periodiek van de VVS jaargang 6 nummer 4 december 2005
STAtOR Grondstoffen-logistiek bij Corus IJmuiden Proefopzetten Volkstelling: nieuwe en interessante bestanden bij het CBS Kans- of behendigheidsspel? Wiskunde helpt de rechter bij uitspraken op het terrein van kansspelen
Inhoud
STAtOR
Jaargang 6, nummer 4, december 2005 STAtOR is een uitgave van de Vereniging voor Statistiek en Operationele Research (VVS). STAtOR wil leden, bedrijven en overige geïnteresseerden op de hoogte houden van ontwikkelingen en nieuws over toepassingen van statistiek en operationele research. Verschijnt 4 keer per jaar.
3 4
Redactie
Dick den Hertog (hoofdredacteur), Wies Akkermans, Martijn Berger, Han Oud, Gerrit Stemerdink (eindredacteur), Fred Steutel, Marnix Zoutenbier. Kopij en reacties richten aan
11
Prof. dr. ir. D. den Hertog (hoofdredacteur), Faculteit der Economische Wetenschappen van de Universiteit van Tilburg, Postbus 90153, 5000 LE Tilburg, telefoon 013 - 466 2122,
.
16
Bestuur van de VVS
Voorzitter: A.W. van der Vaart Penningmeester: S. J. Koopman <[email protected]> Namens de Bedrijfssectie (BDS): P. Banens Namens de Biometrische Sectie (BMS): A. Stein Namens de Economische Sectie (ECS): P.H.F.M. van Casteren ; Namens het Ned. Genootschap voor Besliskunde (NGB): H. Fleuren Namens de Sectie Mathematische Statistiek (SMS): P. Spreij <spreij@science. uva.nl>; Namens de Sociaal Wetenschappelijke Sectie (SWS): C. Glas .
17 19 23
Leden- en abonnementenadministratie van de VVS
VVS, Postbus 2095, 2990 DB Barendrecht, telefoon 0180 - 623796, fax 0180 - 623670, e-mail . Raadpleeg onze website over hoe u lid kunt worden van de VVS of een abonnement kunt nemen op STAtOR of op een van de andere periodieken.
25
VVS-website
http://www.vvs-or.nl
Wedden dat …? Grondstoffen-logistiek bij Corus IJmuiden Nol Goedhart en Ron Schuurmans Proefopzetten Emiel van Berkum Jaarvergadering VVS-OR & Lezing door Alexander Schrijver Pompen of verzuipen - column Fred Steutel Kans- of behendigheidsspel? Wiskunde helpt de rechter bij uitspraken op het terrein van kansspelen Marcel Dreef Ode aan Lunteren - column Onno Boxma Volkstelling: nieuwe en interessante bestanden bij het CBS Mars Cramer
29 Beter ten halve gekeerd… Sunk costs en
Advertenties
Uiterlijk vier weken voor verschijnen te zenden aan Pharos, Moeflonstraat 5, 6531 JS Nijmegen, telefoon 024 3559214, e-mail . STAtOR verschijnt in maart, juni, september en december.
de bereidheid de waarheid onder ogen te zien
Ontwerp en opmaak
Pharos / M. van Hootegem, Nijmegen Uitgever
© Vereniging voor Statistiek en Operationele Research ISSN 1567-3383
STAt O R
2
december 2005 /4
Wedden dat…? Weddenschappen zijn zo oud als de mensheid. De Batavieren dobbelden om hun vrouwen, de duivel wedde al met God over het geloof van Job. De duivel was overtuigd van de invloed die er op de uitkomst van de weddenschap was uit te oefenen door rampspoed en ziekte over Job te laten komen. Bij weddenschappen zijn beide partijen overtuigd van het eigen gelijk, en daardoor van het feit dat ze zullen winnen. Hoe meer de kans op winnen van het toeval afhangt, hoe meer de weddenschap in gokken overgaat. Maar waar ligt precies de grens tussen wedden en gokken? Of tussen behendigheid en gokken? Daarover moet soms, tegenwoordig, de rechter uitspraak doen. In STAtOR hebben we ditmaal een bijdrage die beschrijft hoe zo’n rechterlijke beslissing kan worden ondersteund. Ook het bedrijven van beschrijvende statistiek, wat meestal schatten wordt genoemd, kan worden opgevat als een vorm van gokken: na een steekproefonderzoek wordt aangenomen dat er, bijvoorbeeld, 95 procent kans is dat een bepaald interval het gemiddelde inkomen bevat van alle alleenstaande Nederlandse werkende vrouwen tussen de 45 en 50 jaar met een opleiding op wetenschappelijk niveau, en woonachtig buiten de Randstad. Sommige wetenschappers (bijvoor-
ook internetsites over Idea Futures) betogen dat de wetenschap inderdaad als een weddenschap zou moeten worden opgezet, met als inzet de wetenschappelijke naam of faam van de onderzoekers. Maar voor een aantal onderwerpen is dit soort gokken in Nederland niet meer nodig: het Centraal Bureau voor de Statistiek (CBS) heeft de afgelopen jaren gewerkt aan de koppeling van bestanden met informatie over alle individuele Nederlanders: inkomen, gezinssamenstelling, gezondheid. Het gemiddelde inkomen van bovenstaande vrouwen is dus bekend, en hoeft niet meer te worden geschat. Een deel van deze gegevens is ook beschikbaar voor onderzoekers buiten het CBS. Verderop in StatOr krijgt U een kijkje achter de schermen van het CBS. Het gok-element in de uitkomst van een onderzoek is ook te verkleinen door het kiezen van een goede proefopzet. Ook hierover hebben we een verhaal dat voor een aantal lezers zeker interessant zal zijn. Tenslotte krijgen we een blik op de indrukwekkende logistiek bij Corus. Veel leesplezier!
De redactie
beeld de Groninger W.K.B. Hofstee in 1980; zie
STAt O R
3
december 2005 /4
A
B
C
GRONDSTOFFEN-LOGISTIEK BIJ CORUS IJMUIDEN Voor de produktie van 6,4 miljoen ton ruwijzer worden door vier grondstoffabrieken ijzerertsen en kolen tot tussenproducten verwerkt, die nodig zijn in het hoogovenproces. De taak van de afdeling Grondstoffen logistiek is het verzorgen van het vervoer van de voorraadbunkers bij de fabrieken naar de hoogovenbunkers. De aanvoer van de tussenproducten naar twee hoogovens wordt gerealiseerd met een aantal transportbanden. Door toename van het productieniveau ontstaan bottlenecks in de huidige logistieke grondvorm. Om een toekomstige verdere productiestijging mogelijk te maken, zal dit probleem opgelost moeten worden. Met behulp van simulatie zijn de gevolgen van enige installatiewijzigingen en verhoogde productieniveaus onderzocht. De resultaten van de simulatie hebben geleid tot een aanbeveling voor het aanpassen van de huidige logistieke grondvorm.
Nol Goedhart & Ron Schuurmans Corus IJmuiden is in 1999 ontstaan uit een fusie van Koninklijke Hoogovens en British Steel. Het is een geïntegreerd staalbedrijf, dat wil zeggen dat het gehele proces van verwerking van erts tot en met de productie van bekleed materiaal op een aaneengesloten bedrijfsterrein plaats vindt. Uit de hele wereld worden grondstoffen, zoals ijzer-
STAt O R
erts en kolen per schip aangevoerd. Deze worden na verwerking tot sinter, pellets en kooks ingezet in het hoogovensproces waardoor ruwijzer ontstaat. Dit ruwijzer wordt, met toevoeging van schroot, omgezet in plakken staal van verschillende kwaliteit. Deze plakken worden vervolgens uitgewalst tot dunne plaat, dat meestal bekleed
4
december 2005 /4
D
E
Figuur 1. A. Van erts tot ruwijzer; B. Van ruwijzer tot ruwstaal; C. Van ruwstaal tot gewalst staal; D. Van dun naar dunner; E. Van onbekleed naar bekleed.
wordt met tin, chroom, zink of verf (zie bovenstaande figuur) Jaarlijks wordt ongeveer 6,9 miljoen ton staal geproduceerd. De gunstige ligging aan de Noordzee zorgt voor een goede verbinding, zowel wat betreft aanvoer van grondstoffen als afvoer van producten. Het staalbedijf werkt in hoofdzaak voor drie afzetmarkten: de verpakkingsindustrie, de automobielsector en de bouw. Er werken circa 9.600 mensen bij het staalbedrijf in IJmuiden.
veel koolstof, waardoor het materiaal bros is en bijvoorbeeld niet tot sterke platen kan worden gewalst. De Oxystaalfabriek 2 (OSF 2) brandt de koolstof uit het ijzer door er met grote kracht en bij een temperatuur van circa 2000°C zuurstof op te blazen. C. Van ruwstaal tot gewalst staal Het staal wordt op drie manieren verder verwerkt. Het grootste deel wordt tot een 22,5 centimeter dikke plak gegoten en vervolgens in de Warmbandwalserij 2 (WB2) gewalst tot een dikte van enkele millimeters. Corus IJmuiden beschikt ook over een moderne, geïntegreerde Gietwalsinstallatie, de DSP. Daarin wordt staal gegoten en direct gewalst tot een dikte van circa 1 millimeter
Het productieproces
A. Van erts tot ruwijzer Het maken van ruwijzer omvat drie processen. Het eerste proces is de ‘vergassing’ van steenkool tot kooks. De steenkool wordt door deze behandeling poreuzer en daarmee geschikt voor gebruik in de hoogovens. Het tweede proces is het ‘voorbakken’ van ijzererts tot brokken en knikkers, die sinter en pellets worden genoemd. Daarna begint de eigenlijke productie van ruwijzer, uit een lading kooks, sinter en pellets in de hoogovens.
D. Van dun naar dunner De koudbandwalserijen walsen het staal tot de productkwaliteit die de klant vraagt. Bijvoorbeeld tot dun verpakkingsstaal, met een dikte van 0,12 tot 0,49 millimeter. Of tot iets dikker staal (0,5 tot 3,0 mm) voor afnemers die er auto’s of vaten van maken. Afhankelijk van de uiteindelijke toepassing krijgt het staal nog extra nabehandelingen.
B. Van ruwijzer tot ruwstaal IJzer omzetten in staal betekent vooral het ver-
lagen van het koolstofgehalte. Ruwijzer bevat
STAt O R
5
december 2005 /4
E. Van onbekleed naar bekleed Bekledingslijnen geven het koudgewalste staal een dun laagje metaal dat bescherming biedt tegen roest. Bij verpakkingsstaal gaat het om tin of chroom. Veel plaatmateriaal voor de automobielindustrie krijgt een laagje zink. Voor gebruik in de bouw wordt staal eerst verzinkt en daarna meestal nog van een laklaag voorzien.
verwerkt, maar rechtstreeks van de opslag aangevoerd. Bij de hoogovens is er een vaste indeling van de bunkers. Iedere hoogovenbunker heeft een eigen grondstof en deze zijn groepsgewijs toegedeeld. Aan beide kanten van iedere hoogoven is een groep bunkers (zie ook figuur 2). Iedere grondstof wordt vervoerd van de grondstof-fabriek naar de hoogovenbunkers door een eigen aantal banden. (zie figuur 5) Het bandensysteem dat het transport verzorgt van de voorraadbunkers van de grondstoffen naar de bunkers van de twee hoogovens heeft onvoldoende capaciteit. Dit probleem wordt opgelost door extra transporten met trucks. Het geheel wordt bestuurd door procesoperators, die met behulp van beeldschermen inzicht hebben in de voorraden. Omdat het inzetten van trucks veel geld kost wachten de operators lang waardoor de bunkers bij de hoogovens op sommige ogenblik-
Aanvoerlogistiek Hoogovens 6 & 7
Er zijn twee hoogovens die ruwijzer produceren. Hoogoven 6 produceert 2,6 miljoen ton ruwijzer en Hoogoven 7 produceert 3,8 miljoen ton. Voor het hoogovenproces zijn de vijf belangrijkste grond-
stoffen in beschouwing genomen: Sinter, Pellets, Sesagoa (allen ertsen) en Kooks-1 en Kooks-2. Iedere hoogoven gebruikt een eigen mix van deze grondstoffen. Het dagverbruik is bovendien per hoogoven verschillend. De sinter, pellets en kooks worden door verschillende fabrieken geproduceerd en met behulp van transportbanden vervoerd naar groepen bunkers bij de hoogovens. Sesagoa wordt niet eerst
ken laag staan, maar zonder dat dit de productie in gevaar brengt. De voorraadbunkers hebben een diepte van minimaal 10 meter. Indien het niveau van de voorraadbunkers te laag komt te liggen dan wordt de
Figuur 2. Beladingsinstallatie.
STAt O R
6
december 2005 /4
valhoogte dermate groot dat de grondstoffen vergruizen. Om deze kwaliteitsverliezen te beperken dient elke bunker een minimale voorraad van 60% te hebben. Dit is een key performance indicator voor de afdeling Grondstoffen-logistiek. Door de variatie van aanbod en vraag worden bij een gemiddelde voorraad van 85% de grondstoffen naar opslagen getransporteerd. Zodra de vraag groter is dan het aanbod worden deze materialen weer aangevoerd vanaf opslag.
gebruik van dezelfde transportbanden van de voorraadbunkers naar de hoogovenbunkers en is wél belemmerend. De sinterfabriek. De sinterfabriek produceert ca 4,3 miljoen ton per jaar en bestaat uit drie sintermachines met verschillende productie capaciteiten. Deze machines bakken een fijn mengsel van ertsen en toeslagstoffen tot grotere luchtige stukken sinter. De sinter wordt door iedere machine in één van de twee voorraadbunkers verzameld. Van deze zes voorraadbunkers (SB11 t/m SB32) zijn er maximaal twee die het materiaal op een transportband storten. Zoals in figuur 3 te zien is, gaat de sinter via bandgroep 11, 12 naar bandgroep 4. Deze stort de sinter in een aantal sinterbunkers van de hoog-
Fabrieken
Er zijn vier fabrieken om de grondstoffen te produceren: de sinterfabriek, de pelletfabriek en de twee kooksfabrieken. Als de bunkers bij de hoogovens vol zijn, wordt de productie van de fabrieken afgevoerd naar opslagvelden. Dit transport belemmert de andere transporten niet. Bij een hoge productie van ruwijzer kan extra materiaal van opslag teruggehaald worden met behulp van de transportbanden. Dit transport maakt
ovens. Als deze bunkergroep voor meer dan 85 % gevuld is met sinter, of een andere bunkergroep lager staat dan 60 %, wordt de band 4 naar een andere hoogovenbunker gereden. Voorwaarde is
Figuur 3. Sinter van fabriek naar hoogovens.
STAt O R
7
december 2005 /4
Transportbanden
dat de band 4 leeg moet zijn. Dus wordt de toevoer gestopt door bandgroep 11 en 12 stil te zetten en bandgroep 4 leeg te draaien. Na het verrijden van band 4 starten de banden weer.
De materialen worden grotendeels door verschillende transportbanden vervoerd. Zoals in figuur 4 blijkt, wordt het transport van de voorraadbunkers naar de hoogovenbunkers door verschillende bandgroepen verzorgd. Het onderscheid van de materialen en hun banden wordt door verschillende kleuren aangegeven. Deze kleuren worden ook in de simulatie gehanteerd. Er is echter een uitzondering voor sesagoa. Sesagoa wordt niet door een fabriek geproduceerd maar wordt direct van opslag gehaald. Uit bovenstaand schema blijkt dat voor de aanvoer van sesagoa vanaf opslag de bandgroepen 1,2,3 en 7/8 nodig zijn, die ook de kooks-1 aanvoer verzorgen. Als het nodig is om sesagoa aan te voeren, wor-
De pelletfabriek. De pelletfabriek produceert ca. 4,45 miljoen ton per jaar. Een mengsel van fijnertsen en concentraten wordt tot ertsmeel gemalen en gebrand tot knikkers, die in twee voorraadbunkers worden opgeslagen. Vanuit één van de voorraadbunkers worden de pellets op een transportband gestort. De kooksfabrieken 1 & 2. Samen procuceren de kooksfabrieken 2,025 mil-
joen ton per jaar. Gemalen steenkool wordt in een afgesloten kamer verhit tot 1000° C. Als de kooks ‘gaar’ is, wordt deze uit de kamer gedrukt en ogenblikkelijk geblust. Iedere kooksfabriek heeft twee voorraadbunkers, waarvan er een het materiaal op de transportband stort.
den eerst de kooks-1 bandgroepen leeggedraaid en daarna worden ze voor sesagoa benut. Dit kan alleen als de kooks-1 bunkers op voldoende laag niveau zijn, zodat de productie van kooks-1 door kan gaan. Als op grond van een aantal criteria de
Figuur 4. Transport van voorraadbunkers naar hoogovenbunkers.
STAt O R
8
december 2005 /4
Figuur 5. Extra sinteraanvoer gebruikt de kooks- en pelletbanden; dit kan alleen als eerst alle banden zijn leeggedraaid.
aanvoer van sesagoa gaat stoppen, kan dat alleen als alle banden weer zijn leeggedraaid. Daarna komt de kooks-1 aanvoer weer op gang. In figuur 5 kan men zien wat nodig is voor bij-
Het systeem is ontwikkeld in ARENA, dat de mogelijkheid heeft om eenvoudig een transportband te kunnen modelleren. In het model is de productie van de grondstoffabrieken en hun voor-
voorbeeld het transport van sinter vanaf opslag. De sinteraanvoer heeft dan een gedeelte van de kooksbanden (1,2,3) en een gedeelte van de pelletband (5) nodig. De gewone sinteraanvoer vindt gelijktijdig plaats, alleen storten beide stromen in een verschillende groep. Voorwaarde is dan dat de pellet voorraadbunkers en de kooks-1 voorraadbunkers voldoende laag zijn om door te kunnen produceren. De pellet- en kooks-1 fabrieken kunnen dan hun productie kwijt in de eigen voorraadbunkers. Voordat begonnen wordt met het vervoer van sinter van de sinteropslag, moeten eerst alle banden worden leeggedraaid. Als de pellet of kooks-1 voorraadbunkers op een zekere hoogte komen, of de sinter hoogovenbunkers zijn voldoende hoog, stopt het transport van opslag. Dit betekent weer dat eerst alle banden leeggedraaid moeten zijn, voordat ze hun oorspronkelijke taak weer kunnen hervatten. Het halen van opslag lukt niet altijd, omdat bijvoorbeeld de pellet voorraadbunkers te vol zijn. In die gevallen kan men de hoogovenbunkers met vrachtwagens beladen.
raadbunkers als start van het proces gebouwd. De grondstoffabrieken vullen om en om de voorraadbunkers en de volste voorraadbunker wordt aangewezen om op de transportband te storten. Als de voorraadbunker beneden een bepaald niveau komt, wordt een andere voorraadbunker gekozen. De transportband vervoert het materiaal naar een combinatie van hoogovenbunkers. Als een van de combinaties vol is, of een andere combinatie te laag staat, wordt een andere groep gekozen. De banden worden een voor een stilgezet en het eindpunt van de laatste band wordt naar de volgende combinatie verreden. Daarna starten de banden van achter naar voren en wordt het materiaal weer vervoerd. De bunkers bij de hoogovens hebben een vaste plaats en materiaalsoort. Dagelijks wordt een productiehoeveelheid geloot van zowel de grondstoffabrieken als de beide hoogovens en worden de grondstoffen in een vaste verhouding afgenomen. Lay-out van de animatie: Bijna alle parameters (productieniveaus, bunkergrootte van de voorraden bij de grondstoffabrieken, bandsnelheden) en criteria (wanneer komen de grondstoffen van opslag en onder welke proces-
Simulatiemodel.
Om deze complexe logistiek en zijn spelregels te kunnen onderzoeken, is een simulatiemodel ontwikkeld. Het is immers onmogelijk om in de praktijk te kunnen experimenteren.
STAt O R
omstandigheden) zijn in een EXCEL spreadsheet opgeslagen. Dit geeft de gebruiker een ruime mogelijkheid om te experimenteren.
9
december 2005 /4
Om betrouwbare resultaten te krijgen is de simulatietijd bepaald op 5 jaar, verdeeld in 5 stukken van een jaar. Het model geeft als resultaat de spreiding van de vullingsgraden in de hoogovenbunkers, de bezettingsgraden van de transportbanden, de hoeveelheid materiaal die door externe transporten moet worden ‘bijgestort’ etc. De bouw van het model is in 230 uur gerealiseerd.
meer noodzakelijk zijn. Hierdoor is het mogelijk 24 uur per dag zonder omschakelverliezen te transporteren en komt de capaciteit uit op ongeveer 16000 ton per dag. Dan is de lay-out klaar voor alle toekomstige denkbare scenario’s. De totale kosten voor de nieuwe logistieke grondvorm liggen rond de 20 miljoen. Het model is een goede ondersteuning voor het management om hun problemen beter te kwantificeren en de verbeteringen te onderbouwen, om zo het groene licht te verkrijgen voor de investeringen. Als de infrastructuur verbeterd is, kunnen de spelregels en de criteria die in het model zijn bepaald, gebruikt worden als rekenregels in een Decision Support System. Dit betekent dat de hoofd- en handbesturingstaak van de operator komt te vervallen.
Resultaten.
Met behulp van het model is vastgesteld dat de capaciteit van het bandensysteem 4200 ton per dag is. In 1997 was er in 15 % van de dagen meer dan 4200 ton nodig en in 2003 is deze grens in 32 % van de dagen overschreden en waren alternatieve transporten noodzakelijk. Op grond van de experimenten met het model blijkt dat het upgraden van de huidige installaties niet de gewenste oplossing biedt. Er wordt aanbevolen om een extra transport-
Nol Goedhart is Operations Research consultant bij Corus Iron Services IJmuiden. E-mail: <[email protected]>. Ron Schuurmans is productie-assistent bij Corus Strip Products.
bandenlijn, vanaf kooksfabriek 1 met een lengte van 3 kilometer te bouwen, zodat alternatieve transporten en het omschakelen (zie figuur 5) niet
STAt O R
10
december 2005 /4
P RO E F O PZ E T TE N Een eenvoudig voorbeeld is het volgende. Bij het bakken van tegels is veel uitval. Men wil onderzoeken hoe de temperatuur van de oven de kwaliteit van de tegels beïnvloedt. Daarom gaat men 10 keer tegels bakken bij 370 graden en 10 keer bij 340 graden. Het is echter erg kostbaar om telkens de temperatuur van de oven opnieuw in te stellen en daarom bakt men eerst tien keer tegels bij een temperatuur van 370 graden en daarna tien keer bij 340 graden. Men zag geen verschil in de kwaliteit van de tegels. Pas na verder experimenteren kwam men erachter dat de oven een langere opwarmperiode nodig had dan gedacht. Hoewel de knop op 370 graden stond was de werkelijke temperatuur in de oven nog geen 370 graden. Dit is een voorbeeld van het niet juist toepassen van de principes die van belang zijn bij proefopzetten. Emiel van Berkum Statistiek houdt zich onder andere bezig met het analyseren van data. Uit data wil men dan conclusies trekken of vragen beantwoorden. De manier waarop de data (waarnemingen) verza-
Men wil duidelijke en goede conclusies kunnen trekken. Bovendien wil men dit zo efficiënt mogelijk doen. De manier waarop het experiment georganiseerd is kan veel beperkingen opleveren met betrekking tot de conclusies: er kunnen verkeerde conclusies worden getrok-
meld worden heet een proefopzet. Dit is dus de manier waarop het experiment georganiseerd wordt. Het is heel belangrijk dit goed te doen.
STAt O R
ken.
11
december 2005 /4
Verloting
aan de zogeheten restterm van het model. In het algemeen formuleert men een model waarbij het te onderzoeken kenmerk enerzijds afhangt van een aantal meetbare factoren, maar anderzijds ook van een toevallige fout: de restterm in het model. Deze restterm wordt stochastisch verondersteld en vaak wordt aangenomen dat hij normaal verdeeld is. Een eenvoudig model kan bijvoorbeeld het volgende model zijn
Een van de belangrijke principes bij proefopzetten is verloting van de volgorde van waarnemen. Als men besloten heeft hoe men waarnemingen gaat doen, is het van belang om de volgorde waarin men waarnemingen gaat doen te verloten. Een eerste reden is dat meestal aangenomen wordt dat de waarnemingen onafhankelijk zijn. Het verloten van de volgorde is daarvoor van wezenlijk belang. Een tweede reden is dat op die manier het effect van niet-bekende factoren gemodelleerd wordt als een toevallige fout. Het voorbeeld van de tegels maakt duidelijk welk gevaar men loopt als niet een willekeurige volgorde voor het expe-
y=β0+β1x1+β2x2+ε waarbij x1 de temperatuur aan geeft en x2 de plaats in de oven kan aanduiden (bijvoorbeeld x1=0 betekent 'onder' en x1=1 betekent ‘boven’). Door de volgorde van het doen van de waarnemingen te verloten zorgt men ervoor dat de invloed van (on)bekende ongewenste fouten gezien kan worden als een bijdrage aan de restterm in het model.
rimenteren wordt gekozen, maar bijvoorbeeld een makkelijke. Als in de proefopzet voor het bakken van tegels een willekeurige (verlote) volgorde was aangehouden, zou de temperatuur van 370 graden niet 'benadeeld' zijn. Bij de in de inleiding genoemde opzet had men de oven ingesteld op 370 graden, maar de werkelijke temperatuur was door de opwarmperiode lager. Toen de waarnemingen bij 340 graden aan de beurt waren, was de opwarmperiode voorbij en was de werkelijke temperatuur gelijk aan die 340 graden. Bij een experiment zijn er altijd bronnen van variatie. Hierbij kan een aantal soorten variatie worden onderscheiden. Allereerst is er de variatie die men wil onderzoeken: bij de tegels verwacht men dat de temperatuur van de oven invloed heeft. Deze zorgt voor variatie in de kwaliteit van de tegels. Dit is een gewenste bron van variatie. Er zijn ook ongewenste bronnen van variatie. Men heeft allereerst te maken met onnauwkeurigheid bij het meten en met variatie in het experimenteel materiaal. Daarnaast kunnen er ook andere factoren een rol spelen. Zo kan het bij het bakken van tegels verschil uitmaken wie de oven bedient. De plaats van de tegels in de oven is mogelijk van belang. Dit zijn ongewenste bronnen van variatie. Zo kunnen er ook onbekende ongewenste bron-
Blokvorming
De variatie die het gevolg is van bekende ongewenste factoren kan in de analyse apart genomen worden door deze factoren in het model op te nemen. Het is van belang om daar in de proefopzet rekening mee te houden. In het voorbeeld van de tegels is genoemd dat er verschil kan zijn tussen de verschillende ploegen bedieners. Voor een goede analyse moeten dan de waarnemingen in gelijke mate over de verschillende ploegen verdeeld zijn. Dat heet een gebalanceerde blokkenproef. De ploegen zijn dan de blokken. Zo kan er nog een andere blokfactor zijn, bijvoorbeeld de verschillende partijen grondstof. De waarnemingen moeten dan ook in gelijke mate over de partijen verdeeld zijn. De theorie van het proefopzetten gaat onder andere over het construeren van efficiënte proefopzetten als er veel factoren een rol spelen. Proefopzetten die in dit kader genoemd kunnen worden zijn Latijnse vierkanten.
nen van variatie zijn. Deze leveren een bijdrage
STAt O R
12
december 2005 /4
Herhaling
Een Latijns vierkant van orde p heeft p rijen en p kolommen. In de p2 cellen van het vierkant staan de eerste p letters van het alfabet zodanig dat iedere letter precies één keer voorkomt in elke rij en elke kolom. Een voorbeeld van zo'n proefopzet is het volgende. Stel dat men in een experiment de invloed van de temperatuur op een kwaliteitskenmerk wil onderzoeken en dat er 5 verschillende temperaturen gekozen zijn in het experiment. Om het experiment uit te voeren zijn verschillende operators en verschillende partijen van de grondstof nodig. Deze operators en partijen vormen een ongewenste bron van variatie. Men wil de gegevens zo kunnen analyseren dat de variatie die het gevolg is van de operators en de partijen apart genomen kan worden en men goed conclusies kan trekken over de invloed van de temperatuur. Daarvoor is een Latijns vierkant handig. Met iedere rij wordt nu een partij geas-
Herhalingen zijn nodig om iets over de mate van variatie te zeggen. Stel dat men bij een temperatuur van 340 graden één waarneming heeft en één waarneming bij 370 graden en laat de kwaliteit bij 340 graden 6,4 zijn en bij 370 graden 6,7. Nu kan men niet zien of dit het gevolg is van toeval (bijvoorbeeld van de meetfout) of het gevolg van de temperatuursverandering. Als er meerdere waarnemingen zijn per temperatuur krijgt men een indruk van de meetfout en kan statistisch getoetst worden of het verschil van het toeval afhangt of niet.
Factoriële opzetten
Bij veel problemen kan een groot aantal factoren een rol spelen. In een industrieel probleem komt het regelmatig voor dat meer dan tien factoren mogelijk van belang zijn voor het te onderzoeken kwaliteitskenmerk. Om te onderzoeken welke factoren van belang zijn wordt dan een opzet gekozen waarbij slechts twee verschillende niveaus per factor worden gekozen. Een proefopzet die – helaas – in de praktijk nog veel gekozen wordt is een zogeheten one-factor-at-a-time opzet. Hierbij wordt vanuit een bestaande situatie telkens maar één factor gevarieerd. Het idee is dat men dan goed zou kunnen zien of die betreffende factor invloed heeft of niet. Voorbeeld: bij een chemisch proces wil men onderzoeken welke factoren de filtration rate beïnvloeden. De te onderzoeken vier factoren zijn: temperatuur, druk, concentratie en roersnelheid. Bij de huidige instellingen wordt een waarneming gedaan. Vanuit de huidige instellingen worden dan om de beurt elk van de vier factoren gewijzigd om de invloed van elk van de factoren te kunnen meten. Zo krijgt men vijf waarnemingen. Zo'n opzet is niet efficiënt en bovenal kan hij leiden tot foute
socieerd (er moeten dus ook 5 partijen gekozen worden), met iedere kolom wordt een operator geassocieerd (dus ook 5 operators). De letters in het vierkant stellen de 5 temperaturen voor. In Figuur 1 staat dit weergeven. operators
1
2
3
4
5
A
D
B
E
C
D
A
C
B
E
C
B
E
D
A
B
E
A
C
D
E
C
D
A
B
partij
1
2 3
4 5
Figuur 1: Latijns vierkant
Dit stelt een proefopzet voor. Als de letter B in rij 3 en kolom 2 voorkomt, betekent het dat men een waarneming gaat doen bij temperatuur B, partij 3 en operator 2. In plaats van 5*5*5=125 hoeft men nu slechts 25 waarnemingen te doen. Bovendien kan de variatie die het gevolg is van ongewenste bronnen van variatie in de analyse apart geno-
men worden.
STAt O R
13
december 2005 /4
conclusies. Het kan leiden tot foute conclusies omdat men op deze manier geen interacties kan detecteren.
op het hoge niveau en het gemiddelde van de waarnemingen op het lage niveau. Het effect van A is dus A =
Interacties
We spreken van een interactie als de invloed van een factor afhangt van het niveau van een andere factor. Het volgende eenvoudige rekenvoorbeeld geeft dat aan. We gaan uit van twee factoren A en B, elk op twee niveaus. In de tabel staan de gemiddelden van de waarnemingen bij elk van de vier niveaucombinaties
Het effect van B is B =
30+50 20+40 = 10 2 2
In Figuur 2 staan de waarnemingen weergegeven. De bovenste stippellijn tussen de twee open cirkels verbindt de twee punten van de twee waar-
Het effect van A wordt gedefinieerd als het verschil van het gemiddelde van de waarnemingen
nemingen die op het hoge niveau gedaan zijn. De helling van de lijn geeft dus de invloed van factor A aan bij het hoge niveau van B. De helling van de andere lijn geeft de invloed van factor A bij het lage niveau van factor B aan. De twee lijnen lopen hier evenwijdig. Dat betekent dat de invloed van factor A niet afhangt van het niveau dat factor B heeft. Er wordt gezegd dat factor A en factor B geen interactie hebben.
waarnemingen bij het lage niveau van factor B waarnemingen bij het hoge niveau van factor B
waarnemingen bij het lage niveau van factor B waarnemingen bij het hoge niveau van factor B
Factor B Factor A
B laag
B hoog
A laag
20
30
A hoog
40
50
60
50
50
40 waarneming
waarneming
40+50 20+30 = 20 2 2
40 30
30 20 10
20
lage niveau van A
lage niveau van A
hoge niveau van A
hoge niveau van A
niveaus van factor A
niveaus van factor A
Figuur 2: Geen interactie
Figuur 3: Interactie
STAt O R
14
december 2005 /4
Fractionele factoriële opzetten
Stel nu dat één van de waarnemingen een andere waarde heeft.
Bij een 2k-proefopzet, dat wil zeggen een opzet met k factoren die elk twee niveaus hebben, is het aantal niveaucombinaties gelijk aan 2k. In de praktijk kan het te kostbaar zijn om bij alle niveaucombinaties waarnemingen te doen. Het is niet ongebruikelijk dat het aantal factoren in een experiment 10 of nog meer is. Met de theorie van proefopzetten is het mogelijk om in plaats van bij alle 2k combinaties slechts bij een fractie van deze combinaties waarnemingen te doen. Als men wil zorgen dat de proefopzet mooie eigenschappen heeft wat betreft de analyse is het gewenst om als aantal waarnemingen een aantal te kiezen dat gelijk is aan een macht van 2. Dus bij-
Factor B Factor A
B laag
B hoog
A laag
20
30
A hoog
40
10
Het effect van A is nu dus A =
40+10 20+30 = 0 2 2
Toch heeft factor A wel degelijk effect. Het effect van factor A hangt af van het niveau van factor B. In Figuur 3 is dit weergegeven. Hier snijden de lijnen elkaar. Er wordt gezegd dat factor A en factor B een interactie hebben.
voorbeeld de helft of een kwart van het totaal aantal combinaties. Zo'n opzet wordt een 2k-p-proefopzet genoemd. Zo'n fractionele opzet is ook mogelijk als er niet zoveel factoren zijn. Ook in het geval van het chemisch proces kan men ervoor kiezen om niet alle 16 niveaucombinaties te kiezen, maar een halve fractie. Men doet dan dus 8 waarnemingen. Aan de hand van dit voorbeeld kan ook duidelijk gemaakt
Nu kan het gevaar van een one-factor-at-a-time duidelijk gemaakt worden. In een one-factor-ata-time-opzet worden slechts de volgende waarnemingen gedaan. Factor B B hoog
A laag
20
30
A hoog
40
waarnemingen bij het lage niveau van factor B waarnemingen bij het hoge niveau van factor B
In Figuur 4 worden de waarnemingen weergegeven. Als men op grond hiervan een zo hoog mogelijk waarde wil bereiken, ligt het voor de hand om zowel het hoge niveau van A als het hoge niveau van B te kiezen. Als er een interactie is kan dat een verkeerde conclusie zijn. Om de interacties te kunnen meten moet gekozen worden voor een factoriële opzet. Dat kan een volledige factoriële opzet zijn, maar dat is niet nodig. Bij een volledige factoriële opzet worden alle niveaucombinaties gekozen. In het voorbeeld van het chemisch proces zouden dan 24=16 waar-
60 50 waarneming
Factor A
B laag
30 20
}
effect van B = 10
lage niveau van A
Figuur 4: One-factor-at-a-time-opzet
15
december 2005 /4
}
effect van B = 10
hoge niveau van A
niveaus van factor A
nemingen nodig zijn.
STAt O R
40
worden dat zo'n opzet veel efficiënter is dan een one-factor-at-a-time opzet. De one-factor-at-a-timeopzet heeft 5 waarnemingen. Als men echter het effect van een factor wil meten, heeft men dus slechts een waarneming op het hoge niveau en een waarneming op het lage niveau. Dan kan je niet concluderen of het verschil een gevolg is van de meetonnauwkeurigheid of het gevolg van het effect van die factor. Daarom moet men de opzet minstens één keer herhalen. Dan telt de opzet 10 waarnemingen en heeft men toch slechts twee waarnemingen op het hoge niveau van de betreffende factor en twee op het lage niveau van die factor. De fractione-
UITNODIGING Jaarvergadering VVS-OR
&
Railway Optimization,
lezing door Alexander Schrijver 14 maart 2006, Vrije Universiteit Amsterdam Op 14 maart zullen in Amsterdam de jaarvergadering van de VVS-OR en enkele sectie-vergaderingen plaatsvinden. Diezelfde middag zal Alexander Schrijver, winnaar van de Spinozapremie (‘de Nederlandse Nobelprijs’) een lezing geven. De lezing richt zich op een breed publiek. U bent tevens uitgenodigd voor een borrel na afloop. Details over plaats en tijd, en vergaderstukken worden bekend gemaakt via e-mail en website. De Dag voor Statistiek en Besliskunde (‘Statistische Dag’) vindt later plaats, op 14 juni in Rotterdam.
le opzet met slechts 8 waarnemingen zit zo mooi in elkaar dat alle 4 waarnemingen op het hoge niveau van een factor en alle 4 de waarnemingen op het lage niveau van de factor gebruikt kunnen worden om het effect van die factor te kunnen schatten. De fractionele opzet is dus veel efficiënter. Bovendien kan men in die opzet 3 van de 6 interacties van twee factoren schatten. Deze kunnen in de one-factor-at-a-time-opzet helemaal niet geschat worden.
Behalve onderzoeker aan het Centrum voor Wiskunde en Informatica is Alexander Schrijver sinds 1990 hoogleraar discrete wiskunde en optimalisering aan de Universiteit van Amsterdam. Hij is wereldleider op zijn vakgebied - de combinatorische optimalisering - dat zowel tot de wiskunde als tot de informatica gerekend moet worden en dat door Schrijvers onderzoek op de kaart is gezet. Het onderzoek van Schrijver speelt zich op een zeer fundamentaal niveau af, maar het vindt zijn weg naar zeer complexe, hedendaagse toepassingen. Voorbeelden zijn het zitplaatsenprobleem van de Nederlandse Spoorwegen, productieschema’s voor computerchips met honderden gaatjes en ook het matchingvraagstuk: hoe koppel je werknemers en taken op een slimme manier? In zijn lezing zal hij laten zien op welke manier je voor het efficiënt laten rijden van gekoppelde ‘Koplopers’ een NS-dienstregeling kan maken.
Conclusie
Bij een onderzoek is het van belang eerst goed na te denken over het experiment. Welke factoren kunnen van belang zijn? Hoeveel verschillende niveaus per factor moeten er gekozen worden? Bij welke niveaucombinaties moeten er waarnemingen gedaan worden? Hoeveel herhalingen moeten er gedaan worden? Te vaak wordt begonnen met waarnemingen zonder dat over deze vragen goed is nagedacht. In het ergste geval kunnen effecten niet geschat worden die men had willen schatten en kunnen de verkeerde conclusies getrokken worden. Als het meezit heeft men slechts een inefficiënte proefopzet gekozen. Emiel van Berkum is universitair docent bij de Faculteit Wiskunde & Informatica van de Technische Universiteit Eindhoven. Een van zijn onderzoeksgebieden is de theorie van proefopzetten. E-mail: <[email protected]>
STAt O R
16
december 2005 /4
Dijkverzwaring Westerschelde. Foto: P. Bosch
column
Pompen of verzuipen Fred Steutel De recente dijkdoorbraken in New Orleans brengen allerlei vragen terug in mijn herinnerring: hoe hoog moeten de dijken zijn om er voor te zorgen dat het water er maar eens in de 200 jaar (New Orleans) of eens in de 10.000 jaar (Nederland) overheen komt, en wat betekent dat eigenlijk? De echte vraag is natuurlijk: hoe geef je antwoord op dit soort vragen?
Holland en de afvoeren van de Rijn bij Lobith; er werd geen afhankelijkheid gevonden.
Hoogwaterstanden
Als ik in het bovengenoemde rapport blader voel ik weer een lichte weerzin opkomen bij het zien van al die getallen, grafieken en tabellen. Er was natuurlijk enorm veel materiaal: sinds 1888 elke dag twee hoogwaterstanden, zeg zo’n 40.000, sterk afhankelijke, waarnemingen. Immers, als de vloed vanochtend hoog is, dan is dat waarschijnlijk vanavond en morgenochtend nog zo. Van al die vele waarnemingen bleven er uiteindelijk 332 over: de hoogste vloedstanden tengevolge van speciaal geselecteerde depressies; deze waarnemingen werden als onafhankelijk beschouwd. Het zoeken was daarna naar die hoogwaterstand die maar eens in de 10.000 jaar zou worden overschreden. Geen sinecure.
Mathematisch Centrum
In 1956 kwam ik als assistent op de Statistische Afdeling van het Mathematisch Centrum (MC, nu CWI). Daar werd toen koortsachtig gewerkt aan een statistisch rapport voor de Deltacommissie, die in het leven geroepen was na de stormramp van 1 februari 1953. Ik wist niets van statistiek – dat vak kwam in de kandidaatsfase van de studie wis- en natuurkunde niet aan de orde, maar ik werd toch ingeschakeld bij het statistische rekenwerk dat bij de modelering van hoogwaterstanden nodig was. Mijn naam wordt zelfs in het rapport vermeld voor een bijdrage aan een onder-
Modellen
De 332 geselecteerde waterhoogten werden van klein naar groot uitgezet op geschikt grafiekenpapier, zó dat het aantal overschrijdingen per jaar
zoek met betrekking tot de mogelijke afhankelijkheid tussen de hoogwaterstanden bij Hoek van
STAt O R
17
december 2005 /4
voor iedere hoogte kon worden afgelezen. Het blijkt dan de de ramphoogte (3,84 m) van 1 februari 1953 ongeveer eens in de tweehonderd jaar te verwachten was. Hoek van Holland was dus in 1953 niet veel veiliger dan New Orleans in 2005. Door extrapolatie moest nu de de waterhoogte worden geschat die maar ‘eens in de 10.000 jaar’ zal worden overschreden. Uit het plaatje is duidelijk dat dat niet zou meevallen: naarmate de waarnemingen schaarser worden - bij de hoge waterstanden - waaieren ze meer uit; er zijn grote onbetrouwbaarheden in het geding. Het wordt allemaal wat eenvoudiger als we aannemen dat de geselecteerde waterstanden te beschouwen zijn als onafhankelijke waarnemingen uit een exponentiele verdeling; alleen de parameters van die verdeling (bijvoorbeeld beginpunt en ver-
om aan de waarde van een mens een getal toe te kennen.
New Orleans en Hoek van Holland
De interpretatie van één dijkdoorbraak in 200 jaar (New Orleans) of in 10.000 jaar (Hoek van Holland) is eigenlijk ‘De kans op een dijkdoorbraak in een gegeven jaar is 1/200 = 0,005, respectievelijk 1/10.000 = 0,0001’. Hierbij wordt dan impliciet verondersteld dat de mogelijke dijkdoorbraken onafhankelijk zijn. Dat betekent al bijna dat we te maken hebben met een Poisson-proces als model voor het optreden van extreme waterstanden en dus met exponentieel verdeelde tussentijden. De veronderstelling houdt tevens in dat de veilig-
heids toestand door de jaren heen niet verandert. Dit betekent dan weer dat de waterweringen zullen moeten aangepast aan een veranderend klimaat of aan bodemdaling. He ziet er naar uit dat dit soort aanpassingen in New Orleans niet heeft plaats gevonden. In Nederland wordt daar eens in de vijf jaar naar gekeken.
wachting) moeten dan nog geschat worden, maar ook dan blijft de onbetrouwbaarheid groot.
Wat is alles achter de dijk waard?
Bij discussies over de dijken rond New Orleans (daar levees genoemd naar het Franse woord levée, verhoogd) werd gezegd: ‘Duurdere huizen staan achter hogere dijken’; er geldt daar een strikt economisch beginsel. De waarde van een mensenleven is ook al heel lang een punt van discussie. Het komt heel even aan de orde in het hoofdstuk over het Economisch Beslissingsprobleem van het Deltarapport, maar al snel wordt dat terzijde geschoven. Van Dantzig meldt wel dat in 1669, bij een poging om het totale bezit van de Engelse koning te bepalen, de waarde van een inwoner op 69 pond word gesteld – bij soortgelijke studies hadden vrouwen en bejaarden soms een negatieve waarde. De 69 pond was niet eens gek weinig; dat was toen vijf à acht maal het jaarloon van een arbeider, nu zo’n 130.000 euro. In het algemeen schijnt de waarde van de door dijken te beschermen objecten aanzienlijk veel hoger te zijn dan de ‘economische waarde’ van de bevol-
Kosten en baten
Ik weet niet wat het Deltarapport van het Mathematisch Centrum gekost heeft. Niet zo erg veel; salarissen van wiskundigen waren toen, ook relatief gezien, laag. Het was de eerste grote opdracht van het MC, en daarom belangrijk. Ik heb het idee dat het selecteren van de waarnemingen mogelijk de belangrijkste stap in de beschouwingen was. Voor het extrapoleren van de geselcteerde waarnemingen had een eenvoudige grafische methode misschien volstaan. Anderzijds heeft het MC (CWI) veel ervaring opgedaan en is de exercitie mogelijk aanleiding geweest voor veel theoretisch onderzoek op het gebied van extreme waarden, niet alleen waterhoogten. Fred Steutel is emeritus hoogleraar kansrekening aan de TU Eindhoven; hij is redacteur van STAtOR. E-mail: .
king achter die dijken; het is daarom niet nodig
STAt O R
18
december 2005 /4
Kans- of behendigheidsspel?
Wiskunde helpt de rechter bij uitspraken op het terrein van kansspelen Marcel Dreef Het is bekend dat roulette een kansspel is. Bij schaken speelt toeval geen rol en wordt de speluitkomst volledig bepaald door de strategieën van de spelers. Dat is dus een behendigheidsspel. Maar hoe zit dat bijvoorbeeld bij poker? Via het delen van kaarten speelt toeval een rol. Maar iedere professionele pokerspeler zal beamen dat je als speler invloed hebt op je spelresultaat. Is die invloed voldoende om poker een behendigheidsspel te noemen? En hoe meet je die invloed eigenlijk? Naar deze en andere vragen rond behendigheid in spelen deed Marcel Dreef vier jaar onderzoek als AIO aan de Universiteit van Tilburg. Op 30 september 2005 promoveerde hij op zijn proefschrift ‘Strategy and Skill in Games’. In dit artikel geeft hij een overzicht van zijn onderzoek en de belangrijkste resultaten.
STAt O R
19
december 2005 /4
De Nederlandse markt voor casinospelen is geen vrije markt. De overheid deelt de licenties uit voor het aanbieden van kansspelen. En met het verstrekken van die licenties is zij bepaald niet gul. Voor veel casinospelen is Holland Casino de enige vergunninghouder, terwijl Stichting de Nationale Sporttotalisator het alleenrecht heeft op het organiseren van sportprijsvragen. Voor het aanbieden van een behendigheidsspel is geen vergunning nodig: in principe mag iedere ondernemer in Nederland behendigheidsspelen exploiteren. De vraag is nu natuurlijk: wanneer is iets een kansspel en wanneer is het een behendigheidsspel? Hoe kunnen we deze twee typen spelen onderscheiden? In artikel 1 van de Wet op de Kansspelen (WoK) staat hierover het volgende:
moet worden gekwalificeerd. Daarmee is het dus ook lastig om aan te geven voor welke spelen een vergunning vereist is voor exploitatie. Dat is geen prettige situatie, zeker omdat de casinowereld een wereld is waar veel geld in omgaat. Vanzelfsprekend zijn er veel partijen die via het aanbieden van voor het publiek interessante spelen graag iets meepikken van het geld dat hier te verdienen valt. Dat leidt zo nu en dan tot een conflict over de aard van een spel: de organisator beweert natuurlijk dat hij een behendigheidsspel aanbiedt, terwijl een vergunninghouder voor ver-
wante kansspelen van mening is dat zijn concurrent een kansspel organiseert. Van de rechter wordt verwacht dat hij in geval van conflicten op een heldere en consistente manier beslissingen neemt. In het verleden bleek dit nogal eens een lastige opgave. Tegenstrijdige rechterlijke uitspraken, soms gebaseerd op statistisch gezien onjuiste argumenten, hebben geleid tot inconsistente jurisprudentie op het terrein van kansspelen. Om de rechter te ondersteunen bij het nemen van consistente beslissingen, is een wiskundige methode ontwikkeld voor het bepalen van het behendigheidsniveau van een spel. Drie typen spelers spelen een rol in deze methode: beginners, optimale spelers en fictieve spelers. Per spelertype leg ik hieronder uit wat wat de rol ervan is in het bepalen van het behendigheidsniveau van het spel.
‘Behoudens het in Titel Va van deze wet bepaalde is het verboden: gelegenheid te geven om mede te dingen naar prijzen of premies, indien de aanwijzing der winnaars geschiedt door enige kansbepaling waarop de deelnemers in het algemeen geen overwe-
gende invloed kunnen uitoefenen, tenzij daar ingevolge deze wet vergunning is verleend.’ Spelen die onder deze passage in de WoK vallen, noemen we kansspelen. Alle andere spelen zijn per definitie behendigheidsspelen. Maar welke spelen nu precies wel en niet onder de WoK vallen, is niet meteen duidelijk. Hoe moeten we bijvoorbeeld de zinsnede ‘kansbepaling waarop de deelnemers in het algemeen geen overwegende invloed kunnen uitoefenen’ interpreteren?
Beginners en optimale spelers
Volgens de wet moeten we weten of de deelnemers overwegende invloed hebben op de ‘kansbepaling’ in het spel. Ondanks het wiskundig gezien ongelukkige gebruik van het woord kans, lijdt het geen twijfel dat het bij het meten van behendig-
Wiskundige methode
Op basis van zo’n vaag geformuleerde wettekst is het lastig om voor een specifiek spel te beoordelen of het als kans- of als behendigheidsspel
STAt O R
heid gaat om de vraag of een speler invloed heeft op zijn spelresultaat. Het gebruik van het woord ‘overwegend’ geeft aan dat we de spelersinvloed
20
december 2005 /4
Ordening
moeten afzetten tegen een ander soort invloed op de speluitkomst, namelijk die van de toevalselementen in het spel. Bij toevalselementen kun je bijvoorbeeld denken aan het delen van kaarten, het gooien van een dobbelsteen of het draaien van een roulettewiel. Om nu te bepalen of spelers überhaupt invloed hebben op hun spelresultaat, vergelijken we de verwachte spelresultaten van beginners met die van optimale spelers. Beginners zijn spelers die weliswaar kennis hebben genomen van de spelregels, maar door hun onervarenheid niet in staat zijn om een slimme strategie te gebruiken. Een optimale speler speelt het spel, zoals zijn naam al suggereert, op een optimale manier. Dat wil zeg-
Nu hebben we alle getallen in handen die nodig zijn om het relatieve behendigheidsniveau van het spel te bepalen. We definiëren: relatieve behendigheid = leereffect / (leereffect + toevalseffect). Een spel met leereffect gelijk aan 0, krijgt daarmee een behendigheidsniveau van 0. Wanneer het toevalseffect in het spel daarentegen 0 is, dan is het behendigheidsniveau van het spel 1. Een spel met behendigheidsniveau 0 is een zuiver kansspel en een behendigheidsniveau gelijk aan 1 duidt op een zuiver behendigheidsspel. Aan elk casinospel kunnen we op deze manier een getal tussen 0 en 1 toekennen. Zo kunnen we spelen ordenen op basis van het behendigheidsniveau. En we kunnen een grens (tussen 0 en 1) bepalen. Ieder spel waarvan het behendigheidsniveau onder de grens ligt, is een kansspel. Alle spelen die qua behendigheid boven de grens uitkomen zijn behendigheidsspelen. Uiteindelijk kunnen wij als wiskundigen niet bepalen waar de grens moet liggen. Die beslissing is nog altijd aan de rechter. Die is nu echter wel in staat om consequent te zijn in zijn beoordelin-
gen dat hij een strategie gebruikt die hem een zo hoog mogelijke verwachte spelopbrengst geeft. Het verschil tussen de verwachte spelresultaten van optimale spelers en beginners noemen we het leereffect van het spel.
Fictieve spelers
Naast de spelersinvloed meten we de invloed van toevalselementen op de spelresultaten. Daarvoor vergelijken we het verwachte spelresultaat van de optimale speler met dat van een fictieve speler. Deze fictieve speler stellen we voor aanvang van het spel op de hoogte van de uitkomst van de toevalselementen. Deze informatie kan hij meenemen in zijn strategiekeuze: hij kiest die strategie die hem, gegeven de extra informatie die hij heeft, het hoogste verwachte spelresultaat oplevert. Vanzelfsprekend kan hij minstens zo’n goed spelresultaat bereiken als de optimale speler. Wanneer hij het strikt beter doet dan de optimale speler, betekent dit dat de toevalsfactoren in het spel invloed hebben op de spelresultaten van de deelnemers. Het verschil tussen het verwachte spelresultaat van de fictieve speler en dat van de optimale speler noemen we het toevalseffect.
STAt O R
gen: een spel dat een hoger behendigheidsniveau heeft dan een spel dat eerder als behendigheidsspel is aangemerkt door de rechter, is per definitie ook een behendigheidsspel.
Zorgvuldigheid vereist
De grote lijn van de hierboven beschreven maat voor behendigheid in spelen is eenvoudig. Een correcte analyse van een spel vergt echter wel zorgvuldigheid bij het beantwoorden van een aantal vragen. Zo is het vinden van een optimale strategie in een eenpersoons spel hoogstens een
21
december 2005 /4
kwestie van het oplossen een pittige optimalisatiepuzzel. Voor een tweepersoons spel kun je een beroep doen op speltheoretische definities en technieken. Maar bij een spel met meer dan twee spelers is de definitie van optimaal spel niet zo duidelijk. Daar moeten we voor het bepalen van het verwachte spelresultaat van een speler aannames maken over het spelgedrag van de overige spelers. Hoe de andere deelnemers spelen, is sowieso van belang in de analyse van een meerpersoons spel. Bieden zij de geanalyseerde speler maximale tegenstand? Of houden ze zich aan een bepaalde vaste strategie, ongeacht of ze het tegen een beginner, een optimale speler of een fictieve spe-
taat natuurlijk wel een belangrijk referentiepunt in de analyse. Daarom moeten we ook hier zorgvuldig zijn. Tot slot heeft de juridische historie rond de WoK uitgewezen dat de rechter geïnteresseerd is in hoe een spel op een bepaalde plaats in een bepaalde periode wordt gespeeld. Dat betekent bijvoorbeeld dat de beginnersstrategie kan afhangen van de ontwikkeling van het spel op een locatie of van de manier waarop de spelregels bij beginners worden geïntroduceerd. Een analyse van behendigheid bevat daarom vaak tijd- en plaatsgebonden aspecten.
Nuttig instrument
ler opnemen? En wat is de definitie van het verwachte spelresultaat van onze drie typen spelers in een meerpersoons spel? En van het leereffect en het toevalseffect? Ergens moet natuurlijk een gemiddelde worden genomen van de kengetallen, maar op welk moment in de analyse? Hoe speelt een beginner eigenlijk? Voor een spel als roulette is het relatief eenvoudig om een strategie aan te wijzen waarmee beginners kunnen worden geïdentificeerd. Voor sommige kaartspelen is dat lastiger. Soms is er voor de analyse data beschikbaar uit een omgeving waar het spel gespeeld wordt, terwijl in andere gevallen een expert op het gebied van casinospelen een goede inschatting moet maken van een beginnersstrategie. Hoewel het bepalen van het spelresultaat van de fictieve speler vaak het eenvoudigste van de drie deelpuzzels is, is ook hier zorgvuldigheid geboden. Met name bij spelen waarin de toevalsfactoren een complexe structuur hebben (zoals meerdere momenten in het spel waarop kaarten kunnen worden gedeeld of geruild), is het soms lastig om te definiëren welke informatie een fic-
Betekenen alle vragen in bovenstaande paragraaf dat de voorgestelde behendigheidsanalyse te ingewikkeld is om concreet te worden toegepast? Integendeel, zolang de oplossingen van alle deelpuzzels in de analyse maar op een consistente manier worden bepaald, vormt het model een nuttig instrument voor de rechter bij categoriseren van spelen in het kader van de WoK. In de afgelopen jaren is het bewijs van die bewering al geleverd via de bijdrage die dit model en voorlopers ervan in de rechtszaal hebben gehad. Gezien de specifieke kennis die vereist is voor een juiste analyse, ligt het wel voor de hand dat de rechter op dit terrein altijd wiskundigen nodig zal blijven hebben om hem als getuige-deskundige te helpen bij zijn beslissingen. Literatuur Dreef, M.R.M. (2005). Skill and strategy in games. Proefschrift, Universiteit van Tilburg. Marcel Dreef is als advanced planning and scheduling consultant werkzaam bij Quintiq Applications B.V. in ’s-Hertogenbosch. E-mail: <[email protected]>. Zijn promotores zijn Peter Borm en Ben van der Genugten, beiden verbonden aan de Universiteit van Tilburg.
tieve speler op welke manier kan gebruiken bij de bepaling van zijn strategie. Hoewel het maar een fictieve speler is, vormt zijn verwachte spelresul-
STAt O R
22
december 2005 /4
column
ODE AAN LUNTEREN Onno Boxma ‘Lunteren’ associeer ik al heel lang met vakantie. Mijn eerste vakantieherinnering, zo’n halve eeuw oud, is van een vakantie met ouders en broer in Pension De Leperkoen in Lunteren. Misschien komt het daardoor, dat ik altijd een vakantiegevoel krijg als ik naar een Stochastiekof Besliskundebijeenkomst in Lunteren ga. Naar zulke bijeenkomsten ga ik voor mijn gevoel trouwens ook al mijn hele leven; in ieder geval ben ik zo’n vijftig keer in Congrescentrum De Werelt geweest.
Misschien was het de aanwezigheid van beroemde sprekers als Krickeberg, Siegmund en W.L. Smith. Ik had hun boeken al als student in de bibliotheek gezien, wat me het idee gaf dat de auteur dood of stokoud moest zijn. Misschien was het de ontmoeting met begaafde jonge onderzoekers als Balkema, De Haan en Vervaat; of Van Zwet op de eerste rij die elke lezing van begin tot eind leek te begrijpen. Misschien was het ook wel de statistiek, die ik als student zo leuk had gevonden maar waar ik als promovendus stochastische besliskunde minder mee te maken had. Hoe het ook zij; die eerste Lunteren was geweldig. Van veel lezingen begreep ik weinig, maar toen dacht ik nog dat dat later vast wel beter zou worden. Een sterk aspect van het recept van Lunteren was trouwens dat de sprekers hun eerste lezing toegankelijk behoorden te maken voor een groot publiek, want zo kreeg je toch een aardig gevoel waar iemand mee bezig was. Later heb ik ook begrepen dat het niet helemaal alleen aan mij ligt als ik een lezing niet begrijp; zie in dat verband ook het fantastische artikel van Klaas Landsman ‘Hoe geef ik een wiskundige voordracht’, uit het Nieuw Archief voor Wiskunde van december 2001, pp. 351-355. En ach, zelfs bij een lezing die je maar matig kan volgen pik je wellicht toch het basis-
Mijn eerste Lunterencongres
De eerste keer was in november 1974. Het was ook het eerste congres dat ik ooit bijwoonde. Een beetje promovendus heeft tegenwoordig al congressen in drie werelddelen bezocht, maar ik kwam als promovendus slechts één keer over de grens. Lunteren was dus al een hele reis (al kon ik het vanuit m’n toenmalige woonplaats Bilthoven met de fiets doen). Een congres in een klein plaatsje, waar eens per uur een trein stopt; in een oord dat de belachelijke naam De Blije Werelt draagt (toen was geluk nog heel gewoon), waar de bedden te kort zijn, waar het eten matig is, en waar het enige vertier een biljart vormt – dat kon toch niets worden? Toch was ik direct verkocht.
STAt O R
idee mee, of leer je iets over een techniek; snap je
23
december 2005 /4
niets, dan heb je heerlijk drie kwartier om rustig over je eigen probleem na te denken. Ook een andere sterke kant van de Lunterenbijeenkomsten was die eerste keer al goed merkbaar: Lunteren als ontmoetingsplaats. Eén van de eerste mensen met wie ik kennis maakte bleek statisticus in dezelfde faculteit als ik te zijn.
een ongelukkige combinatie. Mijn omzwervingen door de Lunterse bossen plegen dan ook zelfs na 30 jaar nog te eindigen op zulke interessante plekken als het erf van een kippenfokker, uitspanning De Lunterse Boer, en het rusthuis voor overspannen typografen.
Een tweede serie Lunterencongressen
De toenmalige Werkgemeenschap Besliskunde en Systeemtheorie nam het Lunteren-idee al snel over: februari 1976 vond de eerste ‘Lunteren’ op hun gebied plaats. Na enige jaren haakten de systeemtheoretici af. De besliskundigen gingen door, maar moesten wel een paar crises over-
De geschiedenis van Lunteren
De Lunteren van 1974 was al de derde. Van Zwet en Runnenburg organiseerden de eerste in 1972. Sprekers: Dinges, Efron, Huber, Johansen, Kemperman en Teugels. Directe aanleiding was een bezoek van Pyke aan Van Zwet, in mei 1971. De zogenoemde Vertrouwenscommissie van NWO leverde een financiële bijdrage aan dit bezoek, en als tegenprestatie moest de bezoeker op allerlei plaatsen aan den volke getoond worden. Van Zwet nam Pyke mee op tournee naar Delft, Eindhoven, Leiden, Utrecht en Enschede, en begon zich af te vragen of het niet efficiënter zou zijn als zulke bezoekers op een centrale plaats hun lezing(en) zouden geven. Sommige collega’s rea-
winnen. Zo daalde de belangstelling eind jaren tachtig tot onder de veertig deelnemers, en moest mede daarom een keer naar Dalfsen worden uitgeweken. Het organiseren van AIO-presentaties en de actieve rol van het LNMB gaven echter nieuwe impulsen, en nu ligt het deelnemersaantal weer ruim boven de honderd. LNMB en NGB organiseren sinds 1999 een derde dag, gewijd aan een bepaald thema: het Operations Research and Health Care thema trekt dit jaar zelfs 200 deelnemers. In de besliskunde zijn Lunteren en het LNMB er in belangrijke mate voor verantwoordelijk dat Nederlandse AIO’s op een relatief hoog peil staan en dat onze gemeenschap een hechte is. Men ontmoet elkaar in een rustige omgeving, waaruit geen ontsnapping mogelijk is. ’s Avonds is het biljart nog steeds nagenoeg het enige vertier, dus je raakt al gauw met je collega’s aan de praat (en schroeft je biljartmoyenne van 0.1 naar 0.2 op). Op het moment van schrijven van dit stukje is de Lunteren van januari 2006 nog maar een week verwijderd; ik verheug me er nu alweer op!
geerden wat gereserveerd op Van Zwets plan om zes buitenlandse stochastici en de Nederlandse stochastiekgemeenschap voor drie dagen in Lunteren bijeen te brengen (enkelen meenden dat er in Amsterdam meer vertier zou zijn te vinden), maar ‘Lunteren’ was meteen een doorslaand succes. De formule is in de loop der jaren een paar keer licht gewijzigd, maar is momenteel toch weer de oorspronkelijke: zes buitenlandse sprekers die ieder twee voordrachten houden. Het vakantiegevoel in Lunteren wordt versterkt door het betrekkelijk relaxte programma, met een lange middagpauze. Die pauze heb ik menigmaal gebruikt om te verdwalen. Een volsla-
Onno Boxma is hoogleraar Stochastische Besliskunde bij de Faculteit Wiskunde en Informatica van de TU Eindhoven en wetenschappelijk directeur van EURANDOM. E-mail: .
gen ontbreken van enig richtingsgevoel, boeiende discussies over nieuwe wiskundeproblemen, en een sterke gelijkenis tussen bomen, zijn voor mij
STAt O R
24
december 2005 /4
VOLKSTELLING: nieuwe en interessante bestanden bij het CBS
Een van de pronkstukken van de ambtelijke statistiek uit de negentiende eeuw is de volkstelling, die ook nu nog over de gehele wereld om de tien jaar wordt gehouden, de laatste keer in 2001. De Nederlandse volkstelling van 2001 was geen echte volkstelling, waarvoor de tellers van deur tot deur gaan, maar een virtuele, geconstrueerde telling die geheel op bestaande bestanden berust. Mars Cramer De oudste telling vond in Nederland in 1795 plaats, voor de verkiezingen van de Bataafse Republiek. Vanaf 1830 waren er in totaal dertien reguliere volkstellingen. Maar bij de volkstelling van 1971 leidde de vrees voor aantasting van de privacy tot rumoerige protesten en politieke agitatie. Uiteindelijk weigerden slechts 35.000 mensen er aan mee te werken (bijna drie pro mille van de toenmalige bevolking), maar de actiegroepen hadden hun werk goed gedaan en in de politiek was het een verloren zaak. In 1981 werd geen volkstelling meer ondernomen, en in 1991 werd de wet die volkstellingen mogelijk maakt door
STAt O R
de Tweede Kamer ingetrokken. Nederland kon in die jaren dan ook alleen met grote moeite met gebruikmaking van aanwezige gegevens en bestaande enquêtes voldoen aan de verlangens van de internationale instellingen die de volkstellingen coördineren en van ieder land een aantal volkstellings-tabellen willen ontvangen. In 2001 was ons land echter opeens een van de eersten die het verlangde huiswerk bij Eurostat (het statistisch bureau van de Europese Unie) kon inleveren, en dat terwijl niemand iets van een volkstelling had gemerkt! De Nederlandse volkstelling van 2001 was dan ook geen echte
25
december 2005 /4
volkstelling, waarvoor de tellers van deur tot deur gaan, maar een virtuele, geconstrueerde telling die geheel op bestaande bestanden berust.
de inkomensverdeling kan vaststellen voor de afzonderlijke etnische groepen, die het CBS naar geboorteland onderscheidt. En binnen de GBA kan men individuen koppelen aan hun ouders, en zo bijvoorbeeld allochtonen van de eerste en de tweede generatie onderscheiden. Waar de registraties tekort schieten kan het CBS natuurlijk altijd nog, net als vroeger, individuele gegevens verzamelen door enquêtering, op basis van vrijwilligheid, bij een steekproef van personen dan wel een steekproefonderzoek houden onder bedrijven. Voorbeelden zijn de Enquête Werkgelegenheid en Lonen (bij bedrijven), de Enquête Beroeps Bevolking (onder personen) en het Permanent Onderzoek Leef Situatie (onder personen), waar het Sociaal en Cultureel Planbureau veel mee werkt. De gegevens over personen uit deze enquê-
Uitbreiding van bevoegdheden
Wat eerder niet mogelijk was kon dit keer wel als gevolg van twee belangrijke nieuwe mogelijkheden van het Centraal Bureau voor de Statistiek (CBS). De eerste is een grote uitbreiding van zijn bevoegdheden. In de Wet op het Centraal Bureau en de Centrale Commissie voor de Statistiek van 1996 kreeg het Bureau uitdrukkelijk toegang tot de bestanden van de overheid, en wel tot de individuele gegevens met inbegrip van de sofi-nummers. Bovendien werd bepaald dat het CBS deze sofi-nummers mag gebruiken ten behoeve van statistische doeleinden. Deze bevoegdheden zijn in de Wet op het Centraal Bureau voor de Statistiek van 2003 bevestigd en niet onaanzienlijk uitgebreid. Natuurlijk ontving het CBS, zoals alle nationale statistische bureaus, altijd al gegevens van instanties zoals de Belastingdienst, maar nu kreeg het toegang tot de bestanden en de mogelijkheid de individuele gegevens zelf te bewerken en, nog belangrijker, ze uit verschillende bestanden op individueel niveau te koppelen. Behalve in Nederland is dit alleen in enkele Scandinavische landen mogelijk; Finland en Denemarken zijn de voortrekkers. De tweede nieuwigheid is natuurlijk de moderne informatietechnologie, die de koppeling ook voor bestanden van vele miljoenen records daadwerkelijk uitvoerbaar maakt. Dat was tien, vijftien jaar geleden nog niet het geval. De mogelijkheden van het CBS zijn hiermee heel sterk verruimd. Men weet nu niet alleen allerlei bijzonderheden van individuen, maar men kan ze ook in kruistabellen naar kenmerken uit verschillende bronnen indelen. De koppe-
tes kunnen vervolgens ook in de gekoppelde bestanden worden opgenomen, mits van die personen een goede koppelvariabele (zoals het sofinummer) bekend is. Bij enquêtes onder personen is dat eenvoudig te bereiken door de steekproef uit de GBA te trekken; daarin is immers het sofi-nummer bekend. Wel zijn nog technische kunstgrepen nodig om er voor te zorgen dat de tabellen waarin gegevens uit enquêtes zijn verwerkt onderling consistent blijven, in die zin dat de randtotalen van verschillende indelingen (uit verschillende bronnen) overeenkomen.
Sociaal Statistisch Bestand
Het eerste project waaraan het CBS zich heeft gewijd is de opbouw van een Sociaal Statistisch Bestand (SSB). De gegevens over zestien miljoen personen van de GBA vormen de ruggengraat van dit bestand; het CBS beschikt over bijna alle gegevens uit de GBA, behalve de persoonsnamen. De GBA is vervolgens. met het sofi-nummer als koppelvariabele, verrijkt met gegevens uit andere overheidsadministraties, zoals de 7,2 miljoen indi-
ling van belastinggegevens aan de Gemeentelijke Basis Administratie (GBA, vroeger bekend als de burgerlijke stand) betekent bijvoorbeeld dat men
STAt O R
viduele records van de Loonbelasting, 6,5 miljoen
26
december 2005 /4
van de Werknemersverzekeringen, 3 miljoen uit de Enquête Werkgelegenheid en Lonen, bijna 800 duizend uit de Inkomstenbelasting van zelfstandigen, en gegevens van uitkeringsinstanties zoals het UWV. Ook is gebruik gemaakt van bestanden van de Gemeenten en van de Informatie Beheergroep. Het SSB bestrijkt op dit ogenblik de jaren van 1999 tot en met 2003; het bestand over 2004 komt komende zomer beschikbaar. Binnen dit bestand geldt de mogelijkheid van individuele koppeling ook voor gegevens uit opeenvolgende jaren, zodat individuen en hun karakteristieken in de loop van de tijd kunnen worden gevolgd. Voor specifieke doeleinden kan het SBB worden uitgebreid met andere informatie, bijvoorbeeld met gegevens over de woning uit gemeentelijke registers, met nadere details van het inkomen uit de Inkomstenbelasting, met gegevens over de opleiding uit de registers van de Informatie Beheergroep of met gegevens over verdachten uit het Herkenningsdienstsyteem van de politie. Dergelijke specifieke bestanden noemt het CBS satellieten van het SSB. De tabellen voor de vir-
de kwalificatie. Dit is een merkwaardig lijstje: Arbodiensten, instellingen van de gezamenlijke gas-, water- en elektriciteitsbedrijven en van de vervoersbedrijven, de Stichting Prismant en de BV Vektis. De Arbodiensten hebben gegevens over het ziekteverzuim, Prismant werkt voor de gezondheidszorg en houdt onder meer landelijke registraties van ziekenhuisopnames bij, en Vektis is het informatiecentrum van de gezamenlijke zorgverzekeraars. Deze laatste bestanden worden op het ogenblik door het CBS gebruikt voor de constructie van een Gezondheids Statistisch Bestand of GSB naar analogie van het SSB. Hierin worden om te beginnen de ziekenhuisopnames van de afgelopen jaren uit de landelijke medische registratie (circa 2,5 miljoen per jaar) aan de GBA gekoppeld, niet via het sofi-nummer maar aan de hand van geboortedatum, geslacht en postcode. Andere gegevens over gezondheidszorg en ziekteverzuim zullen later worden toegevoegd. Met een dergelijk project zijn jaren gemoeid, maar uiteindelijk zal het GSB met het SSB worden samengevoegd. Er ontstaat dan een bijzonder interessant bestand dat vrijwel alles omvat wat je over personen en hun levensloop te weten kan komen.. Ik wil niet uitsluiten dat er nog eens een AmvB komt waarin nog meer registraties voor het CBS worden opengesteld, en dat er nog nieuwe bestanden worden aangelegd, bijvoorbeeld van vermogens en bezit van onroerend goed. Op dit ogenblik is de koppeling in zoverre gebrekkig, dat niet overal met hetzelfde nummer wordt gewerkt: sofinummer en onderwijsnummer zijn hetzelfde, maar in de gezondheidszorg moest men uitwijken naar andere koppelvariabelen, die minder goed werken. Zoals men weet wordt echter op het ogenblik de invoering van een enkel nationaal registratienummer voor personen voorbereid, het Burger Service Nummer, en daarmee zullen deze
tuele Volkstelling 2001 zijn trouwens ook door uitbreiding van het SSB vervaardigd.
Toegang tot registraties
Dezelfde aanpak als bij het SSB kan ook voor andere gebieden worden gebruikt. De mogelijkheden zijn ruim, want het CBS heeft toegang tot zeer veel bestanden. De Wet van 2003 spreekt van registraties, die in verband met de uitoefening van een wettelijke taak worden bijgehouden door instellingen en diensten van het Rijk, provincies, gemeenten, waterschappen, openbare lichamen en zelfstandige bestuursorganen op het niveau van de centrale overheid, kortom door alle overheidsinstanties. Bovendien is er bij Algemene Maatregel van Bestuur nog een stel rechtsper-
problemen hopelijk worden opgelost. De constructie van deze integrale gekoppelde bestanden van individuele gegevens doorbreekt
sonen aangewezen waar het CBS terecht kan voor registraties met dezelfde zojuist genoem-
STAt O R
27
december 2005 /4
de grondregel van de privacy wetgeving dat informatie uitsluitend mag dienen voor het doel waarvoor ze in eerste instantie wordt verzameld. De wet maakt al in het algemeen een uitzondering voor statistische analyses, maar het CBS heeft door de wettelijke bevoegdheid om over zoveel registraties te beschikken en tot individuele koppeling over te gaan toch een uitzonderingspositie. Het draagt daarmee een zware verantwoordelijkheid voor de bescherming en geheimhouding van de persoonsgegevens waarover het beschikt. Natuurlijk wordt er alles aan gedaan om de geheimhouding jegens derden te waarborgen. De Memorie van Toelichting bij de Wet van 2003 geeft aan dat deze geheimhouding ook tegenover de Politie, Justitie, en de Fiscus geldt. Ik denk ove-
volkstelling is afgeschaft zal de GBA nooit meer aan een integrale controle worden onderworpen. Ik weet niet of dit erg is. Er bevinden zich ongetwijfeld mensen in ons land die niet in de GBA zijn opgenomen, noch in enig ander officieel bestand, zodat zij bij de koppeling niet worden opgemerkt. Als men aanneemt dat alle geboorten worden aangegeven, en dat vreemdelingen die hier komen wonen er alle belang bij hebben in de burgerlijke stand te worden opgenomen, dan moet het wel gaan om vreemdelingen zonder geldige verblijfstitel of illegalen. Het CBS zelf heeft met veel kunst- en vliegwerk geschat dat het er tussen de 50 en 150 duizend zijn, een half procent van de geregistreerde bevolking. Hoeveel men-
sen omgekeerd wel in de GBA staan maar niet (meer) in ons land aanwezig zijn is niet bekend, en komt ook niet snel bij de koppeling aan het licht. Tenslotte zijn er mensen die keurig in de GBA geregistreerd staan maar in werkelijkheid niet zo keurig op een ander adres verblijven en/of deel uitmaken van een ander huishouden dan hun officiële inschrijving aangeeft. Bijna iedereen zal wel zo’n geval kennen. Voor de omvang en samenstelling van de totale bevolking maakt dit geen verschil, wel voor cijfers over regio’s of steden en over de gezinssamenstelling. Bij een enkel steekproefonderzoek is gebleken dat slechts circa 2% van de kiesgerechtigden (dat zijn de volwassen Nederlanders) niet op het aangegeven adres aanwezig was. Ik had gedacht dat het er meer zouden zijn. Misschien is het een goed idee de GBA wat vaker door eenvoudige steekproefonderzoeken te controleren.
rigens niet dat deze instanties op de statistische bestanden van het CBS uit zullen zijn, want als zij informatie uit overheidsregistraties nodig hebben kunnen zij die heus wel rechtstreeks verkrijgen.
Gemeentelijke Basis Administratie
Deze integrale gekoppelde bestanden bieden natuurlijk ongekende mogelijkheden voor de statistiek. Er is ook een gevaar aan verbonden en dat is dat men geen onafhankelijke controle meer heeft op de juistheid van de gegevens. Het gebruik van verschillende registraties of enquêtes op verwant terrein vereist vaak moeizame aanpassingen, maar een vergelijking van twee onafhankelijke bronnen kan ook systematische verschillen of fouten aan het licht brengen. Deze vergelijking en controle komen nu aan de orde bij de constructie van het SSB uit verschillende bronnen, maar de benchmark van de traditionele volkstelling ontbreekt. De GBA is de ruggengraat van het SSB, maar hoe goed is de GBA? Eén van de functies van de oude volkstellingen door de dorpsveldwachter was dat er eens in de tien jaar een integrale onafhankelijke controle plaats vond van de Burgerlijke Stand. Nu de traditionele
STAt O R
Statline
Waar kan de geïnteresseerde lezer nu de vruchten van deze grote inspanningen van het CBS genieten? Voor de volkstelling van 2001 verlangde Eurostat rond veertig min of meer uniforme tabellen. Deze staan niet in een reeks boeken, zoals vroeger, maar
28
december 2005 /4
men kan de files van het internet ophalen. Heeft men ze eenmaal uitgepakt (want de bestanden worden in gezipte toestand geleverd) dan bieden ze een buitengewoon rijke akker aan gegevens over de samenstelling van de bevolking naar leeftijd, geslacht, familiestatus, herkomst, opleidingsniveau en economische activiteit, vaak in kruistabellen naar twee of drie kenmerken. Enkele onderwerpen worden nader beschreven in het begeleidende boek, met vier hoofdstukken over mensen en hun werk, vijf over steden en hun omgeving, en twee over de gevolgde methode. Los van de volkstelling 2001 zijn er allerlei tabellen die men kan vinden (of zelf kan samenstellen) op Statline, de online databank van het CBS. Onderzoekers kunnen ook, onder bepaalde voorwaarden (en tegen betaling), hun eigen tabellen bij het CBS bestellen. Sommige categorieën onderzoekers kunnen het SSB on site
de individuele gegevens laten uitvoeren, dit alles binnen de voorwaarden die bij de wet zijn gesteld. Van deze mogelijkheden wordt door vele onderzoekers uit de sociale wetenschappen en de economie gebruik gemaakt. Literatuur Eric Schulte Nordholt, Marijke Hartgers, Rita Gircour (red): The Dutch Virtual Census of 2001. Statistics Netherlands, Voorburg/Heerlen, 2004. De tabellen van de Volkstelling 2001 zijn te vinden op <www.cbs.nl/nl-NL/menu/themas/dossiers/volkstellingen/cijfers/incidenteel/maatwerk/2003-volkstellingexcel.htm>. Voor nadere inlichtingen over de mogelijkheden tot gebruik van de gegevens moet men zich wenden tot Bart Bakker, manager Sociaal Economisch Totaalbeeld (Kamer 0854, CBS, Postbus 4000, 2270 JM Voorburg, telefoon 070 – 337 57 07, e-mail . Mars Cramer is emeritus hoogleraar in de econometrie aan de Universiteit van Amsterdam. E-mail: <[email protected]>.
analyseren, of hun eigen programma bij het CBS op
BETER TEN HALVE GEKEERD…
Sunk costs en de bereidheid om de waarheid onder ogen te zien Vooral grote projecten met een wat langere doorlooptijd hebben er last van. Nog vóór de voltooiing tasten nieuwe inzichten, veranderde
STAt O R
marktomstandigheden of tussentijdse tegenvallers de kansen op winstgevendheid plotseling aan, of vagen die zelfs helemaal weg. Soms
29
december 2005 /4
When you find yourself in is stopzetting van het project op a hole, zal zijn investeringen dat moment de financieel enige moeten afschrijven. juiste oplossing. Bij de besluitvor- the best thing you can do De onderzoeker ming mogen dan alleen de margilegt de situatie voor is st0p digging. nale investeringen worden afgezet aan een groep stutegen de daarmee nog te behalen denten, met de vraag winst. Maar wat blijkt? Hoe hoger of zij – als zij zo’n de sunk costs – al gedane, onom- Warren Buffet project onder hankeerbare investeringen – zijn ten den hadden – dat nog opzichte van de nog resterende zouden voortzetten. investeringen, hoe kleiner de bereidheid om de Een grote meerderheid van 83% zegt het project waarheid onder ogen te zien. meteen te zullen afblazen. Het kan dan voorkomen dat de laatste marDe onderzoeker legt hetzelfde probleem voor aan een andere groep studenten. Maar hij vertelt ginale investeringen óók worden gedaan als die er wel bij dat ‘onze’ – achterlopende – vliegtuiginmiddels niet meer in verhouding staan met de te boeken marginale winst, simpelweg veelal omdat men het grote verlies niet direct onder ogen wil zien, maar wel wil doorschuiven naar de verre toekomst. Dus terwijl men wéét dat andere oplossingen met grote zekerheid zullen leiden tot een beter resultaat, blijkt men bereid zichzelf – en anderen – er van te overtuigen dat de ingeslagen weg vervolgd moet worden. Geen fictie, maar een valkuil waarvan het bestaan met onderzoeken is aangetoond.
bouwer van het oorspronkelijke budget van € 100 miljoen al 90 miljoen heeft uitgegeven, en binnen budget een prototype zal kunnen realiseren. Hij heeft dus nog maar € 10 miljoen ‘te gaan’. Ondanks de zekerheid van verlies - de concurrent komt immers eerder op de markt met een op alle essentiële punten beter toestel - zegt nu nog maar 15% van de studenten dat zij het project zouden stopzetten. Het feit dat nog ‘slechts’ € 10 miljoen nodig is om een project af te ronden waar al € 90 miljoen in is geïnvesteerd, leidt tot een vertroebeld oordeel. Men maakt het zekere verlies liever € 10 miljoen groter, dan het (aanzienlijke, maar kleinere) investeringsverlies op voorhand te accepteren.
Buiten radar
Een onderzoeker neemt als voorbeeld een ondernemer in de luchtvaartindustrie, die is gestart met de ontwikkeling van een vliegtuig dat onzichtbaar is voor radar. Een concurrerend bedrijf is bezig met een soortgelijk project. Na jarenlange simultane activiteiten boekt de concurrent succes: zijn ontwerp voldoet aan alle doelstellingen. Bovendien blijkt dat zijn toestel in alle gevallen sneller en – zowel wat betreft aanschaf als gebruik – goedkoper zal uitvallen dan het ont-
Onder water
Er zijn legio praktijkvoorbeelden van de gevolgen van sunk costs. Neem de Kanaaltunnel. Een omvangrijk project met als doel – voor het eerst sinds de ijstijd – weer een vaste verbinding te leggen tussen Groot-Brittannië en het vaste land van Europa. De ‘chunnel’ werd twaalf maanden te laat in gebruik genomen. De inmiddels gemaakte kosten beliepen het dubbele van hetgeen men in
werp dat ‘onze’ vliegtuigbouwer nog in ontwikkeling heeft. De achterlopende vliegtuigbouwer zal dus vermoedelijk geen enkel toestel verkopen, en
STAt O R
30
december 2005 /4
1987 had begroot. Bovendien kwam al vroegtijdig naar voren dat de opbrengsten te florissant waren ingeschat. Zo was dus al tijdens de bouw bekend dat de ‘chunnel’ tot in lengte van dagen onrendabel zou zijn. Geïnvesteerd geld en prestige weerhielden de initiatiefnemers er echter van om de mislukking toe te geven. De ‘chunnel’ is daarom afgebouwd. Rentebetalingen werden stopgezet, een schuldsaneringsplan ingezet. Nu draait de ‘chunnel’ marginaal, nauwelijks in staat om de resterende rentelasten op te brengen.
het proces rondom het afhandelen van verstrekte leningen die zich moeilijk laten terugwinnen. Om erger te voorkomen analyseert de adviseur allereerst de oorzaak van de ‘slechte’ leningen. Dat geeft een duidelijk beeld. De moeilijk inbare leningen betreffen in veel gevallen cliënten die al langere tijd aan één relatiemanager zijn toegewezen. Na het fiatteren van een eerste lening, blijkt de manager de betrokken cliënten later aanvullende leningen te hebben verstrekt. De relatiemanager voelde zich daartoe kennelijk – bewust of onbewust – verplicht. Vanwege de goede relatie, misschien. Maar gezien het oninbare karakter van de leningen is het waarschijnlijker dat de manager met de vervolgleningen heeft gepro-
Boven de wolken
Een ander voorbeeld van de invloed van sunk costs op de beoordeling van het point-of-noreturn is de ontwikkeling van het supersonische lijnvliegtuig Concorde. De ontwikkelingskosten daarvan vielen zevenmaal hoger uit dan ooit begroot, terwijl de opbrengsten zwaar overschat bleken te zijn. Dergelijke grove misvattingen moeten zich al ver vóór de oplevering van de eerste commercieel inzetbare Concorde hebben afgetekend. Toch heeft men doorgezet. Met hoge nieuwe investeringen is het supersonische toestel in productie genomen. Er zijn uiteindelijk slechts negen toestellen verkocht. Tegen beter weten in zijn die jarenlang in de lucht gehouden. Na continue zware verliezen is pas recentelijk een einde gekomen aan het operationele leven van dit toestel: in oktober 2003 maakte de Concorde zijn laatste vlucht.
beerd eerdere vergissingen goed te maken. Zónder de vervolglening is er kans op het ‘omvallen’ van de cliënt, en kunnen de eerdere leningen definitief worden afgeschreven. Zo is het van kwaad tot erger gegaan. De adviseur geeft de bank in overweging alle debetcliënten waarbij zich ook maar enig probleem voordoet, direct aan een andere relatiemanager toe te wijzen. De strategie werkt. De bank verstrekt zijn cliënten nog altijd extra leningen, maar uitsluitend op objectieve gronden.
Onder nul
Het dilemma van de sunk costs speelt in veel – meest kapitaalintensieve en langlopende – projecten van uiteenlopende aard. Bij investeringen in ict, productieplants en infrastructurele werken, die vanaf vandaag nog worden gedaan. Als de marginale bijdrage de additionele investering niet goedmaakt, moet het project worden gestopt. Sunk costs mogen daarbij geen rol spelen.
seur wordt verzocht inzichten te verschaffen in
Met toestemming overgenomen uit de publicatie Beslissen = menselijk; besluitvormingsprocessen vanuit het perspectief van behavioural finance, uitgebracht door Cardano Risk Management (Rotterdam, 2003), <www.cardano.nl>.
Ander bekend voorbeeld van sunk costs komt uit de krediet-verschaffingshoek. Dit wordt geïllustreerd aan de hand van de praktijkervaring van een adviseur. Eén van zijn cliënten is een grote, gerenommeerde bankinstelling. De advi-
STAt O R
31
december 2005 /4
Policy Research Corporation CONCRETE OPLOSSINGEN GESTEUND OP WETENSCHAPPELIJK ONDERZOEK De kerncompetentie van Policy Research Corporation bestaat uit het leveren van concrete oplossingen voor strategische
Policy Research Corporation is een internationaal opererend consultancybedrijf dat het topsegment van overheid en bedrijfsleven adviseert. Voor onze vestiging in Rotterdam zijn wij op zoek naar een
bedrijfsvraagstukken.
(JUNIOR) STRATEGY CONSULTANT (m/v)
Sinds de oprichting in 1989 is Policy
met bovengemiddelde wetenschappelijke en sociale kwaliteiten en
problemen
en
Research Corporation uitgegroeid tot een gerenommeerd onderzoeksbureau. Onze rol in diverse onderhandelingsprocessen van (inter)nationaal belang onderstreept deze prominente positie. Onze klanten zijn managers in de top van bedrijven en overheden binnen en buiten Europa.
affiniteit met strategische advisering.
Wie zoeken wij? De (junior) strategy consultant die wij zoeken heeft het volgende profiel: • Een met uitstekende studieresultaten afgeronde opleiding op academisch niveau Econometrie, Kwantitatieve Economie of een vergelijkbare studierichting; • Affiniteit met strategisch onderzoek; • Uitstekend analytisch en probleemoplossend denkvermogen; • Luistert kritisch en formuleert duidelijk in woord en geschrift, zowel in het Nederlands als in het Engels; • Pragmatisch, resultaatgericht en zeer leergierig. De taken van een (junior) strategy consultant omvatten alle facetten van het onderzoeks- en implementatieproces: van het uitvoeren van analyses tot het formuleren van aanbevelingen en het deelnemen aan onderhandelingen met hoofdrolspelers in het besluitvormingsproces.
Wat bieden wij? Policy Research Corporation biedt jou een gedreven en inspirerende jonge werksfeer en een takenpakket waarbij je direct veel verantwoordelijkheden krijgt. Een goed arbeidsvoorwaardenpakket met aantrekkelijke secundaire arbeidsvoorwaarden en er wordt gewerkt met een transparant beloningsen prestatiesysteem. Herken je jezelf in bovenstaand profiel, dan ontvangen wij graag jouw motivatie en curriculum vitae per e-mail of per post t.a.v. Policy Research Corporation Nederland B.V., t.a.v. de heer Frank Hendrickx (frank. [email protected]), Parklaan 40, 3016 BC te Rotterdam. Voor verdere informatie over deze vacature en andere vacatures kun je telefonisch contact opnemen met Tom Moester (010-436 03 64).