Technische Hogeschool Afdeling der Weg- en Waterbouwkunde
Gebruik van moderne statistische methoden
ZESTIENDE VAKANTIECURSUS 16 en 17 januari 1964
MOORMANS PERIODIEKE PERS N.V.
-
D E N HAAG
Reeds zijn in onderstaande volgorde in boekvorm verschenen de voordrachten van de volgende cursussen: l. Filtratie, 2. Vervaardiging van buizen voor transport- en distributieleidingen. 3. Winning van mondwater. 4. waterzuivering: 5. Hygiënische aspectei van de m-wate&ooniening; 6. Het transmrt en de distributie van leidinmater, 7. Keuze. aantasting en bescherm& van materialen voor koud- en wa&nwaterleiciin~en.8. g en 10. Enige ketenschappelijke grondslagen der waterleidingtec&ek I, II en Iii. 11. Radioactiviteit, 12. Het mondwater, 13. De Riin. - .14. Nieuwe ontwikk;lingen in de waterleidingtechniek op f&sch, chemisch en biole gisch gebied, 15. De watervoorziening en de industrie. -
Technische Hogeschool A f d e l i n g der Weg- en Waterbouwkunde
Zestiende Vakantiecursus in drinkwatervoorziening gehouden op 16 en 17 januari 1964 te Delft
Gebruik van moderne statistische methoden
MOORMANS PERIODIEKE PERS N.V.
-
DEN HAAG
WOORD VOORAF Gaarne geef ik gevolg aan het verzoek van de Voorzitter van de Commissie inzake Vakantiecursussen in Drinkwatervoorziening hier een enkel woord te zeggen. Het was voor de Afdeling der Weg- en Waterbouwkunde van de Technische Hogeschool Delft steeds een genoegen gastvrijheid te verlenen aan de Vakantiecursussen in Drinkwatervoorziening, omdat het streven van genoemde Commissie de volle instemming heeft van de Afdeling en omdat elke nascholingscursus kan leiden tot een beperkte verkorting van de studieduur aan de T.H. Bij het streven naar verkorting van de studieduur staat de Technische Hogeschool Delft, evenals alle instellingen voor wetenschappelijk onderwijs, voor de moeilijke taak: 1. een ald doend hoog wetenschappelijk peil voor het onderwijs te handhaven; 2. de snelle vorderingen van wetenschap en techniek zo goed mogelijk te volgen; 3. een voor de diverse onderdelen bv. voor de opleiding tot civielingenieur, voldoend brede basis te handhaven; 4. een behoorlijke studievrijheid te eerbiedigen; 5. een studieduurverkortingte bereiken. Reeds mijn voorganger, prof. ir. A. A. van Douwen, heeft in vorige cursussen verteld van de plannen van de Afdeling m.b.t. een onderwijsherziening, waarbij voortdurend aan genoemde punten aandacht werd geschonken. Maar het zal niet lukken, een schaap met vijf poten ter wereld
te brengen. De minister van Onderwijs, Kunsten en Wetenschappen heeft gewaarschuwd, dat hij zelf de nodige maatregelen zal treffen om studieduurverkortingte bereiken als de instellingen van wetenschappelijk onderwijs daarvoor geen middelen weten te vinden. De Rector Magnificus van de Technische Hogeschool Delft heeft tijdens het bezoek van de minister aan deze Technische Hogeschool op de dag van deze Vakantiecursus erop gewezen, dat het bereiken van een studieduurverkorting niet alleen afhangt van de maatregelen, te treffen door de Technische Hogeschool, of door het ministerie van Onderwijs, Kunsten en Wetenschappen, maar altijd ook van de studenten zelf. Nu is er natuurlijk wel een methode om een - zij het ook beperkte - studieduurverkorting te verkrijgen, bv. door veel aandacht *teschenken aan de (basis-en hulpwetenschappen (wiskunde, natuurkunde, de mechanica's, inclusief de hydraulica, de constructievakken, enz.), en bij de zuiver technische vakken niet teveel tot beschrijving over te gaan maar te volstaan met het wijzen op de beginselen die bij het coiistrueren moeten gelden en op de achtergronden van de constructies. Aldus behandelt men de hoofdlijnen en laat veel details onbehandeld, overwegende, da+ de pas afgestudeerde ingenieur in zijn praktijk de details, waarmee hij te maken krijgt, zelf zal moeten leren. Hierin schuilt het gevaar, dat hij de werkwijzen en details leert kennen zoals ze tot nu toe geweest zijn en gebruikelijk waren, maar niet die, welke volgens de nieuwste inzichten de meest wenselijke zijn. Om nu na beëindiging van de studie tijdens de werkzaamheid in de praktijd op de hoogte te komen en te blijven van de inmiddels verbeterde zienswijzen is bezoek aan post-academiale cursussen zo nuttig. Aan de Commissie inzake Vakantiecursussen in Drinkwatervoorziening komt de eer toe, naar ik meen, de eerste te zijn geweest, die een onderwerp, dat aan de Technische Hogeschool wordt behandeld, heeft gekozen als onderwerp voor de door haar in het leven geroepen telkenjare terugkerende vakantiecursus, op-
dat mensen uit de praktijk op de hoogte kunnen blijven van de laatste stand van wetenschap en techniek. Ditmaal is het de laatste keer, dat de huidige Voorzitter, prof. W. F. J. M. Krul, als hoogleraar een inleiding voor deze cursus zal houden. Hij was het die zestien jaar geleden de stoot tot het organiseren van deze vakantiecursussen heeft gegeven en die al die jaren een stuwende kracht van de Commissie is geweest. Ik hoop voor prof. Krul en voor de Commissie dat prof. Krul niet zonder meer van het toneel zal verdwijnen als hij volgend jaar geen hoogleraar in deze Afdeling meer zal zijn, maar dat de Commissie ook voor volgende jaren van zijn kennis en ervarhg zal kunnen profiteren. Ik zou willen besluiten met een wens en een woord van dank. Ik wens de Commissie met deze 16e cursus een even groot succes toe als zij met alle voorgaande heeft gehad en ik dank prof. Krul namens de Afdeling van harte voor wat hij deze zestien jaar als hoogleraar voor deze Commissie en voor deze cursussen heeft gedaan. Delft, januari 1964
De Voorzitter van de Afdeling der Weg- en Waterbouwkunde, prof. ir. F. M. C. Berkhout
Algemene inleiding door prof. W . F . J . M. Krul
Bij de aanvang van deze 16e Vakantiecursus past het, onze op 13 juni 1963 overleden vriend ir. Andrew F. Meyer te herdenken, die op zo voortreffelijke wijze als lid van de Commissie van Voorbereiding de eerste 15 cursussen hielp tot stand brengen. Hij vervulde een zéér bijzondere plaats in de Nederlandse waterleidingkring, als bekwaam en vooruitstrevend bedrijfsdirecteur, als leider van commissies en vergaderingen, als toegewijd medewerker ook aan menige studie. Maar vooral leeft hij voort in de gedachten van zijn vele vrienden door zijn begaafdheid met uitzonderlijke karakterdeugden. Nooit kwamen die treffender uit dan tijdens zijn langdurige ziekte, die hij met volle bewustzijn en in volledige berusting aanvaardde.
*
Reeds gedurende vele decennia plegen onze waterleidingbedrijven jaarlijks gegevens van technische en fiancïele aard omtrent produktie, distributie en consumptie beschikbaar te stellen aan een centrale instantie die voor geordende publikatie zorgt. Aanvankelijk was die instantie de Vereniging voor Waterleidingsbelangen, thans is het de Vereniging van Exploitanten van Waterleidingbedrijven in Nederland. Die statistische overzichten zijn uitermate belangrijk en in weinig andere landen zó volledig, voor zover ze daar al bestaan. De leiding van een bedrijf kan er vergelijkingsmateriaal, trots of jaloezie aan ontlenen, de overheid grondslagen voor doelmatig en rechtvaardig beleid, de bedrijfsadviseur voorlopig inzicht, de buitenlander bewondering, de hoogleraar stof voor collegebeschouwingen. Toch is deze statistische activiteit niet de statistiek, die de Commissie van Voorbereiding zich als onderwerp voor deze 16e Vakantiecursus voor ogen stelde: de overzichten van de VEWIN geven immers cijfermateriaal, waarop wellicht statistische methoden kunnen worden toegepast, de cursus echter zal de statistische methodiek met haar beginselen en doelstellingen behandelen.
Men dient zich ervan bewust te zijn of te maken, dat in de moderne industriële samenleving het individu steeds meer afhankelijk is van wat de collectiviteit voor hem verricht. In het agrarische milieu bedient de mens zich van eenvoudige, deels door hemzelf vervaardigde, werktuigen, die hij kent, begrijpt en kan herstellen; hij beheerst zijn omgeving, voorzover die niet door hogere natuurmacht wordt bepaald. In het industriële milieu is de enkeling nagenoeg geheel afhankelijk van een onnoemelijk aantal specialisten die in een ingewikkeld samenstel zijn voortbeweging, zijn voeding, zijn gezondheid verzorgen. Steeds groter wordt daardoor de invloed en de verantwoordelijkheid van collectieve ondernemingen en de overheid; het besturen van die collectiviteiten is een nieuwe specialiteit geworden die om wetenschappelijke beoefening vraagt. Zeer merkwaardig is daarbij, dat de mens in het huidige stadium van zijn evolutie, nu hij - naar Teilhard de Chardin ons leert - van de biosfeer in de noösfeer, de sfeer van de geest, is getreden, de hoogst merkwaardige automatische interne regeling van zijn eigen lichaam heeft ontdekt. Door een wonderbaarlijk mechanisme van inwendige chemische processen, beheerst door interne secretie van velerlei aard, adapteert de mens zich of hij tracht zich te adapteren aan veranderingen in zijn milieu. Dat mechanisme wordt bestuurd door elektrische prikkels, door een informatiesysteem en een keuzesysteem. Men is nu tot het inzicht gekomen dat in wezen dezelfde wetten de basis vormen voor de elektronische regeltechniek en dat aldus de studie van de biologische verschijnselen de ontwikkeling van de regeltechniek kan bevorderen. In 1960 heeft men aan deze nieuwe wetenschap de naam ,,bionicay' gegeven. De grondslagen voor de technische stuurmechanismen en de automatische rekenmachines of computers zijn vervat in de cybernetica, zoals de thermodynamica de grondslag vormt van de warmtemachines. Ik vermeld deze bijzonderheden omdat zij aanvankelijk meer of minder vaag rondwaarden in het ondeskundig brein van de leden van de Voorbereidingscornmissie van deze Vakantiecursus. Voorgelicht door prof. ir. L. J. Mostertman, die aan onze Delftse internationale cursussen de ,,engineering operation" doceert, kregen wij de deskundige medewerking van de docenten van deze cursus. Daarbij werd het ons aldra duidelijk dat noch de cybernetica, noch de werking van computers een onderwerp van
bespreking moesten zijn, maar wel de mathematisch-statistische methoden die aan informatie en beslissing ten grondslag liggen. Het gaat hierbij niet om de ,,definiete9' wiskunde, die stellingen uit bepaalde axioma's afleidt, maar om de waarschijnlijkheidsrekening, waarmee op grond van bepaalde gegevens bepaalde consequenties met een zekere mate van nauwkeurigheid kunnen worden voorspeld, om een benadering volgens zg. ,,stochastische methoden". In mijn Grieks woordenboek vind ik voor ,,stochazoma?' de vertaling: ,,op iets mikken, maar iets gissen". Het woord ,,stochasis" wordt vertaald met ,,gissingw. De heer De Jonge zal als eerste inleider ons een algemene begripsomschrijving van moderne statistische methoden geven en voorbeelden van toepassing in zijn rijke ervaring als statisticus bij het Nederlands Instituut voor Praeventieve Geneeskunde. Dit is onontbeerlijk voor het hoofddoel van deze cursus, dat kan worden omschreven als: het aantonen van het nut van deze methoden in de moderne techniek en bedrijfsvoering. Tot nu toe is in het waterleidingbedrijf de toepassing vrijwel beperkt gebleven tot het bacteriologisch wateronderzoek, waarin ir. Leeflang ons een inzicht zal geven. Steeds méér echter, vooral tijdens en na de Tweede Wereldoorlog, is het belang van de stochastische methoden voor het nemen van beslissingen en het ontwerpen van technische constructies op velerlei gebied aan het licht getreden. Daaraan zullen de lessen van prof. Cohen en prof. Monhemius zijn gewijd. Zij zullen ongetwijfeld laten uitkomen, dat het de moeite loont, de toepassing ook in de waterleidingtechniek en de bedrijfsvoering van de waterleidingbedrijven te overwegen en te bevorderen. Men mag van deze cursus geenszins pasklare voorschriften verwachten, maar wel een prikkel voor de waterleidingdeskundigen om te gaan denken. Het zal niet mogelijk zijn, tenzij misschien bij de grootste bedrijven, om eigen statistische deskundigheid in de staforganisatie in te bouwen. Wel acht de Commissie van Voorbereiding het mogelijk, dat in samenwerking tussen verschiiiende bedrijven, wellicht door inschakeling van het KIWA, voorlichting wordt gezocht bij deskundigen op het gebied van statistische methoden als hulpmiddel bij ,,operationeel onderzoek" (een goede vertaling van ,,operational research"). Dat zou een fraai resultaat van deze ongetwijfeld niet gemakkelijke studiedagen zijn.
Aan het einde van deze inleiding wil ik aan onze deskundigen en overige aanwezigen het volgende vraagstuk voorleggen. Twee hoogleraren zijn betrokken bij de voorbereiding van een cursus in statistische methoden op geheel verschillende gebieden van de techniek, waarbij zij geen enkele voeling met elkaar houden. Hoe groot is de kans, dat hun cursus op dezelfde dag zal aanvangen? Dit probleem is actueel, want op deze zelfde dag opent mijn collega prof. ir. J. Volmuller aan deze zelfde Hogeschool een cursus in ,,Statistiek en waarschijnlijkheidsleer met betrekking tot de verkeerskunde", waarin ook prof. Cohen als docent optreedt. Ik kan er als leek slechts deze verklaring voor vinden: ,,it is in the air". Ten slotte een waarschuwing inzake het gebruik van de statistiek, die ik in een Franse publikatie vond: ,,la statistique est le bikini des grandes entreprises: elle cache ce qui est intéressant".
Statistiek en proefopzet door H . de Jonge
1 . Statistiek Bij het woord statistiek plegen velen in de eerste plaats te denken aan methoden, die kunnen worden gebruikt als men beschikt over een uitgebreid waamemingsmateriaal, dat moet worden omgezet in tabellen en grafieken, of dat tot een reeks kengetallen (zoals gemiddelden of correlatiecoëfficiënten) moet worden gereduceerd. Anderen denken wellicht aan min of meer ingewikkelde rekenmethoden, die tenslotte tot een conclusie leiden waarin het woord ,,significanty' voorkomt. Deze opvattingen omtrent de statistiek zijn echter verouderd en zodoende misleidend. Het is mijn taak u een indruk te geven van de rol, die de moderne statistische methoden - zoals deze in de afgelopen 50 jaar zijn ontwikkeld - kunnen spelen bij de opzet van onderzoekingen en bij de analyse van hun uitkomsten. Het is, zoals wij later zullen zien, niet toevallig dat ik in de voorgaande zin eerst spreek over de rol van de statistiek bij de opzet van een onderzoek en pas daarna haar gebruik bij de analyse van de onderzoekuitkomsten noem. In de laatste decennia is namelijk een samenspel van experiment en analyse tot stand gekomen, waarbij, zoals Hamaker (4) opmerkt: ,,. . . uit de gedachtenwereld van de statistiek tal van nieuwe ideeën zijn voortgesproten over de wijze waarop experimenten het best h e n worden genomeny'. voordat wij echter over de proefopzetten op statistische basis kunnen gaan spreken, dien ik enige aandacht te wijden aan enkele essentiële elementen van de ,,taal" van de statistiek. Ik wil daarbij uitgaan van een eenvoudige definitie, nl.: statistiek is een hulpwetenschap, die kan worden gebruikt bij het bestuderen van de variatie die optreedt in kenmerken van de elementen van een populatie. Een (statistische) populatie is de nauwkeurig omschreven verzameling van elementen, waarop een onderzoek betrekking heeft. De elementen van zo'n populatie kunnen materiële objecten, zoals mensen, dieren of voorwerpen, zijn. Zij kunnen echter ook be-
staan uit gebeurtenissen (zoals ongevallen), getallen, of uit denkbeeldige elementen (zoals waarnemingsuitkomsten die zouden kunnen worden, maar niet zijn verkregen). Laat ik enkele voorbeelden van dergelijke populaties geven. 1. De arbeiders die op 1 januari 1964 in een bepaald bedrijf werkzaam zijn. 2. De geregistreerde verkeersongevallen op de openbare weg in Nederland in 1962. 3. Alle metingen die waarnemer A aan een bepaald voorwerp op voorgeschreven wijze zou kunnen verrichten. 4. De gehele getallen van 1 t / m 100. Wanneer men t.b.v. een onderzoek een populatie heeft gedefinieerd, gaat men over tot het verrichten van waarnemingen aan de elementen van deze populatie. Deze waarnemingen betreffen min of meer gedifferentieerde reeksen van kenmerken, die kwalitatief of kwantitatief kunnen zijn. Een kwalitatief kenmerk wordt met een omschrijving (soms met een niet-numeriek symbool) aangeduid. Het eenvoudigste systeem van kwalitatieve kenmerken is de dichotomie (tweedeling), bestaande uit twee kenmerken (positief/negatief, geslaagdlgezakt). Hierop volgt een systeem van k (3 of meer) kenmerken; bij zo'n categorisch systeem kan men onderscheid maken tussen: a. een systeem waarbij de kenmerken een intrinsieke volgorde bezitten (zoals de reeks: goed/voldoende/matig/onvoldoende/slecht), en b. een systeem waarbij dit niet het geval is (zoals: de reeks bestaande uit alle in Nederland voorkomende godsdiensten; de verschillende soorten defecten die een produkt kan vertonen, plus het kenmerk ,,niet defect").' Een kwantitatief kenmerk wordt verkregen door tellen, meten of wegen en het bestaat uit een getal (waarde, score). Bij kwantitatieve kenmerken krijgt men te doen met categorische systemen van waarden van grootheden (zoals lichaamslengte, verzuimduur, hoeveelheid neerslag). Bestudeert men de elementen van een populatie t.a.v. een bepaald categorisch systeem, dan blijkt variatie op te treden: niet alle elementen bezitten hetzelfde kenmerk of dezelfde waarde. Men kan vaststellen hoe frequent elk kenmerk, resp. elke waarde, voorkomt en de reeks van bij een categorisch systeem behorende frequenties, de frequentieverdeìing, geeft een beeld van het variatiepatroon. Tabel 1 geeft een voorbeeld, waarbij de frequen-
--
Deze kwalitatieve kenmerken komen vooral op psychologisch, sociologisch en medisch gebied veel voor.
l
TABEL I Geregistreerde verkeersongevallen op de openbare weg in Nederland
Frequentieverdelingen naar ernst Ernst van het ongeval Dodelijke afloop Ten hoogste ernstig letsel Ten hoogste licht letsel Uitsluitend materiële schade Totaal
1
1938
1947
1951
1956
1961
740
941
1088
1534
1873
6593
11 480
19 198
27 166
5 074
8 382
12 600
15 970
11 913 32001
26792
53 753
95 482
145 237
46664
39 400
74703
128 814
190246
~elatievefrequentieverdelingen Dodelijke afloop T.h. ernstig letsel
1,6
( i
%)
2,4 16,7
1s 15,4
12 14,9
1,o 14,3
12,9 68,O
11,2 71,9
93 74,l
8,4 76,3
29.8
T.h. licht letsel Uitsl. mat. schade
68,6
tieverdelingen naar ernst zijn gegeven van de geregistreerde verkeersongevallen op de openbare weg in Nederland in de jaren 1938, 1947, 1951, 1956 en 1961. Voor het vergelijken van de verdelingen onderling zijn ook de relatieve frequentieverdelingen berekend, die voor elk jaar laten zien welk procentueel aandeel elke categorie in het totaal aantal ongevallen bezit. Een onderzoek wordt vaak verricht om:
1. het variatiepatroon (in de vorm van frequentieverdelingen) van één of meer categorische systemen van een populatie te leren kennen; voorbeeld:' een onderzoek naar aantal en aard van defecten bij de vervaardiging van een bepaald produkt; 2 . na te gaan of de variatie van twee of meer categorische systemen binnen één populatie een samenhang vertoont enlof om deze samenhang te bestuderen; voorbeeld: een onderzoek naar de relatie tussen de afvoer van de Rijn te Lobith en het chloorgehalte te Rhenen (zie tabel 2); 3. de frequentieverdelingen van een categorisch systeem van twee of meer populaties te vergelijken; voorbeelden: onderzoek, waarbij per machine een frequentieverdeling wordt opgesteld; onderzoek naar de verdeling van chloorgehalten in een rivier in de zomer- en winterperioden (zie tabel 3); 4. de fluctuatie, d.i. de variatie in de tijd, van één of meer categorische systemen, al dan niet in hun onderlinge samenhang, te bestuderen.
TABEL 2 Correlatie tussen de afvoer van de Rj'n te Lobith (m3/sec) en het chloorgehalte te Rhenen (mgtl) in de wintermaanden van 1926-1930 (1 nov.1 mei). Perioden met zware ijsgang of ijsbedekking zijn buiten besehouwing gelaten. Gegevens uit ,,Rapport 1940, de watervoorziening van Amsterdam" Log (chloorgehalte) Log (afvoer)
130- 140- 150- 160- 170- 180- 190- 200- 210- Totaal 139 149 159 169 179 189 199 209 219
4,OO-4,09 3,90-3,99 3,80-3,89 3,70-3,79 3,60-3,69 3,50-3,59 3,40-3,49 3,30-3,39 3,20-3,29 3,lO-3,19 3,OO-3,09
1 3 1 2 11 1 1 1 1
Totaal
7
24
1
1 7 46 50 4
1 3 25 34
9
4 13 44 40 82 123 115 148 84 47
64 105 153 168 108
63
9
701
32 24 8
14 1 57 16 3 4 8 1 53 2
1 7 54 97 9
TABEL 3 Verdelingen van de (logaritmen van de) chloorgehalten te Rhenen, 19261930, in de zomermaanden (1mei-l nov.) en de wintermaanden (1 nov.1 mei). Gegevens uit ,,Rapport 1940 enz."
Absolute frequenties Log (chloorgehalte)
Totaal
Relatieve frequenties
Zomer fz
Winter f rv
100.fzlnz
100.f wlnw
759 nz
701 n n7
100,l
100,O
Bij deze en dergelijke (en vanzelfsprekend meestal meer gecompliceerde onderzoekingen) kan men in de eerste plaats gebruik maken van de beschrijvende statistiek. Ik moet afkien van een behandeling van deze tak van de statistiek en volsta met de vermelding, dat hij methoden verschaft voor: a. de ordening van waarnemingen, bv. door het opstellen van frequentie en conelatietabellen, b. het tekenen van grafieken, bv. voor het verge-
lijken van frequentieverdelingen, c. het karakteriseren van frequentieverdelingen d.m.v. kengetallen zoals gemiddelden, spreidingsmaten, correlatiematen. Indien men steeds alle tot de onderzoekpopulatie behorende elementen in het onderzoek zou kunnen betrekken, zou men met de beschrijvende statistiek kunnen volstaan. Gewoonlijk is dit echter niet mogelijk. Vele populaties bezitten een zo grote omvang en/of geogra£ische spreiding, dat een volledig onderzoek te tijdrovend of te kostbaar is. Op industrieel gebied is vaak de moeilijkheid, dat de elementen door het onderzoek zelf worden beschadigd of verloren gaan (een fabrikant van lucifers kan niet van elk geproduceerd exemplaar onderzoeken of het bevredigend ontvlamt en brandt). Op medisch terrein dient men bij vele onderzoekingen, bv. bij die naar de werking van geneesmiddelen, de omvang van het onderzoek om ethische redenen zoveel mogelijk te beperken. Verder zijn er vele situaties, waarin men op grond van een betrekkelijk klein, nu ter beschikking staand aantal elementen, conclusies moet trekken omtrent een populatie die (wellicht) slechts in de toekomst zal gaan bestaan; zo zal men bv. in de industrie, op grond van proeven met een aantal prototypen, willen uitmaken of een nieuw produkt ook inderdaad in fabricage zal worden genomen. Tenslotte noem ik de mogelijkheid dat het economisch niet verantwoord is de onderzoekpopulatie volledig te bestuderen, omdat een betrekkelijk klein deelonderzoek voldoend betrouwbare informatie kan verschaffen (zoals bij marktonderzoek). In de praktijk zal men dus meestal (moeten) volstaan met het onderzoeken van een deel van de populatie, een steekproef (of monster). Hierbij doet zich onmiddellijk een aantal vragen voor, nl. hoe groot moet de steekproef zijn, hoe moet deze worden samengesteld en welke uitspraken omtrent de populatie laat zij toe? Het is duidelijk dat deze vragen een samenhang bezitten: een ,,verkeerdy7 samengestelde steekproef zal onherroepelijk tot verkeerde conclusies omtrent de populatie leiden; een op juiste wijze samengestelde steekproef zal meer informatie (omtrent de populatie) bevatten, naarmate zij groter is. Ik laat de (belangrijke) vraag omtrent de steekproefomvang buiten beschouwing en neem aan, dat zij ,,zo groot mogelijk" wordt gekozea2 Veronderstel nu dat een populatie volledig bekend is en uit N Onder bepaalde voorwaarden kan de voor een verantwoord onderzoek noodzakelijke steekproefomvang echter van te voren worden aangegeven, of er kan een zg. sequent onderzoek worden uitgevoerd.
TABEL 4 Aantal mogelijke verschilleude steekproeven, C
t (t) , =
bij
trekking zonder teruglegging Steekproefomvang I1
Aantal steekproeven
TABEL 5 Alle mogelijke, verschillende steekproeven van n-3 elementen uit een 6 populatie van N = 6 elementen met de waarden 1,2,
....
elementen bestaat, waarvan er n in de steekproef worden opgenomen. Er kunnen echter vele verschillende steekproeven van n elementen worden gevormd. Tabel 4 geeft een overzicht waaruit blijkt dat zelfs bij een kleine omvang van de populatie het aantal mogelijke verschillende steekproeven (d.i. het aantal steekproeven dat tenminste één verschillend element bevat) reeds (zeer) groot is. Tabel 5 geeft een overzicht van alle mogelijk verschillende steekproeven van n = 3 elementen die kunnen worden getrokken uit een populatie van N = 6 elementen, die de waarden 1, 2, 3, 4, 5 en 6 dragen. De tweede tak van de statistiek, de mathematische statistiek (statistica) verschaft technieken voor het doen van uitspraken omtrent de populatie op basis van een steekproef. De mathematische statistiek kan echter slechts worden gebruikt als de steekproef aselect wordt samengesteld (getrokken) d.w.z. als de trek-
king zó plaatsvindt dat elke mogelijke steekproef dezelfde kans heeft om als de te bestuderen steekproef te worden aangewezen. Indien de tot de populatie behorende elementen van 1 t/m N kunnen worden genummerd, kan men deze aselecte trekking uitvoeren d.m.v. een lotingsprocedure. Men laat door het toeval n nummers tussen O en N 1 aanwijzen en neemt de elementen van de populatie, die deze nummers dragen in de steekproef op. Men kan hierbij gebruik maken van tabellen met aselecte getallen (zie De Jonge (7), O 1.3.1.). Bij het uitvoeren van experimenten gaat men vaak uit van een steekproef van n elementen uit de onderzoekpopulatie, die in twee of meer groepen wordt gesplitst, die verschillende ,,behandelingen" ondergaan. Deze groepen dienen eveneens aselect te worden samengesteld (men noemt dit aselecteren) en men kan hierbij het beste gebruik maken van tabellen met aselecte permutaties (zie De Jonge (7) 8 1.3.2.). De zojuist genoemde procedures gaan uit van een zg. volledige aselecte trekking, resp. aselectering. Indien echter omtrent de samenstelling van de populatie (resp. steekproef) relevante informatie ter beschikking staat kan men tot laagsgewijze trekking (resp. aselectering) overgaan. Als de populatie bestaat uit een groot aantal betrekkelijk kleine deelpopulaties (,,clusters"), staat de methode van de groepssteekproeven (,,cluster sampling") ter beschikking (zie voor deze en andere speciale steekproeftechnieken: De Jonge (7), O 1.3.3. en 1.3.4.). Vaak kan men bij het steekproeftrekken geen loterijprocedure toepassen, bv. omdat het inventariseren en/of nummeren van de elementen van de populatie vrijwel onmogelijk is. In deze gevallen moet men zoeken naar een trekkingsmethode, waarvan redelijkerwijze mag worden aangenomen dat zij een aselecte steekproef zal opleveren. Dit is niet altijd eenvoudig, maar bijzonder belangrijk. Is de steekproef immers niet als aselect te beschouwen (,,biassed", onzuiver), dan is de betrouwbaarheid van de conclusies, die zij omtrent de populatie oplevert, onbekend. Men dient zich te realiseren dat de mens een bijzonder slecht instrument is voor het maken van een aselecte keuze. Yule en Kendall (9) merken hierover op: ,,Wherever there is any scope for personal choice or judgement on the part of the observer, bias is almost certain to creep in. Nor is this a quality which can be removed by conscious effort or training. Nearly every human being has, as part of his psychological make-up, a tendency away from true randomness in his choices". Om deze reden is dan ook het zg. doelbewust steekproeftrekken niet aan te bevelen. Deze
+
methode van uitzoeken van wat typerend voor de populatie wordt geacht is immers juist in sterke mate gevoelig voor (vaak onbewuste) vooroordelen van de onderzoeker. Een algemeen verbreide misvatting is, dat een ,,lukrakev keuze van de elementen wel tot een aselecte steekproef zal leiden. Gewoonlijk is dit juist niet het geval, omdat allerlei niet vermoede of qua invloed moeilijk waardeerbare factoren selectief blijken te werken. Trekt men bv. uit een kooi met 25 ratten lukraak een steekproef van 5 ratten, dan verkrijgt men - zoals vele proeven hebben aangetoond - overwegend de tragere en daardoor zwaardere dieren. Selectie kan ook optreden als men de steekproef wel aselect heeft samengesteld, maar als tijdens het onderzoek uitvallers optreden. Dit kan zich o.m. voordoen bij schriftelijke enquêtes, indien een belangrijk deel van de personen die een enquêteformulier hebben ontvangen geen antwoord inzendt. De autoselectie die hierbij optreedt kan tot een bijzonder onzuivere steekproef leiden. De conclusies die een steekproef oplevert hebben uitsluitend betrekking op de populatie, waaruit de steekproef afkomstig is. Een conclusie, gebaseerd op een onderzoek van een steekproef, bestaande uit studenten, behoeft dus niet te gelden voor andere jonge mensen van dezelfde leeftijd. Vele onderzoeken zijn bedoeld om tot min of meer algemeen geldende uitspraken te komen, om algemeen geldende ,,wetmatighedenw op te sporen en vast te leggen. Voert men bv. op dit moment een onderzoek uit naar de werking van twee verschillende soorten filterbedden, A en B, en vindt men dat A ,,beterw is dan B, dan zal men deze uitspraak niet alleen op het heden willen betrekken, maar tevens op de toekomst. Deze extrapolatie in de tijd is echter niet altijd geoorloofd, omdat de mens en zijn omgeving in vele opzichten evolueren. Na langere tijd zal men dus de vraag of de uitspraak nog geldt gewoonlijk slechts door het uitvoeren van een nieuw onderzoek kunnen beantwoorden. Mede om deze reden is op vele gebieden het herhalen van reeds door anderen verrichte onderzoekingen verre van zinloos.
Het is mij niet mogelijk de gedachtengang van de mathematische statistiek hier volledig te behandelen. Er zijn echter in deze gedachtengang twee fasen te onderscheiden. 1. Uitgaande van een populatie, waarvan de verdeling, resp. het type van de verdeling, bekend is, stelt men vast welke variatie optreedt in aselecte steekproeven van rz elementen. Zo'n variatiepatroon kan, gewoonlijk d.m.v. de kansrekening, in de vorm van een kansverdeling worden vastgelegd. Enkele voorbeelden. Beschouw eerst een populatie van N elementen, waarvan er Ni het kenmerk A en Np het kenmerk B dragen (N = Ni Nz). Men definieert dan als de kans op (van) kenmerk A, bij aselecte trekking van één element uit deze populatie, de relatieve frequentie van dit
+
kenmerk: P(A) = P = N I I N ; de kans op kenmerk B is dus: P(B) = Q = N2IN = l-P. Trekt men uit deze populatie aselect een steekproef van n elementen, dan is de kans dat deze x elementen met kenmerk A (dus 11-x elementen met kenmerk B) bevat, indien N 2 5011is, bij benadering gelijk aan
(Hierin is, zoals bekend mag worden verondersteld, n! = 11 faculteit, . . 3 x 2 X 1). De kansverdeling die door de d.w.z. /I! = r i (11-1) (11-2) voorgaande formule wordt gerepresenteerd is de birioi~iiole verdeling. Als tweede voorbeeld nemen wij een populatie van N elementen, die alle een waarde van een grootheid x dragen; de populatieverdeling van deze grootheid is bij benadering normaal (d.i. een verdeling van Gauss-Laplace met gemiddelde en standaardafwijkingen o, (deze en dergelijke kengetallen, betrokken op populaties, worden porclmeters genoemd). De kansverdeling van het gemiddelde X van een aselecte steekvroef van 11 elementen uit deze bezit als eigenschappen dat zij: a. eveneens bij benadering normaal is, b. als gemiddelde ,[c en als standaardafwijking 01 11 heeft.
2. Met behulp van deze kansverdeling kan men, op basis van een aselecte steekproef uit een populatie met het bestudeerde verdelingstype, tot uitspraken komen omtrent de populatie. Naar de aard van deze uitspraken kan men onderscheid maken tussen: a. methoden voor het toetserz van hypothesen omtrent populatieverdelingen; b. methoden voor het geven van schattingen omtrent populatieverdelingen of hun parameters. Op grond van een steekproef kan men niet tot uitspraken omtrent populatieverdelingen of parameters komen, die zonder enige reserve juist zijn. Steeds is er een zeker risico, een zekere kans dat een uitspraak onjuist is. Het voordeel van een op statistiek gefundeerde t.o.v. een intuïtief getrokken concIusie is echter, dat men de kans op de onjuistheid van de conclusie kan kwantificeren, of anders gezegd: dat men de onbetrouwbaarheid van de uitspraak kan aangeven. Ook hier moet ik met het geven van een enkel voorbeeld volstaan. Veronderstel dat een waterleidingbedrijf een groot aantal exemplaren van een bepaald produkt gaat installeren. Het sluit een contract met een bepaalde leverancier voor 100.000 exemplaren, die successievelijk zullen worden afgeleverd. De eerste partij van 100 exemplaren wordt nauwgezet gekeurd en blijkt 3 exemplaren (3%) te bevatten, die niet aan de gestelde eisen voldoen (,,defectenv). Wat kan men concluderen over het percentage defecten in de gehele bestelling, aangenomen dat de afgeleverde partij een aselecte steekproef uit deze ,,populatien vormt?
Langs statistische weg kan men komen tot de uitspraak, dat dit percentage defecten tussen 0,6% en 8,5% ligt; de onbetrouwbaarheid van deze uitspraak (de kans dat zij fout is) is hierbij op 5% gesteld. Deze schatting van het populatiepercentage (de parameter) bezit twee bijzonderheden. In de eerste plaats worden twee grenzen opgegeven, waartussen de parameter wordt geschat (het zg. schattingsinterval). De grootte van dit interval bepaalt de nauwkeurigheid van de schatting: hoe kleiner het is, des te nauwkeuriger de schatting is. Verder bevat de uitspraak een element van onzekerheid: de onbetrouwbaarheid van de uitspraak, de kans dat zij fout is, wordt aangegeven. Bij een gegeven steekproef kan deze onbetrouwbaarheid slechts worden verkleind ten koste van de nauwkeurigheid van de schatting kiest men bv. een onbetrouwbaarheid van 1% , dan worden de grenzen van het schattingsinterval 0,34% en 10,6%. In de praktijk hangt de keuze van de onbetrouwbaarheid, die men acceptabel acht, gewoonlijk af van de ernst van de consequenties, die aan de onjuiste uitspraak zijn verbonden. Door het trekken van een grotere steekproef kan men een schatting verkrijgen, die bij dezeEde onbetrouwbaarheid nauwkeuriger is dan de schatting die een kleine steekproef oplevert. Vindt men bv. bij een steekproef van 500 exemplaren 15 (d.i. 3%) defecten, dan zijn de schattingsintervallen met onbetrouwbaarheid 5% en 1% resp. 1,7-4,9% en 1,4-5,8%.
2. Vormen van onderzoek Voordat ik de rol van de statistiek bij de analyse van waarnemingsuitkomsten nader ga bezien, wil ik eerst even met u kijken naar de belangrijkste vormen van onderzoek. Deze zijn: A. onderzoek: 1. experimenteel, 2. observationeel; B. analyse van bestaande gegevens. In afb. 1 is de gang van zaken bij een onderzoek schematisch weergegeven. Uitgaande van een bepaalde vraagstelling, na definitie van de populatie(s) waarop men het onderzoek wil betrekken en na bestudering van de relevante literatuur (en zo nodig: na uitvoering van een vooronderzoek) maakt men de proefopzet, waarin de gehele gang van zaken bij het onderzoek nauwkeurig wordt aangegeven. Hierbij dient dus te worden vermeld hoe de steekproef, resp. steekproeven, zullen worden getrokken, welke waarnemingen zullen worden verricht (wanneer, langs welke weg, door wie), hoe zij zullen worden vastgelegd en bewerkt, welke onbetrouwbaarheid van de uitspraken men verantwoord acht, enz. Bij het experimentele onderzoek gaat men gewoonlijk
Li--' m Rapporteren
Gb Conclusies
4 llï b Steek r o e v e n
\
Afb. 1 De gang van zaken bij een onderzoek
uit van een steekproef uit de onderzoekpopulatie, waarvan : a. de elementen successievelijk aan verschillende behandelingen worden onderworpen, of b. die wordt gesplitst in groepen, die verschillende behandelingen ondergaan. Bij het observationele onderzoek beperkt men zich tot het verrichten van waarnemingen aan de elementen van steekproeven uit de onderwekpopulaties. Enkele belangrijke vormen van observationeel onderzoek zijn het (éénmalige) transversale en het longitudinale onderzoek, waarbij de in het onderzoek betrokken elementen op verschillende tijdstippen worden geobserveerd. Bij de analyse van bestaande gegevens gaat men uit van waar-. nemingsmateriaal dat reeds ter beschikking staat. Eensdeels is natuurlijk het feit, dat men de waarnemingen zelf niet meer behoeft te verrichten een voordeel, maar hieraan zijn ook belangrijke nadelen verbonden: a. men weet vaak niet precies, uit welke populatie(s) de elementen, waarop de waarnemingen betrekking hebben, afkomstig zijn, resp. of en, zo ja, welke selectie bij het verzamelen van deze elementen heeft plaatsgevonden; b. men weet niet hoe betrouwbaar de waarnemingen zijn (systematische fouten, nauwkeurigheid); c. gewoonlijk vertonen de waarnemingen leemten, die niet meer achteraf zijn te vullen. Dit betekent dat men bij de analyse van bestaande gegevens steeds met grote vakkennis en bijzonder kritisch te werk zal moeten gaan en de uitkomsten van de analyse met min of meer reserve zal moeten beschouwen. Gaarne wil ik dit toelichten.
Plaats
TABEL 6 Totaal aantal onderzochte kinderen -
-
-
Kinderen met cariës* Aantal % -
-
-
-
-
-
A 400 112 28 B 450 126 28 * Uiteraard zal men in werkelijkheid dit gegeven meer gedifferentieerd bestuderen (aantal carieuze elementen per kind).
Leeftijd in jaren
6 7 8 Y Totaal
TABEL 7 A Onderzocht Cariës % 90 80 110 120 400
11 16 29 56 112
12,2 20,O 26,4 46,7 28,O
B Onderzocht Cariës 140 110 100 100 450
21 27 30 48 126
%
15,O 24,s 30,O 48,O 28,O
Voorbeeld l In twee plaatsen, A en B, zijn gegevens verzameld over de gebitten van kinderen van 6 t/m 9 jaar. In plaats A komt van nature fluoride in het drinkwater voor, in plaats B is dit niet het geval. Men komt na bewerking van de gegevens tot de in tabel 6 gegeven uitkomsten. De uitkomst is voldoende verrassend om de onderzoeker, die de bewerking van de gegevens heeft verricht, aan het denken te zetten. Hij realiseert zich, dat een relevante factor in dit verband wordt gevormd door de leeftijd van de kinderen (bij oudere kinderen komt meer cariës voor) en maakt derhalve tabel 7. Deze uitkomst beantwoordt beter aan de verwachting van de onderzoeker: voor elke leeftijdsgroep is immers het percentage kinderen met cariës in plaats B (iets) hoger dan in plaats A. Hij vraagt zich echter af, of er wellicht nog andere verschillen tussen de plaatsen dienen te worden uitgeschakeld en besluit, de kinderen ook onder te verdelen in twee welstandsgroepen, I en I1 (ik laat hier buiten beschouwing hoe dit gebeurt; het is wel duidelijk dat zo'n inleiding zorgvuldig en met kennis van zaken moet plaatsvinden). De onderzoeker verkrijgt daarna tabel 8. De onderzoeker zal zijn oordeel nogmaals moeten herzien: het blijkt nu dat bij welstand I de cariëspercentages in A en B per leeftijd precies gelijk zijn: bij welstand I1 zijn echter deze percentages in B voor elke leeftijd duidelijk hoger dan in A. Het is duidelijk, dat in de praktijk wellicht nog meer relevante factoren aanwezig kunnen zijn, die moeten worden uitgeschakeld (geslacht?). Afgezien van het feit, dat men nooit precies weet
TABEL 8
Leef tijd 6 7 8 9
Totaal
I I1 I 11 Tot. Car. % Tot. Car. % Tot. Car. % Tot. Car. % 50 40 40 40
5 8 8 16
10 20 20 40
170 37
-
40 6 15 40 8 20 70 21 30 80 40 50
70 7 60 12 60 12 60 24
10 20 20 40
70 14 50 15 40 18 40 24
20 30 45 60
-
250 55
-
200 71
-
230 75
TABEL 9 Tijdstip Vijver
Som Gem.
1
2
3
4
5
6
40 10
40 10
40 10
40 10
40 10
40 10
of men al deze factoren te pakken heeft, komt men op deze wijze, zelfs bij een groot uitgangsmateriaal, al spoedig tot zo kleine aantallen in de eindtabellen, dat men wel bijzonder voorzichtig moet worden met het vergelijken van de daaruit berekende percentages.
Voorbeeld 2 Tabel 9 geeft het aantal diatoma in 5 betonnen vijvertjes op 6 opeenvolgende tijdstippen (aantal organismen per 1 water). Men concludeert uit deze uitkomsten dat het gemiddelde aantal diatoma in de tijd geen verandering heeft ondergaan. Deze conclusie houdt echter geen rekening met de ontbrekende uitkomsten (-) en behoeft niet juist te zijn, daar de volledige uitkomsten heel goed kunnen luiden als weergegeven in tabel 10. Dit voorbeeld lijkt triviaal, maar ik kan u verzekeren dat deze fout, bestaande uit het geen rekening houden met ontbrekende uitkomsten, in de praktijk herhaaldelijk wordt gemaakt. Het is mijn bedoeling dadelijk met u het experimentele onderzoek nader onder de loep te nemen. Ik wil daarom volstaan met het maken van enkele opmerkingen omtrent een vorm, waarin een observationeel onderzoek tegenwoordig vaak wordt uitgevoerd: de enquête, waarbij men gegevens verzamelt door schrif-
TABEL 10
Vijver
Som Gem.
Tijdstip 1
2
3
4
5
6
40 8,O
56 11,2
75 15,O
68 13,6
56 11,2
41 8,2
telijke of mondelinge ondervraging van de in het onderzoek betrokken elementen. Iedere vraag, die bij een enquête wordt gesteld, moet zo beknopt mogelijk en vooral duidelijk zijn. U moet niet te snel denken, dat een vraag die voor u en uw medewerkers volkomen duidelijk is, ook voor niet-ingewijden (of minder ontwikkelden) begrijpelijk zal zijn of slechts één interpretatie zal toelaten. Verder moeten de vragen zonder vooringenomendheid worden gesteld en zij mogen de ondervraagde niet een bepaald antwoord suggereren. Voorts verdient het aanbeveling de vragen zo te stellen, dat er slechts een beperkt aantal antwoorden mogelijk is (dat dan tevens wordt vermeld, zodat de ondervraagde slechts zijn antwoord heeft aan te geven). Stelt men immers de vragen zo, dat met een omstandig verhaal erop kan worden geantwoord dan ondervindt men veel moeite bij de rubricering van de antwoorden; deze zal gewoonlijk niet zonder willekeur kunnen plaatsvinden; voorts zullen sommige antwoorden zo vaag of zo uitgebreid zijn, dat men zelden verantwoord een enquête zal kunnen uitvoeren zonder een vooronderzoek, waarin vragen en antwoorden op hun bruikbaarheid worden getoetst. 3. Experimenteel onderzoek door middel van statistische proefopzetten
Bij de klassieke methode van experimenten, die voortkomt uit de fysica, wordt steeds één factor tegelijk gevarieerd; alle ándere bij het experiment betrokken factoren worden constant gehouden. Door Fisher (1) is echter, in de eerste plaats t.b.v. landbouwkundige experimenten, een wijze van experimenteren aangegeven waarbij men in principe werkt met alle mogelijke combinaties van een aantal bewust gekozen niveaus van de onderzoekfactoren. Langs deze weg komt men tot meer gecompliceerde, maar bij-
TABEL 11 Een 22 factorïele proef met 3 replicaties: procentuele opbrengst bij de niîrering van aniline A. Toevoeging van HNO3 2 uur
4 uur
% uur
87,2 87,9 87,4
88,4 88,l 87,s
2 uur
83,9 84,7 84,3
85,l 85,3 86,l
B. Roertijd
Gemiddelden
A
B Totaal
1%
uur 2 uur
2 uur
4 uur
Totaal
873 84,3
88,l 85,5
87,s 84,9
85,9
86,s
86,35
zonder efficiënte proefopzetten, waarbij een voiledige symbiose tussen proefopzet en statistiek optreedt. De situatie waarin men zich, eerst nadat de proef was verricht, ging afvragen, op welke wijze de verkregen waarnemingen het best konden worden geanalyseerd, is daarbij geheel in het tegendeel overgegaan, daar het experiment wordt gebaseerd op een ,,statistischew proefopzet, een zg. factorieel proefschema. Ik kan hier met u slechts enkele eenvoudige factoriële proefschema's bekijken. Het eerste daarvan behoort tot het type der 2~ factorïele schema's, d.w.z. de schema's met p factoren, ieder met 2 niveaus. Het betreft een onderzoek naar de opbrengst van een nitre~gsproces,nl. het nitreren van aniline (waarvan het eindresultaat het grondmateriaal vormt van een uitgebreid gebied van kleurstoffen en medicamenten). Veronderstel dat men bij dit onderzoek twee factoren wil variëren, nl.: a. de duur van het toevoegen van salpeterzuur: 2 uur of 4 uur; b. de roertijd: 1 uur of 2 uur. Er zijn dus twee factoren, ieder met twee niveaus, zodat een 22 factorieel schema wordt gebruikt. Wij veronderstellen verder dat de proef bij ieder van de vier combinaties 3 X wordt uitgevoerd; dergelijke herhalingen worden replicaties genoemd. De uitkomsten zijn in tabel 11 gegeven (opbrengsten in %). Bestudeert men de waargenomen gemiddelde opbrengsten, dan blijkt het volgende:
TABEL 12 Gemiddelden bij een 22 factorïèle proef (met 3 replicaties) met een duidelijke interactie
B
j % uur )
2 uur
Totaal
2 uur
4 uur
Totaal
87,5 89,9
88,l 84,3
87,8 87.1
88,7
86,2
87,45
-
TABEL 13 Uitkomsten van de variante-analyse, toegepast op de gegevens in tabel 11 Variatiebron
Vrijheids- Kwadratengraden ( v ) som
Factor A Factor B Interactie A X B
1 1 1
2,43 25,23 0,17
Residueel
8
1,42
11
29,25
Totaal
F (1;8) = 2,4310,1775 = 13/59 F (1;8) = 25,2310,1775 = 142,14 F(1;8) = 0,1710,1775 = 0,96
s :es
=
1,4218 = 0,1775
Kritieke waarden van F (1;8): 5%: 5.32, 1%: 7,57, 0.5%: 14.7.
1. bij toevoeging van HNO, gedurende 4 uur is de opbrengst 0,9% hoger dan bij toevoeging in 2 uur; 2. bij een roertijd van V2 uur is de opbrengst 2,9% hoger dan bij een roertijd van 2 uur. 3. er is geen interactie (wisselwerking) tussen de twee factoren. De verschillen tussen de gemiddelden van B bij beide niveaus van A, 88,l-87,5 = 0,6 en 85,5-84,3 = 1,2 of: die tussen de gemiddelden van A bij beide niveaus van B, 87,5-84,3 = 3,2 en 88,l-85,5 = 2,6 ontlopen elkaar slechts weinig. Ter verduidelijking geeft tabel 12 uitkomsten, waarbij wel interactie tussen de factoren A en B optreedt. Zo is (bv.) het verschil tussen de lange en de korte roertijd bij A-2 uur gelijk aan +2,4 maar bij A-4 uur gelijk aan -3,8. Bij kleine aantallen waarnemingen zal men gewoonlijk nog moeten onderzoeken, of de geconstateerde verschillen wellicht door toevallige variatie kunnen worden verklaard. Men toetst dan de zg. nulhypothese, dat bepaalde waargenomen verschillen op toeval berusten, met als alternatieve hypothese dat zij een afspiegeling zijn van reële verschillen. Dit statistische onderzoek kan geschieden door middel van de techniek van de variantieanalyse. Hoewel een bespreking van deze techniek buiten het kader van deze inleiding valt, geef ik in tabel 13 volledigheidshalve de uitkomsten van de analyse. Deze wijzen uit, dat men bij toet-
TABEL 14 Uitkomsten van een 23 factoriële proef .A. Toevoeging van HNO3 2 uur
4 uur C. Restant
afwezig 87,2 *.2 uur 87,9 87,4
B. Roertijd
2 uur Gemiddelden
I
aanwezig 87,l 88,O 87,7
afwezig 88,4 88,l 87,8
aanwezig 87,7 87,9 87,s
S3,9 84,7 84,3
87,5 86,8 87,3
85,l 86,l 85.3
87,9 88,4 88.6
87,s 84,3
87,6 87,2
88,l 85,s
87,7 88,3
sing met een onbetrouwbaarheidsdrempel van 0,01 (l%),d.w.z. als men bereid is een risico van ten hoogste 1% te accepteren op het ten onrechte verwerpen van de nulhypothese (= het ten onrechte concluderen tot een ,,effect"), de volgende conclusies kan trekken. 1. Toevoeging van salpeterzuur gedurende 4 uur levert een hogere opbrengst op dan toevoeging gedurende 2 uur. 2. Een roertijd van Y2 uur levert een hogere opbrengst op dan een roertijd van 2 uur. 3. Er is geen interactie tussen de twee factoren. Het belangrijke van deze statistische conclusies, vergeleken met de uitspraken die wij reeds eerder, op grond van bestudering van de gemiddelden in tabel 11 deden, is, dat ook het betrekkelijk kleine ad 1 genoemde verschil ,,significant" is bij de gebruikte 1% drempel, d.w.z. als reëel kan worden beschouwd. Verder zien wij dat de praktische conclusie luidt, dat men het best kan werken met een roertijd van ?huur en een toevoeging van salpeter in 4 uur. Men kan overigens ook een intervalschatting geven van het verschil tussen de opbrengsten bij de lange en korte duur van HNO3-toevoeging (bij een roertijd van ?huur). Op grond van het waargenomen verschil, 0,9%, kan men bv. met een onbetrouwbaarheid van 5% beweren, dat het werkelijke verschil ligt tussen 0,6% en 1,1%.Hierbij kan echter worden opgemerkt, dat een toevoeging in 2 uur slechts een iets ongunstiger opbrengts zal geven; de mogelijkheid bestaat dat de kortere duur van de toevoeging, ondanks het geringe verlies aan opbrengst, voordeliger zal zijn dan de langere. In tabel 14 staan de (gefingeerde) uitkomsten van een facto-
TABEL 15 Uitkomsten van een onderzoek naar de bezinkingssnelheid van rivierslib Bezinkingsduur in uren Slibgehalte
Totaal Gemiddelden
3
6
12
24
Totaal
486
495
525
528
2034
75
77
82
84
79,s
87
88
93
92
90,O
riële proef met 3 replicaties. Het betreft hier de eerder besproken proef, uitgebreid met de factor ,,restantm, eveneens met twee niveaus, t.w. ,,restant afwezig" en ,,restant aanwezig". Het restant is de rest van een voorgaande charge, die is achtergebleven in de pan waarin het procédé plaatsvindt. Bij ,,restant afwezig" is de pan zorgvuldig gereinigd. Door deze factor in te voeren wil men onderzoeken, in hoeverre een grondige schoonmaak van de pannen nodig is voor het verkrijgen van een hogere opbrengst.
Bestudeert men de waargenomen gemiddelden, dan blijkt dat een duidelijke interactie optreedt tussen de factoren B en C: bij een roertijd van % uur is de opbrengst bij ,,restant afwezig", onafhankelijk van de toevoegingsduur van salpeterzuur, duidelijk hoger dan bij de roertijd van 2 uur. Dit verschil verdwijnt bij ,,restant aanwezig". De praktische conclusie is dus, dat men: a. kan volstaan met de toevoeging van salpeterzuur in 2 uur, b. een roertijd van !h uur kan toepassen en c. de pannen niet grondig behoeft schoon te maken. Een volgend voorbeeld betreft een onderzoek naar de bezinkingssnelheid van rivierslib. Men neemt 12 watermonsters met een slibgehalte van ca. 25 mg11 en 12 watermonsters met een slibgehalte van ca. 75 mgll. Bij elk slibgehalte bepaalt men het percentage slib dat gezonken is in drie monsters en wel na 3, 6, 12 en 24 uur. De eerste factor is hier het slibgehalte met twee niveaus, de tweede de bezinkingsduur met vier niveaus, zodat men een 2 X 4 factorieel schema verkrijgt. De uitkomsten van zo'n onderzoek zijn in tabel 15 opgenomen. Een uitvoerige analyse is feitelijk niet noodzakelijk. Men ziet direct, dat geen interactie optreedt. Bij elke bezinkingsduur is het gemiddelde percentage bezonken slib bij het hoge slibgehalte ca. 10% hoger dan bij het
TABEL l 6 Latijns vierkant voor het uitvoeren van een makpmef met 4 proefpersonen en 4 soorten water (A. B, C en D) -
Proefopzet Personen
1 2 3 4
Uitkomsten
Tijdstippen
1
2
3
Personen
4
Tijdstippen
1
A
B
D
C
1
D B
C A D
A C B
B D A
2 3 4 Totaal
3
Totaal
4
6,2 5,8 6,O 5,7 23,7 4,3 7,6 8,8 8,7 29,4 4,7 6,2 5,5 5,3 21,7 5,2 4,8 8,l 9,l 27,2 20,4 24,4 28,4 28,8 102,O A
Totaal
2
B
C
D
30,3 27,3 24,O 20,4 102,O
lage. De gemiddelde percentages bezonken slib verschillen bij 3 en 6 uur slechts weinig; evenzo bij 12 en 24 uur. De twee laatstgenoemde percentages liggen gemiddeld echter duidelijk hoger dan de beide eerstgenoemde. Het laatste voorbeeld betreft het gebruik van een zg. Lntiijns vierkant. Hierbij brengt men feitelijk in een schema met twee factoren, elk met k niveaus, een derde factor met k niveaus onder. Het kan worden gebruikt als men weet, dat tussen de factoren geen interacties optreden. Beschouw een onderzoek, waarbij men de smaak van vier soorten water, A, B, C en D, wil Iaten beoordelen door vier proefpersonen. Deze ,,scoren" de smaak door het zetten van een streepje op een schaalverdeling van O t/m 10. Zou men nu alle personen de vier soorten water in dezelfde volgorde toedienen, dan bestaat het gevaar dat een ,,volgorde-effect" de vergelijking tussen de watersoorten beïnvloedt. Men ltan daarom het proefje beter uitvoeren op de wijze, die in tabel 16 is aangegeven. Men ziet dat de ,,Latijnsew letters, die overeenkomen met de vier soorten water, zó over het ,,vierkant9' zijn verdeeld, dat elke soort water éénmaal per proefpersoon en per tijdstip voorkomt. Op deze wijze bereikt men, dat een bepaalde combinatie van de drie factoren (personen/soorten water/tijdstippen) precies één keer voorkomt. De (ge£ingeerde) uitkomsten van de proef staan eveneens in tabel 16. Men ziet, dat er duidelijke verschillen tussen de gemiddelde scores (= totalen gedeeld door vier) van de proefpersonen zijn. Ook ziet men dat inderdaad een ,,verloopw van de gemiddelde scores in de tijd optreedt; deze stijgen duidelijk van tijdstip 1 tot tijdstip 3. Er blijken echter tevens duidelijke verschiien tussen de gemiddelden van de vier soorten water aan-
TABEL 17
wezig te zijn, zodat men kan concluderen dat soort A het best en soort D het slechtst wordt geacht. Het behoeft nauwelijks betoog dat deze conclusie, die ook door de statistische analyse wordt ondersteund, uitsluitend geldt voor de populatie waaruit de vier proefpersonen afkomstig zijn en onder de veronderstelling, dat zij daaruit een aselecte steekproef vormen. Uit het voorbeeld is ook te berekenen welke uitkomst de proef zou hebben opgeleverd als de proefpersonen het water in de volgorde A-B-C-D zouden hebben geproefd. De totalen worden dan als in tabel 17 gegeven. Doordat de verschillen tussen de soorten water en het verloop in de tijd ,,verstrengeld" zijn, zou men ten onrechte concluderen dat de appreciatie voor A, B en C weinig verschilt en dat slechts D ongunstiger wordt beoordeeld. Het is duidelijk dat men zich bij het opzetten van een factoriële proef een helder beeld moet vormen van het probleem waarom het gaat. Nadat men de te bestuderen factoren en hun niveaus heeft opgesomd, zal men gewoonlijk daaruit een keuze moeten doen. In de industrie, waar men snel kan experimenteren en ook snel een oordeel wenst, zal men zelden meer dan drie factoren tegelijk behoeven te variëren; bij andere toepassingsgebieden, zoals het landbouwkundige, zijn uitgebreide en gecompliceerde proefopzetten op hun plaats, omdat de experimenten bv. groeiprocessen betreffen, die slechts langzaam verlopen. De statistische analyse, d.m.v. de variantie-analyse verschaft de mogelijkheid het waarnemingsmateriaal in zijn geheel te overzien en vast te stellen of bepaalde effecten al dan niet als toevallig kunnen worden beschouwd. Bij de eenvoudiger proefopzetten kan men echter, zoals uit de gegeven voorbeelden blijkt, de belangrijkste ,,effectenn meestal direct vinden. Men behoeft zich dus in de praktijk niet te laten afschrikken door het feit dat men de statistische techniek niet of niet voldoende beheerst: een ervaren experimentator kan, bij een goede proefopzet, de belangrijkste conclusies in de regel wel zelf, en zonder toepassing van deze techniek, trekken. Het is dan een kleine moeite deze door een statisticus te laten verifiëren. De statistiek heeft echter, omdat zij de weg heeft gewezen voor het efficïent uitvoeren van onderzoekingen bij problemen, waarbij vele factoren en een belangrijke
r
toetallige variatie in het spel zijn, een grote omwenteling in de wetenschap van het experimenteren teweeggebracht (zie ook Hamaker (2)(3)(4)).
m,
I 4. Statistiek als bewijsmiddel
Y
b
-
,
P I
A
=-,=
-m
m
b.
- a-,
I I
u
m -
Onder een statistisch ,,bewijsH verstaat men het leveren van een uitspraak, waarvan de onbetrouwbaarheid, d.i. het risico dat zij " onjuist is, exact of met zeer goede benadering bekend is (de term I ,,bewijs" is hier bewust tussen aanhalingstekens geplaatst omdat 'dit bewijs van een geheel andere aard is dan het mathematisch Y - bewijs, dat gewoonlijk als het prototype van ,,hetyybewijs wordt beschouwd). Om tot een statistisch bewijs te komen moet bij de opzet en uitvoering aan de volgende voorwaarden worden voldaan (ik volsta met een opsomming van de belangrijkste punten). -
E
a. Het doel van het onderzoek dient van te voren duidelijk te worden geformuleerd en tijdens het onderzoek niet te worden veranderd. b. De proefopzet moet van te voren nauwkeurig worden vastgelegd en hiervan moet tijdens het onderzoek niet worden afgeweken. De te onderzoeken populatie(s) dienen nauwkeurig te worden omschreven en het steekproeftrekken dient plaats te vinden op een wijze, die als aselect kan worden beschouwd. c. Men dient zich van tevoren rekenschap te geven van de wijze waarop de statistische analyse zal plaatsvinden en bij voorkeur de proefopzet te richten. Hierbij dient te worden aangetekend dat bij de toepassing van bepaalde statistische methoden, waartoe de variantie-analyse behoort, de grootheden die men bestudeert, bij benadering normaal moeten zijn verdeeld. Weet of bemerkt men, dat aan deze voorwaarde niet is voldaan, dan moet men nagaan of deze normaliteit door het toepassen van een transformatie (bv. door het nemen van logaritmen, wortels of reciproken) wordt verkregen, of een zg. verdelingsvrije methode toepassen (d.i. een methode die vrij is van de normaliteitsonderstelling). d. In principe dienen slechts conclusies te worden getrokken omtrent de in de doelstelling geformuleerde vragen. e. Men dient van tevoren vast te stellen welke onbetrouwbaarheid van de conclusie toelaatbaar wordt geacht. De grootte van deze onbetrouwbaarheid is afhankelijk van de aard en ernst van de consequenties, die aan het trekken van onjuiste conclusies is verbonden.
Uit het voorgaande blijkt in de eerste plaats, dat een onderzoeker in feite enige kennis van de statistiek (en in ieder geval van de statistische gedachtengang) moet bezitten, indien hij tot een goede proefopzet wil komen. Bezit hij deze kennis niet, dan verdient het aanbeveling reeds bij het maken van de proefopzet een statisticus te raadplegen. Want, zoals Johnson (6) opmerkt: ,,The common procedure of consulting a statistician or statistical principles after an experiment of investigation has been completed is equivalent to holding a post-mortem analysis. Perhaps the only interpretation of the data that can be made is to state from what the experiment died". Vervolgens moge hier worden opgemerkt, dat het bij het opstellen van een goede proefopzet, rekening houdend met de kennis die reeds beschikbaar is, vaak mogelijk is ongeveer aan te geven welke omvang het onderzoek dient te hebben, om tot verantwoorde beslissingen, bv. omtrent het al of niet juist zijn van gestelde hypothesen, te komen. Op deze wijze kan worden voorkomen dat een onderzoek onnodig groot (en dus te kostbaar) of onverantwoord klein wordt opgezet. Tevens kan men zich dan afvragen of wellicht een zg. sequente proef mogelijk is; hierbij wordt de omvang niet .van tevoren vastgelegd, maar wordt het onderzoek stopgezet zodra een verantwoorde beslissing mogelijk is. Voor een inleiding omtrent deze moderne onderzoekmethode raadplege men Rümke (8). Als niet aan de vorengenoemde voorwaarden is voldaan, kan men natuurlijk wel tot allerlei uitspraken komen, zodat het ondexzoek gelukkig niet alle waarde verliest, maar het verliest dan wel de kracht van ,,bewijs". Wat overblijft kenschetst Hemelrijk (5), die aan dit onderwerp een uitgebreidere beschouwing wijdt, als ,,statistische detectie". De onbetrouwbaarheid van een uitspraak staat dan niet precies meer vast en deze kan zowel veel kleiner als veel groter zijn dan de waarde, die men verkrijgt. Gaat men waamemingsmateriaal onderzoeken op eigenaardigheden, dan kunnen deze ons op het spoor van niet-vermoede effecten brengen. Men dient echter rekening te houden met de mogelijkheid dat deze eigenaardigheden door toeval of door selectie zijn ontstaan, en men zal pas door een volgend, gericht onderzoek de juistheid (of onjuistheid!) van deze effecten kunnen verifiëren. Hemelrijk ( 5 ) merkt dan ook verder op: ,,Aan het onderscheid tussen detectie en bewijs wordt bij statistische onderzoekingen en publikaties te weinig aandacht besteed. Het is voor de beoordeling van de overtuigingskracht van een statistische conclusie van groot belang, te weten of de vraag van tevoren was gesteld, óf tijdens de analyse, en naar aanleiding van
het waarnemingsmateriaal naar voren is gekomen. Het verdient daarom aanbeveling dit te vermelden. ."
.
Naar ik hoop ben ik erin geslaagd een indruk te geven van het terrein dat de statistiek bestrijkt en van de rol die zij, als hulpwetenschap, bij onderzoekingen kan spelen. Hierbij is naar voren gekomen dat, gezien de betrekkelijk kleine omvang die vele onderzoekingen noodgedwongen hebben, tegenwoordig vooral de mathematische statistiek van groot belang is. Dit onderdeel van de statistiek stelt ons in staat om, tot generalisatie te komen, d.w.z. uit waarnemingen verricht aan steekproeven te komen tot uitspraken omtrent de populaties, waaruit deze steekproeven stammen. Men dient echter steeds te bedenken dat de statistiek haar functie slechts 'bij een goede proefopzet optimaal kan vervulien. Men kan fundamentele tekortkomingen in de wijze waarop een onderzoek is opgezet enlof uitgevoerd niet opheffen door het gebruik van min of meer gecompliceerde statistische methoden - wel kan men ze soms ermee verdoezelen. De statistiek kan een waardevolle tovenaarsleerlinge zijn, maar een tovenares is zij niet! Literatuur 1. R. A. Fisher - Tlie desigii of e.uperiineiits. Oliver and Boyd, Edinburgh (1935). 2. H. C. Hamaker - Statist. Neerl. 9(1955)7. 3. H. C. Hamaker - Statist. Neerl. 9(1955)209. 4. H . C. Hamaker - Statist. Neerl. 12(1958)119. 5. J. Hemelrijk - Statist. Neerl. 12(1958)111. G. P. O. Johnson - Statistical nletliods in research. Prentice-Hall Inc., New York (1950). 7. H. de Jonge - Iiileidiiig tot de ri~ediscliestatistiek, dl I , 2e dr. Ned. Inst. v. Praev. Geneesk., Leiden (1963). 8. C. L. Rumke - Statist. Neerl. 15(1961)47. 9. G. U. Yule en M. G. Kendall - Ai1 introduction to the tlieory o f statistics, 13e dr. Ch. Griffin and Comp., Londen (1946). Aanbevolen inleidingen a.
PROEFOPZET
W. I. B. Beveridge - Tlie art o f scieiitific irii>estigation.W . Heinemann Ltd., Londen (1951). - Design for decisioii. The McMillan Comp., New York (1953). D. J. Finney - Experirneiihl desigrr arrd its sfatistical basis. Carnbridge University Press, Londen (1955).
I. D. J. Bross
b.
STATISTIEK
D. Huff - H o ~ vto lie 111ithstatistics. Norton and Comp., New York (1954). (Ned. vert.: Gebruik en misbrz~ikvan de statistiek (Prisma 572)). Het Spectrum, Utrecht (vnl. betr. beschrijvende statistiek).
M. J. Moroney - Facts froin figures (Pelican Book). Penguin Books Ltd., Londen (1953). M. L. Wijvekate - Verklareilde statistiek (Aula-reeks 39). Aula Boeken, UtrechtIAntwerpen (1960).
Waarschiinliikheidsberekening in techniek
door prof. dr. ir. J . W . Cohen
1. Opbouw van de waarschijnlijkheidsrekening De mens beschouwt reeds sinds onheuglijke tijden de natuur. Waarneming van de natuur en vraagstelling aan de natuur en wel d.m.v. het uitvoeren van experimenten hebben geleid tot de formulering van natuurwetten. Een natuurwet wordt geformuleerd als een relatie, en de essentie ervan is de beschrijving van een causaal verband tussen oorzaak en gevolg. Anders geformuleerd: ,,eenzelfde experiment steeds onder dezelfde condities uitgevoerd levert steeds dezelfde uitkomst". Zo zal bv. water, verhit tot 100 OC, bij 1 atm druk verdampen. Natuurwetten drukken een fysische noodzakelijkheid uit. Van een geheel andere aard is de logische noodzakelijkheid, die zich bv. uit in de formulering van een wiskundige wet. In de Euclidische meetkunde volgt door logische deductie uit de axioma's: ,,twee congruente driehoeken hebben dezelfde oppervlakte". Werpt men met een dobbelsteen dan is het moeilijk de samenhang te formuleren tussen het geworpen aantal ogen en de wijze waarop de dobbelsteen wordt geworpen en tot rust komt. Alhoewel men het standpunt kan verdedigen dat een dergelijk experiment deterministisch kan worden beschreven, zal een dergelijke beschrijving uitermate gecompliceerd worden. Analoog is het gesteld met het trekken van een kaart uit een goed geschud spel kaarten. Ook hier is het moeilijk te voorspellen, welke kaart wordt getrokken. Een groot aantal factoren beheerst dit. Gelijksoortige moeilijkheden treden op als men de hoeveelheid drinkwater wenst te voorspellen die op 17 januari tussen 11 en 12 uur 's ochtends in het gebouw voor Weg- en Waterbouwkunde wordt verbruikt. Hoe kunnen dergelijke experimenten worden bestudeerd en beschreven? Hoe kunnen wij geraken tot uitspraken omtrent experimenten waarbij geen directe en eenvoudig te formuleren causale relatie bestaat tussen oorzaak en gevolg? Een merkwaardig verschijnsel, optredend bij dergelijke experimenten, is hetgeen bekend staat als de experimentele wet van de grote aantallen. Deze wet manifesteert zich zeer duidelijk bij het
herhaald werpen met een dobbelsteen. Zij n het aantal worpen en m, het aantal malen dat hierbij een vier is geworpen. Het blijkt m, nu dat het frequentiequotient -voor toenemende n steeds minn der zal fluctueren. Wordt met een zuivere dobbelsteen geworpen dan zal voor toenemende waarden van n het frequentiequotiënt steeds minder van 1/6 afwijken. Het is zeker niet zo dat
m" -
n bij aangroeiende n regelmatig minder van 1/6 zal gaan verschilm,, n n = 1/6), inlen (mathematisch geformuleerd dat +
tegendeel, het zal voorkomen, en blijven voorkomen, dat gedurende opeenvolgende worpen soms in het geheel geen vier, soms steeds een vier, wordt geworpen. Op den duur worden de afmn wijkingen van - t.o.v. 1/6 echter bijzonder klein. n Het is te verwachten dat men zich de vraag stelt of het mogelijk is voor deze niet-deterministische experimenten een algemeen model te beschrijven en te formaliseren, zodanig dat wij toch een zekere uitspraak, een voorspelling kunnen doen al is het dan niet met een zo volledige betrouwbaarheid als voor experimenten met een strikt causaal verband tussen oorzaak en gevolg. In het bijzonder: is het mogelijk een theorie te ontwerpen, gebaseerd op eenvoudige uitgangspunten, die voert tot een afleiding van een theorema dat een gemodelleerde vorm van de experimentele wet van de grote aantallen beschrijft? Bovenstaande vragen kunnen inderdaad bevestigend worden beantwoord. De tak van wetenschap, die zich hiermee bemoeit, draagt de naam van ,,Waarschijnlijkheidsrekening". De principes van de opbouw van de waarschijnlijkheidsrekening d e n wij hier globaal beschrijven. Centraal staat het verschijnsel van een experiment dat meer dan één mogelijke uitkomst kan hebben. Het experiment, gevormd door het werpen van een dobbelsteen, heeft bv. als uitkomsten: het aantal geworpen ogen. Dit aantal kan zijn 1 of 2 o f . . . of 6. Algemeen, zij de verzameling van alle mogelijke uitkomten {E,, E,, . . ., E,); dus voor een dobbelsteen is M = 6 en Ei is de uitkomst: ,,aantal geworpen ogen is i". Met behulp van deze ,,uitkomsten" k u ~ e nwij ,,gebeurtenissen" vormen. Wij kunnen bv. vragen: zal bij uitvoering van het experiment de gebeurtenis ,,E, of E," optreden? Een gebeurtenis duiden wij ook met een letter aan, zo
en
H = Es of Eq of Es. In het geval van de dobbelsteen stelt H voor: de gebeurtenis ,,de worp is even". Met behulp van gebeurtenissen kunnen nieuwe gebeurtenissen worden gevormd, bv.:
"G en H" en "G of H". Kennelijk treedt de gebeurtenis "Ei of E2 o f . . . of EII" bij iedere uitvoering van het experiment op. Vandaar dat deze gebeurtenis wordt aangeduid met de naam ,,zekere gebeurtenis"; als notatie gebruikt men hiervoor de letter Q, dus Q = El of Ez o f .
. . of Elf.
.
Zij nu gegeven een experiment met uitkomsten E,, E,, . . , E,; de verzameling van alle mogelijke gebeurtenissen voor dit experiment zij (G,, G,, . . . ). (Een uitkomst is natuurlijk ook een gebeurtenis). Aan iedere gebeurtenis G voegen wij nu een getal toe, Pr {G) aangeduid met de 'kans op het optreden van G, en wel zodanig dat aan de volgende axioma's wordt voldaan: axioma 1 O S Pr {G) Pr {Q) = i axioma 2 Pr (G1 of Gr) = Pr {Gi) $ Pr {Gz) axioma 3 indien G, en G, niet tegelijkertijd kunnen optreden. (Bij het werpen met een dobbelsteen kunnen de gebeurtenis: ,,de worp is even" en de gebeurtenis: ,,de worp is een één of een drie" niet tegelijkertijd optreden). Men bewijst nu eenvoudig dat voor iedere gebeurtenis G geldt dat Pr {G) 5 1 is, en dat als Pr {E,) bekend is voor alle i = 1, . ., M, dat dan Pr {G) voor iedere G m.b.v. de axioma's kan worden berekend. Nemen wij als voorbeeld weer de dobbelsteen. Hier is M = 6. Veronderstellen wij dat de dobbelsteen zuiver is, dan kiezen wij louter en alleen op grond van plausibiliteitsovenvegingen
.
Pr (El)
= Pr
{EZ)= Pr (Es)
= Pr
{E4) = Pr (Es) = Pr {Es).
Daar de gebeurtenissen
"El" en "EZ of E3 o f . . . of E6" niet tegelijkertijd kunnen optreden volgt uit axioma 3
+
Pr {"Ei" of "EZ of E3 o f . . . of Es") = Pr {EI) Pr {EZof E3 o f . . . of Es). Analoog Pr {EZ o f . . . of Es) = Pr {EZ) 4- Pr {Es of E4 o f . . . of Es). Zo doorgaande, en gebruik makend van axioma 2
+
+
1 = Pr {Ei o f . . . of Es) = Pr {Ei) Pr {EB) . . . dus Pr {EI) = 116 voor i = 1,2, . . . , 6. Zij H de gebeurtenis ,,de worp is even", zodat
H
= "EZ of
+ Pr {Es),
E4 of Esff,
dan Pr {H)
= =
+
Pr {EZ of Eq of Eg) = Pr {Es) Pr {E4 of Es) Pr {EZ) Pr {E41 Pr (Es) = 3. 116 = t.
+
+
=
Beschouwen wij nu het experiment: n maal werpen met een zuivere dobbelsteen, en wel zal een enkele worp een succes zijn, aangeduid met S, als er vier ogen geworpen zijn; anders wordt de worp een mislukking genoemd, aan te duiden met een M. De uitkomsten van dit experiment zijn dus alle mogelijke opeenvolgingen van M'en en S'en, in totaal n maal. Bv.: M S S M S S S M M ...M M l e 2e (n-1). ne In totaal zijn er 2" verschillende uitkomsten. Aan ieder van deze uitkomsten waarin juist k maal een S voorkomt voegen wij toe l k 5 de kansjq) n-k ,k 0, 1, . . ., n. Deze toevoeging is zeer
-
plausibel. Aan iedere uitkomst kennen wij nu een getal toe. Dit getal zij aangeduid door m,,en stelt voor het aantal successen in een serie van n worpen. De gebeurtenis: ,,m,, = 8" ( n 2 8) wordt dus gevormd door al die uitkomsten, al die reeksenvan n worpen, waarbij er juist 8 maal een vier geworpen is. Aan verschillende uitkomsten wordt dus hetzelfde getal m, toegevoegd. In totaal zijn er
("1 k
verschillende uitkomsten waarbij juist k maal een
vier geworpen is. Eenvoudig is uit de axioma's te verifiëren dat 1 k 5 n-k Pr {mn = k ) = (X) (X) ,kF~,1,...,n. Een grootheid m, als boven gedefinieerd noemt men een stochas-
(k)
fische variabele. Een stochastische variabele is dus een variabele die met een bepaalde kans een zekere waarde aanneemt. Het is niet eenvoudig in het #kader van deze voordracht een exacte definitie van het begrip ,,stochastische variabele" te geven. Voor het zojuist beschreven experiment is n een willekeurig positief geheel getal. Wij kunnen n laten toenemen. Nu zal voor een willekeurig getal E , de kans
voorstellen de kans dat het frequentiequotiënt, dit is de verhouding van het aantal geslaagde proeven en het totaal aantal proeven, meer dan een bedrag E afwijkt van 1/6. Men kan nu aantonen dat geldt
M.a.w.: de kans dat het frequentiequotiënt meer dan een bedrag E van 1/6 afwijkt nadert voor iedere e O naar nul als n -. m. Deze eigenschap staat bekend als de zwakke wet van de grote aantallen voor het herhaald experiment. Deze wet is het theoretisch pendant van de experimentele wet van de grote aantallen. De aandacht zij erop gevestigd hoe de invoering van het begrip kans een theoretische formulering van het verschijnsel beschreven door de experimentele wet van de grote aantallen mogelijk maakt.
>
2. Stochastische variabelen en verdelingsfuncties Het begrip ,,stochastische variabele" is in de waarschijnlijkheidsrekening een fundamenteel begrip. Zoals reeds vermeld is het in het kader van deze voordracht niet mogelijk het begrip volledig te behandelen. Wij zuilen dan ook d.m.v. een aantal voorbeelden trachten de ,betekenis van het begrip toe te lichten en de praktische interpretatie ervan te schetsen. In de vorige paragraaf hebben wij reeds een stochastische variabele leren kennen, namelijk m,,het aantal geslaagde proeven in een serie van n herhaalde proefnemingen. Deze stochastische variabele is echter van een zeer bepaald type, daar m, slechts de gehele waarden 0, 1, . ., n kan aannemen. Wij zullen nu een aantal algemene voorbeelden behandelen. Beschouwen wij eens het gebruik van eenzelfde 'haan door een huisvrouw. Deze kraan wordt herhaaldelijk gebruikt; de ene keer is de kraan kort open, een andere keer lang. Zij nu R(t) de
.
t0
t1
Afb. 1
-
t
relatieve frequentie van het aantal malen dat deze kraan korter dan een tijd t openstaat. Om R(t) te bepalen wordt als volgt tewerk gegaan. Voor een groot aantal malen dat de kraan is gebruikt, zeg N maal, bepalen wij steeds de openingsduur; dan is R(t) het quotiënt van het aantal malen dat de kraan korter dan t heeft opengestaan en het getal N. Tekent men R(t) als functie van t dan ontstaat een grafiek van de gedaante als aangegeven in afb. 1, indien N zeer groot wordt gekozen. Blijkbaar is de kraan nooit korter open geweest dan t, en nooit langer dan t,. De openingstijd van de kraan is blijkbaar te beschouwen als de uitkomst van een experiment, en wel van een experiment met meer dan één mogelijke uitkomst. Het ligt derhalve voor de hand ook hier weer de hulp van de waarschijnlijkheidsrekening in te roepen voor de mathematische beschrijving van een model voor de openingsduur van de (kraan.Eén en ander geschiedt als volgt. Algemeen duiden wij met de stochastische variabele z aan de tijd dat een kraan ononderbroken wordt gebruikt. Zij nu F(t) = P r {z < t}, O < t oo. Kennelijk is de functie F(t) niet-dalend voor toenemende t. Kiezen wij F(t,) = l en F(t,,) = 0, dan betekent dit dat de kans, dat de kraan korter dan t, openstaat, gelijk is aan één, en dat de kans, dat de kraan korter dan een tijd t, openstaat, gelijk nul is. De functie F(t) is de wiskundige modellering van de functie R(t), die het relatieve frequentiequotient voorstelt. Deze functie F(t) heet de verdelingsfunctie van de stochastische variabele z. Uit bovenstaande beschouwingen zal het duidelijk zijn dat R(t+At)-R(t) de relatieve £requentie van de openingsduren zal voorstellen die kleiner dan t+At en groter dan t zijn. Evenzo stelt F(t At)-F(t) = P r {t 5 z < t At} de kans voor dat de openingsduur z tenminste gelijk is aan t en minder dan t+At bedraagt. Veronderstellen wij dat F(t) voor alle waarden van t een differentieerbare functie is van t dan geldt d F(t At) - F(t) = -- F(t) At .. . dt
+
+
+
+
Het d i ~ e r e n t i a a l ~ u o t i ë o F(t) t d heet de kansdiditheid van de dt stochastische variabele z. Daar m
*
dR(t) dt), tn = kdt,
k=O
k = O , l , . . .. , een maat is voor de gemiddelde openingsduur van de gemeten tijden voor de kraan, zal analoog def
"
de betekenis hebben van een gemiddelde waarde. Men noemt E {z) als boven gedefinieerd de mathematische veïwachting van de stochastische variabele z. In het algemeen zal ook bij het openen van een kraan de doorstromingsopening variëren. Men opent immers in het algemeen een {kraan wijder voor het laten vollopen van een emmer dan voor een glas. Ook dit proces is weer te beschrijven m.b.v. een stochastische variabele. Zij d de stochastische variabele die de diameter van de doorstromingsopening van een geopende kraan voorstelt. Zij G(d) de verdelingsfunctie van d, d.w.z. G(d)
= Pr
{ d < d).
De uitstroomsnelheid s van het water uit de kraan is een functie van de opening d van de kraan, zeg s = f(d). Deze uitstroomsnelheid zal echter ook een stochastische variabele zijn, stel s, met verdelingsfunctie C(s), C(s) = Pr (s
< s).
Uit het functionele verband s = f(d) tussen s en d is het nu mogelijk bij gegeven G(d) de verdelingsfunctie C(s) te berekenen. De hoeveelheid water y7 die per opening van de kraan wordt afgetapt is gelijk aan het produkt s z van de uitstroomsnelheid en de openingsduur. Zij
.
~ ( p ) % ~ p{Fr < p), dan zal gelden K(?) = Pr ( s . z < v). Zijn de verdelingsfunctie C(s) en F(t) van s, resp. z bekend, dan kan hieruit de verdelingsfunctie K(cp) worden bepaald.
3. Wachttijdtheorie
Wachttijden treden veelvuldig op in allerlei situaties van het dagelijks leven. Voorbeelden zijn eenvoudig te vinden. Het wachten aan een loket in een postkantoor, het wachten van een voetganger om veilig een verkeersstroom te kunnen kruisen, het wachten van auto's bij bewaakte zowel als onbewaakte kruispunten; het wachten bij de douane op pascontrole. Maar ook op het terrein van de bedrijfsorganisatie treden in allerlei vormen wachttijdproblemen op, bv. bij planning- en produktieschema's, bij de inrichting van een magazijn (hoe groot moet hier het aantal magazijnbedienden zijn opdat de arbeider niet te lang behoeft te wachten?), bij de organisatie van havenbedrijven (hoe groot moet het aantal ligplaatsen voor schepen zijn, opdat deze niet buitengaats behoeven te wachten en hoe groot moet de overslagcapaciteit van een laad- en losbedrijf zijn opdat de schepen niet te lang behoeven te wachten?). Ook in de techniek zijn wachttijdproblemen van fundamenteel belang. Hoeveel telefonistes zijn er nodig opdat een aanvrager van een niet-automatisch gesprek niet te lang behoeft te wachten? Uit hoeveel spreekwegen moet de telefoonverbinding tussen Amsterdam en Utrecht bestaan opdat het telefoonverkeer zonder al te veel stagnatie, d.w.z. te lange wachttijden op een vrije spreekweg, kan plaatsvinden? De eerste studies betreffende wachttijdproblemen dateren van het begin van deze eeuw. Deze studies werden noodzakelijk voor de dimensionering van zowel met de hand bediende als van de automatische telefooncentrales. Tot ongeveer 1940 werd de wachttijdtheorie voornamelijk ontwikkeld met het oog op vraagstukken die zich in de telefonie voordeden. Als belangrijkste onderzoekers uit de vooroorlogse periode moeten genoemd worden Erlang, Molina, Fry, Polackzek en Palm. Erlang, een Deens mathematicus in dienst van de Deense P.T.T., kan als de grondlegger van de wachttijdtheorie worden beschouwd. Na de oorlog is de studie van de wachttijdtheorie intensief ter hand genomen, vooral met het oog op die toepassingen waarvan hierboven een aantal is geschetst. Momenteel is een uitgebreide literatuur aanwezig en, alhoewel de theorie nog zeker niet als afgerond is te beschouwen, is de stand van zaken thans toch wel dusdanig dat vele vruchtbare toepassingen mogelijk zijn geworden. De wachttijdtheorie is in feite een tak van toegepaste waarschijnlijkheidsrekening en zonder enige kennis van de elementaire waarschijnlijkheidsrekening is de wachttijdtheorie moeilijk te interpreteren en te hanteren. In het hierna volgende zullen wij een
wachttijdprobleem bespreken dat zowel van praktische als theoretische betekenis is. Wij beschouwen een groep van N machines, die eenmaal ingesteld produceren (functioneren) zonder dat hiervoor direct toezicht nodig is. Er kunnen echter storingen optreden, storingen van allerlei aard waardoor de machine uitvalt. Voor ons doel is het niet nodig deze storingen nader te preciseren. Iedere storing dient zo snel mogelijk te worden hersteld, daar anders de machine stilstaat (niet functioneert) en niet produceert, hetgeen verlies meebrengt. Voor het verhelpen van storingen is onderhoudspersoneel nodig. Zijn er veel monteurs aanwezig dan zal meestal zonder wachttijd een uitvallende machine in reparatie kunnen worden genomen. Een groot onderhoudspersoneel vergt echter veel arbeidsloon, temeer daar het steeds direct beschikbaar moet zijn en daardoor dikwijls, als er geen storingen zijn, toch niet met ander werk kan worden belast. Uiteraard ligt hier een economisch optimumprobleem, daar een te klein onderhoudspersoneel tot lange wachttijden en dus improduktieve uren leidt. Kent men de arbeidslonen en het verlies per improduktief uur van een machine dan kan het economisch optimale aantal monteurs eenvoudig worden bepaald als men de wachttijdverdeling van een gestoorde machine kent. Onder de wachttijd verstaan wij hier de tijd tussen het optreaen van een storing bij een machine en het begin van de reparatie. Uit de duur van de reparatietijd en de wachttijd is dan het aantal improduktieve uren voor een machine te bepalen. In eerste instantie is het probleem dus, te bepalen de wachttijdverdeling bij een gegeven aantal machines N en bij een gegeven aantal monteurs R. Voor de bestudering van dit probleem moeten echter nog meer gegevens bekend zijn. Eerst moeten wij iets weten omtrent de duur nodig voor het herstellen van een storing. Daar niet alle storingen van hetzelfde type zullen zijn, zal de reparatieduur in het algemeen variëren. In het hierna volgende zullen wij veronderstellen dat de $reparatieduurr een stochastische variabele is met verdelingsfunctie gegeven door
=O
,r
Eenvoudig blijkt dat p
=
J." r dd;{l -e-r/#} dr,
zodat ;L de gemiddelde reparatieduur voorstelt. Bovendien dienen wij iets te weten omtrent de frequentie waarmee storingen zich voordoen. De tijd tussen het moment waarop een machine in bedrijf is gesteld en het moment waarop deze machine daarna voor het eerst uitvalt zal in het algemeen niet constant zijn maar variëren. Wij zullen deze tijd o ook als een stochastische variabele opvatten en veronderstellen dat
Hierin stelt dus l/), de gemiddelde tijd voor, dat de machine ongestoord draait. Daar wij al min of meer stilzwijgend hebben verondersteld dat alle machines van hetzelfde type zijn, nemen wij aan dat 1, en /L voor alle machines dezelfde waarde hebben. Verder zullen wij veronderstellen dat de verschillende reparatieduren en de tijden dat de machines ongestoord draaien elkaar niet beïnvloeden, noch dat de duur van de reparatie en het optreden van storingen tijdsafhankelijk zijn, d.w.z. dat A en ;L met de tijd variëren. Tenslotte wordt verondersteld dat iedere monteur iedere reparatie kan verrichten en dat, zolang er monteurs beschikbaar zijn, een uitvallende machine direct in reparatie wordt genomen; zijn alle monteurs met herstellen bezig, dan wachten de uitgevallen machines en worden in volgorde van uitvallen hersteld. Voor dit probleem zullen wij de mathematische oplossing beschrijven. Zij op tijdstip t het aantal uitgevallen machines voorgesteld door y,. Dit aantal zal voor iedere vaste t een stochastische variabele zijn. De waarden die y, kan aannemen zijn de getallen 0, 1, 2, . . ., N. Veronderstel dat op tijdstip t = O alle machines functioneren. Zij def Pn(t) = Pr {yt = n J yo = O), n = O, 1, . . . ,N, zodat P,(t) voorstelt de kans dat op tijdstip t er n machines zijn uitgevallen wanneer op tijdstip t = O alle machines functioneren. Als n I R, dan zijn dus alle uitgevallen machines in reparatie, terwijl r R in reparatie zijn en n-R op reparatie wachten als R. n Men kan nu aantonen dat voor t -t m de kans P,(t) een limiet heeft. Stellen wij def P, = lim P,(t).
>
t+m
In praktische gevallen houdt deze laatste eigenschap in, dat na korte of langere tijd de verdeling van y, onafhankelijk is van t.
Wij zeggen dat voor t -t de toestand van statistisch evenwicht optreedt; wij hebben dan slechts met statistische fluctuaties te maken en de invloed van de situatie op t = O is verdwenen of, sprekend in de terminologie van de regeltechniek: het inschakelverschijnsel is gepasseerd. Voor de toestand van statistisch evenwicht stelt nu P, voor de kans dat n machines zijn uitgevallen. Er geldt nu
waarin
met
Duiden wij met Wc(t) aan de kans dat een uitgevallen machine langer dan een tijd t moet wachten voordat deze machine in reparatie wordt genomen, dan geldt
waarin C
def =
A
(N - E (yt)),
(5)
Voor de kans dat een gestoorde machine op reparatie moet wachten vinden wij
waarin
Alle van belang zijnde grootheden zijn nu bekend en wij kunnen
vervolgens het optimaliseringsprobleem, althans in principe, oplossen. De gemiddelde wachttijd
o
is immers te bepalen, zodat het gemiddelde produktieverlies door wachten en door reparatie is te berekenen; de arbeidslonen zijn in eerste instantie evenredig met R. Het hierboven besproken wachttijdprobleem is van een bijzonder algemeen karakter. Wij zullen van dit model achtereenvolgens een aantal varianten beschouwen. a. Beschouwen wij eerst het geval dat N zeer groot is t.o.v. R. In dit geval kunnen wij dan wel N naar laten naderen. Uiteraard is het duidelijk dat, indien wij zonder meer N -t laten naderen, op den duur alle R monteurs bezig zullen zijn met herstellen en dat het aantal niet functionerende machines onbeperkt groot wordt. Om tot een zinvol resultaat te komen moeten wij ervoor zorgen dat ook de kans dat een machine uitvalt naar nul nadert, m.a.w.: wij moeten 1 naar nul laten naderen, maar niet zonder meer. Nu stelt 1/1 voor de gemiddelde tijd dat een machine ongestoord functioneert, zodat dus A voorstelt het gemiddeld aantal storingen dat optreedt per tijdseenheid, gerekend over die tijden waarin de machine functioneert. Derhalve is NA het gemiddeld totaal aantal storingen per tijdseenheid. Wij laten nu N -+ oo naderen en A -t O echter zodanig dat N;i+s,N+w,A+O. Dan stelt s voor het gemiddeId aantal storingen dat per tijdseenheid optreedt. Men kan nu bewijzen dat de kans pn(T) op n storingen in een tijdsinterval T door de Poissonverdeling wordt beschreven
Voeren wij de limiet overgang uit, dan gaan onder de conditie def a=s,u
R aR WC(0) = --- -Po. R-a R! Alvorens over de conditie (8) te spreken, gaan wij eerst ons model enigszins anders interpreteren. Plaatsen wij eens de R monteurs achter R loketten, per loket één. Denken wij ons verder in dat op ieder moment waarop een storing zich voordoet een klant arriveert &e aan een van de R loketten moet worden bediend. De klanten komen dus volgens een Poissonverdeling met parameter s binnen. De bedieningsduur van een klant is een stochastische variabele met verdelingsfunctie r} = l r > O, =O ,r 40. De kans P, stelt nu voor de kans dat er in totaal n klanten aanwezig zijn, waarvan n-R wachten als n > R. Wij kunnen nu de betekenis van de conditie (8) toelichten. Daar ,u de gemiddelde bedieningsduur is en s het aantal per tijdseenheid arriverende klanten voorstelt, stelt dus a = slu voor de gemiddelde hoeveelheid werk in tijdseenheden (man-uren) die per tijdseenheid (uur) van de R bedienden wordt verlangd. Uiteraard moet dit bedrag a < R zijn, daar de R bedienden tezamen niet meer dan R tijdseenheden per tijdseenheid kunnen werken. Het zal duidelijk zijn, indien aan de voorwaarde (8) niet wordt voldaan, m.a.w. als a > R is, dat dan het aantal wachtende klanten steeds toeneemt en van een situatie van statistisch evenwicht geen sprake kan zijn. Uit de bovenstaande formules volgt, dat het gemiddeld aantal wachtende klanten G gelijk is aan Pr {r
Q>
aR G = 2 h Pn+h = (R-a)2 h=O
aR R! po,
en dat voor de gemiddelde wachttijd t wa geldt
t,,., is de gemiddelde wachttijd voor alle klanten. De gemiddelde wachttijd voor de klanten die moeten wachten wordt gegeven door
Uit de laatste formule blijkt duidelijk dat, naarmate a groter wordt en dus R-a kleiner, de gemiddelde wachttijd zeer snel toeneemt. Het hier beschreven wachttijdprobleem voor klanten, te bedienen aan R loketten treedt in velerlei vormen in de praktijk op. Wij noemen hier nog eens enkele toepassingen: een tankstation met R bedienden, een overslagbedrijf met R los- en laadinstallaties; een magazijn met R bedienden aan de afgiftebank. In al deze gevallen vormen de wachtkans en de gemiddelde wachttijd een maat voor de verleende service; is deze te gering dan moet R worden vergroot. De verdeling van het aantal wachtende klanten en het gemiddelde aantal wachtende klanten is vooral van belang voor de bepaling van het aantal wachtplaatsen dat beschikbaar moet zijn. b. Van bijzonder belang is bovenstaand wachtprobleem voor het geval R = 1. In dit geval gaan de formule's (9) t/m (16) over in (a 1)
<
P O = l-a
G = - a2 l -a'
a tw, =l-a
p, tmw
=-
P
l-a
.
(21)
Wij merken nogmaals op dat verondersteld is dat de bedieningsduur van de klanten negatief exponentieel is verdeeld en dat de klanten volgens een Poissonproces aan het loket arriveren. Het wachttijdprobleem met één loket is in de literatuur uitgebreid onderzocht, ook in die gevallen waarvoor de bedieningsduurverdeling niet is gespecificeerd, en waarbij de aankomst van de klanten aan het loket volgens een algemener proces dan het Poissonproces wordt beschreven.
c. Wij keren weer terug tot het oorspronkelijke model met N machines en R monteurs. Wij laten nu echter R 3 00 naderen, zodat iedere machine, die uitvalt, ogenblikkelijk in reparatie wordt genomen. Er is dus geen sprake van wachttijden. De formules (1) en (2) gaan nu over in
Hier geeft dus P, weer aan de kans dat er op een willekeurig tijdstip n machines zijn uitgevallen. Wij gaan dit model weer anders interpreteren. Beschouw een woningblok met een groot aantal woningen. Zij N het aantal waterkranen of aftappunten in dit woningblok. Zij nu r de tijd dat een waterkraan ononderbroken openstaat en
< r)=l= o,
e-rlP, t 2 0, t < O. Zij verder o de tijd dat een kraan is gesloten, en
Pr
{I.
Denken wij ons nu een machine vervangen door een waterkraan, dan volgt ogenblikkelijk dat de formule (22) voor P, aangeeft de kans dat in het woningblok gelijktijdig n van de in totaal aanwezige N kranen openstaan. In het algemeen zal N zeer groor en A betrekkelijk he in zijn; 1 / A is immers de gemiddelde tijd dat de kraan ononderbroken is gesloten. Laten wij derhalve in formule (22) N -t en -t O zodanig dat NI, -+ s, zodat s voorstelt het gemiddeld aantal malen dat per tijdseenheid een kraan wordt opengedraaid dan volgt met def a = ,US voor de kans P, dat gelijktijdig n kranen openstaan.
Zij nu s de hoeveelheid water die per tijdseenheid door een kraan wegstroomt; uiteraard is dit een stoohastische variabele. Zij C(o) de verdelingsfunctie van s, d.w.z. Pr {s < o) = C(@). Staan er gelijktijdig n kranen open en stroomt per tijdseenheid si liter door de i e kraan, dan volgt dat in totaal per tijdseenheid s, . . -i-s, liter. Men kan nu aantonen dat uitstroomt s,
+ + .
veldt
Pr {SI
+ + . . . + sn< o) = Ck*(o), SZ
waarin
= O
1' ce-1)*(G-t) dC(t) dt, k=3,4, . . . dt
Stellen-wij door S voor de hoeveelheid water die op een gegeven moment per tijdseenheid in het woningblok wordt afgetapt, zodat S = O als geen kranen openstaan, = si
+ . . . + sn als n kranen openstaan,
dan volgt Pr {S = 0)
= e-a,
i
Kiezen wij eens C(o) = 1 - e-a/e,rr 2 O waarin p dus de gemiddelde uitstroomsnelheid voor één kraan, dan volgt
waarin I,(x) de Besselfunctie, gedefinieerd door CO
I1(x) =
z k=0
(Jx)l+Zk k!(k+ l)! '
Eenvoudig volgt nu dat de gemiddelde hoeveelheid water E {S) die per tijdseenheid uitstroomt wordt gegeven door E {S) = a@.
(26)
In het hier besproken voorbeeld ware het misschien beter s te definiieren als de door de gebruiker verlangde uitstroomsnelheid van het water uit de kraan. In dat geval zou dan S voorstellen de door de $bewonersverlangde hoeveelheid water per tijdseenheid. Uiteraard zal, wanneer u voorstelt de hoeveelheid water die per tijdseenheid aan het woningblok kan worden toegevoerd, de kans Pr (S > u) voorstellen de kans dat in de toevoerleiding een drukdaling zal optreden.
De bovenstaande formules, waarvan het de schrijver onbekend is of zij reeds eerder in de literatuur betreffende de drinkwatervoorziening zijn behandeld, hebben zeker niet de pretentie reeds als formules te dienen bij een eventueel ontwerp van m a t e r leidingnetten. Veeleer is het de bedoeling om, aan de hand van een eenvoudig en sterk geschematiseerd model, eens een indruk te krijgen van hetgeen met waarschijnlijkheidstheoretische overwegingen misschien valt te bereiken bij de verfijning van de berekening van waterleidingnetten. Zoals reeds opgemerkt, is het boven beschreven model sterk geschematiseerd. Onder meer is steeds verondersteld dat de bewoners van het woningblok t.a.v. hun behoefte aan drinkwater een stationair gedrag vertonen. Dit is niet het geval, het waterverbruik zal in de loop van de dag sterk variëren. Alhoewel het mogelijk is met dit tijdsafhankelijke gedrag rekening te houden, kunnen wij wel verwachten dat voor bepaalde perioden van de dag het waterverbruik een stationair karakter heeft.
4. Voorraadtheorie Bij het in voorraad houden van een aantal goederen rijst direct de vraag: ,,hoeveel goederen moeten in voorraad worden gehouden?" Uiteraard is dit een economisch probleem. De hoeveelheid opgeslagen goederen betekent een zekere investering, die men in het algemeen slechts bereid is te doen indien daarvan revenuen zijn te verwachten. De grootte van de voorraad zal zowel afhangen van de te verwachten vraag naar de goederen, als van de mogelijkheid om de goederen door nieuwe te kunnen vervangen, als van de kosten gemoeid met de opslag. Dikwijls is de vraag naar de goederen niet exact bekend maar zal van dag tot dag vaneren. Het ligt dus voor de hand de hoeveelheid per dag te verkopen goederen voor te stellen door een stochastische variabele.
I
-
.ei I
Alvorens verder het voorraadprobleem te beschouwen zullen wij eerst eens een simpel geval behandelen. Veronderstel dat zich van een bepaald artikel maximaal R exemplaren in het magazijn bevinden en dat, zodra een exemplaar uit het magazijn wordt verkocht, er een bestelorder voor een vervangingsexemplaar wordt geplaatst. Zij h de tijd, die verloopt tussen het uitsturen van de bestelorder en de aflevering op deze order. Veronderstellen wij verder dat in een tijdsinterval van de duur T er zT kopers komen opdragen, waarbij de stochastische variabele zT de volgende verdelingsfunctie heeft
hierin stelt v voor het gemiddeld aantal kopers dat per tijdseenheid arriveert. Tenslotte veronderstellen wij dat, wanneer een koper arriveert en er bevinden zich geen exemplaren meer in het magazijn, deze koper dan verdwijnt en elders het gewenste artikel tracht te verkrijgen. Duiden wij met p,, n = 0, 1, . . ., R aan de kans dat er n artikelen in het magazijn aanwezig zijn, en dus R-n artikelen in bestelEng dan kan men aantonen dat geldt
In het bijzonder is
de kans dat er zich geen goederen in het magazijn bevinden, en deze kans stelt tevens voor de kans dat een koper onverrichterzake wordt weggestuurd. Het gemiddeld aantal in het magazijn aanwezige goederen bedraagt R
2 npn
n=O
= vh(l=
PR),
(30)
terwijl vp, voorstelt het gemiddeld aantal kopers dat per tijdseenheid onverrichterzake wordt weggestuurd. Met behulp van bovenstaande formules is het nu in principe mogelijk de optimale waarde van R te bepalen bij gegeven v en h. Maakt men R groter dan zal de winstderving door het wegsturen van kopers verminderen; een grotere voorraad betekent echter meer kosten voor opslag en rente. In het bovenstaande model is verondersteld dat de leveringstermijn h een constante is. De formules (28), . . ., (30) blijven echter ook geldig indien h geen constante is, d.w.z. indien deze leveringstermijn een stochastische variabele 3s; voor h moet dan de gemiddelde waarde van deze stochastische variabele worden gekozen. Het bovenbeschreven model is van een bijzonder algemeen karakter en treedt in velerlei vormen in het dagelijks leven op. Historisch gezien werd dit model voor de eerste maal gebruikt bij de dimensionerhg van telefooncentrales. Daar het economisch onmogelijk is ieder tweetal telefoonabonnees door een kabel te
verbinden, stelt men aan een grote groep van abonnees een aantal kanalen R voor gemeenschappelijk gebruik ter beschikking. Als V voorstelt het aantal oproepen dat per tijdseenheid wordt gemaakt door zo'n groep van abonnees en h de gemiddelde gespreksduur voorstelt, dan stelt pR voor de stagnatiekans, d.w.z. de kans dat een oproepende abonnee van de groep de situatie aantreft waarbij alle R kanalen door overige abonnees zijn bezet voor het voeren van een gesprek. Dit model is door Erlang voor de eerste maal onderzocht en de formule (29) staat dan ook bekend als de formule van Erlang. Een andere toepassing van het model ontmoeten wij in de verkeerstheorie. Als R voorstelt het aantal parkeerplaatsen op een parkeerveld en V het aantal auto's dat per tijdseenheid arriveert om te parkeren en h de gemiddelde parkeerduur is, dan stelt p~ voor de kans dat het parkeerveld volledig bezet is, en is tevens de kans dat een arriverende auto niet kan parkeren.
In de laatste tien jaren heeft het stochastische karakter van voorraadvraagstukken sterk de belangstelling getrokken, en er is een uitgebreide literatuur hieromtrent ontstaan. In het volgende zullen wij hieronder in het kort uiteen zetten van welk gezichtspunt uit men deze problemen benadert. Zij G, de grootte van de voorraad op tijdstip t. Boven hebben wij reeds uiteengezet dat de beschrijving van de vraag het eenvoudigst geschiedt door in te voeren de stochastische variabele zt die voorstelt het aantal klanten dat in een tijdsinterval T arriveert. In het algemeen is het ook nodig in te voeren de stochastische variabele y die voorstelt de hoeveelheid goederen die door een enkele koper per keer wordt gekocht. Behalve de beschrijving van de vraag is het ook nodig de bestelpolitiek te omschrijven. In ons bovenstaande voorbeeld werd diiect bijbesteld zodra een artikel was verkocht. In het algemeen is dit niet het geval en men zal bv. slechts eens per maand bestellen. Een veel bestudeerd geval is het (S,$-voorraadbeheer. S is de maximale capaciteit van de opslagruimte; s is het bestelniveau. Is aan het einde van de maand de voorraad G, kleiner dan s geworden, dan bestelt men bij tot een bedrag S; is daarentegen aan het eind van de maand de voorraad groter dan s dan wordt niet bijbesteld. Het probleem is nu om bij gegeven verdeling van en y de optimale waarden van S en s te bepalen. Een heel ander type voorraadproblemen ontmoet men bij de bepaling van de grootte van stuwdammen voor waterkrachtcentrales. Deze problemen zijn de laatste jaren vooral in India, Egypte en Australië bestudeerd. Hier is de vraag in het algemeen
Afb. 2
goed bekend en heeft meestal een minder variërend karakter dan de hoeveelheid water die wordt aangevoerd. De hoeveelheid water die per tijdseenheid wordt toegevoerd hangt dikwijls sterk af van klimatologische omstandigheden. Men tracht nu de watertoevoer door een stochastisch proces te beschrijven en op grond hiervan en van de te leveren hoeveelheid water per tijdseenheid te komen tot de bepaling van de grootte van het stuwmeer. Deze grootte moet zodanig zijn dat de kans dat geen water kan worden geleverd voldoende klein is. Van dit probleem beschouwen wij hieronder een zeer schematisch geval. Beschouw een spaarbekken met een constante waterafvoer. De toevoer van het water vindt uitsluitend plaats door regenbuien. Door z, stellen wij voor het aantal regenbuien dat in een tijdsinterval van de duur T optreedt. De verdeling van z~ zij gegeven door formule (27). De hoeveelheid water per regenbui zij voorgesteld door y, met Pr {y < y} = 1- e-yfa, y 2 0, zodat a de gemiddelde hoeveelheid water die per regenbui valt. Zij G, de hoeveelheid water in het spaarbekken op tijdstip t. Wij veronderstellen dat de regenbuien een tijdsduur nul hebben, zodat wij ons indenken dat al het water van één enkele regenbui instantaan aan het spaarbekken wordt toegevoerd. Zetten wij de hoeveelheid water in het spaarbekken als functie van de tijd uit dan krijgen wij een verloop van het type, zoals getekend in afb. 2. Op de tijdstippen t,, 5, . . . zijn er regenbuien geweest, met hoeveelheden water van resp. y,, y, . . . Enige tijd na t, blijkt het spaarbekken leeg te zijn. Direct na t, is de voorraad y, en er vindt weer waterafvoer plaats. Het zojuist beschreven model van een spaarbekken is in feite het wachtprobleem met een enkel loket waar het aantal arriverende klanten % in een tijdsinterval van de duur T door de Poissonverdeling wordt beschreven en waarvoor y de bedieningsduur van een klant voorstelt. G, is nu de virtuele wachttijd op tijdstip t, dit
is de wachttijd bij bediening in volgorde van binnenkomst, die een op tijd t ,arriverende klant zou moeten wachten voordat zijn bediening wordt gestart. Op tijd t wordt de klant arriverend op t, in bediening genomen, deze bediening is gereed op tijdstip z,. Op tijdstip t wacht dus één klant en één is in bediening. In het model van het spaarbekken wordt dus op z, met de waterafvoer van de regenbui gevallen op t, begonnen, op z, met die van de bui gevallen op h. Uit de formules voor het wachtprobleem met één loket (zie 3.b, formule (17), . ., (21)) volgt dus, met Y = R, a = ,u, a = va < 1, dat P, = l-a de kans is dat het reservoir leeg is; uit formule (19) vinden wij voor de verdeling van de watervoorraad G,. Pr {Gt > o} = a e-(l-a)ala, o 2 0.
.
Literatuur
Th. L. Saaty - Matlrematical methods of operation research. McGrawHill, New York (1959). Th. L. Saaty - Elements of querieing theory. McGraw-Hili, New York (1961).
Toepassing van statistische methoden
bil
het bacteriologisch onderzoek door ir. K . W . H . Leeflang
Bij het bacteriologisch wateronderzoek worden statistische methoden gebruikt ter bepaling van het meest waarschijnlijke aantal coli-bacteriiën in een monster water. Dit getal, in het kort aangeduid als M.P.N. (Most Probable Number) wordt, althans voor drinkwater, gewoonlijk betrokken op 100 ml teneinde een te groot aantal cijfers achter de komma te vermijden. In het onderstaande zal, om misverstand te voorkomen, steeds sprake zijn van het aantal bacteriën per eenheid van volume, dus per ml. De bepaling van het meest waarschijnlijke aantal coli-bacteriën in water is een bijzonder geval van het algemene vraagstuk in een monster van een microbenhoudend materiaal, anders dan door directe telling, het meest waarschijnlijke aantal van een bepaald micro-organisme of van een groep van organismen vast te stellen. Dit kan bv. zijn het aantal protozoën in een monster grond; het aantal sulfaatreducerende bacteriën in het bodemslib van een kanaal of een zeearm; het aantal coli-bacteriën in melk of water. In deze gevallen ent men een voedingsbodem, die bij uitstek geschikt is voor de groei van het gezochte organisme (of de groep van organismen) bij zo veel mogelijk uitsluiting van andere, met kleine hoeveelheden van het monster. Indien aanwezig ontwikkelt de microbe zich in het geënte medium op karakteristieke, goed herkenbare wijze. De kleinste hoeveelheid van het monster, waarmee een positief resultaat wordt verkregen, geeft een aanwijzing voor het aantal van de gezochte microbe. Bij het wateronderzoek maakt men gebruik van de eigenschap van bacteriën uit de coligroep om, bij aanwezigheid van de verder benodigde voedingsstofffen, suikers onder vorming van zuur en gas te vergisten. Worden nu bv. met 100, 10, 1 en 1/10 ml van een bepaald watermonster dergelijke gistingsproeven ingezet en wordt een positief resultaat waargenomen uitsluitend met 100 ml, dan werd vroeger gesproken van 1/100 als de ,,coli-titer", zijnde de reciproke waarde van de kleinste hoeveelheid water
waarmee gisting werd verkregen. Dit is echter niet meer dan een eerste benadering. Indien niet één enkele, doch vijf van dergelijke reeksen waren ingezet, dan had het resultaat bv. kunnen zijn: hoeveelheid water . . . . . . . . . . l00 l 0 l 1/10 ml aantal positieve uitkomsten . . . . . . . . . . 5 3 1 0 Op grond van dit resultaat kan niet meer van een colititer worden gesproken, maar anderzijds kan de verdeling van de positieve en negatieve uitkomsten ten grondslag worden gelegd aan een statistische bepaling van het meest waarschijnlijke aantal colibacteriën, dat deze verdeling te voorschijn heeft gebracht. Dit meest waarschijnlijke aantal kan worden betrokken op de gisting als zodanig (in de V.S. de ,,presumptive test" genoemd) of door nader onderzoek worden verfijnd. Nagegaan kan worden of de gisting inderdaad door een bacterie uit de coligroep is veroorzaakt en het M.P.N. kan op deze bacteriën worden betrokken. Nog verder voortgezet onderzoek is nodig om uit te maken of de gisting verwekkende bacterie identiek is met Escherichia coli. de vertegenwoordiger uit de coligroep die als de beste indicator van faecale verontreiniging wordt beschouwd, en op grond daarvan het M.P.N. van deze specifieke bacterie vast te stellen. De statistische verwerking van de gegevens wordt daardoor niet gewijzigd; in het onderstaande d e n voorbeelden van d e drie mogelijkheden worden behandeld. 2. De statistische verwerking van de uitkomsten Teneinde het meest waarschijnlijke aantal bacteriën statistisch te kunnen bepalen, is het nodig te beschikken over tenminste één serie met dezelfde hoeveelheid van het monster ingezette gistingsproeven, waarin zowel positieve als negatieve uitkomsten voorkomen. Het probleem wordt daarmee teruggebracht tot het bepalen van de waarschijnlijkheid, dat de voor de proeven gebruikte hoeveelheid een of meer bacteriën zal bevatten. Deze waarschijnlijkheid is immers afhankelijk van het aantal bacteriën, dat in het monster aanwezig is. Een aantal onderzoekers heeft zich met dit vraagstuk bezig gehouden: McCrady (l), Greenwood en Yule (2), Stein (4), Fisher (9, Halverson en Ziegler (g), Swaroop (13). Hun beschouwingen hebben tot de volgende oplossing geleid. Stel dat in een monster water, groot V ml, één E.coli aanwezig is. De kans, dat in 1 ml van dit monster deze ene bacterie wordt
1 v aangetroffen is dan -; de kans op afwezigheid
v
-l
v
. Indien
de V ml water niet één, maar x E.coli bevatten, wordt het waarschijnlijk aantal hoeveelheden, groot 1 ml, waarin zich 0, 1, 2, 3. . . bacterïen bevinden, gegeven cloor de binomiale ontwikkeling van
vooropgesteld, dat de verdeling van de bacteriën over het monster willekeurig is. Daar V en x als groot mogen worden beschouwd, kan formule (1) volgens de door Poisson gegeven transformatie worden overgevoerd in
waarin A
X
=
-, dus het aantal bacterïen per ml.
v
Deze Poisson-verdeling kan men, als gezegd, toepassen op een reeks met dezelfde hoeveelheid water ingezette proeven, die gedeeltelijk positief, gedeeltelijk negatief zijn uitgevallen. Om de kans, dat de overgang van positief naar negatief inderdaad wordt waargenomen te vergroten, zet men gewoonlijk een aantal reeksen in met afdalende hoeveelheden water, welke hoeveelheden zich in de regel verhouden als machten van 10.' Dit komt ook de nauwkeurigheid ten goede. Deze afdalende hoeveelheden zullen in het vervolg gemakshalve als verdunningen worden aangeduid. Reed (6) (zie ook Hoskins (10)) heeft op grond van formule (2) aangetoond, dat indien: N,, NB, N3 . . . zijn de grootten van de voor de proef gebruikte hoeveelheden in ml; p, r, t . . . .het aantal positieve uitkomsten in deze respectieve hoeveelheden; q, s, u . . . . het aantal negatieve uitkomsten in deze respectieve hoeveelheden; = het aantal coli-bacteriën per ml; A = de waarschijnlijkheid van het voorkomen van Y het gevonden resultaat bij de concentratie i,; = een constante voor een bepaalde groep waarnea mingen,
... ..
l In ieder geval moet de grootte van enige ingezette hoeveelheid groter zijn dan de som van de kleinere hoeveelheden (Greenic~ooden Yule (2)).
de waarschijnlijkheidscu~e de volgende vorm aanneemt:
-l [(l -e-N1).)~(e-N12)s] [(l -e-h'zrl)r (e-Nel)sl. a [(l -e-Nx.2)t(e-Xxi).] (3) De meest waarschijnlijke waarde van 3, is dan die, waarvoor y y
maximaal wordt. Door (3) te differentiëren en het differentiaalquotiënt = O te stellen, wordt de vergelijking gevonden, waaraan deze waarde van 3, moet voldoen:
In deze berekeningen is stilzwijgend verondersteld, dat een aanwezige coli-bacterie in het cultuurmedium ook inderdaad tot ontwikkeling komt. Het is daarom van belang dit medium zodanig te kiezen, dat een overgroeiing door andere bacteriën wordt MacConkey-vloeistof en tegengegaan. Verschillende media (h. glutaminemurmedium) bezitten de daartoe vereiste specifiteit. Hoskins (10) (11) en Pomeroy (14) hebben de algemene formule (4) voor de in de praktijk voorkomende gevallen uitgewerkt. a. Voor het geval, dat slechts in één verdunning positieve uitkomsten zijn verkregen, is de berekening zeer eenvoudig. Zij:
N,
de grootte in ml van de hoeveelheid, die ten dele positieve resultaten heeft opgeleverd; A = het totaal volume waarmee proeven zijn ingezet; B = het totaal volume waarmee proeven zijn ingezet die een negatief resultaat hebben opgeleverd; =
dan is: A A (5) B B Een voorbeeld moge dit verduidelijken. Het filtraat van een langzaam zandfilter is in de loop van een maand 25 maal onderzocht. Telkenmale werden gistingen ingezet met 100 en 10 ml water. In 100 ml werd éénmaal E.coli aangetroffen, in 10 ml nimmer. A bedraagt 2750, B 2650 ml, dus 2750 100 3, = 2,303 log = 0,037 2650 of het M.P.N. aan E.coli bedraagt 0,00037 per ml.
Ni A
= Nap log - = 2,303 log10 -
b. Ingewikkelder wordt het, indien niet in één verdunning, doch in twee opeenvolgende verdunningen N, en Nz positieve uitkomsten zijn geboekt. In dit geval moet worden voldaan aan de betrekking: A -Nz r -Ae-"?A N i A = 2,303 log B-(A-Nip)eN2"
Zoekenderwijs moet hier de juiste waarde van i, worden gevonden. Dit wordt vergemakkelijkt doordat deze waarde steeds ligt tussen de aangenomene, die in het rechterlid is gesubstitueerd en de uitkomst, die daarmee wordt verkregen. Een voorbeeld: van een oppervlaktewater (Loosdrechtse Plassen) is met elk van de hoeveelheden 100, 10 en 1 ml een reeks van 9 gistingsproeven in gezet. De uitkomsten van het coli-onderzoek waren als volgt: Hoeveelheid in ml . . . . . . . . . . . . . . . . . . . . . 100 10 1 Aantal positieve uitkomsten . . . . . . . . . . . . . . 2 1 O Aantal negatieve uitkomsten . . . . . . . . . . . 7 8 9 A = 999, B = 789 ml. Stel, dat het aantal colibacteriën 0,0030 per ml zal bedragen dan gaat (6) over in: 100 of:
X
0,0030 W 2,303 log
989 -999e-O*O3 789 -799e-O903
19,s 0,30 W 2,303 log - = 0,29 . 14.6
De waarde van A ligt dus tussen 0,0030 en 0,0029, zodat men gevoeglijk 0,003 kan aanhouden. Dikwijls kan dit geval b tot het eerst besproken geval a worden teruggebracht. Zijn nl. alle resultaten in een bepaalde verdunning (bv. 100 ml) positief en is de meerderheid in de volgende, grotere verdunning (dus 10 ml) eveneens positief, dan kan de eerste buiten beschouwing worden gelaten, zonder dat zulks de uitkomst schaadt. c. Hebben wij te doen met positieve resultaten in 3 of meer verdunningen, dan is de juiste waarde van i, slechts langs een zeer moeizame weg van ,,trial and error" te vinden, tenzij men het 3-verdunningenprobleem op een soortgelijke manier als zojuist besproken tot een 2-verdunningenprobleem kan herleiden. Is dit niet mogelijk, dan doet men het beste, gebruik makende van de door Hoskins (11) gegeven tabellen, de waarde van 1, te zoeken,
waarvoor het produkt in het rechterlid van formule (3) maximaal wordt. In het gunstigste geval moet dan toch dit produkt voor drie opeenvolgende waarden van % worden berekend, om tot een maximum te kunnen concluderen. Maar slechts zelden zal men zo fortuinlijk zijn en in de regel ziet men zijn geduld op harde proef gesteld. In de praktijk valt dit alles mee, omdat voor alle mogelijke verdelingen van de positieve uitkomsten in de meest gebruikelijke combinaties van verdunningen en aantallen in iedere verdunning ingezette proeven, eens en vooral het M.P.N. is berekend en in tabellen vastgelegd. Dergelijke tabellen worden bv. aangetroffen in de Standard Methods of Water Analysis, l l e uitgave, waarin voor 7 verschillende combinaties de waarden van het M.P.N. zijn opgenomen. Deze tabellen bestrijken een wijd gebied, aangezien bv. de tabel, die betrekking heeft op de uitkomsten, verkregen met 5 X 10, 5 X 1 en 5 X 0,1 ml, óók kan worden gebruikt indien 5 X 100, 5 X 10, 5 X 1 ml is ingezet, mits de opgegeven waarde van het M.P.N. dan door 10 wordt gedeeld enz. Moet evenwel het M.P.N. worden bepaald op grond van willekeurige reeksen, die niet in een tabel zijn opgenomen, dan moet dit worden berekend. Men kan daarbij met vnicht gebruik maken van een benaderende rekenwijze, of van een grafische methode. Alvorens daarop in te gaan zullen eerste twee gevallen worden behandeld, waarin de boven beschreven berekeningen tekort schieten, nl. de gevallen waarin alle ingezette proeven hetzij positief, hetzij negatief uitvallen. Pomeroy heeft hiervoor een oplossing aan de hand gedaan. Indien alle ingezette gistingen een positief resultaat geven, kan worden gezegd, dat de concentratie van de bacteriën waarschijnlijk een bepaalde waarde te boven gaat. Pomeroy acht het logisch te veronderstellen, dat deze concentratie waarschijnlijk de minimumwaarde overtreft, waarvoor het waargenomen resuitaat een waarschijnlijkheid bezit, die juist iets groter is dan 50%. Bij de berekening van deze waarde, die waarschijnlijk wordt overtroffen, kunnen alle uitkomsten buiten de reeks met de kleinste hoeveelheden worden weggelaten. Uit formule (2) volgt, dat de waarschijnlijkheid dat een reeks van p proeven, ieder geënt met N ml van het monster, geheel positief zal zijn, gelijk is aan (l-e-"1)P. Als deze functie gelijk aan 50% wordt gesteld, volgt:
N iZ = 2,303 log
1 l-($)
p
waaruit het waarschijnlijk overtroffen aantal kan worden berekend. Zijn alle ingezette gistingen negatief, dan is de concentratie van de bacteriën waars~hijnlijkkleiner dan de maximale concentratie, waarvoor de waarschijnlijkheid van het waargenomen resultaat juist iets groter is dan 50%. De waarschijnlijkheid van een geheel negatief resultaat is e-Al, waarin A = het totaal volume water waarmee de proeven zijn ingezet. Deze functie = 50 stellende, wordt gevonden, dat het M.P.N. waarschijnlijk kleiner zal zijn dan:
Indien bv. gistingen, ingezet met 2 X 10, 2 X 1 en 2 X 0,l ml, alle negatief uitvallen dan is het M.P.N. waarschijnlijk kleiner
3. Benaderende rekenwijzen en grafische bepaling Een weinig gecompliceerde, benaderende rekenwijze werd o.a. gegeven door Wolman en Weaver (3). Voortbouwend op de beschouwingen van McCrady hebben deze auteurs formule (4) vereenvoudigd tot:
t 1-0,999" waarin (p+ q), (r+$ en (t+u) zijn de aantallen gistingen, ingezet met 10, 1 en 0,l ml van het monster en p, r en t de aantalIen positieve uitkomsten in deze reeksen: x is het gezochte M.P.N. per 100 ml. Ook met behulp van deze vereenvoudigde formule moet het M.P.N. door proberen worden gevonden. Dit wordt vergemakkelijkt door de gra£ische voorstelling van de functies 1-0,9*, 1-0,99" en 1-0,99*, die Wolman en Weaver in hun artikel hebben opgenomen. De afwijkingen van de op deze wijze berekende meest waarschijnlijke aantallen en de exact berekende zijn zeer gering. Een veel eenvoudiger benaderingsformule is voorgesteld door Thomas (15): P A= -
+
4Ä.B
waarin 3. weer het meest waarschijnlijke aantal per ml is,
P het aantal positieve uitkomsten, A het totaal volume van de ingezette hoeveelheden en B het totaal volume van de hoeveelheden waarmee een negatief resultaat werd verkregen. Thomas geeft het volgende voorbeeld: Ingezet is : 1 X 10 ml, resultaat 1 i- , O 5 X l ml, resultaat 1 ,4 1 X 0,l ml, resultaat O ,1-
+ +
Op grond van deze resultaten word 1, =
1
- = 0,25. 15,l X 4,l De tabel uit de Standard Methods geeft 3, = 0,26, in zeer goede overeenstemming. Volgens Thomas is de overeenstemming in het geval dat de reeks, geënt met de grootste hoeveelheden, geheel positief is, het beste indien deze reeks buiten beschouwing wordt gelaten. De gemiddelde afwijking tussen de benaderde en de exact berekende waarde bedraagt volgens de auteur ongeveer 7% ; zelden is de afwijking meer dan 15% en in menig geval geven beide rekenwijzen nagenoeg hetzelfde resultaat. De exacte berekening kan ook worden vereenvoudigd door gebruik te maken van een nomogram. Dergelijke nomogrammen zijn door Linscl~oten(7) en Tl7onzns (18) samengesteld. Een eenvoudige grafische methode (Leeflrng(l7)) berust op de volgende overwegingen. Indien in een water voorkomen 3, E.coli per ml en daarvan een hoeveelheid groot N ml wordt onderzocht, bedraagt de waarschijnlijkheid, dat de proef negatief uitvalt: e-NA en dat zij positief uitvalt: (l--e-sl). Hieruit volgt, dat indien van een watersoort een groot aantal hoeveelheden wordt ingezet, elk groot N ml, de meest waarschijnlijke verhouding van de negatieve en positieve uitkomsten zal zijn als e-"1 . (1-e-NR)P. Hoe groter het aantal ingezette hoeveelheden wordt, des te meer zal deze ideale verhouding worden benaderd. Indien in een water 1 E.coli per ml aanwezig is en van dit water een groot aantal proeven wordt ingezet met 100, 10, 1, 0,l en 0,01 ml, dan is het meest waarschijnlijke resultaat als weergegeven in tabel 1.
TABEL 1 Grootte van de ingezette hoeveelheid in ml
Positief in %
Negatief in %
Afb. l
Diagroili voor liet bepalen van het M.P.N. op grond van de verdeling vali de positieve i ~ i t k o r l ~ s ~ e n
Zeer in het algemeen kan men de meest waarschijnlijke verhouding van positieve en negatieve uitkomsten berekenen bij gegeven waarden van het produkt N 1. (zie tabel 2). Deze verdeling is voor opklimmende gehalten van E.coli in afb. 1 aangegeven. Hierbij is langs de verticale as op logaritmische schaal afgezet de grootte van de ingezette hoeveelheden N, langs de horizontale as het percentage positieve uitkomsten. De meest waarschijnlijke verdeling van de positieve uitkomsten wordt voorgesteld door een kromme lijn, die bij verandering van ieven-
TABEL 2 D e waarden v m (l-e -NA)
NA. 10 8 6 5 4 3 2 l 0,8 0,6 04 0,2 o, 1
100(1-e-N%) % pos.
100(1-e-NA) % pos. 7,7 53 3,9 2,o 1,o 0,80 0,40 0,20 0,lO 0,08 0,04 0,02 0,011
0,08 0,06 0,04 0,02 0,O 1 0,008 0,004 0,002 0,001 0,0008 0,0004 0,0002 0,0001
99,995 99,97 99,75 99,3 98,2 95,O 86,s 63,2 55,l 45,l 33,O 18,l 995
TABEL 3 Onderzoek van rivierwater
februari 1930 1 april1 oktober 1962 1 aprill oktober 1959
25
100
100
64
8
O
-
E.coli
130
100 94
93 63
43 15
7
4 O
-
1
-
gisting E.coli
100
96
75
52
25
14
gisting
130
wijdig aan zichzelf verschuift. Voor gegeven A is de ligging van de kromme gemakkelijk aan te geven, daar voor N A = 1 het meest waarschijnlijk aantal positieve uitkomsten = 63% (voor N A = 1 is immers (1-e-NL) = 0,63). Men kan dus dezelfde figuur gebruiken voor waarden van N, die bv. 100 X zo klein zijn, wanneer men alle waarden van 1 100 X zo groot neemt. De grafische methode kan vooral met voordeel worden toegepast, indien men beschikt over reeksen gistingsproeven van grote omvang. In het algemeen zullen deze niet betrekking hebben op één enkele monsterneming, doch op een aantal monsters, die over een zeker tijdsverloop zijn genomen. Daarbij moet worden voldaan aan de voorwaarde, dat de verdeling van de coli-bacteriën
in de monsters willekeurig is, m.a.w. de monsters moeten ten aanzien van het coligehalte gelijkwaardig zijn. Betreffen de monsternemingen bv. het door een pompstation over een zekere periode afgeleverd water, dan zal aan deze eis van gelijkblijvende kwaliteit in het algemeen worden voldaan. Bij monsters oppervlaktewater, over een zekere tijdsduur genomen, zal dit in veel mindere mate het geval zijn, hetgeen zich echter onmiddellijk verraadt doordat - ook bij een groot aantal waarnemingen
- de aansluiting van de gevonden punten bij de theoretische lijn steeds meer te wensen overlaat, naarmate minder aan de grondvoorwaarde wordt voldaan. Als voorbeeld zijn in afb. 2 enkele resultaten weergegeven van het onderzoek van Rijnwater, uitgevoerd door het laboratorium van de Gemeentewaterleidingen van Amsterdam. De waarnemingsresultaten, waarop de lijnen in afb. 2 betrekking hebben, zijn in tabel 3 samengevat. De percentages positieve uitkomsten voor E.coli in februari 1930 sluiten zeer fraai aan bij de lijn voor 1, = 100. Blijkbaar is in deze maand op bevredigende wijze voldaan aan de eis van gelijkwaardigheid van de monsters. Voor de gistingen en E.coli in de zomermaanden van 1962 is deze voorwaarde minder goed vervuld. Niettemin valt uit het diagram toch af te lezen, dat het meest waarschijnlijke aantal E.coli in deze periode zich om de waarde 10 zal hebben bewogen. De percentages positieve uitkomsten van de gistingen in de zomermaanden van 1959 liggen daarentegen op een nagenoeg rechte lijn, die het diagram doorsnijdt. Van een willekeurige verdeling van de colibacteriën over gelijkwaardige monsters is daarbij geen sprake meer; uiteraard is het ongeoorloofd uit deze lijn enige conclusie ten aanzien van het M.P.N. af te leiden. Het diagram leent zich, behalve voor een snelle informatie omtrent het M.P.N., ook zeer goed om de verhouding tussen de coli-gehalten van verschillende watersoorten in beeld te brengen. In afb. 3 is in het diagram een aantal normen getekend, die voor drinkwater zijn gesteld. De lijn voor L = 0,001 stemt overeen met de formulering in de Aanbevelingen (26), uitgegeven door de VEWIN, die luidt: ,,Het rneest waarschijitlijke aaittal bacteriën van de coligroep, berekend iiit de onderzoekingen over een vol kalenderjaar, behoort voor oppervlakte+vater eit voor grondivater, bij toepassing van geheel of gedeeltelijk open winning en berging o f geheel o f gedeeltelijk open en niet irt eelt gebouw opgestelde zuiveringsi~lstallaties,kleiner te zijn dan 2 per liter en bij voorkeur kleiner dan I per liter."
De strengere eis, overeenkomende met A < 0,001, is in afb. 3 weergegeven. Beide eisen hebben betrekking op door het pompstation afgeleverd water. Grondwater behoort, bij geheel gesloten
Afb. 3
Enkele normen soor diinkivnter
winning en zuivering, in het geheel geen bacteriën van de coligroep te bevatten. .
Indien het onderzoek op het voorkomen van E.coli geregeld wordt verricht, bepalen de Aanbevelingen, dat onder dezelfde voorwaarden het meest waarschijnlijke aantal van deze bacterie kleiner behoort te zijn dan 1 per 1 en bij voorkeur kleiner dan 0,5 per 1. Ook voor deze bacterie is de strengere eis in het diagram afgebeeld.
In de International Standards for Drinking-water (24), door de World Health Organization in 1958 uitgegeven, wordt ten aanzien van bacteriën van de coligroep gesteld, dat in monsters van 100 ml van het water, dat het pompstation verlaat, deze bacteriën nimmer mogen worden aangetroffen en dat zij afwezig moeten zijn in tenminste 90% van 100 ml-monsters, genomen in het distributienet gedurende een jaar, hetgeen wil zeggen h 0,001. Deze zeer strenge normen zouden overal ter wereld moeten worden nagestreefd. Rekening houdende met het feit, dat dit technisch en economisch niet overal mogelijk is, is als internationale norm aangenomen, dat in 90% van de 10 ml-monsters van behandeld water, die gedurende een jaar worden onderzocht, bacteriën uit de coligroep niet zullen worden gevonden, of L 0,Ol. (De aanvullende bepalingen omtrent de afzonderlijke monsters, de frequentie van de monsterneming enz., worden hier buiten beschouwing gelaten). Deze norm geldt ook voor het distributienet. Dezelfde norm werd in de V.S. reeds in 1925 vastgesteld. In de laatste herziening van de Public Health Service Drinking Water Standards (28) wordt zij in wezen nog steeds gehandhaafd. Zij geldt voor water in het distributiesysteem en bepaalt, dat van alle 10 ml-hoeveelheden, gedurende een maand onderzocht, niet meer dan 10% organismen uit de coligroep mag bevatten. Ook dit komt vrijwel overeen met 3, < 0,Ol. (Bepalingen omtrent de afzonderlijke monsters enz. zijn weer buiten beschouwing gelaten).
<
<
Tegen deze milde norm gaan in de V.S. stemmen op. Reeds in 1940 heeft Bnylis (23) gepleit voor veel scherper gestelde normen, die hij voor bacteriën van de coligroep ongeveer legt bij ;I = 0,001, met dien verstande, dat een goed geleid bedrijf moet 0,0005. De werkgroep 2225M streven naar het resultaat l, van de American Water Works Association, die zich bezighoudt met de voorwaarden waaraan een ,,ideaal" drinkwater zou moeten voldoen, stelt als grens voor het gehalte aan bacterïën uit de coligroep in het distributienet 1,0/1, of ;I = 0,001 (Beun (29)). Ook de volgende norm heeft betrekking op het meest waarschijnlijke aantal bacterïën uit de coligroep in het distributienet, echter voor één enkele monsterneming. Zij wordt gevonden in Bijlage A van het Waterleidingbesluit (25), zij het niet met zoveel woorden. Uit de voorschriften voor het te verrichten onderzoek volgt evenwel, dat van vijf gistingsproeven, ingezet met 10 ml, ten hoogste één positief mag zijn ten gevolge van de
<
%pos. Afb. 4
M.P.N. van dririkivaier erz errkele oppervlrikte~vateren
aanwezigheid van bacteriën uit de coligroep. De lijn ligt bij 3, = 0,022. Uit dit overzicht van enkele normen mag worden afgeleid, dat een communis opinio groeiende is, die de grens voor drinkwater legt bij een M.P.N. = 0,001. De bepaling van het Waterleidingbesluit voor het enkele monster sluit daarbij voortreffelijk aan. Tegen deze normen zijn in afb. 4 de meest waarschijnlijke aantallen aan E.coli van drinkwater en enkele oppervlaktewateren geprojecteerd. De gegevens waarop deze berusten zijn in tabel 4 samengevat.
TABEL 4 Onderzoek van drinkwater en enkeIe oppe~laktewateren
23
Percentages positieve uitkomsten in opvolgende hoeveelheden (ml)
8 8
Plaats van monsterneming
2
$8.g
4
z2&
100
Q 8 4 aa Pompstation Bergen 1962 76 2,6 Distributiegebied ten Noorden van Noordzeekanaal 1962 840 Herstelde distributieleidin760" gen 1961 1900 ~oisdrechtsePlassen 11 100 Amsterdam-Rijnkanaal Delft, Haarlem 20 *lnge&t 2 >( 50 en 5 X 10 ml per onderzoek.
50
10
-
O
-
0,6
5
24 91
-
-
l
1
0,l
0,Ol
-
-
-
-
-
-
-
-
-
-
-
93
41
0 100
-
18 100
-
0,001 0,0001
-
40
g E;O
3
a
o" E.coli E.coii Bact. coligroep E.coli E.coli E.coli
Het gedurende 1962 door het pompstation Bergen van het Provinciaal Waterleidingbedrijf van Noord-Holland afgeleverde water (grondwater met open zuivering) voldoet ruimschoots aan de strengste normen van de VEWJN. De monsters, gedurende hetzelfde jaar in het distributienet van het P.W.N. ten noorden van het Noordzeekanaal genomen, geven gezamenlijk een lijn, die begrijpelijkerwijze lager ligt dan de lijn voor het afgeleverde water, maar nog steeds aan hoge normen voor drinkwater voldoet. De daarop volgende punten, die door een korte, rechte lijn verbonden zijn, hebben betrekking op het onderzoek, eveneens gedurende een vol jaar, van de eerste monsters, genomen na herstellingen in het genoemde distributienet, waarbij volgens de voorschriften is ontsmet. De voorwaarde van gelijkwaardigheid vm de monsters gaat hierbij echter niet op; in enkele gevallen is de ontsmetting mislukt (zodat zij moest worden herhaald), in andere - de meerderheid - volledig geslaagd. Vandaar dat is afgezien van het trekken van een lijn, die het M.P.N. zou aangeven. De punten, die het resultaat aangeven van het onderzoek naar bacteriën van de coligroep, zijn hier afgebeeld om aan te tonen, dat door bij de herstelling goed uitgevoerde ontsmetting, met meerekening van de mislukkingen, een gemiddeld resultaat kan worden bereikt, dat de daaraan bestede zorg volkomen wettigt. Het diagram bevat verder drie lijnen die karakteristiek zijn voor enkele typen oppervlaktewater. Een weinig verontreinigd oppervlaktewater als de Loosdrechtse Plassen leverde bij een onderzoek op 11 plaatsen een M.P.N. aan E.coli van 0,23 op. Ondanks de verspreide monsterneming is de aansluiting aan de theoretische lijn zeer goed. Voor het rivierwater is het resultaat van een groot aantal onderzoekingen van water uit het AmsterdamRijnkanaal karakteristiek, het M.P.N. ligt ongeveer bij 50. Een met huishoudelijk afvalwater zeer sterk verontreinigde waterloop, de Delft. te Haarlem, wordt gekenschetst door een meest waarschijnlijk aantal E.coli van niet minder dan 5000. De verhouding tussen het gehalte aan E.coli van goed drinkwater en sterk verontreinigd oppervlaktewater is ruim 107, d.i. de verhouding tussen het inwonertal van een gehucht van een paar honderd zielen en de ganse wereldbevolking.
4. De waarschijnlijkheid van het waargenomen resultaat Indien van een monster water proeven worden ingezet met 5 x 10, 5 X 1 en 5 X 0,l ml, dan mag het resultaat: 5 X 10
TABEL 5 Indeling van de resultaten
Groep
Onwaarschijnlijke codes
Theoretisch verwacht percentage resultaten
Gesommeerd theoretisch percentage
1,o
100,O
Aan 360 monsters waargenomen percentages
1.4
positief, 3 X 1positief en alle proeven met 0,1 ml negatief, volkomen normaal worden geacht. (Dit resultaat kan worden weergegeven door de code 530; dergelijke code-aanduidingen zullen in het volgende worden gebruikt). Ware het resultaat geweest 501, dan moet dit als minder waarschijnlijk worden beschouwd. Toch komen soortgelijke resultaten af en toe voor. Een resultaat 005 zal ongetwijfeld met hoog opgetrokken wenkbrauwen worden bezien: de kans daarop is kleiner dan 1 : lol2!
Woodward (21) heeft alle denkbare codes voor onderzoekingen in 3 verdunningen, uitgevoerd zowel met 5 als met 3 proeven in iedere verdunning, naar hun waarschijnlijkheid in 4 klassen ingedeeld. De eerste, meest voorkomende klasse bevat code's, waarbij de overgang van alle positieve naar alle negatieve uitkomsten in één verdunning valt, of tussen twee verdunningen in. Klasse 2 bevat codes waarin positieve en negatieve uitkomsten in 2 verdunningen worden waargenomen en waarvan mag worden verwacht dat zij in meer dan 2% van de onderzoekingen zullen voorkomen. De nog minder £requente codes van klasse 3 maken met de beide vorige klassen 99% van
TABEL 6 Onderzoek van Rijnwater Klasse van de code
Zomer 1962 Gistingen Aantal
E.coli %
Aantal
%
alle resultaten uit. De 4e klasse, waartoe 1% van de resultaten behoort, bevat de onwaarschijnlijke codes. Ter verduidelijking wordt hier de tabel van Woodward voor de meest gebruikte proefreeksen, nl. die in vijfvoud, opgenomen (tabel 5). De theoretisch berekende en de aan een groot aantal onderzoekingen, verricht op het Taft San. Engng. Centre, Cincinnati (Ohio), waargenomen percentages, kloppen zeer goed. Van de 214 codes die bij in vijfvoud ingezette proeven mogelijk zijn, zijn er 49 in de tabel opgenomen. De overige 165 maken dus slechts 1% van de waarnemingen uit! Woodward raadt aan op grond van deze onwaarschijnlijke uitkomsten geen M.P.N. op het rapport te vermelden, maar dit bv. door een vraagteken te vervangen. Deze classificatie doet een uitstekend middel aan de hand om de waarnemingsresultaten te controleren. Treft men onder een niet te klein aantal onderzoekingen te veel onwaarschijnlijke uitkomsten aan, dan is er reden om te veronderstellen, dat een storende factor in het spel is, die dient te worden opgespeurd. Deze factor kan zowel in de laboratoriumtechniek als in het water schuilen. Dit laatste moge aan de hand van het onderzoek van het Rijnwater worden toegelicht. De lijnen voor de gisting en het meest waarschijnlijke aantal E.coli gedurende de zomer van 1962, die in afb. 2 zijn opgenomen, berusten op 26 wekelijkse bepalingen, waarbij telkenmale In tabel 6 een groot aantal verdunningen in vijfvoud is inge~et.~ is de code-indeling van de verkregen resultaten samengevat. De verdeling van de resultaten der gistingen sluit, het kleine aantal Bij het onderzoek van het rivierwater worden bv. 6 of 7 verdunningen gebruikt. Indien de uitslag van een onderzoek 555410 is, dan kan het M.P.N. zowel met de code 541 als met 410 worden bepaald. Het verschil in uitkomst is slechts gering; niettemin is het raadzaam in dergelijke gevallen de geheel positieve verdunning weg te laten, in het voorbeeld dus de code 410 te gebruiken. 2
TABEL 7 Rijnonderzoek l april 1958 l april 1963 (Verdeling van de codes in klassen (%))
-
Klasse zomer
gisting winter
E.coli zomer
,inter
Theoretische verdeling
waarnemingen in aanmerking genomen, goed aan bij de theoretische. De resultaten van het onderzoek op E.coli laten echter een onmiskenbare verschuiving naar de minder waarschijnlijke codes zien. Over langere termijn gezien wordt het verschijnsel nog duidelijker. Tabel 7 bevat de gegevens over de periode 1 april 1958-1 april 1963, verdeeld over de zomer- en winterseizoenen. Het totaal aantal bepalingen van het M.P.N. bedraagt 130, zowel in de gecombineerde zomer- als winterseizoenen. Het blijkt, dat reeds de gistingen een verschuiving naar de minder waarschijnlijke codes te zien geven; voor E.coli is deze verschuiving nog meer geprononceerd. Winter en zomer maken weinig verschil. Het is verleidelijk te veronderstellen, dat de oorzaak van deze storing in de vervuiling van het rivierwater moet worden gezocht en bovenstaande uitkomsten op te vatten als een teken aan de wand, hoever de Rijn van een natuurlijk levensmilieu is afgeweken. Dat zulks vooral voor E.coli, die als darmbewoner aan een temperatuur van 37 ' C is aangepast, tot uiting zou komen, is volkomen aannemelijk. De verklaring van de storing kan echter ook in geheel andere richting worden gezocht. Het ruwe rivierwater, waarmee de proeven zijn verricht, bevat slib en een groot deel van de bacteriën is aan de slibdeeltjes vastgehecht. Het is mogelijk, dat dientengevolge de voorwaarde van de willekeurige verdeling van de bacteriën over het monster onvoldoende is gerealiseerd, zodat de berekende waarschijnlijkheden van de codes niet meer inherent zijn aan slibhoudend water, vooral indien daarvan grote verdunningen, bv. tot 1/100.000 ml moeten worden ingezet. Nader onderzoek naar de oorzaak van de storing is dan ook zeker van belang te achten. 5. De grenzen der betrouwbaarheid Het M.P.N. mag niet als een absolute grootheid worden be-
organismen per m l
Waarschijnlijkheidskrommen voor de gevallen: 2 X I ml ingezet, I positieve z~itkomst; 10 X l ml irlgezet, 5 positieve uitkomsten
Afb. 5
schouwd. Wie dit zou doen, loopt gevaar te worden gerangschikt onder hen, waarvan eens geestig is opgemerkt, dat zij de statistiek gebruiken zoals een dronkeman een lantaarnpaal: meer tot houvast, dan tot verlichting. De vraag moet dus worden gesteld: hoe moet een M.P.N. worden beoordeeld, m.a.w.: hoe waarschijnlijk is het meest waarschijnlijke aantal? Met deze uiterst belangrijke vraag hebben zich de eerste onderzoekers op het gebied van het M.P.N. reeds beziggehouden. Het M.P.N. is de top van een waarschijnlijkheidscurve; om het volledig te kunnen beschrijven is het nodig de spreiding van deze curve te kennen. De spreiding is afhankelijk van het aantal ingezette proeven. In afb. 5, ontleend aan Eisenhart en Wilson (16) is voor de gevallen: 2 X 1 ml ingezet, 1 positief, en 10 X 1 ml ingezet, 5 positief, tegen het werkelijke aantal bacteriën afgezet de waarschijnlijkheid (uitgedrukt als percentage), dat één van beide resultaten zal worden waargenomen. De top van beide curven -het M.P.N. ligt op dezelfde plaats, aangezien in beide gevallen 50% van de proeven positief is uitgevallen en dus volgens (5) t = Nap. log 2 = 0.69. De spreiding is evenwel veel kleiner voor het grotere aantal proeven. De spreiding wordt veelal aangegeven door het 95%-betrouwbaarheidsinterval, aangevende de grenzen waarbinnen 95 % van de waarnemingen komt te liggen. Gezien de scheefheid van de frequentiecurve is het duidelijk, dat de ondergrens van dit betrouwbaarheidsinterval zich dichter bij de top bevindt dan de bovengrens. Zo bekend zou zijn, op welke wijze een groot aantal M.P.N.'s, bepaald van hetzelfde monster water of van een reeks gelijkwaardige monsters, varieert, zou het bepalen van het betrouw-
verwacht percentage waarnemingen
Afb. 6 Frequentieverdeling van de te verwachten uitkomsten van het M.P.N. bij onderzoek van water met 1,5 E.cofilm1
baarheidsinterval weinig moeite opleveren. In sommige omstandigheden kan hiervan inderdaad gebruik worden gemaakt. Eisenhart en WiIson (16) hebben erop gewezen dat, indien het aantal ingezette proeven per verdunning groot genoeg is - of indien een groot aantal M.P.N.'s aan het zelfde water is bepaald - de standaarddeviatie van de logaritme van het M.P.N. nagenoeg constant is. Velz (20) heeft dit nader uitgewerkt. Afb. 6, ontleend aan het artikel van Velz, laat voor een water met een coligehalte van 1,5/ml de theoretische waarschijnlijkheidsverdeling zien van de mogelijke resultaten, indien voor het onderzoek drie verdunningen, in vijfvoud ingezet, worden gebruikt. Op logaritmisch waarschijnlijkheidspapier kan door de berekende punten een rechte lijn worden getrokken. Ieder punt geeft aan het percentage waarin een zeker M.P.N. of kleinere waarden daarvan mogen worden verwacht. De lijn snijdt de 50%-ordinaat juist bij het onderstelde gehalte van 1,5 colibacteriën per ml. Dergelijke lijnen zijn experimenteel bevestigd. Velz leidt daaruit af dat, indien het M.P.N. wordt bepaald met behulp van 3 reeksen, ieder omvattende n proeven: 1. de logaritmen van de gevonden M.P.N.'s een normale distributie vertonen; 2. de standaarddeviatie van deze logaritmen bedraagt:
2
/
/
'Qpl
0.1
/
/
./
2
/
/
u
/
/
1
z
s
m
2030
oo
L O S O S O ~ro
QS
999~5
ss
l 989s
percentage waarnemingen
Afb. 7 Frequentieverdeling van liet M.P.N. van Rijnwafer, zomer 1962 @log =
0,5487
-.
i n
Aangezien de logaritmen van de 95% -betrouwbaarheidsgremen zijn gelegen op afstanden van 2 o van het gemiddelde van de logaritmen, biedt hun berekening geen moeilijkheden meer. Dit gemiddelde van de logaritmen is niet de logaritme van het rekenkundig gemiddelde van het M.P.N. zelf, doch van de mediane waarde daarvan (d.i. de waarde, waarboven en waaronder 50% van alle waarnemingen is gelegen). Wil men van een groep M.P.N.'s, aan eenzelfde monster of aan gelijkwaardige monsters bepaald, een gemiddelde opgeven, dan vormt deze mediane waarde een betere maat dan het rekenkundig gemiddelde. Bij he$ onderzoek van monsters ruw water, over een zeker tijdsverloop genomen, zal in het algemeen niet aan de voorwaarde van een willekeurige verdeling van de colibacteriën worden voldaan. Zijn de afwijkingen niet te groot, dan wordt de logaritmische distributie van de bepaalde meest waarschijnlijke aantallen niettemin gerealiseerd. Afb. 7 toont, voor het Rijnwater gedurende de zomer van 1962, de distributie van de geaccumuleerde percentages van de gevonden waarden van het M.P.N. De punten, afgezet op logaritmisch-waarschijnlijkheidspapier, sluiten op bevredigende wijze bij een rechte lijn aan. Deze lijn is evenwel steiler dan de theoretische, die geldt voor de willekeurige verdeling van de coli's en in afb. 7 gestippeld is getekend.
De mediane waarde bedraagt 6,4. De vraag rijst nu, binnen welke grenzen deze mediane waarde heeft geschommeld. Deze vraag kan worden beantwoord, door uit de snijpunten van de gevonden lijn met de ordinaten voor 2,5 en 97,5% lijnen te trekken, evenwijdig aan de theoretische. Deze laatste lijnen snijden de 50%-ordinaat bij resp. 3,4 en 12. Dit wil zeggen, dat de mediane waarde van het gehalte van E.coli van het Rijnwater gedurende het genoemde tijdvak zich met 95% waarschijnlijkheid zal hebben bewogen tussen 3,4 en 12. De uit de grafische methode gevonden waarde van 10 (zie afb. 2) blijkt dus een redelijke benadering te zijn. Vaststelling van het 95%-betrouwbaarheidsinterval voor één enkele bepaling van het M.P.N. op grond van de normale distributie van de logaritmen is echter alleen geoorloofd, indien 3 reeksen worden ingezet, die ieder tenminste 10 proeven tellen (Eisenhart en Wilson (16)). In het normale routine-onderzoek worden evenwel ten hoogste 3 reeksen van ieder 3 of 5 proeven gebruikt. Aan de discrete gegevens, die zo kleine reeksen opleveren, mag niet een zodanig aanvaardbare waarschijnlijkheid worden toegekend, dat het betrouwbaarheidsinterval op grond van de normale logaritmische distributie kan worden berekend zonder fouten te maken en meer dan een benaderende waarde te verkrijgen. Swaroop (19) is erin geslaagd de wiskundige grondslag uit te werken, waarop een bepaling van het betrouwbaarheidsinterval bij deze routine-onderzoekingen kan worden gefundeerd. Op zijn berekeningen berusten de tabellen van het M.P.N., aangevuld met de 95%-betrouwbaarheidsgrenzen, die in de International Standards for Drinking-water van de W.H.O. (24) zijn opgenomen. De Standard Methods, l l e druk (27), bevatten gelijkluidende tabellen. Een blik op deze tabellen doet zien, hoe ver deze betrouwbaarheidsgrenzen uiteen liggen. Het gebrek aan nauwkeurigheid van de bepaling van het M.P.N. op de gebruikelijke wijze wordt dan ook algemeen erkend. De praktische uitvoerbaarheid stelt hierbij de grens. Als voorbeeld wordt hier de tabel overgenomen van de in verband met het Waterleidingbesluit belangrijke reeks van 5 X 10 ml (tabel 8) (Woodwnrd (21)). De bovengrens van het 50 % -betrouwbaarheidsinterval, indien alle vijf proeven negatief zijn, en de ondergrens daarvan voor het geval van vijf positieve uitkomsten, komen uiteraard overeen met de berekening volgens Pomeroy (14), gegeven in de formules (8) en (7). Desgewenst zou men ook de 95%-betrouwbaarheidsgrenzen kunnen opgeven.
TABEL S MPN per 100 ml en betrouwbaarheidsgrenzen voor een proefreeks van 5 X 10 ml Aantal positieve uitkomsten
MPN
50% betr. grens onder boven
95% betr. grens onder boven
6. Vergelijking tussen de bepaling van het M.P.N. d.m.v. gistingen en van het membraanfilter Behalve door het inzetten van gistingsreeksen, kan het gehalte aan coli-bacteriën ook door middel van een membraanfilter worden bepaald. Daarbij wordt een geschikte hoeveelheid water over een microfilter gefiltreerd, waarop de bacteriën achterblijven. Door het filter op een voedingsbodem te leggen en te bebroeden, ontwikkelen de bacteriën zich tot koloniën. De zich daaronder bevindende koloniën van colibacteriën kunnen aan hun uiterlijk worden geïdentificeerd en geteld. Aan de vergelijking van beide methoden hebben McCarthy, Thomos en Delaney (22) interessante beschouwingen gewijd. Statistisch heeft de membraanfiltermethode op de gistingsmethode ongetwijfeld voordelen, daar de grenzen van het betrouwbaarheidsinterval van 95% nauwer bijeen liggen. Bij een grote A. stel A = 10 of hoger - geldt voor een willekeurige (Poisson) verdeling van de bacteriën over het monster, dat o' = A.. Het betrouwbaarheidsinterval van 95% is derhalve 3. + 2 l//, Zijn bv. 100 ml afgefiltreerd en op het membraanfilter 49 colikoloniën geteld, dan bedraagt het meest waarschijnlijke aan wli-bacteriën per 100 ml dus 49, met als onderste betrouwbaarheidsgrens 35 en als bovenste 63. Wordt ditzelfde M.P.N., eveneens op 100 ml berekend, gevonden als resultaat van de drie gistingsreeksen in vijfvoud ingezet (voor 10, l en 0,l ml, code 520) dan ligt de onderste betrouwbaarheidsgrens bij 13 en de bovenste bij 180. Het verschil is evident. De nauwkeurigheid van de membraanfiltermethode kan alleen worden geëvenaard door het inzetten van zeer lange gistingsreeksen en dit stuit al spoedig op praktische bezwaren. In het gegeven voorbeeld zou elk van de drie reeksen omstreeks 80 proeven moeten teilen.
-
De membraanfiltermethode heeft bovendien haar snelheid voor. Kan het beoordelen van de gistingen eerst na 2 X 24 uur geschieden waarna het nadere onderzoek naar het gistingverwekkende organisme nog enkele dagen in beslag neemt, het membraanfilter levert na 16 tot 20 uur zijn resultaat. Het filter wordt dan ook vaak te hulp geroepen in gevallen, waarin men snel ge-informeerd wil zijn, bv. bij herstelwerkzaamheden aan het buizennet, waarbij de afsluiting zo kort mogelijk moet duren. Grote, soms onschatbare diensten bewijst het door zijn snelle informatie bij ernstige infecties in het distributienet of bij rampen. Niettemin de bacterioloog voert tegen het membraanfilter bezwaren aan, die zeker tegen het statistisch voordeel opwegen, zelfs de balans doen omslaan. In de eerste plaats is een principieel bezwaar van deze methode, dat zij niet is gegrondvest op de voor de coligroep karakteristieke vergisting van suiker onder vorming van zuur en gas, doch op veel minder karakteristieke morfologische en biochemische kenmerken. In de tweede plaats geven de thans beschikbare voedingsbodems nóch de zekerheid, dat in concurrentie met andere op het filter aanwezige organismen, alle colibacteriën zich tot herkenbare koloniën zullen ontwikkelen, nóch de waarborg, dat alle koloniën met het voor coli kenmerkende uiterlijk inderdaad koloniën van colibacteriën mllen zijn. Het laatste geldt in het bijzonder indien het onderzoek op het voorkomen van E.coli is gericht. Vooralsnog ligt het belang van de membraanfiltermethode in haar snelheid in al die gevallen, waarin aan snelle informatie meer waarde moet worden toegekend dan aan optimale betrouwbaarheid. Literatuur l . N. H. McCrady J. Infect. Dis. 17(1915)183. 2. M . Greenwood en G . U. Yule - J. Hyg. 16(1917)36. 3. A. Wolman en H. L. Weaver - J. Infect. Dis. 21(1917)287. 4. F. M. Stein - l. Bact. 4(1919)243. 5. R. A. Fisher - Philisoph. Trans. Royal Soc. London 222A(1922)309. 6. L. J. Reed - Public Health Rep. 40(1925)704 (reprint 1029). 7. J. H. Linschoten - Water en gas 3(1929)169. 8. N . D. R. Schaafsma - Med. Dienst Volksgezondlt. Ned. Indië I (1930)156. 9. H. O . Halverson en N. R. Ziegler - J. Bact. 25(1933)101; 26(1933) 331,559; 29(1935)609. 10. J. K. Hoskins J.A.W.W.A. 25(1933)867. 11. J . K. Hoskins - Pliblic Health Rep. 49(1934)393 (reprint 1621). 12. J. K. Hoskins en C. T. Butterfield - J.A.W.W.A. 27(1935)1101. 13. S. Swaroop - Ind. J. Med. Res. 26(1938)353. 14. R. Pomeroy - I.A. W. W.A. 32(1940)478. 15. H. A. Thomas jr. - J.A.W.W.A. 34(1942)572. 16. C . Eisenhart en P. W. Wilson - Bact. Rev. 7(1943)57.
-
-
17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29.
K.W. H.Leeflang - Water 30(1946)145.
H. A. Thomas jr. - J. New Engl. W.W.A. 60(1946)153. S. Swaroop - Znd. J. Med. Res. 39(1951)107. C. J. Velz - Water and Sew. W . 98(1951)66. R. L. Woodwi~d- J.A.W.W.A. 49(1957)1060. 1. A. McCarthy, H. A. Thomas jr. en J. E. Delaney - Amer. J. Public Health 48(1958)1628. J. R. Baylis - J.A.W.W.A. 32(1940)1753. International Standards for Drinking-water. W.H.O., Genèva (1958). Besluit d.d. 7 juni 1960, Stb. 345 (Waterleidingbesluit); Bijlage A, ZZI. Aanbevelingen ter zake van liet bepaalde in art. 4, lid 2, van de Waterleidingwet. VEWIN (1960). Standard Metliods for the Examinafion of Water and Wastewater, lle dr. Amer. Public Health Ass. (1960). U.S. Public Health Service Drinking Water Standards. U.S. Public Health Sen. Publ. 956. Govt. Printing Office (1962); J.A.W.W.A. 53 (1961)935; 54(1962)1548. E.L.Bean- J.A.W.W.A. 54(1962)1313.
Operationeel onderzoek ter voorbereiding van beslissingen door prof. ir. W . Monhemius Inleiding Operationeel onderzoek (Engels: Operational research, Amerikaans: Operations Research) is een nieuwe naam voor een in principe niet zo nieuwe wijze om problemen te benaderen, die zich voordoen bij het organiseren en beheren van ondernemingen, bedrijven, instellingen, militaire onderdelen, in het algemeen: organisaties. Een deel van deze problemen bestaat immers uit het nemen van beslissingen en operationeel onderzoek kan een belangrijke rol spelen bij het voorbereiden van beslissingen. Wij zullen vandaag achtereenvolgens nagaan:
- hoe komt een beslissing tot stand?
- wat is, in het kort, de geschiedenis van het operationele onderzoek? - welke hoofdindeling van problemen bestaat er? - wat zijn de fasen en kenmerken van operationeel onderzoek (hierna soms aangeduid met de angelsaksische afkorting OR)? - wat is OR dus in wezen? Daarna zullen wij een uitgewerkt voorbeeld behandelen dat betrekking heeft op het voorraadbeheer van reserve-onderdelen.
Beslissingen Wanneer in het bedrijf een beslissing wordt genomen, dan is dat een beslissing om een bepaalde adie te ondernemen. Aan deze beslissing zijn gewoonlijk enkele stappen voorafgegaan. Een beslissing is vaak een keuze uit een aantal alternatieve acties. Van elk van die acties heeft men getracht de consequenties te voorspellen en op grond van de voorspelde gevolgen is op grond van een bepaald criterium een keuze gedaan. Voordat de alternatieven werden opgesteld, heeft men zich moeten afvragen: - welk doel willen wij bereiken? - onder welke voorwaarden moet het doel worden bereikt? Nu zijn er talloze problemen in het bedrijf, die op zuiver tech-
informatie
r-------I
-i I I
I
alternaprobleem 4 tieven stellen
b
actie
-7
+gevolgen
L
I I
-J
I I I
I
I
i- - - _J -analyse
Afb. I
Beslr~it~~orrniilg (naar Sittig (13))
nisch gebied liggen. Ook dergelijke beslissingen worden volgens het gegeven schema genomen. Er komt echter geen ,,operationeel onderzoek" aan te pas. Van OR spreekt men pas als het gaat over het onderzoek ten behoeve van beslissingen ten aanzien van handelingen in of van systemen van mensen, goederen, machines en installaties; het gaat dan dus over problemen van bedrijfsvoering. Uiteraard geldt ook voor deze beslissingen het boven besproken schema, dat nog eens is weergegeven in afb. 1 (ontl. aan Sittig (13)). Tenslotte speelt bij elk operationeel onderzoek het wiskundig model de centrale rol.
Geschiedenis van het operationele onderzoek De term ,,operationeal research" die, zoals ik in ,,Onze Taal" heb gelezen, het best in het Nederlands kan worden vertaald als ,,operationeel onderzoek"', is in Engeland ontstaan, vlak vóór of in de Tweede Wereldoorlog. De militairen hadden nieuwe wapensystemen ter beschikking gekregen, die door natuurkundigen en technici waren gemaakt; men had nog geen ervaring in het werken met deze systemen. Het bleek nu, dat deze natuurkundigen en technici, in het algemeen mensen, gewend aan een wetenschappelijke aanpak van problemen, goede hulp konden bieden bij het gebruik van deze nieuwe systemen. Daarbij werd vooral het goed functioneren van het systeem als systeem beklemtoond. Zo bracht in september 1940 de Britse natuurkundige Blackett een groep mensen bij elkaar om de problemen te bestuderen rond het gebruik van radarvuurleiding tijdens vijandelijke luchtaanvallen. Als leden van deze groep zien wij achtereenvolgens optreden: 2 fysiologen, 2 theoretische natuurkundigen, 1 astrofysicus, 1 legerofficier, 1 landmeter, een 3e fysioloog, 1 natuurkundige en 2 wiskundigen. Deze groep stond bekend als l
D e officiële Nederlandse ,,vertaling9' luidt echter: operationele research.
84
,,Blackett7s Circus". Ter onderscheiding van andere research kreeg dit werk de naam ,,Operational Research": onderzoek op het gebied van (militaire) operaties. In de oorlogsjaren nam, later óók in de V.S., het operationele onderzoek een grote vlucht. Onder de problemen, die in dit kader werden behandeld, vindt men: - het juiste gebruik van mankracht bij het bedienen van geschut (nauwelijks wiskundig model nodig); - de optimale grootte van konvooien; - het nuttig effect van diverse soorten bombardementen v.w.b. de verlaging van de gevechtskracht van de tegenstander.
In de meeste studies speelt het wiskundig model de centrale rol. Na de oorlog kwamen veel mensen, die bij de krijgsmacht OR hadden bedreven of daarmee kennis hadden gemaakt, terug in het bedrijfsleven. Zij propageerden daar de wijze van aanpak, die zij hadden leren kennen. Men ziet enkele controversen ontstaan tussen deze mensen en degenen, die voor de oorlog reeds lang soortgelijke activiteiten bedreven, onder namen als wetenschappelijke bedrijfsorganisatie, ,,industrial engineering" e.d. Wat nieuw was, was de omvang van de nieuwe werkwijze en de meer principieel kwantitatieve aanpak. Bovendien speelde op tweeërlei wijze omstreeks 1950 de opkomst van de elektronische rekenmachine (,,computer") een rol bij de groei van OR. Ten eerste konden nu wetenschappelijke berekeningen worden uitgevoerd, waarvoor men tot dusver steeds was teruggeschrokken. In de tweede plaats ontstonden door de invoering van deze machines allerlei nieuwe mogelijkheden maar ook moeilijkheden voor de bedrijfsvoering. Zo kwam men tenslotte tot de oprichting van een OR-club in Engeland, die in 1954 tot OR Society werd, met heden ongeveer 1000 leden; in de V.S. werd in 1953 de Operations Research Society of America opgericht. In Nederland werd, als een sectie van de Vereniging voor Statistiek de SOR (Sectie Operationele Research) opgericht. Van deze sectie kunnen leden van het KIvI en het NIVE ook lid worden, zonder lid van de VVS te zijn. Hoofdindelig van problemen
De problemen, die men op het terrein van OR ontmoet, kunnen tot enkele hoofdgroepen worden teruggebracht.
1. Zoekproblemen Deze problemen ontmoet men, althans tot dusver, vrijwel uitslui85
tend op militair gebied. Onderwerp is bv. het zoeken naar een duikboot door een vliegtuig. 2. Concurrentieproblemen Hierbij gaat het om situaties, waarbij het resultaat van iemands bemoeiingen mede afhangt van de acties van één of meer tegenspelers die hem zoveel mogelijk afbreuk proberen te doen. Deze situatie bestaat ook in het spel, vandaar dat de theorie vaarin het kwantitatieve aspect van deze problemen wordt besproken, de naam ,,speltheorie" heeft. 3. Routebepaling Onderwerp is bv. het probleem van de handelsreiziger, die met Amsterdam als begin- en eindpunt alle steden in Noord-Holland één, maar ook sleohts één, keer wil bezoeken en daarbij zo weinig mogelijk kilometers wil afleggen. 4. Problemen van toewijzing Dit zijn problemen als het volgende. De Engelse elektrische centrales (en ook andere grote afnemers) hebben kolen nodig in bepaalde hoeveelheid en kwaliteit. Deze kolen moeten worden aangevoerd uit de een of andere Engelse kolenmijn of, als het geebporteerdekolen zijn, uit de een of andere haven. De totale kosten van de ,,operatie kolenvoorziening" kunnen met enige goede wil worden beschreven als een lineaire functie van een groot aantal variabelen. Elk van die variabelen is de onbekende hoeveelheid kolen, die van een bepaalde mijn naar een lbepaalde centrale moet worden vervoerd. Deze variabelen zijn natuurlijk in hun waarde begrensd, zowel elk voor zich als per groep. De rekenmethodes van de lineaire programmering houden zich bezig met het optimaliseren van een lineaire functie van een aantal variabelen, waarbij die variabelen nog aan lineaire beperkingen zijn onderworpen.
De theorie van de wiskundige programmering blijft echter geenszins beperkt tot de gevallen, waarbij de optredende relaties lineair zijn.' De programmeringsmethodes zijn wellicht het meest sprekende voorbeeld van methodes, die zonder de aanwezigheid van elektronische rekenmachines geen praktische toepassing hadden kunnen vinden. De Fransen P. Massé en R. Gibrat hebben de gedachtengang van de lineaire programmering op verrassende wijze toegepast
op het nationale probleem van stroomvoorziening. Zij stelden daartoe het probleem als volgt (11). De gezamenlijke Franse centrales moeten in staat zijn tot stroomleverantie met de volgende karakteristieken: gegarandeerd vermogen op een winterdag A,; piekvermogen B,; jaarlijks geleverde energie c,; Uit de volgende types elektrische centrale moet een keuze worden gedaan: - stoomcentrales; - hydroëlektrische centrale zonder reservoir; - hydroëlektrische centrale met klein reservoir; - hydroëlektrische centrale met groot reservoir; - getijdecentrales. Daarbij mochten de investeringen ten hoogste D, bedragen en de kosten moesten worden geminimaliseerd. Had men tot dusver bij de beoordeling van investeringen in centrales te zeer uitsluitend op kosten per kilowattuur gelet, deze beschouwing leverde een juiste analyse van het gehele probleem, waarbij ook de flexibiliteit van bv. een hydroëlektrische centrale met een reservoir beter tot haar recht kwam.
5 . Problemen van wachttijd en volgorde Door prof. Cohen is in de tweede voordracht reeds veel aandacht besteed aan de theorie van de wachttijdproblemen. Het type wachttijd, dat door hem werd besproken, zou men loketwachttijd kunnen noemen. Het is het soort wachttijd, dat een klant ondergaat, die aan een loket bediend wil worden. Voor praktische toepassingen is het prettig, daarnaast te spreken van perronwachttijden, als het gaat om het type wachttijd dat een reiziger op een perron ondervindt. Deze perronwachttijden ontstaan o.a. als een bepaalde service (bv. het ophalen van de interne post in het bedrijf) niet continu, maar slechts met een bepaald interval plaatsvindt. Als gevolg van dit verschijnsel vormt zich een geleidelijk aangroeiende stapel wachtende mensen of dingen, die periodiek weer tot nul wordt teruggebracht. Men kan desgewenst deze wachttijd ook een speciaal geval van loketwachttijd noemen. Als derde type wachttijd kennen wij de complementeringswachttijd. Deze wachttijd ontstaat, als er moet worden gewacht op een ontbrekende component. Bij de uitvoering van een project bv. treedt dit verschijnsel veel op; een bepaald deelkarwei kan pas
beginnen, als één of meer voorgaande deelkanveien gereed zijn. Sedert enkele jaren zijn ter behandeling van deze problemen de netwerkmethodes ter beschikking gekomen; wij hebben hier een gelukkig voorbeeld van eenvoudige, goed hanteerbare methodes. Tot deze netwerkmethodes behoren de kritieke-padmethode en PERT (afkorting van Project Evaluation and Review Technique; oorspronkelijk Program Evaluation Research Task). Wanneer een groot project uit deelkarweien bestaat, zoals het gsval is bij ontwerp en bouw van een wolkenkrabber of bij het Polarisproject van de Amerikaanse marine, zijn het maken van een tijdschema en de voortgangscontrole daarop van oudsher lastige zaken. Steeds weer moeten de plannen aan de wijzigende situatie worden aangepast. De kracht van de netwerkmethode is nu, dat men eerst door middel van een netwerk van pijlen, het pijlendiagram, alle eisen van onderlinge volgorde van de deelkarweien weergeeft, zoals die volgen uit de technische logica van het project zelf. Overwegingen van capaciteitsplanning of ruirnteplanning zijn niet verwerkt in dit pijlendiagram, dat daardoor in de loop van de tijd slechts weinig behoeft te worden gewijzigd. Dit pijlendiagram, waarin elke pijl een deelkarwei voorstelt, geeft reeds een goed inzicht in de structuur van een bepaald project en in de eisen die aan het communicatiesysteem zullen worden gesteld. Wanneer per deelkanvei de benodigde tijd tevoren redelijk nauwkeurig (bekend is, kan worden uitgerekend wat het vroegst mogelijke tijdstip van voltooiing van het gehele project is, gegeven het aanvangstijdstip. Terugrekenend kan men voor elk deelkarwei uitrekenen wanneer h& op zijn laatst gereed moet zijn. Er is nu een aantal karweien, dat in het netwerk op het zg. kritieke pad ligt; als één van deze karweien wordt vertraagd, betekent dat vertraging voor het hele project. De andere deelkarweien hebben een kleinere of grotere speling; de grootte daarvan is een bijzonder nuttig gegeven. Als namelijk een aantal karweien terzelfdertijd dezelfde produktiecapaciteit zou opeisen, is bij de bepaling van de onderlinge volgorde deze toelaatbare speling bruikbaar als prioriteitsindex. De kracht van de netwerkmethode is hiermee echter nog geenszins uitgeput, vooral nie,t als zij door gebruik van computers wordt ondersteund. In de eerste plaats is een duidelijk antwoord mogelijk op de vraag: ,,Als wij het totale project willen versnellen, welke deelkarweien komen dan achtereenvolgens in aanmerking om te worden versneld, en wat kost dus een bepaalde projectversnelling, indien zij op de beste wijze wordt uitge-
voerd?". Daartoe moet als uitgangspunt per deelkarwei uiteraard bekend zijn, wat versnelling kost. De beantwoording van de gestelde vraag leidt tot een probleem van (gewoonlijk) lineaire programmering, doch het antwoord zelf is zeer begrijpelijk te presenteren. Indien tenslotte de duur van elk deelkarwei tevoren niet nauwkeurig kan worden geschat, zoals bij ontwikkelingsarbeid vaak voorkomt, is de vraag niet wat de leverdatum van het project zal zijn, maar wat de kans is, dat een bepaalde leverdatum kan worden gerealiseerd. Wanneer de netwerkmethode in deze zin wordt uitgebreid en niet alleen wordt gebruikt om tevoren een tijdschema te maken maar ook om regelmatig de voortgang te controleren, spreekt men van PERT (10).
6 . Problemen van vervanging In de ene klasse van gevallen gaat het om apparatuur, die met het verstrijken van de tijd duurder in gebruik wordt en dus op een bepaald moment zal moeten worden vervangen. In een andere klasse van gevallen is sprake van componenten met een stochastische levensduur zoals gloeilampen, fluorescentie-buislampen of machine-onderdelen die bezwijken ten gevolge van slijtage of breuk. De vraag is hier, of preventief onderhoud zin heeft, waarbij groepsvervanging als een speciale vorm daarvan kan worden beschouwd.
7 . Voorraaclproblemen Uit de voordracht van prof. Cohen is reeds gebleken, dat sommige voorraadproblemen sterke overeenkomst vertonen met sommige wachttijdproblemen. In vele gevallen is de mathematische formulering vrijwel dezeifde, maar alleen het spraakgebruik verschilt in de praktijk. De Engelsman Stafford Beer schreef eens: ,,When people or things collect in front of a gate or process, we normally ivish they ~vouldnot. The word "queue" mggests sorne form of nzrisarzce. Tlzere are r>kenotnena, however, ~vhichare exactly o f approve. When we approve, we do tkis kind, o f wl~icliwe nori~iall)~ not speak of a "qiietre" but of a stock."
Van uit het gezichtspunt van de klant spreken wij van wachttijd, als de bewerking, waarom het hem gaat, nog niet is gebeurd, en van voorraad als dat wel het geval is. In de praktijk van de voorraadstudies krijgt men te maken met twee vaak optredende situaties, die als volgt kunnen worden onderscheiden.
7.1. De aanvoer naar de voorraad geschiedt intermitterend, stootsgewijs. De afname uit de voorraad vindt meer continu plaats. Van deze situatie zal later een voorbeeld uitgebreid worden besproken, ik wil daarom op dit moment niet verder erop in gaan. 7.2. De aanvoer zowel als de afvoer vinden continu plaats. De afvoer per eenheid van tijd is een stochastische variabele. De vraagstelling is gewoonlijk, op welke wijze de toevoer moet worden geregeld; een probleem dus van meten en regelen. Als voorbeeld mogen een probleem dienen dat eens door prof. dr. H. C . Hamaker is behandeld. Een bepaalde behoefte aan water wordt geleverd uit een reservoir waaraan door een aantal m a t e r p o m p e n via filters water wordt toegevoerd. De vraag naar water vertoont systematische schommelingen gedurende het etmaal (dag-nachteffect) en verder toevallige fluctuaties. Het zou uitvoerbaar zijn, de afname te volgen met de aanvoer; dit zou wel stapsgewijs moeten gebeuren, men kan alleen maar één pomp aan of één pomp af zetten; tussengelegen niveaus zijn niet realiseerbaar. Men zou op die wijze echter vaak moeten schakelen; de filterbelasting zou sterk variëren en men achtte dit nadelig voor de kwaliteit van het water. Het is daarom raadzaam, als regel slechts met een bepaalde frequentie het produktieniveau te herzien op grond van de aanwezige voorraad water. Hoe lager men deze frequentie kiest, hoe minder variatie in de filterbelasting optreedt, maar ook: hoe meer voorraad water er nodig is, dus hoe groter het reservoir moet zijn. Door afweging van voor- en nadelen moeten wij tot de optimale keuze komen. 8. Problemen van optimale capaciteit Men kan deze vraagstukken theoretisch ook zien als een bepaalde klasse voorraadproblemen. Het gaat hier om vraagstukken van het volgende type: hoe groot moet de capaciteit zijn van een hulpafdeling, als de prestatie die wordt gevraagd van dag tot dag varieert en als wij tóch elke dag aan de vraag willen voldoen, en waarbij voorraadvorming (,,achtern de afdeling) of wachttijdvorming (,,voor" de afdeling) niet mogelijk of niet toelaatbaar zijn. Dergelijke vraagstellingen ontmoet men bij de keuze van de omvang van een eigen centrale, een eigen transportbedrijf, een typekamer enz. De dagelijkse vraag z is een stochastische variabele, waarvan wij de frequentieverdeling bepalen. De capaciteit van het bedrijf is de door ons te kiezen onafhankelijk veranderlijke x; de verwachte waarde van de be'ïnvloedbare kosten,
Afb. 2 De optimale capaciteit voor een eenvoudig geval
y moet worden geminimaliseerd (afb. 2). De kosten van het bezitten van een bepaalde capaciteit x bedragen C x per dag. Als op een dag de afname z groter is dan x, moet een capaciteit z - x worden bijgehuurd, wat als kosten meebrengt: E . (z - x). De verwachte waarde van de ,beïnvloedbare kosten bedraagt dus:
De optimale waarde van x wordt bereikt als
of als f (Z) dz
=
C E
- is.
In woorden uitgedrukt: kans op cap. tekort (gearc.) = kosten hebben 1 eenh. cap. kosten huren 1 eenh. cap. Wanneer de kansverdeling- gegeven is, is hiermee rechtstreeks - de waarde van x bepaald. Wij zien hier het beeld van twee kostencomponenten; de ene daalt en de andere stijgt bij toenemende x, zodanig dat ergens Hierbij is gebruik gemaakt van de tussenuitkomsten:
0 dx
dx
7 7
f (z) dz
=
- f (x)
x
x
z f (z) dz = - x f (x)
Afb.
3 De stninp of
,,rubber
O R
een minimum optreedt. Dit beeld komt men bij het operationele onderzoek zo vaak tegen, dat men wel spreekt van ,,the rubber stamp of OR" (afb. 3). Het zal overigens duidelijk zijn, dat in de praktijk de meeste tijd niet gaat zitten in de eigenlijke optimalisatieberekening, maar in het bepalen van de verschillende gegevens, zoals in dit voorbeeld: C, E en f (z). Men kan dan ook het volgende zeggen wat betreft de verschillende fasen van een operationeel onderzoek.
Fasen van een operationeel onderzoek Een operationeel onderzoek, dat is een onderzoek in een concrete situatie naar aanleiding van een conrete probleemstelling, lijkt in vele opzichten treffend op het klassieke organisatie-onderzoek. Dit laatste wordt door Verburg (15) als volgt in fasen verdeeld: - probleemstelling; - introductie; eerste kennismaking met alle betrokkenen; - oriëntatie; de eerste terreinverkenning; - het verzamelen en verwerken van gegevens; - het trekken van conclusies en het formuleren van voorstellen; - invoering en ,,follow-up". Het onderscheid met ,,operationeel onderzoek" ligt vooral in de wezenlijke rol, die daarbij door het wiskundig model wordt gespeeld. De beschouwing, die hierna volgt over de fasen van OR is, behalve op eigen ervaring, grotendeels gebaseerd op boeken van Ackoff e.a. (1)(3), Van der Burg (9) en Zimmerman. Bij het operationele onderzoek kunnen de volgende fasen worden onderscheiden, echter niet worden gesoheiden (zij lopen soms
door elkaar heen en men moet wel eens ,,op en neer werken" of gewoon opnieuw beginnen). 1. Stellen van het probleem. In woorden wordt geformuleerd, wat precies de vraagstelling is. Wat wil men minimaliseren of maximaliseren en aan welke voorwaarden moet daarbij worden voldaan? In dit stadium moet reeds worden overwogen, in hoeverre er zal woraen gesuboptimaliseerd en in hoeverre wisselwerking met andere eenheden binnen of buiten het bedrijf in de beschouwing zal worden betrokken. Dit omvat introductie en origntatie. 2. Opstellen van het wiskundig model. De grootheid, die wij willen optimaliseren, de doelvariabele, wordt opgevat als een functie van een aantal variabelen. Van sommige van deze variabelen kunnen wij het gedrag wel beïnvloeden, van andere niet. Ook moet worden geformuleerd, aan welke beperkende voorwaarden de keuze van de variabelen onderworpen is. In deze fase moet worden overwogen, in hoeverre de verschillende grootheden en hun relaties kunnen worden gekwantificeerd, waarbij op de achtergrond al wel de vraag speelt, welke gegevens beschikbaar zijn resp. zouden kunnen worden verkregen. 3. Verzamelen van gegevens. Soms zijn gegevens 'beschikbaar, soms moeten nog waarnemingen worden verricht. In het bijzonder tijdens deze fase van het onderzoek speelt de statistiek een zeer belangrijke rol. 4. Voorspellen van de te verwachten waarde van de doelvariabele voor de verschillende alternatieve acties. 5. Toetsen van model en/of de gevonden oplossingen. 6 . Beslissing door de leiding; hierbij kunnen ook niet-gekwantificeerde aspecten belangrijk zijn. 7. Invoeren van de gekozen oplossing ,,OR is action research, its objective is not to turn out reports but to improve operations. This cannot be done without becorning directly involved in d e operations" (Ackoff en Rivett (1)). 8. Zorgen voor bewaking van de geldigheid van de oplossing. Als de omstandigheden veranderen, zal de waarde van de oplossing verschuiven; soms zelfs zal een ander model nodig zijn.
Kenmerken van operationeel onderzoek Als kenmerk van operationeel onderzoek kan men aanvoeren (zie Ackoff en Rivett (1)): 1. het gebruik van de wetenschappelijke methode en, als onderdeel daarvan, van het wiskundig model;
2. het streven, te letten op de werking van het systeem als geheel. Echter, ook hier geldt: in de verstandige beperking toont zich de meester; 3. samenwerking van mensen, afkomstig uit verschillende vakgebieden, bv. ingenieurs, economen en wiskundigen. Dit is echter geenszins een kenmerk van OR alleen. Wat is nu eigenlijk operationeel onderzoek? Ter afronding van de voorgaande beschouwingen en voorafgaande aan een voorbeeld wil ik enkele meningen geven over het wezen van het operationele onderzoek. Het ene uiterste wordt wel gegeven door de opvatting: ,,OR is rzothing birt a11 exterwion of the best ind~rstrialengineering practice to irzcllrrle rnore ndi~ar~ced rrzntlierizatical techniques" (Melden).
Het andere extreem wordt gegeven door de opvatting van T. Page, die eens heeft gesteld dat in het toegepaste vlak OR ten aanzien van geesteswetenschappen, sociale wetenschappen, biologie en fysica dezelfde rol vervult als de filosofie in het theoretische vlak. Een definitie van Ackoff ligt tussen deze uitersten in: ,,OR is tlte stz~dyof orgar~izedsysterns to provide decisions ivhich enable these systerns to opernte i11 the i~zosteffective ivay frorn the point of view of the orgaizizatiotz as a ivhole".
Een vroegere definitie van Morse en Kimball luidde: ,,OR is a scieiztific inethode of providiilg execzitive depart~nentswitk a quantitative basis for decisions regarding tlie operntio~ts~irzdertlteir coritrol".
Hoewel wiskunde bij OR een zeer belangrijke en onvervangbare plaats inneemt is OR niet synoniem met wiskunde. Als dat zo was, zou het bedenken van een methode voor lineaire programmering identiek zijn met het uitvoeren van Operations Research en m.i. is dat niet zo, het is wiskundige research. De Duitser Nitsche heeft een bepaald probleem, dat ontstaat bij het ontwerpen en berekenen van een brug, weten te formuleren als een probleem van mathematische programmering. Een brug is echter geen ,,operation", het ontwerpen van een brug is iets anders dan het programmeren van een steenkolentransport. Mathematische programmering is een bijzonder belangrijke techniek die zowel wordt toegepast bij het ontwerpen van een brug als ook bij Operations Research, maar het is niet hetzelfde als OR. Wij moeten ons goed realiseren dat de mooiste wiskundige techniek geen
goed antwoord geeft als het onderzoek naar de ,,operations" zelf fout wordt uitgevoerd. In dit verband spreekt Tukey over conclusies van de statisticus en conclusies van de experimentator. Ik wil dit onderscheid, dat ik essentieel acht, met een voorbeeld verduidelijken. Een vroegere collega van mij maakte eens multimomentopnamen bij de afbouw van een schip. Het ging om de tijdsbesteding van de elektriciens, die bezig waren leidingen aan te leggen in de hutten. Mijn collega had vele waarnemingen gedaan en na enige tijd was de volgende statistische conclusie mogelijk: het aantal malen, dat verliestijd werd waargenomen bedraagt 6% I 1,4% van het totaal aantal waarnemingen (met een betrouwbaarheid van 95%). Mijn collega aarzelde echter sterk hieruit de conclusie te trekken: 6% -L 1,4%van de tijd van de elektricien gaat door oponthouden verloren. Hij besloot tot een controle-experiment. Terwijl hij tijdens de studie de gang langs de hutten altijd was doorgelopen van voor naar achter, maakte hij nu eens een opname lopend van achter naar voren. Het verliespercentage bedroeg significant méér dan 6% -t- 1,4%. Om de een of andere reden, het doet er hier niet toe welke, had men het verlies voor hem willen verbergen. De elektriciens hadden heel gauw zijn normale looprichting ontdekt en hadden elkaar steeds gewaarschuwd door klopsignalen tegen de tussenwanden van de hutten. Het klopsignaal bewoog zich sneller voort dan de waarnemer. Nu ligt onze taak op het gebied van Operations Research niet alleen op het gebied van de zg. statistische conclusies maar het gaat ook om die conclusies van de tweede soort omtrent de ware aard van de verschijnselen. Dat betekent ook, dat wij meer ,,probleemgericht" moeten denken en minder ,,techniekgericht". Niet alleen moeten de wiskundige methoden, die wij gebruiken, verder worden uitgebouwd, er moet ook nog veel meer onderzoek over ,,operationsy'worden gedaan. Tenslotte moeten wij nog de opvatting recht laten wedervaren, dat operationeel onderzoek zou kunnen worden aangeduid als ,,besliskunde" of met een langer, maar m.i. juister, woord: ,,beslissingskunde"; .men gaat daarbij uit van de overweging, dat in de probleemstellingen van alle operationele onderzoeken het gemeenschappelijke element is, dat er een beslissing moet worden genomen (13). Men zou daartegen kunnen inbrengen dat de onderzoeker de beslissing niet neemt, doch slechts (en dan nog ten dele) voorbereidt. De beslissing wordt genomen door de leiding van de ,,operaties" (12).
Literatuur 1. R. L. Ackoff en P. Rivett - A iTzoiiagers guide t o operatioiial resenrch. John Wiley & Sons, New York (1963). 2. A. Kaufmann en R. Faure - Ziivitatioii à Ia reclierclie operatioiie//e. Dunod, Parijs (1963). 3. R. L. Ackoff, E. L. Arnoff en C. W. Churchman - Aii iritroduction to operntioris research. John Wiley & Sons, New York (1957). 4. A. Battersby - A grlide to stock coritrol. Pitman, Londen (1962). 5. J. F. Magee - Prodirctiori plaii~ziiigand i?iveiitoiy coittrol. McGrawHill, Londen (1958). 6. R. W. Metzger - Eleineritary matlrei~~atical progranii~liiig.Chapman and Hall, Londen (1958). 7. R. A. Howard - Dgiinrnic prograinnzz?ig oiid Mcrkov processes. John Wiley & Sons, New York (1960). 8. A. Kaufmann en R. Cruon - Les phéizo~iiènes d'atteilte. Dunod, Parijs (1961). 9. A. R. van der Burg - De beste beslissirig iienieii. Samson, Alphen a/d Rijn (1963). 10. D. G. Malcolm e.a. - J. Operatioiial Res. Soc. Ainer. 7 (1959)(5)646. 11. P. Massé en R. Gibrat - Hfdst. 4 uit: Bowman en Fetter - Analyses o f iiidrrsfrial operatioizs (1959). 12. W. Monhemius - Statist. Neerl. 17 (1963)(4). 13. J. Sittig - Statist. Neerl. 10 (1956)(1)1. 14. H. Theil, J. C. G. Boot en T. Kloek - Voorspelleri en beslisseii. Het Spectrum, Utrecht (1964). 15. R. Verburg - Orgnriisereii ei1 orgaiiisatieoiiderzoek. Stenfert Kroese, Leiden (1959).
Operationeel onderzoek ter voorbereiding van beslissingen - II door prof. ir. W. Monhemius
Optimalisering bij het ,,onderhoudsprobleem" Prof. Cohen besprak reeds de theorie van de wachttijdverdeling voor N machines, die door R monteurs worden bediend. Zoals hij daar reeds stelde, kan het economisch optimale aantal monteurs eenvoudig worden bepaald als men de arbeidslonen en het verlies per improduktief machine-uur kent. Wij zuilen nog even bij dit probleem stilstaan. Er bestaan gelukkig tabellen, bv. de ,,Finite Queuing tables" van L. G. Peck en R. N. Hazelwood l, waarin de uitkomsten van de theorie zijn weergegeven. Wanneer de veronderstellingen gelden, die Cohen maakte, nl. een negatief exponentiële kansverdeling voor looptijd z en voor reparatieduur r, dan kan men uit de genoemde tabellen met de verhouding tussen ,u en (p
+-)11
gemakkelijk het percentage
improduktieve uren van de machine vinden. De vraag is nu echter: wat willen wij precies? Stel, dat wij een groot machinepark hebben en dat om diverse redenen reeds vaststaat, dat R = 1 zal zijn; 1 monteur bedient alleen een aantal machines N. Als nu N klein is t.o.v. het totaal aantal machines kan men de vraag u> stellen, dat die waarde voor N wordt gezocht, waaiibij de kostprijs van het produkt zo laag mogelijk wordt. Voor elke waarde van N kan nu worden uitgerekend: - wat het geproduceerde aantal eenheden per uur is; - wat de totale kosten per uur zijn, voor zover zij worden beïnvloed door de keuze van N (,,mankosten" en ,,machinekosten"); - wat dus de kosten per stuk zijn. Het resultaat is een grafiek van de kosten als functie van N, de ,,rubber stamp of OR". De vraagstelling kan echter ook anders luiden. Het kan zijn, dat het machinepark N machines bedraagt en niet kan worden uitgebreid. De verkoopprijs van de produkten is gegeven. Hoe moet men het aantal monteurs kiezen, om zoveel mogelijk winst te maken? De vraag kan ook als volgt luiden: een onderdelen l
Uitg. John Wiley & Sons, New York (1958).
producerende afdeling in een groot bedrijf moet een bepaalde produktie halen. Hoe moet men dit tegen de laagste kosten doen? Heeft het bv. zin de monteurs te verdelen over een dag- en een nachtploeg? Ook kunnen zich situaties voordoen, waarbij de eis eenvoudig luidt: de wachttijd voor de machine mag maar in 0,1% van de gevallen meer dan X,,,. bedragen. Uit het voorgaande blijkt, dat de probleemstelling nog vele moeilijkheden kan bieden. Het is een gunstige omstandigheid, dat de uitkomsten in de tabellen betrekkelijk ongevoelig zijn voor de gemaakte veronderstellingen t.a.v. de kansverdelingen. Wanneer ons doel is, de wachttijden van de ,,machines7' te verlagen, moeten wij ons realiseren dat er soms meer middelen zijn om dat te doen, dan alleen verhoging van het aantal monteurs R. Om slechts enkele middelen als voorbeeld te noemen: - verlaging van het aantal storingen; - verkorten van de reparatieduur; - preventief onderhoud volgens een bepaald schema; - indien mogelijk meer monteurs concentreren op één karwei, zolang er monteurs onbezet zijn; - voorrang aan de kleine reparaties; tijdelijk uitbreiden van het aantal monteurs als de wachttijd te groot wordt. Voorraadbeheer van reserve-onderdelen: een voorbeeld van operationeel onderzoek
Inleiding Op het gebied van het voorraadbeheer heeft O.R. in het bedrijfsleven veel nuttig werk gedaan. Een andere reden om speciaal dit onderwerp als voorbeeld te nemen is de overweging, dat men haast in elk bedrijf te maken zal hebben met reserve-onderdelen voor de produktiemachines. Een groot deel van het nu volgende is ontleend aan een voordracht, die ir. A. Bouwmeester heeft gehouden op 17 december 1963 voor de Sectie Operationele Research van de Vereniging voor Statistiek. Verder is gebruik gemaakt van studies door ir. H. Bosch (Unilever) (l), Boothroyd en Tonzlinso~z(National Coal Board in Engeland) (2) en Shatinty en Van Court Hare (T.W.A.)(4). Probleemstelling In elk bedrijf, waar machines voor de produktie worden gebruikt,
zullen die machines een aantal onderdelen bevatten, die min of meer geregeld moeten worden vervangen. Men kan daarbij desgewenst onderscheid maken tussen onderdelen, die niet meer voldoen ten gevolge van slijtage, en onderdelen, die het door breuk opgeven. Door een goed georganiseerd preventief onderhoud is het mogelijk sommige onderdelen, vooral de slijtage-onderdelen, te vervangen voordat zij aanleiding geven tot machinestoring. Het is eohter nóch mogdijk, nóch economisoh verantwoord d e onderdelen te vervangen voordat zij aanleiding geven tot onverwachte storing. E r blijft dus een vraag naar onderdelen over, waarvan van geval tot geval geen exacte voorspelling valt te maken. Ook de hoeveelheid onderdelen, die voor een eventueel preventief onderhoud nodig is, is trouwens niet op lange termijn te voorspellen. Daar de levertijd van dergelijke onderdelen gewoonlijk vrij lang is (één of meer maanden) zal men dus altijd een voorraad hebben, waamit voor het onderhoud en de reparatie kan worden geput. De vraagstelling is nu: welk systeem moet worden gebruikt, om deze voorraad te beheren. Dit systeem moet antwoord geven op twee vragen: a. wanneer moet worden besteld? b. áls men bestelt, hoevéél moet er dan worden besteld? De doelvariabele is de som van een aantal kosten. Wij willen deze kosten zo laag mogelijk houden. In deze fase van het onderzoek wordt eerst de bestaande situatie onderzooht. Wij willen weten, hoe geraffineerd het huidige systeem al is en wij zouden trouwens geen nieuw systeem kunnen invoeren zonder kennis van het bestaande. Onderzoek In het door Bouwmeester lbestudeerde geval gebruikte men een systeem, waarbij periodiek, met een bepaald constant interval, alle voorraadstanden werden nagelopen en waarbij men dan besliste over al dan niet bestellen. Het interval bedroeg enkele maanden. Er bestond geen bepaald systeem ter beantwoording van de vragen: moet er al worden besteld of niet? - m ja, hoeveel moet er worden besteld? De Macht was, dat de voorraden hoog waren, maar dat men geen norm had om te weten of zij té hoog waren, en dat er toch vaak produktiestagnaties optraden door gebrek aan onderdelen. Dit wijst op een slecht uitgebalanceerde voorraad.
-
omzet
I
Afb. 1
100 perc. van de codenummers
/ eu m. af name
geSc
bat/'
/,
verbrY'
Afb. 2 Ciimulafief beeld van de afname tijd-
Een inventarisatie van het assortiment leverde de frequentieverdeling van het jaarverbruik in aantal stuks. Ruim de .helft van het aantal artikelen heeft een omzet van minder dan 10 stuks per jaar, nog eens 19% heeft een omzet tussen 10 en 20 stuks per jaar. Gaat men de jaaromzet in geld uitdrukken, dan zou een soortgelijk beeld ontstaan. Dit heeft echter ook tot gevolg, dat de 20% codenummers (artikelen) met de hoogste omzet samen reeds globaal 80% van de totale omzet vertegenwoordigen. Dit is een wetmatigheid, die vaak blijkt te gelden, al is de curve wel eens wat meer of wat minder bol (zie afb. 1). Ik vestig de aandacht ook reeds op het verloop van de afname uit het centraal magazijn, hoewel het systematisch onderzoek daarnaar wat later in hst verhaal past (afb. 2). Wat door de afdeling bedrijfsmechanisatie uit het centraal magazijn wordt gehaald, is niet altijd direct voor reparatie
l
leverancier 11: gevraagd
werketij k
', Levertijd i n m a a n d e n
A f b . 3 Frequeirtieverdelingen van de levertijd
of onderhoud bestemd. De opzichters hebben van sommige onderdelen zelf een grijpvoorraadje. Zij hebben dit vooral voor die artikelen, waarvan de prijs per stuk laag en de omzet hoog is. Het feit, dat deze grijpvoorraden bestaan en worden aangevuld, leidt tot een afnameverloop als aangegeven in afb. 2. In afb. 2 kan men ook zien, dat de geschatte afname in dit geval veel te hoog lag. Het bleek, dat de opzichters tot deze hoge schattingen welbewust hun toevlucht hadden gezocht, toen de bedrijfsleiding trachtte de voorraad, in maanden afname uitgedrukt, te verlagen. Uit afb. 3 wordt ten dele duidelijk, waarom men toch zo vaak onderdelen te kort kwam: de levertijden vertoonden grote spreiding, d.w.z. grote spreiding ten opzichte van de gevraagde en beloofde levertijden. Dat is overigens maar voor één leverancier het geval. Een dergelijk onderzoek achteraf is altijd lastig; elke levering heeft haar eigen historie. Het is niet juist, te volstaan met zomaar een frequentieverdeling van in het verleden gemeten levertijden om dan daarna te rekenen alsof elke levertijd een onafhankelijke trekking uit die verdeling zou zijn. Om twee redenen is een dergelijke handelwijze gevaarlijk: - de levertijd is een functie van een aantal gegevens, die voor elk artikel tevoren bekend zijn; - het kan ook wel eens zijn, dat korte levertijden juist gevallen zijn, waarin op verzoek van de klant (chasseren!) de levertijd is verkort; daardoor krijgt de frequentieverdeling ook aan de hoge kant een staart. Er is daarom contact opgenomen met de leveranciers om tot nieuwe, betere en duidelijke afspraken over de levertijd te komen. In afb. 4 wordt het voorraadverloop geschetst van een artikel, dat vele lotgevallen had. Terwijl een bestelling liep, en zelfs al een tweede was geplaatst, heeft de magazijnbediende een grote
voorraad
-.
---I
Afb. 4
Voorbeeld voorraadverloop
I
r
I
tijd
bestelling naar Spanje weggezonden. Daardoor raakte men buiten voorraad. Men had in dit geval niet direct de hele lbesteliing mogen uitleveren. Even later ontstonden moeilijkheden, doordat een deel van de aanvullingsbestelling bij binnenkomst werd afgekeurd. Doordat deze onderdelen later toch nog werden goedgekeurd en doordat een zending binnenkwam voor de beloofde leverdatum was er na enige tijd meer dan voldoende voorraad. Tenslotte bleek een bepaalde post foutief te zijn afgeboekt, er bleek bij controle meer in het magazijn te liggen dan op de kaart stond.
@,Q) systeem Er moet nu een bepaalde systematiek worden gekozen. Als men een eenvoudig systeem wil hebben, is er in principe keus uit 4 mogelijkheden (tabel 1). Bij een systeem met periodieke bestsllingen is de reactiesnelheid minder groot: men moet altijd eerst wachten op de eerstvolgende bestelgelegenheid; dan pas bemerkt men, wat er is gebeurd. Daarom is hier een systeem met doorlopende bestelmogelijkheid gekozen. Dit geeft tevens een betere spreiding van TABEL 1 Bestelserie onafhankelijk van hangt af van voorraadvoorraadhoogte op hoogte op moment van moment van bestellen bestellen mogelijkheid periodiek tot doen van bestellingen doorlopend
(s,Q) @,Q)
(s,S) (BJ)
I --c tijd
Afb. 5 Grondvorm van de (B,Q) regel. Ontl. aan (5) technische voorraad, - - - - - economische voorraad, t = tijd -t
de arbeid, verbonden aan het plaatsen van bestellingen. Aangezien de afname betrekkelijk continu is en maar weinig grote stoten vertoont, is in de praktijk het verschil tussen de systemen in de linker en rechter kolom niet groot. Het argument, dat een vaste seriegrootte voor de leverancier een besparing betekent bij calculatie en verdere administratie, gaf daarom de doorslag. Men koos daarom een (B,Q) systeem. De grondvorm van de (B,Q)~beslissingsregelis: zodra in een magazijn de voorraad van een bepaald artikel het tevoren vastgestelde niveau B onderschrijdt, wordt een hoeveel= heid Q bijbesteld. Deze hoeveelheid Q is niet afhankelijk van de voorraadhoogte op het moment van bestellen. p$$! c-a L
.
De aanduiding B komt van ,,bestelniveau", Q komt van ,,quantiteit". In de meeste gevailen blijft voor een bepaald artikel de serie grootte Q enige tijd onveranderd, daar slechts periodiek de te gebruiken seriegroottes opnieuw worden
J ' dI
.TL
ri; i 2 JF ..-C;
L?
voorraad-
niveau
I
Afb. 6 Ook als de techtiische voorraad nooit boven B uitkomt, werkt een juist gehanteerd (B,Q) systeem toch bevredigend. Oritl. aan (5) technische voorraad, - - - - - - economiscl~evoort = levertijd, raad voorraadniveau
n
tijd
Afb. 7 Een overigens goed futictiot1erend systeem kan otitsporeri, als men alleeti hestelt indien de technisclle voorraad B doorsnijdt. Ontl. aan (5)
boven het bestelniveau uitkomt (afb. 6). In het geschetste geval lopen soms twee orders tegelijk. Werkt men echter niet op deze wijze, dan kan men voor onverwachte verrassingen komen te staan (afb. 7). Er zij dus uitdrukkelijk op gewezen, dat het in een @,Q)-systeem heel goed mogelijk is, een nieuwe order te plaatsen (indien nodig zelfs meerdere) voordat de vorige is gearriveerd. Volkomen ten onrechte meent men soms, dat dit niet mogelijk is, waardoor men dan tot de volledig onjuiste stelling komt, dat levertijd en bestelserie sterk gekoppeld zou zijn. Berekening B en Q Nu eenmaal het (B,Q) systeem is gekozen, rest ons nog, aan te geven hoe voor elk artikel apart de B en Q moeten worden bepaald. Eigenlijk zou men de jaarlijkse kosten C moeten schrijven als SC SC C = f(B,Q), om daarna - = O te stellen. SQ Het blijkt, dat men bij benadering voor een eerste aanpak wel de
'm
volgende oplossing mag gebruiken, waarbij B en Q onafhankelijk van elkaar bepaald worden. Ten aanzien van de bepaling van Q* geldt het volgende. Twee kostensoorten spelen hierbij een rol, namelijk: a. de voorraadkosten; dit zijn de kosten verbonden aan het hebben van voorraden. Deze kosten nemen toe naarmate de serie (Q) toeneemt en omgekeerd; b. de orderkosten; dit zijn de kosten verbonden aan het voorbereiden van de serie. Deze kosten zijn per produkt omgekeerd evenredig met de serie. Behalve deze twee kostensoorten is, bij het bepalen van de optimale seriegrootte, ook het ve~bruikper tijdseenheid van belang. In de formule van Camp komen dan ook de volgende factoren voor:
z
ci (Inventory costs)
F (Fixed costs) D (Demand)
Q (Quantis) Q*
= de
voorraadkosten per stuk per tijdseenheid; = de orderkosten per fabricageserie of bestelling; = de vraag naar de hoeveelheid produkt per tijdseenheid; = de seriegrootte, d.i. de hoeveelheid die per aanvullingsorder wordt geproduceerd of geleverd; = de optimale seriegrootte; hierbij is de som van voorraad- en orderkosten per tijdseenheid minimaal.
Wij krijgen nu te maken met twee kostencomponenten: VOORRAADKOSTEN
De gemiddelde voorraad is %Q, de voorraadkosten per stuk per jaar zijn, c , de voorraadkosten zijn dus per jaar % &ci. ORDERKOSTEN
D Per jaar bedraagt het aantal bestellingen-; de kosten per bestelD l i n ~zijn F, dus de orderkosten zijn per jaar -. F. Q
Q
De som van beiden is:
D Ctot= - F
Q
- ++Q .
Q moet zó worden gekozen dat C,,, minimaal is; deze waarde van C, ,, wordt bereikt wanneer:
Afb. 8
Q* =
11
Tabel seriegrootte
D ' F (formule van Camp, 1922 c2
Voor elk artikel moeten nu D, F en ciworden bepaald. Door de loop van een order na te gaan kan door optelling van kosten het bedrag F worden bepaald. Het bedrag ci moet worden gesplitst in: - ruimte; - rentabiliteit, vereist van het geïnvesteerde kapitaal. Gewoonlijk kan een bedrijf niet ongelimiteerd geld lenen. Dat betekent, dat het kapitaal, dat nu in voorraden wordt geïnvesteerd, aan een alternatief gebruik wordt onthouden; risico op incourant worden. In afb. 8 wordt getoond, hoe de tabel voor de seriegrootte voor deze situatie eruit zag. Langs de bovenrand is als ingang uitgezet
-
K100
, waarbij K,,,, inkoopsprijs per 100 stuks, ontdaan van E de ,,orderkosten". Langs de kantlijn is als ingang uitgezet: D, de jaarlijkse afname, in aantal stuks. Een groot aantal van de artikelen blijkt te liggen in een gebied waar volgens de formule Q hoger dan D zou meten zijn. Om allerlei redenen besloot men, geen waarden van Q hoger dan D toe te laten. Dat betekent, dat 70% van de artikelen, maar een veel kleiner deel van de omzet (immers de artikelen met lage omzet) volgens de vuistregel Q* = D wordt besteld. Dit minimum wordt gevonden door
Ctot =
D
-F Q
tiëren naar Q en het resultaat te stellen aan nul: dCtot
dQ
DF
Q, + + c t
=0 .
+fQ
ci
te differen-
opbouw l e v e r t i j d (in maanden )
Cate-
Afb. 9 Tabel levertijd
Hoe wordt nu B bepaald? Daartoe moeten in de eerste plaats duidelijke afspraken over de levertijd worden gemaakt. In overleg met de leverancier werd de tabel opgesteld, die in afb. 9 is weergegeven. De voornaamste variabele is hier het aantal bewerkingen van een onderdeel. Omdat niet d e bewerkingen over één kam kunnen worden geschoren, rekent men met ,,bewerkingsequivalenten". Hoe meer bewerkingsequivalenten, hoe hoger de levertijd. Voorts is het van belang, welk materiaal nodig is. Speciaal materiaal 'vraagt meer tijd. De levertijd, waarover men het als gegarandeerde levertijd is eens geworden, bestaat uit 3 componenten: - een voorbereidingstijd in de administratieve sfeer, eventueel met toeslag voor wachten op speciaal materiaal; - een periode, afhankelijk van het aantal bewerkingsequivalenten; - 1 maand, omdat de orders slechts 1 maal per maand worden doorgestuurd. Het is voor de leverancier voordelig, de orders van 1 afnemer in maandelijkse zendingen te ontvangen en niet continu. Toch is het, met het oog op de werkverdeling bij de afnemer, wel zinvol elke dag aanvullingsorders te creëren. Het bestelniveau B moet nu zo groot zijn, dat de vraag gedurende de levertijd zelden groter dan B is. Echter, hoe vaak is ,,zeldenm? Wij zullen daarop straks nader ingaan, na eerst de situatie te hebben geanalyseerd. Het is goed, hier de nadruk erop te leggen dat het gehele probleem van de bepaling van de veiligheidsvoorraad ontstaat door de combinatie van vertraging (in het aankomen van de bestelling) en onzekerheid (t.a.v. de afname). Als bestelniveau moet bij een (B,Q)-systeem worden genomen: B = verwachte afname gedurende de levertijd veiligheidsvoorraad = redelijkerwijs maximaal te verwachten afname gedurende de 1evertJd.
+
Afb. 10 Verband tussen bestelniveau en veiligheidsvoorraad bij Ti:bestellen, bij Tz:bestelling komt binnen; g = kans op een bepaalde afname. Ontl. aan (5) A
B=t.d+b
of: B
=a
*
d t , waarin
A
d = verwachte dagafname; b = veiligheidsvoorraad; a = veiligheidsfactor; t = levertijd. Deze situatie kan grafisoh worden voorgesteld (afb. 10). Deze afbeelding toont, hoe het voorraadverloop kan zijn gedurende de levertijd. De veiíigheidsvoorraad is aanwezig om de fluctuaties in de afname gedurende de levertijd op te vangen. In de rechterhelft van afb. 10 is de waarschijnlijkheidsverdeling getekend van de afname gedurende de levertijd. Incidenteel zal de vraag gedurende de levertijd zelfs groter kunnen zijn dan de verwachte vraag plus de veiligheidsvoorraad. In zo'n geval is de voorraad uitgeput alvorens de bestelling arriveert en men raakt buiten voorraad. Per keer, dat men een aanvullingsbestelling doet, is er een bepaalde kans dat men buiten voorraad raakt; deze kans wordt aangegeven door het gearceerde deel van de kansverdeling. Het 'is duidelijk dat: - hoe groter men B kiest, hoe groter b wordt; - hoe groter b en B worden, hoe kleiner de kans z op buiten voorraad wordt. Met B, zal verder worden aangeduid: het bestelniveau dat behoort bij een kans z. Uit het voorgaande volgt, dat drie soorten informatie nodig zijn om bestelniveaus te kunnen bepalen:
1. de frequentieverdeling van de verschillen tussen werkelijke en verwachte afname gedurende de levertijd; 2. het toegestane risico van buiten voorraad raken; 3. de verwachte gemiddelde afname. De verwachte gemiddelde afname te bepalen, is een moeilijke opgave. Voor het gegeven probleem was de schatting van de opzichters van de bedrijfsmechanisatie de beste richtlijn, nadat hun de werking van het systeem was uitgelegd; ook de cijfers uit het verleden moeten voor elk artikel op overzichtelijke wijze ter beschikking staan. Typerend is, dat men ook bij de National Coal Board stelt: ,,The prediction o f detnand is irltir?zately the responsibility o f the people 11~110operate tlie stock cotrtrol systenz; we have not offered a rnecl~anicalset of rules wlrich wil1 replace the exercise of tlieir discretion. But ive advise tkei?z to zrse past dernand over as long a period as possible, niaking nIlon>ancefor technica1 changes, for zrsage pzirely for tnodifying equiprnetzt, atrd for trends in tlie parts - per nrachiize record wlzich is Icept in ~ n o s central t ~vorkshops.Tilis inetlrod is one of relying on the stock control staff to tnake good estirnates by poo!itzg, in an uildefitred way, estimate frortz different solrrces".
In de studie bij T.W.A. wordt wel beschreven, hoe men daar voorspellingen maakt op grond van het aantal vliegtuiglandingen; het gaat daar waarschijnlijk om dure onderdelen en in zo'n geval loont een nog betere voorspelling de moeite. Als risico van buiten voorraad raken heeft men in de door Bouwmeester beschreven situatie eenvoudig voor alle artikelen eenzelfde bepaalde kans op buiten voorraad raken vastgesteld. Er is, wat dit betreft, dus geen optimum berekend, wel heeft de bedrijfsleiding de benodigde investering afgewogen tegen het jaarlijks totaal aantal malen buiten voorraad raken. Als theoretisch frequentieverdeling voor de afname bleek een gammaverdeling redelijk te voldoen. Om deze verdeling te karakteriseren, zijn gemiddelde en spreiding nodig. Over de bepaling van het gemiddelde spraken wij reeds. Uit een onderzoek bleek, dat tussen gemiddelde en spreiding voldoende samenhang bestond om de standaarddeviaties te mogen schrijven als (afb. 11): S=C.XP. Een tabel voor het bestelniveau hoeft nu alleen maar als ingangen te hebben: - de levertijd t in maanden. - de vraag D in aantal stuks per jaar.
standaard afwijking l. .-b-----
s
verband tussen gemiddelde en spreiding
/ I
e
100
Oemidd, verbruik per maand ( T )----r
Resumerend heeft men nu een @,Q) systeem, dat als volgt werkt. leveren via een tabel de optimale serie Q* waarF bij 70% van de artikelen als wistrègel Q* = D vindt. - het aantal bewerkingsequivalenten en het uitgangsmateriaal leveren via een tabel de gegarandeerde t. D en t leveren via een tabel B. Om de geldigheid van het systeem te bewaken is het vooral nodig: - de ahame per artikel goed te volgen; regelmatig moet D worden herzien; - de levertijden te bewaken; dit gebeurt met een soort kruisjeskaart, zoals men die ook in de statistische kwaliteitscontrole wel kent. -Den-
-
Men verwacht van het ingevoerde systeem de volgende resultaten, die ten dele al zijn gerealiseerd. VOOR DE LEVERANCIER
- Besparing op calculatie en voorbereidingskosten, doordat per artikel de serie enige tijd constant blijft.
- Meer gelijkmatige bezetting. - Mogelijkheid om desgewenst
in geval van capaciteitsoverschot of tekort met het systeem te spelen, bv. door tijdelijk seriegroottes te verkleinen of bestelniveaus te verhogen.
VOOR DE AFNEMER
- Betrouwbare levertijden. - Betere service door het magazijn; daardoor een hoger rendement van de machines. - Voorraadverlaging.
De zo beschreven oplossing mag stellig nog niet worden beschreven als een optimale oplossing in die zin, dat de totale kosten zijn geminimaliseerd. Wel is de situatie: a. bestuurbaar geworden; b. in de richting van het optimum verschoven. Of een meer diepgaande studie verantwoord is, hangt ook af van de vraag of er voor de operationele onderzoekers nog ander werk ligt te wachten, waarvan men in korte tijd een hoge opbrengst resp. besparing verwacht. Mede lettend op de studies bij Unilever en de National Coal Board kan over een eventuele verdieping van de studie het volgende worden gezegd. In de studie van Bosch (1) wordt wel het bestelniveau bepaald, door de kosten van buiten voorraad raken af te wegen tegen de kosten van het hebben van veiligheidsvoorraad. Daarbij wordt gesteld, dat buiten voorraad raken per keer een bepaald bedrag kost, dat afhangt van het belang van het onderdeel. Bosch werkt echter met eenzelfde gemiddelde bedrag aan bestel- en instelkosten voor alle artikelen. De tabel wordt anders te gecompliceerd. Ook de mensen van de Nat. Coal Board leggen terecht grote nadruk op de eenvoud van het systeem; zij gebruiken om die reden de gemiddelde afname als enige bepalende factor voor de spreiding, zoals ook Bouwmeester doet:
,,. . . at rzo point do we ask people irsiilg standard stock coiltrol tables to estirnate m ~ ypara~netero f tke d e i ~ ~ a ndistribzction d ofher than the Inean. O ~ i rexperience in iesting a n7etl7od ~ohichinclzrded a second paramter indicated that is ~vozrldtake too rnzrch tirpie to be acceptable to rniddle i?~ai~ager~leilt and be too coi77plicated for tlfe staff who actually zwed the nzethods".
In de eerste ,,ronde7' van een dergelijk onderzoek is soms ook in feite niet de opgave: minimaliseer de totale kosten, maar wel: ontwerp een systeem, dat eenvoudig hanteerbaar is en waarmee de voorraad op een gewenst niveau kan worden ingesteld, zodanig dat de som van bestelkosten, voorraadkosten en stock-outkosten in de buurt van een minimum ligt.
Meer compleet wiskundig model Wij zullen tot slot het wiskundig model beschouwen, zoals dat bij de National Coal Board wordt gehanteerd en dat men daar ook nog in een uitgebreidere versie heeft gehanteerd.
De veronderstellingen, waarvan wij uitgaan, zijn:
- het bestelsysteem is een (B,Q) systeem;
- klantenorders, die niet uit voorraad kunnen worden
geleverd, moeten alsnog worden geleverd zodra er weer voorraad is; - de levertijd L is een constante (L in jaren); - elke klantenorder is slechts een order voor 1 exemplaar; - het houden van een gemiddelde voorraad van 1 produkt kost per jaar C;; - kosten van buiten voorraad raken bestaan uit twee delen: R per produkt, dat niet uit voorraad kon worden geleverd; W per gemiddelde achterstand van 1 produkt per jaar; - de kans op een afname van r produkten gedurende L is A@). De jaarlijks beïnvloedbare kosten bestaan nu uit: - bestelkosten; - voorraadkosten; - stock-outkosten. Als tevoren zullen wij nog de volgende notatie gebruiken: D = jaarlijkse afname in stuks; F = kosten van het plaatsen van een bestelling. Bestelkosten Deze bedragcn
D -
Q
x
F
.
Stockoutkosten W f(B,Q), waarin: Deze bedragen R.D.g (B,Q) g(B,Q) = de kans, dat een willekeurige klantenorder niet uit voorraad kan worden grleverd; f(B,Q) = de verwachte hoogte van de negatieve voorraad op een willekeurig moment.
+
Voorrnadkosten Deze bedragen C; . h(B,Q), waarin h(B,Q) = verwachte hoogte van de voorraad op een willekeurig moment. Het lastige werk is uiteraard de berekening van f(B,Q), g(B,Q) en h(B,Q). Berekening g(B,Q) Men kan zich de tijd verdeeld denken in cycli. Elke cyclus begint op het tijdstip, waarop een bestelling Q wordt geplaatst omdat de economische voorraad het niveau B heeft bereikt. De duur van een cyclus is dus precies de tijd, die nodig is om een serie van Q te verbruiken; gedurende elke cyclus worden er Q produkten
afgenomen. Wij beschouwen n produkt nummer B + r van zo'n cyclus en vragen ons af: wat is de kans, dat nummer B + r niet uit voorraad kan worden geleverd. Wij laten r lopen van 1 tot en met Q en gebruiken dus eigenlijk een nieuwe cyclus, die een afstand B verschoven ligt t.o.v. de vorige. Als nu de afname gedurende L groter is dan B + r of daaraan gelijk, wordt het produkt nummer (B+r) niet uit voorraad geleverd. De kans hierop is: %n A (n) B+ r
.
Over de hele cyclus geldt dus:
Nu kan men schrijven
Door dit te substitueren en de zo verkregen vorm uit te schrijven of uitgeschreven te denken komt men tot de conclusie:
Berekening h(B,Q) Wij stelden: h(B,Q) = de verwachte voorraad op een willekeurig moment. Om de verwachte technische voorraad te bepalen, gaan wij uit van de economische voorraad. Van de economische voorraad weten wij, dat die een rechthoekige verdeling zal vol1 tot en met M Q zal, gen: elk voorraadniveau van M gemiddeld genomen, even lang voorkomen. Op een willekeurig moment T, zij de economische voorraad aangeduid met n. Hoe groot de technische voorraad is, weten wij niet; er zouden 1 of 2 orders onderweg kunnen zij, maar misschien is dat ook niet het geval. Wij beschouwen nu echter de technische voorraad, een periode L later. Wij weten zeker, dat alle bestellingen die eventueel onderweg waren, inmiddels rnoeten zijn binnengekomen. Er kan echter geen enkele bestelling zijn binnengekomen, die op T, nog niet was geplaatst. De technische voorraad op tijdstip T, L bedraagt dus max. (rt - r, o ) ~waar, bij r = afname gedurende L. De mathematische verwachting L is daarom: van de voorraad ten tijde T,,
+
+
+
+
Max (n-r, o), d.w.z. de grootste van de twee waarden n-r en o.
fl
Xr
(11
o
-r)
A (r)
Daaruit volgt, dat in het algemeen de verwachte waarde van de technische voorraad bedraagt: 1 B+Q n X ~ I Xr (11-r) A (r) 1 (B, Q) = Q B.1 o Op soortgelijke wijze als de vorige vorm kan ook deze formule worden uitgewerkt. Wij vinden tenslotte:
Berekening f(B,Q) Mat f(B,Q) hadden wij aangegeven: de verwachte hoogte van de negatieve voorraad op een willekeurig moment. Volgens de boven ontwikkelde gedachtengang kan men stellen: f(B,Q)=-
1 Q
M + Q
X
m
X
&I+l , , + l
(r-n)
A(r)
.
Dit kan worden herleid tot
De jaarlijkse beïnvloedbare kosten, die kunnen worden geschreven als:
zijn nu langs numerieke weg met behulp van een elektronische rekenmachine eenvoudig te bepalen, zodra de verschillende constanten en de functie A(r) bekend zijn. De rekenmachine kan zó worden geprogrammeerd, dat direct de optimale B en Q worden geleverd. Overeenkomst met telefonieprobleem De overeenkomst met het telefonieprobleem, zoals prof. Cohen die behandelde, treedt op voor systemen waarbij Q = 1 is. Literatuur
1. H. Bosch - Sigrnn (1961)(1)9.
2. H. Boothroyd en R. C. Todinson - Operatiorial Res. Qziart. 14(1963) (3)317. 3. W. Lampkin en A. D. J. Flowerdew - Opercrtiorral Res. Quart. 14 (1963)(3)263. 4. J. A. Shaunty en Van Court Hare - Mariage111ent Techlrol. (1960) (12)66. 5. R. N. van Hees en W. Monhemius - Produktiebestlrring era voorraadbeheer I . Centrex, Eindhoven (1964).
INHOUD . . . . . . . . . . . . . . . Algemene inleiding, door prof. W. F. J. M. Krrtl . . . . St,atistieken proefopzet, door H. de Jonge . . . , . . Woord vooraf
3
7 11
Waarschijnlijkheidsberekening in techniek en bedrijfsvoering, door prof. dr. ir. J . W . Cohen . . . . . . . 35 Toepassing van statistische methoden bij het bacteriologisch onderzoek, door ir. K. W. H . Leeflang . , . . . . 56 Operationeel onderzoek ter voorbereiding van beslissingen, door prof. ir. W. Monhemius - deel I . . . . . . . 83 Operationeel onderzoek ter voorbereiding van beslissingen, . . . 97 door prof. ir. W. Monhemius - deel I1 . .
.