ONDER DE LOEP
Met de krant in de hand… Inhoud 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Inleiding Kijken of lezen, misleid door de grafische voorstelling Staafdiagram of histogram Interpretatie van cijfermateriaal Afhankelijkheid en onafhankelijkheid Valse positieven Samenhang en oorzakelijk verband Gedurfde extrapolatie Expontiële groei Een cosinusfunctie Een volume berekenen
1. Inleiding Een aantal jaar geleden verscheen een boekje met de titel ‘Een wiskundige leest de krant’ ([5]). Deze loep kun je opvatten als ‘Een wiskundeleraar leert zijn leerlingen de krant lezen’. We hebben in de afgelopen jaren een aantal interessante krantenartikels uitgeknipt en bijgehouden. We hebben daarrond nu opdrachten gemaakt, tot ‘lering en vermaak’ van de leerlingen. Wiskunde koppelen aan krantenartikels is inderdaad een manier om het nuttige aan het aangename te paren (waarbij een enkele keer het aangename overheerst...): het is niet alleen een leuk en motiverend middel om een wiskundig onderwerp aan te kaarten, maar het maakt ook zichtbaar dat kennis van wiskunde en statistiek nuttig is om volwaardig deel te nemen aan het maatschappelijke leven, ook buiten je beroep. Wiskunde en statistiek kennen is een meerwaarde om goed te begrijpen wat in de krant staat en er kritisch mee om te gaan. Natuurlijk houden we hier geen pleidooi om in elke wiskundeles te vertrekken van een krantenartikel. Lang niet alle inhouden lenen zich hiertoe. Er zijn bovendien ook heel wat andere redenen om wiskunde en statistiek te leren dan dat het nuttig is voor ‘het dagelijkse leven’. We hebben in de voorgaande jaren nu en dan al eens een bijdrage gepubliceerd die gebaseerd was op een krantenartikel, bv. [2] over een toepassing van kansrekening bij erfelijke ziekten. Ook nu beginnen we de loep met een aantal artikels die aansluiten bij allerlei onderwerpen uit de kansrekening en statistiek. De artikels en bijbehorende werkteksten kun je gebruiken in de tweede of derde graad. We gaan daarna over naar artikels die betrekking hebben op functies en analyse. We hadden ook een artikel in petto dat aansluit bij een fascinerend meetkundige onderwerp, namelijk nomogrammen. De uitwerking daarvan is echter zo lang geworden dat we beslist hebben om een van de volgende loeps aan dit onderwerp te wijden. Daar hoor je later dus nog van.
14
onder de loep
We hebben de krantenartikels die we gebruiken uiteraard opgenomen in deze loep. Je kunt ze verder ook downloaden van onze website (zie bij Werkteksten e.d.). Je vindt ze daar in tekstformaat zodat je ze in je eigen documenten kunt integreren. We stellen ook een versie ter beschikking die er meer ‘krantachtig’ uitziet: een pdf-versie van de volledige krantenpagina of een ingescande versie van het papieren artikel. In sommige gevallen is er ook nog wat extra materiaal voorzien.
2. Kijken of lezen, misleid door de grafische voorstelling In kranten en tijdschriften worden artikels vaak geïllustreerd met grafische voorstellingen. Dit is logisch omdat grafische informatie sneller de aandacht trekt dan tekstuele of cijferinformatie. Een grafiek geeft een meer gesynthetiseerd beeld dan een tabel zodat het interpreteren en het herkennen van een tendens of extrapolatie een stuk eenvoudiger wordt. In de volgende voorbeelden (zie [4]) kun je merken dat het nodig is om met enige voorzichtigheid naar zulke voorstellingen te kijken. Auteurs maken hun grafische voorstellingen niet altijd even zorgvuldig.
15
Uitwiskeling 23/4 (herfst 2007)
Kijken of lezen? De onderstaande afbeelding komt uit de Duitse krant Die Zeit. Rechts vind je de vertaling van de Duitse tekst.
Geld terug Mening van de Duitse burger over een vervroegde belastinghervorming Verkiezen de inwoners een vervroegde uitvoering van de derde stap van de belastinghervorming van 2005 naar 2004?
Bij een vervroegde belastinghervorming moet de staat dan hogere schulden maken
belastingvoordelen voor ondernemingen en burgers afbouwen Zou de economie door een vervroegde invoering van de belastinghervorming aangezwengeld worden?
1. Welke fouten stel je vast bij de bovenstaande grafische voorstellingen? Hoe kan je deze fouten verklaren? (In de cirkeldiagrammen is het aantal personen dat niet geantwoord heeft niet opgenomen. Daardoor geven ze een fout beeld van de verhoudingen. De grafische informatie trekt veel sneller de aandacht dan de getallen, waardoor voor een snelle (vluchtige) lezer deze informatie verloren gaat en hij een verkeerd beeld krijgt. Bij het lezen van een krant/tijdschrift, lees je vaak vluchtig.) 2. Maak het cirkeldiagram dat jij bij deze gegevens zou publiceren.
16
onder de loep
Een tijd geleden plaatste De Morgen de onderstaande advertentie. Hiermee wilden ze zelf bedrijven motiveren om in hun krant te adverteren.
De manier waarop de informatie in deze advertentie verwoord wordt, maakt het de lezer niet gemakkelijk om alles juist te kunnen interpreteren. 3. Er is in de eerste paragraaf sprake van een stijging van 59%. Er wordt niet vermeld waarvan deze 59% genomen wordt. Uit de tekst kun je dit wel impliciet opmaken. Zoek dit uit en controleer je antwoord met behulp van de cijfergegevens in de grafiek. (Uit de tekst en de waarden van de grafiek kun je afleiden dat op de x-as de tijd en op de y-as het aantal kaderleden onder de lezers van De Morgen wordt uitgezet. Zoals uit de cijfergegevens van de grafiek blijkt, wordt het aantal kaderleden nu, vergeleken met het aantal bij de vorige meting in 2000. 59% van 13 500 is 7965, dit is ongeveer de toename van 13 500 tot 21 500. Wellicht zijn de cijfers in de grafiek afgerond.) 4. In de tweede paragraaf is er sprake van een verdubbeling van het aantal lezers. Kun je zeggen dat een verdubbeling van het aantal lezers een stijging met 59% is? Wat wordt er dan juist bedoeld?
17
Uitwiskeling 23/4 (herfst 2007)
(Sinds de recentste kaderstudie in 2000 is het aantal kaderleden gestegen met 59%. De uitdrukking ‘de voorbije jaren’ uit de tweede paragraaf heeft betrekking op een periode die verder teruggaat tot in 1997. Sinds 1997 is het aantal kaderleden van 9200 tot 21 500 gestegen. Dit is ongeveer een verdubbeling. Dit is bij snel lezen moeilijk te interpreteren omdat de referentie waarmee vergeleken wordt bij beide paragrafen verschilt, zonder dat dit vermeld wordt. Daarnaast wordt deze verwarring versterkt door het gebruik van het woord ‘zodoende’.) 5. Op de grafiek zelf valt ook een en ander aan te merken. Je kunt zeggen dat de gegevens misleidend zijn voorgesteld. Welke misleidingen werden toegepast en zijn ze in het voordeel van De Morgen gebruikt (m.a.w. ben je na een snelle blik meer onder de indruk dan je zou zijn bij een correcte voorstelling)? (De 0 op de y-as valt niet samen met het snijpunt met de x-as. Daarom lijkt het alsof we in 1997 van bijna niets vertrekken. Dit heeft tot gevolg dat de stijging veel groter lijkt dan ze in werkelijkheid is. De eenheid op de x-as is niet lineair: De periode van 3 jaar wordt even groot getekend als de periode van 2 jaar. Daardoor wordt de sterkere stijging tijdens de periode van 2 jaar afgevlakt. De maker van de grafiek heeft de lezers wellicht niet bewust willen misleiden…) 6. Herschrijf de advertentie zodat de gegeven informatie duidelijker is. Bij het herschrijven kun je zelf een keuze maken of je gaat voor een misleidende voorstelling met meer overtuigingskracht, of je een correcte voorstelling kiest. Motiveer je keuze. (De bovenstaande argumenten worden in een goede tekst gegoten. Het is niet alleen belangrijk dat leerlingen begrijpen wat hier aan de hand is, maar ook dat ze tot een goede verslaggeving kunnen komen. Eventueel kan de leerkracht Nederlands hierbij ingeschakeld worden.)
3. Staafdiagram of histogram De volgende werktekst bevat een voorbeeld dat je kunt gebruiken als een toepassing op beschrijvende statistiek waarbij je een aantal begrippen (klassenbreedte, relatieve frequentiedichtheid, staafdiagram en histogram) concrete invulling geeft. Je kunt de tekst ook gebruiken om het begrip frequentiedichtheid in te voeren.
De leeftijd van de bloedgevers In de onderstaande grafische voorstelling uit Knack vind je gegevens terug over de verdeling van het aantal bloedgevers in functie van hun leeftijd. We bekijken deze voorstelling wat nauwkeuriger.
18
onder de loep
LEEFTIJD VAN BLOEDGEVERS In 1995 vonden in Vlaanderen 373.775 bloedafnamen plaats. Daartoe boden zich 170.027 bloedgevers aan. Een voorstelling van de Vlaamse bloedgeversgroep naar leeftijd en aantal (in procenten van de hele groep).
7. De leeftijden van de bloedgroepgevers werden opgedeeld in klassen. In welke klasse zou je iemand met de leeftijd 20 jaar en 7 maanden onderbrengen? (We gaan er van uit dat in de medische gegevens het geboortejaar en degeboortedatum aanwezig zijn en gebruikt worden voor de indeling in klassen. Dan behoort de bloedgever tot de klasse 18 – 20. Wiskundig zou je dit beter noteren als een interval [18, 21[. Het is duidelijk dat de klassenbreedte dan 3 is.) 8. Hoeveel personen van 18, 19 of 20 jaar hebben bloed gegeven? (5% van 170 027 is 8501) 9. Hoeveel personen uit de tweede klasse hebben bloed gegeven? (50 % van 170 027 is 85 013) De auteurs hebben gekozen voor een creatieve voorstelling van het aantal bloedgevers door proefbuisjes van verschillende grootte te gebruiken. In de eerste klasse vind je 5% van de bloedgevers terug, in de tweede klasse 50%. De relatieve frequentie van de tweede leeftijdsklasse (50%) is 10 keer zo groot als die van de eerste leeftijdsklasse (5%). Daarom werd het proefbuisje met bloed bij de tweede leeftijdsklasse 10 keer zo lang gemaakt als het proefbuisje bij de eerste leeftijdsklasse. 10. Vergelijk de inhoud van de twee buisjes. (Klasse 1: r 2 ! h
Klasse 2: (10 r ) 2 ! 10 h " 1000 r 2 ! h De verhouding tussen beide relatieve frequenties (10 keer) heeft geen verband met de verhouding van de inhouden die hier visueel voorgesteld wordt (1000 keer zo groot). Een klassiek, maar saaier staafdiagram geeft een veel beter beeld van de verhoudingen.
19
Uitwiskeling 23/4 (herfst 2007)
Leeftijd van bloedgevers 60 50 40 % 30 20 10 0 18 - 20
21 - 39
40 - 49
50 - 59
60 - 65
Leeftijd
) 11. Na een snelle blik op de grafiek zegt John: “De mensen uit de tweede leeftijdsklasse zijn betere bloedgevers dan die uit de eerste leeftijdsklasse, want 50% van de bloedgevers komt uit de tweede leeftijdsklasse en slechts 5% uit de eerste.” Wat is er mis met Johns uitspraak? Zoek een manier om een goede verhouding tussen beide klassen uit te drukken. Maak gebruik van de echte aantallen en niet van de percentages. (We kunnen de klassen niet op Johns manier met elkaar vergelijken omdat de tweede klasse een veel grotere leeftijdsgroep beslaat. De tweede klasse bevat dus meer mensen en daarom ook meer bloedgevers. Om beide klassen te kunnen vergelijken kunnen we bijvoorbeeld werken met een gemiddeld aantal bloedgevers per leeftijdsjaar (voor klasse 1: voor 18, 19 en 20 jaar, voor klasse 2: voor 21, 22,…, 39 jaar). Gemiddeld gezien zijn er dus voor de eerste klasse 8501 / 3 = 2834 bloedgevers per leeftijdsjaar. Voor de tweede klasse vinden we 85010 / 19 = 4474 bloedgevers per leeftijdsjaar. Dit gemiddeld aantal bloedgevers per leeftijdsjaar is de frequentiedichtheid = frequentie / klassebreedte. Het blijft kloppen dat de mensen uit de tweede leeftijdsklasse vaker bloed geven, maar de verhouding van deze aantallen is veel minder extreem dan het op het eerste gezicht lijkt. Een kritische bemerking hierbij is zeker dat we bij deze redenering geen rekening gehouden hebben met de vraag of verschillende leeftijdsgroepen even groot zijn.) 12. Een meer realistisch beeld krijg je als je een histogram gebruikt. Teken het histogram dat hoort bij deze gegevens. Werk hierbij ook met de echte aantallen en niet met de percentages. Leeftijd van bloedgevers
aantal bloedgevers
5000 4000 3000 2000 1000
leeftijden
20
63
57 60
48 51 54
45
39 42
33 36
27 30
24
18 21
0
onder de loep
(Je krijgt voor een bepaalde klasse een rechthoek waarbij de hoogte overeen komt met de frequentiedichtheid en de breedte met de klassebreedte. De frequentie van een klasse = frequentiedichtheid # klassebreedte = hoogte # breedte = oppervlakte van de rechthoek. Op deze voorstelling krijg je door de hoogte een beter beeld van de verhoudingen van het aantal bloedgevers tussen de klassen onderling.)
4. Interpretatie van cijfermateriaal Enkele jaren geleden verscheen in De Standaard op de voorpagina een klein artikeltje met de volgende opener: “Bent u een man, tussen de 25 en 40 jaar, en rijdt u met een terreinwagen? Dan bent u hoogstwaarschijnlijk een snelheidsduivel.” De aandacht was onmiddellijk gewekt. En de scepsis ook... Het artikel op de voorpagina en het bijbehorende uitgebreidere artikel wat verderop in de krant waren gebaseerd op een studie door de Kortrijkse politie over het profiel van de snelheidsovertreder. We hebben het eindrapport van deze studie opgevraagd en vergeleken met het artikel. We hebben ook de reacties van lezers en deskundigen in de krant en op het forum op de website bijgehouden. Op basis van dat materiaal hebben we de onderstaande opdracht voor leerlingen gemaakt. Het is de bedoeling om de teksten te lezen en tegenover elkaar te plaatsen. De opdracht is in de eerste plaats bedoeld voor leerlingen van de derde graad. Als je sommige vragen weglaat, is deze werkstekst misschien ook bruikbaar in de tweede graad.
21
Uitwiskeling 23/4 (herfst 2007)
TWEE OP DRIE SNELHEIDSOVERTREDERS IS MAN
Snel rijden is mannenzaak BRUSSEL -- De mannelijke soort komt slecht uit het onderzoek dat de Kortrijkse politie naar snelheidsovertreders heeft uitgevoerd. Mannen zijn onder meer verantwoordelijk voor de vele overtredingen tijdens het weekeinde. Vrouwen springen er op één punt uit: tijdens de week stijgt hun aantal dat te snel rijdt opmerkelijk tussen 16 en 19 uur. Dat is de tijd dat ze zich moeten haasten om hun kroost te halen en boodschappen te doen. Van onze redacteur Filip Verhoest Daarmee hebben we niet gezegd dat mannen voor hun plezier te hard rijden. De grootste groep snelheidsovertreders, mannen tussen 25 en 39 jaar, is tijdens de week onderweg, vaak beroepshalve. Zevenentwintig procent van de overtreders rijdt overigens met een bedrijfswagen. Toch biedt de studie mannen weinig redenen om trots te zijn. ņTwee overtreders op de drie zijn mannen (64 procent, tegen 36 procent vrouwen). Bij de jongste groep chauffeurs (18-24 jaar) bedraagt die verhouding zelfs 72 tegen 28 procent. Hoofdcommissaris Stefaan Eeckhout van de Kortrijkse politie: ,,De relatief goede score van de jonge bestuurders -- 30 procent overtreders, tegen 36 procent in de groep 25-39 jaar -- is uitsluitend te danken aan de vrouwen.'' Ook bij de groep 55-69 jaar is bijna drie vierde van de snelheidsovertreders van het mannelijke geslacht. ņTijdens de week reed 41 procent van de bestuurders te hard, tijdens het weekeinde 59 procent. Onder meer jonge mannen (18-24 jaar) zorgen voor de pieken tijdens de weekendnachten en –namiddagen. ņHet aandeel van de mannen neemt bovendien toe naarmate de snelheidsovertreding ernstiger is. Bij overtredingen van 10 tot 20 kilometer per uur te snel maken mannen 62 procent van de overtreders uit. Die verhouding stijgt tot bijna
22
80 procent bij overtredingen van meer dan 40 kilometer per uur te snel, de echte ,,zware voeten''. ņNog opvallend is dat er gedurende de week vooral te snel wordt gereden op ogenblikken dat het verkeer het drukst is, de spitsuren. Vrouwen rijden in de week niet sneller dan tijdens het weekeinde, behalve tijdens de avondspits (van 16 tot 19 uur). De conclusie ligt voor de hand. De zorg voor het gezin voert de tijdsdruk op vrouwelijke chauffeurs op. Maar die vaststelling is niet voor rekening van de Kortrijkse politie. ,,We hebben een beschrijvende studie verricht'', zegt korpschef Stefaan Eeckhout. ,,Wij zijn politiemensen, de verklaringen laten we over aan psychologen.'' ņDe Kortrijkse politie deelde de wagens van de overtreders in zes groepen in: sportwagens (van het type Ferrari), monovolumeauto's, terreinwagens, en grote, middelgrote en kleine gezinswagens. De meeste snelheidsovertredingen werden begaan in een jeeplike (23 procent), gevolgd door sportwagens (21 procent), monovolumewagens (16 procent) en grote personenwagen (15 procent). Hoe groter, hoe sneller, is hier de vaststelling. Opgedeeld volgens merk voeren Land Rover, Porsche en BMW de rangorde aan (zie infografiek). ņDe lokale politie, van de zone Kortrijk-Kuurne-Lende-
lede, voerde haar strategische analyse van snelheidsovertredingen uit op 4.626 processen-verbaal, opgesteld tussen 1 januari en 31 juli 2002. Snelheidsovertreding volgens automerk
(uit: De Standaard, 19/02/2003)
onder de loep
Het profiel van de snelheidsovertreder 1. Lees het artikel ‘Snel rijden is mannenzaak’. De krant publiceerde achteraf een aantal reacties van deskundigen en ontving reacties van lezers op het forum op de website: deskundigen en lezers gaven hun mening over 4#4wagens, het verschillende gedrag van mannen en vrouwen m.b.t. auto’s, ... Eén van de reacties was echter van een heel andere aard en stelde fundamentele vragen bij de interpretatie van de cijfers. Hieronder vind je een stukje uit deze reactie:
Het verbaast mij dat nauwelijks een lezer of lezeres bedenkingen uit bij de manier waarop de Kortrijkse politie en Filip Verhoest omgaan met cijfers. Laten we hun stellingen eens de revue passeren. “Twee overtreders op de drie zijn mannen (64 procent, tegen 36 procent vrouwen). [...]” Deze cijfers kunnen maar tot een conclusie leiden als ...
2. Vul aan! Wat ontbreekt er volgens jou in het krantenartikel opdat je zinnige conclusies zou kunnen trekken? (Je moet weten in welke mate mannen en vrouwen vertegenwoordigd zijn bij de autobestuurders. Als mannen meer met de wagen rijden, dan is het ook logisch dat ze vaker betrapt worden.) 3. Kun je gelijkaardige opmerkingen maken ten aanzien van andere conclusies die in het artikel getrokken worden? (De leeftijdsklasse van 18-24 jaar is veel kleiner dan de leeftijdsklasse 25-39 jaar en heeft een bijna even groot aandeel in de snelheidsovertredingen ( 30% versus 36%). Op basis van deze cijfers lijken de jonge chauffeurs juist wel heel sterk verantwoordelijk voor snelheidsovertredingen. Ook de conclusie dat chauffeurs van 4#4-wagens vaker te snel rijden dan chauffeurs van sportwagens komt onder druk te staan: er rijden veel meer 4#4wagens op onze wegen dan sportwagens.) 4. Lees het onderstaande fragment uit de studie ‘Profiel van de snelheidsovertreder’ van de Kortrijkse lokale politie. Dat is de studie waarop het krantenartikel gebaseerd is. Beantwoord daarna de vragen 2 en 3 opnieuw. Er werden een aantal wegingsfactoren ingevoerd op de variabelen om de resultaten te kunnen interpreteren:
$
Geslacht: werd niet gewogen - daarbij wordt verondersteld dat er evenveel mannen als vrouwen op de weg zijn.
$
Leeftijdsklasse: de leeftijdsklassen die gebruikt werden zijn 18-24, 25-39, 40-54, 55-69 en +70. Omdat de klasse 18-24 slechts 7 jaar beslaat, terwijl de andere klassen 15 jaar beslaan, moest deze variabele gewogen worden. Er wordt wel verondersteld dat de verdeling van de (rijdende) bevolking over de leeftijdsklassen gelijk is, wat niet helemaal klopt.
$
Merk van de auto: van bepaalde automerken (en -types) rijden veel meer auto’s rond dan van andere. Om hiermee rekening te houden werd deze variabele gewogen volgens het aantal ingeschreven voertuigen van elk
23
Uitwiskeling 23/4 (herfst 2007)
merk en type in het arrondissement Kortrijk de laatste 20 jaar (bekomen bij Febiac).
$
Segmentgroep van de auto: Febiac deelt de verschillende merken en types in 18 segmentgroepen in, wij hebben die nog verder samengenomen tot 6 segmentgroepen. Zoals bij het merk van de auto moest ook hier herwogen worden.
$ $
Km/u te snel: werd niet herwogen - de klassen zijn even groot.
$
Firmawagen: werd niet herwogen omdat hierover geen beschikbaar waren, het zou nochtans interessant geweest zijn.
Tijdstip: er werden uurblokken opgesteld en bovendien uitgesplitst in week/weekend. Maar omdat het aantal uren per uurblok niet gelijk is en omdat het aantal weekdagen niet gelijk is aan het aantal weekenddagen moest hierop al gewogen worden. Bovendien was het aantal controles op elk tijdstip niet gelijk, ook hiermee werd rekening gehouden met een wegingsfactor. gegevens
(Uit dit fragment blijkt dat de onderzoekers van de politie heel wat zorgvuldiger tewerk gegaan zijn dan uit het krantenartikel blijkt. Zij waren zich wel degelijk bewust van de problematiek die door de lezer aangehaald werd en hebben hiervoor een aantal wegingen toegepast. Toch blijft een deel van de kritiek overeind. We geven enkele voorbeelden. $ De leeftijdsklasse van 18-24 jaar bevat niet alleen minder personen dan de leeftijdsklasse van 25-39 jaar, maar bovendien leggen deze personen wellicht ook veel minder kilometer per persoon af. Voor dat laatste fenomeen is niet gecorrigeerd. De conclusie dat de 25-39-jarigen grotere snelheidsduivels zijn dan de 18-24-jarigen blijft daardoor toch twijfelachtig. $ Een gelijkaardige opmerking is van toepassing voor de grotere versus kleine wagens: er is gecorrigeerd aan de hand van het aantal inschrijvingen, maar het zou kunnen dat grotere wagens meer op de baan zijn dan kleinere. De conclusie dat chauffeurs van grotere wagens vaker te snel rijden moet dus alleszins genuanceerd worden. $ De veronderstelling dat er evenveel mannen als vrouwen achter het stuur zitten, tot slot, had relatief gemakkelijk gecontroleerd kunnen worden. Een indicatie wordt gegeven door een telling door leerlingen van collega Wilfried Van Hirtum ([7], in Westerlo, tijdens de schooluren, op basis van ongeveer 2000 personenwagens): 63% mannelijke chauffeurs versus 37% vrouwelijke chauffeurs. Deze cijfers plaatsen grote vraagtekens bij de conclusie dat mannen grotere snelheidsduivels zijn dan vrouwen.) We blijven nog even hangen bij het gebruik van de wegingsfactoren. 5. Lees de tekst hieronder, die ook uit de studie van de Kortrijkse politie komt.
Het invoeren van frequenties voor de Om alle verwarring alles procentueel interpreteren.
24
de wegingsfactoren heeft tot gevolg dat de bekomen gewogen variabelen niet meer de absolute frequenties zijn. hieromtrent uit te sluiten werd in de grafieken die volgen uitgedrukt, dat laat zich bovendien gemakkelijker
onder de loep
Om voeling te krijgen met de percentages die in de studie gebruikt worden voeren we de berekeningen die de onderzoekers maakten uit voor een fictief voorbeeld. Veronderstel dat de politie 4200 overtredigingen vaststelde en dat die gelijk gespreid waren over elke leeftijdsklasse. Zonder wegingsfactor zou ze dan uitkomen op 20% overtreders voor elke leeftijdsklasse. 6. Bereken welke percentages je krijgt als je corrigeert voor de ongelijke breedte van de leeftijdsklassen. Neem aan dat de laatste leeftijdsklasse loopt van 70 tot 84 jaar en dus even breed is als de voorgaande. (De onderzoekers gingen als volgt tewerk. In elke leeftijdsklasse bevinden zich 840 snelheidsovertreders. De eerste leeftijdsklasse is 7 jaar breed en de andere leeftijdsklassen 15 jaar. In de eerste leeftijdsklasse zijn er dus 840 overtredingen gespreid over 7 ‘leeftijdsjaren’. Dat geeft 120 overtredingen per leeftijdsjaar. Als de eerste leeftijdsklasse ook 15 jaar breed zou zijn, zou dit neerkomen op 1800 overtredingen voor deze leeftijdsklasse. We vervangen het (reële) aantal snelheidsovertreders uit de eerste leeftijdsklasse daarom door een (fictief!) aantal van 1800, wat het zou geweest zijn als deze klasse even breed was als de andere. Het (fictieve) totale aantal snelheidsovertreders wordt hiermee 5160. Uitgedrukt in percentages vinden we dus na de weging dat 34,9% van de overtredingen begaan zijn door chauffeurs uit de eerste leeftijdsklasse en dat elk van de vier andere leeftijdsklassen verantwoordelijk is voor 16,3% van de snelheidsovertredingen. Deze percentages komen overeen met wat we intuïtief aanvoelen: 840 snelheidsovertredingen in een leeftijdsklasse van 7 jaar breed is iets meer dan dubbel zoveel als 840 snelheidsovertredingen in een leeftijdsklasse van 15 jaar breed. Een alternatief voor de werkwijze van de Kortrijkse politie is overgaan op frequentiedichtheden: deel 840 door 7 voor de eerste leeftijdsklasse en door 15 voor de tweede leeftijdsklasse. Je vindt dan 120 voor de eerste leeftijdsklasse en 56 voor de andere. Je komt dan echter niet tot percentages en de conclusies zijn dan minder gemakkelijk te communiceren.) Er gaan nog wel wat dingen mis bij de berichtgeving in de krant. Zo lezen we bij het tweede item in de lijst uit het tweede artikel: ‘Tijdens de week reed 41 procent van de bestuurders te hard, tijdens het weekeinde 59 procent.’ Het feit dat de som van de twee percentages precies 100 procent is, doet vermoeden dat de journalist iets anders bedoelt dan hij hier schrijft. 7. Corrigeer deze zin. (De journalist had moet schrijven dat 41% van de geconstateerde snelheidsovertredingen in de week vastgesteld zijn en 59% tijdens het weekend. Zo staat het in de studie van de Kortrijkse politie. Het gaat met andere woorden niet over 41% of 59% van de chauffeurs, maar over 41% of 59% van de overtredingen. Laat ons alvast hopen dat het niet klopt dat ongeveer de helft van de chauffeurs te snel rijdt!) 8. Vergelijk de uitspraken over het gedrag van vrouwen tussen 16 en 19 uur met het volgende fragment uit de studie van de Kortrijkse politie.
25
Uitwiskeling 23/4 (herfst 2007)
Interactie plot: Geslacht x Tijdstip Geslacht Mannelijk Geslacht Vrouwelijk
7% 6% 5% 4% 3% 2%
Week 19-22
Week 16-19
Week 14-16
Week 11-14
Week 09-11
Week 06-09
Week 04-06
WE 22-24
WE 19-22
WE 16-19
WE 14-16
WE 11-14
0%
WE 09-11
1%
WE 00-04
Frequenties - procentueel t.o.v. totaal overtreders
8%
Tijdstip
Het patroon in de week is zowel voor mannen als voor vrouwen veel minder grillig, ze volgen trouwens hetzelfde patroon. Dat er globaal gezien sneller gereden wordt in het weekend dan in de week is bijna volledig voor rekening van de mannen. Bij de vrouwen is er in het weekend slechts één uitschieter in het uurblok 1619, waarvoor niet direct een verklaring kan gevonden worden. Voor het overige wordt er door de vrouwen niet sneller gereden dan in de week.
(Hier is de journalist gewoon fout: het gaat niet over deze tijdstippen tijdens de week, maar tijdens het weekend. De verklaring van de journalist snijdt dan ook geen hout.) 9. Het artikel dat je gelezen hebt, stond in de binnenbladzijden van de krant. Op de voorpagina stond er ook een artikeltje over hetzelfde onderwerp, dat als volgt begon. Bent u een man, tussen de 25 en 40 jaar, en rijdt u met een terreinwagen? Dan bent u hoogstwaarschijnlijk een snelheidsduivel. Deze robotfoto van de snelheidsovertreder maakte de Kortrijkse politie, op grond van een analyse van ruim 4.600 processen-verbaal.
(Uit de studie blijkt dat er bij de snelheidsovertreders (bijvoorbeeld) veel bestuurders van terreinwagens zitten. Je mag dit echter niet zomaar omdraaien: het is niet noodzakelijk zo dat er onder de bestuurders van terreinwagens veel snelheidsduivels zitten. Het is bijvoorbeeld mogelijk dat er globaal genomen door zeer weinig chauffeurs te snel gereden wordt, maar dat de weinige snelheidsovertredingen voornamelijk begaan worden door een kleine groep chauffeurs van terreinwagens. Deze problematiek is verwant met de regel van Bayes in de kansrekening: uit de kennis van P(A|B) alleen kan niets afgeleid worden over P(B|A). Het woord ‘hoogstwaarschijnlijk’ is alleszins misplaatst: het suggereert dat mannen tussen 25 en 40 jaar die met een terreinwagen rijden pakweg 80% van de tijd te snel rijden. Dit kan helemaal niet afgeleid worden uit het cijfermateriaal.)
26
onder de loep
5. Afhankelijkheid en onafhankelijkheid Het onderscheid tussen afhankelijke en onafhankelijke gebeurtenissen is fundamenteel in de kansrekening. Sommige rekenregels mogen bijvoorbeeld alleen toegepast worden in het geval van onafhankelijkheid. Toch gaat hier in het secundair onderwijs weinig aandacht naar. In het leerplan voor de drie- en vieruursleerlingen wordt het begrip onafhankelijkheid zelfs helemaal niet vermeld. De onderstaande opdracht, die met de problematiek van (on)afhankelijkheid te maken heeft, werd reeds gebruikt in een 3-uursrichting en in een 6-uursrichting. Het gaf telkens aanleiding tot een boeiend klasgesprek.
Kans op wiegendood 1. Lees het onderstaande krantenartikel. BABYSTATISTIEK Hoe groot is de kans dat in éénzelfde gezin twee kinderen overlijden aan wiegendood? Niet meer dan één op 73 miljoen, vertelde professor Sir Roy Meadow in 1999 aan een Britse rechtbank. Zo onwaarschijnlijk dus, dat het bijna uitgesloten was. Dat twee kinderen van beklaagde Sally Clark aan 'wiegendood' overleden waren, moest dan ook betekenen dat het helemaal niet om natuurlijke wiegendood ging, maar om moord. Steven Stroeykens Clark ging de gevangenis in, net als een hele reeks ouders voor haar, die van kindermoord werden beschuldigd op advies van Meadow, dé Britse wiegendoodexpert (DS 24 januari). Één geval van wiegendood was een tragedie, volgens Meadow. Twee gevallen in één gezin
waren verdacht, en bij drie gevallen was het moord, tenzij het tegendeel bewezen kon worden. Op basis van die 'wet' gingen moeders de gevangenis in en werden pasgeboren kinderen preventief bij hun verdachte ouders weggehaald.
Maar hoe kwam Meadow aan zijn cruciale getal, één op 73 miljoen? Uit onderzoek was bekend dat de kans op één geval van wiegendood in een middenklassegezin met nietrokende ouders (zoals bij Clark) ongeveer één op 8.500 was. (…)
(uit: De Standaard, 30/01/2004)
2. Het krantenartikel is niet af. Probeer de redenering verder te zetten en leg uit hoe Meadow aan zijn getal van één op 73 miljoen komt. 3. Stel dat jij in de jury van het proces zou zitten, zou je dan Meadow volgen in zijn redenering? Waarom wel? Waarom niet?
Opdracht 2 is niet zo moeilijk. Met een kansboom is dit zeer snel na te rekenen. Het cijfer van Meadow is sterk afgerond, maar verder het klopt wel. Hoewel de leerlingen net voorbeelden van afhankelijke en onafhankelijke gebeurtenissen gezien hadden, was de link met het artikel voor hen niet onmiddellijk duidelijk. Het cijfer was bevestigd door een berekening. Het moest dus toch juist zijn? De meeste leerlingen zouden Meadow dan ook volgen in zijn redenering. Het was immers duidelijk
27
Uitwiskeling 23/4 (herfst 2007)
1 1 1 ! . De leerlingen bleven maar controleren met hun rekentoestel of de 8500 8500 72 250 000 vermenigvuldiging wel klopte. Niemand die zich afvroeg of je wel mócht vermenigvuldigen. Als leerkracht moet je dan wat aandringen en de werkwijze in vraag stellen door te vragen naar de veronderstellingen die we maken bij zo’n kansboom. Bij de eerste kansbomen die leerlingen maken, denken ze hierover wél na, maar naarmate die techniek geautomatiseerd wordt, vaak niet meer. Eens de discussie op gang was, konden de leerlingen zelf heel wat argumenten geven waarom het hier misschien niet om onafhankelijke gebeurtenissen gaat. Er kunnen kleine aangeboren afwijkingen zijn die erfelijk bepaald zijn. Broertjes en zusjes hebben dan een verhoogde kans om ook deze afwijking te hebben. Het kan ook zijn dat andere omgevingsfactoren die dezelfde blijven een rol spelen (buiklig, type van bedje, slecht verluchte kamer, te warm toegedekt, …).
dat
Een andere invalshoek zou zijn Meadow van hetzelfde laken een broek te geven. Je kunt op gelijkaardige wijze de kans berekenen dat een niet-rokende vrouw uit de middenklasse haar baby vermoordt. Deze kans is wellicht nog veel kleiner dan 1 op 8500. En de kans op een dubbele moord dan? Maakt dat het verhaal van een dubbele moord niet heel erg onwaarschijnlijk? Bij deze redenering maken we dezelfde fout als Meadow, maar het foutieve van de redenering komt zo wel beter tot uiting. Na de bespreking kregen de leerlingen het volledige artikel (hieronder afgedrukt). Hetgeen daarin wordt uitgelegd is een samenvatting van wat in het klasgesprek aan bod kwam.
Babystatistiek HOE groot is de kans dat in éénzelfde gezin twee kinderen overlijden aan wiegendood? Niet meer dan één op 73 miljoen, vertelde professor Sir Roy Meadow in 1999 aan een Britse rechtbank. Zo onwaarschijnlijk dus, dat het bijna uitgesloten was. Dat twee kinderen van beklaagde Sally Clark aan 'wiegendood' overleden waren, moest dan ook betekenen dat het helemaal niet om natuurlijke wiegendood ging, maar om moord. Steven Stroeykens Clark ging de gevangenis in, net als een hele reeks ouders voor haar, die van kindermoord werden beschuldigd op advies van Meadow, dé Britse wiegendoodexpert (DS 24 januari). Één geval van wiegendood was een tragedie, volgens Meadow. Twee gevallen in één gezin waren verdacht, en bij drie gevallen was het moord, tenzij het tegendeel bewezen kon worden. Op basis van die 'wet' gingen moeders de gevangenis in en werden pasgeboren kinderen preventief bij hun verdachte ouders weggehaald. Maar hoe kwam Meadow aan zijn cruciale getal, één op 73 miljoen? Uit onderzoek was bekend dat de kans op één geval van wiegendood in een middenklassegezin met nietrokende ouders (zoals bij Clark) ongeveer één op 8.500 was. En als de kans op één wiegendood 1 op
28
8.500 was, dan was de kans op twee keer wiegendood volgens Meadow 1 op 8.500 × 8.500 of ongeveer 1 op 73 miljoen (optimistisch afgerond). Is die redenering correct? De kans op één geval kwadrateren en je hebt de kans op twéé gevallen? Een op het eerste gezicht gelijkaardig voorbeeld suggereert van wel. De kans dat je met een dobbelsteen een zes gooit is één op zes. En inderdaad, de kans dat je twee keer na elkaar een zes gooit is 1 op 6 × 6 of 1/36 (dat is gemakkelijk te controleren met enkele duizenden dobbelsteenworpen). Maar er is een belangrijk verschil. De kans op een zes wordt niet beïnvloed door het resultaat van de vorige worp. Elke nieuwe worp is weer even toevallig, en niet door
een of andere verborgen oorzaak verbonden met de vorige. Dat is de vereiste om de kwadrateerregel te mogen toepassen. Is bij wiegendood aan die vereiste voldaan? Niemand die het weet, aangezien de oorzaak van wiegendood onbekend is. Zijn er misschien genetische factoren? Dan zou het helemaal niet vreemd meer zijn dat twee broertjes of zusjes getroffen worden. Of omgevingsfactoren in het gezin, of herhaalde medische problemen tijdens opeenvolgende zwangerschappen? Zelfde conclusie: dan zouden sommige gezinnen gewoon veel meer kans hebben op wiegendood dan andere, en dus ook een veel hogere kans om twee keer getroffen te worden. Het is dan zoals twee keer werpen met een vervalste dobbelsteen die heel vaak op '6' blijft liggen.
onder de loep
Na de veroordeling van Clark voelde het Britse Koninklijk Genootschap voor Statistiek zich genoodzaakt een brief te schrijven aan de openbare aanklager, om erop te wijzen dat Meadows berekening ,,geen statistische basis had''. Het onterechte gebruik van de kwadrateerregel was trouwens niet de enige redeneerfout rond kansrekening in de zaak-Clark. En het puur medische deel van de
bewijsvoering bleek ook al niet in orde. De vrouw werd vorig jaar in hoger beroep vrijgesproken. We kunnen er niet omheen: statistiek en kansrekening zijn voor veel mensen een hopeloze blinde vlek. Het onderwijs doet grote inspanningen om 'geletterde' burgers te vormen, maar de 'gecijferdheid' blijft achter.
Als het publiek wél 'gecijferd' zou zijn geweest, en op school geleerd zou hebben om zich thuis te voelen in redeneringen over kansen en waarschijnlijkheden, dan zou er geen Genootschap voor Statistiek nodig geweest zijn om de rechtbank terecht te wijzen. Dan was die 'expert' meteen de zaal uitgelachen.
(uit: De Standaard, 30/01/2004)
6. Valse positieven Het krantenartikel dat we in deze paragraaf voorstellen, handelt over een onderwerp uit de kansrekening: het optreden van valse positieve resultaten bij het testen of iemand aan een ziekte lijdt. Vals positief betekent dat de test aangeeft dat de persoon de ziekte heeft, terwijl dat in werkelijkheid niet het geval is. Dit fenomeen is een gevolg van het feit dat geen enkele test helemaal correct is. Om de vragen uit de werktekst op te lossen, volstaan kansbomen. Indien gewenst kan ook het verband gelegd worden met de regel van Bayes. We maken in een van de vragen gebruik van een homografische functie. Daarom is dit krantenartikel annex werktekst bedoeld voor leerlingen uit de derde graad, al dan niet met veel lestijden wiskunde per week. TEST KAN PANIEK VEROORZAKEN, MAAR IN RISICOGEBIEDEN SNELLE VERSPREIDING VAN AIDS TEGENGAAN
Belg verkoopt doe-het-zelf-hiv-test via het net Het duurt twee minuten en je hebt er alleen maar een druppel bloed voor nodig. Met de doe-het-zelf-hiv-test, die je on line kunt bestellen bij de Belg Charles Dupont, wordt aids testen kinderspel. Maar hoe betrouwbaar is de test, en hoe legaal is de verkoop via internet? In Amerika werd de test in november 2000 door de FDA verboden, in de Nederlandse hoerenbuurt wordt hij toegejuicht. Brussel / Van onze medewerker Dirk Bogaert Zijn naam is Charles Dupont. Hij heeft een Belgische identiteitskaart, maar leeft in Monaco. De maatschappelijke zetel van zijn bedrijf Health Diagnostics bevindt zich in Groot-Brittannië. Via een Frans computerbedrijf en dito server verkoopt hij vanuit Malta een doe-het-zelf-hiv-test die door de Canadese regering is goedgekeurd. Op de bijsluiter ontdek je een gebruiksaanwijzing in het Russisch en het Engels. Kortom, globalisering op zijn best. Mensen die willen
weten of ze met hiv zijn besmet, wensen vanzelfsprekend te vernemen of deze 'thuistest' betrouwbaar is. Dupont zelf was woensdagnamiddag nergens voor onmiddellijke commentaar bereikbaar. Aan de BBC en The San Francisco Chronicle heeft hij inmiddels verklaard dat zijn hiv-testkit 99 procent zekerheid geeft op het moment van de proef. Dokter Marc Vandebruwaene van het Tropisch Instituut in
Antwerpen verwerpt de test niet meteen wegens onbetrouwbaarheid, maar hij heeft zijn twijfels. "Stel dat we deze 'hiv-thuisanalyse' aanbieden op de Belgische markt en honderdduizend mannen en vrouwen doen de hiv-proef. De statistische gegevens leren ons dat hiv bij ons in één op de tienduizend gevallen voorkomt. Indien de Health Diagnostic-proefresultaten bekend zijn, is de kans groot dat we opeens duizend mensen in het Tropisch Instituut krijgen
29
Uitwiskeling 23/4 (herfst 2007)
die denken dat ze hiv-positief zijn. Na een tweede, officiële controle bij ons zal blijken dat 990 mensen op de 1.000 nodeloos werden gealarmeerd. De tien anderen zullen inderdaad met hiv besmet zijn. "Je kunt dus niet beweren dat de verkochte hiv-kit waardeloos is. Hij jaagt enkel ontzettend veel mensen voor niets de stuipen op het lijf. We leven in een land waar er twee huisartsen in één straat wonen. De schrikdrempel om een professionele hiv-proef te laten uitvoeren, moet bijgevolg miniem zijn. Mensen vergeten te snel dat een arts gebonden is aan het beroepsgeheim." Ook de Britse aids-specialist, professor Jonathon Weeber, heeft zijn twijfels over de efficiënte werking van hiv-testen die via het internet worden aangeboden. "De resultaten kunnen nooit zo accuraat zijn als in een professioneel laboratorium. De kans is groot dat de mensen thuis een verkeerd negatief of positief resultaat krijgen. Vergeet niet dat de man of vrouw - bij een ver-
keerd negatief resultaat – onwetend verder kan gaan met potentiële kortstondige partners te besmetten met het virus. Voor mij is de investering van 30 pond - de kostprijs van de test – waardeloos." Niettegenstaande alle kritiek worden er in Nederland ruim duizend 'thuis-hiv-testkits' per week verkocht. Sommige Nederlandse prostituees verplichten hun klanten tot de twee minuten durende hivcontrole. Pooiers doen een beroep op de aids-test teneinde er zeker van te zijn dat ze over gezonde meisjes beschikken. De procedure is zeer eenvoudig. Een kleine prik in de vinger levert een bloeddruppel op. Die wordt in een cirkelachtig doosje gebracht en vermengd met peptides die enkel voorkomen in hiv-molecules. Indien het centrum van het doosje binnen twee minuten rood wordt, is er sprake van hiv-besmetting. In het andere geval is de man of vrouw hiv-negatief.
De test is, behalve in Nederland, ook in Canada, Uganda, Rusland en de Bahama’s goedgekeurd. In de Verenigde Staten wordt hij enkel gebruikt in de Bronx-ziekenhuizen van New York. Dokter Brian Di Parma van het Bronx-aidscenter vertelde dat het in een hoog hiv-risicogebied zeer belangrijk is om potentiële aidsdragers snel te kennen. "Deze eenvoudige, maar soms alarmerende testkit, maakt het mogelijk veel mensen na een tweede controle in het ziekenhuis gerust te stellen. Ondertussen vangen we wel de echte hiv-besmette mannen en vrouwen op. Ik vind het prima dat deze hiv-controle via het internet wordt aangeboden. Vergeet niet dat ruim driekwart miljard mannen en vrouwen reeds op het internet zijn aangesloten. Een kleine 40 procent gebruikt het web voor eigen gezondheidsdoeleinden. De test van de Belg voorkomt de vroegtijdige dood van een aantal aids-patiënten. Dat de man in kwestie ondertussen rijk wordt, is voor mij geen probleem."
(uit: De Morgen, 01/02/2001)
Een doe-het-zelf-hiv-test op het internet 1. Lees het artikel ‘Belg verkoopt doe-het-zelf-hiv-test via het net’. 2. Wat betekent het volgens jou dat de test 99% zekerheid geeft? (Dit is niet helemaal duidelijk, maar we zullen er in deze werktekst van uitgaan dat de test in 99% van de gevallen de juiste toestand aangeeft zowel wanneer je besmet bent als wanneer je niet besmet bent. Met andere woorden: bij 99% van de besmette mensen geeft de test inderdaad aan dat ze besmet zijn en bij 99% van de niet-besmette mensen dat ze niet besmet zijn.) 3. Vind je de bewering van de arts van het Antwerpse Tropisch Instituut dat 990 mensen van de 1000 nodeloos gealarmeerd worden geloofwaardig? Controleer de cijfers. (Maak een kansboom of een tabel. Dan vind je de kans op een positief testresultaat ( 0,010098) en de kans dat iemand niet ziek is en toch een positief tesresultaat krijgt
30
onder de loep
( 0,009999). Als je dit omzet naar aantallen (op basis van 100 000 mensen die de test uitvoeren), krijg je 1010 mensen bij wie de test een positief resultaat geeft en daarvan zijn er 1000 die niet besmet zijn. Dit wijkt een klein beetje af van de getallen uit het artikel. Het lijkt er op dat de arts het resultaat gewoon wat vereenvoudigd heeft omdat dit gemakkelijker communiceert of dat hij een vuistregel gebruikt heeft die een benaderend resultaat oplevert. Maar de teneur van de boodschap die hij geeft, is wel degelijk correct. Hoewel de berekening dus correct is, is een van de uitgangspunten van de berekening niet vrij van kritiek. Wellicht zullen de mensen die de test ondergaan, dat doen omdat ze enig risico gelopen hebben op besmetting. Dat zou betekenen dat van de mensen die de test doen een groter deel daadwerkelijk besmet is dan in de Belgische bevolking als geheel. Het aantal valse positieven zou dan lager liggen dan de arts aangeeft.) Gevallen waarin de test ten onrechte positief uitvalt, worden vals positief genoemd. De Antwerpse arts wijst de test dus af op basis van het feit dat heel wat positieve testresultaten vals zijn. 4. Geef in je eigen woorden een goede verklaring voor het hoge aantal valse positieven. (Het aantal echte positieven is een groot percentage (betrouwbare test) van een klein aantal (er zijn weinig mensen besmet). Het aantal valse positieven is een klein percentage (de test is niet volledig correct) van een groot aantal (bijna iedereen). Omdat er hier heel weinig mensen besmet zijn, is het eerste getal veel kleiner dan het tweede. Op onze website vind je nog een kort artikeltje over het fenomeen van de valse positieven, waarin het heel duidelijk uitgelegd wordt. Je kunt het verschijnsel ook in verband brengen met de regel van Bayes. Noteer TP en TN voor de gebeurtenis dat de test een positief, respectievelijk negatief resultaat geeft en Z en NZ voor de gebeurtenis dat de testpersoon in realiteit ziek, respectievelijk niet ziek is. De gegevens over de betrouwbaarheid hebben dan betrekking op de voorwaardelijke kansen P(TP|Z), P(TN|Z), P(TP|NZ) en P(TN|NZ). De kans die berekend moet worden, is P(Z|TP). Het twistpunt over het al dan niet frequent voorkomen van de valse positieven is een gevolg van het feit dat je uit de grootteorde van (bijvoorbeeld) P(TP|Z) niet onmiddellijk iets kunt afleiden over de grootteorde van P(Z|TP).) 5. Denk je dat het probleem van de valse positieven opgelost kan worden door de mensen met een positief testresultaat aan te raden om de thuistest nogmaals uit te voeren voor ze zich zorgen beginnen te maken? (Dit zou een hele verbetering inhouden als de resultaten van de twee tests onafhankelijk van elkaar zouden zijn. Als je er dan van uit zou gaan dat iemand pas contact opneemt met een arts voor verder onderzoek als beide testresultaten positief zijn, dan daalt het percentage valsen bij de positieven van 99% tot 50,5%. Maar in realiteit zijn de resultaten bij het twee keer uitvoeren van dezelfde test wellicht niet onafhankelijk van elkaar. We kunnen vermoeden dat het vals positief zijn te maken heeft met kenmerken van de besmetting (bijvoorbeeld nog niet erg sterk of virussen die een klein beetje afwijken) of van het eigen lichaam. En dan helpt het niet om de test twee keer uit te voeren.) 6. De Britse aids-specialist denkt dat de test niet erg accuraat kan zijn en wijst bovendien op het gevaar van valse negatieven. Bereken de kans dat iemand met een negatief resultaat op de test toch besmet is. (We kunnen het antwoord berekenen m.b.v. de kansboom uit het antwoord op vraag 3. De gevraagde kans is (afgerond) 0,000 001 of één op één miljoen. Dergelijke vals negatieve resultaten komen dus maar zeer zelden voor. Maar uiteraard kunnen de gevolgen veel zwaarder zijn dan bij een vals positief resultaat.)
31
Uitwiskeling 23/4 (herfst 2007)
De arts van het Bronx-aids-centrum werkt in een omgeving waar hiv-besmetting veel vaker voorkomt. Hij staat positief ten opzichte van de test. 7. In het artikel wordt niet gezegd hoeveel procent hiv-besmettingen er zijn. Ga er van uit dat het er 5% zijn en bereken de kans dat iemand met een positief testresultaat toch niet besmet is. Vind je dat het voordeel van het snel ontdekken van mensen met een hivbesmetting nu opweegt tegen het leed dat de valse positieven ondergaan? (De kans dat iemand met een positief testresultaat toch niet besmet is, bedraagt 16,1%. Op de vraag die gesteld wordt, is er natuurlijk geen eenduidig antwoord, maar het feit dat het aantal missers veel lager ligt, is natuurlijk wel erg relevant.) Stel de proportie hiv-besmette personen in een zekere populatie voor door x en noem y de kans dat iemand met een positief testresultaat toch niet besmet is. Het is duidelijk dat y afhangt van x. 8. Geef een vergelijking van de functie y(x), maak een grafiek en bespreek de belangrijkste kenmerken van de functie. (De functie blijkt de homografische functie met vergelijking y "
! 0,01x 0,01 te zijn 0,98 x 0,01
met beperkt domein: 0 # x # 1 . De grafiek, een deel van een hyperbool, vind je in de onderstaande figuur. De (volledige) hyperbool heeft een verticale asymptoot een klein beetje links van de y-as en een horizontale asymptoot een klein beetje onder de x-as. De functie is dalend, wat uiteraard overeenstemt met de verwachtingen. De grafiek snijdt de y-as in (0, 1) (als niemand besmet is, zijn alle positieven vals) en de x-as in (1,0) (als iedereen besmet is, zijn er geen valse positieven). Als x heel klein is, ligt y dicht bij 1, maar y daalt heel snel naarmate x toeneemt.)
9. Vanaf welke proportie besmette personen zakt de kans dat iemand met een positief testresultaat niet ziek is onder 20%? (vanaf (afgerond) 3,9%)
32
onder de loep
7. Samenhang en oorzakelijk verband In deze paragraaf behandelen we drie krantenartikels waarin een samenhang vastgesteld wordt tussen twee variabelen. In een van de artikels wijst de journalist er zorgvuldig op dat uit deze samenhang niet besloten kan worden dat er een oorzakelijk verband is. In een tweede artikel neemt men als vanzelfsprekend aan dat er een oorzakelijk verband is. We gaan er van uit dat de leerlingen vooraf al kennisgemaakt hebben met de problematiek dat een samenhang niet automatisch een causaal verband impliceert. We laten hen beide artikels lezen, waarbij we hen vertellen dat een van beide artikels in de fout gaat. We vragen hen op welk punt het artikel fout is en laten hen het foutieve artikel herschrijven, rekening houdend met de valkuil samenhang versus causaal verband. Tot slot vragen we hen nog een derde artikel te analyseren i.v.m. deze problematiek.
Verband tussen antibioticagebruik en borstkankerrisico Amerikaanse artsen wijzen deze week in het Journal of the American Medical Association op een verband tussen antibioticagebruik en een verhoogd risico op borstkanker bij vrouwen. Ze concluderen uit een studie bij 10.000 vrouwen in de Amerikaanse staat Washington dat vrouwen die veel antibiotica gebruiken een dubbel zo groot risico lopen als vrouwen die geen antibiotica slikken. Antibiotica worden gebruikt bij de bestrijding van bacteriële infecties (van huid-
ontstekingen king).
tot
longontste-
De onderzoekers kunnen niet zeggen of het gevonden verband oorzakelijk is. Ze weten dus niet of het antibioticagebruik de borstkanker doet ontstaan. Het verband kan ook ingewikkelder liggen: zo is het denkbaar dat vrouwen met een zwak immuunsysteem eerder borstkanker krijgen dan andere vrouwen. Door hun falende afweer zullen ze ook vaker infectieziekten oplopen, die moeten worden behandeld
met antibiotica. Antibioticagebruik en borstkanker zijn dan beiden het gevolg van een falend immuunsysteem, zonder dat het ene de oorzaak van het andere is. De wetenschappers waarschuwen dat ze niet hebben bewezen dat antibiotica borstkanker veroorzaken en benadrukken dat vrouwen zeker antibiotica moeten blijven nemen om infecties te behandelen. (hvde)
(uit: De Standaard, 20/02/2004)
Ongelijke resultaten werken geweld op school in de hand Zelfs als de misdaadcijfers in een land astronomisch hoog zijn, wil dat nog niet zeggen dat de scholen gewelddadiger zijn dan elders. Geweld op school heeft veel meer te maken met schoolresultaten dan met criminaliteit in de samenleving. Tot die conclusie kwam professor Gerald LeTendre van de Penn Stateuniversiteit. Hij vergeleek gegevens uit 41 landen en kwam tot de vaststelling dat Hongarije, Roemenië en de Filippijnen het meest te kampen hebben met gewelddadige
leerlingen. De VS daarentegen, waar de criminaliteitscijfers bij jongeren de pan uit rijzen, scoren middelmatig. Zelfs in ‘vreedzame’ landen als Nieuw-Zeeland en Canada is er meer fysiek geweld op school. In zijn zoektocht naar een verklaring analyseerde LeTendre de resultaten van wiskundetests die in de verschillende landen afgenomen waren. Daaruit kon hij afleiden dat de mate van geweld op school nauw samenhing met de wiskunderesultaten. Landen waar
de beste en de slechtste leerlingen zeer uiteenlopende cijfers hadden, hadden de meeste problemen. Lagen de scores relatief dicht bij elkaar, dan was er meestal weinig aan de hand. Volgens LeTendre ligt de oplossing dan ook voor de hand: willen landen veilige scholen, dan moeten ze er vooral voor zorgen dat het onderwijssysteem ongelijkheid niet in de hand werkt. Geen elitaire toplaag die ver boven de rest uittorent maar wel een grote massa die het ongeveer even goed doet. (KH)
(uit De Morgen, 10/05/05)
33
Uitwiskeling 23/4 (herfst 2007)
Twee krantenartikels over samenhang In deze werktekst bekijken we drie artikels waarin de samenhang tussen twee variabelen aan bod komt. 1. Lees de artikels ‘Verband tussen antibioticagebruik en borstkankerrisico’ en ‘Ongelijke resultaten werken geweld op school in de hand’ aandachtig. 2. De twee artikels verschillen op een essentieel punt. Eén artikel doet het hier goed en het andere gaat in de fout. Welk punt is dat? (In het artikel over de samenhang tussen borstkanker en antibioticagebruik wordt er nadrukkelijk op gewezen dat de samenhang niet automatisch betekent dat er een causaal verband is. In het andere artikel wordt eerst aangegeven dat er een samenhang vastgesteld is tussen de hoeveelheid geweld op school en de spreiding in resultaten op wiskundetests. Het is natuurlijk verleidelijk om deze samenhang te interpreteren als een oorzakelijk verband. In het artikel stapt men inderdaad zonder meer over naar een causaal verband: om minder geweld op school te krijgen, volstaat het te zorgen voor een meer egalitair onderwijssysteem. Zie in dat verband ook de titel van het artikel.) 3. Herschrijf het minder goede artikel, rekening houdend met de fout die je in vraag 2 opgemerkt hebt. 4. Het artikel ‘Wapens lokken moorden uit’ verscheen naar aanleiding van een schietpartij door een dolle schutter op een Amerikaanse universiteit waarbij 35 doden vielen. Het was de dodelijkste schietpartij in zijn soort. Hoe zit het in dit artikel met de conclusies die getrokken worden uit de samenhang die vastgesteld is? (Op de redactievergadering hebben we lang en hevig gediscussieerd over dit artikel. We waren er met zijn allen van overtuigd dat er inderdaad een causaal verband is: wapenbezit veroorzaakt geweld. Dat ook de journalist gelooft in dit oorzakelijk verband, is bijvoorbeeld duidelijk uit de titel van het artikel. De vraag is alleen of je dit kunt besluiten op basis van het cijfermateriaal dat de journalist beschrijft. We denken dat er – zoals vermeld in de samenvatting van het artikel bovenaan – ook andere argumenten en verklaringen nodig zijn, die niet in het artikel genoemd worden maar die misschien wel in rekening gebracht zijn in de studies waarop het artikel gebaseerd is.)
Wapens lokken moorden uit Het grote aantal wapens is één verklaring voor het gewelddadige karakter van de misdaad in de VS. BRUSSEL. Een vergelijking van de statistieken van de ,,valse tweelingen'' VS en Canada kan verhelderend werken. Uit een studie van het Canadese centrum voor statistieken inzake Justitie blijkt dat de twee landen elkaar in 2000 proportioneel in evenwicht hielden inzake eigendomsdelicten. Canada kende zelfs meer autodief-
34
stallen en brandstichtingen. Er was wel een groot verschil inzake misdaden die gepaard gaan met geweld. Recente cijfers bevestigen dit. In 2004 vonden er in Canada 622 moorden plaats, of 1,95 op 100.000 inwoners; in de VS ging het om 16.137 moorden, of 5,5 op 100.000 inwoners. Dat
betekent dat de verhouding 2,8 keer hoger ligt in de VS. Die ratio trekt helemaal scheef als er gekeken wordt naar het aantal moorden met vuurwapens: 7,2 in het nadeel van de VS. In Canada ging het in 2004 om 172 gevallen: 27,7 % van het aantal moorden of 0,54 op 100.000 inwoners. In
onder de loep
het geval van de VS betrof het 11.344 gevallen, of 70 % van het aantal moorden en een verhouding van 3,9 op 100.000 inwoners. Al in 2000 merkte het Canadese centrum voor statistieken inzake Justitie op dat ,,sommige onderzoekers gesuggereerd hebben dat de beschikbaarheid van vuurwapens het verschil inzake moorden kan verklaren''. In Canada waren er in 2005 7 miljoen wapens geregistreerd, wat ruwweg
neerkomt op 212 op 1.000 inwoners. In de VS circuleerden er volgens het ministerie van Justitie meer dan 200 miljoen privéwapens, of omgerekend 710 op 1.000. Een studie van de Amerikaanse Harvard School of Public Health begin dit jaar was duidelijk in haar conclusies over wapenbezit in de VS: staten waar de inwoners meer wapens bezitten, kennen meer moorden, zowel op straat als thuis.
Wapens vormen een belangrijke factor voor het gewelddadige karakter van de misdaad in de VS. De Australische premier John Howard, een bondgenoot van president Bush, verwees gisteren naar de strengere wapenwet die zijn land invoerde na een schietpartij in 1996 waarbij 35 doden vielen: ,,Wij toonden de vastberadenheid om de wapencultuur die zo negatief is in de VS, nooit zo negatief te laten worden in ons land.'' (bar)
(uit De Standaard, 18/04/2007)
8. Gedurfde extrapolatie Het onnadenkend toepassen van wiskunde leidt soms tot onthutsende en weinig betekenisvolle resultaten. Wanneer je een redenering staaft met cijfers en grafieken, win je nochtans heel snel aan overtuigingskracht die zelden in twijfel wordt getrokken. Mensen hebben de neiging om vooral hun energie te besteden aan de interpretatie van de grafiek en de bijbehorende conclusies zonder kritisch na te denken over de gegevens waarop de grafiek gebaseerd is. Resultaten kunnen hierbij gemakkelijk gemanipuleerd worden met heel verregaande gevolgen. De onderstaande werktekst, waarmee je deze problematiek aankaart, maakt gebruik van een artikel uit De Morgen. Hij is bedoeld voor leerlingen uit de derde graad a.s.o. of t.s.o. met het keuzeonderwerp over lineaire regressie. Je kunt de leerlingen zelf een aantal grafieken en regressielijnen laten zoeken of je kunt hen de grafieken aanbieden. De leerlingen bekijken daarna de gegeven grafieken kritisch.
Straffe toebak! Hieronder vind je het eerste deel van een artikel uit De Morgen. Lees het aandachtig.
Vrouw van de toekomst loopt sneller dan de man De finale van de 100 meter op de Olympische Spelen van 2156. Acht seconden na het startschot behaalt de winnaar goud. Voor het eerst wordt een man verslagen door een vrouw op die afstand. Het lijkt onmogelijk dat een vrouw de snelste mens ter wereld wordt, maar volgens wetenschappers duurt het nog slechts enkele generaties voor het zover is. Steve Connor Een analyse van de slinkende kloof tussen de atletische prestaties van mannen en vrouwen wijst erop dat vrouwen hun man-
nelijke tegenhangers inhalen. Volgens een studie lopen vrouwen nu sneller dan ooit de 100 meter. Als ze die tred aanhouden,
rennen ze over 150 jaar de mannen voorbij. Dat is de conclusie van Andrew Tatem en zijn collega's aan de universiteit van Oxford.
35
Uitwiskeling 23/4 (herfst 2007)
Ze vergeleken mannelijke en vrouwelijke winnende tijden op de olympische 100 meter sinds 1900. Zowel mannen als vrouwen zijn in de loop der jaren sneller gaan lopen, maar de vrouwen verbeteren blijkbaar sneller dan de mannen.
en zagen bij elke sekse een rechtlijnig 'lineair' verband; met andere woorden, zowel mannen als vrouwen gingen steeds sneller lopen.
Mannen lopen de 100 meter een seconde sneller dan vrouwen. Op de Olympische Spelen in Athene in augustus behaalde de Amerikaan Justin Gatlin goud met een tijd van 9,85 seconden. Yuliya Nesterenko uit Wit-Rusland greep de titel bij de vrouwen met 10,93 seconden.
De onderzoekers vinden dat het gaat om opvallend sterke tendensen. Het ziet er niet naar uit dat mannelijke of vrouwelijke sprinters stilaan een prestatiepiek bereiken waarna het virtueel onmogelijk wordt om nog beter te worden. "Er zijn geen aanwijzingen dat het plafond bereikt is bij mannelijke of vrouwelijke atleten op de olympische 100 meter", schrijven wetenschappers in het tijdschrift Nature.
Dr. Tatem: "Als de huidige tendensen zich doorzetten, lopen de vrouwen op de Olympische Spelen van 2156 sneller dan de mannen." De onderzoekers legden de winnende tijden op de olympische 100 meter naast het jaartal waarin de wedstrijden plaatsvonden
De onderzoekers, die zich normaal bezighouden met de statistische opmars en afname van epidemieën, trokken de lijnen op de grafiek van de mannelijke en vrouwelijke prestaties door naar de toekomst en kwamen tot een verrassende conclusie. "Wan-
neer die tendens zich doorzet, kruisen de lijnen elkaar op de Olympische Spelen van 2156. Op dat moment winnen de vrouwen de 100 meter sprint met 8,079 seconden. Voor het eerst zal hun tijd lager liggen dan de winnende tijd bij de mannen, die 8,098 seconden zal bedragen", zeggen wetenschappers. Volgens Dr. Tatem is het feit dat steeds meer vrouwen geëmancipeerd raakten in de voorbije eeuw een mogelijke verklaring. Er is een grotere groep vrouwen die trainen tot ze topatleten worden. Hij heeft vertrouwen in de statistische analyse en is ervan overtuigd dat hij tijdens zijn eigen leven geen ongelijk zal krijgen. "Ik kan er mijn reputatie voor op het spel zetten, en dan kan eender wie in 2156 vertellen dat ik het bij het verkeerde eind had", zegt hij….”
(uit: De Morgen, 01/10/2004)
1. Je hebt vast enkele kritische bedenkingen bij dit artikel. Op welke manieren zou je kunnen checken of jouw bezwaren relevant zijn? (Er zijn natuurlijk heel veel goede, uiteenlopende suggesties mogelijk. We sommen er hier maar enkele op:
36
onder de loep
opzoeken van de recordtijden, deze uitzetten in grafiek, zoeken op welke manier het moment waarop de mannen even snel lopen als de vrouwen gevonden wordt, $ nagaan of zo’n verregaande extrapolatie verantwoord is, $ op zoek gaan naar andere wetenschappers die hierrond onderzoek doen,…) Op de vrije encyclopedie ‘wikipedia’ [8] kun je de tijden van de olympische winnaars 100 m atletiek terugvinden. Met behulp van deze gegevens stelden we de onderstaande tabel op. $ $
Jaartal 1896 1900 1904 1908 1912 1920 1924 1928 1932 1936 1948 1952 1956 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004
Tijd winnaar Mannen 12 11 11 10,8 10,8 10,8 10,6 10,8 10,3 10,3 10,3 10,4 10,5 10,2 10 9,95 10,14 10,06 10,25 9,99 9,92 9,96 9,84 9,87 9,85
(in s) Vrouwen
12,2 11,9 11,5 11,9 11,5 11,5 11 11,4 11,08 11,07 11,08 11,06 10,97 10,54 10,82 10,94 10,75 10,93
37
Uitwiskeling 23/4 (herfst 2007)
2. Zet deze gegevens uit op een grafiek. (De onderstaande grafiek maakten we met een rekenblad. Je kunt ook een grafisch rekenmachine gebruiken. Olympische Spelen: 100 meter lopen Tijd winnaars 14 12
tijd (s)
10 8 6 4 2 0 1880
1900
1920
1940
1960
jaartal
1980
2000
2020 mannen vrouwen
) 3. Welke informatie kun je uit de grafiek afleiden? Klopt deze informatie ook met degene die je terugvindt in het artikel? Zou je een voorspelling kunnen maken over hoe de recordtijden in de toekomst verder evolueren? (De mannen lopen al langer mee dan de vrouwen. De mannen lopen sneller dan de vrouwen. Als je kijkt naar de evolutie in de tijd, dan lopen zowel de mannen als de vrouwen sneller dan vroeger. Mannen: eerste helft, een verbetering van bijna twee seconden, tweede helft een heel kleine verbetering van minder dan een seconde. Vrouwen: eerste helft een verbetering van meer dan een seconde, tweede helft een verbetering van hooguit een halve seconde. Je vindt veel van deze informatie terug in de tweede en derde paragraaf van het artikel. Als de evolutie zo verder gaat zullen beide groepen in de toekomst waarschijnlijk nog sneller gaan lopen.) De evolutie van de looptijden van beide groepen kan goed benaderd worden door een rechte. Zoals je kan zien gebeurde dat ook voor de grafiek van het artikel. De rechte die het best past bij een groep punten is de regressielijn. 4. Zoek de regressielijn voor de mannen en voor de vrouwen met behulp van ICT. (Een spreadsheetprogramma of je grafische rekentoestel kan de regressielijn (trendlijn) voor je berekenen.
38
onder de loep
Olympische Spelen: 100 meter lopen Tijden winnaars met lineaire trendlijn 14
y = -0.0168x + 44.347
12 tijd (s)
10
y = -0.0134x + 36.573
8 6 4 2 0 1850
1900
1950
2000
jaartal
2050 mannen vrouw en Lineair (vrouw en) Lineair (mannen)
) Dr. Tatem gebruikte deze grafieken om te voorspellen dat de vrouwen in 2156 even snel lopen als de mannen en zelfs sneller. 5. Ga na of dit voor jouw regressielijnen ook zo is. Vergelijk jouw resultaten met die van dr. Tatem en ga op zoek naar verschillen tussen beide grafieken. (Als je de rechten verder door tekent kun je op de x-as aflezen dat de vrouwen pas even snel als de mannen zullen lopen rond 2300. Dit is veel later dan bij Dr. Tatem.
t ijd ( s )
Olympische Spelen: 100 meter lopen Tijden winnaars met lineaire trendlijn en toekomst 14 12 y = -0.0168x + 44.347 10 8 y = -0.0134x + 36.573 6 4 2 0 1850 1950 2050 2150 2250 jaartal
2350 mannen vrouwen Lineair (vrouwen) Lineair (mannen)
) 6. Op welke manier kun je ervoor zorgen dat jouw resultaten beter overeenkomen met de resultaten in het artikel. Motiveer ook de wijzigingen die je aanbrengt.
39
Uitwiskeling 23/4 (herfst 2007)
(Het snijpunt van beide rechten verschuift naar links als de rechte van de mannen minder steil wordt. De eerste waarde van de mannen wijkt erg af van de andere waarden. Misschien was de tijdsmeting op dat moment nog erg gebrekkig? Wanneer je deze waarde niet meeneemt in het opstellen van de regressierechte krijg je een snijpunt dat goed overeenkomt met dat van dr. Tatem. Olympische Spelen: 100 meter lopen tijden winnaars met lineaire trendlijn en toekomst, één waarde minder voor de mannen
14 12
y = -0.0168x + 44.347
tijd (s)
10 8 6
y = -0.0115x + 32.841
4 2 0 1850
1950
2050
2150
jaartal
2250
2350 mannen vrouwen Lineair (vrouwen) Lineair (mannen)
) 7. Zoek het snijpunt met de x-as voor de rechte van de vrouwen. Welke fysische betekenis heeft dit snijpunt? (Het snijpunt is ongeveer (2640, 0). In 2640 zullen de vrouwen volgens dit model de 100 m in 0 s lopen. De mannen zullen dit stadium pas jaren later bereiken...) 8. Lees het onderstaand kalendermopje. Welk verband zie je met het artikel? (Zowel bij het kalendermopje als bij het artikel wordt een model gebruikt dat geëxtrapoleerd wordt ver buiten het gebied waarvoor het model opgesteld is.)
40
onder de loep
Na het oplossen van de werktekst is het zeker zinvol om samen met de leerlingen deze opgaven te kaderen. In wiskunde maak je vaak een model van de werkelijkheid. Zo’n model helpt je de situatie te vereenvoudigen en laat je toe om beperkt voorspellingen te doen. Deze voorspellingen komen (in min of meerdere mate) uit naarmate je model dichter bij de werkelijkheid staat. Belangrijk is te beseffen dat er aan elk model grenzen zijn. Bij de opbouw en het gebruik van het bovenstaande model zijn toch wel belangrijke bezwaren te formuleren: De keuze van een rechte ligt niet voor de hand. Ook al krijg je voor de laatste 100 jaar waarden die min of meer op een rechte liggen, er zijn zeker beperkingen aan het menselijk lichaam die tot gevolg zullen hebben dat we naar een bodemwaarde zullen evolueren voor de recordtijden. Een curve met een horizontale asymptoot is wellicht beter te verantwoorden. $ Extrapolatie van curven kan op korte termijn wel een perspectief bieden van hoe de dingen kunnen evolueren, op langere termijn wordt de betrouwbaarheid van de voorspelling erg bedenkelijk. Zeker wanneer de gemeten waarden lopen over een periode 100 jaar en de extrapolatie meer dan 150 jaar beslaat. De invloed van één enkele meting is al duidelijk zichtbaar wanneer we de laatste twee grafieken met elkaar vergelijken. $ Je kunt ook vraagtekens plaatsen bij de gebruikte dataset: er worden erg weinig data gebruikt om te spreken van statische resultaten, er zijn waarschijnlijk betere waarden dan de tijden van de olympische winnaars om mee te werken, invloeden van weer en wind werden niet in rekening gebracht,… Het volledige artikel zoals het in De Morgen verschenen is kun je op de website vinden. De journalist heeft geen wiskundige bezwaren geopperd of trekt het gebruikte model niet in twijfel. Hij heeft wel andere bronnen en informatie verwerkt in het artikel zodat dit artkel toch een genuanceerd beeld lijkt te geven. $
Het artikel is gebaseerd op een publicatie uit het tijdschrift Nature [6], waarin je in eerste instantie meer gefundeerde artikels verwacht. Het verbaasde ons dat we met erg beperkt opzoekingswerk al snel dezelfde resultaten kregen als in het artikel. De lezersbrieven bij het artikel wezen er ook op dat de auteurs veel reacties kregen. In hun repliek op deze brieven beschreven ze het artikel als een luchtig stukje. Vermoedelijk hebben ze veel plezier gehad met het schrijven ervan en de reacties die ze erop kregen. Misschien is het zelfs een strategie van Nature om af en toe zo’n luchtig stukje te publiceren om hun lezers kritisch te houden. Of ze hiermee in hun opzet slagen is wel de vraag, wanneer je ziet hoe dit artikel een eigen leven ging leiden…
9. Exponentiële groei Misvattingen bij het rekenen met exponentiële groei zijn schering en inslag. Dat onze leerlingen zich daarmee in koninklijk gezelschap bevinden, illustreert het krantenartikeltje uit de werktekst hieronder. Het sluit aan bij de leerstof over exponentiële functies in het vijfde jaar.
Groeiende economie in China China is een land met een sterk groeiende economie. Westerse landen proberen dan ook goede relaties te onderhouden met deze grote afzetmarkt van de toekomst. In het kader daarvan is eind 2004 een Belgische handelsmissie onder leiding van Prins Filip naar China getrokken. In
41
Uitwiskeling 23/4 (herfst 2007)
hun kielzog trok ook een groot leger journalisten mee. Hiernaast lees je een stukje uit één van hun verslagen .
Begin dit jaar bezocht een Belgische delegatie onder leiding van prins Filip China. De prins zag de toekomst van het land rooskleurig in en verklaarde dat China een groei kent van veertien procent. Dat is zoveel, dat ,,de mensen hun inkomen zullen zien verdubbelen in zeven jaar’’.
1. Hoe komt Prins Filip aan die zeven jaar? ( 14 % 7 " 98 . Dit zou betekenen dat er 98% bijkomt, wat ongeveer overeenkomt met een verdubbeling in zeven jaar tijd.) (uit: De Standaard 02/06/2005) 2. Bereken de werkelijke factor waarmee de Chinezen hun inkomen vermenigvuldigd zien na zeven jaar bij een jaarlijkse groei van 14%. Was Prins Filip te optimistisch of te pessimistisch? Vind je dit erg? (De factor is 1,14 7 & 2,5 . Hij was dus te pessimistisch. Op zich is dit misschien niet zo erg; het is best mogelijk dat deze sterke groei geen zeven jaar blijft duren, maar wat afzwakt.) 3. Bereken de verdubbelingstijd tot op één maand nauwkeurig. (De verdubbelingstijd t voldoet aan de vergelijking 1,14 t " 2 . Daaruit volgt dat log 2 t "1,14 log 2 " & 5,29 . De verdubbelingstijd is dus 5 jaar en 4 maanden.) log 1,14
10. Een cosinusfunctie De volgende werktekst maakt gebruik van een heel bijzondere krant: het Belgisch Staatsblad. Het is niet onmiddellijk een krant die bij de meeste mensen op de salontafel rondslingert, maar onbewust wordt heel wat van ons dagelijks leven geregeld door artikels in deze ‘krant’. Je kunt het staatsblad elektronisch te raadplegen op [1]. Verrassend genoeg publiceerde het Staatsblad enkele jaren geleden een stuk met daarin een cosinusfunctie. De werktekst is bruikbaar bij het onderdeel over de algemene sinusfuncties in de derde graad.
Verkeersdrempels We kennen ze allemaal wel: de verhogingen in het wegdek om de automobilisten te dwingen hun snelheid te verlagen. Ze zijn bedoeld om hinder te veroorzaken, maar deze hinder moet natuurlijk binnen de perken blijven. Daarom heeft de wetgever een beschrijving van de vorm van deze drempels opgenomen in de wet. Om nieuwe wetten aan de bevolking kenbaar te maken publiceert men die wetten in het Belgisch Staatsblad. In bijlage vind je een uitreksel uit de editie van 31 mei 2002 met de beschrijving van de toegelaten verkeersdrempels.
42
onder de loep
1. Bij 2.2 vind je in de wettekst een formule die de vorm van de verkeersdrempel beschrijft. Maak een schets van deze functie en duid er de verschillende parameters op aan. Uiteraard hoef je maar één periode te tekenen (maar je moet wel het goede deel tekenen). 2. Hoeveel is de maximale hoogte van de drempel bij een lengte van 4,20 meter? (De moeilijkheid zit hier de juiste informatie te vinden in het grote aanbod van informatie en de correcte interpretatie van ‘pro rata’. De maximale hoogte is dan (10 + 0,25·2) cm = 10,5 cm.)
De derde zin uit de algemene omschrijving (punt 1 in de tekst) legt vast hoe sterk de hinder mag zijn. Er staat “de toename van de verticale versnelling moet maximaal zijn voor een snelheid dicht bij de 30 km/h”. Wij hebben met de redactie van Uitwiskeling onze hoofden gebroken over de betekenis van deze zin. Wij zijn er niet uitgeraakt. Maar misschien is er wel ergens een lezer (of een kennis van een lezer) die wél begrijpt wat er staat. Laat het ons in dat geval a.u.b. weten.
43
Uitwiskeling 23/4 (herfst 2007)
44
onder de loep
11. Een volume berekenen Het onderstaande krantenartikeltje over het grootste paasei kan aanleiding geven tot een mooie onderzoeksopdracht. De opdracht is geïnspireerd op [4]. Indien je het in het zesde jaar na integralen geeft, kunnen er naast eenvoudige modellen, ook moeilijkere functies als model gebruikt worden. De leerlingen kunnen best per twee aan deze opdracht werken.
Grootste paasei
1.950 kilo chocolade in Sint-Niklaas Op de Grote Markt van Sint-Niklaas staat momenteel het grootste paasei ter wereld. Dat heeft de jury van Guinness World Records bevestigd. In samenwerking met de stad en het Waasland Shopping Center belegde de chocoladefabrikant Guylian een eivormige constructie met 50.000 repen. Het ei meet 8,32 meter bij 6,39 meter en klopt het record dat op 4 april 1996 werd bevestigd in Kwazulu-Natal, Zuid-Afrika. Daar werd een ei gebouwd van 7,65 meter hoog. Aan het Sint-Niklase paasei hebben 26 chocolatiers van Guylian samen 525 uren gewerkt. Er was 1.950 kilo chocolade voor nodig. (uit: De Standaard van 24/03/2005)
De opdracht bij dit artikeltje is eenvoudig: schat de dikte van de chocolade.
45
Uitwiskeling 23/4 (herfst 2007)
De opdracht is bewust heel kort en eenvoudig gehouden. De leerlingen moeten zelf kunnen beslissen welke oplossingsweg ze volgen en welke bijkomende informatie ze nodig hebben. Ze zullen wellicht eerst op zoek gaan naar een wiskundige beschrijving van het ei. Deze beschrijving kan een zeer ruwe benadering zijn (het ei beschrijven met een balk of een bol), of het kan wat verfijnder met een ellipsoïde of het aaneenplakken van een halve bol en een halve ellipsoïde. Er zijn krommen die nog veel beter de vorm van een ei beschrijven. Deze krommen vinden de leerlingen op internet. Indien ze ‘egg curves’ ingeven bij Google, komen ze zeker uit bij [9]. Daar vind je een hele verzameling krommen om eieren te beschrijven. Verder hebben ze ook nog gegevens nodig i.v.m. het soortelijk gewicht van chocolade. Ook hiervoor kun je gaan zoeken op het internet. Je vindt, afhankelijk van de bron, cijfers van 1,1 tot 1,3 kg/liter. Niets houdt hen echter tegen om zelf te experimenteren. Huis-, tuin- en keukenmateriaal is wellicht te weinig nauwkeurig om de dichtheid van chocolade te bepalen. Maar in het scheikundelabo op school lukt dat zeker wel! Onze eigen experimenten gaven een soortelijk gewicht van 1,24 kg/liter voor pure chocolade tot 1,26 kg/liter voor melkchocolade. De bedoeling van deze opdracht is niet alleen het rekenwerk, maar vooral dat de leerlingen leren opschrijven hoe ze te werk gegaan zijn: vanuit welke veronderstellingen zijn ze vertrokken (zoals bv. de veronderstelling dat het ei overal even dik is) en waarom kiezen ze voor een bepaald model? We geven hieronder de uitwerking voor enkele modellen.
Een balk als model We nemen de hoogte en de breedte als afmetingen voor de balk. Een volle balk even hoog en even breed als het ei heeft dan een volume van A " 63,9 2 % 83,2 dm 3 " 339 723,072 dm 3 . Het volume van de chocolade kunnen we berekenen uit het gegeven gewicht en de gevonden dichtheid. We gebruiken 1950 hier 1,25 kg/l. Dit geeft als volume B " liter = 1560 dm3. Indien de chocolade op alle zijvlakken 1,25 van de balk een dikte heeft van x cm, krijgen we als vergelijking
A ! '63,9 ! 2 x (2 % '83,2 ! 2 x ( " B . Deze vergelijking kunnen we oplossen met de solver van onze grafische rekenmachine. Dit geeft x = 0,053 dm. De dikte van de chocolade is dus ongeveer 5 mm.
Een bol als model Een bol geeft wellicht een betere benadering voor het ei dan een balk. Als diameter nemen we het gemiddelde van de hoogte en de breedte van het ei. Dit geeft R " 36,775 dm als straal van de bol. We 4 vinden dan als volume van de volle bol A " )R 3 " 208 327,525 dm3. Indien de chocolade weer dikte 3 x heeft, krijgen we nu als vergelijking 4 A ! ) '36,775 ! x (3 " B . 3
46
onder de loep
Deze vergelijking heeft als oplossing x = 0,092 dm. Met dit model is de dikte van het ei dus ongeveer 9 mm.
Een ellipsoïde als model Van de bol een ellipsoïde maken is alweer een stap dichter bij een eivorm. Voor een ellipsoïde die we 4 x2 y2 krijgen door de ellips " 1 te wentelen om de x-as wordt het volume gegeven door )ab 2 . 2 2 3 a b De leerlingen kunnen deze formule ofwel vinden op het internet, ofwel zelf opstellen m.b.v. integralen.
De hoogte van het ei nemen we als lengte van de grote as (= 2a) en de breedte als lengte van de kleine as (= 2b). Zo vinden we voor A " 177 878,585 dm3. De vergelijking die we nu moeten oplossen is 4 A ! ) '41,6 ! x ('31,95 ! x (2 " B . 3 De oplossing hiervan is x = 0,1015 dm. De dikte van het ei is nu dus ongeveer 10 mm. Een terechte vraag is of het ei in dit geval overal even dik is.
Een halve bol met een halve ellipsoïde als model Het model voor het ei ziet er dan ongeveer uit als in de figuur hieronder.
31,95
31,95
83,2 ! 31,95 = 51,25
47
Uitwiskeling 23/4 (herfst 2007)
De halve bol links heeft de halve breedte van het ei als straal. Dit is ook de halve kleine as van de halve ellipsoïde. De halve grote as nemen we zo dat de totale hoogte van het ei overeenstemt met de waarde uit het artikel. Voor het volume van het volle ei vinden we dan
1 4 1 4 % ) % 31,953 % ) % 31,95 2 % 51,25 2 3 2 3 1 4 " % ) % 31,95 2 % '31,95 51,25( 2 3 1 4 " % ) % 31,95 2 % 83,2 2 3 4 " ) % 31,95 2 % 41,6 3
A"
De waarde van A is dus exact dezelfde als in het vorige model. Bij het vereenvoudigen van de vergelijking die de dikte x bepaalt, krijgen we hetzelfde merkwaardige fenomeen.
2 2 A ! ) '31,95 ! x (3 ! ) '51,25 ! x ('31,95 ! x (2 " B 3 3 2 , A ! ) '31,95 ! x (2 *'31,95 ! x ( '51,25 ! x (+ " B 3 2 , A ! ) '31,95 ! x (2 '83,2 ! 2 x ( " B 3 4 , A ! ) '31,95 ! x (2 '41,6 ! x ( " B 3 Deze vergelijking is identiek dezelfde als bij het vorige model. De oplossing is bijgevolg ook dezelfde. De dikte van het ei is dus opnieuw ongeveer 10 mm.
Bibliografie
[1] Belgisch Staatsblad website, http://www.ejustice.just.fgov.be/cgi/welcome.pl [2] Eggermont, H., Kansen in de genetica, Uitwiskeling 19/3 (mei 2003), p. 8-11. [3] Herget, W., Die etwas andere aufgabe: Mehr und weniger, Mathematiklehren nr.138, (oktober 2006), p. 66. [4] Herget,W., Ostern kommt, Mathematiklehren nr. 140, (feb. 2007), p. 67.
48
onder de loep
[5] Paulos, J.A., Een wiskundige leest de krant, Bert Bakker (Amsterdam), 1995. [6] Tatem, A. (2004). Momentous sprint at the 2156 Olympics?: Women sprinters are closing the gap on men and may one day overtake them, Nature nr. 431, (september 2004), p. 525. [7] Van Hirtum,W., http://users.fulladsl.be/spb10695/verkeer20070419vijfbia4.pdf, geconsulteerd op 08/08/07 [8] Wikipedia,. Olympische zomerspelen 1948, Geraadpleegd 23 augustus 2007, http://nl.wikipedia.org/wiki/Olympische_Zomerspelen [9] www.mathematische-basteleien.de/eggcurves.htm
Johan, Hilde en Els
49