2 Verdelingen
1
Inhoudsopgave 2.0
Geboortes
3
2.1
Frequentieverdelingen
4
2.2
Kans
15
2.3
Op den duur …
20
2.4
Simulaties
28
2.5
Rekenen met kansen
32
2.6
De som van de kansen is 1
39
2.7
Voorwaardelijke kansen
42
2.8
Extra opgaven
48
2.9
Samenvatting Verdelingen
50
Bij dit hoofdstuk hoort een digimap. Daarin staan opgaven waarbij er iets met ict valt te beleven. Ze hebben hetzelfde nummer als de bijbehorende opgave in deze tekst. Je herkent ze aan het icoontje . Via de digimap kom je bij VU-Statistiek of op een website terecht. De opgaven in de digimap kunnen op drie manieren worden gebruikt: - niet, - aanvullend op de corresponderende opgave in deze tekst, - vervangend voor de corresponderende opgave in deze tekst.
Bij de opgaven waarvoor WB staat hoort een werkblad.
Colofon © 2009 cTWO Experimentele uitgave versie auteurs met medewerking van
Kansrekening en Statistiek, vwo, wiskunde A en C 2 (januari. 2012) Leon van den Broek, Maris van Haandel Simon Biesheuvel, Carel van de Giessen, Piet Versnel, Peter van Wijk
2
2.0 Geboortes Procentuele verdeling van het hoeveelste kind bij een bevalling wordt geboren naar leeftijd van de moeder, Vlaams Gewest, 2006. Primipaar = eerste kind, pariteit 1 = tweede kind, enz.
Aantal bevallingen per 1.000 vrouwen, opgesplitst naar nieuwe moeders (eerste kind) en vrouwen die al een of meer kinderen hadden, Vlaams Gewest, 2006.
Bron: http://www.zorg-en-gezondheid.be
Wat kun je uit deze verdelingen aflezen?
3
2.1 Frequentieverdelingen WB 1 In de eredivisie voetbal worden per seizoen 306 wedstrijden gespeeld. In 2006/2007 waren die als volgt verdeeld over het aantal doelpunten. aantal doelpunten aantal wedstrijden
0
1
2
3
4
5
6
7
8
9
18
46
63
58
52
35
19
10
3
2
Hieronder staat het bijbehorende histogram.
aantal wedstrijden
70 60 50 40 30 20 10 0
0
1
2
3
4 5 6 aantal doelpunten
7
8
9
a. In hoeveel procent van de wedstrijden werd niet gescoord? Deze verdeling is niet symmetrisch, maar “scheef”. b. Wat betekent dat, denk je? c. Bereken het gemiddelde van het aantal doelpunten per wedstrijd in het seizoen 2006/2007.
Het gemiddelde is de "evenwichtswaarde". Daarbij hoort het volgende idee. Denk je het histogram in alsof het is uitgezaagd uit een houten plaat; plaats onder het histogram een wig op de plaats van het gemiddelde; dan balanceert het histogram netjes op deze wig. 4
d. Welk van de drie posities van de wig hierboven is de juiste? Denk aan het evenwicht. De verdeling kan van jaar tot jaar verschillen. Maar denk je dat de verdeling in andere jaren heel anders is? In het seizoen 1996/97 was de verdeling als volgt: aantal doelpunten aantal wedstrijden
0
1
2
3
4
5
6
7
8
9
17
48
79
66
53
23
11
6
2
1
We gaan de verdelingen in de twee jaren vergelijken. e. Teken op het werkblad in dezelfde figuur als de verdeling van 2006/2007 het histogram van de verdeling in het seizoen 1996/1997. Voor het grootste deel vallen de histogrammen over elkaar heen. f. Hoeveel procent zit niet in de overlap? g. Vind je dat de verdelingen in de twee seizoenen veel verschillen?
2 Elk uur wordt in De Bilt de temperatuur gemeten. De resultaten van 8 uur ’s ochtends in de jaren 1981 t/m 2000 geven de volgende verdeling. a. Reken na dat er in die periode 7305 metingen zijn gedaan. 450 400
aantal metingen
350 300 250 200 150 100 50 0
-15
-10
-5
0
5
10
15
20
25
30
temperatuur in °C
b. Hoe groot is de gemiddelde temperatuur ongeveer? c. Er is iets verrassends (iets onlogisch) aan de verdeling. Wat? d. Hoe groot schat jij het percentage van de dagen dat de temperatuur om 8 uur ’s ochtends 20°C of hoger is.
3 De meisjes en de jongens van het Amalia College zijn als volgt verdeeld over de vier profielen: 11 leerlingen in CM, 42 in EM, 60 in NG en 41 in NT: a. Maak een staafdiagram van de verdeling van alle leerlingen van het Amalia College over de vier profielen. Landelijk waren in 2007 de keuzes op het vwo als volgt over de profielen verdeeld.
5
14% CM, 31% EM, 36% NG en 19% NT. b. Teken ook een staafdiagram bij deze landelijke verdeling.
Algemeen In een groep letten we op een zekere eigenschap (variabele). Die eigenschap kan bijvoorbeeld vier waarden hebben. De groep is verdeeld over de vier waarden: elke waarde komt een zeker aantal keren voor. We spreken dan van een frequentieverdeling. Als de verdeling in procenten van de totale groep is, spreken we van een relatieve frequentieverdeling. De som van de relatieve frequenties is 100 %.
frequenties
4 De meest extreme verdelingen zijn die waarbij 100% van de leerlingen voor één profiel kiest (en de andere profielen dus geen klanten hebben). De meest vlakke verdeling is die waarbij alle vier de profielen evenveel leerlingen hebben. Stel dat op een school het profiel EM twee keer zo veel leerlingen heeft als CM en dat het profiel NG ook twee keer zo groot is als NT. Stel dat de M-profielen (CM en EM) anderhalf keer zoveel leerlingen hebben als de N-profielen. Hoe is dan de frequentieverdeling?
waarden 5 Als je in een Engelse tekst van elk woord telt hoe vaak het voorkomt, dan blijkt het volgende. Het woordje "the" komt het vaakste voor, het woordje "of" komt op de tweede plaats, enzovoort. Hieronder staat de toptien: 1 the
2 of
3 and
4 to
5 a
6 in
7 that
8 it
9 is
10 was
Dit is zo voor elke (niet te korte) Engelse tekst. Georg Kingley Zipf, docent Duits aan de Harvard University heeft dit verschijnsel ontdekt en verder onderzocht. Dat was het begin van de kwantitatieve linguïstiek. Maar er is meer aan de hand. Zipf constateerde ook dat "the" ongeveer 2 keer zo vaak voorkwam als “of” en 3 keer zo vaak als “and”, 4 keer zo vaak als “to”, enzovoort. Dat is als volgt kort samen te vatten: in een natuurlijke taal is de frequentie waarmee een woord voorkomt ongeveer omgekeerd evenredig met de rang van het woord in de frequentietabel. Deze wet geldt zowel voor mensen met een grote woordenschat als voor mensen met een kleinere woordenschat. Het woordje "the" kwam in een zekere tekst 1200 keer voor. Teken een staafdiagram bij deze frequentieverdeling voor de tien meest voorkomende woordjes. 6
6 Alle kinderen die op de echopoli van kindercardiologie komen, krijgen een compleet echoonderzoek waarbij diverse dimensies en bloedstroomsnelheden van het hart worden gemeten. Als blijkt dat het kind geen grote afwijkingen heeft aan het hart, worden deze kinderen "normaal" genoemd. Van deze normaal gescoorde kinderen wordt ook de lengte en het gewicht gemeten. De gegevens zijn afkomstig van het Radboud Ziekenhuis te Nijmegen. De gewichten zijn ingedeeld in klassen. Hieronder staat een histogram van de frequentieverdeling. a. Kun je uit onderstaand histogram aflezen om hoeveel kinderen het ongeveer gaat? Kies uit 220, 1120, 2440, 4440. Het frequentiehistogram is verre van symmetrisch. b. Hoe komt dat? Het frequentiehistogram is niet zo regelmatig; het is nogal "springerig". c. Wat gebeurt er met die springerigheid als je de klassenbreedte twee keer zo groot neemt? Bekijk het databestand via de digimap. d. Experimenteer met verschillende klassenbreedtes. Welke klassenbreedte heeft je voorkeur? normals aantal
120
100
80
60
40
20
0 10
510
9 20
13 30
17 40
21 50
25 60
29 70
weights [kg]
7
33 80
37 90
41 100
7 Old Faithful is de beroemdste en actiefste geiser in het Amerikaanse Yellowstone National Park (Wyoming). In een uitbarsting kan de geiser tot 32.000 liter kokend water zo'n 56 m hoog spuiten. Een uitbarsting duurt tussen de 1½ en 6 minuten. De toeschouwer moet soms wel geduld hebben, want de tussenpozen tussen twee uitbarstingen variëren tussen drie kwartier en twee uur.
Van 272 erupties van de Old Faithful is gegeven: de duur en de wachttijd vanaf de vorige eruptie, beide in minuten. Bekijk de data via de digimap. a. Maak een histogram van de duren van de erupties. Kies zelf een geschikte klassenindeling. b. Ook van de wachttijden.
De verdelingen van de duur en de wachttijd zijn allebei tweetoppig. c. Hoe zie je dat in nevenstaand diagram?
8
Van histogram naar polygoon
8 Hoe oud is een vrouw als ze haar eerste kind krijgt? De gegevens voor Vlaanderen (2006) staan in de tabel hieronder: leeftijd frequentie
10-14 8
15-19 1113
20-24 5965
25-29 13302
30-34 6980
35-39 1874
40-44 237
45-49 5
50-54 2
Het betreft in totaal 29486 vrouwen. a. Hoeveel procent van de vrouwen is jonger dan 25 jaar als ze hun eerste kind krijgen. Als je wilt weten hoeveel procent van de vrouwen 20, 21 of 22 jaar oud is als ze hun eerste kind krijgen, heb je te maken met 3 van de 5 levensjaren in de klasse “20-24”. Een redelijke schatting van dat aantal vrouwen is 3/5 van 5965 = 3579. Dat klopt waarschijnlijk niet precies, maar het is het beste wat je op grond van de gegeven tabel kunt doen (zonder nadere informatie). b. Bepaal op grond van de tabel hoeveel procent ouder dan 26 maar jonger dan 31 jaar is? We hebben er een procentueel histogram bij gemaakt. 50 45 40 35 30 25 20 15 10 5 0
10
15
20
25
30
35
40
45
50
55
leeftijd
We hebben de middens van de bovenkanten van de opvolgende balken verbonden. Zodoende ontstaat er een zogenaamde frequentiepolygoon. Om de polygoon links en rechts op 0% te laten beginnen, is er aan weerszijden een lege klasse toegevoegd.
9
De hoogte van een staaf geeft het aantal of het percentage in de bijbehorende klasse. In plaats van de hoogte kun je ook op de oppervlakte letten. 50
Bijvoorbeeld in opgave 8: De oppervlakte van het histogram links van 27 jaar, inclusief 27 jaar zelf, geeft het percentage van de vrouwen van 27 jaar of jonger. De totale oppervlakte van de balken is 100%.
45 40 35 30 25 20 15 10 5 0
25 27 29
9 Inkomensverdeling in Nederland Het besteedbaar inkomen in Nederland is verdeeld in klassen van breedte 2000 euro. Er zijn 5000 gezinnen met een inkomen tussen -6000 en -4000 euro. Er zijn ook gezinnen met een besteedbaar inkomen boven de 100.000 euro, maar die zijn niet meer in de verdeling opgenomen. De gegevens zijn afkomstig van het CBS (2008) % 6 5 4 3 2 1 0 0
10
20
30
40
50
60
70
80
90 × 1000 euro
a. Hoeveel procent van de gezinnen had een besteedbaar inkomen van minder dan 20.000 euro? Merk op dat het totale percentage (van alle balken tezamen) 100% is.
10
Door de middens van de bovenkanten van de balken te verbinden, ontstaat de frequentiepolygoon.
0
10
20
30
40
50
60
70
80
90 × 1000 euro
b. Hoe kun je – in principe – hieruit aflezen hoeveel procent van de gezinnen een besteedbaar inkomen onder de 20.000 euro heeft?
Zie voor een aardige animatie: http://www.cbs.nl/nl-NL/menu/themas/inkomen-bestedingen/cijfers/extra/inkomensverdeling.htm Opmerking Het plaatje in opgave 2 is ook een frequentiepolygoon. Gevraagd werd het percentage te schatten van de dagen dat de temperatuur ’s ochtends om 8 uur 20°C of hoger is. Daarvoor moest je schatten welk deel van de oppervlakte rechts van 20 °C ligt.
10 Hoeveel uur slaapt een mens? Tijdens een onderzoek is met een EEG (elektro-encefalogram) de slaapduur vastgesteld bij 147 volwassenen (16-71 jaar) gedurende 399 nachten. De gegevens zijn van werkdagen (op vrije dagen slaapt men gemiddeld 1,5 uur langer). Bron: Waken en Slapen, Paul A. M. van Dongen, isbn 90-74078-02-8. Bekijk de frequentiepolygoon op de volgende bladzijde. a. Wat betekent de hoogste stip precies? b. Bepaal op grond van de polygoon zo goed mogelijk hoeveel procent van de mensen meer dan 7 uur en minder dan 9 uur slaapt als hij/zij de volgende dag moet werken.
11
30
%
25
20
15
10
5
0
5
6
7
8
9
10
11
uur
11 Hieronder zie je de relatieve (procentuele) verdelingen van de slaapduur van ouderen (70-79 jaar) en jongeren (20-29 jaar) (gebaseerd op onderzoek uit 1969). Het betreft de subjectieve slaapduur (zoals de mensen het zelf ervaren). jongeren (20-29 jaar) ouderen (70-79 jaar)
0
2
4
6
8
10
12
14
16
18
20
subjectieve slaapduur (uren) a. Noem twee verschillen tussen deze verdelingen. De mediaan (middelste) van de slaapduren is díe waarde waarboven en waaronder 50% zit van alle slaapduren. b. Bepaal zo goed mogelijk de mediaan van de slaapduur bij de jongeren en bij de ouderen. c. De modale slaapduur is de slaapduur die het meest voorkomt. Hoeveel procent ongeveer van de jongeren slaapt bovenmodaal? En hoeveel procent van de ouderen? 12
De twee krommen snijden elkaar bij 5,5. Anne zegt dat er evenveel ouderen als jongeren zijn die gemiddeld 5,5 uur slapen. d. Is dat juist?
12 Spaanse exportsinaasappelen zijn gewogen. Hieronder staat de frequentiepolygoon van de gewichten.
100
120
140
160
180
200 gram
a. Hoeveel procent weegt minder dan 160 gram? Schrijf ook op hoe je te werk bent gegaan. b. Hoeveel wegen de zwaarste 10 procent (ongeveer)? c. Hoe groot is de mediaan?
13 We bekijken het aantal uren dat een baan per dag telt in Luilekkerland. Dat varieert tussen 0 en 5 uur per dag. Hieronder zie je hoe de banen over de verschillende groottes verdeeld zijn.
uur a. Hoeveel procent van de banen wordt gerepresenteerd door één hokje? b. Hoeveel procent van de banen heeft een omvang tussen 1 en 2 uur per dag? c. Ga door een berekening na of een baan van 1,5 uur groter of kleiner dan de mediaan is.
13
14 Bekijk de bevolkingspiramide van Nederland op 1 januari 2007. Een bevolkingspiramide is een grafische weergave van een frequentieverdeling, apart voor mannen en vrouwen. a. Op welk kenmerk zijn de mannen en de vrouwen verdeeld? b. Verklaar de "uitschieters" van 60-jarigen. c. Schat de mediaan van de leeftijden van de Nederlanders. d. Schat hoeveel procent ouder dan 80 jaar was (op 1 januari 2007). Van een zekere leeftijd is 2 van de 3 Nederlanders vrouw. e. Welke leeftijd is dat (ongeveer)?
Op de site van het CBS kun je de ontwikkeling van de bevolkingspiramide in het verleden en toekomst volgen: http://www.cbs.nl/nl-NL/menu/themas/bevolking/cijfers/extra/piramide-fx.htm
Opmerking Langs de verticale as van de verdelingen in opgaven 9, 10, 12 en 13 staat niets. Dat kan ook niet. Je gebruikt de oppervlakte onder de grafiek, waarbij de totale oppervlakte op 100% is gesteld. Bij opgave 12 vertegenwoordigt één hokje 5%, bij opgave 13 is één hokje 2%.
Hieronder staat de grafiek van de verdeling van de bevolking van Luilekkerland over de verschillende lengtes. Op de horizontale as staat de lengte in cm. • Wat weet je van de lengte van de mensen in Luilekkerland te vertellen? • Wat kun je uit deze grafiek aflezen? • Hoe doe je dat?
50
14
70
90
110
130
150
170 cm
2.2 Kans 15 We gebruiken nog eens de context en de gegevens van opgave 8. Hieronder staat weer de tabel voor de 29486 bevallingen van het eerste kind in Vlaanderen, 2006. leeftijd 10-14 frequentie 8
15-19 1113
20-24 5965
25-29 13302
30-34 6980
35-39 1874
40-44 45-49 50-54 237 5 2
a. In hoeveel procent van de bevallingen is de vrouw jonger dan 20 jaar? Ook herhalen we het histogram. 50 45 40 35 30 25 20 15 10 5 0
10
15
20
25
30
35
40
45
50
55
leeftijd
b. Wat betekent je antwoord op vraag a voor het histogram?
Een Vlaamse vrouw gaat zo dadelijk bevallen van haar eerste kind. We kennen de vrouw verder niet. Hoe oud kan ze zijn? Zeker tussen de 10 en 54 jaar. In 3,8% van de bevallingen is de vrouw jonger dan 20 jaar. We zeggen ook wel: de kans dat de vrouw jonger dan 20 jaar is, is 3,8%.
c. Wat is de kans dat de vrouw jonger is dan 30 jaar en ouder dan 19 jaar? 15
16 Hoeveel doelpunten vallen er per voetbalwedstrijd in de eredivisie? Dat staat voor het seizoen 2010/2011 in onderstaande tabel. Er zijn per seizoen 306 wedstrijden. aantal doelpunten aantal wedstrijden
0
1
2
3
4
5
6
7
8
9
10
18
34
66
65
53
35
21
7
5
1
1
We nemen aan dat deze tabel voor elk seizoen geldt. Anne heeft geen verstand van voetballen en gaat met haar vriend naar een voetbalwedstrijd. a. Wat is de kans dat die in 0-0 eindigt? b. Wat is de kans dat Anne ten minste vijf doelpunten gaat zien?
WB 17 Jaarlijks wordt de hoeveelheid neerslag in De Bilt geregistreerd. Van de resultaten in de jaren 1980 t/m 2009 is een histogram gemaakt, met klassenbreedte 5 cm. 7 6
aantal jaren
5 4 3 2 1 0 1 60 2
3 70 4
5 80 6
7 90 8
910010 1111012 13120 14
1513016 17
cm neerslag
Neem aan dat het neerslagpatroon sindsdien niet is gewijzigd. a. Wat is dan de kans dat in het komend jaar meer dan 1 meter neerslag valt in De Bilt? b. Wat is de kans dat er tussen de 9 dm en 1 meter neerslag valt? c. Teken op het werkblad de frequentiepolygoon. d. Leg uit dat de oppervlakte onder de polygoon even groot is als de totale oppervlakte van het histogram (dus 30). e. Bepaal de kans in de vragen a en b nog eens met de polygoon. Merk op dat het histogram en de polygoon niet precies dezelfde kans geven.
16
18 Hieronder zie je nog eens de relatieve (procentuele) verdelingen van de slaapduur van ouderen (70-79 jaar) en jongeren (20-29 jaar). jongeren (20-29 jaar) ouderen (70-79 jaar)
0
2
4
6
8
10
12
14
16
18
20
subjectieve slaapduur (uren) Jan maakt kennis met de opa van zijn nieuwe vriendin. Die behoort tot de ouderen. a. Wat is de kans ongeveer dat opa denkt dat hij minder dan 4 uur per nacht slaapt? Jan is een jongere van 24 jaar. We kennen hem niet en weten niets van zijn slaapgewoontes. b. Wat is de kans ongeveer dat Jan tussen 6 en 10 uur per nacht denkt te slapen.
19 Luilekkerland bevalt ons wel; we brengen het opnieuw een bezoek. De omvang van een baan ligt in Luilekkerland tussen 0 en 5 uur. Hieronder zie je hoe de banen over de verschillende groottes verdeeld zijn. In opgave 13 vroegen we naar percentages; nu vragen we naar kansen. Verder zijn het precies dezelfde vragen.
uur a. Wat is de kans dat een willekeurige Luilekkerlander een baan heeft met een omvang tussen 1 en 2 uur? b. Wat is de kans dat een willekeurige Luilekkerlander een baan heeft van ten hoogste 1,5 uur?
17
Een groep is verdeeld op een kenmerk. Stel dat het kenmerk een discrete variabele is, die als waarden de gehele getallen van 5 t/m 15 kan aannemen. Van de verdeling is het relatieve frequentiestaafdiagram gegeven: de percentages waarmee elk van de waarden 5 t/m 15 voorkomt zijn dus bekend. De kans op een waarde kleiner dan 10 is dan de som van de percentages van de waarden 5 t/m 9. oppervlakte van de staven bij 5, 6, 7, 8 en 9 Dat is . oppervlakte van alle staven 5
Stel dat het kenmerk een continue variabele is, die als waarden alle getallen van 5 t/m 15 kan aannemen. Van de verdeling is de relatieve frequentiepolygoon gegeven: voor elk interval is het percentage bekend dat de waarde daarin ligt. De kans op een waarde kleiner dan 10 is dan hoeveel procent het deel tussen 5 en 10 is van het geheel. oppervlakte links van 10 . Dat is totale oppervlakte Een kans laat zich uitdrukken als een percentage (tussen 0% en 100%) en ook als een (verhoudings-) getal (tussen 0 en 1).
18
5
10
10
15
15
De bevolking van Nederland is verdeeld over twaalf provincies, zoals te zien is in onderstaand staafdiagram. 4.000.000
3.500.000
3.000.000
2.500.000
2.000.000
1.500.000
1.000.000
500.000
0
Gro 1
Fri 2
Dre 3
Ove 4
Fle 5
Gel 6
Utr 7
NHo 8
ZHo 9
Zee 10
NBr 11
Lim 12
Wat is de kans dat de ministerpresident in 2050 afkomstig is uit een zuidelijke provincie (Noord Brabant, Limburg of Zeeland)? Neem aan dat alle provincies gelijkwaardig zijn. Dat wil zeggen dat er niet bij voorbaat een voorkeur dat de ministerpresident uit een bepaald deel van Nederland komt.
Hoe oud wordt een kat? Dat kun je hieronder aflezen.
Er is zojuist weer een katje geboren. Wat is de kans ongeveer dat het katje ouder dan 12 jaar wordt?
19
2.3 Op den duur … 20 In 2010 stond de onderstaande grafiek op het internet. Hij betreft het gemiddelde van het aantal doelpunten per wedstrijd dat gemaakt is tijdens het WK Voetbal 2006 in Duitsland. Horizontaal is het aantal gespeelde wedstrijden uitgezet, verticaal het gemiddelde aantal doelpunten tot dan toe.
a. Hoeveel doelpunten werden er in de tweede wedstrijd gemaakt? b. Hoeveel doelpunten werden er in de zevende wedstrijd gemaakt? Wat opvalt is dat de schommelingen in de grafiek in het begin nogal heftig zijn, maar dat ze verderop veel minder voorkomen. En dat is niet (alleen maar) toevallig. c. Leg dat uit.
20
Series herhalingen
21 Iemand heeft 500 keer met een dobbelsteen
150
geworpen. Het resultaat staat hiernaast. 120
Dit is goed te simuleren met VU-statistiek, Simulatie, Dobbelstenen (via de digimap).
90
66 van de 500 keer viel de dobbelsteen op 5 ogen. Anne zegt dat de kans op 5 ogen dus
60
66 = 0,132 is. 500
30 0
1
2
3
4
5
6
a. Wat is daarop je commentaar? b. Hoe vaak verwacht je 5 ogen in een volgende serie van 500 worpen?
22 Er is een serie van twintig worpen met een munt gedaan: k k m k k k m m k k k m m m m k m m k k. Na elke worp werd het percentage kop genoteerd dat tot dan toe was gegooid. Na de eerste worp en na de tweede worp was dat dus 100%. Na drie worpen hadden we: k k m. Toen was het percentage kop 66 32 %. a. Wat werd het percentage kop na zes worpen? En na de twintigste worp?
Hieronder staat een grafiek van het verloop van het percentage: % 100 80 60 40 20 0 1
3
5
7
9
11
13
15
17
19
aantal worpen
b. Controleer je antwoorden op vraag a in de grafiek. c. Stel dat er nog een eenentwintigste worp zou volgen. Wat wordt het percentage kop als deze eenentwintigste worp kop zou zijn? En wat als hij munt zou zijn?
21
We laten de computer nog twee series van twintig worpen produceren. 100 80 60 40 20 0 1
3
5
7
9
11
13
15
17
19
De twee plaatjes lijken op elkaar, maar zijn niet precies hetzelfde: het begin is heel verschillend, de staarten lijken op elkaar. d. Waarom verbaast je dat niet? Een munt valt gemiddeld even vaak op kop als op munt. Op de computer is dat gemakkelijk te veranderen. Stel dat we kop gemiddeld 9 keer zo vaak laten optreden als munt. Weer doen we een serie van 20 worpen en tekenen daar een plaatje bij. e. Wat zal het grote verschil zijn tussen dit plaatje en de vorige plaatjes? We veranderen de gemiddelde frequentie van kop opnieuw. Dat leverde het volgende plaatje op. 50 40 30 20 10 0 1
3
5
7
9
11
13
15
17
19
f. Wat is de verhouding van de frequenties kop : munt nu ongeveer, denk je? Wat is de kans op kop ongeveer?
23 We kunnen de computer ook met een dobbelsteen laten gooien. Steeds kijken we of het aantal ogen 1 is of niet. We doen een serie van 1000 worpen. Na elke worp bepalen we het percentage 1’en tot dan toe. Je kunt daar weer een plaatje bij tekenen. a. Wat kun je van dat plaatje zeggen? Bij een dobbelsteen en een munt is bekend met welke gemiddelde frequentie de mogelijke uitkomsten optreden. Tenminste, als er niet met de dobbelsteen of met de munt geknoeid is (dan komt elk van de mogelijke uitkomsten gemiddeld even vaak voor). Als je met een punaise werpt, kan die in twee standen eindigen: met de punt omhoog of met de punt op de grond. In hoeveel procent van de worpen die twee standen voorkomen, is niet bekend. Hieronder staat het plaatje waarbij we de relatieve frequentie-tot-dan-toe van de stand "punt omhoog" hebben gevolgd.
22
1,2
1
0,8
0,6
0,4
0,2
0 1
6
11
16
21
26
31
36
41
46
51
56
61
b. Wat zijn de eerste tien worpen? (Kort af: "punt omhoog" = H , "punt omlaag" = L) c. Hoe zie je gemakkelijk in het plaatje bij een worp in welke stand de punaise viel? d. Hoe groot schat jij dat de relatieve frequentie op den duur van de stand "punt omhoog" is? Hoe groot is de kans op "punt omhoog" ongeveer?
24 Wordt het een jongen of een meisje? Er worden ongeveer evenveel jongens als meisjes geboren, maar niet precies evenveel. De verhouding jongen: meisje is ongeveer 513 : 487. a. Hoe kan men dat weten? b. In Nederland worden jaarlijks zo'n 196000 kinderen geboren. Hoeveel jongens en hoeveel meisjes ongeveer? c. Hoeveel jongens ongeveer worden er per 1000 meisjes geboren? d. Wat is de kans op een jongen? e. Je zou dus verwachten dat er meer mannen dan vrouwen zijn. Maar dat is juist niet zo: op 1 januari 2011 waren er 8.243.482 mannen en 8.412.317 vrouwen in Nederland. Heb je hier een verklaring voor?
23
25 Als je twee raszuivere groene erwten kruist, krijg je 100% raszuivere groene nakomelingen. (Raszuiver betekent dat de erwt alleen drager is van de groene eigenschap.) Als je twee raszuivere gele erwten kruist, krijg je 100% raszuivere gele nakomelingen. Wat gebeurt er nu als je een raszuivere groene erwt kruist met een raszuivere gele erwt? De nakomelingen zijn dan allemaal geel, maar niet raszuiver! Dat blijkt uit de tweede nakomelingen (de nakomelingen van de nakomelingen); daar zijn zowel groene als gele exemplaren bij. Wel zijn er meer gele dan groene. De Tsjechische monnik Gregor Mendel deed uitgebreide experimenten met erwten. Hij bestudeerde de overerving van zeven verschillende eigenschappen. Dat waren: vorm en kleur van de zaden, vorm en kleur van de bloemen, vorm en kleur van de peulen, lengte van de stengels. De tweede nakomelingen telden 6022 exemplaren met gele zaden en 2001 met groene zaden. Dit en de andere aantallen staan in het overzicht hieronder.
5474
Gregor Mendel 1822 - 1884
a. Wat is de verhouding tussen de aantallen met gele zaden en met groene zaden afgerond? b. Hoe is die verhouding bij elk van de andere zes eigenschappen ongeveer? Mendel trok op grond van deze resultaten de volgende conclusie. Bij kruising tussen twee raszuivere variëteiten - de een met een zekere eigenschap, de ander zonder die eigenschap zullen de tweede generatie nakomelingen die eigenschap wel of niet hebben. En wel in een vaste verhouding. c. Tot welke verhouding besloot Mendel, denk je? Als je er vanuit gaat dat er inderdaad een vaste verhouding is, kun je van alle kenmerken de grote aantallen optellen en ook de kleine aantallen, en de verhouding tussen de twee sommen bekijken. d. Bevestigt die verhouding je antwoord op vraag c? e. Is het niet verontrustend dat bij geen van de zeven eigenschappen die Mendel onderzocht deze mooie verhouding precies uitkwam?
24
De wet van de grote aantallen
Voorbeeld Je gooit met een (oneerlijke) munt die met kans 0,4 op kop valt. In een serie van 1000 worpen zal het aantal keer kop in de buurt van 400 liggen. 400 De relatieve frequentie van het aantal kop zal dus dicht bij 1000 liggen. (Maar precies wel erg toevallig zijn.)
400 1000
zou
Bij een experiment kan iets gebeuren of niet. Als het gebeurt, spreken we van een "treffer". Veronderstel dat de kans op een treffer 0,4 is. Als het experiment vaak herhaald wordt, nadert het gemiddelde aantal treffers altijd tot 0,4. Dit staat bekend als de wet van de grote aantallen.
De wet van de grote aantallen is voor het eerst geformuleerd in 1689 door de Zwitser Jacob Bernoulli. Deze wet zegt dat je de ware kans op een treffer kunt achterhalen door (zeer) vaak het experiment te herhalen. Hoe vaak, dat weet je niet van tevoren.
Theoretische kansen De kans op vijf ogen bij een worp met een dobbelsteen is
1 6
.
We gaan nader op deze uitspraak in. Als je vaak met een dobbelsteen werpt, zal je ongeveer 1 op de 6 keer 5 ogen krijgen. Bij de ene serie zul je er wat minder vijven hebben, bij een andere wat meer. In de praktijk blijken dobbelstenen niet perfect te zijn. De meeste hebben een systematisch verschil met die "1 op 6". De afwijking is weliswaar niet zo groot, maar duidelijk aanwezig. Toch gaat men er bij berekeningen vanuit dat de zes grensvlakken van een dobbelsteen gemiddeld even vaak boven zullen komen te liggen (even waarschijnlijk zijn). Er is immers geen duidelijke reden waarom 5 ogen vaker zou voorkomen (een grotere kans zou hebben) dan 2 ogen. En dan moet de totale kans 1 (=100%) dus eerlijk verdeeld worden over de zes mogelijke aantallen: allemaal 16 . In de wiskunde gaan we, als we met een dobbelsteen werpen, ervan uit dat die ideaal is: de kans op elk van de aantallen ogen is exact Zo ook bij andere kansmechanismen.
25
1 6
.
26 a. Wat zijn de kansen bij het werpen van een munt? Een regelmatige vijfhoek is verdeeld in vijf driehoeken, genummerd 1, 2, 3, 4 en 5. Steek een pin door het middelpunt en je hebt een kanstol. b. Wat zijn de kansen bij het draaien van deze kanstol? Iemand pakt (willekeurig) een kaart uit een kaartspel en let op de "kleur" (klaveren, ruiten, harten, schoppen). c. Wat zijn de kansen? Iemand pakt (willekeurig) een kaart uit een kaartspel en let op de "rang" (2 t/m 10, Boer, Vouw, Heer, Aas) d. Wat zijn de kansen? In de trommel van de lotto zitten de ballen 1 t/m 45. Er wordt een bal uit de trommel getrokken; we letten op het nummer. e. Wat zijn de kansen? Iemand beantwoordt een driekeuzevraag puur op de gok. Eén van de drie alternatieven is goed. We letten op goed/fout. f. Wat zijn de kansen? De randomgenerator van je rekenmachine produceert "toevalsgetallen" van tien cijfers achter de komma, bijvoorbeeld 0,1058347538. g. Wat is de kans op elk van die toevalsgetallen? Bij een loterij op een braderie worden 100 loten verkocht. Miss Braderie zal tien winnende loten trekken. Iemand koopt een lot en wint een prijs of niet. h. Wat zijn de kansen? Iemand kiest willekeurig een getal van twee cijfers, dus van 10 t/m 99. We letten op het aantal even cijfers. Dat kan 0, 1 of 2 zijn. i. Wat zijn de kansen?
Bij een toevalsexperiment zijn er verschillende uitkomsten mogelijk. De totale kans van 100% is verdeeld over de verschillende uitkomsten. Die verdeling noemen we een kansverdeling. Veronderstel dat er zeven uitkomsten mogelijk zijn. Als die gelijkwaardig zijn (gemiddeld even vaak voorkomen), zeggen we dat elk van die uitkomsten kans 17 heeft. Als drie van de zeven uitkomsten speciaal zijn (en de andere vier niet), is de kans op een speciale uitkomst 73 . Soms is het verstandig kansen als decimale breuken te schrijven (en die af te ronden): 1 = 0,142857… ≈ 14% en 73 = 0,428571… ≈ 43%. 7
26
100
Iemand werpt herhaaldelijk met een (eventueel niet geheel zuivere) munt. Hiernaast staat het verloop van de relatieve frequentie van het aantal keer kop t/m de twintigste worp. Hoe groot schat jij de kans op kop? Hoeveel zal je schatting na de eenentwintigste worp veranderen? Hoe ziet het verloop van de relatieve frequentie van het aantal keer munt eruit t/m de twintigste worp? We werpen met drie dobbelstenen en willen weten wat de kans is op drie gelijke aantallen ogen. Hiernaast staan alle mogelijke resultaten. Wat is de kans op 543? • Wat is de kans op drie gelijken?
• Zeg precies hoe je de kans op drie kop bij het werpen met drie munten kunt achterhalen?
27
80 60 40 20 0 1
3
5
7
9
11
13
15
17
19
111 112 113 114 115 116 131 132 133 134 135 136 151 152 153 154 155 156
121 122 123 124 125 126 141 142 143 144 145 146 161 162 163 164 165 166
211 212 213 214 215 216 231 232 233 234 235 236 251 252 253 254 255 256
221 222 223 224 225 226 221 242 243 244 245 246 261 262 263 264 265 266
311 312 313 314 315 316 331 332 333 334 335 336 351 352 353 354 355 356
321 322 323 324 325 326 341 342 343 344 345 346 361 362 363 364 365 366
411 412 413 414 415 416 431 432 433 434 435 436 451 452 453 454 455 456
421 422 423 424 425 426 441 442 443 444 445 446 461 462 463 464 465 466
511 512 513 514 515 516 531 532 533 534 535 536 551 552 553 554 555 556
521 522 523 524 525 526 541 542 543 544 545 546 561 562 563 564 565 566
611 612 613 614 615 616 631 632 633 634 635 636 651 652 653 654 655 656
621 622 623 624 625 626 641 642 643 644 645 646 661 662 663 664 665 666
2.4 Simulatie 27 Voetbaluitslagen Vanaf het seizoen 1956-1957 speelden er achttien clubs in de eredivisie voetbal. Dat geeft 306 wedstrijden per jaar. Alle uitslagen daarvan kun je vinden op www.koningvoetbal.nl a. Ga naar die site en bepaal hoe groot de kans ongeveer is op de uitslag 0 – 0. b. Welk gelijkspel heeft de grootste kans?
28 Gratis toegang tot Chimpie Champ Bij de entree van de overdekte kinderspeelplaats Chimpie Champ krijg je een kaart. Er zijn zes verschillende kaarten. Als je vier verschillende hebt, mag je een keer gratis naar binnen. Hoeveel keer kan het duren voordat je vier verschillende kaarten hebt? Minimaal vier keer natuurlijk. Maar om in vier keer alle vier de kaarten ook echt te hebben, moet je veel geluk hebben. Trouwens om in vijf of zes keer vier verschillende te hebben, is ook nog niet zo zeker. Anderzijds heb je wel heel veel pech als je in bijvoorbeeld tien keer nog niet vier verschillende hebt. Door heel vaak naar Chimpie Champ te gaan en te kijken na hoeveel keer je vier verschillende kaarten hebt, kun je de kansverdeling van het aantal keer achterhalen. Maar dat is niet praktisch. Handiger is om de bezoeken aan Chimpie Champ te simuleren (na te bootsen). a. Hoe zou je dat met een dobbelsteen kunnen doen? Beschrijf precies hoe het gaat. Een andere vraag is: hoeveel verschillende kaarten heb je na zes bezoeken? b. Wat zijn de mogelijke aantallen? c. Hoe zou je het krijgen van zes kaarten kunnen simuleren om achter de kansverdeling van het aantal verschillende kaarten te komen? Hiernaast staat een kanshistogram van het aantal verschillende kaarten na zes bezoeken. d. Wat is de kans ongeveer dat je na zes keer nog geen vier verschillende hebt?
Je kunt het kaarten-krijgen bij Chimpie Champ simuleren met VU-statistiek, Simulaties, Toevalsregen (via de digimap). d. Controleer daarmee of het kanshistogram hierboven ongeveer klopt.
28
1
2
3
4
5
6
29 In de herfst van 2009 had Albert Heijn een reclameactie. Bij elke 15 euro aan boodschappen kreeg de klant een figuur uit het sprookje Sneeuwwitje en de zeven dwergen van de gebroeders Grimm. Er waren er vijftien: Sneeuwwitje, de Prins, de boze Koningin, de Heks, de zeven dwergen: Doc, Sleepy, Happy, Grumpy, Sneezy, Bashful en Dopey, de Jager en nog drie dieren uit het bos: de Schildpad, de Wasbeer en het Hert. Het werd een rage om alle vijftien de figuren te bemachtigen, tot aan ruilbeurzen toe. Maar van ruilen zien we nu even af.
We buigen ons over de vraag: Hoe vaak moet je 15 euro aan boodschappen uitgeven om met kans 50% alle vijftien de sprookjesfiguren te bemachtigen? Die vraag is niet zo maar te beantwoorden. Anne denkt dat de helft van de mensen met 30 keer boodschappen van 15 euro wel alle vijftien de sprookjesfiguren zal hebben verzameld. a. Denk je dat Anne te optimistisch of te pessimistisch is?
Je kunt dit simuleren met VU-Statistiek, Simulaties, Toevalsregen (via de digimap). b. Doe dat.
30 Trekkingen lotto 2009 De lotto is een bekend kansspel. Er vallen zes genummerde balletjes en een gekleurd balletje uit een trommel: de zogenaamde trekking. De speler heeft zes nummers op zijn lottoformulier aangekruist en ook een kleur. Hoe meer overeenkomst er is met de trekking, des te hoger de prijs. In Nederland zijn er 45 balletjes: 1 t/m 45, en zes kleuren: geel, groen, blauw, oranje, rood en paars. De nummers hebben allemaal evenveel kans om in een trekking voor te komen en de kleuren hebben ook allemaal evenveel kans. Elk zaterdag is er een trekking, en de laatste zaterdag van de maand zijn er twee.
a. Ga na dat er 64 trekkingen per jaar zijn.
29
Hieronder zie je van elke trekking van 2009 hoe vaak elk nummer en elke kleur voorkwamen. 1 11
2 9
3 9
4 1
5 3
6 15
7 6
8 9
9 10
10 11
11 15
12 5
13 14
14 5
15 17
16 9
17 7
18 11
19 5
20 8
21 7
22 6
23 6
24 11
25 12
26 10
27 6
28 4
29 8
30 8
31 10
32 11
33 5
34 9
35 9
36 6
37 11
38 7
39 9
40 3
41 8
42 12
43 8
44 10
45 8
geel 11
groen 12
blauw 10
oranje 12
rood 9
paars 10
b. Hoe vaak zal elk nummer gemiddeld voorkomen in 64 trekkingen? c. Wat is dus de kans dat bijvoorbeeld nummer 23 voorkomt in een trekking? d. Welke nummers waren in 2009 onderbedeeld? In de tabel hieronder vind je hoeveel van de nummers 0 keer voorkwam, hoeveel 1 keer, hoeveel 2 keer, enzovoort. aantal keer 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 voorkomen aantal 0 1 0 2 1 4 5 3 6 7 4 6 2 0 1 2 0 1 nummers
e. Maak een frequentiestaafdiagram waarbij het-aantal-keer-voorkomen van een nummer horizontaal wordt uitgezet. f. Bevestigt deze verdeling het antwoord op vraag b?
31 Ga naar het computerprogramma VU-statistiek, Simulaties, Steekproeven (via de digimap). a. Hoeveel verschillende aantallen blauwe vierkantjes zijn er mogelijk bij een steekproef van 10. De steekproef kun je willekeurig vaak herhalen. Daarna krijg je een frequentiestaafdiagram te zien van het aantal blauwe vierkantjes in de steekproeven. b. Experimenteer met het programma. We kiezen voor de volgende instellingen: - populatieomvang: 5000 - steekproefomvang: 50 - aantal steekproeven: 100. Stel dat we nevenstaand resultaat krijgen. c. Wat betekent de geïsoleerde stip links? d. Schat het percentage blauw. e. Hoe groot is de kans ongeveer op 15 of meer blauwe vierkantjes in de steekproef?
30
0,1 0,2 0,3 Steekproefpercentage blauw
Met VuStat kun je ook het werpen met een munt simuleren. We stellen de kans op kop in op 0,4. We doen een serie van 50 worpen en tellen in die serie het aantal keer kop. We maken 40 van deze series, met nevenstaand resultaat:
• Hoe groot schat jij op grond van deze simulatie de kans dat er in een serie van 50 meer kop dan munt geworpen wordt? • Hoe kun je de kans op meer kop dan munt in een serie van 50 worpen met deze munt met grotere zekerheid bepalen? Anne schat op grond van het resultaat dat de kans op 18 of 19 kop in een serie van 50 worpen met deze munt 10% is. • Hoe komt Anne aan haar schatting, denk je? • Geef commentaar op Annes schatting, gezien de hele lijst van frequenties. • Hoe groot schat jij de kans op 18 of 19 kop in een serie van 50 worpen met deze munt op grond van het resultaat?
31
aantal kop 10-11 12-13 14-15 16-17 18-19 20-21 22-23 24-25 26-27 28-29
frequentie 1 0 3 9 4 13 6 3 0 1
2.5 Rekenen met kansen WB 32 Stroomdiagrammen helpen je om kansen te berekenen. We werpen 1000 keer met drie munten en maken daar als volgt een stroomdiagram bij. We letten eerst op de eerste munt: valt die op kop, dan gaan we bij de eerste wegensplitsing naar boven; valt die op munt, dan gaan we naar beneden. Daarna letten we op de tweede munt; valt die op kop dan gaan we bij de tweede wegensplitsingen naar boven; anders gaan we naar beneden. Evenzo voor de derde munt bij de derde wegen-splitsingen. Hieronder zie je het stroomdiagram.
In ongeveer de helft van de gevallen zal de eerste munt op kop vallen en ga je in de eerste wegensplitsing naar boven. Je verwacht dat dat 500 van de 1000 keer zal gebeuren. En je verwacht dus dat je 500 keer naar beneden gaat bij de eerste splitsing. Die getallen 500 zijn allebei al in het stroomdiagram geschreven. Ook staan de kansen (fracties) bij de wegen. a. Geef op het werkblad aan hoe de aantallen zich verder over de wegen verdelen en schrijf de kansen bij de overige wegen. b. Kleur in het stroomdiagram de route die hoort bij drie keer kop. Schrijf aan het eind van die route KKK. c. In hoeveel van de 1000 worpen verwacht je 3 kop? Wat is dus de kans op 3 kop? d. Schrijf ook achter de overige routes het resultaat. Met bijvoorbeeld KKM geef je aan dat de eerste twee munten op kop zijn gevallen en de derde op munt. e. In hoeveel van de 1000 worpen verwacht je 2 kop en 1 munt? Wat is dus de kans op 2 kop en 1 munt? f. Wat is de kans op 1 kop en 2 munt? g. Wat is de kans op 3 munt? h. Wat is de som van de hierboven berekende kansen?
32
WB 33 Een kleine test bestaat uit drie vierkeuzevragen. Je kunt deze vragen op de gok beantwoorden. We zijn geïnteresseerd in het aantal goede antwoorden. We stellen ons voor dat maar liefst 1600 mensen de test op de gok maken. Daarbij hoort het volgende stroomdiagram. Vraag 1
Vraag 2
Vraag 3 G
G
F
G
F
G
F
G
1600 F
G
F
F
Merk op dat de routes GGF, GFG en FGG samenkomen in hetzelfde eindpunt. a. Vul het stroomdiagram verder in en zet de aantallen goede antwoorden achter de eindpunten. b. Wat is de kans dat een gokker alle drie de vragen goed gokt. c. Wat is de kans dat een gokker precies één vraag fout heeft? d. Wat is de kans dat een gokker precies twee vragen fout heeft? e. Wat is de kans dat je alle drie de vragen fout hebt? f. Hoe kun je de antwoorden op vraag c, d, e en f controleren? Doe dat. g. Waarom zijn we, denk je, met 1600 mensen zijn begonnen? Maakt het wat uit voor de hierboven berekende kansen als je met een ander aantal begint? h. Hoeveel mensen hebben de tweede vraag goed? Wat is dus de kans dat een gokker de tweede vraag goed heeft?
33
WB 34 De minilotto is een spel waarbij je twee nummers moet omcirkelen op een formulier:
Slechts één combinatie van twee cijfers is winnend. We laten maar liefst 600 mensen dit spel spelen. Hieronder staat een stroomdiagram bij deze situatie.
a. Vul het stroomdiagram verder in. Zet de kansen bij de pijlen en schrijf de resultaten achteraan: 0 goed, 1 goed of 2 goed. b. Wat is de kans dat je de winnende combinatie van twee cijfers hebt omcirkeld. c. Bereken ook de kans op 0 cijfers goed en de kans op 1 cijfer goed. d. Je speelt dertig dagen mee in de minilotto, elke dag met één formulier. Hoe vaak verwacht je dan te winnen?
35 Het is niet nodig om bij de minilotto een heel stroomdiagram te tekenen; met behulp van een zogenaamde kansboom kun je ook de kansen uitrekenen. Een kansboom krijg je door bij een stroomdiagram de aantallen weg te laten; er staan alleen nog kansen bij de takken. Hiernaast staat een kansboom voor de minilotto.
34
Kansen op bepaalde uitkomsten bereken je door de kansen langs de takken te vermenigvuldigen: bijvoorbeeld de kans op 2 cijfers goed is 12 ⋅ 13 = 16 . a. Leg uit dat je de kans dat precies één van jouw aangekruiste nummers wordt getrokken als volgt kunt berekenen: 12 ⋅ 23 + 12 ⋅ 23 . b. Bereken ook de kans dat geen van jouw aangekruiste nummers wordt getrokken.
Het doel van deze paragraaf is dat je kansen leert berekenen met behulp van kansbomen. Misschien lukt jou dat nu nog niet. Werk dan voorlopig nog met een stroomdiagram. In dat geval moet je wel zelf nadenken over een geschikt aantal om mee te beginnen.
36 Bij een iets grotere minilotto worden drie nummers uit de getallen 1 tot en met 7 getrokken. Op het spelformulier kruist de speler drie nummers uit 1 tot en met 7 aan. a. Maak bij deze minilotto een kansboom. Schrijf de kansen bij de takken. Geef achter alle takken het behaalde resultaat aan: 0 goed, 1 goed, 2 goed of 3 goed. b. Wat is de kans op 3 goed bij deze minilotto? c. Geef ook de kans op 0 goed, de kans op 1 goed en de kans op 2 goed. Bij de echte lotto worden 6 getallen uit de 45 getrokken. De speler kruist ook 6 getallen op zijn formulier aan. d. Wat is de kans op 6 goed bij de echte lotto? Je kunt (een deel) van een kansboom tekenen.
37 Een pistool heeft een draaibaar magazijn waarin plaats is voor zes kogels. Bij Russisch roulette wordt één van de zes plaatsen met een kogel geladen. De persoon die dit “spel” speelt geeft het magazijn een flinke draai, zet de loop tegen zijn slaap en haalt de trekker over. Iemand neemt zich voor dit "spel" zes keer te spelen. a. Je kunt dit nabootsen met een dobbelsteen. Leg uit hoe. We willen de kans te weten komen om een serie van zes keer Russisch roulette te overleven. b. Speel daarvoor twintig series van zes keer met een dobbelsteen. Noteer bij elke serie of je dood bent of niet. Hoe groot schat jij de kans om een serie van zes keer Russisch roulette te overleven? c. Vergelijk jouw resultaat met dat van klasgenoten. Hoe groot schat jij nu de kans om een serie van zes keer Russisch roulette te overleven? d. Teken een (deel van een) kansboom bij dit “spel” en bereken daarmee de gevraagde kans.
35
38 Stef en Leon gaan een avondje stappen. Wat later op de avond komen ze een café binnen waar aan de bar negen lege barkrukken op een rij staan. Ze zijn wat aangeschoten. Daardoor nemen ze, zonder verder op elkaar te letten, op een kruk plaats. Er is een kans dat Stef en Leon naast elkaar gaan zitten. We gaan een kansboom tekenen waarmee we deze kans kunnen berekenen. We letten eerst op de kruk waar Stef op gaat zitten. a. Welke twee soorten krukken moet je daarbij onderscheiden? b. Maak de kansboom en bereken daarmee de kans dat Stef en Leon naast elkaar komen te zitten.
39 Als Anne van school naar huis fietst, komt zij twee verkeerslichten tegen. Het eerste verkeerslicht staat met kans 0,4 op groen en met kans 0,6 op rood (de tijd dat het licht op oranje staat verwaarlozen we). Als dit verkeerslicht op rood staat, kan Anne in de helft van de gevallen toch doorrijden, omdat er geen verkeer aankomt (en dat doet ze dan ook). Het tweede verkeerslicht staat met kans 0,3 op groen en met kans 0,7 op rood. Als dit licht op rood staat, kan Anne in 40% van de gevallen toch doorrijden. a. Maak een bijbehorende kansboom. b. Bereken de kans dat Anne bij beide verkeerslichten gaat stoppen. c. Bereken de kans dat Anne bij beide verkeerslichten gaat doorrijden.
Bij de volgende opgaven staat er niet meer bij of je een kansboom of een stroomdiagram moet maken. Er wordt van jou verwacht dat je hier zelf over nadenkt en vervolgens doet wat jij het beste vindt.
40 Het CBR (Centraal Bureau Rijvaardigheidsbewijzen) publiceert jaarlijks de gegevens van het percentage mensen dat hun rijbewijs haalt. Omdat de kans dat je de eerste keer slaagt kleiner is dan de kans dat je de tweede keer slaagt, zijn de gegevens uitgesplitst naar het aantal pogingen.
1e keer op 2de keer op 3de keer op daarna
Slagingspercentage 48% 65% 72% 80%
a. Wat is de kans dat een willekeurige Nederlander in twee keer zijn rijbewijs haalt? b. Wat is de kans dat iemand zijn rijbewijs na drie keer rijexamen doen nog steeds niet heeft?
In 2009 nam het CBR 407.773 rijexamens voor rijbewijs B af. Er werden 209.182 eerste examens en 198.591 herexamens afgenomen. c. Hoeveel personen slaagden in 2009 naar verwachting de eerste keer? d. Kun je zeggen hoeveel personen de tweede keer slaagden?
36
41 Jeanine speelt even goed tennis als haar moeder. Een partijtje tegen haar moeder wint ze met kans 0,5. Ze speelt veel beter dan haar vader. Een partijtje tegen haar vader wint ze met kans 0,8. Jeanine krijgt van haar ouders een bromfiets als ze in een serie van drie partijen, afwisselend tegen haar vader en haar moeder, twee maal achter elkaar wint. a. Tegen wie zou jij beginnen als je Jeanine was, tegen haar vader of tegen haar moeder? En waarom? b. Bepaal de kans dat Jeanine de bromfiets wint als ze tegen haar vader begint. c. Bepaal ook de kans dat ze de brommer wint als ze tegen haar moeder begint.
42 Anne heeft in principe elke woensdagmiddag bijles van de heer Nijdam. Maar Anne is nogal ziekelijk: gemiddeld moet ze 30% van de bijlessen afzeggen. De heer Nijdam is een drukbezet man; hij is gemiddeld 20% van de woensdagen verhinderd. a. Wat is de kans dat de heer Nijdam van drie opeenvolgende woensdagen er twee verhinderd is? b. Bereken de kans dat de bijles op een willekeurige woensdag niet doorgaat.
43 In een volière in een dierenzaak zitten drie exemplaren van een zeldzame vogelsoort: 1 mannetje en 2 vrouwtjes. Het geslacht van zo'n vogeltje kun je op afstand niet zien. Daarvoor moet je het eerst uit de volière halen en van dichtbij bekijken. Willem wil de twee vrouwtjes kopen. De verkoper haalt steeds één vogeltje uit de volière. Blijkt dat het mannetje te zijn, dan stopt hij het weer terug in de volière; blijkt het een vrouwtje te zijn, dan geeft hij het aan Willem. Vervolgens pakt de verkoper opnieuw een vogeltje; net zo lang tot Willem zijn twee vrouwtjes heeft. Elke keer dat de verkoper een vogeltje uit de volière pakt, noemen we een trekking. Bij elke trekking hebben de vogeltjes die nog in de kooi zitten evenveel kans om gepakt te worden. a. Wat is de kans dat bij de tweede trekking een vrouwtje wordt gepakt? b. Bepaal de kans dat er twee trekkingen nodig zijn om de twee vrouwtjes te pakken. c. Bepaal de kans dat er drie trekkingen nodig zijn om de twee vrouwtjes te pakken.
44 Een bommelding blijkt in 50 van de 100 gevallen loos alarm te zijn. Na de melding gaat de opsporingsdienst aan het werk en wanneer er werkelijk een bom aanwezig is, vindt men deze in 95 van de 100 gevallen. a. Hoe groot is de kans dat er na een willekeurige bommelding geen bom wordt gevonden? b. Als er geen bom gevonden wordt (dat is in 2100 van de 4000 gevallen), wat is dan de kans dat er toch een bom aanwezig is?
37
Hieronder staat het stroomdiagram van een toevalsexperiment dat bestond uit drie stappen. Als in een stap de pijl naar boven gaat spreken van “plus” en anders van “min”. Alleen aan de toppen zijn de (verwachte) aantallen ingevuld. 10 20 30 40 50 60 70 80
• Vul de andere aantallen in. • Maak er een kansboom bij. • Wat is de kans op 2 minnen en 1 plus? We bekijken twee experimenten. Het ene experiment heeft mogelijke uitkomsten 1, 3 en 5 met kansen achtereenvolgens 13 , 12 en 16 , het andere heeft uitkomsten 2 en 4 met kansen achtereenvolgens 25 en 53 . • Maak een kansboom. • Wat is de kans dat het tweede experiment een lagere uitkomst geeft dan het eerste?
38
2.6 De som van de kansen is 1 45 In een hoed zitten zes kaarten. Op elke kaart staat één cijfer. De cijfers zijn 6, 7, 7, 8, 8 en 8. Uit de hoed worden zonder te kijken twee kaartjes getrokken (dus zonder terugleggen). a. Teken een kansboom hierbij (met acht “toppen”, dat zijn de uiteinden). Vermeld bij elke top het resultaat en de kans op dat resultaat (het resultaat eerste kaart 7, tweede kaart 8 geef je aan met 7,8). Als je de kans wilt weten dat er ten minste één kaartje wordt getrokken zonder het cijfer 7, kun je zeven kansen optellen. Maar het kan handiger. b. Hoe? c. Wat is de kans op minstens één kaartje met het cijfer 8? Wat is de kans op geen enkel kaartje met het cijfer 8. Hoe kloppen die kansen met elkaar? We letten nu op de som S van de cijfers die op de twee getrokken kaartjes staan. d. Welke uitkomsten kan S allemaal hebben? e. Wat is de kans dat S = 13? En wat is de kans dat S = 14, dat S = 15 en dat S = 16? Hoe kloppen deze vier kansen met elkaar?
46 Anne, Barbara en Cleo zijn vriendinnen. Ze willen graag weten op welke dag van de week ze geboren zijn. Dat kunnen ze uitzoeken met een eeuwigdurende kalender die ze op internet hebben gevonden. Ze vragen zich af hoeveel van hen zondagskinderen zijn. a. Maak een bijbehorende kansboom. (Hoeveel toppen?) b. Bereken handig de kans dat één of meer van hen een zondagskind is.
Over kansbomen Bij opgave 46 kun je twee kansbomen maken. Door voor elke dag een aparte tak te nemen; en dat voor elk van de drie kinderen. Dan krijg je een kansboom van 7 ⋅ 7 ⋅ 7 = 343 toppen. Bij elke tak is de kans 17 . 1 Alle 343 toppen hebben kans 17 ⋅ 17 ⋅ 17 = 343 . Door twee mogelijkheden te onderscheiden: zondag en niet-zondag. Dan krijg je een kansboom met 2 ⋅ 2 ⋅ 2 = 8 toppen. De helft van de takken heeft kans 17 , de andere helft kans 67 .
De kansen bij de toppen zijn nu
1 343
,
6 343
,
6 343
,
36 343
39
,
6 343
,
36 343
,
36 343
en
216 343
.
47 Harrie en Ferdie spelen een tennispartij. Zo'n partij bestaat uit een aantal sets. Winnaar van de partij is degene die het eerst twee sets gewonnen heeft. Harrie en Ferdie spelen even sterk; bij elke set hebben ze beiden kans 1 om te winnen. a. Hoeveel sets worden er minstens gespeeld? En hoogstens? b. Teken een kansboom bij deze tennispartij. Schrijf bij elk uiteinde de bijbehorende uitkomst (met HFH kun je aangeven dat Harrie de eerste set wint, Ferdie de tweede en Harrie weer de derde). Schrijf er ook de kans bij. c. Wat is de kans dat de partij 2 sets duurt? En dat de partij 3 sets duurt?
48 We gaan verder met het tennissen van Harrie en Ferdie. Na hun eerste partij besluiten Harrie en Ferdie om nog een partij te spelen, maar nu gaan ze door tot een van hen drie sets gewonnen heeft. a. Zo'n partij wordt ook wel best of five genoemd. Kun jij dat uitleggen? b. Wat is de kans dat Harrie de eerste drie sets wint? c. Wat is de kans dat de partij maar drie sets duurt? d. Wat is de kans dat de partij minstens vier sets duurt?
Bij een kansexperiment is de som van de kansen op alle mogelijke uitkomsten gelijk aan 1. Als bij een kansexperiment bijvoorbeeld de mogelijke uitkomsten 7, 8, 9, 10 en 11 zijn, dan is het volgende vaak handig: • de kans op minstens waarde 8 = 1 − de kans op waarde 7 • de kans op hoogstens waarde 10 = 1 − de kans op waarde 11
49 Het water in de rivieren staat erg hoog. De dijk om een polder heeft drie zwakke plekken. Deskundigen schatten dat voor elk van de plekken de kans 0,2 is dat de dijk daar doorbreekt. Als de dijk op een van de plekken doorbreekt, komt de hele polder onder water te staan. a. Bereken de kans dat de dijk op geen van de drie zwakke plekken doorbreekt. b. Bereken de kans dat de polder onder water komt te staan op twee manieren: één keer als de som van zeven kansen en één keer door gebruik te maken van de som van de kansen is 1.
50 Je gooit net zo lang met een dobbelsteen tot je alle aantallen ogen minstens één keer boven hebt gehad. a. Hoe groot is de kans dat je daar precies 6 worpen voor nodig hebt? b. Wat is de kans dat je daar minstens 7 worpen voor nodig hebt? 51 Een steenfabriek levert trottoirtegels in pakketten van 15 tegels. Een aannemer bestelt 50 pakketten. Omdat er wel eens tegels tussen zitten die veel breuken vertonen, voert de aannemer vooraf een controle uit. Hij kiest 5 van de 50 pakketten en controleert daarin de tegels. Als alle tegels in deze 5 pakketten goed zijn gaat de bestelling door. Neem aan dat bij de bestelling 6 pakketten zitten met één of meer gebroken tegels. Bereken de kans dat de bestelling niet doorgaat.
40
52 Bij een finalewedstrijd voetbal die ook na verlenging gelijk staat, worden strafschoppen genomen. Op grond van de statistieken weten we dat het Nederlands elftal bij het nemen van een strafschop 70% kans heeft om deze te benutten. We bekijken een serie van vijf strafschoppen van het Nederlands elftal.
a. Bereken de kans dat het Nederlands team tijdens deze serie een of meer strafschoppen mist. Een tegenstander van het Nederlands elftal weet met 90% kans een strafschop te benutten. Beide teams nemen elk vijf strafschoppen.
b. Bereken de kans dat minstens één van beide teams alle strafschoppen weet te benutten. c. Bereken de kans dat minstens één van de beide teams een of meer strafschoppen mist.
Iemand doet een serie van tien worpen met een muntstuk. Van elke worp noteert hij de uitkomst: K(op) of M(unt). Hiernaast staan twee mogelijke series.
• Bereken de kans dat er twee of meer keer na elkaar dezelfde uitkomst voorkomt. • Dezelfde vraag als het muntstuk niet zuiver is, maar met twee keer zoveel kans op K valt als op M.
41
KMMKMKKKMK MKMKMKKKKM
2.7 Voorwaardelijke kansen 53 Vraag 16 van de Nationale Wetenschapsquiz 2003 luidde als volgt: Met een steekproef testen we de deelnemers aan de tiende Nationale Wetenschapsquiz op een verboden pepmiddel. Stel dat tien procent van de deelnemers het pepmiddel gebruikt. De test is slechts voor negentig procent zuiver. Een deelnemer blijkt pep-positief. Hoe groot is de kans dat hij het pepmiddel daadwerkelijk heeft gebruikt? a) Minder dan vijftig procent. b) Vijftig procent. c) Meer dan vijftig procent. Voor alle duidelijkheid: met de zinsnede "de test is voor slechts negentig procent zuiver" wordt bedoeld dat de test in 10% van de gevallen een verkeerde uitslag geeft. Dus 10% van de gebruikers wordt pep-negatief getest en 10% van de niet-gebruikers wordt pep-positief getest. a. Teken een stroomdiagram bij deze test uitgaande van 200 deelnemers waarvan 10% gebruikers. b. Hoeveel procent van de deelnemers wordt pep-positief getest? c. Hoeveel procent van de deelnemers wordt pep-positief getest en is ook gebruiker? d. Wat is het goede antwoord op vraag 16 van de Nationale Wetenschapsquiz 2003? Leg uit.
In opgave 53 was er sprake van twee percentages: • het percentage met een positieve uitslag überhaupt, • het percentage met een positieve uitslag onder de pep-gebruikers. Bij het tweede percentage gaat het niet over de hele populatie, maar over een select deel daarvan. Er wordt dan een voorwaarde aan de deelnemer gesteld. Zo’n voorwaarde heeft meestal invloed op het percentage.
Met tabellen Met behulp van gegevens in tabellen kunnen we bepaalde kansen eenvoudig aflezen. Soms staan er aantallen in de tabel, soms ook kansen. In het eerste geval spreken we van een frequentietabel, in het tweede geval van een kanstabel.
Voorbeeld 1. Kleurenblindheid Uit een onderzoek onder 1000 personen (527 mannen en 473 vrouwen) komen de volgende gegevens over kleurenblindheid en geslacht naar voren. Op de onderste rij en in de rechterkolom staan de randtotalen.
42
Kleurenblind Niet kleurenblind
Man 42 485 527
Vrouw 7 466 473
49 951 1000
Met behulp van de tabel kunnen we snel een aantal kansen schatten: • De kans dat iemand kleurenblindheid is, is 49/1000 = 0,049 = 4,9%. • De kans dat iemand kleurenblind en man is, is 42/1000 = 0,042 = 4,2%. Je kunt ook kijken naar kansen in een deel van de data, bijvoorbeeld alleen naar de mannen of alleen naar de kleurenblinde mensen. • De kans dat een man kleurenblind is, is 42/527 = 0,080 = 8,0%.
54 a. Wat is de kans dat een vrouw kleurenblind is? b. Wat is de kans dat een kleurenblind persoon een vrouw is? Het is duidelijk dat kleurenblindheid afhankelijk is van het geslacht. Bij mannen komt kleurenblindheid immers veel vaker voor dan bij vrouwen. Mucoviscidose (taaislijmziekte) is de meest voorkomende erfelijke, niet-besmettelijke longziekte. Ongeveer 1400 Nederlanders hebben deze ziekte. Mucoviscidose is onafhankelijk van het geslacht. c. Hoeveel Nederlandse vrouwen ongeveer hebben mucoviscidose?
55 Het al dan niet sport beoefenen is in Nederland nagenoeg onafhankelijk van het geslacht. a. Zeg in eigen woorden wat dat betekent. Of men een dagelijkse roker is, is wel afhankelijk van het geslacht. b. Zeg in eigen woorden wat dat betekent.
56 Een autoreparatiebedrijf heeft twee verfspuiters in dienst, Willem en John. Willem spuit 60% van alle auto's. Bij regelmatige controles is gebleken dat 4% van de auto's die door Willem gespoten werden, niet aan de kwaliteitseisen voor spuitwerk voldeed. Bij John was dit 8%. a. Maak een frequentietabel bij bovenstaande gegevens. Ga bijvoorbeeld uit van 1000 auto’s. b. Hoeveel procent van de auto's voldoet niet aan de kwaliteitseisen? c. Hoeveel procent van de auto’s die aan de kwaliteitseisen voldoen, is door Willem gespoten? d. Hoeveel procent van de auto’s die niet aan de kwaliteitseisen voldoen, is door Willem gespoten?
43
57 De meeste slagmannen bij honkbal hebben een voorkeur voor linkshandige of rechtshandige werpers. Zo ook John, die bij een linkshandige werper slechts 15% honkslagen slaat en bij een rechtshandige werper 35%. In de competitie waarin John speelt is 20% van de werpers linkshandig. a. Maak een frequentietabel bij deze gegevens. b. Wat is de kans dat John een honkslag slaat tegenover een willekeurig gekozen werper? c. Hoeveel procent van John's honkslagen slaat hij tegenover een rechtshandige werper?
58 De Mantoux-test Zo nu en dan vindt in ons land een tuberculose-uitbraak plaats. Om mensen in de omgeving die ook besmet zijn op te sporen wordt de zogenaamde Mantoux-test gebruikt. Deze test is rond 1900 ontwikkeld door de Franse arts Charles Mantoux. De test werkt niet feilloos: van degenen met een tuberculosebesmetting reageert 98% positief op de test. Bovendien reageert 1% van degenen die niet besmet zijn ook positief op de test. Daarom worden mensen die positief reageren nogmaals getest met dezelfde test, die een nieuwe uitslag geeft, onafhankelijk van de eerste test. Stel dat er in een stad met 250.000 inwoners 100 gevallen van tuberculosebesmetting zijn (dat is 0,04%). We maken een tabel voor het geval dat alle Positief Negatief inwoners van die stad getest worden. a. Vul de frequentietabel hiernaast in. Wel TBC
Geen TBC
b. Wat is de kans op tuberculose na een positieve uitslag van de test? c. Wat is de kans op tuberculose na een negatieve uitslag van de test? d. Wat is de kans op tuberculose na een positieve test en een positieve hertest?
Met kansen Als je de kansen weet, kun je die omzetten in aantallen, door uit te gaan van een geschikt totaal aantal. Welk totaal aantal je kiest doet er niet toe. Je kunt daarom ook met kansen rekenen. Schrijf die kansen in de tabel als (decimale) breuken, niet als percentages. Percentages werken vaak verwarrend. Is de gevraagde kans eenmaal berekend, dan mag deze natuurlijk weer als percentage worden genoteerd.
Voorbeeld 2. Defecte producten Machine I, machine II en machine III maken alledrie hetzelfde product. Machine I neemt 50% van de productie voor zijn rekening, machine II 30% en machine III 20%. Machine I produceert 1% defecten, machine II 2% en machine III 3%.
44
Om de gegevens overzichtelijk weer te geven maken we een kanstabel. Voor de drie machines staan hierin de fracties goede en defecte producten. Eerst zetten we rechtsonder de totale kans 1 neer. Vervolgens leiden we uit de gegevens de randtotalen 0,5 , 0,3 en 0,2 af. Vervolgens kunnen we de kansen van de binnenste cellen van de tabel berekenen. Ten slotte kunnen we hiermee de randtotalen van de fracties goede en defecte producten berekenen. Dit alles leidt tot de volgende kanstabel (met kansen in drie decimalen):
Goed Defect
Machine I 0,495 0,005 0,500
Machine II 0,294 0,006 0,300
Machine III 0,194 0,006 0,200
0,983 0,017 1,000
Zodoende hebben we de volgende kansen bepaald. Het percentage goede producten = de kans op een goed product 0,983 = 98,3%. De kans dat een defect product door machine II is gemaakt is 0,006/0,017 = 0,353 = 35,3%.
Als je het lastig vindt met kansen te werken, kun je ook een frequentietabel maken door van een aantal van bijvoorbeeld 1000 producten uit te gaan.
Notatie Kansen worden vaak kort en bondig als volgt genoteerd. • Gewone kansen: “De kans op een goed product” wordt P(goed product). • Voorwaardelijke kansen: “De kans dat een defect product door machine II is gemaakt” wordt P(machine II | defect product). Voor de verticale streep staat de eigenschap waarnaar we op zoek zijn: hier de producten die door machine II zijn geproduceerd. Na de verticale streep staat de voorwaarde: hier de defecte producten. We zijn dus geïnteresseerd in het deel van de defecte producten dat door machine II is geproduceerd. De letter P staat voor ‘Probabilitas’; dat is Latijn voor ‘kans’. 30% van de eredivisiewedstrijden voetbal eindigt in een gelijkspel. Dus P(gelijkspel) = 0,3. Hoe wordt deze kans beïnvloed in de volgende voorwaardelijke kansen? P(gelijkspel | een van de ploegen is Ajax) , P(gelijkspel | ruststand is 4 – 0) , P(gelijkspel | de spelers ontvangen een winstpremie van 10000 euro)
Maak bij de volgende opgaven telkens eerst zelf een geschikte (frequentie- of kans-)tabel.
59 Van de Nederlandse automobilisten is 58% man en 42% vrouw. Van de mannelijke automobilisten ontvangt jaarlijks 55% één of meerdere bekeuringen wegens te hard rijden. Bij de vrouwelijke automobilisten is dat percentage slechts 10%. a. Hoeveel procent van de Nederlandse automobilisten ontvangt jaarlijks één of meerdere bekeuringen wegens te hard rijden? b. Hoeveel procent van de bekeurde automobilisten is een man? 45
60 Het vak statistiek wordt op een bepaalde faculteit afgesloten met een tentamen en eventueel een hertentamen. Op basis van resultaten uit de afgelopen jaren is bekend dat 55% van de studenten uiteindelijk (na een eventueel hertentamen) een voldoende haalt voor dit vak. Van de studenten die gedurende de collegeperiode regelmatig opgaven geoefend hebben, haalt 80% uiteindelijk een voldoende voor dit vak. Het percentage studenten dat regelmatig oefent wordt geschat op 35%. Iemand beweert dat oefenen voor statistiek weinig zin heeft. a. Wordt de bewering door deze gegevens ondersteund? b. Hoeveel procent van de studenten die uiteindelijk een voldoende hebben voor statistiek, heeft regelmatig geoefend?
61 Voor de productie van gevoelige druktoetsen heeft een fabriek twee machines in bedrijf. De machines zijn even goed: de kans op een foute druktoets is bij beide machines 0,65%. Machine I neemt 60% van de productie voor zijn rekening, machine II 40%. a. Maak een kanstabel: Goed Fout Machine I Machine II
b. Is het goed-zijn van een druktoets onafhankelijk van de machine? Dat wil zeggen: is de kans dat een druktoets goed is op beide machines hetzelfde? We bekijken dit algemener. Veronderstel dat het goed-zijn van een druktoets onafhankelijk is van de machine. Veronderstel dat de kansen door welke machine een druktoets gemaakt is en of een druktoets goed of fout is bekend zijn. c. Hoe kun je de kanstabel dan verder maken?
62 Iemand werpt twee keer met een dobbelsteen. a. Is het aantal ogen bij de tweede worp onafhankelijk van het aantal ogen bij de eerste worp? Iemand trekt twee kaarten uit een stapeltje van vier kaarten: twee boeren en twee azen. b. Is het resultaat (boer of aas) bij de tweede kaart onafhankelijk van het resultaat bij de eerste kaart? Licht je antwoord toe.
46
In een land leven twee bevolkingsgroepen, de Langen en de Korten. In beide groepen komt een ziekte voor. Hieronder staan de kansen op het hebben van de ziekte, apart voor de Langen en de Korten Zo is P(Lang en Niet) = x. Wel Niet Lang 0,1 x Kort 0,2 y
• Wat is het verband tussen x en y? • Druk P(Wel | Lang) uit in x? • Wat weet je van x en y als het hebben van de ziekte onafhankelijk is van de bevolkingsgroep? • Wat weet je van x en y als een Lange meer risico heeft de ziekte te krijgen dan een Korte?
47
2.8 Extra opgaven 63 Een zekere elektrische stroomkring is opgebouwd uit twee elementen: A en B. De kans dat element A (in een bepaalde periode) uitvalt is 0,3. De kans dat element B uitvalt is 0,25. We bekijken eerst het geval dat A en B parallel geschakeld zijn. a. Teken een kansboom voor het al of niet uitvallen van de stroom in de kring. b. Bereken de kans dat de stroom uitvalt. c. Bereken de kans dat de stroom niet uitvalt. Neem nu het geval dat A en B in serie geschakeld zijn. d. Teken een kansboom voor het al of niet uitvallen van de stroom in de kring. e. Bereken de kans dat de stroom niet uitvalt. f. Bereken de kans dat de stroom wel uitvalt.
64 Op de lijn Arnhem-Utrecht is de kans 20% dat je in de trein gecontroleerd wordt op een geldig vervoersbewijs (per enkele reis). Door de week reist Jaap ’s ochtends van Arnhem naar Utrecht en ’s middags weer terug naar Arnhem. Jaap besluit op een maandag om geen kaartje te kopen voor de heen- en terugreis. a. Hoe groot is de kans dat Jaap die dag tegen de lamp loopt? Jaap werd die maandag niet gecontroleerd. Hij besluit daarom ook de rest van de week zonder kaartje te reizen. b. Hoe groot is de kans dat hij gedurende die week tegen de lamp loopt?
65 Een klas telt 25 leerlingen. Ze vormen een hechte groep en vieren elkaars verjaardag uitbundig. Bereken de kans dat er twee (of meer) leerlingen op dezelfde dag jarig zijn. (Neem maar aan dat het bekend is dat geen van de leerlingen op 29 februari geboren is. Er zijn dan voor elke leerling nog 365 dagen over om te zijn geboren.) Schrik niet terug voor flink wat rekenwerk op de GR.
66 Een bedrijf neemt regelmatig nieuw personeel aan. Na verloop van tijd blijkt slechts 60% hiervan geschikt voor het werk, dus 40% is ongeschikt. Om beter te kunnen selecteren, worden kandidaten voortaan psychologisch getest. Van de geschikte kandidaten komt 90% door de test, terwijl van de ongeschikte kandidaten 20% door de test komt. a. Maak een kanstabel bij bovenstaande gegevens. Kies zelf een geschikt aantal kandidaten. b. Bereken de kans dat een willekeurige kandidaat door de test komt. c. Bereken de kans dat een kandidaat die afgewezen wordt, toch geschikt is.
48
67 De faculteit VPL kent drie studierichtingen: Verkeerskunde (V), Planologie (P) en Logistiek (L). Van de mannelijke studenten is 29,1% bij Verkeerskunde ingeschreven, 27,2% bij Planologie en 43,7% bij Logistiek. Van de vrouwelijke studenten is 34,4% bij Verkeerskunde ingeschreven, 38,5% bij Planologie en 27,1% bij Logistiek. Van de totale studentenpopulatie is 77,6% man. a. Bepaal voor elke studierichting het percentage van de totale studentenpopulatie dat deze richting volgt. b. Bepaal bij elk van de drie studierichtingen de man/vrouw-verdeling in procenten.
68 20% van de veroorzakers van verkeersongevallen heeft alcohol gebruikt. Een kwart van de weggebruikers die met drank op een ongeval veroorzaken is jonger dan 25 jaar oud. Van de weggebruikers die een ongeval veroorzaken zonder dat van drankgebruik sprake is, is 35% jonger dan 25 jaar oud. De 18-24 jarige weggebruikers noemen we jongeren en de overige weggebruikers noemen we ouderen. a. Hoeveel procent van de verkeersongevallen wordt veroorzaakt door ouderen? Iemand beweert dat met name bij jongeren het alcoholgebruik leidt tot veel ongelukken. b. Wordt de bewering door deze gegevens ondersteund?
49
2.9 Samenvatting Verdelingen frequenties
Paragraaf 2.1 Frequentieverdelingen In een groep letten we op een zekere eigenschap (variabele). Die eigenschap kan bijvoorbeeld vier waarden hebben. De groep is verdeeld over de vier waarden: elke waarde komt een zeker aantal keren voor. We spreken van een frequentieverdeling. Als de verdeling in procenten van de totale groep is, spreken we van een relatieve frequentieverdeling. De som van de relatieve frequenties is 100%. Bij een frequentieverdeling kunnen we een staafdiagram of een frequentiehistogram maken. De hoogte van een staaf geeft het aantal of het percentage in de bijbehorende klasse. In plaats van de hoogte kun je ook op de oppervlakte letten.
waarden
50 45 40 35 30 25 20
Voorbeeld: de totale oppervlakte van het histogram links van 27, inclusief 27 zelf, geeft het percentage van de gevallen dat de waarde 27 of lager is.
15 10 5 0
25 27 29
Als we in een frequentiehistogram de middens van de opvolgende balken verbinden, ontstaat een frequentiepolygoon. Als in een frequentiehistogram de balken heel smal zijn, is de frequentiepolygoon goed te benaderen met een continue gladde kromme. Een zekere variabele (bijvoorbeeld gewicht, tijdsduur, bedrag) neemt waarden aan tussen 1 en 8. Hieronder staat zijn frequentieverdeling:
0
2
4
6
8
10
12
50
14
16
18
20
Hoe vaak de grootheid een waarde kleiner dan 8 heeft, wordt gegeven door de oppervlakte van het grijze gebied. Preciezer: het percentage van het gebied onder de kromme dat grijs is, is gelijk aan het percentage van de gevallen dat de variabele kleiner dan 8 is.
Paragraaf 2.2 Kans Als in 3,8% van de gevallen een variabele een waarde kleiner dan 20 heeft, zeggen we: de kans dat de variabele kleiner dan 20 is, is 3,8%. Van een discrete variabele staat hiernaast een relatief frequentie-staafdiagram. De kans op een waarde kleiner dan 10 is de som van de percentages van de waarden 5 t/m 9. Dat is
oppervlakt e van de staven bij 5, 6, 7, 8 en 9 . oppervlakt e van alle staven
5
10
15
Van een continue variabele staat hiernaast een relatieve frequentiepolygoon. De kans op een waarde kleiner dan 10 is dan hoeveel procent het deel tussen 5 en 10 is van het geheel. Dat is
oppervlakt e links van 10 . totale oppervlakt e
5
10
15
Een kans laat zich uitdrukken als een percentage (tussen 0% en 100%) en ook als een breuk (tussen 0 en 1).
Paragraaf 2.3 Op den duur …
We voeren het experiment bij herhaling uit en volgen het verloop van het aantal treffers. Dan zal op den duur het percentage treffers zeer dicht in de buurt komen van de kans op een treffer.
perc. treffers
De wet van de grote aantallen Veronderstel dat bij een zeker experiment de kans op een treffer 0,4 is. Als het experiment vaak herhaald wordt, nadert het gemiddelde aantal treffers altijd tot 0,4. 100 80 60 40 20 0 1
3
5
7
9
11
13
15
17
19
aantal experimenten
51
Theoretische kansen De kans op vijf ogen bij een worp met een dobbelsteen is 61 . De kans op kop bij een worp met een muntstuk is 12 . Een randomgenerator produceert de cijfers 0 t/m 9. De kans op het cijfer 5 is 101 . Bij een toevalsexperiment zijn er verschillende uitkomsten mogelijk. De totale kans van 100% is verdeeld over de verschillende uitkomsten. We spreken van een kansverdeling. Veronderstel dat er zeven uitkomsten mogelijk zijn. Als die gelijkwaardig zijn (gemiddeld even vaak voorkomen) zeggen we dat elk van die uitkomsten kans 17 heeft.
Paragraaf 2.4 Simulaties Soms is het ondoenlijk een experiment in werkelijkheid vaak uit te voeren. Om dan toch zicht te krijgen op de kansen maken we gebruik van simulatie. Dat wil zeggen dat we het experiment nabootsen. Hierbij kan de computer worden ingeschakend of de randomgenerator op de GR.
Paragraaf 2.5 Rekenen met kansen Een experiment wordt opgesplitst in deelexperimenten. We voeren het experiment in gedachten een groot aantal keren uit, zeg 1600 keer. In een stroomdiagram splitst dat aantal zich na elk deelexperiment. Bij elke splitsing vraag je je af: "hoe vaak mag ik verwachten dat de ene uitslag voorkomt, en hoe vaak de andere". Aan de toppen (de uiteinden) van het diagram kun je tellen hoe vaak je mag verwachten dat een speciale uitkomst optreedt.
G
G
G
F
F
G
1600
F
G F
F G F
52
Als bij elk deelexperiment de kans op G ¼ is en op F ¾, dan gaat de stroom als volgt:
25
G Bij * lees je af dat je 225 keer het resultaat "2G en 1F" mag verwachten. 225 = 649 . De kans op 2G en 1F is 1600
100
F
G 400
225
F
G
*
G 600
1600
F
F
G
675
1200
G
F 900
F 675 Je hoeft niet een (geschikt) aantal experimenten te kiezen om in het stroomdiagram te beginnen. Je kunt ook rekenen met de fracties (kansen) langs de wegen van het diagram. In het voorbeeld wordt dat zoals hiernaast. De kans op het resultaat * laat zich als volgt berekenen: ¼ ⋅ ¼ ⋅ ¾ + ¼ ⋅ ¾ ⋅ ¼ + ¾ ⋅ ¼ ⋅ ¼ = 649 .
¼
¼ ¾
¼ ¾ ¼ ¾
¾ ¼
*
¾ ¼ ¾
Paragraaf 2.6 De som van de kansen is 1 Bij een kansexperiment is de som van de kansen op alle mogelijke uitkomsten gelijk aan 1. Als bij een kansexperiment bijvoorbeeld de mogelijke uitkomsten 7, 8, 9, 10 en 11 zijn, dan is het volgende vaak handig: • de kans op minstens waarde 8 = 1 − de kans op waarde 7 • de kans op hoogstens waarde 10 = 1 − de kans op waarde 11
53
Paragraaf 2.7 Voorwaardelijke kansen In een groep van 20 jongens en 10 meisjes komt een eigenschap voor bij 12 jongens en 4 meisjes.
eig. jongen 12 meisje 4 totaal 16
Dan • heeft 12/20 × 100% = 60% van de jongens die eigenschap, • is 12/16 × 100% = 75% van de mensen met die eigenschap jongen.
niet 8 6 14
totaal 20 10 30
Met kansen: • de kans dat een jongen die eigenschap heeft is P(eigenschap | jongen) = 0,6, • de kans dat de drager van de eigenschap een jongen is is P(jongen | eigenschap) = 0,75. Men spreekt hier van voorwaardelijke kansen; de voorwaarden zijn “jongen” respectievelijk “eigenschap”.
54
Werkblad Kansverdelingen Opgave 1e 70
60
aantal wedstrijden
50
40
30
20
10
0
0
1
2
3
4
5
6
7
8
9
aantal doelpunten
Opgave 17c 7
6
aantal jaren
5
4
3
2
1
0 1 60 2
3 70 4
5 80 6
7 90 8
910010 1111012 13120 14
cm neerslag
1513016 17
Opgave 32
Opgave 33
Vraag 1
Vraag 2
Vraag 3 G
G
F
G
F
G
F
G
1600
F
F
G F
Opgave 34
Antwoorden Statistiek en Kansverdelingen H2 Verdelingen Opg. 1a 1b 1c 1d
18 : 306 = 0,0588.. ≈ 6% Er is geen symmetrie-as 0 18 1 46 2 63 .... 9 2 3,12... 3,1 306 Op het oog: de tweede. Dit klopt met 1c. De eerste wig is 2,5 en de derde is 3,5
1e Eigenlijk zouden de staafjes over elkaar getekend moeten worden. Maar zo kijkt het makkelijker na.
1f
1g Opg. 2a 2b 2c 2d Opg. 3a
1+2+16+8+1+12+8+4+1+1 = 54 of je telt alleen hoeveel 06/07 boven 96/97 uitsteekt, dat is 1+12+8+4+1+1 = 27 Dus 54 : 612 = 27 : 306 = 0,0882.. ≈ 9% Er is niet veel verschil. 20 jaar elke dag één meting, schrikkeljaren 1984, 1988, 1992, 1996 en 2000. Dus 20 x 365 + 5 = 7305 Ongeveer 10 graden. Denk aan de wig. Een vreemde dip bij ongeveer 12 graden. Ongeveer 8% Ongeveer een twaalfde deel zit rechts van 20 graden. aantallen
Amalia College
3b
procenten
Landelijk
Opg. 4 M = 1,5N Dus samen is dit 2,5N dan 2,5N = 100% Dus N = 40% NG = 2NT Dus samen is dit 3NT dan 3NT = 40% Dus NT = 13 13 % NG = 40 - 13 13 = 26 23 % 1
Voor M is er nog 60% EM = 2CM Dus samen is dit 3CM 3CM = 60% Dus CM = 20% EM = 60 – 20 = 40% CM EM NG NT 2 20% 40% 26 3 % 13 13 % Opg. 5 the of and to a in that it is was 1200 1200:2 1200:3 1200:4 1200:5 1200:6 1200:7 1200:8 1200:9 1200:10 =600 =400 =300 =240 =200 ≈171 =150 ≈133 120
Opg. 6a 6b
6c
6d Opg. 7a
7c Opg. 8a 8b
40 staafjes, gemiddeld ongeveer 30 hoog. Dan is 1120 de beste keus. Of alle hoogtes redelijk goed schatten en deze 40 getallen optellen. Er worden veel kleine kinderen gemeten. Rond de 20 kg. Tegenover een aantal zware kinderen van 80 t/m 100 kg kunnen geen kinderen staan die tussen de -60 en -40 kg wegen. Die wordt een stuk minder. Neem steeds samen de klassen 1 en 2, 3 en 4, 5 en 6. De lage waarden van klassen 1, 4 en 5 zijn dan weg. Waarschijnlijk een klassenbreedte tussen de 10 en 15 . (bijvoorbeeld)
7b
(bijvoorbeeld)
Horizontaal een concentratie bij 2 en 4,2. Vertikaal bij 55 en 82 (8+1113+5965) : 29486 = 0,2403…≈ 24% Dus 27, 28, 29 of 30 jaar oud. 2
3 5
van 13302 plus
1 5
van 6980 = 9377,2
9377,2 : 29486 = 0,318… ≈ 32% Opg. 9a 9b
Van 13 staafjes de hoogtes aflezen en optellen: ongeveer 30% Schatten hoeveel procent links van de verticale lijn door 20 ligt. Uit de animatie blijkt dat het 29,3% is.
Opg. 10a De meeste mensen (27%) slapen tussen de 7,75 en 8,25 uur per nacht. 10b 5,5% tussen 7 en 7,25 (want 11% tussen 6,75 en 7,25) 22% tussen 7,25 en 7,75 27% tussen 7,75 en 8,25 22% tussen 8,25 en 8,75 5,5% tussen 8,75 en 9 (want 11% tussen 8,75 en 9,25) 82% totaal Opg.11a Verschil 1: Bij de ouderen is het verschil tussen de kort- en de langslapers (de spreiding) veel groter. Verschil 2: De verdeling bij de ouderen is minder symmetrisch; hij heeft een dikkere staart naar rechts. 11b Mediaan van de jongeren 7,5 en die van de ouderen 6,5 uur. (Links en rechts van de mediaan moeten evenveel oppervlakte zitten, namelijk 50%.) 11c Bij de jongeren is de modale slaapduur ongeveer 7,2 uur; ongeveer 58% zit daarboven. Bij de ouderen is de modale slaapduur 5,3 uur; ongeveer 69% zit daarboven. 11d De percentages zijn wel gelijk. Redenering: Maak in gedachten een histogram bij beide verdelingen, bijvoorbeeld van balkjes van breedte 0,2 uur. Elk balkje representeert een zelfde percentage mensen (omdat de totale oppervlakte onder de verdelingen hetzelfde is). Zeg dat er een balkje komt tussen 5,4 en 5,6 uur. Dat is bij beide verdelingen even hoog. Dus zijn er procentueel evenveel jongeren die ongeveer 5,5 uur slapen als ouderen. Opg. 12a Berekenen via de oppervlakte: 20 hele hokjes is 100%. Onder de 160 is 16 hokjes. Dus 80%. 12b 2 hokjes vanaf rechts. Dus bij ongeveer 172 gram. 12c Na 10 hokjes, dus bij 140 gram. Opg. 13a 50 rechthoekjes. 1 rechthoekje is dus 100% : 50 = 2% 13b 14 rechthoekjes, dus 28%. 13c Boven 1,5 liggen 24,5 rechthoekjes, dus 49%. Dus 1,5 is iets groter dan de mediaan (die ligt bij 50%). Opg. 14a Op leeftijd. 14b Die zijn geboren rond 1947, dus vlak na de tweede wereldoorlog. Ze vormen het begin van de babyboomers. 14c Ongeveer 37 jaar (oppervlakte erboven = oppervlakte eronder) 14d Ongeveer 4% 14e Zoek een horizontale lijn die rechts tweemaal zolang is als links. Bij 84 of 85 jaar. (zie animatie, schuif de cursor over de grafiek) 3
Opg. 15a (8 + 1113) ; 29486 = 0,0380.. ≈ 3,8% 15b de oppervlakte van de eerste staaf is ongeveer 3,8% van de gehele oppervlakte. 15c Dat is precies de oppervlakte van de derde en de vierde staaf. (5965 + 13302) : 29486 = 0,6534.... ≈ 65,3% Opg. 16a 18 : 306 = 1: 17 ≈ 5,9% 16b (35 + 21 + 7 + 5 + 1 + 1) : 306 = 70 : 306 ≈ 23% Opg. 17a 1980 – 2009 is 30 jaar, hoogte van alle staven is samen ook 30 (2 + 1 + 1) : 30 = 0,1333.. ≈ 13,3% 17b (4 + 6) : 30 = 0,3333.. ≈ 33,3% 7 17c 6
aantal jaren
5 4 3 2 1 0 1 60 2
3 70 4
5 80 6
7 90 8
910010 11110 12 13120 14
cm neerslag
17d Een lijnstuk van de polygoon snijdt van een balk een stukje af dat precies past in de vrije ruimte boven de balk ernaast. Zie het voorbeeld hiernaast. 17e Rechts van 100 is de oppervlakte 12 + 1 + 2 + 1 = 4 12 De kans is 4 12 : 30 = 15% Tussen 90 en 100 is de oppervlakte 5 1 1 8 + 4 + 6 - 2 = 9 8
1 2
De kans is 9 85 : 30 ≈ 32,1% 1 2
4
1
1513016 17
Opg. 18a De onderste kromme, links van 4 lijkt op een kwart van de totale oppervlakte. Dus is de kans ongeveer 25% 18b Ongeveer twee derde deel van de oppervlakte, dus 65% Opg. 19a Een rechthoekje is 2% (zie opg.9) 2 rechthoekjes, dus 4% 19b 28% (14 rechthoekjes) Opg. 20a 1 wedstrijd met gemiddelde 6 geeft totaal 6 2 wedstrijden met gemiddelde 4 geeft totaal 8 Dus 2 doelpunten in de tweede wedstrijd 20b 6 wedstrijden gemiddeld 2,2 geeft totaal 13,2 ≈ 13 7 wedstrijden gemiddeld 2,4 geeft totaal 16,8 ≈ 17 Dus 4 doelpunten 20c De daling is in het begin 2 (van 6 naar 4) 30 wedstrijden gemiddeld 4 geeft totaal 120 Als er niet gescoord wordt in wedstrijd 31 wordt het gemiddelde 120 : 31 ≈ 3,87 Dit is een daling van 0,13 Een grotere daling kan niet. De schommeling (2) van het begin kun je aan het eind dus nooit meer krijgen. Opg. 21a We kunnen er wel vanuit gaan dat VUStat goed werkt. Blijkbaar zitten we met 500 nog in de beginfase waar nog wat schommelingen voorkomen. Daarom kan 5 wat weinig voorkomen. 21b Een zesde deel van 500 Dus 500 : 6 ≈ 83 Opg. 22a 5 keer k in 6 worpen, dus 5 : 6 = 0,83.. ≈ 83% 11 keer k in 20 worpen, dus 11 : 20 = 0,55 = 55% 22b klopt 22c Kop, dan 12 keer k in 21 worpen, dus 12 : 21 = 0,571.. ≈ 57% Munt, dan 11 keer k in 21 worpen, dus 11 : 21 = 0,523.. ≈ 52% 22d In het begin kunnen de schommelingen groot zijn en dus ook de verschillen tussen de twee plaatjes. Aan het eind zijn de schommelingen klein en dus ook de verschillen tussen de twee plaatjes. 22e Aan het eind zal de grafiek naar 90% gaan. 22f De kans op kop zal ongeveer 35% zijn, op munt dan 65% De verhouding is dan 35 : 65 = 17 : 13 ( ≈ 1 : 2 ) Opg. 23a Aan het eind zal de grafiek naar 17% gaan. 23b Aflezen 1; 1; 0,67; 0,75; 0,8; 0,67; 0,58; 0,63; 0,69; 0,71 Dit vermenigvuldigen met resp. 1, 2, 3, 4 enz. geeft 1, 2, 2, 3, 4, 4, 4, 5, 6, 7 Bij het volgende getal kwam er steeds bij 1, 1, 0, 1, 1, 0, 0, 1, 1, 1 Een 1 is H en een nul is L, dus H,H, L, H,H, L, L, H,H,H 23c H als het gemiddelde omhoog gaat. L als het gemiddelde naar beneden gaat. 23b had dus achteraf veel eenvoudiger gekund. 23d 0,7 van de worpen een H, dus de kans is 0,7 (of 70%) Opg. 24a Bij alle geboortes het aantal j en m tellen. 513 24b 196000 1000 = 1000548 ≈ 1000500 jongens 487 196000 1000 = 95452 ≈ 95500 meisjes 24c 1000 x 513 : 487 = 1053,3.. ≈ 1053 24d 513 : 1000 = 0,513 5
24e Mannen worden gemiddeld minder oud dan vrouwen. Opg. 25a 6022 : 2001 ≈ 3 : 1 (6022 : 2001 = 3,009…) 25b 1e 5474 : 1850 = 2,958.. 3e 705 ; 224 = 3,147.. 4e 882 : 299 = 2,94.. 5e 428 : 152 = 2,815.. 6e 615 : 207 = 2,97.. 7e 787 : 277 = 2,84.. 25c Alles is steeds ongeveer 3, de verhouding is dus 3 : 1 25d ja 25e nee, want de kans dat bij deze grote aantallen er precies 3 : 1 eruit komt is erg klein Opg. 26a De kans op munt is
1 2
26b De kansen op 1, 2, 3, 4 en 5 zijn allemaal 26c De kansen op k, r, h en s zijn allemaal 14 26d De kansen zijn 131 26e De kansen zijn
1 2
en die op kop is ook 1 5
1 45
1 en de kans op fout is 23 3 mogelijke getallen. De kans is 110
26f De kans op goed is 26g Er zijn 1010
10
10 1 26h De kans op prijs is 100 De kans op geen prijs is 109 10 26i De kans op 0 even (oneven, oneven) is 14 De kans op 2 even (even, even) is 14 De kans op 1 even (oneven, even) of (even, oneven) is
2 4
1 2
7 14 Opg. 27a 306 (afhankelijk van het jaar). 153 22 11 27b uitslag 1 – 1: kans 306 153 [Eind november 2011 was in totaal sinds de oprichting van het betaalde voetbal in de ere-divisie: 1235 keer 0-0, 1892 keer 1-1, 921 keer 2-2, 187 keer 3-3, 20 keer 4-4, 5 keer 5-5, 1 keer 6-6.]
Opg. 28a Gooi steeds met een dobbelsteen, noteer wat je gooit. Tel hoe lang het duurt voor je 4 verschillende getallen hebt. 28b 1, 2, 3, 4, 5, 6 28c Gooi 6 keer met een dobbelsteen, noteer wat je gooit. Tel hoeveel verschillende getallen je hebt. 28d hoogtes gemeten in mm 0; 2; 22,5; 49; 22,5; 1,5 samen is dit 97,5 Nog geen 4 is 1, 2 of 3 kans is 24,5 : 97,5 = 0,251.. ≈ 0,25 28d - - - Opg. 29a - - - - 29b - - - Opg. 30a 52 weken, dus 52 zaterdagen, elke maand een extra trekking geeft 52 + 12 = 64 trekkingen. (Tenzij er in een jaar 53 zaterdagen vallen) 30b 64 keer 6 getallen is 384 getallen. Elk getal komt gemiddeld ongeveer 384 : 45 = 8,533.. ≈ 8,5 keer. 6
30c 8,533333.. : 64 = 152 Ook kan (64 x 6 : 45) : 64 = 456 152 30d Onderbedeeld bij 8 of minder keer, dus 4, 5, 7, 12, 14, 17, 19, 20, 21, 22, 23, 27, 28, 29, 30, 33, 36, 38, 40, 41, 43 en 45 (Dit is vrijwel de helft) 30e aantal nummers
7
0 0
5
10
15
aantal keer voorkomen
Opg. 31a 31b 31c 31d 31e
0 t/m 10 ---hoort bij 0,08 0,08 van 50 is 4, dus 4 van de 50 is blauw. Waarschijnlijk 0,2 dus 20% 15 : 50 = 0,3 0,3 of meer komt 11 van de 100 keer voor. Kans is 11 : 100 = 0,11 Opg. 32a Bij alle kop en bij alle munt moet 12 staan. Verder 4 keer het getal 250 en helemaal rechts 8 keer het getal 125 32b kleur de drie bovenste lijntjes met kop
KKK KKM KMK KMM MKK MKM MMK MMM
32c 125 keer, dus de kans is 125 : 1000 = 18 32d Achter alle routes dus 125 : 1000 = 18 32e Dus KKM en KMK en MKK. De kans is 375 : 1000 = 83 32f Dat gaat net zo, dus ook 375 : 1000 = 83 32g 125 keer, dus de kans is 125 : 1000 = 18 32h 1000 : 1000 = 1 Die eerste 1000 ligt wel erg voor de hand.
7
Opg. 33a
vraag 1
vraag 2
vraag 3 25
3 goed
75+150=225
2 goed
450+225=675
1goed
675
0 goed
100 400 1600
300+300=600 1200 900
25 1 33b 1600 64 225 9 33c 1600 64 675 27 33d 1600 64 675 33e 1600 27 64 33f Kansen opgeteld geeft 1 33g Voor het antwoord maakt het niet uit, maar het lijkt onlogisch en het is onhandig om met breuken te werken. 400 1 33h 100 + 300 = 400 en 1600 en bij een vierkeuzevraag is 14 ook heel 4 logisch.
1e nummer
Opg. 34 a
2e nummer 1 3 2 4
x 300 = 100
2g
x 300 = 200
1g
2 3
x 300 = 200
1g
1 3
x 300 = 100
0g
x 600 = 300 2 3
600 2 4
x 600 = 300
1 34b 100 600 6 400 1 34c kans op 0 goed = 100 kans op 1 goed = 600 600 6 34d 1 op de 6 keer, je verwacht dus 5 keer te winnen.
2 3
Opg. 35a 2 mogelijkheden: 1 goed 12 23 13 (van de 600) 1 goed 12 23 13 (van de 600) Samen is dit 23 (van de 600) De kans is dus inderdaad 35b
1 2
1 3
1 6
8
1 2
2 3
1 2
2 3
1e trekking
Opg. 36a
2de trekking
3de trekking 1 5
2 6
4 5
wel 3 7
2 goed
2 5
niet 2 6
wel
3 goed
wel niet
2 goed
wel niet
1 goed
3 5
3 5
3 6
niet 4 7
2 goed
wel niet
1 goed
2 5
wel
3 5
niet 3 6
1 goed
wel niet
36b 73 62 15 36c 0 goed 1 goed
4 7
3 6
2 5
4 35
3 7
4 6
3 5
4 7
3 6
2 5
4 7
3 6
3 5
16 35
2 goed
3 7
2 6
4 5
3 7
4 6
2 5
4 7
3 6
3 5
2 5
3 42
2 41
1 40
36d
6 45
5 44
1 35
4 43
0 goed
2 5
1 8145060
( 0,00000012277)
Opg. 37a 6 keer gooien met een dobbelsteen, kies (bijvoorbeeld) dat de 1 raak is. aantal keer overleven 37b Schatting van de kans is 20 aantal keer overlevenvan alle leerlingen 37c aantal leerlingen 20 37d 56 56 56 56 56 56 ( 56 )6 0,334... 0,33 Opg. 38a Soort 1: eerste of laatste kruk van de rij. Soort 2: een kruk tussen twee krukken in. 38b
Stef 2 9
Leon 1 8
ernaast niet ernaast 7 8
hoekkruk geen hoekkruk 7 9
2 8
ernaast niet ernaast 6 8
De kans op naast elkaar zitten is
9
2 9
1 8
7 9
2 8
2 9
Opg. 39a
e
de
1 licht
2 licht 1 8
2 9
ernaast niet ernaast 7 8
hoekkruk 2 8
geen hoekkruk 7 9
ernaast niet ernaast
39b 0,3 x 0,42 = 0,126 39c 0,7 x 0,58 = 0,406 Opg. 40a 40b 40c 40d
6 8
kans op 1e zakken, 2e slagen is 0,52 x 0,65 = 0,338 kans op 1e, 2e en 3e zakken is 0,52 x 0,35 x 0,28 = 0,05096 209182 x 0,48 = 100407,36 ≈ 100407 Nee, want je weet niet hoeveel mensen er voor de tweede keer opgaan. Als je ervan uit gaat dat degenen die de eerste keer zakten (bijna 109 duizend) allen voor de tweede keer opgaan, dan vind je dat bijna 71 duizend personen de tweede keer slagen.
Opg. 41a Begin tegen vader, want twee keer tegen vader geeft meer kans op winst (toch??) 41b winnen van v, winnen van m of verliezen van v, winnen van m, winnen van v De kans is 0,8 x 0,5 + 0,2 x 0,5 x 0,8 = 0,48 41c v en m net andersom heeft kans 0,5 x 0,8 + 0,5 x 0,8 x 0,5 = 0,6 Dan was antwoord a toch fout, verrassend !! Opg. 42a VVA of VAV of AVV (A is aanwezig, V is verhinderd) De kans is 0,2 x 0,2 x 0,8 + 0,2 x 0,8 x 0,2 + 0,8 x 0,2 x 0,2 = 0,096 42b VZ of VB of AZ (Z is ziek, B is beter) 0,2 x 0,3 + 0,2 x 0,7 + 0,8 x 0,3 = 0,44 Opg. 43a De kans op mv of vv is 13 43b De kans op vv is 23 12 13 43c De kans op vmv of mvv is
2 3
2 3
1 2
5 9
2 3
1 2
1 2
1 3
2 3
1 2
5 18
Opg. 44a De kans op geen bom of wel een bom, maar niet gevonden is 0,5 + 0,5 x 0,05 = 0,525 44b
10
In 2100 gevallen niets gevonden, in 100 van deze gevallen is er toch een 100 1 bom. De kans op een bom is dus 2100 21 Opg. 45a
eerste trekking
tweede trekking 2/5 7 8
1/6
kans
3/5
6
1/5
totaal
6, 7 1/15
13
6, 8 1/10
14
7, 6 1/15
13
7, 7 1/15
14
7, 8 1/5
15
8, 6 1/10
14
8, 7 1/5
15
8, 8 1/5
16
6
2/6 7
1/5
7 8
3/5
8 3/6
1/5 6
2/5
7 2/5
8
45b Je wilt niet twee kaartjes met 7. Kans op twee keer 7 is 1 De rest is dus 1
1 15
15
1 10
45c Kans op minstens een 8 is Kans op geen enkele 8 is 45d 13, 14, 15, 16 45e De kans op S = 13 is De kans op S = 15 is
2 15 2 5
1 5
1 5
1 10
1 5
1 5
14 15
.
4 5
De kansen zijn samen 1 en dat klopt dus.
; De kans op S = 14 is ; De kans op S = 16 is
4 15 1 ; 5
;
Opgeteld zijn deze kansen 1. Opg. 46a Zondag = Z een andere dag = N 8 toppen. 46b Kans op geen zondagskinderen is 6 7
6 7
6 7
Barbara
216 343
Kans op minstens een zondagskind is 1 216 127 . 343
Anne
343
1/7
6/7
1/7
Z
6/7
N
Z
Cleo 1/7
Z
6/7
N
1/7 Z 6/7 N
N 1/7 Z 6/7
N
1/7
Z
6/7
N
1/7 Z 6/7
11
N
1e set
Opg.47a Minstens 2 en hoogstens 3 sets 47b Zie hiernaast 47c Kans op 2 sets is 1 1 1
HH 1/4
4
Kans op 3 sets is
4 2 1 1 4 8 2
1/2 H
(deze kansen zijn samen 1, klopt)
2
2
HFH 1/8
1/2 F 1/7 1/2
Opg. 48a Maximaal 5 sets 48b 1 1 1 1 2
3e set
2e set
1/2 H
H
1/2 F
HFF 1/8
8
48c HHH of FFF dus
1 8
1 8
1/2
1 4
F
1/2 F
1/2 H
48d “4 of meer” is hetzelfde als “niet 3” De kans is dus 1 1 3 4
FHH 1/8
1/2 H
1/2
4
FHF 1/8
F FF 1/4
1e plek Opg.49a Niet heeft kans 0,8 Niet niet niet heeft kans 0,8 x 0,8 x 0,8 = 0,512 49b D is doorbraak, N is niet doorbraak
1 – 0,8 x 0,8 x 0,8 = 1 – 0,512 = 0,488 Of zie kansboom hiernaast
1/7 0,2
2e plek
3e plek
kans 0,2 x 0,2 x 0,2
0,2 D 0,2
D
0,8
N
D
0,8 N
0,2 x 0,2 x 0,28
0,2 x 0,8 x 0,2
0,2 D 0,8
N
0,2
D
0,8
N
0,2 x 0,8 x 0,8
0,8 x 0,2 x 0,2 0,8
N 0,2 D 0,8
N
0,8 x 0,2 x 0,8
0,8 x 0,8 x 0,2
0,2 D 0,8 N
Opg.50a
6 6
50b 1 Opg.51
5 6
4 3 2 6 6 6 51 319 324 324
1 6
deze niet samen 0,488
5 324
1 – kans op doorgaan = 1 – kans op 5 goede pakketten =
1
44 50
43 49
42 48
41 47
≈ 1 – 0,5126 = 0,4874 Opg.52a Kans op alles raak is 0,75 ≈ 0,168 Kans op een of meer missen = 1 – 0,168 = 0,832 52b Kans op tegenstander alles raak 0,95 ≈ 0,590 Kans op een of meer missen = 1 – 0,591 = 0,410 Kans dat geen van beide teams alles raak schiet is 0,832 x 0,410 ≈ 0,341 Kans dat minstens een team alles raak heeft is 1 – 0,341 = 0,659 12
40 46
52c Kans dat beide teams geen strafschop missen is 0,168 x 0,590 ≈ 0,099 Kans dat minstens een team een strafschop mist is 1 – 0,099 = 0,991 Opg.53a G is gebruiker, N is niet gebruiker. pos is positief getest en neg is negatief getest. Zie boomdiagram hiernaast. 53b pos. getest: 18 + 18 = 36 en dat is 18% 53c 18 van de 200 is 9% 53d pep positief zijn 36 personen, G gebruiker 18. De helft van de pep positieven is gebruiker, dus 50%. 200
18 pos 180 neg 162
18 2
N pos 20 neg
Opg.54a 7/466 ≈ 0,015 = 1,5% 2 18 54b 7/49 ≈ 0,143 = 14,3% 54c Ongeveer, dus mag je er wel vanuit gaan dat er evenveel mannen als vrouwen zijn. Onafhankelijk, dus evenveel mannen als vrouwen. Dus ongeveer 700 vrouwen. Opg.55a Het percentage mannen dat aan sport doet is gelijk aan het percentage vrouwen. 55b Het percentage mannen dat rookt doet is niet gelijk aan het percentage vrouwen. Opg.56a goed niet goed
Willem John 576 368 24 32 600
400
944 56 1000
56b 56/1000 = 0,056 = 5,6% 56c 576/944 ≈ 0,610 = 61,0% 56d 24/56 ≈ 0,429 = 42,9% Opg.57a
John honkslag geen honkslag
linksh. rechtsh. 3% 28% 17% 52% 20%
31% 69%
80% 100%
Linksh. honkslag 15% van 20% = 0,15 x 20% = 3% Rechtsh. honkslag 35% van 80% = 0,35 x 80% = 28% enz. 57b 31% 57c 28% van 31% = 0,28 x 31% = 90,32%
13
Opg.58a wel TBC geen TBC
positief negatief 98 2 100 2499 247401 249900 2597 247403 250000
58b 98/2597 ≈ 0,0377 = 3,77% 58c 2/247403 ≈ 0,00000808 ≈ 0,0008% ≈ 0% 58d 2597 mensen zijn pos. Getest. Hiervan hebben 98 mensen TBC, 98% pos. bij hertest. Dit zijn 96,04 mensen (we laten die 0,04 er maar bij staan, ook al kan dat bij aantallen niet) Hiervan hebben 2499 geen TBC, 1% pos. bij hertest. Dit zijn 24,99 mensen. Samen zijn dit 121,03 mensen. Kans op TBC na 2 keer pos. test is 96,04/121,03 ≈ 0,79 Opg.59a bekeuring geen bekeuring
man vrouw 0,319 0,042 0,261 0,378 0,58
0,42
0,361 0,639 1
Dus 0,361 = 36,1% 59b 0,319 op de 00,361 is 0,319/0,361 ≈ 0,884 = 88,4% Opg.60a geoefend niet geoefend
vold. onvold. 0,28 0,07 0,27 0,38
0,35 0,65
0,55 0,45 1 vold. en geoefend 80% van 0,53 = 0,8 x 0,35 = 0,28 enz. Kans op vold. na oefenen is 0,28 op de 0,35 = 0,28/0,35 = 0,8 Kans op vold. zonder oefenen is 0,27 op de 0,65 = 0,27/0,35 = 0,415 Oefenen heeft dus zeker wel zin. 60b 0,28 op de 0,55 = 0,28/0,55 = 0,509 = 50,9% Opg.61a
goed fout machine 1 0,5961 0,0039 0,6 machine 2 0,3974 0,0026 0,4 0,9935 0,0065 1 61b Kans op goed als machine 1 gebruikt wordt is 0,5961/0,6 = 0.9935 Kans op goed als machine 2 gebruikt wordt is 0,3974/0,4 = 0.9935 Dus is het goed zijn onafhankelijk van de machine. Dit lag voor de hand, bij allebei is het percentage goed 99,35% 61c Bij goed en machine1 (links boven) komt het product van de kans op goed (links onder) en de kans op machine1 (rechts boven) enz.
14
Opg.62a Ja 62b Nee, de kans dat de tweede kaart boer is, hangt af van de eerste kaart, of daar wel of niet een boer getrokken is. Opg. 63a Uitvallen is U, niet uitvallen is N, A zie kansboom hiernaast 63b Kans op stroomuitval is 0,3 x 0,25 = 0,075 63c Kans op geen stroomuitval is 1 – 0,075 = 0,925 63d zie kansboom hiernaast 63e Kans op geen uitval is 0,7 x 0,75 = 0,525 0,3
0,7
Opg.64a kans op niet tegen de lamp lopen is 0,8 x 0,8 = 0,64 Kans op minstens een keer tegen de lamp lopen is 1 – 0,64 = 0,36 64b Kans op een dag niet tegen de lamp lopen is 0,644 ≈ 0,1678 Kans op minstens een keer tegen de lamp lopen is 1 – 0,1678 = 0,8322 Opg.65
vraag a uitval
B 0,25 U
0,75 N U
niet uitval
N
niet uitval
365
365
365
0,75
niet uitval
365
Opg.66a
Test goed Test niet goed
62 38 100
66b 62/100 = 0,62 = 62% 66c 6/38 ≈ 0,158 = 15,8% Opg.67a V P L man 22,58% 21,11% 33,91% 77,6% vrouw 7,71% 8,62% 6,07% 22,4% 30,29% 29,73% 39,98% 100% Kolom onder V: man 29,1% van 77,6% = 0,291 x 77,6% ≈ 22,58% Kolom onder P: man 27,2% van 77,6% = 0,272 x 77,6% ≈ 21,11% enz. Kolom onder V: vrouw 34,4% van 22,4% = 0,344 x 22,4% ≈ 7,71% enz. 67b Studierichting V: man 22,58 is van 30,29 22,58/30,29 ≈ 0,7455 = 74,55%
15
uitval
N
Dus twee of meer op dezelfde dag jarig heeft kans 1 – 0,4313 = 0,5687
geschikt niet geschikt 54 8 6 32 60 40
uitval
0,25 U
De kans dat ze allemaal op een andere dag jarig zijn is 365 364 363 362 341 .... ≈ 0,4313 365
vraag d uitval
niet uitval
Opg.68a veroorzaker ongeluk jongeren ouderen
alcohol geen alcohol gebruikt gebruikt 0,04 0,28 0,32 0,16 0,52 0,68 0,20 0,80 1 Jongeren en alcohol 20% van de 0,2 = 0,2 x 0,2 = 0,04 enz. 68% is veroorzaakt door ouderen. 68b Nee, onbekend is hoeveel procent van de jongeren die alcohol gebruikten een ongeluk veroorzaken. Ook is onbekend hoeveel procent van alle jongeren alcohol gebruikt.
16
Begrepen 2.1 De lengte varieert tussen 50 en 170 cm. Er zijn evenveel mensen van lengte 110 x als van lengte 110+x. De meestvoorkomende lengtes zijn 75 en 145 cm Je kunt aflezen hoeveel procent van de Luilekkerlanders tussen … en … cm lang is. Dat doe je door de oppervlakte tussen … en … te vergelijken met de totale oppervlakte onder de grafiek. Begrepen 2.2 De totale bevolking (som van de hoogtes) is 16.500.000. De bevolking van de drie zuidelijke provincies is 2.900.000. De kans is dus 29 / 165 ≈ 17,6% De oppervlakte onder de grafiek rechts van 12 is ongeveer het 1/7 de deel van de totale oppervlakte. Die kans is dus ongeveer 15%. Begrepen 2.3 55% (Let op de hoogte van de laatste stip.) Van de 20 worpen waren er 11 kop. Van de 21 worpen zullen dat er 12 of 0 zijn. De schatting zal dus 2% stijgen of 5% dalen. Het spiegelbeeld in de lijn op hoogte 50%. 543 is één van de 216 m9ogelijkheden. De kans is dus Ook 6 ×
1 216
=
1 216
.
1 36
Maak een lijst van de acht mogelijke resultaten. Daarvan is er één KKK. De kans is dus 81 . Begrepen 2.4 Meer kop dan munt kwam 0+1 = 1 keer voor. ik schat de kans dus op 1/40 = 2,5%. Meer series maken. Dat kwam 4 keer voor van de 40 series. Dus in 10% van de series. Die 4 in de tabel is verdacht, want hij staat tussen twee groetre frequenties in (namelijk 9 en 13). Het aantal 18-19 kwam waarschijnlijk door toeval zo laag uit. Ik denk dat de kans op 18-19 veel groter is dan 10%. Misschien zijn de 9 en de 13 in de tabel wat te hoog. en moeten die 7 en 9 zijn en dan zou de freqentie 10 voor 18-19 kop daar mooi tussen passen. 10 van de 40 is 25%. Begrepen 2.5 30 100 70 360 110 260 150 17
10 20 30 40 50 60 70 80
1 3 2 3 3 7 4 7
3 10 7 10
5 18 13 18
5 11 6 11 77 15 15 8 15
11 26 15 26
(40+60+70) / 360 =
1 3 1 2 1 6
1 2
2 5
17 36
2 5 3 5
1,2
2 5
3,2
3 5
3,4
1,4
2 5 3 5
5,2 5,4
1 = 11 6 30
Begrepen 2.6 De kans op afwisselend is de kans op KMKMKMKMKM of MKMKMKMKMK De kans op twee of meer keer dezelfde na elkaar is 1 De kansen zijn dan
2 3
en
1 2
10
1 2
10
511 . 512
1 3
De kans op twee of meer keer dezelfde na elkaar is 1
1 3
5
2 3
5
1 3
5
2 3
5
≈
0,9989 Begrepen 2.7 0,1 + x + 0,2 + y = 1 dus x + y = 0,7 P(Lang) = 0,1 + x P(Wel | Lang) = 0,1
0,1 x
Dan moet het aantal Korten twee keer zo groot zijn als het aantal Langen Bij Wel en Niet moeten de kansen ook twee keer zo groot zijn, dus y = 2x 0,1 0,1 x
0,2 0,2 y
Omdat
0,1 0,1 x
0,2 0,2 2 x
en een breuk groter wordt als de noemer kleiner
wordt (bij pos. getallen) is dus 2x < y.
18