Domein Statistiek en kansrekening havo A
1 Kijken naar data Inhoud 1.1 1.2 1.3 1.4 1.5
Wat is statistiek? Data Diagrammen Interpretaties Overzicht
In opdracht van: Commissie Toekomst Wiskunde Onderwijs
© cTWO Utrecht 2010 Dit lesmateriaal is ontwikkeld in het kader van de nieuwe examenprogramma’s zoals voorgesteld door de Commissie Toekomst Wiskunde Onderwijs. De gebruiker mag het werk kopiëren, verspreiden en doorgeven en remixen (afgeleide werken maken) onder de volgende voorwaarden: • Naamsvermelding. De gebruiker dient bij het werk de door de maker of de licentiegever aangegeven naam te vermelden (maar niet zodanig dat de indruk gewekt wordt dat zij daarmee instemmen met uw werk of uw gebruik van het werk). • Niet-commercieel. De gebruiker mag het werk niet voor commerciële doeleinden gebruiken. • Gelijk delen. Indien de gebruiker het werk bewerkt kan het daaruit ontstane werk uitsluitend krachtens dezelfde licentie als de onderhavige licentie of een gelijksoortige licentie worden verspreid. Licht gewijzigde testversie: oktober 2010
Voorlopig overzicht lesmateriaal in het domein Statistiek en kansrekening 1 1.1 1.2 1.3 1.4 1.5
Kijken naar data Wat is statistiek? Data Diagrammen Interpretaties Overzicht
2 2.0 2.1 2.2 2.3 2.4 2.5
Data en datasets verwerken Data voor onderzoek Data presenteren Cetrum en spreiding Verdelingen typeren Relaties Overzicht
3 3.0 3.1 3.2 3.3 3.4 3.5 3.6
Data verwerven Statistisch onderzoek Experimenteren en simuleren Toeval Kansen berekenen Steekproeven Enquêtes Overzicht
4 4.0 4.1 4.2 4.3 4.4 4.5 4.6
Normale verdeling Een bijzondere verdeling Gemiddelde en standaardafwijking Normale verdeling Rekenen met normale verdelingen Steekproef en populatie Schatten van een proportie Overzicht
5
Conclusies trekken
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
2
1.1
Wat is statistiek?
Verkennen
In 1812 trok het Franse leger onder aanvoering van de Franse keizer Napoléon ten strijde tegen Rusland. Deze campagne begon aan de rivier de Niemen en leidde naar Moskou. Dit leger stuitte op flinke weerstand en werd bij Moskou verslagen. De terugtocht was vreselijk, mede door de extreme koude. Dit is de figuur die de Franse ingenieur Charles Joseph Minard (1781 – 1870) tekende om het verloop van deze Russische veldtocht weer te geven.
!
Opgave 1 Je ziet dat het Franse leger met 422.000 man uit Polen vertrok richting Moskou. Het aantal mensen waaruit het leger bestond is een statistische variabele. a) Hoeveel mensen in dit leger kwamen aan in Moskou? b) Hoeveel mensen kwamen weer bij het startpunt terug? c) Hoeveel procent van dit Franse leger is tijdens de Russische veldtocht overleden? d) De slag aan de Bérézina vond plaats van 26 – 29 september 1812. Hoe komt het dat Napoléon’s leger vlak daarvoor in omvang meer dan verdubbelde? Welk deel van dit nieuwe leger bleef er na deze slag nog over? e) Op de terugweg zijn ook af en toe de dagtemperaturen gemeten. Welke laagste dagtemperatuur is er gemeten? En op welke datum? f) De temperatuur is gegeven in graden Réamur (°Re). Nu is 0°C hetzelfde als 0°Re en 100°C hetzelfde als 80°Re. Hoeveel graden was de laagste dagtemperatuur in °C?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
3
!
Opgave 2 Bekijk de figuur van Minard nog eens goed. Je kunt er in aflezen uit hoeveel personen Napoléon’s leger op bepaalde momenten bestond, hoe de gevolgde route er uit zag en met welke temperaturen het leger op de terugweg te maken kreeg. Bekijk nu vooral die terugweg. a) Op welke twee manieren geeft dit diagram de grootte van het leger weer? b) Welke andere twee variabelen worden er in getallen uitgedrukt? c) Welke variabele wordt er niet in een getal uitgedrukt? Hoe wordt die variabele zichtbaar gemaakt? d) Maak voor de terugtocht een tabel waarin je bij elke datum die je in de figuur kunt aflezen de grootte van het leger tegen de temperatuur uitzet. Hoe zou je deze gegevens op een andere manier dan in Minard’s diagram grafisch kunnen voorstellen? e) Welk doel heeft Minard waarschijnlijk gehad met zijn diagram? Licht je antwoord toe.
!
Opgave 3 Op de website van het Centraal Bureau voor de Statistiek, afgekort CBS, vind je een schat aan informatie. Bekijk de startpagina van de website van het CBS. Op de startpagina stond op zeker moment deze informatie:
a) b) c) d) e) f) g) h)
Op welke dag en op welk tijdstip is deze schermafdruk gemaakt? Hoeveel mensen telde Nederland op dat moment? En hoeveel nu? Het C.B.S. spreekt in haar toelichting over een schatting van het aantal inwoners. Licht dit toe. Wat lees je af onder Kerncijfers > Arbeid? Het percentage werklozen is begin 2009 aan het stijgen. Kun je op grond van alleen deze gegevens zeggen dat ook het aantal werklozen in die periode stijgt? Waarom is dit wel erg waarschijnlijk? Beschrijf wat je afleest onder “Prijzen”, onder “Groei” en onder “Vertrouwen”. Bij “Groei” wordt een staafdiagram gebruikt en bij de andere variabelen niet. Waarom zou men dat hebben gedaan? Waarom heeft het C.B.S. juist deze kerncijfers op de startpagina staan?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
4
Uitleg Het woord statistiek ontstond in de tijd van Napoléon toen het bestuur van de verschillende Europese staten die in de achttiende eeuw opkwamen zo ingewikkeld werd dat een nauwkeurige kennis van staatszaken belangrijk werd. Tegenwoordig moet je dat wat ruimer opvatten: ook bedrijven, onderzoeksinstellingen en particulieren buiten de overheid verzamelen gegevens en doen dus aan statistiek. Die gegevens worden in de vorm van tabellen, diagrammen, kaarten of een combinatie daarvan overzichtelijk weergegeven. Op de website van het C.B.S. (Centraal Bureau voor de Statistiek) vind je daar mooie voorbeelden van. In de figuur van Minard ging het om de soldaten van het Franse leger dat onder Napoléon naar Moskou trok. Deze soldaten vormen de elementen van een statistisch onderzoek naar hun wel en wee. Napoléon’s leger was de onderzochte populatie. Eén van de onderwerpen van het onderzoek was het aantal soldaten afhankelijk van de vordering van de tocht. Dit aantal soldaten was één van de statistische variabelen die Minard onderzocht. De gegevens omtrent het aantal soldaten op een bepaald punt tijdens de tocht vormen de door Minard verzamelde data. Data zijn dus statistische gegevens. In Minard’s diagram zijn ook data over andere variabelen te vinden. Bij de weergave van de data heeft de onderzoeker meestal wel een bepaald doel. Minard wilde kennelijk de verschrikkingen van deze veldtocht van Napoléon in beeld brengen. Hij heeft daarom de vorm van zijn diagram zo gekozen dat duidelijk zichtbaar wordt hoeveel kleiner het leger telkens werd tijdens de veldtocht.
!
Opgave 4 Bekijk nog eens de gegevens uit Minard’s diagram over de veldtocht van 1812. a) Welke variabelen zijn in het diagram terug te vinden? b) Het grootste deel van Minard’s diagram heeft de vorm van een kaart. Welk voordeel heeft die keuze? En welk nadeel? c) Welke variabele wordt vooral als nadere toelichting op de grote sterfte onderzocht? d) Is het diagram dat bij deze variabele past een echt lijndiagram?
!
Opgave 5 Open het bij deze opgave horende bestand met data van de Nederlandse bevolking zoals die in juli 2009 te vinden waren op de website van het C.B.S. a) Waarom staat achter het jaartal 2009 een sterretje? (Zoek eventueel op het tabblad “Beschrijving”.) b) Over welke populatie gaat deze tabel? c) Wat zijn de elementen van de populatie als het gaat over “Bevolking”? En wat zijn de elementen als het gaat over “Huishoudens”? d) Over welke variabelen gaat het bij “Bevolking naar geslacht”? e) Over welke variabelen gaat het bij “Particuliere huishoudens”?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
5
f) g)
Wat stelt de “Bevolkingsdichtheid” voor? Wat betekent de toename van de bevolkingsdichtheid? Hoe komt het dat het totale aantal Nederlanders gedeeld door de bevolkingsdichtheid niet voor elk jaar hetzelfde getal is? (Geef minstens twee verklaringen.)
Theorie *************************************** Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken, interpreteren en presenteren van gegevens. Een statisticus is iemand die statistisch onderzoek verricht: ! Je begint een statistisch onderzoek met een vraag die alleen met statistische gegevens kan worden beantwoord. ! Dan stel je vast over welke populatie (doelgroep) het onderzoek gaat. De leden van de populatie zijn de elementen van het onderzoek. ! Vervolgens stel je nauwkeurig vast op welke statistische variabele het onderzoek betrekking heeft. ! Daarna verzamel je de bij die variabele passende data (de statistische gegevens) ! Vervolgens orden je de verzamelde gegevens om meer overzicht te krijgen. ! Tenslotte probeer je een conclusie te trekken. De verzamelde data geef je weer met behulp van tabellen en diagrammen. Welke vorm je kiest hangt af van wat je wilt zeggen: tabellen zijn nauwkeuriger, diagrammen vaak overzichtelijker.
********************************************* Voorbeeld Stel je voor dat je de vraag voorgelegd krijgt hoe het aantal Nederlanders in de loop van de jaren verandert. Dat is een statistische vraag waarvoor het C.B.S. tabellen bijhoudt. Je ziet hier een klein deel van de tabel “Bevolking; kerncijfers naar diverse kenmerken”.
Beschrijf hoe dit deel van de tabel is opgebouwd: welke variabelen worden er gebruikt en hoe hangen die variabelen samen? Uitwerking: Dit deel van de tabel gaat over de Nederlandse bevolking (de populatie). Er komen nogal wat variabelen voor in de tabel: totale bevolking, aantal mannen, aantal vrouwen, totale bevolkingsgroei, aantal levendgeborenen, aantal
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
6
overledenen, geboorteoverschot en bevolkingsdichtheid. Deze variabelen variëren met de tijd. Het CBS heeft de bijbehorende data verzameld. De variabelen aantal mannen, aantal vrouwen en totale bevolking hangen als volgt samen: aantal mannen + aantal vrouwen = totale bevolking En zo kun je ook een samenhang beschrijven tussen de totale bevolkingsgroei, relatief, de totale bevolkingsgroei en de totale bevolking. " Opgave 6 Bekijk het voorbeeld nog eens. a) Hoe komt het C.B.S. aan dergelijke gegevens? b) Licht toe hoe je de waarden van totale bevolkingsgroei, relatief kunt berekenen uit de totale bevolking en de totale bevolkingsgroei. c) Laat met een berekening zien dat de waarde 4,9 voor 2008 klopt. d) Welke uitspraak zou je op grond van deze tabel kunnen doen over de variabele totale bevolkingsgroei, relatief? Opgave 7 In het voorbeeld komt ook de variabele bevolkingsdichtheid voor. a) Hoe berekent het C.B.S. de bevolkingsdichtheid? b) Klopt het dat tussen 1950 en 2000 de oppervlakte van Nederland groter is geworden? Reken na hoeveel km2 ongeveer. Opgave 8 Bekijk nog eens de variabele bevolkingsgroei. a) Waaraan zie je dat deze variabele niet alleen kan worden bepaald uit totale bevolking en geboorteoverschot? b) Waar moet je om de bevolkingsgroei te berekenen ook nog rekening mee houden? c) In welke periode was het geboorteoverschot groter dan de bevolkingsgroei? Wat betekent dit?
!
Opgave 9 Open het bestand met data van de Nederlandse bevolking. Bekijk ook dit leeftijddiagram uit 2008 voor de Nederlandse bevolking. a) Wat wordt verstaan onder “Demografische druk”? b) Laat zien hoe de demografische druk wordt berekend uit de rest van deze tabel. c) De “grijze druk” neemt toe, de “groene druk” neemt af. Wat betekent dit? d) Hoe kun je dit verschijnsel uit het leeftijddiagram afleiden?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
7
Verwerken !
Opgave 10 Ecologische voetafdruk De ecologische voetafdruk (ook mondiale voetafdruk of kortweg voetafdruk) is een getal dat weergeeft welk deel van het aardoppervlak een bepaalde bevolkingsgroep in een jaar gebruikt om van te leven. Dit getal wordt uitgedrukt in mondiale hectares.
Deze vervormde wereldkaart geeft de ecologische voetafdruk van de gemiddelde inwoner van een bepaald land weer. a) Wat betekent het dat Nederland aan de donkere kant van het rood zit? b) Waarom zijn bijvoorbeeld Groenland en Portugal blauw gekleurd? c) De V.S. zijn nogal opgeblazen getekend en Rusland is nogal ingekrompen. Waarom is dat? d) Wat valt je op aan Italië? e) “De kleine Aarde” heeft berekend dat een gemiddelde ecologische voetafdruk van 1,8 voor de hele wereldbevolking haalbaar is. Maak op grond daarvan eens een schatting van de totale biologisch productieve oppervlakte op Aarde. (Zoek eerst op hoeveel mensen de Aarde op dit moment telt.) f) Het diagram op de volgende pagina laat meer details zien. Welke ecologische voetafdruk heeft de gemiddelde Nederlander? g) Litouwen heeft een vergelijkbare ecologische voetafdruk als Nederland terwijl de welvaart er lager is. Geef daarvoor een verklaring. h) De Verenigde Arabische Emiraten hebben een voetafdruk van ongeveer 11,9. De gemiddelde voetafdruk per inwoner van dit land en Nederland samen is niet ongeveer (11,9 + 4,4)/2. Waarom niet? En hoe moet je die dan wel berekenen?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
8
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
9
!
Opgave 11 Dit overzicht van de bijbanen van 44.000 actieve deelnemers van de site www.bijbanen.nl stond in juni 2008 op de site.
a) b) c) d) e) f)
Hoeveel deelnemers van de leeftijdscategorie 14 t/m 16 zijn er ongeveer? Hoeveel deelnemers zitten er ongeveer op VMBO/HAVO/VWO? In welke branche hebben de meeste deelnemers een bijbaan? Hoeveel ongeveer? In het cirkeldiagram lijkt het dat bijna een kwart van de deelnemers in de regio Amsterdam zit. Klopt dat ook? Waarom zijn de twee cirkeldiagrammen misleidend? Wat is er fout? En hoe kun je ze eerlijker maken? Kun je nu zeggen dat 9% van alle mensen met een bijbaan in de horeca werkt?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
10
Opgave 12 De tabel hieronder stamt uit een onderzoek van het C.B.S. naar vakanties van Nederlanders. Een lange vakantie is een vakantie met minstens vier overnachtingen. a) Waaraan zie je dat de grenzen van de regio’s niet zuiver langs provinciegrenzen lopen? b) Over welke populatie gaat deze tabel? Welke variabelen zijn er? c) Hoeveel personen uit regio Noord hielden in 2008 een lange vakantie? d) Uit welke variabelen bereken je het “Gemiddeld aantal lange vakanties per participant”? Hoe gaat die berekening? e) Kun je op grond van deze tabel concluderen dat mensen uit stedelijke gebieden meer behoefte aan lange vakanties hebben? Motiveer je antwoord.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
11
1.2
Data
Verkennen Opgave 13 Stel je voor dat je een statistisch onderzoekje houdt onder de leerlingen in jouw eigen jaargroep. Je vraagt naar: - het geslacht (mannelijk of vrouwelijk) - de lichaamslengte - het lichaamsgewicht - de omvang van het gezin - de afstand tot de school - de bloedgroep - de kleur van de ogen - het zakgeld per maand in euro’s - de voorkeur voor klassieke muziek Sommige van deze variabelen geven een hoeveelheid, een grootte aan, sommige geven een kenmerk aan. a) Welke van deze variabelen geven een kenmerk aan? b) Welke van deze variabelen kun je in een getal uitdrukken? c) Bij welke van deze variabelen is het zinvol om ze op volgorde te zetten? Opgave 14 Hieronder staan de gegevens over de gezinsomvang van leerlingen uit twee 4havo klassen: H4A: 3, 5, 2, 6, 5, 5, 2, 3, 4, 6, 4, 3, 5, 2, 5, 4, 4, 3, 4, 4, 5, 3, 7, 4, 4, 5, 2, 4 H4B: 4, 2, 5, 3, 4, 2, 4, 3, 5, 2, 3, 4, 6, 3, 3, 4, 3, 5, 4, 2, 4, 2, 5, 3 a)
Ga na dat de frequentietabel hieronder bij de data past en leg uit waarom deze frequentietabel handiger is: gezinsomvang (aantal personen) 2 3 4 5 6 7
b) c) d) e)
frequenties H4A 4 5 9 7 2 1
frequenties H4B
Hoeveel leerlingen zaten er in H4A? Hoeveel personen zaten er in totaal in de gezinnen waaruit de leerlingen van H4A kwamen? Hoeveel bedraagt de gemiddelde gezinsomvang in H4A? Vul de tabel verder in voor H4B.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
12
In de frequentietabel staan de absolute frequenties. Door ze allemaal te delen door het totale aantal leerlingen krijg je relatieve frequenties die je ook kunt geven als percentages. Je kunt dan gemakkelijker beide tabellen vergelijken. f) Maak een nieuwe tabel met relatieve frequenties. g) Beschrijf de verschillen tussen H4A en H4B.
Uitleg Kijk je naar de voorgaande twee opgaven, dan kun je vaststellen: - statistische variabelen als het geslacht, de kleur ogen, de godsdienst, de bloedgroep, de naam, e.d., geven alleen een kenmerk van de populatie weer maar hoeven niet noodzakelijkerwijs in een getal te worden uitgedrukt; dit zijn kwalitatieve variabelen; - statistische variabelen als de lengte, de hoogte van het inkomen, de omvang van het gezin, e.d., moeten wel in een getal worden uitgedrukt; dit zijn kwantitatieve variabelen. Het is vaak handig om je gegevens te ordenen in frequentietabellen. Daarin hebben niet alleen de data een logische volgorde, maar is ook meteen te zien hoe vaak een bepaalde waarde van de statistische variabele voorkomt, zijn absolute frequentie. Bij de gegevens over de gezinsomvang van leerlingen uit twee 4havo klassen heb je twee datasets bij eenzelfde kwantitatieve variabele. Om beide datasets goed te kunnen vergelijken is het handiger om met relatieve frequenties te werken, d.w.z. absolute frequenties gedeeld door het totaal, eventueel in procenten. Opgave 15 Hieronder wordt telkens een variabele beschreven die betrekking heeft op de werknemers van een bepaald bedrijf. Geef aan of het een kwalitatieve of een kwantitatieve variabele betreft. Geef ook aan of het maken van een frequentietabel zinvol is en waarom. a) De schoenmaat. b) De lengte. c) Het inkomen in euro. d) De burgerlijke staat. e) Het aantal dienstjaren bij het bedrijf. f) Het aantal personen waaruit het huishouden van de betreffende werknemer bestaat.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
13
Theorie *************************************** Er bestaan verschillende soorten variabelen en dus verschillende soorten data. Een belangrijk onderscheidend kenmerk is: - Een kwalitatieve variabele beschrijft van elk element van de populatie een bepaald kenmerk dat niet noodzakelijk in een getal wordt uitgedrukt (bijvoorbeeld het geslacht, de kleur ogen, de godsdienst, de bloedgroep, de naam, e.d.). - Een kwantitatieve variabele kan wel in een getal worden uitgedrukt (zoals de lengte, de hoogte van het inkomen, de omvang van het gezin, e.d.). Bij veel statistische variabelen kun je een frequentietabel maken. Door tellen hoe vaak een bepaalde waarde van die variabele voorkomt krijg je de absolute frequentie van die waarde. Deel je die absolute frequentie door het totale aantal waarden dan krijg je de relatieve frequentie van die waarde, eventueel in procenten. Relatieve frequenties maken het vergelijken van twee datasets gemakkelijker.
********************************************* Voorbeeld In 1947 hielden de wiskundigen Freudenthal en Sittig een statistisch onderzoek ten behoeve van een nieuw maatsysteem voor vrouwenkleding in opdracht van het warenhuis De Bijenkorf. Onder andere maten zij de mouwlengte van 5001 vrouwen in cm nauwkeurig. Hier zie je een frequentietabel met hun data. ! Welke absolute en welke relatieve frequentie horen er bij een mouwlengte van 60 cm? ! Hoeveel % van deze vrouwen had een mouwlengte vanaf 64 cm? Uitwerking: ! Er zijn 653 vrouwen met een mouwlengte van 60 cm, de absolute frequentie is dus 653. 653 De relatieve frequentie is nu 5001 ! 0,131. !
"
Dat is ongeveer 13%. Een mouwlengte vanaf 64 cm betekent dat je met de mouwlengtes 64, 65, …, 71 te maken hebt. Het gaat daarbij om 159 + 106 + 52 + 18 + 15 + 3 + 0 + 1 = 354 vrouwen. 354 En dat is: 5001 ! 0,071. Dat is ongeveer 7%.
Opgave 16 Bekijk de tabel uit het voorbeeld nog eens. a) Is mouwlengte een kwalitatieve of een kwantitatieve statistische variabele? b) Maak zelf een tabel met relatieve frequenties voor de mouwlengtes. c) Welk nut heeft zo’n tabel voor De Bijenkorf, denk je?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
14
Opgave 17 Je ziet hier de kruistabel die Freudenthal en Sittig maakten van de mouwlengte en de kniehoogte in cm van 5001 vrouwen. a) Hoeveel % van de onderzochte vrouwen heeft mouwlengte 60 cm en kniehoogte 50 cm? b) Welke combinatie van mouwlengte en kniehoogte komt het meeste voor? c) Hoeveel % van de vrouwen met een mouwlengte van 60 cm heeft een kniehoogte van 50 cm? d) Hoeveel % van deze vrouwen heeft een mouwlengte van meer dan 68 cm en een kniehoogte van meer dan 50 cm? e) Hoeveel bedroeg de gemiddelde mouwlengte van de 5001 vrouwen? En de gemiddelde kniehoogte? *Opgave 18 Waarom hebben Freudenthal en Sittig een kruistabel zoals die in opgave 17 gemaakt, denk je? Welke andere kruistabellen zou je ook nog kunnen maken bij een onderzoek dat als doel heeft een nieuw maatsysteem voor vrouwenkleding te ontwerpen? Opgave 19 Stel je voor dat je het onderzoek van Freudenthal en Sittig dit jaar opnieuw zou uitvoeren. Je kunt nu (met de moderne hulpmiddelen) veel meer vrouwen in De Bijenkorf laten opmeten. Als je de resultaten wilt vergelijken met die van Freudenthal en Sittig is het verstandig om met relatieve frequenties te werken. Laat met een rekenvoorbeeld zien waarom dat zo is.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
15
Verwerken !
Opgave 20 Deze tabel laat het aantal geslaagden zien op havo en vwo gedurende een drietal schooljaren. (Bron: C.B.S. juli 2009)
a) b) c) d) e) f) g) h)
Om welke populatie gaat het bij deze data? Welke variabelen worden er onderzocht? Welke soort variabele betreft het? Waar vind je absolute frequenties en waar relatieve frequenties? Op het Havo is in 2007/2008 het geslaagdenpercentage 89. Toon dit aan door een berekening. Hoeveel procent van de examenkandidaten Havo heeft in 2007/2008 een Nprofiel gekozen? En hoeveel M-profielers zijn er dat jaar op Havo? Kun je het geslaagdenpercentage Havo in 2007/2008 berekenen vanuit de percentages geslaagden van de M-profielen en de N-profielen afzonderlijk? Het aantal examenkandidaten met een N-profiel op Havo neemt absoluut gezien toe. Is dat relatief bekeken ook zo? Kun je verklaren waarom de examenkandidaten in alle ongedeelde Nprofielen of M-profielen een hoger geslaagdenpercentage hebben dan het totaal per profiel?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
16
Opgave 21 Voor een biologiepracticum moet het aantal slakken op een stuk grond worden geteld. Het stuk grond wordt daartoe in stukken van 1 m2 verdeeld. Iedere leerling telt het aantal slakken op vier van die stukken. Hier zie je de resultaten: aantal slakken per m2 frequentie a) b) c) d) e)
2 16
3 14
4 7
5 4
6 2
7 3
8 1
9 1
Om welke populatie gaat het hier en om welke variabele? Wat voor soort variabele betreft het? Hoeveel m2 is de oppervlakte van dat stuk grond? Hoeveel leerlingen hebben er geteld? Hoeveel slakken zijn er in totaal geteld? Hoeveel slakken zijn er gemiddeld per m 2 gevonden?
Opgave 22 Hier zie je kruistabellen van zes tentamens en twee hertentamens.
a) b) c)
Welk tentamen werd duidelijk slechter gemaakt dan de meeste studenten hadden verwacht? Hoeveel studenten behaalden bij tentamen A een beter cijfer dan verwacht als er 240 studenten deelnamen? Kun je zeggen dat de twee hertentamens moeilijker waren dan de bijbehorende eerste versies?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
17
1.3
Diagrammen
Verkennen !
Opgave 23 Verpleegster Florence Nightingale was zo geschokt door het gebrek aan hygiëne onder het Britse leger dat vocht tijdens de Krimoorlog, dat ze bij terugkeer deze diagrammen maakte. Rood stelt “dood door verwonding” voor, blauw is “dood door ziektes als gevolg van de slechte omstandigheden” en zwart is “dood door andere oorzaken”. Elk diagram is in twaalf sectoren verdeeld en bij elke sector is vanaf het middelpunt een deel rood gekleurd, een deel zwart en een deel blauw. Die drie delen overlappen elkaar! De oppervlakte van elke sector stelt het aantal militairen voor.
a) b) c) d) e)
Vooral in januari 1855 was de sterfte onder de soldaten hoog. Waaraan stierf verreweg het grootste deel van de militairen in die maand? Wat betekent het in deze figuur als in een bepaalde sector het rode gebied het zwarte gebied overlapt? In welke maanden is dat zo? In welke maand is het aantal doden door verwondingen relatief gezien het hoogst? In welke maanden zijn er helemaal geen doden door verwondingen? Waarom zou Florence Nightingale voor dit type diagram hebben gekozen? Welke andere mogelijkheden zijn er?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
18
!
Opgave 24 In 1968 gaf de toenmalige N.V. Luchthaven Schiphol dit overzicht uit van de verkeersdrukte op enige Europese Luchthavens. a) Waarom zou dit type diagram wel “beelddiagram” worden genoemd? b) Hoeveel passagiers werden er in 1968 op Heathrow vervoerd? c) Bereken hoeveel passagiers er gemiddeld per vlucht op elk van deze luchthavens werden vervoerd. d) Het diagram bestaat uit twee delen, waarbij elk deel op een eigen manier de aantallen weergeeft. Leg dat uit.
Uitleg Als je data overzichtelijk wilt weergeven, of een bepaalde tendens zichtbaar wilt maken, dan zijn tabellen vaak niet erg handig. Je vindt er wel alle gegevens in, maar je mist overzicht, je kunt slecht in één oogopslag zien wat er aan de hand is. Wil je – zoals Florence Nightingale – een boodschap overbrengen, dan zeggen diagrammen meestal meer. Het lijkt wel of er oneindig veel verschillende soorten diagrammen bestaan. Je zult er in deze paragraaf een flink aantal voorbij zien komen. Het beelddiagram, het staafdiagram, het lijndiagram en het cirkeldiagram ken je al. Daarnaast bestaat er een veelheid aan bijzondere diagrammen voor heel specifieke situaties. In deze paragraaf zul je ook daarvan een aantal tegenkomen. Opgave 25 Als je van het diagram van Florence Nightingale een staafdiagram wilt maken, kun je dan de staven even hoog nemen als de stralen van de cirkelsectoren? Opgave 26 Deze diagrammen geven een beeld van de groei van de Nederlandse bevolking. a) Wat voor soort diagrammen zijn het? b) Beschrijf wat je hieruit kunt aflezen. c) Hoe leid je het diagram van de totale
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
19
d)
bevolkingsgroei uit de andere twee af? Wat betekent het afnemen van de totale bevolkingsgroei voor het aantal inwoners van Nederland?
Opgave 27 Bij opgave 10 tref je twee soorten diagrammen aan. Eén daarvan is een gestapeld staafdiagram. Leg uit wat dat is en wat er in dit geval is gestapeld.
!
Opgave 28 In deze twee cirkeldiagrammen wordt het bodemgebruik van Zuid-Holland met dat van heel Nederland vergeleken
a) b)
De getallen in beide diagrammen verschillen nogal, toch kun je in één oogopslag zien dat in Zuid-Holland relatief gezien veel minder bossen zijn dan in Nederland als geheel. Hoe komt dat? Laat door berekening zien dat de sectorhoeken van de categorie “bossen” correct zijn.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
20
c) d)
Bij een cirkeldiagram gaat het eigenlijk om de oppervlakte van een cirkelsector. Wat is er dus mis in de bovenstaande figuur? Dezelfde gegevens kun je ook in een staafdiagram weergeven. Je ziet het hieronder. Wat geeft deze figuur beter weer?
Theorie *************************************** In een tabel heb je vaak alle data nauwkeurig voorhanden, maar een diagram geeft vaak beter overzicht en duidelijker een bepaald verloop weer. Er zijn veel soorten diagrammen, in deze paragraaf kom je de belangrijkste tegen: - in een beelddiagram (pictogram) worden de waarden of de frequenties weergegeven door de oppervlakte van een figuur of het aantal figuren; - in een staafdiagram (bar chart) worden de waarden of de frequenties weergegeven door de oppervlaktes van rechthoekige staven; - in een lijndiagram (line chart) worden de waarden of de frequenties weergegeven door punten in een assenstelsel die door rechte lijnstukken met elkaar worden verbonden; - in een cirkeldiagram (pie chart) worden de waarden of de frequenties weergegeven door de oppervlakte van een cirkelsector; - in een kaartdiagram (cartogram) worden de gegevens in de vorm van een kaart gepresenteerd; - in een puntenwolk of spreidingsdiagram (scatter plot) worden twee variabelen tegen elkaar uitgezet en worden de gegevens aangeduid door punten in een assenstelsel (past bij een kruistabel).
*********************************************
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
21
Voorbeeld Hier zie je nog eens de tabel van de mouwlengte van 5001 vrouwen die Freudenthal en Sittig maakten bij hun onderzoek. Maak er een staafdiagram van. Uitwerking: Nu komt op de horizontale as een schaalverdeling die logisch oploopt met stappen van 1 van 49 t/m 71. Bij elke waarde voor de voetlengte hoort een interval van getallen die op die waarde worden afgerond: bijvoorbeeld bij 54 hoort waarden vanaf 53,5 tot 54,5. Dit is het interval [53,5; 54,5". De staaf die bij de waarde 54 hoort heeft precies de breedte van dat interval en heeft een hoogte van 163 eenheden. Het getal 54 staat onder het midden van deze staaf. En zo gaat dat ook voor alle andere voetlengtes. Je krijgt dan dit staafdiagram:
" Opgave 29 Bekijk het voorbeeld. a) Teken een lijndiagram bij de data over de mouwlengtes van de 5001 vrouwen die Freudenthal en Sittig hebben onderzocht. b) Is een cirkeldiagram hier een geschikte manier om de gegevens te presenteren? Verklaar je antwoord.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
22
!
Opgave 30 Dit cirkeldiagram geeft de uitslag van de Tweede Kamer verkiezingen in 2006. (Bron: Wikipedia) a) Stellen de getallen percentages voor of aantallen kamerzetels? b) Het cirkeldiagram is in 3D weergegeven en dus wat vertekend. Maak zelf het correcte cirkeldiagram door de sectorhoeken te berekenen. c) Maak een staafdiagram van deze data. Is het belangrijk in welke volgorde de partijen in jouw staafdiagram staan?
!
Opgave 31 Dit kaartdiagram geeft informatie over de zuigelingensterfte in Nederland.
a) b)
Waarom zou er voor deze presentatievorm zijn gekozen? Kun je hierbij een staafdiagram of een lijndiagram maken? Beschrijf de nadelen daarvan.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
23
Opgave 32 Als je in de sportzaal een tijdje een bepaalde oefening hebt gedaan, gaat vaak je polsslag wat omhoog. In dit tweezijdige steelblad diagram vind je bijbehorende data. Van elke sporter werd één keer voor en één keer na de oefening de polsslag gemeten. De laagst gemeten polsslag voor de oefening was 50, na de oefening was dat 59. a) Hoeveel sporters deden er aan het onderzoekje mee? b) Hoeveel bedroeg de hoogste polsslag voor de oefening? En na de oefening? c) Hoeveel bedroeg de gemiddelde polsslag voor en na de oefening? d) Gaat de polsslag door de oefening inderdaad omhoog? e) Er wordt wel gezegd dat een steelblad diagram een combinatie is van een staafdiagram en een tabel. Verklaar dat.
Opgave 33 Hier zie je een puntenwolk van lengte en gewicht van de havo scholieren uit één klas. (lengte in cm en gewicht in kg.)
a) b) c) d)
Om hoeveel scholieren gaat het hier? Hoe lang is de zwaarste leerling? Is hij of zij ook het langst? Hoeveel weegt de kleinste leerling? Is hij of zij ook het lichtst? Toevallig was er bij het meten van deze gegevens iemand ziek. Hij was 1,86 m lang. Hoe zwaar zal hij waarschijnlijk zijn?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
24
Verwerken Opgave 34 Dit diagram geeft informatie over de bevolking van Amsterdam.
a) b) c) d) e)
Welke soorten diagrammen tref je in de figuur aan? Wat betekenen de variabelen geboorteoverschot, buitenlands migratiesaldo en binnenlands saldo? Hoeveel bedraagt de bevolkingstoename van Amsterdam in 2004 ongeveer? Hoeveel zijn in dat jaar het geboorteoverschot, het buitenlands migratiesaldo en het binnenlands saldo? Het migratiesaldo zit de éne keer boven en de andere keer onder de nullijn. Geef daar een verklaring voor. Aan het lijndiagram zie je dat in 2007 de Amsterdamse bevolking met ongeveer 6000 personen is toegenomen. Laat zien hoe je dit kunt berekenen vanuit het staafdiagram.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
25
Opgave 35 Op de volgende pagina zie je de medaillespiegel van de Olympische Spelen van 2008 in Beijng, alleen de beste 12 landen. a) Wat geeft elke staaf in dit diagram weer? b) Waarom is er een 3D-diagram gebruikt? Wat staat er op elk van de assen weergegeven? c) Welk land heeft de meeste gouden medailles gewonnen? d) Welk land won de meeste zilveren medailles? e) Welk land heeft in totaal de meeste medailles gewonnen? f) Deze gegevens kun je ook in een gestapeld staafdiagram weergeven. Wat is daarvan het voordeel? En wat is het nadeel? g) Maak zo’n gestapeld staafdiagram. h) Maak ook een staafdiagram waarbij je voor elk land drie staafjes naast elkaar zet voor goud/zilver/brons. i) Kun je nog een andere wijze van presentatie bedenken die alle gewenste informatie bevat en toch een duidelijk overzicht geeft?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
26
Opgave 36 Bekijk de kruistabel voor mouwlengte en kniehoogte van Freudenthal en Sittig nog eens. a) Teken een staafgram van de variabele kniehoogte (in cm). b) Teken ook een lijndiagram van de kniehoogte. Gebruik nu relatieve frequenties. c) Kun je een manier bedenken om een puntenwolk te tekenen van deze gegevens?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
27
!
Opgave 37 Dit stroomdiagram stelt de energiebalans van Nederland voor. Je vindt er de hoeveelheid energie die Nederland zelf opwekt en invoert. Je vindt er ook de energie die we met z’n allen verbruiken dan wel doorvoeren/uitvoeren naar het buitenland. De gebruikte eenheid is 1015 joule.
a) b)
Wat betekent het getal 2281 bij de Aardgaswinning? Hoeveel joule aan energie is er in 2007 verbruikt door onze energiecentrales om elektriciteit op te wekken?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
28
c) d) e) f) g) h)
Deze energiecentrales halen hun energie behalve uit aardgas en steenkool ook uit andere energiebronnen. Waaruit blijkt dat? En om welke energiebronnen zou dat gaan? Hoeveel joule aan energie is er in Nederland in 2007 verbruikt? Hoeveel joule aan energie is er in Nederland in 2007 ingevoerd? Hoeveel joule aan energie is er als elektriciteit ingevoerd? Waarom was het vinden van aardgas in de Nederlandse bodem de afgelopen jaren zo belangrijk voor onze economie? Nederland kent ook opgeslagen energievoorraden. Je ziet dat in het schema op twee plaatsen. Waar?
!
Opgave 38 Mooie diagrammen met gegevens over landen vind je via www.gapminder.org. Klik op “Gapminder World” en je vindt zo’n diagram:
a) b) c) d) e) f) g)
Wat voor soort diagram betreft het hier? Welke twee variabelen zijn er tegen elkaar uitgezet? Welke betekenis heeft de grootte van elke “punt”? Speel deze animatie maar eens af en beschrijf wat je ziet gebeuren. Welke twee landen stellen de grootste cirkels voor? Wat is in 2007 het armste land ter wereld? Hoe zit het met de levensverwachting in dat land? Hoe groot is de bevolking? Waar ligt dit land? Heeft in 2007 het rijkste land ook de hoogste levensverwachting? Om welk land gaat het? Kun je dit verklaren?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
29
h) i) j)
Noem een land dat sinds 1900 (voor die tijd zijn de gegevens onbetrouwbaar) spectaculair is gestegen in levensverwachting. Is het gemiddelde inkomen ook zo spectaculair gegroeid? Je kunt ook naar het tabblad “Map”. Wat voor diagram krijg je dan? Is er op dit tabblad extra informatie beschikbaar of is de informatie alleen anders geordend? Klik op “Family size & length of life”. Speel de animatie af. Beschrijf wat je ziet gebeuren en vertel ook iets over de verschillende categorieën landen. Probeer in ieder geval het merkwaardige bewegen van het “punt” dat China voorstelt te verklaren.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
30
1.4
Interpretaties
Verkennen Opgave 39 De volgende diagrammen komen uit “Exxon Mobile’s Energy Outlook 2004”.
Het bijbehorende onderschrift luidde: In het eerste van de drie diagrammen is goed te zien dat de wereld voor zijn energievoorziening zeker de eerste vijfentwintig jaar grotendeels van fossiele brandstoffen afhankelijk blijft. Olie blijft de belangrijkste energiedrager, maar de productie van gas en steenkool groeit ook flink. Het tweede diagram is een detaillering van het oranje vlak in het eerste (overige energiedragers). De groei van kernenergie stagneert enigszins doordat het maatschappelijk omstreden blijft. Voor de sector windmolens en zonnepanelen (derde diagram) is niet meer dan een bijrol weggelegd, ondanks de indrukwekkende groeicijfers.
a) b) c) d) e)
Hoeveel % van het energieverbruik in 2000 is gebaseerd of fossiele brandstoffen? Hoeveel % van het energieverbruik is dat in 2030 volgens dit scenario. Ondersteunen deze diagrammen de uitspraak dat de eerste vijfentwintig jaar de energievoorziening grotendeels van fossiele brandstoffen afhankelijk blijft? In de derde grafiek lijkt het alsof er een enorme toename van het gebruik van windenergie en zonne-energie zal plaatsvinden. Waarom is er toch volgens Exxon maar een bijrol voor die sector weggelegd? Waaraan zie je dat de ontwikkeling van kernenergie volgens Exxon zal gaan stagneren?
Exxon is in zijn vooruitblik 2004 niet pessimistisch over het vinden van olie. Men verwacht tot het einde van deze eeuw voldoende olie te kunnen winnen, alleen zal het dan niet alleen conventionele aardolie zijn.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
31
Exxon’s Outlook 2004 toont een diagram met de volgende beschikbare oliereserves en belangrijkste vindplaatsen.
Bijschrift bij deze figuur: Er is in ieder geval genoeg aardolie tot het einde van deze eeuw. De kleurschakering geeft aan hoe waarschijnlijk het is dat de getoonde reserves ook daadwerkelijk gewonnen kunnen worden: hoe donkerder, hoe waarschijnlijker. Op de wereldkaart zijn de vindplaatsen per land weergegeven: conventionele oliebronnen in blauw, teerzandolie in rood en leisteenolie in geel.
f) g) h)
Waar denkt men bij Exxon kan er veel teerzandolie worden gewonnen? Op hoeveel miljard vaten wordt de voorraad teerzandolie geschat? Wat bepaalt de beschikbare hoeveelheid reserves: de hoogte van een vat of de inhoud van een vat? Wat is er dus niet correct in deze figuur?
Theorie*************************************** Met statistieken en vooral met diagrammen die statistieken presenteren wil iemand meestal een bepaald verloop van een variabele tot uitdrukking brengen. Vaak worden diagrammen gebruikt om meningen weer te geven en af en toe worden daarbij grafische trucs gebruikt om een bepaald verloop te overdrijven. Daarom is het erg belangrijk om kritisch te zijn op statistisch materiaal. Let goed op: - de keuze van de eenheden; - de keuze van een nulpunt op een schaalverdeling; - de manier van vergroten of verkleinen van figuren om een grotere of kleinere hoeveelheid aan te geven; - het feit dat het bij staafdiagrammen gaat om de oppervlakte van de staaf, zeker als je staven van verschillende breedte gebruikt. In de opgaven in deze paragraaf tref je een aantal situaties aan waarin dit soort zaken voor interpretatieproblemen kunnen zorgen.
********************************************* CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
32
Verwerken Opgave 40 Wij Nederlanders, we doen nauwelijks iets anders dan fietsen. Kijk maar… a) Welk land heeft vermoedelijk de meeste fietsen? b) Welke informatie ontbreekt om dit met zekerheid te kunnen zeggen? c) Hoeveel km fietsen we per persoon in Nederland per jaar ongeveer? d) Het onderste deel van de figuur is eigenlijk een staafdiagram. De lengte van de staaf past dan bij de grootte van de waarde die hij aangeeft. Klopt dat hier wel? Licht je antwoord toe met een voorbeeld. e) Waarom is zo bekeken het bovenste deel van de figuur ook een staafdiagram? Kloppen dan de hoogtes van de “staven”? Opgave 41
a) b)
De linker figuur laat zien hoe het aantal kikkers in de vijver toeneemt. Hoe heeft de maker van deze figuur van overdrijving gebruik gemaakt? In de rechter figuur leggen aardappelhandelaren uit dat er in aardappelen 720 mg Kalium per portie zit. Hoeveel is dat bij broccoli, bij bananen en bij tomaten? Waarom is het rechter staafdiagram misleidend?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
33
Opgave 42 Deze figuur geeft de koers van de US dollar weer in de loop van de jaren. Er zijn behoorlijke schommelingen, maar in de figuur wordt dat toch wel overdreven. a) Wat wordt bedoeld met USD/EUR? b) Hoeveel moest een Europeaan voor een dollar betalen toen de dollar op zijn dieptepunt was? c) Leg uit hoe de overdrijving in deze figuur ontstaat. (Er zijn twee oorzaken.) Opgave 43 Deze twee cirkeldiagrammen geven de uitgaven aan het militaire apparaat in de V.S. weer in twee verschillende jaren.
a) b) c)
d)
Kun je op grond van deze figuur vaststellen dat de “Marines” (de mariniers) in 1998 een groter budget hadden dan in 1990? Welke informatie ontbreekt in deze figuur? In dit staafdiagram zie je werkelijke uitgaven in miljoenen dollars. Schat met hoeveel het totale budget voor het militaire apparaat in de V.S. in deze jaren is afgenomen. Wat betekent dit voor het cirkeldiagram voor 1998?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
34
Opgave 44
Deze lijndiagrammen komen uit een krantenartikel uit 1988. Volgens de linker grafiek rookte in 1958 nog 90% van de mannen in de leeftijdsgroep van 20 tot 65 jaar. In 1987 was dit percentage gedaald tot 43%. Deze sterke daling wordt door de tekenaar op een misleidende wijze benadrukt. a) Wat veroorzaakt deze misleiding? b) Bekijk het diagram van de mannen van 15 tot 20 jaar. De grafiek ziet er ook voor de jaren 1982 tot 1987 dalend uit. Daalt het percentage rokers van die categorie ook werkelijk? c) Bij welke van deze acht diagrammen is er vrijwel nooit van daling sprake? In het krantenartikel stond: Een overzicht van de rookgewoonten in Nederland in 1987 gaf, net als in de jaren daarvoor, opnieuw een daling te zien van het aantal rokers in ons land. Hoewel de betrekkelijk snelle daling in de jaren zeventig en het begin van de jaren tachtig is afgenomen, heeft die tendens zich de afgelopen drie jaar gestabiliseerd op een daling van 1% per jaar. Kon in 1958 worden becijferd dat 60% van de Nederlandse mannen en vrouwen in de leeftijdsgroep van 15 tot 65 jaar rookte, volgens cijfers van de Stichting Volksgezondheid en Roken was dat in 1987 afgenomen tot 37%.
Een lezer van dit artikel denkt dat die 37% niet kan kloppen. Hij redeneert zo: - de laatste drie jaar was er een daling van 1%; - volgens de tekst en de figuur was de daling in de periode daarvoor nog sterker; - in 1958 was het percentage rokers 60; - in de 29 jaar van de periode 1958-1987 is daar zeker 29 x 1% = 29% van af gegaan, dus in 1987 moet het percentage minder dan 31% zijn. d) Leg uit waarom het percentage van 37% wel correct kan zijn als je de 1% daling per jaar goed interpreteert.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
35
Overzicht Je hebt nu alle theorie van het onderwerp “Kijken naar data” doorgewerkt. Het is nu tijd om een overzicht over het geheel te krijgen. Begrippen 1.1: statistiek – populatie – elementen – variabele – data 1.2: meetbaar – kwalitatief – kwantitatief 1.3: beelddiagram – staafdiagram – lijndiagram – cirkeldiagram – kaartdiagram – puntenwolk 1.4: interpretatieproblemen Vaardigheden 1.1: de populatie en de objecten van een statistisch onderzoek herkennen – de te onderzoeken variabele herkennen – soorten data herkennen 1.2: verschillende soorten variabelen en hun data herkennen 1.3: verschillende soorten diagrammen herkennen en op grond daarvan de wijze van aflezen eruit herkennen – een aantal basisdiagrammen zelf kunnen tekenen 1.4: kritisch kijken naar statistisch materiaal Opgave 45 Samenvatten Maak een samenvatting van dit onderwerp door bij elk van de genoemde begrippen een omschrijving of een voorbeeld te geven en bij elk van de genoemde vaardigheden een voorbeeld te geven.
Terugblikken Opgave 46 Op de volgende pagina zie je de kruistabel voor lengte en gewicht die de wiskundigen Freudenthal en Sittig maakten van 5001 vrouwen in het kader van hun onderzoek naar een beter systeem voor kledingmaten van vrouwen in opdracht van warenhuis De Bijenkorf uit 1947. Bekijk de tabel goed. a) Over welke populatie gaat deze tabel? b) Iemand’s lengte is een kwantitatieve variabele die is afgerond. Welk interval is afgerond op 150 cm? c) Hoe heeft de afronding van de gewichten plaats gevonden? Geef ook hiervan een voorbeeld. d) Teken een staafdiagram van de lengtes van de 5001 vrouwen. Gebruik daarbij relatieve frequenties. Teken ook een lijndiagram van deze lengtes. e) Hoeveel procent van de vrouwen is kleiner dan 151,5 cm? f) Kun je ook schatten hoeveel procent van de vrouwen kleiner is dan 153 cm? g) Bereken hoeveel procent van de vrouwen groter is dan 172,5 cm maar lichter dan 64,5 kg.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
36
h)
Schat hoeveel procent van de vrouwen groter is dan 175 cm maar lichter dan 80 kg. Licht toe hoe je te werk gaat.
Opgave 47 Dit beelddiagram geeft informatie over de geboorte en de sterfte in het Duitsland van de jaren 1911 – 1926.
a) b) c)
Waaraan herken je de periode van de Eerste Wereldoorlog? Hoeveel bedroeg het geboorteoverschot in de jaren voor de Eerste Wereldoorlog? Hoeveel bedroeg het geboorteoverschot in de jaren na de Eerste Wereldoorlog? Heb je een verklaring voor het verschil?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
37
Opgave 48 Je ziet hier een overzicht van het aantal ongevallen op de werkplek in Vlaanderen in de periode 1985 - 2002.
a) b) c) d) e) f) g)
Wat is hier de populatie en wat zijn de statistische variabelen? Wat voor vreemds is er aan het staafdiagram? Welke schaalverdeling hoort bij “Aantal ongevallen”? Hoeveel bedroeg het aantal ongevallen op de werkplek in 2000? Hoeveel daarvan waren ernstig? Hoeveel % is dat? Hoeveel bedroeg het aantal ongevallen in deze periode op zijn hoogst? Hoeveel % daarvan was ernstig? De twee getekende lijnen zijn bedoeld om een bepaalde trend weer te geven. Beschrijf de trend voor wat betreft het totale aantal ongevallen op de werkplek. Doe hetzelfde voor het aantal ernstige ongevallen. Wat betekent dit voor het aantal ernstige ongevallen als percentage van het totale aantal ongevallen?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
38
!
Opgave 49 Hieronder zie je een overzicht van de windgegevens op Ameland in de loop van het jaar. De windkracht wordt gemeten in Beaufort: 4 bft komt overeen met matige wind. a) Over welke statistische variabelen gaat dit overzicht? b) Uit welke windrichting komt de wind op Ameland meestal? c) Met betrekking tot de wind op Ameland in juli kun je drie gegevens uit deze figuur aflezen. Welke drie? d) In welke maand waait het op Ameland het vaakst harder dan 4 bft? Hoe hard waait het dan gemiddeld? e) De onderste figuur is geen cirkeldiagram, maar eigenlijk meer een lijndiagram. Licht dat toe. f) Hoe zou dit diagram er uit zien wanneer het als een normaal lijndiagram zou zijn getekend? Welk nadeel heeft dat?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
39
Opgave 50 In De Volkskrant van 2 januari 2008 stond deze infographic.
a) b) c) d) e) f)
Welke soorten diagrammen tref je in deze infographic aan? Waarom is het kaartje eigenlijk geen cartogram maar een legenda? Hoeveel procent van de totale bewezen olievoorraad zit in het MiddenOosten? Waarom wordt er gesproken over de “bewezen” olievoorraad? Let eens op de verticale schaal van het lijndiagram. Wat is daar merkwaardig aan? Wat was er aan de hand tijdens de eerste en de tweede oliecrisis? Welke gevolgen had dit? Wat probeert de krant met dit diagram weer te geven? Verzin een andere kop voor het bijbehorende artikel dan “Olieprijs naar de 100 dollar”.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
40
!
Opgave 51 Deze figuur over de geografische spreiding van de wereldbevolking stond op 22 september 1999 in NRC/Handelsblad.
a) b) c) d) e)
Om wat voor soort diagram gaat het hier? Licht de kop van deze infographic toe. Hoeveel % groeit de bevolking van Noord-Amerika volgens deze voorspelling? Hoe zit het met Europa? Van welk werelddeel wordt relatief gezien de grootste groei verwacht? In 1950 woonde ongeveer de halve wereldbevolking in Azië. Hoe zit dat volgens deze voorspelling in 2050?
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
41
! Onderzoeken Om echt de ins en outs van het bedrijven van statistiek te leren moet je zelf een keer een statistisch onderzoek uitvoeren. Dat ga je ook daadwerkelijk doen als je wat meer kennis over statistiek hebt opgebouwd. Nu ga je jezelf daarop voorbereiden. Opdracht: Beantwoord de volgende vragen: - Welk onderwerp zou je kiezen voor een statistisch onderzoek, m.a.w. welke vraag zou je met behulp van statistisch onderzoek willen beantwoorden? - Welke populatie zou je kiezen om dit onderzoek op uit te voeren? - Hoe zou je het onderzoek willen inrichten? Houd hierbij rekening met je mogelijkheden om ook echt onderzoek te doen, echt te meten, een enquête af te nemen, etc. Hieronder krijg je een paar voorbeelden aangereikt. De eerste mogelijkheid zul je in de komende hoofdstukken af en toe tegenkomen. Voorbeeld 1: Hoofdvraag: Hebben havo-leerlingen in het NG-profiel die wiskunde B hebben gekozen betere cijfers dan havo-leerlingen in het NG-profiel die wiskunde A hebben gekozen? Populatie: Alle havo-leerlingen met een NG-profiel. Onderzoeksmethode: Het gemiddelde eindcijfer voor het havo-examen wordt vergeleken met de gekozen wiskundesoort. Ook worden de cijfers voor natuurkunde, scheikunde en biologie vergeleken met de gekozen wiskundesoort. Voorbeeld 2: Hoofdvraag: Je school gaat alle leerlingen voorzien van sportkleding en koopt daarom shirts en sportbroeken. Daarvoor moet je een bestaand maatsysteem voor kleding (van een bepaalde fabrikant?) gebruiken om vast te stellen hoeveel shirts en broeken je van een bepaalde maat moet inkopen. Hoeveel koop je van elke maat in? Populatie: Alle leerlingen op jouw school. Onderzoeksmethode: Je meet een goed gekozen steekproef van de leerlingen van je school op. Belangrijk is om vooraf vast te stellen welke maten van belang zijn voor de kledingmaat. Vervolgens stel je vast hoeveel procent van de gemeten personen een bepaalde maat broek of shirt heeft. Daarna bereken je hoeveel leerlingen dit jaarlijks op jouw school betreft. Voorbeeld 3: Hoofdvraag: Bij de lessen l.o. (of b.o.) doe je regelmatig de Coopertest en/of de shuttle-run test. Doen sporters deze tests structureel beter dan niet-sporters? Populatie: Alle leerlingen in het vierde leerjaar. Onderzoeksmethode: Eerst stel je vast wat je onder een “sporter” verstaat en vervolgens ga je de resultaten van Coopertest en/of shuttle-run test vergelijken met het aantal uren dat iemand aan zijn sport besteedt.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
42
Kijken naar Data Antwoorden
1.1 Wat is statistiek? Opgave 1 a) 100.000 b) 10.000 c) 98% (of 97,6%) d) 33.000 manschappen waren in Polotzk achtergebleven en zijn op de terugweg weer aangesloten; 14/25e deel (of 56%) overleefde de slag e) -30 ºRe; op 6 oktober 1812 f) -37,5 ºC Opgave 2 a) met getallen en de dikte van de lijn b) temperatuur en datum c) afgelegde afstand; door middel van de schaalverdeling (op schaal) d) datum temp(ºRe) aantal
e)
1 aug 0 100.000
9 sept -9 55.000
14 sept -21 37.000
?24 sept -11 20.000
28 sept -20 28.000
1 okt -24 20.000
6 okt -30 12.000
7 okt -26 8.000
Door in een grafiek twee lijnen weer te geven: eentje voor temperatuur en eentje voor het aantal manschappen Dat de grootste vijand voor het leger de temperatuur was
Opgave 3 a) Maandag 6 juli 2009; 12:13 uur Nederlandse tijd b) 16.521.632 Nu: opzoeken op de site van het CBS c) Omdat het op elk moment verandert en ze (waarschijnlijk) slechts jaarlijks precieze cijfers krijgen; ze schatten de verandering per dag d) Gegevens over de werkloosheid (als percentage van de beroepsbevolking) e) Niet met zekerheid; als de beroepsbevolking in dezelfde periode sterk afneemt, kan het aantal werklozen toch dalen; het is aannemelijk omdat de beroepsbevolking vrij constant is f) Prijzen: stijging (of daling) van de prijzen in procenten Groei: economische groei Vertrouwen: consumentenvertrouwen, saldo van positieve en negatieve antwoorden g) Omdat het gaat over de verandering over een bepaalde periode (in dit geval een kwartaal) h) Ze geven een overzicht van de stand van de economie en dat is voor veel bedrijven en beleidsmakers belangrijk. Opgave 4 a) grootte van het leger, temperatuur, datum, afgelegde afstand b) voordeel: je ziet hoe de grootte van het leger verandert tijdens de veldtocht
c) d)
nadeel: de variabele ‘datum’ wordt nu niet gelijkmatig verdeeld temperatuur De horizontale schaalverdeling klopt niet
Opgave 5 a) Voor het jaar 2009 zijn voorlopige (geschatte?) cijfers gegeven b) de Nederlandse bevolking c) elke inwoner van Nederland; elk (samenwonend) gezin d) mannen en vrouwen e) eenpersoonshuishoudens, meerpersoonshuishoudens en gemiddelde huishoudensgrootte f) het aantal inwoners per km2; Nederland wordt voller g) door afrondingen; de oppervlakte van Nederland verandert bijv. door inpoldering Opgave 6 a) Bevragen van de gemeenten in Nederland b) totale bevolkingsgroei, relatief = totale bevolkingsgroei / 1000 c) 81188 / 16405399 x 1000 ! 4,9 d) De groei van de Nederlandse bevolking neemt af (afnemende groei) Opgave 7 a) bevolkingsdichtheid = totale bevolking / totale oppervlakte Nederland b) 1950: 10.026.773/309 ! 32449 km2; 2000: 15.863.950/468 ! 33897 km2; dus de oppervlakte is met (ongeveer) 1448 km2 toegenomen Opgave 8 a) Dan had totale bevolkingsgroei gelijk moeten zijn aan geboorteoverschot b) migratie c) rond 1960; meer emigranten (vertrekkers) dan immigranten (komers) Opgave 9 a) Dat is de verhouding tussen het niet werkende deel van de bevolking (<20jr en >65jr) en het werkende deel van de bevolking (van 20jr t/m 65jr) Wordt door het CBS als volgt berekend: Het aantal personen van 0 tot 20 jaar én 65 jaar of ouder per honderd personen van 20 tot 65 jaar b) Bijv. 2008 Niet werkend deel = 3.940.450 + 1.799.337 + 615.489 = 6.355.276 Werkend deel = 4.267.063 + 5.783.060 = 10.050.123 Verhouding = 6.355.276 / 10.050.123 x 100(%) ! 63,2(%) c) Per werkend persoon neemt het aantal senioren (>65jr) toe; per werkende persoon neemt het aantal jeugdigen (<20jr) af d) Tussen de 30 en de 60 jaar zit een behoorlijke uitstulping in het leeftijdsdiagram, in de toekomst zullen er daardoor waarschijnlijk naar verhouding meer senioren komen. Daarentegen is de categorie 0 – 5 jaar betrekkelijk klein, dus er zullen naar verhouding minder jeugdigen komen. Opgave 10 Ecologische voetafdruk a) Dat wij in Nederland per persoon relatief erg veel aardoppervlak gebruiken b) Te weinig informatie beschikbaar
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
2
c) d) e) f) g) h)
V.S. is opgeblazen om aan te geven dat ze een relatief groot deel van het aardoppervlak gebruiken en Rusland juist een kleiner deel. De oppervlakten van de landen zijn zo in verhouding met hun voetafdruk Vooral Noord-Italië is erg opgeblazen, kennelijk is de ecologische voetafdruk van Noord-Italië veel groter dan van de rest van Italië. Wereldbevolking (ongeveer) 6,8 miljard; 6,8 x 1,8 ! 12,4 miljard ha (ongeveer) 4,4 Ze zijn minder ver met milieu- en energiebesparende maatregelen Nee, want het inwoneraantal van de Verenigde Arabische Emiraten is veel kleiner dan van Nederland. Nederland: 16,5 miljoen inwoners VAE: 4,8 miljoen inwoners Dus (11,9 x 4,8 + 4,4 x 16,5) / (16,5 + 4,8) ! 6,1 is een betere schatting
Opgave 11 a) ongeveer 7500 (of 7480) b) ongeveer 11500 (of 11440) c) Horeca; ongeveer 4000 (of 3960) d) Nee, slechts 13% komt uit de regio Amsterdam e) De diagrammen geven alleen de grootste 10 weer; er hoort een categorie ‘overig’ bij om de cirkeldiagrammen ‘eerlijk’ te maken. De percentages zijn samen geen 100%. f) Nee, dit is het resultaat van de 44.000 bezoekers van deze ene website; dat zegt waarschijnlijk weinig over alle mensen met een bijbaan in de horeca. Opgave 12 a) De vakantieregio’s lopen door de provinciegrenzen heen, maar voor Noord klopt het bijna: Groningen + Friesland + Drenthe + Overijssel + Flevoland + Noord-Holland = 550 + 620 + 470 + 1080 + 360 + 2440 = 5520 Maar Gelderland + Utrecht + Zuid-Holland = 1900 + 1140 + 3220 = 6260 en dat is meer dan de regio Midden. b) Populatie: Nederlanders; Variabelen: woonprovincie, regio, aantal lange vakanties, bestemming binnen- of buitenland, stedelijkheid gemeente c) Ongeveer 8270 / 2,01 ! 4114 (Bedenk dat alle getallen zijn afgerond!) d) gemiddeld aantal lange vakanties per participant = totaal aantal lange vakanties / (omvang van de populatie x participatie aan lange vakanties / 100) (Bedenk dat alle getallen zijn afgerond!) e) Het participatiepercentage voor ‘niet stedelijk’ ligt iets lager dan voor stedelijke gemeenten; ook het gemiddelde aantal lange vakanties loopt licht op met de mate van verstedelijking; maar het kan ook met de hoogte van het inkomen te maken hebben en niet met de ‘behoefte’ aan vakantie; je zou het dus wel kunnen vermoeden, maar aanvullend onderzoek is nodig.
1.2 Data Opgave 13 a) geslacht, bloedgroep, kleur van de ogen, voorkeur voor klassieke muziek b) lichaamslengte, lichaamsgewicht, omvang van het gezin, afstand tot de school, zakgeld per maand CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
3
c)
lichaamslengte, lichaamsgewicht, omvang van het gezin, afstand tot de school, zakgeld per maand
Opgave 14 a) overzichtelijker en geordend b) 28 c) 113 d) 4,0 e) achtereenvolgens 5, 7, 7, 4, 1, 0 (zie ook hieronder) f) gezinsomvang 2 3 4 5 6 7 totaal
g)
freq. h4a 4 5 9 7 2 1 28
rel.freq. h4a (%) 14 18 32 25 7 4 100
freq h4b 5 7 7 4 1 0 25
rel.freq. h4b (%) 20 28 28 16 4 0 100
In h4b is de gemiddelde gezinsomvang kleiner
Opgave 15 a) kwantitatief, zinvol b) kwantitatief, niet zinvol (tenzij ingedeeld in klassen) c) kwantitatief, niet zinvol (tenzij ingedeeld in klassen) d) kwalitatief, zinvol e) kwantitatief, zinvol f) kwantitatief, zinvol Opgave 16 a) kwantitatief b) ! c) Ze kunnen hun voorraad erop afstemmen; weinig voorkomende maten hoef je (bijna) niet in voorraad te hebben en veel voorkomende maten juist wel Opgave 17 a) ongeveer 0,04% b) mouwlengte 48 cm, kniehoogte 43 cm c) 2/653 " 100 ! 0,3% d) 2/5001 " 100 ! 0,04% e) ongeveer 59,1 cm; ongeveer 43,6 cm Opgave 18 Deze kruistabel past bij een onderzoek naar een verband tussen mouwlengte en kniehoogte. Bestaat zo’n verband dan kan daar bij kledingontwerp rekening mee worden gehouden. Zo is voor het ontwerpen van schoenen b.v. een verband tussen voetlengte en voetbreedte misschien interessant.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
4
Opgave 19 Stel je voor dat je de mouwlengte van 25000 vrouwen zou kunnen meten. Dan komt bijvoorbeeld een mouwlengte 54 cm 700 keer voor. Alleen als je naar relatieve frequenties kijkt zie je dan dat dit minder vaak is dan in het onderzoek van Freudenthal en Sittig. Zij vonden 3,26% en in dit onderzoek komt dit in 700/25000 " 100 = 2,8% van de metingen voor. Opgave 20 a) de leerlingen havo en vwo die in de jaren 2006 t/m 2008 examen deden b) aantal examenkandidaten: kwantitatief aantal geslaagden: kwantitatief percentage geslaagden: kwantitatief onderwijssoort: kwalitatief c) absolute frequenties onder aantal examenkandidaten en aantal geslaagden relatieve frequenties onder percentage geslaagden d) 41371 van de 46313 is 89,3% dus klopt e) N-profiel: 29% (of 29,4%); M-profiel: 32679 f) ja, maar niet zo eenvoudig en niet nauwkeurig want de percentages voor de M- en N-profielen zijn al afgerond: voor 2008/2009 bijvoorbeeld (90 x 13634 + 89 x 32679) / (13634 + 32679) ! 89,2 g) achtereenvolgens 27,9% - 28,4% - 29,4%; dus ja h) Zouden vaak de betere leerlingen een dubbelprofiel hebben? Opgave 21 a) populatie: de slakken op een stuk grond variabele: aantal slakken per m2; kwalitatief b) 48 m2 c) 12 leerlingen d) 172 slakken e) 3,6 Opgave 22 a) hertentamen A (en hertentamen B) b) 36% van 240 is ongeveer 86. c) nee, de reden dat ze slechter zijn gemaakt dan verwacht kan ook andere oorzaken hebben; misschien hebben ze zich niet voldoende voorbereid voor de herkansing
1.3 Diagrammen Opgave 23 a) door ziektes b) meer doden door verwonding dan door andere oorzaken c) september 1855 d) april 1854 t/m augustus 1854 en januari 1855 t/m april 1855 e) zo is in een oogopslag duidelijk dat de meeste doden niet door de strijd maar door ziektes tot stand zijn gekomen; andere mogelijkheid is een staafdiagram of cirkeldiagram of … Opgave 24
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
5
a) b) c) d)
de data worden weergegeven door afbeeldingen 13,5 miljoen Heathrow: 13,5 miljoen/229.200 ! 60; Parijs: 9 miljoen/177.200 ! 51; Frankfurt: 7,5 miljoen/146.700 ! 51; A’dam: 3,5 miljoen/83.400 ! 42; R’dam: 0,5 miljoen/11.700 ! 43 Linkerzijde: de grootte van de vliegtuig geeft het aantal vluchten weer (let op: nu niet de oppervlakte, maar de lengte); Rechterzijde: het aantal poppetjes geeft het aantal passagiers weer
Opgave 25 Nee, want de oppervlakte van elke sector stelt het aantal voor. Opgave 26 a) lijndiagrammen b) over de jaren 1960 t/m 2005 kan de groei van de Nederlandse bevolking afgelezen worden, in totaal, door natuurlijke aanwas en door migratie c) totale bevolkingsgroei = natuurlijke aanwas + migratiesaldo d) dat het inwoners van Nederland nog wel toeneemt, maar minder snel Opgave 27 Stapeldiagram: in plaats van meerdere staafjes naast elkaar, staan de staafjes van de verschillende variabelen op elkaar. Aangegeven is uit welke onderdelen en in welke mate de ecologische voetafdruk voor een land is samengesteld. Opgave 28 a) Omdat de cirkelsector “Bossen” bij Zuid-Holland duidelijk kleiner is dan bij Nederland als geheel b) Totaal Zuid-Holland (!) 344.600, dus 8.171/344.600x360º ! 9º; Totaal Nederland (!) 3.865.000 dus 350.128/3.865.000x360º ! 33º; c) Het cirkeldiagram van Zuid-Holland had veel kleiner getekend moeten zijn dan die van heel Nederland. d) Deze figuur laat de verschillen tussen Zuid-Holland en Nederland beter zien. Opgave 29 a) middens van de staafjes dmv rechte lijnen verbinden (staafjes kunnen weg) b) nee, o.a. teveel categorieën
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
6
Opgave 30 a) Kamerzetels (want totaal is 150) b) CDA: 41/150x360º ! 98º; PvdA: 79º; SP: 60º; VVD: 53º; PVV: 22º; GL: 17º; CU: 14º; D66: 7º; PvdD & SGP: elk 5º c) Zie hieronder; volgorde niet per se van belang
(
'
#$$
)*+ !"
,-.+
&
/, 00* ,00
$$
&"
12
&!
)3
%"
*((
%! $"
%$$!
##
,-.*
#" #! " ! '()
*+,)
-*
..(
*..
/0
'1
(22
*+,(
-/*
Opgave 31 a) om in een oogopslag aan te geven of er duidelijke verschillen zijn tussen zuigelingensterfte in de provincies b) ja, maar dan kun je de geografische spreiding niet zo duidelijk meer zien Opgave 32 a) 15 b) 79; 92 c) 62,9; 73,5 d) ja e) de gegevens zijn af te lezen als in een tabel, maar door de stapeling van bladen is het tevens een staafdiagram Opgave 33 a) 22 scholieren b) 190 cm; nee, de langste leerling is 192 cm c) 51 kg; nee, de lichtste leerling weegt 48 kg d) ongeveer 70 kg Opgave 34 a) stapeldiagram en lijndiagram b) geboorteoverschot, = geboorten minus sterfgevallen buitenlands migratiesaldo = aantal immigranten minus emigranten (dus vertrekken naar een ander land of komen van een ander land naar A’dam) binnenlands saldo = mensen die binnen Nederland verhuizen, dus aantal gekomen naar A’dam minus aantal vertrekkers c) groei van 4000; (ongeveer) 4650; 850; -1500 d) migratiesaldo positief: er komen meer mensen uit het buitenland dan er naar het buitenland vertrekken; negatief saldo: dan juist andersom e) aflezen: geboorteoverschot ! 4750; binnenlands saldo ! 1850; buitenlands migratiesaldo ! -800; dus de toename is 4750 + 1850 – 800 ! 5800
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
7
&"!
Opgave 35 H5=*1 &!! a) Het aantal behaalde medailles ;)2I>5 van elke ‘kleur’ %! 4=03 b) omdat er drie gegevens $! (variabelen) tegelijk worden weergegeven; land, #! medaillekleur, aantal "! c) China (51) ! d) V.S. (38), maar een kanttekening -. + + C)D > 3 3 )82 * )8 )82 hierbij is wel dat er in theorie een + * * )* -, * 5C F* 5> + + + + @ ( 7 +5 2 * 2 7 = + A 1 1 1 ' + * ? < 7 land zou kunnen zijn dat bijna 7 C 0 0 ) 6 + ) 5B > 5 / 0 : 3 ; 4 E 9 65 geen gouden medailles won en 4 daardoor niet in dit diagram van de beste 12 landen staat, maar wel de meeste zilveren medailles van allemaal heeft gewonnen. e) V.S. (110) f) Bij een gestapeld diagram had je direct kunnen zien welk land de meeste medailles in totaal heeft; de verdeling voor de verschillende kleuren onderling tussen de landen valt een beetje weg (op de onderste na) g) Zie hiernaast '! 5>14 h) Zie hiernaast &! i) Lijndiagram, zie hieronder, maar <*3I?6 %! echt duidelijk is het niet… '! 5>14
#!
<*3I?6
%!
"!
J6>+2
$!
!
#! "! !
J6>+2
$!
&!
, *+ ) (
./ . -
4 + ,3 2 1 0
9* + + ,8 6* 75 6 5
4 + ,3 28 * 1 :
93* 8,2 1 ;
, ?6 > 7= 4 <
+ , A ,@
93* ,8 B
ED* D6 ,+ 6C
3 * 2+5 > 3 > G
? + ,G6 D ? F
, + * ) (
./ . -
4 + ,3 2 1 0
9* + + ,8 *6 5 67 5
4 + ,3 28 * 1 :
93* ,8 2 1 ;
, ?6 > = 7 4 <
+ , A ,@
93* ,8 B
D*E 6D + 6,C
4 + 3,6 ? 4 ? H
Opgave 36 a) Zie volgende pagina b) Zie volgende pagina c) Dat is hier nogal moeilijk. Het zou zo kunnen: op de horizontale as de kniehoogtes en op de verticale as de mouwlengtes. Steeds als er bij een bepaalde combinatie een frequentie staat geef je dat met een punt in het assenstelsel aan. Hoe groter de frequentie, hoe dikker de punt. Bijvoorbeeld bij kniehoogte 43 en mouwlengte 60 hoort het punt (43,60) met een dikte van 112.
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
8
? + G, 6D ? F
4 + ,3 6 ? 4 ? H
Opgave 37 a) Nederland haalt zelf voor 2281 x 1015 joule aan energie uit de grond b) 301 x 1015 joule c) Het lijntje ‘overig energie’ naar het blokje centrales; alternatieve energie bijvoorbeeld windenergie en zonne-energie d) 3353 x 1015 joule e) 8856 x 1015 joule
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
9
f) g) h)
83 x 1015 joule aardgas is de hoofdader van de energiebalans: het verzorgt een groot deel van het verbruik aan energie en tevens belangrijk uitvoerproduct linksboven het blokje ‘onttrekking uit voorraden’ en linksonder opslag in ‘bunkers’
Opgave 38 a) spreidingsdiagram of puntenwolk (scatter plot) b) gemiddeld inkomen per persoon (in $) en levensverwachting bij geboorte (in jaren) c) inwoneraantal van het land (‘population, total’) d) het inkomen per hoofd van de bevolking en de levensverwachting nemen beide in de loop van de jaren toe (en vooral vanaf 1950 neemt voor de hele wereld de levensverwachting toe) e) China en India f) Congo; levensverwachting is ook laag (maar niet het laagst); in Afrika (zuidelijk van de Sahara) g) Qatar is het rijkst maar niet de hoogste levensverwachting; het is een oliestaat met een klein aantal zeer rijke mensen en waarschijnlijk een veel groter aantal arme mensen h) bijv. Japan; ja i) kaartdiagram met het inwoneraantal van een land; geografische spreiding: je ziet welke delen van de wereld meer of minder hard groeien j) het aantal kinderen per vrouw neemt drastisch af terwijl de levensverwachting stijgt; …
1.4 Interpretaties Opgave 39 a) ongeveer 80% b) ongeveer 82% c) alleen het linkerdiagram, die andere twee geven juist een ander (vertekend) beeld dat de niet-fossiele brandstoffen juist groeien d) ‘wind en zon’ in totaal is in 2030 nog steeds maar (ongeveer) 3% van ‘overig’; dat is dus 3% van ongeveer 20% van het totaal en dat is minder dan 1% van het totaal e) de breedte van de strook ‘Nucleair’ blijft ongeveer gelijk (en de geschatte groeifactor is 0,7 dus neemt zelfs naar verwachting af) f) Canada, Rusland en Colombia/Venezuela g) bijna 6000 miljard vaten h) de hoogte; de figuur suggereert dat de voorraad conventionele olie veel groter is omdat onze hersenen gewend zijn de inhoud van de getekende vaten te schatten Opgave 40 a) Duitsland, want er zijn heel veel meer Duitsers dan Nederlanders. b) het aantal inwoners van het land c) 1019 km per persoon
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
10
d) e)
België heeft met 327 km bijna het dubbele van Italië (168), maar de staaf is maar een klein beetje langer; de staaf van Groot-Brittannië moet meer dan 3 keer zo lang zijn dan die van Spanje de hoogte van de fiets is dan de hoogte van de staaf; ja, bijv. de Nederlandse fiets is dubbel zo hoog dan de Belgische fiets
Opgave 41 a) vergroting in twee richtingen b) 540, 400, 360; nulpunt ontbreekt: de staaf van aardappelen had precies dubbel zo hoog moeten zijn als de staaf van tomaten maar is bijna drie keer zo hoog Opgave 42 a) de waarde van de Amerikaanse dollar ten opzichte van de euro; ofwel hoeveel dollar heeft dezelfde waarde als 1 euro b) 1,48 dollar is evenveel als 1 euro, dus 1 dollar kost 68 eurocent c) de nul op de verticale as ontbreekt; op de horizontale as zou een ruimere schaal de figuur vlakker laten lijken Opgave 43 a) nee b) de hoogte van de totale uitgaven c) ongeveer 20% afgenomen d) het rechter cirkeldiagram had kleiner getekend moeten worden Opgave 44 a) de hele grafiek is op ‘dalend roosterpapier’ getekend b) nee, redelijk constant c) vrouwen van 65 jaar en ouder d) alle 29 jaar 1% afname geeft 60 · 0,9929 ! 45%, maar er was de eerste jaren meer afname; dus die 37% kan wel kloppen
1.5 Overzicht Opgave 45 Samenvatten zelf doen!
#!"
'&" Opgave 46 !"#$"%%'( '%" a) 5001 vrouwen met een '$" leeftijd > 18 jr '#" b) [148,5 ; 151,5> '!" c) [73,5 ; 76,5> wordt &" afgerond op 75 kg %" d) zie hiernaast $" #" e) 5,3% !" f) de helft van die 342 % ( ! ) $ ' & * # + % ( ! ) $ ' & & & & ) ) ) % % % * * * * $ $ $ ( erbij geeft (!) 8,7% ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' g) 64 stuks, dus 1,3% h) 1/6 deel van de klasse 81 kg en 1/6 deel van de klasse 175 cm moeten erbij: 99 + 1/6 x 129 + 1/6 x 8: ongeveer 122 vrouwen; 2,4%
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
11
Opgave 47 a) er gaan meer mensen dood dan er worden geboren b) 3 x 250.000 = 750.000 c) 2 x 250.000 = 500.000; … Opgave 48 a) populatie: werkenden in Vlaanderen; variabelen: aantal ongevallen en aantal ernstige ongevallen en jaartal b) de nul ontbreekt op de verticale as c) de linker schaalverdeling d) 210.000 ongevallen; 13.250 ernstig; 6% (of 6,3%) e) 275.000 ongevallen; 4,5% ernstig f) het aantal ongevallen neemt lineair af in de tijd; het aantal ernstige ongevallen neemt lineair toe in de tijd g) het percentage ernstige ongevallen neemt toe Opgave 49 a) dominante windrichting; kans op windkracht " 4 bft; gemiddelde windsnelheid (bft); gemiddelde luchttemperatuur (ºC); verdeling van de windrichting b) WSW c) d) e) f)
de dominante windrichting ; de kans op een wind "4 bft is 51%; de gemiddelde windsnelheid was 4 bft; maart; gemiddeld 6 bft de afstand tot het midden van de roos is een maat voor het % wind uit die richting Gewone lijndiagram (zie bijv. hiernaast); de richting is niet meer zo duidelijk af te lezen
&$
!"#$%$"&'()"*#%$"+)&",-)"*#%./0
&" &! % $ # " ! '
( ' '
( '
( ' (
( ' (
() (
()
() )
)
* * * * * * )* ' ) ) )* )* ' ' ' *
Opgave 50 a) cirkeldiagram, kaartdiagram, lijndiagram b) de kleuren in het kaartje komen overeen met de kleuren in het cirkeldiagram en hebben verder geen betekenis c) 61,5%; omdat er waarschijnlijk ook her en der nog onbekende, geheime olievoorraad is d) de nul ligt niet helemaal onderaan; het kan dus ook negatief zijn e) er was minder olie beschikbaar; de olieprijs steeg explosief f) … Opgave 51 a) staafdiagram (of ook gestapeld staafdiagram) b) de Europese bevolking omvatte in 1950 ongeveer 20% van de wereldbevolking en is in 2050 nog maar 7% van de wereldbevolking; aandeel Afrika is erg gestegen c) Noord-Amerika: stijging ongeveer 200%; Europa: stijging ongeveer 20% d) Afrika e) licht gestegen tot (ongeveer) 55%
CTWO – havo wiskunde A – Statistiek en kansrekening 1 – Kijken naar data
12