1
1 ENKELE STATISTISCHE BEGRIPPEN 1.1
Een statistisch onderzoek Als we goed willen uitleggen wat statistiek precies inhoudt, is het nodig eerst enkele begrippen te verduidelijken. We doen dit aan de hand van enkele voorbeelden. Voorbeeld 1
We willen onderzoeken welk vak de leerlingen van onze school het liefst studeren. Op het enquêteformulier staan volgende vakken vermeld: aardrijkskunde, Frans, geschiedenis, godsdienst, informatica, Nederlands en wiskunde. Er wordt aan de leerlingen gevraagd om één vak te kiezen, het vak dat ze het liefst studeren. Omdat onze school meer dan duizend leerlingen telt, geven we in elke klas enkel een enquêteformulier aan de leerlingen die het klasnummer 5, 10, 15 of 20 hebben. De populatie is de grote groep (personen of objecten) waarvan men een bepaalde eigenschap of kenmerk wil bestuderen. De resultaten van het onderzoek gelden voor de hele populatie. Wat is de populatie in dit voorbeeld?
Meestal voert men het onderzoek slechts uit op een deel van de populatie. Dat deel noemen we dan de steekproef. Wat is de steekproef in dit voorbeeld?
Men onderzoekt eigenschappen of kenmerken van de elementen van de steekproef. Deze eigenschappen of kenmerken noemen we de variabelen van het onderzoek. Wat is de variabele in dit voorbeeld?
Wat zijn de mogelijke waarden van de variabele in dit voorbeeld?
Men verzamelt een heleboel gegevens of data. Dit kunnen antwoorden zijn op een vraag, metingen, gegevens uit een databank… Wat zijn de gegevens in dit voorbeeld?
Enkele statistische begrippen
NITO47W_H1.indd 5
5
10/08/12 4:24 PM
1 Voorbeeld
In een woonwijk ontvangen duizend mensen een enquêteformulier rond de bouw van een nieuw winkelcomplex in de buurt. Van de 80 mensen die reageren, antwoorden er 60 negatief. Men besluit dat 75 % van de woonwijk negatief oordeelt over het nieuwe winkelcomplex. Geef twee redenen waarom deze steekproef niet representatief genoemd kan worden.
De methode waarmee je de gegevens verzamelt, kan ook de representativiteit van de steekproef beïnvloeden. Zo kan je een enquête op verschillende manieren afnemen. Telefonisch, via internet, schriftelijk, met een persoonlijk interview, via krant of tijdschrift…. Dit kan vaak tot verschillende resultaten leiden. Voorbeeld
Op de website van De Standaard wordt een enquête georganiseerd die vraagt of kerncentrales moeten blijven bestaan. De Morgen doet het anders. Zij zullen een duizendtal zorgvuldig geselecteerde mensen telefonisch dezelfde vragen stellen. De groene partij is voor de sluiting van de kerncentrales en stelt alle leden op de hoogte van beide enquêtes. Welke van deze twee steekproeven zal het meest representatief zijn?
Bij het afnemen van een enquête is het belangrijk dat de context zo neutraal mogelijk is. Voorbeeld
De politie heeft zeer zorgvuldig, aselect, een steekproef samengesteld van de inwoners van de gemeente Zwalm. Op een zondag trekt een aantal agenten in uniform rond om de aangeduide mensen te interviewen. Eén van de vragen is: “Hebt u vertrouwen in de politie?” Gaan de mensen allemaal eerlijk antwoorden op de vraag?
8
NITO47W_H1.indd 8
Enkele statistische begrippen
10/08/12 4:24 PM
3
4
5
6
7
Je wilt het analfabetisme in Vlaanderen onderzoeken. Hoe hou je best de enquête? 1
Per telefoon.
2
Per post.
3
Per e-mail.
4
Huis aan huis.
Bij een reclame op de televisie beweert een willekeurig gekozen huisvrouw dat het ene product witter wast dan het andere. Duid de juiste beweringen aan. 1
De steekproefomvang bevat slechts één element en is dus te klein.
2
De steekproef is aselect.
3
De steekproef is representatief.
“Vier op vijf apothekers raden zonnemelk X-factor aan”. Wat kan je uit deze krantenkop besluiten? 1
De streekproefomvang is voldoende groot.
2
De steekproef is aselect.
3
Je hebt onvoldoende informatie.
Na een tv-programma vragen de makers de waardering voor het programma te sms’en. De mogelijke waarderingen zijn: zeer goed (1), goed (2) en slecht (3). Duid de verschillende redenen aan waarom de steekproef niet representatief is. 1
De steekproef is gebaseerd op vrijwillige respons en dus niet aselect.
2
De steekproef bestaat enkel uit mensen met een gsm.
3
De steekproef zou meer mogelijkheden van waardering moeten bieden.
4
De steekproef sluit de mensen uit die het einde van het programma niet gezien hebben.
5
De steekproefomvang is te klein.
Bij een onderzoek naar de invloed van een bepaald geneesmiddel tegen allergie blijkt dat het een positief effect heeft bij 4 op de 5 deelnemers. 1 Kan je iets besluiten in verband met de grootte van de steekproef?
Enkele statistische begrippen
NITO47W_H1.indd 13
13
10/08/12 4:24 PM
12
Zet een kruisje in de passende kolom. Variabele
13
1
Aantal leerlingen dat niet deelneemt aan de les L.O. per dag.
2
De temperatuur in °C om 12.00 uur in de leraarskamer.
3
De lengte van de leerlingen in het eerste studiejaar.
4
De tijd die een Vlaamse student doorbrengt in zijn geliefde stamkroeg.
5
Het bouwjaar van de huizen in je straat.
6
De hoogte van een boom.
NITO47W_H1.indd 16
Discreet
Met elke vraag stemt een variabele overeen. Vul telkens het juiste woord in. Kies uit: nominaal, ordinaal, discreet, continu. De vraag
16
Continu
1
Welke ploeg uit de eerste klasse zal kampioen worden?
2
Naar welk merk gaat je voorkeur bij de aankoop van een motorfiets?
3
Hoe breed is een vrachtwagen?
4
Van hoeveel leerkrachten krijg je les?
5
Hoe groot is je slaapkamer?
6
Wat geldt voor jou? ‘Ik rook niet.’ ‘Ik rook weinig.’ ‘Ik rook veel.’
7
Wat is jouw graad in het leger?
De variabele is…
Enkele statistische begrippen
10/08/12 4:24 PM
2
2 VERWERKEN VAN GEGEVENS 2.1 2.1.1
Frequenties bij kwalitatieve gegevens Een frequentietabel opstellen voor kwalitatieve gegevens Voor het opstellen van een frequentietabel voeren we enkele notaties en begrippen in. Turven is het plaatsen van streepjes om dingen te tellen. Om het tellen achteraf te vereenvoudigen, zetten we iedere vijfde streepje schuin doorheen de vorige vier: De computer maakt het manuele tellen dikwijls overbodig. Als de gegevens nog niet geteld zijn, spreekt men over ruwe gegevens. Als de gegevens geteld zijn, spreekt men over geordende of verwerkte gegevens. In een frequentietabel zijn de gegevens geordend en de frequenties berekend. De absolute frequentie van een gegeven is gelijk aan het aantal keer dat het gegeven geteld is. De relatieve frequentie van een gegeven is de absolute frequentie van dat gegeven gedeeld door het totaal aantal gegevens. Je kan de relatieve frequentie met een decimaal getal tussen 0 en 1 noteren of als een percentage. We spreken af dat we de relatieve frequentie tot op drie decimalen nauwkeurig berekenen. Voorbeeld 1
In twee scholen hebben we aan de leerlingen van het vierde jaar gevraagd het vak dat zij dit jaar het liefst studeren op te schrijven. Omdat de populatie niet erg groot is, nemen we geen steekproef. We hebben alle leerlingen ondervraagd. Frequentietabel voor de eerste school vakken
turfruimte
Aardrijkskunde
relatieve absolute relatieve frequentie frequentie frequentie (%) 8 0,089 8,9 %
Frans
10
0,111
11,1 %
Geschiedenis
10
0,111
11,1 %
Godsdienst
6
0,067
6,7 %
Informatica
13
0,144
14,4 %
Nederlands
19
0,211
21,1 %
Wiskunde
24
0,267
26,7 %
Totaal
90
1
100 %
Vul de frequentietabel aan van de tweede school. Frequentietabel voor de tweede school vakken
turfruimte
relatieve absolute relatieve frequentie frequentie frequentie (%)
Aardrijkskunde Frans Geschiedenis Godsdienst Informatica Nederlands Wiskunde Totaal
Verwerken van gegevens
NITO47W_H2.indd 19
19
10/08/12 4:25 PM
OEFENINGEN 1
Na de examens organiseren twee vierdeklassen een brunch. Aan alle leerlingen wordt gevraagd naar hun favoriete beleg voor de broodjes. Dit is het resultaat. Vul de tabellen verder in. Frequentietabel voor 4A
beleg
turfruimte
absolute frequentie
relatieve frequentie
relatieve frequentie (%)
absolute frequentie
relatieve frequentie
relatieve frequentie (%)
Jonge kaas Smeerkaas Salami Ham Tonijnsalade Totaal
Frequentietabel voor 4B
beleg
turfruimte
Jonge kaas Smeerkaas Salami Ham Tonijnsalade Totaal
Waar of niet waar? Verklaar je antwoord. 1 Kaas is minder geliefd in 4A dan in 4B.
2 De meeste leerlingen uit die twee klassen kiezen voor vlees.
Verwerken van gegevens
NITO47W_H2.indd 25
25
10/08/12 4:26 PM
3
Dit zijn de leeftijden van de vaders van de leerlingen van het vierde jaar van onze school. 42
41
40
43
39
47
40
40
44
39
41
42
43
39
42
38
42
40
41
40
42
41
40
40
44
43
43
47
39
41
41
42
41
44
39
42
48
42
41
41
41
41
42
40
42
40
42
41
41
42
42
42
45
41
41
44
45
42
42
40
42
42
43
40
43
39
43
40
41
41
39
41
48
40
41
41
41
42
44
46
42
41
39
44
Vul eerst de frequentietabel in en beantwoord dan de vragen. 1 Hoeveel procent van de vaders is 40 jaar? 2 Hoeveel procent van de vaders is jonger dan 40 jaar? 3 Hoeveel procent van de vaders is 40 jaar of ouder? 4 Wat betekent het getal in de groene cel?
5 Wat betekent het getal in de blauwe cel?
i
xi
turven
fi
rfi
rfi (%)
cfi
crfi
crfi (%)
Totaal
36
NITO47W_H2.indd 36
Verwerken van gegevens
24/08/12 6:48 AM
V
4
Vul de volgende frequentietabel verder in.
i
xi
fi
1
5
25
2
10
3
15
4
20
5
25
rfi (%)
rfi
cfi
crfi
100
0,769
crfi (%)
0,223
16,9 % 8
Totaal Voor de gegevens in deze tabel geldt: 1 x3
f2
crf5
n
2 Als i 4, dan is xi 3 Als rfi 0,169 dan is i 4 Hoeveel gegevens zijn kleiner dan 20? 5 Hoeveel gegevens zijn kleiner dan of gelijk aan 25? 6 Wat betekent het getal 100 in de groene cel?
V
5
Vul de tabel verder aan.
rfi
rfi (%)
i
xi
fi
1
183
2
2
2
184
4
6
3
185
4
186
18
5
187
20
6
188
8
7
189
8
190
cfi
crfi
crfi (%)
13
12,5 %
59 62
Totaal
Verwerken van gegevens
NITO47W_H2.indd 37
37
10/08/12 4:26 PM
2 Opmerkingen
De verbindingslijnen dienen enkel om de leesbaarheid te verhogen en hebben daarnaast geen betekenis.
15
Als de verticale as te ver ligt van de verschillende waarden xi, kan je altijd gebruik maken van een scheurlijn.
10
scheurlijn 5
0 5
6
7
8
9
10
Het ogief van de cumulatieve relatieve frequenties wordt op analoge wijze getekend. Teken nu zelf het ogief voor de cumulatieve relatieve frequenties van hetzelfde voorbeeld. Ogief van de cumulatieve relatieve frequentie (cfi) 1
0,5
0
1
2
3
4 Aantal huisdieren
Je merkt dat je dezelfde tekening krijgt als voor de cumulatieve absolute frequentie. Als je op de verticale as van het ogief voor de cumulatieve absolute frequenties de gekozen eenheid op de juiste manier aanpast, krijg je het ogief voor de cumulatieve relatieve frequenties. OEFENINGEN 5 – 8
Verwerken van gegevens
NITO47W_H2.indd 49
49
10/08/12 4:26 PM
OEFENINGEN 2.3.1 Grafische voorstelling van frequenties bij kwalitatieve gegevens 1
De leerlingen van de vierdes mogen hun keuze maken voor de sportnamiddag. Zij kunnen kiezen uit: muurklimmen (Mu), skaten (Sk), mountainbiken (Mo), raften (Ra) en boogschieten (Bo). Dit is het resultaat. Mu
Sk
Bo
Ra
Bo
Mu
Bo
Mo
Mo
Mu
Mu
Sk
Mo
Mu
Sk
Mo
Sk
Mu
Sk
Mo
Mu
Ra
Mu
Sk
Mo
Mo
Mo
Mu
Mu
Mu
Ra
Sk
Mo
Sk
Bo
Mu
Sk
Sk
Mo
Sk
Mu
Sk
Mo
Bo
Mu
Mo
Bo
Mo
Ra
Mo
Ra
Mo
Ra
Mo
Bo
Mo
Bo
Mo
Bo
Mo
Bo
Sk
Mo
Sk
Mo
Mu
Mu
Mo
Mo
Mo
Mo
Sk
1 Stel een frequentietabel op. i
xi
fi
rfi
rfi (%)
2 Teken het staafdiagram van de absolute frequenties.
56
NITO47W_H2.indd 56
Verwerken van gegevens
10/08/12 4:27 PM
2
Een voetbalploeg telt op het einde van het seizoen het aantal gewonnen (W) matchen, het aantal verloren (V) matchen en het aantal keer dat gelijk gespeeld (D) werd. Op het staafdiagram kan je het resultaat aflezen. Een slecht seizoen?
14
10 8
W
V
D
1 Vul de frequentietabel in.
2 Teken het strookdiagram en het schijfdiagram. Noteer je berekeningen.
58
NITO47W_H2.indd 58
Verwerken van gegevens
10/08/12 4:27 PM
3
De algemene vergadering van een belangrijke vereniging koos een nieuwe voorzitter. Jef kreeg 30 stemmen. Op het strookdiagram kan je de rest van het resultaat aflezen.
Legende Rlta
Willy
Yvette
Jef
Werner
1 Vul de frequentietabel in.
2 Teken het staafdiagram.
4
In een grote stadsschool van 3000 leerlingen worden er verkiezingen gehouden. Er zijn vijf kandidaten voor de functie van voorzitter van de leerlingenraad: An, Bert, Cécile, Dirk en Eva. De leerlingen van 4A voeren twee weken voor de verkiezingen een opiniepeiling uit en vragen aan een steekproef van 150 leerlingen voor wie ze zullen stemmen. Dit is het resultaat. A
D
B
D
D
D
E
C
E
D
E
D
E
E
A
E
E
E
C
A
E
B
E
B
E
E
C
E
E
E
B
B
E
A
E
D
E
D
A
E
D
D
E
B
E
E
E
A
E
E
B
D
E
E
E
D
E
B
E
E
E
D
E
E
B
D
E
D
D
D
A
E
E
D
C
D
E
E
A
D
E
A
E
E
E
E
C
E
E
E
E
A
B
E
D
B
E
C
E
E
E
E
C
E
D
D
E
E
B
E
E
E
B
E
C
D
E
E
D
B
E
A
E
C
D
A
E
A
D
D
D
A
D
E
E
D
E
C
E
D
E
D
E
E
E
A
E
E
E
C
Verwerken van gegevens
NITO47W_H2.indd 59
59
10/08/12 4:27 PM
Vul de frequentietabel in.
absolute frequentie
Vakken
relatieve frequentie
relatieve frequentie (%)
An (A) Bert (B) Cécile (C) Dirk (D) Eva (E) Totaal Teken het staafdiagram van de relatieve frequenties.
2.3.2 Grafische voorstelling van frequenties bij kwantitatieve gegevens Staafdiagram, schijfdiagram en strookdiagram 5
Een lid van de verkeerscommissie telt het aantal inzittenden van de personenwagens die op een bepaalde plaats in de gemeente voorbijrijden. 1 Vul de tabel verder in.
i
xi
fi
1
1
54
2
2
36
3
3
18
4
4
12
Totaal
60
NITO47W_H2.indd 60
Verwerken van gegevens
10/08/12 4:27 PM
7
Een ijverige bediende van de openbare bibliotheek noteerde gedurende een week het aantal uitgeleende boeken per bezoeker. Hieronder zie je het ogief voor 16 februari 2012. Aantal geleende boeken per klant per week (cumulatief) 55 53 49
C
41 Aantal klanten
B
16
A
10
2 0
1 2 3 4 Aantal ontleende boeken
5
1 Hoeveel bezoekers namen geen boeken mee naar huis? 2 Hoeveel boeken werden uitgeleend op 16 februari 2012?
3 Het lijnstuk [AB] is steiler dan het lijnstuk [BC]. Wat wil dat zeggen?
4 Hoeveel bezoekers namen meer dan drie boeken mee naar huis? 5 Hoeveel bezoekers namen minder dan twee boeken mee naar huis?
62
NITO47W_H2.indd 62
Verwerken van gegevens
10/08/12 4:27 PM
2 2.4
Groeperen van kwantitatieve gegevens Bij een statistisch onderzoek zijn er vaak zeer veel verschillende waarden mogelijk. De frequentietabel is dan zeer lang en weinig overzichtelijk. Bovendien is een grafische voorstelling van een onderzoek met veel verschillende waarden amper leesbaar.
Schijfdiagram met 26 verschillende waarden
Een oplossing voor dit probleem is de gegevens te groeperen in verschillende klassen.
Voorbeeld
De dierentuin wil een onderzoek doen naar de leeftijd van de bezoeker. Men stelt een steekproef samen en verzamelt de volgende gegevens. 6 78 14 25 6 0 27 6 11 12
5 81 5 33 8 12 23 16 10 1
3 45 1 42 9 45 88 18 8 5
26 47 7 4 15 55 25 34 9 37
31 52 64 57 17 53 67 37 48 39
57 53 62 69 19 22 12 91 7 4
34 18 6 12 21 7 43 20 35 5
36 29 7 15 28 9 38 50 33 6
14 34 8 57 66 12 21 7 23 12
16 12 8 2 12 3 7 4 29 18
In deze tabel staan 54 verschillende gegevens. Dit is te veel om in een frequentietabel te zetten. We tellen daarom hoeveel bezoekers jonger zijn dan 10, tussen 10 en 20 jaar oud zijn, tussen 20 en 30 jaar oud zijn, … We krijgen de volgende frequentietabel. Leeftijd
aantal
冤 0,10 冤
31
冤 10,20 冤
21
冤 20,30 冤
13
冤 30,40 冤
12
冤 40,50 冤
6
冤 50,60 冤
8
冤 60,100 冤
9
We werken met halfopen intervallen. In de statistiek noemt men dat een klasse. Een tienjarige hoort niet tot de klasse 冤 0,10 冤 maar wel tot de klasse 冤 10,20 冤 .
64
NITO47W_H2.indd 64
Verwerken van gegevens
10/08/12 4:27 PM
2 De klassenbreedte van een klasse bepaal je door het verschil te berekenen van de bovengrens en de ondergrens van die klasse. De klassen hoeven niet allemaal even breed te zijn. Zo heeft 冤 0,10 冤 klassenbreedte 10 en 冤 60,100 冤 heeft klassenbreedte 40. Gegroepeerde kwantitatieve gegevens worden vaak voorgesteld met behulp van een histogram. Dat is een staafdiagram waarbij de staven tegen elkaar worden geplaatst. De breedte van de staven mag je zelf kiezen. Aantal bezoekers per leeftijdsklasse 35
Aantal bezoekers
30 25 20 15 10 5 0 0
10
20
30 40 leeftijd
50
60
100
Verwerken van gegevens
NITO47W_H2.indd 65
65
10/08/12 4:27 PM
3 Dit zijn de antwoorden van de 10 meisjes uit die klas. 8
9
7
5
9
7
8
8
6
7
Bereken het gemiddeld aantal uren van de meisjes van de klas. x De mediaan is, bij een even aantal gegevens, gelijk aan het gemiddelde van de twee middelste gegevens. In dit voorbeeld zijn er 10 gegevens. 1 10 5,5 → 5,5 ligt tussen 5 en 6 2 De twee middelste gegevens staan dus op de plaatsen 5 en 6. Rangschik de bovenstaande gegevens in stijgende volgorde en bepaal de mediaan.
Me Als de hoogste frequentie tweemaal voorkomt, dan heeft de reeks gegevens twee modi. We spreken dan over een bimodale verdeling. Bepaal de modus (modi) in bovenstaand voorbeeld. Mo1
Voorbeeld 2
In 2007 werd een onderzoek uitgevoerd naar het aantal personenwagens per gezin. In de tabel staan de resultaten van het onderzoek. Bij het berekenen van het gemiddeld aantal personenwagens per gezin kan je gebruik maken van de frequenties van de verschillende waarden. x
0 432 1 1776 … 5 3 6 1 3025 x
x1 f1 x2 f2 … xk fk n
i
xi
fi
cfi
1
0
432
432
2
1
1776
2208
3
2
733
2941
4
3
71
3012
5
4
9
3021
6
5
3
3024
7
6
1
3025
Totaal
3025
Om de berekeningen te vereenvoudigen is het makkelijk een kolom toe te voegen met voor elke waarde het product van de frequentie van die waarde met de waarde zelf. Vervolledig de tabel en bereken daarna de som. i
xi
fi
cfi
xi · f i
1
0
432
432
0 · 432 0
2
1
1776
2208
1 · 1776 1776
3
2
733
2941
2 · 733 1466
4
3
71
3012
5
4
9
3021
6
5
3
3024
7
6
1
3025
Totaal 3025 72
NITO47W_H3.indd 72
Centrummaten en spreidingsmaten
10/08/12 4:29 PM
3 Wat is het gemiddeld aantal personenwagens per gezin? x Bij het bepalen van de mediaan moet je goed kijken naar de frequenties van de verschillende waarden. De cumulatieve frequentie kan hierbij helpen. Bepaal de mediaan in dit voorbeeld. Me Bij het bepalen van de modus is het voldoende de hoogste absolute frequentie te vinden. Bepaal de modus in dit voorbeeld. Mo
Voorbeeld 3
Aan 162 veertienjarigen van eenzelfde gemeente werd gevraagd hoe vaak ze al naar een land buiten België op vakantie waren geweest. De antwoorden werden in de volgende frequentietabel genoteerd.
i
xi
fi
f i · xi
1
0
20
0
2
1
23
23
3
2
42
84
Bereken het gemiddeld aantal keer dat deze 161 jongeren al het buitenland bezocht hadden. Bepaal de mediaan en de modus.
4
3
35
105
5
4
28
6
5
14
x
7
6
7
8
7
3
9
10
1
10
15
1
Me Mo
Totaal
174
Begrippen Het gemiddelde x van een reeks gegevens is gelijk aan de som van die gegevens gedeeld door het aantal gegevens. X1 X2 X3 … Xn1 Xn x n met Xi de verschillende gegevens en n het aantal gegevens. Als de gegevens geordend staan in een frequentietabel, dan kan je het gemiddelde berekenen met de formule: f1 x1 f2 x2 f3 x3 … fk1 xk1 fk xk x n met xi de verschillende waarden, fi de absolute frequentie van xi, n het aantal gegevens en k het aantal verschillende waarden die de variabele kan aannemen. De mediaan Me is, bij een oneven aantal gegevens, gelijk aan het middelste gegeven. Bij een even aantal gegevens neemt men het gemiddelde van de twee middelste gegevens als mediaan. De modus Mo van een groep gegevens is de waarde met de grootste absolute frequentie.
Centrummaten en spreidingsmaten
NITO47W_H3.indd 73
73
10/08/12 4:29 PM
3 3 Peter is 14 jaar en 1,55 meter groot. Hoeveel procent van de 14-jarige jongens zijn groter dan Peter?
4 In welk percentiel bevind jij je ongeveer?
5 Geef een andere naam voor P25, P50 en P75?
Centrummaten en spreidingsmaten
NITO47W_H3.indd 79
79
10/08/12 4:29 PM
8
Aan een klas jongens wordt gevraagd hoe vaak ze per jaar hun haar laten knippen. De resultaten staan in de volgende frequentietabel. i
xi
fi
1
3
4
2
4
5
3
5
12
4
6
3
cfi
xi fi
Totaal Vul de tabel verder aan. Bereken het gemiddelde en bepaal de mediaan en de modus.
x= 9
Me =
Mo =
Een vierde klas doet aan hoogspringen tijdens de LO-les. De beginhoogte is 120 cm. In de volgende frequentietabel kan je aflezen welke hoogte de leerlingen maximaal gesprongen hebben. i
xi
fi
1
120
4
2
125
6
3
130
8
4
135
6
5
140
2
6
145
1
7
150
1
cfi
xi fi
Totaal Vul de tabel verder aan. Bereken het gemiddelde en bepaal de mediaan en de modus.
x=
82
NITO47W_H3.indd 82
Me =
Mo =
Centrummaten en spreidingsmaten
10/08/12 4:29 PM
10
Aan het schietkraam op de kermis koop je voor 5 euro 10 loodjes. Elke schutter die 5 maal in de roos schiet, wint een knuffelbeer. 1 De uitbater noteert elke keer wanneer hij een knuffelbeer moet geven, hoeveel loodjes de klant gekocht heeft. De resultaten staan in de volgende frequentietabel. i
xi
fi
1
10
2
2
20
7
3
30
12
4
40
42
5
50
18
6
60
2
cfi
xi fi
Totaal Vul de tabel verder aan. Bereken het gemiddelde en bepaal de mediaan en de modus.
x=
Me =
Mo =
2 De volgende dag maakt hij de roos wat kleiner en noteert hij weer het aantal gekochte loodjes wanneer een klant met een knuffelbeer naar huis gaat. De resultaten staan in de volgende frequentietabel maar nu zijn enkel de cumulatieve frequenties gegeven. i
xi
fi
cfi
1
20
5
2
30
16
3
40
28
4
50
50
5
60
65
6
70
70
xi fi
Totaal Vul de tabel verder aan. Bereken het gemiddelde en bepaal de mediaan en de modus.
x=
Me =
Mo = Centrummaten en spreidingsmaten
NITO47W_H3.indd 83
83
10/08/12 4:29 PM
2
De leeftijden van vijftien spelers van een voetbalploeg worden verzameld. Teken de boxplot van de gegevens. Bereken daarvoor alle nodige kengetallen. Bereken tot slot ook de variatiebreedte, de interkwartielafstand en het gemiddelde. Duid het gemiddelde aan op de boxplot. 22
3
22
25
26
26
26
26
27
28
28
28
28
29
30
30
Aan 16 mensen werd gevraagd hoeveel uur ze die week met de fiets hadden gereden. Teken de boxplot van de gegevens. Bereken daarvoor alle nodige kengetallen. Bereken ook de variatiebreedte, de interkwartielafstand en het gemiddelde. Duid het gemiddelde aan op de boxplot. 0
0
2
3
5
5
7
8
9
9
9
10
11
12
12
Centrummaten en spreidingsmaten
NITO47W_H3.indd 93
13
93
10/08/12 4:29 PM
4
Een vierde klas doet aan hoogspringen tijdens de LO-les. De beginhoogte is 120 cm. In de volgende frequentietabel kan je aflezen welke hoogte de leerlingen maximaal gesprongen hebben.
i
xi
fi
1
120
4
2
125
6
3
130
8
4
135
6
5
140
2
6
145
1
7
150
1
cfi
xi fi
Totaal Teken de boxplot van de volgende gegevens. Bereken daarvoor alle nodige kengetallen. Bereken ook de variatiebreedte, de interkwartielafstand en het gemiddelde. Duid het gemiddelde ook aan op de boxplot.
94
NITO47W_H3.indd 94
Centrummaten en spreidingsmaten
10/08/12 4:29 PM
5
Aan het schietkraam op de kermis koop je voor 5 euro 10 loodjes. Elke schutter die 5 maal in de roos schiet, wint een knuffelbeer. De uitbater noteert elke keer wanneer hij een knuffelbeer moet geven hoeveel loodjes de klant heeft gekocht. De resultaten staan in de volgende frequentietabel. i
xi
fi
1
10
2
2
20
7
3
30
12
4
40
42
5
50
18
6
60
2
cfi
xi fi
Totaal Teken de boxplot van de gegevens. Bereken daarvoor alle nodige kengetallen. Bereken ook de variatiebreedte, de interkwartielafstand en het gemiddelde. Duid het gemiddelde ook aan op de boxplot.
Centrummaten en spreidingsmaten
NITO47W_H3.indd 95
95
10/08/12 4:29 PM
6
In drie klassen met 20 leerlingen werd dezelfde test wiskunde gemaakt. Van de resultaten werd telkens een boxplot getekend.
Klas 4A
+
Klas 4B
+
+
Klas 4C
0
1
2
3
4
5
6
7
8
9
10
1 Welke klas heeft de grootste interkwartielafstand?
2 Welke klas heeft de kleinste variatiebreedte?
3 Welke klas heeft de grootste mediaan?
4 Welke klas heeft het meeste goede resultaten (meer dan 6)?
5 Hoeveel leerlingen uit klas 4C hebben 4 of minder?
6 In welke klas is de meerderheid geslaagd?
96
NITO47W_H3.indd 96
Centrummaten en spreidingsmaten
10/08/12 4:29 PM
3 • Variatiebreedte en interkwartielafstand. Voor de variatiebreedte of interkwartielafstand bestaan geen functies. Je zal dus zelf een formule moeten invoeren op basis van eerder gemaakte berekeningen. • Maak cel N12 actief. We hebben de kleinste en grootste waarde al berekend. Bereken de variatiebreedte met de formule =N6-N5. • Maak cel N13 actief. Zoek zelf naar de formule voor de interkwartielafstand.
• Dit is het resultaat van je berekeningen.
3.3.2
Vanuit een frequentietabel We beschouwen hetzelfde onderzoek als bij het begin van deze paragraaf, maar nu krijgen we de resultaten in een frequentietabel en beschikken we niet meer over de ruwe data.
Omdat er geen formules bestaan om vanuit een frequentietabel centrum- of spreidingsmaten te berekenen, zal je ze moeten afleiden uit de frequentietabel of vanuit de definitie berekenen. • Gemiddelde Maak een extra kolom G waar je het product van de kolommen A en B berekent. • Maak cel G2 actief en typ de formule =A2*B2. • Kopieer met behulp van de vulgreep de formule uit G2 omlaag tot cel G6. Maak de som van die producten en deel door het totaal aantal gegevens om het gemiddelde te krijgen. • Maak cel G7 actief en bereken de som van G2 t.e.m. G6. • Maak cel G8 actief en typ de formule =G7/B7.
Centrummaten en spreidingsmaten
NITO47W_H3.indd 99
99
10/08/12 4:29 PM
3
• Modus, mediaan, kwartielen, variatiebreedte en interkwartielafstand Deze maten zijn allemaal af te leiden uit de frequentietabel.
100 Centrummaten en spreidingsmaten
NITO47W_H3.indd 100
10/08/12 4:29 PM
OEFENINGEN 1
Met het oog op een goede praktische vorming zijn de leerlingen van technische scholen onderverdeeld in praktijkgroepen met beperkte omvang. Dit zijn de aantallen leerlingen per praktijkgroep in een hotelschool. 8
11
9
8
10
11
9
6
9
10
12
8
12
10
11
10
11
9
10
9
10
9
8
13
6
9
12
9
11
8
10
9
10
7
10
11
10
10
12
7
9
13
9
7
8
9
10
9
10
9
8
9
13
10
11
8
8
10
9
12
7
14
7
12
7
7
11
9
11
10
11
10
10
9
8
11
10
13
6
11
1 Stel de frequentietabel op. 2 Bereken de centrummaten en de spreidingsmaten van de ruwe gegevens. 3 Maak een staafdiagram van de absolute frequenties. 4 Teken een strookdiagram van de relatieve frequenties. 5 Teken een ogief van de cumulatieve relatieve frequenties. 6 Teken een boxplot.
Centrummaten en spreidingsmaten 101
NITO47W_H3.indd 101
10/08/12 4:29 PM
2
In een middelbare school wordt de leeftijd van alle leerlingen van het 4e jaar genoteerd. 14
14
14
15
14
15
14
15
16
15
14
14
15
16
18
16
13
14
14
15
14
15
14
14
16
14
15
14
14
14
14
16
15
15
17
14
15
14
15
14
15
14
14
14
14
15
15
16
17
16
15
15
14
15
18
15
14
14
15
16
15
14
14
14
14
14
14
15
14
14
15
16
14
15
16
15
17
14
14
15
1 Stel de frequentietabel op. 2 Bereken de centrummaten en de spreidingsmaten van de ruwe gegevens. 3 Maak een staafdiagram van de absolute frequenties. 4 Teken een schijfdiagram van de relatieve frequenties. 5 Teken een ogief van de cumulatieve absolute frequenties. 6 Teken een boxplot.
102 Centrummaten en spreidingsmaten
NITO47W_H3.indd 102
10/08/12 4:29 PM