Samenvatting statistiek havo4 boek 1 H4 Centrummaten: Modus (modaal) = wat het vaakst voorkomt, zowel kwalitatief als kwantitatief Mediaan = het middelste getal, in een rij getallen die op volgorde staat allegetallenoptellen Gemiddelde= X = m = aanta lg etallen Spreidingsmaten: Spreidingsbreedte = Xmax – Xmin Kwartielafstand = Q3 – Q1 (boxplot, elk gedeelte = 25%) Standaardafwijking = σ = s (deze vindt je op de GR, of in de tekst) GR: voer in x = L1 = wat er opgemeten wordt, ook klassenmiddens Y = L2 = frequentie (= aantal keer dat iets voorkomt) Stat calc 1: 1-VarStats L1, L2 Enter, en je krijgt bijna alle bovenstaande gegevens Daarbij kan je aan n = aantal zien, of je goed hebt ingevoerd. Boxplot 2nd stat plot enter On enter type 5 enter xlist = L1 en freq = L2, denk aan x window instellen, graph Teken de relatieve cumulatieve frequentie polygoon Relatief = % cumulatief = bij elkaar optellen polygoon= lijn met hoekjes X = wat opgemeten wordt, Y = frequentie in %, opgeteld Let op: als je klasseverdelingen hebt, neem je bij de frequentiepolygoon het midden van de klasse, maar bij de cumlatieve frequentie polygoon de rechtergrens van de klasse (dus het hoogste getal). Normale verdeling havo 4 boek 2 H8 (GR 2nd Vars normalcdf en invnorm) a. Bij de standaardnormale verdeling heb je te maken met De oppervlakte onder het klokje, en de z-as. Bij het gemiddelde geldt: z = 0 1 σ naar rechts, vanuit het midden : z = 1 , opp = 34% 1 σ naar links, vanuit het midden : z = -1 , opp = 34% 2 σ naar rechts, vanuit het midden : z = 2 , opp = 13,5 2 σ naar links, vanuit het midden : z = -2 , opp = 13,5% Als z geen 1, -1 , 2, of -2 is gebruik je de GR 1. Oppervlakte of % uitrekenen Opp = Φ (z ) = normalcdf (linkergrens , rechtergrens, µ , σ ) Als z de rechtergrens is kies je linkergrens -10 99 Als z de linkergrens is kies rechtergrens +10 99 Opp → % keer 100 ; % → opp gedeeld door 100 2. z uitrekenen z = invnorm(opp) , heb je nodig als je µ of σ moet uitrekenen b. normale verdeling (vooral bij tekstsommen) Stappenplan : Schrijf al je gegevens op, (er zijn er 5): µ = σ = z= linkerOpp (of %) = score X = (feitelijk de linker of rechtergrens)
1
Zet een vraag teken bij wat je uit moet rekenen GR: 1. als je µ , σ en X weet, en Opp ( of % of kans) uit moet rekenen : Normalcdf(linkergrens, rechtergrens, µ , σ ) = opp 2. als je µ , σ , en Opp ( of % of kans) weet, en score X uit moet rekenen : invnorm(opp, µ , σ ) = score X Zonder GR: als je µ of σ uit moet rekenen: Meestal eerst: z = invnorm(linkeropp) , X −µ en daarna: z= , en vergelijking oplossen
σ
Boek 1 hoofdstuk 4 Havo 4 Statistiek. 4.1frequentietabellen 1a. Kwantitatief = wat je kan tellen, bv gewicht, afstand, zakgeld Kwalitatief = niet telbaar, kenmerkend, bv bloedgroep, soort vervoer. b. kwantitatief: lengte, kwalitatief: welk muziekinstrument, haarkleur c. frequentie jongens = aantal jongens = 12 2a. Bloedgroep frequentie 3a. Aantal 1 gezinsleden frequentie 0
O 12
A 10
B 2
AB 4
2
3
4
5
3
7
9
5
6
7
3 1 10 d. Minder dan 4 dus 2 of 3, dat zijn er 10 van de 28 Het percentage= ∗ 100 = 35.7% 28 18 Minstens 4: Het percentage= ∗ 100 = 64.3% 28 4b. Er komt 18 keer voor: 2 slakeen per m 2 , dat zijn dus 18 m 2 Zo kom je op 41m 2 . c. 2 ∗ 18 + 3 ∗ 16 + 4 ∗ 5 + 5 ∗ 7 + 6 ∗ 3+ 7 ∗ 2 = 171
5a. Het komt 11 weken voor dat de bus 0 keer per week te laat is, dat zijn 11 weken, net zo: 11 + 16 + 5 + 3 + 1= 36 weken 27 c. minder dan twee keer, dat is 0 of 1 keer ∗ 100 = 75 % 36 d. 1 ∗ 16 + 2 ∗ 5 + 3 ∗ 3 + 4 ∗ 1 = 39 keer te laat 39 totaal 10 keer per week met de bus, 36 weken, dat is 360 keer ∗ 100 = 10,8 % 360 b. zie vlg blz.
2
frequentie 18
16
14
12
10 frequentie 8
6
4
2
0 0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
aantal keer bus te laat per week
6a. 8 + 6 + 5 + 7 + 6 + 5 + 3 = 40 controlebeurten, dus 40 dagen b. Er zijn 40 ∗ 50 pakken onderzocht, dat is 2000 pakken Te weinig gewicht hadden 1 ∗ 6 + 2 ∗ 5 + 3 ∗ 7 + 4 ∗ 6 + 5 ∗ 5+ 6 ∗ 3 = 104 pakken 104 ∗ 100 = 5.2% 2000 c. Teken de relatieve cumulatieve frequentie polygoon Relatief = % cumulatief = bij elkaar optellen polygoon= lijn met hoekjes X = wat opgemeten wordt, Y = frequentie in %, opgeteld aantal pakken te licht 1.20
1.00
0.80
0.60
aantal pakken te licht
0.40
0.20
0.00 0
1
2
3
4
5
6
7
4.2 Frequentieverdelingen. 7. Er zijn te veel verschillende getallen, dat geeft geen inzicht 8a en c. zie ook blz. 121 Zakgeld per 5 -< 10 mnd. in euro’s frequentie 5
10 - < 15
15 -< 20
20-< 25
25-<30
30-<35
6
5
7
3
1
3
zakgeld per mnd in euro 8 7
frequentie
6 5 4
zakgeld per mnd in euro
3 2 1 0 0
10
20
30
40
zakge ld
9a. twee keer, op de tweede regel b. 6 euro c. 20 euro d. De klassen zijn tientallen, dus 0-<10, 10-<20 enz. 10a.16 echtparen b. 1 man was 33, en niet een vrouw was 33 c. 5 mannen en 6 vrouwen, totaal 11 personen d. 6 mannen en 8 vrouwen = 14 mensen 11 meisjes 123346667 00234 14 eenheden
jongens 125788 1599 23 eenheden
0 1 2 tientallen
12a en b. cum freq 0 538 1673 2891 3832 4489 4572
rel cum freq 0 12 37 63 84 98 100
relatieve cumulatieve frequentie 120
100
80
percentage
klasse 155 160 165 170 175 180 185
60
relatieve cumulatieve frequentie
40
20
0 150
155
160
165
170
175
180
185
190
lengte in cm
4
13. cum freq
rel cum freq 0 16 38 64 88 100
0 8 19 32 44 50
relatieve cumulatieve freqentie 120
100
80
procenten
klasse 60 63 66 69 72 75
60
rel cum freq
40
20
0 0
10
20
30
40
50
60
70
80
gewicht eieren in gram
14. Zodat alle vorige klassen en de laatste klasse bij elkaar geteld worden. Let op: als je klasseverdelingen hebt, neem je bij de frequentiepolygoon het midden van de klasse, maar bij de cumlatieve frequentie polygoon de rechtergrens van de klasse (dus het hoogste getal). 15a. Het onderzoek duurde 5 ∗ 12 = 60 uur, daarvan tankten bij A 50% minder dan 30 klanten per uur, dus dat is 30 uur. b. Minstens 40 klanten is 40 of meer per uur, dat is 80% van de tijd = 48 uur c. twee dagen is 24 uur, dat is 40 % van de tijd, de lijn van B komt daar uit op 55 klanten. aantal klanten per uur per 10 35 30
frequentie
25 20 aantal klanten per uur per 10 15 10 5 0 1
2
3
4
5
6
7
klanten per uur keer 10
d. e. Bij pomp B is het juist drukker, want daar zijn er van 20 tot 60 klanten per uur, in 50% van de tijd, bij pomp A zijn dat er maar 30 16a. perceel 1, minder dan 50 kg per boom : 40% van 200 bomen = 80 bomen perceel 2, minstens 60 kg per boom : 75% van 160 bomen = 120 bomen perceel 1, tussen 50 en 70 kg per boom : 20% van 200 bomen = 40 bomen b. de meeste kg per boom krijg je op perceel 2. Perceel 1: 12200/200 = 61 kg per boom Perceel 1 levert 240 kg meer op. 5
Perceel 2: 11760?160 = 73,5 kg per boom Als de twee percelen even groot zijn staan de bomen ook wijder uit elkaar. Welk perceel het meest oplevert moet je echt uitrekenen perceel 1 : perceel 2: Aantal Kg per Totaal Aantal Kg per Totaal bomen boom gewicht bomen boom gewicht 16 45 720 80 45 3600 10
55
550
24
55
1320
30
65
1950
8
65
520
70
75
5250
32
75
2400
10
85
850
80
85
6800
12200
160
200
11760
4.4 Centrum en spreidingsmaten. somvanallegetallen 200000 + 40000 + 250000 = = 40833 euro aanta lg etallen 12 b. rare manier om met gemiddelde om te gaan, vakbond?
24a. gemiddelde =
25a. Tel alle frequenties bij elkaar . 20 dagen = 4 schoolweken. b. 3 ∗ 0 +3 ∗ 1+ 7 ∗ 2 + 0 ∗ 3 + 3 ∗ 4 + 2 ∗ 5 + 2 ∗ 6 = 51 51/20 = 2,55 = gemiddelde c. mediaan is het middelste getal van 20 getallen, dat zijn de getallen 2 en 2, 00011122222224445566 dus de mediaan is 2 Modus is wat het vaakst voorkomt dus 2 26a. 2 ∗ 0 +4 ∗ 1+ 5 ∗ 2 + 3 ∗ 3 + 3 ∗ 4 + 2 ∗ 5 + 1 ∗ 32 = 77 77/20 = 3,85 = gemiddelde b. 0 0 1 1 1 1 2 2 2 2 2 3 3 3 4 4 4 5 5 32 mediaan en modus zijn ook allebei 2, net als bij de andere klas. c. Gemiddelde verandert door uitschieter 32, andere twee maten niet. 27a. modus = 5, komt het vaakst voor (6 keer), mediaan = 6 (middelste getal) cijfer 3 4 5 6 7 8 9 10 frequentie 2 4 6 5 4 4 3 2 3 ∗ 2 +4 ∗ 4+ 5 ∗ 6 + 6 ∗ 5 + 7 ∗ 4 + 8 ∗ 4 + 9 ∗ 3 + 2 ∗ 10 = 189 189/ 30 = 6.3 = gemiddelde b. gemiddelde = 6.3, mediaan = 6, modus = 5 c. gemiddelde = 6.5 34 ∗ 6.5 = 221 punten totaal 189 + 27 = 216 het vierde cijfer is een 5, want 221 – 216 = 5 28a. kwalitatief (kenmerkend, zonder getal) b en c. alleen de modus
6
29a. mediaan b. modus, want kwalitatief d. modus (iemand heeft een fout gemaakt)
c. gemiddelde
30a. Hoogst mogelijke gemiddelde, 18 ∗ 34 +3 ∗ 44+ 40 ∗ 54 + 9 ∗ 64= 3480 3480/70 = 49,7 Laagst mogelijke gemiddelde, 18 ∗ 25 +3 ∗ 35+ 40 ∗ 45 + 9 ∗ 55= 2850 2850/70 = 40,7 b. mediaan in klasse 45-< 55 c. 38 ligt in een klasse die maar drie keer voorkomt Stel dat er 3 leerk. zijn van 36. In de klasse 45-< 55 zitten 40 lk. Dus zelfs bij een evenwichtige verdeling komt elke leeftijd 45, 46, 47, enz toch al 4 keer voor. 31a. 1800 ∗ 85 + 2200 ∗ 75 + 2600 ∗ 63 + 3000 ∗ 58 + 3400 ∗ 19 = 720400 720400/300 = 2501 branduren (300 = alle freq. opgeteld) b. mediaan = middelste getal dus de klasse 2000-<2400 c. modale klasse komt het vaakst voor, dus 1600-<2000 d. Ik vermoed kleiner, kijkend naar de opbouw van de tabel. GEBRUIK GR ! BELANGRIJK, dit moet je goed kunnen. 32. GR, Stat Edit aantal =L1= {36……46}, freq. =L2 = {6, 12, 18 enz zie tabel} Stat calc 1 var stats enter enter (voer in met 2nd 1 en 2nd 2) L1,L2 enter (vergeet de , niet) Bovenste getal X = gemiddelde= 40.4 vijfde getal = σ x =standaardafwijking (komt later voor, ook als SD) = 2,693 zesde getal = n = aantal waarnemingen (dus alle frequenties opgeteld) = 105 pijltje naar beneden minX = kleinste waarneming = 36 Q1 = 38 Mediaan = 40 Q3 = 43 maxX = grootste waarneming = 46 Boxplot maken van deze gegevens: GR (2nd Y)Stat Plot 1 enter On enter, type 5 (pijltjestoets naar rechts 5 keer) Xlist = L1 en Freq = L2 Zoom:9 Stat Stel je window in x = [35,50] (zie tabel) , y hoeft niet Met tracé krijg je med, Q1 en Q3 , en Xmin en Xmax (pijltjes nar links en rechts)
36
38
40
43
33a. Q1 = 25% van alle waarnemingen = 2 jaar Q3 = 75% van alle waarnemingen = 6.8 jaar
0
2
4.6
6.8
46 Mediaan = 50% = 4.6 jaar
9 jaren
7
34a. 25% van de 50 staten = 12 of 13 staten b. 25% van de staten heeft van 4 tot 6,3 miljoen inwoners, dus ongeveer (3 a 4%) + 25% = 28.5% van de staten heeft meer dan 6 miljoen inwoners c. 25 + 13 = 38 % van de staten heeft minder dan 3 miljoen inwoners d. van Q1 tot Q3 is van 1.8 tot 6.3 miljoen inwoners, gemiddeld 4 miljoen per staat het gaat dus om 25 staten ∗ 4 miljoen inwoners = 100 miljoen inwoners e. Als je rekent totaal 290 miljoen inwoners, 100 miljoen = middelste 50% eerste 25% heeft gemiddeld 1.2 miljoen inwoners ∗ 13 staten = 15 a 16 miljoen inwoners Voor de grootste staten zijn 290 – 100 – 16 = 174 miljoen inwoners ( gemiddeld 14 miljoen per staat) 35a. mediaan is steeds 3 km b. geeft geen goede indruk c. de meeste leerlingen (50%) woont op een afstand tussen 2 en 4 km van school B de meeste leerlingen (50%) woont op een afstand tussen 1 en 5 km van school A d. spreiding het kleinst bij school C, het grootst bij school A 36a. Bij alledrie 70 – 30 = 40 b. A ; 44 -35 = 9 B: 43 -37 = 6 C: 55 – 32 = 23 c. grootste spreiding bij ll. C d. spreidingsbreedte wordt 50, kwartielafstand verandert niet e. spreidingsbreedte is gevoelig voor uitschieters. 37a. Alanya : spreidingsbreedte=12 – 4 = 8, kwartielafstand = 11 – 7 = 4 kleinste spreiding is Alanya Mallorca: spreidingsbreedte=12 – 0 = 12, kwartielafstand = 10 – 6 = 4 Amsterdam; spreidingsbreedte=12 – 4 = 8, kwartielafstand = 8 – 2 = 6 38.
Aklas 4
5
4
4.5
6.5
8
9 Bklas meeste spreiding
6.5
8.5
9
Cklas minste spreiding 4
6
6.5 7
9
39. gebruik je GR stat edit L1 en L2 (freq), stat calc 1 var stats L1, L2 X = gemiddelde= 4.02 vijfde getal = σ x =standaardafwijking (komt later voor, ook als SD) = 1,517
8
40 zelfde manier, maar zonder freq, en daardoor alleen L1 X = gemiddelde= 7.224en σ x =standaardafwijking =0.253 41. L1 = klassemiddens = 67,5 ; 72,5 ; 77,5 ; 82,5 L2 = freq. X = gemiddelde= 75,9 σ x =standaardafwijking = 2,9 (de meeste banden zitten tussen 73 en 78,8 km) n = aantal waarnemingen = 500 42a. σ x =8 cm
b. σ x =1,8
43a en c. gebruik je GR stat edit L1 en L2 (freq), stat calc 1 var stats L1, L2 X = gemiddelde = 5.094 en σ x =standaardafwijking = 0.124 Q1 = 5 mediaan = 5.1 en Q3 = 5.2, kwartielafstand =Q3 – Q1 = 0.2 b. Je ziet al dat de meeste waarnemingen rondom 5.1 liggen, dus is de σ x < 0.1
4.5 steekproeven 44a. suggestie door het woord “zeker ook” b. suggestie door de woorden “vind U niet” c. wat wordt bedoeld met “ veel” 46a. Allemaal mensen die boodschappen doen. b. Mensen die allemaal ‘s morgens naar hun werk gaan. c. Uit elke provincie 1 is te weinig. d. Mensen die van natuur houden. 47a. 5% vlekken blijft, dat is nogal veel. b. op 1 klas kan je geen conclusie baseren c. de leeftijdsopbouw binnen de wijk is niet vermeld. d. vergelijkingen met een onbekend product geven geen info. e. het ligt eraan wanneer die neerslag valt f. misschien is er een kortingsactie onder artsen geweest g. dit is met alle opgepompte banden het geval 48 Uit deze tabel lijkt de ziekte vaker voor te komen bij mannen dan bij vrouwen, Uit de tweede tabel blijkt de ziekte echter met grote waarschijnlijkheid aan roken gekoppeld te zijn. 50 toevalsgetallen maken met de GR: MATH_ ← _PRB_5:randInt(kleinste toevalsgetal, grootste toevalsgetal, aantal toevalsgetal) Daarbij betekent randInt: random = toeval en Int = integer = geheel getal In dit geval heb je: MATH_ ← _PRB_5:randInt(1, 480, 8) 55 = E55 445 = I45 51a. twee lettercodes met herhaling, dus 26 ∗ 26 = 676 codes b. codes met letter A vooraan 1 – 26, B vooraan 27 – 52 , dus nr 65 is code CL 26 ∗ 16 = 416 Q is de 17de letter dus nr 430 is code QN
9
52a. de groepen verschillen sterk in grootte b. 100 van de 5000 = 1 van de 50 dus 1 directielid, 90 winkelmedewerkers en 9 magazijnmedewerkers.
Boek 2 hoofdstuk 8 De normale verdeling. 8.1 Vuistregels bij de normale verdeling 1a. 155-< 160 ; 160-< 165 t/m 185-< 190 (dus per 5 cm, vanaf 1,55 t/m 1,90) b. 1000 personen (getallen boven staven optellen) c. L1 = klassemiddens = 157,5 ; 162,5 ; enz t/m 187,5 L2 = freq. = getallen boven staven σ x ( namen standaard deviatie en standaard afwijking is hetzelfde) X = gemiddelde = µ (spreek uit mu) = 172,3 cm σ x =standaardafwijking = 5,7 cm (de meeste mannen zitten tussen 166,6 en 178 cm n = aantal waarnemingen = 1000 d. σ x ( namen standaard deviatie en standaard afwijking is hetzelfde) e. 95 % 680/1000 = 68% 2a. klassenbreedtes van 1 cm b. 375 (aflezen grafiek) c. nee, alleen al de groep van 170 tot 175 bestaat uit 5 ∗ 370 personen 4 zie vuistregel blz 188, die heb je bij de komende sommen nodig a. µ - 2 ∗ σ x = 50 µ - σ x = 60 µ = 70 µ + σ x = 80 µ + 2 ∗ σ x = 90 b. 68 % c. 95% d. 2,5% e. 47,5% 6. 16% = 2,5% + 13,5% , dus 76 gram = µ - σ x invullen µ = 80 gr. ⇒ σ x = 4 gr. 7a. Het gemiddelde µ zie je bij 50%, b. µ + σ x = 84 % (want 50% + 34%) c. µ = 68 uur en µ + σ x = 75 uur dus d. σ x = 7 uur 9a. De top ligt bij allebei op hetzelfde getal 167cm. b. standaardafwijking is groter bij de groene lijn, die wijkt verder uit c. De oppervlakte onder beide grafieken is even groot, dus platter, dan ook breder d. De lijn heeft dezelfde vorm en hoogte en breedte als lijn A, maar is naar links verschoven. (top boven het gemiddelde van lijn C) 10a. lijn A, de reactie tijd van jonge mensen is korter dan van oudere mensen. b. lijn C, de 60 jarigen want σ x is bij deze lijn het grootst 11a. µ = 65 σ x = 1 c. µ = 67,5 σ x = 1,25
b. µ = 66,5 σ x = 1 d. µ = 70 σ x = 1
10
8.2 Oppervlakte onder de normaalkromme GR:Gebruik steeds Opp = 2nd VARS = distr Distr 2: normalcdf(l, r, µ , σ ) Met l = linkergrens (gegeven of 0 of -10 99 ), r = rechtergrens (gegeven of 10 99 ) Let goed op afronden op 4 decimalen, rond het laatste cijfer goed af. 12a. µ - σ x = 12 en µ - 2 ∗ σ x = 9 het gebied is 13.5% b. Het gebied is 100 – 2.5 = 97.5% c. Het gebied is 2 ∗ 2.5 = 5% d. Het gebied is 50 + 34 = 84% 13a. normalcdf(l, r, µ , σ ) = normalcdf(925, 970, 950, 20)= 0.7357 b. normalcdf(2.6 , 3.9 , 2.8 , 0.7) = 0.5544 c. normalcdf(7.1 , 10 99 , 8.6, 1.3)= 0.8757 d. normalcdf( -10 99 , 130, 150, 12)= 0.0478 14a. normalcdf(1000, 1100, 1080, 60)= 0.5393 b. normalcdf( -10 99 , 5, 3.5, 1.1) = 0.9137 c. normalcdf(700, 10 99 , 850, 120) = 0.8944 15a. normalcdf( -10 99 , 16, 17.1, 1.8) = 0.2706 b. normalcdf(13.4 , 10 99 , 11, 2) =0.1151 c. normalcdf( 0.03, 0.05, 0.04, 0.012) = 0.5953 16a. normalcdf( -10 99 , 28, 21, 4) = 0.9599 b. normalcdf( 17.5, 10 99 , 21, 4) = 0.8092 c. normalcdf( 16.8, 18.7, 21, 4) = 0.1359 17a. normalcdf( -10 99 , 480, 520, 18)= 0.0131 b. normalcdf( 510, 10 99 ,520, 18) = 0.7107 c. normalcdf( 518, 541, 520, 18) =0.4226 18a. normalcdf( 9.8, 10 99 , 8.7, 1.6) = 0.2459 → 24,59% b. normalcdf( -10 99 , 5.1, 8.7, 1.6) = 0.0122 → 1.22% c. normalcdf( 9.1, 12.3, 8.7, 1.6) = 0.3891 → 38.91 % 19a. normalcdf( -10 99 , 12, 16, 3) = 0.09121 b. normalcdf( 12, 10 99 ,16, 3) = 0.9088 c. totaal = 1 of 100% GR, als je de opp weet, en µ en σ , en je zoekt de rechtergrens, kies je 2nd VARS = distr Distr 3: invnorm(Opp, µ , σ ) = a (= rechtergrens) Zoek je de linkergrens, dan doe je eerst hetzelfde, maak een schets en spiegel, zie Uitleg blz 108 Rond a altijd af op 1 decimaal meer dan de gegeven µ .
11
20a. Opp = 0,3 µ = 16 σ = 2 a = invnorm(0.3, 16, 2) = 14.95 b. Opp = 0,7, ivm linkergrens opp = 0.3 µ = 50 σ = 8 invnorm(0.3, 50, 8) = 45.8 c. Opp = 0,86 µ = 600 σ = 70 a = invnorm(0.86, 600, 70) = 675.6 d. Opp = 0,08 ivm linkergrens opp = 0.92 µ = 0,8 σ = 0,2 invnorm(0.92, 0.8, 0.2) = 1,08 21a. bij a =z = 0,333 en bij b = z = 0,667 (elk stuk 33,3%) b. invnorm( 0.333, 40, 5)= 37,8 = a en invnorm( 0.667, 40, 5)= 42,2 (linkergrens en rechtergrens allebei op 2,2 afstand van m = 40) 22a. bij a =z = 0,2 en bij b = z = 0,4 (elk stuk 20%) b. invnorm( 0.2, 1000, 50)= 958 = a en invnorm( 0.4, 1000, 50)= 987 c = 1000 + 13 = 1013 d = 1000 + 42 = 1042 (linkergrens en rechtergrens op dezelfde afstand van µ = 1000) 23a. Opp = 0.5 → linkergrens =0.25 en rechtergrens = 0.75 invnorm(0.25, 18, 2) = 16.65 (linkergrens) en 19.35 (rechtergrens) b. Opp = 0.82 → linkergrens =0.09 en rechtergrens = 0.91 invnorm(0.09, 150, 12) = 133.9 (linkergrens) en 166.1 (rechtergrens) c. Opp = 0.12 → linkergrens =0.06 en rechtergrens = 0.94 invnorm(0.06, 58, 6) = 48.7 (linkergrens) en 67.3 (rechtergrens) 24. Bij dit soort opdrachten heb je de volgende formules nodig, (andere methode dab het boek geeft, die je moet kunnen): opp = normalcdf(l, r, µ , σ ) z = invnorm(opp) X −µ , met X = score en z =
σ
Dit is een stappenplan: bereken σ z = invnorm(0.78) = 0.7722 en z =
450 − 400
σ
⇔σ=
450 − 400 = 64.75 0.7722
25. Dit is een stappenplan: bereken µ z = invnorm(0.08) = -1.4051 170 − µ 170 − µ z= ⇔ -1.4051= ⇔ -1.4051 ∗ 12=170 - µ ⇔ -16.861-170= - µ ⇔ 12 12 186.861= µ Je moet dit ver afronden, bv µ = 187 of 186.9
26. zie 25. bereken µ Omdat de oppervlakte rechts wordt gegeven, moet je daar eerst de oppervlakte links van make, dus 1 – 0.28 = 0.72 ⇒ z = invnorm(0.72)=0.5828 17 − µ 0.5828 = ⇔ 0.5828 ∗ 3.8 = 17 - µ ⇔ 2.215-17= - µ ⇔ 14.8= µ 3 .8 12
27 als je een schets maakt, zie je dat 2080 net zo ver links van 2200 ligt als 2320 er rechts van ligt. De opp. = 0.62, de halve opp = 0.31, de linkergrens = 0.19
2080
2320 2080 − 2200 − 120 en σ = = 136 z = invnorm(0.19)= -0.878 dus -0.878= σ − 0.878 28 oppervlakte rechts, dus links = 0.59 en z = invnorm(0.59) = 0.2275 14.6 − µ a. 0.2275 = ⇔ 0.2275 ∗ 3.5= 14.6 - µ ⇔ µ =13.8 3 .5
b. 0.2275 =
14.6 − 12.3
σ
2200
⇔σ=
14.6 − 12.3 ⇔ σ = 10.1 0.2275
29a. normalcdf(82, 10 99 , 75, 4.8) = 0.0723 b. normalcdf(70, 83, 75, 4.8) = 0.8034 c. opp rechts, dus links = 0.17 invnorm(0.17, 75, 4.8) = 70.4 = a d. 4 stukken van 25%, dus eerste linkergrens = 0.25 invnorm(0.25, 75, 4.8) = 71.8 = b , c = 75 en d = 78.2 30a. het hele gebied links van 30.5 = normalcdf( -10 99 , 30.5, 28, 4.3) = 0.72 Het oranje gebied = 0.36 Het gebied links van a is dus ook 0.36 Invnorm(0.36, 28, 4.3) = 26.5 = a b. links van b ligt 0.72 + 0.19 = 0.91 van de opp. Invnorm(0.91, 28, 4.3) = 33.8 = b 31 maak een schets µ = 2.3enσ = 0.08
13
2.18 a 2.3 2.36 Opp. gebied links van 2.18 = normalcdf(-10 99 , 2.18, 2.3, 0.08) = 0.0668 Opp. gebied links van 2.36 = normalcdf(-10 99 , 2.36, 2.3, 0.08) = 0.7734 Opp gebied normalcdf(2.18, 2.36, 2.3, 0.08) = 0.7066 Halve Opp gebied = 0.3533 Lijn a loopt bij 0.3533 + 0.0668 = 0.42
8.3 Toepassingen normale verdeling Deze sommen zijn een heel goede oefening voor de toets. Je gebruikt steeds normalcdf(linkergrens, rechtergrens, m, s) wanneer je het % of de opp of de kans wilt berekenen X −µ de formule z = wanneer je X , µ , of σ moet berekenen.
σ
Heel vaak moet je dan eerst z uitrekenen met z = invnorm(opp) Schets steeds de normale verdeling en zet je gegevens erin.
32a. X = 182, µ = 178, σ = 5,4 normalcdf (0,182,178,5.4) =0,7705 b. (1-0,7705) ∗ 100 = 22,9% c. 0,229 =22,9% (hetzelfde dus) 33a. X = 2,85 µ = 3 σ = 0,2 normalcdf(0, 2.85, 3, 0.2)=0,2266 Minder dan 2,85 kg = 22,7% b. normalcdf(2.95, 3.05, 3, 0.2)= 0,1974 dus gewicht tussen 2,95 en 3,05 kg = 19,74% c. X = 2,9 (want rechtergrens van 3,1 is hetzelfde als linkergrens van 2,9 bij µ = 3) µ = 3 σ = 0,2 normalcdf(0, 2.9, 3, 0.2)=0,3085 Minder dan 2,9 kg = Meer dan 3,1 kg = 30,9% P(meer dan 3,1 kg ) = 0,309 Je kan ook kiezen normalcdf (3.1, 100, 3 , 0.2) =0,3085 d. P(meer dan 3,1 kg ) = 0,309 dus 0,309 ∗ 450 =139 zakken met meer dan 3,1 kg e. opp gebied links van 2.7 dus normalcdf(0, 2.7, 3, 0.2) = 0.0668 d.i. 6.7% 14
34a. X =80, µ =75, σ = 9 normalcdf(0, 80, 75, 9)= 0,7107, mindeer dan 80 kg ⇒ 100 71,1 = 28,9% meer dan 80 kg b. 1 - normalcdf(60, 90, 75, 9)= 0,0956 ⇒ 9,6% c. 5% zwaarste mannen, dus voorbij grens 0.95 invnorm (0.95, 75, 9)= 89.8 kg Je kan een oproep verwachten vanaf 90 kg d. 1- normalcdf(0, 100, 75, 9)= 0,0027 ⇒ 0,0027 ∗ 4800= 13 mannen meer dan 100kg 35a. X =220, µ =210, σ = 8 normalcdf(0, 220, 210, 8)= 0,8944 minder dan 220 gr. ⇒ 100 – 89.4 = 10.6% meer dan 220 gr. b. normalcdf(0,200, 210, 8)= 0,1056 ⇒ 10,6% van de pakken lichter dan 200 gram 36a. X =50, µ =36.2 , σ = 12.7 normalcdf(0, 50, 36.2, 12.7)= 0,8592 minder dan 50 ⇒ P(meer dan 50 mm) = 1 - 0,8592 = 0,1408 0,1408 ∗ 50= 7 jaren meer dan 50mm b. X =8, µ =36.2 , σ = 12.7 normalcdf(0, 8, 36.2, 12.7)= 0,0110 ⇒ P(minder dan 8 mm) = 0,0110 voor komende maand april
37 X = 60 , µ = 65 , σ = 6 normalcdf(0, 60, 65, 6)=0,2023 ⇒ 20,23 % X = 60 , µ = 62 , σ = 2,5 normalcdf(0, 60, 62, 2,5)=0,2119 ⇒ 21,19% Je hebt uitgerekend de kans dat de batterijen tussen 0 en 60 uur meegaan. Soort A is betrouwbaarder, kans dat hij meer dan 60 uur mee gaat is 79.8 % Net zo als normalcdf(linkergrens, rechtergrens, µ , σ ) = oppervlakte standaardnormaal Zo is invnorm(oppervlakte, µ , σ ) = score X
38a. Opp= 0,05 (5%) µ = 3600 en σ = 200 invnorm(0.05 , 3600, 200) = 3271 Bij 3271 branduren wordt er vervangen b. Een groot deel van de lampen is nog niet defect na 3271 branduren. Mensen gaan klagen als er veel lampen defect zijn 39a. X =30, µ = 28 , σ = 0.6 normalcdf(0, 30, 28 , 0.6)= 0,9996 ⇒ P(meer dan 30 mm) = 1 - 0,9996 = 0,0004 ⇒ 0,04% meer dan 30 mm b. normalcdf(26.5 , 29.5 , 28 , 0.6)= 0,9938 ⇒ (1- 0,9938) ∗ 100= 0,62% onbr.baar c. normalcdf(26.5 , 29.5 , 28 , 0.35)= 0,99998 ⇒ (1- 0,99998) ∗ 100= 0,002% onbr. d. het gaat om gebiedjes met een opp van 20% = 0.2 (linkergrens invnorm(oppervlakte, µ , σ ) = score X , dus dit is de kleinste diameter : invnorm(0.2, 28, 0.35) = 27.97 mm dit is de grootste diameter : invnorm(0.8, 28, 0.35) = 28.03 mm
15
40 Elk evenveel exemplaren, dus opp = 0,2 0,4 0,6 0,8 Klasse a: invnorm(0.2 , 75, 18)= 59.9 cm ⇒ van 0 tot 60 cm Klasse b: invnorm(0.4 , 75, 18)= 70,4 cm ⇒ van 60 tot 71 cm Klasse c: invnorm(0.6 , 75, 18)= 79,6 cm ⇒ van71 tot 80 cm Klasse d: invnorm(0.8 , 75, 18)= 90,1 cm ⇒ van 80 tot 90 cm Klasse e: ⇒ 90 cm en langer De middelste klasse = klasse c ⇒ van71 tot 80 cm 41a. Opp= 0,1 µ = 45 en σ = 5 invnorm(0.1 , 45, 5) = 38,6 Je valt af bij een score lager dan 39 b. dus tot 30%. Invnorm( 0.3, 45,5) = 42,4 Bij een score vanaf 39 t/m 42 mag je herkansen c. beste 3% dus opp links = 0.97 invnorm(0.97 , 45, 5) = 54.4 Ze hoort er net niet bij, want 54 is minder dan 54.4 42a. µ = 3.8 m/s en σ = 1.3 m/s Score X = 5 m/s Opp = normalcdf (0, 5, 3.8, 1.3)= 0.8202 ⇒ 18% van 365 ∗ 24 uur = 1577 uur b. Opp matige wind = normalcdf (3.4, 5, 3.8, 1.3)= 0.6186 ⇒ 61.9% van 365 ∗ 24 uur = 5422 uur
43a. X=5,5 µ =6 en σ = 0.4 normalcdf(0, 5.5, 6, 0.4)=0,1056 ⇒ 10,5% te licht b. Opp = 0.05, want de zakjes moeten zwaarder zijn X −µ ⇒ invnorm(0.05)= -1,6449 = z, µ =? =z ⇔
σ
5,5 − m = -1,6449 ⇔ 5,5 – µ = 0,4 ∗ -1,6449 (= - 0,658) ⇔ 5,5 + 0,658 = µ = 6.158 0,4
44a. µ = 1005 X = 995 Opp = 0.01 (omdat het naar twee kanten 10 gram kan afwijken mag 1 % minder dan 995 gram bevatten) Invnorm(0.01)= -2.3263 X −µ 995 − 1005 − 10 − 10 =z ⇔ = -2.3263 ⇔ = -2.3263 ⇔ = 4.3 = σ σ σ σ − 2.3263 b. σ = 8, z = invnorm(0.05)= -1.6449 X = 1000 µ=? X −µ
1000 − µ =-1.6449 ⇔ 1000 - µ = -1.6449 ∗ 8 ⇔ 1000 - µ = -13.16 σ 8 Dus µ = 1013,2 gram =z ⇔
45a. µ = 70 gr. σ = 20 gr jaarlijks 10000 brieven Hoeveel % is tussen 50 en 100 gram? Normalcdf( 50, 100, 70, 20) = 0.7745 dus 0.7745 ∗ 10000 = 7745 brieven
16
b. Gewicht in gr 0-20 20-50 50-100 100-250 totaal
Tarief
%
Aantal
kosten
0.39 0.78 1.17 1.56
0.598 15.24 77.45 6.68
61 1525 7745 669 10000
23.97 1189.50 9061.25 1043.64 11318.36
c. lichtste 25% dus opp = 0.25 invnorm(0.25, 70, 20) dus t/m 57 gram zwaarste 15% dus opp = 0.85 invnorm(0.85, 70, 20) dus boven 91 gram Gewicht in gr Tarief % Aantal kosten 0-57 0.50 25.8 2577 1288.50 57-91 0.75 59.53 5953 4464,75 91-250 1.00 14.69 1470 1470 totaal 10000 7223.25 Het is een stuk goedkoper (dat had je ook aan de tarieven kunnen zien)
46a. µ = 2.52 kg. σ = 0.12 kg X = 2.5 kg Normalcdf(0, 2.5, 2.52, 0.12) = 0.4338 dus 43,38% is te licht b. µ = 2.56 kg. σ = 0.12 kg gewicht tussen 2.26 en 2.86 kg Normalcdf(2.26, 2.86, 2.56, 0.12) = 0.9876 dus 1.24% wijkt 0.3 kg af c. 4% dus opp = 0.04 en z = invnorm(0.04) =-1.7507 σ = 0.12 kg µ =? X −µ 2 .5 − µ =z ⇔ = -1.7507 ⇔ 2.5 - µ = -1.7507 ∗ 0.12 ⇔ µ = 2.71 kg σ 0.12 16 d. ∗ 100 = 1.88% is zwaarder, dus linkeropp = 0.9812 en z = invnorm(0.9812) = 2.08 853 X −µ 2.78 − µ =z ⇔ = 2.08 ⇔ 2.78 - µ = 2.08 ∗ 0.12 ⇔ µ = 2.53 kg σ 0.12 47a. µ = 2010 σ = 33 normalcdf(1970, 2005, 2010, 33) = 0.3271 dus 32.7% verbruikt b. linkeropp = 0.8 invnorm (0.8, 2010, 33) = 2037.8 Dus ergens in de tweede helft van het jaar 2037 c. Beetje rare vraag, omdat juist zo’n oorlogssituatie vaak tot een afwijking van de norm leidt, maar goed: normalcdf(1940, 1945, 2010, 33) = 0.075 dus 7.5% d. normalcdf(2000, 2005, 2010, 33) = 0.0589 0.0589 ∗ 1800105.93 Gb 800 e. Er was 1800 Gb, gebruikt = 800 Gb dat is = 0.444 deel = linkeropp. 1800 En z = invnorm(0.444)= -0.1397 X −µ 2005 − 2010 −5 −5 =z ⇔ = -0.1397 ⇔ = -0.1397 ⇔ = 35.8 jaar = σ σ σ σ − 0.1397
17
18