JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 1 SESS: 446 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Wat leer je? Zorgt verbeterde hygiëne voor een toename van allergische aandoeningen? In de statistiek is een methode ontwikkeld om op zo’n vraag een onderbouwd antwoord te geven aan de hand van een steekproefresultaat. Deze methode heet het toetsen van hypothesen. Je maakt hiermee kennis met een belangrijk onderdeel van de statistiek, namelijk de toetsingstheorie.
15.1 Beslissen op grond van een steekproef
theorie C
15.2 Eenzijdig en tweezijdig toetsen
15.3 Binomiale toetsen
15.4 De tekentoets
15.5 Diagnostische toets
15
theorie A, B, C
theorie B
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 2 SESS: 445 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Het toetsen van hypothesen Volgens de laatste gegevens lijdt meer dan 30% van de kinderen in Nederland aan een vorm van allergie. Dat percentage is de laatste decennia sterk toegenomen. Een verklaring wordt gevonden in de door de Britse epidemioloog Strachan geformuleerde hygiënehypothese: door een schonere leefwijze worden kinderen minder blootgesteld aan ziektekiemen, waardoor het natuurlijke afweersysteem ontregeld wordt. Hoewel deze hypothese onderwerp is van felle discussies, wijst onderzoek uit dat bijvoorbeeld kinderen op het platteland minder vatbaar zijn voor allergieën.
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 3 SESS: 498 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
15.1 Beslissen op grond van een steekproef O 1
Fabrikant Helder brengt een vloeibaar schuurmiddel op de markt in flacons van 400 ml. De vulmachine is ingesteld op een gemiddelde ⫽ 400 ml. De praktijk wijst uit dat na verloop van tijd het gemiddelde niet meer precies 400 ml is. a Het zou kunnen zijn dat het gemiddelde is toegenomen. Noem hiervan een nadeel voor de fabrikant. b Noem een nadeel van een te laag gemiddelde.
In alle opgaven en theorie over Helder geldt: Inhoud X is normaal verdeeld met σx = 4ml Vulmachine is ingesteld op μ x = 400ml
Theorie A Beslissingsvoorschrift
De vulmachine van fabrikant Helder zorgt per flacon schuurmiddel voor een inhoud van X ml, waarbij X normaal verdeeld is met X ⫽ 4 ml. De vulmachine is ingesteld op een gemiddelde van X ⫽ 400 ml, maar na verloop van tijd is het gemiddelde niet meer precies 400 ml. Vandaar dat Helder op gezette tijden een aselecte steekproef neemt en op grond van het steekproefgemiddelde besluit de vulmachine al dan niet bij te stellen. Helder besluit tot het nemen van een steekproef van 25 flacons. Hij berekent de gemiddelde inhoud X per flacon. Zoals je weet, volgt uit de 冪n-wet dat X normaal verdeeld is met μ X ⫽ X ⫽ 400 en X 4 X ⫽ ⫽ ⫽ 0,8. 冪25 5 Bij een meetresultaat van X ⫽ 399 of X ⫽ 400,5 zal Helder op grond van X ⫽ 0,8 geen aanleiding zien tot bijstelling over te gaan. Bij het meetresultaat X ⫽ 404 is er alle aanleiding om te twijfelen aan de juiste werking van de vulmachine. Maar wat zal Helder beslissen als X ⫽ 398 of X ⫽ 401,8? Het is bij dit soort problemen gebruikelijk een beslissingsvoorschrift af te spreken dat aangeeft bij welke meetresultaten tot bijstelling wordt overgegaan. Helder zou bijvoorbeeld kunnen afspreken
√n n-wet Voor het streekproefgemiddelde X geldt μx = μx en σ √n
x σx = —.
X = 400,5 is nog geen σ van het gemiddelde af. Dat zou dus kunnen. X = 404 is maar liefst 5σ van het gemiddelde af. Dat is vrijwel onmogelijk.
μX = 400 σX = 0,8
Vulmachine bijstellen als X ⱕ 398 of X ⱖ 402. Helder loopt met zo’n afspraak een zeker risico. Het is immers mogelijk dat X ⫽ 397,8, terwijl de machine goed werkt. Hij vraagt zich daarom af hoe groot het risico is dat hij de machine bijstelt, terwijl deze goed werkt. Dit risico is P共X ⱕ 398 of X ⱖ 402兲 bij μ X ⫽ 400 en X ⫽ 0,8.
398
400
402
figuur 15.1 䊲
84 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 4 SESS: 450 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
P共X ⱕ 398 of X ⱖ 402兲 ⫽ 2 ⭈ P共X ⱕ 398兲 ⫽ 2 ⭈ normalcdf共⫺10 99, 398, 400, 0.8兲 ⬇ 0,012 Helder loopt een risico van 1,2% dat de productie wordt stilgelegd om de vulmachine bij te stellen, terwijl dat eigenlijk niet nodig is. We zeggen dat de vulmachine in dat geval ten onrechte wordt bijgesteld. Het risico voor Helder wordt kleiner als gekozen wordt voor het beslissingsvoorschrift Vulmachine bijstellen als X ⱕ 397 of X ⱖ 403. Toch is het niet verstandig het beslissingsvoorschrift zo te kiezen dat dit risico heel erg klein is. Helder heeft immers nog met een ander soort risico te maken, namelijk het risico dat het productieproces voortgaat, terwijl het gemiddelde niet 400 ml is. En dat kan vervelende consequenties hebben. voorbeeld
Fabrikant Helder neemt een steekproef van 40 flacons. Hij kiest het beslissingsvoorschrift Vulmachine bijstellen als X ⱕ 398,5 of X ⱖ 401,5. a Bereken de kans dat ten onrechte tot bijstelling wordt overgegaan. b Neem eens aan dat de machine werkt met een gemiddelde van 398 ml. Bereken de kans dat op grond van het steekproefresultaat de vulmachine niet wordt bijgesteld. Aanpak a Ten onrechte bijstellen impliceert • er wordt bijgesteld, dus het steekproefresultaat voldoet aan X ⱕ 398,5 of X ⱖ 401,5 • het bijstellen geschiedt ten onrechte, dus in werkelijkheid is het gemiddelde ⫽ 400. b Op grond van het steekproefresultaat X wordt niet tot bijstelling overgegaan, dus X voldoet aan 398,5 ⬍ X ⬍ 401,5. 4 Bereken P共398,5 ⬍ X ⬍ 401,5兲 met μ X ⫽ 398 en X ⫽ . 冪40 Uitwerking a P共ten onrechte bijstellen兲 ⫽ P共X ⱕ 398,5 of X ⱖ 401,5兲 ⫽ 2 ⭈ P共X ⱕ 398,5兲 ⫽ 4 ⬇ 0,018 2 ⭈ normalcdf ⫺10 99, 398.5, 400, 冪40 b P共niet bijstellen兲 ⫽ P共398,5 ⬍ X ⬍ 401,5 bij μ X ⫽ 398兲 ⫽ 4 ⬇ 0,215 normalcdf 398.5, 401.5, 398, 冪40
冉
冉
μX = 400 4 40
σX =
398,5
400
冊
401,5
μX = 398 4 40
σX =
冊
398,5
401,5
Het toetsen van hypothesen 85
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 5 SESS: 444 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
2
Neem aan dat fabrikant Helder een steekproef van 50 flacons neemt. Hij kiest als beslissingsvoorschrift Vulmachine bijstellen als X ⱕ 399 of X ⱖ 401. a Bereken de kans dat hij ten onrechte de machine gaat bijstellen. b Waarom is het niet mogelijk de kans te berekenen dat Helder terecht tot bijstelling overgaat? c Neem aan dat de machine werkt met het gemiddelde van 401 ml. Bereken de kans dat Helder op grond van het steekproefresultaat niet tot bijstelling overgaat.
3
De vulmachine wordt ten onrechte bijgesteld. 1 Er vindt bijstelling plaats, dus uit de steekproef volgt X ≤ 399 of X ≥ 401. 2 Het bijstellen is ten onrechte, dus in werkelijkheid werkt de machine goed, d.w.z. μ is nog gewoon 400. Rond kansen af op drie decimalen!
Neem aan dat Helder een steekproef van 120 flacons neemt. Als beslissingsvoorschrift kiest hij Vulmachine bijstellen als X ⱕ 399 of X ⱖ 401. a Bereken de kans dat Helder ten onrechte tot bijstelling overgaat. b Neem aan dat de machine werkt met een gemiddelde van 399,2 ml. Bereken de kans dat de vulmachine op grond van het steekproefresultaat niet wordt bijgesteld.
Theorie B Significantieniveau
Fabrikant Helder wil op grond van een steekproef van 25 flacons een beslissing nemen over het al dan niet bijstellen van de vulmachine. Hij heeft te maken met twee veronderstellingen. 1 De inhoud van een flacon is normaal verdeeld met ⫽ 400. 2 De inhoud van een flacon is normaal verdeeld met ⫽ 400. De eerste veronderstelling heet de nulhypothese, aangegeven met H 0. We schrijven H 0 ⬊ ⫽ 400. Tegenover de nulhypothese staat de alternatieve hypothese H 1 die zegt dat het gemiddelde geen 400 is. Notatie H 1 ⬊ ⫽ 400.
H0 : μ = μ0 nulhypothese H 1 : μ ≠ μ0
alternatieve hypothese
Op grond van het steekproefresultaat X zal Helder besluiten de nulhypothese al dan niet te verwerpen. Kiest Helder het beslissingsvoorschrift Verwerp H 0 als X ⱕ 399 of X ⱖ 401 dan is de kans dat hij H 0 ten onrechte verwerpt gelijk aan P共X ⱕ 399 of X ⱖ 401兲 ⫽ 2 ⭈ P共X ⱕ 399兲 ⫽ 4 2 ⭈ normalcdf ⫺10 99, 399, 400, ⬇ 0,211. 冪25
冉
冊
䊲
86 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 6 SESS: 493 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Kiest Helder het beslissingsvoorschrift Verwerp H 0 als X ⱕ 397,5 of X ⱖ 402,5 dan is de kans dat hij H 0 ten onrechte verwerpt gelijk aan P共X ⱕ 397,5 of X ⱖ 402,5兲 ⫽ 2 ⭈ P共X ⱕ 397,5兲 ⫽ 4 2 ⭈ normalcdf ⫺10 99, 397.5, 400, ⬇ 0,002. 冪25
冉
冊
H0 ten onrechte verwerpen houdt in • H0 is waar • op grond van het beslissingsvoorschrift en het steekproefgemiddelde wordt H0 verworpen.
Door een geschikt beslissingsvoorschrift te kiezen, kun je P共H 0 ten onrechte verwerpen兲 zo klein maken als je wilt. Je loopt dan het gevaar dat het productieproces doorgaat, terwijl het gemiddelde niet meer 400 ml is. Je hebt dus met tegenstrijdige belangen te maken. Om aan beide belangen tegemoet te komen, spreekt men van te voren af wat de maximale kans mag zijn dat H 0 ten onrechte wordt verworpen. Deze maximale waarde heet het significantieniveau en wordt aangegeven met ␣. De kans dat je H 0 ten onrechte verwerpt is hoogstens het significantieniveau ␣.
De keuze van ␣ is een zaak die van externe factoren afhangt, zoals hoe schadelijk het is de nulhypothese te verwerpen. In de praktijk kiest men meestal ␣ ⫽ 0,10, ␣ ⫽ 0,05 of ␣ ⫽ 0,01. Informatief: het significantieniveau
De keuze van het significantieniveau ␣ heeft te maken met twee tegenstrijdige belangen van de fabrikant. Enerzijds wil hij dat de inhoud van een flacon niet te veel van 400 ml afwijkt, want • te weinig in een flacon kost hem klanten • te veel in een flacon kost hem geld. Anderzijds wil de fabrikant het productieproces niet te vaak stilleggen om de machine bij te stellen. Een grote waarde van ␣ betekent dat hij vaak moet bijstellen, terwijl hij bij een kleine waarde van ␣ het risico loopt flacons te produceren met een afwijkende inhoud. De praktijk heeft bewezen dat ␣ ⫽ 0,10 of ␣ ⫽ 0,05 een evenwichtige keuze is. Vóór het uitvoeren van de steekproef moet er overeenstemming zijn over de keuze van ␣. In de opgaven is steeds een waarde voor ␣ gegeven.
䊲
Het toetsen van hypothesen 87
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 7 SESS: 437 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Laten we eens aannemen dat Helder besluit ␣ ⫽ 0,10 te kiezen. De steekproefomvang is 25. Het beslissingsvoorschrift heeft de vorm Verwerp H 0 als X ⱕ g l of X ⱖ g r
μ X = 400 σ X = 4 = 0,8 25 opp = 0,10
Bij ␣ ⫽ 0,10 moet je g l en g r zo berekenen, dat P共X ⱕ g l of X ⱖ g r兲 ⫽ 0,10. Omdat de normaalkromme symmetrisch is, geldt gl gr 400 opp links ⫽ opp rechts ⫽ 12 ⭈ 0,10 ⫽ 0,05. figuur 15.2 Dus • P共X ⱕ g l兲 ⫽ 0,05, dus g l ⫽ invNorm共0.05, 400, 0.8兲 ⬇ 398,68. Uit de symmetrie volgt • P共X ⱕ g r兲 ⫽ 1 ⫺ 0,05 ⫽ 0,95 gr= 400 + (400 – 398,68). dus g r ⫽ invNorm共0.95, 400, 0.8兲 ⬇ 401,32. Na het vaststellen van het beslissingsvoorschrift laat Helder 398,68 400 de steekproef uitvoeren. Op grond van het gevonden g μ gr l steekproefgemiddelde X zal hij H 0 al dan niet verwerpen. 1,32 1,32 Vindt hij bijvoorbeeld X ⫽ 398,83 dan is er geen aanleiding H 0 te verwerpen, maar bij X ⫽ 398,63 zal H 0 verworpen worden. We zeggen dat het steekproefgemiddelde X ⫽ 398,63 significant afwijkt van ⫽ 400 ml.
4
Fabrikant Helder wil op grond van een steekproef met lengte 100 een beslissing nemen over het al dan niet verwerpen van H 0 ⬊ ⫽ 400. Hij kiest als significantieniveau ␣ ⫽ 0,01. Het beslissingsvoorschrift is: Verwerp H 0 als X ⱕ g l of X ⱖ g r . a Bereken g l en g r in twee decimalen nauwkeurig. b Het steekproefgemiddelde blijkt 400,8 ml te zijn. Welke conclusie trekt Helder?
5
Een fabrikant maakt gloeilampen van het type GL04, Afspraak waarvan de levensduur X in uren normaal verdeeld is Neem aan dat bij het nieuwe met ⫽ 1500 en ⫽ 60. De afdeling research heeft voor de fabricage van de productieprocédé de standaardlampen een goedkoper procédé ontwikkeld waarvan afwijking niet verandert. men beweert dat het de levensduur van de lampen niet Ook in de rest van dit hoofdstuk beïnvloedt. gaan we van deze aanname uit. De fabrikant twijfelt hieraan en onderzoekt dit door middel van een steekproef van 100 lampen. Als significantieniveau wordt ␣ ⫽ 0,05 gekozen. a Geef H 0 en H 1. b Het beslissingsvoorschrift is: Verwerp H 0 als X ⱕ g l of X ⱖ g r . Bereken g l en g r in één decimaal nauwkeurig. c Het steekproefgemiddelde blijkt 1492,7 te zijn. Welke conclusie trekt de fabrikant?
88 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 8 SESS: 455 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
A 6
Een autofabrikant beweert dat bij normaal rijgedrag het aantal kilometers X dat zijn banden meegaan normaal verdeeld is met X ⫽ 35000 en X ⫽ 4000. Een autotijdschrift houdt een bandentest. In een steekproef van 64 van deze banden komt als steekproefgemiddelde 33844 km tevoorschijn. We vragen ons af of je op grond van dit steekproefresultaat mag concluderen dat X significant afwijkt van 35000. Neem ␣ ⫽ 0,05. a Geef H 0 en H 1. b Het beslissingsvoorschrift is: Verwerp H 0 als X ⱕ g l of X ⱖ g r. Bereken g l en g r in gehelen nauwkeurig. c Wat is de conclusie van het autotijdschrift? De theorie kun je doornemen met de applet Overschrijdingskans. Theorie C
Normale toetsen
Bij de bandentest in opgave 6 is H 0 ⬊ ⫽ 35000, H 1 ⬊ ⫽ 35000 en ␣ ⫽ 0,05. In deze opgave is het steekproefresultaat 33844 bekend. In zo’n geval is het niet nodig eerst het beslissingsvoorschrift op te stellen. Door P共X ⱕ 33844兲 te berekenen, kun je direct zien of je H 0 al dan niet moet verwerpen. Je krijgt P共X ⱕ 33844兲 ⫽ normalcdf共⫺10 99, 33844, 35000, 500兲 ⬇ 0,010. Omdat P共X ⱕ 33844兲 ⬍ 0,025, is 33844 ⬍ g l . Het steekproefresultaat 33844 wijkt dus significant af van 35000.
μ X = 35 000 σ X = 4000 = 500 64
opp = 0,025
opp = 0,025
gl
gr
35 000
33 844
figuur 15.3
P共X ⱕ 33844兲 heet de overschrijdingskans van het steekproefresultaat X ⫽ 33844. Omdat deze overschrijdingskans kleiner is dan 0,5␣ verwerp je H 0 . De overschrijdingskans van X ⫽ 34831 is P共X ⱕ 34831兲. Omdat P共X ⱕ 34831兲 ⫽ normalcdf共⫺10 99, 34831, 35000, 500兲 ⬇ 0,368 en 0,368 ⬎ 0,5␣ geeft het steekproefresultaat X ⫽ 34831 geen aanleiding H 0 te verwerpen. Bij de steekproefuitslag X ⫽ 35682 is de overschrijdingskans P共X ⱖ 35682兲, want 35682 ⬎ 35000. Omdat P共X ⱖ 35682兲 ⫽ normalcdf共35682, 10 99, 35000, 500兲 ⬇ 0,086 en 0,086 ⬎ 0,5␣ is er bij het steekproefresultaat X ⫽ 35682 geen aanleiding H 0 te verwerpen.
μ X = 35 000 σ X = 500
35 000
gl 33 844
34 831
gr 35 682
figuur 15.4
Bij H 0 ⬊ ⫽ 0 en H 1 ⬊ ⫽ 0 is de overschrijdingskans van k • gelijk aan P共X ⱕ k兲 als k ⬍ 0 • gelijk aan P共X ⱖ k兲 als k ⬎ 0. Is de overschrijdingskans van k kleiner dan of gelijk aan 0,5␣, dan wordt H 0 verworpen.
䊲
Het toetsen van hypothesen 89
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 9 SESS: 287 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Afspraak
Is het steekproefresultaat bekend, gebruik dan de overschrijdingskans om te bepalen of H 0 al dan niet verworpen wordt. Dit gaat sneller dan het berekenen van g l en g r. Is de overschrijdingskans kleiner dan of gelijk aan 0,5␣, dan verwerp je H 0 ⬊ ⫽ 0 ten gunste van H 1 ⬊ ⫽ 0. voorbeeld
In een bedrijf is de totale tijd X in uren die per dag wordt overgewerkt normaal verdeeld met X ⫽ 9,3 en X ⫽ 2,1. Sinds kort is een systeem van flexibele werktijden ingevoerd. In een periode van 40 werkdagen bleek de gemiddelde overwerktijd 8,6 uur per dag te zijn. Onderzoek of bij een significantieniveau van 1% geconcludeerd kan worden dat het nieuwe systeem invloed heeft op de overwerktijd. Uitwerking X is de overwerktijd per dag in uren. H 0 ⬊ ⫽ 9,3, H 1 ⬊ ⫽ 9,3 en ␣ ⫽ 0,01. De overschrijdingskans van 8,6 is P共X ⱕ 8,6兲 ⫽ 2.1 normalcdf ⫺10 99, 8.6, 9.3, ⬇ 0,018. 冪40 P共X ⱕ 8,6兲 ⬎ 0,5␣, dus H 0 wordt niet verworpen. Conclusie: er is geen aanleiding te veronderstellen dat het nieuwe systeem invloed heeft op de overwerktijd.
冉
冊
Je hebt in deze paragraaf bij een gegeven significantieniveau op grond van een steekproefresultaat de hypothese H 0 al dan niet verworpen. Men zegt dat de hypothese H 0 getoetst is tegen H 1. Bij het toetsen van hypothesen wordt op grond van een steekproefresultaat de nulhypothese H 0 al dan niet verworpen. Omdat het hier gaat om het steekproefgemiddelde bij een normale verdeling, spreken we van een normale toets.
Informatief: data-snooping
In het voorbeeld op de vorige bladzijde is het misschien verleidelijk om ␣ ⫽ 0,05 te kiezen. Dan is namelijk P(X ⱕ 8,6) ⱕ 0,5␣ en zou geconcludeerd mogen worden dat het nieuwe systeem inderdaad invloed heeft op de overwerktijd bij het bedrijf. Zo’n verandering van het toetsmodel is echter niet toegestaan. Deze manier van werken wordt in de statistiek ’data-snooping’ genoemd. Bij een juiste toetsprocedure moet je vooraf afspraken maken over de hypothesen en over het significantieniveau. Je mag die afspraken niet achteraf, na het uitvoeren van de steekproef, bijstellen.
90 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 10 SESS: 456 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
7
Gegeven is een normaal verdeelde toevalsvariabele X met X ⫽ 25 en X ⫽ 3. Telkens is het steekproefgemiddelde gegeven. Onderzoek of bij het gegeven significantieniveau ␣ er aanleiding is het gemiddelde X ⫽ 25 in twijfel te trekken. a ␣ ⫽ 5%, steekproefgemiddelde ⫽ 24 en steekproefomvang ⫽ 50 b ␣ ⫽ 1%, steekproefgemiddelde ⫽ 26 en steekproefomvang ⫽ 100
8
De levensduur X in uren van een bepaald soort batterij is normaal verdeeld met X ⫽ 2000 en X ⫽ 25,5. Een steekproef van 200 batterijen levert een gemiddelde levensduur op van 1995 uur. Onderzoek of bij een significantieniveau van 5% geconcludeerd mag worden dat het steekproefgemiddelde significant afwijkt van 2000.
9
Een machine vult pakken suiker. Het gewicht X in kg van een pak suiker is normaal verdeeld met X ⫽ 1,02 en X ⫽ 0,04. De fabrikant vermoedt dat na verloop van tijd de vulmachine de neiging vertoont om pakken met een afwijkend gemiddelde te leveren. Een steekproef van 50 pakken levert een steekproefgemiddelde van 1,04 kg op. a Onderzoek of de fabrikant bij een significantieniveau van 5% zal besluiten de vulmachine opnieuw in te stellen. b Welke conclusie zal de fabrikant trekken als het steekproefgemiddelde 1,03 kg is bij een significantieniveau van 5%?
A 10 Bij de productie van tennisballen is de diameter X in cm normaal verdeeld met ⫽ 6,8 cm en ⫽ 0,2 cm. Een afnemer twijfelt of de gemiddelde diameter klopt. a Bij een steekproef van lengte 40 is het steekproefgemiddelde 6,75 cm. Bereken de overschrijdingskans van X ⫽ 6,75 en geef aan welke conclusie de afnemer trekt bij een significantieniveau ␣ ⫽ 0,10. En wat is zijn conclusie bij ␣ ⫽ 0,05? b De tennisbond wil op grond van een steekproef van lengte 100 een beslissing nemen over het al dan niet verwerpen van H 0 ⬊ ⫽ 6,8. Stel het beslissingsvoorschrift op. Neem ␣ ⫽ 0,10.
Het toetsen van hypothesen 91
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 11 SESS: 297 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
terugblik Hypothesen toetsen
Een fabrikant van tennisballen maakt ballen waarvan het gewicht X in gram normaal verdeeld is met ⫽ 58 en ⫽ 2. Er is een nieuwe productiemethode ontwikkeld die goedkoper is en die volgens de afdeling research geen invloed heeft op het gewicht van de tennisballen. Een afnemer van de tennisballen twijfelt aan deze bewering. Je hebt hier te maken met twee hypothesen: H 0 ⬊ ⫽ 58
共de nieuwe productiemethode heeft geen invloed op het gewicht兲 en
H 1 ⬊ ⫽ 58
共de nieuwe methode beïnvloedt het gewicht兲.
Bij het toetsen van hypothesen doe je op grond van een steekproefresultaat een uitspraak over het al dan niet verwerpen van H 0. Belangrijke begrippen
nulhypothese
H 0 ⬊ ⫽ 58
alternatieve hypothese
H 1 ⬊ ⫽ 58
toetsingsgrootheid
X ⫽ het steekproefgemiddelde
beslissingsvoorschrift
Verwerp H 0 als X ⱕ g l of X ⱖ g r.
significantieniveau ␣
De kans dat H 0 ten onrechte verworpen wordt is hoogstens ␣, ofwel P共X ⱕ g l of X ⱖ g r 兲 ⱕ ␣ bij X ⫽ 58.
Overschijdingskans
Op grond van een steekproefresultaat besluit je H 0 al dan niet te verwerpen. Er zijn twee situaties te onderscheiden. 1 Het steekproefresultaat is bekend. Bereken de overschrijdingskans van het steekproefgemiddelde. Is deze kans kleiner dan 0,5␣, dan verwerp je H 0.
Verwerp H0 als de overschrijdingskans van het steekproefresultaat kleiner is dan –12α.
Is gegeven dat X ⫽ 56,6, dan is de overschrijdingskans P共X ⱕ 56,6兲, want 56,6 ⬍ . Is gegeven dat X ⫽ 58,7, dan is de overschrijdingskans P共X ⱖ 58,7兲, want 58,7 ⬎ .
μ X = 58 σX = 2 n n = steekproefomvang
2 Het steekproefresultaat is niet bekend. Stel het beslissingsvoorschrift op en bereken g l en g r.
opp = –12 α gl
figuur 15.5
92 Hoofdstuk 15
opp = –12 α 58
gr
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 12 SESS: 458 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
15.2 Eenzijdig en tweezijdig toetsen O 11
Bij de fabricage van gloeilampen van het merk Flash is de levensduur X van de lampen normaal verdeeld met X ⫽ 1150 uur en X ⫽ 25 uur. Een medewerker beweert een nieuwe productiemethode ontwikkeld te hebben, waarmee de levensduur van de gloeilampen verlengd wordt. Door middel van een steekproef van 100 lampen, geproduceerd met de nieuwe methode, zal beslist worden of het nieuwe procédé inderdaad een gunstig effect heeft. a Waarom is het niet juist bij H 0 ⬊ ⫽ 1150 als alternatieve hypothese H 1 ⬊ ⫽ 1150 te nemen? b Stel dat het steekproefgemiddelde X ⫽ 1135 is. Is er aanleiding te veronderstellen dat de nieuwe productiemethode een gunstig effect heeft? Theorie A
Linkszijdige en rechtszijdige toetsen
Tot nu toe was bij het toetsen van hypothesen de alternatieve hypothese steeds van de vorm H 1 ⬊ ⫽ 0. Je verwerpt dan H 0 als X ⱕ g l of X ⱖ g r . Zo’n toets heet een tweezijdige toets. Maar de alternatieve hypothese kan ook van de vorm H 1 ⬊ ⬍ 0 of van de vorm H 1 ⬊ ⬎ 0 zijn. We spreken dan van een eenzijdige toets. Als voorbeeld bekijken we het productieproces van een bepaald type beeldscherm. De levensduur X in uren van de beeldschermen is normaal verdeeld met X ⫽ 18000 en X ⫽ 3000. De afdeling productie beweert een nieuw procédé ontwikkeld te hebben dat de levensduur van de beeldschermen verlengt, terwijl de kosten en de productietijd gelijk blijven. Op grond van een steekproef van 100 beeldschermen beslist de directie of het nieuwe procédé zal worden ingevoerd. Omdat de productieafdeling beweert dat de levensduur verlengd is, is de alternatieve hypothese H 1 ⬊ ⬎ 18000. Het beslissingsvoorschrift heeft daarom de vorm: Verwerp H 0 als X ⱖ g. Bij significantieniveau ␣ ⫽ 0,05 bereken je g zo, dat P共X ⱖ g兲 ⫽ 0,05. Opp links ⫽ 1 ⫺ 0,05 ⫽ 0,95, 3000 dus g ⫽ invNorm 0.95, 18000, ⬇ 18493,46. 冪100 Je verwerpt H 0 als X ⱖ 18494.
冉
冊
Het toetsen van H 0 ⬊ ⫽ 18000 tegen H 1 ⬊ ⬎ 18000 is een voorbeeld van een rechtszijdige toets. Het toetsen van H 0 ⬊ ⫽ 0 tegen H 1 ⬊ ⬍ 0 is een voorbeeld van een linkszijdige toets.
opp = 0,05
g
18 493 18 494
Let op met afronden! Kies je X ≥ 18 493, dan is P(X≥g) iets groter dan α en dat mag niet.
䊲
Het toetsen van hypothesen 93
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 13 SESS: 460 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
EENZIJDIGE TOETSEN Bij de linkszijdige toets H 0 ⬊ ⫽ 0 tegen H 1 ⬊ ⬍ 0 hoort het beslissingsvoorschrift Verwerp H 0 als X ⱕ g. Bij de rechtszijdige toets H 0 ⬊ ⫽ 0 tegen H 1 ⬊ ⬎ 0 hoort het beslissingsvoorschrift Verwerp H 0 als X ⱖ g.
NORMALE TOETSEN Linkszijdige toets H0 ⬊ ⫽ 0 H1 ⬊ ⬍ 0
Tweezijdige toets H0 ⬊ ⫽ 0 H1 ⬊ ⫽ 0
opp = –12 α
gl
opp = –12 μ0
gr
Beslissingsvoorschrift Verwerp H 0 als X ⱕ g l of X ⱖ g r.
Rechtszijdige toets H0 ⬊ ⫽ 0 H1 ⬊ ⬎ 0
opp = α
g
opp = α μ0
μ0
Beslissingsvoorschrift Verwerp H 0 als X ⱕ g.
Beslissingsvoorschrift Verwerp H 0 als X ⱖ g.
12 Gegeven is de normaal verdeelde toevalsvariabele X met X ⫽ 85 en X ⫽ 15. Stel het beslissingsvoorschrift op bij de volgende toetsen. Hierbij is n de steekproefomvang. a H 0 ⬊ ⫽ 85, H 1 ⬊ ⬎ 85, ␣ ⫽ 0,10 en n ⫽ 30 b H 0 ⬊ ⫽ 85, H 1 ⬊ ⬍ 85, ␣ ⫽ 0,05 en n ⫽ 50 c H 0 ⬊ ⫽ 85, H 1 ⬊ ⫽ 85, ␣ ⫽ 0,01 en n ⫽ 200 13 De afhandelingstijd in minuten van de bestellingen op de verpakkingsafdeling van een groothandel is normaal verdeeld met ⫽ 12 en ⫽ 3. De groothandel beweert dat door een interne reorganisatie de gemiddelde afhandelingstijd is teruggedrongen. a Deze bewering wordt getoetst door van 25 bestellingen de afhandelingstijd te meten. Bij welke steekproefgemiddelden is er bij een significantieniveau van 5% aanleiding te veronderstellen dat de afhandelingstijd inderdaad verminderd is? b Een steekproef van 80 bestellingen heeft een steekproefgemiddelde van 11,3 minuten. Is er bij een significantieniveau van 1% aanleiding om te concluderen dat de afhandelingstijd is afgenomen?
94 Hoofdstuk 15
g
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 14 SESS: 463 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Theorie B Overschrijdingskans
rechtszijdige toets
Weet je het steekproefresultaat, dan is het ook bij eenzijdig toetsen aan te bevelen met overschrijdingskansen te werken.
opp = α
Bij H 0 ⬊ ⫽ 25 tegen H 1 ⬊ ⬎ 25 met significantieniveau ␣ is de overschrijdingskans van het steekproefgemiddelde 26,3 gelijk aan P共X ⱖ 26,3兲. Je verwerpt H 0 als P共X ⱖ 26,3兲 ⱕ ␣.
25
g
26,3
Als P(X ≥ 26,3)≤α, verwerp je H0.
Bij H 0 ⬊ ⫽ 25 tegen H 1 ⬊ ⬍ 25 met significantieniveau ␣ is de overschrijdingskans van het steekproefgemiddelde 24,2 gelijk aan P共X ⱕ 24,2兲. Je verwerpt H 0 als P共X ⱕ 24,2兲 ⱕ ␣.
linkszijdige toets opp = α g
25
24,2
Als P(X ≤ 24,2)≤α , verwerp je H0.
OVERSCHRIJDINGSKANSEN BIJ STEEKPROEFRESULTAAT k EN SIGNIFICANTIENIVEAU ␣ LINKSZIJDIG nulhypothese H0 ⬊ ⫽ 0 alternatieve hypothese H 1 ⬊ ⬍ 0 overschrijdingskans van k
P共X ⱕ k兲
Je verwerpt H 0 als de ␣ overschrijdingskans kleiner dan of gelijk is opp ≤ α ? aan k
TWEEZIJDIG
RECHTSZIJDIG
H0 ⬊ ⫽ 0 H1 ⬊ ⫽ 0
H0 ⬊ ⫽ 0 H1 ⬊ ⬎ 0
P共X ⱕ k兲 als k ⬍ 0 P共X ⱖ k兲 als k ⬎ 0
P共X ⱖ k兲
0,5␣
␣
μ0
k
opp ≤ α ?
opp ≤ 0,5 α ?
opp ≤ 0,5 α ?
μ0
k
μ0
k
voorbeeld
Een fabrikant beweert dat de levensduur X in uren van een nieuw soort batterij normaal verdeeld is met X ⫽ 800 en X ⫽ 40. Een consumentenorganisatie beweert dat de gemiddelde levensduur minder is dan 800 uur. Een aselecte steekproef van 100 batterijen geeft een gemiddelde levensduur van 793,8 uur. Is er op grond van dit steekproefresultaat bij een significantieniveau van ␣ ⫽ 0,025 aanleiding om te twijfelen aan de bewering van de fabrikant? Uitwerking H 0 ⬊ ⫽ 800, H 1 ⬊ ⬍ 800 en ␣ ⫽ 0,025.
冉
40
冊
⬇ 0,061 ⬎ ␣ 冪100 Dus verwerp H 0 niet. Er is geen aanleiding de bewering van de fabrikant in twijfel te trekken.
P共X ⱕ 793,8兲 ⫽ normalcdf ⫺10 99, 793.8, 800,
Het toetsen van hypothesen 95
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 15 SESS: 494 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Werkschema: het toetsen van hypothesen
1 Formuleer H 0 en H 1 en vermeld het significantieniveau ␣. 2 Is het steekproefresultaat bekend? JA Bereken de overschrijdingskans en beantwoord de gestelde vraag. NEE Stel het beslissingsvoorschrift op en beantwoord de gestelde vraag. 14 Een zuivelfabrikant levert margarine in pakjes van 500 gram. Bij de productieafdeling bestaat het vermoeden dat de pakjes te veel margarine bevatten. Een steekproef van 100 pakjes levert een gemiddeld gewicht van 500,4 gram per pakje op. Is er op grond van het steekproefresultaat bij een significantieniveau van 5% reden om de productieafdeling gelijk te geven? Ga er vanuit dat het gewicht van een pakje normaal verdeeld is met een standaardafwijking van 1,5 gram. 15 Van een middeleeuwse schrijver is bekend dat hij zinnen schreef met een gemiddelde zinslengte van 28,6 woorden en een standaardafwijking van 5,9 woorden. De zinslengte is normaal verdeeld. Onlangs zijn resten van een manuscript gevonden waarvan vermoed wordt dat het door deze auteur geschreven is. Onderzoek wees uit dat bij 75 zinnen de gemiddelde zinslengte 30,2 woorden is. Kun je bij een significantieniveau van 1% stellen dat het pas ontdekte manuscript van deze auteur afkomstig kan zijn? 16 Lees het volgende krantenartikel.
Het IQ Volgens de Duitse filosoof William Stern (1871-1938) is intelligentie de begaafdheid tot aanpassing door denkmiddelen van de reacties der persoonlijkheid op nieuwe en onverwachte situaties in de buitenwereld. Door middel van intelligentietests wordt de intelligentie gemeten en uitgedrukt in het intelligentiequotiënt IQ. De tests worden zo ontworpen, dat een normale verdeling ontstaat met = 100 en = 15.
Het IQ van de Nederlander is normaal verdeeld met μ ⫽ 100 en ⫽ 15. Tijdens een interview met het plaatselijke dagblad vertelt de voorzitter van schaakvereniging ASC dat het gemiddelde IQ van de 25 competitiespelende leden maar liefst 108 is. Volgens hem toont dit gemiddelde aan dat schakers intelligenter zijn dan gemiddeld. Kun je met een significantieniveau van 2,5% zeggen dat de voorzitter gelijk heeft?
96 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 16 SESS: 470 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
A 17 Een medicijn is verkrijgbaar in tabletvorm. Het werkzame aandeel X in een tablet is normaal verdeeld met een gemiddelde van 4 mg en een standaardafwijking van 0,12 mg. Het medicijn helpt als het werkzame aandeel per tablet tussen 3,8 mg en 4,2 mg ligt. a Bereken de kans dat een tablet helpt. b Er vinden regelmatig controles plaats om te kijken of de gemiddelde hoeveelheid werkzame stof inderdaad gemiddeld 4 mg is. Een steekproef van 50 tabletten levert een gemiddelde op van 3,95 mg werkzame stof. Toets of hieruit volgt dat dit gemiddelde significant afwijkt van 4 mg. Neem ␣ ⫽ 0,05. c Stel dat er gemiddeld 3,95 mg werkzame stof in een tablet zit. Hoeveel procent van de tabletten helpt dan niet? 18 Ga uit van een steekproef uit een normale verdeling met ⫽ 8. We toetsen H 0 ⬊ ⫽ 40 tegen H 1 ⬊ ⬎ 40. a Stel dat we een steekproef gebruiken van 25 exemplaren. Bij welke steekproefgemiddelden verwerpen we H 0 bij ␣ ⫽ 0,05? Rond af op één decimaal. b Hoe groot moet de steekproef zijn, opdat het steekproefgemiddelde 40,5 bij een significantieniveau van 5% aanleiding geeft H 0 te verwerpen? A 19 Zijn basketballers langer dan gemiddeld? De lengte van de Nederlandse man is normaal verdeeld met een gemiddelde van 183 cm en een standaardafwijking van 7 cm. De gemiddelde lengte van de 133 spelers in de hoogste afdeling van de Nederlandse basketbalbond is 1,97 meter. Kun je bij een significantieniveau van 1% zeggen dat basketballers inderdaad langer zijn dan gemiddeld? O 20 Een kabelfabrikant beweert dat zijn remkabels voor toerfietsen gemiddeld minstens een trekkracht van 800 newton kunnen weerstaan. De redactie van een fietstijdschrift vindt dit gemiddelde te optimistisch. Een aselect gekozen steekproef van 25 kabels levert een gemiddelde trekkracht op van 785 newton. Ga er vanuit dat de trekkracht normaal verdeeld is met ⫽ 35 newton. a Onderzoek of er bij een significantieniveau van 5% voldoende aanleiding is de bewering van de fabrikant in twijfel te trekken. Gebruik de opmerking hieronder bij het formuleren van H 0. Opmerking Een eerste gedachte is wellicht om H 0 ⬊ ⱖ 800 共minstens 800 newton兲 en H 1 ⬊ ⬍ 800 te kiezen. Beide hypothesen zijn dan samengesteld en daar is niet mee te werken. De nulhypothese moet altijd van de vorm ⫽ 0 zijn. Je kiest daarbij de voor de fabrikant meest gunstige 0, hier dus H 0 ⬊ ⫽ 800. b Licht toe dat ⫽ 800 voor de fabrikant gunstiger is dan een μ-waarde groter dan 800.
Het toetsen van hypothesen 97
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 17 SESS: 442 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Theorie C Enkelvoudige hypothese
Niet altijd is duidelijk welke hypothese H 0 en welke H 1 is. De volgende opmerkingen kunnen je helpen de juiste keuze te maken. 1 H 0 is de hypothese die als uitgangspunt dient en die door middel van de alternatieve hypothese in twijfel wordt getrokken. 2 H 0 dient een enkelvoudige hypothese te zijn, dus H 0 heeft de vorm H 0 ⬊ ⫽ 0. Beweert een fabrikant dat de houdbaarheid van zijn producten minstens acht dagen is en trekt een consumentenorganisatie dat in twijfel, dan kies je H 0 ⬊ ⫽ 8 en H 1 ⬊ ⬍ 8. Bij H 0 hoort immers de bewering die in twijfel wordt getrokken. Je kiest niet H 0 ⬊ ⱖ 8, want de nulhypothese moet enkelvoudig zijn. Je kiest de voor de fabrikant meest gunstige situatie.
A 21 Volgens Hans kijkt de Nederlander gemiddeld minstens 28,4 uur per week naar de tv. Een medewerker van reclamebureau ’De Ster’ trekt deze bewering in twijfel. Een aselecte steekproef van 30 personen levert het gemiddelde 27,6 uur op. Onderzoek of je het bij een significantieniveau van 2,5% eens kunt zijn met de uitspraak van de medewerker van ’De Ster’. Ga er vanuit dat de tijd die een Nederlander per week naar de tv kijkt normaal verdeeld is met ⫽ 2,4 uur. A 22 In een koffiebranderij worden pakken gevuld met koffiebonen. Het gewicht X in gram van de bonen in een pak is normaal verdeeld met een standaardafwijking van 4 gram. De fabrikant beweert dat de vulmachine zo is ingesteld, dat een pak gemiddeld 500 gram bevat. a Een consumentenorganisatie zegt dat de pakken gemiddeld minder dan 500 gram koffiebonen bevatten. Hoeveel moet het gemiddelde gewicht van de koffiebonen per pak in een steekproef van lengte 50 zijn om de consumentenorganisatie bij een significantieniveau van 5% in het gelijk te stellen? Rond af op één decimaal. b Het hoofd van de afdeling voorraad beweert dat het gewicht van de koffiebonen in een pak meer dan 500 gram is. Een steekproef van 25 pakken koffie levert het steekproefgemiddelde X ⫽ 501,94 op. Is er bij een significantieniveau van 2,5% aanleiding het hoofd van de afdeling voorraad gelijk te geven? c De afdeling controle beweert dat ten gevolge van een defect aan de vulmachine het gewicht van de bonen in een pak niet 500 gram is. Bij een steekproef van 25 pakken is het gemiddelde gewicht per pak gelijk aan 502,48 gram. Wijkt dit steekproefresultaat significant af van 500 gram? Neem ␣ ⫽ 0,05. 98 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 18 SESS: 442 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
terugblik Eenzijdige en tweezijdige toetsen
Linkszijdige toets:
H 0 ⬊ ⫽ 0 tegen H 1 ⬊ ⬍ 0 Verwerp H 0 als X ⱕ g met g zo, dat P共X ⱕ g兲 ⫽ ␣.
Rechtszijdige toets
H 0 ⬊ ⫽ 0 tegen H 1 ⬊ ⬎ 0 Verwerp H 0 als X ⱖ g met g zo, dat P共X ⱖ g兲 ⫽ ␣.
Tweezijdige toets
H 0 ⬊ ⫽ 0 tegen H 1 ⬊ ⫽ 0 Verwerp H 0 als X ⱕ g l of X ⱖ g r met g l zo, dat P共X ⱕ g l兲 ⫽ 0,5␣ en g r zo, dat P共X ⱖ g r兲 ⫽ 0,5␣.
Overschrijdingskans van het steekproefgemiddelde
Bij H 0 ⬊ ⫽ 25 en • H 1 ⬊ ⬍ 25 is de overschrijdingskans van 23 gelijk aan P共X ⱕ 23兲 • H 1 ⬊ ⬎ 25 is de overschrijdingskans van 28 gelijk aan P共X ⱖ 28兲 • H 1 ⬊ ⫽ 25 is de overschrijdingskans van 28 gelijk aan P共X ⱖ 28兲 en is de overschrijdingskans van 23 gelijk aan P共X ⱕ 23兲. Je verwerpt H 0 als
• de overschrijdingskans kleiner is dan of gelijk is aan ␣ 共bij eenzijdig toetsen兲 • de overschrijdingskans kleiner is dan of gelijk is aan 0,5␣ 共bij tweezijdig toetsen兲.
Toetsen van hypothesen
Volg bij het toetsen van hypothesen de volgende stappen. 1 Formuleer H 0 en H 1 en vermeld het significantieniveau ␣. 2 Bereken de overschrijdingskans als het steekproefresultaat bekend is. Stel anders het beslissingsvoorschrift op. 3 Beantwoord de gestelde vraag. Bedenk dat H 0 de hypothese is die in twijfel wordt getrokken. Kies H 0 altijd enkelvoudig, dus H 0 ⬊ ⫽ 0.
Het toetsen van hypothesen 99
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 19 SESS: 472 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
15.3 Binomiale toetsen
BINOMIAAL KANSEXPERIMENT
• het herhaald uitvoeren van O 23 Frisdrankfabrikant Mol beweert in een advertentie een kansexperiment waarbij dat 40% van de Nederlanders zijn nieuwe frisdrank je alleen let op de gebeurtede lekkerste frisdrank vindt. Concurrent Franck nissen succes en mislukking vecht dit aan bij de reclamecodecommissie. is het aantal keer dat het • n Volgens hem is dit percentage lager. experiment wordt uitgevoerd De reclamecodecommissie besluit een steekproef van 100 personen te nemen en op grond van het • p is de kans op succes per keer steekproefresultaat zal Mol de advertentie al dan • X is het aantal keer succes niet moeten herzien. • P(X = k) = binompdf (n, p, k) De toetsingsgrootheid X is het aantal personen in de • P(X ≤ k) = binomcdf (n, p, k) steekproef dat de frisdrank van fabrikant Mol de lekkerste vindt. a Is X een discrete of een continue toevalsvariabele? Licht toe. b Licht toe dat X een binomiaal verdeelde toevalsvariabele is. c Neem aan dat X ⫽ 48. Zal Mol de advertentie moeten herzien? d Neem aan X ⫽ 28. Welke partij krijgt dan volgens jou gelijk? Theorie A Eenzijdige binomiale toets
In opgave 23 moet op grond van een steekproefresultaat beslist worden of de firma Mol al dan niet gelijk krijgt. In de steekproef wordt het aantal personen X geteld dat de frisdrank van Mol het lekkerst vindt. De toetsingsgrootheid X is een binomiaal verdeelde toevalsvariabele. Indien Mol gelijk heeft is p ⫽ 0,4, dus de nulhypothese is H 0 ⬊ p ⫽ 0,4. De alternatieve hypothese is H 1 ⬊ p ⬍ 0,4. Neem als significantieniveau ␣ ⫽ 0,05. H 0 wordt verworpen als het aantal personen in de steekproef dat de frisdrank van Mol de lekkerste vindt, klein is. Dus het beslissingsvoorschrift heeft de vorm Verwerp H 0 als X ⱕ g. Hierbij is g het grootste gehele getal dat bij n ⫽ 100 en p ⫽ 0,4 voldoet aan P共X ⱕ g兲 ⱕ 0,05. Neem aan dat uit de steekproef volgt dat 28 personen het met Mol eens zijn. Door de overschrijdingskans van 28 te berekenen, kom je er eenvoudig achter of H 0 al dan niet verworpen dient te worden. De overschrijdingskans van 28 is P共X ⱕ 28兲 ⫽ binomcdf共100, 0.4, 28兲 ⬇ 0,008. Omdat P共X ⱕ 28兲 ⱕ ␣ weet je dat 28 ⱕ g, dus je verwerpt H 0. Mol zal de advertentie moeten herzien. Je hebt hier een voorbeeld van een binomiale toets. Bij een binomiale toets is de toetsingsgrootheid X een binomiaal verdeelde toevalsvariabele.
kans 0,08
0,06
0,04
0,02
0
20
30
40
50
60
x
figuur 15.6 Het kanshistogram bij de binomiale verdeling met n = 100 en p = 0,4. 䊲
100 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 20 SESS: 473 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Bij een binomiale toets heeft de nulhypothese de vorm H 0 ⬊ p ⫽ p 0. Bij een linkszijdige toets is H 1 ⬊ p ⬍ p 0 en bij een rechtszijdige toets is H 1 ⬊ p ⬎ p 0. BINOMIALE TOETS De toetsingsgrootheid X telt hoeveel elementen in de steekproef een bepaald kenmerk hebben. X is binomiaal verdeeld, waarbij n de steekproefomvang is. H 0 ⬊ p ⫽ p 0 en H 1 ⬊ p ⬍ p 0 Linkszijdig: De overschrijdingskans van k is P共X ⱕ k兲. Verwerp H 0 als P共X ⱕ k兲 ⱕ ␣. Rechtszijdig: H 0 ⬊ p ⫽ p 0 en H 1 ⬊ p ⬎ p 0 De overschrijdingskans van k is P共X ⱖ k兲. Verwerp H 0 als P共X ⱖ k兲 ⱕ ␣.
Het voorbeeld kun je ook doornemen met de applet Eenzijdige binomiale toets. voorbeeld
Een bandenfabrikant beweert dat hoogstens 10% van zijn banden minder dan 40000 km meegaat. Een consumentenorganisatie vermoedt dat dit percentage hoger is. Er wordt besloten tot een steekproef van 50 autobanden. Hiervan blijken er twaalf minder dan 40000 km mee te gaan. Is er aanleiding om de bewering van de fabrikant in twijfel te trekken? Neem ␣ ⫽ 0,05. Aanpak • H 0 is de bewering van de fabrikant, want die wordt aangevochten.
Omdat H 0 enkelvoudig moet zijn, neem je niet H 0 ⬊ p ⱕ 0,1, maar H 0 ⬊ p ⫽ 0,1. • Het steekproefresultaat is bekend, dus gebruik een overschrijdingskans. • Ga op soortgelijke wijze te werk als in het werkschema op bladzijde 96. X is discreet, dus Uitwerking X ⫽ het aantal banden dat minder dan 40000 km meegaat. P(X ≥ 12) = 1 – P(X ≤ 11). H 0 ⬊ p ⫽ 0,1, H 1 ⬊ p ⬎ 0,1 en ␣ ⫽ 0,05. De overschrijdingskans van 12 is P共X ⱖ 12兲 ⫽ 1 ⫺ P共X ⱕ 11兲 ⫽ 1 ⫺ binomcdf共50, 0.1, 11兲 ⬇ 0,003. P共X ⱖ 12兲 ⱕ ␣, dus verwerp H 0. Er is inderdaad aanleiding om de bewering van de fabrikant in twijfel te trekken.
24 In een krant staat dat 35% van de Nederlanders in één keer slaagt voor het rijexamen. De eigenaar van een rijschool beweert dat bij zijn rijschool dit percentage hoger ligt. Bij een aselecte groep van 40 klanten van deze rijschool slagen er 19 in één keer voor het rijexamen. a Bereken de overschrijdingskans van 19. b Is er aanleiding de bewering van de rijschoolhouder in twijfel te trekken bij ␣ ⫽ 0,05?
Het toetsen van hypothesen 101
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 21 SESS: 344 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
25 In de westerse wereld lijdt 8% van de mannen aan een vorm van kleurenblindheid. De bioloog mevrouw drs. E.D. Bouman beweert dat dit percentage onder Aziatische mannen hoger ligt. Een onderzoek onder 200 Aziatische mannen wijst uit dat er 22 aan een vorm van kleurenblindheid lijden. Is er aanleiding om mevrouw Bouman gelijk te geven? Neem ␣ ⫽ 0,05. Informatief: kleurenblindheid Het is een misvatting te denken dat kleurenblinde mensen de wereld geheel zwart/wit zien. De meeste kleurenblinde mensen zien wel kleuren, maar kunnen geen onderscheid maken tussen weinig contrasterende kleuren zoals groen en rood. Slechts 1 op de 30 000 mensen is echt kleurenblind. Een bijzondere situatie doet zich voor op het eiland Pingelap in de Stille Oceaan ten noorden van Australië. Omstreeks 1775 werd Pingelap getroffen door een verwoestende tyfoon. Slechts 20 mensen overleefden de catastrofe, waaronder een echt kleurenblinde man. Van de huidige 3000 inwoners van Pingelap heeft zo’n 10% de kleurenblindheid geërfd van deze man. Over het eiland Pingelap kun je meer lezen in het boek ⬙Het eiland der kleurenblinden⬙ van Oliver Sacks.
26 In de westerse wereld heeft 30% van de bevolking last van een vorm van allergie. Amerikaanse onderzoekers beweren dat dit percentage lager ligt bij mensen die op jonge leeftijd regelmatig met honden en katten in contact zijn gekomen. Door de ontwikkeling van het immuunsysteem zijn ze op latere leeftijd dan minder vatbaar voor allergieën. De onderzoekers hebben 474 kinderen gevolgd die dagelijks met minstens twee honden of katten in contact kwamen. Het bleek dat 112 van hen later met een allergie te kampen kregen. Is er bij een significantieniveau van 2,5% voldoende aanleiding de Amerikaanse onderzoekers gelijk te geven? Informatief: de hygiënehypothese De hygiënehypothese stelt dat het nog steeds toenemende aantal allergieën in de westerse wereld een gevolg is van de schonere leefwijze. Door een beetje ’viezer’ te leven, zijn allergieën te voorkomen. Voorstanders van de hypothese wijzen op plattelandskinderen die meer weerstand hebben dan stadskinderen. Ook zijn er onderzoeken waaruit blijkt dat kinderen die naar een crèche gaan minder last van allergieën hebben. En omstreeks 1980 waren er in OostDuitsland ondanks een enorme luchtvervuiling veel minder allergiegevallen dan in West-Duitsland. Toch zijn er veel wetenschappers die de hypothese in twijfel trekken. Volgens professor Nanni uit Maastricht heeft het geen zin een kind op een vieze vloer te laten rondkruipen.
102 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 22 SESS: 499 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
27 Een televisierecensent beweert dat minstens 70% van alle tv-kijkers zich stoort aan reclameblokken tijdens een film. Een aselecte steekproef wijst uit dat 320 van 500 ondervraagden zich inderdaad aan zulke blokken stoort. Is er op grond van dit steekproefresultaat voldoende reden aanwezig om de mening van de recensent in twijfel te trekken? Neem ␣ ⫽ 0,025.
Vanwege het uitgelopen reclameblok kunnen we het einde van de film helaas niet meer uitzenden!
A 28 Mirjam speelt een spel met een dobbelsteen. Volgens haar krijg je te weinig keer zes ogen. Bij het 80 keer gooien met de dobbelsteen krijgt ze maar liefst 72 keer geen zes. Is er bij een significantieniveau van 5% voldoende aanleiding om het met Mirjam eens te zijn? A 29 Simon beweert dat bij het draaien van de schijf in figuur 15.7 de wijzer te vaak op rood komt. Bij het 160 keer draaien van de schijf komt de wijzer maar liefst 52 keer op rood. Is dat voldoende reden om Simon bij een significantieniveau van 1% gelijk te geven?
figuur 15.7
Theorie B Beslissingsvoorschrift bij binomiale toets
Bij een binomiale toets is H 0 ⬊ p ⫽ 0,42, H 1 ⬊ p ⬎ 0,42 en ␣ ⫽ 0,05. Door middel van een steekproef van lengte 100 wordt beslist of H 0 al dan niet verworpen wordt. In het geval de steekproefuitslag niet bekend is, moet je berekenen voor welke steekproefresultaten H 0 verworpen wordt. Het beslissingsvoorschrift heeft de vorm Verwerp H 0 als X ⱖ g. De vraag is dus Wat is het kleinste gehele getal g waarvoor geldt P共X ⱖ g兲 ⱕ 0,05? ofwel Wat is het kleinste gehele getal g zo, dat 1 ⫺ P共X ⱕ g ⫺ 1兲 ⱕ 0,05? TI
Casio
1 ⫺ binomcdf共100, 0.42, g ⫺ 1兲 ⱕ 0,05 1 ⫺ P共X ⱕ g ⫺ 1兲 ⱕ 0,05, ofwel P共X ⱕ g ⫺ 1兲 ⱖ 0,95 Voer in binomcdf共100, 0.42, g ⫺ 1兲 ⱖ 0,95 y 1 ⫽ 1 ⫺ binomcdf共100, 0.42, x ⫺ 1兲. Proberen geeft Maak een tabel en lees af • P共X ⱕ 49兲 ⬇ 0,935 • voor x ⫽ 50 krijg je y 1 ⬇ 0,065 • P共X ⱕ 50兲 ⬇ 0,957. • voor x ⫽ 51 krijg je y 1 ⬇ 0,043. Dus g ⫺ 1 ⫽ 50, ofwel g ⫽ 51. Dus verwerp H 0 als X ⱖ 51. Dus verwerp H 0 als X ⱖ 51. 䊲
Het toetsen van hypothesen 103
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 23 SESS: 476 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Het voorbeeld kun je ook doornemen met de applet Beslissingsvoorschrift bij binomiale toets. voorbeeld
Een woordvoerder van de NS beweert dat minstens 90% van de treinen op het traject Utrecht - Arnhem op tijd rijdt. Organisatie Rover vermoedt dat dit percentage lager is. Er wordt besloten van 150 treinen na te gaan of ze op tijd rijden. Hoeveel van deze treinen moeten op tijd rijden om de bewering van de NS bij een significantieniveau van 1% te verwerpen? Uitwerking X ⫽ het aantal treinen dat op tijd rijdt. H 0 ⬊ p ⫽ 0,9, H 1 ⬊ p ⬍ 0,9 en ␣ ⫽ 0,01. Verwerp H 0 als X ⱕ g. Zoek het grootste gehele getal g zo, dat P共X ⱕ g兲 ⱕ 0,01, ofwel binomcdf共150, 0.9, g兲 ⱕ 0,01.
90% van 150 is 135, dus onder H0 zal het aantal treinen dat op tijd rijdt niet te ver onder 135 liggen.
TI Casio Voer in y 1 ⫽ binomcdf共150, 0.9, x兲. Uit de tabel volgt Proberen geeft x ⫽ 125 geeft y 1 ⬇ 0,00765 P共X ⱕ 125兲 ⬇ 0,00765 x ⫽ 126 geeft y 1 ⬇ 0,01431. P共X ⱕ 126兲 ⬇ 0,01431. Verwerp H 0 als X ⱕ 125. Verwerp H 0 als X ⱕ 125. De bewering van de NS wordt verworpen als er 125 of minder treinen op tijd rijden.
30 De fabrikant van het geneesmiddel Pharmeaplus beweert dat dit middel in minstens 80% van de gevallen doeltreffend werkt. Een arts vindt dit percentage te optimistisch en daarom wordt van 500 patiënten die het middel hebben gebruikt het ziekteverloop nagegaan. Wat is bij een significantieniveau van 5% het kleinste aantal patiënten waarbij het middel Pharmeaplus een positieve uitwerking had, wil de bewering van de fabrikant niet verworpen worden? A 31 Volgens een tennisliefhebber wint een speler die in een set met serveren begint in minstens 55% van de gevallen de set. Commentator Jacco vindt dit percentage te optimistisch en daarom onderzoekt hij 500 gespeelde sets op Wimbledon. a Neem aan dat Jacco op grond van zijn steekproef gelijk krijgt. Wat weet je van het aantal sets waarbij de speler die begint met serveren de set wint? Neem ␣ ⫽ 0,05. b Het werkelijke aantal blijkt 242 te zijn. Wat is je conclusie? De kans dat een serveerder de game wint, is voor op Wimbledon gespeelde partijen 81,5%. Volgens Jacco geven nieuwe ballen bij het serveren extra voordeel. Door middel van een steekproef van 300 met nieuwe ballen gespeelde games op Wimbledon wordt onderzocht of Jacco gelijk heeft. c Hoeveel van die games moet de serveerder winnen om bij een significantieniveau van 2,5% Jacco gelijk te geven? 104 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 24 SESS: 361 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Informatief: tennis Tennis is een spel dat al bekend was bij de Grieken en de Romeinen. Met de ontwikkeling van de rubberen bal begon omstreeks 1870 het moderne tennis. Het eerste toernooi op Wimbledon vond plaats in 1877. Mede door de televisie is tennis een sport geworden die over de gehele wereld gespeeld en bekeken wordt. Van veel partijen is het spelverloop bekend en op grond van deze gegevens zijn heel wat hypothesen over tennis te toetsen, zoals ⬙Is het een voordeel om een set te beginnen met serveren?⬙ en ⬙Geven nieuwe ballen voordeel bij het serveren?⬙.
Theorie C Tweezijdige binomiale toets
In een krantenartikel is te lezen dat 38% van de Nederlandse huishoudens een breedbeeld tv bezit. Om deze bewering te toetsen wordt aselect een steekproef van 120 Nederlandse huishoudens genomen. We vragen ons af bij welke aantallen huishoudens met breedbeeld tv het percentage van 38% in twijfel wordt getrokken. We nemen ␣ ⫽ 0,05. De toetsingsgrootheid X is het aantal huishoudens in de steekproef dat een breedbeeld tv bezit. De nulhypothese is H 0 ⬊ p ⫽ 0,38. Het percentage 38% wordt in twijfel getrokken, dus H 1 ⬊ p ⫽ 0,38. Je hebt te maken met een tweezijdige binomiale toets. Onder H 0 is X binomiaal verdeeld met n ⫽ 120 en p ⫽ 0,38. Het beslissingsvoorschrift heeft de vorm Verwerp H 0 als X ⱕ g l of X ⱖ g r . Bereken g l en g r zo, dat P共X ⱕ g l of X ⱖ g r兲 ⱕ 0,05. We kiezen g l en g r zo, dat P共X ⱕ g l兲 ⱕ 0,025 én P共X ⱖ g r兲 ⱕ 0,025.
Je krijgt binomcdf共120, 0.38, 34兲 ⬇ 0,017 binomcdf共120, 0.38, 35兲 ⬇ 0,027.
P共X ⱖ g r兲 ⱕ 0,025 1 ⫺ P共X ⱕ g r ⫺ 1兲 ⱕ 0,025 1 ⫺ binomcdf共120, 0.38, g r⫺1兲 ⱕ 0,025 Je krijgt 1 ⫺ binomcdf共120, 0.38, 55兲 ⬇ 0,032 1 ⫺ binomcdf共120, 0.38, 56兲 ⬇ 0,021.
Conclusie g l ⫽ 34.
Conclusie g r ⫺ 1 ⫽ 56, dus g r ⫽ 57.
P共X ⱕ g l兲 ⱕ 0,025 binomcdf共120, 0.38, g l兲 ⱕ 0,025
Het percentage 38% wordt bij ␣ ⫽ 0,05 in twijfel getrokken als het aantal huishoudens in de steekproef met een breedbeeld tv kleiner dan of gelijk is aan 34 of groter dan of gelijk aan 57. 䊲
Het toetsen van hypothesen 105
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 25 SESS: 477 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
TWEEZIJDIGE BINOMIALE TOETS Bij H 0 ⬊ p ⫽ p 0 tegen H 1 ⬊ p ⫽ p 0 verwerp je H 0 als X ⱕ g l of X ⱖ g r. Kies g l en g r zo, dat P共X ⱕ g l兲 ⱕ 0,5␣ en P共X ⱖ g r兲 ⱕ 0,5␣.
Is het steekproefresultaat k bekend, dan heeft ook bij tweezijdige binomiale toetsen de overschrijdingskans de voorkeur. Van te voren moet je bedenken of je P共X ⱕ k兲 of P共X ⱖ k兲 moet berekenen. Bekijk de volgende situaties.
Overschrijdingskans van k bij tweezijdige binomiale toetsen H 0 ⬊ p ⫽ 0,6, H 1 ⬊ p ⫽ 0,6
冧 冧
De overschrijdingskans van 42 is P共X ⱖ 42兲, steekproefomvang n ⫽ 60 want 0,6 ⫻ 60 ⫽ 36 en 42 ⬎ 36. steekproefresultaat k ⫽ 42 H 0 ⬊ p ⫽ 0,6, H 1 ⬊ p ⫽ 0,6 De overschrijdingskans van 42 is P共X ⱕ 42兲, steekproefomvang n ⫽ 80 want 0,6 ⫻ 80 ⫽ 48 en 42 ⬍ 48. steekproefresultaat k ⫽ 42 Verwerp H 0 als de overschrijdingskans van k kleiner dan of gelijk is aan 0,5␣. Het voorbeeld kun je ook doornemen met de applet Overschrijdingskans bij binomiale toets. voorbeeld
Een nutsbedrijf beweert dat 30% van de particuliere gasafnemers de energiebespaarwijzer invult. Bij een aselecte steekproef onder 400 afnemers blijken er 262 de bespaarwijzer niet in te vullen. Is er bij een significantieniveau van 5% aanleiding om de bewering van het nutsbedrijf in twijfel te trekken? Uitwerking X ⫽ het aantal afnemers dat de bespaarwijzer invult. H 0 ⬊ p ⫽ 0,3, H 1 ⬊ p ⫽ 0,3 en ␣ ⫽ 0,05. Het steekproefresultaat is 400 ⫺ 262 ⫽ 138. De overschrijdingskans van 138 is P共X ⱖ 138兲 ⫽ 1 ⫺ P共X ⱕ 137兲 ⫽ 1 ⫺ binomcdf共400, 0.3, 137兲 ⬇ 0,029. P共X ⱖ 138兲 ⬎ 0,5␣, dus verwerp H 0 niet. Er is geen aanleiding de bewering van het nutsbedrijf in twijfel te trekken.
32 Judith toetst de zuiverheid van een geldstuk door het geldstuk 100 keer op te gooien. a Waarom is dit een tweezijdige toets? b Tot welke conclusie komt ze omtrent de zuiverheid bij ␣ ⫽ 0,05 als er 59 keer kop boven komt? 33 Martin toetst de zuiverheid van een dobbelsteen. Hij neemt ␣ ⫽ 0,05. Tot welke conclusie komt hij als hij bij 150 worpen 12 zessen telt?
106 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 26 SESS: 478 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
34 Bij het toetsen van H 0 ⬊ p ⫽ 0,3 tegen H 1 ⬊ p ⫽ 0,3 door middel van een steekproef van lengte 50 is de toetsingsgrootheid X een binomiaal verdeelde toevalsvariabele. Bij welke steekproefresultaten zal bij een significantieniveau van 10% de nulhypothese verworpen worden? 35 Omstreeks het jaar 2000 waren er in Nederland onregelmatigheden bij de aanbesteding van overheidsprojecten. Aannemers verdeelden onder elkaar de opdrachten, waardoor ze hogere prijzen konden vragen. In een landelijk ochtendblad was te lezen dat in 12% van de dossiers bouwfraude voorkwam. Volgens de directeur van een bouwbedrijf is dit percentage lager. Bij een steekproef van 80 dossiers blijkt in acht gevallen sprake van fraude te zijn geweest. Wijst de steekproefuitslag significant af van de mededeling in het ochtendblad? Neem ␣ ⫽ 0,05. A 36 Volgens de kappersbond gaat 68% van de Nederlandse mannen minstens één keer per twee maanden naar de kapper. Kapper Beerlage twijfelt aan dit percentage. Bij een aselecte steekproef onder 60 mannen blijken er 14 minder dan één keer per twee maanden naar de kapper te gaan. Is er bij een significantieniveau van ␣ ⫽ 0,10 voldoende aanleiding om Beerlage gelijk te geven? A 37 In een krantenartikel is te lezen dat 68% van de Nederlanders het een goed idee vindt veroordeelden van lichte delicten thuis hun straf te laten uitzitten met behulp van een zender die aan de voet wordt bevestigd. Woordvoerder Wolfsen van een politieke partij zegt dat dit percentage lager is. In een aselecte steekproef van 66 Nederlanders blijken 38 personen het thuis uitzitten van de straf een goed idee te vinden. Is er bij een significantieniveau van 5% voldoende aanleiding woordvoerder Wolfsen gelijk te geven? A 38 De rouletteschijf in figuur 15.8 is verdeeld in vijf even grote sectoren. Bij een controle wordt nagegaan of de roulette zuiver is. a Men draait de roulette 500 keer en telt hoe vaak het balletje op de sector met het cijfer 1 blijft liggen. Dit blijkt 115 keer te zijn. Is er bij een significantieniveau van 1% aanleiding te vermoeden dat de roulette niet zuiver is? b Men draait de roulette 600 keer en telt hoe vaak het balletje op de sectoren met de figuur 15.8 cijfers 4 en 5 blijft liggen. Bij welke aantallen zal de zuiverheid van de roulette niet in twijfel worden getrokken? Neem ␣ ⫽ 0,01. c Volgens Erik komt het balletje niet vaak genoeg op een sector met een even getal. Bij het 300 keer draaien gebeurt dit slechts 110 keer. Is er bij ␣ ⫽ 0,025 voldoende reden om het met Erik eens te zijn?
Het toetsen van hypothesen 107
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 27 SESS: 213 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
A 39 Het ministerie van milieu veronderstelt dat minstens de helft van de woningen dubbele beglazing heeft. Bij een aselecte steekproef onder 2375 woningen blijken er 1141 dubbele beglazing te hebben. Ga na of de uitslag van de steekproef bij een significantieniveau van 2,5% voldoende reden vormt om de veronderstelling van het ministerie te herzien. A 40 Een fabrikant beweert dat minstens 80% van de bespaarlampen een levensuur van meer dan 8000 uur heeft. Een steekproef levert de volgende aantallen branduren op. 7831 8521 8471 9321 6827 5277 8711 9216 5317 9997 5317 9612 8306 8711 8836 7189 7723 9111 9991 9920 8618 8817 8171 8356 7881 9158 8377 7583 9313 8271 Ga na of deze steekproef voldoende aanleiding geeft om de fabrikant in het gelijk te stellen bij een significantieniveau van 10%. A 41 De diameter van de tomaten van tomatenexporteur Driessen is normaal verdeeld met ⫽ 7,9 cm en ⫽ 0,5 cm. De tomaten met een diameter minder dan 7,2 cm zijn niet geschikt voor de export. Deze worden doorgedraaid. a Toon aan dat de kans dat een tomaat van Driessen wordt doorgedraaid gelijk is aan 0,081. De heer Van Eijk, fabrikant van het middel S3Fb beweert dat door bespuiting van de tomatenplanten met zijn middel de diameter toeneemt. Van 900 met het middel S3Fb bespoten tomaten wordt de diameter gemeten. Van deze tomaten blijken er na meting 65 te moeten worden doorgedraaid. b Is met een significantieniveau van 1% aangetoond dat het middel S3Fb de diameter inderdaad vergroot? A 42 In Nederland wegen baby’s bij de geboorte gemiddeld 3250 gram. Het geboortegewicht is normaal verdeeld met een standaardafwijking van 425 gram. Op consultatiebureaus rekent men baby’s met een geboortegewicht van meer dan 4000 gram tot de categorie ’zwaar’. a Bereken de kans dat van 80 pasgeboren baby’s er minstens vijf tot de categorie ’zwaar’ behoren. Medewerkers van het consultatiebureau in Appelscha beweren dat in hun omgeving het aantal zware baby’s boven het landelijk gemiddelde ligt, want van de laatste 58 borelingen behoorden er maar liefst acht tot de categorie ’zwaar’. b Onderzoek of bij een significantieniveau van 1% de medewerkers van het consultatiebureau gelijk hebben.
108 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 28 SESS: 480 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
terugblik Binomiale toets
Bij een binomiale toets heeft de nulhypothese de vorm H 0 ⬊ p ⫽ p 0 . Is de toets linkszijdig, dan is H 1 ⬊ p ⬍ p 0. Is de toets rechtszijdig, dan is H 1 ⬊ p ⬎ p 0. Is de toets tweezijdig, dan is H 1 ⬊ p ⫽ p 0. Het al dan niet verwerpen van H 0 hangt af van het steekproefresultaat. Onder H 0 is X binomiaal verdeeld met p ⫽ p 0; n is de steekproefomvang. Beslissingsvoorschrift bij significantieniveau ␣
Linkszijdig:
Verwerp H 0 als X ⱕ g. Kies g zo, dat P共X ⱕ g兲 ⱕ ␣.
Rechtszijdig:
Verwerp H 0 als X ⱖ g. Kies g zo, dat P共X ⱖ g兲 ⱕ ␣.
Tweezijdig:
Verwerp H 0 als X ⱕ g l of X ⱖ g r. Kies g l en g r zo, dat P共X ⱕ g l兲 ⱕ 0,5␣ én P共X ⱖ g r兲 ⱕ 0,5␣.
Bij een binomiale toets telt X bijvoorbeeld • hoe vaak een bepaalde gebeurtenis optreedt in de steekproef • hoeveel elementen van de steekproef een zekere eigenschap hebben.
Bij de tweezijdige binomiale toets met H 0 ⬊ p ⫽ 16 en H 1 ⬊ p ⫽ 16 met steekproeflengte 100 en significantieniveau ␣ ⫽ 0,05 vind je g l en g r als volgt. P共X ⱕ g l兲 ⱕ 0,025, dus binomcdf共100, 16 , g l兲 ⱕ 0,025. De GR geeft
binomcdf共100, 16 , 9兲 ⬇ 0,0213 binomcdf共100, 16 , 10兲 ⬇ 0,0427
冎
g l ⫽ 9.
P共X ⱖ g r兲 ⱕ 0,025 geeft 1 ⫺ P共X ⱕ g r ⫺ 1兲 ⱕ 0,025, ofwel 1 ⫺ binomcdf共100, 16 , g r ⫺ 1兲 ⱕ 0,025. De GR geeft
1 ⫺ binomcdf共100, 16 , 23兲 ⬇ 0,0379 1 ⫺ binomcdf共100, 16 , 24兲 ⬇ 0,0217
冎
g r ⫺ 1 ⫽ 24, dus g r ⫽ 25.
Conclusie: verwerp H 0 als X ⱕ 9 of als X ⱖ 25. Overschrijdingskans
Is het steekproefresultaat bekend, dan is het verstandig om bij het toetsen met overschrijdingskansen te werken. We gaan uit van een steekproef van lengte 50. Bij H 0 ⬊ p ⫽ 0,6 tegen H 1 ⬊ p ⫽ 0,6 en ␣ ⫽ 0,10 is de overschrijdingskans van het steekproefresultaat 25 gelijk aan P共X ⱕ 25兲. Immers n ⫽ 50 en p ⫽ 0,6, dus np ⫽ 50 ⭈ 0,6 ⫽ 30 en 25 ⬍ 30. P共X ⱕ 25兲 ⫽ binomcdf共50, 0.6, 25兲 ⬇ 0,098 ⬎ 0,5␣. Bij het steekproefresultaat 25 is er geen aanleiding H 0 te verwerpen. De overschrijdingskans van het steekproefresultaat 34 is P共X ⱖ 34兲. Immers 50 ⭈ 0,6 ⫽ 30 en 34 ⬎ 30.
Het toetsen van hypothesen 109
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 29 SESS: 433 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
15.4 De tekentoets O 43 De eigenaar van een fietsenzaak beweert dat de mediaan van het aantal verkochte sportfietsen per maand gelijk is aan 18. Op grond van een aselecte steekproef met de verkoopcijfers van twaalf maanden zal beslist worden of de bewering van de eigenaar geaccepteerd wordt. Waarom is de normale toets hier niet bruikbaar? Theorie A Het toetsen van de mediaan
In opgave 43 wordt getoetst of de mediaan van een populatie 18 is. De normale toets is hierbij niet te gebruiken, want het is niet bekend of de toevalsvariabele X = het aantal verkochte sportfietsen per maand normaal verdeeld is. De mediaan
De mediaan van een rij waarnemingsgetallen is het middelste waarnemingsgetal in het geval de getallen in volgorde van grootte staan. Ruwweg kan gesteld worden dat het aantal waarnemingsgetallen dat groter is dan de mediaan gelijk is aan het aantal waarnemingsgetallen dat kleiner is dan de mediaan. Aan de hand van het volgende steekproefresultaat behandelen we de toets die bij dit soort situaties wordt gebruikt. We nemen ␣ ⫽ 0,05. steekproefresultaat 12 maandverkopen 10 20 28 8 19 2 24 20 19 20 26 20
Bekijk telkens het teken van waarneming ⫺ mediaan
waarneming ⫺ mediaan teken ⫺ ⫹ ⫹ ⫺ ⫹ ⫺ ⫹ ⫹ ⫹ ⫹ ⫹ ⫹
Het omzetten van de steekproefresultaten in plus- en mintekens levert drie mintekens op en negen plustekens. Onder de nulhypothese is de mediaan 18. Bij deze veronderstelling is de kans op een plusteken even groot als de kans op een minteken. Dus P共⫹兲 ⫽ 0,5. Daarom is H 0 ⬊ p ⫽ 0,5 en H 1 ⬊ p ⫽ 0,5. De toetsingsgrootheid X is het aantal plustekens in de steekproef van lengte 12. Onder H 0 is X binomiaal verdeeld met n ⫽ 12 en p ⫽ 0,5. Het steekproefresultaat is X ⫽ 9.
P (waarneming > mediaan) = 0,5 want de mediaan splitst de populatie ruwweg in twee even grote delen.
Omdat 9 ⬎ 0,5 ⭈ 12 is de overschrijdingskans van 9 gelijk aan P共X ⱖ 9兲. Deze kans is gelijk aan 1 ⫺ P共X ⱕ 8兲 ⫽ 1 ⫺ binomcdf共12, 0.5, 8兲 ⬇ 0,073. Omdat P共X ⱖ 9兲 ⬎ 0,5␣ wordt H 0 niet verworpen. Er is geen aanleiding om de mediaan 18 in twijfel te trekken.
䊲
110 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 30 SESS: 490 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Je hebt hier een voorbeeld van de tekentoets. Met de tekentoets kun je de mediaan van een populatie toetsen. Bij de tekentoets bereken je steeds het teken van het verschil waarneming ⫺ mediaan. Er ontstaat zo een rij plus- en mintekens. Onder H 0 共dus als de mediaan klopt兲 mag je aannemen dat er evenveel plussen als minnen zijn. Het aantal plustekens is dan binomiaal verdeeld met p ⫽ 0,5. Dit geeft H 0 ⬊ p ⫽ 0,5. In het volgende voorbeeld komt een eenzijdige tekentoets voor. voorbeeld
Volgens een fabrikant is de 共mediaan van de兲 levensduur van wasmachines van het type Novotronic W909 minstens 12 jaar. Consumentenorganisatie VcV bestrijdt dit. Een steekproef van 15 wasmachines geeft de volgende levensduren in jaren. 9 6 12 8 7 15 14 16 11 15 8 7 10 11 12 Is er bij een significantieniveau van 5% aanleiding VcV gelijk te geven? Aanpak Bereken telkens het teken van waarneming ⫺ 12 . X is het aantal plustekens. Onder H 0 is de mediaan 12, dus P共het teken is ⫹ 兲 ⫽ 0,5. Volgens VcV is de mediaan minder dan 12, dus VcV verwacht weinig plustekens, ofwel P共het teken is ⫹ 兲 ⬍ 0,5. Uitwerking Het teken van waarneming ⫺ 12 geeft: ⫺ ⫺ 0 ⫺ ⫺ ⫹ ⫹ ⫹ ⫺ ⫹ ⫺ ⫺ ⫺ ⫺ 0 Laat 0 weg. X is het aantal plustekens in de steekproef met lengte 13, dus X ⫽ 4. H 0 ⬊ p ⫽ 0,5, H 1 ⬊ p ⬍ 0,5 en ␣ ⫽ 0,05. De overschrijdingskans van 4 is P共X ⱕ 4兲 ⫽ binomcdf共13, 0.5, 4兲 ⬇ 0,133. P共X ⱕ 4兲 ⬎ ␣, dus H 0 wordt niet verworpen. Er is geen aanleiding VcV in het gelijk te stellen. Je kunt in het voorbeeld ook het aantal mintekens tellen. In dat geval is het steekproefresultaat X ⫽ 9. Denk je zoals VcV dat de levensduur minder dan 12 jaar is, dan verwacht je als resultaat van de steekproef veel mintekens bij waarneming ⫺ 12, dus P共het teken is ⫺ 兲 ⬎ 0,5. Dit geeft H 0 ⬊ p ⫽ 0,5, H 1 ⬊ p ⬎ 0,5 en ␣ ⫽ 0,05. P共X ⱖ 9兲 ⫽ 1 ⫺ P共X ⱕ 8兲 ⫽ 1 ⫺ binomcdf共13, 0.5, 8兲 ⬇ 0,133 Omdat P共X ⱖ 9兲 ⬎ ␣, wordt H 0 niet verworpen.
䊲
Het toetsen van hypothesen 111
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 31 SESS: 486 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Afspraak
Bij het toepassen van de tekentoets spreek je eerst af of je mintekens of plustekens telt. Afhankelijk van de probleemstelling volgt hieruit bij een eenzijdige toets H 1 ⬊ p ⬍ 0,5 of H 1 ⬊ p ⬎ 0,5. 44 Een boswachter beweert dat 共de mediaan van兲 het aantal m 3 hout dat een gekapte boom oplevert minstens 15 is. Een steekproef van 13 bomen levert de volgende hoeveelheden in m 3. 11,3 8,8 6,4 8,7 14,6 16,2 12,4 7,1 15,2 10,3 9,5 17,2 7,8 Is er bij een significantieniveau van 10% aanleiding de bewering van de boswachter in twijfel te trekken?
45 De helpdesk van een internetprovider beweert dat bij telefonisch aanvragen van informatie 共de mediaan van兲 de wachttijd hoogstens 2,5 minuten is. Een steekproef van lengte 15 levert de volgende wachttijden in minuten op. 1,8 2,8 3,0 4,2 1,7 5,3 1,2 2,9 3,6 1,0 5,2 4,6 1,2 0,8 4,1 Onderzoek of bij een significantieniveau van 10% inderdaad gesteld kan worden dat de wachttijd hoogstens 2,5 minuten is. A 46 Een reizigersorganisatie beweert dat een bus op het traject Borculo-Deventer bij de halte in Lochem gemiddeld 4,3 minuten te laat is. De busmaatschappij zegt dat het werkelijke gemiddelde lager is. Een aselecte steekproef van lengte 24 levert de volgende vertragingen in minuten op. 1,6 1,1 4,3 6,1 1,3 4,7 0,0 2,8 2,3 4,3 5,1 4,5 0,7 4,3 4,3 0,0 4,8 3,2 1,1 2,8 1,3 1,7 3,9 4,4 Onderzoek of op grond van dit steekproefresultaat bij een significantieniveau van 10% inderdaad gesteld kan worden dat de bus gemiddeld minder dan 4,3 minuten te laat is. Je mag er van uit gaan dat de mediaan en het gemiddelde hier op dezelfde manier behandeld mogen worden. 112 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 32 SESS: 392 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Geschiedenis: de toetsingstheorie Door het werk van Galton (1822-1911) en zijn leerling Pearson kwam de ontwikkeling van de statistiek aan het eind van de 19e eeuw in een stroomversnelling. Een gebied dat zich snel ontwikkelde was de toetsingstheorie. De toepassingen van deze theorie in de verschillende takken van de wetenschap zijn zo divers en specialistisch, dat het lijkt alsof elke grote wetenschapper zijn eigen toets heeft ontwikkeld. Dankzij de computer zijn de meeste toetsen eenvoudig uit te voeren. Zo zijn er met het standaardprogramma voor statistisch onderzoek SPSS/PC+ al meer dan 25 miljoen verschillende toetsen uit te voeren. Galton (1822-1911)
A 47 In 1995 was het gewicht van twintigjarige jongens normaal verdeeld met een gemiddelde van 75,6 kg en een standaardafwijking van 8,7 kg. In het katern Gezondheid van een landelijk dagblad wordt beweerd dat dit gemiddelde de laatste jaren sterk is toegenomen. Deze bewering werd ondersteund met het resultaat van een onderzoek dat van een groep van 250 aselect gekozen twintigjarige jongens er maar liefst 138 zwaarder dan 75,6 kg waren. Onderzoek of bij een significantieniveau van 2,5% inderdaad geconcludeerd mag worden dat het gemiddelde gewicht is toegenomen. A 48 De duur van de zwangerschap is normaal verdeeld met een gemiddelde van 266 dagen en een standaardafwijking van 10 dagen. Volgens een geneeskundige is de duur van de zwangerschap bij vrouwen ouder dan 35 jaar significant korter. Dit wordt ondersteund door een onderzoek onder 753 vrouwen ouder dan 35 jaar die het afgelopen jaar moeder zijn geworden. Bij slechts 325 van deze vrouwen bleek de zwangerschap langer dan 266 dagen te hebben geduurd. Onderzoek of bij een significantieniveau van 1% de bewering van de geneeskundige geaccepteerd kan worden. Theorie B Rijen waarnemingsgetallen vergelijken
De tekentoets kan goed gebruikt worden om te onderzoeken of er een significant verschil bestaat tussen twee rijen waarnemingsgetallen, die elk betrekking hebben op dezelfde populatie. Van elk paar waarnemingsgetallen stel je vast of het verschil positief of negatief is. Op deze wijze ontstaat een rij van plus- en mintekens. Is er geen verschil tussen de rijen waarnemingsgetallen, dan mag je evenveel plustekens als mintekens verwachten. Het aantal plustekens is dus binomiaal verdeeld met p ⫽ 0,5. Dit geeft H 0 ⬊ p ⫽ 0,5. Zie het voorbeeld op de volgende bladzijde. 䊲
Het toetsen van hypothesen 113
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 33 SESS: 487 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
Je kunt het voorbeeld ook doornemen met de applet De tekentoets. voorbeeld
Door de aanleg van rotondes wil men de veiligheid van kruispunten vergroten. Op 15 kruispunten heeft men gedurende een jaar vóór en een jaar ná de aanleg van een rotonde het aantal ongelukken bijgehouden. De resultaten staan in de tabel. AANTAL ONGELUKKEN OP 15 KRUISPUNTEN
kruispunt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
aantal V voor aanleg aantal N na aanleg
4 1
6 2
3 0
1 2
2 2
5 1
2 3
3 0
2 0
1 0
0 1
3 1
4 2
2 4
3 0
Onderzoek of gesteld kan worden dat een kruispunt na aanleg van een rotonde significant veiliger is. Neem ␣ ⫽ 0,05. Aanpak Bereken telkens het teken van V ⫺ N en stel X ⫽ het aantal plustekens. Als de kruispunten vóór en ná aanleg van een rotonde even veilig zijn, is P共V ⫺ N is positief兲 ⫽ 0,5. Als de veiligheid is toegenomen, is P共V ⫺ N is positief兲 ⬎ 0,5, want dan zal V groter zijn dan N. Uitwerking Het teken van V ⫺ N is ⫹ ⫹ ⫹ ⫺ 0 ⫹ ⫺ ⫹ ⫹ ⫹ ⫺ ⫹ ⫹ ⫺ ⫹ . Laat 0 weg. X is het aantal plustekens in de steekproef van lengte 14. Het steekproefresultaat is X ⫽ 10. H 0 ⬊ p ⫽ 0,5, H 1 ⬊ p ⬎ 0,5 en ␣ ⫽ 0,05. De overschrijdingskans van 10 is P共X ⱖ 10兲 ⫽ 1 ⫺ P共X ⱕ 9兲 ⫽ 1 ⫺ binomcdf共14, 0.5, 9兲 ⬇ 0,090. Omdat P共X ⱖ 10兲 ⬎ ␣ wordt H 0 niet verworpen. Het aantal van 10 plustekens is niet significant afwijkend, dus er is geen aanleiding om te veronderstellen dat de kruispunten er veiliger op geworden zijn door de aanleg van de rotondes. DE TEKENTOETS Om te onderzoeken of er een significant verschil bestaat tussen de waarnemingsgetallen in de rijen A en B gebruik je de tekentoets. Geef aan of je het verschil A ⫺ B of B ⫺ A gebruikt en of je plustekens of mintekens telt.
Bij de tekentoets is H0 : p = 0,5.
49 Een tomatenkweker test een nieuw middel tegen bladluizen. Met het middel worden 16 tomatenplanten ontsmet. Voor en na de ontsmetting wordt het aantal bladluizen op de planten geteld. AANTAL BLADLUIZEN PER PLANT
plant
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
voor na
0 0
0 3
12 0
8 5
21 7
5 5
8 0
2 10
30 5
28 6
7 1
10 0
12 1
20 8
38 4
7 7
Geeft dit resultaat aanleiding te veronderstellen dat het ontsmettingsmiddel het aantal bladluizen vermindert? Neem ␣ ⫽ 5%. 114 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 34 SESS: 406 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
50 Op 6 september 1997 werd de 119 e interlandwedstrijd tussen Nederland en België gespeeld. Nederland heeft er daarvan 55 gewonnen en 39 verloren. Is er op grond van deze gegevens voldoende reden te veronderstellen dat Nederland bij het voetballen sterker is dan België? Neem ␣ ⫽ 0,05.
51 Bij een onderzoekscentrum verzamelt men waarderingscijfers van populaire televisieprogramma’s. Men wil met het verzamelde materiaal onderzoeken of er bij ␣ ⫽ 0,10 een significant verschil is in populariteit van de programma’s A en B. Men gebruikt de waarderingscijfers van een aselect gekozen groep van 20 personen. Zie de tabel. Welke conclusie kun je hieruit trekken? WAARDERINGSCIJFERS VOOR DE TV-PROGRAMMA’S A EN B
persoon
1
2
3
4
5
6
7
8
9
10
A B
6,5 5,1
7,1 6,9
6,7 4,8
6,3 5,0
6,0 7,2
8,5 7,9
6,5 6,4
4,2 9,3
6,5 7,7
7,1 6,5
persoon
11
12
13
14
15
16
17
18
19
20
A B
6,0 6,4
6,8 6,9
5,6 5,5
7,4 6,1
6,7 4,0
6,6 5,2
6,5 6,0
8,1 5,9
8,0 9,4
6,6 6,3
52 Een dierenspeciaalzaak krijgt een offerte van een nieuw soort hondenbrokken B dat iets duurder is dan merk A dat tot nu toe werd verkocht. Om te beslissen of in de toekomst merk B verkocht zal gaan worden, wordt een proef genomen met 30 honden, die elk tegelijk een bak met A en een bak met B krijgen voorgezet. Van deze honden geven er 20 de voorkeur aan B en 10 aan A. Is er bij ␣ ⫽ 0,05 voldoende reden te veronderstellen dat door de honden merk B meer op prijs wordt gesteld dan merk A?
Het toetsen van hypothesen 115
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 35 SESS: 488 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
A 53 Bestaat er bij sportwedstrijden thuisvoordeel? Wetenschapsredacteur Hans van Maanen van het Parool deed daartoe een onderzoek in de hoogste afdeling van het vrouwenvolleybal in het seizoen 1996-1997. Zie de tabel. Is er op grond van dit onderzoek aanleiding te veronderstellen dat ’thuisvoordeel’ inderdaad bestaat? Neem ␣ ⫽ 0,01.
AANTAL OVERWINNINGEN
thuis
uit
VVC Volco Pollux AMVJ Martinus OS Sliedrecht Zaanstad Facopa Sudosa
9 8 7 7 4 7 3 2 1 3
6 6 5 4 5 1 4 2 2 0
A 54 Een bank biedt een AEX beleggingsfonds aan. Een belegger twijfelt tussen een AEX belegging en een belegging in een aandeel NIG. Gedurende een periode van twaalf maanden volgt hij de maandelijkse rendementen bij een AEX belegging en een NIG belegging. MAANDELIJKS RENDEMENT IN %
maand
1
2
3
4
5
6
7
8
9
10
11
12
AEX NIG
2 7
⫺4 ⫺6
2 ⫺4
3 3
4 ⫺5
⫺8 ⫺12
9 4
5 ⫺5
4 2
2 ⫺1
⫺8 ⫺12
2 0
Is er bij een significantieniveau van 10% reden om aan te nemen dat een aandeel AEX het beter doet dan een aandeel NIG? A 55 Een volkstuinvereniging onderzoekt of er verschil bestaat tussen de oogstopbrengst bij gebruik van twee soorten kunstmest. Op 16 percelen bemest men de ene helft met soort A en de andere helft met soort B. Daarna wordt er gezaaid. De opbrengst bij het oogsten staat in de tabel. OPBRENGST PER VOLKSTUIN
volkstuin
1
2
3
4
5
6
7
8
A B
230 310
220 305
280 270
225 285
260 270
210 230
280 300
225 315
volkstuin
9
10
11
12
13
14
15
16
A B
215 305
205 280
220 200
280 260
250 305
255 360
255 305
265 250
a Is er bij een significantieniveau van 5% reden om aan te nemen dat er kwaliteitsverschil bestaat tussen de beide soorten kunstmest? b Is er bij een significantieniveau van 5% reden om aan te nemen dat soort B beter is dan soort A? 116 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 36 SESS: 419 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
terugblik Het toetsen van de mediaan met de tekentoets
Bij het toetsen van de hypothese ’de mediaan is m 0’ tegen de hypothese ’de mediaan is niet m 0’ bereken je van alle steekproefresultaten het teken van waarneming ⫺ m 0. Er ontstaat zo een rij van plus- en mintekens. Indien de mediaan werkelijk m 0 is, is de kans op een plusteken gelijk aan 0,5. Het aantal plustekens is dan binomiaal verdeeld met p ⫽ 0,5. Dus H 0 ⬊ p ⫽ 0,5 en H 1 ⬊ p ⫽ 0,5. Gebruik vervolgens de overschrijdingskans van het steekproefresultaat om de juiste conclusie te trekken. Bij deze methode laat je de waarnemingen waarvoor waarneming ⫺ m 0 ⫽ 0 buiten beschouwing. Is er een significant verschil tussen twee rijen waarnemingsgetallen?
Om te onderzoeken of er een significant verschil bestaat tussen twee rijen waarnemingsgetallen kun je de tekentoets gebruiken. Bij elk paar stel je vast of het verschil positief of negatief is. De rij plus- en mintekens die zo ontstaat gebruik je als steekproef uit een binomiale verdeling, waarbij de toetsingsgrootheid het aantal plustekens is. De nulhypothese is H 0 ⬊ p ⫽ 0,5. Immers als er geen verschil is tussen de rijen waarnemingsgetallen is de kans op een plusteken gelijk aan de kans op een minteken. De alternatieve hypothese is, afhankelijk van de probleemstelling, H 1 ⬊ p ⬍ 0,5 of H 1 ⬊ p ⬎ 0,5 of H 1 ⬊ p ⫽ 0,5. Het is gebruikelijk om de paren waarbij het verschil nul is, buiten beschouwing te laten. Informatief: fouten van de eerste en de tweede soort Bij het toetsen van hypothesen zijn vier situaties te onderscheiden.
BESLISSING OP GROND VAN STEEKPROEF
WERKELIJKE SITUATIE
H 0 accepteren
H 0 verwerpen
H 0 is waar
juiste beslissing
fout van de eerste soort
H 1 is waar
fout van de tweede soort
juiste beslissing
De kans dat H 0 ten onrechte wordt verworpen heet de kans op een fout van de eerste soort. Deze kans heet de onbetrouwbaarheid van de toets. Door de keuze van ␣ wordt van te voren afgesproken welke maximale onbetrouwbaarheid acceptabel is. Maar je hebt ook nog te maken met een andere fout. Het is namelijk mogelijk dat je H 0 accepteert, terwijl in werkelijkheid H 1 waar is. De kans op deze zogenaamde fout van de tweede soort is niet te berekenen, omdat je de μ of p die bij H 1 hoort niet weet. Maar je voelt wel aan dat deze kans zal toenemen naarmate de kans op een fout van de eerste soort afneemt. In dit hoofdstuk letten we alleen op de kans op een fout van de eerste soort.
Het toetsen van hypothesen 117
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 37 SESS: 500 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
15.5 Diagnostische toets De uitwerkingen staan ook op de site.
15.1 Beslissen op grond van een steekproef 1
Gegeven is een normaal verdeelde toevalsvariabele X met X ⫽ 2200 en X ⫽ 250. Telkens is het steekproefresultaat X gegeven. Onderzoek of er bij het gegeven significantieniveau ␣ aanleiding is X ⫽ 2200 in twijfel te trekken. a ␣ ⫽ 0,10, X ⫽ 2000 en steekproefomvang ⫽ 5 b ␣ ⫽ 0,05, X ⫽ 2275 en steekproefomvang ⫽ 20
15.2 Eenzijdig en tweezijdig toetsen 2
Gegeven is dat X een normaal verdeelde toevalsvariabele is met ⫽ 75. Toets H 0 ⬊ μ ⫽ 1600 tegen H 1 ⬊ μ ⬎ 1600. a Stel dat de steekproefomvang 15 is. Bij welke steekproefresultaten wordt H 0 verworpen bij ␣ ⫽ 0,05? Rond in het antwoord af op gehelen. b Bij een steekproef van lengte 40 is het steekproefresultaat X ⫽ 1625. Is er bij een significantieniveau van 2,5% aanleiding H 0 te verwerpen? c Hoe groot moet de steekproefomvang zijn opdat het steekproefresultaat X ⫽ 1620 bij een significantieniveau van 10% aanleiding geeft H 0 te verwerpen?
3
Een fabrikant van pakken volle melk beweert dat het vetgehalte X normaal verdeeld is met een gemiddelde van 3,50% en een standaardafwijking van 0,02%. a De controledienst zegt dat het gemiddelde vetgehalte minder dan 3,50% is. Hoeveel moet het gemiddelde vetgehalte van een pak volle melk in een steekproef van lengte 20 zijn om de controledienst bij een significantieniveau van 10% in het gelijk te stellen? Rond in het antwoord af op drie decimalen. b De gezondheidsraad beweert dat het vetgehalte van de volle melk meer dan 3,50% is. Een steekproef van 30 pakken levert een steekproefgemiddelde op van 3,508%. Is er bij een significantieniveau van 2,5% aanleiding de gezondheidsraad gelijk te geven? c De afdeling controle beweert dat door een fout in het productieproces het vetgehalte niet 3,50% is. Bij een steekproef van 40 pakken is het vetgehalte gelijk aan 3,494%. Wijkt dit resultaat significant af van 3,50%? Neem ␣ ⫽ 0,05.
118 Hoofdstuk 15
JOBNAME: GR.223727.vwo.a.dl.4 PAGE: 38 SESS: 427 OUTPUT: Tue Sep 9 15:15:32 2008 /een/epn/015/002/115⫺4⫺
15.3 Binomiale toetsen 4
Sportleraar Van de Vooren beweert dat minstens 75% van de jongeren tussen 12 en 18 jaar lid is van een sportvereniging. De schoolleiding betwijfelt dit. Een aselecte steekproef wijst uit dat 81 van de 120 ondervraagde jongeren lid zijn van een sportvereniging. Is er op grond van dit steekproefresultaat reden om de bewering van sportleraar Van de Vooren in twijfel te trekken? Neem ␣ ⫽ 0,05.
5
Een rad van avontuur heeft 20 gelijke sectoren, genummerd van 1 tot en met 20. Om te controleren of het rad zuiver is, telt men hoe vaak de getallen 6 tot en met 11 worden aangewezen. a Men draait het rad 100 keer. Bij welke aantallen zal men de zuiverheid van het rad niet in twijfel trekken bij een significantieniveau van 0,05? b Men draait het rad 200 keer. Hierbij wordt 70 keer één van de getallen 6 tot en met 11 aangewezen. Is er bij een significantieniveau van 1% aanleiding te vermoeden dat het rad niet zuiver is?
6
Bij het vullen van pakken koffie levert de vulmachine pakken af waarvan het gewicht normaal verdeeld is met een gemiddelde van 1006 gram en een standaardafwijking van 5 gram. a Toon aan dat de kans dat een pak koffie minder dan 1000 gram weegt 0,115 is. Na klachten van een consumentenorganisatie over een te laag gewicht van de pakken besluit de fabrikant de machine bij te stellen. Nadat de technische dienst de machine heeft bijgesteld blijken in een steekproef van 250 pakken er 18 minder dan 1000 gram te wegen. b Is er met een significantieniveau van 1% aangetoond dat het gemiddelde inderdaad is toegenomen?
15.4 De tekentoets 7
De leerlingen van Scholengemeenschap Zuid beweren dat op hun school het schoolexamen wiskunde A veel moeilijker is dan het centraal examen 共CE兲 en dat daarom de resultaten van het schoolexamen wiskunde A zo teleurstellend zijn. Na het CE vergelijkt de wiskundeleraar de behaalde cijfers van het schoolexamen 共SE兲 met die van het CE. Het blijkt dat van de 30 leerlingen er • 17 zijn die voor het CE een hoger cijfer hebben dan voor het SE • 9 leerlingen zijn die voor het CE een lager cijfer hebben dan voor het SE. De overige leerlingen hebben voor het CE hetzelfde cijfer als voor het SE. Onderzoek of er op grond van deze cijfers bij een significantieniveau van 5% gesteld kan worden dat het schoolexamen slechter gemaakt is dan het CE.
Het toetsen van hypothesen 119