TOETSEN VAN HYPOTHESEN
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
1
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
2
Inhoudsopgave Achtergrondinformatie ........................................................................................................................... 4 voorwoord...............................................................................................................................................5 §1 Inleiding hypothese toetsen...............................................................................................................6 §2 Theorie significantie...........................................................................................................................8 §3 Het opstellen van een hypothese.....................................................................................................10 §4 Eenzijdig/tweezijdig toetsen.............................................................................................................11 §5 Overschrijdingskans..........................................................................................................................14 §6 Oefenopgaven..................................................................................................................................20 §7 Uitwerkingen bij oefenopgaven.......................................................................................................26
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
3
Achtergrondinformatie Auteurs: Brigitte Smits Hanneke Abbenhuis Andre Zegers Marina van Sluisveld Wouter van Orsouw
Doelgroep: VWO Wiskunde A , als voorbereiding op het eindexamen of als inleiding op het Hoofdstuk uit de methode.
Voorkennis: Normale verdeling, binomiale verdeling
Waaruit bestaat het materiaal? Het pakketje gaat over hypothese toetsen, en is bedoeld ter vervanging van of aanvulling op de bestaande paragrafen over hypothese toetsen.
Wat was de aanleiding om dit te ontwerpen? We hebben gezocht naar een meer intuïtieve en praktische invulling ter vervanging van de gebruikelijke wijze van uitleggen naar aanleiding van het gemaakte materiaal in Utrecht
Wat zijn de aanbevelingen voor verdere ontwerpen? 1.
uitbreiden met foutenanalyse
2.
uitbreiden met opgaven, zodat het ter vervanging kan van het hele hoofdstuk
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
4
Voorwoord Dit boekje is een inleiding op hypothese toetsen. Aan de hand van je gevoel proberen we dit onderwerp duidelijk te maken, om daarna via theorie en opdrachten daadwerkelijk hypothese te toetsen. Een hypothese (Grieks: υπόθεση [upóthese] = veronderstelling) is in de wetenschap een stelling die (nog) niet bewezen is en dient als het beginpunt van een theorie, een verklaring of een afleiding. Het is mogelijk zeer veel aanwijzingen te verzamelen die een hypothese steunen, maar één enkel negatief uitvallend experiment is voldoende om de hypothese te ontkrachten Je kunt nooit een uitspraak doen of iemand gelijk heeft . Je kunt alleen uitspreken of iemand gelijk krijgt. Vergelijk het met een rechtszaak: je kunt niet bewijzen dat iemand schuldig is , iemand wordt schuldig bevonden ! Bij doorwerken van dit materiaal moet je de binomiale en normale verdeling beheersen.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
5
§1 Inleiding hypothese toetsen 1.
SMARTPHONES Bij ons op school wordt beweerd dat 80% van de leerlingen in een tussenuur of pauze binnen vijf minuten zijn of haar smartphone checkt. (bron: BEN, je weet wel, een provider) De leerlingen van 5 vwo geloven dat niet zomaar en beweren dat dit percentage in het vwo lager ligt ("wij zijn vwo-‐ers, wij zijn dus verstandiger, wij hebben ook andere hobby's"). Bij de eerstvolgende tussenuren observeren een paar vijfdeklassers alle leerlingen die de kantine binnenkomen en kijken of die leerlingen wel of niet binnen vijf minuten hun smartphone tevoorschijn halen en 'm checken. Een les later hebben ze 60 leerlingen geobserveerd en van hen bleken er 46 binnen vijf minuten hun telefoon gecheckt te hebben. (a) Wat is jouw eerste gedachte/jouw gevoel? Is het bij ons op school minder of niet? (b) Een leerling beweert dat je dat nooit kunt weten omdat er 350 bovenbouwers zijn en die 46 van
de 60 dus 'niks zegt'. Wat vind jij daarvan?
(c) Bij welk aantal 'smartphone-‐checkers' in een groep van 60 bovenbouwers ben jij gevoelsmatig
(volledig) overtuigd dat bij ons op school (veel) minder dan 80% van de leerlingen in de bovenbouw binnen vijf minuten zijn of haar telefoon checkt?
In dit hoofdstuk gaat het om gelijk krijgen op basis van een steekproefresultaat. Of je in wèrkelijkheid ook echt gelijk hèbt, kun je 'nooit' weten, dan zou je geen steekproef van 60 leerlingen moeten nemen, maar de hele groep van 350 bovenbouwers (herhaaldelijk) moeten observeren (want menselijk gedrag is niet iedere dag precies hetzelfde). We beginnen met een paar opgaven waarbij je intuïtief (op gevoel) wordt gevraagd wie jij gelijk zou geven, er is dus niet echt een 'goed' of 'fout' antwoord. Op deze manier proberen we relevante begrippen als "populatie" (die hele groep van 350 bovenbouwers), "steekproeflengte" (die 60 observaties) en "significantie" (vind ik die 46 smartphone-‐ checkers in die groep van 60 zoveel minder dan 80% dat ik denk dat het bij ons op school ook ècht minder is?) te leren kennen.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
6
2.
VERLIEFDHEID NA VAKANTIES Ohhhh, die goddelijke Griekse jongen of dat fantastische Finse meisje. Volgens een bekende trendwatcher komt 13% van de Nederlandse jongeren tussen de 16 en 24 jaar (zwaar) verliefd terug van een vakantie in het buitenland. We praten dan over een verliefdheid op een buitenlandse jongen of buitenlands meisje die na deze vakantie nog een tijdje voortduurt, mèt alle fijne en moeilijke gevoelens er bij. (bron: internetartikel)
Echter, hoe betrouwbaar zijn trendwatchers? Een paar zesdeklassers vonden dit wel aardig om te onderzoeken, volgens hen was het méér. In hun omgeving (van hockeyclub tot discotheek en kroeg) bleek na twee weken onderzoek dat 20 van de 89 geïnterviewden (tussen de 16 en 24 jaar oud) wel eens zwaar verliefd waren teruggekomen van vakantie en daar nog een flinke tijd 'last' van hadden gehouden. (a) Wat zou jouw conclusie zijn na deze steekproef? (b) En als er niet 20, maar 13 geïnterviewden gezegd hadden dat ze wel eens verliefd waren teruggekomen? Wat zou dan jouw mening zijn? (c) Bij welke aantallen verliefde jongeren in die steekproef van 89 geïnterviewden zou jij
concluderen dat het -‐ in het echt, dus bekeken over alle jongeren tussen de 16 en 24 jaar -‐ waarschijnlijk wel klopt, die 13%?
(d) Vergelijk je antwoord bij (c) met het antwoord van minstens twee andere leerlingen.
3.
EXAMENTRAINING Steeds meer universiteiten bieden examentrainingen aan, in allerlei vakken. Soms zijn dat ééndaagse bijeenkomsten, maar er zijn bijvoorbeeld ook driedaagse cursussen, die rustig €300 kosten. Kassa!! Wij hebben het idee dat minstens 15% van de vwo-‐ers één of meer examentrainingen bezoekt, maar we weten het natuurlijk niet zeker. Een onderzoek door een decaan onder vwo-‐leerlingen die vorig jaar geslaagd zijn leverde op dat van de 63 leerlingen die reageerden (er waren er 145 geslaagd) er precies 7 aangaven dat ze een examentraining hadden gedaan. (a) Wat is jouw conclusie? (b) Bij welk aantal leerlingen in een groep van 63 dat zegt een examentraining te hebben gevolgd zou
jij ons (minstens 15% van de vwo-‐ers doet dat) gelijk geven?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
7
4.
FACEBOOK Het gemiddelde wereldwijde Facebookgebruik zou 15 uur en 33 minuten per maand zijn, dus laten we zeggen 3,5 uur per week, met een standaardafwijking van één uur per week. (bron: de Belgische krant "De Morgen", december 2013)
Volgens de oudervereniging van onze school is dat voor hun kinderen 'echt veel meer'. Hun kinderen echter (jullie dus), denken dat die 3,5 uur wel zo ongeveer klopt. In plaats van ruzie haalt men de statistiek erbij. Ouders èn leerlingen besluiten tot een onderzoekje waarbij ze bij 150 leerlingen het programmaatje TimeRabbit op computer en mobiel installeren om zo de gebruikte Facebooktijd één week lang precies te kunnen meten. Het resultaat was dat er in deze groep gemiddeld 3 uur en 35 minuten werd 'gefacebookt'. (a) Wat zou jouw conclusie zijn?
(b) Bij welk(e) steekproefresulta(a)ten zou jij de oudervereniging sowieso gelijk geven?
5.
STRENGE WISKUNDEDOCENT? De leerlingen uit de klas 5A beweren dat hun docent altijd (veel) strenger nakijk dan de andere wiskundedocenten. Er is weinig reden om te denken dat hij minder slimme leerlingen heb dan de andere docenten, vinden zij, dus (!!) dat kan het niet zijn. Verder geven we in een toetsweek aan alle clustergroepen het zelfde schoolexamen. Over de gehele vijfde klas (klas 5A niet meegerekend) was er voor het laatste SE Statistiek gemiddeld een 6.4 gehaald met een standaardafwijking van 1,3. In klas 5A haalden 24 leerlingen voor het laatste SE gemiddeld maar een 5,9 en je zou toch zeggen dat dat (significant?) minder is. (a) Wat is jouw conclusie? (b) Welk gemiddelde vind jij nog nèt acceptabel om mij niet 'te streng' te vinden?
Je hebt nu op gevoel een aantal hypotheses bekeken en bepaald wanneer jij iets nog acceptabel vindt en wanneer niet. Aan de hand van wat voorbeelden wordt op de volgende bladzijden nu de theorie achter hypothese toetsen uitgelegd.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
8
§2 Significantie Er staat aan het eind van een grote stad een zuivelfabriek. De grootste specialiteit van deze fabriek -‐ en daaraan ontleent de fabriek zijn faam -‐ is zijn vanillevla. !
!
!
Deze vanillevla kun je verkrijgen in flessen van , en 1 liter en in emmertjes van 2 liter. In deze inleiding kijken we naar flessen van 1 liter.
!
!
!
Het zal je niet verbazen dat een volle fles vanillevla het resultaat is van een geautomatiseerd proces. Van koeienmelk wordt middels allerlei bewerkingen vanillevla wordt gemaakt die een machine uiteindelijk in de fles laat lopen. Deze machine is niet in staat in elke fles exact een liter te laten lopen. Het resultaat is dan ook dat meting van de inhoud van een groot aantal literflessen vanillevla -‐ mits nauwkeurig uitgevoerd -‐ zeer veel verschillende resultaten oplevert. Gemiddeld zal er 1 liter vanillevla in een fles zitten. Hoe nauwkeuriger de machine werkt des te kleiner zal de afwijking ten opzichte van 1 liter zijn. Een maat waarin die afwijking wordt uitgedrukt, is de standaardafwijking of standaarddeviatie. binnen de wiskunde is het symbool voor standaardafwijking !, hoewel er ook wel "SD" voor gebruikt wordt.
Echter, bij een gemiddelde inhoud van 1 liter zal bij een normale verdeling de helft van de flessen te weinig vanillevla bevatten. En natuurlijk de andere helft te veel, maar dat wordt door de kopers van deze flessen niet erg gevonden. Europese regels bepalen inmiddels dat niet meer dan een zeker percentage van een artikel een te laag gewicht/inhoud/... mag hebben. Laten we nu eens kijken naar een partij flessen vanillevla die op een dag door onze fabriek is geproduceerd. En laten we eens aannemen dat er gemiddeld 1005 ml vla in de fles terecht is gekomen met een standaardafwijking van 5 ml. We stellen ons zelf nu drie vragen. 1)
hoe groot is de kans dat je een fles met "te weinig" vanillevla krijgt wanneer je één fles vla uit die partij koopt ?
Met de vuistregels van de normale verdeling weet je dat die kans ongeveer 16% is. Dat betekent dat, als de aankoop van deze fles jou zeer teleurstelt omdat je je afgezet voelt ( "Ze verkopen flessen van een liter waar helemaal geen liter inzit !" ), dat niet zonder meer terecht is. Sterker nog, de kans dat er meer dan 1010 ml in die fles zit is ook ongeveer 16%. Het kan een kwestie van toeval zijn. 2)
Hoe groot is de kans dat je twee flessen met "te weinig" vanillevla krijgt wanneer je twee flessen vla uit die partij koopt ?
Die kans is alweer een stuk kleiner : 0,16 x 0,16, dus ongeveer 2,5 %. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
9
En stel dat je vier flessen zou kopen, dan is de kans nog maar net 0,06 % op vier flessen met een inhoud van minder dan 1 liter. Het kan nog steeds, maar als het je zou overkomen, zou het toch wel heel erg toevallig zijn. In het laatste geval zou een uitspraak als "Ze verkopen flessen van een liter waar helemaal geen liter in zit!" een veel grotere kans hebben terecht te zijn. In erg veel situaties moet een uitspraak getoetst worden. om bij onze zuivelfabriek te blijven, natuurlijk een uitspraak als "De vulmachine vult de literflessen met gemiddeld 1005 ml met een standaarddeviatie van 5 ml", maar ook "De mengmachine voegt 15mg vanille toe per 10 l melk" , "Wij hebben een marktaandeel in onze provincie van 17,6%" , enz. Het eventueel onjuist zijn van deze uitspraken kan op allerlei terrein aanzienlijke consequenties hebben : voor betrouwbaarheid van een merk, voor kostenbeheersing, voor mogelijkheden tot uitbreiden van de fabriek, ......... Maar ook het in twijfel trekken van deze uitspraken door buitenstaanders kan ernstige gevolgen hebben. Als jij, op grond van jouw aankoop van die ene fles vanillevla naar een bekend landelijk dagblad stapt en er de volgende dag met grote letters op de voorpagina staat : "Bekende zuivelfabriek : te weinig vla in de fles!!", dan maak je -‐ samen met dat dagblad -‐ wel wat los. Als je terugdenkt aan de kans dat dit gebeurde terwijl het gemiddelde wel 1005 ml was, neem je wel een aanzienlijk risico om ten onrechte schade aan te richten. Want zo'n actie heeft wel gevolgen voor de fabriek : naam van de fabriek, omzet, banen, en ga maar even door. Dus : moet je wel zeker van je zaak zijn ! Vaak zie je dat als de een of andere uitspraak in twijfel wordt getrokken, dat dan de kans dat dit ten onrechte wordt gedaan, klein wordt gehouden. 3)
Hoe groot is de kans, dat je uit de partij uit het begin van dit verhaal, een fles krijgt met een inhoud onder de 990 ml ?
Reken maar na op je GR : die kans is 0,0013, dus net 0,1%. De kans om een fles met zo'n inhoud te krijgen is zó klein, dat dit wel erg toevallig is, onder de gegeven omstandigheden. Anders gezegd : de afwijking ten opzichte van wat je zou mogen verwachten is toch wel erg groot; of: de afwijking ten opzichte van wat je zou mogen verwachten is significant. Als een uitspraak als "De vulmachine vult de literflessen met gemiddeld 1005 ml vanillevla met een standaarddeviatie van 5 ml", of "De mengmachine voegt 15 mg vanille toe per 10 l melk", of "Wij hebben een marktaandeel in onze provincie van 17,6%" op juistheid onderzocht wordt, moet altijd van te voren afgesproken worden bij welke kans er nog gezegd wordt "Dit kàn gebeuren" en bij welke kans er gezegd wordt "Dit is ons té toevallig om waar te kunnen zijn". Of, om het anders te zeggen: bij welke kans er sprake zal zijn van een significante afwijking van wat er te verwachten was. Die kans wordt over het algemeen gekozen op 1%, 5% of 10%. Er wordt in die gevallen gesproken van een significantieniveau van 1%, 5% of 10%. Dit betekent dus dat degene die uitspraak "Dit is té toevallig om waar te kunnen zijn" doet, weet dat hij een kans van 1%, 5% of 10% voor lief neemt om het tóch nog fout te hebben. Het significantieniveau wordt met de variabele ! aangeduid.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
10
§3 Het opstellen van een hypothese Het doel van een statistische toets is om door middel van een steekproef van een veronderstelling na te gaan of deze zou kunnen kloppen. Na het uitvoeren van een steekproef ga je na of deze veronderstelling stand kan houden op basis van de gevonden resultaten. Zo'n veronderstelling noemen we de hypothese en wordt voorafgaand aan een onderzoek opgesteld. Er wordt onderscheid gemaakt tussen de nulhypothese H 0 en de alternatieve hypothese H 1 . De nulhypothese moet altijd enkelvoudig opgesteld worden, dus met een = teken, H 0 : µ = µ 0 of
H 0 : p = p 0 . Als deze samengesteld, dus H 0 : µ ! µ 0 of H 0 : p ! p 0 zou zijn, dan kun je hier niet mee rekenen. In de alternatieve hypothese staat het vermoeden van degene die gaat onderzoeken. Voorbeeld: Een lampenfabrikant beweert dat zijn lampen gemiddeld minstens 1050 uur branden. De consumentenbond heeft een steekproef gehouden en vindt dit te optimistisch en stelt een onderzoek in. Waarschijnlijk zou de eerste gedachte voor de nulhypothese zijn:
H 0 : µ ! 1050 (minstens 1050 uur) en H 1 : µ < 1050 Maar met welk gemiddelde ga je dan rekenen? 1050 uur of 1051 uur of …? Daarom wordt de hypothese:
H 0 : µ = 1050 en H 1 : µ < 1050
Dit is voor de fabrikant het meest gunstig. 4) Waarom is dit het meest gunstig voor de fabrikant? Voorbeeld: Stel dat je het vermoeden hebt dat de inhoud van een flesje bier van een bepaald merk minder is dan wat op het flesje staat: 30 cl. Je hebt een steekproef genomen waarvan het gemiddelde inderdaad lager is. Om een uitspraak te doen, stel je eerst de hypothese op. Jij bent degene die onderzoekt, dus jouw vermoeden komt bij de alternatieve hypothese.
H 0 : µ = 30
De veronderstelling dat de inhoud die op het flesje staat klopt.
H 1 : µ < 30 De veronderstelling dat de inhoud minder is. Stel dat je geen vermoeden hebt over de inhoud, maar alleen wilt controleren of wat op het flesje staat ongeveer klopt, dan verandert de alternatieve hypothese. H 0 : µ = 30 De veronderstelling dat de inhoud die op het flesje staat klopt. H 1 : µ ! 30
De veronderstelling dat de inhoud minder of meer is.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
11
§4 Eenzijdig/tweezijdig toetsen We kijken opnieuw naar de pakken vanillevla van de zuivelfabriek. Eerder hebben we het belang van de klant besproken. Je wilt niet dat er te weinig vla in een pak zit, dan betaal je teveel. De fabrikant zal hier rekening mee houden en de kans klein willen houden dat er te weinig in een pak zit. Maar de fabrikant heeft ook nog een ander belang. Er kan niet te veel vla in een pak zitten, dan maakt de fabrikant minder winst. Wat houdt dit in? De fabrikant wil niet dat er te weinig in een pak zit, anders worden de klanten ontevreden, maar te veel vla in een pak is ook niet goed, want dat kost de fabrikant geld. De fabrikant wil dus niet dat een willekeurig gekozen pak te veel afwijkt van het gemiddelde. We moeten er nu dus rekening mee houden dat we aan twee kanten een afwijking kunnen hebben, zowel boven als onder het gemiddelde. Een dergelijke soort hypothesetoets noemen we een tweezijdige toets. We moeten namelijk met twee kanten rekening houden. Terug naar de vanillevla. We nemen weer aan dat de pakken gevuld worden met een gemiddelde van 1005 ml en een standaardafwijking van 5 ml. De fabrikant controleert regelmatig door middel van een steekproef of het gemiddelde nog steeds 1005 ml is. 5) Welke nul-‐ en alternatieve hypothese zal de fabrikant opstellen? De fabrikant gaat er van uit dat het gemiddelde 1005 ml is. Dit geeft aanleiding tot de nulhypothese: H0 : μ = 1005 ml Wanneer de fabrikant na de steekproef H0 verwerpt, verwerpt hij het idee dat het gemiddelde 1005 ml is. Omdat tweezijdig wordt getoetst, kan het gemiddelde van de steekproef zowel naar boven, als naar onder afwijken. Dit geeft als alternatieve hypothese: H1 : μ ≠ 1005 ml De fabrikant neemt een significantieniveau van 10%. Wat betekent dat in dit geval? De fabrikant zal H0 verwerpen bij een significante afwijking. Dus als hij een steekproefgemiddelde vindt dat hoort bij de 10% die het meest van het gemiddelde μ = 1005 ml afwijkt. 6) Zit deze 10% onder of boven het gemiddelde? Het antwoord is: allebei! Je hebt te maken met een tweezijdige toets, dus de afwijking kan zowel onder als boven het gemiddelde voorkomen. De fabrikant verwerpt de nulhypothese als het steekproefgemiddelde in de figuur hieronder in één van de gekleurde gebieden valt.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
12
7)
De fabrikant neemt een willekeurig pak en gaat de inhoud bepalen. Een steekproef dus van grootte 1. Er blijkt 998 ml in te zitten. Wat is de conclusie van de fabrikant?
Bij een tweezijdige toets moet je er op letten dat je de overschrijdingskans niet vergelijkt met α, maar !
met !, omdat aan twee kanten een afwijking mogelijk is. !
De kans op een resultaat van maximaal 998 ml is ongeveer 0,081. Een pak met een inhoud van 998 ml hoort dus niet bij de 10% die het meest van het gemiddelde afwijken. H0 wordt dus niet verworpen. De conclusie van de fabrikant is in dit geval dat het gemiddelde op 1005 ml staat. 8) Stel dat de fabrikant bij een volgende controle een pak met een inhoud van 1016 ml vindt. Wat zal in dat geval zijn conclusie zijn? Wanneer weet je of je te maken hebt met een eenzijdige of tweezijdige toets? Dat volgt uit de vraagstelling. Bij de pakken vanillevla vermoedde de klant `Er zit te weinig vla in een pak’. Hieruit volgt de hypothese H1 : μ < 1005. Een eenzijdige toets, want de klant vermoedt niet dat er te veel in een pak zit. De fabrikant vroeg zich af `Is het gemiddelde wel 1005?’. Hierbij hoort H1 : μ ≠ 1005. Een tweezijdige toets, want de fabrikant wil weten of het gemiddelde afwijkend is, zodat hij indien noodzakelijk zijn machines kan bijstellen. Het gemiddelde kan zowel hoger als lager dan 1005 zijn. We bekijken een nieuw voorbeeld. Cornelis en Antoon gaan een spel spelen waarbij regelmatig een munt wordt opgeworpen. Cornelis haalt een muntstuk van twee euro uit zijn portemonnee, hij gaat er vanuit dat deze eerlijk is. Antoon vraagt zich af of dat wel echt zo is. Ze besluiten voor ze aan het spel beginnen de munt te testen door deze 100 keer op te gooien en het aantal keer kop te tellen. Hun significantieniveau kiezen ze op 5%. 9) Stel de hypothesen op die bij dit vraagstuk horen. Cornelis denkt dat de munt eerlijk is en Antoon trekt dit in twijfel. We noemen p de kans op kop. H0 : p = 0,5 (De bewering van Cornelis) H1 : p ≠ 0,5 (De bewering van Antoon) Antoon geeft niet aan of er vaker kop of munt wordt gegooid, dus het zou allebei nog kunnen. Hierdoor is het een tweezijdige toets. Ze voeren het experiment uit en blijken 41 keer kop te hebben gegooid. Bij een eerlijke munt verwacht je 50 keer kop. Omdat ze onder de verwachting zitten berekenen ze de kans op maximaal 41 keer kop. Dat levert een kans van ongeveer 0,044. Ze hebben een tweezijdige toets, dus moeten ze dit vergelijken met de helft van α. 0,044 > 0,025. Dus ze verwerpen H0 niet. Ze gaan er dus vanuit dat de munt eerlijk is. 10) Cornelis en Antoon testen nog een munt door deze 150 keer op te gooien. Hun significantieniveau is weer 5%. Ze gooien 63 keer kop. Wat is hun conclusie? En wat is hun conclusie als er 90 keer kop is gegooid? Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
13
§5 De overschrijdingskans 11)
De wiskunde A-‐docent Jan Stoer zag het examen met vertrouwen tegemoet. Zijn klas had goed gewerkt, dus verwachtte hij dat het vwo wiskunde A-‐examen wel goed zou gaan. En dat bleek ook het geval te zijn: de 25 leerlingen scoorden de volgende cijfers: 7,6 8,5 5,6 9,4 6,8
8,7 6,8 6,8 8,6 8,5
8,0 6,9 8,0 5,7 7,6
7,8 8,3 3,4 4,1 7,1
6,1 9,9 5,3 6,9 8,0
3
4
5
6
7
8
9
10
8
6
4
2
Jan maakte bij de cijfers een frequentiehistogram met klassenbreedte 1. De cijfers 4,5 tot en met 5,4 komen in de klasse “5”, enzovoort. a. Wat was de mediaan van de cijfers? Voor alle leerlingen in Nederland die het wiskunde A-‐examen in 2010 hebben gemaakt was de mediaan 6,7. b. Hoeveel procent van de klas van Jan Stoer scoorde boven de landelijke mediaan? Geen wonder dat Jan Stoer trots was op zijn klas (en op zichzelf). Henk Modaal, zijn collega Frans, is niet zo onder de indruk van de prestaties van Jans klas. Hij redeneert: als je een munt 25 keer opgooit, kan die best 19 of meer keer op kop vallen. De kans op P(X > 19)?noemen we de overschrijdingskans. c. Hoe groot is die kans P(X > 19)? Twee meningen, die van Jan en van zijn collega staan tegenover elkaar: Jan: “De klas heeft buitengewoon goed gepresteerd.” Henk: “Dit kan best toeval zijn.” Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
14
10
Als Henk gelijk heeft, is de kans p dat een leerling bovenmodaal (hoger dan de landelijke mediaan) scoort gelijk aan
1 . Dat noemen we de nulhypothese H0. 2
Als Jan gelijk heeft, is de kans p dat een leerling bovenmodaal scoort groter dan
1 ; dat is de 2
alternatieve hypothese H1.
1 2
1 . 2 1 H1 zegt niet hoe groot de kans p precies is; alleen maar dat hij groter is dan . 2
Kortom:
H0 (Henk gelijk): p =
en
H1 (Jan gelijk): p >
Het steekproefresultaat in het voorbeeld met Jans klas is 19 (19 leerlingen scoorden hoger dan de landelijke mediaan). De overschrijdingskans is de kans op dit steekproefresultaat (19) of een nog extremer resultaat (meer dan 19), onder de aanname dat H0 waar is (p =
1 ), dus als je ervan uitgaat dat Henk gelijk 2
heeft. In dit voorbeeld is de overschrijdingskans de kans P(X > 19) met n = 25 en p =
1 2
Kun je nu op grond van dit steekproefresultaat H0 verwerpen en dus Henk gelijk geven? Nee, dat kan niet zomaar. Het blijft mogelijk dat het steekproefresultaat toevallig zo hoog is, of zelfs nog hoger. De overschrijdingskans geeft je de grootte van de kans op dit resultaat of een nog extremer afwijkend resultaat. Deze kans is klein, maar niet gelijk aan 0. Je moet daarom van tevoren beslissen wanneer je de overschrijdingskans zo klein vindt dat je H0 gaat verwerpen en dus H1 aanneemt. Veelgebruikte waarden voor dit significantieniveau (α ) zijn 10%, 5% en 1%. Als de overschrijdingskans kleiner of gelijk is aan deze gekozen α, dan verwerp je H0. In opgave 11c heb je berekend dat de overschrijdingskans P(X > 19) ≈ 0,007 is. Als er van tevoren voor een significantieniveau van 10% zou zijn gekozen, dan zou je H0 verwerpen, want dan zou gelden: P(X > 19) ≤ α (namelijk 0,007 < 0,10). Kortom: bij α = 10% verwerp je H0 en dus geef je Henk ongelijk en neem je aan dat Jan gelijk heeft: de goede resultaten van zijn leerlingen zijn zeer waarschijnlijk geen toeval. Als het steekproefresultaat niet 19 was geweest, maar 15, dan zou de overschrijdingskans Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
15
P(X > 15) ≈ 0,115 dus groter zijn dan α = 0,10. In dit geval zou H0 niet worden verworpen, want de overschrijdingskans is nu groter dan het significantieniveau. Je zou in dit geval dus Henk gelijk geven: de goede resultaten van Jans klas berusten naar alle waarschijnlijkheid op toeval. We gaan deze begrippen in een ander voorbeeld nogmaals bekijken. 12)
Het is weer zover: de buurkinderen zijn weer “gezellig” een potje Mens-‐Erger-‐Je-‐Niet aan het spelen:
HIJ: “Nou ja, zeg! Alwéér geen zes! En jij gooit stééds zessen!” ZIJ: “Ach ja, je kunt het of je kunt het niet...” HIJ: “Maar dit is geen toeval meer. Ik wil ook met die dobbelsteen gooien!!” ZIJ: “Nou ja, zeg, je wilt toch niet beweren dat ik vals speel? Dit is gewoon mijn geluksdobbelsteen” Om een einde te maken aan de impasse besluiten ze na lang geruzie om “wetenschappelijk” te bewijzen of de dobbelsteen nou vaker dan normaal 6 gooit of niet. Ze gaan de steen 300 keer gooien en het aantal zessen tellen. Als de dobbelsteen zuiver (niet vals) is, zal dat in de buurt van de 50 moeten uitkomen (dat is wat ZIJ beweert). Als HIJ gelijk heeft, dan zal het aantal zessen groter dan 50 zijn. Wiskundig gezien hebben we te maken met twee beweringen. ZIJ zegt dat de kans op een zes gelijk !
!
is aan en HIJ zegt dat die kans groter is dan : ! !
!
H0: p = (ZIJ) ! !
H1: p > (HIJ) !
Ze gooien 300 keer en het aantal zessen blijkt gelijk te zijn aan 57. En tja, dan begint het gekibbel weer: HIJ: “Zie je wel! Méér dan 50 zessen!” !
ZIJ: “Maar dat is toeval, ook als de kans per keer precies is, dan kan het best voorkomen dat er 57 zessen in 300 keer gooien komen.
!
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
16
Het wordt tijd om de zaak wat wiskundiger te bekijken. !
De kans op precies 57 zessen is binompdf(300, , 57) = 0,033. !
!
Maar de kans op precies 50 zessen is binompdf(300, , 50) = 0,062 en dat is ook niet erg groot. !
Is het nu wel of geen eerlijke dobbelsteen? Dat gaan we onderzoeken met de volgende hypothesetoets. !
•
De nulhypothese is H0: p = .
•
De alternatieve hypothese is H1: p > .
•
De toetsingsgrootheid X is het aantal keer dat we 6 ogen gooien. X is in dit voorbeeld ! binomiaal verdeeld met n = 300 en p = .
!
! !
!
a. b. c.
• Het significantieniveau kiezen we α = 0,05. Bereken de overschrijdingskans P(X ≥ 57). Welke conclusie kun je trekken als je de overschrijdingskans vergelijkt met de gekozen α? Bekijk de figuur op de volgende pagina. Wat zou worden bedoeld met een rechtszijdige toets?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
17
d. Welke bewering zou horen bij een linkszijdige toets? Wat is dan de alternatieve hypothese? e. De buren zijn het nog steeds niet eens en besluiten nogmaals 300 keer te gooien. Het resultaat is nu 58 keer een 6. Hoe groot is nu de overschrijdingskans? f. Het proces herhaalt zich. Ze blijven het oneens en gooien nog maar eens 300 keer met de dobbelsteen. Maak een tabel met overschrijdingskansen voor (minimaal acht) verschillende uitkomsten van hun experiment. k P(X>k) 57 58 .. .. In deze paragraaf hebben we steeds na berekening van de overschrijdingskans een beslissing genomen. Als de overschrijdingskans gelijk of kleiner was dan het gekozen significantieniveau, dan besloten we om H0 te verwerpen. We kunnen deze conclusie ook op een andere manier trekken. Met behulp van het significantieniveau kunnen we grenzen bepalen van het gebied waar we H0 verwerpen. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
18
We hoeven dan niet steeds opnieuw de overschrijdingskans te berekenen, zoals in opgave 12f, maar berekenen één keer de grenswaarde. Wil je zelf een valse dobbelsteen maken? Bekijk dan de handleiding voor het maken van valse dobbelstenen: http://alternativetechnologies.wordpress.com/2012/08/26/vals-‐spelen-‐met-‐ dobbelstenen/ . Samengevat: Iemand doet een bewering die we gaan onderzoeken. Aan de juistheid van deze bewering wordt getwijfeld. Een hypothesetoets is een methode om te beslissen bij zo’n meningsverschil. • De twee meningen die tegenover elkaar staan zijn: de alternatieve hypothese H1 en de nulhypothese H0 • Er is een toetsingsgrootheid ; dat is het aantal X dat geteld wordt (of een gewicht dat gemeten wordt of ...) • De hypotheses handelen over de kans-‐parameter p van een binomiale verdeling of de gemiddelde-‐parameter μ van een normale verdeling. • Als je uitgaat van een onbevooroordeelde, kritische waarnemer, is de inhoud van H0: er is niets bijzonders aan de hand; wat er gebeurt, is zuiver toeval. H0 wordt zo geformuleerd dat p of μ onder H0 een vaste waarde hebben (bijv. p = 0,25), terwijl bij H1 een heel gebied van mogelijkheden is (bijv. H1: p < 0,25). • De alternatieve hypothese hangt af van de bewering die onderzocht wordt en deze bewering bepaald de richting waarin je toetst: linkszijdig, rechtszijdig of tweezijdig. • Het significantieniveau α α . Deze α is vooraf afgesproken en wordt als getal of als percentage gegeven. Voor α neemt men vaak 0,05 (5%), 0,01 of zelfs 0,005, afhankelijk van hoe zwaarwegend de beslissing is. Na het opstellen van de hypothesetoets volgt het nemen van een steekproef. Op grond van de waarde die X aanneemt bij deze steekproef, wordt H0 verworpen of niet. Als H0 juist is, zal het steekproefresultaat in de buurt van E(X) zitten. Als het steekproefresultaat daar sterk van afwijkt, zal H0 worden verworpen. • De overschrijdingskans is de kans op het steekproefresultaat of een nog extremer resultaat, onder de aanname dat H0 waar is. Wat extreem is, de richting van extreem (links of rechts), wordt bepaald door de alternatieve hypothese.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
19
§6 Oefenopgaven 1.
SMARTPHONES Op school wordt beweerd dat 80% van de leerlingen in een tussenuur of pauze binnen vijf minuten zijn of haar smartphone checkt. (bron: BEN, je weet wel, een provider)
De leerlingen geloven dat niet zomaar en beweren dat dat percentage in het vwo lager ligt ("wij zijn vwo-‐ers, wij zijn dus verstandiger, wij hebben ook andere hobby's"). Bij de eerstvolgende tussenuren observeren een paar vijfdeklassers alle leerlingen die de kantine binnenkomen en kijken of die leerlingen wel of niet binnen vijf minuten hun smartphone tevoorschijn halen en 'm checken. Een les later hebben ze 60 leerlingen geobserveerd en van hen bleken er 46 binnen vijf minuten hun telefoon gecheckt te hebben.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
20
(a)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 5% een conclusie. Krijgen mijn leerlingen gelijk op basis van dit steekproefresultaat?
(b)
Een stuk lastigere variant is deze: "Bij welk aantal 'checkers' in die groep van 60 geobserveerde leerlingen geef jij mijn leerlingen gelijk als ! = 0,05 ?"
2.
VERLIEFDHEID NA VAKANTIES Ohhhh, die goddelijke Griekse jongen of dat fantastische Finse meisje. Volgens een bekende trendwatcher komt 13% van de Nederlandse jongeren tussen de 16 en 24 jaar (zwaar) verliefd terug van een vakantie in het buitenland. We praten dan over een verliefdheid op een buitenlandse jongen of buitenlands meisje die na deze vakantie nog een tijdje voortduurt, mèt alle fijne en moeilijke gevoelens er bij. (bron: internetartikel)
Echter, hoe betrouwbaar zijn trendwatchers? Een paar zesdeklassers vonden dit wel aardig om te onderzoeken. Zij dachten namelijk gevoelsmatig dat het méér was. In hun omgeving (van hockeyclub tot discotheek en kroeg) bleek na twee weken onderzoek dat 20 van de 89 geïnterviewden (tussen de 16 en 24 jaar oud) wel eens zwaar verliefd waren teruggekomen van vakantie en daar nog een flinke tijd 'last' van hadden gehouden.
3.
(e)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 2,5% een conclusie. Krijgt die trendwatcher gelijk van jou op basis van dit steekproefresultaat?
(f)
En als er niet 20, maar 13 geïnterviewden gezegd hadden dat ze wel eens verliefd waren teruggekomen? Wie krijgt er dàn gelijk?
(g)
Bij welke aantallen verliefde jongeren in die steekproef van 89 geïnterviewden zou jij concluderen dat het -‐ in het echt, dus bekeken over àlle jongeren tussen de 16 en 24 jaar -‐ waarschijnlijk wel klopt, die 13%?
EXAMENTRAINING Steeds meer universiteiten bieden examentrainingen aan, in allerlei vakken. Soms zijn dat ééndaagse bijeenkomsten, maar er zijn bijvoorbeeld ook driedaagse cursussen, die rustig 300€ kosten. Kassa!! Wij hebben het idee dat minstens 15% van de vwo-‐ers één of meer examentrainingen bezoekt, maar we weten het natuurlijk niet zeker. Een onderzoek door de decaan onder vwo-‐leerlingen die vorig jaar geslaagd zijn leverde op dat van de 63 leerlingen die reageerden (er waren er 145 geslaagd) er precies 7 aangaven dat ze een examentraining hadden gedaan. (c)
Stel een toetsmodel op, bereken de overschrijdingskans en trek op basis van dit steekproefresultaat bij een significantieniveau van 2,5% een conclusie.
(d)
Wat zou de conclusie moeten zijn bij een significantieniveau van 1%?
(e)
Bij welk aantal leerlingen in een groep van 63 dat zegt een examentraining te hebben gevolgd zou jij ons (minstens 15% van alle vwo-‐ers doet dat) gelijk (moeten) geven als we uitgaan van een significantieniveau van bijvoorbeeld 5%? Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
21
4.
FACEBOOK Het gemiddelde wereldwijde Facebookgebruik zou 15 uur en 33 minuten per maand zijn, dus laten we zeggen 3,5 uur per week, met een standaardafwijking van één uur per week. (bron: de Belgische krant "De Morgen", december 2013)
Volgens de oudervereniging van de school is dat voor hun kinderen 'echt veel meer'. Hun kinderen echter (jullie dus), denken dat die 3,5 uur wel zo ongeveer klopt. In plaats van ruzie haalt men de statistische formules erbij. Ouders èn leerlingen besluiten tot een onderzoekje waarbij ze bij 150 leerlingen het programmaatje TimeRabbit op computer en mobiel installeren om zo de gebruikte Facebooktijd één week lang precies te kunnen meten. Het resultaat was dat er in deze groep gemiddeld 3 uur en 35 minuten werd 'gefacebookt'.
5.
(c)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 5% een conclusie. Krijgt de oudervereniging gelijk of krijgen de leerlingen gelijk van jou op basis van dit steekproefresultaat?
(d)
Als het goed is heb je bij (a) hierboven de leerlingen gelijk moeten geven, máár je weet: "ouders geloven hun kinderen niet zómaar" en dus besluiten de ouders tot een uitgebreidere steekproef onder 400 leerlingen. Het resultaat is precies hetzelfde: gemiddeld 3 uur en 35 minuten. Toch claimen de ouders nu opnieuw hun gelijk. Is dat terecht bij een significantieniveau van 5%?
SMARTPHONE, VERVOLG (zie opgave 1) In het blad "Ouders van nu" beweerde iemand in een ingezonden brief dat smartphone-‐ gebruik zodanig verslavend werkt dat 60% van de jongeren met een smartphone niet in staat is om langer dan een half uur zijn of haar telefoon niet te checken. Onder de leerlingen in de klas barstte een discussie los of dit nou klopte of niet. Sommigen dachten dat het percentage hoger lag, anderen dachten lager. Een klein onderzoek onder 83 leerlingen wees uit dat 56 leerlingen inderdaad binnen een half uur zijn of haar smartphone checkte, onafhankelijk van de omstandigheden. Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 10% een conclusie. Krijgt de briefschrijver gelijk op basis van dit steekproefresultaat?
6.
STRENGE WISKUNDEDOCENT? De leerlingen uit de 5e klas beweren dat ik altijd (veel) strenger nakijk dan mijn andere wiskundecollega's. Er is weinig reden om te denken dat ik minder slimme leerlingen heb dan mijn andere collega's, vinden zij, dus (!!) dat kan het niet zijn. Verder geven we in een toetsweek aan alle clustergroepen het zelfde schoolexamen. Over de gehele vijfde klas (mijn groep niet meegerekend) was er voor het laatste SE Statistiek gemiddeld een 6.4 gehaald met een standaardafwijking van 1,3 punten. Bij mij haalden mijn 24 leerlingen voor het laatste SE gemiddeld maar een 5,9 en je zou toch zeggen dat dat (significant?) minder is. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
22
(c)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 2,5% een conclusie. Kijk ik te streng na?
(d)
Wat zou jouw conclusie zijn bij een significantieniveau van 5%?
7.
ALLERGIE 25% van alle kinderen in het voortgezet onderwijs heeft last van één of andere allergie. (bron: www.gezondheidsplein.nl)
Er zijn mensen die beweren dat als je vóór je tweede levensjaar regelmatig in aanraking bent geweest met katten, je kans op een allergie kleiner is, maar helaas kun je daar als inmiddels 16-‐ of 17-‐jarige niet zoveel meer mee. Voor een profielwerkstuk wisten twee zesdeklassers maar liefst 233 middelbare scholieren te vinden die vóór hun tweede levensjaar regelmatig in aanraking waren geweest met katten en wat bleek: 45 hadden last van één of meer allergieën. (a)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 5% een conclusie.
(b)
Bij welk(e) steekproefresulta(a)t(en) zou jij precies de tegenovergestelde conclusie hebben getrokken?
8.
FIJNSTOF IN RELATIE TOT AUTISME Fijnstof zou wel eens een oorzaak kunnen zijn voor het steeds vaker voorkomen van autisme. In Nederland kampt ongeveer 1 op de 100 mensen met autisme. (bron: artikel Volkskrant)
Een organisatie van verontruste moeders heeft gelezen dat het grootste risico om te veel fijnstof in te ademen bestaat als je binnen 250 meter van een snelweg woont. Volgens deze moeders moeten er dus binnen een afstand van 250 meter van de snelweg relatief veel (méér dan 1%) mensen wonen die kampen met autisme. Het RIVM (RijksInstituut voor Volksgezondheid en Milieu) besluit tot een grootschalig onderzoek onder 30000 mensen die binnen een afstand van 250 meter van een snelweg wonen. (a)
Bij welk onderzoeksresultaat vind jij dat er bij een significantieniveau van 5% aanleiding is om zonder meer te geloven dat onder mensen die binnen 250 meter van een snelweg wonen het aantal mensen met autisme groter is dan 1 op de 100?
Een onderzoeker van de universiteit van Groningen pakt het heel anders aan. Hij onderzoekt 1500 mensen bij wie de diagnose "Autisme" is gesteld en bekijkt hoeveel van hen binnen 250 meter van een snelweg wonen. (b)
Bij welk onderzoeksresultaat vind jij nú dat er (bij opnieuw ! = 0,05) aanleiding is om zonder meer te geloven dat onder mensen die binnen 250 meter van een snelweg wonen het aantal mensen met autisme (significant) groter is dan 1 op de 100?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
23
9.
WISKUNDEDOCENT Jouw zeer gewaardeerde wiskundedocent(e) zegt dat hij/zij in 80% van de gevallen je cijfer voor de volgende toets binnen een marge van 0,5 punten kan voorspellen. Hij zegt dus bijvoorbeeld dat je iets haalt tussen de 7,1 en 8,1. Hoewel hij/zij het zelf nakijkt denk jij toch dat de goede man/vrouw niet helderziend is en dus besluiten jullie de volgende drie toetsen (elk onder 25 leerlingen) te kijken of zijn/haar (van te voren opgeschreven) voorspellingen kloppen. Hij/zij blijkt het 55 keer 'goed' te hebben.
10.
(a)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 2,5% een conclusie. Krijgt hij/zij gelijk van jou ?
(b)
Bij welk aantal goede voorspellingen had je hem/haar (on)gelijk gegeven?
BLOEDDRUK Een arts in het Amphia-‐ziekenhuis (niet toevallig de vader van één van de leerlingen) beweert dat de kans op hoge bloeddruk voor mannen en vrouwen gelijk is. In vrolijkere wetenschappelijke taal heet dit "hoge bloeddruk is niet sexegebonden" Zijn vrouw wil hem deze keer echt niet geloven, het gaat 'tegen haar gevoel in". Hij houdt de maanden daarna zo eerlijk mogelijk bij wie er allemaal te hoge bloeddruk hebben en wat blijkt: van de 280 patiënten met te hoge bloeddruk waren er 150 vrouw.
11.
(a)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 5% een conclusie. Krijgt de arts gelijk van jou of is de vrouwelijke intuïtie toch meer waard?
(b)
Als het goed is heb je hierboven een tweezijdig toetsmodel opgesteld. Stel nu ook eens een eenzijdig toetsmodel op en ga na of je weer tot dezelfde conclusie komt.
KOFFER TE LAAT Misschien heb je het al eens meegemaakt: je staat in de bagagehal van het vliegveld en jouw koffer is niet gearriveerd, balen. Vliegtuigmaatschappijen geven je in dat geval een vergoeding om een tandenborstel en -‐ als je koffer er na een aantal dagen nog niet is -‐ ondergoed, een zwembroek, een nieuwe bikini en andere kleding te kopen. Hoewel het niet zo vaak voorkomt, beweren de maatschappijen dat ze -‐ àls het fout gaat -‐ gemiddeld 150€ uitkeren met een standaardafwijking van 50€ (overigens claimde Victoria Beckham ooit 700000 dollar toen ze twee koffers kwijt was)
Een grote reizigersorganisatie vertrouwt dit niet helemaal en heeft na een paar maanden van 200 mensen de vergoeding achterhaald. Die blijkt bij die mensen gemiddeld 140€ te zijn geweest. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
24
(a)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 2,5% een conclusie. Wie krijgt er gelijk?
(b)
Bij welke steekproefresultaten zou je de vliegmaatschappijen sowieso gelijk geven? Bij welke juist niet? Probeer die grens bij ! = 0,05 precies vast te stellen.
12.
BIER Jongens van 18 die drinken en uitgaan blijken gemiddeld op een uitgaansavond 5,1 glazen bier te drinken met een standaardafwijking van 2,1 glazen. (bron: Stichting Alcoholpreventie & RIVM)
Mijn Brabantse leerlingen in de examenklas denken dat dat (veel) meer is. Bij een onderzoek onder 92 uitgaande (en bierdrinkende) Bredase jongens blijken zij gemiddeld 5,6 glazen bier genuttigd te hebben. (a)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 2,5% een conclusie. Drinken ze in Breda meer bier?
(b)
Als je ditzelfde steekproefresultaat zou hebben gevonden wanneer het onderzoek maar 46 Bredase jongens had omvat, wat zou dàn je conclusie zijn geweest?
13.
AANTAL WHATSAPPJES PER DAG Voor degenen die het gebruiken is WhatsApp nauwelijks meer weg te denken uit hun bestaan. Zeker als je in allerlei groepswhatsapps actief bent kan het aantal whatsappberichtjes dat je op een dag ontvangt flink oplopen Gemiddeld ontvangen -‐ volgens een leerling van mij -‐ de whattsappgebruikers bij ons op school zo'n 110 berichtjes per dag met een standaardafwijking van 50 berichtjes. Mij lijkt dat nogal veel, hoewel er pas geleden een meisje zei dat ze ongeveer 700 whatsappjes per dag binnen kreeg. Dat werd dus even rondvragen. Na een paar dagen bleek dat van 60 leerlingen die het wisten en met mij wilden delen het gemiddeld ontvangen aantal whatsapp-‐berichten 98 was. (a)
Stel een toetsmodel op, bereken de overschrijdingskans en trek bij een significantieniveau van 2,5% een conclusie. Geef je mij gelijk of krijgt de leerling gelijk?
(b)
Bij welk(e) gemiddelde(n) zou jij mij gelijk geven (en concluderen dat dat het zeker minder is dan die 110) bij een significantieniveau van 5%?
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
25
§7 Uitwerkingen 1)
SMARTPHONES a)
!! : ! = 0,8 (wat wij op school denken) !! : ! < 0,8 (de mening van de leerlingen)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≤ 46 !"# ! = 60 !" ! = 0,8 = !"#$%&'( 60, 0.8, 46 ≈ 0,31 waarbij ! uiteraard het aantal 'checkers' is in de steekproef. Dit is meer dan de van te voren afgesproken acceptabele 5% dus is de conclusie dat dit steekproefresultaat (misschien) aan toeval te wijten is (die kans is 31%) en dùs mogen we !! niet verwerpen, de leerlingen krijgen dus géén gelijk. b)
!! : ! = 0,8 (wat wij op school denken) !! : ! < 0,8 (de mening van de leerlingen)
Nu weet je uiteraard niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “klein genoeg” is om !! te verwerpen. De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nu ! ! ≤ ! !"# ! = 60 !" ! = 0,8 = !"#$%&'( 60, 0.8, ! < ! = 0,05 Je zult nu in je GRM moeten ingeven dat !! = !"#$%&'((60, 0.8, !) en dan in de tabel zoeken naar de eerste waarde van ! waarvoor !! < 0,05. Het blijkt dat dit bij ! = 42 is. Uiteraard kan dat ook opgelost worden met !! = 0,05 en dan iets als CALC intersect.
Dit houdt in dat als er in de steekproef 42 of minder dan 42 ‘checkers’ zijn, de overschrijdingskans onder de van te voren afgesproken acceptabele 5% komt en er dùs reden is te denken dat dit (waarschijnlijk) geen toeval is en dùs mogen we !! verwerpen, de leerlingen krijgen dan wèl gelijk. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
26
2)
VERLIEFDHEID NA VAKANTIES a)
!! : ! = 0,13 (dit denkt de trendwatcher) !! : ! > 0,13 (dit denken een paar zesdeklassers)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is
! ! ≥ 20 !"# ! = 89 !" ! = 0,13 = 1 − !"#$%&'( 89, 0.13, 19 ≈ 0,01 waarbij ! het aantal geïnterviewden is dat verliefd terugkeerde van een vakantie.
Deze kans is minder dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit (waarschijnlijk) geen toeval is (er is namelijk maar 1% kans dat dat wèl het geval is) en dùs moeten we !! verwerpen, wat betekent dat de zesdeklassers dus gelijk krijgen, en die trendwatcher niet. (b)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nú
! ! ≥ 13 !"# ! = 89 !" ! = 0,13 = 1 − !"#$%&'( 89, 0.13, 12 ≈ 0,37
Deze kans is meer dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit steekproefresultaat (misschien) geen toeval is en dùs mogen we !! niet verwerpen, de trendwatcher krijgt dus gelijk. (c)
In dit geval weet je niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “klein genoeg” is om !! te verwerpen.
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≥ ! !"# ! = 89 !" ! = 0,13 = 1 − !"#$%&'( 89, 0.13, ! − 1 < ! = 0,025 Je zou nu in je GRM kunnen ingeven dat !! = 1 − !"#$%&'((89, 0.13, ! − 1) en dan in de tabel zoeken naar de eerste waarde van ! waarvoor !! < 0,025 Het blijkt dat dit bij ! = 19 is. Uiteraard kan dat ook met !! = 0,025 en dan iets als CALC intersect.
Dit houdt in dat als er in de steekproef 19 of meer ‘verliefden’ zijn, de overschrijdingskans onder de van te voren afgesproken acceptabele 2,5% komt en er dùs reden is te denken dat dit (waarschijnlijk) geen toeval is (die kans was maar 0,019) en dùs mogen we !! verwerpen, de leerlingen krijgen dan gelijk. Die trendwatcher krijgt gelijk als we !! niet verwerpen, dus als er hoogstens 18 'verliefden' in de steekproef zijn. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
27
3)
EXAMENTRAINING (a)
!! : ! = 0,15 (dit denken wij, maar zie je in dat er 'eigenlijk' staat dat !! : ! ≥ 0,15) !! : ! < 0,15 (dan klopt onze gedachte niet)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is
! ! ≤ 7 !"# ! = 63 !" ! = 0,15 = !"#$%&'( 63, 0.15, 7 ≈ 0,253 waarbij ! het aantal ex-‐leerlingen is dat heeft deelgenomen aan een examentraining. Deze kans is meer dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit (misschien gewoon) toeval was (een kans van 25,3%) en dùs mogen we !! niet verwerpen, wat betekent dat wij gelijk krijgen.
(b)
Dezelfde conclusie! Pas bij een overschrijdingskans van meer dan 25,3% (en dat niveau wordt wetenschappelijk veel te hoog gevonden) mag je ons ongelijk geven.
(c)
In dit geval weet je niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “klein genoeg” is om !! te verwerpen. De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is
! ! ≤ ! !"# ! = 63 !" ! = 0,15 = !"#$%&!" 63, 0.15, ! < 0,05 Met je GRM vind je dat ! = 4
Je moet ons gelijk geven als er minstens 5 leerlingen in de steekproef aangeven dat ze een examentraining hebben gevolgd. 4)
FACEBOOK (a)
!! : ! = 3,5 (dit denken de leerlingen) !! : ! > 3,5 (dit denken de ouders)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier
! ! ≥ 3
!" !"
!"# ! = 3,5 !" ! =
!
!"#
= !"#$%&'() 3
!" !"
, 100, 3.5,
!
!"#
≈ 0,154
waarbij ! de tijd is die in deze groep van 150 leerlingen GEMIDDELD per week aan Facebook werd besteed. Overigens mag de bovengrens van 100 ook best (veel) groter of (iets) kleiner genomen worden en is het zo dat je voor de waarde van ! rekening MOET houden met de ! − !"# !""# ℎ!" !"#$%%"&%".
Deze kans is groter dan de van te voren afgesproken acceptabele 5% dus is de conclusie dat dit (misschien wel) toeval is (15% kans dat dat zo is) en dùs mogen we !! niet verwerpen, wat betekent dat de leerlingen gelijk krijgen, en de ouders niet. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
28
(b)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nú ! ! ≥ 3
!" !"
!"# ! = 3,5 !" ! =
!
!""
= !"#$%&'() 3
!" !"
, 100, 3.5,
!
!""
≈ 0,048 waarbij
! in dit geval de tijd is die in deze groep van 400 gemiddeld per week aan Facebook werd besteed, wat er op neer komt dat je voor de waarde van ! wéér rekening MOET houden met de ! − !"# !""# ℎ!" !"#$%%"&%", !""# !" !"# ! = 400.
Deze kans is kleiner dan de van te voren afgesproken acceptabele 5% dus is de conclusie dat dit (waarschijnlijk) geen toeval is (4,8% kans dat dat wèl zo is) en dùs moeten we !! verwerpen, wat betekent dat de ouders in dit geval inderdaad gelijk moeten krijgen. 5)
SMARTPHONE, VERVOLG (zie opgave 1) !! : ! = 0,6 (dit beweert de schrijver van de ingezonden brief)
!! : ! ≠ 0,6 (dan denk je dat de bewering hierboven niet klopt)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is
! ! ≥ 56 !"# ! = 83 !" ! = 0,6 = 1 − !"#$%&'( 83, 0.6, 55 ≈ 0,0998 waarbij ! het aantal leerlingen is dat binnen een half uur zijn of haar smartphone checkte. Deze kans ligt weliswaar onder de van te voren afgesproken acceptabele 10% (en dus !
lijkt het of je !! moet verwerpen), máár niet onder ! = 5% en omdat je hier
tweezijdig toetst is dàt nodig om !! te mogen verwerpen.
!
De conclusie is dus dat dit (misschien gewoon) toeval was (een kans van 10%) en dùs mogen we !! niet verwerpen, wat betekent dat de schrijver van de ingezonden brief gelijk krijgt.
NB
Had je hier éénzijdig getoetst (!! : ! = 0,6 tegen !! : ! > 0,6), dan zou de
conclusie precies omgekeerd zijn geweest (!! verworpen, briefschrijver ongelijk)!
6)
STRENGE WISKUNDEDOCENT (a)
!! : ! = 6,4 (dit zou het ook bij mij moeten zijn) !! : ! < 6,4 (ik ben te streng)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier
! ! ≤ 5,9 !"# ! = 6,4 !" ! =
!,!
!"
= !"#$%&'() 0, 5.9, 6.4,
!,!
!"
≈ 0,03 waarbij !
het gemiddelde cijfer in een groep van 24 leerlingen is, waarbij je voor de waarde van ! rekening MOET houden met de ! − !"# !""# ℎ!" !"#$%%"&%".
Deze kans is groter dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit (misschien wel) toeval is (3% kans dat dat zo is) en dùs mogen we !! Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
29
niet verwerpen, wat betekent dat de leerlingen mij niet als 'te streng' mogen beschouwen op grond van dit resultaat. (b)
7)
Omdat de overschrijdingskans van 0,03 nu kleiner is dan de drempel van 5% moet de conclusie precies 'andersom' zijn: we moeten !! verwerpen en dus 'ben ik (opeens wel) te streng' op grond van hetzelfde steekproefresultaat.
ALLERGIE (a)
!! : ! = 0,25 (dit percentage heeft last van één of andere allergie) !! : ! < 0,25 (als je voor je 2e regelmatig met katten in aanraking was)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≤ 45 !"# ! = 233 !" ! = 0,25 = !"#$%&'( 233, 0.25, 45 ≈ 0,025 waarbij ! uiteraard het aantal kinderen is in de steekproef dat voor hun 2e levensjaar regelmatig met katten in aanraking was geweest.
Dit is minder dan de van te voren afgesproken acceptabele 5% dus is de conclusie dat dit steekproefresultaat (hoogstwaarschijnlijk) niet aan toeval te wijten is (die kans is maar 2,5%) en dùs moeten we !! verwerpen, kinderen die voor hun 2e levensjaar regelmatig met katten in aanraking waren geweest hebben een significant kleinere kans op één of andere allergie. (b)
!! : ! = 0,25 !! : ! < 0,25
Nu weet je uiteraard niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “groot genoeg” is om !! niet te verwerpen.
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nu ! ! ≤ ! !"# ! = 233 !" ! = 0,25 = !"#$%&'( 233, 0.25, ! > ! = 0,05 Je zult nu in je GRM moeten ingeven dat !! = !"#$%&'((233, 0.25, !) en dan in de tabel zoeken naar de eerste waarde van ! waarvoor !! > 0,05. Het blijkt dat dit bij ! = 48 is. Uiteraard kan dat ook opgelost worden met !! = 0,05 en dan iets als CALC intersect.
Dit houdt in dat als er in de steekproef 48 of meer dan 48 ‘allergiegevallen’ zijn, de overschrijdingskans boven de van te voren afgesproken acceptabele 5% komt en er dùs reden is te denken dat dit (waarschijnlijk) toeval is en dùs mogen we !! niet verwerpen, we trekken de tegenovergestelde conclusie. 8)
FIJNSTOF IN RELATIE TOT AUTISME (a)
!! : ! = 0,01 (de gedachte dat 1 op de 100 Nederlanders kampt met autisme) !! : ! > 0,01 (het idee dat dit meer is als je binnen 250m van een snelweg woont) Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
30
Nu weet je uiteraard niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “groot genoeg” is om !! te verwerpen.
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≥ ! !"# ! = 30000 !" ! = 0,01 = 1 − !"#$%&'( 30000, 0.01, ! − 1 waarbij ! uiteraard het aantal mensen in de steekproef is dat met autisme kampt. Deze kans moet minder worden dan de van te voren afgesproken acceptabele 5%. Je zult nu in je GRM moeten ingeven dat !! = 1 − !"#$%&'((30000, 0.01, ! − 1) en dan in de tabel zoeken naar de eerste waarde van ! waarvoor !! < 0,05. Het blijkt dat dit bij ! = 330 is. Uiteraard kan dat ook opgelost worden met !! = 0,05 en dan iets als CALC intersect.
De conclusie is dùs dat we !! moeten verwerpen (de verontruste moeders gelijk gaan geven) als we in de steekproef 330 of meer autisme-‐gevallen aantreffen, want dan is er een significant (vermoedelijk niet op toeval berustend, die kans is immers minder dan 5%) effect als je binnen 250 m van een snelweg woont (b)
!! : ! = 0,01 (1% of minder woont binnen 250 meter van de snelweg) !! : ! > 0,01 (meer dan 1% woont binnen 250 meter van de snelweg)
Nu weet je uiteraard weer niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “groot genoeg” is om !! te verwerpen.
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≥ ! !"# ! = 1500 !" ! = 0,01 = 1 − !"#$%&'( 1500, 0.01, ! − 1 waarbij ! het aantal mensen in de steekproef is dat binnen 250m van de snelweg woont (en niet het aantal mensen dat met autisme kampt, want dat hebben ze alle 1500 !!). Deze kans moet minder worden dan de van te voren afgesproken acceptabele 5%. Je zult nu in je GRM moeten ingeven dat !! = 1 − !"#$%&'((1500, 0.01, ! − 1) en dan in de tabel zoeken naar de eerste waarde van ! waarvoor !! < 0,05. Het blijkt dat dit bij ! = 23 is. Uiteraard kan dat ook opgelost worden met !! = 0,05 en dan iets als CALC intersect.
De conclusie is dùs dat we !! moeten verwerpen (de verontruste moeders gelijk gaan geven) als we in de steekproef 23 of meer mensen aantreffen die binnen 250 meter van de snelweg wonen.
9)
WISKUNDEDOCENT (a)
!! : ! = 0,8 (dit beweert jouw zeer gewaardeerde wiskundedocent) !! : ! < 0,8 (jij gelooft je docent niet)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≤ 55 !"# ! = 75 !" ! = 0,8 = !"#$%&'( 75, 0.8, 55 ≈ 0,10 waarbij ! uiteraard het aantal goede voorspellingen in de steekproef is. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
31
(b)
Dit is meer dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit steekproefresultaat (misschien wel) aan toeval te wijten is (die kans is ongeveer 10%) en dùs mogen we !! niet verwerpen, je docent krijgt gelijk.
!! : ! = 0,8 !! : ! < 0,8
Nu weet je uiteraard niet bij welke grenswaarde (die ik X noem) je moet besluiten dat de overschrijdingskans “groot genoeg” is om !! te verwerpen.
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nu ! ! ≤ ! !"# ! = 75 !" ! = 0,8 = !"#$%&'( 75, 0.8, ! > ! = 0,025 Je zult nu in je GRM moeten ingeven dat !! = !"#$%&'((75, 0.8, !) en dan in de tabel zoeken naar de eerste waarde van ! waarvoor !! > 0,025. Het blijkt dat dit bij ! = 52 is. Uiteraard kan dat ook opgelost worden met !! = 0,025 en dan iets als CALC intersect.
Dit houdt in dat als er 52 of minder dan 52 goede voorspellingen zijn, de overschrijdingskans boven de van te voren afgesproken acceptabele 2,5% komt en er dùs reden is te denken dat dit (waarschijnlijk) geen toeval is en dùs mogen we !! niet verwerpen, de docent krijgt ongelijk. Bij 53 of meer goede voorspellingen krijgt de docent wèl gelijk.
10)
BLOEDDRUK (a)
!! : ! = 0,5 (Dit beweert de arts: hoge bloeddruk is niet sexegebonden) !! : ! ≠ 0,5 (Vrouwelijke intuïtie zegt: dat geloof ik niet)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≥ 155 !"# ! = 280 !" ! = 0,5 = 1 − !"#$%&'( 280, 0.5, 154 ≈ 0,041 waarbij ! uiteraard het aantal vrouwen (met te hoge bloeddruk) in de steekproef is. Dit is weliswaar minder dan de van te voren afgesproken acceptabele 5%, maar omdat het !
hier een tweezijdige toets betreft is het meer dan ! = 2,5% (!!!) !
De conclusie móet dus zijn dat dit steekproefresultaat (misschien wel) aan toeval te wijten is (die kans is maar liefst ongeveer 4,1%) en dùs mogen we hier !! niet verwerpen, de arts (en niet zijn vrouw) krijgt gelijk. (b)
!! : ! = 0,5 (Dit beweert de arts: hoge bloeddruk is niet sexegebonden) !! : ! > 0,5 (Vrouwelijke intuïtie zegt: dat geloof ik niet)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nog steeds ! ! ≥ 155 !"# ! = 280 !" ! = 0,5 = 1 − !"#$%&'( 280, 0.5, 154 ≈ 0,041 waarbij ! uiteraard het aantal vrouwen (met te hoge bloeddruk) in de steekproef is. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
32
Dit is minder dan de van te voren afgesproken acceptabele 5%, de conclusie móet nú dus zijn dat dit steekproefresultaat (waarschijnlijk) niet aan toeval te wijten is (die kans is maar een luizige 4,1%) en dùs moeten we hier !! echt verwerpen, de vrouw van de arts (en haar intuïtie) krijgt gelijk. NB VERGELIJK HIER HEEL NAUWKEURIG DE OVEREENKOMSTEN EN VERSCHILLEN IN ZOWEL DE AANPAK ALS IN DE CONCLUSIES. WAT VALT JE DAN HET MEEST OP? 11)
KOFFER TE LAAT (a)
!! : ! = 150€ (dit beweren de vliegtuigmaatschappijen gemiddeld uit te keren) !! : ! < 150€ (volgens een reizigersorganisatie is het minder) De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier
! ! ≤ 140 !"# ! = 150 !" ! =
!"
!""
!"
= !"#$%&'() 0, 140, 150,
!""
≈ 0,00234 waarbij !
de gemiddelde uitkering aan een groep van 200 gedupeerde reizigers is, en waarbij je voor de waarde van ! rekening MOET houden met de ! − !"# !""# ℎ!" !"#$%%"&%".
Deze kans is kleiner dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit (hoogstwaarschijnlijk) geen toeval is (0,234% kans dat dat wel zo is) en dùs moeten we !! hier verwerpen, wat betekent dat de reizigersorganisatie gelijk krijgt en de conclusie is dat de vliegmaatschappij gemiddeld minder uitkeert dan ze beweert. (b)
!! : ! = 150€ (dit beweren de vliegtuigmaatschappijen gemiddeld uit te keren) !! : ! < 150€ (volgens een reizigersorganisatie is het minder)
Nu weet je uiteraard niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “groot genoeg” is om !! al dan niet te verwerpen.
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≤ ! !"# ! = 150 !" ! =
!"
!""
= !"#$%&'() 0, !, 150,
!"
!""
de gemiddelde uitkering aan een groep van 200 gedupeerde reizigers is. Je zult nu in je GRM moeten ingeven dat !! = !"#$%&'() 0, !, 150,
tabel zoeken naar de hoogste waarde van ! waarvoor !! < 0,025.
< 0,025 waarbij ! !"
!""
en dan in de
Het blijkt dat dit bij ! ≈ 143.1 is. WEET JE HET NOG?
DIT IS VEEL GEMAKKELIJKER TE VINDEN MET BEHULP VAN DE FANTASTISCHE FORMULE: !"#$%&' (!. !"#, !"#,
!"
!""
) ≈ !"#, !"
Dit betekent dat je bij een uitkering van gemiddeld €143,07 of meer de vliegtuigmaatschappijen gelijk moet geven omdat dàn de conclusie moet zijn dat dit Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
33
(hoogstwaarschijnlijk) toeval is (2,5% kans of meer dat dat zo is) en dùs mogen we !! dàn niet verwerpen. 12) a)
SMARTPHONES !! : ! = 0,8 (wat wij op school denken) !! : ! < 0,8 (de mening van de leerlingen)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≤ 46 !"# ! = 60 !" ! = 0,8 = !"#$%&'( 60, 0.8, 46 ≈ 0,31 waarbij ! uiteraard het aantal 'checkers' is in de steekproef. Dit is meer dan de van te voren afgesproken acceptabele 5% dus is de conclusie dat dit steekproefresultaat (misschien) aan toeval te wijten is (die kans is 31%) en dùs mogen we !! niet verwerpen, de leerlingen krijgen dus géén gelijk.
b)
!! : ! = 0,8 (wat wij op school denken)
!! : ! < 0,8 (de mening van de leerlingen)
Nu weet je uiteraard niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “klein genoeg” is om !! te verwerpen. De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nu ! ! ≤ ! !"# ! = 60 !" ! = 0,8 = !"#$%&'( 60, 0.8, ! < ! = 0,05 Je zult nu in je GRM moeten ingeven dat !! = !"#$%&'((60, 0.8, !) en dan in de tabel zoeken naar de eerste waarde van ! waarvoor !! < 0,05. Het blijkt dat dit bij ! = 42 is. Uiteraard kan dat ook opgelost worden met !! = 0,05 en dan iets als CALC intersect.
Dit houdt in dat als er in de steekproef 42 of minder dan 42 ‘checkers’ zijn, de overschrijdingskans onder de van te voren afgesproken acceptabele 5% komt en er dùs reden is te denken dat dit (waarschijnlijk) geen toeval is en dùs mogen we !! verwerpen, de leerlingen krijgen dan wèl gelijk. 13) a)
VERLIEFDHEID NA VAKANTIES !! : ! = 0,13 (dit denkt de trendwatcher) !! : ! > 0,13 (dit denken een paar zesdeklassers)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is
! ! ≥ 20 !"# ! = 89 !" ! = 0,13 = 1 − !"#$%&'( 89, 0.13, 19 ≈ 0,01 waarbij ! het aantal geïnterviewden is dat verliefd terugkeerde van een vakantie. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
34
Deze kans is minder dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit (waarschijnlijk) geen toeval is (er is namelijk maar 1% kans dat dat wèl het geval is) en dùs moeten we !! verwerpen, wat betekent dat de zesdeklassers dus gelijk krijgen, en die trendwatcher niet. (b)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nú
! ! ≥ 13 !"# ! = 89 !" ! = 0,13 = 1 − !"#$%&'( 89, 0.13, 12 ≈ 0,37
Deze kans is meer dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit steekproefresultaat (misschien) geen toeval is en dùs mogen we !! niet verwerpen, de trendwatcher krijgt dus gelijk.
(c)
In dit geval weet je niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “klein genoeg” is om !! te verwerpen.
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≥ ! !"# ! = 89 !" ! = 0,13 = 1 − !"#$%&'( 89, 0.13, ! − 1 < ! = 0,025
Je zou nu in je GRM kunnen ingeven dat !! = 1 − !"#$%&'((89, 0.13, ! − 1) en dan in de tabel zoeken naar de eerste waarde van ! waarvoor !! < 0,025 Het blijkt dat dit bij ! = 19 is. Uiteraard kan dat ook met !! = 0,025 en dan iets als CALC intersect.
Dit houdt in dat als er in de steekproef 19 of meer ‘verliefden’ zijn, de overschrijdingskans onder de van te voren afgesproken acceptabele 2,5% komt en er dùs reden is te denken dat dit (waarschijnlijk) geen toeval is (die kans was maar 0,019) en dùs mogen we !! verwerpen, de leerlingen krijgen dan gelijk. Die trendwatcher krijgt gelijk als we !! niet verwerpen, dus als er hoogstens 18 'verliefden' in de steekproef zijn.
14) EXAMENTRAINING a) !! : ! = 0,15 (dit denken wij, maar zie je in dat er 'eigenlijk' staat dat !! : ! ≥ 0,15) !! : ! < 0,15 (dan klopt onze gedachte niet)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is
! ! ≤ 7 !"# ! = 63 !" ! = 0,15 = !"#$%&'( 63, 0.15, 7 ≈ 0,253 waarbij ! het aantal ex-‐leerlingen is dat heeft deelgenomen aan een examentraining.
(b)
Deze kans is meer dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit (misschien gewoon) toeval was (een kans van 25,3%) en dùs mogen we !! niet verwerpen, wat betekent dat wij gelijk krijgen.
Dezelfde conclusie! Pas bij een overschrijdingskans van meer dan 25,3% (en dat niveau wordt wetenschappelijk veel te hoog gevonden) mag je ons ongelijk geven. Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
35
(c)
In dit geval weet je niet bij welke grenswaarde (die ik G noem) je moet besluiten dat de overschrijdingskans “klein genoeg” is om !! te verwerpen. De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is
! ! ≤ ! !"# ! = 63 !" ! = 0,15 = !"#$%&'( 63, 0.15, ! < 0,05 Met je GRM vind je dat ! = 4
Je moet ons gelijk geven als er minstens 5 leerlingen in de steekproef aangeven dat ze een examentraining hebben gevolgd.
15) FACEBOOK a) !! : ! = 3,5 (dit denken de leerlingen) !! : ! > 3,5 (dit denken de ouders)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≥ 3
!" !"
!"# ! = 3,5 !" ! =
!
!"#
= !"#$%&'() 3
!" !"
, 100, 3.5,
!
!"#
≈ 0,154
waarbij ! de tijd is die in deze groep van 150 leerlingen GEMIDDELD per week aan Facebook werd besteed. Overigens mag de bovengrens van 100 ook best (veel) groter of (iets) kleiner genomen worden en is het zo dat je voor de waarde van ! rekening MOET houden met de ! − !"# !""# ℎ!" !"#$%%"&%".
Deze kans is groter dan de van te voren afgesproken acceptabele 5% dus is de conclusie dat dit (misschien wel) toeval is (15% kans dat dat zo is) en dùs mogen we !! niet verwerpen, wat betekent dat de leerlingen gelijk krijgen, en de ouders niet. (b)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is nú
! ! ≥ 3
!" !"
!"# ! = 3,5 !" ! =
!
!""
= !"#$%&'() 3
!" !"
, 100, 3.5,
!
!""
≈ 0,048 waarbij
! in dit geval de tijd is die in deze groep van 400 gemiddeld per week aan Facebook werd besteed, wat er op neer komt dat je voor de waarde van ! wéér rekening MOET houden met de ! − !"# !""# ℎ!" !"#$%%"&%", !""# !" !"# ! = 400.
Deze kans is kleiner dan de van te voren afgesproken acceptabele 5% dus is de conclusie dat dit (waarschijnlijk) geen toeval is (4,8% kans dat dat wèl zo is) en dùs moeten we !! verwerpen, wat betekent dat de ouders in dit geval inderdaad gelijk moeten krijgen.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
36
16) STRENGE WISKUNDEDOCENT a) !! : ! = 6,4 (dit zou het ook bij mij moeten zijn) !! : ! < 6,4 (ik ben te streng)
De overschrijdingskans (de kans dat je !! ten onrechte verwerpt) is hier ! ! ≤ 5,9 !"# ! = 6,4 !" ! =
!,!
!"
= !"#$%&'() 0, 5.9, 6.4,
!,!
!"
≈ 0,03 waarbij !
het gemiddelde cijfer in een groep van 24 leerlingen is, waarbij je voor de waarde van ! rekening MOET houden met de ! − !"# !""# ℎ!" !"#$%%"&%".
Deze kans is groter dan de van te voren afgesproken acceptabele 2,5% dus is de conclusie dat dit (misschien wel) toeval is (3% kans dat dat zo is) en dùs mogen we !! niet verwerpen, wat betekent dat de leerlingen mij niet als 'te streng' mogen beschouwen op grond van dit resultaat. (b)
Omdat de overschrijdingskans van 0,03 nu kleiner is dan de drempel van 5% moet de conclusie precies 'andersom' zijn: we moeten !! verwerpen en dus 'ben ik (opeens wel) te streng' op grond van hetzelfde steekproefresultaat.
Dit materiaal is gemaakt gedurende de Leergang Wiskunde schooljaar 2013/14
37