STATISTIEK 1 - VERSIE A
MAT15303 – 1310 – 1
WAGENINGEN UNIVERSITEIT LEERSTOELGROEP MAT Tentamen Statistiek 1 (MAT-15303) 22 oktober 2013, 8.30-10.30 uur
DEZE PAGINA NIET vóór 8.30u OMSLAAN! START MET INVULLEN VAN NAAM, REGISTRATIENUMMER, ETC. OP HET ANTWOORDFORMULIER. CONTROLEER OF JE DE JUISTE VERSIE VAN HET ANTWOORDFORMULIER, DUS VERSIE A HEBT. Aanwijzingen: Het tentamen bestaat uit 25 meerkeuzevragen. Bij alle meerkeuzevragen is één van de vier gegeven antwoorden correct. Vul de antwoorden in met potlood. Elke vraag met géén of meer dan één zwart rondje wordt geheel fout gerekend. -
Op je tafel mag je uitsluitend de volgende zaken hebben liggen: Boek, studiewijzer, rekenmachine, zelfgemaakte handgeschreven samenvatting (één A4tje) en collegekaart. Mobiele telefoon is niet toegestaan!
-
Overhandig na afloop van het tentamen het antwoordformulier aan de surveillant.
-
Elke vraag weegt even zwaar mee voor het cijfer. De score wordt gecorrigeerd voor de gokkans. Het aantal goed beantwoorde vragen voor een voldoende wordt na het tentamen door de examinatoren vastgesteld. De eventueel behaalde 0.5-punt voor de eindopdracht van het practicum wordt bij het cijfer van het tentamen opgeteld (maximaal een 10).
-
De antwoorden van dit tentamen staan binnenkort op Blackboard (http://edu6.wur.nl bij MAT15303) Inzage Zodra de uitslag van het tentamen bekend is gemaakt, wordt op Blackboard aangegeven wanneer en waar het tentamen kan worden ingezien.
STATISTIEK 1 - VERSIE A
MAT15303 – 1310 – 2
MAT15303 – 1310 – 3
STATISTIEK 1 - VERSIE A
Opgave 1 Een veerpont vervoert wandelaars, fietsers, bromfietsers, personenauto’s en vrachtauto’s (vervoersmiddelen). Men is geïnteresseerd in het aantal personen per dag die van deze veerpont gebruik maken. In 2010 worden door een aselecte trekking 20 dagen gekozen. Op elk van deze dagen wordt het aantal personen geteld. De eenheden van dit onderzoek zijn: A B C D
Dagen Veerponten Personen Vervoersmiddelen
Opgave 2 In een groot Europees onderzoek wordt de groei van planten bestudeerd. Een belangrijke variabele is de totale bladoppervlakte van een plant. Deze bladoppervlakte wordt met behulp van een computersysteem automatisch gemeten. Het blijkt dat de positie van de plant in het computersysteem van groot belang is. Af en toe is de positie zo dat een groot blad van de plant gemist wordt door het computersysteem. Dit levert een sterk afwijkende waarde van de totale bladoppervlakte op. Men meet elke plant in 10 verschillende posities. Welke centrummaat en welke maat voor spreiding is het meest geschikt voor de 10 waarnemingen van de totale bladoppervlakte per plant? A B C D
centrummaat gemiddelde gemiddelde mediaan mediaan
maat voor spreiding standaardafwijking interkwartielafstand standaardafwijking interkwartielafstand
Informatie bij opgaven 3 t/m 5 Chris Horner heeft in 2013 op 41 jarige leeftijd de ronde van Spanje gewonnen. Voor een wielrenner is hij behoorlijk oud, wat speculaties oplevert over dopinggebruik. Om dit te pareren heeft hij zijn hematocrietwaarden (%) van dopingtests op internet gezet. Voor 2013 zijn dat de volgende waarden: 41.6
44.2
45.4
42.7
40.0
42.9
43.1
De maximale hematocrietwaarde die is toegestaan is 50 %. Wanneer een wielrenner daar boven komt wordt hij van doping beschuldigd. Opgave 3 Bereken de variantie van de hematocrietwaarden van Chris Horner in 2013. A B C D
1.61 1.74 3.02 2.59
Opgave 4 Stel dat de hematocrietwaarde op een willekeurig moment in het jaar van een bepaalde wielrenner normaal verdeeld is met een verwachting van 45 en een standaardafwijking van 2. Bereken de kans dat deze wielrenner van doping wordt beschuldigd. A B C D
0.006 0.106 0.143 0.994
STATISTIEK 1 - VERSIE A
MAT15303 – 1310 – 4
Opgave 5 Stel dat een zekere wielrenner van nature een vrij lage hematocrietwaarde heeft met een verwachting van 40%. De wielrenner besluit voor een belangrijke wedstrijd doping te gaan gebruiken. Met hoeveel kan hij zijn verwachte hematocrietwaarde verhogen, wanneer hij bereid is een risico van 10% te lopen om te worden betrapt op doping? In de berekeningen mag je ervan uitgaan dat hematocrietwaarde van de wielrenner normaal verdeeld is met een standaardafwijking van 2. Het antwoord ligt het dichtst bij: A 2.5 B 5.0 C 6.0 D 7.5 Opgave 6 Een groot zeilschip wordt verhuurd voor personeelsuitjes. Door weersomstandigheden (mist, te harde wind of bliksem) kan het schip niet altijd uitvaren en kan het personeelsuitje niet doorgaan. Op een willekeurige dag is de kans op mist gelijk aan 0.05, de kans op te harde wind is gelijk aan 0.05 en de kans op bliksem is gelijk aan 0.05. De gebeurtenis mist is disjunct met een te harde wind. Gebeurtenissen mist en bliksem zijn ook disjunct. De kans dat er zowel een te harde wind staat als dat het bliksemt is gelijk aan 0.04. Bereken de kans dat op een willekeurige dag het personeelsuitje door kan gaan: A 0.81 B 0.85 C 0.89 D 0.95 Informatie bij opgaven 7 en 8 Bij een verzekeringsmaatschappij kan men zich verzekeren tegen het niet doorgaan van een personeelsuitje. Deze verzekering dekt meer dan alleen niet uitvaren door het weer. Er wordt onderscheid gemaakt tussen voorzien (het personeelsuitje is van te voren afgezegd) en onvoorzien (personeel is al bij het schip aanwezig) niet doorgaan van het personeelsuitje. De kansverdeling van de kosten/baten (Euro’s) die de verzekeringsmaatschappij gebruikt, is gelijk aan: Mogelijkheden Kosten/baten (Euro) P(mogelijkheid)
Uitvaren 130 0.80
Niet uitvaren voorzien -370 0.15
Niet uitvaren onvoorzien -870 0.05
Opgave 7 Bereken de verwachte winst (in Euro’s), wanneer de verzekering 100 keer is afgesloten. A B C D
5 500 10400 20300
Opgave 8 De verzekeringsmaatschappij sluit 20 keer (onafhankelijk) deze verzekering af. De verzekeringsmaatschappij verwacht, op grond van de kansverdeling, dat het zeilschip 4 keer niet uit kan varen. Bereken de kans dat het zeilschip vaker dan verwacht niet kan uitvaren? A B C D
0.17 0.21 0.37 0.59
STATISTIEK 1 - VERSIE A
MAT15303 – 1310 – 5
Opgave 9 Een dominospel bestaat uit 28 stenen. Op beide helften van elke steen staat met ogen een getal aangegeven van nul tot en met zes. Van de 28 stenen zijn er 7 “dubbele”, waar op elke helft hetzelfde aantal ogen staat. Het spel begint met het (aselect) pakken van 6 stenen. Men wil de kans berekenen dat geen van de 6 stenen een “dubbele” is. Een student past de binomiale verdeling toe. Welke van de volgende uitspraken is juist? A B C D
De binomiale verdeling kan niet worden toegepast, omdat de kans op succes niet gelijk blijft. De binomiale verdeling kan niet worden toegepast, omdat alleen een kans wordt berekend op geen enkele dubbele. De binomiale verdeling kan niet worden toegepast, omdat n·π niet groter of gelijk is aan 5. De binomiale verdeling kan hier inderdaad worden toegepast.
Informatie bij opgaven 10 t/m 14 Gewone beschuiten worden verkocht in beschuitrollen van 13 stuks. Er zijn ook grotere, zogeheten “Twentsche beschuiten” die worden verkocht in zakken van 10 stuks. Vanzelfsprekend wegen beschuiten niet allemaal precies even veel. Het gewicht van een gewone beschuit is normaal verdeeld met een verwacht gewicht van 8.0 gram en een standaardafwijking van 0.6 gram. Het gewicht van een Twentsche beschuit is normaal verdeeld met een verwachting van 10.7 gram en een standaardafwijking van 0.9 gram. Zowel bij een rol gewone beschuit als bij een zak Twentsche beschuit kan het gebeuren dat de inhoud minder weegt dan de 100 gram die op de verpakking staat vermeld. In deze opgaven gaan we er vanuit dat het gewicht van beschuiten onafhankelijk is. Opgave 10 Bereken het gewicht dat door 10% van de gewone beschuiten wordt overschreden. A B C D
7.23 8.77 9.15 11.85
Opgave 11 Bereken de kans dat de inhoud van een zak Twentsche beschuit minder weegt dan 100 gram. A B C D
0.000 0.007 0.016 0.218
Opgave 12 Een fabrikant van gewone beschuit gaat ervan uit dat de machines voor productie van gewone beschuiten zo zijn ingesteld dat slechts 5% van de beschuiten te licht is. Een medewerker van deze fabriek heeft echter de indruk dat meer dan 5% van de beschuiten te licht is. Om zijn vermoeden te onderzoeken, pakt hij willekeurig 50 beschuiten. Van deze 50 beschuiten blijken er 10 te licht te zijn. De medewerker voert een exacte toets op een kans uit om te kijken of hij gelijk heeft of niet. Hij hanteert daarbij een significantieniveau van 0.01. Welke verdeling moet de medewerker gebruiken voor het berekenen van de P-waarde bij deze toets? A B C D
Bin(50, 0.05) Bin(50, 0.20) N(2.5, 0.042) N(0, 1)
STATISTIEK 1 - VERSIE A
MAT15303 – 1310 – 6
Opgave 13 De conclusie van het onderzoek is dat er is aangetoond dat meer dan 5% van de beschuiten te licht is. Dat betekent dat de P-waarde…………………….. A B C D
groter is dan 0.01 kleiner of gelijk is aan 0.01 groter is dan 0.05 kleiner of gelijk is aan 0.05
Opgave 14 De fabrikant zegt dat hij het niet eens is met de keuze van het significantieniveau van de medewerker en dat daarom de conclusie voor hem ongunstig is. Hij wil graag het gebruikelijke significantieniveau van 0.05. Welke bewering is juist? A B C D
De fabrikant heeft geen gelijk, want het significantieniveau heeft helemaal niets te maken met de belangen van de fabrikant. De fabrikant heeft geen gelijk, de keuze van de medewerker geeft juist minder kans op een voor de fabrikant nadelige conclusie. De fabrikant heeft gelijk, want de P-waarde wordt groter bij een groter significantieniveau. Geen van de antwoorden A, B of C is juist.
Opgave 15 Uit een zeer groot onderzoek is gebleken dat Amsterdammers redelijk eerlijk zijn. Bij een portemonnee test, waarbij een portemonnee met diverse pasjes en 40 euro op straat werd gelegd, brengt 60% van de vinders de portemonnee naar de politie. Een onderzoeker is geïnteresseerd hoe eerlijk een willekeurige bezoeker van de PC Hooftstraat is ten opzichte van een willekeurige Amsterdammer. Op voorhand heeft hij geen idee of de bezoekers van de PC Hooftstraat eerlijker zijn of juist niet. Op willekeurige dagen en tijdstippen legt de onderzoeker 8 keer een portemonnee op het trottoir van de PC Hooftstraat. Geen van de portemonnees blijkt naar de politie gebracht te worden. Laat π de kans zijn dat een willekeurige bezoeker de portemonnee niet naar de politie brengt. De onderzoeker zal de volgende nul- en alternatieve hypothese formuleren: A B C D
H0: π = 0.40 H0: π = 0.40 H0: π = 0.60 H0: π = 0.60
en en en en
Ha: π ≠ 0.40 Ha: π > 0.40 Ha: π ≠ 0.60 Ha: π < 0.60
Informatie bij opgaven 16 t/m 19 Een autofabrikant claimt dat hoogstens 8% van zijn auto’s één of ander defect heeft. Bij een grote kwaliteitscontrole worden 300 auto’s aselect geselecteerd. Van deze auto’s blijken er 30 een defect te hebben. De fractie auto’s van deze fabrikant met één of ander defect noemen we π. Wanneer we het ongelijk van de fabrikant willen aantonen hebben we de volgende hypothesen nodig: H0: π = 0.08 en Ha: π > 0.08. Opgave 16 Bereken de uitkomst van de toetsingsgrootheid van een benaderende z-toets. A B C D
-1.28 0.10 1.28 81.52
STATISTIEK 1 - VERSIE A
MAT15303 – 1310 – 7
Opgave 17 Stel dat de uitkomst van de toetsingsgrootheid van een benaderende toets gelijk is aan 0.7. Bereken de Pwaarde. A B C D
0.52 0.30 0.24 0.48
Opgave 18 Wanneer de nulhypothese waar is, kan het aantal auto’s met een defect in een willekeurige steekproef van 300 auto’s variëren tussen …… en …….. Gebruik de empirical rule met een percentage van 95%. A B C D
tussen 19 en 29 auto’s met een defect tussen 25 en 35 auto’s met een defect tussen 15 en 33 auto’s met een defect tussen 23 en 25 auto’s met een defect
Opgave 19 In een nieuw onderzoek met 150 auto’s blijkt dat de steekproeffractie auto’s met een defect gelijk is aan 0.09. De P-waarde van de toets bij dit nieuwe onderzoek zal …………. de P-waarde in het beschreven onderzoek met 300 auto’s. A B C D
groter zijn dan kleiner zijn dan gelijk zijn aan kun je met deze informatie niets over zeggen
Informatie bij opgaven 20 en 21 In een onderzoek wordt gemeten hoeveel wortels (in grammen) kleine kinderen eten tijdens één warme maaltijd. Stel dat de hoeveelheid wortels die kinderen bij één warme maaltijd eten een verwachtingswaarde van 90 gram en een standaardafwijking van 40 gram heeft. Opgave 20 Geef de kansverdeling van de hoeveelheid gegeten wortels, gemiddeld over vier willekeurige gekozen kinderen. A B C D
Kan op basis van deze gegevens niet bepaald worden, want de Centrale Limiet Stelling kan in dit geval niet toegepast worden. N(90, 20), de Centrale Limiet Stelling is hiervoor niet nodig. N(90, 20), op grond van de Centrale Limiet Stelling. N(90, 10), op grond van de Centrale Limiet Stelling.
Opgave 21 Om het onderzoek te kunnen vergelijken met een ander onderzoek wordt de hoeveelheid gegeten wortels niet meer uitgedrukt in gram maar in kilogram (1000 gram). Verandert de variantie wanneer de hoeveelheid gegeten wortels niet meer in gram maar in kilogram wordt uitgedrukt? A B C D
Nee, variantie verandert niet Ja, variantie moet vermenigvuldigd worden met 1000 Ja, variantie moet gedeeld worden door 1000 Ja, variantie moet gedeeld worden door 1000000
STATISTIEK 1 - VERSIE A
MAT15303 – 1310 – 8
Opgave 22 Stel men heeft de volgende nul- en alternatieve hypothese H0: = 0.5 en Ha: ≠ 0.5 in een exacte binomiale toets, waarbij de succeskans is. In een simulatie, waarbij de succeskans gelijk is aan 0.5, wordt 50 keer deze toets uitgevoerd met telkens 20 (gesimuleerde) waarnemingen. Het significantieniveau = 0.05. De theoretische verdeling van het aantal keer dat, in deze simulaties, de nulhypothese verworpen wordt, ligt dicht in de buurt van: A B C D
Bin(50, 0.5) Bin(50, 0.05) Bin(20, 0.5) Bin(20, 0.05)
Opgave 23 Stel dat op een universiteit 60% van de studenten vrouw is en dat 40% van alle studenten (zowel mannen als vrouwen) Bos- en Natuurbeheer studeert. Het percentage van de studenten dat vrouw is en Bos- en Natuurbeheer studeert is 34%. Op grond van de informatie van deze universiteit mogen we concluderen dat: A B C D
‘vrouw’ en ‘studeren van Bos- en Natuurbeheer’ onafhankelijke gebeurtenissen zijn. ‘vrouw’ en ‘studeren van Bos- en Natuurbeheer’ disjuncte gebeurtenissen zijn. ‘vrouw’ en ‘studeren van Bos- en Natuurbeheer’ consistente gebeurtenissen zijn. Geen van de antwoorden A, B of C is juist.
Opgave 24 Honden met heupdysplasie hebben te veel speling tussen de kom van het heupgewricht in het bekken en de kop van het dijbeen. Als gevolg hiervan kan een ernstige vorm van gewrichtsontsteking (artritis) ontstaan. In principe kan elke hond hier last van krijgen, maar heupdysplasie komt het meest voor bij allerlei grote rassen zoals de Duitse Herder, de Rottweiler etc. Men vermoedt dat 45% van de volwassen Duitse Herders heupdysplasie heeft. In een onderzoek naar de fractie volwassen Duitse Herders met heupdysplasie () hebben 10 van de 18 aselect gekozen volwassen Duitse Herders heupdysplasie. Het significantieniveau = 0.05. De P-waarde van een exacte toets voor H0: π = 0.45 en Ha: π ≠ 0.45 is (antwoord afgerond op 4 decimalen): A B C D
0.2527 0.5054 0.8720 ‘andere waarde’
Opgave 25 Op basis van lange ervaring weet een vertegenwoordiger dat zijn auto bij een dagelijkse rit een benzineverbruik per 100 km heeft dat Normaal verdeeld is met verwachting 7.5 liter en een standaardafwijking van 0.6 liter. De vertegenwoordiger moet volgende week van maandag tot en met vrijdag weer zijn dagelijkse ritten maken. Deze 5 ritten zijn nagenoeg even lang. Het benzineverbruik in deze 5 ritten mag onafhankelijk verondersteld worden. Bereken de kans dat het gemiddeld benzineverbruik onder de 7.9 liter per 100 km ligt. A B C D
0.068 0.252 0.748 0.932