herkansing Methoden van Onderzoek en Statistiek, 6 juli 2012 – versie 1 – Vraag 1 Een onderzoeker gebruikt een experimenteel design om een hypothese te toetsen over het gemiddelde in de populatie. Hiertoe trekt hij een steekproef uit deze populatie en berekent in deze steekproef het gemiddelde. Wat is de parameter waar de onderzoeker in geïnteresseerd is? 1. Het design van het experiment 2. Het gemiddelde in de populatie 3. Het gemiddelde in de steekproef 4. De steekproeffluctuatie(‘samplingerror’)in the steekproef Vraag 2 Een onderzoeker onderzoekt de hypothese dat bij mannen een hoger testosterongehalte in het bloed (gemeten in milliliter testosteron per liter bloed) leidt tot het vertonen van meer risicogedrag. De aard van de twee in deze hypothese genoemde variabelen staat hieronder beschreven. I. ‘risicogedrag’ is de verklarende variabele (onafhankelijke variabele). II. ‘testosteron gehalte’ is een discrete numerieke variabele Welke beschrijving is juist? 1. Alleen beschrijving I is juist. 2. Alleen beschrijving II is juist. 3. Beschrijving I en II zijn beide juist. 4. Beschrijving I en II zijn beide NIET juist. Vraag 3 Welk van de onderstaande onderzoeken is experimenteel onderzoek? 1. Een onderzoeker kijkt naar het verschil in bloeddruk tussen een groep mannelijke proefpersonen en een groep vrouwelijke proefpersonen. 2. Een onderzoeker bepaalt het verband tussen IQ en hersenomvang bij een groep eerstejaars studenten. 3. Een onderzoeker vergelijkt twee random samengestelde groepen basis- schoolleerlingen die hebben leren rekenen volgens twee verschillende rekenmethoden. 4. Een onderzoeker vergelijkt de hoeveelheid ammoniak die in de grondzittussen verschillende grote steden. Vraag 4 Welke definitie hoort bij de term ‘pseudoreplication’? 1. Een systematische discrepantie tussen de schatting en de populatiewaarde 2. Een collectie van individuen die makkelijk beschikbaar zijn voor de onderzoeker 3. Wanneer twee gebeurtenissen niet tegelijkertijd kunnen plaatsvinden. 4. Wanneer individuele metingen niet onafhankelijk zijn maar wel als zodanig worden behandeld.
Vraag 5 Een grote studie toont een positief verband aan tussen een verhoogde BMI (body mass index) en de kans op een depressie. Een onderzoeker concludeert dat overgewicht de kans op een depressie verhoogt. Hieronder staan twee mogelijke kritieken op deze conclusie. I. Een ‘confounding variable’ kan verantwoordelijk zijn voor dit verband. II. Een correlatie zegt niets over causaliteit,het verband kan ook omgekeerd zijn. Welke kritiek is aannemelijk? 1. Alleen kritiek I is aannemelijk. 2. Alleen kritiek II is aannemelijk. 3. Kritiek I en II zijn beide aannemelijk. 4. Kritiek I en II zijn beide NIET aannemelijk. Vraag 6 Wat houdt het in als in een onderzoek naar de effectiviteit van een nieuwe medicijn een ‘placebo effect’ optreedt? 1. Door het placebo effect wordt de werking van het nieuwe medicijn in de experimentele groep overschat. 2. Door het placebo effect wordt de werking van het nieuwe medicijn in de experimentele groep onderschat. 3. Door het placebo effect wordt de werking van het nieuwe medicijn in de experimentele groep onderdrukt. 4. Door het placebo effect wordt de werking van het nieuwe medicijn in de experimentele groep versterkt. Vraag 7 Ik deel een groep proefpersonen op in 3 subgroepen op basis van hun gewicht (licht, middel, of zwaar). Vervolgens wijs ik binnen elke subgroep elke proefpersoon toe aan een placebogroep óf een ‘treatment’-groep. Hoe heet dit design? 1. Een ‘balanced design’ 2. Een ‘blocking design’ 3. Een‘paired design’ 4. Een‘factorial design’
Vraag 8 Beschouw onderstaande funnel plot.
Hieronder staan twee mogelijke conclusies over deze funnel plot. I. Er is sprake van ‘publication bias’ II. Over alle studies genomen is er sprake van een effect Welke van deze conclusies is juist? 1. Alleen conclusie I is juist. 2. Alleen conclusie II is juist. 3. Conclusie I en II zijn beide juist. 4. Conclusie I en II zijn beide NIET juist. Vraag 9 Wanneer is het verstandig om een Bonferroni correctie op het significantieniveau te overwegen? 1. Als je een lage statistische power hebt om een bepaalt effect aan te tonen. 2. Als je een bepaalt effect éénzijdig wilt toetsen in plaats van tweezijdig. 3. Als je meerdere toetsen uitvoert om een bepaalt effect aan te tonen. 4. Als de standaardfout van een parameterschatting erg hoog is Vraag 10 Welke regel is van toepassing op de constructie van een histogram: 1. Op de verticale as staat altijd de relatievefrequentie. 2. De variabele op de horizontale as moet numeriek zijn. 3. Er moet tussen ruimte zijn tussen de staafjes. 4. De verticale as hoeft niet bij nul te beginnen.
Vraag 11 In figuur 1 is een puntgrafiek (scatter plot) te zien van het verband tussen de repons- variabele “cholesterolgehalte” en de verklarende variabele “gewicht”. De figuur bevat in de linker bovenhoek een duidelijke outlier, aangegeven met een pijl. Over deze figuur worden twee beweringen gedaan: I. De outlier moet uit de dataset verwijderd worden II. “Gewicht” moet op de verticale as staan Welke bewering is waar? 1. Alleen bewering I is waar. 2. Alleen bewering II is waar. 3. Bewering I en II zijn beide waar. 4. Bewering I en II zijn beide NIET waar.
Figuur 1. Puntgrafiek (scatter plot) van het verband tussen cholesterolgehalte en gewicht. De eenheden en variabelen op de assen zijn weggelaten. Vraag 12 Onderstaande tekst komt uit het lab-journaal van een studente biomedische wetenschappen. De tekst is onderdeel van een beschrijving van een onderzoekje waarin de studente bijnieren van muizen moest los prepareren en wegen. “Ik heb de massa bepaald van 14 los geprepareerde bijnieren. Als variantie (A) van deze 14 massa’s vond ik 1.5 mg2. Het aantal vrijheidsgraden van deze variantie was (B). Op internet vond ik dat de standaardafwijking (C) van de bijnier-massa van muizen gelijk is aan 1.1. mg.” Wat moet er op de plaatsen A, B en C staan? 1. 2. 3. 4.
S2 S2 σ2 σ2
13 14 13 14
σ σ S S
Vraag 13 Uit de populatie van Y worden 5 steekproeven getrokken. Elke steekproef heeft omvang n=10. Van elke steekproef wordt de variantie bepaald. ! ! ! ! ! De aldus verkregen 5 steekproefvarianties 𝑆!! , 𝑆!! , 𝑆!! , 𝑆!! en 𝑆!! kunnen zelf beschouwd ! worden als steekproef met omvang n=5 uit de populatie van 𝑆! Met welk van onderstaande formules kun je de standaardafwijking van laatstgenoemde steekproef berekenen?
1.
2.
Vraag 14. Je werpt 3 achtvlaksdobbelstenen. Wat is de kans dat er van de 3 stenen precies 2 met hetzelfde aantal ogen boven blijven liggen? 1. 3/512 2. 3/56 3. 56/512 4. 168/512 Vraag 15 Een multiple choice tentamen bestaat uit 8 opgaven. Elke opgave heeft 4 antwoordmogelijkheden. Wat is de kans om 5 opgaven goed te hebben als alle antwoorden worden gegokt? 1. 0.0004 2. 0.0010 3. 0.0231 4. 5/8 Vraag 16 Een onderzoeker wil nagaan of het eten van chocola effect heeft op het geluksgevoel van mensen. Hij vraagt 30 chocola-eters en 25 nooit-chocola-eters om de mate waarin ze zich gelukkig voelen uit te drukken als een cijfer op een schaal van 0 tot 10 (met 0 = zeer ongelukkig, 10 = zeer gelukkig). Het gemiddelde cijfer van de chocola-eters blijkt lager te zijn dan het gemiddelde cijfer van de nooit-chocola-eters.
Hoe luiden de statistische hypothesen bij dit onderzoek? 1. H0:chocola-eters voelen zich even gelukkig als nooit-chocola-eters HA: chocola-eters voelen zich niet even gelukkig als nooit-chocola-eters 2. H0:chocola-eters voelen zich even gelukkig als nooit-chocola-eters HA: chocola-eters voelen zich minder gelukkig dan nooit-chocola-eters 3. H0:chocola-eters voelen zich niet even gelukkig als nooit-chocola-eters HA: chocola-eters voelen zich even gelukkig als nooit-chocola-eters 4. H0:chocola-eters voelen zich niet even gelukkig als nooit-chocola-eters HA: chocola-eters voelen zich minder gelukkig dan nooit-chocola-eters Vraag 17 Een onderzoeker test de werking van twee antibiotica (A en B) bij de bestrijding van blaasontsteking. Een groot aantal vrouwen met blaasonsteking krijgt via random toewijzing ofwel antibioticum A ofwel antibiticum B toegediend. Vervolgens wordt vastgesteld na hoeveel dagen er in de urine geen verwekkers van blaasontsteking meer aantoonbaar zijn (de ziekteduur). Bij de vrouwen die antibioticum A hebben gekregen blijkt de ziekteduur gemiddeld korter te zijn dan bij de vrouwen die antibioticum B hebben gekregen. Toetsing van de twee gemiddeldes met een two sample t-test geeft een P- waarde van 0.1285. Welke conclusie is gerechtvaardigd? Op grond van dit experiment... 1. is erg een reden om aan te nemen dat de ziekteduur bij gebruik van antibiotica A en B gelijk is. 2. is erg een reden om aan te nemen dat de ziekteduur bij gebruik van antibiotica A en B verschillend is. 3. is er reden om aan te nemen dat de ziekteduur bij gebruik van antibiotica A en B gelijk is. 4. is er reden om aan te nemen dat de ziekteduur bij gebruik van antibiotica A en B verschillend is. Vraag 18 Onlangs was in de Volkskrant te lezen dat bij 2% van de mensen bij wie een tumor wordt ontdekt, deze tumor veroorzaakt is door straling van onderzoeksapparaten. Hoe groot is de kans dat bij minimaal 4 van de 100 patiënten bij wie er een tumor wordt ontdekt, deze tumor veroorzaakt is door straling van onderzoeksapparaten? 1. 0.0508 2. 0.1410 3. 0.8590 4. 0.9492
Vraag 19 Medewerkers van een opwerkingsfabriek staan gedurende hun werktijd bloot aan radioactieve straling. Een onderzoeker meent dat daardoor bij deze medewerkers afwijking A meer zal voorkomen dan bij de rest van de bevolking. Hij onderzoekt 150 medewerkers van een opwerkingsfabriek en treft afwijking A aan bij 3 medewerkers. Normaalgesproken komt afwijking A voor bij 1 op de 100 mensen. Waartoe leidt statistische analyse van deze resultaten? 1. De nulhypothese p=0.01 kan niet verworpen worden. 2. De nulhypothese p=0.01 kan verworpen worden. 3. De nulhypothese p=0.02 kan niet verworpen worden. 4. De nulhypothese p=0.02 kan verworpen worden. Vraag 20 Er worden per dag gemiddeld 3 mobiele telefoons gestolen in Amsterdam. Wat is de kans dat er in Amsterdam in 3 dagen tijd 12 mobiele telefoons worden gestolen? 1. 0.0047 2. 0.0728 3. 0.1680 4. 0.5041 Vraag 21 Een onderzoeker kruist een erwtenplant die gladde, groene erwten heeft met een erwtenplant die gebobbelde, gele erwten heeft. Deze kruising levert nakomelingen met gladde, gele erwten.
Daarna kruist de onderzoeker deze gladde, gele erwten met zichzelf. De nakomelingen omvatten vier typen erwtenplanten in de volgende aantallen:
Met een chikwadraattoets voor passendheid (χ2 goodness-of-fit test) gaat de onderzoeker na of de verhouding tussen de gevonden aantallen afwijkt van de verwachte 9:3:3:1 verhouding. Welke waarde vindt de onderzoeker voor de toetsingsgrootheid (test statistic), en hoeveel vrijheidsgraden (degrees of freedom) heeft de verdeling van de toetsingsgrootheid? 1. TG=0.218,df=1 2. TG=0.218,df=3 3. TG=1.689,df=1 4. TG=1.689,df=3
Vraag 22 Een onderzoeker wil weten of er een verband is tussen rookgedrag en sporten. De onderzoeker vraagt 153 personen of ze roken en hoe vaak ze aan sport doen. In de tabel hieronder staan de resultaten.
Om zijn vraag te beantwoorden, voert de onderzoeker een toets uit. De toetsingsgrootheid (test statistic) neemt de waarde 6.43 aan. Wat is de nulhypothese van de toets die de onderzoeker uitvoert, en wordt deze nulhypothese verworpen? 1. De H0 luidt: “‘rookgedrag’ en ‘sportfrequentie’ zijn afhankelijke variabelen” en deze hypothese wordt niet verworpen. 2. De H0 luidt: “‘rookgedrag’ en ‘sportfrequentie’ zijn afhankelijke variabelen” en deze hypothese wordt verworpen op het 0.05 niveau. 3. De H0 luidt: “‘rookgedrag’ en ‘sportfrequentie’ zijn onafhankelijke variabelen” en deze hypothese wordt niet verworpen. 4. De H0 luidt: “‘rookgedrag’ en ‘sportfrequentie’ zijn onafhankelijke variabelen” en deze hypothese wordt verworpen op het 0.05 niveau. Vraag 23 Hieronder staat een tabel met informatie over het aantal individuen bij wie genezing optrad van een bepaalde ziekte na een medische behandeling. Ook staat in de tabel aangegeven hoeveel individuen in een onbehandelde groep genazen zonder medicatie.
Veronderstel dat je een odds ratio wilt gebruiken om na te gaan of de medische behandeling effectief was. Wat is, op grond van de data, de geschatte odds ratio? 1. OR = 0.54 2. OR = 1.05 3. OR = 1.12 4. OR = 1.21
Vraag 24 Slib van onvervuilde rivieren bevat gemiddeld 400 ppb cadmium met een standaardafwijking van 200 ppb. Wat is de kans dat het gehalte aan cadmium in een willekeurig slib-monster van een onvervuilde rivier hoger is dan 600 ppb? NB. Ga ervan uit dat het gehalte aan cadmium in rivierslib normaal verdeeld is. 1. vrijwel 0% 2. ongeveer 2.5% 3. ongeveer 5% 4. ongeveer 15% Vraag 25 Beschouw n variabelen Y, die allemaal de Poissonverdeling met μ=2 volgen. !!!!!!!!!⋯!!" Definiëer variabele X als X = ! Hieronder staan twee beweringen over X. Welke bewering is waar? 1. Alleen bewering I is waar. 2. Alleen bewering II is waar. 3. Bewering I en bewering II zijn beide waar. 4. Bewering I en bewering II zijn beide NIET waar. Vraag 26 Student’s t-verdeling en de standaardnormale verdeling lijken wat vorm betreft erg op elkaar, maar er zijn verschillen. Hieronder staat een bewering over deze verschillen. Bewering: De staarten van een Student’s t-verdeling zijn dunner/dikker dan de staarten van de standaardnormale verdeling en dus is de standaardafwijking van een Student’s t-verdeling kleiner/groter dan de standaardafwijking van de standaardnormale verdeling. Welke van de vet weergegeven termen zijn juist? 1. dunner en kleiner 2. dunner en groter 3. dikker en kleiner 4. dikker en groter. Vraag 27 Vrouwtjes van witte neushoorns leven in groepen. Deze groepen bestaan uit 6 tot 7 dieren. Een neushoorn-deskundige wilde weten hoe groot het leefgebied is van zo’n groep. Hij bepaalde bij 15 groepen de oppervlakte van het leefgebied. Het gemiddelde daarvan was 12.2 km2 en de standaardafwijking was 6.0 km2. Hoe luidt, uitgaande van deze gegevens, het 95% betrouwbaarheidsinterval van het verwachte leefgebiedoppervlak van een groep vrouwelijke witte neushoorns? 1. [8.88km2,15.52km2] 2. [8.90km2,15.50km2] 3. [9.16km2,15.24km2] 4. [9.47km2,14.93km2]
Vraag 28 Stel dat Y1 en Y2 normaal verdeelde variabelen zijn. Als je de nulhypothese H0: μy1=μy2 wilt toetsen, wanneer mag je de toetsingsgrootheid
1. Als de populatievarianties van Y1 en Y2 gelijk zijn. 2. Als de populatievarianties van Y1 en Y2 ongelijk zijn. 3. Als de steekproefvarianties van Y1 en Y2 gelijk zijn. 4. Als de steekproefvarianties van Y1 en Y2 ongelijk zijn. Vraag 29 Figuur a. toont de (niet normale) verdeling van onderzoeksdata. Figuur b. toont de (bij benadering normale) verdeling van de onderzoeksdata nadat deze getransformeerd zijn.
De verdeling in figuur b. werd verkregen door één van onderstaande transformaties toe te passen op de onderzoeksdata. Welke? 1. wortel-transformatie: Y’=√(Y+0.5) 2. reciproke transformatie: Y’=1/Y 3. log-transformatie: Y’=lnY 4. antilog-transformatie: Y’=eY Vraag 30 Bij 10 mensen wordt voor en na het gebruik van een bepaald ijzerbevattend voedingsmiddel de concentratie hemoglobine in het bloed vastgesteld. De metingen staan in de tabel hieronder. Tabel. Hemoglobine (Hb) concentratie (in mmol/l) bij 10 proefpersonen, voor en na gebruik van een ijzerhoudend voedingsmiddel.
Wat is de juiste toets om na te gaan of de concentratie hemoglobine in het bloed verandert bij gebruik van het betreffende voedingsmiddel? NB. Ga ervan uit dat hemoglobine concentratie normaalverdeeld is. 1. t-toets voor twee steekproeven(two sample t-test) 2. Mann-Whitney U-toets 3. gepaarde t-toets(paired t-test) 4. tekentoets(sign test) Vraag 31 Populaties Y1, Y2 en Y3 zijn normaalverdeeld en hebben dezelfde variantie. Men beschikt over een steekproef uit elk van deze populaties. Aan de hand van deze steekproeven wordt de nulhypothese H0: µY1=µY2=µY3 getoetst met een one-way anova. Men vindt een P-waarde van 0.0387. Wat suggereert de gevonden P-waarde over de populatiegemiddeldes? 1. De populatie gemiddeldes zijn alle drie even groot. 2. De populatie gemiddeldes zijn niet alle drie even groot. 3. De populatie gemiddeldes zijn alle drie verschillend. 4. De populatie gemiddeldes zijn niet alle drie verschillend. Vraag 32 Bij een onderzoek naar het effect van de samenstelling van de anticonceptiepil op de bloeddruk werden 129 vrouwen in 3 gelijke groepen verdeeld. Elke groep kreeg een anticonceptiepil met een andere samenstelling. Na een jaar werd bij alle vrouwen de bloeddruk gemeten. De resultaten werden geanalyseerd met een one-way anova. Het bleek dat SS(between) = 120.00 en SS(error) = 4679.00. Welke P-waarde volgde hieruit? 1. P tussen 0.0500 en 0.2000 2. P tussen 0.2000 en 0.3000 3. P tussen 0.3000 en 0.6000 4. P tussen 0.6000 en 0.9500 Vraag 33 In elk van onderstaande spreidingsdiagrammen is de sterkte van de lineaire correlatiecoëfficiënt anders.
Als je de spreidingsdiagrammen op volgorde zou plaatsen van minst sterke lineaire correlatiecoëfficiënt naar sterkste lineaire correlatiecoëfficiënt, wat is dan die volgorde? 1. ABC 2. ACB 3.BAC 4. BCA