Vraag 1. Welk design bevat geen random assignment: a) b) c) d)
Een design gebaseerd op ‘matching’ Een design gebaseerd op ‘blocking’ Een ‘factorial’ design Elk van de hierboven genoemde designs
Vraag 2. In een experiment met 3 between-subject factoren heb ik de volgende situatie: Factor A heeft 4 niveaus, Factor B heeft 2 niveaus en factor C heeft 3 niveaus. Hoeveel condities zijn er (ga er vanuit dat het design ‘fully crossed’ is)? a) b) c) d)
3 9 11 24
Vraag 3. De Bonferroni correctie op het significantie niveau (α) is gegeven door de volgende formule:
α* =
α aantal toetsen
Waarom wordt een Bonferroni correctie gebruikt? a) b) c) d)
Bij het gebruik van meerdere statistische toetsen vergroot de variantie van α. Bij het gebruik van meerdere statistische toetsen verkleint de variantie van α. Bij het gebruik van meerdere statistische toetsen vergroot de kans op een Type I fout. Bij het gebruik van meerdere statistische toetsen verkleint de kans op een Type I fout.
Vraag 4. Bekijk de volgende definitie: ‘Het verschil tussen het ware effect en het gemiddelde effect zoals dat is gepubliceerd in de literatuur’. Welk begrip wordt hier bedoeld? a) b) c) d)
‘Confounding’ ‘Observer bias’ ‘Publication bias’ ‘Experimental artifacts’
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 5. Bij een groep proefpersonen manipuleert een onderzoekster 2 variabelen. Variabele A krijgt 3 niveaus, variabele B krijgt 6 niveaus. Ze wil de invloed van haar manipulaties onderzoeken in een ‘between-subject design’ dat ‘fully crossed’ is. Hoeveel condities moet de onderzoekster gebruiken? a) b) c) d)
2 condities 4 condities 9 condities 18 condities
Vraag 6. Wanneer is er sprake van een ‘balanced design’? a) b) c) d)
Wanneer de varianties binnen de condities van het experiment gelijk zijn. Wanneer elke factor in het design evenveel niveaus heeft. Wanneer er evenveel meetwaarden in elke conditie van het experiment zitten. Wanneer het design 2 factoren heeft (in plaats van 1).
Vraag 7. In het boek wordt het gebruik van ‘data dredging’ besproken. Dit houdt in dat er meerdere statistische tests worden uitgevoerd in de hoop dat er tenminste één een significant resultaat oplevert. Wat is het gevolg van ‘data dredging’? a) b) c) d)
Door meerdere toetsen uit te proberen wordt de aanname van normaliteit geschonden. Door meerdere toetsen uit te proberen vergroot de kans op een Type I fout. Door meerdere toetsen uit te proberen is er sprake van pseudoreplicatie. Door meerdere toetsen uit te proberen wordt de steekproefgrootte kunstmatig verhoogd. De daadwerkelijke steekproef is kleiner.
Vraag 8. Waar wordt een ‘funnel plot’ voor gebruikt? a) b) c) d)
Om een indicatie te krijgen van de groepsverschillen op een gegeven afhankelijke variabele. Om een indicatie te krijgen van de mate waarin er sprake is van publication bias. Om een indicatie te krijgen van de spreiding binnen één individu op een herhaalde meting. Om een indicatie te krijgen van de precisie van een bepaalde schatter.
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 9 Lichaamstemperatuur van gezonde mensen is normaalverdeeld met gemiddelde van 36.8 °C en een standaarddeviatie van 0.35 °C. Wat is de kans op een lichaamstemperatuur die lager is dan 36.0 °C? a) P < 0.01 b) 0.01 < P < 0.02 c) 0.02 < P < 0.05 d) P > 0.05
Vraag 10 Geboortegewicht is normaalverdeeld met gemiddelde 3339 gram en standaardafwijking 573 gram. Een baby moet uit voorzorg in de couveuse als ze tot de 1% lichtste baby’s behoort. Onder welk grensgewicht moet een baby in de couveuse? a) Minder dan 1.7 kg. b) Minder dan 1.8 kg. c) Minder dan 1.9 kg. d) Minder dan 2.0 kg.
Vraag 11 IQ is normaal verdeeld met gemiddelde 100 en standaarddeviatie 15. Welk deel van de populatie zal een IQ hebben van 119 of hoger? a) Ongeveer 5 procent b) Ongeveer 10 procent c) Ongeveer 15 procent d) Ongeveer 20 procent
Vraag 12 De lengte van kinderen bij de geboorte is normaalverdeeld met een gemiddelde van 52 cm en een variantie van 1.5 cm2. Hoe groot is de kans dat de gemiddelde lengte van (een willekeurig samengestelde groep van) 6 pasgeboren baby’s ligt tussen de 51 en 53 cm? a) b) c) d)
0.4950 0.5858 0.8975 0.9545
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 13 Een onderzoeker wil testen of de lengte van vrouwen uit België afwijkt van de lengte van vrouwen uit Nederland. De gemiddelde lengte van vrouwen uit Nederland is 169.6 cm. De onderzoeker bepaalt de lengte van 100 (aselect gekozen) Belgische vrouwen en vindt een gemiddelde lengte van 168.9 cm met een standaardafwijking van 3.4 cm. Lichaamslengte is een normaalverdeelde variabele. Wat is de juiste conclusie op grond van deze van deze steekproef? a) P=0.021; de nulhypothese dat Belgische vrouwen dezelfde lengte hebben als Nederlandse vrouwen wordt verworpen (P < 0.05). b) P=0.042; de nulhypothese dat Belgische vrouwen dezelfde lengte hebben als Nederlandse vrouwen wordt verworpen (P < 0.05). c) P=0.42; de nulhypothese dat Belgische vrouwen dezelfde lengte hebben als Nederlandse vrouwen wordt niet verworpen (P > 0.05). d) P=0.84; de nulhypothese dat Belgische vrouwen dezelfde lengte hebben als Nederlandse vrouwen wordt niet verworpen (P > 0.05).
Vraag 14 Beschouw de volgende twee beweringen: I. De Student’s t-verdeling gaat bij een toenemend aantal vrijheidsgraden steeds meer lijken op de standaardnormale verdeling. II. Bij een klein aantal vrijheidsgraden is de Student’s t-verdeling asymmetrisch. Welke beweringen zijn waar? a) Alleen bewering I is waar b) Alleen bewering II is waar c) I en II zijn beide waar d) I en II zijn beide niet waar Vraag 15 Staartlengte van zwarte ratten (rattus rattus) is normaal verdeeld. Een onderzoeker bepaalt bij een steekproef van 9 ratten de staartlengte en vindt een gemiddelde van 15.20 cm met een standdaardeviatie van 2.19 cm. Wat is op grond van deze data het 99% betrouwbaarheidsinterval voor het populatiegemiddelde µ? a) 9.56 < µ < 20.84 b) 12.75 < µ < 17.65 c) 12.83 < µ < 17.57 d) 13.32 < µ < 17.08
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 16 Wat is de juiste interpretatie van het betrouwbaarheidsinterval bij de voorgaande vraag? a) Er is 99% kans dat het populatiegemiddelde tussen beide grenswaarden ligt b) In 99% van de steekproeven zal het gevonden betrouwbaarheidsinterval het populatiegemiddelde bevatten c) Er is 99% kans om een steekproefgemiddelde tussen beide grenswaarden te vinden d) Geen van bovengenoemde interpretaties is juist
Vraag 17 Het enzym lactaatdehydrogenase (LDG) komt voor in spiercellen, bloedcellen en huidcellen. Het zet koolhydraten om in melkzuur (lactaat). Hieronder staan de resultaten van een studie naar de LDGconcentratie in de rode bloedcellen van mannen en vrouwen (met X: ‘lactaatdehydrogenaseconcentratie’).
n X-streep S
Mannen 270 60 11
Vrouwen 264 57 10
Met een T-toets kun je nagaan of er verschil is tussen de LDG-concentratie van mannen en vrouwen. Als je die toets uitvoert, wat is dan de TG-waarde en wat is de conclusie? a) TG=3.30; er is geen reden om aan te nemen dat de LDG-concentratie van mannen en vrouwen verschilt. b) TG=3.30; het lijkt erop dat de LDG-concentratie van mannen en vrouwen verschilt. c) TG=10.70; er is geen reden om aan te nemen dat de LDG-concentratie van mannen en vrouwen verschilt. d) TG=10.70; het lijkt erop dat de LDG-concentratie van mannen en vrouwen verschilt.
Vraag 18 Wat stelt de ‘pooled variance’ voor? a) Het gemiddelde van de steekproefvarianties b) De variantie van de steekproefgemiddeldes c) Het gewogen gemiddelde van de steekproefvarianties d) De gewogen variantie van de steekproefgemiddeldes
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 19 Op een groep van 25 proefpersonen wordt een nieuw medicijn getest. Een controlegroep van 19 proefpersonen krijgt een placebo. Een onderzoeker vermoedt dat het medicijn de spreiding van een bepaalde bloedwaarde beïnvloedt. De variantie van deze bloedwaarde is 0.9 in de groep die het medicijn slikt en 1.8 in de groep die de placebo slikt. De onderzoeker voert een F-test uit voor gelijke varianties. Welk van onderstaande kansen correspondeert met de P-waarde? a) b) c) d)
P = P(F(24,18) ≤ 0.5) P = P(F(24,18) ≥ 2) P = 2 * P(F(18,24) ≤ 0.5) P = 2 * P(F(18,24) ≥ 2)
Vraag 20 Iemand wil de nulhypothese H0: σA2= σB2 toetsen tegen de alternatieve hypothese HA: σA2≠ σB2 A en B zijn normaalverdeelde variabelen. Zowel uit A als uit B wordt een steekproef getrokken. Voor de steekproef uit A geldt: A-streep is 14.949, SA is 4.995 en nA is 10. Voor de steekproef uit B geldt: B-streep is 14.146, SB is 6.26 en nB is 12. Bereken de waarde die de bij deze nulhypothese te gebruiken TG aanneemt, en bepaal de bijbehorende P-waarde. De P-waarde is: a) 0.2535 b) 0.3733 c) 0.5071 d) 0.7465
Vraag 21 Beschouw de volgende twee uitspraken: I. De power van een non-parameterische toets is over het algemeen lager dan de power van een vergelijkbare parametrische toets II. Bij gepaarde data waarbij de verschillen tussen de meetwaardes niet normaal verdeeld zijn kan een tekentoets (sign test) toegepast worden Welke uitspraken zijn waar? a) Alleen bewering I is waar b) Alleen bewering II is waar c) I en II zijn beide waar d) I en II zijn beide niet waar
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 22 Bij de Mann-Whitney U-test krijgt elke variabele uit de steekproeven een rang toegewezen. Per steekproef worden de rangen vervolgens opgeteld tot rangsom R Hieronder staan de samenstellingen van twee steekproeven. A: 11 19 10 B: 18 5 11
5 11 12 3 18 10
Welke rangsom verwacht je theoretisch voor steekproef A als de steekproeven uit populaties komen met dezelfde mediaan? a) b) c) d)
RA = 24 RA = 39 RA = 42 RA = RB , meer kun je er niet over zeggen
Vraag 23 Aan vier groepen van elk 15 personen wordt variabele Y gemeten. Het blijkt dat Y in de vier groepen niet normaalverdeeld is, maar √ Y wel. Welke toets heeft de voorkeur als je wilt nagaan of de ligging van deze vier groepen gelijk is? Neem aan dat er aan de voorwaarde voor gelijke variantie (ANOVA) of gelijke verdelingsvorm (KruskallWallis) is voldaan, zowel voor Y als voor √Y. a) ANOVA op de getransformeerde metingen b) ANOVA op de oorspronkelijke metingen c) Kruskall-Wallis op de getransformeerde metingen d) Kruskall-Wallis op de oorspronkelijke metingen
Vraag 24 Drie groepen muizen worden elk onder een verschillende stressvolle situatie geplaatst. Van elk muis wordt daarna het cortisol-gehalte in het bloed bepaald (cortisol is een stress-hormoon). Elke groep bestaat uit 5 muizen.De nulhypothese dat de groepen niet verschillen in het gemiddelde cortisolgehalte wordt met een ANOVA getoetst. Daarbij blijkt SSerror = 10 en SSgroups = 7. In welk interval valt de P-waarde? a) b) c) d)
P < 0.025 0.025 < P < 0.050 0.050 < P < 0.100 0.100 < P
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 25 In een onderzoek naar het effect van elektromagnetische velden op de menselijke gezondheid, warden 7 groepen mensen elk gedurende een week blootgesteld aan een elektromagnetisch veld van een andere sterkte. Elke groep bestond uit 45 personen. Na afloop werd bij elk groepslid de serumconcentratie adrenaline vastgesteld. De metingen werden met een één-factor model variantieanalyse geanalyseerd. Welke verdeling volgde de toetsingsgrootheid? a) b) c) d)
F(6,314) F(6,308) F(6,44) F(6,38)
Vraag 26 Uit populatie X1 wordt de volgende steekproef getrokken: 3.8 5.2 5.1 5.1 3.4 Uit populatie X2 wordt de volgende steekproef getrokken: 6.1 7.4 9.0 6.7 6.8 Beide populaties zijn normaalverdeeld en hebben dezelfde variantie. Wat is de zuiverste schatter van deze (populatie)variantie? a) b) c) d)
MS(groups) MS(error) SS(erros) S2X1 + S2X2
Vraag 27 In een onderzoek naar het effect van suikerconsumptie (factor A) op bloedsuikergehalte (variabele X) worden 40 personen in 2 even grote groepen ingedeeld. Elke groep krijgt een andere hoeveelheid suiker te consumeren. Van elke groep wordt vervolgens het gemiddelde bloedsuikergehalte bepaald. Om de nulhypothese te toetsen dat suikerconsumptie geen effect heeft op bloedsuikergehalte, wordt een één-factor model variantieanalyse uitgevoerd. De resultaten daarvan zijn: SS(error) = 100.0 SS(groups)= 6.5 In welk interval ligt de waarde die de TG aanneemt? a) b) c) d)
0.00 tot <1.00 1.00 tot <2.00 2.00 tot <2.50 2.50 tot <3.00
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 28 Een onderzoeker bepaalt in een experimentele proef of er bij papegaaien samenhang bestaat tussen omgevingstemperatuur en de hoeveelheid dagelijks genuttigd voedsel. Hij vindt een lineaire correlatiecoëfficiënt tussen de variabelen ter grootte r = –0.36 op basis van 60 waarnemingen. Welke conclusie kan hieruit worden getrokken? a) b) c) d)
Het lijkt erop dat papagaaien minder eten als ze zich in een warmere omgeving bevinden (p<0.05). Het lijkt erop dat papagaaien meer eten als ze zich in een warmere omgeving bevinden (p<0.05). Er lijkt bij papegaaien geen samenhang te zijn tussen omgevingstemperatuur en de hoeveelheid dagelijks genuttigd voedsel (p>0.05). De spreiding in de hoeveelheid voedsel die papegaaien dagelijks eten is voor 36% te verklaren uit de samenhang die er bestaat met de omgevingstemperatuur.
Vraag 29 Hoe moet de correlatiecoëfficiënt van een eindige populatie (omvang n) worden berekend? a)
ρ=
∑ (X − µ
X
b)
ρ=
∑ (X − µ
X
c)
ρ=
∑ (X − µ
X
d) ρ =
)(Y − µY )
(n − 1) ⋅ s X ⋅ sY
)(Y − µY )
(n − 1) ⋅ σ X ⋅ σ Y )(Y − µY )
n ⋅ s X ⋅ sY
∑ (X − µ
X
)(Y − µY )
n ⋅σ X ⋅σY
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 30 Als je hasj rookt, komen er allerlei stofjes (cannabinoïden) in je lichaam die het zenuwstelsel beïnvloeden. Het is niet ondenkbaar dat hierdoor bepaalde hersenfuncties worden aangetast en dat dit uiteindelijk kan leiden tot verlaging van het IQ. Hieronder staan van 6 personen de gegevens omtrent langdurig dagelijks hasj gebruik en IQ. persoon hasj gebruik (g/dag) IQ
A 0.2 116
B 0.4 108
C 0.8 102
D 1.4 110
E 1.8 95
F 2.6 93
Wat is de lineaire correlatiecoëfficiënt voor hasj gebruik en IQ in deze steekproef? rekenhulp: ∑X=7.2; ∑X2=12.8; SX=0.912 (X: ‘hasj gebruik’) ∑Y=624; ∑Y2=65298; SY=8.967 (Y: ‘IQ’) ∑XY=714.8 a) b) c) d)
r = –0.69 r = –0.76 r = –0.83 r = –0.90
Vraag 31 Bij lineaire regressie van Y op X is het een voorwaarde dat de populatievariantie van Y hetzelfde is voor elke waarde van X. Welke mean square is een schatter van deze populatievariantie? a) MSresidual b) MSregression c) MStotal d) MSerror
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 32 Hieronder staat een scatter plot uit het boek (hoofdstuk 17). Het betreft gegevens van leeuwen. Op de horizontale (X) as staat de proportie zwarte pigment op de neus van de leeuw, op de verticale (Y) as staat de leeftijd van de leeuw. Zowel de lijn Y = Y als de regressielijn zijn aangegeven.
^
Y=0.88+10.65X Y=Y
Wanneer de nulhypothese H0: β=0 getoetst wordt tegen HA: β ≠0 vindt men een P-waarde van P=0.0000. Wat kun je daaruit opmaken over de regressie van leeftijd (Y) op proportie pigment (X) in werkelijkheid? a) b) c) d)
In werkelijkheid is er geen regressie (β =0) In werkelijkheid is er regressie met β >0 In werkelijkheid is er regressie met β =0.88 In werkelijkheid is er regressie met β =10.65
Oefententamen II, Methoden van Onderzoek en Basis Statistiek
Vraag 33
Bij lineaire regressie van Y op X gelden onder andere de volgende voorwaarden (boek, §17.5, p. 482): • At each value of X, the distribution of possible Y-values is normal. • The variance of Y-values is the same for all values of X. Om normaliteit en gelijkheid van varianties te onderzoeken, is het gebruikelijk om een residual plot te maken. Hieronder staat zo’n plot.
X Bewering I. De oriëntatie van de punten in het residual plot laat zien dat er waarschijnlijk geen sprake is van normaliteit zoals bedoeld in de voorwaarden. Bewering II. De orientatie van de punten in het residual plot laat zien dat er waarschijnlijk geen sprake is van gelijke varianties zoals bedoeld in de voorwaarden. Welke bewering is waar? a) b) c) d)
Alleen bewering I. Alleen bewering II. Bewering I en II zijn beide waar. Bewering I en II zijn beide niet waar.
Oefententamen II, Methoden van Onderzoek en Basis Statistiek