Opgaven hoofdstuk 16 Verdelingsvrije statistiek 16.1 Beschouw de volgende steekproef van 10 meetwaarden: LM15_4.DAT 8,4 16,9 15,8
10,3
4,9
12,9
9,8
23,7
7,3
Gebruik deze gegevens om elk van de volgende tekentoetsen uit te voeren met behulp van tabellen van de binomiale verdeling (Tabel II, Appendix B) en α = 0,05: a.
H 0 : η = 9 tegen H a : η > 9
b.
H 0 : η = 9 tegen H a : η ≠ 9
c.
H 0 : η = 20 tegen H a : η < 20
d.
H 0 : η = 20 tegen H a : η ≠ 20
e.
Herhaal elk van de voorafgaande toetsen, maar nu met gebruikmaking van de normale benadering voor de binomiale kansen. Vergelijk de resultaten.
f.
Welke aannames zijn nodig om de geldigheid van elk van de voorafgaande toetsen te garanderen?
16.2 Stel dat je de onderzoekshypothese wilt toetsen dat de mediaan van een populatie groter is dan 75. Je neemt een aselecte steekproef van 25 meetwaarden uit de populatie en je stelt vast dat 17 daarvan groter zijn dan 75. Stel een geschikte toets op en voer deze uit op het 0,10 significantieniveau. Vergeet niet alle noodzakelijke aannames te specificeren.
16.3 Een manier om de voordelen van een MBA-graad te beoordelen, is het onderzoeken welk salaris MBA-studenten een paar jaar na hun afstuderen krijgen. In 2008 schatte de Graduate Management Council dat het mediane salaris voor afgestudeerden van een full-time en prestigieuze MBA-opleiding vier jaar na afstuderen $96.000 bedroeg. Een aselecte steekproef van 50 afgestudeerden van de klas van 2006 van een bepaalde, prestigieuze MBA-opleiding werd een vragenlijst gestuurd, waarin hun gevraagd werd wat hun salaris in 2010 was. Er werden vijftien bruikbare antwoorden verkregen; 9 daarvan gaven een salaris groter dan $96.000 en 6 een salaris kleiner dan $96.000. a.
Specificeer welke nulhypothese en welke alternatieve hypothese gebruikt moeten worden om te toetsen of het mediane inkomen van afgestudeerden van de MBAopleiding groter was dan $96.000 in 2010.
b.
Voer de toets van a uit voor α = 0,05, en geef je conclusies in termen van de vraagstelling.
c.
Aan welke aannames moet voldaan zijn opdat je toets geldig is?
16.4 In het Journal of the American Mosquito Control Association wordt verslag gedaan van een onderzoek naar de bijterigheid van een bepaald soort vlieg. De bijterigheid wordt gedefinieerd als het aantal vliegen dat een vrijwilliger bijt gedurende een blootstelling van 15 minuten. Van deze vliegensoort is bekend dat deze een bijterigheid van 5 beten in de 15 minuten heeft op Stanbury Island, Utah. Men veronderstelt echter dat de mediane bijterigheid groter is bij helder zonnig weer. (Deze informatie is van belang voor de marketing van insectenbestrijdingsmiddelen.) Om deze theorie te toetsen, werden er 122 vrijwilligers op een zonnige dag op Stanbury Island blootgesteld aan de vliegen. Van deze vrijwilligers ondervonden 95 een bijterigheid die groter was dan 5. a.
Stel de nulhypothese en de alternatieve hypothese voor deze toets op.
b.
Bereken de benaderde overschrijdingskans [Aanwijzing: gebruik de normale benadering voor een binomiale kans.]
c.
Geef je conclusie voor α = 0,01.
16.5 Specificeer de toetsingsgrootheid en het kritieke gebied voor de toets van Wilcoxon voor twee onafhankelijke steekproeven in elk van de volgende situaties: a.
n 1 = 10, n 2 = 6, α = 0,10 H 0 : twee kansverdelingen, 1 en 2, zijn gelijk H a : de kansverdeling voor populatie 1 is ten opzichte van de kansverdeling voor populatie 2 naar links of naar rechts verschoven.
b.
n 1 = 5, n 2 = 7, α = 0,05 H 0 : twee kansverdelingen, 1 en 2, zijn gelijk H a : de kansverdeling voor populatie 1 is ten opzichte van de kansverdeling voor populatie 2 naar rechts verschoven.
c.
n 1 = 9, n 2 = 8, α = 0,025 H 0 : twee kansverdelingen, 1 en 2, zijn gelijk H a : de kansverdeling voor populatie 1 is ten opzichte van de kansverdeling voor populatie 2 naar links verschoven.
d.
n 1 = 15, n 2 = 15, α = 0,05 H 0 : twee kansverdelingen, 1 en 2, zijn gelijk H a : de kansverdeling voor populatie 1 is ten opzichte van de kansverdeling voor populatie 2 naar links of naar rechts verschoven.
16.6 De onderzoekers J. Hann en R. Weber van de Universiteit van Queensland hebben een steekproef genomen van overheidsorganisaties en particuliere organisaties in Australië om de planning van de informatiesystemen-afdelingen van deze organisaties te onderzoeken. Als onderdeel van dat proces vroegen de onderzoekers aan elke organisatie uit de steekproef hoeveel deze in het voorafgaande belastingjaar had besteed aan informatiesystemen en techniek als percentage van de totale inkomsten van het bedrijf. De resultaten worden in de tabel gegeven. INFOSYS.DAT Private Publieke sector sector 2,58 5,40 5,05 2,55 0,05 9,00 2,10 10,55 4,30 1,02 2,25 5,11 2,50 12,42 1,94 1,67 2,33 3,33 a.
Hebben de twee populaties waaruit de steekproef is genomen gelijke kansverdelingen of ligt de verdeling voor de organisaties in de overheidssector in Australië rechts van de verdeling voor de bedrijven in de particuliere sector in Australië? Toets voor α = 0,05.
b.
Is de overschrijdingskans voor de toets kleiner of groter dan 0,05. Licht je antwoord toe.
c.
Aan welke aannames moet zijn voldaan opdat de test in a geldig is?
16.7 Een grote fabrikant van scheermesjes adverteert dat met zijn wegwerpscheerapparaat met dubbele mesjes ‘u zich veel vaker kunt scheren’ dan met elk wegwerpscheerapparaat met één mesje dat op de markt is. Een concurrerende firma die zeer succesvol is geweest met het verkopen van wegwerpscheerapparaten met één mesje, wil deze claim toetsen. Er worden onafhankelijke aselecte steekproeven genomen van acht gebruikers van enkele mesjes en acht gebruikers van dubbele mesjes, en het aantal keren dat de gebruiker zich kan scheren voordat hij aangeeft een nieuw scheermes te willen gebruiken wordt genoteerd. De resultaten worden in de tabel gegeven. RAXOR.DAT Dubbele Enkele mesjes mesjes 8 15 10 13 17 10 6 14 9 6 3 5 11 12 7 7
a.
Ondersteunen de gegevens de claim van de fabrikant van de dubbele mesjes? Gebruik α = 0,05.
b.
Denk je dat dit experiment optimaal was ontworpen? Zo niet, welk ontwerp zou dan beter zijn geweest?
c.
Welke aannames zijn nodig opdat de toets in a geldig is? Lijken deze aannames redelijk in dit geval?
16.8 Specificeer de toetsingsgrootheid en het kritieke gebied voor de rangtekentoets van Wilcoxon voor gepaarde waarnemingen in elk van de volgende gevallen: a.
n = 30, α = 0,10 twee kansverdelingen, 1 en 2, zijn gelijk H0: Ha: de kansverdeling voor populatie 1 is naar links of naar rechts verschoven ten opzichte van de kansverdeling voor populatie 2
b.
n = 20, α = 0,05 twee kansverdelingen, 1 en 2, zijn gelijk H0: Ha: de kansverdeling voor populatie 1 is naar rechts verschoven ten opzichte van de kansverdeling voor populatie 2
c.
n = 8, α = 0,005 H0: twee kansverdelingen, 1 en 2, zijn gelijk Ha: de kansverdeling voor populatie 1 is naar links verschoven ten opzichte van de kansverdeling voor populatie 2
16.9 Een onderzoek met gepaarde waarnemingen met n = 30 paren geeft als resultaat T + =354. a.
Specificeer de nulhypothese en de alternatieve hypothese die gebruikt moeten worden om een hypothesetoets uit te voeren om te bepalen of de kansverdeling voor populatie 1 rechts van die voor populatie 2 ligt.
b.
Voer de toets van a uit voor α = 0,05.
c.
Wat is bij benadering de overschrijdingskans van de toets in b?
d.
Welke aannames zijn nodig om de geldigheid van de toets in b te kunnen garanderen?
16.10 Een manier om medewerkers beter te motiveren en werkverzuim te voorkomen is om de aanwezigheid te regelen via flextime. Dit betekent dat werknemers zelf hun 40-urige werkweek mogen plannen, in overeenstemming met hun persoonlijke behoeften. Een groot bedrijf overweegt dit systeem ook in te voeren, maar houdt eerst een proef. Tien medewerkers worden willekeurig aangewezen en gevraagd een vragenformulier in te vullen over hun houding ten opzichte van het werk. Daarna mag ieder zijn werkweek invullen volgens het flextime-principe
en na een half jaar wordt dezelfde vragenlijst opnieuw afgenomen. De scores staan hieronder, evenals in het bestand FLEXTIME. Hoe hoger de score, hoe positiever de houding van de medewerker ten opzichte van het werk. Gebruik een parametervrije toets om te kijken of flextime een gunstige invloed heeft op de houding ten opzichte van het werk. Gebruik α = 0; 05. Medewerker 1 2 3 4 5
Voor 54 25 80 76 63
Na 68 42 80 91 70
Medewerker 6 7 8 9 10
Voor 82 94 72 33 90
Na 88 90 81 39 93
16.11 Een innovatie op het gebied van werkschema's, die managers geholpen heeft bij het oplossen van problemen met motivatie en absenteïsme die samenhangen met een vaste 8-urige werkdag, is het concept flextijd. Dit programma van flexibele werktijden stelt werknemers in staat om hun eigen 40-urige werkweek in te delen naar hun persoonlijke behoeften. Het management van een groot productiebedrijf overweegt om een flextijdprogramma in te voeren, afhankelijk van het succes of het falen van een proefproject. Tien medewerkers worden willekeurig gekozen en krijgen een vragenlijst om hun houding ten opzichte van hun werk te meten. Elk van hen mag een flexibele werkdag bedenken en in praktijk brengen. Na zes maanden wordt hun houding ten opzichte van hun werk nogmaals gemeten. De resulterende scores hiervan worden in de tabel gegeven. Hoe hoger de score, des te gunstiger is de houding van de werknemer ten opzichte van zijn of haar werk. Gebruik een niet-parametrische toetsingsprocedure om het succes van het proefprogramma flextijd te beoordelen. Toets voor α = 0,05. FLEXTIME.DAT Werknemer Voor 1 54 2 25 3 80 4 76 5 63
Na 68 42 80 91 70
Werknemer 6 7 8 9 10
Voor 82 94 72 33 90
Na 88 90 81 39 93
16.12 Drie van de categorieën die Business Week gebruikt om gemeenschappelijke beleggingsfondsen te karakteriseren zijn 'groei', 'gemengd' en 'waarde'. De fondsen met een significant lagere 'price-earning ratio' (p-e; winst per aandeel) en 'price-to-book ratio' (p-b; aandelenkoers versus boekwaarde) dan de gemiddelde waarde worden waardefondsen genoemd; de fondsen met een meer dan gemiddelde p-e en p-b worden groeifondsen genoemd, terwijl de fondsen die hiertussen liggen gemengde fondsen worden genoemd. In de tabel staat de rente na belasting voor de beleggers voor steekproeven van zeven gemeenschappelijke beleggingsfondsen in elk van deze drie categorieën. a.
Leveren de gegevens voldoende bewijs om te kunnen concluderen dat de verdelingen van de rente voor de drie soorten fondsen verschillend zijn? Toets voor α = 0,05.
b.
Aan welke aannames moet voldaan zijn opdat de toets in a geldig is?
c.
Beschrijf de fouten van de eerste en van de tweede soort die bij de toets in a in de context van de vraagstelling kunnen voorkomen.
d. Onder welke omstandigheden kan de variantieanalyse F-toets uit hoofdstuk 14 helpen bij het beantwoorden van de vraag in a? MFUNDS.DAT Categorie Opbrengst 21,2 37,9 39,2 Groei 22,7 44,8 31,8 118,5 5,9 23,5 21,3 Gemengd 47,9 8,2 17,8 12,4 -9,2 -5,5 8,5 Waarde -8,5 9,2 -6,8 -9,6 16.13 Er worden in drie grote steden aselecte steekproeven genomen van zeven pro-Deoadvocaten. In de tabel worden hun salarissen gegeven. Je hebt de opdracht gekregen om vast te stellen of er verschillen bestaan tussen de verdelingen van de salarissen voor pro-Deoadvocaten in de drie steden. a.
Onder welke omstandigheden kun je een F-toets voor een volledig gerandomiseerd ontwerp gebruiken om de gewenste analyse uit te voeren?
b.
Aan welke aannames die nodig zijn voor de F-toets wordt in dit geval waarschijnlijk niet voldaan? Licht je antwoord toe.
c.
Gebruik de Kruskal-Wallis H-toets om vast te stellen of de verdelingen van de salarissen verschillen tussen de drie steden. Specificeer je nulhypothese en je alternatieve hypothese, en geef je conclusies in termen van de vraagstelling. Gebruik α = 0,05.
d.
Welke aannames zijn nodig opdat de verdelingsvrije toets in c geldig is?
PUBDEF.DAT Atlanta Los Angeles $34.600 $42.400 $84.900 $135.000 $61.700 $63.000 $38.900 $43.700 $77.200 $69.400 $83.600 $97.000 $59.800 $49.500
Washington , D.C. $38.000 $76.900 $48.000 $72.600 $73.200 $51.800 $55.000
16.14 De volgende steekproefgegevens werden over de variabelen x en y verzameld: x 0 3 0 −4 3 0 4 3 1 2 y 0 2 2 0 a.
Specificeer welke nulhypothese en welke alternatieve hypothese gebruikt moeten worden om een hypothesetoets uit te voeren om te bepalen of de variabelen x en y correleren.
b.
Voer de toets in a uit voor α = 0,05.
c.
Wat is bij benadering de overschrijdingskans van de toets in b?
d.
Welke aannames zijn nodig opdat de toets in b geldig is?
16.15 Een medewerkersideeënsysteem is een formeel proces voor het opvangen, analyseren, invoeren en herkennen van organisatorische verbeteringen die door medewerkers worden voorgesteld. (Voorzover bekend werd het eerste systeem in 1880 door de Yale and Towne Manufacturing Company of Stanford ingevoerd.) D. Carnevale en B. Sharp onderzochten aan de hand van gegevens van de National Association of Suggestion Systems hoe sterk het verband is tussen de mate van participatie door medewerkers bij het suggereren van plannen, en de kostenbesparingen die door de werkgevers worden gerealiseerd. De gegevens in de tabel zijn representatief voor de gegevens die ze hebben geanalyseerd voor een steekproef van overheidsinstellingen (federaal, van de staat en lokaal). De besparingen worden berekend vanaf het eerste jaar dat meetbare voordelen werden waargenomen. a.
Leg uit waarom de besparingsgegevens die in dit onderzoek zijn gebruikt een te lage schatting kunnen geven van het totale voordeel dat door de ingevoerde suggesties wordt behaald.
b.
Carnavale en Sharp concludeerden dat er een significant, matig positief verband bestaat tussen de mate van participatie en de kostenbesparingen in suggestiesystemen van de overheidssector. Ben je het daarmee eens? Toets voor α = 0,01.
c.
Toon de juistheid aan van de statistische methode die je in b hebt gebruikt.
SUGGEST.DAT Participatie Kostenbesparingen (% van de (% van de totale medewerkers begroting) die ideeën leverden) 10,1 8,5 6,2 6,0 16,3 9,0 1,2 0,0 4,8 5,1 11,5 6,1 0,6 1,2 2,8 4,5 8,9 5,4 20,2 15,3 2,7 3,8 16.16 Er wordt een aselecte steekproef genomen van negen paren meetwaarden voor twee variabelen, x en y. In de tabel worden de resultaten gegeven. LM15_55.DAT Paar x y 1 19 12 2 27 19 3 15 7 4 35 25 5 13 11
Paar 6 7 8 9
x 29 16 22 16
y 10 16 10 18
a.
Bieden de gegevens voldoende aanwijzingen dat ρ, de rangcorrelatie tussen x en y, ongelijk aan nul is? Toets voor α = 0,05.
b.
Bieden de gegevens voldoende aanwijzingen dat de kansverdeling voor x naar rechts is verschoven ten opzichte van die van y? Toets voor α = 0,05.
16.17 Volgens de National Restaurant Association zijn hamburgers de best verkochte snack in de Verenigde Staten. Een econoom die een studie heeft gemaakt van het fast-food-koopgedrag van Amerikanen, liet studenten buiten twee vestigingen van McDonalds in een voorstad bij Boston staan en aan vertrekkende klanten vragen of ze meer of minder dan $2,25 hadden besteed aan hamburgerproducten voor hun lunch. Twintig antwoordden “minder dan”; 50 zeiden “meer dan” en 10 weigerden de vraag te beantwoorden. a.
Zijn er voldoende aanwijzingen om te kunnen concluderen dat het mediane bedrag dat aan hamburgers bij de lunch wordt besteed bij McDonalds minder is dan $2,25?
b.
Geldt je conclusie voor alle Amerikanen die bij McDonalds lunchen? Licht je antwoord toe;
c.
Aan welke aannames moet zijn voldaan om de geldigheid van de toets in a te kunnen garanderen?
16.18 De tijdsduur die nodig is voordat een persoon reageert op een nieuwe pijnstiller wordt op de volgende manier getest. Zeven willekeurig gekozen proefpersonen krijgen zowel aspirine als het nieuwe middel. De twee behandelingen vinden op verschillende tijdstippen plaats en in een willekeurige volgorde. De tijdsduur (in minuten) die nodig is voordat een proefpersoon aangeeft dat hij of zij verlichting van de pijn voelt, wordt voor zowel aspirine als voor het nieuwe middel vastgelegd. De resultaten worden in de tabel gegeven. PAINKILL.DAT Persoon Aspirine Nieuwe pijnstiller 1 15 7 2 20 14 3 12 13 4 20 11 5 17 10 6 14 16 7 17 11 Leveren de gegevens voldoende aanwijzingen dat de kansverdeling van de tijd die nodig is om met aspirine verlichting te krijgen naar rechts is verschoven ten opzichte van de kansverdeling van de tijd die nodig is om verlichting te krijgen bij het nieuwe middel?
16.19 Veel waterbehandelingsinstallaties vullen het natuurlijke fluoridegehalte in water aan met kiezelfluorwaterstofzuur om een streefwaarde voor de concentratie van fluoride in het drinkwater te bereiken. Men denkt dat bepaalde niveaus goed voor het gebit zijn, maar zeer hoge concentraties kunnen gevaarlijk zijn. Stel dat zo'n waterbehandelingsinstallatie streeft naar 0,75 milligram/liter voor het water dat zij leveren. De fabriek neemt elke dag 25 steekproeven om vast te stellen of het mediane niveau van het streefniveau verschilt. a.
Stel de nulhypothese en de alternatieve hypothese op.
b.
Bepaal de toetsingsgrootheid en het kritieke gebied voor α = 0,10
c.
Leg uit wat de implicaties zijn van een fout van de eerste soort in de context van deze toepassing. En van een fout van de tweede soort.
d.
Stel dat de steekproeven van één dag in 18 waarden resulteren die groter zijn dan 0,75 mg/L. Voer de toets uit en geef de juiste conclusie in de context van deze toepassing.
e.
Toen men de supervisor van de installatie suggereerde om een t-toets te gebruiken voor de dagelijkse test, antwoordde ze dat de kansverdeling van de fluorideconcentraties ‘sterk scheef naar rechts was verdeeld’. Laat in een grafiek zien wat ze hiermee bedoelt en leg uit waarom dit een reden is om de tekentoets te prefereren boven de t-toets.