Opgaven hoofdstuk 8 I Basistechnieken 8.1 We verwerpen (in het algemeen) de nulhypothese als de toetsingsgrootheid in het kritieke gebied ligt, maar we accepteren de nulhypothese niet als de toetsingsgrootheid niet in het kritieke gebied ligt. Waarom? 8.2 Stel dat je een statistische toets wilt uitvoeren van H 0 : μ = 255 tegen H a : μ > 255, en dat je hebt besloten de volgende beslissingsregel toe te passen: verwerp H 0 als het steekproefgemiddelde van een aselecte steekproef van 81 elementen groter is dan 270. Veronderstel dat de standaardafwijking van de populatie 63 bedraagt. a.
Druk de beslissingsregel uit in termen van z.
b.
Bepaal α, de kans op het maken van een fout van de eerste soort door het gebruiken van deze beslissingsregel.
8.3 Een aselecte steekproef van 100 waarnemingen uit een populatie met standaardafwijking 60 geeft een steekproefgemiddelde gelijk aan 110. a.
Toets de nulhypothese dat μ = 100 tegen de alternatieve hypothese μ > 100, voor α = 0,05. Interpreteer de resultaten van deze toets.
b.
Toets de nulhypothese dat μ = 100 tegen de alternatieve hypothese μ ≠ 100, voor α = 0,05. Interpreteer de resultaten van deze toets.
c.
Vergelijk de resultaten van de twee toetsen. Leg uit waarom de resultaten verschillend zijn.
8.4 Een statisticus toetst een nulhypothese μ ε 20 tegen de alternatieve hypothese dat μ < 20. De statisticus vindt een overschrijdingskans gelijk aan 0,06. Wat is de kleinste waarde van α waarvoor de nulhypothese wordt verworpen? 8.5 In een toets van H 0 : μ = 100 tegen H a : μ > 100 vindt men als uitkomst van de toetsingsgrootheid z = 2,17. Bepaal de overschrijdingskans voor deze toets. 8.6 In een toets van H 0 : μ = 100 tegen H a : μ ≠ 100 vindt men als uitkomst van de toetsingsgrootheid z = 2,17. Bepaal de overschrijdingskans voor deze toets. 8.7 Een onderzoek werd uitgevoerd naar tv-kijkers die goederen kopen via een van de thuiswinkelkanalen. Stel dat je de nulhypothese wilt toetsen dat μ = 51 voor de populatie van kopers op basis van een aselecte steekproef van n = 50 thuiswinkel-kopers.
a.
Bepaal de overschrijdingskans bij een tweezijdige toets als x̅ = 52,3 en s = 7,1.
b.
Bepaal de overschrijdingskans bij een rechts-eenzijdige toets als x̅ = 52,3 en s = 7,1.
c.
Bepaal de overschrijdingskans bij een tweezijdige toets als x̅ = 52,3 en s = 10,4.
d.
Geef bij ieder van de toetsen in a tot en met c een waarde van α waarvoor de nulhypothese wordt verworpen.
e.
Als x̅ = 52,3, bepaal dan een waarde van s waarvoor een tweezijdige overschrijdingskans gelijk zou zijn aan 0,01.
8.8 Schets voor elk van de volgende kritieke gebieden de verdeling van t, en geef de positie van het kritieke gebied in de schets aan: a.
t > 1,440 met df = 6
b.
t < –1,782 met df = 12
c.
t < –2,060 of t > 2,060 met df = 25
8.9 Wat is voor elk van de kritieke gebieden in opgave 8.8 de kans dat er een fout van de eerste soort wordt gemaakt? 8.10 Je wilt een tweezijdige toets uitvoeren met H 0 : μ = 30 tegen H a : μ ≠ 30 met α = 0; 05. Een aselecte steekproef van 121 stuks wordt getrokken uit de populatie. Veronderstel dat de populatie een standaardafwijking heeft van 1,2. a.
Beschrijf de verdeling van x̅ als H 0 juist is.
b.
Beschrijf de verdeling van x̅ als H 0 = 29,8.
c.
Als μ werkelijk gelijk zou zijn aan 29,8, bepaal dan de waarde van ß.
d.
Bepaal de waarde van ß voor het alternatief H a : μ = 30,4.
8.11 Stel dat je een tweezijdige toets wilt uitvoeren van H 0 : μ = 30 tegen H a : μ ≠ 30, voor α = 0,05. Er wordt een aselecte steekproef met omvang 121 uit de desbetreffende populatie genomen. Veronderstel dat de populatie een standaardafwijking gelijk aan 1,2 heeft. a.
Beschrijf de verdeling van x̅ onder de veronderstelling dat H 0 juist is.
b.
Beschrijf de verdeling van x̅ onder de veronderstelling dat μ = 29,8.
c.
Als μ in werkelijkheid gelijk is aan 29,8, bepaal dan de waarde van ß voor deze toets.
d.
Bepaal de waarde van ß voor de alternatieve hypothese H a : μ = 30,4.
8.12 Een aselecte steekproef van zeven meetwaarden geeft x̅ = 9,4 en σ2= 4,84. a.
Welke aannames moet je maken met betrekking tot de populatie om een hypothese over σ 2 te kunnen toetsen?
b.
Stel dat aan de aannames in a is voldaan. Toets de nulhypothese σ 2 = 1 tegen de alternatieve hypothese σ 2 > 1. Gebruik α = 0,05.
c.
Toets de nulhypothese dat σ 2 = 1 tegen de alternatieve hypothese dat σ 2 ≠ 1. Gebruik α = 0,05.
8.13 Zie opgave 8.12. Stel dat n = 100, x̅ = 9,4 en s2 = 4,84. a.
Toets de nulhypothese dat σ 2 = 1 tegen de alternatieve hypothese dat σ 2 > 1.
b.
Vergelijk het resultaat van de toets met dat van opgave 8.12.
8.14 Als je een heel kleine waarde voor α kiest bij het toetsen van een hypothese, zal ß dan klein of groot zijn? Licht je antwoord toe. 8.15 Als het verwerpen van de nulhypothese van een bepaalde toets het einde van je bedrijf zou betekenen, zou je dan α klein of groot willen hebben? Licht je antwoord toe. 8.16 Een aselecte steekproef van 20 waarnemingen uit een normaal verdeelde populatie geeft x̅ = 72,6 en s2 = 19,4. a.
Toets H 0 : μ = 80 tegen H a : μ < 80. Gebruik α = 0,05.
b.
Toets H 0 : μ = 80 tegen H a : μ ≠ 80. Gebruik α = 0,01.
II Toepassingen 8.17 Een groep artsen heeft de leugendetector aan een onderzoek onderworpen dat even zorgvuldig werd uitgevoerd als een medische diagnostische test. Ze vonden dat als 1000 personen worden getest met de leugendetector en 500 van hen de waarheid spreken en 500 liegen, de leugendetector dan aangeeft dat ongeveer 185 van degenen die de waarheid spreken, leugenaars zijn en dat ongeveer 120 van degenen die liegen, de waarheid spreken. a.
Bij het gebruiken van een leugendetector wordt de te testen persoon geacht de waarheid te spreken (H 0 ) totdat “bewezen” is dat hij liegt (H a ). Wat is in deze context een fout van de eerste soort? En een fout van de tweede soort?
b.
Wat is volgens het onderzoek (bij benadering) de kans dat een test met een leugendetector resulteert in een fout van de eerste soort? Een fout van de tweede soort?
8.18 Een van de belangrijkste problemen in de industrie is de beveiliging van computers. Beveiliging van computers wordt vaak bereikt door het gebruiken van een wachtwoord – een reeks symbolen (meestal letters en cijfers) die door de gebruiker moet worden gegeven voordat de computer toegang tot het account geeft. Het probleem is dat een wachtwoord altijd kan worden onderschept en in verkeerde handen terechtkomen. De nieuwste systemen lossen dit probleem op door geautoriseerde gebruikers zich te laten identificeren met behulp van unieke lichaamskenmerken. Een voorbeeld is een systeem dat door Palmguard, Inc, is ontwikkeld, dat de hypothese H 0 : de gebruiker die zich aanmeldt is geautoriseerd toetst tegen de alternatieve hypothese H a : de gebruiker die zich aanmeldt is niet geautoriseerd door de kenmerken van de handpalm van deze gebruiker te vergelijken met die welke in het gegevensbestand van geautoriseerde gebruikers voorkomen. a.
Definieer een fout van de eerste soort en een fout van de tweede soort voor deze toets.Welke fout is ernstiger? Waarom?
b.
Palmguard stelt dat het percentage fouten van de eerste soort voor zijn systeem kleiner is dan 1%, en het percentage fouten van de tweede soort kleiner dan 0,00025%. Interpreteer deze foutpercentages.
c.
Een ander succesvol beveiligingssysteem, de EyeDentifyer, “herkent geautoriseerde gebruikers door het unieke patroon van kleine bloedvaatjes op het netvlies achter in het oog te lezen.” De EyeDentifyer vermeldt percentages voor fouten van de eerste en de tweede soort gelijk aan respectievelijk 0,01% (1 op 10 000) en 0,005% (5 op de 100 000). Interpreteer deze percentages.
8.19 Welke factoren remmen het leerproces in de klas? Om deze vraag te beantwoorden, hebben onderzoekers van de Curry State University een enquête gehouden onder 40 studenten van een hogere marketingopleidingsklas. Elke student kreeg een lijst met factoren en werd gevraagd in welke mate elke factor het leerproces belemmerde in de cursussen die in hun afdeling werden gegeven. Er werd een 7-puntsschaal gebruikt, met 1 = “helemaal niet” en 7 = “in sterke mate”. De factor die het hoogst scoorde had betrekking op de docent: “docenten die te veel nadruk leggen op één juist antwoord in plaats van op het denkproces en creatieve ideeën.” De samengevatte statistische gegevens voor de beoordeling door de studenten van deze factor zijn: x̅ = 4,70, s = 1,62. a.
Voer een toets uit om vast te stellen of de werkelijke verwachte beoordeling van deze factor groter is dan 4. Gebruik α = 0,05. Interpreteer de resultaten van de toets.
b.
Omdat de desbetreffende variabele, een beoordeling, op een 7-puntsschaal wordt gemeten, is het onwaarschijnlijk dat de populatie van beoordelingen normaal verdeeld is. Daarom is het mogelijk dat sommige statistici vinden dat de toets in a niet geldig
is, en zoeken ze naar alternatieve analysemethoden. Verdedig of weerleg dit argument. 8.20 Een bedrijf heeft een nieuw inkjetpatroon ontworpen voor zijn faxapparaat voor gewoon papier, waarvan het denkt dat hij (gemiddeld) een langere levensduur heeft dan de patroon die nu wordt geproduceerd. Om de levensduur van de patroon te onderzoeken, werden 225 nieuwe patronen getest door het aantal gedrukte pagina’s van goede kwaliteit te tellen dat elke patroon kon produceren. Er werd vastgesteld dat het gemiddelde en de standaardafwijking 1511 pagina’s respectievelijk 35,7 pagina’s bedroegen. De totale verwachte levensduur van de patronen die tot nu toe worden gemaakt is 1505 pagina’s met een standaardafwijking van 97,3 pagina’s. a.
Wat zijn de juiste nulhypothese en alternatieve hypothese om te toetsen of de verwachte levensduur van de nieuwe patronen groter is dan die van de oude patronen?
b.
Gebruik α = 0,005 om de toets in a uit te voeren. Hebben de nieuwe patronen een levensduur die statistisch significant langer is dan de patronen die nu worden geproduceerd?
c.
Lijkt het verschil in verwachte levensduur van praktisch belang te zijn vanuit het gezichtspunt van de consument? Licht je antwoord toe.
d.
Moet de kleinere standaardafwijking voor de verwachte levensduur van de nieuwe patronen als een verbetering worden gezien ten opzichte van de oude patronen? Licht je antwoord toe.
8.21 Een artikel gepubliceerd in het Journal of the American Medical Association noemt roken in China een “noodsituatie in de gezondheidszorg.” De onderzoekers vonden dat rokers in China gemiddeld 16,5 sigaretten per dag roken. Dit hoge gemiddelde is een van de redenen dat de tabaksindustrie de grootste bron van belastinginkomsten voor de overheid vormt. Is het gemiddeld aantal sigaretten dat Chinese rokers per dag roken de afgelopen twee jaar toegenomen? Bedenk dat in een aselecte steekproef van 200 Chinese rokers in 1997 het aantal gerookte sigaretten per dag een gemiddelde waarde had gelijk aan 17,05 en een standaardafwijking gelijk aan 5,21. a.
Stel de nulhypothese en de alternatieve hypothese op voor het toetsen of Chinese rokers in 1997 gemiddeld meer sigaretten per dag roken dan in 1995. (Veronderstel dat de populatieverwachting voor 1995 gelijk is aan μ = 16,5.)
b.
Bereken en interpreteer de overschrijdingskans van de toets.
c.
Waarom is een tweezijdige toets niet geschikt voor dit probleem?
8.22 Er is een onderzoek uitgevoerd naar de effectiviteit van een nieuw muggenafweermiddel dat door het Amerikaanse leger is ontworpen als een camouflage-gezichtsverf (Journal of the Mosquito Control Association. Het afweermiddel werd toegepast op de onderarm van vijf vrijwilligers, waarop de arm gedurende een periode van 10 uur werd blootgesteld aan vijftien
actieve muggen. Op basis van het aantal en de plaats van de muggenbeten werd voor elk van de vijf vrijwilligers het percentage berekend van het oppervlak van de onderarm dat beschermd was tegen muggenbeten. Voor één bepaalde kleur (leem) werden de volgende steekproefgrootheden gevonden: x̅ = 83% s = 15% a.
Het nieuwe afweermiddel wordt geacht effectief te zijn als het een afweerpercentage heeft dat ten minste 95 bedraagt. Voer een toets uit om vast te stellen of het verwachte afweerpercentage van het nieuwe muggenafweermiddel minder is dan 95. Gebruik voor de toets α = 0,10.
b.
Welke aannames zijn nodig opdat de toets in a geldig is?
8.23 Winkeldiefstal in de VS kost winkeliers ongeveer $15 miljard dollar per jaar. Deze verliezen worden vertaald naar hogere prijzen voor de consument. Shoplifters Alternative uit Jericho, N.Y. stelt dat ondanks de ernst van het probleem, slechts 50% van alle winkeldieven aan de politie wordt overgedragen (Athens Daily News). Een aselecte steekproef van 40 Amerikaanse winkeliers werd gevraagd wat ze hadden gedaan met de laatste winkeldief die ze hadden betrapt. Slechts 24 van deze winkeldieven werden aan de politie overgedragen. Vormen deze gegevens voldoende bewijs om Shoplifters Alternative tegen te kunnen spreken? a.
Is de steekproef groot genoeg om de procedure van paragraaf 8.5 te kunnen gebruiken om deze vraag te beantwoorden? Licht je antwoord toe.
b.
Voer een toets uit om de vraag te beantwoorden. Gebruik α = 0,05.
c.
Bepaal de overschrijdingskans van de toets in b.
d.
Voor welke waarden van α zou de overschrijdingskans voldoende zijn om de nulhypothese van de toets in b te kunnen verwerpen?
8.24 “Ga de Pepsi uitdaging aan” was een marketing campagne die enige tijd geleden door de Pepsi-Cola Company werd gebruikt. Coca-Cola drinkers namen deel in een blinde smaaktest waarin hun gevraagd werd om Pepsi en Coke te proeven in ongemarkeerde bekers, waarop hun werd gevraagd aan welke ze de voorkeur gaven. In een televisiecommercial van Pepsi zegt een verslaggever dat “in blinde smaaktests die onlangs zijn gehouden zei meer dan de helft van de Cola-Light-drinkers dat ze de voorkeur gaven aan de smaak van Pepsi-Light”. Stel dat 100 drinkers van Cola-Light de Pepsi-uitdaging aangingen en dat 56 van hen de voorkeur gaven aan de smaak van Pepsi-Light. Toets de hypothese dat meer dan de helft van alle Cla-Light-drinkers in een blinde smaaktest voor Pepsi-Light zullen kiezen. Gebruik α = 0,05. Wat zijn de consequenties van de toetsresultaten gezien vanuit het standpunt van CocaCola?
8.25 Als een fabrikant (de koper) alle artikelen van één bepaalde verkoper koopt, spreken we van ‘sole sourcing’. Als onderdeel van een solesourcing- overeenkomst gaat een verkoper ermee akkoord dat hij de koper regelmatig voorziet van steekproefgegevens uit zijn productieproces. De koper gebruikt deze gegevens om na te gaan of de gemiddelde lengte van staafjes die door het productieproces van de verkoper worden geproduceerd werkelijk 5,0 mm of meer bedraagt, zoals door de verkoper wordt geclaimd en door de koper wordt gewenst. a.
Als het productieproces een standaardafwijking van 0,01 mm heeft, de verkoper 100 artikelen aan de koper levert, en de koper α = 0,05 gebruikt voor het toetsen van H 0 : μ = 5,0 mm tegen H a : μ < 5,0 mm, hoe groot is dan de kans dat de toets van de koper de nulhypothese niet verwerpt terwijl in werkelijkheid μ = 4,9975 mm? Hoe wordt zo’n soort fout genoemd?
b.
Hoe groot is de kans dat de toets van de verkoper, zoals beschreven in a, de nulhypothese verwerpt, terwijl in werkelijkheid μ = 5,0? Hoe wordt zo’n soort fout genoemd?
c.
Hoe groot is het onderscheidingsvermogen van de toets voor het opsporen van een afwijking van 0,0025 mm onder de gespecificeerde gemiddelde staaflengte van 5,0 mm?
8.26 Het Environment Protection Agency (EPA) heeft geschat dat de 2000 Honda Civic auto een gemiddelde van 35 mijl per gallon (mpg) op de snelweg haalt. De fabrikant van de auto claimt echter dat het EPA het aantal mijl per gallon van de Civic te laag heeft geschat. Om deze bewering te ondersteunen kiest het bedrijf 36 auto’s van dit model en legt het aantal afgelegde mijlen vast voor elke auto op een traject soortgelijk als door het EPA gebruikt. Dit geeft de volgende resultaten: x̅ = 37,3 mpg, s = 6,4 mpg. a.
Als de autofabrikant wil aantonen dat het gemiddeld aantal mpg voor 2000 Civic auto’s groter is dan 35 mpg, wat zou dan de alternatieve hypothese moeten zijn? En de nulhypothese?
b.
Leveren de gegevens voldoende bewijs om de claim van de fabrikant te ondersteunen? Toets voor α = 0,05. Noem alle aannames die je maakt bij het uitvoeren van de toets.
c.
Bereken het onderscheidingsvermogen van de toets voor de verwachtingswaarden 35,5, 36,0, 36,5, 37,0 en 37,5, aangenomen dat s = 6,4 een goede schatting van σ is.
d.
Maak een grafiek van het onderscheidingsvermogen van de toets op de verticale as tegen de verwachting op de horizontale as. Trek een kromme door de punten.
e.
Gebruik de kromme voor het onderscheidingsvermogen in d om het onderscheidingsvermogen te schatten voor de gemiddelde waarde μ = 36,75. Bereken het onderscheidingsvermogen voor deze waarde van μ en vergelijk deze waarde met de geschatte waarde.
f.
Gebruik de kromme voor het onderscheidingsvermogen om het onderscheidingsvermogen van de toets te schatten voor μ = 40. Als de werkelijke
waarde van het gemiddeld aantal mpg gelijk is aan 40, hoe groot is dan (bij benadering) de kans dat de toets de nulhypothese dat het gemiddelde gelijk is aan 35 niet verwerpt? 8.27 Laser Raman microprobe (LRM) spectroscopie wordt gebruikt om vloeibare insluitingen (holtes met gas of vloeistof gevuld) in gesteente te analyseren. Een schilfer natuurlijk Braziliaans kwarts werd kunstmatig geïnjiceerd met verschillende vloeibare insluitingen van vloeibaar kooldioxide (CO 2 ) en vervolgens onderzocht met LRM spectroscopie. De hoeveelheid CO 2 in de insluiting werd op vier verschillende dagen voor dezelfde insluiting geregistreerd. In de tabel staan de gegevens (in molprocent): CO2.DAT 86,6 84,6
85,5
85,9
a.
Valt uit de gegevens op te maken dat de variantie in de metingen van de CO 2 concentratie met behulp van de LRM-methode verschilt van 1?
b.
Welke aanname is nodig opdat de toets geldig is?
8.28 Acties die door fabrikanten worden gebruikt om detailhandelaren aan te moedigen de producten van de fabrikant te voeren of er reclame voor te maken, worden trade promotions genoemd. Uit een enquête die door Cannondale Associates (een consultingbedrijf voor verkoop en marketing) onder 250 fabrikanten werd gehouden bleek dat 91% van de fabrikanten denkt dat uitgaven voor trade promotions niet effectief zijn. Is dit voldoende bewijs om een eerdere claim van de American Marketing Association te verwerpen, namelijk dat niet meer dan de helft van alle fabrikanten ontevreden is over de uitgaven die ze doen voor trade promotion? a.
Voer de hiervoor geschikte toets uit voor α = 0,02. Begin je analyse met het bepalen of de steekproef groot genoeg is om de toetsingsmethoden van hoofdstuk 8 te kunnen toepassen.
b.
Geef de overschrijdingskansvan de toets en interpreteer de betekenis daarvan in de context van de vraagstelling.
c.
Bereken ß, de kans op een fout van de tweede soort, als in werkelijkheid 55% van alle fabrikanten ontevreden is over hun uitgaven voor trade promotion.
8.29 De “bèta-coëfficiënt” van een aandeel is een maat voor de volatiliteit (of het risico) van het aandeel in vergelijking tot de markt in het geheel. Aandelen met een bèta-coëfficiënt groter dan 1 dragen in het algemeen meer risico (hebben een hogere volatiliteit) dan de markt, terwijl aandelen met een bèta-coëfficiënt kleiner dan 1 minder riskant (een lagere volatiliteit hebben) zijn dan de totale markt. Onlangs werd een aselecte steekproef genomen van 15 hightech-aandelen en het gemiddelde en de standaardafwijking van de bètacoëfficiënt werden berekend: x̅ = 1,23, s = 0,10.
a.
Stel de nulhypothese en de alternatieve hypothese op voor het toetsen van de vraag of het doorsnee high-tech aandeel riskanter is dan de markt in het geheel.
b.
Stel de juiste toetsingsgrootheid en het kritieke gebied vast voor deze toets. Gebruik α = 0,10
c.
Welke aannames zijn nodig opdat deze toets geldig is?
d.
Bereken de uitkomst van de toetsingsgrootheid en geef je conclusie.
e.
Wat is bij benadering de overschrijdingskans voor deze toets? Interpreteer deze waarde.