Opgaven hoofdstuk 8 I
Learning the Mechanics
8.1 We verwerpen (in het algemeen) de nulhypothese als de toetsingsgrootheid in het verwerpingsgebied ligt, maar we accepteren de nulhypothese niet als de toetsingsgrootheid niet in het verwerpingsgebied ligt. Waarom? 8.2 Stel dat je een statistische toets wilt uitvoeren van H0: µ = 255 tegen Ha: µ > 255, en dat je hebt besloten de volgende beslissingsregel toe te passen: verwerp H0 als het steekproefgemiddelde van een aselecte steekproef van 81 elementen groter is dan 270. Veronderstel dat de standaarddeviatie van de populatie 63 bedraagt. a.
Druk de beslissingsregel uit in termen van z.
b.
Bepaal α, de kans op het maken van een fout van de eerste soort door het gebruiken van deze beslissingsregel.
8.3 Een aselecte steekproef van 100 waarnemingen uit een populatie met standaarddeviatie 60 geeft een steekproefgemiddelde gelijk aan 110. a.
Toets de nulhypothese dat µ = 100 tegen de alternatieve hypothese µ > 100, voor α = 0,05. Interpreteer de resultaten van deze toets.
b.
Toets de nulhypothese dat µ = 100 tegen de alternatieve hypothese µ ≠ 100, voor α = 0,05. Interpreteer de resultaten van deze toets.
c.
Vergelijk de resultaten van de twee toetsen. Leg uit waarom de resultaten verschillend zijn.
8.4 Een analist toetst een nulhypothese µ ≥ 20 tegen de alternatieve hypothese dat µ < 20. De analist vindt een p-waarde gelijk aan 0,06. Wat is de kleinste waarde van α waarvoor de nulhypothese wordt verworpen? 8.5 In een toets van H0: µ = 100 tegen Ha: µ > 100 geven de steekproefgegevens de toetsingsgrootheid z = 2,17. Bepaal de p-waarde voor deze toets. 8.6 In een toets van H0: µ = 100 tegen Ha: µ ≠ 100 geven de steekproefgegevens de toetsingsgrootheid z = 2,17. Bepaal de p-waarde voor deze toets.
8.7 Televisiereclame in de VS gebruikt meestal vrouwen of ‘vrouwelijke’ mannen om een product aan te prijzen. Onderzoek dat in Nature (27 aug. 1998) is gepubliceerd, heeft aan het licht gebracht dat mensen in feite meer aangetrokken worden tot “vrouwelijke” gezichten, ongeacht het geslacht. In een bepaald experiment bekeken 50 proefpersonen het gezicht van een Japanse vrouw en van een blanke man op een computer. Met speciale grafische software kon elke proefpersoon de gezichten veranderen (door ze vrouwelijker of mannelijker te maken) totdat ze het “meest aantrekkelijke” gezicht hadden. Het niveau van “vervrouwelijking” x werd als een percentage gemeten. a.
Voor het Japanse vrouwengezicht was = 10,2% en s = 31,3%. De onderzoekers gebruikten deze steekproefinformatie om de nulhypothese te toetsen dat het gemiddeld niveau van “vervrouwelijking” gelijk is aan 0%. Ga na dat de toetsingsgrootheid gelijk is aan 2,3.
b.
Zie a. De onderzoekers gaven als p-waarde van de toets p = 0,027. Verifieer en interpreteer dit resultaat.
c.
Voor het gezicht van de blanke man was = 15,0% en s = 25,1%. De onderzoekers gaven voor de toetsingsgrootheid (voor de toets van de nulhypothese in a) de waarde 4,23 met een bijbehorend p-waarde gelijk aan ongeveer 0. Verifieer en interpreteer deze resultaten.
8.8 Schets voor elk van de volgende verwerpingsgebieden de steekproefverdeling van t, en geef de positie van het verwerpingsgebied op de schets aan: a.
t > 1,440 met df = 6
b.
t < –1,782 met df = 12
c.
t < –2,060 of t > 2,060 met df = 25
8.9 Wat is voor elk van de verwerpingsgebieden in opgave 8.8 de kans dat er een fout van de eerste soort wordt gemaakt? 8.10 Stel dat je wilt toetsen H0: µ = 500 tegen Ha: µ > 500 voor α = 0,05. De desbetreffende populatie is normaal verdeeld met een standaarddeviatie gelijk aan 100. Er wordt een aselecte steekproef met omvang n = 25 gebruikt. a.
Schets de steekproefverdeling van , aangenomen dat H0 juist is.
b.
Bepaal de waarde van 0, de waarde van waarboven de nulhypothese wordt verworpen. Geef het verwerpingsgebied aan op de grafiek in a. Arceer het oppervlak rechts van het verwerpingsgebied en geef dit aan met α.
c.
Schets in de grafiek van a de steekproefverdeling van als µ = 550. Arceer het gebied onder deze verdeling dat overeenkomt met de kans dat in het niet-verwerpingsgebied valt als µ = 550. Geef dit gebied aan met ß.
d.
Bepaal ß.
e.
Bereken het onderscheidingsvermogen van deze toets voor het signaleren van de alternatieve Ha: µ = 550.
8.11 Stel dat je een tweezijdige toets wilt uitvoeren van H0: µ = 30 tegen Ha: µ ≠ 30, voor α = 0,05. Er wordt een aselecte steekproef met omvang 121 uit de desbetreffende populatie genomen. Veronderstel dat de populatie een standaarddeviatie gelijk aan 1,2 heeft. a.
Beschrijf de steekproefverdeling van onder de veronderstelling dat H0 juist is.
b.
Beschrijf de steekproefverdeling van onder de veronderstelling dat µ = 29,8.
c.
Als µ in werkelijkheid gelijk is aan 29,8, bepaal dan de waarde van ß voor deze toets.
d.
Bepaal de waarde van ß voor de alternatieve Ha: µ = 30,4.
8.12 Een aselecte steekproef van zeven meetwaarden geeft = 9,4 en σ2 = 4,84. a.
Welke aannames moet je maken met betrekking tot de populatie om een hypothese over σ2 te kunnen toetsen?
b.
Stel dat aan de aannames in a is voldaan. Toets de nulhypothese σ2 = 1 tegen de alternatieve hypothese σ2 > 1. Gebruik α = 0,05.
c.
Toets de nulhypothese dat σ2 = 1 tegen de alternatieve hypothese dat σ2 ≠ 1. Gebruik α = 0,05.
8.13 Zie opgave 8.12. Stel dat n = 100, = 9,4 en s2 = 4,84. a.
Toets de nulhypothese dat σ2 = 1 tegen de alternatieve hypothese dat σ2 > 1.
b.
Vergelijk het resultaat van de toets met dat van opgave 8.12.
8.14 Als je een heel kleine waarde voor α kiest bij het toetsen van een hypothese, zal ß dan klein of groot zijn? Licht je antwoord toe. 8.15
Als het verwerpen van de nulhypothese van een bepaalde toets het einde van je bedrijf zou betekenen, zou je dan α klein of groot willen hebben? Licht je antwoord toe. 8.16 Een aselecte steekproef van 20 waarnemingen uit een normaal verdeelde populatie geeft = 72,6 en s2 = 19,4. a.
Toets H0: µ = 80 tegen Ha: µ < 80. Gebruik α = 0,05.
b.
Toets H0: µ = 80 tegen Ha: µ ≠ 80. Gebruik α = 0,01.
II
Applying the Concepts
8.17 Een groep artsen heeft de leugendetector aan een onderzoek onderworpen dat even zorgvuldig werd uitgevoerd als een medische diagnostische test. Ze vonden dat als 1000 personen worden getest met de leugendetector en 500 van hen de waarheid spreken en 500 liegen, de leugendetector dan aangeeft dat ongeveer 185 van degenen die de waarheid spreken, leugenaars zijn en dat ongeveer 120 van degenen die liegen, de waarheid spreken (Discover, 1986). a.
Bij het gebruiken van een leugendetector wordt de te testen persoon geacht de waarheid te spreken (H0) totdat “bewezen” is dat hij liegt (Ha). Wat is in deze context een fout van de eerste soort? En een fout van de tweede soort?
b.
Wat is volgens het onderzoek (bij benadering) de kans dat een test met een leugendetector resulteert in een fout van de eerste soort? Een fout van de tweede soort?
8.18 Een van de belangrijkste problemen in de industrie is de beveiliging van computers. Beveiliging van computers wordt vaak bereikt door het gebruiken van een wachtwoord – een reeks symbolen (meestal letters en cijfers) die door de gebruiker moet worden gegeven voordat de computer toegang tot het account geeft. Het probleem is dat een wachtwoord altijd kan worden onderschept en in verkeerde handen terechtkomen. De nieuwste systemen lossen dit probleem op door geautoriseerde gebruikers zich te laten identificeren met behulp van unieke lichaamskenmerken. Een voorbeeld is een systeem dat door Palmguard, Inc, is ontwikkeld, dat de hypothese H0: de gebruiker die zich aanmeldt is geautoriseerd toetst tegen de alternatieve hypothese Ha: de gebruiker die zich aanmeldt is niet geautoriseerd door de kenmerken van de handpalm van deze gebruiker te vergelijken met die welke in het gegevensbestand van geautoriseerde gebruikers voorkomen (Omni, 1984).
a.
Definieer een fout van de eerste soort en een fout van de tweede soort voor deze toets.Welke fout is ernstiger? Waarom?
b.
Palmguard stelt dat het percentage fouten van de eerste soort voor zijn systeem kleiner is dan 1%, en het percentage fouten van de tweede soort kleiner dan 0,00025%. Interpreteer deze foutpercentages.
c.
Een ander succesvol beveiligingssysteem, de EyeDentifyer, “herkent geautoriseerde gebruikers door het unieke patroon van kleine bloedvaatjes op het netvlies achter in het oog te lezen.” De EyeDentifyer vermeldt percentages voor fouten van de eerste en de tweede soort gelijk aan respectievelijk 0,01% (1 op 10 000) en 0,005% (5 op de 100 000). Interpreteer deze percentages.
8.19 Welke factoren remmen het leerproces in de klas? Om deze vraag te beantwoorden, hebben onderzoekers van de Curry State University een enquête gehouden onder 40 studenten van een hogere marketingopleidingsklas (Marketing Education Review, najaar 1994). Elke student kreeg een lijst met factoren en werd gevraagd in welke mate elke factor het leerproces belemmerde in de cursussen die in hun afdeling werden gegeven. Er werd een 7-puntsschaal gebruikt, met 1 = “helemaal niet” en 7 = “in sterke mate”. De factor die het hoogst scoorde had betrekking op de docent: “professoren die te veel nadruk leggen op één juist antwoord in plaats van op het denkproces en creatieve ideeën.” De samengevatte statistische gegevens voor de beoordeling door de studenten van deze factor zijn: = 4,70, s = 1,62. a.
Voer een toets uit om vast te stellen of de werkelijke gemiddelde beoordeling van deze factor groter is dan 4. Gebruik α = 0,05. Interpreteer de resultaten van de toets.
b.
Omdat de desbetreffende variabele, een beoordeling, op een 7-puntsschaal wordt gemeten, is het onwaarschijnlijk dat de populatie van beoordelingen normaal verdeeld is. Daarom is het mogelijk dat sommige analisten vinden dat de toets in a niet geldig is, en zoeken ze naar alternatieve analysemethoden. Verdedig of weerleg dit argument.
8.20 Een bedrijf heeft een nieuw inkjetpatroon ontworpen voor zijn faxapparaat voor gewoon papier, waarvan het denkt dat het (gemiddeld) een langere levensduur heeft dan het patroon dat nu wordt geproduceerd. Om de levensduur van het patroon te onderzoeken, werden 225 nieuwe patronen getest door het aantal gedrukte pagina’s van goede kwaliteit te tellen dat elk patroon kon produceren. Er werd vastgesteld dat het gemiddelde en de standaarddeviatie 1511 pagina’s respectievelijk 35,7 pagina’s bedroegen. De totale gemiddelde levensduur van de patronen die tot nu toe worden gemaakt is 1505 pagina’s met een standaarddeviatie van 97,3 pagina’s. a.
Wat zijn de juiste nulhypothese en alternatieve hypothese om te toetsen of de gemiddelde levensduur van de nieuwe patronen groter is dan die van de oude patronen?
b.
Gebruik α = 0,005 om de toets in a uit te voeren. Hebben de nieuwe patronen een levensduur die statistisch significant langer is dan de patronen die nu worden geproduceerd?
c.
Lijkt het verschil in gemiddelde levensduur van praktisch belang te zijn vanuit het gezichtspunt van de consument? Licht je antwoord toe.
d.
Moet de kleinere standaarddeviatie voor de gemiddelde levensduur van de nieuwe patronen als een verbetering worden gezien ten opzichte van de oude patronen? Licht je antwoord toe.
8.21 Een artikel gepubliceerd in het Journal of the American Medical Association (16 okt. 1995) noemt roken in China een “noodsituatie in de gezondheidszorg.” De onderzoekers vonden dat rokers in China gemiddeld 16,5 sigaretten per dag roken. Dit hoge gemiddelde is een van de redenen dat de tabaksindustrie de grootste bron van belastinginkomsten voor de overheid vormt. Is het gemiddeld aantal sigaretten dat Chinese rokers per dag roken de afgelopen twee jaar toegenomen? Bedenk dat in een aselecte steekproef van 200 Chinese rokers in 1997 het aantal gerookte sigaretten per dag een gemiddelde waarde had gelijk aan 17,05 en een standaarddeviatie gelijk aan 5,21. a.
Stel de nulhypothese en de alternatieve hypothese op voor het toetsen of Chinese rokers in 1997 gemiddeld meer sigaretten per dag roken dan in 1995. (Veronderstel dat het populatiegemiddelde voor 1995 gelijk is aan µ = 16,5.)
b.
Bereken en interpreteer het waargenomen significantieniveau van de toets.
c.
Waarom is een tweezijdige toets niet geschikt voor dit probleem?
8.22 Er is een onderzoek uitgevoerd naar de effectiviteit van een nieuw muggenafweermiddel dat door het Amerikaanse leger is ontworpen als een camouflage-gezichtsverf (Journal of the Mosquito Control Association, juni 1995). Het afweermiddel werd toegepast op de onderarm van vijf vrijwilligers, waarop de arm gedurende een periode van 10 uur werd blootgesteld aan vijftien actieve muggen. Op basis van het aantal en de plaats van de muggenbeten werd voor elk van de vijf vrijwilligers het percentage berekend van het oppervlak van de onderarm dat beschermd was tegen muggenbeten. Voor één bepaalde kleur (leem) werden de volgende samenvattende statistische grootheden gevonden: = 83% s = 15% a.
b.
Het nieuwe afweermiddel wordt geacht effectief te zijn als het een afweerpercentage heeft dat ten minste 95 bedraagt. Voer een toets uit om vast te stellen of het gemiddelde afweerpercentage van het nieuwe muggenafweermiddel minder is dan 95. Gebruik voor de toets α = 0,10. Welke aannames zijn nodig opdat de hypothesetoets in a geldig is?
8.23 Winkeldiefstal in de VS kost winkeliers ongeveer $15 miljard dollar per jaar. Deze verliezen worden vertaald naar hogere prijzen voor de consument. Shoplifters Alternative uit Jericho, N.Y. stelt dat ondanks de ernst van het probleem, slechts 50% van alle winkeldieven aan de politie wordt
overgedragen (Athens Daily News, 12 dec. 1999). Een aselecte steekproef van 40 Amerikaanse winkeliers werd gevraagd wat ze hadden gedaan met de laatste winkeldief die ze hadden betrapt. Slechts 24 van deze winkeldieven werden aan de politie overgedragen. Vormen deze gegevens voldoende bewijs om Shoplifters Alternative tegen te kunnen spreken? a.
Is de steekproef groot genoeg om de procedure van paragraaf 8.5 te kunnen gebruiken om deze vraag te beantwoorden? Licht je antwoord toe.
b.
Voer een hypothesetoets uit om de vraag te beantwoorden. Gebruik α = 0,05.
c.
Bepaal het waargenomen significantieniveau van de hypothesetoets in b.
d.
Voor welke waarden van α zou het waargenomen significantieniveau voldoende zijn om de nulhypothese van de toets in b te kunnen verwerpen?
8.24 “Ga de Pepsi uitdaging aan” was een marketing campagne die enige tijd geleden door de Pepsi-Cola Company werd gebruikt. Coca-Cola drinkers namen deel in een blinde smaaktest waarin hun gevraagd werd om Pepsi en Coke te proeven in ongemarkeerde bekers, waarop hun werd gevraagd aan welke ze de voorkeur gaven. In een televisiecommercial van Pepsi zegt een verslaggever dat “in blinde smaaktests die onlangs zijn gehouden zei meer dan de helft van de Cola-Light-drinkers dat ze de voorkeur gaven aan de smaak van Pepsi-Light” (Consumer’s Research, mei 1993). Stel dat 100 drinkers van Cola-Light de Pepsi-uitdaging aangingen en dat 56 van hen de voorkeur gaven aan de smaak van Pepsi-Light. Toets de hypothese dat meer dan de helft van alle Cla-Light-drinkers in een blinde smaaktest voor Pepsi-Light zullen kiezen. Gebruik α = 0,05. Wat zijn de consequenties van de toetsresultaten gezien vanuit het standpunt van Coca-Cola? 8.25 Als een fabrikant (de koper) alle artikelen van een bepaalde verkoper koopt, spreken we van ‘sole sourcing’ (Schonberger en Knod, Operations Management, 1994). Als onderdeel van een solesourcing-overeenkomst gaat een verkoper ermee akkoord dat hij de koper regelmatig voorziet van steekproefgegevens uit zijn productieproces. De koper gebruikt deze gegevens om na te gaan of de gemiddelde lengte van staafjes die door het productieproces van de verkoper worden geproduceerd werkelijk 5,0 mm of meer bedraagt, zoals door de verkoper wordt geclaimd en door de koper wordt gewenst. a.
Als het productieproces een standaarddeviatie van 0,01 mm heeft, de verkoper 100 artikelen aan de koper levert, en de koper α = 0,05 gebruikt voor het toetsen van H0: µ = 5,0 mm tegen Ha: µ < 5,0 mm, wat is de kans dat de toets van de koper de nulhypothese niet verwerpt terwijl in werkelijkheid µ = 4,9975 mm? Hoe wordt zo’n soort fout genoemd?
b.
Wat is de kans dat de toets van de verkoper, zoals beschreven in a, de nulhypothese verwerpt, terwijl in werkelijkheid µ = 5,0? Hoe wordt zo’n soort fout genoemd?
c.
Wat is het onderscheidingsvermogen van de toets voor het opsporen van een afwijking van 0,0025 mm onder de gespecificeerde gemiddelde staaflengte van 5,0 mm?
8.26 Het Environment Protection Agency (EPA) heeft geschat dat de 2000 Honda Civic auto een gemiddelde van 35 mijl per gallon op de snelweg haalt. De fabrikant van de auto claimt echter dat het EPA het aantal mijl per gallon van de Civic te laag heeft geschat. Om deze bewering te ondersteunen kiest het bedrijf 36 auto’s van dit model en legt het aantal afgelegde mijl vast voor elke auto op een traject soortgelijk als door het EPA gebruikt. Dit geeft de volgende resultaten: = 37,3 mpg, s = 6,4 mpg. a.
Als de autofabrikant wil aantonen dat het gemiddeld aantal mpg voor 2000 Civic auto’s groter is dan 35 mpg, wat zou dan de alternatieve hypothese moeten zijn? En de nulhypothese?
b.
Leveren de gegevens voldoende bewijs om de claim van de fabrikant te ondersteunen? Toets voor α = 0,05. Noem alle aannames die je maakt bij het uitvoeren van de toets.
c.
Bereken het onderscheidingsvermogen van de toets voor de gemiddelde waarden 35,5, 36,0, 36,5, 37,0 en 37,5, aangenomen dat s = 6,4 een goede schatting van σ is.
d.
Maak een grafiek van het onderscheidingsvermogen van de toets op de verticale as tegen het gemiddelde op de horizontale as. Trek een kromme door de punten.
e.
Gebruik de kromme voor het onderscheidingsvermogen in d om het onderscheidingsvermogen te schatten voor de gemiddelde waarde µ = 36,75. Bereken het onderscheidingsvermogen voor deze waarde van µ en vergelijk deze waarde met de geschatte waarde.
f.
Gebruik de kromme voor het onderscheidingsvermogen om het onderscheidingsvermogen van de toets te schatten voor µ = 40. Als de werkelijke waarde van het gemiddeld aantal mpg gelijk is aan 40, hoe groot is dan (bij benadering) de kans dat de toets de nulhypothese dat het gemiddelde gelijk is aan 35 niet verwerpt?
8.27 Laser Raman microprobe (LRM) spectroscopie wordt gebruikt om vloeibare insluitingen (holtes met gas of vloeistof gevuld) in gesteente te analyseren. Een schilfer natuurlijk Braziliaans kwarts werd kunstmatig geïnjiceerd met verschillende vloeibare insluitingen van vloeibaar kooldioxide (CO2) en vervolgens onderzocht met LRM spectroscopie. De hoeveelheid CO2 in de insluiting werd op vier verschillende dagen voor dezelfde insluiting geregistreerd. In de tabel staan de gegevens (in molprocent):
a.
Valt uit de gegevens op te maken dat de variatie in de metingen van de CO2-concentratie met behulp van de LRM-methode verschilt van 1?
b.
Welke aanname is nodig opdat de toets geldig is?
8.28 Sales promotions die door fabrikanten worden gebruikt om detailhandelaren aan te moedigen de producten van de fabrikant te voeren of er reclame voor te maken, worden trade promotions genoemd. Uit een enquête die door Cannondale Associates (een consultingbedrijf voor sales en marketing) onder 250 fabrikanten werd gehouden bleek dat 91% van de fabrikanten denkt dat het uitgaven voor trade promotions niet effectief zijn (Potentials in Marketing, juni 1995). Is dit voldoende bewijs om een eerdere claim van de American Marketing Association te verwerpen, namelijk dat niet meer dan de helft van alle fabrikanten ontevreden is over de uitgaven die ze doen voor trade promotion? a.
Voer de hiervoor geschikte hypothesetoets uit voor α = 0,02. Begin je analyse met het bepalen of de steekproef groot genoeg is om de toetsingsmethoden van hoofdstuk 8 te kunnen toepassen.
b.
Geef het waargenomen significantieniveau van de toets en interpreteer de betekenis daarvan in de context van de vraagstelling.
c.
Bereken ß, de kans op een fout van de tweede soort, als in werkelijkheid 55% van alle fabrikanten ontevreden is over hun uitgaven voor trade promotion.
8.29 De “bèta-coëfficiënt” van een aandeel is een maat voor de volatiliteit (of het risico) van het aandeel in vergelijking tot de markt in het geheel. Aandelen met een bèta-coëfficiënt groter dan 1 dragen in het algemeen meer risico (hebben een hogere volatiliteit) dan de markt, terwijl aandelen met een bèta-coëfficiënt kleiner dan 1 minder riskant (een lagere volatiliteit hebben) zijn dan de totale markt (Alexander, Sharpe, en Bailey, Fundamentals of Investments, 1993). Eind 1996 werd een aselecte steekproef genomen van 15 hightech-aandelen en het gemiddelde en de standaarddeviatie van de bètacoëfficiënt werden berekend: = 1,23, s = 0,10. a.
Stel de nulhypothese en de alternatieve hypothese op voor het toetsen van de vraag of het gemiddelde high-tech aandeel riskanter is dan de markt in het geheel.
b.
Stel de juiste toetsingsgrootheid en verwerpingsgebied vast voor deze toets. Gebruik α = 0,10
c.
Welke aannames zijn nodig opdat deze toets geldig is?
d.
Bereken de toetsingsgrootheid en geef je conclusie.
e.
Wat is bij benadering de p-waarde voor deze toets? Interpreteer deze waarde.