Opgaven hoofdstuk 7
I
Learning the Mechanics
7.1 Bepaal zα /2 voor elk van de volgende waarden van α a.
α = 0,10
b.
α = 0,01
c.
α = 0,05
d.
α = 0,20
7.2 Een aselecte steekproef van 70 waarnemingen uit een normaal verdeelde populatie heeft een gemiddelde dat gelijk is aan 26,2 en een standaarddeviatie gelijk aan 4,1. a.
Bepaal een 95% betrouwbaarheidsinterval voor µ.
b.
Wat bedoel je als je zegt dat een betrouwbaarheidscoëfficiënt gelijk is aan 0,95?
c.
Bepaal een 99% betrouwbaarheidsinterval voor µ.
d.
Wat gebeurt er met de breedte van een betrouwbaarheidsinterval als de waarde van de betrouwbaarheidscoëfficiënt wordt vergroot terwijl de steekproefomvang gelijk blijft?
e.
Zouden de betrouwbaarheidsintervallen uit a en c nog geldig zijn als de verdeling van de oorspronkelijke populatie niet normaal was? Licht je antwoord toe.
7.3 Leg uit wat de verschillen zijn tussen de steekproefverdelingen van voor grote en kleine steekproeven bij de volgende aannames. a.
De relevante variabele, x, is normaal verdeeld.
b.
Er is niets bekend over de verdeling van de variabele x.
7.4 De volgende steekproef van 16 meetwaarden werd genomen uit een populatie die bij benadering normaal is verdeeld:
a.
Construeer een 80% betrouwbaarheidsinterval voor het populatiegemiddelde.
b.
Construeer een 95% betrouwbaarheidsinterval voor het populatiegemiddelde en vergelijk de breedte van dit interval met die van het interval in a.
c.
Geef een zorgvuldige interpretatie van beide betrouwbaarheidsintervallen en leg uit waarom het 80% betrouwbaarheidsinterval nauwer is.
7.5 Een aselecte steekproef met omvang n = 121 geeft = 0,88. a.
Is de steekproefomvang groot genoeg om de methoden in paragraaf 7.3 voor het construeren van een betrouwbaarheidsinterval voor p te gebruiken? Licht je antwoord toe.
b.
Construeer een 90% betrouwbaarheidsinterval voor p.
c.
Welke aanname is nodig om de geldigheid van dit betrouwbaarheidsinterval te kunnen verzekeren?
7.6 Stel dat je een populatiegemiddelde wilt schatten binnen een marge B = 0,20 met een kans gelijk aan 0,90. Je kent σ2 niet, maar je weet dat de waarden zullen liggen tussen 30 en 34. a.
Bepaal bij benadering de steekproefomvang die de gewenste nauwkeurigheid van de schatting zal opleveren. Je wilt aan de veilige kant blijven om er zeker van te zijn dat de steekproef groot genoeg is om de gewenste nauwkeurigheid van de schatting te verkrijgen. [Aanwijzing: gebruik je kennis van variatie van gegevens in paragraaf 2.6 en veronderstel dat het bereik van de meetwaarden gelijk is aan 4 σ.]
b.
Bereken bij benadering de benodigde steekproefomvang door de minder conservatieve aanname te maken dat het bereik van de meetwaarden gelijk is aan 6 σ.
7.7 Bepaal in elk van beide gevallen bij benadering de steekproefomvang die nodig is om een 95% betrouwbaarheidsinterval voor p met een marge B = 0,08 te construeren. a.
Veronderstel dat p dicht bij 0,2 ligt.
b.
Veronderstel dat je geen kennis vooraf hebt over p, maar dat je er zeker van wilt zijn dat je steekproef groot genoeg is om de gespecificeerde nauwkeurigheid voor de schatting te bereiken.
7.8 Stel N = 5000, n = 64 en s = 24. a.
Vergelijk de grootte van de standaardfout van berekend met en zonder eindige-populatiecorrectiefactor.
b.
Herhaal a, maar nu voor n = 400.
c.
Theoretisch zou de eindige-populatiecorrectiefactor altijd moeten worden gebruikt bij het nemen van een steekproef uit een eindige populatie voor het berekenen van de standaardfout van . Maar als n klein is ten opzichte van N, ligt de eindige-populatiecorrectiefactor dicht bij 1 en kan dan zonder bezwaar worden genegeerd. Laat zien hoe dit in a en b wordt geïllustreerd.
7.9 Stel dat je een populatiegemiddelde µ wilt schatten en dat = 422, s = 14, N = 375 en n = 40. Bepaal bij benadering een 95% betrouwbaarheidsinterval voor µ. 7.10 Bepaal voor elk van de volgende gevallen of je een z of een t toetsingsgrootheid (of geen van beide) zou gebruiken om een 95% betrouwbaarheidsinterval te construeren, en zoek dan de desbetreffende z of t waarde op. a.
Een aselecte steekproef met omvang n = 23 uit een normale verdeling met onbekend gemiddelde µ en onbekende standaarddeviatie σ.
b.
Een aselecte steekproef met omvang n = 135 uit een normale verdeling met onbekend gemiddelde µ en onbekende standaarddeviatie σ.
c.
Een aselecte steekproef met omvang n =10 uit een normale verdeling met onbekend gemiddelde µ en standaarddeviatie σ = 5.
d.
Een aselecte steekproef met omvang n = 83 uit een verdeling waar niets over bekend is.
e.
Een aselecte steekproef met omvang n = 12 uit een verdeling waar niets over bekend is.
7.11 In een aselecte steekproef van 400 meetwaarden hebben 227 van de meetwaarden het gezochte kenmerk A. a.
Gebruik een 95% betrouwbaarheidsinterval om de fractie p te schatten van de meetwaarden met kenmerk A.
b.
Hoe groot moet een steekproef zijn om p binnen 0,02 te schatten met een betrouwbaarheid van 95%?
II
Applying the Concepts
7.12 In het Journal of the American Medical Association (21 april 1993) staat een verslag van de resultaten van een ‘National Health Interview Survey’ om te bepalen hoeveel Amerikaanse volwassenen roken. Meer dan 40 000 volwassenen beantwoordden vragen als “Hebt u minstens 100 sigaretten in uw leven gerookt?” en “Rookt u nu sigaretten?” Aan mensen die nu roken (11 000 volwassenen in de enquête) werd ook gevraagd: “Hoeveel sigaretten rookt u nu gemiddeld per dag?” Het resultaat was een
gemiddelde van 20,0 sigaretten per dag met een 95% betrouwbaarheidsinterval (19,7 , 20,3). a.
Beschrijf zorgvuldig de populatie waaruit de steekproef is genomen.
b.
Interpreteer het 95% betrouwbaarheidsinterval.
c.
Noem eventuele aannames over de doelpopulatie van huidige sigarettenrokers waaraan moet zijn voldaan opdat gevolgtrekkingen op basis van het interval geldig zijn.
d.
Een onderzoeker van de tabaksindustrie claimt dat het gemiddeld aantal sigaretten dat wordt gerookt door mensen die regelmatig roken minder dan 15 is. Geef je mening over deze claim.
7.13 Uit onderzoek blijkt dat fietshelmen levens kunnen redden. Een onderzoek dat in Public Health Reports (mei-juni 1992) is gepubliceerd had tot doel manieren te vinden om het gebruik van helmen door kinderen aan te moedigen. Een van de variabelen die werden gemeten was de perceptie door de kinderen van het risico van fietsen. Er werd een vierpuntsschaal gebruikt met scores lopend van 1 (geen risico) tot 4 (zeer hoog risico). Een steekproef van kinderen in groep 6-8 gaf de volgende resultaten met betrekking tot de variabele risicoperceptie: = 3,39, s = 0,80. a.
Bereken een 90% betrouwbaarheidsinterval voor de gemiddelde risicoperceptie voor alle leerlingen in groep 6-8. Welke aannames heb je gemaakt opdat de geldigheid van het betrouwbaarheidsinterval wordt gegarandeerd?
b.
Als het populatiegemiddelde van de risicoperceptie groter is dan 2,50 concluderen de onderzoekers dat deze leerlingen tonen dat ze zich bewust zijn van het risico dat met fietsen gepaard gaat. Geef in deze context een interpretatie van het betrouwbaarheidsinterval dat in a is berekend.
7.16 – 7.14 401(k)-plannen, die genoemd zijn naar de paragraaf in de Internal Revenue Code 1978 die ze mogelijk heeft gemaakt, stellen werknemers in staat om een deel van hun inkomsten vóór belasting over te hevelen naar een belegging, zoals een gemeenschappelijk beleggingsfonds. Werkgevers passen in het algemeen 50% van de bijdrage van de medewerker bij tot ongeveer 6% van het salaris (Fortune, 28 dec. 1992). Een bedrijf dat bezorgd was over wat het zag als een geringe werknemerparticipatie in zijn 401(k)-plan, nam een steekproef van 30 andere ondernemingen met soortgelijke 401(k)-plannen en vroeg hun wat hun 401(k)participatie percentages waren. De volgende percentages werden verkregen:
Beschrijvende statistische grootheden worden in de SPSS-uitdraai gegeven. a.
Gebruik de informatie in de SPSS-uitdraai om een 95%betrouwbaarheidsinterval te construeren voor het gemiddelde participatiepercentage voor alle bedrijven die een 401(k)-plan hebben.
b.
Interpreteer het interval in de context van dit vraagstuk.
c.
Welke aanname is noodzakelijk opdat dit betrouwbaarheidsinterval geldig is?
d.
Als het bedrijf dat de steekproef heeft genomen een participatiepercentage van 71% heeft, kan het dan zonder meer concluderen dat dit percentage onder het populatiegemiddelde voor alle bedrijven met een 401(k)-plan ligt? Licht je antwoord toe.
e.
Als in de gegevensverzameling de 60% gelijk was geweest aan 80%, hoe zou dit dan het midden en de breedte van het betrouwbaarheidsinterval dat in a is berekend, hebben beïnvloed?
7.25 – 7.15 Het Hillsborough County (Florida) Water Department controleert regelmatig het drinkwater van huiseigenaren op verontreinigingen als lood en koper. Hieronder wordt een overzicht gegeven van het gehalte aan lood en koper in watermonsters die in 1998 voor een steekproef van 10 inwoners van Crystal Lakes Manors werden genomen.
Bron: Hillsborough County Water Department Environmental Laboratory, Tampa, Florida. a.
Construeer een 99% betrouwbaarheidsinterval voor het gemiddelde loodgehalte in watermonsters uit Crystal Lake Manors.
b.
Construeer een 99% betrouwbaarheidsinterval voor het gemiddelde kopergehalte in watermonsters uit Crystal Lake Manors.
c.
Interpreteer de intervallen in a en b in termen van de vraagstelling.
d.
Leg uit wat de term “99% betrouwbaarheid” betekent.
7.16 Volgens de Amerikaanse wet moeten alle nieuwe auto’s zijn uitgerust met airbags zowel voor de bestuurder als voor de passagier naast de bestuurder. Er bestaat echter bezorgdheid over de vraag of airbags misschien gevaar kunnen opleveren voor kinderen op de plaats naast de bestuurder. In een onderzoek door de National Highway Traffic Safety Administration (NHTSA) over 55 personen die door de explosieve kracht van een airbag werden gedood, bleek dat 35 van hen kinderen waren die naast de bestuurder zaten (Wall Street Journal, 22 jan. 1997). Dit onderzoek leidde ertoe dat sommige autobezitters met kinderen de airbag voor de plaats naast de bestuurder verwijderden. Beschouw alle dodelijk auto-ongelukken waarbij is vastgesteld dat een airbag de doodsoorzaak was. Noem p de werkelijke fractie van deze ongelukken waarbij een kind naast de bestuurder zat. a.
Gebruik de gegevens van het NHTSA-onderzoek om een schatting te maken van p.
b.
Construeer een 99% betrouwbaarheidsinterval voor p.
c.
Interpreteer het interval in b in termen van de vraagstelling.
d.
NHTSA-onderzoekers stelden vast dat 24 van de 35 kinderen die door een airbag werden gedood geen gordel droegen of niet goed in hun bewegingen werden beperkt. Wat voor invloed heeft deze informatie op je beoordeling van het risico van een dodelijk airbagongeluk?
7.17 Het is bekend dat familiebedrijven vaak problemen hebben met het overdragen van het bedrijf van de ene generatie op de volgende generatie. Een deel van dit probleem kan verklaard worden door het ontbreken van een goed gedocumenteerd bedrijfsplan. Uit een enquête door Arthur Anderson, de internationale accounting en consulting onderneming, onder 3900 familiebedrijven met een inkomen boven de $1 000 000 per jaar, bleek dat 1911 van deze bedrijven geen strategisch bedrijfsplan hadden (Minnesota Star Tribune, 4 sept. 1995). a.
Beschrijf de populatie die door Arthur Anderson werd onderzocht.
b.
Veronderstel dat de 3900 bedrijven aselect werden gekozen uit de populatie. Gebruik een 90% betrouwbaarheidsinterval om een schatting te maken van het percentage familiebedrijven zonder strategisch bedrijfsplan.
c.
Hoe breed is het 90% betrouwbaarheidsinterval in b? Zou een 80% betrouwbaarheidsinterval breder of smaller zijn? Licht je antwoord toe.
7.18 Betaal je voor bepaalde webdiensten? Het Graphics Visualization and Usability Center van het Georgia Institute of Technology heeft een enquête gehouden onder 13 000 internetgebruikers, waarin ze deze vroegen naar hun bereidheid om te betalen voor toegang tot websites. Van hen wilde 2938 beslist niet hiervoor betalen (Inc. Technology, No. 3, 1995). a.
Veronderstel dat de 13 000 gebruikers aselect waren gekozen. Construeer een 95% betrouwbaarheidsinterval voor het percentage dat beslist niet wil betalen.
b.
Hoe breed is het interval dat je in a hebt geconstrueerd? Voor de meeste toepassingen is deze breedte onnodig klein. Wat suggereert dit met betrekking tot de steekproefomvang?
c.
Hoe groot moet een steekproef zijn om het percentage binnen 2% te schatten met een betrouwbaarheid van 95%?
7.19 Volgens schattingen van het Amerikaanse General Accounting Office (vergelijkbaar met de Algemene Rekenkamer in Nederland) heeft de Internal Revenue Service IRS (de Amerikaanse belastingdienst) 18,3 telefonische vragen beantwoord tijdens een recente belastingperiode, en 17% van de IRS kantoren heeft daarbij antwoorden gegeven die fout waren. Deze schattingen waren gebaseerd op gegevens die waren verzameld in een steekproef van telefoontjes naar talloze IRS kantoren. Hoeveel IRS kantoren moeten er aselect worden gekozen om een schatting te kunnen maken van het percentage IRS kantoren dat geen juiste antwoorden geeft op vragen over schenkingsrecht, met een 90% betrouwbaarheidsinterval met breedte 0,06? 7.20 Uit een enquête die voor het tijdschrift Money werd uitgevoerd door de ICR Survey Research Group bleek dat 26% van de ouders van kinderen op een middelbare school die willen gaan studeren, in het geheel geen geld heeft gespaard voor deze studie. De enquête had een “...foutmarge van plus of min 4 percentagepunten” (Newark StarLedger, 16 aug. 1996). a.
Veronderstel dat er een aselecte steekproef is genomen voor de enquête en dat de onderzoekers een betrouwbaarheid van 95% voor hun resultaten willen hebben. Maak een schatting van de omvang van de steekproef die voor de enquête wordt gebruikt.
b.
Herhaal a, maar veronderstel nu dat de onderzoekers een betrouwbaarheid van 99% willen bereiken.
7.21 Vanaf het begin van de jaren 50 hebben accountants op grote schaal gebruik gemaakt van steekproeftechnieken in plaats van volledige controles om de financiële gegevens van de firma’s van hun klanten te testen en te beoordelen. Als een steekproef wordt gebruikt om de totale waarde in dollars van een rekening - het rekeningsaldo - te schatten, wordt het onderzoek een gegevensgerichte steekproef genoemd (Arkin,
Sampling Methods for the Auditor, 1982). Om de redelijkheid te toetsen van de door een bedrijf gegeven totale waarde van de onderdelen in voorraad, neemt een accountant een aselecte steekproef van 100 van de 500 onderdelen op voorraad, bepaalt de prijs van elk onderdeel en presenteert de resultaten die in onderstaande tabel worden gegeven. Beschrijvende statistische grootheden voor de gegevens staan in de hierbij gevoegde SPSS-uitdraai. a.
Geef een puntschatting van de gemiddelde waarde van de voorraad onderdelen.
b.
Bepaal de geschatte standaardfout van de puntschatting van a.
c.
Construeer een benaderd 95% betrouwbaarheidsinterval voor de gemiddelde waarde van de voorraad onderdelen.
d.
Het bedrijf rapporteert een gemiddelde waarde van de onderdelenvoorraad van $300. Wat suggereert het betrouwbaarheidsinterval in c over de redelijkheid van deze waarde? Licht je antwoord toe.
7.22 In een onderzoek naar fouten in facturen in een nieuw factureringssysteem van een bedrijf neemt een accountant een aselecte steekproef van 35 facturen die door het nieuwe systeem zijn geproduceerd en legt het werkelijke bedrag (A), het bedrag van de factuur (I) en het verschil (of fout) x = (A – I) vast. Het resultaat is = $1 en s = $124. Op het moment dat de steekproef is genomen heeft het nieuwe systeem 1500 facturen geproduceerd. Gebruik deze informatie om bij benadering een 95% betrouwbaarheidsinterval te construeren voor de werkelijke gemiddelde fout per factuur van het nieuwe systeem. Interpreteer het resultaat.
7.23 Zie opgave 7.12 over het rapport in het Journal of the American Medical Association (21 april 1993) over het roken van sigaretten door volwassenen in de VS Van de 43 732 respondenten van de enquête zeggen 11 239 personen dat ze roken en 10 539 dat ze vroeger gerookt hadden. a.
Construeer en interpreteer een 90% betrouwbaarheidsinterval voor het percentage volwassenen in de VS dat sigaretten rookt.
b.
Construeer en interpreteer een 90% betrouwbaarheidsinterval voor het percentage volwassenen in de VS dat vroeger sigaretten heeft gerookt.
7.24 In Management Accounting van juni 1995 staan de resultaten van de zesde jaarlijkse salarisenquête van de leden van het Institute of Management Accountants (IMA). De 2112 leden die op de enquête hebben gereageerd, hebben een salarisverdeling met een
20e percentiel gelijk aan $35 100, een mediaan gelijk aan $50 000 en een 80e percentiel gelijk aan $73 000. a.
Gebruik deze informatie om de minimum steekproefomvang te bepalen die nodig is om in de enquête van volgend jaar het gemiddelde salaris van IMAleden te schatten met een nauwkeurigheid van $2000 en met een betrouwbaarheid van 98%.
b.
Leg uit hoe je de standaarddeviatie hebt geschat die nodig is voor de berekening van de steekproefomvang.
c.
Maak een lijst van alle aannames die je hebt gedaan.
7.25 In 1989 begon de American Society for Quality Control met de publicatie van het tijdschrift Quality Engineering. In 1994 heeft het tijdschrift een vragenlijst naar de 8521 abonnees gestuurd. Er werden in totaal 202 reacties ontvangen. In de tabel staan de antwoorden op de vraag “hoe lang bent u al abonnee?” a.
Welke aanname(s) zijn nodig om de betrouwbaarheidsinterval methode van hoofdstuk 7 te kunnen toepassen voor het schatten van de gemiddelde abonnementsduur voor de populatie van 8521 abonnees?
b.
Gebruik een 98% betrouwbaarheidsinterval om het populatiegemiddelde in a te schatten.
c.
Beschrijf mogelijke niet-steekproeffouten die deze enquête kunnen verstoren.
7.26 Zie opgave 7.16 over het onderzoek door de National Highway Traffic Safety Administration (NHTSA) over dodelijke auto-ongelukken die door airbags zijn veroorzaakt. We hebben gezien dat de NHTSA een schatting wil maken van de fractie van zulke ongelukken waarbij kinderen op de plaats naast de bestuurder werden gedood. Hoeveel dodelijke ongelukken moeten er in een steekproef worden verzameld opdat deze fractie tot op 0,1 van de werkelijke waarde kan worden geschat, met een 99% betrouwbaarheidsinterval?