os t rp
yo
Business Administration / Bedrijfskunde
Schriftelijk tentamen - UITWERKINGEN
:
Vakcode Datum Docent(en)
: : :
Statistische Methoden en Technieken BKB0019t 22 maart 2010 dr J. van Dalen
Groep
:
niet van toepassing
Soort tentamen Tijd Aantal pagina’s (incl. voorblad)
: : :
gesloten boek 9.30 - 12.30 uur 9
op
Algemeen Vak
Opmerkingen
tc
• De uitwerkingen in dit formulier betreffen antwoordschetsen. Alternatieve formuleringen zijn niet bij voorbaat uitgesloten.
• De puntenverdeling die binnen de onderdelen wordt genoemd, is indicatief. Bij de precieze allocatie van punten wordt mee rekening gehouden met de kwaliteit van het gehele antwoord.
Do
no
• Schoonheidsfoutjes in de uitwerkingen zijn niet uitgesloten. Eventuele missers graag doorgeven. • Nadruk en verdere verspreiding verboden.
1
os t
rp
Vraag 1: Rook- en examengedrag in Turijn
(6 pnt) Gevraagd: toetsen veronderstelling (H0 ) dat aandeel rokende studenten gelijk is aan 0.50, uitgaande van α = 1%.
(a)
3. Z ∼ n(0, 1)
yo
1. H0 : p = 0.50; H1 : p 6= 0.50 p − p0 2. Z = p S p0 (1 − p0 )/n
4. ps << 0.50 ∨ ps >> 0.50 of Zobs << 0 ∨ Zobs >> 0 5. α = 0.01
6. −z0.005 = −2.58 en +z0.005 = 2.58 √ 236 7. Zobs = ( 600 − 0.50)/ 0.50 × 0.50/600 = −0.107/0.020 = −5.226 < −2.58 ⇒ verwerp H0 op α gelijk 1%: het aandeel rokende studenten in Turijn wijkt significant af van (is lager dan) 0.50.
op
Opmerking: dit is een toets voor een proportie; onjuiste bepaling standaardfout leidt standaard tot een punt aftrek. (6 pnt) Gevraagd: toetsen veronderstelling dat tentamendeelname 364 nietrokende Turijnse studenten over de vier kwartielen overeenkomt met 20%, 40%, 30% en 10%, uitgaande van α = 1%.
(b)
tc
1. H0 : p1 = 0.20, p2 = 0.40, p3 = 0.30, p4 = 0.10; H1 : niet alle pk zoals gespecificeerd 4
2. Y =
(Ok − Ek )2 , waarbij Ek = npk , k = 1, 2, 3, 4 ∑ Ek k =1
3. Y ∼ χ2 (K − 1) = χ2 (3); K = 4, n = 600
4. Yobs >> 0
Do
no
5. α = 0.01
6. χ23,0.01 = 11.345 (55−364×0.2)2
(147−364×0.4)2
(112−364×0.3)2
(50−364×0.1)2
7. Yobs = + + + = 364×0.2 364×0.4 364×0.3 364×0.1 4.352 + 0.013 + 0.072 + 5.081 = 9.519 < 11.345 ⇒ handhaaf H0 op α gelijk 1%: de waargenomen fracties niet-rokende Turijnse student in de kwartielen van tentamendeelname wijken niet significant af van de populatieproporties op een significantieniveau van 1%.
Opmerking: dit is een χ2 -toets op een veronderstelde verdeling.
2
os t
(6 pnt) Gevraagd: berekenen minimale verwachte celfrequentie bij onderzoek onafhankelijk verdeeld-zijn van rookgedrag en tentamendeelname.
rp
(c)
• Verwachte celfrequenties onder onafhankelijkheid worden gevonden als Eij = n pˆ ij = n pˆ i pˆ j . De marginale kansen pˆ i en pˆ j zijn geschat op basis van rij- en kolomtotalen: pˆ i = ni /n en pˆ j = n j /n. De minimale verwachte celfrequenties wordt gevonden voor de cel waarvoor de rijfrequentie en de kolomfrequentie beide minimaal zijn.
yo
• De minimale rijfrequentie is 55 (tentamendeelname > 75%), de minimale kolomfrequentie is 236 (rokende studenten), zodat de minimale verwachte celfrequentie gelijk is aan E41 = 55 × 236/600 = 21.6. • De minimale verwachte celfrequentie is nodig om te beoordelen of wordt voldaan aan de ’rule of five’ (de eis dat de verwachte celfrequenties groter zijn dan vijf). Maar hierover werd bij dit onderdeel niets gevraagd.
op
• De weergave van een tabel met verwachte frequenties (niet gevraagd) zonder duiding van de minimale verwachte frequentie is met hooguit drie punten gewaardeerd.
(6 pnt) Gevraagd: benoemen en toelichten geëigende toetsgrootheid voor analyseren tentamendeelname en rookgedrag als ordinale variabelen.
(d)
tc
• Achtergrond: tentamendeelname en rookgedrag van Turijnse studenten zijn beide ordinaal gemeten variabelen. In het geval van tentamendeelname is dat direct duidelijk omdat het een gedegeneeerde kwantitatieve variabele betreft, terwijl het voor rookgedrag niet echt een issue is omdat het een dummyvariabele betreft. De Pearson χ2 -grootheid laat deze attribuutinformatie onbenut.
Do
no
• Wanneer tentamendeelname en het al dan niet roken van studenten worden beschouwd als ordinale variabelen dan is de Spearman rangcorrelatie geëigend om de samenhang te onderzoeken. • Eventueel zou de Mann-Whitney-toetsgrootheid gebruikt kunnen worden, maar dan wordt in het antwoord niets gedaan met eventuele ordinaliteit van het rookgedrag. In ieder geval moet dit antwoord afdoende toegelicht worden. Het maximale aantal verkrijgbare punten is dan 3.
3
os t rp
Vraag 2: The thrill of suspense
(6 pnt) Gevraagd: (i) causaal relatieschema voor onderzoekshypothesen Bastick (2006); (ii) beschrijven rol van daadwerkelijk ervaren emotie (ErvEmot).
(a)
AntSurp
+
ErvSurp
yo
• Een causaal relatieschema op basis van de onderzoekshypothesen in de tekst (inclusief causaliteitsrichting en verwachte aard van de relatie voor zover gespecificeerd) ziet eruit als volgt (3 pnt):
+
+
AntEmot
+
ErvEmot
Satisfac
op
• De feitelijk ervaren emotie (ErvEmot) heeft de rol van interveniërende variabele voor met name de invloed van de ervaren verrassing (ErvSurp) op de tevredenheid over het assortiment (Satisfac). (3 pnt) (6 pnt) Gevraagd: onderzoeken of samenhang tussen feitelijk ervaren emotie (ErvEmot) en tevredenheid over assortiment (Satisfac) wordt doorkruist door invloed feitelijk ervaren verrassing (ErvSurp); stappenschema’s niet nodig.
tc
(b)
• Voor opschonen. De samenhang tussen feitelijk ervaren emotie (ErvEmot) en tevredenheid over assortiment (Satisfac) is (zeer) significant positief (r = 0.369, p = 0.000). De significantie volgt uit het feit dat de waargenomen waarde van de toetsgrootheid gelijk is aan q 2 1−0.369 Tobs = 0.369 365−2 = 7.564.(2 pnt)
Do
no
• Na opschonen. Controleren voor de invloed van ervaren verrassing geeft als partiële correlatie: r12.3
=
q
=
p
r12 − r13 r23 q 2 ) (1 − r 2 ) (1 − r13 23 0.369 − 0.267 × 0.575
(1 − 0.2672 )(1 − 0.5752 )
= 0.215/0.788 = 0.273
Deze partiële correlatie is kleiner dan de paarsgewijze correlatie, maar de waargenomen waarde van de toetsgrootheid is nog altijd: Tobs = q 2 1−0.273 0.273 365−2 = 5.404, en dus nog steeds zeer significant (r12.3 = 0.273, p = 0.000). (2 pnt)
4 • Conclusie. Zowel voor als na opschonen voor de feitelijk ervaren verrassing (ErvSurp) is de samenhang tussen de ervaren emotie en de tevredenheid over het assortiment significant positief, zodat er geen doorkruisendheid van betekenis heeft plaatsgevonden. (2 pnt)
os t
(6 pnt) Gevraagd: toetsen veronderstelling (H0 ) dat de samenhang in de huidige steekproef overeenkomt met de eerder gevonden 0.4, uitgaande α = 5%. 1. H0 : ρ = 0.4; H1 : ρ 6= 0.4 √ 1 1 + r 1 1 + 0.4 ln − ln 2. Z = n − 3 2 1 − r 2 1 − 0.4 3. Z ∼ n(0, 1)
rp
(c)
4. robs << 0.4 ∨ robs >> 0.4, of Zobs << 0 ∨ Zobs >> 0
yo
5. α = 0.05
op
6. −z0.025 = −1.96 en +z0.025 = +1.96 √ √ 1 1 + 0.267 1 1 + 0.4 ln − ln = 7. Zobs = 365 − 3 362(0.274 − 2 1 − 0.267 2 1 − 0.4 √ 0.423) = 362 × (−0.15) = −2.858 < −1.96 ⇒ verwerp H0 op α gelijk aan 5%: de correlatiecoëfficiënt tussen ervaren verrassing (ErvSurp) en tevredenheid over het assortiment (Satisfac) wijkt in de steekproef significant af van (is lager dan) de eerder gevonden 0.4 uitgaande van significantieniveau gelijk aan 5%.
(6 pnt) Gevraagd: (i) populatieregressiemodel voor samenhang tussen tevredenheid (Satisfac) en ervaren verrassing (ErvSurp); en (ii) bepalen gestandaardiseerde regressiecoëfficiënt van het verrassingseffect.
(d)
tc
(i) Het populatieregressiemodel ziet er uit als volgt (3 pnt): Satisfac = α + βErvSurp + e,
e ∼ n(0, σ )
Do
no
(ii) De waarde van de gestandaardiseerde regressiecoëfficiënt komt in dit enkelvoudige regressiemodel overeen met de correlatiecoëfficiënt van tevredenheid (Satisfac) en de ervaren verrassing (ErvSurp), beta = r = 0.267. (3 pnt) Uit het antwoord bij (ii) moest wel duidelijk zijn dat men begreep dat het hier gaat om een gestandaardiseerde (dus niet een gewone) regressiecoëfficiënt.
5
os t
rp
Vraag 3: M&A’s en de levenscyclus van industrieën
(6 pnt) Gevraagd: onderzoeken of de variantie van de transactiewaarde groter is voor volwassen (mature) dan voor groei (growth) bedrijfstakken (H1 ); ga uit van α = 5%.
(a)
2 ≤ σ2 ; H : σ2 > σ2 1. H0 : σM 1 M G G
2. F = S2M /S2G 4. S2M >> S2G , Fobs >> 1 5. α = 0.05 6. F40,100,0.05 = 1.52
yo
3. F ∼ F (n M − 1, nG − 1) = F (40, 100); n M = 41, nG = 101
7. Fobs = 1992 /1812 = 1.209 < 1.52 (= F40,100,0.05 ) ⇒ handhaaf H0 op α gelijk 5%: de variantie van de transactiewaarde is voor volwassen bedrijven niet significant groter dan voor groei bedrijven.
op
Veel gemaakte fouten bij dit onderdeel zijn het niet kwadrateren van de standaarddeviaties in de berekening van Fobs en het tweezijdig uitvoeren van de toets (hetgeen in het licht van de onderzoekshypothese in dit geval niet geëigend is).
(6 pnt) Gevraagd: berekenen geschatte standaardfout van het verschil tussen de steekproefgemiddelden van de transactiewaarde in volwassen (mature) en groei (growth) bedrijfstakken. Ga uit van gelijke varianties van de transactiewaarde in de beide deelpopulaties.
tc
(b)
• Uitgaande van gelijke varianties van de transactiewaardeq in de beide deelpopulaties is de geschatte standaardfout gelijk aan SP n1M + n1 G
• De gepoolde variantie is gelijk aan (3 pnt):
=
Do
no
S2P
=
(n M − 1)S2M + (nG − 1)S2G n M + nG − 2 (41 − 1)1992 + (101 − 1)1812 = 34715.286 41 + 101 − 2
• Hiermee wordt de geschatte standaardfout van het verschil tussen de steekproefgemiddelden van de transactiewaarde berekend als (3 pnt): s r √ 1 1 1 1 SP + = 34715.286 + = 186.320 × 0.185 nM nG 41 101
= 34.503 6
os t
(6 pnt) Gevraagd: (i) 95%-betrouwbaarheidsintervalschatting verschil tussen verwachte transactiewaarden in volwassen (mature) en groei (growth) bedrijfstakken; (ii) beoordelen of veronderstelde gelijkheid van verwachte transactiewaarden blijft gehandhaafd op α = 5% aan de hand van het berekende betrouwbaarheidsinterval.
rp
(c)
yo
(i) Een 95%-betrouwbaarheidsintervalschatting voor µ M − µG wordt gevonden als (3 pnt): s 1 1 X M − X G ± tn−2,α/2 SP + nM nG
⇔ 166 − 110 ± t140,0.025 × 34.503 ⇔ 56 ± 1.977 × 34.503 ⇔ 56 ± 68.212 ⇔ (−12.212; 124.212)
op
(ii) Vanwege de rekentechnische overeenkomsten, en de vergelijkbare instellingen van de betrouwbaarheidsintervalschatting (gekozen α en tweezijdigheid), betekent het feit dat het veronderstelde verschil µ M − µG = 0 in het betrouwbaarheidsinterval ligt, dat de nulhypothese bij toetsen gehandhaafd blijft. (3 pnt) Noot: zomaar ’nulpunt’ noemen bij onderdeel (ii) is niet volledig gehonoreerd, omdat niet duidelijk is wat ermee wordt bedoeld. (6 pnt) Gevraagd: (i) berekenen significantie (p-waarde) toetsresultaat van onderzoek naar de hypothese (H1 ) dat de verwachte transactiewaarde voor volwassen (mature) bedrijfstakken groter is dan voor groei (growth) bedrijfstakken; en (ii) beoordelen of toetsresultaat significant is, uitgaande α = 1%.
tc
(d)
• De toetssituatie is: H0 : µ M − µG ≤ 0, H1 : µ M − µG > 0 (er wordt rechtseenzijdig getoetst). De waarde van de toetsgrootheid is gelijk aan Tobs = (116 − 110)/34.503 = 1.623.
• De gevraagde p-waarde wordt gevonden als:
Do
no
p = P( T > | Tobs | | µ M − µG ≤ 0) ∼ = P( Z > 1.623) = 0.053
Aangezien p = 0.053 > 0.01 = α blijft de nulhypothese gehandhaafd: de verwachte transactiewaarde in volwassen bedrijfstakken is niet significant groter dan die in groei bedrijfstakken op basis van α gelijk aan 1%.
Noot: de betekenis van p als kans moet in de voorgaande stap toegelicht zijn; zomaar een getal of ’Zobs in tabel invullen geeft. . . ’ roepen levert niet de volle punten op.
7
os t
rp
Vraag 4: Verkoopresultaten familiebedrijf
(6 pnt) Gevraagd: (i) berekenen vier fit-maatstaven voor het uitgebreide model 1: meervoudige samenhang (R), mate van verklaring (R2 ), aangepaste mate van verklaring (R2adj ) en geschatte standaardfout regressiemodel (σˆ ); en (ii) benoemen preferente maatstaf voor beoordelen verklaringskracht beide modellen.
(a)
• De vier fit maatstaven worden gevonden als (4 pnt):
=
R
=
R2adj
= =
σˆ
=
2953.142 SSR = = 0.384 SST 7684.000 √ √ R2 = 0.384 = 0.620 4730.858/75 SSE/(n − K − 1) = 1− 1− SST/(n − 1) 7684.000/81 63.078 1− = 1 − 0.665 = 0.335 94.864 √ √ √ σˆ 2 = MSE = 63.078 = 7.942
yo
R2
op
• De aangepaste mate van verklaring heeft de voorkeur voor het vergelijken van de fit van deze geneste modellen, omdat deze rekening houdt met de informatie-inhoud (verklaarde variatie per vrijheidsgraad) van de toegevoegde variabelen. (2 pnt) (6 pnt) Gevraagd: onderzoek of volgen interne cursussen meer bijdraagt aan de verkoopprestaties dan lage vooropleiding, uitgaande van α = 1%.
tc
(b)
De coëfficiënt van dOpleid3, β 2 , meet het verschil tussen de verwachte verkoopprestaties van medewerkers met een interne cursus (Opleid=3) en medewerkers met alleen een lage vooropleiding (Opleid=1) – andere kenmerken constant houdend.
Do
no
1. H0 : β 2 ≤ 0, H1 : β 2 > 0 2. T = ( βˆ 2 − β 2 )/S ˆ β2
3. T ∼ t(n − K − 1) = t(75); n = 82, K = 6 4. βˆ 2 >> 0, Tobs >> 0 5. α = 0.01
6. +t75,0.01 = +2.377 7. Tobs = 5.791/2.126 = 2.724 > +2.377 ⇒ verwerp H0 op 1%: verwachte verkoopprestaties liggen significant hoger voor medewerkers met interne cursussen dan medewerkers met lager vooropleiding op significantieniveau van 1%.
8
os t
(6 pnt) Gevraagd: onderzoek of gezamenlijke bijdrage van de opleidingsniveaus aan de verklaring van verkoopprestaties significant is op α = 2.5%. Uitvoeren toets op meervoudige restricties (partial F-test):
rp
(c)
1. H0 : β 1 = β 2 = 0; H1 : β 1 en β 2 niet beide gelijk aan nul 2. F =
(SSER − SSEU )/r SSEU /(n − K − 1)
4. F >> 1 5. α = 0.025 6. F2,75,0.025 = 3.88
yo
3. F ∼ F (r, n − K − 1) = F (2, 75) (r = 2, n = 82, K = 6)
(5360.398 − 4730.858)/2 = 314.77/63.078 = 4.990 > 3.88 = 4730.858/75 F2,75,0.025 ⇒ verwerp H0 op α gelijk aan 2.5%: de gezamenlijke bijdrage van de opleiding aan de verklaring van variatie in verkoopprestaties is significant op 2.5%.
op
7. Fobs =
(6 pnt) Gevraagd: (i) berekenen significantie (p-waarde) van Branche-effect in uitgebreide (’U’) en beperkte (’R’) modellen; en (ii) onderzoeken of invloed verkoopafdeling wordt doorkruist door de opleiding van medewerkers.
(d)
(i) De p-waarden van het Branche effect in beide modellen wordt uitgaande van tweezijdig toetsen gevonden als (3 pnt):
= 2P( T > | − 0.607|) ≈ 2P( Z > 0.607) = 2 × 0.273 = 0.546 = 2P( T > | − 0.400|) ≈ 2P( Z > 0.400) = 2 × 0.345 = 0.690
tc U:p
R:p
(ii) Onderzoek naar doorkruisendheid komt in deze context vreemd over, maar het betekent niets meer dan het vergelijken van het geschatte Branche-effect voor (’R’) en na (’U’) opschonen het opleidingseffect (3 pnt):
Do
no
Voor opschonen: het Branche-effect in het beperkte model is negatief en niet-significant ( βˆ Br = −0.400, p = 0.690). Na opschonen: na opnemen van de opleiding in het regressiemodel is het Branche-effect in het uitgebreide model nog steeds negatief en niet-significant ( βˆ Br = −0.607, p = 0.546). Conclusie: het Branche-effect was en blijft niet-significant na opschonen voor de opleiding, zodat er geen doorkruisendheid van betekenis is.
9