© 2006 Wolters-Noordhoff bv Groningen/Houten
De groothandel
Onderwerp: regressieanalyse met SPSS Bij: hoofdstuk 10 Een groothandel heeft onderzoek gedaan onder de klanten en daarbij geprobeerd met regressieanalyse vast te stellen wat de bepalende factoren zijn voor de hoogte van de inkoop over de laatste twaalf maanden. De afhankelijke variabele is omzet en de onafhankelijke variabelen zijn: jaren = aantal jaren klant; bonus = heeft bonus over totale inkoop gehaald; assorti = aantal assortimentsgroepen afgenomen; huismerk = voert ons huismerk nee/ja; vorig = omzet voorgaande jaar; bezoek = aantal bezoeken vertegenwoordiger; internet = bestelt per internet nee/ja; spaar = doet mee aan spaarprogramma nee/ja. Natuurlijk zijn de nee/ja variabelen gecodeerd als nul en een. Hierachter vind je de output. Variables Entered/Removed Model Variables Entered
a
Variables Removed .
1
vorig = omzet voorgaande jaar
2
bezoek = aantal bezoeken vertegenwoordiger
.
3
internet = bestelt per internet
.
4
spaar = doet mee aan spaarprogramma
.
Method Forward (Criterion: Probability-of-F-to-enter <= ,050) Forward (Criterion: Probability-of-F-to-enter <= ,050) Forward (Criterion: Probability-of-F-to-enter <= ,050) Forward (Criterion: Probability-of-F-to-enter <= ,050)
a Dependent Variable: omzet = omzet
Model Summary
,747a ,817b
R Square ,558 ,667
Adjusted R Square ,557 ,666
Std. Error of the Estimate 2,519 2,187
3
,819c
,671
,670
2,175
4
,821d
,674
,672
2,168
Model 1 2
R
a Predictors: (Constant), vorig = omzet voorgaande jaar b Predictors: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger c Predictors: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger, internet = bestelt per internet d Predictors: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger, internet = bestelt per internet, spaar = doet mee aan spaarprogramma
De groothandel
1
© 2006 Wolters-Noordhoff bv Groningen/Houten
ANOVAe Model 1 Regression Residual Total 2 Regression Residual Total 3 Regression Residual Total 4 Regression Residual Total
Sum of Squares 5448,895 4313,910 9762,805 6514,915 3247,890 9762,805 6555,458 3207,347 9762,805 6579,348 3183,457 9762,805
df Mean Square 1 5448,895 680 6,344 681 2 3257,457 679 4,783 681 3 2185,153 678 4,731 681 4 1644,837 677 4,702 681
F 858,907
Sig. ,000a
681,000
,000b
461,919
,000c
349,794
,000d
a Predictors: (Constant), vorig = omzet voorgaande jaar b Predictors: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger c Predictors: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger, internet = bestelt per internet d Predictors: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger, internet = bestelt per internet, spaar = doet mee aan spaarprogramma e Dependent Variable, omzet = omzet
Coefficientsa
Model 1 2
3
4
(Constant) vorig = omzet voorgaande jaar (Constant) vorig = omzet voorgaande jaar bezoek = aantal bezoeken vertegenwoordiger (Constant) vorig = omzet voorgaande jaar bezoek = aantal bezoeken vertegenwoordiger internet = bestelt per internet (Constant) vorig = omzet voorgaande jaar bezoek = aantal bezoeken vertegenwoordiger internet = bestelt per internet spaar = doet mee aan spaarprogramma
Unstandardized Standardized Coefficients Coefficients B Std. Error Beta t Sig. 1,155 ,165 6,984 ,000 ,690 ,024 ,747 29,307 ,000 -,448 ,179 -2,498 ,013 ,611 ,021 ,662 28,965 ,000 ,272
,018
,341
14,929
,000
-2,643 ,617
,771 ,021
,668
-3,429 29,271
,001 ,000
,289
,019
,363
15,181
,000
,374 -2,166 ,612
,128 ,797 ,021
,069 ,663
2,928 -2,718 28,954
,004 ,007 ,000
,289
,019
,363
15,226
,000
,369
,127
,068
2,901
,004
-,096
,042
-,050
-2,254
,025
a Dependent Variable, omzet = omzet
2
Marktonderzoek
© 2006 Wolters-Noordhoff bv Groningen/Houten
Excluded Variablee
Model 1
2
3
4
jaren = aantal jaren klant bonus = heeft bonus over totale inkoop gehaald assorti = aantal assortimentsgroepen afgenomen huismerk = voert ons huismerk ja/nee bezoek = aantal bezoeken vertegenwoordiger internet = bestelt per internet spaar = doet mee aan spaarprogramma jaren = aantal jaren klant bonus = heeft bonus over totale inkoop gehaald assorti = aantal assortimentsgroepen afgenomen huismerk = voert ons huismerk ja/nee internet = bestelt per internet spaar = doet mee aan spaarprogramma jaren = aantal jaren klant bonus = heeft bonus over totale inkoop gehaald assorti = aantal assortimentsgroepen afgenomen huismerk = voert ons huismerk ja/nee spaar = doet mee aan spaarprogramma jaren = aantal jaren klant bonus = heeft bonus over totale inkoop gehaald assorti = aantal assortimentsgroepen afgenomen huismerk = voert ons huismerk ja/nee
Beta In t ,003a
SiQ. ,130
Collinearity Partial Statistics Correlation Toleranee ,897 ,005 ,996
,035a
1,327
,185
,051
,958
,057a
2,243
,025
,086
,997
a
,034
1,321
,187
,051
,998
,341a
14,929
,000
,497
,938
a
-,042 -,049a ,017b
-1,609 -1,917 ,769
,108 ,056 ,442
-,062 -,073 ,030
,973 ,988 ,994
,039b
1,727
,085
,066
,958
,029b
1,326
,185
,051
,990
,019b ,069b -,051b ,015c
,877 2,928 -2,287 ,665
,381 ,004 ,023 ,506
,034 ,112 -,087 ,026
,996 ,879 ,988 ,993
,028c
1,227
,220
,047
,927
,033c
1,470
,142
,056
,988
,019c -,050c -,032d
,870 -2,254 -1,105
,385 ,025 ,270
,033 -,086 -,042
,996 ,988 ,556
,022d
,966
,334
,037
,913
,035d
1,595
,111
,061
,985
d
,773
,440
,030
,994
,017
a Predictors in the Model: (Constant), vorig = omzet voorgaande jaar b Predictors in the Model: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger c Predictors in the Model: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger, internet = bestelt per internet d Predictors in the Model: (Constant), vorig = omzet voorgaande jaar, bezoek = aantal bezoeken vertegenwoordiger, internet = bestelt per internet, spaar = doet mee aan spaarprogramma e Dependent Variable: omzet = omzet
Vragen 1 Regressieanalyse kun je doen door een voor een de variabelen in te voegen (forward), door ze allemaal tegelijk in te voegen en door variabelen die te weinig opleveren te verwijderen (backward). Welke methode van regressieanalyse is gebruikt? 2 Een R² van 0,9 of hoger is fantastisch, zo mooi dat je je moet afvragen of je niet eigenlijk dezelfde dingen meet. Tussen de 0,8 en 0,9 is goed en tussen 0,65 en 0,8 is voldoende. Onder de 0,65 is het regressiemodel te zwak. Is de analyse geslaagd? 3 Geef de regressieformule van de laatste stap. 4 De groothandel heeft enkele marketinginstrumenten ingezet (bonus, huismerk, bezoek, internet, spaar). Welke daarvan werken wel en welke niet?
De groothandel
3
© 2006 Wolters-Noordhoff bv Groningen/Houten
5 6
4
Zijn oude relaties in de groothandel (mijn vader was al klant) nog bepalend? Waarom komt er in stap twee de variabele bezoek bij en niet een andere variabele?
Marktonderzoek
© 2006 Wolters-Noordhoff bv Groningen/Houten
Antwoorden 1 Methode forward. 2 Geslaagd? Ja, net aan, vanwege de adjusted R-square van 67,2% 3 Regressieformule van de laatste stap: omzet = -2.166 + 0.612 × vorig + 0.289 × bezoek + 0.369 × internet – 0.096 × spaar. 4 Alleen vorig, bezoek, internet en spaar werken, want die zitten in de regressievergelijking. 5 De variabele aantal jaren klant zit niet in de vergelijking, en dus zijn oude relaties in de groothandel niet significant van belang voor de omzet. 6 In stap 2 komt de variabele bezoek erbij vanwege de grootste t-waarde in stap 1.
De groothandel
5