Marketingový výzkum 6
•Analýza dat •Grafy •Závěrečná zpráva
Analýza dat 1. Deskriptivní statistika – výběr vhodných měřítek 2.Induktivní statistika - měření a testování závislostí
Na výběr statistické metody má vliv • Typ dat (použitá škála) • Typ výzkumu – – – –
nezávislost výběrů, počet skupin, počet proměnných možnost kontroly proměnných
1. stupeň zpracování • Popis odpovědí pro celý soubor, pro jednotlivé části (Ž,M) • Absolutní a relativní četnosti • Míry polohy • Míry variability (vč. var.koef.) • Míry šikmosti
• Tvorba kontingenčních tabulek
Kategorie měřící škály
Typ postoje
Kdy použít
Typická aplikace
Statistické testy
Nominální
Ano, ne
Objekty jsou stejné nebo rozdílné
Pohlaví, sociální třída
%, mo, chíkvadrát
Ordinální, pořadové
Pořadí, párové srovnání,
Objekty jsou větší či menší
Řazení
Me, korelace pořadí, percentily
Intervalové
Likert,Thurstone , sem.d.
Intervaly jsou stejné
Měření postojů
Průměr, směrod. odchylka, anova, regrese, faktorová an.
0 má smysl, možné srovnání absolutních odchylek
Tržby, počty výrobků, věk
geom. a harm. průměr, variační koeficient
Poměrové
Rozdělení četností Zájem o službu
Počet
Histogram
% 5
Ano
124
11,1 4
Asi ano Nevím
211
18,9 3
376
33,7 2
Asi ne
204
18,3
Ne
200
17,9
1 0
Celkem
115
50
100
150
200
250
300
350
400
99,9 3
Ano
124
11,1
Asi ano
211
18,9
Nejistota, nezájem
780
69,9
2
1 0
200
400
600
800
1000
Pořad .číslo 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Velikost balení (l) 2 2 2 2 2 2 2 2 2 2
Cena Kč/l 24,95 21,45 27,40 24,50 24,50 26,10 22,45 27,40 26,10 26,10
Pořad .číslo 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.
Velikost balení (l) 2 2 2 2 1 1 1 1 1 1
Cena Kč/litr 24,95 22,45 27,40 22,45 28,60 28,00 32,00 24,90 32,60 21,90
Velikost Pořad. balení (l) Cena číslo Kč/litr 21. 1 24,90 22. 1 27,50 23. 1 24,90 24. 1 30,00 25. 1 30,00 26. 1 24,90 27. 1 27,50 28. 1 27,50 29. 1 24,90 30. 1 31,00
6
5
5
4
Četnosti
Četnosti
•Aritmetický průměr = 26,31 Kč, medián = 26,10 Kč, směrodatná odchylka = 2,86 Kč
4 3 2
3 2 1
1
0
0 23
25
27
29
31
33
Cena ( balení 1l) Kč
23
25
Průměrná cena džusu (balení 1l) = 27,57 Kč, průměrná cena džusu (balení 2l) = 24,87 Kč
27
29
31
33
Cena (balení 2l) Kč
Deskriptivní statistika Průměrné skóre
Uživatelé
Řídím nerad
3,7
4,3
2,9
1,4
Rád chodím pěšky
3,9
3,8
4,0
-0,2
Sleduji cenu benzínu
5,3
6,1
4,4
1,7
Zajímá mě znečištění ovzduší
4,6
4,6
4,6
3,9
Souhlas na škále 1(silný s.7 (silný n.)
Podíl resp., Kteří kladně odpověděli :
36%
50%
Neuživatelé
25%
„Bydlím do vzdálenosti 1 km “od stanice metra“ Velikost vzorku
62
28
34
Rozdíl mezi průměry
25%
Deskriptivní statistika Otázka
Škála
Odpověď
Četnost
%
-3
300
30
-2
120
12
-1
50
5
0
50
5
1
100
10
2
300
30
3
80
8
Nesouhlas Při bolestech hlavy preferuji bylinky.
Souhlas Průměr
-0,3
Deskriptivní statistika
Lék „X“, „Z“ na snižování hmotnosti hodnotím jako: velmi účinný, účinný, ani-ani, neúčinný, velmi neúčinný(problémy) Škála 1
Škála 2
Lék X
Škála 1
Škála 2
Lék Y
Škála 1
Škála 2
-2
1
3
-6
3
12
-24
12
-1
2
8
-8
16
20
-20
40
0
3
15
0
45
60
0
180
1
4
160
158
640
110
110
440
2
5
99
198
495
83
166
415
S1
S2
285
342
1199
285
232
1087
1,2
3,505848
0,814035
3,814035
Kontingenční tabulky Záměr koupit v závislosti na příjmu Méně než 7000
7000-15999
Víc než 16 000
Ano
20,4% (38)
11,6%(46)
7,6%(37)
11,3% (121)
Asi ano
19,4% (36)
11,9%(47)
17,9% (87)
16% (170)
Neví, nezájem
60,2% (112)
76,5%(302)
74,5% (362)
72,5% (776)
100%(186)
100% (395)
100%(362)
100% (1067)
Záměr koupit v závislosti na věku Do 30 let
30-40 let
Nad 40 let
Ano
14%(60)
12,5% (40)
6,6% (24)
11,1% (24)
Asi ano
21,9%(94)
20% (64)
14,5% (53)
18,9%(211)
Neví, nezájem
64,1%(276)
67,5%(216)
78,9%(288)
70% (780)
100% (430)
100% (320)
100%(365)
100%(115)
Analýza závislostí- statistické charakteristiky v analýze dvou proměnných Typ proměnných Charakteristika
Příklad
Dvě intervalové proměnné
Nominální a intervalová proměnná
Dvě ordinální proměnné
Dvě nominální proměnné
Závislost výdajů na příjmu
Závislost mezi barvou balení a velikostí prodeje
Shoda kvality zboží v názorech odborníků a laiků
Vazba mezi kouřením rodičů a kouřením dětí
Deskriptivní Korelační koeficient Analýza rozptylu Regresní koeficienty Deduktivní
A a Z testy
(ANOVA)
Koeficient korelace pořadí U-test Test Mann –Whitney
Kontingenční koeficienty (Pearsonův a Cramerův) Test 2
Závislost dvou intervalových proměnných • Závislost ceny na stáří automobilu (20 automobilů stejně značky a typu) – B = -1,529, r = -0,923
• Závislost výdajů na potravinářské zboží (y) na příjmu domácnosti (x) a počtu členů domácnosti (z) – byx.z=0,27 – ryx.z=0,538
byz.x=1089 ryz.x=0,689
Závislost nominálních proměnných • Existence – test χ2 • H0: nezávislost • H1= závislost • χ2> K krit → přijetí H1
• Síla - Pearsonův a Cramerův kontingenční koficient •
C, Cr = <0,1>
Závislost nominálních proměnných Vzdělání
Názor na množství reklamy
Součty
příliš mnoho
přiměřeně
příliš málo
základní
29
57
14
100
vyučení
38
75
27
140
středoškolské
40
65
15
120
vysokoškolské
13
23
4
40
Součty
120
220
60
400
Relativní četnosti
0,30
0,55
0,15
1,00
G=
(nij-n0,ij)2/
n0,ij
G = 4,074 G krit = 12,6
C= √G/G+n, Cr= √G/c.n
C = 0,100 Cr=0,071
Kontingenční tabulka Mladší 30 let ano ne
Penzijní připojištění ano 144 576 720
ne 456 424 880
celkem
600 1000 1600
Souvisí důchodové pojištění s věkem? G* = n(n11n22n12n21І-n/2)2/n1*n2* n*1n *2 G>X0,95 =3,84
Závislost ordinálních proměnných • Pořadí vypracované 2 skupinami hodnotitelů podle názoru na přitažlivost výrobků či na vlastnosti, které by měl mít výrobek – 2 skupiny pořadí : Spearmen – Více skupin. Kendallův koef. konkordance
Koeficient konkordance Znač k a piva
Pořadí podle chuti 1.
2.
3.
4.
Součet pořadový ch čísel Ai
A
2
3
3
1
9
81
B
7
5
4
6
22
484
C
9
7
8
7
31
961
D
3
2
1
2
8
64
E
10
8
9
9
36
1296
F
8
10
10
10
38
1444
G
1
1
2
3
7
49
H
6
9
7
8
30
900
I
4
4
5
5
18
324
J
5
6
6
4
21
441
Součt y
55
55
55
55
220
6044
Ai2
Rk= 12/(h2(n3 -n)). Σ Ai2 – 3(n+1)/(n-1)
Rk=
Závislost nominální a ordinální proměnné • Variační analýza ANOVA • H0: a1 = a2 = a3 =…aM; • H1= non H0 • Výpočet testové charakteristiky F – F >Ftab. → závislost
• Problém: závislost výše prodeje na typu obalu nebo barvě balení
ANOVA: Cenový experiment Má cena vliv na prodej NV? – 3 úrovně ceny: 39,44,49 Kč – 3 soubory supermarketů, v každém 5 obchodů (na úroveň prodeje může mít vliv jak cena tak samotný supermarket, lokalita a skupina zákazníků, ) H0: x1 = x2 = x3 =…xM; H1= non H0
F statistika
ANOVA:cenový experiment 14 = 8 13 12
X
11
X
10
X
PRODEJ PRODEJ
9 8
X X
X
X
X
X
7
X
X
X
6
X
X
5 4
X
3 2
1 1 Cena
2
3 39Kč
4
5
1
2
3 44Kč
4
5
1
2
3 49Kč
4
5
Poro
ANOVA:cenový experiment CENA
1
2
3
4
5
Celkem
39Kč
8
12
10
9
11
50
1=
10
44Kč
7
10
6
8
9
40
2=
8
49Kč
4
8
7
9
7
35
3=
7
Rozptyl v důsledku změny cen:
SS r
r
n p 1
p
X
p
X
ip
X
Průměr.prodej
23,3
Rozptyl v důsledku „obchodu“: SS u
X np
i 1
r
p 1
2
p
34
ANOVA:cenový experiment – Rozptyl vysvětlený změnami ceny • 23,3/2 = 11,65
– Rozptyl vlivem obchodu • 34/12= 2,8
– Statistika F =11,65/2,8= 4,16 – Pro daný počet stupňů volnost čitatele (2) a jmenovatele (12) tabulky distribuční fce F udávají hodnotu p= cca 0,4 – Závěr: zamítáme hypotézu o rovnosti průměrů
Speciální testy (závislé výběry) • Mc Namarův test změny názorů – Stejná skupina je tázána na názor před a po…
• Wilcoxonův test pro závislé výběry – stejná skupina kupuje určité množství výrobků a změní se např. cena
Mc Namarův test změny názorů na… Názor před získáním informace
Názor po získání informace
Součty
příznivý
nepříznivý
příznivý
146
8
154
nepříznivý
26
20
46
Součty
172
28
200
G= (|n12-n21|-1)2 /n12+n21 G = 8,5
Ho : nezměnil
H1 : změnil se G> Gkrit
Vybrané vícerozměrné statistické metody
Faktorová analýza • Používá se pro omezení počtu proměnných • Vstupy tvoří soubor proměnných vztahujících se ke každému objektu • Výstupy poskytují faktorová skóre s údaji, z kolika % vysvětlují daný faktor
Banka Měření postojů na 9 bodové škále souhlas-nesouhlas 1. Malé banky požadují nižší poplatky než velké 2. Velké banky se pravděpodobně dopouštějí více chyb než malé 3. Pracovníci na přepážkách nemusí být mimořádně přátelští a uctiví, stačí když se budou chovat civilně 4. Přeji si, aby mě v bance znali osobně a jednali se mnou s velmi uctivě. 5. Když se ke mě v bance chovají neosobně a neochotně, nestanu se jejím pravidelným zákazníkem.
Ot.
X1
X2
X3
X4
X5
F1
F2
1
9
6
9
2
2
-.91581
1.03767
2
4
6
2
6
7
.93263
-.00767
3
0
0
5
0
0
-1.05059
-1,94294
4
2
2
0
9
9
1.64856
-1,03405
5
6
9
8
3
3
-0,44159
1.04045
6
3
8
5
4
7
0,44671
0,30815
7
4
5
6
3
6
8
8
6
8
2
2
9
4
4
0
8
8
10
2
8
4
5
7
11
1
2
6
0
0
12
6
9
7
3
5
13
6
7
1
7
8
14
2
1
7
1
1
15
9
7
9
2
1
Respond ent
Korelační analýza X1
X1
X2
X3
X4
X5
1.0000
0,60980
0,46870
-0,01795
-0,09642
1,0000
0,23048
0,18969
0,31863
1,000
-0,83183
-0,77394
1,0000
0,92732
X2
X3 X4 X5
1,0000
Principal-Component Analysis 1
2
3
4
5
Eigenvalue
2,754602
1,774869
0,377091
0,064964
0,028474
Difference
,979733
1,397778
0,312127
0,036491
Proportion
0,5509
0,3550
0,0754
0,0130
0,0057
Cumulative
0,5509
,9059
,9813
.9943
1,0000
Složení faktorů F1
F2
Komunalita
X1
-0,29
0,85
0,81
X2
0,05
0,92
0,83
X3
-,94
0,28
0,94
X4
0,95
0,23
0,94
X5
0,94
0,27
0,96
Interpretace faktorů F1: proměnné 3,4,5 – interpretace: personální faktor F2: proměnné 1,2 – interpretace: velikost banky
FA: Prací prášky Co zákazníci očekávají od pracích prášků? síla, odstranění všech nečistot, rozjasnění barev, cena, zamezení ztráty barev, odstranění skvrn od tuku, vůně, nepoškození struktury prádla (netřepí se), praktičnost balení, přehlednost dávkování, vliv na životní prostředí, vypere límečky na košilích, odstranění zapraných nečistot, náklady na praní, účinek na pokožku, snadnost rozpouštění, hebkost prádla, cena přiměřená účinku.
FA: Prací prášky (požadavky a vnímání zákazníků) JE
SILNÝ
Nejméně silný
VYPERE VŠECHNY NEČISTOTY Vůbec nevypere
Nejvíce silný
Zcela vypere
ROZJASNÍ BARVY Vůbec nerozjasní
Nádherně rozjasní
CENA JE Vysoká PRÁDLO PO VYPRÁNÍ ZTRÁCÍ BARVU Ztrácí barvu ODSTRANÍ OD TUKU
Nízká Vůbec neztrácí barvu
SKVRNY Vůbec neodstraní
PRÁDLO PO VYPRÁNÍ VONÍ Bez vůně NEPOŠKOZUJE STRUKTURU PRÁDLA Silně poškozuje ( prádlo je po častém praní otřepené…) PRAKTIČNOST BALENÍ PŘEHLEDNOST DÁVKOVÁNÍ VLIV NA ŽIVOTNÍ PROSTŘEDÍ
Zcela nepraktické balení Nepřehledné
Zcela odstraní skvrny Intenzivní vůně Nepoškozuje
Velmi praktické balení Srozumitelné, přehledné
Škodlivý
Neškodlivý
VYPERE LÍMEČKY NA KOŠILÍCH Vůbec nevypere
Zcela vypere
ODSTRANÍ I ZAPRANÉ NEČISTOTY Vůbec neodstraní
Zcela odstraní
NÁKLADY NA PRANÍ JSOU
Vysoké
ÚČINEK NA POKOŽKU
Dráždivý
Šetrný
SNADNOST ROZPOUŠTĚNÍ
Nízká
Vysoká
HEBKOST PRÁDLA PO VYPRÁNÍ
Nízká
Vysoká
CENA PŘIMĚŘENÁ ÚČINKU, KTERÝ Zcela nepřiměřená POSKYTUJE
Nízké
Velmi přiměřená
FA: Prací prášky - faktory Jednotlivé vlastnosti souvisí s faktory takto: F1:hebkost, síla, nečistoty, zašpiněnost F2: cena, cena/účin, náklady F3:pokožka, struktura, prostředí (prostředí málo koresponduje s ostatními) • Vysvětlení celkového rozptylu F1: 65%, F2: 16,8%, F3:16%
Grafy
Krabicový graf
250
280
310
340
370
400
Výdaje na 1 člena domácnosti
Grafy – ordinální škála Základní rozdělení četností 5 st. škály způsob využití videomagnetofonu
stupeň využití 1
2
velmi často dosti často
3
4
5
prů-měrně dosti zřídka velmi zřídka zatím nevědí
k nahrávání TV pořadů
9
19
33
8
3
28
k přehrávání nahraných videokazet
7
20
23
11
4
35
k promítání vlastních natočených snímků
8
10
12
7
17
46
N=400, údaje v %
50 45 40 35 1 velmi často
30
2 dosti často 25
3 prů-měrně 4 dosti zřídka
20
5 velmi zřídka 15
5 zatím nevědí
10 5 0 k nahrávání TV pořadů
k přehrávání nahraných videokazet
k promítání vlastních natočených snímků
k přehrávání nahraných videokazet 1 velmi často 2 dosti často 3 prů-měrně 4 dosti zřídka 5 velmi zřídka 5 zatím nevědí
k promítání vlastních natočených snímků 1 velmi často 2 dosti často 3 prů-měrně 4 dosti zřídka 5 velmi zřídka
k nahrávání TV pořadů
5 zatím nevědí
1 velmi často 2 dosti často 3 prů-měrně 4 dosti zřídka 5 velmi zřídka 5 zatím nevědí
4
3,5
3
2,5 nahrávání TV pořadů
2
přehrávání videokazet promítání vl. snímků
1,5
1
0,5
0 základní
středoškolské s maturitou
vysokoškolské
Průměrné hodnoty 5-stupňové škály využití videomagnetofonu pro:
Znak
nahrávání TV pořadů
přehrávání videokazet
promítání vl. snímků
muži
2,7
3,1
3,8
ženy
2,6
2,8
3,0
15-24
2,7
2,5
3,3
25-34
2,6
2,6
3,1
35-44
2,6
2,8
3,5
45-59
2,8
3
3,8
60+
2,7
2,9
3,2
základní
2,7
2,8
3,4
středoškolské s maturitou
2,6
2,8
3,5
vysokoškolské
2,8
2,7
3,3
věk
vzdělání
Závisí způsob použití na…? 4 3,5 3 2,5
nahrávání TV pořadů
2
přehrávání videokazet promítání vl. snímků
1,5
1 0,5 0
základní
středoškolské s vysokoškolské maturitou
Grafy 4 3,5 3 2,5
nahrávání TV pořadů
2
přehrávání videokazet promítání vl. snímků
1,5 1 0,5 0 muži
ženy
Grafy 4 3,5 3 nahrávání TV pořadů
2,5
přehrávání videokazet
2 1,5
promítání vl. snímků
1 0,5 0 15-24
25-34
35-44
45-59
60+
Struktura zprávy • Titulní strana (název, zadavatel, autoři) • Obsah (kapitoly, subkapitoly) • Stručný souhrn (cca 10% -úvod, hlavní výsledky,hlavní doporučení) • Hlavní část (úvod – problém, cíle, metodika,metodologie. Získané výsledky – údaje, grafy, tabulky, názory) • Závěry a doporučení: návrhy a dopady pro zadavatele • Přílohy – výsledky v podobě tabulek