Vliv marketingového dotazování na identifikaci tržních segmentů Jedním z klíčových faktorů stanovení optimální marketingové strategie je správně provedená identifikace a následné vymezení tržních segmentů cílového trhu. Ačkoliv se v praxi často můžeme setkat s preferencemi homogenními či difúzními, v případě existujících přirozených shlukových preferencí je nezbytné tyto přirozené shluky spotřebitelů na trhu identifikovat a správně ztotožnit s tržními segmenty a následně je posoudit z hlediska marketingové využitelnosti dle následujících požadavků: dostatečná definovatelnost, dostatečná velikost, rozlišitelnost, přístupnost a měřitelnost. Přestože typický postup při identifikaci tržních segmentů zahrnuje nezbytnou dávku osobní zkušenosti a intuice marketéra, vhodným výchozím podkladem jsou data primárního či sekundárního marketingového výzkumu, zejména marketingového dotazování. Za segment obecně označujeme skupinu zákazníků, která sdílí podobný soubor potřeb a přání, respektive je dostatečně diferencovaná od ostatních skupin zákazníků na základě přijatých kritérií odlišností potřeb a přání. Z toho vyplývá, že marketingové dotazování by mělo poskytnout taková výstupní data, na jejichž základě bude možno shluky zákazníků snadno identifikovat. Pokud se na výsledná data marketingového dotazování díváme ryze technicky, můžeme získané informace chápat jako čistě statistická data a pro hledání shluků a použít vhodné statistické metody a prostředky. K dispozici máme tabulku, jejímiž sloupci jsou jednotlivá kritéria, resp. kladené otázky, a řádky reprezentují odpovědi jednotlivých účastníků dotazování. Aby takováto data bylo možno zpracovat matematickými prostředky a postupy, je nezbytné provést transformaci jednotlivých hodnot odpovědí na číselné hodnoty. Velmi důležité je vypořádat se zejména s různými ordinálními a nominálními kritérii, která jsou v marketingových dotaznících převážně využívána, protože do matematického modelu trhu není možno vnášet žádné dodatečné závislosti, jež by pocházely jen z nevhodné metody použité pro transformaci původních hodnot do číselných stupnic následně využívaných při matematickém zpracování datového souboru. Vhodnou matematickou metodou pro identifikaci shluků v datovém souboru je shluková analýza, jejíž podstatou je nalezení skupin objektů, nazývaných shluky, a rozčlenění objektů statistického souboru do těchto shluků tak, aby si objekty v rámci stejného shluku byly vzájemně více podobné než objekty vybrané z různých shluků. Pro zjišťování, jak jsou si dva objekty podobné či nepodobné, se užívá míra nepodobnosti, která přiřazuje každé dvojici objektů z datového souboru hodnotu z intervalu <0;1> tak, že totožným objektům přiřadí hodnotu 0 a zcela odlišným objektům hodnotu 1. Na základě znalosti míry nepodobnosti každé dvojice objektů z datového souboru je potom možno realizovat různé shlukovací algoritmy. Jelikož v typickém marketingovém dotazníku existují různé typy otázek, které lze rozlišit do následujících typů: kvantitativní, ordinální, nominální, symetrická binární a asymetrická binární kritéria, je třeba se nejprve vypořádat s tím, jak určit vzájemnou nepodobnost dvou objektů, resp. respondentů marketingového dotazování. Budeme předpokládat, že xi ( xi ,1, xi , 2 ,..., xi , m ) a x j ( x j ,1 , x j , 2 ,..., x j , m ) jsou dva objekty datového souboru s m proměnnými, tedy odpovědi dvou účastníků marketingového dotazování s m otázkami. Proměnné můžeme přehledně rozčlenit do následujících druhů: kvantitativní kritéria – obsahují konkrétní číselné hodnoty, např. maximální přijatelná cena,
ordinální kritéria – obsahují hodnoty různých stupnic, typicky vyjádření preferencí (např. silný souhlas, souhlas, neutrální postoj, nesouhlas, silný nesouhlas), je důležité vzájemné pořadí hodnot, nicméně nepředstavují konkrétní číselný údaj, nominální kritéria – diskrétně rozlišují jednotlivé odpovědi respondentů, neexistuje však žádná přirozená interpretace uspořádání jednotlivých hodnot, například u oboru podnikání příslušné firmy nelze určit jaké je vzájemné pořadí zemědělství, telekomunikací a zdravotnictví, binární kritéria – nabývají pouze dvou hodnot, typicky ano/ne, souhlas/nesouhlas apod. Je nezbytné je rozlišovat na asymetrické, kdy má jedna z obou hodnot významnější výskyt než druhá, příkladem může být výskyt chlapců a dívek mezi studenty technické vysoké školy, a symetrické, kdy je výskyt obou hodnot stejně významný, například výskyt chlapců a dívek na základní škole. Ukážeme si, že typ otázek v marketingovém dotazníku a zejména způsob jejich interpretace zásadně ovlivňuje stanovení míry nepodobnosti jednotlivých objektů a tím i identifikaci shluků. Jako vhodnou míru nepodobnosti totiž používáme Gowerův koeficient nesouhlasu, který lze matematicky popsat následujícím vzorcem: m
Di , j
k 1
k
wi , j .k di , j ,
m
k 1
k
wi , j
kde k di , j je míra nepodobnosti mezi objekty xi a x j na základě proměnné k, hodnota k wi , j je rovna 0 pro případ, kdy proměnná k je asymetrická binární a alespoň jedna z hodnot xi , k nebo x j , k je rovna nule nebo chybí. V opačném případě je hodnota k wi , j rovna 1. Smyslem této podmínky je vyloučení shody pro negativní výsledek v případě asymetrických binárních proměnných, kdy je zajímavá shoda pouze pro pozitivní výsledky. Míra nepodobnosti k di , j mezi objekty xi a x j na základě proměnné k závisí na typu této proměnné:
pro kvantitativní kritéria je definována jako podíl absolutního rozdílu hodnot proměnných u obou objektů a maximálního rozdílu hodnot proměnných pro tuto proměnnou xi , k x j , k k di , j max x p min x p p 1, 2 ,...,n
p 1, 2 ,...,n
pro binární a nominální kritéria je definována jako rovnost či nerovnost hodnot dané proměnné u porovnávaných objektů, tedy k di , j 1 , pokud xi , k x j , k , a k di , j 0 , pokud xi , k x j , k .
pro ordinální kritéria jsou všechny hodnoty dané proměnné převedeny na pořadí této hodnoty ri , k 1,2,..., mk , kde mk je maximální pořadí pro hodnotu k-té proměnné.
S takto převedenými hodnotami pak pracujeme stejně jako s kvantitativními kritérii. Jaké důsledky má volba interpretace typu kritéria si ukážeme na demonstračním příkladu malého marketingového dotazování. Nejde o výsledky skutečného výzkumu, ale pouze o ukázková data. Předpokládejme, že deseti respondentům byl předložen marketingový dotazník obsahující celkem 19 otázek, z nichž prvních 11 otázek umožňovalo vyjádřit preferenční vztah pomocí stupnice (silný nesouhlas, nesouhlas, neutrální, souhlas, silný souhlas) a zbývajících 8 otázek umožnilo volbu odpovědi ano/ne. Pomocí shlukové
souhlas
neutrální
souhlas
souhlas
souhlas
souhlas
ano
ano
ano
ne
ano
ano ne
ne
neutrální
souhlas
souhlas
souhlas
silný souhlas
neutrální
souhlas
ano
ano
ano
ne
ano
ano ne
ne
souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
souhlas
silný souhlas
souhlas
souhlas
ano
ano
ano
ano ano
ano ne
ne
neutrální
souhlas
silný souhlas
silný souhlas
nesouhlas
souhlas
silný souhlas
silný nesouhlas
silný souhlas
silný nesouhlas
souhlas
ne
ano
ne
ne
ne
ano ne
ne
souhlas
silný souhlas
silný souhlas
souhlas
souhlas
silný souhlas
souhlas
souhlas
silný souhlas
souhlas
souhlas
ano
ano
ano
ne
ano
ano ne
ano
souhlas
souhlas
souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
souhlas
silný souhlas
silný souhlas
souhlas
ne
ano
ano
ne
ano
ano ne
ne
souhlas
souhlas
neutrální
souhlas
souhlas
silný souhlas
silný souhlas
neutrální
souhlas
souhlas
souhlas
ano
ano
ano
ne
ano
ano ne
ano
souhlas
souhlas
silný souhlas
silný souhlas
souhlas
silný souhlas
souhlas
souhlas
neutrální
souhlas
neutrální
ano
ano
ano
ne
ano
ano ne
ano
souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
neutrální
silný souhlas
silný souhlas
souhlas
ano
ano
ano
ne
ano
ano ne
ano
neutrální
souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
silný souhlas
souhlas
neutrální
ano
ano
ne
ne
ne
ano ne
ne
otázka 9
otázka 8
otázka 7
otázka 6
otázka 5
otázka 4
otázka 3
otázka 18
neutrální
silný souhlas
otázka 19
souhlas
silný souhlas
otázka 16
souhlas
silný souhlas
otázka 17
otázka 14
souhlas
nesouhlas
otázka 15
otázka 12
otázka 13
ozázka 10
souhlas
otázka 2
otázka 11
1 2 3 4 5 6 7 8 9 10
otázka 1
respondent
analýzy byly posouzeny výskyty shluků odděleně pro obě skupiny otázek. Otázky s odpověďmi ve formě stupnice byly správně posouzeny jako ordinální kritéria, a dále proveden kontrolní výpočet interpretující je jako nominální kritéria, kdy není rozlišen vztah jednotlivých hodnot.
Výsledná struktura shluků byla zaznamenána ve formě tzv. dendrogramů, které určují hloubku sloučení při spojení jednotlivých podshluků tvořící shluky vyšších řádů. Podle rozkladu dle ordinálních kritérií lze z dendrogramu zjistit, že například ve hloubce 4 lze respondenty rozdělit do 3 shluků { 1, 5, 7, 8 }, { 2, 4 } a { 3, 6, 9, 10 }. Je zřejmé, že při užití nominálních kritérií je v této úrovni odlišně zařazen respondent číslo 8 a tedy došlo ke zkreslení zpracovávaných dat. Nominální kritéria
Ordinální kritéria
Hloubka spojení 1
2
3
4
Hloubka spojení
5
6
1
1
2
3
4
5
6
1,5,7
1,5,7
1,5,7
2,4
2,4
1 1,7
1,7
7
7 1,5,7,8
1,5,7,8
1,5,7,8
5
5
5
5,8 8
2 2,4
2 2,4
2,4
4
1,2,3,4, 5,6,7,8, 9,10
2,4
4
1,2,3,4, 5,6,7,8, 9,10
3 3,9
3 3,9 3,6,9
9
6
2,3,4,6, 8,9,10
3,6,9
9
2,3,4,6, 9,10
3,6,8,9, 10
6
3,6,9,10 6
6
10
10
8 8,10 10
8,10
10
Asymetrická binární kritéria
Symetrická binární kritéria
Hloubka spojení 1
2
3
4
5
6
Hloubka spojení 7
8
9
1
1
2
3
5
6
1 1,2
1,2 1,2,3
2
1,2,3
2 1,2,3,6
1,2,3,6, 7
1,2,3,6
3
3
6
6
6
7
7
7
7
8
8
8
8
8
9
9
9
9
9
9
10
10
10
10
10
10
1,2,3,6, 7,8
1,2,3,6, 7,8,9
1,2,3,6, 7,8,9,10 1,2,3,4, 5,6,7,8, 9,10
3
3
6
6
6
5
5
5
10
1,2,3,4, 5,6,7,8, 9,10
9
5,7,8,9 7,8,9
8
4
1,2,3,5, 6,7,8,9
7 7,8
9
4 4,5
5
4
4,5
4,5
4,5
4,5
4,5
4,5
4,10
4,10
4,10
4,10
10
Zajímavější situace nastává v případě rozkladu dle skupiny binárních kritérií, které je možno interpretovat buď jako symetrická či asymetrická. Ukazuje se, že způsob, jakým tato data interpretujeme, zásadně ovlivňuje podobu výsledných zjištěných shluků. Pokud
se opět zaměříme na hloubku shlukového rozkladu na úrovni 4, zjistíme, že v případě asymetrických binárních kritérií existuje celkem 6 shluků: { 1, 2, 3, 6 }, { 7 }, { 8 }, { 9 }, {10 } a { 4, 5 }. Naproti tomu pro symetrická binární kritéria nalezneme jenom 3 shluky { 1, 2, 3, 6 }, { 5, 7, 8, 9 } a { 4, 10 }. Z této skutečnosti vyplývá, že volba interpretace kritéria zásadním způsobem ovlivňuje možnost analýzy výsledného datového souboru marketingového dotazování. Pokud při návrhu marketingového dotazníku počítáme s využitím získaných výsledků nejen pro zjištění konkrétních procentuálních odpovědí, ale uvažujeme s ním i pro analýzu existující struktury trhu pomocí statistických metod, je vhodné jeho návrh přizpůsobit požadavkům na optimální matematické zpracování těchto dat. Měly by být dodrženy následující zásady: používat kvantitativní kritéria, která umožňují velmi přesné určení nepodobnosti objektů v datovém souboru. Pokud lze, je výhodné začlenit několik kvantitativních kritérií do dotazníku, u ordinálních kritérií preferovat větší stupnice alespoň s 5 hodnotami, ordinální kritéria s větším počtem hodnot mohou být dostatečnou náhradou za chybějící kvantitativní kritéria, pokud charakter otázek není vhodný pro jejich použití, např. dotaz na výši příjmu lze nahradit ordinálním kritériem s dostatečným počtem pásem, v žádném případě by neměla převažovat nominální kritéria, jejich doporučený podíl by neměl přesahovat více než 30%, u těchto kritérií je porovnávána pouze prostá shoda dvou hodnot a tedy neposkytují dostatečnou informaci pro posouzení nepodobnosti sledovaných objektů, otázky by měly být formulovány tak, aby byl minimalizován počet neurčitých odpovědí. V případě neúplných odpovědí nelze takovýto záznam použít pro zpracování pomocí shlukové analýzy s výjimkou asymetrických binárních kritérií. Vhodnou formulací otázek je tedy třeba předejít neúplným odpovědím respondentů, které znehodnocují získaná data marketingového dotazování pro další využití, neboť musí být vyřazeny ze statistického zpracování, je nezbytné podle charakteru odpovědí respondentů posoudit interpretaci binárních kritérií jako symetrických, či asymetrických. Pokud je výskyt jedné hodnoty dominantní zhruba v poměru 85% oproti druhé včetně započtení neúplných odpovědí, je vhodné vyhodnocovat toto kritérium jako asymetrické binární. V případě symetrického binárního kritéria dojde v tomto případě k potlačení velmi výrazného znaku majícího potenciálně vysoký vliv na formování segmentu. Cílem tohoto článku bylo poukázat na možnosti využití prostředků shlukové analýzy v procesu segmentace trhu a demonstrovat možná úskalí vycházející z návrhu marketingových dotazníků. Ačkoliv se jedná o aplikaci statistické metody, v žádném případě není možno ponechat tuto činnost na statistikovi bez hlubokých znalostí marketingové problematiky. Interpretace vstupních dat i výsledků použitých algoritmů musí plně respektovat specifické požadavky marketingové segmentace trhu. Marketér v rámci segmentace trhu nepožaduje znalost optimální shlukové struktury daného datového souboru, ale hledá takové shluky respondentů, které vyhovují požadavkům na efektivní tržní segmenty. Optimální je tedy nalezení existence zhruba 3 až 5 shluků, z toho plyne zvolená hloubka shlukovací úrovně použitá v demonstračním příkladu. Výsledky shlukové analýzy dat z marketingových dotazníků jsou velmi cennou pomůckou, která marketérům poskytuje dodatečné informace o struktuře zákaznických preferencí a tím i usnadňuje nalezení optimálních tržních segmentů.
Použitá literatura
TOMEK, G. ,VÁVROVÁ, V. – Marketing od myšlenky k realizaci. Praha: Professional Publishing 2008 ŘEZANKOVÁ, H., HÚSEK, D., SNÁŠEL, V. – Shluková analýza dat. Praha: Professional Publishing 2007 EVERITT, B.S., LANDAU, S., LEESE , M. – Cluster analysis, 4th edition. London: Arnold, a member of the Hodder Headline Group 2001
Summary Marketing questioning has a crucial impact on marketing segmentation process. Having relevant output data allows statistics method usage to discover cluster structure and identify marketing segments on the final market. Author focuses on cluster analysis and dissimility measures with relationship to questionnaire questions. It is necessary to rethink questionnaire designs in order to simplify effective discovery of marketing segments.