Západočeská univerzita v Plzni Fakulta aplikovaných věd
Semestrální práce z předmětu MAB Analýza chování rozhlasových posluchačů a jejich segmentace z hlediska doby poslechu rádia a volnočasového chování
Plzeň, 2010
Petra Flajtingrová
Obsah OBSAH .............................................................................................................................. 2 1.
ÚVOD ........................................................................................................................ 3
2.
INFORMACE O RADIO PROJEKTU ................................................................................ 5 2.1. 2.2.
3.
POPIS VSTUPNÍCH DAT ............................................................................................... 9 3.1. 3.2.
4.
FORMA DOTAZOVÁNÍ CATI ............................................................................................................................5 METODIKA VÝZKUMU ....................................................................................................................................6
SPOLEHLIVOST VÝSLEDKŮ ...............................................................................................................................9 POPIS PROMĚNNÝCH ...................................................................................................................................10
ANALÝZA CHOVÁNÍ ROZHLASOVÝCH POSLUCHAČŮ .................................................. 12 4.1.
ROZDĚLENÍ POSLUCHAČŮ Z HLEDISKA KOMBINACE POSLECHŮ RÁDIA A DENNÍCH ČINNOSTÍ .........................................13
4.1.1. 4.1.2. 4.1.3. 4.2.
LOGICKÉ VAZBY MEZI DENNÍ AKTIVITOU A POSLECHEM RÁDIA V PŘÍSLUŠNÉM ČASOVÉM ÚSEKU DNE .............................26
4.2.1. 4.2.2. 5.
Podrobný snímek činností v kombinaci s poslechem rádia během dne ............. 13 Provedení shlukové analýzy................................................................................ 17 Výsledky analýz .................................................................................................. 18 Grafické znázornění jednotlivých činností během dne ....................................... 26 Srovnání činností prováděných při poslechu rádia ............................................. 37
ZÁVĚR ...................................................................................................................... 40
POUŽITÉ INFORMAČNÍ PRAMENY ................................................................................... 42 PŘÍLOHA 1 – TABULKA S POPISEM PROMĚNNÝCH ZE VSTUPNÍCH DAT TÝKAJÍCÍCH SE RESPONDENTA ................................................................................................................ 44 PŘÍLOHA 2 – VÝSTUP SHLUKOVÉ ANALÝZY........................................................................ 48
2
1. Úvod Tato semestrální práce z předmětu MAB je vypracována jako část diplomové práce s názvem Analýza chování rozhlasových posluchačů a jejich segmentace. Zadání (celé diplomové práce) bylo navrženo společností STEM/MARK, která se mimo jiné podílí na celonárodním průzkumu poslechovosti rádií – Radio projektu. V práci jsou zpracovávána data, která byla v rámci Radio projektu zjištěna za I. a II. čtvrtletí roku 2009. Cílem práce pak je analyzovat data z jiného úhlu pohledu, než jak je tomu ve zveřejňovaných čtvrtletních výsledcích Radio projektu, který se snaží především přiblížit hlavní trendy rozhlasového trhu. V práci budeme klást důraz na posluchače jako celek, budeme se snažit objasnit jejich chování v hlubších souvislostech a přiblížit ho jak zadavateli této práce, tak i samotným rozhlasovým médiím. Naproti tomu se nebudeme snažit provést analýzu posluchačů pro konkrétní rozhlasové stanice zvlášť. Provedeme zde podrobnou analýzu chování rozhlasových posluchačů a jejich typologii, konkrétně posluchače segmentujeme do skupin z hlediska doby poslechu rádia a volnočasového chování. Nejprve ve 2. kapitole podrobněji popíšeme Radio projekt, co je jeho cílem, kdy se zveřejňují jeho výsledky, jaká je jeho metodika – tedy konkrétně výběr respondentů, dotazovací rozhovor a zpracování dat. 3. kapitolu věnujeme popisu vstupních dat. Uvedeme jejich rozsah, obsah, formu a spolehlivost získaných výsledků. V praktické části práce – kapitole 4. analyzujeme chování posluchačů rádií. Posluchače popíšeme nejen podle toho, kdy rádio poslouchají, ale také podle toho, jakou činnost při poslechu provádějí. Vytvoříme různé skupiny posluchačů, segmentované jak podle poslechu rádia, tak podle jejich činnosti během dne. Popsání posluchačů z hlediska kombinace poslechu a činnosti poté rozšíříme a vykreslíme grafy průběhu poslechovosti od rána až do noci u každé činnosti zvlášť a pokusíme se najít výraznější vazby mezi poslechem a činností v danou denní dobu. Veškeré výpočty a analýzy provedeme na softwaru PASW® Statistics 18. Použijeme především metody shlukové analýzy – konkrétně dvoukrokovou metodu shlukové analýzy. Informace budeme čerpat především z materiálů poskytnutých společností STEM/MARK, 3
které se týkají Radio projektu, z rozsáhlých a podrobných manuálů k softwaru PASW® Statistics 18 a z literatury pojednávající o metodách shlukové analýzy.
4
2. Informace o Radio projektu Radio projekt je oficiální národní mediální výzkum poslechovosti rozhlasových stanic, do kterého jsou zařazeny všechny české lokální, regionální a celoplošné stanice. Radio projekt sleduje populaci ve věku 12 – 79 let a zaměřuje se především na její mediální chování, ale také na chování spotřební a na životní styl. Zadavatelem výzkumu jsou členové Radiové sekce Sdružení komunikačních a mediálních organizací České republiky (SKMO) a Sdružení reklamních agentur (ARA’s), projekt realizují české společnosti STEM/MARK a MEDIAN. Cílem tohoto výzkumu je přiblížit hlavní trendy rozhlasového trhu, které jsou velmi důležité pro rozhodování zadavatelů reklamy. Výzkum probíhá průběžně po celý kalendářní rok s výjimkou posledních 14 prosincových dnů (tedy od 17. 12. do 31. 12.) a je rozdělen do 4 etap (čtvrtletí). Výsledky jsou zveřejňovány každé tři měsíce za klouzavé pololetí a jsou k dispozici například na webových stránkách společnosti MEDIAN [1].
2.1. Forma dotazování CATI Při výzkumu je používána technologie CATI1. Jedná se o metodu telefonních rozhovorů s elektronickým záznamem do CATI dotazníku, která zároveň umožňuje jejich logickou kontrolu. Radio projekt používá standardizovaný telefonní rozhovor day after recall (dotaz na včerejší chování).
Obrázek 1: CATI studio společnosti STEM/MARK [2].
1
CATI – Computer Assisted Telephone Interview (Telefonické dotazování s podporou počítače) [3].
5
Forma dotazování CATI je standardní formou a metodikou výzkumu, který je osvědčený především v západní Evropě. Radio projekt tedy splňuje veškeré požadované evropské parametry pro průzkum sledovanosti rozhlasových stanic. Oproti dříve používané metodě při průzkumu poslechovosti face-to-face (forma osobního dotazování), má metoda CATI několik nesporných výhod. Jedna z největších předností spočívá v moderní technologii záznamu dat a ve snadné kontrole dotazování. Výzkum je také výrazně přesnější a lépe odpovídá sociodemografické struktuře populace ČR. Oproti osobnímu dotazování je zkrácena doba dotazování a přístup k respondentovi je mnohem snadnější a rychlejší. Také se zvýšila ochota podílet se na výzkumu od mladších respondentů a osob s vyšším příjmem.
2.2. Metodika výzkumu 1. Výběr respondentů K výběru respondentů na mobilních telefonech se využívá prostý náhodný výběr. Ke každému předčíslí používaných mobilních operátorů je náhodně vygenerováno číslo. Poměr mezi rozhovory realizovanými na telefonních číslech jednotlivých mobilních operátorů je 40% : 40% : 20% (O2 : T-Mobile : Vodafone), což je stanoveno na základě údajů o jejich podílu na trhu soukromých klientů. K výběru respondentů na pevných linkách dochází na základě databáze telefonních čísel pevných linek domácností ČR (zahrnuje asi 50% všech domácností) a je k němu využíván vícestupňový systematický náhodný výběr s proporcionální alokací. Poměr mezi rozhovory realizovanými na mobilních telefonech a pevných linkách je 40% : 60%, což bylo stanoveno na základě dostupných údajů o telefonizaci ČR a expertního odhadu. Obě metody výběru reprezentují dle dostupných údajů zhruba 95% populace ČR (100% telefonizované populace), přičemž zbývajících 5% populace jsou respondenti, kteří nemají pevnou linku ani žádný mobilní telefon. Tato část je šetřena v rámci face-to-face výzkumu2 a výsledný správný poměr se zajistí vážením.
2
Market & Media & Lifestyle / Target Index Group – výzkum realizovaný společností MEDIAN.
6
Dotazování probíhá všech 7 dní v týdnu, od 8:00 do 21:00 hodin. Pokud je kontakt s respondentem neúspěšný, operátor opakuje volání ještě minimálně třikrát. Celkově je ročně dotázáno metodou CATI 28 000 telefonizovaných respondentů a přibližně 1 500 netelefonizovaných respondentů metodou face-to-face. 2. Telefonní rozhovor Rozhovory provádí školení operátoři společností STEM/MARK a MEDIAN v CATI studiích do elektronické podoby. Tazatel nejprve zjistí základní informace o respondentovi (pohlaví, věk, vzdělání, místo bydliště) a poté přejde k vlastnímu dotazníku, jak uvádí [4]: - spontánní znalost rozhlasových stanic - nejčastěji poslouchaná stanice nyní a před rokem - dotazování na základní ukazatele poslechovosti rádií v posledních 7 dnech (zda poslouchal, kolikrát) - časový snímek včerejšího dne - dotazování na základní ukazatele poslechovosti rádií včera (zda poslouchal, kdy, jak dlouho a jakou stanici) - přístup k internetu, frekvence užívání, poslech rádií na internetu - přístup ke kabelové televizi, poslech rádií na kabelové televizi - identifikace respondenta, hlavy domácnosti, domácnosti a otázky na vybavenost domácnosti v relaci ABCDE klasifikace3 Data jsou následně vyčištěna a logicky překontrolována a určité údaje jsou zakódovány (např. profese, názvy rozhlasových stanic). Provádí se kontrolní náslechy u min. 5% rozhovorů. 3. Zpracování dat Jakmile jsou pořízena všechna potřebná data, následuje jejich další zpracování. Nejprve je nutno provést druhé čištění dat (zajistit konzistenci informací). Poté se data doplní o netelefonizované respondenty z odpovídajícího čtvrtletí. Po zajištění konzistence se provádí
3
ABCDE klasifikace – typologie, která populaci rozděluje do několika skupin podle kombinace sociálního postavení a ekonomické zdatnosti domácnosti, ve které člověk hospodaří [5].
7
vícefaktorové vážení datového souboru za celé čtvrtletí (od 1. kvartálu r. 2007 se provádí i normování vzorku na jednotnou kvartální velikost, a to 7 500 respondentů) a poté je soubor za dané čtvrtletí spojen se souborem pro čtvrtletí předchozí. Proběhnou konverze do vyhodnocovacích a uživatelských softwarů a nakonec je vypracována zpráva ve formě tabulek a grafů. Výsledky výzkumu se předávají dále a jsou podrobovány neustálé kontrole.
8
3. Popis vstupních dat V této práci jsou zpracovávána data zjištěná za 1. a 2. kvartál roku 2009. V tomto pololetí bylo dotázáno přesně 14 719 respondentů, přičemž v původním datovém souboru je u každého respondenta zaznamenáno 1 694 proměnných.
3.1. Spolehlivost výsledků Půlroční vzorek respondentů se pro výsledky Radio projektu převažuje na přesných 15 0004. Tento počet respondentů je dostatečný na to, aby závěry mohly být zobecněny na celou populaci. Ve velkém vzorku je tedy věrohodnost výsledků velmi dobrá, na menším vzorku respondentů nebo při sledování jevu, který se ve vzorku nevyskytoval často (např. pouze 300 respondentů odpovídá skupině hospodyně v Praze ve věku 25 – 45 let), je už třeba větší opatrnosti. Neboť čím menší je vzorek respondentů nebo četnost jevu ve vzorku, tím se snižuje jeho věrohodnost. Bohužel není možné stanovit matematicky přesné hodnoty intervalů spolehlivosti pro naměřené hodnoty, lze však zjednodušeně vypočítat alespoň odhad přibližného intervalu spolehlivosti CI [4]: CI =
,
kde n – počet úspěšných pokusů N – rozsah vzorku K – velikost populace
Interval spolehlivosti CI pokrývá skutečnou hodnotu měřeného údaje (hodnota zaznamenána při dotazování celé populace) s pravděpodobností 95%.
4
V práci počítáme s daty nepřeváženými, neboť to nikterak neovlivní interpretaci výsledků a práci s daty nám to podstatně zjednoduší.
9
3.2. Popis proměnných Na první pohled se může zdát, že je proměnných příliš mnoho (téměř 1 700). Pro přehlednost a lepší představu si ale proměnné rozdělíme do dvou základních skupin: A. popis respondenta – do této skupiny proměnných patří všechny takové, které popisují respondenta: jeho pohlaví, věk, vzdělání, bydliště, socioekonomickou situaci, příjem, ekonomickou aktivitu, profesi, domácnost, vybavenost domácnosti, atp. Jelikož je proměnných týkajících se popisu respondenta poměrně velký počet (81), jejich přehled je uveden v tabulce připojené na konci práce v příloze Příloha 1.
B. poslechovost rádií – v této skupině jsou zařazeny všechny proměnné, které se týkají poslechu rádií (resp. určité rozhlasové stanice). Tyto proměnné hrají v naší práci největší roli, popíšeme je zde detailněji, neboť s nimi budeme dále pracovat. Srozumitelný přehled proměnných týkajících se poslechovosti nám nabízí následující tabulka:
10
JMÉNO
POPIS
DR RAD***
Respondent poslouchal rádio včera Rádia včera (jméno rádia)
HODNOTY
{0= Ne, 1= Ano} {0= Ne, 1= Ano} ,002= Frekvence 1, 003= ČRo 1 RAD**A/B/C Rádia včera (časový interval - po 15 min) Radiožurnál, …, Z49= Český rozhlas obecněRADF5*** Rádia v posl. 7 dnech (jméno rádia) {0= Ne, 1= Ano} ,0= žádný den v posl. 7 dnech, Rádia v posl. 7 dnech (jméno rádia) časový R5****** 1= 1 den v posl. 7 dnech, …, 7= interval - po 3 n. 4 hod 7 dní v posl. 7 dnechRADKN*** Rádia znalost (jméno rádia) {0= Ne, 1= Ano} Nejčastěji poslouchaná rozhlasová stanice RADON*** {0= Ne, 1= Ano} (jméno rádia) Nejčastěji poslouchaná rozhlasová stanice RADYA*** {0= Ne, 1= Ano} před rokem (jméno rádia) SPND*** Činnosti včera (název činnosti) {0= Ne, 1= Ano} Činnosti včera (časový interval - po 15 ,001= Spánek, 002= Hygiena, …, SPN**A min) 018= Jiné činnosti,1= Každý den n. téměř každý NETR Jak často posloucháte rádio na internetu? den, 2= Několikrát týdně, …, 7= VůbecRádia poslouchaná prostřednictvím NETRA*** {0= Ne, 1= Ano} internetu (jméno rádia) ,1= Každý den n. téměř každý Jak často posloucháte rádio KABR den, 2= Několikrát týdně, …, 7= prostřednictvím kabelové televize? VůbecRádia poslouchaná prostřednictvím KABRA*** {0= Ne, 1= Ano} kabelové televize (jméno rádia) Tabulka 1: Tabulka nabízející přehled všech proměnných týkajících se poslechovosti, které se vyskytují v původním datovém souboru.
Z tabulky vyplývá, že se v datech vyskytuje pouze 14 typů „základních proměnných“. Tyto proměnné pak mají určitou část jména stejnou, mění se jim pouze ta část, která je místo číslic a písmen doplněna o určitý počet hvězdiček. Kurzívou jsou pak v jejich popisu znázorněny atributy, které se mění. Toto zjištění velice usnadňuje orientaci v datech a jejich proměnných. Některé ze „základních proměnných“ se opakují pro každou rozhlasovou stanici zvlášť (např. proměnné Rádia znalost (jméno rádia) zkoumají postupně znalost všech rozhlasových stanic v jednotlivých proměnných přiřazených každé stanici zvlášť – např. proměnná se jménem RADKN020 je popsána jako Rádia znalost (Classic FM)) nebo snímají den v určitých časových intervalech (např. proměnná RAD01A je popsána jako Rádia včera (3:00- 3:15)).
11
4. Analýza chování rozhlasových posluchačů V této kapitole je provedena celá shluková analýza, popisy, segmentace posluchačů a diskuze výsledků. Jelikož je práce orientovaná především na výstupy a praktické výsledky (nikoli na teorii), rozhodli jsme se, že se zde nebudeme věnovat teoretickému popisu použitých statistických metod. Nabízíme zde podrobné odkazy na zdroje, ze kterých jsme při zpracování vycházeli: [6], All manuals, PASW® Statistics 18 Algorithms, str. 885 – 890. – Velmi podrobný popis dvoukrokové metody shlukové analýzy. [7], str. 380 – 389. – Popis dvoukrokové metody shlukové analýzy spolu s příklady. [6], All manuals, PASW® Statistics 18 Algorithms, str. 108 - 115. – Definice a popis parametrů, měřítek a koeficientů, které vystupují při zadávání dvoukrokové metody nebo v jejím výstupu. Přehled výstupů provedené shlukové analýzy je uveden na konci práce v příloze Příloha 2. Soubor s původními daty, nově vypočtenými proměnnými a rozřazením respondentů do
jednotlivých shluků (proměnné TSC_1, TSC_2, …) má koncovky .sav a .xlxs. Výstupové soubory mají koncovky .spv a .pdf; v nich je možné prohlédnout si především podrobné rozložení všech vstupních proměnných, grafické znázornění, srovnat shluky mezi sebou, porovnat významnost pomocných proměnných, apod. K dispozici je také soubor s koncovkou .sps se syntaxovým zápisem veškerých provedených analýz, vykreslení grafů a vypočtení nové proměnné.
12
4.1. Rozdělení posluchačů z hlediska kombinace poslechů rádia a denních činností
V této části práce budeme analyzovat posluchače z hlediska kombinace poslechu rádia a činností během dne. Respondenty rozdělíme do skupin podle toho, co během dne dělají a zda přitom poslouchají rádio, tyto skupiny pak detailně popíšeme. (Jen pro představu můžeme definovat např. skupinu posluchačů, kteří se během dne při poslechu rádia starají o domácnost a děti, přičemž významnou část této skupiny tvoří ženy od 28 do 35 let.) V další části na tyto analýzy navážeme a vytvoříme názorné časové snímky dne pro jednotlivé činnosti zvlášť, kde bude zachyceno provozování těchto činností spolu s nebo bez poslechu rozhlasové stanice. Nakonec se zaměříme na podrobnější denní úseky (ranní, dopolední, …), kdy opět posluchače segmentujeme do skupin a popíšeme vazby mezi jejich denní aktivitou a poslechem rádia. Pro segmentování posluchačů do skupin použijeme metody shlukové analýzy, konkrétně dvoukrokovou metodu.
4.1.1. Podrobný snímek činností v kombinaci s poslechem rádia během dne Ještě předtím, než začneme se samotnými analýzami, vytvoříme si graf, kde se budou odrážet všechny činnosti spolu s poslechem rádia během dne. Tímto si o průběhu činností v kombinaci s poslechem uděláme alespoň obecnou představu. Na ose x je v grafu zachycen průběh celého dne od 5:00 do 24:005 po 15 minutách a na ose y počet respondentů provádějící danou činnost v kombinaci s poslechem. Sloupce grafu
5
Zobrazovat celých 24 hodin je zbytečné. V čase od 24:00 do 5:00 sice bylo zjišťováno, zda respondent poslouchal nebo neposlouchal rádio, nebylo už ale zjišťováno, co konkrétně dělal. Jelikož se v této kapitole zabýváme popisem posluchačů z hlediska kombinace činnosti a poslechu rádia, můžeme tento časový interval pro analýzu zcela vynechat, neboť postrádá informaci o činnosti respondenta.
13
jsou rozděleny podle zjištěných počtů (pro téměř 9 600 respondentů6) na části, které odpovídají jednotlivým činnostem, přičemž každá činnost je zastoupena dvakrát: pro posluchače (respondenty, kteří souběžně poslouchali rádio) a pro neposluchače (respondenty, kteří neposlouchali současně rádio).
Graf 1: Všechny činnosti v průběhu od 5:00 do 24:00 (včera), které jsou rozděleny pro posluchače a neposluchače zvlášť. V grafu jsou zaznamenáni pouze respondenti, kteří přes den (včera) alespoň 5 minut poslouchali rádio.
6
Zahrneme pouze ty respondenty, kteří přes den (včera) alespoň na chvilku poslouchali rádio. Ti, co při šetření uvedli, že včera neposlouchali rádio ani 5 minut, byli automaticky na celých 24 hodin zařazeni do skupiny činností: nezjišťováno – neposlouchal. Vynecháním těchto zhruba 35% respondentů získáme mnohem přehlednější graf.
14
Pro podrobné analýzy je tento graf poněkud nepřehledný, nabízí nám ovšem základní představu o průběhu dne respondentů, kteří alespoň chvilku přes den (včera) poslouchají rádio. Můžeme si kupříkladu všimnout zcela logické věci: kolem 12 hodiny počet respondentů provádějící téměř všechny činnosti výrazně klesá na úkor stravování. Taktéž si můžeme všimnout faktu, že kolem 21 hodiny více než polovina respondentů sleduje televizi (video/DVD), aniž by přitom souběžně poslouchala rádio. Další fakta nejsou z grafů tak zřejmá; nelze přesně vyčíst, jaké procento respondentů provádějící určitou činnost při ní také poslouchá rádio. Toto si ale provedeme později v kapitole 4.2 spolu s vykreslením grafů pro každou činnost zvlášť. Pro zajímavost ještě uvedeme koláčový diagram, který znázorňuje, kolik procent z celého času stráveného při poslechu všech rozhlasových stanic připadá jednotlivým činnostem (neboli jaká činnost se provádí za poslechu rádia více a jaká méně nebo vůbec; celý koláč tedy představuje veškerý čas celkem, kdy respondenti včera poslouchali rádio).
15
Graf 2: Koláčový diagram podílů prováděných činností souběžně při poslechu rádia (včera).
Z grafu vyplývá, že téměř jednu třetinu doby celkového poslechu rozhlasových stanic respondenti tráví v zaměstnání mimo domov, druhou nejčastější činností jsou domácí práce a péče o děti (při více než 20% doby celkového poslechu), následuje volný čas a koníčky provozované doma (13% doby celkového poslechu) a poslední výraznější činností, o které se zmíníme, je cestování autem (necelých 10% doby celkového poslechu). Naopak jedinou činností, kdy ani jeden respondent neuvedl, že při ní poslouchá rádio, je nepřekvapivě spánek. Lze tedy očekávat, že se v naší analýze objeví přinejmenším skupina posluchačů, kteří poslouchají rádio v zaměstnání a skupina posluchačů poslouchající rádio při starání se o domácnost/péči o děti.
16
4.1.2. Provedení shlukové analýzy Jak jsme již uvedli na začátku této kapitoly, pro rozdělení posluchačů do skupin použijeme opět metodu shlukové analýzy – konkrétně dvoukrokovou metodu. Tuto metodu použijeme proto, že pracujeme s velkým množstvím dat (9 529 respondentů – ti, kteří včera alespoň 5 minut poslouchali rádio a tudíž byly pro ně zaznamenány činnosti během dne) a s nominálními vstupními proměnnými (viz dále). Dvoukroková metoda je tudíž ideální (a jediná) nabízená softwarem PASW® Statistics 18. Nastavení parametrů u dvoukrokové metody je podrobně popsáno v diplomové práci7. Toto nastavení ponecháme stejné i pro nynější analýzu z hlediska kombinace denních činností a poslechu; konkrétně se jedná o: logaritmickou věrohodnostní míru vzdálenosti, zvolené parametry struktury CFT (které byly zvoleny na základě pokusných analýz), neuvažujeme žádný šum, do výsledku zahrneme stejné doplňující proměnné8. Analýzy provedeme jak pro automaticky určený počet shluků podle kritéria BIC, tak pro implicitně zadaný počet od 2 do 109. Zásadní věcí pro shlukovou analýzu, kterou provedeme v této části, bude určení vstupních proměnných. Ze zadání a z výše popsaných grafů jsou zřejmé tyto dva základní poznatky: Nemá smysl mezi vstupní proměnné zahrnovat takové, které popisují činnosti nebo poslech mezi 24:00 a 5:00 hodinou. Stejně tak nemá smysl zahrnovat do analýzy respondenty, kteří přes den (včera) neposlouchali rádio a tím u nich nebyly zaznamenány žádné činnosti ani poslech. Dále ze zadání vyplývá, že budeme muset vycházet z proměnných zachycujících jak činnosti, tak i poslechovost v čase. V původním datovém souboru ale neexistuje proměnná, která by tyto dvě informace zachycovala najednou. Budeme tedy muset vyjít z proměnných
7
V kapitole Chyba! Nenalezen zdroj odkazů. u analýzy posluchačů z hlediska poslechovosti rádií během dne. DR (zda respondent poslouchal včera rádio), DRHOD (jak dlouho resp. poslouchal včera rádio), RADR (kolik dní min. v posledním týdnu resp. poslouchal rádio), SEX (pohlaví resp.), SIZE1 (velikost místa, kde resp. tráví většinu času), NETY (zda má resp. přístup k internetu), RINC (průměrný čistý měsíční příjem resp.), HHINC_NP (čistý měsíční příjem domácnosti resp.), AGEREC (věk resp.), EDUREC (vzdělání resp.), ECOACT (zda je resp. ekonomicky aktivní), ABCDCZ (národní socioekonomická klasifikace resp.). 9 K těmto počtům jsme došly pokusným analyzováním dat. 8
17
RAD**D popisující poslechovost rádia v čase, a z proměnných SPN**A, které zachycují v čase (v 15 minutových intervalech stejně jako RAD**D) činnost, kterou respondent prováděl. Otázkou nyní je, zda můžeme použít tyto proměnné tak, jak jsou, zvlášť. Takové řešení vstupních proměnných pro shlukovou analýzu by nebylo šťastné, neboť by nám zcela chyběla jejich časová provázanost. Nezbývá tedy nic jiného, než vytvořit10 nový typ proměnných v čase, který v sobě ponese jak informaci o prováděné činnosti, tak i informaci o poslechu rádia. Nový typ proměnných nazveme SPNRAD**, kde hvězdičky stejně jako v případě proměnných RAD**D a SPN**A nahrazují čísla od 01 do 96, která zastupují čtvrthodinové časové úseky od 3:00 po celých 24 hodin. Původní proměnné SPN**A mohou nabývat celkem 19 různých nominálních hodnot přiřazených každé činnosti (např. 5 – cestování autem). Pro naše účely bude tedy nový typ proměnných SPNRAD** nabývat dvojnásobného počtu hodnot, neboť každou činnost rozdělíme na dvě části: při poslechu rádia a bez poslechu rádia (např. 5,0 – cestování autem bez poslechu rádia, 5,1 – cestování autem se souběžným poslechem rádia). Jako vstupní proměnné shlukové analýzy v této části práce použijeme tedy nově zkonstruovaný typ proměnných SPNRAD**; v časech 5:00 – 24:00 (tedy SPNRAD09 – SPNRAD84) a pouze pro včerejší posluchače (respondenti, kteří mají proměnnou zaznamenávající poslech včera DR = 1).
4.1.3. Výsledky analýz Nejdříve určíme optimální počet shluků, což v tomto případě nebude snadné. Při analýze, kdy jsme zadali určení shluků automaticky pomocí kritéria BIC, vyšel optimální počet shluků 2. Kvalita tohoto modelu je sice velice slabá (Silhouettovo měřítko je blízké 0), pokud se ale podíváme na modely, kde je počet shluků vyšší, kvalita těchto modelů se nijak výrazně neliší – nachází se také ve velmi slabém pásmu. S touto nízkou kvalitou se tedy budeme muset spokojit. Chceme najít ale takové řešení, kde budou vytvořené shluky dobře interpretovatelné s výraznějšími rozdíly mezi sebou.
10
Syntaxový zápis vytvoření této proměnné je v souboru 5.3-SPNRAD.sps.
18
V analýzách v předchozí kapitole jsme pracovali se vstupními proměnnými, které nabývaly pouze dvou nominálních hodnot 0 – neposlouchal a 1 – poslouchal. Nyní ale pracujeme se vstupními proměnnými s celkem 38 nominálními hodnotami, lze tedy čekat také mnohem pestřejší a podrobnější shluky. Ideální bude vytvořit si dendrogram, který vzniká při druhém kroku dvoukrokové metody, jednotlivé shluky si popsat a na jejich základě se pak rozhodnout, který počet shluků bude pro naši analýzu nejvhodnější. V první části dvoukrokové analýzy se shluky rozdělí do „před-shluků“11, ve druhé části je prováděno hierarchické shlukování. Bohužel výstup této metody neumožňuje zakreslení dendrogramu, vytvoříme si ho tedy sami (s počtem 7 shluků12). V obvyklém případě se dendrogram kreslí v průběhu hierarchického shlukování, my ho budeme muset vytvořit přímo z výsledků jednotlivých analýz, které provádíme pro každý počet shluků znovu (zvlášť). V průběhu každé analýzy se ale vytvoří nepatrně odlišné shluky, které mají shodnou charakteristiku a téměř stejnou velikost13.
Graf 3: Dendrogram znázorňující postupné vytváření shluků, nakreslen pouze do sedmé úrovně se 7 shluky. Římské číslice značí konečný počet shluků při analýze, pomáhají orientovat se
11
Z angl. pre-clusters. Jak uvidíme dále, tento počet zvolíme jako konečný, nemá tedy smysl zakreslovat do dendrogramu víc podrobnějších shluků. 13 Tento poznatek uvádíme především proto, že v klasickém dendrogramu se jednotlivé shluky postupně slučují, tudíž dva shluky o 10 a 20 členech po sloučení vytvoří shluk o 30 členech. V našem dendrogramu toto pravidlo ale neplatí, neboť se nevytvořil postupně při jedné analýze, ale je vytvořen z konečných výsledků 7 analýz. Počty shluků tedy neodpovídají naprosto přesně, jsou ale přibližně stejně velké a především shodné co se týče jejich popisu. 12
19
v úrovni grafu. U každé větve je pak napsáno číslo shluku, které mu bylo přiřazeno při dané dvoukrokové shlukové analýze. Pod číslem shluku se pak pro představu nachází počet jeho členů.
Nejprve si popíšeme postupné odlišování na jednotlivých stupních dendrogramu, poté si konečné shluky detailněji popíšeme také s pomocí rozložení významných doplňujících proměnných. Ještě poznamenáme, že v následujícím odlišení vyzdvihneme pouze výrazné a odlišné skutečnosti; nebudeme popisovat činnosti ve shlucích pro celých 24 hodin, protože je např. zřejmé, že pokud se ve večerních hodinách dívá většina respondentů na televizi, bude se i většina respondentů v jednotlivých shlucích (kromě např. skupiny nočních pracujících) večer dívat na televizi. I.
1 – všichni respondenti, kteří včera poslouchali rádio
II.
1 – zaměstnaní (mimo domov) 2 – ostatní
III.
2 – studující (mimo domov i doma), pracující doma, zábava a koníčky 3 – v domácnosti/péče o děti, volný čas, nakupování
IV.
1 – zaměstnaní (mimo domov), kteří poslouchají v práci rádio 2 – zaměstnaní (mimo domov), kteří v práci rádio neposlouchají
V.
2 - studující (mimo domov i doma), pracující doma 3 – zábava a koníčky, dopolední spáči
VI.
1 – zaměstnaní (mimo domov) s obvyklou pracovní dobou, kteří poslouchají v práci rádio 4 – zaměstnaní (mimo domov) s pracovní dobou v pozdějších a nočních hodinách, kteří v práci rádio poslouchají a ráno spí.
VII.
6 – v domácnosti/péče o děti, volný čas, kteří souběžně poslouchají rádio 7 – v domácnosti/péče o děti, kteří souběžně rádio neposlouchají
VIII.
Toto (a další úrovně) členění už je příliš podrobné a pro naše účely z hlediska poslechovosti rádií dostatečně nevypovídající.
20
Nyní máme popsané základní rozdíly mezi jednotlivými shluky a můžeme už určit, jaký konečný počet shluků budeme podrobněji popisovat a brát jako výsledný pro naši analýzu. Nic nebrání tomu, abychom popsali všech 7 shluků, neboť mezi sebou mají výrazné rozdíly z hlediska kombinace poslechu rádia a denních činností a tudíž vyhovují našemu původnímu zadání. Zde je koláčový graf znázorňující velikosti jednotlivých shluků a Silhouettovo měřítko kvality modelu:
Grafy 1: Obrázek znázorňující kvalitu modelu podle Silhouettova měřítka a koláčový diagram ukazující velikost jednotlivých shluků.
Uvedeme zde ještě tabulku s významnými pomocnými proměnnými, na které se v popisech shluků budeme odkazovat. Ostatní doplňující proměnné, které v této tabulce nejsou uvedeny, nevykazují mezi shluky žádné významné rozdíly.
21
Tabulka 2: Ukázka tabulky významnějších pomocných proměnných z výstupu 5.3-1.spv pro dvoukrokovou metodu shlukové analýzy. Tabulka je rozdělena do sloupců pro jednotlivé shluky, v části pro pomocné proměnné (Evaluation Fields) vidíme nejčastěji se vyskytující odpověď (spolu s procentuálním vyčíslením) nebo střední hodnotu dané proměnné ve shluku.
A nyní si popíšeme všech 7 výsledných shluků: 1. zaměstnaní (mimo domov) s obvyklou pracovní dobou, kteří poslouchají v práci rádio - Výrazně převládají respondenti, kteří jsou v zaměstnání v obvyklou pracovní dobu (zhruba od 6 do 16 hodin) a kteří souběžně poslouchají rádio. Odpoledne mají respondenti z této skupiny různé aktivity, žádná z nich není pro tuto skupinu určující. Tento shluk je z 95% tvořen ekonomicky aktivními lidmi s nejvíce zastoupenou věkovou skupinou mezi 30 a 40 lety. Naopak nejmladší a nejstarší věková kategorie zde téměř vůbec zastoupena není. Střední hodnota počtu hodin poslechu (včera) je nad 9 hodinami, což je nejvyšší ze všech shluků. 2. studující (mimo domov i doma), pracující doma - Většinu zde tvoří respondenti, kteří studují mimo domov (a neposlouchají přitom rádio) v čase ranním, dopoledním a odpoledním a pak ti, kteří studují nebo pracují doma v čase ranním a pozdně odpoledním (s i bez souběžného poslechu rádia).
22
Tento shluk je ze tří čtvrtin tvořen ekonomicky neaktivními lidmi, logicky studenty, s většinově zastoupenou věkovou skupinou mezi 12 a 20 lety (kolem 55% respondentů ze skupiny). V porovnání s ostatními skupinami má tato skupina největší přístupnost k internetu (95%). Střední hodnota počtu hodin poslechu (včera) jsou necelé 4 hodiny. 3. zábava a koníčky, dopolední spáči – Tuto skupinu (největší část jejích respondentů) lze popsat následujícím sledem činností: spánek do 10. hodiny dopolední, zábava a koníčky bez poslechu rádia v průběhu celého dne až do večera, s přestávkou na jídlo (od 12:00 do 12:30) také bez poslechu rádia. U této skupiny její doplňující proměnné ničím výrazně nevybočují, všechny kategorie jsou rozloženy poměrně rovnoměrně. Nabízí se otázka, zda tato skupina není tvořena respondenty, kteří byli dotazováni na poslech a činnosti o víkendu. Po prozkoumání zjistíme, že více než polovina jejích respondentů bylo dotazováno na víkendový den a že z celkového počtu respondentů dotazovaných na víkend je zde zastoupena jejich jedna třetina. 4. zaměstnaní (mimo domov) s pracovní dobou v pozdějších a nočních hodinách, kteří v práci rádio poslouchají a ráno spí – V názvu této skupiny je řečeno téměř vše, dodáme jen, že většina respondentů, kteří pracují v noci a poslouchají přitom rádio, patří do tohoto shluku. Doplňující proměnné mají velmi podobné rozložení jako u shluku 1, pozorujeme jednu výraznější odlišnost a to pro rozložení počtu hodin poslechu včera:
23
Grafy 2: Grafy absolutních četností pomocné proměnné počet hodin poslechu – včera: Grafy jsou vykreslené pro srovnávané tři shluky (přidáme ještě shluk 5 popsaný níže) zvlášť – zleva: shluk 1, shluk 4, shluk 5.
I když střední hodnoty poslechu rádia přes den pro shluky 1 a 4 nejsou od sebe nijak vzdálené (9 a 7 hodin), tvary jejich rozložení jsou velmi odlišné. První skupina má početné zastoupení v blízkosti střední hodnoty, u 4. skupiny vidíme téměř rovnoměrné zastoupení od 0 (resp. 15 minut) až do 15 hodin, kdy rozložení pomalu klesá. 5. zaměstnaní (mimo domov), kteří v práci rádio neposlouchají – Tato skupina je jistým „doplňkem“ ke skupinám 1 a 4, neboť je tvořena pracujícími, kteří v práci rádio neposlouchají. 93% jejích členů tvoří ekonomicky aktivní lidé, rozložení ostatních proměnných je opět podobné shlukům 1 a 4, až na počet hodin poslechu včera (viz graf výše). Střední hodnota počtu hodin poslechu je výrazně nižší: 2,5 hodiny.
6. v domácnosti/péče o děti, volný čas, kteří souběžně poslouchají rádio – Nejpočetnější shluk této analýzy (s téměř 24%) tvoří respondenti, kteří se přes den věnují především domácnosti/péči o děti, odpoledne u nich převládnou volnočasové aktivity (doma). Při těchto činnostech (včetně poledního stravování doma) poslouchají souběžně rádio. Tato skupina je tvořena z více než 75% ekonomicky neaktivními lidmi, přičemž důchodci z celé skupiny tvoří přibližné dvě třetiny. Na rozdíl od všech předchozích
24
skupin, v této převládají ženy. Zajímavé je, že pouhá polovina této skupiny má přístup k internetu. Střední hodnota počtu hodin poslechu je zhruba 6 hodin. 7. v domácnosti/péče o děti, kteří souběžně rádio neposlouchají – Poslední skupina je zastoupena těmi, kteří se celý den věnují především domácnosti a péči o děti a přitom rádio neposlouchají. Skupina je, co se týká rozložení doplňkových proměnných, velice podobná předchozí 6. Je tvořena ze 70% ekonomicky neaktivními lidmi, přičemž důchodci zde tvoří necelou polovinu. Také v této převládají ženy. Střední hodnota počtu hodin poslechu je trochu přes 2 hodiny. Pokud porovnáme 6. a 7. shluk z hlediska rozložení věku, oba mají nejpočetněji zastoupenou skupinu ve věku 60-69 let. Shluk 6 má ale výraznější zastoupení starších věkových kategorií, zatímco shluk 7 je rovnoměrněji rozložen především ve středním věku.
25
4.2. Logické vazby mezi denní aktivitou a poslechem rádia v příslušném časovém úseku dne
Tato kapitola je úzce spojena s kapitolou předchozí, opět zkoumá kombinaci denních činností a poslechu rádia. Tentokrát se nebudeme snažit posluchače přímo segmentovat do skupin podle toho, jak se chovají v průběhu celého dne, ale budeme se snažit popsat chování posluchačů pro každou činnost v průběhu dne zvlášť. Určíme také, které činnosti při poslechu rádia dominují s ohledem na každou část dne. Na začátku si je třeba definovat časové úseky dne. Budeme rozdělovat pouze čas od 5:00 do 24:00 (z důvodů uvedených již v předchozí kapitole). Logicky ho rozdělíme na 6 částí: ráno: 5:00 – 9:00 dopoledne: 9:00 – 12:00 odpoledne: 12:00 – 15:00 pozdní odpoledne: 15:00 – 18:00 večer: 18:00 – 21:00 noc: 21:00 – 24:00 Nyní se můžeme věnovat grafickému znázornění všech činností, popsání jejich vývoje během dne a zahrnutí souběžné poslechovosti rádia.
4.2.1. Grafické znázornění jednotlivých činností během dne Vykreslíme dva názorné časové snímky dne postupně pro všechny činnosti. V prvních grafech je zachycen počet respondentů, pro které byly činnosti podrobněji zjišťovány a kteří danou činnost přes den provádí. Každý sloupec pro 15 minutové intervaly je rozdělen na dvě části: modrá pro ty respondenty, co při činnosti rádio neposlouchají, zelená pro ty, kteří souběžně rádio poslouchají. V grafech je tedy přehledně vidět, jak se vyvíjí počet respondentů provádějící danou činnost během dne s ohledem na poslech rádia.
26
V druhých grafech jsou znázorněny dva procentuální vývoje: jednak je to podíl respondentů provádějící danou činnost souběžně s poslechem ku počtu všech respondentů provádějící ve stejném čase danou činnost (bez ohledu na souběžný poslech rádia). Ve stejném grafu je ještě přidána druhá křivka – vývoj podílu respondentů provozující danou činnost (bez ohledu na poslech) ku všem respondentům (všem, kteří odpovídali na dotazník, tedy 14 719). Druhý procentuální vývoj je vhodný uvést především proto, abychom se nenechali zmást situací, kdy např.: v čase 5:15 – 5:30 pouze 1 respondent uvedl, že nakupoval, tento respondent při tom poslouchal rádio. Tudíž nám rázem vyskočí procento souběžných posluchačů provádějící danou činnost na 100%, přitom ale nesmíme těchto 100% přeceňovat, neboť jsou vypočítány z téměř 0% všech respondentů. Je třeba se tedy dívat souběžně na obě křivky vývoje, ne pouze na jednu. U jednotlivých grafů nebudeme popisovat přímo jasný vývoj činností během dne, zdůrazníme ale důležité detaily a zajímavosti. Ještě je třeba připomenout, že podrobný snímek dne i s činnostmi je zpracováván pouze pro takové respondenty, kteří včera poslouchali alespoň 5 minut rádio; u ostatních respondentů je automaticky pro celých 24 hodin zaznamenána činnost: Nezjišťováno. Pokud tedy zjistíme, že např. z 500 respondentů, kteří pro daný časový interval odpověděli, že jedou autem, poslouchá souběžně rádio 400 (tedy 80%), nesmíme udělat chybný závěr, že kolem 80% populace poslouchá v autě rádio! Správný výklad je takový, že kolem 80% lidí jedoucí autem, kteří přes den poslouchají alespoň 5 minut rádio, při jízdě poslouchá rádio. Kolik procent celého vzorku populace poslouchá při jízdě autem rádio bohužel z dat, které máme k dispozici, nelze přesně zjistit.
27
Grafy 3: Grafické znázornění činnosti v průběhu dne – SPÁNEK.
V celém vzorku respondentů není zaznamenaný ani jeden takový, který by při spánku poslouchal rádio.
Grafy 4: Grafické znázornění činnosti v průběhu dne – HYGIENA/PÉČE O VZHLED/OBLÉKÁNÍ.
Všimneme si, že zatímco ráno poslouchá rádio při hygieně/péči o vzhled/oblékání mezi 30% a 40% respondentů (kteří přes den alespoň 5 minut poslouchají rádio), večer už, i když tuto činnost provádí zhruba stejné množství lidí, při tom rádio poslouchá necelých 10%.
28
Grafy 5: Grafické znázornění činnosti v průběhu dne – STRAVOVÁNÍ (DOMA).
U stravování doma vidíme klesající tendenci poslouchat rádio. Zatímco ráno doma při snídani poslouchá souběžně rozhlasovou stanici až 60% respondentů (kteří přes den alespoň 5 minut poslouchají rádio), v poledne je to už méně – kolem 50% a večer zhruba okolo 20%.
Grafy 6: Grafické znázornění činnosti v průběhu dne – STRAVOVÁNÍ (MIMO DOMOV).
Je vidět, že největší počet respondentů se stravuje mimo domov kolem poledne (tedy v dobách dopoledne a odpoledne). V těchto dobách pak kolem 20% z nich (kteří přes den alespoň 5 minut poslouchají rádio) při jídle souběžně poslouchá rádio. V ostatních dobách je zaznamenáno příliš málo respondentů, kteří jedí mimo domov. Nepovažujeme tedy podíl posluchačů v tomto čase za příliš vypovídající (ráno se podíl posluchačů pohybuje mezi 30% a 90%, v pozdní odpoledne a večer se udržuje kolem 20%, v noci pak od 10% až k 70%).
29
Grafy 7: Grafické znázornění činnosti v průběhu dne – CESTOVÁNÍ AUTEM.
Co se týče cestování autem, vidíme zde téměř konstantní procento poslechovosti v průběhu celého dne: mezi 60% a 80% (respondentů, kteří přes den alespoň 5 minut poslouchají rádio). Můžeme upřesnit, že ráno a dopoledne poslouchá rádio kolem 80% těch, kteří jedou autem, od odpoledne do noci je toto procento trochu nižší, pohybuje se kolem 70%.
Grafy 8: Grafické znázornění činnosti v průběhu dne – CESTOVÁNÍ (JINAK).
Souběžní posluchači rádia mezi respondenty, kteří cestují v průběhu dne jinak než autem (a kteří přes den alespoň 5 minut poslouchají rádio), se pohybují mezi 5% a 15%. Hranice 15% dosahují především v časných ranních hodinách a pozdních nočních.
30
Grafy 9: Grafické znázornění činnosti v průběhu dne – ZAMĚSTNÁNÍ (MIMO DOMOV).
I když se přes den mění procento lidí, kteří pracují mimo domov, procento těch, kteří v práci poslouchají rádio (a kteří přes den alespoň 5 minut poslouchají rádio), se ve všech dobách pohybuje stabilně kolem 50%. V ranních a dopoledních hodinách je to dokonce nad hranicí 50%, od odpoledne až do noci procento mírně klesá pod tuto hranici.
Grafy 10: Grafické znázornění činnosti v průběhu dne – ŠKOLA/STUDIUM (MIMO DOMOV).
Za vypovídající můžeme brát pouze dopolední a odpolední doby (neboť tehdy je počet studujících dostatečně vypovídající), kdy se poslechovost rádia při studiu pohybuje pod 10% (u respondentů, kteří přes den alespoň 5 minut poslouchají rádio).
31
Grafy 11: Grafické znázornění činnosti v průběhu dne – ZAMĚSTNÁNÍ/STUDIUM (DOMA).
Ráno poslechovost při zaměstnání nebo studiu doma prudce narůstá: od 15% až na téměř 60% (respondentů, kteří přes den alespoň 5 minut poslouchají rádio). Během dopoledne, odpoledne, pozdního odpoledne a večera postupně mírně klesá z téměř 60% až těsně nad 20%. V noci kolísá okolo 30%.
Grafy 12: Grafické znázornění činnosti v průběhu dne – DOMÁCÍ PRÁCE/PÉČE O DĚTI.
Ráno a dopoledne poslechovost rádia při domácích pracích/péči o děti roste ze 40% na 60%, poté strměji klesá během odpoledne až do večera na 20%, v noční době kolísá kolem 30% (zahrnuje pouze ty respondenty, kteří přes den alespoň 5 minut poslouchají rádio).
32
Grafy 13: Grafické znázornění činnosti v průběhu dne – VOLNÝ ČAS/KONÍČKY DOMA.
Nejvíce poslouchají rádio ve volném čase/při koníčkách (doma) respondenti (kteří přes den alespoň 5 minut poslouchají rádio) ráno, jejich poslechovost ale v průběhu klesá z 80% na 60%, klesání pokračuje až do večera těsně pod hranici 30%, aby v noci stouplo nad poloviční většinu.
Grafy 14: Grafické znázornění činnosti v průběhu dne – NAKUPOVÁNÍ/ZAŘOZOVÁNÍ.
Ve vypovídajících dobách (což jsou podle počtu respondentů všechny kromě rána a noci) souběžně poslouchá některou rozhlasovou stanici při nakupování/zařizování pouze necelých 10% respondentů (kteří přes den alespoň 5 minut poslouchají rádio).
33
Grafy 15: Grafické znázornění činnosti v průběhu dne – SPORTOVÁNÍ (MIMO DOMOV).
O sportování mimo domov lze říci v podstatě to samé jako o nakupování a zařizování: ve vypovídajících dobách (kromě rána a noci) poslouchá některou rozhlasovou stanici při sportování (mimo domov) pouze necelých 10% respondentů (kteří přes den alespoň 5 minut poslouchají rádio).
Grafy 16: Grafické znázornění činnosti v průběhu dne – ZÁBAVA/KONÍČKY (MIMO DOMOV).
V této činnosti opomineme ranní dobu (kvůli malému počtu respondentů), v ostatních dobách během dne se procento respondentů (kteří přes den alespoň 5 minut poslouchají rádio) věnující se souběžně zábavě/koníčkům (mimo domov) a poslechu rádia pohybuje kolem 10%.
34
Grafy 17: Grafické znázornění činnosti v průběhu dne – SLEDOVÁNÍ TELEVIZE/ VIDEA/ DVD.
Opět nebudeme brát v úvahu ranní čas, v ostatních dobách nestoupne procento těch, kteří při sledování televize ještě poslouchají rádio (a kteří přes den alespoň 5 minut poslouchají rádio), nad 5%. Pozorujeme tendenci, že s přibývajícím časem i toto procento klesá.
Grafy 18: Grafické znázornění činnosti v průběhu dne – ČAS STRÁVENÝ U POČÍTAČE BEZ SURFOVÁNÍ NA INTERNETU.
Obecně je skupina respondentů, kteří tráví čas u počítače bez surfování na internetu (a kteří přes den alespoň 5 minut poslouchají rádio), velice malá (do 100). Večerní dobu bychom mohli vzhledem k vyššímu zastoupení považovat za vypovídající – v tomto čase souběžně poslouchá rádio kolem 20% respondentů.
35
Grafy 19: Grafické znázornění činnosti v průběhu dne – ČAS STRÁVENÝ NA INTERNETU.
Ráno procento posluchačů (kteří přes den alespoň 5 minut poslouchají rádio) poslouchající souběžně rádio při surfování na internetu značně kolísá, od dopoledne pozorujeme postupný pokles začínající na 50% posluchačů pokračující až do noci pod 20%.
Grafy 20: Grafické znázornění činnosti v průběhu dne – JINÉ ČINNOSTI.
Poslech rádia přes den při jiných činnostech je poměrně proměnlivý, především v ranní době je velmi kolísavý. Přes den se pak pohybuje kolem 20% (z respondentů, kteří přes den alespoň 5 minut poslouchají rádio).
36
Pro úplnost ještě přidáme grafy, které znázorňují činnost Nezjišťováno.
Grafy 21: Grafické znázornění činnosti v průběhu dne – NEZJIŠŤOVÁNO.
V druhém grafu vidíme, že přesně 35% všech respondentů je zařazeno od 5:00 do 24:00 do kategorie Nezjišťováno. Podle struktury dotazníku je logické, že mezi nimi není ani jeden souběžný posluchač rádia. Tím jsme si popsali podrobně vývoj činností a poslechovosti v průběhu dne. Při pohledu na některé grafy je nasnadě jedna zajímavá otázka: Jak by grafy vypadaly, pokud bychom do nich přidali i sledovanost televize? Když se zadíváme např. na průběh stravování (doma), všimneme si, že večer souběžně při jídle poslouchá rádio mnohem menší procento respondentů než ráno. Může to být dáno právě tím, že večer lidé při stravování doma upřednostňují sledování televize. Tuto domněnku by ovšem bylo třeba podložit a provést také analýzu sledovanosti televize (což už ale není předmětem této práce).
4.2.2. Srovnání činností prováděných při poslechu rádia V kapitole 1 jsme uvedli koláčový Graf 2: Koláčový diagram podílů prováděných činností souběžně při poslechu rádia (včera)., ve kterém je znázorněn podíl činností od 5:00 do 24:00 pouze
za poslechu rádia. Nyní si takovýto procentuální podíl činností provedeme detailněji pro každou čtvrthodinu od 5:00 do 24:00 zvlášť. Vykreslíme si pak vývoj pro jednotlivé podíly činností prováděné při poslechu v čase, tudíž budeme moci v jednom grafu porovnat všechny najednou.
37
V každé čtvrthodině máme tedy zaznamenaný určitý počet posluchačů celkem, dále máme počet posluchačů pro jednotlivé činnosti. Po 15 minutách vypočteme procento posluchačů, kteří prováděli danou činnost, ze všech posluchačů, kteří měli puštěné rádio. Do následujícího grafu pak zařadíme pouze dominantní činnosti, tedy ty, jejichž posluchači v nějakém čase tvořili minimálně 10% všech poslouchajících.
Graf 4: Vývoj procentuálního zastoupení dominantních činností, které jsou prováděny při poslechu rádia, v čase od 5:00 do 24:00.
V ranních, dopoledních a odpoledních hodinách je jednoznačnou dominantní činností zaměstnání (mimo domov) – tuto skupinu tvoří 30% až 40% všech posluchačů, kteří v této době poslouchají rádio a současně jsou v zaměstnání. V průběhu pozdního odpoledne pak jejich podíl prudce klesá, večer a v noci pracující tvoří nejvýše 20% všech poslouchajících.
38
V časných ranních hodinách (zhruba od 5:00 do 7:00) tvoří významnou část posluchačů ti, kteří provádějí hygienu/péči o vzhled/oblékání – mezi 10% a 30%. Ve zbytku dne je zastoupení této činnosti mezi posluchači zanedbatelné. Další velmi silnou skupinu posluchačů tvoří ti, kteří se při poslechu rádia věnují domácím pracím/péči o děti. Od rána a během dopoledne se jejich podíl vyšplhá až na necelých 40% Kolem 11 hodiny tvoří dokonce největší skupinu ze všech, kteří právě poslouchají rádio. Poté jejich podíl v době oběda prudce klesne, odpoledne a pozdní odpoledne se pohybuje kolem 20%. Ve večerních a nočních hodinách postupně klesá až pod 5% podíl. Večer a v noci pozorujeme nejvýraznější zastoupení posluchačů, kteří se věnují volnému času a koníčkům (doma) – jejich procentní podíl naroste od 20% až na necelých 50%. Dopoledne se jejich podíl pohybuje pod 10%, odpoledne do 20%. Nad hranicí 10% se ráno pohybují ti, kteří se stravují (doma). Kolem 12. hodiny se jejich podíl mezi všemi posluchači vyšplhá až pod 30%. Ve večerních hodinách pak tvoří kolem 10% všech posluchačů, v ostatních časech je jejich podíl mezi poslouchajícími zanedbatelný. Jedna z dominantních činností, kterou zde musíme zmínit, je cestování (autem). Ráno, v pozdní odpoledne a večer se podíl těch, kteří cestují autem a poslouchají rádio vůči všem poslouchajícím, pohybuje mezi 10% a 20%. V ostatních denních dobách klesá pod 10%. V grafu je ještě zařazena činnost čas strávený na internetu, neboť kolem 21. hodiny tuto činnost provádí 10% všech posluchačů.
39
5. Závěr Cílem této semestrální práce bylo analyzovat chování rozhlasových posluchačů a provést jejich segmentaci do skupin z hlediska doby poslechu rádia a volnočasového chování. Toto hledisko bylo stanoveno v obecné rovině zadavatelem, na základě vlastních kritických úvah a výsledků průběžných analýz pak bylo zkonkretizováno a upřesněno. Tím bylo možné aplikovat je na vstupní data a provést cílené analýzy. Na základě spolupráce se společností STEM/MARK jsme získali pololetní data Radio projektu, s nimiž jsme pak dále pracovali. V práci jsme použili shlukovou analýzu, konkrétně dvoukrokovou metodu shlukové analýzy, neboť výborně pracuje také s velkým množstvím dat a navíc je schopna pracovat s číselnými i nominálními proměnnými (obojí bylo nutné ve všech shlukových analýzách). Po seznámení s Radio projektem, samotnými daty a základním zobrazením poslechovosti rádií z několika úhlů pohledu jsme provedli segmentaci posluchačů z hlediska kombinace poslechu rádia v různých denních dobách a činností prováděných během dne. Vypočítali jsme procentní podíl jednotlivých činností při poslechu rádia, přičemž největší část respondentů (31%) je při poslechu během dne v zaměstnání (mimo domov). Po provedení dvoukrokové shlukové analýzy jsme určili, zdůvodnili a podrobně popsali celkem 7 shluků: 1. zaměstnaní (mimo domov) s obvyklou pracovní dobou – poslouchají v práci rádio, 2. studující (mimo domov i doma) + zaměstnaní doma, 3. zábava a koníčky + dopolední spáči, 4. zaměstnaní (mimo domov) s pracovní dobou v pozdějších a nočních hodinách – v práci rádio poslouchají a ráno spí, 5. zaměstnaní (mimo domov) – v práci rádio neposlouchají, 6. v domácnosti/péče o děti, volný čas – souběžně poslouchají rádio a konečně 7. v domácnosti/péče o děti – souběžně rádio neposlouchají. Pro jednotlivé činnosti zvlášť jsme graficky znázornili a objasnili vývoj poslechovosti, resp. neposlechovosti během dne, jakož i vývoj jejich vzájemného poměru. V práci jsme do hloubky analyzovali chování posluchačů v I. a II. čtvrtletí roku 2009 a nabídli jsme konkrétní typ jejich segmentace. Provedli jsme analýzu poslechovosti českých rozhlasových stanic z jiného úhlu, než z jakého ji prezentuje Radio projekt. Tato analýza může mimo jiné představovat východisko a základ k účinnému a efektivnímu cílení
40
reklamy. Kromě toho poskytuje detailnější sociologický popis a charakteristiku posluchačské obce v České republice.
41
Použité informační prameny [1]
Median [online]. Praha : Společnost Median, s.r.o. [použito 10. prosince 2009]. Dostupné na WWW: < http://www.median.cz/index.php?lang=cs&page=1&sub=9>.
[2]
STEM/MARK [online]. Praha : Společnost STEM/MARK, a.s. Firemní prezentace (PDF). Posl. úpravy 9.12.2009 [použito 10. prosince 2009]. Dostupné na WWW:
.
[3]
CATI [online]. Praha : CATI. Telefonické dotazování s podporou počítače. [použito 10. prosince 2009]. Dostupné na WWW: < http://www.cati.cz/>.
[4]
Median,
STEM/MARK:
Radio
projekt.
Metodika.
Poslechovost
v populaci
a
sociodemografických skupinách v ČR: metodika, 1. 1. 2009 – 30. 6. 2009. Praha: Median, STEM/MARK, SKMO, 2009. [5]
MediaGuru [online]. MediaGuru! Server o reklamě a mediálním plánování. [použito 10. prosince
2009].
Dostupné
na
WWW:
slovnik/a/1911.html>. [6]
PASW® Statistics 18 *DVD+. PASW Statistics, part of SPSS Inc.’s Predictive Analytics Software Portfolio, 2009 SPSS Inc. Ident. č.: S18WRP-0609.
[7]
SPSS Statistics Guide [online]. Straight talk about data analysis and SPSS. [použito 1. března 2010+. Dostupné na WWW: .
[8]
STEM/MARK [online]. Praha : Společnost STEM/MARK, a.s. [použito 10. prosince 2009]. Dostupné na WWW: < http://www.stemmark.cz/>.
[9]
Wikipedia [online]. Wikipedia, the free encyclopedia [použito 10. prosince 2009]. Dostupné na WWW: < http://en.wikipedia.org/wiki/Copy_testing>.
42
[10] Median, STEM/MARK: Radio projekt. Výzkum poslechovosti rozhlasových stanic (Výsledky IV/2008 + I/2009): prezentace výsledku RP, 7. 5. 2009. Praha: Median, STEM/MARK, 2009.
[11] Regie Radio Music: Radioprojekt 2006 – 2008. Praha, 2008 *použito 30. listopadu 2009+. Dostupné na WWW: .
[12] Media Master: Radio projekt. Výzkum poslechovosti rozhlasových stanic (1.1.2009 – 30.6.2009): půlroční zpráva o RP. Praha, 2009 *použito 30. listopadu 2009+. Dostupné na WWW: .
[13] REIF, J. Metody matematické statistiky. 2. uprav. vydání. Plzeň : Západočeská univerzita v Plzni, 2004. ISBN 80-7043-302-7. [14] HEBÁK, P.; HUSTOPECKÝ, j.; PECÁKOVÁ, i. aj. Vícerozměrné statistické metody [3]. 1. vydání. Praha : INFORMATORIUM, 2005. ISBN 80-73333-039-3.
43
Příloha 1 – Tabulka s popisem proměnných ze vstupních dat týkajících se respondenta JMÉNO DVT DVTS PHASE ABCD ABCDCZ DVD HHINC_NP HINC_N KRAJ1 KRAJ2 OKRES1 OKRES2 OLDKRAJ1 OLDKRAJ2 PDVD PO_05 PO06_ PO15_ PO18_ PO26_ PO80_ POINC PRECHOD
POPIS Den dotazování Den sledování Období Socioekonomická klasifikace ESOMAR Socioekonomická klasifikace národní Jsou v domácnosti děti mladší 18 let? Čistý měsíční příjem domácnosti na osobu Průměrný čistý měsíční příjem domácnosti Kraj kde respondent tráví většinu dnů v týdnu Kraj kde respondent trvale bydlí Okres kde respondent tráví většinu dnů v týdnu Okres kde respondent trvale bydlí Starý kraj kde respondent tráví většinu dnů v týdnu Starý kraj kde respondent trvale bydlí Počet dětí v domácnosti mladších 18 let Počet osob mladších 6 let Počet osob ve věku 6 - 14 let Počet osob ve věku 15 - 17 let Počet osob ve věku 18 - 25 let Počet osob ve věku 26 - 79 let Počet osob ve věku 80 let a více Počet osob s příjmem Tráví respondent většinu dnů v týdnu v místě trvalého bydliště?
HODNOTY ,1= Neděle, 2= Pondělí, …, 7= Sobota,1= Neděle, 2= Pondělí, …, 7= Sobota} {2= 1.1.2009 - 30.6.2009} {1= A - nejvyšší, 2= B, …, 8= E3 - nejnižší{1= A - nejvyšší, 2= B, …, 8= E3 - nejnižší{1= Ano, 2= Ne} ,1= Do 3 500 Kč, 2= 3 501 - 4 500, …, 7= 15 001 a více,1= Do 4 000 Kč, 2= 4 001 - 6 000, …, 17= Odmítl(a),1= Praha, 2= Středočeský kraj, …, 14= Moravskoslezský kraj,1= Praha, 2= Středočeský kraj, …, 14= Moravskoslezský kraj{1= Praha, 2= Benešov, …, 77= Ostrava,1= Praha, 2= Benešov, …, 77= Ostrava,1= Praha, 2= Střední Čechy, …, 8= Severní Morava} ,1= Praha, 2= Střední Čechy, …, 8= Severní Morava} ,0= žádná, 1= 1 osoba, …, 20= 20 osob,0= žádná, 1= 1 osoba, …, 15= 15 osob,0= žádná, 1= 1 osoba, …, 15= 15 osob,0= žádná, 1= 1 osoba, …, 15= 15 osob,0= žádná, 1= 1 osoba, …, 15= 15 osob,0= žádná, 1= 1 osoba, …, 15= 15 osob,0= žádná, 1= 1 osoba, …, 15= 15 osob,1= 1 osoba, 2= 2osoby, …, 20= 20 osob{1= Ano, 2= Ne}
44
JMÉNO SIZE1 SIZE2 VDZ01 VDZ02 VDZ03 VDZ04
VDZ05
VDZ06 VDZ07 VDZ08 VDZ09 VDZ10 VDZ11 VDZ12 VDZ13 VDZ14 VDZ15 VELDOM VMB1 VMB2
POPIS Velikost místa bydliště kde respondent tráví většinu dnů v týdnu Velikost místa bydliště Vybavenost domácnosti (Barevná televize) Vybavenost domácnosti (Videorekordér) Vybavenost domácnosti (DVD přehrávač / DVD rekordér) Vybavenost domácnosti (Videokamera (klasická nebo digitální)) Vybavenost domácnosti (Osobní automobil mladší 10 let) Vybavenost domácnosti (Fotoaparát (klasický nebo digitální)) Vybavenost domácnosti (Počítač) Vybavenost domácnosti (Elektrická vrtačka) Vybavenost domácnosti (Mikrovlnná trouba) Vybavenost domácnosti (Domácí kino) Vybavenost domácnosti (Chata / chalupa) Vybavenost domácnosti (Pevná telefonní linka) Vybavenost domácnosti (Autorádio) Vybavenost domácnosti (Jiný rozhlasový přijímač) Vybavenost domácnosti (Myčka nádobí) Celkem osob v domácnosti a. Velikost místa bydliště kde respondent tráví většinu dnů v týdnu a. Velikost místa bydliště
HODNOTY {1= do 1 000 obyvatel, 2= 1 001 - 4 999 obyvatel, …, 6= 100 000 a více{1= do 1 000 obyvatel, 2= 1 001 - 4 999 obyvatel, …, 6= 100 000 a více{0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano}
{0= Ne, 1= Ano}
{0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} {0= Ne, 1= Ano} ,1= 1 osoba, 2= 2osoby, …, 25= 25 osob{1= do 1 000 obyvatel, 2= 1 001 - 4 999 obyvatel, …, 5= 100 000 a více{1= do 1 000 obyvatel, 2= 1 001 - 4 999 obyvatel, …, 5= 100 000 a více-
45
JMÉNO AGE AGEREC ECOACT
POPIS Věk respondenta Věk respondenta (R) Je respondent ekonomicky aktivní?
ECONOACT Ekonomicky neaktivní EDU
Vzdělání respondenta
EDUREC
Vzdělání respondenta (R)
HWIFE
Respondent je hlava domácnosti Respondent je hospodyně
PEA
Profese respondenta
POSEACT
Pozice ekonomicky aktivních
HEAD
RINC ROFT RPOST RPZAM RZAM SEX VOZ01
VOZ02
VOZ03
HHEDU
Průměrný čistý měsíční příjem respondenta Rozhodování o finančních tocích Postavení v zaměstnání respondenta Počet zaměstnanců ve firmě respondenta Pracovní zařazení respondenta
HODNOTY ,12= 12 let, 13= 13 let, …, 79= 79 let{1= 12-19 let, 2= 20- 29 let, …, 7= 70- 79 let} {1= Ano, 2= Ne} ,1= Důchodci, 2= Žáci/ Studenti/ Učni, 3= Ostatní,1= Bez vzdělání / Neukončené vzdělání, 2= Základní, …, 7= Vysokoškolské- magisterské/ vědecká příprava,1= Základní, 2= Střední bez maturity, …, 4= Vysokoškolské{1= Ano, 2= Ne} {1= Ano, 2= Ne} ,1= Zemědělec, 2= Nekvalifikovaný dělník, 7= Ostatní,1= Zaměstnanec - řadový pracovník, 2= Zaměstnanec - vedoucí pracovník, …, 4= Neuvedeno} ,1= Bez příjmu, 2= Do 4 000 Kč, …, 18= Odmítl(a),1= Nerozhoduji o finančních tocích, 2= Do 50 tisíc Kč ročně, …, 8= Odmítl(a) uvést,1= Řadový pracovník, 2= Vedoucí pracovník s 15 podřízenými, …, 8= Neuvedeno,1= Pouze jeden pracovník / podnikatel / živnostník, 2= 2- 5 zaměstnanců, 6= Neuvedeno,1= Zaměstnanec, 2= Soukromý podnikatel (vlastník/ spoluvlastník firmy) bez zaměstnání, …, 9= Neuvedeno,1= Muž, 2= Žena-
Pohlaví respondenta Respondent osobně disponuje: (Soukromým {0= Ne, 1= Ano} mobilem) Respondent osobně disponuje: (Služebním {0= Ne, 1= Ano} mobilem) Respondent osobně disponuje: (Platební / kreditní {0= Ne, 1= Ano} kartou) ,1= Bez vzdělání / Neukončené vzdělání, 2= Vzdělání hlavy domácnosti Základní, …, 7= Vysokoškolské- magisterské/ vědecká příprava-
46
JMÉNO
POPIS
HODNOTY ,1= Základní, 2= Střední bez maturity, …, 4= HHEDUREC Vzdělání hlavy domácnosti (R) VysokoškolskéPrůměrný čistý měsíční příjem ,1= Bez příjmu, 2= Do 4 000 Kč, …, 18= HHINC hlavy domácnosti Odmítl(a)Postavení v zaměstnání hlavy ,1= Řadový pracovník, 2= Vedoucí pracovník s 1HHPOST domácnosti 5 podřízenými, …, 8= NeuvedenoPočet zaměstnanců ve firmě ,1= Pouze jeden pracovník / podnikatel / HHPZAM hlavy domácnosti živnostník, 2= 2- 5 zaměstnanců, 6= Neuvedeno,1= Zaměstnanec, 2= Soukromý podnikatel Pracovní zařazení hlavy HHZAM (vlastník/ spoluvlastník firmy) bez zaměstnání, domácnosti …, 9= Neuvedeno} ,1= Zemědělec, 2= Nekvalifikovaný dělník, 7= PEAH Profese hlavy domácnosti OstatníMáte e-mailovou adresu EADR {1= Ano, 2= Ne} (soukromou/firemní)? ,1= Každý den n. téměř každý den , 2= NETC Jak často využíváte internet? Několikrát týdně, …, 8= Neuvedeno} Kde máte přístup k internetu? NETZ01 {0= Ne, 1= Ano} (V práci) Kde máte přístup k internetu? NETZ02 {0= Ne, 1= Ano} (Ve škole) Kde máte přístup k internetu? NETZ03 {0= Ne, 1= Ano} (Doma) Kde máte přístup k internetu? NETZ04 {0= Ne, 1= Ano} (Kdekoliv přes mobil ) Kde máte přístup k internetu? NETZ05 {0= Ne, 1= Ano} (Jinde) NETY Máte přístup k internetu? {1= Ano, 2= Ne} KAB Máte kabelovou televizi? {1= Ano, 2= Ne} RISCO KZAM respondenta ,101= 101, 1 100= 1 100, …, 9 999 = 9 999HHISCO KZAM hlavy domácnosti ,101= 101, 1 100= 1 100, …, 9 999 = 9 999Netel Má telefon? ,,0= Má telefon, 1,00= Nemá telefon-
47
Příloha 2 – Výstup shlukové analýzy kapitola 4.1 dvoukroková shluková analýza se vstupní proměnnou SPNRAD**D 5.3-1.sav, 5.3-1.xlxs – soubor s daty a rozřazením všech respondentů do jednotlivých shluků 5.3-1.sps – syntaxový soubor se všemi provedenými metodami 5.3-SPNRAD.sps – syntaxový soubor se zápisem vytvoření nového typu proměnné SPNRAD** 5.3-1.spv, 5.3-1.pdf – výstupní soubor s podrobnými tabulkami a grafy
kapitola 4.2 grafické znázornění jednotlivých činností během dne 5.4-1a.sav, 5.4-1a.xlxs, 5.4-1b.sav, 5.4-1b.xlxs – soubory s daty 5.4-1.spv, 5.4-1.pdf – výstupní soubor s podrobnými grafy 5.4-1.sps – syntaxový soubor se zápisem vykreslení grafů porovnání činností prováděných při poslechu rádia 5.4-2.sav, 5.4-2.xlxs – soubory s daty 5.4-2.spv, 5.4-2.pdf – výstupní soubor s podrobnými grafy 5.4-2.sps – syntaxový soubor se zápisem vykreslení grafů
48