ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
Problémák a mérıeszköznél
• Vajon néz-e a nézınek bejelentkezett? • Elfelejtkezhet bejelentkezni
Megoldási kísérletek: • idınkénti kontroll-kérdések • telefonos ellenırzés • adatok szőrése
A súlyozás
Célja: a minta kiegyenlítése, az alapozó felmérés, ill. a mikrocenzus alapján számított esetszámok (universe-k) beállítása Lehetséges módszerek: • Cellamátrix (többdimenziós együttes eloszlás minden cellájára) • RIM weighting (marginálisok súlyozása)
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
Elıadó: Zempléni András
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
TVTV-nézı nézımérı rendszer és lehetséges torzítása
TVTV-nézettség mérése
Minden országban mőködik Célja: • visszajelzés a TV-mősorok készítıinek • reklámok által elért közönség becslése Eszköze: • TV-n nézett csatornát regisztráló készülék, a nézık gombnyomással jeleznek
Adatszolgáltatók köre: köre: panel
• kiválasztás: évenként elvégzett széleskörő felmérés (Establishment Survey, Alapozó felmérés) alapján • cél: minél jobban reprezentálja az ország lakosságát • valóság: nem teljes az egyezés • korrekció: súlyozás
Kérdések a súlyozásnál figyelembe veendı változókra vonatkozóan Mely változókat (változó - kombinációkat) válasszuk?
Melyek legyenek a súlyozás kategóriái?
Képzeletbeli példa universek A népesség (universe) Férfi összetétele
Nı
Összesen
Városi
1 250 000
1 250 000
2 500 000
Falusi
1 250 000
1 250 000
2 500 000
Összesen
2 500 000
2 500 000
5 000 000
Súlyozás lépései /1 A universe összetétele (ezer) Városi
Férfi 2000
Nı Összesen 5000 súlyok 500 500 1000 Súlyozott esetszámok
Falusi
2000
2000
4000
Összesen
2500
2500
5 000
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
• Melyik módszerrel? Ha kevés a változó, a cellamátrix, egyébként a marginális-súlyozás a reális Magyarországon ez utóbbi módszert alkalmazzák (RIM weighting). • Mely változókat (változó - kombinációkat) válasszuk? Mik legyenek a súlyozás kategóriái?
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
Kérdések a súlyozásról
Példa RIM weighting súlyozásra • Ha egy változó nem szerepel a súlyozásban, az adott - esetleg kiegyenlítetlen - panel torzíthatja a nézettség becslését Példa: Két változó, két-két értékkel, különbözı súlyozási kategóriákkal: • súlyozás nélkül • csak az egyik változó súlyozó • mindkét változó súlyozó
Képzeletbeli példa panel A panel összetétele
Nı
Összesen 350
Falusi
250 100 Esetszámok 1000 400
1 400
Összesen
1250
1750
Városi
Férfi
500
Kérdés: hogyan súlyozzunk, hogy a súlyozás utáni minta peremeloszlásai megfeleljenek a teljes populációnak?
Súlyozás lépései /2 A universe összetétele (ezer) Városi 2.5
súlyok
Férfi 2000
Nı Összesen 5000 súlyok 1250 1250 2500 Súlyozott esetszámok
Falusi 0.625
1250
1250
2500
Összesen
2500
2500
5 000
A súlyok koncentrációja A panel különbözı súlyú részeinek hatása 15000
12000
9000
6000
3000
0
1
2
3
4
5
Az egyes 20% nagyságú csoportok
A becslések megbízhatósága
• Ha valószínőségi modellt alkalmazunk (N Poisson eloszlású – a mősor nézıi – független X,Y-tól): N 2 2 2 2 2 2 λ (σ + + mm) = λ (σ) = + mλ )(σ(σ + m ) + m )(σ D 2 (∑ X iYi ) D=(∑λX(Yσ) =XY XY X X Y + mY ) N
2
i
i
2 XY
2 XY
2 X
2 X
2 Y
2 Y
i =1
i =1
X: súlyok, Y:nézettség. X szórása is növeli a becslés szórását. • Nagyobb panel esetén a becslések szórása csökken • Alacsony esetszámú kategória (<50 paneltag) nézettségére vonatkozó becslés szórása igen nagy
0
0
0
,0 0
,0 0 57
53
0
,0 0
0
0
0
0
,0 0
,0 0
49
45
41
,0 0 37
0
,0 0
,0 0
29
25
50
,0 0
0
1 00
33
2
1 50
00
0
0 00 53
57
0
0 00 49
0
0
00
00 41
45
0
0
00
00
00 29
33
37
0
0 00
00 25
0
00
0 21
00
0 00
Súlyozatlan becslés: 455/1750=0.26 Súlyozott becslés: 0.2
4
2 00
13
1750
6
2 50
17
500
8
3 00
00
1 250
Összesen
10
3 50
00
1400
a súlyok nagy szórást
4 00
50
1000 400 AMR=.3 AMR=.3
->
A sú l yok m egoszlása 19 98.09.24-én
90
350
Túl sok súlyozó változó mutatnak
G y ak or i ság
250 100 AMR=.1 AMR=.1
A súlyok megoszlása
10
Összesen
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
Falusi
Nı
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
Férfi
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
A panel összetétele és a becsült nézettség (valószínőség) Városi
átlagsúly
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
Képzeletbeli példa panel és nézettség
A súlyok ingadozása • Ha a panel az adott változó szerint nem arányos, a súlyok szórása nı Az elızı példában : ha csak 1 változó szerint súlyozunk: max/min=4 ha mindkét változó szerint súlyozunk: max/min= 10
Következtetések Azokat a változókat célszerő súlyozó változónak választani, amelyek • hatnak a TV nézési szokásokra • napi kiegyenlítettsége fontos a felhasználók számára Célszerő kihagyni azokat, amelyek • nem fontosak, de viszonylag kiegyenlítetlen a minta az adott szempontból
A nézettségi adatok clusterei (k-közép módszer); módszer); a legfontosabb TV csatornák átlagos nézettsége az egyes clusterekben Cluster sorszáma MTV1
1
2
3
4
65 165 25
37
MTV2
5
18
4
3
Duna TV
3
12
4
3
TV2 RTL Klub
222 49
70 40
85
31 34 204
A clusterek vizsgálata
Elemeztük a csoportok összetételét. A változókat rangsorolhatjuk aszerint, hogy mennyire különböznek az egyes clusterek között. A legfontosabbak azok, amelyek nagy eltérést mutatnak. A mérıszám az úgynevezett KruskalWallis próbastatisztika, amely chi-négyzet eloszlású, ha csak véletlen eltérés van a csoportok között.
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
Cluster-analízis A módszer lényege: több számértékkel egyidejőleg jellemzett megfigyelések csoportosítása a távolságuk alapján A megfigyelések: az egyes panel-tagok a vizsgált 10 hetes idıszakban mennyit nézték az egyes csatornákat (külön-külön, idısávonként, ill. összesítve).
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
A változók hatásának vizsgálata
Clusteranalízis
• •
Cél: sokdimenziós megfigyelések csoportosítása Módszerek: 1. k-közép módszer (elıre rögzített clusterszámmal dolgozunk, iterációs eljárás) – ezt használtuk a TVnézettségnél 2. hierarchikus eljárások (n-rıl egyesével csökken a clusterszám, definiálni kell a megállás helyét) Minden esetben definiálni kell clusterek távolságát (középpontok távolsága, minimális/maximális elemenkénti távolság, stb.)
A clusterek elhelyezkedése
700 600
M T V 1
500 400 300 200
Cluster
100 0 800
4 600
400
TV2
200
0
0
100 200
300 400
500
RTL Klub
600 700
3 2 1
A KruskalKruskal-Wallis statisztika
K =
12 N +1 2 ) ni( R i − ∑ 2 N ( N + 1) i
• N a teljes minta elemszáma (kb. 1600) • Ri az i-edik csoporthoz tartozó elemek rangjainak (a nagyság szerinti sorban elfoglalt helyei sorszámának) átlaga • ni az i-edik csoport elemszáma
72.2
30-49
33.9
30-34
13.9
35-39
8.0
A változók kiválasztása Tesztek a különbözı kategória-rendszerekkel: iterációk konvergenciája kritikus csoportok vizsgálata külön-külön “telefon” szükséges (felhasználók elvárása) „jövedelem” beválasztása jelentısen növeli a szórást alsó két iskolázottsági kategória (<8 oszt., = 8 oszt.) összevonása célszerő
A változók számának csökkentése után adódó súlyok • Az egymás utáni napok közötti súlyok korrelációja közel 0.99 • a súlyok szórása kisebb a ‘98-as érték harmadánál A súlyozás (ideális esetben, azaz amikor a universe esetszámok pontosak és teljesül a függetlenség) nem okoz torzítást, legfeljebb a szórást növeli.
Kérdés: mekkora is ez a szórás?
Chi-négyzet 11.4
Borsod, Heves megye Baranya, Tolna, Somogy megye
6.2
Fejér, Veszprém, Zala megye
3.2
Városi nı
3.8
Kisvárosi harmincas nı
3.1
Az új súlyok koncentrációja A 620-as panel
A 840-es panel
különbözı súlyú részeinek hatása
különbözı súlyú részeinek hatása
15000
15000
12000
12000
900 0
900 0
átlagsúly
4-14
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
78.2
Néhány kevésbé fontos változó
átlagsúly
15-29
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
Chi-négyzet
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
Néhány korcsoport szerepe
600 0
300 0
600 0
300 0
0
0
1
2
3
4
5
Az egyes 20% nagyságú csoportok
1
2
3
4
5
Az egyes 20% nagyságú csoportok
A becslések szórásának vizsgálata
• A megfigyelések nem függetlenek! családon belüli (kényszerő) kapcsolat: az egymáshoz közeli idıpontokban nagyon hasonló a mősorok nézıinek összetétele
• Kérdés: valójában hány elemő mintának felel meg a panel?
Alkalmazása
• Xc, X2,...Xn a panel által adott percben szolgáltatott adatok. • A mintákat a panelból vesszük, a nézettségi adatok nem változnak. • Gond: nem függetlenek a panel-tagok, de az összefüggıség szórásra gyakorolt hatása vizsgálható a módszerrel.
A két szórás alakulása egy nap során (átlagos percenkénti nézettség, nézettség, AMR) .014
.012
.010
.008
.006
.004
.002
RTLSZ
0.000
RTLELMS 1
145 73
PERC
289
217
433
361
577
505
721
649
865
793
1009 1153 1297
937
1081 1225 1369
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
• Véletlen, az adott napi panellel családlétszám szerint azonos megoszlást mutató “paneleket” generálunk. • A súlyozási eljárást minden egyes panelre külön-külön elvégezzük • Így panelenként kapunk becslést a nézettségi adatokra.
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
A bootstrap eljárás
A becslések szórásának vizsgálata bootstrap módszerrel A módszer matematikai háttere: Xc, X2,...Xn: ftlen, azonos, F eloszlású. Fn a tapasztalati eloszlásfv. Új (bootstrap) minta a tapasztalati eloszlásból: x* Ennek feltételes szórásnégyzete:
D2 (X *) =
x (1 − x ) n
A szórások összehasonlítása
• Elméleti érték:
pˆ (1 − pˆ ) n
• A bootstrap minták révén megfigyelt (tapasztalati) szórás: ahol pi az egyes mintáknál kapott becslés, p pedig ezek átlaga
1 ∑(pi −p)2 n−1
A két szórás hányadosa
• Nem függ szignifikánsan az idıponttól a nézettségtıl
• Lényeges viszont a vizsgált célcsoport, hiszen az összefüggés mértéke jelentısen eltérhet
.012
.010
.008
.006
.004
.002 MTV1SZ 0.000
MTV1ELMS 1
145 73
289
217
433
361
577
505
721
649
865
793
1009 1153 1297
937
1081 1225 1369
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
A két szórás hányadosa a 1818-49 évesek, évesek, mint célcsoport esetén
A szórások hányadosa a fıbevásárlók, fıbevásárlók, mint célcsoport esetén .02
.01
TV2SZ 0.00 289
217
433
361
577
505
721 649
865
793
1009 1153
937
1081
1297
1225
1369
Ha a fıbevásárlókat tekintjük, tekintjük, nincs családon belüli összefüggés SHANY 1.4
1.3
1.2
1.1
1.0
.9 Observed .8
Linear .1
.2
.3
ATL
Mősorok, Mősorok, kampányok
• Nemzetközi tapasztalat: a reach/AMR hányados növekedésével (azaz ahogy nı a legalább 1 percre elért populáció és az adott percben nézık számának aránya) csökken a becslés szórása (és így a szórás-hányados is) • A különbözı mősorok meglehetısen eltérı viselkedést mutattak, ezért célszerőbb volt különbözı sorozatok, ill. kampányok vizsgálata
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
PERC
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
145 73
PERC
0.0
TV2ELMS 1
A bootstrap mintákból kapott becslés szórása Az elızı ábra szerint a bootstrap mintákból kapott becslés szórása néhány százalékkal nagyobb a vártnál. Az ok: a bootstrap mintákra kapott súlyozás szélsıségesebb - a súlyok szórása mintegy 10%-kal magasabb - (hiszen a minta természetszerőleg kevésbé arányos) és ez növeli a kapott becslések szórását.
A szórások hányadosa különbözı kampányokra 1.6
1.4
1.2
1.0
.8
.6 Predicted Values REAPERAT
.4
SHANY REAPERAT
.2 0
2
4
6
8
10
12
14
16
Alapozó felmérés
• 8.000 család, reprezentatív minta • gond: nem mindenkit lehet elérni, ill. nem mindenki válaszol a kérdésekre • a család szociológiai viszonyait vizsgálja • a nézıméréshez való viszonyt is rögzíti (több, mint 50% nem vállalja a részvételt)
A becsült és a megfigyelt TV üzemórák összehasonlítása • TUHETI: a háztartásonként mért heti össz-TV üzemórák átlaga • ÓRAHETI pedig az Alapozó Felmérésben elozetesen bevallott heti TV üzemóra. N Min Max Átlag ÓRAHETI 11453 0 326 37.40 TUHETI 1014 0 130 47.98
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
b+(max-b)/[a(R-1)+1] A paraméterek szemléletes jelentése: • a adja meg a görbe meredekségét • b a legkisebb, elvileg elérhetı szóráshányados (ha az R=reach/AMR hányados végtelenhez tart) • max pedig a reach/AMR=1 értékhez tartozó szórás-hányados
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
A nemlineáris regresszió képlete
Következtetések
A bootstrap elemzés megmutatta, hogy • az AMR becslések szórása valamelyest (legfeljebb 30%-kal) nagyobb, mint ami az elméleti becslés lenne • viszont a kampányok, sorozatok esetén a reach/AMR hányados növekedtével akár az elméleti érték negyedére is csökkenhet a szórás.
Az esetleges torzítás vizsgálata
• Számszerősítés: a becsült és a ténylegesen megfigyelt TV-nézés (heti össz üzemóra) vizsgálata • Bootstrap elemzés: a teljes alapozó felméréspopulációval azonos eloszlású TV üzemórát becslı háztartásokból álljanak a mintapanelok.
A torzítás
A fenti populáció azokból áll, akik a panelbe kerültek az alapozó felmérésbıl, ezért az eltérés csak a becslés bizonytalanságát mutatatja. Viszont, ha az ORAHETI értékét a nézımérı rendszerhez való viszony függvényében vizsgáljuk: AGBMER N Min Max Átlag elutasít (1) 6458 0 252 32.73 vállalk. (2) 4451 0 326 43.70 beszerelt (3) 235 7 140 45.27
Az ORAHETI értékek eltérésének szignifikanciáját kétmintás t-próbával vizsgálhatjuk: • Az AGBMER = 1 és = 2 csoportok közötti eltérés szignifikáns • nem sziginifikáns az eltérés az AGBMER = 2 és = 3 csoportok között.
nézı mérés-- 20 201 feb.. 1 10 ımérés 14.feb 0. TV néz
ımérés nézı mérés-- 20 201 feb.. 1 10 14.feb 0. TV néz
Az eltérések vizsgálata
Összefoglalás
•
A mőszeres mérés megbízhatóságának fı tényezıi 1. Panel kiegyensúlyozottsága a fı szempontok szerint 2. A panelba kerülı háztartások kiválasztása 3. Panelméret
•
A bizonytalanság számszerősítendı (esetleg késıbb visszatérünk rá)