BGF PSzK Módszertani Intézeti Tanszéki Osztály
GAZDASÁGI ÉS ÜZLETI STATISZTIKA jegyzet A PIAC VIZSGÁLATA
A jegyzetet a BGF Módszertani Intézeti Tanszékének oktatói készítették 2001-ben, és frissítették 2011-ben.
5. A piac vizsgálata A piac: a tényleges és potenciális eladók és vevők, illetve azok cserekapcsolatainak rendszere, melynek legfőbb tényezői a kereslet, a kínálat, az ár és a jövedelem [Koppányi Mihály: Mikroökonómia AULA 1993.] Ebben a fejezetben elsősorban a termelők, a szolgáltatók, a fogyasztók, háztartások egy meghatározott csoportjánál (mezoszint) jelentkező jelentősebb gazdasági problémák vizsgálatára kerül sor. A fejezet első részében az egy termék vagy szolgáltatás piacán jelenlevő versenytársak összehasonlítása történik meg. 5. 1. A piac mérete, a piaci részesedés vizsgálata, koncentráció Minden vállalkozást érdekel, hogy kik a versenytársai a piacon, mekkora a piaci részesedésük és – szorosan kapcsolódva az előző kettőhöz – milyen mértékű a piac koncentrációja. l. probléma: Az AFEOSZ által működtetett Coop Hungary Rt. szeretné megvizsgálni, hogy tartja-e piaci helyzetét 1999-ben is az élelmiszerkereskedelem területén. Az 1998. évben második helyet foglalt el a Top listán. Vezetői úgy érzékelik, hogy az eddig negyedik helyezett CBA hihetetlen dinamizmussal tör előre. .Az elmúlt években sikerült megdupláznia üzleteinek számát és a forgalmát is. Módszertan Az elemzés nagyon egyszerű módszerrel történik. Csoportosított adatokból viszonyszámokat számolunk, koncentrációt elemzünk. Továbbá érdemes a kapott mutatókat a korábbi évek hasonló mutatóival összehasonlítani. 5.1.1. A piac mérete: A piac mérete alatt a piaci résztvevők számát értjük. A piac méretét a költségek alakulása, a termék, szolgáltatás iránti kereslet nagysága és egymáshoz való viszonyuk határozza meg. A közgazdaságtanban értelmezett relatív piacméret [Koppányi Mihály: Mikroökonómia AULA 1993. 322. old.] meghatározza társadalmi szempontból a piaci szereplők optimális számát. A valóságban azonban ez nagyon ritkán teljesül. Ennek ellenére a piac mérete nagyon fontos kérdés a fogyasztók és a vállalatok szempontjából is. A vállalatok szempontjából azért, mert minél kevesebb a piacon résztvevők száma, annál nagyobb a profit lehetősége. A fogyasztók szempontjából pedig minél több a piacon résztvevők száma, annál nagyobb a választási lehetőségek száma. A piac szerkezete befolyásolja a szereplők viselkedését, így egy cég helyzetének megítéléséhez feltétlenül szükség van ezek statisztikai elemzésére.
A probléma megoldása 5.1.1 Az elemzés első szakaszában összegyűjtjük az adatokat a piac résztvevőiről, majd ezekből csoportosító sorokat készítünk a következőképpen: száma forgalom sorszám vállalat neve száma forgalom sorszám vállalat neve Mrd Ft Mrd Ft 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22.
Metro Co-op CBA Tengelmann Csemege Hungarotabak Rewe Tesco SPAR MADOF CORA PROFI BÉE HÉLIKER A-WALHALLA AUCHAN SLÁGER ALFA HAJDÚ-BÉT CSOPAK ORIENT DM DROGERIE
23. 24. 25.
UNIVER ZETA ROSSMANN
9 7233 815 189 200 110 143 38 112 150 4 60 165 75 39 1 188 3 23 47 49 96 42 68 41
220.00 200.00 195.00 139.00 99.00 95.00 89.70 82.30 73.99 62.08 55.00 32.00 29.20 18.00 18.00 15.00 14.60 12.95 12.92 12.04 12.03 11.20
26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47.
10.76 48. 8.45 49. 7.96 50.
RÓZSAVÖLGY AZÚR CSOKI H G-ROBY ZALAIPAR KISALFÖLD ZÖLD-KER BUDAVIDÉK FINNKER MIÉLKER SZILVÁSI KISS B. JÉGCS1LLAG AKKORD TANDEM FE-ZO 100 ÍZ REMA 1000 B1OMARK BONBON MERCATOR SOMOGY MEGA FÁCIT MAX STR. HERBÁRIA
26 60 2 7 32 11 3 13 1 18 8 15 10 3 52 9 236 11 1 45 5 2
7.43 5.20 5.09 3.90 3.70 3.25 3.12 3.02 2.71 2.68 2.60 2.42 2.00 1.90 1.88 1.86 1.68 1.65 1.50 1.46 1.44 1.20
4 1 24
0.70 0.58 0.54
5.1.2. A piaci részesedés elemzése: Módszertan: A piaci részesedés viszonyszám, amelynek számlálójában mindig az adott vállalat forgalma áll. A nevező változhat. Így a piaci részesedés elemzése során az első lépés annak eldöntése, hogy milyen piaci mércét alkalmazzunk, mihez viszonyítsunk. A marketing szakirodalom négyféle mércét említ: Általános piaci részesedés: az adott cég forgalmának és a teljes piacon résztvevők együttes forgalmának a hányadosa, (százalékban adják meg) Megjegyzések: A vizsgálat előtt el kell döntenünk, hogy a forgalmat volumenben vagy értékben számoljuk és tisztázni kell, hogy mit értünk teljes piac alatt. Célpiaci részesedés: az adott cég forgalmának és a célpiaci résztvevők együttes forgalmának a hányadosa. Megjegyzések: Célpiac: az a piac, amely érdeklődik a cég termékei iránt A célpiaci részesedés mindig kisebb, mint az általános piaci részesedés. Relatív piaci részesedés 1: az adott cég forgalmának és a három legnagyobb versenytárs együttes forgalmának a hányadosa. Relatív piaci részesedés 2: az adott cég forgalmának és a legnagyobb versenytárs forgalmának a hányadosa. Fontos, hogy a cég jól értelmezze a piaci részesedés mozgásait!
Bontsuk az általános piaci részesedést a következő négy összetevőre [Philip Kotler: Marketing management Műszaki Könyvkiadó 1991.] Általános piaci részesedés = lefedett fogyasztók X fogyasztói hűség X fogyasztói szelektivitás X árszelektivitás, ahol a lefedett fogyasztók a cégtől vásárlók száma az összes az adott piacon résztvevő cégtől vásárlók számának százalékában kifejezve, fogyasztói hűség a vevők beszerzései a vállalattól az összes többi vállalattól történő összes beszerzés százalékában. fogyasztói szelektivitás a vevők átlagos beszerzései a vállalattól egy átlagos vállalattól történt átlagos beszerzés százalékában. árszelektivitás az adott vállalat által szabott átlagár az összes többi vállalat által kialakított átlagár százalékában. Ha egy cég értékben kifejezett piaci részesedése csökkent az előzőek alapján, a következő négy okra vezethető vissza: - A cég elveszített néhány vevőt - A jelenlegi vevők kevesebbet vásárolnak - A megmaradt fogyasztók köre kisebb - A cég által megadott ár elcsúszott a versenytársakhoz képest A probléma megoldása 5.1.2. Kiszámítjuk a megoszlási viszonyszámokat és kiemeljük az első tíz céget. Top 10 Forgalmi részesedés az 50 cég összforgalmából (%) Sorszám Vállalat neve 1999 1998 1. Metro Holding Hungary 13,8 14,85 2. Co-op Hungary Rt./ÁFEOSZ 12,5 13,20 3. CBA 12,3 7,90 4. Tengelmann Csoport 8,8 9,04 5. Csemege Szupermarketek Rt. 6,2 7,74 6. Hungarotabak-Tobaccoland 6,0 4,12 7. Rewe 5,7 4,83 8. Tesco-Global Áruházak Rt. 5,2 3,35 9. Spar Magyarország Ker. Kft. 4,6 4,03 10. Magyar Dohányforgalmazó Rt. 3,9 4,21 Forrás: Mai piac VII. évf. 5. sz. 2000. május A forgalom megoszlása a Top 50-es lista cégei között
A forgalom megoszlása a Top 50-es lista cégei között Helyezés 1 - 10 11 - 20 21 - 30 31 - 40 41 - 50
%
1 – 10
79,0
11 – 20
14,0
21 – 30
4,7
31 – 40
1,6
41 – 50
0,7
összesen
100,0
Következtetések: Az eredmények alapján a következő megállapításokat tehetjük: Tartja a pozícióját a Coop Hungary Rt./ÁFEOSZ, de sarkában ott van a CBA beszerzési társulás, amelyik hatalmas erővel tör előre. Ezt többek között annak is köszönheti, hogy olyan cégek is csatlakoztak hozzá, amelyek az elmúlt évben a Top listán is szerepeltek (124 új üzletre tett szert). A 124 cég bekebelezése hatékony stratégiának bizonyult a CBA számára. A Coop Hungary Rt.-nek el kell gondolkoznia, hogy milyen stratégiát dolgozzon ki piaci pozíciójának megtartása érdekében. Az elmúlt évek statisztikai elemzései a kereskedelemben tapasztalható koncentráció folyamatos növekedését jelzik, amely a nemzetközi kereskedelmi láncok és a külföldi tőkerésszel működő magyar vállalatok főszereplésével zajlik le. Vizsgáljuk meg, hogy 1999-ben is folytatódik-e ez a tendencia. 5.2. A piaci koncentráció vizsgálata: Módszertan: Koncentráció: a gazdasági életben levő összpontosulásokat értjük koncentráció alatt. Általában a teljes értékösszegnek a sokaság kevés egységére való összpontosulását jelenti. Mi a forgalom koncentrációját vizsgáljuk és nem csak a koncentráció eredményére, hanem annak folyamatára is kíváncsiak vagyunk. Megkülönböztetünk abszolút és relatív koncentrációt: Abszolút koncentráció: ha a teljes értékösszeg kevés számú egységhez tartozik. Relatív koncentráció: ha a teljes értékösszeg egyenetlenül oszlik szét a sokaság egységei között, vagyis nagy az értékek szóródása. Ha egyenletesen oszlik szét az értékösszeg, akkor a koncentráció hiányáról beszélünk. A koncentráció fokát különböző mutatószámokkal jellemezzük: * Abszolút koncentráció mutatói: egységek szárma (N) az egységek pl. forgalomban kifejezett átlagos nagysága ( Y ) * Relatív koncentráció mutatói: koncentrációs tábla kvantilis eloszlás Lorenz görbe A koncentrációs táblában a koncentrációs ismérv, a relatív gyakoriság és a relatív értékösszeg szerepel. A kvantilis eloszlás: a koncentrációs ismérv szerint sorba rendezett azonos hányadaihoz (tized, ötöd stb.) tartozó értékösszeg hányadokat mutatja. A Lorenz görbe egy olyan egységnyi oldalú négyzetben elhelyezett vonaldiagram, ahol a vízszintes tengelyen a relatív gyakoriság, a függőleges tengelyen pedig a relatív értékösszeg szerepel. Koncentrációs együttható: K
T
2T , ahol
T T : az átló és a Lorenz görbe által bezárt terület
T: az átló és a tengelyek által bezárt terület Bebizonyítható, hogy K pontosan a következőképpen határozható meg: K
G
. ahol G az átlagos abszolút különbség
2Y
(GINI). A koncentráció általános mutatói: amelyek az abszolút és a relatív koncentráció kimutatására is alkalmasak.
CR koncentrációs arányszám H Herfindahl index CR koncentrációs arányszám: megmutatja, hogy a sokaság néhány legnagyobb egysége hogyan részesedik a teljes értékösszegből. Főképpen a termelési és piaci koncentráció jellemzésére használják. 1 N 2 H Herfindahl index: H z i . A koncentráció hiánya esetén H és maximális a koncentráció, ha H = l. Ez a i 1 N mutató az egységek kisebb számát méltányolja.
Még meg szokták említeni harmadik mutatóként a redundanciát. A probléma megoldása 5.2. Az előzetes táblázatok eredményei szerint a koncentrációs arányszám 1999-ben az első tíz vállalatot nézve: 0,79. A korábbi adatok alapján 1998-ban 0,73 volt. Következtetések: Megállapítható, hogy a koncentráció mind a két évben nagyon magas és tendenciáját tekintve növekvő. A magyar kereskedők újabb külföldi tőkeerős cégek megjelenésétől tartanak. Az adatok alapján a koncentráció további mutatói is meghatározhatók. 5.3. A konjunktúra elemzése mutatószámokkal A vállalatoknak nem csak szűkebb környezetükre kell figyelniük, hanem ismerniük kell az általános piaci környezetet, annak időbeli változásait. Tudniuk kell, hogy növekvő vagy csökkenő termelésre, fogyasztásra, árakra stb. kell-e számítaniuk. Ezekre a kérdésekre a konjunktúramutatók segítségével válaszolhatnak. 1993. januárja óta a konjunktúramutatók A KSH jelenti c. kiadványban (korábbi nevénStatisztikai Havi Közleményekben) rendszeresen megtalálhatók. E mutatók többek között az ipari termelés és értékesítés, kiskereskedelmi és külkereskedelmi forgalom, beruházás, áruszállítás, lakásépítés, foglalkoztatottság, munkanélküliség, bruttó átlagkereset, külkereskedelmi és fogyasztói árak, a pénzkínálat, a folyó fizetési mérleg, a költségvetési egyenleg, a külföldi adósságállomány alakulását mutatják havonként, illetve negyedévenként megfelelő indexek vagy adatok formájában. 2. Probléma A Co-op Hungary Rt. szeretné újabb üzletek megnyitásával növelni piaci részesedését. Az új beruházások megkezdése előtt szeretne tájékozódni a tágabb környezetről is. Meg akarja tudni, hogy a gazdaság fellendülő vagy hanyatló ciklusban van-e, várható-e a fogyasztás növekedése vagy sem stb. Módszertan A konjunktúra fogalma az idősor ciklikus mozgásához kapcsolódó fogalom. Ciklus: hosszabb távú, kevésbé szabályos ingadozások. Jelenlétét csak hosszabb idősorok esetén lehet kimutatni. Konjunktúracikluson a gazdaságban végbemenő ciklikus változásokat értjük. Üzleti ciklusnak is szokták nevezni. „Üzleti ciklus a piacgazdaságok aggregált gazdasági aktivitásában mutatkozó ingadozás, melynek során a gazdasági aktivitás számos megnyilvánulásának közel egyidejű fellendülését egy hasonló, általános visszaesés követi." [Wesley Mitchell, 1947.] A konjunktúra alakulását sokszor valamilyen makro mutató időbeli változásának vizsgálatához kötjük. Ilyen mutató a bruttó hazai termék (GDP). A GDP-t a KSH-ban két egymástól független adatsorra támaszkodva veszik számba. A termelés és a felhasználás oldala felőli közelítés lehetővé teszi, hogy pontosabb adathoz jussunk. A GDP és annak volumenindexe a gazdasági fejlettség és jólét színvonalának és változásának, illetve a gazdasági növekedés ütemének vizsgálatára szolgál. Az elemzés statisztikai eszközei:
Az előző év azonos időszakához viszonyító indexek: célja a szezonhatás egyszerű kiküszöbölése. Hibája, többek között hogy a gazdasági folyamat dinamikáját nem igazán tükrözi, továbbá ezzel nincs lehetőség az ún. mozgó szezonalitás kezelésére, ezért kevesebb információt nyújt, mint a szezonálisan kiigazított idősor. • Előző időszakhoz való viszonyítás szezonálisan kiigazított adatok alapján. • Gazdasági folyamatok időbeli alakulásának vizsgálata szezonálisan kiigazított idősorral, ahol a véletlen hatás is része a konjunktúrának vagy a szezonális és véletlen hatástól is megtisztított idősorral. Szezonálisan kiigazított idősort kapunk additív modell esetén, ha a tényleges idősor adataiból kivonjuk a szezonális eltérést, multiplikatív modellnél a tényleges idősor adatot elosztjuk a megfelelő szezonindexszel. Ma a gazdasági gyakorlatban más, bonyolultabb (ún. sztochasztikus) kiigazító módszereket használnak, amelyek a szezonalitás egyéb komponenseit is figyelembe veszik. Ilyen az amerikai statisztikai hivatal által is használt X12-ARIMA módszer, vagy a Spanyol Nemzeti Bank által kifejlesztett TRAMO/SEATS módszer. Ez utóbbit használja a KSH és az MNB is. A módszerekről részletesebb leírás a KSH 43. számú, Szezonális kiigazítás című módszertani füzetében található. • A konjunktúra előrejelzésére alkalmas mutatók (megelőző jelzőszámok): megelőző jelzőszámnak bizonyult például a bruttó nominálbér az iparban, a hosszú lejáratú hitelkamatok stb. Ezek bonyolult tesztelés eredményeként adódtak és változnak időben. Megoldás 5.3 A részletes táblázatok havi bontásban is megtalálhatók a 2001. májusi Statisztikai Havi Közleményekben. Csak néhány táblázatot emeltünk ki és csak az utolsó két év adatait. Negyedéves konjunktúra jelzőszámok 1. Idősz ak
GDP Beruházás Háztartások előző év évkezdet előző előző év évkezdet fogyasztása előző év évkezdet azonos azonos azonos tőla tőla negyedé tőla negyedév negyedév v= 2000. negyedév =106.5 100.0 =107.0 100.0 =103.0 100.0 I. n. 106.5 100.0 102.9b 107.0 103.0 103.2 IIévn. 105.6 106.0 102.8 105.5 106.1 103.4 III. 104.5 105.5 98.7 102.2 104.4 103.4 103.3 évn. évn. IV. 104.2 105.2 107.1 108.4 106.5 103.5 103.3 2001. év I. n. 104.4 104.4 97.7 105.3 106.3 104.5 104.5 év a. Évkezdettől a tárgynegyedév végéig, az előző év azonos időszaka = 100.0 b. A szezonális hatásoktól megtisztítva Negyedéves konjunktúra jelzőszámok 2. Idősz ak
2000. I. n. IIévn. III. évn. évn. IV. 2001. év I. n. év a.
Ipari termelés előző negyedé v= 105.6c 100.0 103.4 105.8 98.4 103.2
Kiskereskedelmi forgalom
előző év évkezdet előző azonos tőla negyedé negyedév v= =120.7 100.0 120.7 90.3b 100.0 120.4 120.6 103.8 119.8 120.3 101.4 113.4 118.3 105.2 110.2
110.2
96.5
előző év évkezdet azonos tőla negyedév =103.5 100.0 103.5 102.5 103.0 100.5 102.0 102.1 102.0 107.2
107.2
Évkezdettől a tárgynegyedév végéig, az előző év azonos időszaka = 100.0
b.
A szezonális hatásoktól megtisztítva
c.
A szezonális hatásoktól megtisztított és a munkanaptényezővel korrigált index
Következtetések: A GDP 2000. év első negyedévében 6,5%-kal, 2001-ben csak 4,4%-kal nőtt, vagyis a magyar gazdaság növekedési üteme mérséklődött. Legerősebben a beruházásoknál figyelhető meg visszaesés. A háztartások fogyasztása kedvezően befolyásolta a gazdaság növekedési ütemét. Az előző évi 3,0%-hoz képest 2001-ben 4,5%-kal növekedett. A kiskereskedelmi forgalom 2001. első negyedévében 7,2%-kal nőtt az előző évi 3,5 %-os növekedéséhez képest. Az eddigi mutatók alapján a Co-op Hungary Rt.-nek nagyon megfontoltan kell cselekednie, hiszen úgy tűnik, hogy a lassuló gazdasági növekedés világgazdasági jelenség, mert a múlt év második felétől a világ meghatározó térségében is ez a folyamat tapasztalható. 5.4. A piackutatás fontosabb statisztikai eszközei Az utóbbi időben a gazdaságban lezajlott változások hatására megnőtt a piaci tényezők szerepe. Ennek következtében erőteljes eltolódás mutatkozik a vállalatok érdeklődésében a termeléstől az értékesítés felé. Fő célként a fogyasztói igények jobb kielégítése jelent meg. Ez a szemléletváltás maga után vonta a piackutatás szerepének növekedését. A piackutatás során alkalmazott módszerek két nagy csoportra oszthatók, a kvantitatív és a kvalitatív módszerekre. A kvantitatív kutatási technikák közös vonása, hogy a vizsgált változókat számszerűsíti, és ezzel lehetővé teszi a statisztika eredményeinek az alkalmazását. Egyszerűbb problémák megoldhatók a leíró statisztika eszközeivel, de bonyolultabb feladatok megoldásához szükségünk van a többváltozós statisztikai módszerekre is. Ebben a fejezetben néhány többváltozós kvantitatív kutatási módszert fogunk bemutatni. A többváltozós elemzések közé sorolható a többváltozós regresszió és a faktoranalízis is. A fogyasztói preferenciák vizsgálatára használt conjoint analízis is a többváltozós regresszió számításon alapszik. 5.4.1. Termékértékesítés elemzése: 3. probléma Ma Magyarországon is egymás után épülnek a bevásárló központok. A bevásárló központ a különböző boltok együttese. Szeretnénk megvizsgálni, hogy a bevásárló központokban levő boltok értékesítését mennyiben befolyásolja a bevásárlóközponton belüli helyzete és milyen egyéb tényezők hatnak még. Módszertan: A többváltozós regressziós modell: A gazdasági életben többnyire nem lehetséges egyetlen magyarázó változóval leírni a vizsgált jelenség alakulását. A több magyarázó változót tartalmazó modelleket többváltozós regressziós modelleknek hívjuk. A modellkészítés a probléma megfogalmazásával kezdődik. A következő lépés a modell specifikációja, mely a magyarázó változók és a függvénytípus megválasztását takarja. • A magyarázó változók megválasztása: A felvetett problémánknál a bevásárló központban levő üzlet évi értékesítése függ az üzlet területétől, egy órára jutó átlagos forgalomtól (fő/óra) a bevásárló központ területétől, a vásárlók átlagos jövedelmétől, az adott kereskedelmi terület átlagos árbevételétől és a konkurencia jelenlététől. Látható, hogy a mennyiségi ismérvek mellett egy minőségi ismérv is megjelenik (versenytárs jelenléte). Felmerül a kérdés, hogy hogyan tudjuk kezelni ezeket a modell alkotás során. A modell ismertetése során erre a problémára visszatérünk. • Függvénytípus megválasztása: Mi csak lineáris függvénnyel foglalkozunk.
A következő 25 elemű minta alapján szeretnénk elemzést készíteni. értékesítés forgalom bevásárló vásárlók üzlet átlagos van-e évi (000) $ fő/óra központ átlagos ter. árbevétel verseny(00) ter. (láb2) jövedelme (láb2) a ker ter. társ (000)$ (000)$ 1 1300 42 300 10,0 900 8,2 (Y)1750 X2 275 X317,1 1500 X515,2 2 20 X1 X4 3 950 32 250 10,5 1000 8,4 4 2000 48 290 20,8 1800 18,9 5 1350 15 260 12,4 1200 10,2 6 1600 26 280 15,7 900 13,6 7 2150 31 350 23,2 2000 21,5 8 1100 37 200 12,1 1000 10,8 9 3250 22 440 26,3 2200 23,9 10 2600 27 360 24,8 1800 22,7 11 1900 29 310 20,5 1600 18,8 12 1500 35 360 13,8 1450 11,2 13 1800 31 320 16,2 1700 14,1 14 1650 43 220 15,4 1500 13,8 15 1200 36 210 13,1 1200 10,0 16 1760 21 420 14,6 1400 12,5 17 1880 18 310 15,9 1200 12,5 18 1950 27 260 20,5 1900 18,9 19 2050 33 290 21,3 1900 19,1 20 1720 45 230 14,3 1700 12,8 21 1340 19 220 12,6 1300 11,1 22 1460 23 290 14,2 1400 13,0 23 1820 28 310 17,4 1700 15,3 24 1990 26 300 21,1 1900 19,2 25 2060 30 360 22,1 1800 20,3 Forrás: Donald S. Tull, Dell I. Hawkins: Marketing Research
0 Z0 1 1 0 0 1 1 0 1 0 0 1 0 0 1 1 0 0 1 1 1 0 0 1 0
A többváltozós lineáris regressziós modell: Y 0 1 X1 2 X 2 ... m X m
Mátrix egyenlettel felírva a következőt kapjuk: Y X ahol Y: a függő változó n komponensű oszlopvektora m: a magyarázó változók száma X: a magyarázó változók n x ( m+1) ed rendű mátrixa : regressziós paraméterek m+1 komponensű vektora : a hibatag n komponensű oszlopvektora A nem mennyiségi ismérveket úgynevezett mesterséges változókként kezeljük, mert értékük l és 0 lehet (dummy változók). Mindig eggyel kevesebb változóval visszük be a modellbe, mint ahány változata van. = 1, ha igen A mesterséges változók képzése: Z0 =0, ha nem A táblázat alapján a nem mennyiségi ismérvvel bővített modellünk a következő: Y 0 1 X1 2 X 2 3 X 3 4 X 4 5 X 5 6 Z 0
A modell feltételrendszere: • Véletlen tényezőre: 1 , 2 normális eloszlású valószínűségi változók: N (0, ) Várható értéke: E ( ) 0 Var( )
Varianciája:
2
Egymástól független (nem autokorrelált) valószínűségi változók • Az Y1, Y2… egymástól független valószínűségi változók Normális eloszlásúak: Y N ( X , ) Várható értéke: E (Y ) X Varianciája: Var(Y )
2
• A magyarázó változók lineárisan függetlenek, vagyis az X mátrix rangja m+1 (nincs multikollinearitás), értékük rögzített és mérési hibát nem tartalmaznak. Az m+1< n, ahol n a minta elemszáma. A tapasztalatok azt mutatják, hogy a minta elemszámának négyszer, ötször annyinak kell lenni, mint a változók számának a jó becslés érdekében. A lineáris regressziós modell a becsült paraméterek segítségével a következőképpen írható fel: Y X ˆ e
A becsült paraméterek meghatározása a legkisebb négyzetek módszerével történik és a következő eredményhez jutunk:
1 X Y
ˆ X X
Igazolhatók a következő állítások: E ( ˆ )
1 2 Var( ˆ ) X X
Ennek alapján megállapíthatjuk, hogy az így származtatott becslőfüggvény torzítatlan. A második összefüggés a paraméterek variancia - kovariancia mátrixának számítását mutatja. A fődiagonálisban a becsült paraméterek varianciáit, a fődiagonálison kívül pedig a becsült kovarianciákat találjuk. 2
becslése az empirikus véletlen tényező (e) segítségével történik a következőképpen: 2
e
ee n m 1
Ez a reziduális szórásnégyzet, négyzetgyöke pedig a reziduális szórás. Jelentése ugyanaz, mint kétváltozós esetben, vagyis megmutatja, hogy átlagosan mennyivel térnek el az Y tényleges értékei a becsült értéktől. j Parciális regressziós együttható: a j-edik változóhoz tartozó becsült paraméter (j=1,2…m) azt fejezi ki, hogy Xi
egységnyi változása hogyan hat az eredményváltozóra, ha a többi magyarázó változót nem változtattuk. A modell képzésénél nem tudhatjuk előre, hogy a figyelembe vehető magyarázó változók valóban szignifikáns kapcsolatban vannak-e az eredmény változóval. Ezért mind a regressziós modellt, mind a regressziós paramétereket tesztelnünk kell. A regressziós modell tesztelése során azt vizsgáljuk, hogy a magyarázóváltozók együttesen szignifikáns hatást gyakorolnak-e az eredményváltozóra. Ugyanakkor nem jelenti azt, hogy mindegyik változó hatása szignifikáns.
A tesztelés a variancia-analízis alkalmazásával globális F próbafüggvénnyel történik a kétváltozós esethez hasonlóan. Az F próbafüggvény segítségével azt derítjük ki, hogy az Y varianciájából szignifikánsan nagy hányadot magyaráz-e a regressziós függvény. A hipotézisek a következők: H 0 : 1 2 ... m 0 H1 : k ( k 1, 2,... m) 0
A variancia-analízis tábla a következő: Négyzetössze Szabadságfo g k m SSR n-m-1 SSE SST n-1
A variancia eredete Regresszió Hibatag Együtt
Átlagos négyzetösszeg MSR MSE
F F
MSR MSE
A hipotézis ellenőrzését jobb oldali próbával hajtjuk végre. Ha az adott szignifikancia-szinthez és szabadságfokokhoz tartozó kritikus érték nagyobb, mint a próbafüggvény értéke, a nullhipotézist fogadjuk el, vagyis a többváltozós lineáris regressziós modell az adott változókkal alkalmatlan a probléma elemzésére. A variancia-analízis táblázat segítségével értelmezhetjük a többszörös determinációs együtthatót is: Többszörös determinációs együttható: 2
R
SSR SST
A többszörös determinációs együttható azt mutatja meg. hogy a figyelembe vett magyarázó változók hány százalékban magyarázzák az Y szóródását. A paraméterek tesztelése: A m tesztelése során azt vizsgáljuk, hogy ha az Xm magyarázóváltozót utolsóként kapcsoljuk be a modellbe, szignifikánsan javította-e a modell magyarázó erejét vagy sem. Parciális F-próba: 2
F
ˆ m Var( ˆ m )
ahol a számláló szabadságfoka l és a nevező szabadságfoka n-m-1.
A paraméterek tesztelésére gyakran Student t-próbát alkalmazunk. Student t-próba:
t
ˆ m s
ahol a szabadságfok n-m-1. m
A két próba közötti összefüggés: F = t2 A m konfidencia intervalluma m ˆ m t
1 ; szf 2
1
megbízhatósági szinten:
s( ) m
A probléma megoldása 5.4. A probléma megoldása az Excel számítógépes programmal történt. Javasoljuk még az SPSS használatát, ami kimondottan piackutatási problémák megoldásához készült.
Regressziós statisztika r értéke 0,947532 r-négyzet 0,897817 Korrigált r-négyzet 0,863757 Standard hiba 178,225 Megfigyelések 25
VARIANCIAANALÍZIS Regresszió Maradék Összesen
df 6 18 24
SS 5023669 571754,6 5595424
MS F F szignifikanciája 837278,2 26,35923 5,51E-08 31764,14
Koefficiensek Standard hiba t érték Tengelymetszet X1 X2 X3 X4 X5 Z0
-363,506 -1,03286 1,899957 131,1445 0,205454 -62,5517 -19,5063
300,9424 4,525655 0,777097 79,41026 0,212944 79,58569 74,29383
-1,20789 -0,22822 2,444942 1,65148 0,964829 -0,78597 -0,26256
p-érték 0,24272 0,822045 0,025003 0,115979 0,347415 0,442112 0,795875
Alsó 95% Felső 95% Alsó 95,0% Felső 95,0% -995,763 268,7509 -995,763 268,7509 -10,5409 8,475195 -10,5409 8,475195 0,267336 3,532578 0,267336 3,532578 -35,6904 297,9793 -35,6904 297,9793 -0,24192 0,652834 -0,24192 0,652834 -229,755 104,6518 -229,755 104,6518 -175,592 136,5794 -175,592 136,5794
A regressziós függvény a következő: Y 363,506 1,03286 X1 1,899957 X 2 131,1445 X 3 0,205454 X 4 62,5517 X 5 19,5063Z0
A modell megválasztása során nagyon lényeges szempont, hogy legalább annyi magyarázó változót tartalmazzon, ami biztosítani tudja a megfigyelések és a becsült értékek jó illeszkedését és ugyanakkor a lehető legkevesebb magyarázó változót tartalmazza. A két cél elérésének optimális arányát a következő módszerekkel valósíthatjuk meg: backward eliminációs eljárás, stepwise, forward stb. módszerek. A backward eliminációs eljárás lényege a következő: Az első lépésben minden szóba jöhető magyarázó változót figyelembe veszünk. Utána t-(vagy F) próbával teszteljük a paramétereket. A nem szignifikáns paraméterek közül a legkisebb t értékhez tartozót elhagyjuk és a regressziós paramétereket újraszámoljuk a maradék változóval. Ezt az eljárást addig folytatjuk, amíg egyre nagyobb magyarázó erejű regressziót kapunk. A forward eljárásnál először a legnagyobb t-értékű változót építjük be a modellbe. Az eljárást mindig azzal a magyarázó változóval folytatjuk, amelyik a legnagyobb mértékben növeli a többszörös korrelációs együttható értékét. A stepwise eljárás az előző kettő kombinációja, lépésenként választjuk be a modellbe mindig a legjobbnak tekintett magyarázó változót. Az egyes változók bevonása után minden lépésben megnézzük, hogy mely változót lehetne elhagyni a modellből, úgy hogy erősebb magyarázó erejű regressziót kapjunk. 18
A mi problémánk megoldásánál a t 0,975 2,1 , így először az X1 változót elhagyjuk a modellből. A műveletet többször végre kellett hajtani, mert csak X2 és X3 bizonyult szignifikánsnak, amit a következő táblázat mutat:
ÖSSZESÍTŐ TÁBLA Regressziós statisztika r értéke 0,943713 r-négyzet 0,890594 Korrigált rnégyzet 0,880648 Standard hiba 166,8115 Megfigyelések
25
VARIANCIAANALÍZIS
Regresszió Maradék
F SS MS F szignifikanciája 2 4983250 2491625 89,54284 2,69E-11 22 612173,5 27826,07
Összesen
24
df
5595424
Standard Koefficiensek hiba t érték p-érték Tengelymetszet -246,826 173,0903 -1,42599 0,167906 X2 2,092116 0,671132 3,117297 0,005018 X3
Felső Alsó Felső Alsó 95% 95% 95,0% 95,0% -605,794 112,1418 -605,794 112,1418 0,700273 3,483959 0,700273 3,483959
81,68022 9,082155 8,993484 8,02E-09
62,84496 100,5155 62,84496 100,5155
A regressziós függvényünk tehát a megmaradó változókkal a következő: Y 246,826 2,092116 X 2 81,68022 X 3
Az üzlet éves értékesítésére nem hat szignifikánsan az üzlet területe, az egy órára jutó átlagos forgalom (fő/óra), az adott kereskedelmi terület átlagos árbevétele és a konkurencia jelenléte. Az értékesítést leginkább a vásárlók átlagjövedelme befolyásolja. 1000 dollár átlagjövedelem növekedés 81680 dollár átlagos eladás növekedést eredményez, ha a bevásárló központ területe változatlan. A bevásárló központ nagysága is szignifikánsan befolyásolja az értékesítést. Egy négyzetláb növekedés hatására az értékesítés átlagosan 2092 dollárral nő, ha az átlagjövedelem változatlan. A paraméterekre vonatkozó konfidencia intervallumok a következők:
0 : 605,794;112,1418 2 : 0,700273;3, 483959 3 : 62,84496;100,5155
A variancia-analízis alapján azt mondhatjuk, hogy a megmaradt változók összességében jól magyarázzák az Y szóródását, mert az R2 = 0,89 . A megmaradt magyarázó változók és az eredményváltozó között releváns kapcsolat van, ( 2, 22) mert F = 98,54 > F0,95 3, 44 . 5.4.2. Conjoint analízis A conjoint analízis ma már jól ismert technika a több-attribútumú alternatívák közötti fogyasztói preferenciák vizsgálatára. 4. probléma Az Egészséges Álom Tejüzem menedzsmentje elhatározta, hogy egy új terméket jelentet meg a piacon. A menedzsment feltérképezte, hogy ehhez három lényeges kérdésben kell döntenie: milyen modellek kellenének, milyen legyen a fizikai megjelenésük, mik legyenek a belső jellegzetességeik. A kérdés megválaszolása a következő négy fázisban történhet:
fogyasztói felhasználás és attitűd felmérése, a termék attribútumainak és előnyeinek a megfogalmazása, conjoint analízis: a különböző terméktulajdonságokra vonatkozó fogyasztói preferenciák feltérképezése, termékvonal szimulációk: a fogyasztói preferenciák struktúrája alapján a piaci részesedés előrejelzése és ennek megfelelően a legjobb konfiguráció kiválasztása. A conjoint analízis végrehajtására cégünket kérték fel. Tegyük fel, hogy az l. és a 2. fázis lezajlott és a következő attribútumokat találtuk a vizsgálatra megfelelőnek: A.. zsírtartalom: -l = 1,5 % 1 =2,8% B. csomagolás: -1 = zacskós 1 = dobozos C. tömeg: -l =0,5 liter 1 = l liter D. tartósság: -l = féltartós l = friss E. Energiatartalom 100 grammban: -l = 265kJ l = alacsonyabb F. Fehérjetartalom 100 grammban: -l =-3,3 g 1 = alacsonyabb
G. szénhidrát 100grammban: -l =4,6 g l = alacsonyabb H. kalcium 100 grammban: -1 = 115 mg l = alacsonyabb I. ár: -l = 150 Ft/l l = alacsonyabb J. pasztőrözöttség: -l = pasztőrözött l = ultra pasztőrözött K. Tartósítószert tartalmaz: -l = igen l = nem L. ízesített: -l = nem l = igen
A menedzsment arra keresi a választ, hogy mely terméktulajdonságok a legfontosabbak, illetve legkevésbé fontosak a fogyasztók számára. A szinteknek melyik kombinációja a legelfogadottabb? Módszer A conjoint analízis a termékkel, szolgáltatással kapcsolatos fogyasztói elvárásokat jelenti egységes skálán. A felhasználásra kerülő alapfogalmak a következők: Attribútumok vagy faktorok: az adott termék vagy szolgáltatás – a továbbiakban egységesen profil – értékelését meghatározó tulajdonság. Szintek (levels): az attribútumok konkrét értékei. „Fractional factorial design”: A conjoint analízis során a válaszadó mindig a teljes termékről mond véleményt. A „fractional factorial design” nagyszámú faktorkombináció helyett annak megfelelő részhalmazával dolgozik. „Orthogonal array”: csak a főhatásokat veszi figyelembe. Az egyes faktorokhoz „fontosságokat" („importance”). Azok szintjeihez „rész-hasznosságokat” vagy részértékeket („utility” vagy part-worths) rendel. Preferenciák: a megkérdezettek válaszai. A conjoint analízis olyan alapvető kérdésekre adja meg a választ, mint * Egy terméknek vagy szolgáltatásnak mely tulajdonságai a legfontosabbak a fogyasztó számára? * Az egyes tulajdonságok mely szintjét preferálja legjobban? * A tulajdonságok mely kombinációi tükrözik legjobban a fogyasztói véleményeket? A kérdések megválaszolása több módszerrel történhet, például: Tradeoff mátrix, full profile és az adaptive eljárással. Jegyzetünkben csak a full profile eljárást ismertetjük.
Full profile eljárás A full profile eljárás során a válaszadó mindig a teljes termékről mond véleményt. A preferenciák és a faktorszintek közötti kapcsolat lehet: * „diszkrét”, amikor nincs előzetes feltételezésünk a faktorszintek és a preferenciák között, * lineáris: a preferenciák és a faktorszintek között feltételezett kapcsolatot lineáris függvény írja le, * Alkalmazzák még a „négyzetes” elnevezést, amikor másodfokú függvénykapcsolatot feltételeznek. A legelterjedtebb a gyakorlatban a dummy változók lineáris regressziós függvénye, ami a következőképpen néz ki: Tételezzük fel. hogy n személy válaszol a profilok halmazára és az i-edik személy Ji profilról mond véleményt: Yi Z i i i
Yi: az i-edik személy metrikus válaszának a Ji dimenziós vektora Xi : a Ji x p dimenziós tervmátrix, ami általában dummy változók mátrixa i : egy p-dimenziós regressziós vektor, az i-edik válaszadó részértékeit tartalmazó vektor Feladatunk tehát a regressziós paraméterek meghatározása és értékelése. A probléma megoldása A megadott 12 attribútum mindegyike 2 szinttel rendelkezik, ami összesen 4096 kombinációt jelentene, de az orthogonal array 16 megfelelően kiválasztott kombináció alapján megbízható eredményt nyújt. (l. táblázat) A megkérdezettek száma:
110 fő
minden válaszoló a tervmátrixban szereplő összes profilt értékeli. Az egy megkérdezettre jutó profilok száma:
16
Az egy megkérdezettre jutó ellenőrzési profilok száma:
4
Az ellenőrzési profilok (holdout) megítélésre kerülnek, de a számítások során nem használjuk őket. 1. táblázat Profilok, ellenőrzési profilok Profilok profil 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
A -1 -1 1 1 -1 -1 1 1 1 1 -1 -1 1 1 -1 -1
B -1 1 -1 1 1 -1 1 -1 1 -1 1 -1 -1 1 -1 1
C -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1 -1 -1
D -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1
E -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1
F -1 -1 -1 -1 1 1 1 1 1 1 1 1 -1 -1 -1 -1
G -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1
H -1 -1 1 1 1 1 -1 -1 1 1 -1 -1 -1 -1 1 1
I -1 1 -1 1 1 -1 1 -1 -1 1 -1 1 1 -1 1 -1
J -1 1 1 -1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1
K -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1
L -1 1 1 -1 1 -1 -1 1 1 -1 -1 1 -1 1 1 -1
Ellenőrzési profilok prof il 1 2 3 4
A
B
C
D
E
F
G
H
I
J
K
L
1 1 1 -1
1 1 -1 -1
1 -1 -1 1
1 -1 -1 1
-1 1 -1 -1
1 1 -1 1
1 -1 1 -1
-1 -1 1 -1
-1 1 1 1
1 1 -1 1
1 -1 1 -1
1 1 1 -1
A 2. táblázat az egyesített minta (110 fő) aggregát eredményeit mutatja az OLS legkisebb négyzetek becslés alapján.
2. táblázat Az egyesített minta aggregát eredményei: R-Squared: 0.2445 Adjusted R Squared: 0.2393 Standard Error of the Estimate: 0.2557
Estimated Coefficients Variabl Coefficie STD T eInterce nt 0.4809 Error 0.0061 Value 78.905 pt 1 A -0.0381 0.0061 -6.2576 B -0.0175 0.0061 -2.8683 C 0.0017 0.0061 0.2824 D -0.110 0.0061 -1.8019 E -0.0161 0.0061 -2.6352 F 0.0212 0.0061 3.4835 G -0.0210 0.0061 -3.4425 H -0.0027 0.0061 -0.4502 I 0.1219 0.0061 20.001 J -0.0515 0.0061 -8.4482 5 K 0.0093 0.0061 1.5316 L 0.0191 0.0061 3.1349 Következtetések: A 2. táblázatból az alábbi következtetések állapíthatók meg: A fogyasztók a következő tulajdonságokkal rendelkező tejet preferálják: 1,5% zsírtartalmú, zacskós, literes, féltartós, 265 kJ energiatartalmú, 3,3 grammnál alacsonyabb fehérjetartalmú, 4,6 g szénhidráttartalmú, 115 mg kalcium tartalmú, 150 Ft/l-nél alacsonyabb árú, tartósítószert nem tartalmazó, ízesített. A legfontosabb attribútumok: •
ár: 150 Ft/liternél alacsonyabb
•
pasztőrözöttség: pasztőrözött legyen
•
zsírtartalom: 1,5 %
A legkisebb mértékben preferált attribútumok: tömeg, kalciumtartalom, tartósítószer tartalom. A valódi preferenciák és a becsült preferenciák közötti korrelációs együttható a négy ellenőrző profilra vonatkozóan: 0,616, ami közepesnek mondható.(3. táblázat)
ANOVA Table Source Sum of Squares Regression 36.974 Error 114.233 Total 151.207
DF 12 1747 1759
Mean Square 3.0812 0.0654
F Ratio 47.1209(p<0.0 1)
A probléma az SPSS program segítségével is megoldható. Faktoranalízis A többváltozós módszerek közé szokták sorolni a faktoranalízist is. 5. Probléma Egy sört gyártó cég új fajta sör előállítását tervezi. Az új termék jellemzőit reprezentatív fogyasztói mintával értékeltette egy arányskálán. A felmérés során 15 jellemzőt vizsgáltak. A cég arra kíváncsi, hogy milyen a kapcsolat a termékjellemzők között, milyen háttérváltozók befolyásolják a paramétereket. Módszer A faktoranalízis matematikai modelljével egy többváltozós adatállományt lehet jellemezni néhány faktor lineáris kombinációjaként. A faktorok egymással korrelálatlanok és az eljárás kezdetekor ismeretlenek. Ez a tulajdonság különbözteti meg a többváltozós regresszióanalízistől, ahol a változók ismertek. A faktoranalízis alkalmazásának csak akkor van értelme, ha az adatok összefüggnek (korreláltak). Az SPSS kétféle tesztet is végez ennek eldöntésére (KMO, Bartlett). A többivel nem összefüggő változók kirostálása után kezdődik meg a faktormodell felállítása. A különböző faktorok eltérő súllyal befolyásolják ugyanazon változó alakulását. Ezeket a súlyokat hívjuk faktorsúlynak. A faktoranalízis során a változók összefüggését tükröző faktorsúlyok (loading) mátrixát keressük. A változók száma kisebb, mint a faktorok száma, mivel aggregált változókat kapunk. A változók szórásnégyzeteinek a faktorokkal magyarázott része a kommunalitás, a nem magyarázott része a hibaszórásnégyzet. A loading mátrix előállítására több módszer ismert: főfaktoranalízis, nem súlyozott és súlyozott legkisebb négyzetek módszere, Maximum-likelihood faktoranalízis, és képfaktorizációs módszerek. Az SPSS program a felsorolt módszer mindegyikét tudja. A loading mátrix meghatározása után gyakran szükség van még egy lépésre. Ennek oka az, hogy a faktorsúlyok között negatív számok is vannak és ezek nehezen értelmezhetők. Célszerű az adatrendszeren valamilyen elforgatást végezni. Négyfajta forgatás lehetséges: varimax, quartimax, equamax, nem ortogonális. Ezek szintén megtalálhatók az SPSS lehetőségei között. Ha valamelyik faktorban csak néhány változó jelenik meg nagy súllyal, akkor azt a faktort úgy kell tekinteni, mint ezen változók által hordozott együttes információ hordozóját. Főkomponens analízis: modellje egybeesik a faktoranalízis főfaktorizációs modelljével. Itt azonban nem az összefüggések feltárása a cél, hanem a változók számának a csökkentése úgy, hogy közben a lehető legkevesebb információt veszítsük a statisztikai sokaságról, vagyis közelítőleg azonos következtetéseket tudjunk levonni, mint az eredeti változókkal. A conjoint analízis során az „Orthogonal array” is csak a főhatásokat veszi figyelembe. A probléma megoldása: Az adatok alapján végrehajtott faktoranalízis eredményét a következő oldalon található táblázat mutatja. A három faktor együtt a varianciának több, mint 80 százalékát magyarázza az eredeti fogyasztói értékeléseknek. A táblázatból kitűnik, hogy az első faktorral a legszorosabb kapcsolatot az erősség, a második faktorral a drágaság, a harmadikkal pedig a népszerűség mutatja. Rangsorolva a fontossági sorrendek is megkaphatók.
Attribútumok férfias drága erős laktató könnyű alacsony drága minőségű magas státuszú malátatartalmú világos népszerű szomjoltó fiatalos gyenge hagyományos sajátérték magyarázott variancia
I. 0.52 0.14 0.83 0.52 -0.67 -0.08 0.32 0.02 0.52 -0.67 -0.21 0.21 -0.26 -0.58 -0.16 5.91 39.4
Faktorsúlyok II. 0.21 0.91 0.12 0.08 0.34 -0.67 0.24 0.79 -0.18 -0.16 0.03 0.02 -0.04 0.05 0.11 4.86 43.2
III. -0.32 -0.08 -0.13 0.20 0.16 -0.62 -0.27 -0.01 0.22 0.88 0.32 0.45 0.18 0.62 1.44 6.67