KOVÁCS PÉTER* A multikollinearitás vizsgálata és modellezése lineáris regressziós modellekben a Red-mutató alapján Examination and Modelling of Multicollinearity in linear Regression Models on the Basis of Red Indicator In empirical analyses it frequently happens that not all the data have a useful content in respect of the examination, in other words the database is redundant. In a multivariate linear regression models multicollinearity can be interpreted as a type of redundancy. Therefore during regression analysis it is essential to know the proportion of the data with a useful content in respect of the estimator βˆ = (X′ X ) X′ y , but its proper measurement poses a problem. Petres’ Red is one possibility for measuring the proportion of data with a useful content in respect of the estimator βˆ = (X′ X ) X′ y . With this indicator, which contains the eigenvalues of the correlation matrix of the variables, it is possible to quantify the percentage of collinearity: from 0% (all the eigenvalues are equal to 1) to 100% (all the eigenvalues, except the first, are equal to 0). As a new approach, The elliptical model of multicollinearity can be formulated on the basis of Petres’ Red indicator. Parallel with the increase in the extent of the mean covariance of the variables, the “possible eigenvalues” are situated on an mdimensional sphere with a greater radius. The “possible eigenvalues” are situated on a segment of the m-dimensional sphere in such a way that with a fixed Red value they are located on an (m–1)-dimensional ellipsoid. Unfortunately, the higher the dimension number of the model is, the more conditions have to be given for determining and studying the range of “possible eigenvalues”. Therefore the detailed examination of this range and of the elliptical curves was carried out only for three explanatory variables. We compared how the ellipses and the lines containing the identical-value quotients of the highest and lowest values of the eigenvalues “move along” the range of the “possible eigenvalues”. −1
−1
Bevezetés Empirikus elemzéseknél gyakori eset, hogy a vizsgálat szempontjából nem minden adat hordoz hasznos tartalmat, azaz az adatállomány redundáns. Ez az eset a többváltozós lineáris regressziószámításnál a multikollinearitással magyarázható. Ezért a regressziószámítás során fontos tudni a βˆ = (X′ X )−1 X′ y becslıfüggvény szempontjából hasznos tartalmat hordozó adatok arányát, de probléma ennek a megfelelı mérése. Erre egy lehetıség a PETRES-féle Red-mutató. Tanulmányom célja a Red-mutató és néhány tulajdonságának ismertetése, valamint a multikollinearitás – Red-mutatóra épülı – elliptikus modelljének bemutatása.
*
Szegedi Tudományegyetem Gazdaságtudományi Kar, egyetemi adjunktus, PhD.
81
BUDAPESTI GAZDASÁGI FİISKOLA – MAGYAR TUDOMÁNY NAPJA, 2008
A Red-mutató A Red-mutató definiálásakor a tényezıváltozók R korrelációs mátrixának λj (j = 1, 2, …, m) sajátértékeit alkalmazzuk. Mivel a korrelációs mátrix pozitív szemidefinit mátrix, ezért ennek sajátértékei nemnegatívak. A korrelációs mátrix sajátértékeinek száma és összege is megegyezik a magyarázóváltozók számával. Ebbıl következıen sajátértékeinek számtani átlaga egy. A Red-mutató az alábbi gondolatmeneten alapszik. Ha a magyarázóváltozók forrásául szolgáló adatállomány a βˆ becslıfüggvény szempontjából redundáns, azaz nagymértékő az adatok együttmozgása, akkor nem mindegyik adat hordoz hasznos tartalmat. Minél kisebb a hasznos tartalmat hordozó adatok aránya, annál nagyobb a redundancia mértéke. Minél nagyobb mértékben szóródnak a sajátértékek, annál nagyobb mértékő az adatállományban szereplı magyarázóváltozók együttmozgása. Két szélsıséges eset létezik: minden sajátérték egyenlı egymással (azaz értékük egy), illetve egy sajátérték kivételével mindegyik sajátérték nullával egyenlı. A diszperzió mértékét számszerősíthetjük a sajátértékek relatív szórásával vagy (ebben az esetben az ezzel egyenlı) szórásával. m
m
∑ (λ j − λ ) 2 vλ =
σλ = λ
∑ (λ j − λ ) 2
j =1
m m
m
∑ (λ j − 1) 2
j =1
=
∑λ j j =1
m m m
=
j =1
m
=σλ
(1)
m
Különbözı adatállományok redundanciájának összevethetısége végett a fenti mutatót normálni kell. Mivel a sajátértékek nemnegatívak, ezért a relatív szórásra vonatkozó 0 ≤ v λ ≤ m − 1 összefüggés miatt, a normálás m − 1 értékével történik. Az így kapott mutatót a redundancia mértékének számszerősítésére használhatjuk, és segítségével a Red-mutatót az alábbiak szerint definiáljuk.
Red =
vλ m −1
(2)
A redundancia hiánya esetén a fenti mutató értéke nulla, illetve nulla százalék, míg maximális redundancia esetén egy, illetve száz százalék. A Red-mutató a vizsgált, adott mérető adatállomány redundanciáját méri. Két vagy több különbözı mérető adatállomány redundanciájának összevetésekor a Red-mutatók alapján csak annyi állítható, hogy az egyes adatállományok mennyire redundánsak, de arra vonatkozó közvetlen kijelentés nem tehetı, hogy ezek közül melyiknek van több hasznosítható adata. A Red-mutató kiszámítható a tényezıváltozók korrelációs mátrixa fıátlón kívüli elemeinek négyzetes átlagaként is.
82
KOVÁCS P.: A MULTIKOLLINEARITÁS VIZSGÁLATA ÉS MODELLEZÉSE... m
m
∑∑ r Re d =
i =1 j =1 j ≠i
2 ij
(3)
m(m − 1)
Az összefüggés abból a szempontból érdekes, hogy a Red-mutató egy olyan négyzetes átlag, amely – a definíciójából következıen – százalékban is kifejezhetı. A (3) képlet szerint a Red-mutatóval mérni lehet a tényezıváltozók átlagos együttmozgásának mértékét. A mutató definíciójából és a (3) képletbıl következik, hogy a mutató elınye a többi sajátértékekre épülı mutatóval szemben az, hogy úgy veszi figyelembe az összes sajátértéket, hogy értékét minden sajátérték azonos súllyal befolyásolja, továbbá figyelembe veszi a tényezıváltozók öszszes páronkénti együttmozgását is, így a Red-mutató mindenképpen pozitív elmozdulást jelent a multikollinearitás eddigi kutatásához képest. A mutató segítségével megkülönböztethetıek az extrém multikollinearitás különbözı esetei is, hiszen a mutató akkor is használható, ha valamelyik sajátérték nulla. Azonban megjegyzem, hogy a multikollinearitás vizsgálatakor nem csak változópárok együttmozgása, hanem változócsoportok együttmozgása is problémát jelenthet, ennek azonban még nincs részletesen kidolgozott szakirodalma. Erre megoldást jelenthet a kanonikus korrelációelemzés használata, ahol valamilyen korrelációs együtthatók négyzetes átlaga szerepel az RI redundancia-indexben is, de alkalmazási körét és tartalmát tekintve ez teljesen más, mint a Red-mutató. Ennek egyik speciális esete az egy–egy elemő csoportok vizsgálata, mely a Red-mutatóval lehetséges. A redundancia-indexet a kanonikus korrelációelemzés során alkalmazzuk. A kanonikus korrelációelemzés a lineáris korrelációvizsgálat általánosításának tekinthetı. A kanonikus korrelációelemzés során adott az x1, x2, ..., xp és y1, y2, ... yq (q ≤ p) két standardizált változócsoport. A feladat az, hogy mindkét változócsoportot u1 K u q z1 K z q helyettesítjük a változók különbözı, ut, zt (t = 1, u1 1 0 0 r1 0 0 2, …, q) lineáris kombinációival úgy, hogy az ut, M 0 O 0 0 O 0 zt kanonikus változópáros közötti rt korrelációs 1 együttható maximális legyen. Ezeket a korrelá- R = u q 0 0 1 0 0 rq ciókat kanonikus korrelációknak nevezzük. A z1 r1 0 0 1 0 0 kanonikus változók közötti korrelációs mátrix M 0 O 0 0 O 0 szerkezete az alábbi. z q 0 0 rq 0 0 1
1 A kanonikus korrelációelemzés efféle megközelítése gyakorlatilag kettıs faktoranalízisnek tekinthetı, mivel két változóhalmaz azon faktorait keressük, amelyek maximálisan korrelálnak egymással. A kanonikus korrelációelemzés másfajta megközelítése az, hogy változók egy csoportjával próbáljuk a függıváltozók egy csoportját megmagyarázni, azonban ez nem a megfigyelt változókon keresztül történik, hanem a magyarázóváltozók azon lineáris kombinációja segítségével, amely maximálisan megmagyarázza a függıváltozókat, azok lineáris kombinációján keresztül (Füstös – Kovács – Meszéna – Simonné [2004]).
83
BUDAPESTI GAZDASÁGI FİISKOLA – MAGYAR TUDOMÁNY NAPJA, 2008 Ekkor az y változók szórásnégyzetét a zt kanonikus változó átlagosan q
ryz2 t =
∑r i =1
2 yi z t
q
mértékben, míg az ut kanonikus változó
RI yzt = ryz2 t rz2t ut mértékben magyarázza (HAJDU [2003]). Tehát a kanonikus korrelációelemzések során az eredeti változók és az ezeket helyettesítı valamelyik kanonikus változó közötti korrelációs együtthatók négyzetes átlagának négyzete használatos. Ezzel szemben a Red-mutató képletében a tényezıváltozók közötti korrelációs együtthatók négyzetes átlaga szerepel. A kanonikus korrelációelemzéseknél használatos négyzetes átlag inkább a VIFj-mutatókkal hozható kapcsolatba. A kanonikus korrelációelemzés speciális esete az, amikor az eredményváltozók csoportja egy változóból áll. Ekkor az egyetlen kanonikus korreláció nem más, mint a többszörös korrelációs együttható. Ekkor, a j-edik tényezıváltozót különvéve, a többitıl a kanonikus korreláció négyzete pontosan rx2 .x , x ,K, x , x ,K, x lesz. Ezt minden lehetséges kombinációra elkészítve – felhasználva a VIFj képletét – kiszámíthatjuk azt, hogy az egyes tényezıváltozók varianciái átlagosan m m m 1 1 rx2j . x1 , x2 ,K, x j−1 , x j+1 ,K, xm ∑ 1 − ∑ ∑ VIF VIF (4) j = 1 1 j j =1 j =1 j = = 1− = 1− m m m VIFj H j
1
2
j −1
j +1
m
mértékben magyarázhatóak a többi tényezıváltozóval együttesen, ahol VIF j H a VIFj-mutatók harmonikus átlaga. A (4) képlet négyzetgyöke megadja az egyes tényezıváltozóknak a többi tényezıváltozó csoportjával való együttmozgás átlagos mértékét, mellyel a multikollinearitás okainak ismételten csak egy speciális csoportja vizsgálható. A vizsgálatot a késıbbiekben általánosítani kell a tényezıváltozók – minden lehetséges módón elıállított – két tetszıleges csoportja átlagos együttmozgásának mérésére. Ennek egyik speciális esete az egy–egy elemő csoportok vizsgálata, mely a Red-mutatóval lehetséges, illetve a másik az egy–(m–1) elemő csoportok vizsgálata, amely a (4) képlettel lehetséges.
A multikollinearitás modellezése Felmerülhet az a kérdés, hogy a multikollinearitás hogyan modellezhetı. A tényezıváltozókat, mint vektorokat ábrázolva sejtéseket fogalmazhatunk meg a multikollinearitás jelenlétére vonatkozóan. Az egyik leggyakrabban emlegetett modellezési lehetıség a tényezıváltozók ortogonalitásának vizsgálata. Amennyiben az ábrázolt vektorok ortogonálisak, azaz a tényezıváltozók tere maximálisan kifeszített, akkor nincs multikol84
KOVÁCS P.: A MULTIKOLLINEARITÁS VIZSGÁLATA ÉS MODELLEZÉSE... linearitás a modellben. Minél kisebb a tér kifeszítettsége, annál nagyobb a multikollinearitás mértéke. Egy másik lehetıség az, ha a regressziós sík, hipersík vetületeit nézzük minden egyes xi–xj síkvetületben. Például, két tényezıváltozó esetén az 1. ábra azt mutatja, hogy – a magyarázóváltozók statisztikailag jelentéktelen együttmozgása esetén – a becsült paraméterek varianciái, a jelentıs együttmozgás esetén kiszámított szórásnégyzetekhez viszonyítva jóval kisebbek. Ez azért van, mert az elsı esetben az adatállománynak a „pontfelhıje” az x1–x2 síkvetületben minden dimenzióban szóródik és így az illesztett regressziós sík stabil. Míg a 2. ábra „pontfelhıje” nem mindegyik dimenzióban szóródik az x1–x2 síkvetületben, így a ráillesztett sík könnyen kibillen, azaz instabillá válik az illesztés. Ez az ábrázolási mód egyrészt meglehetısen sok munkával jár, másrészt pedig a tényezıváltozóknak csak a páronkénti együttmozgása szemléltethetı.
1. ábra Stabil regressziós sík a magyarázóváltozók nem szignifikáns együttmozgása esetén (m = 2)2
2. ábra Instabil regressziós sík szignifikáns multikollinearitás esetén (m = 2)3
A Red-mutató definíciójából kiindulva megadható a multikollinearitás egy más fajta modellje is. A Red-mutató (2) képletét átrendezve az alábbi összefüggést kapjuk. m
∑ (λ i =1
i
− 1) 2 = ( m( m − 1) Re d ) 2
(5)
Az (5) egyenlet egy olyan gömb egyenlete, melynek sugara m(m − 1) Re d , továbbá középpontjának minden koordinátája egy. Abban az esetben, ha a változók átlagos együttmozgása nulla, azaz nincs együttmozgás a tényezıváltozók között, akkor a gömb arra az egyetlen pontra redukálódik, melynek minden koordinátája 2 Tričković [1976].
85
BUDAPESTI GAZDASÁGI FİISKOLA – MAGYAR TUDOMÁNY NAPJA, 2008 egy. Minél nagyobb mértékő a változók átlagos együttmozgása, annál nagyobb lesz a gömb sugara, azaz annál nagyobb mértékő a gömb „felfújódása”. Abban az esetben, ha a változók átlagos együttmozgása egy, azaz minden tényezıváltozó-páros közötti korrelációs együttható abszolút értéke egy, akkor a gömb sugara m(m − 1) . Természetesen a gömbök nem minden pontja jelent létezı korrelációs struktúrát, hiszen a gömbökön a sajátértékek olyan kombinációi is megtalálhatóak, amelyek korrelációs mátrixok esetén nem lehetségesek. Kérdés, hogy a gömbök mely pontjai jelentenek létezı korrelációs struktúrát? Ezeket a sajátértékkombinációkat a továbbiakban röviden csak „lehetséges sajátértékeknek” fogom nevezni. A „lehetséges sajátértékek” vizsgálatához figyelembe kell vennünk a korrelációs mátrix sajátértékeinek tulajdonságait. Mivel a sajátértékek összege megegyezik a tényezıváltozók számával, azaz a gömb dimenziójával, ezért a „lehetséges sajátértékek” biztosan az (5) egyenlettel adott gömbök és (6) metszetein helyezkednek el. m
∑λ i =1
i
=m
(6)
A továbbiakban az általánosság megszorítása nélkül feltehetjük, hogy
λmax = λ1 ≥ λ2 ≥ K ≥ λm = λmin
A (6) képletbıl a legkisebb sajátértéket kifejezve és az (5) egyenletbe behelyettesítve az alábbi egyenletet kapjuk. 2
m −1
m −1 2 ( λ − 1 ) + m − λi − 1 = m(m − 1) Re d 2 ∑ ∑ i i =1 i =1
Az egyenletet rendezve az alábbi egyenletet kapjuk. m −1
∑λ i =1
2 i
m −1
m m −1
i =1
i =1 j =1 j >i
− m ∑ λi + ∑∑ λi λ j +
m( m − 1) m( m − 1) = Re d 2 2 2
(7)
A (7) egyenlet azt jelenti, hogy a „lehetséges sajátértékeket” – adott Red érték mellett – egy (m–1)-dimenziós ellipszoid tartalmazza. Speciálisan három tényezıváltozó esetén az ellipszisek valamely pontjai jelentik a „lehetséges sajátértékeket”. A modell elliptikus elnevezése a görbék jellegébıl adódik. Látható, hogy a (7) egyenlet alapján a sajátértékek számához képest egygyel alacsonyabb dimenzióban kapjuk meg a sajátértékek reprezentációját. Ha a tényezıváltozók száma három, akkor a (7) egyenlet az alábbi formában írható fel:
λ12 + λ22 − 3λ1 − 3λ2 + λ1 λ2 + 3 = 3 Re d 2
(8) Három tényezıváltozó esetén a „lehetséges sajátértékek” tartományának körülhatárolása – a (6) képleten túl – további három feltétel megadásával lehetséges. • A sajátértékek közötti relációt figyelembe véve: λ1 ≥ λ2. • A sajátértékek közötti relációt figyelembe véve: λ2 ≥ λ3 = 3 – λ1 – λ2, ezért
λ2 ≥
86
3 − λ1 2
KOVÁCS P.: A MULTIKOLLINEARITÁS VIZSGÁLATA ÉS MODELLEZÉSE... • Továbbá λ1 + λ2 ≤ 3. Ez a feltétel már tartalmazza a λ1 + λ3 ≤ 3 és λ2 + λ3 ≤ 3 feltételeket is. A különbözı Red értékek melletti szintvonalak közül néhány szemléltetését a 3. ábra tartalmazza. Az ábrázolás a két legnagyobb sajátérték függvényében történik. Tehát három dimenzió esetén a „lehetséges sajátértékek” a 3. ábra háromszögében találhatóak. Az extrém multikollinearitás eseteit az ellipszisek és a λ2 = 3 – λ1 egyenes metszéspontjai adják. Ebbıl is látható, hogy az extrém multikollinearitás különbözı esetei is megkülönböztethetıek a Red-mutató segítségével.
3. ábra A multikollinearitás elliptikus modellje három tényezıváltozó esetén (saját szerkesztés) A következıkben három tényezıváltozó esetén bemutatom az ellipszisek néhány sajátosságát. (1) Ha nagyobb a tényezıváltozók együttmozgásának mértéke, az ellipszisek „lehetséges tartományba” esı szakasza jobbra tolódik. (2) Az empirikus tapasztalatok szerint, adott Red érték mellett, a λ1 sajátérték növekedése a λ2 sajátérték nagyobb mértékő csökkenésével jár együtt, ezért a legkisebb sajátérték is növekedni fog, mivel a sajátértékek összege három. (3) Azon korrelációs mátrixok elhelyezkedése, amelyek mindegyik diagonálison kívüli eleme megegyezik – ekkor Red = r = Rij(i≠j) – a lehetséges tartomány alsó határán találhatóak. Ekkor a korrelációs mátrix determinánsa megegyezik az 1 – 3Red2 + 2Red3 kifejezés értékével.
87
BUDAPESTI GAZDASÁGI FİISKOLA – MAGYAR TUDOMÁNY NAPJA, 2008 (4) Az empirikus tapasztalatok szerint egy adott ellipszisen felfelé haladva a sajátértékek szorzata csökken, azaz a korrelációs mátrix determinánsa egyre kisebb (4. ábra). Így rögzített ellipszisen, azaz adott Red-érték mellett a korrelációs mátrix determinánsa beleesik a [max(1 – 3Red2 – 2Red3;0); 1 – 3Red2 – 2Red3] tartományba.
4. ábra A tényezıváltozók korrelációs mátrixa determinánsának szintvonalai három tényezıváltozó esetén (saját szerkesztés) (5) Érdekes kérdés lehet, hogy a korrelációs mátrix közül egyetlen sajátértéke alapján, milyen becslés adódik a Red-mutató értéke. Ezek a tartományok a „lehetséges tartományok” és az ellipszisek metszéspontjaiból adódnak. Például, a legnagyobb sajátérték alapján az alábbiakat kapjuk. Ha λ1 ≤ 1,5, akkor λ −1 Re d ∈ [ 1 ; λ1 − 1] , 2 továbbá, ha λ1 ≥ 1,5, akkor
Re d ∈ [
λ1 − 1 2
;
(2λ1 − 3) 2 + 3 ] 12
A legnagyobb sajátérték függvényében a Red-mutató lehetséges értékeinek tartományát szemlélteti az 5. ábra.
88
KOVÁCS P.: A MULTIKOLLINEARITÁS VIZSGÁLATA ÉS MODELLEZÉSE...
5. ábra A Red-mutató lehetséges legkisebb és legnagyobb értéke a legnagyobb sajátérték függvényében három tényezıváltozó esetén (saját szerkesztés) (6) Érdekes kérdés lehet, egy másik multikollinearitás mérıszám tartományi bejárását is megvizsgálni és összehasonlítani az ellipszisekkel. Például, a legnagyobb és a legkisebb sajátértékek hányadosait (kondíciószám) vizsgálva megállapítható, hogy a hányadosok rögzített értéke mellett, a lehetséges sajátérték-kombinációk egy egyenesen helyezkednek el. Ezeknek az egyeneseknek közös pontja a (0;3) pont, továbbá ezek a multikollinearitás mértékének növekedésére egyre jobban közelítenek a tartomány λ2 = 3 – λ1 határához (6. ábra). A sajátérték legnagyobb és legkisebb értékének hányadosát megbecsülhetjük a Red-mutató rögzített értéke mellett és fordítva. Ehhez a „lehetséges sajátértékek” tartományának határán kell meghatároznunk az ellipszisek és az egyenesek metszéspontjait. Nyilvánvaló, hogy a tartomány alsó határán határozhatjuk meg a hányados minimális értékét, míg a felsı határán a maximális értékét. Elmondható, hogy ha Red < 0,5, akkor
7. ha Red ≥ 0,5, akkor
λ1 1 + 2 Re d 1 + Re d ∈ ; λ3 1 − Re d 1 − 2 Re d , 8.
λ1 1 + 2 Re d ∈ ; + ∞ λ3 1 − Re d
Fordítva: ha a sajátérték legnagyobb és legkisebb értékének hányadosa rögzített, véges érték, akkor
89
BUDAPESTI GAZDASÁGI FİISKOLA – MAGYAR TUDOMÁNY NAPJA, 2008
λ1 λ1 −1 −1 λ λ ; 3 9. Re d ∈ 3 λ1 λ1 + 2 1 + 2 λ3 λ 3 ellenkezı esetben Red ≥ 0,5.
6. ábra A legnagyobb és a legkisebb sajátérték hányadosának viselkedése három tényezıváltozó esetén (saját szerkesztés) Magasabb dimenziók esetében – a fenti gondolatmenet alapján – a „lehetséges sajátértékek” ábrázolása nehézkes a feltételek magas száma miatt. Ezért magasabb dimenziókban csak azt állíthatjuk biztosan, 90
KOVÁCS P.: A MULTIKOLLINEARITÁS VIZSGÁLATA ÉS MODELLEZÉSE... hogy a változók átlagos együttmozgásának növekedésével a vizsgált mdimenziós gömb sugara nı. Továbbá, a Red-mutató rögzített értéke mellett a „lehetséges sajátértékek” egy (m–1)-dimenziós ellipszoid felület részén helyezkednek el. Hasonló ábrázolás a szakirodalomban a lineáris korrelációs együtthatókra vonatkozóan létezik. Ezek egy elliptópot alkotnak (BOLLA – KRÁMLI, [2005]). Magasabb dimenziókban az ábrázolás ilyen megközelítési módja is nehézkes.
Összegzés A redundancia és így a multikollinearitás egy lehetséges mérıszáma a PETRES-féle Red-mutató. A Red-mutató definiálásakor a tényezıváltozók korrelációs mátrixának sajátértékeit alkalmazzuk. A multikollinearitást nem csak változók, hanem változócsoportok is okozhatják. Megállapítható, hogy ennek egyik speciális esete a Red-mutató segítségével, míg egy másik speciális esete a VIFj-mutatók harmonikus átlagának segítségével mérhetı. Új megközelítésként ismertettem a multikollinearitás egy új modellezési lehetıségét, a Red-mutatóra épülı elliptikus modellt. A „lehetséges sajátértékek” egy m-dimenziós gömbnek egy metszetén helyezkednek el úgy, hogy rögzített Red érték mellett ezek egy (m–1)-dimenziós ellipszoidon helyezkednek el. Bemutattam a modell néhány jellemzıjét három tényezıváltozó esetén. Sajnos magasabb dimenziókban, a feltételek magas száma miatt egyelıre nehézkesnek tőnik a lehetséges sajátértékek pontos behatárolása, illetve ezek grafikus reprezentációja.
Irodalom BOLLA M. – KRÁMLI A. [2005]: Statisztikai következtetések elmélete, Typotex Kiadó, Budapest. FÜSTÖS L. – KOVÁCS E. – MESZÉNA GY. – SIMONNÉ M. N. [2004]: Alakfelismerés (Sokváltozós statisztikai módszerek), Új Mandátum Kiadó, Budapest. HAJDU O. [2003]: Többváltozós statisztikai számítások, Központi Statisztikai Hivatal, Budapest. KOVÁCS P. – PETRES T. – TÓTH L. [2005]: A new measure of multicollinearity in linear regression models, International Statistical Review (ISR), Volume 73 Number 3, Voorburg, The Netherlands, 405-412. oldal KOVÁCS P. [2008]: A multikollinearitás vizsgálata lineáris regressziós modellekben, Statisztikai szemle, 86. évfolyam 1. szám, 38-67. oldal. KOVÁCS P. [2008]: A multikollinearitás vizsgálata lineáris regressziós modellekben, A Petres-féle Red-mutató vizsgálata, doktori értekezés, 120 oldal. TRIČKOVIĆ V. [1976]: Teorijski modeli i metodi kvantitativnog istraživanja tržišta, Institut za ekonomiku industrije, Beograd.
91
BUDAPESTI GAZDASÁGI FİISKOLA – MAGYAR TUDOMÁNY NAPJA, 2008
92