A sztochasztikus idősorelemzés alapjai Ferenci Tamás BCE, Statisztika Tanszék
[email protected] 2013. november 29.
2
Tartalomjegyzék 1. Az idősorelemzés fogalma, megközelítései 1.1. Az idősor fogalma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 5
1.2. Idősorok nevezetes jellemzői . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.3. Determinisztikus és sztochasztikus idősorelemzés . . . . . . . . . . . . . . . . . .
8
1.3.1. Determinisztikus idősorelemzés . . . . . . . . . . . . . . . . . . . . . . . .
9
1.3.2. Sztochasztikus idősorelemzés . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.4. Determinisztikus és a sztochasztikus trend . . . . . . . . . . . . . . . . . . . . . .
10
2. Stacionaritás
15
2.1. A stacionaritás fogalmának szükségessége . . . . . . . . . . . . . . . . . . . . . .
15
2.2. Erős és gyenge stacionaritás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.2.1. Erős stacionaritás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.2.2. Gyenge stacionaritás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.3. Stacionárius idősorok jellemzőinek becslése mintából . . . . . . . . . . . . . . . .
20
2.4. A stacionaritás ellenőrzése . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
2.4.1. Az idősor grafikus vizsgálata . . . . . . . . . . . . . . . . . . . . . . . . .
26
2.4.2. A korrelogram lecsengésének vizsgálata . . . . . . . . . . . . . . . . . . .
27
2.4.3. Statisztikai tesztek a stacionaritás vizsgálatára . . . . . . . . . . . . . . .
27
2.5. Stacionarizálás, trend- és differenciastacioner idősorok . . . . . . . . . . . . . . .
27
2.5.1. Trendstacioner idősorok (TSP) . . . . . . . . . . . . . . . . . . . . . . . .
28
2.5.2. Differenciastacioner idősorok (DSP) . . . . . . . . . . . . . . . . . . . . .
30
3. Nevezetes idősormodellek
35
4. A Box–Jenkins-eljárás
37
5. ARIMA-modellek haladó megfogalmazása
39
6. ARIMA-modellek becslése
41
3
4
TARTALOMJEGYZÉK
1. fejezet
Az idősorelemzés fogalma, megközelítései Ebben a fejezetben elsőként definiáljuk az idősor fogalmát (1.1. pont), majd – későbbi jelentősége miatt – külön beszélünk az időrosok néhány nevezetes jellemzőjéről (1.2. pont). Ezt követően bemutatjuk az idősorok elemzésével foglalkozó két alapvető megközelítési módot (1.3. pont), amire az 1.4. pontban példát is mutatunk.
1.1. Az idősor fogalma Az idősor fogalmát megragadhatjuk „sokasági” (elméleti idősor) és „minta” (empirikus idősor) szemléletben. Sokasági értelemben idősornak nevezzük valószínűségi változók egy indexelt {Yt , t ∈ N } családját1 , ahol a t indexet „idő”-nek fogjuk nevezni. (Az indexelés, amire az egyes valószínűségi változóknál az alsó index utal, a valószínűségi változók között egy sorrendet állít fel: Y1 „előbb” van, Y2 „később”.) Ilyen értelemben ez tehát lényegében valószínűségi változók egy sorbarendezett halmaza. Jelentheti például Yt a t nap végi OTP záróárfolyamot, a t nap végi HUF/EUR árfolyamot, a t évbeli magyarországi gabonatermelést stb. Néha az is hasznos lesz, ha úgy gondolunk erre, mint egy többdimenziós valószínűségi változóra, melynek Yt -k a komponensei (csak épp, szemben a szokásos többdimenziós eloszlásokkal, a sorrendjünk nem indifferens). N a lehetséges időpontok halmaza; ez a közgazdasági gyakorlatban legtöbbször diszkrét, nagyon gyakran egy véges halmaz, például N = {1, 2, . . . , T }. Ekkor tehát T számú időpontunk van, melyeket 1-től T -ig indexeltünk; a valószínűségi változóink így tehát: Y1 , Y2 , . . . , YT . (Műszaki és természettudományos gyakorlatban előfordulnak folytonos indexhalmazok is, pl. lehet N = R+ . Mi ilyen, ún. folytonos idejű idősorokkal a továbbiakban nem foglalkozunk, csak diszkrét idejűekkel, és az egyszerűség kedvéért azon belül is az N = {1, 2, . . . , T } esettel.) Lehet például az indexelés 1 Pontosan
ugyanezt a fogalmat a valószínűségszámításban sztochasztikus folyamatnak szokás nevezni.
5
6
1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI
jelentése az, hogy t = 1 a jövő hétfői OTP záróárfolyam, t = 2 a jövő keddi stb., és T = 5 (azaz a jövő hét öt munkanapjára vonatkozó OTP záróárfolyam az idősorunk). Minta megközelítésben idősornak azt a y1 , y2 , . . . , yT statisztikai adatsort (adatbázist) nevezzük, amelynek az megfigyelési egységei sorbarendezettek, valamilyen időponthoz kötöttek. (Itt már láthatóan alkalmaztuk azt a konvenciót, hogy az időpontjaink az {1, 2, . . . , T } halmaz elemei.) Míg tehát az előbbiekben valószínűségi változók (sorbarendezett) sorozatával van dolgunk, itt már konkrét számok (sorbarendezett) sorozatával. Nyilvánvaló, hogy ez utóbbi az előbbi egy realizációja. (Pontosan ugyanúgy, ahogy az 1406 eladásra kínált lakás is egy-egy, összesen 1406 realizáció a kínálati ár, alapterület stb. változók (ismeretlen) együttes eloszlásából.) Ez utóbbi megjegyzés rögtön mutatja az idősorelemzés legnagyobb problémáját (és egyben persze kihívását): azt, hogy a gyakorlati feladatokban az egyes időpontokhoz tartozó valószínűségi változónkra csak egy realizációnk lesz! Nem hogy 1406 mintát nem vehetünk a valószínűségi változóból, de kettőt sem. (Aligha lehet a „holnapi OTP-záróárfolyam”, mint valószínűségi változóból két mintát venni. . . ) Szokás ezt, nagyon találóan, a reprodukálhatatlanság problémájának is nevezni. Mindezeket példázza az 1.1. ábra2 , mely az OTP 2010 évi záróárait ábrázolja. 2010-ben összesen 254 kereskedési nap volt a BÉT-en, ez tehát egy T = 254 elemű idősor; január 4től (az első kereskedési naptól) 1-gyel kezdve, minden kereskedési napon egyesével növekvően indexelhetjük. A fentiek fényében világos, hogy az OTP záróárfolyamainak alakulását elvileg egy 254-dimenziós valószínűségi változó írja le; az ábrán ennek egyetlen realizációja látható. . . ami egyúttal bizonyosan az egyetlen létező realizáció is erre az idősorra. Ennek megfelelően tehát soha ne felejtsük el, hogy az empirikus idősor, hiába is áll 254 számból, valójában egyetlen realizáció – csak épp egy 254-dimenziós valószínűségi változóból. (Ahogy például a kínálati ár, alapterület, szobaszám együttes eloszlásából vett egyetlen realizáció is három számból áll.) A fenti ábrázolás azt juttatja kifejezésre, hogy az idősoros adatok specialitása (szemben a lakásos példával), hogy a valószínűségi változó komponensei között (és így persze a realizált komponensei között is) sorrendezés van: az ábrázolásnak csak úgy van értelme, ha erre tekintettel vagyunk; nyilván az ábra is e sorbarendezés figyelembevételével készült. A fentiek mind ún. egyváltozós idősorok voltak, hiszen skalárértékű valószínűségi változókat, ill. realizáltjaikat vizsgáltuk. Természetesen semmi akadálya annak, hogy ehelyett vektorértékű valószínűségi változókra térjünk át (pl. OTP árfolyam és HUF/EUR árfolyam együttes vizsgálata), ilyen többváltozós idősorról szokás beszélni. Ez egy még izgalmasabb, és persze bonyolultabb matematikai formalizmusú terület, hiszen ilyenkor nem csak a különböző időpontok közötti, hanem a különböző változók közötti kapcsolat kérdését is kezelni kell. Mi most egyváltozós idősorokkal fogunk foglalkozni. 2 Az ábrázolás elvileg nem teljesen korrekt, hiszen ez az idősor ugyebár diszkrét, ezért az egyes pontokat nem köthetnénk össze, ám itt olyan sok időpontunk van, hogy ez lényeges hibát nem jelent (amúgyis „szabad szemmel” szinte megkülönböztethetetlenül közel lennének a pontok).
1.2. IDŐSOROK NEVEZETES JELLEMZŐI
7
Az OTP záróárai (BÉT), 2010 7500
7000
Záróár [Ft]
6500
6000
5500
5000
4500
febr.
márc.
ápr.
máj.
jún.
júl.
aug.
szept.
okt.
nov.
dec.
Dátum
1.1. ábra. Az OTP 2010. évi záróárai a BÉT-en
1.2. Idősorok nevezetes jellemzői Egy idősor teljes sokasági leírását az adja, ha ismerjük az összes t ∈ N -re vett együttes eloszlását. Ennek ismeretében „mindent tudunk” az idősorról (természetesen sztochasztikus értelemben). Ezzel a kérdéssel, illetve ennek nehézségeivel a 2. fejezetben fogunk foglalkozni; de addig is – hasonlóan a keresztmetszeti esethez – itt is definiáljuk az idősor néhány, ennél egyszerűbb jellemzőjét. Olyan értelemben lesznek ezek „egyszerűbbek”, hogy az összes időpont együttes eloszlása helyett csak egy, legfeljebb két időpont együttes eloszlására vonatkoznak, illetve a teljes eloszlás megadása helyett csak egy, legfeljebb két momentumot adnak meg. (Teljes analógiában a keresztmetszeti esettel: ott is nagyon gyakori, hogy egy változó eloszlását csak várható értékével és esetleg szórásnégyzetével adjuk meg, illetve, hogy két változó eloszlását csak kovarianciájukkal/korrelációjukkal írjuk le.) Mivel Yt egy valószínűségi változó minden t ∈ N -re, így kiszámíthatjuk az EYt várhatóértékét. Ez már egyszerűen egy valós szám lesz, mégpedig t-től függő valós szám. Azaz: egy függvényt kaptunk, mely t időponthoz hozzárendeli, az akkori várható értékét az idősornak, EYt -t. Ezt
8
1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI
hívják precízen várható érték függvénynek, jele µ (µ : N → R): µt := EYt . Teljesen hasonlóan definiálható a σ 2 szórásnégyzet függvény (σ 2 : N → R+ ): 2 2 σt2 := D2 Yt = E (Yt − EYt ) = E (Yt − µt ) = EYt2 − µ2t .
Értelemszerűen a σ szórás függvény ennek a négyzetgyöke: σt :=
p σt2 .
Ezeken felül szokás definiálni az autokovariancia függvényt is, mint két időpont közti (azaz a két időponthoz tartozó valószínűségi változók közti) kovarianciát. (Az „auto” arra utal, hogy – az idősor szintjén – „önmagával vett” kovarianciáról van szó.) Mivel ehhez mindkét időpontot meg kell adni, ez már egy kétváltozós függvény lesz, jele γ (γ : N × N → R): γt,s := cov (Yt , Ys ) = E (Yt − EYt ) (Ys − EYs ) = E (Yt − µt ) (Ys − µs ) = E (Yt Ys ) − µt µs . Az autokovariancia-függvény hátránya (a keresztmetszeti esethez hasonlóan), hogy a számértéke önmagában nem sokat mond. Ezért itt is szokás ehelyett inkább az autokorreláció függvényt használni, melynek jele ρ (ρ : N × N → [−1, 1]): ρt,s := corr (Yt , Ys ) =
γt,s . σt σs
1.3. Determinisztikus és sztochasztikus idősorelemzési megközelítések Az idősorok elemzésének két alapvető megközelítése, módszertana alakult ki: a determisztikus (1.3.1. alpont) és a sztochasztikus (1.3.2. alpont) idősorelemzés. Megjegyezzük, hogy valójában mindkettő az ún. időtartományon történő elemzés kategóriájába esik (mivel azon alapulnak, hogy az idősor külöböző időpontokhoz tartozó értékei között teremtenek kapcsolatot). Tágabban szemlélve, az idősorelemzés másik nagy kategóriája a frekvenciatartományon történő elemzés, ezzel azonban nem fogunk részleteiben foglalkozni. A frekvenciatartományon történő elemzés lényege (némiképp leegyszerűsítve), hogy az idősort Fouriertranszformációval szinuszhullámok összegére bontja. Belátható, hogy idősorok egy széles csoportja ekvivalensen reprezentálható úgy, hogy megadjuk, hogy az egyes frekvenciájú szinuszhullámokat milyen súllyal kell kombinálni, hogy megkapjuk az idősort. (Az ekvivalens reprezentáció alatt azt értjük, hogy oda-vissza át lehet térni a két leírás között.) Ez utóbbira szokták azt mondani, hogy időtartomány helyett frekvenciatartományon írtuk fel az idősort; ebből is sok hasznos és érdekes következtetést lehet levonni. Ezt a módszertant szokták spektrális elemzésnek is nevezni.
1.3. DETERMINISZTIKUS ÉS SZTOCHASZTIKUS IDŐSORELEMZÉS
9
1.3.1. Determinisztikus idősorelemzés Az ún. determinisztikus idősorelemzés azon a feltevésen nyugszik, hogy az idősort alakító tényezők, elvileg legalábbis, teljeskörűen számbavehetőek, és ez alapján az idősor alakulása, elvileg legalábbis, tökéletes pontossággal felírható lenne. A véletlennek „csak” annyiban jut szerep, hogy valami átkozott pech folytán a gyakorlati esetekben ez a teljeskörű felírás soha nem valósul meg (korlátozottak a mérési lehetőségek, korlátozott a tudásunk, hibával tudunk csak mérni stb.), emiatt a valóság mindig eltér a modell szerinti becslésünktől. (Vegyük észre, hogy ez az eltérés teljesen analóg a keresztmetszeti regresszió eltérésváltozójával, amiben szintén a fenti okok miatti hibát sűrítettük.) Azonban, és ez nagyon fontos, ebben a modellezési filozófiában a véletlen szerepe itt véget is ért: kialakítja az adott időszakbeli pontos értéket (eltérve valamennyivel a becslésünktől), ám ennyi, a későbbi időszakokra ennek már nincs hatása! (Természetesen a későbbi időpontokban is lesz eltérés, tehát ott is szerepet kap a véletlen, ám ez már az előző(ek)től függetlenül alakul – mintha minden időpillanatban pénzfeldobásszerűen döntenénk a tényleges érték becsülttől való eltérítéséről.) Ez a filozófia a dekompozíciós idősormodellek felé mutat, melyek különböző, eltérő tartalmú komponensekre próbálják bontani az idősort (melyektől az idősor valamilyen függvényszerű módon függ). A legnépszerűbb modellben szokás beszélni pl. trendről (hosszú távú alapirányzat), ciklusról (éven túli ingadozás a trend körül) és szezonalitásról (évszakról-évszakra ingadozó, tehát éven belüli eltérés a trend és ciklus szerinti értéktől). Amennyiben feltesszük, hogy ezek additíve tevődnek össze, úgy az idősormodellünk a következőképp néz ki: Yt = Rt + Ct + St + ut , ahol Rt , Ct és St a trend, a ciklus és a szezonalitás t-edik időszakbeli értéke rendre, ut pedig a már említett eltérésváltozó. Ezek a komponensek klasszikus statisztikai (jellegében deskriptív statisztikai) módszerekkel (pl. analitikus trendszámítás) becsülhetőek. A determinisztikus idősorelemzéssel (mellyel elsősorban hosszútávú előrejelzések adása a cél), a továbbiakban nem foglalkozunk.
1.3.2. Sztochasztikus idősorelemzés A sztochasztikus idősorelemzés alapvető filozófiai eltérése, hogy bár ez a modell is adni fog egy becsült értéket az idősor adott időpontbeli értékére, és feltételezi, hogy a valós érték ettől véletlen módon eltér, ám abból indul ki, hogy ennek a véletlen eltérésnek később is hatása van: az idősor későbbi alakulását is befolyásolja. Úgy is szokták mondani, hogy az idősor fejlődésében öngeneráló hatások érvényesülnek: egy adott időpillanatbeli (véletlen) eltérés befolyásolja a későbbi értékeket is, tehát a véletlennek folyamatépítő szerepe van. E megközelítést nagy sikerrel alkalmazták különböző közgazdasági (kiemelten: pénzügyi) idősorok modellezésére; elsősorban rövid távra.
10
1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI
1.4. Egy példa a két filozófiára: a determinisztikus és a sztochasztikus trend Most megnézünk egy egyszerű példát, mely közvetlenül a két modellezési iskola feltevéseit szemlélteti, ám a későbbiek szempontjából is nagyon jól fog jönni. Vegyük a következő két idősor-specifikációt: (D)
= αt + ut ,
(S)
= α + Yt−1 + ut ,
Yt Yt
(S)
Y0 = 0.
(Látható, hogy mindkét idősort a sokaságban3 specifikáltuk.) Az egyszerűség kedvéért feltételez zük, hogy ut ∼ N 0, σ 2 , mégpedig különböző t-kre függetlenül. Első ránézésre több hasonlóság is felfedezhető a két specifikáció között. Mindkét idősor a 0ból indul (a 0 időpillanatban) és érezhető, hogy mindkettőre igaz, hogy egy időszakkal később várhatóan α-val nagyobb értéket vesznek fel. (Az α természetesen lehet negatív is.) Hogy ezt (S)
az állítást precízebben is megfogalmazzuk, vegyük észre, hogy az Yt behelyettesíthetünk (hiszen ha (S)
Yt
(S) Yt
=
(S) α + Yt−1 + ut ,
akkor nyilván
(S) Yt−1
definíciójába rekurzíve (S)
= α + Yt−2 + ut−1 stb.):
(S) (S) = α + Yt−1 + ut = α + α + Yt−2 + ut−1 + ut = t X (S) = α + α + α + Yt−3 + ut−2 + ut−1 + ut = . . . = αt + ui . i=1 (D)
Az intuitív észrevételünket tehát úgy fogalmazhatjuk meg most már precízen, hogy EYt = Pt (S) E (αt + ut ) = αt és EYt = E αt + i=1 ui = αt, tehát várható értékben minden időpillanatban ugyanaz a két idősor értéke. (Kihasználtuk, hogy összeg várható értéke a várható értékek összege, illetve, hogy konstans várható értéke saját maga és Eui = 0.) Ez egy nagyon komoly megállapítás, ám van különbség is a két idősor fejlődése között. Ez rög(D)
tön világos lesz, ha felírjuk a szórásnégyzetet egy általános időpontra: D2 Yt = D2 (αt + ut ) = P (S) t σ 2 és D2 Yt = D2 αt + i=1 ui = tσ 2 . (Kihasználtuk, hogy konstans minden valószínűségi változótól független (és szórásnégyzete nulla), és hogy független valószínűségi változók összegének szórásnégyzete a szórásnégyzetek összege.) A két idősor tehát várható értékban ugyan azonos, (S)
ám Yt
(D)
egyre nagyobb kilengésekkel ingadozik ezen várható érték körül, míg Yt
Megjegyezzük, hogy mivel nyilván mind
(D) Yt ,
mind
(S) Yt
állandóakkal.
normális eloszlású (hiszen a normális
eloszláscsalád zárt a konvolúcióra és a konstanssal eltolásra), így a fenti két megállapítással teljesen le is írtuk az idősorokat. (Hiszen egy normális eloszlást egyértelműen meghatároz várható értéke és varianciája.) A fentieket számítógépes szimulációval szemléltethetjük: véletlenszám-generátorral előállítunk 3 Pontosan innen látszik az is, hogy az Y = 0 természetesen nem azt jelenti, hogy az Y az a 0 (mint valós 0 0 szám), hiszen az Yt -k valószínűségi változók, ez tehát úgy értendő, hogy az Y0 az az elfajult valószínűségi változó, mely 1 valószínűséggel a 0 értéket veszi fel.
1.4. DETERMINISZTIKUS ÉS A SZTOCHASZTIKUS TREND
11
ut ∼ N 0, σ 2 számokat, majd így „lejátszhatjuk” egy lehetséges lefutását az idősornak. (Mind (D)
Yt
(S)
-t, mind Yt
-t szimulálhatjuk ilyen módon.) E megközelítés előnye, hogy míg valós szi-
tuációban nem ismerjük a sokasági eloszlást (épp ennek meghatározása lesz a feladat), csak egy realizáltat (sőt, idősorelemzésnél biztosan legfeljebb egy realizáltját láthatjuk az ismeretlen sokasági eloszlásnak), addig ebben az esetben ismerjük, sőt, mi határozzuk meg (a véletlenszámgenerátor beállításával) a sokasági eloszlást. Ennek megfelelően természetesen ebben az esetben vehetünk akárhány realizáltat a sokasági eloszlából (egyszerűen újra lefuttatjuk a szimulációt). (D) (S) Ezt szemlélteti az 1.2. ábra, melyen 9-9 realizáltat ábrázoltunk a Yt (kékkel) és Yt (pirossal) idősorokból α = 1, σ 2 = 9 paraméterek mellett. (A jobb áttekinthetőség végett csak 3-3 realizáltat ábrázoltunk egy grafikonon.) Megjegyezzük, hogy ezeket a lefutásokat szokás trajektóriának is nevezni. Az ábra tanulságosan igazolja vissza mindazt, amit eddig elméleti úton levezettünk. Egyrészt jól látszik, hogy várható értékben tényleg egyezik a két idősor (már ennyi ábrából is érezhető, (D)
hogy az y = x egyenes körül ingadoznak); és az is tökéletesen látszik, hogy míg Yt szórással ingadozik ezen egyenes körül, addig
(S) Yt
állandó
egyre nagyobb szórással („legyezőszerűen”
kitágul ezen egyenes körül). (D)
Most már elárulhatjuk, hogy Yt
(S)
-t szokás determinisztikus trendnek, Yt
-et pedig szto-
chasztikus trendnek nevezni. (A „trend” elnevezés jogosságát épp a várható értékek alakulásáról tett megállapításunk indokolja.) Már a specifikációkból is látható, hogy a determinisztikus trend alakulása a determinisztikus idősorelemzési iskola premisszáit teljesíti, a sztochasztikus trend a sztochasztikus idősorelemzésiét. És ebből egy újabb fontos, tartalmi következtetést vonhatunk le az idősorok fejlődésének jellegzetességeire vonatkozóan. A determinisztikus trend alakulását úgy lehet elképzelni, hogy a t-edik időpontban fellépünk az αt pontba, majd egy N 0, σ 2 véletlenszám szerint perturbáljuk a pozíciónkat. A sztochasztikus trend esetén az előző pozícióból fellépünk α-t és utána térítjük el a pozíciónkat egy N 0, σ 2 véletlenszám szerint. (Mindezek a – most ismert – sokasági specifikációból világosak.) Hogy mi a különbség? Ha a véletlengenerátor pont egy nagyon nagy, vagy nagyon kicsi értéket dob ki, az ugyan kiugró pozíciót fog eredményezni, ám ennek determinisztikus trendnél semmilyen jelentősége nincs a későbbiek szempontjából (ettől függetlenül αt-be lépünk és generálunk újra véletlenszámot a következő időpontban), addig sztochasztikus trend esetén nagyon is van: az egész folyamat a kiugró pozíciótól folytatódik tovább! Ez legjobban talán a legalsó részábra legfelső trajektóriáján látszik: miután a 25. időpillanatban egy nagy pozitív véletlenszámot kaptunk, a nagy kiugrás nem egyszeri volt (ahogy determinisztikus trend esetén lett volna), hanem lényegében „eltolódott” az idősor, és onnan folytatódott az épülése. Mindez a specifikációból következik, természetesen. Azt is mondhatnánk, hogy a sztochasztikus trend esetén az idősorba „beépülnek a sokkok”, míg a determinisztikus trendbe nem. Ez a példa jól szemlélteti, hogy mit kell az alatt érteni, hogy egy idősorban a véletlennek „folyamatépítő szerepe” van, hogy „öngeneráló” hatások érvényesülnek. Megjegyezzük, hogy az Yt = Yt−1 +ut specifikációt szokás véletlen bolyongásnak (RW, random
12
1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI 100 80 60 40 20 20
40
60
80
100
20
40
60
80
100
20
40
60
80
100
120 100 80 60 40 20
120 100 80 60 40 20
(D)
1.2. ábra. Yt
(S)
(kék) és Yt
(piros) szimulált lefutása 100 időegységre
walk) is nevezni, hiszen Yt felfogható úgy is, mint egy objektum („a bolyongó”) térbeli helyzete. Azaz: a bolyongó kezdetben az origóban áll, minden időpillanatban előveszi a véletlenszámgenerátorát, és annyit lép felfelé, amennyit a véletlenszám-generátor mutat. (Ez természetesen negatív is lehet.) Ez tehát egy ún. egydimenziós bolyongás. Az Yt = α + Yt−1 + ut típusú folyamat neve eltolásos véletlen bolyongás (RWD, random walk with drift), hiszen ilyenkor a bolyongó
1.4. DETERMINISZTIKUS ÉS A SZTOCHASZTIKUS TREND
13
először determinisztikusan felfelé lép α-t (eltolás, „sodródás”) és utána nézi meg a véletlenszámgenerátorát. RWD-folyamatokra a fentiekben már láttunk példákat, az 1.3. ábrán pedig 5 szimulált RW-folyamat trajektóriáját láthatjuk. Érdemes ellenőrizni a megbeszélt tulajdonságok teljesülését! Ezen folyamatoknak a valószínűségszámításban van nagy jelentőségük.
40
20
20
40
60
80
-20
-40
-60 1.3. ábra. Véletlen bolyongás (RW) szimulált trajektóriái
100
14
1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI
2. fejezet
Stacionaritás A stacionaritás az idősorelemzés egyik alapvető fogalma; lényegében egy megkötést jelent az idősor valószínűségi struktúrájára nézve. E megkötés azért szükséges, hogy az idősor statisztikai eszközökkel kézbentartható legyen. (És mert – épp emiatt – a későbbi ismertetendő módszertan is stacionárius idősorokat fog igényelni.) A 2.1. pontban megindokoljuk, hogy miért szükséges ez a fogalom, mi a bevezetésének a logikája. Ezt követően, a 2.2. pontban precízen is bevezetjük a két, gyakran használt stacionaritás fogalmat, majd a 2.3. pontban megmutatjuk pár nevezetes jellemzőjét a stacionárius idősoroknak. Ez már csak azért is fontos, mert a későbbiekben szinte kizárólag ilyen idősorokkal fogunk dolgozni. A 2.4. pontban megmutatjuk, hogy az idősorok stacionaritását hogyan tudjuk megvizsgálni. Ez azért különösen fontos, mert a későbbiekben, amint már utaltunk is rá, stacioner idősorokra lesz szükségünk a modellépítéshez. Emiatt itt tárgyaljuk azt a másik nagyon fontos kérdést is, hogy mi a teendő nem-stacioner idősorok esetén, hogyan tudjuk őket stacioner idősorrá transzformálni („stacionarizálás”).
2.1. A stacionaritás fogalmának szükségessége Hasonlóan a keresztmetszeti adatelemzéshez, idősoros esetben is az lehet a célunk, hogy a minta alapján rekonstruáljuk az ismeretlen háttéreloszlást, amiből a minta származik. Ahogy már említettük is, egy idősor teljes leírását az adja, ha megadjuk a komponenseinek, tehát az egyes t ∈ N időponthoz tartozó valószínűségi változóknak az együttes eloszlását. Jegyezzük meg, hogy az egyes időpontok önmagában vett eloszlása nyilván kevés, hiszen ezekből semmit nem tudunk az időpontok közötti kapcsolatokról. Gondoljunk akár csak a legegyszerűbb esetre: T = 2 és az idősor eloszlása kétdimenziós normális. A 2.1. ábra két ilyen esetet szemléltet, a kétdimenziós sűrűségfüggvényt szintvonalakkal megjelenítve. A két eset jellegzetessége, hogy mindkét vetületi eloszlásuk (tehát: mindkét időpontban az adott időpontra 15
16
2. FEJEZET. STACIONARITÁS
önmagában vett eloszlás) pontosan ugyanaz (ezt szemléltetendő az ábrán szintén feltüntettük ezeket a vetületi eloszlásokat, mégpedig pont úgy, ahogy a kétdimenziós eloszlást „le kéne vetíteni’), mégis a két idősor tartalma drámaian eltérő: nagyon nem mindegy, hogy ha a részvény adott napi árfolyama az átlagánál magasabb, akkor a következő napi várhatóan átlagánál alacsonyabb, vagy pont hogy magasabb lesz. . . Kicsit precízebb valószínűségszámítási terminológiával megfogalmazva: a két eloszlás várhatérték-vektora és szórásnégyzetei teljesen azonosak, ami eltér, az a kovariancia (és így persze a korreláció is). Az is világos mellesleg valószínűségszámításból, hogy kizárólag akkor mondhatjuk, hogy a vetületi eloszlások elégségesek, ha az egyes időpontok függetlenek (hiszen ekkor az együttes sűrűségfüggvény1 előállítható a vetületi sűrűségfüggvényekből, egyszerű szorzással). Ez nyilván irreális feltevés a legtöbb gyakorlati esetben. Minden információt
0.4
0.4
0.3
0.3
0.2
0.2
0.1
y 2 4 6 8 10 -2
0.05
y 10 8 6 4 2 0 x -2 1234567
0.10
y 10 8 6 4 2 0 x -2 1234567
0.15
-2
0.05
0.10
0.15
2 4 6 8 10
y
általánosságban csak az együttes eloszlás hordoz.
0.1 x 1234567
x 1234567
2.1. ábra. Két kétdimenziós normális eloszlás sűrűségfüggvénye (szintvonalakkal) és vetületi eloszlásaik (szemléletesen ott, ahová tényleg „vetíteni” lehetne a kétdimenziós felületet); úgy, hogy az eloszlások mindkét vetületi eloszlása pontosan egyezik, mégis drámaian eltérőek tartalmilag Az 1. fejezetben mondottak szerint azonban az együttes eloszlás meghatározására – szemben a keresztmetszeti esettel – semmilyen reményünk nincs: míg 1406 minta alapján a 7 változónk együttes eloszlása jól rekonstruálható, addig itt, egyetlen minta lévén, lényegében semmit nem tudunk mondani az együttes eloszlásról. Sőt, nem csak az együttes eloszlásról nem tudunk érdemben nyilatkozni, de még a vetületi eloszlásokról (itt: az idősornak az egyes időpontokban önmagában vett eloszlásairól) sem: egyetlen realizációból értelmesen még várható értéket sem tudunk mondani, nemhogy eloszlást rekonstruálni. 1 Mi most csak olyan idősorokkal foglalkozunk, melyeknél a valószínűségi változó eloszlása folytonos, és így létezik sűrűségfüggvény.
2.2. ERŐS ÉS GYENGE STACIONARITÁS
17
Ebből tehát világos, hogy az idősorelemzéssel csak úgy tudunk érdemben továbbhaladni, ha az együttes eloszlásra bizonyos megkötéseket teszünk. Ez fog elvezetni minket a stacionaritás fogalmához. Először egy rávezető problémával kezdünk. Tegyük fel, hogy valaki megkér minket, hogy adjuk meg a 2010. január 4-i OTP záróárfolyam várható értékét. (Ez az Y1 az 1.1. ábra példáján.) Ahogy már mondtuk, további megkötés nélkül ez a feladat reménytelen, hiszen arra a valószínűségi változóra egyetlen mintánk van (y1 = 5492), amiből, értelmesen legalábbis, nem lehet várható értéket becsülni. (Mint ahogy semmi mást sem.) Itt jön elő a reprodukálhatatlanság, az egyetlen realizáció problémája: nem lenne gond egy ilyen becsléssel, ha vehetnék több mint a 2010. január 4-i OTP záróárfolyamból. . . de nem vehetünk, ez sajnos elvileg lehetetlen. Tegyük fel azonban, hogy valaki „megsúgja”, hogy az együttes eloszlás olyan, hogy minden vetületi eloszlásnak (tehát minden nap záróárának) ugyanaz a várható értéke. Ekkor már drasztikusan más a helyzet! Ha ugyanis ez a feltevés igaz, akkor természetesen a második (vagy bármelyik más) időpontbeli realizáció is ugyanúgy használható a várható érték becslésére, mint az első napi; azaz: a különböző naphoz tartozó értékeket „összeönthetjük” a várható érték becsléséhez. Márpedig 254 értékből nagyon is lehet várható értéket becsülni! E feltevés híján azonban a külöböző időpontbeli értékeket nem használhattuk volna fel együtt. Ez a példa rámutat arra, hogy ha bizonyos megszorításokat teszünk (a példában: hogy minden vetületi eloszlás várható értéke ugyanaz), akkor a kezdetben reménytelen feladatot kezelhetővé tesszük (legalábbis bizonyos szempontok szerint). E kikötések teljesülését persze valahogy ellenőrizni kell, de erre majd később, a 2.4. pontban térünk vissza.
2.2. Erős és gyenge stacionaritás Most bevezetjük, a fentiek által motiválva, idősorok stacionaritásának fogalmát. (Jobban mondva fogalmait, mert több stacionaritási fogalmat is definiálni fogunk.) Előtte még emlékeztetünk arra, hogy egy többdimenziós eloszlás vetületének néhány kiválasztott komponensének együttes eloszlását nevezzük. Például az X, Y, Z, V valószínűségi változókból (mint komponensekből) álló többdimenziós (négydimenziós) valószínűségi változónak 4 darab egydimenziós vetületi eloszlása van (az X, az Y , a Z és a V változók (önmagában vett) eloszlása), 6 darab kétdimenziós vetületi eloszlása van (az X, Y , X, Z, X, V , Y, Z, Y, V és Z, V párok együttes eloszlása) és így tovább. (Természetesen, mint azt ez a példa is mutatja, a vetületi eloszlás is lehet többdimenziós, azaz egy együttes eloszlás vetületi eloszlása is jelenthet együttes eloszlást.)
2.2.1. Erős stacionaritás Kezdjük egy nagyon erős megkötéssel. Egy idősort erős értelemben stacionáriusnak (vagy: erős értelemben stacionernek) nevezünk, ha minden véges dimenziós vetületének együttes eloszlása (tehát: akárhány elemű vetületről van szó, és ezeket az elemeket akárhogy választjuk ki az idősor komponensei (azaz időpontjai) közül) eltolásinvariáns, minden értelmes eltolásra. Például
18
2. FEJEZET. STACIONARITÁS
mondjuk azt, hogy háromdimenziós vetületek együttes eloszlására vagyunk kíváncsiak; egy ilyen lehetséges vetület például az Y1 , Y3 és Y7 együttes eloszlása. Ha az erős stacionaritás fennáll, akkor e három együttes eloszlásának ugyanannak kell lennie, mint Y2 , Y4 és Y8 együttes eloszlásának, vagy épp Y12 , Y14 és Y18 együttes eloszlásának, vagy épp Y212 , Y214 és Y218 együttes eloszlásának, és egyáltalán: minden más, eltolással kijelölt időpont együttes eloszlásának. (Eltolással kijelölés itt olyan, mintha egy ablakot mereven végigtolnánk az idősoron, tehát az egyes időpontok közti különbségeknek ugyanannyinak kell lenniük.) És ennek természetesen nem csak a háromdimenziós vetületekre kell teljesülnie, hanem az egydimenziósokra, a kétdimenziósokra, . . . és az n − 1 dimenziósokra is. (Azért kellett úgy fogalmaznunk, hogy minden „értelmes” eltolásra, mert nem véges idősoroknál ezt az ablakot nyilván nem tolhatjuk ki az idősoron „túlra”.) Precízen megfogalmazva: ∀k ≥ 1 esetén ∀t1 , t2 , . . . , tk -ra Yt1 , Yt2 , . . . , Ytk együttes eloszlása megegyezik Yt1 +h , Yt2 +h , . . . , Ytk +h együttes eloszlásával, ∀h-ra (ha az itt szereplő komponensek mind az idősor részei). Ez a feltétel (már a ∀ kvantorok számából is érezhetően. . . ) rendkívül sokat követel meg. Vegyük észre például, hogy ennek része az előző pont végének példa-megkötése: a definíciót k = 1gyel alkalmazva azt kapjuk, hogy erős stacionaritás esetén minden egyes időpontban pontosan ugyanannak kell lennie az idősor adott időpontbeli (vetületi) eloszlásának. (Így nyilván a várható értékének, és egyáltalán, minden momentumának is ugyanannak kell lennie, minden időpontban.) Ennek megfelelően, ha egy idősor erősen stacioner, az rendkívüli módon megkönnyíti az elemzését. Nem csak a várható értékének becsléséhez használható fel együtt az összes időpontbeli érték (tehát y1 , y2 , . . . , yT ), de a szórásnégyzetének, ferdeségének stb., tehát általában, bármilyen momentumának becsléséhez, sőt: a definíció k = 2-re alkalmazásából látszik, hogy az egymást követő időpontok kétdimenziós eloszlása is ugyanaz, tehát minden időpont és a rákövetkező időpont közti korreláció is ugyanaz kell legyen (függetlenül attól, hogy melyik ez a két időpont, csak az számít, hogy egymás utániak legyenek), és ennek becsléséhez felhasználhatjuk az (y1 , y2 ), (y2 , y3 ), . . . , (yT −1 , yT ) értékeket. Sőt, a kettő különbségű időpontok eloszlása is azonos, függetlenül attól, hogy melyek a konkrét időpontok (csak az számít, hogy időkülönbségük kettő legyen), így korrelációjuk is azonos, és emiatt e korreláció (szokták úgy is hívni: a kettő késleltetéshez tartozó korreláció) becsléséhez felhasználhatóak az (y1 , y3 ), (y2 , y4 ),. . . ,(yT −2 , yT ) párok értékei, és így tovább. (Tehát például minden háromdimenziós (stb.) vetületi eloszlás is azonos lesz, eltolástól függetlenül, csak ezek nem bírnak olyan nagy gyakorlati jelentőséggel, nincs is olyan közismert leírójuk, mint kétdimenziósoknál a korreláció.)
2.2.2. Gyenge stacionaritás Az látható, hogy a felvázolt problémát az erős stacionaritás elfogadása megoldja, csak épp ezzel bizonyos értelemben „átesünk a ló túloldalára”: az erős stacionaritás olyan komplex követelményrendszer, hogy ellenőrzése lényegében reménytelen mintából. Éppen emiatt, a gyakorlati alkalmazásokban ehelyett inkább egy gyengített változatát szokás használni. A gyengítés motivációja, hogy csak azokat a követelményeket hagyjuk meg az erős
2.2. ERŐS ÉS GYENGE STACIONARITÁS
19
stacionaritásból, amelyek kézzelfogható statisztikai jellemzőkhöz kapcsolódnak: például a kétdimenziós eloszlásoknak van gyakorlati jelentőségük (fontos leírójuk kovariancia/korreláció), ám a három (és több) dimenziós eloszlásoknak nincs ilyen jellemzőjük, ezért kettőnél nagyobb dimenziójú vetületekre egyáltalán nem teszünk kikötést. Sőt, az egy- és kétdimenziós eloszlásoknál is enyhítünk a feltételeken: nem az eloszlások teljes egyezőségét követeljük meg, csak az első és második momentumban történő egyezést. (Kétdimenziós esetben az első momentumnak nincs értelme, a második momentum pedig a kovariancia lesz.) Mindezeket összefoglalva, és precízzé téve: egy idősort gyenge értelemben stacionáriusnak (vagy gyenge értelemben stacionernek) nevezünk, ha a következő három feltétel teljesül rá: 1. Minden időpontban ugyanaz az idősor várható értéke, tehát létezik a közös µ ≡ EYt várható érték (azaz µt ≡ µ minden t-re). 2. Minden időpontban ugyanaz az idősor szórásnégyzete, tehát létezik a közös σ 2 ≡ D2 Yt szórásnégyzet (azaz σt2 ≡ σ 2 minden t-re). 3. Két időpont közti kovariancia kizárólag a két időpont külöbségétől (a késleltetéstől) függ, tehát cov (Yt , Ys ) = cov (Yt+h , Ys+h ) minden értelmes h eltolásra (azaz a kétváltozós γt,s függvény felírható egy egyváltozós függvényként úgy, hogy γt,s = γt−s ). Azonnal látható, hogy egy az egyben az erős stacionaritás követelményeit ismételtük meg, csak épp mindössze egy- és kétdimenziós vetületekre, és mindössze első két momentumban történő egyezésre. (Szokás a gyenge stacionaritást kovariancia-stacionaritásnak is nevezni.) Észrevehető mellesleg, hogy ez a gyengítés pontosan összhangban van azzal, amit akkor tennénk, ha tudnánk, hogy az idősor többdimenziós normális eloszlású (és így persze minden vetületi eloszlása is (többdimenziós) normális). Ekkor ugyanis egyrészt az első két momentum teljesen meghatározza az eloszlást, másrészt pl. négy időpont együttes eloszlása teljesen determinált, ha ismerjük a belőlük kiválasztható összes pár eloszlását. (Hiszen az egyes időpontok várható értékén túl csak a kovarianciamátrixra van szükségünk (e kettő teljeskörűen leír egy többdimenziós normális eloszlást), márpedig az páronként számolható.) Magyarán: többdimenziós normális eloszlásnál semmilyen „pluszt” nem jelent a kettőnél több elemű vetületek, illetve a kettőnél nagyobb momentumok ismerete. A fentiekből tehát világos, hogy az erős stacionaritás fogalma valóban erősebb: az erősebb stacionaritás implikálja a gyengét2 . A fordított irány általában nem áll fenn (tehát a két fogalom nem ekvivalens), de az előző bekezdés fényében világos, hogy speciálisan többdimenziós normális eloszlású idősorra (ún. Gauss-folyamat) igen, ott tehát e két fogalom egybeesik. A továbbiakban, ha nem mondunk mást, stacionaritás alatt gyenge stacionaritást fogunk érteni. 2 Ez alól az egyetlen kivételt az jelenti, ha az idősor eloszlása az egyes időpontokban olyan, hogy annak nem létezik első vagy második momentuma. (Például: Cauchy-eloszlású.) Az erős stacionaritás definíciója ebben az esetben is teljesen változatlanul alkalmazható, viszont a gyenge stacionaritás definíciója értelmetlenné válik, hiszen a nem is létező momentumokra fog hivatkozni.
20
2. FEJEZET. STACIONARITÁS A 2.2. ábra példát mutat egy stacioner idősorra: adott, biztosan stacioner sokasági speci-
fikációból3 szimulációval generáltunk három trajektóriát. Érdemes megfigyelni a stacionaritási követelmények „ránézésre” történő teljesülését: nem úgy tűnik, mintha a trajektóriáknak lenne trendjük és szintén nem tűnik úgy, mintha a szórás változna. (Az autokorrelációk időfüggését nyilván kevésbé lehet szabad szemmel megítélni.)
10
5
20
40
60
80
100
-5
-10 2.2. ábra. Példa stacionárius idősorra: három szimulált trajektória az Yt = 0,5+0,7·Yt−1 +ut , ut ∼ N (0, 3), beláthatóan stacionárius specifikációból
2.3. Stacionárius idősorok nevezetes jellemzőinek mintából történő becslése Ezen a ponton már világosan látható, hogy az 1.2. pontban bevezetett nevezetes jellemzőket (várható érték függvény, autokorreláció függvény stb.) miért csak a sokaságban definiáltuk: általános esetben a mintából történő becslésük reménytelen feladat (hiszen például mt becsléséhez egyetlen megfigyelésünk lenne. . . ). És itt válik érthetővé, hogy a stacionaritás miért volt fontos: ha ugyanis ezt elfogadjuk, akkor ezek a jellemzők máris becsülhetővé válnak! Ebben a pontban ezt a kérdéskört fogjuk áttekinteni. Ha egy idősor stacioner, úgy az előzőek alapján beszélhetünk az egyes komponenseinek közös 3 Ez a specifikáció egy ún. AR(1) folyamat, melyet később fogunk tárgyalni, itt most csak annyi fontos, hogy bizonyosan stacioner. Konkrét specifikációja: Yt = 0,5 + 0,7 · Yt−1 + ut , ut ∼ N (0, 3).
2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL
21
µ ≡ EYt várható értékéről. Ennek becslése minta alapján nyilván: µ b=
T 1X yt . T t=1
Érdemes megfigyelni, ahogy kihasználjuk a stacionaritást! Ha az idősor nem lenne stacioner, akkor a különböző időpontokhoz tartozó értékek nem lennének felhasználhatóak közös becsléshez (különösen, hogy közös várható érték nem is létezne), viszont ha a közös várható érték létezését a priori tudjuk, akkor annak megbecsléséhez ugyanúgy jó az első időpont értéke, a második időpont értéke és így tovább. Egyszerűbben szólva, e feltételezés fényében ezek ugyanúgy használhatóak várható érték becslésére, mint egy keresztmetszeti esetben – az idősor, ebből a szempontból, „összetolható”, a különböző időponthoz tartozó megfigyelések „összeönthetőek” (legalábbis a várható érték becsléséhez!). Ha egy idősor stacioner, úgy az előzőek alapján beszélhetünk az egyes komponenseinek közös 2
σ ≡ D2 Yt szórásnégyzetéről is. Ennek becslése minta alapján nyilván: T X c2 = 1 σ (yt − µ b) . T t=1
(Itt már kihasználtuk, hogy a gyenge stacionaritás miatt létezik közös várható érték.) Megjegyezzük, hogy ez a képlet csak akkor adna torzítatlan becslést σ 2 -re, ha a várható érték helyett annak µ sokasági értékét, és nem µ b mintából becsült értékét szerepeltettük volna. A fenti formában ez torzított becslést fog adni, igaz a torzítás az idősor hosszának növekedtével egyre kisebb lesz (teljesen analóg módon a keresztmetszeti szórásnégyzet-becsléssel), továbbá a becslő konzisztens is. Izgalmasabb a kovariancia/korreláció kérdése. Már utaltunk rá, hogy a különböző időpontok (mint az idősor egyes komponens valószínűségi változói) közötti kovarianciát autokovarianciának szokás nevezni. A gyenge stacionaritás tehát azt köti ki, hogy az Yt és Ys közötti autokovariancia kizárólag a k = s − t különbségtől (a késleltetéstől) függ, t-től és s-től konkrétan nem. Az várható érték és a szórásnégyzet jellemző általában egy egyváltozós függvény volt, de speciálisan stacioner esetben „nulla változóssá” (azaz: konstans számmá) alakulnak azáltal, hogy eltűnik az időfüggés. Az autokovariancia ezzel szemben általában kétváltozós függvény volt, így stacioner esetben is függvény lesz, igaz már csak egyváltozós. Erről szól a következő definíció: egy idősor (empirikus) autokovariancia függvényének nevezzük a γk = cov (Y1 , Y1+k ) kifejezést, mely láthatóan k függvénye. Megismételjük, hogy ez a definíció gyenge stacionaritás esetén jogos, hiszen ekkor cov (Y1 , Y1+k ) = cov (Y2 , Y2+k ) = . . . = cov (YT −k , YT ), így ezt joggal definálhatjuk a k késleltetéshez tartozó autokovarianciának. Az autokovariancia függvény becslése mintából: γ ck =
T −k 1 X (yt − µ b) (yt+k − µ b) . T − k t=1
22
2. FEJEZET. STACIONARITÁS
(A gyenge stacionaritás feltételezése miatt természetesen támaszkodhattunk arra, hogy létezik közös várható érték.) Itt is elmondható, hogy ez a képlet a fenti formában torzított becslés γk -ra (akkor lenne torzítatlan, ha µ b helyett a sokasági érték, µ szerepelne), viszont konzisztens; de ezekkel a kérdésekkel nem foglalkozunk tovább. Itt is kihasználtuk a stacionaritást: ez tette lehetővé, hogy például az 1 késleltetéshez tartozó autokorreláció becsléséhez ugyanúgy használjuk az első és második időpontbeli értékekből képezett párt, a második és harmadik időpontbeli értékekből képezett párt, és így tovább, egészen az utolsó előtti és utolsó időpontbeli értékekből képezett párig. Látható, hogy minél nagyobb késleltetésre vagyunk kíváncsiak, annál kevesebb párból kell becsülnünk – ez logikus is, 1 késleltetéshez az idősor hosszánál mindössze eggyel kevesebb pár található (első és másodiktól az utolsó előtti és utolsóig), T − 1 késleltetéshez viszont már csak egyetlen egy (a legelső és a legutolsó). Az autokovarianciának ugyanaz a baja, mint keresztmetszeti esetnél a kovarianciának: a számértéke önmagában keveset mond. Emiatt, szintén a keresztmetszeti esethez hasonlóan, be szokás vezetni az autokorreláció fogalmát, ami gyenge stacionaritás esetén nyilván ρk = σγk2 (kihasználtuk, hogy a szórás, épp a stacionaritás miatt, minden időpontban σ); mintából becsült értéke előállítható az eddigiek felhasználásával: ρ ck =
γ ck . c2 σ
Ezt a függvényt szokás (empirikus) autokorreláció-függvénynek (ACF, autocorrelation function) nevezni. (Emiatt néha ρk helyett az ACk megnevezést is használják.) Az ACF kézenfekvően ábrázolható grafikusan, ha a vízszintes tengelyen k lehetséges értékeit, a függőleges tengelyen pedig az e késleltetésekhez tartozó autokorrelációt ábrázoljuk. (ρ0 = 1 nyilván, ezért ezt nem szokás külön feltüntetni.) Ezt az ábrát, mely természetesen diszkrét függvény lesz, és így oszlopdiagrammal vagy hasonló módon jeleníthető meg, korrelogramnak szokás nevezni. A 2.3. ábra a 2.2. ábra kék színnel jelölt idősorának korrelogramját mutatja. Bár ábrázolni nem szokták, de általában az ACF-et negatív késleltetésekre is értelmezik. Először a stacionaritást, aztán a korreláció szimmetriáját használva adódik, hogy corr (Yt , Yt+k ) = corr (Yt−k , Yt ) = corr (Yt , Yt−k ) , azaz azt kaptuk, hogy ρk = ρ−k . (Szebben megfogalmazva: az ACF egy páros függvény.) Szintén szoktak beszélni egy idősor parciális autokorrelációs függvényéről (PACF, partial autocorrelation function). Emlékezhetünk rá, hogy a parciális autokorrelációt nem két változó, hanem két változó és változók egy halmaza között értelmezzük; tartalma: a két változó közti kapcsolat erőssége és iránya ha köztük a megadott változókon keresztül terjedő hatásokat kiszűrjük. (Ezúttal sem fontos, hogy ezt pontosan hogyan valósíthatjuk meg, mindenesetre megvalósíthatjuk. Itt természetesen csak lineáris hatásokról beszélünk.) A PACF-függvényt is két időpont
2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL
23
ACF for Y_t = 0,5 + 0,7 * Y_{t-1} + u_t +- 1,96/T^0,5
0,4 0,2 0 -0,2 -0,4 0
5
10
15
20
lag PACFszínű for Y_tidősorának = 0,5 + 0,7 * korrelogramja Y_{t-1} + u_t 2.3. ábra. A 2.2. ábra kék (ACF-függvénye) +- 1,96/T^0,5
0,4
között hogy mik a *kiszűrt A válasz kézenfekvő: a két ACF az, for Y_t = 0,5 + 0,7 Y_{t-1} változók. + u_t 0,2 számoljuk, a kérdés már csak időpont közötti időpontok (mint valószínűségi változók). Ennek megfelelően a 0 és 1 késlelte0 +- 1,96/T^0,5
0,4
téshez tartozó PACF szükségképp ugyanaz, mint a megfelelő ACF (azaz 1 és ρ1 rendre) hiszen -0,2 0,2
ilyenkor „nincs mit” kiszűrni. A PACF az ACF-hez hasonlóan becsülhető mintából, ezzel most -0,4
nem 0foglalkozunk. -0,2 A
0
5
10
15
20
2.4. ábra mutat egy parciális autokorrelációs (PACF) függvényt, ezúttal is a 2.2. ábra kék lag
-0,4 idősorának példáján. (Tehát ez, és az előző korrelogram összevethető, olyan értelemben, hogy
ugyanahhoz az idősorhoz tartoznak.) Érdemes 10 ellenőrizni előbbi megjegyzésünket arról,20hogy az 0 5 15 lag 1 késleltetéshez tartozó ACF és PACF megegyezik. PACF for Y_t = 0,5 + 0,7 * Y_{t-1} + u_t +- 1,96/T^0,5
0,4 0,2 0 -0,2 -0,4 0
5
10
15
20
lag
2.4. ábra. A 2.2. ábra kék színű idősorának parciális autokorrelációs (PACF) függvénye Végül még egy fontos kérdéskörről kell beszélnünk: az egyes korrelációk szignifikanciájáról. Mintából számolt értékek esetén (mint amilyen az empirikus autokorreláció és parciális autokorreláció) ugyanis soha nem tudhatjuk, hogy mi a valós (értsd: sokasági) értéke a jellemzőnek. A mintából számolt értékeket terheli a mintavételi ingadozás, azaz az a jelenség, hogy a mintából számolt jellemző értéke nem csak a sokasági jellemző értékétől függ, hanem attól is, hogy pont milyen mintát sikerült vennünk (még akkor is, ha a mintavétel tökéletes volt).
24
2. FEJEZET. STACIONARITÁS Hiába látjuk tehát például a 2.3. ábrán, hogy az idősor 1 késleltetéshez tartozó autokorrelá-
ciója mintegy ρ ck = 0,4, nem tudhatjuk, hogy az valójában (értsd: a sokaságban, a valószínűségi változókkal megadott elméleti idősorban) mennyi (a ρk ). Lehet, hogy 0,3, csak mi pont olyan mintát vettünk, amiben kicsit jobban korreláltak voltak az egymást követő elemek, lehet, hogy 0,5, csak mi pont olyan mintát vettünk, amiben kicsit kevésbé voltak korreláltak az egymást követő elemek, és persze az is lehet, hogy véletlenül épp 0,4. Erről nem tudunk biztos döntést hozni, csak valószínűségit: statisztikai próbát kell alkalmaznunk. A gyakorlatban legfontosabb kérdés, hogy elképzelhető-e, hogy egy adott késleltetéshez tartozó autokorreláció valódi (sokasági) értéke épp nulla (tehát, hogy nincs is azon a késleltetésen autokorreláció). A H0 : ρ k = 0 H1 : ρk 6= 0 hipotézispárra lehetséges statisztikai tesztet szerkeszteni. Egy közelítő (de nem túl kis mintaméretnél – azaz idősor-hosszúságnál – már elfogadható) megoldás a normális approximáció használata: az az észrevétel, hogy ha egy adott autokorreláció sokasági értéke ρk , akkor egy sokaságból vett mintán kiszámolt ρ ck eloszlása közelítőleg normális lesz ρk várható értékkel és T1 szórás k −ρ √ k ∼ N (0, 1). Ez alapján a négyzettel (azaz ρ ck ∼ N ρk , 1/T a mintavételi eloszlás), így ρc 1/ T tesztstatisztika és nulleloszlása (emlékezzünk rá, hogy a nullhipotézis feltételezése, hogy ρk = 0): ρ ck √ ∼ N (0, 1) . 1/ T Ha tehát α szignifikanciaszinten szeretnénk dönteni, akkor azt kell megvizsgálnunk, hogy a h i benne van-e a −z1−α/2 , +z1−α/2 intervallumban, avagy kívül esik ±z1−α/2 -n. Ugyanez h i másképp megfogalmazva: ρ ck benne van-e a −z1−α/2 √1T , +z1−α/2 √1T intervallumban, avagy ρ c k √ 1/ T
kívül esik ±z1−α/2 √1T -n. Ez utóbbi megfogalmazás előnye, hogy segíti az összehasonlíthatóságot: a korrelogramon minden további nélkül feltüntethetőek a ±z1−α/2 √1T határok, és mivel azokat a korrelogramon ábrázolt ρ ck -kal kell összevetni, így a hipotézis „vizuálisan” is megvizsgálható: ha egy oszlop kilóg a ±z1−α/2 √1T sávból, akkor az szignifikáns (értve ez alatt azt, hogy adott szignifikanciaszinten elvethető a nullhipotézis, miszerint az autokorreláció sokasági értéke nulla: akkora a mintából számolt érték eltérése a nullától, hogy nem hihető, hogy az csak a mintavételi ingadozásnak lenne betudható, arra kell gondolnunk, hogy a sokasági érték sem nulla), ha benne van ebben a sávban, akkor inszignifikáns (elfogadható adott szignifikanciaszinten, hogy az autokorreláció sokasági értéke nulla, és csak a mintavételi ingadozás miatt nem nullát kaptunk a mintából számolva). Nem túl meglepő módon pontosan ezek azok a sávok, amik a 2.3. és a 2.4. ábrákon kékkel behúzva láthatóak, amint a jobb felső sarokban lévő felirat is mutatja. (Ebből az is kiderül, hogy itt z1−α/2 = 1,96, tehát 5 %-os szignifikanciaszintre vonatkoznak.)
2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL
25
Egy további fontos kérdés van, amit ennek kapcsán meg kell beszélni. A fent vázolt módszer rendkívüli módon csábít arra, hogy végignézzük az oszlopokat, és ha bárhol kilógót látunk, akkor megörüljünk, hogy találtunk egy szignifikáns autokorrelációt. Ez azonban rendkívül félrevezető lehet, ugyanis tipikus példa a többszörös összehasonlítások helyzetére (multiple comparisons). Amikor ugyanis „végignézünk az ábrán”, akkor valójában mi – bár szinte tudattalan módon, implicite –, de hipotézisvizsgálatok sokaságát hajtjuk végre (egész pontosan annyit, ahány késleltetésre készült a korrelogram, a fenti példákban tehát 20-at). Ilyen esetben azonban nem tehetjük meg, hogy megnézzük, hogy van-e szignifikáns különbség, és ha igen, akkor kijelentjük, hogy találtunk szignifikáns autokorrelációt! Ennek az oka abban keresendő, hogy minden egyes hipotézisvizsgálatnak (külön-külön) van elsőfajú hibája. Ha például 5 %-on végeztük a hipotézisvizsgálatot, akkor az egyúttal azt is jelenti, hogy minden egyes teszt (külön-külön) 5 % valószínűséggel akkor is szignifikáns autokorrelációt jelez, ha az valójában nincsen. Ha két tesztet végzünk (például két késleltetést vizsgálunk meg), akkor annak a valószínűsége, hogy legalább az egyik szignifikáns autokorrelációt fog jelezni annak ellenére, hogy egyik késleltetésen sincs auto2
korreláció 1 − (1 − 0,05) = 0,0975, tehát 10 % – kishíján az eredeti szignifikanciaszint duplája! (Az egyszerűség kedvéért most feltételeztük, hogy a tesztek függetlenek.) Ez a jelenség az ún. α-infláció. 20 tesztnél ez a valószínűség már 64 %, tehát az lenne a meglepőbb, ha nem találnák egyetlen „szignifikáns eredményt” sem (miközben ugye azt feltételeztük, hogy valójában nincs ilyen!). Másként megfogalmazva azt is mondhatnánk, hogy 5 %-os szignifikanciaszinten döntve 20 tesztből várhatóan épp 1 a fals jelzések száma (tehát várhatóan 1 teszt fog még akkor is szignifikanciát jelezni, ha valójában mind a 20 esetben a nullhipotézis áll fenn). Emiatt nem tehetjük meg, hogy „kiragadunk” egy eredményt – ha 20 késleltetésből 1 szignifikáns, azt nem feltétlenül nevezhetjük találatnak, hiszen vegyük észre, hogy ez pont megfelel annak, amit akkor várhatunk, ha egyetlen késleltetésen sincs autokorreláció! (Persze éppenséggel ettől még lehet történetesen valódi szignifikancia is, ezt ne felejtsük el.) Éppen ezért, ha a kérdésfeltevésünk az, hogy az autokorreláció késleltetések egy egész csoportjára együttesen is nulla-e (tipikusan ez a csoport az első valahány autokorreláció, tehát azon ρt autokorrelációk melyre 1 ≤ t ≤ M ), akkor ennek eldöntésére nem az a helyes mód, ha a fenti tesztet minden késleltetésre megismételjük. Ehelyett külön tesztet kell szerkeszteni a H0 : ρ1 = ρ2 = . . . = ρM = 0 nullhipotézis ellenőrzésére. A legnépszerűbb erre4 az ún. Ljung–Box-teszt (vagy Ljung–Box Q); tesztstatisztikája és nulleloszlása: Q = T (T + 2)
M 2 X ρ ck H0 2 ∼ χM T −k
k=1
teszt elődje a Box–Pierce-teszt volt, melynek tesztstatisztikája és nulleloszlása: Q0 = T Jobb kismintás tulajdonságai miatt ezt szinte teljesen felváltotta a Ljung–Box-teszt. 4E
PM
k=1
H
2 ρ c ∼0 χ2M . k
26
2. FEJEZET. STACIONARITÁS Érdemes megfigyelni, hogy a tesztstatisztika annál nagyobb, minél nagyobbak az (empirikus)
autokorrelációk, ami a tesztet az elvetés irányába tolja (hiszen a χ2 -próbát mindig egyoldali, jobboldali kritikus tartománnyal hajtjuk végre) – ahogy az logikus is. Néha a tesztet úgy használják, mint az adatok függetlenségének próbája (egyfajta „véletlenség ellenőrzés”-ként). Szigorúan nézve ez helytelen, hiszen a Ljung–Box-próba autokorrelálatlanságot ellenőriz – márpedig abból általában nem következik a függetlenség. Valamennyi alapja azonban mégis van a dolognak, ha ugyanis tudjuk (vagy elfogadjuk) az adatok normalitását, akkor a függetlenség és a korrelálatlanság ekvivalenssé válik, így mondhatjuk, hogy a próba a függetlenséget ellenőrzi. Végezetül megjegyezzük, hogy a Ljung–Box Q használatával kapcsolatban megfogalmaztak elméleti aggályokat, ami miatt egyes szerzők ennek elvetését és más (LM-elvű) próbák használatát javasolják. Ezek a nézetek azonban mégsem terjedtek el annyira a gyakorlatban; a Ljung–Box Q-t szinte minden ökonometriai programcsomag tartalmazza.
2.4. A stacionaritás ellenőrzése Amint már említettük is, a később ismertetendő módszertan stacionárius idősorokat lesz képes modellezni; így az elsőként adódó kérdés, hogy egy idősorról hogyan lehet eldönteni, hogy stacioner-e. Erre többféle megoldás jöhet szóba, különböző előnyökkel és hátrányokkal – ebben a pontban ezeket fogjuk bemutatni.
2.4.1. Az idősor grafikus vizsgálata A legkézenfekvőbb lehetőség az idősor egyszerű – szintben történő – ábrázolása, és a grafikon szemrevételezése. Ha például olyan grafikont látunk, mint akármelyik az 1.2. ábrán, akkor joggal gondoljuk, hogy nem lehet stacioner: a görbének látható trendje van, ami megsérti a gyenge stacionaritás követelményeiből rögtön az elsőt, a várható érték állandóságát. (A piros görbéknél pedig még a szórás állandóságának a követelménye is sérülni látszik.) Ezzel kapcsolatban nagyon fontos megjegyezni, hogy ez nem egy „holtbiztos” módszer: hiába is látunk mondjuk egy folyamatosan növekvő idősort (realizációt), elvileg elképzelhető, hogy közben ugyanaz a várható érték (csak épp pont úgy jött ki a mintavétel, hogy időben előrehaladva véletlenül pont egyre nagyobb elemeket vettünk ki egy egyébként állandó várható értékű eloszlásból – elvileg legalábbis ez is elképzelhető!). Bár elég hosszú idősornál meglehetősen biztosra lehet menni (a fent leírt „pechnek” kicsi lesz a valószínűsége), de ettől még tény, hogy ez a módszer nem is formalizált, nem szolgáltat semmilyen eredményt a megállapítás bizonyosságára vonatkozóan.
2.5. STACIONARIZÁLÁS, TREND- ÉS DIFFERENCIASTACIONER IDŐSOROK
27
2.4.2. A korrelogram lecsengésének vizsgálata Stacioner idősorok esetén a korrelogram jellemzően lecsengő, ami alatt azt értjük, hogy egyre nagyobb késleltetésekre egyre inkább nulla közeliek az autokorrelációk. (Ennek oka jobban érthető lesz a 3. fejezet után.) Ezzel szemben, nemstacioner idősoroknál tipikus, hogy a korrelogram nem, vagy csak minimálisan lecsengő: nem egyszerűen nem tartanak nullához az autokorrelációk, de akár több tucat késleltetésre is 1-közeliek. Ennek oka jobban megérthető, ha megint csak az 1.2. ábrára gondolunk. Ha az idősornak folyamatosan növekvő trendje van, akkor hiába is veszünk egyre nagyobb lépésközt, a kovariancia csak nagyon lassan fog eltűnni (minél hosszabb az idősor, annál lassabban), hiszen a várhatóértéket – fals módon – az egész idősorból becsüljük, így azt fogjuk gondolni, hogy az valahol „középen” van. (És a kovarianciát csak azok a tagok fogják csökkenteni, melyeknél a lépésköz tartalmazza ezt a (rosszul) becsült várható értéket.) Erről a módszerről is elmondható, hogy nem ad sem egyértelmű eredményt, sem becslést az eredmény bizonytalanságára, így ez is csak amolyan „gyanújelként” kezelhető.
2.4.3. Statisztikai tesztek a stacionaritás vizsgálatára A stacionaritás vizsgálatára természetesen készítettek statisztikai próbákat is, melyek immár formális kezelését teszik lehetővé ennek a kérdésnek. A próbák pontos leírását, mechanizmusuk ismertetését későbbre kell halasztanunk, mert olyan eszközök szükségesek, melyeket csak az 5. fejezetben fogunk bevezetni. Addig is elmondjuk, hogy legismertebb erre vonatkozó próba az ún. Dickey–Fuller-teszt (DFteszt), illetve kiterjesztett változata, az augmented Dickey–Fuller-teszt (ADF-teszt). Fontos megjegyezni, hogy a nullhipotézisük elfogadása azt jelenti, hogy az idősor nem stacioner. A két próba között a különbség, hogy az ADF-teszt – kicsit több belső becslés árán – komplexebb eseteket is képes kezelni, így a gyakorlatban jellemzően inkább ezt használják. A precíz nullhipotézisük nem egészen az, hogy „az idősor nem stacioner”, de ennek a megtárgyalását ismét csak későbbre kell halasztanunk. Amellett, hogy e próbák nyilatkoznak a stacionaritásról (a fenti fenntartással), arra is használhatóak, hogy a következő pontban leírt eljárásokat is segítsék. Ezt ott fogjuk megtárgyalni.
2.5. Stacionarizálás, trendstacioner (TSP) és differenciastacioner (DSP) idősorok Amint mondtuk, az első feladat az, hogy egy idősorról eldöntsük, hogy stacioner-e. Ha a válasz pozitív, akkor máris alkalmazhatjuk a később bemutatandó modellezési eszköztárat. De mi van akkor, ha nem az, ha az idősorunk nem bizonyul stacionernek. . . ? A kérdés hatalmas gyakorlati jelentőségű, ugyanis a legtöbb közgazdasági idősor pont hogy nem stacioner: a legtöbb
28
2. FEJEZET. STACIONARITÁS
gyakorlati esetben a közgazdasági idősoroknak határozott hosszútávú trendje van. Erre mutat egy klasszikus példát a 2.5. ábra az Egyesült Államok nemzeti össztermékének kapcsán. Az USA reál GDP-jének alakulása, 1950-2000 10000 9000
Reál GDP [mrd USD]
8000 7000 6000 5000 4000 3000 2000 1000
1950
1960
1970
1980
1990
2000
Év
2.5. ábra. Az Egyesült Államok reál GDP-jének alakulása 1950 és 2000 között (milliárd USD-ban) A válasz az, hogy ekkor sincs minden veszve: léteznek bizonyos megoldások arra, hogy ezt a helyzetet kezeljük. Alkalmazhatunk transzformációkat, melyek révén van rá remény, hogy ezt a trendet kiszűrjük és ilyen módon a nemstacioner (emiatt számunkra most nem modellezhető) idősorból stacioner, modellezhető idősort nyerjünk. Mi most a két, gyakorlatban legfontosabb ilyen eljárást fogjuk bemutatni. Már most mondjuk, hogy garancia nincs rá, hogy ezek célt érnek – ám a tapasztalat azt mutatja, hogy a közgazdasági idősorok túlnyomó többségénél megoldhatjuk a nemstacionaritás problémáját a kettő közül alkalmazásával. A trend kiszűrésére szolgáló két módszer abban tér el, hogy mit feltételeznek az idősor mögötti, annak stacionaritását elrontó trend jellegéről. A feltételezések tökéletes összhangban vannak az 1.4. pontban bemutatott két alapesettel: a sztochasztikus és a determinisztikus trenddel. A következőkben ezeket fogjuk bemutatni
2.5.1. Trendstacioner idősorok (TSP) Amennyiben azt feltételezzük, hogy az idősor mögött egy determinisztikus trend van, akkor annak eltávolítása kézenfekvő: megbecsüljük a paramétereit, és egész egyszerűen kivonjuk az idősorból. Tegyük fel például, hogy idősorunk az Yt = α + βt + Xt
2.5. STACIONARIZÁLÁS, TREND- ÉS DIFFERENCIASTACIONER IDŐSOROK
29
alakban adott, ahol Xt egy stacioner idősor. Jól látható, hogy ekkor Yt nem lesz stacioner (várható érték függvénye mt = α + βt + EXt , ami semmiképp nem lehet t-től független). Igen ám, de ha felismerjük, hogy itt valójában arról van szó, hogy egy determinisztikus trend „rontotta el” a stacionaritást (ami ugye Xt -ben még megvolt), akkor attól könnyen megszabadulhatunk: megbecsüljük α-t és β-t valamilyen alkalmas módszerrel, majd képezzük az b Yt0 = Yt − α b + βt transzformált idősort. Ha helyes volt a kiindulási feltevésünk, akkor ezzel a módszerrel, a determinisztikus trend kiszűrésével (kivonásával) egy stacioner idősort nyerünk! Azaz, megvalósítottuk célunkat, stacionarizáltuk az idősort. Természetesen nem muszáj ragaszkodni a fenti, lineáris specifikációhoz – bármilyen általunk megadott determinisztikus trend kiszűrhető. A gyakorlatban sokszor t-ben polinomiális trendeket használnak, ezen belül is általában a fenti lineáris trendet, vagy a kvadratikus trendet: Yt = α + βt + γt2 + Xt . Például a 2.5. bemutatott idősor igen jól közelíthető egy kvadratikus trenddel, amint azt a 2.6. ábra is mutatja, amin ábrázoltuk a regressziós eszközökkel megbecsült α b, βb és γ b együtthatókkal kapható trendet. Az USA reál GDP-jének alakulása, 1950-2000 10000 9000
Kvadratikus trend Reál GDP
Reál GDP [mrd USD]
8000 7000 6000 5000 4000 3000 2000 1000
1950
1960
1970
1980
1990
2000
Év
2.6. ábra. Az Egyesült Államok reál GDP-jének alakulása 1950 és 2000 között (milliárd USDban), rajta a rá legjobban illeszkedő (determinisztikus) kvadratikus trenddel Innen kezdve ez a trend egyetlen kivonással kiszűrhető, így kapjuk a 2.7. ábrán látható transz-
30
2. FEJEZET. STACIONARITÁS
formált idősort. Az USA kvadratikus trendttől tisztított reál GDP-jének alakulása, 1950-2000 Kvadratikus trendtől tisztított reál GDP [mrd USD]
500 400 300 200 100 0 -100 -200 -300 -400
1950
1960
1970
1980
1990
2000
Év
2.7. ábra. Az Egyesült Államok reál GDP-jének alakulása 1950 és 2000 között (milliárd USDban), miután kiszűrtük belőle a kvadratikus trendet Érzékelhető, hogy stacionaritás feltevése sokkal inkább hihető az új idősoron – bár ennyiből önmagában még nem tudható, hogy ezzel valóban elértük-e a célunkat; ehhez a transzformált idősor precíz vizsgálatára (lásd a 2.4. pontot) van szükség. Amennyiben egy idősor önmagában nem stacioner, de valamilyen determinisztikus trend kiszűrése után az lesz, akkor azt mondjuk, hogy az idősor egy trendstacioner folyamat (TSP, trendstationary process).
2.5.2. Differenciastacioner idősorok (DSP) A másik alapvető trend-fogalmunk a sztochasztikus trend. Az, hogy ezt hogyan lehet kiszűrni egy idősorból már nem annyira triviális, mint a determinisztikus trend esetén. Az ugyanis szinte ránézésre látható, hogy (D)
Yt
= αt + Xt
esetén αt egyszerű kivonása a célravezető (ha Xt egy önmagában stacioner idősor), de vajon mi a helyzet (S)
Yt
(S)
= α + Yt−1 + Xt ,
Y0 = 0
esetében? A válasz az, hogy egy differenciázásnak nevezett trükkel kell élnünk: egy olyan új, transzformált idősort kell képeznünk, melyben a t-edik elem az eredeti idősor t-edik és (t − 1)-edik
2.5. STACIONARIZÁLÁS, TREND- ÉS DIFFERENCIASTACIONER IDŐSOROK
31
időpontbeli értékének a különbsége lesz. Ennek pontos neve: első, vagy elsőrendbeli differenciázás. (Világos, hogy ez az idősor az eredetinél eggyel rövidebb lesz.) Precízen: legyen (S)
Yt0 = Yt
(S)
− Yt−1 .
Innen már rögtön látható, hogy ez miért lehet jó a stacionarizáláshoz: ha valóban teljesül a fenti specifikációnk, akkor ezzel a transzformációval épp Xt -t, tehát egy stacioner folyamatot fogunk kapni. Folytatva példánkat, az Egyesült Államok reál GDP-jének első differenciázottját a 2.8. ábra mutatja. Az USA elsőrendben differenciázott reál GDP-jének alakulása, 1950-2000
Elsőrendben differenciázott reál GDP [mrd USD]
200 150 100 50 0 -50 -100 -150
1950
1960
1970
1980
1990
2000
Év
2.8. ábra. Az Egyesült Államok elsőrendben differenciázott reál GDP-jének alakulása 1950 és 2000 között (milliárd USD-ban) Rögtön látszik, hogy a stacionaritás feltevése sokkal inkább hihető erről, de itt is elmondható, hogy ezt még precízen is igazolnunk kell (2.4. pont) ahhoz, hogy kijelenthessük, hogy ilyen módon stacionarizáltuk az idősort. A módszer a nevét onnan kapta, hogy az eljárás ekvivalens a szokásos deriválással (differenciálással) – csak épp diszkrét időben. A differenciázott idősor az eredeti idősor egyes elemei közötti különbségeket tartalmazza; ez az oka annak, hogy ha kifejezetten utalni kivánunk arra, hogy egy idősorról differenciázás nélkül beszélünk (tehát az „eredeti” idősorról van szó), akkor néha azt mondjuk, hogy az idősort szintben vizsgáljuk. Világos, hogy a differenciázott idősorból – az első elem ismeretében – probléma nélkül rekonstruálható az eredeti idősor: egy adott elemének előállításához összeadjuk az összes előtte lévő
32
2. FEJEZET. STACIONARITÁS
különbséget (és ehhez hozzáadjuk a legelső tagot). Érdemes megfigyelni, hogy ez az összeszummázás természetesen a diszkrét idejű integrálás lesz, ami valóban, „visszacsinálja” a – diszkrét idejű – deriválást. Látható, hogy ezzel a módszerrel lineáris trendet tüntethetünk el (csak épp sztochasztikus értelmű lineáris trendet, nem determinisztikus értelműt). De mi van akkor, ha kvadratikus trendet kéne (sztochasztikus értelemben) eltüntetnünk? Determinisztikus trendnél egyszerűen bevettük a második hatványt is, de mi a teendő sztochasztikus esetben? Ha a differenciázásra mint diszkrét deriválásra gondolunk, akkor a válasz nem meglepő: folytonos halmazon a deriválás valóban eltünteti az x függvényből a „trendet”, az x2 függvényből viszont a kétszeri deriválás fogja „eltüntetni a trendet”. Ennek megfelelően a kvadratikus trend sztochasztikus értelmű szűrése sem más, mint egy idősor kétszer egymás után történő (precíz kifejezéssel másodrendű) differenciázása. Az Egyesült Államok reál GDP-jének másodrendű differenciázottját a 2.9. ábra mutatja. Az USA másodrendben differenciázott reál GDP-je 1950-2000 Másodrendben differenciázott reál GDP [mrd USD]
200 150 100 50 0 -50 -100 -150
1950
1960
1970
1980
1990
2000
Év
2.9. ábra. Az Egyesült Államok másodrendben differenciázott reál GDP-jének alakulása 1950 és 2000 között (milliárd USD-ban) Természetesen itt is elmondható, hogy a stacionaritást meg kell vizsgálni (2.4. pont) az eredményül kapott idősoron. Amennyiben egy idősor önmagában nem stacioner, de valamilyen rendű differenciázás után azzá válik, akkor azt mondjuk, hogy az idősor egy differenciastacioner folyamat (DSP, differencestationary process). Itt még egy szóhasználat szokásos: ha az idősor önmagában nem stacioner, továbbá az elsőrendű, másodrendű, . . . , (d − 1)-ed rendű differenciázottja sem stacioner, de a d-ed rendű differenciázottja már igen, akkor azt mondjuk, hogy az idősor d-ed rendben integrált idősor (jelben: I (d)). Speciálisan egy stacioner idősort nevezhetünk I (0) idősornak. (A diszkrét
2.5. STACIONARIZÁLÁS, TREND- ÉS DIFFERENCIASTACIONER IDŐSOROK
33
idejű deriválásra és integrálásra vonatkozó megjegyzésünk fényében érthető, hogy az „integrált idősor” elnevezés honnan jön.) A fentiekben láttuk, hogy az – esetleg többszöri – differenciázással polinomiális (tipikusan: lineáris és kvadratikus) trendeket tudunk eltávolítani. Ahogy a determinisztikus trend szűrésénél, így itt sem vagyunk csak erre korlátozva.
34
2. FEJEZET. STACIONARITÁS
3. fejezet
Nevezetes idősormodellek Nevezetes idősormodellek.
35
36
3. FEJEZET. NEVEZETES IDŐSORMODELLEK
4. fejezet
A Box–Jenkins-eljárás A Box–Jenkins-eljárás.
37
38
4. FEJEZET. A BOX–JENKINS-ELJÁRÁS
5. fejezet
ARIMA-modellek haladó megfogalmazása ARIMA-modellek haladó megfogalmazása.
39
40
5. FEJEZET. ARIMA-MODELLEK HALADÓ MEGFOGALMAZÁSA
6. fejezet
ARIMA-modellek becslése ARIMA-modellek becslése.
41