Közgazdasági idősorok elemzése X-11/12 ARIMA eljárással
1. Az idősor-elemzés menete Az idősor-elemzés célja, hogy a közgazdasági tartalmú idősor hosszú távú és rövid távú viselkedését egyértelmű módon szétválassza, és ezzel azok várható alakulásának rövid és hosszú távú összetevőire, illetve azok kompozíciójára megbízható előrejelzéseket tegyen. Az éven belüli ingadozások elkülönített és a hátramaradó kiigazított adatok idősorát a következő eljárás eredményezi. A idősor-elemzés arra a feltevésre alapozódik, hogy bármely közgazdasági tartalmú idősort három komponensre lehet bontani. Ezek: •
trend-ciklus = C,
•
szezonális = S,
•
irreguláris = I
összetevők. Miután az eredeti idősor fenti komponensekre való bontása megtörténik, az S szezonális komponenst eltávolítjuk, és a hátramaradó C trend-ciklus és I irreguláris komponensek együttesen a szezonálisan kiigazított idősort definiálják. A trend és a ciklus hasonló viselkedésű, és az idősor-elemzés során egybevontan kezelik őket. A trend az idősor hosszú távú viselkedését írja le. Például a népességszám növekedése a foglalkoztatottsági adatokban hosszú távú növekedést okozhat. A foglalkoztatottak számának ezen hosszú távú (évtizedes skálájú) növekedését a trend komponenssel lehet megragadni. A ciklus is hosszú távú, de rövidebb, mint a trend, általában 2-5 év hosszúságú. Leginkább üzleti ciklusként lehet értelmezni. A növekedő mozgásokat ezen ciklusokon belül bővülésnek, a csökkenéseket pedig recessziónak hívják. Példa: Bár a népességszám növekedése hosszú távon a foglalkoztatottak számának bővüléséhez vezethet, a keresletben mutatkozó rövid távú ingadozások rövid távon a foglalkoztatottak számának növekedését és csökkenését is kiválthatják. Ezeket a rövid távú ingadozásokat a ciklus komponens segítségével lehet megragadni. A szezonális komponens hivatott az idősor éven belüli ismétlődő fel-le mozgásait megragadni, amely mozgások kiváltói évenként ismétlődő események. Tehát ezt az alakot az különbözteti meg a ciklikus események hatásától, hogy minden évben ismétlődve jelentkezik. Példa: A téli hónapokban az építőipar foglalkoztatottsági adatai lecsökkennek, míg a melegebb hónapokban újra megemelkednek. Ezt az éves szintű ingadozást írja le a szezonális komponens. E komponens elemeinek az X-11/12 ARIMA eljárással készített becsléseit hívják szezonális faktoroknak. A szezonális faktorokat alkalmazva az eredeti idősor elemeire, kapjuk a szezonálisan kiigazított adatokat (multiplikatív modell esetén a szezonális faktor alkalmazása osztást jelent, additív modell esetén pedig kivonást). Váratlan vagy nem szokványos események okozta véletlenszerű ingadozásokat az irreguláris elnevezésű komponenssel lehet megragadni. Például a természeti katasztrófák (árvíz, földrengés stb.), sztrájkok és minden más nem szezonális és nem trend/ciklus típusú események úgy tekinthetők, mint amelyek véletlenszerűen lépnek fel, és így előre nem várt ingadozásokat okozhatnak a gazdasági adatokban. Az irreguláris komponens ezeket a nem várt ingadozásokat hivatott leírni. 1
Illusztrációként gondoljunk egy üzleti ciklusokat mutató gazdaság foglalkoztatási adataira. Ekkor: •
A C trend-ciklus komponens szerint a foglalkoztatottság adatai először lassan növekednek, majd csúcsot érnek el és aztán elkezdenek csökkeni, egy mélypont után pedig újra növekedésnek indulnak és így tovább.
•
Az S szezonális komponens szerint a foglalkoztatottsági adatok az év második és harmadik negyedévében növekednek, míg a maradék hat hónapban csökkennek. Mivel ez a növekedés és csökkenés minden év ugyanazon szakaszában ismétli magát, ezért az illusztráció megfelel a szezonális komponens definíciójának.
•
Az I irreguláris komponens nem mutat egyértelműen felismerhető alakot. összetevőről csupán a következő két információval rendelkezünk:
értékének algebrai előjelét vagy nagyságát sohasem tudjuk előre jelezni, mivel váratlanul és véletlenszerűen változik;
értékeinek hosszú távú átlaga közelítőleg zérus.
Erről az
Ha tökéletes információval rendelkeznénk a vizsgált idősorról, amely lehetővé tenné számunkra annak elemzését és komponensekre való bontását, akkor az összetevőket pontosan meg lehetne határozni. A valóságban azonban a legtöbb amit megtehetünk, hogy az idősor-elemzésre támaszkodva mindegyik komponens értékét megbecsüljük. Az elmondottakból látható, hogy az idősor-elemzéssel kapott adat egy szezonálisan kiigazított adatnak nincs "igazi" értéke.
becslés: például
2. Idősorok komponensekre bontása X-11/12 ARIMA eljárással Az X-11/12 ARIMA eljárás egy eszköz, amely segítségével az idősorok három komponensének becslése előállítható. Ez az eljárás lehetővé teszi az egyes komponensek becslését az idősor hisztorikus adatainak segítségével. Ha például a historikus gazdasági adatok szabályos, előre jelezhető szezonális viselkedést mutatnak, akkor az ebben rejlő információ használható a jövőbeni szezonalitás előrejelzésére. A szezonális ingadozásokat az idősor S szezonális komponense testesíti meg. Ha az elemzés célja például a szezonálisan kiigazított adatok előállítása, akkor az idősor-elemzés során ezt az S komponenst kell eltávolítani az idősorból. Az S komponens azonosítása érdekében valahogy azt el kell különíteni a többi összetevőtől. Ez oly módon történik, hogy először eltávolítjuk a trend-ciklus komponenst, ezután pedig az irreguláris komponenst. Mivel csupán három komponens van, így a C és I komponensek eltávolítása után az S szezonális komponensnek kell hátramaradnia. Az S komponens különválasztásának eljárása elsősorban mozgóátlag képzésével történő simítási folyamatra alapozódik. A kvantitatív megközelítés során az idősort felépítő három komponens kapcsolata lehet multiplikatív vagy additív (vagy log-additív). Ha O jelöli az eredeti idősort, akkor a multiplikatív esetben:
O= C× S× I, és a szezonálisan kiigazított idősort ekkor az O vagy C× I S
alak szolgáltatja. Ebben az esetben az S szezonális komponensnek az O eredeti idősorra vonatkozó hatása arányos a C× I nem szezonális komponens nagyságával. 2
Additív esetben: O=CS I , és a szezonálisan kiigazított idősort az O−S vagy C I alak szolgáltatja. Ebben az esetben az S szezonális komponensnek az eredeti idősorra vonatkozó hatása független a C trend-ciklus komponenstől, a szezonális komponens a C-től független értéket vesz fel minden hónapban. Multiplikatív modell esetén az S szezonális komponenst a C× I trend-ciklus-irreguláris komponens százalékában lehet kifejezni. Míg az additív modell esetében a szezonális komponens rögzített nagysággal való növekedést vagy csökkenést idéz elő egy adott hónapban, addig a multiplikatív modellben ez a hatás rögzített százalékkal való szorzásban testesül meg. A idősor-elemzést a gyakorlatban végrehajtó X-11 ARIMA eljárás számítógépes programként áll rendelkezésre, amelyet Észak-Amerikában a szezonálisan kiigazított hivatalos (publikált) gazdasági adatsorok előállítására használnak. Ez a program a korábban használt X-11 eljárás ARIMA modellekkel való kibővítésének tekinthető, amely modellek hozzáadásával a friss adatok idősorelemzése javítható. Ezt a javított módszert és a hozzátartozó szoftvert a kanadai Statisztikai Intézetben fejlesztették ki Estela Bee Dagum vezetésével. A programon belül az X-11 programrész az, amely komponensekre bontja az adatokat. Az X-11 eljárás az idősor-elemzés egy olyan simító módszere, amelyet az USA Népszámlálási Hivatalában (U.S. Census Bureau) fejlesztett ki Shiskin, Young és Musgrave. Technikailag ez a módszer mozgóátlagképzések egy sorozatát használja a komponensek szétválasztására. Az ARIMA (Auto Regressive Integrated Moving Average) modellt az eljárás során arra használják, hogy az X-11 eljárás végrehajtása előtt az eredeti idősor időbeli alakulását előre jelezzék. Ez az előrejelzés csökkenti az aszimmetrikus alakú mozgóátlagok alkalmazásának igényét, és így például segít csökkenteni a szezonálisan kiigazított adatok jövőbeni módosításának lehetséges mértékét. Technikailag egy ARIMA modell egy olyan matematikai modell, amely arra a feltevésre alapozódik, hogy a vizsgált változó jelenlegi értéke múltbeli értékeinek véges súlyozott összegeként állítható elő, kibővítve jelenlegi és múltbeli zavarok (fehér zaj) hozzáadásával. Az X-11 ARIMA program segítségével a szezonális összetevőt és a adatokat hat fő lépésben kapjuk. Ezek a következők:
szezonálisan kiigazított
1. A szezonálisan kiigazítatlan adatok bevitele a rendszerbe (input). 2. Ha az eredeti idősor alakja igényli, előzetes kiigazítások végrehajtása. Ezt az előzetes kiigazító faktorok segítségével lehet végrehajtani. Ezeket a faktorokat a gazdasági idősorokon ismert, nem ciklikus események okozta hatások eltávolítására használják. Tehát az előzetes kiigazító faktorok alkalmazásával olyan idősor adódik, amely akkor volna várható, ha nem következtek volna be ezek a nem ciklikus események. Az előzetes kiigazítást röviden sztrájkkiigazításnak is nevezik, mivel az előzetes kiigazítások egy jellegzetes okát a sztrájkok adják. 3. Az első két lépésben adódott idősor ARIMA modelljének kiválasztása és segítségével az idősor alakulásának előrejelzése. Ha az idősor hossza szükségessé teszi, akkor időben visszafelé is végre kell hajtani a továbbvezetést (backcasting).
3
4. A program X-11 részével a komponensekre való szétválasztás végrehajtása. Mint mondottuk, ez az eljárás mozgóátlag-képzéssel és ezek különböző típusainak egymás utáni alkalmazásával izolálja az idősor szezonális komponensét és távolítja el a fent említett módok valamelyikével. A mozgóátlag simítja az idősort, azaz eltávolítja belőle a rövid távú ingadozásokat. Az eredményül kapott idősor simább az eredetinél abban az értelemben, hogy a hónapról hónapra való változás összességében kisebbé válik. A mozgóátlag a lineáris simítási eljárások egy típusa, amely az idősor adott tagját ennek a tagnak és a környezetében lévő tagok súlyozott átlagával helyettesíti. A súlyozott átlag a számtani közép olyan módon való változtatása, hogy az átlagképzésben részt vevő tagok együtthatói változó értékeket vehetnek fel azzal a megkötéssel, hogy az összegük továbbra is az egység. Tehát egy számtani közép súlyozott átlag, de egy súlyozott átlag nem feltétlenül számtani közép. A szimmetrikus mozgóátlag az adott elem mindkét oldaláról ugyanannyi elemet von be az átlagképzésbe. Ezzel szemben az aszimmetrikus mozgóátlag valamelyik oldalról kevesebb elemet von be. Értelemszerűen ilyeneket kell alkalmazni közeledve az idősor valamelyik végéhez. Az X-11 a C trend-ciklus komponens becslésére Henderson-típusú mozgóátlagot használ. Ez a mozgóátlag technikailag abból a minimumelvből adódik, hogy a simított idősor harmadik differenciái négyzetösszege minimális legyen. 5. Az X-11 statisztikai táblákat szolgáltat az eljárás eredményének kiértékelésére. Ezekben a táblákban statisztikai tesztek eredménye jelenik meg. Az ún. F-teszttel a szezonalitás két lényeges típusát lehet szétválasztani. A mozgó szezonalitásra vonatkozó F-teszt arra hivatott, hogy meghatározza létezik-e mozgószezonalitás a vizsgált idősorban. Ez olyan típusú szezonális viselkedést jelöl, amely hónapról hónapra fejlődő vagy változó nagyságú hatásban testesül meg. A mozgó szezonalitásban rejlő stabilitáshiány nehézzé teszi alakulásának előrejelzését. Például, ha a karácsony véletlenszerűen különböző hónapokra esne, akkor a kiskereskedelmi forgalmi adatok nagymértékű mozgó szezonalitást mutatnának, amelynek alakulását lehetetlen lenne előre jelezni, és így az idősor-elemzés végrehajthatatlan lenne ebben az esetben. A gyakorlatban mozgó szezonalitást az építőipar vagy olyan iparágak mutatóiban lehet észlelni, amelyekben a csúcsszezon kezdete és zárása az időjárás alakulásának függvénye. Technikailag a mozgó szezonalitást vizsgáló F-teszt azt ellenőrzi, hogy a trend-ciklus összetevő eltávolítása után hátramaradó idősor (az SI hányad) teljes hónapról hónapra való változásának szignifikáns hányada köszönhető-e mozgó szezonalitásnak. A stabil szezonalitás kimutatására vonatkozó F-teszt arra hivatott, hogy ellenőrizze: az idősorban létezik-e stabil szezonalitás. Ez olyan típusú szezonalitás, amely mindig ugyanabban a hónapban ismétli magát évről évre. Ez az ismétlődés vagy stabilitás szemben a mozgó szezonalitással megkönnyíti a szezonalitás alakulásának előrejelzését. Technikailag a stabil szezonalitást vizsgáló F-teszt azt ellenőrzi, hogy a trend-ciklus összetevő eltávolítása után hátramaradó idősor (az SI hányad) teljes hónapról hónapra való változásának szignifikáns hányada köszönhető-e stabil szezonalitásnak. 6. Ebben a lépésben az elemző a program által szolgáltatott statisztikai táblák átvizsgálásával dönt arról, hogy az eredményül kapott szezonális összetevő és szezonálisan kiigazított idősor kielégíti-e vagy sem a statisztikai próbákat, van-e szükség további eljárásra vagy sem. Ebben a munkájában az elemzőt ellenőrző lista segíti, amit a program futtatása során kapott eredmény (output) segítségével tölthet ki. 4
Az ellenőrző listán fel van tüntetve az eredményesség eldöntéséhez szükséges küszöbszám is mindegyik statisztikai teszt vonatkozásában. Az eredménytelen futtatások, az ún. problematikus idősorok főbb esetei a következők: •
Azok az idősorok, amelyek nem vagy csak kis mértékű szezonalitást mutatnak.
•
Azok az idősorok, amelyek mozgószezonalitást mutatnak.
•
Azok az idősorok, amelyek túl nagy irreguláris összetevővel rendelkeznek.
•
Azok az idősorok, amelyek nagy kiugrást tartalmaznak, például olyat, amelyet sztrájk okozhat.
3. Az idősor-elemzés menetének illusztrálása Most kvantitatív alakban is illusztráljuk az idősor-elemzés menetének fő lépéseit. Az idősor-elemzés során a komponensek meghatározására alkalmazzák a mozgóátlag képzésének módszerét. Ez egy olyan eljárás, amely megfigyelt értékek idősorából kiválaszt rögzített számú egymást követő elemet, ezek átlagát képezi, és időperiódusonként előre mozogva egy újabb megfigyelt értéket hozzávesz az átlagképzéshez, miközben egy elemet a kiválasztott elemek végéről elhagy. Az 1. táblázat egy három elemű mozgóátlaggal kisimított idősorra mutat példát. Maga az idősor-elemzés eljárása, azaz a szezonális komponens meghatározása és eltávolítása az idősorból tartalmilag négy fő lépésben történik. Ezt egy multiplikatív alakkal közelített havi periodicitású idősorra mutatjuk be. 1. lépés Egy 12 tagú mozgóátlag-képzéssel (simítással) eltávolítják az eredeti idősorból a szezonális és irreguláris komponenseket (az idősor adott tagját időben előtte és mögötte lévő, összességében egy éves hosszúságú adatsor átlagával helyettesítik). Azaz
Ct =
1 ( zt − 5 + z t− 4 + + z t + z t+ 1+ + zt + 6 ) , 12
(3.1)
ahol zt jelöli az eredeti idősort. 1. táblázat Mozgóátlagképzés Hónap Január Február Március Április Május Június Július Augusztus Szeptember Október November December
Munkanélküliségi hányad (%) 5,0 5,2 5,1 5,3 5,5 6.5 6,5 5,7 5,2 5,8 6,0 6,8
5
Mozgóátlag
5,1 = (5,0+5,2+5,1)/3 5,2 = (5,2+5,1+5,3)/3 5,3 = (5,1+5,3+5,5)/3 5,8 = (5,3+5,5+6,5)/3 6,2 = (5,5+6,5+6,5)/3 6,2 = (6,5+6,5+5,7)/3 5,8 = . . . 5,6 = . . . 5,7 = . . . 5,9 = . . .
2. lépés Ebben a lépésben a trend-ciklus komponenst távolítják el az eredeti idősorból, amivel hátramarad a szezonális és irreguláris komponensekből álló sor becslése. Azaz képzik a következő hányadost:
zt (C × S × I ) t = = (S × I )t . Ct Ct
(3.2)
3. lépés Ebben a lépésben az előző lépésben levezetett ( S × I ) t idősorból eltávolítják az irreguláris komponenst egy 5 tagú mozgóátlagképzéssel. Az adott hónaphoz tartozó átlagot a megelőző és az utána következő két év ugyanazon hónapjához tartozó értékek átlagolásával kapják. Például:
S 90 jan. =
(
)
1 ( S × I )88 jan. + ( S × I ) 89 jan. + ( S × I ) 90 jan . + ( S × I ) 91 jan. + ( S × I ) 92 jan. . 5
(3.3)
Általános formában pedig:
St =
1 ( ( S × I ) t− 24 + ( S × I ) t − 12 + ( S × I ) t + ( S × I ) t + 12 + ( S × I ) t + 24 ) . 5
(3.4)
4. lépés Ebben a lépésben kapják meg a szezonálisan kiigazított idősort azzal, hogy a szezonális komponenst eltávolítják az eredeti idősorból. Azaz a (3.4) segítségével képzik a következő hányadot:
z t (C × S × I ) t = = (C × I ) t . St St
(3.5)
A négylépéses eljárásból látható, hogy alkalmazásának feltétele legalább négyéves hosszúságú idősorok léte és legalább kétéves hosszúságú előrejelzés készítése az adott idősor várható alakulására, hogy az aktuális érték fent ismertetett változatú idősor-elemzését elvégezhessük. Ellenkező esetben az idősor elején és végén lévő pontok komponensekre bontása az ismertetett módon nem végezhető el. Az X-11 ARIMA-ban havi gyakoriságú adatok esetén az automatikus opcióban csupán egyéves hosszúságú előrejelzést készítenek, és az idősor végéhez és elejéhez közeledve aszimmetrikus mozgóátlagképzéssel hajtják végre a komponensekre bontást.
4. Az X-11 ARIMA lehetőségeit továbbfejlesztő X-12 ARIMA Jelenleg az X-11 ARIMA módszer olyan továbbfejlesztése áll befejezés előtt és tesztelés alatt, amely a vizsgált idősor extrapolációjához továbbra is csupán az ARIMA modellosztályból választ, viszont a diagnosztika területén és az idősor szezonális kiigazításra való felkészítése területén jelentős előrelépéseket tartalmaz. Ez a programrendszer az USA Népszámlálási Hivatalában D. F. Findley és munkatársai által kidolgozott módszerekre alapuló és általuk fejlesztett X-12 ARIMA. Az X-11 ARIMA-hoz képesti két említett ponton való továbblépését a következő két alpontban foglaljuk össze.
6
4.1.
Új diagnosztika: Csúsztatott intervallum analízis
Findley és munkatársai az X-12 ARIMA kifejlesztése során törekednek az elmúlt évtized új kutatási eredményeinek a programba való beillesztésére. Ehhez felhasználják Cleveland és munkatársai által kifejlesztett STL programot is [28], kiemelve annak következő négy előnyös tulajdonságát. •
Az STL eljárás tetszőleges periodicitású szezonalitásra alkalmazható: napira, hetire, két hetire, havira, negyedévesre stb.
•
A trend-szűrő hosszának kiválasztására olyan összefüggést alkalmaz, amelyet a stacionárius adatokra alkalmazott szimmetrikus szűrők frekvenciatartomány-analízisén keresztül vezettek le. Ez helyettesítheti az empirikusan levezetett döntési szabályokat.
•
Az STL robusztus eljárása jobb lehet az X-11 eljárásánál, amely függ az irreguláris összetevő folyamatosan finomított, de nem belső módon megerősített variancia becsléseitől.
•
Mivel a program az X-11-gyel ellentétben (nem dokumentált) FORTRAN szubrutinok együtteseként terjesztett, ezért a felhasználó számára szokásos eljárási formát ki lehet hozzá alakítani.
Findley és munkatársai miközben felhívják a figyelmet az STL eljárással kapcsolatos előnytelen tapasztalataikra is [29] az X-12 ARIMA-ban az STL eljáráshoz képest két bővítést hajtanak végre: a program ARIMA és regressziós modellezésre is képes és új diagnosztikai eljárást tartalmaz. Az utóbbi ismertetése előtt bemutatjuk az X-11-ARIMA eljárás által a szezonális kiigazítás minőségének leírására használt M1−M11 statisztikai mutatókat és a belőlük számított Q-statisztikai mutatót [39]. Az M1−M11 mutató rendre a következőket méri [1, 39]. M1:
Az irreguláris összetevő relatív hozzájárulását méri az idősor összetevők három hónapra vonatkoztatott együttes varianciájához.
M2:
Az irreguláris összetevő relatív hozzájárulását méri az idősor stationárius összetevőjének varianciájához.
M3:
Az irreguláris összetevő hónapról hónapra való változásának nagyságát méri a trend-ciklus összetevő hónapról hónapra való változásához viszonyítva.
M4:
Az irreguláris összetevő autokorrelációjának nagyságát méri az átlagos futásidő segítségével kifejezve.
M5:
A hónapok azon számát méri, ami alatt a trend-ciklus összetevő átlagos abszolút változása már felülmúlja az irreguláris összetevő átlagos abszolút változását.
M6:
Az irreguláris összetevő évről évre való változásának nagyságát méri a szezonális összetevő évről évre való változásához viszonyítva.
M7:
Az idősorban jelenlévő stabil szezonalitás nagyságát méri a jelenlévő mozgó szezonalitás nagyságához viszonyítva.
Az utolsó négy minőségellenőrző statisztikai mutató a szezonális összetevőben rejlő évről évre való változás mértékét méri. M8:
A szezonális összetevő fluktuációjának mértékét írja le a teljes idősorra.
M9:
A szezonális összetevőben rejlő átlagos lineáris mozgást határozza meg a teljes idősorra.
M10: A szezonális összetevő fluktuációjának mértékét adja meg az utolsó két évet megelőző négy évre.
7
M11: A szezonális összetevőben rejlő átlagos lineáris mozgás mértékét adja meg az utolsó két évet megelőző 4 évre. Az X-11-ARIMA/88 hat évnél rövidebb idősorokra csupán az M1−M7 mutatókat számolja, mind a 11 mutatót legalább hat év hosszúságú idősorokra számítja ki (összhangban M10 és M11 definíciójával). A hat évnél rövidebb idősorok esetében a Q-statisztikát az M-statisztikák következő súlyozott átlaga adja: Q = 0.17M1 + 0.17M2 + 0.1M3 + 0.05M4 + 0.11M5 + 0.1M6 + 0.3M7. A legalább hat év hosszúságúakra pedig: Q = 0.13M1 + 0.13M2 + 0.1M3 + 0.05M4 + 0.11M5 + 0.1M6 + 0.16M7 + 0.07M8 + 0.07M9 + 0.04M10 + 0.04M11. Az X-12 ARIMA ezen mutatók számítása mellett egy további, stabilitást vizsgáló diagnosztikai eljárást is tartalmaz, aminek a neve csúsztatott intervallum statisztika (sliding spans statistics) [30, 31]. Az eljárást röviden ismertetjük adott multiplikatív szezonális kiigazítási eljárás esetére. A vizsgált idősorból ki kell választani négy részidősort oly módon, hogy a részidősorokat egy év hosszúságú adatsorral csúsztatjuk az idősor elejétől indulva a végéig (tehát az első részidősor az eredeti első adatával indul és négy évvel hamarabb ér véget az eredetihez képest stb.). Mindegyik részidősort ("intervallumot") úgy igazítjuk ki, mintha az lenne a teljes idősor. Minden olyan hónap adatát, amely legalább egynél több részidősorban (intervallumban) közös, megvizsgáljuk, hogy a szezonális kiigazítása, vagy más kapcsolódó vizsgált mutatója nem változike túlzott módon intervallumról intervallumra. Az utolsó intervallum úgy van választva, hogy tartalmazza a legfrissebb adatokat (tehát nem teljes évet magába foglaló részadatokat), és az intervallum hossza egyenlő a szezonális szűrő hossza plusz eggyel. A multiplikatív szezonális faktorok stabilitási kritériumát a következő adja. Legyen S t ( k ) a szezonális faktor k-adik intervallumból a t hónapra kapott becslése. Definiáljuk az N t = {k: a t hónap a k-adik intervallumban van}
indexhalmazt. A legtöbb esetben a t-edik hónap szezonális faktorának becslése instabil (azaz túlságosan instabil ahhoz, hogy megbízható kiigazításnak lehessen tekinteni), ha max k ∈ N i S t ( k ) − min k ∈ Ni S t ( k ) min k ∈ N i S t ( k )
> 0.03 ,
azaz ha a szezonális faktorokban fellépő maximális százalékos különbség nagyobb a 3%-os határértéknél. Ezt a mennyiséget minden olyan hónapra ki lehet számítani, amely legalább két intervallumban benne van. Jelölje S(%) azon hónapok százalékos arányát, amelyekhez instabil szezonálisfaktor-becslés tartozik. Ha X t jelöli a kiigazítatlan adatot a t-edik hónapra, akkor At ( k ) = X t / S t ( k ) adja a szezonális kiigazítást a k-adik intervallumból. Azon t hónapok közül, amelyekre az At ( k ) / At − 1 ( k ) hónapról hónapra való hányad a négy intervallumból legalább kettőre definiált, jelölje MM(%) azok százalékát, amelyekre
max k ∈ N t At ( k ) At − 1 ( k )
−
min k ∈ N t At ( k ) At − 1 ( k )
> 0 .03 .
Jelölje YY(%) az At ( k ) / At − 12 ( k ) évről évre való hányadokra vonatkozó analóg százalékot. 8
Tehát Findley és munkatársai az X-11 ARIMA és az STL olyan tovább-fejlesztett változatát készítették el, amely az X-11 ARIMA statisztikai mutatói mellett kiszámolja ezeket a statisztikákat is. Továbbá magába foglalja a [30, 32]-ben leírt, szezonális ARIMA hibájú regressziós modellek iteratív legkisebb négyzetek módszerét alkalmazó becslési eljárásának algoritmusát is. A regressziós átlag függvények lehetővé teszik a trendszint-eltolódások és más, a trendben bekövetkező hirtelen változások modellálását (továbbá az additív kiugrások, kereskedelmi nap hatások és ünnep hatások kezelését). Ezeknek az effektusoknak a figyelembevétele olyan ARIMA modellekhez vezet, amelyek-nek az előrejelző tulajdonságai jobbak, és az ezekkel készített extrapolációkkal stabilabb szezonális kiigazítások születnek. A trendszint-eltolódások meghatá-rozásának módszere az intervencióanalízis. Ezeket az új eljárásokat a követke-ző alpontokban vázoljuk.
4.2.
Általános REGARIMA-modell
Az ARIMA-modellek hasznos kiterjesztését kapjuk, ha az idősor időfüggő átlagát lineáris regresszióval modelláljuk. Részletesen, tételezzük fel, hogy az yt idősorra a következő lineáris regressziós egyenletet írhatjuk fel: yt =
∑
i
β i xi t + z t ,
ahol yt a függő (magyarázandó) idősor, xi t a regressziós (magyarázó) változó, a β együtthatók (paraméterek), és zt = z t −
∑
i
regressziós
β i xit
i
a regressziós hibák idősora. Az utóbbiról azt tételezzük fel, hogy (a Mellékletben definiált) szezonális ARIMA-modellalaknak tesz eleget. Ezeket a feltételeket egyetlen összefüggésbe foglalhatjuk:
φ ( B )Φ ( B s )∇ d ∇
D s
yt −
∑ i
β i x it = θ ( B )Θ ( B s ) a t .
Ezzel az összefüggéssel definiált általános REGARIMA-modell tehát azt foglalja magába, hogy az yt idősorból zérus átlagú zt idősor származtatása végett eltávolítjuk a regressziós hatásokat, majd a zt hibasorozatot addig differenciáljuk, hogy egy wt stacionárius idősort kapjunk, amely egy
φ ( B )Φ ( B s ) w t = θ ( B )Θ ( B s ) a t stacionárius ARMA-alakot követ [2]. A REGARIMA-modell másik alakját kapjuk az utóbbi összefüggés felhasználásával:
∇ d∇
D s yt
=
∑ i
β i∇ d∇
D s x it
+ wt ,
ahol tehát wt a fent specifikált stacionárius ARMA-alakot követi. Ez az alak hangsúlyozza, hogy a REGARIMA-modellben mind az xi t regressziós válto-zó, mind az yt idősor az ARIMA-modell ∇ d∇ D s differenciáló operátorával van differenciálva.
9
4.3.
Intervencióanalízis
Az intervencióanalízist az idősorok trendjében bekövetkező hirtelen esések vagy emelkedések kezelésére fejlesztették ki [25]. Ilyen effektus klasszikus példája az olajárakban bekövetkezett hirtelen esés 1986 januárjában. (A kiváltó oka az volt, hogy az OPEC piacszabályzó képessége 1985-ben meggyengült és a piacra főleg Szaúd-Arábia megnövelt termelése miatt nagy mennyiségű nyersolaj került. Ez zuhanásszerű áreséshez vezetett.) Az intervenciós jellegű hatások kalkulálására a Box és Jenkins által javasolt azonosításbecslésdiagnosztikai ellenőrzés ciklus szolgál. Ehhez az előző pontban (és részletesen a Mellékletben) definiált, kiterjesztett alakú ARIMA (regressziós ARIMA) modellt használják:
λ ( z t − α Dt ) −
∑
j
β j P jt = ψ ( B , B 12 )a t .
A ψ függvény szezonális ARIMA modellt jelöl, λ a vizsgált idősorra választott transzformációt (majdnem mindig logaritmusképzést) jelent. A P jt függvények additív kiugrásokat és szinteltolódásokat reprezentálnak, a Dt pedig olyan idősort jelöl, amely magába foglalja az összes emelkedést vagy esést. Egyetlen esés esetében Dt lineárisan csökken 1-től 0-ig, az esés tetejétől az aljáig, és α az egész idősorban bekövetkező változás mértéke. Többszörös esés (és/vagy emelkedés) esetén a relatív változási mértékeket meg kell becsülnünk, és a Dt -t úgy normáljuk, hogy +1 és −1 között változzon és 0-hoz tartson úgy, hogy z t − α Dt az adott idősor végével egybeessen. Eltolódáson olyan változást értünk az idősor tendenciájában, amely nagyobb a közönséges fluktuációknál és időben tartós változást jelent. A tendenciaszint-eltolódás olyan eltolódást modellál, amely egyetlen egy hónap alatt következik be, míg az esés/emelkedés függvény megengedi, hogy az eltolódás néhány hónapon keresztül menjen végbe. Ezzel a leírás rugalmassá és realisztikussá válik [33]. Az intervenciós hatások azonosítását grafikus vizsgálatból, lineáris törést becslő regressziós modellből és extrém pontok X-11-gyel való meg-határozásából álló eljárás során végzik el. Az X-11 alkalmazása során az extrém pontokhoz tartozó hónapot vagy hónapok sorozatát a program D9-es táblájának vizsgálatán keresztül lehet meghatározni. Az egyik grafikus vizsgálatot pedig a hónapok szerint csoportosított első differenciák grafikonja adja. Végül a lineáris törést becslő regressziós modell olyan illesztési eljárás, amely havi néma (dummy) változókat tartalmaz. Azok a törésrészek válnak esélyessé intervenciós hatások azonosítására, amelyek különösen nagy meredekségűek. A törésillesztés bizonyos automatizmust és objektivitást ad az esés/emelkedés kiválasztó eljárásnak. Az eljárás részletes leírása J. A. Buszuwski [34] alatti munkájában található. A modell becslését P. Burman modell alapú szezonális kiigazító programja segítségével lehet elvégezni [35]. Egy modell elfogadható, ha az összes paramétere szignifikáns értékkel rendelkezik és a Ljung−Box-bőröndstatisztika durván 5%-os szignifikanciaszinten elfogadhatónak adódik. Az intervenciós paraméterekre a 3 vagy nagyobb t-statisztika a szignifikanciakritériuma. Ha megtaláltuk az elfogadható modellt, akkor segítségével előzetes kiigazító faktorokat határozhatunk meg a vizsgált idősorra, amiket alkalmazni lehet az X-11 alapú szezonális kiigazítás során. Az intervencióanalízis vázolt becslési eljárását építették be az X-12 ARIMA programba Findley és munkatársai, míg a SAS intézetben pedig az SAS/ETS modulba [33, 36].
10
4.4.
A regressziós változók specifikálása az intervencióanalízishez
Az X-12 ARIMA eljárás az intervencióanalízis alkalmazásához a következő négyféle regressziós változót használja: 1. trend-konstans (TC), 2. additív kiszórópont (outlier) (AO), 3. szinteltolódás (LS), 4. hirtelen emelkedés vagy esés (temporary ramps (TR)). Az AO változó csupán egyetlen idősor-elemet befolyásol, az LS változó valamely állandó értékkel megnöveli vagy lecsökkenti az idősor összes elemét egy bizonyos időponttól kezdve, míg a TR változó az idősor trendjét lineárisan megemeli vagy leszállítja valamely, az idősor egészéhez képest rövid, időszak alatt. Ezeket a változókat alább specifikáljuk. (Az LS-változókat azért definiáljuk −1ként és utána 0-ként, hogy a regressziós átlag függvény általános szintje bármilyen előrejelzésre konzisztens legyen az idősor legfrissebb szintjével. Hasonló okok vezettek a TR-változó aktuális definíciójához is.) 1. Trend Konstans változó: TC = ∇
−d
∇
−D s I (t
≥ 1)
1, ha t ≥ 1, I ( t ≥ 1) = 0 , ha t < 1.
2. Additív Outlier változó a t 0 időpontban: 1, ha t = t 0 , t AOt 0 = 0, ha t ≠ t 0 . 3. Szinteltolódás a t 0 időpontban: − 1, t LS t 0 = 0,
ha t < t 0 , ha t ≥ t 0 .
4. Hirtelen emelkedés vagy esés a t 0 időponttól a t 1 időpontig: t ,t1
TR t 0
− 1, ha t ≤ t 0 , t − t 0 = − 1, ha t 0 < t < t 1 , t1 − t 0 0 , ha t ≥ t 1.
Előre specifikált AO, LS és TR változók az ún. intervenciók [38] egyszerű formái. Célszerűen választott AO, LS és/vagy TR változók egy rövid sorozata képes összetettebb dinamikai intervenciók hatásának a leírására is [38].
11
5. A szezonális kiigazítás lehetséges módjai Egy adott idősor (pl. összes regisztrált munkanélküliek létszámának idősora) szezonális kiigazítása 4-féle módon történhet: 1. A legegyszerűbb eljárás az idősor szezonális kiigazítása az X-11-ARIMA felhasználásával havonta, a hónap végén, amikor ismertté válik a legfrissebb adat. (a továbbiakban egyidejű közvetlen kiigazítás). 2. Végrehajtható a kiigazítás úgy is, hogy félévenként az addig rendelkezésre álló idősor alapján 6 hónapra előre jelezzük a várható szezonális kiigazító faktort, s az aktuális megfigyelési adatokat ezen előre jelzett kiigazító faktorral korrigáljuk (a továbbiakban előrejelzéses közvetlen kiigazítás). Megjegyzés: Az előrejelzés egy adott évben először az előző év decemberével záródó idősor, másodszor pedig az adott év júniusával záródó idősor alapján történik. 3. A nemzetközi gyakorlatban ismert módszer, hogy egy idősort (ilyenkor főidősort) olyan ún. elemi idősorokra bontják szét, melyeknek viselkedése karakteresen eltér egymástól, továbbá amelyek közgazdaságilag jól definiáltak (pl. összes regisztrált munkanélküliek idősorának pályakezdők, nem pályakezdők szerinti bontása). Ezen elemi idősorok szezonális kiigazításából állítják elő a főidősor szezonális kiigazítását. Ezek egyik változata, amikor minden hónapban aktuálisan kerül az X-11-ARIMA az elemi idősorokra alkalmazásra. S az így kapott szezonális kiigazítások kerülnek összegzésre (a továbbiakban egyidejű közvetett kiigazítás). 4. Hasonlóan a 2. pontban leírt módszerhez, úgy is eljárhatunk, hogy minden elemi idősor szezonális kiigazító faktorára előrejelzést teszünk félévente, s az előre jelzett faktorokat alkalmazzuk ezek után a kiigazításhoz. Az így kiigazított elemi idősorok összegzése adja ki ilyenkor a főidősor szezonálisan kiigazított értékét (a továbbiakban előrejelzéses közvetett kiigazítás).
6. Az X-11/12 ARIMA eljárások módszertani irodalma 1. E. B. Dagum: The X11ARIMA/88 seasonal adjustment method; Foundation and user's manual, Statistics Canada, Canada, 1988. 2. G. E. Box and G. M. Jenkins: Time series analysis, forcasting and control, Holden-day, San Francisco, London, 1970. 3. D. W. Bacon: Seasonal time series, Ph. D. Thesis, University of Winconsin, Madison, 1965. 4. E. B. Dagum: Data extrapolation and smoothing with the X-11 ARIMA seasonal adjustment method. Procceedings of the Computer Science and Statistics: 12th Annual Symoposium on Interface, ed. J. F. Gentleman, Univ. of Waterloo, 195-202, 1979. 5. D. Pierce: Data revision with moving average seasonal adjustment procedures. J. Econometrics, 14, 95-114, 1980. 6. W. P. Cleveland and G. C. Tiao: Decomposition of seasonal time series: a model for the census X-11 program, J. Amer. Statist. Assoc. 71, 581-587, 1967. 7. A. N. Kolmogorov: Sur l'interpolation et extrapolation des suites stationnaires. C. R. Acad. Sci. Paris, 208, 2043-2045, 1939.
12
8. N. Wiener: Extrapolation, Interpolation and Smoothing of Stationary Time Series, Wiley, New York, 1949. 9. P. Whittle: Prediction and Regulation by Linear Least-Square Methods, D. van Nostrand, Princeton, N. J. 1963. 10. A. H. Young: Linear approximations to the census and BLS seasonal adjustment methods, J. Amer. Statist. Assoc. 63, 445-457, 1968. 11. K. F. Wallis: Seasonal adjustment and relations between variables, J. Amer. Statist. Assoc. 69, 18-31, 1974. 12. J. Shiskin, A. H. Young and J. C. Musgrave: The X-11 Variant of Census Method II Seasonal Adjustment, Technical Paper No. 15, Bureau of the Census, U.S. Department of Commerce, 1967. 13. H. T. Davis: The Analysis of Economic Time Series, Bloomington, Indiana; The Principia Press Inc., 1941. 14. R. Henderson: Note on Graduation by Adjusted Average, Transactions of the Actuarial Society of America, Vol. XVII, 43-48, 1916. 15. Dagum, E. B.: Current Issues on Seasonal Adjustment. Survey Methodology, 13, 63-74, 1987. 16. Young, A. H.: Linear Approximations to the Census and BLS Seasonal Adjustment Methods. JASA 63, 445-471, 1968. 17. Dagum, E. B.: The effects of asymmetric filters on seasonal factor revisions. Journal of the American Statistical Association, 77, 732-738, 1982. 18. Dagum, E. B.: Revisions of time varying seasonal filters. Journal of Forecasting, 1, 173-187, 1982. 19. Kenney, P., and Durbin, J.: Local trend estimation and seasonal adjustment of economic time series. Journal of the Royal Statistical Society, Ser. A., 145, 1-41, 1982. 20. Dagum, E. B. and Morry, M.: Basic issues on the seasonal adjustment of the Canadian Consumer Price Indes. Journal of Business and Economic Statistics, 2, 250-259, 1984. 21. Dagum, E. B.: Revisions of seasonally adjusted data due to filter changes. Proceedings of the Business and Economic Statistics Section, American Statistical Association, 39-45, 1982. 22. Freschl Gy.: Bevezetés az idősori módszerek gyakorlatába, Statisztikai Módszertani Füzetek, 1, 1982. 23. Harvey, A. : The Econometric Analysis of Time Series, Philip Allan. 1982. 24. Dagum, E. B.: Monthly versus annual revisions of concurrent seasonally adjusted series. In: Time series and Econometric Modelling, (Eds. I.B. MacNeill and G.J. Umphrey), New York: D. Reidel, 131-196, 1987. 25. A. C. Harvey: Forecasting, Structural Time Series Models and the Kalman Filter. Cambridge: Cambridge University Press, 1989. 26. Multi-Ráció: Kisterületi Munkanélküliségi Statisztikai Rendszer Kialakításának Vizsgálata. Tanulmány az OMK részére, Budapest, 1993. 27. S. Scott: An extended review of the X11ARIMA seasonal adjustment package, Internatinal Journal of Forecasting, 8, 627-633, 1992. 28. R. B. Cleveland, W. S. Cleveland, J. E. McRae and I. Terpenning: STL: A seasonal-trend decomposition procedure based on Loess, Journal of Official Statistics, 6, 3-73, 1990. 13
29. D. F. Findley and B. C. Monsell: Comment, Journal of Official Statistics, 55-59, 1990. 30. D. F. Findley, B. Monsell, M. Otto, W. Bell and M. Pugh: Toward X-12-ARIMA, Proceedings of the Bureau of the Census Annual Research Conference, 4, 591-622, 1988. 31. D. F. Findley, B. C. Monsell, H. B. Shulman and M. Pugh: Sliding spans diagnostics for seasonal and related adjustments, Journal of the American Statistical Association, 85, 345-355, 1990. 32. M. C. Otto, W. R. Bell and J. P. Burman: An Iterative GLS Approach to Maximum Likelihood Estimation of Regression Models with ARIMA Errors. Research Report No. 87/34, Statistical Research Division, U. S. Bureau of the Census, Washington, D. C. 1987. 33. J. A. Buszuwski and S. Scott: On the Use of Intervention Analysis in Seasonal Adjustment, Proceedings of the Business and Economics Section, American Statistical Association, 1988. 34. J. A. Buszuwski: Some Notes on Ramp and Additive Outlier Estimation, LS dokumentum, 1988. 35. J. P. Burman: Seasonal Adjustment by Signal Extraction, Journal of the Royal Statistical Society A, 143, 321-337, 1980. 36. SAS/ETS User's Guide, Version 6, 1988, SAS Institute inc., Cary, NC. 37. X-12-ARIMA Reference Manulal, Beta Version 1.0, Bureau of the Census, 1996. 38. D. F. Findley, B. C. Monsell, W.R. Bell, M.C. Otto and B.C. Chen: New Capabilities and Methods of the X-12-ARIMA Seasonal Adjustment Program, Bureau of the Census, 1996. 39. J. Lothian and M. Morry: A set of quality control statistics for the X-11-ARIMA seasonal adjustment method, Staistics Canada, October 1978, report-78-10-005 E.
14