ARIMA and Forecasting • We have learned linear models and their characteristics, like: AR(p), MA(q), ARMA(p,q) and ARIMA (p,d,q). • The important thing that we have to know in developing the models are determining the orders of p, q and d. It turns out that the process of deciding p, q and d is not easy. We need kinds of arts and subjectivity. • It is true that the identification process can be guided by observing autocorrelation function or partial autocorrelation function. However, the experience from the analysts is required. Some experts say that the identification process tends to be an art rather than an econometric thinking.
We will learn: (1). How to model stationery time series data or how to explain behavior of the stationery time series data with a model. (2). How to utilize the selected model to develop a forecast.
• The model (s) that will be used in answering these two questions is (are) ARIMA model (s) or Box-Jenkins model (s).
• There are several approaches that commonly used to forecast economic and business data. Roughly, there are 4 methods to be used in forecasting economic and business data using time series approach. (i). Single Equation Regression Model (ii). Simultaneous Equation Regression Model (iii). ARIMA (iv). VAR (vector autoregression) Model We would like to discuss: Forecasting with ARIMA A forecast method that emphasizes on the behavior of time series of a variable without observing any other variables. Philosophy: Let
the data speak for themselves.
Model ARIMA (p,d,q). - Merupakan campuran antara AR(p), MA(q) yang telah distasionerkan dengan melakukan pembedaan sebanyak d kali. -
Telah dijelaskan bahwa tidak mudah menentukan p dan q. Box ` dan Jenkins menawarkan 4 (empat) tahapan berikut untuk menentukan p,d dan q.
(1).Identifikasi Mencari atau menentukan p,d dan q dengan bantuan korelogram dan korelogram parsial.
(2).Estimasi Setelah p dan q ditentukan, tahapan berikutnya adalah mengestimasi parameter AR dan MA yang ada pada model. Estimasi ini bisa menggunakan teknik kuadrat terkecil sederhana maupun dengan metode estimasi tidak linier. Untungnya, sudah ada software yang menghitungnya sehingga kita tidak perlu mempelajari teknik estimasi yang relatif kompleks.
(3).Tes Diagnostik. Setelah model ARIMA nya ditentukan, parameternya telah diestimasi, kemudian kita akan cek apakah model yang terpilih cocok dengan data atau tidak. Siapa tahu ada model ARIMA lain yang lebih cocok atau sama cocoknya dengan model terpilih. Salah satu tes yang dapat dilakukan adalah dengan mengamati apakah residual dari model terestimasi merupakan white noise atau tidak. Jika residual berupa white noise, berarti model terpilih cocok dengan data. Sebaliknya bila residual tidak berupa white noise, berarti model terpilih bukan merupakan model yang cocok. Akibatnya, kita harus melakukan pilihan ulang dari awal lagi. Oleh sebab itu, metodologi Box-Jenkins disebut juga suatu proses iterasi.
(4). Ramalan. Secara umum dan pada banyak hal, ramalan yang diperoleh dengan menggunakan model ARIMA lebih reliabel bila dibandingkan dengan ramalan yang menggunakan model ekonometri biasa.
Rincian Tahapan (1). Tahap Identifikasi Seperti yang telah didiskusikan terdahulu, alat utama untuk identifikasi model ARIMA adalah Fungsi Autokorelasi (ACF) dan Fungsi Autokorelasi Parsial (PACF) melalui korelogramnya. ACF mengukur korelasi antar pengamatan dengan jeda k; sedangkan PACF mengukur korelasi antar pengamatan dengan jeda k dan dengan mengontrol korelasi antar dua pengamatan dengan jeda kurang dari k. PACF adalah korelasi antara yt dan yt-k setelah menghilangkan efek yt yang terletak diantara kedua pengamatan tersebut
Ingat bahwa dalam regresi berganda, βk mengukur tingkat perubahan terhadap y bila xk berubah satu unit dengan menganggap regresor lainnya konstan. βk disebut juga koefisien regresi parsial. Sebagai ilustrasi , perhatikan data GDP AS, 1970-1991 yang disajikan pada Tabel 21.1 dan Gambar 21.1 (Gujarati, 2003) Dari pengamatan sekilas, tampak bahwa data GDP tersebut tidak stasioner. Hal ini diperkuat dengan data sampel ACF dan korelogramnya yang disajikan pada Gambar 21.4. Gambar 22.1 menunjukkan bahwa sampai dengan lag 23, sampel ACF signifikan secara statistik dan tidak sama dengan nol. Tetapi sampel PACF setelah lag 1 kecil sekali dan secara statistik tidak signifikan. Karena data GDP tidak stasioner, diupayakan agar stasioner dulu dengan mencari series pembedanya (selisihnya)
Dari Gambar 21.9 terlihat bahwa seriesnya sudah stasioner. Hal ini diperkuat dengan korelogram ACF dab PACF yang disajikan pada Gambar 22.2. Perhatikan bahwa ACF pada lag 1,8 dan 12 terlihat bahwa secara statistik, mereka tidak sama dengan nol, Tetapi untuk lag yang lain, ACF kecil sekali (tidak beda dengan nol secara statistik). Demikian juga untuk PACF. Pertanyaannya sekarang adalah bagaimana memanfaatkan, ACF dan PACF tersebut untuk menentukan model ARIMA? Cara yang dapat dilakukan adalah mencocokkan pola ACF dan PACF yang sedang kita pelajari dengan pola model standard seperti AR(1), MA(1), MA(2), ARMA (1,1), ARMA (2,2), dst. Lihat Gambar 22.3 Bila pola yang sedang dianalisis cocok dengan salah satu pola tersebut maka model acuan kita jadikan model pilihan. Tetapi, model terpilih masih perlu dilakukan tes diagnostik untuk mengetahui apakah model terpilih memang akurat.
Acuan Pola ACF dan PACF Model
Pola ACF
Pola PACF
AR (p)
Menyusut secara eksponensial atau pola gelombang sinusoidal yang tidak begitu jelas
Ada tiang pancang sampai lag p
MA (q)
Ada tiang pancang yang jelas sampai lag q
Menyusut secara eksponensial
ARMA (p,q)
Menyusut secara eksponensial
Menyusut secara eksponensial
Tabel 22.1
Komentar: (1). ACF dan PACF tidak teramati. Sedangkan yang teramati hanyalah sampel ACF dan sampel PACF. Oleh karenanya seringkali korelogram yang teramati tidak ada yang persis dengan pola teoritis ACF dan PACF. (2). Tugas kita adalah mencocokkan kesamaan pola yang ada antara pola yang teramati dan pola yang berdasarkan teori. ARIMA dari GDP AS tahun pengamatan 1970-1991 Setelah mengenal acuan pola ACF dan PACF, bagaimana dengan data GDP AS yang sedang dianalisis. Bagaimana model ARIMA nya.
Kembali ke Gambar 22.2 dan bandingkan dengan pola acuan ACF dan PACF (Tabel 22.1). Autokorelasi menurun sampai lag 4. Setelah itu muncul lagi pada lag 8 dan lag 12. Korelogram PACF menunjukkan bahwa PACF signifikan pada lag 1,8 dan 12. Dari dua indikator tersebut dapat diduga bahwa data GDP tersebut yang sudah distasionerkan merupakan proses AR(12) atau ARIMA (12,1,0). Namun, karena korelogram yang signifikan hanya pada lag 1,8 dan 12 maka yang masuk dalam model hanyalah yt-1, yt-8, dan yt-12.
(2). Tahap Estimasi Model ARIMA Dari proses identifikasi, kita menduga bahwa series yang dianalisis merupakan proses ARIMA (12,1,0). Lebih spesifik lagi, bila: Yt = yt - yt-1; dengan yt GDP AS pada periode t, maka model yang ditawarkan adalah: Yt = δ + a1 Yt-1 + a8 Yt-8 + a12 Yt-12 + et Dengan menggunakan suatu software, diperoleh: Yt = 23.0894 + 0.3428 Yt-1 – 0.2994 Yt-8 – 0.2644 Yt-12 S.E:
(2.9774) t:
(0.0987)
(7.7547) (3.4695) R2 = 0.2931;
(0.1016)
(0.0986)
( -2.9475) d = 1.7663
(-26817)
(3).Tahap Tes Diagnostik. Untuk meyakinkan apakah ARIMA (12,1,0) merupakan model yang cocok dengan data yang dianalisis, kita perlu menguji apakah residual dari model tersebut merupakan white noise (random) atau tidak. Untuk itu lakukan tahapan sebagai berikut: (i). (ii). (iii). (iv). (v).
Estimasi model ARIMA (12,1,0) Hitung residual dari model tersebut Hitung ACF dan PACF kemudian plot Uji apakah ACF dan PACF signifikan Bila ACF dan PACF tidak signifikan, ini merupakan indikasi bahwa residual merupakan white noise yang artinya modelnya telah cocok.
Gambar 22.4 menunjukkan bahwa ACF dan PACF dari residual tidak signifikan yang berarti residualnya merupakan white noise. Akibatnya, model ARIMA (12,1,0) sudah merupakan model yang cocok dengan data yang dianalisis.
(4).Tahap peramalan Ada beberapa hal yang sangat fundamental yang perlu disadari sebelum melakukan peramalan. (i). Data yang dianalisis adalah data level GDP AS dari tahun 1970-1 s/d 1991-4 (ii). Sedangkan model yang diestimasi adalah series dari perubahan GDP (iii). Kalau kita ingin meramal level GDP pada tahun 1992 kuartal 1, kita tidak dapat menggunakan langsung model yang telah terestimasi. Melainkan kita perlu menyesuaikan model terestimasi tersebut dari model perubahan ke model level.
Ingat bahwa model ARIMA yang ditawarkan adalah: Yt = δ + a1 Yt-1 + a8 Yt-8 + a12 Yt-12 dengan Yt = yt - yt-1 Yt-1 = yt-1 - yt-2 Yt-8 = yt-8 - yt-9 Yt-12 = yt-12 - yt-13 Sehingga model tersebut juga dapat dinyatakan dalam level GDP sebagai berikut: yt - yt-1 = δ + a1 (yt-1 - yt-2) + a8 (yt-8 - yt-9) + a12 (yt-12 - yt-13) atau yt = δ + (1 + a1)yt-1 – a1 yt-2 + a8 (yt-8 - yt-9) + a12 (yt-12 - yt-13)
Ramalan 1 periode ke depan: yT+1 = δ + (1 + a1) yT - a1 yT-1 + a8 (yT-7 – yT-8) + a12 (yT-11 – yT-12) Dalam kasus ini T T-1 T-7 T-8 T-11 T- 12 T+1
= 1991 kuartal 4 = 1991 kuartal 3 = 1989 kuartal 4 = 1989 kuartal 3 = 1988 kuartal 4 = 1988 kuartal 3 = 1992 kuartal 1
Karena nilai δ1 a1, a8, dan a12 telah diestimasi, maka y1992-1 = 23.0894 + (1 + 0.3428)(4868) – 0.3428 (4862.7) - 0.2994 (4859.7 – 4845.6) – 0.2644(4779.7 – 4734.5) = 4876.7 Dengan demikian, ramalan GDP 1992-1 adalah sekitar $4877 B Sedangkan kenyataannya nilai GDP 1992-1 sebesar $ 4873.7 B. Akibatnya , ada kelebihan ramalan sebesar $3 B (Berapa %?) dan kemelesetan ramalan ini relatif kecil, sekitar 0.05 persen.