PEMODELAN DATA RUNTUK WAKTU PADA DATA PRODUKSI SUSU SAPI DI AMERIKA SEJAK TAHUN 1962 – 1975
Jantini Trianasari Natangku dan Fitria Puspitoningrum Mahasiswa Program Studi Matematika Fakultas Sains dan Matematika Universitas Kristen Satya Wacana
Abstrak Setiap peristiwa yang ada dalam kehidupan sehari –hari pasti akan berubah – ubah. Peramalan diperlukan untuk memperkirakan apa yang terjadi pada periode waktu ke depan, data yang digunakan merupakan kronologi kejadian dari pengamatan sebelumnya. Makalah ini menjelaskan cara mendiagnosi data “Milk” dengan model ARIMA. Model yang cocok setelah melakukan pengstasioneran pertama data diperoleh model ARIMA (0,1,1). Pengstasioneran kedua dilakukan untuk mencari model runtun waktu dalam periode 1 tahun. Keduanya digunakan untuk memprediksi peningkatan produksi dari data “Milk” periode 1 tahun yang akan datang. Prediksi dengan model ARIMA Seasonal menunjukkan nilai data yang tidak berbeda jauh dari data sebenarnya. Kata Kunci : Peramalan, Diagnosi, Prediksi.
PENDAHULUAN Setiap peristiwa atau kejadian yang ada di kehidupan sehari – hari pasti akan berubah – ubah. Sebagai contoh, di bidang ekonomi terdapat rata – rata angka penjualan produk yang tidak menetap, indeks harga saham yang selalu berubah dan lain sebagainya. Peramalan diperlukan untuk memperkirakan apa yang akan terjadi sehingga dapat dilakukan tindakan yang tepat terhadap situasi yang terjadi. Dalam peramalan, data yang digunakan merupakan runtun waktu, yaitu rentetan kronologi dari pengamatan – pengamatan yang dilakukan (Hanke, 1998). Pada makalah ini, akan dibahas mengenai model peramalan ARIMA (Autoregressive Integrated Moving Average). Model peramalan ini dipelajari secara mendalam oleh Gorge.E.P.Box dan Gwilym.M.Jenkins, sehingga metode ARIMA sering disinonimkan
dengan nama mereka yaitu Box-Jenkins. Model ini dapat digunakan untuk data diskret maupun kontinu dengan selang waktu yang sama dan dapat dipakai untuk permalan data musiman ataupun tidak musiman asalkan data stasioner. DASAR TEORI Data Stasioner dan Non Stasioner Dalam model permalan Box-Jenkins, sebelum melakukan identifikasi model sementara harus terlebih dahulu diperiksa apakah data runtun waktu yang akan diamati sudah stasioner. Untuk memeriksa hal tersebut dibutuhkan unsur – unsur statistic seperti nilai rata – rata (mean), variansi dan nilai autokorelasi. Atau dengan cara yang lain dengan melihat grafik yang terbentuk dari n buah yang diamati. Apabila grafik tersebut naik turun di sekitar nilai rata – rata, maka deret tersebut stasioner. Jika tidak stasioner, data tersebut harus diubah menjadi stasioner dengan transformasi logaritma dan mendiferensialkannya.
Fungsi Autokorelasi Sampel (ACF) Autokorelasi sampel merupakan relasi antara data runtun waktu. Jika diberikan sembarang data runtun waktu Y1 , Y2 ,..., Yn dengan mengasumsikan bahwa data tersebut telah stasioner, akan dapat diestimasi fungsi autokorelasi untuk berbagai lag k = 1,2,... . Cara yang sederhana untuk melakukan hal ini dengan menghitung korelasi sampel untuk pasangan (Y1 , Y1−k ), (Y2 , Y2−k ),..., (Yn−k , Yn ) . Fungsi autokorelasi sampel rk didefinisikan pada persamaan (1). n
rk =
∑ (Y − Y )(Y
t = k +1
t −k
t
n
∑ (Y t =1
t
−Y )
−Y ) (1)
2
Fungsi Autokorelasi Sampel Parsial (PACF)
Diperoleh estimasi dari fungsi autokorelasi parsial untuk lag k = 1,2,... yang dinotasikan dengan φ kk seperti pada persamaan (2). φ kk = Corr (Yt − β 1Yt −1 − β 2 Yt − 2 − ... − β k −1 Yt − k , Yt − k − β 1Yt − k +1 − β s Yt − k + 2 − ... − β k −1Yt −1 )
(2)
Berdasarkan ACF dan PACF yang telah diperoleh akan mampu diidentifikasi suatu model Box-Jenkins yang sesuai dengan data runtun waktunya yang kemudian disebut sebagai
model sementara. Model sementara tersebut pasti memiliki satu atau lebih parameter yang nilai – nilainya belum diketahui dan harus diestimasi dari deret pengamatan. Model fitting terdiri dari penentuan estimasi yang mungkin dan terbaik dari parameter yang tidak diketahui dalam model yang diberikan sehingga sesuai dengan data runtun waktu yang dimodelkan. Model didiagnosi untuk menganalisa kelayakan dari model sementara tersebut. Apakah model cocok dengan data runtun waktunya? Jika cocok, maka model dapat digunakan untuk meramal nilai deret yang akan datang. Sebaliknya apabila tidak cocok maka dilakukan kembali identifikasi sampai model yang diperoleh cocok. Untuk mengetahui cocok tidaknya model sementara tersebut dengan melakukan pengujian terhadap nilai koefisien autokorelasi dengan menggunakan salah satu dari dua statistik berikut Box-Pierce dan LjungBox yang dinyatakan pada persamaan (3) dan (4).
Statistik Box-Pierce
Q = n(rˆ12 + rˆ22 + ... + rˆK2 )
(3)
⎛ rˆ 2 rˆ 2 rˆ 2 ⎞ Q* = n(n + 2)⎜⎜ 1 + 2 + ... + K ⎟⎟ n−K ⎠ ⎝ n −1 n − 2
(4)
Statistik Ljung-Box
MODEL ARIMA SEASONAL Model Box-Jenkins (ARIMA) dibagi kedalam 3 kelompok, yaitu: model autoregressive (AR), moving average (MA), dan model campuran ARIMA (autoregressive moving average) yang mempunyai karakteristik dari dua model pertama bentuk umum dapat dilihat dari pustaka Cryer (1986) dan pustaka Cryer dan Chan (2008). Untuk meramalkan prediksi data dalam periode waktu ke depan dapat digunakan model ARIMA Seasonal. Bentuk umum dari model MA order Q dengan periode musiman didefinisikan pada persamaan (5), dengan karateristik musiman MA polynomial ditunjukkan pada persamaan (6). Yt = et − Θ1et − s − Θ 2 e t − 2 s − ..... − ΘQ e t −Qs
(5)
Θ(x ) = 1 − Θ1 x s − Θ 2 x 2 s − .... − ΘQ x Qs
(6)
Sedangkan bentuk umum untuk model AR order P dengan periode musiman didefinisikan pada persamaan (7). Persamaan (8) menunjukkan karateristik model AR polynomial. Yt = Φ1Yt − s + Φ 2 Yt − 2 s + .... + Φ P Yt − Ps + e t
(7)
Φ (x ) = 1 − Φ 1 x s − Φ 2 x 2 s − .... − Φ P x Ps
(8)
METODE PENELITIAN Data
Penelitian ini menggunakan data sekunder yang diperoleh dari perusahaan produksi susu sapi. Data diperoleh melalui penelitian yang dilakukan oleh perusahaan selama bulan Januari 1962 – Desember 1975 sebanyak 168 titik sampel. Dilakukan spesifikasi model dari data tersebut, sehingga model dapat digunakan untuk peramalan pada masa yang akan datang. Model yang telah ditentukan harus didiagnosi sehingga memperoleh model terbaik sesuai dengan asumsi yang digunakan. Apabila model tersebut belum cocok, maka dilakukan kembali spesifikasi dan diagnosi model kembali sampai menemukan model data runtun waktu yang sesuai dengan data.
HASIL DAN PEMBAHASAN
Data “Milk” yang digunakan terlebih dahulu dianalisis tentang kestasionerannya. Kestasioneran data “Milk” ditunjukkan melalui Gambar 1. Pada gambar tersebut diketahui bahwa data “Milk” tidak stasioner karena sampel tersebut makin lama makin menaik sepanjang tahun atau mengalami trend naik.
800 600
700
Pounds
900
Milk Production per Cow 1962:1 – 1975:12
0
50
100
150
Month
Gambar 1. Uji Stasioner Data Milk
Karena “Milk” tidak stasioner seperti yang ditunjukkan pada Gambar 1 dan cenderung mengalami trend menaik, maka data tersebut harus distasionerkan terlebih dahulu. Hasil stasioner data “Milk” ditunjukkan pada Gambar 2. Untuk menstasionerkan data “Milk” dilakukan deferensial terhadap data tersebut sehingga diperoleh stasioner.
-50
0
Pounds
50
100
Miilk Production per Cow C 1962:1 – 1975:12 Stasioner
0
50
100
150
Month
Gambar 2. D Data Milk Stasio oner
t diperolleh harus diccari nilai AC CF dan PAC CF yang massing – masinng Data stassioner yang telah ditunjukkan pada Gam mbar 3 & 4. Baatas UCL ( gaaris putus – puutus) bernilaii
±
1.96 n
=±
1.96 168
= ±0.15112173
d “Milk” memperlihatk m kan pada lag 1 bernilai, lag g 2 mendekati 0 ACF yangg diperoleh daari stasioner data tetapi lag 3 kembali bernilai b sepertti yang disajiikan pada Gaambar 3. PAC CF yang dibeentuk dari daata b dan m mulai bernilai pada lag 2, tetapi t kemballi tidak bernillai “Milk” staasioner pada lag 1 tidak bernilai pada lag 3 dan seterusnnya seperti yaang terlihat paada Gambar 4. 4
Gambbar 3. ACF Datta Milk Stasionner Pertama
Gambaar 4. PACF Daata Milk Stasio oner Pertama
CF bernilai paada lag 1 sed dangkan PAC CF Hasil padda Gambar 3 & 4 mempeerlihatkan bahhwa baik AC mulai berrnilai di lag 2. Hal tersebuut dapat digunnakan untuk meramal m moddel data runtuun waktu untuuk “Milk”. Model M tersebu ut adalah ARIIMA (0,1,1). M Model tersebuut terjadi untuuk lag 50, dikkarenakan nillai ACF dan PACF yang digunakan sampai lag 500. Berdasarkaan hal tersebuut, maka dilak kukan kembaali w “Milk” di identifikasi model melalui differenssial untuk ke 2x nya, untukk mencari moodel runtun waktu d unntuk yang keddua diperlihattkan pada Gam mbar 5. lag 12 (muusiman per taahun). Hasil differensial
10 0 -10 -20 -30
P ounds
20
30
M ilk Production per Cow 1962:1 – 1975:122 Stasioner2
0
50
100
150
Month
Gambar 5. Grafik Stasiioner Data Millk yang Kedua
Hasil Gam mbar 5 digunaakan dalam menghitung m niilai ACF dan PACF dari ddata “Milk” yaang dinyatakaan dalam Gaambar 6 & 7. Fungsi ACF yang digunaakan pada “M Milk” stasioneer kedua ini berada b pada laag 12, sehinggga diperolehh seperti Gam mbar 6 yang menunjukkan m bahwa hanyaa bernilai pada lag 1, 12 daan 13. Sedan ngkan PACF yang ditunjuk kkan pada Gaambar 7 mak kin lama makiin mendekatii 0 dan bernillai pada lag 1. 1
Gam mbar 6. ACF Data D Milk Stasiooner Ke-2
Gam mbar 7. PACF Data D Milk Stasioner ke-2
m m model data “M Milk” pada ssaat lag 12. Model M tersebut Gambar 6 & 7 digunaakan untuk meramalkan merupakaan model ARIIMA (0,1,1)122 . Sehingga ppada data “M Milk” ini diguunakan perkallian antara daata “Milk” sttasioner pertaama dengan “Milk” untukk lag 12. Beerdasarkan haal tersebut diiperoleh moddel ARIMA (0,1,1) ( x (0,1,1)12 untuk datta “Milk” denngan estimasi parameter paada persamaaan (1).
∇12∇Y Yt = et – θet – 1 – Θet – 122 + θΘet – 133
dengan et saling bebaas dan memiliki mean 0 serta varian nsi σ2. Dipeeroleh hasil estimasi e untuuk parameterr θ=-0.2443 dengan estim masi standardd error diperroleh 0.0759. sedangkan untuk u estimaasi parameterr Θsebesar -0.6421 dengan estimasi standard error diperoleh 0.06671. Variansi diestimasi d 61.449 sedangkan untuk AIC (Aikike ( Infoormation Criiteria) bernillai 1090,74. Nilai param meter tersebuut
disubstitu usi ke persam maan (1), seh hingga diperroleh persam maan (2). ∇12∇Yt = et – (-0.244 43)et – 1 – (-00.6421)et – 12 + (-0.2443) (-0.6421)et – 13 = et + 0.2443 3et – 1 + 0.64221)et – 12 + 0.156865e t – 13 M Model yang teelah tersebut dilakukan d diagnosi darii residunya. Hasil residuu standar daari
model tersebut dinyaatakan pada Gambar 8 bagian b yang pertama. Teerlihat bahw wa nilai residdu standar berkisar b diaantara -3 saampai 4 daan dapat dik katakan bahhwa berdistrrbusi normaal. ###(kok bisa) Untuk meenguji kenorm malan residu standar s data “Milk”, dilaku ukan uji kenorrmalan menggunakan uji
Kolmogoorov-Smirnoov. Hasil pen ngujian mengggunakan uji tersebut dipperoleh nilaii p sebesar 0.2044 sehhingga tetap dikatakan d bahhwa nilai residu standar terrsebut normal. Berdasarkaan nilai korelasi antar nilai resiidu yang disajjikan pada Gaambar 8 bagiaan kedua, terllihat bahwa nilai korelasi sampai lag g ke 20 berad da di dalam baatas garis biruu, atau dapat dikatakan d tidaak bernilai. Pada Gambar 8 bagian ketiga diperlihaatkan bahwa nilai-p n dari sstatistik Ljunng-Box tidakk ada yang leebih kecil daari
tingkat siignifikansi 5 %. Hal – haal tersebut memperkuat m pendapat meengenai residdu standar berdistribbusi normal yang ditunjuukkan pada Gambar G 9.
Gambar 8. Grafik Hasil Diagnosi Ressidu Data Milkk
0 -2
S ample Quantiles
2
4
Normal Q-Q Plot
-2
-1
0
1
2
Theoretical Quantiles
Gambar 9. Grafik Kenormalan
Hasil peramalan data “Milk” tersebut sesuai model ARIMA seasonal yaitu ARIMA (0,1,1) x (0,1,1)12 digunakan untuk meramalkan prediksi 1 tahun ke depan beserta nilai standard error yang
dinyatakan dalam Tabel 1. Hasil prediksi tersebut dapat juga digambarkan dalam bentuk grafik dengan tingkat kepercayaan 95 % yang ditunjukkan pada Gambar 10. Terlihat bahwa grafik prediksi tidak berbeda jauh dengan grafik data sebenarnya. Tabel 1. Hasil Prediksi data Milk 1975:2
1975:3
1975:4
1975:5
1975:6
1975:7
Prediksi
864.86
817.99
924.24
937.46
1000.55
SE
7.84
9.83
11.48
12.92
14.21
1975:11
1975:12
1976:1
Prediksi
851.32
817.281
859.36
SE
19.43
20.32
21.16
1975:8
1975:9
1975:10
973.17
922
892.06
846.21
15.40
16.5
17.53
18.51
Gambar 10. Grafik Produksi Susu Sapi di Amerika Serikat pada tahun 1962:1 sampai 1975:1 dan prediksinya dari 1975:2 sampai 1976:1.
KESIMPULAN
Makalah ini telah menjelaskan dan membahas peramalan model runtun waktu untuk data musiman. Hasil prediksi menunjukkan nilai yang tidak berbeda dari data sebenarnya.
Pemodelan yang digambarkan pada makalah ini terbatas pada Model ARIMA seasonal. Sehingga diperlukan penelitian lagi untuk membahas ARIMA seasonal model lain. DAFTAR PUSTAKA
Cryer, J. D. , 1986, Time Series Analysis, PWS-Kent Publishing Company, Boston. Cryer, J. D. dan Kung-Sik Chan, 2008, Time Series Analysis with Application in R, Springer, New York. Hanke, J. E dan A. G. Reitch. 1998. Business Forecasting, 6th Edition.New Jersey.2 Prentice-Hall.