PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
(T.7) PENAKSIRAN KUADRAT TERKECIL PARAMETER MODEL VEKTOR AUTOREGRESI Kankan Parmikanti, Khafsah Joebaedi, dan Budi Nurani R. Jurusan Matematika FMIPA Universitas Padjadjaran Jl. Raya Bandung Sumedang Km 21 Jatinangor e-mail:
[email protected]
Abstrak Dalam makalah ini dikaji model vektor autoregresi orde 1, VAR(1) dan penaksiran parameternya menggunakan metode kuadrat terkecil. Studi kasus dilakukan pada data produktivitas teh dari beberapa kebun menggunakan perangkat lunak S-Plus. Kata kunci: Vektor autoregresi, kuadrat terkecil, produktivitas teh 1.
PENDAHULUAN Model time series atau deret waktu, adalah salah satu model peramalan, di mana
peramalan masa depan didasarkan pada nilai masa lalu dari suatu variabel. Dua model sederhana dalam time series adalah model autoregresi untuk univariat dan model vektor autoregresi untuk multivariat. Keakuratan peramalan dengan kedua model tersebut akan sangat tergantung pada nilai penaksir parameter. Banyak metode yang berkembang yang bertujuan untuk menentukan nilai penaksir parameter tersebut. Diantaranya adalah metode Yule-Walker, metode Maksimum Likelihood, dan metode Kuadrat Terkecil. Dalam makalah ini penulis akan membahas tentang metode kuadrat terkecil, yaitu suatu metode yang dikembangkan oleh Gauss sejak tahun 1980-an. Metode ini merupakan metode yang paling sering digunakan dalam statistika. Istilah kuadrat terkecil didasarkan atas kenyataan bahwa prosedur penaksiran ini berusaha meminimumkan jumlah kuadrat kesalahan. 2.
MODEL AR(p)
Definisi-1: Proses Autoregresi berorde p adalah model yang berbentuk Z(t) = 1 Z(t-1)+ 2 Z(t-2) + 3 Z(t-3)+ . . . + p Z(t-p)+ at di mana t adalah waktu pengamatan, Z(t) adalah peubah acak waktu ke-t, i
adalah
parameter model, dan at adalah galat yang berdistribusi N(0 , 2) .
Jurusan Statistika-FMIPA-Unpad 2011
69
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
Jika diasumsikan bahwa rata-ratanya adalah , maka persamaan di atas dapat ditulis sebagai Z(t)
= 1 (Z(t-1) − ) + 2 ( Z(t-2) − ) + . . . + p ( Z(t-p) − ) + at
sehingga faktor kesalahannya (eror) adalah at =
(t) −
−
( (t − 1) − ) −
( (t − 2) − ) − ⋯ −
( (t − p) − )
atau at2 =
(t) −
−
( (t − 1) − ) −
( (t − 2) − ) − ⋯ −
( (t − p) − )
Apabila diambil nilai ekspektasinya, maka diperoleh E[at2]
,…,
(t) −
(t) − ̅ −
∑
=
∶=
Karena koefisien dari
−
( (t − 1) − ) − ⋯ −
( (t − 1) − ̅ ) − ⋯ −
( (t − p) − )
( (t − p) − ̅ )
adalah positif, maka grafik dari f berbentuk paraboloida
yang terbuka ke atas. Metode kuadrat terkecil meminimumkan kuadrat dari fakor kesalahan, maka nilai minimum dari f akan diperoleh apabila =0, untuk i = 1, 2, . . . , p diperoleh: ∑
(t) − ̅ −
( (t − 1) − ̅ ) − ⋯ −
( (t − p) − ̅ ) ( (t − i) − ̅ )
=
0 Maka didapat sebuah sistem persamaan linear dengan (n – p) buah persamaan yang memuat p buah variabel yaitu
⎛ ⎝
− ̅ ⎛ − ̅ ⎞ = ⎜ ⋮ − ̅ ⎠ ⎝
,…,
. Dalam bentuk matriks dapat ditulis sebagai:
− ̅ − ̅
− ̅ − ̅
⋮ − ̅
⋮
− ̅
− ̅ − ̅ ⎞ ⎟ ⋮ − ̅ ⎠
… … …
( − )×
(n – p) × 1
⋮
(1)
p×1
Secara umum ditulis: (
− ̅ )=(
)
Model di atas berbeda dengan model regresi linear sederhana karena ( matriks bujur sangkar tetapi matriks yang berorde ( − ) × variabel bebas. Dengan mengalikan tranpose dari (
) yaitu
) bukan
yang tergantung pada
pada masing-masing ruas,
persamaan menjadi: ( Jadi penaksir dari (
− ̅ )=(
)
) yaitu ( ) diperoleh:
Jurusan Statistika-FMIPA-Unpad 2011
70
PROSIDING Seminar Nasional Statistika | 12 November 2011 = (
)
ISSN : 2087-5290. Vol 2, November 2011
− ̅ ) ; i = 1, 2, . . . , p
(
(2)
Khusus untuk nilai p =1, maka (1) menjadi: − ̅ − ̅ ⋮ − ̅ sehingga dari (2) , nilai penaksir − ̅ − ̅ ⋮ − ̅
⎡ ⎢ = ⎢ ⎢ ⎣
=
3.
( (
− ̅ − ̅ ⋮ − ̅
⎤ ⎥ ⎥ ⎥ ⎦
)(
∑
=
,
, yaitu menjadi:
− ̅ − ̅ ⋮ − ̅ ∑
− ̅ − ̅ ⋮ − ̅
− ̅ − ̅ ⋮ − ̅
) )
MODEL VAR(1)
Model bivariat VAR(1) dinyatakan sebagai: Z(t) = Z(t-1) + ⃗t dimana Z(t) =
, =
, ⃗t ~
( 0 , 2 I2 )
Model di atas dapat pula ditulis dalam bentuk model regresi Z(t) pada Z(t-1) berikut: Z(T2) = Z(1)(T2) ’(22) + A(T2)
(3)
dengan Z dan Z(1) didefinisikan sebagai matriks berisi vektor observasi untuk setiap waktu t = 1, . . ., T, yaitu (2) (3) ⋮ ( + 1)
Z =
(2) (3) ⋮ ( + 1)
, Z(1) =
(1) (2) ⋮ ( )
(1) (2) ⋮ ( )
Pada model (4) di atas, maka untuk memperoleh taksiran parameter model VAR(1) menggunakan Metode Kuadrat Terkecil adalah dengan cara mengalikan masing-masing ruas dengan tranpose dari Z(1)(T2) yaitu Z’(1)(T2) sehingga dihasilkan: (NN) = ( Z’(1)(2T) Z(1)(T2))-1 ( Z’(1)(2T) Z(T2)) (2) ⋯ (2) ⋯
(1) (1)
=
( ) ( )
=
∑ ∑
∑ [ ( )] ∑ () ()
=
(1) (2) ⋮ ( )
(1) (2) ⋮ ( )
() () [ ( )]
Jurusan Statistika-FMIPA-Unpad 2011
(2) ⋯ (2) ⋯
(1) (1)
∑ ∑
() ()
( ) ( )
( + 1) ∑ ( + 1) ∑
(2) (3) ⋮ ( + 1)
() ()
(2) (3) ⋮ ( + 1)
( + 1) ( + 1)
71
PROSIDING Seminar Nasional Statistika | 12 November 2011
di mana
=
=
=
=
4.
∑
[
( )] ∑ ∑
∑
[
[
[
( )]
[
( )]
∑
( )] ( )
[
( )]
) [
( ∑
( ) [
( )] ∑ ∑
(
( )
( )] ∑ ∑
∑
[
( )] ∑ ∑
∑
( )
)
) [
( [
∑ ( )
( )
( )]
( ) ∑
)
( )
(
)
( )
(
)
( )
(
)
( )
( ) ∑ ()
(
( )
( ) ∑ ()
( ) ( )
( ) ∑ ()
∑
∑
( )∑ ( )
∑
∑ ( )]
)
( )
∑ ( )]
(
∑
( )]
[
∑
∑
ISSN : 2087-5290. Vol 2, November 2011
( )
IMPLEMENTASI PADA PERAMALAN PRODUKSI TEH Data Produksi Teh pada Perkebunan Santosa dan Purbasari Dalam 60 Bulan (Dalam kg/ha) SANTOSA PURBASARI
SANTOSA PURBASARI
SANTOSA PURBASARI
1 286.59 297.86
21 200.51 182.46
41 204.39 236.59
2 152.04 173.95
22 206.79 220.65
42 235.11 243.37
3 236.44 256.86
23 210.31 208.58
43 139.14 154.43
4 252.29 275.18
24 234.86 195.04
44 176.25 199.27
5 250.76 260.67
25 255.68 229.52
45 170.80 193.41
6 240.64 230.75
26 132.84 117.91
46 199.72 189.63
7 181.10 188.24
27 171.24 152.12
47 238.29 220.46
8 160.38 154.07
28 225.94 203.89
48 231.02 219.33
9 150.12 124.51
29 189.70 181.57
49 158.60 172.87
10 196.15 176.82
30 207.47 206.14
50 138.35 160.17
11 213.91 210.33
31 172.25 159.07
51 278.46 290.60
12 192.77 162.42
32 80.88 77.42
52 276.39 277.50
13 250.16 190.56
33 56.70 50.36
53 240.87 287.09
14 211.76 186.79
34 58.75 50.29
54 203.61 215.14
15 210.77 193.82
35 69.72 58.93
55 159.93 164.33
16 294.44 270.35
36 162.33 170.16
56 195.70 216.51
17 221.99 210.15
37 172.29 157.06
57 215.55 196.57
18 245.45 217.85
38 114.24 128.55
58 185.15 183.58
19 188.47 197.48
39 205.23 201.24
59 137.20 178.00
20 186.67 191.33
40 168.32 155.99
60 138.24 156.45
Jurusan Statistika-FMIPA-Unpad 2011
72
PROSIDING Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290. Vol 2, November 2011
> Korelasi: SANTOSA PURBASARI SANTOSA 1.0000000 0.9303035 PURBASARI 0.9303035 1.0000000 Korelasi produksi kedua perkebunan terlihat cukup besar yaitu 0,9303035, hal ini ditunjang pula oleh hasil TS Plot dari kedua grafik berikut yang hampir sama. Dari grafik ini, juga terlihat bahwa data stasioner dalam rata-rata dan varian. Berdasarkan plot ACF yang memperlihatkan pola gelombang sinus teredam dan plot PACF pada masing-masing lokasi terpotong pada leg-1, maka dapat diambil kesimpulan bahwa data masing-masing lokasi mengikuti model AR(1). Oleh karena itu model sementara dari produksi teh untuk kedua kebun diasumsikan mengikuti model VAR(1). Untuk model AR(1), yaitu Z(t)
= Z(t-1) , dengan menggunakan program S-plus
diperoleh hasil sebagai berikut: - Nilai penaksir parameter untuk Perkebunan Santosa adalah
= 0,9533416
- Nilai penaksir parameter untuk Perkebunan Purbasari adalah Jadi, model AR(1) untuk Perkebunan Santosa adalah:
Z(t)
= 0,9552251 = 0,9533416 Z(t-1),
artinya bahwa produksi teh dipengaruhi oleh produksi bulan sebelumnya sebesar 95,3%. Sedangkan model AR(1) untuk Perkebunan Purbasari adalah:
Z(t)
= 0,9552251 Z(t-1) ,
artinya bahwa produksi teh dipengaruhi oleh produksi bulan sebelumnya sbesar 95,5%. Selanjutnya untuk model VAR(1), yaitu Z(t)
= Z(t-1)
telah diperoleh hasi
penaksir sebagai berikut:
= 0,6331161 ,
= 0,2281275 ,
= 0,3246624 , dan
= 0,7293967 .
Jadi model VAR(1) dari kedua perkebunan tersebut adalah: Z1(t) dan
Z2(t)
= 0,6331161 Z1(t-1) + 0,2281275 Z2(t-1) = 0,3246624 Z1(t-1) + 0,7293967 Z2(t-1)
Dengan demikian dapat disimpulkan bahwa: 1.
Produksi teh perkebunan Santosa dipengaruhi oleh produksi bulan sebelumnya. Yaitu: dariperkebunan santosa sebesar 63,3% dan dari Purbasari sebesar 22,8% .
2.
Produksi teh perkebunan Purbasari dipengaruhi oleh produksi bulan sebelumnya. Yaitu: dari perkebunan santosa sebesar 32,4% dan dari Purbasari sebesar 72,9% .
Jurusan Statistika-FMIPA-Unpad 2011
73
PROSIDING Seminar Nasional Statistika | 12 November 2011 5.
ISSN : 2087-5290. Vol 2, November 2011
DAFTAR PUSTAKA
Jonathan D. Cryer,1986, Time Series Analysis, Duxbury Press, Boston. Ruchyana, B.N, 2002, Suatu Model Generalisasi Space-Time Autoregresi dan Penerapannya Pada Produksi Minyak Bumi, Desertasi S-3, ITB. Spyros Makridakis, Steven C.Wheellwright, and Victor E. Mc Gee, 1983, Forcasting, John Willey&Sons Inc. Van der Vaart, A. W, 2002,Time Sries, Lecture Notes, Amsterdam Wei William W.S, 1994, Time Series Analysis, Addison Wesley Publishing Company, Inc
Jurusan Statistika-FMIPA-Unpad 2011
74