BAHAN AJAR EKONOMETRIKA AGUS TRI BASUKI UNIVERSITAS MUHAMMADIYAH YOGYAKARTA
REGRESI DAN KORELASI
Tujuan metode kuadrat terkecil adalah menemukan nilai dugaan b0 dan b1 yang menghasilkan jumlah kesalahan kuadrat minimum. Dalam pengertian tertentu, yang segera akan kita bahas, nilai dugaan itu akan menghasilkan fungsi regresi linier yang “baik”. Penduga Kuadrat Terkecil. Penduga b0 dan b1 yang memenuhi kriterium kuadrat terkecil dapat ditemukan dalam dua cara berikut : Pendekatan Pertama, digunakan suatu prosedur pencarian numerik. Prosedur ini untuk berbagai nilai dugaan b0 dan b1 yang berbeda sampai diperoleh nilai dugaan yang meminimumkan. Pendekatan kedua adalah menemukan nilai-nilai b0 dan b1 secara analitis yang meminimumkan Jumlah Kesalahan Kuadrat (∑e2) . Pendekatan analitis mungkin dilakukan bila model regresinya secara sistematis tidak terlalu rumit, seperti halnya di sini. Dapat diperlihatkan nilai-nilai b0 dan b1 yang meminimumkan (∑e2) untuk data sampel yang dimiliki diberikan oleh sistem persamaan linear berikut : yi nb0 b1 X i X 1Yi b0 X i b1 X
2 i
(a) (b)
Persamaan (a) dan (b) dinamakan persamaan normal; b0 dan b1 dinamakan penduga titik (point estimator) bagi 0 dan 1. Besaran-besaran Yi, Xi, dan seterusnya di dalam (a) dan (b) dihitung dari amatan-amatan sampel(Xi, Yi). Dengan demikian, kedua persamaan itu bisa diselesaikan. Untuk memperoleh b0 dan b1 bisa dihitung secara langsung menggunakan rumus :
PENGANTAR EKONOMETRI
1
X i Yi X i X Yi Y n b1 2 2 Xi Xi X 2 Xi n 1 b0 Yi bi X i Y b1 X n X iYi
(c)
(c)
dalam hal ini X dan Y berturut-turut adalah rataan Xi dan rataan Yi. Persamaan normal (a) dan (b) dapat diturunkan secara kalkulus. Untuk suatu data amatan (Xi, Yi), ∑e2 dapat diturunkan dengan cara mendiferensialkan: ∑e2 = ∑(Yi - 0 - 1Xi)2 terhadap 0 dan 1 . Kita peroleh: Q 2 (Yi 0 1 X i ) 0 Q 2 X i (Yi 0 1 X i ) 1
Selanjutnya kedua turunan parsial ini disamakan dengan nol, dan dengan menggunakan b0 dan b1 untuk menyatakan 0 dan 1 yang meminimumkan (∑e2), maka:
(Y X ) 0 X (Y X ) 0 i
i
0
i
1
0
i
1
i
Sistem persamaan ini dinamakan persamaan normal. Dengan menyelesaikan persamaan-persamaan normal ini diperoleh: b1
n X iYi ( X i )( Yi ) n X i2 ( X i )2
b0 Y b1 X
Rumus terakhir ini merupakan versi lain dari rumusan yang telah disajikan di depan, namun akan menghjasilkan nilai yang sama.
PENGANTAR EKONOMETRI
2
Penduga kuadrat terkecil ini ialah penduga tak bias dan merupakan fungsi linear dari Yi , yaitu: a. E (b0 ) 0 dan E (b1 ) 1 (jadi merupakan penduga tak bias). b. b1
n X iYi ( X i )( Yi ) n X i2 ( X i )2
( X X )Y k Y ( X X ) i
i 2
i i
i
dimana:
(X X ) ( X X ) 1 Y X k Y bY n
ki
i
2
i
b0
i
i i
i i
dimana: 1 bi ( Xki ) n (baik b1 maupun b0 merupakan kombinasi linear atau fungsi linear dari Yi ).
PENGANTAR EKONOMETRI
3
Analisis Regresi Sederhana Tabel Data konsumsi (Y) dan pendapatan (X) 30 mahasiswa fakultas ekonomi No 11 12 13 14 15 16 17 18 19 20
Y 38 40 45 49 52 55 57 60 64 67
X 42 45 49 52 55 57 60 65 67 71
No 21 22 23 24 25 26 27 28 29 30
Y 70 74 77 80 84 90 92 95 98 100
X 74 79 85 88 90 95 97 99 110 120
Konsumsi
No Y X 1 10 11 2 12 14 3 15 17 4 19 22 5 22 24 6 25 28 7 27 30 8 29 31 9 33 35 10 35 40 Sumber : Data Hipotesi
Pendapatan
PENGANTAR EKONOMETRI
4
Perhitungan regresi linear sederhana Dari tabel diatas dapat kita jabarkan sebagai berikut : No Y 1 10 2 12 3 15 4 19 5 22 6 25 7 27 8 29 9 33 10 35 11 38 12 40 13 45 14 49 15 52 16 55 17 57 18 60 19 64 20 67 21 70 22 74 23 77 24 80 25 84 26 90 27 92 28 95 29 98 30 100 ∑ 1614
X YX X^2 11 110 121 14 168 196 17 255 289 22 418 484 24 528 576 28 700 784 30 810 900 31 899 961 35 1155 1225 40 1400 1600 42 1596 1764 45 1800 2025 49 2205 2401 52 2548 2704 55 2860 3025 57 3135 3249 60 3420 3600 65 3900 4225 67 4288 4489 71 4757 5041 74 5180 5476 79 5846 6241 85 6545 7225 88 7040 7744 90 7560 8100 95 8550 9025 97 8924 9409 99 9405 9801 110 10780 12100 120 12000 14400 1752 118782 129180
PENGANTAR EKONOMETRI
y -43.8 -41.8 -38.8 -34.8 -31.8 -28.8 -26.8 -24.8 -20.8 -18.8 -15.8 -13.8 -8.8 -4.8 -1.8 1.2 3.2 6.2 10.2 13.2 16.2 20.2 23.2 26.2 30.2 36.2 38.2 41.2 44.2 46.2 0
x yx -47.4 2076.120 -44.4 1855.920 -41.4 1606.320 -36.4 1266.720 -34.4 1093.920 -30.4 875.520 -28.4 761.120 -27.4 679.520 -23.4 486.720 -18.4 345.920 -16.4 259.120 -13.4 184.920 -9.4 82.720 -6.4 30.720 -3.4 6.120 -1.4 -1.680 1.6 5.120 6.6 40.920 8.6 87.720 12.6 166.320 15.6 252.720 20.6 416.120 26.6 617.120 29.6 775.520 31.6 954.320 36.6 1324.920 38.6 1474.520 40.6 1672.720 51.6 2280.720 61.6 2845.920 0 24524.400
x^2 y^2 2246.760 1918.440 1971.360 1747.240 1713.960 1505.440 1324.960 1211.040 1183.360 1011.240 924.160 829.440 806.560 718.240 750.760 615.040 547.560 432.640 338.560 353.440 268.960 249.640 179.560 190.440 88.360 77.440 40.960 23.040 11.560 3.240 1.960 1.440 2.560 10.240 43.560 38.440 73.960 104.040 158.760 174.240 243.360 262.440 424.360 408.040 707.560 538.240 876.160 686.440 998.560 912.040 1339.560 1310.440 1489.960 1459.240 1648.360 1697.440 2662.560 1953.640 3794.560 2134.440 26863.200 22576.800
Y' 11 13 16 21 22 26 28 29 32 37 39 42 45 48 51 53 55 60 62 65 68 73 78 81 83 87 89 91 101 110 1614
e^2 -0.527 -1.266 -1.004 -1.569 -0.395 -1.047 -0.873 0.214 0.563 -2.002 -0.828 -1.567 -0.218 1.043 1.304 2.478 1.739 0.175 2.349 1.697 1.958 1.394 -1.084 -0.823 1.351 2.787 2.961 4.135 -2.908 -10.037 0.000
5
Persamaan (2.5a) dan (2.5b) dapat disusun sebagai berikut : 1614 118782
= =
30 b0 1752 b0
+ +
1752 129180
b1 b1
2827728 3563460
= =
52560 b0 52560 b0
+ +
3069504 3875400
b1 b1
-735732
=
0 b0
+
-805896
b1
b1 b0
= =
x
1752 30
0.913 0.484
Sehingga persamaan regresinya dapat disusun sebagai beriku : Y = 0,484 + 0,913 X + et dimana : Bo = 0,484, artinya jika faktor lain dianggap tetap maka rata-rata konsumsi sebesar 0,484 satuan B1 = 0,913, artinya jika faktor lain dianggap tetap maka kenaikan pendapatn sebesar 1 satuan akan meningkatkan konsumsi sebesar 0,913 satuan Dalam praktek sebetulnya banyak sekali faktor yang mempengaruhi suatu variabel dependen y, tidak hanya satu variabel. Contoh yang paling nyata adalah pembelian produk oleh konsumen. Pembelian produk oleh konsumen tidak hanya dipengaruhi oleh faktor harga, tatapi juga bisa dipengaruhi oleh faktor iklan produk, preferensi konsumen, keterjangkauan produk, dan fitur produk. Untuk membuat analisis pengaruh berbagai macam faktor independen terhadap satu variabel dependen kita menggunakan analisis regresi dan korelasi berganda.
PENGANTAR EKONOMETRI
6
Analisis Regresi Berganda Dalam analisis regresi linier sederhana, rumus regresi dirumuskan dengan y = a + bx. Untuk regresi berganda lebih dari satu variabel independen x. Rumus regresinya adalah : Y = a + b1x1 + b2x2 + .................+e Dimana : x1, x2, x3 ...adalah variabel independen a : konstanta b1 adalah koefisien perubahan y dengan x2 dan x2 konstan b2 adalah koefisien perubahan y bila x2 konstant dengan x1 dan x3 konstan b3 adalah koefisien perubahan y bila x3 berubah dengan x1 dan x2 konstan e adalah error Rumus regresi diatas adalah untuk regresi dengan dua variabel independen x, kita bisa juga memperluas jumlah variabel independen x misal menjadi tiga variabel independen (x) sehingga rumus regresinya adalah: Y1 = a + b1x1 + b2x2 + b3x3 Persamaan regresi diatas apabila kita bisa perluas dengan n variabel independen maka rumus regresi adalah: Y1 = a + b1x1 + b2x2 + b3x3 +..............+ bnxn Untuk mendapatkan persamaan regresi diatas nilai konstanta dan slope regresi dicari dengan menggunakan metode kuadrat terkecil. Sebagai contoh untuk dua variabel independen metode Least square adalah sebagai berikut: ΣY = na + b1x1 + b2x2 ΣX1Y = a ΣX1 + b1 ΣX12 + b2 ΣX1X2 ΣX2Y = a ΣX2 + b1 ΣX22 X2 + b2 ΣX22 Persamaan normal diata dapat diturunkan secara kalkulus. Untuk suatu data amatan (Xi, Yi), ∑e2 dapat diturunkan dengan cara mendiferensialkan: ∑e2 = ∑(Yi - 0 - 1X1 - 2X2)2 terhadap 0, 1 dan 2 dapat kita peroleh:
PENGANTAR EKONOMETRI
7
∂Q/∂ 0 = -2∑(Yi - 0 - 1X1 - 2X2) ∂Q/∂ 1 = -2∑X1(Yi - 0 - 1X1 -2X2) ∂Q/∂ 2 = -2∑X2(Yi - 0 - 1X1 -2X2) Apabila jumlah variabel independen diperluas menjadi ke-k variabel maka metode least square adalah sebagai berikut: ΣY = na + b1Σx1 + b2 Σx2 + b3x3 + …………………. ΣX1Y = a ΣX1 + b1 ΣX12 + b2 ΣX1X2+ b3 ΣX1X3 +……. ΣX2Y = a ΣX2 + b1 ΣX1 X3 + b2 ΣX22 + b3 ΣX2 X3 +…… ΣX3Y = a ΣX3 + b1 ΣX1 X3 + b2 ΣX2 X3 + b3 ΣX32 +…… ΣXkY = a ΣXk + b1 ΣX1 Xk + b2 ΣX2 Xk + b3 ΣX3Xk +……
+ bk ΣXk + bk ΣX1Xk + bk Σ(X2Xk) + bk Σ(X3Xk) + bk ΣXk2
Untuk mendapatkan nilai a, b, dan b2 kita menggunakan perkalian matriks dengan prediksi dua variabel independen, persamaan matriks yang digunakan adalah sebagai berikut: y a n x1 x2 2 x1 y b1 x1 x1 x1 x2 2 x y b2 x x x 2 2 1 2 x2 H = bA
b = A-1.H
A
dimana A- =
1 det A1 det A
dimana det A, x1
n
A=
x2
x x x x x x x x 2
1
1
1 2
2
1 2
2
2
Det A = n. Σx12 Σx22 + Σx1. Σx1x2 .Σx2 + Σx2. Σx1x2 .Σx1 - Σx2. Σx12 .Σx2 - Σx1x2 . Σx1x2.n Σx22. Σx1. Σx1
PENGANTAR EKONOMETRI
8
Det A1 = Σy Σx12Σx22 + Σx1. Σx1x2 .Σ2y + Σx2. Σx1x2 .Σx1y - Σx2y. Σx12 .Σx2 - Σx1x2 . Σx1x2. Σy - Σx22. Σx1. Σx1y Det A2 = n. Σx1y Σx22 + Σy. Σx1x2 .Σx2 + Σx2. Σx2y .Σx1 - Σx2. Σx1y .Σx2 – Σx2y . Σx1x2.n Σx22. Σy. Σx1 Det A3 = n Σx12. Σx2y + Σx1.Σx1y .Σx2 + Σy. Σx1x2 .Σx1 - Σx2. Σx12 .Σy – Σx1x2. Σx1y.n Σx2y. Σx1. Σx1 Dimana nilai a, b1, b2 bisa didapatkan dengan cara sebagai berikut: a=
det A1 det A
b1 =
det A2 det A
b2 =
det A3 det A
Untuk mengetahui lebih jelas berikut adalah contoh penerapan regresi berganda. Seorang manager perusahaan ingin mengetahui pengaruh dari jumlah periklanan di koran (X1) dan jumlah periklanan di radio (X2), terhadap volume penjualan (Y) dalam setahun selama 10 tahun. Data yang dikumpulkan adalah sebagai berikut: Tabel Jumlah Iklan Koran (X1), Radio (X2) dan Volume penjualan (Y) NO 1 2 3 4 5 6 7 8 9 10 Jumlah
X1 6 6 6 7 7 7 7 8 8 8 70
X2 8 8 9 9 9 9 9 10 10 10 91
Y 15 15 16 17 17 17 18 18 18 18 169
Manager tersebut ingin mengetahui pengaruh dari jumlah iklan di tv dan koran selama setahun terhadap volume penjualan. Buatkanlah persamaan regresi untuk menjawab hal tersebut.
PENGANTAR EKONOMETRI
9
Untuk mendapatkan persamaan regresi kita membuat tabel seperti berikut: Tabel Least Square Methode NO 1 2 3 4 5 6 7 8 9 10 Jumlah
X1 6 6 6 7 7 7 7 8 8 8 70
X2 8 8 9 9 9 9 9 10 10 10 91
Y 15 15 16 17 17 17 18 18 18 18 169
X12 36 36 36 49 49 49 49 64 64 64 496
X22 64 64 81 81 81 81 81 100 100 100 833
Y2 225 225 256 289 289 289 324 324 324 324 2.869
X1X2 48 48 54 63 63 63 63 80 80 80 642
X1Y 90 90 96 119 119 119 126 144 144 144 1.191
X2Y 120 120 144 153 153 153 162 180 180 180 1.545
ΣY = na + b1x1 + b2x2 ΣX1Y = a ΣX1 + b1 ΣX12 + b2 ΣX1X2 ΣX2Y = a ΣX2 + b1 ΣX1 X2 + b2 ΣX22
169 = 1.191 = 1.545 =
10 a + 70 a + 91 a +
70 b1 + 496 b1 642 b1
91 b2 + 642 b2 + 833 b2
Dalam perkalian matriks A B = C B = A-1C 10 70 91 a 169 70 496 642 x b = 1.191 1 91 642 833 b2 1.545
A
x
b = c
Dengan aturan perkalian matriks, persamaan regresi didapatkan dengan cara mencari determinan matrik A, A1, A2, A3 sebagai berikut:
PENGANTAR EKONOMETRI
10
Det A = (10 x 496 x 833) + (70 x 642 x 91) + ( 91x 642 x 70 – (91 x 496 x 91) – (642 x 642 x 10) – (833 x 70 x 70) = 44 Det A1= (169 x 496 x 833) + (70 x 642 x 1.545) + (91 x 642 x 1.191) – (1.545 x 496 x 91) - (642 x 642 x 169) – (833 x 70 x1.191) = 248 Det A2 = (10 x 1.191 x 833) + (169 x 642 x 91) + ( 91 x 1.545 x 70) – (91 x 1.191 x 91) – (1.545 x 642 x 10) – (833 x 169 x 70) = 37 Det A3 = (10 x 496 x 1.545) + (70 x 1.191 x 91) + (169 x 642 x 70) - (91 x 496 x 169) – (642 x 1.191 x 10) – (1.545 x 70 x 70) = 26 Dari perhitungan diatas kita bisa mencari koefisien a, b1, b2 dengan perhitungan sebagai berikut: a
det A1 det A 248 = 44
=
= 5,6
det A2 det A 37 = 44
b1 =
= 0,84
det A3 det A 26 = 44
b2 =
= 0,59
Dengan demikian kita bisa menyatakan persamaan regresinya sebagai berikut: Y= 5,6 + 0,84 X1 + 0,59 X2 Koefisien Korelasi dan Koefisien Determinasi Model regresi adalah suatu model yang dihasilkan oleh metode yang disebut least square methode. Dalam setiap model regersi apabila digunakan untuk
PENGANTAR EKONOMETRI
11
memprediksi akan terjadi kesalahan dimana hasil persamaan regresi tidak sama dengan hasil nilai Y. Kesalahan ini disebut dengan standar error of estimate. Standar kesalahan ini terbagi menjadi dua yaitu kesalahan yang bisa dijelaskan oleh model regresi dan kesalahan yang tidak bisa dijelaskan oleh model regresi. Sebagaimana dibahas pada bab sebelumnya, koefisien korelasi adalah besar hubungan antara variabel independen dengan variabel dependen. Sedangkan koefisien determinasi adalah suatu indikator yang menunjukkan besarnya varians dari variabel depneden yang bisa dijelaskan oleh variabel independen. Sehingga untuk mencari koefisien determinasi kita bisa mendapatkan dari besarnya penyimpangan atau varians dari variabel dependen dibagi dengan total penyimpangan atau varians. R2=
Explained Variation Total Variation (Y Yˆ )2
= 1-
(Y Y )
2
Dimana R2 adalah koefisien determinasi Y adalah nilai Y Yˆ adalah nilai y prediksi Y rata-rata Y Sehingga koefisien korelasi adalah akar kuadrat dari koefisien determinasi. r= R 2 Dari soal pengaruh jumlah iklan di radio (X 1) dan jumlah iklan di koran (X2) terhadap volume penjualan diatas diperoleh persamaan regresinya adalah Y= 5,6+0,84X1+0,59X2, carilah koefisien korelasi dan koefisien determinasinya! Untuk mencari nilai Y kita memasukkan nilai X1 dan X2 kedalam persamaan dan mengurangi nilai Y dengan rata-rata Y, sehingga diperoleh tabel seperti dibawah.
PENGANTAR EKONOMETRI
12
Prediksi Y dengan X dan Varians Y Sampel X1
X2
Y
1 6 2 6 3 6 4 7 5 7 6 7 7 7 8 8 9 8 10 8 Jumlah 70
8 15 8 15 9 16 9 17 9 17 9 17 9 18 10 18 10 18 10 18 91 169
Y’ 15,36 15,36 15,95 16,79 16,79 16,79 16,79 18,22 18,22 18,22 168,49
(Y-Y’)2 0,1296 0,1296 0,0025 0,0441 0,0441 0,0441 1,4641 0,0484 0,0484 0,0484 2,0033
y2 2,25 2,25 0,25 0,25 0,25 0,25 2,25 2,25 2,25 2,25 14,5
Berdasarkan tabel diatas nilai koefisien determinasi dihitung dengan rumus: R2
= 1-
R2= 1-
(Y Yˆ ) (Y Y )
2 2
2,0033 14,5
R2= 0,86 Sehingga koefisien korelasinya adalah akar kuadrat dari koefisien determinasi. R = 0,86
= 0,928
PENGANTAR EKONOMETRI
13
Latihan Soal 1. Apa yang Sauadara ketahui tentang regresi 2. Diketahui data perekonomian negara ABC sebagai berikut : Perkembangan Ekonomi negara ABC Tahun GDP Konsumsi Inflasi 2000 1290 875 8 2001 1325 900 8 2002 1365 950 9 2003 1375 980 8 2004 1405 110 11 2005 1436 1025 10 2006 1454 1060 11 2007 1489 1075 8 2008 1510 1110 9 2009 1525 1130 8 2010 1560 1175 9 Sumber : Data hipotesis Pertanyaan : a. Buatlah persamaan regresi dan hasil regresinya b. Tentukan korelasi berganda, dan apa artinya 3. Diketahui data pengeluaran konsumsi dan pendapatan suatu wilayah tahun 2001-2012 sebagai berikut :
PENGANTAR EKONOMETRI
14
Tahun Konsumsi Pendapatan 2001 40 45 2002 45 50 2003 49 55 2004 52 60 2005 57 65 2006 64 70 2007 70 80 2008 75 85 2009 83 90 2010 90 100 2011 98 110 2012 105 115 Pertanyaan : a. Buatlah persamaan regresi dan hasil regresinya b. Tentukan korelasinya, dan apa artinya
PENGANTAR EKONOMETRI
15
DAFTAR PUSTAKA Allen L. Webster, Applied Statistics for Bussiness and Economics An Esseential Version, Third Edition, Irwin Mc Graw-Hill, 1998. Budiyuwono, Nugroho, Pengantar Statistik Ekonomi & Perusahaan, Jilid 2, Edisi Pertama, UPP AMP YKPN, Yogyakarta, 1996. Barrow, Mike. Statistics of Economics: Accounting and Business Studies. 3rd edition. Upper Saddle River, NJ: Prentice-Hall, 2001 Dajan, Anto. Pengantar Metode Statistik. Jakarta: Penerbit LP3ES, 1974 Daniel, Wayne W. Statistik Nonparametrik Terapan. Terjemahan Alex Tri Kantjono W. Jakarta: PT Gramedia Hasan, Iqbal M, Pokok-pokok Materi Statistik 2 (statistic deskriptif), Bumi Aksara, Jakarta, 1999. J. Supranto, Statistik Teori dan Aplikasi, Jilid 2, Edisi Kedua, Jakarta, Penerbit Erlangga, 2009 Wonnacott, Thomas H. and Ronald J. Wonnacott. Introductory Statistics for Business and Economics. Third edition. New York: John Wiley & Sons, 1990 Zainal Mustafa, Pengantar Statistik Deskriptif, Edisi Revisi, Ekonisia, Yogyakarta, 1998
PENGANTAR EKONOMETRI
16