Supawi Pawenang, 2011, Ekonometrika Terapan, IDEA Press Jogja
BAB IV REGRESI LINIER BERGANDA
Tujuan Pengajaran: Setelah mempelajari bab ini, anda diharapkan dapat: Mengetahui kegunaan dan spesifikasi model Menjelaskan hubungan antar variabel Mengaitkan data yang relevan dengan teori Mengembangkan data Menghitung nilai parameter Mengetahui arti dan fungsi parameter Menentukan signifikan tidaknya variabel bebas Menentukan determinasi model Menjelaskan tahapan-tahapan regresi Membaca hasil regresi Menyebutkan asumsi-asumsi. Membedakan dengan regresi linier sederhana
BAB IV REGRESI LINIER BERGANDA Pengertian Regresi linier Berganda Pada bab sebelumnya telah dibahas tentang regresi linier dengan 2 (dua) variabel (yaitu variabel Y dan X) atau biasa disebut dengan single linier regression. Pada bab ini jumlah variabel yang digunakan akan ditambah menjadi lebih banyak, yaitu satu variabel Y dan jumlah variabel X nya lebih dari 1 (satu) variabel. Artinya, variabel X bisa berjumlah 2, 3, atau lebih. Jumlah X yang lebih dari satu tersebut terkenal dengan istilah Regresi Linier Berganda atau multiple linier regression. Bertambahnya jumlah variabel X hingga lebih dari satu sangat memungkinkan, karena dalam keilmuan sosial semua faktor-vaktor atau variabel-variabel saling berkaitan satu dengan lainnya. Sebagai misal, munculnya inflasi tentu tidak hanya dipengaruhi oleh bunga deposito (budep) saja seperti yang telah diterangkan di atas, tetapi sangat mungkin dipengaruhi oleh faktor lain seperti perubahan nilai tukar (kurs), jumlah uang beredar, kelangkaan barang, dan lain-lain. Sebagaimana dalam teori inflasi, inflasi dapat digolongkan sebagai inflasi karena tarikan permintaan dan inflasi desakan biaya. Inflasi tarikan permintaan terjadi apabila masyarakat banyak memegang uang. Tentu secara singkat dapat diartikan bahwa terdapat jumlah kelebihan jumlah uang beredar yang ada di masyarakat. Selain itu dapat pula disebabkan ekspektasi masyarakat akibat adanya perubahan nilai tukar uang. Seperti yang pernah terjadi di Indonesia dalam kurun waktu pertengahan Juni 1997 hingga 2003, gerakan lonjakan inflasi ternyata terjadi pula pada gerakan lonjakan nilai tukar rupiah (IDR) terhadap dollar Amerika Serikat (USD). Inflasi desakan biaya mempunyai sebab yang hampir serupa. Inflasi jenis ini terjadi akibat melonjaknya harga-harga
faktor produksi. Kalau ditelusuri, melonjaknya harga- harga faktor produksi dapat disebabkan banyak hal seperti semakin langkanya jenis barang, tuntutan kenaikan gaji pekerja, semakin mahalnya ongkos transportasi, atau bisa juga disebabkan oleh adanya perubahan nilai tukar mata uang juga. Dari uraian singkat ini dapat disimpulkan bahwa pemicu terjadinya inflasi desakan biaya karena perubahan pada sisi supply, sedang inflasi tarikan permintaan disebabkan perubahan pada sisi demand. Berbagai alasan yang dijelaskan di atas, maka untuk semakin memperjelas perihal terjadinya inflasi, dapat dicoba menambah satu variabel penduga (X2) yaitu Kurs, yang menggambarkan nilai tukar IDR terhadap USD, pada kurun waktu yang sama dengan data sebelumnya yaitu antara Januari 2001 hingga Oktober 2002. Karena jumlah variabel X tidak lagi satu melainkan sudah dua, maka analisa yang akan digunakan adalah analisa regresi linier berganda. Dengan bertambahnya variabel Kurs sebagai variabel penduga, maka data yang dianalisis pun bertambah hingga menjadi sebagai berikut: X1 (Budep) 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19 15.88 15.76 15.55
Y (Inflasi) 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01 12.47 12.91 12.55 14.42 15.13 14.08 13.3
X2 (Kurs) 9433.25 9633.78 10204.7 11074.75 11291.19 11294.3 10883.57 8956.59 9288.05 10097.91 10554.86 10269.42 10393.82 10237.42 9914.26 9485.82
15.16 14.85 14.22 13.93 13.58 13.13 324.22
12.93 11.48 10.05 10.6 10.48 10.33 260.49
9115.05 8688.65 8964.7 8928.41 8954.43 9151.73 216816.7
Perubahan model dari bentuk single ke dalam bentuk multiple mengalami beberapa perubahan, meliputi: 1) jumlah variabel penjelasnya bertambah, sehingga spesifikasi model dan data terjadi penambahan. 2) rumus penghitungan nilai b mengalami perubahan, 3) jumlah degree of freedom dalam menentukan nilai t juga berubah. Model Regresi Linier Berganda Penulisan model regresi linier berganda merupakan pengembangan dari model regresi linier tunggal. Perbedaannya hanya terdapat pada jumlah variabel X saja. Dalam regresi linier tunggal hanya satu X, tetapi dalam regresi linier berganda variabel X lebih dari satu. Model regresi linier umumnya dituliskan sebagai berikut: Populasi: +e
Y = A + B1X1 + B2X2 + B3X3 + ………+ BnXn
Atau +e
Y = B0 + B1X1 + B2X2 + B3X3 + ………+ BnXn
Sampel : +e
Y = a + b1X1 + b 2X2 + b 3X3 + ………+ b nXn
Atau nXn + e
Y = b0 + b1X1 + b 2X2 + b 3X3 + ………+ b
Perlu diingat bahwa penulisan model sangat beragam. Hal ini dapat dimengerti karena penulisan model sendiri hanya bertujuan sebagai teknik anotasi untuk memudahkan interpretasi. Penulisan cara di atas adalah bentuk model yang sering dijumpai dalam beberapa literatur. Notasi model
seperti itu tentu berbeda dengan notasi model Yale16. Apabila kita ingin menganalisis pengaruh Budep dan Kurs terhadap Inflasi dengan mengacu model Yale, maka notasi model menjadi seperti berikut: Populasi:
Y = B1.23 + B12.3X2i + B13.2X3i + e
Sampel :
Y = b1.23 + b12.3X2i + b13.2X3i + e
Notasi model Yale ini mempunyai spesifikasi dalam menandai variabel terikat yang selalu dengan angka 1. Untuk variabel bebas notasinya dimulai dari angka 2, 3, 4, dan seterusnya.17 Notasi b1.23 berarti nilai perkiraan Y kalau X2 dan X3 masing-masing sama dengan 0 (nol). Notasi b12.3 berarti besarnya pengaruh X2 terhadap Y jika X3 tetap. Notasi b13..2 berarti besarnya pengaruh X3 terhadap Y jika X2 tetap. Penulisan model dengan simbol Y untuk variabel dependen, dan X untuk variabel independen, saat ini mulai ada penyederhanaan lagi, yang intinya untuk semakin memudahkan interpretasi. Berdasar pada keinginan mempermudah dalam mengingat variabel yang akan dibahas, maka notasi model dapat pula ditulis sebagai berikut: Inflasi
=
b0 + b1Budep + b2 Kurs +
Pers.f.2)
Penulisan dengan gaya seperti ini ternyata sekarang lebih disukai oleh penulis-penulis saat ini, karena memberikan kemudahan bagi para pembacanya untuk tidak mengingat- ingat arti dari simbol X yang dituliskan, tetapi cukup dengan melihat nama variabelnya. Dengan pertimbangan tersebut maka cara ini nanti juga akan banyak digunakan dalam pembahasan selanjutnya.
16
G.U. Yale, On the Theory of Correlation for any Number of Variables, Treated by a new System of Notation, Preceeding of Royal Society, A, Vol.79, 1970. 17 Penulisan model seperti ini ditemui pula dalam buku-buku karya Gujara
Penghitungan Nilai Parameter Penggunaan metode OLS dalam regresi linier berganda dimaksudkan untuk mendapatkan aturan dalam mengestimasi parameter yang tidak diketahui. Prinsip yang terkandung dalam OLS sendiri adalah untuk meminimalisasi perbedaan jumlah kuadrat kesalahan (sum of square) antara nilai observasi Y dengan Yˆ . Secara matematis, fungsi minimalisasi sum of square ditunjukkan dalam rumus:
Untuk mendapatkan estimasi least square b0, b1,b2 minimum, dapat dilakukan melalui cara turunan parsial (partially differentiate) dari formula di atas, sebagai berikut:
Jadikan nilai-nilai turunan parsial di atas menjadi sama dengan 0 (nol), dengan cara membagi dengan angka 2, hingga menjadi:
Untuk menyederhanakan rumus paling atas dilakukan pembagian dengan n, sehingga memperoleh rumus baru sebagai berikut:
Kalau kita notasikan:
maka b1 dan b2 dapat dicari dengan rumus:
Telah dikemukaan di atas bahwa pencarian nilai b pada single linier berbeda dengan multiple linier. Perbedaan ini muncul karena jumlah variabel penjelasnya bertambah. Semakin banyaknya variabel X ini maka kemungkinankemungkinan yang menjelaskan model juga mengalami pertambahan. Dalam single linier kemungkinan perubahan variabel lain tidak terjadi, tetapi dalam multiple linier hal itu terjadi. Misalnya, Jika terjadi perubahan pada X1, meskipun X2 konstan, akan mampu merubah nilai harapan dari Y. Begitu pula, perubahan pada X2, meskipun X1 konstan, akan mampu merubah nilai harapan dari Y. Perubahan yang terjadi pada X1 atau X2 tentu mengakibatkan perubahan nilai harapan Y atau E(Y/X1,X2) yang berbeda. Oleh karena itu pencarian nilai b mengalami perubahan.
Guna mengetahui seberapa besar kontribusi X1 terhadap perubahan Y, tentu perlu untuk melakukan kontrol pengaruh dari X2. Begitu pula, untuk mengetahui kontribusi X2, maka perlu juga melakukan kontrol terhadap X1. Dari sini dapat timbul pertanyaan, bagaimana caranya mengontrolnya? Untuk menjawabnya, perlu ilustrasi secara konkrit agar mudah dipahami. Misalnya kita hendak mengontrol pengaruh linier X2 ketika melakukan pengukuran dampak dari perubahan X1 terhadap Y, maka dapat melakukan langkah-langkah sebagai berikut: Tahap pertama: lakukan regresi Y terhadap X2. Y = b0 + b2 X2 + e1 Dimana e1 merupakan residual, yang besarnya: e1 = Y – b0 – b2X2 = Y- Yˆ Tahap kedua: lakukan regresi X1 terhadap X2 X1 = b0 + b2 X2 + e2 Dimana e1 merupakan residual, yang besarnya: e2 = X1 – b0 – b2X2 = X1- Xˆ Tahap ketiga: lakukan regresi e1 terhadap e2 e1 = a0 + a1e2 +e3 Besarnya a1 pada tahap ketiga inilah yang merupakan nilai pasti atau net effect dari perubahan satu unit X1 terhadap Y, atau menunjukkan kemiringan (slope) garis Y atas variabel X1. Logika dari teori tersebut yang mendasari rumus yang dapat digunakan untuk menentukan koefisien regresi parsial (partial regression coefficients) (baca: b1, b2). Dengan memanfaatkan data yang telah tersedia, kita dapat pula menentukan nilai b1 variabel Budep maupun b2 variabel Kurs. Pencarian koefisien regresi tersebut dapat dilakukan dengan
menggunakan rumus-rumus yang telah ditentukan di atas. Guna mempermudah dalam memasukkan angka-angka ke dalam rumus, maka data yang ada perlu diekstensifkan sesuai dengan kebutuhan rumus tersebut. Hasil ekstensifikasi dari beberapa rumus yang dicari sebagai berikut:
Dengan menggunakan rumus-rumus tersebut di atas, maka nilai total masing-masing komponen rumus yang dikembangkan adalah tertera sebagai berikut: X1 324.22
Y X2 260.49 216,816.70
x
1
x
2
22.40 14,318,503.69
x y x 1
32.48
2
x x
y
7,274.46
1 2
2,227.72
Berdasarkan data-data yang tertera dalam tabel di atas, maka nilai b0, b1, dan b2 dapat ditentukan, melalui pencarian menggunakan rumus-rumus sebagai berikut: Rumus untuk mencari nilai b1 (pada model multiple regression) adalah:
Rumus untuk mencari nilai b2 (pada model multiple regression) adalah:
Rumus untuk mencari nilai b0 (pada model multiple regression) adalah:
Dengan menggunakan rumus pencarian b1 di atas, maka diketahui bahwa nilai b1 adalah:
Dengan menggunakan rumus pencarian b2 di atas, maka diketahui bahwa nilai b2 adalah:
Dengan menggunakan rumus pencarian b0 di atas, maka diketahui bahwa nilai b0 adalah: b0 Y b1 X 1 b2 X 2
= 11,84-1,421(14,73)-0,0002869(9.855,30) = 11,84-20,93,2,827 = -11,917 Nilai dari parameter b1 dan b2 merupakan nilai dari suatu sampel. Nilai b1 dan b2 tergantung pada jumlah sampel yang ditarik. Penambahan atau pengurangan akan mengakibatkan perubahan rentangan nilai b. Perubahan rentang nilai b1 dan b2 diukur dengan standar error. Semakin besar standar error mencerminkan nilai b sebagai penduga populasi semakin kurang representatif. Sebaliknya, semakin kecil standar error maka keakuratan daya penduga nilai b terhadap populasi semakin tinggi. Perbandingan antara nilai b dan standar error ini memunculkan nilai t, yang dapat dirumuskan sebagai berikut: t
b Sb
dimana: b = nilai parameter Sb = standar error dari b. Jika b sama dengan 0 (b=0) atau Sb bernilai sangat besar, maka nilai t akan sama dengan atau mendekati 0 (nol). Untuk dapat melakukan uji t, perlu menghitung besarnya standar error masing-masing parameter ( baik b0, b1, b2), seperti diformulakan Gujarati (1995:198-199) sebagai berikut:
Rumus-rumus di atas, dapat kita masuki dengan angkaangka yang tertera pada tabel, hanya saja belum semuanya dapat terisi. Kita masih memerlukan lagi angka untuk mengisi rumus e 2 . Untuk dapat mengisi rumus tersebut, perlu terlebih dulu mencari nilai e. Nilai e adalah standar error yang terdapat dalam persamaan regresi. Perhatikan persamaan regresi: Y = b0 + b1X1 + b2 X2 + e atau Inflasi = b0 + b1Budep + b2 Kurs + e Secara matematis, dari persamaan regresi di atas nilai e dapat diperoleh, dengan cara mengubah posisi tanda persamaan hingga menjadi:
eY- (b0 + b1X1 + b2 X2)
Dengan memasukkan nilai b0, b1, b2, yang telah didapatkan, dan X1i, X2i, yang ada pada data, maka nilai total e dapat terlihat pada tabel berikut: X1 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67
Y 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01
X2 9433.25 9633.78 10204.70 11074.75 11291.19 11294.30 10883.57 8956.59 9288.05
B0 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933
B1 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421
B2 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287
e e^2 -1.05 1.11 -1.31 1.73 -0.23 0.05 -0.33 0.11 -0.42 0.18 0.71 0.50 1.40 1.97 0.32 0.10 0.01 0.00
15.91 12.47 10097.91 16.02 12.91 10554.86 16.21 12.55 10269.42 16.19 14.42 10393.82 15.88 15.13 10237.42 15.76 14.08 9914.26 15.55 13.3 9485.82 15.16 12.93 9115.05 14.85 11.48 8688.65 14.22 10.05 8964.70 13.93 10.6 8928.41 13.58 10.48 8954.43 13.13 10.33 9151.73 324.22 260.49 216816.70
-11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933
1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421
0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287
-1.10 1.21 -0.95 0.90 -1.50 2.24 0.37 0.13 1.56 2.43 0.77 0.60 0.41 0.17 0.71 0.50 -0.18 0.03 -0.80 0.63 0.18 0.03 0.55 0.30 0.98 0.96 0.09 15.90
Dari tabel di atas dapat diketahui bahwa nilai total nilai e adalah sebesar 0.09, sedangkan total nilai e2 adalah sebesar 15,90. Berdasarkan angka yang didapatkan tersebut, maka standar error b0, b1, b2, dapat dicari menggunakan rumus yang ada hingga hasil penghitungannya tertera sebagai berikut:
Setelah diketahui semua nilai standar error (Sb0, Sb1, Sb2) melalui penggunaan rumus-rumus di atas, maka nilai t untuk masing-masing parameter dapat diperoleh, karena nilai t merupakan hasil bagi antara b dengan Sb. Pencarian nilai t mempunyai kesamaan dengan model regresi linier sederhana, hanya saja pencarian Sb nya yang berbeda. Pencarian masing-masing nilai t dapat dirumuskan sebagai berikut: Mencari nilai statistik tb0: t b0
b0 Sb 0
Mencari nilai statistik tb1: t b1
b1 S b1
Mencari nilai statistik tb2: tb2
b2 ; Sb 2
Dengan menggunakan rumus-rumus di atas, maka nilai tb0 adalah: dengan diketahuinya nilai t hitung masing-masing parameter, maka dapat digunakan untuk mengetahui signifikan tidaknya variabel penjelas dalam mempengaruhi variabel terikat. Untuk dapat mengetahui apakah signifikan atau tidak nilai t hitung tersebut, maka perlu membandingkan dengan nilai t tabel. Apabila nilai t hitung lebih besar dibandingkan dengan nilai t tabel, maka variabel penjelas tersebut signifikan. Sebaliknya, jika nilai t hitung lebih kecil darit tabel, maka variabel penjelas tersebut tidak signifikan. Karena nilai tb1 adalah sebesar 7,938, yang berarti lebih besar dibanding nilai tabel pada =5% dengan df 19 yang besarnya 2,093, maka dapat dipastikan bahwa variabel budep secara individual signifikan mempengaruhi inflasi. Sedangkan nilai tb2 yang besarnya 1,284 adalah lebih kecil dibandingkan dengan nilai t tabel pada =5% dengan df 19 yang besarnya 2,093, maka dapat dipastikan bahwa variabel Kurs secara individual tidak signifikan mempengaruhi inflasi. Pengujian kedua nilai t dapat dijelaskan dalam bentuk gambar sebagai berikut:
Bantuan dengan SPSS Tahapan-tahan yang dilalui untuk melakukan regresi linier berganda dengan penghitungan-penghitungan nilai a, b, Sb di atas, dapat dilakukan dengan bantuan SPSS dengan tahapan sebagai berikut: Pastikan data SPSS sudah siap Lakukan regresi, caranya: pilih Analyze, Reression, Linear
Masukkan variabel Y ke kotak variabel dependen, dan variabel X1 dan X2 ke kotak variabel Independen, kemudian klik OK.
Hasil regresi akan tampak dalam output regression yang menunjukkan tabel: model summary (memuat R2), ANOVA (memuat nilai F), Coefficient (memuat nilai t). Model Summary
Model 1
R .867a
R Square .752
Adjusted R Square .726
Std. Error of the Estimate .9148
a. Predictors: (Constant), X2, X1
ANOVAb
Model 1
Sum of Squares Regression
df
Mean Square
Residual
48.261 15.899
2 19
Total
64.160
21
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
24.130 .837
F 28.836
Sig. .00 0a
Coefficientsa
Model 1
Unstandardized Coefficients B Std. Error
(Constant) -11.933 X1 1.421 X2 2.869E-04 a. Dependent Variable: Y
3.511 .195 .000
Standardi zed Coefficien ts Beta .840 .136
t -3.399 7.298 1.177
Sig. .003 .000 .254
Catatan: Nilai a, b1, b2, antara hitungan manual dengan hitungan SPSS terdapat sedikit perbedaan angka di belakang koma. Ini disebabkan oleh pembulatan angka saat penghitungan. Angka 2.869E-04 dibaca 0,0002869
Koefisien Determinasi (R2) Disamping menguji signifikansi dari masingmasing variabel, kita dapat pula menguji determinasi seluruh variabel penjelas yang ada dalam model regresi. Pengujian ini biasanya disimbolkan dengan koefisien regresi yang biasa disimbolkan dengan R2. Uraian tentang koefisien determinasi sedikit banyak telah disinggung pada single linier regression. Pada sub bahasan ini hanya menambah penjelasan-penjelasan agar menjadi lebih lengkap saja. Koefisien determinasi pada dasarnya digunakan untuk mengkur goodness of fit dari persamaan regresi, melalui hasil pengukuran dalam bentuk prosentase yang menjelaskan determinasi variabel penjelas (X) terhadap variabel yang dijelaskan (Y). Koefisien determinasi dapat dicari melalui hasil bagi dari total sum of square (TSS) atau total variasi Y terhadap explained sum of square (ESS) atau variasi yang dijelaskan Y. Dengan demikian kita dapat mendefinisikan lagi R2 dengan arti rasio antara variasi yang dijelaskan Y dengan total variasi Y. Rumus tersebut adalah sebagai berikut: R2
ESS TSS
Total variasi Y (TSS) dapat diukur menggunakan derajat deviasi dari masing-masing observasi nilai Y dari rata-ratanya. Hasil pengukuran ini kemudian dijumlahkan hingga mencakup seluruh observasi. Jelasnya:
n
TSS =
(Y
t
Y )2
t 1
Nilai explained sum of square (ESS) atau variasi yang dijelaskan Y didapat dengan menggunakan rumus sebagai berikut: n
ESS =
(Yˆ t 1
t
Y )2
Jadi, rumus di atas dapat pula dituliskan menjadi sebagai berikut:
(Yˆ Y ) (Y Y )
2
R2
2
dimana: Yˆ (baca: Y cap) adalah nilai perkiraan Y atau estimasi
garis regresi. Y (baca: Y bar) adalah nilai Y rata-rata.
Y cap diperoleh dengan cara menghitung hasil regresi dengan memasukkan nilai parameter dan data variabel. Penghitungan nilai Y cap menjadi penting untuk dilakukan agar mempermudah kita dalam menggunakan rumus R2 yang telah ditentukan di atas. Sebagai contoh menghitung Y cap, berikut ini dihitung nilai Y cap pada observasi 1. Hasil regresi adalah: Y = -11,917 + 1,421 (X1) + 0,0002869(X2) Jika observasi nomor 1 (satu) kita hitung, dimana X1= 13,06 dan X2 = 9.433,25, maka nilai Yˆ1 -11,917 + 1,421 (13,06) + 0,0002869(9.433,25)
= 9,438 Hasil hitungan Y cap individual maupun total, beserta ekstensinya diperlukan untuk menyesuaikan dengan rumus mencari R2. Hasil perhitungan dan pengembangan data selengkapnya tertera dalam tabel sebagai berikut: X1 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19 15.88 15.76 15.55 15.16 14.85 14.22 13.93 13.58 13.13 324.22
Y 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01 12.47 12.91 12.55 14.42 15.13 14.08 13.3 12.93 11.48 10.05 10.6 10.48 10.33 260.49
X2 9433.25 9633.78 10204.70 11074.75 11291.19 11294.30 10883.57 8956.59 9288.05 10097.91 10554.86 10269.42 10393.82 10237.42 9914.26 9485.82 9115.05 8688.65 8964.70 8928.41 8954.43 9151.73 216816.70
B0 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933
B1 B2 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287
Yˆ 9.348 10.471 10.862 10.856 11.259 11.416 11.654 11.925 13.015 13.588 13.876 14.064 14.071 13.586 13.322 12.901 12.240 11.678 10.862 10.439 9.949 9.366 260.747
2 2 ˆ Yˆ Y (Y Y ) Y Y (Y Y )
-2.493 -1.370 -0.978 -0.985 -0.581 -0.424 -0.187 0.085 1.174 1.748 2.035 2.223 2.230 1.745 1.482 1.061 0.400 -0.163 -0.979 -1.401 -1.891 -2.474 0.256
6.214 1.876 0.957 0.969 0.338 0.180 0.035 0.007 1.379 3.054 4.142 4.943 4.975 3.045 2.196 1.125 0.160 0.027 0.958 1.964 3.577 6.121 48.243
-3.561 -2.701 -1.221 -1.331 -1.021 0.269 1.200 0.390 1.170 0.630 1.070 0.710 2.580 3.290 2.240 1.460 1.090 -0.361 -1.791 -1.241 -1.361 -1.511 -0.001
Dengan menggunakan angka-angka yang terdapat dalam tabel di atas, maka nilai R2 dapat ditentukan. Adapun rumus untuk mencari nilai R2 adalah sebagai berikut:
12.677 7.293 1.490 1.770 1.041 0.073 1.439 0.152 1.368 0.396 1.144 0.503 6.654 10.821 5.015 2.130 1.187 0.130 3.206 1.539 1.851 2.282 64.160
(Yˆ Y ) (Y Y )
2
R
2
2
dengan demikian nilai R2 dari model yang ada adalah sebesar: R2 =
48,243 64,160
R2 = 0,751 Nilai R2 sebesar 0,751 tersebut menunjukkan arti bahwa determinasi variabel Budep (X1) dan Kurs (X2) dalam mempengaruhi inflasi (Y) adalah sebesar 75,1%. Nilai sebesar ini mengindikasikan bahwa model yang digunakan dalam menjelaskan variabel Y cukup baik, karena mencapai 75,1%. Sisanya sebesar 24,1% dijelaskan oleh variabel lain yang tidak dijelaskan dalam model. Uji F Seperti telah dikemukakan di atas, bahwa dalam regresi linier berganda variabel penjelasnya selalu berjumlah lebih dari satu. Untuk itu, maka pengujian tingkat signifikansi variabel tidak hanya dilakukan secara individual saja, seperti dilakukan dengan uji t, tetapi dapat pula dilakukan pengujian signifikansi semua variabel penjelas secara serentak atau bersama-sama. Pengujian secara serentak tersebut dilakukan dengan teknik analisis of variance (ANOVA) melalui pengujian nilai F hitung yang dibandingkan dengan nilai F tabel. Oleh karena itu disebut pula dengan uji F. Pada prinsipnya, teknik ANOVA digunakan untuk menguji distribusi atau variansi means dalam variabel
penjelas apakah secara proporsional telah signifikan menjelaskan variasi dari variabel yang dijelaskan. Untuk memastikan jawabannya, maka perlu dihitung rasio antara variansi means (variance between means) yang dibandingkan dengan variansi di dalam kelompok variabel (variance between group). Hasil pembandingan keduanya itu (rasio antara variance between means terhadap variance between group) menghasilkan nilai F hitung, yang kemudian dibandingkan dengan nilai F tabel. Jika nilai F hitung lebih besar dibanding nilai F tabel, maka secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y. Sebaliknya, jika nilai F hitung lebih kecil dibandingkan dengan nilai F tabel, maka tidak secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y. Atau secara ringkas dapat dituliskan sebagai berikut: F F ;( k 1);( n k ) berarti tidak signifikan atau H0
diterima F F ;( k 1);( n k ) berarti signifikan atau H0 ditolak
H0 diterima atau ditolak, adalah merupakan suatu keputusan jawaban terhadap hipotesis yang terkait dengan uji F, yang biasanya dituliskan dalam kalimat sebagai berikut: H0 : b1 = b2 = 0 Variabel penjelas secara serentak tidak signifikan mempengaruhi variabel yang dijelaskan. H0 : b1 b2 0 Variabel penjelas secara serentak signifikan mempengaruhi variabel yang dijelaskan.
Karena uji F adalah membandingkan antara nilai F hitung dengan nilai F tabel, maka penting untuk mengetahui bagaimana mencari nilai F hitung ataupun nilai F tabel. Nilai F hitung dapat dicari dengan menggunakan rumus sebagai berikut: F
R 2 /(k 1) (1 R 2 ) /(n k )
Sedangkan nilai F tabel telah ditentukan dalam tabel. Yang penting untuk diketahui adalah bagaimana cara membaca tabelnya. Seperti yang telah dituliskan pada pembandingan antara nilai F hitung dan nilai F tabel di atas, diketahui bahwa F tabel dituliskan F;k-1; (n-k). Arti dari tulisan tersebut adalah: Simbol menjelaskan tingkat signifikansi (level of significance) (apakah pada 0,05 atau 0,01 ataukah 0,10, dan seterusnya). Simbol (k-1) menunjukkan degrees of freedom for numerator. Simbol (n-k) menunjukkan degrees of freedom for denominator. Guna melengkapi hasil analisis data yang dicontohkan di atas, kita dapat menghitung nilai F berdasarkan rumus. Nilai F dari model tersebut ternyata besarnya adalah: F
R 2 /(k 1) (1 R 2 ) /(n k )
(0,751) /(3 1) (1 0,751) /(22 3) 0.3755 = 28.66 = 0.0131
=
Dari hasil penghitungan di atas diketahui bahwa nilai F hitung adalah sebesar 28,66. Nilai ini lebih besar dibanding dengan nilai F tabel pada 0,05 dengan (k-1) = 2, dan (n-k) = (22-3) = 19 yang besarnya 3,52. Dengan demikian dapat disimpulkan bahwa variabel Budep dan Kurs secara serentak signifikan mempengaruhi inflasi. Dengan demikian, maka null hyphothesis ditolak. Daerah penolakan atau penerimaan hipotesis dapat dilihat pada gambar berikut ini:
Daerah diterima Daerah ditolak F(; k-1; n-k)
F0,05;2;19; 3,52
Gb.3.2. Daerah Uji F
-000-
F
Tugas: 1. Buatlah rangkuman dari pembahasan di atas! 2. Cobalah untuk menyimpulkan maksud dari uraian bab ini! 3. Lakukanlah perintah-perintah di bawah ini: a. Coba jelaskan apa yang dimaksud dengan regresi linier berganda! b. Coba tuliskan model regresi linier berganda! c. Coba uraikan arti dari notasi atas model yang telah anda tuliskan! d. Jelaskan informasi apa yang dapat diungkap pada konstanta! e. Jelaskan informasi apa yang dapat diungkap pada koefisien regresi! f. Coba sebutkan perbedaan-perbedaan antara model regresi linier sederhana dengan model regresi linier berganda! g. Jelaskan mengapa rumus untuk mencari nilai b pada model regresi linier erganda berbeda dengan model regresi linier sederhana! h. Coba jelaskan apakah pencarian nilai t juga mengalami perubahan! kenapa? i. Coba uraikan bagaimana menentukan nilai t yang signifikan! j. Jelaskan apa kegunaan nilai F! k. Bagaimana menentukan nilai F yang signifikan? l. Jelaskan apakah rumus dalam mencari koefisien determinasi pada model regresi linier berganda berbeda dengan regresi linier sederhana! kenapa? m. Jelaskan bagaimana variabel penjelas dapat dianggap sebagai prediktor terbaik dalam menjelaskan Y!
Jawab : 1.
Rangkuman A. Pengertian Regresi linier Berganda Jumlah X yang lebih dari satu tersebut terkenal dengan istilah Regresi Linier Berganda atau multiple linier regression. B. Model Regresi Linier Berganda Penulisan model regresi linier berganda merupakan pengembangan dari model regresi linier tunggal. Model regresi linier umumnya dituliskan sebagai berikut: - Populasi: Y = A + B1X1 + B2X2 + B3X3 + ………+ BnXn + e Atau Y = B0 + B1X1 + B2X2 + B3X3 + …..+ BnXn + e - Sampel : Y = a + b1X1 + b 2X2 + b 3X3 + ………+ b nXn + e Atau Y = b0 + b1X1 + b 2X2 + b 3X3 + ………+ b C. Penghitungan Nilai Parameter Penggunaan metode OLS dalam regresi linier berganda dimaksudkan untuk mendapatkan aturan dalam mengestimasi parameter yang tidak diketahui. Prinsip yang terkandung dalam OLS sendiri adalah untuk meminimalisasi perbedaan jumlah kuadrat kesalahan (sum of square) antara nilai observasi Y dengan Yˆ . Secara matematis, fungsi minimalisasi sum of square ditunjukkan dalam rumus:
Nilai dari parameter b 1 dan b2 merupakan nilai dari suatu sampel. Nilai b1 dan b2 tergantung pada jumlah sampel yang ditarik. Penambahan atau pengurangan akan mengakibatkan perubahan rentangan nilai b. Perubahan rentang nilai b1 dan b2 diukur dengan standar error. Semakin besar standar error mencerminkan nilai b sebagai penduga populasi semakin kurang representatif. Sebaliknya, semakin kecil standar error maka keakuratan daya penduga nilai b terhadap populasi semakin
tinggi. Perbandingan antara nilai b dan standar error ini memunculkan nilai t, yang dapat dirumuskan sebagai berikut: t=
b Sb
dimana: b = nilai parameter Sb = standar error dari b. Jika b sama dengan 0 (b=0) atau Sb bernilai sangat besar, maka nilai t akan sama dengan atau mendekati 0 (nol). Untuk dapat melakukan uji t, perlu menghitung besarnya standar error masing-masing parameter ( baik b0, b1, b2), seperti diformulakan Gujarati (1995:198-199) sebagai berikut:
Pencarian masing-masing nilai t dapat dirumuskan sebagai berikut: Mencari nilai statistik tb0: t b0
b0 Sb 0
Mencari nilai statistik tb1: t b1
b1 S b1
Mencari nilai statistik tb2: tb2
b2 ; Sb 2
Dengan menggunakan rumus-rumus di atas, maka nilai tb0 adalah: Dengan diketahuinya nilai t hitung masing-masing parameter, maka dapat digunakan untuk mengetahui signifikan tidaknya variabel penjelas dalam mempengaruhi variabel terikat. Untuk dapat mengetahui apakah signifikan atau tidak nilai t hitung tersebut, maka perlu membandingkan dengan nilai t tabel. Apabila nilai t hitung lebih besar dibandingkan dengan nilai t tabel, maka variabel penjelas tersebut signifikan. Sebaliknya, jika nilai t hitung lebih kecil darit tabel, maka variabel penjelas tersebut tidak signifikan. Pengujian kedua nilai t dapat dijelaskan dalam bentuk gambar sebagai berikut:
Bantuan dengan SPSS Tahapan-tahan yang dilalui untuk melakukan regresi linier berganda dengan penghitungan-penghitungan nilai a, b, Sb di atas, dapat dilakukan dengan bantuan SPSS dengan tahapan sebagai berikut: Pastikan data SPSS sudah siap Lakukan regresi, caranya: pilih Analyze, Reression, Linear Masukkan variabel Y ke kotak variabel dependen, dan variabel X1 dan X2 ke kotak variabel Independen, kemudian klik OK. Hasil regresi akan tampak dalam output regression yang menunjukkan tabel: model summary (memuat R 2), ANOVA (memuat nilai F), Coefficient (memuat nilai t). D. Koefisien Determinasi (R2) Dengan demikian kita dapat mendefinisikan lagi R² dengan arti rasio antara variasi yang dijelaskan Y dengan total variasi Y.
Rumus tersebut adalah sebagai berikut:
Adapun rumus untuk mencari nilai R² adalah sebagai berikut:
E. Uji F Pengujian secara serentak tersebut dilakukan dengan teknik analisis of variance (ANOVA) melalui pengujian nilai F hitung yang dibandingkan dengan nilai F tabel. Oleh karena itu disebut pula dengan uji F. Pada prinsipnya, teknik ANOVA digunakan untuk menguji distribusi atau variansi means dalam variabel penjelas apakah secara proporsional telah signifikan menjelaskan variasi dari variabel yang dijelaskan. Hasil pembandingan keduanya itu (rasio antara variance between means terhadap variance between group) menghasilkan nilai F hitung, yang kemudian dibandingkan dengan nilai F tabel. Jika nilai F hitung lebih besar dibanding nilai F tabel, maka secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y. Sebaliknya, jika nilai F hitung lebih kecil dibandingkan dengan nilai F tabel, maka tidak secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y.
Nilai F hitung dapat dicari dengan menggunakan rumus sebagai berikut:
Dimana: - Simbol α menjelaskan tingkat signifikansi (level of significance) (apakah pada α = 0,05 atau α=0,01 ataukah -
2.
α=0,10, dan seterusnya). Simbol (k-1) menunjukkan degrees of freedom for numerator. Simbol (n-k)menunjukkan degrees of freedom for denominator.
Kesimpulan :
Jumlah X yang lebih dari satu tersebut terkenal dengan istilah Regresi Linier Berganda atau multiple linier regression. Penggunaan metode OLS dalam regresi linier berganda dimaksudkan untuk mendapatkan aturan dalam mengestimasi parameter yang tidak diketahui. R² dengan arti rasio antara variasi yang dijelaskan Y dengan total variasi Y. Pengujian secara serentak tersebut dilakukan dengan teknik analisis of variance (ANOVA) melalui pengujian nilai F hitung yang dibandingkan dengan nilai F tabel. Oleh karena itu disebut pula dengan uji F. Pada prinsipnya, teknik ANOVA digunakan untuk menguji distribusi atau variansi means dalam variabel penjelas apakah secara proporsional telah signifikan menjelaskan variasi dari variabel yang dijelaskan. Hasil pembandingan keduanya itu (rasio antara variance between means terhadap variance between group) menghasilkan nilai F hitung, yang kemudian dibandingkan dengan nilai F tabel. Jika nilai F hitung lebih besar dibanding nilai F tabel, maka secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y. Sebaliknya, jika nilai F hitung lebih kecil dibandingkan dengan nilai F tabel, maka tidak secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y. 3.
Jawab Pertanyaan :
a. Jumlah X yang lebih dari satu b. Penulisannya : Penulisan model regresi linier berganda merupakan pengembangan dari model regresi linier tunggal. Model regresi linier umumnya dituliskan sebagai berikut:
-
-
Populasi: Y = A + B1X1 + B2X2 + B3X3 + ………+ BnXn + e Atau Y = B0 + B1X1 + B2X2 + B3X3 + …..+ BnXn + e Sampel : Y = a + b1X1 + b 2X2 + b 3X3 + ………+ b nXn + e Atau Y = b0 + b1X1 + b 2X2 + b 3X3 + ………+ b
c. Arti dari symbol yang dituliskan Y = Variabel bebas X = Variabel terikat A = Konstanta B = Koefisien regresi (nilai peningkatan ataupun penurunan) d. Konstanta merupakan nilai Y apabila X1, X2…..Xn = 0
e. Koefisien regresi merupakan nilai peningkatan ataupun penurunan) f. Analisis regresi yang hanya melibatkan dua variabel saja, yaitu 1 (satu) variabel dependen atau variabel tergantung dan 1 (satu) variabel independen atau variabel bebas. Analisis regresi linier berganda adalah analisis regresi yang melibatkan lebih dari dua variabel, yaitu 1 (satu) variabel dependen atau variabel tergantung dan lebih dari 1 (satu) variabel independen atau bebas. g. Karena regresi linier berganda memiliki variabel (X) lebih dari dua sedangkan regresi linier hanya memiliki satu variabel sehingga rumus yang digunakan sama. h. Mengalami perubahan karena variable independen lebih dari satu i. Derajat signifikansi yang digunakan adalah 0,05. Apabila nilai signifikan lebih kecil dari derajat kepercayaan maka kita menerima hipotesis alternatif, yang menyatakan bahwa suatu variabel independen secara parsial mempengaruhi variabel dependen. j. Pengujian tingkat signifikansi variabel tidak hanya secara individual saja tapi pada semua variabel k. Jika nilai F hitung lebih besar dibanding nilai F tabel maka secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y. l. Menguji determinasi seluruh variabel penjelas yang ada dalam model regresi m. Nilai koefisien ini antara 0 dan 1, jika hasil lebih mendekati angka 0 berarti kemampuan variabel-variabel independen dalam menjelaskan variasi variabel amat terbatas. Tapi jika hasil mendekati angka 1 berarti variabel-variabel independen
memberikan hampir semua informasi yang dibutuhkan untuk memprediksi variasi variabel dependen.