BAB VI ANALISIS REGRESI LINEAR GANDA
1. Pendahuluan Analisis regresi merupakan suatu analisis antara dua variabel yaitu variabel independen (Prediktor) yaitu variabel X dan variabel dependent (Respon) yaitu variabel Y, dimana X diasumsikan mempengaruhi Y secara linear. Pada bab ini akan dipelajari analisis regresi yang melibatkan k variabel independent X1,….,Xk yang mempengaruhi variabel dependent Y secara linear.
a. Model Populasi
b. Estimasi fungsi regresi Estimator b0 , b1,...,bk dicari salah satunya dengan menggunakan metode LSE (Least Square Error) yaitu metode yang meminimalkan jumlah kuadrat Error.
Nilai L di atas akan minimum jika derivatif parsialnya terhadap β0, β1,. βk sama dengan nol.
Universitas Gadjah Mada
1
Universitas Gadjah Mada
2
CONTOH 1. Data berikut menunjukkan umur barang waktu dilelang X1 , Jumlah penawarX2 , dan Harga Y pada suatu lelang. Akan dicari hubungan regresi linear antara ketiga variabel di atas. Dipunyai data sebagai berikut di bawah ini :
Dari data didefinisikan Matrik-matrik sebagai berikut :
Diperoleh nilai
dan persamaan regresi Y = -1563,16 + 14,34X1 +
87,6X2 Dengan menggunakan software Excell diperoleh output sebagai berikut :
Jika diperhatikan terdapat nilai intercept -1563,16 yang tidak relevan dengan kondisi yang sebenarnya, untuk itu sebaiknya regresi tidak menggunakan konstan dan diperoleh persamaan regresi seperti di bawah ini
Universitas Gadjah Mada
3
Koefisien Determinasi ganda R2 dan Analisis Variansi
Untuk regresi ganda yang melibatkan lebih dan satu variabel maka sangat efisien bila dilakukan suatu uji signifikansi terhadap keseluruhan variabel independentnya. Karena regresi linear merupakan keluarga model linear seperti anova maka uji anova dipakai dalam analisis regresi.
Universitas Gadjah Mada
4
Anava Dalam Regresi
Uji hipotesis di atas lazim ditabelkan dalam table Anova sepertio dibawah ini :
Jika H0 tIdak ditolak maka tidak ada persamaan regresi linear, karena semua variabel independent tidak signifikan. Jika H0 ditolak maka akan ada minimal satu variabel yang signifikan, hal ini menjamin adanya persamaan regresi linear.
Universitas Gadjah Mada
5
Representasi Regresi Linear dengan Matrik Dalam model regresi linear dipunyai persamaan seperti berikut :
Persamaan di atas dapat direpresentasikan dalam bentuk matrik sbb :
Estimasi parameter dengan LSE Dalam representasi matrik diperoleh
Dengan menurunkan jumlahan di atas terhadap β diperoleh
Sebagai estimator LSE
Universitas Gadjah Mada
6
Korelasi Parsial Koefisien korelasi sederhana r yang dipelajari pada bab terdahulu hanya didefinisikan untuk dua variabel. Jika ada lebih dari dua variabel maka r tidak cocok dipakai. Untuk lebih dari dua variabel yang saling berhubungan dikembangkan korelasi parsial yaitu korelasi antara dua variabel dengan mengontrol (mengeluarkan) pengaruh variabel lainnya. Misalkan X1, X2 , X3 tiga variabel. Korelasi parsial antara X1, X2 bila X3 dikontrol didefinisikan sebagai berikut :
Contoh: Terdapat data dari sembilan bayi waktu lahir yaitu
Dari data di atas diperoleh: rX1X2 = 0.263 rX1X3 = 0.150 rX2X3 = 0.780 Output dari SPSS dapat dilihat sebagai berikut:
Dari data di atas dapat dihitung nilai koefisien korelasi parsial
Universitas Gadjah Mada
7
Menggunakan rumus di atas akan sulit jika ada lebih dari dua variabel pengontrol karena rumusnya jadi Iebih komplek lagi. Cara lain menghitung korelasi parsial adalah dengan menggunakan regresi. Penggunaan regresi untuk mengontroI (mengeluarkan) pengaruh variabel kontrol. Sebagai contoh dicari rx1x2.x3
r
(X1-X1)(X2-X2) = 0.235307. Hasil ini sama seperti menggunakan rumus di
atas. Pendekatan regresi ini terlihat mudah walaupun terdapat banyak variabel kontrol. Dengan hanya meregresikan kemudian mencari residunya hal ini sangat mudah dipahami dibandingkan dengan rumus di atas.
Universitas Gadjah Mada
8