BAB 2
LANDASAN TEORI
2.1 Pengertian Regresi
Analisis regresi merupakan suatu model matematis yang dapat digunakan untuk mengetahui pola hubungan antara dua atau lebih variabel. Istilah regresi yang berarti ramalan atau taksiran pertama kali diperkenalkan Sir Francis Galton pada tahun 1877, sehubungan dengan penelitiannya terhadap tinggi manusia, yaitu antara tinggi anak dan tinggi orang tuanya. Dalam penelitiannya, Galton menemukan bahwa tinggi anak dan tinggi orang tuanya cenderung meningkat atau menurun dari berat rata-rata populasi. Garis yang menunjukkan hubungan tersebut disebut garis regresi. Analisis regresi lebih akurat dalam melakukan analisis korelasi, karena pada analisis itu kesulitan dalam menunjukkan slop (tingkat perubahan suatu variabel terhadap variabel lainnya dapat ditentukan). Jadi dengan analisis regresi, peramalan atau perkiraan nilai variabel terikat pada nilai variabel bebas lebih akurat pula. Karena merupakan suatu prediksi, maka nilai prediksi tidak selalu tepat dengan nilai riilnya, semakin kecil tingkat penyimpangan antara nilai prediksi dengan nilai riilnya, maka semakin tepat persamaan regresi yang dibentuk.
Universitas Sumatera Utara
Dapat disimpulkan bahwa analisis regresi adalah metode statistika yang digunakan untuk menentukan kemungkinan bentuk hubungan antara variabelvariabel, dengan tujuan pokok dalam penggunaan metode ini adalah untuk meramalkan atau memperkirakan nilai dari suatu variabel lain yang diketahui.
2.2 Persamaan Regresi
Persamaan Regresi (regression equation) adalah suatu persamaan matematis yang mendefenisikan hubungan antara dua variabel. Persamaan regresi yang digunakan untuk membuat taksiran mengenai variabel dependen disebut persamaan regresi estimasi, yaitu suatu formula matematis yang menunjukkan hubungan keterkaitan antara satu atau beberapa variabel yang nilainya sudah diketahui dengan satu variabel yang nilainya belum diketahui. Sifat hubungan antar variabel dalam persamaan regresi merupakan hubungan sebab akibat (causal relationship). Oleh karena itu, sebelum menggunakan persamaan regresi dalam mejelaskan hubungan antara dua atau lebih variabel, maka perlu diyakini terlebih dahulu bahwa secara teoritis atau perkiraan sebelumnya, dua atau lebih variabel tersebut memiliki hubungan sebab akibat. Variabel yang nilainya akan mempengaruhi nilai variabel lain disebut dengan variabel bebas (independent variabel), sedangkan variabel yang nilainya dipengaruhi oleh nilai variabel lain disebut variabel terikat (dependent variabel).
Universitas Sumatera Utara
Ada dua jenis Persamaan Regresi Linier, yaitu sebagai berikut : 1. Analisis Regresi Sederhana (simple analisis regresi) 2. Analisis Regresi Berganda (multiple analisis regresi)
2.3 Regresi Linier Sederhana
Regresi linier sederhana merupakan suatu proses untuk mendapatkan hubungan matematis dalam bentuk suatu persamaan antara variabel tak bebas tunggal dengan variabel bebas tunggal atau dengan kata lain, regresi linier yang hanya melibatkan satu peubah bebas X yang dihubungkan dengan satu peubah tak bebas Y. Bentuk umum model regresi linier sederhana yaitu: Y= Di mana :
(2.1) = variabel tak bebas (dependen) = parameter intersep = koefisien regresi (slop) = variabel bebas (independen) = kesalahan penduga
2.4 Regresi Linier Berganda
Disamping hubungan linier dua variabel, hubungan linier lebih dari dua variabel dapat juga terjadi. Pada hubungan ini, perubahan satu variabel dipengaruhi oleh lebih dari satu variabel lain. Maka regresi linier berganda adalah analisis regresi yang menjelaskan hubungan antara peubah respon (variable dependent) dengan faktor-faktor
yang
mempengaruhi
lebih
dari
satu
predaktor
(variable
independent).
Universitas Sumatera Utara
Tujuan analisis regresi linier berganda adalah untuk mengukur intensitas hubungan antara dua variabel atau lebih dan memuat prediksi/perkiraan nilai Y atas nilai X. Bentuk umum persamaan regresi linier berganda yang mencakup dua atau lebih variabel, yaitu : Y=
(2.2)
Model di atas merupakan model regresi untuk populasi, sedangkan apabila hanya menarik sebagian berupa sampel dari populasi secara acak dan tidak mengetahui regresi populasi untuk keperluan analisis, variabel bebas akan dinyatakan dengan
sedangkan variabel tidak bebas
dinyatakan dengan Y. =
(2.3)
Λ
Di mana :
Y
= variabel tidak bebas (dependent) = Koefisien regresi = variabel bebas (independent)
e
= kesalahan pengganggu
2.5 Uji Persyaratan Regresi Linier Berganda
Beberapa hal lain yang penting juga untuk dipahami dalam penggunaan analisis regresi linier ganda yaitu perlunya melakukan uji asumsi klasik atau uji persyaratan analisis regresi ganda sehingga persamaan garis regresi yang diperoleh benar-benar dapat digunakan untuk memprediksi variabel dependen atau kriterium. Uji persyaratan tersebut harus terpenuhi, apabila tidak maka akan menghasilkan garis regresi yang tidak cocok untuk memprediksi.
Universitas Sumatera Utara
Sebelum masuk pada uji persyaratan perlu dipahami bahwa statistik sebagai alat analisis dikelompokkan menjadi dua bagian yang berbeda, yaitu kelompok statistik parametrik dan statistik non-parametrik. Pada statistik nonparametrik tidak memerlukan persyaratan tertentu sedangkan pada statistik parametrik memerlukan persyaratan yang harus dipenuhi. Oleh karena itu, dalam uji persyaratan regresi linier ganda yang harus dilakukan pada dasarnya juga dikelompokkan menjadi dua bagian, yaitu uji persyaratan untuk masuk ke statistik parametrik dan uji persyaratan untuk menggunakan regresi linier ganda. Uji asumsi klasik yang secara minimal perlu dilakukan oleh penulis menggunakan regresi linier ganda sebagai alat analisis yaitu berupa: 1. Uji persyaratan untuk statistik parametrik, yang berupa: a. Uji normalitas b. Uji homogenitas 2. Uji Persyaratan untuk regresi linier ganda, yang terdiri atas: a. Uji linieritas garis regresi b. Tidak
terdapat
saling
hubungan
antara
variabel
bebas
(uji
multikolinieritas) c. Tidak terdapat autokorelasi antar data pengamatan d. Tidak terjadi adanya heteroskedasitas (Gujarati,1997)
Universitas Sumatera Utara
2.6 Membentuk Persamaan Regresi Linier Berganda
Dalam regresi linier berganda variabel tak bebas (Y), tergantung kepada dua atau lebih variabel bebas (X). Bentuk persamaan regresi linier berganda yang mencakup dua atau lebih variabel, yaitu : + Di mana: Y
= Variabel terikat (dependen) = koefisien regresi = Variabel bebas (independen)
e
= kesalahan pengganggu (disturbance terma), artinya nilai-
nilai dari variabel lain yang tidak
dimasukkan dalam persamaan. Nilai ini biasanya tidak dihiraukan dalam perhitungan. Untuk hal ini, penulis menggunakan regresi linier berganda dengan tiga variabel, yaitu satu variabel tak bebas (dependent variable) dan dua variabel bebas (independent variable). Bentuk umum persamaan regresi linier berganda tersebut yaitu : + Nilai dari koefisien
(2.5) dapat ditentukan dengan metode kuadrat
terkecil (least squared) seperti berikut ini: ! "
Universitas Sumatera Utara
$
# Harga-harga
yang telah didapat kemudian disubstitusikan ke
dalam persamaan (2.5) sehingga diperoleh model regresi linier berganda Y atas dan
Dalam persamaan model regresi linier yang diperoleh, maka antara nilai Y
dan
akan menimbulkan perbedaan hasil yang sering disebut sebagai kekeliruan.
Untuk mengetahui ketepatan persamaan estimasi dapat digunakan kesalahan standar estimasi (standard error of estimate). Besarnya kesalahan standar estimasi menunjukkan ketepatan persamaan estimasi untuk menjelaskan nilai variabel tidak bebas yang sesungguhnya. Semakin kecil nilai kesalahan standar estimasi, makin tinggi ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel tidak bebas sesungguhnya. Sebaliknya, semakin besar nilai kesalahan standar estimasi, makin rendah ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel tidak bebas sesungguhnya. Kesalahan standar estimasi dapat ditentukan dengan rumus: %&
Di mana:
'
%& Yi
#
(
= Kesalahan baku = nilai data sebenarnya
Λ
Yi
= nilai taksiran
n
= banyak ukuran sampel
k
= banyak variabel bebas
Universitas Sumatera Utara
2.7 Koefisien Determinasi
Koefisien determinasi adalah salah satu nilai statistik yang dapat digunakan untuk mengetahui apakah ada hubungan pengaruh antara dua variabel. Nilai koefisien determinasi menunjukkan persentase variasi nilai variabel dependen yang dapat dijelaskan oleh persamaan regresi yang dihasilkan. Koefisien determinasi yang dinyatakan dengan ) untuk pengujian regresi linier berganda yang mencakup lebih dari dua variabel adalah untuk mengetahui proporsi keragaman total dalam variabel tak bebas (Y) yang dapat dijelaskan atau diterangkan oleh variabelvariabel bebas (X) yang ada dalam model persamaan regresi linier berganda secara bersama-sama. Maka * akan ditetukan dengan rumus, yaitu: R2 =
JK reg
(2.10)
y2
Dengan: +,-./
0
0
0
Harga ) yang diperoleh sesuai dengan variansi yang dijelaskan masing-masing variabel yang tinggal dalam regresi. Hal ini mengakibatkan variasi yang dijelaskan penduga yang disebabkan oleh variabel yang berpengaruh saja (bersifat nyata).
Universitas Sumatera Utara
2.8 Koefisien Korelasi
Setelah mengetahui hubungan fungsional antara variabel-variabel di mana persamaan regresinya telah ditentukan dan telah melakukan pengujian maka persoalan berikutnya yang perlu dirasakan yaitu, jika data hasil pengamatan terdiri dari banyak variabel adalah seberapa kuat hubungan antara variabel-variabel itu. Dengan kata lain perlu ditentukan derajat hubungan antara variabel-variabel tersebut. Studi yang membahas derajat hubungan antara variabel-variabel tersebut dikenal dengan nama analisis korelasi. Ukuran yang dipakai untuk mengetahui derajat hubungan, terutama data kuantitatif dinamakan koefisien korelasi. Besarnya hubungan antara variabel yang satu dengan variabel yag lain dinyatakan dengan koefisien korelasi yang disimbolkan dengan “r” yang besarnya adalah akar koefisien determinasi. Atau secara matematis dapat ditulis sebagai berikut: r = 1*
(2.12)
Koefisien korelasi (r) dapat digunakan untuk: 1. Mengetahui keeratan hubungan (korelasi linier) antara dua variabel. 2. Mengetahui arah hubungan antara dua variabel. Untuk mengetahui keeratan hubungan antara dua variabel dengan menggunakan koefisien korelasi adalah dengan menggunakan nilai absolut dari koefisien tersebut. Besarnya koefisien korelasi (r) antara dua variabel adalah nol sampai dengan 1. Apabila dua buah variabel mempunyai nilai r = 0, berarti antara dua variabel tersebut tidak ada hubungan. Sedangkan apabila dua buah variabel
Universitas Sumatera Utara
mempunyai r = 2 1, maka dua buah variabel tersebut mempunyai hubungan yang sempurna. Semakin tinggi nilai koefisien korelasi antara dua buah variabel (semakin mendekati 1), maka tingkat keeratan hubungan antara dua variabel tersebut semakin tinggi. Dan sebaliknya semakin rendah koefisien korelasi antara dua buah variabel (semakin mendekati 0), maka tingkat keeratan hubungan antara dua variabel tersebut semakin lemah. Hubungan antar variabel dapat dikelompokkan menjadi 3 jenis hubungan sebagai berikut :
1. Korelasi Positif Terjadinya korelasi positif apabila perubahan pada variabel yang satu diikuti dengan perubahan variabel yang lain dengan arah yang sama (berbanding lurus). Artinya, apabila variabel yang satu meningkat, maka akan diikuti dengan peningkatan variabel lain.
2. Korelasi Negatif Korelasi negatif terjadi apabila perubahan pada variabel yang satu diikuti dengan perubahan variabel yang lain dengan arah yang berlawanan (berbanding terbalik). Artinya apabila variabel yag satu meningkat, maka akan diikuti dengan penurunan pada variabel yang lain dan sebaliknya.
Universitas Sumatera Utara
3. Korelasi Nihil Korelasi nihil terjadi apabila perubahan pada variabel yang satu diikuti perubahan pada variabel yang lain dengan arah yang tidak teratur (acak), artinya apabila variabel yang satu meningkat, kadang diikuti dengan peningkatan pada variabel yang lain dan kadang diikuti dengan penurunan pada variabel yang lain. Selain diturunkan dari koefisien determinasi (3 ), koefisien korelasi (r) dapat pula ditentukan dengan menggunakan formulasi sebagai berikut: 4&56
7 #
#
8
#
Di mana: 4&56
= koefisien korelasi antara Y dan X = Variabel bebas (independen)
Y
= Variabel terikat (dependen)
Untuk
mencari
korelasi
antara
4&
dapat dicari dengan rumus:
4&
=
n
{n
variabel
Y
X iYi − ( X i )( Yi )
X i2 − ( X i )
2
}{n
Yi 2 − ( Yi )
2
}
terhadap
atay
(2.14)
Jika kenaikan di dalam suatu variabel diikuti dengan kenaikan variabel lain, maka dapat dikatakan bahwa kedua variabel tersebut mempunyai korelasi yang positif. Tetapi jika kenaikan di dalam suatu variabel diikuti oleh penurunan di dalam variabel lain, maka dapat dikatakan bahwa variabel tersebut mempunyai korelasi yang negatif. Dan jika tidak ada perubahan pada variabel walaupun variabel lainnya berubah maka dikatakan bahwa kedaua variabel tersebut tidak mempunyai hubungan. Interpretasi harga r akan disajikan dalam tabel berikut:
Universitas Sumatera Utara
Tabel 2.1 Interpretasi Koefisien Korelasi Nilai r R
Interpretasi
0
Tidak berkorelasi
0,01 – 0,20
Sangat rendah
0,21 – 0,40
Rendah
0,41 – 0,60
Agak rendah
0,61 – 0,80
Cukup
0,81 – 0,99
Tinggi
1
Sangat tinggi
2.9 Uji Regresi Linier Berganda
Pengujian hipotesis bagi koefisien-koefisien regresi linier berganda dapat dilakukan secara serentak atau keseluruhan. Pengujian regresi linier perlu dilakukan untuk mengetahui apakah variabel-variabel bebas secara bersamaan memiliki pengaruh terhadap variabel tak bebas. Langkah-langkah pengujiannya adalah sebagai berikut: 1. Menentukan formulasi hipotesis 9 : : = : = : = ... = :; = 0 (<
<
< ; =>?@A BCBDCEF@3GH> I
9 : minimal ada satu parameter koefisien regresi yang tidak sama dengan nol atau mempengaruhi Y.
2. Penentuan nilai kritis. Nilai kritis dalam pengujian hipotesis terhadap koefisien regresi dapat ditentukan dengan menggunakan tabel distribusi
Universitas Sumatera Utara
normal dengan memperhatikan tingkat signifikan (J dan banyaknya sampel digunakan serta nilai KLMNOP dengan derajat kebebasan Q = k dan Q = n-k-1
3. Menentukan kriteria pengujian R diterima bila KSTLUVW X KLMNOP
R ditolak bila KSTLUVW Y KLMNOP
4. Menentukan nilai statistik F dengan rumus : K
Z[ \OW ]A Z[ \O^ ] E A
_
Di mana: +,-./
= jumlah kuadrat regresi
+,-.`
= jumlah kuadrat residu (sisa)
#
+,-./
= derajat kebebasan
+,-.`
0
0
5. Membuat kesimpulan apakah 9 diterima atau ditolak.
2.10 Uji Koefisien Regresi Berganda
Keberartian adanya variabel-variabel bebas dalam regresi linier berganda perlu diuji untuk menunjukkan seberapa besar pengaruh yang diberikan pada variabel
Universitas Sumatera Utara
tak bebas. Dan cara yang tepat untuk mengujinya adalah dengan menggunakan uji statistik t (student). Dimisalkan populasi mempunyai model regresi berganda sebagai berikut : a& 5
+
+
+ ... +
Yang akan ditaksir oleh regresi berbentuk : =
+
+
+ ... +
. Adanya kriteria bahwa variabel-variabel tersebut memberikan pengaruh yang berarti atau tidak terhadap variabel tak bebas akan diuji hipotesis 9 melawan hipotesis tandingan 9 dalam bentuk: 9 = :T = 0
i = 1, 2, ... , k
9 = :T b 0
i = 1, 2, ... , k
Untuk menguji hipotesis tersebut digunakan kekeliruan baku taksiran %&
. Jadi untuk melihat kekeliruan baku dari koefisien '
%
%&
!
*c
c
adalah :
Di mana: '
%& 0
# c
c
4c
d #
#
c
#
c
c
c
Kemudian dicari perhitungan statistik t yaitu: e
%f
"
Universitas Sumatera Utara
Dari tabel distribusi t-student serta dk = (n-k-1), = LMNOP = =
6 h
Vg;g
, di mana kriteria
pengujian diperoleh: 9 : ditolak
jika = T Y = LMNOP
9 : diterima jika = T i = LMNOP
Universitas Sumatera Utara