BAB 2
LANDASAN TEORI
2.1 Pengertian Regresi Regresi pertama kali digunakan sebagai konsep statistika pada tahun 1877 oleh sir Francis Galton. Beliau memperkenalkan model peramalan, penaksiran, atau pendugaan, yang selanjutnya dinamakan regresi, sehubungan dengan penelitiannya terhadap tinggi badan manusia. Galton melakukan suatu penelitian dimana penelitian tersebut mambandingkan antara tinggi anak laki-laki dan tinggi badan ayahnya. Galton menunjukkan bahwa tinggi anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (Regressed), sedangkan tinggi anak laki-laki dari ayah yang pendek cenderung lebih tinggi dari ayahnya, seolah-olah semua anak laki-laki yang tinggi dan anak laki-laki yang pendek bergerak menuju kerata-rata tinggi dari seluruh anak laki-laki yang menurut istilah galton disebut dengan “Regresssion to mediocrity”. Dari uraian tersebut dapat disimpulkan bahwa pada umumnya tinggi anak mengikuti tinggi orang tuanya.
Istilah “regresi” pada mulanya bertujuan untuk membuat perkiraan nilai suatu variabel (tinggi badan anak) terhadap variabel yang lain (tinggi badan orang tua). Pada perkembangan selanjutnya analisis regresi dapat digunakan sebagai alat untuk membuat perkiraan nilai suatu variabel dengan menggunakan beberapa variabel lain yang berhubungan dengan variabel tersebut. Jadi prinsip dasar yang harus dipenuhi dalam mambangun suatu persamaan regresi adalah bahwa antara suatu variabel terikat (Dependent variabel) dengan variabel-variabel bebas
Universitas Sumatera Utara
(Independent variabel) lainnya memiliki sifat hubungan sebab akibat hubungan kasualitas, baik didasarkan pada penjelasan logis tertentu.
2.2 Analisis Regresi Linier Analisis regresi linier merupakan teknik yang digunakan dalam persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel. Analisis regresi linier atau regresi garis lurus digunakan untuk: 1.
Menentukan hubungan fungsional antar variabel terikat dengan variabel bebas. Hubungan fungsional ini dapat disebut sebagai persamaan garis regresi yang berbentuk linier
2.
Meramalkan atau menduga nilai dari satu variabel dalam hubungannya dengan variabel lain yang diketahui melalui persamaan garis regresinya
Analisis regresi terdiri dari dua bentuk, yaitu: 1.
Analisis Regresi Linier Sederhana
2. Analisis Regresi Linier Berganda
Analisis regresi sederhana adalah bentuk regresi dengan model yang bertujuan untuk mempelajari hubungan antara dua variabel, yakni variabel terikat dan variabel bebas. Sedangkan analisis regresi berganda adalah bentuk regresi dengan model yang memiliki hubungan antara satu variabel terikat dengan dua atau lebih variabel bebas.
Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan baik, atau untuk mengetahui bagaimana variasi dari beberapa variabel bebas mempengaruhi variabel terikat dalam suatu fenomena yang kompleks. Jika X , X , … , X adalah variabel-variabel bebas dan Y adalah variabel terikat, maka
terdapat hubungan fungsional antara X dan Y, dimana variasi dari X akan diiringi pula
Universitas Sumatera Utara
oleh variasi dari Y. Jika dibuat secara matematis hubungan itu dapat dijabarkan sebagai berikut:
Y fX , X , … , X , e
Dimana: Y adalah variabel terikat X adalah variabel bebas
e adalah variabel residu (disturbace term)
Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang lazim dilaksanakan yakni: 1.
Mengadakan estimasi terhadap parameter berdasarkan data empiris
2.
Menguji seberapa besar variasi variabel terikat dapat diterangkan oleh variasi variabel bebas
3.
Menguji apakah estimasi parameter tersebut signifikan atau tidak
4.
Melihat apakah tanda magnitude dari estimasi parameter cocok dengan teori.
2.2.1 Analisis Regresi Linier Sederhana Regresi linier sederhana digunakan untuk memperkirakan hubungan antara dua variabel dimana hanya terdapat satu variabel/peubah bebas X dan satu peubah terikat Y. Dalam bentuk persamaan, model regresi sederhana adalah: Y a bX
(2.1)
Dimana: Y adalah variabel terikat X adalah variabel bebas
a adalah penduga bagi intercept (α) b adalah penduga bagi koefisien regresi (β) Penggunaan regresi linier sederhana didasarkan pada asumsi diantaranya sebagai berikut: 1.
Model regresi harus linier dalam parameter
Universitas Sumatera Utara
2.
Variabel bebas tidak berkorelasi dengan disturbance term (error).
3.
Nilai disturbance term sebesar 0 atau dengan symbol sebagai berikut: (E(U/X)) = 0
4.
Varian untuk masing masing error term (kesalahan) konstan
5.
Tidak terjadi auto korelasi
6.
Model regresi dispedifikasi secara benar. Tidak terdapat bias spesifikasi dalam model yang digunakan dalam analisis empiris
7.
Jika variabel bebas lebih dari satu, maka antara variabel bebas (explanatory) tidak ada hubungan linier yang nyata.
2.2.2 Analisis Regresi Linier Berganda Untuk memperkirakan nilai variabel terikat Y, akan lebih baik apabila ikut memperhitungkan variabel-varibel bebas X lain yang ikut mempengaruhi nilai Y, dengan demikian dimiliki hubungan antara satu variabel terikat Y dengan beberapa variabel lain yang bebas , , ' , … , ( . Untuk itulah digunakan regresi linier
berganda. Dalam pembahasan mengenai regresi sederhana, simbol yang digunakan untuk variabel bebasnya adalah X, dalam regresi berganda, persamaan regresinya memiliki lebih dari satu variabel bebas maka perlu menambah tanda bilangan pada setiap variabel tersebut, dalam hal ini X , X , … , X .
Secara umum persamaan regresi berganda dapat ditulis sebagai berikut: (untuk Populasi)
(untuk Sampel)
* B B X B X ⋯ B X ε
(2.2)
* b b X b X ⋯ b X ε
(2.3)
Dimana: i = 1,2,...,n
b , b , b , … , b dan ԑ adalah pendugaan atas B , b , B , … B dan ε .
Universitas Sumatera Utara
Dalam penelitian ini, digunakan lima variabel yang terdiri dari satu variabel
terikat Y dan empat variabel bebas X yaitu X , X , X' dan X - . Maka persamaan regresi bergandanya adalah:
b b X b X b' X ' b- X - Y
(2.4)
Persamaan diatas dapat diselesaikan dengan empat bentuk yaitu: ∑ Y b n b ∑ X b ∑ X b' ∑ X ' b- ∑ X -
(2.5)
∑ Y X b ∑ X b ∑ X
b ∑ X X b' ∑ X X ' b- ∑ X X -
(2.6)
∑ Y X ' b ∑ X ' b ∑ X X ' b ∑ X X ' b' ∑ X '
b- ∑ X ' X -
(2.8)
∑ Y X b ∑ X b ∑ X X b ∑ X
b' ∑ X X ' b- ∑ X X -
∑ Y X - b ∑ X - b ∑ X X - b ∑ X X - b' ∑ X ' X - b- ∑ X -
(2.7)
(2.9)
2.3 Uji Keberartian Regresi Sebelum persamaan regresi yang diperoleh digunakan untuk membuat kesimpulan terlebih dahulu diperiksa setidak-tidaknya mengenai kelinieran dan keberartiannya. Pemeriksaan ini ditempuh melalui pengujian hipotesa. Uji keberartian dilakukan untuk meyakinkan diri apakah regresi yang didapat berdasarkan penelitian ada artinya bila dipakai untuk membuat kesimpulan mengenai hubungan sejumlah peubah yang sedang dipelajari.
Untuk itu diperlukan dua macam jumlah kuadrat (JK) yaitu Jumlah Kuadrat
untuk regresi yang ditulis JK 012 dan Jumlah Kuadrat untuk sisa (residu) yang ditulis
dengan JK 013 .
5 , x X X 5 , … , x X X 5 dan y Y Y 5 maka secara Jika x X X umum jumlah kuadrat-kuadrat tersebut dapat dihitung dari:
78 012 b ∑ x y b ∑ x y b' ∑ x' y b- ∑ x- y
(2.10)
5 78 013 ∑Y Y
(2.11)
dengan derajat kebebasan dk = k
dengan derajat kebebasan dk = (n-k-1) untuk sampel berukuran n.
Universitas Sumatera Utara
Dengan demikian uji keberartian regresi berganda dapat dihitung dengan: F:;<2
JK 012 ⁄k 2.12 JK 013 ⁄n k 1
Dimana statistik F yang menyebar mengikuti distribusi F dengan derajat kebebasan
pembilang V k dan penyebut V n k 1. 2.4 Pengujian Hipotesis
Pengujian hipotesis dapat didasarkan dengan menggunakan dua hal, yaitu tingkat signifikansi atau probabilitas (α) dan tingkat kepercayaan atau confidence interval. Didasarkan tingkat signifikansi pada umumnya orang menggunakan 0,05. Kisaran tingkat signifikansi mulai dari 0,01 sampai dengan 0,1. Yang dimaksud dengan tingkat signifikansi adalah probabilitas menggunakan kesalahan tipe I, yaitu kesalahan menolak hipotesis ketika hipotesis tersebut benar. Tingkat kepercayaan pada umumnya ilah sebesar 95% yang dimaksud dengan tingkat kepercayaan ialah tingkat dimana sebesar 95% nilai sampel akan mewakili nilai populasi dimana sampel
berasal. Dalam melakukan uji hipotesis terdapat dua hipotesis yaitu: H (hipotesis nol) dan H (hipotesis alternativ). H bertujuan untuk memberikan usulan dugaan
kemungkinan tidak adanya perbedaan antara perkiraan penelitian dengan keadaan yang sesungguhnya yang diteliti. H bertujuan memberikan usulan dugaan adanya
perbedaan perkiraan dengan keadaan sesungguhnya yang diteliti.
Pembentukan suatu hipotesis memerlukan teori-teori maupun hasil penelitian terlebih dahulu sebagai pendukung pernyataan hipotesis yang diusulkan. Dalam membentuk hipotesis ada beberapa hal yang dipertimbangkan: 1.
Hipotesis nol dan hipotesis alternative yang diusulkan.
2.
Daerah penerimaan dan penolakan serta teknik arah pengujian (one tailed atau two tailed).
3.
Penentuan nilai hitung statistik.
Universitas Sumatera Utara
4.
Menarik kesimpulan apakah menerima atau menolak hipotesis yang diusulkan.
Dalam uji keberartian regresi, langkah-langkah yang dibutuhkan untuk pengujian hipotesis ini antara lain: 1.
H : β β ⋯ β 0
Tidak terdapat hubungan fungsional yang signifikan antara variabel bebas dengan variabel terikat
E : Minimal satu parameter koefisien regresi β yang ≠ 0 terdapat hubungan fungsional yang signifikan antara variabel bebas dengan variabel terikat 2. 3. 4. 5.
Pilih taraf α yang diinginkan
Hitung statistik F:;<2 dengan menggunakan persamaan
Nilai F;GH1I menggunakan daftar tabel F dengan taraf signifikansi α
Kriteria pengujian: jika F:;<2 ≥ F;GH1I , maka H ditolak dan E diterima Sebaliknya jika F:;<2 < F;GH1I , maka H diterima dan E ditolak.
2.5 Koefisien Determinasi Koefisien determinasi yang disimbolkan dengan R bertujuan untuk mengetahui
seberapa besar kemampuan variabel bebas menjelaskan variabel terikat. Nilai R
dikatakan baik jika berada diatas 0,5 karena nilai R berkisar antara 0 dan 1. Pada
umumnya model regresi linier berganda dapat dikatakan layak dipakai untuk penelitian, karena sebagaian besar variabel terikat dijelaskan oleh variabel bebas yang digunakan dalam model. Koefisien determinasi dapat dihitung dari: R
b ∑ X y b ∑ X y ⋯ b ∑ X y 2.13 5 ∑Y Y
Sehingga rumus umum koefisien determinasi yaitu: L
JK 012 2.14 ∑M y
Universitas Sumatera Utara
Harga R diperoleh sesuai dengan variansi yang dijelaskan oleh masing-masing
variabel yang tinggal dalam regresi. Hal ini mengakibatkan variansi yang dijelaskan penduga hanya disebabkan oleh variabel yang berpengaruh saja.
2.6 Uji Korelasi Uji korelasi bertujuan untuk menguji hubungan antara dua variabel yang tidak menunjukkan hubungan fungsional (berhubungan bukan berarti disebabkan). Uji korelasi tidak membedakan jenis variabel ( tidak ada variabel terikat maupun variabel bebas). Keeratan hubungan ini dinyatakan dalam bentuk koefisien korelasi. Uji korelasi terdiri dari Pearson, Spearman, dan Kendall. Jika sampel data lebih dari 30 (sampel besar) dan kondisi data normal, sebaiknya menggunakan korelasi Pearson (karena memenuhi asumsi parametrik). Jika jumlah sampel kurang dari 30 (sampel kecil) dan kondisi data tidak normal maka sebaiknya menggunakan korelasi Spearman atau Kendall (karena memenuhi asumsi non-parametril).
2.6.1 Koefisien Korelasi Nilai koefisien korelasi merupakan nilai yang digunakan untuk mengukur kekuatan (keeratan) suatu hubungan antar variabel. Koefisien korelasi biasanya disimbolkan dengan r. Koefisien korelasi dapat dirumuskan sebagai berikut: 1.
Untuk menghitung koefisien korelasi antara variabel terikat Y dengan variabel bebas X yaitu:
n ∑ X Y ∑ X ∑ Y
On ∑ X ∑ X n ∑ Y ∑ Y
2.15
Universitas Sumatera Utara
Koefisien korelasi memiliki nilai antara -1 hingga +1. Sifat nilai koefisien korelasi adalah plus (+) atau minus (-) yang menunjukkan arah korelasi. Makna sifat korelasi: 1.
Tanda positif (+) pada koefisien korelasi menunjukkan hubungan yang searah (korelasi positif). Artinya jika suatu nilai variabel mengalami kenaikan maka nilai variabel yang lain juga mengalami kenaikan dan demikian juga sebaliknya
2.
Tanda negatif (-) pada koefisien korelasi menunjukkan hubungan yang berlawanan arah (korelasi negatif). Artinya jika suatu nilai variabel mengalami penurunan maka nilai variabel yang lain juga mengalami penurunan dan demikian juga sebaliknya
Sifat korelasi akan menentukan arah dari korelasi. Keeratan korelasi dapat dikelompokkan sebagai berikut:
Tabel 2.1: Interpretasi Koefisien Korelasi (Nilai r) R
Interpretasi
0
Tidak Berkorelasi
0,01 – 0,20
Sangat Lemah
0,21 – 0,40
Lemah
0,41 – 0,60
Cukup
0,61 – 0,80
Kuat
0,81 – 0,99
Sangat Kuat
1
Sempurna
Analisis ini bertujuan untuk mengukur kekuatan dan derajat hubungan antar dua variabel. Derajat hubungan antara dua variabel disebut korelasi sederhana sedangkan derajat yang berkaitan dengan tiga atau lebih variabel disebut sebagai korelasi berganda. Korelasi dapat bersifat linier atau non linier.
Universitas Sumatera Utara
2.7 Uji Koefisien Regresi Linier Berganda Untuk mengetahui bagaimana keberartian setiap variabel bebas dalam regresi, perlu diadakan pengujian tersendiri mengenai koefisien-koefisien regresi. Misalkan populasi memiliki model regresi linier berganda: Q!,"R ,"S,…,"T UV UW X W UY X Y ⋯ UZ X Z yang berdasarkan sebuah sampel acak berukuran n ditaksir oleh regresi berbentuk: b b X b X ⋯ b X Y
Akan dilakukan pengujian hipotesis dalam bentuk: H : β 0, i 1,2, … , k
H : β ] 0, i 1,2, … , k
Untuk menguji hipotesis ini digunakan kekeliruan baku taksiran S!,,…, jumlah
5` dan koefisien korelasi ganda antara kuadrat-kuadrat ƩX` dengan x` X ` X
masing-masing variabel bebas X dengan variabel terikat Y dalam regersi yaitu R . Dengan besaran-besaran ini dibentuk kekeliuran baku koefisien b, yakni:
SH a
s!.…
c∑ X ` d1 R
2.16
Dimana : s!.…
5 ∑Y Y
nk1
5 ` d x` fcX` X R
JK 012 ∑M y
Selanjutnya dihitung statistik:
Universitas Sumatera Utara
g
b 2.17 sH
Dengan kriteria pengujian: jika g i g ;GH1I , maka tolak Ej dan jika g k g ;GH1I ,
maka terima Ej yang akan berdistribusi t dengan derajat kebebasan dk = (n-k-1) dan
t ;GH1I t mm,n/ .
Universitas Sumatera Utara