BAB 2
TINJAUAN TEORITIS
2.1 Pengertian Regresi
Regresi pertama kali digunakan sebagi konsep statistika pada tahun 1877 oleh sir Francis Galton. Beliau memperkenalkan model peramalan, penaksiran, atau pendugaan, yang selanjutnya dinamakan regresi, sehubungan dengan penelitiannya terhadap tinggi badan manusia. Galton melakukan suatu penelitian dimana penelitian tersebut membandingkan antara tinggi anak lakilaki dan tinggi badan ayahnya. Galton menunjukan bahwa tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (Regressed) pendek cenderung lebih tinggi dari ayahnya, jadi seolah-olah semua anak laki-laki yang tinggi dan anak laki-laki yang pendek bergerak menuju kerata-rata tinggi dari seluruh anak laki-laki yang menurut istilah Galton disebut dengan “Regression to mediocrity”. Dari uraian tersebut dapat disimpulkan bahwa pada umumnya tinggi anak mengikuti tinggi orang tuanya.
Istilah “regresi” pada mulanya bertujuan untuk membuat perkiraan nilai suatu variabel (tinggi badan anak) terhadap variabel yang lain (tinggi badan orang tua). Pada perkembangan selanjutnya analisis regresi dapat digunakan sebagai alat untuk membuat perkiraan nilai suatu variabel dengan menggunakan beberapa variabel lain yang berhubungan dengan variabel tersebut.
Jadi prinsip dasar yang harus dipenuhi dalam membangun suatu persamaan regresi adalah bahwa antara suatu variabel tidak bebas (Dependent variable) dengan variabel-variabel bebas (Independent variable) lainnya memiliki sifat hubungan sebab akibat hubungan kasualitas, baik didasarkan pada penjelasan logis tertentu.
2.2 Analisis Regresi Linier
Analisis regresi linier merupakan teknik yang digunakan dalam persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel. Analisis regresi linier atau regresi garis lurus digunakan untuk: 1. Menentukan hubungan fungsional antar variabel dependen dengan independen. Hubungan fungsional ini dapat disebut sebagai persamaan garis regresi yang berbentuk linier. 2. Meramalkan atau menduga nilai dari satu variabel dalam hubungannya dengan variabel lain yang diketahui melalui persamaan garis regresinya. Analisis regresi terdiri dari dua bentuk, yaitu: 1. Analisis Regresi Linier Sederhana 2. Analisis Regresi Linier Berganda
Analisis regresi linier sederhana adalah bentuk regresi dengan model yang bertujuan untuk mempelajari hubungan antara dua variabel, yakni variabel dependen (terikat) dan variabel independent (bebas). Sedangkan analisis regresi berganda adalah bentuk regresi dengan model
yang memiliki hubungan antara satu variabel dependen dengan dua atau lebih variabel independen.
Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan baik, atau untuk mengetahui bagaimana variasi dari beberapa variabel independen mempengaruhi variabel dependen dalam suatu fenomena yang kompleks. Jika,
adalah variabel-variabel
independen dan Y adalah variabel dependen, maka terdapat hubungan fungsional antara X dan Y, dimana variasi dari X akan diiringi pula oleh variasi dari Y. jika dibuat secara matematis hubungan itu dapat dijabarkan sebagai berikut: Dimana:
Y= f (
, e)
Y adalah variabel dependen (tak bebas) X adalah variabel Independen (bebas) e adalah variabel residu (disturbace term)
Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang lazim dilaksanakan yakni: 1. Mengadakan estimasi terhadap parameter berdasarkan data empiris. 2. Menguji seberapa besar variasi variabel dependen dapat diterangkan oleh variasi independen. 3. Menguji apakah estimasi parameter tersebut signifikan atau tidak. 4. Melihat apakah tanda magnitude dari estimasi parameter cocok dengan teori.
2.2.1
Analisis Regresi Linier Sederhana
Regresi linier sederhana digunakan untuk memperkirakan hubungan antara dua variabel dimana hanya terdapat satu variabel/peubah bebas X dan satu peubah tak bebas Y. Dalam bentuk persamaan, model regresi sederhana adalah : Y = a + bX dimana:
Y adalah variabel dependen (tak bebas) X adalah variabel Independen (bebas) a adalah penduga bagi intercept b adalah penduga bagi koefisien regresi (β)
Penggunaan regresi linier sederhana didasarkan pada asumsi diantaranya sebagai berikut: 1.
Model regresi harus linier dalam parameter.
2.
Variabel bebas tidak berkorelasi dengan disturbance term (error).
3.
Nilai disturbace term sebesar 0 atau dengan symbol sebagai berikut: (E (U/X)) = 0.
4.
Varian untuk masing-masing error term (kesalahan) konstan.
5.
Tidak terjadi auto korelasi.
6.
Model regresi dispesifikasi secara benar. Tidak terdapat bias spesifikasi dalam model yang digunakan dalam analisis empiris.
7.
Jika variabel bebas lebih dari datu, maka antara variabel bebas (explanatory) tidak ada hubungan linier yang nyata.
2.2.2 Analisis Regresi Linier Berganda
Untuk memperkirakan nilai variabel tak bebas Y, akan lebih baik apabila ikut memperhitungkan variabel-variabel bebas lain yang ikut mempengaruhi nilai Y. dengan demikian dimiliki hubungan antara satu variabel tidak bebas Y dengan beberapa variabel lain yang bebas Untuk itulah digunakan regresi linear berganda. Dalam pembahasan mengenai regresi sederhana, simbol yang digunakan untuk variabel bebasnya adalah X. dalam regresi berganda, persamaan regresinya memiliki lebih dari satu variabel bebas maka perlu menambah tanda bilangan pada setiap variabel tersebut, dalam hal ini
.
Secara umum persamaan regresi berganda dapat ditulis sebagai berikut: (Untuk Populasi)
(Untuk Sampel)
Dimana:
i = 1, 2, . . . , n adalah pendugaan atas
Dalam penelitian ini, digunakan empat variabel yang terdiri dari satu variabel bebas Y dan tiga variabel X yaitu adalah:
. Maka persamaan regresi bergandanya
Persamaan diatas dapat diselesaikan dengan empat bentuk yaitu:
2.3 Uji Keberartian Regresi
Sebelum persamaan regresi yang diperoleh digunakan untuk membuat kesimpulan terlebih dahulu diperiksa setidak-tidaknya mengenai kelinieran dan keberartiannya. Pemeriksaan ini ditempuh melalui pengujian hipotesis. Uji keberartian dilakukan untuk meyakinkan diri apakah regresi yang didapat berdasarkan penelitian ada artinya bila dipakai untuk membuat kesimpulan mengenai hubungan sejumlah peubah yang sedang dipelajari.
Untuk itu diperlukan dua macam jumlah kuadrat (JK) yaitu Jumlah Kuadrat untuk regresi yang ditulis
dan Jumlah Kuadrat untuk sisa (residu) yang ditulis dengan
Jika jumlah kudarat-kuadrat-kuadrat tersebut dapat dihitung dari:
Dengan derajat kebebasan dk = k
Dengan derajat kebebasan dk = ( n – k - 1 ) untuk sampel berukuran n.
. maka secara umum
Dengan demikian uji keberartian regresi berganda dapat dihitung dengan:
Dimana statistik F yang menyebar mengikuti distribusi F dengan derajat kebebasan pembilang V1 = k dan penyebut V2 = n – k -1.
2.4 Pengujian Hipotesis
Pengujian hipotesis dapat didasarkan dengan menggunakan dua hal, yaitu: tingkat signifikansi atau probabilitas (α) dan tingkat kepercayaan atau confidence interval. Didasarkan tingkat signifikansi pada umumnya orang menggunakan 0,05. Kisaran tingkat signifikansi mulai dari 0,01 sampai dengan 0,1. Yang dimaksud dengan tingkat signifikansi adalah probabilitas menggunakan kesalahan tipe I, yaitu kesalahan menolak hipotesis ketika hipotesis tersebut benar. Tingkat kepercayaan pada umumnya ialah sebesar 95%, yang dimaksud dengan tingkat kepercayaan ialah tingkat dimana sebesar 95% nilai sampel akan mewakili nilai populasi dimana sampel berasal. Dalam melakukan uji hipotesis terdapat dua hipotesis yaitu: alternative).
(Hipotesis Nol) dan Ha (hipotesis
bertujuan untuk memberikan usulan dugaan kemungkinan tidak adanya perbedaan
antara perkiraan penelitian dengan keadaan yang sesungguhnya yang diteliti. Ha bertujuan memberikan usulan dugaan adanya perbedaan perkiraan dengan keadaan sesungguhnya yang diteliti.
Pembentukan suatu hipotesis memerlukan teori-teori maupun hasil penelitian terlebih dahulu sebagai pendukung pernyataan hipotesis yang diusulkan. Dalam membentuk hipotesis ada beberapa hal yang dipertimbangkan: 1) Hipotesis nol dan hipotesis alternative yang diusulkan 2) Daerah penerimaan dan penolakan serta teknik arah pengujian (one tailed atau two tailed) 3) Penentuan nilai hitung statistik 4) Menarik kesimpulan apakah menerima atau menolak hipotesis yang diusulkan Dalam uji keberartian regresi, langkah-langkah yang dibutuhkan untuk pengujian hipotesis ini antara lain: 1) Ho :
=
=...=
=0
Tidak terdapat hubungan fungsional yang signifikan antara variabel bebas dengan variabel tak bebas Ha : Minimal satu parameter koefisien regresi
Terdapat hubungan
fungsional yang signifikan antara variabel bebas dengan variabel tak bebas 2) Pilih taraf α yang diinginkan 3) Hitung statistik 4) Nilai
dengan menggunakan persamaan
menggunakan daftar table F dengan taraf signifikansi α
5) Kriteria pengujian : jika Sebaliknya jika
, maka Ho ditolak dan Ha diterima. , maka Ho diterima dan Ha ditolak.
2.5 Koefisien Determinasi
Koefisien determinasi yang disimbolkan dengan
bertujuan untuk mengetahui seberapa besar
kemampuan variabel independen menjelaskan variabel dependen. Nilai berada diatas 0,5 karena nilai
dikatakan baik jika
berkisar antara 0 dan 1. Pada umumnya model regresi linier
berganda dapat dikatakan layak dipakai untuk penelitian, karena sebagian besar variabel dependen dijelaskan oleh variabel independen yang digunakan dalam model.
Koefisien determinasi dapat dihitung dari: = Sehingga rumus umum koefisien determinasi yaitu
Harga
diperoleh sesuai dengan variansi yang dijelaskan oleh masing-masing variabel
yang tinggal dalam regresi. Hal ini mengakibatkan variasi yang dijelaskan penduga hanya disebabkan oleh variabel yang berpengaruh saja.
2.6 Uji Korelasi
Uji korelasi bertujuan untuk menguji hubungan antara dua variabel yang tidak menunjukkan hubungan fungsional (berhubungan bukan berarti disebabkan). Uji korelasi tidak membedakan jenis variabel (tidak ada variabel dependen maupun independen). Keeratan hubungan ini dinyatakan dalam bentuk koefisien korelasi. Uji korelasi terdiri dari Pearson, Spearman, dan
Kendall. Jika sampel data lebih dai 30 (sampel besar) dan kondisi data normal, sebaiknya menggunakan korelasi Pearson (karena memenuhi asumsi parametrik). Jika jumlah sampel kurang dari 30 (sampel kecil) dan kondisi data tidak normal maka sebaiknya menggunakan korelasi Spearman atau Kendall (karena memenuhi asumsi non-parametrik).
2.6.1 Koefisien Korelasi
Nilai koefisien korelasi merupakan nilai yang digunakan untuk mengukur kekuatan (keeratan) suatu hubungan antar variabel. Koefisien korelasi biasanya disimbolkan dengan r.
Koefisien korelasi dapat dirumuskan sebagai berikut:
1. Untuk menghitung koefisien korelasi antara variabel tak bebas Y dengan tiga variabel bebas
, yaitu:
2. Koefisien korelasi antara Y dengan
3. Koefisien korelasi antara Y dengan
4. Koefisien korelasi antara Y dengan
Koefisien korelasi memiliki nilai antara -1 hingga +1. Sifat nilai koefisien korelasi adalah plus (+) atau minus (-) yang menunjukan arah korelasi. Makna sifat korelasi:
1. Tanda positif (+) pada koefisien korelasi menunjukkan hubungan yang searah (korelasi positif). Artinya jika suatu nilai variabel mengalami kenaikan maka nilai variabel yang lain juga mengalami kenaikan dan demikian juga sebaliknya. 2. Tanda negatif (-) pada koefisien korelasi menunjukkan hubungan yang berlawanan arah (korelasi negatif). Artinya jika suatu nilai variabel mengalami kenaikan maka nilai variabel yang lain juga mengalami penurunan dan demikian juga sebaliknya.
Untuk lebih memudahkan mengetahui bagaimana sebenarnya derajat keeratan antara variabel-variabel tersebut, dapat dilihat pada rumus berikut : -1,00 ≤ r ≤ -0,80 berarti korelasi kuat -0,79 ≤ r ≤ -0,50 berarti korelasi sedang -0,49 ≤ r ≤ 0,49 berarti korelasi lemah 0,50 ≤ r ≤ 0,79 berarti korelasi sedang 0,80 ≤ r ≤ 1,00 berarti korelasi kuat Analisis ini bertujuan untuk mengukur kekuatan dan derajat hubungan antar dua variabel. Derajat hubungan antara dua variabel disebut korelasi sederhana sedangkan derajat yang berkaitan
dengan tiga atau lebih variabel disebut sebagai korelasi berganda. Korelasi dapat bersifat linier atau non linier.
2.7 Uji Koefisien Regresi Linier Berganda
Untuk mengetahui bagaimana keberartian setiap variabel bebas dalam regresi, perlu diadakan pengujian tersendiri mengenai koefisien-koefisien regresi. Misalkan populasi memiliki model regresi linier berganda :
yang berdasarkan sebuah sampel acak berukuran n ditaksir oleh regresi berbentuk:
Akan dilakukan pengujian hipotesis dalam bentuk: Ho : Ha :
Untuk menguji hipotesis ini digunakan kekeliruan baku taksiran kuadrat ∑
dengan
jumlah kuadrat-
dan koefisien korelasi ganda antara masing-masing variabel
bebas X dengan variabel tak bebas Y dalam regresi yaitu
Dengan besaran-besaran ini dibentuk kekeliruan baku koefisien b, yakni :
=
Dimana:
∑
Selanjutnya dihitung statistik:
Dengan kriteria pengujian: jika
, maka tolak Ho dan jika
, maka
terima Ho yang akan berdistribusi t dengan derajat kebebasan dk = (n-k-1) dan .