ANALISIS REGRESI DAN KORELASI
MODUL
13
ANALISIS REGRESI DAN KORELASI
Dalam kehidupan sehari-hari, seringkali dijumpai hubungan antara suatu variabel dengan satu atau lebih variabel lain. Di dalam bidang pertanian sebagai contoh, dosis dan jenis pupuk yang diberikan berhubungan dengan hasil pertanian yang diperoleh, jumlah pakan yang diberikan pada ternak berhubungan dengan berat badannya, dan sebagainya. Secara umum ada dua macam hubungan antara dua atau lebih variabel, yaitu bentuk hubungan dan keeratan hubungan. Bila ingin mengetahui bentuk hubungan dua variabel atau lebih, digunakan analisis regresi. Bila ingin melihat keeratan hubungan, digunakan analisis korelasi. Analisis regresi adalah teknik statistika yang berguna untuk memeriksa dan memodelkan hubungan diantara variabel-variabel. Penerapannya dapat dijumpai secara luas di banyak bidang seperti teknik, ekonomi, manajemen, ilmu-ilmu biologi, ilmu-ilmu sosial, dan ilmu-ilmu pertanian. Pada saat ini, analisis regresi berguna dalam menelaah hubungan dua variabel atau lebih, dan terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan sempurna, sehingga dalam penerapannya lebih bersifat eksploratif. Analisis regresi dikelompokkan dari mulai yang paling sederhana sampai yang paling rumit, tergantung tujuan yang berlandaskan pengetahuan atau teori sementara, bukan asal ditentukan saja. a. Regresi Linier Sederhana, Regresi linier sederhana bertujuan mempelajari hubungan linier antara dua variabel. Dua variabel ini dibedakan menjadi variabel bebas (X) dan variabel tak bebas (Y). Variabel bebas adalah variabel yang bisa dikontrol sedangkan variabel tak bebas adalah variabel yang mencerminkan respon dari variabel bebas. b. Regresi Berganda, Regresi berganda seringkali digunakan untuk mengatasi permasalahan analisis regresi yang melibatkan hubungan dari dua atau lebih variabel bebas. Pada awalnya regresi berganda dikembangkan oleh ahli ekonometri untuk membantu meramalkan
81
STATISTIKA
c.
d.
82
akibat dari aktivitas-aktivitas ekonomi pada berbagai segmen ekonomi. Misalnya laporan tentang peramalan masa depan perekonomian di jurnal-jurnal ekonomi (Business Week, Wall Street Journal, dll), yang didasarkan pada model-model ekonometrik dengan analisis berganda sebagai alatnya. Salah satu contoh penggunaan regresi berganda dibidang pertanian diantaranya ilmuwan pertanian menggunakan analisis regresi untuk menjajagi antara hasil pertanian (misal: produksi padi per hektar) dengan jenis pupuk yang digunakan, kuantitas pupuk yang diberikan, jumlah hari hujan, suhu, lama penyinaran matahari, dan infeksi serangga. Regresi Kurvilinier, Regresi kurvilinier seringkali digunakan untuk menelaah atau memodelkan hubungan fungsi variabel terikat (Y) dan variabel bebas (X) yang tidak bersifat linier. Tidak linier bisa diartikan bilamana laju perubahan Y sebagai akibat perubahan X tidak konstan untuk nilai-nilai X tertentu. Kondisi fungsi tidak linier ini (kurvilinier) seringkali dijumpai dalam banyak bidang. Misal pada bidang pertanian, bisa diamati hubungan antara produksi padi dengan taraf pemupukan Phospat. Secara umum produksi padi akan meningkat cepat bila pemberian Phospat ditingkatkan dari taraf rendah ke taraf sedang. Tetapi ketika pemberian dosis Phospat diteruskan hingga taraf tinggi, maka tambahan dosis Phospat tidak lagi diimbangi kenaikan hasil, sebaliknya terjadi penurunan hasil. Untuk kasus-kasus hubungan tidak linier, prosedur regresi sederhana atau berganda tidak dapat digunakan dalam mencari pola hubungan dari variabel-variabel yang terlibat. Dalam hal ini, prosedur analisis regresi kurvilinier merupakan prosedur yang sesuai untuk digunakan. Regresi Dengan Variabel Dummy (Boneka), Analisis regresi tidak saja digunakan untuk data-data kuantitatif (misal : dosis pupuk), tetapi juga bisa digunakan untuk data kualitatif (misal : musim panen). Jenis data kualitatif tersebut seringkali menunjukkan keberadaan klasifikasi (kategori) tertentu, sering juga dikatagorikan variabel bebas (X) dengan klasifikasi pengukuran nominal dalam persamaan regresi. Sebagai contoh, bila ingin meregresikan pengaruh kondisi kemasan produk dodol nenas terhadap harga jual. Pada umumnya, cara yang dipakai untuk penyelesaian adalah memberi nilai 1 (satu) kalau kategori yang dimaksud ada dan nilai 0 (nol) kalau kategori yang dimaksud tidak ada (bisa juga sebaliknya, tergantung tujuannya). Dalam kasus kemasan ini, bila kemasannya menarik diberi nilai 1 dan bila tidak menarik diberi nilai 0. Variabel yang mengambil nilai 1 dan 0 disebut variabel dummy
ANALISIS REGRESI DAN KORELASI
e.
dan nilai yang diberikan dapat digunakan seperti variabel kuantitatif lainnya. Regresi Logistik (Logistic Regression) Bila regresi dengan variabel bebas (X) berupa variabel dummy, maka dikatagorikan sebagai regresi dummy. Regresi logistik digunakan jika variabel terikatnya (Y) berupa variabel masuk katagori klasifikasi. Misalnya, variabel Y berupa dua respon yakni gagal (dilambangkan dengan nilai 0) dan berhasil (dilambangkan dengan nilai 1). Kondisi demikian juga sering dikatagorikan sebagai regresi dengan respon biner. Seperti pada analisis regresi berganda, untuk regresi logistik variabel bebas (X) bisa juga terdiri lebih dari satu variabel.
PERSAMAAN REGRESI LINIER Gagasan perhitungan ditetapkan oleh Sir Francis Galton (1822-1911) Persamaan Regresi : Persamaan Matematik yang memungkinkan peramalan nilai suatu peubah tak bebas (dependent variable) dari nilai peubah bebas (independent variable) Diagram Pencar = Scatter Diagram Diagram yang menggambarkan nilai-nilai observasi peubah tak bebas dan peubah bebas. Nilai peubah bebas ditulis pada sumbu X (sumbu horizontal) Nilai peubah tak bebas ditulis pada sumbu Y (sumbu vertikal) Nilai peubah tak bebas ditentukan oleh nilai peubah bebas BENTUK UMUM REGRESI LINIER SEDERHANA Y = a + bX Y : peubah takbebas X : peubah bebas a : konstanta b : kemiringan BENTUK UMUM REGRESI LINIER BERGANDA Y = a + b1X1 + b2X2 + ...+ bnXn Y : peubah takbebas a : konstanta X1 : peubah bebas ke-1 b1 : kemiringan ke-1 X2 : peubah bebas ke-2 b2 : kemiringan ke-2 Xn : peubah bebas ke-n bn : kemiringan ke-n
83
STATISTIKA
BENTUK UMUM REGRESI NON-LINIER (contoh: Regresi Eksponensial) Y = abx log Y = log a + (log b) x Contoh : Berikut adalah data Biaya Promosi dan Volume Penjualan PT BIMOLI perusahaan Minyak Goreng.
Tahun
1992 1993 1994 1995 1996 Σ
x Biaya Promosi (Juta Rupiah) 2 4 5 7 8 Σx = 26
y Volume Penjualan (Ratusan Juta Liter) 5 6 8 10 11 Σy = 40
xy 10 24 40 70 88 Σxy = 232
x²
y²
4 16 25 49 64 Σx² =158
25 36 64 100 121 Σy² = 346
n=5 bentuk umum persaman regresi linier sederhana : Y = a + b X b = 1.053 a = 2.530 Y = a + b X → Y = 2.530 + 1.053 X “Perkiraan” dengan Persamaan Regresi Contoh : Diketahui hubungan Biaya Promosi (X dalam Juta Rupiah) dan Y (Volume penjualan dalam Ratusan Juta liter) dapat dinyatakan dalam persamaan regresi linier berikut Y = 2.530 + 1.053 X Perkirakan Volume penjualan jika dikeluarkan biaya promosi Rp. 10 juta ? Jawab : Y = 2.530 + 1.053 X X = 10 Y = 2.53 + 1.053 (10) = 2.53 + 10.53 = 13.06 (ratusan juta liter) Volume penjualan = 13.06 x 100 000 000 liter
84
ANALISIS REGRESI DAN KORELASI
KORELASI Korelasi merupakan angka yang menunjukan arah dan kuatnya hubungan antar dua variabel atau lebih, arah dinyatakan dalam bentuk hubungan positif atau negatif, sedangkan kuatnya hubungan dinyatakan dalam besarnya koefisien korelasi (Sugiyono; 2005 : 210). Ada beberapa teknik korelasi diantaranya: Koefisien Kontigency, Rank Spearman, Kandal Tau, Pearson Product Moment, Korelasi Ganda, Korelasi Parsial dan lain sebagainya. A. Korelasi Product Moment Teknik ini digunakan untuk mencari hubungan dan membuktikan hipotesis hubungan dua variabel bila data kedua variabel berbentuk interval atau ratio dan sumber data dari dua variabel atau lebih adalah sama. (Sugiyono; 2005 : 210).
rxy
xy (
x2 y2 )
dengan : rxy = Korelasi antara variabel x dan y x
= (Xi - X )
y
= (Yi - Y )
N(
rXY (N
Xi
2
X iYi ) ( (
X i ) 2 )(N
Xi
Yi ) Yi
2
(
Yi ) 2 )
Pengujian signifikansi koefisien korelasi, selain dapat menggunakan tabel, juga dapat dihitung dengan uji t
t
r n 2 1 r2
85
STATISTIKA
Pedoman Untuk Memberikan Interpretasi Terhadap Koefisien Korelasi Interval Koefisian Tingkat Hubungan 0,00 – 0,199 Sangat rendah 0,20 – 0,399 Rendah 0,40 – 0,599 Sedang 0,60 – 0,799 Kuat 0,80 – 1,000 Sangat Kuat B. Korelasi Rank Spearman Kalau pada korelasi Product Moment, sumber data untuk variabel yang akan dikorelasikan adalah sama, data yang dikorelasikan adalah data interval atau rasio, serta data dari kedua variabel masing-masing membentuk distribusi normal. Sedangkan korelasi Rank Spearman sumber data untuk kedua variabel yang akan dikonversikan dapat berasal dari sumber yang tidak sama, jenis data yang dikorelasikan adalah data ordinal, serta data dari kedua variabel tidak harus membentuk distribusi normal. Korelasi Rank Spearman bekerja dengan data ordinal atau berjenjang atau rangking dan bebas distribusi. (Sugiyono; 2005 : 229).
1
6
bi
2
n(n 2 1)
Catatan : Untuk keperluan penulisan Karya Ilmiah berbentuk Skripsi atau lainnya, pelajari buku referensi lain: buku “Metode Penelitian” dan buku “Statistika untuk Penelitian” Analisis regresi digunakan untuk mengetahui bentuk hubungan dua buah variable atau lebih. Apabila suatu data terdiri dari pasangan-pasangan dua buah variable, maka data tersebut disebut “Bivareate Population” Misalnya produksi padi yang dipengaruhi oleh dosis pemupukan N setiap dosis pemupukan N tertentu akan memberikan produksi tertentu pula. Besarnya produksi ditentukan oleh besarnya dosis pupuk N. dalam hal ini dosis pupuk N disebut variable bebas (independen variable) dan produksi disebut variable tak bebas (dependen variable) Apabila antara dosis pupuk N dan produksi tersebut digambarkan dalam bentuk grafik akan diperoleh suatu garis yang disebut garis regresi. Bentuk persamaan aljabar yang menggambarkan garis tersebut disebut persamaan regresi.
86
ANALISIS REGRESI DAN KORELASI
Regresi linear sederhana y Y=a+bx
x
Gambar Garis Regresi Linear Sederhana Bentuk umum persamaan garis regresi linear sederhana adalah : Y = 1 + bx Dimana : Y = Dependen variable X = independen variable A = intensif B = slope A dan b disebut parameter-parameter regresi yang akan dihitung menghitung a dan b dengan metode kuadrat terkecil (least square methode) xiy ( xi) ( yi ) / n Rumus : b 2 X i2 xi / n A = y bx Keterangan : Yi : Dependen variable Xi : Independen variable N : jumlah pasangan data Y : Rata-rata hitung Yi
x : Rata-Rata hitung Xi Contoh : Tabel 1 Xi Yi 0 5 2 6 3 6,5 5 0 7 9 17 34,5
Xi2 0 4 9 25 49 87
XiYi 0 12 19,5 40 63 134,5
Yi2 25 36 42,25 64 81 248,25
87
STATISTIKA
Xi Xi
X
n
Yi
Y
2
Yi :
n
Xi :
17 5
XiYi
3,4
34 ,5 n
6,9 5
Jadi ;
b
134 ,5 (17 )(34 ,5) / 5 17 ,2 87 (17 ) 2 / 5
0,5890
α = 6,9 – 0,5090 (3,4) = 4,8974 Jadi persamaan regresi dari data di atas : y = 4,8974 + 0,5890 x korelasi sederhana koefisien korelasi merupakan ukuran eratnya hubungan antara dua buah variabel random. Misalnya terdapat variabel random x dan y, maka koefisien (disingkat xy0 merupakan ukuran eratnya hubungan antara x dan y menghitung koefisien korelasi) :
rxy :
Xi X Yi Y ( xi
rxy :
x) 2 (Yi XiYi
x2
(
y) 2 Xi (
x) 2 / n y 2
Yi ) / n (
y) 2 / n
Dari contoh tebel 1 dapat dihitung koefisien korelasi antara x dan y
rxy : rxy
88
134,5 (17)(34,5) / 5
(87 17 2 )(248,25 34,5 2 / 5 17 ,2 : 0,99 297 ,84