12/8/2012
KORELASI DAN REGRESI Sinollah, S.Sos, M.AB
Dalam banyak keputusan manajemen terutama dalam dunia usaha, adalah perlu untuk membuat ramalan nilai-nilai dari variable yang tidak diketahui. Perencanaan anggaran perusahaan tahun mendatang memerlukan ramalan tentang nilai penjualan. Manajer bagian produksi harus membuat ramalan berapa banyak bahan dasar yang terbuang selama pengerjaan untuk dapat menentukan berapa banyak bahan dasar yang akan dipesan. Perusahaan listrik harus meramalkan permintaan akan jasa-jasa pemakaian listrik tahun-tahun akan datang dalam hal akan memutuskan berapa besar kapasitas generator yang akan dibangun. Manajer sumberdaya manusia perlu mengetahui apakah Produktivitas karyawan dapat diramalkan dari hasil tes Seleksi dan lamanya latihan, dan sebagainya.
1
12/8/2012
Dalam pembahasan ini kita akan mempelajari bagaimana pengetahuan tentang hubungan antara dua variable dapat dipraktekkan, sehingga informasi dari satu variable dapat digunakan untuk memperkirakan nilai dari variable lain. Teknik statistik tentang hubungan antara dua variabel tersebut dinamakan korelasi dan regresi. Regresi akan menjelaskan kepada kita bagaimana satu variable dihubungkan dengan variable lain, dimana hubungan tersebut dinyatakan dalam bentuk persamaan dan nilai dari satu variable yang diketahui atau variable yang digunakan untuk meramalkan (predictor) dapat digunakan untuk menduga nilai variable lain yang tidak diketahui atau variable yang diramalkan (kreterium). Misalnya manajer pemasaran dapat memperkirakan penjualan (kreterium) yang akan dicapai berdasarkan besarnya biaya advertensi (predictor). Sedangkan korelasi akan menjelaskan kepada kita tentang besarnya derajat hubungan antara dua variable.
KORELASI Korelasi (correlation) adalah salah satu teknik statistik yang digunakan untuk mencari hubungan antara dua variabel atau lebih yang sifatnya kuantitatif. Misalnya kita ingin menyelidiki apakah ada hubungan antara penetapan harga dengan jumlah yang diminta, biaya advertensi yang dikeluarkan dengan hasil penjualan barang yang diadvertensikan, banyaknya jam kerja dengan besarnya penghasilan dsb. Hubungan antara dua variabel dapat hanya karena kebetulan saja, dapat pula memang merupakan hubungan sebab akibat. Dalam statistik yang dipelajari adalah hubungan yang bersifat tidak kebetulan. Dua variabel dikatakan berkorelasi apabila perubahan pada variabel yang satu akan diikuti perubahan pada variabel yang lain secara teratur, dengan arah yang sama atau dapat pula dengan arah yang berlawanan. Bila dua variabel tersebut dinyatakan sebagai variabel X dan variabel Y, maka apabila variabel X berubah, variabel Y pun berubah dan sebaliknya.
2
12/8/2012
Arah hubungan antara dua variabel (direction of correlation) dapat dibedakan menjadi: 1. Direct correlation (Positive Correlation)
Perubahan pada salah satu variabel diikuti perubahan variabel yang lain secara teratur dengan arah/gerakan yang sama. Kenaikan nilai variabel X selalu diikuti kenaikan nilai variabel Y dan sebaliknya turunnya nilai X selalui diikuti oleh turunnya nilai variabel Y. misalnya : hubungan antara penetapan harga dengan jumlah yang ditawarkan. 2. Inverse Correlation (Negative Correlation)
Perubahan pada salah satu variabel diikuti perubahan variabel yang lain ssecara teratur dengan arah/gerakan yang berlawanan. Nilai variabel X yang tinggi selalu disertai dengan nilai variabel Y yang rendah dan sebaliknya variabel X yang rendah nilainya selalu diikuti nilai variabel Y yang tinggi. Misalmya : hubungan antara penetapan harga dengan jumlah yang diminta.
3. Korelasi Nihil (Tidak Berkorelasi)
Kenaikan nilai variabel yang satu kadang-kadang disertai dengan turunnya nilai variabel yang lain atau kadang-kadang diikuti kenaikan variabel yang lain. Arah hubungannya tidak teratur kadang-kadang dengan arah yang sama kadang-kadang berlawanan. Besar kecilnya hubungan dinyatakan dalam bilangan. Bilangan yang menyatakan besar kecilnya hubungan tersebut disebut koefisien korelasi yang bergerak antara 0,000 sampai +1,000 atau diantara 0,000 sampai – 1,000, tergantung kepada arah korelasinya (nihil, positif apa negatif). Koefisien yang bertanda positif menunjukkan arah korelasi yang positif. Koefisien yang bertanda negatif menunjukkan arah korelasi yang negatif. Adapun koefisien yang bernilai 0,000 menunjukkan tidak adanya korelasi antara X dan Y.
3
12/8/2012
Jika dua variable mempunyai koefisien korelasi sebesar +1,000 atau 1,000, kedua variable tersebut dikatakan mempunyai korelasi yang sempurna. Yang pertama disebut korelasi yang sempurna positif dan sebaliknya. Dalam korelasi yang sempurna positif, tiap-tiap kenaikan variable X selalu disertai kenaikan yang seimbang (proporsional) pada nilai-nilai variable Y. Sebaliknya dalam korelasi yang sempurna negatif, tiap-tiap kenaikan variable X selalu diserta penurunan yang seimbang pada nilai variable Y.
Korelasi Product Moment (Karl Pearson) Korelasi dari Pearson, atau juga disebut Korelasi Momen Tangkar mendasarkan perhitungannya pada angka-angka kasar seperti apa adanya. Untuk menghitung korelasi product moment dapat dilakukan dengan rumus deviasi dan rumus angka kasar.
Rumus deviasi:
rxy =
Ket:
Rumus angka kasar:
Σxy
(Σx )(Σy ) 2
rxy x y
2
rxy =
ΣXY −
(ΣX )(ΣY )
N 2 (ΣX ) 2 2 (ΣΥ) 2 ΣX − ΣΥ − N N
= koefisien korelasi = deviasi X (X – M) = deviasi Y (Y – M)
4
12/8/2012
Contoh perhitungan: Tabel . contoh perhitungan dengan rumus deviasi Subjek
X
Y
x
x2
y
y2
xy
1
130
20
-29.5
870.25
-7.6
57.76
224.2
2
132
24
-27.5
756.25
-3.6
12.96
99
3
152
28
-7.5
56.25
0.4
0.16
-3
4
142
23
-17.5
306.25
-4.6
21.16
80.5
5
184
37
24.5
600.25
9.4
88.36
230.3
6
190
32
30.5
930.25
4.4
19.36
134.2
7
150
25
-9.5
90.25
-2.6
6.76
24.7
8
170
23
10.5
110.25
-4.6
21.16
-48.3
9
181
29
21.5
462.25
1.4
1.96
30.1
10
164
35
4.5
20.25
7.4
54.76
33.3
Jumlah
1595
276
0
4202.5
0
284.4
805
Mx = 1595/10 = 159,5
My = 276/10 = 27,6
805 = 0.7363 (4202.5)(284.4)
Rxy =
Tabel . contoh perhitungan dengan rumus kasar X2
Y2
Subjek
X
Y
XY
1
130
20
16900
400
2600
2
132
24
17424
576
3168
3
152
28
23104
784
4256
4
142
23
20164
529
3266
5
184
37
33856
1369
6808
6
190
32
36100
1024
6080
7
150
25
22500
625
3750
8
170
23
28900
529
3910
9
181
29
32761
841
5249
10
164
35
26896
1225
5740
Jumlah
1595
276
258605
7902
44827
5
12/8/2012
(1595)(276) 805 10 = = 0.7363 2 2 (4202)(284.4) (1595) (276) 258.605 − 7902 − 10 10 44.827 −
rxy =
Untuk menguji apakah harga rxy = 0,7363 itu signifikan atau tidak, kita dapat berkonsultasi dengan tabel r – teoritik dengan N = 10 atau derajat kebebasan db = 10 – 2. Dari tabel r teoritik dengan N = 10 (atau db = 8) akan kita temukan harga r – teoritik pada taraf signifikansi 1% atau rt1% = 0,765 dan rt5% = 0,632. karena harga rt5% < rxy < rt1% maka kita nyatakan signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X dan Y signifikan.
Resp
Berat Bada (X)
Kelincahan (Y)
1
24
28
2
23
30
3
22
26
4
25
28
5
20
28
6
24
29
7
23
27
Carilah koefisien korelasinya. Apakah koefisien tersebut signifikan atau tidak ?
6
12/8/2012
Tujuan utama dari analisis regresi adalah mendapatkan ramalan dari satu variable (kreterium) dengan menggunakan variable lain yang diketahui (predictor). Korelasi antara variable kreterium dengan variable predictor dapat dilukiskan dalam satu garis. Garis tersebut disebut garis regresi. Garis regresi mungkin merupakan garis lurus (linier), mungkin merupakan garis lengkung (parabolic, hiperbolik dsb). Dalam kesempatan ini dibicarakan garis yang linier saja.
Suatu garis dapat dinyatakan dalam persamaan matematik. Persamaan ini disebut persamaan regresi linier. Dengan mengetahui persamaan regresi ini peramalan nilai Y (kreterium) dapat dibuat berdasarkan nilai X (predictor) tertentu. Untuk garis linier dengan satu variable predictor persamaannya adalah:
Y = aX + K Dimana:
Y X a K
= kriterium = predictor = bilangan koefisien preditktor = bilangan konstans
Tugas pokok regresi linier adalah: 1) mencari korelasi antara kreterium dengan predictor, 2) menguji apakah korelasi itu signifikan atau tidak, dan 3) mencari persamaan garis regresinya.
7
12/8/2012
Contoh: misalkan suatu Penyelidikan ingin memastikan apakah berat badan orang pada kelompok umur tertentu dapat diramalkan dari tinggi badan? Dalam penyelodokan itu dikumpulkan data tinggi badan dan berat badan sepuluh orang sebagai seperti nampak pada tabel 100 berikut: Subjek
Tinggi Badan (cm) X
Berat Badan (kg) Y
X2
Y2
XY
1
168
63
28224
3969
10584
2
173
81
29929
6561
14013
3
162
54
26244
2916
8748
4
157
49
24649
2401
7693
5
160
52
25600
2704
8320
6
165
62
27225
3844
10230
7
163
56
26569
3136
9128
8
170
78
28900
6084
13260
9
168
64
28224
4096
10752
10
164
61
26896
3721
10004
Jumlah
1650
620
272460
39432
102732
Korelasi antara X dan Y dapat kita cari melalui teknik korelasi product moment dari Pearson, dengan rumus umum (deviasi). Telah diketahui:
Σ xy = ΣΧΥ −
(ΣΧ )(ΣΥ ) = 102732 − (1650 )(620 ) = 432 Ν
(ΣΧ )
2
Σ x 2 = ΣΧ 2 −
(1650 )
10
2
= 210 Ν 10 2 2 ( ( ΣΥ ) 620 ) 2 2 Σ y = ΣΥ − = 39432 − = 992 Ν rxy =
Σ xy
(Σx )(Σ y ) 2
2
=
= 272460 −
432 = 0,946 ( 210 )( 992 )
8
12/8/2012
Untuk menguji apakah harga rxy = 0,946 itu signifikan kita dapat berkonsultasi dengan tabel r – teoritik dengan N = 10 atau derajat kebebasan db = 10 – 2. Dari tabel r teoritik dengan N = 10 (atau db = 8) akan kita temukan harga r – teoritik pada taraf signifikansi 1% atau rt1% = 0,765 dan rt5% = 0,632. karena harga rt5% < rxy < rt1% maka kita nyatakan signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X dan Y signifikan. Kesimpulannya adalah bahwa korelasi antara tinggi badan dan berat badan sangat signifikan. Dengan harga korelasi antara tinggi badan dan berat badan yang sangat signifikan tersebut kita mempunyai landasan untuk meramalkan berat badan dari tinggi badan. Karenanya kita dapat membuat garis regresi untuk prediksi dengan rumus garis linier yang sudah ada, yaitu: y = aX = K.
Untuk mengisi persamaan regresi itu harga koefisien predictor (harga a) dan harga bilangan konstan K harus kita ketemukan lebih dahulu. Harga-harga a dan K itu dapat kita cari melalui dua jalan: yaitu dengan metode skor kasar dan dengan metode skor deviasi. Dengan metode skor kasar, harga a dan K dapat dicari dari persamaan: ΣXY = a ΣX2 + KΣX ΣY = a ΣX + NK Jika data yang sudah kita ketahui kita masukkan ke dalam rumusrumus tersebut: (1) 102732 = 272,460 a + 1650K (2) 620 = 1650 a + 10 K
9
12/8/2012
Dengan penyelesaian persamaan secara simultan akan kita temukan (dengan membagi persamaan 1 dengan 1.650 dan persamaan 2 dengan 10). (3) 62 = 165,13 a + K (4) 62 = 165 a + K (5) 0,26 = 0,13 a a =2 (4) 62 = (165) 2 + K K = - 268 Dengan harga a = 2 dan K = -268, persamaan garis regresinya adalah: Y = aX – K Y = 2X – 268
Dengan metode skor dari persamaan: y = ax −
dimana: y = Y – Υ
Σxy Σx2 a Y
deviasi harga-harga a dan K dapat kita cari −
, x = X - Χ dan a =
= 432 = 210 = 432/210 = 2,05 = 2,05x
Σxy , maka: Σx 2
dari data yang dikumpulkan dapat dicari: −
Υ = ΣΥ = 620 = 62 Ν 10
−
Χ
=
ΣΧ 1650 = = 165 Ν 10
10
12/8/2012
−
Karena itu, untuk persamaan garis regresi y = ax atau Y - Υ= a (X ), adalah:
−
Χ
Y – 62 = (2,05) (X – 165) Y = 2,05X – 338,25 + 62 = 2,05X – 276,25 Dengan metode skor kasar kita dapat menemukan persamaan garis regresinya, yaitu: Y = 2X – 268, sedang dengan metode skor deviasi kita menemukan persamaan garis regresinya Y = 2,05X – 276,25. Seharusnya dengan kedua metode itu kita tidak menemukan hasil perhitungan yang berbeda. Perbedaan hasil perhitungan garis regresi yang kita temukan itu semata-mata disebabkan karena ketelitian perhitungan saja.
Resp
Berat Bada (X)
Kelincahan (Y)
1
24
28
2
23
30
3
22
26
4
25
28
5
20
28
6
24
29
7
23
27
Carilah koefisien regresinya. Apakah koefisien tersebut signifikan atau tidak ?
11
12/8/2012
Tabel r Product Moment Pada Sig.0,05 (Two Tail) N
r 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
N 0.997 0.95 0.878 0.811 0.754 0.707 0.666 0.632 0.602 0.576 0.553 0.532 0.514 0.497 0.482 0.468 0.456 0.444 0.433 0.423 0.413 0.404 0.396 0.388 0.381 0.374 0.367 0.361 0.355 0.349
r 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
N 0.344 0.339 0.334 0.329 0.325 0.32 0.316 0.312 0.308 0.304 0.301 0.297 0.294 0.291 0.288 0.285 0.282 0.279 0.276 0.273 0.271 0.268 0.266 0.263 0.261 0.259 0.256 0.254 0.252 0.25
r 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
N 0.248 0.246 0.244 0.242 0.24 0.239 0.237 0.235 0.234 0.232 0.23 0.229 0.227 0.226 0.224 0.223 0.221 0.22 0.219 0.217 0.216 0.215 0.213 0.212 0.211 0.21 0.208 0.207 0.206 0.205
R 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
0.204 0.203 0.202 0.201 0.2 0.199 0.198 0.197 0.196 0.195 0.194 0.193 0.192 0.191 0.19 0.189 0.188 0.187 0.187 0.186 0.185 0.184 0.183 0.182 0.182 0.181 0.18 0.179 0.179 0.178
12
12/8/2012
13