Atina Ahdika Universitas Islam Indonesia 2015
Pada materi sebelumnya, kita telah belajar tentang koefisien korelasi, yaitu suatu ukuran yang menyatakan tentang kuat tidaknya hubungan linier antara dua variabel. Setelah kita mendapatkan korelasi antara dua variabel cukup kuat, selanjutnya kita bisa melakukan suatu ramalan atau prediksi terhadap nilai satu variabel dengan menggunakan variabel yang lain. Ramalan atau prediksi terhadap suatu variabel dengan menggunakan variabel yang lain dengan menentukan sebuah persamaan yang disebut regresi linier sederhana.
Ketika kita menghitung koefisien korelasi, penentuan variabel 𝑋 dan variabel 𝑌 tidak menjadi masalah, lain halnya dengan penentuan untuk regresi linier sederhana (prediksi). Dalam regresi linier sederhana, terdapat aturan tertentu dalam menentukan data yang mana yang sesuai untuk variabel 𝑋 atau variabel 𝑌, yaitu Variabel 𝑋 adalah variabel bebas/independen/penjelas, yaitu variabel yang berdiri sendiri atau tidak dipengaruhi oleh variabel lain. Variabel 𝑌 adalah variabel terikat/independen/respon, yaitu variabel yang tak bebas atau dipengaruhi oleh variabel yang lain.
Sebelum menentukan garis/persamaan regresi, baiknya kita melakukan pengecekan terhadap kondisi berikut: Scatter plot-nya memiliki pola linier Koefisien korelasinya cukup kuat (𝑟 ≤ −0.6 atau 𝑟 ≥ 0.6)
Manakah variabel 𝑋 dan variabel 𝑌 yang sesuai dari contoh-contoh berikut? 1. Data mengenai angka kematian dan tingkat kemiskinan penduduk 2. Data mengenai nilai ujian dan jam belajar mahasiswa 3. Data mengenai harga produk dan banyaknya permintaan terhadap produk tersebut
Contoh lain?
Persamaan regresi linier sederhana 𝑦 = 𝛽0 + 𝛽1 𝑥 Estimasi koefisien (parameter) regresi linier: 𝑦 = 𝑏0 + 𝑏1 𝑥 Dengan 𝑦 : nilai yang diukur atau dihitung pada variabel tidak bebas (nilai yang akan diestimasi) 𝑥 : nilai tertentu dari variabel bebas 𝑏0 : 𝑦 pintasan (nilai 𝑦 jika 𝑥 = 0) 𝑏1 : kemiringan dari garis regresi (kenaikan atau penurunan untuk setiap perubahan satu satuan 𝑥), disebut juga koefisien regresi yang mengukur besarnya pengaruh 𝑥 terhadap 𝑦
Residual adalah error yang diperoleh dari estimasi oleh persamaan regresi, atau selisih nilai sebenarnya dengan nilai estimasi. 𝑒𝑖 = 𝑦𝑖 − 𝑦𝑖 Dengan 𝑒𝑖 : error data ke-𝑖 𝑦𝑖 : nilai yang sebenarnya ke-𝑖 𝑦𝑖 : nilai estimasi ke-𝑖 dari persamaan regresi
Persamaan regresi:
𝑦 = 𝑏0 + 𝑏1 𝑥 Estimasi koefisien 𝑏0 dan 𝑏1 dari persamaan regresi dapat dihitung dengan menggunakan rumus berikut: 𝑛∑𝑥𝑦 − ∑𝑥 ∑𝑦 𝑏1 = 𝑛∑𝑥 2 − ∑𝑥 2
𝑏0 = 𝑦 − 𝑏1 𝑥
Contoh: Misalkan berikut ini adalah data mengenai pendapatan nasional per kapita dan pengeluaran konsumsi rumah tangga (dalam ribuan rupiah). Cari persamaan garis regresi linier 𝑦 = 𝑏0 + 𝑏1 𝑥 Pendapatan Nasional Per Kapita
Pengeluaran Konsumsi Rumah Tangga
19
15
27
20
39
28
47
36
52
42
66
45
78
51
85
55
Setelah dihitung diperoleh 𝑟 = 0.985
Manakah variabel 𝑋 dan manakah variabel 𝑌 dari contoh tersebut?
Variabel 𝑋 : pendapatan nasional per kapita Variabel 𝑌 : pengeluaran konsumsi rumah tangga 𝒙
𝒚
𝒙𝟐
𝒙𝒚
19
15
361
285
27
20
729
540
39
28
1521
1092
47
36
2209
1692
52
42
2704
2184
66
45
4356
2970
78
51
6084
3978
85
55
7225
4675
∑𝑥𝑖 = 413
∑𝑦𝑖 =292
∑𝑥 2 = 25189
∑𝑥𝑦 = 17416
𝑥 = 51.625
𝑦 = 36.5
𝑛∑𝑥𝑦 − ∑𝑥 ∑𝑦 8 17416 − 413 292 𝑏1 = = = 0.605 2 2 2 𝑛∑𝑥 − ∑𝑥 8 25189 − 413 𝑏0 = 𝑦 − 𝑏1 𝑥 = 36.5 − 0.605 51.625 = 5.27 Jadi, persamaan regresinya adalah 𝑦 = 5.27 + 0.605𝑥 Sekarang, misal ditanyakan nilai estimasi pengeluaran konsumsi rumah tangga jika diketahui pendapatan nasional per kapita nya adalah 100 (dalam ribuan rupiah)? Dengan menggunakan persamaan regresi di atas, maka 𝑦 = 5.27 + 0.605 100 = 65.77 Jadi, estimasi pengeluaran konsumsi rumah tangganya adalah 𝑅𝑝 65.770
Ukuran baik atau buruknya suatu persamaan regresi, salah satunya adalah dengan melihat nilai rata-rata galat kuadratnya, atau dikenal dengan istilah MSE (Mean Squared Error). Semakin kecil nilai MSE, maka persamaan regresinya semakin baik. 1 2 𝑀𝑆𝐸 = ∑𝑒 𝑛
Persamaan regresi: 𝑦 = 5.27 + 0.605𝑥 𝒙
𝒚
𝒚
𝒆
𝒆𝟐
19
15
16.765
-1.765
3.115225
27
20
21.605
-1.605
2.576025
39
28
28.865
-0.865
0.748225
47
36
33.705
2.295
5.267025
52
42
36.73
5.27
27.7729
66
45
45.2
-0.2
0.04
78
51
52.46
-1.46
2.1316
85
55
56.695
-1.695
2.873025 ∑𝑒𝑖2 =44.524025
Jadi, 𝑀𝑆𝐸 =
1 8
44.524025 = 5.5655
Carilah data real (nyata) yang dengan dua variabel yang saling berhubungan, sertakan judul serta sumber data. Kemudian lakukan hal-hal berikut 1. Hitunglah nilai koefisien korelasinya 2. Gambarkan scatter plot-nya 3. Tentukan persamaan regresi dan 𝑀𝑆𝐸