08/11/2013
Pertemuan 8 • Outline:
STATISTIKA INDUSTRI 2 TIN 4004
Introduction to Linier Regression
– Regresi Linier Sederhana dan Korelasi (Simple Linier Regression and Correlation)
• Referensi: – Montgomery, D.C., Runger, G.C., Applied Statistic and Probability for Engineers, 5th Ed. John Wiley & Sons, Inc., 2011. – Walpole, R.E., Myers, R.H., Myers, S.L., Ye, K., Probability & Statistics for Engineers & Scientists , 9th Ed. Prentice Hall, 2012.
Introduction to Linier Regression
• Dasar: – studi mengenai hubungan dua atau lebih variabel – Deterministik linier:
• • • •
• Single variable: 𝒀 = 𝜷𝟎 + 𝜷𝟏 𝒙 • Multiple variable: 𝒀 = 𝜷𝟎 + 𝜷𝟏 𝒙𝟏 + 𝜷𝟐 𝒙𝟐 𝑌 : Dependent Variable / responses 𝑥 : Independent Variable / regressors 𝛽0 = 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡 𝛽1 = 𝑠𝑙𝑜𝑝𝑒
Introduction to Linier Regression
Simple Linear Regression (SLR) Model
• Kondisi nyata: sangat jarang terjadi deterministik linier – Contoh: • Konsumsi energi rumah tangga, dipengaruhi oleh ukuran rumah • Pemakaian BBM, dipengaruhi berat muatan
• ANALISA REGRESI: – Pertama kali digunakan oleh Sir Francis Galton, untuk studi keterkaitan tinggi seorang ayah dan anak laki-laki-nya. – Tool statistik yang digunakan untuk memodelkan dan mengeksplorasi hubungan antara variabel yang nondeterministik – Digunakan untuk melakukan peramalan / prediksi, optimasi
1
08/11/2013
Simple Linear Regression (SLR) Model
Simple Linear Regression (SLR) Model • Karl Gauss: mengusulkan cara estimasi 𝛽0 dan 𝛽1 , sehingga meminimasi sum of square deviasi vertikal • Estimasi 𝛽0 dan 𝛽1 pada SLR:
ϵ : random error; dengan mean = 0, 𝜎 2 tidak diketahui n : jumlah observasi
Simple Linear Regression (SLR) Model
Simple Linear Regression (SLR) Model • Variansi (σ2 ) titik observasi: variasi error pada persamaan regresi linier • σ2 diestimasikan dengan s2
Contoh Soal •
Contoh Soal
Berdasarkan data tabel di atas (pengaruh hydrocarbon terhadap purity / kemurnian udara):
Hitung s 2 nya!
2
08/11/2013
Latihan Soal
Latihan Soal
• Estimasikan persamaan garis regresi untuk data pada tabel di bawah ini (hitung pula estimasi variansi errornya).
Uji Hipotesa pada SLR • Menggunakan Uji-t • Dilakukan untuk menduga nilai parameter model regresi dan membentuk confidence intervals • Asumsi ϵ berdistribusi normal • Pengujian yang dilakukan: 𝐻0 : 𝛽1 = 𝛽10
𝐻0 : 𝛽1 = 0
𝐻0 : 𝛽0 = 𝛽00
𝐻1 : 𝛽1 ≠ 𝛽10 𝐻1 : 𝛽1 > 𝛽10 𝐻1 : 𝛽1 < 𝛽10
𝐻1 : 𝛽1 ≠ 0
𝐻1 : 𝛽0 ≠ 𝛽00 𝛽00 : konstanta
• Misalnya X adalah persentase kenaikan biaya periklanan dan Y adalah persentase kenaikan hasil penjualan. Berapakah besarnya ramalan persentase kenaikan penjualan jika biaya iklan dinaikkan menjadi 15%? Tentukan variansi (kesalahan baku) regresi linier yang terbentuk. X (%)
Y (%)
1
2
2
4
4
5
5
7
7
8
9
10
10
12
Uji Hipotesa pada SLR 𝐻0 : 𝛽1 = 𝛽10
𝐻1 : 𝛽1 ≠ 𝛽10 𝐻1 : 𝛽1 > 𝛽10 𝐻1 : 𝛽1 < 𝛽10
vs
• T hitung: 𝑠2
• Daerah penolakan: Degree of freedom = n – 2
𝑡0 > 𝑡α,𝑛−2 𝑡0 < −𝑡α,𝑛−2
𝛽10 : konstanta
Uji Hipotesa pada SLR 𝐻0 : 𝛽1 = 0
vs
𝐻1 : 𝛽1 ≠ 0
• T hitung: 𝑇0 =
Uji Hipotesa pada SLR 𝐻0 : 𝛽0 = 𝛽00
𝐻1 : 𝛽0 ≠ 𝛽00 𝐻1 : 𝛽0 > 𝛽00 𝐻1 : 𝛽0 < 𝛽00
vs
• T hitung: 𝛽1 𝑠2
𝛽0 − 𝛽00
𝑇0 = 𝑠2
𝑆𝑥𝑥
• Daerah penolakan:
𝑛 2 1 𝑥𝑖
(𝑛𝑆𝑥𝑥 )
• Daerah penolakan: Degree of freedom = n – 2
Degree of freedom = n – 2
𝑡0 > 𝑡α,𝑛−2 𝑡0 < −𝑡α,𝑛−2
3
08/11/2013
Uji Hipotesa pada SLR 𝐻0 : 𝛽1 = 0 • • •
vs
Uji Hipotesa pada SLR
𝐻1 : 𝛽1 ≠ 0
Jika 𝐻0 diterima, artinya tidak ada hubungan linier antara x dan Y. Jika 𝐻0 diterima, artinya x sedikit mempengaruhi variasi nilai Y, dengan estimator terbaik untuk Y oleh setiap nilai x adalah 𝑦 = 𝑌. (gambar a) Jika 𝐻0 diterima, memang benar antara x dan Y tidak ada hubungan linier. (gambar b)
Uji Hipotesa pada SLR: Latihan Soal
𝐻0 : 𝛽1 = 0 • • •
𝐻1 : 𝛽1 ≠ 0
vs
Jika 𝐻0 ditolak, artinya x memilik pengaruh pada variabilitas nilia Y. Jika 𝐻0 ditolak, artinya terdapat cukup hubungan linier antara x dan Y . (gambar a) Jika 𝐻0 ditolak, artinya terdapat hubungan linier antara x dan Y, namun lebih tepat digambarkan dengan hubungan polynomial yang lain (gambar b).
Pendugaan Interval Koefisien Regresi (Slope & Intercept)
• Lakukan uji hipotesa pada parameter slope tidak sama dengan nol untuk model regresi linier pengaruh hydrocarbon terhadap purity / kemurnian udara di atas (diketahui 𝛼 = 0,01).
Contoh Soal • Berdasarkan data tabel pengaruh hydrocarbon terhadap purity / kemurnian udara, carilah dugaan interval slope-nya: – Jika menggunakan confidence interval (tingkat kepercayaan) 95%, maka:
𝜎2 = 𝑠2 =
𝑛 𝑖=1(𝑦𝑖
− 𝑦)2 −𝛽1 𝑆𝑥𝑦 = 1,18 𝑛−2
Latihan Soal Confidence Interval • Tentukan interval dari parameter intercept dan slope pada biaya periklanan dan kenaikan penjualan berikut, dengan α = 5% atau tingkat keyakinan 95% dan jelaskan artinya! X (%)
Y (%)
1
2
2
4
4
5
5
7
7
8
9
10
10
12
4
08/11/2013
Peramalan (Prediction) Terhadap Rata-rata Respon (Y)
Contoh Soal • Berdasarkan data tabel pengaruh hydrocarbon terhadap purity / kemurnian udara, carilah interval prediksi untuk Y, dengan 𝑥0 = 1,00% – Sebelumnya telah diperoleh persamaan regresi – Sehingga = 89,23 – Interval prediksi Y:
Peramalan (Prediction) terhadap Single Respon (Y)
Contoh Soal • Berdasarkan data tabel pengaruh hydrocarbon terhadap purity / kemurnian udara, carilah interval prediksi untuk Y, dengan 𝑥0 = 1,00% – Sebelumnya telah diperoleh persamaan regresi – Sehingga 𝑦0 = 89,23 – Interval prediksi Y:
To reflect error of precdict future observed response
Latihan Soal Prediction Dengan menggunakan data dari tabel biaya iklan dan kenaikan penjualan (di atas), Buatlah: a. Ramalan interval untuk individu Y, jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%! b. Ramalan interval untuk rata-rata E(Y), jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%!
Correlation • Analisa korelasi:
– Menggambarkan hubungan antara variable 𝑋 dan 𝑌 • Jika nilai 𝑋 besar maka nilai 𝑌 besar, dan sebaliknya. Contoh: 𝑋 = fasilitas belajar, 𝑌 = prestasi siswa. • Jika nilai 𝑋 besar maka nilai 𝑌 kecil, dan sebaliknya. Contoh: 𝑋 = usia pakai mobil, 𝑌 = nilai jual mobil.
– Note: • Korelasi tidak secara otomatis menunjukkan adanya hubungan kausalitas / sebab akibat atau timbal balik • Contoh: – tinggi badan menyebabkan berat badanya bertambah, tetapi berat badannya bertambah belum tentu menyebabkan tinggi badannya bertambah. – kemiskinan dengan kebodohan – kebersihan dengan kesehatan
5
08/11/2013
Scatter Diagram of Correlation
Correlation • Analisa korelasi: – Population coefficient correlation = ρ – Menggunakan sample coefficient correlation
31
Correlation – Sample coefficient of determination
– Disebut juga Pearson product-moment correlation coefficient. – 𝑟 bernilai antara -1 dan +1. – Hati-hati dalam mengintrepertasikan nilai 𝑟. Nilai 𝑟 = 0.3 dan 𝑟 = 0.6, bukan berarti hubungan X dan Y kedua 2x lipat X dan Y pertama.
Latihan Soal • Hitung koefisien korelasinya dan intrepertasikan.
– Menunjukkan proporsi total variasi pada nilai variabel Y yang dapat digambarkan secara linier oleh variabel X • Nilai korelasi 0.6, berarti terdapat 36% variasi nilai Y dalam sample yang dipengaruhi secara linier oleh nilai X
Pertemuan 9 - Persiapan • Materi – Regresi linier berganda dan korelasi – Regresi nonlinier
6