STATISTIKA INDUSTRI 2 TIN 4004
Pertemuan 8 • Outline: – Simple Linear Regression and Correlation – Multiple Linear Regression and Correlation
• Referensi: – Montgomery, D.C., Runger, G.C., Applied Statistic and Probability for Engineers, 5th Ed. John Wiley & Sons, Inc., 2011. – Walpole, R.E., Myers, R.H., Myers, S.L., Ye, K., Probability & Statistics for Engineers & Scientists , 9th Ed. Prentice Hall, 2012.
Latihan Soal Simple Linear Regression • Misalnya X adalah persentase kenaikan biaya periklanan dan Y adalah persentase kenaikan hasil penjualan. Berapakah besarnya ramalan persentase kenaikan penjualan jika biaya iklan dinaikkan menjadi 15%? Tentukan variansi (kesalahan baku) regresi linier yang terbentuk. X (%)
Y (%)
1
2
2
4
4
5
5
7
7
8
9
10
10
12
Pendugaan Interval Koefisien Regresi (Slope & Intercept)
Contoh Soal • Berdasarkan data tabel pengaruh hydrocarbon terhadap purity / kemurnian udara, carilah dugaan interval slope-nya: – Jika menggunakan confidence interval (tingkat kepercayaan) 95%, maka:
𝜎 2 = 𝑠2 =
𝑛 𝑖=1(𝑦𝑖
− 𝑦)2 −𝛽1 𝑆𝑥𝑦 = 1,18 𝑛−2
Latihan Soal Confidence Interval • Tentukan interval dari parameter intercept dan slope pada latihan soal biaya periklanan dan kenaikan penjualan, dengan α = 5% atau tingkat keyakinan 95% dan jelaskan artinya!
Peramalan (Prediction) Terhadap Rata-rata Respon (Y)
Contoh Soal • Berdasarkan data tabel pengaruh hydrocarbon terhadap purity / kemurnian udara, carilah interval prediksi untuk Y, dengan 𝑥0 = 1,00% – Sebelumnya telah diperoleh persamaan regresi – Sehingga = 89,23 – Interval prediksi Y:
Peramalan (Prediction) terhadap Single Respon (Y)
To reflect error of precdict future observed response
Contoh Soal • Berdasarkan data tabel pengaruh hydrocarbon terhadap purity / kemurnian udara, carilah interval prediksi untuk Y, dengan 𝑥0 = 1,00% – Sebelumnya telah diperoleh persamaan regresi – Sehingga 𝑦0 = 89,23 – Interval prediksi Y:
Latihan Soal Prediction Dengan menggunakan data dari tabel biaya iklan dan kenaikan penjualan (di atas), Buatlah: a. Ramalan interval untuk individu Y, jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%! b. Ramalan interval untuk rata-rata E(Y), jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%!
Correlation • Analisa korelasi:
– Menggambarkan hubungan antara variable 𝑋 dan 𝑌
• Jika nilai 𝑋 besar maka nilai 𝑌 besar, dan sebaliknya. Contoh: 𝑋 = fasilitas belajar, 𝑌 = prestasi siswa. • Jika nilai 𝑋 besar maka nilai 𝑌 kecil, dan sebaliknya. Contoh: 𝑋 = usia pakai mobil, 𝑌 = nilai jual mobil.
– Note: • Korelasi tidak secara otomatis menunjukkan adanya hubungan kausalitas / sebab akibat atau timbal balik • Contoh: – tinggi badan menyebabkan berat badanya bertambah, tetapi berat badannya bertambah belum tentu menyebabkan tinggi badannya bertambah. – kemiskinan dengan kebodohan – kebersihan dengan kesehatan
Scatter Diagram of Correlation
13
Correlation • Analisa korelasi: – Population coefficient correlation = ρ – Menggunakan sample coefficient correlation
– Disebut juga Pearson product-moment correlation coefficient. – 𝑟 bernilai antara -1 dan +1. – Hati-hati dalam mengintrepertasikan nilai 𝑟. Nilai 𝑟 = 0.3 dan 𝑟 = 0.6, bukan berarti hubungan X dan Y kedua 2x lipat X dan Y pertama.
Correlation – Sample coefficient of determination
– Menunjukkan proporsi total variasi pada nilai variabel Y yang dapat digambarkan secara linier oleh variabel X • Nilai korelasi 0.6, berarti terdapat 36% variasi nilai Y dalam sample yang dipengaruhi secara linier oleh nilai X
Latihan Soal • Hitung koefisien korelasinya dan intrepertasikan.
Multiple Linear Regression • Terdiri atas lebih dari satu independent variable • Metode yang digunakan untuk estimasi koefisien: – Least square estimation (metode kuadarat terkecil) – Normal equation (Persamaan Normal) – Matrix approach (Sistem Matriks)
Pertemuan 9 - Persiapan • Materi – Regresi dan Korelasi Linier Berganda – Regresi Nonlinier