REGRESI LINEAR SEDERHANA
y (x5,y5) ● d5
(x3,y3) ● d3
d2
● (x2,y2)
d4
● (x4,y4)
d
1 ● (x1,y1)
x
Definisi: Dari semua kurva pendekatan terhadap satu set data, kurva yang memenuhi sifat bahwa nilai S=d12+d22+...+dN2 adalah minimum disebut dengan kurva terbaik yang mewakili data.
Koefisien Diterminasi yi − yˆi ) ( ∑ = 1− 2 ∑ ( yi − y )
2
R
2
Interpretasi koefisien diterminasi: 100(R2)% variasi sampel dalam y dapat dijelaskan dengan menggunakan x untuk memprediksi y pada model linear.
Problem 1: Regresi Linear Sederhana Bagaimana pengaruh harga terhadap sales suatu produk ? Dapatkah meramal sales suatu produk berdasarkan harganya ?
Input (X)
Harga Produk
Controllable Factors F1, F2, …, Fq
Biaya Iklan, Jumlah Outlet, Area Pemasaran dan faktor lain yang dapat dikontrol dalam kondisi TETAP
Process
Output (Y)
Z1, Z2, …, Zq
Sales Produk
(Model Regresi)
Uncontrollable Factors Harga Pesaing, Selera Konsumen, Kondisi Ekonomi Nasional (inflasi dll) dan faktor lain yang tidak dapat dikontrol dalam kondisi TETAP
Tahap-tahap dalam Analisis Regresi 1. Plot data  identifikasi bentuk hubungan secara grafik 2. Koefisien Korelasi  identifikasi hubungan linear dengan suatu angka n
Ö rxy =
∑ ( xi i =1
n
∑ ( xi i =1
− x )( y i − y )
− x)2
n
∑ ( yi
, -1 ≤ rxy ≤ 1
− y) 2
i =1
3. Pendugaan (estimasi) model regresi 4. Evaluasi (diagnostic check) kesesuain model regresi 5. Prediksi (forecast) suatu nilai Y pada suatu X tertentu
Problem 1: Data hasil pengamatan …
Minggu
Sales (ribu unit)
Harga (ribu rupiah)
1.
10
1.3
2.
6
2.0
3.
5
1.7
4.
12
1.5
5.
10
1.6
6.
15
1.2
7.
5
1.6
8.
12
1.4
9.
17
1.0
10.
20
1.1
Pengamatan dilakukan dengan mengambil secara random data 10 minggu penjualan
(continued)
Plot antara Harga dan Sales
Problem 1: MINITAB output …
(continued)
MTB > Correlation 'Harga' 'Sales'. Pearson correlation of Harga and Sales = -0.863 P-Value = 0.001 MTB > Regress 'Sales' 1 'Harga' The regression equation is Sales = 32.1 – 14.5 Harga Predictor Constant Harga S = 2.725
Coef 32.136 -14.539
SE Coef 4.409 3.002
R-Sq = 74.6%
T 7.29 -4.84
P 0.000 0.001
R-Sq(adj) = 71.4%
Analysis of Variance Source Regression Residual Error Total
DF 1 8 9
SS 174.18 59.42 233.60
MS 174.18 7.43
F 23.45
P 0.001
Problem 1: MINITAB output …
(continued)
Plot data, garis regresi dan ramalan Sales dari Harga
Linearisasi Persamaan Pangkat Sederhana
Contoh Soal: a=1,8515 b=0,1981 Hitung: c = ea = e1,8515 = 6,369366 Jadi y = cxb = 6,368366x0,1981
Linearisasi Model eksponensial y=c.ebx
Problem 2: Regresi Linear Berganda Bagaimana pengaruh harga dan biaya iklan terhadap sales suatu produk ? Lebih baikkah ketepatan ramalannya ?
Input (X)
Harga Produk
Biaya Iklan
Controllable Factors F1, F2, …, Fq
Jumlah Outlet, Area Pemasaran dan faktor faktor lain yang dapat dikontrol dalam kondisi TETAP
Process
Output (Y)
Z1, Z2, …, Zq
Sales Produk
(Model Regresi)
Uncontrollable Factors Harga Pesaing, Selera Konsumen, Kondisi Ekonomi Nasional (inflasi dll) dan faktor lain yang tidak dapat dikontrol dalam kondisi TETAP
Problem 2: Data hasil pengamatan …
(ribu unit)
Harga
(ribu rupiah)
Biaya Iklan
1.
10
1.3
9
2.
6
2.0
7
3.
5
1.7
5
4.
12
1.5
14
5.
10
1.6
15
6.
15
1.2
12
7.
5
1.6
6
8.
12
1.4
10
9.
17
1.0
15
10.
20
1.1
21
Minggu
Sales
(continued)
(juta rupiah)
Pengamatan dilakukan dengan mengambil secara random data 10 minggu penjualan
Plot antara Harga, Iklan dg Sales
Problem 2: MINITAB output …
MTB > Correlation 'Sales''Iklan'.
(continued)
MTB > Regress 'Sales' 2 'Harga' 'Iklan' The regression equation is
Correlations: Sales, Harga, Iklan
Harga
Iklan
Sales -0.863 0.001 0.891 0.001
Harga
-0.654 0.040
Cell Contents: Pearson correlation P-Value
Sales = 16.4 - 8.25 Harga + 0.585 Iklan Predictor Constant Harga Iklan
Coef 16.406 -8.248 0.5851
SE Coef 4.343 2.196 0.1337
S = 1.507
R-Sq = 93.2%
T 3.78 -3.76 4.38
P 0.007 0.007 0.003
R-Sq(adj) = 91.2%
Analysis of Variance Source DF Regression 2 Residual 7 Total 9
SS 217.70 15.90 233.60
MS 108.85 2.27
F P 47.92 0.000
Problem 2: MINITAB output …
R2 = 74.6% R2 = 79.5%
(continued)
R2 = 93.2%
Problem 3: Regresi dengan Variabel Dummy Bagaimana pengaruh TES BAKAT dan GENDER thd produktifitas ? Dapatkah produktifitas pekerja diramal dari tes bakat dan jenis kelaminnya?
Input (X)
Nilai TES BAKAT pekerja
Controllable Factors F1, F2, …, Fq
Process
Output (Y)
Z1, Z2, …, Zq
Produktifitas pekerja
(Model Regresi)
JENIS KELAMIN pekerja
Usia, Pendidikan, Ruang kerja, Mesin dan faktor faktor lain yang dapat dikontrol dalam kondisi TETAP
Uncontrollable Factors
Emosi (suasana hati) pekerja dan faktor lain yang tidak dapat dikontrol dalam kondisi TETAP
Problem 2: Data hasil pengamatan …
Pengamatan dilakukan dengan mengambil secara random data 15 pekerja
(continued)
Plot antara Tes Bakat dan Produktifitas, antara pekerja PRIA dan WANITA
Problem 3: MINITAB output …
MTB > Correlation
(continued)
'Tes Bakat' 'Dummy' 'Produktifitas'.
Produktifitas
Tes Bakat 0.876 0.000
Dummy -0.021 0.940
MTB > Regress 'Produktifitas' 2 'Tes Bakat' 'Dummy' The regression equation is Produktifitas = - 4.14 + 0.120 Tes Bakat + 2.18 Dummy Predictor Constant Tes Bakat Dummy S = 0.7863
Coef -4.1372 0.12041 2.1807
SE Coef 0.8936 0.01015 0.4503
R-Sq = 92.1%
T -4.63 11.86 4.84
P 0.001 0.000 0.000
R-Sq(adj) = 90.8%
Problem 3: MINITAB output …
(continued)
Problem 3: Plot hasil regresi …
(continued)
WANITA
PRIA
Model-model Time Series Regression
1. Model Regresi untuk LINEAR TREND Yt = a + b.t + error
Ö t = 1, 2, … (dummy waktu)
2. Model Regresi untuk Data SEASONAL (variasi konstan) Yt = a + b1 D1 + … + bS-1 DS-1 + error dengan : D1, D2, …, DS-1 adalah dummy waktu dalam satu periode seasonal.
3. Model Regresi untuk Data dengan LINEAR TREND dan SEASONAL (variasi konstan) Yt = a + b.t + c1 D1 + … + cS-1 DS-1 + error  Gabungan model 1 dan 2.
Problem 4: Regresi Trend Linear
(Video Store case)
Time Series Plot data Sales
Problem 4: Hasil Regresi Trend dg MINITAB …
(continued)
Problem 4: Hasil Regresi Trend dg MINITAB …
(continued)
Problem 5: Regresi Data Seasonal …
(Data Electrical Usage)
Time Series Plot (Data seasonal)
Problem 5: Hasil regresi dengan MINITAB …
MTB > Regress 'Kilowatts' 3 'Kuartal-1'-'Kuartal-3'
The regression equation is Kilowatts = 722 + 281 Kuartal.1 - 97.4 Kuartal.2 - 202 Kuartal.3 Predictor Constant Kuartal.1 Kuartal.2 Kuartal.3 S = 30.84
Coef 721.60 281.20 -97.40 -202.20
SE Coef 13.79 19.51 19.51 19.51
R-Sq = 97.7%
Analysis of Variance Source DF Regression 3 Residual Error 16 Total 19
SS 646802 15220 662022
T 52.32 14.42 -4.99 -10.37
P 0.000 0.000 0.000 0.000
R-Sq(adj) = 97.3%
MS 215601 951
F 226.65
P 0.000
Problem 5: Struktur dummy dan hasil regresinya …
Dummy Variable
Problem 5: Hasil regresi dengan MINITAB … Forecast
Time Series Plot (Data dan Ramalannya)
Problem 6: Regresi Data Trend Linear dan Seasonal …
Time Series Plot (Data trend dan seasonal)
Problem 6: Hasil regresi dengan MINITAB …
Dummy Variable
Problem 6: Hasil regresi dengan MINITAB …
MTB > Regress 'Sales' 4 't' 'Kuartal.1'-'Kuartal.3' The regression equation is Sales = 413 + 19.7 t + 130 Kuartal.1 - 108 Kuartal.2 - 228 Kuartal.3 16 cases used 4 cases contain missing values Predictor Constant t Kuartal.1 Kuartal.2 Kuartal.3 S = 35.98
Coef 412.81 19.719 130.41 -108.06 -227.78
SE Coef 26.99 2.012 26.15 25.76 25.52
R-Sq = 96.3%
T 15.30 9.80 4.99 -4.19 -8.92
P 0.000 0.000 0.000 0.001 0.000
R-Sq(adj) = 95.0%
Analysis of Variance Source Regression Residual Error Total
DF 4 11 15
SS 371967 14243 386211
MS 92992 1295
F 71.82
P 0.000
Problem 6: Hasil regresi dengan MINITAB …
Forecast
Time Series Plot (Data dan Ramalannya)
Perbandingan ketepatan ramalan antar metode … Kasus Sales Video Store
Model
Kasus Sales Data Kuartalan
Kriteria kesalahan ramalan MSE
MAD
MAPE
Double M.A.
66.6963
6.68889
0.9557
Holt’s Method
28.7083
4.4236
0.6382
Regresi Trend
21.6829
3.73048
0.5382
Holt’s Method : Alpha (level): 0.202284 Gamma (trend): 0.234940
Kriteria kesalahan ramalan
Model
MSE
MAD
MAPE
Winter’s Method
4372.69
52.29
9.67
Regresi Trend & Seasonal
890.215
23.2969
4.3122
Winter’s Method : Alpha (level): 0.4 Gamma (trend): 0.1 Delta (seasonal): 0.3
Tugas : Carilah model peramalan terbaik untuk dua data sales (produk A dan B) berikut ini.