Kualitas Fitted Model
• Apakah model regresi sudah cukup pas mewakili data?
• Apakah model regresi cukup baik untuk model peramalan?
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Tebaran titik amatan / scatter plot a.
Mana di antara gambar–gambar ini yang mo- b. delnya cukup pas/sesuai ?
y
x
c.
y
x Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Perlu diuji y apakah modelnya sudah pas d. atau belum uji lack of fit atau secara eksploratif plot sisaan
y
x
x
a.
y
Tebaran titik amatan / scatter plot y
b.
x
c.
y
x Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Mana di antara gambar–gambar ini yang modelnya cukup baik untuk peramalan? Perlu suatu besaran yang dapat mengukur jauh/dekatnya titik pengamatan thdp garis regresi
y
x
d.
x
Koefisien Determinasi, R2 Koefisien determinasi mengukur proporsi keragaman atau variasi total di sekitar nilai tengah (Y) yang dapat dijelaskan oleh garis regresi secara grafis mengukur jauh/dekatnya titik pengamatan thdp garis regresi
Koefisien determinasi juga disebut R-kuadrat dan dinotasikan sebagai R2
R 2
JK Reg JK Tot
( yˆ (y
CATATAN: Itasia & Y Angraini, Dep Statistika FMIPA - IPB
i
y)2
2 y ) i
2 atau R 1
0 R2 1
JK Sisa JK Total
Analisis Korelasi Analisis korelasi digunakan untuk mengukur kekuatan hubungan (hubungan linier) antara dua peubah Korelasi hanya khusus untuk kekuatan hubungan Mengukur arah hubungan
Tidak berdampak pada sebab akibat
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Analisis Korelasi Koefisien korelasi populasi dinotasikan dengan ρ (huruf Greek rho)
Koefisien korelasi contoh adalah :
r
s xy
sxsy Koefisien korelasi Pearson
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
,
s xy
(x x)(y y) i
n 1
i
Pada Model Regresi Linier Sederhana yg hub.nya linier : R2 = r2 r = (tanda b1)
Uji Hipotesis untuk Korelasi Untuk melakukan tes bahwa tidak ada hubungan linier, Hipotesis nol nya :
H0 : ρ 0
Statistik ujinya mengikuti sebaran t Student dengan derajad bebas (n – 2 )
t
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
r (n 2) (1 r 2 )
Kaidah Keputusan Uji Hipotesis untuk Korelasi
H0: ρ 0 H1: ρ < 0
a
H0: ρ ≤ 0 H1: ρ > 0
-ta
tolak H0 jika t < -tn-2, a
ta
a
Tolak H0 jika t > tn-2, a
dengan t Itasia & Y Angraini, Dep Statistika FMIPA - IPB
H0: ρ = 0 H1: ρ ≠ 0
r (n 2) (1 r ) 2
, d.b n - 2
a/2
-ta/2
a/2 ta/2
Tolak H0 jika t < -tn-2, a/2 atau t > tn-2, a/2
Interpretasi beberapa nilai r2 Y
Y
r2 = 1 dapat diinterpretasikan sbb. :
r2 = 1
r2
=1
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
X
X
Adanya hubungan linier yang tepat antara X dan Y:
100% keragaman Y dijelaskan oleh keragaman X
Interpretasi beberapa nilai r2 Y
Y
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
0 < r2 < 1 dapat diinterpretasikan sbb. : X
X
Adanya hubungan linier yang lemah antara X dan Y: Sebagian (tidak semuanya) keragaman Y dijelaskan oleh keragaman X
Interpretasi beberapa nilai r2 r2 = 0 dapat diinterpretasikan sbb. :
Y
Tidak ada hubungan linier antara X dan Y: r2 = 0
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
X
Nilai Y tidak bergantung pada nilai X. (Tidak ada keragaman Y yang dapat diterangkan oleh keragaman X)
Data contoh Harga Rumah Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
312
1600
245 279 308 199
1400 1700 1875 1100
219
1550
324
2450
405 319 255
FILM : MENDUGA KOEFISIEN KORELASI PEARSON dengan MENGGUNAKAN MINITAB
2350 1425 1700
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Klik di sini
Koefisien Determinasi :
Excel Output
SSR 18934.9348 R 0.58082 SST 32600.5000 2
Regression Statistics
Multiple R R Square
Adjusted R Square Standard Error Observations
ANOVA Regression Residual Total
Intercept
Luas Lantai
0.76211
0.58082
58.08% keragaman harga rumah dijelaskan oleh keragaman luas lantai
0.52842
41.33032
10
df
SS
1
18934.9348
9
32600.5000
8
Coefficients
98.24833
0.10977
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
13665.5652
Standard Error
58.03348
0.03297
MS
18934.9348
1708.1957
t Stat
1.69296
3.32938
F
Significance F
P-value
Lower 95%
11.0848
0.12892
0.01039
0.01039
-35.57720
0.03374
Upper 95%
232.07386
0.18580
Korelasi dan Koefisien Determinasi R2 Koefisien determinasi, R2, untuk regresi linier sederhana yang hubungannya linier (ordo X = 1) sama dengan koefisien korelasi kuadrat
R
2
r
rxy R (tanda b1 )(R )
2 xy
2 1/ 2
^
Korelasi antara amatan Yi dengan nilai dugaannya Yi untuk sembarang regresi linier dengan berapapun banyaknya peubah bebas
r
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
^
Y Y
R
Uji Ketidakpasan Model Harus ada ulangan pengamatan yi pada nilai xi yang sama. Mis. : x
x1 x2
y
y11
y12
y21 y22 y23
x3 x4
y24
y31 y32 y33
y41 y42
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Untuk data contoh di samping dapat dinotasikan : m = 4, n1=2, n2=4, n3=3, n4=2
n
m
j 1
n j 2 4 3 2 11
Uji ketidakpasan model : Tabel Sidik Ragam Derajat Sumber Keragaman Bebas (db) Regresi
1
(b1| b0)
Sisaan
n-2
Ketidakpasan db -db sisa GM model Galat murni
Total (terkoreksi)
nj m m
j 1
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
n-1
Jumlah Kuadrat (JK)
yˆ y n
i 1
2
i
2 ˆ y y i i n
i 1
JKsisa – JKGM
( y ju y j )2 m
nj
y y j 1 u 1
n
i 1
i
2
Kuadrat Tengah (KT) JK Regresi 1
JK sisaan n 2
KTKM KTGM
JKKM dbKM
JKGM dbGM
Statistik ujinya :
Fhit
KT KM KT GM
Langkah-langkah Pemilihan Model yang Pas 1. Tentukan model, dapatkan dugaan persamaan garis regresinya, susun tabel Sidik Ragam, jangan dulu melakukan uji F untuk regresi keseluruhan 2. Lakukan uji ketidakpasan model. Jika tidak ada ulangan, cek secara eksploratif : plot sisaan-nya (akan dijelaskan pada pokok bahasan: Diagnosa Model). Jika nyata : lanjut ke langkah 3 Jika tidak nyata : gunakan KT sisaan s2 sebagai dugaan bagi Rag(Y) = σ2 , lakukan uji F secara keseluruhan, hitung R2, periksa asumsi untuk MKT melalui plot sisaan (Diagnosa Model) 3. Hentikan analisis, perbaiki modelnya (lihat pola plot sisaannya). Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Data contoh Harga Rumah Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
312
1600
245 279 308 199
1400 1700 1875 1100
219
1550
324
2450
405 319 255
2350 1425 1700
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
FILM : MENGUJI KETIDAKPASAN MODEL dengan MENGGUNAKAN MINITAB Klik di sini
Data contoh Harga Rumah Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
312
1600
245 279 308 199
1400 1700 1875 1100
219
1550
324
2450
405 319 255
2350 1425 1700
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Setelah diuji ketidakpasan modelnya, ternyata model yang pas adalah Model Regresi Linier Ordo 1. Selanjutnya kita lakukan pendugaan untuk model linier tsb. Sekaligus mendapatkan dugaan garis regresinya
FILM : Menduga Persamaan Regresi (Linier) Klik di sini
Selang Kepercayaan bagi koefisien kemiringan b1
Selang kepercayaan bagi koefisien kemiringan adalah :
b1 t n2,α/2 sb1 β1 b1 t n2,α/2 sb1
Output Excel untuk contoh kasus harga rumah: Intercept
Luas Lantai
Coefficients
Standard Error
0.10977
0.03297
98.24833
58.03348
t Stat
P-value
3.32938
0.01039
1.69296
0.12892
d.b. = n - 2 Lower 95%
-35.57720
0.03374
Upper 95%
232.07386
0.18580
Pada tingkat kepercayaan 95%, selang kepercayaan bagi koefisien kemiringan garis adalah (0.0337, 0.1858) Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Selang Kepercayaan bagi koefisien kemiringan b1
(lanjutan)
Intercept
Luas Lantai
Coefficients
Standard Error
0.10977
0.03297
98.24833
58.03348
t Stat
P-value
3.32938
0.01039
1.69296
0.12892
Lower 95%
-35.57720
0.03374
Upper 95%
232.07386
0.18580
Selama satuan peubah tak bebas (harga rumah) dalam juta rupiah, kita percaya 95% bahwa rata-rata pengaruh penambahan harga rumah berada antara Rp. 0,03374 juta sampai dengan Rp.0,18580 juta setiap penambahan satu m2 luas lantai Selang kepercayaan 95% ini tidak memuat angka 0.
Kesimpulan : Ada hubungan linier yang nyata antara harga rumah dengan luas lantai dengan tingkat nyata sebesar 95% Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Peramalan Dugaan persamaan garis regresi dapat digunakan untuk memprediksi/meramal nilai Y jika x diketahui (hati-hati hanya untuk x yang berada dalam selang pengamatan) Untuk suatu nilai, xn+1 , nilai prediksi bagi Y adalah
yˆ n1 b0 b1x n1
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Memprediksi dengan menggunakan persamaan garis regresi Berapa kira-kira harga rumah yang luas lantainya 2000 m2 ! (2000 bukan titik pengamatan, namun masih dalam selang pengamatan). interpolasi
harga rumah 98.25 0.1098 (luas lantai) 98.25 0.1098(200 0) 317.85 Prediksi harga rumah dengan luas lantai 2000 m2 adalah Rp 317,85 juta Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Selang data yang relevan Ketika menggunakan garis regresi sebagai alat untuk memprediksi, x yang boleh digunakan adalah x yang nilainya dalam selang pengamatan
Harga Rumah (juta Rp)
Selang yang relevan 450 400 350 300 250 200 150 100 50 0
0
500
1000
1500
2000
Itasia & Y Angraini, Dep Statistika FMIPA - IPB(m2) Luas Lantai
2500
3000
Sangat riskan untuk melakukan ekstrapolasi X di luar selang pengamatan
Selang kepercayaan rataan respon dan dugaan individu Selang kepercayaan bagi rataan Y, untuk xi
Y
y
y = b0 + b1 xi Selang kepercayaan bagi nilai pengamatan y, untuk xi Itasia & Y Angraini, Dep Statistika FMIPA - IPB
xi
X
Selang Kepercayaan bagi nilai harapan Y, untuk suatu X Selang kepercayaan bagi dugaan nilai harapan/rataan y jika diketahui xi
Selang kepercayaan bagi E(Yn 1 | X n 1 ) : yˆ n 1 t n 2,α/2s e
1 (x n 1 x) 2 2 n (x i x)
Perhatikan bahwa rumus tersebut mengandung (x n1 x)2 Jadi beragamnya lebar selang bergantung pada jarak antara xn+1 terhadap nilai rataan, x Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Selang Kepercayaan bagi individu Y, untuk suatu nilai x Selang kepercayaan individu y untuk suatu nilai xi Selang kepercayaa n bagi yˆ n 1 : yˆ n 1 t n 2, α/2 s e
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
1 (x n 1 x) 2 1 2 n (x i x)
Dugaan bagi Nilai Tengah/Rataan: Contoh harga rumah
Selang kepercayaan bagi E(Yn+1|Xn+1)
Dapatkan selang kepercayaan 95% bagi rataan harga rumah dengan luas lantai 2.000 m2
harga rumah yi = 317,85 (Rp. juta) yˆ n1 t n-2,α/2 s e
1 (x i x)2 317.85 37.12 2 n (x i x)
Selang kepercayaan 95% bagi rataan harga rumah adalah dari Rp 280.660.000,- sampai Rp. 354.900.000,Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Dugaan bagi individu/respon:
contoh harga rumah
Selang kepercayaan bagi individu yn+1
Dapatkan selang kepercayaan 95% bagi respon individu harga rumah untuk rumah dengan luas lantai 2.000 m2 yi = 317,85 (Rp. juta)
yˆ n1 t n-1,α/2 s e
1 (Xi X)2 1 317.85 102.28 2 n (Xi X)
Selang kepercayaan 95% bagi harga rumah dengan luas lantai 2000m2 ialah dari Rp 215.500.000,- sampai Rp 420.070.000,-. Itasia & Y Angraini, Dep Statistika FMIPA - IPB
Data contoh Harga Rumah Harga Rumah (Rp.juta) (Y)
Luas Lantai (m2) (X)
312
1600
245 279 308 199
1400 1700 1875 1100
219
1550
324
2450
405 319 255
2350 1425 1700
Itasia & Y Angraini, Dep Statistika FMIPA - IPB
FILM : MENGHITUNG SELANG KEPERCAYAAN BAGI RAMALAN NILAI TENGAH & RAMALAN NILAI INDIVIDU dengan MENGGUNAKAN MINITAB Klik di sini