REGRESI LINEAR SEDERHANA DAN KORELASI 1. Model Regresi Linear 2. Penaksir Kuadrat Terkecil 3 Prediksi Nilai Respons 3. 4. Inferensi Untuk Parameter-parameter Regresi 5. Kecocokan Model Regresi 6. Korelasi
Utriweni Mukhaiyar MA 2181 Analisis Data
Tujuan j 2
2.
Melakukan prediksi terhadap nilai suatu variabel, misalkan Y, berdasarkan nilai variabel yyang g lain , misalkan X, dengan g menggunakan gg model regresi linier (interpolasi). i l i
f(X)
Gula yang Dihasilkan (Y)
Suhu (X)
X menentukan Y respons
prediktor peubah acak
Memiliki distribusi bukan b k peubah b h acak 3
Observasi
1
2
3
…
n
X
X1
X2
X3
…
Xn
Y
Y1
Y2
Y3
…
Yn
1 Variabel yang nilainya mempengaruhi
variabel yang lainnya. 2
3
4
Variabel yang kejadiannya lebih dahulu terjadi.
Variabel yang variansinya terkecil
MODEL REGRESI LINEAR SEDERHANA
Yi 0 1 X i ei - 1 dan 0 merupakan parameter-parameter model yang akan ditaksir - ei adalah galat pada observasi ke-i (acak)
5
Sumber Galat 6
1.
2.
3.
Ketidakmampuan model regresi dalam memodelkan hubungan prediktor dan respons dengan tepat Ketidakmampuan peneliti dalam melakukan pengukuran dengan tepat Ketidakmampuan model untuk melibatkan semua variabel b l prediktor dk
Penaksir Kuadrat Terkecil - 1 dan 0 ditaksir dengan g metode kuadrat terkecil ((least square) - Asumsi-asumsi : 1. Ada pengaruh X terhadap Y 2. Yi 0 1 X i ei , untuk i = 1, 1 2, 2 ..., n 3. Nilai harapan dari ei adalah 0, atau E[ ei ] = 0 4 Variansi 4. V i i dari d i ei, sama untuk t k semua i = 1, 1 2,…, 2 n 5. ei berdistribusi normal untuk semua i = 1, 2,…, n 6. e1,e2,...,en saling bebas (independen) 7
Misalkan b1 adalah taksiran bagi 1 dan b0 adalah taksiran bagi 0. Maka taksiran bagi model regresi adalah
Yˆi b0 b1 X i Kriteria penaksiran kuadrat terkecil adalah meminimumkan n
2 e i i 1
terhadap b0 dan b1, dengan
8
ei Yi Yˆi Yi b0 b1 X i .
Diperoleh p n
JK XY b1 JK XX
X i 1
i
X Yi Y
n
X i 1
i
X
2
b0 Y b1 X Sedangkan g taksiran untuk variansi g galat acak adalah
n
JK G 2 ˆ n2
9
i 1
Yi Yˆi
n2
2
Suhu (X) Gula yg dihasilkan (Y)
1
1 1 1.2 1.1 1 2 1.3 1 3 1.4 1 4 1.5 15
8.1 7.8 8.5 9.8 9.5 8.9
16 1.6
17 1.7
1 8 1.9 1.8 19
8.6 10.2 9.3 9.2 10.5 Sumber: Walpole and Myers, 1989
ei
10
2
n = 11
1 n x x i 1.5 n i 1
1 n y yi 9.13 n i 1
n
b1
x i 1
i
n
x yi y
xi x
2
1.8091 1 8091
i 1
b0 Y b1 X 6.4136
Yˆ 6.4136 1.8091X Model persamaan regresi
11
Prediksi Nilai Respons p 12
ˆi) Prediksi (y model
ei y i yˆ i
Suhu (xi)
Gula yg dihasilkan (yi)
1
8.1
8.22
-0.12
1.1
7.8
8.40
-0.60
1.2
8.5
8.58
-0.08
1.3
9.8
8.77
1.03
1.4
9.5
8.95
0.55
1.5
8.9
-0.23
1.6
8.6
9.13 1 2 yi yˆ i 0.4 9 9.31
-0.71
1.7
10.2
9.49
0.71
1.8
9.3
9.67
-0.37
1.9
9.2
9.85
-0.65
2
10.5
10.03
0.47
T ki Taksiran variansi i i galat l acakk
ˆ 2
Misalkan suhu proses (X) adalah 1.55 satuan suhu. Maka prediksi banyaknya gula yang dihasilkan pada suhu h tersebut t b t adalah d l h
yˆ 6.4136 1.8091x = 6.4136 + 1.8091(1.55) =9.217705 13
ASUMSI KENORMALAN
14
1
• Asumsi ei berdistribusi normal untuk semua i = 1, 2,…, n
2
• Yi beristribusi normal untuk semua i = 1 1, 2,…, 2 n
3
• b0 dan b1 berdistribusi normal
INFERENSI UNTUK PARAMETER 0 b0 0
T0 =
ˆ
n
x i 1
2 i
/ nJK XX
berdistribusi t dengan derajat kebebasan n-2. Selang kepercayaan (1-α) untuk 0 :
b0 t / 2ˆ
n
x / nJK XX 0 b0 t / 2ˆ i 1
2 i
t/2 adalah nilai distribusi t dengan derajat kebebasan n-2 15
n
2 x i / nJK XX i 1
INFERENSI UNTUK PARAMETER 1 b1 1 T1 = ˆ / JK XX berdistribusi t dengan derajat kebebasan n-2. Selang kepercayaan (1-α) untuk 1 :
t / 2ˆ t / 2ˆ b1 1 b1 JK XX JK XX t/2 adalah nilai distribusi t dengan derajat kebebasan n-2 16
PENGUJIAN PARAMETER REGRESI
Rumusan Hipotesis H 0 : β0 = 0
H 0 : β1 = 0
H 1 : β0 ≠ 0
H 1 : β1 ≠ 0
b0
t0 ˆ
17
t1
n
2 x i i 1
nJK XX
ˆ
b1 JK XX
SELANG PREDIKSI Misalkan nilai respons p Y untuk X = X0 adalah Y0, dan misalkan adalah prediksi model regresi bagi Y0. Maka T
ˆ -Y Y 0 0 ˆ 1+(1/n)+[(x 0 x)2 / JK XX ]
berdistribusi t dengan derajat kebebasan n-2. Selang prediksi (1 – α) bagi y0 adalah 1 (x 0 x)2 1 (x 0 x)2 yˆ 0 t / 2ˆ 1+ + y0 yˆ 0 t / 2ˆ 1+ + n JK XX n JK XX 18
CONTOH 1 SELANG KEPERCAYAAN 1- 1 TINJAU CONTOH SEBELUMNYA
(2.26)(0.4) (2.26)(0.4) 1.8091 1 1.8091 1.1 1.1 Selang kepercayaan 95% untuk β1 :
b1=1,8091
19
b0=6,4136
6.4136 (2.26)(0.4)
Selang kepercayaan 95% untuk β0 :
25.85 25.85 0 6.4136 (2.26)(0.4) (11)(1.1) (11)(1.1)
CONTOH 2 UJI HIPOTESIS
t0 > t0.025 & t1 > t0.025 maka masing-masing H0 ditolak
Kesimpulan β0 dan β1 tidak dapat diabaikan
20
Kecocokan Model Regresi Salah satu alat ukur untuk melihat apakah model regresi yang diperoleh sudah memadai adalah koefisien determinasi yaitu n
R2 =
JK R = JK T
(yˆ
2 y) i
(y
2 y) i
i=1 n
, dengan 0 R 2 1
i=1
Besaran R2 menunjukkan proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang diperoleh 21
UJI KEBAIKAN MODEL H0 : Model regresi yang diperoleh tidak memadai H1 : Model memadai Statistik uji
n
JK R f ˆ
2 ˆ (y y) i i=1
ˆ
Tolak H0 pada tingkat keberartian α jika f > f,(1,n-2), dimana f,(1,n-2) adalah nilai distribusi F dengan derajat kebebasan 1 dan n – 2. 22
CONTOH 3 Untuk contoh sebelumnya diperoleh R2 = 0,499. Artinya proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang diperoleh adalah 49.9% Uji kebaikan model n
2 ˆ (y y) i
JK R i=1 8.99 ˆ ˆ Untuk α = 5%,, titik kritis f0.05,(1,9) , 0 05 (1 9) = 5,12 f
23
f > f0.05,(1,9), model memadai.
Korelasi
Mengukur hubungan linear dua peubah acak Misalkan X dan Y adalah dua peubah acak, maka korelasi antara X dan Y dinyatakan dengan
XY
24
E (X X )(Y Y ) X Y
25
26
Gambar 1 Korelasi positif
Gambar 2 Korelasi negatif
Gambar 3 Korelasi nol
Gambar 4 Korelasi nol
KORELASI SAMPEL Korelasi dapat ditaksir dengan koefisien korelasi sampel, yaitu rXY
JK XY JK XX JK YY n
27
(X
i
X)(Yi Y)
i=1
n n 2 2 (X i X) (Yi Y) i=1 i=1
CONTOH 4 Data dua peubah acak berat badan bayi (kg) dan ukuran dada bayi (cm)
28
berat (kg)
ukuran dada (cm)
2.75
29.5
2.15
26.3
4.41
32.2
5.52 5 52
36 5 36.5
3.21
27.2
4.32
27.7
2.31
28.3
4.3
30.3
3.71 3 71
28 7 28.7
Rata-rata berat = 3.63 , Rata-rata ukuran dada = 29.63
ukuran (cm)
38 36 34 32 30 28 26 24 22 20 1
2
3
4
5
berat (kg)
9
r
29
(X
i
X)(Yi Y)
i=1
9 9 2 2 (X X) (Y Y) i i i=1 i=1
0.78
6
Referensi 30
Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika. Walpole, Ronald E. Dan Myers, Raymond H., Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, Ilmuwan Edisi 4, 4 Bandung: Bandung Penerbit ITB ITB, 1995.