11/10/2010
REGRESI LINEAR SEDERHANA DAN KORELASI 1. Model Regresi Linear 2. Penaksir Kuadrat Terkecil 3. Prediksi Nilai Respons 4. Inferensi Untuk Parameter-parameter Regresi 5. Kecocokan Model Regresi 6. Korelasi Utriweni Mukhaiyar MA 2181 Analisis Data
TUJUAN 1.
Menentukan/menaksir parameterparameter yang terlibat dalam suatu model matematik yang linear terhadap parameter-parameter tersebut
2.
Melakukan prediksi terhadap nilai suatu variabel, misalkan Y, berdasarkan nilai variabel yang lain , misalkan X, dengan menggunakan model regresi linier (interpolasi). 2
f(X)
Gula yang Dihasilkan (Y)
Suhu (X)
X menentukan Y respons
prediktor peubah acak bukan peubah acak
Memiliki distribusi 3
1
11/10/2010
Observasi
1
2
3
…
n
X
X1
X2
X3
…
Xn
Y
Y1
Y2
Y3
…
Yn
1 Variabel yang nilainya mempengaruhi
variabel yang lainnya. 2
Mana yang merupakan prediktor ?? 3
Variabel yang kejadiannya lebih dahulu terjadi.
Variabel yang variansinya terkecil 4
MODEL REGRESI LINEAR SEDERHANA
Yi 0 1 X i ei - 1 dan 0 merupakan parameter-parameter parameter parameter model yang akan ditaksir - ei adalah galat pada observasi ke-i (acak)
5
SUMBER GALAT
1.
2.
3.
Ketidakmampuan model regresi dalam memodelkan hubungan prediktor dan respons dengan tepat Ketidakmampuan peneliti dalam melakukan pengukuran dengan tepat Ketidakmampuan model untuk melibatkan semua variabel prediktor
6
2
11/10/2010
PENAKSIR KUADRAT TERKECIL - 1 dan 0 ditaksir dengan metode kuadrat terkecil (least square) - Asumsi-asumsi : 1. Ada p pengaruh g X terhadap pY 2. Yi 0 1 X i ei , untuk i = 1, 2, ..., n 3. Nilai harapan dari ei adalah 0, atau E[ ei ] = 0 4. Variansi dari ei, sama untuk semua i = 1, 2,…, n 5. ei berdistribusi normal untuk semua i = 1, 2,…, n 6. e1,e2,...,en saling bebas (independen)
7
Misalkan b1 adalah taksiran bagi 1 dan b0 adalah taksiran bagi 1. Maka taksiran bagi model regresi adalah
Yˆi b0 b1 X i Kriteria penaksiran kuadrat terkecil adalah meminimumkan n ei2 i 1
terhadap b0 dan b1, dengan ei Yi Yˆi Yi b0 b1 X i . 8
Diperoleh n
JK XY b1 JK XX
X i 1
i
X Yi Y
n
X i 1
i
X
2
b0 Y b1 X Sedangkan taksiran untuk variansi galat acak adalah n 2 ˆ 2
JK G n2
Y Yˆ i 1
i
i
n2 9
3
11/10/2010
Suhu (X)
1
Gula yg dihasilkan (Y)
1.1 1.2 1.3 1.4 1.5 1.6
1.7
1.8 1.9
2
8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5 Sumber: Walpole and Myers, 1989
ei
10
n = 11
x
1 n xi 1.5 n i 1
y
n
b1
x i 1
i
x yi y
n
x i 1
i
x
1 n yi 9.13 n i 1
1.8091
2
b0 Y b1 X 6.4136
Yˆ 6.4136 1.8091X
11
Model persamaan regresi
PREDIKSI NILAI RESPONS ˆi) Prediksi (y model
ei y i yˆ i
Suhu (xi)
Gula yg dihasilkan (yi)
1
8.1
8.22
-0.12
1.1
7.8
8.40
-0.60
1.2
8.5
8.58
-0.08
1.3
9.8
8.77
1.03
1.4
9.5
8.95
0.55
1.5
8.9
9.13
-0.23 -0.71
1.6
8.6
9.31
1.7
10.2
9.49
0.71
1.8
9.3
9.67
-0.37
1.9
9.2
9.85
-0.65
2
10.5
10.03
0.47
Taksiran variansi galat acak
ˆ 2
1 2 yi yˆ i 0.4 9
12
4
11/10/2010
Misalkan suhu proses (X) adalah 1.55 satuan suhu. Maka prediksi banyaknya gula yang dihasilkan pada suhu tersebut adalah
yˆ 6.4136 1.8091x = 6.4136 + 1.8091(1.55) =9.217705 13
ASUMSI KENORMALAN 1
• Asumsi ei berdistribusi normal untuk semua i = 1, 2,…, n
2
• Yi beristribusi normal untuk semua i = 1, 2,…, n
3
• b0 dan b1 berdistribusi normal 14
INFERENSI UNTUK PARAMETER 0 b0 0
T0 =
ˆ
n
x i 1
2 i
/ nJK XX
berdistribusi t dengan derajat kebebasan n-2. Selang kepercayaan (1-α) untuk 0 :
b0 t / 2ˆ
n
x i 1
2 i
/ nJK XX 0 b0 t / 2ˆ
n
x i 1
2 i
t/2 adalah nilai distribusi t dengan derajat kebebasan n-2
/ nJK XX 15
5
11/10/2010
INFERENSI UNTUK PARAMETER 1 T1 =
b1 1 ˆ/ JK XX
berdistribusi t dengan derajat kebebasan n-2. Selang kepercayaan (1-α) untuk 1 :
b1
t / 2ˆ JK XX
1 b1
t / 2ˆ JK XX
t/2 adalah nilai distribusi t dengan derajat kebebasan n-2
16
PENGUJIAN PARAMETER REGRESI
Rumusan Hipotesis H0 : β0 = 0
H0 : β1 = 0
H1 : β0 ≠ 0
H1 : β1 ≠ 0
b0
t0
t1
n
ˆ
xi2 i 1
nJK XX
ˆ
b1 JK XX
17
SELANG PREDIKSI Misalkan nilai respons Y untuk X = X0 adalah Y0, dan misalkan adalah prediksi model regresi bagi Y0. Maka T
ˆ -Y Y 0 0 ˆ 1+(1/n)+[(x 1 (1/ ) [( 0 x))2 / JK XX ]
berdistribusi t dengan derajat kebebasan n-2. Selang prediksi (1 – α) bagi y0 adalah 1 (x x) 2 1 (x x)2 yˆ 0 t / 2ˆ 1+ + 0 y0 yˆ 0 t / 2 ˆ 1+ + 0 n JK XX n JK XX
18
6
11/10/2010
CONTOH; SELANG KEPERCAYAAN 1- 1.8091
TINJAU CONTOH SEBELUMNYA
(2.26)(0.4) (2.26)(0.4) 1 1.8091 1.1 1.1 Selang kepercayaan 95% untuk β1 :
b1=1,8091
b0=6,4136
6.4136 (2.26)(0.4)
Selang kepercayaan 95% untuk β0 :
25.85 25.85 0 6.4136 (2.26)(0.4) (11)(1.1) (11)(1.1)
CONTOH; UJI HIPOTESIS
19
derajat kebebasan n – 2 = 9, nilai kritis t0.025 = 2.26
H0 : β0 = 0 H1 : β0 ≠ 0
t0 > t0.025 & t1 > t0.025 0 025 maka masingmasing H0 ditolak
Kesimpulan
H0 : β1 = 0 H1 : β1 ≠ 0
β0 dan β1 tidak dapat diabaikan 20
KECOCOKAN MODEL REGRESI Salah satu alat ukur untuk melihat apakah model regresi yang diperoleh sudah memadai adalah koefisien determinasi yaitu n
JK R = R = JK T 2
(yˆ
i
y) 2
(y
i
y) 2
i=1 n
, dengan 0 R 2 1
i=1
Besaran R2 menunjukkan proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang diperoleh 21
7
11/10/2010
UJI KEBAIKAN MODEL H0 : Model regresi yang diperoleh tidak memadai H1 : Model memadai Statistik uji
n
JK R f ˆ
(yˆ y)
2
i
i=1
ˆ
Tolak H0 pada tingkat keberartian α jika f > f,(1,n-2), dimana f,(1,n-2) adalah nilai distribusi F dengan derajat kebebasan 1 dan n – 2.
22
CONTOH Untuk contoh sebelumnya diperoleh R2 = 0,499. Artinya proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang di diperoleh l h adalah d l h 49.9% 49 9% Uji kebaikan model n
(yˆi y)2 JK R i=1 8.99 f ˆ ˆ Untuk α = 5%, titik kritis f0.05,(1,9) = 5,12
23
f > f0.05,(1,9), model memadai.
KORELASI
Mengukur hubungan linear dua peubah acak Misalkan X dan Y adalah dua peubah acak, maka korelasi antara X dan Y dinyatakan dengan
XY
E (X X )(Y Y ) X Y
24
8
11/10/2010
Jika nilai korelasi mendekati 1 maka hubungan kedua peubah “sangat erat” dan searah sedangkan jika nilai korelasi mendekati –1 maka hubungan kedua peubah “sangat sangat erat erat” dan berlawanan arah. arah
25
Gambar 1 Korelasi positif
Gambar 2 Korelasi negatif
Gambar 3 Korelasi nol
Gambar 4 Korelasi nol
26
KORELASI SAMPEL Korelasi dapat ditaksir dengan koefisien korelasi sampel, yaitu
rXY
JK XY JK XX JK YY n
(X
i
X)(Yi Y)
i=1
n n 2 2 (X i X) (Yi Y) i=1 i=1
27
9
11/10/2010
CONTOH Data dua peubah acak berat badan bayi (kg) dan ukuran dada bayi (cm) berat (kg) ukuran dada (cm) 2.75
29.5
2.15
26.3
4.41
32.2
5.52
36.5
3.21
27.2
4.32
27.7
2.31
28.3
4.3
30.3
3.71
28.7
28
ukuran (cm)
Rata-rata berat = 3.63 , Rata-rata ukuran dada = 29.63
38 36 34 32 30 28 26 24 22 20 1
2
3
4
5
6
berat (kg)
9
r
(X
i
X)(Yi Y)
i=1
9 2 2 (X i X) (Yi Y) i=1 i=1 9
0.78 29
Referensi Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika. Walpole, Ronald E. Dan Myers, Raymond H., Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan, g Penerbit ITB,, 1995. Edisi 4,, Bandung:
30
10