Analisis Regresi 1 Pokok Bahasan :
Diagnosa Model Melalui Pemeriksaan Sisaan dan Identifikasi Pengamatan Berpengaruh Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Sisaan Sisaan adalah menyimpangnya nilai amatan yi terhadap dugaan nilai harapannya
) ) ) E [Y | x i ] → E [Y | x i ] = yi = b 0 + b1x i
Sisaan untuk suatu amatan ke-i: Sisaan baku ri
( yi − yˆ i ) ei = =
Kurang tepat sebab ragam (ei) = s2 (1-hii) Itasia & Y Angraini Dep. Statistika FMIPA-IPB
s( yi − yˆ i )
s
) ei = yi − yi
Bisa digunakan untuk memeriksa kebenaran εi menyebar N(0,1) σ
1 + ( xi − x )2 ei , hii = nn ri = 2 s (1 − hii ) ( ) x − x ∑ k k =1
Contoh: menghitung sisaan Berikut adalah 1 set (25 pengamatan) data berpasangan x1i dan yi yang didapat dari sebuah percobaan. Dari data ini ingin diketahui model matematika hubungan antara x1 dan Y. i
1
2
3
4
5
6
7
8
9
10
11
12
13
10.98
11.13
12.51
8.4
9.27
8.73
6.36
8.5
7.82
9.14
8.24
12.19
11.88
X1
20
20
23
20
21
22
11
23
21
20
20
21
21
i
14
15
16
17
18
19
20
21
22
23
24
25
9.57
10.94
9.58
10
8.11
6.83
8.88
7.7
8.47
8.86
10.4
11.08
19
23
20
22
22
11
23
20
21
20
20
22
Y
Y X1
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Contoh: menghitung sisaan (lanjutan) Dari tebaran x1 terhadap Y digunakan persamaan garis regresi linier sederhana ordo satu : Y = β +β x +ε
Scatterplot of Y vs X1 13 12 11
0
1
10 Y
Dengan Minitab didapatkan dugaan persamaannya : Yˆ = 3.56 + 0.290 X1
9 8 7 6 10
12
14
16
18 X1
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
20
22
24
Untuk setiap amatan dihitung nilai dugaannya, kemudian hitung sisaannya
Contoh: menghitung sisaan (lanjutan) Y duga = 3.56 + 0.290 X1
sisaan ke i = amatan ke-i – dugaan pd titik x ke-i
i
1
2
3
4
5
6
7
8
9
10
11
12
13
y
10.98
11.13
12.51
8.40
9.27
8.73
6.36
8.50
7.82
9.14
8.24
12.19
11.88
y_duga
9.35
9.35
10.22
9.35
9.64
9.93
6.75
10.22
9.64
9.35
9.35
9.64
9.64
sisaan
1.63
1.78
2.29
-0.95
-0.37
-1.20
-0.39
-1.72
-1.82
-0.21
-1.11
2.55
2.24
i
14
15
16
17
18
19
20
21
22
23
24
25
y
9.57
10.94
9.58
10.09
8.11
6.83
8.88
7.68
8.47
8.86
10.36
11.08
y_duga
9.06
10.22
9.35
9.93
9.93
6.75
10.22
9.35
9.64
9.35
9.35
9.93
sisaan
0.51
0.72
0.23
0.16
-1.82
0.08
-1.34
-1.67
-1.17
-0.49
1.01
1.15
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Informasi-informasi yang Didapat Melalui Sisaan
Bisa melihat pola sebaran peubah acak Y Melalui sisaan, kita dapat mengetahui apakah asumsi-asumsi yang disyaratkan pada pendugaan dengan MKT dipenuhi atau tidak Melalui sisaan, kita juga dapat menguji parameter regresi, sehingga kita perlu mengetahui sebaran sisaan Melalui sisaan, kita juga bisa melihat apakah model yang kita pilih pas atau tidak Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan merupakan pencilan atau bukan Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan merupakan pengamatan berpengaruh atau bukan
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Pemeriksaan Pola Sebaran Peubah Respon Y MODEL REGRESI Acaknya Y disebabkan karena acaknya eror
Y = β 0 + β1x + ε
E [ Y | xi ] Acak
ε
Bentuk sebaran Y = bentuk sebaran eror Memeriksa bentuk sebaran Y = memeriksa bentuk sebaran eror Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Fix
Acak
Plot Sisaan untuk: Pemeriksaan Bentuk Sebaran Tebaran sisaan dan histogram di samping untuk melihat : BENTUK SEBARAN SISAAN, simetri atau tidak
H is to g r a m S is a a n Norm al 4
Frekuensi
3
2
1
0
-3
-2
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
-1
0 S is a a n
1
2
3
HASIL DIAGNOSA : Sebaran sisaan agak menjulur ke kanan
Plot Sisaan untuk: Pemeriksaan Sebaran Normal Plot sisaan terhadap peluang Normal untuk :
Probability Plot of Sisaan Normal - 95% CI 99
Mencocokkan apakah sebaran sisaan merupakan sebaran Normal atau tidak. Ya jika pola tebaran membentuk garis lurus
95
Peluang normal
90 80 70 60 50 40 30
Hasil Diagnosa : bisa dianggap lurus Æ menyebar Normal
20 10 5
1
-4
-3
-2
-1
0 1 Sisaan
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
2
3
4
5
Plot Sisaan untuk: Melihat Ketidakpasan Model Plot SISAAN vs Y duga Plot sisaan vs y_duga
40 30 20
sisaan
10 0 -10 -20
-30 -40 0
50
100 y_duga
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
150
200
Plot sisaan terhadap y_duga masih berpola (kuadratik) Sisaan masih mengandung komponen kuadratik Model belum pas Æ model harus ditambah dg komponen kuadratik
Plot Sisaan untuk : Pemeriksaan Asumsi MKT Plot SISAAN vs Y duga Pada tebaran sisaan terhadap nilai dugaan Y dapat dilihat : - Sisaan di sekitar nilai nol / tidak Æ nilai harapan - Lebar pita sisaan sama atau tidak untuk semua nilai dugaan Æ kehomogenan ragam - Tebaran berpola atau tidak Æ ketidakpasan model Æ sisaan bebas atau tidak
Plot Sisaan vs y_duga 3
sisaan
2
1
0
-1
-2 7.0
7.5
8.0
8.5 y_duga
9.0
9.5
Kondisi Gauss-Markov
10.0
10.5
1. E[ε i ] = 0
⇒ terpenuhi
2. E[ε i ] = σ 2 ⇒ tidak ter penuhi 2
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
3. E[ε iε j ] = 0, i ≠ j ⇒ terpenuhi
Pola Tebaran Sisaan ˆ terhadap Y i Pola tebaran sisaan memenuhi asumsi MKT: berpusat di NOL, lebar pita sama, tidak berpola Pola tebaran sisaan yang tidak memenuhi asumsi MKT: Ragam tidak homogen (perlu analisis kuadrat terkecil terboboti; atau transformasi thdp Y) Penyimpangan terhadap persamaan regresi bersifat sistematis; atau karena tdk disertakannya β 0 kedalam model Model tidak pas (perlu suku-suku lain dalam model atau transformasi thdp Y) Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Transformasi untuk : Menghomogenkan Ragam Transformasi terhadap peubah respon Y Anggap : σ 2 = aμ b 1 Y 1 b = 3 ⇒ Y* = Y b = 2 ⇒ Y* = ln Y
jika b = 4 ⇒ Y* =
b = 1 ⇒ Y* = Y
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Setelah respon Y ditransformasi, lakukan analisis regresi seperti biasa, sisaan harus diperiksa lagi, jika masih belum memenuhi asumsi, model diubah, kemungkinan ada suku nonlinier yg belum masuk model, atau lakukan pendugaan dg MKT terboboti.
Contoh Transformasi untuk Menghomogenkan Ragam Plot Sisaan vs Y duga “data asli”
Plot Sisaan vs
Yˆ “data transformasi Y*=
Residuals Versus theFittedValues
Residuals Versus the FittedValues
(response is Y)
(response is akar Y) 1,0
10
0,5
Residual
Residual
5
0
0,0
-0,5
-5 -1,0 -10 -1,5 5
10
15 FittedValue
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
20
25
2,5
3,0
3,5 4,0 Fitted Value
4,5
5,0
Y“
Plot Sisaan untuk: Pemeriksaan Kebebasan Sisaan Plot sisaan terhadap urutan untuk :
Scatterplot of RESI1 vs urutan 2
Memeriksa apakah sisaan bebas satu dengan lainnya atau tidak. Bebas jika tdk membentuk pola.
RESI1
1
0
-1
-2 0
2
4
6 urutan
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
8
10
12
Hasil Diagnosa : Tebaran tidak membentuk pola Æ Sisaan saling bebas
Pola Tebaran Sisaan terhadap Urutan Waktu Pengaruh waktu jangka panjang tidak mempengaruhi data.
Pola tebaran sisaan yang menginformasikan bahwa pengaruh waktu belum diperhitungkan Ragam tidak homogen (perlu analisis kuadrat terkecil terboboti) Suatu suku linier dalam waktu harus ditambahkan ke dalam model Suku linier dan kuadratik dalam waktu perlu ditambahkan ke dalam model
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Plot Sisaan untuk: Pemeriksaan Pengaruh Waktu Plot sisaan terhadap urutan waktu yg jaraknya sama.
Scatterplot of RESI1 vs urutan 2
Perhatikan : Æ lebar pita sama/tidak Æ berpola/tidak
RESI1
1
0
Hasil Diagnosa :
-1
-2 0
2
4
6 urutan
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
8
10
12
• Lebar pita sama Æ homogen • Tebaran tidak membentuk pola Æ tidak perlu ditambahkan pengaruh waktu ke dalam model
Sisaan Terstandardkan (Sisaan Terbakukan) SISAAN TERBAKUKAN : ri
( yi − yˆ i ) ei = = s( yi − yˆ i )
s
Bisa digunakan untuk memeriksa kebenaran ε i menyebar N(0,1) σ
Sisaan akan memiliki ragam yg relatif besar jika xi di sekitar x
Pd sebaran Normal Baku peluang nilai ri terletak antara -1,96 s.d 1,96 adalah 95%. Æ | ri|>2 patut dicurigai
ragam(ei)= s2, kurang tepat Æ ragam(ei) = s2 (1- hii)
1 + ( x i − x )2 ei , hii = n ri = 2 ( ) − x x s (1 − hii ) ∑ k ei = sisaan amatan ke-i n = banyaknya pengamatan s2 = dugaan bagi ragam Yi Æ KTsisaan hii = unsur diagonal ke-i matriks H = X(X’X)-1X’
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Sisaan Terstandarkan (Sisaan Baku) (lanjutan) Plot Sisaan ei vs Dugaan Y
Plot Sisaan Baku ri vs Dugaan Y
Residuals Versus the Fitted Values
Scatterplot of SRES1 vs FITS1
(response is ln(y)) 2
1,0
1 0,5
SRES1
Residual
0 0,0
-1 -2
-0,5
-3 -1,0 -4 1,0
1,2
1,4
1,6
1,8 2,0 Fitted Value
2,2
2,4
2,6
2,8
1,0
1,2
1,4
1,6
1,8 2,0 FITS1
2,2
2,4
Pola tebaran plot sisaan ei dan ri tidak berbeda.
2,6
Æ pemeriksaan sisaan thdp pola tebaran, keduanya dapat digunakan Itasia & Y Angraini Dep. Statistika FMIPA-IPB
2,8
Nilai PRESS PRESS = Prediction Sum of Squares, adalah prosedur yang merupakan kombinasi dari: semua kemungkinan regresi, analisis sisaan, dan teknik validasi. Digunakan untuk mengukur validitas model. PRESS = ∑ ( yi − yˆ i , −i )
2
= ∑ (ei,-i )
2
yi
⎛ ei ⎞ R2PRED=1− PRESS = ∑⎜ 2 ⎜ 1 − h ⎟⎟ ( yi − y) i =1 ⎝ ii ⎠ n
: nilai respon pada x=xi (data lengkap) yˆ i , − i : nilai ramalan y pd x=xi yg diramal melalui dugaan persamaan regresi dari data tanpa amatan ke-i Model valid jika memiliki PRESS yg kecil Itasia & Y Angraini Dep. Statistika FMIPA-IPB
2
∑
R2pred adalah statistik lainnya yg berhub dg PRESS. Model valid jika R2pred besar.
Nilai PRESS PROSEDUR PRESS
(lanjutan)
Mis. k adalah banyaknya peubah dalam suatu persamaan regresi, n adalah banyaknya amatan Langkah-langkahnya: 1. Sisihkan amatan ke-1, amatan ke-1 tidak digunakan, data tinggal n-1. 2. Dugalah semua ”kemungkinan model regresi” thdp n-1 data tersebut. (jika k=1Æ banyaknya ”kemungkinan model” hanya 1) 3. Ramal y1 dengan model yang didapat pd no.2. (lakukan untuk semua kemungkinan model Æ hanya 1 jika k=1) ˆ 4. Hitung perbedaan y1 yg disisihkan tadi dengan hasil no.3. Æ y1 − y1k 5. Ulangi langkah 1-4 dengan menyisihkan amatan ke-2, ke-3,...., ke-n. Didapat y 2 − yˆ 2 k , y3 − yˆ 3k , ..., y n − yˆ nk n
2
6. Untuk setiap model regresi yang mungkin hitung : PRESS= ∑( yi − yˆik ) i =1
7. Pilih model yang relatif memiliki nilai PRESS terkecil, dan melibatkan peubah penjelas sedikit. Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Nilai PRESS (lanjutan) Contoh Proses PRESS, untuk n=11 dan k=1 Dugaan Garis Regresi dg Data tanpa amatan ke-i
ramalan Yi tnp amatan ke-i
e
ei,-i
i,-i
Y
X
7,46
10
Y tnp 1 = 3,01 + 0,505 X tnp 1
8,06
-0,6
0,36
6,77
8
Y tnp 2 = 3,05 + 0,497 X tnp 2
7,026
-0,256
0,06553
12,74
13
Y tnp 3 = 4,01 + 0,345 X tnp 3
8,495
4,245
18,02003
7,11
9
Y tnp 4 = 3,04 + 0,500 X tnp 4
7,54
-0,43
0,18490
7,81
11
Y tnp 5 = 2,95 + 0,514 X tnp 5
8,604
-0,794
0,63043
8,84
14
Y tnp 6 = 2,46 + 0,577 X tnp 6
10,538
-1,698
2,88320
6,08
6
Y tnp 7 = 2,97 + 0,502 X tnp 7
5,982
0,098
0,00960
5,39
4
Y tnp 8 = 2,72 + 0,526 X tnp 8
4,824
0,566
0,32035
8,15
12
Y tnp 9 = 2,84 + 0,528 X tnp 9
9,176
-1,026
1,05267
6,42
7
Y tnp 10 = 3,03 + 0,498 X tnp10
6,516
-0,096
0,00921
5,73
5
Y tnp 11 = 2,88 + 0,511 X tnp11
5,435
0,295
0,08703
kuadrat
Total = PRESS = Itasia & Y Angraini Dep. Statistika FMIPA-IPB
23,6229
Nilai PRESS (lanjutan) Output Minitab untuk data contoh tsb • Hasil PRESS melalui proses The regression equation is Y = 3,00 + 0,500 X Predictor Constant X
Coef SE Coef 3,002 1,124 0,4997 0,1179
T 2,67 4,24
P 0,026 0,002
S = 1,23631 R-Sq = 66,6% R-Sq(adj) = 62,9% PRESS = 23,6210 R-Sq(pred) = 42,70% Analysis of Variance Source DF SS Regression 1 27,470 Residual Error 9 13,756 Total 10 41,226
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
MS F P 27,470 17,97 0,002 1,528
• • • •
= hasil Minitab Untuk k=1 hanya ada 1 model Amatan ke-3 memberikan simpangan ramalan terbesar Amatan ke-3 dapat dipandang sebagai amatan berpengaruh Dugaan parameter regresi tanpa amatan ke-3 sangat berbeda dg lainnyaÆ dugaan yg ini relatif yg benar/baik
Keluarkan amatan ke-3 dari analisis. Cek nilai PRESS-nya. Cek nilai R2nya
Nilai PRESS Output Minitab data lengkap The regression equation is Y = 3,00 + 0,500 X Predictor Constant X
(lanjutan)
Output Minitab data tanpa amatan ke-3 The regression equation is Y tnp 3 = 4,01 + 0,345 X tnp 3
Coef SE Coef 3,002 1,124 0,4997 0,1179
T P 2,67 0,026 4,24 0,002
Predictor Coef SE Coef T Constant 4,00619 0,00221 1811,78 X tnp 3 0,345334 0,000237 1454,74
P 0,000 0,000
S = 1,23631 R-Sq = 66,6%
S = 0,00308655 R-Sq = 100,0
PRESS = 23,6210 R-Sq(pred) = 42,70%
PRESS = 0,000174853 R-Sq(pred) = 100,00%
Analysis of Variance Source DF SS Regression 1 27,470 Residual Error 9 13,756 Total 10 41,226
Analysis of Variance Source DF SS MS F P Regression 1 20,161 20,161 2116264,34 0,000 Residual Error 15 0,000 0,000 Total 16 20,161
MS F P 27,470 17,97 0,002 1,528
Menyisihkan amatan ke-3 mempengaruhi dugaan parameter, menurunkan nilai PRESS Dari sisi model, “persamaan tanpa amatan ke-3” yg terbaik. R-Sq(pred)=100,00% Æ model sangat valid Æ PELUANG salah memprediksi = 0 Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Nilai PRESS
(lanjutan)
Dugaan garis regresi dg data lengkap Dugaan garis regresi tanpa amatan ke-3 PRESS = 23,6210
R-Sq(pred) = 42,70%
PRESS = 0,000174853
R-Sq(pred) = 100,0%
Fitted Line Plot
Fitted Line Plot
Y = 3,002 +0,4997 X
Y tnp 3 = 4,006 + 0,3453 X tnp 3
13
9
12 11
8
Y tnp 3
10 Y
9 8
7
7
6
6 5 4
5 5,0
7,5
10,0 X
12,5
15,0
5,0
7,5
10,0 X tnp 3
12,5
Semakin kecil nilai PRESS-nya Æ model semakin valid Æ semakin baik untuk memprediksi. Setiap 1 model regresi thdp 1 set data memiliki 1 nilai PRESS Itasia & Y Angraini Dep. Statistika FMIPA-IPB
15,0
Pencilan “Pencilan adalah pengamatan yang nilai mutlak sisaannya jauh lebih besar daripada sisaan-sisaan lainnya”
Bisa jadi terletak pada tiga atau empat simpangan baku atau lebih jauh lagi dari rata-rata sisaannya.
Keberadaan pencilan harus diperiksa dengan seksama, apakah pencilan itu merupakan kesalahan dalam pencatatan amatan atau pencilan tersebut muncul dari kombinasi keadaan yang tidak biasa yang mungkin saja sangat penting dan perlu diselidiki lebih jauh.
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Pencilan (lanjutan) Plot antara Sisaan ei vs dugaan Yi
Plot antara Sisaan ri vs dugaan Yi
Scatterplot of Sisaan baku-2 vs dugaan-Y2
Scatterplot of sisaan2 vs dugaan-Y2
3
3
2 sisaan2
Sisaan baku-2
2
1
1
0
0
-1
-1 5
6
7
8 dugaan-Y2
9
10
5
6
7
8 dugaan-Y2
• Dugaan persamaan regresi Y = 3.00 + 0.500 X dgn R-Sq = 66.6% • Pola tebaran sisaan thdp ei dan ri sama • Ada sisaan yang nilainya sangat besar Æ potensi sebagai pencilan Itasia & Y Angraini Dep. Statistika FMIPA-IPB
9
10
Pencilan (lanjutan)
MENDETEKSI PENCILAN
• Hitung nilai dengan
ei ri = s (1 − hii )
hii =
1 n
+
( x i − x )2 n
∑ (xk − x ) i =1
• Jika nilai |ri|>2, amatan tsb dapat dikatakan sebagai pencilan Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Yi
2
Xi
ri
7.46
10 -0.46018
6.77
8 -0.19633
12.74
13
2.99999
7.11
9 -0.33085
7.81
11 -0.59695
8.84
14 -1.13497
6.08
6
0.07042
5.39
4
0.3807
8.15
12 -0.75518
6.42
7 -0.06974
5.73
5
0.21188
Pencilan (lanjutan) DATA LENGKAP
DATA TANPA PENCILAN Scatterplot of Y tnp pclan vs X tnp pclan 13
12
12
11
11
10
10
Y tnp pclan
Y-3
Scatterplot of Y-3 vs X-3 13
9 8
9 8
7
7
6
6 5
5 5,0
7,5
10,0
12,5
15,0
5,0
7,5
X-3
Coef 3.002 0.4997
S = 1.23631
SE Coef 1.124 0.1179
12,5
Y = 4.01 + 0.345 X
Y = 3.00 + 0.500 X Predictor Constant X
10,0 X tnp pclan
T P 2.67 0.026 4.24 0.002
R-Sq = 66.6%
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Predictor Constant X
Coef 4.00565 0.345390
S = 0.00308168
SE Coef 0.00292 0.000321
P 0.000 0.000
R-Sq = 100.0%
15,0
Pencilan (lanjutan) Plot sisaan baku (ri) vs dugaan Y Data Lengkap
Data Tanpa Pencilan
Scatterplot of sisaan2 vs dugaan-Y2
Scatterplot of s baku tnp pcl vs dugaan tnppcl 2.0
3 1.5 1.0 s baku tnp pcl
sisaan2
2
1
0.5 0.0 -0.5
0
-1.0 -1 -1.5 5
6
7
8
9
dugaan-Y2
Tebaran berpola, karena (1) ada pencilan, atau (2) model tidak pas
10
5
6
7 dugaan tnppcl
8
Tebaran tidak berpola, menyebar di sekitar nilai nol, lebar pita relatif sama
Mengeluarkan data pencilan dari analisis: • mampu memperbaiki pola tebaran sisaan yang tadinya berpola (garis lurus) • harus dilakukan dengan kehati-hatian yang tinggi. Itasia & Y Angraini Dep. Statistika FMIPA-IPB
9
Amatan Berpengaruh AMATAN BERPENGARUH : berkaitan dengan besarnya perubahan yang terjadi pada dugaan parameter regresi jika pengamatan tersebut disisihkan X1
1
1
1
1,2 1,2 1,2 1,3 1,3 1,3 1,4 1,4 1,4 1,5 1,5 1,5 1,6 1,6 1,6
4,0
Y1 2,11 1,39 0,78 2,02 2,46 3,67 2,56 1,74 1,88 5,15 2,41 2,00 3,56 3,09 0,78 4,29 3,33 3,10 15,00
Unusual Observations
Scatterplot of Y1 vs X1 16 14
Obs X1 Y1 Fit 10 1,40 5,147 2,895 15 1,50 0,776 3,345 19 4,00 15,000 14,576
12
Y1
10 8 6
SE Fit 0,244 0,243 1,009
Residual 2,252 -2,569 0,424
St Resid 2,19 R -2,50 R 1,34 X
4 2 0 1,0
1,5
2,0
2,5 X1
3,0
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
3,5
4,0
R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large influence.
Amatan Berpengaruh (lanjutan) OUTPUT MINITAB The regression equation is
Y1 = - 3,39 + 4,49 X1 S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1% Analysis of Variance Source DF SS Regression 1 150,10 Residual Error 17 19,01 Total 18 169,11 Unusual Observations Obs X1 Y1 Fit 10 1,40 5,147 2,895 15 1,50 0,776 3,345 19 4,00 15,000 14,576
MS 150,10 1,12
SE Fit 0,244 0,243 1,009
F P 134,22 0,000
Residual 2,252 -2,569 0,424
St Resid 2,19 R -2,50 R 1,34 X
R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large influence. Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Hasil analisis regresi dari data tersebut menunjukkan bahwa ada 3 amatan yg aneh, yaitu amatan ke 10,15, dan 19. Amatan 10 dan 15 berpotensi sebagai pencilan. Amatan 19 berpotensi sebagai amatan berpengaruh Bandingkan dg data tanpa amatan 19. Apakah perubahan dugaan parameter regresi cukup nyata?
Amatan Berpengaruh (lanjutan)
Penyisihan “pengamatan berpengaruh” mengubah secara berarti dugaan persamaan regresi Analisis Regresi thdp Data Lengkap
An Regresi thdp Data Tanpa Amatan 19
The regression equation is
The regression equation is
Y1 = - 3,39 + 4,49 X1
Y1 = - 1,26 + 2,88 X1
S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1%
S = 1,03065 R-Sq = 25,4% R-Sq(adj) = 20,8%
Analysis of Variance Source DF SS Regression 1 150,10 Residual Error 17 19,01 Total 18 169,11
Analysis of Variance Source DF SS Regression 1 5,797 Residual Error 16 16,996 Total 17 22,793
MS 150,10 1,12
F P 134,22 0,000
Unusual Observations Obs X1 Y1 Fit SE Fit Resid St Resid 10 1,40 5,147 2,895 0,244 2,252 2,19 R 15 1,50 0,776 3,345 0,243 -2,569 -2,50 R 19 4,00 15,000 14,576 1,009 0,424 1,34 X Itasia & Y Angraini Dep. Statistika FMIPA-IPB
MS F P 5,797 5,46 0,033 1,062
Unusual Observations Obs X1 Y1 Fit SE Fit Resid St Resid 10 1,40 5,147 2,764 0,256 2,383 2,39 R 15 1,50 0,776 3,052 0,318 -2,276 -2,32 R
Amatan Berpengaruh (lanjutan) Dugaan Garis Regresi Data Lengkap
Dugaan Grs Regresi Data Tnp Amatan 19
Fitted Line Plot
Fitted Line Plot
Y1 = - 3,394 + 4,493 X1
Y1 tnp amatan 19 = - 1,265 + 2,878 X1 tnp amatan 19 16
14
14
12
12
Y1 tnp amatan 19
16
Y1
10 8 6 4
10 8 6 4
2
2
0 1,0
1,5
2,0
2,5 X1
3,0
3,5
4,0
1,0
1,5
2,0 2,5 X1 tnp amatan 19
3,0
3,5
Penyisihan AMATAN BERPENGARUH menyebabkan perubahan dugaan kemiringan garis. Æ BERBAHAYA, apabila pemanfaatan hasil analisis regresi bertumpu pada pemaknaan parameter Itasia & Y Angraini Dep. Statistika FMIPA-IPB
4,0
Amatan Berpengaruh (lanjutan)
Statistik Uji untuk Mendeteksi Amatan Berpengaruh Pengaruh titik data ke-i diukur dengan jarak :
⎧ ⎫ ei Di = ⎨ 1 ⎬ 2 ( ) 1 − s h ii ⎩ ⎭
2
2
⎧ hii ⎫ 1 ⎨ ⎬ ⎩1 − hii ⎭ p
Keterangan: s2 = dugaan bagi ragam Yi = KTsisaan hii = unsur diagonal ke-i matriks H = X(X’X)-1X’ Nilai Di dibandingkan dengan F (p,n-p; 1-α). Dengan n = banyaknya pengamatan dan p = banyaknya parameter Di > F (p,n-p;1-α). menandakan bahwa amatan ke-i berpengaruh. Itasia & Y Angraini Dep. Statistika FMIPA-IPB
X (i)
Y (i)
e (i)
r (i)
D (i)
1
2,11
1,01
1,00
0,30
1
1,39
0,30
0,29
0,09
1
0,78
-0,32
-0,32
-0,09
1,2
2,02
0,02
0,02
0,01
1,2
2,46
0,46
0,45
0,11
1,2
3,67
1,68
1,64
0,45
1,3
2,56
0,11
0,11
0,03
1,3
1,74
-0,71
-0,69
-0,17
1,3
1,88
-0,56
-0,55
-0,13
1,4
5,15
2,25
2,19
0,59
1,4
2,41
-0,49
-0,47
-0,11
1,4
2,00
-0,90
-0,87
-0,21
1,5
3,56
0,21
0,21
0,05
1,5
3,09
-0,26
-0,25
-0,06
1,5
0,78
-2,57
-2,50
-0,72
1,6
4,29
0,50
0,49
0,11
1,6
3,33
-0,47
-0,45
-0,11
1,6
3,10
-0,70
-0,68
-0,16
4
15,00
0,42
1,34
4,40
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Amatan Berpengaruh CONTOH PENGGUNAAN Di
(lanjutan)
Dugaan persamaan regresi DATA LENGKAP : Y1 = - 3,39 + 4,49 X1 Banyaknya parameter = 2 Æ p = 2 Banyaknya pengamatan = 19 Æ n = 19 Pengamatan ke -19 memiliki nilai D19 = 4,40 Dengan α = 5% Nilai tabel F(p,n-p; 1-α) = F (2,17; 0,95) = 3,59 D19 > F (2,17; 0,95) Dengan α = 5%, amatan ke 19 (terakhir) merupakan amatan berpengaruh.
Amatan Berpengaruh (lanjutan)
Itasia & Y Angraini Dep. Statistika FMIPA-IPB