HANDOUT
ANALISIS REGRESI
Kismiantini
NIP. 19790816 200112 2 001 JURUSAN PENDIDIKAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI YOGYAKARTA 2010
1
2
Analisis Regresi dan Analisis Korelasi Analisis Regresi A Analisis li i Korelasi K l i Model Regresi Linear Sederhana
• Apa itu analisis regresi? • Apa bedanya dengan korelasi? Analisis Regresi Î Analisis statistika yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu p peubah dapat p diramalkan dari peubah p lainnya. y Analisis Korelasi Î Analisis statistika yyang g membahas tentang g derajat (kekuatan) hubungan antara peubah-peubah.
3
Korelasi
4
Yi = β 0 + β1 X i + ε i
Korelasi
i = 1, 2, …, n
Yi adalah nilai peubah tak bebas dalam pengamatan ke-i β0 dan d β1 adalah d l h parameter t Xi adalah konstanta yang diketahui, yaitu nilai peubah bebas dari pengamatan ke-i εi adalah galat yang bersifat acak dengan rataan E[εi]=0 dan ragam Var [εi]=σ2; εi dan εj tidak berkorelasi sehingga peragam/kovariansi ,j ; i ≠ j σ {{εi, εj} =0 untuk semua i,j
ε i ~ N (0, σ 2 ) iid
Sehingga :
E[Yi ] = β 0 + β1 X i
5
Model regresi linear sederhana • Model regresi diatas dikatakan sederhana, linear dalam parameter, dan linear dalam peubah bebas. • Dikatakan Dik t k “sederhana” “ d h ” karena k h hanya ada d satu t peubah b h bebas. • Dikatakan “linear linear dalam parameter parameter” karena tidak ada parameter yang muncul sebagai suatu eksponen atau dikalikan atau dibagi oleh parameter lain. • Dikatakan Dik t k “linear “li dalam d l peubah b h bebas” b b ” karena k peubah dalam model tersebut berpangkat satu. • Model yang linear dalam parameter dan linear dalam peubah bebas juga dinamakan model ordo-pertama.
6
Plot Data! NEVER skip this step! The data may not even be linear and a different model may be more appropriate.
7
8
9
10
ei (sisaan ( i kke-i) i) adalah d l hb beda d antara t nilai il i amatan t Yi dengan d nilai il i d dugaannya Yˆi
Persamaan regresi linear dugaan :
Yˆi = 13,82 + 48,60 X i
Yˆ = 13,82 + 48,60 X
11
12
• Pendugaan g terhadap p koefisien regresi: g Bagaimana mendapatkan b0 dan b1? • Metode kuadrat terkecil, terkecil yaitu dengan meminimumkan jumlah kuadrat galat :
Æ b0 penduga bagi β0 dan b1 penduga bagi β1 X Y ∑ X Y − ∑ n∑ = ( X) ∑X − ∑ i
i
i i
n
∑ε i =1
n
2 i
n
= ∑ (Yi − E (Yi )) = ∑ (Yi − (β 0 + β1 X i )) = L i =1
2
i =1
2
b1
b0 = n ∂L = −2∑ (Yi − (β 0 + β1 X i )) = 0 ∂β 0 i =1 n ∂L = −2∑ (Yi − (β 0 + β1 X i ))X i = 0 ∂β1 i =1
2
2 i
i
Metode Kuadrat Terkecil
n
1 (∑ Yi − b1 ∑ X i ) = Y − b1 X n
Bagaimana Pengujian terhadap model regresi ?? • parsial (per koefisien) Æ uji-t • bersama Æ uji-F (Anava) g menilai kesesuaian model ?? Bagaimana R2 (Koef. Determinasi: % keragaman Y yang mampu dijelaskan oleh X)
13
M k dugaan Makna d g k fi i regresi koefisien g i Misalkan ingin mengetahui hubungan jarak tempuh kendaraan mobil dalam k (X) dengan km d ti k t emisinya tingkat i i d l dalam ppm (Y). (Y)
14
Soall 1 i
1
2
3
4
5
6
7
8
9
10
Xi
5,5
4,8
4,7
3,9
4,5
6,2
6,0
5,2
4,7
4,3
• Plot data ternyata menunjukkan ada hubungan linear antara X dan Y • Dicobakan model linear Yi = β0 + β1Xi + εi, diperoleh persamaan regresi
Yi
3,1
2,3
3,0
1,9
2,5
3,7
3,4
2,6
2,8
1,6
i
11
12
13
14
15
16
17
18
19
20
• Apa makna b0 dan b1 pada konteks ini ? Makna dari b1 yaitu rata-rata emisi meningkat 5,47 ppm untuk setiap kenaikan jarak tempuh kendaraan mobil 1 km (atau kenaikan jarak tempuh kendaraan mobil 1 km akan meningkatkan rata-rata emisi yang dihasilkan mobil sebesar 5,47 ppm).
Xi
4,9
5,4
5,0
6,3
4,6
4,3
5,0
5,9
4,1
4,7
Yi
2,0
2,9
2,3
3,2
1,8
1,4
2,0
3,8
2,2
1,5
Yˆi = 364 + 5,47 X i
Makna dari b0 yaitu untuk mobil dengan jarak tempuh kendaraan mobil 0 km (mobil baru) tingkat emisi yang dihasilkan rata-rata sebesar 364 ppm.
∑X
i
= 100,0; ∑ Yi = 50,0; ∑ X = 509,12; ∑ Yi = 134,84; ∑ X iYi = 257,66 2 i
2
1. Apakah nilai mutu rata-rata (NMR) pada akhir tahun pertama (Y) dapat diramalkan dari nilai ujian masuk (X)? Bila jawaban ya, maka 2 Buatlah 2. l h diagram d pencar X d dan Y. 3. Tentukan persamaan regresi dugaannya beserta maknanya!
15
16
Soal 3
Soal 2 • Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika (dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama seminggu) Nilai ulangan 95 100 100 80 70 55 50 75 55 60 65 95 matematika Lama waktu 18 18 19 17 14 5 6 10 13 4 12 10 belajar matematika a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y! b) Tentukan persamaan regresi dugaan dan berikan makna dugaan koefisien regresinya!
• Suatu penelitian telah dilakukan untuk mengetahui hubungan pengeluaran g untuk iklan (X dalam jjutaan rupiah) p ) dengan g antara p penerimaan melalui penjualan (Y dalam jutaan rupiah) pada perusahaan tertentu. Berikut ringkasan datanya :
n = 10, ∑ X i = 120, ∑ Yi = 500, ∑ X iYi = 6106, ∑ X i2 = 1470, ∑ Yi 2 = 25440 a) Tentukan persamaan regresi dugaan! Berikan maknanya. b) Bila pengeluaran untuk iklan sebesar 16 juta rupiah, rupiah berapakah penerimaan dari hasil penjualan?
17
Soal 4
Soal 5
Seorang guru matematika mencatat lama waktu (Y, dalam menit), i ) yang diambil di bil dari d i perjalanan j l k sekolah ke k l h ketika k ik meninggalkan rumah setelah jam 7 pagi (X, dalam menit) pada tujuh pagi hari yang tercatat. tercatat X Y
18
0 16
10 27
20 28
30 39
40 39
50 48
60 51
a) Plot data dengan diagram pencar. Berikan penjelasan dari plot tersebut. b) Tentukan persamaan regresi linear sederhana dari dan maknanya. c)) Gambarkan G b k garis i regresii dari d i b) pada d gambar b a). )
Tabel ini menunjukkan j skor tes p penalaran verbal,, X,, dan skor tes Inggris, Y, untuk setiap sampel acak dari 8 anak yang mengikuti kedua tes tersebut: Anak A B C D E F G H X 112 113 110 113 112 114 109 113 Y 69 65 75 70 70 75 68 76
a) Plot data dengan diagram pencar. Berikan penjelasan dari plot tersebut. a) Tentukan persamaan regresi linear dugaan dan berikan maknanya
MODEL REGRESI LINEAR SEDERHANA BERGALAT NORMAL
Yi = β 0 + β1 X i + ε i β0 dan d β1 adalah d l h parameter t Xi adalah konstanta yang diketahui nilainya εi adalah g galat y yang g menyebar y N(0,σ ( , 2) dan bebas satu sama lain
ASUMSI-ASUMSI DALAM ANALISIS REGRESI LINEAR SEDERHANA
Galat memiliki ragam yang konstan | Galat menyebar normal | Galat bersifat saling bebas |
ASUMSI-ASUMSI DALAM ANALISIS REGRESI LINEAR SEDERHANA 1
εi diduga oleh ei = Yi − Yi !!! S l Selanjutnya ei disebut d b sisaan atau nilai l dugaan d galat. l
ˆ
GALAT MEMILIKI RAGAM YANG KONSTAN
GALAT MENYEBAR NORMAL
Plot sisaan (ei) dengan nilai dugaan (Yˆi ) | Plot sisaan (ei) dengan peubah bebas (Xi) |
Plot peluang normal bagi sisaan yaitu ei versus hi
|
⎡ ⎛ i − 0,375 ⎞⎤ hi = KTG ⎢ z ⎜ ⎟⎥ ⎣ ⎝ n + 0,25 ⎠⎦
Bila sisaan-sisaan tidak membentuk suatu pola tertentu maka galat memiliki ragam yang konstan.
KTG = JKG /(n − p )
JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X iYi
hi adalah nilai harapan di bawah asumsi kenormalan Sisaan diurutkan dari kecil ke besar
|
ei
Galat memiliki ragam konstan (tidak berpola)
2
Galat tidak memiliki ragam konstan (berpola)
Gambar disamping menunjukkan bahwa galat menyebar normal karena titik-titik (sisaan-sisaan) mengikuti arah garis diagonal.
3
4
hi
GALAT BERSIFAT SALING BEBAS
PERHATIKAN TABEL BERIKUT Ŷ = 10 + 2X, KTG = 7,5
Bila data tidak diamati secara bersamaan,melainkan dalam suatu urutan waktu maka buatlah plot sisaan (ei) terhadap waktu. | Tujuan adalah untuk melihat apakah ada korelasi antara suku galat dengan suku galat berikutnya. | Bila suku-suku suku suku galat saling bebas, bebas maka sisaan-sisaan sisaan sisaan berfluktuasi secara acak di sekitar nilai o. |
i
Xi
Yi
Ŷi
ei
1
30
73
70
3
2
20
50
50
0
3
60
128
130
-2
4
80
170
170
0
5
40
87
90
-3
6
50
108
110
-2 2
7
60
135
130
5
8
30
69
70
-1 1
9
70
148
150
-2
10
60
132
130
2
Urutan naik i
ei terurut
hi
1 2 3 4 5 6 7 8 9 10
-3 -2 -2 -2 -1 0 0 2 3 5
-4,24 -2,74 -1,79 -1,02 -0,33 0 33 0,33 1,02 1 79 1,79 2,74 4 24 4,24
Bila data diamati bersamaan, untuk melihat keacakan g galat p percobaan dibuat p plot antara nilai dugaan galat (ei) dengan nilai dugaan respons ( Ŷi ) Apabila berfluktuasi secara acak di sekitar nol maka dapat dikatakan bahwa galat saling bebas. 5
6
SOAL 1 Sebuah penelitian mengukur banyaknya gula yang terbentuk pada berbagai suhu. Data telah dikodekan sebagai berikut:
a) Tentukan persamaan garis regresi linear dugaan b) Dugalah banyaknya gula yang terbentuk bila suhunya 1,75. c) Perhatikan gambar berikut, apa yang dapat Anda simpulkan dari gambar tersebut? Residuals Versus the Fitted Values
Normal Probability Plot of the Residuals
(response is Y)
(response is Y) 99
1.0
95 90 80
Perc cent
Residual
0.5
0.0
70 60 50 40 30 20 10
-0.5
7
1
SOAL 2 Perhatikan gambar berikut :
|
Normal Probability Plot
Versus Fits
Scatterplot of Y vs X
(response is Y)
(response is Y)
90
20
99
80
95 90
10
70 Residual
Y 50
Percent
80
60
0
70 60 50 40 30 20
40
-10
10 5
30 -20
20 30
35
40
45 X
Gambar 1. 1 Plot X dan Y
50
55
1
40
50
60 Fitted Value
70
80
-30
-20
-10
0 Residual
10
20
30
Gambar 2. 2 Plot nilai dugaan vs sisaan Gambar 3. 3 Plot Peluang Normal
a)
Apa yang dapat Anda simpulkan dari gambar 1, 2 dan 3? Berikan penjelasannya. j l
b)
Berdasarkan Gambar 1, apa tanda dari koefisien korelasinya? Berikan penjelasannya. penjelasannya 9
5
8.0
8.5
9.0 Fitted Value
9.5
10.0
-1 5 -1.5
-1 0 -1.0
-0 5 -0.5
00 0.0 Residual
05 0.5
10 1.0
15 1.5
8
Selang Kepercayaan bagi β1 b1 − β1 ~ t( n − 2 ) s{b1}
INFERENSI DALAM ANALISIS REGRESI
Tingkat kepercayaan
⎛ ⎞ b − β1 P⎜⎜ − t α ;(n − 2 ) ≤ 1 ≤ t α ;(n − 2 ) ⎟⎟ = 1 − α 2 2 s{b1} ⎝ ⎠
1. Inferensi tentang β1 a Selang Kepercayaan bagi β1 a. b. Uji bagi β1 2 Inferensi 2. I f i tentang t t β0 a. Selang Kepercayaan bagi β0 b. Uji bagi β0
b1 ± t α 2
;( n− n 2)
s{b1} dengan s 2 {b1} =
KTG
∑ X i2 −
(∑ X )
2
i
n
Misalkan diperoleh selang kepercayaan 95% bagi β1 1,89 ,8 ≤ β1 ≤ 2,11 , Artinya diduga bahwa rata-rata banyaknya jam-orang (Y) naik sekitar antara 1,89 sampai 2,11 satuan untuk setiap kenaikan satu unit it ukuran k llott (X) (X). 1
Perhatikan simpangan total berikut :
Uji bagi β1=0 lawan β1≠0
Yi − Y = Yˆi − Y + Yi − Yˆi
Hipotesis H0 : β1=0 (Tidak ada hubungan linear antara X dan Y) g linear antara X dan Y) H1 : β1≠ 0 (Ada hubungan Sumber Keragaman
db
JK
KT
Regresi
1
JKR
KTR=JKR/1
Galat
n-2 n2
JKG
KTG=JKG/n-2 KTG JKG/n 2
Total
n-1
JKT
2
Jumlah kuadrat simpangan-simpangan tersebut :
∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
Fhit=KTR/KTG
2
2
Ftabel
Fhit
i
Fα(1,n-2)
2
i
JKT
=
i
+
JKR
i
JKG
JKT = ∑ Yi 2 − nY 2
Kriteria keputusan : H0 ditolak jika Fhit > Fα(1,n-2)
JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X iYi
thit =
b1 s{b1}
Kriteria keputusan : H0 ditolak dit l k jika jik |thit|> | tα/2(n-2)
⎡ (∑ Yi ) = ⎢∑ Yi 2 − n ⎢⎣
2
3
Uji Satu Arah Bagi β1
⎡ X Y⎤ X Y − ∑ i∑ i ⎥ ⎤ ⎢∑ i i n ⎦ ⎥− ⎣ (∑ X i )2 ⎥⎦ 2 X − ∑ i n
2
JKR = JKT − JKG
4
Mi lk a S Misalkan Suatu t K Konstanta t t
A k h β1 positif Apakah itif atau t tidak tid tidak? k? k?
Hipotesis : H0 : β1 ≤ 0 H1 : β 1 > 0 Taraf nyata : α Statistik uji : t = b1/s{b1} Kriteria Keputusan : H0 ditolak jika thit > tα(n-2)
• Ujilah apakah β1 = a atau tidak? • Statistik St ti tik ujiji :
Apakah β1 negatif atau tidak? tidak?
t=
Hipotesis : H0 : β1 ≥ 0 H1 : β 1 < 0 Taraf nyata : α Statistik uji : t = b1/s{b1} Kriteria Keputusan : H0 ditolak jika thit < -tα(n-2)
b1 − β1 s{b1} Ganti β1 dengan a
5
6
Selang Kepercayaan bagi β0 b0 − β 0 ~ t( n − 2 ) s{b0 }
b0 ± t α 2
(n − 2 )
s{b0 }
Uji bagi β0=0 lawan β0≠0
⎛ ⎞ b − β0 P⎜⎜ − t α ;(n − 2 ) ≤ 0 ≤ t α ;(n − 2 ) ⎟⎟ = 1 − α 2 2 s{b0 } ⎝ ⎠
Hipotesis H0 : β0=0 H1 : β0≠ 0
⎡ ⎤ ⎢ ⎥ 2 1 X dengan s {b } = KTG ⎢ + ⎥ 0 2 ⎢n (∑ X i ) ⎥⎥ 2 X − ⎢ ∑ i n ⎣ ⎦ 2
Taraf Nyata : α Statistik Uji :
Misalkan diperoleh selang kepercayaan 90% bagi β0 5,34 ≤ β0 ≤ 14,66 Artinya diduga bahwa rataan banyaknya jam jam--orang sekitar antara 5,34 sampai 14 14,,66 satuan untuk ukuran lot sebesar 0. Selang g ini tidak mempunyai p y makna. makna. Selang g kepercayaan p y ini tidak selalu memberikan informasi yang bermanfaat
thit =
Kriteria keputusan : H0 ditolak jika |thit|> tα/2(n-2) 7
8
Soal 2
Soal a 1 Data berikut merupakan p hasil p penelitian tentang g hubungan g antara nilai ulangan Matematika (dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama seminggu). Nilai ulangan 95 100 100 80 70 55 50 75 55 60 65 95 matematika L Lama waktu kt 18 18 19 17 14 5 6 10 13 4 12 10 belajar matematika a)Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y! Anggap asumsi asumsi-asumsi asumsi dalam model regresi linear sederhana terpenuhi. b)Tentukan selang kepercayaan 99% bagi β0 dan β1 beserta maknanya! c)Ujilah ) j apakah p ada hubungan g linear antara lama waktu belajar j matematika dan nilai ulangan matematika? Gunakan taraf nyata α = 0,01. d)Ujilah apakah β1 = 5 lawan β1 ≠ 5 ? Gunakan taraf nyata α = 0,01. e)Ujilah apakah β0 = 0 atau tidak? Gunakan taraf nyata α = 0,01. 9
Soal 3 Suatu percobaan dilakukan pada jenis mobil baru merk tertentu, untuk menentukan jarak yang dibutuhkan untuk berhenti bila mobil tersebut direm pada berbagai kecepatan. Data yang diperoleh sebagai berikut: Kecepatan p (kilometer ( per p jam) j ) Jarak sampai berhenti (meter)
b0 s{b0}
Suatu tes diberikan pada semua mahasiswa baru. Seseorang yang memperoleh nilai di bawah 35 tidak diizinkan mengikuti kuliah matematika yang biasa, biasa tetapi harus mengikuti suatu kelas khusus (remedial class). Berikut ringkasan data dari nilai tes dan nilai akhir bagi 20 mahasiswa yang mengikuti kuliah matematika yang biasa: a Tentukan peubah mana sebagai peubah bebas X dan peubah tak a. bebas Y! b. Tentukan b u a persamaan p a aa regresi g dugaan! dugaa c. Bila 60 adalah nilai terendah agar lulus dari pelajaran matematika tersebut, berapakah batas nilai tes terendah di masa mendatang untuk dapat diizinkan mengikuti kuliah tersebut? Bila model regresi ordo pertama layak digunakan. d Ujilah d. Ujil h apakah k h ada d hubungan h b linier li i antara nilai il i tes dan d nilai il i akhir? khi ? Gunakan taraf nyata 0,05. e Tentukan selang kepercayaan 95% bagi β0 dan β1 beserta maknanya. e. maknanya 10
Sum Square of Errors (SSE) → JKG
(
SSE = ∑ Yi − Yˆi
)
2
35 50 65 80 95 110 16 26 41 62 88 119
a)Tentukan )T t k peubah b h mana sebagai b i peubah b h bebas b b X dan d peubah b h tak t k bebas Y! b)Tentukan persamaan regresi dugaan dan berikan makna dugaan koefisien regresinya! Anggap gg p asumsi-asumsinya y terpenuhi. p c)Tentukan selang kepercayaan 95% bagi β1 dan berikan maknanya! d)Tentukan selang kepercayaan 95% bagi β0 dan berikan maknanya! e)Ujilah apakah ada hubungan linear antara kecepatan dan jarak sampai berhenti? Gunakan taraf nyata α = 0,05. f)Ujilah apakah β1 positif? Gunakan taraf nyata α = 0,05.
SSE = ∑ Yi 2 − 2b0 ∑ Yi − 2b1 ∑ X iYi + b0 ∑ Yi + b1 ∑ X iYi 11
12
Normal Equation
Data Kredit Konsumen Hal 204 No. 6.5 Data di bawah ini menunjukkan bagi sebuah perusahaan kredit konsumen yang beroperasi di enam kota, banyaknya perusahaan sejenis yang beroperasi b i di kota k t itu it (X) dan d besarnya b t t l kredit total k dit dalam d l ribuan ib yang tertunggak (Y): i
1
2
3
4
5
6
Xi
4
1
2
3
3
4
Yi
16
5
10
15
13
22
Anggaplah bahwa model regresi ordo pertama layak digunakan.
13
a. Tentukan persamaan regresi dugaannya! b Tentukan selang kepercayaan bagi β0 dan β1 beserta b. maknanya! j apakah p besarnya y total kredit tertunggak gg c. Ujilah berhubungan dengan banyaknya perusahaan sejenis yang beroperasi di kota itu!
1 4
` Perhatikan kembali
Ukuran Deskriptif bagi Hubungan antara Peubah u Bebas s ((X)) d dan Peubah Tak Bebas (Y) dalam Model Regresi
∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ ) 2
2
i
2
i
=
JKT
i
+
JKR
i
JKG
` JKT mengukur keragaman di dalam amatan-amatan Yi atau ketidakpastian ketika meramalkan Y tanpa menggunakan peubah bebas X ⇒ keragaman e aga a total o a
* Koefisien Determinasi
` JKG mengukur keragaman dalam Yi dengan menggunakan model regresii yang menyertakan t k peubah b h bebas b b X ⇒ keragaman k yang tidak dapat dijelaskan
* Koefisien Korelasi
` JKR mengukur keragaman Yi yang berasal dari garis regresi ⇒ keragaman Y yang dapat dijelaskan 1 2
Koefisien Determinasi P h k Gambar Perhatikan G b 1 !! ` Ukuran untuk mengukur pengaruh X dalam menurunkan keragaman Y adalah
r2 =
JKT − JKG JKR JKG = = 1− JKT JKT JKT
Koefisien determinasi
Jika semua amatan terletak pada garis regresi maka JKG = 0 dan r2 = 1. Peubah bebas X berhasil menjelaskan semua keragaman di dalam amatan-amatan Yi.
Perhatikan Gambar 2 !! Jika kemiringan garis regresi adalah b1 = 0 sehingga
Karena 0 ≤ JKG ≤ JKT maka 0 ≤ r2 ≤ 1
0 Yˆ ≡ Y maka JKG = JKT dan r2 = 0.
Tidak ada hubungan linear antara X dan Y. Peubah bebas X dalam bentuk regresi linear tidak bisa membantu sama sekali k li dalam d l menurunkan k keragaman k d l dalam amatan-amatan t t Yi.
Yˆ = b0 + b1 X
Yˆ = Y
Semakin dekat pada 1 semakin tinggi tingkat hubungan linear antara X dan Y.
Gambar 2
Gambar 1
3
4
Makna koefisien determinasi ` Misalkan ingin mengetahui hubungan antara jarak kendaraan (X) dengan tingkat emisinya (Y) suatu mobil ?
Hubungan antara b1 dan r
tempuh
r2
` Diperoleh = 89,9% , artinya sekitar 89,9% keragaman dari tingkat emisi suatu mobil yang dapat dijelaskan oleh jarak tempuhnya.
∑ (Y − Y ) ∑ (X − X ) 2
b1 = r
i
2
i
⎛s = r ⎜⎜ Y ⎝ sX
⎞ ⎟⎟ ⎠
dalam hal ini
atau Keragaman tingkat emisi suatu mobil berhasil diturunkan 89,9% dengan disertakan peubah jarak tempuh.
5
∑ (Y − Y )
2
sY =
sX =
i
n −1
6
∑ (X
−X)
2
i
n −1
Koefisien Korelasi
Rumus Hitung bagi r
r = ± r2
r=
Tanda plus atau minus tergantung pada kemiringan garis g y positif p atau negatif. g regresinya -1 ≤ r ≤ 1
∑ (X
− X )(Yi − Y )
[∑ (X − X ) ∑ (Y − Y ) ] i
2
2 12
i
i
X Y ∑ X Y − ∑ n∑ (∑ X ) ⎞⎟⎛⎜ Y − (∑ Y ) − ⎟⎜ ∑ n n i
=
i
i i
⎡⎛ ⎢⎜ ∑ X i2 ⎢⎜⎝ ⎣
2
⎞⎤ ⎟⎥ ⎟⎥ ⎠⎦
2
i
i
2
i
⎠⎝
12
Bila hubungan linear antara X dan Y sempurna maka r = ±1 r = 1 hubungan sempurna dan searah r = -1 hubungan sempurna dan berlawanan arah
β1 < 0
β1 > 0
Korelasi hanya dapat mengukur hubungan linear !!! 8
7
Pengujian hipotesis tentang k fi i korelasi koefisien k l i
Koefisien Korelasi antara X dan Y Koefisien korelasi populasi dinyatakan dengan ρ. U t k menguji Untuk ji apakah k h ada d hubungan h b li linear antara t X dan d Y pada d model Y=β0+β1X+ε dapat pula dengan menguji H0: ρ = 0 lawan H1: ρ ≠ 0
Hipotesis 1) H0: ρ = 0 (Tidak ada hubungan linear antara X dan Y) H1: ρ ≠ 0 (Ada hubungan linear antara X dan Y) 2) H0: ρ ≥ 0 3) H0: ρ ≤ 0 H1: ρ < 0 H1: ρ > 0 T f nyata Taraf t :α r n−2 Statistik uji :
Jika regresi Y atas X merupakan garis lurus maka koefisien korelasi pada populasi adalah ρ atau ρXY
ρ XY =
Cov( X , Y ) E ( XY ) − E ( X )E (Y ) = σ XσY V ( X )Var Var V (Y )
Koefisien korelasi sampel
rXY =
(n∑ X
t=
n∑ XY − ∑ X ∑ Y 2
)(
− (∑ X ) n∑ Y 2 − (∑ Y ) 2
2
1− r2
Kriteria Keputusan : 1) H0 ditolak jika |thit| > tα/2,n-2 2) H0 ditolak jika thit < - tα,n-2 3) H0 ditolak jika thit > tα,n-2
)
9
10
Soal 1 Hipotesis 1) H0: ρ = k H1: ρ ≠ k
2) H0: ρ ≥ k H1: ρ < k
Taraf nyata : α Statistik Uji :
3) H0: ρ ≤ k H1: ρ > k
1+ r 1+ k ln − ln 1− r 1− k Z= 1 n−3
Kriteria Keputusan : 1) H0 ditolak jika |Zhit| > Zα/2 2)) H0 ditolak jjika Zhit < -Zα 3) H0 ditolak jika Zhit > Zα
11
Data nilai mutu ratarata-rata i
1
2
3
4
5
6
7
8
9
10
Xi
5,5
4,8
4,7
3,9
4,5
6,2
6,0
5,2
4,7
4,3
Yi
3,1
2,3
3,0
1,9
2,5
3,7
3,4
2,6
2,8
1,6
i
11
12
13
14
15
16
17
18
19
20
Xi
4,9
5,4
5,0
6,3
4,6
4,3
5,0
5,9
4,1
4,7
Yi
2,0
2,9
2,3
3,2
1,8
1,4
2,0
3,8
2,2
1,5
Keterangan: Keterangan: Y : nilai mutu rata-rata (NMR) pada akhir tahun pertama X : nilai ujian masuk Anggap model regresi linear cocok digunakan. a) Tentukan koefisien determinasi dan maknanya b) Tentukan koefisien korelasi c) Apakah ρ > 0,75? Lakukan pengujian hipotesis dengan α= 0,05. 12
Soal 2
Soal 3
Data Pemeliharaan Kalkulator
∑Y
i
i
1
2
3
4
5
6
7
8
9
Xi
7
6
5
1
5
4
7
3
4
Yi
97
86
78
10
75
62
101
39
53
i
10
11
12
13
14
15
16
17
18
Xi
2
8
5
2
5
7
1
4
5
Yi
33
118
65
25
71
105
17
49
68
= 1152, ∑ X i = 81, ∑ (Yi − Y ) = 16504, ∑ (X i − X ) = 74,.5, ∑ (X i − X )(Yi − Y ) = 1098 2
2
Xi adalah banyaknya kalkulator yang diservis Yi adalah lamanya waktu untuk memperbaiki kalkulator A Anggap model d l regresii linear li sederhana d h cocok k digunakan. di k Hitunglah koefisien determinasi determinasi!! Berikan maknanya maknanya!! Hitunglah koefisien korelasinya korelasinya!! Apakah ρ≠ 0? Lakukan pengujian hipotesis dengan α =0,01.
Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika (dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama seminggu). Nilai a u ulangan a ga 95 100 00 100 00 80 70 0 55 50 75 5 55 60 65 95 matematika Lama waktu 18 18 19 17 14 5 6 10 13 4 12 10 belajar matematika a) Tentukan peubah mana sebagai peubah bebas dan peubah tak bebas! Anggap asumsi asumsi-asumsi asumsi dalam model regresi linear sederhana terpenuhi. terpenuhi b)Tentukan koefisien determinasi dan maknanya c)Tentukan koefisien korelasi d)Ujilah apakah ada hubungan linier antara lama waktu belajar matematika dan nilai ulangan matematika? Gunakan uji korelasi populasi dengan taraf nyata 0,05. 0 05
13
Soal 4 Suatu tes diberikan pada semua mahasiswa baru. Seseorang yang memperoleh nilai di bawah 35 tidak diizinkan mengikuti kuliah matematika yang biasa, tetapi harus mengikuti suatu kelas khusus (remedial class). Berikut ringkasan data dari nilai tes dan nilai akhir bagi 20 mahasiswa yang mengikuti kuliah matematika yang biasa: a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y! Bila model regresi ordo pertama layak digunakan. b)Tentukan koefisien determinasi dan maknanya c)Tentukan koefisien korelasi d)Apakah ρ = 0,85? Lakukan pengujian hipotesis dengan α= 0,01.
15
14
K it i kkoefisien Kriteria fi i kkorelasi l i (Sarwono:2006): – 0 : Tidak ada korelasi antara dua variabel – >0 – 0,25: Korelasi sangat lemah – >0,25 – 0,5: Korelasi cukup – >0,5 – 0,75: Korelasi kuat – >0,75 – 0,99: Korelasi sangat kuat – 1: Korelasi sempurna
16
UJI F UNTUK KETIDAKCOCOKKAN MODEL REGRESI LINEAR SEDERHANA
• Uji ini mengasumsikan bahwa pengamatan-pengamatan Y untuk suatu X tertentu bersifat bebas, tersebar normal, memiliki ragam yang sama. • Uji ini menghendaki adanya pengamatan berulang pada satu atau lebih nilai X.
ANALISIS VARIANSI UJI F UNTUK KETIDAKCOCOKKAN MODEL REGRESI LINEAR SEDERHANA
1 2
Jumlah Kuadrat Ketidakcocokkan Model (JKKM)
Formula Hipotesis p Hipotesis H0 : E{Y} = β0+ β1X H1 : E{Y} ≠ β0+ β1X Atau H0 : Tidak ada ketidakcocokan model regresi linear sederhana dengan data H1 : Ada ketidakcocokan model regresi linear sederhana dengan data Atau H0 : Model regresi linear sederhana cocok H1 : Model regresi linear sederhana tidak cocok
JKG = JKGM + JKKM Perhatikan :
Yij − Yˆij = Yij − Y j + Y j − Yˆij
Simpangan galat g
∑∑ (Y
ij
Simpangan g galat murni
− Yˆij
) = ∑∑ (Y 2
ij
JKG =
Simpangan ketidakcocokan model d l
(
− Y j ) + ∑∑ Y j − Yˆij 2
+
JKGM
)
2
JKKM
4 3
Statistik Uji j
J KKM (k − 2 ) F= JKGM (n − k )
JKGM = ∑∑ (Yij − Y j ) JKG = ∑ Yi 2 − b0 ∑ Yi − b1 ∑ X iYi JKKM = JKG − JKGM db(G) = n − 2; db(GM) = n − k; db(KM) = k − 2 2
5
Soal 1, lakukan uji kecocokan model regresi linear sederhana gunakan taraf nyata 0,05. sederhana, 0 05 i
Xi
Xi
Yi
1
125
160
2
100
112
3
200
124
⎯Yj
Yij 75
28 42
35
100
112 136
124
125
160 150
155
4
75
28
5
150
152
6
175
156
150
152
152
7
75
42
175
140
8
175
124
156 124
200
124 104
114
9
125
150
10
200
104
11
100
136
ΣXiYi=186200, ΣXi=1500, ΣYi =1288, ΣYi 2=170696 The regression equation is Ŷi = 50,72251+ 0,48670 Xi 6
Soal 2. Data Konsentrasi Larutan i
Xi
Yi
1
9
0.07
2
9
0 09 0.09
3
9
0.08
4
7
0.16
5
7
0.17
6
7
0.21
7
5
0.49
8
5
0.58
9
5
0 53 0.53
10
3
1.22
11
3
1.15
12
3
1.07
13
1
2.84
14
1
2.57
15
1
3.10
Soal 3
a. Tentukan persamaan regresi linear d dugaannya. b. Lakukan uji F untuk memeriksa apakah ada ketidakcocokan model bila digunakan model regresi linear sederhana, gunakan α = 0.05. c. Buatlah diagram pencar antara X dan Y, mengindikasikan model regresi apa yang cocok? Jelaskan. Jelaskan Seorang g kimiawan mempelajari p j hubungan g konsentrasi suatu larutan (Y) dengan waktu (X).
7
Bagaimana uji kecocokan model regresi linear sederhana dilakukan bila tidak ada pengamatan berulang pada nilai X? Berikan penjelasan. penjelasan.
Perhatikan kembali model regresi linear sederhana sederhana:: Yi = β0+β1Xi+εi
PENDEKATAN MATRIKS TERHADAP ANALISIS REGRESI LINEAR SEDERHANA
Y1 = β 0 + β1 X 1 + ε 1 Y2 = β 0 + β1 X 2 + ε 2 M Yn = β 0 + β1 X n + ε n
⎡Y1 ⎤ ⎡1 ⎢Y ⎥ ⎢1 ⎢ 2⎥ = ⎢ ⎢ M ⎥ ⎢M ⎢ ⎥ ⎢ ⎣Yn ⎦ ⎣1
⎡ε1 ⎤ X1 ⎤ X 2 ⎥ ⎡ β 0 ⎤ ⎢ε 2 ⎥ ⎥⎢ ⎥+⎢ ⎥ M ⎥ ⎣ β1 ⎦ ⎢ M ⎥ ⎢ ⎥ X n ⎦⎥ ⎣ε n ⎦
Y = X β +ε n×1 n×2
2×1 n×1
1
2
Perhatikan bahwa X β adalah vektor nilai-nilai harapan b i amatan-amatan bagi t t Yi sebab b b E{Yi}= } β0+β1Xi
Perhatikan !!!
S h Sehingga : E{Y } = X β n×1
n×2 2×1
Syarat : ε adalah S d l h suatu vektor k peubah-peubah b h b h acakk normall yang bebas dengan E{ε } = 0 dan σ 2 {ε } = σ 2 I Persamaan normal regresi linear sederhana nb0 + b1 ∑ X i = ∑ Yi
ditulis dalam notasi matriks ⎡1 1 K 1 ⎤ ⎢⎢1 ⎡1 ⎢ X X K X ⎥ ⎢M n⎦ 2 ⎣ 1 ⎢ ⎣1
X Xb = X Y t
b0 ∑ X i + b1 ∑ X i2 = ∑ X iYi
t
(
⇒b= X X t
)
−1
t
X Y
X1 ⎤ ⎡Y1 ⎤ X 2 ⎥⎥ ⎡b0 ⎤ ⎡1 1 K 1 ⎤ ⎢⎢Y2 ⎥⎥ =⎢ ⎢ ⎥ ⎥ M ⎥ ⎣b1 ⎦ ⎣ X 1 X 2 K X n ⎦ ⎢ M ⎥ ⎥ ⎢ ⎥ Xn⎦ ⎣Yn ⎦ 3
Uji terhadap β1
Perhatikan !!!
• Untuk menguji apakah ada hubungan linear antara Y dengan X dilakukan X, dil k k pengujian ji berikut b ik t : Hipotesis : H0 : β1 = 0 H1 : β1 ≠ 0 Taraf nyata : α Statistik Uji : F = KTR = JKR /( p − 1)
KTG
4
⎛1⎞ / / JKT = Y Y − ⎜ ⎟Y J Y ⎝n⎠
′ Y Y = ∑ Yi 2
JKG /((n − p )
p : banyaknya parameter ⎛1⎞ / / / / / JKT = Y Y − ⎜ ⎟Y J Y JKG = Y Y − b X Y JKR = JKT-JKG ⎝n⎠ Kriteria Keputusan : H0 ditolak jika Fhit > Fα(p-1,n-p) 5
⎡1 L 1⎤ J = ⎢⎢M M M⎥⎥ n×n ⎢⎣1 L 1⎥⎦
2 ′ Y J Y = (∑ Yi )
6
Soal 1
Selang Kepercayaan bagi βk
bk ± tα / 2,(n − p )s{bk }
⎡ s 2 {b0 } s{b0 ,b1}⎤ s {b} = ⎢ ⎥ 2 ⎣ s{b1 , b0 } s {b1} ⎦ 2
Suatu percobaan telah dilakukan untuk menentukan apakah berat seekor kambing (dalam kilogram) dapat diprediksikan (setelah pada periode tertentu) berdasarkan jumlah makanan yang dimakan (dalam kilogram). Berikut data yang telah dinyatakan dalam notasi matriks.
(
s 2 {b} = KTG X X /
379 ⎤ ⎡ 825 ⎤ ⎡ 10 ′ ′ ′ X X =⎢ ⎥, X Y = ⎢31726⎥, Y Y = [70083], ⎣ ⎦ ⎣379 14533⎦
)
−1
′ Y J Y = [680625]
Anggap model regresi ordo pertama dapat digunakan. a) Tentukan persamaan regresi dugaan beserta maknanya. b) Bila jumlah makanan seekor kambing sebesar 300 kg, berapakah prediksi berat kambing tersebut? c) Buatlah selang kepercayaan 99% bagi β1 dan berikan maknanya. maknanya d) Tentukan koefisien korelasinya.
K fi i Determinasi Koefisien D t i i r2 = JKR/JKT = 1- (JKG/JKT)
Koefisien korelasi r = ± r2
7
Soal 2 (kerjakan dengan pendekatan matriks) matriks) D Data K Kerusakan k Rasa R Data berikut merupakan hasil penelitian tentang hubungan antara suhu penyimpanan (dalam °F) dan lama (dalam minggu ) sebelum mulai terjadi kerusakan rasa suatu produk i
1
2
3
4
5
Xi
8
4
0
-4
-8
Yi
7.8
9.0
10.2
11.0
11.7
Anggap bahwa model regresi ordo pertama dapat digunakan. a)Tentukan persamaan regresi dugaannya b)Ujilah apakah ada hubungan linear antara suhu penyimpanan dan lama sebelum mulai terjadi kerusakan rasa suatu produk ? c)Buat selang kepercayaan bagi β0 dan β1! d)Tentukan ) koefisien determinasi dan koefisien korelasinya! y 9
Ingat!! Ingat Metode Kuadrat Terkecil untuk Model Regresi Linear Sederhana n
n
n
Q = ∑ (Yi − E (Yi )) = ∑ (Yi − (β 0 + β1 X i )) = ∑ (Yi − β 0 − β 1 X i ) 2
i =1
ANALISIS REGRESI LINEAR GANDA
2
i =1
n ∂Q = −2∑ (Yi − β 0 − β1 X i ) ∂β 0 i =1
Dosen Pengampu : Kismiantini, M.Si.
2
i =1
n ∂Q = −2∑ X i (Yi − β 0 − β 1 X i ) ∂β 1 i =1
Lalu kedua turunan parsial tersebut disamadengankan nol nol,, dengan penduga bagi β0 dan β1 adalah b0 dan b1 yang meminimumkan Q. n
− 2∑ (Yi − b0 − b1 X i ) = 0
n
− 2∑ X i (Yi − b0 − b1 X i ) = 0
i =1
n
∑Y i =1
i
i =1
n
− nb0 − b1 ∑ X i = 0 i =1
n
∑X Y i =1
i i
n
n
i =1
i =1
− b0 ∑ X i − b1 ∑ X i2 = 0
1 2
Model Regresi Linear Ganda
Persamaan Normal
n
n
i =1
i =1
Yi = β 0 + β1 X i1 + β 2 X i 2 + L + β p −1 X i , p −1 + ε i dengan : β0, β1, …, βp-1 adalah parameter Xi1, …, Xi,p-1 ,p adalah konstanta yang diketahui nilainya εi saling bebas dan menyebar N(0,σ2) i = 1, 2, …, n
nb0 + b1 ∑ X i = ∑ Yi n
n
n
i =1
i =1
i =1
b0 ∑ X i + b1 ∑ X i2 = ∑ X i Yi
Persamaan regresi g dugaan g : Yˆi = b0 + b1 X i1 + b2 X i 2 + L + b p −1 X i , p −1 4
3
Model Regresi Linear dengan 2 Peubah Bebas
P Persamaan Normal N l
Yi = β 0 + β1 X i1 + β 2 X i 2 + ε i
b0 n + b1 ∑ X i1 + b2 ∑ X i 2 + K + b p −1 ∑ X ip −1 = ∑ Yi
Persamaan regresi dugaan : Yˆ = b + b X + b X
b0 ∑ X i1 + b1 ∑ X i21 + b2 ∑ X i1 X i 2 + K + b p −1 ∑ X i1 X ip −1 = ∑ X i1Yi
b0 ∑ X i 2 + b1 ∑ X i1 X i 2 + b2 ∑ X i22 + K + b p −1 ∑ X i 2 X ip −1 = ∑ X i 2Yi
i
M
0
1
i1
2
i2
Persamaan normal :
b0 ∑ X ipp −1 + b1 ∑ X i1 X ipp −1 + b2 ∑ X i 2 X ipp −1 + K + b p −1 ∑ X ip2p −1 = ∑ X ipp −1Yi
b0 n + b1 ∑ X i1 + b2 ∑ X i 2 = ∑ Yi
b0 ∑ X i1 + b1 ∑ X i21 + b2 ∑ X i1 X i 2 = ∑ X i1Yi
b0 ∑ X i 2 + b1 ∑ X i1 X i 2 + b2 ∑ X i22 = ∑ X i 2Yi 5
6
⎡ 1 X X = ⎢⎢ X 11 ⎢⎣ X 12
⎡1 X 11 1 ⎤⎢ 1 X 21 ⎥ X n1 ⎥ ⎢ ⎢M M L X n 2 ⎥⎦ ⎢ ⎣1 X n1
X 22
⎡ n ⎢ ' X X = ⎢ ∑ X i1 ⎢∑ X i 2 ⎣ ⎡ 1 ' X Y = ⎢⎢ X 11 ⎢⎣ X 12
∑X ∑X ∑X X i1 2 i1
i2
∑X ∑X X ∑X i2
i1
i1
Memaknai Persamaan Regresi g Dugaan g
X 12 ⎤ X 22 ⎥⎥ M ⎥ ⎥ X n2 ⎦
1 L X 21 L
'
i2
2 i2
Misalkan : Ingin mengetahui apakah volume penjualan (Y, gros) b h b berhubungan d dengan j l h penduduk jumlah d d k (X1, ribuan ib ji ) dan jiwa) d pendapatan per kapita (X2, dolar). Diperoleh pe o e pe persamaan sa aa regresi eg es dugaa dugaannya ya ialah aa
⎤ ⎥ ⎥ ⎥ ⎦
Yˆ = 3,453 + 0,496 X 1 + 0,00920 X 2 Persamaan ini menunjukkan bahwa rataan volume penjualan diharapkan akan naik 0,496 gros bila jumlah penduduk naik 1 ribu jjiwa kalau p pendapatan p per kapita p p tetap, p, dan bahwa rataan volume penjualan diharapkan akan naik 0,0092 gros bila pendapatan per kapita naik 1 dolar kalau jumlah penduduk tetap. Bila jumlah penduduk sebesar 0 jiwa dan pendapatan per kapita 0 dollar maka rata-rata volume penjualan sebesar 3,453 gros (tidak bermakna).
⎡Y ⎤ ⎤ 1 ⎤ ⎢ 1 ⎥ ⎡∑ Yi ⎢ ⎥ Y ⎥ X n1 ⎥ ⎢ 2 ⎥ = ⎢∑ X i1Yi ⎥ ⎢M⎥ ⎢ L X n 2 ⎦⎥ ⎢ ⎥ ⎢∑ X i 2Yi ⎥⎥ ⎦ ⎣Yn ⎦ ⎣
1 L X 21 L
X 22
7
Uji terhadap Hubungan Regresi
Soal 1 Suatu percobaan telah dilakukan untuk menentukan apakah berat seekor binatang dapat diprediksikan (setelah pada periode tertentu)) berdasarkan b d k b berat awall dan d j l h makanan jumlah k yang dimakan. Diperoleh data sebagai berikut yang diukur dalam kilogram. Berat Akhir (Y)
95
77
80
100
97
70
50
80
92
Berat Awal (X1)
42
33
33
45
39
36
32
41
40
38
272
226
259
292
311
183
173
236
230
235
Jumlah Makanan (X2)
Untuk menguji apakah peubah tak bebas Y berhubungan dengan peubah-peubah p p bebas ((X1, X2,,…,X , pp-11), dilakukan p pengujian g j berikut : Hipotesis : H0 : β1 = β2 = … = βp-1=0 0 H1 : Tidak semua βk (k=1,2,…,p-1)sama dengan nol Taraf nyata : α Statistik Uji : F = KTR/KTG = (JKR/(p-1))/(JKG/(n-p)) p : banyaknya parameter ⎛1⎞ JKR = JKT-JKG JKT = Y ' Y − ⎜ ⎟Y ' J Y ⎝n⎠ Kriteria Keputusan : JKG = Y ' Y − b' X ' Y H0 ditolak jika Fhit > Fα(p-1,n-p)
84
Tentukan persamaan regresi dugaan dan maknanya! Coefficientsa
Model 1
(Constant) Berat Awal Jumlah Makanan
8
Unstandardized Coefficients B Std. Error -22.993 17.763 1 396 1.396 .583 583 .218 .058
Standardized Coefficients Beta .404 404 .634
t -1.294 2 396 2.396 3.767
Sig. .237 .048 048 .007
95% Confidence Interval for B Lower Bound Upper Bound -64.995 19.009 .018 018 2 773 2.773 .081 .354
a. Dependent Variable: Berat Akhir
9
10
Uji terhadap βk
Perhatikan!!! Perhatikan !!!
s 2 {b} = KTG ( X ' X )
−1
Hipotesis : ⎡ s {b } s{b , b } H0 : βk = 0 H1 : βk ≠ 0 ⎢ s{b , b } s {b } s {b} = ⎢ ⎢ Taraf nyata : α M M ⎢ ⎢⎣ s{b , b } s{b , b } Statistik Uji : t = bk/s{bk} Kriteria Keputusan : Ho ditolak jika |thit| > tα/2, n-p
⎛1⎞ ' JKT = Y Y − ⎜ ⎟Y J Y ⎝n⎠
2
0
'
0
1
2
2
1
p −1
′ Y Y = ∑ Yi 2
0
1
0
p −1
1
L s{b0 , b p −1 }⎤ ⎥ L s{b1 , b p −1 }⎥ ⎥ M M ⎥ L s 2 {b p −1 } ⎥⎦
S l Selang K Kepercayaan b i βk bagi
2 ′ Y J Y = (∑ Yi )
bk ± tα / 2,(n − p )s{bk }
11
12
Soal 2 Makna Selang Kepercayaan
Suatu p penelitian telah dilakukan untuk mengetahui g hubungan g antara persentase kehadiran mahasiswa (X1) dan lama belajar dalam jam per minggu (X2) terhadap nilai akhir ujian suatu mata kuliah (Y). Sebanyak 30 mahasiswa telah dipilih secara acak untuk menjadi subyek penelitian. ⎡ 9,8866861 − 0,132528 0,640573 ⎤ Diketahui : (X′X )−1 = ⎢⎢− 0,132528 0,0018375 − 0,010051⎥⎥
Dari soal 1, diperoleh selang kepercayaan bagi β1 adalah 0 018 ≤ β1 ≤ 2,773 0,018 2 773 artinya diduga bahwa rata-rata berat akhir binatang (Y) naik sekitar antara 0,018 , sampai p 2,773 , kgg untuk setiapp kenaikan satu kilogram g berat awal binatang (X1) bila jumlah makanan tetap (X2).
⎣⎢ 0,640573
− 0,010051
0,079075 ⎥⎦
∑ Yi = 2440, ∑ Yi 2 = 2016000, ∑ X i1Yi = 224670, ∑ X i 2Yi = 8880,
∑X
i1
X i 2 = 9810, ∑ X i21 = 251674, ∑ X i22 = 409
a)) Tentukan p persamaan regresi g dugaan g dan berikan maknanya. y b) Bila dianggap asumsi-asumsi dalam analisis regresi linear ganda terpenuhi, ujilah apakah ada hubungan antara persentase kehadiran mahasiswa dan lama belajar dalam jam per minggu terhadap nilai akhir ujian suatu mata kuliah. Gunakan α = 0,05. c) Tentukan selang kepercayaan bagi β1 dan maknanya.
13
Soal 3 Dari soal 1,
Selang g Kepercayaan p y Serempak p
( X ' X )−1
8.6176001 -0.21777 -0.001093 0 001093
-0.21777 0.0092689 -0.000552 0 000552
Selang S l k kepercayaan b bersama B f Bonferroni i dapat d di digunakan k untukk menduga beberapa koefisien regresi secara serempak. JJika a g bua buah pa parameter a ete a akan a d diduga duga seca secara a be bersamaan sa aa (asa (asalkan a g ≤ p), maka batas-batas kepercayaan serempak dengan tingkat kepercayaan 1-α adalah
-0.001093 -0.000552 0.0000911 0 0000911
a) Ujilah apakah ada hubungan linear antara berat akhir dengan berat awal dan jumlah makanan? b) Ujilah apakah β2=0 atau tidak? c) Buat selang kepercayaan masing-masing bagi β1 dan β2!
bk ± B s{bk } B=tα 2g
(n − p )
15
Makna Selang Kepercayaan Serempak
16
Koefisien Determinasi Ganda (R2)
Misalkan : Ingin g mengetahui g apakah p volume p penjualan j ((Y,, gros) berhubungan dengan jumlah penduduk (X1, ribuan jiwa) dan pendapatan per kapita (X2, dolar). Diperoleh selang kepercayaan serempak 90% sebagai berikut : (g=2) (g 2)
R2 = JKR/JKT / = 1- (JKG/JKT) ( / ) Koefisien ini mengukur proporsi pengurangan keragaman total di dalam Y akibat digunakannya peubah-peubah bebas X1,X2, …, Xp-1. Sifat koefisien determinasi ganda : 0 ≤ R2 ≤ 1. R2 akan bernilai 0 bila semua bk = 0 (k=1,…,p-1). R2 akan bernilai 1 bila semua amatan Y berada tepat pada permukaan respons dugaannya, Yi = Ŷi untuk semua i.
0 483≤β1≤0,509; 0,483≤β ≤0 509; 0,0071 0 0071 ≤β2≤0,0113 ≤0 0113 Selang kepercayaan serempak ini mengindikasikan bahwa β1 dan β2 keduanya positif, hal ini sesuai harapan teoritis bahwa volume penjualan memang harus naik jika jumlah penduduk naik ik dan d pendapatan d t per kapita k it naik, ik tentu t t saja j asalkan lk peubah-peubah lain dipertahankan konstan.
17
18
Koefisien determinasi ganda terkoreksi
Memaknai Koefisien Determinasi Ganda
Penambahan lebih banyak y p peubah bebas ke dalam model selalu akan menaikkan nilai R2 tidak pernah menurunkannya, sebab JKG tidak pernah menjadi lebih besar bila peubah bebasnya lebih banyak, sedangkan JKT tidak akan berubah bila data responsnya tetap sama. Karena R2 sering bisa dibuat besar dengan cara menyertakan peubah bebas, bebas maka ada yang menyarankan agar ukuran ini dimodifikasi untuk mempertimbangkan banyaknya peubah bebas di dalam model. Koefisien determinasi ganda terkoreksi
Misalkan : Ingin mengetahui apakah volume penjualan (Y, (Y gros) berhubungan dengan jumlah penduduk (X1, ribuan jiwa) dan pendapatan per kapita (X2, dolar) Diperoleh R2 = 0,9989, artinya bila kedua bebas, jumlah penduduk dan pendapatan per kapita ikut diperhitungkan maka keragaman volume penjualan dapat dikurangi sebanyak 99,9%. atau sebesar 99,9% keragaman dari volume penjualan yang dapat dijelaskan oleh jumlah penduduk dan pendapatan per kapita.
⎛ n − 1 ⎞ JKG JKG (n − p ) ⎟⎟ = 1 − ⎜⎜ R = 1− JKT (n − 1) ⎝ n − p ⎠ JKT 2 a
19
20
Chatterjee, S. & Hadi, A.S. 2006. Regression Analysis by Example. New Jersey: John Wiley & Sons.
Koefisien Korelasi Ganda Koefisien korelasi ganda R adalah akar kuadrat positif dari R2 ⇒ R=
R2
Mengapa koefisien k fi i korelasi k l i ganda d diperoleh di l h hanya h dari akar positif koefisien determinasi ganda ganda??
21
22
Soal 4 Dari soal 1, 1 a) Tentukan selang kepercayaan serempak 95% untuk β1 dan β2. b) Hitunglah koefisien determinasi ganda dan berikan maknanya. c) Hitunglah koefisien korelasi ganda.
Soal 5 Dari soal 2, a) Tentukan selang kepercayaan serempak 95% untuk β1 dan β2. b) Hitunglah koefisien determinasi ganda dan berikan maknanya. g koefisien korelasi g ganda. c)) Hitunglah
Soal 6. Data tentangg ppengiriman g bahan kimia Data berikut ini, yang diambil dari 20 kali pengiriman bahan kimia dalam drum drum-drum drum di sebuah gudang, menunjukkan banyaknya drum yang dikirimkan (X1), berat total kiriman (X2, dalam ratusan pon), dan lamanya waktu (dalam menit) untuk menangani kiriman (Y). i
1
2
3
4
5
6
7
8
9
Xi1
7
18
5
14
11
5
23
9
16
10 5
Xi2
5,11
16,72
3,20
7,03
10,98
4,04
22,07
7,03
10,62
4,76
Yi
58
152
41
93
101
38
203
78
117
44 20
i
11
12
13
14
15
16
17
18
19
Xi1
17
12
6
12
8
15
17
21
6
11
Xi2
11 02 11,02
9 51 9.51
3 79 3.79
6 45 6,45
4 60 4,60
13 86 13,86
13 03 13,03
15 21 15,21
3 64 3,64
9 57 9,57
Yi
121
112
50
82
48
127
140
155
39
90
24
Pertanyaan a) Misalkan model regresi linear berganda cocok digunakan, tuliskan persamaan regresi dugaannya. Bagaimana dugaan β1 dan β2 ditafsirkan dalam hal ini? b) Ujilah Ujil h apakah k h ada d hubungan h b regresii linear li antara t k d kedua peubah b h bebas dengan peubah tak bebas, gunakan taraf nyata 0,05. c)) Hitunglah g koefisien determinasi g ganda R2! Bagaimana g ukuran ini ditafsirkan dalam kasus ini? d) Ujilah β1=0 atau tidak, β2=0 atau tidak, α = 0,05. e) Buatlah B atlah selang kepercayaan kepe ca aan 95% secara seca a masing-masing masing masing untuk nt k β1 dan β2. Berikan maknanya. f)) Buatlah selang g kepercayaan p y secara serempak p 95% untuk β1 dan β2. Berikan maknanya.
25
Asumsi--asumsi dalam Regresi Linear Ganda Asumsi
Asumsi-asumsi dalam Regresi Linear Ganda
yMultikolinearitas yHeteroskedastisitas yNormalitas l yAutokorelasi A t k l i
Dosen Pengampu g p : Kismiantini Kismiantini,, M.Si M.Si..
1
2
Multikolinearitas
Kriteria terjadinya multikolinearitas
y Multikolinearitas atau kekolinearan ganda adalah terjadinya
Rule of Thumb
korelasi antar peubah bebas. y Model regresi yang baik seharusnya tidak terjadi korelasi
y Mempunyai nilai l VIF > 10
antar peubah bebas.
y Mempunyai angka TOLERANCE < 0,1
y Metode yang banyak digunakan untuk mendeteksi adanya
y TOLERANCE = 1/VIF.
multikolinearitas adalah faktor inflasi ragam (variance inflation factor/VIF) y Rumusnya
VIFk = (1 − Rk2 )−1 , k = 1,2,..., p − 1
y Rk2 adalah koefisien determinasi ganda bila Xk diregresikan
terhadap p-2 p 2 peubah lainnya lainn a di dalam model model.
3
4
Heteroskedastisitas
Normalitas
y Ragam galat diasumsikan konstan dari satu pengamatan ke
y Galat diasumsikan berdistribusi Normal. Normal
pengamatan lain, hal ini disebut homoskedastisitas.
y Model regresi yang baik adalah distribusi data normal atau
y JJika ragam g ggalat berbeda disebut heteroskedastisitas.
mendekati normal. normal
y Model regresi yang baik adalah tidak terjadi heteroskedastisitas.
y Untuk mendeteksi normalitas digunakan normal p-p plot.
y Untuk mendeteksi heteroskedastisitas adalah dengan membuat
y Jika Jik titik-titik i ik i ik ((sisaan) i ) menyebar b di sekitar ki garis i di diagonall ddan
plot nilai dugaan yang dibakukan (standardized predicted value) dengan sisaan yang dibakukan (studentized residual). y Jika ada pola tertentu (bergelombang, melebar kemudian menyempit) maka terjadi heteroskedastisitas. y Jika tidak ada pola jelas, serta titik-titik (sisaan) menyebar di atas dan di bawah angka 0 pada sumbuY, maka tidak terjadi h t heteroskedastisitas. k d ti it 5
ε i ~ N (0,σ 2 )
mengikuti arah garis diagonal, maka model regresi memenuhi asumsi normalitas. normalitas y Jika titik-titik (sisaan) menyebar jauh dari garis diagonal dan atau tidak mengikuti arah garis diagonal diagonal, maka model regresi tidak memenuhi asumsi normalitas. 6
Autokorelasi
Sifat-sifat Statistik Durbin Watson
y Bila dalam model regresi linear ganda ada korelasi antara galat
pada periode t dengan galat pada periode t-1, maka dinamakan aadaa masalah asa a auto autokorelasi. o e as . y Model regresi yang baik adalah model regresi yang bebas dari autokorelasi. y Autokorelasi sering ditemukan pada regresi yang datanya adalah time series atau berdasarkan waktu berkala seperti bulanan, tahunan. y Deteksi autokorelasi dengan menggunakan besaran Durbin n Watson (D-W) ( e − e )2 d= 7
∑ i =2
∑e i =1
2 i
8
Uji Durbin Watson
Uji Durbin Watson
Hipotesis: H0 : ρ = 0 (Tidak ada autokorelasi) H1 : ρ > 0 (Ad (Ada autokorelasi k l i positif) i if) Taraf nyata : α Statistik Uji : d Kriteria Keputusan: Jika d > dU maka terima H0 (tidak ada autokorelasi) JJika d < dL maka tolak H0 ((ada autokorelasi ppositif)) Jika dL ≤ d ≤ dU , maka uji tidak meyakinkan
Hipotesis: H0 : ρ = 0 (Tidak ada autokorelasi) H1 : ρ < 0 (Ad (Ada autokorelasi k l i negatif) if) Taraf nyata : α Statistik Uji : 4-d Kriteria Keputusan: Jika 4-d > dU maka terima H0 (tidak ada autokorelasi) JJika 4-d < dL maka tolak H0 ((ada autokorelasi negatif) g ) Jika dL ≤ 4-D ≤ dU , maka uji tidak meyakinkan
9
10
Uji Durbin Watson Hipotesis: H0 : ρ = 0 (Tidak ada autokorelasi) H1 : ρ ≠ 0 (Ada (Ad autokorelasi) k l i) Taraf nyata : 2α Statistik Uji : d Kriteria Keputusan: Jika d < dL atau 4-d < dL maka tolak H0 (ada autokorelasi) JJika d > dU dan 4-d > dU maka terima H0 ((tidak ada autokorelasi ) y Selain itu,, maka ujij dikatakan tidak meyakinkan 11
2 2.
i −1
i
n
Selalu 0 ≤ d ≤ 4 Jik sisaan Jika i tterurutt bberkorelasi k l i positif itif ,maka k d mendekati d k ti noll 3. Jika sisaan terurut berkorelasi negatif, maka d mendekati 4 sehingga hi 44-dd mendekati d k ti 0 4. Distribusi d simetrik pada nilai 2 1.
Data tentang pengiriman bahan kimia Data berikut ini, yang diambil dari 20 kali pengiriman bahan kimia dalam drum-drum drum drum di sebuah gudang, gudang menunjukkan banyaknya drum yang dikirimkan (X1), berat total kiriman (X2, dalam ratusan pon), dan lamanya waktu (dalam menit) untuk menangani kiriman (Y).
12
i
1
2
3
4
5
6
7
8
9
Xi1
7
18
5
14
11
5
23
9
16
10 5
Xi2
5,11
16,72
3,20
7,03
10,98
4,04
22,07
7,03
10,62
4,76
Yi
58
152
41
93
101
38
203
78
117
44 20
i
11
12
13
14
15
16
17
18
19
Xi1
17
12
6
12
8
15
17
21
6
11
Xi2
11,02
9,51
3,79
6,45
4,60
3,64
9,57
Yi
121
112
50
82
48
39
90
13,86 13,03 15,21 127
140
155
Model Summaryb Model 1
R .993a
R Square .987
Adjusted R Square .985
Std. Error of the Estimate 5.618
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
Model 1
Coefficientsa Unstandardized Coefficients B Std. Error 3 324 3.324 3 111 3.111 3.768 .614 5.080 .666
(Constant) X1 X2
Data tentang Rumah Sakit
DurbinWatson 1.813
Standardized Coefficients Beta
t 1.069 1 069 6.135 7.632
.451 .561
Sig. .300 300 .000 .000
Collinearity Statistics Tolerance VIF .142 .142
7.028 7.028
Direktur sebuah Rumah Sakit ingin g meneliti hubungan g antara kepuasan p pasien (Y) dengan umur pasien (X1, dalam tahun) keparahan penyakit yang diderita (X2, sebuah indeks) dan tingkat kecemasan (X3, suatu indeks). Secara acak diambil 23 pasien dan diperoleh data sbb. :
a. Dependent Variable: Y
Y
X1
X2
X3
Y
X1
X2
X3
48
50
51
2.3
47
38
55
2.2
57
13
14
51
2.3
66
40
48
2.2
57
53
54
2.2
70
41
36
41
46
1.8
2.3
66
51
36
34
49
2
89
28
43
1.8
79
33
56
2.5
36
49
54
2.9
88
29
46
1.9
46
42
50
2.2
60
33
49
2.1
54
45
48
2.4
49
55
51
2.4
26
52
62
2.9
77
29
52
2.3
77
29
50
2.1
52
44
58
2.9
89
29
48
2.4
60
43
50
2.3
67
43
53
2.4
Model Summaryb Model 1
R .820a
R Square q .673
Adjusted R Square q .622
Std. Error of the Estimate 10.281
DurbinWatson 2.017
Data Penjualan Roti Duta Makmur
a. Predictors: (Constant), X3, X1, X2 b. Dependent Variable: Y
y Daerah penjualan roti Duta Makmur meliputi Jakarta, Jakarta Jawa
Coefficientsa
Model 1
(Constant) X1 X2 X3
Unstandardized Coefficients B Std. Error 161.409 24.142 -1.225 1.225 .299 -.649 .782 -8.131 12.517
Standardized Coefficients Beta -.621 .621 -.182 -.148
t 6.686 -4.092 4.092 -.830 -.650
Sig. .000 .001 .417 .524
Barat, Jawa Tengah dan Jawa Timur
Collinearity Statistics Tolerance VIF .748 .357 .332
y Sales (peubah tak bebas) adalah tingkat penjualan roti semua
1.337 2.798 3.008
rasa (dalam unit/bulan)
a. Dependent Variable: Y
y Iklan_koran Iklan koran menyatakan iklan di koran (juta rupiah/bulan) y Iklan_radio menyatakan iklan di radio (juta rupiah/bulan) y Jumlah_outlet J lh l menyatakan k jjumlah l h outlet l perusahaan h untukk
setiap daerah seperti di pasar, supermaket, mall y Jumlah_salesman J lh l menyatakan k jumlah l h salesman l untukk setiap
daerah (orang) 15
16
Daerah Jakarta1 J k t 2 Jakarta2 Jakarta3 Jakarta4 Jakarta5 Jakarta6 Jakarta7 Jawa Barat1 Jawa Barat2 Jawa Barat3 J Jawa Barat4 B t4 Jawa Barat5 Jawa Barat6 Jawa Barat7 g Jawa Tengah1 Jawa Tengah2 Jawa Tengah3 Jawa Tengah4 Jawa Tengah5 Jawa Tengah6 Jawa Tengah7 Jawa Tengah8 Jawa Tengah9 Jawa Timur10 Jawa Timur11 Jawa Timur12 Jawa Timur13 Jawa Timur14 Jawa Timur15 Jawa Timur16
17
Sales 300.12 312 25 312.25 362.02 400.25 412.6 423 320.14 366.25 451.29 430.22 265 99 265.99 254.26 352.16 365.21 295.15 354.25 415.25 400.23 423.22 452 62 452.62 512.33 435.23 302.21 330.92 254.25 265.21 215.36 235.26 222 32 222.32 323.45
Iklan_koran Iklan_radio Jumlah_outlet Jumlah_salesman 26.23 12.23 7 4 25 12 25.12 12 88 12.88 8 3 29.8 15.26 8 2 34.55 14.23 9 1 33.45 13.02 6 4 32.26 13.56 5 2 23.45 12.03 8 3 34.76 15.26 9 3 40.12 14.32 8 2 36.21 13.33 10 5 25 89 25.89 12 05 12.05 11 4 22.98 15.26 10 1 36.25 12.89 9 5 36.87 12.45 8 5 22.41 13.44 5 2 26.25 13.67 6 2 36.99 19.25 8 5 32.79 18.78 9 2 33.98 16.59 7 2 23 21 23.21 18 45 18.45 5 3 44.98 13.45 8 5 35.99 15.78 8 3 25 16.35 9 2 23.25 19.58 8 5 24.86 13.87 6 6 26.23 15.87 5 5 20.98 13.23 7 4 24.88 15.69 9 3 25 87 25.87 18 97 18.97 8 6 28.94 18.29 9 5
Model Summaryb Model M d l 1
R RS Square .869a .755
Adjusted RS Square .716
Std. Error of the Estimate th E ti t 41.58129
DurbinWatson W t 1.592
a. Predictors: (Constant), Jumlah_salesman, Jumlah_outlet, Iklan_radio, Iklan_koran b. Dependent Variable: Sales
Model 1
(Constant) Iklan_koran Iklan_radio Jumlah_outlet Jumlah_salesman
a. Dependent Variable: Sales
18
Unstandardized Coefficients B Std. Error 100.128 71.407 10.913 1.279 4.966 3.316 -13.275 4.969 -13.988 5.263
Coefficientsa Standardized Coefficients Beta .869 .149 -.271 -.265
t 1.402 8.530 1.498 -2.672 -2.658
Sig. .173 .000 .147 .013 .014
Collinearity Statistics Tolerance VIF .942 .985 .955 .984
1.062 1.015 1.048 1.017
Soal Normal P-P Plot of Regression Standardized Residual
Dependent Variable: Y
Expected Cum Prob
1.0
0.8
0.6
0.4
0.2
0.0 0.0
0.2
0.4
0.6
0.8
1.0
Observed Cum Prob
Gambar 1
19
Gambar 2
Bagaimana mengenai pemenuhan asumsi asumsi-asumsi asumsi dalam model regresi linear ganda? Berikan penjelasannya. b)) Berdasarkan a)) apakah p inferensi dalam model regresi g linear ganda g dapat dilakukan? Berikan penjelasannya. a)
Gagasan Dasar (Jumlah Kuadrat Ekstra) Mengukur pengurangan JKG akibat dimasukkannya 1 atau lebih peubah bebas ke dalam model regresi, regresi jika diketahui peubahpeubah peubah lain telah ada di dalam model Mengukur kenaikan JKR akibat dimasukkannya 1 atau beberapa peubah bebas ke dalam model regresi
JUMLAH KUADRAT EKSTRA Dosen Pengampu : Kismiantini, M.Si.
1 2
Untuk mengetahui apakah yang dimaksud dengan Jumlah Kuadrat Ekstra, perhatikan tabel-tabel ANOVA berikut :
Kegunaan Jumlah Kuadrat Ekstra
a) Regresi Y terhadap X1 : Untuk menguji apakah peubah Xk dapat dibuang dari model regresi ganda dengan hipotesis
Sumber Keragaman
H0 : βk = 0 (Xk dapat dikeluarkan) H1 : βk ≠ 0 (Xk tidak dapat dikeluarkan)
JK
Yˆ = −1,496 + 0,8572 X 1 db
KT
Regresi
JKR(X1)=352,27
1
352,27
Galat
JKG(X1)=143,12 )=143 12
18
7 95 7,95
Total
495,39
19
b) Regresi Y terhadap X2 : Sumber Keragaman
JK
Yˆ = −23,634 + 0,8565 X 2 db
KT
Regresi
JKR(X2)=381,97
1
381,97
Galat
JKG(X2)=113,42
18
6,30
Total
495,39
19
3
4
c) Regresi ) R i Y terhadap X t h d X1 dan X d X2 : Yˆ = −19,174 + 0,2224 X 1 + 0,6594 X 2 Sumber Keragaman
JK
db
KT
Regresi
JKR(X1,X2)=385,44
2
192,72
Galat
JKG(X1,X2)=109,95
17
6,47
Total
495,39
19
Perhatikan bahwa JKG bila X1 dan X2 dalam model ditulis sebagai JKG(X1, X2)=109,95 lebih kecil dari JKG bila di dalam model hanya ada X1 saja yaitu JKG(X1)=143,12. Selisih kedua jumlah kuadrat yaitu JKG(X1)-JKG(X1,X2) disebut j l h kuadrat jumlah k d t ekstra k t dan d dilambangkan dil b k oleh l h JKR(X2|X1). )
d) Regresi Y terhadap X1 , X2 dan X3 : Yˆ = 117,08 + 4,334 X 1 − 2,857 X 2 − 2,186 X 3 Sumber Keragaman
JK
db
KT
Regresi
JKR(X1,X2,X3)=396,98
3
132,33
Galat
JKG(X1,X X2,X X3)=98,41 )=98 41
16
6 15 6,15
Total
495,39
19
JKR(X2|X1) mencerminkan pengurangan JKG bagi X2 bila X1 sudah ada di dalam model JKR(X2|X1) = JKG(X1)-JKG(X1,X2) JKR(X1|X2) = JKG(X2)-JKG(X1,X2) JKR(X2,X3|X1) = JKG(X1)-JKG(X1,X2,X3)
5
6
Definisi-definisi
Data Lemak Tubuh
JKR(X1|X2))=JKG(X JKG(X2))-JKG(X JKG(X1,X2) setara dengan JKR(X1|X2)=JKR(X1,X2)-JKR(X2) JKR(X2|X1)=JKG(X1)-JKG(X1,X2) setara dengan JKR(X2|X1)=JKR(X1,X X2)-JKR(X ) JKR(X1) Perluasan JKR(X3|X1,X2)=JKG(X1,X2) -JKG(X1,X2,X3) JKR(X3|X1,X X2)=JKR(X ) JKR(X1,X X2,X X3) -JKR(X JKR(X1,X X2) JKR(X2,X3|X1)=JKG(X1) -JKG(X1,X2,X3) JKR(X2,X3|X1)=JKR(X1,X2,X3) -JKR(X1)
i
X1
X2
X3
Y
i
X1
X2
X3
Y
1
19,5
43,1
29,1
11,9
11
31,1
56,6
30,0
25,4
2
24,7
49,8
28,2
22,8
12
30,4
56,7
28,3
27,2
3
30,7
51,9
37,0
18,7
13
18,7
46,5
23,0
11,7
4
29,8
54,3
31,1
20,1
14
19,7
44,2
28,6
17,8
5
19,1
42,2
30,9
12,9
15
14,6
42,7
21,3
12,8
6
25,6
53,9
23,7
21,7
16
29,5
54,4
30,1
23,9
7
31,4
58,5
27,6
27,1
17
27,7
55,3
25,7
22,6
8
27,9
52,1
30,6
25,4
18
30,2
58,6
24,6
25,4
9
22,1
49,9
23,2
21,3
19
22,7
48,2
27,1
14,8
10
25,5
53,5
24,8
19,3
20
25,2
51,0
27,5
21,1
X1 : Ketebalan Lipatan Kulit Trisep p p X2 : Lingkar Paha
X3 : Lingkar Lengan g g Y : Lemak Tubuh
7
Uji Apakah Semua βk = 0
Tabel ANOVA dengan Penguraian JKR Data Lemak Tubuh Sumber Keragaman
JK
db
KT
JKR(X1,X2,X3)=396,98
3
132,33
JKR(X1)=352,27 JKR(X2|X1)=33,17 JKR(X3|X1,X2)=11,54
1 1 1
352,27 33,17 11,54
Galat
JKG(X1,X2,X3)=98,41
16
6,15
Total
JKT=495,39
19
Regresi X1 X2|X1 X3|X1,X2
8
Hipotesis : H0 : β1 = β2 = … = βpp-11 = 0 H1 : Tidak semua βk (k=1, …, p-1) sama dengan nol Taraf nyata y :α Statistik Uji : JKR X 1 , L , X p −1 JKG X 1 , L , X p −1 KTR F= : = p −1 n− p KTG
(
)
(
)
Kriteria Keputusan : H0 ditolak jika Fhit > Fα(p-1,n-p)
Dari data Lemak Tubuh, Tubuh untuk mempelajari hubungan antara banyaknya lemak tubuh (Y) dengan ketebalan lipatan kulit intersep (X1), lingkar paha (X2) dan lingkar lengan (X3) yang didasarkan pada suatu contoh 20 perempuan sehat berusia 25-34 tahun. Diperoleh persamaan regresi dugaanya :
Yˆ = 117,08 + 4,334 X 1 − 2,857 X 2 − 2,186 X 3 9
Uji Apakah Satu βk = 0
Uji Apakah Beberapa βk = 0 Hipotesis : H0 : βq= βq+1 = …= βp-1= 0 H1 : Tidak semua βk di dalam H0 sama dengan nol Taraf nyata : α Statistik Uji : JKR X q , K , X p −1 X 1 , K , X q −1 JKG X 1 , K , X p −1 F= : p−q n− p
Hipotesis : H 0 : β k= 0 H 1 : β k≠ 0 Taraf nyata : α St ti tik Uji : Statistik
JKR(X k X 1 , L , X k −1 , X k +1 , L , X p −1 ) JKG (X 1 , L , X p −1 ) F= : 1 n− p =
10
KTR (X k X 1 , L , X k −1 , X k +1 , L , X p −1 )
=
KTG
Kriteria Keputusan : H0 ditolak jika Fhit > Fα(1,n-p)
(
)
(
)
KTR X q , K , X p −1 X 1 , K , X q −1
(
)
KTG
Kriteria Keputusan : H0 ditolak jika Fhit > Fα(p-q,n-p) 11
12
Dari Data Lemak Tubuh
Dari Data Lemak Tubuh
Ingin diketahui apakah lingkar lengan (X3) dapat dikeluarkan dari model regresi penuh.
Ingin diketahui apakah lingkar paha (X2) dan lingkar lengan (X3) dapat dikeluarkan dari model regresi penuh.
Hipotesis H0 : β3= 0 H1 : β3≠ 0 Taraf nyata : α = 0,05 0 05 JKR( X 3 X 1 , X 2 ) JKG ( X 1 , X 2 , X 3 ) Statistik Uji : F = :
=
Hipotesis: H0 : β2= β3 =0 H1 : Tidak benar bahwa β2 dan β3 keduanya sama dengan nol Taraf nyata : α = 0,01 Statistik Uji : F = JKR(X , X X ) : JKG( X , X , X )
n−4
1 KTR ( X 3 X 1 , X 2 )
2
KTG
Kriteria Keputusan : n = 20, p=4, F0,05(1,16)=4,49 H0 ditolak jika Fhit > 4,49 4 49 Hitungan : F=(11,54/1)/(98,41/16)=1,876 ( , / )/( , / ) , Kesimpulan : Karena Fhit=1,876<4,49 maka H0 diterima, artinya dengan taraf nyata 0 0,05 05 dapat disimpulkan bahwa lingkar lengan dapat dikeluarkan dari model regresi.
=
3
1
1
2
3
n−4
2 KTR ( X 2 , X 3 X 1 ) KTG
Kriteria Keputusan : n = 20, p=4, q=2, F0,01(2,16)=6,23 H0 ditolak jika Fhit > 6,23 Hitungan : F=(44,71/2)/(98,41/16)=3,63 Kesimpulan : Karena Fhit=3,63<6,23 maka H0 diterima, artinya dengan taraf nyata 0,01 dapat disimpulkan bahwa lingkar paha dan lingkar lengan dapat dikeluarkan dari model regresi yang di dalamnya terdapat ketebalan lipatan kulit trisep (X1). 13
Soal 1. Data Kesukaan terhadap merek i
Xi1
Xi2
Yi
1
4
2
64
2
4
4
73
3
4
2
61
4
4
4
76
5
6
2
72
6
6
4
80
7
6
2
71
8
6
4
83
ANOVAb Model 1
i
Xi1
Xi2
Yi
8
2
83
10
8
4
89
11
8
2
86
12
8
4
93
13
10
2
88
14
10
4
95
15
10
2
94
16
10
4
100
Sum of Squares 1872.700 94.300 1967.000
Regression Residual Total
df 2 13 15
Mean Square 936.350 7.254
F 129.083
Sig. .000a
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
Dalam suatu studi percobaan skala kecil tentang hubungan antara derajat kesukaan terhadap merek (Y) dengan kandungan uap air (X1) dan kemanisan produk (X2). Hasil sebagai berikut :
9
14
Coefficientsa
Model 1
a) Tentukan persamaan regresi dugaan! j p β1=β β2=0 b)) Ujilah apakah β atau tidak? c) Buatlah tabel ANOVA penguraian JKE untuk kedua peubah bebas! d) Ujilah apakah β2 = 0 atau tidak?
(Constant) X1 X2
Unstandardized Coefficients B Std. Error 37.650 2.996 4.425 .301 4.375 .673
Standardized Coefficients Beta
t 12.566 14.695 6.498
.892 .395
Sig. .000 .000 .000
95% Confidence Interval for B Lower Bound Upper Bound 31.177 44.123 3.774 5.076 2.920 5.830
a. Dependent Variable: Y
Coefficient Correlationsa Model 1
Correlations Covariances
X2 X1 X2 X1
X2 1 000 1.000 .000 .453 .000
X1 .000 000 1.000 .000 .091
a. Dependent Variable: Y
Model Summary Model 1
R R Square .976a .952
Adjusted R Square .945
Std. Error of the Estimate 2.693
a. Predictors: (Constant), X2, X1 15
16
Koefisien Determinasi Parsial
• Untuk mengukur sumbangan marjinal satu peubah bebas X, bila semua peubah bebas lain telah ada di dalam model. • Model od regresi g ganda ga da o ordo-pertama do p a a dg 2 p peubah uba b bebas ba Koefisien Determinasi Parsial Koefisien Korelasi Parsial
Yi = β 0 + β1 X i1 + β 2 X i 2 + ε i
• Maka koefisien determinasi parsial antara Y dan X model sudah ada X2 adalah rY21.2 =
1
bila dalam
JKR(X 1 X 2 ) JKG ( X 2 )
• Ukuran ini mengukur proporsi penurunan keragaman Y yang diakibatkan oleh dimasukkannya X1 dalam model yang sebelumnya sudah ada X2.
18
Data Lemak Tubuh
Lanjutan Koefisien Determinasi Parsial rY21.2 =
rY21.23 =
rY23.12 =
JKR( X 1 X 2 ) JKG ( X 2 )
JKR( X 1 X 2 , X 3 ) JKG ( X 2 , X 3 )
rY22.13 =
rY24.123 =
JKR( X 2 X 1 , X 3 )
rY22.1 =
JKG ( X 1 , X 3 )
JKR( X 2 X 1 ) JKG ( X 1 )
=
33,17 = 0,232 143,12
Artinya : Jika X2 dimasukkan ke dalam model regresi yang di dalamnya sudah ada X1 maka JKG akan berkurang 23,2%.
JKR( X 4 X 1 , X 2 , X 3 ) JKG ( X 1 , X 2 , X 3 )
JKR( X 3 X 1 , X 2 )
11,54 = = 0,105 JKG ( X 1 , X 2 ) 109,95 A ti Artinya : Jik Jika X3 dimasukkan di kk kke d dalam l model d l regresii yang di d dalamnya l sudah ada X1 dan X2 maka JKG akan berkurang 10,5%. rY23.12 =
JKR( X 3 X 1 , X 2 ) JKG ( X 1 , X 2 )
JKR( X 1 X 2 )
3,47 = = 0,031 JKG ( X 2 ) 113,42 Artinya : Jika X1 dimasukkan ke dalam model regresi yang di dalamnya sudah ada X2 maka JKG akan berkurang g 3,1%. , rY21.2 =
19
Koefisien Korelasi Parsial
20
Koefisien Regresi Tidak Dapat Dibandingkan
Koefisien korelasi parsial merupakan akar kuadrat koefisien d determinasi i i parsial. i l
• Biasanya koefisien regresi tidak dapat dibandingkan karena satuannya berbeda. • Misalkan a a d diketahui a u p persamaan a aa regresi g dugaan dugaa • Seseorang mungkin menyimpulkan bahwa X adalah satu satu-
Koefisien ini mempunyai tanda yang sama dengan koefisien regresi padanannya di dalam fungsi regresi dugaannya.
Yˆ = 200 + 20000 X 1 + 0,2 X 2
1
Untuk data lemak tubuh : rY 2.1 = 0,232 = 0,482 rY 3.12 = − 0,105 = −0,324 rY 1.2 = 0,031 = 0,176 b2 = 0,6594
b3 = −2,186
•
b1 = 0,2224
satunya peubah bebas yang terpenting daripada X2 sebab g y X2 hanya y berpengaruh p g kecil dilihat dari koefisien regresinya terhadap peubah tak bebas Y. Hal tersebut tidak selalu benar Misalkan satuan-satuannya adalah Y: dalam dolar, X1: dalam ribuan dolar, X2: dalam sen dolar. Dalam hal ini pengaruh terhadap nilai dugaan Y akibat kenaikan X1 sebesar $1000 bila X2 konstan, k t akan k sama persis i sama dengan d pengaruh h akibat kib t kenaikan X2 sebesar $1000 bila X1 konstan.
21
Soal 2 Telah diambil secara acak 25 mahasiswa untuk suatu penelitian tentang tingkat kecerdasan IQ (X1), nilai ujian tengah semester (X2), nilai ujian akhir khi semester t (X3) terhadap t h d nilai il i hasil h il akhir khi suatu t mata t kuliah k li h (Y). (Y) Berikut beberapa output yang diperoleh :
a) Apakah peubah tingkat kecerdasan IQ dapat dikeluarkan dari model? Gunakan α = 0,05. 2 b) Tentukan koefisien determinasi parsial rY 1.23 beserta maknanya.
22
Soal 3 Seorang guru ingin mengetahui S h hubungan h b antara skor k matematika k siswa (Y) dengan skor logika siswa (X1) dan skor verbal siswa (X2), yang diukur dalam skala 1 1-10 10. Untuk keperluan tersebut, tersebut telah dipilih secara acak 20 siswa dari suatu sekolah menengah pertama negeri. Beberapa output berdasarkan data yang diperoleh sebagai berikut:
a) Tentukan persamaan regresi Y atas X1, Y atas X2 dan Y atas X1, X2. Berikan makna untuk masing-masing persamaan. b) Apakah peubah skor logika siswa dapat dikeluarkan dari model? Gunakan α α=0 0,05. 05 c) Tentukan koefisien determinasi parsial rY21.2 beserta maknanya.
UJI F UNTUK KECOCOKAN MODEL REGRESI LINEAR GANDA
• Uji ini mengasumsikan bahwa pengamatan-pengamatan Y untuk
suatu X tertentu bersifat bebas, tersebar normal, memiliki ragam yang sama.
ANALISIS VARIANSI
• Uji ini menghendaki adanya pengamatan berulang pada satu atau l b h nilai lebih l X.
UJI F UNTUK KECOCOKAN MODEL REGRESI LINEAR GANDA
Bagaimana uji kecocokan model regresi linear ganda dilakukan bila tidak ada pengamatan berulang pada nilai X? Berikan penjelasan.
1
2
Formula Hipotesis
Jumlah Kuadrat Ketidakcocokan Model (JKKM)
Hipotesis H0 : E{Y} = β0+ β1X1+ β2X2 + …+ βp-1Xp-1 H1 : E{Y} ≠ β0+ β1X1 + β2X2 + …+ βp-1Xp-1 Atau H0 : Tidak ada ketidakcocokan model regresi linear ganda dengan data H1 : Ada ketidakcocokan model regresi linear ganda dengan data Atau H0 : Model M d l regresii linear li ganda d cocokk H1 : Model regresi linear ganda tidak cocok
JKG = JKGM + JKKM Perhatikan :
Yij − Yˆij = Yij − Y j + Y j − Yˆij
Simpangan galat g
∑∑ (Y
ij
Simpangan g galat murni
) = ∑∑ (Y 2
− Yˆij
)
2
JKKM
4
Data kesukaan terhadap merk
Statistik Uj S Uji KTKM JKKM (k − p ) = KTGM JKGM (n − k )
+
JKGM
3
F=
(
− Y j ) + ∑∑ Y j − Yˆij 2
ij
JKG =
Simpangan ketidakcocokan model d l
JKGM = ∑∑ (Yij − Y j )
2
JKG = Y ' Y − b' X ' Y
JKKM = JKG − JKGM db(G) = n − p; db(GM) = n − k; db(KM) = k − p
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Xi1
4
4
4
4
6
6
6
6
8
8
8
8
10
10
10
10
Xi2
2
4
2
4
2
4
2
4
2
4
2
4
2
4
2
4
Yi
64
73
61
76
72
80
71
83
83
89
86
93
88
95
94
100
Xi1
Xi2 4
Yij 2
64; 61
4
4
73; 76
6
2
72; 71
6
4
80; 83
8
2
8
4
10
2
10
4
ΣXi1Yi=
⎯Y Yj
, ΣXi2Yi =
Y : derajat d j t kkesukaan k tterhadap h d merk k X1 : kandungan uap air X2 : kemanisan produk k = 8, 8 JKG = 94,3 94 3 Ujilah ketidakcocokan model regresi linear ganda dengan taraf nyata 0,01! 0 01!
, ΣXi1=
,ΣXi2 =
The regression equation is Ŷ = 37,650 + 4,425 X1 + 4,375 X2 5
6
, ΣYi =
, ΣYi2=
Hipotesis H0 : E{Y} { } = β0+ β1X1+ β2X2 H1 : E{Y} ≠ β0+ β1X1+β2X2 Taraf nyata : α = 0,05 Statistik Uji: F=KTKM/KTGM Kriteria keputusan : n 16 k n=16, k=8, 8 db(KM) db(KM)=k-p=8-3=5 k p 8 3 5 ,db(GM)=n-k=16-8=8 db(GM) n k 16 8 8 F0,05(5,8)= 3,69 H0 ditolak jika Fhit > Hitungan : JKG =
JJKGM=(-) ( )2+(-) ( )2+(-) ( )2+(-) ( )2+(-) ( )2+(-) ( )2+(-) ( )2+(-) ( )2+(-) ( )2+(-) ( )2+(-) ( )2= J JKKM=JKG-JKGM= J J F=(/5)/(/)= Kesimpulan : Karena Fhit= ………………….. Jadi dengan taraf nyata 0 0,05 05 dapat disimpulkan bahwa model regresi linear ……………... 7
Perhatikan gambar berikut
REGRESI POLINOMIAL KUADRATIK Dosen Pengampu : Kismiantini Kismiantini,, M.Si M.Si..
β2 < 0
β2 > 0
1
Regresi Kuadratik Regresi kuadratik termasuk dalam regresi non linear yang menyatakan hubungan antara dua peubah yang terdiri dari peubah tak bebas (Y) dan peubah bebas (X) sehingga akan diperoleh suatu kurva yang membentuk garis lengkung menaik (β2 > 0) atau menurun (β2 < 0). Bentuk persamaan matematis model kuadratik secara umum p menurut Steel & Torrie (1980) adalah : a. Polinomial : E(Y) = β0+β1X+β2X2 b. Eksponensial : E(Y) = β0β1X c. Logaritma g : Log g E(Y) ( )=β β’0β β’1X
Model Regresi Polinomial Kuadratik iid
(
Y = β 0 + β1 X + β 2 X 2 + ε , ε ~ N 0, σ 2
)
P Persamaan regresii dugaannya d
Yˆ = b0 + b1 X + b2 X 2
4
Untuk memudahkan perhitungan dan mengatasi kekolinearan ganda ( d korelasi (ada k l i antara t X dan d X2) digunakan di k nilai il i simpangan i d t data terhadap rata-ratanya
Persamaan Normal nbb0' + b1' ∑ xi + b2' ∑ xi2 = ∑ Yi
x=X −X
Persamaan regresi dugaan :
b0' ∑ xi + b1' ∑ xi2 + b2' ∑ xi3 = ∑ xi Yi
Yˆ = b0 + b1 X + b2 X 2
Dengan data x diperoleh : Yˆ = b + b x + b x ' 0
2 Yˆ = b0' + b1' (X − X ) + b2' (X − X )
(
' 1
' 2
2
b0' ∑ xi2 + b1' ∑ xi3 + b2' ∑ xi4 = ∑ xi2Yi
∑x
)
= b0' − b1' X + b2' X 2 + b1' − 2b2' X X + b2' X 2
=0
i Karena maka k persamaan normalnya menjadi sbb :
Sehingga :
nb0' + b2' ∑ xi2 = ∑ Yi
b0 = b0' − b1' X + b2' X 2
b1' ∑ xi2 + b2' ∑ xi3 = ∑ xiYi
b1 = b1' − 2b2' X
b0' ∑ xi2 + b1' ∑ xi3 + b2' ∑ xi4 = ∑ xi2Yi
b2 = b2' 5
6
Data Volume Penjualan Kopi di Kafetaria Kafetaria (i) 1
Banyaknya Dispenser (Xi) 0
Volume Penjualan (ratusan galon) Yi 508 1 508,1
2
0
498,4
3
1
568,2
4
1
577,3
5
2
651,7
6
2
657,0
7
3
, 713,4
8
3
697,5
9
4
755,3 ,
10
4
758,9
11
5
787,6
12
5
792,1
13
6
841,4
14
6
831,8
a. Tentukan koefisien k l i antara korelasi t X dengan X2. b. Lakukan transformasi
x=X−X c. Hitunglah koefisien korelasi antara x dengan x2. d Apa yang dapat d. disimpulkan dari hasil a dan c? e. Tentukan T t k persamaan regresi polinomial kuadratik dugaan.
Jawab : Yi 508.1 508 1 498.4 568.2 577.3 651.7 657 713.4 697.5 755.3 758.9 787 6 787.6 792.1 841.4 831.8
xi Xi^2 xi^2 -3 3 0 9 -3 0 9 -2 1 4 -2 1 4 -1 4 1 -1 1 4 1 0 9 0 0 9 0 1 16 1 1 16 1 2 25 4 2 25 4 3 36 9 3 36 9
Correlations: X,
Correlations: x, x2 Pearson correlation of x and x2 = 0,000 P-Value = 1,000 Scatterplot of Y vs X 850 800 750
St ti tik Uji : F = (JKR( Statistik (JKR(x2|x)/1)/(JKG(x,x | )/1)/(JKG( 2)/(n-p)) )/( )) = KTR(x2|x)/KTG(x,x2) Kriteria Keputusan : H0 ditolak jika Fhit > Fα (1,n-p)
700 650 600 550 500 0
The regression equation is Ŷ = 705,5 + 54,89 x – 4,249 x2
Hipotesis : H0 : β 2 = 0 H1 : β 2 ≠ 0 Taraf Nyata : α St ti tik Uji : t = b2/s{b / {b2} Statistik Kriteria Keputusan : H0 ditolak jika |thit| > tα/2(n-p)
Pearson correlation of X and X2 = 0,961 P-Value = 0,000
Y
Xi 0 0 1 1 2 2 3 3 4 4 5 5 6 6
Uji j Apakah p β2 Sama dengan g Nol
(Menyelidiki apakah suku kuadratik dapat dibuang dari model)
X2
1
2
3 X
4
5
6
(
)
JKG x, x 2 = ∑ Yi 2 − b0′ ∑Yi − b1′ ∑ xi Yi − b2′ ∑ xi2Yi
The regression equation is Ŷ = 502,6 + 80,39 X – 4,249 X2 9
Analisis Ragam
Koefisien Regresi Koefisien Regresi
Koefisien Regresi Dugaan
Simpangan Baku Dugaan
thit
β0
705,474
3,208
219,91
β1
54,893 54 893
1,050 1 050
52,28 52 28
β2
-4,249
0,606
-7,01
M t ik s2{b} Matriks
SV
JK
db
KT
Regresi R i
171773
2
85887
x x2|x
168741 3033
1 1
168741 3033
Galat
679
11
61,7
Total
172453
13
0 − 1,4702⎤ ⎡10,2912 ⎢ 0 1 , 1026 0 ⎥⎥ ⎢ 0 0,3675 ⎦⎥ ⎣⎢− 1,4702
( )
s 2 {b} = KTG x x '
−1
Fitted Line Plot
S R-Sq R-Sq(adj)
800
7.85795 99.6% 99.5%
750 700 Y
⎡ s 2 {b0 } s{b0 , b1 } s{b0 , b2 }⎤ ⎢ ⎥ s {b} = ⎢ s{b1 , b0 } s 2 {b1 } s{b1 , b2 }⎥ 2 ⎢ s{b2 , b0 } s{b2 , b1 } s {b2 } ⎥ ⎣ ⎦ 2
Hipotesis : H0 : β2 = 0 H1 : β2 ≠ 0 Taraf Nyata : α = 0,05 Statistik Uji : t = b2/s{b2} Kriteria Keputusan : t0,025(11) = 2,201 H0 ditolak jika |thit| > 2,201 Hitungan : thit = -4,249/0,606 = -7,012 Kesimpulan : Karena |thit| = 7,012 > 2,201 maka H0 ditolak. β2 ≠ 0. Jadi dengan taraf nyata 0,05 dapat disimpulkan bahwa pengaruh g ada,, sehingga gg suku kuadratik harus kuadratik memang dipertahankan di dalam model.
Y = 705.5 + 54.89 xi - 4.249 xi**2 850
10
650 600
Hitungan: F = 3033/61,7 = 49,2 Kriteria Keputusan : F0,05(1,11) = 4,84 H0 ditolak d l k jika k Fhit > 4,84 (thit)2 = (-7,012)2 = 49,2 = Fhit
550 500 -3 3
-2 2
-1 1
0 xi
1
2
3
11
12
Koefisien Determinasi Ganda
Uji Kecocokan Model Regresi Polinomial Kuadratik Hipotesis H0 : E{Y} = β0+β1x+β2x2 (model regresi polinomial kuadratik cocok digunakan) H1 : E{Y} ≠ β0+ β1x+β2x2 (model ( d l regresii polinomial li i lk kuadratik d ik tidak id k cocok k di digunakan) k )
R2 = JKR(x,x2)/JKT = 171773/172453 = 0,996 Artinya keragaman volume penjualan kopi bisa diturunkan p 99,6% , bila hubungan g polinomial kuadratik terhadap p p sampai banyaknya mesin dispenser dimasukkan ke dalam model.
Taraf nyata : α Statistik Uji:
(
F=
k ⎛ ni 2⎞ JKGM = ∑ ⎜⎜ ∑ (Yij − Y j ) ⎟⎟ j =1 ⎝ i =1 ⎠
JKKM /(k − p ) JKGM /( n − k )
)
JKG x, x 2 = ∑ Yi 2 − b0′ ∑Yi − b1′ ∑ xi Yi − b2′ ∑ xi2Yi
(
)
JKKM = JKG x, x 2 − JKGM Kriteria keputusan p : k = banyaknya y y xy yang g berbeda,, p = banyaknya parameter H0 ditolak jika Fhit > Fα(k-p, n-k)
13
14
Soal 2
Soal 1 Data Studi Efisiensi Bahan Bakar Keefektifan suatu persneling baru dalam menurunkan konsumsi b h bakar. bahan b k Xi : kecepatan konstan (dalam km per jam) Yi : km per liter yang diperoleh
Suatu penelitian ingin menyelidiki apakah ada hubungan kuadratik antara berat larva (X) dengan banyaknya oksigen yang dikonsumsi (Y). Data yang diperoleh sebagai berikut:
i
1
2
3
4
5
6
7
8
9
10
11
12
Xi
35
35
40
40
45
45
50
50
55
55
60
60
Yi
22
20
28
31
37
38
41
39
34
37
27
30
a. Buatlah diagram pencar antara X dan Y! Apa yang diketahui dari diagram tsb? b. Tentukan koefisien korelasi antara X dengan X2. c. Bila diperlukan, lakukan transformasi terhadap X. d Apakah model regresi kuadratik cocok digunakan? d. Gunakan α = 0,05
X
Y
X
0,519
0,610
0,114
0,477
Y
0,033
X
0,744
Y
0,140
X
0,855
Y
0,053
0,482
0,137
0,551
0,049
0,711
0,204
0,932
0 190 0,190
0 516 0,516
0 230 0,230
0 588 0,588
0 210 0,210
0 927 0,927
0 265 0,265
0 914 0,914
0,210
0,561
0,240
0,561
0,215
0,914
0,346
0,973
0,260
0,580
0,470
0,718
0,462
1,000
0,544
0,800
0,389
0,674
0,521
0,754
0,468
0,998
0,004
0,654
a. Buatlah tabel Anava untuk regresi polinomial kuadratik b Tentukan b. T t k persamaan regresii polinomial li i l kuadratik k d tik d dugaan c. Apakah model regresi polinomial kuadratik cocok digunakan? 15
Soal 4
Soal 3
Suatu penelitian telah dilakukan untuk mengetahui hubungan antara tentang tes kemampuan bahasa (X) dan nilai karya ilmiah (Y) dari 10 siswa kelas I SMA. Diduga bahwa model regresi polinomial kuadratik cocok digunakan. Diketahui:
Untuk mengetahui hubungan antara pengeluaran untuk promosi (X, dalam ribuan dolar) dan permintaan akan produk perusahaan (Y, (Y dalam ribuan dolar) di suatu daerah telah dilakukan penelitian dan p data sbb : diperoleh i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Xi
17
15
25
10
18
15
20
25
17
13
20
23
25
16
Yi
56, 15
54, 50
55, 27
52, 56, 55, 54 23 97
55, 55
54, 32
55, 14
54, 28
55, 55, 78 65
54, 96
55, 06
− 0,006212 − 0,002259⎤ 0,0032523 0,0001725 ⎥⎥ ⎢⎣− 0,002259 0,0001725 0,0000627 ⎥⎦ ⎡ 0,1813176
(x′x )−1 = ⎢⎢− 0,006212 ∑Y
i
a. Gambarkan diagram pencarnya pencarnya!! b. Tentukan persamaan regresi kuadratik dugaan! dugaan! c. Ujilah ketidakcocokan model regresi kuadratik! kuadratik! Gunakan α = 0,05
= 458, ∑ Yi 2 = 21604, ∑ xiYi = 304, ∑ xi2Yi = 17252 , ∑ xi2 = 360, ∑ xi4 = 31620
a) Tentukan persamaan regresi polinomial kuadratik dugaan. b) Tentukan koefisien determinasi ganda dan berikan maknanya. c) Apakah suku kuadratik dapat dibuang dari model? Gunakan α = 0,05. 0 05 17
MODEL REGRESI POLINOMIAL ORDE KEDUA
Y = β 0 + β1 x1 + β 2 x 2 + β11 x12 + β 22 x 22 + β 12 x1 x 2 + ε REGRESI POLINOMIAL DUA PEUBAH BEBAS, ORDO KEDUA
E{Y } = β 0 + β1 x1 + β 2 x 2 + β11 x12 + β 22 x 22 + β12 x1 x 2
Y = β 0 + β 1 x1 + β 2 x 2 + β11 x12 + β 22 x 22 + β12 x1 x 2 + ε
ε ~ N (0, σ 2 ) iid
1
Apakah model regresi polinomial orde kedua cocok digunakan? 2
x1 =
CONTOH
X 1 − X 1 X 1 − 1,0 = 0,4 0,4
x2 =
X 2 − X 2 X 2 − 20 = 10 10
i
X1
X2
x1
x2
Y
Yj
1 2 3 4 5 6 7 8 9 10 11
0,6 1,0 1,4 0,6 1,0 1,0 1,0 1,4 06 0,6 1,0 1,4
10 10 10 20 20 20 20 20 30 30 30
-1 0 1 -1 0 0 0 1 -1 1 0 1
-1 -1 -1 0 0 0 0 0 1 1 1
150 86 49 288 157 131 184 109 279 235 224
150 86 49 288
X 1 = 1,0
X 2 = 20
UJI KECOCOKAN MODEL REGRESI POLINOMIAL ORDE KEDUA Hi t i Hipotesis H0 : E{Y} = β0+β1x1+β2x2+β11x12+β22x22+β12x1x2(model regresi polinomial orde kedua cocok digunakan) H1 : E{Y} ≠ β0+β1x1+β2x2+β11x12+β22x22+β12x1x2 (model regresi polinomial orde kedua tidak cocok digunakan) Taraf nyata : α Statistik Uji:
157,33
F=
109 279 235 224
JKKM /(k − p ) JKGM /(n − k )
k ⎛ ni 2⎞ JKGM = ∑ ⎜⎜ ∑ (Yij − Y j ) ⎟⎟ j =1 ⎝ i =1 ⎠
JKKM = JKG − JKGM
3
Kriteria keputusan : k = banyaknya x yang berbeda, p = banyaknya parameter H0 ditolak jika Fhit h > Fα(k-p, (k n-k) k)
4
ANOVAb Model 1
Regression Residual Total
Sum of Squares 55365.561 5240.439 60606.000
df 5 5 10
Mean Square 11073.112 1048.088
F 10.565
Sig. .011a
a. Predictors: (Constant), x1x2, x2kuadrat, x2, x1, x1kuadrat b. Dependent Variable: Y
JKGM=(157-157,33)2+(131-157,33)2+(184-157,33)2=1404,676 JKKM=JKG-JKGM=5240-1404,67=3835,33 db1 = k-p = 9-6 = 3 db2 = n-k = 11-9 = 2 F0,05(3,2)=19,2, 19 2 H0 ditolak dit l k jika jik Fhit > 19,2 19 2
ANOVAb Model 1
Regression Residual Total
Sum of Squares 55365 561 55365.561 5240.439 60606.000
df 5 5 10
Mean Square 11073 112 11073.112 1048.088
a. Predictors: (Constant), x1x2, x2kuadrat, x2, x1, x1kuadrat b. Dependent Variable: Y
F 10 565 10.565
Fhit=(3835,33/3)/(1404,675/2)=1,82
Sig. .011 011a
Karena Fhit=1 1,82<19,2 82<19 2 maka H0 diterima. diterima 5
Jadi dengan taraf nyata 0,05 dapat disimpulkan bahwa model regresi polinomial orde kedua cocok digunakan.
6
SOAL |
Dalam suatu studi percobaan skala kecil tentang hubungan antara derajat kesukaan terhadap merek (Y) dengan kandungan uap air (X1) dan kemanisan produk (X2). Hasil sebagai berikut :
Hipotesis: H0 : β12 = 0 H1: β12 ≠ 0 | Taraf nyata: α | Statistik Uji: |
i 1 2 3 4 5 6 Xi1 4 4 4 4 6 6 Xi2 2 4 2 4 2 4 Yi 64 73 61 76 72 80 |
7 8 9 10 11 12 13 14 15 16 6 6 8 8 8 8 10 10 10 10 2 4 2 4 2 4 2 4 2 4 71 83 83 89 86 93 88 95 94 100
Berdasarkan data ini, ujilah apakah model regresi polinomial ordo kedua cocok digunakan! Gunakan taraf nyata α = 0,05, JKG = 72,05.
| 7
Hipotesis: H0 : β22 = 0 H1: β22 ≠ 0 | Taraf nyata: α | Statistik Uji:
F=
(
) ) (n − p )
JKR x1 x2 x1 , x2 , x12 , x22 1
(
JKG x1 , x2 , x12 , x22 , x1 x2
Kriteria Keputusan H0 ditolak jika Fhit > Fα(1, n-p)
8
|
F=
|
|
(
)
JKR x22 x1 , x2 , x12 1
(
JKG x1 , x2 , x12 , x22
Kriteria Keputusan H0 ditolak jika Fhit > Fα(1, n-p)
) (n − p )
F=
Y = β 0 + β1 x1 + β 2 x2 + β11 x12 + ε Bagaimana untuk uji β11 = 0 atau tidak?
Hipotesis: H0 : β11 = β22 = β12 = 0 H1 : tidak semua βk (k = 11, 22, 12) dalam H0 sama dengan nol Taraf nyata : α Statistik Uji : JKR (x12 , x22 , x1 x2 x1 , x2 ) 3
9
11
(
JKG x1 , x2 , x12 , x22 , x1 x2
Kriteria Keputusan H0 ditolak jika Fhit > Fα(3, n-p)
) (n − p )
10
Latar Belakang • Ingin membandingkan prestasi belajar murid perempuan dan laki-laki • Ingin meneliti bagaimana pengaruh jenis makanan terhadap berat ayam y • Jenis kelamin dan jenis makanan merupakan peubah yang sifatnya klasifikasi • Semua peubah dalam regresi bersifat kuantitatif maka peubah kualitatif dijadikan kuantitatif agar regresi dapat digunakan
DUMMY VARIABLE ((Peubah Boneka)) Dosen Pengampu : Kismiantini Kismiantini,, M.Si M.Si..
1
2
Perhatikan kasus berikut • Dua kelompok murid yang mempunyai tingkat inteligensi yang kira-kira sama diberikan dua metode mengajar yang b b d Kelompok berbeda. K l k pertama t dib i metode diberi t d yang biasa bi sedangkan yang kedua diberikan metode yang modern. Kelompok I
Kelompok II
i
Y
X
i
Y
X
1 2 3 4 5 6 7 8 9 10
81 69 51 59 56 78 53 65 53 57
103 104 92 100 98 105 99 102 101 99
11 12 13 14 15 16 17 18
92 84 76 72 60 81 72 52
105 106 103 98 92 101 101 92
Y : nilai hasil ujian akhir X : skor IQ
• Bila regresi linear sederhana antara X dan Y digunakan, diperoleh persamaan regresi dugaannya : Ŷ = -145,5578 + 2,1272 X • dengan R2 = 53,70%
• Apa yang salah dalam hal ini ini? ?
3
4
Tabel diatas dapat disajikan sebagai berikut No
Y
X1
X2
1
81
0
103
2
69
0
104
3
51
0
92
4
59
0
100
5
56
0
98
6
78
0
105
7
53
0
99
8
65
0
102 0
9
53
0
101
10
57
0
99
11
92
1
105
12
84
1
106
13
76
1
103
14
72
1
98
15
60
1
92
16
81
1
101
17
72
1
101
18
52
1
92
dengan
p I ⎧0 bila murid masuk kelompok X1 = ⎨ ⎩1 bila murid masuk kelompok II Sehingga diperoleh persamaan regresi sebagai berikut : Ŷ = -160,5817 + 12,6466 X1 + 2,2212 X2 dengan R2 = 79,25%. Terlihat bahwa kecocokan model 2 lebih baik dari model 1, R2 naik sekitar 25,55%. (Keterangan model 1 adalah model regresi linear sederhana, model 2 adalah model regresi linear ganda dengan dua peubah bebas). Untuk kelompok I, masukkan X1 = 0, maka diperoleh : Ŷ = -160,5817 + 2,2212 X2 Untuk kelompok II, masukkan X1 = 1, maka diperoleh : Ŷ = -147,9351 + 2,2212 X2
5
Dari gambar tersebut dapat diketahui bahwa metode yang modern terlihat jauh lebih baik atau efektif d l dalam meningkatkan i k tk prestasi t i belajar b l j murid. id 6
Persamaan Normal (2 peubah bebas)
Misalkan ada tiga metode mengajar yang ingin dibandingkan maka diperlukan dua peubah boneka sebagai berikut :
b0 n + b1 ∑ X i1 + b2 ∑ X i 2 = ∑ Yi
b0 ∑ X i1 + b1 ∑ X i21 + b2 ∑ X i1 X i 2 = ∑ X i1Yi
⎧0 bila murid masuk kelompok I atau III X1 = ⎨ ⎩1 bila murid masuk kelompok II
b0 ∑ X i 2 + b1 ∑ X i1 X i 2 + b2 ∑ X i22 = ∑ X i 2Yi
Koefisien Determinasi Ganda ⎧0 bila murid masuk kelompok I atau II X2 = ⎨ ⎩1 bila murid masuk kelompok III
R2 = JKR/JKT = 1- (JKG/JKT) ⎛1⎞ JKT = Y ' Y − ⎜ ⎟Y ' J Y ⎝n⎠
JKG = Y ' Y − b' X ' Y 7
Sehingga misalkan ada 30 murid yang terbagi dalam tiga kelompok tiap kelompok terdiri atas 10 murid kelompok, murid. Maka nilai X1 dan X2 yang mungkin terbentuk sebagai berikut Kelompok p
i
X1
X2
I
1 2 . . . 10
0 0 . . . 0
0 0 . . . 0
II
11 12 . . . 20
1 1 . . . 1
0 0 . . . 0
III
21 22 . . . 30
0 0 . . . 0
1 1 . . . 1
9
perempuan mempunyai nilai ujian matematika tahun pertama di suatu universitas dan nilai matematika pada rapor kelas 3 SMA sebagai berikut : Jenis kelamin
Nilai Matematika Ujian
Rapor
1
L
3
7
2
L
2
8
3
L
4
9
4
L
3
6
5
L
1
7
6
L
2
8
7
P
3
7
8
P
2
6
9
P
2
8
10
P
3
5
11
P
0
9
Soal 1: Suatu penelitian telah dilakukan untuk mengetahui adanya p perbedaan penggajian p gg j ((diskriminasi)) terhadap p karyawan y wanita dan p pria di suatu perusahaan. Karyawan yang diteliti adalah yang memiliki tingkat pendidikan yang sama. Pria
Soal 2: Enam mahasiswa laki-laki dan lima mahasiswa
i
8
a. Tentukan persamaan regresi dugaan yang sesuai untuk permasalahan tsb. tsb b. Buat gambar garis regresi untuk masing-masing jenis kelamin mahasiswa. Apa yang dapat disimpulkan.
Wanita
i
Gaji (dalam ratusan ribu per minggu)
Lama Bekerja (tahun)
1 2 3 4 5 6 7 8 9 10 11
28 28 28 21 28 29 33 36 39 39 43
1 2 4 6 6 8 15 20 25 24 30
i
Gaji (dalam ratusan ribu per minggu)
Lama Bekerja (tahun)
12 13 14 15 16 17 18 19 20 21
20 24 21 28 23 25 23 21 25 26
1 3 4 6 9 11 17 19 23 28
a. Tentukan p persamaan regresi g dugaan g yang y g sesuai untuk p permasalahan tsb. b. Buat gambar garis regresi untuk masing-masing jenis kelamin karyawan. Apa 10 yang dapat disimpulkan.
Soal 3 Berikut B ik adalah d l h data d sampell tentang hubungan h b antara lama l b l j belajar (dalam jam per minggu) terhadap nilai akhir ujian suatu mata g terdiri dari enam mahasiswa lakikuliah dari 12 mahasiswa yyang laki (L) dan enam mahasiswa perempuan (P). Pengamatan Lama belajar Nilai akhir ujian Jeniss kelamin Je ea
1 4 9 L
2 3 7 L
3 3 8 L
4 9 10 L
5 5 7 L
6 2 7 L
7 6 9 P
8 5 8 P
9 6 8 P
10 4 6 P
11 8 10 P
12 5 6 P
a)Tentukan persamaan regresi dugaan yang sesuai untuk permasalahan tersebut. p b)Buat gambar garis regresi untuk masing-masing jenis kelamin mahasiswa. Apa yang dapat disimpulkan. 11
12
Alasan jika ada k kategori maka ada k-1 peubah boneka
Yan, X. & Su, X.G. 2009.Linear regression analysis : theory and computing. New Jersey: World Scientific Publishing. Publishing 13
REGRESI NON LINEAR
2 1
Model Kuadratik
Model Kubik
2 Persamaan regresi dugaan : Yˆ = b0 + b1 X + b2 X
Persamaan regresi dugaan : Persamaan normal :
Persamaan normal :
nb0 + b1 ∑ X i + b2 ∑ X i2 = ∑Yi
nb0 + b1 ∑ X i + b2 ∑ X i2 + b3 ∑ X i3 = ∑Yi
x=X −X
b0 ∑ X i + b1 ∑ X + b2 ∑ X = ∑ X iYi 2 i
3 i
x=X −X
b0 ∑ X i + b1 ∑ X i2 + b2 ∑ X i3 + b3 ∑ X i4 = ∑ X iYi
b0 ∑ X i2 + b1 ∑ X i3 + b2 ∑ X i4 +b3 ∑ X i5 = ∑ X i2Yi
b0 ∑ X i2 + b1 ∑ X i3 + b2 ∑ X i4 = ∑ X i2Yi
b0 ∑ X i3 + b1 ∑ X i4 + b2 ∑ X i5 +b3 ∑ X i6 = ∑ X i3Yi
Data :
Data :
Yˆ = −1,761+ 9,498X − 0,5467X 2
Yˆ = −4,805+12,13X −1,115X 2 + 0,0344X 3 3
3
4
Model Eksponensial Persamaan regresi dugaan : Mencari b0 dan b1 : l b0 = ln
∑ ln Y − (ln ∑X l b) i
n
1
i
n
Data :
X Yˆ = b0 b1
ln Yˆ = ln b0 + (ln b1 )X ln b1 =
n(∑ X i ln Yi ) − (∑ X i )(∑ ln Yi )
Model Geometrik (Power) Persamaan regresi dugaan : Mencari b0 dan b1 : ln b0 =
n∑ X i2 − (∑ X i )
2
∑ ln Y
i
n
− b1
∑ ln X
i
b1 =
n
Data
Yˆ = (377,495) X −0,286
Yˆ = (11,240)(e 0,159 ) X 5
Yˆ = b0 + b1 X + b2 X 2 + b1 X 3
6
Yˆ = b0 X b1
ln Yˆ = ln b0 + b1 ln X
n(∑ ln X i ln Yi ) − (∑ ln X i )(∑ ln Yi ) n∑ ln 2 X i − (∑ ln X i )
2
Yˆ =
Model Logistik
1 b0 b1
Model Hiperbola
X
Yˆ =
Persamaan regresi dugaan : ⎛1⎞ ln⎜ ⎟ = ln b0 + (ln b1 )X Mencari b0 dan b1 : ⎝ Yˆ ⎠ ( ) ln 1 Y X ( n ∑ i − (ln b ) ∑ i lnl b = ∑ X i ln(1 Yi )) − (∑ X i )(∑ ln(1 Yi )) ln b0 = 1 1 2 2
Persamaan regresi dugaan : Mencari b0 dan b1 : ∑ (1 Yi )(∑ X i2 ) − (∑ X i )(∑ X i Yi )
Data :
Data :
n
b0 =
n∑ X i − (∑ X i )
n
1 b0 + b1 X
1 = b0 + b1 X , jika Yˆ ≠ 0 Yˆ
n∑ X i2 − (∑ X i )
2
b1 =
n(∑ X i Yi ) − (∑ X i )∑ (1 Yi ) n∑ X i2 − (∑ X i )
2
160 140 120
Y
100 Y
80
Yduga
60 40 20
Yˆ =
1 (0,089)(0,853) X
Yˆ =
7
0
1 0,0066+ 0,000013X
0
500
1000
1500
2000
X
8
Soal 1
Soal 2
Suatu perusahaan yang mengalami kemunduran ditunjukkan oleh merosotnya hasil h il penjualan j l dari d i tahun h ke k tahun h sebagai b i berikut: b ik T h Tahun
2001
2002
2003
2004
2005
2006
X : harga barang per unit dalam ribuan rupiah Y : hasil penjualan barang tersebut dalam jutaan rupiah
2007
Kode Tahun
1
2
3
4
5
6
7
Hasil Penjualan (dalam jutaan rupiah)
83
60
54
21
22
13
13
X
20
35
60
100
150
300
500
800
Y
150
125
105
100
92
77
62
58
Dengan menggunakan model eksponensial, berapa prediksi hasil penjualan j l kalau k l X = 900? Gambarkan G b k grafik fik Y dan d Ŷ dalam d l satu t gambar.
Dengan menggunakan D k model d l kuadratik, k d tik tentukan t t k b berapa prediksi dik i hasil penjualan untuk tahun 2008 dan 2009? Gambarkan grafik Y dan Ŷ dalam satu gambar.
9
Soal 3
10
Soal 4
X = kecepatan (dalam km) ketika rem mulai diinjak Y = jarak (dalam m) yang masih ditempuh mobil dihitung mulai rem diinjak hingga berhenti. Pemeriksaan jarak berhenti sejak mobil direm pada tiap kecepatan tidak dilakukan hanya sekali melainkan berulang-ulang berulang ulang atau terhadap beberapa mobil. Hasilnya seperti berikut: X
10
20
30
40
50
60
70
80
Y
9,2 8,7 , 9,0 8,9
16,4 15,2 , 16,7
27,3 28,2 , 26,8 27,0
41,8 40,2 ,
62,4 63,1 , 60,9
88,5 86,2 ,
120,0 119,1 , 120,4
141,8 140,1 , 138,9
Selidikilah model regresi mana yang lebih tepat diantara: a. Eksponen c. Logistik e. Kubik b. Geometrik d. Hiperbola
Perkembangan industri rumah tangga dari suatu daerah selama 6 tahun, h adalah d l h sebagai b i berikut: b ik
Tahun
2002
2003
2004
2005
2006
2007
Kode Tahun
2
3
4
5
6
7
Banyaknya industri
4
8
12
18
18
20
Dengan menggunakan model logistik, berapa prediksi banyaknya industri rumah tangga pada tahun 2010. 2010 Gambarkan grafik Y dan Ŷ dalam satu gambar.
11
12
Soal 5
Tabel Model Regresi
Suatu penelitian yang bertujuan untuk menentukan model regresi yang paling li tepat dari d i empat kemungkinan k ki yaitu, i model d l linear, li model kuadrat, model akar serta model logaritmik dalam mengetahui pengaruh dari beberapa faktor yang berpengaruh terhadap produktivitas tenaga kerja di suatu industri kecil. Jumlah observasi ada 168. Data produksi per orang per minggu diperoleh p produktivitas (Y), lama bekerja p j dari industri kecil tersebut meliputi (X1), umur (X2), pendidikan (X3).
Model regresi Linear
Yˆ = 15457,77 + 25,33 X 1 + 19,72 X 2 + 225,22 X 3
Kuadrat
((9,00)) ((0,14)) ( (0,33) ) ((1,62)) R2 = 0,018; F = 1,01 Yˆ = 30783,70 + 846,30 X 1 − 1107,20 X 2 − 784,20 X 3 − 61,90 X 12 + 18,00 X 22 + 119,10 X 32
Akar
• T Tentukan t k model d l regresii yang terbaik t b ik dari d i beberapa b b model d l yang telah dicobakan dengan memperhatikan nilai thitung, koefisien determinasi (R2) dan nilai Fhitungg pada tabel diatas. Gunakan taraf nyata 0,05 bila diperlukan melakukan pengujian.
Logaritmik
P Persamaan regresii dugaan, d nilai il i uji ji t dalam d l kurung, k R2, F
((5,79) , ) ((1,02) , ) ((2,80) , ) ((1,48) , ) ((0,89) , ) ((2,75) , ) ((2,18) , ) R2 = 0,174; F = 2,13 1 1 1 Yˆ = 72602,7 − 232 X 1 + 2005 X 2 + 1534 X 3 + 1896 X 1 2 − 21770 X 2 2 − 3886 X 3 2
(3 63) (3,63) (0 20) (2,72) (0,20) (2 72) (2 94) (2,94) (0 36) (0,36) R2 = 0,173; F = 2,15 ln Yˆ = 9,90 + 0,013 ln X 1 − 0,068 ln X 2 + 0,002 ln X 3 (27 7) (0,22) (27,7) (0 22) R2 = 0,006; F = 0,32
13
(0 54) (0,54)
(2 77) (2,77)
(2 44) (2,44)
(0 25) (0,25)
14
Latar Belakang • Regresi logistik adalah bagian dari analisis regresi yang di digunakan k k ik peubah ketika b h dependen d d ( (respons) ) merupakan k peubah dikotomi. Peubah dikotomi biasanya hanya terdiri atas dua nilai, nilai yang mewakili kemunculan atau tidak adanya suatu kejadian yang biasanya diberi angka 0 atau 1.
REGRESI LOGISTIK REGRESI LOGISTIK
1
Model Regresi Linear Sederhana → Peubah respons biner
2
• Nilai Harapan bagi Yi E(Yi) = 1(πi) + 0(1‐ πi) = πi Sehingga 0 ≤ E(Yi) ≤ 1.
Yi = β0 + β1Xi + εi , Yi = 0, 1 Karena E(εi) = 0 maka E(Yi ) = β0 + β1Xi Yi merupakan peubah acak Bernoulli, sehingga fungsi peluangnya Yi Peluang 1 P(Yi = 1) 1) = π πi 0 P(Yi = 0) = 1‐ πi dengan πi menyatakan d k peluang l b h Yi = 1, dan bahwa 1 d 1‐π 1 i menyatakan k peluang bahwa Yi = 0.
3
4
• Karena pengamatan Yi saling bebas, maka fungsi peluang bersama adalah d l h
Model Regresi Model Regresi Logistik Sederhana • Model regresi logistik sederhana: Yi = E(Yi) + εi , dengan Yi mer pakan peubah merupakan pe bah acak Bernoulli dengan Berno lli dengan E(ε E( i ) = 0. ) 0 E (Yi ) = π i =
exp(β 0 + β1 X i ) 1 + exp(β 0 + β1 X i )
• Untuk mempermudah estimasi parameter dengan metode maksimum likelihood maka
• Peubah X diasumsikan konstanta yang diketahui. Bernoulli dengan fungsi peluang • Yi i merupakan peubah acak Bernoulli dengan
5
6
Data Tugas Pemrograman (Hal 566)
• Sehingga fungsi likelihood adalah sebagai berikut
• Peubah bebas adalah pengalaman pemrograman dalam bulan. Peubah tak bebas (peubah respons) adalah kesuksesan program, dengan 1 = sukses, 0 = gagal. • Dengan estimasi maksimum likelihood diperoleh
• Selanjutnya diturunkan terhadap masing‐masing parameter dan dimaksimumkan Sehingga diperoleh penduga bagi β0 yaitu b0 dan dimaksimumkan. Sehingga penduga bagi β1 yaitu b1. g respons p logistik g dugaan g adalah • Fungsi
Fungsi respons logistik dugaan
πˆ =
exp(− 3,0597 + 0,1615 X ) 1 + exp(− 3,0597 + 0,1615 X )
• Misalkan seseorang selama 14 bulan 14 bulan berpengalaman dalam pemrograman maka peluang suksesnya adalah …………………….. 7
8
Rasio Odds (Odds Ratio Odds (Odds Ratio)) • Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor (peubah bebas) diartikan sebagai jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang l < 1) ketika k ik nilai il i peubah b h prediktor dik meningkat i k sebesar b 1 unit. i • Pada data tugas pemrograman, diperoleh rasio odds ∧
OR = exp(0,1615) = 1,175 • Peluang menyelesaikan tugas naik sebesar 17,5% 17 5% = (117,5‐100)% (117 5‐100)% untuk setiap kenaikan 1 bulan pengalaman pemrograman. 9
10
Soal (Data kemampuan (Data kemampuan bekerja bekerja) )
Regresi Logistik dg SPSS
Seorang psikologi ingin mengetahui hubungan antara stabilitas emosi karyawan (X) dan kemampuan karyawan bekerja dalam kelompok (Y). Stabilitas emosi diukur dengan uji tertulis dengan semakin tinggi skor menyatakan k stabilitas bili emosii semakin ki tinggi. i i Kemampuan K b k j dalam bekerja d l kelompok (Y = 1 jika dapat, Y = 0 jika tidak dapat) dievaluasi oleh supervisor. Berikut data dari 27 karyawan :
11
i
1
2
3
4
5
6
7
8
9
10
11
12
13
Xi
474
432
453
320
356
532
587
423
552
403
502
321
453
14 579
Yi
0
0
1
0
1
1
0
0
1
0
0
1
0
0
i
15
16
17
18
19
20
21
22
23
24
25
26
27
Xi
537
402
592
320
337
589
513
413
572
422
562
506
600
Yi
1
0
1
0
1
1
0
0
1
0
1
0
1
12
Dimisalkan model regresi logistik dapat digunakan. a. Tentukan fungsi respons dugaan. b. Buatlah plot pencar dari data dan fungsi respons logistik dugaannya. Apakah fungsi respons dugaan cocok? c. Tentukan exp(b1) dan berikan maknanya. d Berapa peluang d. l b h karyawan bahwa k d dengan skor k stabilitas bili emosii 550 akan dapat bekerja dalam kelompok?
Model Regresi Model Regresi g Logistik g Berganda g • Yi merupakan peubah acak Bernoulli
• Sehingga S hi nilai il i harapan h d i Yi adalah dari d l h
• Dengan estimasi maksimum likelihood diperoleh fungsi respons logistik g dugaan g adalah 13
14