BAB V ANALISIS REGRESI Setelah mempelajari mahasiswa diharapkan dapat : (1) Menghitung parameter regresi (2) Melakukan estimasi dan uji parameter regresi (3) Menemukan model regresi yang tepat
Dalam kehidupan sering ditemukan adanya sekelompok peubah yang diantaranya terdapat hubungan, misalnya Kadar ter dari suatu proses kimia tergantung temperatur, panjang berat bayi yang baru lahir tergantung dari berat badanya ketika lahir. Hubungan yang umum terjadi antara peubah bebas xi yang galat pengukurannya dapat diabaikan atau dikendalikan dalam percobaan dengan peubah terikat (respon Y) tunggal yang tidak dapat dikontrol. Persoalan utama dalam bidang statistika adalah menemukan taksiran terbaik peubah terikat apabila diketahui nilai dari perubah bebasnya. A. REGRESI SEDERHANA Setiap nilai peubah bebas xi terdapat satu nilai y i tunggal tetapi bila sampel ditambah dengan nilai xi yang sama dapat diyakini terdapat nilai y i yang belum tentu sama. Hasil survey untuk meneliti hubungan antara tinggi badan dengan berat badan mendapatkan bahwa tinggi badan A 160 cm berat badannya 52 kg, tetapi si B yang memiliki tinggi badan yang sama dengan B memiliki berat badan 49 kg. Dalam hal ini y i merupakan nilai peubah acak berat badan ( Yi ) atau Y|xi dengan nilai rata-rata µ Y | x dan variansi σ Y2|x . Apabila terdapat hubungan linier antara xi dan y i , dinyatakan dalam hubungan µ Y | x = α + β x . Koefisien α dan β merupakan dua parameter yang ditaksir dari data sampel Yˆ = a + bx (lihat gambar).
( xi , y i )
Yˆ = a + bx µ Y |x = α + βx
Aziz Luthfi., Ir., MSc
Page 1
13/11/2011
Dari setiap hasil pengamatan ( xi , y i ) dapat ditarik sebuah garis Yˆ = a + bx yang dianggap cocok untuk menggambarkan hubungan antara kedua variabel. Beberapa titik pengamatan akan memiliki galat terhadap model yang diperkirakan tersebut. Garis yang dianggap paling tepat menggambarkan hubungan kedua variabel tersebut adalah yang memiliki Jumlah Kuadrat Galat/Eror (JKG) minimun atau n
n
n
i =1
i =1
i =1
( JKG ) = ∑ ei2 = ∑ ( y i − yˆ i ) 2 = ∑ ( y i − a − bx) 2 tercapai apabila
minimum.
Kondisi
tersebut
∂ ( JKG ) ∂ ( JKG ) = 0 dan = 0. ∂a ∂b
Dari keduua persamaan yang dihasilkan akan dapat dihasilkan parameter a dan b. n n ∂ ( JKG ) = ∑ y i − an − b∑ xi =0 ......................... (1) ∂a i =1 i =1
n n n ∂ ( JKG ) = ∑ xi y i − a ∑ xi − b∑ xi2 =0 ................. (2) ∂b i =1 i =1 i =1
1. Menetapkan Nilai Parameter Bila diketahui sampel {( xi , y i ), i = 1,2, , , , , n
}maka taksiran kuadrat terkecil a
dan b dari koefisien regresi α dan β dihitung dengan menggunakan rumus n
n
n
n
n ∑ xi y i − (∑ xi )(∑ y i ) b=
i =1
i =1
∑y
i =1
n
n
i =1
i =1
, dan a =
n∑ xi2 − (∑ xi ) 2
n
i
− b∑ xi
i =1
i =1
n
Bukti :
Persamaan awal
Dikali
Persamaan Baru
dengan n
∑y
n
i
n
− an − b∑ xi =0
i =1
∑x
i =1
i =1
n
n
n
i =1
i =1
i =1
∑ xi yi − a ∑ xi − b∑ xi2 =0
n
n
i
n
∑x ∑ y i
i =1
i
n
n
i =1
i =1
− an∑ xi − b(∑ xi ) 2 =0
i =1
n
n
n
i =1
i =1
i =1
n ∑ xi y i − an ∑ xi − bn∑ xi2 =0 n
n
n
n
n
i =1
i =1
i =1
i =1
i
∑ xi ∑ yi − n∑ xi yi − b(∑ xi ) 2 + bn∑ xi2 =0 n
n
n
n
n
i =1
i =1
i =1
i =1
i
∑ xi ∑ yi − n∑ xi y i − b(∑ xi ) 2 + bn∑ xi2 =0
Aziz Luthfi., Ir., MSc
Page 2
13/11/2011
n
n
n
n
i =1
i =1
i =1
i =1
− b ( ∑ x i ) 2 + bn ∑ x i2 = n ∑ x i y i − ∑ x i ∑ y i
n
n
n
n ∑ xi y i − (∑ xi )(∑ y i ) i =1
b=
i =1
i =1
n
n
n∑ x − (∑ x i ) 2 i
i =1
………..> (terbukti)
2
i =1
Jika n
∑y
n
i
− an − b∑ xi =0
i =1
i =1
n
n
∑ yi − b∑ xi =an i =1
i =1 n
n
∑ y i − b∑ xi a=
i =1
i =1
n
…………..> (Terbukti)
Apabila digunakan notasi berikut ini,
J xx
2
n ∑ xi 2 n n i =1 2 2 2 = ∑ ( x i − x ) = ∑ xi − = n ∑ x i − ∑ xi n i =1 i =1 2
J yy
J xy
n ∑ yi 2 n n n n i =1 2 2 2 = ∑ ( yi − y ) = ∑ yi − = n∑ yi − ∑ yi n i =1 i =1 i =1 i =1
n n ∑ xi ∑ y i n n n n = ∑ ( xi − x )( y i − y ) = ∑ xi y i − i =1 i =1 = n ∑ xi y i − ∑ xi ∑ y i , n i =1 i =1 i =1 i =1
maka
Aziz Luthfi., Ir., MSc
Page 3
13/11/2011
Teorema 1. Parameter b dari regersi y= ax + b dapat dihitung dari
b=
J xy J xx
Teorema 2. Galat akan memiliki distribusi dengan Variansi
JKG J yy − bJ xy = n−2 n−2
S2 = Bukti : n
n
n
i =1
i =1
i =1
JKG = ∑ ei2 = ∑ ( y i − yˆ i ) 2 = ∑ ( y i − a − bx) 2 n
JKG = ∑ [( y i − y ) − b( xi − x)] 2 = i =1 n
n
n
i =1
i =1
i =1
JKG = ∑ ( y i − y ) 2 − 2b ∑ ( xi − x)( y i − y ) + b 2 ∑ ( xi − x) 2 2
JKG = J yy − 2bJ xy + b J xx = J yy − 2
J xy J xx
J xy
J xy + J xx
2
J xx = J yy − bJ xy
Contoh V.1 Hasil Ujian Tengah Semester matakuliah Kesehatan Mental semester ganjil 2006 dan Prestasi Akademik yang diukur dari Indeks Prestasi Kumlatif (IPK) sampai dengan semester genap 2005/06 mahasiswa Psikologi Universitas X ditunjukkan dalam Tabel V-6 Tabel V-1 Nilai UTS Matakuliah Kesehatan Mental dan IPK Nilai UTS IPK Nama Nilai UTS Rorial 40 1.99 Elisabeth 72 Erlinda 24 2.68 Yuliani 60 Mardani 36 189 Lauren Ranum 52 Dwi Novilia 60 3.0 Janti Ria 52 Deni Romdoni 36 2.68 Sawitri 56 Winarni Zulkarnaen 56 2.05 Syahnu Widjaja 52 Helen 52 3.10 Eka Persiti 60 Masroni 44 2.92 Ninia Wula 60 Indah Puspita 68 3.41 Emilia Novianti 28 Wahyu Dwi 28 2.10 Raja Sapta 28 Wahyudin 44 2.42 Nama
IPK 3.55 3.61 3.08 2.99 2.44 2.36 3.15 2.96 2.88 2.80
Apabila diasumsikan bahwa perolehan nilai UTS ( y1 ) dipengaruhi oleh nilai IPK (
xi ) dalam hubungan yang linier y = a + bx , maka dapat dihitung parameter b=
21(2.862,92) − (58.06)(1.008) 60.121,32 − 58.524.48 1.596,84 = = = 15.18 3.476.13 − 3.370.96 105.17 21(165,53) − (58.06) 2
dan parameter a =
Aziz Luthfi., Ir., MSc
1.008 − (15.18)(58.06) 126.65 = = 6.03 (lihat tabel berikut), 21 21
Page 4
13/11/2011
sehingga persamaan regresi menjadi y = 6.03 + 15.18 x . Dengan persamaan ini, dapat diperkirakan perolehan nilai UTS matakuliah kesehatan mental apabila IPK seorang mahasiswa 4, yaitu y = 6.03 + 15.18( 4) = 66.75 Nomor Sampel 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Jumlah Rata-rata
2
IPK (X)
UTS (Y)
XY
1.99 2.68 1.89 3.0 2.68 2.05 3.10 2.92 3.41 2.10 2.42 3.55 3.61 3.08 2.99 2.44 2.36 3.15 2.96 2.88 2.80 58.06 2.76
40 24 36 60 36 56 52 44 68 28 44 72 60 52 52 56 52 60 60 28 28 1008 48
79.60 64.32 68.04 180.00 96.48 114.80 161.20 128.48 231.88 58.80 106.48 255.60 216.60 160.16 155.48 136.64 122.72 189.00 177.60 80.64 78.40 2.862.92
2
X
Y
3.96 7.18 3.57 9.00 7.18 4.20 9.61 8.53 11.63 4.41 5.86 12.60 13.03 9.49 8.94 5.95 5.57 9.92 8.76 8.29 7.84 165.53
1600 576 1296 3600 1296 3136 2704 1936 4624 784 1936 5184 3600 2704 2704 3136 2704 3600 3600 784 784 52.288
Kuat hubungan antara variabel IPK dengan UTS matakuliah kesehatan mental adalah
r=
21( 2.862,92) − (58.06)(1.008) ( 21x165.53 − 58.06 2 )( 21x52.288 − 1.008 2 ) r=
=
60.121,32 − 58.524.48 105.17 x81.984
=
1596.84 = 0.54 (hubungan agak rendah). 2936.36
1. Menetapkan selang kepercayaan α dan β Suatu selang kepercayaan (1- α )100% untuk parameter α dalam persamaan garis regresi µ Y | x = α + β x adalah n
a−
i =1
nJ xx
Dalam rumus ini kebebasan n-2
Aziz Luthfi., Ir., MSc
n
∑ xi2
tα / 2 s
tα / 2 s <α < a+
∑x
2 i
i =1
nJ xx
t α / 2 menyatakan nilai distribusi t dengan derajat
Page 5
13/11/2011
Suatu selang kepercayaan (1- α )100% untuk parameter β dalam persamaan garis regresi µ Y | x = α + β x adalah
b− Dalam rumus ini kebebasan n-2
Dalam
J xy
contoh
IV-1
tα / 2 s J xx
< β
diperoleh
J xx
t α / 2 menyatakan nilia distribusi t dengan derajat
diatas,
diperoleh
(58.06)(1.008) = 2.862,92 − = 76.04 21
sehingga
tα / 2 s
s=
besaran
demikian estimasi parameter α
nilai
dan
J xx = 165.53 − J yy = 52.288 −
58.06 2 = 5.01 , 21
1.008 2 = 3.904 , 21
3.904 − 15.18x76.04 = 12.03 . 21 − 2
Dengan
dari contoh IV-1 dengan taraf siginifikasi
α = 0.10 dan dengan derajat kebebasan ν = 21 − 2 = 19 adalah
10.27 −
1.328 x12.03 165.53 21x5.01
< α < 10.27 +
1.328 x12.03 165.53 21x5.01
,atau
− 9.76 < α < 30.31 Estimasi parameter β untuk contoh IV-1 dengan taraf siginifikasi dan derajat kebebasan yang sama adalah
15.18 −
1.328(12.07) 1.328(12.07) , atau 8.02 < β < 22.34 < β < 15.18 + 5.01 5.01
Suatu selang kepercayaan (1- α )100% untuk rataan respon µ Y | x0 diberikan oleh
yˆ 0 − tα / 2
1 ( x0 − x) 2 1 ( x0 − x) 2 + < µ Y | x0 < yˆ 0 + tα / 2 + n J xx n J xx
t α / 2 menyatakan nilai distribusi t dengan derajat kebebasan n-2
Aziz Luthfi., Ir., MSc
Page 6
13/11/2011
2. Uji Hipotesa α dan β Untuk menguji H 0 : α =α 0 dibanding H 1 : α ≠α 0 digunakan distribusi t dengan derajat kebebasan n-2 untuk mendapatkan daerah kritis dan kemudian mendasarkan keputusan pada nilai
a − a0
t=
n
∑x
s
2 i
/ nJ xx
i =1
Untuk menguji H 0 : β = β 0 dibanding H 1 : sesuaipers oalan digunakan distribusi t dengan derajat kebebasan n-2 untuk mendapatkan daerah kritis dan kemudian mendasarkan keputusan pada nilai
t=
Aziz Luthfi., Ir., MSc
b − β0 s / J xx
Page 7
13/11/2011