XI. ANALISIS REGRESI KORELASI
Analisis regresi mempelajari bentuk hubungan antara satu atau lebih peubah bebas (X) dengan satu peubah tak bebas (Y). dalam penelitian peubah bebas ( X) biasanya peubah yang ditentukan oelh peneliti secara bebas misalnya dosis obat, lama penyimpanan, kadar zat pengawet, umur ternak dan sebagainya. Disamping itu peubah bebas bisa juga berupa peubah tak bebasnya, misalnya dalam pengukuran panjang badan dan berat badan sapi, karena panjang badan lebih mudah diukur maka panjang badan dimasukkan kedalam peubah bebas (X), sedangkan berat badan dimasukkan peubah tak bebas (Y). sedangkan peubah tak bebas (Y) dalam penelitian berupa respon yang diukur akibat perlakuan/peubah bebas (X). misalnya jumlah sel darah merah akibat pengobatan dengan dosis tertentu, jumlah mikroba daging setelah disimpan beberapa hari, berat ayam pada umu tertent dan sebagainya. Bentuk hubungan antara peubah bebas (X) dengan peubah tak bebas (Y) bisa dalam bentuk polinom derajat satu (linear) polinom derajat dua (kuadratik). Polinim derajat tiga (Kubik) dan seterusnya. Disamping itu bisa juga dalam bentuk lain misalnya eksponensial,logaritma,sigmoid dan sebagainya. Bentuk-bentuk ini dalam analisis regresikorelasi biasanya ditransformasi supaya menjadi bentuk polinom. Dalam bentuk yang paling sederhana yaitu satu eubah bebas (X) dengan satu peubah tak bebas (Y) mempunyai persamaan : Y =a +bx Disini a disebut intersep dan b koefisien arah Dlam pengertian fungsi persamaan garis Y + a +bx hanya ada satu yang dapat dibentuk dari dua buah titik denagn koordinat yang berbeda yaitu ( X 1, Y1) dan X2,Y2). Hal ini berarti kita bisa membuat banyak sekali persamaan garis dalam bentuk lain melalui dua buat titik yang berbeda koordinatnya/tidak berimpit. Persamaan :
garis
melalui
dua
buah
titik
dirumuskan
sebagai
berikut
(Y Y) 1 (X X 1 ) (Y2 Y1 ) (X 2 X 1
Biostatistika
86
Y
Y=a+bx
a
-----------------
y x ------------------------x …………………….. b
X Sebagai contoh misalnya titik A (1,3) dan titik B ($,9) maka persamaan gais linear yang dapat dibuat adalah :
(Y 3) ( X 1) (9 3) (4 1) (Y-3)(4-1) =(X-1) (9-3) 3Y-9 = 6X-6 3Y = 3 +6X
Y=1+2X
Dalam bentukmatrik bisa kita buat persaman sebagai berikut : Y1 = a + b X1 Y2 = a + b X2 Y1 1 Y 1 2
X 1 a X 2 b
3 1 9 1
1 a 4 b
a 1 b 1
1 a 4 b
1
a 1 4 1 3 b (4 1) 1 1 9 a 4 / 9 1 / 3 3 4 3 1 b 1 / 3 1 / 3 9 1 3 2
Jadi a=1 dan b=2 sehingga persamaannya Y=1 +2X
Biostatistika
87
Jika jumlah data sebanyak n maka persamaannya sebagai berikut ; Yi o 1 X 1 i
i= 1,2,3,…..n disini βo adalah penduga a, β1 adlah penduga b dan εi merupakan besarnya simpangan persamaan garis penduga. Semakin kecil nilai ε i persamaan regresi yang diperoleh akan semakin baik. Jadi kita dapat menuliskan pengamatan kita menjadi
y1 o 1 X 1 1 y 2 o 1 X 2 2 y 3 o 1 X 3 3
………………….. y n o 1 X n n
Dengan notasi matrik dapt ditulis sebagi berikut : Y1 1 Y 1 2 Y3 1 . . . . Yn 1
X1 1 X2 2 X 3 o 3 . 1 . . . X n n
Jadi kita peroleh matrik Y,X,β dan ε dengan dimensi sebagi berikut : Y nx1
β
X ε nx2 nx1 2x1
Jika diasumsikan E(ε) = 0 maka E(Y) = Xβ Bila modelnya benar β merupakan enduga terbaik yaitu dengan jalan melakukan penggadaaan awal dengan X’ sehingga diperoleh persamaan normal sebagai berikut :
Biostatistika
88
X’Y=X’X β 2x1
1 X 1
2x2
2x1
1
1
X2
X2
Y1 Y 2 ......... 1 Y3 1 ........... X n . X 1 . Yn
n Yi n ni 1 n XY X i i i i 1 i 1
1
1
X2
X3
1 1 ........ 1 1 ...... X n . . 1
X1 X 2 X 3 o . 1 . X n
o i 1 n 2 1 Xi i 1 n
X
n n Xi 0 i 1 n n 2 1 X X1 i i 1 i 1 -1 Jadi β=(X’X) X’Y
1
i
n Yi ni 1 XY i i i 1
Disini(X’X)-1 adalah kebalikan (inverse)dari matrik X’X
(X’X)-1 =
n
n X i i 1
2
n 2 Xi 1 i 1n n 2 ( X i ) X i i 1 i 1
n Xi i 1 n
Y 1 X n n n o Jadi X i Yi ( X i )( Yi ) / n i 1 i 1 1 i 1 n n X i 2 ( X i ) 2 / n i 1 i 1
Contoh Seorang peneliti ingin mengetahui bentuk hubungan antara jumlah cacing jenis tertentu denagn jumlah telurnya pada usus ayam buras. Untuk tujuan tersebut diperiksa 20 ekor ayam dan ditemukan sebagai berikut :
Biostatistika
89
Tabel 1 jumlah cacing dan jumlah telurnya pada usus ayam buras am buras. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Total rataan
Jumlah Cacing ( Xi) 12 14 13 12 15 16 13 11 10 11 12 13 17 19 13 11 16 12 14 15 269 13,45
Jumlah telurnya (Yi) 45 50 51 43 61 62 50 43 40 44 48 52 70 76 53 43 60 48 53 63 1055 52,75
Dari data diatas kita bisa menghitung : n
X i 1
=12+14+13+…………………………+15=269
i
n
Y i 1
=45+50+51+……………………….+63=1055
i
n
X i 1 n
Y i 1
i
2 i
2
=122+142+132+……………………+152=3719
=452+502+512+……………………+622=57449
n
X Y i 1
i i
=12x45+14x50+13x51+…………………+15x63=14604
X
1 n 1 Xi 269 13,45 n i 1 20
X
1 n 1 Yi 1055 52,75 n i 1 20
Bila kita duga bentuk hubungan antara jumlah cacing (X)dan jumlah telurnya (Y) adalah : Ŷi=β0 +β1Xi+εi Biostatistika
90
i=1,2,3,……………………..,20 disini Ŷi adalah dugaan Yi jadi persamaan normalnya adalah : X’Y =X’Xβ 20 Yi 20 20i 1 20 XY X i i i i 1 i 1
0 i 1 20 2 1 X1 i 1 n
X
i
1055 20 269 o 14604 269 3719 1
o 20 1 20 X 2 1 i 1
20 2 X1 1 i 120 20 ( X i ) 2 X i i 1 i 1
20 n 2 X i Yi i 1 20i 1 20 X i Yi i 1
o 3719 269 1055 2,442 1 2 20 14604 4,103 1 20(3719) (269) 269
Jadi Ŷ=-2,442 + 4,103 Xi, Persamaan garis regresi Yi =-2,442 + 4,103 Xi bukanlah satu-satunya garis penduga untuk menyatakan hubungan antara jumlah cacing dengan jumlah telurnya. Sudah barang tentu masih banyak lagi bentuk persamaan penduga yang dapat dibuat misalnya dalam bentuk persamaan Yi=βo+β1Xi+β2Xi2,Yi=βoXiβ1 ( dalam bnetuk linear LnYi=Ln β o+βiLnXi)dan masih banyak lagi bentuk yang lainnya Untuk menyatakan apakah garis yang diperoleh cukup baik untuk menggambarkan hubungan antara peubah bebas (X) dengan peubah tak bebas(Y) dapat dilakukan pengujian bentuk model yang digunakan dan keeratan hubungannya (korelasinya) untuk menyatakan ketepatan dan ketelitian persamaan garis regresi yang diperoleh. Garis regresi yang kita peroleh akan selalu melalui rata-rata peubah X dan Y (X,Y)maka dapat dijelaskan seperti gambar dibawah ini
Biostatistika
91
(Xi,Yi)
Ỹ = β0 + β1Xi
Yi (Yi-Ў.)=(ỹ- Ў.)(Yi- ỹ)
Ỹ ỹ
β0
_ X
Dengan metode kuadrat terkecil maka kita peroleh : n
n
i 1
i 1
n
n
i 1
i 1
(Yi Y .) 2 i Y . (Yi Y i)
2
(Yi Y .) 2 (ˆY Y .) 2 (Yˆi Y .)(Yi Yˆi ) (Yi Yˆi ) 2
Dari persamaan diatas maka diperoleh : n
JK total =
n 1 n 2 2 ( Y Y . ) Y ( Yi ) 2 i i n i 1 i 1 i 1 n
n
1 JK Regresi = (Yˆi Y .) 2 ( X ' Y ) ( Yi ) 2 n i 1 i 1 n
n
i 1
i 1
2
JK Galat = (Yi Yˆi ) 2 Yi ( X ' Y )' n
Sedangkan=
(Yˆ Y .)(Y i 1
i
i
Yˆi ) 0
Untuk menetukan apakah garis regresi yang kita peroleh cukkup dapatdipercaya maka kita dapat mengujinya dengan uji F seperi tabel sidik ragam dibawah ini
Biostatistika
92
Sumber keragaman Regresi
Derajat bebas p
Jumlah kuadrat JK R
Galat
n-1-p
JK G
Total
n-1
JK T
Kuadrat tengah
F hitung
JKR KTR p JKG KTG n 1 p
KTR KTG
Jika hasil hitungan yaitu F hitung (
F tabel 0,05 0,01
KTR )≥ dari F tabel (0,05; p,n-1-p) maka dapat KTG
disimpulkan persamaan garis regresi nyata (P<0,05) bentuk persamaannya seperti yang kita duga demikian pula jika F hitung (
KTR )≥ dari F tabel (0,05; p,n-1-p) maka dapat KTG
disimpulkan persamaan garis regresi sangat nyata (P>0,05) atau dengan kata lain persamaaan garis regresi tersebut tidak bisa kita terima sebagai penduga hubungan antara peubah (X) dengan Peubah (Y) Bila bentuk hubungan antar peubah X dengan peubah Y sudah dapat kita terima maka kita ingin pula mengetahui seberapa besar keeratan hubungannya(korelasinya). Walaupun bentuk hubungan antara peubah X dengan peubah Y ada dalam bentuk yang benar belum tentu korelasinya bsar karena banyakpeubah
lain yang turut mempengaruhi perubahan
peubah Y Besarnya perubahan peubah Y yang dapat diterangkan oleh peubah X dengan menggunakan persamaan garis regresi yang diperoleh disebut koefisien determinan Koefisien determinat diberi lambing r2 untukbentuk persamaan garis regresi sederhana dan R2 untuk bentuk persamaan lainnya, besarnya 0
r 2 R2
JK Re gresi JKTotal
Jadi koefisien korelasinya : r =R= R 2 Dari tabel 1 kita dapat menghitung n
JK Total = Yi i 1
2
1 n (1055) 2 ( Yi ) 2 57449 n i 1 20
= 57449-55651,25=1797,75 JK Regresi = (X’Y)’β= JK total- JK Regresi = 1797,75-1692,625=105,098 Jadi tabel sidik ragamnya adalah : Biostatistika
93
Sumber keragaman Regresi
Derajat bebas 1
Jumlah kuadrat 1692,652
Kuadrat tengah
Galat
18
105,098
5,839
Total
19
1797,750
1692,652
F hitung 289,89
F tabel 0,05 0,01 4,41 8,29
Jadi dapat disimpulkan bahwa persamaan garis regresi yang diperoleh sangat nyata (P<0,01) karena F hitung> F tabel pada taraf signifikansi 0,01 (289,89>8,29) Jadi r 2
JKregresi 1692,652 0,9415 JKTotal 1797,750
Jadi dengan menggunakan persamaan garis regresi penduga Yi =-2,442 + 4,103 Xi banyaknya jumlah telur cacing pada usus ayam buras sekitar 94,15 % ditentukan oleh banyaknya cacing dalam usus tersebut sedangkan 5,85 % ditentukan atau dipengaruhi oleh factor lain. Jadi kereratan hubungan (r=±√0,9415=0,9703) dalam persamaan ini diambil hanya r positip karena dengan bertambah besarnya nilai Xi nilai Yi juga meningkay. Untuk menyatakan apakah hubungan cukup berarti maka besarnya r ini dapat kita bandingkan dengan r tabel. Jika r hitung ≥ r tabel (0,05:p,db=n-p-1) maka disimpulkan keeratan hubungannya nyata (P>0,05) dan jika r hitung≥r tabel (0,01;p,db=n-p-1)maka disimpulkan keeratan hungannya sangat nyata (P<0,01) sedangkan jika r hitung< r tabel (0,05;p,db=n-p-1) maka disimpulkan keeratan hubungannya tidak nyata (P<0,01) Bila persamaan garis regresi derajat polinomnya atau peubah bebasnya (X) lebih besar dari satu maka perlu dilakukan pengujian terhadap koefisien garis regresinya (β j yaitu β1,β2,…………,βp), untuk mengetahui βj yang mana yang menentukan ketepatan dan ketelitian garis regresinya yang diperoleh. Misalkan terdiri dari p peubah bebas maka modelnya menjadi Yi = β o + β1Xi1+………..+βpXip dengan persamaan normalnya :
X 'Y dxi
Biostatistika
X'X dxd dx1
disini d=p+1
94
n n n Yi n Xi 1 Xi 2 i 1 i 1 i 1 n n n n 2 Xi1Yi Xi 1 X 1 Xi1Xi 2 i i 1 i 1 i 1 i 1 n n n n Xi 2Yi Xi 2 Xi 2 Xi 1 X i2 i 1 i 1 i 1 i 1 .......... ................ ................. ................. n n n n XipYi Xip XipXi 1 XipXi1 i 1 i 1 i 1 i 1
i 1 n ............. Xi1Xip i 1 n 2 .............. Xi 2 Xip i 1 ............. ................ n .............. X i2 p i 1 n
.............
Xip
Jadi :β= (X’X)-1X’Y
Jika elemen-elemen matrik X kita kurangi dengan rata-rata elemen-elemen tiap kolomnya maka diperoleh matrik X A. sebagai contoh kita untuk p=2 maka matriknya adalah sebagai berikut :
( X 11 X .1 ) ( X 21 X .1 ) X A ( X 31 X .1 ) .............. ( X X . ) 1 n1
( X 12 X .2 ) ( X 22 X .2 ) ( X 32 X .2 ) .............. ( X n 2 X .2 )
n ( Xi1 X 1 .) 2 i 1 X 'A X A n ( Xi X . )( Xi X . ) 2 1 2 2 2 i 1
JKX 1 Biasanya ditulis : X ' A X A JHKX 1 X 2
X i2 X .2 ) i 1 n 2 ( Xi 2 X 2 . ) i 1 n
( Xi
1
JHKX 1 X 2 JKX 2
Untuk menguji βi kita cari kekalikan dari matriks XAXA-1kemudian kita gandakan dengan n
S r2 regresi yaitu ( Yˆi Yi ) 2 /( n p 1) maka pengujian βi dapat dilakukan dengan rumus : i 1
tH
i Sbi
Disini √Sbi adalah elemen-elemen diagonal matrik X AXA-1 yang telah digandakan dengan S r2 regresi
Contoh Biostatistika
95
Seorang peneliti ingin mengetahui hubungan antara dosis oba tertentu (X) dengan kadar Creatinin Ginjalnya (Y) dari hasil peneitiannya diperoleh hasil sebagai berikut : Data hasil penelitiannya sebagai berikut: No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Dosis Obat mg (Xi) 1 2 3 4 5 7 3 2 4 6 7 8 8 1 3
Kadar Creatinin % (Yi) 10 13 15 20 16 11 14 12 21 17 10 7 6 11 16
Jawab Dari data yang diperoleh diduga bentuk persamaan garis regresinya Yi =β 0 +β1Xi +β2X12+εi Jadi persamaann normalnya adalah X’Y=X’X β n Yi n ni 1 n XiYi Xi i 1 i 1 n n 2 X 1 Yi X 12 i 1 i 1
i 1 o n 3 X 1 1 i 1 n 2 4 X 1 i 1
n
n
Xi
X
i 1 n
X
2 1
X
3 1
i 1 n
i 1
2 1
64 356 0 199 15 803 64 356 2278 1 4055 356 2278 15703 2
64 356 15 1 64 356 2278 2 356 2278 15703
1
199 803 4055
1,0520 0,5090 0,0500 1 0,5090 0,2855 0,0299 2 0,0500 0,0299 0,0033
199 3,36313 803 6,77799 4055 0,80123
Jadi persamaan garis regresinya adalah: Ŷi=3,36313 + 6,77799Xi -0,80123X 12 Biostatistika
96
1 n (199) 2 2 JK total = Yi ( Yi ) 2903 n i 1 15 i 1 n
2
= 2903-2640,067=262,933
1 n JK Regresi =(X”Y)’ ( ) 2 n i 1 3,36313 6,77799 2 (199) = 199 803 4055 0,80123 15
= 669,263 +5442,726 -3248,988-1640,067 = 222,934 n
JK Galat = Yi 2 ( X ' Y )' = JK total – JK Regresi i 1
= 262,933-222,934 =39,999
Jadi tabel sidik ragamnya adalah : Sumber keragaman Regresi
Derajat bebas 2
Jumlah kuadrat 222,934
Kuadrat tengah
Galat
12
39,999
3,333
Total
14
262,933
111,476
F hitung 33,44
F tabel 0,05 0,01 3,89 6,93
Disini S r2 = KT Galat =3,333 Jadi dapat kita simpulkan bahwa persamaan garis regresi yang diperoleh sangat nyata (P<0,01) karena F hitung > f tabel pada taraf signifikasi 0,01(33,44>8,93) Jadi R 2
JK Re gresi 222,934 0,8479 JKTotal 262,933
Maka R =√0,8479=0,9208 Bila kita bandingkan dengan R0,01(db=2;12)=0,732 maka disimpulkan korelasinya sangat nyata (P<0,01) Untuk menguji β1dan β2 maka dicari matrik XAXA dan kebalikkanya (XAXA-1) n 1 n (64) 2 JK X = Xi 2 ( Xi ) 2 356 n i 1 15 i 1
= 356 – 273,0667 = 82,9333 Biostatistika
97
n 1 n (356) 2 JK X2 = Xi 4 ( Xi 2 ) 2 15703 n i 1 15 i 1
= 15703 -8449,0667 =7253,9333 n n 1 n JK XX2 = Xi 3 ( Xi ) ( Xi 2 ) n i 1 i 1 i 1
= 2278-
(64)(356) 15
= 2278 – 1518,9333 =759,0667 82,9333 759,0667 0,28545 0,02987 1 X’AXA = , X 'A X A 759,0667 7253,9333 0,02987 0,00326 0,28545 0,02987 0,951405 0,099557 2 XAXA-1 S r 3,333 0,02987 0,00326 0,099557 0,010866 tH
i Sbi
Untuk 1 maka t H Untuk 2 maka t H
6,77799 0,951405 0,80123 0,010866
6,61 7,69
Bila kita bandingkan t 0,005(db=n-p-1=12)=3,055 tH untuk β1 dan β2 lebih besar dari t tabel 0,01 maka disimpulkan koefisien garis regresinya sangat nyata (P<0,01) dar creatinin Darah (%)
Biostatistika
98
Kadar Creatinin Darah
20 18 16 14 12 10 8 6 4 2 0
Y = 3.36313 + 6.77799X – 0.80123X2
0
2
4
6
8
10
Dosis Obat
Biostatistika
99