ANALISIS REGRESI DAN KORELASI SEDERHANA
LATAR BELAKANG • Analisis regresi dan korelasi mengkaji dan mengukur keterkaitan secara statistik antara dua atau lebih variabel. • Keterkaitan antara dua variabel regresi dan korelasi sederhana. • Keterkaitan tiga atau lebih variabel regresi dan korelasi multipel. • Variabel yang mempengaruhi perubahan variabel bebas sumbu-X. • Variabel yang akan ditaksir variabel tak bebas sumbu-Y.
ANALISIS REGRESI DIAGRAM PENCAR • Kegunaan diagram pencar: melihat kaitan antar variabel secara visual membantu untuk menentukan jenis persamaan regresi yang akan digunakan
ANALISIS REGRESI DIAGRAM PENCAR • Gambaran kaitan yang cukup kuat antara variabel X dan variabel Y hubungan yang bersifat langsung bila variabel X meningkat, maka variabel Y juga meningkat hubungan linier positif.
ANALISIS REGRESI DIAGRAM PENCAR • Hubungan linier positif dengan pencarn yang lebih besar korelasi mengecil.
ANALISIS REGRESI DIAGRAM PENCAR • Hubungan linier negatif (berlawanan)
ANALISIS REGRESI DIAGRAM PENCAR • Keterkaitan dua variabel yang bersifat tidak linier dan mempunyai pola hubungan kurvilinier positif
ANALISIS REGRESI DIAGRAM PENCAR • Hubungan kurvilinier negatif
ANALISIS REGRESI DIAGRAM PENCAR • Hubungan kurvilinier
ANALISIS REGRESI DIAGRAM PENCAR • Secara visual tidak terdapat hubungan
ANALISIS REGRESI PERSAMAAN REGRESI LINIER • Persamaan umum regresi untuk populasi:
Y = f ( X 1 , X 2 ,..., X k θ 1 , θ 2 ,..., θ k ) θ : parameter yang terdapat dalam regresi dan perlu ditaksir untuk mendapatkan persamaan regresi dari sampel
ANALISIS REGRESI PERSAMAAN REGRESI LINIER • Model regresi yang paling sederhana:
Y = α + βX α dan β ditaksir dengan a dan b regresi berdasarkan sampel acak:
Yc = a + bX
a = intersepsi Yc bila X = 0 b = slope garis regresi X = nilai variabel bebas Yc = nilai variabel tak bebas yang dihitung dari regresi
persamaan
ANALISIS REGRESI PERSAMAAN REGRESI LINIER • Metoda pencarian persamaan regresi yang paling sering digunakan metode kuadrat terkecil (least square). • Garis regresi least square:
∑ (Y − Y ) = 0 ∑ (Y − Y ) = min imum c
2
c
mengupayakan agar simpangan positif dari titik sebaran diatas garis, dihilangkan oleh simpangan negatif di bawah garis jumlah = 0
ANALISIS REGRESI PERSAMAAN REGRESI LINIER
ANALISIS REGRESI PERSAMAAN REGRESI LINIER • Nilai a dan b sebagai penaksir α dan β dihitung dengan:
b=
[n (∑ XY ) − (∑ X )(∑ Y )] [n (∑ X )− (∑ X ) ] 2
2
Ym = ∑
Y
Xm = ∑
X
n
a = Ym − bX m
[(∑ Y )(∑ X ) − (∑ X )(∑ XY )] a= (n ∑ X ) − (∑ X ) 2
2
n = jumlah pasangan observasi
2
n
ANALISIS REGRESI GALAT BAKU DARI PENDUGA • Asumsi yang diambil: (1) Model regresi mengalami koreksi (ε) model regresi:
terdapat galat
Y = α + βX + ε Kekeliruan berbentuk variabel acak yang mengikuti distribusi normal dengan varian σx2
ANALISIS REGRESI GALAT BAKU DARI PENDUGA
ANALISIS REGRESI GALAT BAKU DARI PENDUGA
ANALISIS REGRESI GALAT BAKU DARI PENDUGA (2) Untuk setiap harga X yang diberikan variabel tak-bebas Y adalah bebas dan terdistribusi normal dengan: rerata = α + βX varian= σy.x2 varian-galat-baku Varian-galat-baku sama untuk setiap harga X σε2 (varian-galat-taksiran) ditaksir rerata-kuadrat-residu (sε2)
ANALISIS REGRESI GALAT BAKU DARI PENDUGA • Akar dari kuadrat residu galat-baku-taksiran:
∑ (Y − Y )
2
s y . x = sε =
c
n−2
∑ (Y )
2
=
− a (∑ Y ) − b (∑ XY ) n−2
PENGUJIAN MODEL REGRESI • Bisa terdapat hubungan dengan slope = 0 tidak ada korelasi
PENGUJIAN MODEL REGRESI • Dapat pula terjadi pasangan data yang memberikan garis regresi yang baik analisis regresi menggambarkan keterkaitan antar variabel bebas dan tak-bebasnya.
PENGUJIAN MODEL REGRESI • Asumsi yang digunakan: (1) nilai a dan b dalam persamaan adalah berasal sampel yang merupakan estimasi dari α dan β
dari
(2) untuk setiap nilai X ada distribusi nilai-nilai Y dalam populasi nilai-nilai tsb terpencar secara vertikal dari garis regresinya dan berdistribusi normal.
PENGUJIAN MODEL REGRESI
PENGUJIAN MODEL REGRESI (3) Setiap distribusi-distribusi nilai-nilai Y tsb. mempunyai simpangan baku yang sama. (4) Setiap nilai-nilai dalam distribusidistribusi tersebut adalah bebas satu sama lain.
PENGUJIAN MODEL REGRESI • Uji terdapatnya hubungan yang sebenarnya antara variabel X dan variabel Y uji slope : H0: β = 0 H1: β ≠ 0 Rasio kritis : b − β H0 RK = t = sb
(
sb =
s y.x n
2 ( xi − x ) ∑ i =1
)
PENGUJIAN MODEL REGRESI • Simpangan baku ukuran penyebaran dari rerata. • Galat-baku-taksiran ukuran penyebaran terhadap garis regresinya. • Pada sampel yang banyak serta nilai-nilai Y berdistribusi normal didapat garis-garis batas rentang ± 1 sy.x, ± 2 sy.x, dan ± 3 sy.x.
PENGUJIAN MODEL REGRESI
PENGUJIAN MODEL REGRESI • Jumlah sampel cukup besar untuk sebuah harga X rentang taksiran (n > 30): Yc ± Z (s y . x ) • Jumlah sampel kecil rentang rata-rata output: Yc ± t n − 2 s y . x
2 1 + Xi − X n n 2 ( Xi − X ) ∑ i =1
( )
(
)
PENGUJIAN MODEL REGRESI • Rentang output:
(a + bX ) ± tα 2 s y . x
2 Xi − X 1 1+ + n n 2 ( Xi − X ) ∑ i =1
( )
(
)
ANALISIS KORELASI KOEFISIEN DETERMINASI (r2) • Bila garis regresi digunakan sebagai dasar estimasi:
(Y
*
)
(
− Ym = (Yc − Ym ) + Y * − Yc
)
• Secara umum:
(Y − Ym ) = (Yc − Ym ) + (Y − Yc ) total simpangan = simpangan dapat dijelaskan + simpangan tak terjelaskan
ANALISIS KORELASI KOEFISIEN KORELASI (r)
ANALISIS KORELASI KOEFISIEN DETERMINASI (r2) • Bila seluruh titik sebaran yang diperhatikan:
∑ (Y − Y ) = ∑ (Y 2
m
c
− Ym ) + ∑ (Y − Yc ) 2
total variasi = variasi dapat dijelaskan + variasi tak terjelaskan SST = SSR + SSE
2
ANALISIS KORELASI KOEFISIEN DETERMINASI (r2) • Koefisien r2 koefisien determinasi ukuran banyaknya “total variasi” variabel Y yang dapat dijelaskan secara regresi, yang berpasangan dengan variabel X: r 2 = SSR
SST
r
2
(Y =∑
r
2
[a ( X ) + b (∑ XY ) − n (Y ) ] = ∑ [∑ (Y )− n (Y ) ]
c
− Ym )
2 2 ( ) Y − Y ∑ m
2
m
2
2
m
ANALISIS KORELASI KOEFISIEN KORELASI (r) • Koefisien korelasi akar dari koefisien determinasi menyatakan skala kedekatan hubungan antara X dan Y. • Bila r = 0 tidak ada hubungan. • Bila r = +1 atau r = -1 terdapat hubungan yang sempurna.
KOEFISIEN DETERMINASI DAN KORELASI
KOEFISIEN DETERMINASI DAN KORELASI
KOEFISIEN DETERMINASI DAN KORELASI
KOEFISIEN DETERMINASI DAN KORELASI
KOEFISIEN DETERMINASI DAN KORELASI
REKAPITULASI
ANALISIS REGRESI REGRESI NONLINIER (KURVILINIER) • Beberapa persamaan regresi nonlinier: (1) Persamaan parabola kuadratik:
Yc = a + bX + cX
2
dengan metode kuadrat terkecil a,b dan c dapat dihitung dengan substitusi:
∑ Y = na + b ∑ X + c ∑ X
2
∑ XY
= a∑ X + b∑ X 2 + c∑ X 3
∑X
Y = a ∑ X 2 + b∑ X 3 + c∑ X 4
2
ANALISIS REGRESI REGRESI NONLINIER (KURVILINIER) (2) Persamaan kubik:
Yc = a + bX + cX 2 + dX 3
untuk menentukan a,b dan c:
∑ Y = na + b ∑ X + c ∑ X ∑ XY
2
+ d∑ X 3
=a ∑ X + b ∑ X 2 + c ∑ X 3 + d ∑ X 4
∑
X 2Y =a ∑ X 2 + b ∑ X 3 + c ∑ X 4 + d ∑ X 5
∑
X 3Y = a ∑ X 3 + b ∑ X 4 + c ∑ X 5 + d ∑ X 6
ANALISIS REGRESI REGRESI NONLINIER (KURVILINIER) (3) Persamaan eksponensial: Yc = ab x
log Yc = log a + (log b )X
dengan menganggap:
Y 'c = log Yc a ' = log a b ' = log b
maka
Y ' c = a '+ b ' X
ANALISIS REGRESI REGRESI NONLINIER (KURVILINIER) Model eksponensial model pertumbuhan diubah menjadi:
Yc = ae
bx
ln Yc = ln a + bX
ANALISIS REGRESI REGRESI NONLINIER (KURVILINIER) (4) Persamaan geometris:
Yc = aX
b
log Yc = log a + b log X (5) Persamaan hiperbola: 1 Yc = (a + bX ) atau 1 = a + bX Yc