Regression Ledhyane I. Harlyan
Fakultas Perikanan dan Ilmu Kelautan Universitas Brawijaya 2013
TUJUAN INSTRUKSIONAL KHUSUS • Mahasiswa mampu melakukan analisis regresi sederhana dengan menggunakan metode fitby eye dan metode kuadrat terkecil
Peramalan “Meramalkan suatu peubah tak bebas (Y) lewat satu/lebih peubah bebas (X)” Persamaan REGRESI Contoh: - Hubungan nilai UTS dengan skor intelegensia - Hubungan jumlah pendapatan dengan tingkat kepuasan - Menduga kecerahan air dari konsentrasi klorofil - Hubungan hasil tangkapan per unit effort dengan effort, dll.
HUBUNGAN FUNGSI ..”konsentrasi klorofil dapat dihubungkan dgn kecerahan air..” Jika konsentrasi klorofil=C; kecerahan air=D C = f (D) artinya: D digunakan sebagai indikator C Manakah peubah/variabel bebas?? Manakah peubah tak bebas?
“D” atau “C”
X dan Y dalam populasi X (peubah bebas) dan Y(peubah tak bebas) adalah anggota dari populasi Notasi dlm populasi : {xi,yi}; i= 1, 2, 3…n (x1,y1), (x2, y2),…(xn, yn) -
Jika data tiap anggota populasi diplotkan / disebarkan (Diagram Pencar) Analisa relasi antar variabel adalah dengan membuat diagram pencar (scatter diagram) yang menggambarkan titik-titik plot dari data yang diperoleh.
-
Titik-titik akan “mengikuti “ garis lurus dua peubah (X & Y) berhubungan secara linear (Garis Regresi Linear)
Garis linier pada diagram pencar
y
yˆ a bx y (+)
y (-)
y (+) y (0) y (+) y (+)
y (0)
y (-)
y (-) y (-)
a
x
Gambar Garis regresi linier pada diagram pencar
Model Regresi (pangkat 1) Model dugaan ŷ = a + bx ŷ = nilai ramalan hasil dari analisis regresi a = intercept/perpotongan sumbu tegak b = slope/kemiringan Note: ŷ ≠ y !! y = nilai pengamatan sesungguhnya
Model observasi ẏ= α + βx ẏ= nilai rata-rata observasi α = intercepts β = slope/kemiringan εi= galat/sisa
Ĉ=a+bD Ĉ = peubah tak bebas D= peubah bebas a = intercept b = slope
yi = ŷ+ εi
Diagram pencar & Garis Regresi Diagram Pencar & Garis Regresi
Nilai pengamatan sesungguhnya
100
Nilai UTS
95 90 85
Tumpukan titik-titik ramalan ŷ = a + bx (GARIS REGRESI)
80 75 70 45
50
55
60
Skor tes intelegensia
65
70
Tumpukan titik2 ramalan/garis regresi digunakan utk peramalan Misal: -skor tes 60, maka nilai UTS=83.86 -83.86 adalah nilai harapan bagi mahasiswa yg memiliki skor tes 60
Asumsi Penggunaan Regresi • • • •
εi ~ N (0, δ2) εi bebas satu sama lain Setiap nilai x mempunyai sebaran bagi nilai y x bersifat non measurement error
Transformasi linier 1. EKSPONENSIAL
Y = a . ebX y = peubah tak bebas x = peubah bebas a, b= konstanta e = bilangan natural = 2.71 Transformasi logaritmik
Loge (Y) = Loge (a) + bX; Loge e = 1 Z=c + bX; Z = Variabel tidak bebas yang nilainya = Loge (Y); c = Konstanta yang nilainya = Loge a
Transformasi linier 2. KUADRATIK Hubungan antara tekanan effort (F) dengan total hasil tangkapan (C) umumnya mengikuti persamaan kuadratik, dengan persamaan: C = a + bF + cF2 • Jika F=0 C=0 maka a=0 • Jika penambahan F C meningkat, namun pada titik tertentu akan penurunan total C
C = f(F) nilai dari C adalah fungsi dari F C = bF + cF2 Namun karena kurva ke arah “negatif” Kurva cembung ke atas C = bF - cF2 C/f = b- cF Y = b- cF
Beberapa metode regresi linier 1. Metode Fit-By Eye Dilakukan jika: a.Tidak tersedia kalkulator/komputer b.Jumlah data relatif sedikit c.Keputusan memerlukan waktu yang relatif sedikit d.Tidak memerlukan tingkat akurasi/galat yg terukur Kelemahan: tidak bisa menghitung galat, sehingga asumsi tidak terpenuhi Cara: 1. Plotkan titik-titik observasi 2. Buat garis dugaan, dimana jarak antara titik yg berada di atas dan garis dugaan sama dengan jarak antara titik yg berada di bawah dan garis dugaan 3. Teruskan garis hingga menyentuh sumbu Y notasi a ; saat x =0 4. Teruskan garis hingga menyentuh sumbu X notasi z ; saat y=0 5. Nilai konstanta b = (0 – a) (z – 0)
Beberapa metode regresi linier 2. Metode Kuadrat Terkecil XY 1 X Y n b X 1n X 2
2
JKT Y 1
Y
2
2
n
JKR b XY 1
n
X Y
a Y b* X
Kaidah Penarikan Kesimpulan • F hit > F tab 5% Tolak Ho, terima H1 artinya model regresi dapat dipercaya dengan selang kepercayaan 95% • Fhit > F tab 1% Tolak Ho, terima H1 artinya model regresi sangat dapat dipercaya dengan selang kepercayaan 99% • Fhit < F tab 5% Gagal tolak Ho artinya model regresi tidak dapat dipercaya
Uji Lanjutan 1. R2 (koefisien determinasi) JKR x 100% JKT “berapa persen keragaman nilai Y dapat dijelaskan hubungan linearnya dgn X?”
2. r (koefisien korelasi) Nilai rentang: -1 < r < 1 “ seberapa kuat hubungan antara dua peubah (bebas & tak bebas)? “
Koefisien korelasi
Linier positif
Linier negatif
Uji Lanjutan 3. Uji t t hitung = b1 Sb1
bandingkan dengan
t tab (tα/2; n-2)
Sb1 = S2 (atau KTS) ∑X2- 1/n(∑X)2 Keputusan: T hit < T tabel gagal tolak H0 x tidak mempengaruhi y
Contoh soal Jika diketahui bahwa lama perendaman (X) akan mempengaruhi kadar protein umpan (gr/100 gr umpan) (Y), maka berikut ini akan dibuktikan bahwa X mempengaruhi Y!
X 975 X 192175 XY 8259 Y 110.7 Y 2730.95 2
2
X 139.2857 Y 15.81 n7
Pengerjaan dengan Ms. Excell NO
SECCHI CHLOROPH DISH YLL
1
(cm) /X 45
(TE/F)/ Y 28,0
2
250
3,2
3
130
14,7
4
270
0,5
5
65
20,4
6
35
35,0
7
180
8,9
• Masuk ke Ms.excell • Buka data analysis
Metode Kuadrat Terkecil (Excell)
INTERPRETASI Setiap penambahan 1 cm secchi disk, maka konsentrasi klorofil akan berkurang sebesar 0.127 TE/F
Assignment!! •
Sebuah penelitian dilakukan untuk menentukan hubungan antara kapasitas mesin kapal dengan produksi hasil tangkapan (dalam ton) per bulan dan hasil penjualannya. Data yang diperoleh adalah sebagai berikut :
Kapasitas mesin (PK)
40
20 25 20 30 50 40 20 50 40 25 50
Produksi (ton)
385 400 395 365 475 440 490 420 560 525 480 510
Tentukan : 1. Persamaan regresinya ? 2. Perkirakan besar produksi per bulan bila kapasitas mesin sebesar 35 ? 3. Koefisien korelasinya ( r ) ? 4. Bagaimanakah hasil dari uji t utk pengujian x variabel?
Model Dugaan Mana pendekatan yang baik ? Garis lurus yang sedemikian rupa sehingga melewati seluruh titik (data ) pada diagram pencar yang mendekati
Harga (Rp. juta)
12,00 10,00 8,00 6,00 4,00 2,00 0,00 0,00
1,00
2,00
3,00 Luas (Ha.)
4,00
5,00
6,00
Model Observasi