SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
Analisis Regresi SederhanaMenggunakan MS Excel 2007 Lisensi Dokumen: Copyright © 2010 ssista.wordpress.com Seluruh dokumen di ssista.wordpress.com dapat digunakan dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ssista.wordpress.com.
Pendahuluan Dalam beberapa masalah terdapat dua atau lebih variabel yang hubungannya tidak dapat dipisahkan, dan hal ini diselidiki sifat hubungannya. Jika salah satu variabel (tunggal) dikatakan variabel tak bebas(terikat), maka variabel lainnya bersifat bebas (independent). Analisa regresi adalah sebuah teknik statistik untuk membuat model dan menyelidiki hubungan antara dua atau lebih variabel yang dimaksud diatas. Model ini untuk memprediksi variabel tersebut. Pada umumnya, variabel tak bebas (dependent) dinyatakan dengan Y sebagai variabel respon. Jika ada sebanyak k-variabel bebas (independent) misalnya X1, X2, …, Xk maka kvariabel ini disebut variabel prediktor. Persamaan garis regresi yang dibentuk adalah:
Y = α + β1X1 +β 2 X 2 + .....+β k X k + ε
, dikatakan sebagai persamaanregresi linier ganda.
Jika variabel prediktornya hanya satu persamaannya menjadi Y = α + β X + ε
, disebut
persamaan regresi linier sederhana.
Dalam regresi linier, untuk setiap pasangan observasi (x i , yi ); i = 1, 2,..., n akan memenuhi persamaan yi = a + bx i + ei ; dimana ei adalah galat/eror atau kesalahan ukur. Persamaan garis yang melalui titik–titik koordinat pada diagram pencar dinamakan penduga garis linier atau regresi linier. Secara matematis dinyatakan dengan persamaan
: yˆ = a + bx ,
dimana: 1 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.
SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
a=
2 n ∑ x i yi - ∑ x i ∑ y i ∑ yi ∑ x i - ∑ x i ∑ y i dan b= 2 2 2 n ∑ xi - ( ∑ xi ) n ∑ x i - ( ∑ x i )2
Dalam perkenbangannya, sejalan dengan kemajuan dibidang komputer statistik, analisis regresi telah menjadi sangat bervariasi: •
Regresi sederhana, untuk sebuah variabel dependent dan satu buah variabel independent.
•
Regresi berganda, untuk lebih dari satu variabel independent an satu variabel dependent.
•
Regresi dengan Dummy variabel, yaitu jika data variabel independent ada yang bertipe nominal.
•
Regresi ordinal, untuk data variabel dependent yang berjenis ordinal.
•
Log regresion, untuk data variabel dependent yang berjenis nominal.
•
Regresi polinomial, yaitu model regresi yang tidak berbebntuk linier.
Dalam percobaan ini akan dibahas regresi sederhana dan regresi ganda yang relatif sederhana. •
Analisa Regresi Linier Sederhana
Yang dimaksud dengan analisa Regresi Linier sederhana (univariat) adalah analisis regresi linier dengan jumlah satu variabel independen x. Dalam membuat regresi parametrik, langkah pertama yang paling ideal adalah membuat plotting data antara variabel dependen y dan variabel independen x, hal ini dilakukan untuk melihat kecenderungan pola data asli. Jika datanya mengikuti pola linier, maka pendekatan modelnya adalah regresi linier. •
Analisa Regresi Linier Berganda
Jika kasusnya terdapat lebih dari satu variabel independen, maka model yang cocok adalah analisa regresi linier berganda. Dalam praktek bisnis, model ini sering digunakan, selain karena banyaknya variabel dalam bisnis yang perlu dianalisa secara bersama. Pada umunya variabel independen berkisar dua sampai empat variabel. 2 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.
SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
Walaupun secara teoritis dapat dilakukan banyak variabel bebas, namun penggunaan lebih dari tujuh variabel independen dianggap akan tidak relevan.
Contoh Kasus:
Dari hasil survey hubungan antara berat badan dan tinngi badan dari 9 orang dewasa diperoleh data-data sbb: No
X (CM)
Y (KG)
1
150
55
2
160
67
3
162
70
4
167
65
5
160
80
6
170
79
7
169
76
8
172
79
9
175
80
Dengan x sebagai variabel independen dan y sebagai variabel dependen. Dari data-data diatas saya akan menganalisisnya dengan mengguanakan Analisis Toolpak. Langkah-langkahnya adalah sbb: •
Masukan data seperi biasanya ke dalam lembaran kerja MS Excel 2007.
3 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.
SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
•
Selanjutnya pilih Ribbon Data. Pada sisi sebelah kanan terlihat Command Analysis, pilih menu Data Analysis, maka akan terlihat kota dialog seperti berikut ini:
•
Pilih Regression maka akan tampil kotak dialog sbb:
•
Pada Input masukan nilai X dan Y dengan memblok sel yang berisi data pada lembaran kerja. Pilih Confidence Level dan masukan tingkat kepercayaannya, misalnya 95%. 4 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.
SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
Pada Output Options pilih New Worksheet Ply dan ketikan nama Sheet untuk menampilkan Output pada Sheet baru. Pada Residuals pilih Residuals Residual Plots dan Standardized Residuals untuk menampilkan tabel Sisa dan Grafik Sisa. •
Klik OK untuk mengakhirinya.
Dari hasil Analisis diatas Diperoleh Output sbb: Tabel 1.1 Summary Options SUMMARY OUTPUT Regression Statistics
Multiple R
0.76
R Square
0.58
Adjusted R Square
0.52
Standard Error
6.01
Observations
9.00
Tabel 1.2 ANOVA ANOVA Significance df
SS
MS
F
Regression
1.00
355.11
355.11
Residual
7.00
252.89
36.13
Total
8.00
608.00
F
9.83
0.02
Tabel 1.3 Coefficients Standard Coefficients
Intercept
-69.88
Error
45.41
t Stat
-1.54
P-
Lower
Upper
Lower
Upper
value
95%
95%
95.0%
95.0%
-
37.48
0.17
-
37.48
5 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.
SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
177.25 X (CM)
0.86
0.27
3.14
0.02
0.21
177.25 1.51
0.21
1.51
Tabel 1.4 Residual Outpot RESIDUAL OUTPUT Predicted Observation
Y (KG)
Standard Residuals Residuals
1.00
59.40
-4.40
-0.78
2.00
68.02
-1.02
-0.18
3.00
69.75
0.25
0.04
4.00
74.06
-9.06
-1.61
5.00
68.02
11.98
2.13
6.00
76.64
2.36
0.42
7.00
75.78
0.22
0.04
8.00
78.37
0.63
0.11
9.00
80.95
-0.95
-0.17
Grafik 1.1 Grafik Data dan Garis Regresi
6 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.
SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
90
TINGGI BADAN (Y)
80 70 60 50 40
Series1
30
Linear (Series1)
20 10 0 140
150
160
170
180
BERAT BADAN (X)
Grafik 1.2 Grafik Sisa
X (CM) Residual Plot Residuals
20,00 10,00 0,00 -10,00 145
150
155
160
-20,00
165
170
175
180
X (CM)
INTERPRETASI •
Tabel 1.1 Summary Options Multiple R menerangkan tingkat hubungan antara variabel independen ( )ݔdan
variabel dependen ()ݕ. Dari hasil analisis didapat nilai koefisien korelasi sebesar 0.76 berarti bahwa hubungan antara berat badan dan tinggi badan adalah sebesar 76%. R Square disebut juga koefisien determinasi menerangkan seberapa besar pengaruh
variabel ݔterhadap variabel ݕ. Dari tabel dilihat nilai R Square sebesar 0.58 artinya 7 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.
SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
pengaruh berat badan terhadap tinngi badan adalah sebesar 58%, sedangkan sisanya dipengaruhi oleh variabel lain. Adjusted R Square merupakan nilai R Square yang disesuaikan sehingga
gambarannya lebih mendekati mutu penjajakan model dalam populasi. Nilai Adjusted R Square adalah sebesar 0.52. Standard Error merupakan kesalahn standar dari penaksiran, bernilai 6.01. •
Tabel 1.2 ANOVA Menjelaskan apakah model dari persamaan regresi yang digunakan sesuai atau tidak, maka hipotesisnya adalah sbb: H0 : model regresi yang digunakan tidak sesuai H1 : model yang digunakan sesuai. Dengan mengambil tingkat signifikansi alpha 0.05. ܨ௧௨ digunakan untuk menguji apakah model persamaan ݕො = ܽ + ܾ ݔyang
diajukan dapat diterima atau tidak. Caranya dengan membandingkan ܨ௧௨ tersebut dengan ܨ௧ . Jika ܨ௧௨ >ܨ௧ maka H0 ditolak atau sebaliknya. Berdasarkan Tabel 1.2 ANOVA terlihat nilai ܨ௧௨ = 9.83 > ܨ௧ = 5.59, maka H0 ditolak atau
dengan kata lain model diatas dapat diterima. Selain membandingkan ܨ௧௨ dengan ܨ௧ kita juga bias membandingkan nilai Significance F dengan tingkat signifikansi α=0.05. Jika Significance F> 0.05 maka
model ditolak. Jika Significance F< 0.05 maka model diterima. Dari tabel ANOVA diperoleh Significance F= 0.02 < 0.05 maka model tersebut dapat diterima. •
Tabel 1.3 Coefficients Setelah menguji apakah model yang digunakan sesuai atau tidak, selanjutnya kita akan menguji apakah variable independen ( )ݔmempunyai pengaruh yang nyata terhadap variabel dependen ()ݕ. 8 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.
SSI STATISTICAL STUDENT OF IST AKPRIND Sekretariat : Jln. Bimasakti No:3 Pengok Yogyakarta 55222 Tlp. (0274) 544504 E-mail :
[email protected] Blog : http://ssista.wordpress.com/
Hipotesisnya adalah sbb: H0 : variabel independen tidak mempuyai pengaruh yang nyata terhadap variabel dependen. H1 : variabel independen mempuyai pengaruh yang nyata terhadap variabel dependen. Untuk mengujinya kita akan membandingkan nilai ݐ௧௨ dengan nilai ݐ௧ untuk variable independen, jika −ݐ௧ > ݐ௧௨ > ݐ௧ maka H0 ditolak atau sebaliknya. Pada Tabel 1.3 Coefficients terlihat nilai t ୦୧୲୳୬ = 3.14 > t ୲ୟୠୣ୪ = 2.365 maka H0 ditolak, jadi variabel ݔmempunyai pengaruh yang nyata terhadap variabel ݕ. Jika model regresinya ݕො = ܽ + ܾݔ, maka kolom Coefficients menunjukan koefisien ܽ = −69.88 dan ܾ = 0.86, sehingga persamaan regresinya berbentuk : ݕො = −69.88 + 0.86 ݔ.
Sebagai
contoh
misalnya
= ݔ100
maka
ݕො = −69.88 +
0.86(200) = −69.88 + 172 = 102.12 •
Tabel 1.4 Residual Output Menerangkan selisih antara nilai ݕsebenarnya dengan nilai ݕො atau sering disingkat dengan rumus ( ݕ− ݕො). Sebagai contoh misalkan nilai = ݕ55 dan nilai ݕො = 59.40 maka sisanya adalah −4.40.
9 http://ssista.wordpress.com/
Please purchase 'e-PDF Converter and Creator' on http://www.e-pdfconverter.com to remove this message.