Praktikum Statistika Industri – Modul 4 – Regresi
Modul Praktikum Regresi Praktikum Statistika Industri Laboratorium Manajemen industri Jurusan Teknik Industri Fakultas Teknik Universitas Trunojoyo Madura- Bangkalan
Modul 4 Regresi
R
egresi, suatu teknik yang sangat luas penggunaannya, sangat terkenal, namun juga sangat menakutkan. Menakutkan karena keterkenalannya, di tangan yang salah regresi bisa jadi alat yang sangat mudah dipakai namun juga dengan kesalahan yang mudah dipraktekkan.
Sangat cepat dipakai, namun hal tersebut juga berarti bisa salah dengan cepat di tangan yang tidak berpengalaman. Regresi sangat sering dipakai, namun juga sangat sering dipakai secara tidak benar. Seperti semua teknik dalam statistika, if you fit a silly model, you will get silly result. Apalagi bila Anda menggunakan teknik regresi pada kasus-kasus sosial, seperti pada kasus di praktikum ini, perhatian lebih haruslah dicadangkan bila hendak menggunakan teknik regresi. Teknik regresi dengan least square mampunyai banyak asumsi, ditambah kesalahan yang akan terjadi bila variabel penentunya saling berkorelasi. Untuk mencegah hal-hal yang kurang baik terjadi, selalu plot hubungan antar variabelnya, lakukan IDA (Initial Data Analysis), dan perkirakan model yang tepat berdasarkan informasi yang ada, latar belakang masalah dan pengalaman yang telah ada. Untuk menggambarkan betapa bahayanya regresi, khususnya regresi berganda, lihatlah puisi di bawah ini:
T h e Bal l ade of Mu l t i pl e Regressi on I f you want t o deal best wi t h your quest i ons, Use mul t i - regres si on t echni ques; A Comput er ca n do i n a mi nut e What , ot her wi se done, woul d t ake week s, For ‘ predi ct or sel e ct i on’ procedure s Wi l l pi ck j ust t he one best f or you A nd provi de t he best -f i t t i ng equat i on For t he dat a you’ ve f i t t ed i t t o B ut di d you col l ect t he ri ght dat a? Were t he re ‘ gl ari ng omi ssi ons’ i n yours ? Have t he ones t hat score hi ghl y much meani ng? Can you t el l t he ef f ect f rom t he cause? A re your ‘ cause’ f act ors ones you can act on? I f not, you’ ve got more work t o do; Your equat i on’ s as good – or as bad – as T he dat a you’ ve f i t t ed i t t o dari Tom Corlett, Applied Statistics, 1963, 2 bait pertama Jadi berhati-hatilah! Anda telah diperingatkan! A. TUJUAN PRAKTIKUM
Praktikum Statistika Industri – Modul 4 – Regresi
1. Praktikan dapat memahami data kualitatif dan data kuantitatif. 2. Praktikan mampu memahami penggunakan data kualitatif maupun kuantitatif pada analisa regresi. 3. Praktikan dapat memahami dan mengetahui teknik pembuatan simple dan multiple linear regression untuk menjelaskan hubungan antara 2 jenis variabel. 4. Praktikan dapat melakukan hypothesis test dan interval test pada simple linear regression. 5. Praktikan dapat menentukan koefisien korelasi dan determinasi beserta analisisnya. 6. Praktikan dapat menentukan persamaan regresi linear baik simple maupun multiple dengan bantuan software dan mengaplikasikannya pada kehidupan nyata. 7. Praktikan mengetahui batasan-batasan, asumsi, dan bahaya dari teknik regresi 8. Praktikan dapat menggunakan SPSS dengan teknik regresi B. LANDASAN TEORI Analisa regresi adalah sebuah pendekatan yang digunakan untuk mendefinisikan hubungan matematis antara variabel output/dependen (y) dengan satu atau beberapa variabel input/independen (x). Hubungan matematis digunakan sebagai suatu model regresi yang digunakan untuk mereamalkan atau memprediksi nilai output (y) berdasarkan nilai input (x) tertentu. Dengan analisis regresi, akan diketahui variabel independen yang benar-benar signifikan mempengaruhi variabel dependen dan dengan variabel independen yang signifikan tadi dapat digunakan untuk memprediksi nilai variabel dependen. Model regresi linier sesungguhnya mengasumsikan bahwa terdapat hubungan linier antara variabel dependen dengan setiap variabel independen. Hubungan linier ini secara matematis digambarkan dalam rumus sebagai berikut: Y = b0 + b1X1 + b2X2 + b3X3 +.......+ bnXn + ℮ Dimana : b0
= intercept
b1, b2, b3, bn
= koeficient regresi
X1, X2, X3, Xn
= variabel independen
Y
= variabel dependen
℮
= eror/residu
Praktikum Statistika Industri – Modul 4 – Regresi
Regresi linear adalah suatu teknik dalam statistika untuk menentukan persamaan garis secara linear yang dapat meminimasi penyimpangan dan deviasi antara nilai data yang didapat dari observasi dengan yang didapat dari suatu persamaan regresi. Dalam regresi linear, terdapat dua macam variabel yaitu: 1. Variabel X atau independent variable1 adalah variabel yang nilainya tidak tergantung pada variabel lainnya. Variabel ini memiliki nilai yang sudah pasti (tidak random) dalam suatu eksperimen. 2. Variabel Y atau dependent variable adalah variabel yang nilainya tergantung pada variabel lainnya yaitu variabel independen. Variabel ini memiliki nilai yang random dalam suatu eksperimen. Jika pasangan observasi pengukuran (Xi,Yi) digambarkan, maka kita akan memperoleh serangkaian titik-titik koordinat yang menghubungkan kedua hasil observasi yang disebut dengan scatter diagram. Garis yang ditarik melalui titik-titik koordinat hasil dari suatu observasi dinamakan regression line.
Variabel dummy Pada beberapa kasus analisa regresi pasti melibatkan data kualitatif pada variabel independen, misalnya saja jenis kelamin, pendidikan dan laian-lain. Pada dasarnya regresi tidak bisa dilakukan dengan data kualitatif maka dari pada itu data kualitatif itu harus dikuantitatifkan dengan teknik dummy. Perlu diingat bahwa angka-angka dummy yang mewakili data kualitatif hanya simbol. Penggunaan simbol dummy yaitu menggunakan angka 0 dan 1, dimana angka 1 biasanya menggambarkan data kualitatif yang dianggap lebih tinggi. Misal saja tingkat pendidikan antara SD dan SMP, maka dummy untuk SMP ada;ah 1 dan yang lain adalah 0. Penentuan jumlah variabel dummy bergantung dari jumlah kategori yang ada. Jika jumlah kategori yaitu n, maka variabel dummy dirumuskan n-1.
Menentukan persamaan regresi Persamaan : Yˆi a bX i simple linear regression Untuk memudahkan perhitungan, maka dengan mentranslasikan titik origin (0,0) ke titik ( X ,Y ) maka akan didapat persamaan yang lebih sederhana karena konstanta akan tereliminasi sehingga persamaan akan menjadi y y b( x x) 2
Dengan a’=0 dan b= X X Y Y
X X
2
Dengan independent variable yang lebih dari satu, maka regresi akan menjadi regresi berganda / multiple regression, dan asumsi-asumsinya tetap ada. Bila independent variable lebih dari satu, maka akan ada x1, x2, x3, dst, sehingga akan terdapat b 1, b2, b3, dst. Nilai b tersebut hanya akan tidak berkorelasi bila desainnya ortogonal, dalam artian y didapat dengan mengubah
Praktikum Statistika Industri – Modul 4 – Regresi
satu-persatu nilai x dengan yang lainnya tetap. Bila independent variable memang bisa kita kontrol, maka akan mudah untuk merancang desain yang ortogonal. Hal ini tidak hanya membuat analisisnya mudah namun juga membuat setiap variabel independen bisa dinilai satu per satu secara independen. Meskipun begitu, pada prakteknya, hal ini sangat sulit untuk dilakukan, apalagi biasanya antar variabel independen terdapat keterkaitan (correlated) pada masalah-masalah sosial. Dengan variabel-variabel independen yang saling berkaitan, adalah tidak aman untuk mengintepretasikan masing-masing koefisien yang ada pada model, dan model yang sepertinya fit dengan baik bisa jadi tidak tepat (misleading). Terkadang ada variabel-variabel independen yang sangat berkorelasi sehingga kedua variabel yang sangat bervariasi tersebut bisa dianggap satu variabel. Hal ini disebut dengan istilah multicollinearity. Hal ini bisa terjadi karena ada variabel independen yang redundan karena batasan-batasan fisik atau teknik sampling yang digunakan. Beberapa variabel independen mungkin tidak menyumbangkan kontribusinya, atau tidak berpengaruh dan bisa dihilangkan dari model. Ada beberapa teknik stepwise regression yang bisa dipakai, antara lain backward elimination (di mana variabel independen yang paling tidak penting dikeluarkan sampai semua variabel independen penting) atau forward selection (di mana model dimulai dari 0 variabel independen). Meskipun begitu, pengetahuan eksternal perlu dipakai tanpa sehingga tidak terlalu mengandalkan pemilihan variabel terotomatisasi, bahkan mungkin pada awalnya sudah terdapat perkiraan model yang baik dari pendapat ahli di bidangnya. Suatu regresi tidak dapat dibangun dengan jumlah observasi kurang dari jumlah variabel independennya. Ada aturan empiris yang menyebutkan bahwa variabel independen dalam satu model regresi jangan melebihi satu per empat dari jumlah observasinya, juga tidak baik mempunyai lebih dari lima variabel independen dalam satu model sekaligus. Sampai dengan di sini, Anda seharusnya sudah mulai menyadari kelemahan dan bahaya dari regresi. Meskipun terlihat simpel namun bila Anda sudah mengenalnya, teknik ini akan menjadi salah satu teknik terbahaya yang pernah Anda temui. Ada peneliti (Preece, 1984) yang meneliti bahwa ada sekitar 100.000 regresi berganda yang dilakukan setiap harinya di seluruh dunia, namun hanya 1 dari 100 regresi berganda yang masuk akal.
Praktikum Statistika Industri – Modul 4 – Regresi
Menentukan koefisien kolerasi dan determinasi Correlation Coefficient ( r ) adalah ukuran hubungan/relasi antara 2 variabel. r
n X
n XY X Y 2
X n Y Y 2
2
2
1
Pearson’s product moment correlation 2
Batas interval : 1 r 1 r= 1
: Korelasi linear sempurna
r=0
: Tidak terdapat korelasi linear
r>0
: Korelasi positif
r<0
: Korelasi negatif
Koefisien korelasi tidak mempunyai dimensi dan harap diperhatikan bahwa koefisien korelasi Pearson di atas hanya dapat digunakan untuk meneliti korelasi antar dua variabel berskala interval/rasio. Harap diperhatikan bahwa korelasi tidak mencerminkan adanya hubungan sebab akibat!
Determination Coefficient ( r 2 ) adalah perbandingan antara variasi yang dapat dijelaskan oleh regresi dengan total variasi.
Yˆ Y Y Y
2
r2
SS R SS T
2
explained variations residual variations residual SS 1 1 total variations total variations total SS
Satu masalah dalam koefisien determinasi adalah koefisien ini akan semakin besar semakin banyak variabel independen yang dimasukkan, meskipun variabel yang dimasukkan sebenarnya tidak berguna. Koefisien alternatif yang sangat banyak dipakai untuk penggantinya adalah R2(adjusted) yang memperhitungkan jumlah parameternya. r 2 (adjusted ) 1
residual MS total MS
yang pasti lebih kecil daripada koefisien determinasi biasa dan lebih tidak menipu dibandingkan koefisien determinasi biasa. Juga hati-hati terhadap terjadinya overfit.
Praktikum Statistika Industri – Modul 4 – Regresi
Cara pengolahan data dengan software: Teknik statistika regresi sangat baik diimplementasikan dalam SPSS, hal ini mengingat teknik regresi sangat luas pemakaiannya di dalam bidang sosial. Software MINITAB yang diproyeksikan untuk mendukung perusahaan manufaktur agak lemah dalam regresi meskipun terdapat fitur-fitur yang tidak terdapat dalam SPSS. Oleh karena itu, Anda diharapkan menggunakan SPSS sebagai software utama dan MINITAB sebagai software penunjang. Cara mengolah data dengan SPSS adalah sebagai berikut: 1) Pilih Analyze Regression Linear 2) Masukkan variabel dependen dan independennya 3) Pilih metode backward elimination bila hendak dibuat multiple regression. 4) Pilih statistics
Checklist yang terdiri dari estimates dan collinierity doagnostics pada Regression Coeficients.
Checlist durbin-watson.
5) Pilih plots
Klik SDRESID
dan masukkan ke pilihan Y. Kemudian klik ZPRED dan masukkan ke
pilihan X. 6) Klik Continue untuk meneruskan. 7) Pilih OK, akan keluar outputnya 8) Anda akan dibimbing oleh asisten dalam mengartikan outputnya 9) Bila dibuat model multiple regression, model yang paling akhir biasanya merupakan model yang paling baik dengan F-value yang paling besar dalam ANOVA-nya, meskipun hal ini tidak menjamin. 10) Bila model multiple regression yang hendak dipilih mempunyai condition index terakhir yang lebih besar dari 15, apalagi lebih besar dari 30, maka terdapat masalah yang serius yang disebabkan oleh multicollinearity. Bila hal ini terjadi, maka Anda harus memecah model ini menjadi dua model (atau lebih), atau mengurangi variabel independen yang terkait erat dengan variabel independen lainnya (dapat dilihat pada tabel ‘correlations’. 11) Sebagai panduan, bila dilakukan dan dianalisis dengan baik, dan memenuhi semua asumsi dan aturan regresi, biasanya regresi berganda mempunyai performansi yang lebih baik daripada regresi simpel. C. PROSEDUR PRAKTIKUM Pada modul 4 regresi ini, praktikan akan meneliti sebuah kasus di kehidupan nyata. Penentuan kasus terserah anda sebagai praktikan dengan ketentuan kasus tersebut memiliki minimal 4 variabel independent dengan 1 variabel dependent. Pemilihan variabel independen maupun dependen pada kasus tersebut haruslah berdasarkan literatur yang dapat dipercaya (buku, junal atau yang lain). Data yang digunakan bisa data kualitatif atau kuantitatif, bisa juga gabungan dari data kualitatif dan kuantitatif.
Praktikum Statistika Industri – Modul 4 – Regresi
D. PENGUMPULAN DATA Pengambilan data dilakukan berdasarkan kasus yang digunakan (tentunya berbeda antar kelompok). Semakin banyak anda dapat mengidentifikasi variabel-variabel independen, maka makin baik hasil yang akan dicapai dalam regresi ini.
E. FORMAT LAPORAN
BAB I PENDAHULUAN
I.1 Latar Belakang Masalah I.2 Tujuan Praktikum I.3 Tinjauan pustaka I.4 Metodologi penelitian
BAB II HASIL DAN PEMBAHASAN II.1 Identifikasi Variabel Dependent & Independent serta Korelasi empiris-nya II.2 Data Mentah II.3 IDA dan Data Plotting II.4 Uji Asumsi II.4.1 Uji t II.4.2 Uji f II.4.3 Analisa multikolinieritas II.4.4 Analisa heterokedestisitas II.4.5 Analisa autokorelasi II.4.6 Analisa kenormalan II.5 Penentuan variabel terbaik II.6 Pembuatan Model-Model Regresi II.6.1 Single Factor II.6.2 Multi Factor BAB III PENUTUP III. 1 Kesimpulan III. 2 Saran
Lampiran
Praktikum Statistika Industri – Modul 4 – Regresi
F. REFERENSI
Blank, Leland. 1980. Statistical Procedures for Engineering, Management, & Science. New York : McGraw Hill.
Kurniawan , Heri dan Yamin, Yusuf. 2009. SPSS Complete: Teknik Analisa Terlengkap Degan Software SPSS . jakarta: Salemba Infotek.
Santoso, singgih. 2010. Statistik Multivariat. Jakarta: Elex Media Komputindo
Simamora, Bilson. 2005. Analisa Multivariat Pemasaran. Jakarta: Gramedia Pustaka Utama.
Walpole, Ronald E., dan Raymond H Myers. 1995. Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuwan. Bandung : ITB.
Winardi. 1981. Manajemen Pemasaran. Bandung: Sinar Baru