BAB VII. MASALAH DALAM ANALISIS REGRESI 7.1 Pendahuluan Dalam pembicaraan ini, secara umunm akan dibahas syarat-syarat atau asumsi-asumsi dasar yang sering digunakan dalam analisis regresi yang disebut dengan asumsi klasik dalam metode OLS (ordinary least squares) yang sangat sering dilanggar di dalam melakukan estimasi sebuah model regresi, sehingga parameter yang diperoleh menjadi menyimpang atau bias atau jauh dari harapan, tidak konsisten, dan tidak efisien. Apabila dalam analisis regresi tidak didasarkan pada analisis yang benar maka akan mengakibatkan hasil pedugaan regresi akan menyimpang dari harapan. Misalnya, apabila dalam peubah bebas Xi terjadinya kolinieritas ganda yang sempurna akan menyebabkan matriks X’X menjadi singular, sehingga tidak mempunyai determinan dan akibatnya koefisien regresi bi tidak dapat diduga. Untuk melakukan analisis regresi yang benar berdasarkan metode OLS, maka diperlukan asumsi-asumsi yang harus dipenuhi di antaranya adalah: 1. Asumsi pertama yaitu: nilai tengah (mean value) dari komponen pengganggu ui, yang ditimbulkan variabel eksplanatori atau variabel bebas X harus sama dengan nol. 2. Asumsi kedua yaitu: varians dari komponen penggangu ui harus konstan atau harus memenuhi syarat homoskedastisitas atau setiap variabel bebas X mempunyai varians komponen penggangu ui harus sama. 3. Asumsi ketiga yaitu: tidak terjadi autokorelasi antar komponen penggangu ui atau harus konstan atau tidak terjadi korelasi antar Xt dengan Xt+1 dan seterusnya. 4. Asumsi keempat yaitu: variabel eksplanatori atau variabel bebas X nilainya harus non stokastik atau apabila bersifat stokastik harus menyebar bebas dari komponen pengganggunya. 5. Asumsi kelima yaitu: tidak terjadi multikolinieritas antarvariabel eksplanatori atau variabel bebas X 6. Asumsi keemam yaitu: komponen pengganggu ui harus menyebar menurut sebaran normal dengan nilai tengah μ = 0 dengan varians sebesar σ2 hal ini kalau terpenuhi, maka asumsi 1) dan asumsi 2) secara otomatis telah terpenuhi. . Dengan keenam asumsi tersebut di atas dapat diketahui bahwa estimator OLS dari koefisien regresi bi ternyata bersifat BLUE (Best Linier Unbias Estimaior), dan atas dasar asumsi normalitas maka estimator–estimator tersebut akan menyebar mengikuti sebaran normal. Sehingga, hasilnya memungkinkan unuk mendapatkan suatu kisaran atau range yang dapat diuji kebenarannya terhadap koefisien regresi populasi βi. Dalam uraian selanjutnya tidak akan dibahas lebih mendalam untuk asumsi-asumsi pertama, keempat, dan keenam, karena pelanggaran asumsi tersebut tidaklah serius akaibatnya dalam analisis regresi.
7.1.1 Pelanggaran terhadap asumsi pertama Pelanggaran terhadap asumsi pertama yang akibatnya tidaklah begitu parah mempengaruhi hasil perhitungan dalam prakteknya, sebab hanya akan berpengaruh pada nilai intersep atau b0 yaitu titik potong terhadap sumbu vertikal Y. Hal ini dapat ditunjukkan dengan model persamaan: Yi = B0 + B1 X1 + ui.
157
PDF created with pdfFactory Pro trial version www.pdffactory.com
Misalkan apabila E(ui) ≠ 0, tetapi sama dengan suatu nilai tertentu k. Dengan demikian, nilai harapan bersyarat bagi model tersebut di atas diperoleh: E(Y/Xi) = = = =
B0 + B1 X1 + ui atau B0 + B1 X1 + E( Y/Xi) B0 + B1 X1 + k A + B1 X1
di mana A = B0 + B1 X1
Jelaslah bahwa asumsi pertama tidak terpenuhi menurut kekentuan, maka sebagai akibatnya tak bisa menaksir atau menduga nilai B0 yang sebenarnya. Akan tetapi, karena pada prakteknya intersep B0 kadang-kadang tidak begitu dipentingkan dibandingkan dengan nilai B1 yang diutamakan, dengan demikian jelaslah bahwa asumsi pertama tidak dipentingkan, walaupun asumsi pertama tidak memenuhi saumsi yang disyaratkan dalam analisis.
7.1.2 Pelanggaran terhadap asumsi keempat Pelanggaran terhadap asumsi keempat, walaupun pada pendekatan model-model regresi merupakan hal yang harus memenuhi syarat-syarat terutama terhadap variabel bebas X atau variabel eksplanatori X. Terdapat beberapa alasan terhadap pendekatan ini di mana para ekonom bekerja dengan data yang bersifat skunder atau data dikumpulkan oleh lembaga yang lain. Dengan demikian data yang terkumpul tersebut belum tentu memenuhi asumsi yang bersifat nonstokastik, sehingga datanya masih dapat dianalisis. Dengan demikian, masalah variabel bebas X yang harus bersifat non stokastik tidak mutlak dapat dipenuhi, selama masih dapat memberikan pembatasan atau alasan sehingga analisis regresi dalam prakteknya masih bisa digunakan pendugaan nilai koefisien regresi dapat diinterprestasikan.. Apabila pelanggaran asusi terus dilakukan maka akan didapatkan hasil di mana E(bi) tidak akan sama dengan Bi. Hal ini dapat dijelaskan, umpamanya dalam asumsi ke lima yang terus-menerus dilanggar, maka akan tampak pada analisis dengan model simultan. Pada analisis model simultan atau serentak yaitu model yang lebih dari satu persamaan regresi, di mana dalam model ini komponen pengganggu ui hampir semuanya berkorelasi dengan satu atau beberapa variabel bebas eksplanotori X lainnya. Dalam keadaan yang demikian ini dapat dikatakan bahwa estimator OLS tidak hanya berbias tapi juga tidak konsisten. Sebagai misal dapat dicontohkan di sini seperti yang dinyatakan dengan model beikut: Yi = B0 + B1 X1 + ui. 2
bi = B1 + (∑Xu1)/ (∑X1 ) Apabila X dan u berkorelasi, maka bagian terakhir dari persamaan yang kedua di atas tidak akan sama dengan nol. Oleh karena itu, E(b1) tidak akan sama dengan B1 atau dikatakan sama dengan b1, tetapai akan membias. Dalam asumsi keempat nanti akan dikatakan bahwa apabila terjadi bias tidak akan muncul jika jumlah sampelnya diperbesar atau ditambah. Jika variabel-variabel eksplanatori dan komponen pengganggu ui berkorelasi atau keduanya berkorelasi maka metode OLS tidak dapat dipergunakan
7.1.3
Pelanggaran terhadap asumsi keenam
Pelanggaran terhadap asumsi keenam, dalam hal ini pelanggaran terhadat asumsi ini tidaklah dianggap penting, sebab sebaran data yang normal sangat tergantung pada jumlah sampel atau bagaimana data itu diambil atau dikumpulkan. Apabila tujuan daripada analisis data hanya semata-mata untuk melakukan estimasi atau pendugaan koefisisen regresi bi saja, maka sebaran nomar tidak dianggap penting. Telah diketahui bahwa estimator OLS adalah bersifat BLUE apakah ui menyebar normal atau tidak tidaklah dianggap mempengaruhi hasil analisis.
158
PDF created with pdfFactory Pro trial version www.pdffactory.com
Lebih jauh dapat ditunjukkan bahwa apabila ui menyebar normal, estimator OLS cendrung akan menyebar normal asimtotik, yang hanya berlaku untuk junlah pengamatan yang relatif banyak. Apabila jumlah pengamatan relatif kecil yang kurang dari 30 sampel, tanpa asumsi normalitas estimator OLS tidak akan menyebar normal. Data ekonomi yang biasanya tidak terlalu besar maka asumsi normalitas data sangat diperlukan, untuk pengujian hipotesis, estimasi, dan peramalan. Selanjutnya, akan diuraikan asumsi-asumsi kedua, ketiga, dan kelima, dengan anggapan bahwa apabila tidak disebutkan, maka asumsi kenormalan menjadi suatu syarat keharusan, dan telah dilakukan, dan ini sangat diperlukan dalam membuat perkiraan dan pengujian hipotesis.
7.2
Uji Kolinieritas Ganda (Multicollinierity) [Asumsi ke Lima]
Multikolinieritas ada lah merupakan pelanggaran terhadap asumsi kelima yang dipenuhi dalam analisis regresi linier. Multikolinieritas diartikan adanya hubungan linier yang sempurna atau eksak diantara variabel-variabel bebas X dalam metode analisis regresi. Istilah kolinieritas sendiri adalah hubungan linier tunggal (single linier relationship), sedangkan kolinieritas ganda (multikolinierity) menunjukkan adanya lebih dari satu hubungan linier yang sepurna. Untuk hubungan yang terdiri atas sejumlah k variabel bebas X termasuk X0 di mana k = p +1, dan p = jumlah varibel bebas Xi (X1, X2, X3, . . . , Xk). Hubungan linier yang sempurna atau eksak akan terjadi kalau berlaku hubungan seperti: [7.1] C1 X1 + C2 X2 + . . . + Ck Xk = 0. Di mana: C1, C2, . . . , Ck apabilangan konstan yang tidak seluruhnya sama dengan nol atau paling tidak ada satu yang bernikai tidak sama dengan nol
Istilah kolinieritas ganda dipergunakan dalam arti yang lebih luas yang mencakup hubungan linier sempurna atau eksak seperti pada persamaan [7.1] dan juga di mana variabel-variabel bebas X interkorelasi, akan tetapi tidak sempurna seperti hubungan berikut: [7.2] C1 X1 + C2 X2 + . . . + Ck Xk + Vi = 0. Di mana: Vi adalah kesalahan pengganggu
Apabila ada dua variabel bebas X interkorelasi dapat diukur dengan koefisien korelasi sederhana atau koefisien korelasi order nol, tetapi apabila terdapat lebih dari dua variabel bebas X interkorelasi dapat diukur dengan koefisien korelasi parsial atau koefisien korelasi berganda antara satu variabel bebas X dengan sisa variabel bebas X lainnya secara simultan. Untuk mengetahui perbedaan antara hubungan linier sempurna dan hampir sempurna, dengan anggapan C2 ≠ 0. Persamaan [7.1] dapat ditulis seperti berikut: [7.3]
X 2i =
C C C1 X 1i − 3 X 3i − . . . − k X ki C1 X1. C2 C2 C2
Dari persamaan [7.3] dapat diketahui bagaimana X2 menunjukkan hubungan linier sempurna sengan sisa variabel lainnya secara keseluruhan, atau bagaimana hubungan tersebut dapat diturunkan (deriveted) dari suatu kombinasi linier terhadap variabelvariabel lainnya. Dalam hal ini, koefisien korelasi antara X2 dan kombinasi linier yang berada disebelah kanan tanda sama dengan persamaan [7.3] dengan nilai satu (unity).
159
PDF created with pdfFactory Pro trial version www.pdffactory.com
Hal yang sama apabila C2 ≠ 0. Persamaan [7.3] dapat ditulis seperti berikut: [7.4]
X 2i =
C C C1 1 X 1i − 3 X 3i − . . . − k X ki − Vi C2 C2 C2 C2
Bahwa dari persamaan [7.4] menunjukkan tidak terjadi hubungngan linier sempurna dengan sisa variabel lainnya, sebab masih tergantung pada kesalahan pengganggu dengan kesalahan stokastik (stocastic error term). Sebagai teladan perhatikan data hipotetis berikut: X1 0 15 18 24 30
X2
X3*
50 75 90 120 150
50 75 97 150 152
Dari tabel data di atas terlihat bahwa X2 = 5X1 menunjukkan hubungan yang sepurna antara X1 dengan X2 dikarenakan terdapat nilai koefisien korelasi antara X1 dengan X2 yaitu r12 = 1 (coba anda hitung sendiri lagi besarnya nilai r12 tersebut). Apabila data X3 diperhatikan dengan baik, ternyata nilai data X 3 dapat diperoleh dari data X2 dengan menambahkan suatu nilai atau apabilangan sebesar 2; 0; 7; 9; dan 2 terhadap data X2, sehibngga tidak terdapat hubungan yang sempurna antara X2 dengan X3, tetapi hubungannya sangat kuat karena koefisien korelasi antaraa X2 dengan X3 dengan r23 = 0,9959 mendekat 1 (unity). Perlu ditegaskan di sini bahwa kolinieritas ganda hanya berlaku untuk hubungan linier antara variabel bebas Xi, dan tidak berlaku bagi hubungan yang bukan linier atau non linier. Mengapa perlu adanya nonkolinieritas pada variabel bebas X dalam analisis regresi linier, hal ini diperlukan dengan alasan bahwa apabila terjadi kolinieritas antara variabel bebas X yang bersifat sempurna seperti contoh data di atas maka dari variabel bebas X yang berkorelasi linier sempurna koefisien regresinya tidak akan dapat diestimasi bahkan tidak dapat ditentukan, serta salah baku koefisien regresi bernilai tidak berhingga (infinite). Apabila terjadi kolinieritas yang kurang sempurna, koefisien regresi tetap masih bisa ditentukan, tetapi akan mempunyai nilai salah baku koefisien regresi yang sangat besar, sehingga koefisien regresi regresi tidak dapat diperkirakan dengan pasti sampai tinggkat ketelitian yang tinggi (pendugaan nilai beta tidak didapatkan). Dalam analisis regresi yang dilakukan, telah terdapat anggapan bahwa variabel bebas X adalah bersifat bebas sesamanya di dalam mempengaruhi variabek tak bebas Y. Kalau terjadi hubungan linier yang kuat pada semua variabel bebas X, akan berdampak pada tidak dapat melakuakan pemisahan pengaruh individu masing-masing variabel bebas X terhadap variabel Y. Sebagai ilustrasi, di mana sulit memisahkan antara pengaruh kekayaan dan pendapatan terhadap konsumsi dapat ditulis dengan persamaan: [7.5]
Konsumsi = B1 + B2 pendapatan + B3 kekayaan + ε
atau dapat ditulis
Konsumsi = B1 + B2 X2i + B3 X3i + εi Dalam contoh di atas bisa terjadi bahwa antara kekayaan dan pendapatan mempunyai koefisien korelasi yang mendekati satu (unity) sebab orang kaya bisa pendapatanya tinggi. Secara logika antara kekayaan dan pendapatan berpengaruh sendiri-sendiri terhadap konsumsi, dalam kenyataannya sulit dibedakan atau dipisahkan.
160
PDF created with pdfFactory Pro trial version www.pdffactory.com
7.2.1 Estimasi kolinieritas ganda sempurna Estimasi kolinieritas ganda yang sepurna dalam analisis regresimenyebabkan koefisien regresi tidak dapat diestimasi dan salah bakunya adalah infinite atau tak berhingga dapat ditunjukkan dengan regresi berganda dua variabel bebas X dengan persamaan: Y = B0 + B1 X1i + B2 X2i + εi. [7.6a]
B1 =
∑ x22 ∑ x1 y − ∑ x2 y ∑ x1 x2 ` 2 ∑ x12 ∑ x22 − (∑ x1 x2 )
[7.6b].
B2 =
∑ x12 ∑ x2 y − ∑ x1 y ∑ x1 x2 2 ∑ x12 ∑ x22 − (∑ x1 x2 )
Dengan anggapan apabila x2 = k x1, di mana k ≠ 0 maka persamaan koefisien regresi B2 menjadi:
B2 =
=
∑ (k x1 ) 2 ∑ x1 y − ∑ k x1 y ∑ x1 k x1 ` 2 2 ∑ x12 ∑ (k x1 ) − (∑ x1k x1 ) k 2 ∑ x 12
∑ x1 y − k ∑ x 1 y k ∑ x12 ` 2 ∑ x12 k 2 ∑ x12 − k 2 (∑ x 12 )
Nilai B1di atas tidak dapat ditentukan, demikian juga halnya dengan nilai B2. karena kernilai nol dibagi dengan nol. Ingat arti dari nilai B1 dan B2. yang menyebabkan perubahan yang terjadi pada nilai Y apabila nilai X1 berubah satu unit, dengan anggapan bahwa nilai X2 konstan atau tetap. Dalam pengertian di mana X1 dan X2 berkorelasi dengan sempurna, maka tidak dapat membuat X1 yang konstan apabila X2 berubah, karena perubahan X2 akan diikuti oleh perubahan X1 dengan perubahan berkelipatan k. Ini berart tidak dapat memisahkan antara X1 dan X2. terhadap Y apabila terjadi korelasi yang sempurna...
7.2.2
Estimasi kolinieritas ganda kurang sempurna
Terjadinya kolinieritas ganda yang sempurna antara variabel bebas Xi ataau antara variabel bebas Xi bebas sesamanya merupaka keadaan yang ekstrim di dalam analisis regresi linier berganda dan sangat jarang terjadi. Suatu hal sering terjadi adalah bahwa korelasi antara variabel bebas Xi tidak bernilai satu atau nol, jadi mempunyai nilai 0 < rij < 1. Perhatikan persamaan berikut: [7.7] `
X1 = c + d X2 + V Di mana: V residual yang sangat kecil sehingga ∑V = ∑X2V = 0
161
PDF created with pdfFactory Pro trial version www.pdffactory.com
Koefisien korelasi antara X1 dan X2 dapat dihitung dengan rus Pearson seperti: [7.8].
r12 =
∑ x1 x2 ∑ x12 ∑ x22
=
∑ (dx 2 + V ) x2 ∑ (dx 2 + V ) 2 ∑ x 22
=
∑ dx22 d 2 (∑ ( x 22 ) 2 + ∑ V 2 ∑ x 22
Dari analisis regresi linier sederhana bahwa nilai koefisien korelasi adalah: [7.9]
r12 =
d 2 ∑ x 22 d 2 (∑ x 22 +
∑V 2
Apabila ∑ V 2 = 0 maka r12 = 1 sehingga akan didapatkan kolinieritas ganda yang sempurna antara kedua variabel X1 dan X2. Akan tetapi, sebaliknya apabila 2 2 didapatkan bahwa nilai d = 0, sehingga nilai r12 = 0, yang berari bahwa X1 V = x ∑ ∑ 1 dan X2. bebas sesamanya. Pada umumnya dalam analisis regresi berganda jarang terjadi kedua nilai ektrim di atas, atau. didapatkan nilai 0 < ∑ V 2 < 1 sehinga nilai 0 < r12 < 0, kenyataan ini berati bahwa antara variabel bebas X1 dan X2 terdapat korelasi tetapi tidak sempurna. Untuk mengukur adanya kolinieritas ganda pada suatu model persamaan regresi linier berganda, dapat ditentukan dengan semakin tinggi nilai koefisien korelasi antara dua variabel bebas X, maka semakin tinggi juga derajat kolinieriras ganda yang terdapat dalam peubah bebas tersebut. Apabila dalam suatu model persamaan yang terdiri atas p buah variabel bebas Xi di mana p > 2, maka. ukuran derajat korelasi antara dua variabel bebas X tidak bisa dipakai mengukur adanya kolinieritas yang meyakinkan, kecuali terjadi kolinieritas sempurna atau rij = 1. Ada pula yang menyatakan apabila nilai kofisien korelasi rij = > 0,90 terdapat indikasi adanya sifat kolinieritas, tetapi hal ini sangat tidak dapat diterima apabila jumlah sampel sangat rendah atau minim, dan hal ini dapat diterima apabila jumlah sapel di atas 30.. Banyak peneliti menggunakan determinant X’X yang rendah sebagai pengukur adanya kolinieritas ganda, akan tetapi batas rendah suatu determinan sangat tergantung pada ukuran sampel dan jumlah variabel bebas X. Selain dengan menggunakan cara di atas sebagai pengukur adanya kolinieritas ganda, 2 dapat juga digunakan cara lain yaitu mengetahui selisih koefisien determinasi (R ) model penuh dengan kuadrat koefisien korelasi individual variabel bebas Xi. Apabila selisih 2 antara koefisien determinasi (R ) model penuh dengan kuadrat koefisien korelasi variabel bebas Xi individual yang nilainya terkecil atau minimal maka variabel tersebut diindikasikan terdapat kolinieritas ganda. Dengan berkembangnya alat analisis data dengan berbagai solf-wares statistika, sering digunakan nilai VIP (variance inflaction vactor) atau tolerance untuk menentukan adanya kolinieritas ganda, di mana VIP = 1/tolerance. Untuk mengetahui adanya kolinieritas ganda pada variabel bebas Xi. Kedua ukuran tersebut menyatakan setiap variabel bebas Xi yang manaka dapat dijelaskan oleh variabel bebas Xi yang lainnya. Dalam pengertian sederhana setiap variabel bebas Xi menjadi variabel tak bebas (variabel terikat) yang diregresikan terhadap variabel bebas Xi yang lainnya.
162
PDF created with pdfFactory Pro trial version www.pdffactory.com
Tolerance mengukur variabilitas variabel terpilih yang tidak dijelaskan oleh variabel bebas Xi yang lainnya. Jadi nilai tolerance yang rendah atau sebaliknya nilai VIP yang tinggi menyatakan adanya kolinieritas ganda. Standar nilai VIP yang dipakai adalah 10 atau nilai tolerace = 0,1, hal ini tergantung pada peneliti yang dapat juga menentukan standar sendiri.
7.2.3
Cara mengatasi persoalan dengan adanya kolinieritas ganda
Dengan berkembangnya alat analisis data dengan berbagai solf-wares statistika, maka cara untuk mengatasi adanya kolinieritas ganda akan menjadi lebi cepat diatasi. Apa yang perlu dilakukan ?. Tidak ada satupun cara yang efektif untuk mengatasi adanya kolinieritas ganda. Sebab kolinieritas pada prinsipnya adalah persoalan sampel yang dianalisis. Jadi sampel yang dianalisis telah membawa keadaaanya tersendiri seperti kolinieritas atau sifat yang lain. Beberapa cara diajukan untuk menangani adanya sifat kolinieritas ganda yaitu: 1. Melihat informasi sebelumnya. Seperti misalnya bahwa pendapatan dan kekayaan mempunyai koliniertitas ganda yang tinggi, maka selanjutnya pengamatan pendapatan atau kekayan didanti dengan pengukuran yang lain seperti perubahan konsumsi atau peninggkatan kekayaan, atau pengamatan yang lain yang berhubungan dengan variabel tersebut. 2. Penggabungan data yang berasal dari data cross section dengan time series. Analisis data cross section dengan sifatnya adalah statis, tidak dipengaruhi uleh waktu pengamatan atau perubahan waktu. Sdangkan data time series sering adalah bersifat dinamis yang dihubungkan dengan rata-rata tingkat kenaikan (rate increase), rata-rata tinggkat pertumbuhan ((rate of growth) selalu dihubungkan dengan data berkala. Dengan melakukan penggabungan antara data cross section dengan time series maka dapat mengatasi terjadinya akinbat yang ditimbulkan oleh masing-masing data apabila dianalisis secara individual, seperi pada data cross section timbul kolinieritas ganda, dan pada data time series sering terjadi adanya autokorelasi atau korelai biserial. 3. Mengeluarkan satu variabel atau lebih. Apabila terjadi kolinieritas ganda yang serius, salah satu hal yang paling gampang dilakukan adalah mengeluarkan salah satu variabel yang berkorelasi dengan satu atau lebih variabel yang lain. Akan tetapi dengan mengeluarkan variabel dari model regresi, maka secara otomatis kan terjadi kesalahan sfesifik (sfecification error) Kesalahan sfesifikasi adalah kesalahan dalam menentukan model yang disfesifik untuk dianalisis. Pilihan harus dilakukan apakah perlu melakukan eliminasi variabel, tergantung pada akibat yang ditimbulkan, apakan dapat mengatasi kolinierritas yang serius dengan kesalahan sfesikikasi yang relatif kecil, atau model mempunyai kolinieritas ganda yang relatif dengan kesalah sfesifikasi yang rendah. Pilihan tergantung pada yang menganalisis. 4. Melakukan transformasi variabel yang mempunyai masalah kolinieritas ganda. Misalnya apabila memasukkan dua variabel dalam suatu model ada variabel biaya dan luas lahan yang biasanya mempunyai kolinierritas yang tinggi, maka dapat dilakukan teransformasi variabel biaya dan luas lahan menjadi variabel baru yaitu biaya per satu satuan luas lahan, misalnya biaya per hektar. Selanjutnya, variabel baru ini yang dimasukan dalam model.
163
PDF created with pdfFactory Pro trial version www.pdffactory.com
5. Penambahan variabel baru, atau penambah jumlah sampel dalam model, apabila memungkinkan, sehingan dapat mengurang kolinierriras ganga yang ada pada model awal dengan model yang baru dan dengan jumlah sampel yang baru. 6. Kolineiritas ganda dapat dilakukan dengan melakukan pemfaktoran terfadap variabel bebas X terlebih duhulu, setelah faktor terbentuk, barulah analisis dilakukan antara variabel Y dengan faktor yang terbentuk. Antarfaktor yang terbentuk sudah bebas sesamanya berati bebas dari kolinieritas ganda, sehingga kolinieritas dapat dihilangkan. Dalam analisis ini harus melakukan analisis faktotr terlebih dahulu, baru dilanjutkan dengan analisis regresi linier yang telah bebas dengan sifat kolinieritas ganda..
7.3 Uji Autokorelasi [Asumsi ke Tiga] Salah satu asumsi kelasik yang harus dipenuhi dari analisis regresi berganda adalah tidak terjadinya atau korelasi serial antar kesalahan pengganggu εi. Auto korelasi merupakan korelasi antara anggota seri pengamatan yang telah tersusun secara terurut seperti urutan antar waktu (time series data) atau data menurut urutan tempat (cross section data). Sehingga dapat dikatakan auto korelasi merupakan terjadi kjorelasi pada dirinya sendiri. Dalam kaitannya dengan analisis regresi model regresi linier klasik mengganggap bahwa auto korelasi tidak terjadi pada nilai kesalahan pengganggu yang dinyatakan dengan: E (εi εj) = 0 di mana i ≠ j. Model klasik menganggap kesalahan pengganggu εi yang berhubungan dengan data pengamatan ke-i tidak dipengaruhi oleh kesalahan pengganggu εj yang berhubungan dengan data pengamatan ke-j (1, j = 1, 2, 3, . . ., n). Akan tetapi, apabila ada ketergantungan antara εi dengan εj maka dikatakan terdapat autokorelasi dengan simbul E (εi εj) ≠ 0 di mana i ≠ j. Paada waktu membicarakan asumsi-asumsi yang lain adanya korelasi serial atau autokorelasi antarkesalahan pengganggu dianggap tidak ada di mana sering ditulis dengan pernyataan E (εi εj) = 0 untuk i ≠ j. Karena korelasi serial atau autokorelasi biasanya terjadi pada data kurun waktu (time series) yang dalam pernyataan sering ditulis dengan: E (εt εt-r) ≠ 0 di untuk r < t yang berarti kesalahan pengganggu yang timbul pada data pengamatan t berkorelasi dengan kesalahan pengganggu yang timbul pada pengamatan (r-t). Jarak waktu pengamatan juga berpengaruh pada besarkecilnya korelasi yang timbul. Hubungan ini sering dinamakan resonasi antardata pengamatan. Untuk dapat mengetahui adanya autokorelasi dapat dilihat dari pola distribusi kesalahan pengganggu εi dengan waktu pengamatan. Apabila terjadi pola yang teratur menurut pola tertentu dengan waktu atau sumbu ordinat seperti pola: linier, kuadratik, atau kubik maka dapat dikatakan terjadi adanya sifat autokorelasi dan sebaliknya. Perhatian gambar distribusi kesalahan penganggu waktu pengamatan yang dinyatakan dengan sumbu datar (lihat gambar). Adanya korelasi serial atau autokorelasi antarkesalahan pengganggu εi akan menyebabkan terjadinya varians kesalahan tidak minimum sebagai syarat dalam analisis regresi linier baik, baik pada sampel kecil maupun pada sampel besar. Selanjutnya dengan adanya korelasi serial bahwa varians kesalahan penggangu atau 2 2 varians error atau S residu (S = 1/(n-k) ∑ e12 akan tidak dapat dipakai untuk menaksir besarnya varians kesalahan pengganggu populasi
∑ σ 2 . Selain itu, penggunaan uji t
dan uji F tidak akan valid dalam pengujian analisis regresi selanjutnya, sehingga hasilnya akan menyesatkan atau tidak sesuai dengan harapan atau kaidah-kaidah analisis regresi.
164
PDF created with pdfFactory Pro trial version www.pdffactory.com
Dengan adanya korelasi serial atau autokorelasi antarkesalahan pengganggu εi akan menyebabkan terjadinya varians kesalahan tidak minimum sebagai syarat dalam analisis regresi linier baik, baik pada sampel kecil maupun pada sampel besar.
εj
εj
εj
4
3
10
3
2
2
5
1 0 -1 0
5
10
15
1 0
0
20
0
-2
5
10
-1 0
15
-5 -10
-4
[A] terdapat autokorelasi
5
10
15
20
-2
-3
-3
[B] terdapat autokorelasi
εj
[C] tidak terdapat autokorelasi εj 8
4
6 4
2
2
0 -2
0
5
10
15
20
0 -2
1
6
11
-4
-4
-6
-6
-8
[D] terdapat autokorelasi
[
[B] terdapat autokorelasi
Gambar A, B, D, dan E terjadi autokorelasi (distibusinya ti teratur). Pada Gambar C tidak terjadi autokorelasi (distibusinya tidak teratur) Konsekuensi dengan adanya autokotelasi akan dapat mengakibatkan hal-hal yang serius, terhadap hasil regresi suatu model. Apabila OLS dilakukan dengan benar dan tidak menimbulkan aotukorelasi maka akan didapatkan: 1. Hasil yang diperoleh dari OLS (ordinary least squares) atau metode kuadrat terkecil tidak akan berbias atau menyipang artinya hasil analisis sampel kesimpulannya sama dengan populasinya. 2. Hasil yang diperoleh akan konsisten, yitu dengan meninkatnya jumlah sampel kekeliruan hasil perhitungan tetap sama. 3. Varian yang diperoleh akan tetap minimal dengan makin membesarnya ukuran data sampel yang digunakan. Apabila dalam analisis regresi terjadi autokorelasi atau adanya korelasi biserial mengakibatkan: Pendugaan OLS tidak efisien, karena selang kepercayaan (interval confident) menjadi melebar dan uji nyata tidak ampuh lagi. Pendugaan OLS menjadi sangat sensitif terhadap adanya fluktuasi jumlah sampel. Apabila adanya autukorelasi diabaikan maka akan terjadi: 1. Varian residu penduga
∑ σˆ 2 mungkin tidak dapat mengestimasi (underestimated), 2
varians residu yang sebenarnya σ . 2
2. Apabila varians σ underestimated, maka varians dan standar kesalahan penggangu yang diperoleh mungkin underestimated dibandingkan dengan varians residu yang 2 sebenarnya σ 3. Pada umumnya hasil uji-t dan uji-F tidak begitu valid dan kesimpulanya akan membias atau menyipangkan dalam mengambil kesipulan.
165
PDF created with pdfFactory Pro trial version www.pdffactory.com
7.4
HETERO KEDASITAS [Asumsi ke Dua]
Dalam analisis regresi linier untuk mendapatkan hasil yang baik adalah satu asumsi kelasik yang harus dipenuhi dari analisis regresi berganda adalah tidak terjadinya hetero kedasitas yang berarti bersifat homogenitas variaans yang ditimbulkan oleh variabel pengganggu dengan istilah lain maka haris terpenuhi syarat 2 bahwa ∑ e12 = σ . Dalam kenyataan syarat tersebut tidak selalu dapat terpenuhi 2
2
2
2
sehingga ∑ e12 = σi ≠ σ . Adanya gejala gejala ∑ e12 σi ≠ σ sering disebut dengan gejala adanya sifat heterokedasitas yaitu varians variabel pengganggu bersifat tidak homogen (ingat asumsi ke dua). Kejadian-kejadian yang menyebabkan terjadinya gejala heterokedasitas adalah: 1. Proses latihan yang kontinyu menyebabkan kesalahan (error)yang timbul akan makin kecil, sehingga lama-lama menjadi sangat kecil dan konstas yang berarti varian 2 residu σi akan sama dengan satu. 2. Dengan sistem pengumpulan data yang baik, memungkinkan terjadinya penyipangan atau kekeliruan yang semakin kecil sehingga didapatkan data dengan kekeliruan yang relatif kecil dan konstan Dengan terpenuhinya semua asumsi, maka estimasi OLS akan BLUE (best linier unbiased estimator) yaitu etimator-etimator tidak bias atau menyimpang dan mempunyai varians yang minimal. Atau dapat dikatakan bahwa estimator adalah bersifat efisien dan konsisten. Sebaliknya, apabila dalam analisis regresi terjadi adanya sifat heterokedasitas dapat ditunjukkan bahwa estimator OLS masih tetap tidak berbias atau menyimpang dan tetap konsisten pada populasinya, tetapi pada sampelnya akan terjadi tidak konsisten dan tidak terpenuhinya varians yang minimal, maka akan terjadi ketidak seragaman variansnya. Konsekuensi adanya gejala heterokedasitas dapat diketahui dengan: *
1. Jika terjadi gejala heterokedasitas estimator bi dapat dikoreksi dengan Bi , walaupu sebenarnya bi masih BLUE (best linier unbiased estimator) yaitu tidak bias. 2. Varians bi menurut asumsi heterokedasitas tidak lagi minimal, sedangkan varians Bi memenuhi syarat minimal. 3. Selang kepercayaan masaalah 1 & 2 di atas berdasarkan asumsi heterokedasitas akan menjadi lebih besar dan uji signifikansinya kurang ampuh. 4. Keadaan akam menjadi lebih buruk lagi apabila dalam keadaan heterokedasitas yang tidak efisien menggunakan pendekatan OLS untuk mengestimasi varians bi, 2 sebab dalam hal ini terjadi bias yang tergantung pada σ . 5. Apabila tetap menggunakan OLS dalam keadaan heterokedasitas akan memberikan kesimpulan yang salah, disebabkan uji-t dan uji-F nilai-nilainya akan menyipang. Sebararan sekitar garis
Sebararan sekitar garis
Sebararan sekitar garis
Sebararan sekitar garis
166
PDF created with pdfFactory Pro trial version www.pdffactory.com
Untuk mendeteksi adanya heterokedasitas dapat dilakukan dengan mudah apabila menggunakan metode grafis atau diagram antara ei dengan Yi atau antara ei dengan Xi.. Selain itu, terdapat banyak cara-cara mendeteksi anyanya heterokedasitas. Salah satu adalah bentuk diagram pencar yang terjadi hubungan yang teratur dan sitematis antara ei dengan Xi. atau Yi, dikatakan dalam analisis regresi tersebut terdapat sifat heterokedasitas seperti gambar berikut: .
7.5
Sebaran Normal [Asumsi ke Satu]
Cara untuk menentukan suatu data menyebar normal dapat menggunakan perhitungan yang didasarkan nilai korelasi (r) oleh Rian-Joiner, oleh Anderson-Darling dan Kolmogorov-Sirminov didasarkan nilai pada distribusi komulatif secara empieis, yang gambarnya serupa seperti pada Gambar 1. Sedangankan, cara lain kurva normal disasarkan distribusi frekuensi komulatif yang ditunjukkan pada Gambar 2 di bawah ini. N o r m a l P r o b a b ility P lo t
.9 9 9
Probability
.9 9 .9 5 .8 0 .5 0 .2 0 .0 5 .0 1 .0 0 1 25
35
45
55
65
75
85
95
P r A ve ra g e : 5 6 . 6 4 4 4 S t D e v: 1 5 . 4 5 9 5 N : 90
A n d e rs o n -D a rlin g N o rm a lit y T e s t A -S q u a re d : 0 . 2 4 2 P -V a lu e : 0 .7 6 4
Gambar 1. Gambar Distribusi Data yang Normal
Dependent Variable: Normal
25
Mean = -9.02E-17 Std. Dev. = 0.997 N = 150
Frequency
20
15
10
5
0 -3
-2
-1
0
1
2
3
Kurva Normal
Gambar 2. Gambar Distribusi Normal
Dari kedua gambar di atas Gambar 1 dan Gambar 2, terlihat bahwa hubungan titiktitik menunjukkan trend yang hampir normal.
167
PDF created with pdfFactory Pro trial version www.pdffactory.com