Supawi Pawenang, 2011, Ekonometrika Terapan, IDEA Press Jogja
BAB II MODEL REGRESI
Tujuan Pengajaran: Setelah mempelajari bab ini, anda diharapkan dapat: Mengerti definisi model Mengerti definisi regresi Menyebutkan modelmodel regresi Menjelaskan kegunaan model regresi Menuliskan alternatif notasi model Memahami perbedaan-perbedaan model Menggunakan model untuk menjabarkan teori
1
BAB II MODEL REGRESI
Keilmuan sosial mempunyai karakteristik berupa banyaknya variabel-variabel atau faktor-faktor yang saling mempengaruhi satu sama lain. Kondisi yang demikian ini menyebabkan kesulitan dalam menentukan secara pasti faktor apa saja yang menyebabkan faktor tertentu. Sebagai contoh, apabila kita ingin mengetahui faktor apa saja yang mempengaruhi permintaan suatu barang tertentu (sebut saja barang X), maka dengan mengidentifikasi kemungkinan faktor-faktor yang mempengaruhinya, kita akan mendapatkan banyak sekali faktor-faktor itu seperti: harga barang tersebut, harga barang lain, mutu barang, pendapatan, anggaran pengeluaran, prediksi harga masa yang akan datang, selera, trend yang berkembang, persepsi atas barang tersebut, kebutuhan, gengsi, return usaha yang mungkin diperoleh, tingkat bunga bank, stabilisasi keamanan, tempat penjualan barang tersebut, barang pengganti, dan tentu masih banyak lagi faktor-faktor lainnya yang sangat sulit untuk ditentukan secara mutlak, bahwa harga barang X tersebut hanya ditentukan oleh faktor-faktor yang telah dijelaskan. Dari beragam faktor-faktor yang disebutkan di atas, tentu mempunyai tingkat signifikansi yang berbeda. Beberapa faktor mungkin mempunyai tingkat signifikansi yang tinggi, sementara yang lain mungkin tingkat signifikansinya rendah, atau biasa disebut tidak signifikan. Dalam kepentingan untuk mengidentifikasi beberapa variabel saja, maka dibenarkan untuk mengabaikan variabel-variabel yang lain. Cara yang dilakukan adalah membuat model, yang menjelaskan 2
variabel-variabel yang hendak diteliti saja. Sedang untuk variabel-variabel lain yang terkait tetapi tidak hendak diteliti, dapat diabaikan. Hal ini dibenarkan dalam keilmuan sosial (ekonomi), karena terlalu banyak faktorfaktor yang saling terkait dan sangat sulit untuk diidentifikasi secara menyeluruh, sehingga perlu asumsi yang menganggap tidak adanya perubahan dari variabelvariabel yang disebut dengan ceteris paribus. Model dalam keilmuan ekonomi berfungsi sebagai panduan analisis melalui penyederhanaan dari realitas yang ada. Sehingga model sering diartikan refleksi dari realita atau simplikasi dari kenyataan. Hal ini akan semakin jelas kalau kita runut dari bentuk suatu model yang memang berbentuk sangat sederhana. Penulisan model dalam ekonometrika adalah merupakan pengembangan dari persamaan fungsi secara matematis, karena pada hakikatnya sebuah fungsi adalah sebuah persamaan yang menggambarkan hubungan sebab akibat antara sebuah variabel dengan satu atau lebih variabel lain. Penulisan model dalam bentuk persamaan fungsi tersebut dicontohkan dalam persamaan berikut ini: Persamaan Matematis Y=a + bX ……….. (pers.1) Persamaan Ekonometrika Y = b0 + b1X + e ……….. (pers.2) Munculnya e (error term) pada persamaan ekonometrika (pers.2) merupakan suatu penegasan bahwa sebenarnya banyak sekali variabel-variabel bebas yang mempengaruhi variabel terikat (Y). Karena dalam model tersebut hanya ingin melihat pengaruh satu variabel X saja, maka variabel-variabel yang lain dianggap bersifat tetap atau ceteris paribus, yang dilambangkan dengan e.
3
Bentuk Model Model persamaan fungsi seperti dicontohkan pada pers.2 bertujuan untuk mengetahui pengaruh variabel bebas terhadap variabel terikat. Oleh karena itu, persamaan tersebut disebut juga sebagai persamaan regresi. Model Regresi mempunyai bermacam-macam bentuk model yang dapat dibedakan berdasarkan sebaran data yang terlihat dalam scatterplott-nya.8 Setidaknya terdapat tiga jenis model yaitu: Model Regresi Linier, Model Regresi Kuadratik, Model Regresi Kubik Model Regresi Linier Kata “linier” dalam model ini menunjukkan linearitas dalam variabel maupun lineraitas dalam data. Kata linier menggambarkan arti bahwa sebaran data dalam scatter plot menunjukkan sebaran data yang mendekati bentuk garis lurus. Data semacam ini dapat wujud apabila perubahan pada variabel Y sebanding dengan perubahan variabel X. Jika sebaran datanya berkecenderungan melengkung, maka cocoknya menggunakan dengan regresi kuadratik. Jika sebaran datanya kecenderungannya seperti bentuk U atau spiral regresinya menggunakan regresi kubik. Model linier sendiri dapat dibedakan sebagai single linier maupun multiple linier. Disebut single linier apabila variabel bebas hanya berjumlah satu dengan batasan pangkat satu. Sedang multiple linier apabila variabel bebas lebih dari satu variabel dengan batasan pangkat satu. Untuk lebih jelasnya akan dicontohkan bentuk
8
Scatter plot merupakan gambar sebaran data.
4
persamaan single linier (pers.3) dan persamaan multiple linier (pers.4) sebagai berikut: ……….. (pers.3)
Y = b 0 + b1X + e
Y = b0 + b1X1 + b2X2 + …… + bnXn + e ……….. (pers.4)
Misalkan dari pers.3 dianggap bahwa Y = Inflasi, dan X = bunga deposito (Budep) pada periode tertentu, dan jika datanya telah diketahui, maka data akan tergambar dalam bentuk titik-titik yang merupakan sebaran data dalam scatter plot. Dengan menggunakan data penelitian hubungan antara inflasi dan bunga deposito antara Januari 2001 hingga Oktober 2002, maka sebaran datanya tergambar sebagai berikut: Hubungan Suku Bunga terhadap Inflasi 16
15
14
13
12
INFLASI
11
10
9 8 13.0
13.5
14.0
14.5
BUDEP Gambar 3
5
15.0
15.5
16.0
16.5
Sebaran data tersebut di atas (gambar 3) menunjukkan hubungan yang positif, yaitu jika bunga deposito meningkat, maka inflasi juga meningkat. Begitu pula jika bunga deposito menurun, inflasi juga turun. Sedangkan contoh sebaran data yang digambarkan dalam scatter plot di bawah ini (gambar 4), menunjukkan bahwa hubungan antara variable Afenegat (Afeksi negative) dan Latribut (Atribut) mempunyai hubungan yang negative. Jika atributnya berkurang, maka afeksi negatifnya meningkat. Begitu pula sebaliknya. Dari scatter plot kedua gambar tersebut (baik gambar di atas maupun di bawah ini) menunjukkan bahwa sebaran datanya menyebar memanjang lurus, sehingga dapat diwakili dengan garis lurus. Oleh karena itu, kedua scater plot tersebut akan tepat digunakan regresi linier.
1.9
1.8
LATRIBUT
1.7
1.6 0
10
20
AFENEGAT
Gambar 4
6
30
40
Model Kuadratik
Salah satu ciri model kuadratik dapat diketahui dari adanya pangkat dua pada salah satu variabel bebasnya. Ciri yang lain dapat dilihat dari pengamatan terhadap scatter plott yang menunjukkan kecenderungan sebaran data membentuk lengkung, tidak seperti model linier yang cenderung lurus. Model kuadratik dituliskan dalam persamaan fungsi sebagai berikut: Y = b0 + b1X1 + b2X12 + e
……….. (pers.5)
Model Kubik Salah satu ciri model kubik dapat diketahui dari adanya pangkat tiga pada salah satu variabel bebasnya. Oleh karena itu sering disebut juga dengan fungsi berderajat tiga. Ciri yang lain dapat dilihat dari pengamatan terhadap scatter plott yang menunjukkan kecenderungan sebaran data yang berbentuk lengkung dengan arah yang berbeda. Setiap fungsi kubik setidaktidaknya mempunyai sebuah titik belok (inflexion point), yaitu titik peralihan bentuk kurva dari cekung menjadi cembung atau dari cembung menjadi cekung.9 Model kuadratik dituliskan dalam persamaan fungsi sebagai berikut: Y = b0 + b1X1 + b1X12 + b1X13 + e ……….. (pers.6)
9
Dumairy, Matematika Terapan Untuk Bisnis dan Ekonomi, BPFE, Yogjakarta, p.140
7
Notasi Model
Huruf Y memerankan fungsi sebagai variabel dependen atau variabel terikat. Y sering juga disebut sebagai variabel gayut, variabel yang dipengaruhi, atau variabel endogin. Dengan alasan keseragaman, penulisan huruf Y diletakkan disebelah kiri tanda persamaan. Sedang variabel independen yang secara umum disimbolkan dengan huruf X diletakkan disebelah kanan tanda persamaan. Huruf X menggambarkan variabel bebas atau variabel yang mempengaruhi. Oleh karena itu variabel ini mempunyai nama lain seperti variabel independen, variabel penduga, variabel estimator, atau juga variabel eksogen. Peletakannya di sebelah kanan tanda persamaan menunjukkan perannya sebagai variabel yang mempengaruhi. Huruf b0 sering juga dituliskan dengan huruf a, , atau juga 0. Secara substansi penulisan itu mempunyai arti yang sama, yaitu menunjukkan konstanta atau intercept yang merupakan sifat bawaan dari variabel Y. Konstanta ini mempunyai angka yang bersifat tetap yang sekaligus menunjukkan titik potong garis regresi pada sumbu Y. Jika konstanta itu bertanda positif maka titik potongnya di sebelah atas titik origin (0), sedang bila bertanda negatif titik potongnya di sebelah bawah titik origin. Nilai konstanta ini merupakan nilai dari variabel Y ketika variabel X bernilai nol. Atau dengan bahasa yang mudah, nilai konstanta merupakan sifat bawaan dari Y. Huruf b1, b2, bn merupakan parameter yang menunjukkan slope atau kemiringan garis regresi. Parameter ini sering juga dituliskan dengan bentuk b, atau 1, 2, n. Meskipun dituliskan dengan tanda yang 8
berbeda, secara substansi parameter ini menunjukkan beta atau koefisien korelasi yang sekaligus menunjukkan tingkat elastisitas dari variabel X tersebut. Nilai beta ini memungkinkan untuk bernilai positif maupun negatif. Tanda positif menunjukkan hubungan yang searah antara variabel X dengan variabel Y. Artinya jika X mengalami peningkatan maka Y juga mengalami peningkatan. Sebaliknya jika X mengalami penurunan maka Y pun akan menurun. Arah hubungan seperti itu tidak terjadi pada beta yang berangka negatif. Karena jika tandanya negatif arah hubungan X terhadap Y saling berlawanan. Jika X meningkat maka Y menurun, sebaliknya jika X menurun maka nilai statistik t meningkat. Demikian pula, karena nilai koefisien korelasi ini juga menunjukkan tingkat elastisitas, maka dari besarnya nilai koefisien korelasi (b) tersebut dapat ditentukan jenis elastisitasnya. Jika nilai b besarnya lebih dari satu (b>1) maka disebut elastis. Artinya, jika variabel X mengalami perubahan, maka variabel Y akan mengalami perubahan yang lebih besar dari perubahan yang ada pada variabel X tersebut. Jika nilai b besarnya sama dengan angka satu (b=1) disebut uniter elastis. Artinya, jika variabel X mengalami perubahan, maka variabel Y akan mengalami perubahan yang sama besar dengan perubahan yang ada pada variabel X tersebut. Jika nilai b besarnya lebih kecil dari angka satu (b<1) disebut inelastis. Artinya, jika variabel X mengalami perubahan, maka variabel Y akan mengalami perubahan yang lebih kecil dari perubahan yang ada pada variabel X tersebut. Huruf e merupakan kependekan dari error term atau kesalahan penggganggu. Simbol error ini tidak jarang dituliskan dalam huruf atau . Simbol ini merupakan karakteristik dari ekonometrika yang tidak dapat dilepaskan dari unsur-unsur stokhastik atau hal-hal yang mengandung probabilita, karena hasil yang 9
ditunjukkan oleh model ekonometrika hanya bersifat perkiraan, dalam arti tidak menunjukkan kebenaran yang mutlak. Oleh karena itu nama lain dari simbol ini tidak terlepas dari sifat dasar itu seperti: disturbance error atau stochastic disturbance. Kesalahan pengganggu ini sendiri mempunyai banyak sebab yang dapat menimbulkannya seperti: 1. tidak seluruh variabel bebas yang mempunyai potensi dalam mempengaruhi variabel terikat dapat disebutkan dalam model. 2. kesalahan asumsi dalam menentukan teori yang diwujudkan sebagai model. 3. ketidaklengkapan data yang dianalisis. 4. ketidaktepatan model yang digunakan. Misalnya, seharusnya digunakan model kuadratik tetapi justru yang digunakan adalah model linier, atau sebaliknya.
Spesifikasi Model dan Data Secara spesifik model dalam ekonometrika dapat dibedakan menjadi: model ekonomi (economic model) dan model statistic (statistical model). Model Ekonomi biasanya dituliskan dalam bentuk persamaan sebagai berikut: Y = b0 + b1X1 + b2 X2 Tanda b = parameter, menunjukkan ketergantungan variabel Y terhadap variabel X b0 = intercept, menjelaskan nilai variabel terikat ketika masing-masing variabel bebasnya bernilai 0 (nol).
10
Model ini menggambarkan rata-rata hubungan sistemik antara variabel Y, X1, X2. Dalam model ini nilai e tidak tertera, karena nilai e diasumsikan non random. Dalam realita, model ini tidak mampu menjelaskan variabelvariabel ekonomi secara pas (clear), oleh karena itu membutuhkan regresi. Model Statistik Model ekonomi seperti yang dijelaskan di atas, mencerminkan nilai harapan, maka dapat pula ditulis: E (Y) = b0 + b1X1 + b2 X2 Karena nilai harapan, maka tentu tidak akan secara pasti sesuai dengan realita. Oleh karena itu akan muncul nilai random error term (e). Nilai e sendiri merupakan selisih antara nilai kenyataan dan nilai harapan. Secara matematis dapat dituliskan sebagai berikut: e = Y – E(Y) jadi, karena, maka
atau e = Y – Yˆ
Y = Yˆ + e Yˆ = E (Y) = b0 + b1X1 + b2 X2 Y = b0 + b1X1 + b2 X2 + e
tanda e pada persamaan di atas mencerminkan distribusi probabilitas. Atau dapat pula dianggap sebagai pengganti variabel-variabel berpengaruh lain selain variabel yang dijelaskan dalam model. Dalam teori ekonomi, e merupakan representasi dari asumsi ceteris paribus. Pengakuan adanya variabel lain yang berpengaruh, meskipun tidak disebutkan variabel apa, cukup ditulis dengan tanda e, maka model menjadi lebih realistik. Agar terdapat gambaran yang jelas, maka nilai e harus diasumsikan. Asumsi-asumsinya adalah: 30
1. Nilai harapan e sama dengan 0 (nol). E(e) = 0, masing-masing random error mempunyai distribusi probabilitas = 0. Meskipun e bisa bernilai positif atau negatif, tetapi rata-rata e harus = 0. 2. Variance residual sama dengan standar deviasi Var (e) = 2 , artinya: masing-masing random error mempunyai distribusi probabilitas variance yang sama dengan standar deviasi ( 2 ). Asumsi ini menjelaskan bahwa residual bersifat homoskedastik. 3. Kovarian ei dan ej mempunyai nilai nol. Cov (ei, ej) = 0. Nilai nol dalam asumsi ini menjelaskan bahwa antara ei dan ej tidak ada korelasi serial atau tida berkorelasi (autocorrelation). 4. Nilai random error mempunyai distribusi probabilitas yang normal. Karena masing, masing observasi Y tergantung pada e, maka masing-masing Y juga memiliki varian yang random. Dengan demikian, statistik Y menjadi sebagai beriku: 1. Nilai harapan Y tergantung pada nilai masingmasing variabel penjelas dan parameterparameternya. Dengan menggunakan asumsi E(e) = 0, maka rata-rata perubahan nilai Y untuk setiap observasi ditentukan oleh fungsi regresi. E (Y) = b0 + b1X1 + b2 X2 2. Variance distribusi probabilitas Y tidak dapat berubah setiap observasi. Var (Y) = Var (e) = 2 3. Tidak ada kaitan langsung antara observasi satu dengan observasi lainnya. Cov (Yi, Yj) = Cov (ei, ej) = 0
4. Nilai Y secara normal terdistribusi di sekitar ratarata. Asumsi-asumsi di atas difokuskan pada pembahasan variabel terikat. Perlu adanya asumsi tambahan terhadap variabel penjelas, yaitu: 1. Variabel independen tidak bersifat random, karena dengan jelas dapat diketahui dari data. 2. Variabel independen tidak merupakan fungsi linear dari yang lain. Asumsi ini penting agar tidak terjadi redundancy, yang menyebabkan multikolinearitas.
Kesimpulan: Dalam suatu model regresi terdapat dua jenis variabel, yaitu variabel terikat dan variabel bebas, yang dipisahkan oleh tanda persamaan. Variabel terikat sering disimbolkan dengan Y, biasa pula disebut sebagai variabel dependen, variabel tak bebas, variabel yang dijelaskan, variabel yang diestimasi, variabel yang dipengaruhi. Cirinya, berada pada sebelah kiri tanda persamaan (=). Variabel bebas sering disimbolkan dengan X, biasa pula disebut sebagai variabel independen, variabel yang mempengaruhi, variabel penjelas, variabel estimator, variabel penduga, variabel yang mempengaruhi, variabel prediktor. Cirinya terletak pada sebelah kanan tanda persamaan (=). Dalam suatu model juga terdapat parameterparameter yang disebut konstanta, juga koefisien korelasi. Konstanta sering disimbolkan dengan a, atau b0, atau 0. Koefisien korelasi disebut pula sebagai beta, B, b, menunjukkan slope, kemiringan, elastisitas.
-000-
Tugas: 1. Buatlah rangkuman dari pembahasan di atas! 2. Cobalah untuk menyimpulkan maksud dari uraian bab ini! 3. Jawablah pertanyaan-pertanyaan di bawah ini: a. Jelaskan apa yang dimaksud dengan model! b. Sebutkan apa saja jenis-jenis model ekonometrika! c. Jelaskan perbedaan antara jenis-jenis model ekonometrika! d. Coba uraikan asumsi-asumsi yang harus dipenuhi dalam regresi linier