BASIC ECONOMETRIC S
SOPAR M.H.
PARANGINAN 2016
i
bY Shazame
“Lihatlah Ibu Aku membuat semuanya menjadi baru” --------The Passions_________________
ii
DAFTAR ISI
Table of Contents BAB 1 ...................................................................................................1 ANALISIS REGRESI DUA PEUBAH .............................................1 BAB 2 ................................................................................................ 16 MODEL REGRESI DUA PEUBAH .............................................. 16 BAB 3 ................................................................................................ 39 ASUMSI KENORMALAN : .......................................................... 39 MODEL REGRESI LINIIR NORMAL KLASIK ....................... 39 BAB 4 ................................................................................................ 42 PENAKSIRAN SELANG DAN PENGUJIAN HIPOTESIS ....... 42 REGRESI DUA PEUBAH .............................................................. 42 BAB 5 ................................................................................................ 61 ANALISIS REGRESI MAJEMUK (BERGANDA): ................... 61 MASALAH PENAKSIRAN ........................................................... 61 5.9 Determined Betta Coeficients of Structural Equation By Crammer ........................................................................................... 79 ( Menentukan Parameter Model 100 Variabel /Peubah) ............. 79 BAB 6 ................................................................................................ 86 INFERENSI REGRESI MAJEMUK ............................................ 86 BAB 7 ................................................................................................ 98 PENYIMPANGAN ASUMSI MODEL KLASIK ......................... 98
iii
GLOSARIUM RISET
Ekonometrika adalah perpaduan 3 disiplin ilmu : Matematika, Statistika dan Ekonomi. Ekonometrika digunakan Ahli Ekonomi untuk Riset-riset Ekonomi. Tapi sekarang Ekonometrika sudah dugunakan semua bidang Ilmu dan pro fesi. Ekonometrika ditambah disiplin ilmu Fisika menjadi Ekonofisika. Bagan Ekonometrika dibuat sbb.:
Time Series
Simultan
Panel
General Equilibrium
Cross-Section
ARIMAX
Eksplorasi
Analisis : Faktor Jalur SEM Cluster Manova
Deskripsi Kualitatif
iv
Bidang Profesi seperti : Kedokteran, Kependidikan, Manjemen, Pertanian, Akuntansi melakukan Riset dengan data Cross-sectionmengguna kan : Analisis Jalur’ Analisis Faktor, Structural Eqution Modelling (SEM), Analisis Cluster, dan Manova. Bidang Sains seperti : Ekonomi, Fisika, Matematika, Kimia, dll. Melakukan Risetdengan data Time-series menggunakan General Equilibrium, Simultan Equation. Riset Pooling (Panel) perpaduan dari time-series dan cross-section al. Time-series riset dengan data minimal 18 tahun, berisi ratusan sampai ribuan variable (peubah). ARIMAX (auto regresif integration moving average) dengan data jangka pendek , untuk bursa saham menggunakan data per detik. Cross-section dengan data bulanan , dan kurang dari 10 variabel (peubah).
Tahun 2006 Aku dari Bandung menuju Medan naik Bus Lintas Timur, mengisi liburan Program Doktor UNPAD. Kadangkala padat nya perkuliahan membuat penat, bapalagi tiap hari Minggu semua Program Doktor Ekonomi UNPAD harus ke SESKOAD diskusi dengan Para Jenderal AD dalam acara coffe-morning. Aku sengaja pilih Lintas Timur, rute TAPANULI, hanya untuk melihat bagaimana Tapanuli 2006 setelah 60 tahun merdeka . Sejauh mata memandang yang ada rumah-rumah sederhana, seperti tidak ada pembangunan, hanya ada pertanian padi, dan sedikit perkebunan. Yang terlintas di pikiran Ku hanya ratusan variable ekonomi yang ada di TA PANULI , kenapa pertumbuhan ekonominya lamban ? Kalau jumpa di perhentian aku melihat bagaimana Sumber Daya Manusianya yang masih sederhana. Melihat usaha mereka hanya melibatkan sedikit capital. Aku pikir 60 tahun mereka masih saja tradisional, baik dari SDM, capital,profesi , maupun infrastrukturnya.
v
DipikiranKu sepanjang jalan menuju Medan hanya menganalisis ratusan variable yang ada di TAPANULI. Kok bisa ? Itulah kelebihan Ilmu Ekonometrik, Anda bisa meneliti apa saja bahkan yang tak nampak di mata. Di Bandung, minggu pertama di UNPAD Aku complain, kok Program Doktor taka da Mata Kuliah Ekonomerik ? Akhirnya setelah UNPAD Lokakarya, dimunculkan Mata Kuliah Ekonometri ka, dan semua S1,S2, S3 wajib ikut Kuliah Ekonometrika. Memang Aku ancam balik ke Medan kalok taka da Ekonometrika di UNPAD. Mungkin mereka malu, Aku dari UNSYIAH NAD sangat fasih de ngan EKONOMETRIKA. Mau jadi apa Riset tanpa Ekonometrika, kata Ku ? Di samping rasa malu mereka juga pasti benci dengan Anak Medan meracau di Bandung.
Jika Anda tak mau dituduh JADUL jangan pernah takut dengan EKONOMETRIKA !
Berkatalah Prof.Fatimah Dosen Filsafat : “Ributlah seluruh Eropa karena Francis Bacon dan Spinoza. Untung ada Immanuel Kant. AKU BERPIKIR MAKA AKU ADA Versus PERSEPSI MEMBENTUK SEGALANYA LEWAT PENCERAPAN INDERAWI“ Sebenarnya yang disebut IMMANUEL KANT adalah Ekonometrika: Teori tanpa Data tak mungkin bisa diterima.
WITZGEINSTEIN Filosof Modern meracau : Sekarang ini taka da lagi Filosof yang menguasai Matematika, padahal dahulu seorang Filsuf harus menguasai semua Ilmu. Sekarang ini semuanya sudah terspesialisasi, jadi untuk menguasai semua ILMU rasanya gak mungkin lagi bisa, yang ada Kolaborasi Pakar-pakar Ilmu.
vi
------Paranginan, Lumban Tonga-tonga 2016------
vii
BAB 1 ANALISIS REGRESI DUA PEUBAH Istilah Regresi
Istilah regresi diperkenalkan oleh FRANCIS GALTON. Penjelasannya adalah bahwa ada kecenderungan bagi rerata tinggi anak-anak dengan orang tua yang mempunyai tinggi tertentu untuk bergerak atau mundur (regress) kea rah tinggi rerata seluruh populasi. KARL PEARSON mengumpulkan lebih 1000 catatan tinggi anggota kelom pok keluarga. Ia menemukan bahwa rerata tinggi anak leleki kelompok ayah (yang) tinggi kurang daripada tinggi ayah mereka dan rerata tinggi anak lelaki kelompok ayah (yang) pendek lebih besar dari pada tinggi ayahnya, jadi “mundurnya” (“regressing”) anak lelaki yang tinggi maupun yang pendek serupa kea rah rerata tinggi semua lelaki.
Ketergantungan Statistik vs Fungsional
Dalam analisis regresi perhatian diarahkan pada apa yang dikenal dengan ketergantungan antara peubah yang bersifat statistic, bukannya fungsional (bersifat fungsi) atau deterministic, seperti pada ilmu fisika klasik. Dalam hubungan di antara peubah yang bersifat statistic pada dasarnya menghadapi peubah random (acak) atau stokastik, yaitu peubah yang mempunyai distribusi probabilistas. Ketergantungan panen pada suhu, curah hujan, sinar matahari, dan pupuk, misalnya, pada dasarnya bersifat statistic dalam arti bahwa peubah yang menjelaskan (explanotary variables), meskipun jelas penting, tidak akan memungkinkan ahli agronomi untuk untuk meramalkan hasil panen secara akurat karena kesalahan yang terdapat (tersangkut) dalam pengukuran peubah- peubah ini dan juga sekelompok factor (peubah) lain yang secara bersama-sama memengaruhi hasil panen tadi tetapi mungkin sulit untuk dikenal secara perorangan (individual).
1
Regresi VS Korelasi
Analisis korelasi tujuan utamanya adalah untuk mengukur kuat atau derajat hubungan linier antara dua peubah. Analisis regresi berusaha untuk menaksir atau meramal nilai rerata sebuah peubah atas dasar nilai yang tetap peubah-peubah lain (ceteris paribus).
Istilah dan Notasi
Dalam berbagai literature istilah peubah tak bebas (dependent varia ble) dan peubah yang menjelaskan (explanotary variable) digambarkan de ngan berbagai cara, sbb. :
Peubah tak bebas
Peubah yang menjelaskan
(Depandentvariable)
(Explanotory variable)
Peubah yang dijelaskan
Peubah bebas
(Explained variablr)
(Independent variable)
Yang diramalkan
Peramal
(Predictand)
(Predictor)
Yang diregresi
Yang meregresi
(Regressand)
(Regressor)
Tanggapan
Perangsang atau peubah kendali
2
(Response)
(Stimulus or control variable)
Contoh Hipotesis
Analisis regresi terutama berkenaan dengan penaksiran dan/atau peramalan nilai rerata hitung atau nilai rerata (pupulasi) peubah tak bebas atas dasar nilai peubah yang menjelaskan yang tetap (fixed) atau diketahui.
Bayangkanlah Negara hipotesis dengan total penduduk (populasi) 60 keluarga. Misalnya Anda ingin berminat mempelajari hubungan antara belanja konsumsi keluarga mingguan Y dan pendapatan keluarga yang dapat dibelanjakan (disposable) atau setelah dipotong pajak mingguan X. Asumsikan Anda ingin meramalkan rerata (populasi) tingkat belanja konsumsi mingguan dengan mengetahui pendapatan mingguan keluarga itu. Untuk tujuan itu, misalkan Anda membagi 60 keluarga ke dalam 10 kelompok dari keluarga yang pendapatannya kira-kira sama dan memeriksa belanja konsumsi keluarga yang pendapatannya kira-kira sama dan memeriksa belanja konsumsi keluarga dalam tiap kelompok pendapatan ini. Tabel berikut berisi hanya tingkat pendapatan yang benar-benar diamati.
Tabel Pendapatan keluarga mingguan X,$ 80
100
120
140
160
180
200
220
240
260
belanja konsumsi keluarga mingguan Y,$
55 60 65 70 75
65 70 74 80 85 88
79 84 90 94 98
80 93 95 103 108 113 115
102 107 110 116 118 125
110 115 120 130 135 140
120 136 140 144 145
135 137 140 152 157 160 162
137 145 155 165 175 189
150 152 175 176 180 185 191
Total
325
462
445
707
678
750
685
1043
966
1211
Y
X
3
Tabel ditafsirkan sbb. : Cocok (berhubungan) dengan pendapatan mingguan $80, misalnya ada 5 keluarga yang belanja konsumsi mingguan nya berkisar antara $55 dan $75. Tabel di atas, memberikan distribusibersyarat (conditional distribution)Y tergantung pada nilai X tertentu. Tabel di atas menyatakan populasi, sehingga dapat dihitung probabi litas bersyarat(conditional probabilities) Y, 𝑝 𝑌 𝑋 , probabilitas Y untuk X tertentu (given X), sbb. Untuk X $80, misalnya, ada 5 nilai 𝑌 = $55, $560, $65, $70, 𝑑𝑎𝑛 $75 . Jadi, dengan 𝑋 = 80, probabilitas untuk 1 mendapatkan yang manapun dari belanja konsumsi ini adalah . 5
1
Menggunakan lambing, 𝑝 𝑌 = 55 𝑋 = 80 = . 5
Probabilitas bersyarat untuk Tabel di atas diberikan :
Tabel Probabilitas bersyarat 𝒑 𝒀 𝑿𝒊 𝒑 𝒀 𝑿𝒊 ↓ X
Probabili tas bersya rat 𝒑 𝒀 𝑿𝒊
Rerata bersyarat (dari) Y
80
100
120
140
160
180
200
220
240
260
1 5
1 6
1 5
1 7
1 6
1 6
1 5
1 7
1 6
1 7
1 5 1 5 1 5 1 5
1 6 1 6 1 6 1 6 1 6
1 5 1 5 1 5 1 5
1 7 1 7 1 7 1 7 1 7 1 7
1 6 1 6 1 6 1 6 1 6
1 6 1 6 1 6 1 6 1 6
1 5 1 5 1 5 1 5
1 7 1 7 1 7 1 7 1 7 1 7
1 6 1 6 1 6 1 6 1 6
1 7 1 7 1 7 1 7 1 7 1 7
65
77
89
101
113
125
137
149
161
173
Sekarang untuk tiap distribusi probabilitas bersyarat (dari) Y Anda da pat menghitung rerata hitung atau nilai reratanya, yang dikenal sebagai rerata bersyarat(conditional mean) atau harapan bersyarat (conditional
4
expecta tion),dinyatakan dengan 𝐸 𝑌 𝑋 dan dibaca “nilai Y yang diharapkan untuk X tertentu”. (Perhatikan : nilai yang diharapkan hanyalah suatu rerata hitung populasi). Harapan bersyarat ini dapat dihitung dengan mengalikan nilai Y yang relevan dalam Tabel pertama dengan probabilitas bersyaratnya pada Tabel kedua dan menjumlahkan hasil perkalian tadi. Contoh, rerata hitung bersyarat atau harapan Y untuk X = 80 adalah 1 5
55 + 60 + 65 + 70 + 75 = 65, disajikan padi baris akhir Tabel di atas.
Belanja Kkonsumsi mingguan,$
200
150
100
80
100
120
140
160
Pendapatan Mingguan, $
Gambar Distribusi bersyarat belanja konsumsi untuk berbagai tingkat pendapatan
Diagram pencar di atas menunjukkan distribusi bersyarat Y yang ber hubungan dengan berbagai nilai X. Meskipun ada variasi dalam belanja konsumsi perorangan, Gambar menujuk kan dengan syarat jelas bahwa belanja konsumsi secara rerata meningkat bersama dsengan peningkatan pendapatan.
5
Diagram pencar menunjukkan bahwa nilai rerata hitung (bersyarat) Y meningkat bersama meningkatnya X. Diagram pencar menunjukkan bahwa rerata bersyarat ini tepat terletak pada garis lurus dengan kemiringan positif. Garis ini dikenal sebagai garis regresi, atau, lebih umum, kurva regresi. Lebih tepat lagi, garis tadi adalah kurva regresi Y atas X. Jadi, kurva regresi hanyalah suatu tempat kedudukan rerata bersyarat atau harapan (expectation) peubah tak bebas untuk nilai tetap (fixed) peubah yang menjelaskan.
𝐸 𝑌 𝑋𝑖
Rereta yang sesuai
Belanja konsumsi mingguan, $
149
101
65
80
140
220
PEndapatan mingguan,$ Gambar Garis regresi
6
1.1
Konsep Fungsi Regresi Populasi ( Popolation Regression Function = PRF ) Tiap rerata bersyarat 𝐸 𝑌 𝑋𝑖 merupakan fungsi dari 𝑋𝑖 .
Dengan mengunakan symbol ,
𝐸 𝑌 𝑋𝑖 = 𝑓 𝑋𝑖
(1)
dimana 𝑓 𝑋𝑖 menggambarkan sebuah fungsi dari peubah yang menjelaskan 𝑋𝑖 . Persamaan (1) dikenal sebagai fungsi regresi populasi (dua-peubah) (PRF). Seorang ahli ekonomi mungkin menduga bahwa belanja konsumsi ber hubungan secara liniir dengan pendapatan . Dengan demikian diasumsikan bahwa PRF 𝐸 𝑌 𝑋𝑖 merupakan fungsi liniir dari 𝑋𝑖 , sebutlah, dari jenis
𝐸 𝑌 𝑋𝑖 = 𝛽0 + 𝛽1 𝑋𝑖
(2)
dimana 𝛽0 𝑑𝑎𝑛 𝛽1 parameter yang tak diketahui (besarnya) tetapi tetap (fixed) disebut sebagai koefisien regresi ,𝛽0 𝑑𝑎𝑛 𝛽1 juga secara berurut-urut dikenal sebagai intercept dan koefisien kemiringan (slope coefficient). Persamaan (2) dikenal sebagai regresi populasi liniir.
Liniiritas Liniiritas dalam Peubah
𝐸 𝑌 𝑋𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 2
bukan fungsi liniir karena peubah X berpangkat 2.
7
Liniiritas dalam Parameter
Fungsi liniir dari parameter dari β , mungkin liniir atau tidak dalam peubah X. Dalam penafsiran ini,
𝐸 𝑌 𝑋𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 2 adalah fungsi liniir.
𝐸 𝑌 𝑋𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 bukan fungsi liniir (non liniir).
Fungsi yang liniir dalam parameter maupun peubah disebut LRM (Liniir Regression Model).
Sfesifikasi Stokhastik PRF
Dengan tingkat pendapatan 𝑋𝑖 , belanja konsumsi keluarga secara indi vidu berkelompok di sekitar konsumsi rerata semua keluarga pada pendapatan 𝑋𝑖 , yaitu di sekitar harapan bersyaratnya (conditional expectation). Jadi dapat dinyatakan penyimpangan (deviation) suatu 𝑌𝑖 secara individu dari nilai yang diharapkannya sbb.:
𝑢𝑖 = 𝑌𝑖 − 𝐸 𝑌 𝑋𝑖 atau
𝑌𝑖 = 𝐸 𝑌 𝑋𝑖 + 𝑢𝑖
(3)
8
dimana penyimpanan 𝑢𝑖 merupakan peubah random yang tak bisa diamati yang bisa bernilai positif atau negatif. Secara tehnis, 𝑢𝑖 dikenal sebagai gangguan stokhastik (stochastic disturbance) ,atau factor kesalahan stokhastik (stochastic error term). Sekarang persamaan (3) dapat dituliskan menjadi
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
(4)
Jadi,belanja konsumsi secara individu untuk X = $80 dapat dinyatakan sebagai :
𝑌1 = 55 = 𝛽0 + 𝛽1 80 + 𝑢1 ⋮ 𝑌5 = 75 = 𝛽0 + 𝛽1 80 + 𝑢5
(5)
Sekarang jika persamaan (3) diambil ekspektasinya, diperoleh
𝐸 𝑌 𝑋𝑖 = 𝐸 𝐸 𝑌 𝑋𝑖
+ 𝐸 𝑢 𝑋𝑖
= 𝐸 𝑌 𝑋𝑖 + 𝐸 𝑢 𝑋𝑖
(6)
di sini 𝐸 𝑢 𝑋𝑖 = 0 , karena 𝑢 dapat bernilai negatif atau positif, jumlah seluruh 𝑢 sama dengan 0.
1.2
Fungsi Regresi Sampel (Sample Regression Function =SRF) Sekarang menaksir PRF atas dasar informasi sampel .
9
Andaikan Tabel populasi di atas tak diketahuidan satu-satunya infor masi adalah suatu sampel nilai-nilai Y yang dipilih secara random untuk X yang tetap (fixed) sbb.:
Tabel Sebuah Sampel Random dari Populasi Y
X
70
80
65
100
90
120
95
140
110
160
115
180
120
200
140
220
155
240
150
260
Apakah dari tabel ini dapat meramal rerata belanja konsumsi ming guan Y dalam populasi keseluruhan sesuai dengan X yang dipilih random ? Dapatkah PRF ditaksir dari data sampel ? Secara akurat mungkin tidak, karena ada fluktuasi sampling lain sbb.: Tabel Sampel Random lain dari Populasi Y
X
55
80
88
100
90
120
80
140
114
160
120
180
145
200
135
220
145
240
175
260
10
Diagram pencar kedua tabel di atas dapat dibuat sbb.:
Belanja konsumsi mingguan, $
SRF2 SRF1
200
150
100
80
100
120
140
160
180
200
220
260
Pendapatan mingguan,$ Garis regresi didasarkan pada dua sampel berbeda
Tak ada satu yang membuat yakin bahwa salah satu dari garis regresi yang ditunjukkan mewakili garis regresi populasi. Jadi garis regresi sampel ini hanya pendekatan PRF yang sebenarnya.
11
Dengan demikian dapat dikembangkan konsep fungsi regresi sampel (SRF) untuk menyatakan garis regresi sampel, sbb.:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖
di mana
(7)
∧ = 𝑑𝑖𝑏𝑎𝑐𝑎 hatatau cap ("topi") 𝑌𝑖 = 𝑝𝑒𝑛𝑎𝑘𝑠𝑖𝑟 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑜𝑟 𝐸 𝑌 𝑋𝑖 𝛽0 = 𝑝𝑒𝑛𝑎𝑘𝑠𝑖𝑟 𝛽0 𝛽1 = 𝑝𝑒𝑛𝑎𝑘𝑠𝑖𝑟 𝛽1
Sebuah penaksir atau statistic(sampel), hanya suatu aturan atau formula, atau metode yang mengatakan bagaimana menaksir parameter populasi dari informasi yang diberikan oleh sampel yang dimiliki. Sebuah nilai angka khusus yang diperoleh oleh penaksir dalam suatu penerap an disebut taksiran (estimate). SRF dapat dinyatakan dalam bentuk stokhastik sbb.:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑒𝑖
(8)
di mana 𝑒𝑖 factor residual/sisi (sampel). Dan sebagai taksiran untuk 𝑢𝑖 . Jadi tujuan utama analisis regresi adalah untuk menaksir PRF
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
atas dasar SRF 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑒𝑖 karena analisis lebih sering didasarkan pada suatu sampel dari populasi.
12
Perhatikan gambar berikut :
SRF : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 𝑌𝑖
𝑌𝑖
𝑒𝑖
PRF : 𝐸 𝑌 𝑋𝑖 = 𝛽0 + 𝛽1 𝑋𝑖
𝑢𝑖
𝑌𝑖
𝑌𝑖
𝐸 𝑌 𝑋𝑖 Belanja konsumsi mingguan, $
𝐸 𝑌 𝑋𝑖 A
𝑋𝑖 Pendapatan mingguan, $
Garis regresi sampel dan populasi
13
Dalam SRF, untuk = 𝑋𝑖 , diperoleh 𝑌𝑖 = 𝑌𝑖 + 𝑒𝑖
(9)
dan dalam PRF, dapat dinyatakan 𝑌𝑖 = 𝐸 𝑌 𝑋𝑖 + 𝑢𝑖
(10)
Soal
1. Banyaknya ahli ekonomi dikelompokkan atas dasar tahun pengalaman dan umur (hanya ahli ekonomi yang bekerja penuh secara profesional )
Tahun Pertama Kelom Pok umur (tahun)
2
20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74
24 121 77 18 6 1 1 1 1
Total
250
2-4
5-9
13 405 407 125 36 15 5 2
10-14
15-19
20-24
Total
1
1 184 825 535 161 48 19 10 3 1
197 780 652 183 52 18 6 2
3 194 761 433 119 27 8 4 1
1 235 751 784 612 382 206 27
38 710 1599 1653 1851 1431 980 670 400 214 28
1099
1787
1890
1550
2998
9574
14
Tabel memberikan frekuensi mutlak bersama (joint absolute frequencies) peubah umur dan tahun pengalaman. Dengan menggunakan frekuensi relatif (frekuensi mutlak dibagi jumlah total) sebagai ukuran probabilitas :
(a) Dapatkan distribusi probabilitas bersama (joint probabilities distribu tion) umur dan tahun pengalaman. (b) Dapatkan distribusi probabilitas bersyarat (dari) umur untuk berbagai tahun pengalaman. (c) Dapatkan distribusi probabilitas bersyarat (dari) tahun pengalaman untuk berbagai umur. (d) Denan menggunakan titik tengah berbagai selang unur dan tahun pengalaman, dapatkan rerata bersyarat dari distribusi frekuensi yang diperoleh dalam (b) dan (c). (e) Jika Anda menghubungkan rerata bersyarat yang ditunjukkan dalam (d), apa yang diperoleh ? (f) Apa yang bisa Anda katakana mengenai hubungan antara tahun penga lamn dan umur ?
Petunjuk :
Probabilitas Gabungan (Joint Probability) . Untuk peubah diskrit :
𝑓 𝑥, 𝑦 = 𝑃 𝑋 = 𝑥 𝑑𝑎𝑛 𝑌 = 𝑦 = 0 𝑠𝑎𝑎𝑡 𝑋 ≠ 𝑥 𝑑𝑎𝑛 𝑌 ≠ 𝑦
X mengambil nilai x dan Y mengambil nilai y.
Probabilitas Individual (Marginal)
15
di mana
𝑦
𝑓 𝑥 =
𝑦
𝑓 𝑥, 𝑦 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙 𝑑𝑎𝑟𝑖 𝑋
𝑓 𝑦 =
𝑥
𝑓 𝑥, 𝑦 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙 𝑑𝑎𝑟𝑖 𝑌 ,
berarti jumlah untuk semua nilai Y.
Harapan Bersyarat
𝐸 𝑋𝑌=𝑦 =
𝑥
𝑥𝑓 𝑥 𝑌 = 𝑦
𝑗𝑖𝑘𝑎 𝑋 𝑑𝑖𝑠𝑘𝑟𝑖𝑡
2. Tentukan apakah model berikut liniir dalam parameter, atau dalam peubah, atau kedua-duanya. Yang mana dari model-model ini adalah model regresi liniir ? (a) 𝑌𝑖 = 𝛽0 + 𝛽1
1 𝑋𝑖
+ 𝑢𝑖
(b) 𝑙𝑛𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝑢𝑖 (c) 𝑌𝑖 = 𝛽0 + 𝛽1 𝑙𝑛𝑋1 + 𝑢𝑖 (d) 𝑙𝑛𝑌𝑖 = 𝑙𝑛𝛽0 − 𝛽1 𝑙𝑛𝑋1 + 𝑢𝑖 (e) 𝑌𝑖 = 𝛽0 𝑋1 𝛽1 + 𝑢𝑖 (f) 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝑢𝑖 (g) 𝑌𝑖 = 𝛽0 + (0.75 − 𝛽0 )𝑒 −𝛽1
𝑋 𝑖 −2
+ 𝑢𝑖
BAB 2 MODEL REGRESI DUA PEUBAH
2.1
Metode Kuadrat Terkecil Biasa (OLS-Ordinary Least Square)
16
OLS dikemukakan oleh CARL FRIEDRICH GAUSS, Matematikawan Jer man. PRF : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
dengan Asumsi-asumsi :
Asumsi 1 𝐸 𝑢𝑖 𝑋𝑖 = 0
(11)
Perhatikan Gambar berikut, tiap populasi Y yang berhubungan dengan suatu X tertentu didistribusikan di sekitar nilai rerata dengan beberapa nilai Y di atas nilai rerata dan beberapa di bawahnya. Jarak-jarak ini dari rerata adalah 𝑢𝑖 , dimana nilai rerata hitung dari deviasi (simpangan) ini harus sama dengan nol. Artinya 𝑢𝑖 dapat bernilai negatif atau positif, sehingga jumlah totalnya sama dengan 0.
Y
Rerata 𝑃𝑅𝐹 ∶ 𝑌 = 𝛽0 + 𝛽1 𝑋𝑖
X1
X2
X3
X4
Gambar Distribusi bersyarat ui
17
Asumsi 2
𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 = 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖
𝑢𝑗 − 𝐸 𝑢𝑗
= 𝐸 𝑢𝑖 − 0 𝑢𝑗 − 0 = 𝐸 𝑢𝑖 𝑢𝑗 = 𝐸 𝑢𝑖 , 𝑢𝑗 = 0𝑖 ≠ 𝑗
(12)
di mana i dan j dua pengamatan yang berbeda dan di mana cov berarti kova rians. Ini artinya, gangguan 𝑢𝑖 𝑑𝑎𝑛 𝑢𝑗 tidak berkorelasi. Asumsi ini dikenal sebagai tidak adanya korelasi berurutan, atau taka da autokorelasi. Artinya, untuk Xi tertentu, simpangan tiap dua Y yang manapun dari niali reratanya tidak menunjukkan pola positif , di mana u positif diikuti u lain yang positif, atau u negatifdiikuti u lain yang negatif, atau u positif diikuti u yang negatif. Pola sistematis ini menunjukkan adanya autokorelasi. Jika taka da pola yang sistematis, maka korelasi nol.
18
u
u
Korelasi nol
Asumsi 3
𝑣𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 = 𝐸 𝑢𝑖 − 0
2
2
= 𝐸 𝑢𝑖
2
= 𝜎2
(13)
Artinya, varians 𝑢𝑖 untuk tiap Xiadalah konstan (tetap) sebesar 𝜎 2 . Menyatakan asumsi (skedasticity).
homoskedasitisitas,
atau
sama
penyebaran
19
Berarti populasi Y yang berhubungan dengan berbagai nilai X mempunyai varians yang sama. Perhatikan Gambar berikut :
𝑓 𝑢
Y
X1 X2
𝑃𝑅𝐹 ∶ 𝑌 = 𝛽0 + 𝛽1 𝑋𝑖
X3
Sebaliknya, dari Gambar berikut, varians bersysrat populasi Y meningkat dengan menungkatnya X. Situasi ini disebut heteroskedastisitas,atau penyebaran yang tak merata, atau varians yang tak sama, dengan symbol ditulis : 𝑣𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎𝑖2
(14)
n probabilitas ui
tanda indeks i menunjukkan varians populasi Y tidak lagi konstan.
𝑓 𝑢
20
Y
Dalam Gambar akhir, varians meningkat bersama dengan meningkatnya penda patan. Artinya keluarga yang lebih kaya secara rerata mengkonsumsi lebih banyak dari pada keluarga yang lebih miskin, tapi variabilitas belanja konsumsi keluarga yang lebih kaya juga lebih besar.
Asumsi 4 𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖
𝑋𝑖 − 𝐸 𝑋𝑖
= 𝐸 𝑢𝑖 − 0 𝑋𝑖 − 𝐸 𝑋𝑖 = 𝐸 𝑢𝑖 𝑋𝑖 − 𝐸 𝑋𝑖 = 0. 𝑋𝑖 − 𝐸 𝑋𝑖
=0
(15)
Gangguan u dan peubah yang menjelaskan X tidak berkorelasi. Diasumsikan bahwa X dan u ( semua peubah yang diabaikan) mempunyai pe ngaruh yang terpisah (dan bersifat penjumlahan)atas Y. Jadi kalau X dan u berkorelasi secara positif, X meningkat pada saat u mening kat.
21
Suatu model regresi yang memenuhi keempat asumsi tadi dikenal se bagai model regresi klasik, standar, atau liniir umum. Model ini klasik dikem bangkan GAUSS tahun 1821.
Tabel Asumsi model regresi liniir klasik Asumsi no 1 2 3
Terhadap u
Terhadap Y
𝐸 𝑢𝑖 𝑋𝑖 = 0 𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 = 0 𝑖≠𝑗 𝑣𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎 2
𝐸 𝑌𝑖 𝑋𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 𝑐𝑜𝑣 𝑌𝑖 , 𝑌𝑗 = 0 𝑖≠𝑗 𝑣𝑎𝑟 𝑌𝑖 𝑋𝑖 = 𝜎 2
Prinsip OLS
PRF tidak dapat diamati secara langsung. PRF ditaksir dari SRF. SRF : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑒𝑖 = 𝑌𝑖 + 𝑒𝑖 𝑒𝑖 = 𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖
(8) (9) (16)
Jika ada N pasang observasi atas Y dan X tertentu, ingin ditetapkan SRF sedemikian sehingga sedekat mungkin dengan nilai Y yang sebenarnya. Pilih SRF sedemikian sehingga jumlah residual (sisa) sekecil mungkin.
𝑒𝑖 =
𝑌𝑖 − 𝑌𝑖
Perhatikan Gambar di bawah. Misalkan,
𝑒1 , 𝑒2 , 𝑒3 , 𝑒4 𝑏𝑒𝑟𝑛𝑖𝑙𝑎𝑖 10, −2, +2, −10 𝑏𝑒𝑟𝑗𝑢𝑚𝑙𝑎 0.
Ide nya lebih baik menggunakan kriteria kuadrat terkecil, di mana SRF dapat ditetapkan sedemikian sehingga
22
𝑒𝑖2 = =
𝑌𝑖 − 𝑌𝑖
2
𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖
2
(17)
sekecil mungkin, di mana 𝑒𝑖2 adalah residual kuadrat.
Y
SRF 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖
e3 e1
e4 e2
X1
X2
X3
X4
23
Untuk memperoleh kuadrat terkecil yang minimum, maka persamaan (17) di differensial, diperoleh :
𝜕
𝑒𝑖2 𝜕𝛽 0
𝜕
𝑒𝑖2 𝜕𝛽 1
= −2
𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖
= −2
𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 𝑋𝑖
Syarat optimum, kedua persamaan tadi disamakan dengan nol.
−2
𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 = 0
𝑌𝑖 −
𝛽0 − 𝛽1
𝑋𝑖 = 0
𝑌𝑖 − 𝑁𝛽0 − 𝛽1
𝑋𝑖 = 0
𝑌𝑖 = 𝑁𝛽0 + 𝛽1
𝑋𝑖
−2
(18)
𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 𝑋𝑖 = 0
𝑌𝑖 𝑋𝑖 − 𝛽0 𝑋𝑖 − 𝛽1 𝑋𝑖 2 = 0 𝑌𝑖 𝑋𝑖 − 𝛽0
𝑋𝑖 − 𝛽1
𝑋𝑖 2 = 0
𝑌𝑖 𝑋𝑖 = 𝛽0
𝑋𝑖 + 𝛽1
𝑋𝑖 2
(19)
Menyelesaikan persamaan (18) dan (19) secara simultan, diperoleh :
𝛽1 =
𝑁 𝑋 𝑖 𝑌𝑖 − 𝑋 𝑖 𝑌𝑖 𝑁 𝑋𝑖 2 − 𝑋𝑖 2
24
Karena
𝑋𝑖 = 0 , maka diperoleh :
𝛽1 =
𝑁 𝑋 𝑖 𝑌𝑖 𝑁 𝑋𝑖 2
Dengan mengurangkan tiap nilai X dan Y dengan reratanya, diperoleh :
𝛽1 =
𝑋 𝑖 −𝑋 𝑌𝑖 −𝑌 𝑋 𝑖 −𝑋 2
Dengan mengingat 𝑋𝑖 − 𝑋 = 𝑥𝑖 , 𝑌𝑖 − 𝑌 = 𝑦𝑖 , maka
𝛽1 =
𝑥𝑖 𝑦𝑖 𝑥𝑖 2
𝛽0 =
𝑋 𝑖 2 𝑌𝑖 − 𝑋 𝑖 𝑋 𝑖 𝑌𝑖 𝑁 𝑋𝑖 2 − 𝑋𝑖 2
(20)
Dan
= 𝑌 − 𝛽1 𝑋
(21)
Penaksir yang diperoleh disebut sebagai penaksir kuadrat terkecil ka rena diperoleh dari prinsip kuadrat terkecil.
2.2
Koefisien Determinasi r2 : Suatu Ukuran “Kebaikan Suai” (“Goodness of Fit”)
Sebaik mana garis regresi sampel mencocokkan data ? Jika semua pengamatan terletak pada garis regresi, maka diperoleh kecocokan yang “sempurna”.
25
𝑌𝑖 = 𝑌𝑖 + 𝑒𝑖
(9)
atau dalam bentuk simpangan
𝑦𝑖 = 𝑦𝑖 + 𝑒𝑖
(22)
Mengkuadratkan persamaan (22) dan menjumlahkan untuk semua sampel, diperoleh
𝑦𝑖2 =
𝑦𝑖2 +
𝑒𝑖2 + 2
𝑦𝑖2 =
𝑦𝑖2 +
𝑒𝑖2 + 0
𝑦𝑖2 =
𝑦𝑖2 +
𝑒𝑖2
𝑦𝑖2 = 𝛽1
2
𝑦𝑖 𝑒𝑖
𝑒𝑖2
𝑥𝑖 2 +
(23)
𝑦𝑖 𝑒𝑖 = 0, diperoleh dengan cara berikut.
Di sini
𝑦𝑖 = 𝛽1 𝑥𝑖
Dikali 𝑒𝑖 dan dijumlahkan seluruhnya diperoleh :
𝑦𝑖 𝑒𝑖 = 𝛽1
𝑥𝑖 𝑒𝑖
= 𝛽1
𝑥𝑖 𝑦𝑖 − 𝛽1 𝑥𝑖
= 𝛽1
𝑥𝑖 𝑦𝑖 − 𝛽1 𝑥𝑖 2
= 𝛽1
𝑥𝑖 𝑦𝑖 − 𝛽1
2
𝑥𝑖 2
26
karena 𝛽1 =
𝑥𝑖 𝑦𝑖 𝑥𝑖 2
, maka baris akhir menjadi
= 𝛽1
2
𝑥𝑖 2 − 𝛽1
2
𝑥𝑖 2 = 0
Berbagai jumlah kuadrat pada persamaan (23) dapat digambarkan sbb. : 𝑦𝑖2 = 𝑌𝑖 − 𝑌 2 = total variasi nilai Y sebenarnya di sekitar reratanya, disebut jumlah kuadrat total ( total sum of squares, TSS). 𝑦𝑖2 =
𝑌−𝑌
2
=
𝑌−𝑌
2
= 𝛽1
2
𝑥𝑖 2 =variasi
nilai Y yang ditaksir di sekitar reratanya 𝑌 = 𝑌 , yang disebut secara benar sebagai jumlah kuadrat akibat regresi ( karena peubah yang menjelaskan), atau dijelaskan oleh regesi, atau jumlah kuadrat yang dijelaskan (explained sum of squares, ESS ). 𝑒𝑖2 =residual atau variasi yang tak terjelaskan (unexplain ed) dari nilai Y di sekitar garis regresi, atau jumlah kuadrat residual (residual sum of squares, RSS). Atau
𝑇𝑆𝑆 = 𝐸𝑆𝑆 + 𝑅𝑆𝑆
Total variasi dalam nilai Y yang diamati di sekitar nilai rerata nya dapat dipisahkan ke dalam 2 bagian, sebagian oleh garis regresi dan bagian lain oleh kekuatan random karena tak semua pengamatan Y yang sebenarnya terletak pada garis yang dicocokkan.
𝐸𝑆𝑆
𝑅𝑆𝑆
1 = 𝑇𝑆𝑆 + 𝑇𝑆𝑆
=
𝑌𝑖 −𝑌 𝑌𝑖 −𝑌
2 2
+
𝑒𝑖2
𝑌𝑖 −𝑌 2
(24)
27
Didefinisikan
𝑌𝑖 −𝑌
𝑟 = 2
𝑌𝑖 −𝑌
2 2
𝐸𝑆𝑆
= 𝑇𝑆𝑆
(25)
Besaran 𝑟 2 disebut koefisien determinasi (sampel), digunsksn untuk mengukur kebeikan-suai(gooness of fit) garis regresi, Secara verbal, 𝑟 2 mengukurproporsi (bagian) atau prosentase total variasi dalam Y yang dijelaskan oleh model regresi.
Sifat𝑟 2 : 1. 𝑟 2 besaran non negatif 2. Batasnya 0 ≤ 𝑟 2 ≤ 1. 𝑟 2 = 1 berarti suatu kecocokan sempurna, sedangkan 𝑟 2 = 0 berarti tak ada hubungan antara peubah tak bebas dengan peubah yang menje laskan. Di sini 𝑟 2 dapat pula dihitung demikian :
𝐸𝑆𝑆
𝑟 2 = 𝑇𝑆𝑆
2
𝑦𝑖
= =
𝑦2𝑖 𝛽1
2
= 𝛽1
𝑥𝑖 2 𝑦2𝑖
2
𝑥𝑖 2 𝑦2𝑖
(26)
Jika pembilang dan penyebut dibagi dengan N atau 𝑁 − 1 (untuk sampel kecil) diperoleh :
28
𝑟 2 = 𝛽1
𝑆2𝑋
2
(27)
𝑆2𝑌
di mana 𝑆𝑌2 𝑑𝑎𝑛 𝑆𝑋2 adalah varians sampel Y dan X. sebuah besaran yang berhubungan erat tapi berbeda konsep adalah koefisien korelasi, yang merupakan ukuran tingkat hubungan antara dua pe ubah. Besaran nya dihitung dengan rumus : 𝑟 = ± 𝑟2
(28)
atau dari definisi nya 𝑥𝑖 𝑦𝑖
𝑟=
𝑥 𝑖2 𝑁
= 𝑁
𝑦𝑖2 𝑋 𝑖 𝑌𝑖 −
𝑋𝑖2 −
𝑋𝑖
2
𝑋𝑖
𝑌𝑖
𝑁
𝑌𝑖2 −
𝑌𝑖 2
(29)
yang dikenal sebagai koefisien korelasi sampel. Sifatr :
1. r dapat positif atau negatif, tandanya tergantung tanda pembilang persamaan (29), yang mengukur kovariasi kedua peubah. 2. −1 ≤ 𝑟 ≤ +1 3. 𝑆𝑖𝑓𝑎𝑡 𝑑𝑎𝑠𝑎𝑟𝑛𝑦𝑎 𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑠, yaitu koefisien korelasi antara X dan Y 𝑟𝑋𝑌 sama dengan koefisien korelasi antara Y dan X 𝑟𝑌𝑋 . 4. 𝑇𝑎𝑘 tergantung pada titik asal (origin) dan skala; yaitu jika didefinisi kan 𝑋𝑖∗ = 𝑎𝑋𝑖 + 𝑐 dan 𝑌𝑖∗ = 𝑏𝑌𝑖 + 𝑑, di mana 𝑎 > 0, 𝑏 > 0, 𝑐 𝑑𝑎𝑛 𝑑 konstan, maka r antara X* dan Y* adalah sama dengan r antara peubah asli X dan Y. 5. 𝐽𝑖𝑘𝑎 X dan Y bebas secara statistic, koefisien korelasi nya nol; tapi jika 𝑟 = 0, ini tak berarti kedua peubah bebas, jadi korelasi 0 tak berarti kebebasan.
29
6. 𝑟 hanyalah sebuahnukuran hubungan liniir atau ketergantungan liniir saja, r tadi tak mempunyai arti untuk menggambarkan hubungan nonliniir. 7. 𝑀𝑒𝑠𝑘𝑖𝑝𝑢𝑛 r adalah hubungan liniir antara dua peubah, tapi tak perlu adanya hubungan causalitas. 8. 𝑁𝑖𝑙𝑎𝑖 𝑟 = 𝑅 dalam regresi majemuk (berganda) nilainya diragukan.
Contoh : Diberikan data sampel seperti Tabel berikut. Asumsikan bahwa Y berhubungan liniir dengan X . Data mentah diperlukan untuk mendapatkan taksiran koefisien regresi, kesalahan standar, dsb.
Data hipotesis belanja konsumsi mingguan keluarga Y dan pendapatan mingguan keluarga X Y($) 70 65 90 95 110 115 120 140 155 150
X($) 80 100 120 140 160 180 200 220 240 260
Berdasarkan data mentah diperoleh :
30
𝛽0 = 24,4545
𝑣𝑎𝑟 𝛽0 = 41,137
𝑠𝑒 𝛽0 = 6,4138
𝛽1 = 0,5091
𝑣𝑎𝑟 𝛽1 = 0,0013
𝑠𝑒 𝛽1 = 0,0357
𝜎 2 = 42,1591
𝑟 2 = 0,9621
𝑟 = 0,9809
𝑑𝑓 = 8.
di mana 𝑣𝑎𝑟 𝛽1 =
𝑣𝑎𝑟 𝛽0 =
𝜎2
𝑠𝑒 𝛽1 =
𝑥 𝑖2
𝑋𝑖2 𝑁 𝑥 𝑖2
𝜎2
𝑠𝑒 𝛽0 =
𝜎 𝑥 𝑖2
𝑋𝑖2 𝑁
𝑥 𝑖2
𝜎
𝑠𝑒 ≡ 𝑘𝑒𝑠𝑎𝑙𝑎𝑎𝑛 𝑠𝑡𝑎𝑛𝑑𝑎𝑟; 𝜎 2 ≡ 𝑣𝑎𝑟𝑖𝑎𝑛𝑠 𝑢𝑖 𝑦𝑎𝑛𝑔 𝑘𝑜𝑛𝑠𝑡𝑎𝑛 atau homoskedastik (Asumsi 3). Nilai 𝜎 2 dihitung dengan rumus 𝜎2 =
𝑒𝑖2 𝑁−2
di mana 𝜎 2 adalah penaksir OLS dari 𝜎 2 yang sebenarnya tak diketahui dan di mana 𝑁 − 2 dikenal sebagai derajat kebebasan(number of degree of freedom, df), 𝑒𝑖2 adalah jumlah kudrat residual residual sum of squares (RSS). Istilah derajat kebebasan berarti jumlah total pengamatan dalam sam pel ( = N) dikurangi banyaknya kendali liniir bebas atau pembatasan (restriksi)yang diletakkan atas pengamatan . Untuk menghitung RSS (residusl sum of squares) terlebih dulu ditentukan 𝛽1 𝑑𝑎𝑛 𝛽0 , jadi ada 𝑁 − 2 pengamatan bebas . Untuk regresi tiga peubah mempunyai 𝑁 − 3df pengamatan bebas, untuk model k peubah akan dipilih𝑁 − 𝑘 𝑑𝑓 pengamatan bebas. Jadi df = banyaknya parameter yang ditaksir.
Rumus 𝜎 2 diturunkan sbb.:
31
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
Diketahui Maka
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢 ___________________ _ 𝑦𝑖 = 𝛽1 𝑥𝑖 + 𝑢𝑖 − 𝑢
𝑒𝑖 = 𝑦𝑖 − 𝛽1 𝑥𝑖
Juga diketahui
_________________ _
𝑒𝑖 = 𝛽1 𝑥𝑖 + 𝑢𝑖 − 𝑢 − 𝛽1 𝑥𝑖
𝑒𝑖 = 𝛽1 − 𝛽1 𝑥𝑖 + 𝑢𝑖 − 𝑢 𝑒𝑖 2 =
𝛽1 − 𝛽1
𝑒𝑖 2 =
𝑒𝑖 2 = 𝛽1 − 𝛽1 = 𝛽1 − 𝛽1
2
𝑋𝑖 − 𝑋
2
2
𝑥𝑖 2 + +
𝑥𝑖 + 𝑢𝑖 − 𝑢
𝛽1 − 𝛽1
𝑢𝑖 − 𝑢
𝑢𝑖 − 𝑢
2
2
2
𝑥𝑖 + 𝑢𝑖 − 𝑢
− 2 𝛽1 − 𝛽1
− 2 𝛽1 − 𝛽1
2
𝑥𝑖 𝑢𝑖 − 𝑢
𝑋𝑖 − 𝑋 𝑢𝑖 − 𝑢
2
= 𝑆𝑢𝑢 + 𝛽1 − 𝛽1 𝑆𝑋𝑋 − 2 𝛽1 − 𝛽1 𝑆𝑋𝑢
Diketahui bahwa :
𝑆𝑋𝑢 = 𝑆𝑋𝑦 − 𝛽𝑆𝑋𝑋 = 𝑆𝑋𝑋 𝛽1 − 𝛽1
Dengan mengambila ekspektasinys diperoleh
32
𝑒𝑖 2 = 𝐸 𝑆𝑢𝑢 − 𝑆𝑋𝑋 𝐸 𝛽1 − 𝛽1
𝐸
2
Di sini 𝐸 𝑆𝑢𝑢 dihitung sbb.:
Jika sebuah sampel random 𝑥1 , 𝑥2 , … , 𝑥𝑁 ditarik dari sebuah populasi normal dengan rerata 𝑑𝑎𝑛 𝑣𝑎𝑟𝑖𝑎𝑛𝑠 𝜎 2 , maka varians sampel
1
𝑠2 =
𝑁−1
𝑥𝑖 − 𝑥
𝑁 − 1 𝑠 2 /𝜎 2 =
atau
2
𝑥𝑖 − 𝑥
2
2 /𝜎 2 ~ 𝜒𝑁−1
di sini Chi-kuadrat mempunyai df =N – 1, karena 𝜇 (𝑡𝑎𝑘 𝑑𝑖𝑘𝑒𝑡𝑎𝑢𝑖) telah digantikan oleh 𝑥 (diketahui). Karena rerata 𝜒 2 adalah jumlah derajat kebebasannya (df) sendiri, maka 𝐸 𝜒2𝑁−1 = 𝐸
𝑥𝑖−𝑥 2 𝜎2
=𝑁−1
Jadi 𝐸 𝑆𝑢𝑢 = 𝑁 − 1 𝑉𝑎𝑟 𝑢 = 𝑁 − 1 𝜎2
Dan 𝐸
Jadi
𝛽1 − 𝛽1
2
=
𝜎2 𝑆𝑋𝑋
2
𝐸
𝑒𝑖 2 = 𝐸 𝑆𝑢𝑢 − 𝑆𝑋𝑋 𝐸 𝛽1 − 𝛽1
𝐸
𝑒𝑖 2 = 𝑁 − 1 𝜎2 − 𝑆 𝑆𝑋𝑋 = 𝑁 − 2 𝜎2
𝐸
𝑒 𝑖 2 = 𝑁 − 2 𝜎2
𝜎2
𝑋𝑋
33
Jadi jika didefinisikan
𝜎2 =
𝑒𝑖 2 𝑁−2
Maka 𝐸 𝜎
2
=𝐸
𝑒𝑖 2 𝑁−2
1
= 𝑁−2 𝐸
1
𝑒𝑖 2 = 𝑁−2 𝑁 − 2 𝜎2 = 𝜎2
Yang menunjukkan 𝜎 2 adalah penaksir tak bias dari 𝜎 2 yang sebenarnya.
Untuk mencari
𝑒𝑖2 digunakan rumus
𝑒𝑖2 =
𝑦𝑖2 − 𝛽1
2
𝑥𝑖 2 .
Oleh karenanya garis regresi yang ditaksir adalah
𝑌𝑖 = 24,4545 + 0,5091𝑋𝑖 . Arti dari garis regresi : 𝛽1 = 0,5091, mengukur kemringn garis regresi. Dari data mentah, jangkauan sampel antara $80 dan $260 per minggu pada saat X meningkat, katakana dengan $1, kenaikan rerata tingkat belanja konsumen mingguan yang ditaksir kira-kira 51 sen. Nilai 𝛽0 = 24,4545 , yang merupakan titik potong garis regresi dengan sumbu Y (intersep), menunjukkan rerata tingkat belanja konsumen mingguan ketika pendapatan mingguan adalah nol (pengangguran). Nilai 𝑟 2 = 0,9621 berarti bahwa 96% dari variasi dalam belanja konsumsi mingguan dijelaskan oleh pendapatan.
34
Koefisien korelasi, 𝑟 = 0,9809 menunjukkan kedua peubah, belanja konsumsi dan pendapatan, berhubungan secara positif dengan tingkat yang tinggi
Tabel Anatomi model regresi klasik dua-peubah Yang diasumsikan
Yang diamati
Gak dapat diamati
Yang dapat dinyatakan
Yang harus dihitung
𝛽0 𝑑𝑎𝑛 𝛽1 yang sebenarnya ada
𝛽0 𝑑𝑎𝑛 𝛽1 yang sebe narnya
Beberapa kriteria pe naksiran, mi salnya kua drat terkecil
𝛽0 𝑑𝑎𝑛𝛽1
ui sebenarnya ada
ui sebenarnya
Residual ei
𝐸 𝑢𝑖 𝐸 𝑢𝑖2
𝑒 = 𝑟𝑒𝑟𝑎𝑡𝑎 residual = 0 𝜎2 = 𝑡𝑎𝑘siran 𝜎 2
sifat ui : (i) 𝐸 𝑢𝑖 = 0 (ii) 𝐸 𝑢𝑖2 = 𝜎2 (iii) 𝐸 𝑢𝑖 , 𝑢𝑗 = =0 𝑖≠𝑗 Populasi Y untuk X terten tu di mana 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
Y dan X da lam suatu sampel ter tentu
Y yang taka da dalam sampel
𝑌𝑖
Soal
1. Buktikan kesamaan asumsi 2. Diberikan regresi sampel
35
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑒𝑖 . Dengan batasan (restriksi) 𝑒𝑖 = 0 dan 𝑒𝑖 𝑋𝑖 = 0, dapatkan penaksir 𝛽0 dan 𝛽1 dan tunjukkan kedanya identic dengan penaksir kuadrat terkecil. Metode untuk mendapatkan penaksir ini disebut prinsip analogi. 3. Misalkan 𝛽𝑦𝑥 𝑑𝑎𝑛 𝛽𝑥𝑦 secara berurut menyatakan kemiringan (gradient) regresi Y atas X dan X atas Y. Tunjukkan bahwa 𝛽𝑦𝑥 𝛽𝑥𝑦 = 𝑟 2 di mana r adalah koefisien korelasi antara X dan Y. 4. Koefisien korelasi tingkatan (peringkat) dari SPEARMAN didefinisikan sbb.: 6 𝑑2 𝑁 2 −1
𝑟𝑠 = 1 − 𝑁
di mana d =perbedaan tingkatan (peringkat) yang diberikan pada indivi du atau fenomena yang sama dan N = banyaknya individu atau fenomena yang diberi tingkatan (diranking). Peroleh 𝑟𝑠 𝑑𝑎𝑟𝑖 𝑟. Petunjuk: berikan peringkat nilai X dan Y dari 1 sampai N. Perhatikan bahwa jumlah peringkat X dan Y masing-masing N(N+1) /2 dan kar enanya reratanay adalah (N+1)/2. 5. Hitung peringkat Spearman dari
Peringkat: Tengah Semester Peringkat : Atas
Mahasiswa D 10
A 1
B 3
C 7
3
2
8
7
G 4 5
H 8 10
I 2 1
J 6 4
E 9
F 5
9
6
6. Tingkat ke luar dari pekerjaan dan pengangguran di sector Industri sbb.
Tahun
Tingkat ke luar dari
Tingkat pengangguran
36
pekerjaan per 100 buruh, Y 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
1,3 1,2 1,4 1,4 1,5 1,9 2,6 2,3 2,5 2,7 2,1 1,8 2,2
6,2 7,8 5,8 5,7 5,0 4,0 3,2 3,6 3,3 3,3 5,6 6,8 5,6
Asumsikan tingkat ke luar pekerjan Y berhubungan secara liniir dengan tingkat pengangguran X dalam bentuk 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 . Taksirlah 𝛽0 , 𝛽1 , 𝑑𝑎𝑛 𝑘𝑒𝑠𝑎𝑙𝑎𝑎𝑛 𝑠𝑡𝑎𝑛𝑑𝑎𝑟 (𝑠𝑒). Hitung 𝑟 2 dan r.
7. Tabel berikut menyajikan tingkat perubahan ( % per tahun) indeks harga saham (IHSG) dan indeks harga konsumen (IHK) di beberapa Negara pasca PD II (sampai 1969) Tingkat perubahan, % per tahun Negara 1.Australia 2.Austria 3.Belgia 4.Kanada 5.Chili
Harga saham,Y 5,0 11,1 3,2 7,9 25,5
Harga saham,X 4,3 4,6 2,4 2,4 26,4
37
6.Denmark 7.Finlandia 8.Perancis 9.Jerman 10.India 11.Irlandia 12.Israel 13.Italia 14.Jepang 15.Meksiko 16.Belanda 17.Selandia Baru 18.Swedia 19.Britania Raya 20.AS
3,8 11,1 9,9 13,3 1,5 6,4 8,9 8,1 13,5 4,7 7,5 4,7 8,0 7,5 9,0
4,2 5,5 4,7 2,2 4,0 4,0 8,4 3,3 4,7 5,2 3,6 3,6 4,0 3,9 2,1
(a) Taksirlah parameter regresi liniir tingkat perubahan harga sa ham terhadap tingkat perubahan harga konsumen dan dapat kan 𝑟 2 nya. (b) Apakah saham biasa merupakan pelindung (hedge) terhadap inflasi? Apakah saham biasa tadi merupakan pelindung yang sempurna?
8. Jika dalam model ln 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 dan 𝑌𝑖 = 𝛼0 + 𝛼1 𝑋𝑖 + 𝑢𝑖 Y menyatakan belanja konsumsi dan X menyatakan pendapatan, tunjuk kan bahwa elastisitas belanja konsumsi berkenaan dengan pendapatan ditunjukkan oleh 𝐸1 = 𝛽1 𝑋𝑖 dan 𝐸1 = 𝛼1 𝑋𝑖 /𝑌𝑖 , di mana E1 dan E2 ada lah elastisitas. Bagaimana Anda akan menginterpretasikan elastisitas ini? Petunjuk : Definisi elastisitas antara Y dan X adalah
𝑑𝑦 𝑑𝑥
𝑋/𝑌 .
38
9. Kurva belanja ERNST ENGEL (1821-1896) ahli statistic Jerman, menghubungkan belanja konsumen untuk sebuah barang (Y) dengan total pendapatannya (X). Perhatikan model berikut : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 𝑌𝑖 = 𝛽0 + 𝛽1 1/𝑋𝑖 + 𝑢𝑖 ln 𝑌𝑖 = ln 𝛽0 + 𝛽1 ln 𝑋𝑖 + 𝑢𝑖 ln 𝑌𝑖 = ln 𝛽0 + 𝛽1 ln 1/𝑋𝑖 + 𝑢𝑖 𝑌𝑖 = 𝛽0 + 𝛽1 ln 𝑋𝑖 + 𝑢𝑖 Yang mana di antara model tadi yang Anda pilih untuk kurva belanja Engel? Petunjuk : Interpretasikan berbagai koefisien arah (gradien); dapatkan bentuk yang menggambarkan elastisitas belanja yang berkenaan dengan pendapatan, dst.
BAB 3 ASUMSI KENORMALAN : MODEL REGRESI LINIIR NORMAL KLASIK Di sini gangguan populasi (disturbance) ui didistribusikan secara nor mal. Model ini disebut model regresi liniir normal klasik dua-peubah.
3.1
Distribusi Probabilitas Disturbance ui Dalam OLS sebelumnya, diasumsikan : 𝐸 𝑢𝑖 𝑋1 = 0 𝑐𝑜𝑣 𝑢𝑖 , 𝑢𝑗 = 0 → 𝑡𝑎𝑘 𝑎𝑑𝑎 𝑘𝑜𝑟𝑒𝑙𝑎𝑠𝑖 𝑣𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎 2 → 𝑜𝑚𝑜𝑠𝑘𝑒𝑑𝑎𝑠𝑡𝑖𝑘 Dengan 3 asumsi ini, penaksir OLS tidak bias dan varians mini mum(BLUE, best linear unbiased estimator). v. Semua asumsi diringkas menjadi
i. ii. iii. iv.
𝑢𝑖 ∼ 𝑁 0, 𝜎 2 → 𝑢𝑖 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑁𝑜𝑟𝑚𝑎𝑙
(30)
39
Untuk dua peubah yang didistribusikan secara normal kovarians atau korelasi nol berarti dua peubah tadi independen (bebas). Jadi, dengan asumsi (30) , 𝑢𝑖 𝑑𝑎𝑛 𝑢𝑗 tidak hanya tak berkorelasi tetapi juga terdistribusikan secara independen. 1.
2.
3.
3.2
Dalam central limit theorem yang hebat itu, jika ada sejumlah peubah random yang didistribusikan secara indenpenden dan identic, dengan beberapa perkecualian , jumlah distribusinya cenderung ke distribusi normaljika ba nyak peubah seperti itu meningkat tak terbatas., inilah justifikasi asumsi kenormalan ui. Sebuah varians dari central limit theorem menyatakan, sekalipun banyak peubah tak sangat besar atau jika peubah ini tak independen benar ( strictly independent), jumlahnya masih didistribusikan secara normal. Sifat distribusi normal, setiap fungsi liniir dari peubah-peubah yang didistribusikan normal dengansendirinya didistribusikan secara normal.
Sifat Penaksir OLS di bawah Asumsi Normal 2
Dengan asumsi normal, 𝛽0 , 𝑑𝑎𝑛 𝛽1 , 𝜎 mampunyai sifat-sifat stati stic :
1. Penaksir tidak bias 2. Penaksir mempunyai varians minimum; ditambah sifat 1, penaksir menjadi efisien. 3. Konsisten, dengan meningkatnya ukuran sampel tak terbatas, penaksir mengarah ke (converge) nilai populasi sebenarnya. 4. 𝛽0 , 𝑑𝑎𝑛 𝛽1 didistribusikan normal dengan : Rerata
:
𝛽1 =
𝐸 𝛽1 = 𝛽1 → 𝑝𝑒𝑛𝑎𝑘𝑠𝑖𝑟 𝑡𝑎𝑘 𝑏𝑖𝑎𝑠 𝑥𝑖 𝑦𝑖 𝑥𝑖 2
=
𝑥 𝑖 𝑌𝑖 −𝑌 𝑥𝑖 2
=
𝑥 𝑖 𝑌𝑖 𝑥𝑖 2
−
𝑌
𝑥𝑖 𝑥𝑖 2
40
= =
𝑥 𝑖 𝑌𝑖 𝑥𝑖 2
𝑘𝑎𝑟𝑒𝑛𝑎
𝑥𝑖 = 0
𝑘𝑖 𝑌𝑖 𝑑𝑖 𝑚𝑎𝑛𝑎 𝑘𝑖 =
𝑥𝑖 𝑥𝑖 2
= 𝑘𝑖 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 = ( 𝑘𝑖 𝛽0 + 𝑘𝑖 𝛽𝑖 𝑋𝑖 + 𝑘𝑖 𝑢𝑖 ) = 𝛽0
= 𝛽0
= 𝛽0
= 𝛽0
𝑘𝑖 + 𝛽1 𝑥𝑖 2 𝑥𝑖 2
𝑥𝑖 + 𝛽1 𝑥𝑖 2 𝑋𝑖 − 𝑋 + 𝛽1 𝑥𝑖 2 𝑋𝑖 − 𝑥𝑖
𝑋𝑖 𝑁 2
𝑘𝑖 𝑋𝑖 +
1 𝑥𝑖 2 1 𝑋𝑖
+ 𝛽1
2
𝑘 𝑖 𝑢𝑖
𝑋𝑖 +
𝑋𝑖 +
𝑋𝑖 +
𝑋𝑖 − 𝑋 𝑢𝑖 𝑥𝑖 2 𝑋𝑖 − 𝑋 𝑢𝑖 𝑥𝑖 2
= 0 + 𝛽1 + 0 = 𝛽1
𝑣𝑎𝑟 𝛽0 :
𝑥𝑖 𝑢𝑖 𝑥𝑖 2
(31)
𝜎𝛽20 =
𝑋𝑖2 𝑁
𝑥 𝑖2
𝜎2
(32)
atau,
𝛽0 ∼ 𝑁 𝛽0 , 𝜎2𝛽
0
(33)
5. 𝑁 − 2 𝜎 2 /𝜎 2 didistribusikan secara distribusi 𝜒 2 (Chi-kuadrat) de ngan derajat kebebasan𝑑𝑓 = 𝑁 − 2. 6. 𝛽0 , 𝑑𝑎𝑛 𝛽1 didistribusikan secarabebas dari 𝜎 2 7. 𝛽0 , 𝑑𝑎𝑛 𝛽1 mempunyai varians minimum dalam seluruh kelas penaksir tak bias, baik liniir maupun bukan liniir (Prof.RAO).
41
Kareana 𝛽1 𝑑𝑎𝑛 𝛽0 adalah fungsi liniir dari ui , dan ui terdistribusi normal, maka 𝛽1 𝑑𝑎𝑛 𝛽0 juga terdistribusi normal, dengan demikian Yi terdistribusi normal juga.
Rerata
: 𝐸 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖
(34)
𝑣𝑎𝑟 𝑌𝑖 = 𝜎2
(35)
atau 𝑌𝑖 ∼ 𝑁 𝛽0 + 𝛽1 𝑋𝑖 , 𝜎 2
(36)
BAB 4 PENAKSIRAN SELANG DAN PENGUJIAN HIPOTESIS REGRESI DUA PEUBAH Penaksiran Selang
Diperoleh kecenderungan konsumsi marjinal (MPC) yang ditaksir 𝛽1 = 0,5091 , yang merupakan taksiran tunggal dari MPC populasi 𝛽1 yang tak diketahui. Sampek di mana ini bisa dipercaya ? Dalam statistic, penaksir dapat dipercaya diukur dengan kesalahanstandar (se) atau varians nya . Jadi penaksir itu harus berada di selang tertentu atau selang di sekitar parameter sebenarnya, misalnya dalam 2 atau 3 se. Asumsikan ingin diketahui seberapa “dekat”, misalnya 𝛽1 terhadap 𝛽1 .
42
Diusahakan, menemukan dua angka positif 𝛿 dan 𝛼, dimana 0 < 𝛼 < 1, sede mikian sehingga probabilitas bahwa selang 𝛽1 − 𝛿, 𝛽1 + 𝛿 berisi (mengandung) 𝛽1 .sebenarnya adalah 1 − 𝛼. Atau 𝑃 𝛽1 − 𝛿 ≤ 𝛽1 . ≤ 𝛽1 + 𝛿 = 1 − 𝛼
(37)
Kalau selang ini ada disebut selang keyakinan (confidence interval); 1 − 𝛼 disebut koefisien keyakinan;dan 𝛼 disebut tingkat penting (level of signi ficance). Titik ujung selang keyakinan disebut batas keyakinan/ confibence limits (nilai kritis), 𝛽1 − 𝛿 sebagai batas keyakinan bawah dan 𝛽1 + 𝛿 sebagai batas atas keyakinan. Dalam praktek digunakan 100𝛼 𝑑𝑎𝑛 100 1 − 𝛼 persen.
4.1
Distribusi Normal, t, 𝝌𝟐 dan F : Sebuah Penyimpangan
Beberapa distribusi yang berhubungan dengan distribusi Normal.
Teorema 1 : Jika , 𝑍2 , … , 𝑍𝑁 peubah random yang didistribusikan se cara bebas dan normal sedemikian sehingga 𝑍𝑖 ∼ 𝑁 𝜇1 , 𝜎𝑖2 , maka jum lah =
𝑘𝑖 𝑍𝑖 , di mana 𝑘𝑖 konstan tidak semua nol, juga didistribusi
kan secara normal dengan rerata 𝑍𝑖 ∼ 𝑁
𝑘𝑖 𝜇 𝑖 ,
𝑘𝑖 𝜇𝑖 dan varians
𝑘𝑖 2 𝜎𝑖2 ; yaitu
𝑘𝑖 2 𝜎𝑖2 .
Teorema 2: Jika , 𝑍2 , … , 𝑍𝑁 peubah random yang didistribusikan se cara bebas dan normal sedemikian sehingga 𝑍𝑖 ∼ 𝑁 0,1 , yaitu peubah
43
normal yang distandardisir , maka
𝑍𝑖 2 mengikuti distribusi Chi-kua
drat dengan derajat kebebasan N. menggunakan symbol,
𝑍𝑖 2 ∼ 𝜒𝑁2 ,
di mana N menggambarkan derajat kebebasan nya (df).
Teorema 3:Jika
, 𝑍2 , … , 𝑍𝑁 peubah random yang didistribusikan
se cara bebas masing-masing mengikuti suatu distribusi Chi-kudrat de ngan derajat kebebasan 𝑘𝑖 , maka jumlah distribusi Chi-kuadrat dengan 𝑘 =
𝑍𝑖 juga mengikuti
𝑘𝑖 df, derajat kebebasan.
Teorema 4:jika Z1 peubah yan distandardisir 𝑍𝑖 ∼ 𝑁 0,1
dan peu
bah lain Z2menkikuti distribusi Chi-kuadrat dengan derajat kebebasan k dan bebas terhadap Z1, peubah tadi didefinisikan sebagai
𝑡=
𝑍1 𝑍2 / 𝑘
=
𝑍1 𝑘 𝑍2
(38)
mengikuti distribusi Student t dengan derajat kebebasan k.
Teorema 5 :Jika Z1 dan Z2 peubah Chi –kuadarat yang didistribusikan secara bebas dengan derajat kebebasan berurut-urut k1 dan k2, maka peubah 𝑍 /𝑘
𝐹 = 𝑍1 /𝑘 1 2
2
(39)
mempunyaidistribusiF dengan k1 dan k2.
44
4.2
Selang Keyakinan Untuk Koefisien Regresi 𝜷𝟎 dan 𝜷𝟏 Jadi misalnya, peubah
𝑍= =
𝛽1 −𝛽1 𝑠𝑒 𝛽1 𝑥𝑖2
𝛽1 − 𝛽1 𝜎
(40) adalah peubah normal yang distandardisir. Distribusi Normal dapat digunakan untuk membuat pernyataan probabilistic 𝛽1 asalkan varians populasi yang sebenarnya 𝜎 2 diketahui. Jika 𝜎 2 diketahui, sifst penting peubah yang didistribusikan secara normal dengan rerata 𝜇 dan varians 𝜎 2 , bahwa luas di bawah kurva normal antara 𝜇 ± 𝜎 kira-kira 68%, antara batas 𝜇 ± 2𝜎 kira-kira 95%, dan antara 𝝁 ± 𝟑𝝈kira-kira 99,7%. Tapi 𝜎 2 jarang diketahui, dalam praktek ditentukan dengan penaksir tak bias 𝜎 2 . Dengan menggantikan 𝜎 dengan 𝜎 , persamaan (40) menjadi
𝑡=
𝛽1 − 𝛽1 𝜎
𝑥𝑖2 (41)
di mana 𝑠𝑒 𝛽1 sekarang menyatakan kesalahan standar yang ditaksir. Persamaann (41) diturunkan sbb.: Misalkan
𝑍2 = 𝑁 − 2
𝜎2 dan 𝜎2
𝑍1 persamaan (40).
Asalkan 𝜎diketahui, 𝑍1 mengikuti distribusi normal yang distandardisasikan ; yaitu 𝑍1 ~𝑁 0,1 . 𝑍2 mengikuti distribusi Chi-kuadrat dengan 𝑑𝑓 = 𝑁 − 2. Dengan Teorema 4, diperoleh peubah
45
𝑡=
𝑍1 𝑁−2 𝑍2
Substitusi𝑍1 𝑑𝑎𝑛 𝑍2 diperoleh (41). Ditunjukkan bahwa peubah t mengikuti distribusi t dengan derajat kebebasan 𝑁 − 2. Jadi distribusi normal tak digunakan, jadi selang keyakinan untuk 𝛽1 sbb. : 𝑃 −𝑡𝛼 /2 ≤ 𝑡 ≤ 𝑡𝛼/2 = 1 − 𝛼
(42)
di mana 𝑡𝛼/2 adalah nilai peubah t yang diperoleh dari distribusi t untuk tingkat arti (penting, signifikan) 𝛼/2 dan derajat kebebasan 𝑁 − 2. substitusi (41) ke (42) diperoleh 𝑃 −𝑡𝛼/2 ≤
𝛽 1 −𝛽 1 𝑠𝑒 𝛽 1
≤ 𝑡𝛼/2 = 1 − 𝛼
(43)
atau 𝑃 𝛽1 − 𝑡𝛼 𝑠𝑒 𝛽1 ≤ 𝛽1 ≤ 𝛽1 + 𝑡𝛼/2 𝑠𝑒 𝛽1 2
=1−𝛼 (44)
Dengan 𝛽1 = 0,5091, 𝑠𝑒 𝛽1 = 0,0357, 𝑑𝑓 = 8,. Jika diasumsikan 𝛼 = 5%, 𝑦𝑎𝑖𝑡𝑢 95% 𝑘𝑜𝑟𝑓𝑖𝑠𝑖𝑒𝑛 𝑘𝑒𝑦𝑎𝑘𝑖𝑛𝑎𝑛, maka tabel t menunjukkan bahwa derajat kebebasan 8, 𝑡𝛼 /2 𝑘𝑟𝑖𝑡𝑖𝑠 = 𝑡0,025 = 2,306. Substitusi ke (44) diperoleh : 0,4268 ≤ 𝛽1 ≤ 0,5194
Interpretasinya : dengan koefisien keyakinan 95%, dalam jangka panjang, da lam 95 dari 100 kejadian ,selang seperti 0,4628 , 0,5914 akan berisi 𝛽 sebe narnya.
46
9,6643 ≤ 𝛽0 ≤ 39,2545
4.3
Selang Keyakinan untuk 𝝈𝟐
Di bawah asumsi kenormalan, peubah
𝜒2 = 𝑁 − 2
𝜎2 𝜎2
(45)
mengikuti distribusi 𝜒 2 dengan derajat kebebasan 𝑁 − 2 df. Jadi menggunakan distribusi𝜒 2 untuk menetapkan selang keyakinan untuk
𝜎2 :
2 𝑃 𝜒1−𝛼/2 ≤ 𝜒 2 ≤ 𝜒𝛼2 /2 = 1 − 𝛼
(46)
2 2 di mana 𝜒1−𝛼/2 𝑑𝑎𝑛 𝜒𝛼/2 diperoleh dari Tabel Chi-kuadrat untuk derajat kebebasan 𝑁 − 2sehingga kedua nilai ini memotong 100 𝛼/2 persen daerah ujung distribusi 𝜒 2 .
Substitusi (45) ke (46) diperoleh :
𝑃 𝑁−2
𝜎2 𝜒21−𝛼/2
≤ 𝜎2 ≤ 𝑁 − 2
𝜎2 𝜒2𝛼/2
= 1−𝛼
(47)
yang memberikan 100 1 − 𝛼 persen selang keyakinan untuk 𝜎 2 . 𝑓 𝜒2
47 datan
2,5%
Dari perhitungan diperoleh 𝜎 2 = 42,1591 dan derajat kebebasan 8. 2 Jika = 5% , Tabel Chi-kuadrat memberi nilai kritis 𝜒0,025 = 17,5346dan 2 𝜒0,975 = 2,1797 . Nilai-nilai ini menunjukkan bahwa probabilitas nilai Chikuadrat melebihi 17,5346 adalah 2,5% dan probabilitas 2,1797 adalah 97,5%.
Substitusi data ke (47) diperoleh 19,231 ≤ 𝜎2 ≤ 154,7038
4.4
Pengujian Hipotesis : Pendekatan Selang Keyakinan
Untuk menggambarkan selang keyakinan, digunakan contoh terda hulu, konsumsi-pendapatan. Di sini, MPC yang ditaksir 𝛽1 = 0,5091. Missal sekarang diasumsikan 𝐻0 : 𝛽1 = 0,3 𝐻1 : 𝛽1 ≠ 0,3
48
Hipotesis nol adalah hipotesis sederhana sedangkan hipotesis alterna tif adalah hipotesis gabungan. Apakah 𝛽1 yang diamati sesuai dengan H0 ? Selang jangka panjang seperti diperoleh sebelumnya 0,4268 , 0,5914 akan memuat 𝛽1 sebenarnya dengan probabilitas 95%. Dalam jangka panjang (penyampelan berulang) selang demikian memberikan sebuah jangkauan (range) atau batas-batas mana 𝛽1 mungkin terletak, ddengan koefisien keyakinan misalnya 95%. Jadi selang keyakinan tadi memberikan sekelompok hipotesis nol yang masuk akal. Karenanya, jia 𝛽1 dalam H0 berada dalam selang keyakinan 100 1 − 𝛼 per sen, Anda bisa menerima H0, jika 𝛽1 terletak di luar selang, Anda akan meno laknya. Jadi, pendekatan selang keyakinan terhadap pengujian hipotesis terdiri dari pertama mendapatkan selang-keyakinan yang sesuai dankemudian menguji apakah nilai dalam H0 terletak di dalam atau di luar selang. Untuk contoh hipotesis, 𝐻0 : 𝛽1 = 0,3jelas terletak di luar selang keyakinan 95% untuk 𝛽1 . Jadi hipotesis tadi ditolak; probabilitas untuk mengamati 𝛽1 seperti itu ( dengan 𝛽1 = 0,3) urang dari 2,5%.
4.5
Pengujian Hipotesis : Pendekatan Pengujian Tingkat-Penting (Test-of Significance)
Melengkapi metode selang-keyakinan pengujian hipotesis statistic dengan pendekatan pengujian tingkat tingkat penting di sepanjang garis yang independen oleh R.A.FISHER dan NEYMAN dan PEARSON. Pengujian tingkat-penting adalah prosedur dengan mana hasil sampel digunakan untuk menguji kebenaran atau kepalsuan sebuah hipotesis nol. Ide dasar di belakang pengujian tingkat penting adalah pengujian atas statistic uji (estimator) dan distribusi sampling statistic seperti itu dalam hipotesis nol. Keputusan untuk menerima atau menolak H 0 dibuat atas dasar nilai statistic uji yang diperoleh dari data yang dimiliki.
49
Sebagai ilustrasi, ingat bahwa dengan asumsi enormalan peubah
𝑡=
𝛽1 − 𝛽1 𝜎
𝑥𝑖2
mengikuti distribusi t dengan derajat kebebasan 𝑁 − 2. Jika nilai 𝛽1 sebenarnya yang dispesifikasikan dalam hipotesis nol, nilai t da pat segera dihitung dari sampel yang tersedia. Dan karenanya dapat berlaku se bagai statistic uji. Karena statistic uji ini mengikuti distribusi t, pernyataan mengenai selang-ke yakinan spt.berikut ini dapat dibuat :
𝛽 −𝛽 1∗ 𝛽1
𝑃 −𝑡𝛼/2 ≤ 𝑠𝑒1
≤ 𝑡𝛼/2 = 1 − 𝛼
(48)
di mana 𝛽1∗ adalah nilai 𝛽1 dalam H0 dan di mana −𝑡𝛼/2 𝑑𝑎𝑛 𝑡𝛼/2 adalah nilai t yang diperoleh dari Tabel t untuk tingkat penting 𝛼/2 dan derajat kebebasan 𝑁 − 2 . Mengatur kembali (48) diperoleh
∗
∗
𝑃 𝛽1 − 𝑡𝛼 𝑠𝑒 𝛽1 ≤ 𝛽1 ≤ 𝛽1 + 𝑡𝛼 /2 𝑠𝑒 𝛽1 2
= 1−𝛼 (49)
yang memberikan selang dalam mana 𝛽1 akan berada dengan probabilitas ∗
1 − 𝛼 , dengan mengingat 𝛽1 = 𝛽1. Dalam Bahasa pengujian hipotesis selang keyakinan 100 1 − 𝛼 persen yang dietapkan dalam (49) dikenal sebagai daerah penerimaan (dari
50
hipotesis nol) dan daerah (daerah-daerah) selang keyakinan disebut daerah (daerah-dae rah)penolakan (dari H0) atau daerah (daerah-daerah) kritis. Batas keyakinan, titik ujung selang-keyakinan, juga disebut nilai-nilai kritis. 𝒇 𝜷𝟏
𝜷𝟏 = 𝟎, 𝟓𝟎𝟗𝟏 𝒕𝒆𝒓𝒍𝒆𝒕𝒂𝒌
Kepadatan
𝒅𝒂𝒍𝒂𝒎 𝒅𝒂𝒆𝒓𝒂𝒉 𝒌𝒓𝒊𝒕𝒊𝒔 𝟐, 𝟓%
Daerah kritis 2,5%
𝜷𝟏
0,2177
0,3823
Gambar Selang keyakinan 95% untuk 𝜷𝟏 dengan hipote sis bahwa 𝜷𝟏 = 𝟎, 𝟑
Dalam prosedur selang-keyakinan Anda mencoba untuk menetapkan batas dalam mana nilai 𝛽1 yang sebenarnya tetapi tak diketahui letaknya, sedangkan dalam pengujian tingkat penting Anda menghipotesiskan beberapa nilai untuk 𝛽1 dan mencoba untuk melihat apakah 𝛽1 yang dihitung terletak dalam batas (keyakinan ) yang layak di sekitar nilai yang dihipootesiskan. Kembali pada Contoh sebelumnya, konsumsi-pendapatan. Diketahui 𝜷𝟏 = 𝟎, 𝟓𝟎𝟗𝟏 , 𝒔𝒆 𝜷𝟏 = 0,0357, dan derajat kebebasan = 8. Asumsikan 𝛼 = 5% , 𝑡𝛼 /2 = 2,306. Misalkan 𝐻0 : 𝛽1 = 𝛽1∗ = 0,3 𝑑𝑎𝑛 𝐻1 : 𝛽1 ≠ 3, menjadi 𝑃 0,2177 ≤ 𝜷𝟏 ≤ 0,3823 = 0,95 perhatikan Gambar,
𝑓 𝑡
𝑡 = 5,86 𝑡𝑒𝑟𝑙𝑒𝑡𝑎𝑘
adatan
𝑑𝑎𝑙𝑎𝑚 𝑑𝑎𝑒𝑟𝑎 𝑘𝑟𝑖𝑡𝑖𝑠 Daerah kritis 2,5%
2,5%
51
Dapat pula dihitung nilai t di tengah ketidaksamaan ganda (48) dan melihat apakah t tadi terletak antara nilai-nilai t kritis atau di luarnya.
𝑡=
0,5091−0,3 0,0357
= 5,86
yang terletak dalam daerah kritis Gambar di atas; Kesimpulan menolak H 0. Dalam bahasa pengujan tingkat arti, sebuah statistic dikatakan penting secara statistic (statistically significant) jika nilai statistic uji terletak dalamdaerah kritis. Dalam kasus ini hipotesis nol ditolak. Dikatakan secara statistictidak penting jika nilai statistic uji terletak dalam daerah penerimaan. Hipotesis Nol diterima. Pengujan di atas disebut pengujian dua-sisi (two-sided), atau dua ujung (two-tail) karena menunjukkan kedua ujung ekstrim distribusi probabilitas yang relevan, daerah penolakan, dan menolak hipotesis nol jika terletak di ujung manapun. Ini karena H1 merupakan hipotesis gabungandua ujung, 𝐻1 : 𝛽1 ≠ 3, baerarti 𝛽1 bisa lebih besar atau kurang dari 0,3. Tetapi jika 𝐻1 : 𝛽1 > 0,3 , merupakan satu ujung. Batas atas keyakinan atau nilai kritis sekarang bersesuaian dengan
52
𝑡𝛼 = 𝑡0,05 , yaitu tingkat 5%. Perhatikan Gambar berikut. Perhatikan peubah berikut :
𝜒2 = 𝑁 − 2
𝜎2 𝜎2
dengan hipotesis di atas, 𝜎 2 = 42,1591 dan derajat kebebasan 8. Jika didalil kan 𝐻0 : 𝜎2 = 85lawan 𝐻1 : 𝜎2 ≠ 85, persamaan di atas memberikan statistic uji untuk H0. Substitusi nilai yang sesuai ke dalam persamaan diperoleh H 0, 𝜒 2 = 3,97 . Asumsikan 𝛼 = 5%, nilai 𝜒 2 kritis adalah 2,1797 dan 17,5346. Karena 𝜒 2 dihitung terletak antara batas-batas ini, data mendukung hipotesis nol dan dapat diterima. Pengujian ini disebut pengujian tingkat penting Chi-kuadrat.
Kepadatan
𝑓 𝛽1
𝛽1 = 0,5091 terletak dalam daerah kritis 5%
95% Daerah Penerimaan
53 𝛽1
0,3
0,3664
4.2
Analisis Regresi dan Analisis Varians
Analisis regresi dari segi pandangan anlisis varians melengkapi masa lah inferensi yang bersifat statistic. Di depan telah diperoleh identitas :
𝑦𝑖2 =
𝑦𝑖2 +
𝑒𝑖2 = 𝛽12
𝑥𝑖2 +
𝑒𝑖2
54
yaitu, 𝑇𝑆𝑆 = 𝐸𝑆𝑆 + 𝑅𝑆𝑆, mermecah kuadrat total ke dalam dua komponen; jumlah kuadrat yang dijelaskan (ESS) dan kuadrat residual (RSS). Studi ini disebut analisis varians (ANOVA) dari sudut pandang regresi. Berkaitan dengan tiap jumlah kuadrat adalah derajat kebebasan (df ) banyaknya pengamatan independen yang mendasarinya. TSS mempunyai derajat kebebasan 𝑁 − 1 karena kehilangan 1 derajat kebebas an dalam menghitung rerata sampel 𝑌 . RSS memiliki derajat kebebasan 𝑁 − 2 .(Ini hanya benar untuk model regresi 2 peubah termasuk intersep 𝛽0 ). ESS mempunyai 1 derajat kebebasan (hanya benar untuk kasus 2 peubah), karena 𝐸𝑆𝑆 = 𝛽12 𝑥𝑖2 adalah fungsi dari 𝛽1 saja karena 𝑥𝑖2 diketahui. Peubah berikut diperoleh dari Tabel ANOVA ,
𝑀𝑆𝑆 𝑑𝑎𝑟𝑖 𝐸𝑆𝑆 𝑅𝑆𝑆
𝐹 = 𝑀𝑆𝑆 𝑑𝑎𝑟𝑖
2
=
𝛽1
𝑥2𝑖
(50)
𝑒2𝑖 /𝑁−2
Persamaan (50) dapat diturunkan sbb.: Persaman (40) menunjukkkan bahwa 𝑍1 ~𝑁 0,1 . Mengunakan Teorema 2, diperoleh, kuantitas
𝑍𝑖2 ==
𝑍𝑖2 = Mengikuti distribusi 𝜒 2
𝑥 𝑖2
𝛽 1 −𝛽 1
2
𝜎
𝛽 1 −𝛽 1 𝜎2
2
𝑥 𝑖2
dengan derajat kebebasan 1.
55
𝑍2 =
𝑁−2 𝜎 2 𝜎2
𝑒𝑖2 𝜎2
=
juga mengikuti distribusi 𝜒 2 dengan derajat kebebasan 𝑁 − 2 . 𝑍2 didistribusikan secara independen dari 𝑍1 . Maka menerapkan Teprema 5, diperoleh
𝐹=
𝑍𝑖2 /1
𝑍2 / 𝑁−2
𝛽 1 −𝛽 1
=
𝑒2𝑖 /
2
𝑥 𝑖2
𝑁−2
mengikuti distribusi F dengan derajat kebebasan berurut-urut 1 dan 𝑁 − 2 . Dengan anggapan berlaku hipotesis nol 𝐻0 : 𝛽1 = 0, F rasio bisa disederhana kan menjadi persamaan (50) 2
𝐹=
𝛽1
𝑥2𝑖
𝑒2𝑖 /𝑁−2
Tabel ANOVA model regresi dua-peubah Sumber variasi Akibat Regresi (ESS) Akibat residual (RSS)
SS 𝑦𝑖2 = 𝛽12
𝑒𝑖2
df 𝑥𝑖2
1
N –2
MSS = SS/df 𝛽12
𝑥𝑖2
𝑒𝑖2 = 𝜎2 𝑁−2
56
TSS
N –1
𝑦𝑖2
Dengan asumsi gangguan disturbance uididistribusikan secara nor mal dan 𝐻0 : 𝛽1 = 0, dapat ditunjukkan bahwa F dari (50) memenuhi kondisi Teorema 5.5 dan karenanya mengikuti distribusi F dengan derajat kebebbasan 1 dan N –2. Dari (50) dapat ditunjukkan
𝐸 𝛽12
𝑥𝑖2 = 𝜎 2 + 𝛽12
𝑥𝑖2
(51)
dan
𝐸
𝑒𝑖2 𝑁−2
= 𝐸 𝜎2 = 𝜎2
(52)
Pada ruas kanan (51) dan (52) parameter yang muncul 𝛽1 dan 𝜎 2 adalah yang sebenarnya. Jika pada kenyataannya 𝛽1 adalah nol, maka kedua persamaan memberikan taksiran yang identic 𝜎 2 . Dalam situasi ini, peubah yang menjelaskan X sama sekali tidak mempunyai pengaruh liniir atas Y dan seluruh variasi dalam Y dijelaskan oleh gangguan random ui . Oleh karena itu , rasio F memberikan sebuah pengujian hipotesis nol 𝐻0 : 𝛽1 = 0 . F dapat dihitung dari sampel yang tersedia, dan membandingkannya dengan nilai F kritis dari Tabel F. Ada hubungan yang menarik antara pengujian tingkat penting F dengan pengujian t yang dijumpai sebelumnya. Bahwa, kuadrat nilai t dengan derajat kebebasan N –k adalah nilai F dengan derajat kebebasan 1 dan N –k .( Derajat kebebasan pembilang rasio F harus 1 supaya pernyataan benar).
57
Jika diasumsikan 𝐻0 : 𝛽1 = 0, maka contoh konsumsi-pendapatan dengan menerapkan nilai t yang diperoleh adalah 14,26. Nilai t ini mempunyai derajat kebebasan 8. Dengan hipotesis yang sama nilai F adalah 202,87 dengan derajat kebebasan 1 dan 8. Jadi (14,26)2 = nilai F.
Soal
1. Menggunakan soal no.7 BAB 2 (a) Hitung kesalahan standar (se) taksiran parameter dan taksir 𝜎 2 . (b) Tetapkan selang keyakinan 95% untuk 𝛽0 , 𝛽1 , 𝑑𝑎𝑛 𝜎 2 . (c) Uji hipotesis berikut pada tingkat penting 5% : (i) 𝛽1 = 0, (ii) 𝛽0 = 0 (d) Dapatkah Anda menguji hipotesis bahwa 𝛽0 = 𝛽1 secara simultan de ngan menggunakan pengujian t ? Kenapa tidak ?
2. Tabel ANOVA untuk soal n0.6 BAB 2 adalah sbb.: Sumber variasi
SS
df
MSS
Karena regresi
2,153
1
2,153
Karena residual
1,144
11
0,104
Total
3297
12
Atas dasar data tadi, ujilah hipotesis nol bahwa tingkat keluarnya kar yawan pengangguran.
tidak
berhubungan
secara
liniir
dengan
tingkat
3. Tabel berikut ini memberikan indeks kompensasi per jam dan hasil per jam (yaitu, produktivitas tenaga kerja) untuk sector ekonomi swasta total AS untuk periode 1971-2 sampai 1975-4
58
Tahun dan triwulan (kuartal)
Indeks kompensasi per jam (1967 =100)
Indeks hasil per jam (1967 -100)
1971-2 -3 4 1972-1 -2 -3 -4 1973-1 -2 -3 -4 1974-1 -2 -3 -4 1975-1 -2 -3 -4
131,0 133,3 134,1 137,3 138,9 140,4 143,0 147,6 149,5 152,1 155,5 158,4 163,4 168,2 172,1 176,6 179,3 182,3 185,6
107,0 108,4 107,9 109,0 110,6 114,4 113,1 114,4 113,2 113,3 113,2 111,7 111,0 110,5 109,4 109,8 114,4 114,0 114,3
(a) Gunakan model regresi liniir yang sesuai untuk mengetahui apakah ada hubungan antara produktivitas tenaga kerja rerata dan kompensasi rera ta. Petunjuk : Petakan lebih dulu diagram pencarnya (b) Gunakan pengujian t dan F untuk menguji hipotesis bahwa tidak ada hubungan antara produktivitas dengan kompensasi.
4. Tunjukkan bahwa koefisien determinasi r2yang didefinisikan dalam (26) dapat juga dihitung sbb.: 2 𝑟𝑌𝑌 =
𝑌𝑖 −𝑌 𝑌𝑖 −𝑌 2 𝑌𝑖 −𝑌 2 𝑌𝑖 −𝑌 2
59
=
𝑦𝑖 𝑦𝑖 2 𝑦𝑖2
𝑦𝑖2
di mana Yi = Y sebenarnya, 𝑌 = 𝑌 𝑡𝑎𝑘𝑠𝑖𝑟𝑎𝑛, dan 𝑌 = 𝑌 = 𝑌 𝑟𝑒𝑟𝑎𝑡𝑎. Dengan menggunakan kata-kata, koefisien determinasi r2 adalah kuadrat koefisien korelasi antara Y sebenarnya dan Y taksiran. Petunjuk : Terapkan definisi r yang diberikan dalam (29) dan ingat bahwa 𝑥𝑖 𝑦𝑖 = 𝑦𝑖 + 𝑒𝑖 𝑦𝑖 = 𝑦𝑖2 . Catatan : Hubungan tadi berlaku bahkan jika ada lebih dari satu peubah yang menjelaskan ( explanatory variable) dalam model; yaitu hubungan tadi berlaku untuk model regresi majemuk (berganda).
5. R.A.Fisher telah mendapatkan distribusi sampling koefisien korelasi yang didefinisikan dalam (29). Jika diasumsikan bahwa peubah X dan Y didistribusikan secara normal gabungan (jointly normally distributed), yaitu bila peubah-peubah tadi berasal dari distribusi normal bivariate , maka dengan asumsi, maka dengan asumsi bahwa koefisien korelasi un tuk populasi 𝜌 = 0, dapat ditunjukkan bahwa 𝑡 = 𝑟 𝑁 − 2/ 1 − 𝑟 2 mengikuti distribusi Student t dengan derajat kebebasan (df) sebesar 𝑁 − 2 . Tunjukkan bahwa nilai t ini indentik dengan nilai t yang diberikan dalam (41) dengan mengingat berlakunya hipotesis nol bahwa 𝛽1 = 0. Jadi tentukan bahwa dengan hipotesis nol yang sama 𝐹 = 𝑡 2 . 6. Garis pasar modal (capital market line,CML) dari teori portofolio men dalilkan sebuah hubungan liniir antara tingkat hasil yang diharapkan dan risiko ( diukur dengan deviasi standarnyaa0 untuk portofolio yang efisien sbb.: 𝐸𝑖 = 𝛽0 + 𝛽1 𝜎𝑖 di mana 𝐸𝑖 = 𝑡𝑖𝑛𝑔𝑘𝑎𝑡 𝑎𝑠𝑖𝑙 𝑦𝑎𝑛𝑔 𝑑𝑖𝑎𝑟𝑎𝑝𝑘𝑎𝑛 𝑢𝑛𝑡𝑢𝑘 𝑝𝑜𝑟𝑡𝑜𝑓𝑝𝑙𝑖𝑜 𝑖 dan 𝜎𝑖 = 𝑑𝑒𝑣𝑖𝑎𝑠𝑖 𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑎𝑛 𝑡𝑖𝑛𝑔𝑘𝑎𝑡 𝑎𝑠𝑖𝑙. Berikut tingkat hasil yang diharapkan dan deviasi standar dari 10 portofolio dana bersama (mutual fund) di AS untuk periode 1954-1963. Periksa apakah data tsb. Mendukung teori,
60
Nama dana bersama
Tingkat hasil tahunan rerata,%
Deviasi standar ting kat hasil tahunan,%
Boston Fund Delaware Fund Equity Fund Fundamental Investors Investors Mutual Loomins-Sales Mutual Fund Massashusetts Investors Trust New England Fund Putnam Fund of Bos ton Wellington Fund
12,4 14,4 14,6 16,0
12,1 21,4 18,7 21,7
11,3 10,0
12,4 10,4
16,2
20,6
10,4 13,1
10,2 16,0
11,3
12,0
7. Misalkan persamaan indifference curve antara dua barang adalah: 𝑋𝑖 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 Bagaimana Anda akan menaksir parameter model ini? Gunakan model tadi terhadap data berikut dan berikan komentar atas hasil Anda : Konsumsi barang X Konsumsi barang Y
:1 2 3 4 5 : 4 3,5 2,8 1,9 0,8
BAB 5 ANALISIS REGRESI MAJEMUK (BERGANDA): MASALAH PENAKSIRAN 5.1
Model Tiga Peubah
PRF tiga peubah :
61
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑢𝑖
(53)
i menyatakan observasi ke i. YULE menulis dengan notasi demikian :
𝑌𝑖 = 𝛽1,23 + 𝛽12,3 𝑋2𝑖 + 𝛽13,2 𝑋3𝑖 + 𝑢𝑖
(54)
di mana indeks bawah koefisien diinteroretasikan sbb.: indeks bawah satu menyatakan peubah tak bebas Y, 2 menyatakan peubah yang menjelaskan X 2, dan 3 menyatakan peubah yang menjelaskan X 3. (Notasi lain untuk Yiadalah X1i). 𝛽1,23 faktor intersep. Memberikan gambaran pengaruh (efek) rerata semua peubah yang tidak dimasukkan ke dalam model terhadap Y, interpretasi mekanis nya rerata Y saat X2 dan X3 sama dengan nol. Koefisien 𝛽12,3 𝑑𝑎𝑛 𝛽13,2 disebut kefisien regresi parsial. Notasi Yule, X24 berarti observasi ke-4 atas peubah X2 . Tiga indeks bawah, indeks kiri disebut indeks utama, dan indeks kanan disebut indeks sekunder.
Asumsi Model
Empat asumsi pada model 2 peubah, ditambahkan satu lagi asumsi untuk model tiga peubah. Asumsi multikoliniritas,yang berarti tidak terdapat hubungan liniir yang pasti antara peubah yang menjelaskan. Secara formal, taka da multikoliniiritas berarti taka da sekumpulan angka 𝜆2 𝑑𝑎𝑛 𝜆3 , tidak nol keduanya, sedemikian sehingga
62
𝜆2 𝑋2𝑖 + 𝜆3 𝑋3𝑖 = 0
(55)
Jika hubungan liniir seperti itu ada, maka X2 dan X3 dikatakan koliniir, atau bergantung liniir. Persamaan (55) berlaku hanya jika 𝜆2 = 𝜆3 = 0 dan X2 dan X3 dikatakan bebas liniir . Misalkan Y, X2, dan X3secara berurut menyatakan belanja konsumsi, pendapatan, dan kekayaan konsumen. Secara teoritis ekonomi, pendapatan dan kekayaan mungkin mempunyai suatu pengaru bebas atas konsumsi. Jika terdapat hubungan liniir antara pendapatan dan kekayaan, hanya ada satu peubah bebas, dan takperlu memasukkan keduanya. Asumsi tak adanya multikoliniritas mensyaratkan bahwa dalam PRF teoritis yang dimasukkan hanya peubah-peubah yang bukan merupakan fungsi liniir dari peubah dalam model.
5.2
Penafsiran Persamaan Regresi Majemuk Harapan bersyarat :
𝐸 𝑌𝑖 𝑋2 , 𝑋3 = 𝛽1,23 + 𝛽12,3 𝑋2𝑖 + 𝛽13,2 𝑋3𝑖 + 𝑢𝑖
(56)
Arti persamaan (56) memberikan rerata atau nilai (yang) diharapkan bersyarat dari Y dengan syarat nilai X2 dan X3 yang tetap atau tertentu.
63
Jadi yang diperoleh nilai rerata Y untuk nilai-nilai peubah X yang tetap.
5.3
Koefisien Regresi Parsial
Arti koefisien regresi parsial : 𝛽12,3 mengukur perubahan nilai rerata Y, 𝐸 𝑌𝑖 𝑋2 , 𝑋3 , untuk tiap unit perubahan dalam X2, dengan menjaga agar X3konstan (ceteris paribus). Bagaimana menendalikan pengaruh liniir peubah bebas laindalam mengukur perubahan satu unit peubah tertentu dilakukan sbb.:
Tahap I Reresikan Y hanya atas X2
𝑌𝑖 = 𝛽1,23 + 𝛽12,3 𝑋2𝑖 + 𝑤𝑖
Tahap II Regresikan X2 atas X3 saja
𝑋2𝑖 = 𝛽2,3 + 𝛽23 𝑋3𝑖 + 𝑣𝑖 Now,
𝑤𝑖 = 𝑌𝑖 − 𝛽1,23 − 𝛽12,3 𝑋2𝑖 = 𝑌𝑖 − 𝑌𝑖 dan
𝑣𝑖 = 𝑋2𝑖 − 𝛽2,3 − 𝛽23 𝑋3𝑖 = 𝑋2𝑖 − 𝑋2𝑖
Arti 𝑤𝑖 , menyatakan nilai (liniir) X3 atas Yi .
𝑌𝑖 setelah menghilangkan pengaruh 64
Jadi dapat dikatakan 𝑤𝑖 𝑑𝑎𝑛 𝑣𝑖 adalah 𝑌𝑖 dan dari pencemaran X3.
𝑋2𝑖 yang telah “dimurnikan”
Tahap III Regresikan 𝑤𝑖 𝑎𝑡𝑎𝑠 𝑣𝑖
𝑤𝑖 = 𝑎0 + 𝑎1 𝑣𝑖 + 𝑧𝑖
Jadi seharusnya 𝑎0 memberikan sebuah taksiran pengaruh “sebenarnya” peru bahan satu unit X2 atas Y atau kemiringan /gradien sebenarnya Y terhadap X2,yaitu taksiran atas 𝛽12,3 . Tapi itu terlalu loja (too longer time), karena 𝑎1 dapat ditaksir secara lang sung dari formula
𝛽12,3 =
5.4
𝑦 𝑖 𝑥 2𝑖 2 𝑥 2𝑖
2 𝑥 3𝑖 −
𝑦 𝑖 𝑥 3𝑖
2 − 𝑥 3𝑖
𝑥 2𝑖 𝑥 3𝑖 𝑥 2𝑖 𝑥 3𝑖 2
Penaksir OLS Koefisien Regresi Parsial SRF yang berhubungan dengan PRF 𝑌𝑖 = 𝛽1,23 + 𝛽12,3 𝑋2𝑖 + 𝛽13,2 𝑋3𝑖 + 𝑒𝑖
(57)
Prosedur OLS dilakukan dengan memilih nilai parameter yang tak diketahui sehingga jumlah kuadrat resisual (RSS) yaitu 𝑒𝑖2 sekecil mungkin. Dengan motasi,
min
𝑒𝑖2 =
𝑌𝑖 − 𝛽1,23 − 𝛽12,3 𝑋2𝑖 − 𝛽13,2 𝑋3𝑖
2
(58)
di mana RSS diperoleh dengan manipulasi aljabar sederhana.
65
Memperoleh peneksir yang akan meminimumkan (58), dengan mendifferen sialkan terhadap peubah yang tak diketahui, dan menyamakannnya dengan nol, serta menyelesaikan secara simultan. Jadi 𝜕𝑒𝑖2 𝜕𝛽 1,23
=2
𝜕𝑒𝑖2 𝜕𝛽12,3
𝜕𝑒𝑖2 𝜕𝛽13,2
𝑌𝑖 − 𝛽1,23 − 𝛽12,3 𝑋2𝑖 − 𝛽13,2 𝑋3𝑖 −1 = 0
=2
𝑌𝑖 − 𝛽1,23 − 𝛽12,3 𝑋2𝑖 − 𝛽13,2 𝑋3𝑖 −𝑋2𝑖 = 0
=2
𝑌𝑖 − 𝛽1,23 − 𝛽12,3 𝑋2𝑖 − 𝛽13,2 𝑋3𝑖 −𝑋2𝑖 = 0
dengan penyederhanaan diperoleh persamaan normal :
𝑌𝑖 = 𝛽1,23 +12,3 𝑋2𝑖 + 𝛽13,2 𝑋3𝑖
𝑌𝑖 𝑋2𝑖 = 𝛽1,23
𝑋2𝑖 + 𝛽12,3
𝑋2𝑖 2 + 𝛽13,2
𝑌𝑖 𝑋3𝑖 = 𝛽1,23
𝑋3𝑖 + 𝛽12,3
𝑋2𝑖 𝑋3𝑖 + 𝛽13,2
(59)
𝑋2𝑖 𝑋3𝑖 (60)
𝑋3𝑖 2 (61)
Diperoleh :
𝛽1,23 = 𝑌𝑖 −𝛽12,3 𝑋2𝑖 − 𝛽13,2 𝑋3𝑖
(62)
Menggunakan huruf kecil untuk simpangan dari nilai rerata sampel persama an (59) , (60) dan (61) diperoleh
66
𝛽12,3 =
𝑦 𝑖 𝑥 2𝑖
2 𝑥 3𝑖 −
𝑦 𝑖 𝑥 3𝑖
𝛽13,2 =
𝑦 𝑖 𝑥 3𝑖
2 𝑥 2𝑖 −
𝑦 𝑖 𝑥 2𝑖
2 𝑥 2𝑖
2 𝑥 2𝑖
𝑥 2𝑖 𝑥 3𝑖 𝑥 2𝑖 𝑥 3𝑖 2
2 − 𝑥 2𝑖
(63)
𝑥 2𝑖 𝑥 3𝑖 𝑥 2𝑖 𝑥 3𝑖 2
2 − 𝑥 2𝑖
(64)
yang masing-masing penaksir OLS koefisien regresi parsial populasi .
Varians dan Kesalahan Standar Penaksir OLS
Varians dan kesalahan standar berguna untuk menetapkan selang keyakinan dan uji hipotesis statistic.
𝑣𝑎𝑟
𝑠𝑒
𝑣𝑎𝑟
𝑠𝑒
𝛽12,3 =
𝑥23𝑖 𝑥22𝑖
𝑥23𝑖
−
𝑥2𝑖 𝑥3𝑖
2𝜎
2
(65)
𝛽12,3 = + 𝑣𝑎𝑟 𝛽12,3
𝛽13,2 =
𝛽13,2
(66)
𝑥22𝑖 𝑥22𝑖
= + 𝑣𝑎𝑟
𝑥23𝑖
−
𝑥2𝑖 𝑥3𝑖
2𝜎
2
(67)
𝛽13,2
(68)
di mana 𝜎 2 adalah varians (homoskedastik) dari gangguan penaksir ui . Taksiran tak bias dari 𝜎 2 diperoleh dari 𝑒2
𝜎 2 = 𝑁−3𝑖
(69) 67
Di sini 𝑑𝑓 = 𝑁 − 3 karena harus menaksir lebih du/lu 𝛽1,23 , 𝛽12,3 𝑑𝑎𝑛𝛽13,2 yang menghabiskan 3 derajat kebebasan, sisanya 𝑁 − 3. Jadi jika ada N penaksir yang dicari, maka Untuk menghitung
𝑒𝑖2 =
𝑦 2 − 𝛽12,3
𝜎2 =
𝑒𝑖2 (kenapa ?).
𝑒𝑖2 dari (69) digunakan
𝑦𝑖 𝑥2𝑖 − 𝛽13,2
𝑦𝑖 𝑥3𝑖
(70)
Sifat –sifat Penaksir OLS
Dalam kerangka kerja model regresi liniir Klasik, penaksir OLS memenuhi Teorema GAUSS-MARKOV, dalam penaksir tak bias liniir,penak sir OLS mempunyai varians minimum. Ciri SRF : 1.Garis (permukaan/bidang) regresi 3 peubah melewati rerata 𝑌, 𝑋2 𝑑𝑎𝑛 𝑋3 2.Nilai rerata𝑌 = 𝑌 dilihat demikian
𝑌𝑖 = 𝛽1,23 + 𝛽12,3 𝑋2𝑖 + 𝛽13,2 𝑋3𝑖 = 𝑌 − 𝛽12,3 𝑋2 − 𝛽13,2 𝑋3 + 𝛽12,3 𝑋2𝑖 + 𝛽13,2 𝑋3𝑖 = 𝑌 + 𝛽12,3 𝑋2𝑖 − 𝑋2 + 𝛽13,2 𝑋3𝑖 − 𝑋3 = 𝑌 + 𝛽12,3 𝑥2𝑖 + 𝛽13,2 𝑥3𝑖 𝑌 = 𝑌 + 𝛽12,3 𝑥2𝑖 + 𝛽13,2 𝑥3𝑖 𝑌=𝑌
(71)
Sekali lagi,
𝑌𝑖
= 𝑌 + 𝛽12,3 𝑥2𝑖 + 𝛽13,2 𝑥3𝑖
𝑌𝑖 − 𝑌 = 𝛽12,3 𝑥2𝑖 + 𝛽13,2 𝑥3𝑖 𝑦𝑖 = 𝛽12,3 𝑥2𝑖 + 𝛽13,2 𝑥3𝑖
(72)
68
Dengan demikian SRF dapat ditulis dalam bentuk deviasi (penyimpangan) sbg.:
𝑦𝑖 = 𝑦𝑖 + 𝑒𝑖 = 𝛽12,3 𝑥2𝑖 + 𝛽13,2 𝑥3𝑖 + 𝑒𝑖
(73)
3. 𝑒𝑖 = 0 4.𝑒𝑖 tak berkorelasi dengan𝑌𝑖 , yaitu, 𝑒𝑖 𝑌𝑖 = 0 5.𝑅𝑒𝑠𝑖𝑑𝑢𝑎𝑙 𝑒𝑖 tak berkorelasi dengan 𝑋2𝑖 𝑑𝑎𝑛 𝑋3𝑖 ; yaitu, 𝑒𝑖 𝑋2𝑖 =
𝑒𝑖 𝑋2𝑖 = 0
6.Untuk uji hipotesis diasumsikan bahwa gangguan 𝑢𝑖 didistribusikan secara normal dengan rerata 0 dan varians𝜎 2 . Dengan asumsi ini, penaksir 𝛽1,23 , 𝛽12,3 𝑑𝑎𝑛𝛽13,2 dengan sendirinya didistribusikan secara normal dengan rerata berurut 𝛽1,23 , 𝛽12,3 𝑑𝑎𝑛𝛽13,2 , dengan varians seperti di atas. Peneksir-penaksir tersebut berdistribusi normal, ini penting untuk uji Hipotesis . 7.Seperti model 2 peubah, maka dengan asumsi kenormalan dapat 2
ditunjukkan bahwa 𝑁 − 3 𝜎 /𝜎 2 mengikuti distribusi 𝜒 2 dengan 𝑑𝑓 = 𝑁 − 3. Ini memungkinkan untuk menguji hipotesis 𝜎 2 sebenar nya.
5.5
Koefisien Determinasi Majemuk R2dan Koefisien Korelasi Majemuk R
Dalam model 3 peubah hendak diketahui proporsi variasi dalam Y yang dijelaskan oleh peubah X2 dan X3 secara bersama-sama (gabungan). Besaran ini disebut koefisien determinasi majemuk, dinyatakan dengan R2. Diketahui,
69
𝑌𝑖 = 𝛽1,23 + 𝛽12,3 𝑋2𝑖 + 𝛽13,2 𝑋3𝑖 + 𝑒𝑖 = 𝑌𝑖 + 𝑒𝑖
(74)
di mana 𝑌𝑖 adalah nilai 𝑌𝑖 yang ditaksir dari garis regresi yang dicocokkan dan merupakan penaksir dari 𝐸 𝑌𝑖 𝑋2𝑖 , 𝑋3𝑖 . Dengan penyimpangan dari rerata digunakan huruf kecil
𝑦𝑖 = 𝛽1,23 + 𝛽12,3 𝑥2𝑖 + 𝛽13,2 𝑥3𝑖 + 𝑒𝑖 = 𝑦𝑖 + 𝑒𝑖
(75)
Dengan menjumlahkan kuadrat kedua sisi
Jadi
𝑦𝑖 2 =
𝑦𝑖 2 +
𝑒𝑖 2 + 2
=
𝑦𝑖 2 +
𝑒𝑖 2
𝑦𝑖 𝑒𝑖 (76)
𝑇𝑆𝑆 = 𝐸𝑆𝑆 + 𝑅𝑆𝑆
Dari persamaan (70) diketahui 𝑒𝑖2 =
𝑦 2 − 𝛽12,3
𝑦𝑖 𝑥2𝑖 − 𝛽13,2
𝑦𝑖 𝑥3𝑖
Substitusi (70) ke (76) diperoleh
𝑦𝑖 2 =
𝑦𝑖 2 +
𝑦𝑖 2 − 𝛽12,3
𝑦𝑖 𝑥2𝑖 − 𝛽13,2
𝑦𝑖 𝑥3𝑖
atau 𝐸𝑆𝑆 =
𝑦𝑖 2 = 𝛽12,3 𝑦𝑖 𝑥2𝑖 + 𝛽13,2 𝑦𝑖 𝑥3𝑖
(77)
Dengan definisi
70
𝐸𝑆𝑆
𝑅 2 = 𝑇𝑆𝑆
=
(78)
𝛽 12,3
𝑦 𝑖 𝑥 2𝑖 +𝛽 13,2
𝑦 𝑖 𝑥 3𝑖
𝑦𝑖 2
(79)
atau 𝑅2 = 1 −
𝑒𝑖 2 /
𝑦𝑖 2
(80)
atau 𝑅1,23 2 = 1 −
𝑒𝑖 2 /
𝑦𝑖 2
Di sini 0 < 𝑅2 < 1
Kecocokan model dikatakan “lebih baik” jika 𝑅2 mendekati 1. Koefisien Korelasimajemuk , dinyatakan dengan R, dan mengukur tingkat hubungan antara Y dengan semua peubah yang menjelaskan secara ber sama-sama. Nilai R selalu positif; tapi prakteknya R tidak berarti.
Contoh FUngsi Produksi COBB-DOUGLAS
Diberikan fungsi produksi Cobb-Douglas
𝛽
𝛽
𝑌𝑖 = 𝛽1,23 𝑋2𝑖12,3 𝑋3𝑖13 ,2
71
Dengan log-liniir diperoleh ln 𝑌𝑖 = 𝛽0 + 𝛽12,3 ln 𝑋21 + 𝛽13,2 ln 𝑋31
(81)
di mana 𝑌 = 𝑎𝑠𝑖𝑙 𝑜𝑢𝑡𝑝𝑢𝑡 , X2 = 𝑚𝑎𝑠𝑢𝑘𝑎𝑛 𝑡𝑒𝑛𝑎𝑔𝑎 𝑘𝑒𝑟𝑗𝑎, 𝑋3 = 𝑚𝑎𝑠𝑢𝑘𝑎𝑛 𝑚𝑜𝑑𝑎𝑙, 𝑑𝑎𝑛 𝛽0 = 𝛽1,23 . Ciri Fungsi Cobb-Douglas : i. ii.
𝛽12,3 𝑑𝑎𝑛 𝛽13,2 mengukur elastisitas hasil terhadap upah dan modal. 𝐽𝑢𝑚𝑙𝑎 𝛽12,3 + 𝛽13,2 memberikan informasi mengenai pengaruh skala terhadap hasil yang konstan (constan return to scale), melipatduakan masukan akan melipatduakan hasil. Jika < 1, skala menurunterhadap hasil (decreasing), melipatduakan masukan akan memberikan hasil yang kurang dari dua kali lipat.
Diberikan Tabel Data sbb.:
Produksi riil bruto, orang hari (man days) dan masukan modal riil dalam sektor pertanian di Taiwan, 1958-1972 Tahun
1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972
Produk real bruto ( Jutaan NT $), Y
16607,7 17511,3 20171,2 20932,9 20406,0 20831,6 24806,3 26465,8 27403,0 28628,7 29904,5 27508,2 29035,5 29281,5 31535.8
Orang hari (jutaan hari) , X2
Masukan modal real (jutaan NT$),X3
275,5 274,4 269,7 267,0 267,8 275,0 283,0 300,7 307,5 303,7 304,7 298,6 295,5 299,0 288,1
17803,7 18096,8 18271,8 19167,3 19647,6 20803,5 22076,6 23445,2 24939,0 26713,7 29957,8 31585,9 33474,5 34821,8 417943
72
Dengan OLS diperoleh
ln 𝑌𝑖 = −3,3384 + 1,4988 ln 𝑋2 + 0,4899 ln 𝑋3 0,5398
𝑟 = 2,7765 𝑅 2 = 0,8890
0,1020 4,8005 𝑑𝑓 = 8
→ 𝑠𝑒
Dari OLS, di sektor pertanian Taiwan untuk periode 1958-1972 berurut-urut elastisitas hasil tenaga kerja dan modal 1,4988 dan 0,4899. Dengan menjag modal tetap (ceteris paribus), 1% kenaikan masukan tenaga kerja mengakibatkan peningkatan rerata sekitar 1,5% dalam output. Menjumlah kedua elastisitas tersebut 1,9887, merupakan parameter pengaruh skala (produksi) terhadap hasil. Taiwan mengalami skalia tingkat hasil increasing. Nilai R2 sebesar 0,8990 berarti sekitar 89% dari variasi dalam (log) hasil dijelaskan oleh (log) tenaga kerja dan modal.
5.6
Membandingkan Dua atau Lebih Nilai R2: R2yang Disesuaikan(Adjust)
Dengan meningkatnya jumlah peubah yang menjelaskan, R2 selalu meningkat tak pernah turun.
𝐸𝑆𝑆
𝑅 2 = 𝑇𝑆𝑆 =
𝑇𝑆𝑆−𝑅𝑆𝑆 𝑇𝑆𝑆
𝑅𝑆𝑆
= 1 − 𝑇𝑆𝑆 = 1 −
𝑒𝑖 2 /
𝑦𝑖 2
(82)
73
Untuk membandingkan dua 𝑅 2 , harus diperhitungkan banyaknya peubah X yang ada dalam model.Dengan mempertimbangkan koefisien determinasi alternatif, sbb.:
𝑅2 = 1 −
𝑒 𝑖 2 𝑁−𝑘 𝑦 𝑖 2 / 𝑁−1
(83)
di mana 𝑘 = 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑒𝑟 𝑑𝑎𝑙𝑎𝑚 𝑚𝑜𝑑𝑒𝑙 𝑡𝑒𝑟𝑚𝑎𝑠𝑢𝑘 𝑖𝑛𝑡𝑒𝑟𝑠𝑒𝑝. Dalam model 3 peubah, k = 3.. R2 demikian disebut yang disesuaikan (adjust). Yang disesuaikan berarti disesuaikan untuk derajat kebebasan yang berkaitan dengan jumlah kuadrat yang ada dalam persamaan (83). Dari persamaan (83), ter termasuk intersep
𝑒𝑖 2 mempunyai 𝑑𝑓 = 𝑁 − 𝑘 karena ada 3 parame
𝑦𝑖 2 mempunyai 𝑑𝑓 = 𝑁 − 1 karena kehilangan 1 kebebasan akibat ada nya 𝑌 dalam menciptakan peubah simpangan. Persamaan (83) dapat juga dihitung dengan
𝜎2
𝑅2 = 1 − 𝑆 2
(84)
𝑦
di mana 𝜎 2 adalah varians residual, dan 𝑆𝑦2 adalah varians sampel dari Y. Substitusi (83) ke (84) diperoleh
𝑅 2 = 1 − 1 − 𝑅2
𝑁−𝑘 𝑁−1
(85)
Hasilnya
74
i.
ii.
Untuk 𝑘 > 1, 𝑅 2 < 𝑅 2 , dengan meningkatnya banyaknya peubah X, maka 𝑅 2 meningkat dengan peningkatan lebih kecil dari 𝑅 2 . 𝑅 2 dapat berharga negatif, namun dalam prakteknya diambil nol.
Dalam membandingkan koefisien determinasi,peubah tak bebas harus sama, spt.: ln 𝑌𝑖 = 𝛽0 + 𝛽12,3 ln 𝑋2𝑖 + 𝛽13,2 ln 𝑋3𝑖 𝑌𝑖 = 𝛼0 + 𝛼12,3 𝑋2𝑖 + 𝛼13,2 𝑋3𝑖
Di sini 𝑅2 tak dapat dibandingkan, karena Y diukur dalam ln , sedang yang lain tidak dalam ln. Jadi agar dapat dibandingkan harus dicari dulu antilog nya.
5.7 Koefisien Korelasi Parsial Untuk model 3 regresi peubah dapat dihitung 3 koefisien korelasi : 𝑟12 (𝑘𝑜𝑟𝑒𝑙𝑎𝑠𝑖 𝑎𝑛𝑡𝑎𝑟𝑎 𝑌 𝑑𝑎𝑛 𝑋2 , 𝑟13 (𝑘𝑜𝑟𝑒𝑙𝑎𝑠𝑖 𝑎𝑛𝑡𝑎𝑟𝑎 𝑌 𝑑𝑎𝑛 𝑋3 𝑑𝑎𝑛 𝑟23 (𝑘𝑜𝑟𝑒𝑙𝑎𝑠𝑖 𝑎𝑛𝑡𝑎𝑟𝑎 𝑋2 𝑑𝑎𝑛 𝑋3 . Koefisien ini disebut koefisien korelasi sederhana atau koefisien derajat nol. Yang ingin dicari yang bebas dari pengaruh, kalau ada, X3 atas X2 dan Y. Koefisien seperti ini disebut koefisien korelasi parsial. Jadi, 𝑟12,3 = 𝑘𝑜𝑒𝑓𝑜𝑠𝑖𝑒𝑛 𝑘𝑜𝑟𝑒𝑙𝑎𝑠𝑖 𝑝𝑎𝑟𝑠𝑖𝑎𝑙 𝑎𝑛𝑡𝑎𝑟𝑎 𝑌 𝑑𝑎𝑛 𝑋2 , 𝑑𝑒𝑛𝑔𝑎𝑛 menjaga agar X3 konstan.
𝑟13,2 = 𝑘𝑜𝑒𝑓𝑜𝑠𝑖𝑒𝑛 𝑘𝑜𝑟𝑒𝑙𝑎𝑠𝑖 𝑝𝑎𝑟𝑠𝑖𝑎𝑙 𝑎𝑛𝑡𝑎𝑟𝑎 𝑌 𝑑𝑎𝑛 𝑋3 , 𝑑𝑒𝑛𝑔𝑎𝑛
75
menjaga agar X2 konstan.
𝑟23,1 = 𝑘𝑜𝑒𝑓𝑜𝑠𝑖𝑒𝑛 𝑘𝑜𝑟𝑒𝑙𝑎𝑠𝑖 𝑝𝑎𝑟𝑠𝑖𝑎𝑙 𝑎𝑛𝑡𝑎𝑟𝑎 𝑋3 𝑑𝑎𝑛 𝑋2 , 𝑑𝑒𝑛𝑔𝑎𝑛 menjaga agar Ykonstan.
Jika 𝑤𝑖 𝑑𝑎𝑛 𝑣𝑖 , 𝑦𝑎𝑖𝑡𝑢 𝑌𝑖 𝑑𝑎𝑛 𝑋21 , 𝑦𝑎𝑛𝑔 𝑡𝑒𝑙𝑎 𝑑𝑖𝑚𝑢𝑟𝑛𝑢𝑘𝑎𝑛.
diregresi
𝑟𝑤𝑣 = 𝑟12,3
= =
𝑤 𝑖 −𝑤 𝑣𝑖 −𝑣 𝑤 𝑖 −𝑤 𝟐 𝑣𝑖 −𝑣 𝟐 𝒘𝒊 𝒗 𝒊 𝒘𝒊 𝟐
(86)
𝒗𝒊 𝟐
di mana 𝑤 = 𝑣 = 0. Jelas bahwa korelasi parsial antara Y dan X2 dengan menjaga agar X3 konstan tak lain adalah koefisien korelasi sederhana (atau derajat nol) berurut-urut antara residual dari regresi Y atas X3 dan X2 atas X3, 𝑟13,2 dan 𝑟23,1 harus diinprestasikan secara sama. Korelasi dapat dengan mudah diperoleh dari koefisien korelasi seder hana :
𝑟12,3 = 𝑟13,2 = 𝑟23,1 =
𝑟12 −𝑟13 𝑟23 2 1−𝑟13
2 1−𝑟23
𝑟13 −𝑟12 𝑟23 2 1−𝑟12
2 1−𝑟23
𝑟23 −𝑟12 𝑟13 2 1−𝑟12
2 1−𝑟13
(87)
(88)
(89)
76
Koefisien korelasi parsial ini disebut koefisien korelasi derajat satu. Yang dimaksud dengan derajat adalah banyaknya indeks bawah sekunder. Jadi 𝑟13,34 merupakan koefisien korelasi derajat dua.
i. ii.
iii.
Jika 𝑟12 = 0, 𝑟12,3 ≠ 0 kecuali 𝑟13 𝑎𝑡𝑎𝑢 𝑟23 . Jika 𝑟12 = 0,dan 𝑟13 𝑠𝑒𝑟𝑡𝑎 𝑟23 ≠ 0 dan mempunyai tanda yang sama, , maka 𝑟12,3 mempunyai tanda negatif, jika tandanya berlawanan, maka 𝑟12,3 akan bertanda positif. Koefisien korelasi parsial 0≤
𝑟12 −𝑟13𝑟23 1−𝑟213 1−𝑟223
≤1
0 ≤ 𝑟12 − 𝑟13 𝑟23
2
2 2 ≤ 1 − 𝑟13 1 − 𝑟23
0 ≤ 𝑟12 2 + 𝑟13 2 + 𝑟23 2 − 2𝑟12 𝑟13 𝑟23 ≤ 1
iv.
𝑟12,3 2 = 𝑅2
6.8
Beberapa Hubungan Unik
(90)
Antara Koefisien Regresi Sederhana dan Korelasi Sederhana
𝛽12,3 =
𝛽 12 −𝛽 13 𝛽 32 1−𝛽 23 𝛽 32
=
𝑟12−𝑟13𝑟23 𝑆1 1−𝑟223 𝑆2
(91)
77
𝛽13,2 =
𝛽 13 −𝛽 12 𝛽 23 1−𝛽 32 𝛽 23
=
𝑟13−𝑟12𝑟23 𝑆1 1−𝑟223 𝑆3
(92)
di mana 𝛽13 gradien dalam regresi X2 atas X3, dan 𝑆1 , 𝑆2 , 𝑑𝑎𝑛 𝑆3 adalah deviasi standar sampel dari peubah Y, X2, dan X3. Koefisien 𝛽23 disebut koefisien regresi 2 peubah atau sederhana, atau bruto.
Antara Koefisien Regresi Parsial dan Koefisien Korelasi Parsial
𝛽12,3 = 𝑟12,3
𝛽13,2 = 𝑟13,2
di mana
𝑒21,31
1/2
𝑒21,21
1/2
(93)
𝑒22,31
(94)
𝑒23,21
2 𝑒1,31 adalah RSS dalam regresi Y atas X3. 2 𝑒1,31 =
2 𝑦𝑖2 1 − 𝑟13
Antara R2 dan Koefisien Korelasi Sederhan dan Parsial
𝑅2
=
𝑟12 2 + 𝑟13 2 + 𝑟23 2 − 2𝑟12 𝑟13 𝑟23 2 1 − 𝑟23 (95)
𝑅2
= 𝑟12 2 +
2 2 1 − 𝑟12 𝑟13,2 (96)
78
𝑅2
= 𝑟13 2 +
2 2 1 − 𝑟13 𝑟12,3
(97)
di sini bagian variasi dalam Y yang dijelaskan oleh X2 dan X3 secara bersama merupakan jumlah dari 2 bagian : Bagian yang dijelaskan oleh X2 saja 𝑟12 2 dan bagian yang tak dijelaskan X2 = 1 − 𝑟12
oleh
2
𝑘𝑎𝑙𝑖 𝑏𝑎𝑔𝑖𝑎𝑛 𝑦𝑎𝑛𝑔 𝑑𝑖𝑗𝑒𝑙𝑎𝑠𝑘𝑎𝑛 𝑜𝑙𝑒 𝑋3 setelah
menjaga agar pengaruh X2konstan. 2 Now, 𝑅2 > 𝑟12 2 selama 𝑟13,2 > 0. 2 Kasus paling jelek, 𝑟12,3 = 0 , di mana 𝑅2 = 𝑟12 2 .
5.9
Determined Betta Coeficients of Structural Equation By Crammer ( Menentukan Parameter Model 100 Variabel /Peubah)
Let, PRF 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + ⋯ + 𝛽𝑛 𝑋𝑛 + 𝜉
Then, the Normal Equation is : 𝑌 = 𝛽1 + 𝛽2
𝑋2 + 𝛽3
𝑋3 + ⋯ + 𝛽𝑛
𝑋2 𝑌 = 𝛽1
𝑋2 + 𝛽2
𝑋2 2 + 𝛽3
𝑋3 𝑌 = 𝛽1
𝑋3 + 𝛽2
𝑋2 𝑋3 + 𝛽3
𝑋𝑛 𝑌 = 𝛽1
𝑋𝑛 + 𝛽2
𝑋𝑛 𝑋3 + ⋯ + 𝛽𝑛
𝑋𝑛
𝑋2 𝑋3 + ⋯ + 𝛽𝑛
𝑋2 𝑋𝑛
𝑋3 2 + ⋯ + 𝛽𝑛
𝑋3 𝑋𝑛
⋮ 𝑋𝑛 2
In deviation form of mean, the equation become : 𝑥2 𝑦 = 𝛽2
𝑥2 2 + 𝛽3
𝑥2 𝑥3 + ⋯ + 𝛽𝑛
𝑥2 𝑥𝑛
79
𝑥3 2 + ⋯ + 𝛽𝑛
𝑥3 𝑦 = 𝛽2
𝑥2 𝑥3 + 𝛽3
𝑥𝑛 𝑦 = 𝛽2
𝑋𝑛 𝑋3 + ⋯ + 𝛽𝑛
𝑥3 𝑥𝑛
⋮ 𝑋𝑛 2
In matrixs form its write :
𝑥2 𝑦 𝑥3 𝑦 = ⋮ 𝑥𝑛 𝑦
𝑥2 2 𝑥2 𝑥3 ⋮ 𝑥2 𝑥𝑛
𝑥2 𝑥3 𝑥3 2 ⋮ 𝑥3 𝑥𝑛
… … … …
𝑥2 𝑥𝑛 𝑥3 𝑥𝑛 ⋮ 𝑥𝑛 2
𝛽2 𝛽3 ⋮ 𝛽𝑛
Regression coefficient obtain, yie :
𝛽2 =
𝑥2 𝑦 𝑥3 𝑦 ⋮ 𝑥𝑛 𝑦 𝑥2 2 𝑥2 𝑥3 ⋮ 𝑥2 𝑥𝑛
𝑥2 𝑥3 … 𝑥3 2 … … ⋮ 𝑥3 𝑥𝑛 … 𝑥2 𝑥3 … 𝑥3 2 … … ⋮ 𝑥3 𝑥𝑛 …
𝑥2 𝑥𝑛 𝑥3 𝑥𝑛 ⋮ 𝑥𝑛 2 𝑥2 𝑥𝑛 𝑥3 𝑥𝑛 ⋮ 𝑥𝑛 2
𝛽3 =
𝑥2 2 𝑥2 𝑥3 ⋮ 𝑥2 𝑥𝑛 𝑥2 2 𝑥2 𝑥3 ⋮ 𝑥2 𝑥𝑛
𝑥2 𝑦 … 𝑥3 𝑦 … … ⋮ 𝑥𝑛 𝑦 … 𝑥2 𝑥3 … 𝑥3 2 … … ⋮ 𝑥3 𝑥𝑛 …
𝑥2 𝑥𝑛 𝑥3 𝑥𝑛 ⋮ 𝑥𝑛 2 𝑥2 𝑥𝑛 𝑥3 𝑥𝑛 ⋮ 𝑥𝑛 2
⋮
80
𝑥2 2 𝑥2 𝑥3 ⋮ 𝑥2 𝑥𝑛 𝑥2 2 𝑥2 𝑥3 ⋮ 𝑥2 𝑥𝑛
𝛽𝑛 =
𝛽1 =
𝑌−𝛽2
𝑥2 𝑥3 … 𝑥3 2 … … ⋮ 𝑥3 𝑥𝑛 … 𝑥2 𝑥3 … 𝑥3 2 … … ⋮ 𝑥3 𝑥𝑛 …
𝑋2 −𝛽3
𝑥2 𝑦 𝑥3 𝑦 ⋮ 𝑥𝑛 𝑦 𝑥2 𝑥𝑛 𝑥3 𝑥𝑛 ⋮ 𝑥𝑛 2
𝑋3−⋯− 𝛽𝑛
𝑋𝑛
𝑛
(98)
(99)
that which, 𝑥𝑖 2 = 𝑥𝑖 𝑥𝑗 = 𝑥𝑖 𝑦 =
𝑋𝑖 2 −
𝑋𝑖 2
𝑋𝑖
𝑋𝑖 𝑋𝑗 − 𝑋𝑖 𝑌 −
(100)
𝑛 𝑋𝑗 𝑛 𝑋𝑖
𝑌
𝑛
(101) (102)
Soal
1. Berikut data Produk bruto riil, masukan tenag kerja, dan masukan modal riil dalam sektor Produksi Taiwan.
Tahun
Produk bruto riil (jutaan NT $),Y
Masukan tena ga kerja (per 1000 orang), X2
Masukan modal riil (jutaan NT $),X3
81
1958
8911,4
281,5
120,753
1959
10873,2
284,4
122,242
1960
11132,5
289,0
125,263
1961
12086,5
375,8
128,539
1962
12767,5
375,2
131,427
1963
16347,1
402,5
134,267
1964
19542,7
478,0
139,038
1965
21075,9
553,4
146,450
1966
23052,0
616,7
153,714
1967
26128,2
695,7
164,783
1968
29563,7
790,3
176,864
1969
33376,,6
816,0
188,146
1970
38354,3
848,4
205,841
1971
46868,3
873,1
221,748
1972
54308,0
999,2
239,715
(a) Cocokkan model berikut terhadap data tadi : ln 𝑌𝑖 = 𝛽0 + 𝛽12,3 ln 𝑋2𝑖 + 𝛽13,2 ln 𝑋3𝑖 + 𝑢𝑖 𝑌𝑖 = 𝛼0 + 𝛼12,3 𝑋2𝑖 + 𝛼13,2 𝑋3𝑖 + 𝑢𝑖 (b) Model mana yg.lebih baik? (c) Bagaimana membandingkan nilai R2 kedua model tsb. ?(hitunglah) ! (d) Berapa elastisitas hasil terhadap tenaga kerja dan modal untuk model kedua ? (e) Bagaimana hasil sektor produksi (industri) berbeda dari sektor pertain an ?
2. Diketahui kurva PHILIPS 𝑌 = 𝛼0 + 𝛼12,3 𝑋𝑖 + 𝛼13,2 𝑥𝐼2 + 𝑢𝑖 di mana Y = tingkat perubahan upah (dalam) uang dan X = tingkat pengangguran . Y dapat dihitung dengan mengurangkan tingkat hasil tahun sebelum
82
nya dari tingkat hasil tahun ini dan membaginya dengan tingkat hasil tahun lalu.
(a) Ujilah kurva apakah memberikan kecocokan yang baik terhadap data AS dalam Tabel berikut : Tingkat pendapatan rerata per jam dan tingkat pengangguran sektor produksi (industri) total AS 1959-1971 Tahun 1959
Rerata pendapatan per jam, $ 2,19
Tingkat pengang guran, %
1960
2,26
6,2
1961
2,32
7,8
1962
2,39
5,8
1963
2,46
5,7
1964
2,53
5,0
1965
2,61
4,0
1966
2,72
3,2
1967
2,83
3,6
1968
3,01
3,3
1969
3,19
3,3
1970
3,36
5,6
1971
3,56
6,8
6,1
(b) Apa dasar pemikiran untuk memasukkan kuadrat timgkat pengang guran dalam model ? Secara apriori, apakah 𝛼13,2 positif atau nega tif ?
3. Bagaimana anda membuktikan bahwa a0 dalam
83
𝑤𝑖 = 𝑎0 + 𝑎1 𝑣𝑖 + 𝑧𝑖 di halaman 65 adalah nol? 4. Buktikan persamaan (93) dan (94) ! 5. Buktikan persamaan (95) sampai (97) ! 2 2 6. Tunjukkan bahwa 𝑟12,3 = 𝑅2 − 𝑟13 / 1 − 𝑟13 dan interpretasikan persaman tersebut ! 7. Tunjukkan bahwa 𝛽12,3 𝛽23,1 𝛽31,2 = 𝑟12,3 𝑟23,1 𝑟31,2 Secara umumn 𝛽31,2 ≠ 𝛽13,2 tetapi𝑟31,2 = 𝑟13,2 8. Jika hubungan 𝛼1 𝑋1 + 𝛼1 𝑋2 + 𝛼3 𝑋3 = 0 , dapatkan nilai ketiga koefisi en korelasi parsial! 9. Mungkinkah memperoleh hal berikut dari sekumpulan data? (a) 𝑟23 = 0,9. 𝑟13 = −0,2. 𝑟12 = 0,8. (b) 𝑟23 = −0,9. 𝑟31 = −0,5. 𝑟12 = 0,6. (c) 𝑟21 = 0,01. 𝑟13 = 0,66. 𝑟23 = −0,7. 10. Perhatikan fungsi permintaan uang sederhana sbb.: 𝛽
𝛽
𝑀𝑡 = 𝛽0 𝑌𝑡 1 𝑟𝑡 2 𝑒 𝑢 𝑡 di mana 𝑀𝑡 = 𝑗𝑢𝑚𝑙𝑎 𝑎𝑔𝑔𝑟𝑒𝑔𝑎𝑡 𝑠𝑎𝑙𝑑𝑜 𝑘𝑎𝑠 𝑠𝑒𝑏𝑒𝑛𝑎𝑟𝑛𝑦𝑎 𝑟𝑖𝑖𝑙 pa da saat t. 𝑌𝑡 = 𝑗𝑢𝑚𝑙𝑎 𝑝𝑒𝑛𝑑𝑎𝑝𝑎𝑡𝑎𝑛 𝑛𝑎𝑠𝑖𝑜𝑛𝑎𝑙 𝑟𝑖𝑖𝑙 pada saat t, dan 𝑟𝑡 = 𝑡𝑖𝑛𝑔𝑘𝑎𝑡 𝑏𝑢𝑛𝑔𝑎 𝑗𝑎𝑛𝑔𝑘𝑎 𝑝𝑎𝑛𝑗𝑎𝑛𝑔. (a) Dengan data berikut, taksirlah elastisitas jumlah saldo kas riil ter hadap jumlah pendapatan riil dan tingkat bunga jangka panjang. (b) Dari pada mencocokkan fungsi permintaan tadi dipilih 𝛽
mencocok kan model 𝑀/𝑌 𝑡 = 𝛼𝑟𝑡 , bagaiman menginterpretasikan hasil nya ? tunjukkan perhitungan yang diperlukan !
Data mengenai uang, pendapatan nasional, dan deflator harga implisit untuk India, 1948 –1965 Tahun
1948-49
Uang nomi nal (Croses Rupees) 1898,69
Pendapatan Bersih nomi nal (per 100 CR) 86,5
Deflator Harga im plisit 100,00
Tingkat Bunga jk. Panjang (%) 3,01
84
49-50 50-51 51-52 52-53 53-54 54-55 55-56 56-57 57-58 58-59 59-60 60-61 61-62 62-63 63-64 64-65
1880,29 1979,49 1803,79 1764,71 1793,97 1920,63 2216,95 2341,89 2413,16 2526,02 2720,22 2868,61 3045,82 3309,98 3752,12 4880,06
90,1 95,3 99,7 98,2 104,8 96,1 99,8 113,1 113,9 126,9 129,5 141,4 148,0 154,0 172,1 200,1
102,15 107,68 109,56 103,81 104,49 93,48 95,23 102,82 104,59 108,15 109,19 111,19 113,32 115,70 123,19 132,96
3,07 3,15 3,41 3,66 3,64 3,70 3,74 3,99 4,18 4,13 4,05 4,06 4,16 4,49 4,66 4,80
Catatan: untuk merubah jumlah nominal ke dalam jumlah riil, bagilah jumlah nominal dengan deflator harga impilisit ! 11. Jika 𝛼1 𝑋1 + 𝛼1 𝑋2 = 𝑋3 , di mana 𝛼1 𝑑𝑎𝑛 𝛼2 konstanta, tunjukkan bahwa ketiga korelasi parsial secara angka sama dengan 1, 𝑟13,2 memiliki tanda (sama dengan) 𝛼1 , 𝑟23,1 memiliki tanda 𝛼2 , dan 𝑟12,3 memiliki tanda berlawanan dengan 𝛼1 /𝛼2 . 12. Dari data berikut taksirlah koefisien regresi parsial, kesalahan standarnya, dan nilai R2 yang disesuaikan dan tak disesuaikan : 𝑌 = 367,693 𝑋2 = 402,760 2 𝑌𝑖 − 𝑌 = 66042,269 𝑋2𝑖 − 𝑋2
2
𝑋3 = 8,0 = 84855,096
𝑌𝑖 − 𝑌 𝑋2𝑖 − 𝑋2 = 74778,346
𝑋3𝑖 − 𝑋3
2
= 280,000
𝑌𝑖 − 𝑌 𝑋3𝑖 − 𝑋3 = 4250,900
𝑋2𝑖 − 𝑋2 𝑋3𝑖 − 𝑋3 = 4796,000
dan 𝑁 = 15
85
13. Dalam kasus 3-peubah ada 3 koefisien korelasi derajat-0 𝑟12 , 𝑟13 , 𝑟23 dan 3 koefisen derajat-1𝑟12,3 , 𝑟13,2 , 𝑟23,1 . Berapa banyak korelasi derajat-0, dan derajat-1 yang diperoleh dalam kasus 4-peubah? Dalam kasus n-peubah ? 3!
3
3.2
Petunjuk : kasus 3-peubah 2 = 𝐶23 = = = 3. 2! 3−2 ! 2.1
2 14. Buktikan bahwa 𝑟12,3
= 𝛽12,3 𝛽21,3 dan interpretasikan!
Dapatkah hal serupa diperoleh untuk kasus 2-peubah? 15. Tunjukkan bahwa varians dari 𝛽12,3 dapat juga dinyatakan sbg.:
𝑣𝑎𝑟
𝛽12,3 =
𝑑𝑎𝑛 𝛽13,2 pada (65) dan (67)
𝜎2
𝑥22𝑖 1 − 𝑟223
di mana 𝑟23 = 𝑘𝑜𝑒𝑓𝑖𝑠𝑖𝑒𝑛 𝑘𝑜𝑟𝑒𝑙𝑎𝑠𝑖 𝑎𝑛𝑡𝑎𝑟𝑎 𝑋2 𝑑𝑎𝑛 𝑋3 . 2 Petunjuk :𝑟23 =
𝑥2 𝑥3 2 /
2 𝑥2𝑖
2 𝑥3𝑖 .
BAB 6 INFERENSI REGRESI MAJEMUK 6.1
Asumsi Normal
Jika tujuan adalah menaksir dan menarik kesimpulan, maka perlu mengasumsikan bahwa 𝑢𝑖 mengikuti sebuah distribusi probabilitas. Diasumsikan bahwa 𝑢𝑖 mengikuti distribusi normal :
86
𝐸 𝑢𝑖 = 0 → 𝑟𝑒𝑟𝑎𝑡𝑎 𝐸 𝑢𝑖2 = 𝜎 2 → 𝑣𝑎𝑟𝑖𝑎𝑛𝑠 𝑜𝑚𝑜𝑠𝑘𝑒𝑑𝑎𝑠𝑡𝑖𝑘.
Dan penaksir 𝛽12,3 , 𝛽13,2 , 𝑑𝑎𝑛 𝛽1,23 dengan sendirinya didistribusikan secara normal denganrerata :
𝐸 𝛽12,3 = 𝛽12,3 , 𝐸 𝛽13,2 = 𝛽13,2 ,dan 𝐸 𝛽1,23 = 𝛽1,23 sebenar nya dari varians yang disebutkan di depan. Selanjutnya, 𝑁−3
𝜎 2 /𝜎 2
mengikuti distribusi 𝜒 2 𝑑𝑒𝑛𝑔𝑎𝑛 𝑑𝑓 = 𝑁 − 3 disitribusikan secara bebas dari 𝜎 2 .
, dan 3 penaksir OLS
sama seperti kasus 2-peubah, dengan mengganti 𝜎 2 dengan penaksir tak biasnya 𝜎 2 ke kesasalahan standar, maka peubah
𝑡=
𝛽 1,23 −𝛽 1,23
𝑡=
𝛽 12,3 −𝛽 12,3
𝑡=
𝛽 13,2 −𝛽 13,2
𝑠𝑒 𝛽 1,23
𝑠𝑒 𝛽 12,3
𝑠𝑒 𝛽 13,2
(103)
(104)
(105)
masing-masing mengikuti distribusi t dengan 𝑑𝑓 = 𝑁 − 3.
87
Pada saat menghitung 𝑒𝑖2 , dihitung 𝜎 2 yang mula-mula menaksir 3 koefisien regresi parsial dengan meletakkan 3 pembatasan pada jumlah kuadrat residual (RSS) . Karenanya, distribusi t dapat digunakan menetapkan selang keyakinan mau pun sebuah pengujian hipotesis yang bersifat sttistik mengenai koefisien regresi parsial populasi yang sebenarnya. Distribusi 𝜒 2 dapat digunakan untuk menguji hipotesis mengenai 𝜎 2 sebenar nya.
Contoh Illustrasi
Misalnya ingin dipelajari perilaku belanja konsumsipersonil di AS selam beberapa tahun yang lalu. Modelnya , 𝐸 𝑌 𝑋2 , 𝑋3 = 𝛽1,23 + 𝛽12,3 𝑋2𝑖 + 𝛽13,2 𝑋3𝑖
(106)
di mana 𝑌 = 𝑏𝑒𝑙𝑎𝑛𝑗𝑎 𝑘𝑜𝑛𝑠𝑢𝑚𝑠𝑖 𝑝𝑒𝑟𝑠𝑜𝑛𝑖𝑙 𝑃𝐶𝐸 , 𝑋3 = 𝑝𝑒𝑛𝑑𝑎𝑝𝑎𝑡𝑎𝑛 (𝑠𝑒𝑡𝑒𝑙𝑎 𝑝𝑎𝑗𝑎𝑘) yang dibelanjakan personil (PDI) dan 𝑋3 = 𝑤𝑎𝑘𝑡𝑢 𝑑𝑎𝑙𝑎𝑚 𝑡𝑎𝑢𝑛 (𝑝𝑒𝑢𝑏𝑎 trend). Alasan penggunaan data waktu :
i.
ii.
Mungkin hanya untuk mendapatkan bagaimana peubah tak bebas berperilaku sepanjang waktu. Untuk melihat trend nya ke atas atau ke bawah atau taka da trend. Banyak peubah trend hanya sebagi pengganti peubah dasar yang memengaruhi Y. Tapi mungkin peubah dasar ini tak dapat diamati, mungkin karena data tak tersedia atu sulit diperoleh. Contoh teknologi dalam teori produksi, diasumsikan bahwa teknologi adalah fungsi dari waktu. Waktu X 2mungkin dengan secara baik mewakili populasi, PCE keseluhan meningkat seiring dengan peningkatan populasi, mungkin populasi mempunyai hubungan liniir sangat baik dengan waktu.
88
Tabel Belanja konsumsi personil dan pendapatan yang dapat dibelanjakan personil di AS 1958-1970 dalam milyar dolar PCE,Y
PDI,X2
Waktu,X3
281,3
309,3
1956=1
288,1
316,1
1957=2
290,0
318,8
1958-3
307,3
333,0
1959=4
316,1
340,3
1960=5
322,5
350,5
1961=6
338,4
367,2
1962=7
353,3
381,2
1963=8
375,7
408,1
1964=9
397,7
434,8
1965=10
418,1
458,9
1966=11
430,1
477,5
1967=12
452,7
499,0
1968=13
469,1
513,5
1969=14
476,9
533,2
1970=15
Dari Tabel model diuji. Garis regresi yang ditaksir adalah sbb.:
𝑌𝑖 = 53,1603 + 0,7266𝑋2𝑖 + 2,7363𝑋3𝑖 13,0261 0,0487
0,8486
𝑡 = 4,0811 14,9060 3,3246 𝑑𝑓 = 12
𝑅2 = 0,9988
𝑅2 = 0,9986
89
Jika𝑋2 𝑑𝑎𝑛 𝑋3 = 0, maka nilai rerata personilmendekati 53,16 Milyar dollar tahun 1958.
belanja
konsumsi
Koefisien regresi parsial 0,7266 berarti, dengan menjaga agar senua agar semua peubah lain konstan , denga meningkatnya pendapat personil, misalnya , dengan 1$, ,maka rerata belanja konsumsi meningkat kira-kira 73 sen.. Nilai 𝑅2 = 0,9988 menunjukkan bahwa kedua peubah yang menjelasakan menerangkan sekitar 99,9% variasi dalam belanja konsumsi personil di AS selama periode 1956 –1970. Setelah menghitung derajat kebebasan , diperoleh R2 yang disesuaikan menun jukkan, 𝑋2 𝑑𝑎𝑛 𝑋3 masih menjelaskan 99,8% dari variasi dalam Y.
6.2
Uji Hipotesis
Seperti disebut tadi 𝑢𝑖 ~𝑁 0, 𝜎 2 , maka dapatlah uji t digunakan me nguji hipotesiskoefisien regresi parsialindividual(tidak bersama-sama). Didalilkan sbb.: 𝐻0 : 𝛽12,3 = 0
dan
𝐻1 : 𝛽12,3 ≠ 0
Hipoteisi nol menyatakan bahwa, dengan menjaga X3 konstan, pendapatan yang dapat dibelanjakan personil tidak mempunyai pengaruh (liniir) atas belanja konsumsi personil. Untuk menguji hipotesis nol, digunakan ujit seperti persamaan (104). Jika nilai t hitung > nilai t kritis pada tingkat penting (signifikan) yang dipilih, maka hipotesis nol ditolak. Diperoleh,
𝑡=
0,7266 −0 0,0487
= 14,9060
Asumsikan 𝛼 = 0,05, 𝑡𝛼/2 = 2,179 𝑢𝑛𝑡𝑢𝑘 𝑑𝑓 = 12.
90
Catatan : digunakan uji dua ujung (two-tails), karena nilai t yang dihitung 14,906 jauh melebihi nilai kritis𝑡 = 2,170, maka tolak H0 dan mengatakan bahwa 𝛽12,3 penting secara statistik, yaitu penting (signifikan) berbeda dari nol. Dengan grafik :
Kepadatan
f(t)
t = 14,91 ter letak di dalam daerah kritis 2,5 %
Daerah kritis 2,5 % 95 % Daerah penerimaan
t –2,170
+2,170
Selang Keyakinan 95 % untuk t (12 df)
Selang Keyakinan
Ada hubungan yang erat antara pengujian hipotesis dan penaksiran selang keyakinan. Selang keyakinan 95% untuk 𝛽12,3 , adalah
91
𝛽12,3 − 𝑡𝛼/2 𝑠𝑒 𝛽12,3 ≤ 𝛽12,3 ≤ 𝛽12,3 − 𝑡𝛼/2 𝑠𝑒 𝛽12,3
(107)
Diperoleh. 0,7266 − 2,179 0,0487 ≤ 𝛽12,3 ≤ 0,7266 + 2,179 0,0487 yi.
0,6205 ≤ 𝛽12,3 ≤ 0,8327
jadi, 𝛽12,3 terletak antara 0,6205 𝑑𝑎𝑛 0,8327 dwengan koefisien keyakinan 95%. Jika 100 sampel berukuran 15 dipilih dan 100 selang keyakinan seperti 𝛽12,3 ± 𝑡𝛼 /2 𝑠𝑒 𝛽12,3 disusun, diharapkan 95% dari selang keyakinan tadi untuk berisi parameter populasi sebenarnya yaitu 𝛽12,3 . Karena nilai yang dihipotesiskan nol, di mana nol tidak terrletak dalam selang, maka hipotesis nol , 𝛽12,3 = 0 ditolak dengan koefisien keyakinan 95%. Apakah Anda memilih Uji t atau selang keyakinan, simpulannya sama saja.
6.3 Uji Arti Keseluruhan Regresi Sampel
Perhatikan hipotesis
𝐻0 : 𝛽12,3 = 𝛽13,2 = 0
(108)
Hipotesis nol ini adalah sebuah hipotesis gabungan bahwa 𝛽12,3 𝑑𝑎𝑛 𝛽13,2 secara gabungan (simultan) sama dengan nol. Disebut uji arti keseluruhan (overall significance) dari garis regresi yang diamati atau ditaksir, yaitu, Apakah Y berhubungan secara liniir dengan X 2 dan X3 kedua-duanya.
92
Uji parsial (individu) diasumsikan secara implisit menggunakan sampel berbe da.
Pendekatan Analisis Varians untuk Uji Arti Keseluruhan
Analisis Varians (ANOVA), perhatikan identitasnya :
𝑦𝑖2 = 𝛽12,3
𝑦𝑖 𝑥2𝑖 + 𝛽13,2
𝑇𝑆𝑆 =
𝑦𝑖 𝑥3𝑖 +
𝐸𝑆𝑆
𝑒𝑖2
(109)
+ 𝑅𝑆𝑆
TSS mempunyai 𝑑𝑓 = 𝑁 − 1 dan RSS mempunyai 𝑑𝑓 = 𝑁 − 3, ESS mempunyai derajat kebebasan 2 karena merupakan fungsi dari 𝛽12,3 dan 𝛽13,2 . Tabelnya :
Tabel ANOVA 3-Peubah Sumber variasi
SS
Akibat regresi (ESS)
𝛽12,3
Akibat Residual (RSS)
Df 𝑦𝑖 𝑥2𝑖 + 𝛽13,2
𝑦𝑖 𝑥3𝑖
𝛽12,3
𝑦𝑖 𝑥2𝑖 + 𝛽13,2
𝑦𝑖 𝑥3𝑖
2 N –3
𝑒𝑖2
_________________________
Total
2
MSS
𝜎2 =
2
𝑒𝑖
𝑁−3
____ N –1
𝑦𝑖2
Now, 𝑢𝑖 berdistribusinormal dan hipotesis nol 𝛽12,3 = 𝛽13,2 = 0 , maka peubah 𝐹
=
𝛽12,3 𝑦𝑖𝑥2𝑖 +𝛽13,2 𝑦𝑖𝑥3𝑖 /2 𝑒2𝑖 /𝑁−3
(110)
93
didistribusikan sebagai distribusi F dengan derajat kebebasan 2 dan N –3. Dengan asumsi 𝑢𝑖 ~𝑁 0, 𝜎 2 ,dapat dibuktikan
𝐸
𝑒2𝑖 = 𝐸 𝜎 2 = 𝜎2 𝑁−3
(111)
Dengan tambahan asumsi bahwa 𝛽12,3 = 𝛽13,2 = 0 dapat ditunjukkan bahwa
𝐸
𝛽12,3 𝑦𝑖𝑥2𝑖 +𝛽13,2 𝑦𝑖𝑥3𝑖 2
= 𝜎2
(112)
Baik persamaan (111) dan (112) memberikan taksiran yang identic dari 𝜎 2 yang sebenarnya. Jika nilai F yang dihitung > nilaiF kritis dari Tabel F pada tingkat arti %, maka tolak H0 .
Contoh
Sumber variasi
SS
Akibat regresi Akibat residual
df
MSS
65.965,1003
2
32.982,5502
77,1690
12
6,4308
Diperoleh, 𝐹
= 32.982,5502 = 5128,8781 6,4308
Menggunakan tingkat signifikan 5%, nilai F kritis untuk df = 12,
94
𝐹0,05 2,12 = 3,89, jadi H0 ditolak.
6.4 Hubungan Penting antara R2 dan F
Telah diketahui 𝐸𝑆𝑆/2 𝑁−3
𝐹 = 𝑅𝑆𝑆/
(113)
didistribusikan sesuai dengan distribusi F dengan tingkat kebebasan 2 dan N –3. Dlam kasus k –peubah
𝐻0 : 𝛽12,34,…
,𝑘
= 𝛽13,24,…
,𝑘
= ⋯ = 𝛽1𝑘,23,…
,𝑘−1
= 0 (114)
akibatnya 𝐸𝑆𝑆/ 𝑘−1 𝑁−𝑘
𝐹 = 𝑅𝑆𝑆/
(115)
mengikuti distribusi F dangan tingkat kebebasan k –1 dan N –k.
𝐹=
𝑁−𝑘 𝐸𝑆𝑆 𝑘−1 𝑅𝑆𝑆 𝑁−𝑘 𝐸𝑆𝑆
= 𝑘−1 𝑇𝑆𝑆−𝐸𝑆𝑆 =
𝑁−𝑘 𝐸𝑆𝑆/𝑇𝑆𝑆 𝑘−1 1− 𝐸𝑆𝑆/𝑇𝑆𝑆 𝑁−𝑘 𝑅 2 1− 𝑅 2
= 𝑘−1
95
=
𝑅 2 / 𝑘−1 1− 𝑅 2 / 𝑁−𝑘
(116)
di mana digunakan definisi 𝑅2 = 𝐸𝑆𝑆/𝑇𝑆𝑆 . persamann (116) menunjjukkan hubungan F dan 𝑅2 . Pada saat 𝑅 2
= 0 → 𝐹 = 0 ; 𝑅 2 = 1 → 𝐹 =∽
Menguji hipotesis (114) ekivalen dengan menguji 𝐻0 : 𝑅2 = 0 (populasi). Untuk kasus 3-peubah : 𝐹=
𝑅2 /2 1− 𝑅2 / 𝑁−3
(117)
Tabel ANOVA dalam R2
Sumber variasi
SS
Akibat regresi Akibat residual
𝑅2
𝑦𝑖2
1 − 𝑅2
𝑦𝑖2
_______________
Total
𝑦𝑖2
df
MSS
2
𝑅2
N –3
𝑦𝑖2
2 1 − 𝑅2 𝑦𝑖2 𝑁−3
_____ N –1
Soal
1. Lihat soal no.1 BAB 5 (a)
Apakah 𝛽12,3 dan 𝛽13,2 secara individual penting secara statistik ?
96
(b) Apakah keduanya secara atatistik berbeda dari 1? (c) Apakah 𝛼12,3 𝑑𝑎𝑛 𝛼13,2 secara individual penting secara statis tik? (d) Apakah data mendukung hipotesis bahwa 𝛽12,3 = 𝛽13,2 = 0 (e) Ujilah hipotesis bahwa 𝛼12,3 = 𝛼13,2 = 0 (f) Bagaimana Anda menghitung elastisitas output dari tenaga kerja dan model untuk model pertama? Bagaimana pula untuk model kedua? (g) Model mana yang lebih Anda sukai? (h) Bandingkan R2 dari kedua model ! Gunakan tingkat 5%
2.
Untuk soal no.2 (a) Ujilah signifikan keseluruhan dari regresi yang ditaksir ? (b) Berapakah kontribusi tambahan dari 𝑋𝑖2 ? (c) Apakah Anda akan tetap memasukkan 𝑋𝑖2 dalam model atas dasar pengujian F ? Bagaimanapula atas dasar R2 .
3. Dengan mengasumsikan bahwa Y dan 𝑋2 , 𝑋3 , … , 𝑋𝑘 didistribusikan secara normal gabungan dan hipotesis nol bahwa korelasi parsial un tuk populasi secara individual sama dengan nol. R.A.FISHER telah menunjukkan bahwa
𝑡=
𝑟 12,34, … ,𝑘 𝑁−𝑘−2 2 1−𝑟12,34 , … ,𝑘
mengikuti distribusi t dengan derajat kebebasan 𝑁 − 𝑘 − 2 di mana k adalah koefisien korelasi parsial derajat ke-k dan di mana N adalah jumlah totalobservasi. (Catatan :𝑟12,3 adalah koefisien korelasi parsi al derajat-1, 𝑟12,34 adalah koefisien korelasi parsial kedua, dst.) Lihat soal no.12. Dengan asumsi Y dan X2 dan X3 didistribusikan se cara normal gabungan, hitunglah ketiga korelasi parsial 𝑟12,3 , 𝑟13,2 dan 𝑟23,1 dan ujilah arti pentingnya dengan hipotesis bahwa korelasi populasi yang berhubungan secara individual sama dengan nol.
97
4. Dalam mempelajari permintaan untuk traktor pertanian di AS untuk periode 1921-1941 dan 1948-1957, GRILICHHES mendapatkan ha sil sbb.: log 𝑌𝑡 = 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 − 0.519 log 𝑋2𝑖 − 4,933 log 𝑋3𝑖
𝑅2 = 0,793.
0,231 0,477
di mana 𝑌𝑡 = 𝑛𝑖𝑙𝑎𝑖 𝑠𝑡𝑜𝑘 𝑡𝑟𝑎𝑘𝑡𝑜𝑟 𝑝𝑒𝑟𝑡𝑎𝑛𝑖𝑎𝑛 pada 1 Januari, dalam 1925-1939, 𝑋2 = 𝑖𝑛𝑑𝑒𝑘𝑠 𝑎𝑟𝑔𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑏𝑎𝑦𝑎𝑟 untuk traktor dibagi dengan indeks harga yang diterima untuk semua hasil panen pada waktu t –1 , 𝑋3 = 𝑡𝑖𝑛𝑔𝑘𝑎𝑡 𝑏𝑢𝑛𝑔𝑎 𝑦𝑎𝑛𝑔 𝑏𝑒𝑟𝑙𝑎𝑘𝑢 pada tahun t –1, dan dimana standar yang ditaksir diberikan dalam tanda kurung. (a) Interpretasikan regresi tadi (b) Apakah koefisien kemiringan yang ditaksir secara individual penting secara statistik? Apakah koefisien tadi berbeda secara penting dari 1 ? (c) Gunakan teknik ANOVA untuk menguji pentingnya regresi secara kese luruhan. Petunjuk :gunakan varians R2 dari ANOVA. (d) Bagaimana menghitung elastisitas tingkat bunga dari permintaan untuk traktor pertanian? (e) Bagaimana menguji pentingnya atau signifikan R2 yang ditaksir ?
BAB 7 PENYIMPANGAN ASUMSI MODEL KLASIK Asumsi Model Klasik
Asumsi 1 Nilai rerata bersyarat dari unsur ganguan populasi ui,tergantung ke pada nilai tertentu peubah yang menjelaskan (X) adalah nol.
Asumsi 2 Varians bersyarat dari ui adalah konstan atau homoskedastik. Asumsi 3 Tidak adaautokorelasi dalam gangguan.
98
Asumsi 4 Peubah yang menjelaskan adalah nonstokastik (yaitu, tetap dalam penyampelan berulang) atau, jika stokastik, didistribusikan secara independen dari gangguan ui.
Asumsi 5 Tidak ada multikoliniritas di antara peubah yang menjelaskan X.
Asumsi 6 u didistribusikan secara normal dengan rerata dan varians yang di berikan oleh Asumsi 1 dan 2.
Dengan Asumsi-asumsi, penaksir OLS adalah penaksir tak bias li niir terbaik (BLUE) dan dengan asumsi kenormalan, didistribusikan secara normal. Sehingga diperoleh penaksir selang untuk menguji hipotesis mengenai koefisien regresi popolasi sebenarnya.. Penyimpangan asumsi hanya memengaruhi intersep regresi.
7.1 Multikoliniritas Sifat Dasar
Istilah multikoliniritas mula-mula ditemukan RAGNAR FRISCH (1934). Artinya adanya hubungan liniir yang “sempurna” atau pasti, di antara bebe rapa atau semua peubah yang menjelaskan dari model regresi.. Sebuah hubungan liniir yang past dikatakan jika kondisi berikut dipenuhi :
𝜆1 𝑋1 + 𝜆2 𝑋2 + ⋯ + 𝜆𝑘 𝑋𝑘 = 0
(118)
di mana 𝜆1 , 𝜆2 , … , 𝜆𝑘 adalah konstanta sedemikian sehingga tidak semuanya secara simultan sama dengan nol.
99
Hubunga koliniritas dapat juga dituliskan :
𝜆1 𝑋1 + 𝜆2 𝑋2 + ⋯ + 𝜆𝑘 𝑋𝑘 + 𝑣𝑖 = 0
(119)
di mana 𝑣𝑖 adalah unsur kesalahan stokhastik. Untuk melihat perbedaaan, antara multikolinir sempurna dan kurang sempur na, misalnya, 𝜆2 ≠ 0. Maka
𝑋2𝑖 = −
𝜆1 𝜆2
𝑋1𝑖 −
𝜆3 𝜆2
𝑋3𝑖 − ⋯ −
𝜆𝑘 𝜆2
𝑋𝑘𝑖
(120)
Koefisien antara peubah X2 dan kombinasi liniir di sisi kanan sama dengan satu (korelasi sempurna). Atau dapat ditulis menjadi 𝑋2𝑖 = −
𝜆1 𝜆2
𝑋1𝑖 −
𝜆3 𝜆2
𝑋3𝑖 − ⋯ −
𝜆𝑘 𝜆2
𝑋𝑘𝑖 +
1 𝜆2
𝑣𝑖
(121)
yang menunjukkan bahwa X2 bukan kombinasi liniir yang pasti dari X lainnya, karena juga ditentukan oleh unsur lain, kesalahan stokhastik 𝑣𝑖 (tidak sempur na).
Contoh, perhatikan data hipotesis berikut
X2
X3
X3*
10
50
52
15
75
75
18
90
97
24
120
129
30
150
152
100
Jelas bahwa 𝑋2𝑖 = 5𝑋𝑖 → 𝑘𝑜𝑙𝑖𝑛𝑖𝑟𝑖𝑡𝑎𝑠 𝑠𝑒𝑚𝑝𝑢𝑟𝑛𝑎 → 𝑟23 = 1.
𝑋3∗ = 5𝑋𝑖 + 𝑏𝑖𝑙𝑎𝑛𝑔𝑎𝑛 𝑟𝑎𝑛𝑑𝑜𝑚 → 𝑘𝑜𝑙𝑖𝑛𝑖𝑟𝑖𝑡𝑎𝑠 𝑡𝑎𝑘 𝑠𝑒𝑚𝑝𝑢𝑟𝑛𝑎 → 𝑟23 = 0,9959. Bilangan random di sini 2,0,7,9,2 . Multikoliniritas tidak hanya berhubungan liniir, ada juga non liniir:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋12 + 𝛽3 𝑋13 + 𝑢𝑖
(122)
Model regresi liniir klasik berasumsi tidak ada multikoliniritasan tara peubah X. Karena, jika multikoliniritas sempurna, maka koefisien regresi tak tertentu dan kesalahannya tak terhingga. Jika multikoliniritas tak sempurna, maka memiliki kesalahan standar besar (melebihi koefisien regresi), dengan demikian kofisien tak dapat ditaksir de ngan tepat. Secara teori, sangat gampang memisahkan peubah, tetapi dalam prak tek (sampel) susah dipisahkan. Contoh, antara data pendapatan dan kekayaan susah dipisahkan. Orang kaya tentu banyak tanahnya (kekayaan), tapi orang yang banyak tanah nya pasti banyak pendapatannya. Tetapi orang miskin, gampang memisahkan antara pendapatannya dengan ke kayaannya. Orang miskin sudah jelas tak punya asset, tapi mungkin dia punya pendapatan dari kuli kasar. Artinya bagi orang kaya, sulit meentukan, yang mana asset, dan yang mana pendapatan (koliniritas sempurna).
7.1.1Penaksiran Mengandung Multikoliniritas Sempurna
101
Dalam hal multikoliniritas sempurna, koefisien regresi tetap tak tertentu dan kesalahan standarnya tak terbatas.
𝑦𝑖 = 𝛽12,3 𝑥2𝑖 + 𝛽13,2 𝑥3𝑖 + 𝑒𝑖
(123)
diperoleh
𝛽12,3 =
𝑦 𝑖 𝑥 2𝑖
𝛽13,2 =
𝑦 𝑖 𝑥 3𝑖
2 𝑥 2𝑖
2 𝑥 2𝑖
2 𝑥 3𝑖 −
2 𝑥 3𝑖
𝑦 𝑖 𝑥 3𝑖 −
2 𝑥 2𝑖 −
2 𝑥 3𝑖
𝑥 2𝑖 𝑥 3𝑖 2
𝑦 𝑖 𝑥 2𝑖 −
𝑥 2𝑖 𝑥 3𝑖
𝑥 2𝑖 𝑥 3𝑖
𝑥 2𝑖 𝑥 3𝑖 2
(63)
(64)
Asumsikan bahwa 𝑋3𝑖 = 𝜆𝑋2𝑖 , di mana 𝜆 ≠ 0. Substitusi ke (63) diperoleh : 𝛽12,3
= 00 → 𝑡𝑎𝑘 𝑡𝑒𝑛𝑡𝑢 (124)
Jika X2 dan X3 koliniir secara sempurna, maka taka da cara untuk membuat X3 tetap konstan. Untuk varians diperoleh :
𝑣𝑎𝑟
𝛽12,3 =
𝑣𝑎𝑟
𝛽13,2 =
𝑥23𝑖 𝑥22𝑖
𝑥23𝑖
𝑥22𝑖
𝑥23𝑖
−
𝑥2𝑖 𝑥3𝑖
𝑥22𝑖 −
𝑥2𝑖 𝑥3𝑖
2𝜎
2
2𝜎
2
(65)
(67)
102
Substitusi 𝑋3𝑖 = 𝜆𝑋2𝑖 ke persamaan (65) diperoleh
𝑣𝑎𝑟 𝛽12,3 =
𝜎2 0
=∽→ 𝑡𝑎𝑘 𝑡𝑒𝑟𝑑𝑒𝑓𝑖𝑛𝑖𝑠𝑖
(125)
7.1.2Multikoliniritas Tinggi Tak Sempurna Kembali ke persamaan (123) dan 𝑥3𝑖 = 𝜆𝑥2𝑖 + 𝑣𝑖
(126)
Substitusi (126) ke (63) diperoleh
𝑦𝑖 𝑥2𝑖
𝛽12,3 =
di sini,
𝑥22𝑖 + 𝑣2𝑖 − 𝑥22𝑖
𝑦𝑖 𝑥2𝑖 + 𝑦𝑖 𝑣𝑖
𝑥22𝑖 + 𝑣2𝑖 −
𝑥22𝑖
𝑥22𝑖
2
(127)
𝑥2𝑖 𝑣𝑖 = 0 .
Now, taka da alasan apriori bahwa (127) tak dapat ditaksir. Dengan meningkatnya 𝑟23 , maka varians dengan cepat meningkat. Perhatikan, untuk 𝑟23 → 1 , kovarians antara 𝛽12,3 dan 𝛽13,2 cende rung menuju tak terhingga dan karenanya menjadi sulit untuk memisahkan pe ngaruh X2 dan X3 satu sama lain, sbb.:
𝑐𝑜𝑣 𝛽12,3 , 𝛽13,2 =
−𝜎 2 𝑟23 2 1−𝑟23
𝑥22𝑖 𝑥23𝑖
(128)
7.1.3Konsekuensi Multikoliritas Sifat-sifat Penaksir OLS
103
Jika asumsi model regresi liniir klasik dipenuhi, maka penaksirnya BLUE. Ketidakbiasan adalah sifat multi sampel atau penyampelan berulang. Dengan menjaga nilai peubah X tetap, diambil sampel berulang, maka nilai rerata sampel akan menuju ke nilai populasi yang sebenarnya dari penaksir, dengan meningkatnya jumlah sampel. Jadi benar bahwa koliniritas tak merusak sifat varians minimum (efisi en) (BLUE). Multikoliniritas pada dasarnya phenomena sampel. Artinya penaksir OLS adalah BLUE meskipun terdapat multikoliniritas.
Multikoliniritas Praktis
Jika koliniritas tajam tapi tak sempurna, konsekuensinya :
1. Meskipun penaksir OLS mungkin bisa diperoleh, kesalahan standarnya cenderung semakin besar dengan meningkatnya tingkat korelasi antara peningkatan peubah. Seperti disebut dalam 7.1.2, dan berlaku untuk k-peubah. 2. Karena besarnya kesalahan standar, maka selangkeyakinan untuk para meter populasi yang relevan cenderung untuk lebih besar. Jadi dalam kasus 3-peubah, jika 𝑟23 = 0, dan diasumsikan 𝜎 2 Diketahui, selang keyakinan 95% untuk 𝛽12,3 sbg.:
𝑃 𝛽12,3 − 1,96
𝜎2
𝑥22𝑖
≤ 𝛽12,3 ≤ 𝛽12,3 + 1,96
𝜎2
𝑥22𝑖
= 0,95(129)
Tapi jika koliniritas parah,𝑟23 = 0,9, maka selang 95% adalah
104
𝑃 𝛽12,3 − 1,96
5,26
𝜎2
𝑥22𝑖
≤ 𝛽12,3 ≤ 𝛽12,3 + 1,96 5,26
𝜎2
𝑥22𝑖
= 0,95
(130) Jadi selang keyakinan yang terakhir lebih besar dari yang pertama de ngan perkalian 5,26 = 2,29 , lebih besar dua kali. 3. Atas dasar 2, dalam kasus multikoliniritas tinggi, data sampel mungkin sesuai dengan sekelompok hipotesis yang berbedabeda. Jadi probabilitas untuk menerima hipotesis yang salah (yaitu kesalahan tipe II) meningkat. 4. Jika multikoliniritas tinggi, mungkin memperoleh R2 yang tinggi tapi tak satupun koefisien yang ditaksir yang penting secara statis tik.
Contoh Misalkan diasumsikan bahwa belanja konsumsi berhubungan liniir dengan pendapatan dan kekayaan, maka didasarkan Tabel berikut diperoleh :
𝑌𝑖 = 24,7747 + 0,9415𝑋2𝑖 − 0,0424𝑋3𝑖 6,7525
0,8229
𝑡 = 3,6690
0,0807 1,1442
𝑅 2 = 0,9635
−0,5261
𝑅 2 = 0,9531
𝑑𝑓 = 7
Data hipotesis belanja konsumsi Y, pendapatan X2, dan kekayaan X3
Y,$
X2,$
X3, $
70
80
810
65
100
1009
105
90
120
1273
95
140
1425
110
160
1633
115
180
1876
120
200
2052
140
220
2201
155
240
2435
150
260
2686
Hasil regresi menunjukkan bahwa pendapatan dan kekayaan secara bersama-sama menjelaskan sekitar 95% dari variasi dalam belanja konsumsi dan ternyata tak satupou koefisien kemiringansecara individual penting secara statistik. Juga mempunyai tanda yang salah. Secara apriori diharapkan hubungan positif antara konsumsi dan kekayaan. Meskipun 𝛽2 𝑑𝑎𝑛 𝛽3 𝑠𝑒𝑐𝑎𝑟𝑎 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢 tak penting secara statistik. Jika diuji hipotesis bahwa 𝛽2 𝑑𝑎𝑛 𝛽3 = 0secara simultan, hipotesis ini dapat
ditto lak, perhatukan Tabel ANOVA , diperoleh :
Tabel Konsumsi pemderitaan kekayaan Sumber variasi
SS
df
MSS
Akibat regresi
8565,5541
2
4282,7770
Akibat Residual
324,4459
7
46,3494
𝐹
= 4282,7770 = 92,4019 46,3494
sangat penting secara statistik. Kedua peubah berkorelasi sangat tinggi sehingga pengaruh invidual tak dapat diisolasi.
106
7.1.4Deteksi Multikoliniritas Metode deteksi
:
1. Koliniritas sering diduga saat 𝑅2 tinggi (antara 0,7 dan 1). Juga saat korelasi derajat nol juga tinggi, tapi sangat sedikit koef isien regresi parsial secara individual pentingatas dasar pengujian t yang konvensional. Jika 𝑅2 tinggi, berarti uji F dalam sebagian kasus akan menolak hipotesis nolkoefisien kemiringan parsial secara simultan sebenarnya ada lah nol, meskipun uji-t sebaliknya. 2. Meski korelasi derajat nol tinggi mungkin mengusulkan koliniritas tidak perlu tinggi berarti mempunyai koliniritas dalam satu kasus spesifik. Sebab ini dapat terjadi meskipun korelasi sederhana relatif rendah (< 0,5). Missal model 4-peubah : 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝛽4 𝑋4𝑖 + 𝑢𝑖 dan misalnya 𝑋4𝑖 = 𝜆2 𝑋2𝑖 + 𝜆3 𝑋3𝑖 di mana 𝜆2 𝑑𝑎𝑛 𝜆3 konstan, ≠ 0. 2 Jelas kombinasi liniir menghasilkan 𝑅4,23 = 1.
Now, dengan rumus (95)
𝑅2 = 2 𝑅4,23
= 𝑟42
𝑟12 2 +𝑟13 2 +𝑟23 2 −2𝑟12 𝑟13 𝑟23 2 1−𝑟23
2 +𝑟
2 43 −2𝑟42𝑟43𝑟23 1−𝑟223
=1
(131)
diperoleh 𝑟42 = 0,5 , 𝑟43 = 0,5 , 𝑟23 = −0,5 → 𝑠𝑎𝑛𝑔𝑎𝑡 𝑡𝑖𝑛𝑔𝑔𝑖. 3. Seharusnya tidak hanya melihat pada korelasi derajat-nol, harus juga korelasi parsial. 2 2 2 2 Jika 𝑅1,234 sangat tinggi, tetapi 𝑟12,34 , 𝑟13,24 𝑑𝑎𝑛 𝑟14,23 relatif rendah ,ini menyarankan peubah X2, X3, dan X4 berinterkorelasi dengan
107
tingkat yang tinggi sekurang-kurangnya satu dari peubah ini berle bihan. 4. Untuk mengetahui peubah mana yang berhubungan dengan peubah lainnya dengan meregresi tiap Xi terhadap peubah X sisanya dan menghitung R2 yang cocok. Mengikuti hubungan F dan R2 persamaan (116) 𝐹=
𝑅2 / 𝑘−1 1− 𝑅2 / 𝑁−𝑘
,
𝑚𝑎𝑘𝑎
𝐹𝐼 =
𝑅2𝑥1,𝑥2 , … ,𝑥𝑘 / 𝑘−2 1− 𝑅2𝑥1,𝑥2, … ,𝑥𝑘 / 𝑁−𝑘+1
(132)
mengikuti distribusi F.
7.1.5Perbaikan
Petunjuk :
1. Informasi apriori. Misalnya model 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑢𝑖 𝑑𝑖 𝑚𝑎𝑛𝑎𝑌𝑖 = 𝑘𝑜𝑛𝑠𝑢𝑚𝑠𝑖, 𝑋2 = 𝑝𝑒𝑛𝑑𝑎𝑝𝑎𝑡𝑎𝑛, 𝑋3 = 𝑘𝑒𝑘𝑎𝑦𝑎𝑎𝑛. Kekayaan dan pendapatan cenderung koliniir. Misalnya secara apriori𝛽3 = 0,10𝛽2 ; yaitu tingkat perubahan kon sumsi sebagai akibat perubahan kekayaan. Jadi 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 0,10𝛽2 𝑋2𝑖 + 𝑢𝑖 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖 di mana 𝑋𝑖 = 𝑋2𝑖 + 0,10𝑋2𝑖 . Setelah 𝛽2 diperoleh , maka 𝛽3 demikian juga.
108
Informasi apriori dapat diperoleh dari teori ekonomi, atau dari pene litian empiris sebelumnya di mana masalah koliniritas kurang serius. 2. Menghubungkan data cross-sectiononal dan time series. Sebuah varians yang tidak ada hubungannya atau informasi apriori yang disarankan sebelumnya adalah kombinasi dari cross-sectional dan data times series (urutan waktu), dikenal sebagai penggabungan data (pooling the data). Misal ingin dipelajari permintaan mobil di AS dan mengasumsikan ada data deretan-waktu mengenai banyaknya mobil yang dijual, rerata harga mobil, dan pendapatan konsumen. Misalkan juga bahwa ln 𝑌𝑖 = 𝛽1 + 𝛽2 ln 𝑃𝑖 + 𝛽3 ln 𝐼𝑖 + 𝑢𝑖 di mana 𝑌𝑖 = 𝑏𝑎𝑛𝑦𝑎𝑘 𝑚𝑜𝑏𝑖𝑙 𝑑𝑖𝑗𝑢𝑎𝑙, 𝑃 = 𝑎𝑟𝑔𝑎 𝑟𝑒𝑟𝑎𝑡𝑎, 𝐼 = 𝑝𝑒𝑛𝑑𝑎𝑝𝑎𝑡𝑎𝑛, dan 𝑡 = 𝑤𝑎𝑘𝑡𝑢. Tujuan adalah menaksir elastisitas harga 𝛽2 dan elastisitas pendapatan 𝛽3 . Data deretan-waktu peubah harga dan pendapatan biasanya cenderung untuk sangat berkoliniir. Menurut TOBIN jika ada data cross-section ( yang dihasilkan oleh panel konsu men dan atau penelitian anggaran yang dilakukan berbagai lembaga swasta atau pemerintahan), akan dapat diperoleh taksiran yang dapat dipercaya dari elastisitas permintaan𝛽3 , karena data seperti itu, pada satu titik waktu, harga tidak banyak berubah. Dengan menggunakan taksiran, maka persamaan menjadi
𝑌𝑡∗ = 𝛽1 + 𝛽2 ln 𝑃𝑖 + 𝑢𝑖 di mana 𝑌 ∗ = ln 𝑌 − 𝛽3 ln 𝐼𝑖 dengan demikian elastisitas harga 𝛽2 diperoleh.
109
Ini digunakan jika taksiran cross-section tidak berbeda dari satu cross-section ke cross-section lainnya. 3. Mengeluarkan sebuah peubah atau peubah-peubah dan bias spesifi kasi. Ini digunakan, jika mengalami multikoliniir yang parah, cara “paling sederhana” dengan mengeluarkan sebuah peubah yang berkoliniir. Tapi saat mengeluarkan, mungkin terjadi bias spesifikasi, atau kesa lahan spesifikasi. Bias spesifikasi adalah penggunaan model yang tak benar. Jika Teori Ekonomi, menyatakan bahwa peubah pendapatan, dan kekayaan harus dimasukkan dalam model belanja konsumsi, maka mengeluarkan peubah kekayaan tanah yang luas akan menimbulkan bias spesifikasi. Contoh , model yang dispesifikasi secara benar 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑢𝑖 dispesifikasikan salah menjadi 𝑌𝑖 = 𝛼1 + 𝛼2 𝑋2𝑖 + 𝑣𝑖 Diketahui 𝛼2 =
𝑦 𝑖 𝑥 2𝑖 2 𝑥 2𝑖
dan
𝛽2 =
𝑦 𝑖 𝑥 2𝑖
2 𝑥 2𝑖
2 𝑥 3𝑖 −
𝑦 𝑖 𝑥 3𝑖
2 − 𝑥 3𝑖
𝑥 2𝑖 𝑥 3𝑖 𝑥 2𝑖 𝑥 3𝑖 2
(132a)
Dengan demikian 𝐸 𝛼2 = 𝛽2 + 𝑏32 𝛽3
(132b)
di mana 𝑏32 = 𝑘𝑜𝑒𝑓𝑖𝑠𝑖𝑒𝑛 𝑘𝑒𝑚𝑖𝑟𝑖𝑛𝑔𝑎𝑛 𝑟𝑒𝑔𝑟𝑒𝑠𝑖 𝑋3 𝑎𝑡𝑎𝑠 𝑋2 . Jika 𝑏32 ≠ 0, maka 𝛼2 menjadi penaksir tak bias dari 𝛽2 . Jadi obatnya lebih buruk dari penyakitnya.
110
4. Transformasi peubah Jika peubah pendapatan dan kekayaan dengan berjalannya waktu ke duanya bergerak dalam arah yang sama. Untuk meminimumkan ketergantungan dibuat sbb.: 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑢𝑖 Jika ini berlaku pada waktu t, maka harus berlaku pula pada t –1. Jadi 𝑌𝑡−1 = 𝛽1 + 𝛽2 𝑋2,𝑡−1 + 𝛽3 𝑋3,𝑡−1 + 𝑢𝑡−1 (133) Selisihnya 𝑌𝑖 − 𝑌𝑡−1 = 𝛽2 𝑋2𝑖 − 𝑋2,𝑡−1 + 𝛽3 𝑋3𝑖 − 𝑋3,𝑡−1 + 𝑣𝑡
(134)
Persamann (134) disebut perbedaan pertama (first difference). Regresi first difference sering mengurangi kepelikan multikoliniir. Tapi unsur kesalahan 𝑣𝑡 mungkin tak memenuhi asumsi model regre si liniir klasik, yi. Gangguan tak berkorelasi secara urut (serial corre lated ). Dan dengan difference,derajat kebebasan berkurang satu. Untuk cross-section ini tak dapat dilaksanakan.
5. Penambahan data baru Karena multikoliniritas merupakan ciri sampel, maka mungkin dalam sampel lain yang meliputi koliniir peubah yang sama tidak begitu se rius seperti dalam sampel pertama. Tekadang hanya dengan sekedar meningkatkan ukuran sampel, masalh koliniritas berkurang. Contoh 𝑣𝑎𝑟 𝛽12,3 =
𝜎2
𝑥22𝑖
1−𝑟223
111
Saat besar sampel meningkat, maka
2 𝑥2𝑖 akan meningkat, untuk
2 𝑟23 tertentu , maka 𝑣𝑎𝑟 𝛽12,3 akan berkurang, sehingga manaksir
𝛽12,3 lebih tepat.
7.2
Heteroskedastisitas 7.2.1 Sifat Dasar
Varians tiap unsur disturbanceui,tergantung (conditional) pada nilai yang dipilih dari peubah yang menjelaskan, adalah sebuah angka konstan yang sama dengan 𝜎 2 . Asumsi homoskedastisitas (penyebaran sama), yi. Varians sama.
𝐸 𝑢𝑖2 = 𝜎 2
𝑖 = 1,2, … , 𝑁
(135)
Varians bersyarat dari Yi (yang sama dari varians ui ), tergantung pada nilai Xi tertentu, tetap sama tak peduli nilai yang diambil peubah X. Sebaliknya,varians bersyarat dari Yi meningkat dengan meningkat nya X. Di sini, varians Yi tidak sama, terdapat heteroskedastisitas , atau
𝐸 𝑢𝑖2 = 𝜎𝑖2
(136)
Asumsikan model 2-peubah 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
Y menyatakan tabungan dan X menyatakan pendapatan. Meningkatnya pendapatan, maka tabungan secara rerata juga meningkat.
112
Tapi varians tabungan tetap sama untuk semua tingkat pendapatan. Beberapa alasan variansui munngkin variabel, di antaranya sbb.: 1. Mengikuti error-learning ( bukan sintua learning), karena manusia belajar, kesalahan mereka dalam perilaku semakin lama semakin kecil. Dalam hal ini, 𝜎𝑖2 diharapkan semakin menurun. 2. Dengan meninkatnya pendapatan, orang mempunyai lebih banyak pendapatan yang dapat digunakan sesuai dengan keinginan (discreti onary incime) dan karenanya memiliki lebih banyak ruangan untuk me milih mengenai pembagian pendapatan mereka. Jadi 𝜎𝑖2 nampaknya meningkat bersama-sama dengan peningkatan pen dapatan. Jadi dalam regresi tabungan atas pendapatan orang nampaknya menemukan 𝜎𝑖2 meningkat bersama-sama dengan pendapatan karena orang mempunyai lebih banyak pilihan mengenai perilaku tabungan mereka. 3. Dalam peningkatan dalam teknik mengumpulkan data, 𝜎𝑖2 nampaknya menurun. Jadi masalah heteroskadastisitas nampaknya menjadi lebih biasa dalam data cross-section dibandingkan time series. Pada cross-section, orang biasanya berhubungan dengan anggota popu lasi pada saat tertentu. Antara perusahaan kecil,menengah , atau besar mereka berbeda . Sebaliknya, dalam time series,peubahnya cenderung mempunyai derajat yang sama dalam besarnya karena orang biasanya mengumpulkan data untuk kesatuan yang sama selama satu periode waktu. Contohnya,GNP, belanja konsumsi, tabungan, atau kesempatan kerja, di AS misalnya untuk periode 1950-1975.
7.2.2
Konsekuensi
Dalam penyampelan berulang penaksir OLS secara rerata sama dengan nilai populasi sebenarnya, dan dengan meningkatnya ukuran sampel sampai tak terhingga penaksir tadi mengarah pada nilai sebenarnya (konsisten) tapi variansnya tidak lagi minimum bahkan jika besarnya sampel meningkat secaara tak terbatas (sifat efisiensi asimtotik).
113
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 Misalkan 𝐸 𝑢𝑖2 = 𝜎𝑖2 dan semua asumsi OLS dipertahankan, dapat ditunjuk kanbahwa metode kuadrat terkecil terbobot (weight least squares) memberikan BLUE dari 𝛽1 , misalkan 𝛽1∗ , sbb.:
𝑤𝑖
𝛽1∗ =
𝑤 𝑖 𝑋 𝑖 𝑌𝑖 − 𝑤 𝑖 𝑋 𝑖 𝑤 𝑖 𝑌𝑖 𝑤𝑖 𝑤 𝑖 𝑋𝑖2 − 𝑤 𝑖 𝑋 𝑖 2
(137)
dan variansnya 𝑣𝑎𝑟 𝛽1∗ =
𝑤𝑖
𝑤𝑖
𝑤𝑖𝑋2𝑖 −
𝑤𝑖𝑋𝑖 2
(138)
di mana 𝑤𝑖
= 𝜎12
(139)
𝑖
Sebalikanya, Penaksir OLS biasa dari 𝛽𝑖 adalah
𝛽𝑖 =
𝑥𝑖 𝑦𝑖 𝑥 𝑖2
(140)
dan dengan heteroskedastisitas variansnya
𝑣𝑎𝑟 𝛽𝑖 =
𝑥2𝑖 𝜎2𝑖 𝑥2𝑖
2
(141)
𝛽𝑖 masih tetap tak bias.
114
Sifat ketidakbiasan tidak memerlukan bahwa gangguan atau disturbanceuiadalah nomoskedastik. Tapi varians 𝛽𝑖 (141) lebih besar dari varians 𝛽1∗ dan 𝛽𝑖 adalah BLUE . Penaksir OLS dari 𝛽𝑖 seperti (140), dan asumsi homoskedastisitas , maka variansnya
𝑣𝑎𝑟 𝛽𝑖 =
𝜎2 𝑥2𝑖
(142)
Sekarang jika heteroskedastisitas ada seharusnya menggunakan (141) walupun varians nya tidak efisien. Penaksiran biasa 𝑣𝑎𝑟 𝛽𝑖 = 𝜎 2 /
𝑥2𝑖 adalah bias.
Dapat ditunjukkan :
𝐸
𝜎2
𝑥2𝑖
=
−𝑁
𝑥 𝑖2 𝜎2𝑖 + 𝑁−1 𝑁 𝑁−2
𝑥 𝑖2 𝑥 𝑖2
𝜎2𝑖
2
(142a)
yang berbeda dengan persaman (141). Konsekuensi menggunakan (142) sbb., misalkan
𝜎𝑖2 = 𝜎2 𝑘𝑖
(143)
di mana kiadalah beberapa bobot konstan (nonsthokastik), tidak perlu semua nya sama. Substitusi (143) ke (141), diperoleh
115
𝑣𝑎𝑟 𝛽𝑖 =
=
𝜎2 𝑥2𝑖 𝑘𝑖 𝑥2𝑖
2
𝜎2 𝑥2𝑖 𝑘𝑖 𝑥2𝑖 𝑥2𝑖
= 𝑣𝑎𝑟 𝛽1𝑂𝐿𝑆
𝑥2𝑖 𝑘𝑖 𝑥2𝑖
(144)
di mana varians 𝛽1𝑂𝐿𝑆 adalah varians 𝛽𝑖 dengan asumsi homoskedastisitas, yang diberikan (142). Dari (144) jika 𝑥𝑖2 dan 𝑘𝑖 , berkorelasi positif, dan jika
𝑥 𝑖2 𝑘𝑖 𝑥 𝑖2
>1
, maka 𝑣𝑎𝑟 𝛽𝑖 dengan heteroskedastisitas > daripada varians dengan homo skedastisitas. Formula OLS biasa (142) akan menaksir terlalu rendah (underestimates) varians sebenarnya dari 𝛽𝑖 yang diberikan (141) , yang pertama-tama tak efisien. Sebagai hasilnya, akan menaksir terlalu rendah kesalahan standar sebenarnya dari 𝛽𝑖 . Karenanya manaksir terlalu rendah nilai t yang berhubungan dengan 𝛽𝑖 yang ditaksir ( ingat hipotesis 𝛽1 = 0, 𝑡 = 𝛽1 /𝑠𝑒 𝛽1 , yang membawa ke kesimpulan dalam kasus khusus yang ada 𝛽𝑖 penting . Jika varians sebenarnya diberikan oleh (141) diketahui, nilai t yang “benar” mungkin menunjukkan bahwa 𝛽𝑖 , sebenarnya, penting secara statistic.
7.2.3
Deteksi
Hetroskedastisitas ini tak terhindarkan karena 𝜎𝑖2 hanya dapat dike tahui hanya jika mempunyai seluruh populasi Y yang berhubungan dengan X yang dipilih. Ahli EKONOMI berbeda dengan ahli PERTANIAN dan BIOLOGI, mereka mempunyai control yang cukup baik atas subjek mereka.
116
ZVI GRILICHES ahli EKONOMETRIK, heteroskedastisitas mungkin meru pakan persolan “spekulasi” atau, bersifat ad hock.
Metode informal dan formal deteksi Heteroskedastisitas :
1.
Sifat dasar masalah. Pelopor dari PRAIS dan HOUTHAKKER mengenai studi anggaran keluarga, ditemukan bahwa varians residual di sekitar regresi konsumsi atas pendapatan meningkat bersama dengan pendapatan, ini biasanya diasumsikan bahwa dalam survei sejenis orang dapat mengharapkan varians yang tak sama di antara gangguan (disturbance). Dalam data cross-sectional yang meliputi unit heterogen, heteroskedastisitas mungkin lebih merupakan kelaziman (aturan) daripada pengecualian. Dalam analisis cross-sectional yang melibatkan pengeluaran investasi dalam hubungannya dengan penjualan,tingkat bunga, dst., heteroskedastisitas biasanya dapat diperkirakan aka nada jika perusahaan yang kecil, menengah dan besar disampel bersamaan.
2.
Metode grafik. Jika taka da informasi apriori atau empiris mengenai sifat heteroskedastisitas, orang dapat melakukan analisis regresi atas asumsi bahwa bahwa taka da heteroskedastisitas dan kemudian melakukan pengujiansesudahnya (post morterm) dari kuadrat residual yang ditaksir 𝑒𝑖2 untuk melihat jika residual tadi menunjukkan sebuah pola sistematis. Meskipun 𝑒𝑖2 ≠ 𝑢𝑖2 , 𝑒 2 tadi dapat digunakan sbg.pendekatan khusus nya jika ukuran sampel cukup besar. Sebuah pengujian RSS mungkin memunculkan pola spt. berikut :
117
e2
𝑌
(a) e2
e2
𝑌 0
𝑌 0
(b)
e2
(c)
e2
𝑌 0
(d)
𝑌 0
(e)
Gambar Pola hipotesis residual kuadrat yg.ditaksir
118
Gambar di atas, 𝑒𝑖2 dipetakan terhadap Yi , Yi yang ditaksir dari garis regresi, idenya adalah untuk mengetahui apakah nilai rerata yang ditaksir Y secara sistematis berhubungan dengan kuadrat residual. Dalam Gambar (a) di sana taka da pola yang sistematis antara dua peubah , me nyarankan bahwa mungkin taka da heteroskadistisitas dalam data tadi. Gambar (b) sampai (e) menunjukkan pola tertentu. Gambar (c) menyarankan sebuah hubungan liniir. Gambar (d) dan (e) menunjukkan hubungan kuadaratik antara 𝑒𝑖2 terhadap Yi Dengan demikian dapat mentransformasikan data sehingga data tak lagi mengandung heteroskadistasitas. Daripada memetakan 𝑒𝑖2 terhadap Yi, bias dipetakan terhadap peu bah yang menjelaskan khususnya jika dengan memetakan 𝑒𝑖2 terhadap Yi meng hasilkan pola separti Gambar (a). Pemetaan seperti itu seperti ditunjukkan Gambar sbb.:
e2
X
(a)
Dalam kasus model 2-peubah, memetakan 𝑒𝑖2 terhadap Yi dalah ekivalen dengan memetakannya terhadap Xi, dan karenanya Gambar nya sama dengan hal di atas. Sebuah pola seperti Gambar (c)¸menyarankan bahwa varians dari unsur gangguan (disturbance) berhubungan liniir dengan peubah X. Jika dalam regresi tabungan atas pendapatan , ditemukan seperti Gambar (c), menyarankan bahwa variansheteroskedastisitas mungkin proporsional
119
terhadap nilai pendapatan . Setelah ditransformasi varians dari gangguan ada lahhomoskedastisitas.
e2
e2
𝑋 0
𝑋 0
(b)
e2
(c)
e2
𝑋 0
(d)
3.
X 0
(e)
Pengujian PARK.
120
Park memformalkan metode grafik dengan menyarankan bahwa 𝜎𝑖2 adalah sebuah fungsi yang menjelaskan Xi . Bentuk fungsi nya : 𝛽
𝜎𝑖2 = 𝜎 2 𝑋𝑖 𝑒 𝑣𝑖 atau ln 𝜎2𝑖 = ln 𝜎2 + 𝛽 ln 𝑋𝑖 + 𝑣𝑖
(145)
Karena 𝜎𝑖2 biasanya tak diketahui. Park menyarankan untuk meng gunakan sebagai pendekatan dgn. Regresi sbb.: 𝑒𝑖2
ln 𝑒𝑖2 = ln 𝜎 2 + 𝛽 ln 𝑋𝑖 + 𝑣𝑖
(146)
= α +𝛽 ln 𝑋𝑖 + 𝑣𝑖
Jika 𝛽 ternyata penting secara siatistik, ini menyarankan terdapat heteroske dastisitas, Prosedur Park adalah 2-tahap. Tahap I : regresi OLS tanpa mempersoalkan heteroskadastisitas. Tahap II : regresi ei . Tapi uji Park ada masalah: GOLFIELD dan QUANDT (ahli MIkro ekonomi), unsur kesalahan vi mungkin tak memenuhi asumsi OLS, sehingga akan terjadi heteroskedastisitas. Contoh Menggunakan Tabel pada soal No.2 heteroskedastisitas Diregresi 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
121
di mana Y = rerata kompensasi dalam ribuan $, X = rerata produkti vitas dalam ribuan $ dan i = besarnya tenag kerja perusahaan ke-i . Hasilnya 𝑌𝑖 = 1999,0466 + 0,2323𝑋𝑖 (0,1000) 𝑡 = 2,323 𝑅2 = 0,4356.
Koefisien kemiringan penting 5% atas uji t satu ujung. Pada saat produktivitas tenaga kerja meningkat dengan $1, maka kompensasi untuk tenaga kerja rerata naik sekitar 23 sen. Residual yang diperoleh dari regresi terhadap Xi seperti yang disarankan persamaan (146), memberikan sbb.:
ln 𝑒𝑖2 = 35,9010 − 2,8099 ln 𝑋𝑖 4,216 𝑡 = −0,667 𝑅2 = 0,0595
Jelas tak ada hubungan sinifikan antara kedua peubah, jadi taka da heteroske dastisitas.
4.
Pengujian GLEJSER. Seperti Park, setelah mendapatkan residual ei dari regresi OLS, menyarankan untuk meregresi nilai absolutei , terhadap peubah X yang diperkirakan mempunyai hubungan erat dengan 𝜎𝑖2 . Fungsi yang digunakan: 𝑒𝑖 = 𝛽1 𝑋𝑖 + 𝑣𝑖 𝑒𝑖 = 𝛽1 𝑋𝑖 + 𝑣𝑖 𝑒𝑖 = 𝛽1 𝑒𝑖 = 𝛽1
1
𝑋𝑖
+ 𝑣𝑖 1
𝑋𝑖
+ 𝑣𝑖
122
𝑒𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖 𝑒𝑖 =
𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖
𝑒𝑖 =
𝛽0 + 𝛽1 𝑋𝑖2 + 𝑣𝑖
Tapi GOLFELD dan QUANDT menunjukkan bahwa 𝑣𝑖 bermasalah dengan nilai harapan ≠ 0, berkorelasi secara serial, dan bersifat heteroskedas tisitas. Kesulitan lainnya, model 𝑒𝑖 =
𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖
𝑒𝑖 =
𝛽0 + 𝛽1 𝑋𝑖2 + 𝑣𝑖
dan
tak liniir dalam parameter, tak bias ditaksir dengan OLS. Menurut GLEJSER menyatakan untuk sampel besar 4 model pertama hasilnya sangat memuaskan untuk deteksi.
5.
Pengujian rank korelasi SPEARMAN Korelasi rank Spearman :
𝑟𝑠 = 1 − 6
𝑑 𝑖2 𝑁 𝑁 2 −1
(147)
di mana 𝑑𝑖 = 𝑝𝑒𝑟𝑏𝑒𝑑𝑎𝑎𝑛 𝑑𝑎𝑙𝑎𝑚 𝑟𝑎𝑛𝑘 yang ditetapkan untuk 2 ka rakteristik berbeda dari individual atau fenomena ke I dan 𝑁 = 𝑏𝑎𝑛𝑦𝑎𝑘 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑎𝑙 𝑎𝑡𝑎𝑢 𝑓𝑒𝑛𝑜𝑚𝑒𝑛𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑟𝑎𝑛𝑘. Korelasi heteroskedastisitas
tadi dapat sbb.:
digunakan
untuk
mendeteksi
Asumsikan : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 Langkah I : Cocokkan regresi terhadap data mengenai Y dan X dan dapatkan residual ei.
123
Langkah II : Dengan mengabaikan tanda dari ei, yaitu dengan mengambil nilai mutlaknya 𝑒𝑖 , meranking baik harga mutlak 𝑒𝑖 dan Xi sesuai de ngan urutan yang meningkat atau menurun dan menghitung koefisi en rank korelasi Spearman yang telah diberian sebelumnya tadi. Langkah III : Dengan mengasumsikan bahwa koefisien rank korelasi popula si 𝜌𝑠 adalah nol dan N > 8, tingkat penting dari rs yang disampel dapat diuji dengan pengujian t sbb.:
𝑡=
𝑟𝑠 𝑁−3 1−𝑟𝑠2
(148)
dengan 𝑑𝑓 = 𝑁 − 2. Jika t hitung >t kritis , hipotesis adanya heteroskedastisitas diteri ma. Jika model regresi meliputi lebih dari satu peubah X, rs dapat di hitung antara 𝑒𝑖 dan masing-masing peubah X secara terpisah dan dapat diuji untuk tingkat penting secara statistic dengan peng ujian t seperti di atas.
Contoh Penaksiran capital market line dari teori portofolio. Data berhubungan dengan 10 dana bersama (mutual of fund) berbeda dalam ukuran maupun tujuan investasinya, secara apriori bisa diharapkan terdapatnya hetero skedastisitas. Untuk menguji hipotesis digunakan teknik rank korelasi. Tabel berikut mem berikan datanya. Menggunakan (147) , diperoleh
124
126,5
𝑟𝑠 = 1 − 6 100
100−1
= 0,2333
Dengan uji t
𝑡=
0,2333
8
1−0,0544
= 0,6786
Tak ada bukti adanya hubungan yang sistematik antara peubah yang menjelas kan dan nilai mutlak residual, jadi tak ada heteroskedastisitas.
Metode rank korelasi X, deviasi standar da ri hasil ta hunan
𝑒𝑖 , nilai mutlak da ri residual
12,4
1,017
5
9
–4
16
14,4 14,6 16,0 11,3 10,0 16,2 10,4 13,1 11,3
1,260 0,181 0,202 0,221 0,602 0,908 0,110 0,077 0,018
7 8 9 3,5 1 10 2 6 3,5
10 4 5 6 7 8 3 2 1
–3 4 5 –2,5 –6 2 –1 4 2,5 ________
9 16 16 6,25 36 4 1 16 6,25 ________
0
126,5
7.2.4
Rank 𝑒𝑖
Rank X
d2
d
Obat
125
Heteroskedastisitastidak merusak sifat ketidakbiasan dan konsis tensi darim penaksir OLS, tetapi penaksir tidak lagi efisien, bahkan tidak lagi asimtotik (untuk sampel besar). Ketidakefisienan membuat prosedur pengujian hipotesis diragukan. Pendekatan :
Jika 𝝈𝟐𝒊 diketahui : Metode Kuadrat Terkecil Tertimbang ( Weight Least Squares )
Jika 𝜎𝑖2 diketahui atau dapat ditaksir, metode yang paling jelas dan berkaitan dengan heteroskedastisitas adalah dengan menggunakan kuadrat terkecil tertimbang (weighted least squares). Untuk menggambarkannya :
PRF : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
SRF : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑒𝑖
Metode kuadrat terkecil biasa diperoleh dengan meminimumkan 2
RSS : 𝑒𝑖2 = 𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 terhadap yang tak diketahui. Ini secara implisit memberikan bobot yang sama untuk tiap 𝑒𝑖2 . Metode kuadrat terkecil tertimbang memperhitungkan titik-titik ekstrim dengan meminimumkan RSS sbb,:
min
𝑒𝑖2 =
𝑤𝑖 𝑌𝑖 − 𝛽0∗ − 𝛽1∗ 𝑋𝑖
2
(149)
126
di mana 𝑤𝑖 dipilih sedemikian rupa sehingga observasi yang ekstrim (misalnya titik C dalam Gambar) mendapatkan bobot lebih kecil . Jika 𝜎𝑖2 diketahui, dapat dimisalkan 𝑤𝑖 =
1
(150)
𝜎𝑖2
Skema ini akan “mendiskonto” lebih besar observasi yang berasal dari popula si dengan yang lebih besar seperti titik C.
Y C 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖
e
A e
e
B
X
Dengan differensial persamaan (150) dan menyamakan dengan nol (mekanis me minimum), diperoleh :
𝛽0∗ =
𝑤 𝑖 𝑋𝑖 𝑤𝑖
− 𝛽1∗
𝑤 𝑖 𝑋𝑖 𝑤𝑖
(151)
∗ ∗
= 𝑌 ∗ − 𝛽𝑖 𝑋
127
di mana 𝑌 ∗ 𝑑𝑎𝑛 𝑋 ∗ adalah rerata sampel tertimbang dengan 𝑤𝑖 sebagai timbangan dan
𝛽1∗ =
𝑤 𝑖 𝑦𝑖∗ 𝑥 𝑖∗ 𝑤 𝑖 𝑥 𝑖∗
(152)
2
𝝈𝟐𝒊 Tidak Diketahui
Dalam penelitian Ekonometrik pengetahuan sebelumnya mengenai 𝜎𝑖2 jarang dimiliki. Prakteknya membuat sebuah asumsi ad hock𝜎𝑖2 , yang masuk akal, mentrans formasi model regresi asli sedemikian untuk memenuhi asumsi homoskedas tisitas. Transformasi model 2-peubah : 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
Beberapa asumsi heteroskedastisitas yang dipertimbangkan :
Asumsi 1 𝐸 𝑢𝑖2 = 𝜎 2 𝑋𝑖2
(153)
Jika pendekatan Park dan Glejser dipercayai bahwa varians ui proporsional terhadap kudarat peubah yang menjelaskan X, maka model asli ditransformasi sbb.: Model asli dibagi dengan Xi :
128
𝑌𝑖 𝑋𝑖
=
𝛽0 𝑋𝑖
𝑢
+ 𝛽1 + 𝑋 𝑖 𝑖
(153)
1
= 𝛽0 𝑋 + 𝛽1 + 𝑣𝑖 𝑖
Now, 𝐸 𝑣𝑖2 = 𝐸
𝑢𝑖 2 𝑋𝑖
=
1 𝑋𝑖2
𝐸 𝑢𝑖2 = 𝜎 2 → 𝑜𝑚𝑜𝑠𝑘𝑒𝑑𝑎𝑠𝑡𝑖𝑘.
Jadi persamaan (153) diregresi dengan OLS terhadap
1 𝑋𝑖
.
Setelah regresi, penaksir dikalikan dengan 𝑋𝑖 .
Asumsi 2 𝐸 𝑢𝑖2 = 𝜎 2 𝑋𝑖
(154)
Model asli ditransformasi sbb.:
𝑌𝑖 𝑋𝑖
=
𝛽0 𝑋𝑖
+ 𝛽1 𝑋𝑖 + 𝑣𝑖
(155)
𝐸 𝑣𝑖2 = 𝜎 2 → 𝑜𝑚𝑜𝑠𝑘𝑒𝑑𝑎𝑠𝑡𝑖𝑘
Model transformasi tak punya intersep. Setelah regresi, kembali ke model asli dengan perkalian
𝑋𝑖 pada
persamaan (155).
Asumsi 3
129
𝐸 𝑢𝑖2 = 𝜎 2 𝐸 𝑌𝑖
2
(156)
Ini sesuai dengan Gambar (e) di depan.
𝐸 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖
Persamaan asli ditransformasi sbb.:
𝑌𝑖 𝐸 𝑌𝑖
=𝐸
𝛽0 𝑌𝑖
di sini 𝑣𝑖 =
𝛽 𝑋
+ 𝐸 1𝑌 𝑖 + 𝐸 𝑖
𝑢𝑖 𝐸 𝑌𝑖
𝑢𝑖 𝑌𝑖
(157)
→ 𝐸 𝑣2𝑖 = 𝜎2 → homosedastik.
Tapi 𝐸 𝑌𝑖 𝑡𝑒𝑟𝑔𝑎𝑛𝑡𝑢𝑛𝑔 𝛽0 𝑑𝑎𝑛 𝛽1 → 𝑡𝑎𝑘 𝑑𝑖𝑘𝑒𝑡𝑎𝑢𝑖. Juga 𝛽0 𝑑𝑎𝑛 𝛽1 adalah penaksir 𝐸 𝑌𝑖 . Ada 2 mempersoalkan
langkah
:
pertama
regresi
dengan
OLS
tanpa
heteroskedastisitas dan diperoleh 𝑌𝑖 . Kedua, model ditransformasi dengan model sbb.:
𝑌𝑖 𝑌𝑖
=
𝛽0 𝑌𝑖
+
𝛽1 𝑋𝑖 𝑌𝑖
+ 𝑣𝑖
(158)
Meskipun 𝑌𝑖 tidak sama tepat dengan 𝐸 𝑌𝑖 , namun 𝑌𝑖 penaksir yang konsisten dengan meningkatkan ukuran sampel tak terbatas,
130
dengan demikian 𝑌𝑖 mengarah ke 𝐸 𝑌𝑖 yang sebenarnya.
Asumsi 4Transformasi Log Jika tidak melakukan regresi 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 Tapi meregresi ln 𝑌𝑖 = 𝛽0 + 𝛽1 ln 𝑋𝑖 + 𝑢𝑖
(159)
Sering ini akan mengurangi heteroskedastisitas. Logaritma mengecilkan skala, dengan demikian mengurangi perbe daan 10 kali lipat menjadi 2 kali lipat, sebab ln berbasis 2,38. Kelebihan transformasi log di mana koefisien kemiringan 𝛽1 me ngukur elastisitas Y terhadap X, yaitu % perubahan Y karena % pe rubahan X. Sedang dalam model asli 𝛽1 mengukur tingkat rerata perubahan Y karena perubahan 1 unit X.
Saat berhadapan dengan model lebih dari 2-peubah, tidak diketahui peubah mana yang harus ditransformasikan. Menurut KARL PEARSON ada korelasi yang palsu (spurios), di mana terdapat korelasi antara rasio peubah-peubah meskipun peu bah yang asli Y tidak berkorelasi terhadap X atau random.
7.3 Autokorelasi
131
Asumsi model Klasik, taka da autokorelasi atau kondisi berurutan di antara gangguan atau disturbance u i yang masuk dalam PRF.
7.3.1
Sifat Dasar Masalah
Istilah autokorelasi didefinisikan sebagai “korelasi antara anggota serangkaian observasi yang diurutkan menurut waktu (time-series) atau ruang (cross-sectional). Autokorelasi itu tak terdapat dalam disturbance atau gangguanui .
𝐸 𝑢𝑖 , 𝑢𝑗 = 0 𝑖 ≠ 𝑗
Unsur gangguan yang berhubungan dengan observasi tidak dipengaruhi oleh unsur disturbance atau gangguan yang berhubungan dengan pengamatan lain yang manapun. Dalam data times-series, jika karena PHK maka output triwulan I menurun, tapi penurunan itu tidak akan terbawa ke triwulan lain. Dalam data cross-section, jika orang miskin semakin turun daya beli nya, itu tak ada pengaruhnya ke pekerja Sarjana terdidik. Karena mereka berbeda kelas pendapatannya. Orang miskin tak punya kelas pendapatan karena pengangguran. Tapi jika ada hubungan itu, maka dalam data terdapat autokorelasi.
𝐸 𝑢𝑖 , 𝑢𝑗 ≠ 0 𝑖 ≠ 𝑗
(160)
TINTNER mendefinisikan autokorelasi sebagai “korelasi keting galan waktu (lag) sebuah deretan tertentu dengan dirinya sendiri, tertinggal oleh sejumlah unit waktu,”sedangkan serial korelasi sebagai “korelasi ketinggalan waktu antara 2 seri yang berbeda.”
132
Korelasi dua deret waktu : 𝑢1 , 𝑢2 , … , 𝑢10 dan 𝑢2 , 𝑢3 , … , 𝑢11 , di mana yang perta ma adalah seri yang terakhir tapi ketinggalan satu periode waktu adalah autokorelasi. Sedangkan, korelasi antara deretan waktu 𝑢1 , 𝑢2 , … , 𝑢10 dan 𝑣2 , 𝑣3 , … , 𝑣11 , di mana u dan v dua deretan waktu berbeda, disebut serial korelasi. Seperti nonton film JAMES BOND ada seri –seri nya. Perhatikan gambar berikut! Gambar (a) menunjukkan pola siklus; Gamabar (b) dan (c) trend liniir ke atas atau ke bawah dalam gangguan (disturbance); sedang Gambar (d) menunjukkan trend liniir dan kuadratis. Gambar (e) tak ada pola yang sistematis, mendukung asumsi nonautokorelasi dan model regresi liniir klasik.
U,e
U,e
waktu
0
waktu
(a)
(b)
U,e
U,e
waktu
0
(c)
waktu
(d)
133
U,e
waktu
(e)
Alasan adanya serial korelasi :
1. Inertia . Ciri menonjol dari sebagian deretan waktu ekonomi adalah inersia atau kelembaman. Deret waktu seperti GNP, IHK, produksi, kesempatan kerja, dan pe ngangguran menunjukkan pola siklus (konjungtur). Dimulai dari dasar resesi, di mana kebangkitan perekonomian dimulai, sebagian besar deretan ini mulai bergerak ke atas. Dalam ayunan ke atas ini, nilai sebuah seri pada suatu saat tertentu lebih besar dari nilai sebelumnya. Jadi ada sebuah “momentum” yang terdapat di dalamnya, dan momentum it uterus-menerus sampai terjadi sebuah (misalnya, pe ningkatan dalam tingkat bunga atau pajak atau keduanya) yang memper lambatnya. Jadi dalam regresi deret waktu, observasi yang berurutan nampaknya saling bergantungan. 2. Bias spesifikasi :kasus peubah yang tak dimasukkan. Peneliti sering memulai model regresi yang masuk akal, yang mungkin bukan model yang “sempurna”. Setelah anlisi regresi melakukan uji postmortem untuk mengetahui hasilnya cocok dengan harapansecara apriori. Jika tidak, pembedahan dimulai.Peneliti membedakan residual ei untuk diperoleh dari regresi
134
yang dicocokkan dan bias mengamati pola seperti yang ditunjukkan da lam Gambar (a) sampai (d). Residual ini mungkin menyarankan bahwa beberapa model yang pada mulanya merupakan calon tetapi tidak dima sukkan dalam model untuk berbagai alasan yang seharusnya dimasuk kan. Ini kasus bias spesifikasi karena peubah yang tak dimasukkan . Sering terjadi dengan memsukkan peubah seperti itu menghilangkan pola korelasi yang diamati di antara residual. Contoh : 𝑌𝑡 = 𝛽1 + 𝛽2 𝑋2𝑡 + 𝛽3 𝑋3𝑡 + 𝛽4 𝑋4𝑡 + 𝑢𝑡 (161) di mana Y = kuantitas daging sapi yang diminta, X2 = harga daging sa pi, X3 = pendapatan konsumen, X4 = harga daging B2, dan t = waktu. Untuk beberapa alasan dilakukan regresi : 𝑌𝑡 = 𝛽1 + 𝛽2 𝑋2𝑡 + 𝛽3 𝑋3𝑡 + 𝑣𝑡
(162)
Sekarang jika (161) model “yang benar “ atau “hubungan yang sebenar nya,” melakukan regresi (162) adalah sama dengan memisalkan 𝛽4 𝑋4𝑡 + 𝑢𝑡 = 𝑣𝑡 . Dan sejauh pengaruh harga daging B2 memengaruhi harga daging sapi, unsur kesalahan atau gangguan v akan mencerminkan sebuah pola sistemmtik, jadi menimbulkan autokorelasi (yang salah). Pengujian sederhana dengan melakukan regresi (161) dan (162) dan melihat apakah autokorelasi, jika ada , yang diamati dalam (161) menghilang saat (162) dilaksanakan. Sebuah pemetaan residual dari regresi (161) dan (162) akan memperjelas soal serial korelasi.
3. Bias spesifikasi : bentuk fungsional yang tidak benar.. Misalakan model yang “sebenarnya” atau yang benar dalam penelitian biaya hasil adalah sbb.: Biaya marjainal𝑡 = 𝛽1 + 𝛽2 𝑎𝑠𝑖𝑙𝑡 + 𝛽3 𝑎𝑠𝑖𝑙 2𝑡 + 𝑢𝑡 Tetapi dicocokkan model:
135
Biaya marjainal𝑡 = 𝛼1 + 𝛼2 𝑎𝑠𝑖𝑙𝑡 + 𝑣𝑡 Kurva biaya marjinal uang sesuai dengan model “yang benar” ditunjuk kan Gambar berikut : Seperti Gambar di atas antara titik A dan B kurva biaya marjinal liniir akan secara konsisten menaksir terlalu tinggi (overestimate) biaya mar jinal sebenarnya, sedang di luar batas titik-titik ini kurva tadi secara konsisten akan menaksir terlalu rendah (underestimate) biaya marjinal sebenarnya. Seharusnya, ini yang diharapkan, karena unsur gangguan 𝑣𝑡 = 𝛽3 𝑎𝑠𝑖𝑙 2𝑡 + 𝑢𝑡 , dan karenanya menangkap pengaruh sistematis dari hasil pada biaya marjinal.
Biaya marjinal produksi
Dalam kasus ini, 𝑣𝑡 akan mencerminkan autokorelasi karena digunakannya bentuk fungsional yang salah.
B
A
0 Hasil Bias spesifikasi bentuk fungsional yang tak benar
136
4. Fenomena COBWEB PEenawaran banyak komoditi pertanian mencerminkan apa yang disebut “Fenomena Cobweb” di mana penawaran bereaksi terhadap harga dengan keterlambatan satu periode waktu karena keputusan penawaran memerlukan waktu untuk penawarannya (periode persiapan) jadi pada awal musim tanam tahun ini petani dipengaruhi oleh harga yang terjadi tahun yang lalu, sebagai fungsi penawarannya P𝑒𝑛𝑎𝑤𝑎𝑟𝑎𝑛 𝑡 = 𝛽0 + 𝛽1 𝑃𝑡−1 + 𝑢𝑡
(163)
Misalkan pada akhir periode t, harga Pt ternyata lebih rendah dari harga Pt –1 . Jadi dalam periode t +1 petani sangat mungkin memutuskan untuk memproduksi kurang dari apa yang dilakukan dalam periode t , Jelas dalam situasi ini gangguan ui tidak diharapkan random karena jika petani berproduksi terlalu banyak dalam tahun t , mereka nampaknya akan mengu rangi produknya dalam periode t+1 , dst, dan mengakibatkan pola Cobweb. 5. Keterlambatan (Lag) Dalam regresi deretan waktu dan belanja konsumsi atau pendapatan , bukan hal yang tak biasa untuk mendapatkan bahwa belanja konsumsi dalam periode ini tergantung, al. pada belanja konsumsi sebelumnya. Yaitu,
𝐾𝑜𝑛𝑠𝑢𝑚𝑠𝑖𝑡 = 𝛽1 + 𝛽2 𝑝𝑒𝑛𝑑𝑎𝑝𝑎𝑡𝑎𝑛𝑡 + 𝛽3 𝑘𝑜𝑛𝑠𝑢𝑚𝑠𝑖𝑡−1 + 𝑢𝑡
(164)
Regresi (164) dikenal sbg. Autoregresi, karena satu dari peubah yang menjelas kan adalah nilai lambat (lag value) dari peubah tak bebas. Dasar pemikirannya : Konsumen tidak sering merubah kebiasaan konsumsi mereka karena alasan psikologis, teknis atau kelembagaan. Sekarang jika unsur keterlambatan diabai kan dalam (164), unsur kesalahan yang dihasilkan akan mencerminkan
137
pola sistematik sebagai akibat pengaruh konsumsi periode laluatas konsumsi saat ini.
6. “Manipulasi” data. Seringkali data asar “dimanipulasikan.” Contoh, dalam regresi time series dengan data triwulanan, data seperti ini biasanya diperoleh dari data bulanan dengan hanya menambahkan 3 observasi bulanan dan membaginya dengan 3. Pemerataan menghasilkan penghalusan (smoothness) ke dalam data dengan meratakan fluktuasi dalam data bulanan. Jadi jika grafik yang mempetakan data triwulanan nampak jauh lebih halus daripada data bulanan, dan kehalusan mungkin dengan sendirinya mengakibatkan pola sistematis dalam gangguan atau distrurbances, sehingga menyebabkan autokorelasi. Sumber lain manipulasi adalah interpolasi atau ekstrapolasi data. Dalam data deretan waktu, observasi diurutkan dalam urutan kroon logis. Jadi nampaknya akan terjadi interkorelasi di antara observasi yang berurutan, terutama jika selang waktu antara observasi yang berurutan pendek, seperti satu hari, satu minggu, atau satu bulan dan bukannya satu tahun. Umumnya kronologis seperti itu taka da dalam data cross-sectional. Autokorelasi dalam cross-section disebut autokorelasi ruang (spatial corre lation).
7.3.2 Konsekuensi Diketahui model 2-peubah : 𝑌𝑡 = 𝛽0 + 𝛽1 𝑋𝑡 + 𝑢𝑡
(165)
Asumsikan gangguan (disturbance) ditimbulkan sbb.:
𝑢𝑡 = 𝜌𝑢𝑡−1 + 𝜀𝑡
−1 < 𝜌 < +1
(165)
138
di mana 𝜌 disebut koefisien autokovarians dan 𝜀𝑡 adalah gangguan stokastik sedemikian rupa sehingga memenuhi semua asumsi OLS yaitu,
𝐸 𝜀𝑡 = 0 𝑣𝑎𝑟 𝜀𝑡 = 𝜎 2 𝑐𝑜𝑣 𝜀𝑡 , 𝜀𝑡+𝑠 = 0
𝑠≠0
(166)
Skema (165) dikenal sebagai skema autoregresif derajat-1 Markov.
𝜌=
𝐸 𝑢 𝑡 −𝐸 𝑢 𝑡
=
𝐸 𝑢 𝑡 ,𝑢 𝑡−1 𝑣𝑎𝑟 𝑢 𝑡−1
𝑣𝑎𝑟 𝑢 𝑡
𝑢 𝑡−1 −𝐸 𝑢 𝑡−1 𝑣𝑎𝑟 𝑢 𝑡−1
(167)
karena 𝐸 𝑢𝑡 = 0 untuk tiap t dan 𝑣𝑎𝑟 𝑢𝑡 = 𝑣𝑎𝑟 𝑢𝑡−1 memper tahankan asumsi heteroskedastisitas.
karena tetap
Dalil (165) adalah bahwa gerakan atau pergeseran dalam ut terdir dari 2 bagian, satu bagian 𝜌𝑢𝑡−1 , yang menerangkan pergeseran sistematis, dan yang lainnya𝜀𝑡 , yang random secara murni. Dengan skema autoregresif derajat pertama, dapat ditunjukkan bahwa :
𝑣𝑎𝑟 𝛽1∗ =
𝜎2 𝑁 2 𝑡=1 𝑋𝑡
1+𝜌
𝑁−1 𝑡=1 𝑋𝑡 𝑋𝑡+1 𝑁 2 𝑡=1 𝑋𝑡
+ 2𝜌 2
𝑁−1 𝑡=1 𝑋𝑡 𝑋𝑡+2 𝑁 2 𝑡=1 𝑋𝑡
+ ⋯ + 2𝜌 𝑁−1
𝑋𝑡 𝑋𝑁 𝑁 2 𝑡=1 𝑋𝑡
(168)
di mana 𝑣𝑎𝑟 𝛽1∗ kovarians penaksir OLS biasa dengan serial korelasi (de rajat pertama.)
139
𝑣𝑎𝑟 𝛽1∗ masih tetap tidak minimum karena 𝑥𝑙2tidal lagi BLUE.
𝛽1 =
𝑥𝑖 𝑦𝑖 /
Dengan mengasumsikan skema autoregresif derajat pertama, sifat BLUE dari 𝛽1 , yang dinamakan 𝑏1 , adalah
𝑏1 =
𝑥 𝑡 −𝜌𝑥 𝑡−1 𝑦𝑡 −𝜌𝑦𝑡−1 𝑥 𝑡 −𝜌𝑥 𝑡−1 2
+𝐶
dan variansnya adalah
𝑣𝑎𝑟 𝑏1 =
𝜎2
+𝐷 𝑥𝑡 −𝜌𝑥𝑡−1 2
di mana C dan D adalah varians korelasi yang mungkin biasa diartikan dalam praktek. Jadi yang minimum 𝑣𝑎𝑟 𝑏1 bukan 𝛽1∗ , meskipunyang terakhir telah mem perhitungkan serial korelasi (derajat pertama). Jika 𝜌 = 0 maka 𝑏1 bersesuaian dengan 𝛽1 dan 𝑣𝑎𝑟 𝛽1 dan 𝑣𝑎𝑟 𝑏1 keduaduanya sesuai dengan 𝑣𝑎𝑟 𝛽1 = 𝜎2 / 𝑁𝑡=1 𝑥2𝑡 . Tapi meskipun tidak lagi BLUE, 𝛽1 masih tak bias.
Sebaliknya rumus (homoskedastisitas) biasa untuk varians penaksir OLS adalah 𝑣𝑎𝑟 𝛽1 = 𝜎2 /
𝑁 2 𝑡=1 𝑥𝑡
(169)
Bandingkan(168) dengan (169). Jika 𝜌 positif (hal yang bebar untuk sebagian besar deretan waktu ekonomis) dan X berkorelasi secara positif ,maka
140
𝑣𝑎𝑟 𝛽1 < 𝑣𝑎𝑟 𝛽1∗
(170)
yaitu, varians OLS biasa dari 𝛽1 menaksir terlalu rendah varians yang sebenar nya (dengan korelasi derajat pertama). Jadi dengan kondisi yang diasumsikan, seharusnya digunakan 𝑣𝑎𝑟 𝛽1∗ bukan 𝑣𝑎𝑟 𝛽1 . Idealnya , seharusnya menggunakan penaksir BLUE 𝑏1 . Jika 𝑣𝑎𝑟 𝛽1 digunakan, maka tidak membuat tidak terlalu tinggi ketepatannya. Menaksir terlalu rendah kesalahan standar 𝛽1 . Sebagai hasilnya dalam menghitung rasio t dengan 𝑡 = 𝛽1 /𝑠𝑒 𝛽1 , akan menaksir terlalu ting gi nilai t. Tapi seperti dalam kasus heteroskedasitas,𝜎 2 ditaksir terlalu rendah. Untuk model 2-peubah klasik 𝑒2
𝜎 2 = 𝑁−2𝑡
Memberikan penaksir tak bias dari 𝜎 2 , yaitu 𝐸 𝜎
(171)
2
= 𝜎2.
Tapi jika ada autokorelasi, untuk skema autoregresif derajay pertama, maka
𝐸 𝜎
2
= 𝜎2
𝑁− 2/ 1−𝜌 −2𝜌𝑟 𝑁−2
(172)
𝑁−1 2 di mana 𝑟 = 𝑁−1 ,yang diinterpretasikan sebagai koefi 𝑡=1 𝑥𝑡 𝑥𝑡−1 / 𝑡=1 𝑥𝑡 sien korelasi (sampel) antara nilai X yang berurutan.
Jika 𝜌 𝑑𝑎𝑛 r kedua-duanya positif, maka dari (172)
bahwa 𝐸 𝜎2 < 𝜎 2
yaitu varians residual biasa , secara rerata akan ditaksir terlalu rendah 𝜎 2 yang sebenarnya. Bias dalam 𝜎 2 akan diteruskan ke 𝑣𝑎𝑟 𝛽1 .
141
Contoh METODE MONTE CARLO, Dalam model (165) “diketahui” bahwa 𝛽0 𝑠𝑒𝑏𝑒𝑛𝑎𝑟𝑛𝑦𝑎 = 1 𝑑𝑎𝑛 𝛽1 = 0,8. Jika PRF stokastik 𝑌𝑡 = 1,0 + 0,8𝑋𝑡 + 𝑢𝑡 𝐸 𝑌𝑡 𝑋𝑡 = 1,0 + 0,8𝑋𝑡
Jadi
(173)
yang memberikan garis regresi populasi yang sebenarnya. Asumsikan bahwa ut ditimbulkan oleh skema autoregresifderajat pertama sbb.: 𝑢𝑡 = 0,7𝑢𝑡−1 + 𝜀𝑡
(174)
di mana 𝜀𝑡 memenuhi asumsi OLS. Untuk memudahkan 𝜀𝑡 didistribusikan secara normal dengan rerata nol dan varians 1. Gangguan berurutan berkorelasi secara positif dengan koefisien autokorelasi +0,7 , sebuah tingkat ketergantungan yang agak tinggi.
Hipotesis sifat kesalahan autokorelasi positif Observasi 0 1 2 3 4 5 6 7 8 9 10
𝜀𝑡
𝑢𝑡 = 0,7𝑢𝑡−1 + 𝜀𝑡 0 0,464 2,0262 2,455 –0,323 –0,068 0,296 –0,288 1,298 0,241 –0,957
𝑢0 = 5 𝑎𝑠𝑢𝑚𝑠𝑖 𝑢1 = 0,7 5 + 0,464 = 3,9640 𝑢2 = 4,8010 5,8157 3,7480 2,5556 2,0849 1,1714 2,1180 1,7236 0,2495
142
Korelasi skema 𝑢_𝑡=0,7𝑢_(𝑡−1)+𝜀_𝑡 7
6
5,8
5
4,8
4
4
ut
3,7
3 2,6 2,1
2
2,1 1,7 1,2
1
0,2
0 1
2
3
4
5
6
7
8
9 10
Waktu
Dengan memetakan utyang ditimbulkan dalam Tabel, diperoleh Gambar , yang menunjukkan bahwa mula-mula tiap ut yang berurutan lebih tinggi dari nilai sebelumnya dan berikutnya biasanya lebih kecil dari sebelumnya, menunjukan secara umum, ada autokorelasi positif. Sekarang misalnya nilai X tetap pada 1,2,3, … ,10. Dari nilai ini dapat dimunculkan sebuah sampel nilai Y dari Tabel berikut. Dengan Tabel ini diregresi Y atas X, diperoleh :
Nilai sampel Y Xt
𝑌𝑡 = 1,0 + 0,8𝑋𝑡 + 𝑢𝑡
ut
1 2 3
3,9640 4,8010 5,8157
𝑌𝑡 = 1,0 + 0,8 1 + 3,9640 = 5,7640 7,4010 9,2157
143
4 5 6 7 8 9 10
3,7480 2,5556 2,0849 1,1714 2,1180 1,7236 0,2495
7,9480 7,5556 7,8849 7,7714 9,5180 9,9236 9,2495
𝑌𝑡 = 6,5452 + 0,6153
0,3051𝑋𝑡
(175)
(0,0992)
𝑡 = 10,6366 3,0763 𝑟 2 = 0,5419
𝜎 2 = 0,8114
Kedua garis regresi (173) dan (175) dilukis sbb.:
10
𝑌𝑡 = 6,5452 +
Y
8
0,3051𝑋𝑡
𝑌𝑡 = 1,0 + 0,8𝑋𝑡
et 6
PRF sebenarnya
ut
Y sebenarnya
2
144 X 2
8
10
\
Gambar di atas menunjukan kenapa varians ut sebenarnya Nampak nya ditaksir terlalu rendah (underestimate) oleh penaksir 𝜎 2 , yang dihitung dari et : et biasanya dekat dengan garis yang dicocokkan (yang disebabkan oleh prosedur OLS ) tetapi menyimpang banyak dari PRF sebenarnya. Jadi et tidak memberikan gambaran sebenarnya mengenai ut . Seberapa jauh penaksiran terlalu rendah dari 𝜎 2 sebenarnya ? Misalkan dilakukan percobaan penyampelan lain seperti prosedur di atas. Dengan menjaga Xt dan 𝜀𝑡 seperti Tabel di atas , diasumsikan 𝜌 = 0, yaitu taka da korelasi. Sampel baru diperoleh ditampilkan dalam Tabel berikut:
Sampel nilai Y dengan korelasi serial nol Xt
𝜀𝑡 = 𝑢𝑡
𝑌𝑡 = 1,0 + 0,8𝑋𝑡 + 𝜀𝑡
1 2 3 4 5 6 7 8 9 10
0,464 2,0262 2,455 –0,323 –0,068 0,296 –0,288 1,298 0,241 –0,957
2,264 4,626 5,855 3,877 4,932 6,096 6,312 8,698 8,441 8,043
Regresi yang diperoleh :
145
𝑌𝑡 = 2,5339 + 0,6684
0,6146𝑋𝑡 (0,1087)
𝑡 = 3,7910 5,6541 𝑟 2 = 0,7998
𝜎 2 = 0,9752
Regresi ini jauh lebih dekat dengan “kebenaran” karena Y sekarang pada dasarnya random. Di sini 𝜎 2 telah meningkat dari 0,8114 𝜌 = 0,7 𝑘𝑒 0,9752 𝜌 = 0 . Kesalahan standar 𝛽0 𝑑𝑎𝑛 𝛽1 telah meningkat. Ini sejalan dengan teori yang dibahas sebelumnya.
7.3.3 Diagnosa
Beberapa uji :
Metode Grafik
Asumsi nonautokorelasi model klasik berkenaan dengan gangguan atau disturbance populasi ui,tak dapat diamati secara langsung.yang dimiliki hanya pendekatannya, residual ei, yang diperoleh dari prosedur OLS yang bia sa.Meskipun 𝑒𝑖 ≠ 𝑢𝑖 , keduanya berhubungan, sptb.: Model 2-peubah
146
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
atau dalam bentuk penyimpangan (deviasi) 𝑦𝑖 = 𝛽1 𝑥𝑖 + 𝑢𝑖 − 𝑢
(176)
Ingat 𝑢 ≠ 𝐸 𝑢𝑖 .
𝑒𝑖 = 𝑦𝑖 − 𝛽1 𝑥𝑖 = 𝛽1 𝑥𝑖 + 𝑢𝑖 − 𝑢 =
− 𝛽1 𝑥𝑖
𝛽1 − 𝛽1 𝑥𝑖 + 𝑢𝑖 − 𝑢
Sekarang 𝛽1 = 𝛽1 +
(177)
𝑥𝑖 𝑢𝑖 𝑥2𝑖
diperoleh di depan, substitusi ke (177) diperoleh :
𝑒𝑖 = 𝑢𝑖 − 𝑢 − 𝑥𝑖
𝑥𝑖 𝑢𝑖 𝑥2𝑖
(178)
Jadi, jika ada autokorelasi di antara u, akan tercermin dalam e , maka 𝑒𝑖 dapat diperiksa untuk memperoleh sifat serial𝑢𝑖 . Dalam sebuah deret-waktu, ini dapat dikerjakan dengan mempetakan 𝑒𝑖 ter hadap waktu, seperti dalam Gambar pola Autokorelasi (a) sampai (d) di depan. Jika residual menunjukkan pola Gambar (b), residual menyarankan bahwa sebuah trend liniir atau peubah waktu dapat dimasukkan ke dalam mo del. Jika pada residual seperti pola Gambar (d), mungkin menunjukkan bahwa peubah waktu derajat-kedua dan juga derajat -pertama sehaarusnya dimasuk kan ke dalam model. Perhatikan Tabel berikut:
147
Tahun
Y sebenar nya, %
X,%
Y yang ditak sir = 𝑌 ),%
𝑒𝑡
1960
1,3
6,2
1,592
–0,292
1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972
1,2 1,4 1,4 1,5 1,9 2,6 2,3 2,5 2,7 2,1 1,8 2,2
7,8 5,8 5,7 5,0 4,0 3,2 3,6 3,3 3,3 5,6 6,8 5,6
1,134 1,706 1,735 1,935 2,221 2,450 2,336 2,422 2,422 1,763 1,420 1,763
0,066 –0,306 –0,335 –0,435 –0,321 0,150 –0,036 0,078 0,278 0,337 0,380 0,437
Dengan memetakan residual terhadap waktu, diperoleh Gambarnya.
Dari Gambar residualnya adalah nonrandom. Sampai 1964 (kecuali 1961) residual meningkat semakin negative, sedangkan mulai 1966 (kecuali 1967) residual tadi meningkat dengan positif. Jadi ada autokorelasi positif di antara residual. (Dapat diperiksa dengan memetakan et terhadap et-1 ). Gambar di atas menunjukkan pola yang hampir siklis dalam et . Hal ini menyarankan bahwa peubah lain yang banyak secara siklis dengan Y (tingkat ke luarnya karyawan) seharusnya dikenalkan ke dalam model. Misalnya, tingkat masukkaryawan (banyak karyawan yang diterima sebagai pegawai baru per 100 karyawan), yang merupakan sebuah indicator dari permintaan untuk tenaga kerja, mungkin dikenalkan ke dalam model, karena dengan anggapan hal-hal lain tetap sama, semakin tinggi tingkat penerimaan karyawan, semakin tinggi tingkat keluernya karyawan. Metode grafik dapat dilebgkapi dengan metode analisis yang memberikan sebuah statistic uji unruk menunjukkan apakah pola nonrandom yang diamati dalam ei yang ditaksir secara statistic penting.
148
Percobaan d Durbin Watson
𝑑
=
t=N e − e t−1 t=2 t t=N e2 t=1 t
2
(179) adalah rasiojumlah kuadrat perbedaan dalam residual yang berurutan terha dap RSS.peubah yang menjelaskan Banyak observasi adalah 𝑁 − 1 karena sebuah observasi hilang dalam menda patkan perbedaan yang berurutan. Keuntungan statistic d karena didasarkan pada residual yang dita ksir, yang secara rutin dihitung dalam analisis regresi.
Asumsi dasar statistic d:
1. Model regresi mencakup unsur intersep. Perlu melakukan regresi kembali meliputi intersep untuk mendapatkan RSS. 2. Peubah yang menjelaskan, X, adalah nonstokastik, atau tetap dalam pe nyampelan berulang. 3. Gangguan ut ditimbulkan oleh skema autoregresif : 𝑢𝑡 = 𝜌𝑢𝑡−1 + 𝜀𝑡 . 4. Model regresi tidak mengandung nilai terlambat (lagged) dari peubah takbebas sebagai satu dari peubah yang menjelaskan.
Pada statistic ini, takada nilai kritis yang unik yang membawa penolakan atau penerimaan hipotesis nol yang menyatakan bahwa tidak ada korelasi derajat-pertama dalam gangguan atau disturbance ut . DURBIN dan WATSON mendapatkan batas bawah dL dan batas atas dU sedemikian sehingga jika d dihitung terletak di luar nilai kritis ini,
149
sebuah keputusan dapat dibuat mengenai adanya serial korelasi positif atau negative. Batas hanya tergantung pada banyak observasi N dan banyak peubah yang menjelaskan dan tak tergantung pada nilai yang diambil oleh peubah yangmenjelaskan ini. Limit ini, untuk N mulai dari 15 sampai 100 dalam sampel 5 peubah yang menjelaskan, telah ditabulasikan oleh Mereka dan ditabelkan. Gambar berikut menjelaskan tes yang lebih baik, menunjukkan bahwa batas d adalah 0 dan 4, sbb.:
yang
d dapat dituliskan sbb.:
𝑑=
2 −2 𝑒𝑡2 + 𝑒𝑡−1 𝑒𝑡2
𝑒 𝑡 𝑒 𝑡−1
(180)
2 Karena 𝑒𝑡2 𝑑𝑎𝑛 𝑒𝑡−1 hanya berbeda satu observasi, keduanya kira-kira sama, sehingga dituliskan
𝑒𝑡 𝑒𝑡−1 𝑒2𝑡
𝑑 ≐2 1−
(181)
f(d) Daerah keragu raguan
Daerah keragu raguan
Menolak H0 Bukti auto ko reLasi ne gatif
Menolak H0 Bukti auto koreLasi positif Menerima H0 atau H0*atau kedua-duanya
150 0
𝑑𝐿
𝑑𝑈
2
4 − 𝑑𝑈
4 − 𝑑𝐿
4
Didefinisiakn
𝜌=
𝑒𝑡 𝑒𝑡−1 𝑒2𝑡
(182)
sebagai koefisien autokorelasi derajat-pertama dari sampel, sebuah penaksir dari 𝜌 . Jadi
𝑑
≐2 1−𝜌
(182)
Jika 𝝆 = 𝟎, 𝒅 = 𝟐 ; yaitu jika tak ada serial korelasi (derajat-perta ma) d diharapkan sekitar 2. Jika 𝝆 = +𝟏 , menunjukkan korelasi positif sempurna dalam residual 𝑑 ≐ 0. Semakin dekat d ke 0, semakin besar bukti adanya serial korelasi positif. Ini jelas dari (180) karena jika ada autokorelasi positif, et akan terkelompok bersama, dan perbedaannya karena itu cenderung kecil. Dan pembilang (180) akan lebih kecil dari penyebut. Jika 𝝆 = −𝟏, terdapat korelasi negatif di antara residual yang ber urutan, 𝑑 ≐ 4 . Semakin dekat d ke 4 , semakin besar bukti adanya serial korelasi negative. Dengan (180), jika ada korelasi negatif, sebuah et cenderung diikuti et negatif dan sebaliknya sehingga 𝑒𝑡 − 𝑒𝑡−1 biasanya akan lebih besar dari 𝑒𝑡 . Jadi, pembilang d relative lebih besar dari penyebut. Mekanisme tes Durbin-Watson :
151
1. Lakukan regresi OLS dan dapatkan residual 𝑒𝑡 . 2. Hitung d dari (180). 3. Untuk ukuran sampel tertentu dan banyaknya peubah yang menjelas kan tertentu, dapatkan nilai kritis 𝑑𝐿 𝑑𝑎𝑛 𝑑𝑈 ’ 4. Jika hipotesis H0 adalah bahwa tidak ada serial korelasi positif, maka jika 𝑑 < 𝑑𝐿 ∶ 𝑡𝑜𝑙𝑎𝑘 𝐻0 𝑑 > 𝑑𝑈 ∶ 𝑡𝑒𝑟𝑖𝑚𝑎 𝐻0 𝑑𝐿 ≤ 𝑑 ≤ 𝑑𝑈 : 𝑡𝑎𝑘 𝑚𝑒𝑦𝑎𝑘𝑖𝑛𝑘𝑎𝑛 5. Jika H0 : taka da serial korelasi negatif, maka jika 𝑑 > 4 − 𝑑𝐿 ∶ 𝑡𝑜𝑙𝑎𝑘 𝐻0 𝑑 < 4 − 𝑑𝑈 ∶ 𝑡𝑒𝑟𝑖𝑚𝑎 𝐻0 4 − 𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝐿 ∶ 𝑡𝑎𝑘 𝑚𝑒𝑦𝑎𝑘𝑖𝑛𝑘𝑎𝑛 6. H0 adalah 2-ujung, bahwa tak ada serial autokorelasi baik positif ataupun negatif, maka jika
atau
𝑑 < 𝑑𝐿 ∶ 𝑡𝑜𝑙𝑎𝑘 𝐻0 𝑑 > 4 − 𝑑𝐿 ∶ 𝑡𝑜𝑙𝑎𝑘 𝐻0 𝑑𝑈 < 𝑑 < 4 − 𝑑𝑈 ∶ 𝑡𝑒𝑟𝑖𝑚𝑎 𝐻0 𝑑𝐿 ≤ 𝑑 ≤ 𝑑𝑈 tak meyakinkan 4 − 𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝐿
Kelemahan tes DW jika d jatuh dalam daerah meragukan, tak dapat menyimpulkan ada eutokorelasi apa tidak. Dalam hal ini, mencari data tambahan atau sampel berbeda. Banyaknya observasi minimum untuk DW adalah 15. Durbin telah mengembangkan statistic h untuk model autoregresif.
7.3.4 ObatPahit
Karena serial korelasi penaksir OLS jadi tak efisien.
152
Struktur Otokorelasi Diketahui
Karena gangguan 𝑢𝑡 tak teramati, sifat serial korelasi sering merupa kan soal spekulasi atau mendesak yang bersifat praktis. Diasumsikan 𝑢𝑡 mengiuti skema otoregresifderajat-satu,yi.:
𝑢𝑡 = 𝜌𝑢𝑡−1 + 𝜀𝑡
(183)
di mana 𝜌 < 1 dan di mana 𝜀𝑡 mengiuti asuksi OLS dengan nilai yang diha rapkan sama denagan nol, varians konstan, dan taka da otokorelasi, seperti dalam (166) . dengan asumsi (183) , masalah serial korelasi dapat diselesaikan secara memuaslan jika 𝜌, koefisien otokorelasi diketahui. Lihat model 2-peubah : 𝑌𝑡 = 𝛽0 + 𝛽1 𝑋𝑡 + 𝑢𝑡
(184)
Akan berlaku juga pada saat 𝑡 − 1,
𝑌𝑡−1 = 𝛽0 + 𝛽1 𝑋𝑡−1 + 𝑢𝑡−1
(185)
𝜌𝑌𝑡−1 = 𝜌𝛽0 + 𝜌𝛽1 𝑋𝑡−1 + 𝜌𝑢𝑡−1
(186)
atau
Selisih dari (184) dan (186), diperoleh
𝑌𝑡 − 𝜌𝑌𝑡−1 = 𝛽0 1 − 𝜌 + 𝑋𝑡 − 𝜌𝑋𝑡−1 𝛽1 + 𝜀𝑡 (187)
di mana 𝑣𝑡 sama dengan (183).
153
Karena 𝜀𝑡 memenuhi asumsi OLS, maka OLS dapat diterapkan pada (187). Persamaan (187) disebut persamaan beda yang digeneralisasikan. Karena prosedur ini, sebuah observasi hilang, karena observasi pertama taka da pendahulunya. Untuk mengatasinya, dibuat transformasi observasi pertama atas Y dan X sbb.: 𝑌𝑡 1 − 𝜌2 𝑑𝑎𝑛 𝑋𝑡 1 − 𝜌2
𝝆 Tidak Diketahui
Regresi perbedaan yang digeneralisasi sulit dilakukan karena 𝜌 dalam praktek diketahui. Beberapa metode :
1. Metode perbedaan pertama (the first difference method). Karena 𝜌 terletak antara 0 dan ±1 , dapat dimulai dari dua posisi ekstrim. Pada satu ekstrim dapat diasumsikan bahwa 𝜌 = 0, yaitu taka da serial korelasi, dan pada ekstrim lain memisalkan 𝜌 = ±1. Yaitu , otokorelasi positif atau negative sempurna. Saat regresi dilaksanakan, biasanya diasumsikan bahwa taka da otoko relasi dan membiarkan pengujian DW atau tes lainnya menujukkan apa kah asumsi benar. Jika, = +1 , persamaan perbedaan pertama digeneralisasi (187) sbg.: 𝑌𝑡 − 𝑌𝑡−1 = 𝑋𝑡 − 𝑋𝑡−1 𝛽1 + 𝜀𝑡 ∆𝑌𝑡 = 𝛽1 ∆𝑋𝑡 + 𝜀𝑡
(188)
∆= 𝑑𝑒𝑙𝑡𝑎, adalah operator perbedaan pertama untuk perbedaan dua nilai berurutan. 𝑀𝑖𝑠𝑎𝑙𝑘𝑎𝑛 𝑚𝑜𝑑𝑒𝑙 𝑎𝑠𝑙𝑖 : 𝑌𝑡 = 𝛽0 + 𝛽1 𝑋𝑡 + 𝛽2 𝑡 + 𝑢𝑡 (189)
154
di mana t peubah trend dan ut mengikuti skema otogregresif derajat-1. Transformasinya : ∆𝑌𝑡 = 𝛽1 ∆𝑋𝑡 + 𝛽2 + 𝜀𝑡 (189) di sini ada intersep, tapi ini hanya koefisien peubah trend. Jika 𝛽2 𝑝𝑜𝑠𝑖𝑡𝑖𝑓 berarti trend ke atas dalam Ysetelah pengaruh peubah lain. Jika, = −1 , persamaan perbedaan pertama digeneralisasi (187) sbg.: 𝑌𝑡 + 𝑌𝑡−1 = 2𝛽0 + 𝑋𝑡 + 𝑋𝑡−1 𝛽1 + 𝜀𝑡 𝑎𝑡𝑎𝑢 𝑌𝑡 + 𝑌𝑡−1 /2 = 2𝛽0 + 𝛽1 𝑋𝑡 + 𝑋𝑡−1 /2 + 𝜀𝑡 /2 (190) disebut model regresi rerata bergerak (moving average 2 periode
2. 𝜌didasarkan pada statistic DW 𝑑
≐2 1−𝜌
(182)
𝑎𝑡𝑎𝑢
𝜌 ≐1−
𝑑 2
(191)
Asumsi perbedaan pertama 𝜌 = +1 sah jika 𝑑 = 0 atau mendekati. Juga 𝑑 = 2, 𝜌 = 0 𝑑𝑎𝑛 𝑑 = 4 , 𝜌 = −1. Ini tak berlaku untuk sampel kecil. Untuk sampel kecil, THEIL dan NAGAR menyarankan hubungan :
𝜌=
𝑑 2
𝑁 2 1−
+𝑘 2
𝑁 2 −𝑘 2
(192)
k = banyak koefisien (termasuk intersep) taksiran. Setelah 𝜌 diteksir, data ditransformasi menggunakan persamaan perbedaan yang digeneralisasi kemudian OLS biasa. Oabservasi pertama harus dikalikan dengan 1 − 𝜌2 untuk menghin darkan hilangnya observasi pertama.
Contoh Diketahui
155
ln 𝐻𝑊𝐼𝑡 = 𝛽0 + 𝛽1 ln 𝑈𝑡 +𝑢𝑡 Hasil regresinya Ln 𝐻𝑊𝐼𝑡 = 3,1698 + 1,5316 ln 𝑈𝑡 0,0487 0,0719 𝑡 = 65,0883 21,3018 𝑅2 = 0,9516
𝑑 = 0,9021
Hubunngan antara indeks ingin-bantuan HWI dan tingkat pengangguran U
Tahun dan triwulan
HWI,1957-59 = 100
U,%
1962-1
104,66
5,63
2
103,53
5,46
3
97,30
5,63
4
95,96
5,60
1963-1
98,83
5,83
2
97,23
5,76
3
99,06
5,56
4
113,66
5,63
1964-1
117,00
5,46
156
2
119,66
5,26
3
124,33
5,06
4
133,00
5,06
1965-1
143,33
4,83
2
144,66
4,73
3
152,33
4,46
4
178,33
4,20
1966-1
192,00
3,83
2
186,00
3,90
3
188,00
3,86
4
193,33
3,70
1967-1
187,66
3,66
2
175,33
3,83
3
178,00
3,93
4
187,66
3,96
Asumsikan H0 adalah 𝜌 = 0. Pada tingkat penting 5% , nilai d kritis untuk 24 observasi dan 1 peubah yang menjelaskan 𝑑𝐿 = 1,27 𝑑𝑎𝑛 𝑑𝑈 = 1,45. 𝑑 𝑖𝑡𝑢𝑛𝑔 = 0,9021 < 𝑑𝐿 → 𝑡𝑜𝑙𝑎𝑘 𝐻0 → 𝑎𝑑𝑎 𝑜𝑡𝑜 𝑝𝑜𝑠𝑖𝑡𝑖𝑓. Pengobatan : Mendapatkan sebuah taksiran 𝜌 (otoregresif derajat-1) dan menggu nakannya untuk mentransformasi data dengan persamaan perbedaan yang dige neralisasi. Karena d tersedia, teknik Theil-Nagar digunakan untuk memperoleh :
157
𝜌=
0,9021 2 24 2 −22
242 1−
+22
= 0,5598
Persamaan asli ditreansformasi :
ln 𝐻𝑊𝐼𝑡 − 0,5598 ln 𝐻𝑊𝐼𝑡−1 𝑑𝑎𝑛 ln 𝑈𝑡 − 0,5598 ln 𝑈𝑡−1
Nilai pertama HWI dan U ditransformasi :
∗
1 − 0,55982 ln 𝐻𝑊𝐼𝑡 = ln 𝐻𝑊𝐼𝑡 𝑑𝑎𝑛
1 − 0,55982 ln 𝑈𝑡 = ln 𝑈𝑡
∗
Regresi peubah transformasi :
Ln 𝐻𝑊𝐼𝑡 ∗ = 1,4091 − 1,4604 ln 𝑈𝑡 ∗ 0,0487 0,0719 𝑡= 𝑅2 = 0,9516
Regresi tak kena oto, dan 1,4091
65,0883 21,3018 𝑑 = 0,9021
= 𝛽0 1 − 0,5598 → 𝛽0 = 3,2010
Soal
Otokorelasi
158
1. Dengan sebuah sampel dari 50 observasi dan 4 peubah yang menjelas kan , jelaskan otokorelasijika (a) 𝑑 = 1,05 ? (b) 𝑑 = 1,40 ? (c) 𝑑 = 2,50 ? (d) 𝑑 = 3,97 ? 2. Dalam mempelajari perubahan dalam bagian pekerja produksi dalam nilai tambah (yi, bagian tenaga kerja), GUJARATI membuat model 𝑌𝑡 = 𝛽0 + 𝛽1 𝑡 + 𝑢𝑡 𝑌𝑡 = 𝛼0 + 𝛼1 𝑡 + 𝛼2 𝑡 2 + 𝑢𝑡
Model A : Model B :
di mana Y = bagian (share) tenaga kerja dan t =waktu. Didasarkan data tahun 1949-1964, diperoleh untuk industry logam uta ma Model A : 𝑌𝑡 = 0,4529 − 0,0041𝑡 −3,9608 𝑅2 = 0,5284 𝑑𝑎𝑛 𝑑 = 0,8252
𝑌𝑡 = 0,4786 − 0,00127𝑡 + 0,0005𝑡2
Model B :
−3,2724 2,7777 𝑅2 = 0,6629 𝑑𝑎𝑛 𝑑 = 1,82
di mana angka-angka dalam kurung adalah t-rasio. (a) Apakah ada otokorelasi dalam A ? dalam B? (b) Apa penyebabnya ? (c) Ap beda otokorelasi murni dengan bias spesifikasi ? 3. Deteksi oto von NEUMAN (Pakar Game Theory), mengasumsikan bahwa residual et adalah penaksir secara random dari distribusi normal, untuk N besar, rasio 𝜎2 𝑠2
=
𝑒𝑡 −𝑒𝑡−1 2 / 𝑁−1 𝑒𝑡 −𝑒𝑡−1 2 /𝑁
Dalam OLS : 𝑒 = 0. 𝐸
𝜎2 𝑠2
𝑣𝑎𝑟
2𝑁
= 𝑁−1
𝜎2 𝑠2
= 4𝑁 2
𝑁−2 𝑁+1 𝑁−1
3
159
(a) Jika N cukup besar, bagaimana menggunakan rasio von Neuman untuk menguji oto ? (b) Bagaimana hubungan DW dan rasio ini? (c) Statistic DW terletak antara 0 dan 4, berapa batasnya untuk von Neu man (d) Rasio tergantung asumsi bahwa e adalah random dari distribusi normal, seberapa jaun ini sah untuk residual OLS ? (e) Jia dalam sebuah aplikasi rasio tadi sebesar 2,88 dengan 100 obser vasi, uji hipotesis bahwa taka da oto dalam data ! Catatan : B.I.HART telajh mentabulasi nilai kritis rasio von Neuman untuk sampel ukuran 60 observasi.
4. Estimasi 𝜌 : prosedur COCHRAN-ORCUTT skemaotoregresif derajat-1 𝑢𝑡 = 𝜌𝑢𝑡−1 + 𝜀𝑡
dengan asumsi
di mana −1 < 𝜌 < 1 dan 𝜀𝑡 memenuhi asumsi OLS, Cohran dan Or cutt menyarankan untuk menaksir 𝜌 dari residual OLS sbb.: 𝑒𝑡 = 𝜌𝑒𝑡−1 + 𝑣𝑡 yi. 𝜌=
𝑒𝑡 𝑒𝑡−1 𝑒2𝑡−1
(193) (194)
Dengan menggunakan 𝜌 yang diperoleh sebelumnya, persamaan perbe daan yang digeneralisasi (187) dapat didekati dengan 𝑌𝑡 − 𝜌𝑌𝑡−1 = 𝛽0 1 − 𝜌 + 𝑋𝑡 − 𝜌𝑋𝑡−1 𝛽1 + 𝑒𝑡
(195)
dengan tak mengetahui secara apriori𝜌 “tahap pertama “ yang dipero leh adalah taksiran “yang terbaik” dari 𝜌, Cochran –Orcutt menyaran kan untuk mendapatkan sebuah taksiran “tahap kedua” dari 𝜌 adalah sbb.: ∗ 𝑒𝑡∗ = 𝜌𝑒𝑡−1 + 𝑤𝑡 yi
𝜌=
∗ 𝑒𝑡∗ 𝑒𝑡−1 2
∗ 𝑒𝑡−1
160
di mana 𝑒 ∗ adalah residual yang diperoleh dari persamaan (195) dan 𝜌 adalah “taksiran kedua” dari 𝜌. Dengan menggunakan taksiran 2-tahap , data dapat ditransformasikan menggunakan perbedaan yang digeneralisasi. Proses iteratif ini dapat berlanjut terus sampai taksiran yang berurutan dari 𝜌 tidak banyak berbeda satu sama lainnya. (a) Apakah keuntungan prosedur Cochran-Orcutt ? (b) Bagaimana orang mengetahui bahwa 𝜌 diperoleh dalam tahap “terakhir” adalah “yang terbaik” ? 5. Menaksir 𝜌 : prosedur scanning atau pencarian dari HILDRETH-Lu Karena dalam skema otoregresif derajat-1 𝑢𝑡 = 𝜌𝑢𝑡−1 + 𝜀𝑡 diharapkan −1 < 𝜌 < +1, Hildreth-Lu menyarankan sebuah prosedur , Hildreth-Lu menyarankan sebuah prosedur “scanning” atau pencarian sistematik untuk menentukan lokasinya. Direkomendasikan untuk menyeleksi 𝜌 antara –1 dan +1 mengguna kan, misalnya 0,1 satuan interval dan mentransformasikan data dengan perbedaaan yang digeralisasi (187). Jadi dapt dipilih dari −0,9, −0,8 , … ,0,9. 𝑈𝑛𝑡𝑢𝑘 𝜌 yang dipilih dilakukan persamaan perbedaan yang digenera lisasi dan mendapatkan RSS yang bersangkutan : 𝑒𝑡2 . 𝑑𝑖sarankan memilih 𝜌 yang meminimumkan RSS .(jadi maksimumkan R2 ) . Jika pengharusan lebih lanjut diperlukan, mereka menyarankan untuk menggunakan unit interval yang lebih kecil, misalnya 0,01 𝑢𝑛𝑖𝑡 seperti −0,99, −0,98, … , 0,90, 0,91 0,92dst. (a) Apakah keutngan prodedur ini ? (b)
Bagaiman diketahui bahwa nilai 𝜌 yang akhir nya dipilih un tuk trandormasi , kenyataanya, akan menjamin 𝑒𝑡2 yang minimum ?
6. Menaksir : prosedur 2-tahap Durbin. Dengan mengasumsikan skema otoregresif derajat-1, Durbin menya rankan prosedur 2-langkah untuk memecahkan masalah serial korelasi.
161
Dalam langkah I, sebuah taksiran 𝜌 diperoleh dari persamaan-perbeda an yang digeneralisasikan (187) dengan menulisnya sbb.: 𝑌𝑡 = 𝛽0 1 − 𝜌 + 𝛽1 𝑋𝑡 + 𝜌𝛽1 𝑋𝑡−1 + 𝜌𝑌𝑡−1 + 𝜀𝑡 Jika regresi tadi dilakukan, koefisien 𝑌𝑡−1 akan memberikan sebuah taksiran, . Dengan menggunakan taksiran 𝜌 yang diperoleh tadi, dalam langkah II data ditransformasikan dengan persamaan-perbedaan yang digenerali sasikan (187) (a) Apakah kebaikan dari proses 2-langkah Durbin ? (b) Apakah 𝜌 yang diperoleh dengan cara ini nampaknya tak akan kon sisten ? (c) Apakah ada lebih dari 1 cara untuk mendapatkan 𝜌 dari persamaan tadi ? Jika demikian taksiran mana yang dipilih ? (d) Karena 𝑌𝑡−1 nilai lalu dari peubah tak bebas, muncul sebagi peubah yang menjelaskan persamaan adi, apakah regresi tadi melanggar asumsi dari model regresi liniir klasik? Jadi dapatkah persamaan ditaksir dengan OLS?
7. Given data
Y, belanja kon Sumsi personal (dlm.milyar $ Tahun 58
281,4 288,1 290,0 307,3 316,1 322,5 338,4 353,3 373,7 397,7 418,1 430,1 452,7 469,1
X,waktu
1(=1956) 2 3 4 5 6 7 8 9 10 11 12 13 14
𝑌,
Y ditaksir
yang
261,4208 276,6026 291,7844 306,9661 322,1479 337,3297 352,5115 367,6933 382,8751 398,0569 413,2386 428,4206 443,6022 458,7840
et ,residual
19,9791 11,4973 –1,7844 0,3338 –6,0479 -14,8297 –14,1115 –14,3933 –9,1751 –0,3569 4,8613 1,6795 9,0977 10,3159
162
476,9
15(=1970)
Kolom 3 diperoleh dari regresi
473,9658
2,9341
𝑌𝑡 = 𝛽0 + 𝛽1 𝑋𝑡 + 𝑢𝑡
(a) Periksa bahwa DW = 0.4147 (b) Apakah ada serial korelasi positif dlam gangguan (disturbance) ? (c) Jika demikian , taksirlah 𝜌 dengan taksiran (i) Metode Theil Nagar (ii) Prosedur 2-langkah Durbin (iii) Metode Cochran-Orcutt (d) Gunakan metode Theil-Nagar untuk mentransformasi kan data dan melakukan regesi data yang telah ditrans formasikan.
Heteroskedastisitas
1.
2.
Buktikan persamaan (141) Petunjuk : 𝑣𝑎𝑟 𝛽1 = 𝐸 𝑘𝑖 𝑢𝑖 di mana 𝑘𝑖 = 𝑥𝑖 / 𝑥𝑖2 dan 𝐸 𝑢𝑖 2 = 𝜎𝑖2
2
Pengujian homogenitas-varians BARTLETT. Misalkan ada k varians sampel yang independen 𝑠12 , 𝑠22 , … , 𝑠𝑘2 dengan 𝑑𝑓 masing-masing 𝑓1 , 𝑓2 , … , 𝑓𝑘 dari populasi yang didistribusikan secara normal dengan rerata𝜇 dan varians 𝜎𝑖2 . Selanjutnya ingin diuji 𝐻0 = 𝜎12 = 𝜎22 = ⋯ = 𝜎𝑘2 = 𝜎 2 ; yi, tiap va rians sampel adalah sebuah taksiran dari varians populasi 𝜎 2 yang sama. Jika H0 itu benar, maka
𝑠2 =
𝑘 2 𝑖=1 𝑓 𝑖 𝑠𝑖
𝑓𝑖
=
𝑘 2 𝑖=1 𝑓 𝑖 𝑠𝑖
𝑓
𝑘
𝑑𝑖 𝑚𝑎𝑛𝑎𝑓 = 𝑖=1
𝑓𝑖
memberikan sebuah taksiran dari taksiran varians populasi bersama (pooled) 𝜎 2 .
163
Bartlett telah menunjukkan bahwa H0 dapat diuji dengan rasio 𝐴/𝐵, yang didistribusikan mendekati 𝜒 2 dengan 𝑑𝑓 = 𝑘 − 1, di mana 𝐴 = 𝑓 ln 𝑠 2 − 𝐵 =1+
𝑓𝑖 ln 𝑠𝑖2
1
1
3 𝑘−1
𝑓𝑖
−
1 𝑓
Terapkan uji artlett untuk data Tabel berikut untuk uji hipotesis bahwa varians populasi dari kompensasi karyawan adalah sama untuk tiap ukuran (besarnya) karyawan dari perusahaan. Petunjuk:df untuk tiap varians sampel adalah 9. Kompensasi tiap karyawan ($) dalam industry barang-barang Tidak tahan lama sesuai dengan besarnya kesempatan kerja dari perusahaan Banyak kesempatan kerja (rerata banyak Tenaga kerja) Industri 1-4 5-9 10-19 20-49 50-99 Produk makanan dan yang sejenis
2994
3295
3565
3907
4189
Produk tembakau
1721
2057
3336
3320
2980
Produk pabrik tekstil
3600
3657
3674
3437
3340
Produk pakaian dan yang berhubungan
3494
3787
3533
3215
3030
Produk kertas dan yang berhubungan
3498
3847
3913
4135
4445
Percetakan dan pener
3611
4206
4695
5083
5301
bitan Produk kimia dan yang berhubungan
3875
4660
4930
5005
5114
Produk minyak dan batubara
4616
5181
5317
5337
5421
Produk karet dan plastik
3538
3984
4014
4287
4221
164
Produk kulit
3016
3196
3149
3317
3413
Kompensasi rerata Standar deviasi Produksi rerata
3396 743,7 9355
3787 851,4 8584
4013 727,8 7962
4104 746,3 8275
4146 929,9 8389
100249
3.
250499
500999
10002499
4486 2848 3334 2834 4885 5269 5248 5710 4539 3254
4676 3072 3225 2750 5132 5182 5630 6316 4721 3177
4968 2969 3163 2967 5342 5395 5870 6455 4905 3346
5342 3822 3168 3453 5326 5552 5876 6347 5481 4067
4241 1080,6 9418
4387 1243,2 9795
4538 1307,7 10281
4843 1112,5 11750
Dapatkah ditaksir parameter dari model 𝑒𝑖 =
𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖
𝑒𝑖 =
𝛽0 + 𝛽1 𝑋𝑖2 + 𝑣𝑖
dengan metode least-square yang biasa (OLS)? Jika tidak, adakah sebuah metode?
4.
Data Tabel berikut berkenaan debngan gaji rerata ahli ekonomi wanita dan pria sesuai dengan bidang spesialis tahun 1964. (a) Dapatkan rerata gaji dan deviasi standar dari gaji kedua kelompok ahli ekonomi tadi. (b) Adakah perbedaan yang penting antara kedua deviasi standar tadi? (gunakan uji Bartlett).
165
(c) Misalkan ingin diramalkan gaji rerata ahli ekonomi pria dari gaji rerata dari ahli ekonomi wanita . Kembangkan sebuah regresi liniir yang sesuai untuk maksud ini. Jika diharapkan model heteroskedastisitas dalam model itu, bagai mana menanganinya ?
Belanja an,dst.
5.
perusaha
Gaji rerata (dalam $000) Wanita Pria 9,3
13,0
Ekonomi tenaga Kerja Moneter-fiskal Teori ekonomi Umu Populasi,program kesejahteraan,dst
10,3
12,0
8,0 8,7
11,6 10,8
12,0
11,5
System ekonomi Dan pembangunan
9,0
12,2
Data berikut menyajikan rerata produktivitas tenaga kerja dan deviasi standar dari produktivitas tenaga kerja untuk 9 kelas jumlah karya wan seperti Tabel dalam soal no.2 Besarnya karyawan (banyak karyawan) 1-4 5-9 10-19 20-49 50-99 100-249 250-499 500-999 1000-2499
(a)
Rerata produktivitas, $
Deviasi standar dari produktivitas, $
9355 8584 7962 8275 8389 9418 9795 10.281 11.750
2487 2642 3055 2706 3119 4493 4910 5893 5550
Petakan produktivitas rerata terhadap deviasi standar dari pro duktivitas
166
(b) Apakah digram pencar menyarankan bahwa sebuah model dan jenisnya spt. berikut cocok dengan data ? 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
(c)
6.
di mana Y =deviasi stndar, X = rerata produktivitas, i = kelas karyawan . Apa dapat dikatakan mengenai sifat heteroskedastisitas, jika ada dalam data tadi ?
Untuk data yang diberikan dalam Tabel pada soal no.2, lakukan regresi rerata kompensasi Y terhadap rerata produktivitas X, dengan memperlakukan besarnya jumlah karyawan sebagai satuan observasi dan interpretasikan hasilnya, dan periksa hasilnya bandingkan de ngan yang diberikan dalam contoh Uji Park pada halaman 123. (a) dari regresi tsdi dsptksn residual ei (b) regresikan ei terhadap Yi . Jika ada hubungan yang penting antara keduanya , apa yang dapat disimpulkan ? (c) mengikuti uji Park, regresikan ln 𝑒𝑖2 𝑡𝑒𝑟𝑎𝑑𝑎𝑝 ln 𝑋𝑖 dan periksa dengan regresi pada halaman 124. (d) Mengikuti pendekatan Glejser, regresikan 𝑒𝑖 terhadap Xi dan kemudian regresikan 𝑒𝑖 terhadap 𝑋𝑖 dan komentari hasilnya. (e) Dapatkan rank korelasi antara 𝑒𝑖 dan 𝑋𝑖 dan berikan komentar tentang sifat heteroskedastisitas, jika ada.
Multikoliniir
1. Jika hubungan 𝜆1 𝑋1𝑖 + 𝜆2 𝑋2𝑖 + 𝜆3 𝑋3𝑖 = 0 berlaku untuk semua nilai 𝜆1 , 𝜆2 𝑑𝑎𝑛 𝜆3 taksirlah 𝑟12,3 , 𝑟13,2 𝑑𝑎𝑛 𝑟23,1 . Dapatkan juga 2 2 2 𝑅1,23 , 𝑅12,3 , 𝑅13,2 , Bagaimana tingkat multikoliniir dalam situasi tsb?
2. Buktikan persamaan (132b). Petunjuk : bagi pembilang dan penyebut (132a) dengan 2 𝑥2𝑖
2 𝑥3𝑖
167
3. Misalnya dalam model 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑢𝑖 𝑟23 ,koefisien korelasi antara X2 dan X3 adalah nol. Jadi disarankan untuk melakukan regresi sbb.: 𝑌𝑖 = 𝛼1 + 𝛼2 𝑋2𝑖 + 𝑢1𝑖 𝑌𝑖 = 𝛾1 + 𝛾3 𝑋3𝑖 + 𝑢2𝑖 (a) Akankah 𝛼2 = 𝛽2 𝑑𝑎𝑛 𝛾3 = 𝛽3 ? (b) Akankah 𝛼1 = 𝛽1 𝑑𝑎𝑛 𝛾1 = 𝛽1 , atau kombinasinya? (c) Akankah 𝑣𝑎𝑟 𝛽2 = 𝑣𝑎𝑟 𝛼2 𝑑𝑎𝑛 𝑣𝑎𝑟 𝛽3 = 𝑣𝑎𝑟 𝛾3 4. Dalam data yang menyangkut deretan-waktu ekonomis seperti GNP, penawaran uang, harga, pendapatan, pengangguran, dst., multikoliniritas biasanya dicurigai, mengapa ? 5. KLEIN dan GOLDBERGER mencoba mencocokkan model regresi terhadap ekonomi AS: 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝛽4 𝑋4𝑖 + 𝑢𝑖 di mana Y = konsumsi, X2 = pendapatan upah, X3 = pendapatan non upah dan non pertanian, dan X4 = pendapatan pertanian. Tapi karena 𝑋2 , 𝑋3 , 𝑋4 diperkirakan sangat berkorelasi, mereka menda patkan taksiran 𝛽3 = 0,75𝛽2 𝑑𝑎𝑛 𝛽4 = 0,625𝛽2 . Dengan menggunakan taksiran ini mereka memformulasikan kembali fungsi konsumsi sbb.: 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 0,75𝑋3𝑖 + 0,625𝑋4𝑖 + 𝑢𝑖 = 𝛽1 + 𝛽2 𝑍𝑖 + 𝑢𝑖 (a) Cocokkan model yang telah dimodifikasikan terhadap data berikut dan dapatkan taksiran 𝛽1 𝑠𝑎𝑚𝑝𝑎𝑖 𝛽4 . (b) Bagaimana menginterpretsiakan peubah Z ? Tahun 1936 1937 1938 1939 1940 1941 1945
Y
X2 62,8 65,0 63,9 67,5 71,3 76,6 86,1
X3 43,41 46,44 44,38 47,82 51,02 58,71 87,69
X4 17,10 18,65 17,09 19,28 23,24 28,11 30,29
3,96 5,48 4,37 4,51 4,88 6,37 8,96
168
Tahun 1946 1947 1948 1949 1950 1951 1952
Y
X2 95,7 98,3 100,3 103,2 108,9 108,5 111,4
X3 76,73 75,91 77,62 78,01 83,57 90,59 95,47
X4 28,26 27,91 32,30 31,39 35,61 37,58 35,17
9,36 9,31 9,85 7,21 7,39 7.08 7,42
REFERENCES
Greene.2003.Econometrics Analysis.Internatioanl Edition.5th.Prentice Hall Gujarati.2003.Basic Econometrics.Internatioanl Edition.St.Louis. Judge.Griffits.Hill.Luthkepohl.Lee.1985.The Theory and Practice of Econo nometrics.2nd.Wiley Series in Probability and Mathematical Statistics.New York. Nazir.1999/Metode Penelitian.Ghalia Indonesia. Jl.Durung 98B Medan. Ramanathan.1995.Introductory Econometrics.3rd.Internatioanl Edition. Dryden Press.Montreal.
169
CURICULUMVITAE Identitas
:
Nama Lahir Pendidikan
: Sopar M.H. : 19 Pebruari 1967di Balik Papan , Kaltim. :
1. 2. 3. Pekerjaan
IKIP NEGERI MEDAN/SARJANA PENDIDIKAN MATEMATIKA/TAMAT 1991 UNSYIAH BANDA ACEH /MAGISTER EKONOMI / TAMAT 2005 UNPAD BANDUNG/PROGRAM DOKTOR SAINS EKONOMI/MASUK 2005 :
SAINS
Dosen PNS KOOPERTIS WIL. I SUMUT-NAD sejak tahun 1994
Pengalaman yang Pernah Diemban
:
1. Dosen MATEMATIKA ASTRONOMI, MATEMATI KA TEHNIK, MATEMATIKA EKONOMI Akademi Maritim Belawan (AMB), Medan, Tahun 2001 – 2005. 2. Dosen MATEMATIKA EKONOMI , EKONOMI MIKRO,EKONOMIMAKRO di Universitas HKBP NOMMENSEN, UHN Medan , 2012 – sekarang . Jabatan
: Sekretaris PPL (Program Pengalaman Lapangan ) FKIP HKBP NOMMENSEN MEDAN sampai 2014. Sekretaris Prodi Ekonomi FKIP NOM MENSEN MEDAN (Sekarang).
170
Riset
: Computable General Equilibrium. PemanasanGlobalIndonesia.2005. Crowding OutMakroekonometrik Karo .2014. Model Makroekonometrik Tapanuli Era OTDA.2014. Riset Dasar Makroekonometrik Panel PertanianPakpakDari Era OTDA.2016. Model Makroekonomi Pembangunan Simalungun : Kemiskinan Multidimensi .2016.
171
172