BAB II TINJAUAN PUSTAKA 2.1. Statistik Inferensia Tujuan statistik pada dasarnya adalah melakukan deskripsi terhadap data sampel, kemudian melakukan inferensi terhadap data populasi berdasarkan pada informasi yang ada di dalam data sampel. Inferensi statistik dapat dibedakan menjadi dua yaitu estimasi parameter dan uji hipotesis. Estimasi parameter dibedakan menjadi dua yaitu estimasi parameter titik dan estimasi parameter berupa interval. Inferensi statistik dapat dicari dengan metode klasik dan metode Bayes (Walpole dan Myers, 1995). Dalam pendekatan klasik, parameter merupakan suatu nilai yang konstan, dimana parameter adalah sebuah peluang sampel dari populasi (Raudenbush dan Bryk, 2002). Pada perspektif Bayesian, parameter merupakan suatu pola yang memiliki distribusi sendiri, dan distribusi ini menggambarkan ketidakpastian peneliti terhadap nilai parameter. Teori inferensi mengenai estimasi parameter dengan metode klasik sering menganggap bahwa model yang benar mengenai sekumpulan data telah diketahui dan ditentukan sebelum estimasi. Sebuah model dapat dirumuskan dari sekumpulan data yang umumnya memiliki puluhan bahkan ratusan model yang mungkin terbentuk. Metode klasik biasanya memilih satu model terbaik, meskipun model-model lain hampir sama-sama baik namun memberikan kesimpulan yang berbeda. Metode klasik merumuskan model yang didasarkan sepenuhnya pada informasi yang diperoleh melalui sampel, ini dapat menghasilkan error yang besar karena data sampel yang diambil terlalu sedikit, akibatnya inferensi yang dihasilkan nantinya kurang baik. Ketidakpastian dalam pemilihan model seperti ini sering terjadi dalam fenomena-fenomena nyata. Dan dalam berbagai penelitian sering ditemui masalah ketidakpastian tentang variabel apa saja yang akan dimasukkan ke dalam model statistik. Dalam penelitian yang menggunakan metode regresi misalnya, ketidakpastian model tidak dipertimbangkan dalam memilih model
7
yang terbaik. Pemilihan model seperti itu memungkinkan terjadinya estimasi yang kurang tepat dalam pemilihan model tersebut. Sehingga kesimpulan dan keputusan dari pendekatan tersebut beresiko dan bias. Biasanya ada tiga penyebab ketidakpastian dalam setiap masalah, yaitu ketidakpastian tentang struktur model, ketidakpastian tentang perkiraan parameter model, variasi acak yang tidak jelas mengenai variabel yang diamati. Ketidakpastian tentang struktur model dapat muncul dalam cara yang berbeda, seperti kesalahan spesifikasi model (misalnya menghilangkan variabel karena kesalahan), penentuan klasifikasi model, dan pemilihan antara dua atau lebih model dengan struktur yang sangat berbeda (Chatfield, 1995). Untuk mengatasi ketidakpastian model tersebut, akan lebih baik jika data yang digunakan adalah data gabungan antara data sampel saat ini dengan data prior. Penggabungan data dilakukan dengan tujuan untuk meminimalkan tingkat kesalahan sehingga inferensi yang dihasilkan mendekati sempurna. Metode inferensi dengan menggunakan data sampel dan data prior disebut dengan metode bayes.
2.2. Bayesian Model Averaging (BMA) BMA adalah sebuah metode yang mengatasi ketidakpastian model dalam berbagai bidang terapan ilmu pengetahuan. Dalam melakukan pemilihan model terbaik yang melibatkan ketidakpastian model, BMA merata-ratakan distribusi posterior dari semua model yang mungkin terbentuk, sehingga dapat menentukan variabel mana saja yang relevan dengan data yang ada. BMA dapat digunakan ketika ada berbagai model yang layak secara statistik tetapi kebanyakan dari model tersebut memberikan kesimpulan yang berbeda mengenai karakteristik data yang diteliti. BMA fokus pada regresor mana yang akan masuk dalam analisis. Kelebihan BMA yaitu dapat menentukan model secara cepat, menjelaskan dan menentukan variabel-variabel penentu yang memiliki nilai likelihood tinggi secara mendalam. Misalkan ada sebuah model regresi, diberikan y sebagai variabel
8
dependent, αγ konstanta, βγ koefisien, dan ε adalah galat berdistribusi normal dengan varian σ γ :
y = αγ + Xγ βγ + ε , dimana ε ∼ N ( 0, σ 2 I )
(1)
Pemilihan variabel prediktor adalah bagian dasar dari membangun sebuah model regresi linier. Muncul permasalahan ketika ada beberapa variabel yang berpotensi mempengaruhi y dalam matriks X . Variabel
X γ ∈ { X } manakah yang harus dimasukkan ke dalam model? Dan seberapa penting variabel tersebut? Pendekatan single linear model dengan memasukkan semua variabel tidak efisien atau bahkan tidak mungkin dilakukan dengan observasi yang terbatas. BMA mengatasi permasalahan ini dengan mengestimasi semua kombinasi model yang memungkinkan dari
{ X } dan merancang rata-rata terboboti dari semuanya. Setiap model memiliki bobot dan estimasi akhir dibangun dari rata-rata terboboti dari estimasi parameter setiap model. Bobot tersebut merupakan keistimewaan estimasi menggunakan BMA. Tujuan dari BMA adalah menggabungkan model-model yang tidak pasti sehingga didapat satu model yang terbaik. Misalkan terdapat p variabel independent, maka jumlah model yang terbentuk sebanyak q = 2 p model (dengan asumsi bahwa tidak ada interaksi diantara variabel independent). Jika
M = M1 , M 2 ,..., M p adalah model yang mungkin terbentuk dan ∆ adalah nilai yang akan diprediksi maka distribusi probabilitas prior dari parameter model
β dan σ 2 diasumsikan M k ∼ π ( M k ) dan vektor parameter model dihasilkan dari
(θ
k
distribusi
bersyarat
(σ
2
| M k ) ∼ π (σ 2 | M k )
dan
| σ 2 , M k ) ∼ π (θ | M k , σ 2 ) . Distribusi posterior dari ∆ jika diketahui data
Y ditulis dalam persamaan sebagai berikut
Pr ( ∆ | Y ) = ∑ k =1 Pr ( ∆ | M k , Y )Pr ( M k | Y ) q
9
(2)
Dimana q menunjukkan jumlah dari semua model yang mungkin terbentuk. Distribusi posterior dari Δ jika diketahui Y adalah rata-rata dari distribusi posterior jika diketahui model diboboti oleh probabilitas model posterior. Probabilitas posterior dari model M k adalah sebagai berikut
Pr ( M k |Y ) =
Pr (Y | M k ) Pr ( M k )
∑
q
Pr (Y | M l ) Pr ( M l ) l=1
(3)
dimana Pr (Y | M k ) = ∫ Pr (Y | θ k , M k ) Pr (θ k | M k ) dθ k
(4)
adalah marjinal likelihood dari model M k , Pr (θ k | M k ) adalah densitas prior dari θk jika diketahui model M k , Pr (Y | M k ) adalah probabilitas prior jika model M k . Semua probabilitas secara implisit bergantung pada model M sehingga nilai ekspektasi dari koefisien Δ didapat dengan merata-ratakan model M
E ( ∆ | Y ) = ∑ k =1 Pr ( M k | Y ) E ( ∆ | M k , Y ) q
(5)
E ( ∆ | Y ) menunjukkan nilai ekspektasi terboboti dari ∆ disetiap model kombinasi yang mungkin (bobot ditentukan oleh prior dan model). Kriteria untuk menentukan variabel independent termasuk variabel yang signifikan atau tidak dalam model adalah berdasarkan persentase probabilitas posterior yang dihasilkan pada setiap variabel independent. Jika Pr[β1≠0|D] kurang dari 50% maka tidak ada bukti yang kuat untuk X1 menjadi faktor penyebab. Jika diantara 50%-75% maka ada bukti yang lemah untuk menyatakan X1 sebagai faktor penyebab, jika diantara 75%-95% maka ada bukti yang cukup kuat, antara 95%-99% menunjukkan bahwa terdapat bukti yang kuat, dan jika lebih dari 99% maka bukti yang ada sangat kuat, (Jeffreys, 1961).
10
2.3. Metode Occam’s Window Dalam mendapatkan model terbaiknya, BMA akan memilih model mana yang masuk dalam persamaan (2) berdasarkan probabilitas posterior dari sejumlah q = 2 p model yang terbentuk. Ada beberapa metode yang dapat digunakan dalam pemilihan model tersebut, diantaranya adalah Bayesian Information Criterion (BIC), Bayes Factor, dan Occam’s Window. Dalam pemilihan modelnya BIC berguna untuk membandingkan satu model dengan model yang lainnya. BIC hanya membandingkan M 1 dan M 2 dengan membandingkan BIC difference-nya, dimana model yang memiliki BIC difference lebih kecil akan digunakan, sedangkan model yang memiliki BIC difference yang lebih besar akan dieliminasi. Bayes Factor juga menggunakan prinsip yang sama dengan BIC, yaitu membandingkan M 1 dan
M 2 kemudian mengeliminasi salah satu diantaranya. Hanya saja Bayes Factor melihat nilai Bayes Factor sebagai perbandingannya. Berikut adalah nilai value yang sesuai dengan nilai-nilai Bayes Factor, BIC dan Probabilitas Posterior. Tabel 2.1 Nilai value Bayes Factor, BIC dan Probabilitas Posterior. BIC Difference
Bayes Factor
Pr ( M k | Y )( %)
Signifikansi
0-2
1-3
50-75
Lemah
2-6
3-20
75-95
Positif
6-10
20-150
95-99
Kuat
>10
>150
>99
Sangat Kuat
Metode occam’s window adalah salah satu metode yang digunakan dalam menyeleksi model yang masuk berdasarkan probabilitas posteriornya. Occam’s window digunakan ketika membandingkan banyak model
{M1, M 2 ,......, M k } dan
tidak hanya membandingkan dua model. Disinilah
kelebihan dari occam’s window dibandingkan metode yang lainnya, metode ini dapat diandalkan untuk menyeleksi model yang masuk persamaan dengan
11
jumlah yang banyak. Model yang diterima dengan metode occam’s window memenuhi persamaan berikut. A' = Mk :
maxl {Pr ( M l | Y )} Pr ( M k | Y )
(6)
≤c
dengan nilai c adalah 20. Nilai c tersebut setara dengan alfa 0.05 untuk p-value (Jeffreys, 1961). Jeffreys menyarankan menggunakan nilai c antara 10 sampai 100, sedangkan Evett (1991) menggunakan nilai c sebesar 1000 untuk menyeleksi model yang masuk pemodelan bukti forensik dalam kasus pidana. Nilai c yang digunakan tergantung pada konteks pemodelan. Model dikeluarkan dari persamaan 2 jika probabilitas model posterior lebih besar dari nilai c. Kemudian dari model-model yang masuk dalam persamaan (2) akan dipilih 5 (lima) model terbaik berdasarkan probabilitas model posterior (PMP) tertinggi.
Pr ( M k | Y ) digunakan sebagai ukuran seberapa baik model memprediksi data. Dengan cara ini, likelihood yang terboboti oleh probabilitas model prior p ( M k ) diasumsikan untuk mencerminkan data di masa lalu. Cara ini menghasilkan gabungan probabilitas prediksi yang baik untuk data masa lalu dan data masa sekarang.
2.4. Kesalahan Prediksi Kesalahan
prediksi
digunakan
untuk
mengetahui
tingkat
keakuratan dari hasil yang diperoleh. Kesalahan prediksi bisa diketahui melalui selang kepercayaan untuk dugaan nilai y. Selang kepercayaan tersebut menyediakan informasi mengenai nilai yang mungkin terhadap proporsi sesungguhnya dari data yang diteliti. Informasi yang terdapat pada selang kepercayaan adalah rentang perkiraan nilai-nilai yang kemungkinan akan mencakup parameter populasi yang tidak diketahui. Hasil selang kepercayaan dikatakan baik jika banyak nilai y (pengamatan) yang masuk dalam selang. Perkiraan rentang ini dihitung dari himpunan data sampel.
12
Selang kepercayaan 95% untuk memprediksi y (pengamatan) baru adalah sebagai berikut. yˆ − t
α
1− , n − p −1 2
SE < y < yˆ + t
α
1− , n − p −1 2
SE
(7)
Dimana y merupakan proporsi dari sampel, n adalah banyaknya sampel yang diteliti. Apabila setiap nilai y (pengamatan) masuk dalam selang, maka dugaan untuk nilai y benar. Selang kepercayaan ini lebih memberikan informasi daripada hipotesis sederhana hasil tes. Karena selang kepercayaan telah menyediakan serangkaian nilai-nilai yang masuk akal untuk parameter yang tidak diketahui.
2.5. Pertumbuhan Ekonomi Pengertian pertumbuhan ekonomi sudah banyak didefinisikan melalui sudut pandang yang berbeda dari para ekonom. Suryana (2000) mengemukakan bahwa pertumbuhan ekonomi merupakan kenaikan Gross Domestic Bruto (GDP) tanpa memandang bahwa kenaikan itu lebih besar atau lebih kecil dari pertumbuhan penduduk dan tanpa memandang apakah ada perubahan dalam struktur ekonominya. Sedangkan menurut Samuelson (1996), pertumbuhan ekonomi menunjukkan adanya
perluasan atau
peningkatan dari GDP potensial/output dari suatu negara. Berdasarkan dua pengertian pertumbuhan ekonomi tersebut, dapat disimpulkan bahwa pertumbuhan ekonomi terletak dalam perubahan GDP atau Produk Domestik Bruto (PDB), dan pertumbuhan ekonomi tidak dapat diukur secara langsung, melainkan harus diketahui indikator PDB. Begitu pula untuk mengetahui laju pertumbuhan ekonomi di suatu wilayah/provinsi, harus diketahui indikator Produk Domestik Regional Bruto (PDRB). Adapun cara untuk menghitung laju pertumbuhan ekonomi pada suatu wilayah/provinsi berdasarkan konsep PDRB adalah sebagai berikut:
gt =
PDRBt − PDRBt −1 × 100% PDRBt −1
13
(8)
Dimana
gt
adalah
laju
pertumbuhan
ekonomi
suatu
wilayah/provinsi pada tahun t, P D RBt adalah besarnya PDRB pada tahun ke t, dan PDRBt −1 adalah besarnya PDRB pada tahun t-1. Teknik perhitungan laju pertumbuhan ekonomi semacam inilah yang paling banyak digunakan oleh
setiap
instansi-instansi,
lembaga-lembaga,
badan-badan
resmi
pemerintah maupun swasta. Dalam penyajiannya PDRB disusun dalam dua bentuk, yaitu PDRB atas dasar harga konstan dan PDRB atas dasar harga berlaku. Menurut Badan Pusat Statistik (BPS) pengertian PDRB atas dasar harga konstan yaitu jumlah nilai produksi atau pengeluaran atau pendapatan yang dihitung menurut harga tetap, sedangkan PDRB atas dasar harga berlaku adalah jumlah nilai tambah bruto yang timbul dari seluruh sektor perekonomian di suatu wilayah. PDRB atas dasar harga konstan digunakan untuk mengetahui pertumbuhan ekonomi dari tahun ke tahun (Sukirno, 2000), sedangkan menurut BPS PDRB atas dasar harga berlaku digunakan untuk menunjukkan besarnya struktur perekonomian dan peranan sektor ekonomi. Dalam menghitung PDRB, ada tiga pendekatan yang kerap digunakan, yaitu: 1. Menurut Pendekatan Produksi Dalam pendekatan ini PDRB adalah jumlah nilai barang dan jasa akhir yang dihasilkan oleh berbagai unit produksi di suatu wilayah dalam jangka waktu tertentu. Unit produksi dalam penyajiannya dikelompokkan dalam 9 (sembilan) sektor atau lapangan usaha, yaitu pertanian, pertambangan dan penggalian, industri pengolahan, listrik gas dan air bersih, bangunan, perdagangan hotel dan restoran, pengangkutan dan komunikasi, jasa keuangan persewaan dan perusahaan, serta jasa-jasa. 2. Menurut Pendekatan Pendapatan Menurut pendekatan pendapatan, PDRB adalah penjumlahan semua komponen permintaan terakhir, yaitu: pengeluaran konsumsi rumah tangga dan lembaga swasta yang tidak mencari untung, konsumsi pemerintah, pembentukan modal tetap domestik bruto, perubahan stok,
14
ekspor neto dalam jangka waktu tertentu (biasanya satu tahun). Ekspor neto adalah ekspor dikurangi impor. 3. Menurut Pendekatan Pengeluaran Menurut pendekatan pengeluaran, PDRB merupakan jumlah balas jasa yang diterima oleh faktor produksi yang ikut serta dalam proses produksi di suatu wilayah dalam jangka waktu tertentu (biasanya satu tahun). Balas jasa faktor produksi yang dimaksud adalah upah dan gaji, sewa tanah, bunga modal dan keuntungan. Semua hitungan tersebut sebelum dipotong pajak penghasilan dan pajak langsung lainnya.
Dari
tiga
pendekatan
tersebut,
penelitian
ini
akan
lebih
berkonsentrasi pada PDRB menurut pendekatan produksi. Mengingat data mengenai komponen PDRB menurut pendekatan tersebut relatif lebih mudah didapatkan dan lebih terklasifikasi dengan baik ke dalam 9 sektor atau lapangan usaha. Setelah mendapatkan indikator utama laju pertumbuhan ekonomi, yaitu PDRB beserta pendekatannya, akan disusun variabel-variabel yang diduga mampu mewakili kondisi PDRB dengan pendekatan produksi. Penyusunan variabel-variabel tersebut diharapkan mampu membentuk model laju pertumbuhan ekonomi, yaitu variabel-variabel sebagai berikut: 1. Pertanian. 2. Pertambangan dan Penggalian. 3. Industri Pengolahan. 4. Listrik, Gas, dan Air Bersih. 5. Konstruksi. 6. Perdagangan, Hotel, dan Restoran. 7. Pengangkutan dan Komunikasi. 8. Keuangan, Persewaan, dan Jasa Perusahaan. 9. Jasa-jasa.
15