PROSIDING
ISBN : 978-979-16353-8-7
S-6 PENERAPAN MODEL REGRESI LINIER BAYESIAN UNTUK MENGESTIMASI PARAMETER DAN INTERVAL KREDIBEL Vania Mutiarani1, Adi Setiawan2, Hanna Arini Parhusip3 1
Mahasiswa Program Studi Matematika FSM UKSW 2, 3 Dosen Program Studi Matematika FSM UKSW
e-mail:
[email protected],
[email protected], 3
[email protected] Abstrak Dalam penelitian statistik, sering diselidiki hubungan antara dua atau lebih variabel, apakah ada hubungan sebab-akibat atau tidak. Pada paper ini, data yang diambil adalah data SUSENAS tahun 2011 dari BPS Salatiga yaitu pendapatan dan pengeluaran masyarakat Salatiga dengan sampel ๐ = 30 sehingga akan diselidiki hubungan antara pendapatan sebagai variabel Y dengan pengeluaran sebagai variabel X. Hubungan sebab-akibat tersebut dapat membentuk garis regresi berbentuk linier yang tidak dapat ditentukan secara tepat, sehingga diperlukan taksiran parameter untuk model regresi linier. Untuk mengestimasi parameter tersebut digunakan model regresi linier Bayesian yaitu dengan distribusi prior konjugat ๐ ๐ท, ๐ 2 = ๐ ๐ 2 ๐ ๐ท ๐ 2 dengan ๐ ๐ 2 ~Inv โ Gamma(๐0 , ๐0 ) dan ๐ ๐ท ๐ 2 ~๐(๐0 , ๐ 2 ๐ฒโ1 0 ) dan distribusi posterior ๐(๐ท, ๐ 2 |๐ฒ, ๐) โ ๐ ๐ 2 |๐ฒ, ๐ ๐(๐ท|๐ 2 , ๐ฒ, ๐) dengan ๐ ๐ 2 |๐ฒ, ๐ ~Inv โ Gamma(๐๐ , ๐๐ ) dan ๐(๐ท|๐ 2 , ๐ฒ, ๐)~๐(๐๐ , ๐ 2 ๐ T ๐ + ๐ฒ0 โ1 ) . Kemudian dirancang rantai Markov dari distribusi posterior dengan Gibbs sampling sebanyak 5000 iterasi dan diperoleh taksiran parameter yang merupakan rata-rata dari nilai Gibbs sampler yaitu ๐ 2 = 0.005718 , ๐ฝ0 = 2.101 dan ๐ฝ1 = 0.708 . Dari nilai-nilai Gibbs sampler yang telah didapatkan, dihasilkan fungsi densitas untuk masing-masing parameter sehingga interval kepercayaan Bayesian (interval kredibel) 95% untuk taksiran parameter ๐ 2 adalah (0.003384, 0.009659), untuk ๐ฝ0 yaitu (1.607, 2.601) dan (0.6282, 0.7879) untuk parameter ๐ฝ1 . Kata kunci: model regresi linier Bayesian, estimasi parameter, interval kredibel
I. PENDAHULUAN I.1. Latar Belakang Dalam penelitian statistik, sering diselidiki hubungan antara dua atau lebih variabel, apakah ada hubungan sebab-akibat atau tidak. Analisis regresi linier adalah salah satu bagian dari statistik yang merupakan suatu analisis terhadap persamaan regresi dimana hubungan variabel independen dan dependen berbentuk garis lurus (Sembiring, 2003). Garis lurus tersebut disebut juga garis regresi yang tidak dapat ditentukan secara tepat, sehingga diperlukan taksiran parameter untuk model regresi linier. Metode yang biasa digunakan untuk mengestimasi parameter adalah metode kuadrat terkecil. Namun ada cara lain, yaitu menggunakan model regresi linier Bayesian. Dalam statistik, regresi linier Bayesian merupakan pendekatan untuk regresi linier dimana analisis statistik yang dilakukan dalam konteks inferensi Bayesian (Web 1). Makalah dipresentasikan dalam Seminar Nasional Matematika dan Pendidikan Matematika dengan tema โ Kontribusi Pendidikan Matematika dan Matematika dalam Membangun Karakter Guru dan Siswa" pada tanggal 10 November 2012 di Jurusan Pendidikan Matematika FMIPA UNY
PROSIDING
ISBN : 978-979-16353-8-7
Untuk mendapatkan taksiran parameter, dirancang rantai Markov dari distribusi posterior dengan bantuan Gibbs sampling. Interval kepercayaan adalah suatu kisaran nilai yang dianggap mengandung nilai parameter populasi yang sebenarnya (Fauzy, 2008). Interval kepercayaan dapat digunakan sebagai taksiran suatu parameter dan dapat pula dipandang sebagai pengujian hipotesis, yaitu apakah suatu parameter sama dengan suatu nilai tertentu (Sembiring, 2003). Dalam statistik Bayesian, interval kepercayaan Bayesian (interval kredibel) merupakan interval di dalam domain dari distribusi probabilitas posterior yang digunakan untuk penaksiran interval (Web 2). Dalam penelitian ini akan dijelaskan bagaimana penerapan model regresi linier Bayesian untuk mengestimasi parameter dan interval kepercayaan Bayesian (interval kredibel) dengan mengambil data SUSENAS (Survey Sosial Ekonomi Nasional) tahun 2011 dari BPS Salatiga yaitu pendapatan dan pengeluaran masyarakat Salatiga dengan sampel ๐ = 30. II. DASAR TEORI II.1. Regresi Linier Bayesian Dalam statistik, regresi linier Bayesian merupakan pendekatan untuk regresi linier dimana analisis statistik yang dilakukan dalam konteks inferensi Bayesian (Web 1). Saat model regresi memiliki error yang berdistribusi normal, dan jika bentuk khusus dari distribusi prior diasumsikan, hasil eksplisit tersedia untuk distribusi probabilitas posterior dari parameter model. II.2. Model Dalam konteks model regresi linier, ๐ฒ disebut sebagai variabel dependen, dan ๐ variabel independen. Dalam notasi matriks, sistem ini dapat ditulis sebagai (Lancaster, 2003) ๐ฒ = ๐๐ท + ๐ (1) dengan ๐ฒ adalah vektor kolom, untuk pengamatan ๐ = 1, โฆ , ๐ dipunyai nilai ๐ฆ; ๐ adalah matriks ๐ ร ๐, untuk ๐ = 0, โฆ , ๐; ๐ท adalah vektor kolom dari turunan parsial ๐ yaitu ๐ฝ๐ , dan vektor kolom ๐ berisi sebanyak ๐ error sehingga ๐ฆ1 1 ๐ฅ11 ๐ฅ12 โฆ ๐ฅ1๐ ๐ฆ2 1 ๐ฅ21 ๐ฅ22 โฆ ๐ฅ2๐ ๐ฒ = ๐ฆ๐ = โฎ , ๐ = , โฎ โฎ โฎ โฎ โฎ ๐ฆ๐ 1 ๐ฅ๐1 ๐ฅ๐2 โฆ ๐ฅ๐๐ ๐1 ๐ฝ0 ๐2 ๐ฝ ๐ท = ๐ฝ๐ = 1 , ๐ = ๐๐ = โฎ . โฎ ๐๐ ๐ฝ๐ Berdasar pada persamaan (1), model regresi linier dengan intersep dapat ditulis dalam bentuk matriks sebagai ๐ฒ = ๐ฑ ๐T ๐ท + ๐๐ (2)
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 54
PROSIDING
ISBN : 978-979-16353-8-7
dengan vektor ๐ฑ ๐T merupakan tiap baris dari matriks ๐ yang berdimensi ๐ ร ๐. Pada 1 ๐ฅ1 1 ๐ฅ2 paper ini, ๐ = 1 karena ๐ hanya 1 variabel. Oleh karena itu, ๐ฑ ๐T = 1 ๐ฅ๐ = โฎ โฎ 1 ๐ฅ๐ ๐ฝ0 untuk ๐ = 1, โฆ , ๐ dan vektor ๐ท = dan ๐๐ saling bebas dan berdistribusi identik, ๐ฝ1 yaitu normal dengan mean nol dan variansi ๐ 2 , dinotasikan dengan ๐๐ ~๐ 0, ๐ 2 . Persamaan (2) dapat ditulis ulang menjadi : ๐ฝ0 ๐ฆ๐ = 1 ๐ฅ๐ + ๐๐ ๐ฝ1 ๐ฆ๐ = ๐ฝ0 + ๐ฝ1 ๐ฅ๐ + ๐๐ . (3) Persamaan (3) merupakan model regresi linier dengan intersep. Untuk memudahkan dalam penulisan, ๐ฑ ๐T selanjutnya ditulis sebagai ๐. Galat (error) ๐๐ berdistribusi normal, sehingga ๐ฆ๐ ๐, ๐ท, ๐ 2 juga berdistribusi normal (Puspaningrum, 2008) dengan E ๐ฆ๐ = ๐ฝ0 + ๐ฝ1 ๐ฅ๐ dan ๐ ๐ฆ๐ = ๐ 2 . Jadi ๐ฆ๐ ๐, ๐ท, ๐ 2 ~๐ ๐ฝ0 + ๐ฝ1 ๐ฅ๐ , ๐ 2 dengan fungsi kepadatan probabilitas : 1 1 ๐ ๐ฆ๐ ๐, ๐ท, ๐ 2 = exp โ 2 ๐ฒ โ ๐๐ท 2 2๐ 2๐๐ 2 Kemudian fungsi likelihood didefinisikan sebagai : ๐
๐ ๐ฒ ๐, ๐ท, ๐ 2 = ๐
= ๐=1
๐ ๐ฆ๐ ๐, ๐ท, ๐ 2 ๐=1
1 2๐๐ 2
โ exp โ
1 ๐ฒ โ ๐๐ท 2๐ 2
1 ๐ฒ โ ๐๐ท 2๐ 2 Jadi, fungsi likelihood :
= ๐2
โ๐/2
exp โ
๐ ๐ฒ ๐, ๐ท, ๐ 2 โ ๐ 2
๐
โ๐/2
๐
๐ฒ โ ๐๐ท
๐ฒ โ ๐๐ท 1
exp โ 2๐ 2 ๐ฒ โ ๐๐ท
๐
๐ฒ โ ๐๐ท .
(4)
II.3. Distribusi Prior Konjugat Prior konjugat adalah suatu prior yang jika dikombinasikan dengan fungsi likelihood akan menghasilkan suatu posterior dengan distribusi yang sama dengan distribusi prior (Gelman, 2006). Karena log-likelihood kuadratik dalam ๐ท, log-likelihood ditulis ulang sedemikian rupa sehingga likelihood menjadi normal dalam (๐ท โ ๐ท) dengan ๐ท = ๐ T ๐ โ1 ๐ T ๐ฒ. Ditulis ๐
T
๐ฒ โ ๐พ๐ท ๐ ๐ฒ โ ๐พ๐ท = ๐ฒ โ ๐พ๐ท ๐ฒ โ ๐พ๐ท + ๐ท โ ๐ท ๐ T ๐ (๐ท โ ๐ท). Likelihood ditulis ulang menjadi ๐ฃ๐ 2 2 2 โ๐ฃ/2 ๐ ๐ฒ ๐, ๐ท, ๐ โ ๐ exp โ 2 2๐ 1 ๐ ร ๐ 2 โ(๐โ๐ฃ)/2 exp โ 2 ๐ท โ ๐ท ๐ฟ๐ ๐ฟ ๐ท โ ๐ท (5) 2๐
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 55
PROSIDING
ISBN : 978-979-16353-8-7
๐
dengan ๐ฃ๐ 2 = ๐ โ ๐ฒ๐ท ๐ โ ๐ฒ๐ท , dan ๐ฃ = ๐ โ ๐ , ๐ merupakan jumlah koefisien regresi. Dilihat dari persamaan (5), hal ini menunjukkan suatu bentuk untuk prior : ๐ ๐ท, ๐ 2 = ๐ ๐ 2 ๐ ๐ท ๐ 2 (6) 2 dengan ๐ berdistribusi Inv โ Gamma(๐0 , ๐0 ) dengan ๐0 = ๐ฃ0 /2 dan ๐0 = ๐ฃ0 ๐ 02 dengan ๐ฃ0 dan ๐ 02 diperoleh dari informasi awal atau ditentukan secara subyektif. Kepadatan prior ditulis sebagai ๐ฃ ๐ 2
0 0 ๐ ๐ 2 โ ๐ 2 โ ๐ฃ0 /2+1 exp โ 2๐ . 2 Lebih lanjut, prior bersyarat ๐ท|๐ 2 berdistribusi normal yang dinotasikan sebagai ๐(๐0 , ๐ 2 ๐ฒโ1 0 ) dengan ๐0 ditentukan secara subyektif, dan memiliki kepadatan prior bersyarat :
๐(๐ท|๐ 2 ) โ ๐ 2
โ๐/2
1
exp โ 2๐ 2 ๐ท โ ๐0 T ๐ฒ0 ๐ท โ ๐0 .
II.4. Distribusi Posterior Untuk menyatakan distribusi posterior, digunakan teorema Bayes yaitu dapat dinyatakan sebagai berikut (Lancaster, 2003) Posterior โ Likelihood ร Prior sehingga dengan likelihood (persamaan (4)) dan prior yang telah ditentukan pada persamaan (6), distribusi posterior dapat dinyatakan sebagai ๐(๐ท, ๐ 2 |๐ฒ, ๐) โ ๐ ๐ฒ ๐, ๐ท, ๐ 2 ๐ ๐ 2 ๐(๐ท|๐ 2 ) (7) 1 โ ๐ 2 โ๐/2 exp โ 2 ๐ฒ โ ๐พ๐ท ๐ ๐ฒ โ ๐พ๐ท 2๐ ๐0 ร ๐ 2 โ ๐ 0 +1 exp โ 2 2๐ 1 ร ๐ 2 โ๐/2 exp โ 2 ๐ท โ ๐0 T ๐ฒ0 ๐ท โ ๐0 . 2๐
Dengan beberapa pengaturan ulang, posterior pada persamaan (7) dapat ditulis ulang sehingga mean posterior ๐๐ dari vektor parameter ๐ท dapat dinyatakan dalam estimator kuadrat terkecil ๐ท dan mean prior ๐0 dengan kekuatan dari prior ditunjukkan oleh matriks prior presisi ๐ฒ0 = 1/๐ 2 ๐๐ = ๐ T ๐ + ๐ฒ0 โ1 (๐ T ๐๐ท + ๐ฒ0 ๐0 ). (8) Untuk membenarkan bahwa ๐๐ memang mean posterior, istilah kuadrat dalam eksponensial dapat diatur kembali sebagai bentuk kuadrat dalam ๐ท โ ๐๐ ๐ฒ โ ๐พ๐ท ๐ ๐ฒ โ ๐พ๐ท + ๐ท โ ๐0 T ๐ฒ0 ๐ท โ ๐0 = ๐ท โ ๐๐ T ๐ T ๐ + ๐ฒ0 ๐ท โ ๐๐ + ๐ฒ T ๐ฒ โ ๐T๐ ๐ T ๐ + ๐ฒ0 ๐๐ + ๐T0 ๐ฒ0 ๐0 . Selanjutnya, posterior dapat dinyatakan sebagai distribusi normal dikalikan dengan distribusi invers-gamma : 1 ๐(๐ท, ๐ 2 |๐ฒ, ๐) โ ๐ 2 โ๐/2 exp โ 2 ๐ท โ ๐๐ T ๐ T ๐ + ๐ฒ0 ๐ท โ ๐๐ 2๐ ๐0 + ๐ฒ T ๐ฒ โ ๐T๐ ๐ T ๐ + ๐ฒ0 ๐๐ + ๐T0 ๐ฒ0 ๐0 ร ๐ 2 โ(๐+๐ฃ0 )/2โ1 exp โ 2๐ 2 Oleh karena itu, distribusi posterior dapat diparameterisasi sebagai berikut : ๐(๐ท, ๐ 2 |๐ฒ, ๐) โ ๐(๐ท|๐ 2 , ๐ฒ, ๐)๐ ๐ 2 |๐ฒ, ๐ (9) dengan kedua faktor sesuai dengan kepadatan dari distribusi ๐ ๐๐ , ๐ 2 ๐ T ๐ + ๐ฒ0 โ1 dan Inv โ Gamma(๐๐ , ๐๐ ) dengan parameternya diberikan oleh
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 56
PROSIDING
ISBN : 978-979-16353-8-7
1
1
๐ฒ๐ = ๐ T ๐ + ๐ฒ0 , ๐๐ = 2 (๐ + ๐ฃ0 ), ๐๐ = ๐0 + 2 (๐ฒ T ๐ฒ + ๐T0 ๐ฒ0 ๐0 โ ๐T๐ ๐ฒ๐ ๐๐ ). Berdasarkan parameter di atas, persamaan (8) diperbarui sesuai konteks Bayesian menjadi ๐๐ = ๐ฒ๐ โ1 ๐ T ๐๐ท + ๐ฒ0 ๐0 = ๐ T ๐ + ๐ฒ0 โ1 ๐ T ๐ฒ + ๐ฒ0 ๐0 . (10) II.5. MCMC (Markov Chain Monte Carlo) Salah satu cara untuk merancang rantai Markov yaitu dari distribusi posterior dengan 2 ๐ ๐ |๐ฒ, ๐ ~Inv โ Gamma(๐๐ , ๐๐ ) dan ๐ ๐ท ๐ 2 , ๐ฒ, ๐ ~๐ ๐๐ , ๐ 2 ๐ T ๐ + ๐ฒ0 โ1 yaitu dengan Gibbs Sampling yang menghasilkan rantai Markov oleh sampling dari distribusi bersyarat. Sebelumnya, disusun distribusi prior konjugat dengan 2 2 ๐ ๐ ~Inv โ Gamma(๐0 , ๐0 ) dengan ๐0 = ๐ฃ0 /2 dan ๐0 = ๐ฃ0 ๐ 0 dengan ๐ฃ0 dan ๐ 02 ditentukan secara subyektif dan ๐ ๐ท ๐ 2 ~๐(๐0 , ๐ 2 ๐ฒโ1 0 ) dengan ๐0 ditentukan secara 2 subyektif dan prior presisi ๐ฒ0 = 1/๐ dengan memilih nilai ๐ 2 . Jika ๐ 2 ~Inv โ Gamma(๐๐ , ๐๐ ), maka : 1 1 ๐ 2 |๐ฒ, ๐~Inv โ Gamma 2 ๐ + ๐ฃ0 , ๐0 + 2 ๐ฒ T ๐ฒ + ๐T0 ๐ฒ0 ๐0 โ ๐T๐ ๐ฒ๐ ๐๐ (*) Jika ๐ฝ0 , ๐ฝ1 ~๐ต๐๐(๐1 , ๐2 , ๐12 , ๐22 , ๐), (Bain et al., 1991) maka : 1. Distribusi dari ๐ฝ0 bersyarat pada ๐ฝ1 = ๐ฝ10 ๐
๐ฝ0 |๐ฝ10 ~๐ ๐1 + ๐ ๐1 ๐ฝ10 โ ๐2 , ๐12 1 โ ๐2 .
(**)
2
2. Distribusi dari ๐ฝ1 bersyarat pada ๐ฝ0 = ๐ฝ00 ๐
๐ฝ1 |๐ฝ00 ~๐ ๐2 + ๐ ๐2 ๐ฝ00 โ ๐1 , ๐22 1 โ ๐2 ,
(***)
1
Diberikan ๐ 2 dan vektor ๐ท yang tidak diketahui : ๐ท = (๐ฝ0 , ๐ฝ1 ) (0) 1. Dipilih nilai awal ๐ 2 , ๐ฝ00 , ๐ฝ10 2. Sampel ๐ 2
(1)
dari ๐ ๐ 2
(1)
Sampel ๐ฝ01 dari ๐ ๐ฝ01 ๐
๐ฒ, ๐ sehingga ๐ 2 2 (1) (1)
(1)
|๐ฒ, ๐ memenuhi (*)
, ๐ฝ10 , ๐ฒ, ๐ sehingga ๐ฝ01 |๐ 2
(1)
, ๐ฝ10 memenuhi (**)
(1)
Sampel ๐ฝ11 dari ๐ ๐ฝ11 ๐ 2 , ๐ฝ01 , ๐ฒ, ๐ sehingga ๐ฝ11 |๐ 2 , ๐ฝ01 memenuhi (***) 3. Langkah 2 diulangi sebanyak 1000 kali (untuk mendapat hasil yang lebih akurat, dilakukan iterasi sebanyak lebih dari 1000 kali) 4. Akhirnya didapatkan sampel dari ๐ ๐ 2 |๐ฒ, ๐ dan ๐(๐ท|๐ 2 , ๐ฒ, ๐) dalam bentuk rantai Markov. II.6. Interval Kredibel (Interval Kepercayaan Bayesian) Dalam statistik Bayesian, interval kredibel 1 โ ๐ผ 100% merupakan interval di dalam domain dari distribusi probabilitas posterior yang digunakan untuk penaksiran interval (Web 2). Salah satu metode untuk mengestimasi interval kredibel yang paling mudah digunakan adalah interval kredibel dua ekor (Johnson, 2009). Interval kredibel dua ekor disusun dengan menemukan kuantil ๐ผ/2 dan 1 โ ๐ผ/2 dengan tingkat signifikansi ๐ผ.
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 57
PROSIDING
ISBN : 978-979-16353-8-7
III.
1.
2. 3. 4.
METODE PENELITIAN Data yang diambil dalam penelitian adalah data SUSENAS (Survey Sosial Ekonomi Nasional) tahun 2011 dari BPS Salatiga yaitu pendapatan dan pengeluaran masyarakat Salatiga dengan sampel ๐ = 30. Dalam melakukan perhitungan, digunakan alat bantu program WinBUGS 1.4.3. Langkah-langkah penyelesaian untuk mengestimasi parameter dan interval kredibel menggunakan model regresi linier Bayesian sebagai berikut : Merancang rantai Markov dari distribusi posterior ๐(๐ท, ๐ 2 |๐ฒ, ๐) โ ๐ ๐ 2 |๐ฒ, ๐ ๐(๐ท|๐ 2 , ๐ฒ, ๐) dengan ๐ ๐ 2 |๐ฒ, ๐ ~Inv โ Gamma(๐๐ , ๐๐ ) dan ๐(๐ท|๐ 2 , ๐ฒ, ๐)~๐(๐๐ , ๐ 2 ๐ T ๐ + ๐ฒ0 โ1 ) yaitu dengan Gibbs Sampling yang menghasilkan 3 rantai Markov dengan iterasi sebanyak 5000 yaitu untuk taksiran parameter ๐ 2 , ๐ฝ0 dan ๐ฝ1 . Taksiran parameter ๐ 2 , ๐ฝ0 dan ๐ฝ1 diperoleh dengan mencari rata-rata dari nilai Gibbs sampler. Dari nilai-nilai Gibbs sampler tersebut, dihasilkan fungsi densitas untuk ๐ 2 berdistribusi invers-gamma dan ๐ฝ0 , ๐ฝ1 berdistribusi normal. Mencari interval kredibel 95% untuk masing-masing taksiran parameter dengan tingkat signifikansi ๐ผ = 0.05 berdasar pada fungsi densitas.
IV.
HASIL PENELITIAN DAN PEMBAHASAN Data yang digunakan dalam penelitian merupakan nilai logaritma dari data asli dengan pendapatan sebagai variabel dependen ๐ฒ terhadap pengeluaran sebagai variabel independen ๐ dengan pengamatan ๐ = 30 dinyatakan pada Tabel 1. Tabel 1. Data Pendapatan dan Pengeluaran Y X log(Y) 2705000 824382,6667 6,4322 3364333,333 1418616 6,5269 6040000 4297649,667 6,7810 3353000 1936732,667 6,5254 1426333,333 773483 6,1542 7664400 5270866 6,8845 6285666,667 3323499,667 6,7984 5950000 3734666,667 6,7745 5750000 3154333,333 6,7597 1323333,333 472666,3333 6,1217 1650333,333 937132,6667 6,2176 1051400 359666,3333 6,0218 7826616,667 6677783,333 6,8936 1466666,667 719666,3333 6,1663 3500000 1048666 6,5441 3450000 1820000 6,5378 6366666,667 5580666,333 6,8039 4661666,667 2147499,333 6,6685 4976666,667 3411166 6,6969
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
log(X) 5,9161 6,1519 6,6332 6,2871 5,8885 6,7219 6,5216 6,5723 6,4989 5,6746 5,9718 5,5559 6,8246 5,8571 6,0206 6,2601 6,7467 6,3319 6,5329
MS - 58
PROSIDING
ISBN : 978-979-16353-8-7
7068000 5098666,667 1225000 3316666,667 2439166,667 1780000 4156333,333 3057666,667 2950833 1613666,667 3356666,667
4795400 3340066 485166 2182400 1024266 841666,6667 2352566 1987100 1934774,333 578949,6667 1292166
6,8493 6,7075 6,0881 6,5207 6,3872 6,2504 6,6187 6,4854 6,4699 6,2078 6,5259
6,6808 6,5238 5,6859 6,3389 6,0104 5,9251 6,3715 6,2982 6,2866 5,7626 6,1113
Diagram pencar data asli pada Tabel 1 ditampilkan oleh Gambar 1. 6
8
x 10
7
6
5
4
3
2
1
0
1
2
3
4
5
6
7 6
x 10
Gambar 1. Diagram Pencar Data Asli Sedangkan diagram pencar untuk data logaritma dari data asli ditunjukkan oleh Gambar 2. 7 6.9 6.8 6.7 6.6 6.5 6.4 6.3 6.2 6.1 6 5.5
6
6.5
7
Gambar 2. Diagram Pencar Data Logaritma Dari Data Asli
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 59
PROSIDING
ISBN : 978-979-16353-8-7
Dari Gambar 2 terlihat sebaran data cenderung berada di sekitar garis lurus maka dapat dikatakan hubungan antara kedua peubah tersebut membentuk pola linier. Karena data-data tersebut menunjukkan hubungan linier maka selanjutnya dapat ditentukan persamaan regresi dugaannya. Untuk mendapatkan taksiran ๐ท = (๐ฝ0 , ๐ฝ1 ) berdasarkan metode kuadrat terkecil, nilai-nilai logโก (X) dan logโก (Y) dimasukkan ke dalam persamaan ๐ท = ๐ T ๐ โ1 ๐ T ๐ฒ dengan ๐ = [๐; log X ] dan ๐ฒ = logโก (Y) sehingga diperoleh nilai ๐ฝ0 = 2.105302 dan ๐ฝ1 = 0.707418 . Jadi persamaan garis regresi dugaan adalah ๐ฆ๐ = 2.105302 + 0.707418 ๐ฅ๐ . Diagram pencar data dan persamaan garis regresi ๐ฆ๐ ditampilkan pada Gambar 3. 7 6.9 6.8 6.7 6.6 6.5 6.4 6.3 6.2 6.1 6 5.5
6
6.5
7
Gambar 3. Garis Regresi dengan Metode Kuadrat Terkecil Selanjutnya untuk mendapatkan estimasi parameter ๐ 2 dan ๐ท = (๐ฝ0 , ๐ฝ1 ) dengan model regresi linier Bayesian, dirancang rantai Markov dari distribusi posterior ๐(๐ท, ๐ 2 |๐ฒ, ๐) โ ๐ ๐ 2 |๐ฒ, ๐ ๐(๐ท|๐ 2 , ๐ฒ, ๐) dengan ๐ ๐ 2 |๐ฒ, ๐ ~Inv โ Gamma(๐๐ , ๐๐ ) dan ๐(๐ท|๐ 2 , ๐ฒ, ๐)~๐(๐๐ , ๐ 2 ๐ T ๐ + ๐ฒ0 โ1 ) yaitu dengan Gibbs sampling sebanyak 5000 iterasi. 1. Taksiran Parameter ๐ 2 dan Interval Kredibel ๐ 2 Dilakukan Gibbs sampling sebanyak 5000 iterasi untuk mendapatkan taksiran parameter 0 ๐ 2 yang berdistribusi Inv โ Gamma(๐๐ , ๐๐ ) dengan memilih nilai awal ๐ 2 = 1 . Kemudian dengan memotong 500 iterasi pertama, diperoleh hasil: node sigma2
mean sd MC error 0.005718 0.001617 3.245E-5
2.5% 0.003384
median 97.5% 0.005455 0.009659
start 501
sample 5000
Rantai Markov untuk taksiran parameter ๐ 2 sebagai berikut:
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 60
PROSIDING
ISBN : 978-979-16353-8-7
Gambar 9. Rantai Markov untuk Taksiran Parameter ๐ 2 Gambar 9 menunjukkan nilai-nilai Gibbs sampler sebanyak 4500 nilai yang membentuk rantai Markov. Dengan mencari rata-rata dari 4500 nilai Gibbs sampler tersebut, maka diperoleh hasil taksiran parameter ๐ 2 = 0.005718 . berdasarkan nilai-nilai Gibbs sampler tersebut, dihasilkan fungsi densitas pada Gambar 10 sehingga interval kredibel 95% untuk taksiran ๐ 2 adalah (0.003384, 0.009659).
Gambar 10. Fungsi Densitas Parameter ๐ 2 2. Taksiran Parameter ๐ฝ0 dan Interval Kredibel ๐ฝ0 Dipilih nilai awal ๐ฝ00 = 0 . Dengan Gibbs sampling sebanyak 5000 iterasi dan memotong 500 iterasi pertama untuk taksiran ๐ฝ0 yang berdistribusi normal, didapatkan hasil: node beta0
mean 2.101
sd MC error 0.2505 0.00362
2.5% 1.607
median 97.5% 2.102 2.601
start 501
sample 5000
Rantai Markov untuk taksiran ๐ฝ0 ditunjukkan pada gambar di bawah ini :
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 61
PROSIDING
ISBN : 978-979-16353-8-7
Gambar 4.Rantai Markov untuk Taksiran Parameter ๐ฝ0 Berdasarkan Gambar 4, taksiran parameter ๐ฝ0 didapat dengan mencari rata-rata dari nilai Gibbs sampler sebanyak 4500 dan menghasilkan nilai taksiran ๐ฝ0 = 2.101. Dari nilai-nilai Gibbs sampler yang telah dihitung, menghasilkan fungsi densitas pada Gambar 5, sehingga diperoleh interval kredibel 95% yaitu (1.607, 2.601).
Gambar 5. Fungsi Densitas Parameter ๐ฝ0 3. Taksiran Parameter ๐ฝ1 dan Interval Kredibel ๐ฝ1 Untuk memperoleh taksiran parameter ๐ฝ1 yang berdistribusi normal, dipilih nilai awal ๐ฝ10 = 0 kemudian dengan melakukan Gibbs sampling sebanyak 5000 iterasi dan memotong 500 iterasi pertama didapatkan hasil : node beta1
mean 0.708
sd MC error 2.5% 0.04012 5.815E-4 0.6282
median 97.5% 0.7074 0.7879
start 501
sample 5000
Rantai Markov untuk taksiran ๐ฝ1 sebagai berikut:
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 62
PROSIDING
ISBN : 978-979-16353-8-7
Gambar 6. Rantai Markov untuk Taksiran Parameter ๐ฝ1 Dengan mencari rata-rata dari nilai Gibbs sampler sebanyak 4500 iterasi yang ditunjukkan pada Gambar 6, didapat nilai taksiran ๐ฝ1 = 0.708 dan menghasilkan fungsi densitas pada Gambar 7. Jadi, interval kredibel 95% untuk parameter ๐ฝ1 yaitu (0.6282, 0.7879).
Gambar 7. Fungsi Densitas Parameter ๐ฝ1 Selanjutnya, dengan estimasi parameter ๐ท = (2.101, 0.708) dibentuk persamaan garis regresi dugaan: ๐ฆ๐ = 2.101 + 0.708 ๐ฅ๐ . Diagram pencar data dan persamaan garis regresi ditampilkan pada Gambar 8. 7 6.9 6.8 6.7 6.6 6.5 6.4 6.3 6.2 6.1 6 5.5
6
6.5
7
Gambar 8. Garis Regresi dengan Metode Bayesian Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 63
PROSIDING
ISBN : 978-979-16353-8-7
V. KESIMPULAN Dari hasil penelitian tentang data SUSENAS (Survey Sosial Ekonomi Nasional) tahun 2011 dari BPS Salatiga yaitu data logaritma dari data pendapatan dan pengeluaran masyarakat Salatiga dengan sampel ๐ = 30 yang telah diperoleh pada pembahasan, dapat disimpulkan bahwa : - Untuk mendapatkan estimasi parameter ๐ 2 , ๐ฝ0 , dan ๐ฝ1 dirancang rantai Markov dari distribusi posterior ๐(๐ท, ๐ 2 |๐ฒ, ๐) โ ๐ ๐ 2 |๐ฒ, ๐ ๐(๐ท|๐ 2 , ๐ฒ, ๐) dengan ๐ ๐ 2 |๐ฒ, ๐ ~Inv โ Gamma(๐๐ , ๐๐ ) dan ๐(๐ท|๐ 2 , ๐ฒ, ๐)~๐(๐๐ , ๐ 2 ๐ T ๐ + ๐ฒ0 โ1 ) yaitu dengan Gibbs sampling sebanyak 5000 iterasi. Diperoleh nilai-nilai Gibbs sampler sebanyak 5000 (untuk masing-masing parameter), dan setelah dirata-rata, didapat nilai taksiran ๐ 2 = 0.005718, ๐ฝ0 = 2.101, dan ๐ฝ1 = 0.708. - Dengan tingkat signifikansi ๐ผ = 0.05 , interval kredibel 95% untuk masing-masing taksiran ๐ 2 , ๐ฝ0 , dan ๐ฝ1 merupakan interval dimana terdapat taksiran parameternya. Dari nilai-nilai Gibbs sampler yang ada, dihasilkan fungsi densitas untuk ๐ 2 yang berdistribusi invers-gamma, sehingga diperoleh interval kredibel 95% yaitu (0.003384, 0.009659). Sedangkan fungsi densitas untuk ๐ฝ0 dan ๐ฝ1 yang berdistribusi normal, diperoleh interval kredibel 95% yaitu (1.607, 2.601) untuk ๐ฝ0 dan (0.6282, 0.7879) untuk ๐ฝ1 . VI. DAFTAR PUSTAKA Bain, Lee J. dan Engelhardt, Max. 1991. Introduction To Probability and Mathematical Statistics Second Edition. USA : Duxbury. Fall, Roger Levy. 2007. Lecture 6: Bayesian Parameter Estimation; Con๏ฌdence Intervals (Bayesian and Frequentistic). Fauzy, Akhmad. 2008. Statistik Industri. Jakarta : Erlangga. Gelman, Andrew. 2006. Bayesian Analysis. Department of Statistics and Department of Political Science : Columbia University. Johnson, Matthew S. 2009. Introduction to Bayesian Statistics with WinBUGS. New York : Columbia University. Lancaster, Tony. 2003. An Introduction to Modern Bayesian Econometrics. Puspaningrum, Dessy. 2008. Penerapan Metode Bayesian Untuk Mengestimasi Parameter Pada Model Regresi Linier Sederhana. UKSW : FSM. Sembiring, R. K. 2003. Analisis Regresi Edisi Kedua. Bandung : ITB. Web 1 : http://en.wikipedia.org/wiki/Bayesian_linear_regression Bayesian Linear Regression Diunduh pada 28 Agustus 2012 Web 2 : http://en.wikipedia.org/wiki/Credible_interval Credible Interval Diunduh pada 5 September 2012
Seminar Nasional Matematika dan Pendidikan Matematika FMIPA UNY Yogyakarta, 10 November 2012
MS - 64