BIAStatistics (2015) Vol. 9, No. 2, hal. 28-32
PENAKSIRAN PARAMETER REGRESI LINIER DENGAN METODE BOOTSTRAP MENGGUNAKAN DATA BERDISTRIBUSI NORMAL DAN UNIFORM Munawar Jurusan Matematika FMIPA Universitas Syiah Kuala
[email protected]
ABSTRAK Sering dalam sebuah penelitian, peneliti ingin melihat hubungan atau pengaruh yang ditimbulkan oleh suatu peubah atau variabel terhadap peubah lain. Taksiran yang didapat dalam sebuah model regresi linier sederhana sedemikian rupa sehingga “dekat” dengan nilai observasi. Pendekatan dasar metode bootstrap adalah memperlakukan sampel seolah-olah sebagai populasi untuk membangkitkan suatu taksiran empiris dari distribusi sampling statistik tertentu. Taksiran regresi linier sederhana dengan metode bootstrap merupakan taksiran yang tak bias dan memiliki varians minimum. Untuk mendapatkan taksiran tersebut digunakan resampling residual atau resampling pasangan dengan bantuan software statistik SAS. Kajian ini menggunakan 20 sampel dan untuk metode bootstrap dilakukan untuk 500 dan 1000 pengulangan. Standar error penaksir parameter regresi yang diperoleh dengan metode boostrap lebih kecil dibandingkan dengan metode konvensional, baik untuk data yang berdistribusi normal maupun data yang berdistribusi uniform. Key words: bootstrap, regresi linier, taksiran
1.
PENDAHULUAN
Analisis regresi linier sederhana adalah suatu metode untuk melihat hubungan antara satu variabel bebas dan satu variabel takbebas yang diasumsikan mempunyai distribusi normal. Dengan inferensi parametrik tradisional penentuan koefisien dalam sebuah model regresi harus memenuhi syarat distribusi dan beberapa asumsi. Penaksir kuadrat terkecil biasa (the ordinary least squares estimators) akan optimal jika error berdistribusi normal dengan mean sama dengan nol dan varians konstan. Teorema Limit Pusat menjamin penaksir kuadrat terkecil akan berdistribusi normal jika data berukuran besar. Jika syarat tersebut tidak terpenuhi dalam sebuah model empirik atau untuk sebuah himpunan data empirik seperti banyaknya data yang cukup besar, pernyataan-pernyataan inferensi parametrik tentang penaksir kuadrat terkecil akan tidak akurat. Model regresi dengan metode bootstrap adalah sebuah solusi karena bootstrap tidak memperhatikan distribusi data yang ada (free distribution). Bootstrap adalah sebuah metode berbasis komputer untuk menaksir berbagai nilai statistik dan untuk menentukan selang kepercayaan (Efron dan Tibshirani : 1993:10). Metode bootstrap yang dikembangkan oleh Efron (1979) ini merupakan suatu pengulangan pengambilan sampel dari data yang tersedia. Data data, , , ⋯ dipilih secara acak sejumlah data dengan pengembalian sehingga data tersebut mempunyai peluang yang sama untuk dipilih yaitu . Jumlah pengulangan bootstrap juga mempengaruhi penaksiran parameter. Dalam keadaaan penaksiran tertentu, pengulangan bootstrap yang lebih kecil cenderung mendekati nilai parameter yang sebenarnya (Ernyda dan Marzuki : 2012:80). Metode bootstrap secara intensif memanfaatkan simulasi Monte Carlo dalam melakukan resampling data dengan membangkitkan sebanyak kali pengulangan sampel bootstrap.
28
Penyelesaian regresi linier sederhana dengan metode kuadrat terkecil memerlukan asumsi normalitas pada galatnya agar analisis-analisis statistik untuk model yang diperoleh sahih. Pendekatan metode kuadrat terkecil akan tidak berguna apabila asumsi-asumsi tersebut tidak terpenuhi. Pendekatan dengan metode bootstrap diharapkan dapat mengatasi masalah ini. Kajian ini bertujuan untuk mempelajari mengenai penyelesaian regresi linier sederhana dengan menggunakan metode bootstrap. Adapun manfaat dari kajian ini adalah memberikan landasan pengetahuan yang berguna bagi peneliti tentang masalah metode bootstrap khususnya dalam penyelesaian regresi linier sederhana. Kajian ini dibatasi pada penggunaan metode bootstrap untuk menaksir nilai statistik pada model regresi sederhana. Hasil yang didapat pada metode ini akan dibandingkan dengan regresi linier sederhana yang konvensional. 2.
METODOLOGI
Sejumlah data dianalisa untuk menaksir nilai statistik pada regresi linier sederhana dengan metode Bootstrap dan secara konvensional. Data yang digunakan dalam kajian ini merupakan data bangkitan yang diperoleh melalui software Minitab. Tabel 1 menyajikan 20 data dan . adalah variabel bebas yang nilainya telah ditetapkan (fixed). adalah variabel tidak bebas yang nilainya sama dengan 10 + 25 + dimana berdistribusi normal dengan mean = 0 dan varians = 1. Tabel 1. Sampel acak berdistribusi normal No. 1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
35.06281 59.80373 83.76872 109.82760 135.61113 160.82624 183.95751 210.40574 235.76467 260.08128
No. 11 12 13 14 15 16 17 18 19 20
11 12 13 14 15 16 17 18 19 20
285.29197 310.12731 332.56376 359.06074 384.34781 410.66612 435.11034 461.01084 485.13058 510.04977
Tabel 2. Sampel acak berdistribusi uniform No. 1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
35.441339 60.427557 85.435901 110.148891 135.254371 160.879152 185.013324 210.587756 235.261741 260.468397
No. 11 12 13 14 15 16 17 18 19 20
11 12 13 14 15 16 17 18 19 20
285.074355 310.113893 335.692706 360.333578 385.405042 410.809294 435.705868 460.268431 485.234874 510.256800
Tabel 2 menyajikan nila yang ditetapkan (fixed) dan = 10 + 25 + dimana berdistribusi uniform dengan batas bawah = 0 dan batas atas = 1. Nilai dibangkitkan dengan software Minitab.
Biastatistics Vol 9, No.2, September 2015
29
Penaksiran parameter regresi linier sederhana dilakukan untuk dua kasus, masing-masing untuk data yang berdistribusi normal dan berdistribusi uniform. Setiap kasus menggunakan 20 data sampel. Setiap kasus dilakukan penaksiran parameter regresi dengan dua metode yaitu metode bootstrap dan metode konvensional. Metode bootstrap dalam tulisan ini dilakukan untuk masing-masing dengan 500 dan 1000 pengulangan. Prosedur pembangkitan data sampel dan proses analisisnya adalah sebagai berikut: Menetapkan 20 nilai variabel , yaitu 1, 2, 3, ⋯ , 20 Membangkitkan 20 yang berdistribusi nomal dengan parameter mean = 0 dan varians =1 Mendapatkan nilai variabel dengan rumus 10 + 25 + Menaksir parameter regresi dan standar errornya dengan metode konvensional Menaksir parameter regresi dan standar errornya menggunakan metode bootstrap dengan 500 pengulangan Menaksir parameter regresi dan standar errornya menggunakan metode bootstrap dengan 1000 pengulangan Membandingkan standar error yang dihasilkan melalui metode bootstrap dengan metode konvensional
1) 2) 3) 4) 5) 6) 7)
Semua langkah di atas diulang untuk data yang berdistribusi uniform tetapi langkah keduanya diganti dengan parameter batas bawah = 0 dan batas atas = 1. Selain melihat standar error dari parameter-parameter regresi, kajian ini juga menampilkan selang kepercayaan 95% untuk masing-masing parameter regresi sederhana yang ditaksir melalui dua metode. 3.
HASIL DAN PEMBAHASAN
Perhitungan penaksir regresi linier sederhana konvensional diambil dari kumpulan data awal yaitu Tabel 1 dan Tabel 2. Berikut akan dibahas perbandingan antara penaksir regresi linier sederhana bootstrap dan penaksir regresi linier sederhana konvensional. Pembahasan ini dibagi ke dalam dua jenis ditribusi data yaitu normal dan uniform. 3.1. Data Berdistribusi Normal Penaksir regresi linier sederhana secara konvensional untuk data yang berdistribusi normal (data pada Tabel 1) seperti yang disajikan pada Tabel 3. Dengan penaksir regresi linear sederhana metode bootstrap terdapat pada Tabel 4. Tabel 3. Regresi linier sederhana secara konvensional untuk data normal Statistik
Taksiran 9.80728 25.011
Standar Error 0.396681 0.033114
95% Selang Kepercayaan (8.977026 ; 10.637533) (24.941692 ; 25.080307)
Tabel 4. Regresi linier sederhana dgn metode bootstrap 500 pengulangan data normal No. 1 2 3 4
30
Statistik
Taksiran 9.8131 25.0096 9.8181 25.0098 9.8363 25.0069 9.8237 25.0106
Standar Error 0.29790 0.02616 0.30559 0.02721 0.32095 0.02818 0.28806 0.02424
95% Selang Kepercayaan (9.223258 ; 10.402942) (24.957803; 25.061397) (9.213032 ; 10.423168) (24.955924 ;25.063676) (9.200819 ; 10.471781) (24.951104 ;25.062694) (9.253341 ; 10.394059) (25.962605 ; 25.058595)
Biastatistics Vol 9, No.2, September 2015
Tabel 5. merupakan tabel regresi linier sederhana dengan metode bootstrap 1000 kali pengulangan data berdistribusi normal. Tabel 5. Regresi linier sederhana dgn metode bootstrap 1000 pengulangan data normal No. 1
Statistik
2 3 4
Taksiran 9.8123 25.0101 9.8227 25.0093 9.8194 25.0099 9.8214 25.0096
Standar Error 0.30777 0.02555 0.30675 0.02688 0.30794 0.02621 0.31055 0.02611
95% Selang Kepercayaan (9.202915 ; 10.421686) (24.959511; 25.060689) (9.215335 ; 10.430065) (24.956078; 25.062224) (9.209679 ; 10.429121) (24.958004; 25.061796) (9.206511 ; 10.436289) (24.957902; 25.061297)
Standar error penaksir dan yang diperoleh pada hasil di atas dengan metode boostrap lebih kecil dibandingkan dengan metode konvensional. 3.2. Data Berdistribusi Uniform Penaksir regresi linier sederhana secara konvensional untuk data yang berdistribusi uniform (data pada Tabel 2) adalah sebagai berikut: (Tabel 6.) Tabel 6. Regresi linier sederhana secara konvensional untuk data uniform Statistik
Taksiran 10.3771 25.0013
Standar Error 0.116262 0.009705
95% Selang Kepercayaan (10.133763; 10.620436) (24.980948; 25.021612)
Penaksir regresi linier sederhana metode bootstrap ditampilkan pada Tabel 7. Sedangkan Tabel 8. merupakan tabel regresi linier sederhana dengan metode bootstrap 1000 kali pengulangan data berdistribusi uniform. Tabel 7. Regresi linier sederhana dgn metode bootstrap 500 pengulangan data uniform No. 1
Statistik
2 3
Taksiran 10.3792 25.0013 10.3810 25.0010 10.3668 25.0020
Standar Error 0.10052 0.00830 0.10820 0.00839 0.10027 0.00828
95% Selang Kepercayaan (10.18017 ; 10.587496) (24.984866; 25.017734) (10.166764 ; 10.595236) (24.834878; 25.017612) (10.168265 ; 10.565335) (24.985606; 25.018394)
Tabel 8. Regresi linier sederhana dgn metode bootstrap 1000 pengulangan data uniform No. 1 2 3 4
Statistik
Taksiran 10.3744 25.0015 10.3741 25.0015 10.3693 25.0019 10.3691 25.0021
Standar Error 0.097797 0.008012 0.10565 0.00848 0.10639 0.00881 0.10457 0.00857
95% Selang Kepercayaan (10.180761 ; 10.568038) (24.985636; 25.017637) (10.164193 ; 10.583287) (24.984709; 25.018291) (10.158647 ; 10.579952) (24.984456; 25.019343) (10.162051 ; 10.576148) (25.019068; 25.019068)
Standar error penaksir dan yang diperoleh pada hasil di atas dengan metode boostrap lebih kecil dibandingkan dengan metode konvensional.
Biastatistics Vol 9, No.2, September 2015
31
4.
KESIMPULAN
Regresi linier sederhana dengan metode bootstrap dapat digunakan untuk menentukan selang kepercayaan pada kumpulan data yang berdistribusi normal ataupun tidak. Penaksir regresi linier sederhana dengan metode bootstrap lebih “baik” dibanding dengan metode konvensional karena penaksir bootstrap takbias dan varians lebih kecil. Masih banyak masalah bootstrap yang belum dikaji, misal masalah konvergensi. Disarankan dapat dilakukan kajian lanjutan terhadap masalah bootstrap ini. 5.
REFERENCES
Abraham, B. dan Johannes L.E. (1993). Statistical Methods fro Forecasting. John Wiley and Sons Inc, New York. Bain, L.J. dan Engelhardt, M. (1974). Introduction to Probability and Mathematical Statistics. Duxbury Press, Boston. Bickel, P.J. dan Freedman, D. (1981). Some Asymptotic Theory for the Bootstrap. The Annals of Statistics, Vol. 9 No. 6, 1196-1217, Institute of Mathematical Statistics , Ohio. Dudewicz, E.J. dan Mishra, S.N., (1995). Statistika Matematika Modern. Terjemahan R.K. Sembiring, ITB Bandung, Bandung. Efron, B. dan Tibshirani, J. (1993). An Introduction to Bootstrap, Chapman & Hall, New York. Ernyda, N. dan Marzuki. (2012). Pengaruh Jumlah Perulangan Bootstrap terhadap Dugaan Selang Kepercayaan Parameter Selisih Rata-rata Dua Populasi, Jurnal Statistika Vol. 12 No. 2, Nopember 2012. Jurusan Statistika FMIPA Unisba. Freedman, D.A. (1981). Bootstrapping Regression Models. Annals Statistics, Vol. 9 No. 6, 12181228, Institute of Mathematical Statistics , Ohio.
32
Biastatistics Vol 9, No.2, September 2015