BAB I PENDAHULUAN
1.1.
Latar Belakang dan Permasalahan Di dalam statistika, sebuah estimator adalah hasil perhitungan suatu estima-
si terhadap kuantitas tertentu berdasarkan pada data terobservasi atau sering disebut sampel. Kuantitas tertentu tersebut biasanya tidak diketahui nilainya, yang sering disebut parameter. Misal suatu variabel acak X diketahui berdistribusi normal dengan parameter mean µ dan variansi σ 2 . Akan tetapi, nilai parameter-parameter µ dan σ 2 sering tidak diketahui di dalam dunia nyata. Untuk itu, diperlukan suatu estimator untuk mengestimasi parameter tersebut. Selanjutnya, diasumsikan telah tersedia sampel X1 , X2 , . . . , Xn dari variabel acak X. Berdasarkan sampel ini kemudian ditentukan statistik Tn = T (X1 , X2 , . . . , Xn ) untuk suatu fungsional T . Harapannya, statistik Tn ini merupakan estimasi yang terbaik terhadap parameter tertentu yang tidak diketahui nilainya. Beberapa permasalahan yang sering muncul dalam estimasi sebarang parameter tak diketahui θ meliputi: (1) Estimator θb apa yang akan digunakan atau dipilih, (2) Setelah memilih estimator tertentu, bagaimana konsistensi estimator tersebut terhadap parameter yang sebenarnya, dan (3) Bagaimana keakurasian estimator tersebut, dan (4) Bagaimana perilaku asimtotik dari estimator tersebut. Konsistensi dan keakurasian diperlukan untuk menjamin bahwa estimator θb yang dipilih tersebut merupakan estimator terbaik sesuai yang diharapkan dalam ilmu statistika. Konsistensi suatu estimator ditentukan oleh mode kekonvergenan (modes of convergence) seperti konvergen dalam distribusi, konvergen dalam probabilitas ataupun konvergen hampir pasti. Sementara itu, untuk menyelidiki keakurasian suatu estimator perlu diselidiki standar error dari estimator tersebut atau dikonstruksi suatu interval konfidensi. Standar error menyatakan keakurasian estimator yang menggambarkan seberapa jauh estimator θb menyimpang dari nilai parameter θ yang sebenarnya. Sedangkan interval konfidensi
1
2
menyatakan seberapa jauh estimator berada pada lingkungan parameter dengan derajad kepercayaan tertentu yang mana hal ini menggambarkan probabilitas cakupan (coverage probability) dari suatu parameter yang akan diestimasi. Bootstrap, merupakan metode yang berbasis pada komputer-intensif, berkembang pesat sejak diperkenalkan pertama kali oleh Bradley Efron pada tahun 1979. Metode bootstrap didesain untuk bisa menjawab beberapa permasalahan di atas, khususnya permasalahan (3) dan (4) dengan tingkat akurasi yang tinggi [Efron dan Tibshirani (1986)]. Selain itu, metode bootstrap dapat digunakan pada situasi dimana asumsi standar tidak dipenuhi, misal ukuran sampel n kecil dan data tidak berdistribusi normal [Davison dan Hinkley (2006)]. Menurut Singh (1981), Hall (1992) dan DasGupta (2008), distribusi mean sampel bootstrap memiliki tingkat akurasi yang lebih tinggi dibandingkan dengan aproksimasi distribusi limit normal. Secara teoritis mereka menunjukkan bahwa bootstrap memiliki keakurasian orde kedua, sementara aproksimasi distribusi limit normal hanya memiliki keakurasian orde pertama. Bickel dan Freedman (1981) mempelajari aproksimasi distribusi bootstrap dari statistik penting seperti mean dan statistik-t. Mereka menyimpulkan bahwa kedua statistik bersifat asimtotik. Misalkan parameter θ adalah mean populasi. Estimator konsisten untuk θ adaP lah mean sampel θb = X = n1 ni=1 Xi . Teori konsistensi kemudian dikembangkan untuk menyelidiki konsistensi estimator mean bootstrap. Menurut terminologi bootstrap, jika ingin menyelidiki konsistensi dari estimator mean bootstrap, maka harus √ √ ∗ diselidiki distribusi n X − µ dan n X − X . Variabel baru yang dinotasikan dengan X ∗ adalah sampel bootstrap yang diperoleh dengan cara sampling acak berukuran n dengan pengembalian dari sampel semula X. Konsistensi bootstrap di bawah metrik Kolmogorov didefinisikan sebagai √ √ ∗ sup PF n X − µ ≤ x − PFn n X − X ≤ x .
(1.1)
x
Bickel and Freedman (1981) dan Singh (1981) telah menunjukkan bahwa (1.1) konvergen hampir pasti (converges almost surely) menuju 0 ketika n → ∞ . Se-
3
mentara itu, Suprihatin dkk (2012) melengkapi hasil-hasil tersebut dengan ilustrasi menarik hasil simulasi Monte Carlo. Selain estimator bootstrap untuk mean bersifat konsisten, secara teoritis metode bootstrap memiliki tingkat akurasi yang lebih baik dibanding dengan teorema limit pusat yang telah dikenal sebelumnya [lihat Bose (1988) dan Babu dan Singh (1983)]. Konsistensi bootstrap untuk mean sampel merupakan alat penting untuk menyelidiki konsistensi dari statistik lainnya yang lebih rumit. Dalam disertasi ini, akan diselidiki konsistensi estimator bootstrap untuk parameter proses autoregresif. Misal {Xt , t = 1, 2, . . . , n} adalah data runtun waktu (time series) yang memenuhi proses (model) autoregresif orde p atau AR(p), yakni apabila {Xt , t = 1, 2, . . . , n} memenuhi persamaan
Xt = θ1 Xt−1 + θ2 Xt−2 + . . . + θp Xt−p + εt =
p X
θi Xt−i + εt
(1.2)
i=1
dengan θ = (θ1 , θ2 , . . . , θp )T adalah vektor parameter dan {εt } adalah barisan variabel acak white noise yang berdistribusi independen dan identik (i.i.d.) N (0, σ 2 ). Diasumsikan {Xt , t = 1, 2, . . . , n} stasioner. Topik tentang runtun waktu secara lengkap dapat dijumpai misalnya pada Wei (1990) dan Brockwell and Davis (1991). Estima T b = θb1 , θb2 , . . . , θbp . Brockwell and Davis tor untuk vektor parameter θ adalah θ (1991) menunjukkan bahwa √ b − θ →d N 0, σ 2 Γ−1 , n θ p dimana Γp adalah matriks kovariansi [γ(i − j)]pi,j=1 . Dengan menggunakan prinsip T b∗ = θb∗ , θb∗ , . . . , θb∗ plug-in diperoleh vektor estimator bootstrap θ yang dihitung 1 2 p berdasarkan sampel bootstrap X ∗ . Konsistensi dari estimator bootstrap untuk mean b∗ sampel akan digunakan untuk menyelidiki konsistensi dan distribusi asimtotik dari θ dengan menggunakan metode delta.
4
1.2.
Tujuan Penelitian Secara umum penelitian ini terbagi menjadi dua kajian. Pertama, adalah kaji-
an teoritis yang berkaitan dengan pembuktian secara matematis konsistensi estimator bootstrap. Kedua, adalah kajian terapan yang berkaitan dengan implementasi hasil kajian teori untuk memperkuat hasil-hasil pada kajian teoritis. Pada kajian kedua ini disajikan simulasi Monte Carlo yang menggunakan data nyata, untuk memperoleh standar error dari estimator bootstrap, interval konfidensi dan visualisasi estimasi fungsi densitas. Dengan demikian tujuan penelitian ini adalah: 1. Mengkonstruksi suatu fungsi terukur φj yang memenuhi θbj = φj (X1 , X2 , . . . , Xn ), dan θbj∗ = φj (X1∗ , X2∗ , . . . , Xn∗ ), j = 1, 2, . . . , p, dengan θbj adalah estimator untuk paremeter θj dan θbj∗ adalah versi bootstrap dari θbj . 2. Menentukan estimator bootstrap untuk parameter proses autoregresif dan menyatakan estimator bootstrap tersebut sebagai fungsi terukur φj . 3. Menyelidiki distribusi asimtotik dari vektor estimator bootstrap untuk parameter proses autoregresif dengan menggunakan metode delta. 4. Membuat program komputasi aplikasi dan simulasi dengan menggunakan data nyata untuk menguatkan hasil-hasil pada kajian teoritis.
1.3.
Manfaat Penelitian Hasil penelitian ini diharapkan dapat memberikan beberapa manfaat sebagai
berikut: 1. Sebagai sumbangan pemikiran untuk memperkuat dan mengembangkan keilmuan di bidang statistika, khususnya pada bidang bootstrap dan teori runtun waktu. 2. Memberikan landasan teori bagi peneliti berikutnya yang berminat mengembangkan penelitian ini.
5
3. Sebagai salah satu referensi bagi peneliti dan praktisi dalam pengkajian aplikasi metode bootstrap yang cukup berkembang pesat sejak diperkenalkan oleh Bradley Efron pada tahun 1979. 4. Dapat menentukan konsistensi dan distribusi limit dari estimator bootstrap untuk parameter model autoregresif.
1.4.
Tinjauan Pustaka Sejak diperkenalkan pada akhir dekade tahun 1970an, metode bootstrap ber-
kembang pesat. Banyak penelitian yang mengembangkan metode bootstrap seiring dengan berkembangnya teknologi komputasi. Hal ini dikarenakan metode bootstrap erat kaitannya dengan resampling yang melibatkan sampel bootstrap berukuran besar, yang tentu membutuhkan teknologi komputasi. Untuk kasus ukuran sampel kecil, Maritz dan Jarrett (1998) dan Fisher dan Hall (1991) memberikan estimasi yang baik untuk menentukan standar error dari median sampel. Namun, berdasarkan sampel berukuran kecil tersebut, dapat dibangkitkan sampel-sampel tiruan yang diperoleh dengan cara resampling dengan pengembalian dari sampel semula. Sampel tiruan tersebut dinamakan sampel bootstrap. Pada awal perkembangannya, Efron (1992), Hall (1986) dan Efron dan Tibshirani (1993) menyarankan untuk menggunakan sampel bootstrap berukuran paling sedikit 50 untuk menghitung standar error dan sedikitnya 200 untuk menentukan interval konfidensi. Saat ini, dimana alat komputasi semakin canggih, ukuran sebesar itu tidak menjadi kendala. Bahkan, seorang peneliti bisa membangkitkan sampel bootstrap berukuran ratusan bahkan ribuan sesuai dengan kebutuhan. Untuk menentukan standar error dan interval konfidensi yang melibatkan sampel berukuran besar tentu memerlukan program komputasi atau simulasi. Kedua ukuran ini menyatakan keakurasian suatu estimator bootstrap dalam mengestimasi parameter suatu model. Babu dan Singh (1983) mempelajari konsistensi estimator mean dengan menggunakan metode bootstrap. Selanjutnya, Brown dkk (2001) mempelajari median yang diperhalus dengan metode bootstrap. Kedua karya ilmi-
6
ah tersebut melaporkan bahwa bootstrap memiliki tingkat akurasi yang baik. Secara teoritis, Bose (1988) mengkaji keakurasian estimator bootstrap dengan menggunakan ekspansi Edgeworth yang diterapkan pada model autoregresif. Freedman (1984) memberikan algoritma untuk memperoleh sampel bootstrap untuk data runtun waktu yang dikenal dengan bootstrap residual. Singh (1981) membuktikan konsistensi estimator bootstrap untuk mean dengan menggunakan metrik Kolmogorov, sementara Bickel dan Freedman (1981) membuktikan hasil yang sama dengan menggunakan metrik Mallows-Wasserstein. Suprihatin dkk (2013) juga mempelajari keakurasian metode bootstrap untuk statistik yang lain, yakni median. Hasilnya menunjukkan bahwa bootstrap memberikan tingkat akurasi yang baik, yang ditunjukkan oleh standar error dan interval konfidensi, dimana kedua ukuran tersebut memberikan hasil yang sangat dekat dengan versi standarnya. Setelah estimator bootstrap terbukti konsisten, masih timbul permasalahan yang menarik untuk diteliti, yakni keakurasin estimator tersebut. Efron dan Tibshirani (1986) menerbitkan karya ilmiahnya yang menghasilkan ukuran-ukuran keakurasian estimator bootstrap, seperti standar error dan interval konfidensi. Sementara itu, DiCiccio dan Efron (1996), DiCiccio dan Tibshirani (1987) dan Hall (1988) membahas tentang interval konfidensi bootstrap dan menyimpulkan bahwa bootstrap merupakan metode resampling yang akurat dalam analisa statistika. DiCiccio dan Efron (1996) memperkenalkan beberapa interval konfidensi bootstrap, seperti bootstrap-t, bootstrap persentil, dan BCa (bias-corrected and accelerated). Dalam ulasannya, DiCiccio dan Romano (1988) memberikan penilaian bahwa interval-interval bootstrap tersebut memiliki tingkat akurasi yang baik. Untuk ukuran sampel kecil, yakni n = 5, disimpulkan bahwa interval BCa memiliki tingkat akurasi yang paling baik. Hasil penting berkaitan dengan keunggulan metode bootstrap dikemukakan oleh Bose (1988). Ia menyimpulkan bahwa bootstrap memiliki tingkat keakurasian orde o(n−1/2 ) ketika diterapkan pada estimasi parameter proses autoregresif. Kesimpulan ini lebih baik dibandingkan dengan tingkat akurasi pada teorema limit pusat yang keakurasiannya orde O(n−1/2 ).
7
Karya Bickel dan Freedman (1981) dan Singh (1981) menjadi tonggak penemuan yang sangat penting, karena berdasarkan konsistensi estimator bootstrap mean ini dapat digunakan untuk menyelidi konsistensi estimator statistik lain yang lebih rumit. Selanjutnya, Gine dan Zinn (1989) mempelajari syarat-syarat untuk mean bootstrap, yang menyimpulkan bahwa momen pusat kedua berhingga (EX 2 < ∞) merupakan syarat agar mean bootstrap konsisten. Beberapa contoh pengembangan dari konsistensi estimator bootstrap dapat dilihat pada Hutson dan Ernst (2000) dan Sahinler dan Topuz (2007). Hutson dan Ernst (2000) menyelidiki mean dan variansi bootstrap untuk estimator-L, sementara Sahinler dan Topuz (2007) mempelajari algoritma dari estimasi bootstrap untuk parameter model regresi. Hardle dkk (2003) menerbitkan karya mereka tentang bootstrap dalam bidang runtun waktu. Dari kajian teoritis dan hasil simulasi, mereka melaporkan bahwa bootstrap memberikan hasil yang akurat tatkala metode bootstrap diterapkan pada model-model runtun waktu. Teori konsistensi untuk estimator bootstrap menjadi topik menarik untuk penelitian bidang statistika. Cheng dan Huang (2010) mempelajari konsistensi esimator bootstrap untuk estimasi-M, yang merupakan pengembangan dari apa yang telah dihasilkan oleh Hutson dan Ernst (2000). Bibi dan Aknouche (2010) melaporkan konsistensi estimator Yule-Walker versi bootstrap, namun kesimpulannya hanya berdasarkan pada simulasi. Suprihatin dkk (2012) memberikan simulasi Monte Carlo untuk menjelaskan konsistensi estimator bootstrap untuk parameter pada proses autoregresif orde pertama. Sementara itu, Suprihatin dkk (2015a, 2015b) mempelajari aplikasi metode delta untuk menyelidiki distribusi asimtotik estimator bootstrap pada model autoregresif. Konsistensi estimator pada model autoregresif dan regresi telah dipelajari oleh Politis (2003) dan Lamarche (2010). Politis (2003) mempelajari penerapan metode bootstrap pada analisis runtun waktu. Menurutnya, metode bootstrap residual bekerja dengan baik tatkala digunakan untuk meyelidiki konsistensi estimator mean sampel pada model autoregresif AR(p). Sementara itu, Lamarche (2010) menerapkan metode delta untuk menyelidiki konsistensi estimator untuk parameter suatau model. Ia mempelajari metode delta dan metode bootstrap, dan menegaskan bahwa konsisten-
8
si estimator dapat diselidiki dengan menggunakan bootstrap residual yang biasanya diterapkan pada model runtun waktu dan regresi. Ia juga membahas metode delta pada bootstrap pasangan yang cocok diterapkan pada model regresi.
1.5.
Metode Penelitian Disertasi ini merupakan kajian yang didasarkan pada studi literatur. Untuk
mendukung dapat diselesaikannya disertasi ini, langkah awal yang dilakukan adalah mempelajari literatur yang berupa buku dan karya ilmiah pendukung seperti jurnal. Literatur inilah yang dijadikan sebagai dasar untuk pengembangan yang dituangkan dalam disertasi ini. Pada tahap ini diperlukan ketelitian untuk mengamati dan mempelajari literatur tersebut yang diharapkan dapat menjembatani penyelesaian masalah inti yang akan dikerjakan dalam disertasi ini. Setelah menghasilkan proposal disertasi, telah dihasilkan beberapa makalah awal untuk memperkuat hasil penelitian disertasi ini. Ini merupakan sarana untuk berkomunikasi dan mendiskusikan hasil penelitian pada forum ilmiah yang diikuti matematikawan, statistikawan dalam kelompok keahlian yang sama untuk diberikan masukan atau saran untuk perbaikan. Selanjutnya, adalah publikasi pada jurnal nasional terakreditasi atau jurnal internasional. Secara rinci untuk menyelesaikan disertasi ini dilakukan langkah-langkah sebagai berikut: 1. Pada Kajian Teoritis (a) Menjabarkan estimator parameter pada proses autoregresif dan versi bootstrap dari estimator tersebut. (b) Mengkonstruksi suatu fungsi terukur yang digunakan untuk menyatakan estimator pada poin (a). (c) Menerapkan metode delta untuk menyelidiki limit distribusi dari estimator pada proses autoregresif. (d) Menerapkan metode delta untuk bootstrap untuk menyelidiki limit distribusi versi bootstrap dari estimator pada proses autoregresif.
9
2. Pada Kajian Simulasi Aplikasi (a) Memilih data nyata untuk melakukan simulasi dan menerapkan hasil-hasil secara teoritis pada data nyata. (b) Membuat simulasi Monte Carlo yang menggunakan data nyata, untuk menguatkan hasil-hasil yang diperoleh. Langkah-langkah konkret untuk menyelesaikan penelitian ini dijabarkan lebih lanjut pada Bab IV dan V.
1.6.
Sistematika Penulisan Disertasi ini terdiri dari enam Bab. Bab I membahas tentang latar belakang
dan permasalahan, tujuan, manfaat, tinjauan pustaka, metode penelitian dan sistematika penulisan disertasi. Dalam Bab II, dibahas tentang teori yang mendukung tulisan ini, misalnya tentang mode kekonvegenan, model runtun waktu autoregresif, metode delta, metode resampling bootstrap, ekspansi Edgeworth, konsistensi estimator bootstrap mean dan laju kekonvergenannya serta beberapa konsep yang berkaitan dengan tujuan penulisan disertasi ini. Sementara itu, pada Bab III dibahas tentang konsistensi estimator parameter pada model autoregresif dan distribusi peluang dari estimator tersebut. Bab IV merupakan hasil inti dari penelitian disertasi ini, yakni membuktikan kekonsistenan estimator bootstrap untuk parameter model autoregresif dengan menggunakan metode delta. Pada Bab V disajikan hasil-hasil simulasi Monte Carlo sebagai aplikasi kajian teoritis yang diterapkan pada data nyata dengan menggunakan perangkat lunak S-Plus. Pada Bab VI, yang merupakan bab terakhir, penulis mencoba menyimpulkan hasil pembahasan dari bab-bab sebelumnya dan memberikan beberapa masalah terbuka.