BAB 2 TINJAUAN PUSTAKA
Pada bab ini akan dibahas tinjauan pustaka yang akan digunakan untuk tesis ini, yang selanjutnya akan diperlukan pada bab 3. Yang akan dibahas dalam bab ini adalah metode bootstrap bootstrap dan metode jackknife.
2.1 Metode Bootstrap Metode bootstrap pertama kali ditemukan oleh Efron (1979) untuk mengestimasi standar error dan selang kepercayaan. Menurut Efron dan Tibshirani (1993) metode bootstrap ini digunakan untuk mencari nilai rata-rata derivatif dari data yang bias dengan melakukan suatu resampling atau pengambilan data sampel yang dilakukan secara berulang-ulang, sehingga akan diketahui berapa besar tingkat kesalahannya (error) dengan menyatakan ukuran sampel bootstrap B sebesar 50 − 200 telah cukup untuk melakukan pendugaan terhadap standar error dengan ukuran n elemen lebih besar atau kurang dari sampel asli. Menurut Sahinler dan Topuz (2007) menyatakan bahwa bootstrap adalah teknik resampling nonparametrik yang bertujuan untuk menentukan estimasi standar error dan interval konfidensi dari parameter populasi seperti mean, rasio, median, proporsi, koefisien korelasi atau koefisien regresi tanpa menggunakan asumsi bootstrap. Menurut Efron dan Tibshirani (1993) pada metode bootstrap ini dapat dilakukan pengembalian sampel dengan pengembalian pada sampel data. Metode penyampelan disebut dengan resampling bootstrap. Secara singkat langkah-langkah bootstrap yang dinyatakan sebagai berikut : 1. Sampel data x didefinisikan sebagai data sampel berukuran n yang terdiri dari xi = x1 , x2 , · · · , xn dengan xi sebagai vektor data pengamatan. 2. Sampel data x diambil secara acak dengan pengembalian sebanyak n kali. Diperoleh data sampel baru yang didefinisikan sebagai X ∗ . Sampel data X ∗ terdiri dari anggota data asli, akan tetapi mungkin beberapa data asli tidak akan muncul, atau muncul hanya satu kali atau dua kali, tergantung dari randomisasinya.
5 Universitas Sumatera Utara
6 3. Langkah (2) dilakukan secara berulang sebanyak B sehingga didapatkan himpunan data bootstrap dengan (x∗1 , x∗2 , · · · , x∗B ). Setiap sampel bootstrap merupakan sampel acak yang saling independen. Dimana mengestimasi standar error dengan menggunakan standar deviasi untuk bootstrap yang di replikasi sebanyak B kali. Menurut Bennett (2009) pemanfaatan metode bootstrap untuk menentukan standar error dari estimator, dengan menentukan jumlah B sampel independen bootstrap x∗1 , x∗2 , · · · , x∗B dimana masing-masing sampel yang diperoleh dari x (data awal). Dan dengan mengevaluasi replikasi yang ada pada masing-masing sampel bootstrap serta dengan mengestimasi standar error dengan menggunakan standar deviasi untuk bootstrap. Adapun kelebihan bootstrap sebagai berikut :
1. Penggunaan metode statistik parametrik biasanya mensyaratkan informasi mengenai distribusi yang harus dipenuhi dan ini sulit untuk dipenuhi. Untuk mengatasi hal ini dapat digunakan metode-metode yang tidak memerlukan asumsi ketat, salah satunya metode bootstrap. 2. Metode ini dapat digunakan untuk ukuran data yang relatif kecil. 3. Teknik ini menciptakan ukuran-ukuran dari ketidakpastian dan bias, khusus nya pada estimasi parameter dari variabel-variabel yang independen dan berdistribusi identik. 4. Metode bootstrap lebih baik dari pada metode tradisional lainnya misalnya metode klasik dan bayes, karena metode bootstrap mengahasilkan panjang interval yang lebih pendek.
Adapun kelemahan metode bootstrap sebagai berikut : 1. Metode bootstrap biasanya memerlukan data bangkitan bootstrap atau resample (sample diperoleh dari pengacakan saling bebas dan dengan pemulihan dari distribusi empiris). Data bangkitan bootstrap ini sulit dicari karena memerlukan beberapa kali perhitungan yang cukup rumit dan membutuhkan ketelitian yang tinggi.
Universitas Sumatera Utara
7 2. Menduga galat baku, disarankan melakukan pengulangan sebanyak minimal 100 kali. pengulangan sebanyak 100 kali ini akan memperlama waktu dalam perhitungan. 2.1.1 Batasan metode bootstrap Ada beberapa batasan dalam metode bootstrap seperti : 1. Pertama dan mungkin yang paling penting, sampel harus cukup besar dan diambil secara random sehingga dapat mewakili keseluruhan populasi. Sampel yang dimaksud disini mengikuti kaidah teorema limit pusat yaitu ≥ 30 karena teknik bootstrap tidak dapat mengatasi beberapa bias untuk sampel yang tidak mewakili dan dalam beberapa kasus akan memperumit masalah. 2. Kedua, bagaimanapun metode parametrik lebih baik dalam banyak kasus untuk membuat pendugaan titik (point estimation) seperti mean. Jadi prosedur bootstrap bisa menambah pendugaan titik di metode parametrik dengan menyediakan estimasi yang lebih akurat. 2.2 Metode Jackknife Sebuah teknik resampling sederhana telah jauh digunakan sebelum metode bootstrap ditemukan, yaitu resampling jackknife. Metode jackknife pertama kali ditemukan oleh Quenouille (1949) yang digunakan untuk memperkirakan bias dari suatu estimator dengan menghapus beberapa observasi sampel. Menurut Tukey (1958) metode jackknife menjadi sesuatu yang lebih berharga karena Tukey mengemukakan pendapatnya bahwa jackknife juga dapat digunakan untuk membangun variansi dari suatu estimator. Metode jackknife ini dapat dibagi berdasarkan banyaknya data yang dihapus menjadi jackknife (Efron dan Tibshirani, 1993). Secara umum sampel jackknife dapat diperoleh melalui sampel berukuran n − d dari distribusi empiris fbn (x) tanpa pengembalian, di peroleh xJ1 , xJ2 , · · · , xJn−d untuk selanjutnya analisis statistik di lakukan berdasarkan pada sampel Jakknife berukuran n − d tersebut. Secara singkat langkah-langkah jackknife dapat dilihat pada grafik berikut ini :
Universitas Sumatera Utara
8 Berikut ini gambar skema langkah-langkah jackknife :
Gambar 2.1 Skema resample
2.3 Jumlah Replikasi Bootstrap dan Jackknife Replikasi bootstrap dan jackknife dari nilai statistik θb adalah nilai satistik yang dihitung dari sampel bootstrap dan jackknife θˆ∗ = s (x∗ ) . Dimana fungsi s(·) adalah fungsi yang diterapkan pada sampel bootstrap dan jackknife x∗ seperti pada halnya fungsi s(·) yang diterapkan pada sampel awal x untuk menb Notasi (∗) menandakan bahwa keseluruhannya dilakukan dapatkan nilai statistik θ. dalam dunia bootstrap dan jackknife. Misalnya s(x) adalah rata-rata sampel awal x, maka s(x∗ ) adalah rata-rata sampel bootstrap dan jackknife yang dinyatakan dengan x∗ .
Universitas Sumatera Utara
9 Menurut (Efron dan Tibshirani, 1993:52) terdapat beberapa hal yang perlu diperhatikan mengenai jumlah replikasi bootstrap dan jackknife, yaitu :
1. Meskipun jumlah replikasi bootstrap dan jackkknife kecil, misal B = 25, biasanya sudah cukup informatif. Tetapi dengan B = 50, sudah sangat cukup untuk b yang akurat. memberikan suatu estimasi seF (θ) 2. Jumlah replikasi bootstrap dan jackknife yang besar, misalnya B = 200, biasanya tidak perlu dilakukan dalam mengestimasi standar error (jumlah replikasi bootstrap dan jackknife yang besar dilakukan dalam interval konfidensi bootstrap dan jackknife).
Universitas Sumatera Utara