APROKSIMASI BOOTSTRAP PARAMETRIK PADA PENDUGAAN SELANG PREDIKSI STATISTIK AREA KECIL
LA ODE ABDUL RAHMAN
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008
SURAT PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis Aproksimasi Bootstrap Parametrik pada Pendugaan Selang Prediksi Statistik Area Kecil adalah karya saya dengan arahan dari komisi pembimbing dan belum diajukan kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka dibagian akhir tesis ini.
Bogor, Juni 2008
La Ode Abdul Rahman NIM G151050191
ABSTRACT LA ODE ABDUL RAHMAN. Bootstrap Parametric Approximation on Estimation of Small Area Statistic Prediction Interval. Under direction of KHAIRIL ANWAR NOTODIPUTRO and HARI WIJAYANTO. In statistical inference, there are two kinds of parameter estimation. i.e. (i) point estimation and (ii) interval estimation. In this research, we focused on constructing prediction interval of small area estimator, which can be viewed as a combination of point estimator and hypothesis testing. We construct prediction interval using various methods namely direct, synthetic, Cox, Restricted Maximum Likelihood parametric bootstrap (PB-REML) and Adjustment for Density Maximization parametric bootstrap (PB-ADM) techniques. Each method was simulated under two conditions, with and without auxiliary variables. Evaluation of these methods was carried out based on the smallest average length and the closeness to the expected coverage probability. The result of simulation showed that parametric bootstrap method (PBREML and PB-ADM) produced more accurate prediction interval than the existing methods, such as direct, synthetic or Cox techniques. Moreover, the use of auxiliary variables produce more accurate prediction interval than without auxiliary variables. Overall, the best method for constructing prediction interval in small area estimation has been parametric bootstrap with ADM estimator using auxiliary variables. Finally, this method was utilized to construct prediction interval of percapita expenditure data in Kabupaten Bogor. These methods were applied to analyzed percapita expenditure data in Kabupaten Bogor. The result showed that Sukawangi, Pingku, Banyuasih, Kiarapandak, Karacak, Ciaruten Udik, Sipak, Putat Nutug, Kuta Mekar, Curug, Pamager Sari, Sukamaju and Pasir Mukti could be categorized as villages having low percapita expenditure. On the other hand, Pabuaran, Ciomas Rahayu, Bojong Gede, Cijujung, Benteng and Cileungsi were amongst villages with high percapita expenditure. Keywords : small area, prediction interval, parametric bootstrap, average length, coverage probability
RINGKASAN LA ODE ABDUL RAHMAN. Aproksimasi Bootstrap Parametrik pada Pendugaan Selang Prediksi Statistik Area Kecil. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO dan HARI WIJAYANTO. Pendugaan area kecil (small area estimation) merupakan suatu teknik statistika untuk menduga parameter-parameter subpopulasi yang ukuran contohnya kecil. Teknik pendugaan ini memanfaatkan data dari domain besar seperti data sensus atau data survei sosial ekonomi nasional, untuk menduga peubah yang menjadi perhatian pada domain yang lebih kecil. Pendugaan sederhana area kecil yang didasarkan pada penerapan model desain penarikan contoh (design-based) disebut sebagai pendugaan langsung (direct estimation). Pendugaan ini tidak mampu memberikan ketelitian yang cukup bila ukuran contoh dalam area kecil yang menjadi perhatian berukuran kecil, sehingga statistik yang diperoleh akan memiliki ragam yang besar atau bahkan pendugaan tidak dapat dilakukan karena tidak terwakili dalam survei. Oleh karena itu, dikembangkan teknik pendugaan alternatif untuk meningkatkan keefektifan ukuran contoh dan menurunkan galat baku yakni pendugaan tak langsung (indirect estimation). Pendugaan tak langsung bersifat meminjam kekuatan dari pengamatan contoh area yang berdekatan dengan memanfaatkan informasi tambahan yakni dari sensus dan catatan administratif (Rao 2003). Terdapat dua model penghubung yang digunakan untuk menghubungkan area kecil dengan area lainnya yaitu model penghubung implisit dan model penghubung eksplisit. Model penghubung implisit adalah model yang didasarkan pada desain penarikan contoh. Ada tiga metode dalam pendugaan tak langsung dengan model penghubung implisit yaitu sintetik, komposit, dan James-Stein. Model penghubung eksplisit adalah suatu model yang memasukkan pengaruh acak area kecil untuk mendapatkan keragaman antar area dan juga adanya peubah penyerta dalam model tersebut, yang selanjutnya dikenal sebagai model area kecil. Penduga yang diperoleh dari model area kecil tersebut adalah penduga prediksi tak bias linear terbaik empirik (Empirical Best Linear Unbiased Prediction, EBLUP), penduga Bayes empirik (Empirical Bayes, EB), dan penduga Bayes hirarki (Hierarchical Bayes, HB). Di dalam statistika inferensia, ada dua jenis pendugaan parameter, yaitu (i) pendugaan titik dan (ii) pendugaan selang. Penelitian ini difokuskan pada pendugaan selang prediksi statistik area kecil, yang dapat dipandang sebagai kombinasi pendugaan titik dan pengujian hipotesis. Tujuan penelitian ini adalah mengevaluasi kehandalan metode bootstrap parametrik pada pendugaan selang prediksi statistik area kecil dan menduga selang prediksi pengeluaran perkapita perbulan desa/kelurahan di Kabupaten Bogor. Data yang digunakan untuk mengevaluasi kehandalan metode bootstrap parametrik adalah data yang dibangkitkan dari simulasi. Data simulasi dibangun dari model dua level Fay-Herriot yang sederhana dengan ragam contoh setiap area diasumsikan sama, yaitu D = 1 dengan peubah penyerta maupun tanpa peubah penyerta. Dalam simulasi ditetapkan jumlah area m = 20, ragam antar area
ditetapkan masing-masing A = 0.5, A = 1 dan A = 1.5 yang merupakan representasi dari keragaman antar area yang lebih kecil, sama dan lebih besar dari keragaman di dalam area. Mengingat data pengeluaran perkapita perbulan dapat didekati dengan baik oleh sebaran Gamma, maka data yang dibangkitkan dalam simulasi digunakan sebaran Gamma. Simulasi dilakukan untuk mendapatkan dugaan selang prediksi terbaik dari 5 metode pendugaan selang, yaitu metode langsung, sintetik, Cox, parametrik bootstrap dengan penduga REML sebagai penduga ragam antar area (PB-REML) dan parametrik bootstrap dengan penduga ADM (adjustment for density maximization, PB-ADM) sebagai penduga ragam antar area. Untuk data riil, peubah yang menjadi perhatian adalah pengeluaran perkapita perbulan pada desa/kelurahan yang disurvei dalam Susenas 2005 di Kabupaten Bogor. Peubah penyerta dipilih dengan terlebih dahulu melakukan eksplorasi data terhadap sekumpulan peubah ekonomi yang tersedia pada data Podes 2005. Peubah penyerta yang terpilih dan dianggap dapat menerangkan pengeluaran perkapita perbulan pada suatu rumah tangga untuk level area desa/kelurahan meliputi : (1) persentase keluarga pra sejahtera dan sejahtera 1, (2) persentase keluarga pengguna listrik PLN, (3) persentase surat miskin yang dikeluarkan desa, dan (4) jumlah penduduk. Hasil simulasi data tanpa peubah penyerta menunjukkan bahwa untuk keragaman antar area yang lebih kecil dari keragaman di dalam area, yaitu A = 0.5 dan D = 1, terdapat 2 metode yang menghasilkan coverage probability (CP) yang mendekati CP yang diharapkan (95%), yaitu teknik pendugaan langsung dan teknik pendugaan selang prediksi dengan bootstrap parametrik ADM (PB-ADM) dengan nilai CP masing-masing 95,17% dan 95,00%. Selang prediksi terbaik adalah selang prediksi menggunakan aproksimasi PB-ADM, karena panjang selang prediksi metode ini yaitu 2.74 relatif lebih kecil dibanding metode langsung yang mencapai 3.92. Untuk keragaman antar area dan keragaman di dalam area yang sama, yaitu A = 1 dan D = 1, ada 2 metode yang menghasilkan CP yang mendekati CP yang diharapkan yaitu teknik pendugaan langsung dan teknik pendugaan selang prediksi dengan PB-ADM masing-masing 94.93% dan 95.17%. Selang prediksi terbaik adalah selang prediksi menggunakan PB-ADM karena panjang selang prediksi metode ini, yaitu 3.11 relatif lebih kecil dibanding metode langsung yang mencapai 3.92. Sedangkan untuk keragaman antar area yang lebih besar dari keragaman di dalam area, yaitu D = 1 dan A = 1.5, terdapat 3 metode yang mendekati CP yang diharapkan yaitu pendugaan langsung, pendugaan dengan bootstrap parametrik REML (PB-REML) dan pendugaan dengan PB-ADM, masing-masing 95.13%, 94.37% dan 94.80%. Akan tetapi, pendugaan dengan PB-ADM memiliki panjang selang relatif lebih kecil, yaitu 3.27 daripada pendugaan langsung maupun pendugaan dengan PB-REML, di mana panjang selang masing-masing sebesar 3.92 dan 3.27. Hasil simulasi data dengan menggunakan peubah penyerta menunjukkan hasil metode terbaik yang sama dengan simulasi data tanpa menggunakan peubah penyerta. Akan tetapi, penggunaan peubah penyerta mampu meningkatkan keakuratan pendugaan selang prediksi, karena panjang selang prediksi
menggunakan peubah penyerta relatif lebih kecil dibanding tanpa menggunakan peubah penyerta. Secara keseluruhan, pendugaan selang prediksi dengan PB-ADM menggunakan peubah penyerta merupakan metode yang paling baik dibanding metode pendugaan lainnya untuk semua kemungkinan kombinasi keragaman antar area dan keragaman di dalam area. Metode pendugaan selang prediksi terbaik yang diperoleh melalui simulasi, yaitu PB–ADM kemudian digunakan untuk menduga selang prediksi rata-rata pengeluaran perkapita perbulan desa/kelurahan di Kabupaten Bogor. Hasil pendugaan selang menunjukkan desa-desa Sukawangi, Pingku, Banyuasih, Kiarapandak, Karacak, Ciaruten Udik, Sipak, Putat Nutug, Kuta Mekar, Curug, Pamager Sari, Sukamaju dan Pasir Mukti dapat dikategorikan sebagai desa/kelurahan di Kabupaten Bogor dengan rata-rata pengeluaran perkapita perbulan rendah. Sedangkan Pabuaran, Ciomas Rahayu, Bojong Gede, Cijujung, Benteng dan Cileungsi merupakan desa-desa di Kabupaten Bogor dengan rata-rata pengeluaran perkapita perbulan tinggi. Kata Kunci : area kecil, selang prediksi, bootstrap parametrik, panjang selang, coverage probability.
Hak cipta milik IPB, tahun 2008. Hak cipta dilindungi Undang-undang. 1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber. a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah. b. Pengutipan tidak merugikan kepentingan yang wajar IPB. 2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa izin IPB.
APROKSIMASI BOOTSTRAP PARAMETRIK PADA PENDUGAAN SELANG PREDIKSI STATISTIK AREA KECIL
LA ODE ABDUL RAHMAN
Tesis Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008
Penguji Luar Komisi pada Ujian Tesis : Dr. Ir. I Made Sumertajaya, MS
Judul Tesis Nama Mahasiswa Nomor Register Pokok Program Studi
: Aproksimasi Bootstrap Parametrik pada Pendugaan Selang Prediksi Statistik Area Kecil : La Ode Abdul Rahman : G151050191 : Statistika
Disetujui, Komisi Pembimbing
Prof. Dr. Ir. Khairil A. Notodiputro, MS Ketua
Dr. Ir. Hari Wijayanto, MS Anggota
Diketahui,
Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana IPB
Dr. Ir. Aji Hamim Wigena, MSc
Prof. Dr. Ir. Khairil A. Notodiputro, MS
Tanggal Lulus :
Tanggal Ujian : 20 Juni 2008