METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE
KUSMAN SADIK
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2009
PERNYATAAN MENGENAI DISERTASI DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa disertasi yang berjudul ‘Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space’ adalah hasil karya saya sendiri dengan arahan komisi pembimbing dan belum pernah diajukan kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya penulis lain telah dicantumkan di dalam teks dan Daftar Pustaka disertasi ini.
Bogor, November 2009
Kusman Sadik NIM. G161050021
ABSTRACT
KUSMAN SADIK. Best Linear Unbiased Prediction and Hierarchical Bayes Methods for Small Area Estimation Using State Space Models. Under guidance of KHAIRIL ANWAR NOTODIPUTRO, BUDI SUSETYO, and I WAYAN MANGKU.
There have been two main topics developed by statisticians in a survey, i.e. sampling techniques and estimation methods. The current issues are estimation methods related to estimation of a particular domain having small size of samples or, in more extreme cases, there is no sample available for direct estimation. Sample survey data provide effective reliable estimators of totals and means for large area and domains. But it is recognized that the usual direct survey estimator for a parameter of small area, have unacceptably large standard errors, due to the circumstance of small sample size in the area. The most commonly used models for this case, usually in small area estimation, are based on generalized linear mixed models. Some time happened that some surveys are carried out periodically so that the estimation could be improved by incorporating both the area and time random effects. In this dissertation we propose a state space model which accounts for the two random effects and is based on two equations, namely transition equation and measurement equation. Based on an evaluation criterion, the proposed hierarchical Bayes estimator turns out to be superior to both estimated best linear unbiased prediction (BLUP) and the direct survey estimator. The posterior variances which measure accuracy of the hierarchical Bayes estimates are always smaller than the corresponding variances of the BLUP and the direct survey estimates. Keywords: Generalized linear mixed model, hierarchical Bayes, best linear unbiased prediction, prior and posterior function, generalized variance function, block diagonal covariance, state space model.
RINGKASAN
KUSMAN SADIK. Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO, BUDI SUSETYO, dan I WAYAN MANGKU. Terkait dengan persoalan survei, ada dua topik utama yang menjadi perhatian para statistisi selama tahun-tahun terakhir ini. Topik tersebut menyangkut persoalan pengembangan teknik penarikan contoh dan pengembangan metodologi pendugaan parameter pupulasi. Sebagaimana diketahui, pada umumnya survei rutin yang dilakukan oleh pemerintah suatu negara didesain untuk memperoleh statistik nasional. Artinya, survei semacam ini didesain untuk inferensia bagi daerah yang luas. Persoalan muncul ketika dari survei seperti ini ingin diperoleh informasi untuk area yang lebih kecil, misalnya informasi pada level propinsi, kabupaten, bahkan mungkin level kecamatan. Ukuran contoh pada level area tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar. Bahkan bisa saja pendugaan tidak dapat dilakukan karena area tersebut tidak terpilih menjadi contoh dalam survei. Oleh karena itu dikembangkan metode pendugaan parameter yang dapat mengatasi hal ini. Metode tersebut dikenal dengan metode pendugaan area kecil (small area estimation, SAE). Berbagai metode pendugaan area kecil telah dikembangkan khususnya menyangkut metode yang berbasis model. Area kecil tersebut didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil didasarkan pada aplikasi model desain penarikan contoh (design-based) yang dikenal sebagai pendugaan langsung (direct estimation). Namun, metode pendugaan langsung pada subpopulasi tidak memiliki presisi yang memadai karena kecilnya jumlah contoh yang digunakan untuk memperoleh dugaan tersebut. Oleh karena itu dikembangkan metode pendugaan secara tidak langsung (indirect estimation) di suatu area yang relatif kecil dalam percontohan survei. Tujuan tulisan ini adalah untuk mengkaji konsep dan sifat-sifat statistik pada model campuran linear terampat (generalized linear mixed model) untuk SAE serta mengkaji konsep dan sifat-sifat statistik model SAE yang memasukkan pengaruh acak area dan waktu berdasarkan model state space melalui pendekatan kemungkinan maksimum dan Bayes berhirarki. Nilai tengah pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Prediksi tak-bias linear terbaik (best linear unbiased prediction) dilakukan dengan cara meminimumkan fungsi kuadrat tengah galat (mean square of error), sehingga penduga bagi prediksi tak-bias
linear terbaik (PTLT) memiliki kuadrat tengah galat (KTG) yang paling kecil diantara semua penduga tidak bias linear. Metode kemungkinan maksimum terkendala (restricted maximum likelihood) dapat digunakan untuk menduga komponen ragam atau koragam. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh penduga secara dua tahap sebagai PTLT empirik atau PTLTE. Penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai akar kuadrat tengah galatnya (AKTG) lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Sementara pada data deret waktu (time series data) Susenas, AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE data penampang melintang (cross-sectional data). Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai akar kuadrat tengah galat relatif (AKTGR) metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE non-time series pada waktu T dan korelasi diri yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Metode PTLT pada SAE memerlukan banyak kondisi tertentu yang harus dipenuhi, diantaranya adalah pengasumsian bahwa parameter peubah tetap dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataannya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode PTLT yang memerlukan berbagai kondisi tertentu. Penerapan pada data deret waktu Susenas, diketahui bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Berdasarkan kajian analitik pada model SAE yang memasukkan pengaruh acak area dan waktu, penduga PTLT yang berbasis pada metode kemungkinan maksimum terbatas dan penduga Bayes berhirarki sama-sama bersifat tidak bias. Namun, resiko atau KTG yang dihasilkan penduga Bayes lebih kecil daripada penduga PTLT, artinya dalam hal ini penduga Bayes lebih baik daripada penduga PTLT.
@ Hak Cipta Milik Institut Pertanian Bogor (IPB), Tahun 2009 Hak Cipta Dilindungi Undang-undang 1.
2.
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber: a.
Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah.
b.
Pengutipan tidak merugikan kepentingan yang wajar IPB.
Dilarang mengumumkan atau memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa izin IPB.
METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE
KUSMAN SADIK
Disertasi sebagai salah satu syarat untuk memperoleh gelar Doktor pada Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2009
Penguji Luar Komisi pada Ujian Tertutup, 30 Oktober 2009 1. Prof. Dr. Ir. Aunuddin, MSc. 2. Dr. Ir. Aji Hamim Wigena, MSc.
(Dosen Dept. Statistika IPB) (Dosen Dept. Statistika IPB)
Penguji Luar Komisi pada Ujian Terbuka, 23 November 2009 1. Dr. Bambang Heru Santosa, MEc. (Badan Pusat Statistik, Jakarta) 2. Dr. Ir. Anik Djuraidah, MS. (Dosen Dept. Statistika IPB)
Judul Disertasi
: Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space
Nama Mahasiswa
: Kusman Sadik
NIM
: G161050021
Program Studi
: Statistika
Disetujui, Komisi Pembimbing
Prof. Dr. Ir. Khairil Anwar Notodiputro, MS Ketua
Dr. Ir. Budi Susetyo, MS Anggota
Dr. Ir. I Wayan Mangku, MSc Anggota
Diketahui, Ketua Program Studi Statistika,
Dr. Ir. Aji Hamim Wigena, MSc
Dekan Sekolah Pascasarjana IPB,
Prof. Dr. Ir. Khairil Anwar Notodiputro, MS
Tanggal Ujian Terbuka : 23 November 2009
Tanggal Lulus :
PRAKATA
Puji syukur penulis panjatkan ke hadirat Allah SWT, karena atas rahmat dan hidayah-Nyalah akhirnya disertasi ini dapat diselesaikan. Selama pelaksanaan penelitian dan penyelesaian tulisan ini, penulis banyak mendapatkan
bantuan
dari
berbagai
pihak
diantaranya
adalah
Komisi
Pembimbing, seluruh dosen dan karyawan Departemen Statistika FMIPA IPB, seluruh staf dan karyawan Sekolah Pascasarjana IPB, peneliti dan karyawan di BPS Jakarta, dosen dan karyawan di Joint Program in Survey Methodology (JPSM) University of Maryland Amerika Serikat, keluarga, dan berbagai pihak yang tidak dapat penulis sebutkan semuanya. Dengan segala keterbatasan dan kekurangannya, akhirnya disertasi yang berjudul “Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space” dapat diselesaikan dengan baik. Pada kesempatan ini, secara khusus penulis mengucapkan terima kasih kepada: 1.
Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, Bapak Dr. Ir. Budi Susetyo, dan Bapak Dr. Ir. I Wayan Mangku, selaku dosen pembimbing yang telah banyak memberikan arahan, saran, dan bimbingan.
2.
Bapak Prof. Dr. Ir. Aunuddin dan Bapak Dr. Ir. Aji Hamim Wigena selaku penguji luar komisi pada saat Ujian Tertutup.
3.
Bapak Dr. Bambang Heru Santosa, MEc dan Ibu Dr. Ir. Anik Djuraidah selaku penguji luar komisi pada saat Ujian Terbuka.
4.
Seluruh dosen dan karyawan Departemen Statistika FMIPA IPB yang telah menjadi teman diskusi, memberikan saran, dan dorongan moril.
5.
Seluruh dosen dan karyawan Sekolah Pascasarjana IPB yang telah memberikan layanan pengajaran dan administrasi yang baik.
6.
Para peneliti dan karyawan di BPS Jakarta yang banyak membantu memberikan data dan penjelasannya terkait data Susenas dan Podes.