METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE
KUSMAN SADIK
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2009
PERNYATAAN MENGENAI DISERTASI DAN SUMBER INFORMASI
Dengan ini saya menyatakan bahwa disertasi yang berjudul ‘Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space’ adalah hasil karya saya sendiri dengan arahan komisi pembimbing dan belum pernah diajukan kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya penulis lain telah dicantumkan di dalam teks dan Daftar Pustaka disertasi ini.
Bogor, November 2009
Kusman Sadik NIM. G161050021
ABSTRACT
KUSMAN SADIK. Best Linear Unbiased Prediction and Hierarchical Bayes Methods for Small Area Estimation Using State Space Models. Under guidance of KHAIRIL ANWAR NOTODIPUTRO, BUDI SUSETYO, and I WAYAN MANGKU.
There have been two main topics developed by statisticians in a survey, i.e. sampling techniques and estimation methods. The current issues are estimation methods related to estimation of a particular domain having small size of samples or, in more extreme cases, there is no sample available for direct estimation. Sample survey data provide effective reliable estimators of totals and means for large area and domains. But it is recognized that the usual direct survey estimator for a parameter of small area, have unacceptably large standard errors, due to the circumstance of small sample size in the area. The most commonly used models for this case, usually in small area estimation, are based on generalized linear mixed models. Some time happened that some surveys are carried out periodically so that the estimation could be improved by incorporating both the area and time random effects. In this dissertation we propose a state space model which accounts for the two random effects and is based on two equations, namely transition equation and measurement equation. Based on an evaluation criterion, the proposed hierarchical Bayes estimator turns out to be superior to both estimated best linear unbiased prediction (BLUP) and the direct survey estimator. The posterior variances which measure accuracy of the hierarchical Bayes estimates are always smaller than the corresponding variances of the BLUP and the direct survey estimates. Keywords: Generalized linear mixed model, hierarchical Bayes, best linear unbiased prediction, prior and posterior function, generalized variance function, block diagonal covariance, state space model.
RINGKASAN
KUSMAN SADIK. Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO, BUDI SUSETYO, dan I WAYAN MANGKU. Terkait dengan persoalan survei, ada dua topik utama yang menjadi perhatian para statistisi selama tahun-tahun terakhir ini. Topik tersebut menyangkut persoalan pengembangan teknik penarikan contoh dan pengembangan metodologi pendugaan parameter pupulasi. Sebagaimana diketahui, pada umumnya survei rutin yang dilakukan oleh pemerintah suatu negara didesain untuk memperoleh statistik nasional. Artinya, survei semacam ini didesain untuk inferensia bagi daerah yang luas. Persoalan muncul ketika dari survei seperti ini ingin diperoleh informasi untuk area yang lebih kecil, misalnya informasi pada level propinsi, kabupaten, bahkan mungkin level kecamatan. Ukuran contoh pada level area tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar. Bahkan bisa saja pendugaan tidak dapat dilakukan karena area tersebut tidak terpilih menjadi contoh dalam survei. Oleh karena itu dikembangkan metode pendugaan parameter yang dapat mengatasi hal ini. Metode tersebut dikenal dengan metode pendugaan area kecil (small area estimation, SAE). Berbagai metode pendugaan area kecil telah dikembangkan khususnya menyangkut metode yang berbasis model. Area kecil tersebut didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil didasarkan pada aplikasi model desain penarikan contoh (design-based) yang dikenal sebagai pendugaan langsung (direct estimation). Namun, metode pendugaan langsung pada subpopulasi tidak memiliki presisi yang memadai karena kecilnya jumlah contoh yang digunakan untuk memperoleh dugaan tersebut. Oleh karena itu dikembangkan metode pendugaan secara tidak langsung (indirect estimation) di suatu area yang relatif kecil dalam percontohan survei. Tujuan tulisan ini adalah untuk mengkaji konsep dan sifat-sifat statistik pada model campuran linear terampat (generalized linear mixed model) untuk SAE serta mengkaji konsep dan sifat-sifat statistik model SAE yang memasukkan pengaruh acak area dan waktu berdasarkan model state space melalui pendekatan kemungkinan maksimum dan Bayes berhirarki. Nilai tengah pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Prediksi tak-bias linear terbaik (best linear unbiased prediction) dilakukan dengan cara meminimumkan fungsi kuadrat tengah galat (mean square of error), sehingga penduga bagi prediksi tak-bias
linear terbaik (PTLT) memiliki kuadrat tengah galat (KTG) yang paling kecil diantara semua penduga tidak bias linear. Metode kemungkinan maksimum terkendala (restricted maximum likelihood) dapat digunakan untuk menduga komponen ragam atau koragam. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh penduga secara dua tahap sebagai PTLT empirik atau PTLTE. Penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai akar kuadrat tengah galatnya (AKTG) lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Sementara pada data deret waktu (time series data) Susenas, AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE data penampang melintang (cross-sectional data). Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai akar kuadrat tengah galat relatif (AKTGR) metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE non-time series pada waktu T dan korelasi diri yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Metode PTLT pada SAE memerlukan banyak kondisi tertentu yang harus dipenuhi, diantaranya adalah pengasumsian bahwa parameter peubah tetap dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataannya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode PTLT yang memerlukan berbagai kondisi tertentu. Penerapan pada data deret waktu Susenas, diketahui bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Berdasarkan kajian analitik pada model SAE yang memasukkan pengaruh acak area dan waktu, penduga PTLT yang berbasis pada metode kemungkinan maksimum terbatas dan penduga Bayes berhirarki sama-sama bersifat tidak bias. Namun, resiko atau KTG yang dihasilkan penduga Bayes lebih kecil daripada penduga PTLT, artinya dalam hal ini penduga Bayes lebih baik daripada penduga PTLT.
@ Hak Cipta Milik Institut Pertanian Bogor (IPB), Tahun 2009 Hak Cipta Dilindungi Undang-undang 1.
2.
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber: a.
Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah.
b.
Pengutipan tidak merugikan kepentingan yang wajar IPB.
Dilarang mengumumkan atau memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa izin IPB.
METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE
KUSMAN SADIK
Disertasi sebagai salah satu syarat untuk memperoleh gelar Doktor pada Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2009
Penguji Luar Komisi pada Ujian Tertutup, 30 Oktober 2009 1. Prof. Dr. Ir. Aunuddin, MSc. 2. Dr. Ir. Aji Hamim Wigena, MSc.
(Dosen Dept. Statistika IPB) (Dosen Dept. Statistika IPB)
Penguji Luar Komisi pada Ujian Terbuka, 23 November 2009 1. Dr. Bambang Heru Santosa, MEc. (Badan Pusat Statistik, Jakarta) 2. Dr. Ir. Anik Djuraidah, MS. (Dosen Dept. Statistika IPB)
Judul Disertasi
: Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space
Nama Mahasiswa
: Kusman Sadik
NIM
: G161050021
Program Studi
: Statistika
Disetujui, Komisi Pembimbing
Prof. Dr. Ir. Khairil Anwar Notodiputro, MS Ketua
Dr. Ir. Budi Susetyo, MS Anggota
Dr. Ir. I Wayan Mangku, MSc Anggota
Diketahui, Ketua Program Studi Statistika,
Dr. Ir. Aji Hamim Wigena, MSc
Dekan Sekolah Pascasarjana IPB,
Prof. Dr. Ir. Khairil Anwar Notodiputro, MS
Tanggal Ujian Terbuka : 23 November 2009
Tanggal Lulus :
PRAKATA
Puji syukur penulis panjatkan ke hadirat Allah SWT, karena atas rahmat dan hidayah-Nyalah akhirnya disertasi ini dapat diselesaikan. Selama pelaksanaan penelitian dan penyelesaian tulisan ini, penulis banyak mendapatkan
bantuan
dari
berbagai
pihak
diantaranya
adalah
Komisi
Pembimbing, seluruh dosen dan karyawan Departemen Statistika FMIPA IPB, seluruh staf dan karyawan Sekolah Pascasarjana IPB, peneliti dan karyawan di BPS Jakarta, dosen dan karyawan di Joint Program in Survey Methodology (JPSM) University of Maryland Amerika Serikat, keluarga, dan berbagai pihak yang tidak dapat penulis sebutkan semuanya. Dengan segala keterbatasan dan kekurangannya, akhirnya disertasi yang berjudul “Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space” dapat diselesaikan dengan baik. Pada kesempatan ini, secara khusus penulis mengucapkan terima kasih kepada: 1.
Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, Bapak Dr. Ir. Budi Susetyo, dan Bapak Dr. Ir. I Wayan Mangku, selaku dosen pembimbing yang telah banyak memberikan arahan, saran, dan bimbingan.
2.
Bapak Prof. Dr. Ir. Aunuddin dan Bapak Dr. Ir. Aji Hamim Wigena selaku penguji luar komisi pada saat Ujian Tertutup.
3.
Bapak Dr. Bambang Heru Santosa, MEc dan Ibu Dr. Ir. Anik Djuraidah selaku penguji luar komisi pada saat Ujian Terbuka.
4.
Seluruh dosen dan karyawan Departemen Statistika FMIPA IPB yang telah menjadi teman diskusi, memberikan saran, dan dorongan moril.
5.
Seluruh dosen dan karyawan Sekolah Pascasarjana IPB yang telah memberikan layanan pengajaran dan administrasi yang baik.
6.
Para peneliti dan karyawan di BPS Jakarta yang banyak membantu memberikan data dan penjelasannya terkait data Susenas dan Podes.
7.
Prof. Partha Lahiri, yang telah memberikan arahan dan pengajaran terkait konsep teori dan metodologi Small Area Estimation selama penulis melaksanakan Program Sandwich di Joint Program in Survey Methodology, University of Maryland, Amerika Serikat.
8.
Direktorat Pendidikan Tinggi, yang telah memberikan berbagai bantuan biaya pendidikan dan penelitian.
9.
Seluruh anggota keluarga penulis, yang senantiasa memberikan dorongan semangat dan doa yang ikhlas.
10.
Serta berbagai pihak lain yang tidak dapat penulis sebutkan seluruhnya secara satu persatu.
Akhir kalam, dengan segala kerendahan hati, penulis menyadari bahwa disertasi ini masih jauh dari kesempurnaan. Namun demikian, penulis berharap tulisan ini dapat bermanfaat bagi mereka yang memerlukannya. Aamiin.
RIWAYAT HIDUP
Penulis dilahirkan di Sumenep pada tanggal 12 September 1969, sebagai anak kedua dari pasangan Muhammad Durri (alm) dan Siti Ahmadiyah (almh). Pendidikan sarjana ditempuh di Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor (IPB), lulus pada tahun 1995. Pada tahun 1996 penulis diterima di Program Magister Statistika pada Program Pascasarjana IPB, dan menyelesaikannya pada tahun 1999. Pada tahun 2005 penulis mendapat kesempatan untuk mengikuti Program Doktor pada Program Studi Statistika, Sekolah Pasacasarjana IPB, dengan beasiswa pendidikan (BPPS) diperoleh dari Direktorat Jendral Pendidikan Tinggi, Depdiknas RI. Pada tahun 2008, penulis mengikuti Program Sandwich ke University of Maryland, Amerika Serikat, untuk mengikuti kuliah dan melakukan penelitian terkait dengan metode pendugaan area kecil yang menjadi fokus dalam disertasi ini. Pada saat ini penulis bekerja sebagai dosen pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, IPB. Penulis menikah dengan Kurniawati Rahmi Wijaya, S.Si dan telah dikaruniai tiga orang anak, yaitu Firyali Rahmani Shidqi, Muhammad Sayyidurrahman Ash Shidqi, dan Radhwa Rahmaniyah Ash Shidqi. Selama mengikuti program S3, penulis telah mempresentasikan beberapa karya ilmiah dalam seminar nasional dan internasional, dan sebagiannya dipublikasikan dalam jurnal ilmiah nasional. Karya-karya ilmiah tersebut adalah: 1.
Sadik, K. and Notodiputro, K.A. 2009. Hierarchical Bayes Estimation Using Time Series and Cross-sectional Data : A Case of Percapita Expenditure in Indonesia. Conference of Small Area Estimation, 29 Juni – 01 Juli 2009, Elche, Spanyol.
2.
Sadik, K. 2008. Hierarchical Bayes Approach in Small Area Estimation. Makalah Seminar Reguler di Joint Program in Survey Methodology, University of Maryland, USA. Oktober, 2008.
3.
Sadik, K., Notodiputro, K.A., Susetyo, B., Mangku, I.W. 2008. Small Area Estimation With Time and Area Effects Using A Dynamic
Linear Model. The 3rd International Conference on Mathematics and Statistics (ICoMS-3). Institut Pertanian Bogor, Indonesia, 56 August 2008. 4.
Sadik, K. and Notodiputro, K.A. 2007. A State Space Model in Small Area Estimation. The 9th Islamic Countries Conference on Statistical Sciences 2007 (ICCS-IX), Kuala Lumpur: 12-14 December 2007.
5.
Sadik, K. dan Notodiputro, K.A. 2007. Model State Space pada GLMM untuk Pendugaan Area Kecil (Small Area Estimation). Prosiding pada Seminar Nasional Statistika: 24 Mei 2007, Unisba – Bandung.
6.
Sadik, K. dan Notodiputro, K.A. 2006. Pendekatan P-Spline MQuantile dalam Pendugaan Area Kecil (Small Area Estimation). Jurnal Matematika Aplikasi dan Pembelajaran, Vol. 5 No.2 Jilid 1, p:142-147, Universitas Negeri Jakarta, Jakarta.
7.
Sadik, K. dan Notodiputro, K.A. 2006. Small Area Estimation with Time and Area Effects Using Two Stage Estimation. Proceeding at the First International Conference on Mathematics and Statistics, MSMSSEA, 19-21 June 2006, Bandung.
8.
Sadik, K., Notodiputro, K.A., Susetyo, B., Mangku, I.W. 2006. Pendugaan Area Kecil (Small Area Estimation) Berdasarkan Model yang Mengandung Langkah Acak (Random Walk). Prosiding Seminar Nasional Matematika dan Konferda IndoMS wilayah Jabar & Banten, 22 April 2006, Jurusan Matematika UNPAD, Bandung.
DAFTAR ISI
DAFTAR TABEL ........................................................................................... xvii DAFTAR GAMBAR ...................................................................................... xviii DAFTAR LAMPIRAN ................................................................................... I.
xix
PENDAHULUAN .................................................................................
1
1.1. Latar Belakang ..............................................................................
1
1.2. Tujuan Penelitian ..........................................................................
3
1.3. Ruang Lingkup ..............................................................................
3
1.4. Kebaruan / Novelty ........................................................................
4
TINJAUAN METODE PENDUGAAN AREA KECIL ....................
5
2.1. Pendahuluan ..................................................................................
5
2.1.1. Keuntungan dan Keterbatasan Penarikan Contoh .............
6
2.1.2. Validitas, Reliabilitas, dan Keakuratan .............................
6
2.1.3. Pendugaan Ukuran Contoh ...............................................
7
2.2. Perkembangan Metode SAE .........................................................
9
2.2.1. Metode Pendugaan Tidak Langsung untuk Area Kecil ...
12
2.2.2. Pendekatan Model Campuran Linear Terampat ...............
14
2.2.3. Pengaruh Penarikan Contoh pada Pendugaan Tidak Langsung ...........................................................................
16
2.3. Metode SAE dan Model State Space ............................................
23
2.4. Statistik Area Kecil untuk Data BPS ............................................
23
2.4.1. Jenis Data yang Dikumpulkan ..........................................
24
2.4.2. Rancangan Penarikan Contoh Susenas .............................
25
2.4.3. Pendugaan Data Rumah Tangga .......................................
27
2.4.4. Persoalan Ukuran Contoh pada Susenas ...........................
28
III. METODE PREDIKSI TAK-BIAS LINEAR TERBAIK UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE …… . .........................................................................................
31
3.1. Pendahuluan ..................................................................................
31
3.2. MCLT dengan Pengaruh Acak Area dan Waktu ..........................
40
II.
xiv
3.3. Model State Space pada Pendugaan Area Kecil ...........................
41
3.4. Pendugaan Parameter Model dengan KMT ..................................
44
3.4.1. Penduga Tak-bias Linear Terbaik (PTLT) ........................
44
3.4.2. Penduga Dua Tahap ..........................................................
46
3.5. Pendekatan Orde Kedua untuk KTG .............................................
48
3.6. Evaluasi terhadap Penduga KTG ..................................................
51
3.7. Penerapan pada Data Susenas dan Simulasi ..................................
59
3.7.1. Data Susenas .....................................................................
59
3.7.2. Data Simulasi ....................................................................
64
3.8. Simpulan .......................................................................................
66
IV. METODE BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE ........................
68
4.1. Pendahuluan ..................................................................................
68
4.2. Metode Bayes Empirik ..................................................................
68
4.3. Metode Bayes Berhirarki ..............................................................
73
4.3.1. Kasus 2 Diketahui ...........................................................
76
4.3.2. Kasus 2 Tidak Diketahui .................................................
77
4.4. Bayes Berhirarki untuk Model State Space ..................................
78
4.5. Penduga Bagi KTG .......................................................................
85
4.6. Metode Gibbs Sampling ................................................................
89
4.7. Penerapan pada Data Susenas dan Simulasi ..................................
90
4.7.1. Data Susenas .....................................................................
90
4.7.2. Data Simulasi ....................................................................
96
4.8. Simpulan ....................................................................................... 101 V.
PEMBAHASAN UMUM ..................................................................... 103 5.1. Pendahuluan .................................................................................. 103 5.2. Keunggulan Metode Bayes daripada Metode PTLT pada Model SAE Secara Analitik ..................................................................... 104 5.3. Hasil Studi Kasus pada Data ......................................................... 107 5.4. Lesson Learned ............................................................................. 112
VI. SIMPULAN DAN SARAN .................................................................. 113 6.1. Simpulan ....................................................................................... 113 6.2. Saran ….......................................................................................... 114
xv
DAFTAR PUSTAKA ..................................................................................... 116 DAFTAR ISTILAH DAN SINGKATAN ...................................................... 121 LAMPIRAN .................................................................................................... 122
xvi
DAFTAR TABEL
Tabel 2.1. Perbandingan Antara Ukuran Contoh Susenas 2005 (n) dengan Jumlah n Minimum pada Batas d = 0.01. ..................................
28
Tabel 3.1. Perbandingan Antara Metode Pendugaan Langsung dengan Metode Pendugaan Tidak Langsung untuk Rata-rata Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas 2005 Wilayah Kota Bogor ............................................
61
Tabel 3.2. Perbandingan Antara Metode PTLTE Penampang Melintang dengan Metode PTLTE Deret Waktu untuk Data Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .....................................................
62
Tabel 3.3. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode PTLTE Penampang Melintang dan Metode PTLTE Deret Waktu untuk Data Simulasi .......................................................
64
Tabel 3.4. Nilai Rata-rata AKTGR pada Metode PTLTE Penampang Melintang dan Metode PTLTE Deret Waktu untuk Data Simulasi ......................................................................................
65
Tabel 4.1. Perbandingan Antara Metode PTLTE dengan Metode Bayes Berhirarki Model 1 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .....................................................
92
Tabel 4.2. Perbandingan Antara Metode Bayes Berhirarki Model 1 dengan Model 2 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .................................................................................
94
Tabel 4.3. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode Bayes Berhirarki Model 1 dengan Model 2 untuk Data Simulasi ........
97
Tabel 4.4. Nilai Rata-rata AKTGR pada Metode Bayes Berhirarki Model 1 dengan Model 2 untuk Data Simulasi .....................................
98
Tabel 5.1. Perbandingan KTG dan AKTG Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .................................................................................
109
Tabel 5.2. Perbandingan KTG dan AKTG Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .................................................................................
110
Tabel 5.3. Nilai Rata-rata AKTGR pada Metode PTLTE dan Bayes Berhirarki untuk Data Simulasi Deret Waktu ............................
111
xvii
DAFTAR GAMBAR
Gambar 2.1. Diagram Alur Metode Penarikan Contoh Susenas .................
27
Gambar 3.1. Plot Antara AKTG Penduga Langsung dengan AKTG Hasil Metode PTLTE Data Penampang Melintang ..........................
62
Gambar 3.2. Plot Antara AKTG Metode PTLTE Penampang Melintang dengan AKTG Metode PTLTE Deret Waktu .........................
63
Gambar 4.1. Plot Antara AKTG Metode PTLTE dengan AKTG Metode Bayes Berhirarki Model 1 .......................................................
93
Gambar 4.2. Plot Antara AKTG Metode Bayes Berhirarki Model 1 dan Model 2 ...................................................................................
95
Gambar 4.3. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 0 untuk Metode Bayes Berhirarki Model 1 dan Model 2 ...........
98
Gambar 4.4. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 1 untuk Metode Bayes Berhirarki Model 1 dan Model 2 ...........
99
Gambar 4.5. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 2 untuk Metode Bayes Berhirarki Model 1 dan Model 2 ...........
99
Gambar 4.6. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 3 untuk Metode Bayes Berhirarki Model 1 dan Model 2 ...........
100
Gambar 4.7. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 4 untuk Metode Bayes Berhirarki Model 1 dan Model 2 ...........
100
Gambar 4.8. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 5 untuk Metode Bayes Berhirarki Model 1 dan Model 2 ...........
101
xviii
DAFTAR LAMPIRAN
Lampiran 1. Program R untuk Bayes Berhirarki Model 1 ...........................
123
Lampiran 2. Program R untuk Bayes Berhirarki Model 2 ...........................
128
Lampiran 3. Program R untuk Simulasi Data ..............................................
134
Lampiran 4. Perbandingan Antara Metode Pendugaan Langsung dengan Metode Pendugaan Tidak Langsung untuk Rata-rata Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas 2005 Wilayah Kota Bogor .........................................
139
Lampiran 5. Perbandingan Antara Metode PTLTE Penampang Melintang dengan Metode PTLTE Deret Waktu untuk Data Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor ..................................................
141
Lampiran 6. Perbandingan Antara Metode PTLTE dengan Metode Bayes Berhirarki Model 1 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor ..................................................
143
Lampiran 7. Perbandingan Antara Metode Bayes Berhirarki Model 1 dengan Model 2 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor ..............................................................................
145
Lampiran 8. Perbandingan KTG dan AKTG Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor ..................................................
147
Lampiran 9. Metode Pendugaan Langsung yang digunakan oleh BPS untuk Data Susenas (BPS, 2005) ............................................
149
xix
BAB I 1.
Pendahuluan
1.1. Latar Belakang Survei merupakan salah satu bagian penting dari proses pengambilan keputusan yang berbasis pada data. Karena itu, survei sering dilakukan secara rutin baik di lembaga penelitian swasta maupun negeri. Terkait dengan persoalan survei tersebut, ada dua topik utama yang menjadi perhatian para statistisi pada tahun-tahun terakhir ini. Topik tersebut menyangkut persoalan pengembangan teknik penarikan contoh dan pengembangan metodologi pendugaan parameter populasi untuk area dengan contoh kecil. Survei rutin yang dilakukan oleh pemerintah suatu negara, umumnya didesain untuk memperoleh statistik nasional. Artinya, survei semacam ini didesain untuk inferensia bagi daerah yang luas. Persoalan muncul ketika dari survei seperti ini ingin diperoleh informasi untuk area yang lebih kecil, misalnya informasi pada level propinsi, kabupaten, bahkan mungkin level kecamatan. Ukuran contoh pada level area tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar. Bahkan bisa saja pendugaan tidak dapat dilakukan karena area tersebut tidak terpilih menjadi contoh dalam survei. Oleh karena itu dikembangkan metode pendugaan parameter yang dapat mengatasi hal ini. Metode tersebut dikenal dengan metode pendugaan area kecil (small area estimation, SAE). Statistik area kecil semacam itu telah menjadi perhatian para statistisi dunia secara sangat serius sejak sepuluh tahun terakhir ini (misalnya Ghosh and Rao, 1994; Chand dan Alexander, 1995; You dan Rao, 2000; Rao, 2003; Russo et.al., 2005; Chambers dan Chandra, 2006; Lahiri, 2008). Berbagai metode SAE telah dikembangkan khususnya menyangkut metode yang berbasis model. Area kecil tersebut didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil
1
didasarkan pada aplikasi model desain penarikan contoh (design-based) yang dikenal sebagai pendugaan langsung (direct estimation). Namun, metode pendugaan langsung pada sub-populasi tidak memiliki presisi yang memadai karena kecilnya jumlah contoh yang digunakan untuk memperoleh dugaan tersebut. Oleh karena itu dikembangkan metode pendugaan secara tidak langsung (indirect estimation) di suatu area yang relatif kecil dalam percontohan survei (Lahiri dan Rao, 1995; Russo et al, 2005) Menurut Lahiri (2008), metode pendugaan tidak langsung pada area kecil pada dasarnya memanfaatkan kekuatan area sekitarnya (neighbouring areas) dan sumber data di luar area yang statistiknya ingin diperoleh. Dalam hal ini, model dikembangkan dengan asumsi bahwa keragaman didalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi penyerta (auxiliary) yang berupa pengaruh tetap, sedangkan keragaman specifik area kecil diasumsikan dapat diterangkan oleh informasi tambahan yang berupa pengaruh acak area. Meningkatnya kebutuhan terhadap metode SAE saat ini terjadi seiring dengan meningkatnya kebutuhan pemerintah dan para pengguna statistik (termasuk dunia bisnis) terhadap informasi yang lebih rinci, cepat, dan handal, tidak saja untuk lingkup negara tetapi pada lingkup yang lebih kecil seperti provinsi, kabupaten, bahkan kecamatan atau kelurahan. Di Indonesia pentingnya statistik area kecil semakin dirasakan seiring dengan era otonomi daerah dimana sistem ketatanegaraan bergeser dari sistem sentralisasi ke sistem desentralisasi. Pada sistem desentralisasi pemerintah daerah memiliki kewenangan yang lebih besar untuk mengatur dirinya sendiri. Kebutuhan statistik pada level kabupaten, dengan demikian, menjadi keniscayaan sebagai dasar bagi pemerintah daerah untuk menyusun sistem perencanaan, pemantauan dan penilaian pembangunan daerah atau kebijakan penting lainnya. Menurut Sadik et al (2006, 2008), model pendugaan parameter area kecil akan sangat membantu khususnya dalam menyediakan kebutuhan data dan informasi yang akurat untuk kebutuhan daerah di Indonesia seperti level propinsi, kabupaten/kota atau bahkan kecamatan dengan memanfaatkan keakuratan data BPS pada level nasional, tanpa harus mengeluarkan biaya besar untuk
2
mengumpulkan data sendiri. Dengan demikian, secara nasional akan cukup banyak biaya yang bisa dihemat sehingga dapat dialokasikan untuk pembiayaan pembangunan lainnya.
1.2. Tujuan Penelitian Secara umum tujuan penelitian ini adalah untuk mengkaji sifat-sifat statistik pada: a.
Model campuran linear terampat (generalized linear mixed model) sebagai model dasar SAE.
b.
Model SAE yang memasukkan pengaruh acak area dan waktu (state space) melalui pendekatan prediksi tak-bias linear terbaik (best linear unbiased prediction).
c.
Model SAE yang memasukkan pengaruh acak area dan waktu (state space) melalui pendekatan Bayes berhirarki.
1.3. Ruang Lingkup Fokus penelitian ini adalah kajian terhadap metode SAE yang memasukkan pengaruh acak area dan waktu berdasarkan model state space. Pendekatan yang digunakan untuk pendugaan parameter model tersebut adalah metode prediksi takbias linear terbaik (PTLT) dan Bayes berhirarki. Penelaahan terhadap konsep dan sifat-sifat statistik model dilakukan secara analitik dan empirik. Pada Bab II dibahas tinjauan metode SAE secara umum mencakup perkembangan metode SAE, metode pendugaan tidak langsung pada area kecil, pendekatan model campuran linear terampat (MCLT) pada SAE, pengaruh penarikan contoh pada pendugaan tidak langsung, serta persoalan statistik area kecil pada data Badan Pusat Statistik (BPS). Sementara kajian tentang metode PTLT pada pendugaan area kecil berdasarkan model state space dipaparkan pada Bab III yang mencakup pendekatan MCLT pada model SAE dengan pengaruh acak area dan waktu, metode PTLT, pendekatan kuadrat tengah galat / KTG (mean square error / MSE) dengan orde kedua, evaluasi terhadap penduga KTG, serta studi kasus penerapan pada data Susenas dan data simulasi.
3
Metode Bayes berhirarki pada pendugaan area kecil berdasarkan model state space dibahas pada Bab IV. Pembahasan tersebut mencakup konsep metode Bayes empirik dan berhirarki, pendekatan Bayes berhirarki pada model state space, penduga bagi KTG, metode Gibbs sampling, serta studi kasus penerapan pada data Susenas dan data simulasi. Pembahasan umum pada Bab V bertujuan untuk membandingkan sifat-sifat statistik model SAE state space antara metode PTLT dengan metode Bayes berhirarki baik secara empirik maupun analitik. Sementara Bab VI memaparkan simpulan dari penelitian secara keseluruhan dan saran untuk penelitian selanjutnya khususnya menyangkut hal-hal keterbatasan pada penelitian ini.
1.4. Kebaruan / Novelty Pemikiran tentang SAE yang berbasis pada model telah mendapatkan perhatian para statistisi dunia hingga saat ini khususnya setelah JNK Rao (2003) mengeluarkan buku tentang SAE. Buku tersebut merupakan buku pertama yang membahas tentang pendugaan area kecil dengan cara mengkompilasi beberapa hasil penelitian yang telah dipublikasikan di berbagai jurnal ilmiah internasional. Sampai saat ini banyak dilakukan konferensi statistika internasional terkait dengan pengembangan metode pendugaan area kecil tersebut. Penelitian yang menjadi topik dalam disertasi ini merupakan perluasan kajian SAE dari beberapa hasil kajian para statistisi dunia yang mereka publikasikan dalam jurnal ilmiah. Ada dua kebaruan yang disajikan dalam disertasi ini. Pertama adalah penjabaran dan pembuktian secara analitik terhadap sifat-sifat statistik pada model SAE yang berbasis pada model state space. Kedua, kajian metode PTLT dan Bayes berhirarki untuk SAE berdasarkan model state space serta penerapannya pada data Susenas BPS merupakan kajian yang pertama kali dilakukan di Indonesia. Sehingga hasil kajian dalam disertasi ini diharapkan dapat memberikan sumbangsih pemikiran pada perkembangan perstatistikaan di Indonesia.
4
BAB II 2.
Tinjauan Metode Pendugaan Area Kecil
2.1. Pendahuluan Survei digunakan untuk mendapatkan informasi mengenai parameter populasi dengan mengefektifkan biaya yang tersedia. Secara lebih luas survei secara praktis tidak hanya digunakan untuk menduga total populasi tetapi juga untuk menduga keragaman subpopulasi atau domain. Domain dapat didefinisikan sebagai daerah geografik, sosio-demografi, dan sebagainya. Dalam konteks survei, penduga dikatakan langsung (direct estimator) apabila pendugaan terhadap parameter populasi di suatu domain hanya didasarkan pada data contoh yang diperoleh dari domain tersebut. Misalnya, pendugaan rata-rata tingkat pengeluaran rumah tangga perbulan di suatu kabupaten didasarkan hanya pada data survei yang diperoleh dari kabupaten tersebut. Informasi lain yang berada di luar domain kabupaten tersebut tidak diperhitungkan. Pendugaan langsung umumnya didasarkan pada teknik penarikan contohnya (sampling technique). Teknik semacam ini telah dikembangkan oleh Cochran (1977), Swenson dan Wretman (1989), dan Thompson (1997). Metode yang didasarkan pada pemodelan (model-based) juga telah dikembangkan. Survei contoh termasuk dalam kelompok non-percobaan (non-experimental) yang lazim disebut studi observasional. Tujuan utamanya adalah menduga nilai sejumlah peubah yang terdapat dalam populasi. Meskipun sejumlah hipotesis dapat diuji berdasarkan data yang diperoleh dari suatu survei, namun hal ini umumnya merupakan tujuan sekunder dalam survei (Levy dan Lemeshow, 1999). Survei contoh dapat dikategorikan kedalam dua kelompok besar berdasarkan pada metode pemilihan contoh, yaitu contoh berpeluang (probability samples) dan contoh tak-berpeluang (nonprobability samples). Contoh berpeluang memiliki karakteristik bahwa setiap elemen dalam populasi diketahui peluangnya untuk terpilih sebagai contoh. Sedangkan pada contoh tak-berpeluang tidak
5
memiliki karakteristik ini, yaitu peluang suatu elemen dalam populasi untuk terpilih sebagai contoh tidak diketahui berapa besar peluangnya. Pada penarikan contoh berpeluang, karena setiap elemen diketahui peluangnya untuk terpilih, maka penduga tidak bias parameter populasi yang berupa fungsi linear dari pengamatan (rataan populasi, proporsi, total) dapat diformulasikan dari data contoh. Demikian juga, galat baku bagi penduga ini bisa diperoleh sehingga reliabilitas dan validitas dapat dievaluasi. Pada survei contoh mencakup dua hal penting, yaitu perencanaan penarikan contoh (sampling plan) dan prosedur pendugaan parameter. Perencanaan penarikan contoh adalah metodologi yang digunakan untuk pemilihan contoh dari populasi. Sedangkan prosedur pendugaan parameter merupakan algoritma atau formula yang digunakan untuk memperoleh dugaan nilai populasi dari data contoh dan untuk menduga reliabilitas dari penduga tersebut (Levy and Lemeshow, 1999). 2.1.1. Keuntungan dan Keterbatasan Penarikan Contoh Penarikan contoh memiliki beberapa keuntungan dibandingkan dengan enumerasi secara lengkap terhadap populasi, diantaranya adalah lebih ekonomis, lebih pendek jedah waktunya (time-lag), cakupannya lebih luas, dan mutu pekerjaan lebih baik karena lebih terencana (Som, 1996). Penarikan contoh memerlukan sumberdaya yang lebih baik untuk merancang dan melaksanakannya sehingga biaya per unit pengamatan adalah lebih tinggi daripada enumerasi secara lengkap. Namun total biaya untuk penarikan contoh adalah lebih kecil daripada enumerasi secara lengkap dalam suatu cakupan populasi tertentu. Demikian juga, dengan jumlah pengamatan yang lebih kecil, penarikan contoh memungkinkan untuk lebih cepat dibandingkan dengan enumerasi secara lengkap. Penarikan contoh memiliki cakupan yang lebih luas daripada enumerasi secara lengkap 2.1.2. Validitas, Reliabilitas, dan Keakuratan Sebagaimana disebutkan sebelumnya bahwa pada contoh berpeluang, reliabilitas dan validitas penduga dapat dievaluasi. Reliabilitas (reliability) penduga parameter populasi merujuk pada bagaimana penduga tersebut dihasilkan
6
apabila survei yang sama dilakukan secara berulang-ulang. Apabila diasumsikan bahwa tidak ada kesalahan pengukuran dalam survei, maka reliabilitas suatu penduga parameter dapat digambarkan oleh ragam penarikan contohnya atau ekuivalen dengan galat bakunya. Sehingga penduga yang memiliki galat baku terkecil, maka penduga tersebut memiliki reliabilitas terbesar. Validitas (validity) penduga parameter populasi ( θˆ ) merupakan gambaran tentang bagaimana rataan dari penduga-penduga suatu parameter yang diperoleh dari proses survei yang dilakukan secara berulang-ulang berbeda dari nilai parameter yang sebenarnya (). Apabila diasumsikan bahwa tidak ada kesalahan pengukuran dalam survei, maka validitas suatu penduga parameter dapat dievaluasi dari nilai bias penduga tersebut, yaitu E( - θˆ ). Penduga yang memiliki bias terkecil merupakan penduga yang memiliki validitas terbesar. Sementara keakuratan (accuray) suatu penduga menunjukkan tentang seberapa jauh penyimpangan nilai dugaan dari nilai parameter yang sebenarnya. Keakuratan suatu penduga umumnya dievaluasi berdasarkan nilai kuadrat tengah galat / KTG (mean square error / MSE) atau berdasarkan nilai akar kuadrat tengah galat / AKTG (root mean square error / RMSE) yaitu
E (θ θˆ ) 2 .
2.1.3. Pendugaan Ukuran Contoh Salah satu persoalan penting dalam perancangan contoh adalah menentukan berapa besar contoh yang diperlukan untuk memperoleh penduga yang memiliki tingkat reliabilitas tertentu sesuai dengan tujuan survei. Secara umum, ukuran contoh yang lebih besar akan memberikan tingkat reliabilitas yang juga lebih besar terhadap hasil pendugaan. Kesalahan relatif, , dalam pendugaaan parameter dapat dikontrol pada saat melakukan penarikan contoh. Pada penarikan contoh acak sederhana dapat dinyatakan bahwa ˆ P ξ α
( 2.1 )
dimana adalah nilai peluang tertentu. Sebagaimana telah dijabarkan sebelumnya bahwa ˆ dapat diasumsikan menyebar normal dengan ragam V( ˆ ) yaitu
7
N
V( ˆ ) =
(y ( N n) N
)2
N nσy n( N 1) N n
i 1
i
2
sehingga σ = z/2 V (ˆ) = z/2 N n y N n 2
.
Penyelesain untuk ukuran contoh n adalah 2
z / 2 σ y ξY N ( z / 2 )2 ψ 2y n= 2 2 2 2 1 z / 2σ y ( z / 2 ) ψ y Nξ 1 N ξY
( 2.2 )
dimana ψ y = σ y / merupakan koefisien keragaman. Sebuah pendekatan untuk menentukan ukuran contoh kadang-kadang dapat dikembangkan bila keputusan praktis dibuat dari hasil-hasil contoh. Dasar keputusan akan menjadi lebih jelas jika pendugaan contoh mempunyai kesalahan yang rendah daripada jika mempunyai kesalahan yang tinggi. Masih memungkinkan untuk menghitung masalah keuangan, kerugian l(h) yang muncul dalam sebuah keputusan dengan sebuah kasalahan dalam pendugaannya. Meskipun nilai sebenarnya dari h tidak dapat diramalkan sebelumnya, teori penarikan contoh menunjukkan bahwa untuk mendapatkan sebaran frekuensi f(h, n) dari h, yang untuk metode penarikan contoh tertentu akan tergantung pada ukuran contoh n. Dengan demikian kerugian yang diharapkan untuk ukuran contoh tertentu adalah: L(n) l (h) f (h, n)dh .
Tujuan dari pengambilan contoh adalah untuk mengurangi kerugian ini. Jika C(n) adalah biaya dari ukuran contoh n, sebuah prosedur yang beralasan adalah dengan memilih n untuk meminimumkan: C(n) + L(n) karena ini adalah total biaya yang diperlukan dalam pengambilan contoh dan dalam pembuatan keputusan berdasarkan hasil-hasil contoh. Pemilihan ukuran
8
contoh n ditentukan oleh ukuran contoh yang optimum dan tingkat ketelitian yang paling tinggi. Sebagai alternatif, pendekatan yang sama dapat disajikan dalam keuntungan ekonomis (monetary gain) yang diperoleh dari contoh yang dimiliki, bukannya kerugian yang timbul dari kesalahan informasi contoh. Jika keuntungan keuangan yang digunakan, maka dapat dibentuk suatu harapan keuntungan G(n) dari sebuah contoh berukuran n, dengan G(n) adalah nol jika tidak ada contoh yang diambil. Berarti harus memaksimumkan G(n) - C(n). Aplikasi yang sangat sederhana terjadi bila fungsi kerugian, l(h), adalah h2, dengan adalah konstanta, sehingga dapat dinyatakan bahwa L(n) = E(h2). Misalkan ˆ adalah penduga dari dan h = ˆ - , maka 1 1 L(n) λV (ˆ) λσ 2y n N
( 2.3 )
jika yang digunakan adalah penarikan contoh acak sederhana. Sementara bentuk sederhana dari fungsi biaya untuk contoh adalah C(n) = c0 + c1n dimana c0 adalah biaya tetap. Berdasarkan fungsi biaya dan kerugian, nilai dari n yang meminimumkan biaya dan kerugian adalah n λ
σ 2y c1
.
2.2. Perkembangan Metode SAE Persoalan statistik area kecil telah menjadi perhatian serius para statistisi sejak 10 tahun terakhir ini, meskipun dasar pemikirannya telah dimulai jauh sebelumnya. Pendugaan karakteristik area kecil berdasarkan model pengaruh tetap merujuk pada synthetic estimator (Levy, 1971), composite estimator (Schaible et. al., 1977) dan prediction estimator (Holt et. al., 1979). Model pengaruh tetap menerangkan seluruh keragaman peubah respon di dalam area kecil oleh keragaman faktor-faktor yang diketahui.
9
Fay dan Herriot (1979) mengajukan suatu metode pemodelan untuk menduga pendapatan perkapita untuk suatu area kecil berdasarkan data survei Biro Sensus Amerika Serikat (U.S. Bureau of the Cencus). Area kecil yang dimaksudkan oleh Fay dan Herriot sama dengan Levy dan Holt di atas, yaitu suatu area survei dimana ukuran contoh pada area tersebut sangat kecil. Perbedaannya, Fay dan Herriot memasukkan pengaruh acak pada modelnya. Asumsi dasar dalam pengembangan model untuk pendugaan area kecil (SAE) tersebut adalah bahwa keragaman di dalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang disebut sebagai pengaruh tetap. Asumsi lainnya adalah bahwa keragaman specifik area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak area kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh campuran (mixed models). Dibandingkan dengan model pengaruh tetap, model campuran memiliki cakupan aplikasi yang lebih luas. Model Fay-Herriot tersebut menggunakan model campuran yang telah menjadi kajian para statistisi sebelumnya. Salah satu sifat yang menarik dalam model campuran adalah kemampuannya dalam menduga kombinasi linear dari pengaruh tetap dan pengaruh acak. Henderson (1949-1975) mengembangkan teknik penyelesaian model pengaruh campuran untuk memperoleh prediksi tak-bias linear terbaik / PTLT (best linear unbiased prediction / BLUP). Metode PTLT yang dikembangkan tersebut mengasumsikan diketahuinya ragam pengaruh acak dalam model campuran (komponen ragam). Padahal dalam prakteknya, komponen ragam tidak bisa diketahui dan harus diduga berdasarkan data. Selanjutnya, Harville (1977) melakukan kajian terhadap beberapa metode pendugaan komponen ragam, dengan memasukkan metode maximum likelihood dan residual maximum likelihood. Penduga PTLT yang diperoleh dengan cara terlebih dahulu menduga komponen ragamnya disebut sebagai prediksi tak-bias linear terbaik empirik / PTLTE (empirical best linear unbiased prediction / EBLUP) seperti yang dikembangkan Harville (1990) dan Robinson (1991). Metode PTLTE tersebut mengasumsikan bahwa pengaruh acak memiliki sebaran normal. Schall (1991), McGilchrist dan Aisbett (1991), Breslow dan
10
Clayton (1993), Breslow dan Lin (1995), McGilchrist (1994), dan Marker (1999) mengembangkan PTLTE untuk model linear terampat (generalized linear models) yang pengaruh acaknya diasumsikan memiliki sebaran keluarga eksponensial. Zeger dan Karim (1991) memperkenalkan pendekatan Gibbs sampling untuk penyelesaian model campuran. Teknik komputasi Monte Carlo ExpectationMaximization dan Monte Carlo Newton-Raphson digunakan oleh McCulloch (1994 dan 1997). Sementara Datta dan Ghosh (1991), Ghosh dan Rao (1994), Pfeffermann (1999), Ghosh dan Lahiri (1987), Rao (1999, 2003), serta Chambers dan Tzavidis (2006) menggunakan model campuran untuk meningkatkan akurasi pendugaan pada kasus area kecil berdasarkan data survey atau data sensus. Selain PTLTE, pendugaan dan inferensia pada SAE juga menggunakan Bayes empirik (empirical Bayes) dan Bayes berhirarki (hierarchical Bayes). Pada pendekatan Bayes empirik, pendugaan dan inferensia berdasarkan pada sebaran posterior yang diduga dari data. Adapun pada pendekatan Bayes berhirarki, parameter model yang tidak diketahui (termasuk komponen ragam) diperlakukan sebagai komponen acak yang masing-masing memiliki sebaran prior tertentu. Sebaran posterior untuk parameter yang menjadi perhatian diperoleh berdasarkan seluruh sebaran prior tersebut. Ghos dan Rao (1994) mengulas penggunaan Bayes berhirarki pada SAE. Deely dan Lindley (1991), Maiti (1998), Datta et al (1996, 1999) menggunakan non-informative prior untuk kasus hiperparameter pada penggunaan Bayes berhirarki. You dan Rao (2000) menggunakan Bayes berhirarki untuk menduga rataan area kecil berdasarkan model pengaruh acak. Malec et al (1999) mengembangkan model yang digunakan pada Malec et al (1997) dengan memasukkan komponen oversampling di dalam likelihood. Farrell et al (1997) mengembangkan model logistik campuran yang digunakan oleh MacGibbon dan Tomberlin (1989). Moura dan Mignon (2001) lebih mengembangkan model tersebut dengan memasukkan komponen struktur korelasi spasial pada data respon biner. Saat ini penelitian dan pengembangan metode SAE semakin meningkat semenjak JNK Rao menerbitkan buku yang berjudul ’Small Area Estimation’ pada tahun 2003, sebagai buku pertama di dunia yang membahas tentang metode SAE. Seminar dan konferensi internasional tentang SAE saat ini banyak
11
diselenggarakan di berbagai negara. Salah satunya diselenggarakan di Spanyol pada Juli 2009 yang dihadiri oleh berbagai statistisi dunia termasuk JNK Rao. Pada konferensi tersebut didiskusikan berbagai problem SAE termasuk aplikasinya pada data survei di berbagai negara. Perkembangan dan aplikasi metode SAE di Indonesia pada konferensi tersebut dikemukakan oleh Sadik dan Notodiputro (2009). 2.2.1. Metode Pendugaan Tidak Langsung untuk Area Kecil Ukuran contoh pada sub-area survei terkadang berukuran kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar atau bahkan pendugaan bisa saja tidak dapat dilakukan pada sub-area tertentu karena sub-area tersebut tidak terpilih menjadi contoh. Metode SAE dikembangkan untuk menyelesaikan masalah tersebut. Area kecil tersebut didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil didasarkan pada aplikasi model desain penarikan contoh yang menghasilkan metode pendugaan langsung (Rao, 2003; Chambers dan Chandra, 2006; Lahiri, 2008). Informasi tambahan dapat digunakan untuk meningkatkan akurasi dan presisi suatu penduga. Pada SAE, informasi tambahan tersebut dapat berupa nilai parameter dari area kecil lain yang memiliki karakteristik serupa dengan area kecil yang menjadi perhatian, atau nilai pada waktu yang lalu, atau nilai dari peubah yang memiliki hubungan dengan peubah yang sedang diamati. Pendugaan paramater dan inferensianya yang berdasarkan pada informasi tambahan tersebut, dinamakan pendugaan tidak langsung atau model-based. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat penguatan (borrowing strength) dari hubungan antara nilai peubah respon dan informasi tambahan tersebut. Asumsi dasar dalam pengembangan model untuk SAE adalah bahwa keragaman didalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang disebut sebagai pengaruh tetap. Asumsi lainnya adalah bahwa keragaman specifik area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak area
12
kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh campuran (mixed models). Model pengaruh tetap menerangkan seluruh keragaman peubah respon di dalam area kecil oleh keragaman faktor-faktor yang diketahui. Pendugaan karakteristik area kecil berdasarkan model pengaruh tetap merujuk pada synthetic estimator (Levy, 1971), composite estimator (Schaible et. al., 1977) dan prediction estimator (Holt et. al., 1979; Sarndal, 1984; dan Marker, 1999). Pendugaan
langsung
umumnya
didasarkan
pada
teknik
penarikan
contohnya. Teknik semacam ini telah dikembangkan oleh Cochran (1977), Swenson dan Wretman (1989), dan Thompson (1997). Metode yang didasarkan pada pemodelan juga telah dikembangkan, misalnya seperti yang dilakukan oleh You dan Rao (2000). Pada pendugaan yang berbasis pada rancangan survei, pembobot rancangan wj(s) memiliki peranan penting dalam membentuk penduga berbasis rancangan Yˆ bagi Y. Pembobot ini tergantung pada s dan elemen j (js). Salah satu bentuk pembobot yang penting adalah wj(s)=1/j, dimana j = {s:js}p(s), j=1, 2, .., N. Apabila tidak informasi penyerta, maka penduga langsung dapat diekspresikan sebagai Yˆ = {s:js}wj(s)yj. Dalam kasus ini, rancangan tidak berbias apabila terpenuhi {s:js}p(s)wj(s) = 1 untuk j=1, 2, …, N. Pembobot ini merupakan bentuk umum dari penduga Horvitz-Thompson (Cochran, 1977). Pendugaan langsung ini dapat pula menggunakan informasi penyerta yang ada pada domain yang bersangkutan. Misalkan informasi penyerta dalam domain tertentu, X = (X1, …, Xp)T, tersedia dan vektor xj untuk js terobservasi, sehingga data (yj, xj) untuk setiap elemen js terobservasi. Suatu penduga yang mengefisienkan informasi penyerta ini adalah generalized regression (GREG) yang bisa ditulis sebagai berikut:
YˆGR Yˆ ( X Xˆ ) T Bˆ
( 2.4 )
dimana Xˆ = {s:js}wj(s)xj dan Bˆ ( Bˆ1 ,..., Bˆ p ) T adalah solusi dari persamaan kuadrat
terkecil
terboboti
dari
contoh,
yaitu
({s:js}wj(s)xjxjT/cj) Bˆ =
{s:js}wj(s)xjyj/cj dengan cj(>0) sebagai konstanta spesifik.
13
Pendugaan tidak langsung dapat menggunakan pendekatan model secara umum. Misalkan diasumsikan bahwa i = g( Yi ) untuk beberapa spesifikasi g(.) dihubungkan dengan data penyerta spesifik pada area i, xi = (x1i, …, xpi)T melalui suatu model linear i = xiT + bivi,
i = 1, …, m
dimana bi adalah konstanta positif yang diketahui dan adalah vektor berukuran px1. Sedangkan vi adalah pengaruh acak spesifikasi area yang diasumsikan bebas dan menyebar identik dengan Em(vi) = 0 dan Vm(vi) = v2 ( 0), atau vi iid (0, v2). Pendugaan tidak langsung untuk rataan populasi di area kecil i, ( Yi ), diperlukan informasi mengenai penduga langsungnya yaitu Yˆ . Dengan menggunakan metode James-Stein akan diperoleh:
ˆ i g(Yˆ ) = i + ei ˆ i xiT + bivi + ei, i = 1, …, m
( 2.5 )
dimana galat penarikan contoh (sampling error) ei adalah bebas dengan Ep(ei|i) = 0 dan Vp(ei|i) = i, atau vi iid (0, v2). 2.2.2. Pendekatan Model Campuran Linear Terampat Rao(2003) mengaitkan model-model pendugaan tidak langsung (modelbased) di atas sebagai bagian dari model campuran linear terampat / MCLT (generalized linear mixed model / GLMM) yang menggabungkan antara pengaruh tetap dan pengaruh acak dalam suatu model umum. Datta dan Ghosh (1991) mengemukakan formulasi model MCLT sebagai berikut : yP = XP + ZPv + eP.
( 2.6 )
Pada model ini v dan eP bebas dengan eP N(0, 2P) dan v N(0, 2D()), dimana P adalah matriks definit positif yang diketahui dan D() adalah matriks definit positif yang strukturnya diketahui. Sedangkan XP dan ZP adalah matriks rancangan dan YP adalah vektor N x 1 dari nilai y populasi. Matriks koragam bagi v dan e masing-masing adalah G dan R. Persamaan di atas dapat pula ditulis sebagai berikut:
14
y X Z e y P v y * X * Z * e *
( 2.7 )
dimana bagian yang ditandai asterisk (*) menunjukkan unit yang tidak tercakup dalam contoh. Vektor untuk total (Yi) pada area kecil adalah berbentuk Ay + Cy* dengan A = im1 1Tni dan C = im1 1TN i ni dimana im1 A u = blockdiag(A1, …, Am). Pada MCLT ini dilakukan pendugaan terhadap kombinasi linear dari parameter yaitu = 1T + mTv. Rao (2003) mengemukakan bahwa untuk tertentu yang diketahui maka penduga PTLT bagi adalah ~ ~ ~ ~ H = t(, y) = 1T + mT ~v = 1T + mTGZTV-1(y - X )
( 2.8 )
dimana ~ ~ = () = (XTV-1X)-1XTV-1y ~ ~ v =~ v () = GZTV-1(y - X ).
Model untuk pendugaan tidak langsung, yaitu ˆ i xiT + bivi + ei, i = 1, …, m, sebenarnya merupakan kasus khusus dari model MCLT, yaitu yi = ˆ i ,
Xi = xiT,
Zi = bi
dan vi = vi,
ei = ei, = (1, …, p)T
sedangkan Gi = v2,
Ri = i
sehingga Vi = i + v2bi2 dan i = i = xiT + bivi. Apabila persamaan pendugaan tidak langsung disubstitusikan ke dalam pendugaan MCLT akan diperoleh penduga PTLT bagi i atau i yaitu: ~H ~ ~ i = xiT + i( ˆ i - xiT ), dimana i = v2bi2 /(i + v2bi2), dan m xi xiT ~ ~ = (v2) = 2 2 i 1 i v bi
1
m x iˆi . 2 2 i 1 i v bi
( 2.9 )
Ada tiga pendekatan standar untuk SAE didasarkan pada model MCLT tersebut, yaitu PTLTE, Bayes empirik, dan Bayes berhirarki. Metode PTLTE biasanya membutuhkan metode kemungkinan maksimum terkendala / KMT
15
(restricted maximum likelihood / REML) untuk pendugaan parameternya yang berkaitan dengan pengaruh area acak, yang identik dengan Bayes empirik dan Bayes berhirarki dalam beberapa keadaan. 2.2.3. Pengaruh Penarikan Contoh pada Pendugaan Tidak Langsung Sebagaimana dijabarkan di atas bahwa pada pendugaan tidak langsung, metode penarikan contoh akan mempengaruhi metode penghitungan nilai kuadrat tengah
galatnya.
Artinya,
pada
pendugaan
tidak
langsung
juga
mempertimbangkan metode pendugaan langsungnya bagi penduga parameternya maupun keragaman yang terdapat dalam penduga langsung tersebut. Pada model di atas yaitu,
ˆ i g(Yˆ ) = i + ei ˆ i xiT + bivi + ei, i = 1, …, m
( 2.10 )
pengaruh penarikan contoh diperhitungkan pada komponen ei sebagai galat penarikan contoh (sampling error) yang bebas dengan Ep(ei|i) = 0 dan Vp(ei|i) = i, atau vi iid (0, v2). Pada persamaan ( 2.10 ) di atas, penduga langsung yang berbasis pada metode penarikan contoh tertentu berkontribusi pada nilai ˆi dan Vp(ei|i) = i. Untuk penarikan contoh acak sederhana (simple random sampling) yang memilih n unit dari N sehingga setiap elemen dari NCn contoh yang berbeda mempunyai kesempatan yang sama untuk dipilih maka ˆ = y pada suatu area kecil tertentu dimana E( y ) = =
( N 1)! n!( N n)! ( y1 y2 ... y N ) (n 1)!( N n)! nN ! ( y1 y2 ... y N ) Y . N
( 2.11 )
Sehingga y merupakan penduga tidak bias bagi nilai tengah populasi Y . Sedangkan = ragam bagi y untuk area kecil tertentu yang dapat dinyatakan sebagai E( y Y )2, yaitu
= V( y ) = E( y Y )2 =
1 n n 1 2 2 [ 1 {(y1 Y ) + …. + (yN Y ) } 2 n N N 1
16
=
N n N ( yi Y ) 2 nN ( N 1) i 1 N
( N n) = N N
dimana σ 2y
(y i 1
i
(y i 1
i
Y )2
N nσy N n
2
n( N 1)
( 2.12 )
Y )2
( N 1)
, sedangkan penduga bagi ragam y adalah N n sy Vˆ ( y ) N n
2
n
(y
pada penduga ragam bagi y tersebut, s y2
i
i 1
y )2
(n 1)
merupakan penduga tidak
bias bagi ragam populasi σ 2y . Untuk penarikan contoh dengan pengembalian, ragam bagi y yaitu
= V( y ) =
N 1 N 2 n( N 1) n y 2 yi y j 2 2 i 2 n i 1 N N i j N
1 = nN
( yi Y ) 2 N 1 i 1 ( yi Y ) 2 nN N 1 i 1 N
N 1 σy = . N n 2
( 2.13 )
Pada penarikan acak contoh berlapis, populasi N unitnya dibagi ke dalam subpopulasi, masing-masing N1, N2, ..., NL unit, dimana
L
1
N i N , sehingga
subpopulasi ini tidak boleh tumpang tindih. Penduga langsung bagi yaitu ˆ pada persamaan pendugaan area kecil ( 2.10 ) adalah ˆ = yst , yaitu L
yst
N h 1
h
N
yh
L
Wh yh
( 2.14 )
h 1
dimana Wh = Nh/N merupakan pembobot lapisan. Apabila dalam setiap lapisan penduga contohnya, yh , adalah tidak bias, maka yst merupakan penduga tidak bias bagi nilai tengah populasi Y , yaitu
17
L L E( yst ) = E Wh yh WhYh h1 h1 karena penduganya, yh , adalah tidak bias pada tiap lapisan. Sementara itu, nilai tengah populasi dapat dinyatakan sebagai berikut: L
Y
Nh
yhi h 1 i 1
N
L
N Y
h h
h 1
N
L
WhYh
( 2.15 )
h 1
berdasarkan penjabaran di atas, maka yst merupakan penduga tidak bias bagi nilai tengah populasi Y , karena E( yst ) = Y . Ragam penarikan contoh yang berkontribusi pada pendugaan area kecil di atas dapat dinyatakan sebagai ragam bagi yst yaitu L L L L = V( yst ) = V Wh yh Wh2V ( yh ) 2WhW j Cov( yh , y j ) h 1 j h h 1 h 1
Apabila penarikan contohnya dilakukan secara bebas antar lapisan yang berbeda seluruh koragam di atas sama dengan nol, sehigga L L = V( yst ) = V Wh yh Wh2V ( yh ) h1 h1 L
=
Wh2 h 1
σ 2h N h nh nh N h
( 2.16 )
dimana Nh
σ 2h
(y i 1
hi
Yh ) 2
Nh 1
.
Pada penarikan contoh sistematik yang mengambil sebuah unit secara acak dari k unit yang pertama, dan selanjutnya mengambil setiap kelipatan k, Penduga langsung bagi yaitu ˆ pada persamaan pendugaan area kecil ( 2.10 ) adalah ˆ = ysy . Pendekatan pada contoh sistematik adalah berupa penarikan contoh
berkelompok dimana kelompoknya mengandung n elemen dan contohnya terdiri dari satu kelompok, sehingga dapat dianggap bahwa N = nk. Berdasarkan hal ini,
ˆ = ysy merupakan penduga tidak bias bagi nilai tengah populasi Y untuk sebuah contoh sistematik yang ditempatkan secara acak.
18
Misalkan yij menyatakan anggota ke-j dari contoh sistematik ke-i, sehingga j = 1, 2, . . ., n ; i = 1, 2, . . ., k, dan rata-rata contoh ke-i dinotasikan dengan yi. maka adalah ragam dari ysy yaitu: k
n
k
k
n
( N 1) S 2 ( yij Y ) 2 n ( yi. Y ) 2 ( yij yi. ) 2 i 1 j 1
i 1
nkV ( ysy ) k (n 1) S
i 1 j 1
2 wsy
sehingga
= V ( ysy )
N 1 2 k (n 1) 2 S S wsy N N
( 2.17 )
dimana
S2
k n 1 k n 1 2 2 ( y Y ) dan S ( yij yi. ) 2 . ij wsy N 1 i 1 j 1 k (n 1) i 1 j 1
2 S wsy merupakan ragam antara unit-unit yang terletak di dalam contoh
sistematik yang sama. Pembagi dari ragam ini, k(n - 1) dibentuk dengan aturan yang umum dalam analisis ragam yaitu masing-masing dari k contoh memberikan (n - 1) derajat bebas pada jumlah kuadrat dalam pembilangnya. Bentuk lain untuk
pada penarikan contoh acak berlapis ini dapat
dijabarkan sebagai berikut:
N 1 S = V ( ysy ) [1 (n 1) ρw ] . N n 2
( 2.18 )
Pada persamaan di atas, w adalah koefisien korelasi antara pasangan dari unit-unit yang berada dalam contoh sistematik yang sama, yaitu ρw
E ( yij Y )( yiu Y ) E ( yij Y ) 2
.
Dimana pembilangnya adalah rata-rata seluruh kn(n – 1)/2 pasangan yang berlainan, dan penyebutnya keseluruhan nilai N dari yij. Karena penyebutnya adalah (N – 1)S2/N, maka k n 2 ρw ( yij Y )( yiu Y ) . 2 (n 1)( N 1) S i 1 j u
( 2.19 )
Pada penarikan contoh acak bergerombol, penduga langsung bagi yaitu ˆ pada persamaan pendugaan area kecil ( 2.10 ) dapat dijelaskan sebagai berikut.
19
Misalnya yij adalah nilai yang diamati untuk elemen ke-j dalam unit atau kelompok ke-i, dan yi = j 1 yij adalah total pada kelompok ke-i, dimana i = 1, 2, M
..., N dan j = 1, 2, ..., M. Apabila sebuah contoh acak sederhana kelompok berukuran n diambil dari N kelompok pada populasi dan pada masing-masing kelompok berisi M elemen. Misalkan yi menyatakan total pada kelompok ke-i dan
ˆ = y =
n i 1
yi / n , serta adalah ragam y , yaitu n
= V( y ) =
(y N n
i
i 1
Y )2
N 1
nN
.
Karena y = M y dan Y = M Y , maka y merupakan penduga tidak bias bagi Y dengan ragam sebagai berikut: n
V( y ) =
(y N n i 1
nNM
2
i
Y )2
N 1
Misalkan bahwa setiap unit dalam populasi dapat dibagi ke dalam sejumlah unit-unit atau sub-unit yang lebih kecil. Sebuah contoh dari n unit dipilih. Jika sub-unit dalam unit yang dipilih memberikan hasil yang sama, hal ini menjadi tidak efisien untuk mengukur sebuah contoh dari sub-unit dalam setiap unit yang dipilih. Pada kondisi demikian dapat diterapkan sub-penarikan contoh atau penarikan contoh dua tahap, karena contohnya diambil dalam dua tahap. Tahap pertama memilih sebuah contoh dari unit-unit utama dan tahap kedua memilih sebuah contoh dari unit-unit tahap pertama atau sub-unit dari setiap unit utama yang terpilih. Pada penarikan contoh dua tahap, penarikan contoh tahap pertama merupakan sebuah metode pemilihan n unit. Kemudian untuk setiap unit terpilih, digunakan metode untuk memilih sejumlah tertentu subunit-subunit. Dalam mencari rata-rata dan penduga ragam, rata-ratanya harus meliputi seluruh contoh yang dapat diturunkan dengan proses dua tahap ini. Salahsatu cara penghitungan rata-ratanya adalah dengan menghitung rata-rata seluruh contoh tahap kedua yang dapat diambil dari sekumpulan n unit. Kemudian dirata-ratakan seluruh pemilihan
20
yang mungkin dari n unit tersebut. Untuk sebuah penduga, ˆ , metode ini dapat dinyatakan sebagai E( ˆ ) = E1[E2( ˆ )]. Dimana E merupakan nilai harapan seluruh contoh, E2 meruapakan nilai harapan seluruh pemilihan yang mungkin pada tahap kedua dari sekumpulan n unit tetap, dan E1 merupakan nilai harapan seluruh pemilihan yang mungkin pada tahap pertama. Sedangkan ragam bagi ˆ dapat dinyatakan sebagai berikut: V( ˆ ) = E( ˆ )2 = E1[E2( ˆ )2] dimana E2( ˆ )2 = E2( ˆ 2) 2E2( ˆ ) + 2 = [E2( ˆ )]2 + V2( ˆ ) 2E2( ˆ ) + 2 karena E1[E2( ˆ )] = , maka V( ˆ ) = E1[E2( ˆ )]2 + E1[V2( ˆ )] 2 = V1[E2( ˆ )] + E1[V2( ˆ )] .
( 2.20 )
Hal serupa dapat dilanjutkan untuk penarikan contoh tiga tahap atau lebih. Misalnya, untuk penarikan contoh tiga tahap, ragam bagi ˆ dapat dinyatakan sebagai berikut: V( ˆ ) = V1{E2[E3( ˆ )]} + E1{V2[E3( ˆ )]} + E1{E2[V3( ˆ )]}. Misalkan yij merupakan nilai yang diperoleh untuk subunit ke-j (j = 1, 2, ..., m) pada unit utama ke-i (i = 1, 2, ..., n). Apabila n unit dan m subunit dari masingmasing unit yang telah diambil dipilih dengan penarikan contoh acak sederhana, maka n
y
m
y i 1 j 1
ij
nm
merupakan penduga tidak bias bagi Y dengan ragam 2 2 N n S1 M m S 2 V ( y) N n M mn N
N
S12
(Y Y ) i 1
2
i
N 1
dan
S 22
M
( y i 1 j 1
ij
( 2.21 ) Yi ) 2
N ( M 1)
21
dimana S12 merupakan ragam diantara rata-rata unit utama dan S22 merupakan ragam diantara subunit-subunit dalam unit utama. Hal ini dapat ditunjukkan sebagai berikut: n N E( y ) = E1[E2( y )] = E1 1 Yi 1 Yi Y n i 1 N i 1
V( y ) = V1[E2( y )] + E1[V2( y )]
( 2.22 )
karena E2( y ) = Yi /n, maka 2 N n S1 V1[ E2 ( y )] . N n
Selanjutnya, dengan y = yi /n dan penarikan contoh acak sederhana digunakan pada tahap kedua, n
S M m
i 1 V2 ( y ) 2 Mn m
2 2i
( 2.23 )
dimana M
( y j 1
S 22i
ij
Yi ) 2
M 1
merupakan ragam diantara subunit utama ke-i. Apabila dirata-ratakan seluruh contoh tahap pertama, N
S i 1
N
2 2i
S 22 .
Oleh karena itu, 2 M m S2 E1[V2 ( y )] M mn
sehingga ragam bagi y adalah 2 2 N n S1 M m S 2 V ( y) . N n M mn
( 2.24 )
22
2.3. Metode SAE dan Model State Space Terkait dengan SAE, terkadang beberapa survei diulang pelaksanaannya secara berkala. Untuk survei yang demikian ini pendugaan tidak langsung, seperti pendugaan tingkat pengeluaran di suatu area kecil, dapat ditingkatkan efisiensi pendugaanya dengan memasukkan pengaruh acak area dan waktu. Model state space merupakan salah satu alternatif metode pemodelan dalam SAE dengan memperhatikan pengaruh acak waktu (Rao dan Yu, 1994; Pfeffermann, 2002). Model state space atau disebut juga model linear dinamik (dynamic linear model) merupakan model pendekatan umum pada model deret waktu baik untuk peubah tunggal maupun peubah ganda (Wei, 1994). State dari suatu sistem didefinisikan sebagai gugus minimum dari informasi saat ini dan waktu sebelumnya yang mana prilaku sistem pada waktu yang akan datang dapat dideskripsikan secara lengkap melalui informasi tersebut. Representasi state space didasarkan pada proses stokastik Markov, yaitu apabila state saat ini diketahui maka prilaku sistem pada waktu yang akan datang bersifat bebas dengan prilaku sistem pada waktu sebelumnya. Karena itu, representasi state space dari suatu sistem sering juga disebut sebagai representasi Markov (Zivot, 2006). Misalkan Y1t dan Y2t merupakan keluaran (output) dari suatu sistem yang masing-masing mempunyai masukan (input) X1t dan X2t. Suatu sistem dikatakan linear jika dan hanya jika kombinasi linear masukan, aX1t + bX2t, akan menghasilkan kombinasi linear yang sama pada keluaran, aY1t + bY2t, untuk setiap konstanta a dan b. Suatu sistem dikatakan time-invariant apabila karakteristik sistem tidak berubah dari waktu ke waktu, yaitu apabila masukan Xt menghasilkan keluaran Yt maka masukan Xt-s akan menghasilkan keluaran Yt-s. Karena itu, suatu sistem dikatakan linear time invariant jika mempunyai karakteristik kedua-duanya yaitu linear dan time-invariant. Model state space umumnya didasarkan pada model linear time-invariant ini.
2.4. Statistik Area Kecil untuk Data BPS Pada dasarnya, survei yang dilakukan oleh BPS adalah untuk melakukan pendugaan karakteristik berbagai area termasuk diantaranya adalah area kecil.
23
Salah satu survei tersebut adalah Survei Sosial-Ekonomi Nasional (Susenas). Survei ini dirancang untuk mengumpulkan data sosial kependudukan yang relatif sangat luas. Data yang dikumpulkan antara lain meyangkut bidang-bidang pendidikan, kesehatan/gizi, perumahan, sosial ekonomi lainnya, kegiatan sosial budaya, konsumsi/pengeluaran dan pendapatan rumah tangga, perjalanan, dan pendapat masyarakat mengenai kesejahteraan rumah tangganya. Ukuran contoh Susenas untuk level desa sangat kecil, sehingga muncul persoalan galat baku yang sangat besar untuk statistik pada level desa. Metode pendugaan yang digunakan oleh BPS untuk data Susenas adalah metode pendugaan langsung (direct estimation) yaitu metode pendugaan yang didasarkan pada data yang diperoleh dari suatu proses penarikan contoh di suatu area tertentu. Metode pendugaannya semata-mata didasarkan pada metode penarikan contoh yang digunakan. Susenas dilaksanakan di seluruh propinsi di wilayah Indonesia baik di daerah
perkotaan maupun pedesaan. Cakupan contoh rumah tangga terpilih
Susenas 2001 – 2005 adalah rumah tangga biasa yang terletak di blok sensus biasa. Rumah tangga dalam blok sensus khusus seperti komplek militer dan sejenisnya dan rumah tangga khusus seperti asrama, penjara dan sejenisnya yang berada di blok sensus tidak dipilih dalam contoh (BPS, 2005). 2.4.1. Jenis Data yang Dikumpulkan Data yang dikumpulkan dalam Susenas terbagi atas 2 kelompok data, yaitu data Kor dan data Modul.
Data Kor merupakan data yang mencakup keterangan pokok rumah tangga dan anggota rumah tangga, yang dikumpulkan setiap tahun. Data Kor Susenas disajikan sampai tingkat kabupaten/kota. Keterangan rumah tangga yang tergabung dalam kuesioner Kor Susenas 2001 – 2005 tidak berbeda dengan tahun-tahun sebelumnya, antara lain : a.
Keterangan umum anggota rumah tangga yaitu nama, hubungan dengan kepala rumah tangga, jenis kelamin, umur, status perkawinan, tindak kejahatan yang dialami, dan perjalanan;
24
b.
Keterangan umum kesehatan dan pendidikan anggota rumah tangga;
c.
Keterangan kegiatan ekonomi dan ketenagakerjaan anggota rumah tangga berumur 10 tahun ke atas;
d.
Keterangan fertilitas bagi anggota rumah tangga (art) wanita pernah kawin dan keterangan cara pencegahan kehamilan dari art yang berstatus kawin;
e.
Keterangan perumahan antara lain mencakup penguasaan tempat tinggal, kondisi fisik bangunan tempat tinggal, fasilitas bangunan tempat tinggal;
f.
Keterangan tentang rata-rata konsumsi rumah tangga dan sumber penghasilan rumah tangga; dan
g.
Keterangan sosial ekonomi rumah tangga.
Data Modul merupakan data mengenai karakteristik rumah tangga yang digunakan untuk menyusun indikator kesejahteraan rakyat (kesra). Data Modul dikumpulkan secara bergiliran dalam kurun waktu 3 tahun. Modul-modul tersebut dikelompokkan ke dalam 3 paket, yaitu: a.
Modul konsumsi/pengeluaran dan pendapatan rumah tangga
b.
Modul sosial budaya dan pendidikan
c.
Modul kesehatan dan perumahan.
2.4.2. Rancangan Penarikan Contoh Susenas Kerangka contoh yang digunakan dalam Susenas 2001 - 2005 terdiri dari 3 jenis, yaitu:
Kerangka
contoh
untuk
pemilihan
blok
sensus
di
daerah
perkotaan/pedesaan adalah daftar blok sensus biasa yang terdapat di daerah perkotaan/pedesaan di setiap kabupaten/kota.
Kerangka contoh untuk pemilihan sub blok sensus, yaitu daftar sub blok sensus yang terdapat dalam blok sensus terpilih yang mempunyai jumlah rumah tangga lebih besar dari 150 rumah tangga.
Kerangka contoh rumah tangga, yaitu daftar rumah tangga hasil pendaftaran rumah tangga. Kerangka contoh rumah tangga ini
25
dibedakan menurut tiga kelompok golongan pengeluaran rumah tangga sebulan. Pemilihan contoh pada kegiatan Susenas 2001 – 2005 meliputi pemilihan contoh blok sensus Kor dan pemilihan contoh blok sensus Kor-Modul. Contoh blok sensus Kor dirancang untuk estimasi data di tingkat kabupaten/kota. Untuk keperluan estimasi data di tingkat propinsi digunakan contoh blok sensus KorModul. Blok sensus Kor adalah blok sensus dimana contoh rumah tangga terpilihnya dicacah dengan kuesioner Kor, sedangkan blok sensus Kor-Modul adalah blok sensus dimana contoh rumah tangga terpilihnya selain dicacah dengan kuesioner Kor juga dicacah dengan kuesioner Kor-Modul. Contoh blok sensus Kor-Modul merupakan subcontoh dari contoh blok sensus Kor. Prosedur penarikan contoh Susenas untuk suatu kabupaten/kota adalah sebagai berikut:
Tahap pertama, dari master frame blok sensus dipilih nh blok sensus (h = 1, untuk perkotaan ; h = 2, untuk pedesaan) secara PPS – sistematik dengan size banyaknya rumah tangga hasil pencacahan P4B.
Tahap kedua, dari nh dipilih n h blok sensus secara sistematik. Pendaftaran rumah tangga/listing dilakukan pada setiap blok sensus terpilih.
Tahap ketiga, memilih m 16 rumah tangga pada setiap blok sensus terpilih secara sistematik.
Untuk blok sensus yang muatannya lebih dari 150 rumah tangga, maka perlu dilakukan pemilihan satu sub blok sensus secara PPS – sistematik dengan size banyaknya rumah tangga hasil pencacahan P4B.
26
Populasi Blok Sensus di Kab/Kota
Daerah Perkotaan
Pilih Sampel BS Kor
Pilih Sampel BS Modul
Tidak
Daerah Perdesaan
Probability Proportional to Size (PPS)Linear Systematic Sampling (LSS) (Jmlh RT)
Jml RT di BS > 150
Pilih Sampel BS Kor
Pilih Sampel BS Modul
Jml RT di BS > 150
Ya
Tidak
Ya
Bentuk sub Blok Sensus dan pilih 1 sub Blok Sensus
PPS - LSS
Bentuk sub Blok Sensus dan pilih 1 sub Blok Sensus
Pilih Contoh 16 RT/BS
LSS
Pilih Sampel 16 RT/BS
Gambar 2.1. Diagram Alur Metode Penarikan Contoh Susenas
2.4.3. Pendugaan Data Rumah Tangga Metode pendugaan yang digunakan dalam Susenas menggunakan metode secara langsung (direct estimate) dan penduga rasio dengan rasio jumlah rumah tangga untuk mengestimasi karakteristik rumah tangga dan rasio penduduk untuk mengestimasi karakteristik penduduk. Dugaan untuk karakteristik y dalam suatu
27
kabupaten/kota di daerah perkotaan dan daerah pedesaan adalah dengan menggunakan rumus metode sampling dua tahap (apabila 3 tahap dilakukan pemilihan sub blok, formula disesuaikan). 2.4.4. Persoalan Ukuran Contoh pada Susenas Sebagaimana disebutkan sebelumnya bahwa satuan penarikan contoh pada Susenas adalah rumah tangga. Banyaknya rumah tangga yang diambil dari suatu blok (desa) adalah 16 rumah tangga dan 32 rumah tangga apabila jumlah populasi rumah tangga di blok tersebut besar. Perbandingan antara ukuran contoh Susenas tahun 2005 yaitu n = 16 untuk desa-desa di wilayah Kota Bogor dengan jumlah n ideal / minimum pada batas d = 0.01 disajikan pada Tabel 2.1. Tabel 2.1. Perbandingan Antara Ukuran Contoh Susenas 2005 (n) dengan Jumlah n ideal / Minimum pada Batas d = 0.01.
No
Nama Desa
N
n
Jumlah n Minimum untuk d = 0.01 Nilai
Koefisien Keragaman
0.10
0.05
0.025
0.01
1 Mulyaharja
2483
16
0.10831
29
41
54
70
2 Pamoyanan
2438
16
0.13798
37
52
68
89
3 Ranggamekar
2322
16
0.10836
29
41
54
70
4 Genteng
1568
16
0.11235
30
43
55
72
5 Kertamaya
1083
16
0.10917
29
41
53
68
6 Bojongkerta
1945
16
0.10850
29
41
54
70
7 Harjasari
2686
16
0.11856
32
45
59
77
8 Muarasari
1691
16
0.10862
29
41
53
70
9 Cipaku
2730
16
0.13139
35
50
65
85
10 Batutulis
2768
16
0.59367
152
211
270
345
11 Empang
4236
16
0.08935
24
35
45
59
12 Cikaret
3823
16
0.10081
27
39
50
66
13 Sindangrasa
2202
16
0.12011
32
46
59
77
14 Katulampa
4657
16
0.14457
39
55
72
95
15 Baranangsiang
6029
16
0.30552
82
116
150
197
16 Sukasari
2791
16
0.67690
171
238
304
388
17 Bantarjati
5082
16
0.30566
81
115
150
196
18 Tegalgundil
5930
16
0.40981
109
154
199
261
28
No
Nama Desa
N
n
Jumlah n Minimum untuk d = 0.01 Nilai
Koefisien Keragaman
0.10
0.05
0.025
0.01
19 Tanahbaru
4326
16
0.18028
48
69
89
117
20 Cimahpar
3058
16
0.17541
47
66
86
113
21 Ciluar
2968
16
0.19584
52
74
96
125
22 Cibuluh
4692
16
0.24046
64
91
118
155
23 Kedunghalang
4440
15
0.48378
127
179
231
300
24 Ciparigi
4691
16
0.22456
60
85
111
145
25 Paledang
2354
16
0.45178
116
162
208
267
26 Gudang
1920
16
0.45244
115
160
204
260
27 Babakanpasar
2545
16
0.63301
160
223
283
361
28 Tegallega
4339
16
0.22519
60
85
111
145
29 Babakan
1886
16
0.45250
115
160
203
260
30 Sempur
2122
16
0.45210
116
161
206
263
31 Cibogor
1740
16
0.45281
114
159
202
257
32 Kebonkelapa
2752
16
0.18445
49
70
90
118
33 Pasirkuda
3177
16
0.26315
70
99
127
166
34 Pasirjaya
4189
16
0.10803
29
42
54
71
35 Gunungbatu
4328
16
0.07421
20
29
37
49
36 Loji
2905
16
0.26327
70
98
127
165
37 Menteng
3363
16
0.17329
46
66
85
112
38 Cilendek Barat
3284
16
0.07422
20
29
37
49
39 Sindangbarang
2910
16
0.41926
109
153
197
255
40 Margajaya
1159
16
0.26535
68
94
120
153
41 Situgede
1833
16
0.14633
39
55
71
93
42 Bubulak
2147
16
0.26376
69
97
125
162
43 Curugmekar
2287
16
0.26364
69
98
126
163
44 Curug
2164
16
0.26374
69
97
125
162
45 Kedungwaringin
4377
16
0.14562
39
56
72
95
46 Kedungjaya
2680
16
0.28078
74
104
135
175
47 Kebonpedes
4871
16
0.07827
21
30
40
52
48 Tanahsareal
1990
16
0.18451
49
69
89
116
49 Kedungbadak
5941
32
0.51666
136
193
249
325
50 Sukaresmi
2272
16
0.18434
49
69
89
117
51 Cibadak
3813
16
0.49892
130
183
236
305
52 Kayumanis
2272
16
0.21174
56
79
102
133
29
No
Nama Desa
N
n
Jumlah n Minimum untuk d = 0.01 Nilai
Koefisien Keragaman
0.10
0.05
0.025
0.01
53 Mekarwangi
2696
16
0.18415
49
69
90
117
54 Kencana
2154
16
0.22799
60
85
109
142
ˆ 2 z2 / 2 N x2 y n ˆ 2 z2 / 2 x2 ( N 1)d y {( N 1) / N )}s 2y z N 2 y . 2 {( N 1) / N )}s y 2 ( N 1)d z / 2 2 y 2 /2
( 2.25 )
Pada Tabel 2.1 tersebut N merupakan jumlah populasi rumah tangga di area kecil (desa) dan n adalah ukuran contoh Susenas 2005 pada area tersebut. Jumlah n minimum pada d = 0.01 ditentukan sebagaimana pada persamaan ( 2.25 ), dimana d adalah perebedaan relatif mutlak antara parameter dengan dugaannya yaitu, |( - θˆ )/| d. Berdasarkan hasil pada Tabel 2.1 tersebut ukuran contoh Susenas pada tingkat desa sangat kecil, jauh dari jumlah contoh minimum yang diperlukan. Oleh karena itu diperlukan pengembangan metodologi pendugaan untuk mengatasi persoalan ukuran contoh kecil ini. Salah satu metodologi yang saat ini menjadi perhatian para statistisi dunia untuk mengatasi persoalan tersebut adalah metode SAE yang menjadi fokus utama pada disertasi ini.
30
BAB III 3.
Metode Prediksi Tak-Bias Linear Terbaik untuk Pendugaan Area Kecil Berdasarkan Model State Space
3.1. Pendahuluan Sebagaimana dipaparkan pada Bab II bahwa ukuran contoh pada sub-area survei terkadang berukuran kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar atau bahkan pendugaan bisa saja tidak dapat dilakukan pada sub-area tertentu karena sub-area tersebut tidak terpilih menjadi contoh. Metode SAE dikembangkan untuk menyelesaikan masalah tersebut. Area kecil dapat didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil didasarkan pada aplikasi model desain penarikan contoh yang menghasilkan metode pendugaan langsung (Rao, 2003; Chambers dan Chandra, 2006; Lahiri, 2008). Informasi tambahan dapat digunakan untuk meningkatkan akurasi dan presisi suatu penduga. Pada SAE, informasi tambahan tersebut dapat berupa nilai parameter dari area kecil lain yang memiliki karakteristik serupa dengan area kecil yang menjadi perhatian, atau nilai pada waktu yang lalu, atau nilai dari peubah yang memiliki hubungan dengan peubah yang sedang diamati. Pendugaan paramater dan inferensianya yang berdasarkan pada informasi tambahan tersebut, dinamakan pendugaan tidak langsung atau model-based. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat penguatan (borrowing strength) dari hubungan antara nilai peubah respon dan informasi tambahan tersebut. Asumsi dasar dalam pengembangan model untuk SAE adalah bahwa keragaman peubah respon di dalam area kecil dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang disebut sebagai
31
pengaruh tetap. Asumsi lainnya adalah bahwa keragaman specifik area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak area kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh campuran (mixed models). Model pengaruh tetap menerangkan seluruh keragaman peubah respon di dalam area kecil oleh keragaman faktor-faktor yang diketahui. Pendugaan karakteristik area kecil berdasarkan model pengaruh tetap merujuk pada synthetic estimator (Levy, 1971), composite estimator (Schaible et. al., 1977) dan prediction estimator (Holt et. al., 1979; Sarndal, 1984; dan Marker, 1999). Misalnya pada penarikan contoh acak sederhana, rata-rata contoh y merupakan penduga terbaik bagi . Cochran (1977) memberikan gambaran terkait dengan penduga-penduga linear dalam penarikan contoh acak sederhana. Menurutnya, jika setiap yi dengan penimbang yang sama wi bila unit diberi label i yang dipilih, rata-rata contoh y adalah penduga yang tidak bias terhadap n
dengan bentuknya
w y i 1
i
i
. Karena setiap unit muncul dalam sebuah fraksi n/N
dari contoh acak sederhana, maka n n E wi y i i 1 N
n
w y i 1
i
i
jika setiap wi = 1/n. Bila penimbangnya tergantung pada urutannya, dimana unitunit tersebut dipilih ke dalam contoh, maka y mempunyai ragam terkecil di n
antara penduga-penduga linear yang tidak bias dengan bentuk
w y d 1
d
(d )
dimana
y(d) adalah nilai y pada setiap unit yang muncul pada pengambilan ke-d. Beberapa penduga lainnya yang banyak digunakan dalam pendugaan pada data survei dapat dinyatakan sebagai kombinasi linear untuk semua yi yang ada dalam contoh, yaitu : (1) Penduga yang tergantung pada ukuran contoh (sample size dependent estimator)
YˆiSD i Yˆi (1 i )YˆiS
32
1 jika if Nˆ i N i i otherwise Nˆ i /( N i ) selainnya Yˆ YˆiSD i Yˆi (1 i ) Nˆ i Nˆ
Yˆ w j y j and Nˆ = js
w js
j
adalah penduga bagi total dan ukuran populasi untuk
area besar yang berisi area kecil. Nˆ YˆiSD i aij w j y j (1 i ) i Nˆ js
w j y j js
wij* y j
( 3.1 )
js
dimana Nˆ wij* i aij w j (1 i ) i Nˆ
w j
1 if aij w j aij w j jika js jU i otherwise aij w j /( aij w j ) selainnya jU js
(2) Penduga Purcell-Kish (1980) dan penduga composite lainnya,
YˆiPK *Yˆi (1 * )YˆiS Yˆ *Yˆi (1 * ) Nˆ i Nˆ Nˆ * aij w j y j (1 * ) i Nˆ js
w j y j js
w ij y j js
dimana Nˆ w ij * aij w j (1 * ) i Nˆ
w j
33
1 *
v(Yˆ ) i
i (YˆiS Yˆi )2
.
(3) Penduga one off-the-shelf dengan satu peubah penyerta (auxiliary variable) Yˆ YˆiOS Yˆi ( X i Xˆ i ) Xˆ
X Xˆ i a ij w j y j i Xˆ js
w j y j js
wij y j
( 3.2 )
js
dimana X Xˆ i wij aij i Xˆ
m w j dan and w j ij exp( iT x j j ) . i 1
(4) Penduga rasio-sintetik (ratio-synthetic estimator),
Yˆ YˆiRS X i Xˆ
Xi ˆ Xi Y Xˆ Xˆ
w y js
j
j
ij y j w js
dimana ij w
Xi wj . Xˆ
(5) Penduga regresi survei,
Yˆ YˆiR Yˆi ( X i Xˆ i ) Xˆ X Xˆ i aij w j y j i Xˆ js wij y j js
w j y j js
( 3.3 )
34
dimana X Xˆ i wij aij i Xˆ
w j .
Kelima penduga di atas dapat pula dinyatakan dalam bentuk matriks pembobot berukuran n x m, yaitu matriks A = ((aij)): (1) Penduga ketergantungan ukuran contoh (sample size dependent estimator), Nˆ YˆiSD i aij w j y j (1 i ) i Nˆ js
w j y j js
wij* y j js
dimana
Nˆ wij* i a ij w j (1 i ) i Nˆ
w j .
Matriks pembobot n x m ((w*ij)) dapat
dinyatakan sebagai berikut: Nˆ 1 1 a11 w1 (1 1 ) Nˆ w1 ˆ 1 a12 w2 (1 1 ) N1 w2 Nˆ * wij . . . Nˆ 1 1 a1n wn (1 1 ) ˆ wn N
2 a21 w1 (1 2 )
Nˆ 2 w1 Nˆ
2 a22 w2 (1 2 )
Nˆ 2 w2 Nˆ
. . .
2 a2 n wn (1 2 )
Nˆ 2 wn Nˆ
Nˆ m w1 Nˆ ˆ N ... m am 2 w2 (1 m ) m w2 Nˆ . ... . . Nˆ m ... m amn w2 (1 m ) wn ˆ N
.... m am1 w1 (1 m )
(2) Penduga Purcell-Kish (1980) dan penduga composite lainnya, Yˆ YˆiPK *Yˆi (1 * ) Nˆ i Nˆ Nˆ * aij w j y j (1 * ) i Nˆ js
w j y j js
w ij y j js
35
dimana Nˆ w ij * aij w j (1 * ) i Nˆ
w j .
Matriks pembobot n x m (( w ij )) dapat dinyatakan sebagai berikut: ˆ * * N1 a11 w1 (1 ) ˆ w1 N Nˆ * a12 w2 (1 * ) 1 w2 Nˆ w ij . . ˆ * * N1 a1n wn (1 ) ˆ wn N
* a21 w1 (1 * )
Nˆ 2 w1 Nˆ
* a22 w2 (1 * )
Nˆ 2 w2 Nˆ
Nˆ m w1 Nˆ ˆ N ... * am2 w2 (1 * ) m w2 Nˆ . ... . ˆ * * Nm ... amn w2 (1 ) wn ˆ N
.... * am1 w1 (1 * )
. . Nˆ 2 wn Nˆ
* a2 n wn (1 * )
(3) Penduga one off-the-shelf dengan satu peubah penyerta (auxiliary variable) Yˆ YˆiOS Yˆi ( X i Xˆ i ) Xˆ
wij y j js
dimana X Xˆ i wij a ij i Xˆ
w j .
Matriks pembobot n x m (( wij )) adalah X Xˆ 1 a11 1 w1 Xˆ X 1 Xˆ 1 a w2 12 ˆ X wij . . ˆ a X1 X1 w n 1n Xˆ
w1 w2 X m Xˆ m wn Xˆ
X 2 Xˆ 2 a 21 Xˆ X 2 Xˆ 2 a22 Xˆ . .
w2
X Xˆ m ... am1 m Xˆ X Xˆ m ... am2 m Xˆ ... . ... .
X 2 Xˆ 2 a2 n Xˆ
wn
... amn
wj
w1
m
ij exp( iT x j j ) . i 1
36
(4) Penduga rasio-sintetik (ratio-synthetic estimator),
X X YˆiRS i Yˆ i Xˆ Xˆ
w y js
j
j
ij y j w js
dimana ij w
Xi wj . Xˆ
ij )) adalah Pembobot matriks n x m (( w
X1 ˆ w1 X X1 Xˆ w2 ij w . . X1 ˆ wn X
X2 w1 Xˆ
...
X2 w2 Xˆ
...
. .
... ...
X2 wn Xˆ
...
Xm w1 Xˆ Xm w2 ˆ X . . . Xm wn Xˆ
(5) Penduga regresi survei, X Xˆ i YˆiR aij w j y j i Xˆ js wij y j
w j y j js
js
dimana X Xˆ i wij aij i Xˆ
w j .
Matriks pembobot n x m (( wij )) dapat dinyatakan sebagai berikut :
37
X Xˆ 1 a11 1 w1 Xˆ X 1 Xˆ 1 a w2 12 Xˆ wij . . ˆ a X1 X1 w 1 n n Xˆ
w1 w2 . X Xˆ m m w n Xˆ
X 2 Xˆ 2 a21 Xˆ X 2 Xˆ 2 a22 Xˆ . .
w2
X Xˆ m ... am1 m Xˆ X Xˆ m ... am2 m Xˆ ... . ... .
X 2 Xˆ 2 a2 n Xˆ
wn
... amn
w1
Berbeda dengan bentuk kombinasi linear di atas, metode SAE pada dasarnya menggabungkan antara penduga langsung dengan penduga regresi sintetik dengan cara meminimumkan KTG. Model yang berbasis area yang dapat menggunakan metode PTLT bisa dinyatakan sebagai berikut:
ˆi = xiT + bivi + ei, i = 1, 2, ..., m
( 3.4 )
dimana xi adalah p x 1 vektor dari kovariat area, vi iid (0, v2 ) dan bebas terhadap sampling errror ei iid (0, i ) dengan bi adalah konstanta positif. i = i = xiT + bivi. Penduga PTLT bagi i atau i tersebut dapat diperoleh melalui persamaan sebagai berikut (Ghosh et al, 1998; Rao, 2003) : ~H ~ ~ i = xiT + i( ˆ i - xiT ), dimana i = v2bi2 /(i + v2bi2), dan 1
m xi xiT m x iˆi ~ ~ 2 = (v ) = . 2 2 2 2 i 1 i v bi i 1 i v bi
~ Berdasarkan hasil ini, penduga PTLT, iH ,
( 3.5 )
bisa diekspresikan sebagai
~ rataan terboboti antara penduga langsung ˆi dan penduga regresi sintetik xiT ,
dengan pembobot i (0 i 1) yang mengukur perbandingan relatif ragam model v2bi2 terhadap ragam total i + v2bi2. ~ KTG bagi penduga PTLT, iH , yang merupakan KTG terkecil dapat dinyatakan sebagai berikut : ~ ~ KTG( iH ) = E( iH - i)2 = g1i(v2) + g2i (v2) + 2g3i (v2)
( 3.6 )
38
dimana g1i(v2) = (v2bi2i)/(i + v2bi2) = ii dan g2i(v2) = (1 - i)2xiT[ xixiT / (i + v2bi2) ]-1xi g3i(v2) = i2bi2(i + v2bi2)-3V(v2). Sementara model yang berbasis unit pada area tertentu dapat menggunakan metode PTLT yang bisa dinyatakan sebagai berikut: yij = xijT + vi + eij, i = 1, 2, ..., m, j = 1, 2, ..., Ni.
( 3.7 )
Pada model ini diasumsikan bahwa data penyerta (auxiliary) pada unitspesifik xij = (xij1, xij2, ..., xijp)T adalah tersedia untuk setiap elemen j populasi pada setiap area kecil i. Di samping itu, pengaruh area spesifik vi diasumsikan sebagai peubah acak yang menyebar bebas dan identik. i = X Ti + vi. Penduga PTLT bagi i atau i tersebut dapat diperoleh melalui persamaan sebagai berikut (Ghosh et al, 1996; Rao, 2003) : ~ ~ ~iH = X Ti + i( y ia - xiaT ), dimana i = v2bi2 /(i + v2bi2), dan 1
m ~ m = X iT Vi 1 X i X iT Vi 1 y i . i 1 i 1
( 3.8 )
KTG bagi penduga PTLT, ~iH , yang merupakan KTG terkecil dapat dinyatakan sebagai berikut : KTG( ~iH ) = E( ~iH - i)2 = g1i(v2, e2) + g2i (v2, e2)
( 3.9 )
dimana g1i(v2, e2) = i(e2/ai.) dan g2i(v2, e2) = ( X i i xia )T [ Ai]-1( X i i xia ).
39
3.2. MCLT dengan Pengaruh Acak Area dan Waktu Terkadang beberapa survei diulang pelaksanaannya secara berkala, misalnya Susenas. Untuk survei seperti ini pendugaan tidak langsung di suatu area kecil dapat ditingkatkan efisiensi pendugaannya dengan memasukkan pengaruh acak area dan waktu. Rao dan Yu (1994) dan Rao (2003) mengembangkan SAE dengan menggunakan data penampang melintang (cross sectional data) dan data deret waktu (time series data). Model tersebut terdiri dari model galat penarikan contoh
ˆ it it + eit, t = 1, …, T; i = 1, …, m dan model penghubung (linking model) it = xitT + vi + uit.
( 3.10 )
Pada model di atas, ˆ it adalah penduga langsung dari survei untuk area kecil i pada waktu t, it adalah fungsi untuk rataan pada area i pada waktu t, dan eit adalah galat penarikan contoh yang menyebar normal dengan nilai harapan 0 dan mempunyai matriks koragam blok-diagonal . Sedangkan xit adalah vektor spesikasi area yang mungkin berubah menurut waktu t. Sebagaimana diasumsikan sebelumnya bahwa vi iid (0, v2) dan uit diasumsikan mengikuti proses random walk untuk setiap i, yaitu: uit = ui,t-1 + it, dan it iid N(0, 2). Berdasarkan model di atas it tergantung pada pengaruh area spesifik vi dan area oleh waktu spesifik uit yang berkorelasi antar waktu. Model yang salahsatu komponen acaknya berkorelasi menurut waktu seperti yang dipaparkan di atas, ˆit = xitT + vi + uit dan uit = ui,t-1 + it, dapat juga dinyatakan dalam model MCLT, yi = Xi + ZiviT + ei , yaitu: yi = ˆ i ,
Xi = (xit1, …, xitT)T,
Zi = (1T, IT)
( 3.11 )
= (1, …, p)T
( 3.12 )
dan viT = (vi, uiT), ei = (ei1, …, eiT)T,
dimana 1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Sedangkan
v2 Gi = 0
0T , 2
Ri = i
( 3.13 )
40
dimana i = adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) adalah |t-s|/(1 - 2).
3.3. Model State-Space dalam Pendugaan Area Kecil Model state space atau disebut juga model linear dinamik (dynamic linear model) merupakan pendekatan umum untuk model deret waktu dengan peubah tunggal ataupun peubah ganda (Wei, 1994; Casella et al, 2000). State dari suatu sistem didefinisikan sebagai gugus minimum dari informasi saat ini dan waktu sebelumnya sehingga perilaku sistem pada waktu yang akan datang dapat dideskripsikan secara lengkap melalui informasi tersebut. Representasi state space didasarkan pada proses stokastik Markov, yaitu apabila state saat ini diketahui maka perilaku sistem pada waktu yang akan datang bersifat bebas dengan perilaku sistem pada waktu sebelumnya. Karena itu, representasi state space dari suatu sistem sering juga disebut sebagai representasi Markov (Durbin, 2004; Zivot, 2006). Misalkan Y1t dan Y2t merupakan keluaran (output) dari suatu sistem yang masing-masing mempunyai masukan (input) X1t dan X2t. Suatu sistem dikatakan linear jika dan hanya jika kombinasi linear masukan, aX1t + bX2t, akan menghasilkan kombinasi linear yang sama pada keluaran, aY1t + bY2t, untuk setiap konstanta a dan b. Suatu sistem dikatakan time-invariant apabila karakteristik sistem tidak berubah dari waktu ke waktu, yaitu apabila masukan Xt menghasilkan keluaran Yt maka masukan Xt-s akan menghasilkan keluaran Yt-s. Karena itu, suatu sistem dikatakan linear time invariant jika mempunyai karakteristik kedua-duanya yaitu linear dan time-invariant. Model state space umumnya didasarkan pada model linear time-invariant ini. Terkait dengan SAE, terkadang beberapa survei diulang pelaksanaannya secara berkala, misalnya Susenas. Untuk survei yang demikian ini pendugaan tidak langsung, seperti pendugaan rata-rata pengeluaran perkapita di suatu area kecil, dapat ditingkatkan efisiensi pendugaanya dengan memasukkan pengaruh acak area dan waktu. Model state space merupakan salah satu alternatif metode pemodelan dalam SAE dengan memperhatikan pengaruh pengamatan antar waktu (Pfeffermann, 2002). Perhatikan model pendugaan tidak langsung sebagai berikut:
41
ˆ it it + eit, t = 1, …, T; i = 1, …, m
( 3.14 )
it = xitTit dimana koefisien it = (it0, it1, …, itp)T mempunyai variasi menurut area dan waktu, galat penarikan contoh eit untuk setiap area i diasumsikan tidak berkorelasi dengan nilai tengah 0 dan ragam it. Variasi it antar waktu dapat dimodelkan sebagai berikut:
β itj β i ,t 1, j 1 β T j β vitj , j 0,1,..., p . ij ij 0
( 3.15 )
Formulasi bagi it dapat mencakup beberapa model umum yang banyak digunakan. Misalnya, apabila matriks Tj adalah 0 1 Tj 0 1 maka formulasi bagi it berupa model regresi, itj = ij + vitj. Apabila matriks Tj dinyatakan sebagai 1 0 Tj 0 1 maka formulasi bagi it berupa model random walk, itj = i,t-1,j + vitj. Sedangkan model regresi diri (autoregressive) ordo 1 atau AR(1), itj - ij = (i,t-1,j - ij) + vitj, dapat diformulasikan apabila Tj 0
1 . 1
Pemodelan di atas pada dasarnya merupakan kasus khusus dari model state space sebagai berikut: yt = Ztt + t;
E(t) = 0,
E(ttT) = t
t = Htt-1 + At;
E(t) = 0,
E(ttT) =
( 3.16 )
dimana t dan t tidak berkorelasi antar waktu. Persamaan pertama disebut sebagai persamaan transisi Markov (transition equation), sedangkan persamaan kedua disebut persamaan pengukuran (measurement equation). Model state space ini mempunyai bentuk dasar sebagaimana MCLT tetapi dengan melakukan updating dugaan pada tiap waktu, penggunaan persamaan penyaring Kalman, dan pemulusan dugaan terakhir sebagai data baru.
42
~ merupakan penduga Vektor t disebut sebagai vektor state. Misalkan α t -1 PTLT bagi t-1 didasarkan pada semua pengamatan hingga waktu (t-1), sehingga ~ = Hα ~ α t|t -1
t -1
merupakan penduga PTLT bagi t pada waktu (t-1). Selanjutnya dapat dinyatakan pula persamaan (3.17 ) Pt|t-1 = HPt-1HT + AAT ~ - , dimana P = E( α ~ - ) yaitu matriks koragam bagi penduga galat α t t-1 t-1 t|t -1 t -1 ~ - )T adalah matriks koragam bagi penduga galat pada waktu (t-1). Pada E( α t-1 t -1 waktu t, penduga bagi t dan matriks koragamnya diperbarui (updated) menggunakan data baru (yt, Zt), yaitu ~ ~ yt - Zt α t|t -1 = Zt(t - α t|t -1 ) + t
( 3.18 )
~ , Z = Z, v yang mempunyai bentuk model linear campuran dengan y = yt - Zt α t t|t -1 ~ , G = P dan V = F , dimana = t - α t|t-1 t t|t -1
Ft = ZtPt|t-1ZtT + t.
( 3.19 )
Berdasarkan penjabaran di atas, pendugaan parameter pada model state space dapat menggunakan pendekatan MCLT. Pada persamaan pengukuran, yaitu persamaan kedua pada model state space ( 3.16 ) di atas, di samping menggunakan model regresi diri dapat pula mengunakan model rataan bergerak (moving average) maupun model campuran antara regresi diri dan rataan bergerak. Hanya saja untuk model rataan bergerak diperlukan pembalikan proses terlebih dahulu yaitu dari rataan bergerak menjadi regresi diri, selanjutnya diintegrasikan pada persamaan ( 3.16 ) tersebut, karena model dasar untuk persamaan pengukuran pada model state space adalah regresi diri. Dengan demikian, penggunaan rataan bergerak pada model state space akan menjadi sangat kompleks terlebih lagi kalau diintegrasikan pada model SAE. Kajian pada disertasi ini dibatasi pada model state space yang persamaan pengukurannya didasarkan pada model regresi diri.
43
3.4. Pendugaan Parameter Model dengan KMT Nilai tengah atau total pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Prediksi tak-bias linear terbaik (PTLT), dilakukan dengan cara meminimumkan fungsi kuadrat tengah galat (KTG). Sehingga penduga bagi PTLT akan memiliki KTG yang paling kecil di antara semua penduga tidak bias linear. Metode kemungkinan maksimum terkendala / KMT (restricted maximum likelihood / REML) dapat digunakan untuk menduga komponen ragam atau koragamnya. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh melalui dua tahap sehingga disebut sebagai PTLT empirik atau PTLTE. 3.4.1. Penduga Tak-bias Linear Terbaik (PTLT) Model linear campuran umum yang digunakan sebagai model dasar areakecil dengan pengaruh acak area dan waktu di atas dapat dinyatakan sebagai ( 3.20 )
y = X + Zv + e dimana y = ˆit ,
X = (xit1, …, xitT)T,
Z = (1T, IT), dan
vT = (vi, uiT), e = (ei1, …, eiT)T,
= (1, …, p)T
1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Pada persamaan di atas, y adalah vektor dari pengamatan contoh, X dan Z adalah matriks yang diketahui, dan v dan e adalah saling bebas dengan nilai tengah 0 dan matriks koragam G dan R, tergantung pada beberapa parameter yang disebut sebagai komponen ragam. Ragam bagi y yaitu Var(y) = V = R + ZGZT. Selanjutnya akan diduga kombinasi linear
= lT + mTv .
( 3.21 )
Penduga linear yang diinginkan adalah bersifat tidak bias dan memiliki ragam minimum. Suatu penduga linear ˆ = aTy + b adalah tidak bias bagi = lT + mTv berdasarkan model campuran di atas, yaitu E( ˆ ) = E() jika dan hanya jika aTX = lT dan b = 0. Nilai KTG bagi penduga tidak bias linear ˆ dapat dinyatakan sebagai berikut: KTG( ˆ ) = E( ˆ - )2 . Karena ˆ merupakan penduga tidak bias bagi ˆ maka
44
KTG( ˆ ) = Var( ˆ - ) = Var( ˆ ) – 2Cov( ˆ , ) + Var()
( 3.22 )
dimana Var( ˆ ) = Var(aTy + b) = aTVa Cov( ˆ , ) = Cov(aTy, lT + mTv) = Cov(aT(X + Zv + e), lT + mTv) = Cov(aTZv, mTv) = aTZGm Var() = Var(lT + mTv) = Var(mTv) = mTGm. Berdasarkan hasil tersebut, KTG( ˆ ) dapat dinyatakan sebagai berikut: KTG( ˆ ) = aTVa - 2aTZGm + mTGm.
( 3.23 )
Selanjutnya KTG( ˆ ) ini diminimumkan dengan kendala aTX = lT. Penyelesaiannya menggunakan metode pengganda Lagrange, yaitu L(a, ) = aTVa - 2aTZGm + mTGm + 2(aTX - lT) L(a, )/a = 2Va - 2ZGm + 2X = 0 a = V-1ZGm - V-1X.
( 3.24 )
Apabila persamaan ( 3.24 ) disubstitusikan ke dalam kendala aTX = lT, maka diperoleh penyelesaian bagi yaitu = -(XTV-1X)-1l + (XTV-1X)-1XTV-1ZGm .
( 3.25 )
Pengkombinasian persamaan ( 3.24 ) dengan ( 3.25 ) menghasilkan penduga PTLT bagi = lT + mTv, yaitu ~ ˆ = aTy = Ty + (lT - TX) β
dimana ~ T = mTGZV-1 dan β = (XTV-1X)-1 XTV-1y
( 3.26 )
~ β yang diperoleh pada dasarnya dapat dianggap sebagai penduga kuadrat terkecil
terboboti bagi . Untuk model regresi tersarang-galat (nested-error), V = diag(V1, ..., Vm) dengan Vi = e2 I ni + 2 1ni 1Tni , sehingga V-1 = (V1-1, ..., Vm-1) dengan Vi-1= (e2)1
I ni
ini-1(e2)-1 1ni 1Tni dan i = 2(2 + e2ni-1)-1, menggunakan konsep
kebalikan matriks : (A + uvT) = A-1 A-1uvTA-1(1 + vTA-1u)-1. Oleh karena itu, dengan mengambil l = Xi dan m = (0 ... 010 ... 0)T yaitu 1 pada posisi ke-i dan
45
(2/e2)(1 i) = i/ni, maka diperoleh penduga tak-bias linear terbaik bagi i yaitu: ~ ~ h(, y) = XTi β + i ( yi x Ti β )
( 3.27 )
dimana = (2, e2) dan xi adalah rataan contoh dari xij untuk area ke-i. Sedangkan y = col1 i m col1 j ni ( yij ) dan X = col1 i mcol1 j ni (xijT ) . Pendekatan yang sama dapat pula diterapkan pada model koefisien regresi acak yang menghasilkan penduga tidak bias linear terbaik bagi i yaitu ~ ~ ~ hi(, y) = XTi β + γ i Xi ( βi β )
( 3.28 )
~ ~ dimana = (2, e2), γ i = 2(2 + e2/jxij2)-1, βi = jxijyij/jxij2, dan β = ~
γ β /γ i
i
i
.
Untuk model Fay-Herriot, penduga tak-bias linear terbaik bagi i adalah sebagai berikut: ~ ~ hi(, y ) = xTi β + 2/(2 + i2) ( yi x Ti β ),
( 3.29 )
~ dimana β = (XTV-1X)-1(XTV-1 y ) dengan V = diag(2 + 12, ..., 2 + m2), dan X
= col1 i m (x iT ) . Nilai hi(, y ) akan mendekati penduga survei langsung yi apabila ~ i2/(2 + i2) 0, dan mendekati penduga sintetik xTi β apabila 2/(2 + i2) 0. Oleh karena itu penduga tak-bias linear terbaik adalah rataan terboboti antara ~ penduga survei langsung dan penduga sintetik, yaitu wi yi + (1 wi) x Ti β , dimana wi = 2/(2 + i2). 3.4.2. Pendugaan Dua Tahap Penduga h(, y) tergantung pada komponen ragam = (1, …, p)T, tetapi di dalam praktik nilai komponen tidak akan diketahui. Secara aktual, komponen tersebut umumnya berbentuk rasio 1/p, misalnya pada persamaan (3.3) dan (3.4) tergantung pada 2/e2. Nilai tersebut digunakan untuk menduga h(, y) melalui penggantian dengan penduga konsisten φˆ . Hasil dari penduga dua tahap tersebut bersifat tidak bias. Elemen dari φˆ merupakan fungsi dari y yang bersifat
46
translation-invariant yaitu φˆ (-y) = φˆ (y) dan φˆ (y Xa) = φˆ (y) untuk semua y dan a. Beberapa metode pendugaan untuk model campuran linear umum telah banyak dikembangkan, di antaranya adalah oleh Henderson (1975) dan Harville (1977). Penerapannya pada model area kecil di antaranya dikembangkan oleh Prasad dan Rao (1990), Datta dan Lahiri (1995), dan Rao (2003), dan Lahiri (2008). Untuk model regresi galat tersarang, penduga kuadratik tidak bias bagi e2 dan 2 berdasarkan pendekatan Henderson adalah σˆ e2 = (n m k + )-1 eˆij2
dan σˆ 2υ = w-1[ uˆij2 (n k) σˆ e2 ]
dimana w = n tr[(XTX)-1 i 1 ni2 xi xiT ], dan = 0 jika model tersebut tidak m
memiliki intersep dan = 1 untuk selainnya. Nilai { eˆij2 } adalah nilai sisaan dari regresi kuadrat terkecil antara yij yi dengan {xij1 xi.1 , …, xijk xi.k }, sedangkan { uˆij2 } adalah nilai sisaan dari regresi kuadrat terkecil antara yij dengan {xij1, …, xijk}. Untuk model koefisien regresi acak, penduga kuadratik tidak bias bagi e2 dan 2 berdasarkan pendekatan Henderson adalah σˆ e2 = (n m)-1 eˆij2
dan σˆ 2υ = w-1[ uˆij2 (n 1) σˆ e2 ] ~ = x 2 [ ( x 2)2](x 2)-1. dimana eˆij = yij xij(jxijyij)(jxij2)-1 dan w ij i j ij ij
Sedangkan pada model Fay-Herriot, penduga kuadratik tidak bias bagi 2 adalah m m σˆ 2υ (m k ) 1 uˆi2 δi (1 xiT ( XT X) 1 x i i 1 i 1
dimana uˆi yi xiTβˆ dan
( 3.30 )
βˆ ( XT X) 1 XT y . Penduga dua tahap hi( σˆ 2υ , y )
merupakan penduga empirical Bayes di bawah asumsi kenormalan.
47
3.5. Pendekatan Orde Kedua untuk KTG Misalkan h(, y) dituliskan sebagai h() dan h( φˆ , y) ditulis sebagai h( φˆ ), maka KTG bagi h( φˆ ) dapat dinyatakan sebagai berikut: KTG[h( φˆ )] = KTG[h()] + E[h( φˆ ) h()]2,
( 3.31 )
Kackar dan Harville (1984) melalui pendekatan deret Taylor diperoleh persamaan bahwa E[h( φˆ ) h()]2 = E[d()T( φˆ )]2
( 3.32 )
dengan d() = h()/, selanjutnya dapat dinyatakan E[d()T( φˆ )]2 = tr[A()E( φˆ )( φˆ )T],
( 3.33 )
dimana A() adalah matriks koragam dari d(). tr[A( φˆ )E( φˆ )( φˆ )T] = tr[(b)V(bT)E( φˆ )( φˆ )T], ( 3.34 ) dimana bT = col1 j p (b T / j ) dan bT = mTGZTV-1. Kondisi umum terdapat pada bagian Teorema A.1, dimana pendekatan pada persamaan ( 3.33 ) dan ( 3.34 ) adalah o(m-1) untuk m bernilai besar. Pengkombinasian persamaan ( 3.31 ) – ( 3.34 ), akan diperoleh: KTG[h( φˆ )] = KTG[h()] + tr[(bT)V(bT)TE( φˆ )( φˆ )T], ( 3.35 ) Hasil ( 3.35 ) ini dapat digunakan untuk mengevaluasi tiga model area kecil di atas. KTG[hi(2, y)] untuk model regresi tersarang galat dapat dinyatakan sebagai berikut: KTG[hi(2, y)] = (1 i)2 + ( Xi i xi )T(XTV-1X)-1( Xi i xi )
( 3.36 )
~ dimana (XTV-1X)-1 adalah matriks ragam koragam bagi β , (2/e2) (1 i) =
i/ni, dan
γ i / σ 2ν (b )V (b ) n (1 Vi 1ni ) [γ i / σ 2ν γ i / σ e2 ] , 2 γ / σ e i T
T T
2 i
T ni
( 3.37 )
dimana (1Tni Vi 1ni ) ni2 [σ 2ν σ e2 / ni ] , selanjutnya diperoleh tr[(bT)V(bT)TE( φˆ )( φˆ )T] = ni2 (σ 2ν σ e2 / ni ) 3 var(σˆ e2σ 2ν σˆ 2ν σ e2 ) . Melalui metode yang sama, untuk model koefisien regresi acak diperoleh bahwa KTG[hi(2, y)] = X i2 (1 γ i )2 + X i2 (1 γ i )2( γ i )-12
( 3.38 )
48
dan tr[(bT)V(bT)TE( φˆ )( φˆ )T] = X i2 ( j xij2 ) 2 (σ 2ν σ e2 / j xij2 ) 3 var(σˆ e2σ 2ν σˆ 2ν σ e2 ) . Pada model Fay-Herriot diperoleh KTG[hi(2, y)] = 2i2(2 + i2)-1 + i4(2 + i2)-2xiT(XTV-1X)-1xi dan tr[(bT)V(bT)TE( φˆ )( φˆ )T] = i4(2 + i2)-3var( σˆ 2υ ).
( 3.39 )
Nilai harapan dari penduga KTG tersebut bersifat O(m-1) berdasarkan model Fay-Herriot. Untuk model regresi galat tersarang, pendekatan KTG mungkin dapat dinyatakan g1i(2) + g2i(2) + g3i(2), dimana g1i(2) = (1 i)2, g2i(2) = ( Xi i xi )T(XTV-1X)-1( Xi i xi ), dan g3i(2) = ni2 (σ 2ν σ e2 / ni ) 3[σ e4 var( σˆ 2ν ) σ 4ν var(σˆ e2 ) 2σ e2σ 2ν cov(σˆ e2 , σˆ 2ν )] . Di bawah asumsi kenormalan {i} dan {eij}, maka var( σˆ e2 ) = 2(n m k + )-1e4, var( σˆ 2ν ) = 2w-2[(n m k + )-1 (m )( n k) e4 + 2we22 + w*4] dan cov( σˆ e2 , σˆ 2ν ) = (m )w-1var( σˆ e2 )
( 3.40 )
dimana w = n tr[(XTX)-1 i 1 ni2 xi xiT ] dan w* = tr(MZZT)2 dengan M = I m
X(XTX)-1XT. Penduga bagi g2i(2) dan g3i(2) dapat disederhanakan menjadi g2i( σˆ 2 ) dan g3i( σˆ 2 ) yang bersifat Op(m-1), karena σˆ 2 merupakan penduga konsisten bagi 2. Tetapi g1i( σˆ 2 ) bukan penduga yang tepat bagi g1i(2) karena terjadi bias pada ordo O(m-1). Penduga yang tepat bagi g1i(2) dapat diperoleh melalui penyesuaian bias g1i( σˆ 2 ) pada O(m-1) dengan menggunakan metode ekspansi Taylor bagi g1i( σˆ 2 ) dan kemudian diperoleh nilai harapannya, yaitu E(g1i( σˆ 2 )) g1i(2) = g3i(2) + o(m-1)
( 3.41 )
49
sehingga g1i( σˆ 2 ) + g3i( σˆ 2 ) merupakan penduga yang tidak bias pada ordo Op(m-1). Penduga bagi pendekatan KTG yang bersifat Op(m-1) dapat dinyatakan sebagai ktg[hi( σˆ 2 , y)] = g1i( σˆ 2 ) + g2i( σˆ 2 ) + 2g3i( σˆ 2 ).
( 3.42 )
Sesuai penjabaran di atas, untuk model koefisisen regresi acak, nilai ktg[hi( σˆ 2 , y)]-nya juga seperti persamaan ( 3.42 ), dengan g1i(2) = X i2 (1 γ i )2, g2i(2) = X i2 (1 γ i )2( γ i )-12, dan g3i(2) = X i2 ( j xij2 ) 2 (σ 2ν σ e2 / j xij2 ) 3 [σ e4 var( σˆ 2ν ) σ 4ν var(σˆ e2 ) 2σ e2 σ 2ν cov(σˆ e2 , σˆ 2ν )] .
( 3.43 )
Selanjutnya, berdasarkan asumsi kenormalan {i} dan {eij}, maka var( σˆ e2 ) = 2(n m)-1e4, ~ -2[(n 1)(m 1)( n m) 4 + 2 w ~ 2 2 + w ~ * 4], dan var( σˆ 2ν ) = 2 w e e ~ -1var( σˆ 2 ) cov( σˆ e2 , σˆ 2ν ) = (m 1) w e ~ = x 2 [ ( x 2)2](x 2)-1 dan w ~ * = {tr(MZZT)}2 dengan M = I dimana w ij i j ij ij
X(XTX)-1XT. Pada model Fay-Herriot, penjabaran ktg[hi( σˆ 2 , y)] dapat dinyatakan sebagai berikut: ktg[hi( σˆ 2ν , y)] = g1i( σˆ 2ν ) + g2i( σˆ 2ν ) + 2g3i( σˆ 2ν )
( 3.44 )
dimana g1i(2) = 2i2(2 + i2)-1, g2i(2) = i4(2 + i2)-2xiT(XTV-1X)-1xi, dan g3i(2) = i4(2 + i2)-3var( σˆ 2ν ).
( 3.45 )
Selanjutnya, berdasarkan asumsi kenormalan {i} dan {eij}, maka Var( σˆ 2ν ) = 2m-1[4 + 22i2/m + i2/m] .
( 3.46 )
Morris (1994) mengajukan selang kepercayaan emprical Bayes untuk nilai tengah i dengan mengasumsikan i2 = 2 pada kasus khusus i = + i. Intervalnya adalah μˆ i z/2si, dimana μˆ i adalah penduga emprical Bayes yang
50
secara esensial ekuivalen dengan hi( σˆ 2ν , y ), dan si2 = g1i( σˆ 2ν ) + g2i( σˆ 2ν ) + 24( σˆ 2ν +2)-2m-1(yi xiTβˆ )2 yang bersifat o(m-1). Nilai si2 dapat direduksi menjadi g1i( σˆ 2ν ) + g2i( σˆ 2ν ) + g3i( σˆ 2ν ) jika (yi xiTβˆ )2 diganti dengan nilai rataannya yaitu (yi xiTβˆ )2m-1. Penduga ini ekuivalen dengan penduga KTG yang diperoleh melalui pendekatan g1i( σˆ 2ν ) yang tidak disesuaikan pada biasnya ke O(m-1). Prasad dan Rao (1990) serta Datta dan Lahiri (1995) mengajukan hi( σˆ 2 , y) z/2(ktg[hi( σˆ 2 , y)])1/2 sebagai selang kepercayaan pada model koefisien regresi acak dan model regresi galat tersarang, serta hi( σˆ 2ν , y) z/2mse[hi( σˆ 2ν , y)] untuk model Fay-Herriot.
3.6. Evaluasi terhadap Penduga KTG Pada model campuran umum ( 3.20 ) di atas, y = col1 i m (y i ) , X = col1 i m ( Xi ) , Z = col1 i m (Zi ) , v = col1 i m ( v i ) , dan e = col1 i m (ei ) , dimana yi dan ei adalah ni 1 vektor acak, Xi dan Zi adalah matriks konstanta yang diketahui dengan ukuran ni k dan ni bi, vi adalah bi 1 vektor acak, dan n = ni merupakan ukuran total contoh. Vektor vi dan ei adalah saling bebas dengan nilai tengah 0 dan matriks koragam G = col1 i m (G i ) dan R = col1 i m (R i ) dengan ukuran bi bi dan ni ni, tergantung pada parameter = (1, …, p)T yang disebut sebagai komponen ragam. Selanjutnya, i = liT + miTv dengan mi = col1 j i (ij mii ) , dimana ij = 1 jika i = j dan ij = 0 jika i j, li dan mii adalah
vektor konstanta yang diketahui dengan ukuran p 1 dan bi 1, dan adalah vektor parameter berukuran p 1. Teorema A.1. Di bawah kondisi kenormalan untuk galat acak pada model ( 3.20 ), maka ( 3.47 ) E[d()T( φˆ )]2 = tr[(biT)V(biT)TE( φˆ )( φˆ )T] + o(m-1), (A.1) dimana biT = col1 j p (b i / j ) dan biT = mTGZTV-1 . T
Untuk membuktikan Teorema A.1 diperlukan beberapa lemma.
51
Lemma A.1. Misalkan A1 dan A2 adalah matriks berordo n, dan u ~ Nn(0, ), dimana adalah definit positif. Maka, E[u(uTAsu)uT] = (tr As) + 2As,
s = 1, 2,
2 E (u T A s u) = 2tr A1 A2 + (tr A1)(tr A2), s 1
( 3.48 )
dan
2 E u (u T A s u) u T = (tr A1)(tr A2) + 2(tr A1)A2 s1 + 2(tr A2)A1 + 2(tr A1A2) + 4A1A2 + 4A2A1.
( 3.49 )
Lemma A.2. Misalkan u ~ Nn(0, ), zj = jTu, dan qj = uTAju, (j = 1, …, p), dimana j dan Aj adalah matriks dengan ordo n 1 dan n n. Maka, p
p
E[zT(q Eq)]2 = tr zq + 4 { jTAjAll + jTAlAjl}) ( 3.50 ) j 1 l 1
dimana z = (z1, …, zp), q = (q1, …, qp), z dan q adalah matriks koragam bagi z dan q. Berdasarkan hasil ( 3.50 ) dan Lemma A.1, maka E(qi) = tr Ai, cov(qi, qj) = 2tr AiAj, dan E[zizj(qi Eqi)(qj Eqj)] = iTE[u(uTAiuuTAju)uT]j (Eqi)iTE[u(uTAju)uT)]j (Eqj)iTE[u(uTAiu)uT)]j + (Eqi)(Eqj)iTj. Lemma
A.3.
Misalkan
( 3.51 ) (a)
nn =
diag1 i m [O(m 1 )] [O(m 2 )] ; (c) r =
diag1 i m ( Σi ) ;
(b)
Cnn =
col1 h mcol1 j nh [O(m 1 )] ; (d) si =
col1 h m col1 j nh [ihO(1)] , dimana i adalah matriks ni ni. Selanjutnya (e)
CC = [O(m-2)]nn; (f)
siTsi = O(1); (g) (r + si)TCC(r + si) = O(m-2).
Berdasarkan penjabaran (a) (d) akan diperoleh (e) (g). Lemma A.4. Misalkan dm(j)() adalah elemen ke-j dari dm() = tm()/(), maka akan diperoleh cov[dm(j)(), dm(l)()] = [biT/j]V[bmT/l] + O(m-1).
(3.52 )
52
Hal ini berdasarkan konsep diferensial yaitu (AB/) = (A/)B + A(B/) dan B-1/ = B-1(B/)B-1. Selanjutnya bisa dituliskan bahwa dm(j)() = {fm(j)T + biT/j}u, dimana u = Zv + e, dan fm(j)T = (1T mmTGZTV-1X)(XTV-1X)-1 (XT[V-1/j]A (bmT/j)X(XTV-1X)-1XTV-1, dengan A = I X(XTV-1X)-1XTV-1. Dengan demikian bisa diperoleh bahwa cov[dm(j)(, y), dm(l)(, y)] = [fi(j)T + bmT/j]V[fi(l)T + bmT/l.]T ( 3.53 ) Berdasarkan penjabaran di atas, elemen fm(j) bersifat O(m-1), biT/j = [col1 l m (il O(1))]T ,
X(XTV-1X)-1XT = [O(m-1)]nnX(XTV-1X)-1XT(V-1/j)A =
[O(m-1)] nn dan X(XTV-1X)-1XTV-1 = [O(m-1)] nn.
Hasil yang ditunjukkan pada ( 3.47 ) diperoleh dari ( 3.53 ), yaitu E[dm(, y)T( φˆ )]2 = tr[Am()E( φˆ )( φˆ )T] + o(m-1),
( 3.54 )
dan selanjutnya menggunakan Lemma A.4 untuk menggantikan Am() dengan (bmT)V(bmT)T. Melalui penggunaan Lemma A.2 dengan jT = fm(j)T + bmT/j = j(i)T, z = dm(), = V, Aj = Cj, dan q = φˆ , akan diperoleh E[dm(, y)T( φˆ )]2 = tr[Am()E( φˆ )( φˆ )T] p
p
+ 4 [ j(i)TVCjVCll(i) + j(i)TVClVCjl(i)]
( 3.55 )
j 1 l 1
dimana j(i) dan Cj adalah bentuk r + sm dan C pada Lemma A.3. Pada bagian ini dijabarkan bahwa pendekatan deret Taylor untuk nilai harapan penduga parameter pada model Fay-Herriot adalah bersifat o(m-1). Teorema A.2. Misalkan ragam i2 memenuhi 0 < L2 i2 U2 < untuk semua i dan misalkan pula qi = xiT(XTX)-1xi sedemikian hingga
maksi1 qi =
O(m-1). Selanjutnya, E[hi( σˆ 2ν , y) hi( σ 2ν , y )] = E[( σˆ 2ν σ 2ν )hi( σ 2ν , y )/ σ 2ν ]2 + o(m-1).
( 3.56 )
Pembuktian Teorema A.2 membutuhkan dua Lemma yang terkait dengan persoalan tersebut. Lemma A.5. E( σˆ 2ν σ 2ν )2s = O(m-s) (s 1). Hal ini dapat dijelaskan sebagai berikut:
53
σˆ 2ν σ 2ν = (m k)-1[( yi xiT)2 ( β )TXTX( β )
( σ 2ν + i2)(1 qi)] = (m k)-1[Ui( σ 2ν + i2) T( σ 2ν + i2)qi]
( 3.57 )
~ dimana β = (XTX)-1XT y , Ui = ( yi xiT)/( σ 2ν + i2) 1 = U i 1 dengan E(Ui) = 0, T = ( β )TXTX( β )/( σ 2ν
+ i2)qi dengan E(T) = 0, dan
k k ~ T = 1 λ jV j / 1 λ j , Vj merupakan peubah 12 yang saling bebas, sedangkan j
merupakan akar ciri (eigenvalues) dari (XTX)-1(XTVX) dan j = ( σ 2ν + i2)qi. Berdasarkan ( 3.57 ), dapat diketahui bahwa E( σˆ 2ν σ 2ν )2 2(m k)-2[E(Ui( σ 2ν + i2))2 + E(T2(( σ 2ν + i2)qi)2] = O(m-1), karena E(T2) = O(1), ( σ 2ν + i2)qi = O(1), dan E(Ui( σ 2ν + i2))2 = E(Ui2)( σ 2ν + i2)2 ( σ 2ν + U2)2mE(Ui2) = O(m) selanjutnya, E( σˆ 2ν σ 2ν )2s 2s(m k)-2s[E(Ui( σ 2ν + i2))2s + E(T2s(( σ 2ν + i2)qi)2s] = O(m-s), s 2, sedangkan E(Ui( σ 2ν + i2))2s = O(ms) karena E(Ui) = 0. Lemma A.6. E( σˆ 2ν σ 2ν )2s = O(m-s) (s 1) dan E( σˆ 2ν ~ σ ν2 )4 = O(m-4). Hal ini dapat dijelaskan sebagai berikut: P( ~ σ ν2 0) = P( ~ σ ν2 σ 2ν σ 2ν ) P(| ~ σ ν2 σ 2ν | σ 2ν ) E( ~ σ ν2 σ 2ν )2l/ σ 2ν l dengan menggunakan pertidaksamaan Chebyshev. Berdasarkan Lemma A.5 maka P( ~ σ ν2 0) = O(m-1) untuk beberapa nilai l. E( σˆ 2ν σ 2ν )2s = E[( σˆ 2ν σ 2ν )2s| ~ σ ν2 0]P( ~ σ ν2 0) + E[( σˆ 2ν σ 2ν )2s| ~ σ ν2 >0]P( ~ σ ν2 >0) σ 2ν s P( ~ σ ν2 0) + E( ~ σ ν2 σ 2ν )2s = O(m-1),
( 3.58 )
dengan cara memilih l = s dan menggunakan Lemma A.5. Selanjutnya dituliskan ( σˆ 2ν ~ σ ν2 )4 = ~ σ ν4 W, dimana W = 1 jika ~ σ ν2 0 dan W = 0 jika ~ σ ν2 > 0. Melalui pertidaksamaan Cauchy-Schwarz, diperoleh bahwa
54
1
E( σˆ 2ν ~ σ ν2 )4 [E( ~ σ 8ν )P( ~ σ ν2 < 0)] 2 = O(m-4)
( 3.59 )
karena P( ~ σ ν2 0) = O(m-8) dan E( ~ σ 8ν ) 8[E( ~ σ 8ν σ 2ν )8 + σ8ν ] + O(1). Selanjutnya, Teorema A.2 di atas dapat dibuktikan sebagai berikut. Berdasarkan ekspansi deret Taylor dari fungsi hi( σˆ 2ν y ) di sekitar σ 2ν , dapat diperoleh bahwa hi( σˆ 2ν y ) hi( σ 2ν y ) = ( σˆ 2ν σ 2ν )hi( σ 2ν y )/ σ 2ν + 0.5( σˆ 2ν σ 2ν )22hi( σ 2ν * y )/ σ 2ν *2 ,
( 3.60 )
dimana | σ 2ν * σ 2ν | < | σˆ 2ν σ 2ν |. Dengan demikian, maka E[hi( σˆ 2ν y ) hi( σ 2ν y )]2 = E[( σˆ 2ν σ 2ν )hi( σ 2ν y )/ σ 2ν ]2 + R1 + R2, dimana R1 = E[( σˆ 2ν σ 2ν )hi( σ 2ν y )/ σ 2ν ][( σˆ 2ν σ 2ν )22hi( σ 2ν * y )/ σ 2ν *2], dan R2 = E[( σˆ 2ν σ 2ν )4{2hi( σ 2ν * y )/ σ 2ν *2}2]. Dapat ditunjukkan bahwa R2 bersifat o(m-1), yaitu ~ ~ hi( σ 2ν y )/ σ 2ν = i2( σ 2ν + i2)-1(xiT β )/ σ 2ν + i2( σ 2ν + i2)-2( yi xiT β ), ~ ~ ~ ), dimana β = (XTV-1X)-1(XTV-1 y ) dan (xiT β )/ σ 2ν = xiT(XTV-1X)-1(XTV-2 u ~ = y X~ dengan u β . Hal ini berdasarkan pada teorema matriks, bahwa jika A dan
B adalah matriks non-singular sedemikian hingga zTAz > zTBz, maka zTA-1z < zTB-1z untuk setiap z 0 (Graybill, 1969). Berdasarkan hasil ini dan ~ T V-1 u ~ uTV-1u, dimana u = y X, pertidaksamaan Cauchy-Schwarz, dan u
akan diperoleh ~ ~ T V-3 u ~ )1/2 |(xiT β )/ σ 2ν | (xiT(XTV-1X)-1xi)1/2( u
(max qi)1/2( σ 2ν + U2)1/2L-3(uTu)1/2,
( 3.61 )
sehingga ~ ~ |hi( σ 2ν y )/ σ 2ν | |(xiT β )/ σ 2ν | + L-2| yi xiT β | ,
( 3.62 )
~ dimana |(xiT β )/ σ 2ν | diberikan pada (A.9).
Turunan kedua dari hi( σ 2ν y ) adalah
55
~ 2hi( σ 2ν y )/( σ 2ν )2 = i2( σ 2ν + i2)-12(xiT β )/( σ 2ν )2 ~ ~ 2i2( σ 2ν + i2)-2(xiT β )/ σ 2ν 2i2( σ 2ν + i2)-3( yi xiT β ),
dimana ~ ~ 2(xiT β )/( σ 2ν )2 = 2xiT(XTV-1X)-1XTV-3 u ~. 2xiT(XTV-1X)-1XTV-2X(XTV-1X)-1XTV-2 u
Berdasarkan pertidaksamaan Cauchy-Schwarz dan hasil matriks di atas serta beberapa penyederhanaan, dapat diperoleh ~ |2(xiT β )/( σ 2ν )2| 4(max qi)1/2( σ 2ν + U2)1/2L-5(uTu)1/2, ~ TV-2X(XTV-1X)-1XTV-2 u ~ dan u
( 3.63 )
~ TV-3 u ~ , karena V1/2X(XTV-1X)-1XTV-1/2 u
adalah matriks simetrik dan idempoten dengan akar ciri 1 atau 0. Mengacu pada persamaan ( 3.61 ) dapat diperoleh bahwa ~ |2hi( σ 2ν y )/( σ 2ν )2| 6(max qi)1/2( σ 2ν + U2)1/2L-5(uTu)1/2 + 2L-4| yi xiT β |.
Oleh karena itu, ~ [2hi( σ 2ν y )/( σ 2ν )2]2 c1( σ 2ν + U2)((1/m)ui2) + c2( yi xiT β )2, (3.64 )
dimana c1 dan c2 adalah O(1), dan (m maxi qi) = O(1). Juga menyebabkan bahwa, ~ ~ ( yi xiT β )2 2[ui2 + (xiT( β ))2] 2[ui2 + ( σ 2ν + U2)( m maxi qi)L-2((1/m)ui2)], ~ dengan menggunakan pertidaksamaan Cauchy-Schwarz pada (xiT( β ))2,
dimana ui = yi xiT. Selanjutnya, dari (A.12) dapat diperoleh bahwa R2 E[ c~1 ( σˆ 2ν σ 2ν )4( σ 2ν * + U2)((1/m)ui2) + 2c2( σˆ 2ν σ 2ν )4ui2], sedangkan c~1 adalah O(1). |E( σˆ 2ν σ 2ν )4( σ 2ν * + U2)((1/m)ui2)| E| σˆ 2ν σ 2ν |5((1/m)ui2) + ( σ 2ν + U2)E( σˆ 2ν σ 2ν )4((1/m)ui2),
( 3.65 )
karena | σ 2ν * σ 2ν | | σˆ 2ν σ 2ν |. Berdasarkan Lemma A.6 dan pertidaksamaan Cauchy-Schwarz, elemen pertama pada bagian sisi kanan persamaan ( 3.65 ) adalah o(m-1), juga E((1/m)ui2)2 adalah O(1) karena ui adalah bersifat bebas dan menyebar N(0, σ 2ν + i2). Serta E( σˆ 2ν σ 2ν )4ui2 = o(m-1) karena E(ui4) = O(1),
56
sehingga R2 adalah o(m-1). R1 juga sama dengan o(m-1) karena E[( σˆ 2ν σ 2ν )hi( σ 2ν y )/ σ 2ν ]2 adalah o(m-1) menggunakan hasil ( 3.62 ).
Pada bagian ini ditunjukkan bahwa pendekatan penduga KTG, memiliki nilai harapan yang bersifat o(m-1) di bawah model Fay-Herriot, yaitu E[g1i( σˆ 2ν )] = g1i( σ 2ν ) g3i( σ 2ν ) + o(m-1), E[g2i( σˆ 2ν )] = g2i( σ 2ν ) + o(m-1), E[g3i( σˆ 2ν )] = g3i( σ 2ν ) + o(m-1).
( 3.66 )
Sebagaimana penjabaran sebelumnya, g1i( σˆ 2ν ) = σˆ 2ν i2( σˆ 2ν + i2)-1. Melalui ekspansi deret Taylor bagi g1i( σˆ 2ν ) di sekitar σ 2ν , dapat diperoleh g1i( σˆ 2ν ) = g1i( σ 2ν ) + ( σˆ 2ν σ 2ν )g1i( σ 2ν ) + +
1 2 ( σˆ ν σ 2ν )2g1i( σ 2ν ) 2
1 2 ( σˆ ν σ 2ν )2[g1i( σ 2ν *) g1i( σ 2ν )], 2
( 3.67 )
dimana σ 2ν * σ 2ν σˆ 2ν σ 2ν . Selanjutnya, E( σˆ 2ν σ 2ν ) = E( σˆ 2ν ~ σ ν2 ) dan E σˆ 2ν ~ σ ν2 = o(m-1), dengan menggunakan P( ~ σ ν2 0) o(m-1) untuk beberapa nilai l (Lemma A.6) diperoleh E( σˆ 2ν σ 2ν )g1i( σ 2ν ) g1i( σ 2ν )E σˆ 2ν σ 2ν = o(m-1), karena g1i( σ 2ν ) = i4( σ 2ν + i2)-2 1. Sedangkan E( σˆ 2ν σ 2ν )2 = E( ~ σ ν2 σ 2ν )2 + o(m1
) = var( ~ σ ν2 ) + o(m-1) berdasarkan Lemma A.6. Oleh karena itu, maka 1 1 E[ ( σˆ 2ν σ 2ν )2g1i( σ 2ν )] = var( ~ σ ν2 )g1i( σ 2ν ) + o(m-1) 2 2
= g3i( σ 2ν ) + o(m-1),
( 3.68 )
dimana g1i( σ 2ν ) = 2i4( σ 2ν + i2)-3. Untuk elemen terakhir yang terdapat pada persamaan ( 3.67 ), yaitu g1i( σ 2ν *) g1i( σ 2ν ) = 2i4( σ 2ν + i2)-3( σ 2ν * + i2)-3( σ 2ν * + i2)3 ( σ 2ν + i2)3 2L-8[ σ 2ν * σ 2ν 3 + 3( σ 2ν + U2)( σ 2ν * σ 2ν )2 + 3( σ 2ν + U2)2 σ 2ν * σ 2ν ] 2L-8[ σˆ 2ν σ 2ν 3 + 3( σ 2ν + U2)( σˆ 2ν σ 2ν )2
57
+ 3( σ 2ν + U2)2 σˆ 2ν σ 2ν ].
(3.69 )
Sehingga, E( σˆ 2ν σ 2ν )2 g1i( σ 2ν *) g1i( σ 2ν ) 2L-8[E σˆ 2ν σ 2ν 5 + 3( σ 2ν + U2)E( σˆ 2ν σ 2ν )4 + 3( σ 2ν + U2)2E σˆ 2ν σ 2ν 3] = o(m-1),
( 3.70 )
dimana E( σˆ 2ν σ 2ν )2s = O(m-s), E σˆ 2ν σ 2ν 3 [E( σˆ 2ν σ 2ν )2E( σˆ 2ν σ 2ν )4]1/2 = o(m-1) dan E σˆ 2ν σ 2ν 5 [E( σˆ 2ν σ 2ν )4E( σˆ 2ν σ 2ν )6]1/2 = o(m-1). Berdasarkan penjabaran ini, maka persamaan ( 3.66 ) terbukti. Persamaan ( 3.66 ) yang terkait dengan elemen g2i( σˆ 2ν ) dapat dibuktikan sebagai berikut:
ˆ 1 X)-1xi xiT(XTV-1X)-1xi] g2i( σˆ 2ν ) g2i( σ 2ν ) = i4( σˆ 2ν + i2)-2[xiT(XT V + i4xiT(XTV-1X)-1xi[( σˆ 2ν + i2)-2 ( σ 2ν + i2)-2].
( 3.71 )
Melalui ekspansi deret Taylor di sekitar σ 2ν pada persamaan ( 3.71 ) dapat diperoleh
ˆ 1 X)-1xi xiT(XTV-1X)-1xi I1 = xiT(XT V = ( σˆ 2ν σ 2ν )[(xiT(XTV-1X)-1xi)/ σ 2ν ] = ( σˆ 2ν σ 2ν )xiT(XTV*-1X)-1(XTV*-2X)(XTV*-1X)-1xi dimana V* adalah nilai V pada saat σ 2ν = σ 2ν *. Berdasarkan hasil matriks sebelumnya, dapat diketahui bahwa I1 L-2 σˆ 2ν σ 2ν xiT(XT V*-1X)-1xi atau EI1 L-2(max qi)E[ σˆ 2ν σ 2ν ( σ 2ν * + U2)] (1/m)L-2(m max qi)[E( σˆ 2ν σ 2ν )2E( σ 2ν * + U2)2]1/2 = o(m-1), dimana m max qi = O(1), E( σˆ 2ν σ 2ν )2 = o(m-1), dan E( σ 2ν * + U2)2 2[E( σˆ 2ν σ 2ν )2 + ( σ 2ν * + U2)2] = O(1). Demikian juga
E( σˆ 2ν + i2)-2 ( σ 2ν + i2)2 L-8[E( σˆ 2ν σ 2ν )2 + 2( σ 2ν + U2)E σˆ 2ν σ 2ν ] = O(m-1/2),
( 3.72 )
58
dengan [E σˆ 2ν σ 2ν ]2 E( σˆ 2ν σ 2ν )2, dan xiT(XT V-1X)-1xi (1/m)( σ 2ν + U2) (m max qi) = o(m-1). Selanjutnya, sesuai dengan persamaan ( 3.71 ) bahwa Eg2i( σˆ 2ν ) g2i( σ 2ν ) = o(m-1), sehingga persamaan ( 3.66 ) terbukti. Terakhir, persamaan ( 3.66 ) yang terkait dengan elemen g3i( σˆ 2ν ) dapat dibuktikan sebagai berikut: g3i( σˆ 2ν ) g3i( σ 2ν ) = (2/m)i4( σ 2ν + i2)-3[( σˆ 2ν σ 2ν )2 + 2( σ 2ν + δi2 )( σˆ 2ν σ 2ν )] + (2/m)i4( σ 4ν + 2 σ 2ν δi2 + i4/m)[( σ 2ν + i2)-3 ( σˆ 2ν + i2)-3] = I2 + I3,
( 3.73 )
dimana δi2 = i2/m. Karena itu, I2 (2/m)L-2[E( σˆ 2ν σ 2ν )2 + 2( σ 2ν + U2)E σˆ 2ν σ 2ν ] = o(m-1), dan I3 (2/m)L-8( σ 4ν + 2 σ 2ν U2 + U4)[E σˆ 2ν σ 2ν 3 + 3( σ 2ν +
U2)E( σˆ 2ν σ 2ν )2 + 3( σ 2ν + U2)E σˆ 2ν σ 2ν ] = o(m-1), serta E σˆ 2ν σ 2ν = o(m-1/2). Sesuai dengan persamaan ( 3.73 ) bahwa Eg3i( σˆ 2ν ) g3i( σ 2ν ) = o(m-1), maka persamaan ( 3.66 ) terbukti.
3.7. Penerapan pada Data Susenas dan Simulasi Studi kasus penerapan dilakukan pada dua sumber data, yaitu data Susenas dan data simulasi. Data simulasi berguna untuk mengetahui berbagai karakteristik pendugaan pada beberapa kondisi yang berbeda. Pada penelitian ini, data simulasi digunakan untuk mengetahui pengaruh waktu (T) dan korelasi diri () pada model SAE berdasarkan model state space dan metode penarikan contoh sebagaimana yang diterapkan pada data Susenas. 3.7.1. Data Susenas Metode pendugaan tidak langsung yang memasukkan pengaruh acak area dan waktu ini dapat diterapkan pada data Susenas BPS yang memang memiliki persoalan ukuran contoh yang terlalu kecil pada tingkat desa. Model yang digunakan adalah seperti yang dijabarkan di atas yaitu:
ˆit = xitT + vi + uit dan uit = ui,t-1 + it,
( 3.74 )
dengan
59
vi iid (0, v2) dan it iid N(0, 2). Model tersebut dapat juga dinyatakan dalam model MCLT, yi = Xi + ZiviT + ei , yaitu: yi = ˆ i ,
Xi = (xit1, …, xitT)T,
Zi = (1T, IT)
( 3.75 )
dan viT = (vi, uiT), ei = (ei1, …, eiT)T,
= (1, …, p)T
dimana 1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Sedangkan
2 Gi = v 0
0T , 2
Ri = i
( 3.76 )
dimana i = adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) |t-s|/(1 - 2). Berdasarkan model di atas ˆ it tergantung pada pengaruh area spesifik vi dan oleh waktu spesifik uit yang berkorelasi antar waktu. Nilai ˆ it adalah penduga langsung dari survei untuk tingkat pengeluaran perkapita pada area kecil (desa) i pada waktu (tahun) t. Pada kasus ini, T = 5, yaitu Susenas Wilayah Kota Bogor 2001 – 2005. Parameter it merupakan fungsi untuk rataan pada area i pada waktu t, dan eit adalah galat penarikan contoh yang menyebar normal dengan nilai harapan 0 dan mempunyai matriks koragam blok-diagonal . Sedangkan xit adalah vektor kovariat spesikasi area yang mungkin berubah menurut waktu t. Vektor kovariat area xit tersebut adalah peubah tetap yang diperoleh dari data Podes BPS 1999/2000, 2001/2002, dan 2003/2004. Sebagaimana asusmsi yang digunakan pada model area kecil, peubah tetap ini diperoleh melalui sensus sehingga tidak memiliki galat penarikan contoh. Lima peubah tetap yang digunakan untuk membentuk vektor kovariat tersebut adalah persentase rumah tangga pertanian (x1), persentase rumah tangga yang terkategori pra sejahtera (x2), persentase rumah tangga yang menggunakan daya listrik minimum 450 kwh perbulan (x3), persentase rumah tangga yang mendapatkan kartu miskin (x4), dan mayoritas sumber air rumah tangga (x5). Pemilihan peubah tersebut didasarkan pada tingkat korelasinya dengan tingkat pengeluaran perkapita perbulan. Tabel 3.1 menyajikan hasil penerapan metode
60
pendugaan langsung dan metode kemungkinan maksimum terbatas (restricted maximum likelihood / REML) pada model area kecil pada data Susenas 2005 (non-time seies). Hasil lengkap disajikan pada Lampiran 4. Tabel 3.1. Perbandingan Antara Metode Pendugaan Langsung dengan Metode Pendugaan Tidak Langsung untuk Rata-rata Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas 2005 Wilayah Kota Bogor
No
Nilai untuk Seluruh Area Kecil
Penduga Langsung
ˆ
KTG
AKTG
Metode SAE - PTLTE
ˆ PTLTE
KTG
AKTG
1 Minimum
178.1
285.7
16.9
181.5
265.4
16.3
2 Kuartil Pertama
304.5
713.5
26.7
309.7
594.0
24.4
3 Rataan
368.2
2597.0
45.4
347.2
1128.7
32.3
4 Median
363.1
1484.3
38.6
358.5
995.9
31.6
5 Kuartil Ketiga
412.6
3377.4
58.1
397.2
1578.0
39.7
6 Maksimum
753.8 14811.8
121.7
496.7
2420.3
49.2
Pada Tabel 3.1 tersebut, ˆ adalah penduga rata-rata pengeluaran perkapita perbulan berdasarkan metode penarikan contoh Susenas, sedangkan ˆ PTLTE merupakan penduga tingkat pengeluaran perkapita perbulan (dalam ribuan) berdasarkan model SAE melalui pendekatan PTLTE. Nilai akar kuadrat tengah galat / AKTG (root mean square of error / RMSE) dihitung dari
KTG . Gambar
3.1 memperlihatkan plot antara AKTG penduga langsung dengan AKTG hasil metode PTLTE. Berdasarkan Tabel 3.1 dan Gambar 3.1, terlihat bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil PTLTE dibandingkan dengan AKTG pada metode pendugaan langsung. Secara rata-rata, AKTG pada
metode
pendugaan langsung sebesar 45.4 turun menjadi 32.3 pada metode pendugaan tidak langsung PTLTE. Ini menunjukkan bahwa pengaruh acak area maupun pengaruh sintetik vektor kovariat berfungsi mengkalibrasi hasil pendugaan langsung yang hanya didasarkan pada data survei semata. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model.
61
Akar Kuadrat Tengah Galat (AKTG)
140 120 100 80 60 40 20 0 Area Kecil (Desa)
Penduga Langsung
PTLTE-pm
Gambar 3.1. Plot Antara AKTG Penduga Langsung dengan AKTG Hasil Metode PTLTE Data Penampang Melintang Sementara itu, perbandingan antara metode PTLTE penampang melintang dan PTLTE deret waktu untuk rata-rata pengeluaran perkapita pada data Susenas wilayah Kota Bogor disajikan pada Tabel 3.2. Tabel 3.2. Perbandingan Antara Metode PTLTE Penampang Melintang dengan Metode PTLTE Deret Waktu untuk Data Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor
No
Nilai untuk Seluruh Area Kecil
Metode SAE – PTLTE Penampang Melintang
ˆ PT PM
KTG
Metode SAE – PTLTE Deret Waktu
AKTG
ˆ PT DW
KTG
AKTG
1 Minimum
181.5
265.4
16.3
179.7
250.1
15.8
2 Kuartil Pertama
309.7
594.0
24.4
302.7
526.8
22.9
3 Rataan
347.2 1128.7
32.3
338.3
906.7
29.2
4 Median
358.5
995.9
31.6
341.3
846.7
29.1
5 Kuartil Ketiga
397.2 1578.0
39.7
383.1
1251.6
35.4
6 Maksimum
496.7 2420.3
49.2
512.9
1728.5
41.6
Pada Tabel 3.2 tersebut, ˆ PT PM merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan PTLTE untuk
62
Susenas tahun 2005 saja, hanya memasukkan pengaruh acak area. Sedangkan
ˆ PT DW merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan PTLTE untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.415. Gambar 3.2 memperlihatkan plot antara AKTG penduga PTLTE penampang melintang dengan AKTG hasil metode PTLTE deret waktu. Hasil lengkap untuk tiap area kecil (desa) disajikan pada Lampiran 5. Berdasarkan Tabel 3.2 dan Gambar 3.2, terlihat bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE penampang melintang. Secara rata-rata, AKTG pada metode PTLTE penampang melintang sebesar 32.3 turun menjadi 29.2 pada metode PTLTE deret waktu. Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun.
Akar Kuadrat Tengah Galat (AKTG)
60 50
40 30 20
10 0 Area Kecil (Desa)
PLTE-pm
PTLTE-dw
Gambar 3.2. Plot Antara AKTG Metode PTLTE Penampang Melintang dengan AKTG Metode PTLTE Deret Waktu
63
3.7.2. Data Simulasi Data simulasi berguna untuk mengetahui berbagai karakteristik pendugaan pada beberapa kondisi yang berbeda. Pada penelitian ini, proses simulasi difokuskan untuk mengetahui pengaruh banyaknya waktu (T) dan korelasi diri (). Sementara model dan metode penarikan contohnya mengikuti model dan metode penarikan contoh Susenas. Selanjutnya dievaluasi tentang relatif biasnya dan nilai AKTG-nya. Pembangkitan data didasarkan pada model di atas, yaitu:
ˆit = xitT + vi + uit dan uit = ui,t-1 + it,
( 3.77 )
dengan vi iid (0, v2) dan it iid N(0, 2). Tabel 3.3. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode PTLTE Penampang Melintang dan Metode PTLTE Deret Waktu untuk Data Simulasi Korelasi Diri ()
T=3 PTLTE-pm
PTLTE-dw
T=5 PTLTE-pm
PTLTE-dw
T=7 PTLTE-pm
PTLTE-dw
0.01
0.0000121 0.0000124 0.0000116 0.0000112 0.0000123 0.0000112
0.25
0.0000132 0.0000115 0.0000127 0.0000107 0.0000114 0.0000110
0.45
0.0000127 0.0000126 0.0000097 0.0000123 0.0000120 0.0000098
0.60
0.0000122 0.0000117 0.0000107 0.0000093 0.0000096 0.0000105
0.85
0.0000119 0.0000089 0.0000133 0.0000122 0.0000109 0.0000111
Nilai v = 43.4 dan = 24.5 yang diperoleh dari hasil PTLTE deret waktu data Susenas di atas. Vektor kovariat xitT = (xit1, ..., xit5) dibangkitkan sebagai peubah tetap (fixed), sedangkan vektor nilainya diambil dari hasil PTLTE deret waktu data Susenas di atas yaitu 0 = 136.440, 1 = 5.806, 2 = -2.225, 3 = 0.383,
4 = -1.355, dan 5 = -8.215. Parameter it = xitT sedangkan penduga langsung bagi it diperoleh dari persamaan di atas yaitu ˆit = xitT + vi + uit = it + vi + uit dan uit = ui,t-1 + it. Simulasi dilakukan untuk banyaknya waktu (T) yang berbeda yaitu T = 3, 5, dan 7, dengan lima nilai korelasi diri yaitu = 0.01, 0.25, 0.45,
64
0.60, dan 0.85. Selanjutnya dibandingkan relatif bias dan nilai AKTG-nya antara metode PTLTE penampang melintang dan metode PTLTE deret waktu. Pada Tabel 3.3, PTLTE-pm adalah metode PTLTE penampang melintang dan PTLTE-dw adalah metode PTLTE deret waktu. Nilai bias relatif mutlak / BRM (absolute relative bias / ARB) dihitung sebagai berikut: 1 R ˆr i R r 1 i
BRMi =
( 3.78 )
dimana R adalah banyaknya simulasi, yaitu R = 10,000. Berdasarkan tabel tersebut terlihat bahwa secara umum bias relatif mutlak tidak berbeda antara PTLTE penampang melintang dengan PTLTE deret waktu. Artinya, bahwa PTLTE penampang melintang maupun PTLTE deret waktu menghasilkan penduga yang tidak berbias. Tabel 3.4. Nilai Rata-rata AKTGR pada Metode PTLTE Penampang Melintang dan Metode PTLTE Deret Waktu untuk Data Simulasi Korelasi Diri ()
T=3
T=5
T=7
PTLTE-pm
PTLTE-dw
PTLTE-pm
PTLTE-dw
PTLTE-pm
PTLTE-dw
0.01
0.1712
0.1293
0.2134
0.1127
0.2560
0.0919
0.25
0.1871
0.0502
0.2203
0.0465
0.2453
0.0453
0.45
0.2893
0.0477
0.3134
0.0378
0.4040
0.0354
0.60
0.2970
0.0478
0.3540
0.0383
0.4578
0.0276
0.85
0.4221
0.0363
0.4312
0.0287
0.6136
0.0149
Tabel 3.4 menunjukkan hasil nilai rata-rata akar kuadrat tengah galat relatif / AKTGR (relative root of mean square of error / RRMSE) pada metode PTLTE penampang melintang dan metode PTLTE deret waktu. Nilai AKTGR dihitung sebagai berikut :
AKTGR i
1 R ˆ ( r i ) 2 R r 1 i
( 3.79 )
65
Berdasarkan Tabel 4.3, nilai AKTGR metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE penampang melintang pada waktu T dan korelasi diri yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut.
3.8. Simpulan Nilai tengah pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Metode PTLT dilakukan dengan cara meminimumkan fungsi KTG, sehingga penduga bagi PTLT memiliki KTG yang paling kecil di antara semua penduga tidak bias linear. Metode kemungkinan maksimum terbatas dapat digunakan untuk menduga komponen ragam atau koragam. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh penduga dua tahap sebagai PTLT empirik atau PTLTE. Penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai AKTG-nya lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Ini menunjukkan bahwa pengaruh acak area maupun pengaruh sintetik vektor kovariat berfungsi mengkalibrasi hasil pendugaan langsung yang hanya didasarkan pada data survei semata. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model. Sementara itu, AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE penampang melintang. Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai AKTGR metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE penampang melintang pada waktu T dan korelasi diri yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri dapat memperbaiki pendugaan
66
parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Hasil tersebut menunjukkan bahwa informasi tambahan berguna untuk meningkatkan akurasi dan presisi suatu penduga. Informasi tambahan tersebut berupa nilai parameter dari area kecil lain yang memiliki karakteristik serupa dengan area kecil yang menjadi perhatian maupun nilai dari peubah yang memiliki hubungan dengan peubah yang sedang diamati. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat penguatan (borrowing strength) dari hubungan antara nilai peubah respon dan informasi tambahan tersebut.
67
BAB IV 4.
Metode Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space
4.1. Pendahuluan Metode prediksi tak-bias linear terbaik (PTLT) yang dibahas pada Bab III banyak diaplikasikan pada SAE. Namun pada metode ini banyak kondisi tertentu yang harus dipenuhi, di antaranya adalah pengasumsian bahwa parameter peubah tetap () dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataannya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode PTLT yang memerlukan berbagai kondisi tertentu. Secara umum pendekatan Bayes bertujuan untuk menentukan sebaran posterior, f(|y,), dari parameter area kecil yang menjadi perhatian, , apabila diketahui data y, menggunakan fungsi kepekatan bersyarat, f(y|,1) dan f(y|,2), dimana = (1T, 2T) dinotasikan sebagai vektor parameter model. Selanjutnya menduga parameter model, , dari fungsi kepekatan marginal f(y|). Terakhir adalah menggunakan penduga fungsi kepekatan posterior f(|y, λˆ ), untuk membuat inferensia tentang , dimana λˆ adalah penduga bagi .
4.2. Metode Bayes Empirik Sebagaimana telah disebutkan di atas bahwa metode Bayes dapat digunakan pada berbagai kondisi data yang lebih luas dibandingkan dengan metode PTLT yang menggunakan pendekatan metode kemungkinan maksimum. Pada persoalan SAE, metode Bayes empirik pada dasarnya adalah sebagai berikut:
68
(a)
Memperoleh fungsi kepekatan posterior (posterior density), f(y,), dari parameter yang menjadi perhatian yakni untuk data y yang diberikan dengan menggunakan fungsi kepekatan bersyarat f(y,1) dan f(2), dimana = (1T,2T)T merupakan vektor parameter model.
(b) Menduga parameter model, , berdasarkan fungsi kepekatan marginal y, yaitu f(y). (c)
Menggunakan fungsi kepekatan posterior dugaan, f(y, ˆ ), untuk membuat inferensi tentang , dimana ˆ merupakan penduga bagi vektor parameter model . Fungsi kepekatan sering diinterpretasikan sebagai fungsi kepekatan prior bagi yang bisa divalidasi dari data.
Pada Bayes empirik parametrik, parameter diasumsikan menyebar f(2). Sebaliknya, Bayes empirik non-parametrik tidak menspesifikasikan bentuk fungsi kepekatan prior bagi (Larid dan Louism, 1987; Zhang dan Davidian, 2001). Misalkan yij (i = 1, 2, …, m; j = 1, 2, ..., ni) adalah contoh acak dari area kecil ke-i pada unit ke-j digunakan untuk menduga parameter pada area kecil ke-i yaitu i. Model yang digunakan adalah yij = i + eij dan i = + i, dimana eij ~ N(0, i2) dan i ~ N(0, 2). Pendekatan Bayes pada model tersebut dapat dinyatakan sebagai berikut: Level 1a : yij|i N(i, i2), dimana i2 diketahui. Level 2a :
i N(, 2).
1 Misalkan bahwa θˆ i ni
ni
y j 1
ij
, maka persamaan di atas dapat dituliskan sebagai
berikut: Level 1b : Level 2b :
θˆ i |i N(i, i2/ni), dimana i2/ni diketahui. i N(, 2).
Fungsi kepekatan peluang bersyarat bagi i ketika diberikan data yi, berdasarkan model 1b dan 2b adalah:
69
k (θ i | θˆ i )
f (θˆ i | θ i ) g (θ i ) f (θˆ | θ ) g (θ )dθ i
i
i
i
f (θˆ i | θ i ) g (θ i )
1 2σ i / ni
(θˆ θ ) 2 (θ α) 2 1 exp i 2 i i 2 2τ 2 τ 2(σ i / ni )
( τ 2 σ i2 / ni )θ i2 2(θˆ i τ 2 ασ i2 / ni )θ i exp 2(σ i2 / ni ) τ 2
2 yi τ 2 ασ i2 / ni 2 θ 2 θ i i τ σ i2 / ni exp (σ i2 / ni ) τ 2 2 2 2 τ σ / n i i
2 2 θˆ i τ 2 ασ i2 / ni θˆ i τ 2 ασ i2 / ni θi 2 τ σ2 / n τ2 σ2 / n i i i i exp 2 2 (σ i / ni ) τ 2 2 2 τ σ i / ni 2 θˆ τ 2 ασ 2 / n 2 ˆ τ 2 ασ 2 / n θ i i i i θi i 2 i 2 2 2 τ σ / n τ σ i / ni i i exp exp 2 2 2 2 ( σ / n ) τ ( σ / n ) τ i i i i 2 2 2 2 τ 2 σ 2 / n i i τ σ i / ni 2 θˆ i τ 2 ασ i2 / ni θi 2 τ σ2 / n i i exp . 2 2 (σ i / ni ) τ 2 2 2 τ σ / n i i
( 4.1 )
Berdasarkan persamaan ( 4.1 ) di atas, fungsi kepekatan peluang posterior bagi i yaitu k(i θˆ i ) merupakan sebaran normal dengan nilai tengah θˆ i τ 2 ασ i2 / ni τ2 τ2 σ2 / n τ 2 σ i2 / ni i i
ˆ σ i2 / ni θ i 2 τ σ2 / n i i
γ i θˆ i (1 γ i )α dimana γ i
α
( 4.2 )
τ2 τ 2 σ i2 / ni
70
Oleh karena itu, penduga Bayes bagi i yaitu θˆ iB , apabila diketahui θˆ i , , dan 2 adalah
θˆ iB = E(i| θˆ i , , 2) = i θˆ i + (1 - i) (σ 2 / n ) τ 2 Var(i| θˆ i , , 2) = 2 i 2i γ i (σ i2 / ni ) .
( 4.3 )
τ σ i / ni
Pendekatan di atas dapat pula diterapkan pada model Fay-Herriot yang menjadi salah satu bentuk dasar model area kecil. Model tersebut adalah θˆ i = i + ei dan i = xiT + i atau θˆ i = xiT + i + ei dimana xi adalah vektor kovariat pada area yang berukuran p 1, i ~ N(0, 2 ) merupakan pengaruh acak area dan bebas dengan ei ~ N(0, i2), i2 adalah ragam penarikan contoh, dan θˆ i adalah penduga langsung (direct estimator) berdasarkan metode penarikan contohnya. Pendekatan Bayes untuk model tersebut dapat dinyatakan sebagai berikut: Level 1 (sampling model) : Level 2 (linking model)
:
θˆ i |i N(i, i2), dimana i2 diketahui, i N(xiT, 2 ).
Model ini sama dengan model di atas, sehingga berdasarkan pada persamaan ( 4.1 ) maka 2 θˆ i σ 2ν x iT βδ i2 θi σ2 δ2 ν i . k (θ i | θˆ i ) exp 2 2 δi σ ν 2 2 2 σ ν δi
( 4.4 )
Fungsi kepekatan peluang posterior bagi i yaitu k(i θˆ i ) merupakan sebaran normal dengan nilai tengah θˆ i σ 2ν x iT βδ i2 σ 2ν 2 2 σ 2ν δ i2 σ ν δi
ˆ δ i2 θ i 2 σ δ2 i ν
T x i β
γ i θˆ i (1 γ i )x Ti β dimana γ i
σ 2ν σ 2ν δ i2
Oleh karena itu, penduga Bayes bagi i yaitu θˆ iB , apabila diketahui θˆ i , , dan 2 adalah
71
θˆ iB = E(i| θˆ i , , 2 ) = γ i θˆ i (1 γ i )xiT β δ 2σ 2 Var(i| θˆ i , , 2 ) = 2 i ν 2 γ i δ i2 . σ ν δi
( 4.5 )
Penduga Bayes θˆ iB = θˆ iB (, 2 ) tergantung pada parameter model dan 2 yang dapat diduga dari sebaran marginal θˆ i ~ N(xiT, 2 + i2) menggunakan metode kemungkinan maksimum terkendala / KMT (restricted maximum likelihood
/
REML).
Apabila
penduga
parameter
model
dinotasikan
sebagai βˆ dan ˆ 2 maka akan diperoleh penduga Bayes empirik bagi θˆ i dari
θˆ iB dengan mensubstitusikan βˆ pada dan ˆ 2 pada 2 , yaitu θˆ iEB = θˆ iEB ( βˆ , ˆ 2 ) = γˆ i θˆ i (1 γˆ i )xiT βˆ .
( 4.6 )
Penduga Bayes empirik, θˆ iEB , identik dengan penduga PTLTE yang telah dibahas pada Bab III sebelumnya, apabila menggunakan asumsi kenormalan. Penduga Bayes empirik ini juga merupakan nilai harapan bagi fungsi kepekatan posterior dugaan, f(i| θˆ i , βˆ , ˆ 2 ). Metode Bayes empirik ini dapat diterapkan pada model berbasis area ( 4.7 )
sebagai berikut : i = ziT + bivi,
ˆ i i + ei = ziT + bivi + ei, i = 1, …, m vi iid (0, v2),
ei iid (0, i) ,
vi dan ei bebas.
Persamaan ini menggambarkan hubungan antara penduga langsung, kovariat, dan penduga tidak langsung. Persamaan ini dapat pula diekspresikan sebagai berikut :
ˆ i |i iid N(i, i) i iid N(ziT , bi2v2). Pada persamaan ini, i iid N(ziT , bi2v2), disebut fungsi kepekatan prior. Penduga Bayes berdasarkan fungsi kepakatan posterior i| ˆ i adalah
θˆ iB E(i| ˆ i , , v2) = i ˆ i + (1 - i)ziT i = bi2v2/( bi2v2 + i).
( 4.8 )
72
Penduga Bayes θˆ iB tergantung pada parameter model dan v2 yang diduga dari sebaran marginal ˆ i iid N(ziT , bi2v2 + i) menggunakan KMT. Karena dan v2 diduga dari data, maka diperoleh penduga Bayes empirik sebagai berikut :
θˆ iEB E(i| ˆ i , βˆ , ˆ v2 ) = γˆ i ˆ i + (1 - γˆ i )ziT βˆ γˆ i = bi2 ˆ v2 /( bi2 ˆ v2 + i).
( 4.9 )
4.3. Metode Bayes Berhirarki Pada pendekatan Bayes berhirarki, sebaran prior f() untuk parameter model dispesifikasikan dan sebaran posterior f(y,) dari parameter area kecil yang menjadi perhatian dapat diperoleh. Model dua tahap (two-stage), f(y,1) dan f(2), dikombinasikan dengan sebaran prior = (1T,2T)T untuk memperoleh sebaran posterior f(y,). Fungsi parameter yang menjadi perhatian, misalnya = h(), diduga berdasarkan nilai harapan sebaran posteriornya yaitu ˆ HB = E[h()y], dan ragam posterior V[h()y] digunakan untuk mengukur presisinya. Berdasarkan teorema Bayes (Kass dan Steffey, 1989), bahwa f (θ, | y )
f (y , θ | ) f () f1 (y )
( 4.10 )
dimana f1(y) adalah sebaran marginal bagi y, yaitu f1 (y ) f (y , θ | ) f ()dθd .
Sebaran posterior f( | y) dapat diperoleh dari persamaan ( 4.10 ) di atas yang dapat dinyatakan sebagai berikut: f (θ | y ) f (θ, | y )d f (θ | y , ) f ( | y )d .
( 4.11 )
Pada persamaan ( 4.11 ) dapat diketahui bahwa sebaran posterior f (θ | y ) merupakan campuran dua sebaran bersyarat f (θ | y , ) dan f ( | y ) . Sedangkan pada metode Bayes empirik hanya menggunakan f (θ | y , ) sebagai sebaran posteriornya. Karena itu, Bayes berhirarki sering juga disebut sebagai Bayes lengkap (fully Bayes). Berdasarkan persamaan di atas, maka evaluasi terhadap posterior f (θ | y ) serta E (h(θ) | y ) membutuhkan pengintegralan yang multi dimensi. Pada problem
73
yang lebih kompleks, misalnya memasukkan faktor waktu pada model MCLT, proses pengintegralannya akan berdimensi tinggi yang tidak akan diperoleh bentuk tertutupnya (closed form). Oleh karena itu dibutuhkan metode integrasi numerik. Misalkan θˆ i (i = 1, 2, …, m) adalah penduga langsung bagi i, yaitu parameter yang menjadi perhatian pada area kecil ke-i. Selanjutnya digunakan model θˆ i = i + ei dan i = + i sehingga θˆ i = + i + ei dimana ei ~ N(0, 1) dan i ~ N(0, 2). Pada pendekatan Bayes sebelumnya dan 2 diasumsikan konstan, tetapi pada pendekatan Bayes berhirarki diasumsikan memiliki sebaran tertentu. Pendekatan Bayes berhirarki pada model tersebut dapat dinyatakan sebagai berikut: Level 1 :
θˆ i |i N(i, 1),
Level 2 :
i| , 2 N(, 2)
Level 3 :
U(R) dan 2 g(2), R, 2 > 0, g adalah fungsi sebaran.
Pada model tersebut diperlukan untuk memperoleh sebaran bersyarat dari [i| θˆ i , , 2], [| θˆ i ,2], dan [2| θˆ i ]. Sebaran bersama bagi θˆ i , i, , dan 2 dapat dinyatakan sebagai m
1 ˆ
(θ i θ i ) f( θˆ i , i, , 2) e 2
2
i 1
e
m
i 1
m 1 1 1 α {(1 2 ) θ i2 2 ( θˆ i 2 ) θ i } 2 2 i 1 τ τ
e
1 τ
m
e
2
1 ( θ i α) 2 2 τ2
θˆ i2 τ 2 α 2 m
i 1
(τ2 )
g (τ 2 )
m 2
g (τ 2 ) .
( 4.12 )
Selanjutnya dapat ditentukan sebaran bersyarat f(, 2| θˆ i ), yaitu m
m
( θˆ i α ) 2 1 2 2 (1 τ 2 ) i 1 ˆ f(, | θ i ) e g (τ2 ) 2 1 τ 1
2
m
(θˆ i α) 2 = m 2m θˆ + i 1
= m( θˆ )2 +
θˆ
m
i 1
m
θˆ i 1
= m( θˆ )2 +
m
2 i
2 i
m θˆ 2
θˆ θˆ i i 1
2
( 4.13 )
74
sehingga f(, 2| θˆ i ) (1 τ 2 )
m 2
e
1 1 m ( θˆ ) 2 2 (1 τ 2 )
e
m
1 ( θˆ i θˆ ) 2 2 (1 τ 2 ) i 1
g (τ 2 )
m
dan apabila didefinisikan s 2 (θˆ i θˆ ) 2 , maka i 1
f( | θˆ i ) (1 τ 2 )
2
m 1 2
e
S2 2 (1 τ 2 )
g (τ 2 ) .
( 4.14 )
Berdasarkan fungsi tersebut, maka sebaran posteriornya dapat diperoleh jika dan hanya jika
(1 τ
2
)
m 1 2
e
S2 2 (1 τ 2 )
g ( τ 2 )dτ 2 .
( 4.15 )
0
Misalkan K =
1 1 K 2 dan h(K) = g K , maka untuk pertidaksamaan 2 1 τ K
( 4.15 ) dapat dinyatakan dalam notasi K sebagai berikut:
(1 τ
2
)
m 1 2
e
S2 2 (1 τ 2 )
0
1
g ( τ )dτ K 2
2
m 1 2
h( K )dK
( 4.16 )
0
dan kepekatan sebaran posteriornya dapat dinyatakan sebagai penjabaran dari fungsi f(K| θˆ i ), yaitu f(K| θˆ i ) = c.K
m 1 S2 K 2 2
e
h( K )
( 4.17 )
dimana 1
c K 1
m 1 S2 K 2 2
e
h( K )dK .
0
Berdasarkan hasil tersebut, nilai tengah posterior bagi parameter yang menjadi perhatian pada area kecil ke-i, yaitu i, dapat dituliskan sebagai berikut: E(i| θˆ i ) = E{E(i| θˆ i , )| θˆ i } = E{[ θˆ + ( θˆ i θˆ )]| θˆ i } = θˆ + E(| θˆ i )( θˆ i θˆ ).
( 4.18 )
Sedangkan ragam posterior bagi parameter yang menjadi perhatian pada area kecil ke-i, yaitu i, dapat dituliskan sebagai berikut:
75
Var(i| θˆ i ) = E{ Var(i| θˆ i , )| θˆ i } + Var{E(i| θˆ i , )| θˆ i }. Karena Var(i| θˆ i , ) = + (1/m)(1 ), maka E{ Var(i| θˆ i , )| θˆ i } = E(| θˆ i ) + (1/m)[1 E(| θˆ i )] Var{E(i| θˆ i , )| θˆ i } = Var{[ θˆ + ( θˆ i θˆ )]| θˆ i } = ( θˆ i θˆ )2 Var(| θˆ i ) sehingga Var(i| θˆ i ) = E(| θˆ i ) + (1/m)[1 E(| θˆ i )] + ( θˆ i θˆ )2 Var(| θˆ i ) ( 4.19 ) dimana = 1 K, E(K| θˆ i ) =
1
Kf ( K | θˆ )dK yaitu nilai tengah posterior bagi K, i
0
dan Var(| θˆ i ) = Var(K| θˆ i ) = E(K2| θˆ i ) [E(K| θˆ i )]2, yaitu ragam posterior bagi atau K. Misalkan pendekatan Bayes berhirarki seperti di atas diterapkan pada model Fay-Herriot yang menjadi salah satu bentuk dasar model area kecil. Seperti telah dituliskan sebelumnya bahwa model Fay-Herriot adalah θˆ i = i + ei dan i = xiT + i atau θˆ i = xiT + i + ei dimana xi adalah vektor kovariat pada area yang berukuran p 1, i ~ N(0, 2 ) merupakan pengaruh acak area dan bebas dengan ei ~ N(0, i2), i2 adalah ragam penarikan contoh, dan θˆ i adalah penduga langsung berdasarkan metode penarikan contohnya. Pendekatan Bayes berhirarki untuk model tersebut dapat dinyatakan sebagai berikut: Level 1 :
θˆ i |i N(i, i2), dimana i2 diketahui,
Level 2 :
i | , 2 N(xiT, 2 ),
Level 3 :
f(, 2 ) 1.
Pada pendekatan Bayes berhirarki ini ada dua kasus yang mungkin terjadi, yaitu 2 diketahui atau tidak diketahui. 4.3.1. Kasus 2 Diketahui Pada kasus ini, hasil pendugaan parameter mirip dengan Bayes empirik, tetapi berbeda pada ragam posteriornya. Penduga Bayes berhirarki bagi i adalah
76
~ BB 2 θi ( ) = E(i| θˆ i , 2 ) = γ i θˆ i (1 γ i )xiT β , dimana γ i
σ 2ν σ 2ν δ i2
sedangkan ragam posteriornya dapat dinyatakan sebagai ragam bersyarat, [i| θˆ i , 2 ], yaitu sebagai berikut: Var(i| θˆ i , 2 ) = g1i( 2 ) + g2i( 2 )
( 4.20 )
dimana g1i( 2 ) = ii2, dan 1
m x xT g2i( ) = (1 γ i ) x 2 i i 2 x i . i 1 (δ i σ ν ) 2
2
T i
~ Berdasarkan hasil tersebut, penduga Bayes berhirarki, θiBB ( 2 ), sama dengan hasil pendugaan metode PTLT, sedangkan ragam posteriornya, Var(i| θˆ i , 2 ), sama dengan KTG pada metode PTLT. Dengan demikian, metode Bayes berhirarki dapat dianggap sebagai bentuk kalibrasi terhadap metode klasik PTLT yang bersandar pada metode kemungkinan maksimum. 4.3.2. Kasus 2 Tidak Diketahui Secara praktis 2 tidak diketahui, sehingga perlu diasumsikan dengan suatu sebaran prior tertentu, f( 2 ). Berdasarkan model Bayes berhirarki di atas, penduga Bayes berhirarki bagi i adalah
~ θˆ iBB = E(i| θˆ i ) = E{E(i| θˆ i , 2 )| θˆ i } = Eσ 2 [ θiBB ( 2 )] ν
= E(i| θˆ i , 2 ) f( 2 | θˆ i )d 2
( 4.21 )
dimana Eσ 2 dinotasikan sebagai nilai harapan berdasarkan sebaran posterior 2 , ν
f( 2 | θˆ i ). Ragam posterior bagi i adalah Var(i| θˆ i ) = E{ Var(i| θˆ i , 2 )| θˆ i } + Var{E(i| θˆ i , 2 )| θˆ i }
~ = E{(g1i( 2 ) + g2i( 2 ))| θˆ i } + Var{ θiBB ( 2 )| θˆ i }.
77
Penyelesaian terhadap berbagai persamaan di atas dalam bentuk integral berdimensi tinggi membutuhkan metode numerik yang berbasis pada algoritma rekursif.
4.4. Bayes Berhirarki untuk Model State-Space Sebagaimana dijabarkan pada Bab III, bahwa model state-space dapat dinyatakan sebagai bentuk model linear campuran terampat / MCLT sebagai model dasar area-kecil dengan pengaruh acak area dan waktu sebagai berikut : ( 4.22 )
y = X + Zv + e dimana y = ˆit ,
X = (zi1, …, ziT)T,
vT = (vi, uiT), e = (ei1, …, eiT)T,
Z = (1T, IT), dan
= (1, …, p)T
1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Pada persamaan di atas, y adalah vektor dari pengamatan contoh, X dan Z adalah matriks yang diketahui, dan v dan e adalah saling bebas dengan nilai tengah 0 dan matriks koragam G dan R, tergantung pada beberapa parameter yang disebut sebagai komponen ragam. Matriks koragam G dan R dapat dinyatakan sebagai berikut :
2 G= v 0
0T , 2
R=
dimana i = adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) adalah |t-s|/(1 - 2). Model ini dapat dituliskan dalam formulasi Bayes sebagai berikut: Level 1a : Y | v N(X + Zv, R) Level 2a :
v N(0, G).
Misalkan = X + Zv maka Var() = Var(X + Zv) = Var(Zv) = ZGZT. Berdasarkan ini, model di atas dapat dituliskan menjadi Level 1b : Y | N(, R) Level 2b :
N(X, ZGZT).
78
Formulasi Bayes untuk model ini mirip dengan model pada ( 4.1 ), sehingga fungsi kepekatan peluang posteriornya ( | Y, , ZGZT) merupakan sebaran Normal dengan nilai tengah ZGZT(R + ZGZT)-1Y + R(R + ZGZT)-1X.
( 4.23 )
Penduga Bayes, θˆ B , apabila diketahui Y, , dan dapat dinyatakan sebagai berikut: θˆ B = E( | Y, , ) = ZGZT(R + ZGZT)-1Y + R(R + ZGZT)-1X Var( θˆ B ) = Var( | Y, , ) = ZGZT(R + ZGZT)-1R.
( 4.24 )
Penduga Bayes di atas tergantung pada parameter dan yang secara praktis tidak diketahui sehingga harus dilakukan pendugaan dari data. Pendugaan tersebut dapat dilakukan berdasarkan sebaran marginal Y, yaitu Y N(X, R + ZGZT).
( 4.25 )
Proses pendugaan parameter dan pada sebaran marginal Y ini dapat menggunakan KMT. Misalkan penduganya adalah βˆ dan ˆ , maka penduga Bayes empirik bagi dapat diperoleh dengan mensubstitusikan βˆ pada dan ˆ pada , yaitu
ˆ ZT)-1Y + R ˆ ZT)-1X βˆ ˆ + ZG ˆ (R ˆ + ZG θˆ EB = ZGZT( R ˆ ZT( R ˆ ZT)-1 R ˆ + ZG ˆ. Var( θˆ EB ) = Z G
( 4.26 )
Penduga model parameter, ˆ , digunakan untuk memperoleh penduga bagi dua
ˆ. ˆ dan G buah komponen ragam, yaitu R Pada metode Bayes berhirarki, untuk = X + Zv maka Var() = Var(X + Zv) = Var(Zv) = ZGZT, maka model di atas dapat dituliskan menjadi Level 1c : Y | N(, R) Level 2c :
N(X, ZGZT)
Level 3c :
f(R) 1, f(G) 1, dan f() 1.
Artinya, pada metode Bayes empirik, R, G, dan dianggap sebagai konstanta, sedangkan pada Bayes berhirarki R, G, dan dianggap memiliki fungsi kepekatan tertentu.
79
Metode Bayes berhirarki atau dapat digunakan untuk mendapatkan ukuran ketidakpastian pada statistik area kecil. Misalkan yiT adalah penduga langsung dari survei untuk area kecil ke-i pada periode T saat ini, sedangkan iT adalah nilai yang sesungguhnya untuk area kecil tersebut pada periode T. Statistik yiT diasumsikan sebagai penduga tidak bias bagi iT yaitu : yiT = iT + eiT, dimana eiT adalah galat penarikan contoh dengan E(eiT|iT) = 0. Vektor dari peubah konkomitan tetap xiT = (xiT1, ..., xiTp)T yang berhubungan dengan iT adalah tersedia untuk semua area i pada waktu T. Penduga regresi sintetik untuk iT didasarkan pada data cross-sectional {(yiT, xiT), i = 1, 2, …, m) untuk waktu T, diperoleh dengan mengasumsikan model deterministik untuk iT : iT = (xiT)T T
( 4.27 )
dimana T = (T1, ..., Tp) adalah vektor koefisien regresi yang bisa dinyatakan T
sebagai berikut
~ ~ θiT (reg ) (xiT )T βT
( 4.28 )
~ dimana βT merupakan penduga bagi T yang diperoleh dari pengkombinasian
model di atas: yiT = (xiT)T T + eiT, i = 1, …, m
( 4.29 )
untuk satu waktu T saat ini. Penduga sintetik di atas bisa menghasilkan bias rancangan substansial (substantial design biases), karena pada model tersebut menggunakan pembobot nol pada penduga langsung yiT. Kelemahan ini dapat diatasi melalui pendekatan Bayes empirik yang menghasilkan bias yang relatif kecil (Rao dan Yu, 1994). Model di atas yakni iT = (xiT)T T dapat pula ditambahkan faktor ketidakpastian sebagai berikut: iT = (xiT)T T + iT,
( 4.30 )
dimana komponen galat iT merupakan peubah acak bebas dengan nilai tengah 0 dan ragam yang tidak diketahui 2T. Untuk galat penarikan contoh, diasumsikan bahwa eiT adalah peubah acak yang saling bebas dengan nilai tengah 0 dan ragam
80
2iT, dimana 2iT diketahui. Pengkombinasian model di atas dapat dinyatakan menjadi yiT = (xiT)T T + iT + eiT .
( 4.31 )
Berdasarkan model ini, penduga Bayes bagi iT dapat dinyatakan sebagai jumlah terboboti antara penduga langsung yiT dan penduga regresi sintetik
θˆ iT (reg ) (xiT )T βˆ T , yaitu θˆ iT ( σˆ 2υT , yT) = iT yiT + (1– iT) θˆ iT (reg ) .
( 4.32 )
Pada persamaan ini yT = (y1T, …, ymT), iT = σˆ 2υT /( σˆ 2υT + 2iT), βˆ T merupakan penduga kuadrat terkecil terboboti berdasarkan model ( 4.31 ), dan σˆ 2υT merupakan penduga bagi σ 2υT . Prasad dan Rao (1990) melalui metode momen dapat memperoleh penduga bagi σ 2υT . Perluasan dari model Fay-Herriot melalui pendekatan deret waktu dari penduga langsung area akecil {yit} yang dihubungkan dengan data suplemen {xit}, dimana i =1, 2, …, m dan t = 1, 2, …, T. Asumsi yang digunakan adalah yit = it + eit dimana eit merupakan galat penarikan contoh dengan E(eit|it) = 0. Model untuk SAE dapat dituliskan sebagai berikut : it = (xit)T + i + uit, uit = ui,t-1 + it, || < 1,
( 4.33 )
dimana xit = (xit1, …, xitp)T adalah vektor peubah konkomitan tetap untuk area ke-i pada waktu t, i N(0, 2), it N(0, 2), dan {i}, {it} adalah bebas. Pada model ini, i merupakan pengaruh acak area kecil, sedangkan uit mengikuti proses autoregresi. Model di atas dapat dijabarkan menjadi model distributed-lag, yaitu : it = i,t-1 + (xit – xi,t-1)T + (1 – )i + it .
( 4.34 )
Pada model ini, it dihubungkan dengan nilai periode sebelumnya i,t-1, nilai peubah penyerta xit dihubungkan dengan nilai periode sebelumnya xi,t-1, ditambah dengan pengaruh acak area i serta galat it. Choudhry dan Rao (1989) menggunakan galat komposit wit = eit + uit sebagai autoregresi ordo satu dan mengasumsikan it = (xit)T + i. Modelnya dapat ditulis menjadi
81
yit = (xit)T + i + wit, w =~ ρ w + ~ε . it
i,t-1
it
( 4.35 )
Mereka memperoleh penduga dua tahap untuk nilai tengah area kecil it melalui model tersebut dan mengevaluasi efisiensi relatifnya dengan penduga sintetik dan penduga langsung yit. Model yang dikembangkan oleh Choudhry dan Rao di atas tidak memasukkan galat penarikan contoh, padahal secara realistik keberadaan galat penarikan contoh tidak bisa diabaikan. Pada penelitian ini, galat penarikan contoh eit dimasukkan dalam model, yaitu: yit = (xit)T + i + uit + eit uit = ui,t-1 + it, || < 1,
( 4.36 )
dimana galat penarikan contoh eit diasumsikan menyebar normal dengan nilai tengah nol dan matriks koragam blok-diagonal dengan blok i (matriks berukuran T x T) diketahui. Maktriks koragam i untuk setiap area ke-i dan setiap waktu t dapat diperoleh melalui metode generalized variance function (GVF). Model di atas dapat dinyatakan dalam bentuk matriks sebagai berikut : Y = X + Zv + u + e
( 4.37 )
dengan X = (X1T, …, XmT)T,
XiT = (xi1, ...., xiT),
Z = Im 1T, v = (1, …, m)T,
u = (u1T, …, umT)T
e = (e1T, …, emT)T dimana uiT = (ui1, …, uiT), eiT = (ei1, ..., eiT), 1T adalah vektor satuan, dan Im adalah matriks identitas berordo m, dan adalah perkalian Kronecker. E(v) = 0, Cov(v) = 2Im, E(u) = 0, Cov(u) = 2Im = 2R, E(e) = 0, Cov(e) = = blok-diagonal(1, ..., m),
( 4.38 )
dan v, u, dan e adalah bebas, dimana adalah matriks T x T dengan elemen |i-j|/(1 – ). Berdasarkan persamaan tersebut maka Cov(y) = V = + 2R + 2ZZT = blok-diagonal(i + 2 + 2JT) = blok-diagonal(Vi)
( 4.39 )
82
dengan JT = 1T(1T)T. Nilai tengah area kecil pada satu waktu T, iT = (xiT)T + i + uiT, merupakan kasus khusus dari kombinasi linear = lT + l1Tv + l2Tu yang dapat diduga berdasarkan sebaran posteriornya pada pendekatan Bayes berhirarki dimana l = xiT, l1 adalah vektor m dengan nilai 1 pada posisi ke-i dan 0 pada selainnya, serta l2 adalah vektor mT dengan nilai 1 pada posisi ke-iT dan 0 pada selainnya. Misalnya diasumsikan bahwa 2, 2, dan adalah diketahui, maka penduga Bayes bagi adalah ~ ~τ = lT ~ β + (2l1TZT + 2l2TR)V-1(y – X β )
( 4.40 )
~ dimana β = (XTV-1X)-1XTV-1y adalah penduga kuadrat terkecil terampat
(generalized least-squares) bagi . Apabila menggunakan struktur l1, l2, Z, R, dan V, maka dapat diperoleh bahwa ~ θiT = a(2, 2, , y) ~ ~ = (xiT)T β + (2lT + 2T)T(i + 2 + 2JT)-1(yi – Xi β ),
( 4.41 )
dimana T adalah baris ke-T dari matriks . Penduganya mungkin juga ditulis ~ sebagai jumlah terboboti dari penduga langsung yiT, penduga sintetik (xiT)T β , dan ~ sisaan yij – (xij)T β , j = 1, ..., T–1 :
~ ~ θiT = wiT yiT + (1 – wiT) (xiT)T β +
T 1
w (y j 1
ij
ij
~ xijT β ),
( 4.42 )
dimana (wi1, …, wiT) = (2lT + 2T)TVi-1 . Secara praktis, parameter 2, 2, dan biasanya tidak diketahui. Misalkan diasumsikan bahwa diketahui dan mengganti 2 dan 2 dengan penduganya yakni σˆ 2 (ρ) , σˆ 2υ (ρ) untuk memperoleh penduga θˆ iT2 (ρ) . Penduga 2 dapat diperoleh dengan cara transformasi untuk mengeliminasi pengaruh acak i. Pertama mentransformasi yi ke zi = Pyi sehingga matriks koragam dari Pui adalah 2IT. Matriks P berukuran T x T, dimana elemen pada diagonal utamanya adalah (1 ρ 2 ) ; elemen pada diagonal lainnya adalah 1; elemen pada posisi ke (t + 1, t)
adalah (–) untuk t = 1, ..., T–1; dan elemen lainnya adalah 0.
83
(1 ρ 2 ) ρ 0 P 0 . 1
0
0
0
...
(1 ρ 2 )
0
0
...
ρ
(1 ρ 2 )
1
...
0
ρ
(1 ρ 2 )
...
.
.
.
...
0
0
0
...
0 0 0 . (1 ρ 2 ) 1
Model hasil transformasi adalah zi = PXi + fi + P(ui + ei), dimana f = (f1, …, fT)T dengan f1 =
i = 1, …, m,
( 4.43 )
(1 ρ 2 ) dan ft = 1 – untuk 2 t T.
Selanjutnya dilakukan pentransformasian terhadap zi menjadi zi(1) = (IT – D)zi dimana D = (ffT)/c dengan c = fTf = (1 – ){T – (T – 2)}. Hal ini menghasilkan model tereduksi sebagai berikut: zi(1) = Hi(1) + ei*,
i = 1, …, m,
( 4.44 )
dimana Hi(1) = (IT – D)PXi dan ei* = (IT – D)P(ui + ei), dan Cov(ei*) = (IT – D)( 2IT + PiPT)(IT – D)T. Nilai 2 dapat diduga melalui model tereduksi ( 4.44 ) menggunakan jumlah kuadrat galatnya. Misalkan z(1) = [(z1(1))T, …, (zm(1))T]T, H(1) = [(H1(1))T, …, (Hm(1))T], dan eˆ Teˆ adalah jumlah kuadrat galat yang diperoleh dengan meregresikan antara z(1) dengan H(1). Penduga tidak bias bagi 2 adalah ~ σ 2 (ρ) = ( eˆ Teˆ – tr[{blok-diagonali(IT – D) – H(1)( H(1)T H(1))–H(1)T) x blok-diagonali(PiPT)]){m(T – 1) – r(H(1))}–1, dimana A– adalah kebalikan umum matriks A. Pada persamaan di atas, eˆ Teˆ = (ei*)T(ImT – H(1)( H(1)T H(1))–H(1)T)(ei*).
84
Nilai 2 dapat diduga dengan cara mentransformasi persamaan ( 4.43 ),
1 2 T
*
1 2 T
yaitu mengubah zi menjadi c f zi sehingga ui = c f Pui mempunyai nilai tengah 0 dan ragam 2. Model transformasi tersebut adalah
1
1
1
1
c 2 fTzi = c 2 fTPXi + c 2 i + ui* + c 2 fTPei
( 4.45 )
dengan ragam galat c2 + 2 + c-1fT PiPTf. Misalkan uˆ Tuˆ adalah jumlah
1
1
kuadrat galat yang diperoleh dengan meregresikan c 2 fTzi terhadap c 2 fTPXi. Penduga tidak bias bagi 2 adalah ~ σ υ2 (ρ) = c-1{m – r(F)}-1( uˆ Tuˆ – tr[(Im – F(FTF)–FT}diagi(c-1fT PiPTf)})
– c-1 ~ σ 2 (ρ) ,
( 4.46 )
dimana F = (X1TPTf, ..., XmTPTf)T. Ketidakbiasan ~ σ υ2 (ρ) terkait dengan nilai harapan uˆ Tuˆ yaitu E( uˆ Tuˆ ) = (c2 + 2){m – r(F)} + tr[{Im – F(FTF)–FT}diagi(c-1fT PiPTf)].
4.5. Penduga Bagi KTG Berdasarkan asumsi kenormalan galat i, uit, dan eit, maka ~ ~ KTG[ θˆ iT (ρ) ] = KTG( θiT ) + E{ θiT θˆ iT (ρ) }2,
( 4.47 )
~ ~ ~ dimana KTG( θiT ) = E{ θiT θ iT }2 . Nilai KTG( θiT ) ini dapat dinyatakan melalui persamaan berikut:
~ KTG( θiT ) = g1iT(2, 2, ) + g2iT(2, 2, ),
( 4.48 )
dimana g1iT(2, 2, ) = 2 +
σ2 (2lT + 2T)TVi-1(2lT + 2T) 2 1 ρ
dan g2iT(2, 2, ) = {xiT XiTVi-1(2lT + 2T)}T(XTVi-1X)-1 x {xiT XiTVi-1(2lT + 2T)}.
~ Nilai E{ θiT θˆ iT (ρ) }2 pada persamaan ( 4.47 ) dapat ditentukan melalui pendekatan Taylor, yaitu
85
2 ~ ~ iT ~ 2 ~ iT ~ 2 2 2 2 ˆ E{ θiT θ iT (ρ) } E 2 { () } 2 { () } .
Prasad dan Rao (1990) menggunakan pendekatan ini dalam bentuk lain, yaitu
~ E{ θiT θˆ iT (ρ) }2 tr(TV) = g3iT(2, 2, ),
( 4.49 )
diamana adalah matriks koragam 2 x 2 dari penduga tidak bias ~ σ 2 (ρ) dan ~ σ υ2 (ρ) , dan = (b/2, b/2) dengan bT = (2lT + 2T)TVi-1. Penghitungan
turunan b/2 dan b/2 dapat diperoleh dengan menyederhanakan TV = A, dimana A adalah matriks simetrik 2 x 2 dengan elemen diagonal utama a11 = {T Vi-1(2lT + 2T)}TVi-1{T Vi-1(2lT + 2T)} a22 = {lT JTVi-1(2lT + 2T)}TVi-1{lT JTVi-1(2lT + 2T)} dan elemen yang bukan diagonal utama adalah a12 = a21 = {T Vi-1(2lT + 2T)}TVi-1{lT JTVi-1(2lT + 2T)}. Berdasarkan hasil di atas, maka pendekatan bagi KTG[ θˆ iT (ρ) ] dapat dinyatakan sebagai berikut: KTG[ θˆ iT (ρ) ] = g1iT(2, 2, ) + g2iT(2, 2, ) + g3iT(2, 2, )
( 4.50 )
yang mempunyai sifat o(m-1) untuk m besar. Selanjutnya adalah memperoleh matriks yang merupakan matriks koragam 2 x 2 dari penduga tidak bias ~ σ 2 (ρ) dan ~ σ υ2 (ρ) . Untuk keperluan ini, ~ σ 2 (ρ) dan ~ σ υ2 (ρ) dapat ditulis kembali sebagai ~ σ 2 (ρ) = {(m 1)T r(H(1))}-1aTC1a + k1
( 4.51 )
~ σ υ2 (ρ) = c-1{m r(F)}-1aTC2a c-1{(m 1)T r(H(1))}-1aTC1a + k2
dimana a = Zv + u + e N(0, V) C1 = CT{Im – CX(XTCCTX)-1XTCT}C C2 = C*T{Im – C*TX(XTC*T C*X)-1XT C*T} C*
1 2 T
dengan C = blok-diagi[(IT – D)P] dan C* = blok-diagi( c f P). Elemen matriks dapat diperoleh melalui persamaan ( 4.50 ) dan ( 4.51 ) mengikuti Lemma 1 untuk koragam bentuk kuadratik.
86
Lemma 1. Jika y N(0, ), maka cov(yTG1y, yTG2y) = 2tr(G1G2), dimana G1 dan G2 adalah dua matriks simetrik. Dapat ditunjukkan bahwa E{g1iT( σˆ 2 (ρ) , σˆ 2υ (ρ) , )} g1iT(2, 2, ) g3iT(2, 2, )
( 4.52 )
E{g2iT( σˆ 2 (ρ) , σˆ 2υ (ρ) , )} g2iT(2, 2, )
( 4.53 )
E{g3iT( σˆ 2 (ρ) , σˆ 2υ (ρ) , )} g3iT(2, 2, ).
( 4.54 )
Berdasarkan persamaan ( 4.52 ) - ( 4.54 ) dapat ditentukan penduga bagi KTG[ θˆ iT (ρ) ] yang bersifat O(m-1), yaitu ktg[ θˆ iT (ρ) ] g1iT( σˆ 2 (ρ) , σˆ 2υ (ρ) , )} + g2iT ( σˆ 2 (ρ) , σˆ 2υ (ρ) , )} + 2g3iT ( σˆ 2 (ρ) , σˆ 2υ (ρ) , )}.
( 4.55 )
Pada penjabaran di atas, penduga dua tahap bagi iT dan penduga KTG-nya diperoleh dengan mengasumsikan bahwa autokorelasi diketahui. Namun pada kenyataan umumnya tidak diketahui. Misalkan {at} untuk t = 1, 2, ..., T adalah peubah acak deret waktu, maka autokorelasi dapat dinyatakan sebagai berikut : Apabila konsep autorelasi ini diterapkan pada peubah deret waktu iT di atas, maka akan diperoleh penduga bagi yaitu: m T 2
ρˆ
{aˆ i 1 t 1 m T 2
it
(aˆi ,t 1 aˆi , t 2 ) (σ t(,it)1 σ t(,it) 2 )}
{aˆit (aˆi ,t aˆi,t 1 ) (σ(t ,it) σt(,it)1 )}
,
T 2,
( 4.56 )
i 1 t 1
dimana aˆit = yit (xit)T(XTX)-1XTy yaitu sisaan ke-it berdasarkan metode kuadrat terkecil, σ t(,it) = Var(eit), σ t(,it)1 = Cov(eit, ei,t+1), dan σ t(,it) 2 = Cov(eit, ei,t+2). Hasil pendugaan dua tahap bagi θˆ iT2 (ρˆ ) adalah tidak bias, dan KTG-nya diduga dengan mensubstitusikan ρˆ terhadap pada persamaan ( 4.55 ). Ukuran ketidakpastian bagi penduga Bayes berhirarki, θˆ iBB , adalah KTG( θˆ iBB ) = E[( θˆ iBB i)2 θˆ i ] yang dapat dijabarkan sebagai berikut: KTG( θˆ iBB ) = E[( θˆ iBB i)2 θˆ i ]
( 4.57 )
= E[( θˆ iBB θˆ iB + θˆ iB i)2 θˆ i ] = E[( θˆ iBB θˆ iB )2 θˆ i ] + E[( θˆ iB i)2 θˆ i ]
87
+ 2E[( θˆ iBB θˆ iB )( θˆ iB i) θˆ i ] . Nilai E[( θˆ iBB θˆ iB )( θˆ iB i) θˆ i ] dapat dijabarkan menjadi E[( θˆ iBB θˆ iB ) θˆ i ] E[( θˆ iB i) θˆ i ] = 0, karena E[ θˆ iB θˆ i ] = i. Sehingga KTG( θˆ iBB ) dapat dinyatakan sebagai berikut: KTG( θˆ iBB ) = E[( θˆ iBB θˆ iB )2 θˆ i ] + E[( θˆ iB i)2 θˆ i ] = E[( θˆ iBB θˆ iB )2 θˆ i ] + g1i( 2 ) = J2i + J1i .
( 4.58 )
Jiang, Lahiri, dan Wan (2002) menggunakan pendekatan jackknife untuk menduga J2i dan J1i pada ( 4.58 ) di atas. Misalkan θˆ iBB = ki( θˆ i , βˆ , ˆ 2 ) merupakan penduga Bayes berhirarki bagi i yang diekspresikan sebagai fungsi dari penduga langsung θˆ i dan penduga parameter model βˆ dan ˆ 2 . Selanjutnya dilakukan beberapa tahap metode penghitungan, yaitu: (a)
Menghitung βˆ l dan ˆ 2 , l , yaitu penduga bagi β dan 2 berdasarkan data lengkap {( θˆ i , xi); i = 1, 2, ...,m} tetapi data ke-l dihapus. Proses ini dilakukan untuk setiap l untuk mendapatkan penduga sebanyak m bagi β dan 2 , yaitu {( βˆ l , ˆ 2 , l ); l = 1, 2, ...,m}. Hal ini akan menghasilkan sebanyak m penduga bagi i, { θˆ iBB , l ; l = 1, 2, ...,m},
ˆ ˆ ˆ2 dimana θˆ iBB , l = ki( θ i , β l , , l ). (b) Menghitung penduga bagi J2i, yaitu m 1 m ˆ BB ˆ BB 2 Jˆ 2i (θ i,-l θ i ) m l 1
(c)
Menghitung penduga bagi J1i, yaitu m 1 Jˆ1i g1i (σˆ 2ν ) [ g1i (σˆ 2ν,-l ) g1i (σˆ 2ν )]2 m l 1 m
(d) Menghitung penduga jackknife bagi KTG( θˆ iBB ), yaitu ktgJ( θˆ iBB ) = Jˆ2i Jˆ1i .
88
Nilai Jˆ1i merupakan penduga bagi KTG apabila parameter model ( β , 2 ) diketahui, dan Jˆ2i merupakan keragaman tambahan yang diakibatkan oleh pendugaan parameter.
4.6. Metode Gibbs Sampling Sebelumnya telah dipaparkan bahwa pendugaan parameter pada model Bayes berhirarki untuk model SAE yang memasukkan pengaruh acak area dan waktu dapat dilakukan secara numerik. Salah satu metode yang sesuai dengan kebutuhan tersebut adalah Gibbs sampling. Motode ini merupakan pengembangan dari metode Markov Chain Monte Carlo (Gelfand dan Smith, 1990). Misalkan = (T, T)T adalah vektor parameter area kecil dan parameter model . Selanjutnya membentuk rantai Markov {(k), k = 0, 1, 2, ...} sedemikian hingga sebaran (k) konvergen pada sebaran f(|y) yang dinotasikan sebagai (). Oleh karena itu untuk d bernilai besar, (d + 1), (d + 2), ..., (d + D) dapat dianggap sebagai D contoh tidak bebas dari f(|y). Diperlukan spesifikasi satu tahap peluang transisi atau Kernel P((k + 1)| (k)) yang tergantung hanya pada state saat ini, yaitu (k). Dengan demikian, sebaran bersyarat bagi (k + 1) apabila diberikan (0), (1), ..., (k) tidak tergantung pada rantai ((0), (1), ..., (k - 1)). Transisi Kernel tersebut harus memenuhi kondisi kestasioneran, yaitu:
((k))P((k + 1)| (k)) d (k) = ((k + 1)) .
( 4.59 )
Berdasarkan persamaan ( 4.59 ), bahwa jika (k) berasal dari (.) maka (k + 1)
juga berasal dari (.). Pada Gibbs sampling, untuk membangkitkan contoh (k)
maka dibagi ke dalam 1, 2, ..., r. Misalnya untuk model area kecil = (1,
2, ..., m)T dan = ( T, 2). Pada kasus ini, mungkin dibagi sebagai 1 = , 2 = 1, ..., m+1 = m, m+2 = 2 (r = m + 2). Sebaran bersyarat Gibbs dapat dinyatakan sebagai f(1|2, ..., r, y), f(2|1, 3, ..., r, y), ..., f(r|1, ..., r-1, y). Gibbs sampling menggunakan sebaran bersyarat ini untuk membentuk Kernel P(.|.), sedemikian hingga sebaran stasioner dari rantai Markov adalah () = f(|y). Algoritma Gibbs sampling mencakup tahap-tahap berikut ini:
89
(a)
Memilih titik awal (0) dengan komponen 1(0), 2(0), ..., r(0), yaitu pada k = 0. Penduga KMT atau momen bagi dapat digunakan sebagai titik awal tersebut.
(b) Membangkitkan (k + 1) = (1(k + 1), 2(k + 1), ..., r(k + 1)) sebagai berikut : menarik 1(k
+ 1)
dari f(1|2(k), ..., r(k), y); 2(k
+ 1)
dari f(2|1(k
+ 1)
,
3(k), ..., r(k), y); ...; dan r(k + 1) dari f(2|1(k + 1), ..., r-1(k + 1), y). (c)
Memperbaharui nilai k, yaitu k = k + 1, dan kembali ke tahap (a).
4.7. Penerapan pada Data Susenas dan Simulasi Studi kasus penerapan juga dilakukan pada dua sumber data, yaitu data Susenas dan data simulasi. Data simulasi berguna untuk mengetahui berbagai karakteristik pendugaan pendekatan Bayes berhirarki pada beberapa kondisi yang berbeda. 4.7.1. Data Susenas Metode
Bayes
berhirarki
untuk
pendugaan
tidak
langsung
yang
memasukkan pengaruh acak area dan waktu dapat diterapkan pada data Susenas BPS yang memang memiliki persoalan ukuran contoh yang terlalu kecil pada tingkat desa, sehingga pengamatan antar waktu dapat dimodelkan untuk menurunkan nilai ragam. Model yang digunakan adalah seperti yang dijabarkan di atas yaitu:
ˆit = xitT + vi + uit dan uit = ui,t-1 + it,
( 4.60 )
dengan vi iid (0, v2) dan it iid N(0, 2). Model tersebut dapat juga dinyatakan dalam model MCLT, yi = Xi + ZiviT + ei , yaitu: yi = ˆ i ,
Xi = (xit1, …, xitT)T,
Zi = (1T, IT)
dan viT = (vi, uiT), ei = (ei1, …, eiT)T,
= (1, …, p)T
dimana 1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Sedangkan
90
2 Gi = v 0
0T , 2
Ri = i
( 4.61 )
dimana i = adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) |t-s|/(1 - 2). Model area kecil dengan pengaruh acak area dan waktu untuk data Susenas tersebut dapat dinyatakan melalui dua pendekatan Bayes berhirarki sebagai berikut : Model 1 Bayes berhirarki (BB-1): Level 1 : ˆit |it N(it, it), it adalah ragam penarikan contoh Level 2 : it | , uit N(xitT + uit , v2) Level 3 : uit | uit-1 N(uit-1, 2) Level 4 : menyebar flat(-,), v2 dan 2 menyebar Invers-Gamma.
Model 2 Bayes berhirarki (BB-2): Level 1 : ˆit |it, it2 N(it, [1 – f ]it2 /nit) Level 2 : ([nit -1]sit2)/it2 ~ 2(nit -1) Level 3 : it | , uit N(xitT + uit , v2) Level 4 : uit | uit-1 N(uit-1, 2) Level 5 : menyebar flat(-,), v2 dan 2 menyebar Invers-Gamma. Pada BB-1, model penarikan contoh ˆit = it + it dengan it N(0, it) dinyatakan sebagai ˆit |it N(it, it) dimana it dianggap diketahui, yaitu sebagai ragam penarikan contoh yang dapat diduga dari data. Sedangkan pada BB-2, it dianggap tidak diketahui dan dinyatakan sebagai [1 – f ]it2 /nit dengan ([nit -1]sit2)/it2 ~ 2(nit -1). Sedangkan model penghubung yaitu, it = xitT + vi + uit dengan vi iid (0, v2) dan uit = ui,t-1 + it dengan it iid N(0, 2) masingmasing dinyatakan sebagai it | , uit N(xitT + uit , v2) dan uit | uit-1 N(uit-1, 2) baik pada BB-1 maupun BB-2. Parameter dianggap menyebar seragam atau flat(-,), sedangkan v2 dan 2 dianggap menyebar Invers-Gamma dengan berbagai parameter sebaran Invers-Gamma yang mungkin.
91
Pada model di atas ˆ it tergantung pada pengaruh area spesifik vi dan oleh waktu spesifik uit yang berkorelasi antar waktu. Nilai ˆ it adalah penduga langsung dari survei untuk tingkat pengeluaran perkapita pada area kecil (desa) i pada waktu (tahun) t. Pada kasus ini, T = 5, yaitu Susenas Wilayah Kota Bogor 2001 – 2005. Parameter it merupakan fungsi untuk rataan pada area i pada waktu t, dan eit adalah galat penarikan contoh yang menyebar normal dengan nilai harapan 0 dan mempunyai matriks koragam blok-diagonal . Sedangkan xit adalah vektor kovariat spesikasi area yang mungkin berubah menurut waktu t. Vektor kovariat area xit tersebut adalah peubah tetap yang diperoleh dari data Podes BPS 1999/2000, 2001/2002, dan 2003/2004. Sebagaimana asusmsi yang digunakan pada model area kecil, peubah tetap ini diperoleh melalui sensus sehingga tidak memiliki galat penarikan contoh. Lima peubah tetap yang digunakan untuk membentuk vektor kovariat tersebut adalah persentase rumah tangga pertanian (x1), persentase rumah tangga yang terkategori pra sejahtera (x2), persentase rumah tangga yang menggunakan daya listrik minimum 450 kwh perbulan (x3), persentase rumah tangga yang mendapatkan kartu miskin (x4), dan mayoritas sumber air rumah tangga (x5). Pemilihan peubah tersebut didasarkan pada tingkat korelasinya dengan tingkat pengeluaran perkapita perbulan. Tabel 4.1. Perbandingan Antara Metode PTLTE dengan Metode Bayes Berhirarki Model 1 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor
No
Nilai untuk Seluruh Area Kecil
Metode SAE – PTLTE Deret Waktu
ˆ PT DW
KTG
AKTG
Metode SAE – Bayes Berhirarki Model 1 Deret Waktu
ˆ BB1 DW
KTG
AKTG
1 Minimum
179.7
250.1
15.8
214.4
116.1
10.8
2 Kuartil Pertama
302.7
526.8
22.9
259.7
322.8
18.0
3 Rataan
338.3
906.7
29.2
270.8
546.5
22.4
4 Median
341.3
846.7
29.1
273.8
458.1
21.4
5 Kuartil Ketiga
383.1
1251.6
35.4
282.1
709.3
26.6
6 Maksimum
512.9
1728.5
41.6
315.0
1414.1
37.6
92
Hasil penerapan metode Bayes berhirarki (BB-1 dan BB-2) pada model area kecil tersebut disajikan pada Tabel 4.1 dan 4.2, sedangkan hasil rincian untuk tiap area kecil (desa) disajikan pada Lampiran 6 dan 7. Pada Tabel 4.1 tersebut
ˆ PT DW merupakan penduga tingkat pengeluaran perkapita perbulan (dalam ribuan) berdasarkan model SAE melalui pendekatan PTLTE untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.415. Sedangkan ˆ BB1 DW merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan Bayes berhirarki (model 1) untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.431. Gambar 4.1 memperlihatkan plot antara AKTG penduga PTLTE deret waktu dengan AKTG hasil metode Bayes berhirarki deret waktu (model 1). 45
Akar Kuadrat Tengah Galat (AKTG)
40 35 30 25 20 15 10 5 0 Area Kecil (Desa) PTLTE-dw
Bayes Berhirarki Model 1-dw
Gambar 4.1. Plot Antara AKTG Metode PTLTE dengan AKTG Metode Bayes Berhirarki Model 1 Berdasarkan Tabel 4.1 dan Gambar 4.1, terlihat bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki (model 1) dibandingkan dengan AKTG pada metode PTLTE. Secara rata-rata, AKTG pada metode PTLTE sebesar 29.2 turun menjadi 22.5 pada metode Bayes berhirarki. Hal ini
93
mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Tabel 4.2. Perbandingan Antara Metode Bayes Berhirarki Model 1 dengan Model 2 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor
No
Nilai untuk Seluruh Area Kecil
Metode SAE – Bayes Berhirarki Model 1 Deret Waktu
ˆ BB1 DW
KTG
Metode SAE – Bayes Berhirarki Model 2 Deret Waktu
AKTG
ˆ BB 2 DW
KTG
AKTG
1 Minimum
214.4
116.1
10.8
220.1
51.9
7.2
2 Kuartil Pertama
259.7
322.8
18.0
252.4
246.8
15.7
3 Rataan
270.8
546.5
22.4
268.2
485.4
20.7
4 Median
273.8
458.1
21.4
272.1
355.3
18.8
5 Kuartil Ketiga
282.1
709.3
26.6
281.4
736.3
27.1
6 Maksimum
315.0
1414.1
37.6
313.3
1414.2
37.6
Pada Tabel 4.2 tersebut ˆ BB1 DW merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan Bayes berhirarki (model 1) untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.431. Sedangkan
ˆ BB 2 DW merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan Bayes berhirarki (model 2) untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.437. Gambar 4.2 memperlihatkan plot antara AKTG penduga Bayes berhirarki deret waktu (model 1) dengan AKTG hasil metode Bayes berhirarki deret waktu (model 2).
94
45
Akar Kuadrat Tengah Galat (AKTG)
40 35 30 25 20 15 10 5 0 Area Kecil (Desa) Bayes Berhirarki Model 1-dw
Bayes Berhirarki Model 2-dw
Gambar 4.2. Plot Antara AKTG Metode Bayes Berhirarki Model 1 dan Model 2 Berdasarkan Tabel 4.2 dan Gambar 4.2, terlihat bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki (model 2) dibandingkan dengan AKTG pada metode pemodelan area kecil Bayes berhirarki (model 1). Secara rata-rata, AKTG pada metode Bayes berhirarki (model 1) sebesar 22.5 turun menjadi 20.7 pada metode model 2. Hal ini mengindikasikan bahwa metode Bayes berhirarki model 2 lebih baik daripada model 1 dalam menurunkan AKTG. Namun demikian, penurunan AKTG tersebut tidak sebesar penurunan yang terjadi ketika metode PTLTE dibandingkan dengan Bayes berhirarki. Metode Bayes berhirarki model 2 pada dasarnya merupakan kalibrasi terhadap model 1, dimana pada model 1 ragam penarikan contoh dianggap diketahui sedangkan pada model 2 dianggap tidak diketahui. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun.
95
4.7.2. Data Simulasi Data simulasi digunakan untuk mengetahui berbagai karakteristik pendugaan pada beberapa kondisi yang berbeda. Pada penelitian ini, proses simulasi difokuskan untuk mengetahui pengaruh banyaknya waktu (T) dan korelasi diri (). Sementara model dan metode penarikan contohnya mengikuti model dan metode penarikan contoh Susenas. Selanjutnya dievaluasi tentang relatif biasnya dan nilai AKTG-nya. Pembangkitan data didasarkan pada model di atas, yaitu:
ˆit = xitT + vi + uit dan uit = ui,t-1 + it,
( 4.62 )
dengan vi iid (0, v2) dan it iid N(0, 2). Ragam penarikan contoh dianggap mengikuti pola pada Bayes berhirarki model 2 yaitu ˆit |it, it2 N(it, [1 – f ]it2 /nit) dan ([nit -1]sit2)/it2 ~ 2(nit -1). Nilai v = 41.7 dan = 22.6 yang diperoleh dari hasil Bayes berhirarki data Susenas di atas. Vektor kovariat xitT = (xit1, ..., xit5) dibangkitkan sebagai peubah tetap (fixed), sedangkan vektor nilainya diambil dari hasil Bayes berhirarki data Susenas yaitu 0 = 61.890, 1 = 5.360, 2 = -1.012, 3 = 0.850, 4 = -0.990, dan 5 = -7.879. Parameter it = xitT sedangkan penduga langsung bagi it diperoleh dari persamaan di atas yaitu ˆit = xitT + vi + uit = it + vi + uit dan uit = ui,t-1 + it. Simulasi dilakukan untuk banyaknya waktu (T) yang berbeda yaitu T = 3, 5, dan 7, dengan lima nilai korelasi diri yaitu = 0.01, 0.25, 0.45, 0.60, dan 0.85. Selanjutnya dibandingkan relatif bias dan nilai AKTG-nya antara metode Bayes berhirarki model 1 dengan model 2. Pada Tabel 4.3, BB-1 adalah metode Bayes berhirarki model 1 dan BB-2 adalah metode Bayes berhirarki model 2. Nilai bias relatif mutlak / BRM (absolute relative bias / ARB) dihitung sebagai berikut: BRMi =
1 R ˆr i R r 1 i
( 4.63 )
96
dimana R adalah banyaknya simulasi, yaitu R = 10,000. Berdasarkan tabel tersebut terlihat bahwa secara umum bias relatif mutlak tidak berbeda antara metode Bayes berhirarki model 1 dengan model 2. Artinya, metode Bayes berhirarki model 1 dan model 2 sama-sama menghasilkan penduga yang bersifat tidak bias. Tabel 4.3. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode Bayes Berhirarki Model 1 dengan Model 2 untuk Data Simulasi Korelasi Diri ()
T=3 BB-1
T=5 BB-2
BB-1
T=7 BB-2
BB-1
BB-2
0.01
0.0000120 0.0000123 0.0000115 0.0000111 0.0000122 0.0000111
0.25
0.0000124 0.0000117 0.0000129 0.0000108 0.0000116 0.0000121
0.45
0.0000126 0.0000118 0.0000106 0.0000122 0.0000119 0.0000097
0.60
0.0000121 0.0000116 0.0000126 0.0000097 0.0000095 0.0000119
0.85
0.0000132 0.0000108 0.0000125 0.0000124 0.0000110 0.0000112
Tabel 4.4 menunjukkan hasil nilai rata-rata akar kuadrat tengah galat relatif / AKTGR (relative root of mean square of error / RRMSE) pada metode Bayes berhirarki model 1 dan model 2. Nilai AKTGR dihitung sebagai berikut :
AKTGRi
1 R ˆ ( r i ) 2 R r 1 . i
( 4.64 )
Berdasarkan Tabel 4.4 nilai AKTGR metode Bayes berhirarki model 2 cenderung lebih kecil dibandingkan dengan nilai AKTGR metode Bayes berhirarki model 1 pada waktu T dan korelasi diri yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut.
97
Tabel 4.4. Nilai Rata-rata AKTGR pada Metode Bayes Berhirarki Model 1 dengan Model 2 untuk Data Simulasi T=3
Korelasi Diri ()
T=5
T=7
BB-1
BB-2
BB-1
BB-2
BB-1
BB-2
0.01
0.1823
0.1141
0.1825
0.1075
0.1751
0.0987
0.25
0.1824
0.0991
0.1734
0.1002
0.1593
0.0965
0.45
0.1613
0.0825
0.1507
0.0813
0.1345
0.0701
0.60
0.1327
0.0626
0.1328
0.0527
0.1278
0.0364
0.85
0.1178
0.0311
0.1121
0.0312
0.1093
0.0297
Secara umum, karakteristik penduga parameter peubah tetap, yaitu 0, 1,
2, 3, 4, dan 5, cenderung identik antara hasil metode Bayes berhirarki model 1 dengan model 2 dalam bentuk pola sebaran Normal. Perbedaan relatif antara βˆ dengan parameter adalah kecil. Artinya, pengaruh kovariat dapat dikatakan
tidak berbeda antara metode Bayes berhirarki model 1 dengan model 2. Hasil tersebut disajikan pada Gambar 4.3 – 4.8. ˆ0
B0 600
Variable Beta0-BB1 Beta0-BB2
500
Mean StDev N 61,86 14,76 10000 61,05 13,79 10000
Frequency
400 300 200 100 0
0
16
32
48
64
80
96
112
Data 0 Penduga
Gambar 4.3. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 0 untuk Metode Bayes Berhirarki Model 1 dan Model 2
98
B1 Variable Beta1-BB1 Beta1-BB2
400
Mean 5,358 5,376
Frequency
300
StDev N 0,2534 10000 0,2680 10000
200
100
0 4,400
4,675
4,950
5,225 5,500 5,775 Data 1 Penduga
6,050
6,325
Gambar 4.4. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 1 untuk Metode Bayes Berhirarki Model 1 dan Model 2
B2 Variable Beta2-BB1 Beta2-BB2
500
Mean StDev -1,011 0,1621 -1,014 0,1616
Frequency
400
N 10000 10000
300
200
100
0
-1,62
-1,44
-1,26
-1,08 -0,90 -0,72 Data 2 Penduga
-0,54
-0,36
Gambar 4.5. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 2 untuk Metode Bayes Berhirarki Model 1 dan Model 2
99
B3 700
Variable Beta3-BB1 Beta3-BB2
600
Mean StDev 0,8503 0,1279 0,8420 0,1207
Frequency
500
N 10000 10000
400 300 200 100 0
0,42
0,56
0,70
0,84 0,98 Data Penduga
1,12
1,26
3
Gambar 4.6. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 3 untuk Metode Bayes Berhirarki Model 1 dan Model 2
B4 Variable Beta4-BB1 Beta4-BB2
600
Frequency
500
Mean StDev -0,9913 0,1505 -1,006 0,1340
N 10000 10000
400 300 200 100 0 -1,60
-1,44
-1,28
-1,12
-0,96
-0,80
-0,64
-0,48
Data Penduga 4
Gambar 4.7. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 4 untuk Metode Bayes Berhirarki Model 1 dan Model 2
100
B5 Variable Beta5-BB1 Beta5-BB2
700 600
Mean StDev -7,869 1,138 -7,030 1,417
Frequency
500
N 10000 10000
400 300 200 100 0 -12,8
-11,2
-9,6
-8,0
-6,4
-4,8
-3,2
-1,6
Data 5 Penduga
Gambar 4.8. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 5 untuk Metode Bayes Berhirarki Model 1 dan Model 2
4.8. Simpulan Metode PTLT pada SAE memerlukan banyak kondisi tertentu yang harus dipenuhi, diantaranya adalah pengasumsian bahwa parameter peubah tetap dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataanya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode PTLT yang memerlukan berbagai kondisi tertentu. Penerapan pada data deret waktu Susenas, diketahui bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Berdasarkan data simulasi, nilai AKTGR metode Bayes berhirarki model 2 cenderung lebih kecil dibandingkan dengan nilai AKTGR metode Bayes
101
berhirarki model 1 pada waktu T dan korelasi diri yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Karakteristik penduga parameter peubah tetap, yaitu 0, 1, 2, 3, 4, dan 5, cenderung identik antara hasil metode Bayes berhirarki model 1 dengan model 2 dalam bentuk pola sebaran Normal. Artinya, pengaruh kovariat dapat dikatakan tidak berbeda antara metode Bayes berhirarki model 1 dengan model 2.
102
BAB V 5.
Pembahasan Umum
5.1. Pendahuluan Berdasarkan hasil pada Bab III, penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai AKTGnya lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Ini menunjukkan bahwa pengaruh acak area maupun pengaruh sintetik vektor kovariat berfungsi mengkalibrasi hasil pendugaan langsung yang hanya didasarkan pada data survei semata. Informasi tambahan yang berupa nilai parameter dari area kecil lain yang memiliki karakteristik serupa dengan area kecil yang menjadi perhatian maupun nilai dari peubah yang memiliki hubungan dengan peubah yang sedang diamati secara statistik memiliki sifat penguatan (borrowing strength) dari hubungan antara nilai peubah respon dan informasi tambahan tersebut. Pada data deret waktu Susenas AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE penampang melintang. Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai AKTGR metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE penampang melintang pada waktu T dan korelasi diri yang sama-sama besar. Hasil yang terdapat pada Bab IV menunjukkan pada data deret waktu Susenas nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya
103
penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun.
5.2. Keunggulan Metode Bayes daripada Metode PTLT pada Model SAE Secara Analitik Berdasarkan kajian data simulasi pada Bab IV, dapat diketahui bahwa metode Bayes berhirarki menghasilkan KTG yang lebih kecil daripada metode PTLT pada model SAE yang memasukkan pengaruh acak area dan waktu. Pada bagian ini dibandingkan kedua metode tersebut melalui pendekatan analitik. Misalkan yitl adalah nilai karakteristik yang menjadi perhatian pada unit kel, waktu ke-t, dan pada area kecil ke-i (i = 1, 2, ..., m; t = 1, 2, ..., T; l = 1, 2, ..., nit), = (1, 2, ..., m)T, dan 2 = (12, 22, ..., m2)T. Model hirarkinya dapat dinyatakan sebagai berikut: Level 1 : yitl|it, it2 N(it, it2) Level 2 : it|, 2 N(xiT, 2) Level 3 : it2 p(it2), dimana p adalah suatu fungsi kepekatan peluang . Apabila diketahui, maka PTLT bagi it adalah
ˆitPTLT = xiT + itPTLT(yit. - xiT)
( 5.1 )
dimana itPTLT = nit2/(nit2 + ), = E(it2), dan yit. = nit-1(yitl). Misalkan y = (y1t, …, ymt) dan yit = (yit1, yit2, …, yitni)T. Penduga Bayes bagi it adalah
ˆitBB = xiT + itBB(yit. - xiT)
( 5.2 )
dimana itBB = E{nit2/(nit2 + it2)|y}, E adalah nilai harapan berdasarkan sebaran posterior dari it2, yaitu
f it (σ it2 | yit )
1 S2 n exp it2 2 it 2 ( yit . xTi β) 2 p(σ it2 ) ( 5.3 ) 2 2 (σ it nit ) 2 σ it (σ it nit ) σ it ( nit 1)
it2 > 0, sedangkan Sit2 l it1 ( yitl yit . ) 2 . n
104
Karakteristik penduga Bayes dan PTLT di atas, ˆitBB dan ˆitPTLT , dapat diperhatikan dalam tiga hal, yaitu bias, resiko berdasarkan KTG, dan kekonsistenan.
(a) Bias Untuk penduga Bayes, E( ˆitBB ) = E(E{it|y}) = E(it), sedangkan untuk penduga PTLT, E( ˆitPTLT ) = xiT + itPTLT{E(yit. - xiT)} = xiT = E(it). Karena E( ˆitBB ) = E(it) dan E( ˆitPTLT ) = E(it) maka penduga Bayes dan penduga PTLT pada model SAE bersifat tidak bias, artinya bahwa E( ˆitBB - it) = 0 dan E( ˆitPTLT - it) = 0.
( 5.4 )
(b) Resiko Resiko suatu penduga dapat dinyatakan sebagai r( ˆit ) = E( ˆit - it )2, yaitu kuadrat tengah galat (KTG) bagi penduga tersebut. Perbedaan resiko antara penduga PTLT dan penduga Bayes pada model SAE di atas dapat dinyatakan sebagai berikut: r( ˆitPTLT ) – r( ˆitBB ) = E( ˆitPTLT - it )2 - E( ˆitBB - it )2 = E( ˆitPTLT - ˆitBB )2 = E{(iPTLT - itBB)2(yit. - xiT)2}.
( 5.5 )
Berdasarkan hasil tersebut, perbedaan resiko antara penduga PTLT dan penduga Bayes tergantung pada selisih pembobotnya, yaitu itPTLT dan itBB γ itPTLT
nit τ 2 , = E(it2) 2 (nit τ ξ )
( 5.6 )
dan γ
BB it
nit τ 2 E 2 2 (nit τ σ it )
y .
( 5.7 )
Resiko penduga PTLT sama dengan penduga Bayes, jika dan hanya jika pembobotnya sama besar yaitu
105
nit τ 2 nit τ 2 E y . 2 2 2 (nit τ ξ ) (nit τ σ it )
( 5.8 )
Namun kondisi seperti ini, yaitu resiko penduga PTLT sama dengan penduga Bayes, tidak mungkin dapat dipenuhi, karena menurut pertidaksamaan Jensen
E ( ) E y . E ( )
( 5.9 )
Sehingga apabila pertidaksamaan Jensen ini diterapkan pada resiko penduga PTLT dan Bayes dapat dinyatakan sebagai berikut: nit τ 2 E 2 2 (nit τ σ it )
E (nit τ 2 ) y 2 2 E (nit τ ) E (σ it )
nit τ 2 E 2 2 (nit τ σ it )
n τ2 y it2 nit τ ξ
( 5.10 )
γ itBB γ itPTLT .
Karena pembobot penduga Bayes lebih kecil daripada penduga PTLT, γ itBB γ itPTLT , maka resiko penduga Bayes berdasarkan pertidaksamaan tersebut
lebih kecil daripada resiko penduga PTLT, yaitu r( ˆitBB ) < r( ˆitPTLT ) E( ˆitBB - it )2 < E( ˆitPTLT - it )2 KTG( ˆitBB ) < KTG( ˆitPTLT )
(c) Konsisten Apabila ˆn merupakan penduga parameter yang ditentukan berdasarkan contoh berukuran n, maka ˆn disebut penduga yang konsisten apabila ˆn konvergen dalam peluang ke untuk n , atau untuk setiap > 0, lim P(| ˆn | ) 0 n
( 5.11 )
Hal ini dapat dipenuhi apabila ˆn merupakan penduga yang tidak bias bagi dan ragamnya, Var( ˆn ), mendekati nol untuk n . Dengan demikian, untuk nilai n yang cukup besar, ˆn mendekati sifat suatu konstanta yang bernilai sama dengan parameter .
106
Pada Bab III dan Bab IV telah dipaparkan bahwa ragam penduga PTLT ( ˆitPTLT ) dan penduga Bayes berhirarki ( ˆitBB ) lebih kecil daripada ragam penduga langsung ( ˆitL ), yaitu
Var( ˆitL )
> Var( ˆitPTLT ) > Var( ˆitBB ). Karena Var( ˆitL )
berbanding terbalik dengan n, maka lim Var (ˆitL ) lim Var (ˆitPTLT ) lim Var (ˆitBB ) 0 n
n
n
( 5.12 )
Pada poin (a) di atas juga telah dijabarkan bahwa ˆitPTLT dan ˆitBB bersifat tidak bias, maka sesuai dengan definisi di atas, penduga PTLT ( ˆitPTLT ) dan penduga Bayes berhirarki ( ˆitBB ) merupakan penduga yang bersifat konsisten. Berdasarkan kajian analitik di atas, maka dapat disimpulkan bahwa pada model SAE yang memasukkan pengaruh acak area dan waktu, penduga PTLT yang berbasis pada metode kemungkinan maksimum terbatas (REML) dan penduga Bayes berhirarki sama-sama bersifat tidak bias dan konsisten. Namun, resiko atau KTG yang dihasilkan penduga Bayes lebih kecil daripada penduga PTLT, artinya dalam hal ini penduga Bayes lebih baik daripada penduga PTLT.
5.3. Hasil Studi Kasus pada Data Sebagaimana dipaparkan pada bagian sebelumnya, metode PTLTE dan metode Bayes berhirarki untuk pendugaan tidak langsung yang memasukkan pengaruh acak area dan waktu dapat diterapkan pada data Susenas BPS yang memang memiliki persoalan ukuran contoh yang terlalu kecil pada tingkat desa, sehingga pengamatan antar waktu dapat dimodelkan untuk menurunkan nilai ragam. Model yang digunakan adalah seperti yang dijabarkan di atas yaitu:
ˆit = xitT + vi + uit dan uit = ui,t-1 + it,
( 5.13 )
dengan vi iid (0, v2) dan it iid N(0, 2). Model tersebut dapat juga dinyatakan dalam model MCLT, yi = Xi + ZiviT + ei , yaitu: yi = ˆ i ,
Xi = (xit1, …, xitT)T,
Zi = (1T, IT)
( 5.14 )
dan
107
viT = (vi, uiT), ei = (ei1, …, eiT)T,
= (1, …, p)T
dimana 1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Sedangkan
2 Gi = v 0
0T , 2
Ri = i
( 5.15 )
dimana i = adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) |t-s|/(1 - 2). Model area kecil dengan pengaruh acak area dan waktu untuk data Susenas tersebut dapat dinyatakan dalam dua model Bayes berhirarki sebagai berikut :
Model BB-1: Level 1 : ˆit |it N(it, it), it adalah ragam penarikan contoh Level 2 : it | , uit N(xitT + uit , v2) Level 3 : uit | uit-1 N(uit-1, 2) Level 4 : menyebar flat(-,), v2 dan 2 menyebar Invers-Gamma.
Model BB-2: Level 1 : ˆit |it, it2 N(it, [1 – f ]it2 /nit) Level 2 : ([nit -1]sit2)/it2 ~ 2(nit -1) Level 3 : it | , uit N(xitT + uit , v2) Level 4 : uit | uit-1 N(uit-1, 2) Level 5 : menyebar flat(-,), v2 dan 2 menyebar Invers-Gamma.
Ringkasan hasil KTG dan AKTG antara dua pendekatan tersebut, PTLT dan Bayes, disajikan pada Tabel 5.1. Rincian untuk tiap area kecil (desa) disajikan pada Lampiran 8. Berdasarkan hasil pada Tabel 5.1 tersebut, terlihat bahwa nilai AKTG yang paling kecil terdapat pada metode pemodelan area kecil Bayes berhirarki (model 2) dibandingkan dengan AKTG pada metode pemodelan area kecil metode PTLTE dan Bayes berhirarki (model 1). Secara rata-rata, AKTG pada metode PTLTE mempunyai nilai yang paling besar dibandingkan dengan
108
metode Bayes berhirarki. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada metode PTLTE dalam menurunkan AKTG. Tabel 5.1. Perbandingan Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor
Nilai untuk Seluruh Area Kecil
No
Bayes Berhirarki Model 1
PTLTE KTG
AKTG
KTG
AKTG
Bayes Berhirarki Model 2 KTG
AKTG
1 Minimum
250.1
15.8
116.1
10.8
51.9
7.2
2 Kuartil-1
526.8
22.9
322.8
18.0
246.8
15.7
3 Rataan
906.7
29.2
546.5
22.4
485.4
20.7
4 Median
846.7
29.1
458.1
21.4
355.3
18.8
5 Kuartil-3
1251.6
35.4
709.3
26.6
736.3
27.1
6 Maksimum
1728.5
41.6
1414.1
37.6
1414.2
37.6
Data simulasi digunakan untuk mengetahui berbagai karakteristik pendugaan pada beberapa kondisi yang berbeda. Pada penelitian ini, proses simulasi difokuskan untuk mengetahui pengaruh banyaknya waktu (T) dan korelasi diri (). Sementara model dan metode penarikan contohnya mengikuti model dan metode penarikan contoh Susenas. Selanjutnya dievaluasi tentang relatif biasnya dan nilai AKTG-nya untuk metode PTLTE dan Bayes berhirarki. Pembangkitan data didasarkan pada model di atas, yaitu:
ˆit = xitT + vi + uit dan uit = ui,t-1 + it,
( 5.16 )
dengan vi iid (0, v2) dan it iid N(0, 2). Sebagaimana pada simulasi Bab IV, ragam penarikan contoh dianggap mengikuti pola pada Bayes berhirarki model 2 yaitu ˆit |it, it2 N(it, [1 – f ]it2 /nit) dan ([nit -1]sit2)/it2 ~ 2(nit -1). Nilai v = 41.7 dan = 22.6 yang diperoleh dari hasil Bayes berhirarki data Susenas di atas. Vektor kovariat xitT = (xit1, ..., xit5) dibangkitkan sebagai peubah tetap (fixed), sedangkan vektor nilainya diambil
109
dari hasil Bayes berhirarki data Susenas yaitu 0 = 61.890, 1 = 5.360, 2 = 1.012, 3 = 0.850, 4 = -0.990, dan 5 = -7.879. Parameter it = xitT sedangkan penduga langsung bagi it diperoleh dari persamaan di atas yaitu ˆit = xitT + vi + uit = it + vi + uit dan uit = ui,t-1 + it. Simulasi dilakukan untuk banyaknya waktu (T) yang berbeda yaitu T = 3, 5, dan 7, dengan lima nilai korelasi diri yaitu = 0.01, 0.25, 0.45, 0.60, dan 0.85. Selanjutnya dibandingkan relatif bias dan nilai AKTG-nya antara metode PTLTE dengan metode Bayes berhirarki model 1 dengan model 2. Tabel 5.2. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode PTLTE dan Bayes Berhirarki untuk Data Simulasi Deret Waktu T=3 Korelasi Diri ()
PTLTE
BB-1
BB-2
0.01
0.0000104
0.0000097
0.0000089
0.25
0.0000111
0.0000112
0.0000098
0.45
0.0000097
0.0000107
0.0000117
0.60
0.0000122
0.0000101
0.0000106
0.85
0.0000109
0.0000121
0.0000111
T=5
PTLTE
BB-1
BB-2
0.01
0.0000103
0.0000108
0.0000101
0.25
0.0000112
0.0000113
0.0000099
0.45
0.0000104
0.0000108
0.0000118
0.60
0.0000121
0.0000100
0.0000105
0.85
0.0000108
0.0000120
0.0000110
T=7
PTLTE
BB-1
BB-2
0.01
0.0000102
0.0000098
0.0000105
0.25
0.0000116
0.0000114
0.0000100
0.45
0.0000099
0.0000109
0.0000119
0.60
0.0000119
0.0000099
0.0000104
0.85
0.0000107
0.0000118
0.0000109
110
Tabel 5.3. Nilai Rata-rata AKTGR pada Metode PTLTE dan Bayes Berhirarki untuk Data Simulasi Deret Waktu T=3 Korelasi Diri ()
PTLTE
BB-1
BB-2
0.01
0.2034
0.1823
0.1141
0.25
0.2029
0.1824
0.0991
0.45
0.1954
0.1613
0.0825
0.60
0.1957
0.1327
0.0626
0.85
0.1903
0.1178
0.0311
T=5
PTLTE
BB-1
BB-2
0.01
0.2034
0.1825
0.1075
0.25
0.2021
0.1734
0.1002
0.45
0.1913
0.1507
0.0813
0.60
0.1825
0.1328
0.0527
0.85
0.1677
0.1121
0.0312
T=7
PTLTE
BB-1
BB-2
0.01
0.1989
0.1751
0.0987
0.25
0.1988
0.1593
0.0965
0.45
0.1823
0.1345
0.0701
0.60
0.1768
0.1278
0.0364
0.85
0.1609
0.1093
0.0297
Pada Tabel 5.2, BB-1 adalah metode Bayes berhirarki model 1 dan BB-2 adalah metode Bayes berhirarki model 2. Berdasarkan tabel tersebut terlihat bahwa secara umum bias relatif mutlak tidak berbeda antara metode PTLTE dengan Bayes berhirarki model 1 dan 2. Artinya bahwa penduga PTLTE dan Bayes berhirarki untuk data deret waktu bersifat tidak bias. Berdasarkan Tabel 5.3 nilai AKTGR metode Bayes berhirarki model 2 cenderung lebih kecil dibandingkan dengan nilai AKTGR metode PTLTE dan Bayes berhirarki model 1 pada waktu T dan korelasi diri yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya
111
waktu T dan korelasi diri dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut.
5.4. Lesson Learned Berdasarkan penelusuran pustaka, kajian tentang SAE yang memasukkan pengaruh acak area dan waktu berdasarkan model state space yang dibahas dalam disertasi ini merupakan kajian pertama yang pernah dilakukan di Indonesia. Sehingga masih diperlukan penelitian lanjutan untuk mengembangkan metode ini di Indonesia khususnya beberapa keterbatasan yang terdapat dalam disertasi ini, yaitu: a.
Model SAE yang dikaji dalam disertasi ini hanya mencakup peubah respon kontinu belum mencakup peubah respon diskret.
b.
Model yang digunakan memasukkan pengaruh acak area dan waktu, masih
memungkinkan
untuk
mengembangkan
model
yang
memasukkan pengaruh acak area, waktu, dan pengaruh spasial. c.
Program komputasi masih berupa program makro yang terpisah-pisah baik dalam program SAS maupun program R, belum tersusun menjadi suatu paket program yang bersifat user friendly.
d.
Data deret waktu Susenas yang digunakan adalah 5 tahun, masih diperlukan eksplorasi lebih lanjut untuk mengetahui berbagai karakteristiknya dengan data deret waktu yang lebih panjang.
112
BAB VI 6.
Simpulan dan Saran
6.1. Simpulan Nilai tengah pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Prediksi tak-bias linear terbaik (PTLT) dilakukan dengan cara meminimumkan fungsi kuadrat tengah galat (KTG), sehingga penduga bagi PTLT memiliki KTG yang paling kecil di antara semua penduga tidak bias linear. Metode kemungkinan maksimum terkendala (restricted maximum likelihood) dapat digunakan untuk menduga komponen ragam atau koragam. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh penduga dua tahap sebagai PTLT empirik atau PTLTE. Penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai akar kuadrat tengah galatnya (AKTG) lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Sementara pada data deret waktu Susenas, AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE penampang melintang. Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai akar kuadrat tengah galat relatif (AKTGR) metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE penampang melintang pada waktu T dan korelasi diri
yang sama-sama besar. Artinya, pengaruh
pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Metode PTLT pada pendugaan area kecil memerlukan banyak kondisi tertentu yang harus dipenuhi, di antaranya adalah pengasumsian bahwa parameter
113
peubah tetap dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataanya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode kemungkinan maksimum terbatas yang memerlukan berbagai kondisi tertentu. Penerapan pada data deret waktu Susenas, diketahui bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Berdasarkan kajian analitik pada model pendugaan area kecil yang memasukkan pengaruh acak area dan waktu, penduga PTLT yang berbasis pada metode kemungkinan maksimum terbatas dan penduga Bayes berhirarki samasama bersifat tidak bias. Namun, resiko atau KTG yang dihasilkan penduga Bayes lebih kecil daripada penduga PTLT, artinya dalam hal ini penduga Bayes lebih baik daripada penduga PTLT.
6.2. Saran Sebagaimana lesson learned pada Bab V, masih diperlukan penelitian lanjutan untuk beberapa hal yang belum tercakup dalam disertasi ini, yaitu: a.
Model SAE yang mencakup peubah respon kontinu dan peubah respon diskret.
b.
Model SAE yang tidak hanya memasukkan pengaruh acak area dan waktu, tetapi juga memasukkan pengaruh spasial. Pengaruh waktu terkait dengan korelasi diri yang diakibatkan oleh keragaman antar waktu, sedangkan pengaruh spasial terkait dengan korelasi antar area kecil berdasarkan karakteristik spasialnya.
c.
Data deret waktu Susenas yang digunakan lebih panjang, misalnya 710 tahun, agar karakteristiknya dapat diketahui lebih jauh. Di samping
114
itu, perlu pula kajian penerapan metode SAE ini pada data selain Susenas, seperti data pertanian, pertambangan, industri, cuaca, iklim, dan sebagainya.
115
7.
Daftar Pustaka
BPS. 2005. Kumpulan Metodologi Survei Sosial Tahun 2003-2005. Badan Pusat Statistik (BPS) Jakarta. Breslow, N.E. dan Clayton, D.G. (1993). Approximation inference in generalized linear mixed models. Journal of the American Statistical Association 88, 925. Breslow, N.E. dan Lin, X. (1995). Bias correction in generalized linear mixed models with a single component of dispersion. Biometrika 82, 81-92. Casella, G., Fienberg, S., dan Olkin, I. (2000). Time Series Analysis and Its Applications. Springer-Verlag, New York. Chambers, R., dan Chandra, H. (2006). Multipurpose Small Area Estimation. Southampton Statistical Sciences Research Institute, Methodology Working Paper M06/06. Chambers, R., Tzavidis, N. (2006). M-quantile Models for Small Area Estimation. Biometrika, 92, 255-268. Chand, N. dan Alexander, C.H. (1995). Using Administrative Records for Small Area Estimation in the American Community Survey. US Bureau of the census. Choudhry, G.H., dan Rao, J.N.K. (1989). Small Area Estimation Using Models that Combine Time Series and Cross-Sectional Data. Proceedings of the Statistics Canada Symposium on Analysis of Data in Time, Ottawa: Statistics Canada, 67-74. Cochran, W.G. (1977). Sampling Techniques, 3rd ed., New York: Wiley. Datta G.S., Maiti, T. dan Lu, K.L , (1999). Hierarchical Bayes estimation of unemployment artes for the States of the U.S. Journal of The American Statistical Association 94, 1074-1082. Datta, G,S. dan Lahiri, P. (1995). Robust hierarchical Bayes estimation of small area characteristics in the presence of covariates and outliers. Journal of Multivariate Analysis 54, 310-328. Datta, G.S. dan Ghosh, M. (1991). Bayesain prediction in linear models: application to small area estimation. The Annals of Statistics 19, 17481770. Datta, G.S. dan Ghosh, M., Nangia, N. dan Natarajan, K. (1996). Estimation of median income of four-person families: a Bayesian approach. In: Berry, D.A., Chaloner, K.M., Geweke, J.K (Eds), Bayesian Analysis in Statistics and econometrics. Wiley, New York. pp. 129-140.
116
Datta. G.S., Day, B. dan Basawa, I. (1999). Empirical best linear unbiased and empirical Bayes prediction in multivariate small area estimation. Journal of Statistical Planning and Inference 75, 269-279. Deely, J.J and Lindley, D.V. (1991). Empirical Bayes. Journal of the American Statistical Association 76, 833-841. Durbin, J. (2004). State Space and Unobserved Component Models. Cambridge University Press (www.cambridge.org). Farrell, P.J., Mac Gibbon, B. dan Tomberlin, T.J. (1997). Empirical Bayes smallarea estimation using logistic regression models and summery statistics. Journal of Business & Economic Statistics 15, 101-103. Fay, R E. dan Herriot, R.A. (1979). Estimates of income for small places1 an application of James-Stein procedures to census data. Journal of the American Statistical Association 74, 269- 277. Gelfand, A.E., dan Smith, A.F.M. (1990). Sample-based Approaches to Calculating Marginal Densities. Journal of the American Statistical Association, 85, 972-985. Ghosh, M. dan Lahiri, P. (1987). Robust Empirical Bayes Estimation of Means from Stratified Samples. Journal of the American Statistical Association 82, 1153-1162. Ghosh, M. dan Rao, J.N.K. (1994). Small area estimation: an appraisal. Statistical Sciences 9, 55-93. Ghosh, M., Nangia, N and Kim, D.H. (1996). Estimation of median income of four-person families: a Bayesian time series approach. Journal of the American Statistical Association 91, 1423-1431. Ghosh, M., Natarajan, K., Stroud, T.W.F and Carlin, B.P (1998). Generalized linear models for small-area estimation. Journal of the American Statistical Association 93, 273-282. Graybill, F.A. (1969). Introduction to Matrices with Applications in Statistics. Belmont, CA: Wadsworth. Harville, D.A. (1977). Maximum likelihood approaches to variance component estimation and to related problems. Journal of the American Statistical Association 72, 320-340. Harville, D.A. (1990). That BLUP is a good thing: the estimation of random effects. Statistical Science. 6, 15-51. Henderson, C.R (1949). Estimation of changes in herd environment (Abstract). J. Dairy Sci.32:706. Holt, D., Smith, T.M.F. dan Tomberlin. (1979). A model-based approach to estimation for small subgroups of a population. Journal of the American Statistical Association, 74, 405-410. Jiang, J., Lahiri, P., dan Wan, S.M. (2002). A Unified Jackknife Theory. Annals of Statistics, 30, 260-276.
117
Kackar, R.N., dan Harville, D.A. (1984). Approximations for Standard Errors of Estimators of Fixed and Random Effects in Mixed Linear Models. Journal of the American Statistical Association, 79, 853-862. Kass, R.E. dan Steffey, D. (1989). Approximate Bayesian inference in conditionally independent hierarchical models (parametric empirical Bayes models). Journal of the American Statistical Association 84, 717-726. Lahiri, P. (2008). Advanced Topics in Survey Methodology: Small Area Estimation. Catatan Kuliah di Joint Program in Survey Methodology, University of Maryland, USA. Lahiri, P., dan Rao, J.N.K. (1995). Robust Estimation of Mean Squared Error of Small Area Estimators. Journal of the American Statistical Association, 82, 758-766. Larid, N,M. dan Louis, T.A. (1987). Empirical Bayes confidence intervals based on bootstrap samples. Journal of the American Statistical Association 82, 739-750. Levy, P.S. (1971). The use of mortality data in evaluating synthetic estimates. Proceedings of the American Statistical Association 328-331. Levy, P.S. dan Lemeshow, S. 1999. Sampling of Populations, Methods and Applications. John Wiley and Sons, Inc., New York. MacGibbon, B. dan Tomberlin, T.J. (1989). Small area estimates of proportions via empirical Bayes techniques. Survey Methodology 15, 237-252. Maiti, T. (1998). Hierarchical Bayes estimation of mortality rates for disease mapping. Journal Statistical Planning and Inference 69, 339-348. Malec, D., Davis, W.W. dan Cao, X. (1999). Model-based small area estimates of overweight prevalence using sample selection adjusment. Statistics in Medicine 18, 3189-3200. Malec, D., Sedransk, J. Moriarity, C.L. dan Leclere, F.B. (1997). Small area inference for binary variables in the National Helath Interview Survey. Journal of the American Statistical Association 92, 815-826. Marker, D. (1999). Organization of small area estimators using generalized linear regression framework. Journal of Official Statistics, 15, 1-24. McCulloch, C.E. (1994). Maximum likelihood variance components estimation for binary data. Journal of the American Statistical Association 89, 330-335. McCulloch, C.E. (1997). Maximum likelihood algorithms for generalized linear mixed models. Journal of the American Statistical Association 92, 162-170. McGilchrist, C.A. dan Aisbett, C.W. (1991). Restricted BLUP for mixed linear models. Biometrical Journal, 33, 131-141. Morris, C.N. (1994). Parametric empirical Bayes inferences theory and applications. Journal of the American Statistical Association 78, 47-65.
118
Moura, F.A.S. dan Mignon, H.S. (2001). Bayesian models for small area proportions. Working Paper 140, Universidade Federal do Rio De Janeiro, Instituto De Matematica, Departmento de Metodos Estatisticos. Pfeffermann, D. (1999). Small area estimation – big developments. Keynote Paper, Conference on Small Area Statistics, Riga, Latvia, August 1999. Pfeffermann, D. (2002). Small Area Estimation – New Developments and Directions. International Statistical Review, 70, 125-143. Prasad, N.G.N and Rao, J.N.K. (1990). The estimation of the mean squared error of small-area estimators. Journal of the American Statistical Association, 85, 163-171. Purcell, N.J. dan Kish, I. (1980). Postcensal estimates for local areas (domains). International Statistical Review, 48, 3-18. Rao, J.N.K. (1999). Some recent advances in model-based small area estimation. Survey Methodology, 25, 175-186. Rao, J.N.K. (2003). Small Area Estimation. New York : John Wiley and Sons. Rao, J.N.K. dan Yu, M. (1992). Small area estimation combining time series and cross-sectional data. Proceeding Survey Research Methods Section, Americal Statistical Association, 1-9. Rao, J.N.K., dan Yu, M. (1994). Small Area Estimation by Combining Time Series and Cross-Sectional Data. Proceedings of the Section on Survey Research Method. American Statistical Association. Robinson, G.K. (1991). That BLUP is a good thing: the estimation of random effects. Statistical Sciences, 6, 15-51. Russo, C., M. Sabbatini dan R. Salvatore, (2005), ”General Linear Models in Small Area Estimation : an assessment in agricultural surveys”, Paper presented in The Mexsai Conference <www.siap.sagarpa.gob.mx/ mexsai/trabajos/t44.pdf>, [29 April 2005] Sadik, K. 2008. Hierarchical Bayes Approach in Small Area Estimation. Makalah Seminar Reguler di Joint Program in Survey Methodology, University of Maryland, USA. Oktober, 2008. Sadik, K. dan Notodiputro, K.A. 2006. Pendekatan P-Spline M-Quantile dalam Pendugaan Area Kecil (Small Area Estimation). Jurnal Matematika Aplikasi dan Pembelajaran, Vol. 5 No.2 Jilid 1, p:142-147, Universitas Negeri Jakarta, Jakarta. Sadik, K. dan Notodiputro, K.A. 2006. Small Area Estimation with Time and Area Effects Using Two Stage Estimation. Proceeding at the First International Conference on Mathematics and Statistics, MSMSSEA, 19-21 June 2006, Bandung. Sadik, K. dan Notodiputro, K.A. 2007. A State Space Model in Small Area Estimation. The 9th Islamic Countries Conference on Statistical Sciences 2007 (ICCS-IX), Kuala Lumpur: 12-14 December 2007.
119
Sadik, K. dan Notodiputro, K.A. 2007. Model State Space pada GLMM untuk Pendugaan Area Kecil (Small Area Estimation). Prosiding pada Seminar Nasional Statistika: 24 Mei 2007, Unisba – Bandung. Sadik, K. dan Notodiputro, K.A. 2009. Hierarchical Bayes Estimation Using Time Series and Cross-sectional Data : A Case of Per-capita Expenditure in Indonesia. Conference of Small Area Estimation, 29 Juni – 01 Juli 2009, Elche, Spanyol. Sadik, K., Notodiputro, K.A., Susetyo, B., Mangku, I.W. 2006. Pendugaan Area Kecil (Small Area Estimation) Berdasarkan Model yang Mengandung Langkah Acak (Random Walk). Prosiding Seminar Nasional Matematika dan Konferda IndoMS wilayah Jabar & Banten, 22 April 2006, Jurusan Matematika UNPAD, Bandung. Sadik, K., Notodiputro, K.A., Susetyo, B., Mangku, I.W. 2008. Small Area Estimation With Time and Area Effects Using A Dynamic Linear Model. The 3rd International Conference on Mathematics and Statistics (ICoMS-3). Institut Pertanian Bogor, Indonesia, 5-6 August 2008. Sarndal, C.E. (1984). Design-consistent versus model-dependent estimation for small domains. Journal of the American Statistical Association 79, 624631. Schaible, W.L., Brock, D.B. dan Schank, G.A. (1977). An emperical comparison of simple inflation, syntetic and composite estimators for small area statistics. Proceeding of the American Statistical Association 1017-1021. Schall, R. (1991). Estimation in generalized linear models with random effects. Biometrika 78, 719-727. Som, Ranjan Kumar. 1996. Practical Sampling Techniques, 2nd. Marcel Dekker, Inc., New York. Swenson, B., dan Wretman., J.H. (1989). The Weighted Regression Technique foe Estimating the Variance of Generalized Regression Estimator. Biometrika, 76, 527-537. Thompson, M.E. (1997). Theory of Sample Surveys. London: Chapman and Hall. Wei, W.W.S. (1994). Time Series Analysis, Univariate and Multivariate Methods. Addison-Wesley Publishing Company, Canada. You, Y. dan Rao, J.N.K. (2000). Hierarchical Bayes estimation of small area means using multi-level models. Survey Methodology, 26, 173-181. Zeger, S.L. dan Karim, M.R. (1991). Generalized linear models with random effect; A Gibbs sampling approach. Journal of the American Statistical Association, 86, 79-86. Zhang, D., dan Davidian, M. (2001). Linear Mixed Model with Flexible Distributions of Random Effects for Longitudinal Data. Biometrics, 57, 795802. Zivot, E. (2006). State Space Models and the Kalman Filter. Cambridge University Press (www.cambridge.org).
120
8.
No
Daftar Istilah dan Singkatan
Bahasa Indonesia
Bahasa Inggris
1 Akar kuadrat tengah galat (AKTG)
Root of mean square of error (RMSE)
2 Akar kuadrat tengah galat relatif (AKGTR)
Relative root of mean square of error (RRMSE)
3 Bias relatif mutlak (BRM)
Absolute relative biases (ARB)
4 Data deret waktu
Time series data
5 Data penampang melintang
Cross-sectional data
6 Kemungkinan maksimum terkendala (KMT)
Restricted maximum likelihood (REML)
7 Kuadrat tengah galat (KTG)
Mean square of error (MSE)
8 Model campuran linear terampat (MCLT)
Generalized linear mixed model (GLMM)
9 Prediksi tak-bias linear terbaik (PTLT)
Best linear unbiased prediction (BLUP)
10 Prediksi tak-bias linear terbaik empirik (PTLTE)
Empirical best linear unbiased prediction (EBLUP)
121
LAMPIRAN
Lampiran 1. Program R untuk Bayes Berhirarki Model 1 ####################################################### ######### Hierarchical Bayes Model 1 ######### ####################################################### date() thetahat = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/theta_kota.txt", header = TRUE) psi = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/psi_kota.txt", header = TRUE) x1 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x1_kota.txt", header = TRUE) x2 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x2_kota.txt", header = TRUE) x3 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x3_kota.txt", header = TRUE) x4 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x4_kota.txt", header = TRUE) x5 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x5_kota.txt", header = TRUE)
thetahat=as.matrix(thetahat) psi=as.matrix(psi) x1=as.matrix(x1) x2=as.matrix(x2) x3=as.matrix(x3) x4=as.matrix(x4) x5=as.matrix(x5) m = nrow(thetahat) T = ncol(thetahat)-1
### no of small area
k = 6
### no of covariates
####### studying the relationship between thetahat and the covariates ###### library(Design) ks.reg = ols(thetahat[,2] ~ x1[,2] + x2[,2] + x3[,2] + x4[,2] + x5[,2]) ks.coeff = ks.reg$coeff ks.coeff ks.var = ks.reg$var ks.var ### initial value set up for all Chains k = 6 # number of regression coefficients ks.coeff = as.vector(ks.coeff)
123
ks.se = as.vector(sqrt(diag(ks.var))) beta.initi = matrix(0, nrow = k, ncol = 3) # ncol is the number of chains for(i in 1:k) { beta.initi[i,] = rnorm(3, ks.coeff[i], ks.se[i]) }
u = matrix(0, nrow = m, ncol = T+1) for(i in 1:m) { for(j in 1:T+1) { u[i,j] = rnorm(1,0,1) } }
########################################### ####The hierarchical Bayes ################
library(BRugs) dataKT1 = list("m","T","x1","x2","x3","x4","x5","u","thetahat","psi")
inits1 = list(beta = beta.initi[,1], thau = 1.0, sigma = 1.7, v = rnorm(m, 0, 0.50)) inits2 = list(beta = beta.initi[,2], thau = 1.5, sigma = 1.5, v = rnorm(m, 0, 0.75)) inits3 = list(beta = beta.initi[,3], thau = 2.0, sigma = 1.0, v = rnorm(m, 0, 1.00)) initmodelKT1 = list(inits1, inits2, inits3)
basemodelKT1 = function() { for (i in 1:m) { v[i] ~ dnorm(0, thau.inv) for(j in 2:T+1) { thetahat[i,j] ~ dnorm(theta[i,j], psi.inv[i,j]) psi.inv[i,j] <- 1/psi[i,j] theta[i,j] <- beta[1]+beta[2]*x1[i,j]+beta[3]*x2[i,j]+ beta[4]*x3[i,j]+beta[5]*x4[i,j]+beta[6]*x5[i,j]+v[i]+u[i,j] u[i,j] ~ dnorm(u[i,j-1],sigma.inv) } } thau.inv <- 1/thau sigma.inv <- 1/sigma beta[1] ~ dflat() beta[2] ~ dflat() beta[3] ~ dflat() beta[4] ~ dflat() beta[5] ~ dflat()
124
beta[6] ~ dflat() thau ~ dgamma(1,3) sigma ~ dgamma(1,5) } writeModel(basemodelKT1, con = "modelKT1.txt") file
### OpenBUGS model
output.KT1 = BRugsFit(modelFile = "modelKT1.txt", data = dataKT1,inits = initmodelKT1, numChains = 3, para = c("theta","beta","thau","sigma"), nBurnin = 1000, nIter = 10000,nThin=4) resultKT1 = round(samplesStats("thau"),3) pdf(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/ResultsKOTA.Thaupos.pdf") par(mfrow = c(2,2))
plotDensity("thau", main = "posterior of thau given Gamma(1,3)") outputKT1=samplesStats(node=c("theta","beta","thau","sigma"))
par.interest = rownames(outputKT1) summary.statistics = colnames(outputKT1) summary.statistics post.mean = outputKT1$mean post.median = outputKT1$median post.sd = outputKT1$sd mcerror=outputKT1$MC_error l2.5pct = outputKT1$val2.5pc u97.5pct = outputKT1$val97.5pc length.ci = u97.5pct - l2.5pct
#### Fitted values and relevant statistics #####
thetadirect = matrix(0, m*T, 1) for(i in 1:m) { for(j in 2:(T+1)) { thetadirect[((j-1)+(i-1)*T),1] = thetahat[i,j] } } predKT1 = data.frame(par.interest[1:(m*T)],thetadirect[1:(m*T)],post.mean[1: (m*T)], post.median[1:(m*T)], post.sd[1:(m*T)],l2.5pct[1:(m*T)],u97.5pct[1:(m*T)],mcerror[1:(m*T )]) colnames(predKT1) = c("Parameter","Direct","Posterior Mean", "Posterior Median","Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error")
125
write.table(predKT1, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKT1.csv", sep = ",", col.names = NA)
#### Estimation of the Fixed Effects (beta) #### est.fixed = data.frame(par.interest[(m*T+1):(m*T+k)], post.mean[(m*T+1):(m*T+k)],post.median[(m*T+1):(m*T+k)], post.sd[(m*T+1):(m*T+k)],l2.5pct[(m*T+1):(m*T+k)],u97.5pct[(m*T+1) :(m*T+k)],mcerror[(m*T+1):(m*T+k)]) colnames(est.fixed) = c("Fixed Effect", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.fixed, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKT1.csv", append = TRUE, sep = ",", col.names = NA)
#### Estimation of the variance components #### est.varcomp = data.frame(par.interest[(m*T+k+1):(m*T+k+2)],post.mean[(m*T+k+1):( m*T+k+2)],post.median[(m*T+k+1):(m*T+k+2)], post.sd[(m*T+k+1):(m*T+k+2)],l2.5pct[(m*T+k+1):(m*T+k+2)],u97.5pct [(m*T+k+1):(m*T+k+2)],mcerror[(m*T+k+1):(m*T+k+2)]) colnames(est.varcomp) = c("Variance Component", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.varcomp, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKT1.csv", append = TRUE, sep = ",", col.names = NA)
#### Deviance Information Criteria (DIC) #### DIC=output.KT1$DIC ks.KT1.DIC = data.frame(DIC) write.table(ks.KT1.DIC, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/DIC.ModelKT1.csv", sep = ",", col.names = NA) par.interest.DIC = rownames(ks.KT1.DIC) summary.stat.DIC = colnames(ks.KT1.DIC) summary.stat.DIC
dev.off() #### Model checking ##### pdf(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/modelKOTA.check.pdf") par(mfrow = c(3,1))
### The time series trace plots for the chain for each of the parameters specified. plotHistory(node = "beta[2]")
126
plotHistory(node plotHistory(node plotHistory(node plotHistory(node
= = = =
"beta[3]") "thau") "theta[1,3]") "theta[5,4]")
### A density plot(if continuous, else histogram plot) of the marginal posterior distribution plotDensity(node plotDensity(node plotDensity(node plotDensity(node plotDensity(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
### Autocorrelation function (ACF) of parameters of interest;
plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
### The BGR convergence statistic(Brooks and Gelman 1998).
plotBgr(node plotBgr(node plotBgr(node plotBgr(node plotBgr(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
dev.off() thetahat[,2:6] x1[,2:6] x2[,2:6] x3[,2:6] x4[,2:6] x5[,2:6] par.interest post.mean post.sd est.fixed est.varcomp plotDensity(node = "beta[2]") plotDensity(node = "thau")
127
Lampiran 2. Program R untuk Hierarchical Bayes Model 2 ####################################################### ######### Hierarchical Bayes Model 2 ######### ####################################################### date() thetahat = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/theta_kota.txt", header = TRUE) psi = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/psi_kota.txt", header = TRUE) s2 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/S2_kota.txt", header = TRUE) n = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/ns_kota.txt", header = TRUE) Np = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/np_kota.txt", header = TRUE) x1 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x1_kota.txt", header = TRUE) x2 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x2_kota.txt", header = TRUE) x3 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x3_kota.txt", header = TRUE) x4 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x4_kota.txt", header = TRUE) x5 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x5_kota.txt", header = TRUE)
thetahat=as.matrix(thetahat) psi =as.matrix(psi) s2 =as.matrix(s2) n =as.matrix(n) ### no sample household Np =as.matrix(Np) ### no household total x1=as.matrix(x1) x2=as.matrix(x2) x3=as.matrix(x3) x4=as.matrix(x4) x5=as.matrix(x5) m = nrow(thetahat) T = ncol(thetahat)-1
### no of small area
k = 6
### no of covariates
128
####### studying the relationship between thetahat and the covariates ###### library(Design) ks.reg = ols(thetahat[,2] ~ x1[,2] + x2[,2] + x3[,2] + x4[,2] + x5[,2]) ks.coeff = ks.reg$coeff ks.coeff ks.var = ks.reg$var ks.var ### initial value set up for all Chains k = 6 # number of regression coefficients ks.coeff = as.vector(ks.coeff) ks.se = as.vector(sqrt(diag(ks.var))) beta.initi = matrix(0, nrow = k, ncol = 3) # ncol is the number of chains for(i in 1:k) { beta.initi[i,] = rnorm(3, ks.coeff[i], ks.se[i]) }
u = matrix(0, nrow = m, ncol = T+1) for(i in 1:m) { for(j in 1:T+1) { u[i,j] = rnorm(1,0,1) } } sigma = matrix(0, nrow = m, ncol = T+1) for(i in 1:m) { for(j in 1:T+1) { sigma[i,j] = rgamma(1,1,5) } } ########################################### ####The hierarchical Bayes ################
library(BRugs) dataKOTA2 = list("m","T","x1","x2","x3","x4","x5","u","sigma","thetahat","n"," Np","s2")
inits1 = 1.2, inits2 = 1.3, inits3 = 1.4,
= list(beta mu = 2.5, v = list(beta mu = 2.3, v = list(beta mu = 2.1, v
= = = = = =
beta.initi[,1], thau = 1.0, phi = 1.7, delta rnorm(m, 0, 0.50)) beta.initi[,2], thau = 1.5, phi = 1.5, delta rnorm(m, 0, 0.75)) beta.initi[,3], thau = 2.0, phi = 1.0, delta rnorm(m, 0, 1.00))
129
initmodelKOTA2 = list(inits1, inits2, inits3)
basemodelKOTA2 = function() { for (i in 1:m) { v[i] ~ dnorm(0, thau.inv) for(j in 2:T+1) { thetahat[i,j] ~ dnorm(theta[i,j], K.inv[i,j]) K[i,j] <- (1-(n[i,j]/Np[i,j]))*(s2[i,j])/n[i,j] K.inv[i,j] <- 1/K[i,j] s2[i,j] ~ dchisqr(df[i,j]) df[i,j] <- n[i,j]-1 theta[i,j] <- beta[1]+beta[2]*x1[i,j]+beta[3]*x2[i,j]+ beta[4]*x3[i,j]+beta[5]*x4[i,j]+beta[6]*x5[i,j]+v[i]+u[i,j] u[i,j] ~ dnorm(u[i,j-1],phi.inv) sigma[i,j] ~ dlnorm(mu,delta.inv) } } thau.inv <- 1/thau phi.inv <- 1/phi delta.inv <- 1/delta beta[1] ~ dflat() beta[2] ~ dflat() beta[3] ~ dflat() beta[4] ~ dflat() beta[5] ~ dflat() beta[6] ~ dflat() mu ~ dunif(1,5) thau ~ dgamma(1,3) phi ~ dgamma(1,5) delta ~ dgamma(1,7) }
writeModel(basemodelKOTA2, con = "modelKOTA2.txt") model file
### OpenBUGS
output.KOTA2 = BRugsFit(modelFile = "modelKOTA2.txt", data = dataKOTA2,inits = initmodelKOTA2, numChains = 3, para = c("theta","beta","thau","phi"), nBurnin = 1000, nIter = 10000,nThin=4) resultKOTA2 = round(samplesStats("thau"),3) pdf(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/ResultsKOTA.Thaupos.pdf") par(mfrow = c(2,2))
plotDensity("thau", main = "posterior of thau given Gamma(1,3)") outputKOTA2=samplesStats(node=c("theta","beta","thau","phi"))
130
par.interest = rownames(outputKOTA2) summary.statistics = colnames(outputKOTA2) summary.statistics post.mean = outputKOTA2$mean post.median = outputKOTA2$median post.sd = outputKOTA2$sd mcerror=outputKOTA2$MC_error l2.5pct = outputKOTA2$val2.5pc u97.5pct = outputKOTA2$val97.5pc length.ci = u97.5pct - l2.5pct
#### Fitted values and relevant statistics #####
thetadirect = matrix(0, m*T, 1) for(i in 1:m) { for(j in 2:(T+1)) { thetadirect[((j-1)+(i-1)*T),1] = thetahat[i,j] } }
predKOTA2 = data.frame(par.interest[1:(m*T)],thetadirect[1:(m*T)],post.mean[1: (m*T)], post.median[1:(m*T)], post.sd[1:(m*T)],l2.5pct[1:(m*T)],u97.5pct[1:(m*T)],mcerror[1:(m*T )]) colnames(predKOTA2) = c("Parameter","Direct","Posterior Mean", "Posterior Median","Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(predKOTA2, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKOTA2.csv", sep = ",", col.names = NA)
#### Estimation of the Fixed Effects (beta) #### est.fixed = data.frame(par.interest[(m*T+1):(m*T+k)], post.mean[(m*T+1):(m*T+k)],post.median[(m*T+1):(m*T+k)], post.sd[(m*T+1):(m*T+k)],l2.5pct[(m*T+1):(m*T+k)],u97.5pct[(m*T+1) :(m*T+k)],mcerror[(m*T+1):(m*T+k)]) colnames(est.fixed) = c("Fixed Effect", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.fixed, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKOTA2.csv", append = TRUE, sep = ",", col.names = NA)
#### Estimation of the variance components #### est.varcomp = data.frame(par.interest[(m*T+k+1):(m*T+k+2)],post.mean[(m*T+k+1):(
131
m*T+k+2)],post.median[(m*T+k+1):(m*T+k+2)], post.sd[(m*T+k+1):(m*T+k+2)],l2.5pct[(m*T+k+1):(m*T+k+2)],u97.5pct [(m*T+k+1):(m*T+k+2)],mcerror[(m*T+k+1):(m*T+k+2)]) colnames(est.varcomp) = c("Variance Component", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.varcomp, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKOTA2.csv", append = TRUE, sep = ",", col.names = NA)
#### Deviance Information Criteria (DIC) #### DIC=output.KOTA2$DIC ks.KOTA2.DIC = data.frame(DIC) write.table(ks.KOTA2.DIC, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/DIC.ModelKOTA2.csv", sep = ",", col.names = NA) par.interest.DIC = rownames(ks.KOTA2.DIC) summary.stat.DIC = colnames(ks.KOTA2.DIC) summary.stat.DIC
dev.off() #### Model checking ##### pdf(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/modelKOTA.check.pdf") par(mfrow = c(3,1))
### The time series trace plots for the chain for each of the parameters specified. plotHistory(node plotHistory(node plotHistory(node plotHistory(node plotHistory(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
### A density plot(if continuous, else histogram plot) of the marginal posterior distribution plotDensity(node plotDensity(node plotDensity(node plotDensity(node plotDensity(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
### Autocorrelation function (ACF) of parameters of interest;
plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node
= = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]")
132
plotAutoC(node = "theta[5,4]") ### The BGR convergence statistic(Brooks and Gelman 1998).
plotBgr(node plotBgr(node plotBgr(node plotBgr(node plotBgr(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
dev.off()
133
Lampiran 3. Program R untuk Simulasi Data ####################################################### ######### Simulation : Time Series Effect ######### ###################################################### T=5 m=10
# time # area
theta thetahat x1 x2 x3 x4 x5 e u v epsilon psi inv.psi
= = = = = = = = = = = = =
matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0,
beta0 beta1 beta2 beta3 beta4 beta5
= 1.5 = 8.0 = -0.4 = 2.1 = -0.1 = 1.6
nrow nrow nrow nrow nrow nrow nrow nrow nrow nrow nrow nrow nrow
= = = = = = = = = = = = =
m, m, m, m, m, m, m, m, m, m, m, m, m,
ncol ncol ncol ncol ncol ncol ncol ncol ncol ncol ncol ncol ncol
= = = = = = = = = = = = =
T+1) T+1) T+1) T+1) T+1) T+1) T+1) T+1) T+1) 1) T+1) T+1) T+1)
for(i in 1:m) { v[i,] = rnorm(1,0,3.5) for(j in 1:T+1) { inv.psi[i,j] = rgamma(1,5,10) psi[i,j] = 1/inv.psi[i,j] # sampling variance x1[i,j] = runif(1,1,3) x2[i,j] = runif(1,1,5) x3[i,j] = runif(1,1,7) x4[i,j] = runif(1,2,5) x5[i,j] = runif(1,2,7) e[i,j] = rnorm(1,0,sqrt(psi[i,j])) epsilon[i,j] = rnorm(1,0,1.5) u[i,j] = u[i,j-1] + epsilon[i,j] theta[i,j] = (beta0 + beta1*x1[i,j] + beta2*x2[i,j] + beta3*x3[i,j] + beta4*x4[i,j] + beta5*x5[i,j]) + v[i,] + u[i,j] thetahat[i,j]= theta[i,j] + e[i,j] } } theta psi x1
134
####### studying the relationship between thetahat and the covariates ###### library(Design) ks.reg = ols(thetahat[,2] ~ x1[,2] + x2[,2] + x3[,2] + x4[,2] + x5[,2]) ks.coeff = ks.reg$coeff ks.coeff ks.var = ks.reg$var ks.var ### initial value set up for all Chains k = 6 # number of regression coefficients ks.coeff = as.vector(ks.coeff) ks.se = as.vector(sqrt(diag(ks.var))) beta.initi = matrix(0, nrow = k, ncol = 3) # ncol is the number of chains for(i in 1:k) { beta.initi[i,] = rnorm(3, ks.coeff[i], ks.se[i]) }
########################################### ####The hierarchical Bayes ################
library(BRugs) dataKS1 = list("m","T","x1","x2","x3","x4","x5","u","thetahat","psi")
inits1 = list(beta = beta.initi[,1], thau = 1.0, sigma = 1.7, v = rnorm(m, 0, 0.50)) inits2 = list(beta = beta.initi[,2], thau = 1.5, sigma = 1.5, v = rnorm(m, 0, 0.75)) inits3 = list(beta = beta.initi[,3], thau = 2.0, sigma = 1.0, v = rnorm(m, 0, 1.00)) initmodelKS1 = list(inits1, inits2, inits3)
basemodelKS1 = function() { for (i in 1:m) { v[i] ~ dnorm(0, thau.inv) for(j in 2:T+1) { thetahat[i,j] ~ dnorm(theta[i,j], psi.inv[i,j]) psi.inv[i,j] <- 1/psi[i,j] theta[i,j] <- beta[1]+beta[2]*x1[i,j]+beta[3]*x2[i,j]+ beta[4]*x3[i,j]+beta[5]*x4[i,j]+beta[6]*x5[i,j]+v[i]+u[i,j] u[i,j] ~ dnorm(u[i,j-1],sigma.inv) } }
135
thau.inv <- 1/thau sigma.inv <- 1/sigma beta[1] ~ dflat() beta[2] ~ dflat() beta[3] ~ dflat() beta[4] ~ dflat() beta[5] ~ dflat() beta[6] ~ dflat() thau ~ dgamma(1,3) sigma ~ dgamma(1,5) } writeModel(basemodelKS1, con = "modelKS1.txt") file
### OpenBUGS model
output.KS1 = BRugsFit(modelFile = "modelKS1.txt", data = dataKS1,inits = initmodelKS1, numChains = 3, para = c("theta","beta","thau","sigma"), nBurnin = 1000, nIter = 10000,nThin=4) resultKS1 = round(samplesStats("thau"),3) pdf(file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/ResultsKS.Thaupos.pdf") par(mfrow = c(2,2))
plotDensity("thau", main = "posterior of thau given Gamma(1,3)") outputKS1=samplesStats(node=c("theta","beta","thau","sigma"))
par.interest = rownames(outputKS1) summary.statistics = colnames(outputKS1) summary.statistics post.mean = outputKS1$mean post.median = outputKS1$median post.sd = outputKS1$sd mcerror=outputKS1$MC_error l2.5pct = outputKS1$val2.5pc u97.5pct = outputKS1$val97.5pc length.ci = u97.5pct - l2.5pct
#### Fitted values and relevant statistics #####
thetadirect = matrix(0, m*T, 1) for(i in 1:m) { for(j in 2:(T+1)) { thetadirect[((j-1)+(i-1)*T),1] = thetahat[i,j] } }
136
predKS1 = data.frame(par.interest[1:(m*T)],thetadirect[1:(m*T)],post.mean[1: (m*T)], post.median[1:(m*T)], post.sd[1:(m*T)],l2.5pct[1:(m*T)],u97.5pct[1:(m*T)],mcerror[1:(m*T )]) colnames(predKS1) = c("Parameter","Direct","Posterior Mean", "Posterior Median","Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(predKS1, file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/OutputmodelKS1.csv", sep = ",", col.names = NA)
#### Estimation of the Fixed Effects (beta) #### est.fixed = data.frame(par.interest[(m*T+1):(m*T+k)], post.mean[(m*T+1):(m*T+k)],post.median[(m*T+1):(m*T+k)], post.sd[(m*T+1):(m*T+k)],l2.5pct[(m*T+1):(m*T+k)],u97.5pct[(m*T+1) :(m*T+k)],mcerror[(m*T+1):(m*T+k)]) colnames(est.fixed) = c("Fixed Effect", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.fixed, file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/OutputmodelKS1.csv", append = TRUE, sep = ",", col.names = NA)
#### Estimation of the variance components #### est.varcomp = data.frame(par.interest[(m*T+k+1):(m*T+k+2)],post.mean[(m*T+k+1):( m*T+k+2)],post.median[(m*T+k+1):(m*T+k+2)], post.sd[(m*T+k+1):(m*T+k+2)],l2.5pct[(m*T+k+1):(m*T+k+2)],u97.5pct [(m*T+k+1):(m*T+k+2)],mcerror[(m*T+k+1):(m*T+k+2)]) colnames(est.varcomp) = c("Variance Component", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.varcomp, file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/OutputmodelKS1.csv", append = TRUE, sep = ",", col.names = NA)
#### Deviance Information Criteria (DIC) #### DIC=output.KS1$DIC ks.KS1.DIC = data.frame(DIC) write.table(ks.KS1.DIC, file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/DIC.ModelKS1.csv", sep = ",", col.names = NA) par.interest.DIC = rownames(ks.KS1.DIC) summary.stat.DIC = colnames(ks.KS1.DIC) summary.stat.DIC
dev.off()
137
#### Model checking ##### pdf(file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/modelKS.check.pdf") par(mfrow = c(3,1))
### The time series trace plots for the chain for each of the parameters specified. plotHistory(node plotHistory(node plotHistory(node plotHistory(node plotHistory(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
### A density plot(if continuous, else histogram plot) of the marginal posterior distribution plotDensity(node plotDensity(node plotDensity(node plotDensity(node plotDensity(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
### Autocorrelation function (ACF) of parameters of interest;
plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
### The BGR convergence statistic(Brooks and Gelman 1998).
plotBgr(node plotBgr(node plotBgr(node plotBgr(node plotBgr(node
= = = = =
"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")
dev.off()
138
Lampiran 4. Perbandingan Antara Metode Pendugaan Langsung dengan Metode Pendugaan Tidak Langsung untuk Rata-rata Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas 2005 Wilayah Kota Bogor No
Area Kecil Desa
Penduga Langsung
ˆ
KTG
Metode SAE - PTLTE
AKTG
ˆ PTLTE
KTG
AKTG
1 Mulyaharja
320.9
692.9
26.3
329.1
585.4
24.2
2 Pamoyanan
183.6
289.0
17.0
187.3
268.8
16.4
3 Ranggamekar
314.7
666.4
25.8
308.5
562.8
23.7
4 Genteng
207.8
300.4
17.3
212.0
276.5
16.6
5 Kertamaya
354.9
847.4
29.1
366.4
683.0
26.1
6 Bojongkerta
325.7
713.7
26.7
327.6
601.9
24.5
7 Harjasari
226.6
378.4
19.5
232.8
341.1
18.5
8 Muarasari
310.6
649.2
25.5
317.0
544.4
23.3
9 Cipaku
236.7
457.7
21.4
242.2
405.8
20.1
10 Batutulis
453.5
7590.9
87.1
403.6
2255.8
47.5
11 Empang
406.4
919.1
30.3
401.0
707.7
26.6
12 Cikaret
357.6
802.5
28.3
351.4
648.4
25.5
13 Sindangrasa
420.7
1319.5
36.3
368.1
997.3
31.6
14 Katulampa
178.1
285.7
16.9
181.5
265.4
16.3
15 Baranangsiang
310.8
1839.5
42.9
340.6
1169.2
34.2
16 Sukasari
303.6
3879.3
62.3
298.6
1652.0
40.6
17 Bantarjati
312.9
1864.8
43.2
342.5
1178.9
34.3
18 Tegalgundil
369.8
3493.8
59.1
413.0
1578.8
39.7
19 Tanahbaru
448.4
2257.6
47.5
427.3
1280.2
35.8
20 Cimahpar
254.1
704.4
26.5
265.7
579.2
24.1
21 Ciluar
370.7
1673.1
40.9
369.3
1054.4
32.5
22 Cibuluh
398.7
2381.8
48.8
398.9
1292.1
35.9
23 Kedunghalang
548.7
9680.5
98.4
390.5
2160.2
46.5
24 Ciparigi
248.7
865.1
29.4
266.3
686.8
26.2
25 Paledang
540.7
8203.6
90.6
414.9
2278.8
47.7
26 Gudang
432.6
5250.8
72.5
375.0
1902.3
43.6
27 Babakanpasar
365.4
5249.8
72.5
332.2
1822.9
42.7
28 Tegallega
307.0
1321.6
36.4
310.4
959.5
31.0
29 Babakan
357.9
3593.2
59.9
380.4
1575.5
39.7
30 Sempur
521.7
7635.8
87.4
440.8
2035.1
45.1
31 Cibogor
412.8
4780.4
69.1
375.3
1866.9
43.2
32 Kebonkelapa
724.3
6014.6
77.6
496.7
2232.4
47.2
139
No
Area Kecil Desa
Penduga Langsung
ˆ
KTG
Metode SAE - PTLTE
AKTG
ˆ PTLTE
KTG
AKTG
33 Pasirkuda
411.9
2777.5
52.7
415.2
1472.5
38.4
34 Pasirjaya
270.6
492.5
22.2
291.7
429.2
20.7
35 Gunungbatu
392.4
711.7
26.7
392.1
585.0
24.2
36 Loji
430.1
3028.1
55.0
408.2
1500.7
38.7
37 Menteng
364.4
1431.5
37.8
382.3
969.6
31.1
38 Cilendek Barat
393.1
713.4
26.7
389.6
591.3
24.3
39 Sindangbarang
753.8
14811.8
121.7
447.7
2420.3
49.2
40 Margajaya
387.4
2457.1
49.6
366.6
1359.4
36.9
41 Situgede
335.8
1022.6
32.0
329.1
794.5
28.2
42 Bubulak
289.2
1369.2
37.0
294.7
927.9
30.5
43 Curugmekar
423.2
2931.7
54.1
327.2
1665.7
40.8
44 Curug
417.2
2849.6
53.4
425.5
1446.1
38.0
45 Kedungwaringin
276.1
691.6
26.3
277.5
568.1
23.8
46 Kedungjaya
362.7
2296.0
47.9
406.9
1376.0
37.1
47 Kebonpedes
301.9
444.4
21.1
311.5
392.0
19.8
48 Tanahsareal
363.5
1511.9
38.9
365.6
994.4
31.5
49 Kedungbadak
537.9
4646.4
68.2
435.8
1688.7
41.1
50 Sukaresmi
356.8
1456.7
38.2
346.6
994.5
31.5
51 Cibadak
377.3
4421.2
66.5
349.1
1690.3
41.1
52 Kayumanis
299.9
1182.4
34.4
309.5
899.1
30.0
53 Mekarwangi
368.3
1552.6
39.4
375.8
1041.4
32.3
54 Kencana
242.7
833.3
28.9
231.7
695.8
26.4
Rataan
2597.0
45.4
1128.7
32.3
140
Lampiran 5. Perbandingan Antara Metode PTLTE Penampang Melintang dengan Metode PTLTE Deret Waktu untuk Data Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor
No
Area Kecil Desa
Metode SAE – PTLTE Penampang Melintang
ˆ PT PM
KTG
AKTG
Metode SAE – PTLTE Deret Waktu
ˆ PT DW
KTG
AKTG
1 Mulyaharja
329.1
585.4
24.2
332.8
515.3
22.7
2 Pamoyanan
187.3
268.8
16.4
188.1
252.9
15.9
3 Ranggamekar
308.5
562.8
23.7
309.3
500.5
22.4
4 Genteng
212.0
276.5
16.6
210.1
261.0
16.2
5 Kertamaya
366.4
683.0
26.1
364.5
596.5
24.4
6 Bojongkerta
327.6
601.9
24.5
337.3
528.5
23.0
7 Harjasari
232.8
341.1
18.5
230.0
318.1
17.8
8 Muarasari
317.0
544.4
23.3
319.9
489.7
22.1
9 Cipaku
242.2
405.8
20.1
241.0
372.5
19.3
10 Batutulis
403.6
2255.8
47.5
341.6
1606.7
40.1
11 Empang
401.0
707.7
26.6
393.0
627.7
25.1
12 Cikaret
351.4
648.4
25.5
355.6
574.5
24.0
13 Sindangrasa
368.1
997.3
31.6
340.9
811.4
28.5
14 Katulampa
181.5
265.4
16.3
179.7
250.1
15.8
15 Baranangsiang
340.6
1169.2
34.2
332.6
953.3
30.9
16 Sukasari
298.6
1652.0
40.6
296.9
1302.9
36.1
17 Bantarjati
342.5
1178.9
34.3
333.9
958.2
31.0
18 Tegalgundil
413.0
1578.8
39.7
390.0
1260.6
35.5
19 Tanahbaru
427.3
1280.2
35.8
401.4
1052.2
32.4
20 Cimahpar
265.7
579.2
24.1
263.0
520.1
22.8
21 Ciluar
369.3
1054.4
32.5
365.6
903.2
30.1
22 Cibuluh
398.9
1292.1
35.9
383.2
1074.6
32.8
23 Kedunghalang
390.5
2160.2
46.5
361.6
1629.0
40.4
24 Ciparigi
266.3
686.8
26.2
254.4
603.1
24.6
25 Paledang
414.9
2278.8
47.7
420.9
1641.1
40.5
26 Gudang
375.0
1902.3
43.6
331.7
1439.6
37.9
27 Babakanpasar
332.2
1822.9
42.7
311.6
1418.6
37.7
28 Tegallega
310.4
959.5
31.0
300.5
797.4
28.2
29 Babakan
380.4
1575.5
39.7
369.6
1270.5
35.6
30 Sempur
440.8
2035.1
45.1
402.5
1561.7
39.5
31 Cibogor
375.3
1866.9
43.2
377.9
1417.7
37.7
141
No
Area Kecil Desa
Metode SAE – PTLTE Penampang Melintang
ˆ PT PM
KTG
AKTG
Metode SAE – PTLTE Deret Waktu
ˆ PT DW
KTG
AKTG
32 Kebonkelapa
496.7
2232.4
47.2
512.9
1532.8
39.2
33 Pasirkuda
415.2
1472.5
38.4
410.5
1163.4
34.1
34 Pasirjaya
291.7
429.2
20.7
284.9
395.3
19.9
35 Gunungbatu
392.1
585.0
24.2
385.1
524.9
22.9
36 Loji
408.2
1500.7
38.7
406.3
1197.8
34.6
37 Menteng
382.3
969.6
31.1
373.0
830.8
28.8
38 Cilendek Barat
389.6
591.3
24.3
382.6
526.2
22.9
39 Sindangbarang
447.7
2420.3
49.2
450.7
1728.5
41.6
40 Margajaya
366.6
1359.4
36.9
374.0
1101.9
33.2
41 Situgede
329.1
794.5
28.2
328.4
676.0
26.0
42 Bubulak
294.7
927.9
30.5
296.6
806.1
28.4
43 Curugmekar
327.2
1665.7
40.8
274.8
1224.6
35.0
44 Curug
425.5
1446.1
38.0
415.6
1171.5
34.2
45 Kedungwaringin
277.5
568.1
23.8
279.6
512.7
22.6
46 Kedungjaya
406.9
1376.0
37.1
390.6
1078.4
32.8
47 Kebonpedes
311.5
392.0
19.8
309.6
363.1
19.1
48 Tanahsareal
365.6
994.4
31.5
350.0
852.6
29.2
49 Kedungbadak
435.8
1688.7
41.1
408.1
1368.9
37.0
50 Sukaresmi
346.6
994.5
31.5
348.8
840.7
29.0
51 Cibadak
349.1
1690.3
41.1
338.4
1348.5
36.7
52 Kayumanis
309.5
899.1
30.0
310.8
746.6
27.3
53 Mekarwangi
375.8
1041.4
32.3
368.2
870.8
29.5
54 Kencana
231.7
695.8
26.4
228.7
590.9
24.3
Rataan
1128.7
32.3
906.7
29.2
142
Lampiran 6. Perbandingan Antara Metode PTLTE dengan Metode Bayes Berhirarki Model 1 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor
No
Area Kecil Desa
Metode SAE – PTLTE Deret Waktu
ˆ PT DW
KTG
AKTG
Metode SAE – Bayes Berhirarki Model 1 Deret Waktu
ˆ BB1 DW
KTG
AKTG
1 Mulyaharja
332.8
515.3
22.7
254.7
237.9
15.4
2 Pamoyanan
188.1
252.9
15.9
214.4
120.0
11.0
3 Ranggamekar
309.3
500.5
22.4
282.2
443.2
21.1
4 Genteng
210.1
261.0
16.2
226.0
173.9
13.2
5 Kertamaya
364.5
596.5
24.4
264.9
284.9
16.9
6 Bojongkerta
337.3
528.5
23.0
260.6
322.3
18.0
7 Harjasari
230.0
318.1
17.8
228.2
318.1
17.8
8 Muarasari
319.9
489.7
22.1
255.6
324.1
18.0
9 Cipaku
241.0
372.5
19.3
249.7
189.8
13.8
10 Batutulis
341.6
1606.7
40.1
281.1
1220.4
34.9
11 Empang
393.0
627.7
25.1
281.3
255.0
16.0
12 Cikaret
355.6
574.5
24.0
270.9
256.8
16.0
13 Sindangrasa
340.9
811.4
28.5
298.7
411.6
20.3
14 Katulampa
179.7
250.1
15.8
222.3
116.1
10.8
15 Baranangsiang
332.6
953.3
30.9
259.9
515.7
22.7
16 Sukasari
296.9
1302.9
36.1
262.0
735.9
27.1
17 Bantarjati
333.9
958.2
31.0
259.6
378.1
19.4
18 Tegalgundil
390.0
1260.6
35.5
273.8
611.4
24.7
19 Tanahbaru
401.4
1052.2
32.4
293.3
573.2
23.9
20 Cimahpar
263.0
520.1
22.8
231.3
332.8
18.2
21 Ciluar
365.6
903.2
30.1
281.0
687.8
26.2
22 Cibuluh
383.2
1074.6
32.8
277.9
434.6
20.8
23 Kedunghalang
361.6
1629.0
40.4
268.4
643.0
25.4
24 Ciparigi
254.4
603.1
24.6
250.4
479.1
21.9
25 Paledang
420.9
1641.1
40.5
302.1
1414.1
37.6
26 Gudang
331.7
1439.6
37.9
284.4
1263.4
35.5
27 Babakanpasar
311.6
1418.6
37.7
271.1
962.4
31.0
28 Tegallega
300.5
797.4
28.2
274.6
537.7
23.2
29 Babakan
369.6
1270.5
35.6
270.6
873.6
29.6
30 Sempur
402.5
1561.7
39.5
274.4
682.4
26.1
31 Cibogor
377.9
1417.7
37.7
273.8
629.7
25.1
143
No
Area Kecil Desa
Metode SAE – PTLTE Deret Waktu
ˆ PT DW
KTG
AKTG
Metode SAE – Bayes Berhirarki Model 1 Deret Waktu
ˆ BB1 DW
KTG
AKTG
32 Kebonkelapa
512.9
1532.8
39.2
315.0
826.6
28.8
33 Pasirkuda
410.5
1163.4
34.1
281.7
461.8
21.5
34 Pasirjaya
284.9
395.3
19.9
256.5
146.6
12.1
35 Gunungbatu
385.1
524.9
22.9
294.6
255.0
16.0
36 Loji
406.3
1197.8
34.6
281.3
714.7
26.7
37 Menteng
373.0
830.8
28.8
291.9
714.3
26.7
38 Cilendek Barat
382.6
526.2
22.9
299.5
431.9
20.8
39 Sindangbarang
450.7
1728.5
41.6
274.7
812.2
28.5
40 Margajaya
374.0
1101.9
33.2
268.2
410.6
20.3
41 Situgede
328.4
676.0
26.0
263.2
495.0
22.2
42 Bubulak
296.6
806.1
28.4
254.9
369.1
19.2
43 Curugmekar
274.8
1224.6
35.0
298.0
879.0
29.6
44 Curug
415.6
1171.5
34.2
278.8
454.3
21.3
45 Kedungwaringin
279.6
512.7
22.6
250.1
383.3
19.6
46 Kedungjaya
390.6
1078.4
32.8
275.9
442.7
21.0
47 Kebonpedes
309.6
363.1
19.1
268.9
147.5
12.1
48 Tanahsareal
350.0
852.6
29.2
286.1
507.1
22.5
49 Kedungbadak
408.1
1368.9
37.0
312.5
1171.0
34.2
50 Sukaresmi
348.8
840.7
29.0
274.6
694.1
26.3
51 Cibadak
338.4
1348.5
36.7
290.3
1229.7
35.1
52 Kayumanis
310.8
746.6
27.3
264.0
422.6
20.6
53 Mekarwangi
368.2
870.8
29.5
293.7
836.8
28.9
54 Kencana
228.7
590.9
24.3
246.9
274.9
16.6
Rataan
906.7
29.2
546.5
22.5
144
Lampiran 7. Perbandingan Antara Metode Bayes Berhirarki Model 1 dengan Model 2 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor
No
Area Kecil Desa
Metode SAE – Bayes Berhirarki Model 1 Deret Waktu
ˆ BB1 DW
KTG
Metode SAE – Bayes Berhirarki Model 2 Deret Waktu
AKTG
ˆ BB 2 DW
KTG
AKTG
1 Mulyaharja
254.7
237.9
15.4
249.9
172.8
13.1
2 Pamoyanan
214.4
120.0
11.0
220.1
58.1
7.6
3 Ranggamekar
282.2
443.2
21.1
278.0
462.7
21.5
4 Genteng
226.0
173.9
13.2
229.6
51.9
7.2
5 Kertamaya
264.9
284.9
16.9
257.2
183.5
13.5
6 Bojongkerta
260.6
322.3
18.0
252.4
166.6
12.9
7 Harjasari
228.2
318.1
17.8
226.6
370.5
19.2
8 Muarasari
255.6
324.1
18.0
250.8
214.6
14.7
9 Cipaku
249.7
189.8
13.8
247.5
244.7
15.6
10 Batutulis
281.1
1220.4
34.9
280.9
1238.8
35.2
11 Empang
281.3
255.0
16.0
283.2
277.2
16.6
12 Cikaret
270.9
256.8
16.0
269.2
263.1
16.2
13 Sindangrasa
298.7
411.6
20.3
287.5
253.2
15.9
14 Katulampa
222.3
116.1
10.8
222.9
116.2
10.8
15 Baranangsiang
259.9
515.7
22.7
252.5
427.4
20.7
16 Sukasari
262.0
735.9
27.1
259.1
802.6
28.3
17 Bantarjati
259.6
378.1
19.4
254.3
300.9
17.3
18 Tegalgundil
273.8
611.4
24.7
273.8
516.5
22.7
19 Tanahbaru
293.3
573.2
23.9
290.3
537.1
23.2
20 Cimahpar
231.3
332.8
18.2
227.1
263.8
16.2
21 Ciluar
281.0
687.8
26.2
282.4
741.6
27.2
22 Cibuluh
277.9
434.6
20.8
267.6
243.7
15.6
23 Kedunghalang
268.4
643.0
25.4
270.7
685.9
26.2
24 Ciparigi
250.4
479.1
21.9
250.5
288.6
17.0
25 Paledang
302.1
1414.1
37.6
300.8
1414.2
37.6
26 Gudang
284.4
1263.4
35.5
284.1
1303.6
36.1
27 Babakanpasar
271.1
962.4
31.0
266.0
755.2
27.5
28 Tegallega
274.6
537.7
23.2
273.4
326.5
18.1
29 Babakan
270.6
873.6
29.6
274.0
976.0
31.2
30 Sempur
274.4
682.4
26.1
280.7
745.5
27.3
31 Cibogor
273.8
629.7
25.1
276.7
675.1
26.0
145
No
Area Kecil Desa
Metode SAE – Bayes Berhirarki Model 1 Deret Waktu
ˆ BB1 DW
KTG
Metode SAE – Bayes Berhirarki Model 2 Deret Waktu
AKTG
ˆ BB 2 DW
KTG
AKTG
32 Kebonkelapa
315.0
826.6
28.8
313.3
831.1
28.8
33 Pasirkuda
281.7
461.8
21.5
275.6
256.7
16.0
34 Pasirjaya
256.5
146.6
12.1
250.2
59.8
7.7
35 Gunungbatu
294.6
255.0
16.0
298.3
279.0
16.7
36 Loji
281.3
714.7
26.7
274.3
525.2
22.9
37 Menteng
291.9
714.3
26.7
283.7
451.7
21.3
38 Cilendek Barat
299.5
431.9
20.8
279.7
209.8
14.5
39 Sindangbarang
274.7
812.2
28.5
277.8
979.5
31.3
40 Margajaya
268.2
410.6
20.3
270.2
480.7
21.9
41 Situgede
263.2
495.0
22.2
253.8
340.1
18.4
42 Bubulak
254.9
369.1
19.2
252.1
212.8
14.6
43 Curugmekar
298.0
879.0
29.6
301.7
964.7
31.1
44 Curug
278.8
454.3
21.3
281.6
460.5
21.5
45 Kedungwaringin
250.1
383.3
19.6
244.7
265.6
16.3
46 Kedungjaya
275.9
442.7
21.0
269.1
281.7
16.8
47 Kebonpedes
268.9
147.5
12.1
265.7
80.4
9.0
48 Tanahsareal
286.1
507.1
22.5
276.9
305.0
17.5
49 Kedungbadak
312.5
1171.0
34.2
303.3
994.7
31.5
50 Sukaresmi
274.6
694.1
26.3
274.5
720.2
26.8
51 Cibadak
290.3
1229.7
35.1
285.8
954.8
30.9
52 Kayumanis
264.0
422.6
20.6
265.9
489.3
22.1
53 Mekarwangi
293.7
836.8
28.9
292.5
860.6
29.3
54 Kencana
246.9
274.9
16.6
250.4
131.3
11.5
Rataan
546.5
22.5
485.4
20.7
146
Lampiran 8. Perbandingan KTG dan AKTG Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor PTLTE No
Area Kecil - Desa
KTG
BB-1
AKTG
KTG
BB-2
AKTG
KTG
AKTG
1 Mulyaharja
515.3
22.7
237.9
15.4
172.8
13.1
2 Pamoyanan
252.9
15.9
120.0
11.0
58.1
7.6
3 Ranggamekar
500.5
22.4
443.2
21.1
462.7
21.5
4 Genteng
261.0
16.2
173.9
13.2
51.9
7.2
5 Kertamaya
596.5
24.4
284.9
16.9
183.5
13.5
6 Bojongkerta
528.5
23.0
322.3
18.0
166.6
12.9
7 Harjasari
318.1
17.8
318.1
17.8
370.5
19.2
8 Muarasari
489.7
22.1
324.1
18.0
214.6
14.7
9 Cipaku
372.5
19.3
189.8
13.8
244.7
15.6
10 Batutulis
1606.7
40.1
1220.4
34.9
1238.8
35.2
11 Empang
627.7
25.1
255.0
16.0
277.2
16.6
12 Cikaret
574.5
24.0
256.8
16.0
263.1
16.2
13 Sindangrasa
811.4
28.5
411.6
20.3
253.2
15.9
14 Katulampa
250.1
15.8
116.1
10.8
116.2
10.8
15 Baranangsiang
953.3
30.9
515.7
22.7
427.4
20.7
16 Sukasari
1302.9
36.1
735.9
27.1
802.6
28.3
17 Bantarjati
958.2
31.0
378.1
19.4
300.9
17.3
18 Tegalgundil
1260.6
35.5
611.4
24.7
516.5
22.7
19 Tanahbaru
1052.2
32.4
573.2
23.9
537.1
23.2
20 Cimahpar
520.1
22.8
332.8
18.2
263.8
16.2
21 Ciluar
903.2
30.1
687.8
26.2
741.6
27.2
22 Cibuluh
1074.6
32.8
434.6
20.8
243.7
15.6
23 Kedunghalang
1629.0
40.4
643.0
25.4
685.9
26.2
24 Ciparigi
603.1
24.6
479.1
21.9
288.6
17.0
25 Paledang
1641.1
40.5
1414.1
37.6
1414.2
37.6
26 Gudang
1439.6
37.9
1263.4
35.5
1303.6
36.1
27 Babakanpasar
1418.6
37.7
962.4
31.0
755.2
27.5
28 Tegallega
797.4
28.2
537.7
23.2
326.5
18.1
29 Babakan
1270.5
35.6
873.6
29.6
976.0
31.2
30 Sempur
1561.7
39.5
682.4
26.1
745.5
27.3
31 Cibogor
1417.7
37.7
629.7
25.1
675.1
26.0
32 Kebonkelapa
1532.8
39.2
826.6
28.8
831.1
28.8
147
PTLTE No
Area Kecil - Desa
KTG
BB-1
AKTG
KTG
BB-2
AKTG
KTG
AKTG
33 Pasirkuda
1163.4
34.1
461.8
21.5
256.7
16.0
34 Pasirjaya
395.3
19.9
146.6
12.1
59.8
7.7
35 Gunungbatu
524.9
22.9
255.0
16.0
279.0
16.7
1197.8
34.6
714.7
26.7
525.2
22.9
37 Menteng
830.8
28.8
714.3
26.7
451.7
21.3
38 Cilendek Barat
526.2
22.9
431.9
20.8
209.8
14.5
39 Sindangbarang
1728.5
41.6
812.2
28.5
979.5
31.3
40 Margajaya
1101.9
33.2
410.6
20.3
480.7
21.9
41 Situgede
676.0
26.0
495.0
22.2
340.1
18.4
42 Bubulak
806.1
28.4
369.1
19.2
212.8
14.6
43 Curugmekar
1224.6
35.0
879.0
29.6
964.7
31.1
44 Curug
1171.5
34.2
454.3
21.3
460.5
21.5
512.7
22.6
383.3
19.6
265.6
16.3
46 Kedungjaya
1078.4
32.8
442.7
21.0
281.7
16.8
47 Kebonpedes
363.1
19.1
147.5
12.1
80.4
9.0
48 Tanahsareal
852.6
29.2
507.1
22.5
305.0
17.5
1368.9
37.0
1171.0
34.2
994.7
31.5
840.7
29.0
694.1
26.3
720.2
26.8
1348.5
36.7
1229.7
35.1
954.8
30.9
52 Kayumanis
746.6
27.3
422.6
20.6
489.3
22.1
53 Mekarwangi
870.8
29.5
836.8
28.9
860.6
29.3
54 Kencana
590.9
24.3
274.9
16.6
131.3
11.5
906.7
29.2
546.5
22.5
485.4
20.7
36 Loji
45 Kedungwaringin
49 Kedungbadak 50 Sukaresmi 51 Cibadak
Rataan
148
Lampiran 9. Metode Pendugaan Langsung yang digunakan oleh BPS untuk Data Susenas (BPS, 2005). Metode pendugaan yang digunakan dalam Susenas menggunakan metode secara langsung (direct estimate) dan penduga rasio dengan rasio jumlah rumah tangga untuk mengestimasi karakteristik rumah tangga dan rasio penduduk untuk mengestimasi karakteristik penduduk. Dugaan untuk karakteristik y dalam suatu kabupaten/kota di daerah perkotaan dan daerah pedesaan adalah dengan menggunakan rumus metode sampling dua tahap (apabila 3 tahap dilakukan pemilihan sub blok, formula disesuaikan).
Pendugaan Data Rumah Tanga a. Daerah Perkotaan Dugaan nilai rata-rata karakteristik y adalah
y ku
1 16 bu
bu 16
yij i 1 j 1
Dugaan nilai total karakteristik y adalah
Yˆku Pˆku yku di mana, y ku = dugaan nilai rata-rata karakteristik y di kabupaten/kota k daerah u. Yˆku = dugaan nilai total karakteristik y di kabupaten/kota k daerah u. yij = nilai karakteristik pada rumah tangga terpilih ke-j di blok sensus terpilih ke-i. bu = banyaknya blok sensus terpilih di kabupaten/kota k daerah u. Pˆ = perkiraan jumlah rumah tangga di kabupaten/kota k daerah u. ku
b. Daerah Pedesaan Dugaan nilai rata-rata karakteristik y adalah y kr
1 16 br
br
16
y
ij
i 1 j 1
Dugaan nilai total karakteristik y adalah
Yˆkr Pˆkr y kr
149
di mana, y kr = dugaan nilai rata-rata karakteristik y di kabupaten/kota k daerah r. Yˆkr = dugaan nilai total karakteristik y di kabupaten/kota k daerah r. yij = nilai karakteristik pada rumah tangga terpilih ke-j di blok sensus terpilih ke-i. br = banyaknya blok sensus terpilih di kabupaten/kota k daerah r.
Pˆkr = perkiraan jumlah rumah tangga di kabupaten/kota k daerah r. Perkiraan nilai rata-rata karakteristik y di kabupaten/kota k daerah u dan r adalah
y k (u r )
Yˆku Yˆkr Pˆku Pˆkr
Perkiraan nilai total karakteristik y di kabupaten/kota k daerah perkotaan ( Yˆku ) dan pedesaan ( Yˆkr ) adalah
Yˆk ( u r ) Yˆku Yˆkr Perkiraan nilai total karakteristik y di tingkat propinsi daerah perkotaan ( Yˆpu ) atau pedesaan ( Yˆpr ) dihitung dengan rumus: T
T Yˆpu Yˆku dan Yˆpr Yˆkr
k1
k 1
di mana, T = banyaknya kabupaten/kota di propinsi p. Perkiraan nilai total karakteristik y di tingkat propinsi daerah perkotaan ( Yˆpu ) dan pedesaan ( Yˆpr ) adalah
Yˆp(ur ) Yˆpu Yˆpr Perkiraan nilai rata-rata karakteristik y di tingkat propinsi daerah perkotaan (u) dan perdesaan (r) adalah
y p (u r )
Yˆpu Yˆpr Pˆ pu Pˆ pr
Perkiraan nilai total karakteristik y di tingkat nasional dihitung dengan rumus
150
L
Yˆn (u r ) (Yˆpu Yˆpr ) p 1
di mana, L = banyaknya propinsi di Indonesia. Perkiraan nilai rata-rata karakteristik y di tingkat nasional dihitung dengan cara
y n (u r )
Yˆn (u r ) Pˆ
n (u r )
di mana, Pˆn ( u r ) adalah perkiraan jumlah rumah tangga di Indonesia daerah perkotaan dan pedesaan.
Pendugaan Data Individu a. Daerah Perkotaan Dugaan nilai rata-rata karakteristik y adalah yku
1 16 bu
bu
16
a
y i 1
1 j 1 aij
ijk
h 1
Dugaan nilai total karakteristik y adalah
ˆ y Yˆku Q ku ku di mana, y ku = dugaan nilai rata-rata karakteristik y di kabupaten/kota k daerah u. Yˆku = dugaan nilai total karakteristik y di kabupaten/kota k daerah u. yij = nilai karakteristik pada rumah tangga terpilih ke-j di blok sensus terpilih ke-i. bu = banyaknya blok sensus terpilih di kabupaten/kota k daerah u. aij
= banyaknya individu (ART) di rumah tangga terpilih ke-j di blok sensus terpilih ke-i.
ˆ Q ku =
perkiraan jumlah rumah tangga di kabupaten/kota k daerah u.
b. Daerah Pedesaan Dugaan nilai rata-rata karakteristik y adalah
151
ykr
1 16 br
br
16
a
y i 1 j 1
1 aij
ijh
j 1
Dugaan nilai total karakteristik y adalah
Yˆkr Pˆkr y kr di mana, y kr = dugaan nilai rata-rata karakteristik y di kabupaten/kota k daerah r. Yˆkr = dugaan nilai total karakteristik y di kabupaten/kota k daerah r. yijh
br aij
= nilai karakteristik pada rumah tangga terpilih ke-j di blok sensus terpilih ke-i. = banyaknya blok sensus terpilih di kabupaten/kota k daerah r. = banyaknya individu (ART) di rumah tangga terpilih ke-j di blok sensus terpilih ke-i.
ˆ Q kr =
perkiraan jumlah rumah tangga di kabupaten/kota k daerah r.
Perkiraan nilai rata-rata karakteristik y di kabupaten/kota k daerah u dan r adalah
y k (u r )
Yˆku Yˆkr Pˆku Pˆkr
Perkiraan nilai total karakteristik y di kabupaten/kota k daerah perkotaan ( Yˆku ) dan pedesaan ( Yˆkr ) adalah
Yˆk ( u r ) Yˆku Yˆkr Perkiraan nilai total karakteristik y di tingkat propinsi daerah perkotaan ( Yˆpu ) atau pedesaan ( Yˆpr ) dihitung dengan rumus: T
T Yˆpu Yˆku dan Yˆpr Yˆkr k 1
k 1
di mana, T = banyaknya kabupaten/kota di propinsi p. Perkiraan nilai total karakteristik y di tingkat propinsi daerah perkotaan ( Yˆpu ) dan pedesaan ( Yˆpr ) adalah
Yˆp ( u r ) Yˆpu Yˆpr
152
Perkiraan nilai rata-rata karakteristik y di tingkat propinsi daerah perkotaan (u) dan perdesaan (r) adalah
y p( u r )
Yˆ pu Yˆ pr ˆ Q ˆ Q pu pr
Perkiraan nilai total karakteristik y di tingkat nasional dihitung dengan rumus L
Yˆn (u r ) (Yˆpu Yˆpr ) p 1
di mana, L = banyaknya propinsi di Indonesia. Perkiraan nilai rata-rata karakteristik y di tingkat nasional dihitung dengan cara
y n( u r )
Yˆn( u r ) ˆ Q
n( u r )
di mana,
ˆ Q n( u r )
adalah perkiraan jumlah rumah tangga di Indonesia daerah
perkotaan dan pedesaan.
153