METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE KUSMAN SADIK

METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE

KUSMAN SADIK

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2009

PERNYATAAN MENGENAI DISERTASI DAN SUMBER INFORMASI

Dengan ini saya menyatakan bahwa disertasi yang berjudul ‘Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space’ adalah hasil karya saya sendiri dengan arahan komisi pembimbing dan belum pernah diajukan kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya penulis lain telah dicantumkan di dalam teks dan Daftar Pustaka disertasi ini.

Bogor, November 2009

Kusman Sadik NIM. G161050021

ABSTRACT

KUSMAN SADIK. Best Linear Unbiased Prediction and Hierarchical Bayes Methods for Small Area Estimation Using State Space Models. Under guidance of KHAIRIL ANWAR NOTODIPUTRO, BUDI SUSETYO, and I WAYAN MANGKU.

There have been two main topics developed by statisticians in a survey, i.e. sampling techniques and estimation methods. The current issues are estimation methods related to estimation of a particular domain having small size of samples or, in more extreme cases, there is no sample available for direct estimation. Sample survey data provide effective reliable estimators of totals and means for large area and domains. But it is recognized that the usual direct survey estimator for a parameter of small area, have unacceptably large standard errors, due to the circumstance of small sample size in the area. The most commonly used models for this case, usually in small area estimation, are based on generalized linear mixed models. Some time happened that some surveys are carried out periodically so that the estimation could be improved by incorporating both the area and time random effects. In this dissertation we propose a state space model which accounts for the two random effects and is based on two equations, namely transition equation and measurement equation. Based on an evaluation criterion, the proposed hierarchical Bayes estimator turns out to be superior to both estimated best linear unbiased prediction (BLUP) and the direct survey estimator. The posterior variances which measure accuracy of the hierarchical Bayes estimates are always smaller than the corresponding variances of the BLUP and the direct survey estimates. Keywords: Generalized linear mixed model, hierarchical Bayes, best linear unbiased prediction, prior and posterior function, generalized variance function, block diagonal covariance, state space model.

RINGKASAN

KUSMAN SADIK. Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO, BUDI SUSETYO, dan I WAYAN MANGKU. Terkait dengan persoalan survei, ada dua topik utama yang menjadi perhatian para statistisi selama tahun-tahun terakhir ini. Topik tersebut menyangkut persoalan pengembangan teknik penarikan contoh dan pengembangan metodologi pendugaan parameter pupulasi. Sebagaimana diketahui, pada umumnya survei rutin yang dilakukan oleh pemerintah suatu negara didesain untuk memperoleh statistik nasional. Artinya, survei semacam ini didesain untuk inferensia bagi daerah yang luas. Persoalan muncul ketika dari survei seperti ini ingin diperoleh informasi untuk area yang lebih kecil, misalnya informasi pada level propinsi, kabupaten, bahkan mungkin level kecamatan. Ukuran contoh pada level area tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar. Bahkan bisa saja pendugaan tidak dapat dilakukan karena area tersebut tidak terpilih menjadi contoh dalam survei. Oleh karena itu dikembangkan metode pendugaan parameter yang dapat mengatasi hal ini. Metode tersebut dikenal dengan metode pendugaan area kecil (small area estimation, SAE). Berbagai metode pendugaan area kecil telah dikembangkan khususnya menyangkut metode yang berbasis model. Area kecil tersebut didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil didasarkan pada aplikasi model desain penarikan contoh (design-based) yang dikenal sebagai pendugaan langsung (direct estimation). Namun, metode pendugaan langsung pada subpopulasi tidak memiliki presisi yang memadai karena kecilnya jumlah contoh yang digunakan untuk memperoleh dugaan tersebut. Oleh karena itu dikembangkan metode pendugaan secara tidak langsung (indirect estimation) di suatu area yang relatif kecil dalam percontohan survei. Tujuan tulisan ini adalah untuk mengkaji konsep dan sifat-sifat statistik pada model campuran linear terampat (generalized linear mixed model) untuk SAE serta mengkaji konsep dan sifat-sifat statistik model SAE yang memasukkan pengaruh acak area dan waktu berdasarkan model state space melalui pendekatan kemungkinan maksimum dan Bayes berhirarki. Nilai tengah pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Prediksi tak-bias linear terbaik (best linear unbiased prediction) dilakukan dengan cara meminimumkan fungsi kuadrat tengah galat (mean square of error), sehingga penduga bagi prediksi tak-bias

linear terbaik (PTLT) memiliki kuadrat tengah galat (KTG) yang paling kecil diantara semua penduga tidak bias linear. Metode kemungkinan maksimum terkendala (restricted maximum likelihood) dapat digunakan untuk menduga komponen ragam atau koragam. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh penduga secara dua tahap sebagai PTLT empirik atau PTLTE. Penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai akar kuadrat tengah galatnya (AKTG) lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Sementara pada data deret waktu (time series data) Susenas, AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE data penampang melintang (cross-sectional data). Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai akar kuadrat tengah galat relatif (AKTGR) metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE non-time series pada waktu T dan korelasi diri  yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri  dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Metode PTLT pada SAE memerlukan banyak kondisi tertentu yang harus dipenuhi, diantaranya adalah pengasumsian bahwa parameter peubah tetap dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataannya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode PTLT yang memerlukan berbagai kondisi tertentu. Penerapan pada data deret waktu Susenas, diketahui bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Berdasarkan kajian analitik pada model SAE yang memasukkan pengaruh acak area dan waktu, penduga PTLT yang berbasis pada metode kemungkinan maksimum terbatas dan penduga Bayes berhirarki sama-sama bersifat tidak bias. Namun, resiko atau KTG yang dihasilkan penduga Bayes lebih kecil daripada penduga PTLT, artinya dalam hal ini penduga Bayes lebih baik daripada penduga PTLT.

@ Hak Cipta Milik Institut Pertanian Bogor (IPB), Tahun 2009 Hak Cipta Dilindungi Undang-undang 1.

2.

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber: a.

Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah.

b.

Pengutipan tidak merugikan kepentingan yang wajar IPB.

Dilarang mengumumkan atau memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa izin IPB.

METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE

KUSMAN SADIK

Disertasi sebagai salah satu syarat untuk memperoleh gelar Doktor pada Program Studi Statistika

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2009

Penguji Luar Komisi pada Ujian Tertutup, 30 Oktober 2009 1. Prof. Dr. Ir. Aunuddin, MSc. 2. Dr. Ir. Aji Hamim Wigena, MSc.

(Dosen Dept. Statistika IPB) (Dosen Dept. Statistika IPB)

Penguji Luar Komisi pada Ujian Terbuka, 23 November 2009 1. Dr. Bambang Heru Santosa, MEc. (Badan Pusat Statistik, Jakarta) 2. Dr. Ir. Anik Djuraidah, MS. (Dosen Dept. Statistika IPB)

Judul Disertasi

: Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space

Nama Mahasiswa

: Kusman Sadik

NIM

: G161050021

Program Studi

: Statistika

Disetujui, Komisi Pembimbing

Prof. Dr. Ir. Khairil Anwar Notodiputro, MS Ketua

Dr. Ir. Budi Susetyo, MS Anggota

Dr. Ir. I Wayan Mangku, MSc Anggota

Diketahui, Ketua Program Studi Statistika,

Dr. Ir. Aji Hamim Wigena, MSc

Dekan Sekolah Pascasarjana IPB,

Prof. Dr. Ir. Khairil Anwar Notodiputro, MS

Tanggal Ujian Terbuka : 23 November 2009

Tanggal Lulus :

PRAKATA

Puji syukur penulis panjatkan ke hadirat Allah SWT, karena atas rahmat dan hidayah-Nyalah akhirnya disertasi ini dapat diselesaikan. Selama pelaksanaan penelitian dan penyelesaian tulisan ini, penulis banyak mendapatkan

bantuan

dari

berbagai

pihak

diantaranya

adalah

Komisi

Pembimbing, seluruh dosen dan karyawan Departemen Statistika FMIPA IPB, seluruh staf dan karyawan Sekolah Pascasarjana IPB, peneliti dan karyawan di BPS Jakarta, dosen dan karyawan di Joint Program in Survey Methodology (JPSM) University of Maryland Amerika Serikat, keluarga, dan berbagai pihak yang tidak dapat penulis sebutkan semuanya. Dengan segala keterbatasan dan kekurangannya, akhirnya disertasi yang berjudul “Metode Prediksi Tak-bias Linear Terbaik dan Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space” dapat diselesaikan dengan baik. Pada kesempatan ini, secara khusus penulis mengucapkan terima kasih kepada: 1.

Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, Bapak Dr. Ir. Budi Susetyo, dan Bapak Dr. Ir. I Wayan Mangku, selaku dosen pembimbing yang telah banyak memberikan arahan, saran, dan bimbingan.

2.

Bapak Prof. Dr. Ir. Aunuddin dan Bapak Dr. Ir. Aji Hamim Wigena selaku penguji luar komisi pada saat Ujian Tertutup.

3.

Bapak Dr. Bambang Heru Santosa, MEc dan Ibu Dr. Ir. Anik Djuraidah selaku penguji luar komisi pada saat Ujian Terbuka.

4.

Seluruh dosen dan karyawan Departemen Statistika FMIPA IPB yang telah menjadi teman diskusi, memberikan saran, dan dorongan moril.

5.

Seluruh dosen dan karyawan Sekolah Pascasarjana IPB yang telah memberikan layanan pengajaran dan administrasi yang baik.

6.

Para peneliti dan karyawan di BPS Jakarta yang banyak membantu memberikan data dan penjelasannya terkait data Susenas dan Podes.

7.

Prof. Partha Lahiri, yang telah memberikan arahan dan pengajaran terkait konsep teori dan metodologi Small Area Estimation selama penulis melaksanakan Program Sandwich di Joint Program in Survey Methodology, University of Maryland, Amerika Serikat.

8.

Direktorat Pendidikan Tinggi, yang telah memberikan berbagai bantuan biaya pendidikan dan penelitian.

9.

Seluruh anggota keluarga penulis, yang senantiasa memberikan dorongan semangat dan doa yang ikhlas.

10.

Serta berbagai pihak lain yang tidak dapat penulis sebutkan seluruhnya secara satu persatu.

Akhir kalam, dengan segala kerendahan hati, penulis menyadari bahwa disertasi ini masih jauh dari kesempurnaan. Namun demikian, penulis berharap tulisan ini dapat bermanfaat bagi mereka yang memerlukannya. Aamiin.

RIWAYAT HIDUP

Penulis dilahirkan di Sumenep pada tanggal 12 September 1969, sebagai anak kedua dari pasangan Muhammad Durri (alm) dan Siti Ahmadiyah (almh). Pendidikan sarjana ditempuh di Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor (IPB), lulus pada tahun 1995. Pada tahun 1996 penulis diterima di Program Magister Statistika pada Program Pascasarjana IPB, dan menyelesaikannya pada tahun 1999. Pada tahun 2005 penulis mendapat kesempatan untuk mengikuti Program Doktor pada Program Studi Statistika, Sekolah Pasacasarjana IPB, dengan beasiswa pendidikan (BPPS) diperoleh dari Direktorat Jendral Pendidikan Tinggi, Depdiknas RI. Pada tahun 2008, penulis mengikuti Program Sandwich ke University of Maryland, Amerika Serikat, untuk mengikuti kuliah dan melakukan penelitian terkait dengan metode pendugaan area kecil yang menjadi fokus dalam disertasi ini. Pada saat ini penulis bekerja sebagai dosen pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, IPB. Penulis menikah dengan Kurniawati Rahmi Wijaya, S.Si dan telah dikaruniai tiga orang anak, yaitu Firyali Rahmani Shidqi, Muhammad Sayyidurrahman Ash Shidqi, dan Radhwa Rahmaniyah Ash Shidqi. Selama mengikuti program S3, penulis telah mempresentasikan beberapa karya ilmiah dalam seminar nasional dan internasional, dan sebagiannya dipublikasikan dalam jurnal ilmiah nasional. Karya-karya ilmiah tersebut adalah: 1.

Sadik, K. and Notodiputro, K.A. 2009. Hierarchical Bayes Estimation Using Time Series and Cross-sectional Data : A Case of Percapita Expenditure in Indonesia. Conference of Small Area Estimation, 29 Juni – 01 Juli 2009, Elche, Spanyol.

2.

Sadik, K. 2008. Hierarchical Bayes Approach in Small Area Estimation. Makalah Seminar Reguler di Joint Program in Survey Methodology, University of Maryland, USA. Oktober, 2008.

3.

Sadik, K., Notodiputro, K.A., Susetyo, B., Mangku, I.W. 2008. Small Area Estimation With Time and Area Effects Using A Dynamic

Linear Model. The 3rd International Conference on Mathematics and Statistics (ICoMS-3). Institut Pertanian Bogor, Indonesia, 56 August 2008. 4.

Sadik, K. and Notodiputro, K.A. 2007. A State Space Model in Small Area Estimation. The 9th Islamic Countries Conference on Statistical Sciences 2007 (ICCS-IX), Kuala Lumpur: 12-14 December 2007.

5.

Sadik, K. dan Notodiputro, K.A. 2007. Model State Space pada GLMM untuk Pendugaan Area Kecil (Small Area Estimation). Prosiding pada Seminar Nasional Statistika: 24 Mei 2007, Unisba – Bandung.

6.

Sadik, K. dan Notodiputro, K.A. 2006. Pendekatan P-Spline MQuantile dalam Pendugaan Area Kecil (Small Area Estimation). Jurnal Matematika Aplikasi dan Pembelajaran, Vol. 5 No.2 Jilid 1, p:142-147, Universitas Negeri Jakarta, Jakarta.

7.

Sadik, K. dan Notodiputro, K.A. 2006. Small Area Estimation with Time and Area Effects Using Two Stage Estimation. Proceeding at the First International Conference on Mathematics and Statistics, MSMSSEA, 19-21 June 2006, Bandung.

8.

Sadik, K., Notodiputro, K.A., Susetyo, B., Mangku, I.W. 2006. Pendugaan Area Kecil (Small Area Estimation) Berdasarkan Model yang Mengandung Langkah Acak (Random Walk). Prosiding Seminar Nasional Matematika dan Konferda IndoMS wilayah Jabar & Banten, 22 April 2006, Jurusan Matematika UNPAD, Bandung.

DAFTAR ISI

DAFTAR TABEL ........................................................................................... xvii DAFTAR GAMBAR ...................................................................................... xviii DAFTAR LAMPIRAN ................................................................................... I.

xix

PENDAHULUAN .................................................................................

1

1.1. Latar Belakang ..............................................................................

1

1.2. Tujuan Penelitian ..........................................................................

3

1.3. Ruang Lingkup ..............................................................................

3

1.4. Kebaruan / Novelty ........................................................................

4

TINJAUAN METODE PENDUGAAN AREA KECIL ....................

5

2.1. Pendahuluan ..................................................................................

5

2.1.1. Keuntungan dan Keterbatasan Penarikan Contoh .............

6

2.1.2. Validitas, Reliabilitas, dan Keakuratan .............................

6

2.1.3. Pendugaan Ukuran Contoh ...............................................

7

2.2. Perkembangan Metode SAE .........................................................

9

2.2.1. Metode Pendugaan Tidak Langsung untuk Area Kecil ...

12

2.2.2. Pendekatan Model Campuran Linear Terampat ...............

14

2.2.3. Pengaruh Penarikan Contoh pada Pendugaan Tidak Langsung ...........................................................................

16

2.3. Metode SAE dan Model State Space ............................................

23

2.4. Statistik Area Kecil untuk Data BPS ............................................

23

2.4.1. Jenis Data yang Dikumpulkan ..........................................

24

2.4.2. Rancangan Penarikan Contoh Susenas .............................

25

2.4.3. Pendugaan Data Rumah Tangga .......................................

27

2.4.4. Persoalan Ukuran Contoh pada Susenas ...........................

28

III. METODE PREDIKSI TAK-BIAS LINEAR TERBAIK UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE …… . .........................................................................................

31

3.1. Pendahuluan ..................................................................................

31

3.2. MCLT dengan Pengaruh Acak Area dan Waktu ..........................

40

II.

xiv

3.3. Model State Space pada Pendugaan Area Kecil ...........................

41

3.4. Pendugaan Parameter Model dengan KMT ..................................

44

3.4.1. Penduga Tak-bias Linear Terbaik (PTLT) ........................

44

3.4.2. Penduga Dua Tahap ..........................................................

46

3.5. Pendekatan Orde Kedua untuk KTG .............................................

48

3.6. Evaluasi terhadap Penduga KTG ..................................................

51

3.7. Penerapan pada Data Susenas dan Simulasi ..................................

59

3.7.1. Data Susenas .....................................................................

59

3.7.2. Data Simulasi ....................................................................

64

3.8. Simpulan .......................................................................................

66

IV. METODE BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE ........................

68

4.1. Pendahuluan ..................................................................................

68

4.2. Metode Bayes Empirik ..................................................................

68

4.3. Metode Bayes Berhirarki ..............................................................

73

4.3.1. Kasus 2 Diketahui ...........................................................

76

4.3.2. Kasus 2 Tidak Diketahui .................................................

77

4.4. Bayes Berhirarki untuk Model State Space ..................................

78

4.5. Penduga Bagi KTG .......................................................................

85

4.6. Metode Gibbs Sampling ................................................................

89

4.7. Penerapan pada Data Susenas dan Simulasi ..................................

90

4.7.1. Data Susenas .....................................................................

90

4.7.2. Data Simulasi ....................................................................

96

4.8. Simpulan ....................................................................................... 101 V.

PEMBAHASAN UMUM ..................................................................... 103 5.1. Pendahuluan .................................................................................. 103 5.2. Keunggulan Metode Bayes daripada Metode PTLT pada Model SAE Secara Analitik ..................................................................... 104 5.3. Hasil Studi Kasus pada Data ......................................................... 107 5.4. Lesson Learned ............................................................................. 112

VI. SIMPULAN DAN SARAN .................................................................. 113 6.1. Simpulan ....................................................................................... 113 6.2. Saran ….......................................................................................... 114

xv

DAFTAR PUSTAKA ..................................................................................... 116 DAFTAR ISTILAH DAN SINGKATAN ...................................................... 121 LAMPIRAN .................................................................................................... 122

xvi

DAFTAR TABEL

Tabel 2.1. Perbandingan Antara Ukuran Contoh Susenas 2005 (n) dengan Jumlah n Minimum pada Batas d = 0.01. ..................................

28

Tabel 3.1. Perbandingan Antara Metode Pendugaan Langsung dengan Metode Pendugaan Tidak Langsung untuk Rata-rata Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas 2005 Wilayah Kota Bogor ............................................

61

Tabel 3.2. Perbandingan Antara Metode PTLTE Penampang Melintang dengan Metode PTLTE Deret Waktu untuk Data Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .....................................................

62

Tabel 3.3. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode PTLTE Penampang Melintang dan Metode PTLTE Deret Waktu untuk Data Simulasi .......................................................

64

Tabel 3.4. Nilai Rata-rata AKTGR pada Metode PTLTE Penampang Melintang dan Metode PTLTE Deret Waktu untuk Data Simulasi ......................................................................................

65

Tabel 4.1. Perbandingan Antara Metode PTLTE dengan Metode Bayes Berhirarki Model 1 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .....................................................

92

Tabel 4.2. Perbandingan Antara Metode Bayes Berhirarki Model 1 dengan Model 2 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .................................................................................

94

Tabel 4.3. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode Bayes Berhirarki Model 1 dengan Model 2 untuk Data Simulasi ........

97

Tabel 4.4. Nilai Rata-rata AKTGR pada Metode Bayes Berhirarki Model 1 dengan Model 2 untuk Data Simulasi .....................................

98

Tabel 5.1. Perbandingan KTG dan AKTG Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .................................................................................

109

Tabel 5.2. Perbandingan KTG dan AKTG Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor .................................................................................

110

Tabel 5.3. Nilai Rata-rata AKTGR pada Metode PTLTE dan Bayes Berhirarki untuk Data Simulasi Deret Waktu ............................

111

xvii

DAFTAR GAMBAR

Gambar 2.1. Diagram Alur Metode Penarikan Contoh Susenas .................

27

Gambar 3.1. Plot Antara AKTG Penduga Langsung dengan AKTG Hasil Metode PTLTE Data Penampang Melintang ..........................

62

Gambar 3.2. Plot Antara AKTG Metode PTLTE Penampang Melintang dengan AKTG Metode PTLTE Deret Waktu .........................

63

Gambar 4.1. Plot Antara AKTG Metode PTLTE dengan AKTG Metode Bayes Berhirarki Model 1 .......................................................

93

Gambar 4.2. Plot Antara AKTG Metode Bayes Berhirarki Model 1 dan Model 2 ...................................................................................

95

Gambar 4.3. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 0 untuk Metode Bayes Berhirarki Model 1 dan Model 2 ...........

98


99


99


100


100


101

xviii

DAFTAR LAMPIRAN

Lampiran 1. Program R untuk Bayes Berhirarki Model 1 ...........................

123

Lampiran 2. Program R untuk Bayes Berhirarki Model 2 ...........................

128

Lampiran 3. Program R untuk Simulasi Data ..............................................

134

Lampiran 4. Perbandingan Antara Metode Pendugaan Langsung dengan Metode Pendugaan Tidak Langsung untuk Rata-rata Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas 2005 Wilayah Kota Bogor .........................................

139

Lampiran 5. Perbandingan Antara Metode PTLTE Penampang Melintang dengan Metode PTLTE Deret Waktu untuk Data Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor ..................................................

141

Lampiran 6. Perbandingan Antara Metode PTLTE dengan Metode Bayes Berhirarki Model 1 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor ..................................................

143

Lampiran 7. Perbandingan Antara Metode Bayes Berhirarki Model 1 dengan Model 2 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor ..............................................................................

145

Lampiran 8. Perbandingan KTG dan AKTG Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor ..................................................

147

Lampiran 9. Metode Pendugaan Langsung yang digunakan oleh BPS untuk Data Susenas (BPS, 2005) ............................................

149

xix

BAB I 1.

Pendahuluan

1.1. Latar Belakang Survei merupakan salah satu bagian penting dari proses pengambilan keputusan yang berbasis pada data. Karena itu, survei sering dilakukan secara rutin baik di lembaga penelitian swasta maupun negeri. Terkait dengan persoalan survei tersebut, ada dua topik utama yang menjadi perhatian para statistisi pada tahun-tahun terakhir ini. Topik tersebut menyangkut persoalan pengembangan teknik penarikan contoh dan pengembangan metodologi pendugaan parameter populasi untuk area dengan contoh kecil. Survei rutin yang dilakukan oleh pemerintah suatu negara, umumnya didesain untuk memperoleh statistik nasional. Artinya, survei semacam ini didesain untuk inferensia bagi daerah yang luas. Persoalan muncul ketika dari survei seperti ini ingin diperoleh informasi untuk area yang lebih kecil, misalnya informasi pada level propinsi, kabupaten, bahkan mungkin level kecamatan. Ukuran contoh pada level area tersebut biasanya sangat kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar. Bahkan bisa saja pendugaan tidak dapat dilakukan karena area tersebut tidak terpilih menjadi contoh dalam survei. Oleh karena itu dikembangkan metode pendugaan parameter yang dapat mengatasi hal ini. Metode tersebut dikenal dengan metode pendugaan area kecil (small area estimation, SAE). Statistik area kecil semacam itu telah menjadi perhatian para statistisi dunia secara sangat serius sejak sepuluh tahun terakhir ini (misalnya Ghosh and Rao, 1994; Chand dan Alexander, 1995; You dan Rao, 2000; Rao, 2003; Russo et.al., 2005; Chambers dan Chandra, 2006; Lahiri, 2008). Berbagai metode SAE telah dikembangkan khususnya menyangkut metode yang berbasis model. Area kecil tersebut didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil

1

didasarkan pada aplikasi model desain penarikan contoh (design-based) yang dikenal sebagai pendugaan langsung (direct estimation). Namun, metode pendugaan langsung pada sub-populasi tidak memiliki presisi yang memadai karena kecilnya jumlah contoh yang digunakan untuk memperoleh dugaan tersebut. Oleh karena itu dikembangkan metode pendugaan secara tidak langsung (indirect estimation) di suatu area yang relatif kecil dalam percontohan survei (Lahiri dan Rao, 1995; Russo et al, 2005) Menurut Lahiri (2008), metode pendugaan tidak langsung pada area kecil pada dasarnya memanfaatkan kekuatan area sekitarnya (neighbouring areas) dan sumber data di luar area yang statistiknya ingin diperoleh. Dalam hal ini, model dikembangkan dengan asumsi bahwa keragaman didalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi penyerta (auxiliary) yang berupa pengaruh tetap, sedangkan keragaman specifik area kecil diasumsikan dapat diterangkan oleh informasi tambahan yang berupa pengaruh acak area. Meningkatnya kebutuhan terhadap metode SAE saat ini terjadi seiring dengan meningkatnya kebutuhan pemerintah dan para pengguna statistik (termasuk dunia bisnis) terhadap informasi yang lebih rinci, cepat, dan handal, tidak saja untuk lingkup negara tetapi pada lingkup yang lebih kecil seperti provinsi, kabupaten, bahkan kecamatan atau kelurahan. Di Indonesia pentingnya statistik area kecil semakin dirasakan seiring dengan era otonomi daerah dimana sistem ketatanegaraan bergeser dari sistem sentralisasi ke sistem desentralisasi. Pada sistem desentralisasi pemerintah daerah memiliki kewenangan yang lebih besar untuk mengatur dirinya sendiri. Kebutuhan statistik pada level kabupaten, dengan demikian, menjadi keniscayaan sebagai dasar bagi pemerintah daerah untuk menyusun sistem perencanaan, pemantauan dan penilaian pembangunan daerah atau kebijakan penting lainnya. Menurut Sadik et al (2006, 2008), model pendugaan parameter area kecil akan sangat membantu khususnya dalam menyediakan kebutuhan data dan informasi yang akurat untuk kebutuhan daerah di Indonesia seperti level propinsi, kabupaten/kota atau bahkan kecamatan dengan memanfaatkan keakuratan data BPS pada level nasional, tanpa harus mengeluarkan biaya besar untuk

2

mengumpulkan data sendiri. Dengan demikian, secara nasional akan cukup banyak biaya yang bisa dihemat sehingga dapat dialokasikan untuk pembiayaan pembangunan lainnya.

1.2. Tujuan Penelitian Secara umum tujuan penelitian ini adalah untuk mengkaji sifat-sifat statistik pada: a.

Model campuran linear terampat (generalized linear mixed model) sebagai model dasar SAE.

b.

Model SAE yang memasukkan pengaruh acak area dan waktu (state space) melalui pendekatan prediksi tak-bias linear terbaik (best linear unbiased prediction).

c.

Model SAE yang memasukkan pengaruh acak area dan waktu (state space) melalui pendekatan Bayes berhirarki.

1.3. Ruang Lingkup Fokus penelitian ini adalah kajian terhadap metode SAE yang memasukkan pengaruh acak area dan waktu berdasarkan model state space. Pendekatan yang digunakan untuk pendugaan parameter model tersebut adalah metode prediksi takbias linear terbaik (PTLT) dan Bayes berhirarki. Penelaahan terhadap konsep dan sifat-sifat statistik model dilakukan secara analitik dan empirik. Pada Bab II dibahas tinjauan metode SAE secara umum mencakup perkembangan metode SAE, metode pendugaan tidak langsung pada area kecil, pendekatan model campuran linear terampat (MCLT) pada SAE, pengaruh penarikan contoh pada pendugaan tidak langsung, serta persoalan statistik area kecil pada data Badan Pusat Statistik (BPS). Sementara kajian tentang metode PTLT pada pendugaan area kecil berdasarkan model state space dipaparkan pada Bab III yang mencakup pendekatan MCLT pada model SAE dengan pengaruh acak area dan waktu, metode PTLT, pendekatan kuadrat tengah galat / KTG (mean square error / MSE) dengan orde kedua, evaluasi terhadap penduga KTG, serta studi kasus penerapan pada data Susenas dan data simulasi.

3

Metode Bayes berhirarki pada pendugaan area kecil berdasarkan model state space dibahas pada Bab IV. Pembahasan tersebut mencakup konsep metode Bayes empirik dan berhirarki, pendekatan Bayes berhirarki pada model state space, penduga bagi KTG, metode Gibbs sampling, serta studi kasus penerapan pada data Susenas dan data simulasi. Pembahasan umum pada Bab V bertujuan untuk membandingkan sifat-sifat statistik model SAE state space antara metode PTLT dengan metode Bayes berhirarki baik secara empirik maupun analitik. Sementara Bab VI memaparkan simpulan dari penelitian secara keseluruhan dan saran untuk penelitian selanjutnya khususnya menyangkut hal-hal keterbatasan pada penelitian ini.

1.4. Kebaruan / Novelty Pemikiran tentang SAE yang berbasis pada model telah mendapatkan perhatian para statistisi dunia hingga saat ini khususnya setelah JNK Rao (2003) mengeluarkan buku tentang SAE. Buku tersebut merupakan buku pertama yang membahas tentang pendugaan area kecil dengan cara mengkompilasi beberapa hasil penelitian yang telah dipublikasikan di berbagai jurnal ilmiah internasional. Sampai saat ini banyak dilakukan konferensi statistika internasional terkait dengan pengembangan metode pendugaan area kecil tersebut. Penelitian yang menjadi topik dalam disertasi ini merupakan perluasan kajian SAE dari beberapa hasil kajian para statistisi dunia yang mereka publikasikan dalam jurnal ilmiah. Ada dua kebaruan yang disajikan dalam disertasi ini. Pertama adalah penjabaran dan pembuktian secara analitik terhadap sifat-sifat statistik pada model SAE yang berbasis pada model state space. Kedua, kajian metode PTLT dan Bayes berhirarki untuk SAE berdasarkan model state space serta penerapannya pada data Susenas BPS merupakan kajian yang pertama kali dilakukan di Indonesia. Sehingga hasil kajian dalam disertasi ini diharapkan dapat memberikan sumbangsih pemikiran pada perkembangan perstatistikaan di Indonesia.

4

BAB II 2.

Tinjauan Metode Pendugaan Area Kecil

2.1. Pendahuluan Survei digunakan untuk mendapatkan informasi mengenai parameter populasi dengan mengefektifkan biaya yang tersedia. Secara lebih luas survei secara praktis tidak hanya digunakan untuk menduga total populasi tetapi juga untuk menduga keragaman subpopulasi atau domain. Domain dapat didefinisikan sebagai daerah geografik, sosio-demografi, dan sebagainya. Dalam konteks survei, penduga dikatakan langsung (direct estimator) apabila pendugaan terhadap parameter populasi di suatu domain hanya didasarkan pada data contoh yang diperoleh dari domain tersebut. Misalnya, pendugaan rata-rata tingkat pengeluaran rumah tangga perbulan di suatu kabupaten didasarkan hanya pada data survei yang diperoleh dari kabupaten tersebut. Informasi lain yang berada di luar domain kabupaten tersebut tidak diperhitungkan. Pendugaan langsung umumnya didasarkan pada teknik penarikan contohnya (sampling technique). Teknik semacam ini telah dikembangkan oleh Cochran (1977), Swenson dan Wretman (1989), dan Thompson (1997). Metode yang didasarkan pada pemodelan (model-based) juga telah dikembangkan. Survei contoh termasuk dalam kelompok non-percobaan (non-experimental) yang lazim disebut studi observasional. Tujuan utamanya adalah menduga nilai sejumlah peubah yang terdapat dalam populasi. Meskipun sejumlah hipotesis dapat diuji berdasarkan data yang diperoleh dari suatu survei, namun hal ini umumnya merupakan tujuan sekunder dalam survei (Levy dan Lemeshow, 1999). Survei contoh dapat dikategorikan kedalam dua kelompok besar berdasarkan pada metode pemilihan contoh, yaitu contoh berpeluang (probability samples) dan contoh tak-berpeluang (nonprobability samples). Contoh berpeluang memiliki karakteristik bahwa setiap elemen dalam populasi diketahui peluangnya untuk terpilih sebagai contoh. Sedangkan pada contoh tak-berpeluang tidak

5

memiliki karakteristik ini, yaitu peluang suatu elemen dalam populasi untuk terpilih sebagai contoh tidak diketahui berapa besar peluangnya. Pada penarikan contoh berpeluang, karena setiap elemen diketahui peluangnya untuk terpilih, maka penduga tidak bias parameter populasi yang berupa fungsi linear dari pengamatan (rataan populasi, proporsi, total) dapat diformulasikan dari data contoh. Demikian juga, galat baku bagi penduga ini bisa diperoleh sehingga reliabilitas dan validitas dapat dievaluasi. Pada survei contoh mencakup dua hal penting, yaitu perencanaan penarikan contoh (sampling plan) dan prosedur pendugaan parameter. Perencanaan penarikan contoh adalah metodologi yang digunakan untuk pemilihan contoh dari populasi. Sedangkan prosedur pendugaan parameter merupakan algoritma atau formula yang digunakan untuk memperoleh dugaan nilai populasi dari data contoh dan untuk menduga reliabilitas dari penduga tersebut (Levy and Lemeshow, 1999). 2.1.1. Keuntungan dan Keterbatasan Penarikan Contoh Penarikan contoh memiliki beberapa keuntungan dibandingkan dengan enumerasi secara lengkap terhadap populasi, diantaranya adalah lebih ekonomis, lebih pendek jedah waktunya (time-lag), cakupannya lebih luas, dan mutu pekerjaan lebih baik karena lebih terencana (Som, 1996). Penarikan contoh memerlukan sumberdaya yang lebih baik untuk merancang dan melaksanakannya sehingga biaya per unit pengamatan adalah lebih tinggi daripada enumerasi secara lengkap. Namun total biaya untuk penarikan contoh adalah lebih kecil daripada enumerasi secara lengkap dalam suatu cakupan populasi tertentu. Demikian juga, dengan jumlah pengamatan yang lebih kecil, penarikan contoh memungkinkan untuk lebih cepat dibandingkan dengan enumerasi secara lengkap. Penarikan contoh memiliki cakupan yang lebih luas daripada enumerasi secara lengkap 2.1.2. Validitas, Reliabilitas, dan Keakuratan Sebagaimana disebutkan sebelumnya bahwa pada contoh berpeluang, reliabilitas dan validitas penduga dapat dievaluasi. Reliabilitas (reliability) penduga parameter populasi merujuk pada bagaimana penduga tersebut dihasilkan

6

apabila survei yang sama dilakukan secara berulang-ulang. Apabila diasumsikan bahwa tidak ada kesalahan pengukuran dalam survei, maka reliabilitas suatu penduga parameter dapat digambarkan oleh ragam penarikan contohnya atau ekuivalen dengan galat bakunya. Sehingga penduga yang memiliki galat baku terkecil, maka penduga tersebut memiliki reliabilitas terbesar. Validitas (validity) penduga parameter populasi ( θˆ ) merupakan gambaran tentang bagaimana rataan dari penduga-penduga suatu parameter yang diperoleh dari proses survei yang dilakukan secara berulang-ulang berbeda dari nilai parameter yang sebenarnya (). Apabila diasumsikan bahwa tidak ada kesalahan pengukuran dalam survei, maka validitas suatu penduga parameter dapat dievaluasi dari nilai bias penduga tersebut, yaitu E( - θˆ ). Penduga yang memiliki bias terkecil merupakan penduga yang memiliki validitas terbesar. Sementara keakuratan (accuray) suatu penduga menunjukkan tentang seberapa jauh penyimpangan nilai dugaan dari nilai parameter yang sebenarnya. Keakuratan suatu penduga umumnya dievaluasi berdasarkan nilai kuadrat tengah galat / KTG (mean square error / MSE) atau berdasarkan nilai akar kuadrat tengah galat / AKTG (root mean square error / RMSE) yaitu

E (θ  θˆ ) 2 .

2.1.3. Pendugaan Ukuran Contoh Salah satu persoalan penting dalam perancangan contoh adalah menentukan berapa besar contoh yang diperlukan untuk memperoleh penduga yang memiliki tingkat reliabilitas tertentu sesuai dengan tujuan survei. Secara umum, ukuran contoh yang lebih besar akan memberikan tingkat reliabilitas yang juga lebih besar terhadap hasil pendugaan. Kesalahan relatif, , dalam pendugaaan parameter dapat dikontrol pada saat melakukan penarikan contoh. Pada penarikan contoh acak sederhana dapat dinyatakan bahwa  ˆ    P  ξ  α     

( 2.1 )

dimana  adalah nilai peluang tertentu. Sebagaimana telah dijabarkan sebelumnya bahwa ˆ dapat diasumsikan menyebar normal dengan ragam V( ˆ ) yaitu

7

N

V( ˆ ) =

(y ( N  n)  N

  )2

 N nσy   n( N  1)  N  n

i 1

i

2

sehingga σ   = z/2 V (ˆ) = z/2  N  n  y  N  n 2

.

Penyelesain untuk ukuran contoh n adalah 2

 z / 2 σ y     ξY  N ( z / 2 )2 ψ 2y   n=  2 2 2 2  1  z / 2σ y   ( z / 2 ) ψ y  Nξ 1    N  ξY    

( 2.2 )

dimana ψ y = σ y /  merupakan koefisien keragaman. Sebuah pendekatan untuk menentukan ukuran contoh kadang-kadang dapat dikembangkan bila keputusan praktis dibuat dari hasil-hasil contoh. Dasar keputusan akan menjadi lebih jelas jika pendugaan contoh mempunyai kesalahan yang rendah daripada jika mempunyai kesalahan yang tinggi. Masih memungkinkan untuk menghitung masalah keuangan, kerugian l(h) yang muncul dalam sebuah keputusan dengan sebuah kasalahan dalam pendugaannya. Meskipun nilai sebenarnya dari h tidak dapat diramalkan sebelumnya, teori penarikan contoh menunjukkan bahwa untuk mendapatkan sebaran frekuensi f(h, n) dari h, yang untuk metode penarikan contoh tertentu akan tergantung pada ukuran contoh n. Dengan demikian kerugian yang diharapkan untuk ukuran contoh tertentu adalah: L(n)   l (h) f (h, n)dh .

Tujuan dari pengambilan contoh adalah untuk mengurangi kerugian ini. Jika C(n) adalah biaya dari ukuran contoh n, sebuah prosedur yang beralasan adalah dengan memilih n untuk meminimumkan: C(n) + L(n) karena ini adalah total biaya yang diperlukan dalam pengambilan contoh dan dalam pembuatan keputusan berdasarkan hasil-hasil contoh. Pemilihan ukuran

8

contoh n ditentukan oleh ukuran contoh yang optimum dan tingkat ketelitian yang paling tinggi. Sebagai alternatif, pendekatan yang sama dapat disajikan dalam keuntungan ekonomis (monetary gain) yang diperoleh dari contoh yang dimiliki, bukannya kerugian yang timbul dari kesalahan informasi contoh. Jika keuntungan keuangan yang digunakan, maka dapat dibentuk suatu harapan keuntungan G(n) dari sebuah contoh berukuran n, dengan G(n) adalah nol jika tidak ada contoh yang diambil. Berarti harus memaksimumkan G(n) - C(n). Aplikasi yang sangat sederhana terjadi bila fungsi kerugian, l(h), adalah h2, dengan  adalah konstanta, sehingga dapat dinyatakan bahwa L(n) = E(h2). Misalkan ˆ adalah penduga dari  dan h = ˆ -  , maka 1 1  L(n)  λV (ˆ)  λσ 2y    n N 

( 2.3 )

jika yang digunakan adalah penarikan contoh acak sederhana. Sementara bentuk sederhana dari fungsi biaya untuk contoh adalah C(n) = c0 + c1n dimana c0 adalah biaya tetap. Berdasarkan fungsi biaya dan kerugian, nilai dari n yang meminimumkan biaya dan kerugian adalah n λ

σ 2y c1

.

2.2. Perkembangan Metode SAE Persoalan statistik area kecil telah menjadi perhatian serius para statistisi sejak 10 tahun terakhir ini, meskipun dasar pemikirannya telah dimulai jauh sebelumnya. Pendugaan karakteristik area kecil berdasarkan model pengaruh tetap merujuk pada synthetic estimator (Levy, 1971), composite estimator (Schaible et. al., 1977) dan prediction estimator (Holt et. al., 1979). Model pengaruh tetap menerangkan seluruh keragaman peubah respon di dalam area kecil oleh keragaman faktor-faktor yang diketahui.

9

Fay dan Herriot (1979) mengajukan suatu metode pemodelan untuk menduga pendapatan perkapita untuk suatu area kecil berdasarkan data survei Biro Sensus Amerika Serikat (U.S. Bureau of the Cencus). Area kecil yang dimaksudkan oleh Fay dan Herriot sama dengan Levy dan Holt di atas, yaitu suatu area survei dimana ukuran contoh pada area tersebut sangat kecil. Perbedaannya, Fay dan Herriot memasukkan pengaruh acak pada modelnya. Asumsi dasar dalam pengembangan model untuk pendugaan area kecil (SAE) tersebut adalah bahwa keragaman di dalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang disebut sebagai pengaruh tetap. Asumsi lainnya adalah bahwa keragaman specifik area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak area kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh campuran (mixed models). Dibandingkan dengan model pengaruh tetap, model campuran memiliki cakupan aplikasi yang lebih luas. Model Fay-Herriot tersebut menggunakan model campuran yang telah menjadi kajian para statistisi sebelumnya. Salah satu sifat yang menarik dalam model campuran adalah kemampuannya dalam menduga kombinasi linear dari pengaruh tetap dan pengaruh acak. Henderson (1949-1975) mengembangkan teknik penyelesaian model pengaruh campuran untuk memperoleh prediksi tak-bias linear terbaik / PTLT (best linear unbiased prediction / BLUP). Metode PTLT yang dikembangkan tersebut mengasumsikan diketahuinya ragam pengaruh acak dalam model campuran (komponen ragam). Padahal dalam prakteknya, komponen ragam tidak bisa diketahui dan harus diduga berdasarkan data. Selanjutnya, Harville (1977) melakukan kajian terhadap beberapa metode pendugaan komponen ragam, dengan memasukkan metode maximum likelihood dan residual maximum likelihood. Penduga PTLT yang diperoleh dengan cara terlebih dahulu menduga komponen ragamnya disebut sebagai prediksi tak-bias linear terbaik empirik / PTLTE (empirical best linear unbiased prediction / EBLUP) seperti yang dikembangkan Harville (1990) dan Robinson (1991). Metode PTLTE tersebut mengasumsikan bahwa pengaruh acak memiliki sebaran normal. Schall (1991), McGilchrist dan Aisbett (1991), Breslow dan

10

Clayton (1993), Breslow dan Lin (1995), McGilchrist (1994), dan Marker (1999) mengembangkan PTLTE untuk model linear terampat (generalized linear models) yang pengaruh acaknya diasumsikan memiliki sebaran keluarga eksponensial. Zeger dan Karim (1991) memperkenalkan pendekatan Gibbs sampling untuk penyelesaian model campuran. Teknik komputasi Monte Carlo ExpectationMaximization dan Monte Carlo Newton-Raphson digunakan oleh McCulloch (1994 dan 1997). Sementara Datta dan Ghosh (1991), Ghosh dan Rao (1994), Pfeffermann (1999), Ghosh dan Lahiri (1987), Rao (1999, 2003), serta Chambers dan Tzavidis (2006) menggunakan model campuran untuk meningkatkan akurasi pendugaan pada kasus area kecil berdasarkan data survey atau data sensus. Selain PTLTE, pendugaan dan inferensia pada SAE juga menggunakan Bayes empirik (empirical Bayes) dan Bayes berhirarki (hierarchical Bayes). Pada pendekatan Bayes empirik, pendugaan dan inferensia berdasarkan pada sebaran posterior yang diduga dari data. Adapun pada pendekatan Bayes berhirarki, parameter model yang tidak diketahui (termasuk komponen ragam) diperlakukan sebagai komponen acak yang masing-masing memiliki sebaran prior tertentu. Sebaran posterior untuk parameter yang menjadi perhatian diperoleh berdasarkan seluruh sebaran prior tersebut. Ghos dan Rao (1994) mengulas penggunaan Bayes berhirarki pada SAE. Deely dan Lindley (1991), Maiti (1998), Datta et al (1996, 1999) menggunakan non-informative prior untuk kasus hiperparameter pada penggunaan Bayes berhirarki. You dan Rao (2000) menggunakan Bayes berhirarki untuk menduga rataan area kecil berdasarkan model pengaruh acak. Malec et al (1999) mengembangkan model yang digunakan pada Malec et al (1997) dengan memasukkan komponen oversampling di dalam likelihood. Farrell et al (1997) mengembangkan model logistik campuran yang digunakan oleh MacGibbon dan Tomberlin (1989). Moura dan Mignon (2001) lebih mengembangkan model tersebut dengan memasukkan komponen struktur korelasi spasial pada data respon biner. Saat ini penelitian dan pengembangan metode SAE semakin meningkat semenjak JNK Rao menerbitkan buku yang berjudul ’Small Area Estimation’ pada tahun 2003, sebagai buku pertama di dunia yang membahas tentang metode SAE. Seminar dan konferensi internasional tentang SAE saat ini banyak

11

diselenggarakan di berbagai negara. Salah satunya diselenggarakan di Spanyol pada Juli 2009 yang dihadiri oleh berbagai statistisi dunia termasuk JNK Rao. Pada konferensi tersebut didiskusikan berbagai problem SAE termasuk aplikasinya pada data survei di berbagai negara. Perkembangan dan aplikasi metode SAE di Indonesia pada konferensi tersebut dikemukakan oleh Sadik dan Notodiputro (2009). 2.2.1. Metode Pendugaan Tidak Langsung untuk Area Kecil Ukuran contoh pada sub-area survei terkadang berukuran kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar atau bahkan pendugaan bisa saja tidak dapat dilakukan pada sub-area tertentu karena sub-area tersebut tidak terpilih menjadi contoh. Metode SAE dikembangkan untuk menyelesaikan masalah tersebut. Area kecil tersebut didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil didasarkan pada aplikasi model desain penarikan contoh yang menghasilkan metode pendugaan langsung (Rao, 2003; Chambers dan Chandra, 2006; Lahiri, 2008). Informasi tambahan dapat digunakan untuk meningkatkan akurasi dan presisi suatu penduga. Pada SAE, informasi tambahan tersebut dapat berupa nilai parameter dari area kecil lain yang memiliki karakteristik serupa dengan area kecil yang menjadi perhatian, atau nilai pada waktu yang lalu, atau nilai dari peubah yang memiliki hubungan dengan peubah yang sedang diamati. Pendugaan paramater dan inferensianya yang berdasarkan pada informasi tambahan tersebut, dinamakan pendugaan tidak langsung atau model-based. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat penguatan (borrowing strength) dari hubungan antara nilai peubah respon dan informasi tambahan tersebut. Asumsi dasar dalam pengembangan model untuk SAE adalah bahwa keragaman didalam area kecil peubah respon dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang disebut sebagai pengaruh tetap. Asumsi lainnya adalah bahwa keragaman specifik area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak area

12

kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh campuran (mixed models). Model pengaruh tetap menerangkan seluruh keragaman peubah respon di dalam area kecil oleh keragaman faktor-faktor yang diketahui. Pendugaan karakteristik area kecil berdasarkan model pengaruh tetap merujuk pada synthetic estimator (Levy, 1971), composite estimator (Schaible et. al., 1977) dan prediction estimator (Holt et. al., 1979; Sarndal, 1984; dan Marker, 1999). Pendugaan

langsung

umumnya

didasarkan

pada

teknik

penarikan

contohnya. Teknik semacam ini telah dikembangkan oleh Cochran (1977), Swenson dan Wretman (1989), dan Thompson (1997). Metode yang didasarkan pada pemodelan juga telah dikembangkan, misalnya seperti yang dilakukan oleh You dan Rao (2000). Pada pendugaan yang berbasis pada rancangan survei, pembobot rancangan wj(s) memiliki peranan penting dalam membentuk penduga berbasis rancangan Yˆ bagi Y. Pembobot ini tergantung pada s dan elemen j (js). Salah satu bentuk pembobot yang penting adalah wj(s)=1/j, dimana j = {s:js}p(s), j=1, 2, .., N. Apabila tidak informasi penyerta, maka penduga langsung dapat diekspresikan sebagai Yˆ = {s:js}wj(s)yj. Dalam kasus ini, rancangan tidak berbias apabila terpenuhi {s:js}p(s)wj(s) = 1 untuk j=1, 2, …, N. Pembobot ini merupakan bentuk umum dari penduga Horvitz-Thompson (Cochran, 1977). Pendugaan langsung ini dapat pula menggunakan informasi penyerta yang ada pada domain yang bersangkutan. Misalkan informasi penyerta dalam domain tertentu, X = (X1, …, Xp)T, tersedia dan vektor xj untuk js terobservasi, sehingga data (yj, xj) untuk setiap elemen js terobservasi. Suatu penduga yang mengefisienkan informasi penyerta ini adalah generalized regression (GREG) yang bisa ditulis sebagai berikut:

YˆGR  Yˆ  ( X  Xˆ ) T Bˆ

( 2.4 )

dimana Xˆ = {s:js}wj(s)xj dan Bˆ  ( Bˆ1 ,..., Bˆ p ) T adalah solusi dari persamaan kuadrat

terkecil

terboboti

dari

contoh,

yaitu

({s:js}wj(s)xjxjT/cj) Bˆ =

{s:js}wj(s)xjyj/cj dengan cj(>0) sebagai konstanta spesifik.

13

Pendugaan tidak langsung dapat menggunakan pendekatan model secara umum. Misalkan diasumsikan bahwa i = g( Yi ) untuk beberapa spesifikasi g(.) dihubungkan dengan data penyerta spesifik pada area i, xi = (x1i, …, xpi)T melalui suatu model linear i = xiT + bivi,

i = 1, …, m

dimana bi adalah konstanta positif yang diketahui dan  adalah vektor berukuran px1. Sedangkan vi adalah pengaruh acak spesifikasi area yang diasumsikan bebas dan menyebar identik dengan Em(vi) = 0 dan Vm(vi) = v2 ( 0), atau vi  iid (0, v2). Pendugaan tidak langsung untuk rataan populasi di area kecil i, ( Yi ), diperlukan informasi mengenai penduga langsungnya yaitu Yˆ . Dengan menggunakan metode James-Stein akan diperoleh:

ˆ i  g(Yˆ ) = i + ei ˆ i  xiT + bivi + ei, i = 1, …, m

( 2.5 )

dimana galat penarikan contoh (sampling error) ei adalah bebas dengan Ep(ei|i) = 0 dan Vp(ei|i) = i, atau vi  iid (0, v2). 2.2.2. Pendekatan Model Campuran Linear Terampat Rao(2003) mengaitkan model-model pendugaan tidak langsung (modelbased) di atas sebagai bagian dari model campuran linear terampat / MCLT (generalized linear mixed model / GLMM) yang menggabungkan antara pengaruh tetap dan pengaruh acak dalam suatu model umum. Datta dan Ghosh (1991) mengemukakan formulasi model MCLT sebagai berikut : yP = XP + ZPv + eP.

( 2.6 )

Pada model ini v dan eP bebas dengan eP  N(0, 2P) dan v  N(0, 2D()), dimana P adalah matriks definit positif yang diketahui dan D() adalah matriks definit positif yang strukturnya diketahui. Sedangkan XP dan ZP adalah matriks rancangan dan YP adalah vektor N x 1 dari nilai y populasi. Matriks koragam bagi v dan e masing-masing adalah G dan R. Persamaan di atas dapat pula ditulis sebagai berikut:

14

y   X  Z  e  y P          v    y *  X * Z * e *

( 2.7 )

dimana bagian yang ditandai asterisk (*) menunjukkan unit yang tidak tercakup dalam contoh. Vektor untuk total (Yi) pada area kecil adalah berbentuk Ay + Cy* dengan A =  im1 1Tni dan C =  im1 1TN i ni dimana  im1 A u = blockdiag(A1, …, Am). Pada MCLT ini dilakukan pendugaan terhadap kombinasi linear dari parameter yaitu  = 1T + mTv. Rao (2003) mengemukakan bahwa untuk  tertentu yang diketahui maka penduga PTLT bagi  adalah ~ ~ ~ ~ H = t(, y) = 1T   + mT ~v = 1T  + mTGZTV-1(y - X  )

( 2.8 )

dimana ~ ~  =  () = (XTV-1X)-1XTV-1y ~ ~ v =~ v () = GZTV-1(y - X  ).

Model untuk pendugaan tidak langsung, yaitu ˆ i  xiT + bivi + ei, i = 1, …, m, sebenarnya merupakan kasus khusus dari model MCLT, yaitu yi = ˆ i ,

Xi = xiT,

Zi = bi

dan vi = vi,

ei = ei,  = (1, …, p)T

sedangkan Gi = v2,

Ri = i

sehingga Vi = i + v2bi2 dan i = i = xiT + bivi. Apabila persamaan pendugaan tidak langsung disubstitusikan ke dalam pendugaan MCLT akan diperoleh penduga PTLT bagi i atau i yaitu: ~H ~ ~ i = xiT  + i( ˆ i - xiT  ), dimana i = v2bi2 /(i + v2bi2), dan  m xi xiT  ~ ~  =  (v2) =  2 2   i 1  i   v bi 

1

m x iî  .  2 2   i 1  i   v bi 

( 2.9 )

Ada tiga pendekatan standar untuk SAE didasarkan pada model MCLT tersebut, yaitu PTLTE, Bayes empirik, dan Bayes berhirarki. Metode PTLTE biasanya membutuhkan metode kemungkinan maksimum terkendala / KMT

15

(restricted maximum likelihood / REML) untuk pendugaan parameternya yang berkaitan dengan pengaruh area acak, yang identik dengan Bayes empirik dan Bayes berhirarki dalam beberapa keadaan. 2.2.3. Pengaruh Penarikan Contoh pada Pendugaan Tidak Langsung Sebagaimana dijabarkan di atas bahwa pada pendugaan tidak langsung, metode penarikan contoh akan mempengaruhi metode penghitungan nilai kuadrat tengah

galatnya.

Artinya,

pada

pendugaan

tidak

langsung

juga

mempertimbangkan metode pendugaan langsungnya bagi penduga parameternya maupun keragaman yang terdapat dalam penduga langsung tersebut. Pada model di atas yaitu,

ˆ i  g(Yˆ ) = i + ei ˆ i  xiT + bivi + ei, i = 1, …, m

( 2.10 )

pengaruh penarikan contoh diperhitungkan pada komponen ei sebagai galat penarikan contoh (sampling error) yang bebas dengan Ep(ei|i) = 0 dan Vp(ei|i) = i, atau vi  iid (0, v2). Pada persamaan ( 2.10 ) di atas, penduga langsung yang berbasis pada metode penarikan contoh tertentu berkontribusi pada nilai î dan Vp(ei|i) = i. Untuk penarikan contoh acak sederhana (simple random sampling) yang memilih n unit dari N sehingga setiap elemen dari NCn contoh yang berbeda mempunyai kesempatan yang sama untuk dipilih maka ˆ = y pada suatu area kecil tertentu dimana E( y ) = =

( N  1)! n!( N  n)! ( y1  y2  ...  y N ) (n  1)!( N  n)! nN ! ( y1  y2  ...  y N ) Y . N

( 2.11 )

Sehingga y merupakan penduga tidak bias bagi nilai tengah populasi Y . Sedangkan  = ragam bagi y untuk area kecil tertentu yang dapat dinyatakan sebagai E( y  Y )2, yaitu

 = V( y ) = E( y  Y )2 =

1 n  n 1  2 2 [ 1   {(y1  Y ) + …. + (yN  Y ) } 2 n N  N 1

16

=

N n N ( yi  Y ) 2  nN ( N  1) i 1 N

( N  n) = N N

dimana σ 2y 

(y i 1

i

(y i 1

i

 Y )2

 N nσy    N  n

2

n( N  1)

( 2.12 )

 Y )2

( N  1)

, sedangkan penduga bagi ragam y adalah  N  n  sy Vˆ ( y )     N n

2

n

(y

pada penduga ragam bagi y tersebut, s y2 

i

i 1

 y )2

(n  1)

merupakan penduga tidak

bias bagi ragam populasi σ 2y . Untuk penarikan contoh dengan pengembalian,  ragam bagi y yaitu

 = V( y ) =

N 1  N 2 n( N  1) n  y  2 yi y j 2   2  i 2 n  i 1 N N  i j N

1 = nN

( yi  Y ) 2  N  1 i 1 ( yi  Y ) 2   nN N 1 i 1 N

 N 1 σy =  .  N  n 2

( 2.13 )

Pada penarikan acak contoh berlapis, populasi N unitnya dibagi ke dalam subpopulasi, masing-masing N1, N2, ..., NL unit, dimana



L

1

N i  N , sehingga

subpopulasi ini tidak boleh tumpang tindih. Penduga langsung bagi  yaitu ˆ pada persamaan pendugaan area kecil ( 2.10 ) adalah ˆ = yst , yaitu L

yst 

N h 1

h

N

yh

L

 Wh yh

( 2.14 )

h 1

dimana Wh = Nh/N merupakan pembobot lapisan. Apabila dalam setiap lapisan penduga contohnya, yh , adalah tidak bias, maka yst merupakan penduga tidak bias bagi nilai tengah populasi Y , yaitu

17

 L  L E( yst ) = E   Wh yh    WhYh  h1  h1 karena penduganya, yh , adalah tidak bias pada tiap lapisan. Sementara itu, nilai tengah populasi dapat dinyatakan sebagai berikut: L

Y 

Nh

 yhi h 1 i 1

N

L



N Y

h h

h 1

N

L

 WhYh

( 2.15 )

h 1

berdasarkan penjabaran di atas, maka yst merupakan penduga tidak bias bagi nilai tengah populasi Y , karena E( yst ) = Y . Ragam penarikan contoh  yang berkontribusi pada pendugaan area kecil di atas dapat dinyatakan sebagai ragam bagi yst yaitu L L  L  L  = V( yst ) = V  Wh yh   Wh2V ( yh )  2WhW j Cov( yh , y j ) h 1 j  h  h 1  h 1

Apabila penarikan contohnya dilakukan secara bebas antar lapisan yang berbeda seluruh koragam di atas sama dengan nol, sehigga  L  L  = V( yst ) = V  Wh yh   Wh2V ( yh )  h1  h1 L

=

Wh2 h 1

σ 2h  N h  nh    nh  N h 

( 2.16 )

dimana Nh

σ 2h 

(y i 1

hi

 Yh ) 2

Nh  1

.

Pada penarikan contoh sistematik yang mengambil sebuah unit secara acak dari k unit yang pertama, dan selanjutnya mengambil setiap kelipatan k, Penduga langsung bagi  yaitu ˆ pada persamaan pendugaan area kecil ( 2.10 ) adalah ˆ = ysy . Pendekatan pada contoh sistematik adalah berupa penarikan contoh

berkelompok dimana kelompoknya mengandung n elemen dan contohnya terdiri dari satu kelompok, sehingga dapat dianggap bahwa N = nk. Berdasarkan hal ini,

ˆ = ysy merupakan penduga tidak bias bagi nilai tengah populasi Y untuk sebuah contoh sistematik yang ditempatkan secara acak.

18

Misalkan yij menyatakan anggota ke-j dari contoh sistematik ke-i, sehingga j = 1, 2, . . ., n ; i = 1, 2, . . ., k, dan rata-rata contoh ke-i dinotasikan dengan yi. maka  adalah ragam dari ysy yaitu: k

n

k

k

n

( N  1) S 2   ( yij  Y ) 2  n ( yi.  Y ) 2   ( yij  yi. ) 2 i 1 j 1

i 1

 nkV ( ysy )  k (n  1) S

i 1 j 1

2 wsy

sehingga

 = V ( ysy ) 

N  1 2 k (n  1) 2 S  S wsy N N

( 2.17 )

dimana

S2 

k n 1 k n 1 2 2 ( y  Y ) dan S  ( yij  yi. ) 2 .   ij wsy N  1 i 1 j 1 k (n  1) i 1 j 1

2 S wsy merupakan ragam antara unit-unit yang terletak di dalam contoh

sistematik yang sama. Pembagi dari ragam ini, k(n - 1) dibentuk dengan aturan yang umum dalam analisis ragam yaitu masing-masing dari k contoh memberikan (n - 1) derajat bebas pada jumlah kuadrat dalam pembilangnya. Bentuk lain untuk 

pada penarikan contoh acak berlapis ini dapat

dijabarkan sebagai berikut:

 N 1 S  = V ( ysy )    [1  (n  1) ρw ] .  N  n 2

( 2.18 )

Pada persamaan di atas,  w adalah koefisien korelasi antara pasangan dari unit-unit yang berada dalam contoh sistematik yang sama, yaitu ρw 

E ( yij  Y )( yiu  Y ) E ( yij  Y ) 2

.

Dimana pembilangnya adalah rata-rata seluruh kn(n – 1)/2 pasangan yang berlainan, dan penyebutnya keseluruhan nilai N dari yij. Karena penyebutnya adalah (N – 1)S2/N, maka  k n 2  ρw   ( yij  Y )( yiu  Y ) . 2   (n  1)( N  1) S  i 1 j  u

( 2.19 )

Pada penarikan contoh acak bergerombol, penduga langsung bagi  yaitu ˆ pada persamaan pendugaan area kecil ( 2.10 ) dapat dijelaskan sebagai berikut.

19

Misalnya yij adalah nilai yang diamati untuk elemen ke-j dalam unit atau kelompok ke-i, dan yi =  j 1 yij adalah total pada kelompok ke-i, dimana i = 1, 2, M

..., N dan j = 1, 2, ..., M. Apabila sebuah contoh acak sederhana kelompok berukuran n diambil dari N kelompok pada populasi dan pada masing-masing kelompok berisi M elemen. Misalkan yi menyatakan total pada kelompok ke-i dan

ˆ = y =



n i 1

yi / n , serta  adalah ragam y , yaitu n

 = V( y ) =

(y N n 

i

i 1

 Y )2

N 1

nN

.

Karena y = M y dan Y = M Y , maka y merupakan penduga tidak bias bagi Y dengan ragam sebagai berikut: n

V( y ) =

(y N n  i 1

nNM

2

i

 Y )2

N 1

Misalkan bahwa setiap unit dalam populasi dapat dibagi ke dalam sejumlah unit-unit atau sub-unit yang lebih kecil. Sebuah contoh dari n unit dipilih. Jika sub-unit dalam unit yang dipilih memberikan hasil yang sama, hal ini menjadi tidak efisien untuk mengukur sebuah contoh dari sub-unit dalam setiap unit yang dipilih. Pada kondisi demikian dapat diterapkan sub-penarikan contoh atau penarikan contoh dua tahap, karena contohnya diambil dalam dua tahap. Tahap pertama memilih sebuah contoh dari unit-unit utama dan tahap kedua memilih sebuah contoh dari unit-unit tahap pertama atau sub-unit dari setiap unit utama yang terpilih. Pada penarikan contoh dua tahap, penarikan contoh tahap pertama merupakan sebuah metode pemilihan n unit. Kemudian untuk setiap unit terpilih, digunakan metode untuk memilih sejumlah tertentu subunit-subunit. Dalam mencari rata-rata dan penduga ragam, rata-ratanya harus meliputi seluruh contoh yang dapat diturunkan dengan proses dua tahap ini. Salahsatu cara penghitungan rata-ratanya adalah dengan menghitung rata-rata seluruh contoh tahap kedua yang dapat diambil dari sekumpulan n unit. Kemudian dirata-ratakan seluruh pemilihan

20

yang mungkin dari n unit tersebut. Untuk sebuah penduga, ˆ , metode ini dapat dinyatakan sebagai E( ˆ ) = E1[E2( ˆ )]. Dimana E merupakan nilai harapan seluruh contoh, E2 meruapakan nilai harapan seluruh pemilihan yang mungkin pada tahap kedua dari sekumpulan n unit tetap, dan E1 merupakan nilai harapan seluruh pemilihan yang mungkin pada tahap pertama. Sedangkan ragam bagi ˆ dapat dinyatakan sebagai berikut: V( ˆ ) = E( ˆ  )2 = E1[E2( ˆ  )2] dimana E2( ˆ  )2 = E2( ˆ 2)  2E2( ˆ ) + 2 = [E2( ˆ )]2 + V2( ˆ )  2E2( ˆ ) + 2 karena E1[E2( ˆ )] = , maka V( ˆ ) = E1[E2( ˆ )]2 + E1[V2( ˆ )]   2 = V1[E2( ˆ )] + E1[V2( ˆ )] .

( 2.20 )

Hal serupa dapat dilanjutkan untuk penarikan contoh tiga tahap atau lebih. Misalnya, untuk penarikan contoh tiga tahap, ragam bagi ˆ dapat dinyatakan sebagai berikut: V( ˆ ) = V1{E2[E3( ˆ )]} + E1{V2[E3( ˆ )]} + E1{E2[V3( ˆ )]}. Misalkan yij merupakan nilai yang diperoleh untuk subunit ke-j (j = 1, 2, ..., m) pada unit utama ke-i (i = 1, 2, ..., n). Apabila n unit dan m subunit dari masingmasing unit yang telah diambil dipilih dengan penarikan contoh acak sederhana, maka n

y

m

 y i 1 j 1

ij

nm

merupakan penduga tidak bias bagi Y dengan ragam 2 2  N  n  S1  M  m  S 2 V ( y)        N  n  M  mn N

N

S12 

 (Y  Y ) i 1

2

i

N 1

dan

S 22 

M

 ( y i 1 j 1

ij

( 2.21 )  Yi ) 2

N ( M  1)

21

dimana S12 merupakan ragam diantara rata-rata unit utama dan S22 merupakan ragam diantara subunit-subunit dalam unit utama. Hal ini dapat ditunjukkan sebagai berikut: n N E( y ) = E1[E2( y )] = E1  1  Yi   1  Yi  Y  n i 1  N i 1

V( y ) = V1[E2( y )] + E1[V2( y )]

( 2.22 )

karena E2( y ) =  Yi /n, maka 2  N  n  S1 V1[ E2 ( y )]    .  N  n

Selanjutnya, dengan y =  yi /n dan penarikan contoh acak sederhana digunakan pada tahap kedua, n

S M m

i 1 V2 ( y )   2   Mn  m

2 2i

( 2.23 )

dimana M

( y j 1

S 22i 

ij

 Yi ) 2

M 1

merupakan ragam diantara subunit utama ke-i. Apabila dirata-ratakan seluruh contoh tahap pertama, N

S i 1

N

2 2i

 S 22 .

Oleh karena itu, 2  M  m  S2 E1[V2 ( y )]     M  mn

sehingga ragam bagi y adalah 2 2  N  n  S1  M  m  S 2 V ( y)   .     N  n  M  mn

( 2.24 )

22

2.3. Metode SAE dan Model State Space Terkait dengan SAE, terkadang beberapa survei diulang pelaksanaannya secara berkala. Untuk survei yang demikian ini pendugaan tidak langsung, seperti pendugaan tingkat pengeluaran di suatu area kecil, dapat ditingkatkan efisiensi pendugaanya dengan memasukkan pengaruh acak area dan waktu. Model state space merupakan salah satu alternatif metode pemodelan dalam SAE dengan memperhatikan pengaruh acak waktu (Rao dan Yu, 1994; Pfeffermann, 2002). Model state space atau disebut juga model linear dinamik (dynamic linear model) merupakan model pendekatan umum pada model deret waktu baik untuk peubah tunggal maupun peubah ganda (Wei, 1994). State dari suatu sistem didefinisikan sebagai gugus minimum dari informasi saat ini dan waktu sebelumnya yang mana prilaku sistem pada waktu yang akan datang dapat dideskripsikan secara lengkap melalui informasi tersebut. Representasi state space didasarkan pada proses stokastik Markov, yaitu apabila state saat ini diketahui maka prilaku sistem pada waktu yang akan datang bersifat bebas dengan prilaku sistem pada waktu sebelumnya. Karena itu, representasi state space dari suatu sistem sering juga disebut sebagai representasi Markov (Zivot, 2006). Misalkan Y1t dan Y2t merupakan keluaran (output) dari suatu sistem yang masing-masing mempunyai masukan (input) X1t dan X2t. Suatu sistem dikatakan linear jika dan hanya jika kombinasi linear masukan, aX1t + bX2t, akan menghasilkan kombinasi linear yang sama pada keluaran, aY1t + bY2t, untuk setiap konstanta a dan b. Suatu sistem dikatakan time-invariant apabila karakteristik sistem tidak berubah dari waktu ke waktu, yaitu apabila masukan Xt menghasilkan keluaran Yt maka masukan Xt-s akan menghasilkan keluaran Yt-s. Karena itu, suatu sistem dikatakan linear time invariant jika mempunyai karakteristik kedua-duanya yaitu linear dan time-invariant. Model state space umumnya didasarkan pada model linear time-invariant ini.

2.4. Statistik Area Kecil untuk Data BPS Pada dasarnya, survei yang dilakukan oleh BPS adalah untuk melakukan pendugaan karakteristik berbagai area termasuk diantaranya adalah area kecil.

23

Salah satu survei tersebut adalah Survei Sosial-Ekonomi Nasional (Susenas). Survei ini dirancang untuk mengumpulkan data sosial kependudukan yang relatif sangat luas. Data yang dikumpulkan antara lain meyangkut bidang-bidang pendidikan, kesehatan/gizi, perumahan, sosial ekonomi lainnya, kegiatan sosial budaya, konsumsi/pengeluaran dan pendapatan rumah tangga, perjalanan, dan pendapat masyarakat mengenai kesejahteraan rumah tangganya. Ukuran contoh Susenas untuk level desa sangat kecil, sehingga muncul persoalan galat baku yang sangat besar untuk statistik pada level desa. Metode pendugaan yang digunakan oleh BPS untuk data Susenas adalah metode pendugaan langsung (direct estimation) yaitu metode pendugaan yang didasarkan pada data yang diperoleh dari suatu proses penarikan contoh di suatu area tertentu. Metode pendugaannya semata-mata didasarkan pada metode penarikan contoh yang digunakan. Susenas dilaksanakan di seluruh propinsi di wilayah Indonesia baik di daerah

perkotaan maupun pedesaan. Cakupan contoh rumah tangga terpilih

Susenas 2001 – 2005 adalah rumah tangga biasa yang terletak di blok sensus biasa. Rumah tangga dalam blok sensus khusus seperti komplek militer dan sejenisnya dan rumah tangga khusus seperti asrama, penjara dan sejenisnya yang berada di blok sensus tidak dipilih dalam contoh (BPS, 2005). 2.4.1. Jenis Data yang Dikumpulkan Data yang dikumpulkan dalam Susenas terbagi atas 2 kelompok data, yaitu data Kor dan data Modul. 

Data Kor merupakan data yang mencakup keterangan pokok rumah tangga dan anggota rumah tangga, yang dikumpulkan setiap tahun. Data Kor Susenas disajikan sampai tingkat kabupaten/kota. Keterangan rumah tangga yang tergabung dalam kuesioner Kor Susenas 2001 – 2005 tidak berbeda dengan tahun-tahun sebelumnya, antara lain : a.

Keterangan umum anggota rumah tangga yaitu nama, hubungan dengan kepala rumah tangga, jenis kelamin, umur, status perkawinan, tindak kejahatan yang dialami, dan perjalanan;

24

b.

Keterangan umum kesehatan dan pendidikan anggota rumah tangga;

c.

Keterangan kegiatan ekonomi dan ketenagakerjaan anggota rumah tangga berumur 10 tahun ke atas;

d.

Keterangan fertilitas bagi anggota rumah tangga (art) wanita pernah kawin dan keterangan cara pencegahan kehamilan dari art yang berstatus kawin;

e.

Keterangan perumahan antara lain mencakup penguasaan tempat tinggal, kondisi fisik bangunan tempat tinggal, fasilitas bangunan tempat tinggal;

f.

Keterangan tentang rata-rata konsumsi rumah tangga dan sumber penghasilan rumah tangga; dan

g. 

Keterangan sosial ekonomi rumah tangga.

Data Modul merupakan data mengenai karakteristik rumah tangga yang digunakan untuk menyusun indikator kesejahteraan rakyat (kesra). Data Modul dikumpulkan secara bergiliran dalam kurun waktu 3 tahun. Modul-modul tersebut dikelompokkan ke dalam 3 paket, yaitu: a.

Modul konsumsi/pengeluaran dan pendapatan rumah tangga

b.

Modul sosial budaya dan pendidikan

c.

Modul kesehatan dan perumahan.

2.4.2. Rancangan Penarikan Contoh Susenas Kerangka contoh yang digunakan dalam Susenas 2001 - 2005 terdiri dari 3 jenis, yaitu: 

Kerangka

contoh

untuk

pemilihan

blok

sensus

di

daerah

perkotaan/pedesaan adalah daftar blok sensus biasa yang terdapat di daerah perkotaan/pedesaan di setiap kabupaten/kota. 

Kerangka contoh untuk pemilihan sub blok sensus, yaitu daftar sub blok sensus yang terdapat dalam blok sensus terpilih yang mempunyai jumlah rumah tangga lebih besar dari 150 rumah tangga.



Kerangka contoh rumah tangga, yaitu daftar rumah tangga hasil pendaftaran rumah tangga. Kerangka contoh rumah tangga ini

25

dibedakan menurut tiga kelompok golongan pengeluaran rumah tangga sebulan. Pemilihan contoh pada kegiatan Susenas 2001 – 2005 meliputi pemilihan contoh blok sensus Kor dan pemilihan contoh blok sensus Kor-Modul. Contoh blok sensus Kor dirancang untuk estimasi data di tingkat kabupaten/kota. Untuk keperluan estimasi data di tingkat propinsi digunakan contoh blok sensus KorModul. Blok sensus Kor adalah blok sensus dimana contoh rumah tangga terpilihnya dicacah dengan kuesioner Kor, sedangkan blok sensus Kor-Modul adalah blok sensus dimana contoh rumah tangga terpilihnya selain dicacah dengan kuesioner Kor juga dicacah dengan kuesioner Kor-Modul. Contoh blok sensus Kor-Modul merupakan subcontoh dari contoh blok sensus Kor. Prosedur penarikan contoh Susenas untuk suatu kabupaten/kota adalah sebagai berikut: 

Tahap pertama, dari master frame blok sensus dipilih nh blok sensus (h = 1, untuk perkotaan ; h = 2, untuk pedesaan) secara PPS – sistematik dengan size banyaknya rumah tangga hasil pencacahan P4B.



Tahap kedua, dari nh dipilih n h blok sensus secara sistematik. Pendaftaran rumah tangga/listing dilakukan pada setiap blok sensus terpilih.



Tahap ketiga, memilih m  16 rumah tangga pada setiap blok sensus terpilih secara sistematik.

Untuk blok sensus yang muatannya lebih dari 150 rumah tangga, maka perlu dilakukan pemilihan satu sub blok sensus secara PPS – sistematik dengan size banyaknya rumah tangga hasil pencacahan P4B.

26

Populasi Blok Sensus di Kab/Kota

Daerah Perkotaan

Pilih Sampel BS Kor

Pilih Sampel BS Modul

Tidak

Daerah Perdesaan

Probability Proportional to Size (PPS)Linear Systematic Sampling (LSS) (Jmlh RT)

Jml RT di BS > 150

Pilih Sampel BS Kor

Pilih Sampel BS Modul

Jml RT di BS > 150

Ya

Tidak

Ya

Bentuk sub Blok Sensus dan pilih 1 sub Blok Sensus

PPS - LSS

Bentuk sub Blok Sensus dan pilih 1 sub Blok Sensus

Pilih Contoh 16 RT/BS

LSS

Pilih Sampel 16 RT/BS

Gambar 2.1. Diagram Alur Metode Penarikan Contoh Susenas

2.4.3. Pendugaan Data Rumah Tangga Metode pendugaan yang digunakan dalam Susenas menggunakan metode secara langsung (direct estimate) dan penduga rasio dengan rasio jumlah rumah tangga untuk mengestimasi karakteristik rumah tangga dan rasio penduduk untuk mengestimasi karakteristik penduduk. Dugaan untuk karakteristik y dalam suatu

27

kabupaten/kota di daerah perkotaan dan daerah pedesaan adalah dengan menggunakan rumus metode sampling dua tahap (apabila 3 tahap dilakukan pemilihan sub blok, formula disesuaikan). 2.4.4. Persoalan Ukuran Contoh pada Susenas Sebagaimana disebutkan sebelumnya bahwa satuan penarikan contoh pada Susenas adalah rumah tangga. Banyaknya rumah tangga yang diambil dari suatu blok (desa) adalah 16 rumah tangga dan 32 rumah tangga apabila jumlah populasi rumah tangga di blok tersebut besar. Perbandingan antara ukuran contoh Susenas tahun 2005 yaitu n = 16 untuk desa-desa di wilayah Kota Bogor dengan jumlah n ideal / minimum pada batas d = 0.01 disajikan pada Tabel 2.1. Tabel 2.1. Perbandingan Antara Ukuran Contoh Susenas 2005 (n) dengan Jumlah n ideal / Minimum pada Batas d = 0.01.

No

Nama Desa

N

n

Jumlah n Minimum untuk d = 0.01 Nilai 

Koefisien Keragaman

0.10

0.05

0.025

0.01

1 Mulyaharja

2483

16

0.10831

29

41

54

70

2 Pamoyanan

2438

16

0.13798

37

52

68

89

3 Ranggamekar

2322

16

0.10836

29

41

54

70

4 Genteng

1568

16

0.11235

30

43

55

72

5 Kertamaya

1083

16

0.10917

29

41

53

68

6 Bojongkerta

1945

16

0.10850

29

41

54

70

7 Harjasari

2686

16

0.11856

32

45

59

77

8 Muarasari

1691

16

0.10862

29

41

53

70

9 Cipaku

2730

16

0.13139

35

50

65

85

10 Batutulis

2768

16

0.59367

152

211

270

345

11 Empang

4236

16

0.08935

24

35

45

59

12 Cikaret

3823

16

0.10081

27

39

50

66

13 Sindangrasa

2202

16

0.12011

32

46

59

77

14 Katulampa

4657

16

0.14457

39

55

72

95

15 Baranangsiang

6029

16

0.30552

82

116

150

197

16 Sukasari

2791

16

0.67690

171

238

304

388

17 Bantarjati

5082

16

0.30566

81

115

150

196

18 Tegalgundil

5930

16

0.40981

109

154

199

261

28

No

Nama Desa

N

n


Koefisien Keragaman

0.10

0.05

0.025

0.01

19 Tanahbaru

4326

16

0.18028

48

69

89

117

20 Cimahpar

3058

16

0.17541

47

66

86

113

21 Ciluar

2968

16

0.19584

52

74

96

125

22 Cibuluh

4692

16

0.24046

64

91

118

155

23 Kedunghalang

4440

15

0.48378

127

179

231

300

24 Ciparigi

4691

16

0.22456

60

85

111

145

25 Paledang

2354

16

0.45178

116

162

208

267

26 Gudang

1920

16

0.45244

115

160

204

260

27 Babakanpasar

2545

16

0.63301

160

223

283

361

28 Tegallega

4339

16

0.22519

60

85

111

145

29 Babakan

1886

16

0.45250

115

160

203

260

30 Sempur

2122

16

0.45210

116

161

206

263

31 Cibogor

1740

16

0.45281

114

159

202

257

32 Kebonkelapa

2752

16

0.18445

49

70

90

118

33 Pasirkuda

3177

16

0.26315

70

99

127

166

34 Pasirjaya

4189

16

0.10803

29

42

54

71

35 Gunungbatu

4328

16

0.07421

20

29

37

49

36 Loji

2905

16

0.26327

70

98

127

165

37 Menteng

3363

16

0.17329

46

66

85

112

38 Cilendek Barat

3284

16

0.07422

20

29

37

49

39 Sindangbarang

2910

16

0.41926

109

153

197

255

40 Margajaya

1159

16

0.26535

68

94

120

153

41 Situgede

1833

16

0.14633

39

55

71

93

42 Bubulak

2147

16

0.26376

69

97

125

162

43 Curugmekar

2287

16

0.26364

69

98

126

163

44 Curug

2164

16

0.26374

69

97

125

162

45 Kedungwaringin

4377

16

0.14562

39

56

72

95

46 Kedungjaya

2680

16

0.28078

74

104

135

175

47 Kebonpedes

4871

16

0.07827

21

30

40

52

48 Tanahsareal

1990

16

0.18451

49

69

89

116

49 Kedungbadak

5941

32

0.51666

136

193

249

325

50 Sukaresmi

2272

16

0.18434

49

69

89

117

51 Cibadak

3813

16

0.49892

130

183

236

305

52 Kayumanis

2272

16

0.21174

56

79

102

133

29

No

Nama Desa

N

n


Koefisien Keragaman

0.10

0.05

0.025

0.01

53 Mekarwangi

2696

16

0.18415

49

69

90

117

54 Kencana

2154

16

0.22799

60

85

109

142

 ˆ 2  z2 / 2 N  x2  y  n  ˆ 2  z2 / 2  x2   ( N  1)d y   {( N  1) / N )}s 2y   z N 2   y    . 2  {( N  1) / N )}s y  2    ( N  1)d z / 2 2   y   2  /2

( 2.25 )

Pada Tabel 2.1 tersebut N merupakan jumlah populasi rumah tangga di area kecil (desa) dan n adalah ukuran contoh Susenas 2005 pada area tersebut. Jumlah n minimum pada d = 0.01 ditentukan sebagaimana pada persamaan ( 2.25 ), dimana d adalah perebedaan relatif mutlak antara parameter dengan dugaannya yaitu, |( - θˆ )/|  d. Berdasarkan hasil pada Tabel 2.1 tersebut ukuran contoh Susenas pada tingkat desa sangat kecil, jauh dari jumlah contoh minimum yang diperlukan. Oleh karena itu diperlukan pengembangan metodologi pendugaan untuk mengatasi persoalan ukuran contoh kecil ini. Salah satu metodologi yang saat ini menjadi perhatian para statistisi dunia untuk mengatasi persoalan tersebut adalah metode SAE yang menjadi fokus utama pada disertasi ini.

30

BAB III 3.

Metode Prediksi Tak-Bias Linear Terbaik untuk Pendugaan Area Kecil Berdasarkan Model State Space

3.1. Pendahuluan Sebagaimana dipaparkan pada Bab II bahwa ukuran contoh pada sub-area survei terkadang berukuran kecil sehingga statistik yang diperoleh akan memiliki ragam yang besar atau bahkan pendugaan bisa saja tidak dapat dilakukan pada sub-area tertentu karena sub-area tersebut tidak terpilih menjadi contoh. Metode SAE dikembangkan untuk menyelesaikan masalah tersebut. Area kecil dapat didefinisikan sebagai himpunan bagian dari populasi dimana suatu peubah menjadi perhatian. Pendekatan klasik untuk menduga parameter area kecil didasarkan pada aplikasi model desain penarikan contoh yang menghasilkan metode pendugaan langsung (Rao, 2003; Chambers dan Chandra, 2006; Lahiri, 2008). Informasi tambahan dapat digunakan untuk meningkatkan akurasi dan presisi suatu penduga. Pada SAE, informasi tambahan tersebut dapat berupa nilai parameter dari area kecil lain yang memiliki karakteristik serupa dengan area kecil yang menjadi perhatian, atau nilai pada waktu yang lalu, atau nilai dari peubah yang memiliki hubungan dengan peubah yang sedang diamati. Pendugaan paramater dan inferensianya yang berdasarkan pada informasi tambahan tersebut, dinamakan pendugaan tidak langsung atau model-based. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat penguatan (borrowing strength) dari hubungan antara nilai peubah respon dan informasi tambahan tersebut. Asumsi dasar dalam pengembangan model untuk SAE adalah bahwa keragaman peubah respon di dalam area kecil dapat diterangkan oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang disebut sebagai

31

pengaruh tetap. Asumsi lainnya adalah bahwa keragaman specifik area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan pengaruh acak area kecil. Gabungan dari dua asumsi tersebut membentuk model pengaruh campuran (mixed models). Model pengaruh tetap menerangkan seluruh keragaman peubah respon di dalam area kecil oleh keragaman faktor-faktor yang diketahui. Pendugaan karakteristik area kecil berdasarkan model pengaruh tetap merujuk pada synthetic estimator (Levy, 1971), composite estimator (Schaible et. al., 1977) dan prediction estimator (Holt et. al., 1979; Sarndal, 1984; dan Marker, 1999). Misalnya pada penarikan contoh acak sederhana, rata-rata contoh y merupakan penduga terbaik bagi . Cochran (1977) memberikan gambaran terkait dengan penduga-penduga linear dalam penarikan contoh acak sederhana. Menurutnya, jika setiap yi dengan penimbang yang sama wi bila unit diberi label i yang dipilih, rata-rata contoh y adalah penduga yang tidak bias terhadap  n

dengan bentuknya

w y i 1

i

i

. Karena setiap unit muncul dalam sebuah fraksi n/N

dari contoh acak sederhana, maka  n  n E   wi y i    i 1  N

n

w y i 1

i

i



jika setiap wi = 1/n. Bila penimbangnya tergantung pada urutannya, dimana unitunit tersebut dipilih ke dalam contoh, maka y mempunyai ragam terkecil di n

antara penduga-penduga linear yang tidak bias dengan bentuk

w y d 1

d

(d )

dimana

y(d) adalah nilai y pada setiap unit yang muncul pada pengambilan ke-d. Beberapa penduga lainnya yang banyak digunakan dalam pendugaan pada data survei dapat dinyatakan sebagai kombinasi linear untuk semua yi yang ada dalam contoh, yaitu : (1) Penduga yang tergantung pada ukuran contoh (sample size dependent estimator)

YîSD  i Yî  (1  i )YîS

32

1 jika if Nˆ i   N i i   otherwise  Nˆ i /( N i ) selainnya  Yˆ  YîSD  i Yî  (1  i )   Nˆ i  Nˆ 

Yˆ   w j y j and Nˆ = js

w js

j

adalah penduga bagi total dan ukuran populasi untuk

area besar yang berisi area kecil.  Nˆ YîSD  i  aij w j y j  (1  i )  i  Nˆ js 

   w j y j  js

  wij* y j

( 3.1 )

js

dimana  Nˆ wij*  i aij w j  (1  i )  i  Nˆ 

  w j 

1 if  aij w j    aij w j jika  js jU i   otherwise  aij w j /(  aij w j ) selainnya jU  js

(2) Penduga Purcell-Kish (1980) dan penduga composite lainnya,

YîPK   *Yî  (1   * )YîS  Yˆ    *Yî  (1   * )   Nˆ i  Nˆ   Nˆ   *  aij w j y j  (1   * )  i  Nˆ js 

   w j y j  js

  w ij y j js

dimana  Nˆ w ij   * aij w j  (1   * )  i  Nˆ 

  w j 

33

  1 *

 v(Yˆ ) i

 i (YîS  Yî )2

.

(3) Penduga one off-the-shelf dengan satu peubah penyerta (auxiliary variable) Yˆ YîOS  Yî  ( X i  Xˆ i ) Xˆ

 X  Xˆ i   a ij w j y j   i  Xˆ js 

  w j y j   js



 wij y j



( 3.2 )

js

dimana  X  Xˆ i  wij   aij  i  Xˆ 

m   w j dan and w j    ij exp( iT x j   j ) .  i 1 

(4) Penduga rasio-sintetik (ratio-synthetic estimator),

Yˆ YîRS  X i Xˆ 

Xi ˆ Xi Y Xˆ Xˆ

w y js

j

j

ij y j  w js

dimana ij  w

Xi wj . Xˆ

(5) Penduga regresi survei,

Yˆ YîR  Yî  ( X i  Xˆ i ) Xˆ  X  Xˆ i   aij w j y j   i  Xˆ js     wij y j js

   w j y j  js

( 3.3 )

34

dimana  X  Xˆ i  wij   aij  i  Xˆ 

  w j . 

Kelima penduga di atas dapat pula dinyatakan dalam bentuk matriks pembobot berukuran n x m, yaitu matriks A = ((aij)): (1) Penduga ketergantungan ukuran contoh (sample size dependent estimator),  Nˆ YîSD  i  aij w j y j  (1  i ) i  Nˆ js  

  w j y j   js

 wij* y j js

dimana

 Nˆ wij*   i a ij w j  (1   i ) i  Nˆ 

 w j .  

Matriks pembobot n x m ((w*ij)) dapat

dinyatakan sebagai berikut:  Nˆ 1   1 a11 w1  (1  1 ) Nˆ w1    ˆ  1 a12 w2  (1  1 ) N1 w2  Nˆ  * wij   .  .   .   Nˆ 1   1 a1n wn  (1  1 ) ˆ wn N  

2 a21 w1  (1  2 )

Nˆ 2 w1 Nˆ

2 a22 w2  (1  2 )

Nˆ 2 w2 Nˆ

. . .

2 a2 n wn  (1  2 )

Nˆ 2 wn Nˆ

 Nˆ m  w1  Nˆ    ˆ N ... m am 2 w2  (1  m ) m w2   Nˆ   .  ... .   .   Nˆ m  ... m amn w2  (1  m ) wn  ˆ N  

.... m am1 w1  (1  m )

(2) Penduga Purcell-Kish (1980) dan penduga composite lainnya,  Yˆ  YîPK   *Yî  (1   * )   Nˆ i  Nˆ   Nˆ   *  aij w j y j  (1   * )  i  Nˆ js 

   w j y j  js

  w ij y j js

35

dimana  Nˆ w ij   * aij w j  (1   * )  i  Nˆ 

  w j . 

Matriks pembobot n x m (( w ij )) dapat dinyatakan sebagai berikut: ˆ  * * N1   a11 w1  (1   ) ˆ w1 N   Nˆ   * a12 w2  (1   * ) 1 w2  Nˆ w ij   .   .  ˆ  * * N1   a1n wn  (1   ) ˆ wn N 

 * a21 w1  (1   * )

Nˆ 2 w1 Nˆ

 * a22 w2  (1   * )

Nˆ 2 w2 Nˆ

 Nˆ m w1  Nˆ   ˆ N ...  * am2 w2  (1   * ) m w2   Nˆ  .  ...  .  ˆ  * * Nm ...  amn w2  (1   ) wn  ˆ N 

....  * am1 w1  (1   * )

. . Nˆ 2 wn Nˆ

 * a2 n wn  (1   * )

(3) Penduga one off-the-shelf dengan satu peubah penyerta (auxiliary variable) Yˆ YîOS  Yî  ( X i  Xˆ i ) Xˆ 



 wij y j js

dimana  X  Xˆ i  wij   a ij  i  Xˆ 

 w j .  



Matriks pembobot n x m (( wij )) adalah  X  Xˆ 1    a11  1  w1 Xˆ    X 1  Xˆ 1   a    w2 12  ˆ X   wij     .  .   ˆ    a  X1  X1  w  n   1n Xˆ  

   w1        w2        X m  Xˆ m     wn  Xˆ  

 X 2  Xˆ 2 a   21 Xˆ   X 2  Xˆ 2  a22  Xˆ  . .

  w2 

 X  Xˆ m ...  am1  m  Xˆ   X  Xˆ m ...  am2  m  Xˆ  ... . ... .

 X 2  Xˆ 2  a2 n  Xˆ 

  wn 

 ...  amn  

wj 

  w1 

m

  ij exp( iT x j   j ) . i 1

36

(4) Penduga rasio-sintetik (ratio-synthetic estimator),

X X YîRS  i Yˆ  i Xˆ Xˆ

w y js

j

j

ij y j  w js

dimana ij  w

Xi wj . Xˆ

ij )) adalah Pembobot matriks n x m (( w

 X1  ˆ w1  X  X1  Xˆ w2 ij   w  .  .   X1  ˆ wn  X

X2 w1 Xˆ

...

X2 w2 Xˆ

...

. .

... ...

X2 wn Xˆ

...

Xm  w1  Xˆ  Xm  w2  ˆ X . .  .   Xm  wn  Xˆ 

(5) Penduga regresi survei,  X  Xˆ i YîR   aij w j y j   i  Xˆ js     wij y j

   w j y j  js

js

dimana  X  Xˆ i  wij   aij  i  Xˆ 

  w j . 

 Matriks pembobot n x m (( wij )) dapat dinyatakan sebagai berikut :

37

 X  Xˆ 1    a11  1  w1 Xˆ    X 1  Xˆ 1   a    w2   12 Xˆ    wij    .  .   ˆ    a  X1  X1  w 1 n  n  Xˆ  

   w1        w2   .     X  Xˆ m    m w  n  Xˆ  

 X 2  Xˆ 2  a21  Xˆ   X 2  Xˆ 2  a22  Xˆ  . .

  w2 

 X  Xˆ m ...  am1  m  Xˆ   X  Xˆ m ...  am2  m  Xˆ  ... . ... .

 X 2  Xˆ 2  a2 n  Xˆ 

  wn 

 ...  amn  

  w1 

Berbeda dengan bentuk kombinasi linear di atas, metode SAE pada dasarnya menggabungkan antara penduga langsung dengan penduga regresi sintetik dengan cara meminimumkan KTG. Model yang berbasis area yang dapat menggunakan metode PTLT bisa dinyatakan sebagai berikut:

î = xiT + bivi + ei, i = 1, 2, ..., m

( 3.4 )

dimana xi adalah p x 1 vektor dari kovariat area, vi iid (0, v2 ) dan bebas terhadap sampling errror ei iid (0, i ) dengan bi adalah konstanta positif. i = i = xiT + bivi. Penduga PTLT bagi i atau i tersebut dapat diperoleh melalui persamaan sebagai berikut (Ghosh et al, 1998; Rao, 2003) : ~H ~ ~ i = xiT  + i( ˆ i - xiT  ), dimana i = v2bi2 /(i + v2bi2), dan 1

 m xi xiT   m x iî  ~ ~ 2  =  (v ) =  .    2 2 2 2   i 1  i   v bi   i 1  i   v bi 

~ Berdasarkan hasil ini, penduga PTLT, iH ,

( 3.5 )

bisa diekspresikan sebagai

~ rataan terboboti antara penduga langsung î dan penduga regresi sintetik xiT  ,

dengan pembobot i (0  i  1) yang mengukur perbandingan relatif ragam model v2bi2 terhadap ragam total i + v2bi2. ~ KTG bagi penduga PTLT, iH , yang merupakan KTG terkecil dapat dinyatakan sebagai berikut : ~ ~ KTG( iH ) = E( iH - i)2 = g1i(v2) + g2i (v2) + 2g3i (v2)

( 3.6 )

38

dimana g1i(v2) = (v2bi2i)/(i + v2bi2) = ii dan g2i(v2) = (1 - i)2xiT[  xixiT / (i + v2bi2) ]-1xi g3i(v2) = i2bi2(i + v2bi2)-3V(v2). Sementara model yang berbasis unit pada area tertentu dapat menggunakan metode PTLT yang bisa dinyatakan sebagai berikut: yij = xijT + vi + eij, i = 1, 2, ..., m, j = 1, 2, ..., Ni.

( 3.7 )

Pada model ini diasumsikan bahwa data penyerta (auxiliary) pada unitspesifik xij = (xij1, xij2, ..., xijp)T adalah tersedia untuk setiap elemen j populasi pada setiap area kecil i. Di samping itu, pengaruh area spesifik vi diasumsikan sebagai peubah acak yang menyebar bebas dan identik. i = X Ti  + vi. Penduga PTLT bagi i atau i tersebut dapat diperoleh melalui persamaan sebagai berikut (Ghosh et al, 1996; Rao, 2003) : ~ ~ ~iH = X Ti  + i( y ia - xiaT  ), dimana i = v2bi2 /(i + v2bi2), dan 1

 m  ~ m  =  X iT Vi 1 X i   X iT Vi 1 y i  .  i 1   i 1 

( 3.8 )

KTG bagi penduga PTLT, ~iH , yang merupakan KTG terkecil dapat dinyatakan sebagai berikut : KTG( ~iH ) = E( ~iH - i)2 = g1i(v2, e2) + g2i (v2, e2)

( 3.9 )

dimana g1i(v2, e2) = i(e2/ai.) dan g2i(v2, e2) = ( X i   i xia )T [  Ai]-1( X i   i xia ).

39

3.2. MCLT dengan Pengaruh Acak Area dan Waktu Terkadang beberapa survei diulang pelaksanaannya secara berkala, misalnya Susenas. Untuk survei seperti ini pendugaan tidak langsung di suatu area kecil dapat ditingkatkan efisiensi pendugaannya dengan memasukkan pengaruh acak area dan waktu. Rao dan Yu (1994) dan Rao (2003) mengembangkan SAE dengan menggunakan data penampang melintang (cross sectional data) dan data deret waktu (time series data). Model tersebut terdiri dari model galat penarikan contoh

ˆ it  it + eit, t = 1, …, T; i = 1, …, m dan model penghubung (linking model) it = xitT + vi + uit.

( 3.10 )

Pada model di atas, ˆ it adalah penduga langsung dari survei untuk area kecil i pada waktu t, it adalah fungsi untuk rataan pada area i pada waktu t, dan eit adalah galat penarikan contoh yang menyebar normal dengan nilai harapan 0 dan mempunyai matriks koragam blok-diagonal . Sedangkan xit adalah vektor spesikasi area yang mungkin berubah menurut waktu t. Sebagaimana diasumsikan sebelumnya bahwa vi  iid (0, v2) dan uit diasumsikan mengikuti proses random walk untuk setiap i, yaitu: uit = ui,t-1 + it, dan it  iid N(0, 2). Berdasarkan model di atas it tergantung pada pengaruh area spesifik vi dan area oleh waktu spesifik uit yang berkorelasi antar waktu. Model yang salahsatu komponen acaknya berkorelasi menurut waktu seperti yang dipaparkan di atas, ît = xitT + vi + uit dan uit = ui,t-1 + it, dapat juga dinyatakan dalam model MCLT, yi = Xi + ZiviT + ei , yaitu: yi = ˆ i ,

Xi = (xit1, …, xitT)T,

Zi = (1T, IT)

( 3.11 )

 = (1, …, p)T

( 3.12 )

dan viT = (vi, uiT), ei = (ei1, …, eiT)T,

dimana 1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Sedangkan

 v2 Gi =  0

0T  , 2 

Ri = i

( 3.13 )

40

dimana i =  adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) adalah |t-s|/(1 - 2).

3.3. Model State-Space dalam Pendugaan Area Kecil Model state space atau disebut juga model linear dinamik (dynamic linear model) merupakan pendekatan umum untuk model deret waktu dengan peubah tunggal ataupun peubah ganda (Wei, 1994; Casella et al, 2000). State dari suatu sistem didefinisikan sebagai gugus minimum dari informasi saat ini dan waktu sebelumnya sehingga perilaku sistem pada waktu yang akan datang dapat dideskripsikan secara lengkap melalui informasi tersebut. Representasi state space didasarkan pada proses stokastik Markov, yaitu apabila state saat ini diketahui maka perilaku sistem pada waktu yang akan datang bersifat bebas dengan perilaku sistem pada waktu sebelumnya. Karena itu, representasi state space dari suatu sistem sering juga disebut sebagai representasi Markov (Durbin, 2004; Zivot, 2006). Misalkan Y1t dan Y2t merupakan keluaran (output) dari suatu sistem yang masing-masing mempunyai masukan (input) X1t dan X2t. Suatu sistem dikatakan linear jika dan hanya jika kombinasi linear masukan, aX1t + bX2t, akan menghasilkan kombinasi linear yang sama pada keluaran, aY1t + bY2t, untuk setiap konstanta a dan b. Suatu sistem dikatakan time-invariant apabila karakteristik sistem tidak berubah dari waktu ke waktu, yaitu apabila masukan Xt menghasilkan keluaran Yt maka masukan Xt-s akan menghasilkan keluaran Yt-s. Karena itu, suatu sistem dikatakan linear time invariant jika mempunyai karakteristik kedua-duanya yaitu linear dan time-invariant. Model state space umumnya didasarkan pada model linear time-invariant ini. Terkait dengan SAE, terkadang beberapa survei diulang pelaksanaannya secara berkala, misalnya Susenas. Untuk survei yang demikian ini pendugaan tidak langsung, seperti pendugaan rata-rata pengeluaran perkapita di suatu area kecil, dapat ditingkatkan efisiensi pendugaanya dengan memasukkan pengaruh acak area dan waktu. Model state space merupakan salah satu alternatif metode pemodelan dalam SAE dengan memperhatikan pengaruh pengamatan antar waktu (Pfeffermann, 2002). Perhatikan model pendugaan tidak langsung sebagai berikut:

41

ˆ it  it + eit, t = 1, …, T; i = 1, …, m

( 3.14 )

it = xitTit dimana koefisien  it = (it0, it1, …, itp)T mempunyai variasi menurut area dan waktu, galat penarikan contoh eit untuk setiap area i diasumsikan tidak berkorelasi dengan nilai tengah 0 dan ragam it. Variasi it antar waktu dapat dimodelkan sebagai berikut:

β itj  β i ,t 1, j  1  β   T j  β     vitj , j  0,1,..., p .  ij   ij  0

( 3.15 )

Formulasi bagi  it dapat mencakup beberapa model umum yang banyak digunakan. Misalnya, apabila matriks Tj adalah 0 1  Tj    0 1  maka formulasi bagi  it berupa model regresi, itj = ij + vitj. Apabila matriks Tj dinyatakan sebagai 1 0 Tj    0 1  maka formulasi bagi it berupa model random walk, itj = i,t-1,j + vitj. Sedangkan model regresi diri (autoregressive) ordo 1 atau AR(1), itj - ij = (i,t-1,j - ij) + vitj, dapat diformulasikan apabila   Tj    0

1  . 1 

Pemodelan di atas pada dasarnya merupakan kasus khusus dari model state space sebagai berikut: yt = Ztt + t;

E(t) = 0,

E(ttT) = t

t = Htt-1 + At;

E(t) = 0,

E(ttT) = 

( 3.16 )

dimana t dan t tidak berkorelasi antar waktu. Persamaan pertama disebut sebagai persamaan transisi Markov (transition equation), sedangkan persamaan kedua disebut persamaan pengukuran (measurement equation). Model state space ini mempunyai bentuk dasar sebagaimana MCLT tetapi dengan melakukan updating dugaan pada tiap waktu, penggunaan persamaan penyaring Kalman, dan pemulusan dugaan terakhir sebagai data baru.

42

~ merupakan penduga Vektor t disebut sebagai vektor state. Misalkan α t -1 PTLT bagi t-1 didasarkan pada semua pengamatan hingga waktu (t-1), sehingga ~ = Hα ~ α t|t -1

t -1

merupakan penduga PTLT bagi t pada waktu (t-1). Selanjutnya dapat dinyatakan pula persamaan (3.17 ) Pt|t-1 = HPt-1HT + AAT ~ -  , dimana P = E( α ~ - ) yaitu matriks koragam bagi penduga galat α t t-1 t-1 t|t -1 t -1 ~ -  )T adalah matriks koragam bagi penduga galat pada waktu (t-1). Pada E( α t-1 t -1 waktu t, penduga bagi t dan matriks koragamnya diperbarui (updated) menggunakan data baru (yt, Zt), yaitu ~ ~ yt - Zt α t|t -1 = Zt(t - α t|t -1 ) + t

( 3.18 )

~ , Z = Z, v yang mempunyai bentuk model linear campuran dengan y = yt - Zt α t t|t -1 ~ , G = P dan V = F , dimana = t - α t|t-1 t t|t -1

Ft = ZtPt|t-1ZtT + t.

( 3.19 )

Berdasarkan penjabaran di atas, pendugaan parameter pada model state space dapat menggunakan pendekatan MCLT. Pada persamaan pengukuran, yaitu persamaan kedua pada model state space ( 3.16 ) di atas, di samping menggunakan model regresi diri dapat pula mengunakan model rataan bergerak (moving average) maupun model campuran antara regresi diri dan rataan bergerak. Hanya saja untuk model rataan bergerak diperlukan pembalikan proses terlebih dahulu yaitu dari rataan bergerak menjadi regresi diri, selanjutnya diintegrasikan pada persamaan ( 3.16 ) tersebut, karena model dasar untuk persamaan pengukuran pada model state space adalah regresi diri. Dengan demikian, penggunaan rataan bergerak pada model state space akan menjadi sangat kompleks terlebih lagi kalau diintegrasikan pada model SAE. Kajian pada disertasi ini dibatasi pada model state space yang persamaan pengukurannya didasarkan pada model regresi diri.

43

3.4. Pendugaan Parameter Model dengan KMT Nilai tengah atau total pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Prediksi tak-bias linear terbaik (PTLT), dilakukan dengan cara meminimumkan fungsi kuadrat tengah galat (KTG). Sehingga penduga bagi PTLT akan memiliki KTG yang paling kecil di antara semua penduga tidak bias linear. Metode kemungkinan maksimum terkendala / KMT (restricted maximum likelihood / REML) dapat digunakan untuk menduga komponen ragam atau koragamnya. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh melalui dua tahap sehingga disebut sebagai PTLT empirik atau PTLTE. 3.4.1. Penduga Tak-bias Linear Terbaik (PTLT) Model linear campuran umum yang digunakan sebagai model dasar areakecil dengan pengaruh acak area dan waktu di atas dapat dinyatakan sebagai ( 3.20 )

y = X + Zv + e dimana y = ît ,

X = (xit1, …, xitT)T,

Z = (1T, IT), dan

vT = (vi, uiT), e = (ei1, …, eiT)T,

 = (1, …, p)T

1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Pada persamaan di atas, y adalah vektor dari pengamatan contoh, X dan Z adalah matriks yang diketahui, dan v dan e adalah saling bebas dengan nilai tengah 0 dan matriks koragam G dan R, tergantung pada beberapa parameter  yang disebut sebagai komponen ragam. Ragam bagi y yaitu Var(y) = V = R + ZGZT. Selanjutnya akan diduga kombinasi linear

 = lT + mTv .

( 3.21 )

Penduga linear yang diinginkan adalah bersifat tidak bias dan memiliki ragam minimum. Suatu penduga linear ˆ = aTy + b adalah tidak bias bagi  = lT + mTv berdasarkan model campuran di atas, yaitu E( ˆ ) = E() jika dan hanya jika aTX = lT dan b = 0. Nilai KTG bagi penduga tidak bias linear ˆ dapat dinyatakan sebagai berikut: KTG( ˆ ) = E( ˆ - )2 . Karena ˆ merupakan penduga tidak bias bagi ˆ maka

44

KTG( ˆ ) = Var( ˆ - ) = Var( ˆ ) – 2Cov( ˆ , ) + Var()

( 3.22 )

dimana Var( ˆ ) = Var(aTy + b) = aTVa Cov( ˆ , ) = Cov(aTy, lT + mTv) = Cov(aT(X + Zv + e), lT + mTv) = Cov(aTZv, mTv) = aTZGm Var() = Var(lT + mTv) = Var(mTv) = mTGm. Berdasarkan hasil tersebut, KTG( ˆ ) dapat dinyatakan sebagai berikut: KTG( ˆ ) = aTVa - 2aTZGm + mTGm.

( 3.23 )

Selanjutnya KTG( ˆ ) ini diminimumkan dengan kendala aTX = lT. Penyelesaiannya menggunakan metode pengganda Lagrange, yaitu L(a, ) = aTVa - 2aTZGm + mTGm + 2(aTX - lT) L(a, )/a = 2Va - 2ZGm + 2X = 0 a = V-1ZGm - V-1X.

( 3.24 )

Apabila persamaan ( 3.24 ) disubstitusikan ke dalam kendala aTX = lT, maka diperoleh penyelesaian bagi  yaitu  = -(XTV-1X)-1l + (XTV-1X)-1XTV-1ZGm .

( 3.25 )

Pengkombinasian persamaan ( 3.24 ) dengan ( 3.25 ) menghasilkan penduga PTLT bagi  = lT + mTv, yaitu ~ ˆ = aTy = Ty + (lT - TX) β

dimana ~ T = mTGZV-1 dan β = (XTV-1X)-1 XTV-1y

( 3.26 )

~ β yang diperoleh pada dasarnya dapat dianggap sebagai penduga kuadrat terkecil

terboboti bagi . Untuk model regresi tersarang-galat (nested-error), V = diag(V1, ..., Vm) dengan Vi = e2 I ni + 2 1ni 1Tni , sehingga V-1 = (V1-1, ..., Vm-1) dengan Vi-1= (e2)1

I ni 

ini-1(e2)-1 1ni 1Tni dan i = 2(2 + e2ni-1)-1, menggunakan konsep

kebalikan matriks : (A + uvT) = A-1  A-1uvTA-1(1 + vTA-1u)-1. Oleh karena itu, dengan mengambil l = Xi dan m = (0 ... 010 ... 0)T yaitu 1 pada posisi ke-i dan

45

(2/e2)(1  i) = i/ni, maka diperoleh penduga tak-bias linear terbaik bagi i yaitu: ~ ~ h(, y) = XTi β + i ( yi  x Ti β )

( 3.27 )

dimana  = (2, e2) dan xi adalah rataan contoh dari xij untuk area ke-i. Sedangkan y = col1 i  m col1 j  ni ( yij ) dan X = col1 i  mcol1 j  ni (xijT ) . Pendekatan yang sama dapat pula diterapkan pada model koefisien regresi acak yang menghasilkan penduga tidak bias linear terbaik bagi i yaitu ~ ~ ~ hi(, y) = XTi β + γ i Xi ( βi  β )

( 3.28 )

~ ~ dimana  = (2, e2), γ i = 2(2 + e2/jxij2)-1, βi = jxijyij/jxij2, dan β = ~

γ β /γ i

i

i

.

Untuk model Fay-Herriot, penduga tak-bias linear terbaik bagi i adalah sebagai berikut: ~ ~ hi(, y ) = xTi β + 2/(2 + i2) ( yi  x Ti β ),

( 3.29 )

~ dimana β = (XTV-1X)-1(XTV-1 y ) dengan V = diag(2 + 12, ..., 2 + m2), dan X

= col1 i  m (x iT ) . Nilai hi(, y ) akan mendekati penduga survei langsung yi apabila ~ i2/(2 + i2)  0, dan mendekati penduga sintetik xTi β apabila 2/(2 + i2)  0. Oleh karena itu penduga tak-bias linear terbaik adalah rataan terboboti antara ~ penduga survei langsung dan penduga sintetik, yaitu wi yi + (1  wi) x Ti β , dimana wi = 2/(2 + i2). 3.4.2. Pendugaan Dua Tahap Penduga h(, y) tergantung pada komponen ragam  = (1, …, p)T, tetapi di dalam praktik nilai komponen  tidak akan diketahui. Secara aktual, komponen tersebut umumnya berbentuk rasio 1/p, misalnya pada persamaan (3.3) dan (3.4) tergantung pada 2/e2. Nilai tersebut digunakan untuk menduga h(, y) melalui penggantian  dengan penduga konsisten φˆ . Hasil dari penduga dua tahap tersebut bersifat tidak bias. Elemen dari φˆ merupakan fungsi dari y yang bersifat

46

translation-invariant yaitu φˆ (-y) = φˆ (y) dan φˆ (y  Xa) = φˆ (y) untuk semua y dan a. Beberapa metode pendugaan  untuk model campuran linear umum telah banyak dikembangkan, di antaranya adalah oleh Henderson (1975) dan Harville (1977). Penerapannya pada model area kecil di antaranya dikembangkan oleh Prasad dan Rao (1990), Datta dan Lahiri (1995), dan Rao (2003), dan Lahiri (2008). Untuk model regresi galat tersarang, penduga kuadratik tidak bias bagi e2 dan 2 berdasarkan pendekatan Henderson adalah σˆ e2 = (n  m  k + )-1 eîj2

dan σˆ 2υ = w-1[ uîj2  (n  k) σˆ e2 ]

dimana w = n  tr[(XTX)-1 i 1 ni2 xi xiT ], dan  = 0 jika model tersebut tidak m

memiliki intersep dan  = 1 untuk selainnya. Nilai { eîj2 } adalah nilai sisaan dari regresi kuadrat terkecil antara yij  yi dengan {xij1  xi.1 , …, xijk  xi.k }, sedangkan { uîj2 } adalah nilai sisaan dari regresi kuadrat terkecil antara yij dengan {xij1, …, xijk}. Untuk model koefisien regresi acak, penduga kuadratik tidak bias bagi e2 dan 2 berdasarkan pendekatan Henderson adalah σˆ e2 = (n  m)-1 eîj2

dan σˆ 2υ = w-1[ uîj2  (n  1) σˆ e2 ] ~ = x 2  [ ( x 2)2](x 2)-1. dimana eîj = yij  xij(jxijyij)(jxij2)-1 dan w ij i j ij ij

Sedangkan pada model Fay-Herriot, penduga kuadratik tidak bias bagi 2 adalah m m  σˆ 2υ  (m  k ) 1  uî2   δi (1  xiT ( XT X) 1 x i  i 1  i 1 

dimana uî  yi  xiTβˆ dan

( 3.30 )

βˆ  ( XT X) 1 XT y . Penduga dua tahap hi( σˆ 2υ , y )

merupakan penduga empirical Bayes di bawah asumsi kenormalan.

47

3.5. Pendekatan Orde Kedua untuk KTG Misalkan h(, y) dituliskan sebagai h() dan h( φˆ , y) ditulis sebagai h( φˆ ), maka KTG bagi h( φˆ ) dapat dinyatakan sebagai berikut: KTG[h( φˆ )] = KTG[h()] + E[h( φˆ )  h()]2,

( 3.31 )

Kackar dan Harville (1984) melalui pendekatan deret Taylor diperoleh persamaan bahwa E[h( φˆ )  h()]2 = E[d()T( φˆ  )]2

( 3.32 )

dengan d() =  h()/, selanjutnya dapat dinyatakan E[d()T( φˆ  )]2 = tr[A()E( φˆ  )( φˆ  )T],

( 3.33 )

dimana A() adalah matriks koragam dari d(). tr[A( φˆ )E( φˆ  )( φˆ  )T] = tr[(b)V(bT)E( φˆ  )( φˆ  )T], ( 3.34 ) dimana bT = col1 j  p (b T /  j ) dan bT = mTGZTV-1. Kondisi umum terdapat pada bagian Teorema A.1, dimana pendekatan pada persamaan ( 3.33 ) dan ( 3.34 ) adalah o(m-1) untuk m bernilai besar. Pengkombinasian persamaan ( 3.31 ) – ( 3.34 ), akan diperoleh: KTG[h( φˆ )] = KTG[h()] + tr[(bT)V(bT)TE( φˆ  )( φˆ  )T], ( 3.35 ) Hasil ( 3.35 ) ini dapat digunakan untuk mengevaluasi tiga model area kecil di atas. KTG[hi(2, y)] untuk model regresi tersarang galat dapat dinyatakan sebagai berikut: KTG[hi(2, y)] = (1  i)2 + ( Xi  i xi )T(XTV-1X)-1( Xi  i xi )

( 3.36 )

~ dimana (XTV-1X)-1 adalah matriks ragam koragam bagi β , (2/e2) (1  i) =

i/ni, dan

γ i / σ 2ν  (b )V (b )  n (1 Vi 1ni )  [γ i / σ 2ν γ i / σ e2 ] , 2  γ /  σ e  i T

T T

2 i

T ni

( 3.37 )

dimana (1Tni Vi 1ni )  ni2 [σ 2ν  σ e2 / ni ] , selanjutnya diperoleh tr[(bT)V(bT)TE( φˆ  )( φˆ  )T] = ni2 (σ 2ν  σ e2 / ni ) 3 var(σˆ e2σ 2ν  σˆ 2ν σ e2 ) . Melalui metode yang sama, untuk model koefisien regresi acak diperoleh bahwa KTG[hi(2, y)] = X i2 (1  γ i )2 + X i2 (1  γ i )2( γ i )-12

( 3.38 )

48

dan tr[(bT)V(bT)TE( φˆ  )( φˆ  )T] = X i2 ( j xij2 ) 2 (σ 2ν  σ e2 /  j xij2 ) 3 var(σˆ e2σ 2ν  σˆ 2ν σ e2 ) . Pada model Fay-Herriot diperoleh KTG[hi(2, y)] = 2i2(2 + i2)-1 + i4(2 + i2)-2xiT(XTV-1X)-1xi dan tr[(bT)V(bT)TE( φˆ  )( φˆ  )T] = i4(2 + i2)-3var( σˆ 2υ ).

( 3.39 )

Nilai harapan dari penduga KTG tersebut bersifat O(m-1) berdasarkan model Fay-Herriot. Untuk model regresi galat tersarang, pendekatan KTG mungkin dapat dinyatakan g1i(2) + g2i(2) + g3i(2), dimana g1i(2) = (1  i)2, g2i(2) = ( Xi  i xi )T(XTV-1X)-1( Xi  i xi ), dan g3i(2) = ni2 (σ 2ν  σ e2 / ni ) 3[σ e4 var( σˆ 2ν )  σ 4ν var(σˆ e2 )  2σ e2σ 2ν cov(σˆ e2 , σˆ 2ν )] . Di bawah asumsi kenormalan {i} dan {eij}, maka var( σˆ e2 ) = 2(n  m  k + )-1e4, var( σˆ 2ν ) = 2w-2[(n  m  k + )-1 (m  )( n  k) e4 + 2we22 + w*4] dan cov( σˆ e2 , σˆ 2ν ) = (m  )w-1var( σˆ e2 )

( 3.40 )

dimana w = n  tr[(XTX)-1 i 1 ni2 xi xiT ] dan w* = tr(MZZT)2 dengan M = I  m

X(XTX)-1XT. Penduga bagi g2i(2) dan g3i(2) dapat disederhanakan menjadi g2i( σˆ 2 ) dan g3i( σˆ 2 ) yang bersifat Op(m-1), karena σˆ 2 merupakan penduga konsisten bagi 2. Tetapi g1i( σˆ 2 ) bukan penduga yang tepat bagi g1i(2) karena terjadi bias pada ordo O(m-1). Penduga yang tepat bagi g1i(2) dapat diperoleh melalui penyesuaian bias g1i( σˆ 2 ) pada O(m-1) dengan menggunakan metode ekspansi Taylor bagi g1i( σˆ 2 ) dan kemudian diperoleh nilai harapannya, yaitu E(g1i( σˆ 2 ))  g1i(2) =  g3i(2) + o(m-1)

( 3.41 )

49

sehingga g1i( σˆ 2 ) + g3i( σˆ 2 ) merupakan penduga yang tidak bias pada ordo Op(m-1). Penduga bagi pendekatan KTG yang bersifat Op(m-1) dapat dinyatakan sebagai ktg[hi( σˆ 2 , y)] = g1i( σˆ 2 ) + g2i( σˆ 2 ) + 2g3i( σˆ 2 ).

( 3.42 )

Sesuai penjabaran di atas, untuk model koefisisen regresi acak, nilai ktg[hi( σˆ 2 , y)]-nya juga seperti persamaan ( 3.42 ), dengan g1i(2) = X i2 (1  γ i )2, g2i(2) = X i2 (1  γ i )2( γ i )-12, dan g3i(2) = X i2 ( j xij2 ) 2 (σ 2ν  σ e2 /  j xij2 ) 3  [σ e4 var( σˆ 2ν )  σ 4ν var(σˆ e2 )  2σ e2 σ 2ν cov(σˆ e2 , σˆ 2ν )] .

( 3.43 )

Selanjutnya, berdasarkan asumsi kenormalan {i} dan {eij}, maka var( σˆ e2 ) = 2(n  m)-1e4, ~ -2[(n  1)(m  1)( n  m)  4 + 2 w ~  2 2 + w ~ * 4], dan var( σˆ 2ν ) = 2 w e e   ~ -1var( σˆ 2 ) cov( σˆ e2 , σˆ 2ν ) = (m  1) w e ~ = x 2  [ ( x 2)2](x 2)-1 dan w ~ * = {tr(MZZT)}2 dengan M = I  dimana w ij i j ij ij

X(XTX)-1XT. Pada model Fay-Herriot, penjabaran ktg[hi( σˆ 2 , y)] dapat dinyatakan sebagai berikut: ktg[hi( σˆ 2ν , y)] = g1i( σˆ 2ν ) + g2i( σˆ 2ν ) + 2g3i( σˆ 2ν )

( 3.44 )

dimana g1i(2) = 2i2(2 + i2)-1, g2i(2) = i4(2 + i2)-2xiT(XTV-1X)-1xi, dan g3i(2) = i4(2 + i2)-3var( σˆ 2ν ).

( 3.45 )

Selanjutnya, berdasarkan asumsi kenormalan {i} dan {eij}, maka Var( σˆ 2ν ) = 2m-1[4 + 22i2/m + i2/m] .

( 3.46 )

Morris (1994) mengajukan selang kepercayaan emprical Bayes untuk nilai tengah i dengan mengasumsikan i2 = 2 pada kasus khusus i =  + i. Intervalnya adalah μˆ i  z/2si, dimana μˆ i adalah penduga emprical Bayes yang

50

secara esensial ekuivalen dengan hi( σˆ 2ν , y ), dan si2 = g1i( σˆ 2ν ) + g2i( σˆ 2ν ) + 24( σˆ 2ν +2)-2m-1(yi  xiTβˆ )2 yang bersifat o(m-1). Nilai si2 dapat direduksi menjadi g1i( σˆ 2ν ) + g2i( σˆ 2ν ) + g3i( σˆ 2ν ) jika (yi  xiTβˆ )2 diganti dengan nilai rataannya yaitu (yi  xiTβˆ )2m-1. Penduga ini ekuivalen dengan penduga KTG yang diperoleh melalui pendekatan g1i( σˆ 2ν ) yang tidak disesuaikan pada biasnya ke O(m-1). Prasad dan Rao (1990) serta Datta dan Lahiri (1995) mengajukan hi( σˆ 2 , y)  z/2(ktg[hi( σˆ 2 , y)])1/2 sebagai selang kepercayaan pada model koefisien regresi acak dan model regresi galat tersarang, serta hi( σˆ 2ν , y)  z/2mse[hi( σˆ 2ν , y)] untuk model Fay-Herriot.

3.6. Evaluasi terhadap Penduga KTG Pada model campuran umum ( 3.20 ) di atas, y = col1 i  m (y i ) , X = col1 i  m ( Xi ) , Z = col1 i  m (Zi ) , v = col1 i  m ( v i ) , dan e = col1 i  m (ei ) , dimana yi dan ei adalah ni  1 vektor acak, Xi dan Zi adalah matriks konstanta yang diketahui dengan ukuran ni  k dan ni  bi, vi adalah bi  1 vektor acak, dan n = ni merupakan ukuran total contoh. Vektor vi dan ei adalah saling bebas dengan nilai tengah 0 dan matriks koragam G = col1 i  m (G i ) dan R = col1 i  m (R i ) dengan ukuran bi  bi dan ni  ni, tergantung pada parameter  = (1, …, p)T yang disebut sebagai komponen ragam. Selanjutnya, i = liT + miTv dengan mi = col1 j  i (ij mii ) , dimana ij = 1 jika i = j dan ij = 0 jika i  j, li dan mii adalah

vektor konstanta yang diketahui dengan ukuran p  1 dan bi  1, dan  adalah vektor parameter berukuran p  1. Teorema A.1. Di bawah kondisi kenormalan untuk galat acak pada model ( 3.20 ), maka ( 3.47 ) E[d()T( φˆ  )]2 = tr[(biT)V(biT)TE( φˆ  )( φˆ  )T] + o(m-1), (A.1) dimana biT = col1 j p (b i /  j ) dan biT = mTGZTV-1 . T

Untuk membuktikan Teorema A.1 diperlukan beberapa lemma.

51

Lemma A.1. Misalkan A1 dan A2 adalah matriks berordo n, dan u ~ Nn(0, ), dimana  adalah definit positif. Maka, E[u(uTAsu)uT] = (tr As) + 2As,

s = 1, 2,

 2  E  (u T A s u) = 2tr A1 A2 + (tr A1)(tr A2),  s 1 

( 3.48 )

dan

  2   E u  (u T A s u) u T  = (tr A1)(tr A2) + 2(tr A1)A2     s1 + 2(tr A2)A1 + 2(tr A1A2) + 4A1A2 + 4A2A1.

( 3.49 )

Lemma A.2. Misalkan u ~ Nn(0, ), zj = jTu, dan qj = uTAju, (j = 1, …, p), dimana j dan Aj adalah matriks dengan ordo n  1 dan n  n. Maka, p

p

E[zT(q  Eq)]2 = tr zq + 4 { jTAjAll + jTAlAjl}) ( 3.50 ) j 1 l 1

dimana z = (z1, …, zp), q = (q1, …, qp), z dan q adalah matriks koragam bagi z dan q. Berdasarkan hasil ( 3.50 ) dan Lemma A.1, maka E(qi) = tr Ai, cov(qi, qj) = 2tr AiAj, dan E[zizj(qi  Eqi)(qj  Eqj)] = iTE[u(uTAiuuTAju)uT]j  (Eqi)iTE[u(uTAju)uT)]j  (Eqj)iTE[u(uTAiu)uT)]j + (Eqi)(Eqj)iTj. Lemma

A.3.

Misalkan

( 3.51 ) (a)

nn =

diag1 i  m [O(m 1 )]  [O(m 2 )] ; (c) r =

diag1 i  m ( Σi ) ;

(b)

Cnn =

col1 h  mcol1 j  nh [O(m 1 )] ; (d) si =

col1 h  m col1 j  nh [ihO(1)] , dimana i adalah matriks ni  ni. Selanjutnya (e)

CC = [O(m-2)]nn; (f)

siTsi = O(1); (g) (r + si)TCC(r + si) = O(m-2).

Berdasarkan penjabaran (a)  (d) akan diperoleh (e)  (g). Lemma A.4. Misalkan dm(j)() adalah elemen ke-j dari dm() = tm()/(), maka akan diperoleh cov[dm(j)(), dm(l)()] = [biT/j]V[bmT/l] + O(m-1).

(3.52 )

52

Hal ini berdasarkan konsep diferensial yaitu (AB/) = (A/)B + A(B/) dan B-1/ =  B-1(B/)B-1. Selanjutnya bisa dituliskan bahwa dm(j)() = {fm(j)T + biT/j}u, dimana u = Zv + e, dan fm(j)T = (1T  mmTGZTV-1X)(XTV-1X)-1 (XT[V-1/j]A  (bmT/j)X(XTV-1X)-1XTV-1, dengan A = I  X(XTV-1X)-1XTV-1. Dengan demikian bisa diperoleh bahwa cov[dm(j)(, y), dm(l)(, y)] = [fi(j)T + bmT/j]V[fi(l)T + bmT/l.]T ( 3.53 ) Berdasarkan penjabaran di atas, elemen fm(j) bersifat O(m-1), biT/j = [col1 l  m (il O(1))]T ,

X(XTV-1X)-1XT = [O(m-1)]nnX(XTV-1X)-1XT(V-1/j)A =

[O(m-1)] nn dan X(XTV-1X)-1XTV-1 = [O(m-1)] nn.

Hasil yang ditunjukkan pada ( 3.47 ) diperoleh dari ( 3.53 ), yaitu E[dm(, y)T( φˆ  )]2 = tr[Am()E( φˆ  )( φˆ  )T] + o(m-1),

( 3.54 )

dan selanjutnya menggunakan Lemma A.4 untuk menggantikan Am() dengan (bmT)V(bmT)T. Melalui penggunaan Lemma A.2 dengan jT = fm(j)T + bmT/j = j(i)T, z = dm(),  = V, Aj = Cj, dan q = φˆ , akan diperoleh E[dm(, y)T( φˆ  )]2 = tr[Am()E( φˆ  )( φˆ  )T] p

p

+ 4  [ j(i)TVCjVCll(i) + j(i)TVClVCjl(i)]

( 3.55 )

j 1 l 1

dimana j(i) dan Cj adalah bentuk r + sm dan C pada Lemma A.3. Pada bagian ini dijabarkan bahwa pendekatan deret Taylor untuk nilai harapan penduga parameter pada model Fay-Herriot adalah bersifat o(m-1). Teorema A.2. Misalkan ragam i2 memenuhi 0 < L2  i2  U2 <  untuk semua i dan misalkan pula qi = xiT(XTX)-1xi sedemikian hingga

maksi1 qi =

O(m-1). Selanjutnya, E[hi( σˆ 2ν , y)  hi( σ 2ν , y )] = E[( σˆ 2ν  σ 2ν )hi( σ 2ν , y )/ σ 2ν ]2 + o(m-1).

( 3.56 )

Pembuktian Teorema A.2 membutuhkan dua Lemma yang terkait dengan persoalan tersebut. Lemma A.5. E( σˆ 2ν  σ 2ν )2s = O(m-s) (s  1). Hal ini dapat dijelaskan sebagai berikut:

53

σˆ 2ν  σ 2ν = (m  k)-1[( yi  xiT)2  ( β  )TXTX( β  )

 ( σ 2ν + i2)(1  qi)] = (m  k)-1[Ui( σ 2ν + i2)  T( σ 2ν + i2)qi]

( 3.57 )

~ dimana β = (XTX)-1XT y , Ui = ( yi  xiT)/( σ 2ν + i2)  1 = U i  1 dengan E(Ui) = 0, T = ( β  )TXTX( β  )/( σ 2ν

+ i2)qi dengan E(T) = 0, dan

k k ~ T = 1 λ jV j / 1 λ j , Vj merupakan peubah 12 yang saling bebas, sedangkan j

merupakan akar ciri (eigenvalues) dari (XTX)-1(XTVX) dan j = ( σ 2ν + i2)qi. Berdasarkan ( 3.57 ), dapat diketahui bahwa E( σˆ 2ν  σ 2ν )2  2(m  k)-2[E(Ui( σ 2ν + i2))2 + E(T2(( σ 2ν + i2)qi)2] = O(m-1), karena E(T2) = O(1), ( σ 2ν + i2)qi = O(1), dan E(Ui( σ 2ν + i2))2 = E(Ui2)( σ 2ν + i2)2  ( σ 2ν + U2)2mE(Ui2) = O(m) selanjutnya, E( σˆ 2ν  σ 2ν )2s  2s(m  k)-2s[E(Ui( σ 2ν + i2))2s + E(T2s(( σ 2ν + i2)qi)2s] = O(m-s), s  2, sedangkan E(Ui( σ 2ν + i2))2s = O(ms) karena E(Ui) = 0. Lemma A.6. E( σˆ 2ν  σ 2ν )2s = O(m-s) (s  1) dan E( σˆ 2ν  ~ σ ν2 )4 = O(m-4). Hal ini dapat dijelaskan sebagai berikut: P( ~ σ ν2  0) = P( ~ σ ν2  σ 2ν   σ 2ν )  P(| ~ σ ν2  σ 2ν |  σ 2ν )  E( ~ σ ν2  σ 2ν )2l/ σ 2ν l dengan menggunakan pertidaksamaan Chebyshev. Berdasarkan Lemma A.5 maka P( ~ σ ν2  0) = O(m-1) untuk beberapa nilai l. E( σˆ 2ν  σ 2ν )2s = E[( σˆ 2ν  σ 2ν )2s| ~ σ ν2 0]P( ~ σ ν2 0) + E[( σˆ 2ν  σ 2ν )2s| ~ σ ν2 >0]P( ~ σ ν2 >0)  σ 2ν s P( ~ σ ν2 0) + E( ~ σ ν2  σ 2ν )2s = O(m-1),

( 3.58 )

dengan cara memilih l = s dan menggunakan Lemma A.5. Selanjutnya dituliskan ( σˆ 2ν  ~ σ ν2 )4 = ~ σ ν4 W, dimana W = 1 jika ~ σ ν2  0 dan W = 0 jika ~ σ ν2 > 0. Melalui pertidaksamaan Cauchy-Schwarz, diperoleh bahwa

54

1

E( σˆ 2ν  ~ σ ν2 )4  [E( ~ σ 8ν )P( ~ σ ν2 < 0)] 2 = O(m-4)

( 3.59 )

karena P( ~ σ ν2  0) = O(m-8) dan E( ~ σ 8ν )  8[E( ~ σ 8ν  σ 2ν )8 + σ8ν ] + O(1). Selanjutnya, Teorema A.2 di atas dapat dibuktikan sebagai berikut. Berdasarkan ekspansi deret Taylor dari fungsi hi( σˆ 2ν  y ) di sekitar σ 2ν , dapat diperoleh bahwa hi( σˆ 2ν  y )  hi( σ 2ν  y ) = ( σˆ 2ν  σ 2ν )hi( σ 2ν  y )/ σ 2ν + 0.5( σˆ 2ν  σ 2ν )22hi( σ 2ν *  y )/ σ 2ν *2 ,

( 3.60 )

dimana | σ 2ν *  σ 2ν | < | σˆ 2ν  σ 2ν |. Dengan demikian, maka E[hi( σˆ 2ν  y )  hi( σ 2ν  y )]2 = E[( σˆ 2ν  σ 2ν )hi( σ 2ν  y )/ σ 2ν ]2 + R1 + R2, dimana R1 = E[( σˆ 2ν  σ 2ν )hi( σ 2ν  y )/ σ 2ν ][( σˆ 2ν  σ 2ν )22hi( σ 2ν *  y )/ σ 2ν *2], dan R2 = E[( σˆ 2ν  σ 2ν )4{2hi( σ 2ν *  y )/ σ 2ν *2}2]. Dapat ditunjukkan bahwa R2 bersifat o(m-1), yaitu ~ ~ hi( σ 2ν  y )/ σ 2ν = i2( σ 2ν + i2)-1(xiT β )/ σ 2ν + i2( σ 2ν + i2)-2( yi  xiT β ), ~ ~ ~ ), dimana β = (XTV-1X)-1(XTV-1 y ) dan (xiT β )/ σ 2ν =  xiT(XTV-1X)-1(XTV-2 u ~ = y  X~ dengan u β . Hal ini berdasarkan pada teorema matriks, bahwa jika A dan

B adalah matriks non-singular sedemikian hingga zTAz > zTBz, maka zTA-1z < zTB-1z untuk setiap z  0 (Graybill, 1969). Berdasarkan hasil ini dan ~ T V-1 u ~  uTV-1u, dimana u = y  X, pertidaksamaan Cauchy-Schwarz, dan u

akan diperoleh ~ ~ T V-3 u ~ )1/2 |(xiT β )/ σ 2ν |  (xiT(XTV-1X)-1xi)1/2( u

 (max qi)1/2( σ 2ν + U2)1/2L-3(uTu)1/2,

( 3.61 )

sehingga ~ ~ |hi( σ 2ν  y )/ σ 2ν |  |(xiT β )/ σ 2ν | + L-2| yi  xiT β | ,

( 3.62 )

~ dimana |(xiT β )/ σ 2ν | diberikan pada (A.9).

Turunan kedua dari hi( σ 2ν  y ) adalah

55

~ 2hi( σ 2ν  y )/( σ 2ν )2 = i2( σ 2ν + i2)-12(xiT β )/( σ 2ν )2 ~ ~  2i2( σ 2ν + i2)-2(xiT β )/ σ 2ν  2i2( σ 2ν + i2)-3( yi  xiT β ),

dimana ~ ~ 2(xiT β )/( σ 2ν )2 = 2xiT(XTV-1X)-1XTV-3 u ~.  2xiT(XTV-1X)-1XTV-2X(XTV-1X)-1XTV-2 u

Berdasarkan pertidaksamaan Cauchy-Schwarz dan hasil matriks di atas serta beberapa penyederhanaan, dapat diperoleh ~ |2(xiT β )/( σ 2ν )2|  4(max qi)1/2( σ 2ν + U2)1/2L-5(uTu)1/2, ~ TV-2X(XTV-1X)-1XTV-2 u ~ dan u

( 3.63 )

~ TV-3 u ~ , karena V1/2X(XTV-1X)-1XTV-1/2  u

adalah matriks simetrik dan idempoten dengan akar ciri 1 atau 0. Mengacu pada persamaan ( 3.61 ) dapat diperoleh bahwa ~ |2hi( σ 2ν  y )/( σ 2ν )2|  6(max qi)1/2( σ 2ν + U2)1/2L-5(uTu)1/2 + 2L-4| yi  xiT β |.

Oleh karena itu, ~ [2hi( σ 2ν  y )/( σ 2ν )2]2  c1( σ 2ν + U2)((1/m)ui2) + c2( yi  xiT β )2, (3.64 )

dimana c1 dan c2 adalah O(1), dan (m maxi qi) = O(1). Juga menyebabkan bahwa, ~ ~ ( yi  xiT β )2  2[ui2 + (xiT( β  ))2]  2[ui2 + ( σ 2ν + U2)( m maxi qi)L-2((1/m)ui2)], ~ dengan menggunakan pertidaksamaan Cauchy-Schwarz pada (xiT( β  ))2,

dimana ui = yi  xiT. Selanjutnya, dari (A.12) dapat diperoleh bahwa R2  E[ c~1 ( σˆ 2ν  σ 2ν )4( σ 2ν * + U2)((1/m)ui2) + 2c2( σˆ 2ν  σ 2ν )4ui2], sedangkan c~1 adalah O(1). |E( σˆ 2ν  σ 2ν )4( σ 2ν * + U2)((1/m)ui2)|  E| σˆ 2ν  σ 2ν |5((1/m)ui2) + ( σ 2ν + U2)E( σˆ 2ν  σ 2ν )4((1/m)ui2),

( 3.65 )

karena | σ 2ν *  σ 2ν |  | σˆ 2ν  σ 2ν |. Berdasarkan Lemma A.6 dan pertidaksamaan Cauchy-Schwarz, elemen pertama pada bagian sisi kanan persamaan ( 3.65 ) adalah o(m-1), juga E((1/m)ui2)2 adalah O(1) karena ui adalah bersifat bebas dan menyebar N(0, σ 2ν + i2). Serta E( σˆ 2ν  σ 2ν )4ui2 = o(m-1) karena E(ui4) = O(1),

56

sehingga R2 adalah o(m-1). R1 juga sama dengan o(m-1) karena E[( σˆ 2ν  σ 2ν )hi( σ 2ν  y )/ σ 2ν ]2 adalah o(m-1) menggunakan hasil ( 3.62 ).

Pada bagian ini ditunjukkan bahwa pendekatan penduga KTG, memiliki nilai harapan yang bersifat o(m-1) di bawah model Fay-Herriot, yaitu E[g1i( σˆ 2ν )] = g1i( σ 2ν )  g3i( σ 2ν ) + o(m-1), E[g2i( σˆ 2ν )] = g2i( σ 2ν ) + o(m-1), E[g3i( σˆ 2ν )] = g3i( σ 2ν ) + o(m-1).

( 3.66 )

Sebagaimana penjabaran sebelumnya, g1i( σˆ 2ν ) = σˆ 2ν i2( σˆ 2ν + i2)-1. Melalui ekspansi deret Taylor bagi g1i( σˆ 2ν ) di sekitar σ 2ν , dapat diperoleh g1i( σˆ 2ν ) = g1i( σ 2ν ) + ( σˆ 2ν  σ 2ν )g1i( σ 2ν ) + +

1 2 ( σˆ ν  σ 2ν )2g1i( σ 2ν ) 2

1 2 ( σˆ ν  σ 2ν )2[g1i( σ 2ν *)  g1i( σ 2ν )], 2

( 3.67 )

dimana  σ 2ν *  σ 2ν    σˆ 2ν  σ 2ν . Selanjutnya, E( σˆ 2ν  σ 2ν ) = E( σˆ 2ν  ~ σ ν2 ) dan E σˆ 2ν  ~ σ ν2  = o(m-1), dengan menggunakan P( ~ σ ν2  0)  o(m-1) untuk beberapa nilai l (Lemma A.6) diperoleh E( σˆ 2ν  σ 2ν )g1i( σ 2ν )  g1i( σ 2ν )E σˆ 2ν  σ 2ν  = o(m-1), karena g1i( σ 2ν ) = i4( σ 2ν + i2)-2  1. Sedangkan E( σˆ 2ν  σ 2ν )2 = E( ~ σ ν2  σ 2ν )2 + o(m1

) = var( ~ σ ν2 ) + o(m-1) berdasarkan Lemma A.6. Oleh karena itu, maka 1 1 E[ ( σˆ 2ν  σ 2ν )2g1i( σ 2ν )] = var( ~ σ ν2 )g1i( σ 2ν ) + o(m-1) 2 2

=  g3i( σ 2ν ) + o(m-1),

( 3.68 )

dimana g1i( σ 2ν ) = 2i4( σ 2ν + i2)-3. Untuk elemen terakhir yang terdapat pada persamaan ( 3.67 ), yaitu  g1i( σ 2ν *)  g1i( σ 2ν ) = 2i4( σ 2ν + i2)-3( σ 2ν * + i2)-3( σ 2ν * + i2)3  ( σ 2ν + i2)3  2L-8[ σ 2ν * σ 2ν 3 + 3( σ 2ν + U2)( σ 2ν * σ 2ν )2 + 3( σ 2ν + U2)2 σ 2ν * σ 2ν ]  2L-8[ σˆ 2ν  σ 2ν 3 + 3( σ 2ν + U2)( σˆ 2ν  σ 2ν )2

57

+ 3( σ 2ν + U2)2 σˆ 2ν  σ 2ν ].

(3.69 )

Sehingga, E( σˆ 2ν  σ 2ν )2 g1i( σ 2ν *)  g1i( σ 2ν )  2L-8[E σˆ 2ν  σ 2ν 5 + 3( σ 2ν + U2)E( σˆ 2ν  σ 2ν )4 + 3( σ 2ν + U2)2E σˆ 2ν  σ 2ν 3] = o(m-1),

( 3.70 )

dimana E( σˆ 2ν  σ 2ν )2s = O(m-s), E σˆ 2ν  σ 2ν 3  [E( σˆ 2ν  σ 2ν )2E( σˆ 2ν  σ 2ν )4]1/2 = o(m-1) dan E σˆ 2ν  σ 2ν 5  [E( σˆ 2ν  σ 2ν )4E( σˆ 2ν  σ 2ν )6]1/2 = o(m-1). Berdasarkan penjabaran ini, maka persamaan ( 3.66 ) terbukti. Persamaan ( 3.66 ) yang terkait dengan elemen g2i( σˆ 2ν ) dapat dibuktikan sebagai berikut:

ˆ 1 X)-1xi  xiT(XTV-1X)-1xi] g2i( σˆ 2ν )  g2i( σ 2ν ) = i4( σˆ 2ν + i2)-2[xiT(XT V + i4xiT(XTV-1X)-1xi[( σˆ 2ν + i2)-2  ( σ 2ν + i2)-2].

( 3.71 )

Melalui ekspansi deret Taylor di sekitar σ 2ν pada persamaan ( 3.71 ) dapat diperoleh

ˆ 1 X)-1xi  xiT(XTV-1X)-1xi I1 = xiT(XT V = ( σˆ 2ν  σ 2ν )[(xiT(XTV-1X)-1xi)/ σ 2ν ] =  ( σˆ 2ν  σ 2ν )xiT(XTV*-1X)-1(XTV*-2X)(XTV*-1X)-1xi dimana V* adalah nilai V pada saat σ 2ν = σ 2ν *. Berdasarkan hasil matriks sebelumnya, dapat diketahui bahwa I1  L-2 σˆ 2ν  σ 2ν  xiT(XT V*-1X)-1xi atau EI1  L-2(max qi)E[ σˆ 2ν  σ 2ν ( σ 2ν * + U2)]  (1/m)L-2(m max qi)[E( σˆ 2ν  σ 2ν )2E( σ 2ν * + U2)2]1/2 = o(m-1), dimana m max qi = O(1), E( σˆ 2ν  σ 2ν )2 = o(m-1), dan E( σ 2ν * + U2)2  2[E( σˆ 2ν  σ 2ν )2 + ( σ 2ν * + U2)2] = O(1). Demikian juga

E( σˆ 2ν + i2)-2  ( σ 2ν + i2)2  L-8[E( σˆ 2ν  σ 2ν )2 + 2( σ 2ν + U2)E σˆ 2ν  σ 2ν ] = O(m-1/2),

( 3.72 )

58

dengan [E σˆ 2ν  σ 2ν ]2  E( σˆ 2ν  σ 2ν )2, dan xiT(XT V-1X)-1xi  (1/m)( σ 2ν + U2) (m max qi) = o(m-1). Selanjutnya, sesuai dengan persamaan ( 3.71 ) bahwa Eg2i( σˆ 2ν )  g2i( σ 2ν ) = o(m-1), sehingga persamaan ( 3.66 ) terbukti. Terakhir, persamaan ( 3.66 ) yang terkait dengan elemen g3i( σˆ 2ν ) dapat dibuktikan sebagai berikut: g3i( σˆ 2ν )  g3i( σ 2ν ) = (2/m)i4( σ 2ν + i2)-3[( σˆ 2ν  σ 2ν )2 + 2( σ 2ν + δi2 )( σˆ 2ν  σ 2ν )] + (2/m)i4( σ 4ν + 2 σ 2ν δi2 + i4/m)[( σ 2ν + i2)-3  ( σˆ 2ν + i2)-3] = I2 + I3,

( 3.73 )

dimana δi2 = i2/m. Karena itu, I2  (2/m)L-2[E( σˆ 2ν  σ 2ν )2 + 2( σ 2ν + U2)E σˆ 2ν  σ 2ν ] = o(m-1), dan I3  (2/m)L-8( σ 4ν + 2 σ 2ν U2 + U4)[E σˆ 2ν  σ 2ν 3 + 3( σ 2ν +

U2)E( σˆ 2ν  σ 2ν )2 + 3( σ 2ν + U2)E σˆ 2ν  σ 2ν ] = o(m-1), serta E σˆ 2ν  σ 2ν  = o(m-1/2). Sesuai dengan persamaan ( 3.73 ) bahwa Eg3i( σˆ 2ν )  g3i( σ 2ν ) = o(m-1), maka persamaan ( 3.66 ) terbukti.

3.7. Penerapan pada Data Susenas dan Simulasi Studi kasus penerapan dilakukan pada dua sumber data, yaitu data Susenas dan data simulasi. Data simulasi berguna untuk mengetahui berbagai karakteristik pendugaan pada beberapa kondisi yang berbeda. Pada penelitian ini, data simulasi digunakan untuk mengetahui pengaruh waktu (T) dan korelasi diri () pada model SAE berdasarkan model state space dan metode penarikan contoh sebagaimana yang diterapkan pada data Susenas. 3.7.1. Data Susenas Metode pendugaan tidak langsung yang memasukkan pengaruh acak area dan waktu ini dapat diterapkan pada data Susenas BPS yang memang memiliki persoalan ukuran contoh yang terlalu kecil pada tingkat desa. Model yang digunakan adalah seperti yang dijabarkan di atas yaitu:

ît = xitT + vi + uit dan uit = ui,t-1 + it,

( 3.74 )

dengan

59

vi  iid (0, v2) dan it  iid N(0, 2). Model tersebut dapat juga dinyatakan dalam model MCLT, yi = Xi + ZiviT + ei , yaitu: yi = ˆ i ,


Zi = (1T, IT)

( 3.75 )


 = (1, …, p)T


 2 Gi =  v 0

0T  , 2 

Ri = i

( 3.76 )

dimana i =  adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) |t-s|/(1 - 2). Berdasarkan model di atas ˆ it tergantung pada pengaruh area spesifik vi dan oleh waktu spesifik uit yang berkorelasi antar waktu. Nilai ˆ it adalah penduga langsung dari survei untuk tingkat pengeluaran perkapita pada area kecil (desa) i pada waktu (tahun) t. Pada kasus ini, T = 5, yaitu Susenas Wilayah Kota Bogor 2001 – 2005. Parameter it merupakan fungsi untuk rataan pada area i pada waktu t, dan eit adalah galat penarikan contoh yang menyebar normal dengan nilai harapan 0 dan mempunyai matriks koragam blok-diagonal . Sedangkan xit adalah vektor kovariat spesikasi area yang mungkin berubah menurut waktu t. Vektor kovariat area xit tersebut adalah peubah tetap yang diperoleh dari data Podes BPS 1999/2000, 2001/2002, dan 2003/2004. Sebagaimana asusmsi yang digunakan pada model area kecil, peubah tetap ini diperoleh melalui sensus sehingga tidak memiliki galat penarikan contoh. Lima peubah tetap yang digunakan untuk membentuk vektor kovariat tersebut adalah persentase rumah tangga pertanian (x1), persentase rumah tangga yang terkategori pra sejahtera (x2), persentase rumah tangga yang menggunakan daya listrik minimum 450 kwh perbulan (x3), persentase rumah tangga yang mendapatkan kartu miskin (x4), dan mayoritas sumber air rumah tangga (x5). Pemilihan peubah tersebut didasarkan pada tingkat korelasinya dengan tingkat pengeluaran perkapita perbulan. Tabel 3.1 menyajikan hasil penerapan metode

60

pendugaan langsung dan metode kemungkinan maksimum terbatas (restricted maximum likelihood / REML) pada model area kecil pada data Susenas 2005 (non-time seies). Hasil lengkap disajikan pada Lampiran 4. Tabel 3.1. Perbandingan Antara Metode Pendugaan Langsung dengan Metode Pendugaan Tidak Langsung untuk Rata-rata Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas 2005 Wilayah Kota Bogor

No

Nilai untuk Seluruh Area Kecil

Penduga Langsung

ˆ

KTG

AKTG

Metode SAE - PTLTE

ˆ PTLTE

KTG

AKTG

1 Minimum

178.1

285.7

16.9

181.5

265.4

16.3

2 Kuartil Pertama

304.5

713.5

26.7

309.7

594.0

24.4

3 Rataan

368.2

2597.0

45.4

347.2

1128.7

32.3

4 Median

363.1

1484.3

38.6

358.5

995.9

31.6

5 Kuartil Ketiga

412.6

3377.4

58.1

397.2

1578.0

39.7

6 Maksimum

753.8 14811.8

121.7

496.7

2420.3

49.2

Pada Tabel 3.1 tersebut, ˆ adalah penduga rata-rata pengeluaran perkapita perbulan berdasarkan metode penarikan contoh Susenas, sedangkan ˆ PTLTE merupakan penduga tingkat pengeluaran perkapita perbulan (dalam ribuan) berdasarkan model SAE melalui pendekatan PTLTE. Nilai akar kuadrat tengah galat / AKTG (root mean square of error / RMSE) dihitung dari

KTG . Gambar

3.1 memperlihatkan plot antara AKTG penduga langsung dengan AKTG hasil metode PTLTE. Berdasarkan Tabel 3.1 dan Gambar 3.1, terlihat bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil PTLTE dibandingkan dengan AKTG pada metode pendugaan langsung. Secara rata-rata, AKTG pada

metode

pendugaan langsung sebesar 45.4 turun menjadi 32.3 pada metode pendugaan tidak langsung PTLTE. Ini menunjukkan bahwa pengaruh acak area maupun pengaruh sintetik vektor kovariat berfungsi mengkalibrasi hasil pendugaan langsung yang hanya didasarkan pada data survei semata. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model.

61

Akar Kuadrat Tengah Galat (AKTG)

140 120 100 80 60 40 20 0 Area Kecil (Desa)

Penduga Langsung

PTLTE-pm

Gambar 3.1. Plot Antara AKTG Penduga Langsung dengan AKTG Hasil Metode PTLTE Data Penampang Melintang Sementara itu, perbandingan antara metode PTLTE penampang melintang dan PTLTE deret waktu untuk rata-rata pengeluaran perkapita pada data Susenas wilayah Kota Bogor disajikan pada Tabel 3.2. Tabel 3.2. Perbandingan Antara Metode PTLTE Penampang Melintang dengan Metode PTLTE Deret Waktu untuk Data Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor

No


Metode SAE – PTLTE Penampang Melintang

ˆ PT  PM

KTG

Metode SAE – PTLTE Deret Waktu

AKTG

ˆ PT  DW

KTG

AKTG

1 Minimum

181.5

265.4

16.3

179.7

250.1

15.8

2 Kuartil Pertama

309.7

594.0

24.4

302.7

526.8

22.9

3 Rataan

347.2 1128.7

32.3

338.3

906.7

29.2

4 Median

358.5

995.9

31.6

341.3

846.7

29.1

5 Kuartil Ketiga

397.2 1578.0

39.7

383.1

1251.6

35.4

6 Maksimum

496.7 2420.3

49.2

512.9

1728.5

41.6

Pada Tabel 3.2 tersebut, ˆ PT  PM merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan PTLTE untuk

62

Susenas tahun 2005 saja, hanya memasukkan pengaruh acak area. Sedangkan

ˆ PT  DW merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan PTLTE untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.415. Gambar 3.2 memperlihatkan plot antara AKTG penduga PTLTE penampang melintang dengan AKTG hasil metode PTLTE deret waktu. Hasil lengkap untuk tiap area kecil (desa) disajikan pada Lampiran 5. Berdasarkan Tabel 3.2 dan Gambar 3.2, terlihat bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE penampang melintang. Secara rata-rata, AKTG pada metode PTLTE penampang melintang sebesar 32.3 turun menjadi 29.2 pada metode PTLTE deret waktu. Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun.


60 50

40 30 20

10 0 Area Kecil (Desa)

PLTE-pm

PTLTE-dw

Gambar 3.2. Plot Antara AKTG Metode PTLTE Penampang Melintang dengan AKTG Metode PTLTE Deret Waktu

63

3.7.2. Data Simulasi Data simulasi berguna untuk mengetahui berbagai karakteristik pendugaan pada beberapa kondisi yang berbeda. Pada penelitian ini, proses simulasi difokuskan untuk mengetahui pengaruh banyaknya waktu (T) dan korelasi diri (). Sementara model dan metode penarikan contohnya mengikuti model dan metode penarikan contoh Susenas. Selanjutnya dievaluasi tentang relatif biasnya dan nilai AKTG-nya. Pembangkitan data didasarkan pada model di atas, yaitu:


( 3.77 )

dengan vi  iid (0, v2) dan it  iid N(0, 2). Tabel 3.3. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode PTLTE Penampang Melintang dan Metode PTLTE Deret Waktu untuk Data Simulasi Korelasi Diri ()

T=3 PTLTE-pm

PTLTE-dw

T=5 PTLTE-pm

PTLTE-dw

T=7 PTLTE-pm

PTLTE-dw

0.01

0.0000121 0.0000124 0.0000116 0.0000112 0.0000123 0.0000112

0.25

0.0000132 0.0000115 0.0000127 0.0000107 0.0000114 0.0000110

0.45

0.0000127 0.0000126 0.0000097 0.0000123 0.0000120 0.0000098

0.60

0.0000122 0.0000117 0.0000107 0.0000093 0.0000096 0.0000105

0.85

0.0000119 0.0000089 0.0000133 0.0000122 0.0000109 0.0000111

Nilai v = 43.4 dan  = 24.5 yang diperoleh dari hasil PTLTE deret waktu data Susenas di atas. Vektor kovariat xitT = (xit1, ..., xit5) dibangkitkan sebagai peubah tetap (fixed), sedangkan vektor  nilainya diambil dari hasil PTLTE deret waktu data Susenas di atas yaitu 0 = 136.440, 1 = 5.806, 2 = -2.225, 3 = 0.383,

4 = -1.355, dan 5 = -8.215. Parameter  it = xitT sedangkan penduga langsung bagi  it diperoleh dari persamaan di atas yaitu ît = xitT + vi + uit =  it + vi + uit dan uit = ui,t-1 + it. Simulasi dilakukan untuk banyaknya waktu (T) yang berbeda yaitu T = 3, 5, dan 7, dengan lima nilai korelasi diri yaitu  = 0.01, 0.25, 0.45,

64

0.60, dan 0.85. Selanjutnya dibandingkan relatif bias dan nilai AKTG-nya antara metode PTLTE penampang melintang dan metode PTLTE deret waktu. Pada Tabel 3.3, PTLTE-pm adalah metode PTLTE penampang melintang dan PTLTE-dw adalah metode PTLTE deret waktu. Nilai bias relatif mutlak / BRM (absolute relative bias / ARB) dihitung sebagai berikut: 1 R  ˆr   i  R r 1   i

BRMi =

   

( 3.78 )

dimana R adalah banyaknya simulasi, yaitu R = 10,000. Berdasarkan tabel tersebut terlihat bahwa secara umum bias relatif mutlak tidak berbeda antara PTLTE penampang melintang dengan PTLTE deret waktu. Artinya, bahwa PTLTE penampang melintang maupun PTLTE deret waktu menghasilkan penduga yang tidak berbias. Tabel 3.4. Nilai Rata-rata AKTGR pada Metode PTLTE Penampang Melintang dan Metode PTLTE Deret Waktu untuk Data Simulasi Korelasi Diri ()

T=3

T=5

T=7

PTLTE-pm

PTLTE-dw

PTLTE-pm

PTLTE-dw

PTLTE-pm

PTLTE-dw

0.01

0.1712

0.1293

0.2134

0.1127

0.2560

0.0919

0.25

0.1871

0.0502

0.2203

0.0465

0.2453

0.0453

0.45

0.2893

0.0477

0.3134

0.0378

0.4040

0.0354

0.60

0.2970

0.0478

0.3540

0.0383

0.4578

0.0276

0.85

0.4221

0.0363

0.4312

0.0287

0.6136

0.0149

Tabel 3.4 menunjukkan hasil nilai rata-rata akar kuadrat tengah galat relatif / AKTGR (relative root of mean square of error / RRMSE) pada metode PTLTE penampang melintang dan metode PTLTE deret waktu. Nilai AKTGR dihitung sebagai berikut :

AKTGR i 

1 R ˆ ( r   i ) 2  R r 1 i

( 3.79 )

65

Berdasarkan Tabel 4.3, nilai AKTGR metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE penampang melintang pada waktu T dan korelasi diri  yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri  dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut.

3.8. Simpulan Nilai tengah pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Metode PTLT dilakukan dengan cara meminimumkan fungsi KTG, sehingga penduga bagi PTLT memiliki KTG yang paling kecil di antara semua penduga tidak bias linear. Metode kemungkinan maksimum terbatas dapat digunakan untuk menduga komponen ragam atau koragam. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh penduga dua tahap sebagai PTLT empirik atau PTLTE. Penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai AKTG-nya lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Ini menunjukkan bahwa pengaruh acak area maupun pengaruh sintetik vektor kovariat berfungsi mengkalibrasi hasil pendugaan langsung yang hanya didasarkan pada data survei semata. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model. Sementara itu, AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE penampang melintang. Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai AKTGR metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE penampang melintang pada waktu T dan korelasi diri  yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri  dapat memperbaiki pendugaan

66

parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Hasil tersebut menunjukkan bahwa informasi tambahan berguna untuk meningkatkan akurasi dan presisi suatu penduga. Informasi tambahan tersebut berupa nilai parameter dari area kecil lain yang memiliki karakteristik serupa dengan area kecil yang menjadi perhatian maupun nilai dari peubah yang memiliki hubungan dengan peubah yang sedang diamati. Metode dengan memanfaatkan informasi tambahan tersebut secara statistik memiliki sifat penguatan (borrowing strength) dari hubungan antara nilai peubah respon dan informasi tambahan tersebut.

67

BAB IV 4.

Metode Bayes Berhirarki untuk Pendugaan Area Kecil Berdasarkan Model State Space

4.1. Pendahuluan Metode prediksi tak-bias linear terbaik (PTLT) yang dibahas pada Bab III banyak diaplikasikan pada SAE. Namun pada metode ini banyak kondisi tertentu yang harus dipenuhi, di antaranya adalah pengasumsian bahwa parameter peubah tetap () dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataannya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode PTLT yang memerlukan berbagai kondisi tertentu. Secara umum pendekatan Bayes bertujuan untuk menentukan sebaran posterior, f(|y,), dari parameter area kecil yang menjadi perhatian, , apabila diketahui data y, menggunakan fungsi kepekatan bersyarat, f(y|,1) dan f(y|,2), dimana  = (1T, 2T) dinotasikan sebagai vektor parameter model. Selanjutnya menduga parameter model, , dari fungsi kepekatan marginal f(y|). Terakhir adalah menggunakan penduga fungsi kepekatan posterior f(|y, λˆ ), untuk membuat inferensia tentang , dimana λˆ adalah penduga bagi .

4.2. Metode Bayes Empirik Sebagaimana telah disebutkan di atas bahwa metode Bayes dapat digunakan pada berbagai kondisi data yang lebih luas dibandingkan dengan metode PTLT yang menggunakan pendekatan metode kemungkinan maksimum. Pada persoalan SAE, metode Bayes empirik pada dasarnya adalah sebagai berikut:

68

(a)

Memperoleh fungsi kepekatan posterior (posterior density), f(y,), dari parameter yang menjadi perhatian yakni  untuk data y yang diberikan dengan menggunakan fungsi kepekatan bersyarat f(y,1) dan f(2), dimana  = (1T,2T)T merupakan vektor parameter model.

(b) Menduga parameter model, , berdasarkan fungsi kepekatan marginal y, yaitu f(y). (c)

Menggunakan fungsi kepekatan posterior dugaan, f(y, ˆ ), untuk membuat inferensi tentang , dimana ˆ merupakan penduga bagi vektor parameter model . Fungsi kepekatan  sering diinterpretasikan sebagai fungsi kepekatan prior bagi  yang bisa divalidasi dari data.

Pada Bayes empirik parametrik, parameter  diasumsikan menyebar f(2). Sebaliknya, Bayes empirik non-parametrik tidak menspesifikasikan bentuk fungsi kepekatan prior bagi  (Larid dan Louism, 1987; Zhang dan Davidian, 2001). Misalkan yij (i = 1, 2, …, m; j = 1, 2, ..., ni) adalah contoh acak dari area kecil ke-i pada unit ke-j digunakan untuk menduga parameter pada area kecil ke-i yaitu i. Model yang digunakan adalah yij = i + eij dan i =  + i, dimana eij ~ N(0, i2) dan i ~ N(0, 2). Pendekatan Bayes pada model tersebut dapat dinyatakan sebagai berikut: Level 1a : yij|i  N(i, i2), dimana i2 diketahui. Level 2a :

i  N(, 2).

1 Misalkan bahwa θˆ i  ni

ni

y j 1

ij

, maka persamaan di atas dapat dituliskan sebagai

berikut: Level 1b : Level 2b :

θˆ i |i  N(i, i2/ni), dimana i2/ni diketahui. i  N(, 2).

Fungsi kepekatan peluang bersyarat bagi i ketika diberikan data yi, berdasarkan model 1b dan 2b adalah:

69

k (θ i | θˆ i ) 



f (θˆ i | θ i ) g (θ i ) f (θˆ | θ ) g (θ )dθ i

i

i

i

 f (θˆ i | θ i ) g (θ i ) 

1 2σ i / ni

 (θˆ  θ ) 2 (θ  α) 2  1 exp  i 2 i  i 2  2τ 2 τ  2(σ i / ni ) 

 ( τ 2  σ i2 / ni )θ i2  2(θˆ i τ 2  ασ i2 / ni )θ i   exp   2(σ i2 / ni ) τ 2  

 2  yi τ 2  ασ i2 / ni  2 θ  2 θ  i i τ  σ i2 / ni    exp    (σ i2 / ni ) τ 2   2  2  2 τ  σ / n  i i  

      

2 2    θˆ i τ 2  ασ i2 / ni    θˆ i τ 2  ασ i2 / ni     θi   2      τ  σ2 / n     τ2  σ2 / n     i i i i      exp   2 2  (σ i / ni ) τ      2 2 2     τ  σ i / ni    2     θˆ τ 2  ασ 2 / n  2  ˆ τ 2  ασ 2 / n     θ i i   i i     θi   i 2   i 2 2 2       τ  σ / n    τ  σ i / ni   i i     exp    exp  2 2 2 2     ( σ / n ) τ ( σ / n ) τ   i i i i  2   2 2 2  τ 2  σ 2 / n      i i    τ  σ i / ni      2    θˆ i τ 2  ασ i2 / ni      θi   2    τ  σ2 / n      i i    exp   . 2 2  (σ i / ni ) τ     2 2 2   τ  σ / n i i    

( 4.1 )

Berdasarkan persamaan ( 4.1 ) di atas, fungsi kepekatan peluang posterior bagi i yaitu k(i θˆ i ) merupakan sebaran normal dengan nilai tengah θˆ i τ 2  ασ i2 / ni  τ2    τ2  σ2 / n τ 2  σ i2 / ni i i 

 ˆ  σ i2 / ni θ i   2   τ  σ2 / n i i  

 γ i θˆ i  (1  γ i )α dimana γ i 

 α  

( 4.2 )

τ2 τ 2  σ i2 / ni

70

Oleh karena itu, penduga Bayes bagi i yaitu θˆ iB , apabila diketahui θˆ i , , dan 2 adalah

θˆ iB = E(i| θˆ i , , 2) = i θˆ i + (1 - i) (σ 2 / n ) τ 2 Var(i| θˆ i , , 2) = 2 i 2i  γ i (σ i2 / ni ) .

( 4.3 )

τ  σ i / ni

Pendekatan di atas dapat pula diterapkan pada model Fay-Herriot yang menjadi salah satu bentuk dasar model area kecil. Model tersebut adalah θˆ i = i + ei dan i = xiT + i atau θˆ i = xiT + i + ei dimana xi adalah vektor kovariat pada area yang berukuran p  1, i ~ N(0, 2 ) merupakan pengaruh acak area dan bebas dengan ei ~ N(0, i2), i2 adalah ragam penarikan contoh, dan θˆ i adalah penduga langsung (direct estimator) berdasarkan metode penarikan contohnya. Pendekatan Bayes untuk model tersebut dapat dinyatakan sebagai berikut: Level 1 (sampling model) : Level 2 (linking model)

:

θˆ i |i  N(i, i2), dimana i2 diketahui, i  N(xiT, 2 ).

Model ini sama dengan model di atas, sehingga berdasarkan pada persamaan ( 4.1 ) maka 2    θˆ i σ 2ν  x iT βδ i2     θi      σ2  δ2     ν i   . k (θ i | θˆ i )  exp  2 2  δi σ ν     2 2   2   σ ν  δi   

( 4.4 )

Fungsi kepekatan peluang posterior bagi i yaitu k(i θˆ i ) merupakan sebaran normal dengan nilai tengah θˆ i σ 2ν  x iT βδ i2  σ 2ν   2 2 σ 2ν  δ i2  σ ν  δi

 ˆ  δ i2 θ i   2   σ  δ2 i   ν

 T x i β  

 γ i θˆ i  (1  γ i )x Ti β dimana γ i 

σ 2ν σ 2ν  δ i2

Oleh karena itu, penduga Bayes bagi i yaitu θˆ iB , apabila diketahui θˆ i , , dan 2 adalah

71

θˆ iB = E(i| θˆ i , , 2 ) = γ i θˆ i  (1  γ i )xiT β δ 2σ 2 Var(i| θˆ i , , 2 ) = 2 i ν 2  γ i δ i2 . σ ν  δi

( 4.5 )

Penduga Bayes θˆ iB = θˆ iB (, 2 ) tergantung pada parameter model  dan 2 yang dapat diduga dari sebaran marginal θˆ i ~ N(xiT, 2 + i2) menggunakan metode kemungkinan maksimum terkendala / KMT (restricted maximum likelihood

/

REML).

Apabila

penduga

parameter

model

dinotasikan

sebagai βˆ dan ˆ 2 maka akan diperoleh penduga Bayes empirik bagi θˆ i dari

θˆ iB dengan mensubstitusikan βˆ pada  dan ˆ 2 pada 2 , yaitu θˆ iEB = θˆ iEB ( βˆ , ˆ 2 ) = γˆ i θˆ i  (1  γˆ i )xiT βˆ .

( 4.6 )

Penduga Bayes empirik, θˆ iEB , identik dengan penduga PTLTE yang telah dibahas pada Bab III sebelumnya, apabila menggunakan asumsi kenormalan. Penduga Bayes empirik ini juga merupakan nilai harapan bagi fungsi kepekatan posterior dugaan, f(i| θˆ i , βˆ , ˆ 2 ). Metode Bayes empirik ini dapat diterapkan pada model berbasis area ( 4.7 )

sebagai berikut : i = ziT + bivi,

ˆ i  i + ei = ziT + bivi + ei, i = 1, …, m vi  iid (0, v2),

ei  iid (0, i) ,

vi dan ei bebas.

Persamaan ini menggambarkan hubungan antara penduga langsung, kovariat, dan penduga tidak langsung. Persamaan ini dapat pula diekspresikan sebagai berikut :

ˆ i |i  iid N(i, i) i  iid N(ziT , bi2v2). Pada persamaan ini, i  iid N(ziT , bi2v2), disebut fungsi kepekatan prior. Penduga Bayes berdasarkan fungsi kepakatan posterior i| ˆ i adalah

θˆ iB  E(i| ˆ i , , v2) = i ˆ i + (1 - i)ziT i = bi2v2/( bi2v2 + i).

( 4.8 )

72

Penduga Bayes θˆ iB tergantung pada parameter model  dan v2 yang diduga dari sebaran marginal ˆ i  iid N(ziT , bi2v2 + i) menggunakan KMT. Karena  dan v2 diduga dari data, maka diperoleh penduga Bayes empirik sebagai berikut :

θˆ iEB  E(i| ˆ i , βˆ , ˆ v2 ) = γˆ i ˆ i + (1 - γˆ i )ziT βˆ γˆ i = bi2 ˆ v2 /( bi2 ˆ v2 + i).

( 4.9 )

4.3. Metode Bayes Berhirarki Pada pendekatan Bayes berhirarki, sebaran prior f() untuk parameter model  dispesifikasikan dan sebaran posterior f(y,) dari parameter area kecil yang menjadi perhatian dapat diperoleh. Model dua tahap (two-stage), f(y,1) dan f(2), dikombinasikan dengan sebaran prior  = (1T,2T)T untuk memperoleh sebaran posterior f(y,). Fungsi parameter yang menjadi perhatian, misalnya  = h(), diduga berdasarkan nilai harapan sebaran posteriornya yaitu ˆ HB = E[h()y], dan ragam posterior V[h()y] digunakan untuk mengukur presisinya. Berdasarkan teorema Bayes (Kass dan Steffey, 1989), bahwa f (θ,  | y ) 

f (y , θ | ) f () f1 (y )

( 4.10 )

dimana f1(y) adalah sebaran marginal bagi y, yaitu f1 (y )   f (y , θ | ) f ()dθd .

Sebaran posterior f( | y) dapat diperoleh dari persamaan ( 4.10 ) di atas yang dapat dinyatakan sebagai berikut: f (θ | y )   f (θ,  | y )d   f (θ | y , ) f ( | y )d .

( 4.11 )

Pada persamaan ( 4.11 ) dapat diketahui bahwa sebaran posterior f (θ | y ) merupakan campuran dua sebaran bersyarat f (θ | y , ) dan f ( | y ) . Sedangkan pada metode Bayes empirik hanya menggunakan f (θ | y , ) sebagai sebaran posteriornya. Karena itu, Bayes berhirarki sering juga disebut sebagai Bayes lengkap (fully Bayes). Berdasarkan persamaan di atas, maka evaluasi terhadap posterior f (θ | y ) serta E (h(θ) | y ) membutuhkan pengintegralan yang multi dimensi. Pada problem

73

yang lebih kompleks, misalnya memasukkan faktor waktu pada model MCLT, proses pengintegralannya akan berdimensi tinggi yang tidak akan diperoleh bentuk tertutupnya (closed form). Oleh karena itu dibutuhkan metode integrasi numerik. Misalkan θˆ i (i = 1, 2, …, m) adalah penduga langsung bagi i, yaitu parameter yang menjadi perhatian pada area kecil ke-i. Selanjutnya digunakan model θˆ i = i + ei dan i =  + i sehingga θˆ i =  + i + ei dimana ei ~ N(0, 1) dan i ~ N(0, 2). Pada pendekatan Bayes sebelumnya  dan 2 diasumsikan konstan, tetapi pada pendekatan Bayes berhirarki diasumsikan memiliki sebaran tertentu. Pendekatan Bayes berhirarki pada model tersebut dapat dinyatakan sebagai berikut: Level 1 :

θˆ i |i  N(i, 1),

Level 2 :

i| , 2  N(, 2)

Level 3 :

  U(R) dan 2  g(2),   R, 2 > 0, g adalah fungsi sebaran.

Pada model tersebut diperlukan untuk memperoleh sebaran bersyarat dari [i| θˆ i , , 2], [| θˆ i ,2], dan [2| θˆ i ]. Sebaran bersama bagi θˆ i , i, , dan 2 dapat dinyatakan sebagai m

1 ˆ

 (θ i θ i ) f( θˆ i , i, , 2)   e 2

2

i 1

e



m

 i 1

m 1 1 1 α {(1 2 ) θ i2  2 ( θˆ i  2 ) θ i }   2 2 i 1 τ τ



e

1 τ

m

e

2

1 ( θ i  α) 2 2 τ2



 θˆ i2  τ 2 α 2  m



i 1

(τ2 )



g (τ 2 )

m 2

g (τ 2 ) .

( 4.12 )

Selanjutnya dapat ditentukan sebaran bersyarat f(, 2| θˆ i ), yaitu m

m

( θˆ i  α ) 2  1  2  2 (1 τ 2 )  i 1 ˆ f(,  | θ i )   e g (τ2 ) 2  1 τ  1

2

m

 (θˆ i  α) 2 = m  2m θˆ + i 1

= m(  θˆ )2 +

 θˆ

m

i 1

m

 θˆ i 1

= m(  θˆ )2 +

m

2 i

2 i

 m θˆ 2

 θˆ  θˆ   i  i 1 

2

( 4.13 )

74

sehingga f(, 2| θˆ i )  (1  τ 2 )



m 2



e

1 1 m (   θˆ ) 2 2 (1 τ 2 )



e

m



1 ( θˆ i  θˆ ) 2 2 (1 τ 2 ) i 1

g (τ 2 )

m

dan apabila didefinisikan s 2   (θˆ i  θˆ ) 2 , maka i 1

 f( | θˆ i )  (1  τ 2 )

2

m 1 2



e

S2 2 (1 τ 2 )

g (τ 2 ) .

( 4.14 )

Berdasarkan fungsi tersebut, maka sebaran posteriornya dapat diperoleh jika dan hanya jika 

 (1  τ

2

)



m 1 2



e

S2 2 (1 τ 2 )

g ( τ 2 )dτ 2   .

( 4.15 )

0

Misalkan K =

1  1  K  2 dan h(K) = g   K , maka untuk pertidaksamaan 2 1 τ  K 

( 4.15 ) dapat dinyatakan dalam notasi K sebagai berikut: 

 (1  τ

2

)



m 1 2



e

S2 2 (1 τ 2 )

0

1

g ( τ )dτ   K 2

2

m 1 2

h( K )dK  

( 4.16 )

0

dan kepekatan sebaran posteriornya dapat dinyatakan sebagai penjabaran dari fungsi f(K| θˆ i ), yaitu f(K| θˆ i ) = c.K

m 1 S2  K 2 2

e

h( K )

( 4.17 )

dimana 1

c  K 1

m 1 S2  K 2 2

e

h( K )dK .

0

Berdasarkan hasil tersebut, nilai tengah posterior bagi parameter yang menjadi perhatian pada area kecil ke-i, yaitu i, dapat dituliskan sebagai berikut: E(i| θˆ i ) = E{E(i| θˆ i , )| θˆ i } = E{[ θˆ + ( θˆ i  θˆ )]| θˆ i } = θˆ + E(| θˆ i )( θˆ i  θˆ ).

( 4.18 )

Sedangkan ragam posterior bagi parameter yang menjadi perhatian pada area kecil ke-i, yaitu i, dapat dituliskan sebagai berikut:

75

Var(i| θˆ i ) = E{ Var(i| θˆ i , )| θˆ i } + Var{E(i| θˆ i , )| θˆ i }. Karena Var(i| θˆ i , ) =  + (1/m)(1  ), maka E{ Var(i| θˆ i , )| θˆ i } = E(| θˆ i ) + (1/m)[1  E(| θˆ i )] Var{E(i| θˆ i , )| θˆ i } = Var{[ θˆ + ( θˆ i  θˆ )]| θˆ i } = ( θˆ i  θˆ )2 Var(| θˆ i ) sehingga Var(i| θˆ i ) = E(| θˆ i ) + (1/m)[1  E(| θˆ i )] + ( θˆ i  θˆ )2 Var(| θˆ i ) ( 4.19 ) dimana  = 1  K, E(K| θˆ i ) =

1

 Kf ( K | θˆ )dK yaitu nilai tengah posterior bagi K, i

0

dan Var(| θˆ i ) = Var(K| θˆ i ) = E(K2| θˆ i )  [E(K| θˆ i )]2, yaitu ragam posterior bagi  atau K. Misalkan pendekatan Bayes berhirarki seperti di atas diterapkan pada model Fay-Herriot yang menjadi salah satu bentuk dasar model area kecil. Seperti telah dituliskan sebelumnya bahwa model Fay-Herriot adalah θˆ i = i + ei dan i = xiT + i atau θˆ i = xiT + i + ei dimana xi adalah vektor kovariat pada area yang berukuran p  1, i ~ N(0, 2 ) merupakan pengaruh acak area dan bebas dengan ei ~ N(0, i2), i2 adalah ragam penarikan contoh, dan θˆ i adalah penduga langsung berdasarkan metode penarikan contohnya. Pendekatan Bayes berhirarki untuk model tersebut dapat dinyatakan sebagai berikut: Level 1 :

θˆ i |i  N(i, i2), dimana i2 diketahui,

Level 2 :

i | , 2  N(xiT, 2 ),

Level 3 :

f(, 2 )  1.

Pada pendekatan Bayes berhirarki ini ada dua kasus yang mungkin terjadi, yaitu 2 diketahui atau tidak diketahui. 4.3.1. Kasus 2 Diketahui Pada kasus ini, hasil pendugaan parameter mirip dengan Bayes empirik, tetapi berbeda pada ragam posteriornya. Penduga Bayes berhirarki bagi i adalah

76

~ BB 2 θi (  ) = E(i| θˆ i , 2 ) = γ i θˆ i  (1  γ i )xiT β , dimana γ i 

σ 2ν σ 2ν  δ i2

sedangkan ragam posteriornya dapat dinyatakan sebagai ragam bersyarat, [i| θˆ i , 2 ], yaitu sebagai berikut: Var(i| θˆ i , 2 ) = g1i( 2 ) + g2i( 2 )

( 4.20 )

dimana g1i( 2 ) = ii2, dan 1

 m x xT  g2i(  ) = (1  γ i ) x   2 i i 2  x i .  i 1 (δ i  σ ν )  2 

2

T i

~ Berdasarkan hasil tersebut, penduga Bayes berhirarki, θiBB ( 2 ), sama dengan hasil pendugaan metode PTLT, sedangkan ragam posteriornya, Var(i| θˆ i , 2 ), sama dengan KTG pada metode PTLT. Dengan demikian, metode Bayes berhirarki dapat dianggap sebagai bentuk kalibrasi terhadap metode klasik PTLT yang bersandar pada metode kemungkinan maksimum. 4.3.2. Kasus 2 Tidak Diketahui Secara praktis 2 tidak diketahui, sehingga perlu diasumsikan dengan suatu sebaran prior tertentu, f( 2 ). Berdasarkan model Bayes berhirarki di atas, penduga Bayes berhirarki bagi i adalah

~ θˆ iBB = E(i| θˆ i ) = E{E(i| θˆ i , 2 )| θˆ i } = Eσ 2 [ θiBB ( 2 )] ν

= E(i| θˆ i , 2 ) f( 2 | θˆ i )d 2

( 4.21 )

dimana Eσ 2 dinotasikan sebagai nilai harapan berdasarkan sebaran posterior 2 , ν

f( 2 | θˆ i ). Ragam posterior bagi i adalah Var(i| θˆ i ) = E{ Var(i| θˆ i , 2 )| θˆ i } + Var{E(i| θˆ i , 2 )| θˆ i }

~ = E{(g1i( 2 ) + g2i( 2 ))| θˆ i } + Var{ θiBB ( 2 )| θˆ i }.

77

Penyelesaian terhadap berbagai persamaan di atas dalam bentuk integral berdimensi tinggi membutuhkan metode numerik yang berbasis pada algoritma rekursif.

4.4. Bayes Berhirarki untuk Model State-Space Sebagaimana dijabarkan pada Bab III, bahwa model state-space dapat dinyatakan sebagai bentuk model linear campuran terampat / MCLT sebagai model dasar area-kecil dengan pengaruh acak area dan waktu sebagai berikut : ( 4.22 )

y = X + Zv + e dimana y = ît ,

X = (zi1, …, ziT)T,

vT = (vi, uiT), e = (ei1, …, eiT)T,

Z = (1T, IT), dan

 = (1, …, p)T

1T adalah T x 1 vektor 1 dan IT adalah matriks identitas berordo T. Pada persamaan di atas, y adalah vektor dari pengamatan contoh, X dan Z adalah matriks yang diketahui, dan v dan e adalah saling bebas dengan nilai tengah 0 dan matriks koragam G dan R, tergantung pada beberapa parameter  yang disebut sebagai komponen ragam. Matriks koragam G dan R dapat dinyatakan sebagai berikut :

 2 G=  v 0

0T  , 2 

R=

dimana i =  adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) adalah |t-s|/(1 - 2). Model ini dapat dituliskan dalam formulasi Bayes sebagai berikut: Level 1a : Y | v  N(X + Zv, R) Level 2a :

v  N(0, G).

Misalkan  = X + Zv maka Var() = Var(X + Zv) = Var(Zv) = ZGZT. Berdasarkan  ini, model di atas dapat dituliskan menjadi Level 1b : Y |   N(, R) Level 2b :

  N(X, ZGZT).

78

Formulasi Bayes untuk model ini mirip dengan model pada ( 4.1 ), sehingga fungsi kepekatan peluang posteriornya ( | Y, , ZGZT) merupakan sebaran Normal dengan nilai tengah ZGZT(R + ZGZT)-1Y + R(R + ZGZT)-1X.

( 4.23 )

Penduga Bayes, θˆ B , apabila diketahui Y, , dan  dapat dinyatakan sebagai berikut: θˆ B = E( | Y, , ) = ZGZT(R + ZGZT)-1Y + R(R + ZGZT)-1X Var( θˆ B ) = Var( | Y, , ) = ZGZT(R + ZGZT)-1R.

( 4.24 )

Penduga Bayes di atas tergantung pada parameter  dan  yang secara praktis tidak diketahui sehingga harus dilakukan pendugaan dari data. Pendugaan tersebut dapat dilakukan berdasarkan sebaran marginal Y, yaitu Y  N(X, R + ZGZT).

( 4.25 )

Proses pendugaan parameter  dan  pada sebaran marginal Y ini dapat menggunakan KMT. Misalkan penduganya adalah βˆ dan ˆ , maka penduga Bayes empirik bagi  dapat diperoleh dengan mensubstitusikan βˆ pada  dan ˆ pada , yaitu

ˆ ZT)-1Y + R ˆ ZT)-1X βˆ ˆ + ZG ˆ (R ˆ + ZG θˆ EB = ZGZT( R ˆ ZT( R ˆ ZT)-1 R ˆ + ZG ˆ. Var( θˆ EB ) = Z G

( 4.26 )

Penduga model parameter, ˆ , digunakan untuk memperoleh penduga bagi dua

ˆ. ˆ dan G buah komponen ragam, yaitu R Pada metode Bayes berhirarki, untuk  = X + Zv maka Var() = Var(X + Zv) = Var(Zv) = ZGZT, maka model di atas dapat dituliskan menjadi Level 1c : Y |   N(, R) Level 2c :

  N(X, ZGZT)

Level 3c :

f(R)  1, f(G)  1, dan f()  1.

Artinya, pada metode Bayes empirik, R, G, dan  dianggap sebagai konstanta, sedangkan pada Bayes berhirarki R, G, dan  dianggap memiliki fungsi kepekatan tertentu.

79

Metode Bayes berhirarki atau dapat digunakan untuk mendapatkan ukuran ketidakpastian pada statistik area kecil. Misalkan yiT adalah penduga langsung dari survei untuk area kecil ke-i pada periode T saat ini, sedangkan iT adalah nilai yang sesungguhnya untuk area kecil tersebut pada periode T. Statistik yiT diasumsikan sebagai penduga tidak bias bagi iT yaitu : yiT = iT + eiT, dimana eiT adalah galat penarikan contoh dengan E(eiT|iT) = 0. Vektor dari peubah konkomitan tetap xiT = (xiT1, ..., xiTp)T yang berhubungan dengan iT adalah tersedia untuk semua area i pada waktu T. Penduga regresi sintetik untuk iT didasarkan pada data cross-sectional {(yiT, xiT), i = 1, 2, …, m) untuk waktu T, diperoleh dengan mengasumsikan model deterministik untuk iT : iT = (xiT)T T

( 4.27 )

dimana T = (T1, ..., Tp) adalah vektor koefisien regresi yang bisa dinyatakan T

sebagai berikut

~ ~ θiT (reg )  (xiT )T βT

( 4.28 )

~ dimana βT merupakan penduga bagi  T yang diperoleh dari pengkombinasian

model di atas: yiT = (xiT)T T + eiT, i = 1, …, m

( 4.29 )

untuk satu waktu T saat ini. Penduga sintetik di atas bisa menghasilkan bias rancangan substansial (substantial design biases), karena pada model tersebut menggunakan pembobot nol pada penduga langsung yiT. Kelemahan ini dapat diatasi melalui pendekatan Bayes empirik yang menghasilkan bias yang relatif kecil (Rao dan Yu, 1994). Model di atas yakni iT = (xiT)T T dapat pula ditambahkan faktor ketidakpastian sebagai berikut: iT = (xiT)T T + iT,

( 4.30 )

dimana komponen galat iT merupakan peubah acak bebas dengan nilai tengah 0 dan ragam yang tidak diketahui 2T. Untuk galat penarikan contoh, diasumsikan bahwa eiT adalah peubah acak yang saling bebas dengan nilai tengah 0 dan ragam

80

2iT, dimana 2iT diketahui. Pengkombinasian model di atas dapat dinyatakan menjadi yiT = (xiT)T T + iT + eiT .

( 4.31 )

Berdasarkan model ini, penduga Bayes bagi iT dapat dinyatakan sebagai jumlah terboboti antara penduga langsung yiT dan penduga regresi sintetik

θˆ iT (reg )  (xiT )T βˆ T , yaitu θˆ iT ( σˆ 2υT , yT) = iT yiT + (1– iT) θˆ iT (reg ) .

( 4.32 )

Pada persamaan ini yT = (y1T, …, ymT), iT = σˆ 2υT /( σˆ 2υT + 2iT), βˆ T merupakan penduga kuadrat terkecil terboboti berdasarkan model ( 4.31 ), dan σˆ 2υT merupakan penduga bagi σ 2υT . Prasad dan Rao (1990) melalui metode momen dapat memperoleh penduga bagi σ 2υT . Perluasan dari model Fay-Herriot melalui pendekatan deret waktu dari penduga langsung area akecil {yit} yang dihubungkan dengan data suplemen {xit}, dimana i =1, 2, …, m dan t = 1, 2, …, T. Asumsi yang digunakan adalah yit = it + eit dimana eit merupakan galat penarikan contoh dengan E(eit|it) = 0. Model untuk SAE dapat dituliskan sebagai berikut : it = (xit)T + i + uit, uit = ui,t-1 + it, || < 1,

( 4.33 )

dimana xit = (xit1, …, xitp)T adalah vektor peubah konkomitan tetap untuk area ke-i pada waktu t, i  N(0, 2), it  N(0, 2), dan {i}, {it} adalah bebas. Pada model ini, i merupakan pengaruh acak area kecil, sedangkan uit mengikuti proses autoregresi. Model di atas dapat dijabarkan menjadi model distributed-lag, yaitu : it = i,t-1 + (xit – xi,t-1)T + (1 – )i + it .

( 4.34 )

Pada model ini, it dihubungkan dengan nilai periode sebelumnya i,t-1, nilai peubah penyerta xit dihubungkan dengan nilai periode sebelumnya xi,t-1, ditambah dengan pengaruh acak area i serta galat it. Choudhry dan Rao (1989) menggunakan galat komposit wit = eit + uit sebagai autoregresi ordo satu dan mengasumsikan it = (xit)T + i. Modelnya dapat ditulis menjadi

81

yit = (xit)T + i + wit, w =~ ρ w + ~ε . it

i,t-1

it

( 4.35 )

Mereka memperoleh penduga dua tahap untuk nilai tengah area kecil it melalui model tersebut dan mengevaluasi efisiensi relatifnya dengan penduga sintetik dan penduga langsung yit. Model yang dikembangkan oleh Choudhry dan Rao di atas tidak memasukkan galat penarikan contoh, padahal secara realistik keberadaan galat penarikan contoh tidak bisa diabaikan. Pada penelitian ini, galat penarikan contoh eit dimasukkan dalam model, yaitu: yit = (xit)T + i + uit + eit uit = ui,t-1 + it, || < 1,

( 4.36 )

dimana galat penarikan contoh eit diasumsikan menyebar normal dengan nilai tengah nol dan matriks koragam blok-diagonal  dengan blok i (matriks berukuran T x T) diketahui. Maktriks koragam i untuk setiap area ke-i dan setiap waktu t dapat diperoleh melalui metode generalized variance function (GVF). Model di atas dapat dinyatakan dalam bentuk matriks sebagai berikut : Y = X + Zv + u + e

( 4.37 )

dengan X = (X1T, …, XmT)T,

XiT = (xi1, ...., xiT),

Z = Im  1T, v = (1, …, m)T,

u = (u1T, …, umT)T

e = (e1T, …, emT)T dimana uiT = (ui1, …, uiT), eiT = (ei1, ..., eiT), 1T adalah vektor satuan, dan Im adalah matriks identitas berordo m, dan  adalah perkalian Kronecker. E(v) = 0, Cov(v) = 2Im, E(u) = 0, Cov(u) = 2Im   = 2R, E(e) = 0, Cov(e) =  = blok-diagonal(1, ..., m),

( 4.38 )

dan v, u, dan e adalah bebas, dimana  adalah matriks T x T dengan elemen |i-j|/(1 – ). Berdasarkan persamaan tersebut maka Cov(y) = V =  + 2R + 2ZZT = blok-diagonal(i + 2 + 2JT) = blok-diagonal(Vi)

( 4.39 )

82

dengan JT = 1T(1T)T. Nilai tengah area kecil pada satu waktu T, iT = (xiT)T + i + uiT, merupakan kasus khusus dari kombinasi linear  = lT + l1Tv + l2Tu yang dapat diduga berdasarkan sebaran posteriornya pada pendekatan Bayes berhirarki dimana l = xiT, l1 adalah vektor m dengan nilai 1 pada posisi ke-i dan 0 pada selainnya, serta l2 adalah vektor mT dengan nilai 1 pada posisi ke-iT dan 0 pada selainnya. Misalnya diasumsikan bahwa 2, 2, dan  adalah diketahui, maka penduga Bayes bagi  adalah ~ ~τ = lT ~ β + (2l1TZT + 2l2TR)V-1(y – X β )

( 4.40 )

~ dimana β = (XTV-1X)-1XTV-1y adalah penduga kuadrat terkecil terampat

(generalized least-squares) bagi . Apabila menggunakan struktur l1, l2, Z, R, dan V, maka dapat diperoleh bahwa ~ θiT = a(2, 2, , y) ~ ~ = (xiT)T β + (2lT + 2T)T(i + 2 + 2JT)-1(yi – Xi β ),

( 4.41 )

dimana T adalah baris ke-T dari matriks . Penduganya mungkin juga ditulis ~ sebagai jumlah terboboti dari penduga langsung yiT, penduga sintetik (xiT)T β , dan ~ sisaan yij – (xij)T β , j = 1, ..., T–1 :

~ ~ θiT = wiT yiT + (1 – wiT) (xiT)T β +

T 1

w (y j 1

ij

ij

~  xijT β ),

( 4.42 )

dimana (wi1, …, wiT) = (2lT + 2T)TVi-1 . Secara praktis, parameter 2, 2, dan  biasanya tidak diketahui. Misalkan diasumsikan bahwa  diketahui dan mengganti 2 dan 2 dengan penduganya yakni σˆ 2 (ρ) , σˆ 2υ (ρ) untuk memperoleh penduga θˆ iT2 (ρ) . Penduga 2 dapat diperoleh dengan cara transformasi untuk mengeliminasi pengaruh acak i. Pertama mentransformasi yi ke zi = Pyi sehingga matriks koragam dari Pui adalah 2IT. Matriks P berukuran T x T, dimana elemen pada diagonal utamanya adalah (1  ρ 2 ) ; elemen pada diagonal lainnya adalah 1; elemen pada posisi ke (t + 1, t)

adalah (–) untuk t = 1, ..., T–1; dan elemen lainnya adalah 0.

83

 (1  ρ 2 )    ρ   0  P  0    .   1 

0

0

0

...

(1  ρ 2 )

0

0

...

ρ

(1  ρ 2 )

1

...

0

ρ

(1  ρ 2 )

...

.

.

.

...

0

0

0

...

   0    0    0    .   (1  ρ 2 )  1

Model hasil transformasi adalah zi = PXi + fi + P(ui + ei), dimana f = (f1, …, fT)T dengan f1 =

i = 1, …, m,

( 4.43 )

(1  ρ 2 ) dan ft = 1 –  untuk 2  t  T.

Selanjutnya dilakukan pentransformasian terhadap zi menjadi zi(1) = (IT – D)zi dimana D = (ffT)/c dengan c = fTf = (1 – ){T – (T – 2)}. Hal ini menghasilkan model tereduksi sebagai berikut: zi(1) = Hi(1) + ei*,

i = 1, …, m,

( 4.44 )

dimana Hi(1) = (IT – D)PXi dan ei* = (IT – D)P(ui + ei), dan Cov(ei*) = (IT – D)( 2IT + PiPT)(IT – D)T. Nilai 2 dapat diduga melalui model tereduksi ( 4.44 ) menggunakan jumlah kuadrat galatnya. Misalkan z(1) = [(z1(1))T, …, (zm(1))T]T, H(1) = [(H1(1))T, …, (Hm(1))T], dan eˆ Teˆ adalah jumlah kuadrat galat yang diperoleh dengan meregresikan antara z(1) dengan H(1). Penduga tidak bias bagi 2 adalah ~ σ 2 (ρ) = ( eˆ Teˆ – tr[{blok-diagonali(IT – D) – H(1)( H(1)T H(1))–H(1)T) x blok-diagonali(PiPT)]){m(T – 1) – r(H(1))}–1, dimana A– adalah kebalikan umum matriks A. Pada persamaan di atas, eˆ Teˆ = (ei*)T(ImT – H(1)( H(1)T H(1))–H(1)T)(ei*).

84

Nilai 2 dapat diduga dengan cara mentransformasi persamaan ( 4.43 ), 

1 2 T

*



1 2 T

yaitu mengubah zi menjadi c f zi sehingga ui = c f Pui mempunyai nilai tengah 0 dan ragam 2. Model transformasi tersebut adalah 

1



1

1



1

c 2 fTzi = c 2 fTPXi + c 2 i + ui* + c 2 fTPei

( 4.45 )

dengan ragam galat c2 + 2 + c-1fT PiPTf. Misalkan uˆ Tuˆ adalah jumlah 

1



1

kuadrat galat yang diperoleh dengan meregresikan c 2 fTzi terhadap c 2 fTPXi. Penduga tidak bias bagi 2 adalah ~ σ υ2 (ρ) = c-1{m – r(F)}-1( uˆ Tuˆ – tr[(Im – F(FTF)–FT}diagi(c-1fT PiPTf)})

– c-1 ~ σ 2 (ρ) ,

( 4.46 )

dimana F = (X1TPTf, ..., XmTPTf)T. Ketidakbiasan ~ σ υ2 (ρ) terkait dengan nilai harapan uˆ Tuˆ yaitu E( uˆ Tuˆ ) = (c2 + 2){m – r(F)} + tr[{Im – F(FTF)–FT}diagi(c-1fT PiPTf)].

4.5. Penduga Bagi KTG Berdasarkan asumsi kenormalan galat i, uit, dan eit, maka ~ ~ KTG[ θˆ iT (ρ) ] = KTG( θiT ) + E{ θiT  θˆ iT (ρ) }2,

( 4.47 )

~ ~ ~ dimana KTG( θiT ) = E{ θiT  θ iT }2 . Nilai KTG( θiT ) ini dapat dinyatakan melalui persamaan berikut:

~ KTG( θiT ) = g1iT(2, 2, ) + g2iT(2, 2, ),

( 4.48 )

dimana g1iT(2, 2, ) = 2 +

σ2  (2lT + 2T)TVi-1(2lT + 2T) 2 1 ρ

dan g2iT(2, 2, ) = {xiT  XiTVi-1(2lT + 2T)}T(XTVi-1X)-1 x {xiT  XiTVi-1(2lT + 2T)}.

~ Nilai E{ θiT  θˆ iT (ρ) }2 pada persamaan ( 4.47 ) dapat ditentukan melalui pendekatan Taylor, yaitu

85

2 ~ ~  iT ~ 2 ~ iT ~ 2 2 2 2  ˆ E{ θiT  θ iT (ρ) }  E  2 { ()   }  2 { ()    } .    

Prasad dan Rao (1990) menggunakan pendekatan ini dalam bentuk lain, yaitu

~ E{ θiT  θˆ iT (ρ) }2  tr(TV) = g3iT(2, 2, ),

( 4.49 )

diamana  adalah matriks koragam 2 x 2 dari penduga tidak bias ~ σ 2 (ρ) dan ~ σ υ2 (ρ) , dan  = (b/2, b/2) dengan bT = (2lT + 2T)TVi-1. Penghitungan

turunan b/2 dan b/2 dapat diperoleh dengan menyederhanakan TV = A, dimana A adalah matriks simetrik 2 x 2 dengan elemen diagonal utama a11 = {T  Vi-1(2lT + 2T)}TVi-1{T  Vi-1(2lT + 2T)} a22 = {lT  JTVi-1(2lT + 2T)}TVi-1{lT  JTVi-1(2lT + 2T)} dan elemen yang bukan diagonal utama adalah a12 = a21 = {T  Vi-1(2lT + 2T)}TVi-1{lT  JTVi-1(2lT + 2T)}. Berdasarkan hasil di atas, maka pendekatan bagi KTG[ θˆ iT (ρ) ] dapat dinyatakan sebagai berikut: KTG[ θˆ iT (ρ) ] = g1iT(2, 2, ) + g2iT(2, 2, ) + g3iT(2, 2, )

( 4.50 )

yang mempunyai sifat o(m-1) untuk m besar. Selanjutnya adalah memperoleh matriks  yang merupakan matriks koragam 2 x 2 dari penduga tidak bias ~ σ 2 (ρ) dan ~ σ υ2 (ρ) . Untuk keperluan ini, ~ σ 2 (ρ) dan ~ σ υ2 (ρ) dapat ditulis kembali sebagai ~ σ 2 (ρ) = {(m  1)T  r(H(1))}-1aTC1a + k1

( 4.51 )

~ σ υ2 (ρ) = c-1{m  r(F)}-1aTC2a  c-1{(m  1)T  r(H(1))}-1aTC1a + k2

dimana a = Zv + u + e  N(0, V) C1 = CT{Im – CX(XTCCTX)-1XTCT}C C2 = C*T{Im – C*TX(XTC*T C*X)-1XT C*T} C* 

1 2 T

dengan C = blok-diagi[(IT – D)P] dan C* = blok-diagi( c f P). Elemen matriks  dapat diperoleh melalui persamaan ( 4.50 ) dan ( 4.51 ) mengikuti Lemma 1 untuk koragam bentuk kuadratik.

86

Lemma 1. Jika y  N(0, ), maka cov(yTG1y, yTG2y) = 2tr(G1G2), dimana G1 dan G2 adalah dua matriks simetrik. Dapat ditunjukkan bahwa E{g1iT( σˆ 2 (ρ) , σˆ 2υ (ρ) , )}  g1iT(2, 2, )  g3iT(2, 2, )

( 4.52 )

E{g2iT( σˆ 2 (ρ) , σˆ 2υ (ρ) , )}  g2iT(2, 2, )

( 4.53 )

E{g3iT( σˆ 2 (ρ) , σˆ 2υ (ρ) , )}  g3iT(2, 2, ).

( 4.54 )

Berdasarkan persamaan ( 4.52 ) - ( 4.54 ) dapat ditentukan penduga bagi KTG[ θˆ iT (ρ) ] yang bersifat O(m-1), yaitu ktg[ θˆ iT (ρ) ]  g1iT( σˆ 2 (ρ) , σˆ 2υ (ρ) , )} + g2iT ( σˆ 2 (ρ) , σˆ 2υ (ρ) , )} + 2g3iT ( σˆ 2 (ρ) , σˆ 2υ (ρ) , )}.

( 4.55 )

Pada penjabaran di atas, penduga dua tahap bagi iT dan penduga KTG-nya diperoleh dengan mengasumsikan bahwa autokorelasi  diketahui. Namun pada kenyataan umumnya  tidak diketahui. Misalkan {at} untuk t = 1, 2, ..., T adalah peubah acak deret waktu, maka autokorelasi  dapat dinyatakan sebagai berikut : Apabila konsep autorelasi ini diterapkan pada peubah deret waktu iT di atas, maka akan diperoleh penduga bagi  yaitu: m T 2

ρˆ 

{aˆ i 1 t 1 m T 2

it

(aî ,t 1  aî , t  2 )  (σ t(,it)1  σ t(,it) 2 )}

{aît (aî ,t  aî,t 1 )  (σ(t ,it)  σt(,it)1 )}

,

T  2,

( 4.56 )

i 1 t 1

dimana aît = yit  (xit)T(XTX)-1XTy yaitu sisaan ke-it berdasarkan metode kuadrat terkecil, σ t(,it) = Var(eit), σ t(,it)1 = Cov(eit, ei,t+1), dan σ t(,it) 2 = Cov(eit, ei,t+2). Hasil pendugaan dua tahap bagi θˆ iT2 (ρˆ ) adalah tidak bias, dan KTG-nya diduga dengan mensubstitusikan ρˆ terhadap  pada persamaan ( 4.55 ). Ukuran ketidakpastian bagi penduga Bayes berhirarki, θˆ iBB , adalah KTG( θˆ iBB ) = E[( θˆ iBB  i)2 θˆ i ] yang dapat dijabarkan sebagai berikut: KTG( θˆ iBB ) = E[( θˆ iBB  i)2 θˆ i ]

( 4.57 )

= E[( θˆ iBB  θˆ iB + θˆ iB  i)2 θˆ i ] = E[( θˆ iBB  θˆ iB )2 θˆ i ] + E[( θˆ iB  i)2 θˆ i ]

87

+ 2E[( θˆ iBB  θˆ iB )( θˆ iB  i) θˆ i ] . Nilai E[( θˆ iBB  θˆ iB )( θˆ iB  i) θˆ i ] dapat dijabarkan menjadi E[( θˆ iBB  θˆ iB ) θˆ i ] E[( θˆ iB  i) θˆ i ] = 0, karena E[ θˆ iB  θˆ i ] = i. Sehingga KTG( θˆ iBB ) dapat dinyatakan sebagai berikut: KTG( θˆ iBB ) = E[( θˆ iBB  θˆ iB )2 θˆ i ] + E[( θˆ iB  i)2 θˆ i ] = E[( θˆ iBB  θˆ iB )2 θˆ i ] + g1i( 2 ) = J2i + J1i .

( 4.58 )

Jiang, Lahiri, dan Wan (2002) menggunakan pendekatan jackknife untuk menduga J2i dan J1i pada ( 4.58 ) di atas. Misalkan θˆ iBB = ki( θˆ i , βˆ , ˆ 2 ) merupakan penduga Bayes berhirarki bagi i yang diekspresikan sebagai fungsi dari penduga langsung θˆ i dan penduga parameter model βˆ dan ˆ 2 . Selanjutnya dilakukan beberapa tahap metode penghitungan, yaitu: (a)

Menghitung βˆ l dan ˆ 2 , l , yaitu penduga bagi β dan 2 berdasarkan data lengkap {( θˆ i , xi); i = 1, 2, ...,m} tetapi data ke-l dihapus. Proses ini dilakukan untuk setiap l untuk mendapatkan penduga sebanyak m bagi β dan 2 , yaitu {( βˆ l , ˆ 2 , l ); l = 1, 2, ...,m}. Hal ini akan menghasilkan sebanyak m penduga bagi i, { θˆ iBB ,  l ; l = 1, 2, ...,m},

ˆ ˆ ˆ2 dimana θˆ iBB ,  l = ki( θ i , β l ,   ,  l ). (b) Menghitung penduga bagi J2i, yaitu m  1 m ˆ BB ˆ BB 2 Jˆ 2i   (θ i,-l  θ i ) m l 1

(c)

Menghitung penduga bagi J1i, yaitu m 1 Jˆ1i  g1i (σˆ 2ν )   [ g1i (σˆ 2ν,-l )  g1i (σˆ 2ν )]2 m l 1 m

(d) Menghitung penduga jackknife bagi KTG( θˆ iBB ), yaitu ktgJ( θˆ iBB ) = Jˆ2i  Jˆ1i .

88

Nilai Jˆ1i merupakan penduga bagi KTG apabila parameter model ( β , 2 ) diketahui, dan Jˆ2i merupakan keragaman tambahan yang diakibatkan oleh pendugaan parameter.

4.6. Metode Gibbs Sampling Sebelumnya telah dipaparkan bahwa pendugaan parameter pada model Bayes berhirarki untuk model SAE yang memasukkan pengaruh acak area dan waktu dapat dilakukan secara numerik. Salah satu metode yang sesuai dengan kebutuhan tersebut adalah Gibbs sampling. Motode ini merupakan pengembangan dari metode Markov Chain Monte Carlo (Gelfand dan Smith, 1990). Misalkan  = (T, T)T adalah vektor parameter area kecil  dan parameter model . Selanjutnya membentuk rantai Markov {(k), k = 0, 1, 2, ...} sedemikian hingga sebaran (k) konvergen pada sebaran f(|y) yang dinotasikan sebagai (). Oleh karena itu untuk d bernilai besar, (d + 1), (d + 2), ..., (d + D) dapat dianggap sebagai D contoh tidak bebas dari f(|y). Diperlukan spesifikasi satu tahap peluang transisi atau Kernel P((k + 1)| (k)) yang tergantung hanya pada state saat ini, yaitu (k). Dengan demikian, sebaran bersyarat bagi (k + 1) apabila diberikan (0), (1), ..., (k) tidak tergantung pada rantai ((0), (1), ..., (k - 1)). Transisi Kernel tersebut harus memenuhi kondisi kestasioneran, yaitu:

 ((k))P((k + 1)| (k)) d (k) = ((k + 1)) .

( 4.59 )

Berdasarkan persamaan ( 4.59 ), bahwa jika (k) berasal dari (.) maka (k + 1)

juga berasal dari (.). Pada Gibbs sampling, untuk membangkitkan contoh (k)

maka  dibagi ke dalam 1, 2, ..., r. Misalnya untuk model area kecil  = (1,

2, ..., m)T dan  = ( T, 2). Pada kasus ini,  mungkin dibagi sebagai 1 = , 2 = 1, ..., m+1 = m, m+2 = 2 (r = m + 2). Sebaran bersyarat Gibbs dapat dinyatakan sebagai f(1|2, ..., r, y), f(2|1, 3, ..., r, y), ..., f(r|1, ..., r-1, y). Gibbs sampling menggunakan sebaran bersyarat ini untuk membentuk Kernel P(.|.), sedemikian hingga sebaran stasioner dari rantai Markov adalah () = f(|y). Algoritma Gibbs sampling mencakup tahap-tahap berikut ini:

89

(a)

Memilih titik awal (0) dengan komponen 1(0), 2(0), ..., r(0), yaitu pada k = 0. Penduga KMT atau momen bagi  dapat digunakan sebagai titik awal tersebut.

(b) Membangkitkan (k + 1) = (1(k + 1), 2(k + 1), ..., r(k + 1)) sebagai berikut : menarik 1(k

+ 1)

dari f(1|2(k), ..., r(k), y); 2(k

+ 1)

dari f(2|1(k

+ 1)

,

3(k), ..., r(k), y); ...; dan r(k + 1) dari f(2|1(k + 1), ..., r-1(k + 1), y). (c)

Memperbaharui nilai k, yaitu k = k + 1, dan kembali ke tahap (a).

4.7. Penerapan pada Data Susenas dan Simulasi Studi kasus penerapan juga dilakukan pada dua sumber data, yaitu data Susenas dan data simulasi. Data simulasi berguna untuk mengetahui berbagai karakteristik pendugaan pendekatan Bayes berhirarki pada beberapa kondisi yang berbeda. 4.7.1. Data Susenas Metode

Bayes

berhirarki

untuk

pendugaan

tidak

langsung

yang

memasukkan pengaruh acak area dan waktu dapat diterapkan pada data Susenas BPS yang memang memiliki persoalan ukuran contoh yang terlalu kecil pada tingkat desa, sehingga pengamatan antar waktu dapat dimodelkan untuk menurunkan nilai ragam. Model yang digunakan adalah seperti yang dijabarkan di atas yaitu:


( 4.60 )

dengan vi  iid (0, v2) dan it  iid N(0, 2). Model tersebut dapat juga dinyatakan dalam model MCLT, yi = Xi + ZiviT + ei , yaitu: yi = ˆ i ,


Zi = (1T, IT)


 = (1, …, p)T


90

 2 Gi =  v 0

0T  , 2 

Ri = i

( 4.61 )

dimana i =  adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) |t-s|/(1 - 2). Model area kecil dengan pengaruh acak area dan waktu untuk data Susenas tersebut dapat dinyatakan melalui dua pendekatan Bayes berhirarki sebagai berikut : Model 1 Bayes berhirarki (BB-1): Level 1 : ît |it  N(it, it), it adalah ragam penarikan contoh Level 2 : it | , uit  N(xitT + uit , v2) Level 3 : uit | uit-1  N(uit-1, 2) Level 4 :  menyebar flat(-,), v2 dan 2 menyebar Invers-Gamma.

Model 2 Bayes berhirarki (BB-2): Level 1 : ît |it, it2  N(it, [1 – f ]it2 /nit) Level 2 : ([nit -1]sit2)/it2 ~ 2(nit -1) Level 3 : it | , uit  N(xitT + uit , v2) Level 4 : uit | uit-1  N(uit-1, 2) Level 5 :  menyebar flat(-,), v2 dan 2 menyebar Invers-Gamma. Pada BB-1, model penarikan contoh ît = it + it dengan it  N(0, it) dinyatakan sebagai ît |it  N(it, it) dimana it dianggap diketahui, yaitu sebagai ragam penarikan contoh yang dapat diduga dari data. Sedangkan pada BB-2, it dianggap tidak diketahui dan dinyatakan sebagai [1 – f ]it2 /nit dengan ([nit -1]sit2)/it2 ~ 2(nit -1). Sedangkan model penghubung yaitu, it = xitT + vi + uit dengan vi  iid (0, v2) dan uit = ui,t-1 + it dengan it  iid N(0, 2) masingmasing dinyatakan sebagai it | , uit  N(xitT + uit , v2) dan uit | uit-1  N(uit-1, 2) baik pada BB-1 maupun BB-2. Parameter  dianggap menyebar seragam atau flat(-,), sedangkan v2 dan 2 dianggap menyebar Invers-Gamma dengan berbagai parameter sebaran Invers-Gamma yang mungkin.

91

Pada model di atas ˆ it tergantung pada pengaruh area spesifik vi dan oleh waktu spesifik uit yang berkorelasi antar waktu. Nilai ˆ it adalah penduga langsung dari survei untuk tingkat pengeluaran perkapita pada area kecil (desa) i pada waktu (tahun) t. Pada kasus ini, T = 5, yaitu Susenas Wilayah Kota Bogor 2001 – 2005. Parameter it merupakan fungsi untuk rataan pada area i pada waktu t, dan eit adalah galat penarikan contoh yang menyebar normal dengan nilai harapan 0 dan mempunyai matriks koragam blok-diagonal . Sedangkan xit adalah vektor kovariat spesikasi area yang mungkin berubah menurut waktu t. Vektor kovariat area xit tersebut adalah peubah tetap yang diperoleh dari data Podes BPS 1999/2000, 2001/2002, dan 2003/2004. Sebagaimana asusmsi yang digunakan pada model area kecil, peubah tetap ini diperoleh melalui sensus sehingga tidak memiliki galat penarikan contoh. Lima peubah tetap yang digunakan untuk membentuk vektor kovariat tersebut adalah persentase rumah tangga pertanian (x1), persentase rumah tangga yang terkategori pra sejahtera (x2), persentase rumah tangga yang menggunakan daya listrik minimum 450 kwh perbulan (x3), persentase rumah tangga yang mendapatkan kartu miskin (x4), dan mayoritas sumber air rumah tangga (x5). Pemilihan peubah tersebut didasarkan pada tingkat korelasinya dengan tingkat pengeluaran perkapita perbulan. Tabel 4.1. Perbandingan Antara Metode PTLTE dengan Metode Bayes Berhirarki Model 1 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor

No



ˆ PT  DW

KTG

AKTG

Metode SAE – Bayes Berhirarki Model 1 Deret Waktu

ˆ BB1 DW

KTG

AKTG

1 Minimum

179.7

250.1

15.8

214.4

116.1

10.8

2 Kuartil Pertama

302.7

526.8

22.9

259.7

322.8

18.0

3 Rataan

338.3

906.7

29.2

270.8

546.5

22.4

4 Median

341.3

846.7

29.1

273.8

458.1

21.4

5 Kuartil Ketiga

383.1

1251.6

35.4

282.1

709.3

26.6

6 Maksimum

512.9

1728.5

41.6

315.0

1414.1

37.6

92

Hasil penerapan metode Bayes berhirarki (BB-1 dan BB-2) pada model area kecil tersebut disajikan pada Tabel 4.1 dan 4.2, sedangkan hasil rincian untuk tiap area kecil (desa) disajikan pada Lampiran 6 dan 7. Pada Tabel 4.1 tersebut

ˆ PT  DW merupakan penduga tingkat pengeluaran perkapita perbulan (dalam ribuan) berdasarkan model SAE melalui pendekatan PTLTE untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.415. Sedangkan ˆ BB1 DW merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan Bayes berhirarki (model 1) untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.431. Gambar 4.1 memperlihatkan plot antara AKTG penduga PTLTE deret waktu dengan AKTG hasil metode Bayes berhirarki deret waktu (model 1). 45


40 35 30 25 20 15 10 5 0 Area Kecil (Desa) PTLTE-dw

Bayes Berhirarki Model 1-dw

Gambar 4.1. Plot Antara AKTG Metode PTLTE dengan AKTG Metode Bayes Berhirarki Model 1 Berdasarkan Tabel 4.1 dan Gambar 4.1, terlihat bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki (model 1) dibandingkan dengan AKTG pada metode PTLTE. Secara rata-rata, AKTG pada metode PTLTE sebesar 29.2 turun menjadi 22.5 pada metode Bayes berhirarki. Hal ini

93

mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Tabel 4.2. Perbandingan Antara Metode Bayes Berhirarki Model 1 dengan Model 2 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor

No



ˆ BB1 DW

KTG


AKTG

ˆ BB 2 DW

KTG

AKTG

1 Minimum

214.4

116.1

10.8

220.1

51.9

7.2

2 Kuartil Pertama

259.7

322.8

18.0

252.4

246.8

15.7

3 Rataan

270.8

546.5

22.4

268.2

485.4

20.7

4 Median

273.8

458.1

21.4

272.1

355.3

18.8

5 Kuartil Ketiga

282.1

709.3

26.6

281.4

736.3

27.1

6 Maksimum

315.0

1414.1

37.6

313.3

1414.2

37.6

Pada Tabel 4.2 tersebut ˆ BB1 DW merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan Bayes berhirarki (model 1) untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.431. Sedangkan

ˆ BB 2 DW merupakan penduga tingkat pengeluaran perkapita perbulan berdasarkan model SAE melalui pendekatan Bayes berhirarki (model 2) untuk Susenas tahun 2001 - 2005 (T = 5) yang memasukkan pengaruh acak area dan waktu dengan penduga korelasi diri ˆ = 0.437. Gambar 4.2 memperlihatkan plot antara AKTG penduga Bayes berhirarki deret waktu (model 1) dengan AKTG hasil metode Bayes berhirarki deret waktu (model 2).

94

45


40 35 30 25 20 15 10 5 0 Area Kecil (Desa) Bayes Berhirarki Model 1-dw

Bayes Berhirarki Model 2-dw

Gambar 4.2. Plot Antara AKTG Metode Bayes Berhirarki Model 1 dan Model 2 Berdasarkan Tabel 4.2 dan Gambar 4.2, terlihat bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki (model 2) dibandingkan dengan AKTG pada metode pemodelan area kecil Bayes berhirarki (model 1). Secara rata-rata, AKTG pada metode Bayes berhirarki (model 1) sebesar 22.5 turun menjadi 20.7 pada metode model 2. Hal ini mengindikasikan bahwa metode Bayes berhirarki model 2 lebih baik daripada model 1 dalam menurunkan AKTG. Namun demikian, penurunan AKTG tersebut tidak sebesar penurunan yang terjadi ketika metode PTLTE dibandingkan dengan Bayes berhirarki. Metode Bayes berhirarki model 2 pada dasarnya merupakan kalibrasi terhadap model 1, dimana pada model 1 ragam penarikan contoh dianggap diketahui sedangkan pada model 2 dianggap tidak diketahui. Sebagaimana dijabarkan di atas, penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun.

95

4.7.2. Data Simulasi Data simulasi digunakan untuk mengetahui berbagai karakteristik pendugaan pada beberapa kondisi yang berbeda. Pada penelitian ini, proses simulasi difokuskan untuk mengetahui pengaruh banyaknya waktu (T) dan korelasi diri (). Sementara model dan metode penarikan contohnya mengikuti model dan metode penarikan contoh Susenas. Selanjutnya dievaluasi tentang relatif biasnya dan nilai AKTG-nya. Pembangkitan data didasarkan pada model di atas, yaitu:


( 4.62 )

dengan vi  iid (0, v2) dan it  iid N(0, 2). Ragam penarikan contoh dianggap mengikuti pola pada Bayes berhirarki model 2 yaitu ît |it, it2  N(it, [1 – f ]it2 /nit) dan ([nit -1]sit2)/it2 ~ 2(nit -1). Nilai v = 41.7 dan  = 22.6 yang diperoleh dari hasil Bayes berhirarki data Susenas di atas. Vektor kovariat xitT = (xit1, ..., xit5) dibangkitkan sebagai peubah tetap (fixed), sedangkan vektor  nilainya diambil dari hasil Bayes berhirarki data Susenas yaitu 0 = 61.890, 1 = 5.360, 2 = -1.012, 3 = 0.850, 4 = -0.990, dan 5 = -7.879. Parameter  it = xitT sedangkan penduga langsung bagi  it diperoleh dari persamaan di atas yaitu ît = xitT + vi + uit =  it + vi + uit dan uit = ui,t-1 + it. Simulasi dilakukan untuk banyaknya waktu (T) yang berbeda yaitu T = 3, 5, dan 7, dengan lima nilai korelasi diri yaitu  = 0.01, 0.25, 0.45, 0.60, dan 0.85. Selanjutnya dibandingkan relatif bias dan nilai AKTG-nya antara metode Bayes berhirarki model 1 dengan model 2. Pada Tabel 4.3, BB-1 adalah metode Bayes berhirarki model 1 dan BB-2 adalah metode Bayes berhirarki model 2. Nilai bias relatif mutlak / BRM (absolute relative bias / ARB) dihitung sebagai berikut: BRMi =

1 R  ˆr   i  R r 1   i

   

( 4.63 )

96

dimana R adalah banyaknya simulasi, yaitu R = 10,000. Berdasarkan tabel tersebut terlihat bahwa secara umum bias relatif mutlak tidak berbeda antara metode Bayes berhirarki model 1 dengan model 2. Artinya, metode Bayes berhirarki model 1 dan model 2 sama-sama menghasilkan penduga yang bersifat tidak bias. Tabel 4.3. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode Bayes Berhirarki Model 1 dengan Model 2 untuk Data Simulasi Korelasi Diri ()

T=3 BB-1

T=5 BB-2

BB-1

T=7 BB-2

BB-1

BB-2

0.01

0.0000120 0.0000123 0.0000115 0.0000111 0.0000122 0.0000111

0.25

0.0000124 0.0000117 0.0000129 0.0000108 0.0000116 0.0000121

0.45

0.0000126 0.0000118 0.0000106 0.0000122 0.0000119 0.0000097

0.60

0.0000121 0.0000116 0.0000126 0.0000097 0.0000095 0.0000119

0.85

0.0000132 0.0000108 0.0000125 0.0000124 0.0000110 0.0000112

Tabel 4.4 menunjukkan hasil nilai rata-rata akar kuadrat tengah galat relatif / AKTGR (relative root of mean square of error / RRMSE) pada metode Bayes berhirarki model 1 dan model 2. Nilai AKTGR dihitung sebagai berikut :

AKTGRi 

1 R ˆ  ( r   i ) 2 R r 1 . i

( 4.64 )

Berdasarkan Tabel 4.4 nilai AKTGR metode Bayes berhirarki model 2 cenderung lebih kecil dibandingkan dengan nilai AKTGR metode Bayes berhirarki model 1 pada waktu T dan korelasi diri  yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri  dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut.

97

Tabel 4.4. Nilai Rata-rata AKTGR pada Metode Bayes Berhirarki Model 1 dengan Model 2 untuk Data Simulasi T=3

Korelasi Diri ()

T=5

T=7

BB-1

BB-2

BB-1

BB-2

BB-1

BB-2

0.01

0.1823

0.1141

0.1825

0.1075

0.1751

0.0987

0.25

0.1824

0.0991

0.1734

0.1002

0.1593

0.0965

0.45

0.1613

0.0825

0.1507

0.0813

0.1345

0.0701

0.60

0.1327

0.0626

0.1328

0.0527

0.1278

0.0364

0.85

0.1178

0.0311

0.1121

0.0312

0.1093

0.0297

Secara umum, karakteristik penduga parameter peubah tetap, yaitu 0, 1,

2, 3, 4, dan 5, cenderung identik antara hasil metode Bayes berhirarki model 1 dengan model 2 dalam bentuk pola sebaran Normal. Perbedaan relatif antara βˆ dengan parameter  adalah kecil. Artinya, pengaruh kovariat dapat dikatakan

tidak berbeda antara metode Bayes berhirarki model 1 dengan model 2. Hasil tersebut disajikan pada Gambar 4.3 – 4.8. ˆ0

B0 600

Variable Beta0-BB1 Beta0-BB2

500

Mean StDev N 61,86 14,76 10000 61,05 13,79 10000

Frequency

400 300 200 100 0

0

16

32

48

64

80

96

112

Data  0 Penduga

Gambar 4.3. Karakteristik Penduga Parameter Peubah Tetap (Fixed) 0 untuk Metode Bayes Berhirarki Model 1 dan Model 2

98

B1 Variable Beta1-BB1 Beta1-BB2

400

Mean 5,358 5,376

Frequency

300

StDev N 0,2534 10000 0,2680 10000

200

100

0 4,400

4,675

4,950

5,225 5,500 5,775 Data  1 Penduga

6,050

6,325



500

Mean StDev -1,011 0,1621 -1,014 0,1616

Frequency

400

N 10000 10000

300

200

100

0

-1,62

-1,44

-1,26

-1,08 -0,90 -0,72 Data  2 Penduga

-0,54

-0,36


99

B3 700

Variable Beta3-BB1 Beta3-BB2

600

Mean StDev 0,8503 0,1279 0,8420 0,1207

Frequency

500

N 10000 10000

400 300 200 100 0

0,42

0,56

0,70

0,84 0,98 Data Penduga 

1,12

1,26

3



600

Frequency

500

Mean StDev -0,9913 0,1505 -1,006 0,1340

N 10000 10000

400 300 200 100 0 -1,60

-1,44

-1,28

-1,12

-0,96

-0,80

-0,64

-0,48

Data Penduga 4


100


700 600

Mean StDev -7,869 1,138 -7,030 1,417

Frequency

500

N 10000 10000

400 300 200 100 0 -12,8

-11,2

-9,6

-8,0

-6,4

-4,8

-3,2

-1,6

Data  5 Penduga


4.8. Simpulan Metode PTLT pada SAE memerlukan banyak kondisi tertentu yang harus dipenuhi, diantaranya adalah pengasumsian bahwa parameter peubah tetap dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataanya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode PTLT yang memerlukan berbagai kondisi tertentu. Penerapan pada data deret waktu Susenas, diketahui bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Berdasarkan data simulasi, nilai AKTGR metode Bayes berhirarki model 2 cenderung lebih kecil dibandingkan dengan nilai AKTGR metode Bayes

101

berhirarki model 1 pada waktu T dan korelasi diri  yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri  dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Karakteristik penduga parameter peubah tetap, yaitu 0, 1, 2, 3, 4, dan 5, cenderung identik antara hasil metode Bayes berhirarki model 1 dengan model 2 dalam bentuk pola sebaran Normal. Artinya, pengaruh kovariat dapat dikatakan tidak berbeda antara metode Bayes berhirarki model 1 dengan model 2.

102

BAB V 5.

Pembahasan Umum

5.1. Pendahuluan Berdasarkan hasil pada Bab III, penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai AKTGnya lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Ini menunjukkan bahwa pengaruh acak area maupun pengaruh sintetik vektor kovariat berfungsi mengkalibrasi hasil pendugaan langsung yang hanya didasarkan pada data survei semata. Informasi tambahan yang berupa nilai parameter dari area kecil lain yang memiliki karakteristik serupa dengan area kecil yang menjadi perhatian maupun nilai dari peubah yang memiliki hubungan dengan peubah yang sedang diamati secara statistik memiliki sifat penguatan (borrowing strength) dari hubungan antara nilai peubah respon dan informasi tambahan tersebut. Pada data deret waktu Susenas AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE penampang melintang. Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai AKTGR metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE penampang melintang pada waktu T dan korelasi diri  yang sama-sama besar. Hasil yang terdapat pada Bab IV menunjukkan pada data deret waktu Susenas nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya

103

penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun.

5.2. Keunggulan Metode Bayes daripada Metode PTLT pada Model SAE Secara Analitik Berdasarkan kajian data simulasi pada Bab IV, dapat diketahui bahwa metode Bayes berhirarki menghasilkan KTG yang lebih kecil daripada metode PTLT pada model SAE yang memasukkan pengaruh acak area dan waktu. Pada bagian ini dibandingkan kedua metode tersebut melalui pendekatan analitik. Misalkan yitl adalah nilai karakteristik yang menjadi perhatian pada unit kel, waktu ke-t, dan pada area kecil ke-i (i = 1, 2, ..., m; t = 1, 2, ..., T; l = 1, 2, ..., nit),  = (1, 2, ..., m)T, dan 2 = (12, 22, ..., m2)T. Model hirarkinya dapat dinyatakan sebagai berikut: Level 1 : yitl|it, it2  N(it, it2) Level 2 : it|, 2  N(xiT, 2) Level 3 : it2  p(it2), dimana p adalah suatu fungsi kepekatan peluang . Apabila  diketahui, maka PTLT bagi it adalah

îtPTLT = xiT + itPTLT(yit. - xiT)

( 5.1 )

dimana itPTLT = nit2/(nit2 + ),  = E(it2), dan yit. = nit-1(yitl). Misalkan y = (y1t, …, ymt) dan yit = (yit1, yit2, …, yitni)T. Penduga Bayes bagi it adalah

îtBB = xiT + itBB(yit. - xiT)

( 5.2 )

dimana itBB = E{nit2/(nit2 + it2)|y}, E adalah nilai harapan berdasarkan sebaran posterior dari it2, yaitu

f it (σ it2 | yit ) 

 1 S2  n exp   it2  2 it 2 ( yit .  xTi β) 2  p(σ it2 ) ( 5.3 ) 2 2 (σ it  nit )   2  σ it (σ it  nit ) σ it ( nit 1)

it2 > 0, sedangkan Sit2  l it1 ( yitl  yit . ) 2 . n

104

Karakteristik penduga Bayes dan PTLT di atas, îtBB dan îtPTLT , dapat diperhatikan dalam tiga hal, yaitu bias, resiko berdasarkan KTG, dan kekonsistenan.

(a) Bias Untuk penduga Bayes, E( îtBB ) = E(E{it|y}) = E(it), sedangkan untuk penduga PTLT, E( îtPTLT ) = xiT + itPTLT{E(yit. - xiT)} = xiT = E(it). Karena E( îtBB ) = E(it) dan E( îtPTLT ) = E(it) maka penduga Bayes dan penduga PTLT pada model SAE bersifat tidak bias, artinya bahwa E( îtBB - it) = 0 dan E( îtPTLT - it) = 0.

( 5.4 )

(b) Resiko Resiko suatu penduga dapat dinyatakan sebagai r( ît ) = E( ît -  it )2, yaitu kuadrat tengah galat (KTG) bagi penduga tersebut. Perbedaan resiko antara penduga PTLT dan penduga Bayes pada model SAE di atas dapat dinyatakan sebagai berikut: r( îtPTLT ) – r( îtBB ) = E( îtPTLT -  it )2 - E( îtBB -  it )2 = E( îtPTLT - îtBB )2 = E{(iPTLT - itBB)2(yit. - xiT)2}.

( 5.5 )

Berdasarkan hasil tersebut, perbedaan resiko antara penduga PTLT dan penduga Bayes tergantung pada selisih pembobotnya, yaitu itPTLT dan itBB γ itPTLT 

nit τ 2 ,  = E(it2) 2 (nit τ  ξ )

( 5.6 )

dan γ

BB it

 nit τ 2  E 2 2  (nit τ  σ it )

 y . 

( 5.7 )

Resiko penduga PTLT sama dengan penduga Bayes, jika dan hanya jika pembobotnya sama besar yaitu

105

 nit τ 2  nit τ 2  E y . 2 2 2 (nit τ  ξ )  (nit τ  σ it ) 

( 5.8 )

Namun kondisi seperti ini, yaitu resiko penduga PTLT sama dengan penduga Bayes, tidak mungkin dapat dipenuhi, karena menurut pertidaksamaan Jensen

   E ( ) E  y   .    E ( )

( 5.9 )

Sehingga apabila pertidaksamaan Jensen ini diterapkan pada resiko penduga PTLT dan Bayes dapat dinyatakan sebagai berikut:  nit τ 2 E 2 2  (nit τ  σ it )

   E (nit τ 2 ) y   2 2    E (nit τ )  E (σ it ) 

 nit τ 2 E 2 2  (nit τ  σ it )

  n τ2  y    it2    nit τ  ξ 

( 5.10 )

γ itBB  γ itPTLT .

Karena pembobot penduga Bayes lebih kecil daripada penduga PTLT, γ itBB  γ itPTLT , maka resiko penduga Bayes berdasarkan pertidaksamaan tersebut

lebih kecil daripada resiko penduga PTLT, yaitu r( îtBB ) < r( îtPTLT )  E( îtBB -  it )2 < E( îtPTLT -  it )2  KTG( îtBB ) < KTG( îtPTLT )

(c) Konsisten Apabila ˆn merupakan penduga parameter  yang ditentukan berdasarkan contoh berukuran n, maka ˆn disebut penduga yang konsisten apabila ˆn konvergen dalam peluang ke  untuk n  , atau untuk setiap  > 0, lim P(| ˆn   |  )  0 n 

( 5.11 )

Hal ini dapat dipenuhi apabila ˆn merupakan penduga yang tidak bias bagi  dan ragamnya, Var( ˆn ), mendekati nol untuk n  . Dengan demikian, untuk nilai n yang cukup besar, ˆn mendekati sifat suatu konstanta yang bernilai sama dengan parameter .

106

Pada Bab III dan Bab IV telah dipaparkan bahwa ragam penduga PTLT ( îtPTLT ) dan penduga Bayes berhirarki ( îtBB ) lebih kecil daripada ragam penduga langsung ( îtL ), yaitu

Var( îtL )

> Var( îtPTLT ) > Var( îtBB ). Karena Var( îtL )

berbanding terbalik dengan n, maka lim Var (îtL )  lim Var (îtPTLT )  lim Var (îtBB )  0 n 

n 

n 

( 5.12 )

Pada poin (a) di atas juga telah dijabarkan bahwa îtPTLT dan îtBB bersifat tidak bias, maka sesuai dengan definisi di atas, penduga PTLT ( îtPTLT ) dan penduga Bayes berhirarki ( îtBB ) merupakan penduga yang bersifat konsisten. Berdasarkan kajian analitik di atas, maka dapat disimpulkan bahwa pada model SAE yang memasukkan pengaruh acak area dan waktu, penduga PTLT yang berbasis pada metode kemungkinan maksimum terbatas (REML) dan penduga Bayes berhirarki sama-sama bersifat tidak bias dan konsisten. Namun, resiko atau KTG yang dihasilkan penduga Bayes lebih kecil daripada penduga PTLT, artinya dalam hal ini penduga Bayes lebih baik daripada penduga PTLT.

5.3. Hasil Studi Kasus pada Data Sebagaimana dipaparkan pada bagian sebelumnya, metode PTLTE dan metode Bayes berhirarki untuk pendugaan tidak langsung yang memasukkan pengaruh acak area dan waktu dapat diterapkan pada data Susenas BPS yang memang memiliki persoalan ukuran contoh yang terlalu kecil pada tingkat desa, sehingga pengamatan antar waktu dapat dimodelkan untuk menurunkan nilai ragam. Model yang digunakan adalah seperti yang dijabarkan di atas yaitu:


( 5.13 )

dengan vi  iid (0, v2) dan it  iid N(0, 2). Model tersebut dapat juga dinyatakan dalam model MCLT, yi = Xi + ZiviT + ei , yaitu: yi = ˆ i ,


Zi = (1T, IT)

( 5.14 )

dan

107

viT = (vi, uiT), ei = (ei1, …, eiT)T,

 = (1, …, p)T


 2 Gi =  v 0

0T  , 2 

Ri = i

( 5.15 )

dimana i =  adalah T x T matriks koragam ui = (ui1, …, uiT)T dengan elemen ke-(t,s) |t-s|/(1 - 2). Model area kecil dengan pengaruh acak area dan waktu untuk data Susenas tersebut dapat dinyatakan dalam dua model Bayes berhirarki sebagai berikut :

Model BB-1: Level 1 : ît |it  N(it, it), it adalah ragam penarikan contoh Level 2 : it | , uit  N(xitT + uit , v2) Level 3 : uit | uit-1  N(uit-1, 2) Level 4 :  menyebar flat(-,), v2 dan 2 menyebar Invers-Gamma.

Model BB-2: Level 1 : ît |it, it2  N(it, [1 – f ]it2 /nit) Level 2 : ([nit -1]sit2)/it2 ~ 2(nit -1) Level 3 : it | , uit  N(xitT + uit , v2) Level 4 : uit | uit-1  N(uit-1, 2) Level 5 :  menyebar flat(-,), v2 dan 2 menyebar Invers-Gamma.

Ringkasan hasil KTG dan AKTG antara dua pendekatan tersebut, PTLT dan Bayes, disajikan pada Tabel 5.1. Rincian untuk tiap area kecil (desa) disajikan pada Lampiran 8. Berdasarkan hasil pada Tabel 5.1 tersebut, terlihat bahwa nilai AKTG yang paling kecil terdapat pada metode pemodelan area kecil Bayes berhirarki (model 2) dibandingkan dengan AKTG pada metode pemodelan area kecil metode PTLTE dan Bayes berhirarki (model 1). Secara rata-rata, AKTG pada metode PTLTE mempunyai nilai yang paling besar dibandingkan dengan

108

metode Bayes berhirarki. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada metode PTLTE dalam menurunkan AKTG. Tabel 5.1. Perbandingan Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor


No

Bayes Berhirarki Model 1

PTLTE KTG

AKTG

KTG

AKTG

Bayes Berhirarki Model 2 KTG

AKTG

1 Minimum

250.1

15.8

116.1

10.8

51.9

7.2

2 Kuartil-1

526.8

22.9

322.8

18.0

246.8

15.7

3 Rataan

906.7

29.2

546.5

22.4

485.4

20.7

4 Median

846.7

29.1

458.1

21.4

355.3

18.8

5 Kuartil-3

1251.6

35.4

709.3

26.6

736.3

27.1

6 Maksimum

1728.5

41.6

1414.1

37.6

1414.2

37.6

Data simulasi digunakan untuk mengetahui berbagai karakteristik pendugaan pada beberapa kondisi yang berbeda. Pada penelitian ini, proses simulasi difokuskan untuk mengetahui pengaruh banyaknya waktu (T) dan korelasi diri (). Sementara model dan metode penarikan contohnya mengikuti model dan metode penarikan contoh Susenas. Selanjutnya dievaluasi tentang relatif biasnya dan nilai AKTG-nya untuk metode PTLTE dan Bayes berhirarki. Pembangkitan data didasarkan pada model di atas, yaitu:


( 5.16 )

dengan vi  iid (0, v2) dan it  iid N(0, 2). Sebagaimana pada simulasi Bab IV, ragam penarikan contoh dianggap mengikuti pola pada Bayes berhirarki model 2 yaitu ît |it, it2  N(it, [1 – f ]it2 /nit) dan ([nit -1]sit2)/it2 ~ 2(nit -1). Nilai v = 41.7 dan  = 22.6 yang diperoleh dari hasil Bayes berhirarki data Susenas di atas. Vektor kovariat xitT = (xit1, ..., xit5) dibangkitkan sebagai peubah tetap (fixed), sedangkan vektor  nilainya diambil

109

dari hasil Bayes berhirarki data Susenas yaitu 0 = 61.890, 1 = 5.360, 2 = 1.012, 3 = 0.850, 4 = -0.990, dan 5 = -7.879. Parameter  it = xitT sedangkan penduga langsung bagi  it diperoleh dari persamaan di atas yaitu ît = xitT + vi + uit =  it + vi + uit dan uit = ui,t-1 + it. Simulasi dilakukan untuk banyaknya waktu (T) yang berbeda yaitu T = 3, 5, dan 7, dengan lima nilai korelasi diri yaitu  = 0.01, 0.25, 0.45, 0.60, dan 0.85. Selanjutnya dibandingkan relatif bias dan nilai AKTG-nya antara metode PTLTE dengan metode Bayes berhirarki model 1 dengan model 2. Tabel 5.2. Nilai Rata-rata Bias Relatif Mutlak (BRM) pada Metode PTLTE dan Bayes Berhirarki untuk Data Simulasi Deret Waktu T=3 Korelasi Diri ()

PTLTE

BB-1

BB-2

0.01

0.0000104

0.0000097

0.0000089

0.25

0.0000111

0.0000112

0.0000098

0.45

0.0000097

0.0000107

0.0000117

0.60

0.0000122

0.0000101

0.0000106

0.85

0.0000109

0.0000121

0.0000111

T=5



PTLTE

BB-1

BB-2

0.01

0.0000103

0.0000108

0.0000101

0.25

0.0000112

0.0000113

0.0000099

0.45

0.0000104

0.0000108

0.0000118

0.60

0.0000121

0.0000100

0.0000105

0.85

0.0000108

0.0000120

0.0000110

T=7



PTLTE

BB-1

BB-2

0.01

0.0000102

0.0000098

0.0000105

0.25

0.0000116

0.0000114

0.0000100

0.45

0.0000099

0.0000109

0.0000119

0.60

0.0000119

0.0000099

0.0000104

0.85

0.0000107

0.0000118

0.0000109

110

Tabel 5.3. Nilai Rata-rata AKTGR pada Metode PTLTE dan Bayes Berhirarki untuk Data Simulasi Deret Waktu T=3 Korelasi Diri ()

PTLTE

BB-1

BB-2

0.01

0.2034

0.1823

0.1141

0.25

0.2029

0.1824

0.0991

0.45

0.1954

0.1613

0.0825

0.60

0.1957

0.1327

0.0626

0.85

0.1903

0.1178

0.0311

T=5



PTLTE

BB-1

BB-2

0.01

0.2034

0.1825

0.1075

0.25

0.2021

0.1734

0.1002

0.45

0.1913

0.1507

0.0813

0.60

0.1825

0.1328

0.0527

0.85

0.1677

0.1121

0.0312

T=7



PTLTE

BB-1

BB-2

0.01

0.1989

0.1751

0.0987

0.25

0.1988

0.1593

0.0965

0.45

0.1823

0.1345

0.0701

0.60

0.1768

0.1278

0.0364

0.85

0.1609

0.1093

0.0297

Pada Tabel 5.2, BB-1 adalah metode Bayes berhirarki model 1 dan BB-2 adalah metode Bayes berhirarki model 2. Berdasarkan tabel tersebut terlihat bahwa secara umum bias relatif mutlak tidak berbeda antara metode PTLTE dengan Bayes berhirarki model 1 dan 2. Artinya bahwa penduga PTLTE dan Bayes berhirarki untuk data deret waktu bersifat tidak bias. Berdasarkan Tabel 5.3 nilai AKTGR metode Bayes berhirarki model 2 cenderung lebih kecil dibandingkan dengan nilai AKTGR metode PTLTE dan Bayes berhirarki model 1 pada waktu T dan korelasi diri  yang sama-sama besar. Artinya, pengaruh pengamatan antar waktu yang diakibatkan oleh banyaknya

111

waktu T dan korelasi diri  dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut.

5.4. Lesson Learned Berdasarkan penelusuran pustaka, kajian tentang SAE yang memasukkan pengaruh acak area dan waktu berdasarkan model state space yang dibahas dalam disertasi ini merupakan kajian pertama yang pernah dilakukan di Indonesia. Sehingga masih diperlukan penelitian lanjutan untuk mengembangkan metode ini di Indonesia khususnya beberapa keterbatasan yang terdapat dalam disertasi ini, yaitu: a.

Model SAE yang dikaji dalam disertasi ini hanya mencakup peubah respon kontinu belum mencakup peubah respon diskret.

b.

Model yang digunakan memasukkan pengaruh acak area dan waktu, masih

memungkinkan

untuk

mengembangkan

model

yang

memasukkan pengaruh acak area, waktu, dan pengaruh spasial. c.

Program komputasi masih berupa program makro yang terpisah-pisah baik dalam program SAS maupun program R, belum tersusun menjadi suatu paket program yang bersifat user friendly.

d.

Data deret waktu Susenas yang digunakan adalah 5 tahun, masih diperlukan eksplorasi lebih lanjut untuk mengetahui berbagai karakteristiknya dengan data deret waktu yang lebih panjang.

112

BAB VI 6.

Simpulan dan Saran

6.1. Simpulan Nilai tengah pada area kecil dapat diekspresikan sebagai kombinasi linear dari pengaruh tetap dan pengaruh acak. Prediksi tak-bias linear terbaik (PTLT) dilakukan dengan cara meminimumkan fungsi kuadrat tengah galat (KTG), sehingga penduga bagi PTLT memiliki KTG yang paling kecil di antara semua penduga tidak bias linear. Metode kemungkinan maksimum terkendala (restricted maximum likelihood) dapat digunakan untuk menduga komponen ragam atau koragam. Penggunaan komponen dugaan ini dalam penduga PTLT akan diperoleh penduga dua tahap sebagai PTLT empirik atau PTLTE. Penerapan metode pendugaan tidak langsung pada area kecil untuk data Susenas menunjukkan bahwa nilai akar kuadrat tengah galatnya (AKTG) lebih kecil dibandingkan dengan AKTG pada metode pendugaan langsung. Sementara pada data deret waktu Susenas, AKTG lebih kecil pada metode pemodelan area kecil PTLTE deret waktu dibandingkan dengan AKTG pada metode PTLTE penampang melintang. Ini menunjukkan bahwa pengaruh acak area dan waktu maupun pengaruh sintetik vektor kovariat berfungsi memperbaiki hasil pendugaan metode PTLTE yang hanya didasarkan pada data survei pada satu tahun saja. Berdasarkan data simulasi dapat diketahui bahwa nilai akar kuadrat tengah galat relatif (AKTGR) metode PTLTE deret waktu cenderung jauh mengecil dibandingkan dengan nilai AKTGR metode PTLTE penampang melintang pada waktu T dan korelasi diri 

yang sama-sama besar. Artinya, pengaruh

pengamatan antar waktu yang diakibatkan oleh banyaknya waktu T dan korelasi diri  dapat memperbaiki pendugaan parameter pada area kecil yang diindikasikan dengan menurunnya nilai AKTGR tersebut. Metode PTLT pada pendugaan area kecil memerlukan banyak kondisi tertentu yang harus dipenuhi, di antaranya adalah pengasumsian bahwa parameter

113

peubah tetap dan ragam penarikan contohnya adalah konstanta atau tidak memiliki fungsi sebaran tertentu. Padahal kenyataanya, sangat dimungkinkan parameter tersebut bukan suatu konstanta, melainkan memiliki suatu fungsi sebaran tertentu. Metode Bayes dapat digunakan untuk mengatasi persoalan tersebut. Sehingga motode Bayes lebih fleksibel daripada metode kemungkinan maksimum terbatas yang memerlukan berbagai kondisi tertentu. Penerapan pada data deret waktu Susenas, diketahui bahwa nilai AKTG lebih kecil pada metode pemodelan area kecil Bayes berhirarki dibandingkan dengan AKTG pada metode PTLTE. Hal ini mengindikasikan bahwa metode Bayes berhirarki lebih baik daripada PTLTE dalam menurunkan AKTG. Penurunan AKTG ini sebagai akibat adanya penguraian komponen ragam yang terdapat di dalam model, termasuk komponen ragam yang diakibatkan oleh fluktuasi tingkat pengeluaran perkapita antar tahun. Berdasarkan kajian analitik pada model pendugaan area kecil yang memasukkan pengaruh acak area dan waktu, penduga PTLT yang berbasis pada metode kemungkinan maksimum terbatas dan penduga Bayes berhirarki samasama bersifat tidak bias. Namun, resiko atau KTG yang dihasilkan penduga Bayes lebih kecil daripada penduga PTLT, artinya dalam hal ini penduga Bayes lebih baik daripada penduga PTLT.

6.2. Saran Sebagaimana lesson learned pada Bab V, masih diperlukan penelitian lanjutan untuk beberapa hal yang belum tercakup dalam disertasi ini, yaitu: a.

Model SAE yang mencakup peubah respon kontinu dan peubah respon diskret.

b.

Model SAE yang tidak hanya memasukkan pengaruh acak area dan waktu, tetapi juga memasukkan pengaruh spasial. Pengaruh waktu terkait dengan korelasi diri yang diakibatkan oleh keragaman antar waktu, sedangkan pengaruh spasial terkait dengan korelasi antar area kecil berdasarkan karakteristik spasialnya.

c.

Data deret waktu Susenas yang digunakan lebih panjang, misalnya 710 tahun, agar karakteristiknya dapat diketahui lebih jauh. Di samping

114

itu, perlu pula kajian penerapan metode SAE ini pada data selain Susenas, seperti data pertanian, pertambangan, industri, cuaca, iklim, dan sebagainya.

115

7.

Daftar Pustaka

BPS. 2005. Kumpulan Metodologi Survei Sosial Tahun 2003-2005. Badan Pusat Statistik (BPS) Jakarta. Breslow, N.E. dan Clayton, D.G. (1993). Approximation inference in generalized linear mixed models. Journal of the American Statistical Association 88, 925. Breslow, N.E. dan Lin, X. (1995). Bias correction in generalized linear mixed models with a single component of dispersion. Biometrika 82, 81-92. Casella, G., Fienberg, S., dan Olkin, I. (2000). Time Series Analysis and Its Applications. Springer-Verlag, New York. Chambers, R., dan Chandra, H. (2006). Multipurpose Small Area Estimation. Southampton Statistical Sciences Research Institute, Methodology Working Paper M06/06. Chambers, R., Tzavidis, N. (2006). M-quantile Models for Small Area Estimation. Biometrika, 92, 255-268. Chand, N. dan Alexander, C.H. (1995). Using Administrative Records for Small Area Estimation in the American Community Survey. US Bureau of the census. Choudhry, G.H., dan Rao, J.N.K. (1989). Small Area Estimation Using Models that Combine Time Series and Cross-Sectional Data. Proceedings of the Statistics Canada Symposium on Analysis of Data in Time, Ottawa: Statistics Canada, 67-74. Cochran, W.G. (1977). Sampling Techniques, 3rd ed., New York: Wiley. Datta G.S., Maiti, T. dan Lu, K.L , (1999). Hierarchical Bayes estimation of unemployment artes for the States of the U.S. Journal of The American Statistical Association 94, 1074-1082. Datta, G,S. dan Lahiri, P. (1995). Robust hierarchical Bayes estimation of small area characteristics in the presence of covariates and outliers. Journal of Multivariate Analysis 54, 310-328. Datta, G.S. dan Ghosh, M. (1991). Bayesain prediction in linear models: application to small area estimation. The Annals of Statistics 19, 17481770. Datta, G.S. dan Ghosh, M., Nangia, N. dan Natarajan, K. (1996). Estimation of median income of four-person families: a Bayesian approach. In: Berry, D.A., Chaloner, K.M., Geweke, J.K (Eds), Bayesian Analysis in Statistics and econometrics. Wiley, New York. pp. 129-140.

116

Datta. G.S., Day, B. dan Basawa, I. (1999). Empirical best linear unbiased and empirical Bayes prediction in multivariate small area estimation. Journal of Statistical Planning and Inference 75, 269-279. Deely, J.J and Lindley, D.V. (1991). Empirical Bayes. Journal of the American Statistical Association 76, 833-841. Durbin, J. (2004). State Space and Unobserved Component Models. Cambridge University Press (www.cambridge.org). Farrell, P.J., Mac Gibbon, B. dan Tomberlin, T.J. (1997). Empirical Bayes smallarea estimation using logistic regression models and summery statistics. Journal of Business & Economic Statistics 15, 101-103. Fay, R E. dan Herriot, R.A. (1979). Estimates of income for small places1 an application of James-Stein procedures to census data. Journal of the American Statistical Association 74, 269- 277. Gelfand, A.E., dan Smith, A.F.M. (1990). Sample-based Approaches to Calculating Marginal Densities. Journal of the American Statistical Association, 85, 972-985. Ghosh, M. dan Lahiri, P. (1987). Robust Empirical Bayes Estimation of Means from Stratified Samples. Journal of the American Statistical Association 82, 1153-1162. Ghosh, M. dan Rao, J.N.K. (1994). Small area estimation: an appraisal. Statistical Sciences 9, 55-93. Ghosh, M., Nangia, N and Kim, D.H. (1996). Estimation of median income of four-person families: a Bayesian time series approach. Journal of the American Statistical Association 91, 1423-1431. Ghosh, M., Natarajan, K., Stroud, T.W.F and Carlin, B.P (1998). Generalized linear models for small-area estimation. Journal of the American Statistical Association 93, 273-282. Graybill, F.A. (1969). Introduction to Matrices with Applications in Statistics. Belmont, CA: Wadsworth. Harville, D.A. (1977). Maximum likelihood approaches to variance component estimation and to related problems. Journal of the American Statistical Association 72, 320-340. Harville, D.A. (1990). That BLUP is a good thing: the estimation of random effects. Statistical Science. 6, 15-51. Henderson, C.R (1949). Estimation of changes in herd environment (Abstract). J. Dairy Sci.32:706. Holt, D., Smith, T.M.F. dan Tomberlin. (1979). A model-based approach to estimation for small subgroups of a population. Journal of the American Statistical Association, 74, 405-410. Jiang, J., Lahiri, P., dan Wan, S.M. (2002). A Unified Jackknife Theory. Annals of Statistics, 30, 260-276.

117

Kackar, R.N., dan Harville, D.A. (1984). Approximations for Standard Errors of Estimators of Fixed and Random Effects in Mixed Linear Models. Journal of the American Statistical Association, 79, 853-862. Kass, R.E. dan Steffey, D. (1989). Approximate Bayesian inference in conditionally independent hierarchical models (parametric empirical Bayes models). Journal of the American Statistical Association 84, 717-726. Lahiri, P. (2008). Advanced Topics in Survey Methodology: Small Area Estimation. Catatan Kuliah di Joint Program in Survey Methodology, University of Maryland, USA. Lahiri, P., dan Rao, J.N.K. (1995). Robust Estimation of Mean Squared Error of Small Area Estimators. Journal of the American Statistical Association, 82, 758-766. Larid, N,M. dan Louis, T.A. (1987). Empirical Bayes confidence intervals based on bootstrap samples. Journal of the American Statistical Association 82, 739-750. Levy, P.S. (1971). The use of mortality data in evaluating synthetic estimates. Proceedings of the American Statistical Association 328-331. Levy, P.S. dan Lemeshow, S. 1999. Sampling of Populations, Methods and Applications. John Wiley and Sons, Inc., New York. MacGibbon, B. dan Tomberlin, T.J. (1989). Small area estimates of proportions via empirical Bayes techniques. Survey Methodology 15, 237-252. Maiti, T. (1998). Hierarchical Bayes estimation of mortality rates for disease mapping. Journal Statistical Planning and Inference 69, 339-348. Malec, D., Davis, W.W. dan Cao, X. (1999). Model-based small area estimates of overweight prevalence using sample selection adjusment. Statistics in Medicine 18, 3189-3200. Malec, D., Sedransk, J. Moriarity, C.L. dan Leclere, F.B. (1997). Small area inference for binary variables in the National Helath Interview Survey. Journal of the American Statistical Association 92, 815-826. Marker, D. (1999). Organization of small area estimators using generalized linear regression framework. Journal of Official Statistics, 15, 1-24. McCulloch, C.E. (1994). Maximum likelihood variance components estimation for binary data. Journal of the American Statistical Association 89, 330-335. McCulloch, C.E. (1997). Maximum likelihood algorithms for generalized linear mixed models. Journal of the American Statistical Association 92, 162-170. McGilchrist, C.A. dan Aisbett, C.W. (1991). Restricted BLUP for mixed linear models. Biometrical Journal, 33, 131-141. Morris, C.N. (1994). Parametric empirical Bayes inferences theory and applications. Journal of the American Statistical Association 78, 47-65.

118

Moura, F.A.S. dan Mignon, H.S. (2001). Bayesian models for small area proportions. Working Paper 140, Universidade Federal do Rio De Janeiro, Instituto De Matematica, Departmento de Metodos Estatisticos. Pfeffermann, D. (1999). Small area estimation – big developments. Keynote Paper, Conference on Small Area Statistics, Riga, Latvia, August 1999. Pfeffermann, D. (2002). Small Area Estimation – New Developments and Directions. International Statistical Review, 70, 125-143. Prasad, N.G.N and Rao, J.N.K. (1990). The estimation of the mean squared error of small-area estimators. Journal of the American Statistical Association, 85, 163-171. Purcell, N.J. dan Kish, I. (1980). Postcensal estimates for local areas (domains). International Statistical Review, 48, 3-18. Rao, J.N.K. (1999). Some recent advances in model-based small area estimation. Survey Methodology, 25, 175-186. Rao, J.N.K. (2003). Small Area Estimation. New York : John Wiley and Sons. Rao, J.N.K. dan Yu, M. (1992). Small area estimation combining time series and cross-sectional data. Proceeding Survey Research Methods Section, Americal Statistical Association, 1-9. Rao, J.N.K., dan Yu, M. (1994). Small Area Estimation by Combining Time Series and Cross-Sectional Data. Proceedings of the Section on Survey Research Method. American Statistical Association. Robinson, G.K. (1991). That BLUP is a good thing: the estimation of random effects. Statistical Sciences, 6, 15-51. Russo, C., M. Sabbatini dan R. Salvatore, (2005), ”General Linear Models in Small Area Estimation : an assessment in agricultural surveys”, Paper presented in The Mexsai Conference <www.siap.sagarpa.gob.mx/ mexsai/trabajos/t44.pdf>, [29 April 2005] Sadik, K. 2008. Hierarchical Bayes Approach in Small Area Estimation. Makalah Seminar Reguler di Joint Program in Survey Methodology, University of Maryland, USA. Oktober, 2008. Sadik, K. dan Notodiputro, K.A. 2006. Pendekatan P-Spline M-Quantile dalam Pendugaan Area Kecil (Small Area Estimation). Jurnal Matematika Aplikasi dan Pembelajaran, Vol. 5 No.2 Jilid 1, p:142-147, Universitas Negeri Jakarta, Jakarta. Sadik, K. dan Notodiputro, K.A. 2006. Small Area Estimation with Time and Area Effects Using Two Stage Estimation. Proceeding at the First International Conference on Mathematics and Statistics, MSMSSEA, 19-21 June 2006, Bandung. Sadik, K. dan Notodiputro, K.A. 2007. A State Space Model in Small Area Estimation. The 9th Islamic Countries Conference on Statistical Sciences 2007 (ICCS-IX), Kuala Lumpur: 12-14 December 2007.

119

Sadik, K. dan Notodiputro, K.A. 2007. Model State Space pada GLMM untuk Pendugaan Area Kecil (Small Area Estimation). Prosiding pada Seminar Nasional Statistika: 24 Mei 2007, Unisba – Bandung. Sadik, K. dan Notodiputro, K.A. 2009. Hierarchical Bayes Estimation Using Time Series and Cross-sectional Data : A Case of Per-capita Expenditure in Indonesia. Conference of Small Area Estimation, 29 Juni – 01 Juli 2009, Elche, Spanyol. Sadik, K., Notodiputro, K.A., Susetyo, B., Mangku, I.W. 2006. Pendugaan Area Kecil (Small Area Estimation) Berdasarkan Model yang Mengandung Langkah Acak (Random Walk). Prosiding Seminar Nasional Matematika dan Konferda IndoMS wilayah Jabar & Banten, 22 April 2006, Jurusan Matematika UNPAD, Bandung. Sadik, K., Notodiputro, K.A., Susetyo, B., Mangku, I.W. 2008. Small Area Estimation With Time and Area Effects Using A Dynamic Linear Model. The 3rd International Conference on Mathematics and Statistics (ICoMS-3). Institut Pertanian Bogor, Indonesia, 5-6 August 2008. Sarndal, C.E. (1984). Design-consistent versus model-dependent estimation for small domains. Journal of the American Statistical Association 79, 624631. Schaible, W.L., Brock, D.B. dan Schank, G.A. (1977). An emperical comparison of simple inflation, syntetic and composite estimators for small area statistics. Proceeding of the American Statistical Association 1017-1021. Schall, R. (1991). Estimation in generalized linear models with random effects. Biometrika 78, 719-727. Som, Ranjan Kumar. 1996. Practical Sampling Techniques, 2nd. Marcel Dekker, Inc., New York. Swenson, B., dan Wretman., J.H. (1989). The Weighted Regression Technique foe Estimating the Variance of Generalized Regression Estimator. Biometrika, 76, 527-537. Thompson, M.E. (1997). Theory of Sample Surveys. London: Chapman and Hall. Wei, W.W.S. (1994). Time Series Analysis, Univariate and Multivariate Methods. Addison-Wesley Publishing Company, Canada. You, Y. dan Rao, J.N.K. (2000). Hierarchical Bayes estimation of small area means using multi-level models. Survey Methodology, 26, 173-181. Zeger, S.L. dan Karim, M.R. (1991). Generalized linear models with random effect; A Gibbs sampling approach. Journal of the American Statistical Association, 86, 79-86. Zhang, D., dan Davidian, M. (2001). Linear Mixed Model with Flexible Distributions of Random Effects for Longitudinal Data. Biometrics, 57, 795802. Zivot, E. (2006). State Space Models and the Kalman Filter. Cambridge University Press (www.cambridge.org).

120

8.

No

Daftar Istilah dan Singkatan

Bahasa Indonesia

Bahasa Inggris

1 Akar kuadrat tengah galat (AKTG)

Root of mean square of error (RMSE)

2 Akar kuadrat tengah galat relatif (AKGTR)

Relative root of mean square of error (RRMSE)

3 Bias relatif mutlak (BRM)

Absolute relative biases (ARB)

4 Data deret waktu

Time series data

5 Data penampang melintang

Cross-sectional data

6 Kemungkinan maksimum terkendala (KMT)

Restricted maximum likelihood (REML)

7 Kuadrat tengah galat (KTG)

Mean square of error (MSE)

8 Model campuran linear terampat (MCLT)

Generalized linear mixed model (GLMM)

9 Prediksi tak-bias linear terbaik (PTLT)

Best linear unbiased prediction (BLUP)

10 Prediksi tak-bias linear terbaik empirik (PTLTE)

Empirical best linear unbiased prediction (EBLUP)

121

LAMPIRAN

Lampiran 1. Program R untuk Bayes Berhirarki Model 1 ####################################################### ######### Hierarchical Bayes Model 1 ######### ####################################################### date() thetahat = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/theta_kota.txt", header = TRUE) psi = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/psi_kota.txt", header = TRUE) x1 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x1_kota.txt", header = TRUE) x2 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x2_kota.txt", header = TRUE) x3 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x3_kota.txt", header = TRUE) x4 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x4_kota.txt", header = TRUE) x5 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x5_kota.txt", header = TRUE)

thetahat=as.matrix(thetahat) psi=as.matrix(psi) x1=as.matrix(x1) x2=as.matrix(x2) x3=as.matrix(x3) x4=as.matrix(x4) x5=as.matrix(x5) m = nrow(thetahat) T = ncol(thetahat)-1

### no of small area

k = 6

### no of covariates

####### studying the relationship between thetahat and the covariates ###### library(Design) ks.reg = ols(thetahat[,2] ~ x1[,2] + x2[,2] + x3[,2] + x4[,2] + x5[,2]) ks.coeff = ks.reg$coeff ks.coeff ks.var = ks.reg$var ks.var ### initial value set up for all Chains k = 6 # number of regression coefficients ks.coeff = as.vector(ks.coeff)

123

ks.se = as.vector(sqrt(diag(ks.var))) beta.initi = matrix(0, nrow = k, ncol = 3) # ncol is the number of chains for(i in 1:k) { beta.initi[i,] = rnorm(3, ks.coeff[i], ks.se[i]) }

u = matrix(0, nrow = m, ncol = T+1) for(i in 1:m) { for(j in 1:T+1) { u[i,j] = rnorm(1,0,1) } }

########################################### ####The hierarchical Bayes ################

library(BRugs) dataKT1 = list("m","T","x1","x2","x3","x4","x5","u","thetahat","psi")

inits1 = list(beta = beta.initi[,1], thau = 1.0, sigma = 1.7, v = rnorm(m, 0, 0.50)) inits2 = list(beta = beta.initi[,2], thau = 1.5, sigma = 1.5, v = rnorm(m, 0, 0.75)) inits3 = list(beta = beta.initi[,3], thau = 2.0, sigma = 1.0, v = rnorm(m, 0, 1.00)) initmodelKT1 = list(inits1, inits2, inits3)

basemodelKT1 = function() { for (i in 1:m) { v[i] ~ dnorm(0, thau.inv) for(j in 2:T+1) { thetahat[i,j] ~ dnorm(theta[i,j], psi.inv[i,j]) psi.inv[i,j] <- 1/psi[i,j] theta[i,j] <- beta[1]+beta[2]*x1[i,j]+beta[3]*x2[i,j]+ beta[4]*x3[i,j]+beta[5]*x4[i,j]+beta[6]*x5[i,j]+v[i]+u[i,j] u[i,j] ~ dnorm(u[i,j-1],sigma.inv) } } thau.inv <- 1/thau sigma.inv <- 1/sigma beta[1] ~ dflat() beta[2] ~ dflat() beta[3] ~ dflat() beta[4] ~ dflat() beta[5] ~ dflat()

124

beta[6] ~ dflat() thau ~ dgamma(1,3) sigma ~ dgamma(1,5) } writeModel(basemodelKT1, con = "modelKT1.txt") file

### OpenBUGS model

output.KT1 = BRugsFit(modelFile = "modelKT1.txt", data = dataKT1,inits = initmodelKT1, numChains = 3, para = c("theta","beta","thau","sigma"), nBurnin = 1000, nIter = 10000,nThin=4) resultKT1 = round(samplesStats("thau"),3) pdf(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/ResultsKOTA.Thaupos.pdf") par(mfrow = c(2,2))

plotDensity("thau", main = "posterior of thau given Gamma(1,3)") outputKT1=samplesStats(node=c("theta","beta","thau","sigma"))

par.interest = rownames(outputKT1) summary.statistics = colnames(outputKT1) summary.statistics post.mean = outputKT1$mean post.median = outputKT1$median post.sd = outputKT1$sd mcerror=outputKT1$MC_error l2.5pct = outputKT1$val2.5pc u97.5pct = outputKT1$val97.5pc length.ci = u97.5pct - l2.5pct

#### Fitted values and relevant statistics #####

thetadirect = matrix(0, m*T, 1) for(i in 1:m) { for(j in 2:(T+1)) { thetadirect[((j-1)+(i-1)*T),1] = thetahat[i,j] } } predKT1 = data.frame(par.interest[1:(m*T)],thetadirect[1:(m*T)],post.mean[1: (m*T)], post.median[1:(m*T)], post.sd[1:(m*T)],l2.5pct[1:(m*T)],u97.5pct[1:(m*T)],mcerror[1:(m*T )]) colnames(predKT1) = c("Parameter","Direct","Posterior Mean", "Posterior Median","Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error")

125

write.table(predKT1, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKT1.csv", sep = ",", col.names = NA)

#### Estimation of the Fixed Effects (beta) #### est.fixed = data.frame(par.interest[(m*T+1):(m*T+k)], post.mean[(m*T+1):(m*T+k)],post.median[(m*T+1):(m*T+k)], post.sd[(m*T+1):(m*T+k)],l2.5pct[(m*T+1):(m*T+k)],u97.5pct[(m*T+1) :(m*T+k)],mcerror[(m*T+1):(m*T+k)]) colnames(est.fixed) = c("Fixed Effect", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.fixed, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKT1.csv", append = TRUE, sep = ",", col.names = NA)

#### Estimation of the variance components #### est.varcomp = data.frame(par.interest[(m*T+k+1):(m*T+k+2)],post.mean[(m*T+k+1):( m*T+k+2)],post.median[(m*T+k+1):(m*T+k+2)], post.sd[(m*T+k+1):(m*T+k+2)],l2.5pct[(m*T+k+1):(m*T+k+2)],u97.5pct [(m*T+k+1):(m*T+k+2)],mcerror[(m*T+k+1):(m*T+k+2)]) colnames(est.varcomp) = c("Variance Component", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.varcomp, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKT1.csv", append = TRUE, sep = ",", col.names = NA)

#### Deviance Information Criteria (DIC) #### DIC=output.KT1$DIC ks.KT1.DIC = data.frame(DIC) write.table(ks.KT1.DIC, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/DIC.ModelKT1.csv", sep = ",", col.names = NA) par.interest.DIC = rownames(ks.KT1.DIC) summary.stat.DIC = colnames(ks.KT1.DIC) summary.stat.DIC

dev.off() #### Model checking ##### pdf(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/modelKOTA.check.pdf") par(mfrow = c(3,1))

### The time series trace plots for the chain for each of the parameters specified. plotHistory(node = "beta[2]")

126

plotHistory(node plotHistory(node plotHistory(node plotHistory(node

= = = =

"beta[3]") "thau") "theta[1,3]") "theta[5,4]")

### A density plot(if continuous, else histogram plot) of the marginal posterior distribution plotDensity(node plotDensity(node plotDensity(node plotDensity(node plotDensity(node

= = = = =

"beta[2]") "beta[3]") "thau") "theta[1,3]") "theta[5,4]")

### Autocorrelation function (ACF) of parameters of interest;

plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node

= = = = =


### The BGR convergence statistic(Brooks and Gelman 1998).

plotBgr(node plotBgr(node plotBgr(node plotBgr(node plotBgr(node

= = = = =


dev.off() thetahat[,2:6] x1[,2:6] x2[,2:6] x3[,2:6] x4[,2:6] x5[,2:6] par.interest post.mean post.sd est.fixed est.varcomp plotDensity(node = "beta[2]") plotDensity(node = "thau")

127

Lampiran 2. Program R untuk Hierarchical Bayes Model 2 ####################################################### ######### Hierarchical Bayes Model 2 ######### ####################################################### date() thetahat = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/theta_kota.txt", header = TRUE) psi = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/psi_kota.txt", header = TRUE) s2 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/S2_kota.txt", header = TRUE) n = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/ns_kota.txt", header = TRUE) Np = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/np_kota.txt", header = TRUE) x1 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x1_kota.txt", header = TRUE) x2 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x2_kota.txt", header = TRUE) x3 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x3_kota.txt", header = TRUE) x4 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x4_kota.txt", header = TRUE) x5 = read.table(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/x5_kota.txt", header = TRUE)

thetahat=as.matrix(thetahat) psi =as.matrix(psi) s2 =as.matrix(s2) n =as.matrix(n) ### no sample household Np =as.matrix(Np) ### no household total x1=as.matrix(x1) x2=as.matrix(x2) x3=as.matrix(x3) x4=as.matrix(x4) x5=as.matrix(x5) m = nrow(thetahat) T = ncol(thetahat)-1

### no of small area

k = 6

### no of covariates

128

####### studying the relationship between thetahat and the covariates ###### library(Design) ks.reg = ols(thetahat[,2] ~ x1[,2] + x2[,2] + x3[,2] + x4[,2] + x5[,2]) ks.coeff = ks.reg$coeff ks.coeff ks.var = ks.reg$var ks.var ### initial value set up for all Chains k = 6 # number of regression coefficients ks.coeff = as.vector(ks.coeff) ks.se = as.vector(sqrt(diag(ks.var))) beta.initi = matrix(0, nrow = k, ncol = 3) # ncol is the number of chains for(i in 1:k) { beta.initi[i,] = rnorm(3, ks.coeff[i], ks.se[i]) }

u = matrix(0, nrow = m, ncol = T+1) for(i in 1:m) { for(j in 1:T+1) { u[i,j] = rnorm(1,0,1) } } sigma = matrix(0, nrow = m, ncol = T+1) for(i in 1:m) { for(j in 1:T+1) { sigma[i,j] = rgamma(1,1,5) } } ########################################### ####The hierarchical Bayes ################

library(BRugs) dataKOTA2 = list("m","T","x1","x2","x3","x4","x5","u","sigma","thetahat","n"," Np","s2")

inits1 = 1.2, inits2 = 1.3, inits3 = 1.4,

= list(beta mu = 2.5, v = list(beta mu = 2.3, v = list(beta mu = 2.1, v

= = = = = =

beta.initi[,1], thau = 1.0, phi = 1.7, delta rnorm(m, 0, 0.50)) beta.initi[,2], thau = 1.5, phi = 1.5, delta rnorm(m, 0, 0.75)) beta.initi[,3], thau = 2.0, phi = 1.0, delta rnorm(m, 0, 1.00))

129

initmodelKOTA2 = list(inits1, inits2, inits3)

basemodelKOTA2 = function() { for (i in 1:m) { v[i] ~ dnorm(0, thau.inv) for(j in 2:T+1) { thetahat[i,j] ~ dnorm(theta[i,j], K.inv[i,j]) K[i,j] <- (1-(n[i,j]/Np[i,j]))*(s2[i,j])/n[i,j] K.inv[i,j] <- 1/K[i,j] s2[i,j] ~ dchisqr(df[i,j]) df[i,j] <- n[i,j]-1 theta[i,j] <- beta[1]+beta[2]*x1[i,j]+beta[3]*x2[i,j]+ beta[4]*x3[i,j]+beta[5]*x4[i,j]+beta[6]*x5[i,j]+v[i]+u[i,j] u[i,j] ~ dnorm(u[i,j-1],phi.inv) sigma[i,j] ~ dlnorm(mu,delta.inv) } } thau.inv <- 1/thau phi.inv <- 1/phi delta.inv <- 1/delta beta[1] ~ dflat() beta[2] ~ dflat() beta[3] ~ dflat() beta[4] ~ dflat() beta[5] ~ dflat() beta[6] ~ dflat() mu ~ dunif(1,5) thau ~ dgamma(1,3) phi ~ dgamma(1,5) delta ~ dgamma(1,7) }

writeModel(basemodelKOTA2, con = "modelKOTA2.txt") model file

### OpenBUGS

output.KOTA2 = BRugsFit(modelFile = "modelKOTA2.txt", data = dataKOTA2,inits = initmodelKOTA2, numChains = 3, para = c("theta","beta","thau","phi"), nBurnin = 1000, nIter = 10000,nThin=4) resultKOTA2 = round(samplesStats("thau"),3) pdf(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/ResultsKOTA.Thaupos.pdf") par(mfrow = c(2,2))

plotDensity("thau", main = "posterior of thau given Gamma(1,3)") outputKOTA2=samplesStats(node=c("theta","beta","thau","phi"))

130

par.interest = rownames(outputKOTA2) summary.statistics = colnames(outputKOTA2) summary.statistics post.mean = outputKOTA2$mean post.median = outputKOTA2$median post.sd = outputKOTA2$sd mcerror=outputKOTA2$MC_error l2.5pct = outputKOTA2$val2.5pc u97.5pct = outputKOTA2$val97.5pc length.ci = u97.5pct - l2.5pct


thetadirect = matrix(0, m*T, 1) for(i in 1:m) { for(j in 2:(T+1)) { thetadirect[((j-1)+(i-1)*T),1] = thetahat[i,j] } }

predKOTA2 = data.frame(par.interest[1:(m*T)],thetadirect[1:(m*T)],post.mean[1: (m*T)], post.median[1:(m*T)], post.sd[1:(m*T)],l2.5pct[1:(m*T)],u97.5pct[1:(m*T)],mcerror[1:(m*T )]) colnames(predKOTA2) = c("Parameter","Direct","Posterior Mean", "Posterior Median","Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(predKOTA2, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKOTA2.csv", sep = ",", col.names = NA)

#### Estimation of the Fixed Effects (beta) #### est.fixed = data.frame(par.interest[(m*T+1):(m*T+k)], post.mean[(m*T+1):(m*T+k)],post.median[(m*T+1):(m*T+k)], post.sd[(m*T+1):(m*T+k)],l2.5pct[(m*T+1):(m*T+k)],u97.5pct[(m*T+1) :(m*T+k)],mcerror[(m*T+1):(m*T+k)]) colnames(est.fixed) = c("Fixed Effect", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.fixed, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKOTA2.csv", append = TRUE, sep = ",", col.names = NA)

#### Estimation of the variance components #### est.varcomp = data.frame(par.interest[(m*T+k+1):(m*T+k+2)],post.mean[(m*T+k+1):(

131

m*T+k+2)],post.median[(m*T+k+1):(m*T+k+2)], post.sd[(m*T+k+1):(m*T+k+2)],l2.5pct[(m*T+k+1):(m*T+k+2)],u97.5pct [(m*T+k+1):(m*T+k+2)],mcerror[(m*T+k+1):(m*T+k+2)]) colnames(est.varcomp) = c("Variance Component", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.varcomp, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/OutputmodelKOTA2.csv", append = TRUE, sep = ",", col.names = NA)

#### Deviance Information Criteria (DIC) #### DIC=output.KOTA2$DIC ks.KOTA2.DIC = data.frame(DIC) write.table(ks.KOTA2.DIC, file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/DIC.ModelKOTA2.csv", sep = ",", col.names = NA) par.interest.DIC = rownames(ks.KOTA2.DIC) summary.stat.DIC = colnames(ks.KOTA2.DIC) summary.stat.DIC

dev.off() #### Model checking ##### pdf(file = "D:/STK/Maryland/Bahan Disertasi KS/Data Susenas Podes/Program R/modelKOTA.check.pdf") par(mfrow = c(3,1))

### The time series trace plots for the chain for each of the parameters specified. plotHistory(node plotHistory(node plotHistory(node plotHistory(node plotHistory(node

= = = = =



= = = = =



plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node

= = = =

"beta[2]") "beta[3]") "thau") "theta[1,3]")

132

plotAutoC(node = "theta[5,4]") ### The BGR convergence statistic(Brooks and Gelman 1998).


= = = = =


dev.off()

133

Lampiran 3. Program R untuk Simulasi Data ####################################################### ######### Simulation : Time Series Effect ######### ###################################################### T=5 m=10

# time # area

theta thetahat x1 x2 x3 x4 x5 e u v epsilon psi inv.psi

= = = = = = = = = = = = =

matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0, matrix(0,

beta0 beta1 beta2 beta3 beta4 beta5

= 1.5 = 8.0 = -0.4 = 2.1 = -0.1 = 1.6

nrow nrow nrow nrow nrow nrow nrow nrow nrow nrow nrow nrow nrow

= = = = = = = = = = = = =

m, m, m, m, m, m, m, m, m, m, m, m, m,

ncol ncol ncol ncol ncol ncol ncol ncol ncol ncol ncol ncol ncol

= = = = = = = = = = = = =

T+1) T+1) T+1) T+1) T+1) T+1) T+1) T+1) T+1) 1) T+1) T+1) T+1)

for(i in 1:m) { v[i,] = rnorm(1,0,3.5) for(j in 1:T+1) { inv.psi[i,j] = rgamma(1,5,10) psi[i,j] = 1/inv.psi[i,j] # sampling variance x1[i,j] = runif(1,1,3) x2[i,j] = runif(1,1,5) x3[i,j] = runif(1,1,7) x4[i,j] = runif(1,2,5) x5[i,j] = runif(1,2,7) e[i,j] = rnorm(1,0,sqrt(psi[i,j])) epsilon[i,j] = rnorm(1,0,1.5) u[i,j] = u[i,j-1] + epsilon[i,j] theta[i,j] = (beta0 + beta1*x1[i,j] + beta2*x2[i,j] + beta3*x3[i,j] + beta4*x4[i,j] + beta5*x5[i,j]) + v[i,] + u[i,j] thetahat[i,j]= theta[i,j] + e[i,j] } } theta psi x1

134

####### studying the relationship between thetahat and the covariates ###### library(Design) ks.reg = ols(thetahat[,2] ~ x1[,2] + x2[,2] + x3[,2] + x4[,2] + x5[,2]) ks.coeff = ks.reg$coeff ks.coeff ks.var = ks.reg$var ks.var ### initial value set up for all Chains k = 6 # number of regression coefficients ks.coeff = as.vector(ks.coeff) ks.se = as.vector(sqrt(diag(ks.var))) beta.initi = matrix(0, nrow = k, ncol = 3) # ncol is the number of chains for(i in 1:k) { beta.initi[i,] = rnorm(3, ks.coeff[i], ks.se[i]) }

########################################### ####The hierarchical Bayes ################

library(BRugs) dataKS1 = list("m","T","x1","x2","x3","x4","x5","u","thetahat","psi")

inits1 = list(beta = beta.initi[,1], thau = 1.0, sigma = 1.7, v = rnorm(m, 0, 0.50)) inits2 = list(beta = beta.initi[,2], thau = 1.5, sigma = 1.5, v = rnorm(m, 0, 0.75)) inits3 = list(beta = beta.initi[,3], thau = 2.0, sigma = 1.0, v = rnorm(m, 0, 1.00)) initmodelKS1 = list(inits1, inits2, inits3)

basemodelKS1 = function() { for (i in 1:m) { v[i] ~ dnorm(0, thau.inv) for(j in 2:T+1) { thetahat[i,j] ~ dnorm(theta[i,j], psi.inv[i,j]) psi.inv[i,j] <- 1/psi[i,j] theta[i,j] <- beta[1]+beta[2]*x1[i,j]+beta[3]*x2[i,j]+ beta[4]*x3[i,j]+beta[5]*x4[i,j]+beta[6]*x5[i,j]+v[i]+u[i,j] u[i,j] ~ dnorm(u[i,j-1],sigma.inv) } }

135

thau.inv <- 1/thau sigma.inv <- 1/sigma beta[1] ~ dflat() beta[2] ~ dflat() beta[3] ~ dflat() beta[4] ~ dflat() beta[5] ~ dflat() beta[6] ~ dflat() thau ~ dgamma(1,3) sigma ~ dgamma(1,5) } writeModel(basemodelKS1, con = "modelKS1.txt") file

### OpenBUGS model

output.KS1 = BRugsFit(modelFile = "modelKS1.txt", data = dataKS1,inits = initmodelKS1, numChains = 3, para = c("theta","beta","thau","sigma"), nBurnin = 1000, nIter = 10000,nThin=4) resultKS1 = round(samplesStats("thau"),3) pdf(file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/ResultsKS.Thaupos.pdf") par(mfrow = c(2,2))

plotDensity("thau", main = "posterior of thau given Gamma(1,3)") outputKS1=samplesStats(node=c("theta","beta","thau","sigma"))

par.interest = rownames(outputKS1) summary.statistics = colnames(outputKS1) summary.statistics post.mean = outputKS1$mean post.median = outputKS1$median post.sd = outputKS1$sd mcerror=outputKS1$MC_error l2.5pct = outputKS1$val2.5pc u97.5pct = outputKS1$val97.5pc length.ci = u97.5pct - l2.5pct


thetadirect = matrix(0, m*T, 1) for(i in 1:m) { for(j in 2:(T+1)) { thetadirect[((j-1)+(i-1)*T),1] = thetahat[i,j] } }

136

predKS1 = data.frame(par.interest[1:(m*T)],thetadirect[1:(m*T)],post.mean[1: (m*T)], post.median[1:(m*T)], post.sd[1:(m*T)],l2.5pct[1:(m*T)],u97.5pct[1:(m*T)],mcerror[1:(m*T )]) colnames(predKS1) = c("Parameter","Direct","Posterior Mean", "Posterior Median","Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(predKS1, file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/OutputmodelKS1.csv", sep = ",", col.names = NA)

#### Estimation of the Fixed Effects (beta) #### est.fixed = data.frame(par.interest[(m*T+1):(m*T+k)], post.mean[(m*T+1):(m*T+k)],post.median[(m*T+1):(m*T+k)], post.sd[(m*T+1):(m*T+k)],l2.5pct[(m*T+1):(m*T+k)],u97.5pct[(m*T+1) :(m*T+k)],mcerror[(m*T+1):(m*T+k)]) colnames(est.fixed) = c("Fixed Effect", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.fixed, file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/OutputmodelKS1.csv", append = TRUE, sep = ",", col.names = NA)

#### Estimation of the variance components #### est.varcomp = data.frame(par.interest[(m*T+k+1):(m*T+k+2)],post.mean[(m*T+k+1):( m*T+k+2)],post.median[(m*T+k+1):(m*T+k+2)], post.sd[(m*T+k+1):(m*T+k+2)],l2.5pct[(m*T+k+1):(m*T+k+2)],u97.5pct [(m*T+k+1):(m*T+k+2)],mcerror[(m*T+k+1):(m*T+k+2)]) colnames(est.varcomp) = c("Variance Component", "Posterior Mean","Posterior Median", "Standard Error Estimate", "Lower Limit","Upper Limit","Monte Carlo Error") write.table(est.varcomp, file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/OutputmodelKS1.csv", append = TRUE, sep = ",", col.names = NA)

#### Deviance Information Criteria (DIC) #### DIC=output.KS1$DIC ks.KS1.DIC = data.frame(DIC) write.table(ks.KS1.DIC, file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/DIC.ModelKS1.csv", sep = ",", col.names = NA) par.interest.DIC = rownames(ks.KS1.DIC) summary.stat.DIC = colnames(ks.KS1.DIC) summary.stat.DIC

dev.off()

137

#### Model checking ##### pdf(file = "E:/STK/Beasiswa/Maryland/Bahan Disertasi KS/Program R/modelKS.check.pdf") par(mfrow = c(3,1))

### The time series trace plots for the chain for each of the parameters specified. plotHistory(node plotHistory(node plotHistory(node plotHistory(node plotHistory(node

= = = = =



= = = = =



plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node plotAutoC(node

= = = = =


### The BGR convergence statistic(Brooks and Gelman 1998).


= = = = =


dev.off()

138

Lampiran 4. Perbandingan Antara Metode Pendugaan Langsung dengan Metode Pendugaan Tidak Langsung untuk Rata-rata Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas 2005 Wilayah Kota Bogor No

Area Kecil Desa

Penduga Langsung

ˆ

KTG

Metode SAE - PTLTE

AKTG

ˆ PTLTE

KTG

AKTG

1 Mulyaharja

320.9

692.9

26.3

329.1

585.4

24.2

2 Pamoyanan

183.6

289.0

17.0

187.3

268.8

16.4

3 Ranggamekar

314.7

666.4

25.8

308.5

562.8

23.7

4 Genteng

207.8

300.4

17.3

212.0

276.5

16.6

5 Kertamaya

354.9

847.4

29.1

366.4

683.0

26.1

6 Bojongkerta

325.7

713.7

26.7

327.6

601.9

24.5

7 Harjasari

226.6

378.4

19.5

232.8

341.1

18.5

8 Muarasari

310.6

649.2

25.5

317.0

544.4

23.3

9 Cipaku

236.7

457.7

21.4

242.2

405.8

20.1

10 Batutulis

453.5

7590.9

87.1

403.6

2255.8

47.5

11 Empang

406.4

919.1

30.3

401.0

707.7

26.6

12 Cikaret

357.6

802.5

28.3

351.4

648.4

25.5

13 Sindangrasa

420.7

1319.5

36.3

368.1

997.3

31.6

14 Katulampa

178.1

285.7

16.9

181.5

265.4

16.3

15 Baranangsiang

310.8

1839.5

42.9

340.6

1169.2

34.2

16 Sukasari

303.6

3879.3

62.3

298.6

1652.0

40.6

17 Bantarjati

312.9

1864.8

43.2

342.5

1178.9

34.3

18 Tegalgundil

369.8

3493.8

59.1

413.0

1578.8

39.7

19 Tanahbaru

448.4

2257.6

47.5

427.3

1280.2

35.8

20 Cimahpar

254.1

704.4

26.5

265.7

579.2

24.1

21 Ciluar

370.7

1673.1

40.9

369.3

1054.4

32.5

22 Cibuluh

398.7

2381.8

48.8

398.9

1292.1

35.9

23 Kedunghalang

548.7

9680.5

98.4

390.5

2160.2

46.5

24 Ciparigi

248.7

865.1

29.4

266.3

686.8

26.2

25 Paledang

540.7

8203.6

90.6

414.9

2278.8

47.7

26 Gudang

432.6

5250.8

72.5

375.0

1902.3

43.6

27 Babakanpasar

365.4

5249.8

72.5

332.2

1822.9

42.7

28 Tegallega

307.0

1321.6

36.4

310.4

959.5

31.0

29 Babakan

357.9

3593.2

59.9

380.4

1575.5

39.7

30 Sempur

521.7

7635.8

87.4

440.8

2035.1

45.1

31 Cibogor

412.8

4780.4

69.1

375.3

1866.9

43.2

32 Kebonkelapa

724.3

6014.6

77.6

496.7

2232.4

47.2

139

No

Area Kecil Desa

Penduga Langsung

ˆ

KTG

Metode SAE - PTLTE

AKTG

ˆ PTLTE

KTG

AKTG

33 Pasirkuda

411.9

2777.5

52.7

415.2

1472.5

38.4

34 Pasirjaya

270.6

492.5

22.2

291.7

429.2

20.7

35 Gunungbatu

392.4

711.7

26.7

392.1

585.0

24.2

36 Loji

430.1

3028.1

55.0

408.2

1500.7

38.7

37 Menteng

364.4

1431.5

37.8

382.3

969.6

31.1

38 Cilendek Barat

393.1

713.4

26.7

389.6

591.3

24.3

39 Sindangbarang

753.8

14811.8

121.7

447.7

2420.3

49.2

40 Margajaya

387.4

2457.1

49.6

366.6

1359.4

36.9

41 Situgede

335.8

1022.6

32.0

329.1

794.5

28.2

42 Bubulak

289.2

1369.2

37.0

294.7

927.9

30.5

43 Curugmekar

423.2

2931.7

54.1

327.2

1665.7

40.8

44 Curug

417.2

2849.6

53.4

425.5

1446.1

38.0

45 Kedungwaringin

276.1

691.6

26.3

277.5

568.1

23.8

46 Kedungjaya

362.7

2296.0

47.9

406.9

1376.0

37.1

47 Kebonpedes

301.9

444.4

21.1

311.5

392.0

19.8

48 Tanahsareal

363.5

1511.9

38.9

365.6

994.4

31.5

49 Kedungbadak

537.9

4646.4

68.2

435.8

1688.7

41.1

50 Sukaresmi

356.8

1456.7

38.2

346.6

994.5

31.5

51 Cibadak

377.3

4421.2

66.5

349.1

1690.3

41.1

52 Kayumanis

299.9

1182.4

34.4

309.5

899.1

30.0

53 Mekarwangi

368.3

1552.6

39.4

375.8

1041.4

32.3

54 Kencana

242.7

833.3

28.9

231.7

695.8

26.4

Rataan

2597.0

45.4

1128.7

32.3

140

Lampiran 5. Perbandingan Antara Metode PTLTE Penampang Melintang dengan Metode PTLTE Deret Waktu untuk Data Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor

No

Area Kecil Desa


ˆ PT  PM

KTG

AKTG


ˆ PT  DW

KTG

AKTG

1 Mulyaharja

329.1

585.4

24.2

332.8

515.3

22.7

2 Pamoyanan

187.3

268.8

16.4

188.1

252.9

15.9

3 Ranggamekar

308.5

562.8

23.7

309.3

500.5

22.4

4 Genteng

212.0

276.5

16.6

210.1

261.0

16.2

5 Kertamaya

366.4

683.0

26.1

364.5

596.5

24.4

6 Bojongkerta

327.6

601.9

24.5

337.3

528.5

23.0

7 Harjasari

232.8

341.1

18.5

230.0

318.1

17.8

8 Muarasari

317.0

544.4

23.3

319.9

489.7

22.1

9 Cipaku

242.2

405.8

20.1

241.0

372.5

19.3

10 Batutulis

403.6

2255.8

47.5

341.6

1606.7

40.1

11 Empang

401.0

707.7

26.6

393.0

627.7

25.1

12 Cikaret

351.4

648.4

25.5

355.6

574.5

24.0

13 Sindangrasa

368.1

997.3

31.6

340.9

811.4

28.5

14 Katulampa

181.5

265.4

16.3

179.7

250.1

15.8

15 Baranangsiang

340.6

1169.2

34.2

332.6

953.3

30.9

16 Sukasari

298.6

1652.0

40.6

296.9

1302.9

36.1

17 Bantarjati

342.5

1178.9

34.3

333.9

958.2

31.0

18 Tegalgundil

413.0

1578.8

39.7

390.0

1260.6

35.5

19 Tanahbaru

427.3

1280.2

35.8

401.4

1052.2

32.4

20 Cimahpar

265.7

579.2

24.1

263.0

520.1

22.8

21 Ciluar

369.3

1054.4

32.5

365.6

903.2

30.1

22 Cibuluh

398.9

1292.1

35.9

383.2

1074.6

32.8

23 Kedunghalang

390.5

2160.2

46.5

361.6

1629.0

40.4

24 Ciparigi

266.3

686.8

26.2

254.4

603.1

24.6

25 Paledang

414.9

2278.8

47.7

420.9

1641.1

40.5

26 Gudang

375.0

1902.3

43.6

331.7

1439.6

37.9

27 Babakanpasar

332.2

1822.9

42.7

311.6

1418.6

37.7

28 Tegallega

310.4

959.5

31.0

300.5

797.4

28.2

29 Babakan

380.4

1575.5

39.7

369.6

1270.5

35.6

30 Sempur

440.8

2035.1

45.1

402.5

1561.7

39.5

31 Cibogor

375.3

1866.9

43.2

377.9

1417.7

37.7

141

No

Area Kecil Desa


ˆ PT  PM

KTG

AKTG


ˆ PT  DW

KTG

AKTG

32 Kebonkelapa

496.7

2232.4

47.2

512.9

1532.8

39.2

33 Pasirkuda

415.2

1472.5

38.4

410.5

1163.4

34.1

34 Pasirjaya

291.7

429.2

20.7

284.9

395.3

19.9

35 Gunungbatu

392.1

585.0

24.2

385.1

524.9

22.9

36 Loji

408.2

1500.7

38.7

406.3

1197.8

34.6

37 Menteng

382.3

969.6

31.1

373.0

830.8

28.8

38 Cilendek Barat

389.6

591.3

24.3

382.6

526.2

22.9

39 Sindangbarang

447.7

2420.3

49.2

450.7

1728.5

41.6

40 Margajaya

366.6

1359.4

36.9

374.0

1101.9

33.2

41 Situgede

329.1

794.5

28.2

328.4

676.0

26.0

42 Bubulak

294.7

927.9

30.5

296.6

806.1

28.4

43 Curugmekar

327.2

1665.7

40.8

274.8

1224.6

35.0

44 Curug

425.5

1446.1

38.0

415.6

1171.5

34.2

45 Kedungwaringin

277.5

568.1

23.8

279.6

512.7

22.6

46 Kedungjaya

406.9

1376.0

37.1

390.6

1078.4

32.8

47 Kebonpedes

311.5

392.0

19.8

309.6

363.1

19.1

48 Tanahsareal

365.6

994.4

31.5

350.0

852.6

29.2

49 Kedungbadak

435.8

1688.7

41.1

408.1

1368.9

37.0

50 Sukaresmi

346.6

994.5

31.5

348.8

840.7

29.0

51 Cibadak

349.1

1690.3

41.1

338.4

1348.5

36.7

52 Kayumanis

309.5

899.1

30.0

310.8

746.6

27.3

53 Mekarwangi

375.8

1041.4

32.3

368.2

870.8

29.5

54 Kencana

231.7

695.8

26.4

228.7

590.9

24.3

Rataan

1128.7

32.3

906.7

29.2

142

Lampiran 6. Perbandingan Antara Metode PTLTE dengan Metode Bayes Berhirarki Model 1 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor

No

Area Kecil Desa


ˆ PT  DW

KTG

AKTG


ˆ BB1 DW

KTG

AKTG

1 Mulyaharja

332.8

515.3

22.7

254.7

237.9

15.4

2 Pamoyanan

188.1

252.9

15.9

214.4

120.0

11.0

3 Ranggamekar

309.3

500.5

22.4

282.2

443.2

21.1

4 Genteng

210.1

261.0

16.2

226.0

173.9

13.2

5 Kertamaya

364.5

596.5

24.4

264.9

284.9

16.9

6 Bojongkerta

337.3

528.5

23.0

260.6

322.3

18.0

7 Harjasari

230.0

318.1

17.8

228.2

318.1

17.8

8 Muarasari

319.9

489.7

22.1

255.6

324.1

18.0

9 Cipaku

241.0

372.5

19.3

249.7

189.8

13.8

10 Batutulis

341.6

1606.7

40.1

281.1

1220.4

34.9

11 Empang

393.0

627.7

25.1

281.3

255.0

16.0

12 Cikaret

355.6

574.5

24.0

270.9

256.8

16.0

13 Sindangrasa

340.9

811.4

28.5

298.7

411.6

20.3

14 Katulampa

179.7

250.1

15.8

222.3

116.1

10.8

15 Baranangsiang

332.6

953.3

30.9

259.9

515.7

22.7

16 Sukasari

296.9

1302.9

36.1

262.0

735.9

27.1

17 Bantarjati

333.9

958.2

31.0

259.6

378.1

19.4

18 Tegalgundil

390.0

1260.6

35.5

273.8

611.4

24.7

19 Tanahbaru

401.4

1052.2

32.4

293.3

573.2

23.9

20 Cimahpar

263.0

520.1

22.8

231.3

332.8

18.2

21 Ciluar

365.6

903.2

30.1

281.0

687.8

26.2

22 Cibuluh

383.2

1074.6

32.8

277.9

434.6

20.8

23 Kedunghalang

361.6

1629.0

40.4

268.4

643.0

25.4

24 Ciparigi

254.4

603.1

24.6

250.4

479.1

21.9

25 Paledang

420.9

1641.1

40.5

302.1

1414.1

37.6

26 Gudang

331.7

1439.6

37.9

284.4

1263.4

35.5

27 Babakanpasar

311.6

1418.6

37.7

271.1

962.4

31.0

28 Tegallega

300.5

797.4

28.2

274.6

537.7

23.2

29 Babakan

369.6

1270.5

35.6

270.6

873.6

29.6

30 Sempur

402.5

1561.7

39.5

274.4

682.4

26.1

31 Cibogor

377.9

1417.7

37.7

273.8

629.7

25.1

143

No

Area Kecil Desa


ˆ PT  DW

KTG

AKTG


ˆ BB1 DW

KTG

AKTG

32 Kebonkelapa

512.9

1532.8

39.2

315.0

826.6

28.8

33 Pasirkuda

410.5

1163.4

34.1

281.7

461.8

21.5

34 Pasirjaya

284.9

395.3

19.9

256.5

146.6

12.1

35 Gunungbatu

385.1

524.9

22.9

294.6

255.0

16.0

36 Loji

406.3

1197.8

34.6

281.3

714.7

26.7

37 Menteng

373.0

830.8

28.8

291.9

714.3

26.7

38 Cilendek Barat

382.6

526.2

22.9

299.5

431.9

20.8

39 Sindangbarang

450.7

1728.5

41.6

274.7

812.2

28.5

40 Margajaya

374.0

1101.9

33.2

268.2

410.6

20.3

41 Situgede

328.4

676.0

26.0

263.2

495.0

22.2

42 Bubulak

296.6

806.1

28.4

254.9

369.1

19.2

43 Curugmekar

274.8

1224.6

35.0

298.0

879.0

29.6

44 Curug

415.6

1171.5

34.2

278.8

454.3

21.3

45 Kedungwaringin

279.6

512.7

22.6

250.1

383.3

19.6

46 Kedungjaya

390.6

1078.4

32.8

275.9

442.7

21.0

47 Kebonpedes

309.6

363.1

19.1

268.9

147.5

12.1

48 Tanahsareal

350.0

852.6

29.2

286.1

507.1

22.5

49 Kedungbadak

408.1

1368.9

37.0

312.5

1171.0

34.2

50 Sukaresmi

348.8

840.7

29.0

274.6

694.1

26.3

51 Cibadak

338.4

1348.5

36.7

290.3

1229.7

35.1

52 Kayumanis

310.8

746.6

27.3

264.0

422.6

20.6

53 Mekarwangi

368.2

870.8

29.5

293.7

836.8

28.9

54 Kencana

228.7

590.9

24.3

246.9

274.9

16.6

Rataan

906.7

29.2

546.5

22.5

144

Lampiran 7. Perbandingan Antara Metode Bayes Berhirarki Model 1 dengan Model 2 pada Data Deret Waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor

No

Area Kecil Desa


ˆ BB1 DW

KTG


AKTG

ˆ BB 2 DW

KTG

AKTG

1 Mulyaharja

254.7

237.9

15.4

249.9

172.8

13.1

2 Pamoyanan

214.4

120.0

11.0

220.1

58.1

7.6

3 Ranggamekar

282.2

443.2

21.1

278.0

462.7

21.5

4 Genteng

226.0

173.9

13.2

229.6

51.9

7.2

5 Kertamaya

264.9

284.9

16.9

257.2

183.5

13.5

6 Bojongkerta

260.6

322.3

18.0

252.4

166.6

12.9

7 Harjasari

228.2

318.1

17.8

226.6

370.5

19.2

8 Muarasari

255.6

324.1

18.0

250.8

214.6

14.7

9 Cipaku

249.7

189.8

13.8

247.5

244.7

15.6

10 Batutulis

281.1

1220.4

34.9

280.9

1238.8

35.2

11 Empang

281.3

255.0

16.0

283.2

277.2

16.6

12 Cikaret

270.9

256.8

16.0

269.2

263.1

16.2

13 Sindangrasa

298.7

411.6

20.3

287.5

253.2

15.9

14 Katulampa

222.3

116.1

10.8

222.9

116.2

10.8

15 Baranangsiang

259.9

515.7

22.7

252.5

427.4

20.7

16 Sukasari

262.0

735.9

27.1

259.1

802.6

28.3

17 Bantarjati

259.6

378.1

19.4

254.3

300.9

17.3

18 Tegalgundil

273.8

611.4

24.7

273.8

516.5

22.7

19 Tanahbaru

293.3

573.2

23.9

290.3

537.1

23.2

20 Cimahpar

231.3

332.8

18.2

227.1

263.8

16.2

21 Ciluar

281.0

687.8

26.2

282.4

741.6

27.2

22 Cibuluh

277.9

434.6

20.8

267.6

243.7

15.6

23 Kedunghalang

268.4

643.0

25.4

270.7

685.9

26.2

24 Ciparigi

250.4

479.1

21.9

250.5

288.6

17.0

25 Paledang

302.1

1414.1

37.6

300.8

1414.2

37.6

26 Gudang

284.4

1263.4

35.5

284.1

1303.6

36.1

27 Babakanpasar

271.1

962.4

31.0

266.0

755.2

27.5

28 Tegallega

274.6

537.7

23.2

273.4

326.5

18.1

29 Babakan

270.6

873.6

29.6

274.0

976.0

31.2

30 Sempur

274.4

682.4

26.1

280.7

745.5

27.3

31 Cibogor

273.8

629.7

25.1

276.7

675.1

26.0

145

No

Area Kecil Desa


ˆ BB1 DW

KTG


AKTG

ˆ BB 2 DW

KTG

AKTG

32 Kebonkelapa

315.0

826.6

28.8

313.3

831.1

28.8

33 Pasirkuda

281.7

461.8

21.5

275.6

256.7

16.0

34 Pasirjaya

256.5

146.6

12.1

250.2

59.8

7.7

35 Gunungbatu

294.6

255.0

16.0

298.3

279.0

16.7

36 Loji

281.3

714.7

26.7

274.3

525.2

22.9

37 Menteng

291.9

714.3

26.7

283.7

451.7

21.3

38 Cilendek Barat

299.5

431.9

20.8

279.7

209.8

14.5

39 Sindangbarang

274.7

812.2

28.5

277.8

979.5

31.3

40 Margajaya

268.2

410.6

20.3

270.2

480.7

21.9

41 Situgede

263.2

495.0

22.2

253.8

340.1

18.4

42 Bubulak

254.9

369.1

19.2

252.1

212.8

14.6

43 Curugmekar

298.0

879.0

29.6

301.7

964.7

31.1

44 Curug

278.8

454.3

21.3

281.6

460.5

21.5

45 Kedungwaringin

250.1

383.3

19.6

244.7

265.6

16.3

46 Kedungjaya

275.9

442.7

21.0

269.1

281.7

16.8

47 Kebonpedes

268.9

147.5

12.1

265.7

80.4

9.0

48 Tanahsareal

286.1

507.1

22.5

276.9

305.0

17.5

49 Kedungbadak

312.5

1171.0

34.2

303.3

994.7

31.5

50 Sukaresmi

274.6

694.1

26.3

274.5

720.2

26.8

51 Cibadak

290.3

1229.7

35.1

285.8

954.8

30.9

52 Kayumanis

264.0

422.6

20.6

265.9

489.3

22.1

53 Mekarwangi

293.7

836.8

28.9

292.5

860.6

29.3

54 Kencana

246.9

274.9

16.6

250.4

131.3

11.5

Rataan

546.5

22.5

485.4

20.7

146

Lampiran 8. Perbandingan KTG dan AKTG Antara Metode PTLT dengan Bayes Berhirarki pada Data Deret waktu Tingkat Pengeluaran Perkapita Perbulan (dalam Ribuan Rupiah), Susenas Wilayah Kota Bogor PTLTE No

Area Kecil - Desa

KTG

BB-1

AKTG

KTG

BB-2

AKTG

KTG

AKTG

1 Mulyaharja

515.3

22.7

237.9

15.4

172.8

13.1

2 Pamoyanan

252.9

15.9

120.0

11.0

58.1

7.6

3 Ranggamekar

500.5

22.4

443.2

21.1

462.7

21.5

4 Genteng

261.0

16.2

173.9

13.2

51.9

7.2

5 Kertamaya

596.5

24.4

284.9

16.9

183.5

13.5

6 Bojongkerta

528.5

23.0

322.3

18.0

166.6

12.9

7 Harjasari

318.1

17.8

318.1

17.8

370.5

19.2

8 Muarasari

489.7

22.1

324.1

18.0

214.6

14.7

9 Cipaku

372.5

19.3

189.8

13.8

244.7

15.6

10 Batutulis

1606.7

40.1

1220.4

34.9

1238.8

35.2

11 Empang

627.7

25.1

255.0

16.0

277.2

16.6

12 Cikaret

574.5

24.0

256.8

16.0

263.1

16.2

13 Sindangrasa

811.4

28.5

411.6

20.3

253.2

15.9

14 Katulampa

250.1

15.8

116.1

10.8

116.2

10.8

15 Baranangsiang

953.3

30.9

515.7

22.7

427.4

20.7

16 Sukasari

1302.9

36.1

735.9

27.1

802.6

28.3

17 Bantarjati

958.2

31.0

378.1

19.4

300.9

17.3

18 Tegalgundil

1260.6

35.5

611.4

24.7

516.5

22.7

19 Tanahbaru

1052.2

32.4

573.2

23.9

537.1

23.2

20 Cimahpar

520.1

22.8

332.8

18.2

263.8

16.2

21 Ciluar

903.2

30.1

687.8

26.2

741.6

27.2

22 Cibuluh

1074.6

32.8

434.6

20.8

243.7

15.6

23 Kedunghalang

1629.0

40.4

643.0

25.4

685.9

26.2

24 Ciparigi

603.1

24.6

479.1

21.9

288.6

17.0

25 Paledang

1641.1

40.5

1414.1

37.6

1414.2

37.6

26 Gudang

1439.6

37.9

1263.4

35.5

1303.6

36.1

27 Babakanpasar

1418.6

37.7

962.4

31.0

755.2

27.5

28 Tegallega

797.4

28.2

537.7

23.2

326.5

18.1

29 Babakan

1270.5

35.6

873.6

29.6

976.0

31.2

30 Sempur

1561.7

39.5

682.4

26.1

745.5

27.3

31 Cibogor

1417.7

37.7

629.7

25.1

675.1

26.0

32 Kebonkelapa

1532.8

39.2

826.6

28.8

831.1

28.8

147

PTLTE No

Area Kecil - Desa

KTG

BB-1

AKTG

KTG

BB-2

AKTG

KTG

AKTG

33 Pasirkuda

1163.4

34.1

461.8

21.5

256.7

16.0

34 Pasirjaya

395.3

19.9

146.6

12.1

59.8

7.7

35 Gunungbatu

524.9

22.9

255.0

16.0

279.0

16.7

1197.8

34.6

714.7

26.7

525.2

22.9

37 Menteng

830.8

28.8

714.3

26.7

451.7

21.3

38 Cilendek Barat

526.2

22.9

431.9

20.8

209.8

14.5

39 Sindangbarang

1728.5

41.6

812.2

28.5

979.5

31.3

40 Margajaya

1101.9

33.2

410.6

20.3

480.7

21.9

41 Situgede

676.0

26.0

495.0

22.2

340.1

18.4

42 Bubulak

806.1

28.4

369.1

19.2

212.8

14.6

43 Curugmekar

1224.6

35.0

879.0

29.6

964.7

31.1

44 Curug

1171.5

34.2

454.3

21.3

460.5

21.5

512.7

22.6

383.3

19.6

265.6

16.3

46 Kedungjaya

1078.4

32.8

442.7

21.0

281.7

16.8

47 Kebonpedes

363.1

19.1

147.5

12.1

80.4

9.0

48 Tanahsareal

852.6

29.2

507.1

22.5

305.0

17.5

1368.9

37.0

1171.0

34.2

994.7

31.5

840.7

29.0

694.1

26.3

720.2

26.8

1348.5

36.7

1229.7

35.1

954.8

30.9

52 Kayumanis

746.6

27.3

422.6

20.6

489.3

22.1

53 Mekarwangi

870.8

29.5

836.8

28.9

860.6

29.3

54 Kencana

590.9

24.3

274.9

16.6

131.3

11.5

906.7

29.2

546.5

22.5

485.4

20.7

36 Loji

45 Kedungwaringin

49 Kedungbadak 50 Sukaresmi 51 Cibadak

Rataan

148

Lampiran 9. Metode Pendugaan Langsung yang digunakan oleh BPS untuk Data Susenas (BPS, 2005). Metode pendugaan yang digunakan dalam Susenas menggunakan metode secara langsung (direct estimate) dan penduga rasio dengan rasio jumlah rumah tangga untuk mengestimasi karakteristik rumah tangga dan rasio penduduk untuk mengestimasi karakteristik penduduk. Dugaan untuk karakteristik y dalam suatu kabupaten/kota di daerah perkotaan dan daerah pedesaan adalah dengan menggunakan rumus metode sampling dua tahap (apabila 3 tahap dilakukan pemilihan sub blok, formula disesuaikan).

Pendugaan Data Rumah Tanga a. Daerah Perkotaan Dugaan nilai rata-rata karakteristik y adalah

y ku 

1 16 bu

bu 16

 yij i 1 j 1

Dugaan nilai total karakteristik y adalah

Yˆku  Pˆku  yku di mana, y ku = dugaan nilai rata-rata karakteristik y di kabupaten/kota k daerah u. Yˆku = dugaan nilai total karakteristik y di kabupaten/kota k daerah u. yij = nilai karakteristik pada rumah tangga terpilih ke-j di blok sensus terpilih ke-i. bu = banyaknya blok sensus terpilih di kabupaten/kota k daerah u. Pˆ = perkiraan jumlah rumah tangga di kabupaten/kota k daerah u. ku

b. Daerah Pedesaan Dugaan nilai rata-rata karakteristik y adalah y kr

1  16 br

br

16

 y

ij

i 1 j 1


Yˆkr  Pˆkr  y kr

149

di mana, y kr = dugaan nilai rata-rata karakteristik y di kabupaten/kota k daerah r. Yˆkr = dugaan nilai total karakteristik y di kabupaten/kota k daerah r. yij = nilai karakteristik pada rumah tangga terpilih ke-j di blok sensus terpilih ke-i. br = banyaknya blok sensus terpilih di kabupaten/kota k daerah r.

Pˆkr = perkiraan jumlah rumah tangga di kabupaten/kota k daerah r. Perkiraan nilai rata-rata karakteristik y di kabupaten/kota k daerah u dan r adalah

y k (u  r ) 

Yˆku  Yˆkr Pˆku  Pˆkr

Perkiraan nilai total karakteristik y di kabupaten/kota k daerah perkotaan ( Yˆku ) dan pedesaan ( Yˆkr ) adalah

Yˆk ( u  r )  Yˆku  Yˆkr Perkiraan nilai total karakteristik y di tingkat propinsi daerah perkotaan ( Yˆpu ) atau pedesaan ( Yˆpr ) dihitung dengan rumus: T

T Yˆpu  Yˆku dan Yˆpr  Yˆkr

k1

k 1

di mana, T = banyaknya kabupaten/kota di propinsi p. Perkiraan nilai total karakteristik y di tingkat propinsi daerah perkotaan ( Yˆpu ) dan pedesaan ( Yˆpr ) adalah

Yˆp(ur )  Yˆpu  Yˆpr Perkiraan nilai rata-rata karakteristik y di tingkat propinsi daerah perkotaan (u) dan perdesaan (r) adalah

y p (u  r )

Yˆpu  Yˆpr  Pˆ pu  Pˆ pr

Perkiraan nilai total karakteristik y di tingkat nasional dihitung dengan rumus

150

L

Yˆn (u  r )   (Yˆpu  Yˆpr ) p 1

di mana, L = banyaknya propinsi di Indonesia. Perkiraan nilai rata-rata karakteristik y di tingkat nasional dihitung dengan cara

y n (u  r )

Yˆn (u  r )  Pˆ

n (u  r )

di mana, Pˆn ( u  r ) adalah perkiraan jumlah rumah tangga di Indonesia daerah perkotaan dan pedesaan.

Pendugaan Data Individu a. Daerah Perkotaan Dugaan nilai rata-rata karakteristik y adalah yku 

1 16 bu

bu

16

a

  y i 1

1 j 1 aij

ijk

h 1


ˆ y Yˆku  Q ku ku di mana, y ku = dugaan nilai rata-rata karakteristik y di kabupaten/kota k daerah u. Yˆku = dugaan nilai total karakteristik y di kabupaten/kota k daerah u. yij = nilai karakteristik pada rumah tangga terpilih ke-j di blok sensus terpilih ke-i. bu = banyaknya blok sensus terpilih di kabupaten/kota k daerah u. aij

= banyaknya individu (ART) di rumah tangga terpilih ke-j di blok sensus terpilih ke-i.

ˆ Q ku =

perkiraan jumlah rumah tangga di kabupaten/kota k daerah u.

b. Daerah Pedesaan Dugaan nilai rata-rata karakteristik y adalah

151

ykr 

1 16 br

br

16

a

  y i 1 j 1

1 aij

ijh

j 1


Yˆkr  Pˆkr  y kr di mana, y kr = dugaan nilai rata-rata karakteristik y di kabupaten/kota k daerah r. Yˆkr = dugaan nilai total karakteristik y di kabupaten/kota k daerah r. yijh

br aij

= nilai karakteristik pada rumah tangga terpilih ke-j di blok sensus terpilih ke-i. = banyaknya blok sensus terpilih di kabupaten/kota k daerah r. = banyaknya individu (ART) di rumah tangga terpilih ke-j di blok sensus terpilih ke-i.

ˆ Q kr =

perkiraan jumlah rumah tangga di kabupaten/kota k daerah r.

Perkiraan nilai rata-rata karakteristik y di kabupaten/kota k daerah u dan r adalah

y k (u  r ) 

Yˆku  Yˆkr Pˆku  Pˆkr

Perkiraan nilai total karakteristik y di kabupaten/kota k daerah perkotaan ( Yˆku ) dan pedesaan ( Yˆkr ) adalah

Yˆk ( u  r )  Yˆku  Yˆkr Perkiraan nilai total karakteristik y di tingkat propinsi daerah perkotaan ( Yˆpu ) atau pedesaan ( Yˆpr ) dihitung dengan rumus: T

T Yˆpu   Yˆku dan Yˆpr   Yˆkr k 1

k 1

di mana, T = banyaknya kabupaten/kota di propinsi p. Perkiraan nilai total karakteristik y di tingkat propinsi daerah perkotaan ( Yˆpu ) dan pedesaan ( Yˆpr ) adalah

Yˆp ( u  r )  Yˆpu  Yˆpr

152

Perkiraan nilai rata-rata karakteristik y di tingkat propinsi daerah perkotaan (u) dan perdesaan (r) adalah

y p( u  r ) 

Yˆ pu  Yˆ pr ˆ Q ˆ Q pu pr

Perkiraan nilai total karakteristik y di tingkat nasional dihitung dengan rumus L

Yˆn (u  r )   (Yˆpu  Yˆpr ) p 1

di mana, L = banyaknya propinsi di Indonesia. Perkiraan nilai rata-rata karakteristik y di tingkat nasional dihitung dengan cara

y n( u  r )

Yˆn( u  r )  ˆ Q

n( u  r )

di mana,

ˆ Q n( u  r )

adalah perkiraan jumlah rumah tangga di Indonesia daerah

perkotaan dan pedesaan.

153

METODE PREDIKSI TAK-BIAS LINEAR TERBAIK DAN BAYES BERHIRARKI UNTUK PENDUGAAN AREA KECIL BERDASARKAN MODEL STATE SPACE KUSMAN SADIK

Recommend Documents