PERBANDINGAN METODE JACKKNIFE JIANG DAN AREA-SPESIFIC PADA PENDUGAAN MEAN SQUARED ERROR MODEL BETA-BINOMIAL
Skripsi
Oleh DITA PARAMITHA
JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS LAMPUNG BANDAR LAMPUNG 2017
ABSTRACT COMPARISON JACKKNIFE JIANG AND AREA-SPESIFIC METHOD IN ESTIMATION MEAN SQUARED ERROR OF BETA-BINOMIAL MODEL
By DITA PARAMITHA
Empirical Bayes (EB) method is one of method in small area estimation for count or binary data. Estimation with EB method based on posterior which its parameter be estimated by data. Beta Binomial model is a model that can be used for binary data. In this research, parameter estimation from the EB estimator is estimated use the method of momen. MSE of the EB estimator is evaluated by Jackknife Jiang and Area-spesific both in theory and empirical. Empirical studied with Ri386 using the data of preprosperous family in Bandar Lampung 2014 we know that EB estimator is biased. Based on calculation from the data, it showed that the MSE of Area-spesific Jackknife method is smaller than the MSE of Jackknife Jiang method. Keyword: Small Area Estimation, Empirical Bayes (EB), Beta Binomial Model, Method of Momen, Jackknife.
ABSTRAK PERBANDINGAN METODE JACKKNIFE JIANG DAN AREA-SPESIFIC PADA PENDUGAAN MEAN SQUARE ERROR MODEL BETA-BINOMIAL
Oleh DITA PARAMITHA
Metode Empirical Bayes (EB) merupakan salah satu metode pada pendugaan area kecil untuk data cacah atau biner. Pendugaan dengan pendekatan EB didasarkan pada sebaran posterior yang parameternya diduga dari data. Model Beta Binomial merupakan salah satu model yang dapat digunakan pada respon biner. Pada penelitian ini pendugaan parameter dari penduga EB dilakukan menggunakan Metode Momen. Evaluasi Mean Square Error (MSE) pada penduga EB dilakukan dengan metode Jackknife Jiang dan Area-spesific Jackknife baik secara teori maupun empiris. Kajian secara empiris dilakukan dengan bantuan software R i386 menggunakan data Keluarga Prasejahtera Tahun 2014 di Kota Bandar Lampung. Hasil penelitian ini menunjukan bahwa penduga EB bersifat bias. Berdasarkan perhitungan dari data diperoleh bahwa metode Area-specific Jackknife menghasilkan MSE yang relatif lebih kecil dibandingkan MSE dengan metode Jackknife Jiang. Kata kunci: Pendugaan Area Kecil, Empirical Bayes (EB), Model Beta Binomial, Metode Momen, Jackknife.
PERBANDINGAN METODE JACKKNIFE JIANG DAN AREA-SPESIFIC PADA PENDUGAAN MEAN SQUARED ERROR MODEL BETA-BINOMIAL
OLEH
Dita Paramitha Skripsi Sebagai Salah Satu Syarat untuk Mencapai Gelar SARJANA SAINS Pada Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS LAMPUNG BANDAR LAMPUNG 2017
RIWAYAT HIDUP
Penulis dilahirkan di Kurungan Nyawa pada tanggal 17 Juli 1995, sebagai anak pertama dari tiga bersaudara, dari Bapak Awaludin dan Ibu Marwiyah.
Pendidikan Taman Kanak-kanak (TK) Dharma Wanita Utama diselesaikan tahun 2001, Sekolah Dasar Negeri (SDN) 01 Bumi Dipasena Utama diselesaikan pada tahun 2007, Sekolah Menengah Pertama Negeri (SMPN) 26 Bandar Lampung diselesaikan pada tahun 2010, dan Sekolah Menengah Atas Negeri (SMAN) 14 Bandar Lampung diselesaikan pada tahun 2013.
Tahun 2013, penulis terdaftar sebagai mahasiswi Jurusan Matematika FMIPA melalui jalur SNMPTN. Selama menjadi mahasiswa penulis aktif organisasi pada periode 2014/2015 sebagai anggota bidang kaderisasi Himpunan Jurusan Matematika (HIMATIKA), sebagai sekretaris biro sirkulasi dan periklanan Unit Kegiatan Mahasiswa Fakultas (UKMF) Natural, dan sebagai staff ahli kementrian Pendidikan dan Kepemudaan Badan Eksekutif Mahasiswa Universitas (BEMU), sedangkan periode 2015/2016 sebagai pimpinan usaha UKMF Natural. Pada tanggal 18 Januariβ14 Februari 2016 penulis melakukan kerja praktek di Badan Pusat Statistik (BPS) Kota Bandar Lampung dan pada 25 Juliβ25 Agustus 2016 penulis melaksanakan Kuliah Kerja Nyata (KKN) Kebangsaan di Desa Sungai Buluh, Kecamatan Singkep Barat, Kabupaten Lingga, Provinsi Kepulauan Riau.
PERSEMBAHAN
Dengan mengucap Alhamdulillah, puji syukur kehadirat Allah SWT kupersembahkan skripsi ini kepada :
Kedua Orang Tua Tercinta, Ayahanda Awaludin dan Ibunda Marwiyah Orang yang telah membesarkan, merawat, dan mendidik saya hingga saat ini, memberikan dukungan materil maupun moril selama menempuh pendidikan hingga saat ini. Terimakasih atas doa dan harapan yang besar kepada saya, atas segala cinta kasih sayang yang tulus ikhlas serta telah menjadi pembimbing hidup disetiap langkah ini.
Adik David Adie Chandra dan Ricard Arjunandito Zetira Adik kandung yang selalu memberikan motivasi dari canda tawa dan keisengan kalian. Terima kasih telah membuat saya menjadi kuat dan bersemangat untuk menikmati hari-hari.
Dhanil Ajitama Seseorang yang hadir dan memberikan warna-warni di hidup saya. Terima kasih setiap waktunya telah memberikan semangat dan motivasi.
Almamater Tercinta Universitas Lampung
SANWACANA
Segala bentuk puji syukur penulis curahkan kehadirat Allah SWT, yang telah melimpahkan rahmat dan karunia-Nya sehingga penulis dapat menyusun dan menyelesaikan skripsi ini. Skripsi dengan judul βPERBANDINGAN METODE JACKKNIFE JIANG DAN AREA-SPESIFIC PADA PENDUGAAN MEAN SQUARED ERROR MODEL BETA-BINOMIALβ adalah salah satu syarat untuk memperoleh gelar sarjana Sains di Universitas Lampung. Penulisan skripsi ini tidak terlepas dari bantuan, bimbingan dan dukungan dari berbagai pihak yang tentunya sangat bermanfaat dan berharga sehingga skripsi ini dapat diselesaikan oleh penulis. Oleh karena itu, penulis mengucapkan terima kasih kepada : 1) Ibu Widiarti, S.Si., M.Si., selaku dosen pembimbing utama yang telah meluangkan waktu untuk membimbing, mengarahkan, dan memotivasi penulis sehingga skripsi ini dapat terselesaikan. 2) Bapak Suharsono S, M.Sc., Ph.D., selaku dosen pembimbing pembantu yang memberikan bantuan dan saran dalam penyelesaian skripsi ini. 3) Bapak Drs. Eri Setiawan, M.Si., selaku dosen penguji atas saran dan kritik yang diberikan bagi skripsi ini.
4) Ibu Netti Herawati, M.Sc., Ph.D., selaku dosen pembimbing akademik yang telah membimbing penulis selama mengikuti perkuliahan. 5) Bapak Tiryono Ruby, M.Sc., Ph.D., selaku Ketua Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung. 6) Bapak Prof. Warsito, S.Si., D.E.A., Ph.D., selaku Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung. 7) Ibu, Bapak tersayang yang selalu memberikan dukungan baik moril maupun materil dalam menyelesaikan skripsi ini serta adik David dan Dito yang selalu memberikan canda tawa di sela-sela penulisan skripsi ini. 8) Dhanil Ajitama penyemangat dan motivator dalam menyelesaikan skripsi ini. 9) Sahabat tersayang Sisca A, Lena, Widya Ast, Aulianda P, Rifa RP, Dimas RS, Efrizal, Shela M, Nina D, Galuh ISP, Hanifah S, Para Pejuang (Tiyas, Nafisa) dan Anak Bawang (Della, Lia, Chaterine) Karina, Eka, Yucky, Heni, Shintia, Dafri, Bang Gery, Bang Yefta, teman-teman angkatan 2013 dan seluruh pihak yang telah membantu penulis yang tidak dapat disebutkan satu persatu, atas peran dan dukungannya dalam menyusun skripsi ini. Akhir kata, penulis menyadari bahwa skripsi ini jauh dari kesempurnaan, namun penulis berharap penelitian ini dapat berguna dan bermanfaat bagi pembaca.
Bandar Lampung, Penulis
Dita Paramitha
Mei 2017
DAFTAR ISI
Halaman DAFTAR TABEL .......................................................................................
xiii
DAFTAR GAMBAR ..................................................................................
xiv
I.
PENDAHULUAN ................................................................................ 1.1 Latar Belakang dan Masalah .......................................................... 1.2 Tujuan Penelitian ........................................................................... 1.3 Manfaat Penelitian .........................................................................
1 1 3 3
II. TINJAUAN PUSTAKA ....................................................................... 2.1 Pendugaan Area Kecil.................................................................... 2.2 Metode Empirical Bayes ................................................................ 2.3 Model Beta Binomial ..................................................................... 2.4 Pendugaan Parameter dengan Metode Momen .............................. 2.5 Karakteristik Penduga Parameter ................................................... 2.5.1 Ketakbiasan ............................................................................ 2.5.2 Varian Minimum .................................................................... 2.6 Evaluasi Mean Squared Error (MSE) ...........................................
4 4 5 7 11 12 12 13 13
III. METODOLOGI PENELITIAN ............................................................ 3.1 Waktu dan Tempat Penelitian ........................................................ 3.2 Data Penelitian ............................................................................... 3.3 Metode Penelitian ..........................................................................
16 16 16 16
IV. HASIL DAN PEMBAHASAN ........................................................... 4.1 Model Beta Binomial ..................................................................... 4.2 Pendugaan Parameter Empirical Bayes Model Beta Binomial ...... 4.3 Karakteristik Penduga Empirical Bayes (πΜπ πΈπ΅ ).............................. 4.3.1 Ketakbiasan Penduga Empirical Bayes (πΜπ πΈπ΅ ) ....................... 4.3.2 Varian Penduga Empirical Bayes(πΜπ πΈπ΅ ) ................................. 4.4 Pendugaan Parameter dengan Metode Momen .............................. 4.5 Mean Squared Error Penduga Empirical Bayes(πΜ ππΈπ΅ ) ................... 4.6 Aplikasi Pendugaan Area Kecil pada Data Keluarga Prasejahtera Tahun 2014 di Kota Bandar Lampung ..........................................
19 19 20 22 22 23 24 29
V. KESIMPULAN DAN SARAN .............................................................
38
31
5.1 Kesimpulan .................................................................................... 5.2 Saran ..............................................................................................
38 38
DAFTAR PUSTAKA .................................................................................
39
LAMPIRAN ................................................................................................
41
DAFTAR TABEL
Tabel
Halaman
1. Data Keluarga Prasejahtera Tahun 2014 di Kota Bandar Lampung ..... 32 2. Proporsi Dugaan Data Keluarga Prasejahtera Tahun 2014 di Kota Bandar Lampung ................................................................................................ 33 3. Nilai Mean Squared Error Data Keluarga Prasejahtera Tahun 2014 di Kota Bandar Lampung ................................................................................... 35
DAFTAR GAMBAR
Gambar
Halaman
1. Scatterplot antara Penduga Langsung dan Penduga Bayes................... 2. Scatterplot Mean Squared Error antara metode Langsung, Metode Jackknife Jiang dan Area specific-Jackknifeβ¦β¦β¦β¦β¦β¦β¦β¦β¦β¦..
34 36
I.
1.1
PENDAHULUAN
Latar Belakang dan Masalah
Survei merupakan salah satu cara yang digunakan untuk memperoleh suatu informasi. Penerapan sistem sampel dalam survei pada area yang kecil menyebabkan objek survei menjadi terbatas dan menyebabkan informasi yang diperoleh tidak mewakili populasi secara keseluruhan, sehingga pendugaan langsung tidak dapat menghasilkan dugaan yang teliti. Guna menghasilkan pendugaan yang lebih baik, maka digunakan metode pendugaan tidak langsung pada area kecil (Rao, 2003).
Small Area Estimation (SAE) merupakan teknik statistika yang digunakan untuk menduga parameter subpopulasi dengan ukuran sampel yang kecil dengan mengembangkan data survei dan sensus guna mengestimasi tingkat kesejahteraan atau indikator lainnya sebagai peubah yang menjadi perhatian pada domain yang lebih kecil. Biasanya objek survei jumlahnya kecil bahkan mungkin area tersebut tidak tersampling sehingga analisis yang didasarkan pada objek tersebut memiliki ketepatan yang rendah. Selain itu metode ini dapat mengestimasi karakteristik dari subpopulasi yang dikembangkan dengan menghubungkan informasi dari daerah tertentu dengan daerah lain melalui model pendekatan untuk meningkatkan efektifitas ukuran sampel yang disebut estimasi tidak langsung (Rao, 2003).
2
Berbagai metode pendugaan area kecil telah dikembangkan khususnya menyangkut metode yang berbasis model (model-based area estimation). Metode tersebut adalah penduga prediksi tak bias linier terbaik empirik atau Empirical Best Linear Unbiased Prediction (EBLUP) untuk data kontinu, bayes empirik atau Empirical Bayes (EB), dan bayes hierarkhi atau Hierarchical Bayes (HB) untuk data biner atau cacahan.
Proporsi merupakan salah satu peubah respons yang menjadi perhatian dalam SAE yang didapat dari hasil survei data cacahan yaitu banyaknya pengamatan dibagi
dengan
jumlah
keberhasilan
dari
pengamatan
tersebut,
dengan
mengasumsikan pengamatannya menyebar binomial. Dalam pendugaan Bayes terdapat dua jenis informasi yaitu informasi prior diperoleh dari sebaran prior dan informasi posterior dari hasil survei. Untuk peubah Binomial, sebaran prior yang dapat dipilih adalah sebaran Beta. Sehingga pada penelitian ini model yang digunakan adalah model Beta-Binomial.
Kebaikan suatu penduga dapat dievaluasi melalui sifat tak bias dan varian minimum. Karena penduga Bayes biasanya bersifat bias (Bolstad, 2007), maka dalam penelitian ini kualitas penduga EB yang diperoleh akan dievaluasi melalui kriteria Mean Squared Error (MSE). MSE merupakan suatu besaran untuk mengukur keragaman penduga area kecil. Beberapa penelitian yang membahas tentang metode pendugaan MSE adalah Prasad dan Rao (1990), Wan (1999), Chen (2001), Jiang et al (2002), Rao (2003), serta Chen dan Lahiri (2008). Pada penelitian ini peneliti tertarik untuk mengkaji MSE dengan membandingkan metode Jackknife Jiang et al (2002) dan Area-spesifik Jackknife.
3
1.2
Tujuan Penelitian
Penelitian ini bertujuan untuk mengkaji karakteristik penduga Empirical Bayes dengan mengevaluasi Mean Squared Error menggunakan metode Jackknife Jiang dan Area-spesific Jackknife baik secara teori maupun empiris menggunakan data Keluarga Prasejahtera tahun 2014 di Kota Bandar Lampung.
1.3
Manfaat Penelitian
Manfaat yang diperoleh dari penelitian ini adalah memberikan informasi tentang karakteristik penduga Empirical Bayes melalui evaluasi Mean Squared Error menggunakan metode Jackknife Jiang dan Area-spesific Jackknife pada pendugaan area kecil dengan model Beta-Binomial.
II. TINJAUAN PUSTAKA
2.1
Pendugaan Area Kecil
Small Area Estimation (SAE) adalah salah satu teknik statistik yang digunakan untuk menduga parameter subpopulasi dengan ukuran sampel yang relatif kecil. Teknik ini mengembangkan data survei dan sensus untuk mengestimasi tingkat kesejahteraan atau indikator lainnya untuk unit geografis seperti kecamatan atau pedesaan. Terdapat dua masalah pokok dalam pendugaan area kecil. Masalah pertama adalah bagaimana menghasilkan suatu dugaan parameter yang cukup baik untuk ukuran sampel kecil pada suatu domain. Kedua, bagaimana menduga mean Squared error (MSE) dari dugaan parameter tersebut. Kedua masalah pokok tersebut dapat diatasi dengan cara βmeminjam informasiβ dari dalam area, luar area maupun dari luar survei (Pfefferman, 2002).
SAE merupakan metode estimasi tidak langsung yang menduga area yang lebih kecil dan memberikan tingkat akurasi yang lebih baik. Model area kecil dikelompokkan menjadi dua jenis yaitu model level area dan model level unit (Rao, 2003).
5
1.Pendugaan Area Kecil Berbasis Area Pada model pendugaan area kecil berbasis area, data pendukung yang tersedia hanya sampai level area. Model level area menghubungkan penduga langsung pendugaan area kecil dengan data pendukung dari domain lain untuk setiap area.
2. Pendugaan Area Kecil Berbasis Unit Pada model pendugaan area kecil berbasis unit diasumsikan bahwa data variabel π penyerta unit π₯ππ =(xij1,xij2,....,xijp)T tersedia untuk setiap elemen ke-j pada area ke-i
selanjutnya variabel respon π¦ππ diasumsikan berkaitan dengan π₯ππ sehingga bentuk persamaan model area kecil berbasis level unit sebagai berikut : π π¦ππ = π₯ππ π½ + πππ + π£π ; j=1,2, . . ., m; i=1,2,. . . ., n
(2.1)
Dengan π£π merupakan pengaruh acak area, Ξ² merupakan koefisien regresi dan diasumsikan galat sama dengan 0. Namun kadang cukup dengan rata-rata populasi π₯Μ
ππ yang diketahui (Rao, 2003).
2.2
Metode Empirical Bayes
Dasar pengembangan pendekatan statistik Bayes adalah hukum Bayes yang dibuat oleh Thomas Bayes. Hukum ini diperkenalkan oleh Richard Price tahun 1763 dua tahun setelah wafatnya Thomas Bayes. Pada tahun 1774 dan 1781, Laplace memberikan analisis lebih rinci dan lebih relevan untuk statistik Bayes sekarang (Gill, 2002).
6
Bila penduga Bayes ini akan digunakan maka harus diketahui terlebih dahulu nilai parameter sebaran priornya. Namun seringkali informasi mengenai parameter prior belum diketahui. Pendekatan lain yang dapat digunakan adalah Bayes Empirik. Emperical Bayes (EB) merupakan metode dengan menggunakan inferensia dari estimasi posterior untuk menduga parameter. Pertama kali model ini diperkenalkan oleh Fay-Herriot (1979), untuk menduga rata-rata pendapatan area kecil di Amerika Serikat. Metode EB merupakan metode yang cocok digunakan dalam menangani data biner dan data cacahan pada pendugaan area kecil. Misalkan x1, x2, β¦, xn merupakan sampel acak berukuran n dari distribusi yang mempunyai fungsi kepekatan peluang berbentuk f(x1, x2, β¦, xn|ΞΈ) dan sebaran dari peubah acak ΞΈ yaitu h(ΞΈ) sebaran prior. Metode EB dalam konteks pendugaan area kecil secara ringkas sebagai berikut: 1. Mendapatkan fungsi kepekatan peluang akhir (posterior) dari x1, x2, β¦, xn dengan f(x1, x2, β¦, xn) yang didefinisikan sebagai berikut: f(X ,X ,β¦,X |ΞΈ).h(ΞΈ)
f(x1, x2, β¦, xn|ΞΈ) = β« f(X 1,X 2,β¦,X n|ΞΈ).h(ΞΈ)dΞΈ 1
2
(2.2)
n
2. Menduga parameter model dari fungsi kepekatan peluang marginal. 3. Menggunakan fungsi kepekatan peluang akhir (posterior) dugaan untuk membuat inferensi parameter area kecil yang menjadi perhatian. (Kismiantini, 2010) Pendugaan langsung melalui pendekatan Bayes adalah menganggap parameter pi merupakan peubah yang memiliki distribusi tertentu. Dalam pendugaan Bayes terdapat dua jenis informasi yaitu informasi prior diperoleh dari sebaran prior dan informasi posterior dari hasil survei. Untuk peubah Binomial, sebaran prior yang digunakan adalah sebaran Beta atau Logit Normal (Rumiati, 2012).
7
2.3
Model Beta Binomial
Distribusi Beta digunakan untuk menjelaskan distribusi dari sebuah nilai probabilitas yang tidak diketahui sebagai distribusi prior pada sebuah parameter probabilitas sukses dalam distribusi Binomial (Bolstad, 2007). Dalam hal ini dianggap bahwa probabilitas sukses dapat menjalani setiap nilai real antara 0 dan 1, sehingga distribusi prior tidak diskrit melainkan kontinu (Subanar, 2013).
Model ini merupakan model yang berawal dari model Bernoulli dengan model peluang untuk data biner yang dinyatakan dengan : yi| pi ~ Binomial (ni, pi) = 0, . . ., ni, 0 < pi < 1, i = 1, . . ., m
(2.3)
dengan model dasar yi| pi ~ Bernoulli (pi) atau yi| pi ~ Binomial (ni, pi)
(2.4)
pi ~ Beta (Ξ±, Ξ²)
(2.5)
Ξ± > 0, Ξ² > 0
Beta (Ξ±, Ξ²) menyatakan sebaran beta dengan parameter Ξ± dan Ξ² serta fungsi kepekatan untuk pi adalah Ξ(πΌ+π½)
f(pi |Ξ±, Ξ²) = Ξ(πΌ)Ξ(π½) ππ πΌβ1 1 β ππ π½β1 ; πΌ > 0, π½ > 0 untuk 0 β€ pi β€ 1
(2.6)
(Hogg dan Craig, 1995).
Model yang digunakan dalam penelitian ini adalah model berbasis area dua level. Model dua level tersebut dapat dituliskan sebagai berikut: π¦π = ππ + ππ
(2.7)
8
dengan: π¦π = penduga langsung area ke-i ππ = pengaruh acak di dalam area ππ = Parameter yang ingin diduga dimana: Level 1: yi| pi ~ Binomial (ni, pi) Level 2: pi ~ Beta (Ξ±,Ξ²), i= 1,2,3,...,m
(2.8)
Dengan yi menyatakan banyaknya pengamatan suatu kasus pada area ke-i, ni adalah banyaknya ulangan keberhasilan suatu kasus pada area ke-i, pi adalah peluang keberhasilan suatu kasus pada area ke-i yang tidak diketahui dan m menyatakan jumlah area, sedangkan Ξ± dan Ξ² merupakan parameter yang belum diketahui. Level pertama diasumsikan bahwa yi ~ Binomial (ni, pi) dan level kedua diasumsikan bahwa pi ~ Beta (Ξ±,Ξ²) (Kismiantini, 2007).
Diketahui bahwa pi ~ Binomial (ni, pi) mempunyai fungsi kepekatan sebagai berikut : ππ f(yi |pi) = ( ) ππ π¦π (1 β ππ)ππβπ¦π π¦π Berdasarkan fungsi kepekatan ππ dan fungsi kepekatan yi maka : π(ππ |π¦π ) =
π(ππ ; π¦π ) π(π¦π ) π
=
π€(πΌ+π½)
(π¦π ) π π¦π +πΌβ1(1βππ )ππ βπ¦π +π½β1 π π€(πΌ)π€(π½) π ππ
π€(πΌ+π½) π€(π¦π +πΌ)π€(ππ βπ¦π +π½) π€(πΌ+π+π½) π π€(πΌ)π€(π½)
(π¦ )
=
ππ π¦π +πΌβ1 (1βππ )ππ βπ¦π +π½β1 π€(π¦+πΌ)π€(ππ βπ¦π +π½) π€(πΌ+ππ +π½)
(2.9)
9
π€(πΌ+π +π½)
= π€(π¦ +πΌ)π€(ππ βπ¦ +π½) ππ π¦π +πΌβ1 (1 β ππ )ππβπ¦π +π½β1 π
π
π
= π΅((π¦π + πΌ), (ππ β π¦π + π½))
(2.10)
Menurut Berger (1990) nilai ekspektasi dan varian dari distribusi Beta adalah πΌ
πΌπ½
πΈ(π) = πΌ+π½ dan πππ(π) = (πΌ+π½+1)(πΌ+π½)2
Diketahui bahwa distribusi dari p
adalah fungsi Beta ((π¦π +Ξ±),( ππ -π¦π +Ξ²)). Sehingga diperoleh nilai ekspektasi dari distribusi posteriornya adalah:
πΈ(ππ |π¦π ) =
π¦π + πΌ π¦π + πΌ + ππ β π¦π + π½ π¦ +πΌ
π = πΌ+π +π½
(2.11)
π
dan varian dari distribusi posterior adalah
πππ(ππ |π¦π ) =
(π¦π + πΌ)(ππ β π¦π + π½) (π¦π + πΌ + ππ β π¦π + π½ + 1)(π¦π + πΌ + ππ β π¦π + π½)2 (π¦ +πΌ)(π βπ¦ +π½)
π π = (πΌ+π π+π½+1)(πΌ+π +π½)2 π
(2.12)
π
Oleh karena itu penduga Bayes bagi pi adalah rata-rata dari posteriornya, 1
πΜππ΅ = πΈ[ππ |π¦π ] = β« ππ . π(ππ |π¦π )ππ 0
1
= β« ππ 0
=
π€(πΌ + ππ + π½) π π¦π +πΌβ1 (1 β ππ )ππ βπ¦π +π½β1 πππ π€(π¦π + πΌ)π€(ππ β π¦π + π½) π
1 π€(πΌ + ππ + π½) β« ππ π¦π +πΌ (1 β ππ )ππ βπ¦π +π½β1 πππ π€(π¦π + πΌ)π€(ππ β π¦π + π½) β0 π΅(π¦π +πΌ+1,ππ βπ¦π +π½)
10
π€(πΌ+π +π½)
= π€(π¦ +πΌ)π€(ππ βπ¦ +π½) π
π
π
π€(π¦π +πΌ+1)π€(ππ βπ¦π +π½) π€(π¦π +πΌ+1+ππ βπ¦π +π½)
=
π€(πΌ + ππ + π½) π€(π¦π + πΌ + 1)π€(ππ β π¦π + π½) π€(π¦π + πΌ)π€(ππ β π¦π + π½) π€(πΌ + ππ + π½ + 1)
=
π€(πΌ + ππ + π½)π€(π¦π + πΌ + 1) π€(π¦π + πΌ)π€(πΌ + ππ + π½ + 1)
=
(πΌ + ππ + π½ β 1)! (π¦π + πΌ)! (π¦π + πΌ β 1)! (πΌ + ππ + π½)!
=
(πΌ + ππ + π½ β 1)! (π¦π + πΌ)(π¦π + πΌ β 1)! (π¦π + πΌ β 1)! (πΌ + ππ + π½)(πΌ + ππ + π½ β 1)!
=
π¦π +πΌ
(2.13)
πΌ+ππ +π½
(Mayasari, 2016)
Dengan ragam posterior bagi pi adalah :
π(ππ|π¦π, πΌ, π½) =
(π¦π+πΌ)(ππβπ¦π+π½) (ππ+πΌ+π½+1)(ππ+πΌ+π½)2
(2.14)
Sebaran penghubung f(pi, Ξ±, Ξ²) yang merupakan prior pada sebaran posterior tersebut, f(pi | yi, Ξ±, Ξ²) mempunyai bentuk yang sama dengan sebaran priornya. Dari sebaran penghubung tersebut, maka digunakan model Beta-Binomial dengan sebaran peluang marginal sebagai berikut : ππ Ξ(πΌ+π¦π)Ξ(π½+ππβπ¦π) Ξ(πΌ+π½) f(yi | ni, Ξ±, Ξ²) = ( ) Ξ(Ξ±+Ξ²+ni) Ξ(πΌ)Ξ(π½) π¦π ππ Ξ(πΌ+π¦π,π½+ππβπ¦π) =( ) Ξ(πΌ,π½) π¦π
(2.15)
Menurut Lohr dan Rao (2009) jika Ξ± dan Ξ² tidak diketahui, maka πΜ ππ΅ dapat dievaluasi dengan pendugaan πΜ ππΈπ΅ dimana πΌΜ dan π½Μ dihitung dari data. Μ π¦ +πΌ
π πΜ ππΈπ΅ = πΌΜ+π+π½ Μ
(2.16)
11
Pendugaan dan inferensi pada pendekatan EB didasarkan pada sebaran posterior yang parameternya diduga dari data. Salah satu metode yang dapat digunakan untuk menduga parameter adalah Metode Momen.
2.4
Pendugaan Parameter dengan Metode Momen
Secara umum pendugaan parameter digolongkan menjadi dua yaitu pendugaan titik dan pendugaan selang. Beberapa metode pendugaan titik yang digunakan untuk menduga parameter diantaranya adalah metode kuadrat terkecil, metode MLE (Maximum Likelihood Estimation) dan metode momen. Metode kuadrat terkecil prinsip kerjanya adalah meminimumkan jumlah kuadrat penyimpangan atau error nilai-nilai observasi terhadap rata-ratanya. Selanjutnya metode MLE merupakan suatu metode pendugaan parameter yang memaksimalkan fungsi likelihood. Sedangkan metode momen merupakan metode pendugaan dengan cara menyamakan momen ke-k sampel dengan momen ke-k populasi dan menyelesaikan sistem persamaan yang dihasilkan secara bersama atau simultan yang ditulis sebagai berikut : 1
π1 = πΈ(π1 )
1
π2 = πΈ(π 2 )
m1 = π βππ=1 ππ1 , m2 = π βππ=1 ππ2 , .. . 1
mk = π βππ=1 πππ ,
.. . ππ = πΈ(π π )
(2.17)
12
Momen populasi ππ sering ditulis sebagai fungsi dari ΞΈ1, ΞΈ2, . . ., ΞΈk, yaitu ππ (ΞΈ1, ΞΈ2, . . ., ΞΈk). Metode momen penduga (πΜ1, πΜ2, . . ., πΜk) dari (ΞΈ1, ΞΈ2, . . ., ΞΈk) di dapat dengan menyelesaikan sistem persamaan untuk (ΞΈ1, ΞΈ2, . . ., ΞΈk) dalam notasi (m1, m2, . . ., mk) sebagai berikut mβj = πβ²π (πΜ1, πΜ2, . . ., πΜk)j = 1, 2, . . . k m1 = π1 = (ΞΈ1, ΞΈ2, . . ., ΞΈk) m2 = π2 = (ΞΈ1, ΞΈ2, . . ., ΞΈk) .. .
.. . mk = ππ = (ΞΈ1, ΞΈ2, . . ., ΞΈk)
(2.18) (Berger, 1990).
Metode momen yang diciptakan oleh Karl Pearson pada tahun 1800 merupakan metode tertua dalam menentukan estimator titik. Metode momen memiliki keunggulan lebih mudah dalam menurunkan rumus penduga parameternya, namun maksimum likelihood juga dikenal memiliki penduga yang efisien dari sekian banyak penduga yang ada, walaupun kadang tidak mudah untuk mencari bentuk rumus penduganya.
2.5
Karakteristik Penduga Parameter
Estimator yang baik adalah yang memenuhi sifat tertentu, diantaranya sifat tak bias dan varian minimum.
2.5.1
Ketakbiasan
Sifat penduga yang baik salah satunya adalah sifat takbias. Suatu penduga dikatakan takbias apabila asumsi yang telah ditentukan terpenuhi, yaitu misalkan
13
Y1, Y2, Y3 merupakan sampel acak dari fungsi kepekatan peluang kontinu ππ¦ (π¦; π), dimana ΞΈ merupakan parameter yang tidak diketahui. Penduga πΜ = [β(π1 , π2 , β¦ , ππ )] dikatakan takbias bagi ΞΈ, jika πΈ(πΜ) = π.
2.5.2
Varian Minimum
Selain sifat ketakbiasan, penduga parameter dikatakan baik apabila memenuhi sifat penduga ragam minimum. Bila π merupakan penduga bagi g(ΞΈ), maka ΞΈ1 dikatakan sebagai penduga beragam terkecil, jika 2 πΞΈ1 β€ πΞΈ2
(2.19)
dimana ΞΈ merupakan sembarang penduga bagi g(ΞΈ) (Hogg dan Craig, 1995).
2.6
Evaluasi Mean Squared Error (MSE)
Jika suatu penduga merupakan penduga yang tak bias, maka nilai varian ΞΈ akan sama dengan MSE ΞΈ. Pada pendugaan EB penduga yang dihasilkan bersifat bias sehingga performa dari penduga dievaluasi melalui MSE. Jika πΜ ππΈπ΅ merupakan sebuah estimator untuk p, maka MSE tidak bersyarat dari πΜππΈπ΅ adalah:
dimana
πππΈ(πΜ ππΈπ΅ ) = πππΈ(πΜ ππ΅ ) + πΈ(πΜ ππΈπ΅ β πΜ ππ΅ )2
(2.20)
πππΈ(πΜ ππ΅ ) = πΈ{π£ππ(π|π¦)}
(2.21) (Lohr dan Rao, 2009).
14
Metode pendugaan MSE lainnya adalah metode Jackknife yang pertama kali diperkenalkan oleh Quenouille pada tahun 1949 dengan tujuan mengoreksi bias dugaan. Metode ini merupakan metode resampling dengan prosedurnya adalah menghapus area satu persatu. Misalkan y1, y2, β¦ , ym contoh acak berukuran m area, kemudian y1 dihilangkan dan dilakukan perhitungan untuk memperoleh sebuah pendugaan. Operasi ini dilakukan sebanyak m kali dengan menghilangkan satu area pada masing-masing tahap.
Metode Jackknife lainnya adalah Rao (2003) yang dikenal sebagai metode Areaspecific Jackknife yang merupakan pengembangan dari metode Jackknife Jiang et al (2002). Metode ini menggunakan ragam dari sebaran posterior sebagai pendekatan bagi nilai dugaan MSE. Dari segi perhitungan, metode ini lebih mudah dan sederhana karena tidak perlu mencari nilai harapan dari ragam sebaran posterior yang secara analitik terkadang sulit untuk dilakukan. MSE dari (πΜ ππ΅ ) yaitu: πππΈ(πΜ ππ΅ ) = E{Var (ΞΈi | yi, )} = ki(Ο)
(2.22)
diperoleh secara integrasi numerik dengan menggunakan sebaran marjinal dari yi Rao menggunakan gi sebagai pendekatan bagi ki, yaitu gi (πΜ, yi) = Var(ΞΈi | yi, πΜ). Penduga MSE metode Area-specific Jackknife yaitu: Μ A1i + π Μ 2i; i = 1, 2, . . ., m MSEASi = π Μ A1i (yi) = gi (πΜ, yi) β βπ π Μ (βπ) , π¦π ) β ππ (πΜ, yi)} πβ π {ππ (π Μ πΈπ΅ Μ πΈπ΅ 2 Μ 2i = πβ1 βπ π π=1(π π(βπ) β π π ) π
(2.23)
15
Metode Jackknife Jiang (2002) digunakan untuk menduga M1i dan M2i secara terpisah pada iterasi ke-j dari sisa area (m-1) dihitung dengan menduga πΜ(-j) pada Μ 1i sama dengan penduga ki(π) yaitu sebagai berikut : π dimana kuantitas π 2 Μπ΅ Μ πΈπ΅ Μ π΅ 2 MSE(πΜ πΈπ΅ π ) = πΈ(π π β ππ ) + πΈ(π π β π π )
= ki(π) + π2π = π1π + π2π Μ 1i = ki(πΜ) β πβ1 βπ π Μ (βj) ) β ki(πΜ)} π=1{k i (Ο π = ki(πΜ) β
πβ1 π
{k i (Ο Μ (βj) ) β ki(πΜ)}
Μ πΈπ΅ Μ πΈπ΅ 2 Μ 2i = πβ1 βπ π π=1(π π(βπ) β π π ) π
(2.24)
Μ Μ Jiang et al (2002) menunjukan bahwa penduga Jackknife MSE(πΜ πΈπ΅ π ) = π1π + π2π mendekati ketakbiasan (Lohr & Rao, 2009).
III. METODE PENELITIAN
3.1.
Waktu dan Tempat Penelitian
Penelitian ini dilakukan pada semester genap tahun akademik 2016/2017, bertempat di Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Lampung, Lampung.
3.2. Data Penelitian
Data yang digunakan dalam penelitian ini merupakan data sekunder, yaitu data Keluarga Prasejahtera tahun 2014 di Kota Bandar Lampung yang diperoleh dari Bandar Lampung Dalam Angka, Badan Pusat Statistik (BPS) Kota Bandar Lampung.
3.3. Metode Penelitian
Penelitian ini menetapkan model dua tahap distribusi Beta Binomial. Level pertama diasumsikan bahwa yi ~ Binomial (ni, pi) dan level kedua diasumsikan bahwa pi ~ Beta (Ξ±,Ξ²). Dengan : yi = banyaknya pengamatan dalam suatu kasus pada area ke-i ni = banyaknya ulangan keberhasilan suatu kasus pada area ke-i
17
pi = peluang keberhasilan suatu kasus pada area ke-i Ξ±, Ξ² = parameter yang akan diduga (biasanya dapat diketahui melalui data)
Model dua level ini dapat ditulis sebagai model linear campuran Yi= pi + ei Dengan menentukan fungsi kepekatan peluang akhir (posterior) dari model linear campuran di atas untuk menduga parameter distribusi Binomial dengan metode EB seperti pada persamaan (2.16). Pendugaan parameter dari penduga EB dilakukan menggunakan Metode Momen dengan persamaan (2.17) dan mengevaluasi MSE pada penduga EB dengan metode Jackknife Jiang et al (2002) dan Area-spesific Jackknife seperti pada persamaan (2.23) dan (2.24).
Langkah-langkah dalam mengevaluasi MSE adalah sebagai berikut : 1.
Menentukan penduga proporsi πΜ π =
π¦π ππ
dari data Keluarga Prasejahtera tahun
2014 di Kota Bandar Lampung 2.
Menentukan dugaan Mean Squared Error (MSE) penduga langsung
3.
Menentukan parameter penduga πΌΜ dan π½Μ dengan metode momen
4.
Menentukan penduga Bayes empirik πΜ ππΈπ΅
5.
Menghitung nilai MSE dengan membandingkan metode Jackknife Jiang et al (2002) dan Area-spesific Jackknife ο·
Μ A1i (yi) = gi (πΌΜ,π½Μ ,, yi) β βπ π Μβπ , π½Μβπ , π¦π ) β ππ (πΌΜ, π½Μ , yi)} dengan gi πβ π {ππ (πΌ (πΌΜ,π½Μ ,, yi) = Var (pi | yi, πΌΜ,π½Μ ) untuk area-spesific Jackknife
18
ο·
Μ 1i = ki(πΌΜ,π½Μ ) β πβ1 βπ π Μβπ , π½Μβπ ) β k i (πΌΜ, π½Μ )} dengan π=1{k i (πΌ π ki (πΌΜ,π½Μ ) = E{Var (pi | yi, πΌΜ,π½Μ )} untuk Jackknife Jiang (2002)
ο·
π΅ MSE πΜ ππ΅ = ππ (πΜπ , πΌΜ,π½Μ ), πΜ π,βπ = ππ (πΜ π , πΌΜβπ ,π½Μβπ ) dan πΈπ΅ πΈπ΅ 2 Μ 2i = πβ1 βπ π π=1(πΜ π(βπ) β πΜ π ) π
ο·
mencari πΌΜβπ dan π½Μβπ yang merupakan penduga momen yang diperoleh dari data ke-j yang dihapus dan dihitung secara simultan
ο·
Μ 1i + π Μ 2i; i = 1, 2, . . ., m Menentukan galat baku, yaitu MSE = π
6. Membandingkan nilai MSE metode Jackknife Jiang et al (2002) dan Areaspesific Jackknife dimana proses hitungan dilakukan dengan R i386.
V. KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil kajian secara teori diperoleh kesimpulan bahwa pendugaan Mean Squared Error metode Jackknife Jiang et al (2002) menggunakan pendekatan ki sebagai nilai harapan dari ragam posteriornya sedangkan Areaspesific Jackknife menggunakan pendekatan gi sebagai ragam posteriornya. Pada data proporsi keluarga prasejahtera di Kota Bandar Lampung tahun 2014 Area specific-Jackknife menghasilkan nilai Mean Squared Error yang mendekati nilai Mean Squared Error penduga langsung dibandingkan metode Jackknife Jiang et al (2002).
5.2 Saran
Pada pendugaan area kecil level kecamatan, data yang tersedia memenuhi untuk dilakukan pendugaan secara langsung sehingga nilai Mean Squared Error relaif kecil. Untuk penelitian selanjutnya disarankan menggunakan level area yang memiliki informasi yang terbatas.
DAFTAR PUSTAKA
BadanPusat Statistik. 2015. Bandar Lampung DalamAngka 2014. BPS Kota Bandar Lampung. Bandar Lampung. Berger, C., 1990.Statistical Inference. California: Wadsworth and Brooks/Cole. Bolstad, W.M. 2007. Introduction to Bayesian Statistics Second Edition. America: A John Wiley & Sons.
Chen S. 2001. Empirical Best Prediction and Hierarchical Bayes Methods in Small Area Estimation. [disertation]. Nebraska: The Graduate College, University of Nebraska.
Chen S, Lahiri P. 2008. On Mean Squared Prediction Error Estimation in Small Area Estimation Problems. Communications in Statistics 37:1792-1798.
Fay, R.E., & Herriot, R.A. 1979. Estimates of income for small places: an application of James-Stein procedures to census data. Journal of the American StatisticalAssociation, 74 (366), 269-277.
Giil, J. 2002. Bayesian Methods: A social and Behavioral Sciences Approach. Chapman and Hall, Boca Raton.
Hogg, R.V., dan Craig, A.T. 1995. Introduction to Mathematical Statistics, Fifth Edition. New Jersey: Pretice-Hall.
Jiang J., Lahiri P.,dan Wan S.M. 2002. A Unified Jackknife Theory for Empirical Best Prediction with M-estimation. The Annals of Statistics 30(6):1782-1810.
Kismiantini. 2010. Pendugaan Statistik Area Kecil Berbasis Model PoissonGamma.Seminar NasionalPenelitian, PendidikandanPenerapanMIPA.Yogyakarta : FMIPA UniversitasYoyakarta.
Lohr, S.L., dan Rao, J.N.K. 2009. Jackknife Estimation of Mean Squared Error of Small Area Predictors in Nonlinear Mixed Models. Journal of Biometrika. 96, 457-468.
Martinez, E.Z., Achcar, J.A., dan Aragon, D.C. 2015. Parameter estimation of the beta-binomial distribution: anapplication using the SAS software. Cienciae Natura,Vol 37 n. 4. P 12-19.
Mayasari, D. 2016. Karakteristik Penduga Empirical Bayes Pada Pendugaan Area Kecil dengan Model Beta Binomial. Skripsi. Universitas Lampung. Lampung.
Pfefferman D., (2002). Small Area Estimation - New developments and directions, International Statistical Review, Vol70, 1, 125-143. Htpp://www.ibge.gov.br/ amostragem/download/trabalhodanny.doc. [24 Oktober 2016]
Prasad, N.G.N., and Rao, J.N.K. 1990. The Estimation of Mean Square Errors of.Small Area Estimators. Journal of American Statistical Association. 85: 163-171.
Rao, J.N.K. 2003. Small Area Estimation. New York: John Willey and Sons.
Rumiati,A.T. 2012. Model Bayes Untuk Pendugaan Area Kecil Dengan Penarikan Contoh Berpeluang Tidak Sama Pada Kasus Respon Binomial dan Multinomial. Disertasi. Bogor: Institut Pertanian Bogor
Subanar. 2013. Statistika MatematikaProbabilitas, AsimtotisdalamStatistika. Yogyakarta: Graha Ilmu.
Distribusi,
dan
Wan, S.M. 1999. Jackknife Methods in Small Area Estimation and Related Problems. [disertation]. Nebraska: The Graduate College, University of Nebraska