ESTIMASI PENGELUARAN PER KAPITA DI KABUPATEN REMBANG DENGAN PENDEKATAN SAE-NONPARAMETRIK Iswahyudi Joko Suprayitno1, Moh Yamin Darsyah2, Budiharto3 1 Program
Studi Pendidikan Matematika, UNIMUS Studi Statistika, UNIMUS 3 FKIP Universitas Terbuka
2 Program
[email protected] Abstrak
Small Area Estimation (SAE) merupakan suatu teknik statistika untuk menduga parameterparameter subpopulasi yang ukuran sampel nya kecil. Teknik pendugaan ini “borrowing information” memanfaatkan data dari domain besar (seperti data sensus data susenas) untuk menduga variabel yang menjadi perhatian pada domain yang lebih kecil yang selanjutnya dikenal pendugaan tidak langsung. Pendugaan langsung tidak mampu memberikan ketelitian yang cukup bila ukuran sampel dalam area kecil, sehingga statistik yang dihasilkan akan memiliki varian yang besar atau bahkan menghasilkan pendugaan yang bias. Penelitian SAE diaplikasikan untuk memetakan Pengeluaran Per kapita di Kabupaten Rembang dimana variabel kepadatan penduduk berperan signifikan dalam mempengaruhi pengeluaran per kapita daerah. Kecamatan Rembang merupakan kecamatan dengan pengeluaran per kapita tertinggi di Kabupaten Rembang sedangkan kecamatan yang memiliki pengeluaran per kapita terendah di Kecamatan Sumber. Kata kunci : Small Area Estimation, Nonparametrik, Pengeluaran Per kapita Small Area Estmation (SAE) I. Pendahuluan merupakan suatu teknik statistika untuk Suatu area disebut area kecil apabila menduga parameter- parameter subpopulasi sampel yang diambil pada area tersebut yang ukuram sampel nya kecil. Teknik tidak mencukupi untuk melakukan pendugaan ini memanfaatkan data dari pendugaan langsung dengan hasil dugaan domain besar seperti data sensus dan data yang akurat (Rao,2003). Dewasa ini susenas untuk menduga variabel yang pendugaan area kecil menjadi sangat penting menjadi perhatian pada domain yang lebih dalam analisis data survei karena adanya kecil. Pendugaan sederhana pada area kecil peningkatan permintaan untuk menghasilkan yang didasarkan pada penerapan model dugaan parameter yang cukup akurat dengan desain penarikan contoh (design- based) ukuran sampel kecil. disebut sebagai pendugaan langsung (direct 34
estimation) dimana pendugaan langsung
Berbagai penelitian yang berkaitan dengan
tidak mampu memberikan ketelitian yang
pendugaan area kecil dengan pendekatan
cukup bila ukuran sampel dalam area itu
nonparametrik antara lain Darsyah (2013)
kecil sehingga statistik yang dihasilkan akan
menggunakan small area estimation dengan
memiliki varian yang besar atau bahkan
metode kernel-bootstrap, Anwar (2008)
pendugaan tidak dapat dilakukan karena
melakukan small area estimation dengan
berakibat estimasi yang bias (Rao, 2003).
metode kernel learning, Indahwati, Sadik
Sebagai alternatif teknik pendugaan untuk
meningkatkan
sampel
dan
dikembangkan langsung
efektivitas
menurunkan teknik
(inderct
ukuran
eror
pendugaan estimation)
dan Nurmasari area
(2008) melakukan small
estimation
dengan
pendekatan
maka
pemulusan
kernel,
Opsmer
tak
melakukan
small
area
untuk
menggunakan
(2005) estimation
penalized
spline,
melakukan pendugaan pada area kecil
Mukhopadhay dan Maiti (2004) melakukan
dengan ketelitian yang cukup. Teknik
small area estimation dengan pendekatan
pendugaan ini dilakukan melalui suatu
nonparametrik.
model yang menghubungkan area terkait
Penelitian SAE diaplikasikan untuk
melalui penggunaan informasi tambahan
mengestimasi pengeluaran per kapita di
atau variabel penyerta (model based) inilah
Kabupaten Rembang dengan pendekatan
yang selanjutnya dikenal dengan konsep
noparametrik dengan menggunakan fungsi
SAE.
kernel-
bootstrap.
Kabupaten
Rembang
Terdapat dua masalah pokok dalam
merupakan salah satu daerah tertinggal di
pendugaan area kecil. Masalah pertama
Propinsi Jawa Tengah maka dibutuhkan
adalah
kajian
bagaimana
menghasilkan
suatu
strategis
dan
mendalam
untuk
dugaan yang akurat dengan ukuran sampel
mengetahui informasi yang akurat sehingga
kecil pada suatu domain atau area kecil.
pembangunan daerah tepat sasaran.
Masalah kedua yaitu bagaimana menduga
Dalam
kebanyakan
aplikasi
Mean Square Error (MSE). Solusi untuk
pendugaan area kecil, digunakan asumsi
masalah tersebut adalah dengan”meminjam
model linier campuran dan pendugaannya
informasi” baik dari dalam area, luar area,
sensitif terhadap asumsi ini. Jika asumsi
maupu lauar survei.
kelinieran antara rataan area kecil dan 35
variabel penyerta tidak terpenuhi, maka
Mukhopadhayay
dan
“meminjam kekuatan” dari area lain dengan
menggunakan model
Maiti
(2004)
menggunakan model linier tidak tepat. 𝑦𝑖 = 𝜃𝑖 + 𝜖𝑖
(1)
𝜃𝑖 = 𝑚(𝑥𝑖 ) + 𝑢𝑖
(2)
Dimana i = 1,2,....,m menyatakan
acak yang berdistribusi independen dan
banyaknya area kecil. Fungsi m(.) adalah
identik dengan 𝐸(𝑢𝑖 ) = 0 dan 𝑣𝑎𝑟(𝑢𝑖 ) =
fungsi mulus (smoothing function) yang
𝜎𝑢2 , dan 𝜖𝑖 berdistribusi independen dan
mendefinisikan relasi antara x dan y. 𝜃𝑖
identik dengan 𝐸(𝜖𝑖 ) = 0 dan 𝑣𝑎𝑟(𝜖𝑖 ) = 𝐷𝑖 ,
adalah rataan area kecil yang tidak teramati,
dengan asumsi 𝐷𝑖 diketahui. Substitusi
𝑦𝑖 adalah pendugaan langsung dari rataan
persamaan (1) dan (2) akan menghasilkan
area kecil yang tersampel, 𝑢𝑖 galat peubah
persamaan berikut:
𝑦 = 𝑚(𝑥𝑖 ) + 𝑢 + 𝜖 Untuk
𝑚(𝑥𝑖 )
menduga
Mukhopadhayay 𝑚 ̂ ℎ (𝑥𝑖 ) =
(3)
dan
Maiti
menggunakan pendugaan kernel Nadaraya-
,
Watson
(2004)
∑𝑖 𝐾ℎ (𝑥−𝑥𝑖 )𝑦𝑖
(4)
∑𝑖 𝐾ℎ (𝑥−𝑥𝑖 )
Dimana 𝐾ℎ (. ) adalah fungsi kernel dengan bandwidth
h
dan
iii. ∫ 𝐾(𝑎)𝜕𝑎 = 1
1
Fungsi kernel yang sering dipakai
𝐾ℎ (𝑢) = ℎ 𝐾(𝑢⁄ℎ) adalah
dengan 𝐾ℎ (. ) memenuhi:
fungsi
normal
dan
besarnya
i. 𝐾(. ) simetri
bandwidht dipilih ℎ∞𝑛1/5 (silverman, 1986).
ii. 𝐾(. ) terbatas dan kontinu pada daerah
Penduga di atas linier terhadap 𝑦𝑖 , dan dapat ditulis sebagai
hasil x 1
𝑚 ̂ ℎ (𝑥𝑖 ) = 𝑚 ∑𝑚 𝑖=1 𝑊ℎ𝑖 (𝑥)𝑦𝑖 Dimana 𝑊ℎ𝑖 (𝑥) = 1⁄
(5)
𝐾ℎ (𝑥−𝑥𝑖 )
𝑚 ∑𝑖 𝐾ℎ (𝑥−𝑥𝑖 )
Berdasarkan definisi di atas, penduga terbaik dari rataan area kecil 𝜃𝑖 adalah 36
𝜃̂𝑖 = 𝛾̂𝑖 𝑦𝑖 + (1 − 𝛾̂𝑖 )𝑚 ̂ (𝑥𝑖 )
(6)
̂2 𝜎
𝑢 Dimana 𝛾̂𝑖 = 𝜎̂2 +𝐷 dan 𝜎̂𝑢2 merupakan penduga dari 𝜎𝑢2 . 𝑢
𝑖
1
𝜎̂𝑢2 = max {0, 𝑚−1 ∑𝑚 ̂ (𝑥𝑖 )]2 − 𝐷} 𝑖=1 𝑊ℎ𝑖 (𝑥)[𝑦𝑖 − 𝑚
(7)
Untuk MSE pendugaan area kecil berikut: 2
̂𝑢 𝐷𝜎 𝑀𝑆𝐸(𝜃̂𝑖 ) = 𝜎̂2 +𝐷 + (1 − 𝛾)2 𝑚𝑠𝑒[𝑚 ̂ ℎ (𝑥𝑖 )] + 2𝐷2 (𝜎̂𝑢2 + 𝐷)−3 𝑚𝑠𝑒(𝜎̂𝑢2 )
(8)
𝑢
Namun demikian pendugaan MSE
jadinya, maka untuk pendugaan MSE bisa
diatas mempunyai kelemahan karena ada
dilakukan dengan pendekatan bootstrap
informasi yang terputus dan tidak ada rumus
berikut persamaannya
2
1 ∗(𝑗) ∗(𝑗) 𝑚𝑠𝑒 ∗ (𝜃̂𝑖 ) = 𝐽 ∑𝐵𝑗=1(𝜃̂𝑖 − 𝜃𝑖 )
dimana
J
adalah
banyaknya
(9) ∗(𝑗)
populasi
𝜃𝑖
∗(𝑗) bootstrap, 𝜃̂𝑖 adalah penduga rataan area
adalah nilai sebenarnya rataan area
kecil ke–i dari populasi bootstrap ke-j.
kecil ke-i dari populasi bootstrap ke-j, dan II. Metode Selanjutnya
akan
dijelaskan
kernel
∑𝑖 𝐾ℎ (𝑥−𝑥𝑖 )𝑦𝑖
mengenai Kajian Model SAE, Sumber Data dan Variabel Penelitian,
∑𝑖 𝐾ℎ (𝑥−𝑥𝑖 )
Metodelogi
area
kecil
, dimana estimtor pendugaan
untuk area kecil diberikan 𝜃̂𝑖 = 𝛾̂𝑖 𝑦𝑖 +
Penelitian sebagai berikut. Model
𝑚 ̂ ℎ (𝑥𝑖 ) =
Nadaraya-Watson
(1 − 𝛾̂𝑖 )𝑚 ̂ ℎ (𝑥𝑖 ) , dengan
biasanya
̂2 𝜎
𝑢 𝛾̂𝑖 = 𝜎̂2 +𝐷 . 𝑢
𝑖
menggunakan model linier campuran dalam
Dimana
bentuk 𝑦 = 𝑋𝛽 + 𝑍𝑢 + 𝑒 , dimana 𝑋 adalah
pembobot yang didapat dari best linier
matriks peubah penyerta, 𝑍 adalah vektor
unbiased precictor (BLUP) yang merupakan
acak yang biasa dikenal sebagai pengaruh
bentuk parametrik. Jadi ada kemungkinan
area kecil, dan 𝑒 adalah vektor dari galat
untuk penduga area kecil diatas merupakan
sampel (Rao, 2003). Penduga rataan area
penduga semiparametrik karena terdapat 2
kecil di duga dengan melalui estimor best
(dua)
linier unbiased precictor (BLUP) 𝜃̂𝑖 =
nonparamtrik dan pendekatan parametrik.
𝛾𝑖 𝜃̂𝑖 + (1 − 𝛾𝑖 )𝑧𝑖𝑇 𝛽̃ . Maiti
(2004)
pendekatan
merupakan
yaitu
estimator
pendekatan
Sumber data yang digunakan dalam
Mukhopadhyay dan
menggunakan
nilai 𝛾̂𝑖
penelitian ini untuk pengeluaran per kapita
pendugaan 37
berasal dari data Survei Sosial Ekonomi
Kabupaten Rembang. Variabel penyerta
Nasional (SUSENAS) BPS Tahun 2013 dan
yang digunakan yaitu Jumlah prosentase
Rembang Dalam Angka 2014. Dimana
keluarga
variabel respon yang menjadi perhatian
keluarga pengguna Jamkesmas, kepadatan
dalam penelitian ini adalah pengeluaran per
penduduk.
nelayan,
Jumlah
prosentase
kapita pada masing–masing kecamatan di
III. Hasil Penelitian a. Sebaran Data Boxplot of Pengeluaran Per Kapita 2.7
Pengeluaran Per Kapita
2.6 2.5 2.4 2.3 2.2 2.1 2.0 1.9 1.8
Gambar 1. Boxplot Pendugaan Pengeluaran Per Kapita dengan SAE Gambar
1
menunjukan
adanya
keragaman pengeluaran per kapita pada
pencilan pendugaan yaitu Kecamatan Kota
kecamatan di Kabupaten Rembang tidak
Rembang. Lebar bagian atas dan bagian
terlalu mencolok.
bawah sama hal ini mengindikasikan bahwa
b. Uji Keragaman Spasial (Heterokedastisitas)
Gambar 2. Peta Kabupaten Rembang 38
Pengujian menggunakan
keragaman
uji
spasial
Breusch-Pagan
tahun 2014. Adanya keragaman spasial pada
(BP)
pengeluaran
per
kapita
tersebut
menghasilkan nilai BP sebesar 7,76 dengan
menunjukkan bahwa setiap kecamatan di
nilai-p (0,059) yang kurang dari taraf nyata
Kabupaten Rembang memiliki karakteristik
10%, sehingga diperoleh keputusan tolak H0
tersendiri, sehingga diperlukan pendekatan
yang berarti bahwa terdapat keragaman
lokal
spasial pada data pengeluaran per kapita
mengatasi keragaman yang terjadi pada
pada tiap kecamatan di Kabupaten Rembang
pengeluaran per kapita.
untuk
memodelkan
dan
untuk
c.Koefisien Parameter Tabel 1. Koefisien Parameter Variabel
Koefisien Parameter Minimum
Median
Maksimum
Intersep
1,727
2,468
11,240
X1
-0,894
0,021
0,993
X2
-0,033
-0,027
0,409
X3
0,0006
0,003
0,004
Nilai modelsebesar
SSE
43,976
R2
70,79%
R2
yang
Hal
pengguna
jamkesmas
dan
kepadatan
penduduk sebesar 70,79%, sedangkan 20,21
kapita
% sisanya disebabkan oleh adanya faktor
disebabkan oleh persentase rumah tangga
lainnya yang turut mempengaruhi besarnya
nelayan, persentase jumlah rumah tangga
pengeluaran per kapita.
pengeluaran
ini
dari berarti
keragaman
70,79%.
diperoleh
per
d. Pengujian Model Goodness of fit atau pengujian kesesuaian untuk model
terhadap tingkat pengeluaran per kapita di
dilakukan untuk
Kabupaten Rembang.
mengetahui faktor lokasi yang berpengaruh
39
Tabel 2. Uji Kesesuaian Model
Model
SSE
Df
Fhitung
Pvalue
43,977
9,023
2,775
0,032
Berdasarkan tabel 2 di atas didapatkan nilai
berarti tolak H0 karena nilai pvalue lebih kecil
pvalue (0,042) yang berarti nilai pvalue kurang
dari taraf nyata 5%, yang artinya ada faktor
dari taraf nyata 5% (0,032<0,05). Hal ini
pengaruh geografis pada model.
Tabel 3. Signifikansi Parameter No
Kecamatan
Variabel
1
Bulu
2
Gunem
-
3
Kaliori
X1,2,3
4
Kragan
X1,2,3
5
Lasem
X1,2,3
6
Pamotan
X2,3
7
Pancur
X2,3
8
Rembang
X1,2,3
9
Sale
X3
10
Sarang
X1,3
11
Sedan
-
12
Sluke
-
13
Sulang
X2,3
14
Sumber
-
X2,3
Berdasarkan tabel 3 diperoleh hasil
penelitian ini. Hal ini diduga karena ada
bahwa ada 10 kecamatan yang dipengaruhi
variabel lain yang lebih signifikan yang
oleh variabel kepadatan penduduk (X3), dan
mempengaruhi pengeluaran per kapita di
ada 4 kecamatan yang tidak berpengaruh
Kabupaten Rembang.
pada ketiga variabel yang digunakan dalam 40
IV. Kesimpulan
Darsyah, M.Y, Rumiati, A.T, Otok, B.W.
Berikut kesimpulan yang diperoleh
(2012). Small Area Estimation terhadap
dari hasil penelitian yang telah dilakukan
Pengeluaran Per Kapita di Kabupaten
antara lain:
Sumenep dengan pendekatan Kernel-
a) Aplikasi Small Area Estimation dapat di
Bootstrap. Prosiding Seminar Nasional
kombain dengan Regresi Spasial. b) Variabel
yang
paling
MIPA UNESA, Surabaya.
berpengaruh
Darsyah, M.Y dan Wasono, R. (2013).
terhadap pengeluaran per kapita di
Pendugaan Tingkat Pengeluaran per
Kabupaten Rembang secara keseluruhan
kapita di Kabupaten Sumenep dengan
yaitu kepadatan penduduk walaupun
pendekatan SAE. Prosiding Seminar
variabel persentase keluarga nelayan
Nasional Statistika UII, Yogyakarta.
cukup besar. c) faktor
Darsyah, M.Y dan Wasono, R. (2013).
lokasi/area
berpengaruh
antar
kecamatan
Pendugaan IPM pada Area Kecil di
terhadap
tingkat
Kota Semarang dengan Pendekatan
pengeluaran per kapita di Kabupaten
Nonparametrik.
Rembang.
Nasional Statistika UNDIP, Semarang.
d) Nilai
R2
yang
diperoleh
dari
Darsyah,
M.Y.
Prosiding
(2013).
Seminar
Small
Area
modelsebesar 70,79%. Hal ini berarti
Estimation terhadap Pengeluaran Per
keragaman persentase jumlah keluarga
Kapita di Kabupaten Sumenep dengan
miskin
Pendekatan
disebabkan
oleh
persentase
rumah tangga nrlayan, persentasejumlah
Nonparametrik.
Jurnal
Statistika. Vol 1 Nomer 2.
rumah tangga pengguna jamkesmas dan
Eubank, R. L. (1988).Spline Smoothing and
kepadatan penduduk sebesar 70,79%,
Nonparametric
sedangkan 20,21 % sisanya disebabkan
Regression.
New
York: Marcel Deker.
oleh adanya faktor lainnya yang turut
Fay, R.E. dan Herriot, R.A. (1979).
mempengaruhi pengeluaran per kapita.
Estimates Income for Small Places: An Application
of
James-Stein
Procedures to Census Data. Journal of
V. Daftar Pustaka [BPS]. Badan Pusat Statistik. (2014).
American Statistical Association, 74,
http://www.bps.go.id/glossary/2014.
pp.269-277. 41
Hardle, W. (1994). Applied Nonparametric Regression.
New
York:
ASA Section on Survey Research
Cambrige
Methods: 4058-4065.
University Press.
Opsomer et al. (2004). Nonparametric
Hastie, T. dan Tibshirani, R.J. (1990).
Small Area Estimation Using Penalized
Generalized Additive Models. New
Spline Regression. Proceedings of ASA
York:
Sectionon Survey Research Methods:1-
Chapman and Hall.
Mukhopadhyay P, Maiti T. (2004). Two
8.
Stage Non-Parametric Approach for
Rao JNK. (2003). Small Area Estimation.
Small Area Estimation. Proceedings of
New Jersey: John Wiley &Sons, Inc.
42