PENGARUH PENDUGAAN RAGAM PENARIKAN CONTOH PADA SMALL AREA ESTIMATION Anang Kurnia Khairil A. Notodiputro Departemen Statistika - IPB Center for Statistics and Public Opinions
1. Pendahuluan Otonomi daerah menuntut pemda (kab/kota) lebih berperan aktif dalam pelaksanaan pembangunan
perlu data dan informasi sampai level desa/kelurahan
Pada level nasional, data tersedia baik melalui BPS “DESAIN SURVEY PADA LEVEL NASIONAL”
Masalah : tingkat akurasi dan presisi pendugaan untuk area kecil akan rendah karena ukuran contoh sedikit atau bahkan tidak terwakili dalam survey
Solusi Alternatif : Small Area Estimation (SAE) berupaya untuk memanfaatkan keakuratan pendugaan pada level nasional (populasi) untuk menduga parameter pada level di bawahnya (sub-populasi)
2. Model Small Area Estimation Small Area Estimation Fay dan Herriot (1979) Æ menggunakan persamaan linear mixed models untuk menduga rata-rata pendapatan sub-populasi (<1000) menggunakan data sensus 1970 di US. Penjabaran: 1. xi = (xi1, xi2, ..., xip) Æ vektor data pendukung 2. θi = xi’β + υi Æ parameter merupakan fungsi dari data pendukung dan pengaruh acak υi 3. yi = θi + ei Æ direct estimate dengan sampling error 4. yi = xi’β + υi + ei Æ bentuk khusus GLMM
3. Inferensi Pada Model Basic Area Level Basic area : didasarkan pada ketersediaan data pendukung yang hanya ada untuk level area tertentu, katakan xi = (x1i, x2i, …, xpi)’ yang akan digunakan untuk membangun model SAE yi = xi’β + υi + ei Penduga terbaik (BP) bagi θi = xi’β + υi adalah θiBP = xi’β + (1 – Bi)(yi - xi’β) dengan Bi = σ2ei/(σ2υ + σ2ei) untuk i = 1, 2, ..., k. Solusi Empirical Bayes atau Empirical BLUP jika β dan σ2υ terlebih dahulu harus diduga.
3. Inferensi pada Model Basic Area Level
Salah satu masalah yang masih menjadi kajian adalah pendugaan MSE(θi(hat)) Ghosh dan Rao (1994), Prasad dan Rao (1990), Butar dan Lahiri (2001), Jiang, Lahiri dan Wan (2002) serta Chen dan Lahiri (2003) telah memberikan sumbangan yang sangat berarti dalam pendugaan MSE Pendekatan-pendekatan yang diajukan sangat baik dalam mengeliminasi masalah underestimate khususnya untuk kasus A = Di = 1 dan Xβ = 0, walupun Kurnia dan Notodiputro (2006) menunjukkan bahwa jika Di bervariasi serta seluruh parameter dalam model harus diduga, sifat underestimate penduga MSE masih cukup besar berkisar antara 13% - 19%.
3. Inferensi pada Model Basic Area Level Pertanyaan : MSE yang diajukan tersebut semuanya mengasumsikan Di diketahui, bahkan banyak mengambil kasus khusus dimana Di bersifat homogen untuk setiap area kecil RIIL PROBLEM : Di TIDAK DIKETAHUI BAHKAN SANGAT MUNGKIN MEMILIKI KERAGAMAN YANG BESAR
4. Pendugaan MSE dengan Di yang diduga Untuk suatu parameter nilai tengah yang menjadi perhatian, Di diduga oleh s2i = s20i/ni dimana s20i adalah ragam contoh acak pada area ke-i. Dengan asumsi normalitas dan Lemma Stein (1981) ”Misal Y mengikuti N(µ, σ2)dan g(y) adalah fungsi yang differentiable pada y, maka E{(Y - µ) g(Y)} = σ2 E[g’(Y)]”, maka MSE PrasadRao terkoreksi menjadi :
5. Kajian Empirik (1) KELURAHAN
Naive 6.17
PrasadRao 6.18
Prasad-Rao Jackknife Direct Est. Terkoreksi
1002
Pamoyanan
6.18
6.17
6.21
1009
Muarasari
5.07
5.07
5.07
5.07
5.08
1013
Batutulis
11.90
11.94
11.99
11.87
12.04
1015
Empang
6.15
6.15
6.15
6.14
6.17
1016
Cikaret
6.40
6.40
6.40
6.40
6.46
2002
Sindangrasa
10.20
10.21
10.22
10.20
10.27
2006
Sukasari
5.35
5.35
5.35
5.35
5.37
3001
Bantarjati
14.63
14.72
14.81
14.50
15.77
3002
Tegalgundil
9.15
9.16
9.16
9.14
9.25
3004
Cimahpar
9.40
9.41
9.41
9.38
9.44
3006
Cibuluh
6.45
6.46
6.46
6.44
6.50
3007
Kedunghalang
2.76
2.76
2.76
2.76
2.76
3008
Ciparigi
11.54
11.57
11.60
11.51
12.07
4002
Gudang
6.80
6.81
6.81
6.80
6.81
4004
Tegallega
5.50
5.52
5.54
5.50
5.49
4006
Sempur
8.75
8.80
8.84
8.71
8.66
4010
Kebonkelapa
14.40
14.43
14.46
14.38
14.87
5002
Pasirkuda
7.55
7.55
7.56
7.54
7.60
5003
Pasirjaya
9.00
9.01
9.02
8.99
9.09
5004
Gunungbatu
10.83
10.85
10.87
10.82
11.05
5006
Menteng
9.00
9.01
9.02
8.99
9.12
5008
Cilendek Barat
8.78
8.79
8.79
8.76
8.90
5009
Sindangbarang
13.68
13.72
13.76
13.64
14.20
5015
Curugmekar
6001
Kedungwaringin
6003
Kebonpedes
8.76
8.82
8.87
8.68
8.89
6004
Tanahsareal
13.27
13.31
13.35
13.20
13.37
6005
Kedungbadak
11.19
11.22
11.25
11.12
11.53
6007
Sukadamai
15.12
15.16
15.20
15.08
15.74
6009
Kayumanis
18.04
18.17
18.29
17.93
18.17
6011
Kencana
11.37
11.38
11.38
11.36
11.44
6.83
6.84
6.84
6.82
6.87
10.07
10.11
10.15
10.03
10.27
Kasus pertama ini merupakan kajian untuk keragaman antar area yang sangat besar. Peubah yang menjadi perhatian : pendapatan per kapita
5. Kajian Empirik (2) KELURAHAN 1002 1009 1013 1015 1016 2002 2006 3001 3002 3004 3006 3007 3008 4002 4004 4006 4010 5002 5003 5004 5006 5008 5009 5015 6001 6003 6004 6005 6007 6009 6011
Pamoyanan Muarasari Batutulis Empang Cikaret Sindangrasa Sukasari Bantarjati Tegalgundil Cimahpar Cibuluh Kedunghalang Ciparigi Gudang Tegallega Sempur Kebonkelapa Pasirkuda Pasirjaya Gunungbatu Menteng Cilendek Barat Sindangbarang Curugmekar Kedungwaringin Kebonpedes Tanahsareal Kedungbadak Sukadamai Kayumanis Kencana
Naive 2.25 6.35 3.36 4.89 2.80 6.70 2.57 3.71 3.02 4.66 2.71 3.06 4.09 2.16 5.76 2.64 2.37 1.74 2.11 2.68 2.55 1.94 3.26 2.59 3.65 2.84 2.58 3.41 2.48 3.73 3.48
PrasadRao 2.25 6.35 3.36 4.89 2.80 6.70 2.57 3.71 3.02 4.66 2.71 3.06 4.09 2.16 5.76 2.64 2.37 1.74 2.11 2.68 2.55 1.94 3.26 2.59 3.65 2.84 2.58 3.41 2.48 3.73 3.48
Prasad-Rao Jackknife Direct Est. Terkoreksi 2.25 2.25 2.25 6.35 6.35 6.36 3.36 3.36 3.36 4.89 4.89 4.90 2.80 2.79 2.80 6.70 6.70 6.71 2.57 2.57 2.58 3.71 3.71 3.71 3.02 3.02 3.02 4.67 4.66 4.68 2.71 2.71 2.71 3.06 3.06 3.06 4.09 4.09 4.10 2.16 2.16 2.16 5.76 5.76 5.78 2.64 2.64 2.64 2.37 2.36 2.37 1.74 1.74 1.74 2.11 2.11 2.11 2.68 2.68 2.68 2.55 2.55 2.55 1.94 1.94 1.94 3.26 3.26 3.26 2.59 2.59 2.59 3.65 3.65 3.65 2.84 2.84 2.85 2.58 2.58 2.58 3.41 3.41 3.41 2.48 2.48 2.48 3.73 3.73 3.74 3.48 3.48 3.49
Kasus kedua ini merupakan kajian untuk keragaman antar area yang relatif homogen. Peubah yang menjadi perhatian : tingkat pengangguran
6. Diskusi dan Pembahasan Secara umum kajian empirik yang disajikan menunjukkan bahwa pendugaan tidak langsung pada pendugaan statistik area kecil untuk level kelurahan cukup baik dan berhasil meningkatkan akurasi pendugaan. Jika terjadi keragaman sampling error yang cukup besar antar area kecil, tingkat akurasi ini berkurang dibandingkan dengan jika kondisi sampling error homogen. Kondisi ini diperkuat dengan hasil kajian Kurnia dan Notodiputro (2006)
6. Diskusi dan Pembahasan Pengaruh pendugaan ragam sampling error sangat dirasakan jika kondisi antar area memiliki keragaman yang besar. Upaya pengembangan metode dalam hal ini untuk menanggulangi kejadian tersebut menjadi perhatian dalam penelitian-penelitian lanjutan, terutama untuk kasus di Indonesia, dimana hampir bisa dipastikan keragaman penarikan contoh untuk setiap area kecil relatif tidak homogen
Terima Kasih
Pendapatan per kapita
KELURAHAN
MSE_D
EBLUPEB Est.
MSE_N
MSE_P
MSE_PK
MSE_J
1002
Pamoyanan
19.9100
1.5292
19.9875
1.5233
1.5242
1.5251
1009
Muarasari
18.6068
0.8932
18.6151
0.8911
0.8914
0.8917
0.8908
1013
Batutulis
39.0488
22.1159
38.3516
20.8187
20.9745
21.1312
20.7336
1015
Empang
25.7253
2.5224
25.7707
2.5096
2.5120
2.5145
2.5034
1016
Cikaret
23.5192
2.3062
23.6621
2.2921
2.2941
2.2961
2.2903
2002
Sindangrasa
17.9153
3.3882
17.9575
3.3582
3.3625
3.3668
3.3539
2006
Sukasari
23.7173
1.6221
23.7544
1.6152
1.6162
1.6172
1.6142
3001
Bantarjati
40.2376
40.2612
41.3261
36.5640
37.0082
37.4552
35.9035
3002
Tegalgundil
16.7074
2.3859
16.8380
2.3750
2.3772
2.3793
2.3689
3004
Cimahpar
21.0703
3.9555
21.0880
3.9279
3.9337
3.9396
3.9089
3006
Cibuluh
34.1938
4.9335
34.2610
4.8840
4.8930
4.9021
4.8612
3007
Kedunghalang
32.2685
0.7919
32.2555
0.7904
0.7906
0.7909
0.7900
3008
Ciparigi
31.3539
14.3174
32.1954
13.8118
13.8816
13.9518
13.7250
4002
Gudang
20.1629
1.8838
20.1237
1.8748
1.8762
1.8775
1.8732
4004
Tegallega
73.9938
16.4868
72.1205
15.7618
15.8526
15.9440
15.7062
4006
Sempur
68.4664
35.1578
64.7332
32.0712
32.4243
32.7796
31.7886
4010
Kebonkelapa
21.9877
10.6847
22.3678
10.3795
10.4196
10.4599
10.3513
5002
Pasirkuda
24.8399
3.5615
24.8907
3.5270
3.5318
3.5365
3.5237
5003
Pasirjaya
23.7288
4.6516
23.8147
4.5984
4.6065
4.6145
4.5873
5004
Gunungbatu
25.6452
8.0373
25.8966
7.8725
7.8957
7.9191
7.8472
5006
Menteng
26.3644
5.7755
26.4966
5.6851
5.6974
5.7097
5.6767
5008
Cilendek Barat
19.0320
2.8666
19.2365
2.8538
2.8569
2.8600
2.8420
5009
Sindangbarang
28.2437
16.0795
28.7163
15.4347
15.5214
15.6086
15.3361
5015
Curugmekar
33.8163
5.3977
33.8057
5.3286
5.3394
5.3502
5.3113
6001
Kedungwaringin
46.0712
22.3868
45.6695
21.1549
21.3141
21.4743
20.9715
6003
Kebonpedes
74.8297
44.231
72.0041
39.7940
40.3133
40.8359
39.0272
6004
Tanahsareal
30.1196
16.2075
29.7793
15.6272
15.7151
15.8037
15.4525
6005
Kedungbadak
31.0433
12.8135
31.5810
12.4993
12.5559
12.6129
12.3370
6007
Sukadamai
25.2414
15.7916
25.7394
15.1383
15.2221
15.3065
15.0740
6009
Kayumanis
37.8307
47.2355
35.8578
41.8673
42.4456
43.0275
41.3478
6011
Kencana
16.5445
3.5838
16.5731
3.5501
3.5549
3.5597
3.5455
KELURAHAN
Tingkat pengangguran
Direct Est.
1002 1009 1013 1015 1016 2002 2006 3001 3002 3004 3006 3007 3008 4002 4004 4006 4010 5002 5003 5004 5006 5008 5009 5015 6001 6003 6004 6005 6007 6009
Pamoyanan Muarasari Batutulis Empang Cikaret Sindangrasa Sukasari Bantarjati Tegalgundil Cimahpar Cibuluh Kedunghalang Ciparigi Gudang Tegallega Sempur Kebonkelapa Pasirkuda Pasirjaya Gunungbatu Menteng Cilendek Barat Sindangbarang Curugmekar Kedungwaringin Kebonpedes Tanahsareal Kedungbadak Sukadamai Kayumanis
6011
Kencana
Direct Est.
MSE_D
EBLUPEB Est.
MSE_N
MSE_P
1.5222
MSE_PK
MSE_J
13.0435 1.8519 6.3830 3.3333 9.8039 1.6667 8.3333 5.4545 6.8966 3.2787 10.5263 9.0909 4.8780 14.8148 2.2727 10.9375 12.0690 20.0000 13.5135 10.6383 10.9091 16.6667 6.3830 10.4167 6.3830 9.4340 11.5385 6.3830 12.5000 5.4545
0.0861 0.0139 0.0461 0.0266 0.0752 0.0125 0.0461 0.0410 0.0434 0.0235 0.0815 0.0776 0.0399 0.1025 0.0172 0.0836 0.0817 0.1210 0.0813 0.0813 0.0773 0.1044 0.0434 0.0731 0.0544 0.0720 0.0887 0.0475 0.0961 0.0416
13.0346 1.8550 6.3857 3.3368 9.8012 1.6692 8.3345 5.4575 6.8974 3.2853 10.5259 9.0920 4.8822 14.7901 2.2772 10.9254 12.0685 19.9472 13.4947 10.6321 10.8989 16.6437 6.3880 10.4118 6.3866 9.4351 11.5263 6.3844 12.4906 5.4661
0.0859 0.0139 0.0460 0.0266 0.0751 0.0125 0.0460 0.0409 0.0433 0.0235 0.0813 0.0774 0.0399 0.1023 0.0172 0.0834 0.0815 0.1205 0.0811 0.0811 0.0771 0.1040 0.0433 0.0729 0.0543 0.0719 0.0885 0.0474 0.0958 0.0415
0.0859 0.0139 0.0460 0.0266 0.0751 0.0125 0.0460 0.0410 0.0433 0.0235 0.0814 0.0774 0.0399 0.1023 0.0172 0.0834 0.0815 0.1206 0.0811 0.0811 0.0772 0.1041 0.0433 0.0729 0.0543 0.0719 0.0885 0.0474 0.0958 0.0415
0.0860 0.0139 0.0460 0.0266 0.0751 0.0125 0.0460 0.0410 0.0433 0.0235 0.0814 0.0774 0.0399 0.1024 0.0172 0.0835 0.0816 0.1206 0.0812 0.0812 0.0772 0.1041 0.0433 0.0729 0.0543 0.0719 0.0885 0.0474 0.0959 0.0415
0.0859 0.0139 0.0460 0.0266 0.0750 0.0125 0.0460 0.0409 0.0433 0.0235 0.0813 0.0773 0.0399 0.1021 0.0172 0.0834 0.0814 0.1205 0.0811 0.0811 0.0771 0.1040 0.0433 0.0729 0.0543 0.0718 0.0884 0.0474 0.0958 0.0415
6.2500
0.0475
6.2580
0.0474
0.0474
0.0474
0.0474