PENAKSIR RASIO YANG EFISIEN UNTUK RATA-RATA POPULASI DENGAN MENGGUNAKAN VARIABEL TAMBAHAN PADA SAMPLING DUA TAHAP R. Handayani1*, A. Adnan2, H. Sirait2 1
Mahasiswa Program S1 Matematika 2 Dosen JurusanMatematika FakultasMatematikadanIlmuPengetahuanAlamUniversitas Riau KampusBinawidyaPekanbaru, 28293, Indonesia *
[email protected]
ABSTRACT This paper reviews three ratio estimators for the population mean in two-phase sampling proposed by Sukhatme. All ratio estimators are biased estimator. TheirMSE(mean square errors) are compared to find the most efficient estimator. This comparison shows that the ratio estimator in two-phase sampling has the smallest MSE(mean square error). A numerical example is given to explain the problem discussed. Keywords: ratio estimator, two- phase sampling, bias, and MSE (mean square error) ABSTRAK Pada artikel ini dibahas tiga penaksir rasio untuk rata-rata populasi pada sampling dua tahap yang diajukan oleh Sukhatme. Ketiga penaksir merupakan penaksir bias.MSE(mean square error) ketiganya dibandingkan untuk mendapatkan penaksir yang lebih efisien. Perbandingan ini menunjukkan bahwa penaksir rasio pada sampling dua tahap mempunyai MSE (mean squre error) terkecil. Sebuah contoh numerik diberikan pada akhir pembahasan. Kata kunci: penaksir rasio, sampling dua tahap, bias, dan MSE (mean square error)
1. PENDAHULUAN Sampling acak multiphase merupakan sampling yang pengambilan sampelnya berdasarkan informasi yang diperoleh pada tahap pertama, selanjutnya info ini digunakan sebagai informasi tambahan untuk memperoleh estimasi yang akurat pada tahap berikutnya. Sampling multiphase yang biasa digunakan adalah sampling dua tahap. Sampling dua tahap mencakup pemilihan sampel berukuran dari populasi berukuran pada pengambilan sampel tahap pertama dan kemudian diambil sub sampelberukuran dari sampel berukuran pada pengambilan sampel tahap kedua.
1
Informasi yang diperoleh dari digunakan untuk meningkatkan keakuratan estimasi sampel akhir. Apabila rata-rata penaksir sama dengan parameter populasi, dinamakan penaksir tak bias yang memiliki variansi minimum, tetapi apabila rata-rata penaksir tidak sama dengan parameter populasi dinamakan penaksir bias, maka penaksir yang efisien untuk penaksir bias adalah penaksir yang memiliki MSE(Mean Square Error) minimum [2]. Misalkan suatu populasi yang berkarakter Y N akan diteliti, dengan memanfaatkan informasi yang sudah ada yang merupakan variabel tambahan berkarakter X N maka digunakan metode penaksir rasio untuk meningkatkan ketelitian. Pada penaksir rasio, dimana populasi X N setara dengan populasi Y N dengan mengambil manfaat hubungan antara Y N dan X N , dimana y i adalah unit populasi Y N dan x i adalah unit daripopulasi X N , x n merupakan rata-rata sampelpadatahappertamadan x n merupakan rata-rata sampeltahapkedua. Pengambilansampelberkarakter X N dilakukanduatahap, tetapipopulasiberkarakter Y N dilakukansatutahap, dimana n N padapopulasiberkarakter,makadiperoleh Y N setaradengan X N [2]. Bentuk dari tiga penaksir rasio pada sampling dua tahap untuk rata-rata populasiyang diajukan oleh Sukhatme [4] sebagai berikut: Y Yˆ1 n X n Xn
(1)
Yˆ2 rn X n
(2)
dan
n(n 1) Yn rn X n , Yˆ3 rn X n n(n 1) dengan 1 n 1 n 1 n 1 n Yn Yi , X n X i , X n X i , rn ri , n i 1 n i 1 n i 1 n i 1
(3)
Maka Yˆ1 , Yˆ2 dan Yˆ3 merupakanpenaksir bias, dengan X n adalah rata-rata sampel tahap pertama, X n adalah rata-rata sampel tahap kedua, n penarikan sampel tahap pertama dan n adalah penarikan sampel tahap kedua. Penaksirrasio yang efisiendapatdiperolehdenganmembandingkanMSEuntukmasingmasingpenaksir.PenaksirdenganMSE yang terkeciladalahpenaksir yang paling efisien. 2. PENAKSIR RASIO UNTUK RATA-RATA POPULASI Misalkansuatupopulasiberukuran N dengannilaivariabel y i untukmasing-masing unit, i 1,2,3,...,N . Akan diambilsampelberukuran n unit denganvariabel y i , dengan
2
i 1,2,3,...,n., rata-rata populasiadalah Y y
1 N
N
y i 1
i
Sedangkan rata-rata sampeladalah
1 n yi . n i 1
1. Sampling AcakSederhana n Sampling acaksederhanaadalahsuatumetodeuntukmengambil unit daripopulasiberukuran N , dimanasetiapelemenmempunyaikesempatan yang samauntukdiambilmenjadianggotasampel. Pengambilansampelini adalah pengambilan sampel tanpapengembalian agar karakteristik unit-unit lebih akurat [2].Ekspektasidari y akansamadengan Y , pernyataaninidapatditunjukkansebagaiberikut N
E ( yi ) P( yi ) yi , i 1
P( yi )
dengan
adalahprobabilitasterpilihnya
yi
menjadianggotasampel.Apabilaprobabilitas y i terpilihmenjadianggotasampeladalah 1 , N E( y) Y . E ( yi ) Y . makadapat diperoleh Dengandemikiandiperoleh Dapatdinyatakanbahwa y adalahpenaksirtak bias dari Y . Untuk menentukan bias dan MSE pada sampling acak sederhana digunakan teorema variansi dan kovariansi.
Teorema 2.1[2, h: 27]Apabilasampelberukuran n diambildaripopulasiberukuran N yang berkarakter Y dengan sampling acaksederhanamakavariansi rata-rata sampel y dinotasikandengan V y dandirumuskansebagai S y2 N n S y2 V ( y) (1 f ), n N n
dengan f
n N
adalahfraksipenarikansampel, N
S y2
(y i 1
i
Y )2
N 1
adalahvariansi y i padapopulasiberkarakter Y .
Bukti dari teorema ini dapat dilihat pada [2, h: 27]. Teorema 2.2 [2, hal:29] Jika y i dan x i adalah sebuah pasangan yang bervariasi pada unit dalam populasi dengan y dan x adalah rata-rata dari sampel acak sederhana berukuran n , maka kovariansi y dan x adalah
3
E ( y Y )( x X )
N n 1 N ( yi Y )( xi X ). nN N 1 i 1
Bukti dari teorema ini dapat dilihat pada [2, h: 29]. 2. Sampling Dua Tahap Misalkanterdapatsuatupopulasiberukuran N , diperlukansampelberukuran n untukditeliti, penarikansampelberukuran tersebutdilakukandengan sampling n acaksederhanatanpapengembalian. Hal inimerupakancarapenarikansampeltahappertama yang disebutsebagaisampelpertamapada sampling duatahap, n kemudianpenarikansubsampelberukuran n , yaitusampeltahapkeduadisebutjugasampelkeduadarisampelberukuran n penarikansubsampelberukuran tersebutjugadilakukandengan sampling acaksederhanatanpapengembalian. Informasi yang diperolehdari n digunakanuntukmeningkatkankeakuratanestimasisampelakhir [5].Ekspektasi dari subsampel ytps j sama dengan dengan Y , dengan ytps j merupakan rata-rata pengambilan sub sampel acak sederhana dari sampel, dan C nn merupakan peluang terpilihnya sampel pada tahap kedua maka diperoleh, Cnn
E ( ytps j ) P( ytps j ) ytps j i 1
Cnn
P( ytps j ) E ( y tps j i ) i 1
N
1 Cn n P( y ssi ) y ssi i 1 C n i 1 C
1 N C n
CnN
y i 1
ssi
E( ytps j ) Y . Untuk variansi pada sampling dua tahap, jika sampel pada tahap pertama berukuran n dan tahap kedua berukuran n , maka variansinya dapat diperoleh[3]sebagaiberikut
V ( ytps j ) E ( ytps j Y ) 2 V ( ytps j ) E ( ytps j y ssi y ssi Y ) 2 V ( ytps j ) E ( ytps j y ssi ) 2 E ( y ssi Y ) 2 2 E{( ytps j y ssi )( y ssi Y )}. 1 1 1 1 V ( y tps j ) S y2 S d2 , n N n n
4
dengan n
N
S y2
(y i 1
i
Y )
N 1
2
dan S d2
(y
i , j 1
ij
yi ) 2 .
n 1
3. BIAS DAN MSE PENAKSIR RASIO UNTUK RATA-RATA POPULASI PADA SAMPLING DUA TAHAP Bias dan MSE penaksir rasio untuk rata-rata populasi pada sampling dua tahap dari masing-masing penaksir sebagai berikut. Bias dan MSE dari persamaan (1) diperolehdengan, Q
Y YN merupakanrasiountukPopulasi, ˆ Q n merupakanrasiountuksampel, X n Xn XN
merupakan rata-rata sampeltahappertama , dan X n merupakan rata-rata sampeltahapkeduadenganbesar bias dan MSE nyaadalah
1 n n 2 B Yˆ1 QS x S yx X N n n 1 1 MSE(Yˆ1 ) Y2 Q 2 X2 2Q XY 2Q XY Q 2 X2 n n
Bias danMSEdaripersamaan (2) diperoleh, dengan Q
rN X N merupakan rasio untuk populasi, ˆ rn X n rasio untuk sampel, X Q n XN Xn
merupakan rata-rata sampel tahap pertama, denganbesar bias dan MSE nyaadalah
n n 2 B Yˆ2 QS x S rx nn 1 1 MSE(Yˆ2 ) X N2 r2 rN2 X2 2rN X N Xr n n
Bias danMSEdaripersamaan (3) diperoleh, denganbesar bias dan MSE nyaadalah
B Yˆ3
n n 1 2 QS x S rx nn 1 n n
1 1 MSE(Yˆ3 ) Y2 rN2 X2 2rN XY rN2 X2 2rN X N rX 2rN E (2 Xr ) n n
5
dengan E (2 Xr ) atau E (rX ) rX Selanjutnyaakanditentukanpenaksirrasio yang efisiendiantaraketigapenaksirrasio yang diajukan, yaitudenganmembandingkan MSEdaripenaksir Yˆ1 , Yˆ2 dan Yˆ3 sebagaiberikut:
3.1 Perbandingan MSE Yˆ1 dengan MSE Yˆ2 diperoleh MSE(Yˆ1 ) MSE(Yˆ2 ) jika 1 1 1 1 2 X N rX X N rX X N rX X W1 n n n r n N 1 2 X n 2
2
1 1 2 X N rX X W1 n n 1 2 X n
dengan memisalkan 1 2 2 1 2 X N r Y Q 2 X2 2Q XY W1 n n
3.2PerbandinganMSE Yˆ2 denganMSE Yˆ3 diperoleh MSE(Yˆ2 ) MSE(Yˆ3 ) jika
XY 2 rX XY 2 rX 2 1 X2 W1 n
1 2 X n
XY 2 rX XY 2 rX 2 1 X2 W1 rN
n
1 2 X n
dengan memisalkan 1 2 2 1 2 X N r Y W1 n n
3.3 PerbandinganMSE Yˆ1 denganMSE Yˆ3 diperoleh MSE(Yˆ1 ) MSE(Yˆ3 ) jika 2
1 1 2 2 XY 2 XY X W1 n n rN X2
2
1 1 2 2 XY 2 XY X W1 n n
X2
dengan memisalkan 1 2 2 2 X N rX 2 rX Q x 2Q XY W1 . n
6
4. CONTOH Sebagaicontohdaripembahasanini, akanditaksir rata-rata jumlahpenduduk di 33 provinsi Indonesia dalamkurunwaktu 10 tahunpadatahun 2010 [1]. Data dapat dilihatpadaTabel 1.
Tabel 1.Data Jumlah Penduduk (dalam ribuan) di 33 Provinsi Indonesia Tahun 2000-2010 NO.
Provinsi
Tahun 2000 (X)
Tahun 2010 (Y)
1 2 3 4 5 6 7
Aceh Sumatera Utara Sumatera Barat Riau Kepulauan Riau Jambi Sumatera Selatan
3929,2 11642,5 4248,5 3907,8 1040,2 2407,2 6210,8
4494,4 12982,2 4846,9 5538,4 1679,2 3092,3 7450,4
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Kepulauan Bangka Belitung Bengkulu Lampung DKI Jakarta Jawa Barat Banten Jawa Tengah DI. Yogyakarta Jawa Timur Bali Nusa Tenggara Barat Nusa Tenggara Timur Kalimantan Barat Kalimantan Tengah Kalimantan Selatan Kalimantan Timur Sulawesi Utara Gorontalo
900 1455,5 6730,7 8361,1 35724,1 8398,3 31223,3 3121 34766 3150,1 4008,6 3823,1 4016,3 1855,5 2984 2451,9 2000,9 833,5
1223,3 1715,5 7608,4 9607,8 43053,7 10632,2 32382,6 3457,5 34476,8 3890,8 4500,2 4683,8 4395,9 2212,1 3626,6 3553,1 2270,6 1040,2
7
26 27 28 29 30 31 32 33
Sulawesi Tengah Sulawesi Selatan Sulawesi Barat Sulawesi Tenggara Maluku Maluku Utara Papua Papua Barat
2176 7159,2 891,6 1820,4 1166,3 815,1 1684,1 529,7
2635 8034,8 1158,6 2232,6 1533,5 1038,1 2833,4 760,4
Sumber: Pekanbaru dalam angka [1]. Untukkeperluaninidigunakan sampling duatahapdengansampeltahappertamaberukuran 10 dankemudiansampeltahapkeduaberukuran 5.Selanjutnyasebagaiinformasitambahan (variabelbantu) yang telahditelitisebelumnyajugamenggunakan sampling duatahapyaitupenduduktahun 2000. Informasi yang diperolehdari data [2] dengan (X) adalah jumlah penduduk pada tahun 2000 dan (Y) jumlah penduduk pada tahun 2010 adalah sebagai berikut. Informasi yang diperolehdari data jumlah penduduk tahun 2000 danjumlah penduduk tahun 2010 denganmenggunakan Microsoft Excel padaTabel 2 berikut.
Tabel 2. Nilai-nilai yang diperlukan untuk membandingkan MSE dari ketiga penaksir
N 33
n 10
n5
N 74814
X N 48851.9166 7
0.292106931
f 0.5
Q 1.531444519
Y2 2112735450
Y 45964.5020 6 X2 3266127822 XY 767327936 .5 Y X 2626873433 r2 0.089377333 r 0.29896042
X 57150 .04656 rN 0.592774164
rX 3118 .5032
Denganmenggunakaninformasidari data diatas, diperolehbahwa (i) MSE(Yˆ1 ) MSE(Yˆ2 ) jika 49 ,16831452 rN 93287799 ,54 (ii) MSE(Yˆ2 ) MSE(Yˆ3 ) jika 1409598903 rN 1,83703771 (iii) MSE(Yˆ3 ) MSE(Yˆ1 ) jika 1,367873248 rN 1,211249875 5. KESIMPULAN
8
Dari pembahasan di atasdiperolehbahwapenaksir Yˆ1 lebihefisiendaripenaksir Yˆ2 , penaksir Yˆ2 lebihefisiendaripenaksir Yˆ3 danpenaksir Yˆ3 lebihefisiendaripenaksir Yˆ1 . Jadi, dapatdisimpulkanbahwapenaksirrasio sampling duatahapmerupakanpenaksir yang lebihefisiendibandingkanpenaksirlainnya.
DAFTAR PUSTAKA [1] BadanPusatStatistik (BPS). PerkembanganBeberapaIndikatorUtamaSosialEkonomi Indonesia.Jakarta, 2011. [2] Cochran, W.G. 1991. TeknikPenarikanSampel, EdisiKetiga. Terj. Dari Sampling Techniques,olehRudiansyah& E.R Osman. PenerbitUniversitas Indonesia, Jakarta. [3] Raj, D. 1971. Sampling Theory, T M H Edition. United Nations Program of Technical Assistnce, New Delhi. [4] Sukhatme, B. V. (1962). Some ratio-type estimators in two phase sampling.Journal of the American Statistical Association, 57: 628-632. [5] Sukhatme, P. V. 1957. Sampling Theory of Surveys with Applications.The Indian Council ofAgricultural Research, New Delhi.
9
10