PENAKSIR VARIANSI POPULASI YANG EFISIEN PADA SAMPLING ACAK SEDERHANA MENGGUNAKAN KOEFISIEN REGRESI Neneng Gustiana1*, Rustam Efendi2, Harison2 1
Mahasiswa Program S1 Matematika 2 Dosen Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Riau Kampus Bina widya Pekanbaru, 28293, Indonesia *
[email protected] ABSTRACT
In this article we review three estimators for the population variance in simple random sampling using regression coefficient and two auxiliary information. They were proposed by Gupta and Shabbir [2] which is a review of their article “Variance Estimation in Simple Random Sampling Using Auxiliary Information.” Bias of estimators and the mean square errors are determined. Furthermore, the mean square errors of each estimators are compared for showing which one is the efficient estimator. A numerical is given at the end of discusssion. Keywords: variance estimator, simple random sampling, regression coefficient, population variance and mean square error. ABSTRAK Dalam artikel ini kami membahas tiga penaksir untuk variansi populasi pada sampling acak sederhana menggunakan koefisien regresi dan dua informasi tambahan. Penaksir tersebut diajukan oleh Gupta dan Shabbir [2] yang merupakan review dari artikel mereka “Variance Estimation in Simple Random Sampling Using Auxiliary Information.” Kemudian di bahas tentang bias dan mean square error dari ketiga penaksir. Selanjutnya, mean square error dari masing-masing penaksir dibandingkan untuk mendapatkan penaksir yang paling efisien. Contoh numerik diberikan pada akhir pembahasan. Kata kunci: penaksir variansi, sampling acak sederhana, koefisien regresi, variansi populasi dan mean square error. 1. PENDAHULUAN Dalam menaksir suatu parameter, ada beberapa metode yang digunakan sehingga sampel yang diambil dapat mewakili populasi. Salah satu metode tersebut adalah Repository FMIPA
1
sampling acak sederhana. Sampel yang diambil harus mencerminkan semua unsur dalam populasi. Untuk mendapatkan hasil yang lebih akurat, dapat digunakan variabel tambahan. Tujuan penambahan variabel adalah untuk meningkatkan ketelitian penaksir tanpa menambah biaya. Gupta dan Shabbir [2] memberikan penaksir variansi populasi Sˆ JS2 1 , Sˆ JS2 2 dan Sˆ JS2 3 , dimana pada penaksir Sˆ JS2 1 menggunakan koefisien regresi S y2 atas S x2 , dengan S y2 adalah variansi untuk populasi Y dan S x2 adalah variansi untuk populasi X.
Regresi linear merupakan metode yang digunakan untuk mengetahui keeratan hubungan antara dua variabel. Selanjutnya pada penaksir Sˆ JS2 2 dan Sˆ JS2 3 digunakan variabel tambahan d1 dan d 2 , dimana d1 dan d 2 merupakan konstanta. Kemudian dari ketiga penaksir ditentukan bias dan MSE. Selanjutnya dibandingkan MSE dari masing-masing penaksir untuk memperoleh penaksir variansi yang efisien. Penaksir yang memiliki nilai MSE terkecil merupakan penaksir yang paling efisien. Sampling Acak Sederhana Sampling acak sederhana merupakan sebuah metode yang digunakan untuk mengambil n unit sampel dari N unit populasi sehingga setiap unit populasi memiliki kesempatan yang sama untuk dipilih menjadi unit sampel. Dalam hal ini pengambilan sampel dilakukan tanpa pengembalian agar hasil yang diperoleh menjadi representatif [1]. Pada pengambilan sampel tanpa pengembalian probabilitas terpilihnya n dari N populasi terpilih menjadi unit sampel pada pengambilan pertama adalah n N , probabilitas pada pengambilan kedua adalah n 1 N 1 , sampai probabilitas pada pengambilan ke- n yaitu 1 N n 1 , sehingga peluang seluruh n unit-unit tertentu
yang terpilih dalam n pengambilan adalah N C n . Untuk menentukan bias dan MSE suatu penaksir, diperlukan beberapa definisi dan teorema sebagai berikut. Teorema 2.1 [1: h.30] Untuk sampling acak sederhana tanpa pengembalian dengan populasi berkarakter Y, variansi sampel s y2 dirumuskan dengan 1
n
s y2
y i 1
y
2
i
,
n 1
merupakan penaksir tak bias untuk S y2 . Bukti:Dapat dilihat pada [1: h.30]. Teorema 2.2[4: h.34] Apabila sebuah sampel berukuran n diambil secara sampling acak sederhana tanpa pengembalian dari populasi berkarakter Y dan berukuran 2 N maka variansi s y adalah
V s
Repository FMIPA
2 y
S y2 n
2 y 1,
2
dengan
2 y
40 . 202
Bukti:Dapat dilihat pada [4: h.34]. 2. PENAKSIR REGRESI UNTUK VARIANSI POPULASI Bentuk umum model regresi linear sederhana adalah s y2 s x2 e,
(1)
2
dengan variable s y merupakan variabel tak bebas dan s x2 adalah variabel bebas, sedangkan dan adalah parameter yang akan ditaksir. Dari bentuk umum diatas, didapatkan taksiran untuk parameter dan yaitu
b *
s y2 22 1
s x2 2 x 1
dan
a s y2 b s x2 .
(2)
Ketika garis regresi linear melalui titik pangkal a 0 , maka persamaan (2) menjadi s y2 b s x2 , (3) b yang diperoleh dari sampel digunakan juga untuk populasi sehingga variansi populasi dinotasikan dengan Sˆ y2 (4) Sˆ 2 b* S 2 . y
x
Dari pengurangan persamaan (4) dengan persamaan (3) secara aljabar, diperoleh
Sˆ y2 b* S x2 s x2 .
Sˆ y2 disebut penaksir regresi linier untuk rata-rata populasi yang dinotasikan dengan Sˆ JS2 1 sehingga Sˆ JS2 1 b * S x2 s x2 . 3. BIAS DAN MSE PENAKSIR UNTUK VARIANSI POPULASI Penaksir yang diajukan oleh Gupta dan Shabbir [2] untuk variansi populasi pada sampling acak sederhana adalah sebagai berikut Sˆ JS2 1 s y2 b* S x2 s x2 (5) Sˆ JS2 2 d1 s y2 d 2 S x2 s x2 (6) S x2 2 2 2 2 ˆ S JS 3 d1 s y d 2 S x s x 2 2 (7) sx
Repository FMIPA
3
dengan b* adalah koefisien regresi, d1 dan d 2 adalah konstanta yang dipilih. Untuk menentukan bias dan MSE penaksir dimisalkan 0
1
s
2 x
S x2 S x2
s
S y2
2 y
S
2 y
dan
sehingga E i 0, i 0,1, E 02 2 y 1, E 12 2 x 1 ,
dan E 0 1 22 1, dimana
N 1 r s , rs r / 2 rs s / 2 , rs yi Y xi X / N n 20 02 i 1
40 , 2 x 042 merupakan koefisien kurtosis dari y dan x. 2 20 02 2 Untuk Sˆ dari persamaan (5) diperoleh
dan 2 y
JS 1
B( Sˆ JS2 1 ) 0, Var Sˆ 2 1 2 2
MSE Sˆ JS2 1 dengan s 2 , s 2 y
x
y
22 1 . 2 y 1 2 x 1
s
2 y ,sx
,
(8)
Untuk Sˆ JS2 2 dari persamaan (6) diperoleh B Sˆ JS2 2 d1 1 S y2 ,
ˆ MSE S . 1 y 11 Var Sˆ y2 1 2s 2 , s 2
2 JS 2
y
x
(9)
2 s 2y , s x2
2
Untuk S JS2 3 dari persamaan (7) diperoleh B Sˆ JS2 3 d1 1S y2 d1 S y2 22 1 2 x 1 d 2 S x2 2 x 1,
MSE Sˆ JS2 3
opt
S y4U 3* U4
(10)
,
dengan U 3 1 5 2 x 1 2 2 y 1 2 x 1 4 2 2 x 1 2 22 1, U 4 2 x 1 2 y 1 2 x 1 5 2 x 1 22 1 , 2
2
U 3* 2 y 1 2 x 1 22 1 2 y 1 2 x 1 4 2 x 1 2
2
3
2 x 122 1 . 2
4. PENAKSIR VARIANSI POPULASI YANG EFISIEN Penaksir yang efisien dapat ditentukan dengan cara membandingkan MSE dari masingmasing penaksir yang diajukan. 1. Perbandingan antara penaksir Sˆ JS2 1 dengan penaksir Sˆ JS2 2 . Repository FMIPA
4
Diperoleh bahwa jika 2 y 1 maka penaksir Sˆ JS2 2 lebih efisien dari penaksir Sˆ JS2 1 . 2. Perbandingan antara penaksir Sˆ JS2 3 dengan penaksir Sˆ JS2 2 . Diperoleh bahwa untuk
1
S y2U 3*
Var Sˆ y2 U 4 S y2U 3* 2 y 1
s 2 , s 2 1 y
x
S y2U 3*
Var Sˆ y2 U 4 S y2U 3* 2 y 1
,
maka penaksir Sˆ JS2 3 lebih efisien dari penaksir Sˆ JS2 2 jika
1 2 y 1 1 2 y 1 s 2 ,s 2 , y x 2 y 1 2 y 1
dan 1 B 22 1 B . 3. Perbandingan antara penaksir Sˆ JS2 3 dengan penaksir Sˆ JS2 1 . Diperoleh bahwa jika 1
S y2U 3* S y2U 3* 1 , s 2y , s x2 U 4Var Sˆ y2 U 4Var Sˆ y2
maka penaksir Sˆ JS2 3 lebih efisien dari penaksir Sˆ JS2 1 . 4. CONTOH Data pada Tabel 1 merupakan hasil produksi padi berdasarkan luas lahan dari tahun 1970 sampai tahun 2013 [3]. Ditentukan variansi hasil produksi menggunakan syarat relatif efisiensi penaksir. Tabel 1. Hasil produksi padi berdasarkan luas lahan di Indonesia No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Repository FMIPA
Tahun 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983
Produksi(ton) 18693649 20483687 19393933 21490578 22476073 21339455 23300939 23347132 25771570 26282663 29651905 32774176 33583677 35303106
Luas lahan(ha) 7898250 8324322 7897638 8403604 8508598 8495096 8368759 8359568 8929169 8803564 9005065 9381839 8988455 9162469 5
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
38136446 39032945 39726761 40078195 42676170 44725582 45178751 44688247 46240009 48181087 46641524 49744140 51101506 49377054 48236692 50866387 51898852 51460782 51489694 52137604 54088468 54151097 54454937 56157435 60325925 64398890 66469394 64756904 69056126 69271053
9663580 9902293 9988453 9942594 10140155 10531207 10502357 10281519 11103317 10012776 10733830 11438864 11569729 11140594 11730325 11963204 11793475 11499998 11521166 11488034 11922974 12839160 12786430 12147637 12327425 12883576 12147637 13203643 13445524 13451211 Sumber [3] . Perbandingan MSE dari penaksir (7), (8) dan (9) dengan bantuan Microsoft Excel diperoleh kuantitas pada Tabel 2. Tabel 2. Kuantitas yang diperlukan untuk membandingkan MSE ketiga penaksir
X
44 43.150.936,36 10.559.751,89
15 0,066666667 0,807952853
S y2
2,12992E+14
2 ( x)
1,818138891
N Y
Repository FMIPA
n 2 s 2y , s x2
6
S x2 2 ( y)
22
2,73587E+12 2,065425728 1,839205107
Substitusikan kuantitas yang diperoleh pada Tabel 2 terhadap ke persamaan (8), (9) dan (10), diperoleh nilai MSE dari masing-masing penaksir seperti yang disajikan pada Tabel 3. Tabel 3. Nilai MSE dari masing-masing penaksir No
Penaksir
MSE
1
Sˆ JS2 1
6,18825E+26
2
Sˆ JS2 2
6,10498E+26
3
Sˆ JS2 3
6,10579E+25
Berdasarkan Tabel 3, dapat dilihat bahwa penaksir Sˆ JS2 3 memiliki nilai MSE yang terkecil. 5. KESIMPULAN Berdasarkan pembahasan yang telah dikemukakan pada artikel ini,dapat disimpulkan bahwa penaksir variansi Sˆ JS2 2 lebih efisien dari penaksir Sˆ JS2 1 , penaksir Sˆ JS2 3 lebih efisien 2 dari penaksir Sˆ . Jadi dapat disimpulkan bahwa penaksir Sˆ 2 merupakan penaksir JS 2
JS 3
yang paling efisien dari penaksir Sˆ
2 JS 1
dan Sˆ
2 JS 2
.
DAFTAR PUSTAKA [1] [2]
[3] [4]
Cochran, W.G. 1991. Teknik Penarikan Sampel, Edisi Ketiga. Terj. Dari Sampling Techniques, oleh Rudiansyah & E.R Osman. UI Press, Jakarta. Gupta, S&J, Shabbir. 2008. Variance Estimation in Simple Random Sampling Using Auxiliary Information, Hacettepe Journal of Mathematics and Statistics 37(1):57-67. http://bps.go.id/dataset/data-produksi-dan-lahan-dari-padi-dan-palawijaindonesia. Diakses pada 12 Februari 2015. pukul 20.06. Sukhatme, P. V. 1957. Sampling Theory of Surveys with Applications.The Indian Council of Agricultural Research, New Delhi.
Repository FMIPA
7