Statistika
PENGGUNAAN METODE DIRECT SAMPLING DAN INVERSE SAMPLING DALAM MENGESTIMASI UKURAN POPULASI KUCING DI PERUMAHAN BUKIT RIVARIA SAWANGAN – DEPOK PADA BULAN DESEMBER 2009 Tri Handhika dan Murni Pusat Studi Komputasi Matematika (PSKM), Kampus D 139 Universitas Gunadarma, Depok, 16424
[email protected],
[email protected]
ABSTRAK Dalam sejumlah penelitian, seringkali ukuran populasi sebenarnya dari objek yang sedang diamati tidak dapat diperoleh dengan mudah. Oleh karena itu, sebagian besar peneliti mengasumsikan bahwa ukuran populasi tersebut diketahui nilainya guna mendapatkan jumlah sampel yang sesuai untuk penelitian yang sedang berlangsung. Padahal, asumsi tersebut akan berpengaruh besar terhadap hasil penelitian yang diperoleh. Besarnya pengaruh informasi ukuran populasi dari objek yang sedang diamati terhadap hasil suatu penelitian membuat sebagian peneliti berusaha mengembangkan berbagai metode dalam mengestimasi ukuran populasi tersebut. Dengan demikian, diperlukan suatu metode untuk mengestimasi ukuran populasi dari objek yang sedang diamati sehingga tujuan dari penelitian tersebut dapat tercapai. Beberapa metode untuk mengestimasi ukuran populasi tersebut di antaranya adalah Metode Direct Sampling dan Metode Inverse Sampling. Metode Direct Sampling dan Inverse Sampling dapat digunakan untuk mengestimasi ukuran populasi dari objek-objek bergerak yang sulit untuk diketahui berapa ukuran atau jumlah sebenarnya. Pada makalah ini akan dijelaskan Metode Direct Sampling dan Inverse Sampling dalam mengestimasi ukuran populasi dari objek yang sedang diamati. Kata kunci: Direct Sampling; Inverse Sampling; Ukuran Populasi.
PENDAHULUAN
dikembalikan ke populasi. Dengan demikian, proporsi sampel yang diberi tanda pengenal dalam
Dalam sejumlah penelitian, seringkali ukuran populasi sebenarnya dari objek yang sedang diamati tidak dapat diperoleh dengan mudah. Oleh karena itu, sebagian besar peneliti mengasumsikan bahwa ukuran populasi tersebut diketahui nilainya guna mendapatkan jumlah sampel yang sesuai untuk penelitian yang sedang berlangsung. Padahal, asumsi tersebut akan berpengaruh besar terhadap hasil penelitian yang diperoleh. Besarnya pengaruh informasi ukuran populasi dari objek yang sedang diamati terhadap hasil suatu penelitian membuat sebagian peneliti berusaha mengembangkan berbagai metode dalam mengestimasi ukuran populasi tersebut. Salah satu metode untuk mengestimasi ukuran populasi adalah Metode Direct Sampling. Selain itu, akan dijelaskan pula Metode Inverse Sampling dalam mengestimasi ukuran populasi dari objek-objek bergerak yang sedang diamati di mana Metode ini merupakan perkembangan dari Metode Direct Sampling yang terlebih dahulu diperkenalkan.
populasi tersebut ( p ) adalah sebesar p =
BAHAN DAN METODE Prosedur awal yang akan digunakan dalam Metode Direct Sampling sama dengan Metode Inverse Sampling, yakni mengambil sampel secara acak berukuran t dari populasi yang akan diamati berukuran N . Selanjutnya, sampel tersebut diberi tanda pengenal untuk selanjutnya
t . N
Oleh karena itu, ukuran populasi dapat diestimasi melalui
N =
t p
dengan
terlebih
dahulu
melakukan estimasi terhadap p , yakni pˆ , sehingga diperoleh taksiran ukuran populasi, yaitu t Nˆ = . Pada Metode Direct Sampling, beberapa pˆ waktu kemudian (tahap kedua), dilakukan pengambilan sampel secara acak kembali berukuran n dari populasi yang sama guna memperoleh taksiran p . Dari sampel yang diperoleh tersebut, misalkan terdapat sampel sejumlah s yang diperoleh dari pengambilan sebelumnya, yaitu sampel yang memiliki tanda pengenal. Dengan demikian, proporsi sampel yang diberi tanda pengenal dalam sampel kedua tersebut ( pˆ ) adalah sebesar
pˆ =
s n
ˆ taksiran ukuran populasi menjadi N=
sehingga t = pˆ
nt s
[7]. Berbeda dengan Metode Direct Sampling, tahap kedua dari Metode Inverse Sampling dilakukan melalui pengambilan sampel kembali secara acak dari populasi yang sama hingga terdapat sampel sejumlah s yang berasal dari pengambilan sebelumnya, yakni sampel yang memiliki tanda
Prosiding Seminar Nasional Matematika 2010 – Departemen Matematika FMIPA UI
253
Statistika
pengenal. Misalkan, jumlah sampel yang terambil pada tahap kedua adalah sebanyak n sampel, yaitu terdiri dari sampel yang sebelumnya terambil pada pengambilan pertama dan yang bukan. Pengambilan sampel tahap kedua ini dilakukan guna memperoleh taksiran p . Dengan demikian, proporsi sampel yang diberi tanda pengenal dalam sampel kedua tersebut ( pˆ ) s adalah sebesar pˆ = sehingga taksiran ukuran n t nt ˆ [7]. populasi menjadi N= = pˆ s
Beberapa asumsi yang digunakan dalam penggunaan Metode Direct Sampling untuk mengestimasi ukuran populasi ini adalah sebagai berikut [1]: 1. Tanda pengenal yang dikenakan oleh sampel pada pengambilan pertama tidak dapat hilang dan harus dapat dilihat. 2. Tidak ada tambahan objek dalam populasi, baik melalui reproduksi, imigrasi, maupun pertumbuhan. 3. Objek-objek yang diberi tanda pengenal ataupun yang tidak harus sama dalam segala hal, seperti tingkat kematian, aktivitas, respon terhadap jebakan dan lain sebagainya. Akan tetapi, ditemukan kembali atau tidaknya objek yang diberi tanda pengenal tersebut tidak harus sama. 4. Pengambilan sampel pada tahap pertama dan tahap kedua haruslah acak.
atau tidak. Akan tetapi, sebelumnya akan diberikan nilai ekspektasi dan variansi dari s berikut ini.
n
E ( s ) = E ∑ Ii i =1
= ∑ E ( Ii ) n
i =1
= E ( I1 ) + E ( I 2 ) + + E ( I n ) =n
t N
n Var ( s ) = Var ∑ I i i =1
= ∑ Var ( I i ) n
i =1
= Var ( I1 ) + Var ( I 2 ) + + Var ( I n ) =n
t t 1 − N N
Oleh karena itu, diperoleh ekspektasi dari Nˆ [5] sebagai berikut: nt E Nˆ = E s
( )
1 = nt E s
Taylor (Lampiran 1)
E (1) 1 1 − ⋅ ⋅ cov 1, s + Var s ( ) ( ) 3 E ( s ) ( E ( s ) )2 E s ( ) ( )
≈ nt
1 1 − nt nt N N
= nt HASIL DAN DISKUSI Pertama-tama, akan diberikan estimasi ukuran populasi menggunakan Metode Direct Sampling. Berdasarkan Bahan dan Metode sebelumnya, diketahui bahwa taksiran ukuran populasi adalah nt di mana s adalah jumlah sampel pada Nˆ = s
pengambilan kedua yang sebelumnya terambil n
pada tahap pertama. Oleh karena itu, s = ∑ Ii di i =1
mana I i bernilai 1, jika sampel yang terambil pada tahap kedua sebelumnya terambil pada tahap pertama dan bernilai 0, jika sampel yang terambil pada tahap kedua sebelumnya tidak terambil pada tahap pertama. Dengan demikian, I i berdistribusi
dengan aproksimasi
( )
= nt
N
nt
+
N3
( nt )3
2
⋅
⋅0+
1
( nt N )
3
⋅
nt N
t − 1 N
nt t 1 − N N
(N − t). nt Dengan demikian, Nˆ bukan merupakan taksiran yang unbiased untuk N kecuali ukuran sampelnya besar, yakni t dan n sehingga N membuat ( N − t ) menjadi kecil nilainya, atau nt dengan kata lain bias dari Nˆ mendekati nol. Selain itu, berikut ini diberikan variansi dari Nˆ [5]. N+ =
N
Bernoulli dengan probabilitas bahwa sampel yang terambil pada tahap kedua sebelumnya terambil pada tahap pertama adalah sebesar
t N
atau
dengan kata lain E ( I i ) = t . Selanjutnya, akan N
diperiksa apakah Nˆ merupakan taksiran yang unbiased untuk ukuran populasi sebenarnya ( N )
254
Prosiding Seminar Nasional Matematika 2010 – Departemen Matematika FMIPA UI
Statistika
( )
nt Var Nˆ = Var s
itu, n dikatakan berdistribusi Binomial Negatif dengan probabilitas bahwa sampel yang terambil pada tahap kedua sebelumnya terambil pada tahap
2 1 = ( nt ) Var s
dengan aproksimasi Taylor (Lampiran 2)
pertama adalah sebesar
t . Selanjutnya, akan N
diperiksa apakah Nˆ merupakan taksiran yang
2 unbiased untuk ukuran populasi sebenarnya ( N ) Var (1) Var ( s ) 2⋅cov (1, s ) 2 E (1) ⋅ + − ≈ ( nt ) atau tidak. E ( s ) ( E (1) )2 ( E ( s ) )2 E (1)⋅E ( s ) nt E Nˆ = E s nt t 2
2 1 = ( nt ) nt N
0 N 1 − N − 2 ⋅ 0 ⋅ 2 + 2 (1) 1 ⋅ nt nt N N
(
)
t 2 1 − 2 N N = ( nt ) ⋅ 0 + − 0 ( nt )2 nt N
(
( nt )
=
3
=
t N 2 1 − N ⋅ nt ( nt )2 N
2
(
)
)
t N
N 1 − nt
( )
=
t E (n) s t ∞ s n=s
n − 1 t s t n − s ⋅ ⋅ 1 − N s − 1 N
= ∑ n ⋅
s − 1 t s t s − s s⋅ ⋅ ⋅ 1 − s − 1 N N ( s + 1) − 1 t s t ( s + 1) − s t + ( s + 1)⋅ ⋅ ⋅1 − = N − 1 s N s s s + 2)− s ( ( s + 2 ) − 1 t t + ( s + 2 )⋅ ⋅ N ⋅ 1 − N s 1 − +
N (N − t) 2
=
nt
nt Dengan mensubstitusikan Nˆ = ke dalam N , s
berikut ini diperoleh taksiran dari variansi Nˆ ,
( Nˆ ) [7]. yaitu Var ( Nˆ ) = Var
2 Nˆ ( Nˆ − t )
nt 2
=
nt nt − t s s
nt =
nt nt − t s
s = =
nt
2
3
(n s
t 1 + ( s + 1)⋅1 − N s t t 2 t ( s + 1)⋅( s + 2 ) = ⋅ s ⋅ ⋅ + ⋅1 − s N 2! N +
2
nt ( nt − ts )
s
s t s t t s⋅ + s⋅( s + 1)⋅ ⋅1 − N N N t s⋅( s + 1)⋅( s + 2 ) t s t 2 = + ⋅ ⋅1 − s N 2! N +
− s)
3
Selanjutnya, akan diberikan pula penggunaan Metode Inverse Sampling dalam mengestimasi ukuran populasi. Berdasarkan Bahan dan Metode sebelumnya, diketahui bahwa taksiran ukuran nt di mana n adalah populasi adalah Nˆ =
s + 1 t 1 + ⋅1 − N 1 s s + 2 t 2 t = t ⋅ ⋅ + ⋅1 − N N 2 + s t k t ∞ s + k ⋅1 − ⋅ ∑ N N k =0 k
= t ⋅
s
jumlah sampel pada pengambilan kedua setelah yang berasal dari sampel sejumlah s pengambilan sebelumnya diperoleh. Oleh karena
Prosiding Seminar Nasional Matematika 2010 – Departemen Matematika FMIPA UI
255
Statistika
−( s + 1) s t t ( Lampiran 3) ⋅ 1 − 1 − N N s −( s + 1) t t = t ⋅ ⋅ N N
= t ⋅
=t⋅
N t
=N Dengan demikian, diperoleh bahwa merupakan taksiran yang unbiased untuk N .
Nˆ
Dalam melengkapi pembahasan mengenai estimasi ukuran populasi menggunakan Metode Direct Sampling dan Inverse Sampling, maka selanjutnya diberikan sebuah contoh estimasi ukuran populasi kucing di Perumahan Bukit Rivaria Sawangan – Depok pada bulan Desember 2009. Dalam pengambilan sampel pertama kali, peneliti memperoleh 40 kucing yang kemudian diberi tanda pengenal untuk selanjutnya dilepaskan kembali. Dengan menggunakan Metode Direct Sampling, beberapa hari kemudian, dilakukan pengambilan sampel untuk kedua kalinya dan diperoleh 70 kucing dengan 24 di antaranya memiliki tanda pengenal yang diberikan pada tahap pertama. Dengan demikian, taksiran ukuran populasi kucing di lingkungan tersebut adalah sebagai berikut:
( 70 ) ⋅ ( 40 ) = 116, 67 atau Nˆ = 117 Nˆ = ( 24 )
dengan variansi ( Nˆ ) = Var
70⋅( 40 )2 ( 70 − 24 ) = 372, 69 24 3
( )
sedemikian sehingga diperoleh standar error
= Var 372,69 19, 31. ( Nˆ ) = Oleh karena itu, aproksimasi interval kepercayaan 95% terletak di antara 117 ± 1, 96 ⋅ 19, 31 =117 ± 37, 85 = ( 79,15; 154,85 )
atau ( 79, 155 ) . Sedangkan, dengan menggunakan Metode Inverse Sampling, beberapa hari kemudian, dilakukan pengambilan sampel untuk kedua kalinya di mana ditetapkan bahwa pengambilan sampel yang kedua ini dapat dihentikan jika telah diperoleh kucing sejumlah 15 ekor yang berasal dari pengambilan sebelumnya. Setelah dilakukan pengambilan kembali dengan ketentuan di atas, sampel yang diperoleh pada tahap kedua ini adalah sebanyak 42 ekor. Dengan demikian, taksiran ukuran populasi kucing adalah sebagai berikut:
KESIMPULAN Berdasarkan Hasil dan Diskusi di atas, maka dapat disimpulkan bahwa baik menggunakan Metode Direct Sampling maupun Metode Inverse Sampling, estimasi ukuran populasinya adalah banyaknya sampel yang diambil dari populasi pada tahap pertama dibagi dengan proporsi sampel yang diberi tanda pengenal dalam sampel tahap kedua. Untuk Metode Direct Sampling, taksiran ukuran populasi yang diperoleh tersebut dapat dikatakan baik jika ukuran sampel pengambilan tahap pertama dan kedua besar. DAFTAR PUSTAKA [1] Brewer, R. and Margaret T. McCann. 1982. Laboratory and Field Manual of Ecology, New York: Saunders. [2] Chapman, Douglas G. 1952. Inverse, Multiple, and Sequential Sample Censuses, Biometrics, Vol. 8, Num. 4, 286 – 306. [3] Haag, M. and William N. Tonn. 1998. Sampling, Density Estimation, and Spatial Relationship, Tested studies for laboratory teaching, Vol. 19, 197 – 216. [4] McDonald, Trent L. and Steven C. Amstrup. 2001. Estimation of Population Size Using Open Capture – Recapture Models, Journal of Agricultural, Biological, and Environment Statistics, Vol. 6, Num. 2, 206 – 220. [5] Mood, A. M., F. A. Graybill, and D. E. Boes. 1974. Introduction to the Theory of Statistics, New York: McGraw-Hill. [6] Scheaffer, Richard L. 1974. On Direct versus Inverse Sampling from Mixed Populations, Biometrics, Vol. 30, Num. 1, 187 – 198. [7] Scheaffer, Richard L., W. Mendelhall, and Lyman Ott. 1996. Elementary Survey Sampling, California: Wadsworth. [8] Sekar, C. C., and W. E. Deming. 1949. On a Method of Estimating Birth and Death Rates and the Extent of Registration, Journal of the American Statistical Association, Vol. 44, Num. 245, 101 – 115. [9] Thompson, Steven K. 2002. Sampling, Canada: Wiley.
( 42 ) ⋅ ( 40 ) = 112 . Nˆ = (15)
256
Prosiding Seminar Nasional Matematika 2010 – Departemen Matematika FMIPA UI
Statistika
LAMPIRAN 1 Akan dibuktikan bahwa E
1 −µ X + (Y − µY ) 2 + Y µY µY µY −1 2 ( X − µ X ) ⋅ 0 + 2 ( X − µ X )(Y − µY ) 2 1 µY 2! 2 2µ X + ( Y − µY ) ⋅ 3 µY X
µx X µx 1 Y ≈ µ − µ 2 cov [ X , Y ] + µ 2 var [Y ] y y y
di mana X dan Y merupakan variabel random. Aproksimasi dari formula E
X Y diperoleh dari
ekspansi Deret Taylor untuk 2 variabel di sekitar ( a, b ) berikut ini:
µX
≈
µX
=
−
1 ( x − a ) f xx ( a, b ) + 2 ( x − a )( y − b ) f xy ( a, b ) µ 2! + ( y − b )2 f ( a, b ) = X yy µ 2
+
µY
f ( x, y ) ≈ f ( a, b ) + ( x − a ) f x ( a, b ) + ( y − b ) f y ( a, b ) +
+ ( X − µX )
( X − µ X ) − µ X ( Y − µY ) µY
µY
2 µY
3 µY
2
( X − µ X )(Y − µY ) + µ X
( Y − µY )
2
Y
Pertama-tama akan dibuat ekspansi Deret Taylor x dengan beberapa turunan untuk f ( x, y ) = y parsialnya adalah sebagai berikut: 1 −1 f x ( x, y ) f xy ( x, y ) , f xx ( x, y ) 0,= = = 2 y y
2x −x , f yy ( x, y ) = 2 3 y y Dengan demikian, ekspansi Deret Taylor untuk x di sekitar ( µ X , µY ) adalah sebagai f ( x, y ) = y berikut:
+ +
µY ( X − µ X ) − µ X (Y − µY ) − ( X − µ X )(Y − µY ) µY
2
µX 3 µY
=
µX
=
µX
f y ( x, y ) =
µY µY
(Y − µY ) +
( 2 X µY − XY − µ X µY ) + µ X
(Y − µY )
2
−
( XY − 2 X µY + µ X µY ) + µ X
(Y − µY )
2
atau
X Y
≈
2
µX µY
−
2 µY
3 µY
2 µY
3 µY
( XY − 2 X µY + µ X µY ) + µ X 2 µY
3 µY
(Y − µY )
2
sehingga
Prosiding Seminar Nasional Matematika 2010 – Departemen Matematika FMIPA UI
257
.
Statistika
µ X ( XY − 2 X µY + µ X µY ) µ − 2 µY X Y ≈ E E Y µX 2 + µ 3 (Y − µY ) Y µ ( XY − 2 X µY + µ X µY ) = E X −E 2 µY µY µ 2 + E X3 (Y − µY ) µY µX
=
µY
+
−
µX
µX
2
2 µY
µ
1
µY
+
µX 3 µY
2 µY
1
µY
µY
+
µY
3
2
= −
2
µX 3 µY
µ
µY
2
cov [ X , Y ] 2 µY
+
)
µX µY
3
[ ]
Var Y
Jadi, terbukti bahwa E
=
µY µX µY X
µY
1 −µ X + (Y − µY ) 2 µY µY
+ ( X − µX ) +
−
X
µY
−
µXY 2 µY
µX µY +
−
µXY 2 µY
+
µX µY
µX µY
µX X
Y − + 1 µY µ X µY
sehingga
(
E (Y − µY )
X = −
Y
µX
Var
µ X ≈ Var X Y µY
X Y − + 1 µ X µY
2
2
µY
≈
=
µX 1 = − 2 E [ XY ] − µ X µY +
Dengan demikian, ekspansi Deret Taylor untuk x di sekitar ( µ X , µY ) adalah f ( x, y ) = y sebagai berikut:
X
( E [ XY ] − 2µY µ X + µ X µY )
E (Y − µY )
µY
+ ( y − b ) f y ( a, b )
( E [ XY ] − 2µY E [ X ] + µ X µY )
Var [ X ] Var [Y ] 2 cov [ X , Y ] + − 2 2 µy µx µ y µx
f ( x, y ) ≈ f ( a, b ) + ( x − a ) f x ( a, b )
2
E (Y − µY )
µX
µX
2
2
Sebelumnya, diberikan ekspansi Deret Taylor untuk dua variabel di sekitar ( a , b ) berikut ini:
=
X = −
X µx Var Y ≈ µ y
( E [ XY ] − E [2 X µY ] + E [µ X µY ])
1
E (Y − µY )
3 µY
Akan dibuktikan bahwa
E ( XY − 2 X µY + µ X µY )
µ
µY
µY
E (Y − µY )
3 µY
X = −
+
1
LAMPIRAN 2
µx X µx 1 Y ≈ µ − µ 2 cov [ X , Y ] + µ 2 Var [Y ] . y y y
µ X Y = X Var − + 1 µY µ X µY X Y Var + Var µY µX 2 µ X Y , = X +Var [1] − 2 cov µY µ X µY +2 cov X ,1 − 2 cov Y µX µY
,1
Var [ X ] Var [Y ] µ2 + µ2 + 0 µ X Y = X X Y 2 cov , µ [ ] Y − + 0 − 0 µ X µY 2
µ Var [ X ] Var [Y ] 2 cov [ X , Y ] = X + − 2 2 µY µ X µY µY µ X 2
Dengan demikian, terbukti bahwa
258
Prosiding Seminar Nasional Matematika 2010 – Departemen Matematika FMIPA UI
Statistika
X µ Var ≈ x Y µ y
2
Var [ X ] Var [Y ] 2cov [ X , Y ] + − . 2 µ y2 µ x µ y µx
substitusikan t = − n , sehingga:
(1− x )
f ( x)
Deret Taylor untuk didefinisikan sebagai:
x=a
di sekitar f
'
''
( a ) ( x −a ) 2 2!
+
f
'''
( a ) ( x − a )3 3!
f
3! n ( n +1) x
2
+
+
( n ) ( n +1) ( n + 2 ) x 2
2
+
2
2!
∞ n + k −1 k x , k =0 k
= ∑
( x ) = t ( t −1) (1− x )t − 2
3!
( n ) ( n +1) ( n + 2 ) x n ( n +1) x + = 1 + (n) x + + + 3!
1+ n −1 1 2+ n −1 2 x + x 1 2
( x ) =−t (1− x )t −1
'''
( n ) ( − n −1) ( − n −2 ) x 2
= 1+
t
''
2
2!
= 1 + (n) x +
Misalkan f ( x )= (1− x ) dan a = 0 maka:
f
− n ( − n −1) x
2!
) f ( a ) + f ( a ) ( x−a ) + f ( x=
'
1 + (n) x + =
+
LAMPIRAN 3
f
−n
3+ n −1 3 x 3
+
−1< x<1
+
.............. ( iii )
( x ) =−t ( t −1) ( t −2 ) (1− x )t −3
f
j
( x ) = ( −1) j t ( t −1) ( t −2 ) ( t − j +1) (1− x )t − j
sehingga f ( x )= (1− x )
t
= f ( 0 ) + f ( 0 ) ( x −0 ) + '
f
''
( 0 ) ( x −0 ) 2 2!
+
f
'''
( 0 ) ( x −0 ) 3!
= 1 + ( −t ) x +
3
+
t ( t −1) x
2!
2
+
( −t ) ( t −1) ( t −2 ) x 2 3!
+
Prosiding Seminar Nasional Matematika 2010 – Departemen Matematika FMIPA UI
259