BAB III METODE STRATIFIED RANDOM SAMPLING
3.1
Pengertian Stratified Random Sampling Dalam bukunya Elementary Sampling Theory, Taro Yamane menuliskan
βThe process of breaking down the population into strata, selecting simple random samples from each stratum, and combining these into a single sampel to estimate population parameter is called stratified random samplingβ. Berdasarkan kutipan di atas dapat dinyatakan bahwa stratified random sampling merupakan proses pengambilan sampel melalui proses pembagian populasi kedalam strata, memilih sampel acak sederhana dari setiap stratum, dan menggabungkannya ke dalam sebuah sampel untuk menaksir parameter populasinya. Sampel yang representatif adalah sampel yang benar-benar dapat mewakili karakteristik seluruh populasi. Jika populasi bersifat homogen, maka sampel bisa diambil dari populasi yang mana saja, namun jika populasi bersifat heterogen, maka sampel harus mewakili dari setiap bagian yang heterogen dari populasi tersebut sehingga hasil penelitian dari sampel dapat terpenuhi terhadap setiap anggota populasi. Proses pembagian populasi kedalam stratum bertujuan agar sampel yang diambil dari setiap stratum dapat merepresentasikan karakteristik
populasi yang
berukuran besar dan heterogen. Oleh karena itu, stratum harus dibentuk sehomogen mungkin dengan manganalisis karakteristik populasi dengan baik. Terdapat tiga
tahapan yang harus dilakukan dalam mengambil sampel dengan menggunakan metode stratified random sampling, yaitu sebagai berikut:
1. Tahap Pertama Populasi yang berukuran N dibagi menjadi sub-sub populasi yang masingmasing terdiri atas π1 , π2 , π3 , β¦ , ππΏ elemen. Diantara dua sub populasi tidak boleh ada yang saling tumpang tindih sehingga π1 + π2 + π3 + β― + ππΏ = π. Demokrawati, Fiqa A. 2014 ANALISIS QUICK COUNT DENGAN MENGGUNAKAN METODE STRATIFIED RANDOM SAMPLING (STUDI KASUS PEMILU WALIKOTA BANDUNG 2013) Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
23
Setiap stratum dapat dipandang sebagai populasi tersendiri (sub populasi). Dalam pembentukan stratum harus diperhatikan variabel apa yang dijadikan sebagai dasar pembentukan stratum, yaitu variabel yang memiliki korelasi tinggi dengan variabel yang diteliti. 2. Tahap Kedua Sampel diambil dari setiap stratum secara terpisah (independen) dengan ukuran sampel dari masing-masing stratum adalah π1 , π2 , π3 , β¦ , ππΏ dengan syarat π1 + π2 + π3 + β― + ππΏ = π. 3. Tahap Ketiga Setelah diperoleh sampel, selanjutnya dilakukan penaksiran terhadap parameter yang diperlukan dan selanjutnya dibuat kesimpulan untuk populasi berdasarkan hasil penaksiran sampel.
3.2
Total Populasi
3.2.1 Pengertian Total Populasi Apabila N menyatakan banyak anggota populasi dan L menyatakan banyak stratum maka total populasi adalah jumlah dari total stratum dan didefinisikan sebagai berikut: πΏ
πΏ
πβ
π = β πβ = β β πβπ β
β=1 π=1
Dimana πβ adalah total dari stratum h yang didefinisikan sebagai berikut: πβ
πβ = β πβπ π=1
πβπ adalah sampel ke-i pada stratum ke-h. Rata-rata stratum didefiniskan sebagai berikut:
24
πΜ
β =
πβ πβ
Dan rata-rata populasi didefinisikan sebagai berikut:
πΜ
=
π βπΏβ πβ πΜ
β = π π
3.2.2 Penaksir Total Populasi Total populasi merupakan jumlah dari total stratum sehingga dalam menaksir total populasi dapat melalui penjumlahan dari taksiran total stratum. Taksiran total stratum dapat diperoleh dengan rumus sebagai berikut: πΜβ = πβ π₯Μ
β
(3.1)
Dimana π₯Μ
β merupakan rata-rata sampel dari sebuah subsampel acak yang berukuran πβ dari stratum ke-h. Taksiran total populasi πΏ adalah jumlah dari taksiran total stratum seperti yang dijabarkan dalam persamaan berikut: πΏ
πΜπ π‘ = π1 π₯Μ
1 + π2 π₯Μ
2 + β― + ππΏ π₯Μ
πΏ = β πβ π₯Μ
β
(3.2)
β=1
dan taksiran rata-rata populasi menjadi πΜ π π₯Μ
+. . +ππΏ π₯Μ
πΏ βπΏβ=1 πβ π₯Μ
β Μ Μ
β = π₯Μ
π π‘ = π π‘ = 1 1 π = π π1 + β― + ππΏ π Karena rata-rata sampel stratum π₯Μ
β yang diperoleh dengan sampling acak sederhana merupakan penaksir tak bias dari rata-rata stratum πΜ
β . πΈ(π₯Μ
π π‘ ) = πΜ
β Maka nilai ekspektasi π₯Μ
π π‘ menjadi E(π₯Μ
π π‘ ) = =
πΈ(π1 π₯Μ
1 + β¦+ππΏ π₯Μ
πΏ ) π π1 πΜ
1 +β―+ππΏ πΜ
πΏ π
=
π1 +β―+ ππΏ π
Jadi π₯Μ
π π‘ merupakan penaksir tak bias untuk πΜ
.
=
π π
= πΜ
25
Informasi mengenai π1 πππ π2 dibutuhkan untuk menentukan penaksir π
π₯Μ
π π‘ karena E(π₯Μ
π π‘ ) = π , π πβπππππ πΈ (ππ₯Μ
π π‘ ) = π. Pada penjabaran di atas sudah diketahui taksiran dari rata-rata populasi sehingga akan diperoleh persamaan berikut: πΏ
ππ₯Μ
π π‘ = β πβ π₯Μ
β = πΜπ π‘ β
Ini artinya, penaksir πΜπ π‘ juga merupakan penaksir tak bias untuk π karena dapat ditunjukkan bahwa πΈ(πΜπ π‘ ) = π 3.2.3 Varians Penaksir Total Populasi dan Penaksirnya Varians dari XΛ st diperoleh dengan menggunakan hasil dari varians x st . Sebelum membahas mengenai varians untuk penaksir total populasi, akan dijelaskan terlebih dahulu mengenai varians untuk rata-rata sampel. Variansi dari π₯Μ
π π‘ didefinisikan oleh: π
ππ₯Μ
2π π‘
1 = β (π₯Μ
π π‘ β πΜ
)2 π π π‘=1
π π M adalah banyaknya kemungkinan rata-rata sampel, dimana π = ( 1 ) ( 2 ). π1 π2 Selanjutnya akan dicari π(π₯Μ
π π‘ ) dalam bentuk varians stratum π 2 β yang dapat menunjukkan karakteristik dari π(π₯Μ
π π‘ ). π 2 β didefinisikan sebagai berikut: πΏ
πβ2
1 = β(πβπ β πΜ
β )2 πβ β 1
(3.3)
β=1
Ketika populasi dan sampel cukup besar, maka kemungkinan rata-rata sampel M akan semakin besar sehingga dalam menghitung π(π₯Μ
π π‘ ) menggunakan definisi ππ₯Μ
2π π‘ akan sulit. Selanjutnya akan ditunjukkan bagaimana π(π₯Μ
π π‘ ) dapat dijelaskan dalam bentuk πβ2 . Diketahui, π₯Μ
π π‘ =
π1 π₯Μ
1 + π2 π₯Μ
2 = π€1 π₯Μ
1 + π€2 π₯Μ
2 π
26
dimana π€β =
πβ π
, dan disebut stratum weight (bobot). Selama πβ dipilih dengan
sampling acak dan saling bebas antara satu dengan yang lainnya, maka diperoleh: V(π₯Μ
π π‘ ) = π€12 π(π₯Μ
1 ) + π€22 V(π₯Μ
2 ) Berdasarkan definisi varians untuk rata-rata sampel yang dipilih secara acak dan tanpa pengembalian, yaitu ππ₯Μ
2 =
πβπ π 2 π
π
, maka persamaan di atas dapat diubah
menjadi sebagai berikut: V(π₯Μ
π π‘ ) = π€12 π(π₯Μ
1 ) + π€22 V(π₯Μ
2 )
=
w12
N1 β n1 S12 N β n2 S22 2 2 + w2 N1 n1 N2 n2 π
2 π βπ π 2 β β β
= βπΏβ=1 ( πβ )
πβ
πβ
Persamaan di atas dapat dituliskan kembali dalam bentuk: 1
π(π₯Μ
π π‘ ) = π2 β πβ2
πβ βπβ πβ2 πβ
πβ
(3.4)
πβ2 menunjukkan varians dalam masing-masing stratum. Jadi dapat disimpulkan bahwa ketika varians dalam masing-masing stratum kecil, maka V(π₯Μ
π π‘ ) akan kecil dan ketelitian dari π₯Μ
π π‘ akan tinggi. Karena rumusan dari V(π₯Μ
π π‘) memuat πβ2 , maka tidak dapat digunakan pada masalah praktis dimana πβ2 biasanya tidak diketahui. Oleh karena itu, dibutuhkan penkasir untuk πβ2 dan diperoleh penkasir untuk V(π₯Μ
π π‘). Karena π β2 adalah sebuah penaksir tak bias dari πβ2 maka selanjutnya akan disubtitusikan π β2 kedalam
persamaan (3.4). Dimana, πΜ (π₯Μ
π π‘ ) merupakan penaksir tak bias untuk V(π₯Μ
π π‘). 2
1 π βπ π πΜ (π₯Μ
π π‘ ) = π2 β πβ2 βπ β πβ β
β
Setelah diperoleh varians π₯Μ
π π‘ selanjutnya akan dibahas mengenai varians dari penaksir total populasi, yaitu sebagai berikut:
27
Varians dari XΛ st adalah:
V(πΜst) = V (N π₯Μ
st ) = N2 V(π₯Μ
st) 2 1 2 N h ο nh S h N ( 2ο₯ h ) N N h nh
=
N2
=
ο₯ Nh2
N h ο nh S h2 N h nh
1 Ini artinya π(πΜst) sama dengan π(π₯Μ
st) dengan syarat 2 dihilangkan. N Estimator π(πΜst) diperoleh untuk mendapatkan penaksir π(π₯Μ
st), yaitu dengan cara mengganti S h2 menjadi s h2 . Oleh karena itu, estimatornya adalah: πΏ
πΜ (πΜst) = β πβ2 β=1
πβ β πβ πβ2 πβ πβ
(3.5)
Dimana, s h2 ο½
1 nh ( xhi ο xh ) 2 ο₯ nh ο 1
Dengan menggunakan hasil VΛ ( x st ) yang merupakan penaksir tak bias dari
V ( x st ) , kita dengan mudah dapat menunjukkan VΛ ( XΛ st ) merupakan penaksir tak bias dari V ( XΛ st ) . Diketahui bahwa:
E[VΛ ( xst )] ο½ V ( xst ) Dimana xst ο½ XΛ st / N . Substitusikan x st ke kedua ruas persamaan di atas, maka diperoleh:
ο© 1 οΉ 1 E οͺ 2 VΛ ( XΛ st )οΊ ο½ 2 V ( XΛ st ) ο«N ο» N Maka diperoleh:
E[VΛ ( XΛ st )] ο½ V ( XΛ st )
28
3.3
Alokasi Sampel Alokasi sampel merupakan suatu metode untuk menentukan ukuran
sampel dari setiap stratum untuk didistribusikan kedalam sampel n. Ada dua masalah yang perlu dipertimbangkan oleh peneliti, yaitu menentukan ukuran sampel n dan mengalokasikan sampel ini diantara strata h untuk menentukan nh. Terdapat beberapa metode yang dapat digunakan dalam mengalokasikan sampel dari setiap strata yaitu sebagai berikut: 3.3.1 Alokasi Sembarang Alokasi sembarang merupakan suatu cara mengalokasikan sampel dimana ukuran sampel masing-masing strata ditentukan secara sembarang dengan syarat, minimal harus ada dua satuan pengamatan yang dipilih dari setiap stratanya. Dalam praktek, alokasi seperti ini jarang dan tidak disarankan untuk digunakan karena menyebabkan standar error membesar. 3.3.2 Alokasi Proporsional Alokasi proporsional merupakan suatu metode untuk mengalokasikan sampel dimana ukuran sampel untuk setiap stratum sesuai dengan proporsi ukuran masing-masing stratum. Metode ini paling sering digunakan karena praktis dan jelas, tidak bergantung pada pertimbangan biaya dan peneliti hanya perlu mengetahui ukuran stratum. Metode alokasi proporsional bersifat sederhana dan lebih mudah bila dibandingkan dengan metode lainnya dengan tingkat ketepatan yang tidak berbeda jauh dengan metode lainnya. Berikut rumus yang digunakan untuk mengalokasikan sampel secara proporsional: πβ =
πβ .π π
29
Dimana πβ merupakan ukuran sampel dari setiap strata, dan rumus di atas menunjukkan bahwa proporsional).
n
harus dialokasikan sesuai dengan
N h N (secara
Pengambilan sampel dilakukan secara acak sederhana di setiap
strata, sehingga peluang dari setiap unit sampling di strata h untuk terpilih sebagai subsampel n h yaitu
nh ο½ f . Setiap unit dalam populasi mempunyai Nh
peluang yang sama untuk terpilih sebagai sampel. 4. Alokasi Optimum Dalam penarikan sampel stratifikasi, nilai dari ukuran sampel nh dalam masing-masing strata dipilih oleh peneliti. Dalam melakukan penelitan, peneliti akan dihadapi oleh dua kemungkinan dalam mempertimbangkan biaya penelitian atau memperkecil error dalam tahap penarikan sampel, yaitu peneliti mungkin memilih untuk meminimumkan π(π₯Μ
π π‘ ) dengan biaya tertentu untuk memperoleh sampel atau untuk meminimumkan biaya dengan sebuah nilai π(π₯Μ
π π‘ ) tertentu. Metode untuk mengalokasikan sampel n diantara strata untuk meminimalkan _
V ( xst ) disebut alokasi optimum. Berikut ini adalah bentuk sederhana dari fungsi
biaya, yaitu: L
Biaya = c ο½ c0 ο« ο₯ ch nh Biaya dalam setiap lapisan adalah proposional dengan ukuran sampel, tetapi biaya perunit ch dapat bervariasi antara lapisan satu dengan lapisan lainnya. Biaya overhead dinyatakan dengan c0, fungsi biaya ini adalah fixed cost (ongkos tetap) bila sebagian besar biaya itemnya diperoleh dengan mengukur setiap unit dan tidak bergantung pada ukuran dari sampel survey. ch merupakan variable cost dan menunjukkan ongkos tiap unit sampel pada stratum ke h. Dalam penarikan sampel acak stratifikasi dengan sebuah fungi biaya seperti di atas, variansi perkiraan rata-rata xst adalah minimum untuk biaya tertentu C, dan biaya adalah minimum untuk π(π₯Μ
π π‘ ) tertentu. Diketahui rumus variansi sebagai berikut:
30
_
V ( xst ) ο½ Masalah
yang
dihadapi
1 L 2 N h ο nh Sh2 ο₯ Nh N n N2 h h adalah
bagaimana
memilih
nh
agar
_
meminimumkan V ( xst ) dengan biaya tertentu (dengan fungsi biaya linear). Perumusan untuk menentukan besarnya sampel dari setiap stratum agar _
meminimumkan V ( xst ) adalah sebagai berikut:
nh ο½
N h Sh / ch
ο·n
L
ο₯N S h
h
/ ch
5. Alokasi Neyman Alokasi Neyman digunakan apabila varians setiap strata berbeda-beda besarnya sedangkan ongkos per unit penarikan sampel dianggap relatif sama. Rumus ukuran sampel pada setiap strata untuk alokasi Neyman adalah sebagai berikut: πβ =
πβ πβ πΏ ββ=πΌ πβ πβ
π
Perumusan di atas menunjukkan bahwa sampel berukuran π dialokasikan secara proporsi ke πβ πβ . Alokasi Neyman dipergunakan juga ketika strata besar dan dari strata yang heterogen. Sebagai contoh jika sebuah kota dibagi dalam dua wilayah dan dalam wilayah satu terdapat sedikit perbedaan antara pendapatan keluarga, sedangkan di wilayah kedua terdapat variasi yang besar. Dengan rumus alokasi Neyman tersebut dapat diambil sampel wilayah kedua. Jelas bahwa distrik dengan varians yang besar dan sampel yang besar akan memeberikan sampel yang tidak representatif.
31
32
33