METODE PENARIKAN SAMPEL
SYSTEMATIC RANDOM SAMPLING Oleh: Adhi Kurniawan
Pengantar • Pada penarikan sampel acak sederhana (SRS) setiap unit dipilih dengan
menggunakan angka random. • Dengan demikian kita harus menarik sampel sebanyak n kali. • Untuk memperingan penarikan sampel ini maka diterapkan penarikan sampel secara sistematik, dengan hanya mengambil satu angka random saja dan lainnya akan mengikuti dengan menghitung interval-nya.
Jadi, systematic sampling adalah suatu teknik sampling di mana hanya unit pertama dipilih dengan bantuan angka random dan untuk mendapatkan sampel sisanya dipilih secara otomatis menurut interval yang ditentukan sebelumnya.
SRS vs Systematic
Prinsip • N unit dalam populasi diberi nomor urut 1 s/d N • Ada interval (k) antar unit sampel: 𝑘 =
𝑁 𝑛
• Unit sampel pertama 𝐴𝑅1 dipilih secara acak/random
Cara 1: antara 1-k (Linear Systematic Sampling) Cara 2: antara 1-N (Circular Systematic Sampling) • Unit sampel berikutnya ditentukan oleh interval (k), yaitu dengan menambahkan angka random unit terpilih sebelumnya dengan interval. 𝐴𝑅𝑛 = 𝐴𝑅𝑛−1 + 𝑘 • Pemilihan unit pertama akan menentukan sampel secara keseluruhan Misal: N=60; n=10; maka 𝑘 =
60 10
=6
No Mhs
1
2
3
4
5
6
7
8
9
…
60
Tinggi (cm)
165
162
155
176
160
180
176
173
154
…
166
Jika 𝐴𝑅1 yang terpilih adalah 2 maka sampel terpilihnya: no: 2,8,14,20,26,32,38,44,50,56
Linear Systematic Sampling a. Hitung interval, yaitu
𝑁 𝑘= 𝑛 b. Tentukan satu angka random yang lebih kecil atau sama dengan intervalnya (pilih AR≤ 𝑘) dari tabel angka random Angka random ini selanjutnya disebut angka random pertama 𝐴𝑅1 . Unit yang nomor urutnya sama dengan AR ini terpilih sebagai sampel pertama. c. Angka random selanjutnya dihitung dengan interval: 𝐴𝑅2 = 𝐴𝑅1 + 𝑘 𝐴𝑅3 = 𝐴𝑅2 + 𝑘 = 𝐴𝑅1 + 2𝑘 𝐴𝑅4 = 𝐴𝑅3 + 𝑘 = 𝐴𝑅1 + 3𝑘 … 𝐴𝑅𝑛 = 𝐴𝑅𝑛−1 + 𝑘 = 𝐴𝑅1 + 𝑛 − 1 𝑘 Unit yang nomor urutnya sama dengan AR di atas terpilih sebagai sampel. d. Jika N tidak dapat dinyatakan dalam bentuk N=nk, maka k diambil sebagai bilangan bulat yang paling dekat dengan N/n.
Contoh: Populasi N=10 akan diambil sampel n=3 secara linear systematic
1
2
3
4
5
6
7
8
Langkah 1: Menghitung interval 𝑁 10 𝑘= = = 3.33 ≈ 3 𝑛 3 Langkah 2: Menentukan sampel pertama dengan bantuan angka random Misal: 𝐴𝑅1 diambil secara independent choice of digits dengan permulaan pembacaan TAR baris 1 kolom 4, maka ambil 𝐴𝑅1 ≤ 𝑘 → 𝐴𝑅1 = 1 Langkah 3: menentukan sampel kedua sampai ketiga dengan bantuan interval 𝐴𝑅2 = 𝐴𝑅1 + 𝑘 = 1 + 3 = 4 𝐴𝑅3 = 𝐴𝑅2 + 𝑘 = 4 + 3 = 7
9
Baris 1 2 3 4 5
10
Kolom (1-5) 88347 5 7 1 40 74686 6801 3 57477
a. Hitung interval, yaitu
Circular Systematic Sampling
𝑁 𝑘= 𝑛 b. Tentukan satu angka random yang lebih kecil atau sama dengan populasi (pilih AR≤ 𝑁) dari tabel angka random. Angka random ini selanjutnya disebut angka random pertama 𝐴𝑅1 . Unit yang nomor urutnya sama dengan AR ini terpilih sebagai sampel pertama. c. Angka random selanjutnya dihitung dengan interval: 𝐴𝑅2 = 𝐴𝑅1 + 𝑘 𝐴𝑅3 = 𝐴𝑅2 + 𝑘 = 𝐴𝑅1 + 2𝑘 𝐴𝑅4 = 𝐴𝑅3 + 𝑘 = 𝐴𝑅1 + 3𝑘 … 𝐴𝑅𝑛 = 𝐴𝑅𝑛−1 + 𝑘 = 𝐴𝑅1 + 𝑛 − 1 𝑘 Unit yang nomor urutnya sama dengan AR di atas terpilih sebagai sampel. e. Jika setelah ditambahkan dengan interval, didapatkan AR yang lebih besar dengan nilai populasi (N) maka kurangkan AR tsb dengan nilai N. Unit yang nomor urutnya sama dengan AR setelah dikurangi N adalah unit yang terpilih sebagai sampel
Contoh: Populasi N=10 akan diambil sampel n=3 secara circular systematic
1
2
3
4
5
6
7
8
Langkah 1: Menghitung interval 𝑁 10 𝑘= = = 3.33 ≈ 3 𝑛 4 Langkah 2: Menentukan sampel pertama dengan bantuan angka random Misal: 𝐴𝑅1 diambil secara remainder approach dengan permulaan pembacaan TAR baris 1 kolom 1, maka 𝑁 ′ = 90, ambil 𝑎𝑛𝑔𝑘𝑎 𝑟𝑎𝑛𝑑𝑜𝑚 ≤ 𝑁 ′ → 𝑎𝑛𝑔𝑘𝑎 𝑟𝑎𝑛𝑑𝑜𝑚 = 88 → 88 𝑠𝑖𝑠𝑎 8 → 𝐴𝑅1 = 8 10 Langkah 3: menentukan sampel kedua sampai ketiga dengan bantuan interval 𝐴𝑅2 = 𝐴𝑅1 + 𝑘 = 8 + 3 = 11 − 10 = 1 𝐴𝑅3 = 𝐴𝑅2 + 𝑘 = 1 + 3 = 4
9
Baris 1 2 3 4 5
10
Kolom (1-5) 88347 5 7 1 40 74686 6801 3 57477
Latihan 1 • Seorang manajer perusahaan ingin mengetahui tingkat loyalitas pegawainya.
Untuk itu, dari 11 pegawai dilakukan penarikan 4 sampel secara sistematik. TAR
No Nama 1
Bima
2
Yudhistira
3
Pandhu
1
88347
4
Larasati
2
57140
5
Joseph
3
74686
6
Rukmini
4
68013
7
Sinta
57477
8
Haris
5
9
Indra
10 Wisnu 11
Krisna
Baris
Kolom (1-5)
Tentukan pegawai yang terpilih sampel jika penarikan sampel dilakukan dengan 1. Sistematik linear a. Penelusuran 𝐴𝑅1 dari TAR baris 1 kolom 4, independent choice of digits b. Penelusuran 𝐴𝑅1 dari TAR baris 3 kolom 4, remainder approach c. Penelusuran 𝐴𝑅1 dari TAR baris 1 kolom 4, quotient approach 2. Sistematik sirkuler a. Penelusuran 𝐴𝑅1 dari TAR baris 1 kolom 3, independent choice of digits b. Penelusuran 𝐴𝑅1 dari TAR baris 1 kolom 2, remainder approach c. Penelusuran 𝐴𝑅1 dari TAR baris 1 kolom 1, quotient approach
Ilustrasi Perbandingan Sistematik Linear dan Sirkuler untuk N=nk Sistematik linear
Sistematik Sirkuler
1 1
2
3
4
Jika diambil sampel dengan interval k=2, maka kemungkinan sampelnya: 1,3 2,4
2
4 3
Jika diambil sampel dengan interval k=2, maka kemungkinan sampelnya: 1,3 2,4
Ilustrasi Perbandingan Sistematik Linear dan Sirkuler untuk N≠nk Sistematik linear
Sistematik Sirkuler
1 1
2
3
4
5
Jika k=3, maka kemungkinan sampelnya: 1,4 2,5 3
2
5
4
3
Jika k=3, maka kemungkinan sampelnya: 1,4 4,2 2,5 5,3 3,1
Problem With Intervals (1) • If the population size N is not an integral multiple of k, a
problem arises. It can be solved in several ways and the sampler should choose the most convenient. 1. Permit the sample size to be either n or (n+1). Choose k so that N is greater than nk, but less than (n+1)k. Then, the random start will determine whether the sample size will be n or n+1. 2. Eliminate with epsem enough units to reduce the listings to exactly nk before selection with the interval k. The probability of selection over the two procedures is n/N. Instead of elimination, it may be convenient to select some listings with epsem, then add these duplicates to the end of the list
Problem With Intervals (2) 3. Consider the list to be circular, so that the last unit is
followed by the first. Choose a random start from 1 to N. Now add the intervals k until exactly n elements are choosen, going to the end of the list and then continuing to the beginning. 4. Using fractional intervals is simple with a decimal fraction. For example, suppose that to select a sample of n=100 units from a population of N=925 units, the interval k=N/n=925/100=9,25 is applied.
Implicit Stratification • Selain untuk mempermudah penarikan sampel, penarikan sampel sistematik
juga dapat meningkatkan efisiensi desain, misal dengan mengadakan pengaturan unit-unit (systematic arrangement). • Pengaturan unit-unit berdasarkan karakteristik tertentu memungkinkan sampel yang terpilih akan memiliki berbagai karakteristik sehingga lebih representatif. • Pengaturan unit-unit berdasarkan karakteristik tertentu, kemudian dilakukan penarikan sampel sistematik ini disebut implicit stratification. • Pengurutan biasanya didasarkan pada kriteria geografis seperti urban-rural, administrative region, ethnics subpopulations, atau socioeconomic groups, dsb. • Keuntungan implicit stratification: 1. Tidak perlu membangun explicit stratification, sampel otomatis akan teralokasi secara proporsional. 2. Sederhana, hanya memerlukan pengaturan unit-unit dan penggunaan interval untuk penarikan secara sistematik sampling. 3. Jika kriteria yang dijadikan dasar pengurutan mempunyai korelasi yang kuat dengan variabel yang diteliti maka akan meningkatkan presisi hasil estimasi
No urut rumah tangga
Pendidikan tertinggi KRT Kepala Rumah Tangga (KRT)
(1)
(2)
SMP SMA- Universi ke Diploma tas bawah (3)
(4)
1
JUNAIDI
√7
2
SHOFYAN FIRDAUS
√8
3
RAHMAD
√1
4
AHMAD ROFI'IH
√2
5
ANDI CAHYADI ALFARIS
√3
6
AINUR ROSYADI
7
SUBAIDI
8
MOH MASHUDI
9
QUDZI A SPD I
10
ABD GANI
11
CHOLISH
12
MOH FAISOL BASRI
(5)
√9 √4 √ 11 √5 √ 12 √6 √ 10
Dari kerangka sampel di samping (N=12) akan diambil sampel secara sistematik sebanyak n=6. Misalkan 𝐴𝑅1 = 2 maka sampel yang terpilih: Tanpa pengurutan 1. Shofyan Firdaus (SMA-Diploma)-2 2. Ahmad Rofi’ih (SMP ke bawah)-4 3. Ainur Rosyadi (SMA-Diploma)-6 4. Moh. Mashudi (Universitas)-8 5. Abd Gani (Universitas)-10 6. Moh Faisol (SMA-Diploma)-12 Populasi diurutkan terlebih dahulu menurut tingkat pendidikan 1. Ahmad Rofi’ih (SMP ke bawah)-2 2. Subaidi (SMP ke bawah) -4 3. Cholish (SMP ke bawah) -6 4. Shofyan Firdaus (SMA-Diploma) -8 5. Moh. Faisol (SMA-Diploma) -10 6. Abd Gani (Universitas) -12
KOMPOSISI K SAMPEL SISTEMATIK Nomor Gugus Sampel (Class)
Nomor sampel
1
2
…
i
…
k
1
𝑦1
𝑦2
…
𝑦𝑖
…
𝑦𝑘
2
𝑦𝑘+1
𝑦𝑘+2
…
𝑦𝑘+𝑖
…
𝑦2𝑘
…
…
…
…
…
…
…
…
𝑦𝑛𝑘
…
𝑦𝑘
𝑛 Rata-rata
𝑦
𝑛−1 𝑘+1
𝑦1
𝑦
𝑛−1 𝑘+2
𝑦2
… …
𝑦
𝑛−1 𝑘+𝑖
𝑦𝑖
Hubungan dengan Stratified Sampling • Systematic sampling menstratifikasi populasi menjadi n strata yang
terdiri dari: k unit pertama, k unit kedua, dst. • Sampel sistematik sama precisenya dengan stratified random sampling dengan satu unit per strata yang bersesuaian
k = systematic sample
2k
3k
4k
= stratified random sample Perbedaan: • Systematic Sample: Unit-unit terletak pada posisi yang relatif sama dalam strata • Stratified Random Sample: Posisi dalam strata ditentukan secara terpisah berdasarkan pengacakan di dalam masing-masing strata.
Ilustrasi Strata dalam Systematic Sampling Nomor Gugus Sampel (Class)
Nomor sampel
1
2
…
i
…
k
1
𝑦1
𝑦2
…
𝑦𝑖
…
𝑦𝑘
Strata 1
2
𝑦𝑘+1
𝑦𝑘+2
…
𝑦𝑘+𝑖
…
𝑦2𝑘
Strata 2
…
…
…
…
…
…
…
…
𝑦𝑛𝑘
𝑛
𝑦
𝑛−1 𝑘+1
𝑦
𝑛−1 𝑘+2
…
𝑦
𝑛−1 𝑘+𝑖
Strata n
Hubungan dengan Cluster Sampling • Dengan N=nk, populasi dibagi menjadi k unit sampling yang besar, yang
masing-masing mengandung n unit original. • Pelaksanaan pemilihan sampel sistematik adalah pelaksanaan pemilihan satu dari unit-unit sampling yang besar ini secara acak. • Sebuah sampel sistematik adalah sebuah sampel acak sederhana dari satu unit cluster dari suatu populasi sebanyak k unit cluster. Nomor Gugus Sampel (Class)
Nomor sampel
1
2
…
i
…
k
1
𝑦1
𝑦2
…
𝑦𝑖
…
𝑦𝑘
2
𝑦𝑘+1
𝑦𝑘+2
…
𝑦𝑘+𝑖
…
𝑦2𝑘
…
…
…
…
…
…
…
…
𝑦𝑛𝑘
𝑛
𝑦
𝑛−1 𝑘+1
Cluster 1
𝑦
𝑛−1 𝑘+2
Cluster 2
…
𝑦
𝑛−1 𝑘+𝑖
Cluster i
Cluster k
Penduga Rata-rata Populasi • Linear Systematic Sampling Jika
N=nkrata-rata sampel dari sebuah sampel sistematik merupakan penduga unbiased dari rata-rata populasi Jika N ≠ nkrata-rata sampel dari sebuah sampel sistematik merupakan penduga biased dari rata-rata populasi • Circular Systematic Sampling (N=nk maupun N≠nk) Rata-rata sampel akan selalu merupakan penduga unbiased
Sistematik
Kondisi N=nk
N≠nk
Linear
Unbiased
Biased
Sirkuler
Unbiased
Unbiased
Penduga Rata-rata Populasi 𝑦𝑖 =
1 𝑛
𝐸 𝑦𝑠𝑦
𝑦𝑖𝑗 rata-rata untuk sampel sistematik ke-i 𝑘
1 = 𝑦𝑖 𝑘 𝑖=1 1 = 𝑦1 + 𝑦2 + ⋯ + 𝑦𝑘 𝑘 11 = 𝑦 + 𝑦1 + ⋯ + 𝑦𝑁 𝑘𝑛 1
1 = 𝑦1 + 𝑦1 + ⋯ + 𝑦𝑁 𝑁 𝑁 1 = 𝑦𝑖 𝑁 =𝑌
𝑖=1
… (𝑗𝑖𝑘𝑎 𝑁 = 𝑛𝑘)
Latihan 2 • Diketahui populasi mahasiswa sebanyak N=9 dengan jumlah buku
sampling yang dimiliki sebagai berikut: No
1
2
3
4
5
6
7
8
9
Jumlah Buku
1
2
2
3
3
4
5
7
9
Buktikan secara empiris bahwa penarikan sampel secara sistematik linear maupun sirkuler (n=3) akan menghasilkan penduga rata-rata yang unbiased ! • Diketahui populasi mahasiswa sebanyak N=10 dengan jumlah buku
ekonomi yang dimiliki sebagai berikut: No
1
2
3
4
5
6
7
8
9
10
Jumlah Buku
1
1
2
3
3
4
4
5
6
8
Buktikan secara empiris bahwa penarikan sampel (n=3) secara sistematik linear akan menghasilkan penduga rata-rata yang biased, tetapi penarikan sampel secara sistematik sirkuler akan menghasilkan penduga yang unbiased !
Varians Penduga Rata-rata • Penghitungan 𝑣(𝑦𝑠𝑦 ) membutuhkan informasi dari seluruh k
sampel sistematik.
• 𝑣 𝑦𝑠𝑦 = • 𝑣 𝑦𝑠𝑦 =
1 𝑘 𝑘 𝑖=1 𝑁−1 2 𝑆 𝑁
𝑦𝑖 − 𝑌 −
2
… (1)
𝑘(𝑛−1) 𝑆𝑤𝑠𝑦 2 𝑁
Varians within sampel sistematis yang besar mengindikasikan bahwa sampel tsb adalah HETEROGEN • 𝑆2
=
1 𝑁−1
𝑘 𝑖=1
𝑛 𝑗=1(𝑦𝑖𝑗
… (2) 𝑆𝑤𝑠𝑦 2
1 = 𝑘(𝑛 − 1)
𝑘
𝑛
𝑦𝑖𝑗 − 𝑦𝑖 𝑖
𝑗
Varians within dari k sampel sistematik − 𝑌 )2
2
• Misal populasi:
1,2,3,4,5 | 1,2,3,4,5 | 1,2,3,4,5 periodicity • Misal 2 terpilih sampel dan k=5, sehingga sampel sistematik: 2,2,2 homogen dan tidak representatif • Varians within=0 dan 𝑣(𝑦𝑠𝑦 ) akan besar. Bagaimana mengukur kehomogenan atau keheterogenan ini ?
INTRACLASS CORRELATION COEFFICIENT
INTRACLASS CORRELATION COEFFICIENT • Ukuran yang menyatakan tingkat kehomogenan
dalam sebuah sampel sistematik di antara pasangan unit dalam sampel sistematik yang sama adalah intraclass correlation coefficient (𝜌) •𝜌 =
𝐸(𝑦𝑖𝑗 −𝑌)(𝑦𝑖𝑗′ −𝑌) 𝐸(𝑦𝑖𝑗 −𝑌)2
• 𝑣 𝑦𝑠𝑦 =
𝑆 2 𝑁−1 𝑛 𝑁
1 + (𝑛 − 1)𝜌
INTRACLASS CORRELATION COEFFICIENT • Ketika ada n unit sampling dalam sebuah sampel sistematik,
𝑛 𝑛(𝑛−1) maka ada = pasangan unit sampling yang 2 2 berbeda yang bisa kita pilih
• Karena keseluruhan ada k sampel sistematis, ada
pasangan yang berbeda, sehingga: 2 𝐸 𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 = 𝑘𝑛(𝑛 − 1) 1 𝐸(𝑦𝑖𝑗 − 𝑌) = 𝑁
𝑘
𝑛
2
𝑘
𝑛
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 𝑖=1 𝑗<𝑗′
(𝑦𝑖𝑗 − 𝑌)2 𝑖=1 𝑗=1
𝑁−1 1 = 𝑁 𝑁−1 𝑁−1 2 = 𝑆 𝑁
𝑘
𝑛
(𝑦𝑖𝑗 − 𝑌)2 𝑖=1 𝑗=1
𝑘𝑛(𝑛−1) 2
INTRACLASS CORRELATION COEFFICIENT •𝜌 =
2 𝑘𝑛(𝑛−1)
𝑘 𝑖=1 2
𝑛 𝑗<𝑗′
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌
𝑁 . (𝑁−1)𝑆 2
𝑆 𝑁−1 𝑉 𝑦𝑠𝑦 = 1 + (𝑛 − 1)𝜌 𝑛 𝑁 • Jika 𝜌 besar dan positif 𝑣(𝑦𝑠𝑦 ) besar (unit-unit homogen dalam sampel sistematik) • Jika 𝜌 kecil dan (+/-) 𝑣(𝑦𝑠𝑦 ) kecil (unit-unit heterogen dalam sampel sistematik)
Pembuktian (1) Varians cara 1: 𝑽 𝒚𝒔𝒚 = 𝐸 𝑦𝑖 − 𝐸 𝑦𝑖
2
= 𝐸 𝑦𝑖 − 𝑌
2
𝟏 = 𝒌
𝒌
𝒚𝒊 − 𝒀
𝟐
𝒊=𝟏
Varians cara 2: 𝑉 𝑦𝑠𝑦 = 𝑘
𝑛
1 𝑘
𝑘
𝑦𝑖 − 𝑌 𝑖=1
𝑦𝑖𝑗 − 𝑌
2
𝑘
𝑖=1 𝑗=1 𝑘 𝑛
𝑦𝑖𝑗 − 𝑦𝑖 𝑖=1 𝑗=1
2
𝑦𝑖𝑗 − 𝑦𝑖 + 𝑦𝑖 − 𝑌 𝑖=1 𝑗=1
𝑦𝑖𝑗 − 𝑦𝑖
=
𝑛
=
𝑖=1 𝑗=1 𝑘 𝑛
=
2
2
2
+ 𝑦𝑖 − 𝑌 𝑘
2
+ 2 𝑦𝑖𝑗 − 𝑦𝑖 𝑦𝑖 − 𝑌
𝑛
+
𝑘
𝑦𝑖 − 𝑌 𝑖=1 𝑗=1
2
𝑛
+2
𝑦𝑖𝑗 − 𝑦𝑖 𝑦𝑖 − 𝑌 𝑖=1 𝑗=1
Pembuktian (2) 𝑘
𝑛
𝑘 2
𝑦𝑖 − 𝑌
=𝑛
𝑖=1 𝑗=1 𝑘 𝑛
𝑖=1
2
2
𝑦𝑖 − 𝑌
𝑘
𝑛
𝑦𝑖𝑗 − 𝑦𝑖 𝑦𝑖 − 𝑌 = 2 𝑖=1 𝑗=1 𝑛
𝑦𝑖𝑗 − 𝑌 𝑖=1 𝑗=1
𝑉 𝑦𝑠𝑦
1 = 𝑘𝑛
𝑘
=𝑛
𝑆2 =
2
𝑦𝑖 − 𝑌
𝑖=1 𝑗=1 𝑘
2
−
1 𝑘𝑛
𝑛
𝑦𝑖𝑗 − 𝑦𝑖 𝑖
𝑛
𝑗
(𝑦𝑖𝑗 − 𝑌)2 𝑖=1 𝑗=1
𝑛
+
𝑖=1
𝑛
1 = 𝑘(𝑛 − 1)
1 𝑁−1
𝑘
𝑦𝑖𝑗 − 𝑌
𝑘
𝑗=1
𝑘
2
Karena: 𝑆𝑤𝑠𝑦 2
𝑦𝑖𝑗 − 𝑦𝑖 = 0
𝑖=1
Sehingga: 𝑘
𝑦𝑖 − 𝑌
𝑦𝑖𝑗 − 𝑦𝑖 𝑖=1 𝑗=1 𝑘 𝑛
𝑦𝑖𝑗 − 𝑦𝑖
2
2
𝑖=1 𝑗=1
2
Sehingga: 𝑉 𝑦𝑠𝑦
𝑁 − 1 2 𝑘(𝑛 − 1) = 𝑆 − 𝑆𝑤𝑠𝑦 2 𝑁 𝑁
Pembuktian (3): Koefisien korelasi intraklass: 𝐸(𝑦𝑖𝑗 − 𝑌)(𝑦𝑖𝑗 ′ − 𝑌)
𝜌=
𝐸(𝑦𝑖𝑗 − 𝑌)2 Karena terdapat sebanyak 𝑛 unit sampling untuk setiap gugus sampel, maka 𝑛 𝑛(𝑛−1) akan terdapat = pasangan unit sampling yang berbeda yang dapat 2 2 𝑘𝑛(𝑛−1) dipilih. Oleh karena itu, untuk 𝑘 gugus sampel sistematik akan terdapat 2 pasangan yang berbeda, sehingga: 2 𝐸 𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 = 𝑘𝑛(𝑛 − 1)
1 2 𝐸(𝑦𝑖𝑗 − 𝑌) = 𝑁 =
𝑘
𝑛
𝑘
𝑛
(𝑦𝑖𝑗 − 𝑌)(𝑦𝑖𝑗 ′ − 𝑌) 𝑖=1 𝑗<𝑗′
(𝑦𝑖𝑗 − 𝑌)2 𝑖=1 𝑗=1
𝑁−1 1 𝑁 𝑁−1
𝑁−1 2 = 𝑆 𝑁
𝑘
𝑛
(𝑦𝑖𝑗 − 𝑌)2 𝑖=1 𝑗=1
Pembuktian (4) Sehingga: 2 𝜌= 𝑘𝑛(𝑛 − 1)
𝑘
𝑛
𝑦𝑖𝑗 − 𝑌 𝑦
𝑖𝑗 ′
𝑖=1 𝑗<𝑗′
𝑁 −𝑌 . (𝑁 − 1)𝑆 2
Varians cara 3: 𝑉 𝑦𝑠𝑦
1 = 𝑘 =
=
𝑘
𝑦𝑖 − 𝑌 𝑖=1
1 1 𝑘 𝑛2 1 1 𝑘 𝑛2
1 1 = 𝑘 𝑛2
𝑘
2
1 = 𝑘
𝑘
1 𝑛
𝑖=1
2
𝑛
𝑦𝑖𝑗 − 𝑌 𝑗=1
2
𝑛
𝑦𝑖𝑗 − 𝑌 𝑖=1 𝑗=1 𝑘 𝑛
𝑦𝑖𝑗 − 𝑌 𝑖=1 𝑗=1 𝑘 𝑛
𝑛
+2
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 𝑖=1 𝑗<𝑗′
𝑦𝑖𝑗 − 𝑌 𝑖=1 𝑗=1
2
𝑘
2
𝑛−1 +2 ∙ 𝑁 − 1 𝑆2𝜌 2
Pembuktian (5) 𝑉 𝑦𝑠𝑦
𝑉 𝑦𝑠𝑦
1 1 = ∙ 2∙ 𝑘 𝑛
𝑘
𝑛
𝑦𝑖𝑗 − 𝑌 𝑖=1 𝑗=1
2
+ 𝑛 − 1 ∙ 𝑁 − 1 𝑆2𝜌
1 1 = ∙ 2 ∙ 𝑁 − 1 𝑆2 + 𝑛 − 1 ∙ 𝑁 − 1 𝑆2𝜌 𝑘 𝑛 1 = (𝑁 − 1)𝑆 2 1 + (𝑛 − 1)𝜌 𝑛𝑁 𝑆2 𝑁 − 1 = 1 + (𝑛 − 1)𝜌 𝑛 𝑁
EFISIENSI • 𝑣 𝑦𝑠𝑟𝑠 =
𝑆 2 𝑁−𝑛 𝑛 𝑁
• 𝑣 𝑦𝑠𝑦𝑠 =
𝑆 2 𝑁−1 𝑛 𝑁
•
𝑣(𝑦𝑠𝑦𝑠 ) 𝑣(𝑦𝑠𝑟𝑠 )
=
1 + (𝑛 − 1)𝜌
(𝑁−1) 1+(𝑛−1)𝜌 𝑛(𝑘−1)
Agar systematic sampling memiliki presisi yang sama dengan SRS, maka: (𝑁 − 1) 1 + (𝑛 − 1)𝜌 =1 𝑛(𝑘 − 1) −1 −1 𝜌= = 𝑛𝑘 − 1 𝑁 − 1
EFISIENSI • Karena N biasanya besar, 𝜌 seharusnya kecil agar
systematic sampling memiliki presisi yang sama dengan SRS. • Nilai 𝜌 akan kecil jika unit-unit sampling dalam populasi didistribusikan secara random, sehingga 𝑣 𝑦𝑠𝑟𝑠 bisa digunakan untuk sistematic sampling
Penduga Rata-rata Populasi dan Varians (Ringkasan) Penduga
Rumus
𝑌=
Rata-rata
𝑉 𝑦𝑠𝑦 = Varians
Keterangan: 1 = 𝑘(𝑛 − 1)
1 𝑆 = 𝑁−1 2
𝜌=
1 𝑘
𝑦𝑖. 𝑖=1 𝑘
𝑦𝑖 − 𝑌
𝑘
𝑛
𝑘
𝑁 − 1 2 𝑘(𝑛 − 1) 𝑆 − 𝑆𝑤𝑠𝑦 2 𝑁 𝑁 𝑆2 𝑁 − 1 = 1 + (𝑛 − 1)𝜌 𝑛 𝑁
𝑛
𝑦𝑖𝑗 − 𝑦𝑖 𝑖
2
𝑗
(𝑦𝑖𝑗 − 𝑌)2
𝑖=1 𝑗=1 2 𝑘 𝑛 𝑖=1 𝑗<𝑗′ 𝑘𝑛(𝑛−1)
2
𝑖=1
𝑉 𝑦𝑠𝑦 = 𝑉 𝑦𝑠𝑦
𝑆𝑤𝑠𝑦 2
1 𝑘
𝑘
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 .
𝑁 (𝑁−1)𝑆 2
Contoh: Misalkan populasi N=9 dengan nilai karakteristik 𝑌𝑖 sebagai berikut: 1, 2, 3, 4, 5, 6, 7, 8, 9 diambil sampel n=3 secara sistematik sampling. Maka komposisi sampel sistematiknya: No urut sampel
Gugus Sampel 1
Gugus Sampel 2
Gugus Sampel 3
𝑌1𝑗
2 𝑌1𝑗
𝑌2𝑗
2 𝑌2𝑗
𝑌3𝑗
2 𝑌3𝑗
1
1
1
2
4
3
9
2
4
16
5
25
6
36
3
7
49
8
64
9
81
Total
12
66
15
93
18
126
Rata-rata
4
22
5
31
6
42
1 𝑌= 𝑘
𝑘
𝑖=1
1 𝑦𝑖 = 4 + 5 + 6 = 5 3
Penghitungan varians (cara 1): 𝑉 𝑦𝑠𝑦 =
1 𝑘
𝑘
𝑦𝑖 − 𝑌
2
𝑖=1
=
1 4−5 3
2
+ 5−5
2
+ 6−5
2
=
2 3
Penghitungan varians (cara 2): 𝑆𝑤𝑠𝑦
2
𝑆2 =
1 = 𝑘(𝑛 − 1)
1 𝑁−1
𝑉 𝑦𝑠𝑦
𝑘
𝑛
𝑘
𝑛
𝑦𝑖𝑗 − 𝑦𝑖 𝑖
𝑗
(𝑦𝑖𝑗 − 𝑌)2 = 𝑖=1 𝑗=1
2
1 54 = 18 + 18 + 18 = 3∙2 6
60 8
𝑁−1 2 𝑘 𝑛−1 8 60 3 ∙ 2 54 2 2 = 𝑆 − 𝑆𝑤𝑠𝑦 = ∙ − ∙ = 𝑁 𝑁 9 8 9 6 3
Penghitungan varians (cara 3): 𝜌=
2 𝑘𝑛(𝑛−1)
𝑘 𝑖=1
𝑛 𝑗<𝑗′
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 .
𝑁 (𝑁−1)𝑆 2
Untuk 𝑖 = 1: 𝑛 𝑗<𝑗′
𝜌=
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 = Penghitungan varians (cara 3):
2 𝑘𝑛(𝑛−1)
𝑘 𝑖=1
𝑛 𝑗<𝑗′
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 .
𝑁 (𝑁−1)𝑆 2
Untuk 𝑖 = 1: 𝑛
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 = 𝑦11 − 𝑌 𝑦12 − 𝑌 + 𝑦11 − 𝑌 𝑦13 − 𝑌 + 𝑦12 − 𝑌 𝑦13 − 𝑌 𝑗<𝑗′
= 1 − 5 4 − 5 + 1 − 5 7 − 5 + 4 − 5 7 − 5 = −6 Dengan cara yang sama, untuk 𝑖 = 2 diperoleh hasil -9 dan untuk 𝑖 = 3 diperoleh hasil -6.
Maka: 2 𝜌= 𝑘𝑛(𝑛 − 1) =
2 3∙3∙2
𝑉 𝑦𝑠𝑦
𝑘
𝑛
𝑦𝑖𝑗 − 𝑌 𝑦𝑖𝑗 ′ − 𝑌 . 𝑖=1 𝑗<𝑗′ 9
8
𝑁 (𝑁 − 1)𝑆 2
21
−6 − 9 − 6 ∙ ∙ = − 8 60 60 2 𝑆 𝑁−1 60/8 8 = 1 + (𝑛 − 1)𝜌 = ∙ ∙ 1+ 3−1 𝑛 𝑁 3 9
−21 60
2 = 3
Latihan 3 No Ruta
Kepala Rumah Tangga (KRT)
(1) 1 2 3 4 5 6 7 8 9 10 11 12
(2) JUNAIDI SHOFYAN FIRDAUS RAHMAD AHMAD ROFI'IH ANDI CAHYADI AINUR ROSYADI SUBAIDI MOH MASHUDI QUDZI A SPD I ABD GANI CHOLISH MOH FAISOL BASRI
Pendidikan tertinggi KRT Pengeluaran SMP perbulan SMA- Univer ke (000 rupiah) Diploma -sitas bawah (3) (4) (5) (7) √ 1825 √ 2345 √ 1167 √ 752 √ 1222 √ 1935 √ 1441 √ 3402 √ 1458 √ 4046 √ 1067 √ 2505
Dari populasi di samping, dilakukan pengambilan sampel sebanyak 4 rumah tangga secara sistematik. Hitunglah rata-rata, sampling variance populasi untuk rata-rata pengeluaran, koefisien korelasi intraklasnya , dan RE terhadap SRS jika: a. Populasi tidak diurutkan. b. Populasi diurutkan berdasarkan tingkat pendidikan.
No
Jenis pohon
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Pepaya Pepaya Pepaya Pepaya Pepaya Durian Durian Durian Durian Durian Jambu Jambu Jambu Jambu Jambu Jeruk Jeruk Jeruk Jeruk Jeruk
Harga jual hasil panen setahun (000 Rp) 198 197 233 206 276 822 839 707 826 725 379 494 382 339 323 486 515 590 521 417
Latihan 4 • Seorang pemilik kebun buah memiliki 4
jenis pohon buah, yaitu pepaya, durian, jambu, dan jeruk yang masing-masing jenis terdiri dari 4 pohon. Berdasarkan populasi di samping, jika dilakukan penarikan sampel sebanyak 4 pohon, maka: a. Hitunglah rata-rata dan varians populasi beserta koefisien korelasi intraklass dari harga jual hasil panen setahun jika penarikan sampel secara sistematik. b. Jika jenis pohon dianggap sebagai strata, buatlah tabel annovanya kemudian hitunglah rata-rata dan varians populasinya. c. Hitunglah rata-rata dan varians populasinya jika dilakukan penarikan sampel secara SRS WOR. d. Bandingkan efisiensi antara poin (a), poin (b), dan poin (c).
Latihan 5 • In a directory of 13 houses on a street the persons are listed as follow:
𝑀 = 𝑚𝑎𝑙𝑒 𝑎𝑑𝑢𝑙𝑡, 𝐹 = 𝑓𝑒𝑚𝑎𝑙𝑒 𝑎𝑑𝑢𝑙𝑡, 𝑚 = 𝑚𝑎𝑙𝑒 𝑐ℎ𝑖𝑙𝑑, 𝑓 = 𝑓𝑒𝑚𝑎𝑙𝑒 𝑐ℎ𝑖𝑙𝑑. HOUSEHOLD 1
2
3
4
5
6
7
8
9
10
11
12
13
M
M
M
M
M
M
M
M
M
M
M
M
M
F
F
F
F
F
F
F
F
F
F
F
F
F
f
f
m
m
f
f
m
m
m
f
f
m
m
f
m
m
f
f
f
m
f
f
f
m
• Compare the variances given by a systematic sample of one in five
persons and a 20% simple random sample for estimating: (a) the proportion of males, (b) the proportion of children, (c) the proportion of persons living in professional households (households 1,2,3,12, and 13 are described as professional). For the systematic sample, number down each column, then go to the top of the next column.
JENIS-JENIS POPULASI • Populasi dengan susunan acak (random population) • Populasi terurut (ordered population) • Populasi dengan variasi periodik • Populasi alami (natural population) • Populasi yang berautokorelasi
Populasi dengan Susunan Acak • Jika unit-unit sampling di dalam populasi tersusun secara acak,
unit-unit sampling di dalam sampel juga akan tersusun secara acak. • Oleh karena itu, sampel sistematik bisa diperlakukan seolah-olah adalah sampel acak. • Sampel yang tersusun secara acak ini akan menjadi heterogen dan akan memiliki 𝜌 yang kecil maka 𝑣(𝑦𝑠𝑦 ) kurang lebih akan sama dengan 𝑣(𝑦𝑠𝑟𝑠 ) . • Misal, sampling dari sebuah frame yang disusun secara alfabetik menurut nama. Jika item yang diukur tidak memiliki hubungan dengan nama individu, kita bisa mengharapkan systematic sampling benar-benar equivalent dengan SRS dan memiliki varians yang hampir sama.
Populasi Terurut • Dalam sebuah populasi terurut, pemilihan sampel sistematik
akan memberikan sampel yang heterogen dan 𝑣(𝑦𝑠𝑦 ) biasanya akan lebih kecil daripada 𝑣(𝑦𝑠𝑟𝑠 ). • Contoh: menduga produksi jagung dari populasi petani dengan luas lahan. Petani diurutkan terlebih dahulu menurut luas lahan, kemudian dipilih sampel secara sistematik. Sampel yang terpilih akan heterogen dan menghindari kesempatan memilih sampel yang mengandung terlalu banyak petani besar/kecil sehingga lebih mewakili populasi daripada ketika masih tersusun secara acak.
Perbandingan Systematic Sampling, Stratified Sampling, dan SRS dalam Populasi Trend Linear • Ilustrasi populasi dengan trend linear:
𝒚𝒊
𝒚𝒊 = 𝒂 + 𝒃𝒊
𝒂
:systematic sample :stratified sample
𝒊
Perbandingan Systematic Sampling, Stratified Sampling, dan SRS dalam Populasi Trend Linear 1 𝑌= 𝑁
𝑁
𝑖=1
1 𝑦𝑖 = 𝑁
1 2 𝑆 = 𝑁−1
𝑁
𝑁
𝑎 + 𝑏𝑖 = 𝑎 + 𝑏(𝑁 + 1)/2 𝑖=1
𝑦𝑖 − 𝑌 𝑖=1
𝑁 2
= 𝑖=1
𝑏2 𝑁+1 𝑖− (𝑁 − 1) 2
2
𝑁(𝑁 + 1)𝑏 2 𝑛𝑘(𝑛𝑘 + 1)𝑏 2 = = 12 12
(𝑁 − 𝑛) 2 𝑘 − 1 𝑛𝑘 𝑛𝑘 + 1 𝑛𝑘 + 1 2 ∙𝑆 = ∙ ∙ 𝑏2 = 𝑘 − 1 𝑏 𝑁𝑛 𝑛𝑘 12 12 𝑁−𝑛 2 𝑘−1 𝑘 𝑘+1 (𝑘 + 1) 2 2 = ∙ 𝑆𝑤 = ∙ ∙ 𝑏 = (𝑘 − 1) 𝑏 𝑁𝑛 𝑛𝑘 12 12𝑛 𝑘 1 1 𝑘 𝑘+1 𝑘−1 𝑘+1 2 = 𝑦𝑖 − 𝑌 2 = ∙ ∙ 𝑏2 = 𝑘 − 1 𝑏 𝑘 𝑘 12 12
𝑉𝑠𝑟𝑠 = 𝑉𝑠𝑡𝑟
𝑉𝑠𝑦𝑠
𝑖=1
Sehingga: 𝑉𝑠𝑡𝑟 ∶ 𝑉𝑠𝑦𝑠
(𝑘 + 1) 1 ∶ 𝑉𝑠𝑟𝑠 = : 𝑘 + 1 : 𝑛𝑘 + 1 ≅ : 1: 𝑛 = 1: 𝑛: 𝑛2 𝑛 𝑛
Populasi dengan Variasi Periodik • Jika populasi mengandung trend periodik (misalkan kurva sinus),
keefektifan sampel sistematik tergantung pada nilai interval. • Contoh populasi hipotetik: 1,2,3,4,5| 1,2,3,4,5| 1,2,3,4,5 Jika diambil 3 sampel dan dengan random start 2 dan k=5, maka sampel sistematiknya: (2,2,2)homogen, 𝜌 besar • Contoh praktis: Penjualan tinggihari Jumat dan Sabtu Penjualan rendahhari Senin dan Selasa Sampel-sampel bisa dipilih dengan mengubah posisi unit-unit sampling setiap waktu.
Natural Population dan Autocorrelated Population • Systematic sampling secara operasional sangat mudah dan efisien
digunakan dalam populasi alami (natural population), misalnya pada populasi di area hutan untuk mengestimasi produksi kayu, karet, dsb • Pada beberapa populasi alami, unit-unit yang berdekatan akan mempunyai korelasi yang kuat daripada unit-unit yang saling berjauhan. Populasi semacam ini disebut autocorrelated population. • Misalnya, 𝑦𝑖 dan 𝑦𝑗 (𝑖 = 1,2, … , 𝑁) adalah nilai observasi dari dari dua unit yang berkorelasi positif dan serial correlation coefficient 𝜌𝑑 adalah fungsi dari jarak antara keduanya: 𝑑 = 𝑦𝑖 − 𝑦𝑗 . • Misalkan 𝑦𝑖 diambil dari infinite population (superpopulation) dengan
rata-rata 𝜇 dan varians 𝜎 2 maka: 𝐸 𝑦𝑖 = 𝜇 dan 𝐸 𝑦𝑖 − 𝜇 2 = 𝜎 2 𝐸 𝑦𝑖 − 𝜇 𝑦𝑗 − 𝜇 𝜌𝑑 = 𝜎2 Untuk 𝑖 = 1,2, … , 𝑁 dan 𝑑 = 1,2, … , (𝑁 − 1)
Latihan 6 • Grafik
di bawah ini menunjukkan nilai output( 𝑦𝑖 ) untuk setiap perusahaan(𝑖). Hitunglah nilai koefisien korelsi intraklaster dan varians jika dari populasi sebanyak N=12 perusahaan dilakukan pengambilan 4 sampel secara sistematik, kemudian bandingkan efisiensinya dengan SRS WOR ! Populasi dengan Trend Linear 45 40
𝒚𝒊 = 𝟒 + 𝟑𝒊
35
Output
30 25 20 15 10 5 0 0
2
4
6
8
Perusahaan
10
12
14
Estimasi Varians Sistematik dari Single Sample • Pada prinsipnya, varians systematic sampling yang unbiased sulit
didapatkan dari sampel sistematik tunggal. Untuk itu, systematic sampling dapat diasumsikan ke dalam model tertentu sehingga bisa dilakukan pendekatan dalam penghitungan estimasi sampling varians. • Ada beberapa pendekatan untuk menghitung estimasi varians berdasarkan sampel sistematik tunggal yaitu: 1. Simple Random Sampling 2. Stratified Random Sampling 3. Paired Selection Models 4. Succesive Difference Models 5. Interpenetrating (Repeated) Systematic Sampling
Pendekatan SRS dan Stratified Sampling • Pendekatan SRS:
Jika populasi tersusun secara acak, maka unit-unit yang terpilih dalam pengambilan sampel sistematik juga akan tersusun acak sehingga dalam kasus ini estimasi variansnya bisa dilakukan dengan pendekatan SRS, yaitu: 𝑠2 𝑣 𝑦𝑠𝑦 = (1 − 𝑓) ∙ 𝑛 • Pendekatan Stratified Random Sampling: Jika populasi tersusun terurut berdasarkan kategori tertentu (misalkan: wilayah geografis seperti urban-rural, desa, kecamatan, dsb, karakteristik demografi seperti jenis kelamin, kelompok umur, dsb, karakteristik sosial ekonomi seperti kategori pengeluaran, tingkat pendidikan, dsb), maka jumlah sampel sistematik yang terpilih untuk setiap kategori akan proporsional terhadap jumlah populasi pada kategori yang bersangkutan. Untuk kasus seperti ini, varians sampling sistematik bisa didekati dengan rumus varians proportional stratified sampling, yaitu: 𝐿
𝑣 𝑦𝑠𝑦 = ℎ=1
𝑁ℎ 𝑁
2
𝑠ℎ 2 1 − 𝑓ℎ 𝑛ℎ
Paired Selection Model (PSM) • Mengelompokkan N unit populasi ke dalam
𝑛 2
kelompok.
• Masing-masing kelompok terdiri dari 2𝑘 unit. • Melakukan penarikan sampel 2 unit dari tiap kelompok dengan
prosedur: a. Hitung interval 𝑘 ′ = 2𝑘 =
2𝑁 𝑛
b. Ambil dua angka random (𝐴𝑅1 dan 𝐴𝑅2 ) yang kurang dari atau sama
dengan 𝑘 ′ untuk menentukan dua unit yang terpilih sebagai sampel pertama c. Sampel selanjutnya ditentukan dengan interval 𝑘 ′ 𝐴𝑅3 = 𝐴𝑅1 + 2𝑘
𝐴𝑅4 = 𝐴𝑅2 + 2𝑘
𝐴𝑅5 = 𝐴𝑅3 + 2𝑘
𝐴𝑅6 = 𝐴𝑅4 + 2𝑘
𝐴𝑅7 = 𝐴𝑅5 + 2𝑘
𝐴𝑅8 = 𝐴𝑅6 + 2𝑘
…
…
Paired Selection Model (PSM) Penghitungan varians: 1 2 3 4 𝑦2 − 𝑦1
2
𝑦4 − 𝑦3
2
5 𝑦6 − 𝑦5
a. Jika n genap 𝑣 𝑦𝑠𝑦
6
1−𝑓 = 2 𝑛
…
n-1
2
𝑦𝑛 − 𝑦𝑛−1
𝑛/2
𝑦2𝑖 − 𝑦2𝑖−1
2
𝑖=1
b. Jika n ganjil Pilih satu unit secara acak dan menggunakannya dua kali. 𝑣 𝑦𝑠𝑦 Keterangan: 𝑚 =
𝑛+1 2
1−𝑓 = 𝑛(2𝑚)
𝑛/2
𝑦2𝑖 − 𝑦2𝑖−1 𝑖=1
n
2
2
Succesive Difference Model (SDM) • Metode ini menggunakan semua succesive difference yaitu sebanyak
(n-1) succesive difference, sehingga penghitungan dengan metode ini variansnya cenderung meningkat. • Penghitungan varians:
1 𝑦2 − 𝑦1
2
3
2
𝑦3 − 𝑦2
𝑦4 − 𝑦3 2
𝑣 𝑦𝑠𝑦
4
5
2
𝑦5 − 𝑦4
6
𝑦6 − 𝑦5
…
n-1
2
𝑦𝑛 − 𝑦𝑛−1
2
1−𝑓 = 2𝑛(𝑛 − 1)
𝑛−1
𝑦𝑖+1 − 𝑦𝑖 𝑖=1
n
2
2
Interpenetrating (Replicated) Systematic Sampling • Misalnya, suatu sampel sebanyak 𝑛 akan diambil dari populasi sebanyak 𝑁 secara
sistematik. Proses pengambilan sampel yaitu dengan mengambil subsample sistematik sebanyak 𝑚 gugus sampel dengan independent random starts, masing𝑛 masing memuat 𝑛/𝑚 unit untuk menjaga total sampel sebanyak 𝑛. Anggap 𝑛′ = 𝑚 ′ dan 𝑘 = 𝑚𝑘 maka komposisi sampel sistematiknya: Nomor Gugus Sampel (Class)
Nomor sampel
1
2
…
i
…
𝑘′
1
𝑦1
𝑦2
…
𝑦𝑖
…
𝑦𝑘′
2
𝑦𝑘′+1
𝑦𝑘′+2
…
𝑦𝑘′+𝑖
…
𝑦2𝑘′
…
…
…
…
…
…
…
…
𝑦𝑛′𝑘′
𝑦
𝑛′ 𝑦𝑠𝑦
1 = 𝑚
𝑛′−1 𝑘′+1
𝑦
…
𝑛′−1 𝑘′+2
𝑚
𝑦𝑖 𝑖=1 ′
𝑣 𝑦𝑠𝑦 =
𝑘 −𝑚 𝑘 ′ 𝑚(𝑚 − 1)
𝑚
𝑦𝑖 − 𝑦𝑠𝑦 𝑖=1
2
𝑦
𝑛′−1 𝑘′+𝑖
Stratified Systematic Sampling • Populasi terlebih dahulu dikelompokkan menjadi beberapa strata,
kemudian dari masing-masing strata dilakukan penarikan sampel secara sistematik. • Jika 𝑦𝑠𝑦ℎ adalah rata-rata dari sampel sistematik di strata ke-h, estimasi rata-rata populasi beserta variansnya adalah: 𝐿
𝑦𝑠𝑡𝑠𝑦 =
𝑊ℎ 𝑦𝑠𝑦ℎ ℎ=1 𝐿
𝑊ℎ 2 𝑣 𝑦𝑠𝑦ℎ
𝑉 𝑦𝑠𝑡𝑠𝑦 = ℎ=1
TERIMA KASIH Have A Nice Sampling
METODE PENARIKAN SAMPEL
PROBABILITY PROPORTIONAL TO SIZE (PPS SAMPLING) Oleh: Adhi Kurniawan
Pengertian • Pada acak sederhana penarikan sampel hanya didasarkan pada nomor urut
unit dalam populasi. • Penarikan acak sederhana ini menjadi kurang baik bila unit dalam populasi ukurannya bervariasi. Oleh karena itu digunakan variabel pendukung (auxiliary variable) sebagai dasar pertimbangan di dalam penarikan sampel agar diperoleh estimator yang lebih efisien. • Variabel pendukung yang digunakan sebagai dasar penarikan sampel adalah variabel yang memiliki korelasi yang erat dengan variabel yang akan diteliti. • Variabel pendukung yang dipertimbangkan sebagai dasar penarikan sampel selanjutnya disebut ukuran (size). Prosedur penarikan sampel dimana peluang terpilihnya suatu unit sampel sebanding dengan ukuran disebut sebagai sampling berpeluang sebanding dengan ukuran unit atau sampling with probability proportional to size atau disingkat pps sampling
Beberapa contoh variabel yang diteliti dan variabel pendukung Variabel yang diteliti
Variabel pendukung/bantu
Penduduk sekarang
Penduduk tahun sebelumnya
Jumlah kelahiran sekarang
Jumlah WUS tahun sebelumnya
Luas lahan yang ditanami
Total panen
Total output
Total input
Produksi pabrik
Jumlah pekerja
Keuntungan 1.
Memberikan penduga rata-rata populasi yang unbiased.
2.
Mempunyai ketepatan yang lebih tinggi daripada metode-metode yang lain.
3.
Memberikan penduga rata-rata dan varians populasi yang sangat sederhana.
Prosedur Pemilihan Sampel Berdasarkan cara pengambilan
Berdasarkan kerangka sampel yang digunakan
PPS
PPS WR
Cumulative Method
Hansen and Hurwitz
PPS
Pemilihan dari suatu daftar (list)
PPS WOR
Lahiri Method
Lahiri
PPS Systematic Method Madow
Pemilihan dari peta (map)
Random Group Method
Rao, Hartley, and Cochran
Cumulative Method (1) Metode Kumulatif
No
Nama KRT
Langkah 1: Buat kumulatif dari size
Size jumlah ART (𝑿𝒊 )
Kumulatif 𝑿𝒊
1
Danu
3
3
2
Hananto
1
4
3
Wisnu
11
15
4
Pandhu
6
21
5
Krisna
4
25
6
Yudha
2
27
7
Bima
3
30
Jumlah
𝑿 =30
Cumulative Method (2) Metode Kumulatif
No
Nama KRT
Langkah 2: Buat range dari kumulatif untuk tiap unit
Langkah 1: Buat kumulatif dari size
Size jumlah ART (𝑿𝒊 )
Kumulatif 𝑿𝒊
Range
1
Danu
3
3
1-3
2
Hananto
1
4
4
3
Wisnu
11
15
5-15
4
Pandhu
6
21
16-21
5
Krisna
4
25
22-25
6
Yudha
2
27
26-27
7
Bima
3
30
28-30
Jumlah
𝑋 =30
Cumulative Method (3) Metode Kumulatif
No
Nama KRT
Langkah 2: Buat range dari kumulatif untuk tiap unit
Langkah 1: Buat kumulatif dari size
Size jumlah ART (𝑿𝒊 )
Kumulatif 𝑿𝒊
Range
1
Danu
3
3
1-3
2
Hananto
1
4
4
3
Wisnu
11
15
5-15
4
Pandhu
6
21
16-21
5
Krisna
4
25
22-25
6
Yudha
2
27
26-27
7
Bima
3
30
28-30
Jumlah
𝑿 =30
Langkah 3: Ambil angka random (AR) yang tidak lebih dari 𝑋. Langkah 4: Lakukan sebanyak n kali Langkah 5: Unit yang range-nya memuat AR adalah unit yang terpilih sampel Misal: n=2, AR1=10 AR2=25
Latihan 1 • Berikut ini adalah daftar nama desa/kelurahan beserta muatan jumlah
penduduk (dalam 00) di Kecamatan Umbulharjo(040) dan Kotagede(050), Kota Yogyakarta No 1 2 3 4 5 6 7 8 9 10
Desa/Kelurahan Jumlah Penduduk Kode Nama 3471040001 Giwangan 83 3471040002 Sorosutan 160 3471040003 Pandeyan 143 3471040004 Warungboto 115 3471040005 Tahunan 98 3471040006 Mujamuju 114 3471040007 Semaki 52 3471050001 Prenggan 106 3471050002 Purbayan 89 3471050003 Rejowinangun 114
Lakukan penarikan sampel sebanyak 4 desa secara PPS WR dengan metode kumulatif Gunakan TAR halaman 1 baris 1 kolom 1, independent choice of digits
Lahiri Method Metode Lahiri
No
Nama KRT
Size jumlah ART (𝑿𝒊 )
1
Danu
3
2
Hananto
1
3
Wisnu
11
4
Pandhu
6
5
Krisna
4
6
Yudha
2
7
Bima
3
Jumlah
𝑿 =30
Langkah 1: Ambil dua angka random (AR1 dan AR2) sekaligus dengan syarat: 𝐴𝑅1 ≤ 𝑁 dan 𝐴𝑅2 ≤ 𝑋𝑖(𝑚𝑎𝑘𝑠) Untuk contoh di samping: 𝐴𝑅1 ≤ 7 dan 𝐴𝑅2 ≤ 11 Langkah 2: Jika 𝐴𝑅1 = 𝑖 dan 𝐴𝑅2 ≤ 𝑋𝑖 maka unit ke-i terpilih sebagai sampel. Langkah 3: Ulangi langkah 1 dan langkah 2 sehingga didapatkan sampel sebanyak n. Misal: AR1=6, AR2=3 tolak, karena AR2> 𝑋2 AR1=4, AR2=5 unit ke-4 terpilih sampel AR1=4, AR2=6tolak jika PPS WOR, unit ke-4 terpilih kembali sebagai sampel jika PPS WR dst…
Latihan 2 • Berikut ini adalah daftar nama desa/kelurahan beserta muatan jumlah
penduduk (dalam 00) di Kecamatan Umbulharjo(040) dan Kotagede(050), Kota Yogyakarta No 1 2 3 4 5 6 7 8 9 10
Desa/Kelurahan Jumlah Penduduk Kode Nama 3471040001 Giwangan 83 3471040002 Sorosutan 160 3471040003 Pandeyan 143 3471040004 Warungboto 115 3471040005 Tahunan 98 3471040006 Mujamuju 114 3471040007 Semaki 52 3471050001 Prenggan 106 3471050002 Purbayan 89 3471050003 Rejowinangun 114
Lakukan penarikan sampel sebanyak 4 desa secara PPS WR dengan metode Lahiri. Gunakan TAR halaman 1 baris 1 kolom 1, remainder approach.
PPS Systematic(1) PPS Systematic
No
Nama KRT
Langkah 1: Buat kumulatif dari size
Size jumlah ART (𝑿𝒊 )
Kumulatif 𝑿𝒊
1
Danu
3
3
2
Hananto
1
4
3
Wisnu
11
15
4
Pandhu
6
21
5
Krisna
4
25
6
Yudha
2
27
7
Bima
3
30
Jumlah
𝑿 =30
PPS Systematic(2) PPS Systematic
No
Nama KRT
Langkah 1: Buat kumulatif dari size
Size jumlah ART (𝑿𝒊 )
Kumulatif 𝑿𝒊
Range
1
Danu
3
3
1-3
2
Hananto
1
4
4
3
Wisnu
11
15
5-15
4
Pandhu
6
21
16-21
5
Krisna
4
25
22-25
6
Yudha
2
27
26-27
7
Bima
3
30
28-30
Jumlah
𝑿 =30
Langkah 2: Buat range dari kumulatif untuk tiap unit
PPS Systematic(3) PPS Systematic
No
Nama KRT
Langkah 1: Buat kumulatif dari size
Size jumlah ART (𝑿𝒊 )
Kumulatif 𝑿𝒊
Range
1
Danu
3
3
1-3
2
Hananto
1
4
4
3
Wisnu
11
15
5-15
4
Pandhu
6
21
16-21
5
Krisna
4
25
22-25
6
Yudha
2
27
26-27
7
Bima
3
30
28-30
Jumlah
𝑿 =30
Langkah 2: Buat range dari kumulatif untuk tiap unit
Langkah 3:Hitung interval 𝑋 𝑘= 𝑛 Langkah 4: Ambil angka random pertama (AR1) yang tidak lebih dari 𝑘. Langkah 5: Unit yang terpilih sampel adalah yang range-nya memuat: AR1, AR1+k, AR1+2k,… 30 Misal: n=3, 𝑘 = = 10 3 AR1=7 AR2=7+10=17 AR3=7+2*10=27
Latihan 3 • Berikut ini adalah daftar nama desa/kelurahan beserta muatan jumlah
penduduk (dalam 00) di Kecamatan Umbulharjo(040) dan Kotagede(050), Kota Yogyakarta No 1 2 3 4 5 6 7 8 9 10
Desa/Kelurahan Jumlah Penduduk Kode Nama 3471040001 Giwangan 83 3471040002 Sorosutan 160 3471040003 Pandeyan 143 3471040004 Warungboto 115 3471040005 Tahunan 98 3471040006 Mujamuju 114 3471040007 Semaki 52 3471050001 Prenggan 106 3471050002 Purbayan 89 3471050003 Rejowinangun 114
Lakukan penarikan sampel sebanyak 4 desa secara PPS WOR dengan metode PPS Systematic. Gunakan TAR halaman 1 baris 1 kolom 1, quotient approach.
Pemilihan dari Suatu Peta (MAP) • Prosedur ini digunakan jika kerangka sampel berupa peta (map) • Peluang unit-unit wilayah geografis dari sebuah peta untuk
terpilih sebagai sampel sebanding dengan luas (area) dari unitunit tersebut Probability Proportional to Area. • Prosedur:
1. Ambil dua angka random sekaligus, yaitu: AR1: antara 1 sampai panjang peta AR2: antara 1 sampai lebar peta 2. Sepasang angka random terpilih akan menempatkan suatu titik pada peta, dan wilayah dimana titik itu jatuh adalah wilayah yang terpilih sebagai sampel 3. Ulangi langkah ke-1 dan ke-2 hingga n unit sampel terpilih.
Contoh: Pemilihan sampel dari suatu peta 8
Ambil 𝐴𝑅1 ≤ 9 dan 𝐴𝑅2 ≤ 8. Misalkan angka random yang terambil: 𝐴𝑅1 = 4, 𝐴𝑅2 = 3, maka wilayah B terpilih sebagai sampel
D
7 6
A
C
I
5
J
E
4
H F
3
G
2
1
2
3
4
5
6
7
8
9
Random Group Method • Random
group method merupakan salah satu cara
pengambilan sampel PPS secara wor yang disarankan oleh Rao, Hartley, dan Cochran (RHC). • Populasi sebanyak N dibagi menjadi n kelompok, kemudian
dari masing-masing kelompok diambil satu unit sebagai sampel. • Dengan demikian, akan terdapat jumlah sampel sebanyak n
unit.
Contoh: Random Group Methods • Berikut adalah daftar 10 kota dilengkapi dengan jumlah
penduduk (dalam ribu jiwa). Akan dipiliih 2 kota sebagai sampel secara PPS size jumlah penduduk dengan random group method No
Kota
Penduduk
No Kota Penduduk
1
A
127
2
B
130
2
B
130
1
A
127
3
C
139
5
E
149
4
D
141
8
H
159
5
E
149
3
C
139
6
F
150
4
D
141
7
G
155
6
F
150
8
H
159
7
G
155
9
I
169
9
I
169
10
J
189
10
J
189
Randomisasi
Group 1
Group 2
Contoh: Random Group Methods Group 2
Group 1 No
Kota
𝒙
Kumulatif
No
Kota
𝒙
Kumulatif
2
B
130
130
4
D
141
141
1
A
127
257
6
F
150
291
5
E
149
406
7
G
155
446
8
H
159
565
9
I
169
615
3
C
139
704
10
J
189
804
Ambil 1 Angka Random yang tidak lebih dari 704. Misal; angka random yang terambil 526, maka kota H terpilih sampel
Ambil 1 Angka Random yang tidak lebih dari 804. Misal; angka random yang terambil 259, maka kota F terpilih sampel
Sampel terpilih: Kota F dan Kota H
Prosedur Estimasi Estimator untuk PPS Sampling
Estimator untuk PPS WOR
Estimator untuk PPS WR
Hansen Hurwitz Estimator (HH)
Horvitz Thompson Estimator (HT)
Horvitz Thomson Estimator (HT)
Murthy’s Unordered Estimator
Des Raj’s Ordered Estimator
Rao, Hartley, and Cochran Estimator (RHC) untuk random group method
Estimator untuk PPS WR (Hansen Hurwitz Estimator) • Jika pengambilan sampel dilakukan dengan PPS WR, maka
peluang terpilihnya unit ke-i adalah: 𝑋𝑖 𝑋𝑖 𝑝𝑖 = 𝑁 = 𝑋 𝑖=1 𝑋𝑖 Keterangan: 𝑋𝑖 : nilai dari variabel pendukung (ukuran/size) • Fraksi sampling/inclusion probability merupakan perkalian antara 𝑝𝑖 dengan jumlah sampel (𝑛) 𝑋𝑖 𝑓 = 𝜋𝑖 = 𝑝𝑖 ∙ 𝑛 = 𝑛 𝑋 • Sampling weight (penimbang sampling) merupakan kebalikan (invers) dari fraksi sampling: 1 𝑋 𝑤= = 𝑓 𝑛𝑋𝑖
Estimator untuk PPS WR (Hansen Hurwitz Estimator) • Unbiased estimator untuk total karakteristik Y adalah: 𝑛
𝑌𝑝𝑝𝑠 =
𝑛
𝑤 ∙ 𝑦𝑖 = 𝑖=1
𝑖=1
𝑋 1 ∙ 𝑦𝑖 = 𝑛𝑋𝑖 𝑛
𝑛
𝑖=1
𝑦𝑖 𝑝𝑖
Bukti: Misal 𝑡𝑖 menunjukkan berapa kali unit ke-i akan terpilih dari pengambilan sampel sebanyak n (i=1,2,…,n) Maka, joint distribution dari 𝑡𝑖 mengikuti sebaran multinomial: 𝑛! 𝑡 𝑡 𝑡 𝑝11 𝑝22 … 𝑝𝑁𝑁 𝑡1 ! 𝑡2 ! … 𝑡𝑁 ! Untuk sebaran multinomial, properties sebaran dari 𝑡𝑖 diketahui, yaitu: 𝐸 𝑡𝑖 = 𝑛𝑝𝑖 𝑉 𝑡𝑖 = 𝑛𝑝𝑖 1 − 𝑝𝑖 𝐶𝑜𝑣 𝑡𝑖 𝑡𝑗 = −𝑛𝑝𝑖 𝑝𝑗
Estimator untuk PPS WR (Hansen Hurwitz Estimator) • Sehingga rumus estimasi total tersebut bisa dijabarkan:
𝑌𝑝𝑝𝑠
1 = 𝑛
𝑛
𝑖=1
𝑦𝑖 𝑝𝑖
1 𝑦1 𝑦2 𝑦𝑁 = 𝑡1 + 𝑡2 + ⋯ + 𝑡𝑁 𝑛 𝑝1 𝑝2 𝑝𝑁 1 = 𝑛 𝐸 𝑌𝑝𝑝𝑠
𝑁
𝑖=1
1 = 𝑛
𝑦𝑖 𝑡𝑖 𝑝𝑖 𝑁
𝑖=1
𝑦𝑖 𝑛𝑝𝑖 = 𝑝𝑖
𝑁
𝑦𝑖 = 𝑌 𝑖=1
(𝑢𝑛𝑏𝑖𝑎𝑠𝑒𝑑)
Estimator untuk PPS WR (Hansen Hurwitz Estimator) • Varians populasi untuk total karakteristik:
𝑉 𝑌𝑝𝑝𝑠
1 = 𝑛
𝑁
𝑝𝑖 𝑖=1
𝑦𝑖 −𝑌 𝑝𝑖
2
Bukti: 𝑉 𝑌𝑝𝑝𝑠
1 = 2 𝑛
1 = 𝑛 1 = 𝑛
𝑁
𝑖=1 𝑁
𝑖=1 𝑁
𝑖=1
𝑦𝑖 𝑝𝑖
𝑦𝑖 𝑝𝑖 2
𝑁
2
𝑁
𝑉 𝑡𝑖 + 2 𝑖=1 𝑗>𝑖 𝑁
2
𝑦𝑖 𝑦𝑗 𝐶𝑜𝑣(𝑡𝑖 𝑡𝑗 ) 𝑝𝑖 𝑝𝑗 𝑁
𝑝𝑖 1 − 𝑝𝑖 − 2
𝑦𝑖 − 𝑌2 𝑝𝑖
𝑖=1 𝑗>𝑖
1 = 𝑛
𝑁
𝑝𝑖 𝑖=1
𝑦𝑖 𝑦𝑗 𝑝𝑖 𝑝𝑗 𝑝𝑖 𝑝𝑗
𝑦𝑖 −𝑌 𝑝𝑖
2
(𝑡𝑒𝑟𝑏𝑢𝑘𝑡𝑖)
Estimator untuk PPS WR (Hansen Hurwitz Estimator) • Unbiased estimator varians untuk total karakteristik:
𝑣 𝑌𝑝𝑝𝑠
1 = 𝑛(𝑛 − 1)
Bukti: 𝑣 𝑌𝑝𝑝𝑠
1 = 𝑛(𝑛 − 1)
𝑛
𝑖=1 𝑛
𝑖=1 𝑛
𝑛(𝑛 − 1)𝑣 𝑌𝑝𝑝𝑠 = 𝑖=1
𝑛 𝑛 − 1 𝐸 𝑣 𝑌𝑝𝑝𝑠
2
𝑦𝑖 − 𝑌𝑝𝑝𝑠 𝑝𝑖
2
𝑦𝑖 − 𝑌𝑝𝑝𝑠 𝑝𝑖
2
𝑛
=𝐸 𝑛
𝑛 𝑛 − 1 𝐸 𝑣 𝑌𝑝𝑝𝑠
𝑦𝑖 − 𝑌𝑝𝑝𝑠 𝑝𝑖
=𝐸 𝑖=1
𝑖=1
𝑦𝑖 −𝑌 𝑝𝑖
𝑦𝑖 − 𝑌𝑝𝑝𝑠 𝑝𝑖
2
2
− 𝑛 𝑌𝑝𝑝𝑠 − 𝑌
2
Estimator untuk PPS WR (Hansen Hurwitz Estimator) • Unbiased estimator varians untuk total karakteristik:
Bukti (lanjutan):
𝑛
𝑛 𝑛 − 1 𝐸 𝑣 𝑌𝑝𝑝𝑠
𝑦𝑖 −𝑌 𝑝𝑖
=𝐸 𝑖=1 𝑁
𝑛 𝑛 − 1 𝐸 𝑣 𝑌𝑝𝑝𝑠
=𝐸
𝑡𝑖 𝑖=1 𝑁
𝑛 𝑛 − 1 𝐸 𝑣 𝑌𝑝𝑝𝑠
=𝐸 =𝑛 𝑖=1
𝑦𝑖 −𝑌 𝑝𝑖
− 𝑛 𝑌𝑝𝑝𝑠 − 𝑌
2
2
− 𝑛 𝑌𝑝𝑝𝑠 − 𝑌 2
𝑡𝑖
𝑦𝑖 −𝑌 𝑝𝑖
2
𝑝𝑖
𝑦𝑖 −𝑌 𝑝𝑖
𝑖=1 𝑛
𝑛 𝑛 − 1 𝐸 𝑣 𝑌𝑝𝑝𝑠
2
− 𝑛 ∙ 𝑉 𝑌𝑝𝑝𝑠 − 𝑛 ∙ 𝑉 𝑌𝑝𝑝𝑠
𝑛 𝑛 − 1 𝐸 𝑣 𝑌𝑝𝑝𝑠 = 𝑛(𝑛 − 1) ∙ 𝑉 𝑌𝑝𝑝𝑠 𝐸 𝑣 𝑌𝑝𝑝𝑠 = 𝑉 𝑌 (𝑢𝑛𝑏𝑖𝑎𝑠𝑒𝑑)
2
Latihan 4 • Dari data hipotetik di bawah ini, buktikan secara empirik bahwa
penduga total dan penduga varians dari penarikan sampel PPS WR adalah unbiased ! (ambil n=2). Unit
𝑿𝒊
𝒀𝒊
A
6
3
B
12
4
C
15
3
Estimator untuk PPS WR (Hansen Hurwitz Estimator) • Estimasi total:
Estimasi total berdasarkan unit ke-i:
𝑦𝑖 𝑌𝑖 = 𝑝𝑖 Estimasi total berdasarkan 𝑛 sampel: 𝑛 1 𝑌𝑝𝑝𝑠 = 𝑌𝑖 𝑛 𝑖=1
Estimasi varians sampling:
𝑣 𝑌𝑝𝑝𝑠 =
1 𝑛(𝑛 − 1)
• Estimasi rata-rata:
𝑦𝑝𝑝𝑠 Estimasi varians sampling : 𝑣 𝑦𝑝𝑝𝑠
𝑛
𝑌𝑖 − 𝑌𝑝𝑝𝑠 𝑖=1
𝑌𝑝𝑝𝑠 = 𝑁
1 = 2 𝑣(𝑌𝑝𝑝𝑠 ) 𝑁
2
Relative Eficiency PPS WR terhadap SRS WR 𝑁2 2 𝑁 𝑁 • Varians SRS WR: 𝑉 𝑌𝑠𝑟𝑠 = 𝑆 = 𝑦𝑖 2 − 𝑁𝑌 2 𝑖=1 𝑛 𝑛 1 𝑛 𝑦𝑖 2 𝑁 2 Unbiased estimator untuk: 𝑖=1 𝑦𝑖 adalah dan 𝑛 𝑖=1 𝑝𝑖 2 Unbiased estimator untuk: 𝑁𝑌 2 adalah 𝑌𝑝𝑝𝑠 − 𝑣 𝑌𝑝𝑝𝑠
Dengan demikian, unbiased estimator dari varians SRS WR berdasarkan sampel PPS WR dapat dinyatakan dengan rumus: 𝑛 𝑁 𝑦𝑖 2 1 2 𝑣𝑝𝑝𝑠 𝑌𝑠𝑟𝑠 = 2 − 𝑌𝑝𝑝𝑠 − 𝑣 𝑌𝑝𝑝𝑠 𝑛 𝑝𝑖 𝑛 1 = 2 𝑁 𝑛
𝑛
𝑖=1
𝑖=1 𝑦𝑖 2
𝑝𝑖
− 𝑛𝑌𝑝𝑝𝑠
2
1 + 𝑣 𝑌𝑝𝑝𝑠 𝑛
• Relative Eficiency (RE) PPS WR terhadap SRS WR:
𝑅𝐸 =
𝑣 𝑌𝑝𝑝𝑠 𝑣𝑝𝑝𝑠 𝑌𝑠𝑟𝑠
× 100%
Latihan 5 • Untuk meneliti total produksi jagung di suatu desa, dilakukan pengambilan sampel
petak ladang secara PPS WR dengan size luas tanam. Jumlah petak ladang yang ditanami jagung sebanyak 160 petak dengan rata-rata luas tanam per petak adalah 250 𝑚2 . Jumlah sampel yang diambil adalah 12 petak dengan data sebagai berikut: No
1
2
3
4
5
6
7
8
9
10
11
12
Luas tanam 𝑚2
214 315 343 165
195
270
406
227
270
255
380
335
Produksi (kg)
321 378 343 264
351
216
609
454
459
408
912
737
a. b. c.
Perkirakan total produksi jagung di desa tsb dan rata-rata produksi jagung per petak beserta standar error, RSE, Relative Efficiency terhadap SRS dan confidence interval-nya. Beri interpretasi. Perkirakan rata-rata produktivitas ladang per 𝒎𝟐 di desa tsb beserta standar error, RSE, dan confidence interval-nya. Beri interpretasi. Jika petak ladang yang produktivitasnya kurang dari rata-rata produktivitas ladang per 𝑚2 di desa tsb dikategorikan sebagai lahan kurang produktif, perkirakan jumlah petak dan luas tanam yang kurang produktif. Lengkapi dengan nilai standar error, RSE, dan confidence interval-nya. Beri interpretasi.
Latihan 6 • Dari total populasi sebanyak 624 perusahaan
di suatu provinsi dilakukan pengambilan sampel sebanyak 15 perusahaan secara PPS WR dengan size jumlah pekerja tahun lalu kemudian dilakukan pencacahan ke perusahaan terpilih untuk meneliti pengeluaran perusahaan untuk pembayaran upah pekerja. Diketahui jumlah pekerja tahun lalu di provinsi tersebut adalah 1600 orang. a. Perkirakan rata-rata pengeluaran perusahaan untuk pembayaran upah pekerja, lengkapi dengan standar error, RSE, dan 95% Confidence Interval-nya ! b. Jika diasumsikan jumlah pekerja pada tahun survei tidak mengalami perubahan dari jumlah pekerja tahun lalu, perkirakan ratarata upah pekerja di provinsi tsb beserta standar error, RSE, dan 95% Confidence Interval-nya ! c. Hitung relative efficiency nya terhadap SRS !
No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Pengeluaran Jumlah untuk upah Pekerja pekerja (000 rp) tahun lalu tahun survei 40 75240 36 54036 64 110016 24 63144 32 57216 20 39180 16 30912 64 189056 48 85584 52 141388 28 81424 36 90216 60 127740 44 76472 20 53980
Stratified PPS Sampling • Populasi sebanyak N dibagi menjadi L strata (𝑁1 , 𝑁2 , … , 𝑁ℎ , … , 𝑁𝐿 ),
kemudian dari masing-masing strata dilakukan penarikan sampel secara PPS. • Probability selection unit ke-i pada strata ke-h adalah: 𝑋ℎ𝑖 𝑝ℎ𝑖 = 𝑋ℎ • Fraksi sampling (inclusion probability) unit ke-i strata ke-h adalah: 𝑋ℎ𝑖 𝑓ℎ𝑖 = 𝜋ℎ𝑖 = 𝑝ℎ𝑖 ∙ 𝑛ℎ = ∙𝑛 𝑋ℎ ℎ • Estimasi total karakteristik di strata ke-h: 𝑛ℎ 𝑛ℎ 𝑦ℎ𝑖 1 𝑦ℎ𝑖 𝑌ℎ = = 𝜋ℎ𝑖 𝑛ℎ 𝑝ℎ𝑖 𝑖=1
𝑖=1
• Estimasi varians total karakteristik di strata ke-h:
𝑣 𝑌ℎ =
1 𝑛ℎ (𝑛ℎ − 1)
𝑛ℎ
𝑖=1
𝑦ℎ𝑖 − 𝑌ℎ 𝑝ℎ𝑖
2
Stratified PPS Sampling • Estimasi total karakteristik populasi: 𝐿
𝑌=
𝐿
𝑛ℎ
𝑌ℎ = ℎ=1
ℎ=1 𝑖=1
𝑦ℎ𝑖 = 𝜋ℎ𝑖
𝐿
ℎ=1
• Estimasi varians total karakteristik populasi: 𝐿
𝑣 𝑌 =
𝐿
𝑣 𝑌ℎ = ℎ=1
ℎ=1
1 𝑛ℎ (𝑛ℎ − 1)
1 𝑛ℎ 𝑛ℎ 𝑖=1
• Estimasi rata-rata karakteristik populasi:
𝑌 𝑁 • Estimasi varians rata-rata karakteristik populasi: 1 𝑣 𝑦 = 2 𝑣(𝑌) 𝑁 𝑦=
𝑛ℎ 𝑖=1
𝑦ℎ𝑖 𝑝ℎ𝑖
𝑦ℎ𝑖 − 𝑌ℎ 𝑝ℎ𝑖
2
Latihan 7 • Populasi sebanyak 40 perusahaan di kota X dibagi menjadi 2 strata, yaitu
industri mikro (strata 1) dan industri kecil (strata 2). Kemudian dari tiap strata dilakukan penarikan sampel secara PPS WR dengan size jumlah tenaga kerja. Data yang diperoleh: Strata 1 2
Jumlah Jumlah perusahaan pekerja 25 15
160 240
Sampel Pekerja
5
4
3
4
2
6
Output
20
18
12
16
6
18
Pekerja
15
20
25
16
18
Output
90
96
120
72
117
Ket: Output dalam juta rupiah Perkirakan total output perusahaan di kota X beserta standar error , rse, dan 95% Confidence Interval-nya !
PPS WOR • Pada prinsipnya, PPS WOR akan menghasilkan estimator • •
•
•
yang lebih efisien daripada PPS WR. Hal ini dikarenakan effective sample size dari PPS WOR akan lebih besar daripada effective sample size dari PPS WR. Namun, PPS WOR memerlukan prosedur yang kompleks sehingga kadangkala sulit diterapkan pada survei skala besar. Pada survei skala besar, fraksi sampling biasanya kecil sehingga efisiensi dari PPS WOR dan PPS WR perbedaannya tidak terlalu signifikan. Jika fraksi sampling besar, lebih baik menggunakan PPS WOR
Des Raj’s Ordered Estimator • Jika sampel sebanyak n unit (𝑦𝑖 , 𝑦2 , … , 𝑦𝑛 ) diambil secara
PPS WOR dari populasi sebanyak N unit, maka: 𝑖−1
𝑧𝑖 =
𝑖−1
𝑦𝑘 + 1 − 𝑘=1
𝑦𝑖 𝑝𝑖
𝑝𝑘 𝑘=1
, 𝑖 = 2,3, … , 𝑛
• Estimator total karakteristiknya:
1 𝑌𝐷 = 𝑛
𝑛
𝑧𝑖 𝑖=1
• Estimator varians total karakteristiknya:
𝑣 𝑌𝐷
1 = 𝑛(𝑛 − 1)
𝑛
𝑧𝑖 − 𝑌𝐷 𝑖=1
2
Latihan 8 • Sampel berukuran 3 diambil dari populasi sebanyak 10 unit
secara PPS WOR. Jika total size adalah 100 dan data yang diperoleh sebagai berikut: No
1
2
3
𝑥𝑖
6
20
10
𝑦𝑖
3
10
7
Perkirakan total karakteristik populasi dengan Des Raj’s Ordered Estimator beserta standar error dan rse-nya !
Horvitz Thompson Estimator (HT) • Horvitz Thompson Estimator adalah general estimator untuk
estimasi total karakteristik populasi yang dapat digunakan untuk berbagai desain sampling, baik WR maupun WOR. • Sebuah sampel sebanyak n unit diambil secara PPS, dan:
𝜋𝑖 menyatakan peluang unit ke-i masuk dalam sampel 𝜋𝑖𝑗 menyatakan peluang unit ke-i dan unit ke-j keduanya masuk dalam sampel
Horvitz Thompson Estimator (HT) • Jika penarikan sampel dilakukan dengan PPS WR, nilai 𝜋𝑖
dan 𝜋𝑖𝑗 diperoleh dari persamaan:
𝜋𝑖 = 𝑃(𝑢𝑛𝑖𝑡 𝑖 𝑚𝑎𝑠𝑢𝑘 𝑑𝑎𝑙𝑎𝑚 𝑠𝑎𝑚𝑝𝑒𝑙) 𝜋𝑖 = 1 − 𝑃(𝑢𝑛𝑖𝑡 𝑖 𝑡𝑖𝑑𝑎𝑘 𝑚𝑎𝑠𝑢𝑘 𝑑𝑎𝑙𝑎𝑚 𝑠𝑎𝑚𝑝𝑒𝑙) 𝝅𝒊 = 𝟏 − 𝟏 − 𝒑𝒊
𝒏
𝝅𝒊𝒋 = 𝝅𝒊 + 𝝅𝒋 − 𝟏 − 𝟏 − 𝒑𝒊 − 𝒑𝒋
𝒏
Horvitz Thompson Estimator (HT) • Jika penarikan sampel dilakukan dengan PPS WOR (n=2),
nilai 𝜋𝑖 dan 𝜋𝑖𝑗 diperoleh dari persamaan: 𝑁
𝜋𝑖 = 𝑝𝑖 + 𝑗≠𝑖
𝑝𝑗 𝑝𝑖 = 𝑝𝑖 1 + (1 − 𝑝𝑗 )
𝑁
𝑗≠𝑖
𝑝𝑗 (1 − 𝑝𝑗 )
𝒑𝒊 = 𝒑𝒊 𝟏 + 𝑨 − 𝟏 − 𝒑𝒊 𝑝𝑖 𝑝𝑗 𝑝𝑗 𝑝𝑖 𝟏 𝟏 𝜋𝑖𝑗 = + = 𝒑𝒊 𝒑𝒋 + (1 − 𝑝𝑖 ) (1 − 𝑝𝑗 ) (𝟏 − 𝒑𝒊 ) (𝟏 − 𝒑𝒋 ) Keterangan: 𝑵
𝑨= 𝒊=𝟏
𝒑𝒊 𝟏 − 𝒑𝒊
Horvitz Thompson Estimator (HT) • Estimator total karakteristik:
𝑣
𝑌𝐻𝑇 = 𝑖=1
𝑦𝑖 𝜋𝑖
• Estimasi varians total karakteristik: 𝑣
𝑣 𝑌𝐻𝑇 = 𝑖=1
1 1 2 − 𝑦 𝑖 +2 2 𝜋𝑖 𝜋𝑖
𝑣
𝑖=1 𝑗>𝑖
1 1 − 𝑦𝑖 𝑦𝑗 𝜋𝑖 𝜋𝑗 𝜋𝑖𝑗
Keterangan: 𝑣 : effective sample size (jumlah unit yang berbeda dalam sampel)
Contoh: • Dari area sawah seluas 100 ℎ𝑎 dibagi menjadi beberapa
sub-area, dan diambil 4 sub-area sebagai sampel secara PPS WR (proporsional terhadap luas sub-area)untuk meneliti produksi padi di area tersebut. Sub-area A terpilih 2 kali. Data yang diperoleh: No urut No urut effective Sub-Area sampel sample size (i) 1 2
1
𝒙𝒊
𝒚𝒊
A
5
60
A
5
60
3
2
G
2
14
4
3
K
1
1
• Hitung selection probability (𝑝𝑖 )
𝑥1 5 𝑝1 = = = 0,05 𝑋 100 𝑥2 2 𝑝2 = = = 0,02 𝑋 100 𝑥3 1 𝑝3 = = = 0,01 𝑋 100
• Hitung inclusion probability 𝜋𝑖
𝜋𝑖 = 1 − (1 − 𝑝𝑖 )𝑛 𝜋1 = 1 − 1 − 0,05 4 = 0.1855 𝜋2 = 1 − 1 − 0,02 4 = 0.0776 𝜋3 = 1 − 1 − 0,01 4 = 0.0394
Hitung Joint Inclusion Probability 𝝅𝒊𝒋 • Rumus:
𝜋𝑖𝑗 = 𝜋𝑖 + 𝜋𝑗 − 1 − 1 − 𝑝𝑖 − 𝑝𝑗
𝑛
𝜋12 = 𝜋1 + 𝜋2 − 1 − 1 − 𝑝1 − 𝑝2 4 = 0,1855 + 0,0776 − 1 − 1 − 0,05 − 0,02 = 0,0112 𝜋13 = 𝜋1 + 𝜋3 − 1 − 1 − 𝑝1 − 𝑝3 4 = 0,1855 + 0,0394 − 1 − 1 − 0,05 − 0,01 = 0,0056 𝜋23 = 𝜋2 + 𝜋3 − 1 − 1 − 𝑝2 − 𝑝3 4 = 0,0776 + 0,0394 − 1 − 1 − 0,02 − 0,01 = 0,0023
4
4
4
Hitung estimasi total • Estimasi total:
𝑣
𝑌𝐻𝑇 = 𝑖=1
𝑦𝑖 60 14 1 = + + = 529 𝜋𝑖 0,1855 0,0776 0,0394
• Estimasi varians: 𝑣
𝑣 𝑌𝐻𝑇 = 𝑖=1
1 1 − 𝑦𝑖 2 + 2 2 𝜋𝑖 𝜋𝑖
𝑣
𝑖=1 𝑗>𝑖
1 1 − 𝑦𝑦 𝜋𝑖 𝜋𝑗 𝜋𝑖𝑗 𝑖 𝑗
1 1 1 1 2 = − 60 + − 142 2 2 0,1855 0,1855 0,0776 0,0776 1 1 1 1 2 + − 1 + 2 − 60 14 0,03942 0,0394 0,1855 ∙ 0,0776 0,0112 1 1 1 1 +2 − 60 1 + 2 − 14 1 0,1855 ∙ 0,0394 0,0056 0,0776 ∙ 0,0394 0,0023 = 74.538 𝑠𝑒 𝑌𝐻𝑇 =
𝑣 𝑌𝐻𝑇 = 273
Latihan 9 • Sampel berukuran 2 diambil dari populasi sebanyak 5 unit
secara PPS. Data populasi sebagai berikut: No
1
2
3
4
5
𝑥𝑖
6
20
10
5
9
𝑦𝑖
-
10
-
-
6
Jika unit ke-2 dan ke-5 terpilih sebagai sampel, perkirakan total karakteristik populasi dengan Horvitz Thompson Estimator beserta standar error dan rse-nya: a. Jika sampel tersebut diambil secara PPS WR b. Jika sampel tersebut diambil secara PPS WOR
Unordered Murthy’s Method • Dalam PPS WOR, jika unit yang terpilih pertama mempunyai
probability selection 𝑝𝑖 , maka probability selection untuk terpilihnya unit sampel yang kedua adalah 𝑝𝑗 1 − 𝑝𝑖 probability selection untuk terpilihnya unit sampel yang ketiga adalah 𝑝𝑘 1 − 𝑝𝑖 − 𝑝𝑗 probability selection untuk terpilihnya unit sampel yang keempat adalah 𝑝𝑙 1 − 𝑝𝑖 − 𝑝𝑗 − 𝑝𝑘 dst
Unordered Murthy’s Method • Estimator total:
𝑛 𝑖=1 𝑃
𝑠|𝑖 𝑦𝑖 𝑌𝑀 = 𝑃(𝑠) 𝑃 𝑠|𝑖 : conditional probability untuk mendapatkan suatu set sampel jika unit ke-i terpilih sebagai sampel pertama 𝑃(𝑠) : unconditional probability untuk mendapatkan suatu set sampel 𝑦𝑖 : nilai karakteristik untuk unit ke-i • Estimasi varians total: 𝑣 𝑌𝑀
1 = 𝑃(𝑠)
𝑛
𝑛
𝑃 𝑠 𝑃 𝑠 𝑖𝑗 − 𝑃 𝑠 𝑖 𝑃(𝑠|𝑗) 𝑝𝑖 𝑝𝑗
2 𝑖=1 𝑗>𝑖
𝑦𝑖 𝑦𝑗 − 𝑝𝑖 𝑝𝑗
2
𝑃 𝑠|𝑖𝑗 : conditional probability untuk mendapatkan suatu set sampel jika unit ke-i terpilih sebagai sampel pertama dan unit ke-j terpilih sebagai sampel kedua
Unordered Murthy’s Method • Untuk n=2 (sampel terdiri dari unit ke-i dan ke-j):
𝑝𝑗 𝑃 𝑠|𝑖 = 1 − 𝑝𝑖 𝑝𝑖 𝑃 𝑠|𝑗 = 1 − 𝑝𝑗
𝑝𝑖 𝑝𝑗 (2 − 𝑝𝑖 − 𝑝𝑗 ) 𝑃 𝑠 = 𝑝𝑖 ∙ 𝑃 𝑠 𝑖 + 𝑝𝑗 ∙ 𝑃 𝑠 𝑗 = (1 − 𝑝𝑖 )(1 − 𝑝𝑗 ) Estimator total:
𝟏 𝒀𝑴 = 𝟐 − 𝒑𝒊 − 𝒑𝒋
𝒚𝒋 𝒚𝒊 𝟏 − 𝒑𝒋 + (𝟏 − 𝒑𝒊 ) 𝒑𝒊 𝒑𝒋
Varians sampling: (𝟏 − 𝒑𝒊 )(𝟏 − 𝒑𝒋 )(𝟏 − 𝒑𝒊 − 𝒑𝒋 ) 𝒚𝒊 𝒚𝒋 𝒗 𝒀𝑴 = − 𝟐 𝒑𝒊 𝒑𝒋 𝟐 − 𝒑𝒊 − 𝒑 𝒋
𝟐
Latihan 10 • Sampel berukuran 2 diambil dari populasi sebanyak 5 unit
secara PPS WOR. Data yang populasi sebagai berikut: No
1
2
3
4
5
𝑥𝑖
6
20
10
5
9
𝑦𝑖
-
10
-
-
6
Jika unit ke-2 dan ke-5 terpilih sebagai sampel, perkirakan total karakteristik populasi dengan Murthy’s Estimator beserta standar error dan rse-nya !
Rao, Hartley, Cochran Estimator (RHC) • Estimator ini digunakan jika pengambilan sampel dilakukan dengan
random group method. • Dalam random group method, populasi sebanyak N dibagi menjadi n
group secara random, kemudian dari masing-masing group diambil satu unit sebagai sampel • Dengan demikian, akan terdapat sampel sebanyak n unit.
Rao, Hartley, Cochran Estimator (RHC) • Misalkan 𝑥𝑔 menyatakan nilai variabel pendukung untuk unit yang
terpilih sampel pada strata ke-g, dan 𝑋𝑔 menyatakan total nilai variabel pendukung untuk strata ke-g, maka estimator totalnya: 𝑛
𝑌𝑅𝐻𝐶 = 𝑔=1
𝑦𝑔 𝑋𝑔 𝑥𝑔
• Estimasi variansnya:
𝑣 𝑌𝑅𝐻𝐶 =
𝑛 2 𝑛 𝑁 − 𝑁 𝑔=1 𝑔 𝑋𝑔 2 𝑛 2 𝑁 − 𝑔=1 𝑁𝑔 𝑔=1
𝑦𝑔 − 𝑌𝑅𝐻𝐶 𝑥𝑔
2
Latihan 11 • Untuk memperkirakan banyaknya tangkapan ikan di kabupaten A,
dilakukan pengambilan sampel secara PPS WOR Random group method dengan size jumlah perahu yang datang di tempat pelelangan ikan (TPI). Jumlah populasi TPI sebanyak 12 dan diambil 4 TPI sebagai sampel. Data yang diperoleh: Sampel terpilih Group
Nama TPI
Jumlah perahu
1
A, G, L
2
Nama TPI
Jumlah Perahu
Jumlah ikan (kwintall)
16
G
8
12
B, E, I
20
B
10
16
3
C, H, J
10
H
4
8
4
D, F, K
24
K
8
10
Perkirakan total tangkapan ikan di Kabupaten A beserta standar error dan rse-nya !
TERIMA KASIH Have A Nice Sampling
METODE PENARIKAN SAMPEL
RATIO ESTIMATOR Oleh: Adhi Kurniawan
Deskripsi • Selain variabel yang diteliti
𝑦 , satu atau lebih variabel pendukung 𝑥 bisa dikaji
korelasinya dari setiap unit populasi. • Pada tahap estimasi, korelasi antara variabel yang diteliti 𝑦 dan variabel pendukung
𝑥 bisa digunakan untuk menghasilkan estimasi-estimasi yang lebih tepat daripada yang diperoleh dari variabel 𝑦 itu sendiri. • Salah satu metode estimasi yang dipakai untuk menghubungkan variabel 𝑦 dan 𝑥 𝑦 𝑥
adalah dengan menggunakan rasio 𝑅 = 𝑟 = dari dua rata-rata sampel 𝑦 dan 𝑥 . • Rasio ini digunakan sebagai estimator dari rasio rata-rata variabel 𝑦
populasi 𝑅 =
dan 𝑥 dalam
𝑌 𝑋
• Rasio ini juga dapat digunakan untuk memperoleh suatu estimasi tentang total populasi
yang lebih akurat daripada estimasi yang ditentukan dengan perkalian sederhana antara total karakteristik sampel (𝑦) dengan invers dari fraksi sampling.
Definisi
Ratio estimator adalah suatu metode estimasi yang memanfaatkan perbandingan/rasio antara variabel yang diteliti (𝑦) dengan variabel bantu/pendukung 𝑥 untuk meningkatkan efisiensi pendugaan parameter populasi.
Mengapa menggunakan Estimasi Rasio ? (1) 1.
Seringkali kita ingin melakukan estimasi rasio suatu variabel terhadap variabel lainnya. Misalkan: Estimasi rasio produksi padi terhadap luas lahan Estimasi rasio penduduk laki-laki terhadap penduduk
perempuan Estimasi pendapatan per kapita Estimasi rasio hutang terhadap asset perusahaan
Mengapa menggunakan Estimasi Rasio ? (2) 2.
Kadang kala kita ingin melakukan estimasi total, namun ukuran populasi (N) tidak diketahui Kita tidak dapat menggunakan rumus 𝑌 = 𝑁𝑦 seperti yang telah dipelajari
sebelumnya.
Namun,
kita
mempunyai
nilai
total
karakteristik untuk variabel lain, misalkan 𝑋 . Dengan demikian, ukuran populasi bisa diestimasi dengan rumus: 𝑋 𝑁= 𝑥 Dan estimasi total karakteristik untuk variabel yang diteliti (y) adalah: 𝑋 𝑌= 𝑦 𝑥
Mengapa menggunakan Estimasi Rasio ? (3) 3.
Estimasi rasio seringkali digunakan untuk meningkatkan presisi dari estimasi rata-rata dan estimasi total
Contoh: Laplace ingin melakukan estimasi total penduduk Prancis. Dia bisa
mendapatkan estimasi total penduduk dengan mengalikan rata-rata jumlah penduduk 𝑦 di 30 komunitas dengan jumlah komunitas di Prancis (𝑁). Namun, dia menggunakan informasi lain yaitu jumlah catatan kelahiran (𝑥)
untuk meningkatkan presisi. Dia beralasan bahwa jumlah kelahiran akan sebanding dengan jumlah
penduduk. Wilayah yang penduduknya banyak, jumlah kelahirannya juga banyak, sehingga korelasi antara kedua variabel tersebut positif.
Mengapa menggunakan Estimasi Rasio ? (4) 4.
Estimasi rasio bisa digunakan untuk melakukan adjustment dari data sampel sehingga akan diperoleh estimasi total yang lebih akurat. Contoh: Sampel SRS sebanyak n=400 mahasiswa (240 wanita, 160 pria)
diambil dari populasi sebanyak N=4000 mahasiswa di sebuah universitas. Dari data sampel diketahui bahwa sebanyak 84 wanita dan 40 pria
ingin berkarir di bidang riset. Dengan menggunakan informasi hanya dari SRS, maka estimasi
total mahasiswa yang ingin berkarir di bidang riset adalah: 4000 𝑌= × 124 = 1240 400
Mengapa menggunakan Estimasi Rasio ? (4) Jika diketahui bahwa jumlah populasi mahasiswa wanita adalah 2700 orang
dan populasi mahasiswa pria adalah 1300 orang maka estimasi yang lebih akurat mengenai total mahasiswa yang ingin berkarir di bidang riset adalah: 84 40 𝑌= × 2700 + × 1300 = 1270 240 160 Pada kasus di atas, estimasi rasio digunakan berdasarkan jenis kelamin.
Berdasarkan data sampel 60% mahasiswa adalah wanita, tetapi dari data populasi diketahui bahwa persentase mahasiswa perempuan adalah 67,5%, Dengan informasi ini kita bisa melakukan adjustment terhadap estimasi total
mahasiswa yang ingin berkarir di bidang riset. Penggunaan estimasi rasio dalam kasus ini disebut poststratification.
Mengapa menggunakan Estimasi Rasio ? (5) 5. Estimasi rasio bisa digunakan untuk adjustment nonrespon.
Contoh: Untuk meneliti jumlah upah yang dikeluarkan perusahaan, diambil
beberapa perusahaan sebagai sampel. Misalkan 𝑦𝑖 adalah jumlah upah yang dikeluarkan oleh perusahaan ke-i,
dan 𝑥𝑖 adalah jumlah karyawan di perusahaan ke-i dan jumlah karyawan untuk semua perusahaan dalam populasi (𝑋) diketahui. Kita
juga mengasumsikan bahwa jumlah upah yang dikeluarkan
perusahaan akan berhubungan erat dengan jumlah karyawan. Misalkan, ada beberapa perusahaan yang nonrespon.
Adjustment estimasi total upah dengan mengalikan rasio upah terhadap
pekerja dari data sampel 𝑦/𝑥 dengan total pekerja 𝑋 : 𝑦 𝑌= 𝑋 𝑥
Ratio Estimator Ratio estimator dibedakan menjadi 3 kondisi: a. Rasio berupa karakteristik yang sama atau berhubungan dengan periode sebelumnya. 𝑋 adalah jenis karakteristik yang sama dengan 𝑌 tetapi berasal dari periode sebelumnya. Contoh: Suatu survei rumahtangga yang dilakukan tahun 2012 menggunakan hasil Sensus Penduduk 2010 sebagai dasar rasio dan menggunakan blok sensus sebagai unit sampling. 𝑦 adalah jumlah rumahtangga hasil updating tahun 2012 dari blok sensus terpilih. 𝑥 adalah jumlah rumahtangga hasil Sensus Penduduk 2010 dari blok sensus terpilih. 𝑦
Dengan demikian 𝑅 = merupakan perubahan banyaknya 𝑥 rumahtangga saat survei dibandingkan saat sensus.
Ratio Estimator b.
Rasio dari dua karakteristik berbeda yang berkorelasi kuat pada periode yang sama. 𝑋 dan 𝑌 merupakan dua buah karakteristik berbeda yang berasal
dari periode yang sama dan diketahui berkorelasi positif. Contoh:
Dari Survei Konsumsi/Pengeluaran rumah tangga diperoleh: 𝑦 adalah total konsumsi beras dari rumah tangga sampel 𝑥 adalah total anggota rumah tangga (ART) dari rumah tangga sampel Dengan demikian 𝑅 =
𝑦 𝑥
merupakan konsumsi beras per kapita
Ratio Estimator c.
Modifikasi lain dalam penggunaan estimasi rasio adalah menggunakan sumber lain dan data sampel untuk variabel yang sama sebagai faktor pengali. Contoh: Misalkan, telah ditentukan data proyeksi penduduk merupakan data yang disepakati untuk berbagai perencanaan dan kajian, maka dengan estimator
rasio, berarti faktor pengali dari survei adalah: 𝐹=𝑅=
𝑦 𝑥
𝑦 adalah jumlah penduduk pada tahun tertentu dari hasil proyeksi penduduk 𝑥 adalah jumlah penduduk sampel
Sifat-sifat Ratio Estimator • Secara umum, ratio estimator adalah estimator yang bias
konsisten. Maksudnya, semakin besar ukuran sampel maka biasnya akan semakin kecil. • Ratio estimator akan bersifat best linear unbiased estimator
jika memenuhi 2 kondisi: a. Hubungan (korelasi) antara 𝑦𝑖 dan 𝑥𝑖 berupa garis lurus
(linear), positif, dan melalui titik origin (0,0) b. Varians 𝑦𝑖 pada garis lurus bersifat proportional terhadap
𝑥𝑖
Sifat-sifat Ratio Estimator • Jika jumlah sampel (𝑛) besar, limiting distribution dari ratio estimate akan
mengikuti distribusi normal. • Jika jumlah sampel (𝑛) moderate, ratio estimate mempunyai
kecenderungan mengikuti positive skewness distribution. • Dalam penghitungan bias, terdapat rumus untuk berbagai ukuran sampel,
tetapi perkiraan varians hanya berlaku untuk jumlah sampel berukuran besar • Sebagai aturan praktis, Cochran menyatakan bahwa pendekatan large-
sample untuk penghitungan varians dapat digunakan jika: a. Ukuran sampel lebih dari 30 b. Koefisien variasi (CV) dari variabel x dan variabel y, keduanya kurang
dari 10%
Notasi 𝑦𝑖 : nilai karakteristik yang diteliti dari unit sampel ke-i 𝑥𝑖 : nilai variabel pendukung dari unit sampel ke-i 𝑦 : total nilai karakteristik yang diteliti dari data sampel 𝑛
𝑦=
𝑦𝑖 𝑖=1
𝑥 : total nilai variabel pendukung dari data sampel 𝑛
𝑥=
𝑥𝑖 𝑖=1
𝑌 : total nilai karakteristik yang diteliti untuk populasi 𝑁
𝑌=
𝑦𝑖 𝑖=1
𝑋 : total nilai variabel pendukung untuk populasi 𝑁
𝑋=
𝑥𝑖 𝑖=1
Estimator Jika penarikan sampel dilakukan secara simple random sampling, dan nilai karakteristik 𝒚 dan 𝒙 tersedia untuk setiap unit dalam sampel dengan nilai populasi 𝑿 diketahui, maka: • Estimator rasio 𝑦 𝑅= 𝑥 • Estimator rata-rata 𝑦𝑅 = 𝑅𝑋 • Estimator total 𝑌𝑅 = 𝑅 𝑋
Estimasi varians • Varians rata-rata:
𝑣 𝑦𝑅
1−𝑓 = 𝑛(𝑛 − 1)
𝑛
𝑦𝑖 − 𝑅 𝑥𝑖
2
𝑖=1
Rumus di atas dapat dijabarkan menjadi: 𝑛 𝑛 𝑛 1−𝑓 𝑣 𝑦𝑅 = 𝑦𝑖2 − 2𝑅 𝑦𝑖 𝑥𝑖 + 𝑅 2 𝑥𝑖2 𝑛(𝑛 − 1) 𝑖=1 𝑖=1 𝑖=1 1−𝑓 2 = 𝑠𝑦 − 2𝑅 𝑠𝑦𝑥 + 𝑅 2 𝑠𝑥2 𝑛 Keterangan: 𝑛 1 𝑠𝑦𝑥 = 𝑦𝑖 − 𝑦 𝑥𝑖 − 𝑥 → 𝑠𝑎𝑚𝑝𝑙𝑒 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑛−1 𝑖=1
Bukti: 𝑣 𝑦𝑅
1−𝑓 = 𝑛(𝑛 − 1)
𝑛
𝑦𝑖 − 𝑅𝑥𝑖
2
𝑖=1
Rumus di atas dapat dijabarkan menjadi: 𝑛 1−𝑓 𝑣 𝑦𝑅 = 𝑦𝑖 − 𝑦 + 𝑦 − 𝑅𝑥𝑖 𝑛(𝑛 − 1)
2
𝑖=1 𝑛
= = =
1−𝑓 𝑛(𝑛 − 1) 1−𝑓 𝑛(𝑛 − 1) 1−𝑓 𝑛(𝑛 − 1)
2
+ 2 𝑦𝑖 − 𝑦 𝑦 − 𝑅𝑥𝑖 + 𝑦 − 𝑅𝑥𝑖
𝑦𝑖 − 𝑦
2
+ 2𝑅 𝑦𝑖 − 𝑦 𝑥 − 𝑥𝑖 + 𝑅2 𝑥 − 𝑥𝑖
2
𝑦𝑖 − 𝑦
2
− 2𝑅 𝑦𝑖 − 𝑦 𝑥𝑖 − 𝑥 + 𝑅2 𝑥𝑖 − 𝑥
2
𝑖=1 𝑛
𝑖=1 𝑛
𝑖=1
1−𝑓 1 = 𝑛 𝑛−1 𝑣 𝑦𝑅
2
𝑦𝑖 − 𝑦
𝑛
𝑦𝑖 − 𝑦 𝑖=1
2
1 − 2𝑅 𝑛−1
1−𝑓 = 𝑠𝑦2 − 2𝑅𝑠𝑦𝑥 + 𝑅2 𝑠𝑥2 𝑛 (1 − 𝑓) 2 = 𝑠𝑦 − 2𝑅𝜌𝑠𝑦 𝑠𝑥 + 𝑅2 𝑠𝑥2 𝑛
𝑛
𝑦𝑖 − 𝑦 𝑥𝑖 − 𝑥 𝑖=1
1 + 𝑛−1
𝑛
𝑥𝑖 − 𝑥 𝑖=1
2
Estimasi varians • Varians rasio:
𝑣(𝑦𝑅 ) 𝑣 𝑅 = 𝑋2 1−𝑓 2 2𝑠2 = 𝑠 − 2𝑅 𝑠 + 𝑅 𝑦𝑥 𝑥 𝑛𝑋 2 𝑦 • Varians total:
𝑣 𝑌𝑅 = 𝑁 2 𝑣 𝑦𝑅 𝑁 2 (1 − 𝑓) 2 = 𝑠𝑦 − 2𝑅 𝑠𝑦𝑥 + 𝑅 2 𝑠𝑥2 𝑛
Latihan 1 • Berikut ini adalah data sampel dari 30 perusahaan yang diambil secara SRS WOR dari
325 perusahaan di Kota A. x menyatakan jumlah pekerja dan y adalah jumlah pekerja yang absen. Diketahui jumlah pekerja di kota A 25000 orang. No
x
y
No
x
y
No
x
y
No
x
y
No
x
y
1
95
9
7
125
9
13
57
5
19
103
9
25
63
5
2
79
7
8
81
10
14
132
13
20
52
8
26
83
7
3
30
3
9
43
6
15
47
4
21
67
14
27
124
13
4
45
2
10
53
2
16
43
9
22
64
6
28
31
2
5
28
3
11
148
16
17
116
12
23
75
6
29
96
23
6
142
8
12
89
4
18
65
8
24
69
8
30
42
13
a. Perkirakan persentase pekerja yang absen beserta standar error ,rse dan 95%CI-nya ! b. Perkirakan rata-rata pekerja yang absen per perusahaan beserta standar error , rse, dan 95%CI-nya ! c. Perkirakan total pekerja yang absen di Kota A beserta standar error dan rse, dan 95%CI-nya
Latihan 2 • Dari data Sensus Ternak tahun lalu diperoleh informasi bahwa jumlah peternak sapi di suatu
wilayah sebanyak 75.308 rumah tangga peternak dan rata-rata jumlah sapi untuk tiap peternak sebanyak 12 ekor. Sebuah sampel acak sederhana sebanyak 2.055 peternak diambil dari populasi tersebut untuk memperkirakan produksi susu yang dihasilkan. Jumlah sapi yang diperoleh dari hasil observasi adalah 25.071 ekor dan rata-rata produksi susu untuk tiap peternak sebanyak 300 liter per hari. Informasi lain yang diperoleh sebagai berikut: 𝑠𝑦 = 29,4 𝑠𝑥 = 0,96 𝜌 = 0,825 Dengan menggunakan ratio estimator, a.
Perkirakan rata-rata produksi susu per hari yang dihasilkan oleh satu ekor sapi beserta standar error, rse, dan 95% Confidence Interval-nya !
b.
Perkirakan rata-rata produksi susu per hari yang dihasilkan oleh rumah tangga peternak beserta standar error, rse, dan 95% Confidence Interval-nya !
c.
Perkirakan total produksi susu per hari di wilayah tersebut beserta standar error, rse, dan 95% Confidence Interval-nya !
BIAS PADA RATIO ESTIMATOR • Tidak seperti estimator 𝑦 dan 𝑌 pada SRS, ratio estimator
merupakan estimator yang bias dalam menduga nilai 𝑌𝑅 dan 𝑌𝑅 . • Bias pada ratio estimator disebabkan karena 𝑦 kita kalikan 𝑋 𝑥
dengan sehingga 𝐸 𝑦𝑅 ≠ 𝑌𝑅 . • Misalkan:
𝑌 𝑋−𝑋 𝑌𝑅 = ∙ 𝑋 = 𝑌 1 − 𝑋 𝑋 Maka 𝑌 𝑋−𝑋 𝑌𝑅 − 𝑌 = ∙ 𝑋 − 𝑌 = 𝑌 1 − −𝑌 𝑋 𝑋
BIAS PADA RATIO ESTIMATOR Karena 𝐸 𝑌 = 𝑌, maka: 𝑌 𝐸 𝑌𝑅 − 𝑌 = 𝐸 𝑌 − 𝑌 − 𝐸 𝑋−𝑋 𝑋 = −𝐸 𝑅 𝑋 − 𝑋 = −𝑐𝑜𝑣 𝑅 , 𝑋 𝐸 𝑌𝑅 − 𝑌 −𝑐𝑜𝑣(𝑅 , 𝑥 ) 𝐸 𝑅−𝑅 = = 𝑋 𝑋 𝐵𝑖𝑎𝑠 𝑅 𝑣 𝑅
1/2
=
𝜌
𝑅,𝑥
𝑋
∙
𝑣 𝑅 ∙𝑣 𝑥 𝑣 𝑅
1 2
𝑣 𝑥 ≤ 𝑋
1 2
= 𝐶𝑉 𝑥
BIAS PADA RATIO ESTIMATOR Pada desain SRS:
𝑛 1 2−𝜌 𝐸 𝑅−𝑅 ≈ 1− 𝑅𝑠 𝑥 (𝑥,𝑦) 𝑠𝑥 𝑠𝑦 2 𝑁 𝑛𝑋 1 = 2 𝑅 𝑣 𝑥 − 𝑐𝑜𝑣 𝑥 , 𝑦 𝑋 Kesimpulan: Bias dari 𝑅 akan kecil jika: 1) Sample size (𝑛) besar 2) Fraksi sampling
𝑛 𝑁
besar
3) 𝑋 besar 4) 𝑠𝑥 kecil 5) Correlation coefficient antara x dan y 𝜌(𝑥,𝑦) mendekati 1
MSE PADA RATIO ESTIMATOR 2
𝑀𝑆𝐸 𝑅 = 𝐸 𝑅 − 𝑅 𝑦 − 𝑅𝑥 =𝐸 𝑥
2
=𝐸
𝑦 − 𝑅𝑥 𝑥−𝑋 1− 𝑥 𝑋
=𝐸
𝑦 − 𝑅𝑥 𝑋
2
𝑦 − 𝑅𝑥 + 𝑋
Dengan asumsi 𝑥 ≈ 𝑋 maka: 𝑦 − 𝑅𝑥 2 𝑦 − 𝑅𝑥 𝐸 ≈𝐸 𝑥 𝑋
2
2
2
𝑥−𝑋 𝑥
2
𝑥−𝑋 −2 𝑥
1 = 2 𝐸 𝑦 − 𝑅𝑥 𝑋
2
MSE PADA RATIO ESTIMATOR 1 𝑀𝑆𝐸 𝑅 = 2 𝐸 𝑦 − 𝑅𝑥 2 𝑋 Untuk desain SRS: 𝑛 1 2 − 2𝑅 𝜌 2𝑠2 𝑀𝑆𝐸 𝑅 = 1 − 𝑠 𝑠 𝑠 + 𝑅 𝑦 (𝑥,𝑦) 𝑥 𝑦 𝑥 𝑁 𝑛𝑋 2 Kesimpulan: MSE akan kecil jika: 1) Ukuran sampel n besar 2) Fraksi sampling besar 3) Deviasi di sekitar garis 𝑦 = 𝑅𝑥 kecil 4) Koefisien korelasi 𝜌(𝑥,𝑦) mendekati 1 5) Nilai X besar
POPULASI KECIL YANG MENGILUSTRASIKAN BIAS • Bias dan MSE dari ratio estimator pada desain SRS bisa
diilustrasikan dengan membayangkan sampel yang diambil dari suatu populasi yang sangat kecil dan melihat sample space, yaitu sekumpulan dari all possible samples. • Misalkan kita ingin mengestimasi jumlah total dari ikan yang ditangkap pada suatu lokasi penangkapan. • Misalkan N=4 lokasi sepanjang sungai dan jumlah jaring 𝑥𝑖 pada setiap lokasi dalam populasi. i
Lokasi
1
2
3
4
𝑥𝑖
Jumlah Jaring
4
5
8
5
𝑦𝑖
Jumlah Ikan
200
300
500
400
• Total populasi sebenarnya adalah1400 ikan.
• Total populasi untuk variabel tambahan adalah 22 jaring • Simple random sample sebanyak n=2 lokasi dipilih dan
estimasi rasio digunakan untuk mengestimasi total jumlah ikan yang ditangkap. • Misalkan sampel terpilih adalah 𝑆 = 1,2 yang terdiri dari lokasi pertama dan kedua. • Ratio estimate (22)(200 + 300) 𝑌𝑅 = = 1222 (4 + 5) 𝑁 4 • Jumlah all possible sample adalah = =6 𝑛 2 Sampel
(1,2)
(1,3)
(1,4)
(2,3)
(2,4)
(3,4)
𝑌𝑅
1222
1283
1467
1354
1540
1523
• Oleh karena itu setiap sampel mempunyai peluang yang
sama yaitu P(s)=1/6 𝐸 𝑌𝑅 =
𝑌𝑅 𝑃 𝑠 = 1398,17
𝑌 = 1400 6
(𝑌𝑅𝑠 − 𝑌)2 𝑃 𝑠 = 14451,2
𝑀𝑆𝐸 𝑌𝑅 = 𝑠=1
𝑀𝑆𝐸 𝑌𝑅 =
14451,2 = 120
𝐵𝑖𝑎𝑠 = 1398,17 − 1400 = −1,83 𝐵𝑖𝑎𝑠 2 = 3,4 𝑉 𝑌𝑅 = 14487,8
Efisiensi Ratio Estimator Terhadap SRS • Varians SRS
𝑣 𝑌𝑠𝑟𝑠
2 𝑠 𝑦 = 𝑁 2 (1 − 𝑓) ∙ 𝑛
• Varians ratio estimator
𝑣 𝑌𝑅
𝑁 2 (1 − 𝑓) = ∙ 𝑠𝑦2 − 2𝑅 𝜌𝑠𝑦 𝑠𝑥 + 𝑅 2 𝑠𝑥2 𝑛
• Efisiensi:
𝑣 𝑌𝑅 𝑣 𝑌𝑠𝑟𝑠
𝑠𝑦2 − 2𝑅 𝜌𝑠𝑦 𝑠𝑥 + 𝑅 2 𝑠𝑥2 = 𝑠𝑦2
• Ratio estimator akan lebih efisien daripada SRS jika:
𝑣 𝑌𝑅
<1
𝑣 𝑌𝑠𝑟𝑠 𝑠𝑦2 − 2𝑅 𝜌𝑠𝑦 𝑠𝑥 + 𝑅 2 𝑠𝑥2 <1 2 𝑠𝑦 𝑠𝑦2 − 2𝑅 𝜌𝑠𝑦 𝑠𝑥 + 𝑅 2 𝑠𝑥2 < 𝑠𝑦2 −2𝑅𝜌𝑠𝑦 𝑠𝑥 + 𝑅 2 𝑠𝑥2 < 0 2𝑅𝜌𝑠𝑦 𝑠𝑥 > 𝑅 2 𝑠𝑥2 𝑅 𝑠𝑥 𝜌> 2𝑠𝑦 𝑪𝑽(𝒙) 𝝆> 𝟐𝑪𝑽(𝒚)
Ratio Estimator Pada Stratified Sampling Ratio Estimator untuk Stratified Sampling
Separate Ratio estimator
Combined Ratio Estimator
Separate Ratio Estimator Penghitungan rasio dilakukan untuk masing-masing strata 𝑦ℎ 𝑌ℎ 𝑅ℎ = = 𝑥ℎ 𝑋ℎ Estimasi total: 𝑳
𝒀𝑹𝒔 = 𝒉=𝟏 𝑳
𝒗 𝒀𝑹𝒔 = 𝒉=𝟏
𝒚𝒉 ∙𝑿 = 𝒙𝒉 𝒉
𝑵𝒉 𝟐 𝟏 − 𝒇 𝒉 𝒏𝒉
𝑳
𝑹𝒉 𝑿𝒉 𝒉=𝟏
𝟐
𝒔𝟐𝒚𝒉 − 𝟐𝑹𝒉 𝝆𝒉 𝒔𝒚𝒉 𝒔𝒙𝒉 + 𝑹𝒉 𝒔𝟐𝒙𝒉
Formula di atas akan valid jika jumlah sampel di setiap strata cukup besar sehingga aproksimasi rumus varians bisa diterapkan untuk masing-masing strata. Di samping itu, jika jumlah sampel tiap strata kecil dan jumlah strata besar, biasnya akan besar.
Latihan 3 • Suatu survei stratified random sampling dilakukan di suatu desa untuk mengetahui
pendapatan per kapita di desa tersebut. RW dianggap sebagai strata dan setiap RW diambil sampel sebanyak 8 rumah tangga. Data yang diperoleh: Populasi Strata
RW 1
RW 2
RW 3
a. b. c.
Ruta 62
90
88
Penduduk 217
288
352
Sampel Variabel
Ruta 1
Ruta 2
Ruta 3
Ruta 4
Ruta 5
Ruta 6
Ruta 7
Ruta 8
Pengeluaran
1000
1250
1400
1325
1174
1100
1450
1549
3
4
4
3
2
4
5
3
2250
1846
2094
2400
2350
1975
2000
2125
4
2
3
3
3
2
3
4
1500
1650
1742
1725
1792
1575
1850
1450
4
5
5
6
5
3
6
2
ART Pengeluaran ART Pengeluaran ART
Perkirakan pengeluaran rata-rata perkapita di desa tsb beserta standar error, RSE, dan 95%CI-nya dengan metode separate ratio estimator. Perkirakan pengeluaran rata-rata per rumah tangga di desa tsb beserta standar error, RSE, dan 95%CI-nya dengan metode separate ratio estimator. Perkirakan pengeluaran total di desa tsb beserta standar error, RSE, dan 95%CI-nya dengan metode separate ratio estimator.
Combined Ratio Estimator Penghitungan rasio berdasarkan estimasi rata-rata atau total populasi, dan rasio tersebut digunakan untuk semua strata.
𝑦𝑠𝑡 𝑅ℎ = 𝑅 = = 𝑥𝑠𝑡
𝐿 ℎ=1 𝑊ℎ 𝑦ℎ 𝐿 ℎ=1 𝑊ℎ 𝑥ℎ
atau 𝑌𝑠𝑡 𝑅ℎ = 𝑅 = = 𝑋𝑠𝑡 .
𝐿 ℎ=1 𝑌ℎ 𝐿 ℎ=1 𝑋ℎ
Combined Ratio Estimator Estimasi total:
𝐿
𝑌𝑠𝑡 =
𝑁ℎ 𝑦ℎ → 𝑦𝑠𝑡 =
𝑌𝑠𝑡 𝑁
𝑁ℎ 𝑥ℎ → 𝑥𝑠𝑡 =
𝑋𝑠𝑡 𝑁
ℎ=1 𝐿
𝑋𝑠𝑡 = ℎ=1
𝒀𝑹𝒄 = 𝑹𝑿 = 𝑳
𝒗 𝒀𝑹𝒄 = 𝒉=𝟏
𝑵𝒉 𝟐 𝟏 − 𝒇𝒉 𝒏𝒉
𝒀𝒔𝒕 𝒚𝒔𝒕 ∙𝑿= ∙𝑿 𝒙𝒔𝒕 𝑿𝒔𝒕 𝒔𝟐𝒚𝒉 − 𝟐𝑹𝝆𝒉 𝒔𝒚𝒉 𝒔𝒙𝒉 + 𝑹𝟐 𝒔𝟐𝒙𝒉
Estimator 𝑌𝑅𝑐 tidak memerlukan informasi mengenai 𝑋ℎ , hanya membutuhkan informasi 𝑋. Bias dari combined ratio estimator pada umumnya lebih kecil daripada separate ratio estimator. Jika jumlah sampel di setiap strata kecil, combined estimator lebih direkomendasikan untuk digunakan.
Latihan 4 Suatu survei stratified random sampling dilakukan di suatu desa untuk mengetahui pengeluaran untuk bidang pendidikan di desa tersebut. RW dianggap sebagai strata dan setiap RW diambil sampel sebanyak 8 rumah tangga. Jika diketahui proporsi penduduk usia sekolah di desa tersebut sebesar 44%, maka perkirakan pengeluaran rata-rata per rumah tangga di desa tsb beserta standar error, RSE, dan 95%CI-nya dengan metode combined ratio estimator. Populasi Strata
Ruta
Penduduk
Sampel Variabel Pengeluaran (000 )
RW 1
62
210 ART usia sekolah
RW 2
90
288
Pengeluaran (000) ART usia sekolah
RW 3
88
352
Pengeluaran (000 ) ART usia sekolah
Ruta 1
Ruta 2
Ruta 3
Ruta 4
Ruta 5
Ruta 6
Ruta 7
Ruta 8
1000
1250
1400
1325
1174
1100
1450
1549
2
2
3
2
1
3
4
2
2250
1846
2094
2400
2350
1975
2000
2125
3
1
2
2
3
1
2
4
1500
1650
1742
1725
1792
1575
1850
1450
3
4
4
3
4
2
5
1
Perbandingan Efisiensi Combined dan Separate Ratio Estimator • Selisih varians: 𝑣 𝑌𝑅𝑐 − 𝑣 𝑌𝑅𝑠 𝐿
= ℎ=1 𝐿
= ℎ=1
𝑁ℎ 2 1 − 𝑓ℎ 𝑛ℎ
𝑁ℎ 2 1 − 𝑓ℎ 𝑛ℎ
𝑅2 − 𝑅ℎ 𝑅2 − 𝑅ℎ
2
2
2 𝑠𝑥ℎ − 2 𝑅 − 𝑅ℎ 𝜌ℎ 𝑠𝑦ℎ 𝑠𝑥ℎ
2 𝑠𝑥ℎ + 2 𝑅ℎ − 𝑅 𝜌ℎ 𝑠𝑦ℎ 𝑠𝑥ℎ
Jika jumlah sampel di setiap strata besar dan 𝑅ℎ perbedaannya signifikan antarstrata, pada umumnya separate estimator lebih efisien daripada combined estimator.
Bivariate Ratio Estimator • Bivariate
ratio estimator adalah estimasi rasio yang
memanfaatkan
dua
variabel
pendukung
untuk
memaksimalkan ketelitian (presisi) dari estimasi nilai karakteristik yang diteliti. • Jika 𝑦 menunjukkan variabel yang diteliti, dan 𝑥1 dan 𝑥2
merupakan variabel pendukung, penduga 𝑦𝐵𝑅 adalah 𝑦𝐵𝑅 = 𝑤1 𝑦𝑅1 + 𝑤2 𝑦𝑅2 𝑣 𝑦𝐵𝑅 = 𝑤12 𝑣(𝑦𝑅1 ) + 𝑤22 𝑣 𝑦𝑅2 + 2𝑤1 𝑤2 𝑐𝑜𝑣(𝑦𝑅1 , 𝑦𝑅2 )
Bivariate Ratio Estimator • Keterangan:
𝑣 𝑦𝑅1 = 𝑣 𝑦 − 2𝑅1 𝑐𝑜𝑣 𝑦, 𝑥1 + 𝑅12 𝑣(𝑥1 ) 𝑣 𝑦𝑅2 = 𝑣 𝑦 − 2𝑅2 𝑐𝑜𝑣 𝑦, 𝑥2 + 𝑅22 𝑣(𝑥2 ) 𝑐𝑜𝑣 𝑦𝑅1 , 𝑦𝑅2 = 𝑣 𝑦 + 𝑅1 𝑅2 𝑐𝑜𝑣 𝑥1 , 𝑥2 − 𝑅1 𝑐𝑜𝑣 𝑦, 𝑥1 − 𝑅2 𝑐𝑜𝑣 𝑦, 𝑥2 Dengan substitusi 𝑤2 = 1 − 𝑤1 dan melakukan formulasi bahwa diferensiasi varians 𝑣(𝑦𝐵𝑅 ) terhadap 𝑤1 sama dengan nol , didapatkan penimbang yang meminimumkan varians: Nilai 𝑤1 dan 𝑤2 yang meminimumkan varians adalah: 𝑤1 =
𝑣 𝑦𝑅2 − 𝑐𝑜𝑣 𝑦𝑅1 , 𝑦𝑅2 𝑣 𝑦𝑅1 + 𝑣 𝑦𝑅2 − 2𝑐𝑜𝑣(𝑦𝑅1 , 𝑦𝑅2 )
𝑤2 = 1 − 𝑤1
Soal-Soal Latihan 1. Buktikan bahwa varians dari penduga rata-rata berdasarkan ratio estimator dari penarikan sampel secara SRS WOR: 1−𝑓 2 𝑣 𝑦𝑅 = 𝑠𝑦 − 2𝑅𝑠𝑦𝑥 + 𝑅 2 𝑠𝑥2 𝑛 dapat dinyatakan dalam bentuk: 1−𝑓 2 2 𝑣 𝑦𝑅 = 𝑦 𝐶𝑦 − 2𝜌𝐶𝑦 𝐶𝑥 + 𝐶𝑥2 𝑛 Keterangan: Cy adalah koefisien variasi dari variabel y Cx adalah koefisien variasi dari variabel x 2. Berikut ini adalah data populasi hipotetis: No 𝒙𝒊 𝒚𝒊 a. Hitung nilai rasio populasi 𝑅 1 3 1 b. Lakukan penarikan sampel secara srs wor dengan n=3 2 1 2 c. hitunglah estimasi rasio 𝑅𝑖 untuk all possible sample d. Hitung bias 𝐸(𝑅 − 𝑅)
3
2
3
e. Hitung varians 𝑉 𝑅
4
5
4
f. Hitung 𝑀𝑆𝐸 𝑅
5
4
5
Soal-Soal Latihan 3. Varians dari ratio estimator bisa dinyatakan dengan: 1 𝑠𝑑2 𝑆𝑅𝑆 𝑊𝑅 → 𝑣 𝑅 = 2 ∙ 𝑥 𝑛0 1 1−𝑓 𝑆𝑅𝑆 𝑊𝑂𝑅 → 𝑣 𝑅 = 2 ∙ ∙ 𝑠𝑑2 𝑥 𝑛 Keterangan: 𝑛 1 2 𝑠𝑑2 = 𝑦𝑖 − 𝑅𝑥𝑖 𝑛−1 𝑖=1
Dengan mensubstitusikan rumus di atas ke dalam rumus presisi 𝑑 = 𝑧𝛼/2 ∙ 𝑠𝑒 𝑅 , buktikan bahwa ukuran sampel minimum yang diperlukan dapat dinyatakan dengan: 𝑆𝑅𝑆 𝑊𝑅 → 𝑛0 =
2 𝑧𝛼/2 𝑠𝑑2
𝑑2 𝑥 2 𝑛0 𝑆𝑅𝑆 𝑊𝑂𝑅 → 𝑛 = 1 + 𝑛0 /𝑁
Soal-Soal Latihan 4. Berikut ini adalah data yang diperoleh dari pilot survei: No 𝑥𝑖 𝑦𝑖
1 20 4
2 10 2
3 30 6
4 40 8
5 20 5
6 15 2
7 25 5
8 30 6
9 20 4
10 20 4
Jika untuk survei yang akan datang dikehendaki presisi relatif sebesar 2,5% dari nilai rasionya 𝑅 , berapakah jumlah sampel yang dibutuhkan: a. Jika penarikan sampel secara SRS WR 𝛼 = 5% b. Jika penarikan sampel secara SRS WOR 𝛼 = 5%, 𝑁 = 500 5. Untuk meneliti kondisi pendidikan para penyandang cacat, dilakukan suatu survei disabilitas di pulau Jawa. Dari 118 kabupaten/kota diambil sampel sebanyak 30 kabupaten/kota secara SRS WOR, kemudian dilakukan pencacahan ke semua SLB yang ada di kabupaten/kota terpilih. Untuk setiap SLB yang dikunjungi, dilakukan tes terhadap para penyandang cacat yang belajar di sekolah tersebut. Misalkan, 𝑥𝑖 merupakan jumlah guru yang mengajar di SLB untuk kabupaten/kota ke-i, 𝑦𝑖 merupakan jumlah penyandang cacat yang nilai tesnya berada di atas standar nilai minimal yang ditetapkan. Ringkasan data yang diperoleh sebagai berikut: 𝑛
𝑛
𝑥𝑖 = 225 , 𝑖=1
𝑛
𝑦𝑖 = 1127 , 𝑖=1
𝑛
𝑥𝑖2 = 3005 ,
𝑥𝑖 𝑦𝑖 = 14977 , 𝑖=1
𝑛
𝑖=1
𝑦𝑖2 = 75281 𝑖=1
Dengan ratio estimator, perkirakan total penyandang cacat di pulau Jawa yang nilainya berada di atas standar minimal beserta standar error, RSE, dan 95% Confidence Interval.
Soal-Soal Latihan 6. Berikut ini adalah data yang diperoleh dari penarikan sampel industri mikro di suatu kecamatan. No Pekerja Input Output
1 2 12 14
2 3 14 14
3 5 15 24
4 4 15 16
5 2 10 10
6 3 12 15
7 4 10 11
8 1 12 16
Jika sampel di atas diambil secara SRS WOR dari populasi N=80 industri dan diketahui jumlah tenaga kerja industri mikro di kecamatan tersebut sebanyak 264 orang, serta jumlah input industri mikro sebanyak 1200, maka: a. Perkirakan rata-rata output dengan metode ratio estimator berdasarkan variabel pendukung jumlah tenaga kerja, beserta standar error, dan RSEnya. b. Perkirakan rata-rata output dengan metode ratio estimator berdasarkan variabel pendukung jumlah input, beserta standar error, dan RSE-nya. c. Perkirakan rata-rata output dengan metode bivariate ratio estimator berdasarkan variabel pendukung jumlah tenaga kerja dan jumlah input, beserta standar error, dan RSE-nya. d. Bandingkan efisiensi dari ketiga metode di atas.
Soal-Soal Latihan 7. Sampel sebanyak 50 kota diambil dari populasi sebanyak 200 kota. 𝑦 menyatakan jumlah penduduk tahun 2012, 𝑥1 menyatakan jumlah penduduk tahun 2002, 𝑥2 menyatakan jumlah penduduk tahun 1992 Dari data populasi diperoleh: 𝑌 = 1699 𝑋1 = 1482 𝑋2 = 1420 Dari data sampel diperoleh: 𝑦 = 1896 ; 𝑥1 = 1693 ; 𝑥2 = 1643 2 2 𝐶𝑦2 = 1,213 ; 𝐶𝑥1 = 1,302 ; 𝐶𝑥2 = 1,381 𝜌𝑦,𝑥1 𝐶𝑦 𝐶𝑥1 = 1,241 𝜌𝑦,𝑥2 𝐶𝑦 𝐶𝑥2 = 1,256 𝜌𝑥1,𝑥2 𝐶𝑥1 𝐶𝑥2 = 1,335
Soal-Soal Latihan Keterangan: 𝐶𝑦 , 𝐶𝑥1 , 𝐶𝑥2 masing-masing merupakan koefisien variasi dari 𝑦 , 𝑥1 , dan 𝑥2 Pertanyaan: a. Perkirakan rata-rata jumlah penduduk per kota tahun 2012 dengan menggunakan rata-rata sampel acak sederhana, lengkapi dengan standar error dan RSE-nya. b. Perkirakan rata-rata jumlah penduduk per kota tahun 2012 dengan menggunakan ratio estimator berdasarkan variabel pendukung jumlah penduduk tahun 2002, lengkapi dengan standar error dan RSE-nya. c. Perkirakan rata-rata jumlah penduduk per kota tahun 2012 dengan menggunakan ratio estimator berdasarkan variabel pendukung jumlah penduduk tahun 1992, lengkapi dengan standar error dan RSE-nya. d. Perkirakan rata-rata jumlah penduduk per kota tahun 2012 dengan menggunakan bivariate ratio estimator, lengkapi dengan standar error dan RSE-nya.
Soal-Soal Latihan 8. Suatu pilot survei dengan sampel sebanyak 21 rumah tangga digunakan untuk meneliti jumlah anggota rumah tangga 𝑥 , anak usia sekolah 𝑦1 , mobil yang dimiliki 𝑦2 , dan TV yang dimiliki 𝑦3 . Statistik deskriptif yang diperoleh: 𝑥 = 3,9 𝑠𝑥 = 1,3 𝑦1 = 1,8 𝑠𝑦1 = 1,2 𝜌𝑦1,𝑥 = 0,97 𝑦2 = 1,2
𝑠𝑦2 = 0,6
𝜌𝑦2,𝑥 = 0,26
𝑦3 = 0,9
𝑠𝑦3 = 0,6
𝜌𝑦3,𝑥 = 0,10
Jika diasumsikan jumlah anggota rumah tangga dari seluruh populasi 𝑋 diketahui, bagaimana pendapat anda jika untuk memperkirakan total anak usia sekolah, total mobil yang dimiliki, dan total TV yang dimiliki, ratio estimator lebih dipilih daripada menggunakan estimasi berdasarkan sampel acak sederhana ?
Soal-Soal Latihan 9. Survei Industri Tekstil dan Pengolahan Tekstil (TPT) dilakukan di salah satu provinsi di Indonesia. Populasi industri TPT di provinsi tersebut dikelompokkan menjadi 2 strata: Strata 1: Industri TPT yang berorientasi pasar ekspor Strata 2: Industri TPT yang berorientasi pasar domestik. Untuk strata 1 dilakukan pendataan secara sensus. Untuk strata 2 dilakukan survei dengan pengambilan sampel secara SRS WOR. a. Dengan menggunakan metode combined ratio estimator, perkirakan rasio output tahun 2012 terhadap output tahun 2011 beserta standar error dan RSE-nya. b. Berdasarkan selang kepercayaan 95%, apakah sudah cukup bukti untuk menyimpulkan terjadi penurunan nilai output industri tekstil di provinsi tersebut dari tahun 2011 ke tahun 2012 ? Berikan penjelasan. c. Perkirakan total nilai output tahun 2011 beserta standar error, RSE, dan 95% Confidence Interval-nya Populasi Jumlah Industri
Nilai Output 2011
1
4
352
2
20
348
Strata
Sampel Nilai Output (juta Rp) Tahun 2011 2012 2011 2012
1
2
3
4
5
6
7
8
96 84 16 15
64 72 24 20
120 114 8 10
72 60 12 9
4 4
32 36
28 30
12 8
TERIMA KASIH Have A Nice Sampling