Review Teknik Sampling
Mendapatkan data Primer
Studi Kualitatif
Observasi Percobaan Survey – Survey lengkap (sensus) mengumpulkan data
dari keseluruhan populasi Populasi : kumpulan objek yang menjadi perhatian riset –
Survei Sampling mengumpulkan data dari sebagian populasi Sample : himpunan bagian dari populasi yang secara aktual
dipelajari
Konsep
Strategi
Isu
Design [Memilih Skema Sampling]
Bias Pemilihan Voluntary Response, Sample Convenience/Purposive Sample, Simple Random Sample, Systematic Sample, Cluster Sample, Stratified Random Sample
Implementasi [Skema Pengumpulan Data]
Mail Questionnaires, Phone interviews, Personal Interviews, Actual Measurements
Non Response
Inference
Ukuran keakuratan berbasis teori
Assumptions
[Drawing Conclusions]
sampling
Confounding
Response Bias
Mengapa harus sampel ?
Sampling menghemat waktu & uang
Pengujian dapat bersifat merusak
Umumnya sampling lebih akurat manakala uang dan waktu terbatas… Lebih baik menghabiskan uang dan waktu yang ada untuk mendapatkan informasi terperinci yang akurat pada beberapa individu (saja) dibanding berusaha dengan cepat untuk mendapatkan sedikit informasi dari banyak individu
Potential Problem : BIAS
BIAS Sampel yang digunakan hanya mewakili satu atau beberapa kelompok saja dalam populasi. Tidak semua kelompok terwakili dengan baik. Suatu metode sampling ber-bias jika ia cenderung memberi sampel di mana beberapa karakteristik populasi direpresentasikan berlebih atau kurang (over or underrepresented) Bias ada di dalam metode, bukan di dalam sampel
Sampel harus representatif
Sample yang baik representatif… mewakili populasi Jika sampelnya representatif, statistik yang diperoleh dari analisis terhadap data sampel akan mendekati apa yang didapat dari populasi Dalam praktek, kita tidak mengetahui apakah sampel tertentu representatif, tetapi kita dapat mengatakan apakah metode samplingnya baik (tak bias) Suatu metode sampling ber-bias punya kecenderungan memberi sampel yang tidak representatif Jika kita menggunakan suatu metode sampling yang tak bias, kita akan mendapatkan sampel yang representatif
Representativeness
Individu (orang)
Karakteristik Demografi (umur, pendidikan…) Karakteristik Psikografi
Place (urban vs. rural) Time
Seasonality Day of the week
Time of the day
Beberapa Metode Sampling (Probability) • Penarikan Contoh Acak Sederhana (Simple Random Sampling) • Penarikan Contoh Acak Berlapis (Stratified Random Sampling) • Penarikan Contoh Sistematis (Systematic Random Sampling) • Penarikan Contoh Gerombol (Cluster Random Sampling) • Penarikan Contoh Bertahap (Multi-Stage Sampling)
Simple random sampling
Keunggulan – –
Sederhana Sampling error mudah diukur
Kekurangan Membutuhkan sampling frame (daftar dari semua unit) – Tidak selalu menghasilkan keterwakilan yang terbaik (best representativeness) – Unit yang terpilih mungkin menyebar –
9
Simple random sampling Misal: mengevaluasi kesehatan gigi 1200 siswa SD di suatu kecamatan – buat daftar nama ke-1200 siswa SD tersebut – – –
Tiap siswa dinomori dari 1 sampai 1200 ukuran sampel = 100 anak-anak Pilih secara acak 100 angka antara 1 sampai 1200
Bagaimana memilih secara acak? 10
Simple random sampling
11
Table of random numbers 57172 33883 77950 11607 56149 80719 93809 40950 12182 13382 38629 60728 01881 23094 15243 53501 07698 22921 68127 55309 92034 50612 81415 38461 07556 60557
12
42088 87680 67344 11596 55678 65101 19505 86216 59744 48076 94576 32063 99056 29831 21100 58431 24181 25930 00501 10713 90892 84077 98504 44528 24587 50031
70098 28923 10609 01796 38169 77729 82000 48161 65695 73151 48859 12431 46747 95387 48125 68149 01161 79579 37484 36439 69853 41387 32168 30953 88753 75829
11333 15659 87119 24498 47228 83949 79068 17646 83710 48724 75654 23898 08846 23917 05243 25405 01527 43488 99278 65660 06175 54107 17822 08633 71626 05622
26902 09839 15859 17009 49931 83358 45552 24164 41125 35670 17152 23683 01331 07421 16181 23463 17046 13211 28751 72554 61221 09190 49946 08049 64864 30237
29959 45817 74577 67119 94303 75230 86776 35513 14291 38453 66516 10853 88163 97869 39641 49168 31460 71120 80855 77021 76825 74305 37545 68698 54986 77795
43909 89405 42791 00614 67448 56624 48980 94057 74773 63154 78796 04038 74462 88092 36970 02048 91507 91715 02035 46279 18239 68196 47201 08759 38964 41870
49607 70743 75889 49529 31286 27549 56684 51834 66391 58116 73099 75246 14551 72201 99522 31522 16050 49881 10910 22705 47687 75634 85224 45611 83534 26300
Systematic sampling
N = 1200, dan n = 60 sampling fraction = 1200/60 = 20
Buat Daftar siswa dari 1 sampai 1200
Pilih Secara Acak angka diantara 1 & 20 (misal : 8)
siswa pertama yang terpilih adalah siswa ke-8 dalam daftar siswa kedua yang terpilih adalah siswa ke 8 + 20 = 28 dst ..... 13
Systematic sampling
14
1
2
3
16 17
31
4
5
18 19
32 33
20
34 35
46 47
15
6
48
7
21 22
36
8
9
23
37 38
49 50
51
10 11
24
39
25
40
52 53
12
13
26 27
41 42
54
55
14
28
43
15
29
30
44 45
……..
Systematic sampling
16
Stratified sampling Prinsip –
:
Mengelompokkan populasi ke dalam kelompokkelompok yang homogen (strata)
–
Menarik sampel pada setiap strata
17
Stratified sampling Advantages – –
Lebih tepat jika variabel berasosiasi dengan strata Semua sub-sub kelompok terwakili, memungkinkan memberikan kesimpulan terpisah tentang masingmasing strata
Disadvantages –
Sampling error lebih sulit diukur
–
Ketepatan berkurang jika banyaknya individu terpilih dalam strata sangat kecil
18
Example: Stratified sampling
Menentukan pemenuhan vaksinasi dalam suatu negera Satu sample ditarik pada setiap daerah Niliai dugaan (estimasi) dihitung untuk masingmasing Strata Masing-Masing strata diboboti untuk memperoleh nilai dugaan (rata-rata) bagi negera
19
Cluster sampling Prinsip
Sampel acak berupa grup (“clusters”) dari unit – Pada clustrer terpilih, seluruh unit atau sebagian individu dalam cluster diikutkan sebagai sampel –
20
Example: Cluster sampling Section 1
Section 2
Section 3
Section 5 Section 4
21
Cluster sampling
Advantages –
–
Sederhana karena sampling frame di dalam populasi tidak diperlukan Menghemat sumberdaya (perjalanan) karena cukup datang ke beberapa lokasi
Disadvantages –
Tidak tepat jika individu dalam cluster bersifat homogen
–
Sampling error sulit diukur
22
Multiple stage sampling Prinsip = sampling berurutan misal: unit sampling= rumah tangga
langkah-1: pilih area atau blok langkah-2: pilih bangunan, rumah langkah-3: pilih rumah tangga
23
Non Probability Sampling •
Pemilihan tidak dilakukan secara acak
•
Generalisasi terhadap populasi agak sulit dilakukan
•
Sering digunakan dalam penelitian sosial, marketing research, dll., krn Probability Sampling tidak praktis atau bahkan tidak dapat diterapkan
•
Accidental/Haphazard/Convenience vs Purposive
•
Purposive Model Instance Sampling, Expert Sampling, Quota Sampling, Heterogenety Sampling, Snowball Sampling
Selecting a sampling method
Kenali Populasi sasaran studi –
Ukuran dan penyebaran geografis
–
Keragaman variabel
Tingkat akurasi yang diinginkan
Sumberdaya yang tersedia (dana, sdm, peralatan, dll)
Pentingnya mempunyai dugaan yang tepat
tentang sampling error
Steps in estimating sample size • • •
• •
Mengidentifikasi variabel utama studi Menentukan jenis statistik yang akan diduga (%,rata-rata, rasio,...) Menentukan akurasi pendugaan yang diinginkan (margin of error, bound of error, sering disebut orang sebagai sampling error) Menetapkan tingkat kepercayaan (confidence level) Melakukan penyesuaian untuk meningkatkan respon rate yang diharapkan
Ukuran contoh optimum (n) Simple random sampling
n = f(ragam, ukuran populasi, ketelitian yang diinginkan, biaya, waktu, resiko) Ukuran contoh yang diperlukan untuk menduga dengan batas error pendugaan sebesar B adalah: N 2 B2 n , dengan D 2 ( N 1) D 4
z 2 NV 2 n 2 2 z V ( N 1) 2 Z=1.96 dengan SK 95%, V=Std relatif thd mean, =batas kesalahan yang diinginkan (% thd mean)
Ukuran contoh yang diperlukan untuk menduga P dengan batas error pendugaan sebesar B adalah: Np (1 p) n ( N 1) D p(1 p)
z 2 Np(1 p) n 2 z p(1 p) ( N 1) 2 p 2
Sumber kesalahan dalam survei NONCOVERAGE
NONCONTACT
SAMPLING ERROR NONOBSERVATION
TOTAL ERROR
INADEQUATE SAMPLING FRAME
NON-SAMPLING ERROR
NONRESPONSE
REFUSALS
FIELD DATA COLLECTION
INTERVIEW BIAS
OFFICE PROCESSING
EDITING CODING ANALYSES
OBSERVATION ERROR
NOT AT HOME CAN’T LOCATE EXPLICIT SENSITIVE TOPIC OVERBURDENING IMPLICIT LACK OF MOTIVATION
Hubungan Error dengan Ukuran Contoh Error
Non sampling error
Sampling error
nopt
Ukuran contoh
Hubungan Error dengan Ukuran Contoh Error
Non sampling error
Sampling error
nopt
Ukuran contoh
Terima Kasih
ERROR DALAM SURVEI
(versi-2)
Contoh Kasus: •
Suatu survey dilakukan untuk menduga total konsumsi gula di industri 300 350
150
10
200
30
25 10 15
20
Industri yang disurvey? yang terlihat
300 350
150
10
200
30
25 10 15
20
Industri yang disurvey: besar
Total = 1000 Rata-rata = 250
300 350
150
10
200
30
25 10 15
20
Industri yang disurvey? yang mudah
300 350
150
10
200
30
25 10 15
20
Industri yang disurvey: kecil
Total = 110 Rata-rata = 18.3
300 350
150
10
200
30
25 10 15
20
Contoh Kasus: •
Populasi
300 350
150
10
200
30
25 10 15
20
Contoh Kasus:
Total = 1110 Rata-rata = 111
•
Populasi
300 350
150
10
200
30
25 10 15
20
Contoh Kasus lain: •
Populasi
Y
X
Contoh Kasus lain: •
Populasi sampel
Y
X
Contoh Kasus lain: •
Model sampel
Y
X
Contoh Kasus lain: •
Yˆ b0 b1 X
Populasi vs model sampel
Y
X