BabXII Pemungutan SuaradanPengambilan Sampel
KAT A KUNCI cluster sampling adalah metode pengambilan dimana populasi dibagi menjadi kelompok; beberapa kelompok yang dipilih secara random (acak), kemudian beberapa anggota dari kelompok yang dipilih secara random menyusun menjadi sampel. stratified sampling adalah metode pengambilan sampel dimana populasi dipisahkan secara berstrata. PEMUNGUTAN SUARA Bagaimana kita dapat mengetahui karakteristik masyarakat secara terperinci pada sebuah populasi? Misalnya saja, kita ingin mengetahui berapa banyak suara yang menyetujui pemilihan calon presiden favorit kita. Atau mungkin karakteristik masyarakat di tempat yang pasti seperti berapa banyak anak-anak, berapa banyak pegawai, dan sebagainya. Salah satu cara menjawab pertanyaan tersebut adalah dengan memeriksa atau mencocokkan dengan setiap orang yang ada pada populasi. Metode ini akan sangat akurat. Karena kita menanyakan kepada setiap orang, maka kita mendapatkan keterangan terperinci ten tang populasi secara keseluruhan. Metode ini jarang digunakan. Pemilihan presiden di USA diadakan setiap 4 tahun, sensus diadakan setiap 10 tahun untuk mendapatkan keterangan yang terperinci di seluruh negara bagian USA. Bagaimanapun juga, metode dengan jalan menanyakan kepada setiap orang adalah merugikan karena cara tersebut sangat mahal biayanya. Pemilihan dan sensus memerlukan banyak biaya. Metode yang memungkinkanadalah menanyakan beberapa orang yang menjadi bagian dari sampel. Jika sampel terse but mewakili populasi tersebut, maka kita dapat menggunakan karakteristik orang-orang yang merupakan sampel untuk mengestimasi karakteristik orangorang pada populasi. Sebagai contoh, peneliti mengambil sampel kira-kira 3.000 sampai 4.000 orang untukmengtestimasi 235 milyar orang di seluruh negara. Apakah hasilnya akan akurat? Selintas anda mungkin akan curiga. Pemungut suara hanya menanyakan beberapa orang dari 80.000 orang. Menurut Anda mungkin estimasi tersebut tidak akurat. Bagaimanapun juga, pemungutan suara biasanya mendekati hasil sebenamya (dengan beberapa pengecualHm).
155 ---
---
--
--
Kini akan kita lihat teori yang menjelaskan mengapa hasil tersebut cenderung akurat. Jika anggap N merupakan jumlah orang yang berada pada populasi yang akan kita teliti. Sedangkan M merupakan bagian dari populasi yang mendukung calon presiden A, dengan demikian yang tidak mendukung adalah N - M (Kita abaikan orang-orang yang tidak memilih pemungutan suara). Tujuan kita adalah mengestimasi M/N - fraksi orang-orang yang mendukung presiden A. Anggap? p = M/N - fraksi orang-orang yang mendukung presiden A. Anggap? p =M/N. Kita ambil sampel sebanyak n orang. X merupakanjumlah orang yang mendukung pemilihan yang merupakan bagian dari sampel. Jika pemungutan suara yang kita lakukan baik, mka ax/n akan mendekati M/N. Contoh, anggaplah kita mencoba mengestimasi mana yang lebih disukai orang-orang di kota dengan populasi sebanyak 30.000. Kita ambil sampel sebanyak 500 orang yang mendukung presiden A. Pada kenyatannya ada 16.500 orang yang mendukung presiden A (16.500 adalah 55 persen dari populasi). Jika berubah sebesar 270 orang (54 persen) pada sampel yang mendukung presiden A, maka sampel tersebut mewakili keseluruhan populasi. Dengan kata lain,jika 330 orang (66 persen) pada sampel yang mendukung presiden A maka sampel tersebut tidak mewakili dan pemungutan suara yang kita lakukan akan menyesatkan hasil yang diperoleh. MET ODE MEMILIH SAMPEL Kita ingin mendapatkan sistem yang baik dalam memilih sampel sehingga dapat mewakili populasi secara keseluruhan. Kita tidak dapat hanya dengan bertanya pada ternan kita karena mungkin jawaban mereka akan tidak netral, dengan kata lain lebih memihak kita. Hal ini merupakan problem yang cukup rumit. Kita tidak dapat hanya mengirim kartu pos kepada sembarang responden dan menyuruh mereka mengirim kembali, karena cara tersebut beresiko tinggi. Kita dapat membuat sampel tersebut mewakili dengan cara mengajukan sampel yang mempunyai karakteristik khusus yang diinginkan. Contoh, kita menginginkan sampel 50 persen wanita, 15 persen minoritas, 0,5 persen pemakan hewan. Metode ini masih tidak dapat dijawab untuk pertanyaan bagaimana memilih sampel karena tidak membicarakan minoritas apa atau wanita yang mana atau pemakan hewan yang mana yang termasuk pada sampel. Menentukan sampel seharusnya secara random atau acak. Hendaknya kita membentuk sistem pengambilan sampel sedemikian rupa sehingga tiap orang mempunyai kesempatan yang sarna untuk dipilih. Bagaimana caranya? Salah satu cara adalah dengan jalan menulis nama setiap orang pada kertas, letakkan kertas tersebut pada kapsul kecil, kemudian letakkan kapsul-kapsul terse but pada tempat yang besar. Jika kita aduk kapsul dengan seksama dan ambil sebanyak n kapsul, kita akan dapatkan sampel acak dari n orang. Kelemahan cara tersebut adalah bila N sangatr besar, kita butuh temp at yang sangat besar. Selain itu, sangat sulit mengaduk kapsul yang cukup banyak. Jika kapsul tidak teraduk rata, kapsul yang diletakkan paling akhir kemungkinan besar akan terpilih sehingga kita tidak mendapatkan sampel acak yang mumi. Cara yang lebih mudah adalah dengan memberi nomer kepada setiap orang pada populasi. Kemudian kita dapat memilih sejumlah nomer random dan mewawancara orang-
156
orang yang mempunyai nomer tersebut. Bagaimana memilih nomer random? Kelihatannya tidak mudah. Kita memerlukan sistem tersendiri untuk membuatnya. Pada jarna dahulu (precomputer), dilakukan dengan cara menggunakan tabel random digit. Tabel tersebut dibuat oleh seseorang yang pekerjaanya membuat nomer random. Nomer tersebut telah diuji coba dengan baik. Di jaman ini, Anda dapat memakai computer penghasil nomer random. Kebanyakan sistem computer mempunyai penghasil nomer random, Nomer yang dihasilkan tidak tepat sarna dengan nomer random karena computer menghasilkan nomer menurut aturan tertentu. YANG HARUS DIINGA T 1. Meneliti setiap orang pada populasi adalah sangat mahal, sehingga sampel yang dipilih. 2. Proporsi orang-orang pada sampel dengan karakteristik khusus digunakan untuk mengestimasi proporsi populasi yang mempunyai karakteristik khusus yang sarna. 3. Metode yang paling baik untuk memilih sampel adalah dengan cara memilih sampel secara random, yang mana setiap sampel mempunyai kemungkinan yang sarna dipilih. MENGHITUNG JUMLAH CARA MEMILIH SAMPEL RANDOM Telah kita diskusikan pada bab 4 bahwa jika akan memilih sarnpel dari obyek n tanpa pengembalian dari populasi N adalah, N! n! (N - n) 1 yang merupakan cara memilih sampel. Pada sarnpel random, tiap sampel mempunyai kemungkinan yang sarna untuk dipilih. Contoh, jika kita pilih sarnpel sebanyak 6 dari populasi sebanyak 10, maka 1O!/ (4! 6!) = 210 cara memilih sarnpel. Diluar kemungkinan sampel, berapa banyak x menyarnai k? X adalah variabel random karena tergantung pada sarnpel random yang kita pilih. Pertama, kita dapat menentukan bahwa (M/k)cara pemilihan k orang pada sampel yang mendukung pemilihan presiden A. Untuk setiap kemungkinan adalah (N - M cara pemiliahan n - k orang \.n - k pada sampel yang tidak mendukung pemilihan tersebut, maka ada
)
(
~) (~--:)
(O~Y(S~_j ~a
dengan k, adaloo
( ~) 157
Contoh, jika N
= 10, M =4 dan n =6, maka
ada
cara memilih sarnpel dengan X = 3, jadi probabilitas yang terjadi adalah 18/210 = 0,381. MENGGUNAKAN DISTRIBUSI HIPERGEOMETRIK Hal ini telah disinggung sedikit pada bab 7. Telah kita dapatkan nilai harapan X adalah n MIN, sehingga diharapkan nilai X akan mendekati n MIN yang diinginkan, meskipun X mungkin tidak akan persis sarna dengan nilai harapan. Kita dapat menghitung bagaimana X mendekati n MIN. Anggap kita mencoba mengestimasi berapa banyak orangpada populasi 200juta orang yang mendukungpemilihan. Anggap 1/2dari orang-orang yang kenyataannya mendukung dan 1/2 yang tidak. Kita akan mewawancara 100 orang"yang dipilih secara random, sehingga X mempunyai distribusi hipergeometrik
dengan N
= 200
juta, M
= 200
juta, p
= 1/2
dan n
= 100.
Tabel 12-1
menunjukkan probabilitas. Tabe112-1 : Probabilitas Hipergeometrik dengan N
k 40 41 42 43 44 45 46 47 48 49 50
= 200.000.000,
Pr(X
=k)
0,0108 0,0159 0,0223 0,600 0,0389 0,0484 0,0579 0,0665 0,0735 0,0780 0,0795
M
= 200.000.000 k
51 52 53 54 55 56 57 58 59 60
dan n
Pr(X
= 100
=k)
0,0780 0,0735 0,0665 0,0579 0,0484 0,0389 0,0300 0,0223 0,0159 0,0108
Jika sampel kita mewakili populasi dengan sempurna, X akan sarna dengan 50 (Dengan kata lain, tepatnya setengah dari sarnpel akan mendukung pemilihan). Pada tabel ditunjukkan bahwa probabilitas hanya 0,795 dimana X akan tepat sarna dengan 50. Bagaimanapunjuga
158
kira-kira kemungkinan 63 persen X berada antara 46 dan 54, dan kemungkinan 95 persen X berada antara 40 dan 60. Hal ini berarti proposal sampel X/n lebih banyak 10 persen daripada proporsi populasi M/N. Bagaimanapun juga, kita ingin pemungutan suara tersebut lebih akurat. lni menimbulkan perbedaan besar baik proporsi yang mendukung pemilihan 40 persen atau 60 persen. Kita akan mencoba membuat sampel yang lebih akurat dengan mewawancara orang-orang yang lebidh banyak. Sekarang kita akan menanyakan 1000 orang. Tabel 12-2 menunjukkan
hasilnya.
.
TabeI12-2: Probabilitas Hipergeometrik = 200.000.000, M = 100.000.000, dan n
dengan N
k 484 458 456 487 488 489 490 491 492 493 494 495 496 497 498 499 500
Pr(X
=k)
0,0141 0,0150 0,0159 0,0168 0,0176 0,0185 0,0192 0,0200 0,0207 0,0213 0,0219 0,0224 0,0228 0,0231 0,0233 00235
k
= 1000
Pr(X
501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516
=k)
0,0235 0.0233 0,0231 0,0228 0,0224 0,0219 0,0213 0,0207 0,0200 0,0192 0,0185 0,0175 0,0168 0,0159 0,0150 0,0141
0,0235 .
Tabel di atas menunjukkan kemungkinan 65 persen X akan berada diantara 516 dan 484. Anggap X sebenarnya sama dengan 484. Kemudian kita estimasi proporsi populasi yang mendukung pemilihan adalah 0,484. Kita akan berada pada kesalahan 0,500 - 0,484 =0,016. Adakemungkinan 65 persen yang kita estimasi menghasilkan 1,6 persen dari nilai sebenarnya. Pada situasi tersebut kita dapat meramal dengan tingkat keyakinan, apa pendapat populasi berdasarkan sampel 1000 orang. Hasil pemungutan suara menjadi lebih akurat jika proporsi populasi p sangat kecil atau sangat besar. Contoh, anggap p = 0,1 (artinya pendukung pemilihan hanya 10 persen dari populasi). Tabe112-3 menunjukkan probabilitasnya.
159
- ---
--
Tabel menunjukkan ada kemungkinan 96 persen sampel berada antara 0,081 dan 0,119. Lihat pada keadaan ekstrim, jika p =0 atau p = 1 ada kemungkinan 100 persen bahwa X tepat sama dengan n M/N. Hasil ini menjelaskan te?ri dasar mengapa pemungutan suara dilakukan. Hal itu akan ada meskipun dengan sampel relatif kecil akan tidak mewakili proporsi sebenarnya.
TabeI12-3: Probabilitas Hipergeometrik dengan N = 200.000.000,M = 20.000.000,dan n = 1000 k 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 MENGGUNAKAN
Pr(X
=k)
0,0055 0,0068 0,0084 0,0102 0,0122 0,0114 0,0168 0,0194 0,0220 0,0248 0,0275 0,0302 0,0328 0,0352 0,0373 0,0390 0,0404 0,0414 0,0419 0,0419
k 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119
Pr(X
=k)
0,0415 0,0407 0,0394 0,0378 0,0358 0,0358 0,0312 0,0286 0,0260 0,0234 0,0209 0,0184 0,0161 0,0139 0,0119 0,0101' 0,0085 0,0070 0,0058
DISTRIBUSI BINOMIAL
Kita dapat memperluas hasil untuk mencapai probabilitas sampel yang berbeda ukuran. Perhitungan hipergeometrik sangat tiak praktis. Untuk memudahkan perhitungan, kita ubah langkah pengambilan sampel secara lebih mudah. Kita masih memilih 1000 nama di tempat yang besar, tetapi kini setelah kita pilih tiap nama, kita kembalikan ke tempat tersebut dan mengaduknya lagi. hal ini berarti orang yang telah dipilih sekali kemungkinan dapat dipilih lagi, sehingga diwawancara dua kali (orang terse but mungkin akan tidak disukai, inilah salah satu alasan mengapa metode ini tidak digunakan dalam praktek). Bahkan ada kemungkinan yang sangat kedl sekali bila kita pilih orang yang sama 1000 kali.
160
Sekali lagi, kita anggap X mewakili jumlah sarnpel yang mendukung pemilihan. Kita sebut 'sukses' jika orang-orangpadasarnpelmendukungpemilihan.Kemudiankitamengetahui dengan tepat seperti apakah distribusi X - ia mempunyai distribusi binomial dengan pararneter n dan p = MIN. Jika besar populasi lebih besar daripada besar sarnpelkita dapat menggunakan distribusi binomial meskipun tanpa pengembalian. Contoh, pada populasi 200 juta, setengahnya mendukung pemilihan, setengahnya lagi menolak. Ada probabilitas dari 1/2 orang pertama yang kita pilih yang mendukung pemilihan. Jika kita coba dengan pengembalian, probabilitasnya sebesar 0,5 untuk orang kedua yang kita pilih juga akan mendukung pemilihan. Jika coba dengan tanpa pengembalian, ada probabilitas sebesar 99.999.999
= 0,4999999975 199.999.999 untuk orang kedua yang mendukung pemilihan. Jadi hal ini membuat perbedaan yang lebih mudah baik kita coba dengan pengembalian maupun tanpa pengembalian, tetapi tidak banyak. Kita dapat memperkirakan distribusi hipergeometrik dengan distribusi binomial karena variance distribusi hipergeometrik adalah n(M/N) (a - MIN) (M - n) N-1
Kita akan menggunakan distribusi binomial dengan variance yang sarna. Catat, bahwa variance distribusi hipergeometrik sarna dengan distribusi binomial kecuali untuk faktor (N - n) / (N - 1) yang disebut faktor koreksi atau faktor koreksi populasi terbatas. Kita pikirkan itu dapat mengoreksi kenyataan bahwa kita memilih sampel tanpa pengembalian. Seperti Anda ketahui, jika N lebih besar daripada n, faktor koreksi akan mendekati 1, artinya kita dapat mengabaikannya. Contoh, jika N =200 juta dan n =2000, maka faktor koreksi adalah 0,9999995005. MENGGUNAKAN DISTRIBUSI NORMAL Distribusi binomial agak kurang praktis, maka kita membuat perkiraan distribusi normal. Distribusi ini digunakan bila n menjadi besar (lihat bab 8). X merupakan bagian fungsi normal dengan mean Jl =n MIN dan variance M 02
M 1- -
=n N
(
N
N-n
J[
N_n
=np (1 - p) N -1
j
(
N- 1
J
Marilah kita cari interval dengan kemungkinan 95 persen yang mengandung X untuk nilai N, n dan p yang berbeda. Biarkan c berada pada setengah bagian interval. Nilai c adalah 161 -
--
-
Pr (J!-
C
< X < J!+ c)
----
--
-
= 0.95
Kita dapat rnengubah rnenjadi
-c
X - J!
Pr -<
(
-
0'
C
<-
=0.95
J
0'
0'
Seperti kita lihat pada kasus ini c = 1,960'. Kini kita dapat rnernbuat tabel dari hasilnya. (lihat tabel 12-4)
TabeI12-4: Kesalahan persen untuk Sampel
N 10.000 50.000 100.000 500.000 50.000.000 200.000.000
0=100 0=500 0=1000 0=5000 0=10.000 0=50.000 9,8 9,8 9,8 9,8 9,8 9,8
4,3 4,4 4,4 4,4 4,4 4,4
2,9 3,1 3,1 3,1 3,1 3,1
1,0 1,3 1,4 1,4 1,4 1,4
0
-
0,0 0,9 1,0 1,0 1,0
0 0,3 0,4 0,4 0,4
Tabel tersebut rnengasurnsi p = 0,5. Jika nilai sebenamya p berbeda dari 0,5 rnaka kesalahan akan lebih sedikit daripada nilai yang ada pada tabel. Tabel ini rnenunjukkan persentase kesalahan. Contoh, untuk populasi sebesar 50.000 dan sarnpel sebesar 5000, pada tabel ditunjukkan nikan nilai 1,3.Artinya 1,3persen dari nilai sebenamya (dengan kata lain, antara 0,487 dan 0,513). Jika anda periksa hasil N = 200 juta dan n = 10, Anda dapat lihat perhitungan dengan penaksiran normal sarna dengan perhitungan eksak. ANALISA PERSEN ERROR PAD A SAMPEL Anda akan rnendapatkan hsil yang rnenarik bila rnengarnati tabe1.Jika Anda rnengambil ampel 1000 orang, ada kernungkinan 95 persen hasil pernungutan suara akan berada pada persentase 3,1 dari nilai sebenamya. Jika Anda rnenarnbah sampel rnenjadi 5000, erromya hanya 1,4 persen. Hal yang rnenarik lainnya, sarnpell 000 pada populasi sebesar 200 juta, sarna denganjika populasi berjurnlah 50.000. Anda rnungkin rnengharapkan sampel rnenjadi kurang akurat jika populasi bertambah besar. hal ini tidak terjadi pada kasus ini.
162
Bagaimana juga, kebalikannya juga benar. Membuat populasi yang lebih keeil tidak akan mengurangi jumlah orang yang mewakili sampe1.'Andabisa mendapatkan contoh yang dapat mewakili seluruhnya ari 200 juta orang dengan mewawancara satu orang dari tiap 40.000, tetapi jika Anda mencoba mewawancara atau orang dari 40.000 bila populasinya 50.000, maka sampelnya tidak mewakili populasi. hal ini berarti, jika Anda menginginkan hasil yang akurat dari seluruh negara, Anda membutuhkan sampel yang lebih besar dibandingkan jika Anda menginginkan hasil akurat dari seluruh kota. Hal yang perlu diingat, bahwa meskipun error turun jika sampel menjadi besar, error mencapai titik yang kenaikannya besar pada sampel kearah penurunan kecil pada erorr. Saat Anda memutuskan besar sampel yang digunakan, Anda membutuhkan dua faktor tujuan. Menambah banyak orang akan membuat sampel agak lebih akurat, tetapi biayanya menjadi lebih besar. YANG HARUS DIINGA T 1. Ketepatan pemungutan suara tergantung pada besar sampel, bukan besar populasi. 2. Jika populasi lebih besar daripada sampel, maka proporsi sampel akan mendekati distribusi normal. CONFIDENCE INTERVAL UNTUK PROPORSI Setelah kita mendapatkan hasil pemungutan suara, maka itu akan membantu dalam menghitung confidence interval untuk proporsi populasi yang tidak diketahui p. Jika X dari n orang pada sampel yang mendukung pemilihan, maka p mewakili proporsi ampel X/n. Contoh, jika n =200 orang pada sampel, X = 124 orang yang mendukung pemilihan, maka proporsi sampel p = 124/200= 0,623. Kita anggap populasi sangat besar, sehingga dapat kita abaikan faktor koreksi populasi,terbatas. Pada kasus ini, n cukup besar sehingga dapat kita anggap X berasal dari distribusi normal. Kita mengetahui E(X) =np dan Var (X) =np(1-p), sehingga p merupakan variabel random berdistribusi normal dengan E (p) dan Yar (p) =p(1P)/n. Kini kita dapat menentukan confidence interval 95 persen untuk nilai p yang tidak diketahui. Pr (p - c < P < P + c) = 0,95
Pr (-c M P - P < c)
= 0,95
-c
Pr I
~~W
[ £ii
Pr - c
< Z < c
P (l-p)
c
p-p
<
<
Iii]
I
=0.95
= 0.95
P (1 - p)
163
E
= 1.96
c
P (1-p)
c
= 1,96
~
P (1-p)
Confidence interval 95 persen untuk proporsi p adalah :
~
P (1 - p)
p
- 1,96
~
....
P (1 - p)
sampaip + 1,96
n
n
Pada sampel kita, p = 0,62 dan n = 200, jadi confidence interval dari
0,62 x 0,38
0,62 x 0,38
0,62 - 1,96
sampai 0,62 + 1,96 200
200 atau dari
0,586
sampal
0,654
Langkah Umum Confidence Interval Untuk Proporsi n merupakan jumlah sampel, X jumlah sampel dengan karakteristik yang diinginkan, p = X/n merupakan proporsi orang dalam sampel dengan karakteristik dan p merupakan proporsi orang dalam populasi dengan karakteristik. 1. Tentukan confidence level yang diinginkan. 2. Lihat pada tabeill-l (Jika confidence level 95 persen, a = 1,96). 3. Hitung c = a '" p (1"'p)/n confidence interval adalah
p - c sampai p + c.
Metode ini bekerja bila besar populasi N lebih besar daripada besar sampel n (sehingga (N - n)/ (N - 1) mendekati 1), dan besar sampellebih besar dari 30. Jika sampellebih kecil dari 30, perkiraan normal tidak akurat, sehingga Anda perlu membuat perhitungan yang teliti termasuk distribusi binomial yang tidak didiskusikan pada buku ini. Pemungutan suara tidak dapat mengukur proporsi populasi jika proporsi populasinya sangat kecil. Umumnyajika np > 5, maka confidence interval berdasarkan perkiraan normal. Contoh,anggap n = 200 dam n = 0,25. np = 5 dan dapat kita hitung:
164
!iIII!.
Pr(X = 0) Pr(X = I) Pr(X = 2) Pr(X = 3) Pr(X = 4) Pr(X = 5) Pr(X = 6) Pr(X = 7) Pr(X = 8) Pr(X = 9) Pr(X = 10)
Probabilitas dari distribusi normal
Perkiraan Normal
0,006 0,032 0,083 0,140 0,177 0,178 0,148 0,105 0,065 0,036 0,017
0,014 0,035 0,072 0,120 0,163 0,181 0,163 0,120 0,072 0,035 0,014
Nilai X akan rnendekati nilai 5. Kini anggap n =200 dan p = 0,001.Makakitaternukan E(X) = np = 0,2. Jelasnya nilai X yang sebenamya tidak sarna dengan 0,2 karena pasti jurnlahnya besar. Dibawah ini rnerupakan probabilitas:
Pr(X =-1) Pr(X = 0) Pr(X = I) Pr(X = 2) Pr(X = 3)
Probabilitas dari distribusi normal
Perkiraan Normal
-
0,024 0,807 0,180 0 0
0,819 0,164 0,016 0,001
Kebanyakan nilai X adalah nol. Pada kasus ini, perkirakaan normal gagal karena nilai X yang sebenamya tidak pemah negatif rneskipun perkiraan normal rnengatakan dapat negatif. YANG HARUS DIINGA T Jika p adalah proporsi sarnpel dan n adalah jurnlah sampel, rnaka confidence interval 95 persen untuk proporsi populasi adalah
P :t 1,96
165
--
Formulaini berlakujika sarnpelmerupakansarnpelrandommurni,yaitujika semua sarnpelsarnasepertiyangtelahdipilih. MACAMMETODESAMPLING Adalah sangat penting untuk mengingat yang hanya berlaku adalah sampel random murni. Jika sampel bukan sampel random murni, maka tidak berlaku. Contoh, sebuah majalah mengirirnkan kartu kepada orang-orang yang namanya didapatkan dari daftar telepon dan sumber lain, tetapi orang-orang yang mempunyai telepon pada saat itu tidak mewakili populasi secara keseluruhan. Jika sampel tidak dipilih secara random maka tidak dapat diestimasi dengan baik. CLUSTER SAMPLING Pada statistik sangat baik jika menggunakan sampel random murni. Bagaimanapun juga ada alasan nyata mengapa hal itu sering tidak mungkin. Pemungutan suara modern tidak dapat dipilih sampelnya dengan cara meletakkan nama setiap penduduk di sebuah topi. Cara demikian sangat tidak praktis. Cara yang baik adalah dengan cluster sampling. Pada cara ini, populasi dibagi menjadi kelompolk yang berbeda, dan sampel berasal dari kelompok yang dipilih. hendaknya tiap kelompok dapat mewakili seluruh populasi. Pada praktek, kelompok dipilih berdasarkan geografis. Beberapa daerah dipilih secra random, kemudian sub daerah, dan akhirnya beberapa rumah tangga yang dipilih. Langkah demikian menjamin bahwa pewawancara dapat mewawancarai orang yang hanya sedikit. STRATIFIED SAMPLING Jika populasi dapat dikelompokkan menjadi sub kelompok yang terdiri dari individual yang sangat samak, sampel yang mewakili bisa didapat dengan cara mewawancara sampel random setiap kelompok. Langkah demikian dapat menghasilkan sampel yang sangat akurat, tetapi ini dapat dilaksanakan jika populasi hanya dibagi menjadi kelompok yang sama.
CONVENIENCE SAMPLING Banyak tipe lain dari metode sampling yang juga digunakan. Analisis statistik sering tidak tepat diterapkan pada sampel-sampel ini seolah-olah merupakan sampel random murni. Metodetersebutdinamakanconveniencesampling.Contoh,perguruantinggiseringmelakukan eksperimen psikologi pada mahasiswa barn. Karena tidak ada alasan untuk mengharapkan para mahasiswa tersebut mewakili populasi mahasiswa barn, maka tidak tepat jika membuat kesimpulan statistik tentang populsi berdasarkan eksperimen ini. Contoh lain, jika Anda menyusun tabel di pertokoan dan menanyakan pada orang yang lesat untuk diwawancara untuk diwawancara cukup lama, hal ini bukan merupakan sampel random. contoh yang lain lagi, adalah survei populasi yang berlaku, yang dilakukan tiap bulan oleh Biro Sensus. Biasanya survei digunakan untuk menghitung tingkat pengangguran tiap bulan. Biro Statistik ingin mengetahui karakteristik pengangguran; berapa lama mereka menganggur, pekerjaan apa yang biasa dilakukan, dan sebagainya. Untuk mendapatkan data pada kategori yang berlainan, Biro Sensus ingin menggunakan sampel yang lebih besar 166
daripada jika hanya ingin mengetahui jumlah pengangguran. Untuk itu, Biro Sensus menggunakan sampellebih dari 100.000 orang. YANG HARUS DIINGA T 1. Pada praktek, memilih sampel random sangat mahal biayanya, oleh karena itu dua metode yang lain, cluster sampling dan stratified sampling digunakan. 2. Pada cluster sampling, populasi dibagi menjadi kelompok; beberapa kelompok dipilih secara random dan beberapa anggota kelompok yang dipilih, dipilih untuk membentu sampel. 3. Pada stratified sampling, populasi dibagi menjadi strata yang sama. 4. Adalah tidak cocok menerapkan analisa statistik untuk sampel yang terdiri dari orangorang atau unit lain yang kebanyakan dapat diperoleh dengan mudah untuk wawancara.
167 - --
-
- -
BabX'" UjiHipotesa
KAT A KUNCI chi-square test adalah metode statistik untuk menguji hipotesa yang kedua faktornya independen. goodness-of-fit test adalah prosedur statistik untuk menguji hipotesa yang distribusi probabilitas khusus cocok dengan susunan data yang diobservasi. hipotesa nol adalah hipotesa yang akan diuji pada uji hipotesa; hipotesa nol sering berbunyi "Tidak ada hubungan antara dua kuantitas". test statistik adalah perhitungan dari kuantitas yang diobservasi yang digunakan untuk menguji hipotesa nol; tes statistik berasal dari distribusi yang diketahui jika hipotesa nol benar; hipotesa nol akan ditolakjika tes statistik tidak berasal dari distribusi yang diketahui. Pada bab 3 terdapat problem uji hipotesa yang spesiflk::Jika Anda melemparkan uang logam berkali-kali, bagaimana Anda dapat mengatakan bahwa pelemparan itu adil? Kini kita akan memikirkan metode yang dipakai oleh para ahli statistik pada saat mereka merumuskan dan menguji hipotesa. Ingat, bahwa hipotesa yang akankita tes dinamakan hipotesa nol (Ho), dan hipotesa yang berbunyi "Hipotesa nol adalah salah" dinamakan hipotesa alternatif. contoh hipotesa nol: Pelemparan uang logam yang adil. Jumlah rata-rata kismis pada sejumlah kotak kismis adalah 7. Perbedaan kemanjuran antara empat obat flu terjadi secara keseluruhan dengan tidak terduga. Perhitungan pemilihan Mahkamah Agung dengan distribusi normal. JiKamenolak hipotesa nol, berarti kita hampir yakin hipotesa tersebut benar. Biasanya pada tes kita buat kemungkinan 5 persen menolak hipotesa jika benar. Jika kita terima hipotesa, tidak berarti hipotesa itu benar. ltu hanya berarti kita belum menemukan bukti secara statistik untuk menolaknya.
·· · ·
TES STA TISTIK Prosedur normal pada statistik adalah menghitung kuantitas khusus, yang dinamakan tes statistik. Ada beberapa tes statistik. Salah satu yang Anda gunakan tergantung pada problem yang dihadapi. Perhatikan beberapa contoh pada bab ini.
168