Sampling Process and Sampling Distribution Inference : Point and Interval Estimates Pertemuan 2
1
CAKUPAN MATERI:
Pemahaman tentang Sampling Sampel Acak Sederhana (Simple Random Sampling – SRS) Estimasi Titik (Point Estimation) Distribusi Sampling untuk Rata-rata Distribusi Sampling untuk Proporsi Sifat Penaksir (estimator) Titik Estimasi Interval (Interval Estimation) Menguji ketepatan sampling 2
PENGANTAR
Populasi adalah seluruh obyek yang diteliti Mengumpulkan informasi dari populasi disebut sensus, dari sini diperoleh parameter Sampling mengumpulkan informasi dari sebagian unsur populasi diperoleh statistik Sampling digunakan untuk menduga karakteristik dari populasi 3
INFERENSIA STATISTIK
Tujuan dari inferensia statistik adalah untuk memperoleh informasi tentang populasi berdasarkan informasi sampel. Hasil dari sampel adalah nilai estimasi dari karakteristik populasi. Dengan metode sampling yang sesuai/tepat, sampel yang terpilih adakan menghasil estimator yang “baik” mengenai karakteristik populasi. 4
INFERENSIA STATISTIK (L)
Inferensi Statistik meliputi: 1. Estimasi Parameter, terdiri dari: Estimasi Titik (Point Estimation), yaitu suatu nilai dari sampel sebagai estimator parameter Estimasi Interval (Interval Estimation), yaitu suatu interval yang dengan tingkat kepercayaan tertentu memuat nilai parameter. 2.
Pengujian Hipotesis
5
PENGGUNAAN SAMPLING
Pengujian produk Dalam proses pemeriksaan / audit : Pemilihan unit yang akan diperiksa Pemilihan transaksi yang akan diperiksa Pemilihan karyawan yang akan diinterview dalam pengujian internal kontrol Pengujian perilaku konsumen Penelitian teoritis, sampel digunakan untuk membuat generalisasi 6
Metode Sampling
Metode yang digunakan untuk mengambil sampel dari populasi yang ada dua yaitu :
random sampling / probability sampling non random sampling / judgment sampling
Tidak ada cara yang terbaik Cara yang cocok untuk pengambilan sampel ditentukan oleh sifat-sifat populasi dan ketrampilan peneliti 7
Random Sampel
Sampel random adalah sampel yang probabilitas pemilihan masing-masing unsur dalam populasi diketahui sebelum pemilihan dan tidak sama dengan nol.
Simple random sampling Systematic sampling Stratified sampling Cluster sampling 8
Simple Random Sampling
Suatu metode pemilihan sampel yang sedemikian rupa sehingga :
Setiap unsur dalam populasi mempunyai kesempatan yagn sama untuk dipilih Setiap ukuran sample (n) mempunyai kesempatan yagn sama untuk dipilih.
Merupakan dasar statiska inferensia adalah Simple Random Sampling Ilustrasi ada empat anak A, B, C, dan D. Jika diambil 2 anak untuk pergi berlibur maka kombinasi yang mungkin AB, AC, AD, BC, BD, CD.
Setiap kemungkinan memiliki probabilita yang sama Masing-masing anak memiliki probabilita yagn sama untuk terpilih.
9
Stratified Random Sampling
Populasi dibagi ke dalam kelompok (strata) yang relatif homogen dan sampel dibentuk dari masing-masing kelompok. Pengelompokan dimaksudkan untuk memperbaiki pendugaan ciri populasi Contoh Auditor melakukan audit atas piutang.
Piutang dikelompokkan berdasarkan nilainya atau kolektibilitas Masing-masing kelompok diambil sampel. 10
Cluster Random Sampling
Ada dua tahap dalam random cluster sampling
Memilih secara random kelompok (cluster) dari populasi Semua elemen dari masing-masing kelompok (atau hanya sebagian elemen dari masing-masing kelompok) diikutsertakan dalam sample
Cluster random sampling akan memberikan ketepatan yang tinggi jika variasi dalam kelompok lebih besar dibanding variasi antar kelompok 11
Systematic Sampling
Elemen dipilih dari populasi pada satu interval waktu atau urutan. Persamaan denan simple random sampling setiap elemen memiliki kemungkinan yang sama tetapi setiap ukuran sampel yang dipilih tidak memiliki kesempatan yang sama untuk dipilih. Untuk menginterview pelanggan, dipilih dari daftar nama pelanggan yang ke 10, 20 dst. 12
Non Random Sampling
Sampel yang didasarkan pada keahlian seseorang tentang populasi. Kualitas non random sample ditentukan ole keahlian peneliti. Tidak ditentukan berdasarkan teknik statistika Sulit menduga secara obyektif karena dipengaruhi oleh subyektifitas pengambil sampel 13
SAMPEL ACAK SEDERHANA (SIMPLE RANDOM SAMPLING – SRS) 1. Populasi Terbatas (Finite Population) SRS untuk populasi terbatas berukuran N adalah sampel yang dipilih sedemikian sehingga masingmasing kemungkinan sampel berukuran n memiliki peluang yang sama untuk terpilih. Ada 2 (dua) tipe, yaitu: Dengan Pengembalian (with replacement WR) Tanpa Pengembalian (without replacement WOR) 14
SAMPEL ACAK SEDERHANA (SIMPLE RANDOM SAMPLING – SRS) 2. Populasi Tak Terbatas (Infinite Population) SRS dari populasi tak terbatas merupakan sampel yang dipilih sedemikian sehingga kondisi berikut terpenuhi: Masing-masing elemen dipilih dari populasi yang sama Setiap elemen dipilih secara bebas (independent)
15
Desain Penelitian
Perencanaan penelitian
Fase-Fase dalam Desain Penelitian
Sampling hanya merupakan bagian dari keseluruhan desain penelitian Menetapkan tujuan Apa yang akan diukur untuk memenuhi tujuan yang diinginkan Seberapa besar ukuran sampel Melaksanakan penelitian Analisis data
Seberapa keyakinan kita terhadap hasil penelitian Sesuatu dapat ditelliti dengan berbagai cara 16
Sampling Distribution
Sampel memiliki atribut statistik Populasi memiliki atribut parameter Masing-masing kombinasi sampel memiliki nilai statistik Statistik merupakan suatu variabel random yang memiliki distribusi probabilitas atau statistic
stochastic variable
Distribusi sampling adalah distribusi probabilita dengan statistik sampel sebagai variabel randomnya Distribusi rata-rata sampel adalah semua kemungkinan rata-rata dari sampel yang mungkin dibentuk sampling distribution of the mean 17
Sampling Distribution
Membentuk seluruh kombinasi sampel kemudian menghitung rata-rata dan standar deviasi tidak mungkin, melelahkan Sampel digunakan untuk menduga populasi Seberapa kedekatan nilai statistik sampel dengan parameter dari populasi 18
DISTRIBUSI SAMPLING UNTUK X
Proses Inferensi Statistik Population dg RataRata-rata m=?
Nilai x digunakan Untuk membuat inferensi tentang m.
Sampel Acak sederhana berukuran n dipilih dari populasi.
Data sampel menghasilkan nilai rata--rata sampel x . rata 19
DISTRIBUSI SAMPLING µ atau X
Distribusi sampling untuk x adalah distribusi probabilita dari semua kemungkinan nilai rata-rata sampel x . Expected Value E( x ) = µ atau µx = µ dimana µ = rata-rata populasi Simpangan baku dari x Populasi Terbatas Populasi Tak terbatas σ N−n σ σx = ) σx = ( n
( N−n )
( N−1)
N −1
n
merupakan faktor koreksi 20
X
DISTRIBUSI SAMPLING
Dari rumus dapat disimpulkan :
σ x akan turun jika n bertambah
σ x lebih kecil dibandingkan dengan σ ,kecuali jika seluruh unsur populasi nilainya sama besar sehingga
σx =σ =0
Dapat digunakan Tabel distribusi normal untuk menghitung probabilita dari nilai sampel.
z =
x−µ
σ 21
X
DISTRIBUSI SAMPLING
Tabungan sebuah bank tersdistribusi secara normal dengan rata-rata 2000 dan standar deviasi 600. Bank tersebut mengambil sampel. Sebuah sampel 100 tabungan nasabah bank dibentuk. Berapa probabilita ratarata tabungan dari sampel tersebut antara 1900 dan 2050 600 100 1900 − 2000 z = = − 1, 67 → 0 , 4525 60 2050 − 2000 = 0 , 83 → 0 , 2967 z = 60 p = 0 , 4525 + 0 , 2967 = 0 , 7492
σ =
22
The Central Limit Theorem
Distribusi populasi berarti distribusi probabilitas dari suatu variabel random Populasi infinite yang memiliki distribusi normal akan memiliki distribusi sampling rata-rata yang normal berapapun ukuran sampelnya. Jika n bertambah mendekati tak terhingga maka distribusi sampling rata-rata akan semakin kecil Distribusi populasi tidak normal distribusi sampling rata-rata akan mendekati normal jika ukuran sampel cukup besar >30
23
The Central Limit Theorem
Rata-rata distribusi sampling rata-rata akan sama dengan rata-rata populasi Expected Value E( x ) = µ atau µx = µ dimana µ = rata-rata populasi Standard error atau Simpangan baku dari
Populasi Terbatas σx = (
σ n
)
N−n N −1
Populasi Tak terbatas σ σx = n
24
STANDARD ERROR ATAU SAMPLING ERROR
Sampling error merupakan perbedaan absolut antara estimator tak bias (unbiased) dengan paramemter populasi. Contoh sampling error: | x − µ | untuk rata-rata sampel | s − σ | untuk simpangan baku sampel | pˆ − p | untuk proportsi sampel
25
CONTOH 1
Suatu perusahaan ingin menduga penjualan per bulan berdasar rata-rata sampel yang dilakukan selama 100 bulan. Misalkan rata-rata per bulan sebenarnya 5.650 dan standar deviasi 700 Berapa banyak bulan dari sampel tersebut akan memiliki rata-rata sampel antara 5.550 dan 5.750
26
CONTOH 2
Dalam sampel yang terdiri 25 observasi dari populasi yagn terdistribusi normal dengan rata-rata 98,6 dan standar deviasi 17,2. Hitung probabilita rata-ratanya terletak antara 92 sampai 100 Bagaiman jika jumlah sampelnya 36? Andi seorang kreditor di sebuah bank. Rata-rata tagihan kredit nasabah per bulan 112 dan standar deviasi 56. Secara acak ia memilih 50 tagihan, berapa probabilita dari sampel yang terpilih rata-ratanya: Dibawah 100 Antara 100 dan 130 27
CONTOH 3
Dari populasi 125 item dengan rata-rata 105 dan standar deviasi 17,64. Jika diambil sampel 64 ? Berapakan standar error dari rata-rata? Berapa probabilita rata-ratanya antara 107,5 dan 109 Intan melakukan penelitian konsumsi kopi dari rumah tangga tiap tahun. Diketahui distribusi populasi kopi normal dengan rata-rata tidak diketahui dan standar deviasi 1,25.
Jika diambil 36 rumah tangga sebagai sampel dan dhitung komsumsi kopinya per tahun. Berapa probabilita rata-rata sampel setengah pound dari rata-rata populasinya. Seberapa besar sampel harus diambil untuk memastikan bahwa 98% rata-rata sampel berada pada setengah pound rata-rata populasi. 28
PROPORSI
Standar deviasi
σp =
∑( p − µ
p
)
2
n
Didekati dengan distribusi normal : p − µ p ( p ± 1 / 2n ) − µ p Z= =
σp
µp = p
Rata-rata proporsi
σp
Koreksi dilakukan karena proporsi merupakan variabel random diskret 29
BEDA RATA-RATA
µx −x = µx − µx = µ x − µx
Beda rata-rata
1
2
1
2
σ x − x = σ x12 − σ x 2 2 =
Standar deviasi
Didekati dengan distribusi normal :
Z=
1
2
1
σ 12 n1
+
2
σ 22 n2
( x1 − x2 ) − ( µ1 − µ 2 )
σ x −x 1
2
30
BEDA PROPORSI µ p − p = µ p − µ p = P1 − P2
Beda rata-rata
Standar deviasi σ p − p
Didekati dengan distribusi normal :
1
1
Z =
2
2
1
= σ p1 − σ p 2 2
2
2
P1 (1 − P1 ) P2 (1 − P2 ) = + n1 n2
( p 1 − p 2 ) − ( P1 − P2 )
σ
p1 − p 2
31
LATIHAN
Carilah probabilita bahwa rata-rata suatu sampel random sebanyak 25 unsur dari suatu populasi yang didistribusikan normal dengan rata-rata 90 dan standar deviasi lebih besar dari 100? Lima persen barang dalam gudang Pekanbaru cacat, sedangkan sepuluh persen dari gudang Dumai cacat. Bila diambil sampel random sebanyak 200 dari gudang Pekanbaru dan 300 dari gudang Dumai, berapa probabilitas beda prosentase barang yang cacat dalam gudang Dumai 2% lebih besar dibandingkan dengan gudang Pekanbaru Dengan menganggap probabilitas kelahiran bayi pria dan wanita adalah sama. Carilah probabilitas bahwa 200 anak yang akan lahir kurang dari 40%nya adalah pria 32
ESTIMASI
Seberapa jauh parameter populasi yang tidak diketahui berada di sekitar statistik sampel. Estimasi merupakan suatu bagian statistik inferensia yaitu pernyataan mengenai parameter populasi yagn tidak diketahui berdasarkan informasi dari sampel random sederhana yang diambil dari populasi tersebut
33
SIFAT PENAKSIR (ESTIMATOR)
Sebelum menggunakan suatu nilai sampel sebagai estimator titik, perlu diperiksa apakah nilai sampel tersebut memenuhi sifat-sifat sebagai estimator yang baik, yaitu: a. Tak bias (Unbiased), yaitu jika nilai harapan dari estimator sama dengan nilai parameter populasi yang diestimasi. b. Efisien (Efficient), yaitu jika estimator tersebut memiliki standar error (varian) yang paling kecil dibandingkan estimator tak bias yang lain. c. Konsisten (Consistent) 34
SIFAT PENAKSIR (ESTIMATOR) c.
Konsisten (Consistent) Suatu estimator dikatakan memiliki sifat konsisten, apabila estimator tersebut cenderung mendekati nilai parameter populasi jika ukuran sampel ditingkatkan (semakin besar). Jika ukuran sampel ditambah tanpa batas distribusi sampling penduga akan menjadi satu garis tegak lurus di atas paramater yang sesungguhnya.
35
ESTIMASI TITIK (POINT ESTIMATION)
Dalam estimasi titik kita menggunakan data sampel untuk menghitung suatu nilai statistik sebagai estimasi parameter populasi. Contoh: x sebagai estimator titik dari rata-rata populasi, µ. s sebagai estimator titik dari simpangan baku populasi, σ. pˆ sebagai estimator titik dari proporsi populasi, P.
36
POINT ESTIMATION Rata-rata x =
∑
x
n
Standar deviasi
s = 2
∑ (x − x) n
2
bias → s = 2
∑ (x − x)
2
n −1
37
CONTOH
Sebuah bank berusaha untuk menentukan berapa jumlah teller yang tersedia pada saat istirahat di hari Jumat. Untuk itu dilakukan pengamatan selama tiga bulan pada tiap hari jumat. Berikut data yang diperoleh : 242 275 289 306 342 385 279 245 269 305 294 328 α 2 Estimasizrata-rata dan standar deviasi populasinya ?
38
ESTIMASI INTERVAL (INTERVAL ESTIMATION)
Interval kepercayaan untuk rata-rata populasi normal. Varian populasi diketahui. Misalkan variabel acak n observasi/sampel dari suatu populasi berdistribusi normal dengan rata-rata µ dan varian σ2. Jika σ2 diketahui dan rata-rata sampel yang diobservasi adalah x maka interval kepercayaan 100(1 – α)% untuk rata-rata populasi adalah: zα 2 σ zα 2 σ x− < µ < x+ n
dimana zα 2 memenuhi P( Z > zα 2 ) =
n
α 2
dan Z mempunyai distribusi normal baku. 39
ESTIMASI INTERVAL (INTERVAL ESTIMATION) (L)
Interval kepercayaan untuk rata-rata populasi: sampel dengan ukuran besar Misalnya n observasi/sampel dari suatu populasi dengan rata-rata µ. Maka jika n besar, interval kepercayaan 100(1 – α)% untuk µ adalah: x−
zα 2 s n
<µ <x+
zα 2 s n
dimana s = simpangan baku sampel Penafsiran ini secara khusus akan tetap sesuai walaupun distribusi populasi bukan normal. 40
DISTRIBUSI t
Kurva dari distribusi t memiliki bentuk mirip dengan kurva normal, namun lebih runcing. Ciri khusus: distribusi t tergantung pada suatu parameter yang disebut derajat bebas (degrees of freedom). Jika derajat bebas meningkat maka perbedaan distribusi t dengan distribusi normal baku semakin kecil. Distribusi t dengan derajat bebas yang lebih besar memiliki varian yang lebih kecil. Rata-rata dari distribusi t = 0 (nol).
41
DISTRIBUSI t
Membaca Tabel Student’s t Misalkan α = 0,05 dan n = 10, maka nilai tabel tn-1,α/2 = t(10-1);0,025 = 2,262 Degrees
Area in Upper Tail
of Freedom
.10
.05
.025
.01
.005
.
.
.
.
.
.
7
1.415
1.895
2.365
2.998
3.499
8
1.397
1.860
2.306
2.896
3.355
9
1.383
1.833
2.262
2.821
3.250
10
1.372 .
1.812 .
2.228 .
2.764 .
3.169 .
.
42
UKURAN SAMPEL UNTUK ESTIMASI INTERVAL RATA-RATA POPULASI
Misalkan E = nilai sampling error maksimum yang ditentukan. E sering disebut sebagai batas kesalahan (margin of error). maka
E = zα 2
σ n
sehingga
n=
( zα 2 )2 σ 2 E2 43
ESTIMASI INTERVAL (INTERVAL ESTIMATION) (L)
Interval kepercayaan untuk rata-rata populasi normal: varian populasi tidak diketahui Misalnya n observasi dari variabel acak dari populasi berdistribusi normal dengan rata-rata µ dan varian tidak diketahui. Interval kepercayaan 100(1-α)% untuk rata-rata populasi adalah x−
t n−1,α 2 s x n
< µ < x+
t n−1,α 2 s x n
dimana tn-1,α/2 memenuhi P(tn-1 > tn-1,α/2 ) = α/2 Variabel acak tn-1 mempunyai distribusi student’s t dengan derajat bebas (n–1). 44
ESTIMASI INTERVAL (INTERVAL ESTIMATION) (L)
Interval kepercayaan untuk proprosi populasi (sampel besar) Jika pˆ menotasikan proporsi “sukses” dalam sampel acak dari n observasi suatu populasi dengan proporsi sukses p. Maka, jika n besar, interval kepercayaan 100(1 – α)% untuk proporsi populasi adalah pˆ x (1 − pˆ x ) pˆ x (1 − pˆ x ) pˆ − zα 2 < p < pˆ + zα 2 n n dimana zα/2 memenuhi P (Z > zα/2) = α/2 Z mempunyai distribusi normal baku. 45
UKURAN SAMPEL UNTUK ESTIMASI INTERVAL PROPORSI POPULASI
Misalkan E = nilai sampling error maksimum yang ditentukan. E sering disebut sebagai batas kesalahan (margin of error). maka E = zα 2
p(1 − p) n
sehingga n=
( z α 2 )2 p(1 − p ) E2 46
CONTOH ESTIMASI INTERVAL 1. Suatu proses memproduksi kantong-kantong gula. Berat kantong-kantong diketahui berdistribusi normal dengan simpangan baku 1,2 ons. Suatu sampel 25 kantong diambil dan memiliki rata-rata 19,8 ons. Buatlah selang kepercayaan 95% untuk rata-rata populasi berat kantong gula! SOLUSI: α = 0,05 zα/2 = 1,96 x−
zα 2 σ n
< µ < x+
zα 2 σ n
(1,96 )(1,2) (1,96 )(1,2) < µ < 19,8 + 25 25 19,33 < µ < 20,27 19,8 −
47
CONTOH ESTIMASI INTERVAL (L) 2. Sampel acak berukuran 172 mahasiswa akuntansi ditanya pendapat mereka ttg pentingnya suatu pekerjaan dengan skala 1 (tidak penting) s.d. 5 (sangat penting). Ternyata diperoleh rata-rata nilai adalah 4,38 dengan standar deviasi 0,7. Buat selang kepercayaan 99% untuk rata-rata populasi. SOLUSI: α = 0,01 zα/2 = 2,575 x−
zα 2 s
4,38 −
n
< µ < x+
zα 2 s n
( 2,575 )(0,7 ) ( 2,575 )(0,7 ) < µ < 4,38 + 172 172
4,24 < µ < 4,52 48
CONTOH ESTIMASI INTERVAL (L) 3. Sampel acak berukuran 6 mobil dari suatu model tertentu memiliki konsumsi bahan bakar sbb (mil per galon): 18,6 18,4 19,2 20,8 19,4 20,5 Buat selang kepercayaan 90% untuk rata-rata konsumsi bahan bakar populasi. SOLUSI: α = 0,10 tn-1,α/2 = t5;0,05 = 2,015 x−
t n −1,α 2 s
19,48 −
n
< µ < x+
t n −1,α 2 s n
( 2,015 )(0,98 ) ( 2,015 )(0,98 ) < µ < 19,48 + 6 6
18,67 < µ < 20,29 49
CONTOH ESTIMASI INTERVAL (L) 4.
Sampel acak berukuran 344 pemilik perusahaan ditanya mengenai kebijakan perusahaan pada bagian pembelian barang jika diberi hadiah oleh pemasok. Ternyata, 83 menyatakan tidak ada kebijakan apapun. Buat selang kepercayaan 90% untuk proporsi populasi yg menyatakan tidak ada kebijakan apapun berkenaan dg hal tersebut. SOLUSI: α = 0,10 zα/2 = 1,645 pˆ − zα 2
pˆ x (1 − pˆ x ) pˆ x (1 − pˆ x ) < p < pˆ + zα 2 n n
0,241 − 1,645
(0,241)(0,759 ) (0,241)(0,759 ) < p < 0,241 + 1,645 344 344
0,203 < p < 0,279 50
CONTOH
Suatu sampel random sebanyak 100 mahasiswa menghasilkan rata-rata berat badan 60 kg dan standar deviasi 10. Jika populasi 250
Buatlah interval keyakinan rata-rata populasi kalau digunakan tingkat keyakinan 90% Berapa tingkat keyakinan digunakan agar ratarata populasi terletak dalam interval 58-62
51