ESTIMATION AND CONFIDENCE INTERVALS
GOALS 1. 2. 3. 4. 5. 6.
Menjelaskan estimasi titik. Menjelaskan tingkat kepercayaan. Menghitung interval kepercayaan pada rata-rata populasi ketika standar deviasi populasi diketahui. Menghitung interval kepercayaan pada rata-rata populasi ketika standar deviasi populasi tidak diketahui. Menghitung interval kepercayaan pada proporsi populasi. Menghitung ukuran sampel yang diperlukan untuk memperkirakan proporsi populasi atau rata-rata populasi.
Sampling and Estimates Alasan pengambilan sampel: 1. Menghubungi keseluruhan populasi memakan waktu. 2. Meneliti seluruh item di dalam populasi seringkali terlalu mahal. 3. Hasil-hasil sampel umumnya memadai. 4. Tes tertentu bersifat merusak. 5. Memeriksa seluruh item seluruh item secara fisik tidak memungkinkan. Estimasi Titik vs. Interval Kepercayaan • Estimasi titik merupakan angka tunggal yang digunakan untuk memperkirakan parameter populasi. • Interval kepercayaan merupakan jangkauan nilai yang dibentuk dari data sampel, sehungga parameter populasi kemungkinan muncul dalam jangkauan tersebut pada probabilitas tertentu. Faktor-faktor yang menentukan luasnya Interval Kepercayaan 1.Besar sampel, n. 2.Keragaman populasi, biasanya σ dilperkirakan oleh s. 3.Tingkat kepercayaan yang diinginkan.
Interval Estimates - Interpretation Untuk interval kepercayaan sebesar 95% sekitar 95% kesamaan Also 95% of the sample means for a specified sample size will lie within 1.96 standard deviations of the hypothesized population
How to Obtain z value for a Given Confidence Level The 95 percent confidence refers to the middle 95 percent of the observations. Therefore, the remaining 5 percent are equally divided between the two tails. Following is a portion of Appendix B.1.
Point Estimates and Confidence Intervals for a Mean – σ Known
x sample mean
Contoh American Management Association ingin memiliki informasi rata-rata pendapatan manajer toko di industri eceran. Sampel acak 256 manajer menyataka ratarata sampelnya $45.420. Standar deviasi populasi ini adalah $2.050.
z z - value for a particular confidence level σ the population standard deviation
1.
Berapa rata-rata populasinya? Pada kasus ini, kita tidak tahu. Kita hanya tahu ratarata sampel $45.420. Dengan demikian, estimasi terbaik kita dari nilai populasi yang tidak dikeahui adalah angka sampel yang sesuai. Jadi, rata-rata sampel $45.420 merupakan estimasi titik dari ratarata populasi yang tidak diketahui.
2.
Berapa jangkauan nilai yang tepat untuk rata-rata populasinya?
n the number of observations in the sample
1.
2.
The width of the interval is determined by the level of confidence and the size of the standard error of the mean. The standard error is affected by two values: Standard deviation Number of observations in the sample
Cara biasanya adalah membulatkan titik ujung menjadi $45.169 dan $45.671, ini disebut batas kepercayaan. Tingkat kepercayaan adalah 95% yaitu $45.169-$45.671. $251 disebut sebagi batas kesalahan 3.
Apakah maksud hasil tersebut? Jika dipilih sampel 256 manajer, untuk masingmasing sampel dihitung rata-ratanya dan membentuk interval kepercayaan 95%, kita dapat memperkirakan 95% interval kepercayaan ini memuat rata-rata populasi.
Population Standard Deviation (σ) Unknown – The tDistribution Pada kebanyakan situasi sampling standar deviasi (σ) tidak diketahui. Berikut beberapa contoh dimana kami ingin memperkirakan rata-rata populasi dan tidak memungkinkan dapat mengetahui standar deviasi populasi. 1. Dekan Kampus Bisnis ingin
memperkirakan rata-rata jumlah jam bekerja mahasiswa paruh waktu yang bekerja tiap minggu. Ia memilih sampel 30 mahasiswa, menghubungi setiap mahasiswa dan menanyai berapa jam mereka bekerja minggu lalu. 2. Dekan Mahasiswa ingin memperkirakan
jarak tempuh mahasiswa ke kampus. Ia mamilih sampel 40 mahasiswa, menghubungi setiap mahasiswa, dan menentukan jarak satu arah dari rumah setiap mahasiswa ke kampus.
Karakteristik dDistribusi t 1.
Distribusinya, seperti distribusi z, merupakan distribusi kontinu.
2.
Distribusinya, seperti distribusi z, berbentuk lonceng dan simetris.
3.
Tidak hanya ada satu distribusi t, tetapi serumpun distribusi t. Seluruh distribusi t memiliki rata-rata 0, tetapi standar deviasinya berbeda-beda sesuai ukuran sampel, n.
4.
Distribusi t lebih tersebar dan lebih landai di tengah daripada distribusi normal baku. Namun, semakin ukuran sampel bertambah distribusi t mendekati distribusi normal baku karena kesalahan dalam penggunaan s untuk memperkirakan σ menurud n dengan sampel yang lebih banyak.
Confidence Interval Estimates for the Mean Use Z-distribution If the population standard deviation is known or the sample is greater than 30.
Use t-distribution If the population standard deviation is unknown and the sample is less than 30.
Confidence Interval for the Mean – Example using the tdistribution EXAMPLE Pabrik ban ingin menyelidiki tebal jejak ban-ban produksinya. Sampel 10 ban yang menempuh 50.000 mil menyatakan rata-rata sampel jejak yang membekas adalah 0,32 inci dengan standar deviasi 0,09 inci. Gunakan interval kepercayaan 95% untuk rata-rata populasi. Apakah tepat bagi pabrik untuk menyimpulkan bahwa setelah 50.000 mil rata-rata populasi jumlah jejak yang membekas adalah 0,03 inci?
A Confidence Interval for a Proportion (π) Ilustrasi skala pengukuran rasio. 1. Direktur pelayanan karier di Southern Technical Institute melaporkan bahwa 80% lulusannya masuk ke bursa kerja pada jabatan yang berhubungan dengan bidang studinya. 2. Perwakilan perusahaan menyatakan bahwa 45% penjualan Burger King dilakukan melalui drive-through. 3. Survei rumah-rumah di Chicago menunjukkan bahwa 85% bangunan memiliki ventilasi udara terpusat. 4. Survei terkini mengenai pria yang menikah di antara usia 35 dan 50 tahun menemukan bahwa 63% merasa bahwa kedua pasangan seharusnya mencari nafkah.
Using the Normal Distribution to Approximate the Binomial Distribution Untuk membuat tingkat kepercayaan terhadap proporsi, kita perlu memenuhi asumsi berikut. 1. Kondisi binomial telah terpenuhi. Kondisi tersebut antara lain: a. Data sampel merupakan hasil penghitungan. b. Hanya terdapat 2 kemungkinan hasil. c. Probabilitas keberhasilan tetap sama dari satu percobaan ke percobaan berikutnya. d. Percobaan-percobaannya saling beba. Ini berarti hasil pada suatu percobaan tidak mempengaruhi hasil percobaan lainnya. 2. Nilai n π dan n(1-π) seharusnya lebih besar atau sama dengan 5. kondisi ini memungkinkan kita untuk menggunakan teorema limit tengah dan menerapkan distribusi normal baku, yakni, z, untuk mencapai suatu interval kemungkinan.
Confidence Interval for a Population Proportion- Example
EXAMPLE Serikat perwakilan Bottle Blowers of America (BBA) sedang mempertimbangkan proposal untuk bergabung dengan Serikat Teamsters. Menurut anggaran rumah tangga serikat BBA, sedikitnya ¾ anggota serikat harus menyetujui merger apapun. Sampel acak 2.000 anggota BBA saat ini menunjukkan bahwa 1.600 diantaranya akan menyetujui proposal merger tersebut. Berapa estimasi proporsi dan populasinya? Gunakan interval kepercayaan 95%. Dengan mendasarkan keputusan anda pada informasi sampel ini, dapatkah anda mengambil kesimpulan bahwa terdapat cukup proporsi dari populasi yang mendukung merger? Mengapa?
First, compute the sample proportion : p
x 1,600 0.80 n 2000
Compute the 95% C.I. C.I. p z / 2
p( 1 p ) n
0.80 1.96
.80( 1 .80 ) .80 .018 2,000
( 0.782, 0.818 ) Conclude : The merger proposal will likely pass because the interval estimate includes values greater than 75 percent of the union membership .
Finite-Population Correction Factor • A population that has a fixed upper bound is said to be finite. • For a finite population, where the total number of objects is N and the size of the sample is n,
the following adjustment is made to the standard errors of the sample means and the proportion: Standard Error of the Mean x
n
N n N 1
Standard Error of the Proportion p
p (1 p ) n
N n N 1
• However, if n/N < .05, the finite-population correction factor may be ignored. Why? See what
happens to the value of the correction factor in the table below when the fraction n/N becomes smaller
• The FPC approaches 1 when n/N becomes smaller!
CI for Mean with FPC - Example EXAMPLE There are 250 families in Scandia, Pennsylvania. A random sample of 40 of these families revealed the mean annual church contribution was $450 and the standard deviation of this was $75. Could the population mean be $445 or $425? What is the population mean? What is the best estimate of the population mean?
X t
s n
N n N 1
$450 t.10 / 2 ,401
250 40 250 1
$75 40
$75 40
250 40 250 1
Given in Problem: N – 250 n – 40 s - $75
$450 1.685
Since n/N = 40/250 = 0.16, the finite population correction factor must be used.
($431.65, $468.35 )
The population standard deviation is not known therefore use the t-distribution (may use the z-dist since n>30)
$450 $19.98 .8434 $450 $18.35
It is likely that the population mean is more than $431.65 but less than $468.35. To put it another way, could the population mean be $445? Yes, but it is not likely that it is $425 because the value $445 is within th e confidence interval and $425 is not within the confidence interval.
Selecting an Appropriate Sample Size There are 3 factors that determine the size of a sample, none of which has any direct relationship to the size of the population. •
The level of confidence desired. • The margin of error the researcher will tolerate. • The variation in the population being Studied.
z n E
2
EXAMPLE A student in public administration wants to determine the mean amount members of city councils in large cities earn per month as remuneration for being a council member. The error in estimating the mean is to be less than $100 with a 95 percent level of confidence. The student found a report by the Department of Labor that estimated the standard deviation to be $1,000. What is the required sample size? Given in the problem: E, the maximum allowable error, is $100 The value of z for a 95 percent level of confidence is 1.96, The estimate of the standard deviation is $1,000.
z n E
2
( 1.96 )($1,000 ) $100 2 ( 19.6 ) 384.16 385
2
Sample Size for Estimating a Population Proportion Z n p(1 p) E
2
where: n is the size of the sample z is the standard normal value corresponding to the desired level of confidence E is the maximum allowable error NOTE: use p = 0.5 if no initial information on the probability of success is available
EXAMPLE 1 The American Kennel Club wanted to estimate the proportion of children that have a dog as a pet. If the club wanted the estimate to be within 3% of the population proportion, how many children would they need to contact? Assume a 95% level of confidence and that the club estimated that 30% of the children have a dog as a pet.
1.96 n (. 30)(. 70) .03
2
897
EXAMPLE 2 A study needs to estimate the proportion of cities that have private refuse collectors. The investigator wants the margin of error to be within .10 of the population proportion, the desired level of confidence is 90 percent, and no estimate is available for the population proportion. What is the required sample size? 2
1.65 n (.5)(1 .5) 68.0625 .10 n 69 cities