BabXI Confidence Interval
KAT A KUNCI confidence interval adalah sebuah interval yang berdasarkan observasi sampel dan terdapat probabilitas yang ditentukan. Interval mengandung nilai parameter sebenarnya yang tidak diketahui (pada umumnya menghitung confidence interval dengan kemungkinan 95 persen nilai sebenarnya). confidence level adalah tingkat keyakinan (copfidence) dihubungkan dengan confidence interval. Probabilitas interval mengandung nilai sebenarnya. Pada bab 10, telah dibicarakan bagaimana menggunakan observasi variabel random untuk mendapatkan informasi sebuah parameter yang tidak diketahui pada distribusi yang menghasilkan variabel tersebut. Ada satu pertanyaan penting, yaitu: Adakah estimasi (perkiraan) yang benar-benar mendekati nilai sebenarnya? Sebagai contoh, anda akan mengestimasi banyaknya hari-hari pada saat hujan di Puncak. Tentu saja anda akah menggunakan penaksiran (estimator): (banyak hari saat anda berada di Puncak pada waktu hujan) (banyak hari saat anda berada di Puncak)
Jika anda berada di Puncak hanya selama satu hari dan pada saat itu turun hujan, maka estimasi anda tidak baik (akurat), tetapijika anda berada diFlorida selama 10hari, anda dapat mengestimasi dengan lebih akurat. Nilai statistik yang dipakai sebagai estimator tergantung pada nilai sejumlah variabel random, hal ini berarti estimator tersebut merupakan variabel random. Hal tersebut dapat membantu jika kita dapat mengetahui bagaimana distribusi estimator. Anggaplah bahwa kita menggunakan rata-rata sampai x untuk mengestimasi nilai ratarata variabel random normal.
x= n
142
Masing-masing x mempunyai distribusi normal, maka untuk variabel random normal x juga mempunyaidistribusinormal.TelahkitaketahuibahwaE (X) =Ildan Var (X) =cr2In. MENGHITUNGCOFIDENCEINTERVALUNTUKRATA-RATAJIKA VARIANCE DIKETAHUI Distribusi x telah kita ketahui, untuk selanjutnya kita dapat lebih mengetahui seberapa baik estimator yang digunakan. Kita mengetahui bahwa nilai sebenarnya Il? mendekati x, tetapi seberapa dekat? Apakah x mendekati 1 unit Il? Ataukah 50 unit? Sebaiknya kita mengetahui probabilitas yang jarak dari x ke Il akan lebih sedikit daripada beberapa nilai tertentu c. Dengan kata lain, kita ingin mengetahui probabilitas nilai sebenarnya Il adalah terletak antara (x - c) dan (x + c). Pada kenyataannya, probabilitas banyak bergantung pada nilai c yang kita pilih (lihat gambar 11-1). Jika kita pilih nilai c yang sangat besar, maka kita dapat hampir memastikan nilai Il akan berada pada interval. Sebagai contoh, kita dapat menyusun c dengan tidak terbagtas. Probabilitas u akan berada pada interval 100 persen, karena kenyataannya Ilharus ada antara 9x - tidak terbagtas) dan (x + tidak terbatas). Bagaimanapunjuga interval yang luas tidak berguna. Sebaliknya jika kita buat interval yang lebih sempit dengan memilih nilai c yang lebih kecil, nilai Il dapat lebih diketahui dengan tepat. Langkah umum pada statistik adalah sebagai berikut, pertama kita pilih probabilitas yang diinginka, dengan kata lain kita letakkan probabilitas Ildi tengah interval. Biasanya 95 persen. Kemudian kita hitung berapa luas intervaljika kemungkinan 95 persen mengandung nilai sebenarnya. Interval ini dinamakan confidence interval dan 95 adalah confidence leval.
x
x
x-c2
X +cl 1
-c1 j
j
X +c2 1
50% mengandung Il 95% mengandung Il Gambar 11-1
Kini kita akan menghitung nilai c yang memenuhi persamaan Pr
(x - c < Il < x + c) = 0,95 atau
Pr(-c<x
-1l
--
Sekali kita mengetahui nilai c, maka kita harns mengetahui berapa besar confidence interval. Ini berarti kita harns mencari nilai c. Marilah membuat variabel random yaitu Z :
Z=
a Z mempunyai distribusi normal (mean 0 dan variance 1,lihat bab 8), sehingga persamaan dapat ditulis menjadi
=0,95
=0,95
Problem ini dipakai untuk tabel probabilitas normal. Definisikan a sebagai a =c -vn / a, maka Pr (a < Z < a)
= 0,95
Selanjutnya lihat tabel distribusi normal (tabel A3-2) sampai ditemukan nilai a yang memenuhi persamaan. Lihat kolom kebawah, kita dapat jumpai nilai yang benar untuk a adalah 1,96. Sekarang nilai c dapat kita temukan. 1,96 a
c=
Kita mengetahui berapa luas confidence interval. Ada 95 persen kemungkinan nilai sebenarnya ~ akan berada diantara x -1,96 a/ -vn dan x + 1,96 a -vn. Ada dua ciri khas dari hasil ini yaitu pertama, confidence intervallebih luas (lebih tidak pasti) jika a lebih besar. Jika variance tiap observasi individuallebih besar, maka akan sukar 144
mendekati nilai sebenamya, J.1.Kedua, confidence intervallebih sempit jika n lebih besar. Ini berarti jika kita melakukan observasi lebih banyak, kita akan meramal nilai sebenamya /.l secara tepat. Bahkan kita dapat berhati-hati, jika diinginkan. Anggaplah kita ingin 99 persen confidence interval mengandung nilai sebenamya J.1.Kemudian kita harns menentukan luasnya, paling tidak mendekati interval. Atau jika kita tidak ingin berhati-hati, kita dapat menghitung confidence interval yang lebih kedl yang mempunyai probabilitas yang lebih rendah dari nilai sebenamya.
Langkah Umum Menghitung Confidence.lnterval untuk Rata-rata Bila anda mempunyai n observasi dari a distribusi normal dengan standar deviasi cr. 1. Tentukan confidence interval yang diinginkan. Jika anda lebih waspada ambil tingkat yang lebih tinggi (0,95 salah satu tingkat yang umumnya paling banyak). 2. Lihat nilai a pada tabel 11-1. 3. Hitung x dan a cr/-.Jfi. Confidence interval adalah dari x - a a/n sampai x + a aln. Tabel 11-1 confidence level
cr
0,85 0,85 0,90 0,95 0,99
1,28 1,44 1,65 1,96 2,58
Contoh soal mencari confidence interval untuk rata-rata jika variance diketahui: Di bawah ini terdapat kelompok angka yang mendekati distribusi normal dengan a =4,
1835. 21,12,22,22,22,10,13,10,17,14,15,19, 21, 19, 11, 19, 18, 18, 19, 18,20,20, 14,24, 15, 19, 19,24,14, 12, 16,26, 14,25, 9, 18, 14,18,12,17,20,18,12,16,19,191,13,20, 19,11,18,23,19,23,17,12,23,22,14,20, 13,16,17,18,13,21,14,11,15,21,18,25,
145
--
--
18,21,20,15,23,20,20,12,15,18,19,18, 18,20,13,18,20,16,15,15,18,13,28,17, 25, 10, 15, 17, 17, 18, 15, 19, 15, 15,24, 15, 14,18,16,20,21,15,12,19,19,22,19,18, 16,20,21, 16, 15, 11, 11, 11 Jawab: Pertama, kita hitung arata-rata sampel: x = 17,3.Banyaknyasampeladalah128,nilaic untuk 95% confidencd interval adalah c = 1,96x 4,1835/"'128= 0,7248.Sehinggadidapat confidence interval adalah dari 16,58 sampai 18,02. YANG HARUS DIINGAT 1. Pada saat kita menghitung sebuah estimasi parameter populasi yang tidak diketahui, kita perlu mengetahui bagaimana tepatnya estimasi tersebut. 2. Menghitung confidence interval sangat berguna - sebuah interval yang mempunyai probabilits tetap yang mengandung nilai parameter populasi yang tidak diketahui. 3. Probabilitas tetap ini merupakan confidence interval dan umumnya sebesar 95 persen. 4. Confidence interval yang sempit lebih baik karena anda dapat membuat estimasi yang mendekati nilai sebenarnya dari parameter. 5. Pada umumnya, confidence interval akan menjadi lebih sempit jika jumlah observasi bertambah. MENGHITUNGCONFIDENCEINTERVALMENGGUNAKANDISTRIBUSI"T" Kita sekarang tidak mengetahui nilai sebenarnya dari (32.Perkiraan pertama, kita dapat menggunakan variance sampel untuk mengestimasi nilai (32.Jika banyak sampel (n) cukup besar (n > 30), kita dapat menggunakan confidence interval yang telah dibahas pada sub bab di muka, dengan variance sF dipakai sebagai pengganti (32.Untuk sampel kecil, kita gunakan cara lain yaitu dengan distribusi "t". Ingat, confidence interval dengan distribusi normal adalah:
z=
"'n (x - ~) (3
Sedangkan dengan distribusi "t" adalah:
T=
146
Catat bahwa tepatnya T sarna dengan Z kecuali nilai S2=s22yang"diketahuitelahdiganti oleh nilai cr yang tidak diketahui. Kita dapat harapkan distribusi T sangat menyerupai distribusi standar normal. Setelah ada sedikit manipulasi, kita dapatkan Z
T=
dimana y 2 adalah variabel random yang barn yang berhubungan dengan s 12dan S22:
nsF
(n
- l)s22
y2=
a
a
y2 mempunyai distribusi chi-square dengan derajat kebebasan (degree of freedom atau df) sebesar n - 1. Kini kita dapat menghitung besar confidence interval dan dapat mencari nilai c pada persamaan Pr (x - c < 11< x + c)
= 0,95
Menggunakan definisi T maka didapat persamaan
c...Jn
-c...Jn
Pr
=0,95 s2
Kita definisikan a = c ...In /S2 Selanjutnya lihat tabel distribusi t, kita cari nilai a pada Pr (-a < T < a)
= 0,95
Misal jika n - 1 = 8, pada tabel a = 2,306. Jika a telah didapat, maka kita dapat mencari c dari formula
a C=S2 ...In
147
---
Karena itu, 95% confidence interval untuk 11adalah dari x - 8za/-vn 8ampaiX + 8za /-vn . Contoh soal: Marilah kita lihat jurnlah kursi yang kalah di parlernen pada saat pernilihan presiden (lihat tabeI11-2) Tabelll-2
Tahun
Partai
Kursi yang kalah
1942 1946 1950 1954 1958 1962 1966 1970 1974 1978 1982
Dernokrat Dernokrat Dernokrat Republik Republik Dernokrat Dernokrat Republik Republik Dernokrat Republik
50 54 29 18 47 5 48 12 48 16 26
Rata-rata sampai sampel: 32,09 Standar deviasi sarnpai (sz>: 17,807 Anggaplah jurnlah kursi yang kalah berdistribusi normal dengan rata-rata J.ltidak diketahui
dan variance o-Z tidak diketahui. Hitung 95% confidence interval untuk J.L Jawab:
Pertarna kita dapatkan x =32,09 kernudian kita ternukan Sz=17,8. Karena ada 11 observasi, rnaka lihat tabel distribusi "t" dengan df 10. Kita dapatkan nilai a adalah 2,228. Kernudian kita dapatkan confidence interval adalah dari 20,1 sampai 44,1. Langkah-Iangkah Menghitung confidence Interval dengan Distribusi "t" Jika Ada n observasi x Variabel Random 1. Tentukan confidence level (urnurnnya 0,95) 2. Hitung x: Xl + Xz + ... + Xu
X= n
148
n n-l 4.
Lihat nilai pada tabel A3-5 (ljika n > 30, t hampir sarna dengan distribusi normal). Confidence interval untuk f.1adalah x - S2a/...Jn sampai x + S2a/...Jn.
YANG HARUS DIINGAT Mencari confidence interval untuk rata-rata jika variance tidak diketahui, pertama lihat tabel A3-5 untuk menemukan nilai a, seperti Pr (-a < t < a) = CL
dimana CL adalah confidence level (misal 0,95) dan t adalah variabel random dengan df n - 1, sehingga didapatkan confidence interval adalah as2 x:!::...In dimana S2merupakan standar deviasi sampel dan b banyaknya observasi. Dengan probabilitas
CL, intervalini akanmengandungnilai sebenarnyadarirata-ratayangtidakdiketahui(f.1). MENGHITUNG CONFIDENCE INTERVAL UNTUK VARIANCE Anggaplah anda mempunyai sampel yang diambil dari populasi normal yang variancenya ingin anda estimasi. Kita mengetahui bagaimana menghitung variance sampel s 12. Sekarang
kita perlumenentukanconfidenceintervaluntuk cr2. Telahdiketahuibahwa: nsP
merupakan variabel random chi-square dengan df n - 1. Untuk dua angka positif a dan b, kita mengetahui bahwa:
nsP cr2 149 --
=Pr
Contoh soal: tinggi 25 siswa yang terpilih secara random dari Sekolah Dasar Milliard Fillmore adalah sebagai berikut (cm): 135, 139, 128, 143, 122, 123, 142, 135, 140, 141,115,133,128,137,142,128,135, 142, 129, 133, 141, 137, 125, 127, 138 Kita dapatkan sF adalah 54,17. Jika kita tentukan 90% confidence interval untuk variance, maka kita cari a dan b sebagai berikut: Pr (y2 < a) = 0,05 dan Pr (Y2< b) = 0,95 Lihat tabel A3-3 untuk distribusi chi-square dengtan df 25 - 1 = 24. Kita dapatkan a = 13,85 dan b = 36,4. Kemudian kita dapatkan confidence interval dari ns12/b = 37,20 sampai ns12/a = 97,78.
LANGKAHMENGHITUNGCONFIDENCEINTERVALUNTUK VARIANCE 1. Tentukan confidence level (CL). 2. Hitungx, XZ,dans12=XZ _x2 3. Gunakan tabel A3-3 untuk mendapatkan a dn b, jika y2 adalah variabel random chisquare dengan df n - 1, maka 1- CL Pr (y2 < a) =
1 +CL dan Pr (Y2 < b)
2 Misal, jika CL
= 0,90,
= 2
maka Pr (y2 < a) = 0,05 dan Pr (y2 < b) = 0,95.
Confidence interval untuk a2 adalah dari ns12/b sampai nsF/a. MENGHITUNG CONFIDENCE INTERVAL UNTUK PERBEDAAN DUA RATA-RATA Sebuah situasi sering akan muncul dimana anda ingin membandingkan dengan mengharapkan variabel randomnya sarna.
dua populasi
Contoh perbedaan dua rata-rata antara lain:
~
Semua contoh tersebut akan menarik jika diestimasi perbedaan dua rata-rata yaitu J1ayang terdiri dari dua variabel random X. (rata-rata J1a,variance aa2) dan Xb (rata-rata ~,
150
-"i.;'.;';'-'-'-;'-:-:"-
variance crb2).Hal ini dikerjakan dengan menghitung perbedaan rata-rata sarnpel, X. - Xb' Seberapa dekatkah x. - ~ mendekati nilai fl. -Ilt,? Sekali lagi kita dihadapkan paa confidence interval. X. mempunyai rata-rata sarnpel x. danjumlah sarnpel n., begitu juga untuk Xb, xbdan~.
Jika X. dan X b merupakan variabel random normal, maka x. - xbyang mempunyai rata-rata fl. -Ilt, nilai ua - ub? Sekali lagi kita dihadapkan pada confidence interval. X. mempunyai rata-rata sarnpel xa dan jumlah sarnpel na, begitu juga untuk Xb, xb dan
-
-
nb. JikaX. danX b merupakan variabel random normal, maka x. - xb yang mempunyai ratarata fl. - Ilt,dan variance (sa2 / n. + sb/nb». Kita dapatkan variabel random Z yang baru:
Z=
ex. - x b) - (fl. - Ilt,)
Vcra2 / n. + crb2/ ~
yang mempunyai distribusi normal. Kemudian lihat tabel11-1 untuk mendapatkan nilai a pada Pr (-a < Z < a)
= CL
dimana CL merupakan confidence level. Setelah itu hitunglah c
Confidence interval untuk Jla - J.Ibadalah
Contoh soal: Data dibawah ini merupakanjumlah penjualan (dalarnribuan) surat kabar di dunia kota yang berdekatan saru sarna lain pada periode tertentu: Kota A: 25,13,14, 19,23,30,35,29,28, 17, 17, 16, 13, 18,20 Kota B : to, 12, 15, 13,7,6, 11,5,9,14,15,18, 17, 16, 12, 12, to, 11, 13, 14 Anggaplah bahwa cra2=40 dan crb2= 14. Kemudian kita dapat menghitung X. = 21,13,
xb= 12dan x. - xb= 9,13. Menggunakan 99 persen confidence interval,kita dapatkan a =2,58, c = 2,58 "40/15 + 14/20 = 4,73 dan confidence interval terletak antara 4,40 dan 13,86. Langkah Menghitung confidence Interval untuk Perbedaan Dua Rata-rata 1.
Tentukan confidence level yang diinginkan (misalnya 95 persen).
151
--
2.
Lihat nilai pada tabel 11-1.
3. HitungX. - Xb 4.
Hitung c
= a ~ cra2 / n. + crb/ nb.
Confidence Interval adalah (X. - x b) :!:c. Sekali lagi, jika jumlah sarnpel cukup banyak, variance sarnpel dapat mengganti? cra2 dan crb2jika keduanya tidak diketahui. Untuk sarnpel sedikit, kita kembali pada distribusi "t". .
Dalarn hal ini, kita harns membuat dua asumsi, yaitucra2= crb2dan sampel-sarnpel tersebut dipilih secara independen (sampel yang sedikit menghilang krandoman). Ingat, kita tidak mengasumsi bahwakita mengetahui sa2atau sb2.Kita hanyamengasumsi bahwa keduanya adalah sarna. Akan sangat baik jika anda mengetahuinya. Jika tidak mengetahuinya, kita dapat menyarnakan keduanya dengan pooled estimasi Sp2: (n. - a)sa2 + (nb - l)sb2
(n. - 1) + (~ - 1) Akan kita gunakan sa2 untuk rata-rata variance sarnpel, versi 2, dari sarnpel a:
na - 1 Begitu juga dengan sb2untuk sampel b. Sp2merupakan rata-rata tertimbang dari sa2dan sb2, sehingga jika n. lebih besar daripada ~, maka Sp2lebih mendekati sa2 daripada sb2, dan sebaliknya. Kini pada formula di atas untuk sarnpel besar, jika cra2= crb2maka kita mempunyai :
z=
=
IX" \}\.. -x b)-(J.!, . -II) r-"
Kita gantikan pooled estimator Sp2ditempat cra2dan membuat statistik "t" yang barn":
T=
~ crp2 (1 / n. + 152
1 / nb)
n
Statistik "t" mempunyai (na - 1) + (nb - 1) = na + nb- 2 tingkat kebebasan (degrees of freedom atau dt). Jika kita mengetahui nilai aa2, kita masukkan untuk Sp2(tidak diperlukan mengestimasi jika kita mengetahui nilai sesungguhnya). Kita dapatkan nilai a dari tabel A35 sehingga Pr (-a < T < a)
= CL
dimana CL merupakan confidence level dan T mempunyai distribusi t dengan df sebesar na + nb - 2. Kemudian kita cari c:
c=a
Confidence interval untuk J.1a- jlb adalah
Contoh soal: Data di bawah ini merupakan data penjualan (dalam ribuan) dua merk layang-Iayang yang diambil secara random perbulan: Merk A : 15, 20, 33, 27 Merk B : 23, 42, 39 Anggap bahwacra2=crb2. Kitadapatmenghitungx a =23,75, Xb = 34,67, Xa- Xb= -10,92, sa2 = 62,25, sb2 = 104,3 dan sp2 = 79,08. Menggunakan confidence interval sebesar 95 persen untuk na + nb - 2 = 5 degrees of freedom, kita dapatkan a
= 2,571
= 17,46 dan confidence intervalnya terletak diantara -28,38 dan 6,54.
~ 79,08 (1/4 + 1/3)
Langkah Menghitung Confidence Interval untuk Perbedaan antara Rata-rata Populasi Jika Mempunyai Sampel Kecil Variance-variance Populasi yang Sarna 1. Tentukan confidence interval (misalnya 95 persen).
2. HitungXa - Xb. 3.
Hitung Sp2: (na - 1) sa2 + (~ - 1) sb2
na + ~ - 2 4.
Lihat nilai df na+ nb- 2 pada tabel A3-5. 153 --
--
5.
Hitungc:
Confidence interval adalah (X a- X b):t c
154