STATISTICS Confidence Intervals (Rentang Keyakinan)
Confidence Intervals
(1)
• Estimasi Parameter – Distribusi probabilitas memiliki sejumlah parameter. – Parameter-parameter tsb umumnya tak diketahui. – Nilai parameter tersebut diperkirakan (di-estimasikan) berdasarkan nilai yang diperoleh dari pengolahan data. – Estimasi • Estimasi tunggal (point (point estimates) estimates) • Rentang keyakinan (confidence (confidence intervals) intervals) Statistika
Confidence Intervals
2
1
Confidence Intervals
(2)
• Estimasi Tunggal – Contoh • Nilai ratarata-rata sampel sbg estimasi nilai ratarata-rata populasi.
X →μ • Nilai simpangan baku sampel sbg estimasi nilai simpangan baku populasi. sX → σ X
Statistika
Confidence Intervals
3
Confidence Intervals
(3)
• Estimasi parameter θ θ{ˆ →
estimasi
θ{
parameter
Dicari suatu interval [L [L,U] yang memiliki probabilitas (1 – α) bahwa interval tsb mengandung θ.
prob(L < θ < U) = (1 – α)
Æ Pers (1)
L = batas bawah rentang keyakinan. U = batas atas rentang keyakinan. (1 – α) = tingkat keyakinan (confidence (confidence level, level, confidence coefficient). coefficient). L dan U = variabel random Statistika
Confidence Intervals
4
2
Confidence Intervals
(4)
• Contoh – Data debit Sungai A selama tahun 1981 s.d. 2000 menunjukkan bahwa debit rata-rata adalah 77 m3/s. • Kita dapat memperkirakan debit ratarata-rata Sungai A adalah 3 77 m /s. • Kita menyadari bahwa perkiraan tsb dapat salah; bahkan dari sisi pengertian probabilitas, kita tahu bahwa debit ratarata-rata sama dengan 77 m3/s adalah hampir tidak mungkin terjadi:
(
)
prob Q = 77 m 3 s = 0 Statistika
Confidence Intervals
5
Batas Bawah dan Atas
(1)
• Metode Ostle: method of pivotal quantities – Dicari variabel random V yang merupakan fungsi parameter θ (θ = unknown), tetapi distribusi V ini tidak bergantung pada parameter yang tidak diketahui. – Ditentukan v1 dan v2 sedemikian hingga: prob(v1 < V < v2 ) = 1 − α
Statistika
Confidence Intervals
Æ Pers (2)
6
3
Batas Bawah dan Atas
(2)
• Metode Ostle: method of pivotal quantities prob(v1 < V < v2 ) = 1 − α
– Persamaan di atas diubah kedalam bentuk prob(L < θ < U) = 1-α – L dan U adalah variabel random dan fungsi V, tetapi bukan fungsi θ.
Statistika
Confidence Intervals
7
Confidence interval: µ suatu distribusi normal • Mencari interval [L,U] yang mengandung µ, prob(L < µ < U) = 1 – α • Misal variabel random V: V=
X −μ sX
– V berdistribusi t dengan (n – 1) degrees of fredom – n adalah jumlah sampel yang dipakai untuk menghitung nilai rata-rata sampel, X Statistika
Confidence Intervals
8
4
V=
X −μ Æ berdistribusi t? sX
• Bukti
ν , ν = degree of freedom U (X − μ ) σ = (X − μ ) ⋅ 1 X −μ X −μ = = V= sX σ n s 2X n s 2X σ n s 2X σ 2
Distribusi t: X = Y
=
(X − μ ) ⋅
n −1
=Y ⋅
∑ (X i − X ) σ 2 2 ( Xi − X ) X −μ ∑ →Y = , U= , σ
2
n
ν
σ2
n
Statistika
ν U
ν = n −1
Confidence Intervals
• Pers (2): prob(v1 < V < v2 ) = 1 − α
9
⎛ ⎞ X −μ ⇒ prob⎜⎜ v1 < < v2 ⎟⎟ = 1 − α sX ⎝ ⎠
αa + αb = α prob(t prob(t < v1) = αa
dengan (n (n – 1) degrees of freedom
prob(t prob(t > v2) = αb luas = (1 – α) luas = αa
luas = αb
tα a Statistika
t1−αb Confidence Intervals
10
5
⎞ ⎛ X −μ prob⎜⎜ v1 < < v2 ⎟⎟ = 1 − α sX ⎠ ⎝ ⎛ ⎞ X −μ < tαb ,n −1 ⎟⎟ = 1 − α prob⎜⎜ tα a ,n−1 < sX ⎝ ⎠ prob X + tα a ,n−1 ⋅ s X < μ < X + tαb ,n −1 ⋅ s X = 1 − α
(
)
u
ℓ Jadi, confidence limits: l = X + tα a ,n −1 ⋅ s X
sX = sX
u = X + tαb ,n −1 ⋅ s X
tα a ,n−1 → tabel distribusi t
Statistika
n
Confidence Intervals
11
• Jika dikehendaki probabilitas confidence interval simetris, maka v1 dan v2 dipilih sedemikian hingga prob(t prob(t < v1) = prob(t prob(t > v2). • Karena simetri, maka αa = αb = α/2 • Yang dicari adalah (1 – α) = 100(1 – α)% confidence interval Æ maka: prob(t prob(t < v1) = α/2 = prob(t prob(t > v2)
luas = (1 – α)/2
luas = (1 – α)/2
luas = α/2
luas = α/2
tα 2 = −t1−α 2 Statistika
t1−α 2 Confidence Intervals
12
6
Distribusi t luas = α/2
luas = α/2 luas = 1 – α/2
luas = 1 – α/2
tα 2
t1−α 2
luas = α/2
luas = 1 – α
tα 2 − t1−α 2 Statistika
luas = α/2
t1−α 2
Confidence Intervals
13
• Dengan demikian, confidence limits jika probabilitas confidence interval simetri adalah: l = X − t1−α 2,n −1 ⋅ s X u = X + t1−α 2,n−1 ⋅ s X
Statistika
Confidence Intervals
14
7
• Kadang dikehendaki probabilitas confidence interval satu sisi – batas bawah – batas atas
Æ Æ
prob(t prob(t < v1) = α prob(t prob(t > v2) = α
⎛ X −μ ⎞ prob(V > v1 ) = 1 − α ⇒ prob⎜⎜ > v1 ⎟⎟ = 1 − α ⎝ sX ⎠ ⎛ X −μ ⎞ prob(V < v2 ) = 1 − α ⇒ prob⎜⎜ < v2 ⎟⎟ = 1 − α ⎝ sX ⎠ luas = α
luas = α luas = 1 – α
luas = 1 – α
tα Statistika
t1−α Confidence Intervals
15
Distribusi t • Notasi – tγ,n = nilai t sedemikian hingga probabilitas variabel random t dengan n degrees of freedom adalah lebih kecil daripada γ. – misal: t0.95,50 = nilai t sedemikian hingga prob(t < t0.95,50) = 0.95 untuk t yang memiliki 50 degrees of freedom.
Statistika
Confidence Intervals
16
8
Distribusi t • Dapat dibaca di tabel distribusi t – Tabel Distribusi t
• Dapat dihitung dengan perintah/fungsi MSExcel – TDIST(t,ν TDIST(t,ν,tails) • • • • •
menghitung nilai prob(T > t) untuk menghitung nilai prob(T < t) Æ 1 – TDIST(t,ν TDIST(t,ν,tails) t = nilai yang diinginkan untuk dicari distribusinya ν = degree of freedom tails = 1 (one(one-tailed distribution) atau 2 (two(two-tailed distribution)
– TINV(p,ν TINV(p,ν) • mencari nilai t jika nilai p = prob(T > t) diketahui • twotwo-tailed distribution • jika ingin mencari nilai t untuk oneone-tailed distribution, p diganti dengan 2p
Statistika
Confidence Intervals
17
Distribusi t untuk 50 degrees of freedom
0.95 t
t = 1.6 prob(T < 1.6) = 1 – TDIST(1.6,50,1) = 0.942
prob(T < t ) = 0.95 t = TINV(2*(1TINV(2*(1-0.95),50) Æ t = 1.68
0.95 t = –1.6
–t
t = 1.6
prob(–1.6 < T < 1.6) = 1 – TDIST(1.6,50,2) = 0.884
Statistika
Confidence Intervals
t
prob(prob(-t < T < t ) = 0.95 t = TINV(1TINV(1-0.95,50) Æ t = 2 18
9
Confidence interval: µ suatu distribusi normal • Apabila varian populasi diketahui, maka variabel random V didefinisikan sbb.: V=
X −μ , σX
σX = σX
n
Æ V berdistribusi normal
Statistika
Confidence Intervals
19
Confidence interval: µ suatu distribusi normal, σ diketahui • Confidence limits l = X + za ⋅ s X u = X + zb ⋅ s X
αa
αb
1− α
za
zb
– Jika probabilitas rentang keyakinan diinginkan simetri, maka confidence limits nilai ratarata-rata populasi µ adalah sbb:
l = X − z1−α 2 ⋅ s X
u = X + z1−α 2 ⋅ s X
α 2
1− α
zα 2 = − z1−α 2 Statistika
Confidence Intervals
α 2 z1−α 2 20
10
Confidence interval: σ2 suatu distribusi normal • Mencari interval [L,U] yang mengandung σ2 dengan peluang prob(L < σ2 < U) = 1 – α. • Didefinisikan variabel random V:
( n − 1) s X 2 V= σX 2
Æ V berdistribusi chi-squared dengan (n – 1) degrees of freedom.
Statistika
Confidence Intervals
21
prob(v1 < V < v2 ) = 1 − α ⎛ (n − 1) s X 2 < v ⎞⎟ = 1 − α prob⎜ v1 < 2⎟ ⎜ σX 2 ⎝ ⎠ Pilih:
v1 = χ α2 2,n−1 v2 = χ12−α 2,n−1
⎛ ⎞ (n − 1) s X 2 < χ 2 ⎟ = 1− α sehingga: prob⎜ χ α2 2,n−1 < n 1 2 , 1 − α − 2 ⎜ ⎟ σ X ⎝ ⎠ ⎛ (n − 1) s 2 (n − 1) s X 2 ⎞⎟ = 1 − α X atau: prob⎜ 2 < σX 2 < 2 ⎜χ χ α 2,n−1 ⎟⎠ ⎝ 1−α 2,n−1 Statistika
Confidence Intervals
22
11
Jadi batas bawah dan batas atas rentang yang mengandung σX2 dengan tingkat keyakinan (1 – α) adalah: • batas bawah:
( n − 1) s X 2 l=
• batas atas:
( n − 1) s X 2 u=
χ12−α 2,n−1 χ α2 2,n−1
Catatan: X berdistribusi normal χ2 berdistribusi chi-squared Statistika
Confidence Intervals
23
Distribusi chi-squared tidak simetris: sX 2 − l ≠ u − sX 2
n » → (n – 1) » → distribusi mendekati distribusi simetris, sX2 berada kira-kira di tengahtengah rentang [L,U].
1− α
χ α2 2 Statistika
χ12−α 2 Confidence Intervals
24
12
One-sided confidence intervals • Hanya diinginkan satu sisi rentang keyakinan saja – batas bawah saja untuk rentang keyakinan µ prob (L < θ ) = 1 − α ⇒ l = X − t1−α ,n −1
– batas atas saja untuk rentang keyakinan µ prob(θ < U ) = 1 − α ⇒ u = X + t1−α,n−1
Statistika
Confidence Intervals
25
13