STATISTICS. Confidence Intervals (Rentang Keyakinan) Confidence Intervals (1)

STATISTICS Confidence Intervals (Rentang Keyakinan)

Confidence Intervals

(1)

• Estimasi Parameter – Distribusi probabilitas memiliki sejumlah parameter. – Parameter-parameter tsb umumnya tak diketahui. – Nilai parameter tersebut diperkirakan (di-estimasikan) berdasarkan nilai yang diperoleh dari pengolahan data. – Estimasi • Estimasi tunggal (point (point estimates) estimates) • Rentang keyakinan (confidence (confidence intervals) intervals) Statistika


2

1


(2)

• Estimasi Tunggal – Contoh • Nilai ratarata-rata sampel sbg estimasi nilai ratarata-rata populasi.

X →μ • Nilai simpangan baku sampel sbg estimasi nilai simpangan baku populasi. sX → σ X

Statistika


3


(3)

• Estimasi parameter θ θ{ˆ →

estimasi

θ{

parameter

Dicari suatu interval [L [L,U] yang memiliki probabilitas (1 – α) bahwa interval tsb mengandung θ.

prob(L < θ < U) = (1 – α)

Æ Pers (1)

L = batas bawah rentang keyakinan. U = batas atas rentang keyakinan. (1 – α) = tingkat keyakinan (confidence (confidence level, level, confidence coefficient). coefficient). L dan U = variabel random Statistika


4

2


(4)

• Contoh – Data debit Sungai A selama tahun 1981 s.d. 2000 menunjukkan bahwa debit rata-rata adalah 77 m3/s. • Kita dapat memperkirakan debit ratarata-rata Sungai A adalah 3 77 m /s. • Kita menyadari bahwa perkiraan tsb dapat salah; bahkan dari sisi pengertian probabilitas, kita tahu bahwa debit ratarata-rata sama dengan 77 m3/s adalah hampir tidak mungkin terjadi:

(

)

prob Q = 77 m 3 s = 0 Statistika


5

Batas Bawah dan Atas

(1)

• Metode Ostle: method of pivotal quantities – Dicari variabel random V yang merupakan fungsi parameter θ (θ = unknown), tetapi distribusi V ini tidak bergantung pada parameter yang tidak diketahui. – Ditentukan v1 dan v2 sedemikian hingga: prob(v1 < V < v2 ) = 1 − α

Statistika


Æ Pers (2)

6

3

Batas Bawah dan Atas

(2)

• Metode Ostle: method of pivotal quantities prob(v1 < V < v2 ) = 1 − α

– Persamaan di atas diubah kedalam bentuk prob(L < θ < U) = 1-α – L dan U adalah variabel random dan fungsi V, tetapi bukan fungsi θ.

Statistika


7

Confidence interval: µ suatu distribusi normal • Mencari interval [L,U] yang mengandung µ, prob(L < µ < U) = 1 – α • Misal variabel random V: V=

X −μ sX

– V berdistribusi t dengan (n – 1) degrees of fredom – n adalah jumlah sampel yang dipakai untuk menghitung nilai rata-rata sampel, X Statistika


8

4

V=

X −μ Æ berdistribusi t? sX

• Bukti

ν , ν = degree of freedom U (X − μ ) σ = (X − μ ) ⋅ 1 X −μ X −μ = = V= sX σ n s 2X n s 2X σ n s 2X σ 2

Distribusi t: X = Y

=

(X − μ ) ⋅

n −1

=Y ⋅

∑ (X i − X ) σ 2 2 ( Xi − X ) X −μ ∑ →Y = , U= , σ

2

n

ν

σ2

n

Statistika

ν U

ν = n −1


• Pers (2): prob(v1 < V < v2 ) = 1 − α

9

⎛ ⎞ X −μ ⇒ prob⎜⎜ v1 < < v2 ⎟⎟ = 1 − α sX ⎝ ⎠

αa + αb = α prob(t prob(t < v1) = αa

dengan (n (n – 1) degrees of freedom

prob(t prob(t > v2) = αb luas = (1 – α) luas = αa

luas = αb

tα a Statistika

t1−αb Confidence Intervals

10

5

⎞ ⎛ X −μ prob⎜⎜ v1 < < v2 ⎟⎟ = 1 − α sX ⎠ ⎝ ⎛ ⎞ X −μ < tαb ,n −1 ⎟⎟ = 1 − α prob⎜⎜ tα a ,n−1 < sX ⎝ ⎠ prob X + tα a ,n−1 ⋅ s X < μ < X + tαb ,n −1 ⋅ s X = 1 − α

(

)

u

ℓ Jadi, confidence limits: l = X + tα a ,n −1 ⋅ s X

sX = sX

u = X + tαb ,n −1 ⋅ s X

tα a ,n−1 → tabel distribusi t

Statistika

n


11

• Jika dikehendaki probabilitas confidence interval simetris, maka v1 dan v2 dipilih sedemikian hingga prob(t prob(t < v1) = prob(t prob(t > v2). • Karena simetri, maka αa = αb = α/2 • Yang dicari adalah (1 – α) = 100(1 – α)% confidence interval Æ maka: prob(t prob(t < v1) = α/2 = prob(t prob(t > v2)

luas = (1 – α)/2

luas = (1 – α)/2

luas = α/2

luas = α/2

tα 2 = −t1−α 2 Statistika

t1−α 2 Confidence Intervals

12

6

Distribusi t luas = α/2

luas = α/2 luas = 1 – α/2

luas = 1 – α/2

tα 2

t1−α 2

luas = α/2

luas = 1 – α

tα 2 − t1−α 2 Statistika

luas = α/2

t1−α 2


13

• Dengan demikian, confidence limits jika probabilitas confidence interval simetri adalah: l = X − t1−α 2,n −1 ⋅ s X u = X + t1−α 2,n−1 ⋅ s X

Statistika


14

7

• Kadang dikehendaki probabilitas confidence interval satu sisi – batas bawah – batas atas

Æ Æ

prob(t prob(t < v1) = α prob(t prob(t > v2) = α

⎛ X −μ ⎞ prob(V > v1 ) = 1 − α ⇒ prob⎜⎜ > v1 ⎟⎟ = 1 − α ⎝ sX ⎠ ⎛ X −μ ⎞ prob(V < v2 ) = 1 − α ⇒ prob⎜⎜ < v2 ⎟⎟ = 1 − α ⎝ sX ⎠ luas = α

luas = α luas = 1 – α

luas = 1 – α

tα Statistika

t1−α Confidence Intervals

15

Distribusi t • Notasi – tγ,n = nilai t sedemikian hingga probabilitas variabel random t dengan n degrees of freedom adalah lebih kecil daripada γ. – misal: t0.95,50 = nilai t sedemikian hingga prob(t < t0.95,50) = 0.95 untuk t yang memiliki 50 degrees of freedom.

Statistika


16

8

Distribusi t • Dapat dibaca di tabel distribusi t – Tabel Distribusi t

• Dapat dihitung dengan perintah/fungsi MSExcel – TDIST(t,ν TDIST(t,ν,tails) • • • • •

menghitung nilai prob(T > t) untuk menghitung nilai prob(T < t) Æ 1 – TDIST(t,ν TDIST(t,ν,tails) t = nilai yang diinginkan untuk dicari distribusinya ν = degree of freedom tails = 1 (one(one-tailed distribution) atau 2 (two(two-tailed distribution)

– TINV(p,ν TINV(p,ν) • mencari nilai t jika nilai p = prob(T > t) diketahui • twotwo-tailed distribution • jika ingin mencari nilai t untuk oneone-tailed distribution, p diganti dengan 2p

Statistika


17

Distribusi t untuk 50 degrees of freedom

0.95 t

t = 1.6 prob(T < 1.6) = 1 – TDIST(1.6,50,1) = 0.942

prob(T < t ) = 0.95 t = TINV(2*(1TINV(2*(1-0.95),50) Æ t = 1.68

0.95 t = –1.6

–t

t = 1.6

prob(–1.6 < T < 1.6) = 1 – TDIST(1.6,50,2) = 0.884

Statistika


t

prob(prob(-t < T < t ) = 0.95 t = TINV(1TINV(1-0.95,50) Æ t = 2 18

9

Confidence interval: µ suatu distribusi normal • Apabila varian populasi diketahui, maka variabel random V didefinisikan sbb.: V=

X −μ , σX

σX = σX

n

Æ V berdistribusi normal

Statistika


19

Confidence interval: µ suatu distribusi normal, σ diketahui • Confidence limits l = X + za ⋅ s X u = X + zb ⋅ s X

αa

αb

1− α

za

zb

– Jika probabilitas rentang keyakinan diinginkan simetri, maka confidence limits nilai ratarata-rata populasi µ adalah sbb:

l = X − z1−α 2 ⋅ s X

u = X + z1−α 2 ⋅ s X

α 2

1− α

zα 2 = − z1−α 2 Statistika


α 2 z1−α 2 20

10

Confidence interval: σ2 suatu distribusi normal • Mencari interval [L,U] yang mengandung σ2 dengan peluang prob(L < σ2 < U) = 1 – α. • Didefinisikan variabel random V:

( n − 1) s X 2 V= σX 2

Æ V berdistribusi chi-squared dengan (n – 1) degrees of freedom.

Statistika


21

prob(v1 < V < v2 ) = 1 − α ⎛ (n − 1) s X 2 < v ⎞⎟ = 1 − α prob⎜ v1 < 2⎟ ⎜ σX 2 ⎝ ⎠ Pilih:

v1 = χ α2 2,n−1 v2 = χ12−α 2,n−1

⎛ ⎞ (n − 1) s X 2 < χ 2 ⎟ = 1− α sehingga: prob⎜ χ α2 2,n−1 < n 1 2 , 1 − α − 2 ⎜ ⎟ σ X ⎝ ⎠ ⎛ (n − 1) s 2 (n − 1) s X 2 ⎞⎟ = 1 − α X atau: prob⎜ 2 < σX 2 < 2 ⎜χ χ α 2,n−1 ⎟⎠ ⎝ 1−α 2,n−1 Statistika


22

11

Jadi batas bawah dan batas atas rentang yang mengandung σX2 dengan tingkat keyakinan (1 – α) adalah: • batas bawah:

( n − 1) s X 2 l=

• batas atas:

( n − 1) s X 2 u=

χ12−α 2,n−1 χ α2 2,n−1

Catatan: X berdistribusi normal χ2 berdistribusi chi-squared Statistika


23

Distribusi chi-squared tidak simetris: sX 2 − l ≠ u − sX 2

n » → (n – 1) » → distribusi mendekati distribusi simetris, sX2 berada kira-kira di tengahtengah rentang [L,U].

1− α

χ α2 2 Statistika

χ12−α 2 Confidence Intervals

24

12

One-sided confidence intervals • Hanya diinginkan satu sisi rentang keyakinan saja – batas bawah saja untuk rentang keyakinan µ prob (L < θ ) = 1 − α ⇒ l = X − t1−α ,n −1

– batas atas saja untuk rentang keyakinan µ prob(θ < U ) = 1 − α ⇒ u = X + t1−α,n−1

Statistika


25

13

STATISTICS. Confidence Intervals (Rentang Keyakinan) Confidence Intervals (1)

Recommend Documents