Catatan Kuliah
MA3081 STATISTIKA MATEMATIKA “Statistika Mengalahkan Matematika”
disusun oleh
Khreshna I.A. Syuhada, MSc. PhD.
Kelompok Keilmuan STATISTIKA - FMIPA Institut Teknologi Bandung 2011
Daftar Isi 1 Peubah Acak dan Distribusi Kontinu 1.1 Fungsi distribusi . . . . . . . . . . . 1.2 Unsur Peluang . . . . . . . . . . . . 1.3 Ekspektasi . . . . . . . . . . . . . . . 1.4 Distribusi Bivariat . . . . . . . . . . 1.5 Distribusi Bersyarat . . . . . . . . . 1.6 Fungsi Pembangkit Momen . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
2 Distribusi Sampel, Likelihood dan Penaksir 2.1 Sampel Acak . . . . . . . . . . . . . . . . . 2.2 Likelihood . . . . . . . . . . . . . . . . . . . 2.3 Statistic Cukup . . . . . . . . . . . . . . . . 2.4 Distribusi Sampel . . . . . . . . . . . . . . . 2.5 Statistik Terurut . . . . . . . . . . . . . . . 2.6 Momen dari Mean dan Proporsi Sampel . . 2.7 Teorema Limit Pusat . . . . . . . . . . . . . 3 Penaksiran dan Selang Kepercayaan 3.1 “Sifat-sifat” (Kesalahan) penaksiran . 3.2 Konsistensi . . . . . . . . . . . . . . 3.3 Selang Kepercayaan . . . . . . . . . . 3.4 Efisiensi . . . . . . . . . . . . . . . . 4 Uji 4.1 4.2 4.3 4.4 4.5
. . . .
. . . .
Hipotesis Hipotesis, Statistik Uji dan P-value . . . Daerah Penolakan, Kesalahan dan Fungsi Uji Paling Kuasa . . . . . . . . . . . . . Uji Paling Kuasa Seragam . . . . . . . . Uji Rasio Likelihood . . . . . . . . . . .
i
. . . .
. . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . Kuasa . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . . . .
1 1 4 7 9 11 13
. . . . . . .
1 1 1 5 6 6 7 7
. . . .
1 1 2 3 4
. . . . .
1 1 2 3 4 4
BAB 1 Peubah Acak dan Distribusi Kontinu 1.1
Fungsi distribusi
Definisi: Misalkan X peubah acak. Fungsi distribusi (kumulatif) dari X adalah FX (x) = P (X ≤ x) Contoh: 1. Misalkan X ∼ Bin(3, 0.5), maka fungsi distribusi F (x) adalah fungsi tangga berikut 0, 1/8, F (x) = 1/2, 7/8, 1,
x ∈ (−∞, 0); x ∈ [0, 1); x ∈ [1, 2); x ∈ [2, 3); x ∈ [3, ∞).
2. Misalkan X peubah acak dengan ‘support’ S = [a, b], b > 0. Misalkan peluang X akan berada di selang S proporsional terhadap panjang selang. Dengan kata lain, P (x1 ≤ X ≤ x2 ) = λ (x2 − x1 ),
1
untuk a ≤ x1 ≤ x2 ≤ b. Untuk menentukan λ, misalkan x1 = a dan x2 = b. Maka, P (a ≤ X ≤ b) = 1 = λ (b − a) ⇒ λ = 1/(b − a) Fungsi distribusinya: 0, F (x) = P (X ≤ x) = P (a ≤ X ≤ x) =
x−a , b−a
1,
x < a; x ∈ [a, b]; x > b.
Peubah acak X dikatakan berdistribusi Uniform, X ∼ U (a, b). Sifat-sifat fungsi distribusi: • F (−∞) = 0 dan F (∞) = 1 • F merupakan fungsi tidak turun; F (a) ≤ F (b) untuk a ≤ b • F adalah fungsi kontinu kanan; lim²→0+ F (x + ²) = F (x) Misalkan X peubah acak dengan fungsi distribusi F (x). • Jika b ≥ a, maka P (a < X ≤ b) = F (b) − F (a) • Untuk setiap x, P (X = x) = lim²→0+ P (x − ² < X ≤) = F (x) − F (x−) (Perhatikan notasi F (x−) dan kasus apabila fungsi distribusi kontinu kiri) Definisi: Distribusi dari peubah acak X dikatakan KONTINU jika fungsi distribusi disetiap x kontinu dan fungsi distribusi tersebut dapat diturunkan. Misalkan X peubah acak kontinu dengan fungsi distribusi FX (x). • Misalkan g(X) fungsi naik satu-satu kontinu. Untuk y yang berada di daerah hasil dari g, fungsi invers x = g −1 (y) ada. Misalkan Y = g(X). Fungsi distribusi dari Y adalah P (Y ≤ y) = P (g(X) ≤ y) = P (X ≤ g −1 (y)) = FX (g −1 (y)) • Misalkan g(X) fungsi turun satu-satu kontinu. Untuk y yang berada di daerah hasil dari g, fungsi invers x = g −1 (y) ada. Misalkan Y = g(X). Fungsi distribusi dari Y adalah P (Y ≤ y) = P (g(X) ≤ y) = P (X > g −1 (y)) = 1 − FX (g −1 (y)) MA3081 Stat.Mat.
2
K. Syuhada, PhD.
• Misalkan X ∼ U (0, 1) dan Y = g(X) = hX + k, h < 0. Maka X = g −1 (Y ) = FX (x) = FY (y) = Y ∼ Latihan: 1. Misalkan X peubah acak kontinu yang memiliki fungsi distribusi FX (x) yang naik murni. Misalkan Y = FX (X). Tentukan distribusi dari Y 2. Misalkan U peubah acak berdistribusi U (0, 1). Misalkan FX (x) fungsi distribusi yang naik murni dari X. Tentukan fungsi distribusi dari peubah acak FX−1 (U ) 3. Misalkan U1 , U2 , . . . , Un sampel acak dari U (0, 1). Bangkitkan sampel acak dari FX (x) (ambil contoh misalnya untuk FX (x) = 1 − e−λ x , x > 0) Misalkan X peubah acak kontinu dengan fungsi distribusi FX (x). Misalkan Y = g(X) fungsi kontinu tidak monoton. Kita ketahui bahwa pada fungsi yang monoton, FY (y) = P (Y ≤ y) = P (g(X) ≤ y) dimana dalam hal ini setiap solusi inverse x = g −1 (y) digunakan untuk menentukan FY (y) dengan menggunakan FX (g −1 (y)). Untuk X ∼ U (−1, 2) dan g(X) = Y = X 2 , kita dapatkan fungsi distribusi dari Y : FY (y) =
MA3081 Stat.Mat.
3
K. Syuhada, PhD.
1.2
Unsur Peluang
Misalkan X peubah acak kontinu, 4x bilangan positif kecil. Definisikan h(a, b) =def P (a ≤ X ≤ a + b) = FX (a + b) − FX (a) Untuk h(x, 4x) = P (x ≤ X ≤ x + 4x), maka deret Taylor-nya disekitar 4x = 0 adalah h(x, 4x) = F (x + 4x) − F (x) ¯ d = h(x, 0) + h(x, 4x) ¯4x=0 4x + o(4x) d4x = = dimana lim
4x→0
o(4x) =0 4x
Fungsi ·
¸ d dF (x) = F (x) 4x dx disebut DIFERENSIAL. Dalam statistika, diferensial dari fungsi distribusi adalah UNSUR PELUANG (yang merupakan pendekatan terhadap h(x, 4x)). d Unsur peluang adalah fungsi linier dari dx F (x). Contoh: Misalkan F (x) = 1 − e−3x untuk x ≥ 0. Apakah F (x) suatu fungsi distribusi? Hitung unsur peluang di x = 2. Cari pendekatan untuk P (2 ≤ X ≤ 2.01). Densitas rata-rata pada selang (x, x + 4x) didefinisikan: Density rata-rata =def
P (x ≤ X ≤ x + 4x) 4x
Sedangkan fungsi densitas peluang atau fungsi peluang (f.p) di x adalah limit
MA3081 Stat.Mat.
4
K. Syuhada, PhD.
densitas rata-rata saat 4x → 0: f.p = f (x) =def lim
4x→0
P (x ≤ X ≤ x + 4x) 4x
= = =
d F (x) dx
Catatan: Unsur peluang dituliskan sebagai dF (x) = f (x)4x. Sifat-sifat fungsi peluang: • f (x) ≥ 0 untuk semua x R∞ • −∞ f (x) = 1 Hubungan antara fungsi peluang dan fungsi distribusi: d F (x) dx Z x F (x) = f (u)du f (x) =
−∞
Z
b
P (a < X < b) = ... = ... = ... = F (b) − F (a) =
f (x)dx a
Latihan: 1. Misalkan λ bilangan riil positif. Jika F (x) = 1 − e−λx , maka f (x) = 2. Jika X ∼ U (a, b) maka F (x) = dan f (x) = 3. *Misalkan f (x) = c/(1 + x2R) untuk −∞ < x < ∞ dan c konstanta. ∞ Fungsi f (x) tak negatif dan −∞ (1 + x2 )−1 dx = π. Berapa nilai c agar f (x) menjadi fungsi peluag? Tentukan fungsi distribusinya. 4. *Pandang distribusi waktu tunggu. Misalkan T adalah waktu kedatangan kejadian ke-r dalam Proses Poisson dengan laju λ. Tentukan fungsi peluang dari T
MA3081 Stat.Mat.
5
K. Syuhada, PhD.
Misalkan X peubah acak kontinu dengan fungsi peluang f (x) dan Y = g(X) fungsi yang terdiferensial bernilai tunggal. Maka fungsi peluang dari Y : ¯ ¯ ¯ d −1 ¯ −1 fY (y) = fX (g (y)) ¯¯ g (y)¯¯ dy untuk ‘support’ Y = g(X). Komponen J(y) =
d −1 g (y) dy
adalah transformasi Jacobian. BUKTI: Misalkan g(x) memiliki lebih dari satu fungsi invers maka unsur peluang yang terpisah harus dihitung untuk setiap fungsi invers. Contoh, misalkan X ∼ U (−1, 2) dan Y = g(X) = X 2 . Maka untuk y ∈ [0, 1], terdapat 2 fungsi invers yaitu ?, dan satu fungsi invers untuk y ∈ (1, 4] yaitu ?. Fungsi peluang dari Y adalah: f (y) =
MA3081 Stat.Mat.
6
K. Syuhada, PhD.
1.3
Ekspektasi
Misalkan X peubah acak dengan fungsi peluang f (x). Nilai harapan dari X, jika ada, adalah Z ∞ E(X) = µX = f (x)dx −∞
Catatan: nilai ekspektasi dikatakan ada jika nilai integral adalah hingga. Misalkan X rv dengan pdf f (x). Maka nilai harapan dari g(X), jika ada, adalah Z ∞ E[g(X)] = g(x)f (x)dx −∞
. Operator integral bersifat linier. Jika g1 (X) dan g2 (X) fungsi-fungsi yang memiliki ekspektasi dan a, b, c konstanta, maka E[ag1 (X) + bg2 (X) + c] = aE[g1 (X)] + bE[g2 (X)] + c Contoh/Latihan: 1. Jika distribusi X simetrik di sekitar c dan nilai harapanny ada maka E(X) = c. Bukti: Z
∞
E(X − c) =
(x − c)f (x) dx Z−∞ c
=
Z
∞
(x − c)f (x)dx + −∞
Z
(x − c)f (x)dx c
Z
∞
∞
uf (c − u)du + uf (c + u)du =− 0 0 Z ∞ = u(f (c + u) − f (c − u)) du = 0 0
2. Misalkan X ∼ U (a, b). Tunjukkan bahwa distribusi tersebut simetrik disekitar (a + b)/2.
MA3081 Stat.Mat.
7
K. Syuhada, PhD.
Bukti: µ
¶ µ ¶ a+b a+b 1 f −δ =f +δ = 2 2 b−a £ ¤ untuk δ ∈ − b−a , b−a 2 2 3. Misalkan X berdistribusi Cauchy dengan fungsi peluang f (x) =
1 h i, 2 σπ 1 + (x−µ) 2 σ
dengan µ, σ konstanta yang memenuhi |µ| < ∞ dan σ ∈ (0, σ). Tunjukkan bahwa fungsi peluang simetrik di sekitar µ namun ekspektasinya bukanlah µ. 4. Misalkan X ∼ Exp(λ). Nilai harapan dari X adalah...
MA3081 Stat.Mat.
8
K. Syuhada, PhD.
1.4
Distribusi Bivariat
Suatu fungsi fX,Y (x, y) dikatakan fungsi peluang bivariat jika • fX,Y (x, y) ≥ 0, untuk semua x, y R∞ R∞ • −∞ −∞ fX,Y (x, y) dxdy = 1 Jika fX,Y (x, y) fungsi peluang bivariat maka Z x Z FX,Y (x, y) = P (X ≤ x, Y ≤ y) = −∞
y
fX,Y (u, v) dvdu −∞
Sifat-sifat fungsi distribusi bivariat: 1. FX,Y (x, ∞) = FX (x) 2. FX,Y (∞, y) = FY (y) 3. FX,Y (∞, ∞) = 1 4. FX,Y (−∞, y) = FX,Y (x, −∞) = FX,Y (−∞, −∞) = 0 5. fX,Y (x, y) =
∂2 ∂x∂y
FX,Y (x, y)
fX,Y (x, y)4x4y adalah unsur peluang bersama, P (x ≤ X ≤ x + 4x, y ≤ Y ≤ y + 4y) = fX,Y (x, y)4x4y + o(4x4y) Contoh/Latihan: 1. Jika (X, Y ) ∼ U (a, b, c, d) maka fX,Y (x, y) = 2. Untuk soal no 1 di atas, misalkan a = c = 0, b = 4, d = 6 maka P (2.5 ≤ X ≤ 3.5, 1 ≤ Y ≤ 4) = P (X 2 + Y 2 > 16) = 3. Jika fX,Y (x, y) = 6/5(x + y 2 ) untuk x ∈ (0, 1) dan y ∈ (0, 1). Tentukan P (X + Y < 1).
MA3081 Stat.Mat.
9
K. Syuhada, PhD.
Untuk menentukan fungsi peluang marginal, integralkan “peubah yang tidak diinginkan”: Z ∞ fX (x) = fX,Y (x, y) dy −∞
Z
∞
fY (y) =
fX,Y (x, y) dx −∞
Z
∞
Z
∞
fX,Y (x, y) =
fW,X,Y,Z (w, x, y, z) dwdz −∞
−∞
Pada fungsi peluang fX,Y (x, y) = 6/5(x + y 2 ) diperoleh fX (x) = fY (y) = dan nilai harapan Z
∞
Z
∞
g(x, y) fX,Y (x, y) dxdy =
E(g(X, Y )) = E(X) = −∞
MA3081 Stat.Mat.
−∞
10
K. Syuhada, PhD.
1.5
Distribusi Bersyarat
Misalkan fX,Y (x, y) adalah fungsi peluang bersama, maka fungsi peluang Y , diberikan X = x, adalah fY |X (y|x) =def
fX,Y (x, y) , fX (x)
asalkan fX (x) > 0. Contoh: Misalkan X dan Y memiliki distribusi bersama fX,Y (x, y) = 8xy, 0 < x < y < 1, maka fX (x) = E(X r ) = fY (y) = E(Y r ) = fX|Y (x|y) = fY |X (y|x) = E(X r |Y = y) = E(Y r |X = x) = Misalkan (X, Y ) adalah peubah acak berpasangan dengan fungsi peluang bersama fX,Y (x, y). Pandang persoalan memprediksi Y setelah X = x terobservasi. Prediktor dinotasikan sebagai yˆ(x). Prediktor terbaik didefinisikan sebagai fungsi Yˆ (X) yang meminimumkan h i2 Z ∞ Z ∞ ˆ E Y − Y (X) = (y − yˆ(x))2 fX,Y (x, y) dydx −∞
−∞
Prediktor terbaik adalah yˆ(x) = E(Y |X = x). BUKTI: Contoh/Latihan: 1. Misalkan X dan Y memiliki distribusi bersama fX,Y (x, y) = 8xy, 0 < x < y < 1, MA3081 Stat.Mat.
11
K. Syuhada, PhD.
maka fY |X (y|x) = yˆ(x) = 2. Misalkan (Y, X) berdistribusi normal bivariat dengan E(Y ) = µY , E(X) = 2 µX , V ar(Y ) = σY2 , V ar(X) = σX , Cov(X, Y ) = ρX,Y σX σY . Distribusi bersyarat Y , diberikan X, adalah (Y |X = x) ∼ 3. Tunjukkan bahwa h i EX fY |X (y|X) = fY (y) 4. Buktikan n h io h i EX E h(Y )|X = E h(Y ) 5. Buktikan h V ar(Y ) = EX
i h i V ar(Y |X) + V ar E(Y |X)
6. Misalkan X dan Y memiliki distribusi bersama fX,Y (x, y) =
3y 2 , 0
Maka fY (y) = E(Y r ) = · · · , E(Y ) = · · · , V ar(Y ) = · · · fX (x) = fY |X (y|x) = E(Y r |X = x) = · · · , E(Y |X = x) = · · · , V ar(Y |X = x) = · · · V ar(E(Y |X)) = E(V ar(Y |X)) =
MA3081 Stat.Mat.
12
K. Syuhada, PhD.
1.6
Fungsi Pembangkit Momen
Misalkan X peubah acak kontinu, fungsi pembangkit momen dari X adalah Z ∞ tX MX (t) = E(e ) = etx f (x)dx, −∞
asalkan ekspektasi ada untuk t disekitar 0. Jika semua momen dari X tidak ada, maka fungsi pembangkit momen juga tidak ada. Fungsi pembangkit momen berkaitan dengan fungsi pembangkit peluang MX (t) = GX (et ) asalkan GX (t) ada untuk t disekitar 1. Jika MX (t) adalah fungsi pembangkit peluang maka MX (0) = 1. Contoh/Latihan: 1. Jika fX (x) = λe−λx I0,∞ (x), maka MX (t) = 2. Jika MX (t) ada maka Ma+bX (t) = 3. Jika P Xi , i = 1, . . . , n saling bebas, MXi (t) ada untuk setiap i, dan S = Xi , maka MS (t) = 4. Fungsi pembangkit momen bersifat unik. Setiap distribusi memiliki fungsi pembangkit momen yang unik, dan setiap fungsi pembangkit momen berkorespondensi dengan tepat satu distribusi. Akibatnya, jika fungsi pembangkit momen ada maka fungsi pembangkit momen tersebut secara unik menentukan distribusinya. Beri contoh. 5. Pandang turunan dari MX (t) yang kemudian dievaluasi di t = 0. Apa yang dapat anda katakan? Dapatkah kita mendapatkan momen orde tinggi? 6. Dapatkah hasil diatas digunakan untuk distribusi diskrit? Ambil contoh distribusi Geometrik dengan parameter p.
MA3081 Stat.Mat.
13
K. Syuhada, PhD.
7. Misalkan Y ∼ U (a, b). Gunakan fungsi pembangkit momen untuk mendapatkan momen pusat µµ ¶r ¶ a+b 2 E((Y − µY ) ) = E Y − 2
MA3081 Stat.Mat.
14
K. Syuhada, PhD.
BAB 2 Distribusi Sampel, Likelihood dan Penaksir 2.1
Sampel Acak
Misalkan X1 , X2 , . . . , Xn sampel acak berukuran n (random sample of size n). Fungsi peluang n-variat nya adalah fX1 ,X2 ,··· ,Xn (x1 , x2 , . . . , xn ) =
n Y
fXi (xi )
i=1
Contoh/Latihan: 1. Misalkan X1 , X2 , . . . , Xn sampel acak dari distribusi Eksponensial dengan parameter θ. Fungsi peluang n-variatnya adalah... 2. Misalkan X1 , X2 , . . . , Xn sampel acak dari distribusi Uniform pada selang (a, b). Fungsi peluang n-variatnya adalah...
2.2
Likelihood
Misalkan fungsi peluang n-variat bergantung pada parameter yang tidak diketahui θ. Fungsi peluang tersebut ditulis sebagai fX1 ,X2 ,...,Xn (x1 , . . . , xn |θ1 , . . . , θk ) atau fX (x|θ) 1
Contoh/Latihan: 1. Misalkan X1 , X2 , . . . , Xn sampel acak dari distribusi N (µ, σ 2 ). Fungsi peluang n-variat yang bergantung pada parameternya ditulis sebagai... Definisi Fungsi likelihood adalah ukuran yang menyatakan sebarapa sering nilai θ, diberikan bahwa x telah terobservasi. Fungsi likelihood BUKAN suatu peluang. Fungsi likelihood diperoleh dengan (i) menukar peran θ dan x dalam fungsi peluang n-variat, dan (ii) membuang suku yang tidak bergantung pada θ. Notasi: L(θ) = L(θ|x) ∝ fX (x|θ) Contoh/Latihan: 1. Misalkan X1 , X2 , . . . , Xn sampel acak dari distribusi Eksponensial dengan parameter θ. Fungsi likelihoodnya adalah... function likefunction; % this function calculates the likelihood function of distribution % % created by K Syuhada, 14/3/2011 clear clc n = input(’n = ’); % size of random sample % data x = exprnd(0.5,n,1); sumx = sum(x); % parameter of exponential distribution lambda = 0.5:0.05:5; for i = 1:length(lambda) L(i) = (lambda(i)^n)*exp(-lambda(i)*sumx); end plot(lambda,L) MA3081 Stat.Mat.
2
K. Syuhada, PhD.
2. Misalkan X1 , X2 , . . . , Xn sampel acak dari distribusi Uniform pada selang (π, b). Fungsi likelihoodnya adalah... Prinsip Likelihood Jika dua percobaan, yang melibatkan model dengan parameter θ, memberikan likelihood yang sama, maka inferensi terhadap θ haruslah sama. Ilustrasi Pandang percobaan 1 dimana sebuah koin dilantunkan sebanyak n kali secara bebas. Misalkan p adalah peluang muncul MUKA dan X peubah acak yang menyatakan banyaknya MUKA yang muncul. Fungsi peluang dari X dan fungsi likelihoodnya adalah... Pandang percobaan 2 dimana sebuah koin dilantunkan hingga diperoleh MUKA sebanyak 6 kali secara bebas. Misalkan Y peubah acak yang menyatakan banyaknya lantunan yang dibutuhkan agar diperoleh enam MUKA. Fungsi peluang dari X dan fungsi likelihoodnya adalah... Dari 2 percobaan diatas, misalkan kita ingin melakukan uji hipotesis: H0 : p = 0.5 versus H0 : p < 0.5 Nilai signfikansinya atau p-value adalah... Penaksir Likelihood Maksimum Misalkan L(θ) adalah fungsi likelihood (fungsi dari parameter θ). Kita dapat menentukan nilai θ yang memaksimumkan L(θ). Penaksir untuk θ, yaitu θˆ disebut Penaksir Likelihood Maksimum (maximum likelihood estimator, MLE). Penaksir suatu parameter adalah fungsi dari peubah acak. Contoh/Latihan: 1. Diketahui sampel acak berukuran n dari distribusi Bernoulli (p). Fungsi likelihoodnya: L(θ) = θ
P
xi
(1 − θ)n−
P
xi
, 0 < θ < 1.
Untuk menentukan nilai θ yang memaksimumkan L(θ), transformasikan L(θ) menjadi log L(θ): X X `(θ) = log L(θ) = xi log(θ) + (n − xi ) log(1 − θ), kemudian hitung turunan pertama `(θ) terhadap θ: P P xi d`(θ) xi n − = − . dθ θ 1−θ MA3081 Stat.Mat.
3
K. Syuhada, PhD.
Normalisasi dari turunan pertama tersebut memberikan nilai P xi θ= , n yang mana sebagai penaksir ditulis sebagai berikut: P Xi ˆ ¯ θ= = X. n (Pr: Tunjukkan bahwa θ ini memaksimumkan L(θ) dengan menghitung turunan kedua). 2. Misalkan X1 , . . . , Xn sampel acak berdistribusi U (0, θ). Tentukan θ yang memaksimumkan L(0, θ). Dengan kata lain, tentukan penaksir θˆ untuk θ.
Sifat Penaksir ˆ kita dapat menentukan sifat baik peSetelah kita mendapatkan penaksir θ, naksir. Salah satunya adalah sifat TAK BIAS. Penaksir θˆ dikatakan tak bias apabila ˆ = θ. E(θ) Untuk contoh sampel acak Bernoulli, µ ¶ X1 + · · · + Xn ˆ E(θ) = E n 1 = E(X1 + · · · + Xn ) n ´ 1³ = E(X1 ) + · · · + E(Xn ) n 1 = (θ + · · · + θ) n =θ ¯ adalah penaksir tak bias untuk θ. Jadi, penaksir θˆ = X Catatan: Jika suatu penaksir θˆ bersifat bias maka selisih nilai ekspektasi dan nilai θ tidak nol, atau E(θˆ − θ) 6= 0.
MA3081 Stat.Mat.
4
K. Syuhada, PhD.
2.3
Statistic Cukup
Definisi -1 Suatu statistik T = t(X) adalah CUKUP atau sufficient untuk suatu keluarga distribusi fX (x|θ) JIKA dan HANYA JIKA fungsi likelihoodnya bergantung terhadap X hanya melalui T: L(θ) = h(t(X), θ) Definisi -2 Suatu statistik T = t(X) adalah CUKUP untuk suatu keluarga distribusi fX (x|θ) JIKA dan HANYA JIKA distribusi bersyarat dari X TIDAK BERGANTUNG pada θ: fX|T (x|t, θ) = h(x) Definisi -3 Suatu statistik T = t(X) adalah CUKUP untuk suatu keluarga distribusi fX (x|θ) JIKA dan HANYA JIKA fungsi peluangnya dapat difaktorkan sebagai: fX (x|θ) = g(t(x)|θ) h(x) Contoh/Latihan: 1. Misalkan Xi untuk i = 1, . . . , n saling P bebas dan berdistribusi identik Bernoulli(p). Tunjukkan bahwa Y = ni=1 Xi adalah statistik cukup. 2. Misalkan X1 , . . . , Xn sampel acak Pn berdistribusi Poisson dengan parameter λ. Tunjukkan bahwa T = i=1 Xi adalah statistik cukup. 3. Misalkan Xi untuk i = 1, . . . , n saling bebas dan berdistribusi identik ¯ adalah statistik cukup. N(µ, 1). Tunjukkan bahwa Y = X 4. Misalkan X1 , . . . , Xn sampel acak berdistribusi Gamma dengan paramPn eter (α, λ). Tunjukkan bahwa T = i=1 ln(Xi ) adalah statistik cukup. 5. Pandang sampel acak berukuran n dari U (a, b), dengan a diketahui. Tunjukkan bahwa T = X(n) adalah statistik cukup. 6. Pandang sampel acak berukuran n dari N (µ, σ 2 ), dengan µ, σ 2 tidak diketahui. Tunjukkan bahwa statistik T berikut adalah cukup: µ 2 ¶ SX T = ¯ X MA3081 Stat.Mat.
5
K. Syuhada, PhD.
2.4
Distribusi Sampel
Misalkan X1 , X2 , . . . , Xn sampel acak berukuran n dari distribusi Poisson dengan parameter λ. Peubah acak Xi , i = 1, . . . , n saling bebas dan berdistribusi identik dengan fungsi peluang n-variat: P (X = x) =
n Y e−nλ λy e−λ λxi = Qn , x ! x ! i i i=1 i=1
P P dengan y = xi . Dapat ditunjukkan juga Y = Xi cukup. Distribusi sampel dari Y adalah fY (y|θ) =
e−nλ (nλ)y . y!
Misalkan Xi ∼ U (0, θ). Peubah acak-peubah acak Xi tersebut saling bebas dan berdistribusi identik, dengan fungsi peluang: fX (x|θ) = Statistik T = X(n) cukup dan memiliki fungsi distribusi: P (X(n) ≤ x) = dan fungsi peluang: f(x) =
2.5
Statistik Terurut
Misalkan X1 , . . . , Xn sampel acak berukuran n dari suatu populasi yang berdistribusi tertentu, dengan fungsi peluang fX dan fungsi distribusi FX . Pandang X(k) , statistik terurut ke-k. Untuk menentukan fX(k) (x), pertama partisikan I1 = (−∞, x]; I2 = (x, x + dx]; I3 = (x + dx, ∞). Fungsi peluang fX(k) (x) adalah peluang mengamati sejumlah k − 1 dari X di I1 , tepat sebuah X di I2 , dan sejumlah n − k dari X di I3 : µ ¶ ¡ ¢k−1 ¡ ¢1 ¡ ¢n−k n FX (x) fX (x)dx 1 − FX (x) fX(k) (x) ≈ k − 1, 1, n − k
MA3081 Stat.Mat.
6
K. Syuhada, PhD.
yang dengan metode diferensial maka kita peroleh µ ¶ ¡ ¢k−1 ¡ ¢n−k n fX(k) (x) = FX (x) 1 − FX (x) fX (x) k − 1, 1, n − k Contoh/Latihan: 1. Fungsi peluang dari statistik terurut terkecil/terbesar adalah... 2. Statistik terurut ke-k pada distribusi U (0, 1) memiliki fungsi peluang...
2.6
Momen dari Mean dan Proporsi Sampel
2.7
Teorema Limit Pusat
Teorema Misalkan X1 , . . . , Xn sampel acak berukuran n dari populasi dengan mean µX 2 dan variansi σX . Distribusi dari Zn =
¯ − µX X √ σX / n
konvergen ke N (0, 1) untuk n → ∞. Catatan: • Hal penting dari Teorema Limit Pusat (Central Limit Theorem) adalah bahwa kekonvergenan dari Zn ke distribusi normal akan terjadi apapun bentuk distribusi dari X. • Kita dapat memanipulasi sedemikian hingga ¯ ∼ N (µX , σ 2 /n), X X asalkan n besar. • Ekspresi lain dari TLP adalah ¶ µ√ ¯ n (X − µX ) ≤ c = Φ(c) lim P n→∞ σX
MA3081 Stat.Mat.
7
K. Syuhada, PhD.
• Pandang: X1 + · · · + Xn , Ã n ! X E Xi = n µX , i=1
à V ar
n X
! 2 = n σX ,
Xi
i=1
µPn
lim P
n→∞
Xi − n µX √ ≤c n σX
i=1
¶ = Φ(c)
¯ berdistribusi normal? n = 1? • Seberapa besar n harus kita pilih agar X Bergantung pada distribusi dari data (parent distribution)! Misalkan X ∼ Exp(θ). Distribusi ini memiliki kemencengan (skewness) dan kelancipan (kurtosis): E(X − µX )3 p = 2, κ3 = 3 σX dan κ4 =
E(X − µX )4 − 3 = 6, 4 σX
2 ¯ berdistribusi Ga(n, nθ). dengan µX = 1/θ dan σX = 1/θ2 . Mean sampel X ¯ adalah Kemencengan (skewness) dan kelancipan (kurtosis) dari X
¯ − µX¯ )3 2 E(X p =√ , κ3 = 3 n σX dan κ4 =
¯ − µX¯ )4 E(X − 3 = 6/n, 4 σX
Perhatikan plot berikut:
MA3081 Stat.Mat.
8
K. Syuhada, PhD.
Misalkan X ∼ B(n, p) (ingat bahwa distribusi X tersebut sama dengan distribudi dari sejumlah n peubah acak Bernoulli(p)). Untuk n besar, µ ¶ p(1 − p) pˆ ∼ N p, n Ã√ ! n(c − p) P (ˆ p ≤ c) ≈ Φ p p(1 − p) X ∼ N (np, np(1 − p)) µ ¶ 1 1 P (X = x) = P x − ≤ X ≤ x + , x = 0, 1, . . . , n 2 2 à ! à ! x + 0.5 − np x − 0.5 − np ≈Φ p −Φ p , np(1 − p) np(1 − p) dimana menambah dan mengurangi dengan 0.5 disebut “continuity correction”. Koreksi kekontinuan untuk pendekatan normal terhadap fungsi distribusi dari X dan pˆ adalah µ ¶ 1 P (X ≤ c) = P X ≤ x + , x = 0, 1, . . . , n 2 ! à x + 0.5 − np ≈Φ p np(1 − p) dan µ
¶ 1 P (ˆ p ≤ c) = P pˆ ≤ c + , c = 0/n, 1/n, . . . , n/n 2n ! Ã√ n(c + 0.5/n − p) p ≈Φ p(1 − p)
MA3081 Stat.Mat.
9
K. Syuhada, PhD.
BAB 3 Penaksiran dan Selang Kepercayaan 3.1
“Sifat-sifat” (Kesalahan) penaksiran
Pada penaksiran parameter θ, misalnya, penaksir θˆ adalah fungsi peubah acak. Nilai taksirannya “TIDAK” akan pernah sama dengan nilai parameternya. Misalkan T = T (X) adalah penaksir untuk θ. Didefinisikan: bT = E(T − θ) = E(T ) − θ, dan V ar(T ) = σT2 = E(T − µT )2 = E(T ) − θ; µT = E(T ), adalah bias dan variansi dari penaksir T . Selain itu, didefinisikan pula, MSE atau Mean Square Error, MSET (θ) = E(T − θ)2 = V ar(T ) + b2T , Misalkan X1 , . . . , Xn sampel acak dari N (µ, σ 2 ). Penaksir untuk σ 2 adalah S2 =
n 1 X ¯ 2, (Xi − X) n − 1 i=1
dan/atau n 1 X ¯ 2, (Xi − X) V = n i=1
1
Bias and MSE dari kedua penaksir adalah bS 2 = · · · bV = · · · dan MSES 2 = · · · MSEV = · · · Catatan: Penaksir dari deviasi standar dari suatu penaksir disebut “standard error” atau SE. Apakah SE dari jenis pengambilan sampel (sampling): • Apapun asalkan tanpa pengembalian? • Bernoulli tanpa pengembalian?
3.2
Konsistensi
Salah satu sifat dari penaksir yang baik adalah sifat “tak bias”. Kita akan mempelajari sifat baik yang lain yaitu “konsisten”. Namun sebelumnya, perhatikan Ketaksamaan Chebyshev. Misalkan X peubah acak dengan fungsi peluang fX (x). Misalkan h(X) fungsi non-negatif dari X dan ekpektasinya ada serta k adalah konstanta positif. Maka P (h(X) ≥ k) ≤
E(h(X)) . k
Bukti: Aplikasi 1 Ketaksamaan Chebyshev. Misalkan E(X) = µX dan V ar(X) = 2 σX < ∞. Maka · ¸ |X − µX |2 1 2 ≥ k ≤ 2. P 2 σX k Bukti: Aplikasi 2 Ketaksamaan Chebyshev. Misalkan T peubah acak (penaksir dari parameter θ) dengan E(T ) = µT dan V ar(T ) = σT2 < ∞. Maka P [|X − θ| < ²] ≥ 1 −
MSEX (θ) . ²2
Bukti:
MA3081 Stat.Mat.
2
K. Syuhada, PhD.
Konsistensi Definisi: Barisan dari penaksir-penaksir, {Tn }, disebut KONSISTEN untuk θ jika lim P (|Tn − θ| < ²) = 1,
n→∞
untuk setiap ² > 0. Konvergen dalam Peluang Definisi: Barisan dari penaksir-penaksir, {Tn }, KONVERGEN dalam PELUANG untuk θ jika barisan tersebut konsisten untuk θ. Notasi: Tn →prob θ. Contoh/Latihan: ¯ adalah mean sampel dari suatu s.a 1. (Hukum Bilangan Besar) Jika X berukuran n dengan mean µX , maka ¯ →prob µX . X Bukti: 2. Sebuah penaksir untuk θ dikatakan “Mean Square Consistent” jika lim MSETn (θ) = 0.
n→∞
Buktikan bahwa jika sebuah penaksir memiliki sifat MSC maka penaksir tersebut konsiten.
3.3
Selang Kepercayaan
Misalkan Tn adalah penaksir untuk θ dan µ ¶ Tn − θ ≤ c = Φ(c). lim P n→∞ σTn Dengan kata lain, Tn ∼ N (θ, σT2n ),
MA3081 Stat.Mat.
3
K. Syuhada, PhD.
asalkan ukuran sampel cukup besar. Misalkan σT2n = ω 2 /n dan Wn2 adalah penaksir yang konsisten untuk ω 2 . Maka µ ¶ Tn − θ lim P ≤ c = Φ(c). n→∞ STn Dengan menggunakan distribusi (sampel besar) dari Tn , didapat µ ¶ Tn − θ P −zα/2 ≤ ≤ zα/2 ≈ 1 − α, STn yang dapat dimanipulasi shg ¡ ¢ P Tn − zα/2 STn ≤ θ ≤ Tn + zα/2 STn ≈ 1 − α. Selang acak diatas disebut selang kepercayaan 100(1−α)% sampel besar untuk θ. Selang disebut acak karena Tn dan STn adalah peubah acak. Contoh/Latihan: 2 1. Misalkan X1 , . . . , Xn s.a dari populasi dengan mean µX dan variansi σX . Jika sampel cukup besar, maka
¯∼ X 2 SX ¯ = 2 V ar(SX )=
Selang kepercayaan untuk µX adalah · · · ≤ µX ≤ · · · 2. Tentukan selang kepercayaan untuk proporso populasi, p, untuk s.a dari Bern(p).
3.4
Efisiensi
Ketaksamaan Cramer-Rao Misalkan peluang bersama X1 , . . . , Xn adalah fX (x|θ), dimana θ bersifat skalar dan support dari X tidak bergantung pada θ. Misalkan statistik T (X) adalah penaksir tak bias untuk fungsi (yang terdiferensial) dari θ; E(T ) = g(θ). Maka, dibawah kondisi regularitas sedang, V ar(T ) ≥
(∂g(θ)/∂θ)2 , Iθ
MA3081 Stat.Mat.
4
K. Syuhada, PhD.
dengan µ Iθ = E
∂ ln fX (X|θ) ∂θ
¶2 .
• Kuantitas Iθ disebut informasi Fisher dan merupakan indeks yang menyatakan banyaknya informasi yang dimiliki oleh X tentang θ. • Suku (∂g(θ)/∂θ)2 Iθ disebut Batas Bawah Cramer-Rao atau Cramer-Rao Lower Bound. Contoh/Latihan: 1. Misalkan sampel acak berukuran n dari P oi(λ). Apakah penaksir MLE untuk λ memuat/memenuhi/mencapai CRLB? 2. Pandang s.a dari eksponensial dengan mean 1/θ. Apakah penaksirnya mencapai CRLB? Efisiensi Efisiensi dari penaksir tak bias dari g(θ) adalah rasio dari CRLB terhadap variansi dari penaksir. Misalkan T penaksir tak bias untuk g(θ), maka efisiensi dari T adalah Efisiensi =
CRLB , V ar(T )
Jika rasio sama dengan satu, maka penaksir dikatakan efisien. Contoh/Latihan: 1. Misalkan sampel acak berukuran n dari Geo(p). Tentukan efisiensi dari penaksir untuk p. 2. Dapatkah kita mencari efisiensi dari penaksir parameter untuk sampel acak yang BUKAN keluarga eksponensial?
MA3081 Stat.Mat.
5
K. Syuhada, PhD.
BAB 4 Uji Hipotesis 4.1
Hipotesis, Statistik Uji dan P-value
Beberapa definisi: 1. Hipotesis, H0 dan H1 , adalah pernyataan tentang model peluang. Dapat juga dikatakan sebagai karakteristik populasi. H0 umumnya menyatakan tidak ada efek, tidak ada perbedaan dsb. H1 adalah lawan dari H0 . 2. Statistik uji adalah fungsi dari data θ0 . Statistik uji dipilih untuk membedakan H0 dengan H1 . Umumnya, statistik uji memuat penaksir dari θ. Statistik uji yang dikenal antara lain Z, t, χ2 . 3. Salah satu cara untuk mendapatkan statistik uji untuk menguji H0 : θ = θ0 versus H1 1-sisi atau 2-sisi adalah dengan menguji rasio likelihood LR =
L(θ0 |X) maxθ L(θ|X)
dimana memaksimumkan penyebut atas semua θ yang memenuhi H1 . LR adalah rasio dari peluang dari data dibawah H0 terhadap peluang terbesar yang mungkin dari data dibawah H1 . Nilai LR berada diantara nol dan satu. Nilai yang kecil diinterpretasikan sebagai bukti yang melawan H0 . 4. P-value adalah ukuran kekonsistenan antara data dan H0 . Didefinisikan: p − value = P (T > tobs |H0 ) dimana T adalah statistik uji dan tobs adalah realisasinya. Menghitung p-value untuk T > tobs dengan mengikuti arah H1 . 1
5. Kesalahan tentang p-value: 1. P-value yang besar adalah bukti untuk H0 2. P-value yang sangat kecil menunjukkan adanya efekyang besar/penting
4.2
Daerah Penolakan, Kesalahan dan Fungsi Kuasa
Beberapa definisi: 1. Misalkan data X1 , . . . , Xn . Daerah penolakan adalah himpunan nilainilai dari statistik uji yang menolak H0 . Daerah penerimaan adalah komplemen dari daerah penolakan. 2. Kesalahan: Tipe I: kesalahan menolak H0 yang benar Tipe II: kesalahan menerima H0 yang salah 3. Ukuran uji (test size): α = P (menolak H0 |H0 benar) 4. Kesalahan tipe II dan kuasa adalah, berturut turut, β = P (menerima H0 |H0 salah) dan 1 − β = P (menolak H0 |H0 salah) Contoh/Latihan: 1. Pandang uji H0 : p = 0.4 versus H1 : p 6= 0.4 berdasarkan sampel acak berukuran 10 dari Bernoulli(p). Misalkan Y = P Xi . Jika daerah kritisnya adalah menolak H0 jika Y ≤ 0 atau Y ≥ 8, maka ukuran uji-nya adalah α = 1 − P (1 ≤ Y ≤ 7|p = 0.4) = Sedangkan kesalahan tipe II dan kuasanya adalah β= MA3081 Stat.Mat.
2
K. Syuhada, PhD.
kuasa = Plot sbb: 2. Pandang Uji Z. Lakukan seperti hal diatas. Fungsi Kuasa Misalkan X1 , . . . , Xn sampel acak dari fX (x|θ). Misalkan ruang parameter θ adalah Θ. Misalkan Θ0 dan Θ1 adalah subruang dari Θ yang saling asing. Pandang uji H0 : θ ∈ Θ0 versus H1 : θ ∈ Θ1 . Fungsi kuasa adalah fungsi dari θ, didefinisikan sbg π(θ) = P (menolak H0 |θ), untuk semua θ ∈ Θ (meskipun biasanya digunakan saat θ ∈ Θ1 ). Contoh/Latihan: 1. Pandang uji H0 : µ = µ0 versus H1 : µ > µ0 berdasarkan sampel acak berukuran n dari N (µ, σ 2 ), dengan σ 2 diketahui. Uji satu sampel Z=
¯ − µ0 X √ σ/ n
akan menolak H0 jika Z > z1−α . Fungsi kuasanya adalah π(µ0 ) = (ilustrasikan untuk µ0 = 100, σ = 10, n = 25, α = 0.05. 2. Pandang uji proporsi dan lakukan seperti hal diatas.
4.3
Uji Paling Kuasa
Definisi: Hipotesis sederhana adalah hipotesis yang secara lengkap memberikan spesifikasi distribusi bersama dari data. Tidak ada parameter yang tidak diketahui
MA3081 Stat.Mat.
3
K. Syuhada, PhD.
dalam hipotesis sederhana. Contoh: H0 : Y ∼ B(25, 1/3). Definisi: Uji Paling Kuasa (Most Powerful Test) adalah suatu uji untuk H0 sederhana versus H1 sederhana dengan ukuran α yang mana tidak ada lagi uji lain dengan ukuran kurang dari sama dengan α yang memiliki kuasa lebih besar. Lema (Neyman-Pearson): Pandang uji H0 : X ∼ f0 (x), versus H1 : X ∼ f1 (x), dengan f0 dan f1 adalah fungsi peluang bersama dibawah H0 dan H1 . Uji paling kuasa adalah menolak H0 jika Λ(x) =
f0 (x)
adalah rasio likelihood. Ukuran uji-nya adalah Z α= f0 (x) dx, R
dengan R = {x : Λ(x) < K}. Contoh/Latihan: 1. Misalkan s.a X1 , . . . , Xn dari distribusi N B(k, θ), dengan k diketahui. Cari uji paling kuasa dari tes H0 : θ = θ0 versus H1 : θ = θ1 , dengan θ1 > θ0 . 2. Carilah uji paling kuasa untuk s.a dari distribusi eksponensial dengan mean 1/θ.
4.4
Uji Paling Kuasa Seragam
4.5
Uji Rasio Likelihood
MA3081 Stat.Mat.
4
K. Syuhada, PhD.