STATISTIK CUKUP
Oleh: Ramayanti Rizka M (121810101003), Deny Ardianto (121810101012), Ikfi Ulyawati (121810101023), Falviana Yulia Dewi (121810101026), Ricki Ditto Rosanda (121810101034), Nurma Yunita D (121810101035), Wulan Nitiastuti F. (121810101046), (*)
JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS JEMBER 2014
STATISTIK CUKUP Oleh: Ramayanti Riska M (121810101003), Deny Ardianto (121810101012), Ikfi Ulyawati (121810101023), Falviana Yulia Dewi (121810101026), Ricki Ditto Rosanda (121810101034), Nurma Yunita D (121810101035), Wulan Nitiastuti F. (121810101046), (*)
Statistic adalah sembarang nilai yang menjelaskan ciri suatu contoh. Parameter adalah sembarang nilai yang menjelaskan ciri populasi. Sedangkan pengertian populasi sendiri adalah keseluruhan pengamatan yang menjadi perhatian kita. Contoh adalah himpunan bagian dari populasi1. Informasi dalam sampel 𝑋 = (𝑋1 , 𝑋2 . . . , 𝑋𝑛 ) akan digunakan untuk melakukan inferensi tentang 𝜃. Data terobservasi 𝑥 = (𝑥1 , 𝑥2 . . . , 𝑥𝑛 ) merupakan daftar bilangan yang sukar untuk diinterpretasikan, sehingga akan dilakukan pendugaan melalui penghitungan statistik 𝑇(𝑋) yang merupakan fungsi dari sampel. Arti dari statistik sendiri adalah pendugaan parameter, sehingga ilmu yang mempelajari
pendugaan
𝑋1 ,. . . , 𝑋𝑛 ~ 𝑝 𝑥; 𝜃
parameter
dikenal
dengan
statistika.
Misal
, misal 𝑋 𝑛 ≡ (𝑋1 ,. . . , 𝑋𝑛 ), fungsi 𝑇 = (𝑋1 ,. . . , 𝑋𝑛 ) itu
sendiri adalah variabel acak yang akan kita namakan statistic. Statistik cukup untuk parameter 𝜃 adalah statistik dalam arti tertentu dapat menyerap semua informasi tentang 𝜃 yang termuat dalam sampel. Bila 𝑇(𝑋) adalah statistic cukup untuk 𝜃 maka setiap inferensi tentang 𝜃 harus tergantung pada sampel 𝑋 = (𝑋1 , 𝑋2 . . . , 𝑋𝑛 ) hanya melalui 𝑇(𝑋). Definisi : 𝐴𝑛𝑑𝑎𝑖𝑘𝑎𝑛 𝑋1 ,. . . , 𝑋𝑛 ~ 𝑝 𝑥; 𝜃 . 𝑇 𝑎𝑑𝑎𝑙𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑘 𝑐𝑢𝑘𝑢𝑝 𝑢𝑛𝑡𝑢𝑘 𝜃 𝑗𝑖𝑘𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑏𝑒𝑟𝑠𝑦𝑎𝑟𝑎𝑡 𝑑𝑎𝑟𝑖 𝑋1 ,. . . , 𝑋𝑛 | 𝑇 𝑡𝑖𝑑𝑎𝑘 𝑏𝑒𝑟𝑔𝑎𝑛𝑡𝑢𝑛𝑔 𝑝𝑎𝑑𝑎 𝜃. 𝐽𝑎𝑑𝑖,
𝑝 𝑥1 ,. . . , 𝑥𝑛 𝑡; 𝜃) = 𝑝 𝑥1 ,. . . , 𝑥𝑛 𝑡 ).
Ini berarti dapat mengganti 𝑋1 ,. . . , 𝑋𝑛 dengan 𝑇(𝑋1 ,. . . , 𝑋𝑛 ) ataupun 𝑇(𝑋) tanpa kehilangan informasi.
1
Ronald E. Walpole, Pengantar Statistika, PT Gramedia Pustaka Utama, Jakarta, 1992, hlm.
2-23.
Maksud dari definisi diatas yaitu : bila 𝑓 𝑥 𝜃) adalah densitas dari 𝑋 = (𝑋1 ,. . . , 𝑋𝑛 ) dan 𝑔 𝑇 𝑥 𝜃 ) adalah densitas dari
𝑇(𝑋), maka 𝑇 𝑋
adalah
statistik cukup untuk 𝜃 bila untuk setiap 𝑋 = (𝑋1 ,. . . , 𝑋𝑛 ) dalam ruang sampel , (𝑓 𝑥 𝜃 )
rasio =
𝑔 𝑇 𝑥 𝜃)
tidak bergantung pada 𝜃.
Contoh 1: Distribusi Poisson 𝑋1 ,. . . , 𝑋𝑛 ~ 𝑝𝑜𝑖𝑠𝑠𝑜𝑛 (𝜃 ). Misal 𝑇 =
𝑛 𝑖=1 𝑋𝑖
𝑝𝑋 𝑛 𝑇 𝑥 𝑛 𝑡 = ℙ 𝑋 𝑛 = 𝑥 𝑛 𝑇 𝑋 𝑛 = 𝑡) =
.
𝑃(𝑋 𝑛 = 𝑥 𝑛 𝑑𝑎𝑛 𝑇 = 𝑡) 𝑃(𝑇 = 𝑡)
Tetapi, 𝑃 𝑋 𝑛 = 𝑥 𝑛 𝑑𝑎𝑛 𝑇 = 𝑡 =
𝑇 𝑥1 ,. . . , 𝑥𝑛 ≠ 𝑡 0 𝑃 𝑋1 = 𝑥1 ,. . . , 𝑋𝑛 = 𝑥𝑛 𝑇 𝑥1 ,. . . , 𝑥𝑛 = 𝑡 𝑛
𝑛
𝑛
𝑃(𝑋 = 𝑥 ) = 𝑖=1
𝑇 𝑥𝑛 =
𝑛 𝑖=1
𝑒 −𝜃 𝜃 𝑥 𝑖 𝑒 −𝑛𝜃 𝜃 𝑛𝑖=1 𝑥𝑖 𝑒 −𝑛𝜃 𝜃 𝑡 = = 𝑥𝑖 ! (𝑥𝑖 !) (𝑥𝑖 !)
𝑥𝑖 = 𝑡
𝑒 −𝑛𝜃 (𝑛𝜃)𝑡 𝑃 𝑇=𝑡 = 𝑡! 𝑃(𝑋 𝑛 =𝑥 𝑛 ) 𝑃(𝑇=𝑡)
=
𝑡! ( 𝑥𝑖 )!𝑛 𝑡
yang tidak bergantung pada 𝜃. Jadi, 𝑇 =
𝑛 𝑖=1 𝑥𝑖
adalah
statistik cukup untuk 𝜃.
Contoh 2: Distribusi Bernaulli Misalkan 𝑋1 ,. . . , 𝑋𝑛 variabel random independent berdistribusi Bernaulli dengan parameter 𝜃, 0 < 𝜃 < 1 . akan ditunjukkan bahwa : 𝑇 𝑋 = 𝑋1 + 𝑋2 + . . . +𝑋𝑛 = 𝑛 𝑖=1 𝑋𝑖
adalah statistik cukup untuk 𝜃.
Penyelesaian : 𝑋𝑖 ~ 𝐵 1, 𝜃 densitas dari 𝑋𝑖 adalah : 𝑓 𝑥𝑖 𝜃) = 𝜃 𝑥 𝑖 (1 − 𝜃)1−𝑥 𝑖 dengan i=0,1 𝑓 𝑥𝑖 𝜃) = 𝑓 𝑥1 𝜃). 𝑓 𝑥2 𝜃) … . 𝑓 𝑥𝑛 𝜃) = 𝜃𝑥1 1 − 𝜃
1−𝑥 1
. 𝜃𝑥2 1 − 𝜃
1−𝑥 2
. . . 𝜃 𝑥𝑛 1 − 𝜃
1−𝑥 𝑛
= 𝜃
𝑛 𝑖=1 𝑥 𝑖
(1 − 𝜃)𝑛−
𝑛 𝑖=1 𝑥 𝑖
Fungsi pembangkit momen dari 𝑋𝑖 adalah 𝑀𝑋𝑖 (𝑡)= 𝜃𝑒 + 1−𝜃 𝑡
𝑛
𝑀
𝑥𝑖
= 𝑀𝑋1
𝑡
. 𝑀𝑋2
𝑡
. . . . 𝑀𝑋𝑛
𝑡
𝑖=1
= 𝜃𝑒 + 1 − 𝜃 . 𝜃𝑒 + 1 − 𝜃 … . . 𝜃𝑒 + 1 − 𝜃 = (𝜃𝑒 𝑡 + 1 − 𝜃 )𝑛 yang merupakan fungsi pembangkit momen dari distribusi binomial (𝑛 , 𝜃) 𝑛 𝑖=1 𝑥𝑖
Sehingga , 𝑇 𝑋 =
berdistribusi Binomial (𝑛 , 𝜃) 𝑛
𝑔 𝑇 𝑥 𝜃)=
.𝜃
𝑛 𝑖=1 𝑥𝑖
𝑛 𝑖=𝑖 𝑥 𝑖
(1 − 𝜃)𝑛−
𝑛 𝑖=1 𝑥 𝑖
Maka : (𝑓 𝑥 𝜃 ) = 𝑔 𝑇 𝑥 𝜃)
𝜃 𝑛
𝑛 𝑥 𝑖=1 𝑖
𝑛 𝑖=1 𝑥 𝑖
.𝜃
. (1 − 𝜃)𝑛− 𝑛 𝑥 𝑖=1 𝑖
𝑛 𝑖=1 𝑥 𝑖
. (1 − 𝜃)𝑛−
𝑛 𝑥 𝑖=1 𝑖
=
1 𝑛
𝑛 𝑋 𝑖=1 𝑖
yang tidak bergantung pada 𝜃. 𝑛 𝑖=1 𝑋𝑖
Jadi 𝑇 𝑋 =
adalah statistik cukup untuk 𝜃.
Contoh 3 : Distribusi Normal Misalkan 𝑋1 , 𝑋2 . . . , 𝑋𝑛 variabel random independent berdistribusi normal dengan rata-rata 𝜇 dan variansi 9. Akan ditunjukkan bahwa rata-rata sampel : 𝑇 𝑋 =
𝑛 𝑖=1 𝑋 𝑖
𝑛
adalah statistik cukup untuk 𝜇 .
Penyelesaian : 𝑋𝑖 ~ 𝑁 𝜇 , 9 maka densitas dari 𝑋𝑖 adalah : 𝑓 𝑥𝑖 𝜇) = 2𝜋
1 2
−
1
1
9−2 exp(− 2.9 𝑥𝑖 − 𝜇 2 )
𝑓 𝑥𝑖 𝜇) = 𝑓 𝑥1 𝜇). 𝑓 𝑥2 𝜇) … . 𝑓 𝑥𝑛 𝜇) = 2𝜋
1 2
−
1
1 2
−
𝜇 2 ) … 2𝜋 = 2𝜋
1 2
−
1
9−2 exp(− 2.9 𝑥1 − 𝜇 2 ). 2𝜋
1
1
1 2
−
1
1
9−2 exp(− 2.9 𝑥2 −
1
9−2 exp(− 2.9 𝑥𝑛 − 𝜇 2 ) 1
9−2 exp(− 18
𝑛 𝑖=1
𝑥𝑖 − 𝜇 2 )
Selanjutnya akan ditentukan densitas dari 𝑇 𝑋 yaitu 𝑔 𝑇 𝑥 𝜇).
x̅ =
𝑛 𝑖=1 𝑋 𝑖
𝑛
berdistribusi normal dengan rata-rata 𝜇 dan variansi 9/n 1 2
−
𝑔 𝑇 𝑥 𝜇) = 2𝜋
.
1
(𝑓 𝑥 𝜃 ) 𝑔 𝑇 𝑥
1
9 −2 𝑛 (𝑛 −1) 2
= 𝑛−2 2𝜋 𝜃)
−
1
exp(− 18 𝑛(x̅ − 𝜇)2 ) (𝑛 −1) 2
9−
1
𝑛 𝑖=1
exp(− 18 𝑛 𝑖=1 𝑋 𝑖
mengandung 𝜇 sehingga 𝑇 𝑋 = x =
𝑛
𝑥𝑖 − x̅ 2 ) bentuk ini sudah tidak
statistik cukup untuk 𝜇.
TEOREMA FAKTORISASI 𝐽𝑖𝑘𝑎 𝑇 𝑋 𝑛 𝑎𝑑𝑎𝑙𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑘 𝑐𝑢𝑘𝑢𝑝 𝑢𝑛𝑡𝑢𝑘 𝜃 , 𝑚𝑎𝑘𝑎 𝑓𝑢𝑛𝑔𝑠𝑖 𝑘𝑒𝑝𝑎𝑑𝑎𝑡𝑎𝑛 𝑝𝑒𝑙𝑢𝑎𝑛𝑔 𝑏𝑒𝑟𝑠𝑎𝑚𝑎 𝑑𝑎𝑟𝑖 𝑋 𝑛 𝑑𝑎𝑝𝑎𝑡 𝑑𝑖𝑓𝑎𝑘𝑡𝑜𝑟𝑘𝑎𝑛 𝑚𝑒𝑛𝑗𝑎𝑑𝑖 𝑝 𝑥 𝑛 ; 𝜃 = 𝑥 𝑛 𝑥 𝑔 𝑡; 𝜃 . Contoh 4: Misal 𝑋1 , 𝑋2 . . . , 𝑋𝑛 ~ 𝑝𝑜𝑖𝑠𝑠𝑜𝑛 . maka 𝑛
𝑒 −𝑛𝜃 𝜃 𝑖=1 𝑥 𝑖 𝑝 𝑥 ;𝜃 = = (𝑥𝑖 !) 𝑛
1 × 𝑒 −𝑛𝜃 𝜃 (𝑥𝑖 !)
𝑛 𝑖=1 𝑥 𝑖
Contoh 5: 𝑋1 , 𝑋2 . . . , 𝑋𝑛 ~ 𝑁 𝜇 , 𝜎 2 . maka 𝑛
𝑝 𝑥 ; 𝜇 ,𝜎
2
=
1 2𝜋𝜎 2
𝑛/2
(𝑥𝑖 − x ) 2 + 𝑛(x − 𝜇 ) 2 exp − 2𝜋𝜎 2
a) Jika 𝜎 diketahui : 𝑛
𝑝 𝑥 ; 𝜇
1 = 2𝜋𝜎 2
𝑛 2
exp −
𝑥𝑖 − x 2𝜋𝜎 2
2
exp −
𝑛 x − 𝜇 2𝜎 2
b) Jika (𝜇 , 𝜎 2 ) tidak diketahui : Maka 𝑇 = ( x , 𝑆2 ) adalah statistik cukup . jadi 𝑇 = ( 𝑋𝑖 , 𝑋𝑖 2 ) .
STATISTIK CUKUP MINIMAL ( minimal sufficient statistics )
Contoh 6:
𝑋1 , 𝑋2 . . . , 𝑋𝑛 ~ 𝑁 0 , 𝜎 2 . beberapa statistik cukupnya adalah : 𝑇 𝑋1 , 𝑋2 . . . , 𝑋𝑛
= (𝑋1 , 𝑋2 . . . , 𝑋𝑛 )
2
𝑇 𝑋1 , 𝑋2 . . . , 𝑋𝑛
= (𝑋1 2 , … 𝑋𝑛 2 ) 𝑚
𝑇 𝑋1 , 𝑋2 . . . , 𝑋𝑛
𝑛 2
=(
𝑋𝑖 2 )
𝑋𝑖 , 𝑖=1
𝑇 𝑋1 , 𝑋2 . . . , 𝑋𝑛
𝑖=𝑚+1
𝑋𝑖 2
=
T adalah statistik cukup minimal jika dua pernyataan dibawah ini benar : 1. T adalah statistik cukup 2. Jika U adalah statistik cukup yang lain maka T = g(U) untuk beberapa fungsi g. Contoh 7 : misal 𝑋1 , 𝑋2 , 𝑋3 ~ 𝑏𝑒𝑟𝑛𝑎𝑢𝑙𝑙𝑖(𝜃). Misal 𝑇 =
3 𝑖=1 𝑋𝑖
T
u
P(x| u )
(0, 0, 0)
t=0
1
U= 0
1
(0, 0, 1)
t=1
1/3
U=1
1/3
(0, 1, 0)
t=1
1/3
U=1
1/3
(1, 0, 0)
t=1
1/3
U=1
1/3
(0, 1, 1)
t=2
1/3
U=73
1/2
(1, 0, 1)
t=2
1/3
U=73
1/2
(1, 1, 0)
t=2
1/3
U=91
1
(1, 1, 1)
t=3
1
U=103
1
U dan T merupakan statistika cukup , tetapi U bukan statistik cukup minimal .
MENEMUKAN STATISTIK CUKUP MINIMAL Definisi :
𝑝(𝑦 𝑛 ; 𝜃) 𝑅(𝑥 , 𝑦 ; 𝜃) = 𝑝(𝑥 𝑛 ; 𝜃) 𝑛
𝑛
𝑅 𝑥 𝑛 , 𝑦 𝑛 ; 𝜃 𝑡𝑖𝑑𝑎𝑘 𝑏𝑒𝑟𝑔𝑎𝑛𝑡𝑢𝑛𝑔 𝑝𝑎𝑑𝑎 𝜃 𝑗𝑖𝑘𝑎 𝑑𝑎𝑛 𝑎𝑛𝑦𝑎 𝑗𝑖𝑘𝑎 𝑇 𝑦 𝑛 = 𝑇 𝑥 𝑛 . Maka T adalah statistic cukup minimal . Contoh 8 :
𝑌1 , 𝑌2 . . . , 𝑌𝑛 berdistribusi poisson (𝜃 )
𝑝 𝑦𝑛 ; 𝜃 =
𝑒 −𝑛𝜃 𝜃 𝑦𝑖
𝑦𝑖
,
𝑝(𝑦 𝑛 ; 𝜃) 𝜃 𝑦𝑖 − 𝑥𝑖 = 𝑝(𝑥 𝑛 ; 𝜃) 𝑦𝑖 ! 𝑥𝑖 !
Adalah independent pada 𝜃 jika 𝑇 𝑌𝑛 =
𝑦𝑖 =
𝑥𝑖 . secara tidak langsung
𝑦𝑖 adalah statistic cukup minimal untuk 𝜃.
Statistic cukup untuk 𝜃 tidak tunggal , setiap fungsi satu – satu dari statistic cukup untuk 𝜃 adalah juga statistic cukup untuk 𝜃. Sebagai contoh yang paling sederhana bila
𝑛 𝑖=1 𝑥𝑖
adalah statistic cukup untuk
merupakan statistik cukup untuk 𝜃 .
( )
* Corresponding author:
[email protected] afhadi.blog.unej.ac.id
maka
𝑛 𝑖=1 𝑥𝑖
/ 𝑛 juga