Prosiding Statistika
ISSN: 2460-6456
Taksiran Interval bagi Rata-rata Parameter Distribusi Poisson Interval Estimate for The Average of Parameter Poisson Distribution 1
Putri Anggita Nuraeni, 2Teti Sofia Yanti, 3Abdul Kudus
1,2,3
Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung, Jl. Tamansari No. 1 Bandung 40116 e-mail:
1
[email protected]
Abstract: Poisson distribution is one of the theoretical distributions for discrete random variables, which is a random variable using a number of experiments that occur within a certain time interval or in a particular area. The most often method used to establish the confidence interval for parameter Poisson distribution is the interval Wald, however according to Khamkong (2012) the method is not very accurate for Poisson distribution for a small to medium average of parameters, as well as for a small to moderate sample size. This research paper will discuss some preparation methods of the confidence interval for the Poisson distribution parameters and the methods will be applied to the real data and simulation. Keyword: poisson distribution, confidence interval, score confidence, wald confidence
Abstrak: Distribusi Poisson adalah salah satu distribusi teoritis untuk variabel acak diskrit, yaitu variabel acak yang menggunakan banyaknya hasil percobaan yang terjadi dalam suatu interval waktu tertentu atau dalam suatu area tertentu. Metode yang paling sering digunakan untuk membentuk selang kepercayaan bagi distribusi parameter Poisson adalah interval Wald akan tetapi menurut Khamkong(2012) metode
tersebut tidak terlalu akurat digunakan untuk kasus distribusi Poisson dengan parameter rata-rata yang kecil sampai sedang, begitu juga untuk kasus ukuran sampel kecil sampai sedang. Dalam makalah ini akan dibahas beberapa metode penyusunan selang kepercayaan untuk parameter distribusi Poisson dan metode tersebut akan diaplikasikan pada data riil maupun simulasi. Kata kunci : distribusi Poisson, confidence interval, score confidence, wald confidence.
217
218 |
Putri Anggita Nuraeni, et al.
A.
Pendahuluan
Statistika inferensial adalah teknik analisis data yang digunakan untuk menentukan sejauh mana kesamaan antara hasil yang diperoleh dari suatu sampel dengan hasil yang akan didapat pada populasi secara keseluruhan. Jadi statistik inferensial membantu peneliti untuk mencari tahu apakah hasil yang diperoleh dari suatu sampel dapat digeneralisasi pada populasi. Melalui sampel yang diambil dari populasi kita berusaha membuat kesimpulan tentang populasi yang bersangkutan. Caranya adalah dengan melakukan percobaan atau penelitian terhadap sampel sehingga diperoleh ukuran-ukuran sampel (besaran statistik) lalu dari statistik kita tarik kesimpulan tentang ukuran-ukuran populasi (besaran parameter). Salah satu ukuran yang dapat dicari adalah rata-rata. Rata-rata sampel ( X ) dapat digunakan untuk menaksir rata-rata populasi ( ). Taksiran tersebut bisa berupa taksiran titik (satu nilai) ataupun taksiran interval (banyak nilai). Taksiran interval rata-rata digambarkan dalam suatu selang kepercayaan rata-rata yang merupakan rentang perkiraan nilai-nilai yang kemungkinan akan mencakup parameter populasi yang tidak diketahui. Makin lebar selang taksiran, maka derajat kepercayaan yang diperoleh makin tinggi akan tetapi hasilnya kurang bisa menduga nilai yang sebenarnya. Dalam praktiknya harus dicari interval taksiran yang sempit dengan derajat kepercayaan yang tinggi. Selang kepercayaan ini banyak diaplikasikan pada data yang mengacu pada jumlah kejadian pada interval tertentu seperti jarak, waktu, wilayah atau ruang. Beberapa contoh data tersebut adalah data jumlah korban kecelakaan per minggu, jumlah kendaraan yang masuk tol per hari, dan lain-lain. Distribusi poisson adalah model standar dan baik untuk menganalisis data cacahan (count) dan tampaknya menjadi yang paling umum dan sering digunakan. Distribusi poisson adalah distribusi peluang acak poisson X yang menyatakan banyaknya sukses yang terjadi dalam suatu selang waktu atau daerah tertentu. Bila variabel acak ini nilainya besar, maka perhitungan peluang dari variabel acak ini akan sulit. Namun dengan adanya teorema limit pusat maka bisa dilakukan pendekatan normal terhadap distribusi poisson. Tetapi jika variabel acak ini nilainya kecil sampai sedang maka pendekatan Normal tersebut kurang baik, sehingga dibutuhkan koreksi kontinuitas. Khamkong (2012) menjelaskan bahwa banyak metode yang dapat digunakan untuk menentukan selang kepercayaan distribusi Poisson, diantaranya adalah Wald Interval, Score Confidence interval (SC), Moved Score Confidence interval (MSC), dan The Wald interval with Continuity Correction interval (WCC). Akan tetapi metode-metode tersebut tidak terlalu akurat digunakan untuk kasus parameter rata-rata yang kecil sampai sedang, begitu juga untuk kasus ukuran sampel kecil sampai sedang. Oleh karena itu dalam skripsi ini akan dibahas metode baru yang disebut metode Adding the tail probability of the Wald Confidence interval (AWC) yang diajukan oleh Khamkong (2012). Metode ini mempunyai kinerja yang baik untuk kasus dengan ukuran sampel dan nilai parameter rata-rata dari kecil sampai sedang.
Volume 2, No.2, Tahun 2016
Taksiran Interval bagi Rata-rata Parameter...| 219
B.
Landasan Teori
Distribusi Poisson Distribusi Poisson adalah distribusi teoritis yang memakai variabel acak diskrit, yaitu banyaknya hasil percobaan yang terjadi dalam suatu interval waktu tertentu atau dalam suatu area tertentu. Ciri-ciri dari distribusi Poisson adalah: 1. Banyaknya hasil percobaan yang satu tidak tergantung dari banyaknya hasil percobaan yang lain. 2. Probabilitas hasil percobaan sebanding dengan panjang interval waktu atau luas area tertentu, 3. Probabilitas lebih dari satu hasil percobaan yang terjadi dalam interval waktu yang singkat atau dalam area yang kecil dapat diabaikan. Distribusi poisson digunakan dalam : 1. Menghitung probabilitas terjadinya peristiwa menurut satuan waktu, ruang atau isi, luas, panjang seperti : Banyaknya penggunaan telepon per menit, banyaknya kesalahan ketik per halaman sebuah buku, banyaknya mobil yang lewat selama 5 menit di suatu ruas jalan, dsb. 2. Menghitung distribusi binomial apabila n besar (n 30) dan p relatif kecil ( p 0.1) . Fungsi massa peuang dari distribusi poisson adalah : P( X x) f ( x)
e x x!
(2.1)
Dengan rata-rata dan variannya masing-masing adalah
E( X ) x x 0
e x x!
E( X ) 0 x x 1
e x x( x 1)!
e ( ) x 1 E( X ) ( x 1)! x 1
E ( X ) e x 1
x 1 ( x 1)!
dan V ( X ) E( X 2 ) (E( X ) 2 ) V ( X ) 2 2 V (X )
.
Misalkan 𝑋1 , 𝑋2 , … , 𝑋𝑛 adalah suatu sampel acak berukuran n dari distribusi Poisson dengan parameter λ. Penaksir kemungkinan maksimum untuk λ dari distribusi Poisson adalah n
1 ˆ X X i n x 1
(2.2)
The Wald Confidence Interval Interval wald merupakan metode yang paling sederhana dan paling banyak digunakan untuk menentukan selang kepercayaan bagi distribusi poisson. Metode ini dilakukan dengan cara pendekatan pada distribusi normal dari distribusi poisson. Statistika, Gelombang 2, Tahun Akademik 2015-2016
220 |
Putri Anggita Nuraeni, et al.
Dari distribusi poisson(λ) ditarik sampel acak berukuran n yakni {X1, X2, ..., Xn}. Pendekatan normal baku untuk selang kepercayaan rata-rata poisson dibentuk berdasarkan teori limit pusat Wald. Interval untuk rara-rata diberikan oleh : X Z / 2
X , n
dimana X X i , dan Z / 2 adalah kuantil (1 n
2
) persen dari distribusi normal baku.
Selang Wald kemudian dikoreksi dengan The Wald interval with continuity correction interval (WCC) didefinisikan sebagai . X Z / 2
X 0,5 . n
(2.3)
Score Confidence Interval Score interval yang dikemukakan oleh Rao 1973. Barker ( 2002) memperbaiki metode tersebut dan dia memberikan batas-batas score interval untuk distribusi poisson adalah sebagai berikut, Z2 X / 2 Z 2 / 2 2n
X
Z 2 / 2 4n n
(2.4)
.
Moved Score Confidence Interval Moved Score Interval sebenarnya hampir sama dengan Score Interval, akan tetapi metode ini lebih baik untuk kasus dengan parameter rata-rata bernilai sedang. Moved Score Interval untuk rata-rata μ didefinisikan sebagai : X
0,46Z n
2 2
X
Z 2 2 4n
(2.5)
.
n
Adding the tail probability of the Wald Confidence interval Interval Wald dapat ditingkatkan kinerjanya melalui penambahan peluang ekor 2 untuk ukuran sampel kecil dengan faktor penyesuaian sebesar c z / 2 . Misalkan 2n
X1,X2,...,Xn adalah saling bebas dan didistribusikan identik variabel acak berukuran n 2 dipilih dari distribusi Poisson dengan rata-rata dan c z / 2 . Lalu EX c c dan
V X c n 1 , dan melalui teori limit pusat didapat
2n n X
D N 0,1 dimana
n . Selang kepercayaan untuk rata-rata Poisson yang dinamakan adding the tail probability of the Wald interval (AWC) sebagai berikut : X
z2 / 2 X. z / 2 2n n
Volume 2, No.2, Tahun 2016
(2.6)
Taksiran Interval bagi Rata-rata Parameter...| 221
Selang kepercayaan untuk rata-rata dengan tingkat kepercayaan nominal 1 100% mempunyai peluang cakupan bagi nilai tetap sebesar
CP I L( i ) U ( i ) i 0
e i . i!
(2.7)
dimana I merupakan fungsi indikator. Demikian pula lebar yang diharapkan dari setiap selang kepercayaan adalah
EW U (i) L(i) i 0
e i i!
.
(2.8)
Untuk persamaan (2.7) dan (2.8) akan digunakan pada proses simulasi monte carlo untuk menentukan metode terbaik. C.
Hasil dan Pembahasan
Hasil Simulasi Selang Kepercayaan Rata-rata Distribusi Poisson Dilakukan simulasi untuk menentukan selang kepercayaan rata-rata distribusi Poisson yang dilakukan dalam 20 skenario yaitu dengan ukuran sampel, n, sebesar 15, 25, 50, 100 dan parameter λ= 1, 1.5, 3, 5, 10. Dengan bantuan software R maka didapat hasil seperti pada tabel 3.1. Pada tabel 3.1 dipilih nilai CP (Coverage Probability) yang mendekati nilai maksimum 95% atau nilai EW (Estimation Width) yang paling kecil. Metode yang memenuhi kriteria tersebut dikatakan metode terpilih untuk membentuk selang kepercayaan rata-rata distribusi Poisson. Tabel 3.1 Tabel Hasil Simulasi CP N
15
25
50
100
λ 1 1,5 3 5 10 1 1,5 3 5 10 1 1,5 3 5 10 1 1,5 3 5 10
WCC 0,97832 0,97268 0,96388 0,95196 0,9508 0,98444 0,97324 0,96434 0,95976 0,95176 0,98542 0,9737 0,96518 0,95872 0,95508 0,98494 0,97408 0,9629 0,95976 0,95484
SC 0,99268 0,9941 0,99858 0,9991 0,9994 0,99668 0,99752 0,99904 0,99912 0,9997 0,99838 0,9992 0,99944 0,99964 0,99972 0,99922 0,9995 0,99958 0,99974 0,99982
EW MSC 0,58516 0,65578 0,66242 0,67718 0,6861 0,67916 0,66302 0,67644 0,6874 0,6826 0,68758 0,6773 0,6844 0,68152 0,68536 0,66222 0,68316 0,68256 0,68098 0,67794
AWC 0,87938 0,89864 0,91846 0,93484 0,9438 0,90492 0,9287 0,93632 0,94366 0,94658 0,92902 0,93576 0,94276 0,9472 0,94748 0,9424 0,94284 0,94552 0,94762 0,949
WCC 1,234829 1,426723 1,88929 2,370124 3,277174 0,9579873 1,106661 1,464842 1,827049 2,539374 0,6782195 0,7833155 1,036501 1,299588 1,796097 0,4798364 0,5541397 0,733171 0,9191826 1,270094
SC 2,030473 2,467717 3,462413 4,456364 6,288068 1,558331 1,899847 2,67397 3,445654 4,866342 1,094319 1,337193 1,886455 2,433113 3,438743 0,7710569 0,9432881 1,33241 1,719341 2,430529
MSC 0,5285489 0,6423669 0,9012945 1,160028 1,636836 0,4056462 0,4945458 0,6960563 0,8969319 1,266749 0,2848601 0,3480823 0,4910597 0,6333592 0,8951331 0,2007124 0,2455456 0,3468372 0,4475586 0,6326867
AWC 1,003226 1,232412 1,747768 2,259136 3,197942 0,7799201 0,9569686 1,355559 1,751244 2,478063 0,5552987 0,6778867 0,9594004 1,239002 1,752777 0,3915114 0,4797312 0,6787137 0,8763629 1,239471
Statistika, Gelombang 2, Tahun Akademik 2015-2016
222 |
Putri Anggita Nuraeni, et al.
Dari tabel 3.1 terlihat menurut kriteria CP (Coperage Probability) dengan hasil mendekati nilai maksimum 95% dan berdasarkan kriteria EW(estimation width)dengan hasil nilai yang paling kecil untuk kasus parameter rata-rata yang kecil sampai sedang, begitu juga untuk kasus ukuran sampel kecil sampai sedang diperoleh melalui metode AWC dan MSC. Menentukan Selang Kepercayaan Rata-rata Untuk Data Riil Berdasarkan hasil dari simulasi metode yang baik digunakan berdasarkan hasil dari CP dan EW adalah metode AWC dan MSC. Jadi untuk menentukan selang kepercayaan rata-rata bagi data Frekuensi klaim kendaraan bermotor di Indonesia tahun 2011 akan ditentukan melalui kedua metode tersebut. Untuk langkah awal didapat rata-rata dati frekuensi klaim 229 X 0,11073501 Z 1,96 . 2068 dengan 5% maka / 2 Berdasarkan persamaan (2.5) dan (2.6) selang kepercayaan rata-rata bagi data frekuensi klaim kendaraan bermotor di Indonesia tahun 2011 diperoleh hasil sebagaimana terlihat pada tabel 4.3. Tabel 4.3.Selang Kepercayaan Rata-rata Frekuensi Klaim Kendaraan Bermotor Di Indonesia Tahun 2011 Berdasarkan MSC dan AWC
METODE MSC
Batas Atas Batas Bawah EW
METODE AWC
0,118922428
0,126006278
0,10425662
0,097321382
0,014665808
0,028684896
Dari hasil diatas diketahui bahwa untuk data frekuensi klaim kendaraan bermotor di Indonesia tahun 2011 metode yang mendapatkan hasil yang paling baik diperoleh melalui metode Moved Score Confidence interval (MSC). D.
Kesimpulan
Dalam makalah ini selang kepercayaan rata-rata distribusi Poisson dibentuk melalui proses simulasi juga dengan data riil. Hasil simulasi menunjukan bahwa untuk kasus kasus parameter rata-rata yang kecil sampai sedang, begitu juga untuk kasus ukuran sampel kecil sampai sedang hasil yang paling baik diperoleh melalui metode Adding the tail probability of the Wald Confidence interval (AWC) dan Moved Score Confidence interval (MSC) yang dilihat berdasarkan CP dan EW. Untuk data frekuensi klaim kendaraan bermotor di Indonesia tahun 2011 hasil yang paling baik diperoleh melalui metode MSC dengan EW=0,01466.
Volume 2, No.2, Tahun 2016
Taksiran Interval bagi Rata-rata Parameter...| 223
Daftar Pustaka Khamkong, Manad. (2012), Approximate Confidence Interval for the Mean of Poisson Distribution, American Open Journal of Statistics, 2, 204-207. T. T. Cai. (2005), One-Sided Confidence Intervals in Discrete Distributions, Journal of Statistical Planning and Inference, 131, 63-88. Y. Guan. (2001), Moved Score Confidence Intervals for Means of Discrete Distributions, American Open Journal Statistics, 1, 81-86. L. A. Barker. (2002), Comparison of Nine Confidence Intervals for a Poisson Parameter When the Expected Number of Events Is ≤5, The American Statistician, 56, 8589.
Statistika, Gelombang 2, Tahun Akademik 2015-2016