BAB III SIMULASI PENGGUNAAN PERTIDAKSAMAAN PADA DISTRIBUSI
BAB III SIMULASI PENGGUNAAN PERTIDAKSAMAAN PADA DISTRIBUSI 3.1 Pendahuluan
Pada bab sebelumnya telah dibahas mengenai pertidaksamaan Chernoff dengan terlebih dahulu diberi pemaparan mengenai dua pertidaksamaan yang sudah cukup sering dipergunakan yaitu pertidaksamaan Markov dan pertidaksamaan Chebyshev. Telah disebutkan bahwa pertidaksamaan Chernoff memberikan batas yang paling dekat dengan nilai sebenarnya.
Untuk membandingkan batas yang dihasilkan oleh ketiga pertidaksamaan tersebut pada suatu populasi dapat dilakukan sebuah simulasi. Simulasi dilakukan dengan mengenerate data untuk sebuah distribusi kemudian menghitung nilai peluang suatu selang tertentu dengan menggunakan frekuensi relatif yang dihitung dari data tersebut (tanpa melihat distribusinya). Hasil perhitungan secara eksak akan dibandingkan dengan hasil perhitungan dengan menggunakan ketiga bentuk pertidaksamaan. Berikut ini hasil simulasi untuk distribusi binomial dan distribusi normal:
3.2 Simulasi untuk Distribusi Binomial
Pada simulasi pertama untuk suatu data berdistribusi binomial (10, 0.30) di-generate sebanyak 300 data, sebagai berikut
X 0 1 2 3 4
Frekuensi
frekuensi relatif
9 29 64 73 70
0.03 0.097 0.213 0.243 0.233
Frekuensi relatif komulatif 0.03 0.127 0.34 0.583 0.817
hampiran peluang binomial (10, 0.3) (sumber: Walpole) 0.0282 0.1493 0.3828 0.6496 0.8497
24
BAB III SIMULASI PENGGUNAAN PERTIDAKSAMAAN PADA DISTRIBUSI
X 5 6 7 8
frekuensi relatif 0.11 0.06 0.01 0.003
Frekuensi 33 18 3 1
Frekuensi relatif komulatif 0.927 0.987 0.997 1 Tabel 8
hampiran peluang binomial (10, 0.3) (sumber: Walpole) 0.9527 0.9894 0.9984 0.9999
Data Simulasi 1
Distribusi penyebaran data simulasi 1 tersebut dapat digambarkan dalam histogram berikut:
Histogram Data Simulasi 1 80 70
frekuensi
60 50 40 30 20 10 0 1
2
3
4
5
6
7
8
9
x
Gambar 1 Histogram Data Simulasi 1
selain itu statistik dari data tersebut dapat disajikan sebagai berikut : Univariate Statistics Variable 1 Count Sum Average Median Mode Minimum Maximum Range Standard Deviation
300 958 3.19 3 3 0 8 8 1.516
25
BAB III SIMULASI PENGGUNAAN PERTIDAKSAMAAN PADA DISTRIBUSI
2.297 0.191
Variance Skewness
-0.185
Kurtosis Tabel 9
Tabel Informasi Statistik untuk Data Simulasi 1
Dari informasi di atas dapat dilihat bahwa range data cukup besar. Hal ini juga menyebabkan data tersebar cukup luas. Titik puncak dari data berada di sekitar rataan, sehingga kemiringan dari grafik data pun cukup kecil.
Dalam melakukan simulasi penggunaan pertidaksamaan pada distribusi data ini diambil nilai peluang salah satu selang yaitu P( X ≥ 4) . Nilai peluang secara eksak dapat dihitung dengan menggunakan frekuensi relatifnya
P ( X ≥ 4) = 1 − P( X < 4) = 1 − [ P ( X = 3) + P( X = 2) + P( X = 1) + P( X = 0)] = 0.417
(3.2)
Kemudian dengan menggunakan pertidaksamaan dapat diperoleh hasil sebagai berikut Pertidaksamaan Markov: P ( X ≥ 4) ≤
E[ X ] 3.19 = = 0.7975 4 4
(3.3)
Pertidaksamaan Chebyshev: P ( X − 3.19 ≥ 0.81) ≤ P ( X − 3.19 ≥ 0.81) ≤
σ2 σ 2 + (0.81) 2 2.297 2,297 + 0.6561
(3.4)
P ( X ≥ 4) ≤ 0.77 Dalam menghitung batas atas pertidaksamaan Chernoff P ( X ≥ 4) terdapat sedikit kesulitan dalam mencari bentuk fungsi pembangkit momen hampirannya. Perlu bantuan komputer dalam mencari fungsi tersebut. Fungsi pembangkit momen hampirannya tersebut
dihitung
dengan
menggunakan
komputasi
sehingga
didapatkan
hasil
pertidaksamaan Chernoff sebagai berikut:
P ( X ≥ 4) ≤ 0.724
(3.5)
26
BAB III SIMULASI PENGGUNAAN PERTIDAKSAMAAN PADA DISTRIBUSI
Dari simulasi data yang terdistribusi binomial (10, 0.30) ini dapat ditunjukkan bahwa pertidaksamaan Chernoff menghasilkan batas yang paling baik, mendekati nilai sebenarnya. Hal ini bisa diakibatkan karena jumlah datanya yang cukup banyak atau karena penyebaran datanya yang cukup besar. Simulasi lain dilakukan untuk beberapa nilai p, misalnya untuk p=0.5 dengan data sebagai berikut :
Frekuensi
X
frekuensi relative
1 2 3 4 5 6 7 8 9
3 22 64 109 135 96 47 17 6
0.006 0.044 0.128 0.218 0.27 0.192 0.094 0.034 0.012
10
1
0.002
Tabel 10 Tabel Data Simulasi Binomial (10, 0.5)
Pertidaksamaan Chernoff juga memberikan batas yang paling akurat pada simulasi ini. Simulasi lain juga dilakukan untuk distribusi dari peubah acak kontinu, yaitu distribusi normal. Hasil simulasi tersebut dapat dilihat sebagai berikut
3.3 Hasil Simulasi untuk Distribusi Normal
Pada simulasi pertama untuk distribusi normal di-generate data sebanyak 200 dengan mean ( µ ) = 7 dan standar deviasi (σ ) =2
nilai tengah
Frekuensi
2.00-3.00 3.00-4.00 4.00-5.00 5.00-6.00 6.00-7.00
2.5 3.5 4.5 5.5 6.5
6 7 21 33 43
0.03 0.035 0.105 0.165 0.215
0.03 0.065 0.17 0.335 0.55
7.00-8.00
7.5
37
0.185
0.735
Selang
Frekuensi relative
frekuensi relative komulatif
27
BAB III SIMULASI PENGGUNAAN PERTIDAKSAMAAN PADA DISTRIBUSI
nilai tengah
Frekuensi
8.00-9.00
8.5
20
0.1
0.835
9.00-10.00
9.5
19
0.095
0.93
10.00-11.00
10.5
10
0.05
0.98
11.00-12.00
11.5
4
0.02
1
Selang
Frekuensi relative
frekuensi relative komulatif
Tabel 11 Data Simulasi 2
Data mentah untuk simulasi ini dapat dilihat pada lampiran C. Distribusi penyebaran data simulasi 2 tersebut dapat digambarkan dalam histogram berikut:
12.482112
11.714424
10.946736
10.179047
9.411359
8.643671
7.875982
7.108294
6.340606
5.572917
4.805229
4.037541
3.269852
2.502164
50.0 40.0 30.0 20.0 10.0 0.0 1.734476
frekuensi
Histogram Data Simulasi 2
x
Gambar 2 Histogram Data Simulasi 2
Dengan statistik yang diperoleh dari data tersebut sebagai berikut :
Univariate Statistics Variable 1 Count Sum Average
200 1,382.3916 6.911958
Median
6.8740
Minimum
2.1020
Maximum
11.7450
28
BAB III SIMULASI PENGGUNAAN PERTIDAKSAMAAN PADA DISTRIBUSI
9.6430
Range Standard Deviation
1.9513442
Variance
3.8077442 0.103
Skewness
-0.150
Kurtosis Tabel 12
Tabel Informasi Statistik Data Simulasi 2
Dari informasi di atas dapat diketahui bahwa range data cukup besar. Hal ini juga menyebabkan data tersebar cukup luas. Titik puncak dari data berada di sekitar rataan, sehingga kemiringan dari grafik data pun cukup kecil.
Dalam melakukan simulasi penggunaan pertidaksamaan pada distribusi data kontinu ini diambil nilai peluang salah satu selang yaitu P( X ≥ 7) . Nilai peluang secara eksak dapat
dihitung dengan menggunakan frekuensi relatifnya P ( X ≥ 7) = 1 − P ( X < 7) = 0.45
(3.6)
atau jika kita menggunakan tabel distribusi normal [1] bisa didapatkan P ( X ≥ 7) = 1 − P ( X < 7) = 0.5
Kemudian dengan menggunakan pertidaksamaan dapat diperoleh hasil sebagai berikut Pertidaksamaan Markov : E[ X ] 7 6.911958 P ( X ≥ 7) ≤ = 0.9874 7 P ( X ≥ 7) ≤
(3.7)
Pertidaksamaan Chebyshev: P ( X − 6.911958 ≥ 0.088042) ≤ P ( X ≥ 7) ≤
σ2 σ + (0.088042)
3.8077442 = 0.975 3.8077442 + 0.0077513934
(3.8)
Dalam menghitung batas atas pertidaksamaan Chernoff P ( X ≥ 7) terdapat sedikit kesulitan dalam mencari bentuk fungsi pembangkit momen hampirannya. Perlu bantuan
29
BAB III SIMULASI PENGGUNAAN PERTIDAKSAMAAN PADA DISTRIBUSI
komputer dalam mencari fungsi tersebut. Fungsi pembangkit momen hampirannya tersebut dihitung dengan menggunakan komputasi dan akan didapatkan hasil pertidaksamaan Chernoff sebagai berikut: P ( X ≥ 7) ≤ 0.864
(3.9)
Simulasi lain dilakukan untuk beberapa distribusi normal lainnya dan menghasilkan hal yang serupa. Pertidaksamaan Chernoff menghasilkan batas yang paling akurat mendekati nilai sebenarnya.
Dari simulasi ini dapat ditunjukkan bahwa untuk beberapa kasus pada distribusi binomial dan normal, pertidaksamaan Chernoff selalu menghasilkan batas atas dari nilai peluang
P(X ≥ a) yang lebih akurat dibandingkan pertidaksamaan Markov dan Chebyshev. Meskipun dalam perhitungannya lebih sulit dikerjakan dibandingkan dengan kedua pertidaksamaan lainnya.
30