BabVIIOistribusiBinomial,PoissondanHipergeometrik
KAT A KUNCI distribusi binomial adalah distribusi probabilitas diskrit dari percobaan yang dilakukan sebanyak n kali dengan masing-masing percobaan mempunyai probabilitas p dan masingmasing percobaan tidak saling mempengaruhi (independent). distribusi hipergeometrik adalah distribusi probabilitas diskrit dari sekelompok obyek yang dipilih tanpa pengembalian. distribusi poisson adalah distribusi probabilitas diskrit yang menyajikan frekuensi dari kejadian acak tertentu. Ini dapat digunakan sebagai pendekatan distribusi binomial. Beberapa tipe variabel acak sering digunakan dan kesemuanya mempunyai nama-nama khusus. Satu distribusi variabel acak yang penting adalah distribusi binomial. Kita juga akan membicarakan dua distribusi yang berhubungan dalam bab ini yaitu: distribusi poisson dan distribusi hipergeometrik. DISTRIBUSI DINOMIAL Kita kembali ke situasi dimana seorang ilmuwan melakukan percobaan, percobaan itu mempunyai dua kemungkinan hasil yaitu berhasil atau gagal. Probabilitas untuk berhasil dari setiap percobaan adalah p dan probabilitas gagal adalah I-p. Jika peercobaan dilakukan sebanyak 10 kali, berapa percobaan akan menghasilkan keberhasilan? Pertama-tamakita menjawab pertanyaan: jika ilmuwan melakukan percobaan sebanyak 2 kali, berapa probabilitas kedua percobaan itu menghasilkan keberhasilan? Jika A adalah kejadian mendapatkan keberhasilan pada percobaan pertama dan B adalah kejadian untuk mendapatkan keberhasilan pada percobaan kedua, maka Pr (A) = P dan Pr (B) = p. Kejadian untuk mendapatkan keberhasilan pada kedua percobaan dapat ditulis A nB (A irisan B, lihat bab IV). Kita akan membuat asumsi penting, masing-masing percobaan adalah bebas. Hal ini berarti bahwa kemungkinan untuk mendapatkan keberhasilan pada percobaan tertentu tidak dipengaruhi oleh hasil percobaan yang lain. Jika kedua percobaan tidak saling mempengaruhi, maka kita dapat mengalikan dua probabilitas: Pr (A n B) = Pr (A dan B) = Pr (A) x Pr (B) = p2
87 - -
--
--
--
Dengan demikian probabilitas untuk mendapatkan keberhasilan baik dari percobaan pertamamaupunpercobaankeduaadalahp2. Denganalasanyang samakita dapatmenunjukkan probabilitas mendapatkan-keberhasilandari 10kali percobaan yaitu plO.Sebagai contoh,jika p = 0.8, maka probabilitas untuk mendapatkan 10 keberhasilan adalah 0.810= 0.017. Meskipun ada kemungkinan untuk mendapatkan keberhasilan pada berbagai percobaan, tetapi kemungkinan untuk mendapatkan 10keberhasilan dari 10kali percobaan adalah sangat tipis. Kitajuga dapat menunjukkan bahwa probabilitas menghasilkan kegagalan dalam 10kali
percobaanadalah(l-p) 10. Sebagaicontoh,jika p = 0.8makakemungkinanmenghasilkan10
kegagalan dari 10 kali percobaan adalah 0.210= 0.0000001. Sekarang anggaplah kita ingin mengetahui probabilitas mendapatkan 6 keberhasilan dari 10 kali percobaan. Untuk melakukan perhitungan ini kita perlu menggunakan suatu distribusi acak: distribusi binomial. Distribusi binomial dapat diterapkan pada berbagai situasi dimana beberapa percobaan bebas (independent) dilakukan, dan masing-masing mempunyai satu dari dua kemungkinan hasil. Kita menyebut dua kemungkinan hasil itu dengankeberhasilandankegagalan.meskipununtukbeberapakasus mungkinadapenunjukkan yang berubah-ubah. Misalnya seorang ilmuwan melakukan percobaan sebanyak n kali. AnggaplahX mewakilijumlahkeberhasilan.Jikaprobabilitasuntukmendapatkankeberhasilan dari setiap percobaan adalah p, maka probabilitas mendapatkan i keberhasilan: Pr (X=i) = (?) pi (l_p)n-i Formula ini menunjuikkan fungsi kepekatan dari variabel acak binomial. X dikatakan sebagai variabel acak yang mempunyai distribusi binomial dengan parameter n dan p. Ingatlah: n (
n! ) berarti
i
i! (n-i)!
Jika n cukup besar, akan sulit untuk melakukan perhitungan dalam formula. Pada bab VIII kita akan melihat bahwa dimungkinkan untuk menggunakan distribusi lain yang disebut distribusi normal untuk perhitungan mendekati nilai dari distribusi binomial. Berikut ini adalah perhitungan dari kasus kita (p = 0.8 dann = 10):
88
1
Pr(X=i)
1
3 4 5 6
0.001 0.006 0.026 0.088
7 8 9 10
Pr(X=i) 0.201 0.302 0.268 0.107
Kita dapat melihat bahwa probabilitas untuk mendapatkan 6 keberhasilan dari 10 kali percobaan adalah 0.088. Formula ini adalah versi formula yang lebih umum dari formula yang digunakan dalam bab ill untuk menghitung probabilitas jumlah sisi H yang dihasilkan dari pelemparan mata uang sebanyak n kali. PERHITUNGAN
HARAP AN DAN VARIAN DARI VARIABEL ACAK BINOMIAL
Kita ingin menghitung harapan dan varian untuk variabel acak binomial. Sebagai contoh jika anda melakukan percobaan sebanyaak 100 kali dimana probabilitas keberhasilan untuk setiap percobaan adalah 0.75, anda dapat mengharapkan secara rata-rata untuk mendapatkan 75 keberhasilan. Secara umumjika X adalah variabel acak binomial dengan pararneter n dan p, maka bersarnya harapan untuk keberhasilan adalah np. Anggaplah Al adalah variabel acak yang hanya mempunyai dua nilai kemungkinan: Al akan bernilai 1jika percobaan pertarna berhasil, dan Al bernilai 0 jika percobaan pertarna gagal.Demikian juga Azakan bernilai 1jika percobaan kedua berhasil dan bila percobaan kedua gagal nilai A2 akan samadengan O.Kita mendefinisikan A3, A4, ..., An dengan cara yang sarna. Maka:
X =Al + A2 + ... + An Jumlah keberhasilan sarna dengan penjumlahan seluruh A. Kita tahu dari bab VI bahwa masing-masing A adalah variabel acak Bernoulli. Sehingga:
Karena masing-masing A adalah bebas (independent), kita mengerti bahwa: E(X) =E(AI) + E(A2) + ... + E(A) =np Var(X)=Var(AI) + Var(A2)+ ...+ Var(A) =np(1-p) Garnbar 7.1 menunjukkan grafik fungsi kepekatan untuk distribusi binomial: Gambar 7.1 F(x) .3 .2
.1
o
1
2
3
4
5
6
7
8
9
10 x
89
----
---
PENERAP AN DISTRIBUSI BINOMIAL Beberapa kasus dimana distribusi normal dapat diterapkan yaitu: Jumlah pertanyaan dimana anda dapat mengharapkan bahwa terkaan anda benar dalam ujian pilihan ganda. Jumlah asuransi kecelakaan yang harns dibayar oleh perusahaan asuransi. Jumlah lemparan bebas yang dilakukan oleh pemain basket selama satu musim.
· ··
CONTOH SOAL PENERAP AN DISTRIBUSI BINOMIAL SOAL Anggaplah anda dihadapkan dengan 20 pertanyaan pilihan ganda dalam suatu ujian. Masing-masing pertanyaan mempunyai 4 kemungkinan jawaban, sehingga probabilitas anda dapat menjawab dengan benar adalah 0.25. Berapa probabilitas bahwa anda dapat menjawab paling tidak 10 pertanyaan dengan benar hanya dengan menerka. PENYELESAIAN Untuk menyelesaikan masalah ini kita perlu menghitung probabilitas distribusi binomial dengan n =20 dan p =0.25. k
Pr(X=k)
k
Pr(X=k)
0 1 2 3 4 5
0.003 0.021 0.066 0.133 0.189 0.202
6 7 8 9 10 11
0.168 0.112 0.060 0.027 0.009 0.003
Masing-masing probabilitas kurang dari 0.001, tetapi jika kita menjumlahkan keseluruhannya, kita akan menemukan bahwa kemungkinan untuk mendapatkan paling tidak 10pertanyaan dapat dijawab dengan benar adalah 0.01386. (anda dapat melihat bahwa hanya 9 persen probabilitas bahwa anda dapat menjawab 3 pertanyaan dengan benar). SOAL Anggaplah anda mempunyai 3 baju hangat merah dan dua baju hangat biru di dalam lad. Setiap hari anda menarik satu baju hangat secara acak (dan anda mengembalikan kembali setelah dipakai). Berapa probabilitas anda memilih baju hangat merah 3 hari dalam seminggu? PENYELESAIAN Jika X adalahjumlah baju hangat merah yang anda pilih selama satu minggu, kemudian X mempunyai distribusi binomial dengan parameter n =7 dan p =0.6. Kita dapat menghitung probabilitasnya: 90
k
Pr(X=x)
k
Pr(x=k)
0 1 2 3
0.001 0.017 0.077 0.193
4 5 6 7
0.290 0.261 0.130 0.027
SOAL Anggaplah anda membawa pesawat dimana pesawat itu menyediakan 200 tempat duduk. Rata-rata 7% orang yang memesang tempat tidak jadi terbang. Ini nampak sebagai pemborosan bila hanya menyediakan tempat pemesanan sebanyak 200 kursi untuk tiap penerbangan, karena andamengetahui bahwakemudian adatempat duduk yang kosong.Anda memutuskan untuk berspekulasi dengan menyediakan tempat pemesanan lebih dari 200 kursi. Jika ada lebih dari 200 pemesan yang akan berangkat, maka anda akan menghadapi masalah besar. Anda memperkirakan bahwa risiko terjadi kelebihan pemesan adalah 5%. Berapa banyakpemesanan yang dapat anda terimadengan tetap mempertahankanprobabilitas risiko kelebihan pemesan kurang dari 5%? PENYELESAIAN Kita dapat menganggap tiap pemesanan sebagai percobaan, dan kita dapat mengatakan kejadian dimana orang yang memesan tempat akan terbang sebagai keberhasilan. (kita mengasumsikan bahwa tidak seorang pun terbang tanpa memesan tempat lebih dahulu.) Jika x adalah jumlah orang-orang yang terbang pada penerbangan tertentu, maka X mempunyai distribusi binomial dimana n adalahjumlah pemesanan tempat dan p =0.93. Anggaplah anda menyediakan 210 tempat. Kemudian kita dapat menghitung probabilitasnya. Probabilitas Binomial dengan p 210 P =0.093
=
Pr(X = 201) Pr(X =202) Pr(X = 203) Pr(X = 204) Pr(X = 205) Pr(X =206)
0.034 0.020 0.011 0.005 0.002 0.001
Probabilitas bahwa X akan lebih besar dari 206 dapat diabaikan. Akan ada kelebihan jika ada 201 atau lebih orang yang ingin terbang; sehinggajikakita menjumlahkan seluruh probabilitas
91 --
--
pada tabel kita, kita dapat menemukan bahwa probabilitas kelebihan sekitar 7%, tetapi anda menginginkan probabilitas kelebihan kurang dari 5%, maka anda harns menyediakan tempat kurang dari 210. Kita dapat mengulangi perhitungan yang sarna untuk 209 pemesanan tempat, kita menemukan bahwa probabilitas kelebihan sekitar 4%. Dengan demikian anda harns menyediakan 209 tempat untuk tiap penerbangan karena ini adalahjumlah terbesar pemesanan tempat yang dapat anda terima dengan tetap mempertahankan risiko kelebihan kurang dari 5%. YANG HARUS DIINGAT 1. Anggaplah anda melakukan beberapa percobaan sebanyak n kali. Probabilitas mendapatkan keberhasilan dari berbagai percobaan adalah p. Misalnya X adalah variabel acak yang mewakili jumlah keberhasilan yang terjadi. Kemudian X dikatakan mempjnyai a distribusi binomial dengan parameter n dan p. 2. Probabilitas untuk X ditunjukan oleh formula: Pr(X = i) = (p) pi (1 3.
_ p)n-l
Harapan dan varian untuk X ditunjukkan oleh formula: E(X) = np Var(X) = np (1-p)
PERHITUNGAN PROPORSI KEBERHASILAN Sering kali kita tidak hanya tertarik pada jumlah keberhasilan dalarn n kali percobaan, tetapi juga proporsi dari keberhasilan. Jika X mewakili jumlah keberhasilan dan P mewakili proporsi keberhasilan, maka P = X/no Kita dapat menemukan E(P) dan Var(P) sebagai berikut: X E(P) = E( -) nn
1
=
1 E(X) =- x np =p n
XII p(1-p) VAr(P) =Var (-) =(_)2 Var (X) x =-np (l-p) = n n n n Nilai harapan dari proporsi keberhasilan sarna dengan p, probabilitas keberhasilan. Sebagai contoh, jika probabilitas bahwa suatu mesin akan berjalan sebagaimana mestinya adalah 3/4, maka anda dapat mengharapkan mesin tersebut bekerja 3/4 (75%) dari waktu yang anda opeasikan.
92
DISTRIBUSIPOISSON X adalah jumlah panggilan telepon pada kantor tertentu dalam satu jam. X adalah variabel acak dan fungsi kepekatannya akan seperti berikut: Ak f(k)
= e-A
(k
= 1,2,3,...)
k! Variabel acak dengan distribusi seperti ini disebut variabel acak poisson. (Lambang adalah huruf Yunani lambda, dimana biasa digunakan sebagai parameter distribusi poisson, dan e mewakili bilangan matematika tertentu yang nilainya kira-kira 2.72828). Sebagai contoh, anggaplah suatu penelitian telah menentukan bahwa jumlah panggilan telepon setiap jam di kantor dapat diwakilkan oleh variabel acak poisson dengan parameter = 5. Kemudian kita dapat menghitung probabilitas dari X:
k
Pr(X=k) (probabilitas untuk panggilan telepon sejumlah k)
0 1 2 3 4 5 6
0.006 0.033 0.084 0.140 0.175 0.175 0.146
k
Pr(X=k) (probabilitas untuk panggilan telepon sejumlah k)
7 8 9 10 11 12
0.104 0.065 0.036 0.018 0.008 0.003
Gambar 7.2 menunjukkan grafik dari fungsi kepekatan poisson. Catatan, dalam teori, ada nilai yang tidak tertentu dari nilai kemungkinan X, tetapi probabilitas X = k akan semakin kecil bila k semakin besar. Gambar 7.2 F(k) .2
-
.1
, Ol23456789lOk
93
-
---
--
APLIKASI LAIN DISTRIBUSI POISSON Penggunaan lain dari distribusi poisson adalah menyajikan pendekatan distribusi binomial. Anggaplah kita mempunyai distribusi binomial dimana n berukuran sangat besar dan np moderat (tidak terlalu besar dan tidak terlalu kedl). Sebagai contoh, misalnya kita mempunyak 500 orang pelajar yang masing-masing mempunyai probabilitas 0.00002 melakukan kecurangan dalarn ujian akhir. Perhitungan probabilitas keberhasilan sejumlah i dengan menggunakan fungsi kepekatan binomial tidak dapat dikontro. Jika =np,makafungsi kepekatan binomial dapat didekati oleh distribusi poisson: IA P(X=i) = e -A-
., 1.
Dalam contoh yang diberikan di atas, = np = 500 x (0.00002) = 0.01, jadi probabilitas dua orang melakukan kecurangan dalarn ujian adalah: e-O.01 (0.01)2 0/2) x 10-5
·
· · ·
Contoh lain dimana distribusi poisson dapat diaplikasikan: Jumlah novae dalarn galaksi kita pada dekade tertentu Jumlah film yang diputar untuk mendapatkan keuntungan kotor lebih dari 25juta dolar dalam satu tahun. Jumlah siswa Ph.D yang tidak dapat menyelesaikan disertasinya tepat waktu. Jumlah orang yang membeli buku ini, dan membelinya di New York City.
PERHITUNGAN HARAPAN DAN VARIAN DARI VARIABEL ACAK POISSON Kita dapat menghitung harapan variabel acak poisson dengan fungsi kepekatan ini. Ai
P(X=i)= e -A_
., 1.
sarna dengan . Hasil ini masuk akal karena = np apabila distribusi poisson digunakan sebagai pendekatan pada distribusi binomial. Kita juga dapat menemukan bahwa var (X) = . Distribusi Poisson mempunyai keistimewaan yaitu harapannya sarna dengan variannya. YANG HARUS DIINGAT 1.
Variabel acak X dikatakan mempunyai distribusi poisson dengan parameter jika fungsi kepekatannya ditunjukkan dengan formula: Ak P(X=k)=e-A
k!
= 2.71828 2. Harapandan variankeduanyasarnadengana: E(X) =A Var(X)= A 94
DISTRIBUSI HIPERGEOMETRIK Misalnya anda diberikan sebuah kotak yang berisi 10 buah kembang gula, kesemuanya narnpak sarna bila dilihat dari luar. Anggaplah kemudian anda tabu bahwa 8 mempunyai rasa marshmallow (rasa ini yang anda suka) dan 2 buah rasa almond (rasa ini tidak anda suka). Jika anda mengarnbil 5 buah, berapa probabilitas bahwa anda akan mendapat 3 rasa marshmallow? Ini adalah kasus probabilitas dimana jumlah keberhasilan dibagi dengan jumlah kemungkinan hasil. Pertama-tarna kita harns mengetabui jumlah cara pengarnbilan 5 buah kembang gula dari kotak yang berisi 10 buah kembang gula. Kita dapat menggunakan formula ini:
10
(-)= 5
1O! -
=252
5!5!
Sekarang kita menghitung berapa probabilitas mendapatkan 3 kembang gula dengan rasa marshmallow. Karena ada 8 buah kembang gula yang harns dipilih, maka ada (38) cara pengarnbilan 3 kembang gula marshmallow. Kemudian kita mengalikannya dengan jumlah kemungkinan pengarnbilan 2 kembang gula rasa almond dari 2 kembang gula rasa almond di dalarn kotak, yaitu (22) (sarna dengan I) Dengan demikian, probabilitas mengarnbil 3 buah kembang gula rasa marshmallow adalah:
56
=
=
252
2 9
Mari kita membuat garnbara umum. 10 buah kembang gula sarnadengan N obyek. 8 kembang gula rasa marshmallow adalah M obyek dan kembang gula rasa almond sarna dengan N-M. (catatan M < N). 5 buah kembang gula yang anda arnbilsarnadengan percobaan sebanyak n (pemilihan tanpa pengembalian dari obyek sebanyak N). 3 k3mbang gula rasa marshmallow adalah obyek sebanyak i yang ingin dipilih. (catatan i < M, total jumlah obyek yang diinginan, dan i < n, total obyek yang dipilih). Bila X adalah variabel acak yang mewakili jumlah obyek yang diinginkan untuk dipilih, maka kita mempunyai:
(~)
(N~~)
Pr(X = i) =
(~)
95 --
- --
--
(untuk 0 ::;;1 ::;;n, dan i ::;;M; Pr (X = i) = 0). X dikatakanlah mempunyai distribusi hipergeometrik dengan parameter n, N, dan M. APLIKASI DISTRIBUSI HIPERGEOMETRIK Berikut ini adalah contoh yang termasuk dalam distribusi hipergeometrik: Jumlah barang dagangan yang rusak dalarn sarnpel acak dari sejumlah besar kiriman. Jumlah orang-orang yang anda temui dalarn hidup anda dengan nama Fred. Jumlah penny yang terambil dari dalarn kendi. Di dalarn kendi itu ada penny sebanyak M dan nikel sebanyak N-M. Jika hanya mengarnbil 1, maka n=I dan probabilitas mendapatkan penny: MIN. Aplikasi penting lainnya adalah: dalarn penyelidikan pendapat umum seperti Survey Gallup. Orang yang diberi pertanyaan analog dengan kembang gula yang dipilih dari kotak, dan keseluruhan populasi analog dengan jumlah ke~eluruhan kembang gula dalarn kotak. Pada waktu kita melakukan penelitian pengumpulan pendapat umum, kita ingin mengetahui apakah proporsi orang-orang dengan pendapat tertentu dalarn sampel dengan proporsi orangorang pemberi pendapat dalarn populasi adalah sarna.
· ··
PERHITUNGAN HARAPAN HIPERGEOMETRIK
DAN VARIAN
DARI
VARIABEL
ACAK
Karena probabilitas pengarnbilan obyek adalah M/N, dalam pengambilan sebanyak n kita mengharapkan untuk mendapatkan nMIN yang benar. Varian dari variabel acak hipergeometrik adalah:
Catatan bahwa (N-n)f(N-I) dapat ditulis sebagai (I-n/N) (I-IINO. Akan mendekati 1bila N menjadi sangat besar dibandingkan dengan n. Ini berarti bahwa varian dari variabel acak hipergeometrik menjadi:
Formula ini nampak lebih dikenal. Sebagai contoh, anggaplah kita menggunakan lagi kotak kembang gula, anda mengambil n kembang gula dari kotak, kemudian dikembalikan. Kita akan mengatakan sebagai suatu keberhasilan jika anda mendapatkan kembang gula yang anda inginkan. Dengan demikian probabilitas untuk mendapatkan keberhasilan adalah MIN. Jika X adalah jumlah keberhasilan dari n kali pengembalian, kita tahu bahwa X mempunyai distribusi binomial dengan N dan MIN sebagai pararneternya, dan kita mengetahui bahwa variannya adalahn (M/N)(1-MIN). lni akan sarnadengan variandari distribusihipergeometrik apabila N berukuran sangat besar. 96
Kenyataan ini menggambarkan perbedaan antara dua distribusi. Dengan distribusi binomial, tiap pengambilan tidak tergantung satu dengan yang lain, karena anda selalu meletakkan kembali ke dalam kotak kembang gula. Dengan distribusi hipergeometrik, anda tidak mengembalikan kembang gula yang telah diambil, sehingga tiap pengembalian dapat mempengaruhi pengambilan yang lain. Probabilitas keberhasilan dalam setiap pengambilan tergantung berapa banyak macam kembang gula yang ada di dalam kotak dan tergantung pada kembang gula apa yang telah diambil. Tetapi jika jumlah kembang gula di dalam gula tidak merubah probabilitas pengambilan berikutnya secara berarti. Dalam kasus ini tidak membuat perbedaan yang terlalu besar apakah anda mengembalikan (dan menggunakan distribusi binomial) atau tidak (menggunakan distribusi hipergeometrik) kembang gula yang sudah anda ambil. YANG HARUS DIINGAT 1. Populasi sebanyak N obyek terdiri dari M obyek dengan tipe A dan N-M obyek dengan tipe B. Pemilihan n obyek secara acak dari populasi, dan X mewakili jumlah obyek bertipe A dalam suatu sampel sebesar n obyek. Kemudian X adalah variabel acak yang mempunyai distribusi hipergeometrik dengan parameter n, N dan M. 2. Fungsi kepekatan probabilitas adalah:
Pr(X = i) =
(¥-)
(N~~]
(~ ) 3.
Harapan dan varian dapat dieari dengan formula: nM E(X)= N
ISTILAH-ISTILAH YANG HARUS DIPELAJARI distribusi binomial distribusi Poisson distribusi hipergeometrik
97