Catatan Kuliah
MA2082 BIOSTATISTIKA “Orang Biologi Tidak Anti Statistika”
disusun oleh
Khreshna I.A. Syuhada, MSc. PhD.
Kelompok Keilmuan STATISTIKA - FMIPA Institut Teknologi Bandung 2011
Tentang MA2082 Biostatistika A. Bentuk perkuliahan: 1. Tatap muka di kelas 2. Praktikum di Lab. Statistika dan Komputasi B. Jadwal kuliah: 1. Tatap muka di kelas: • Senin; 11.45-13.00; R.9021 • Rabu; 9-10.15; R.9301 Catatan: Jadwal khusus untuk Minggu-1, Minggu-2 dan Ujian 2. Praktikum: dimulai Minggu-5 C. Silabus: • Statistika deskriptif (1 minggu) • Peluang (1 minggu) • Peubah acak dan distribusi (diskrit dan kontinu) (2 minggu) • Penaksiran (2 minggu) • Uji hipotesis (1 sampel) untuk mean dan proporsi (1 minggu) • Uji hipotesis 2 sampel (1 minggu) • Analisis variansi (1 minggu) • Analisis data kategorikal (1 minggu) • Analisis regresi (1 minggu) D. Buku teks: Bernard Rosner, 2006, Fundamentals of Biostatistics, 6th ed. E. Penilaian: 1. Ujian 1,2,3 (80%) : 24 Agustus 2011 (20%), 12 Oktober 2011 (30%), 30 November 2011 (30%). 2. PR, Kuis (10%) 3. Praktikum (15%) MA2082 BioStat.
i
K. Syuhada, PhD.
Matriks kegiatan perkuliahan
Table 1: Materi kuliah MA2082 Biostatistika. Minggu1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
MA2082 BioStat.
Materi Keterangan Statistika deskriptif Penjelasan kuliah Peluang Ujian 1 24 Agustus 2011 Distribusi Diskrit Tabel statistik Distribusi Kontinu Penaksiran Penaksiran Ujian 2 12 Oktober 2011 Uji Hipotesis (1 sampel) Uji Hipotesis (2 sampel) Analisis Variansi Analisis Data Kategorikal Analisis Regresi Ujian 3 30 November 2011
ii
K. Syuhada, PhD.
Daftar Isi 1 Statistika Deskriptif 1.1 Pendahuluan . . . . . . . . . . . . . . . . . 1.2 Data, Jenis Data, Memahami Data . . 1.3 Ukuran Pusat/Lokasi dan Penyebaran 1.4 Mengamati Observasi Luar . . . . . . . . 1.5 Data Kelompok . . . . . . . . . . . . . . . 1.6 Memahami Grafik . . . . . . . . . . . . . .
. . . . . .
1 1 2 3 5 6 7
2 Peluang 2.1 Ilustrasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Konsep Peluang . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Peluang Bersyarat dan Teorema Bayes . . . . . . . . . .
1 1 2 3
3 Peubah Acak dan Distribusi 3.1 Ilustrasi . . . . . . . . . . . . . 3.2 Peubah Acak Diskrit . . . . . 3.3 Distribusi Diskrit . . . . . . . 3.4 Peubah Acak dan Distribusi
1 1 2 4 5
iii
. . . . . . . . . . . . . . . . . . . . . Kontinu .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . .
BAB 1 Statistika Deskriptif Silabus: Jenis data, ukuran pusat/lokasi, ukuran penyebaran, koefisien variasi, observasi luar, data kelompok, grafik Tujuan: 1. Membedakan jenis data dan memahami data 2. Menghitung dan memaknai ukuran lokasi/pusat 3. Membedakan variansi dan koefisien variasi 4. Mengamati observasi luar 5. Memahami data kelompok 6. Membuat dan menafsirkan grafik
1.1
Pendahuluan
• Statistika dan Biostatistika: apa, untuk apa? • Statistik versus Statistika • Manfaat BioStatistika Statistika adalah ilmu yang digunakan untuk mengumpulkan, mengorganisasi, melakukan inferensi dan menafsirkan data. Secara singkat, statistika adalah ilmu/pekerjaan untuk meyimpulkan tentang suatu fenomena pada populasi menggunakan sampel.
1
1.2
Data, Jenis Data, Memahami Data
Data adalah hasil observasi tunggal (datum) yang didapat baik secara langsung (observasi/survey, praktikum) ataupun tidak langsung (buku, koran, internet) Jenis data: • Nominal (jenis kelamin, golongan darah) • Ordinal (tingkat kecemasan, tingkat nyeri) • Rasio/interval (denyut nadi, tekanan darah) Contoh/ilustrasi dan interpretasi: 1. Berat badan bayi: Table 1.1: Data sampel berat badan bayi (di AS) baru lahir. Bayi1 2 3 4 5
BB 3265 3260 3245 3484 4146
Bayi6 7 8 9 10
BB 3323 3649 3200 3031 2069
Bayi11 12 13 14 15
BB 2581 2841 3609 2838 3541
Bayi16 17 18 19 20
BB 2759 3248 3314 3101 2834
2. Jumlah darah putih (×1000) pasien-pasien di RS: 0 357889 1 02 2 3 5
3. Dapatkah anda mencari dan menafsirkan data berbentuk grafik? 4. Dapatkah anda mencari data yang bersifat kategorikal?
MA2082 BioStat.
2
K. Syuhada, PhD.
1.3
Ukuran Pusat/Lokasi dan Penyebaran
• Ukuran lokasi: Mean (aritmetik), Median, Modus • Ukuran Penyebaran: Jangkauan, Variansi, Kuartil • Variansi versus Koefisien Variasi Misalkan data sampel adalah x1 , x2 , . . . , xn , dimana xi menyatakan titik sampel ke-i. Sampel diatas diperoleh dari populasi dan kita ingin melakukan inferensi untuk populasi dengan memanfaatkan sampel. Langkah pertama adalah meringkas data untuk kemudian menghitung MEAN, MEDIAN dan MODUS (selanjutnya disebut ukuran lokasi atau pusat). Mean (aritmetik) didefinisikan sebagai ∑n xi x¯ = i=1 n Sifat-sifat mean (a) Untuk suatu konstanta k, n ∑
k xi = · · ·
i=1
(b) Jika yi = xi + k maka y¯ = x¯ + k. Buktikan! (c) Jika yi = k xi maka y¯ = · · · . Median atau median sampel seringkali dikatakan sebagai nilai tengah. Dengan demikian, menghitung median haruslah dilakukan pada data yang sudah diurutkan. Definisi median adalah (a) Observasi ke-((n + 1)/2), (n ganjil), atau (b) Nilai tengah dari observasi ke-(n/2) dan ke-((n/2) + 1), (n genap)
MA2082 BioStat.
3
K. Syuhada, PhD.
Diskusi: Bagaimana (perbandingan) nilai mean dan median untuk data yang (i) simetrik, (ii) menceng ke kanan, (iii) menceng ke kiri? Modus atau Mode adalah ukuran pusat yang menyatakan nilai observasi yang paling sering muncul. Menentukan modus dapat dilakukan pada data tanpa diurutkan (meskipun lebih mudah apabila diurutkan lebih dahulu). LATIHAN: Tentukan ukuran lokasi/pusat dari contoh data diatas. Ukuran penyebaran menyatakan seberapa jauh data menyebar dari mean. Misalkan kita memiliki dua data sampel. Kedua sampel memiliki mean yang sama, namun memiliki penyebaran data yang berbeda. Beberapa ukuran penyebaran antara lain: 1. Jangkaun (Range): R = xmaks − xmin 2. Variansi atau variansi sampel: ∑n ¯)2 2 i=1 (xi − x s = n−1 Catatan: Deviasi standar atau simpangan baku adalah akar kuadrat dari variansi. 3. Kuantil atau persentil: Sifat-sifat variansi: Diketahui data sampel x1 , . . . , xn memiliki variansi s2x . Jika data sampel (a) yi = xi + k, (b) yi = k xi , untuk suatu konstanta k, maka s2y = . . . LATIHAN: Tentukan ukuran penyebaran dari contoh data diatas.
MA2082 BioStat.
4
K. Syuhada, PhD.
Variansi versus Koefisien Variasi Kita dapat menghitung suatu ukuran yang mengaitkan ukuran penyebaran (deviasi standar) dengan ukuran lokasi (mean), yaitu koefisien variasi (coefficient of variation - CV): CV = 100% × (s/¯ x) yang tidak dipengaruhi unit ukuran yang dipakai. CV bermanfaat untuk membandingkan variabilitas beberapa sampel yang berbeda relatif terhadap nilai mean-nya. Dapat pula kita membanding CV dari beberapa variabel. LATIHAN: Table 1.2: Faktor risiko kardiovaskular pada anak. n Mean s CV(%) Tinggi (cm) 364 142.6 0.31 Berat (kg) 365 39.5 0.77 Tekanan darah (mm Hg) 337 104 4.97 Kolesterol (mg/dL) 395 160.4 3.44
1.4
Mengamati Observasi Luar
Observasi luar atau outlier adalah nilai/observasi yang “menyimpang” dari nilai-nilai/observasi yang lain. Observasi luar dapat ditentukan/dihitung dengan melihat apakah ada nilai/observasi yang LEBIH BESAR dari K3 + 1.5 (K3 − K1 ) atau LEBIH KECIL dari K1 − 1.5 (K3 − K1 ). Dalam praktiknya, observasi luar dapat menyatakan sesuatu yang baik/jelek. Misalnya, seseorang dengan tingkat kecerdasan (IQ) yang sangat tinggi (jauh diatas rata-rata alias observasi luar) adalah baik. Seringkali observasi luar diabaikan dalam analisis data meskipun sesungguhnya cara ini tidaklah tepat. Mendeteksi observasi luar adalah sesuatu yang sangat menantang dalam statistika.
MA2082 BioStat.
5
K. Syuhada, PhD.
LATIHAN: Adakah observasi luar pada contoh data diatas?
1.5
Data Kelompok
Pandang data sampel dengan 275 observasi. Ukuran sampel tersebut terlalu besar sehingga menampilkan data apa adanya menjadi tidak efisien. Dengan demikian, data sampel dapat dikelompokkan. Pengelompokan ini dapat pula terjadi (harus dilakukan) karena tingkat keakuratan data yang diambil tidak dapat diperoleh dengan baik. Pengelompokan data memberikan masalah: Berapa banyak kelompok atau interval kelas (class intervals) yang ingin kita buat? Berapa lebar interval (interval width)? Salah satu formula yang bisa kita pakai adalah Formula Sturges, dimana banyaknya interval kelas adalah k = 1 + (3.322 × log10 n), dimana n adalah besar sampel. Lebar intervalnya: w = R/k, dengan R adalah jangkauan. Untuk contoh data sampel dengan 275 observasi, kita peroleh: k ≈ 8,
w = (63 − 18)/8 = 5.625
Dengan demikian, lebar kelas interval adalah 5 atau 10. Diketahui obervasi terkecil dan terbesar, berturut-turut, adalah 18 dan 63. Jadi, kelas interval yang bisa dibuat adalah: 10-19 20-29 30-39 40-49 50-59 60-69
MA2082 BioStat.
6
K. Syuhada, PhD.
1.6
Memahami Grafik
Beberapa tampilan visual (baca: grafik) untuk data adalah diagram bar/batang (bar chart), diagram batang dan daun (stem-and-leaf plot), histogram, box-plot. Contoh, kita pandang data jumlah darah putih pasien-pasien di RS:
MA2082 BioStat.
7
K. Syuhada, PhD.
Figure 1.1: Box-plot - Jumlah darah putih pasien.
MA2082 BioStat.
8
K. Syuhada, PhD.
Figure 1.2: Histogram - Jumlah darah putih pasien.
MA2082 BioStat.
9
K. Syuhada, PhD.
BAB 2 Peluang Silabus: Ruang sampel dan kejadian, konsep peluang, peluang bersyarat, Teorema Bayes. Tujuan: 1. Mendefinisikan ruang sampel dan kejadian 2. Menghitung peluang suatu kejadian 3. Menghitung peluang bersyarat suatu kejadian 4. Memanfaatkan Teorema Bayes untuk menghitung peluang suatu kejadian
2.1
Ilustrasi
Ilustrasi-1. Tanti baru saja mengikuti tes mata. Ia masih teringat beberapa huruf yang muncul: A-E-M-R-S. Kini, Tanti mencoba menyusun kata-kata yang mungkin dari huruf-huruf tersebut. Ilustrasi-2. Hanin bermaksud menyumbangkan darahnya di suatu tempat donor. Hanin terlebih dahulu harus dicek golongan darahnya. • Golongan darah yang mungkin untuk Hanin adalah... • Rupanya Hanin tidak sendirian. Ada Hana dan Hanan disana yang memiliki maksud yang sama dengan Hanin. Jika seorang diantara mereka dipilih secara acak menjadi pendonor, berapa peluang orang yang terpilih adalah Hana? 1
• Jika, diantara mereka bertiga, Hanan terpilih menjadi pendonor, berapa peluang golongan darah Hanan adalah B? Ilustrasi-3. Untuk keperluan praktikum di Lab, B dan G haruslah mendapatkan hewan (burung) percobaan. B dan G memutuskan untuk mendapatkan itu dengan cara menembak. Pada waktu yang disepakati, B dan G secara bersamaan menembak sasaran tertentu. Peluang tembakan B mengenai sasaran adalah 0.7 sedangkan peluang tembakan G (bebas dari tembakan B) mengenai sasaran adalah 0.4. • Berapa peluang sebuah tembakan mengenai sasaran? • Berapa peluang sasaran tertembak? Ilustrasi-4. “Ayahku meninggal waktu usiaku tiga tahun. Lalu Ibu kawin lagi. Dengan ayah tiriku, Ibu mendapat dua orang anak tiri dan melahirkan tiga orang anak. Ketika usiaku lima belas tahun, Ibu pun meninggal. Ayah tiriku kawin lagi dengan seorang janda yang sudah beranak dua. Ia melahirkan dua orang anak pula dengan ayah tiriku”
2.2
Konsep Peluang
Definisi: Ruang sampel, S, adalah himpunan semua hasil mungkin dari suatu percobaan. Kejadian, E, adalah himpunan bagian dari ruang sampel. Peluang suatu kejadian, P (E), adalah rasio dari banyaknya titik kejadian dan ruang sampel, atau P (E) =
n(E) , n(S)
dimana n(E) dan n(S), berturut-turut, adalah banyaknya titik kejadian dan ruang sampel. Sifat-sifat peluang: 1. 0 ≤ P (E) ≤ 1 2. P ({}) = 0 3. P (S) = 1
MA2082 BioStat.
2
K. Syuhada, PhD.
4. Untuk kejadian A dan B, P (A ∪ B) = P (A) + P (B) − P (A ∩ B) 5. Jika kejadian A dan B saling asing maka P (A ∩ B) = 0 6. Kejadian A dan kejadian B dikatakan saling bebas jika P (A ∩ B) = P (A) P (B)
LATIHAN: Kerjakan ilustrasi-ilustrasi diatas. SOLUSI: 1. Ilustrasi-1: SERAM, M ERAS, SEM AR, RAM ES, .... 2. Ilustrasi-3: Misalkan B kejadian B menembak sasaran Misalkan G kejadian G menembak sasaran Misalkan T kejadian sebuah tembakan mengenai sasaran Misalkan S kejadian sasaran tertembak P (T ) = P (G ∩ B c ) + P (B ∩ Gc ) = (0.4)(0.3) + (0.7)(0.6) P (S) = 1 − P (Gc ∩ B c ) = 1 − (0.6)(0.3)
2.3
Peluang Bersyarat dan Teorema Bayes
Ilustrasi-1. Pandang Ilustrasi-3 diatas. • Jika sebuah tembakan mengenai sasaran, berapa peluang bahwa itu tembakan G?
MA2082 BioStat.
3
K. Syuhada, PhD.
• Berapa peluang bahwa, jika sasaran tertembak, kedua tembakan mengenai sasaran? • Berapa peluang bahwa, jika sasaran tertembak, tembakan G mengenai sasaran? Ilustrasi-2. Seorang praktikan, Ega, tahu bahwa sebuah lembar kerja praktikum akan berada di salah satu dari tiga buah kotak surat lab yang ada. Misalkan pi adalah peluang bahwa Ega akan menemukan lembar kerja praktikum setelah mengecek kotak surat lab i dengan cepat jika ternyata surat tersebut berada di kotak surat lab i, i = 1, 2, 3. • Misalkan Ega mengecek kotak surat 1 tidak menemukan surat. Berapa peluang hal itu akan terjadi? • Jika diketahui Ega mengecek kotak surat 1 tidak menemukan surat, berapa peluang bahwa surat itu ada di kotak surat 1? Definisi: Peluang kejadian A, apabila kejadian B telah terjadi, adalah peluang bersyarat P (A|B) yaitu: P (A|B) =
P (A ∩ B , P (B)
asalkan P (B) > 0. Jelas bahwa jika kejadian A dan B saling bebas maka P (A|B) = P (A). Peluang total: P (B) = P (B|A)P (A) + P (B|Ac )P (Ac ) TEOREMA BAYES: Misalkan {B1 , B2 , . . . , Bn } adalah partisi dari ruang sampel dan misalkan A adalah kejadian yang terobservasi. Peluang kejadian Bj diberikan A adalah P (A Bj ) P (A) P (A|Bj ) P (Bj ) = ∑n i=1 P (A|Bi ) P (Bi )
P (Bj |A) =
MA2082 BioStat.
4
K. Syuhada, PhD.
LATIHAN: 1. Kerjakan ilustrasi-ilustrasi diatas 2. Tes darah di suatu laboratorium akan 95% efektif dalam mendeteksi suatu penyakit tertentu jika penyakit itu ada. Namun demikian, tes tersebut juga memberikan ’hasil positif yang salah’ pada 1% orang sehat yang dites. Jika 0.5% dari populasi mengidap penyakit tertentu tersebut, tentukan peluang bahwa seseorang menderita penyakit itu jika hasil tes positif? SOLUSI: 1. Ilustrasi-1: Misalkan B kejadian B menembak sasaran Misalkan G kejadian G menembak sasaran Misalkan T kejadian sebuah tembakan mengenai sasaran Misalkan S kejadian sasaran tertembak P (G ∩ T ) P (T ) P (G ∩ B c ) = P (G ∩ B c ) + P (B ∩ Gc ) (0.4)(0.3) = (0.4)(0.3) + (0.7)(0.6)
P (G|T ) =
P (G ∩ S) P (B ∩ S) P (S) P (G)P (B) = 1 − P (Gc ∩ B c ) (0.4)(0.7) = 1 − (0.6)(0.3)
P (G ∩ B|S) =
P (G ∩ S) P (S) P (G ∩ S) = 1 − P (Gc ∩ B c ) 0.4 = 1 − (0.6)(0.3)
P (G|S) =
MA2082 BioStat.
5
K. Syuhada, PhD.
2. Ilustrasi-2: Misalkan Ki , i = 1, 2, 3 adalah kejadian lembar kerja praktikum berada di kotak surat lab i. Misalkan T kejadian mengecek kotak surat lab 1 tidak mendapatkan lembar kerja praktikum. Peluang hal itu akan terjadi adalah P (T ) = P (T |K1 )P (K1 ) + P (T |K2 )P (K2 ) + P (T |K3 )P (K3 ) = (1 − p1 )(1/3) + 1/3 + 1/3 Jika diketahui Ega mengecek kotak surat lab 1 dan tidak menemukan surat, maka peluang bahwa lembar kerja praktikum itu ada di kotak surat lab 1 adalah P (T |K1 )P (K1 ) P (T |K1 )P (K1 ) + P (T |K2 )P (K2 ) + P (T |K3 )P (K3 ) (1 − p1 )(1/3) = (1 − p1 )(1/3) + 1/3 + 1/3
P (K1 |T ) =
MA2082 BioStat.
6
K. Syuhada, PhD.
BAB 3 Peubah Acak dan Distribusi Silabus: Konsep peubah acak, fungsi peluang (probability density function), fungsi distribusi (cumulative distribution function), mean dan variansi, distribusi diskrit (binomial, Poisson, geometrik), distribusi kontinu (normal, seragam/uniform, eksponensial). Tujuan: 1. Memahami definisi dan menentukan peubah acak (p.a) 2. Menghitung fungsi peluang (f.p) dan fungsi distribusi (f.d); f.p ke f.d; f.d ke f.p 3. Menghitung mean dan variansi 4. Mempelajari distribusi diskrit (binomial, Poisson) dan kontinu (normal, eksponensial) 5. Menghitung peluang suatu p.a dari distribusi diskrit atau kontinu
3.1
Ilustrasi
(Ilustrasi-1) Manajemen suatu klinik kesehatan mengetahui bahwa lima persen penelepon yang mendaftar untuk periksa dokter tidak akan datang ke klinik. Dengan alasan ini, manajemen tidak ragu untuk menerima pendaftaran sebanyak 52 orang, walaupun kapasitas klinik sebenarnya hanya untuk 50 orang. Berapa peluang setiap penelepon/pendaftar yang datang akan dilayani dokter? (Ilustrasi-2) Lama waktu (dalam menit) mahasiswa mengikuti praktikum di Lab adalah peubah acak dengan fungsi peluang tertentu. Tentukan peluang seorang mahasiswa mengikuti praktikum lebih dari 15 menit? antara 20 dan 35 menit? 1
0.050 0.025
10
20
30
40
Figure 3.1: Fungsi peluang lama waktu mahasiswa di Lab.
3.2
Peubah Acak Diskrit
Peubah Acak • Peubah acak tidaklah “acak” dan bukanlah “peubah” • Peubah acak adalah “fungsi” yang memetakan anggota S ke bilangan real R P.A. Diskrit Peubah acak X dikatakan diskrit jika terdapat barisan terhitung dari bilangan {ai , i = 1, 2, . . . } sedemikian hingga (∪ ) ∑ P {X = ai } = P (X = ai ) = 1 i
i
Catatan: Sebuah peubah acak diskrit tidak selalu berasal ruang sampel diskrit. FX disebut fungsi distribusi (diskrit) dari X jika terdapat barisan terhitung {ai , i = 1, 2, . . . } dari bilangan real dan barisan {pi , i = 1, 2, . . . } dari bilangan positif yang bersesuaian sedemikian hingga ∑ pi = 1 i
dan FX (x) =
∑
pi
ai ≤x
MA2082 BioStat.
2
K. Syuhada, PhD.
Jika diberikan himpunan ∑ terhitung {ai , i = 1, 2, . . . } dan bilangan positif {pi , i = 1, 2, . . . } sdh i pi = 1, fungsi peluang pX (x) adalah pX (x) = pi = P (X = ai ), dengan x = ai Fungsi distribusi (kumulatif): F (x) = P (X ≤ x) Sifat-sifat: (a) F fungsi tidak turun (b) limx→∞ F (x) = 1 (c) limx→−∞ F (x) = 0 (d) F fungsi kontinu kanan Catatan: • P (a < X ≤ b) = F (b) − F (a) • P (X ≤ b) ̸= P (X < b) • { 1 }) X ≤b− n→∞ n ( 1) = lim P X ≤ b − n→∞ n ( 1) = lim F b − n→∞ n
P (X < b) = P
(
lim
Contoh/Latihan: 1. Diketahui S = {00, 01, 10, 11}. Misalkan X peubah acak yang menyatakan banyaknya “0”. Nilai yang mungkin dari X adalah..., dengan fungsi peluang dan fungsi distribusi... 2. Tentukan fungsi 0, 3/5, F (x) = 7/10, 1,
MA2082 BioStat.
peluang dari fungsi distribusi berikut: x < −3.1 −3.1 ≤ x < 0 0≤x<1 1≤x
3
K. Syuhada, PhD.
3. Diketahui fungsi peluang sebagai berikut: p, x = −1.9 0.1, x = −0.1 0.3, x = 20p f (x) = p, x=3 4p, x = 4 0, yang lain Hitung P (−1.9 ≤ |X| ≤ 3), F (2), F (F (3.1))
3.3
Distribusi Diskrit
(Ilustrasi-1) Pasien di IGD adalah orang-orang yang dianggap dekat dengan kematian. Kesembuhan dari penyakit yang dideritanya bagi mereka adalah seperti mimpi. Untuk bisa bertahan hidup dari hari ke hari sudahlah merupakan mukjizat. Asumsikan bahwa setiap orang memiliki peluang yang sama untuk dapat bertahan hidup sampai hari esok sebesar α. Jika jumlah pasien IGD pada suatu hari adalah 5 orang, berapa peluang besok hanya akan ada 2 orang saja yang masih hidup? (Ilustrasi-2) Banyaknya kecelakaan yang terjadi di tol setiap hari berdistribusi Poisson dengan parameter λ = 3. Berapa peluang tidak ada kecelakaan pada hari ini? (Ilustrasi-3) Tiga mahasiswi dokter yang sedang melakukan residensi bertugas di kamar mayat. Untuk menentukan siapa yang akan masuk ke “ruangan idaman” tersebut pertama kali, mereka sepakat untuk mengundi dengan melantunkan koin. Seseorang dengan hasil lantunan yang berbeda dengan yang lain akan menjadi orang pertama. Jika X menyatakan banyaknya lantunan koin yang harus dilakukan, tentukan P (X = 3). Distribusi Binomial Misalkan S = {sukses, gagal} adalah ruang sampel yang menotasikan ’sukses’ atau ’gagal’ dari suatu percobaan. Definisikan X(sukses) = 1 dan X(gagal) = 0 dan pX (1) = P (X = 1) = p pX (0) = P (X = 0) = 1 − p dimana 0 ≤ p ≤ 1 adalah peluang diperoleh sukses. X dikatakan peubah acak Bernoulli dengan parameter p. Jika dilakukan n percobaan independen MA2082 BioStat.
4
K. Syuhada, PhD.
dan jika X menyatakan banyaknya sukses yang diperoleh maka X dikatakan sebagai peubah acak Binomial dengan parameter (n, p), dimana pX (k) = B(k; n, p) = Ckn pk (1 − p)n−k Distribusi Poisson Misalkan X peubah acak dengan fungsi peluang pX (i) = e−λ
λi i!
untuk i = 0, 1, 2, . . . dan λ > 0. X disebut peubah acak Poisson dengan parameter λ. Distribusi Geometrik Misalkan percobaan-percobaan dilakukan hingga diperoleh sukses yang pertama. Percobaan-percobaan tersebut saling bebas dan memiliki peluang sukses p. Misalkan X menyatakan banyaknya percobaan yang dilakukan untuk mendapatkan sukses pertama tersebut, maka X dikatakan peubah acak Geometrik dengan parameter p. Fungsi peluangnya adalah p(n) = P (X = n) = (1 − p)n−1 p, untuk n = 1, 2, . . . dan p > 0.
3.4
Peubah Acak dan Distribusi Kontinu
(Ilustrasi) Riset bidang psikologi melibatkan pengukuran perilaku. Hasil-hasil pengukuran akan berbeda antara individu satu dengan yang lainnya. Namun demikian, sesungguhnya hasil-hasil tersebut dapat diprediksi sebagai kelompok individu. Salah satu pola umum pada hasil pengukuran (tentunya berupa angka) adalah bahwa kebanyakan pengukuran-pengukuran tersebut terkonsentrasi di sekitar mean dari distribusi tersebut. Ada sedikit hasil pengukuran yang jauh dari mean. Apabila distribusi frekuensi digambarkan, akan tampak kurva berbentuk bel (bell-shaped curve) yang disebut DISTRIBUSI NORMAL. P.A. Kontinu Misalkan X peubah acak dan fungsi distribusinya FX dapat diturunkan. Fungsi peluang fX adalah turunan dari fungsi distribusi, fX (x) =
d FX (x) dx
MA2082 BioStat.
5
K. Syuhada, PhD.
atau dengan kata lain ∫ x FX (x) = fX (t) dt −∞
Definisi: Jika X adalah peubah acak sedemikian hingga fungsi peluangnya ada (turunan dari fungsi distribusi) maka X dikatakan sebagai peubah acak kontinu. Catatan: ∫ ∞ fX (t) dt 1 = FX (∞) = −∞
∫
P (a ≤ X ≤ b) = FX (b) − FX (a) = ∫ a fX (t) dt = 0 P (X = a) =
b
fX (t) dt a
a
Distribusi Normal Definisi: Peubah acak kontinu X adalah peubah acak Normal atau GAUSS dengan parameter µ dan σ 2 jika fungsi peluang fX nya sbb: fX (x) = √
1 exp(−(x − µ)2 / 2 σ 2 ), −∞ ≤ x ≤ ∞ 2πσ
Contoh/Latihan: Ukuran ideal jumlah mahasiswa di kelas BioStat adalah 60 orang. Namun demikian, PS Biologi ITB mencatat bahwa biasanya hanya 30 persen mahasiswa saja dari total yang terdaftar yang benar-benar hadir dalam perkuliahan. Jika PS Biologi ITB memutuskan menerima 180 mahasiswa untuk kelas BioStat, berapa peluang bahwa lebih dari 60 orang hadir di kelas? Teorema Limit DeMoivre-Laplace Jika Sn menyatakan ‘banyaknya sukses’ yang terjadi pada n percobaan independen, dengan peluang sukses adalah p, maka untuk setiap a < b, ) ( Sn − np ≤ b → Φ(b) − Φ(a), P a≤ √ np(1 − p) untuk n → ∞. (pendekatan Normal untuk Binomial akan ‘baik’ jika np(1 − p) besar, np(1 − p) ≥ 10)
MA2082 BioStat.
6
K. Syuhada, PhD.
0.050 0.025
10
20
30
40
Figure 3.2: Fungsi peluang lama waktu mahasiswa di Lab. Distribusi Uniform Definisi: Peubah acak kontinu X dikatakan berdistrbusi seragam pada selang (a, b) jika fungsi peluang fX nya sbb: fX (x) =
1 , a≤x≤b b−a
Contoh/Latihan: Lama waktu (dalam menit) mahasiswa mengikuti praktikum di Lab adalah peubah acak dengan fungsi peluang tertentu. Tentukan peluang seorang mahasiswa mengikuti praktikum lebih dari 15 menit? antara 20 dan 35 menit? Distribusi Gamma Peubah acak Gamma: Misalkan percobaan Bernoulli diulang-ulang sebanyak n kali, maka banyaknya ‘sukses’ yang diperoleh adalah peubah acak berdistribusi Binomial dengan parameter n dan p, dimana p adalah peluang sukses. Jika kita memandang banyaknya percobaan Bernoulli yang dilakukan sampai diperoleh (dan termasuk) sukses ke-r, maka kita dapatkan peubah acak beristribusi Binomial negatif dengan parameter r dan p. Peubah acak Gamma adalah analogi dalam bentuk kontinu untuk peubah acak Binomial negatif. Dalam hal ini kita pandang peubah acak Binomial negatif ini sebagai waktu yang diberikan untuk sukses ke-r.
MA2082 BioStat.
7
K. Syuhada, PhD.
Definisi: Peubah acak kontinu X adalah peubah acak Gamma jika memiliki fungsi peluang f (x) =
λα α−1 −λx x e , x>0 Γ(α)
dimana α dan λ adalah bilang real positif. Kita katakan X berdistribusi Gamma dengan parameter α dan λ; x ∼ Gamma(α, λ). Definisi Fungsi Gamma: ∫ ∞ Γ(t) = xt−1 e−x dx 0
Catatan: Γ(t + 1) = t Γ(t), t > 0 Contoh/Latihan: 1. Tentukan fungsi peluang dari fungsi distribusi berikut: 0, x<0 1 x 3 + 5, 0 ≤ x < 1 F (x) = 53 , 1≤x<2 9 , 2≤x<3 10 1, x≥3 2. Pelajari distribusi eksponensial.
MA2082 BioStat.
8
K. Syuhada, PhD.