- Yadi Nurhayadi -
MODUL STATISTIKA BAB 2 DISTRIBUSI FREKUENSI A. Review Pelajaran SMA A.1 Pengumpulan Data 1. Penelitian lapangan (Pengamatan Langsung) 2. Wawancara (Interview) 3. Angket (Kuisioner) 4. Berdasarkan penelitian sebelumnya. A.2 Penyajian Data 1. Diagram lambang (piktogram) 2. Diagram lingkaran 3. Diagram Batang 4. Diagram Garis 5. Histogram dan Poligon Frekuensi. A.3 Ukuran Tendensi Sentral 1. Nilai rata-rata hitung (mean) 1.1 Nilai rata-rata hitung dari sekumpulan bilangan x1, x2, ... , xn didefinisikan sebagai n
∑ xi
x = i =1 . n Contoh: Tentukan nilai rata-rata hitung dari 71, 72, 73, 74, 75! Jawab: n
∑ xi
71 + 72 + 73 + 74 + 75 = 73 . n n 1.2 Jika bilangan x1, x2, ... , xn masing-masing mempunyai frekuensi f1, f2, ... , fn, maka x=
i =1
=
n
∑ f i ⋅ xi
x = i =1
n
.
∑ fi
i =1
Contoh: Tentukan nilai rata-rata hitung dari 50, 55, 60, 65, 70 yang masing-masing mempunyai frekuensi 3, 2, 2, 2, 3! Jawab: n
∑ f i ⋅ xi
x = i =1
n
∑ fi
=
3 ⋅ 50 + 2 ⋅ 55 + 2 ⋅ 60 + 2 ⋅ 65 + 3 ⋅ 70 = 60 . 3+ 2+ 2+ 2+3
i =1
1.3 Jika f1 bilangan mempunyai nilai rata-rata m1, f2 bilangan mempunyai nilai rata-rata m2, ... , fn bilangan mempunyai nilai rata-rata mn, maka nilai rata-rata hitung gabungannya adalah 10
11 n
∑ f i ⋅ mi
x = i =1
.
n
∑ fi
i =1
Contoh: Jurusan Muamalat angkatan 2009 mempunyai 3 kelas. Nilai rata-rata ujian Statistika kelas pertama terdiri dari 35 mahasiswa adalah 75, kelas kedua terdiri dari 40 mahasiswa adalah 80, dan kelas ketiga terdiri dari 35 mahasiswa adalah 85. Tentukan nilai rata-rata ujian Statistika gabungan jurusan Muamalat! Jawab: n
∑ f i ⋅ mi
x = i =1
=
n
∑ fi
35 ⋅ 75 + 40 ⋅ 80 + 35 ⋅ 85 = 80 . 35 + 40 + 35
i =1
2. Median (Me) Median suatu kumpulan bilangan yang telah diurutkan x1, x2, ... , xn (x1 < x2 < ... < xn) adalah Me = x n +1 untuk n ganjil positif, dan 2
xn + xn
Me =
2
2
2
+1
untuk n genap positif.
3. Modus (Mo) Modus adalah ukuran yang sering muncul. Contoh: Tentukan modus dari 1, 2, 3, 3, 4, 5, 6. Jawab: 3. Tentukan modus dari 1, 1, 2, 2, 3, 3. Jawab: Tidak ada. 4. Kuartil (Q) Kuartil adalah nilai yang membagi data yang telah diurutkan menjadi empat bagian yang sama banyaknya menurut suatu aturan tertentu. a. Q1 disebut kuartil bawah, di mana 25% data ≤ Q1 atau 75% data ≥ Q1. b. Q2 disebut kuartil tengah (= median), di mana 50% data ≤ Q2 atau 50% data ≥ Q2. c. Q3 disebut kuartil atas, di mana 75% data ≤ Q3 atau 25% data ≥ Q3. A.4 Frekuensi Biasanya data penelitian yang telah terkumpul dikelompokkan menurut interval-interval kelas tertentu. Banyak data pada tiap kelas disebut frekuensi, dan tabel yang berisi susunan data penelitian yang telah dikelompokkan disebut tabel frekuensi atau distribusi frekuensi. Data yang disusun atau diringkaskan dalam suatu distribusi frekuensi disebut juga pengelompokan data. Perhatikan Tabel 2.1 distribusi frekuensi dari data tinggi mahasiswa berikut ini.
Yadi Nurhayadi
Modul Statistika Bab 2
12 Tabel 2.1 Tinggi 50 Mahasiswa Prodi Muamalat Tinggi (cm) Frekuensi 150 – 154 7 155 – 159 11 160 – 164 13 165 – 169 9 170 – 174 5 175 – 179 3 180 – 184 2 Jumlah 50
1. Interval Kelas, Batas Kelas, dan Tepi Kelas Interval seperti 150 – 154, 155 – 159, dst, disebut interval kelas. Nilai 150, 154, 155, 159, dst, disebut batas kelas interval. Nilai 150, 155, ... , 180 disebut batas bawah kelas. Sedangkan 154, 159, ... , 184 disebut batas atas kelas. Tepi kelas interval bergantung pada ketelitian data. Jika ketelitiannya hingga 1 angka desimal, biasanya tepi bawah kelas = batas bawah kelas – 0,5, tepi atas kelas = batas atas kelas + 0,5. Dengan demikian pada tabel 1 di atas, tepi bawah kelas interval yang pertama adalah 149,5; tepi bawah kelas interval kedua 154,5; dst; tepi bawah kelas interval teakhir 179,5. Demikian pula, tepi atas kelas interval pertama 154,5; kedua 159,5; dst. Selisih antara tepi atas kelas dengan tepi bawah kelas pada kelas interval yang sama disebut panjang interval kelas, yaitu panjang interval kelas = tepi atas kelas – tepi bawah kelas. Dikenal pula titik tengah interval kelas sebagai berikut. Titik tengah interval kelas = ½ (batas atas kelas + batas bawah kelas). Misalnya, titik tengah interval kelas pertama = ½ ( 154 + 150 ) = 152. Dengan demikian, titik-titik tengah interval kelas berikutnya adalah 157, 162, 167, 172, 177, dan 182. 2. Ketentuan-ketentuan Membuat Distribusi frekuensi Dalam membuat distribusi frekuensi dengan panjang interval kelas yang sama, terdapat ketentuan-ketentuan sbb. a. Cari angka terbesar dan terkecil dari data, lalu hitung jangkauannya (angka terbesar dikurangi angka terkecil). b. Tentukan banyaknya interval kelas yang dibutuhkan. Boleh memakai aturan Sturges, yaitu banyaknya interval kelas = 1 + 3,3 log n, di mana n adalah banyaknya data, serta hasil akhirnya dijadikan bilangan bulat. c. Tentukan panjang interval kelas yang diperkirakan dengan perhitungan jangkauan panjang interval kelas = . banyaknya interval kelas d. Pilihlah batas bawah kelas pertama (biasanya ditentukan berdasarkan angka terkecil dari data). e. Tentukan besar frekuensi tiap-tiap kelas interval. Hitung diawali dengan sistem turus.
Yadi Nurhayadi
Modul Statistika Bab 2
13 Catatan: - frekuensi untuk tiap kelas diusahakan tidak nol, - titik tengah interval kelas merupakan bilangan bulat (usahakan tidak pecahan), - saat membuat histogram, biasanya absis-nya adalah interval kelas, dan ordinat adalah frekuensinya.
3. Menentukan Nilai Rata-rata Hitung untuk Data Berkelompok a. Metode Simpangan Rata-rata (Step Deviasi) Jika A merupakan nilai rata-rata hitung sementara yang dipilih sembarang berdasarkan data, dan di = xi – A, dengan xi adalah titik tengah interval kelas, maka ∑ di x = A+ (*) n ∑ fi ⋅ di x = A+ (**). n Rumus (*) jika tidak ada angka yang berulang (tidak berfrekuensi), sedangkan rumus (**) jika terdapat frekuensi. Contoh Hitunglah nilai rata-rata hitung dari data: 55, 60, 65, 70, 75 dengan metode simpangan rata-rata. Jawab Ambil A = 60 (atau boleh angka lain berdasarkan data). Susun tabel berikut ini. Tabel 2.2 Menghitung x dengan Metode Step Deviasi xi di = x i – A 55 -5 60 0 65 5 70 10 75 15 25 ∑ di Maka
25 = 65 . 5 b. Metode Coding Jika interval-interval kelas mempunyai panjang interval kelas C, simpangan rata-rata di = xi – A dapat ditulis sebagai CUi dengan Ui = 0, ±1, 2, ..., maka nilai ratarata hitungnya adalah ∑ fi ⋅U i x = A+ ⋅C n x = 60 +
4. Menentukan Kelas Modus dan Modus untuk Data Berkelompok Modus dari suatu data berkelompok adalah angka dengan nilai frekuensi terbesar. Jika data berupa distribusi frekuensi, modusnya ditentukan oleh:
f 0 − f −1 C , M O = B + 2 f 0 − f −1 − f + 1
Yadi Nurhayadi
Modul Statistika Bab 2
14 dengan B tepi bawah kelas modus, C panjang interval kelas, f0 frekuensi kelas modus, f+1 frekuensi sesudah kelas modus, f-1 frekuensi sebelum kelas modus.
5. Menyusun Distribusi Frekuensi Kumulatif Distribusi frekuensi kumulatif adalah suatu daftar yang memuat frekuensifrekuensi kumulatif. Frekuensi kumulatif ada 2 macam: a. frekuensi kumulatif kurang dari adalah suatu total frekuensi dari semua nilai-nilai yang lebih kecil dari tepi bawah kelas pada masing-masing interval kelasnya, b. frekuensi kumulatif lebih dari adalah suatu total frekuensi dari semua nilai-nilai yang lebih besar dari tepi bawah kelas pada masing-masing interval kelasnya. Contoh: Bentuklah distribusi frekuensi kumulatif kurang dari dan lebih dari untuk tabel frekuensi besar Tabungan Ummat di BMI kantor kas Pondok Gede berikut. Tabel 2.3 Frekuensi Jumlah Tabungan Ummat Besar Tabungan Frekuensi (Juta) 1–5 2 6 – 10 3 11 – 15 3 16 – 20 7 21 – 25 11 26 – 30 9 31 – 35 8 36 – 40 3 41 – 45 2 46 – 50 2 ∑ 50 Jawab Tabel 2.4 Frekuensi Kumulatif Kurang Dari Besar Tabungan Frekuensi (Juta)
< 0,5 < 5,5 < 10,5 < 15,5 < 20,5 < 25,5 < 30,5 < 35,5 < 40,5 < 45,5 < 50,5
Tabel 2.5 Frekuensi Kumulatif Lebih Dari Besar Tabungan Frekuensi (Juta)
0 2 5 8 15 26 35 43 46 48 50
> 0,5 > 5,5 > 10,5 > 15,5 > 20,5 > 25,5 > 30,5 > 35,5 > 40,5 > 45,5 > 50,5
50 48 45 42 35 24 15 7 4 2 0
A.5 Tabel dan Kurva Tabel 2.3, 2.4, dan 2.5 disatukan untuk dikonversi menjadi grafik frekuensi kumulatif yang sering disebut ogive.
Yadi Nurhayadi
Modul Statistika Bab 2
15 Tabel 2.6 Distribusi frekuensi besar Tabungan Ummat BMI Kantor Kas Pondok Gede Tabungan (Juta)
Frekuensi
1–5 6 – 10 11 – 15 16 – 20 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50
2 3 3 7 11 9 8 3 2 2
Frekuensi Kumulatif Kurang Dari 0,5 0 5,5 2 10,5 5 15,5 8 20,5 15 25,5 26 30,5 35 35,5 43 40,5 46 45,5 48 50,5 50
50
50
45
45
40
40
Frekuensi Kumulatif
Frekuensi Kumulatif
35 30 25 20 15
Frekuensi Kumulatif Lebih Dari 0,5 50 5,5 48 10,5 45 15,5 42 20,5 35 25,5 24 30,5 15 35,5 7 40,5 4 45,5 2 50,5 0
35 30 25 20 15 10
10
5
5
Q1 Q2
0 0.5
Q3
0
5.5 10.5 15.5 20.5 25.5 30.5 35.5 40.5 45.5 50.5
0.5
5.5
10.5 15.5 20.5 25.5 30.5 35.5 40.5 45.5 50.5
Besar Tabungan (Juta)
Besar Tabungan (Juta)
Gbr 2.1 Frekuensi kumulatif kurang dari
Gbr 2.2 Frekuensi kumulatif lebih dari
Grafik frekuensi kumulatif seringkali disertai posisi kuartil bawah, median, dan kuartil atas pada grafik tersebut. Dalam hal ini harus ditentukan dahulu nilai kuartil bawah, median, dan kuartil atas dari data distribusi frekuensi berdasarkan rumus
in −∑ Qi = B + 4 f0
f C ,
di mana B adalah tepi bawah kelas kuartil ke i (i = 1, 2, 3), C adalah panjang interval kelas, ∑f jumlah frekuensi sebelum kelas kuartil ke-i, f0 frekuensi kelas kuartil ke-i, dan n banyaknya data (jumlah semua frekuensi). Contohnya dari tabel 2.6,
1 ⋅ 50 −8 5 = 18,714 ; Q1 = 15,5 + 4 7
Yadi Nurhayadi
2 ⋅ 50 − 15 5 = 25,045 ; dan Q2 = 20,5 + 4 11
Modul Statistika Bab 2
16
3 ⋅ 50 − 35 4 5 = 32,0625 . Q3 = 30,5 + 8 A.6 Ukuran Penyebaran (Dispersi) Untuk memperoleh gambaran terpencarnya data secara kuantitatif di sekitar nilai rata-rata hitung, dirumuskan suatu ukuran penyebaran atau ukuran dispersi, antara lain: jangkauan, simpangan kuartil, rata-rata simpangan, dan simpangan baku.
1. Jangkauan Jangkauan dari sekumpulan data adalah selisih antara nilai terbesar dan nilai terkecil dari data tersebut. Jangkauan = nilai terbesar – nilai terkecil. 2. Simpangan Kuartil (Jangkauan Semi Interkuartil) Simpangan kuartil dari sekumpulan data didefinisikan sebagai, QD =
1 2
(Q3 − Q1 )
3. Rata-rata Simpangan (Mean Deviasi) Rata-rata simpangan dari sekumpulan n bilangan x1, x2, ... , xn didefinisikan dengan 1 rata-rata simpangan = ∑ x − x = x − x . n Jika data x1, x2, ... , xn masing-masing berfrekuensi f1, f2, ... , fn, maka rata-rata simpangan didefinisikan sebagai ∑ f x−x = x−x rata-rata simpangan = n 4. Simpangan Baku (Deviasi Standar) Simpangan baku dari sekumpulan n bilangan x1, x2, ... , xn dilambangkan dengan S dengan formulasi
∑ (x − x )
2
S=
(x − x )
2
=
. n Jika data x1, x2, ... , xn masing-masing berfrekuensi f1, f2, ... , fn, maka simpangan bakunya dirumuskan dengan
∑ f (x − x )
2
S=
n
(x − x )
2
=
.
Variansi sampel adalah kuadrat dari simpangan baku (S2). Jika x1, ... , xn mempunyai variansi sampel S x2 , dan y1, ... , ym mempunyai variansi sampel S y2 , maka 2 S gab =
Yadi Nurhayadi
n ⋅ S x2 + m ⋅ S y2 n+m
.
Modul Statistika Bab 2
17
B. Peubah Acak (Pendalaman (Materi Perguruan Tinggi)) B.1 Pengertian Peubah Acak Seringkali pada percobaan/peristiwa statistik bukan titik-titik sampelnya yang menjadi perhatian, tetapi hasil numeriknya. Misalnya untuk ruang sampel yang memuat semua hasil yang mungkin jika satu mata uang dilantunkan tiga kali. S = {MMM, MMB, MBM, BMM, MBB, BMB, MBB, BBB}. Bila yang diamati adalah banyak muka yang muncul, maka hasil numerik (BBB) 0, 1, 2, 3 (MMM) akan menjadi perhatian berkaitan dengan titik-titik sampelnya. Bilangan 0, 1, 2, dan 3 tersebut akan ditentukan oleh hasil percobaan. Maka banyak kali muka yang muncul disebut peubah acak X, dan bilangan 0, 1, 2, dan 3 adalah harga/nilai dari peubah acak itu. Definisi 2.1 Suatu fungsi bernilai real yang harganya ditentukan oleh tiap anggota dalam ruang sampel disebut suatu peubah acak. Suatu peubah acak dinyatakan dengan huruf besar, misalnya X, sedangkan nilainya dinyatakan dengan huruf kecil yang berpadanan, misalnya x. Contohnya untuk lantunan uang di atas, X dengan x = 2 adalah anggota dari himpunan bagian A = {MMB, MBM, BMM} dari ruang sampel S. Jadi tiap nilai x menyatakan kejadian yang merupakan himpunan bagian dari ruang sampel. Titik-titik sampel dalam ruang sampel adakalanya berjumlah berhingga, atau tak berhingga tapi terdefinisi seperti bilangan bulat sehingga dapat dihitung. Definisi 2.2 Jika suatu ruang sampel mengandung titik yang berhingga banyaknya atau suatu deretan anggota yang benyaknya sama dengan banyaknya bilangan bulat, maka ruang sampel itu disebut ruang sampel diskret, dan peubah acak yang didefinisikan pada ruang sampel tersebut adalah peubah acak diskret. Adakalanya pula titik-titik sampel dalam ruang sampel berjumlah tak berhingga dan tidak dapat dinyatakan sebagaimana bilangan bulat, atau ruang sampelnya tidak diskret. Definisi 2.3 Bila ruang sampel mengandung titik sampel yang tak berhingga banyaknya dan sama banyak dengan banyak titik pada suatu garis, maka ruang sampel itu disebut ruang sampel kontinu, dan peubah acak yang didefinisikan di dalamnya disebut peubah acak kontinu. B.2 Distribusi Peluang Diskret Nilai dari suatu peubah acak diskret di dalam ruang sampel mempunyai peluang tertentu. Misalnya peluang x = 2 dari ruang sampel lantunan mata uang di atas, yaitu peluang muncul muka 2 kali {MMB, MBM, BMM} adalah 3/8. Peluang x itu dapat kita tulis semua sbb. x P(X = x)
0 1/8
1 3/8
2 3/8
3 1/8
Perhatikan bahwa x meliputi semua nilai yang mungkin sehingga jumlah semua peluang adalah 1. Peluang x sering dinyatakan dalam suatu rumus. Rumus seperti itu merupakan fungsi nilai numerik x yang dapat dinyatakan dengan f(x), atau g(x), atau h(x), dst. Jadi dapat ditulis f(x) = P(X = x), dengan demikian f(2) = P(X = 2).
Yadi Nurhayadi
Modul Statistika Bab 2
18
Definisi 2.4 Fungsi f(x) adalah suatu fungsi peluang atau distribusi peluang suatu peubah acak diskret X bila untuk setiap hasil x yang mungkin, 1. f ( x) ≥ 0 . 2.
∑ f ( x) = 1 . x
3. P( X = x) = f ( x) .
Definisi 2.5 Distribusi kumulatif F(x) suatu peubah acak X dengan distribusi peluang f(x) dinyatakan oleh
F ( x) = P( X ≤ x) = ∑ f (t ) t≤x
B.3 Distribusi Peluang Kontinu Definisi 2.6 Fungsi f(x) adalah fungsi padat peluang peubah acak kontinu X, yang didefinisikan di atas himpunan semua bilangan real R, bila 1. f ( x) ≥ 0 untuk semua x ∈ R 2.
∫
∞
−∞
f ( x)dx = 1 b
3. P(a < X < b) = ∫ f ( x)dx a
Definisi 2.7 Distribusi kumulatif F(x) suatu peubah acak kontinu X dengan fungsi padat f(x) diberikan oleh
F ( x) = P( X ≤ x) = ∫
x
−∞
f (t )dt
B.4 Distribusi Empiris Seringkali fungsi padat f(x) tidak diketahui karenanya bentuknya dimisalkan. Agar pemilihan f(x) tidak terlalu menyimpang, prosesnya didapat berdasarkan semua informasi data yang tersedia. Analisis distribusi data statistikdalam jumlah yang amat banyak akan terbantu jika disajikan dalam bentuk distribusi frekuensi nisbi. Dalam hal ini, data dikelompokkan dalam beberapa kelas untuk ditentukan perbandingan pengukuran data dalam tiap kelas. Selanjutnya buat tabel dan histogram peluangnya, lalu dari histogram itu taksir fungsi padat peluangnya. Demikian pula, kurva F(x) dapat ditentukan berdasarkan distribusi frekuensi kumulatif nisbi. Misalnya taksirlah bentuk f(x) dan F(x) dari data statistik usia nasabah perbankan berikut ini. Usia Nasabah (tahun) 15 – 19 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 Σ
xi
Frekuensi (fi)
Frekuensi Nisbi
17 22 27 32 37 42 47 52
3 8 9 11 7 7 3 2 50
0,06 0,16 0,18 0,22 0,14 0,14 0,06 0,04 1
Kendati bentuk f(x) telah ditaksir, tetapi rumusnya belum diketahui, sehingga nilai peluang yang didapat dari bentuk f(x) belum dapat diketahui. Pemahaman atas rumus fungsi-fungsi geometri seperti parabola, hiperbola, lingkaran, elips, dsb, akan membantu. Setelah rumus f(x) dketahui maka nilai peluang yang dicari dapat ditentukan dengan bantuan tabel yang sesuai. Yadi Nurhayadi
Modul Statistika Bab 2
19
B.5 Distribusi Peluang Gabungan Bila X dan Y dua peubah acak, distribusi peluang terjadinya secara serentak dapat dinyatakan dengan fungsi f(x,y), dinamakan distribusi peluang gabungan X dan Y. Definisi 2.8 Fungsi f(x,y) adalah fungsi peluang gabungan peubah acak diskret X dan Y bila 1. f ( x, y ) ≥ 0 untuk semua (x,y). 2. ∑∑ f ( x, y ) = 1 . x
y
3. P[( X , Y ) ∈ A] = ∑ A ∑ f ( x, y ) untuk tiap daerah A di bidang xy.
Definisi 2.9 Fungsi f(x,y) adalah fungsi padat gabungan peubah acak kontinu X dan Y bila 1. f ( x, y ) ≥ 0 untuk semua (x,y) 2.
∞
∫ ∫
∞
− ∞ −∞
f ( x, y )dxdy = 1
3. P[( X , Y ) ∈ A] = ∫
A
∫ f ( x, y)dxdy untuk tiap daerah A di bidan xy.
Bila distribusi peluang f(x,y) peubah acak X dan Y diketahui maka distribusi peluang X sendirian dan Y sendirian adalah g ( x ) = ∑ f ( x, y ) y
h ( y ) = ∑ f ( x, y ) x
untuk hal diskret, dan ∞
g ( x) = ∫ f ( x, y )dy −∞ ∞
h( y ) = ∫ f ( x, y )dx −∞
untuk hal yang kontinu. Distribusi peluang g(x) dan h(y), masing-masing didefinisikan sebagai distribusi marginal X dan Y. Bahwa distribusi marginal sesungguhnya adalah distribusi peluang masing-masing peubah dapat ditunjukkan dengan membuktikan bahwa syarat Definisi 2.4 atau Definisi 2.6 dipenuhi. Pada pasal B.1 telah diutarakan bahwa nilai x dari peubah acak X menyatakan kejadian yang merupakan himpunan bagian ruang sampel. Dengan menggunakan definisi peluang bersyarat pada bab 1, P( A ∩ B) P( B | A) = , di mana P(A) > 0. P ( A) Dengan A dan B kini menyatakan kejadian yang ditentukan oleh masing-masing X = x dan Y = y, maka P ( X = x, Y = y ) f ( x , y ) P(Y = y | X = x) = = , di mana g(x) > 0, P( X = x) g ( x) bila X dan Y peubah acak yang diskret. Jika distribusi peluang ini ditulis sebagai f(y | x) maka f ( x, y ) f ( y | x) = , g(x) > 0, g ( x) yang disebut distribusi bersyarat peubah acak diskret Y bila X = x. Dengan cara yang sama didefinisikan f(x | y) sebagai distribusi bersyarat peubah acak X jika Y = y. Yadi Nurhayadi
Modul Statistika Bab 2
20
f ( x, y ) , di mana h(y) > 0. h( y ) Fungsi padat peluang bersyarat peubah acak kontinu X bila Y = y, menurut definisi adalah f ( x, y ) , di mana h(y) > 0. f ( x | y) = h( y ) Sedangkan fungsi padat peluang bersyarat peubah acak kontinu Y jika X = x didefinisikan sebagai f ( x, y ) , g(x) > 0. f ( y | x) = g ( x) Untuk menentukan peluang peubah acak kontinu X jatuh antara a dan b bila diketahui bahwa Y = y, hitunglah f ( x | y) =
b
P(a < X < b | Y = y ) = ∫ f ( x | y )dx . a
Definisi 2.10 Misalkan X dan Y dua peubah acak, diskret maupun kontinu, dengan fungsi peluang gabungan f(x, y) dan distribusi marginal masing-masing g(x) dan h(y). Peubah acak X dan Y dikatakan bebas statistik jika dan hanya jika f(x, y) = g(x) h(y) untuk semua (x, y). Semua definisi untuk dua peubah acak dapat diperluas menjadi n peubah acak. Misalkan f(x1, x2, ..., xn) menyatakan fungsi peluang gabungan peubah acak X1, X2, ..., Xn. Distribusi marginal untuk X1 adalah g(x1) = ∑ x 2 ...∑ f ( x1 , x2 ,..., x n ) x2
xn
untuk hal diskret, dan ∞
∞
g ( x1 ) = ∫ ... ∫ f ( x1 , x 2 ,..., x n )dx2 dx3 ...dx n −∞ −∞
untuk hal kontinu. Demikian pula dapat dicari distribusi marginal gabungan, misalnya Ø(x1, x2), yaitu φ ( x1 , x 2 ) = ∑ ...∑ f ( x1 , x 2 ,..., x n ) untuk yang diskret, dan x3
xn
∞
∞
−∞
−∞
φ ( x1 , x 2 ) = ∫ ... ∫ f ( x1 , x 2 ,..., x n )dx3 dx 4 ...dx n untuk yang kontinu. Berbagai distribusi bersyarat dapat dicari. Sebagai contoh distribusi bersyarat gabungan X1, X2, X3, bila diketahui X4 = x4, X5 = x5, ..., Xn = xn, ditulis f ( x1 , x 2 ,..., x n ) f ( x1 , x 2 , x3 | x 4 , x5 ,..., x n ) = , g ( x 4 , x5 ,..., x n ) dengan g(x4, x5, ..., xn) distribusi marginal gabungan peubah acak X4, X5, ..., Xn. Perluasan Definisi 2.10 untuk peubah acak X1, X2, ..., Xn, agar saling bebas statistik menghasilkan definisi berikut. Definisi 2.11 Misalkan X1, X2, ..., Xn n peubah acak, diskret maupun kontinu, dengan distribusi peluang gabungan f(x1, x2, ..., xn) dan distribusi marginal masing-masing f1(x1), f2(x2), ..., fn(xn). Peubah acak X1, X2, ..., Xn dikatakan saling bebas statistik jika dan hanya jika f(x1, x2, ..., xn) = f1(x1) f2(x2) ... fn(xn). Yadi Nurhayadi
Modul Statistika Bab 2
21
B.6 Harapan Matematik Bila dua uang logam dilantunkan 16 kali dan X menyatakan banyaknya muncul muka pada tiap lantunan, maka X dapat bernilai 0, 1, dan 2. Misalkan percobaan itu menghasilkan tidak ada muka, satu muka, dan dua muka, masing-masing sebanyak 4, 7, dan 5 kali, maka rataan banyaknya muncul muka tiap lantunan adalah (0)(4) + (1)(7) + (2)(5) 4 7 5 = 0 + 1 + 2 = 1,06 . 16 16 16 16 Perhatikan, bilangan 4/16, 7/16, dan 5/16 adalah frekuensi nisbi untuk masing-masing hasil. Rataan banyaknya muka muncul pada tiap lantunan yang diharapkan terjadi dalam jangka panjang diistilahkan dengan nilai harapan atau harapan matematik yang dinyatakan dengan E(X). Definisi 2.12 Misalkan X suatu peubah acak dengan distribusi peluang f(x). Nilai harapan X atau harapan matematik X adalah E(X) = ∑ xf ( x) bila X diskret x
∞
= ∫ xf ( x)dx
bila X kontinu.
−∞
Jika terdapat fungsi g(x) dari peubah acak X, yaitu tiap nilai g(x) dapat ditentukan bila diketahui nilai X, maka dapat dinyatakan teorema 2.1 berikut.
Teorema 2.1 Misalkan X suatu peubah acak dengan distribusi peluang f(x). Nilai harapan fungsi g(X) adalah E[g(X)] = ∑ g ( x) f ( x) bila X diskret, x
∞
= ∫ g ( x) f ( x)dx
bila X kontinu.
−∞
Teorema di atas dapat diperluas menjadi definisi 2.13 berikut untuk perhitungan harapan matematik fungsi dengan beberapa peubah acak.
Definisi 2.13 Bila X dan Y peubah acak dengan distribusi peluang gabungan f(x, y), maka nilai harapan fungsi g(X, Y) adalah E[g(X, Y)]
= ∑∑ g ( x, y ) f ( x, y ) x
bila X dan Y diskret,
y
∞ ∞
=
∫ ∫ g ( x, y) f ( x, y)dxdy
bila X dan Y kontinu.
− ∞− ∞
Perhatikan bila g(X, Y) = X dalam definisi 2.13, kaitkan kembali dengan distribusi marginal X, maka E[g(X, Y)] = E(X)
= ∑∑ xf ( x, y ) = ∑ xg ( x) x
=
y
∞ ∞
∞
− ∞− ∞
−∞
∫
bila diskret,
x
∫ xf ( x, y )dxdy =
∫ xg ( x)dx
bila kontinu,
di mana g(x) adalah distribusi marginal X. Demikian pula jika h(X, Y) = Y, Yadi Nurhayadi
Modul Statistika Bab 2
22 = ∑∑ yf ( x, y ) = ∑ yh( y )
E[h(X, Y)] = E(Y)
x
=
y
∞ ∞
∞
− ∞− ∞
−∞
∫
bila diskret,
y
∫ yf ( x, y )dxdy =
∫ yh( y )dy
bila kontinu,
di mana h(y) adalah distribusi marginal Y.
B.7 Sifat Harapan Teorema 2.2 Bila a dan b tetapan, maka E(aX + b) = aE(X) + b. Teorema 2.3 Nilai harapan jumlah atau selisih dua atau lebih fungsi suatu peubah acak X sama dengan jumlah atau selisih nilai harapan fungsi tersebut, yaitu E[g(X) ± h(X)] = E[g(X)] ± E[h(X)]. Teorema 2.4 Nilai harapan jumlah atau selisih dua atau lebih fungsi peubah acak X dan Y adalah jumlah atau selisih nilai harapan fungsi tersebut, yaitu E[g(X, Y) ± h(X, Y)] = E[g(X, Y)] ± E[h(X, Y)] Teorema 2.5 Misalkan X dan Y dua peubah acak yang bebas, maka E(X, Y) = E(X) E(Y). B.8 Harapan Matematik Khusus Bila g(X) = Xk, teorema 2.1 menghasilkan nilai harapan yang disebut momen ke k di sekitar titik asal peubah acak X, yang dinyatakan dengan µ k′ . Yaitu
µ k′ = E ( X k ) = ∑ x k f ( x)
bila X diskret,
x ∞
=
∫x
k
f ( x)dx bila X kontinu.
−∞
Jika k = 1 maka µ1′ = E(X), yaitu nilai harapan peubah acak X itu sendiri yang menyatakan rataan peubah acak tersebut dan selanjutnya cukup ditulis µ saja. Jadi, µ = µ1′ = E ( X ) . Bila g(X) = (X – µ)k, teorema 2.1 memberikan nilai harapan yang disebut momen ke k sekitar rataan peubah acak X, ditulis µk. Dengan demikian, µ k = E[( X − µ ) k ] = ∑ ( x − µ ) k f ( x) bila X diskret, x ∞
= ∫ ( x − µ ) k f ( x)dx
bila X kontinu.
−∞
Momen kedua sekitar rataan, µ2, mempunyai kegunaan khusus karena memberi gambaran penyebaran pengukuran di sekitar rataan. Untuk seterusnya µ2 ini akan disebut variansi peubah acak X yang dinyatakan dengan σ x2 , atau lebih singkat σ 2 saja. Jadi
σ 2 = µ 2 = E[( X − µ ) 2 ] .
Akar positif dari variansi merupakan suatu ukuran yang disebut simpangan baku. Rumus lain σ 2 yang lebih mudah diberikan oleh teorema berikut. Teorema 2.6 Variansi peubah acak X adalah σ 2 = E( X 2 ) − µ 2 .
Yadi Nurhayadi
Modul Statistika Bab 2
23 Bila g ( X , Y ) = ( X − µ X )(Y − µY ) dengan µ X = E ( X ) dan µY = E (Y ) , maka definisi 2.13 akan menghasilkan nilai harapan yang disebut kovariansi X dan Y yang dinyatakan dengan σ XY atau kov(X, Y). Jadi σ XY = E [( X − µ X )(Y − µ Y )] = ∑∑ ( x − µ X )( y − µ Y ) f ( x, y ) x
=
bila X dan Y diskret,
y
∞ ∞
∫ ∫ (x − µ X )( y − µY ) f ( x, y)dxdy
bila X dan Y kontinu.
−∞ −∞
Kovariansi akan positif bila nilai X yang besar berpadanan dengan nilai Y yang besar dan nilai X yang kecil berpadanan dengan nilai Y yang kecil. Bila nilai X yang besar berpadanan dengan nilai Y yang kecil, atau sebaliknya, maka kovariansi akan negatif. Jika X dan Y bebas statistik maka kovariansi akan nol. Ada pula dua peubah mempunyai kovariansi nol tetapi tidak bebas statistik. Rumus lain σ XY yang lebih sederhana diberikan oleh teorema berikut. Terorema 2.7 Kovariansi dua peubah acak X dan Y dengan rataan masing-masing µ X dan µ Y diberikan oleh σ XY = E ( XY ) − µ X µ Y .
B.9 Sifat Variansi Teorema 2.8 Misalkan X peubah acak dengan distribusi peluang f(x), maka variansi g(X) adalah
[
]
σ g2 ( X ) = E (g ( X ) − µ g ( X ) )2 .
Teorema 2.9 Bila X suatu peubah acak dan b suatu tetapan, maka σ X2 +b = σ X2 = σ 2 . Teorema 2.10 Jika X suatu peubah acak dan a suatu tetapan, maka 2 σ aX = a 2σ X2 = a 2σ 2 Teorema 2.11 Bila X dan Y peubah acak dengan distribusi peluang gabungan f(x, y), 2 2 2 2 2 maka σ aX + bY = a σ X + b σ Y + 2abσ XY . Akibat 1 Jika X dan Y peubah acak yang bebas, maka 2 2 2 2 2 σ aX + bY = a σ X + b σ Y . Akibat 2 Bila X dan Y peubah acak yang bebas, maka 2 2 2 2 2 σ aX −bY = a σ X + b σ Y . B.10 Teorema Chebyshev Teorema Chebyshev Peluang bahwa setiap peubah acak X mendapat nilai dalam k simpangan baku dari nilai rataan adalah paling sedikit (1 – 1/k2), yaitu 1 P(µ − kσ < X < µ + kσ ) ≥ 1 − 2 . k ***
Yadi Nurhayadi
Modul Statistika Bab 2