BabVIIIDistribusi NormalDanDistribusi-Distribusi LainyangBerhubungan
KAT A KUNCI teori batas tengah adalah teori yang menyatakan bahwa rata-rata dari sejumlah angka yang
besar, distribusi variabel acak akan identik dengan distribusi normal. variabel acak kontinu adalah variabel acak yang terjadi pada sembarang bilangan riil dalam suatu jarak (range) tertentu; ini dikelompokkan oleh kurva fungsi kepekatan dimana luas di bawah kurva diantara dua angka mewakili probabilitas bahwa variabel acak akan berada diantara dua angka tersebut. distribusi normal merupakan distribusi dari variabel acak kontinu yang paling penting; fungsi kepekatannya akan menyerupai bentuk lonceng. .
KURVA BERBENTUK LONCENG Anggaplah anda membuat garik dari probabilitas jumlah kejadian munculnya sisi H dari pelemparan mata uang sebanyak 15 kali. (Lihat gambar 8.1). Atau misalnya anda memilih 1000 orang di jalan dan membuat diagram frekuensi dari tinggi mereka. (Lihat gambar 8.2). Gambar ini nampak sama. Kurva berbentuk lonceng ini disebutkurva normal yaitu kurva yang paling penting dalam statistik. Ada banyak contoh kuantitas yang terdistribusi menurut kurva normal:
·. ..
98
tinggi,berat atauIQ dari suatupopulasi hasil pengukuran kuantitas secara fisik seperti berat molekul dalam kimia. total pemunculan apabila anda melemparkan banyak dadu. jumlah pelanggan mingguan pada berbagai usaha.
8m:
Gambar 8.1 /-
.20
/
"'"'
/
\
/ I f I I I
.15
.10
\ \ \ \ \ \
/
\
/ .05
/
/
/
\
/
\
"'
~
"L:::::.
o
I
2
3
4
5
6
7
8
9
10
II
12
13
14
Pengambilan
Gambar 8.2
00
c
0 .c "
e
100
::I ...
50
59
60
61
62
63
64
65
66
61
68
69
70
71
72
73
74
75
76
77
78
79
tinggi
Distribusi normal seringditerapkan pada situasi dimana nilai ekstrim lebih sedikit terjadi daripada nilai moderatoDistribusi normal dapat juga digunakan sebagai pendekatan untuk distribusi binomial, ini diterapkan pada waktu anda menjumlahkan bersama-sama sebagian keeil distribusi variabel aeak yang bebas dan identik. Variabel aeak yang fungsi kepekatannya mengikuti kurva normal dikatakan mempunyai distribusi normal. Tetapi variabel aeak normal bukanlah variabel aeak diskrit seperti yang 99 - - - --
-
III
kita diskusikan pada bab 7. Sebagai alternatif, variabel acak nonnal adalah suatu contoh tipe yang berbeda yang disebut variabel aeak kontinu. VARIABELACAK KONTINU Anggaplah kita sedang memilih secara acak nama-nama dalam buku telepon, kemudian mengukur tinggi dari orang yang terpilih. Jika H adalah tinggi dalam kaki dari seseorang, kita dapat menganggap H sebagai variabel acak. Tetapi ini berbeda dari variabel acak yang lain yang telah kita diskusikan. Anggaplah kita mencoba mencatat semua nilai kemungkinan uotuk H. Jelaslah bahwa ada beberapa nilai yang tidak mungkin. Sebagai contoh, H tidak akan pernah lebih kecil dari 1/4 atau lebih besar dari 9.
Tetapi kita tahu bahwa kita tidak dapat menulis semua nilai
kemungkinan. Tingginya mungkin 5 kali, mungkin 5.1 kaki, atau mungkin 5.00001 kaki atau 5.0000000001 kaki. Dalam kenyataan, diasumsikan bahwa kita dapat mengukur tinggi dengan ketepatan yang sempurna (ini hanya teori, bukan dalam kenyataan), maka akan ada nilai kemungkinan yang tidak terbatas. Dalam kasus ini variabel acak diskrit tidak dapat digunakan. Sebagai alternatif kita menggunakan variabel acak kontinu. Berikut ini adalah beberapa contoh yang tennasuk dalam variabel acak kontinu: tinggi (dari lantai) titik dimana anak panah membentuk papan panah panjang waktu sampai cahaya bila lampu menYala panjang waktu sampai atom radioktif hancur panjang hidup seseorang Variabel acak diskrit lebih mudah untuk dimengerti. Tetapi variabel acak kontinu biasanya lebih mudah untuk diatasi secara matematis. Jika distribusi diskrit mempunyai banyak nilai kemungkinan yang berdekatan, maka ini biasanya dapat didekati dengan distribusi kontinu.
· ·· ·
1. Kurva yang paling penting dalam statistik adalah kurva yang berbentuk lonceng atau kurva normal yang menunjukkan misalnya distribusi dari tinggi populasi atau jumlah kejadian munculnya sisi H jika mata uang dilempar banyak kali. 2. Variabel acak kontinu dapat terjadi pada sembarang bilangan riil dalam jarak (range) tertentu. Sebagai contoh panjang waktu sampai baterai suatu mesin mati dan tinggi lomparan seorang siswa penari balet. FUNGSIDISTRIBUSIKUMULATIF KONTINU Sekarang kita mempunyai gambaran bagaimana menjelaskan perilaku variabel acak kontinu. Ada banyak kesamaan antara variabel acak diskrit dan vriabel acak kontinu, tetapi ada beberapa perbedaan penting. Kita dapat mengestimasi probabilitas seorang yang kita pilih dari buku telepon mempunyai tinggi kurang dari 6 kaki. Atau kita dapat menghitung probabilitas seseorang mempunyai tinggi lebih dari 50 kaki (dalam hal ini tentu samadengan nol). Dengan demikian kita dapat mendefinisikan fungsi distribusi kumulatif untuk variabel acak kontinu sarna seperti yang kita lakukan terhadap variabel acak diskrit. Kita akan
100
menggunakan huruf besar F untuk menyatakan fungsi distribusi kumulatif, jadi kita dapat membuat defmisi: F(a)
= Pr(X
~ a)
dimana X adalah variabel acak yang sedang kita diskusikan. Fungsi distribusi kumulatif kontinu mempunyai syarat-syarat yang sarna seperti yang kita temukan dalarn fungsi distribusi kumulatif diskrit: 1. F(a) selalu berada diantara 0 dan 1 2. bila a menjadi sangat besar, F(a) akan mendekati 1 3. bila a semakin kecil (mendekati negatif tidak terhingga), F(a) akan mendekati nol 4. F(a) tidak pemah menurun. Garnbar 8.2. F(a)
115 120 125 130 135 140
145 I3J
155 160 165
a
Berikut ini adalah dua hal penting yang perlu diperhatikan: 1. Jika kita ingin menemukan probabilitas bahwa X lebih besar daripada nilai tertentu, kita dapat menggunakan formula: Pr(X > a)
2.
= 1 - Pr(X
< a)
= 1 - F(a)
Jika ingin menemukan probabilitas bahwa X akan berada diantara dua nilai tertentu, b dan c kita dapat menggunakan formula ini: Pr(b < X < c)
= F(c) - F(b)
Garnbar 8.3 menunjukkan fungsi distribusi kumulatif untuk tinggi sekelompok orang. Suatu contoh dari variabel acak kontinu adalah variabel acak tertentu yang tidak berubah, dimana variabel acak yang sama terjadi pada sembarang nilai dalarn interval tertentu. Sebagai contoh, variabel acak Y mempunyai kemungkinan yang sarna terjadi pada 101
-
i:'IIIIIIIIIII!
sembarang nilai antara 0 dan 3. Kemudian probabilitas bahwa Y akan kurang dari 1 adalah 1/3, probabilitas bahwa Y akan berada antara 1 dan 11/2adalah 116dan seterusnya. Jika kita ingin membuat grafIk fungsi distribusi kumulatif untuk Y, dapat kita lihat pada fungsi yang ditunjukkan oleh gambar 8.4. Gambar 8.4
F(y)
o
2
4
FUNGSI KEPEKATAN PROBABILITAS KONTINU Sekarang marilah kita mencari probabilitas bahwa Y akan tepat sama dengan 2. Sembarang angka dari 0 sampai 3 mempunyai kesempatan yang sama untuk terpilih, dengan demikian bila N adalah jumlah angka dari 0 sampai 3, maka Pr(Y =2) = IIN. Tetapi jumlah angkadari 0 sampai 3 tidak terbatas (misalnya, 0.01, 0.011, 0.0111, 0.01111 dan seterusnya), ini berarti bahwa Pr (Y
= 2) = 1/ = 0 ~
Secara umum ini terjadi untuk variabel acak kontinu: Probabilitas bahwa sembarang variabel acak akan terjadi sama dengan DOl. Dengan demikian kita tidak dapat mendefmisikan fungsi kepekatan untuk variabel acak kontinu dengan cara yang sama seperti kita mendefInsikan fungsi kepekatan untuk variabel acak diskrit. Kita memerlukan pedekatan barn. Ingatlah bahwa ada hubungan antara fungsi kepekatan untuk variabel acak diskrit dan diagram frekuensi untuk sampel. Dengan demikian kita mulai dengan menggambar diagram frekuensi untuk berat orang-orang dalam sampel tertentu (lihat gambar 8.5). Ingatlahbahwa tinggi masing-masing batang tidakmencerminkan jumlah orang yang mempunyai berat yang sama. Tetapi lebih menunjukkan pada jumlah orang-orang yang mempunyai berat antara dua nilai tertentu. Sebagai contoh: tinggi batang antara 140 dan 145 pon adalahjumlah orang di dalam sampel yang mempunyai berat antara 140 dan 145 pon. Kita menyebut lebar dari masing-masing batang Ax. (A adalah hurnf yunani delta). Dalam kasus ini Ax = 5.
102
Garnbar 8.5
«D
01)
c
DJ
0 .c ..
e " ...,
:m 100
110
115
120 125 130 135 140 145 1~
155 160 165 170
Bera1
Dengan analogi kita dapat menggarnbar fungsi kepekatan yang mendekati tinggi dari fungsi dalam sembarang interval sarna dengan probabilitas variabel acak yang mempunyai sembarang nilai dalam interval itu. Akan lebih baik lagi bila kita membuat tinggi masingmasing batang sarnadengan probabilitas dari interval dibagi dengan Ax, lebar dari batang. (Lihat garnbar 8.6). Maka: * Pr(a < X a + Ax) tinggi batang antara a dan a + Ax
=
dan kemudian Pr(a < X a + Ax)
= f(a)
Ax
Anggaplah kita ingin mengetahui probabilitas bahwa X akan berada diantara dua nilai a dan b, dan kemudian mengalikannya dengan Ax. Tetapi karena f(x) adalah tinggi dari masing-masing batang dan A adalah lebar batang, maka f(x) Ax adalah luas batang. Dengan demikian probabilitas X akan berada di antara a dan b sarnadengan luas seluruh batang antara a dan b (lihat garnbar 8.7).
103 - - -
-
Gambar8.6
I{x) ..
c
0 .c ..
e I("J)----.=
r
r-i r-i
I
r
-
--,
L I I I I
~
f I I I
, 11 I I- ., I I I- ., I x
Berat
Gambar 8.7
I(x)
I I-I '-I
I
_J I I ~
J I I I x Pr (a<x
=daerah
bayangan
DEFINISI DARI FUNGSI KEPEKA T AN VARIABEL ACAK KONTINU Berikut ini adalah definisi dasar dari fungsi kepekatan untuk variabel acak kontinu: Luas di bawah fungsi antara dua nilai adalah probbilitas bahwa variabel acak akan berada diantara dua nilai. Tetapi diagram batang hanyalah suatu pendekatan untuk mewakili fungsi kepekatan variabel acak kontinu. Kita akan mendapatkan pendekatan yang lebih baik dengan membuat batang yang lebih sempit. Pada waktu batang menjadi sangat sempit, fungsi kepekatan nampak seperti kurva yang halus. (Lihat gambar 8.8).
104
~
Gambar 8.8
t{x)
x Pr (a<x
=daerah
bayangan
Kita akan rnernbuatdefinisi: Fungsi f(x) adalah fungsi kepekatan untuk variabel aeak X jika luas di bawah kurva Y
= f(x)
sebelah kiri dari garis x = b, sebelah kanan dari garis x
=
a dan di ata surnbu x sarna dengan Pr (a < X < b). (Ingatlah bahwa huruf besar rnewakili variabel aeak dan huruf keeil rnewakili variabel asal). Kita dapat rnengekspresikan luas ini dalam bentuk yang lebih sederhana: luas f(x) dari a ke b
untuk rnengartikan "Luas di bawah kurva f(x) antara a dan b". Kita tahu bahwa F(x) adalah fungsi distribusi kurnulatif, rnaka: luas f(X) dari a ke b= Pr(a < X < b) = F(b) - F(a) Sekarang kita perhatikan interval dari negatif tidak terhingga ke positip tidak terhingga. Kita tabu bahwa F(+oo) - F(-oo) = Pr(-oo) < X < +00) = I
karena nilai X adalah sesuatu yang berada diantara -00 dan + 00 (di sini tidak ada pilihan lain). Ini berarti bahwa: luas f(x) dari -00 ke +00
=1
Dengan kata lain, totalluas di bawah fungsi f(x) harns sarna dengan 1. Jika f(x) tidak rnernpunyai sifat ini, rnaka ini tidak dapat dinyatakan sebagai fungsi kepekatan. Kita dapat rnenunjukkan bahwa kondisi ini diternukan untuk fungsi kepekatan dari variabel tertentu Y (Iihat gambar 8.9)
105
--
---
. Gambar8.9 f\:x)
1/3
o
1 Area
2 = (1/3)
3 (3)
y
=1
Untuk menghitung probabilitas bahwa variabel acak kontinu berada diantara dua angka, maka sebaiknya menghitung luas di bawah fungsi kepekatan antara dua angka tersebut. Perhitungan luas di bawah kurva menghendaki penggunaan teknik kalkulus yang disebut "integral". Tetapi jika anda menggunakan kalkulus, anda tidak mungkin menemukan formula yang sederhana untuk luas di bawah kurva yang banyak digunakan dalam statistik, jadi sebaiknya melihat tabel untuk menemukan luas di bawah kurva. Nanti kita akan menunjukkan bagaimana menggunakan tabel untuk menemukan luas di bawah fungsi kepekatan normal. NIL AI HARAPAN DAN VARIAN VARIABEL ACAK KONTINU Nilai harapan (atau mean) dari variabel acak kontinu adalah nilai rata-rata yang akan munculjika variabel acak itu diamati berkali-kali. (Kita tidak akan menjelaskan bagaimana menghitung harapan dari variabel acak kontinu dalam buku ini.) Jika X adalah variabel acak kontinu, dan kita tahu E(X) dan E(X2), kita dapat menghitung varian dengan cara yang sarna seperti yang kita lakukan terhadap variabel acak diskrit: Var(X)
= E(X2)
- [E(X)F
YANG HARUS DIINGA T 1.
2.
Fungsi kepekatan untuk variabel acak kontinu adalah fungsi dimana luas di bawah fungsi itu dan luas diantara dua angka adalah probabilitas variabel acak tersebut berada diantara dua angka. Fungsi ini harns selalu positip dan totalluas di bawah fungsi harns sarna dengan 1.
DISTRIBUSI
NORMAL
SIFAT-SIFAT DISTRIBUSI NORMAL Distribusi normal adalah contoh dari distribusi variabel acak yang kontinu. Dalarn kenyataan ada banyak distribusi normal yang berbeda-beda. Distribusi normal dapat diidentifIkasi dengan rata-rata (mean) dan varian (atau deviasi standar). Mean diletakkan 106
pada puncak distribusi. Varian menentukan bentuk dari distribusi apakah tersebar atau terkonsentrasikan dekat puncak. Jika X adalah variabel acak normal dengan mean J.ldan varian S2,maka fungsi kepekatan (densitas) akan ditunjukkan oleh persarnaan ini: 1 f(x) =
e-(1/2)
[x - A.)/cr]2
-.J21tG Dimana e adalah angka khusus yang harnpir mendekat 2,71827 dan 1t adalah angka khusus yang nilainya sekitar 3,14159. Gambar 8.10menunjukkan 4 distribusi normal yang mempunyai varian yang sarnatetapi memiliki rata-rata yang berbeda (mean). Gambar 8.11 menunjukkan 4 distribusi normal yang mempunyai rata-rata (mean) yang sarnatetapi memiliki varian yang berbeda. Luas di bawah masing-masing kurva adalah 1,dan ini hanya berlaku untuk distribusi probabilitas. Bagian atas dan bawah dari kurva disebut tails (ekor) dari distribusi. Ekor dari distribusi tidak pernah tepat menyentuh sumbu x. Dengan demikian variabel acak normal mungkin dapat terjadi pada sembarang nilai, termasuk nilainilai yang letaknya jauh dari mean. Tetapi anda dapat melihat bahwa tidak ada daerah yang cukup besar di bawah ekor kurva, jadi kesempatan untuk mengarnati yang jauh dari mean kecil. Gambar 8.10
-20
-10
o
10
20
30
40
50
60
Gambar 8.11
107
YANG HARUS DllNGA T 1. Distribusi nonnal adalah distribusi variabel acak umum yang muncul pada banyak situasi dimana nilai ekstrim lebih sedikit daripada nilai moderato 2. Graflk dari fungsi kepekatan variabel acak nonnal nampak seperti bentuk lonceng dengan puncak terletak pada mean (1). 3. Varian a2 menentukan bentuk dari kura. Jika nilai variannya besar, berarti kurva akan lebih melebar. SIFAT TAMBAHAN DARI VARIABEL ACAK NORMAL Jika x adalah variabel acak nonnal dengan mean j.1danvarian 02Y =ax + b dimana a dan b adalah 2 konstanta, maka Y mempunyai distribusi nonnal dengan mean aj.1+ b dan varian
dd. Anggaplah juga x dan y dua variabel acak bebas dengan distribusi nonnal (dua variabel acak dikatakan variabel bebas jika keduanya tidak saling mempengarnhi). Anggaplah bahwa: E(X)
=,
IIY
Var(X)
= 02 x""y E(Y) =
II
dan Var(Y)
= 02 y.
Jika kita membuat variabel acak barn dengan menjumlahkan kedua variabel, V =X + Y, maka V akan juga mempunyai distribusi nonnal (kita telah tahu, bahwa E(U) = j.1x+ j.1ydan Var(V) = 02x + 0 Y2. .
Sebagai contoh anggaplah anda memutuskan untuk masuk dalam usaha hamburger dengan membuka dua rumah makan yang lokasinya berbeda. Jumlah hamburger yang yang anda jual setiap hari di dalam kota ditunjukkan oleh variabel acak nonnal dengan mean 200 dan varian 1600. Jumlah dari hamburger yang dijual di pinggir kota mempunyai distribusi nonnal dengan mean 100dan varian 400. Makinjumlah totalhamburger yang dapat andajual mempunyai distribusi nonnal dengan rata-rata (mean) 300 dan varian 2000. Untuk menemukan probabilitas yang dihubungkan dengan distribusi nonnal kita harns dapat menghitung luas dibawah kurva. Perhatikan variabel acak nonnal x dengan mean j.1 = 20 dan deviasi standar a = 5 (lihat gambar 8.12). Jika kita ingin menemukan probabilitas bahwa x akan lebih besar dari 20. Karena distribusi adalah simetris, totalluas di bawah kurva di atas rata-rata adalah sama dengan totalluas di bawah mean (rata-rata). Dengan demikian probabilitas bahwa x akan lebih besar dari 20 dadalah 0,5. Begitu pula probabilitas bahwa sembarang variabel acak nonnal akan lebih besar dari rata-ratanya adalah sama dengan 0,5.
DISTRIBUSI NORMAL STANDAR Dalam kebanyakan kasus, apabila kita ingin mengetahui luas di bawah kurva nonnal, kita harns melihat tabel. Tidak mungkin untuk menyiapkan tabel yang terpisah untuk setiap distribusi nonnal, untuk setiap rata-rata (mean) yang mungkin dan setiap varian yang mungkin. Kita dapat menemukan hasil untuk sembarang distribusi nonnal dengan melihat
pada tabel distribusinonnal yangmempunyairata-rata(mean)=j.1 =0 dan varian 02 Distribusi nonnal khusus ini disebut distribusi normal standar.
108
= 1.
Anggaplah bahwa Z adalah variabel acak dengan fungsi kepektan nOrn1alstandar. Gambar 8.13 menunjukkan graflk dari fungsi kepekatan untuk Z. Anggaplahjuga bahwa kita ingin mengetahui probabilitas Z berada di antara 0 dan 1. Kemudian kita ingin menghitung luas di bawah kurva antara 0 dan 1 (lihat gambar 8.14). Sayang tidak ada formula yang sederhana yang menjelaskan pada kita berapa luas itu. Kita hams melihat hasilnya pada tabel seperti tabe18.1 atau tabel A3.1 di bagian belakang buku ini. Tabel8.1 Tabel Variabel Acak Normal Standar
z 0 0.2 0.4 0.6 1.8 1.0 1.2 1.4 1.6
Pr(Z < z)
=
z
(z)
1.8 2.0 2.2 2.4 2.6 2.8 3.0 3.5
0.5000 0.5793 0.6554 0.7257 0.7881 0.8413 0.8849 0.9192 0.9452
Pr(Z < z)
=
(z)
0.9641 0.9773 0.9861 0.9918 0.9953 0.9974 0.9987 0.9998
Gambar 8.12
1.1=20
Pt (x>20)
= 12
109
---
Gambar 8.13 y .4
x
Gambar 8.14
Pr (0<2:< I)
= daerah
bayangan
Tabel di atas menyajikan fungsi distribusi kumulatifyang mengatakan pada anda bahwa probabilitas Z akan kurang dari nilai z (hurufY unani!ll (phi) sering digunakan untuk mewakili fungsi ini.!II(z) samadengan Pr(Z < z». Tabel ini hanya menyajikan nilai positip dari z, tetapi kita dapat menggunakan formula !II(-z) 1 -!II(z) jika kita ingin mengetahui nilai dari fungsi angka negatip.
=
Probabilitas bahwa Z akan berada diantara dua angka a dan b dapat ditemukan dengan formula: Pr(a < Z < b)
= !II(b)
-!II (a)
Kita telah menggambarkan bahwa 0(0) =0.5. Kita dapat melihat dari tabel bahwa 0(1) Dengan demikian probabilitas bahwa Z akan berada antara -1 dan 0 adalah 0.8413
=0.8413.
- 0.5 = 0.3413.
Karena fungsi kepekatan simetris, kita dapat melihat bahwa probabilitas Z berada antara -1 dan 0 adalah 0.3413. (Lihat gambar 8.15).
110
Gambar 8.15
o Pr (0<2:<1)
= Pr(0<2:
Kita dapat menjumlahkan dua probabilitas bersama-sama. Pr(-l M < 0 + (0 < Z 1) = 0.3413 + 0.3413 Pr(-l , Z < 1) = 0.6826
Dengan demikian 68% kemungkinan variabel acak normal standar akan berada antara -1 dan 1. Dengan kata lain, ada 68% kemungkinan nilai dari variabel acak normal standar berada dalam satu deviasi standar dari rata-ratanya (mean). (Dalam kasus ini deviasi standar = 1 dan mean =0). Hal khusus inijuga terdapat pada sembarang variabel acak normal, dengan mengabaikan rata-rata (mean) dan deviasi standar: ada 68% kesempatan bahwa nilai dari variabel acak nomral standar akan berada dalam satu deviasi standar rata-ratanya (mean). Sebagai contoh, variabel X adalah variabel acak normal dengan mean 200 dan deviasi standar 30, maka ada 68% kemungkinan bahwa X berada antara 170 dan 230. Kitajuga dapat menggunakan tabel untuk menunjukkan bahwa ada 95% kemungkinan Z berada antara -1.96 dan 1.96. Secara umum kita dapat mengatakan bahwa sembarang variabel acak mempunyai 95% kemungkinan kurang sekitar 2 deviasi standar dari rataratanya (mean). YANG BARUS DIINGA T 1.
Sembarang variabel acak normal mempunyai kemungkinan sebesar 68 persen berada di dalam satu deviasi standar dari rata-ratanya (mean). 2. Sembarang variabel acak normal mempunyai kemungkinan sebesar 95% berada dalam dua deviasi standar rata-ratanya (mean) Akan sangat membantu bila kita mengetahui bahwa variabel acak normal standar berada di antara a dan -a, dimanaa adalah angka tertentu. Untuk membuat l;ebih baik lagi, tabel A3.2 di bagian belakang buku ini mencatat nilai-nilai ini. Sebagai contoh, tabel menunjukkan bahwa probabilitas Z berada antara -0.5 dan 0.5 adalah 0.3830.
111 -----
Nitai dari variaOOl acak Donnal standar dapat dipercaya dengan apapun, karena fungsi kepekatan tidak pemah menyentuh sumbu. Tidak ada angka k seperti Pr(Z > k) = o. Tetapi anda dapat melihat dari tabel A3.1 bah~a hanya ada 0.0002 probabilitas bahwa z lebih OOsar dari 3.5. Nilai yang terlalu besar jarang terjadi sehingga kita tidak perlu takut tentang kemungkinan bahwa Z tejadi pada nilai ekstrim. Kita dapatmenggunakan taOOlDonnal standaruntuk menemukan probabilitas sembarang variabel acak nonna1 dengan cara seperti berikut ini: anggaplah Y mempunyai distribusi nonnal dengan rata-rata (mean) 6 dan varian 9, dan kita ingin mengetahui apakah Y akan berada diantara 5 dan 8. Kita dapat menciptakan variabel Z:
y-6 Z= 3 yang mempunyai distribusi nonnal dengan mean 0 dan varian 1. Jelaslah bahwa jika Y berada diantara 5 dan 8,Z akan berada antara-1/3 dan 2/3. Sekarangkita dapat memperhatikan probabilitas pada tabel: P(5 < Y < 8)
= P(-1/3 < Z < 2/3) = !6(0.6667) - !6(-0.3333) = 0.7486 - (1 - 0.6293) = 0.7486
- 0.37-7
= 0.3779
Secara umum jika X adalah variabel acak nonnal dengan mean Il dan varian (J2,maka (X - Il)/s adalah variabel acak nonnal standar. Sebagai contoh, anggaplah kita ingin mengetahui probabilitas bahwa anda akan menjual1ebih dari 230 hamburger pada tokok anda di dalam kota,. Misalnya X mewakili jumlah hamburger. Dalam kasus ini Il =200, S2 = 1600 dan a = 40. Marilah kita membuat variabel acak nonnal standar Z, :
Z= ,
40
Jika X1lebih besar dari 230, maka Z,lebih besar dari 3/4. Tabel A3.1 mengatakan pada kita probabilitas ini terjadi adalah: 1 - Pr(Zl
< 0.75)
= 1 - 0.7734 = 0.2266.
Sekarang anggaplah kita ingin mengetahui probabilitas bahwa anda akan menjual total hamburger lebih dari 330 di duna lokasi. Misalnya X adalah jumlah total hamburger. Kemudian
Il = 300,cr2 = 2000,(J X - 300 Z= 44.72 112
=44.72. Kita mengubah ke dalam variabel acak nonnal standar:
Jika X > 330, maka Z > 0.671, dan probabilitas hal ini terjadi adalah 0.2514. YANG HARUS DnNGA T 1.
2.
3.
Variabel acak normal standar adalah variabel acak normal dengan mean 0 dan varian 1. Tabel A3.1 di bagian belakang buku ini dapat digunakan untuk menghitung probabilitas variabel acak normal standar berada diantara dua angka. Distribusi normal standar juga dapat digunakan untuk menemukan probabilitas sembarang variabel acak normal. Jika x adalah variabel acak normal dengan mean Jldan varian cr2, maka (X - Jl)/cr mempunyai distribusi normal standar. Variabel acak Z = (X - Jl)/cr mempunyai distribusi normal standar. Fungsi !II(z)adalah fungsi distribusi kumulatif Z: !II(z) = Pr(Z < z)
Fungsi ini balik untuk: !II(0) =5
= 1 - !II (z)
!II (-z)
Pr(Z
. b) = 1 - !II(b)
Pr(a < Z < b)
= !II(b)
-!II (a)
b - Jl Pr(s<X
(
~
a - Jl
)
-!II
(
~
)
4.
Jika anda mengalikan variabel acak normal dengan suatu konstanta, maka hasilnya berupa variabel acak normal. Jika anda menjumlahkan dua variabel acak bebas, hasil yang didapat juga merupakan variabel acak normal. 5. Secaraumumjika XI mempunyaidistribusidenganmean ~ dan varian cr)2, dan X2 mempunyai distribusi dengan mean ~ dan varian cr/, maka variabel acak ini:
akan mempunyai distribusi normal dengan mean (cl~ + c2~ + c3) dan varian (C)2crI2+ c/cr/), dimana c)' c2 dan c3 dapat berupa sembarang konstanta.
TEORIBATAS TENGAH(CENTRALLIMIT THEOREM) Sekarang kita akan menyajikan aspek dari distribusi normal yang mengagumkan. Anggaplah X adalah variabel acak dengan distribusi sembarang. X dapat mempunyai distribusi yang tidak nampak seperti distribusi normal dan ini bisa diskrit ataupun kontinu. Seperti biasa E(X) =Jl dan Var(X) =cr2. Kita mengambil sampel acak yang berukuran n dari distribusi XI,~,
.., Xu'
113
-
--
--
--
-
--
Anggaplah X sarnadengan rata-rata dari semuajumlah ini.Dalarn bab 6 kita menemukan bahwa E(X)
= f.!dan
Var(X)
= (52/n.
Sekarang bagian yang mengagumkan adalah: Ukuran sarnpel yang menjadi sangat besar, distribusi dari X akan mendekati distribusi nonnal. Hasil ini disebut teori batas tengah. Keistimewaan dari teori ini adalah dapat diterapkan untuk sembarang variabel aCak' (Jika X yang dipilih dari distribusi nonnal, maka akan mempunyai distribusi nonnal untuk sembarang ukuran sampel).
x
x
Kita dapat mejmbuat korolaris sederhana. Jika kita menjumlahkan semua secara bersamaan., hasilnya juga akan memptinyai distribusi nonnal. Pada waktu ini rata-rata (mean) nu dan varian ns2.Atau bila kita menghitung variabel acak:
z= (5
Kemudian Z akan mempunyai distribusi nonnal standar. Karena distribusi binomial dapat dipertimbangkan sebagai penjumlahan dari kelompok dua nilai variabel acak, teori batas tentah mengatakan bahwa fungsi kepekatan binomial mulai nampak seperti ditribusi nonnaljika n menjadi besar. Ingatlah bahwa ini bekerjajika distribusi binomial adalah distribusi diskrit dan distribusi nonnal adalah distribusi kontinu. Tabel 8.2 menggarnbarkan apa yang terjadi dengan meningkatnya n dan fungsi kepekatan binomial digambarkan dalam gambar 8.16. Tentu ada beberapa keterbatasan untuk pendekatan nonnal. Variabel acak nonnal mungkin berada antara negatip angka yang tidak terhingga dan positip angka yang tidak terhingga, dimana variabel acak binomial harns berada antara 0 dan n. Tetapi probabilitas bahwa variabel acak nonnal akan terjadi pada nilai ekstrim sangat kedl, jadi tidak ada penyebab ketakutan. Secara praktis pendekatan nonnal tepat bila n > 30, np > 5 dan n(1 - p) >5
114
Gambar 8. 16
. '[ . .
.
.2
,[ 0
, 1
, 2
. , 3 1t=6
, 4
.
.3
J . .
.1
0
, 5
.
,
1
2
.
. .
.
,
,
. ,
.. .
3 4 It= 10
5
6
8
,
7
,
9
.
.20
. .
. .
.15
.10
.05
I 0
..
.
. ..
, , , , . , , , , , t I , , , , . , , , 123456789IODI21314151617181920 1t=20
115 --
-
----
--
. ..
.15
. . . . . .. . .
.10
.05
----
o
2
4
6
8
10 12
14
16 18
20
22
24
26 28
30
11:=30
Contoh lain, misalnya fungsi kepekatan untuk angka adalah hasil dari perguliran dadu. (lihat tabel 8.3 dan gambar 8.17). . fungsi kepekatan ini tidak narnpak seperti distribusi normal. Tetapi bila anda menggulingkan dua dadu, fungsi kepekatan dan jika anda rnenambah jumlah perguliran, fungsi kepekatan nampak lebih seperti fungsi kepekatan normal. Tabel 8.2: Perbandingan Fungsi Kepekatan Probabilitas Normal dan Binomial Pr(X = k)
p=0.5 n = 10
n=6
k Binomial Normal Binomial Normal 00 103 0.0417
0.0002
0.001 0.0003
0.0938 0.2344
3
0.3125 0.3257
0.1172 0.1134
0.0011 0.30013
0.2344 0.0938
0.2051 0.2461 0.2051 0.1172 0.0439 0.0098
0.0046 0.0148 0.0370 0.0739 0.1201 0.1602 0.1762 0.1602 0.1201 0.0739 0.0370 0.0148
0.2334 0.0859
0.0098 0.0439
Binomial Normal Binomial Norma
1 2 4 5 6 7 8 9 10 11 12 13 14 15
0.0859 0.2334
n=30
n=20
0.2066 0.2523 0.2066 0.1134 0.0417 0.0103
0.0049 0.0146 0.0360 0.0425 0.1196 0.'1614 0.1784 0.1614 0.1196 0.0725 0.0360 0.0146
-
-
-
-
0.0001 0.0006 0.0019 0.0055 0.0133 0.0280 0.0509 0.0806 0.1115 0.1354 0.1445
0.000 0.000 0.002 0.005 0.013 0.027 0.050 0.079 0.111 0.136 0.145
-
YANG HARUS DIINGA T 1. Toeri batas tengah mengatakan bahwa rata-rata dari sejurnlah besar data yang bebas, distribusi variabel acak akan rnernpunyai distribusi normal. 116
2.
Teori ini dapat diterapkan pada sembarang distribusi variabel acak.
Gambar 8.17
......
.2
.r
salu dadu ,
0
.2
f
.1
t I
0
.3
.2 .1
o
I
2
. . . I
I
23
, 3
, 6
..
.
dua dadu
, , , , , , , I I 4 5 67 8 9 IOn 12
. .... . . . . . liga dadu . . . . .
3 45 67 89 IOn12131415161718
. . . o
, 5
.. . . .
.10
.05
, 4
. . .
.. . . .
.. .. ..
empal dadu
4 5 6 7 8 9 IOn 12131415161718192021222324
117
-
.10
.05
.. 56789
..
.. .... . .. . . .
..
lima dadu
..
IOn 12131415161718192021222324252627282930
Tabel 8.2 1
Jml Dadu:
No. 1 2 .3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
118
3
2
5
4
Jml
Proba-
Jml
Proba-
Jml
Proba-
Jml
Proba-
Jrnl
Cara
bilitas
cara
bilitas
cara
bilitas
cara
bilitas
cara
1 1 1 1 1 1
0.167 0.167 0.167 0.167 0.167 0.167
1 2 3 4 5 6 5 4 3 2 1
0.028 0.056 0.083 0.111 0.139 0.167 0.139 0.111 0.083 0.056 0.028
1 3 6 10 15 21 25 27 27 25 21 15 10 6 3 1
0.005 0.014 0.028 0.046 0.069 0.097 0.116 0.125 0.125 0.116 0.097 0.069 0.046 0.028 0.014 0.005
1 4 10 20 35 56 80 104 125 140 146 140 125 104 80 56 35 20 10 4 1
0.001 0.003 0.008 0.015 0.027 0.043 0.062 0.080 0.096 0.108 0.113 0.108 0.096 0.080 0.062 0.043 0.027 0.008 0.008 0.003 0.001
1 5 15 35 70 125 205 305 420 540 651 735 780 780 735 651 420 420 305 205 126 70 35 15 5 1
- - -.
- --
- --
- --
--- .. --
--
Kita akan mendiskusikan tiga distribusi variabel acak yang berhubungan dengan distribusi normal yaitu distribusi Kai Kuadrat, Distribusi t, dan Distribusi F.
DISTRIBUSIKAI - KUADRAT (JC2) Anggaplah Z adalah variabel acak dengan standar normal (mempunyai mean 0 dan variabell). Kemudian anggaplah Y =71. Ini berarti bahwa Y juga mernpakan variabel acak yang kontinu. Kita ingin mengetahui bagaimana fungsi kepekatan probabilitasnya. Ielaslah Y tidak akan kurang dari 0, sehingga fungsi kepekatan nampak berbeda dengan fungsi kepekatan yang mempunyai standar normal. Kita menamakan variabel acak ini sebagai: variabel acak kai-kuadrat. Karena X adalah hurnf Yunani kai, maka distribusi kai-kuadrat sering dilambangkan dengan X2. Untuk memberikan gambaran tentang seperti apa fungsi kepekatan, anda dapat melihat gambar 8.18 yang menunjukkan diagram frekuensi untuk kuadrat dari sekelompok data yang dipilih dari distribusi normal. Secara matematis, fungsi kepekatan untuk variabel acak Y fey)
= (21t)
-112
y-112e-l12untuk y ~ 0, fey)
= 0 jika
= 71 adalah:
y<0
Fungsi ini digambarkan pada gambar 8.19 Gambar 8.18
Rata-rata (mean) dari variabel ini mudah dihitung karena Z mempunyai distribusi normal dengan defmisi E(Z)
=0 Var(Z) = 1 karena
Var(Z)
=E(71)
mengikuti E(Z2) =E(Y) = 1.Varian dari Y akan sama dengan 2.
- E(Z)2
=e(Z2). ltu semua
119 -
--
- -
Sesungguhnya ada beberapa tipe berbeda dari variabel aeak kai-kuadrat. Variabel Y disebut variabel kai-kuadrat dengan derajat kebebasan 1. Anggaplah kita mengkuadratkan variabel aeak normal bebas (independen) dan menjumlahkannya, hasil dari penjumlahan ini adalah Yn :
maka Yn dikatakan mempunyai distribusi kai-kuadrat'Cienganderajat kebebasan n. (Kita akan menulis Xn2untuk menyatakan distribusi kai-kuadrat dengan derajat kebebasan n). Anda mungkin heran mengapakita menggunakan derajat kebebasan. Masing-masing variabel acak normal berperilaku seperti angka-angka yang anda pilih secara bebas, anda mempunyai n angka, jika anda mempunyai n pilihan bebas yang berbeda.
Gambar 8.19
f{y) 4 3 2
f(y)
o
2
=(21t)-ll2y-ll2x-1I2-
3
y
Seeara umum fungsi kepekatan kai-kuadrat adalah: f(y)
= (lIe
ynf2-1e-y!2
Dalam formula ini c adalah konstanta yang mempunyai nilai tepat, jadi totalluas di bawah kurva adalah 1. Kita dapat dengan mudah menghitung harapan dan varian dari variabel aeak X2dengan derajat kebebasan n. Karena Y n adalah jumlah dari n variabel acak, masing-masing dengan
harapan 1,E(Y0>= n.Masing-ma~ingvariabel acakX2adalah bebas (independen),jadi varian hanyalah penjumlahan seluruh varian tunggal (individdual), dan dengan demikian: Var(Y)n
=2n
Gambar 8.20 menunjukkan beberapa distribusi kai-kuadrat yang berbeda dengan derajat kebebasan yang berbeda-beda.
120
Gambar 8.20
5
One degree of freedom
.1
'.:1 .2 .1
L
o
2
3
4
o
2
3
4
5
5
.4
.4 Three degree of freedom .31
.3
Four degree of freedom
J~ o
2
3
4
o
2
3
4
Pada waktu jumlah derajat kebebasan keeil, fungsi kepekatan akan berbentuk asimetris. Dengan bertambahnya jumlah derajat kebebasan fungsi kepekatan berangsur-angsur menjadi lebih simetris. Bilan menjadi sangat besar, distribusi kai-kuadrat menyerupai distribusi normal. Jelaslah tidak ada jalan lain yang lebih mudah untuk menggambarkan fungsi distribusi kumulatif untuk variabel acak )(2. Satu-satunya jalan adalah menghitung nilai dari F(Y) dengan menggunakan komputer. Tabel8.4 dan A3.3 mencatat beberapa hasil. TabeI8.4: Variasi Acak Kai-Kuadrat
Pr(X < x) =p Derajat Kebebasan
p =0.05
P =0.25
p=0.5
P = 0.75
p=0.9
P
2.77 6.62 12.5 18.2 23.8 56.3
4.60 9.23 15.9 22.3 28.4 63.2
1 1 2 3 6
I
1
5 10 15 20 50
0.1 1.14 3.94 7.26 10.85 34.76
0.57 2.67 6.74 11.04 15.45 42.94
1.38 4.35 9.3 14.3 19.3 49.3
121
-
-
Variabel acak X2 sangat penting dalarn estimasi statistik. Sebagai contoh, distribusi varian sarnpel dari sarnpel acak yang diarnbil dari distribusi normal akan mempunyai hubungan erat dengan distribusi X2.(Lihat bab 11 ). Distribusi ini juga menjadi landasan untuk pengujian statistik yang penting yang disebut pengujian X2(lihat bab 13). DISTRIBUSIt Distribusi penting lainnya yang berhubungan dengan distribusi normal adalah distribusi 1.Anggaplah Z dan Y adalah variabel acak bebas. Z adalah variabel acak normal (mean
= 0,
Varian = 1) dan Y adalah variabel kai-kuadrat dengan derajat kebebasan m. Marilah kita membuat definisi: Z
T= ""y1m Kemudian dikatakan variabel T mempunyai distribusi t dengan derajat kebebasan m. (Distribusi t kadang-kadang disebut student's distribution). Pada mulanya hnarnpak definisi ini sesuatu yang membingungkan dan tidak berarti, tetapi distribusi t mempunyai peran yang penting dalarn statistik. Penurunan dari fungsi kepekatan sangat sulit dan prosesnya rumi1. (Fungsi itu sendiri cukup rumit) Hasil fungsi kepekatan nampak seperti ini:
g(x)
=c
t :]+
(n+1)/2
Sekali lagi c adalah konstanta yang luas sarna dengan 1. Perhatikan bentuk dari fungsi kepekatan yang menyajikan beberapa petunjuk tentang distribusi
t asal. Karena g(x)
= g( -x),
maka berarti memiliki
fungsi kepekatan
yang simetris
terhadap x = O.Anda dapat melihat bahwa nilai maksimum dari g(x) terjadi pada saat x Garnbar 8.21 menunjukkan contoh fungsi kepekatan 1.
=O.
Fungsi kepekatan mempunyai bentuk seperti lonceng yang harnpir sarna .dengan distribusi normal standar. Secara umum distribusi t mempunyai bagian bawah yang lebih ke tangan daripada distribusi normal. Dengan kata lain, variabel acak t mempunyai kemungkinan yang lebih besar untuk jauh dari 0 daripada variabel acak normal. Tetapi bila derajat kebebasan (m) meningkat, distribusi t akan sangat mendekati distribusi normal.
122
Garnbar 8.21
Jika m = 1,rata-rata (mean) dari distribusi t tidak mempunyai keberadaan. (Distribusi t dengan m = 1juga disebut cauchy distribution). Jika m > 1, rata-rata (mean) mempunyai arti, dan ini akan sarna dengan 0, karena distribusi simetris terhadap O.Varian dari distribusi t tidak mempunyai arti bila m = 1 atau m = 2, tetapi bila m > 2 variannya adalah m/m-2. DISTRIBUSI F Sekarang kita akan mengungkapkan satu distribusi lain yang mempunyai hubungan dengan distribusi kai-kuadrat, yang mempunyai peranan penting dalarn statistik. Jika X dan Y adalah variabel acak kai-kuadrat bebas dengan derajat kebebasan m dan n, maka variabel acak:
F ---
X/m
Y/n dikatakan mempunyai distribusi F dengan derajat kebebasan m dan n. Ingatlah bahwa urutan dari m dan n membuat perbedaan yang besar. Tabel A3.6 mengajukan beberapa nilai untuk fungsi distribusi kumulatif. YANG HARUS DIINGAT 1. Distribusi X2, t dan F adalah distribusi yang bernubungan dengan distribusi normal yang digunakan secara ekstensif dalarn statistik inferensia. 2. Untuk mengindentifIkasi apakah distribusi kai-kuadrat atau distribusi t, anda hams. menentukan nilai dari derajat kebebasan. 3. UntiIk mengindentifIkasikan distribusi F, anda hams menetapkan derajat kebebasan untuk pembilan dan derajat kebebasan untuk penyebut. ISTILAH-ISTILAH YANG HARUS DIPELAJARI distribusi F teori batas tengah distribusi kai-kuadrat distribusi normal variabel acak kontinu distribusi normal standar distribusi t derajat kebebasan 123 --