BabIX Distribusi DenganDua Variabel Acak
KATA KUNCI korelasi menunjukkantingkat hubungan antaradua variabel (kuantita); biasanya mempunyai nilai antara -1 dan 1. kovarian menunjukkan tingkat hubungan dua variabel. Mempunyai hubungan dengan korelasi, tetapi nilainya tidak dibatasi antara -1 dan 1. variabel acak bebas (independen) adalah variabel yang tidak saling mempengaruhi. Bila satu nilai variabel acak diketahui tidak akan menyajikan infromasi apapun tentang variabel yang lain. FUNGSIKEPEKATANGABUNGAN Anggaplah kita mempunyai dua variabel acak diskrit X dan Y dan kita tertarik untuk mengetahui probabilitas bahwa variabel itu akan tejadi pada nilai tertentu. Hanya dalam kasus satu variabel acak kita dapat mendefinisikan fungsi kepekatan probabilitas dan fungsi distribusi kumulatif. Misalnya X mempunyai 6 nilai kemungkinan, yaitu Xl' dan X2,X3,X4,Xs dan X6.Y juga mempunyai 6 nilai kemungkinan, yaitu Yl, Y2, Y3, Y4, Ys dan Y6. Sekarang kita melakukan percobaan acak untuk mengamati nilai X dan Y. Hasil dari percobaan terdiri dari 2 angka: nilai observasi X dan nilai observasi Y. Di sini ada 36 hasil yang mungkin. (Secara umum, jika ada m nilai kemungkinan untuk X, dan n kemungkinan untuk Y, maka akan ada mn hasil yang mungkin). Untuk menggolongkan percobaan lebih lengkap, kita perlu menghitung probabilitas masing-masing hasil kemungkinan (ada 36). Kita dapat mengatur hasil kita dalam tabel. Sebagai contoh, misalnya x adalah mata dadu di bagian permukaan (bagian paling atas) yang muncul pada waktu kita menggulirkan dadu dan Y adalah mata dadu di bagian dasar (paling bawah) dadu. Kemudian tabel probabilitas dapat ditunjukkan sebagai berikut:
124
Y
X=1
X=2
X=3
X=4
X=5
X=6
1 2 3 4 5 6
0 0 0 0 0
0 0 0 0
0 0 0
0 0
0
1/6 0 0 0 0 0
1/6 0
1/6
1/6 0 0
1/6 0 0 0
1/6 0 0 0 0
(tabel nampak seperti ini karena bilangan dari penjumlahan mata dadu yang berlawanan sisi adalah 7). Contob lain, anggaplah X dan Z adalah angka yang muncul dari dua dadu yang berbeda, maka tabel probabilitas nampak seperti ini:
Z
X=1
1 2 3 4 5 6
1/36 1/36 1/36 1/36 1/36 1/36
.
X=2
X=3
X=4
X=5
X
1/36
1/36 1/36 1/36 1/36 1/36 1/36
1/36 1/36 1/36 1/36 1/36 1/36
1/36 1/36 1/36 1/36 1/36 1/36
1/36 1/36 1/36 1/36 1/36 1/36
1/36 1/36 1/36 1/36 1/36
Apabila nilai kemungkinan baik X maupun Y banyak, sangat tidak praktis bila kita membuat tabel. Secara umum, kita dapat mendefinisikan fungsi kepekatan probabilitas gabungan f(x,y) seperti ini: f(x,y)
= Pr(X=x) dan (Y=y) = Pr(X=x)(I (Y=y)
Dalam kasus ini f adalah fungsi dari dua variabel (catatan, bentuk asHfungsi kepekatan probabilitas adalah fungsi banya clari 1 variabel). f(x,y) =0 jika (x,y) bukan kemungkinan basil untuk X dan Y. Penjumlahan semua nilai kemungkinan dari fungsi f(x,Y) barns 1. Kita juga dapat mendefinisikan fungsi distribusi kumulatif: F(x,y)
=Pr[(X
~ x) dan (Y ~ y)]
= Pr[(X
~ x) (I
(Y ~ y)]
125
--
Fungsi distribusi kumulatif gabungan untuk dua variabel acak yang kontinu dapat didefinisikan dengan cara yang sarna. Fungsi kepekatan gabungan dari dua variabel acak yang kontinu (continuous random variable) dapat digambarkan sebagai berikut. Bayangkan bukit kecil dilintasi pesawat dengan ditandai sumbu x dan sumb y. Total volume di bawah bukit harns sat. Kemudian probabilitas bahwa nilai X dan Y akan ada dalam bujursangkar khusus dari pesawat sarna dengan volume dari pesawat di atas bujursangkar. FUNGSIKEPEKATAN MARGINALVARIABELACAK INDIVIDUAL Anggaplah kita tertarik pada nilai X tetapi tidak memperhatikan nilai dari y (sebagai contoh banyak orang tidak memperhatikan jumlah mata dadu di dasar dadu dari peoemparan dadu). Dalam kasus ini fungsi kepekatan probabilitas gabungan menyajikan informasi lebih dari yang kita inginkan. Yang jl}ginkita lakukan adalah memikirkan beberapa jalan untuk menurunkan fungsi densitas yang biasa untuk X itu sendiri. (Kita akan menulis f/x) untuk menyatakan fungsi kepekatan dari x.) Perhatikanlah fungsi kepekatan gabungan untuk X dan Y yang telah ditunjukkan di atas. Kita akan mampu menggunakan informasi ini untuk mendapatkan probabilitas bahwa X sarna dengan I. Seperti yang anda lihat dari tabel, ada 6 kemungkinan hasil dari percobaan yang mempunyai X sarna dengan I : (x=1 , y=I); (x=1 , y=2); (x=1 , y=3); (x=1 , y=4); (x=1 , y=5); (x=1 , y=6)
Untuk mendapatkan probabilitas bahwa X sarna dengan 1, kita harns menjumlahkan seluruh probabilitas. Kita mendapatkan o + 0 + 0 + 0 + 0 + 1/6
= 1/6.
Sekarang perhatikan tabel yang menyajikan fungsi kepekatan gabungan untuk X dan Z. Sekali lagi kita dapat memperoleh probabilitas bahwa X akan sarna dengan satu dengan inenjumlahkan seluruh angka dalam kolom pertarna:
Demikian juga dengan penjumlahan masing-masing kolom dalarn tabel, kita dapat menemukan Pr(X=2) , Pr(X=3) dan seterusnya. Secara umum jika ada n nilai kemungkinan untuk Y, maka: Pr(X
= x) = Pr[(X=x) +
dan (Y=y\)] + [(X=x) dan (Y=y)]
... + Pr[(X=x) dan (Y=yn)]
Kita dapat menulis hubungan ini dalarn fungsi kepekatan gabungan: f(x,y\) + (f(x,y) + ... + f(x,y)
126
n
L. f(x,y) i=l
Sebuah fungsi kepekatan individual (tunggal) yang diturunkan dari fungsi kepekatan gabungan, kadang-kadang disebut fungsi kepekatan marginal. Kita juga dapat menemukan fungsi kepekatan marginal untuk: fy(Y) = f(x)'Y) +f(x2,y) + ... + f(xm,y) FUNGSI KEPEKATAN KONDISIONAL Seringkali kita mengetahui satu nilai variabel dari dua variabel aeak dan kita ingin mengetahui nilai yang lain. Kadang-kadang dengan mengetahui satu nilai variabel aeak akan membantu kita untuk menerka nilai yanglain. Sebagai eontoh, jika kita mengetahui bahwa variabel Y yang didiskusikan di atas mempunyai nilai 4, maka kita dapat mengetahui bahwa X mempunyai nilai 3. Tetapi, bila kita mengetahui Z adalah 4 kita akan mendapatkan informasi tentang nilai X. Fungsikepekatan kondisional untukX menjelaskan padakita bagaimana fungsi kepekatan untuk X, apabila Y kita ketahui mempunyai nilai tertentu. Konsep ini sarna dengan probabilitas kondisional (bersyarat) yang telah kita diskusikan pada bab V. Kita akan menulis probabilitas kondisional dari X dimana Y kita ketahui mempunyai nilai y* seperti berikut: f[x I (Y
= y*)] atau f(x I y*)
(Ingatlah garis vertikall, berarti "dengan syarat" atau "diketahui"). Kemudian kita dapat menggunakan definisi dari probabilitas kondisional untuk menemukan bah\\-a:
Pr[{X = x) dan (Y = y*)]
f(x I(Y = y*)
=
=
Pr(Y= y*) f(x,y*) fy (Y*)
Dengan kata lain, fungsi kepekatan kondisional sarnadengan fungsi Jcepekatan gabungan f (x,y*) dibagi den~an fungsi kepekatan marginal dari y. Sebagai eontoh, misalnya Y - 3, maka fy (3) = 1/6 sehingga:
0
bila x = 1
1/6 0
bila x =2
1/6
127 -
-
--
--
f (x I y = 3)
0 1/6 0 1/6 0 1/6 0
-
--
-
--
-
-
bila x = 3 bila x =4 bila x = 5 bila x =6
1/6 YANG HARDS DIINGA T 1. Fungsi kepekatan gabungan untuk dua variabel acak mencatat probabilitas masingmasing pasangan nilai kemungkinan untuk dua variabel. 2. Fungsi kepekatan marginal adalah fungsi kepekatan untuk variabel acak (random). 3. Fungsi kepekatan kondisional adalah fungsi kepekatan untuk satu variabel acak dimana diketahui variabel acak yang lain mempunyai nilai tertentu. 4. fungsi kepekatan marginal dan fungsi kepekatan kondisional, keduanya dapat dihitung dari fungsi kepekatan gabungan. VARIABELACAK BEBAS(INDEPENDEN) Kita dapat mengatakan bahwa dua variabel acak X dan Y adalahvariabel acak bebas jika °nilaiY yang telah diketahui tidak menjelaskan apapun tentang nilai X, dan sebaliknya. Ini berarti bahwa kepekatan kondisional untukX dimana Y diketahui sarna dengan kepekatan marginal biasa untuk X (karena diketahuinya Y tidak merubah probabilitas X). Dengan demikian jika X dan Y adalah variabel bebas, f(x I y) = f/x) Kita ketahui dari definisi probabilitas kondisional, bahwa f(x,y)
f(x Iy) = fy(Y) Dengan demikian, bila X dan Y adalah variabel bebas, f(x,y)
fx(x)= fy (Y) f(x,y)
= fx(x)f/y)
Bila dua variabel adalah variabel bebas, fungsi kepekatan gabungan dapat diari dengan sederhana yaitu dengan mengalikan dua fungsi kepeaktan marginal. Ini berarti bahwa 128
variabel aeak bebas lebih mudah dihadapi. Seeara umum, sangatlah sulit untuk membuat fungsi kepekatan gabungan untuk dua variabel aeak individual (tunggal)jika kita mengetahui fungsi kepekatan marginalnya. (Dalam kenyataan, keeil kemungkinan kita mempunyai beberapa informasi tarnbahan tentang bagaimana hubungan dua variabel). Dalarn eontoh di atas, X, Y dan Z semuanya mempunyai fungsi kepekatan marginal yang identik. Tetapi, fungsi kepekatan gabungan untuk X dan Y sangat berbeda dengan fungsi kepekatan gabungan untuk X dan Z, karena X dan Z adalah variabel bebas, sedang X dan Y mempunyai hubungan (saling mempengaruhi). Berikut ini adalah eontoh dari fungsi kepekatan gabungan untuk dua variabel aeak bebas U dan V:
V.
U=l
U=2
U=3
U=4
f(v)
1 2 3
0.02 0.02 0.06 0.1
0.04 0.04 0.12 0.2
0.06 0.06 0.18 0.3
0.08 0.08 0.24 0.4
0.2 0.2 0.6 1
f(u)
Fungsi kepekatan marginal untuk U dapat ditemukan dengan menjumlahkan masingmasing kolom, dan fungsi kepekatan marginal untuk V dapat ditemukan dengan menjumlahkan masing-masing baris. Anda dapat meolihat bahwa untuk tiap-tiap masukan dalam tabel f(u,v) sarna dengan f(u) f(v). jadi dua variabel aeak tidak saling mempengaruhi (independen). Berikut ini adalah hasil yang berguna yang bekrjajika dua variabel aeak adalah variabel bebas. Jika U dan V adalah variabel bebas, maka: E(UV)
=E(U)
E(V)
Dengan kata lain, harapan dari perkaliannya sarna dengan perkalian masing-masing harapan. Ini adalah alasan lain mengapa hidup lebih mudah bila kita mempunyai variabel aeak yang bebas. YANG HARUS DIINGA T 1. Dua variabel aeak adalah variabel bebas, jika diketahui satu nilai variabel, variabel ini tidak menyajikan informasi apapun tentang nilai variabel yang lain. 2. Seeara matematis, dua variabel aeak adalah variabel bebas jika fungsi kepekatan gabungannya dapat ditemukan denganmengalikankedua fungsi kepekatanmarginalnya.
129
--
KOVAR/AN DAN KORELAS/ KOVARIAN Anggaplah X dan Y adalah dua variabel aeak yang tidak bebas. Kita akan mengukur seberapa dekat, nilai X akan menjelaskan banyak tentang nilai Y. Jika hubungan mereka tidak erat, bila anda mengetahui nilai X hanya akan sedikit membantu bila kita meneoba menerka
nilai Y. Kuantitas yang mengukur tingkat ketergantungan dua variabel disebut kovarian. Kovarian dari X dan Y dapat ditulis sebagai, Cov(X,Y) yang didefinisikan sebagai berikut: Cov(X, Y) = E[ (X - E(X)] [Y - E(Y)]] bahwa Y juga lebih besar dari E(Y). Dalam kasus itu, E[[(X - E(X)] [Y - E(Y)] akan positip.
Seeara umum, bila kovariannya positip. Jika dua variabel aeak eenderung bergerak dengan arah berlawanan (sebagai eontoh, jika X eenderung besar, pada waktu yang sarna Y akan eenderung keeil, dan sebaliknya), kovariannya negatip. Berikut ini formula ringkas untuk menghitung kovarian yang lebih mudah untuk digunakan:
E[[X - E(X)] [Y - E(Y)]]
= [EY - Y E(X) - X E(Y) + E(X) E(y)] = E(XY) - E[y E(X)] - E[X E(Y)] + E(X) E(Y) = E(XY)
Cov(XY(
- E(X) E(Y)
=E(XY)
- E(X)
E(Y) + E(X) E(Y)
- E(X) E(Y)
Sebagai eontoh bila X dan Y adalah mata dadu pada bagian tas dan bagian dasar dadu, kita dapat menemukan bahwa:
E(XY)
= 1/6 x 6 + 1/6 x 10 + 1/6 x 12 + 1/6 x 12 + 1/6 x 10 + 1/6 x 6
=9.333
Dengan demikian: Cov(X,Y) = 9.333 - 3.5 x 3.5 = -2.917
Kovarian bemilai negatip karena nilai X yang lebih besar berasosiasi dengan nilai Y yang lebih keeil. Berikut ini eontoh lain. Anggaplah bahwa fungsi kepekatan gabungan unsuk s dan T sebagai berikut:
130
T
8=1
8=2
8=4
0 1
0 0.6
0.1 0
0.3 0
Kemudian kita dapat menemukan bahwa E(TS) kovariannya adalah: E(ST) - E(S)
= 0.6,
E(S)
= 2 dan
E(T)
= 0.6.
Nilai
= 0.6 - 2 x 0.6 = -0.6
Dari formula singkat, anda dapat melihat bahwa Cov(X
Cov(X
r(X
= ..J
Var(X) Var(Y)
O'x O'y
Hal penting dari koefisien korelasi adalah bahwa nilainya selalu antara -1 dan 1.Jika X dan Y adalah variabel bebas, maka jelas korelasinya nol. Jika koefisien korelasi positip, kita tahu bahwa jika X besar, maka Y juga besar dan keduanya dikatakan mempunyai korelasi positip. X dan Y mempunyai hubungan erat, koefisien kolerasinya positip. X dan Y mempunyai hubungan erat, koefisien korelasinya mendekati 1. Disisi lain, bila korelasi negatip maka jika Y kecil, X besar. Bila hubungan negatip ini kuat maka koefisien korelasinya mendekati -1. Pada contoh terdahulu, kita menemukan bahwa Cov(S,T) = -0.6. Kita juga dapat menemukan bahwa O's= 1.34dan O'T= 0.49. Dengan demikian korelasi antara S dan T adalah: -6
=-0.913
f(S,T) = (1.34) (0.49)
131 -------
CONTOH MENENTUKAN KORELASI SOAL Anggaplah kita melemparkan 3 mata uang penny dan 3 nikel. U adalah jumlah sisi H yang muncul dan V adalah jumlah sisi H yang muncul dari pelemparan mata uang penny. Hitung probabilitas gabungan dan korelasi. PENYELESAIAN Tabel probabilitas gabungan narnpak seperti ini: (lihat tabel). Kita dapat menghitung bahwa E(UV) = 2.52. Kita telah tahu bahwa E(U) = 3 dan E(V) = 3/2. Dengan demikian Cov(U
= 0.75/(1.225
x 0.8660)
= 0.7070
v
U=O
U=l
U=2
U=3
U=4
U=5
U=6
f(v)
0 1 2 3
1164 0 0 0
3/64 3/64 0 0
3/64 9/64 3/64 0
1164 9/64 9164 1/64
0 3/64 9164 3/64
0 0 3/64 3/64
0 0 0 1164
1/8 3/8 3/8
f(u)
1164
6/64
15/64 20/64
15/64
6/64
1164
1
118
Korelasinya positip karena nilai dari U yang lebih besar berasosiasi dengan nilai V yang
lebih besar.
.
Dua variabel acak mempunyai hubungan yang sempuma jika ada hubungan antara mereka dari bentuk:
Y=aX+b dimana a dan b adalah dua konstanta, dan a lebih besar dari O.Sebagai contoh, anggaplah fungsi kepekatan untuk X dan Y narnpak seperti dalarn tabel. Dalarn kasus ini jelas bahwa Y selalu sarna dengan 4X. Kita .dapat menghitung bahwa
E(X) = 3, sx = 2, E(Y) = 12, Sy 12 = 16 dan
132
=8 dan E(XY) =52. Dengan demikian Cov(X,Y) = 52 - 3 x
y
X+O
X=l
X=2
X=3
X=4
X=5
X=6
0 4 8 12 16 20 24
In 0 0 0 0 0 0
0 0 0 0 0 0
0 0 In 0 0 0 0
0 0 0 In 0 0 0
0 0 0 0 In 0 0
0 0 0 0 0 In 0
0 0 0 0 0 0 In
In
In
In
In
In
In
In
in
.
VARIAN DARI PENJUMLAHAN
Sekarang kita dapat menurunkan formula umum untuk Var(X + Y): Var(X + Y)
=E[X Y)2]
_
=y)2] + y2] - [E(X)
[E(X
= E(X2 + 2XY
= E(X2) + 2 E(XY)
+ E(Y) F
+ E(y2) - (E(X»2 - 2 E(X) E(Y) - (E (
=E(X2) - (E(X»2 + E(Y2) - (E(Y»2 + 2[E(XY) - E(X) E( =Var(X) + Var(Y) + 2 COy(XY) Sebagai eontoh, anggaplah anda mempunyai saham di Perusahaan Batik Bumi Persada. Keuntungan anda dari saham adalah variabel aeak (W) dengan mean 1000 dan varian 400. Anda ingin saham lebih banyak lagi dan anda meneoba memutuskan apakah anda akan membeli saham dari perusahaan Batik Tulis atau dari perusahaan Tenun Permai. Kedua saham juga mempunyai keuntungan yang merupakan variabel aeak dengan mean 1000 dan varian 400. Mana yang harns anda pilih? Anggaplah H mewakili keuntungan anda jika anda memilih Perusahaan Batik Tulis DJewakili keuntungan anda jika anda memilih Perusahaan Tenun Permai. Nilai harapan dari keuntungan anda akan sarna tanpa memperhatikan mana yang anda pilih. Tetapi anda tentu menginginkan varian keuntungan anda yang sekeeil mungkin, karena varian yang keeil berarti saham yang anda pegang mengandung risiko yang keeil. Untuk menghitung varian total dari portofilio anda, anda harns memperhatikan kovarian antara Perusahaan Batik Bumi Persada dan dua perusahaan lainnya. Anggaplah Cov(W,H) = 380. Kovarian bernilai positip, berarti bahwa kedua perusahaan dapat menguntungkan bila pasar kain batik kuat tetapi kedua perusahaan akan merugikan bila pasar kain batik lemah. Anggaplah Cov(W,F) =-200. Kovarian yang negatip berarti bahwa pasar tenun mengalami
boom bila pasar batik merosot dan sebaliknya. Bila anda membeli saham Perusahaan Batik Tulis, maka total varian keuntungan anda akan: 133
=Var(W)
Var(W + H)
+ Var(H) + 2 Cov(W,H) = 400 + 400 + 2 x 380
= 1560 Jika anda rnernbeli saharn tenun, varian akan: Var(W + F)= Var(W) + Var(F) + 2 Cov(W,F)
= 400
+ 400 + 2 x (-200)
=400 Jelaslah bila anda rnernbeli saharn tenun risikonya lebih keeil. Seeara urnurn anda dapat rnernperkeeil risiko rnernegang saharn dengan deversiftkasi dan rnernbeli saharn yang rnernpunyai kovarian negatif satu sarna lain. Dengan kata lain, jangan rneletakkan sernua telur anda dalarn satu keranjang.
YANG HARUS DIINGA T 1. Kovarian dari dua variabel aeak adalah ukuran dari hubungan kedua variabel itu. Jika kovarian positip,rnaka bila satu variabel aeak bemilai besar rnaka variabel lain juga rnernpunyainilai besar. Jika kovarian negatif, jika variabel aeak yang satu bemilai besar rnaka variabellain akan bemilai keei. Jika dua variabel aeak rnerupakan variabel bebas (independen) rnaka kovarian dari kedua variabel tersebut sarna dengan no1.Kovarian dapat dihitung dengan formula berikut: Cov(X, Y) = E(XY) - E(X) E(Y)
2.
Korelasi adalah nilai yang harnpir sarna dengan kovarian keeuali pada skalanya yang selalu berada diantara -1 dan 1. Jika dua variabel aeak adalah variabel bebas, nilai korelasinya adalah no1.Jika ada hubungan linear yang sernpuma diantara dua variabel aeak, rnaka korelasinya adalah -1 dan 1, tergantung pada apakah kovarian positip atau negatip. 3. Jika X dan Y adalah dua variabel aeak, rnaka varian dari penjurnlahannya dapat dicari dengan formula ini: Var(X + Y)
= Var(X)
ISTILAH-ISTILAH
+ Var(Y) + 2 Cov(X, YO
YANG HARUS DIPELAJARI
fungsi densitas kondisional fungsi densitas probabilitas gabungan fungsi densitas probabilitas gabungan fungsi distribusi kurnulatif gabungan fungsi densitas marginal variabel aeak bebas (independen) 134
kovarian korelasi korelasi korelasi negatip korelasi positip korelasi sernpuma.