Pengenalan Copula Sapto Wahyu Indratno S TATISTICS D ISIVISION , F ACULTY OF ENCES , I NSTITUT T EKNOLOGI B ANDUNG
M ATHEMATICS AND N ATURAL S CI -
E-mail address:
[email protected]
Daftar Isi Bagian 1. Copula
1
Bab 1. Copula dan aplikasinya 1. Pendahuluan 2. Fungsi-fungsi distribusi 3. Konsep dasar dari Kebergantungan 4. Jenis-jenis Copula 5. Proses Estimasi Copula 6. Korelasi Linear
iii
3 3 3 9 10 10 12
Bagian 1
Copula
BAB 1
Copula dan aplikasinya 1. Pendahuluan Sebuah Copula adalah suatu fungsi multivariat yang terlahir dari sebuah distribusi gabungan. Copula merupakan alat yang dapat digunakan untuk menganalisa kebergantungan variabel-variabel acak dalam struktur yang digambarkan oleh fungsi gabungan terebut. Di sini struktur kebergantungan variabel-variabel acak dalam distribusi gabungan dapat dilihat dari kebergantungan fungsi-fungsi marginalnya dalam fungsi Copula. Sehingga Copula dari sebuah distribusi multivariat dapat dipandang sebagai gambaran struktur kebergantungan dari distribusi multivariat tersebut berdasarkan prilaku dari masing-masing fungsi marginalnya. Salah satu sifat Copula yang penting adalah invarian terhadap transformasitransformasi yang menaik kuat pada marginal-marginalnya. Copula dapat menyelesaikan suatu masalah yang sulit, seperti mencari sebuah distribusi multivariat, dengan melakukan dua langkah sederhana berikut: langkah pertama adalah memodelkan semua distribusi marginalnya. Langkah kedua adalah mengestimasi Copula yang menggambarkan kebergantungan dari marginal-marginalnya. Dalam industri keuangan dan asuransi struktur ketergantungan antara aset merupakan hal yang sangat penting untuk dipelajari. Kebergantungan ini dianalisa untuk beberapa tujuan: pricing dan hedging dari intrumen kredit yang sensitif, basket derivatives dan structured produts, pengaturan portfolio kredit, pengukuran resiko kredit dan resiko pasar. 2. Fungsi-fungsi distribusi Sebuah variabel acak X didefinisikan sebagai sebuah fungsi yang mengaitkan sebuah bilangan real X(ξ) dengan setiap hasil eksperimen ξ dalam ruang sampel Ω 2.1. Univariat. Fungsi distribusi (kumulatif) F dari suatu variabel acak X didefinisikan sebagai FX (x) = P (X ≤ x),
(2.1)
dimana • FX (−∞) = 0 dan FX (∞) = 1 sehingga 0 ≤ FX (x) ≤ 1 ∀x, dan • FX adalah fungsi yang kontinu kanan. Jika FX kontinu juga dari kiri maka X adalah variabel acak kontinu. A KIBAT 1. Melalui sifat 0 ≤ F (X) ≤ 1 diperoleh 1. {x | F (x) < y} = ∅, ∀y ≤ 0, dan 2. {x | F (x) < y} = X, ∀y ≥ 1. Sehingga P (F (X) ≤ y) = 0, ∀y ≤ 0, dan P (F (X) ≤ y) = 1, ∀y ≥ 1. 3
4
1. COPULA DAN APLIKASINYA
Pada umumnya fungsi distribusi FX tidak murni monoton naik, sebagai contoh fungsi distribusi untuk variabel acak diskret, sehingga definisi fungsi F −1 yang klasik tidak dapat digunakan. Untuk mengatasi masalah ini fungsi inversi FX yang diperumum diperkenalkan sebagai berikut: D EFINISI 1 (Inversi yang diperumum). Misalkan X adalah sebuah variabel acak (kontinu atau diskret). Fungsi inversi yang diperumum dari FX didefinisikan sebagai berikut: −1 FX (u) = inf{x | F (x) > u}.
(2.2)
Perhatikan bahwa Definisi 1 dan kekontinuan kanan dari F mengakibatkan F −1 (F (x)) = inf{w | F (w) ≥ F (x)} = x, ∀x ∈ X. (2.3) L EMA 1. Misalkan FX adalah sebuah fungsi distribusi yang monoton naik murni, FX (x) < FX (y) ∀x < y, dari suatu variabel acak kontinu. Maka −1 FX adalah fungsi yang monoton naik murni. B UKTI . (2.3) memberikan dF (F −1 (x)) = 1. dx Aplikasikan aturan rantai pada ruas kiri persamaan di atas, kita peroleh dF (F −1 (x)) dF −1 (x) = F 0 (w) = 1, dx dx
(2.4)
w = F −1 (x), atau (F −1 )0 (x) =
1 F 0 (F −1 (x))
> 0.
(2.5)
T EOREMA 1 (Teorema CDF). Misalkan X adalah sebuah variabel acak kontinu dengan fungsi distribusi F (.). Misalkan X ditransfromasikan melalui fungsi kumulatifnya yaitu Y = F (X). Maka distribusi dari Y adalah seragam pada interval [0, 1], Y ∼ U [0, 1].
G AMBAR 1. F (X) ∼ U [0, 1]
2. FUNGSI-FUNGSI DISTRIBUSI
5
B UKTI . Untuk membuktikan teorema ini kita gunakan definisi berikut: D EFINISI 2. X ∼ U [0, 1] jika dan hanya jika 0, x ≤ 0 x, 0 < x ≤ 1 P (X ≤ x) = 1, x > 1.
(2.6)
Dari Akibat 1 kita cukup menunjukkan P (Y < y) = y, ∀y ∈ [0, 1]. Dengan menggunakan {x ∈ X | F (x) ≤ y} = {x ∈ X | F −1 (F (x)) ≤ F −1 (y)}, kita peroleh P (Y ≤ y) = P (F (X) ≤ y) = P (F −1 (F (X)) ≤ F −1 (y)) = P (X ≤ F −1 (y)) = F (F −1 (y)) = y
∀y ∈ [0, 1].
(2.7)
2.1.1. Fungsi distribusi empirik. Misalkan X1 , X2 , . . . , Xn menyatakan sampel acak yang berukuran n. Bagaimana cara mendapatkan distribusi dari sampel acak tersebut? Untuk menjawab pertanyaan tersebut, kita perhatikan informasi yang dapat kita peroleh dari sampel acak tersebut. Deskriptif Statistik dapat digunakan terlebih dahulu untuk mendapatkan sari numerik dari sampel acak tersebut. Di sini akan difokuskan pada informasi sampel acak yang didapatkan dari distribusi empirik. Fungsi distribusi empirik ini didefinisikan sebagai berikut: D EFINISI 3. Misalkan X1 , X2 , . . . , Xn suatu sampel acak dari suatu distribusi X. Distribusi empirik dari sampel acak tersebut adalah n X 1{Xi ≤x} . (2.8) F (x) = n i=1
G AMBAR 2. (a) n = 5, (b) n = 50, (c) n = 500 Distribusi empirik ini adalah distribusi yang berdasarkan pada data. Gambar 2 mengilustrasikan bentuk dari distribusi empirik untuk beberapa ukuran sample acak yang diambil dari distribusi Gamma(3,1). Terlihat dalam Gambar 2 (a) sampel acak berukuran 5 menyebar pada interval [0, 5]
6
1. COPULA DAN APLIKASINYA
yang menghasilkan distribusi empirik yang jauh dari distribusi populasinya. Dalam Gambar 2 (b) dan (c) sampel acak mulai menyebar merata sehingga distribusi empiriknya semakin mendekati distribusi populasinya. Dari contoh ini terlihat bahwa kedekatan distribusi empirik dengan distribusi populasinya sangat bergantung pada banyaknya data dan penyebaran data. 2.2. Pengkontinuan variabel acak diskret. Misalkan X adalah variabel acak disktrit dan U adalah suatu variabel acak dengan support [0, 1]. Definisikan X ∗ = X + (U − 1). Maka P (X + U − 1 ≤ s) = P (X + U ≤ [s] + 1 + (s − [s])) =
∞ X
P (U ≤ s + 1 − x)P (X = x)
(2.9)
x=0
= 2.3. Univariat Normal. Fungsi densitas dan distribusi (kumulatif) dari distribusi Normal standar didefinisikan masing-masing sebagai berikut: x2 1 φ(x) = √ exp(− ), 2 2π dan Z
−∞ < x < ∞
(2.10)
x
Φ(x) =
φ(t)dt.
(2.11)
−∞
Bila X ∼ N (µ, σ 2 ), maka kita dapat menstandarkan variabel acak tersebut melalui transformasi Y = X−µ ∼ N (0, 1). Sehingga Y memiliki fungsi σ kepadatan sebagai berikut: f (x) = dimana y =
1 φ(y), σ
−∞ < x < ∞,
(2.12)
x−µ σ .
2.4. Bivariat. Suatu fungsi yang kontinu kanan F : R2 → [0, 1] kita sebut fungsi distribusi bivariat bila memenuhi sifat-sifat berikut: • limxj →−∞ F (x1 , x2 ) = 0, j = 1, 2, • limxj →∞, ∀j F (x1 , x2 ) = 1 • untuk semua (x1 , y1 ), (x2 , y2 ) dengan x1 < x2 ,y1 < y2 berlaku F (x2 , y2 ) − F (x1 , y2 ) − F (x2 , y1 ) + F (x1 , y1 ) ≥ 0. (2.13) X1 Misalkan X = adalah sebuah vektor acak yang berdistribusi X2 µ1 Bivariat Normal(µ, Σ), dimana µ = adalah vektor mean, dan µ2 σ12 ρσ1 σ2 (2.14) Σ= ρσ1 σ2 σ22 adalah matriks kovariansi. Di sini ρ menyatakan korelasi antara X1 dan X2 . Fungsi kepadatan peluang untuk bivariat normal ini adalah 1 (X − µ)0 Σ−1 (X − µ) f (x1 , x2 ) = exp − . (2.15) 2π|Σ| 2
2. FUNGSI-FUNGSI DISTRIBUSI
7
Kebebasan bivariat Normal. Kebebasan antar variabel acak distribusi bivariat Normal ini menyebabkan ! 2 1 0 σ1 0 σ12 −1 Σ= dan Σ = . (2.16) 0 σ22 0 σ12 2
Visualisasi kebebasan bivariat normal. Untuk memperoleh gambaran
G AMBAR 3. Kurva ketinggian fungsi bivariat normal baku dengan ρ = 0, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0 struktur kebergantungan X1 dan X2 kami sajikan Gambar bivariat Normal dengan µ = (0, 0) dan σ1 = σ2 = 1 dengan ρ = 0. Gambar 3 merepresentasikan struktur kebergantungan X1 dan X2 ketika mereka saling bebas. Terlihat data yang dibangkitkan dari distribusi bivariat normal baku dengan ρ = 0 mengikuti bentuk kurva ketinggian dari fungsi kepadatan peluang distribusi bivariat normal baku dengan ρ = 0. Untuk kasus X1 dan X2 yang saling bebas kita memiliki P (X1 ≤ 0, X2 ≤ 0) ≈ 0, 5P (X1 ≤ 0), seperti yang diperlihatkan pada Gambar 3. Terlihat bahwa data acak yang dibangkitkan berkumpul membentuk bola dua dimensi yang berpusat di titik (0, 0). Bila kita naikkan nilai ρ nya struktur kebergantungan X1 dan X2 akan berubah. Pada Gambar 4 terlihat bentuk penyebaran data acaknya berbentuk elips. Di sini kita memiliki P (X1 ≤ 0, X2 ≤ 0) ≈ 0, 75P (X1 ≤ 0). Dapat kita lihat untuk ρ → 1 data atau kurva ketinggiannya mendekati bentuk garis seperti yang diperlihatkan pada Gambar 5, dan lim P (X1 ≤ 0, X2 ≤ 0) = P (X1 ≤ 0).
ρ→1
Hal ini menunjukkan parameter ρ sangat erat kaitannya dengan kebergantungan antara dua variabel acak tersebut. L EMA 2. P (A ∩ B) ≤ min{P (A), P (B)}.
(2.17)
B UKTI . Bukti diperoleh melalui hubungan P (A ∩ B) ≤ P (A) dan P (A ∩ B) ≤ P (B).
8
1. COPULA DAN APLIKASINYA
G AMBAR 4. Kurva ketinggian fungsi bivariat normal dengan ρ = 0, 8, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0, 8
G AMBAR 5. Kurva ketinggian fungsi bivariat normal dengan ρ = 0, 99, dan data yang dibangkitkan dari distribusi bivariate baku dengan ρ = 0, 99 2.5. Covariance. Misalkan yt = αyt−1 + µ + t .
(2.18)
E[y( t − h)yt ] = E[(αyt−h−1 + µ + t−h )(αyt−1 + µ + t )]
(2.19)
Maka 2.5.1. Peluang bersyarat. Misalkan X dan Y adalah variabel acak yang berdistribusi masing-masing FX dan FY , dan H adalah distribusi gabungan X dan Y . D EFINISI 4 (CDF bersyarat). P (X ≤ x | Y ≤ y) =
H(x, y) P (X ≤ x, Y ≤ y) = . P (Y ≤ y) FY (y)
Terlihat dari Definisi 4 bahwa P (X ≤ x | Y ≤ y) ≥ H(x, y).
(2.20)
Jika H ∈ C 1 maka P (X ≤ x | Y = y) =
limδ→0 P (X ≤ x, y − δ ≤ Y ≤ y + δ) = limδ→0 P (y − δ ≤ Y ≤ y + δ)
∂ ∂y H(x, y)
fY (y)
. (2.21)
3. KONSEP DASAR DARI KEBERGANTUNGAN
9
2.6. Multivariat. Suatu fungsi yang kontinu kanan F : Rm → [0, 1] kita sebut fungsi distribusi bivariat bila memenuhi sifat-sifat berikut: • limxj →−∞ F (x1 , . . . , xm ) = 0, j = 1, 2, . . . , m, • limxj →∞, ∀j F (x1 , . . . , m) = 1 • untuk semua (x1 , x2 , . . . , xm ), (y1 , y2 , . . . , ym ) dengan xi < yi , i = 1, 2, . . . , m, berlaku 2 X 2 X i1 =1 i2 =1
...
2 X
(−1)i1 +i2 +...+im F (x1 , x2 , . . . , xm ) ≥ 0,
(2.22)
im =1
dimana xi1 = xi dan 3. Konsep dasar dari Kebergantungan Konsep-konsep yang akan ditampilkan adalah: • Konsep dari kebergantungan pada kuadran yang positif dan pengurutan concordance. • Konsep dari kebergantungan dari kenaikan positif yang stokastik • Konsep dari total positivity of order 2 (T P2 ) dan max-infinite divisibility • Konsep dari kebergantungan ekor yang digunakan untuk mengkontruksi dan menganalisa distribusi nilai ekstrim multivariat dan copulas. • Konsep dari kebergantungan dari Kendall’s tau dan Spearman’s rho. 3.1. Kebergantungan Kuadran positif dan Orthan. Misalkan X = (X1 , X2 ) adalah sebuah vektor bivariat dengan cdf F . Di sini X atau F dikatakan bergantung pada kuadran positif (PQD) jika P (X1 > a1 | X2 > a2 ) ≥ P (X1 > a1 ) ∀a1 , a2 ∈ R.
(3.1)
Dengan menggunakan hubungan P (X1 > a1 , X2 > a2 ) = 1 − P (X1 ≤ a1 ) − P (X2 ≤ a2 ) + P (X1 ≤ a1 , X2 ≤ a2 ), (3.2) kita dapat tuliskan hubungan (3.1) sebagai berikut P (X1 ≤ a1 | X2 ≤ a2 ) ≥ P (X1 ≤ a1 ) ∀a1 , a2 ∈ R.
(3.3)
Hubungan (3.1) menyatakan bahwa peluang X1 > a1 akan lebih besar, untuk setiap a1 , bila informasi X2 > a2 , untuk setiap a2 , diketahui dibanding tanpa informasi X2 . Contoh: Distribusi F (x, y) = FX (x)FY (y)[1 + θ(1 − FX (x))(1 − FY (y))], 0 ≤ θ ≤ 1. Untuk melihat hubungan X dan Y secara visual misalkan X ∼ N (0, 1) dan Y ∼ N (2, 4). Kita bangkitkan data (xi , yi ), i = 1, 2, . . . , 700, dari distribusi gabungan F (x, y). Distribusi gabungan di atas dapat dituliskan sebagai C(u, v) = uv[1 + θ(1 − u)(1 − v)], dimana u = FX (x) dan v = FY (y). Kita peroleh ∂ C(u, v) = −θ(1 − 2u)v 2 + v[1 + θ(1 − 2u)]. ∂u
10
1. COPULA DAN APLIKASINYA
G AMBAR 6. Struktur kebergantungan 4. Jenis-jenis Copula Apakah ada hubungan frequency domain used in Fourier analysis dengan Distribution cumulative domain used in Copula? It seems to be similar to me based on the following : The "frequency domain" is simply a different way to look at the data that you have in the time domain. When you listen to a symphony, the time domain description tells you what sound you hear in every given instant, while the frequency domain description tells you, roughly, what instruments are involved and the ways they are played. 4.1. Keluarga Bivariat dengan satu parameter. Dalam bagian ini akan ditampilkan Copula bivariat dengan satu parameter yang memiliki sifat-sifat: • kontinu secara absolut • supportnya berada di seluruh [0, 1]2 • hasil interpolasi antara batas bawah dan batas atas Frechet. 5. Proses Estimasi Copula Asumsikan Copula yang sebenarnya berasal dari sebuah keluarga Copula parametrik C = {Cθ , θ ∈ Θ}. Kita ingin mengestimasi Copula ini berdasarkan data yang diasumsikan saling bebas dan memiliki distribusi yang identik. Untuk mengestimasi Copula ini dapat dilakukan dengan menggunakan parametrik marginal atau non-parametrik marginal. Terlebih dahulu kita perkenalkan beberapa sifat-sifat fungsi distribusi (kumulatif): L EMA 3. Misalkan X memiliki distribusi F . Maka X dan F −1 (U ) dimana U berdistribusi seragam (0, 1) memiliki distribusi yang sama. B UKTI . P (F −1 (U ) ≤ x) = P (U ≤ F (x)) = F (x) = P (X ≤ x).
Dengan menggunakan Lema 3 kita dapatkan hubungan F (x1 , x2 , . . . , xn ) = P (X1 ≤ x1 , X2 ≤ x2 , . . . , Xn ≤ xn ) = P (F1−1 (U1 ) ≤ x1 , . . . , Fn−1 (Un ) ≤ xn ) = P (U1 ≤ F1 (x1 ), . . . , Un ≤ Fn (xn )) = P (U1 ≤ u1 , . . . , Un ≤ un ) = C(u1 , u2 , . . . , un ), dimana Ui , i = 1, 2, . . . , n, berdistribusi seragam (0, 1).
(5.1)
5. PROSES ESTIMASI COPULA
11
Untuk n = 2 kita dapatkan, menggunakan u = F (x) dan v = G(y), kita peroleh f (x, y) =
∂ 2 F (x, y) ∂2 dF (x) dG(x) ∂ 2 = C(F (x), G(y)) = C(F (x), G(y)). ∂x∂y ∂x∂y dx dy ∂u∂v (5.2)
L EMA 4. Misalkan α(x) adalah fungsi yang monoton naik. Maka P (α(X) ≤ x) = P (X ≤ α−1 (x)) = F (α−1 (x)).
(5.3)
5.1. Copula dengan 2 peubah. D EFINISI 5. Misalkan S1 , S2 ⊂ R ∪ ∞, dan Λ : S1 × S2 → R. Maka Λvolume dari B := [u1,1 , u1,2 ] × [u2,1 , u2,2 ] ⊂ S1 × S2 , dimana u1,1 < u1,2 dan u2,1 < u2,2 , didefinisikan sebagai VΛ (B) = Λ(u1,1 , u2,1 ) − Λ(u1,1 , u2,2 ) − Λ(u1,2 , u2,1 ) + Λ(u1,2 , u2,2 ) =
2 X 2 X
(−1)i1 +i2 Λ(u1,i1 , u2,i2 ).
(5.4)
i1 =1 i2 =1
D EFINISI 6. Λ : S1 × S2 → R dikatakan memenuhi sifat 2-increasing jika VΛ (B) ≥ 0 untuk setiap B ⊂ S1 × S2 . Apakah fungsi H(x, y) yang tidak turun terhadap x dan y adalah fungsi yang 2-increasing? Jawabannya adalah negatif. Pandang contoh berikut: H(x, y) = max(x, y). Maka untuk y yang ditetapkan H(x1 , y) ≤ H(x2 , y) jika x1 ≤ x2 . Demikian juga bila xyang ditetapkan kita peroleh H(x, y1 ) ≤ H(x, y2 ) untuk setiap y1 ≤ y2 . Tetapi VH (I × I) = H(0, 0) − H(0, 1) − H(1, 0) + H(1, 1) = 0 − 1 − 1 + 1 = −1 < 0. Apakah fungsi H(x, y) yang 2-increasing mengakibatkan H(x, y) fungsi yang tidak turun terhadap x dan y? Pandang contoh H(x, y) = (2x − 1)(2y − 1). Kita memiliki VH (B) = H(u1,1 , u2,1 ) − H(u1,1 , u2,2 ) − H(u1,2 , u2,1 ) + H(u1,2 , u2,2 ) = (2u1,1 − 1)(2u2,1 − 1) − (2u1,1 − 1)(2u2,2 − 1) − (2u1,2 − 1)(2u2,1 − 1) + (2u1,2 − 1)(2u2,2 − 1)
(5.5)
= 2(2u1,1 − 1)(u2,1 − u2,2 ) − 2(2u1,2 − 1)(u2,1 − u2,2 ) = 2(u2,1 − u2,2 )(2u1,1 − 2u1,2 ) ≥ 0. Jadi H(x, y) fungsi yang 2-increasing. Tetapi untuk y ditetapkan (2x1 − 1)(2y − 1) ≤ (2x2 − 1)(2y − 1) untuk setiap x1 ≤ x2 bila y ≥ 12 . D EFINISI 7. Misalkan terdapat M1 dan M2 yang memenuhi M1 = max S1 dan M2 = max S2 . Maka fungsi-fungsi marginal F dan G dari Λ masingmasing didefinisikan sebagai F : S1 → R, F (x) = Λ(x, M2 )
(5.6)
G : S2 → R, G(y) = Λ(M1 , y).
(5.7)
dan D EFINISI 8. Misalkan terdapat m1 dan m2 yang memenuhi m1 = min S1 dan m2 = min S2 . Maka Λ : S1 × S2 → R dikatakan memiliki sifat grounded jika Λ(m1 , y) = Λ(x, m2 ) = 0 untuk setiap (x, y) ∈ S1 × S2 .
12
1. COPULA DAN APLIKASINYA
5.2. Sifat-sifat dari fungsi 2-increasing dan grounded. Misalkan Λ memiliki sifat 2-increasing. Maka Λ memenuhi ketaksamaan-ketaksamaan berikut: Λ(u1,2 , u2,2 ) − Λ(u1,2 , u2,1 ) ≥ Λ(u1,1 , u2,2 ) − Λ(u1,1 , u2,1 )
(5.8)
Λ(u1,2 , u2,2 ) − Λ(u1,1 , u2,2 ) ≥ Λ(u1,2 , u2,1 ) − Λ(u1,1 , u2,1 ).
(5.9)
dan Misalkan kita gunakan u2,1 = m2 dalam ketaksamaan (5.8) dan u1,1 = m1 dalam ketaksamaan (5.9), dan Λ juga memiliki sifat grounded maka kita peroleh Λ(u1,2 , v) ≥ Λ(u1,1 , v) (5.10) dan Λ(w, u2,2 ) ≥ Λ(w, u2,1 )
(5.11)
untuk sembarang w ∈ S1 dan v ∈ S2 . Sehingga perpaduan antara sifat 2-increasing dan grounded akan menciptakan sifat baru yang kami sajikan dalam lema berikut: L EMA 5. Setiap fungsi Λ : S1 × S2 → R yang memiliki sifat 2-increasing dan grounded adalah fungsi tidak turun di kedua argumennya. Dengan menggunakan Lema 5 kita peroleh G(u2,2 ) − G(u2,1 ) = Λ(M1 , u2,2 ) − Λ(M1 , u2,1 ) ≥ Λ(u1,1 , u2,2 ) − Λ(u1,1 , u2,1 ) ≥ 0 (5.12) dan F (u1,2 ) − F (u1,1 ) = Λ(u1,2 , M2 ) − Λ(u1,1 , M2 ) ≥ Λ(u1,2 , u2,1 ) − Λ(u1,1 , u2,1 ) ≥ 0. (5.13) Sehingga didapat |F (u1,2 )−F (u1,1 )|+|G(u2,2 )−G(u2,1 )| ≥ |Λ(u1,1 , u2,2 )+Λ(u1,2 , u2,1 )−2Λ(u1,1 , u2,1 )| (5.14) D EFINISI 9. N-Copula adalah sebuah fungsi dengan N peubah yang menghubungkan distribusi-distribusi marginal dengan distribusi gabungannya. 6. Korelasi Linear Korelasi adalah suatu ukuran kebergantungan antar dua variabel acak yang didefinisikan sebagai berikut: ρXY =
Cov(X, Y ) . σX σY
(6.1)
Misalkan X ∼ N (0, 1) dan Y = X 2 . Kita ketahui bahwa m.g.f. dari t2
0 00 N (0, 1) adalah MX (t) = e 2 . Maka E(X) = MX (0) = 0, E(X 2 ) = MX (0) = t2
t2
t2
t2
t2
000 e 2 + t2 e 2 |t=0 = 1 dan E(X 3 ) = MX (0) = te 2 + 2te 2 + t3 e 2 |t=0 = 0. Sehingga
Cov(X, Y ) = E(XY ) − E(X)E(Y ) = E(X 3 ) − E(X)E(X 2 ) = 0,
(6.2)
yang mengakibatkan ρXY = 0. Hal ini menunjukan secara umum nilai korelasi yang nol tidak mengakibatkan kebebasan antara X dan Y . Syarat agar X dan Y saling bebas adalah jika Cov(φ1 (X), φ2 (Y )) = 0 untuk setiap fungsi φ1 dan φ2 . Hal ini merupakan salah satu kelemahan pengukuran kebebasan melalui korelasi ρ.
6. KORELASI LINEAR
13
L EMA 6 (Hoeffding). Jika F menyatakan distribusi gabungan dari X dan Y dengan FX dan FY adalah masing-masing distribusi marginalnya, maka Z ∞Z ∞ [F (x, y)−FX (x)FY (y)]dxdy (6.3) Cov(X, Y ) = E(XY )−E(X)E(Y ) = −∞
−∞
dengan anggapan E(XY ), E(X) dan E(Y ) terdefinisi. B UKTI . Misalkan Z1 = (X1 , Y1 ) dan Z2 = (X2 , Y2 ) saling bebas yang berasal dari distribusi F . Maka Cov(Z1 , Z2 ) = 0 yang memberikan hubunganhubungan E[X1 Y2 ] = E[X1 ]E[Y2 ] dan E[Y1 X2 ] = E[Y1 ]E[X2 ].
(6.4)
Dengan menggunakan (6.4) dan E[X] = E[X1 ] = E[X2 ], kita peroleh E[(X1 − X2 )(Y1 − Y2 )] = E[X1 Y1 − X1 Y2 − X2 Y1 + X2 Y2 ] = E[X1 Y1 ] − E[X1 Y2 ] − E[X2 Y1 ] + E[X2 Y2 ] = E[X1 Y1 ] − E[X1 ]E[Y2 ] + E[X2 Y2 ] − E[X2 ]E[Y1 ] (6.5) = E[X1 Y1 ] − E[X1 ]E[Y1 ] + E[X2 Y2 ] − E[X2 ]E[Y2 ] = 2(E[X1 Y1 ] − E[X1 ]E[Y1 ]). Definisikan ( 1, jika u ≤ x I(u, x) = (6.6) 0, lainnnya. R∞ Misalkan X1 < X2 . Maka −∞ (I(u, X1 ) − I(u, X2 ))du = X1 − X2 < 0. Untuk R∞ X1 > X2 kita dapatkan −∞ (I(u, X1 ) − I(u, X2 ))du = X2 − X1 < 0. Kedua hasil integral tersebut merupakan selisih antara X1 dan X2 yang bernilai sama, sehingga urutan dapat diabaikan. Sehingga kita dapat menuliskan Z ∞ (I(u, X1 ) − I(u, X2 ))du = X1 − X2 . (6.7) −∞
Dengan menggabungkan hasil-hasil di atas, kita dapatkan 2(E[X1 Y1 ] − E[X1 ]E[Y1 ]) = E[(X1 − X2 )(Y1 − Y2 )] Z Z = E[ (I(u, X1 ) − I(u, X2 ))(I(v, Y1 ) − I(v, Y2 ))dudv] Z Z = E[(I(u, X1 ) − I(u, X2 ))(I(v, Y1 ) − I(v, Y2 ))]dudv. (6.8) Misalkan H(u, v) = E[(I(u, X1 ) − I(u, X2 ))(I(v, Y1 ) − I(v, Y2 ))]. Maka kita peroleh Z Z Z Z H(u, v) = (I(u, x1 )−I(u, x2 ))(I(v, y1 )−I(v, y2 ))f (x1 , y1 )dx1 dy1 f (x2 , y2 )dx2 y2 . (6.9) Marilah kita hitung integral di atas bagian perbagian. Kita dapat menuliskan integral di atas sebagai: H(u, v) = 2J1 − 2J2 ,
(6.10)
dimana Z Z Z Z J1 =
I(u, x1 )I(v, y1 )f (x1 , y1 )f (x2 , y2 )dx1 dy1 dx2 dy2
(6.11)
14
1. COPULA DAN APLIKASINYA
dan Z Z Z Z J2 =
I(u, x1 )I(v, y2 )f (x1 , y1 )f (x2 , y2 )dx1 dy2 dx2 dy1
(6.12)
Marilah kita hitung J1 terlebih dahulu. Kita memiliki Z Z Z Z x1 I(u, x1 )I(v, y1 )f (x1 , y1 )f (x2 , y2 )dx1 dy1 = f (x2 , y2 ) f (s, y1 )dsdy1 −∞ Z y1 Z x1 f (s, t)dsdt = f (x2 , y2 ) −∞
−∞
= f (x2 , y2 )F (x1 , y1 ). (6.13) Hal di atas menghasilkan Z Z J1 = f (x2 , y2 )F (x1 , y1 )dx2 dy2 = F (x1 , y1 ).
Z Z
(6.14)
Untuk menghitung J2 perhatikan integral berikut Z Z I(u, x1 )I(v, y2 )f (x1 , y1 )f (x2 , y2 )dx1 dy2 = I(u, x1 )f (x1 , y1 )dx1 I(v, y2 )f (x2 , y2 )dy2 Z x1 Z y2 = f (s, y1 )ds f (x2 , t)dt. −∞
−∞
(6.15) Sehingga Z Z
x1
J2 =
Z Z
y2
f (s, y1 )dsdy1 −∞
f (x2 , t)dtdx2 = FX (x1 )FY (y2 ).
(6.16)
−∞
Dari hasil-hasil di atas dapat disimpulkan Z Z 2(E[XY ] − E[X]E[Y ]) = 2 (F (x, y) − FX (x)FY (y))dxdy.
(6.17)
6.1. Keluarga Copula. D EFINISI 10. Distribusi normal multivariabel untuk sebuah vektor berdimensi k yaitu x = (X1 , . . . , Xk )T , N (µ, Σ), didefiniskan sebagai berikut Z x1 Z xk 1 1 Φρ (x1 , . . . , xk ) = ... exp(− (x − µ)T Σ−1 (x − µ)), (6.18) k/2 |Σ|1/2 2 |2π| −∞ −∞ dimana Σi,j = Cov(Xi , Xj ) dan |Σ| adalah determinan dari Σ. Sebagai contoh untuk k = 2, dengan menggunakan persamaan Cov(X, Y ) = ρσX σY , kita peroleh σ12 ρσX1 σX2 µX1 Σ= ,µ= , (6.19) 2 ρσX1 σX2 σX µX2 2 dan 2 2 2 |Σ| = σX σ 2 − σX σ 2 ρ2 = σX σ 2 (1 − ρ2 ). 1 X2 1 X2 1 X2
(6.20)
L EMA 7. Misalkan (X1 , X2 ) ∼ N (µ, Σ). Maka distribusi bersyarat Xi |Xj = a ∼ N (µ, Σ), dimana µ = µi + ρ σσji (a − µj ) dan Σ = σi2 (1 − ρ2 ), i 6= j.
6. KORELASI LINEAR
15
D EFINISI 11 (Copula Gaussian multivariabel-MVN). Misalkan ρ adalah sebuah matrik simetrik, definit positif dengan diag(ρ) = 1 dan Φρ yaitu distribusi normal multivariabel standar dengan korelasi ρ. Copula Gaussian multivariabel didefinisikan sebagai berikut: C(u1 , . . . , CN ; ρ) = Φρ (Φ−1 (u1 ), . . . , Φ−1 ρ (uN ))
(6.21)
dengan fungsi densitas 1 1 T −1 c(u1 , . . . , uN ) = 1/2 exp − ξ (ρ − I)ξ , 2 |ρ|
(6.22)
dimana ξn = Φ−1 (un ). D EFINISI 12. Copula bersyarat dari (x, y)|Ft−1 , dimana x|Ft−1 ∼ F dan y|Ft−1 ∼ G. 6.2. Simulasi Copula. 6.3. Estimasi Non-parametric. Misalkan T ABEL 1. Time series data t X1 X2
1 2 3 2 1 12
3 3 3.5
4 5 7 9 2 8.5
6 1 1.3
7 4 3.5
8 9 8 10 6.5 11
10 15 12.5
T ABEL 2. Statistik terurut dari Time series data t
1
2
3
4
(1) X1 (2) X2
1 3
2 12
3 3.5
2 7
5
6
8.5 1 9 1.3
7 3.5 4
8
9
6.5 10 8 11
10 12.5 15
Distribusi empirik Copulanya dapat dituliskan sebagai berikut: 10 t1 t2 1 X ˆ C , = 1 t (t1 ) t (t2 ) , (6.23) 10 10 10 t=1 x1 ≤x1 , x2 ≤x2 dimana 1 ≤ t1 , t2 ≤ 10. 6.3.1. Simulasi random variabel generator. 0 Data (X1 , Y1 ), . . . , (Xn , Yn ), dimana Xi ∼ F (x, α) dan Yi ∼ G(y, β). Ui = F (Xi ) dan Vi = G(Yi ), i = 1, 2, . . . , n. 1 Fungsi log-Likelihood Copula n n n X X X log l(θ, α, β) = log c(uj , vj , θ) + log f (F −1 (uj ), α) + log g(G−1 (vj ), β) j=1
2 3 4 5
j=1
j=1
(6.24) Pn α ˆ = argmaxα j=1 log f (F −1 (uj ), α) Pn βˆ = argmaxβ j=1 log g(G−1 (vj ), β) ˆ θˆ = argmaxθ log l(θ, α ˆ , β) ˆ Gunakan θ untuk menghitung ρs , ρτ dan membangkitkan data u dan v.