Bab II Kajian Teori Copula
2.1 Pendahuluan Copula Tesis ini mengacu pada terminologi copula sebagai fungsi yang menghubungkan fungsi distribusi multivariat terhadap fungsi distribusi marginal uniform.
Misalkan variabel acak X dan Y , dengan fungsi distribusi masing-masing adalah F(x) = P(X ≤ x) dan G(y) = P(Y ≤ y), serta fungsi distribusi gabungannya H(x,y) = P(X ≤ x ,Y ≤ y). Untuk setiap ( x, y ) ; x, y ∈ R , diperoleh tiga bilangan yaitu F(x), G(y), dan H(x,y), yang ketiganya jatuh dalam interval [0,1]. Dengan kata lain, tiap
( x, y ) ; x, y ∈ R
menghasilkan titik (F(x),G(y)) di dalam persegi satuan
[0,1]×[0,1], dan pasangan terurut ini berkorespondensi dengan bilangan H(x,y) dalam interval [0,1]. Korespondensi terakhir inilah yang menjadi karakteristik untuk copula.
Definisi 2.1.1 Misalkan A, B subhimpunan tak kosong di R dan H : R 2 → R \ {−∞, ∞} adalah r fungsi sedemikian sehingga Dom( H ) = A × B . Pandang a = ( x1 , y1 )t r r r b = ( x2 , y2 )t di R 2 , definisikan a ≤ b , jika x1 ≤ x2 dan y1 ≤ y2 . Misalkan pula suatu persegi panjang di R 2 dinyatakan sebagai r r Q = [ x1 ,x2 ] × [ y1 , y2 ] , a ≤ b ,
dan
(2.1)
sedemikian sehingga Q ⊂ Dom( H ) . Maka a.
Volume-H terhadap persegi panjang Q didefinisikan oleh:
VH ( Q ) = H ( x2 , y2 ) − H ( x2 , y1 ) − H ( x1, y2 ) + H ( x1, y1 ) .
(2.2)
4
5
b.
H disebut 2-increasing jika VH (Q ) ≥ 0 untuk semua persegi panjang Q di Dom( H ) .
c.
Misalkan A, B mempunyai elemen terkecil masing-masing a dan b . Maka H dikatakan grounded jika H ( a, y ) = 0 = H ( x, b) , untuk setiap x ∈ A, y ∈ B ,
(2.3)
akibatnya kita dapat mengatakan jika H grounded, maka VH (Q) = H ( x, y ) , untuk setiap Q = [ a, x] × [b, y ] ⊂ Dom( H ) .
(2.4)
Ilustrasi: Y
y Q b a
x
X
Gambar 2.1. Persegi panjang Q = [a, x] × [b, y ] Maka,
VH (Q) = H ( x, y ) − H ( x, b) − H (a, y ) + H (a, b) = H ( x, y )
,
(2.5)
karena H ( x, b) = H (a, x) = H (a, b) = 0 . Lemma 2.1.2
Misalkan A, B subhimpunan tak kosong di R dan H : R 2 → R \ {−∞, ∞} adalah
fungsi sedemikian sehingga Dom( H ) = A × B dan H bersifat 2-increasing . Misalkan pula x1 , x2 ∈ A dengan x1 ≤ x2 , dan y1 , y2 ∈ B dengan y1 ≤ y2 . Maka pemetaan
Bab II Kajian Teori Copula
6 t a H ( t , y2 ) − H ( t , y1 ) non-decreasing di A , dan
(2.6)
t a H ( x2 , t ) − H ( x1 , t ) non-decreasing di B .
(2.7)
Jika H fungsi 2-increasing yang grounded maka sifat diatas masih dipenuhi. Bukti :
Diketahui x1 , x2 ∈ A dengan x1 ≤ x2 . Karena H bersifat 2-increasing maka berlaku H (t , y2 ) − H (t , y1 ) ≥ 0 ⇔ H (t , y2 ) ≥ H (t , y1 ) Akibatnya pemetaan t a H ( t , y2 ) − H ( t , y1 ) non-decreasing di A . Dengan cara yang serupa akan diperoleh t a H ( x2 , t ) − H ( x1 , t ) non-decreasing di B . Definisi 2.1.3
Misalkan b1, b2 berturut-turut merupakan elemen terbesar untuk A dan B . Maka H dikatakan memiliki marginal yaitu fungsi F dan G yang memenuhi Dom( F ) = A, F ( x ) = H ( x, b2 ) ∀x ∈ A Dom(G ) = B, G ( x ) = H ( b1, y ) ∀y ∈ B
(2.8)
Lemma 2.1.4
Misalkan A, B subhimpunan tak kosong di R dan H : R 2 → R \ {−∞, ∞} adalah
fungsi sedemikian sehingga Dom( H ) = A × B dan H bersifat 2-increasing yang grounded dan memiliki marginal. Misalkan pula ( x1 , y1 ) , ( x2 , y2 ) ∈ A × B . Maka H ( x2 , y2 ) − H ( x1, y1 ) ≤ F ( x2 ) − F ( x1 ) + G ( y2 ) − G ( y1 )
(2.9)
Bukti :
Dengan menggunakan ketaksamaan segitiga diperoleh H ( x2 , y2 ) − H ( x1 , y1 ) ≤ H ( x2 , y2 ) − H ( x1 , y2 ) + H ( x1 , y2 ) − H ( x1 , y1 )
Asumsikan x1 ≤ x2 . Karena H bersifat 2-increasing yang grounded dan memiliki marginal maka menurut Lemma 2.1.2 0 ≤ H ( x2 , y2 ) − H ( x1 , y2 ) ≤ F ( x2 ) − F ( x1 )
Bab II Kajian Teori Copula
7 Asumsikan x2 ≤ x1 analog dengan sebelumnya diperoleh 0 ≤ H ( x1 , y2 ) − H ( x2 , y2 ) ≤ F ( x1 ) − F ( x2 )
Akibatnya ∀x1, x2 ∈ A berlaku H ( x2 , y2 ) − H ( x1, y2 ) ≤ F ( x2 ) − F ( x1 ) Hal yang sama berlaku ∀y1, y2 ∈ B H ( x1, y2 ) − H ( x1, y1 ) ≤ G ( y2 ) − G ( y1 ) Dengan mensubstitusikan dua persamaan terakhir ke dalam ketaksamaan segitiga yang ditulis di awal, maka pembuktian lengkap.
2.2 Copula dan Sifat-sifatnya Definisi 2.2.1
Subcopula dua dimensi (2-subcopula) adalah fungsi C ' yang memenuhi sifatsifat: a. Dom(C ') = A × B , di mana A dan B adalah subhimpunan dari I = [0,1] , b. C ' grounded dan 2-increasing, c. Untuk setiap u ∈ A dan v ∈ B , berlaku
C '(u ,1) = u dan C '(1, v) = v .
(2.10)
Perhatikan bahwa untuk setiap ( u , v ) ∈ Dom(C ') , maka 0 ≤ C '(u, v) ≤ 1 , sehingga Range(C ') juga merupakan subhimpunan dari I.
Definisi 2.2.2
Copula dua dimensi (2-copula) adalah subcopula 2 dimensi (2-subcopula) C dengan Dom(C ') = I 2 . Ekivalen dengan mengatakan bahwa Copula dua dimensi (2-copula) adalah fungsi C : I 2 → I yang memenuhi sifat-sifat: a. Untuk setiap ( u , v ) ∈ I , maka berlaku
C (u , 0) = 0 = C (0, v) ,
Bab II Kajian Teori Copula
(2.11a)
8
dan juga C (u ,1) = u dan C (1, v) = v .
(2.11b)
b. Untuk setiap u1 , u2 , v1, v2 ∈ I sedemikian sehingga u1 ≤ u2 , v1 ≤ v2 , maka berlaku C (u2 , v2 ) − C (u2 , v1 ) − C (u1, v2 ) + C (u1, v1 ) ≥ 0 .
(2.12)
Himpunan dari semua copula dua dimensi didefinisikan sebagai Χ2. Tulis, C (u , v) = C (u , v) − C (u , 0) − C (0, v) + C (0, 0) = VC ([ 0, u ] × [ 0, v ])
(2.13)
maka hal ini akan menunjukkan bahwa C (u , v ) sebagai pengaitan suatu bilangan di I terhadap persegi panjang [ 0, u ] × [ 0, v ] . Beberapa sifat dasar yang penting dari copula akan dibahas berikut ini.
Akibat 2.2.3
Misalkan C ∈ Χ2 dan 0 ≤ x1 ≤ x2 ≤ 1 , maka pemetaan y a C ( x2 , y ) − C ( x1, y ) , untuk setiap y ∈ I
(2.14)
monoton naik di I, dan hal yang sama misalkan C ∈ Χ2 dan 0 ≤ y1 ≤ y2 ≤ 1 , maka pemetaan x a C ( x, y1 ) − C ( x, y2 ) , untuk setiap x ∈ I
(2.15)
monoton naik di I. Bukti:
Misalkan 0 ≤ y1 ≤ y2 ≤ 1 dan 0 ≤ x1 ≤ x2 ≤ 1 . Karena C bersifat 2-increasing, kita peroleh VC ([ x1 , x2 ] × [ y1, y2 ]) = C ( x2 , y2 ) − C ( x2 , y1 ) − C ( x1 , y2 ) + C ( x1 , y1 ) ≥ 0 ⇔ C ( x2 , y2 ) − C ( x1 , y2 ) ≥ C ( x2 , y1 ) − C ( x1, y1 ).
Akibat 2.2.4
Bab II Kajian Teori Copula
9 Copula bersifat kontinu Lipchitz artinya untuk setiap C ∈ Χ2 dan 0 ≤ x1 ≤ x2 ≤ 1 , 0 ≤ y1 ≤ y2 ≤ 1 berlaku 0 ≤ C ( x2 , y ) − C ( x1, y ) ≤ x2 − x1 dan
(2.16a)
0 ≤ C ( x, y2 ) − C ( x, y1 ) ≤ y2 − y1 , jadi
(2.16b)
C ( x2 , y2 ) − C ( x1 , y1 ) ≤ x2 − x1 + y2 − y1 .
(2.17)
Jika x2 → x1 dan y2 → y1 , maka dari persamaan (2.14) akan kita peroleh: C ( x2 , y2 ) − C ( x1, y1 ) ≤
lim
x2 → x1 , y2 → y1
x2 − x1 + y2 − y1 = 0 ,
(2.18)
sehingga lim
x2 → x1 , y2 → y1
C ( x2 , y2 ) = C ( x1 , y1 ) .
(2.19)
Akibatnya copula C kontinu.
Akibat 2.2.5
Misalkan C ∈ Χ2, maka y a C ( x, y ) monoton naik untuk setiap x ∈ I , dan hal yang serupa x a C ( x, y ) monoton naik untuk setiap y ∈ I . Teorema 2.2.6 Misalkan C ∈ Χ2, maka untuk setiap u , v ∈ I berlaku
W (u, v) = max(u + v − 1, 0) ≤ C (u , v) ≤ min(u , v) = M (u , v) ,
(2.20)
di mana fungsi W dan M disebut batas bawah dan batas atas Fréchet dari copula C. Fungsi W dan M sendiri juga merupakan copula. Bukti:
Berdasarkan kemonotonan copula, kita peroleh:
C (u , v) ≤ C (u,1) = u dan C (u , v) ≤ C (1, v) = v , Maka C (u , v) ≤ min(u , v) = M (u , v) . Jelas C (u , v) ≥ 0 dan VC ([u,1] × [ v,1]) ≥ 0 artinya C (1,1) − C (1, v) − C (u,1) + C (u , v) ≥ 0 atau 1 − v − u + C (u, v) ≥ 0 . Sehungga C (u, v) ≥ u + v − 1
Bab II Kajian Teori Copula
10 Akibatnya C (u , v) ≥ max ( u + v − 1, 0 ) = W (u , v) .
2.3 Copula dan Variabel Acak Variabel acak merupakan suatu pemetaan dari ruang sample ke bilangan real. Misalkan X menyatakan suatu variabel acak. Peluang bahwa variabel acak X lebih kecil atau sama dengan x, ditulis P(X ≤ x) adalah F(z) dengan 0 ≤ F(x) ≤1, selanjutnya F(x) disebut dengan fungsi distribusi.
Definisi 2.3.1
Fungsi distribusi (marginal) adalah suatu fungsi F dengan Dom( F ) = R sedemikian sehingga: 1. F fungsi tak turun. 2. F (−∞) = 0 dan F (∞) = 1
Definisi 2.3.2
Fungsi distribusi gabungan adalah suatu fungsi H dengan Dom( H ) = R 2 sedemikian sehingga: 1. H fungsi 2-increasing. 2. H ( x, −∞) = H (−∞, y ) = 0 dan H (∞, ∞) = 1
Lemma 2.3.3
Misalkan H adalah fungsi distribusi gabungan dengan fungsi distribusi marginalnya masing-masing F dan G, maka terdapat subcopula C ' tunggal sedemikian sehingga: 1. Dom(C ') = Rank ( F ) × Rank (G ) , 2. Untuk setiap x, y ∈ R , H ( x, y ) = C ' ( F ( x), G ( y ) ) Lemma 2.3.4
Misalkan C ' adalah subcopula. Maka terdapat copula C sedemikian sehingga
Bab II Kajian Teori Copula
11
C (u , v) = C '(u , v) untuk setiap (u , v) di dom(C ') , artinya setiap subcopula dapat diperluas menjadi suatu copula. Pada umumnya perluasan ini tidak tunggal.
Teorema 2.3.5
Misalkan H adalah fungsi distribusi gabungan dari variable X dan Y, dengan F dan G masing-masing adalah fungsi distribusi marginal dari X dan Y. Maka terdapat sebuah copula C sedemikian sehingga untuk setiap x, y ∈ R berlaku H ( x, y ) = C ( F ( x), G ( y ) ) = C (u , v) ,
(2.21)
dengan u = F ( x) dan v = G ( y ) . Jika F dan G kontinu, maka copula C tunggal, jika F dan G tidak kontinu, maka copula C tunggal pada Range( F ) × Range(G ) . Sebaliknya, jika C adalah sebuah copula, F dan G masing-masing adalah fungsi distribusi marginal dari X dan Y. Maka terdapat fungsi distribusi gabungan H sedemikian sehingga untuk setiap x, y ∈ R berlaku H ( x, y ) = C ( F ( x), G ( y ) ) = C (u , v) .
Teorema ini pertama kali dikemukakan oleh Sklar pada tahun 1959, sehingga disebut sebagai “ Sklar’s Theorem “. Bukti:
Jika F dan G kontinu, berdasarkan lemma 2.3.3, maka terdapat subcopula C ' tunggal dengan Dom(C ') = Range( F ) × Range(G ) , karena F dan G kontinu maka
Range( F ) = Range(G ) = I atau Dom(C ') = I 2 , ini berarti subcopula tersebut merupakan copula yang tunggal. Jika F dan G
tidak kontinu, maka terdapat subcopula C ' tunggal
dengan
Dom(C ') = Range( F ) × Range(G ) , maka berdasarkan lemma 2.3.4 subcopula tersebut dapat diperluas menjadi suatu copula.
Bab II Kajian Teori Copula
12
Copula C pada teorema 2.3.5 akan dinamakan copula dari X dan Y, dan di notasikan C XY , di mana copula tersebut dapat digunakan untuk mengidentifikasi dependensi dari variabel acak X dan Y. Teorema berikut akan menunjukkan bahwa copula Π (u, v) = u.v menyatakan karakteristik keindependenan dari dua variable acak, di mana fungsi distribusinya kontinu.
Teorema 2.3.6.
Misalkan X dan Y adalah variabel acak kontinu. Maka X dan Y independen jika jika dan hanya jika C XY = Π . Bukti:
Misalkan X dan Y adalah variabel acak kontinu,
(⇒)
misalkan X dan Y independent dan misalkan F dan G masing-masing menyatakan fungsi distribusi marginal dari X dan Y, maka fungsi distribusi gabungannya
adalah H ( x, y ) = F ( x).G ( y ) , maka berdasarkan teorema
Sklar, terdapat copula C XY = H ( x, y ) = F ( x).G ( y ) = u.v = Π (u , v) , di mana
u = F ( x) dan v = G ( y ) ,
( ⇐)
misalkan
C XY = Π (u , v) = u.v , misalkan F dan G masing-masing
menyatakan fungsi distribusi marginal dari X dan Y, maka untuk setiap u, v ∈ I , maka terdapat suatu x, y ∈ R sedemikian sehingga F ( x) = u dan
G ( y ) = v , jadi C XY = u.v = F ( x).G ( y ) = H ( x, y ) , berdasarkan teorema Sklar H ( x, y ) adalah fungsi distribusi gabungan dari X dan Y. Jadi X dan Y independen.
Pada subbab 2.2, telah dijelaskan mengenai batas-batas Fréchet-Hoeffding sebagai batas umum untuk setiap copula, yaitu untuk setiap C ∈ Χ2 dan u, v ∈ I berlaku
W (u, v) = max(u + v − 1, 0) ≤ C (u , v) ≤ min(u, v) = M (u , v) .
Bab II Kajian Teori Copula
(2.22)
13
Sebagai konsekuensi dari teorema Sklar, jika X dan Y adalah variabel acak dengan fungsi distribusi gabungan H dan mempunyai fungsi distribusi marginal masingmasing adalah F dan G, maka untuk setiap x, y ∈ R berlaku max ( F ( x) + G ( y ) − 1, 0 ) ≤ H ( x, y ) ≤ min ( F ( x), G ( y ) ) .
(2.23)
2.4 Survival Copula Dalam banyak aplikasi, cukup menarik untuk dikaji adalah mengenai waktu hidup individu atau barang dalam suatu populasi. Peluang seseorang bertahan hidup lebih dari x didefinisikan sebagai Fungsi survival SX ( x) = P ( X > x) = 1− F ( x)
(2.24)
dengan F menyatakan fungsi distribusi dari X . Karena berkaitan dengan waktu hidup, maka secara alami akan diperoleh Range dari peubah acak adalah [ 0, ∞ ) . Untuk peubah acak berpasangan ( X , Y ) dengan fungsi distribusi gabungan H , maka fungsi survival gabungan dinyatakan sebagai berikut, S ( x, y ) = P ( X > x, Y > y )
(2.25)
dengan batas dari S adalah S ( x, −∞ ) dan S ( −∞, y ) , dimana S X dan SY berturutturut menyatakan fungsi marginal untuk X dan Y .
Pertanyaan yang sewajarnya muncul adalah apakah ada hubungan antara fungsi marginal dengan fungsi survival gabungan analog terhadap adanya hubungan antara fungsi marginal dengan fungsi distribusi gabungan? Untuk menjawab pertanyaan ini, misalkan copula dari X dan Y disebut C . Maka kita punya S ( x, y ) = 1 − F ( x ) − G ( y ) + H ( x, y ) = S X ( x ) + SY ( y ) − 1 + C ( F ( x ) , G ( y ) ) = S X ( x ) + SY ( y ) − 1 + C (1 − S X ( x ) ,1 − SY ( y ) )
Bab II Kajian Teori Copula
14
sehingga jika didefinisikan suatu fungsi C dari I 2 ke I oleh C ( u, v ) = u + v − 1 + C (1 − u,1 − v )
(2.26)
S ( x, y ) = C ( S X ( x ) , SY ( y ) )
(2.27)
akan diperoleh
2.5 Copula Archimedean Dalam subbab ini akan dibahas sebuah kelas Copula yang cukup penting, yaitu Copula Archimedean. Copula ini memiliki aplikasi yang cukup luas dengan beberapa alasan, yaitu 1) copula ini mudah dibangun, 2) keluarga copula ini sangat banyak variasinya, dan 3) memiliki sifat-sifat penting yang diperlukan. Copula Archimedean pada awalnya muncul dalam kajian ruang probabilistik, di mana copula ini merupakan bagian dari pengembangan mengenai ketaksamaan segitiga.
Untuk membangun copula Archimedes ini, akan diperkenalkan suatu fungsi yang biasa disebut dengan fungsi pembangkit Φ yang merupakan fungsi kontinu dan monoton turun kuat dari I ke [0, ∞] sedemikian sehingga Φ(1) = 0 . Teorema berikut merupakan teorema dasar dalam membangun copula Archimedean.
Teorema 2.5.1
Misalkan Φ : I → [0, ∞] fungsi kontinu, monoton turun kuat sedemikian sehingga Φ (1) = 0 , dan misalkan Φ[ −1] adalah generalized invers dari Φ
yang
didefinisikan oleh ⎧⎪Φ −1 (t ) , 0 ≤ t ≤ Φ (0) Φ[ −1] = ⎨ ⎪⎩ 0 , Φ (0) < t < ∞
Bab II Kajian Teori Copula
(2.28)
15
Maka fungsi C : I 2 → I yang diberikan oleh −1 C ( u,v ) = Φ[ ] {Φ ( u ) + Φ ( v )}
(2.29)
adalah sebuah copula jika dan hanya jika Φ konvex. Φ disebut pembangkit dari copula. Selanjutnya copula pada persamaan (2.29) disebut copula Archimedean.
Catatan: a. Jika Φ (0) = ∞ , Φ dikatakan pembangkit kuat jika Φ[ −1] = Φ −1 yang merupakan invers yang lazim. Copula yang dibangun dari pembangkit seperti ini disebut copula kuat. b. Pembangkit dari copula Archimedean tidak tunggal, sebagai contoh copula dengan pembangkit cΦ, c > 0 memberikan hasil yang sama dengan copula dengan pembangkit Φ .
Berikut disajikan dua contoh copula yang termasuk dalam Copula Archimedean.
Tabel 1 Contoh Copula Archimedean
Clayton
(t
−α
C ( u, v )
Range α
Φ
Famili
− 1)
( 0, ∞ )
(u
α Gumbel
{− log ( t )}
α +1
[0, ∞ )
−α
+ v −α − 1)
(
−1
α
exp− ( − log u ) + ( − log v ) α
α
)
1
α
Lemma 2.5.2 (Lihat [4])
Misal Φ : I → [0, ∞] memenuhi Φ (1) = 0 . Misalkan pula X dan Y adalah peubah acak uniform yang memenuhi CΦ ( x, y ) = Φ −1 {Φ ( x ) + Φ ( y )} . Definisikan
Bab II Kajian Teori Copula
16
U=
Φ(X )
{Φ ( X ) + Φ (Y )}
V = C ( X ,Y )
λ (v) =
Φ (v) ,0 < v ≤1 Φ' ( v )
Maka : a. U berdistribusi uniform pada ( 0,1) , b. V dan K ( v ) = v − λ ( v ) mengikuti distribusi yang sama pada ( 0,1) , c. U dan V saling bebas Untuk copula pada tabel 1 maka diperoleh λ untuk masing-masing copula sebagai berikut. Tabel 2 λ ( v ) Famili
λ
Clayton
−v (1 − vα )
α Gumbel
v log v (α + 1)
λ ( v ) berkorespondensi satu-satu terhadap Φ . Akibatnya jika dipilih suatu copula Archimedean, ekivalen dengan memilih suatu fungsi λ yang bersesuaian dengan copula tersebut. Estimator non parametrik untuk λ didefinisikan sebagai berikut, λn ( v ) = v − K n ( v ) ;0 < v < 1
dengan K n ( v ) =
1 n ∑ δ ( v − Vi ) n i =1
Bab II Kajian Teori Copula
dan Vi =
{
# ( X j , Y j ) : X j < X i , Y j < Yi
( n − 1)
(2.30)
} ;1 ≤ i ≤ n .
17
2.6 Kendall’s Tau Pada subbab ini akan dijelaskan bentuk kuantifikasi dependensi statistik Kendall’s
τ, yaitu kuantifikasi dependensi yang didasarkan atas data rangking. Tetapi, terlebih dahulu akan dijelaskan mengenai konsep konkordan yang akan digunakan dalam menjelaskan statistik Kendall’s τ.
2.6.1 Konkordan Secara tidak resmi, pasangan variabel acak X dan Y disebut ‘concordance’ jika salah satu variabel bernilai ‘besar’, maka akan berkorespondensi dengan nilai yang ‘besar’ juga di variabel yang lain, begitu juga sebaliknya untuk nilai yang ‘kecil’. Untuk lebih tepatnya, misalkan ( X , Y ) adalah vektor dari dua variabel acak dan ( x1, y1 ) , ( x2 , y2 ) sampel dari ( X , Y ) . Kita akan mengatakan bahwa ( x1 , y1 ) dan ( x2 , y2 ) konkordan jika ( x1 − x2 )( y1 − y2 ) > 0 , dan sebaliknya disebut diskordan jika ( x1 − x2 )( y1 − y2 ) < 0 . Ini jelas bahwa kita dapat mendefinisikan konkordan dari dua vektor
( x1 , y1 )
dan
( x2 , y2 )
tanpa
menggunakan definisi variabel acak.
Perlu diingat bahwa P ( X1 = X 2 ) = 0 , jika X1 dan X 2 kontinu. Oleh karena itu, jika X dan Y di atas kontinu bagian dari konkordan dan diskordan memisahkan ruang sample sebagai subhimpunan dari R 2 menjadi dua bagian yang saling bebas yang mempunyai ukuran peluang 1.
2.6.2 Kendall’s Tau dan Copula Definisi 2.6.2.1 (Kendall’s τ) Misalkan ( X1, Y1 ) dan ( X 2 , Y2 ) dua vektor acak. Kendall’s τ
didefinisikan
sebagai. τ ≡ τ X .Y = P ( ( X1 − X 2 )(Y1 − Y2 ) > 0 ) − P ( ( X1 − X 2 )(Y1 − Y2 ) < 0 )
Bab II Kajian Teori Copula
(2.31)
18 Selanjutnya kita menyebut bentuk di atas adalah definisi Kendall’s τ untuk populasi. Jadi, Kendall’s τ adalah perbedaan antara peluang dari konkordan dan peluang dari diskordan.
Dalam prakteknya, kita dapat mendefinisikan ukuran dependensi Kendall’s τ berdasarkan sampel. Misalkan
{( x1, y1 ),..., ( xn , yn )} ,
berukuran n dari vaktor acak kontinu
{( xi , yi ), ( x j , y j )} ,
i, j ∈ {1,..., n}, i ≠ j
n≥2
adalah sampel
( X , Y ) . Setiap pasang sampel
merupakan
suatu
diskordan
atau
⎛n⎞ konkordan. Maka jelas terdapat ⎜ ⎟ 1 pasangan berbeda dari sampel yang ada. ⎝ 2⎠ Misalkan K menyatakan banyaknya pasangan konkordan, dan D menyatakan banyaknya pasangan diskordan. Maka Kendall’s τ untuk sampel didefinisikan menjadi
τˆ =
Dengan definisi Kendall’s τ
K −D K −D = K+D ⎛n⎞ ⎜ ⎟ ⎝2⎠
(2.32)
di atas, kita dapat menunjukkan bahwa copula
mempunyai hubungan dengan Kendall’s τ, untuk menunjukkan hubungan tersebut, sebelumnya perlu didefinisikan terlebih dahulu suatu fungsi konkordan Q, yang menyatakan perbedaan peluang dari konkordan dan peluang diskordan antara dua vektor ( X1, Y1 ) dan ( X 2 , Y2 ) dari variabel acak kontinu dengan fungsi distribusi gabungan (yang mungkin) berbeda H1 dan H 2 , tetapi dengan fungsi distribusi marginal yang sama F dan G. Kemudian akan ditunjukkan bahwa fungsi konkordan ini bergantung pada distribusi dari ( X1, Y1 ) dan ( X 2 , Y2 ) melalui copula.
1
⎛n⎞ n! ⎜ ⎟= ⎝ k ⎠ k !(n − k )!
Bab II Kajian Teori Copula
19 Teorema 2.6.2.2 (Fungsi Konkordan Q) Misalkan ( X1, Y1 ) dan ( X 2 , Y2 ) adalah dua vektor random dengan fungsi distribusi
gabungan masing-masing H1 dan H 2 , di mana X i ~ F dan Yi ~ G , i = 1, 2 . Lebih lanjut, misalkan C1 dan C2 menyatakan copula dari ( X1, Y1 ) dan ( X 2 , Y2 ) , sedemikian sehingga H1 ( x, y ) = C1 ( F ( x), G ( y ) ) dan H 2 ( x, y ) = C2 ( F ( x), G ( y ) ) . Jika Q menyatakan perbedaan antara peluang dari konkordan dan peluang diskordan dari ( X1, Y1 ) dan ( X 2 , Y2 ) , yang didefinisikan sebagai Q = P ( ( X1 − X 2 )(Y1 − Y2 ) > 0 ) − P ( ( X1 − X 2 )(Y1 − Y2 ) < 0 ) ,
(2.33)
maka kita peroleh: Q = Q(C1 , C2 ) = 4.∫∫ 2 C2 (u , v)dC1 (u , v) − 1 . I
(2.34)
Bukti:
Karena variabel acak X dan Y kontinu, maka P ( ( X1 − X 2 )(Y1 − Y2 ) < 0 ) = 1 − P ( ( X1 − X 2 )(Y1 − Y2 ) > 0 )
(2.35)
dan oleh karena itu, Q = 2.P ( ( X1 − X 2 )(Y1 − Y2 ) > 0 ) − 1
(2.36)
Akan tetapi, P ( ( X1 − X 2 )(Y1 − Y2 ) > 0 ) = P ( X1 > X 2 , Y1 > Y2 ) + P ( X1 < X 2 , Y1 < Y2 ) ,
(2.37)
dan peluang di atas dapat dihitung dengan mengintegralkan (Riemann-Stieltjes) terhadap distribusi dari salah satu vektor ( X1, Y1 ) atau ( X 2 , Y2 ) . Misalkan terhadap ( X1, Y1 ) , kita peroleh:
P ( X1 > X 2 , Y1 > Y2 ) = P ( X 2 < X1, Y2 < Y1 ) , = ∫∫
R2
= ∫∫
R
P ( X 2 < x, Y2 < y ) dH1 ( x, y ),
2 H 2 ( x, y ) dH1 ( x, y ),
(2.38)
= ∫∫ 2 C2 ( F ( x), G ( y )) dC1 ( F ( x), G ( y )), R
jadi dengan menggunakan transformasi distribusi u = F ( x) dan v = F ( y ) menghasilkan P ( X1 > X 2 , Y1 > Y2 ) = ∫∫ 2 C2 (u, v) dC1 (u, v). I
Bab II Kajian Teori Copula
(2.39)
20
Hal yang serupa, P ( X1 < X 2 , Y1 < Y2 ) = P ( X 2 > X1, Y2 > Y1 ) , = ∫∫
P ( X 2 > x, Y2 > y ) dH1 ( x, y ) ,
= ∫∫
[1 − F ( x) − G ( y) + C2 ( F ( x), G ( y))] dC1 ( F ( x), G ( y )),
= ∫∫
[1 − u − v − C2 (u, v)] dC1 (u, u ).
R2 R2 I2
(2.40)
Karena C1 adalah fungsi distribusi gabungan dari pasangan variabel acak (U ,V ) yang masing-masing berdistribusi uniform (0,1) , E[U ] = E[V ] = 1/ 2 , dan dengan demikian 1 1 P ( X1 < X 2 , Y1 < Y2 ) = 1 − − + ∫∫ 2 C2 (u , v) dC1 (u , u ), I 2 2 = ∫∫ 2 C2 (u , v) dC1 (u , u ). I
Jadi, P ( ( X1 − X 2 )(Y1 − Y2 ) > 0 ) = 2.∫∫ 2 C2 (u, v) dC1 (u , u ) , I
(2.41)
dan dengan mensubstitusikan persamaan (2.40) kedalam persamaan (2.35), diperoleh: Q = 2.P ( ( X1 − X 2 )(Y1 − Y2 ) > 0 ) − 1 = 2 ⎡ 2.∫∫ 2 C2 (u , v) dC1 (u , u ) ⎤ − 1 ⎣ I ⎦ = 4∫∫ 2 C2 (u, v) dC1 (u, u ) − 1. I
Berdasarkan definisi fungsi konkordan pada teorema 2.6.2.2, maka kita dapat mendefinisikan Kendall’s τ
untuk X dan Y melalui copula dengan teorema
berikut:
Teorema 2.6.2.3 (Kendall’s τ dengan copula)
Misalkan X dan Y variabel acak kontinu dengan copula C. Maka Kendall’s τ untuk X dan Y diberikan oleh τ X .Y ≡ τC = Q(C , C ) = 4.∫∫ C (u , v)dC (u , v) − 1 . I2
Bab II Kajian Teori Copula
(2.42)
21
Perhatikan bahwa bentuk integral yang ada pada persamaan (2.41)
dapat
diinterpretasikan sebagai ekspektasi dari fungsi C (U ,V ) , di mana U dan V variabel acak yang berdistribusi U (0,1) , atau dengan kata lain τC = 4.EC [C (U , V ) ] − 1 .
(2.43)
Bukti:
Dengan memilih C1 = C2 = C , maka diperoleh τ X .Y ≡ τC = Q(C1, C2 ) = Q(C , C ) = 4.∫∫ C (u , v)dC (u , v) − 1 . I2
Untuk copula pada tabel 1 maka diperoleh τ untuk masing-masing copula sebagai berikut. Tabel 3 τ Famili
τ
Clayton
α
(α + 2 ) Gumbel
Bab II Kajian Teori Copula
α (α + 1)