fl lrs Jrl zo."']7-
KNMru
Koffierems0 Nosnomd
Mdernffio
n-1,4Juni20L4 Graha Sepuluh Nopember
ITS
Konferensi Nosional Matemotika (KNM) XVll
- ITS Suraboyo
DAFTAR ISI
lnformasi 1.1 Susunan Panitia Konferensi Nasional Matematika XV11,2Ot4.....................1
.......7 )(Vll... .................9 1.3 Sambutan Presiden lndoMS 2OL2-20L4 .......13 1.4 Sambutan Rektor lnstitut Teknologi Sepuluh Nopember. 1.2 Laporan Ketua Panitia KNM
1.5 Sambutan Dekan FMIPA lnstitut Teknologi Sepuluh Nopember................15
Acara......... Abstrak lnvited Speaker..... 1.6 Susunan
2.
........L7 ..........-...o.... 23
3. Jadwat Presentasi Sesi Paralel
1................. 3.2 Jnowar PEnsErurlsr Mnrlus Sesr Pmalrr 2................
3.1Jaowm Prnserurnsr Maxnum
Sesr PRRRUI-
.................33 ....-.............47
3.3 Jnowm PeRsEurns Mernux Srsr PRmrE13................ ..................60
4. Denah Lokasi Ruangan 5. lnformasiSingkat Ekskursi 5. lklan dan Sponsor..... 7. Ucapqn Terima Kasih..........
.........75 ........-....-........77
............81 .....................83
Konferensi Nosional Motemotiko (KNM)XVll-
ITS
Suraboya
MENGG UNAKAN PEN DE KATAN
BAYESIAN
2
Tanggat Wahu Ruang Hari/
/ 12 Juni 2osTATlsTlKA :13.'15s.d.17.00 -,r Kamis
:SemeruB/
Waktu
No
ID
1
S1
13.15
- 13.30
Achmad Fahrurozi
KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAiVE BAYES. CLASS/F/ER
Universitas Gunadarma
2
S2
1
3.30
- 13.45
Adhitya Ronnie Effendie
KqLKULATOR SURVIVAL DAN LIFE TABEL MENGGUNAKAN SOFTWARE R
Universitas Gadjah
Nama
Judul
lnstansi
Mada
3
S3
13.45
-
14.00
Affiati Oktaviarina
MODEL REGRESI COX PROPORTIONAL HAZARD PADA DAYA TAHAN PASIEN PENDERITA TBC DI SURABAYA
UNESA
4
S5
14.00
- 14.15
Andi Kresna Jaya
BEBEMPA SIFAT HASIL KALI KRONECKER MNTAI MARKOV BERDIMENSI HINGGA
Universitas Hasanuddin
5
s12
14.15
-
14.30
caturiyati
FUNGSI BARRIER PADA MASALAH SECOND ORDER CONE PROGRAMMING NORMA INFINIT
UNY
o
s13
14.45
-
'l
Danardono
STUDI SIMULASI PENGGABUNGAN TABEL MORTALITAS MENGGUNAKAN METODE. LIKELIHOOD
Jurusan Matematika
Hendro Permadi
PENGEMBANGAN GRAFIK PENGENDALI DISTRIBUSI BETA BINOMIAL SEBAGAI PENGANTI pCHART MELALUI MARKOV CHAIN MONTE CARLO
Jurusan Matematika FMIPA UM
lGustiAyu Made
Pengaruh Outliers Terhadap Estimator Parameter Regresi dan Metode Reqresi Robust A Survey of Copula-based Regression
Matematika, Universitas Udavana
Analisis Gerombol Berbasis Model (Studi Kasus Standar Pelayanan Minimal SMP di Kabupaten Manokwari)
Universitas Negeri
Kajian Analisis Diskriminan Berbasis Model (Model Based Discriminant Analvsis Studv)
Universitas Negeri
Dian Handayani
Aplikasi Metode Empirical Bayes untuk Pendugaan lndikator Kemiskinan pada Level Kecamatan
Universitas Negeri Jakarta
Komang Dharmawan
PEMODELAN KEBERGANTUNGAN INDEKS SAHAM MENGGUNAKAN FUNGSI COPULA
Universitas Udayana
5.00
7
s41
15.00
-
8
s44
15.15
- 15.30
15.15
Srinadi
(9
s45
15.30
-
10
s46
1s.45
- 16.00
11
s47
16.00
15.45
- 16.15
12
s96
16.1 5
-
13
s52
16.30
- 16,45
16.30
lWayan Sumarjaya lndah Ratih Anggriyani
lndah Ratih Anggriyani
53
UGM
Universitas Udayana Papua
Papua
KNM
XVII
11-14 Juni
2014
ITS, Surabaya
SUATU SURVEI TENTANG REGRESI BERBASIS KOPUL
I WAYAN SUMARJAYA' '
Jurusan Matematika Universitas Udayana, sumarj
[email protected]. id
Extended abstract
Analisis regresi merupakan salah satu metode statistika yang paling sering digunakan. Pengembangan analisis regresi dalam bentuk model linear rampat (generalized linear model) telah sukses dalam memodelkan datayang melibatkan peubah respons kontinu ataupun disket. Model linear rampat ini mengasumsikan bahwa peubah respons termasuk dalam keluarga eksponensial. Namun, dalam banyak aplikasi seperti dalam bidang asuransi dan manajemen risiko struktur kebergantungan yang diberikan keluarga eksponensial menjadi tidak fleksibel. Klugman et al. |5) memperluas konsep model linear rampat untuk distribusi selain anggota keluarga eksponensial. Perluasan lebih lanjut dilakukan oleh Venter [30] dengan aplikasi pada /oss reserve.
Mengingat analisis regresi melibatkan hubungan antara dua peubah atau lebih, konsep kebergantungan (dependence) memegang peranan penting. Pada analisis regresi linear hubungan kebergantungan antarpeubah dinyatakan oleh korelasi. Namun, Embrechts et al. ll2l dan [13] mengatakan bahwa pada dunia nonnormal, korelasi bukanlah merupakan ukuran kebergantungan yang berguna. Kelemahan lain adalah korelasi tidaklah invarian dalam transformasi, yang mana hal ini tidak terjadi pada kebergantungan berbasis kopula. Dalam konteks analisis regresi peranan penting kopula antara lain dalam memodelkan kebergantungan nonlinear dan memisahkan pengaruh margin univariat.
[9]
Kolev and Paiva telah mensurvei beberapa model regresi berbasis kopula. Namun, setelah tahun 2009 terdapat beberapa model atau ide baru tentang regresi berbasis kopula yang layak dibahas. Beberapa hasil tersebut antara lain regresi kuantil-kopula, model berbasis kopula bersama, regresi kuadrat terkecil biasa rampat dengan kopula normal, analisis regresi marginal kopula Gauss, dan regresi berbasis kopula untuk data cacah. Mengingat regresi berbasis kopula termasuk area riset yang aktif dan masih belum banyak diketahui dan diaplikasikan, maka survei ini dititikberatkan pada model-model tersebut dan aplikasinya. Kata kunci: kopula, kebergantungan, regresi kopula
1. Latar Belakang Analisis regresi melibatkan hubungan antara dua peubah atau lebih. Hal ini berarti konsep kebergantungan (dependence) memegang peranan penting. Pada analisis regresi linear hubungan antarpeubah dinyatakan oleh korelasi. Namun, Embrechts et al. [12] dan [13] mengatakan bahwa pada dunia/aplikasi nonnormal (noneliptik), korelasi bukanlah ukuran kebergantungan yang berguna. Lebih lanjut dalam [12] dan [13] setidaknya ada enam masalah penggunaan korelasi sebagai ukuran kebergantungan. Ada tiga masalah penyalahgunaan korelasi yang sering ditemukan lihat [12], [13]. Pertama, distribusi marginal dan korelasi menentukan distribusi bersama. Hal ini tentu saja hanya berlaku untuk distribusi eliptik. Distribusi eliptik adalah distribusi yang densitasnya konstan pada ellipsoid dan pada dimensi dua gari kontur permukaan densitas adalah elips [12]. Penyalahgunaan selanjutnya adalah sebagai berikut: diberikan distribusi marginal F1 dan F2 untuk X dan Y , semua korelasi linear antara − 1 dan 1 dapat diperoleh dengan spesifikasi yang sesuai dari distribusi bersama. Hal ini juga tidaklah benar. Embrechts et al. [12] mencontohkan jika X ~ LOGN(0,1) dan Y ~ LOGN (0, σ 2 ) dengan σ 2 > 0 , maka nilai exp(−σ ) − 1 ρ min = (exp(1) − 1)(exp(σ 2 ) − 1) dan exp(σ ) − 1 ρ max = (exp(1) − 1)(exp(σ 2 ) − 1) yang tidak berada pada selang [−1,1] . Penyalahgunaan ketiga adalah pada saat kuantil untuk portofolio linear X + Y terjadi pada saat ρ ( X + Y ) maksimal. Embrechts [12] menegaskan bahwa ini juga hanya terjadi pada dunia eliptik. Berdasarkan kelemahan-kelemahan tersebut di atas diperlukan ukuran kebergantungan lain yang mampu memodelkan hubungan nonlinear. Salah satu cara untuk memodelkan struktur kebergantungan ini adalah dengan kopula. Kopula merupakan fungsi yang menggabungkan atau memasangkan fungsi distribusi multivariat dengan fungsi distribusi marginal satu dimensi. Artikel ini diatur sebagai berikut. Bagian pertama berisi motivasi kelemahan korelasi dalam memodelkan hubungan antarpeubah. Selanjutnya, bagian kedua berisi pengantar kopula dan ukuran Kendall τ dan Spearman ρ . Model-model regresi berbasis kopula dibahas pada bagian ketiga. Bagian keempat membahas teknik umum pendugaan parameter model. Bagian terakhir dari artikel adalah diskusi. 2. Pengantar Kopula Pada bagian ini akan dibicarakan konsep kopula. Pembahasan diawali dengan konsep kopula bivariat, kemudian dilanjutkan dengan kasus multivariat. Literatur standar tentang kopula dapat dibaca pada monograf [23] dan [5]. Pembahasan konsep kopula pada bagian berikut diambil dari [23] dan [5]. Misalkan X dan Y adalah peubah acak dengan fungsi distribusi
2
KNM XVII
11-14 Juni 2014
ITS, Surabaya
F ( x) = Pr( X ≤ x) dan G ( y ) = Pr(Y ≤ y ) serta distribusi bersama H ( x, y ) = Pr( X ≤ x, Y ≤ y ) . Untuk masing-masing bilangan real ( x, y ) dapat diasosiasikan tiga bilangan F ( x) , G ( y ) , dan H ( x, y ) . Sebagai catatan ketiga bilangan tersebut berada pada selang [0,1] . Hubungan antara F ( x) , G ( y ) , dan H ( x, y ) dapat dijelaskan oleh Teorema Sklar untuk kasus bivariat berikut (lihat misalnya [23] dan [5]).
Teorema Sklar [23] Misalkan H ( x, y ) adalah fungsi distribusi bersama dengan margin F ( x) dan G ( y ) , maka terdapat suatu kopula C , sedemikian hingga untuk semua x , y di dalam garis real diperluas R = [−∞, ∞] H ( x, y ) = C ( F ( x), G ( y )) . (1) Jika F ( x) dan G ( y ) kontinu, maka C tunggal (unique); jika tidak, C secara tunggal ditentukan pada ran F dan ran G . Sebaliknya, jika C adalah kopula dan F ( x) serta G ( y ) adalah fungsi distribusi, maka fungsi H ( x, y ) adalah distribusi bersama dengan margin F ( x) dan G ( y ) . Berdasarkan Teorema Sklar di atas dapat dilihat bahwa fungsi densitas peluang bersama dipisahkan menjadi marginal dan kopula, sehingga dalam hal ini kopula hanya menyatakan ”asosiasi” antara X dan Y [5]. Dengan demikian kopula memisahkan tingkah laku marginal yang diwakili oleh F dan G dari asosiasi. Hal inilah yang menyebabkan kopula juga dikatakan fungsi kebergantungan (dependence function). Contoh 1. Kopula Gauss C (u , v) didefinisikan oleh
C (u, v) = N ρ (Φ −1 (u ), Φ −1 (v)) =
Φ −1 ( u ) Φ −1 ( v )
1
∫ ∫
2π 1 − ρ 2 −∞ dengan ρ adalah koefisien korelasi.
−∞
− 2 ρst − s 2 − t 2 exp ds dt , 2 2(1 − ρ )
Contoh 2. Kelas kopula Archimedes (Archimedean copula) yang didefinisikan oleh C (u , v) = ϕ [ −1] (ϕ (u ) + ϕ (v)) dengan ϕ [−1] adalah pseudo-invers dari pembangkit (generator) ϕ . Contoh anggota kopula Archimedes adalah kopula Gumbel C (u , v) = exp − [(− ln u )θ + (− ln v)θ ]1/ θ , θ ∈ [1, ∞) dan kopula Frank C (u , v) = 1 − [(1 − u )θ + (1 − v)θ − (1 − u )θ (1 − v)θ ]1/θ , θ ∈ [1, ∞) . Kopula Gumbel merupakan salah satu kopula yang mampu menangkap kebergantungan ekor atas [11]. Selanjutnya akan didefinisikan densitas kopula dan representasi kanonik.
(
)
3
Definisi [5]. Densitas c(u , v) yang berasosiasi dengan kopula C (u , v) adalah ∂ 2C (u , v) . ∂u ∂v
c(u , v) =
Contoh 3. Fungsi densitas kopula Gauss adalah ν 2 + ν 22 2 ρν 1ν 2 − ν 12 −ν 22 1 c(u , v) = exp 1 + 2 2(1 − ρ 2 ) 1− ρ2
dengan ν 1 = Φ −1 (u ) dan ν 2 = Φ −1 (v). Pada vektor acak kontinu, densitas kopula c berhubungan dengan densitas f dan fungsi distribusi F ; lebih jelasnya hal ini sama dengan rasio densitas bersama f yang merupakan produk dari densitas marginal fi , i = 1, 2 , yakni f ( x, y ) c( F1 ( x), F2 ( y )) = . f1 ( x) f 2 ( y ) Berdasarkan Teorema Sklar pada persamaan (1), hubungan di atas memunculkan representasi kanonik berikut f ( x, y ) = c( F1 ( x), F2 ( y )) f1 ( x) f 2 ( y ). Selanjutnya perluasan Teorema Sklar untuk dimensi d dapat dilihat pada [23] dan [5]. Misalkan H adalah fungsi distribusi berdimensi d dengan margin F1 ( x), F2 ( x), K , Fd ( x) , maka terdapat kopula C berdimensi d sedemikian hingga untuk semua x = ( x1 , x2 , K , xd ) ∈ R d H ( x1 , x2 ,K, xd ) = C ( F1 ( x1 ), F2 ( x1 ),K, Fd ( xd )). Jika F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) semuanya kontinu, maka C tunggal. Jika tidak C secara tunggal ditentukan pada ran F1 × ran F2 × L ran Fd . Sebaliknya, jika C adalah kopula berdimensi d dan F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) adalah fungsi distribusi, maka H adalah fungsi distribusi berdimensi d dengan margin F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) . Contoh 4. Kopula Gauss C (u) multivariat didefinisikan oleh C (u) = 1/ 2
dengan | R |
Φ −1 ( u1 )
1 (2π )
d /2
1/ 2
|R|
∫
Φ −1 ( u d )
∫
L
−∞
−∞
1 exp − xT R −1x dx1 L dxd 2
adalah determinan.
Seperti halnya pada kasus bivariat densitas kopula dan representasi kanonik dapat dikembangkan sebagai berikut. Definisi
[5].
Densitas
c(u1, K , ud )
yang
C (u1, u2 , K , ud ) adalah
4
berasosiasi
dengan
kopula
KNM XVII
11-14 Juni 2014
ITS, Surabaya
∂ d C (u1, u2 , K , ud ) . ∂u1∂u2 L ∂ d Demikian pula fungsi densitas f yang bersesuaian dengan densitas kopula diberikan oleh representasi kanonik c(u1 , K , ud ) =
d
f ( x1, x2 , K , xd ) = c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ fi ( xi )
(2)
i =1
dengan c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) =
∂ d C ( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) . ∂F1 ( x1 )∂F2 ( x2 ) K ∂Fd ( xd )
Contoh 5. Representasi densitas kopula Gauss C Ga (u) multivariat dapat dinyatakan sebagai 1 1 cRGa (u) = exp − ξ T ( R −1 − I )ξ 1/ 2 |R| 2 −1 −1 −1 dengan ξ = (Φ (u1 ), Φ (u2 ), L , Φ (ud )) . Pada bagian sebelumnya salah satu kelemahan korelasi adalah tidak invarian dalam transformasi, sehingga diperlukan ukuran kebergantungan lain yang invarian seperti Kendall τ dan Spearman ρ . Definisi [5] Kendall τ untuk peubah acak X dan Y dengan kopula C didefinisikan sebagai τ = 4∫∫ C (u , v) dC (u , v) − 1. [ 0 ,1]×[ 0 ,1]
Versi sampel Kendall τ dapat dihitung sebagai berikut (lihat [5]) n 2 ∑∑ sgn( X i − X j )(Yi − Y j ). n(n − 1) i =1 j >i Definisi [5] Spearman ρ untuk peubah acak X dan Y dengan kopula C didefinisikan sebagai ρ = 12 ∫∫ uv dC (u , v) − 3. [ 0 ,1]×[ 0 ,1]
Untuk Spearman ρ versi sampel dihitung sebagai berikut (lihat [5])
∑ ∑
n i =1
n
i =1
( Ri − R )( Si − S )
( Ri − R ) 2 ( Si − S ) 2
dengan Ri = rank ( X i ) dan S i = rank (Yi ) .
3. Model-model Regresi Berbasis Kopula Pada bagian sebelumnya telah dijelaskan bahwa model regresi berdasarkan kuadrat terkecil (ordinary least square) tidak sesuai untuk aplikasi aktuaria karena seringkali hubungan antarpeubah tidak linear (nonlinear) dan distribusi peluang tidak normal [26]. Sebagai contoh pada bidang asuransi, model untuk usia pada saat meninggal biasanya pencong ke kiri (skewed to the left), sementara model kerugian casualty (casualty loss) biasanya pencong ke kanan. Salah satu upaya untuk mengatasi masalah ini adalah dengan model linear rampat (generalized
5
linear model, disingkat GLM). Namun, GLM memiliki keterbatasan yakni peubah takbebas harus berasal dari keluarga eksponensial. Pengembangan lebih lanjut GLM untuk distribusi selain keluarga eksponensial telah diusulkan oleh [15] dan dikembangkan lebih lanjut oleh [30]. Pada subbagian ini akan dibahas beberapa model regresi berbasis kopula. Dalam konteks analisis regresi peranan penting kopula antara lain dalam memodelkan kebergantungan nonlinear [26] dan memisahkan pengaruh margin univariat [28]. Selain itu, kopula invarian dalam transformasi [7]. Pembahasan model regresi pada subbagian berikut meliputi model regresi kuadrat terkecil biasa rampat dengan kopula Gauss [26], model regresi marginal kopula Gauss [22], Regresi berbasis kopula bersama [20], regresi kopula data cacah [24], dan regresi kuantil kopula [2]. 3.1 Model Regresi Kuadrat Terkecil Biasa Rampat dengan Kopula Gauss Parsa dan Klugman [26] mengusulkan perluasan regresi kuadrat terkecil dengan kopula. Proses perluasan ini meliputi tiga langkah. Pertama, asumsikan suatu model untuk distribusi bersama untuk semua peubah, baik respons maupun kovariat. Kemudian, estimasi parameter model baik parameter pada distribusi marginal ataupun parameter kopula. Langkah terakhir, hitung nilai prediksi Y bersyarat suatu himpunan kovariat dengan menggunakan nilai tengah bersyarat Y diketahui kovariat yakni E (Y | X 1 = x1 , K , X k = xk ). Parsa dan Klugman [26] menggunakan fungsi kopula Gauss dengan mengasumsikan distribusi normal multivariat dengan nilai tengah nol, varians satu, dan matriks korelasi R . Menggunakan representasi kanonik kopula pada persamaan (2) diperoleh 1 1 f ( x1 , x2 ,K, xd ) = f1 ( x1 )L f d ( xd ) 1 / 2 exp − ξT ( R −1 − I )ξ . |R| 2 Selanjutnya dihitung distribusi bersyarat xd diketahui x1, x2 , K , xd −1 yakni
(
1 Φ −1 ( F ( x ) − r T R −1 )ξ * d d n −1 f ( xd | x1 , x2 ,K, xd −1 ) = f d ( xd ) exp − T −1 1 − r Rn −1r 2
)
2
− (Φ −1 ( Fd ( xd )) 2
× (1 − r T Rn−−11r ) −1 / 2 , r R dengan ξ = (Φ −1 (u1 ), Φ −1 (u2 ), K , Φ −1 (u d −1 )) , R = dT−1 , dan r adalah vektor 1 r (d − 1) × 1 adalah kolom paling kanan dari R dengan elemen terakhir dari elemen terakhir dihilangkan. Selanjutnya, dalam konteks regresi apabila xd diganti dengan y akan diperoleh
(
1 Φ −1 ( F ( y ) − r T R −1 )ξ * n −1 f ( y | x1 , x2 ,K, xd −1 ) = f ( y ) exp − T −1 1 − r Rn−1r 2
)
2
− (Φ −1 ( F ( y )) 2
× (1 − r T Rn−−11r ) −1/ 2 . Pada regresi kuadrat terkecil biasa dan GLM distribusi kovariat biasanya tidak ditentukan, namun dalam model regresi yang diusulkan [26] distribusi kovariat harus ditentukan.
6
KNM XVII
11-14 Juni 2014
ITS, Surabaya
3.2 Regresi Marginal Kopula Gauss Masarotto dan Varin [22] mengusulkan kelas model kopula Gauss untuk analisis regresi marginal untuk data nonnormal berkorelasi. Kelas model ini memberikan perluasan alamiah dari model regresi linear tradisional dengan galat berkorelasi normal dengan respons kontinu, diskret, dan kategorik diperbolehkan. Misalkan Y = (Y1 , K , Yn )T adalah vektor peubah respons kontinu, diskret, ataupun kovariat dan y = ( y1 , K , yn )T adalah realisasinya serta x i = ( xi1 ,K, xip )T adalah vektor p kovariat. Masarotto dan Varin [22] mengusulkan model regresi berbentuk Yi = g (x i , ε i , λ ), i = 1, K , n, dengan g (.) adalah fungsi yang sesuai dari peubah bebas x i dan peubah stokastik yang tidak teramati ε i . Diasumsikan bahwa model regresi di atas diketahui sampai dengan vektor parameter λ . Selanjutnya, salah satu spesifikasi yang mungkin untuk fungsi g (.) adalah −1
Yi = Fi (Φ (ε i ); λ ), i = 1,K, n, (3) dengan Fi (, ; λ ) = F (. | x i ; λ ) adalah fungsi distribusi kumulatif normal Yi | xi , dan Φ(.) adalah fungsi distribusi normal. Dalam memodelkan kebergantungan diasumsikan ε = (ε 1 , K , ε n )T adalah normal multivariat dengan nilai tengah nol dan matriks korelasi Ω yakni ε ~ MVN(0, Ω) . (4) Persamaan (3) di atas menspesifikasikan komponen marginal dan komponen kebergantungan dinyatakan oleh persamaan (4). Keluarga model yang melibatkan persamaan (3) dan (4) disebut regresi marginal kopula Gauss. Pada kasus kontinu pemetaan antara ε i dan Yi pada (3) adalah satu-satu. Sebagai contoh pada kasus bivariat f ij ( yi , y j ; θ) = f i ( yi ; λ ) f j ( y j ; λ )h(ε i , ε j ; θ), dengan f i ( yi ; λ ) = f ( yi | x i ; λ ) , f j ( y j ; λ ) = f j ( y j | x j ; λ ) , dan
h(ε i , ε j ; θ) =
f (ε i , ε j ; θ) f (ε i , λ ) f (ε j , λ )
adalah densitas kopula Gauss bivariat, f (ε i , λ ) adalah densitas normal baku bivariat, f (ε i , ε j ; θ) adalah densitas normal bivariat dengan nilai tengah nol, varians satu, dan korelasi yang diberikan oleh elemen pada posisi (i, j ) dalam matriks Ω . Untuk kasus diskret dan kategorik, pemetaan (3) tidaklah satu-satu melainkan banyak-satu (many-to-one) sehingga f ij ( yi , y j ; θ) = ∫ ∫ f (ε i , ε j ) dε i dε j , Di ( yi , λ ) D j ( y j , λ )
dengan domain hasil kali Cartesius Di ( yi , λ ) = [Φ −1 ( Fi ( yi− ; λ )), Φ −1 ( Fi ( yi ; λ ))] , Fi ( yi− ; λ ) adalah limit dari Fi (.; λ ) pada yi dan yi− = yi − 1 apabila support Yi pada N .
7
3.3 Regresi Berbasis Kopula Bersama Kramer et al. [20] mengusulkan model regresi berbasis kopula bersama dalam memodelkan kebergantungan antara ukuran klaim dan jumlah klaim dengan mengombinasikan distribusi marginal dari frekuensi klaim dan keparahan (severity) dengan kopula bivariat. Model yang diusulkan [20] merupakan pengembangan dari model [21] dan [8]. Konsep pemodelan kopula berdasarkan distribusi bersama adalah sebagai berikut. Misalkan X menyatakan peubah acak kontinu dan Y adalah peubah acak diskret. Diasumsikan Y bernilai 1,2, K . Distribusi bersama X dan Y didefinisikan oleh kopula parametrik C (⋅,⋅ | θ ) yang tergantung pada parameter θ , yakni FX ,Y |θ ( x | y ) = C ( FX ( x), FY ( y ) | θ ). Selanjutnya didefinisikan turunan parsial kopula terhadap peubah pertama yakni ∂ D1 (u , v | θ ) = C (u , v | θ ). ∂u Kemudian fungsi densitas peluang bersama f X ,Y |θ ( x, y | θ ) dari peubah acak kontinu X dan diskret Y diberikan oleh f X ,Y |θ ( x, y | θ ) = f X ( x)[ D1 ( FX ( x), FY ( y ) | θ ) − D1 ( FX ( x), FY ( y − 1) | θ )]. Distribusi bersyarat Y | X = x dapat diperoleh dari model di atas dengan menerapkan aturan peluang bersyarat. Dalam pemodelan polis kerugian (policy loss) didefinisikan kerugian L sebagai perkalian antara rata-rata ukuran klaim X dan jumlah klaim Y sebagai L = XY dan fungsi densitas distribusi kerugian ini diberikan oleh ∞ 1 f L (l ) = ∑ [ D1 ( FX ( ly ), FY ( y ) | θ ) − D1 ( FX ( yl ), FY ( y − 1) | θ )] f X ( ly | θ ) y y =1 untuk l > 0. Persamaan ini diperoleh dengan memarginalkan sepanjang vektor peubah acak diskret l > 0. Dalam formulasi model, [20] menggunakan GLM untuk model regresi marginal dan mengombinasikannya dengan keluarga kopula bivariat.
3.4 Regresi Kopula Data Cacah Nikoloulopoulos dan Karlis [24] mengusulkan model regresi berbasis kopula dengan kovariat yang digunakan tidak saja untuk marginal tetapi juga parameter kopula. Biasanya kopula digunakan untuk analisis data kontinu karena kemampuannya memisahkan marginal dari sifat kebergantungan. Namun, hal ini tidaklah berlaku untuk data cacah karena terdapat perancu (confounding) antara margin univariat dan ukuran asosiasi [24]. Lebih lanjut, menurut [24] informasi kovariat yang berhubungan dengan kebergantungan ada tiga yaitu dengan menempatkan kovariat pada parameter-parameter marginal, pada parameter kopula, dan pada keduanya (marginal maupun kopula). Misalkan model parametrik berbasis kopula bivariat untuk respons cacah Y1 dan Y2 dengan fungsi distribusi H yang diberikan oleh representasi H ( y1 , y2 , α1 , α 2 ;θ ) = C ( F1 ( y1 , α1 ); F2 ( y2 , α 2 );θ )
8
KNM XVII
11-14 Juni 2014
ITS, Surabaya
dengan F1 dan F2 adalah distribusi marginal dengan vektor parameter α1 dan α 2 serta θ adalah parameter kopula. Misalkan akan diselidiki efek informasi kovariat pada struktur kebergantungan. Misalkan pula data ( yij , xij ), i = 1, K , n; j = 1,2 , dengan i adalah indeks untuk individu, j adalah indeks untuk respons cacah, dan xij adalah vektor kovariat untuk individu ke-i yang berasosiasi dengan respons cacah ke-j. Kovariat xij dimasukkan pada model parametrik berbasis kopula dengan mengasumsikan model marginal univariat yij ~ F j (.; α ij ) dengan
α ij = ( µij = g ( β Tj xij , γ j )) ,
µij menyatakan
nilai
tengah
yang
diparameterisasi oleh fungsi tautan (link function) yang sesuai g (.) untuk mengakomodasi kovariat, β j adalah vektor koefisien regresi, dan γ j adalah vektor parameter marginal yang tidak tergantung pada kovariat. Selanjutnya bagian regresi untuk parameter kopula θ menggunakan fungsi kovariat s (.) pada
θ , yakni s (θ ) = bT xi . 3.5 Regresi Kuantil Kopula Regresi klasik menitikberatkan pada nilai harapan peubah takbebas Y bersyarat pada nilai peubah X yang disebut fungsi regresi. Regresi kuantil tidak membatasi perhatian pada harapan bersyarat sehingga memungkinkan untuk mendekati distribusi bersyarat secara keseluruhan dari peubah respons [9]. Regresi kuantil muncul sebagai solusi dari peminimuman (minimization) n
minp ∑ ρτ ( yi − xiT β ) β ∈R
i =1
(lihat [17],[16], dan [18]). Bouyé dan Salmon [2] mengusulkan pendekatan untuk memodelkan regresi kuantil nonlinear berdasarkan fungsi kopula yang mendefinisikan struktur kebergantungan antarpeubah yang diteliti. Lebih lanjut Bouyé dan Salmon [2] memperluas konsep regresi kuantil yang diusulkan oleh [17]. Perluasan ini dilakukan dengan menentukan distribusi untuk peubah acak respons Y bersyarat pada peubah bebas X dengan demikian menspesifikasikan fungsi regresi kuantil. Sebelum membahas model regresi kuantil terlebih dahulu didefinisikan kurva kuantil kopula ke-p. Definisi [2]. Untuk suatu kopula parametrik C (⋅,⋅;θ ) kurva kuantil kopula ke-p dari y bersyarat pada x didefinisikan oleh persamaan berikut p = C1 ( FX ( x), FY ( y ); δ ), (5) dengan θ ∈ Ω himpunan parameter dan C (u , v;θ ) = ∂C (u , v;θ ) / ∂u . Pada beberapa kondisi tertentu, seperti C1 harus terbalikkan sebagian (partially invertible), maka persamaan di atas dapat dinyatakan sebagai y = q(x, p; δ ), dengan q(x, p; δ ) = FY[ −1] ( D( FX ( x), p; δ )) . Contoh 6. Kopula Clayton dengan parameter positif tegas
9
θ
yakni
C (u , v;θ ) = (u −θ + v −θ − 1) −1/ θ memiliki kuantil kopula bersyarat Y | X (lihat [4])
(
)
y = FY−1 (( p −θ /(1+θ ) − 1) FX ( x) −θ + 1) −1/θ . Selanjutnya regresi kuantil kopula didefinisikan sebagai berikut. Definisi [2]. Regresi kuantil kopula ke-p q(x t , p; δ ) adalah solusi dari masalah berikut: min ∑ p | yt − q(x t , p; δ ) | + ∑ (1 − p ) | yt − q(x t , p; δ ) | δ t∈Τ1− p t∈Τp dengan Τp = {t : yt ≥ q(x t , p; δ } dan Τ1− p adalah komplemennya. Bentuk ini juga dapat dinyatakan sebagai T min ∑ ( p − 1{ yt ≤q ( xt , p;δ )} )( yt − q(x t , p; δ ) . δ t =1 Allen et al. [1] melakukan studi empiris terhadap enam pasangan data volatilitasreturn dan menyimpulkan bahwa regresi kuantil berbasis kopula memberikan hasil yang lebih baik dibandingkan regresi kuantil biasa dalam hal menangkap ketidaklinearan hubungan volatilitas-return.
4. Estimasi Parameter Secara umum metode pendugaan parameter dapat dilakukan secara parametrik, nonparametrik, dan semiparametrik. 4.1 Metode Parametrik Pada pendugaan parameter secara parametrik dapat dilakukan dengan menggunakan metode kemungkinan maksimum penuh (full maximum likelihood, disingkat FML), metode kemungkinan maksimum dua-tahap (two-step maximum likelihood, disingkat TSML), dan metode momen rampat (generalized method of moments, disingkat GMM). Subbagian hanya membahas metode FML dan TSML. Lihat kembali representasi kanonik pada persamaan (2) yakni d
f ( x1, x2 , K , xd ) = c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ fi ( xi )
(6)
i =1
dengan ∂ d C ( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) . ∂F1 ( x1 )∂F2 ( x2 ) K ∂Fd ( xd ) Apabila diambil sampel acak berdistribusi saling bebas dan identik dari vektor x ( j ) = ( x1( j ) , x2( j ) , K , xd( j ) ) , j = 1,2, K , n , maka likelihood dari bentuk kanonik di pada (6) adalah n n d f ( x1( j ) , x2( j ) , K , xd( j ) ) = ∏ c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ f i ( xi ) ∏ j =1 j =1 i =1 dan log likelihood yang bersesuaian adalah c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) =
10
KNM XVII
11-14 Juni 2014
n
∑ log f ( x
( j) 1
j =1
ITS, Surabaya
n
, x2( j ) , K , xd( j ) ) = ∑ log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) )) j =1 d
(7)
n
+ ∑∑ log f i ( x ). ( j) i
i =1 j =1
Kemudian tuliskan likelihood L = ∑ j =1 log f ( x1( j ) , x2( j ) , K , xd( j ) ) , likelihood dari n
struktur
kebergantungan
LC = ∑ j =1 log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) )) , n
dan
likelihood dari masing-masing margin Li = ∑ j =1 log f i ( xi( j ) ) . Dengan demikian n
representasi bentuk kanonik di atas dapat dituliskan sebagai d
L = LC + ∑ Li . i =1
Misalkan kopula C adalah anggota dari keluarga kopula yang diindeks oleh parameter θ yakni C (u1 , u 2 , K , u d ;θ ) dan margin Fi serta densitas univariat f i diindeks oleh parameter β i yakni Fi = Fi ( xi ; β i ) dan f i = f i ( xi ; β i ) . Penduga kemungkinan maksimum parameter model ( β1 , K , β d ) adalah ( βˆ MLE , βˆ MLE , K , βˆ MLE ;θˆ MLE ) = arg max L( β , K , β ;θ ) 1
2
d
d
1
β1 ,K, β d
n
= arg max ∑ log c( F1 ( x1( j ) , β1 ), K , Fd ( xd( j ) , β d );θ ) β1 ,K, β d d
j =1
n
+ ∑∑ log f i ( xi( j ) , β i ). i =1 j =1
Metode alternatif untuk mengestimasi likelihood (7) adalah metode inference function for margin (IFM) (lihat [29] atau [6]). IFM meliputi dua tahap. Pada tahap pertama, penduga βˆiIFM diestimasi dari log-likelihood Li pada masingmasing margin βˆiIFM = arg max Li ( β i ) βi
dengan demikian βˆ1IFM , βˆ2IFM ,K , βˆdIFM didefinisikan sebagai MLE dari parameter model dalam asumsi kebebasan. Pada tahap kedua penduga θˆ IFM dari persamaan kopula θ IFM dihitung dengan memaksimumkan kontribusi likelihood LC dengan parameter marginal β i diganti dengan penduga tahap pertama βˆ IFM = arg max L ( βˆ IFM , βˆ IFM ,K , βˆ IFM ;θ ). i
θi
C
1
2
d
Pada kondisi regularitas tertentu penduga MLE βˆ1MLE , βˆ2MLE ,K, βˆdMLE ,θˆ MLE adalah solusi dari ∂L ∂L ∂L ∂L , , K, , = 0. ∂β d ∂θ ∂β1 ∂β 2 Selanjutnya
penduga
tahap
kedua
11
( βˆ1IFM , βˆ2IFM , K, βˆdIFM ,θˆ IFM )
mencari
penyelesaian
∂L1 ∂L2 ∂L ∂L , , L, d , = 0. ∂β d ∂θ ∂β1 ∂β 2 Strategi alternatif penghitungan likelihood adalah algoritma maximation by parts (MBP) yang diusulkan Song [27] (lihat juga [29]). Langkah pertama adalah d mendapatkan estimasi awal ( β1 , K , β d ) dengan memaksimumkan ∑i =1 Li dengan kata lain mengabaikan kebergantungan. Langkah selanjutnya adalah mencari solusi untuk θ . Estimasi awal mengabaikan kebergantungan jadi tidak efisien. Solusi iteratif ( β1MBP , β 2MBP , K , β dMBP ) memberikan suatu estimasi θ . Kemudian θ diberikan estimasi ( β1 , K , β d ) menghasilkan estimasi efisien karena prosedur ini mempertimbangkan kebergantungan. Lebih lanjut jika tidak terdapat kebergantungan, langkah pertama penduga adalah efisien. 4.2 Metode Semiparametrik Metode pendugaan semiparametrik meliputi dua tahap. Pada tahap pertama margin univariat Fi diestimasi secara nonparametrik, yakni dengan distribusi empiris Fˆ atau versi skalanya. Pada tahap kedua, parameter kopula diestimasi i
dari fungsi likelihood LC yakni θˆ = arg max L (θ ) C
θ
n
= arg max ∑ log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) );θ ) θ
j =1
dengan Fˆi adalah penduga nonparametrik margin univariat Fˆi . Noh et al. [25] mengusulkan pendekatan semiparametrik dalam menduga regresi berbasis kopula; kopula dimodelkan secara parametrik tetapi distribusi marginal dimodelkan secara parametrik. Kelebihan metode ini adalah keluwesannya dan juga tidak terlalu dipengaruhi oleh curse of dimensionality. Dette et al.[10] memperingatkan pentingnya spesifikasi model. Lebih lanjut, jika salah dalam menspesifikasikan struktur kopula sebenarnya, seringkali pendekatan ini tidak menghasilkan estimasi yang dapat dipercaya. 4.3 Metode Nonparametrik Prosedur estimasi nonparametrik untuk kopula berdasarkan formula invers dari kopula empiris Cˆ (u1 , u2 ,K, ud ) = Fˆ ( Fˆ1−1 (u1 ), Fˆ2−1 (u2 ),K, Fˆd−1 (ud )) dengan Fˆ adalah penduga nonparametric dari fungsi distribusi F berdimensi d dan Fˆ −1 (u ), Fˆ −1 (u ),K, Fˆ −1 (u ) adalah penduga nonparametrik dari pseudo1
1
2
2
d
d
−1
invers Fi ( s ) = {t : Fi (t ) ≥ s} dari margin univariat F1 , F2 , K , Fd . Biasanya fungsi distribusi empiris berdimensi d
12
KNM XVII
11-14 Juni 2014
ITS, Surabaya
1 T Fˆ ( x1 , x2 , K , xd ) = ∑ I ( X 1 ≤ x1 , X 2 ≤ x2 , K , X d ≤ xd ) T t =1 − 1 estimasi pseudo-invers Fˆi ( s ) = {t : Fˆi (t ) ≥ s} dan distribusi univariat empiris T Fˆ = 1 ∑ I ( X ≤ x ) . Pendugaan kopula dengan metode nonparametrik dapat T
t =1
i
i
dilihat pada [3]. 5. Diskusi Pada bagian ini dibahas hal-hal yang layak menjadi bahan diskusi. Hal pertama adalah penerapan kopula pada kasus diskret. Genest dan Nešlehová [14] menegaskan bahwa bahaya dan keterbatasan dalam memodelkan dan inferensi dari kasus kontinu ke kasus diskret. Hal berikutnya, meskipun konsep kopula dipahami dengan baik, estimasi empirisnya lebih susah dan banyak perangkap dan kesulitan teknis dan biasanya hal ini diabaikan atau dianggap remeh oleh praktisi (lihat [3]). Daftar Pustaka [1] Allen, D. E., Singh, A. K., Powell, R. J., McAleer, M., Taylor, J. and Thomas, L.The Volatility-Return Relationship: Insights from Linear and Non-linear Quantile Regression, Working Paper 1201, School of Accounting, Finance and Economics & FEMARC Working Paper Series, Edith Cowan University, 2012. [2] Bouyé, E. and Salmon, M. Dynamic Copula Quantile Regressions and Tail Area Dynamic Dependence in Forex Markets, The European Journal of Finance, 15, 721—750, 2009. [3] Charpentier, A., Fermanian, J-D. and Scaillet. The Estimation of Copulas: Theory and Practice. In Copulas: From Theory to Application in Finance, Jörn Rank (eds), Wiley, 2006. [4] Cherubini, U., Gobbi, F., Mulinacci, S. and Romagnoli, S. Dynamic Copula Methods in Finance, John Wiley & Sons, 2012. [5] Cherubini, U., Luciano, E., and Vecchiato, W. Copula Methods in Finance, John Wiley and Sons, 2004. [6] Choroś, B., Ibragimov, R. and Permiakova, E. Copula Estimation. in: Workshop on Copula Theory and its Applications, Durante, F., Härdle, W., Jaworski, P. , Rychlik, T., (eds.), Springer, Dortrecht (NL), 2010. [7] Crane, G. J. and van der Hoek, J., Conditional Expectation Formulae for Copulas, Aust. N. Z. J. Stat., 50, 53—67, 2008. [8] Czado, C., Kastenmeier, R., Brechmann, E., Min, A. A Mixed Copula Model for Insurance Claims and Claim Sizes, Scandinavian Actuarial Journal, 4, 278—305, 2012. [9] Davino, C., Furno, M., and Vistocco, D. Quantile Regression: Theory and Applications, John Wiley and Sons, 2014. [10] Dette, H., Van Hecke, R. and Volgushev, S. Misspecification in Copula-based Regression, arXiv: 1310.8037v1[stat.ME], 30 October, 2013. [11] Embrechts, P. and Hofert, M., Statistics and Quantitative Risk Management for Banking and Insurance, Annual Review of Statistics and Its Application, 1, 493— 513, 2014. [12] Embrechts, P., McNeil, A. and Straumann, D. Correlation: Pitfalls and Alternatives, Dependence in Risk Management: Properties and Pitfalls, Risk Management: Value
13
at Risk and Beyond, ed. M. Dempster, 176—223, New York, Cambridge University Press, 1999. [13] Embrechts, P., McNeil, A. and Straumann, D. Correlation and Dependence in Risk Management: Properties and Pitfalls, Risk Management: Value at Risk and Beyond, ed. M. Dempster, 176—223, New York, Cambridge University Press, 2002. [14] Genest, C. and Nešlehová, A Primer on Copulas for Count, Astin Bulletin, 37, 475—515, 2007. [15] Klugman, S., Panjer, H. and Willmot, G. Loss Models: From Data to Decisions, Second Edition, New York, Wiley, 2004. [16] Koenker, R. Quantile Regression, Cambridge, Cambridge University Press, 2005. [17] Koenker, R. and Bassett, G., Regression Quantiles, Econometrica, 46, 33—50, 1979. [18] Koenker, R. and Hallock, K. F., Quantile Regression, EJournal of Economic Perspectives, 15, 143—156, 2001. [19] Kolev, N. and Paiva, D., Copula-based Regression Models: a Survey, Journal of Statistical Planning and Inference, 139, 3847—3856, 2009. [20] Krämer, N., Brechmann, E. C., Silvestrini, D. and Czado, C.,Total Loss Estimation Using Copula-based Regression Models, Insurance: Mathematics and Economics, 53, 829—839, 2013. [21] de Leon, A. R. and Wu, B., Copula-based Regression Models for a Bivariate Mixed Discrete and Continuous Outcome, Statistics in Medicine, 30, 175—185, 2010. [22] Masarotto, G. and Varin, C., Gaussian Copula Marginal Regression. Electronic Journal of Statistics, 6, 1517—1549, 2012. [23] Nelsen, R. B., An Introduction to Copulas, Second Edition, New York, Springer, 2006. [24] Nikoloulopoulos, A. K. and Karlis, D., Regression in a Copula Model for Bivariate Count Data. Journal of Applied Statistics, 37, 1555—1568, 2010. [25] Noh, H., El Ghouch, A. and Bouezmarni, T., Copula-based Regression Estimation and Inference, Journal of the American Statistical Association, 108, 676—688, 2013. [26] Parsa, R. A., and Klugman, S. A., Copula Regression, Variance: Advancing the Science of Risk, 5, 45—54, 2011. [27] Song, P. X. K., Fan, Y. and Kalbfleisch, J. D, Maximation by Parts in Likelihood Inference, Journal of the American Statistical Association, 100, 1145—1158, 2005. [28] Sungur, E. A., Some Observations on Copula Regression Functions, Communication in Statistics—Theory and Methods, 34, 1967—1978, 2006. [29] Trivedi, P. K. and Zimmer, D. M. Copula Modelling: An Introduction for Practitioners, Foundation and Trends in Econometrics, 1, 1—111, 2005. [30] Venter, G. G., Generalized Linear Models Beyond the Exponential Family with Loss Reserve Applications, Astin Bulletin, 37, 345—364, 2007.
14
Sertfut I Wayan Sumariaya Sebagai
:
PENYAJI MAKAIAH Dengan Judul
Suatu Survei Tentang Regresi Berhasis Kopula
#"' ** ils
l3Juni?{J.14
lr
.o. L
L*. .M.Sa
L4L99LO22m1
IrrY' tr.Eftdi
NuraniR. 1223 198803 2 001