KNMru. fl lrs Jrl zo."']7- n-1,4juni20l4. Koffierems0 Nosnomd Mdernffio. Graha Sepuluh Nopember ITS

fl lrs Jrl zo."']7-

KNMru

Koffierems0 Nosnomd

Mdernffio

n-1,4Juni20L4 Graha Sepuluh Nopember

ITS

Konferensi Nosional Matemotika (KNM) XVll

- ITS Suraboyo

DAFTAR ISI

lnformasi 1.1 Susunan Panitia Konferensi Nasional Matematika XV11,2Ot4.....................1

.......7 )(Vll... .................9 1.3 Sambutan Presiden lndoMS 2OL2-20L4 .......13 1.4 Sambutan Rektor lnstitut Teknologi Sepuluh Nopember. 1.2 Laporan Ketua Panitia KNM

1.5 Sambutan Dekan FMIPA lnstitut Teknologi Sepuluh Nopember................15

Acara......... Abstrak lnvited Speaker..... 1.6 Susunan

2.

........L7 ..........-...o.... 23

3. Jadwat Presentasi Sesi Paralel

1................. 3.2 Jnowar PEnsErurlsr Mnrlus Sesr Pmalrr 2................

3.1Jaowm Prnserurnsr Maxnum

Sesr PRRRUI-

.................33 ....-.............47

3.3 Jnowm PeRsEurns Mernux Srsr PRmrE13................ ..................60

4. Denah Lokasi Ruangan 5. lnformasiSingkat Ekskursi 5. lklan dan Sponsor..... 7. Ucapqn Terima Kasih..........

.........75 ........-....-........77

............81 .....................83

Konferensi Nosional Motemotiko (KNM)XVll-

ITS

Suraboya

MENGG UNAKAN PEN DE KATAN

BAYESIAN

2

Tanggat Wahu Ruang Hari/

/ 12 Juni 2osTATlsTlKA :13.'15s.d.17.00 -,r Kamis

:SemeruB/

Waktu

No

ID

1

S1

13.15

- 13.30

Achmad Fahrurozi

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAiVE BAYES. CLASS/F/ER

Universitas Gunadarma

2

S2

1

3.30

- 13.45

Adhitya Ronnie Effendie

KqLKULATOR SURVIVAL DAN LIFE TABEL MENGGUNAKAN SOFTWARE R

Universitas Gadjah

Nama

Judul

lnstansi

Mada

3

S3

13.45

-

14.00

Affiati Oktaviarina

MODEL REGRESI COX PROPORTIONAL HAZARD PADA DAYA TAHAN PASIEN PENDERITA TBC DI SURABAYA

UNESA

4

S5

14.00

- 14.15

Andi Kresna Jaya

BEBEMPA SIFAT HASIL KALI KRONECKER MNTAI MARKOV BERDIMENSI HINGGA

Universitas Hasanuddin

5

s12

14.15

-

14.30

caturiyati

FUNGSI BARRIER PADA MASALAH SECOND ORDER CONE PROGRAMMING NORMA INFINIT

UNY

o

s13

14.45

-

'l

Danardono

STUDI SIMULASI PENGGABUNGAN TABEL MORTALITAS MENGGUNAKAN METODE. LIKELIHOOD

Jurusan Matematika

Hendro Permadi

PENGEMBANGAN GRAFIK PENGENDALI DISTRIBUSI BETA BINOMIAL SEBAGAI PENGANTI pCHART MELALUI MARKOV CHAIN MONTE CARLO

Jurusan Matematika FMIPA UM

lGustiAyu Made

Pengaruh Outliers Terhadap Estimator Parameter Regresi dan Metode Reqresi Robust A Survey of Copula-based Regression

Matematika, Universitas Udavana

Analisis Gerombol Berbasis Model (Studi Kasus Standar Pelayanan Minimal SMP di Kabupaten Manokwari)

Universitas Negeri

Kajian Analisis Diskriminan Berbasis Model (Model Based Discriminant Analvsis Studv)

Universitas Negeri

Dian Handayani

Aplikasi Metode Empirical Bayes untuk Pendugaan lndikator Kemiskinan pada Level Kecamatan

Universitas Negeri Jakarta

Komang Dharmawan

PEMODELAN KEBERGANTUNGAN INDEKS SAHAM MENGGUNAKAN FUNGSI COPULA

Universitas Udayana

5.00

7

s41

15.00

-

8

s44

15.15

- 15.30

15.15

Srinadi

(9

s45

15.30

-

10

s46

1s.45

- 16.00

11

s47

16.00

15.45

- 16.15

12

s96

16.1 5

-

13

s52

16.30

- 16,45

16.30

lWayan Sumarjaya lndah Ratih Anggriyani

lndah Ratih Anggriyani

53

UGM

Universitas Udayana Papua

Papua

KNM

XVII

11-14 Juni

2014

ITS, Surabaya

SUATU SURVEI TENTANG REGRESI BERBASIS KOPUL

I WAYAN SUMARJAYA' '

Jurusan Matematika Universitas Udayana, sumarj [email protected]. id

Extended abstract

Analisis regresi merupakan salah satu metode statistika yang paling sering digunakan. Pengembangan analisis regresi dalam bentuk model linear rampat (generalized linear model) telah sukses dalam memodelkan datayang melibatkan peubah respons kontinu ataupun disket. Model linear rampat ini mengasumsikan bahwa peubah respons termasuk dalam keluarga eksponensial. Namun, dalam banyak aplikasi seperti dalam bidang asuransi dan manajemen risiko struktur kebergantungan yang diberikan keluarga eksponensial menjadi tidak fleksibel. Klugman et al. |5) memperluas konsep model linear rampat untuk distribusi selain anggota keluarga eksponensial. Perluasan lebih lanjut dilakukan oleh Venter [30] dengan aplikasi pada /oss reserve.

Mengingat analisis regresi melibatkan hubungan antara dua peubah atau lebih, konsep kebergantungan (dependence) memegang peranan penting. Pada analisis regresi linear hubungan kebergantungan antarpeubah dinyatakan oleh korelasi. Namun, Embrechts et al. ll2l dan [13] mengatakan bahwa pada dunia nonnormal, korelasi bukanlah merupakan ukuran kebergantungan yang berguna. Kelemahan lain adalah korelasi tidaklah invarian dalam transformasi, yang mana hal ini tidak terjadi pada kebergantungan berbasis kopula. Dalam konteks analisis regresi peranan penting kopula antara lain dalam memodelkan kebergantungan nonlinear dan memisahkan pengaruh margin univariat.

[9]

Kolev and Paiva telah mensurvei beberapa model regresi berbasis kopula. Namun, setelah tahun 2009 terdapat beberapa model atau ide baru tentang regresi berbasis kopula yang layak dibahas. Beberapa hasil tersebut antara lain regresi kuantil-kopula, model berbasis kopula bersama, regresi kuadrat terkecil biasa rampat dengan kopula normal, analisis regresi marginal kopula Gauss, dan regresi berbasis kopula untuk data cacah. Mengingat regresi berbasis kopula termasuk area riset yang aktif dan masih belum banyak diketahui dan diaplikasikan, maka survei ini dititikberatkan pada model-model tersebut dan aplikasinya. Kata kunci: kopula, kebergantungan, regresi kopula

1. Latar Belakang Analisis regresi melibatkan hubungan antara dua peubah atau lebih. Hal ini berarti konsep kebergantungan (dependence) memegang peranan penting. Pada analisis regresi linear hubungan antarpeubah dinyatakan oleh korelasi. Namun, Embrechts et al. [12] dan [13] mengatakan bahwa pada dunia/aplikasi nonnormal (noneliptik), korelasi bukanlah ukuran kebergantungan yang berguna. Lebih lanjut dalam [12] dan [13] setidaknya ada enam masalah penggunaan korelasi sebagai ukuran kebergantungan. Ada tiga masalah penyalahgunaan korelasi yang sering ditemukan lihat [12], [13]. Pertama, distribusi marginal dan korelasi menentukan distribusi bersama. Hal ini tentu saja hanya berlaku untuk distribusi eliptik. Distribusi eliptik adalah distribusi yang densitasnya konstan pada ellipsoid dan pada dimensi dua gari kontur permukaan densitas adalah elips [12]. Penyalahgunaan selanjutnya adalah sebagai berikut: diberikan distribusi marginal F1 dan F2 untuk X dan Y , semua korelasi linear antara − 1 dan 1 dapat diperoleh dengan spesifikasi yang sesuai dari distribusi bersama. Hal ini juga tidaklah benar. Embrechts et al. [12] mencontohkan jika X ~ LOGN(0,1) dan Y ~ LOGN (0, σ 2 ) dengan σ 2 > 0 , maka nilai exp(−σ ) − 1 ρ min = (exp(1) − 1)(exp(σ 2 ) − 1) dan exp(σ ) − 1 ρ max = (exp(1) − 1)(exp(σ 2 ) − 1) yang tidak berada pada selang [−1,1] . Penyalahgunaan ketiga adalah pada saat kuantil untuk portofolio linear X + Y terjadi pada saat ρ ( X + Y ) maksimal. Embrechts [12] menegaskan bahwa ini juga hanya terjadi pada dunia eliptik. Berdasarkan kelemahan-kelemahan tersebut di atas diperlukan ukuran kebergantungan lain yang mampu memodelkan hubungan nonlinear. Salah satu cara untuk memodelkan struktur kebergantungan ini adalah dengan kopula. Kopula merupakan fungsi yang menggabungkan atau memasangkan fungsi distribusi multivariat dengan fungsi distribusi marginal satu dimensi. Artikel ini diatur sebagai berikut. Bagian pertama berisi motivasi kelemahan korelasi dalam memodelkan hubungan antarpeubah. Selanjutnya, bagian kedua berisi pengantar kopula dan ukuran Kendall τ dan Spearman ρ . Model-model regresi berbasis kopula dibahas pada bagian ketiga. Bagian keempat membahas teknik umum pendugaan parameter model. Bagian terakhir dari artikel adalah diskusi. 2. Pengantar Kopula Pada bagian ini akan dibicarakan konsep kopula. Pembahasan diawali dengan konsep kopula bivariat, kemudian dilanjutkan dengan kasus multivariat. Literatur standar tentang kopula dapat dibaca pada monograf [23] dan [5]. Pembahasan konsep kopula pada bagian berikut diambil dari [23] dan [5]. Misalkan X dan Y adalah peubah acak dengan fungsi distribusi

2

KNM XVII

11-14 Juni 2014

ITS, Surabaya

F ( x) = Pr( X ≤ x) dan G ( y ) = Pr(Y ≤ y ) serta distribusi bersama H ( x, y ) = Pr( X ≤ x, Y ≤ y ) . Untuk masing-masing bilangan real ( x, y ) dapat diasosiasikan tiga bilangan F ( x) , G ( y ) , dan H ( x, y ) . Sebagai catatan ketiga bilangan tersebut berada pada selang [0,1] . Hubungan antara F ( x) , G ( y ) , dan H ( x, y ) dapat dijelaskan oleh Teorema Sklar untuk kasus bivariat berikut (lihat misalnya [23] dan [5]).

Teorema Sklar [23] Misalkan H ( x, y ) adalah fungsi distribusi bersama dengan margin F ( x) dan G ( y ) , maka terdapat suatu kopula C , sedemikian hingga untuk semua x , y di dalam garis real diperluas R = [−∞, ∞] H ( x, y ) = C ( F ( x), G ( y )) . (1) Jika F ( x) dan G ( y ) kontinu, maka C tunggal (unique); jika tidak, C secara tunggal ditentukan pada ran F dan ran G . Sebaliknya, jika C adalah kopula dan F ( x) serta G ( y ) adalah fungsi distribusi, maka fungsi H ( x, y ) adalah distribusi bersama dengan margin F ( x) dan G ( y ) . Berdasarkan Teorema Sklar di atas dapat dilihat bahwa fungsi densitas peluang bersama dipisahkan menjadi marginal dan kopula, sehingga dalam hal ini kopula hanya menyatakan ”asosiasi” antara X dan Y [5]. Dengan demikian kopula memisahkan tingkah laku marginal yang diwakili oleh F dan G dari asosiasi. Hal inilah yang menyebabkan kopula juga dikatakan fungsi kebergantungan (dependence function). Contoh 1. Kopula Gauss C (u , v) didefinisikan oleh

C (u, v) = N ρ (Φ −1 (u ), Φ −1 (v)) =

Φ −1 ( u ) Φ −1 ( v )

1

∫ ∫

2π 1 − ρ 2 −∞ dengan ρ adalah koefisien korelasi.

−∞

 − 2 ρst − s 2 − t 2  exp   ds dt , 2  2(1 − ρ ) 

Contoh 2. Kelas kopula Archimedes (Archimedean copula) yang didefinisikan oleh C (u , v) = ϕ [ −1] (ϕ (u ) + ϕ (v)) dengan ϕ [−1] adalah pseudo-invers dari pembangkit (generator) ϕ . Contoh anggota kopula Archimedes adalah kopula Gumbel C (u , v) = exp − [(− ln u )θ + (− ln v)θ ]1/ θ , θ ∈ [1, ∞) dan kopula Frank C (u , v) = 1 − [(1 − u )θ + (1 − v)θ − (1 − u )θ (1 − v)θ ]1/θ , θ ∈ [1, ∞) . Kopula Gumbel merupakan salah satu kopula yang mampu menangkap kebergantungan ekor atas [11]. Selanjutnya akan didefinisikan densitas kopula dan representasi kanonik.

(

)

3

Definisi [5]. Densitas c(u , v) yang berasosiasi dengan kopula C (u , v) adalah ∂ 2C (u , v) . ∂u ∂v

c(u , v) =

Contoh 3. Fungsi densitas kopula Gauss adalah ν 2 + ν 22 2 ρν 1ν 2 − ν 12 −ν 22  1 c(u , v) = exp  1 +  2 2(1 − ρ 2 ) 1− ρ2  

dengan ν 1 = Φ −1 (u ) dan ν 2 = Φ −1 (v). Pada vektor acak kontinu, densitas kopula c berhubungan dengan densitas f dan fungsi distribusi F ; lebih jelasnya hal ini sama dengan rasio densitas bersama f yang merupakan produk dari densitas marginal fi , i = 1, 2 , yakni f ( x, y ) c( F1 ( x), F2 ( y )) = . f1 ( x) f 2 ( y ) Berdasarkan Teorema Sklar pada persamaan (1), hubungan di atas memunculkan representasi kanonik berikut f ( x, y ) = c( F1 ( x), F2 ( y )) f1 ( x) f 2 ( y ). Selanjutnya perluasan Teorema Sklar untuk dimensi d dapat dilihat pada [23] dan [5]. Misalkan H adalah fungsi distribusi berdimensi d dengan margin F1 ( x), F2 ( x), K , Fd ( x) , maka terdapat kopula C berdimensi d sedemikian hingga untuk semua x = ( x1 , x2 , K , xd ) ∈ R d H ( x1 , x2 ,K, xd ) = C ( F1 ( x1 ), F2 ( x1 ),K, Fd ( xd )). Jika F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) semuanya kontinu, maka C tunggal. Jika tidak C secara tunggal ditentukan pada ran F1 × ran F2 × L ran Fd . Sebaliknya, jika C adalah kopula berdimensi d dan F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) adalah fungsi distribusi, maka H adalah fungsi distribusi berdimensi d dengan margin F1 ( x1 ), F2 ( x1 ), K , Fd ( xd ) . Contoh 4. Kopula Gauss C (u) multivariat didefinisikan oleh C (u) = 1/ 2

dengan | R |

Φ −1 ( u1 )

1 (2π )

d /2

1/ 2

|R|

∫

Φ −1 ( u d )

∫

L

−∞

−∞

 1  exp − xT R −1x  dx1 L dxd  2 

adalah determinan.

Seperti halnya pada kasus bivariat densitas kopula dan representasi kanonik dapat dikembangkan sebagai berikut. Definisi

[5].

Densitas

c(u1, K , ud )

yang

C (u1, u2 , K , ud ) adalah

4

berasosiasi

dengan

kopula

KNM XVII

11-14 Juni 2014

ITS, Surabaya

∂ d C (u1, u2 , K , ud ) . ∂u1∂u2 L ∂ d Demikian pula fungsi densitas f yang bersesuaian dengan densitas kopula diberikan oleh representasi kanonik c(u1 , K , ud ) =

d

f ( x1, x2 , K , xd ) = c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ fi ( xi )

(2)

i =1

dengan c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) =

∂ d C ( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) . ∂F1 ( x1 )∂F2 ( x2 ) K ∂Fd ( xd )

Contoh 5. Representasi densitas kopula Gauss C Ga (u) multivariat dapat dinyatakan sebagai 1  1  cRGa (u) = exp − ξ T ( R −1 − I )ξ  1/ 2 |R|  2  −1 −1 −1 dengan ξ = (Φ (u1 ), Φ (u2 ), L , Φ (ud )) . Pada bagian sebelumnya salah satu kelemahan korelasi adalah tidak invarian dalam transformasi, sehingga diperlukan ukuran kebergantungan lain yang invarian seperti Kendall τ dan Spearman ρ . Definisi [5] Kendall τ untuk peubah acak X dan Y dengan kopula C didefinisikan sebagai τ = 4∫∫ C (u , v) dC (u , v) − 1. [ 0 ,1]×[ 0 ,1]

Versi sampel Kendall τ dapat dihitung sebagai berikut (lihat [5]) n 2 ∑∑ sgn( X i − X j )(Yi − Y j ). n(n − 1) i =1 j >i Definisi [5] Spearman ρ untuk peubah acak X dan Y dengan kopula C didefinisikan sebagai ρ = 12 ∫∫ uv dC (u , v) − 3. [ 0 ,1]×[ 0 ,1]

Untuk Spearman ρ versi sampel dihitung sebagai berikut (lihat [5])

∑ ∑

n i =1

n

i =1

( Ri − R )( Si − S )

( Ri − R ) 2 ( Si − S ) 2

dengan Ri = rank ( X i ) dan S i = rank (Yi ) .

3. Model-model Regresi Berbasis Kopula Pada bagian sebelumnya telah dijelaskan bahwa model regresi berdasarkan kuadrat terkecil (ordinary least square) tidak sesuai untuk aplikasi aktuaria karena seringkali hubungan antarpeubah tidak linear (nonlinear) dan distribusi peluang tidak normal [26]. Sebagai contoh pada bidang asuransi, model untuk usia pada saat meninggal biasanya pencong ke kiri (skewed to the left), sementara model kerugian casualty (casualty loss) biasanya pencong ke kanan. Salah satu upaya untuk mengatasi masalah ini adalah dengan model linear rampat (generalized

5

linear model, disingkat GLM). Namun, GLM memiliki keterbatasan yakni peubah takbebas harus berasal dari keluarga eksponensial. Pengembangan lebih lanjut GLM untuk distribusi selain keluarga eksponensial telah diusulkan oleh [15] dan dikembangkan lebih lanjut oleh [30]. Pada subbagian ini akan dibahas beberapa model regresi berbasis kopula. Dalam konteks analisis regresi peranan penting kopula antara lain dalam memodelkan kebergantungan nonlinear [26] dan memisahkan pengaruh margin univariat [28]. Selain itu, kopula invarian dalam transformasi [7]. Pembahasan model regresi pada subbagian berikut meliputi model regresi kuadrat terkecil biasa rampat dengan kopula Gauss [26], model regresi marginal kopula Gauss [22], Regresi berbasis kopula bersama [20], regresi kopula data cacah [24], dan regresi kuantil kopula [2]. 3.1 Model Regresi Kuadrat Terkecil Biasa Rampat dengan Kopula Gauss Parsa dan Klugman [26] mengusulkan perluasan regresi kuadrat terkecil dengan kopula. Proses perluasan ini meliputi tiga langkah. Pertama, asumsikan suatu model untuk distribusi bersama untuk semua peubah, baik respons maupun kovariat. Kemudian, estimasi parameter model baik parameter pada distribusi marginal ataupun parameter kopula. Langkah terakhir, hitung nilai prediksi Y bersyarat suatu himpunan kovariat dengan menggunakan nilai tengah bersyarat Y diketahui kovariat yakni E (Y | X 1 = x1 , K , X k = xk ). Parsa dan Klugman [26] menggunakan fungsi kopula Gauss dengan mengasumsikan distribusi normal multivariat dengan nilai tengah nol, varians satu, dan matriks korelasi R . Menggunakan representasi kanonik kopula pada persamaan (2) diperoleh 1  1  f ( x1 , x2 ,K, xd ) = f1 ( x1 )L f d ( xd ) 1 / 2 exp − ξT ( R −1 − I )ξ . |R|  2  Selanjutnya dihitung distribusi bersyarat xd diketahui x1, x2 , K , xd −1 yakni

(

 1 Φ −1 ( F ( x ) − r T R −1 )ξ * d d n −1 f ( xd | x1 , x2 ,K, xd −1 ) = f d ( xd ) exp − T −1 1 − r Rn −1r  2

)

2

 − (Φ −1 ( Fd ( xd )) 2  

× (1 − r T Rn−−11r ) −1 / 2 , r R dengan ξ = (Φ −1 (u1 ), Φ −1 (u2 ), K , Φ −1 (u d −1 )) , R =  dT−1  , dan r adalah vektor 1 r (d − 1) × 1 adalah kolom paling kanan dari R dengan elemen terakhir dari elemen terakhir dihilangkan. Selanjutnya, dalam konteks regresi apabila xd diganti dengan y akan diperoleh

(

 1 Φ −1 ( F ( y ) − r T R −1 )ξ * n −1 f ( y | x1 , x2 ,K, xd −1 ) = f ( y ) exp − T −1 1 − r Rn−1r  2

)

2

 − (Φ −1 ( F ( y )) 2  

× (1 − r T Rn−−11r ) −1/ 2 . Pada regresi kuadrat terkecil biasa dan GLM distribusi kovariat biasanya tidak ditentukan, namun dalam model regresi yang diusulkan [26] distribusi kovariat harus ditentukan.

6

KNM XVII

11-14 Juni 2014

ITS, Surabaya

3.2 Regresi Marginal Kopula Gauss Masarotto dan Varin [22] mengusulkan kelas model kopula Gauss untuk analisis regresi marginal untuk data nonnormal berkorelasi. Kelas model ini memberikan perluasan alamiah dari model regresi linear tradisional dengan galat berkorelasi normal dengan respons kontinu, diskret, dan kategorik diperbolehkan. Misalkan Y = (Y1 , K , Yn )T adalah vektor peubah respons kontinu, diskret, ataupun kovariat dan y = ( y1 , K , yn )T adalah realisasinya serta x i = ( xi1 ,K, xip )T adalah vektor p kovariat. Masarotto dan Varin [22] mengusulkan model regresi berbentuk Yi = g (x i , ε i , λ ), i = 1, K , n, dengan g (.) adalah fungsi yang sesuai dari peubah bebas x i dan peubah stokastik yang tidak teramati ε i . Diasumsikan bahwa model regresi di atas diketahui sampai dengan vektor parameter λ . Selanjutnya, salah satu spesifikasi yang mungkin untuk fungsi g (.) adalah −1

Yi = Fi (Φ (ε i ); λ ), i = 1,K, n, (3) dengan Fi (, ; λ ) = F (. | x i ; λ ) adalah fungsi distribusi kumulatif normal Yi | xi , dan Φ(.) adalah fungsi distribusi normal. Dalam memodelkan kebergantungan diasumsikan ε = (ε 1 , K , ε n )T adalah normal multivariat dengan nilai tengah nol dan matriks korelasi Ω yakni ε ~ MVN(0, Ω) . (4) Persamaan (3) di atas menspesifikasikan komponen marginal dan komponen kebergantungan dinyatakan oleh persamaan (4). Keluarga model yang melibatkan persamaan (3) dan (4) disebut regresi marginal kopula Gauss. Pada kasus kontinu pemetaan antara ε i dan Yi pada (3) adalah satu-satu. Sebagai contoh pada kasus bivariat f ij ( yi , y j ; θ) = f i ( yi ; λ ) f j ( y j ; λ )h(ε i , ε j ; θ), dengan f i ( yi ; λ ) = f ( yi | x i ; λ ) , f j ( y j ; λ ) = f j ( y j | x j ; λ ) , dan

h(ε i , ε j ; θ) =

f (ε i , ε j ; θ) f (ε i , λ ) f (ε j , λ )

adalah densitas kopula Gauss bivariat, f (ε i , λ ) adalah densitas normal baku bivariat, f (ε i , ε j ; θ) adalah densitas normal bivariat dengan nilai tengah nol, varians satu, dan korelasi yang diberikan oleh elemen pada posisi (i, j ) dalam matriks Ω . Untuk kasus diskret dan kategorik, pemetaan (3) tidaklah satu-satu melainkan banyak-satu (many-to-one) sehingga f ij ( yi , y j ; θ) = ∫ ∫ f (ε i , ε j ) dε i dε j , Di ( yi , λ ) D j ( y j , λ )

dengan domain hasil kali Cartesius Di ( yi , λ ) = [Φ −1 ( Fi ( yi− ; λ )), Φ −1 ( Fi ( yi ; λ ))] , Fi ( yi− ; λ ) adalah limit dari Fi (.; λ ) pada yi dan yi− = yi − 1 apabila support Yi pada N .

7

3.3 Regresi Berbasis Kopula Bersama Kramer et al. [20] mengusulkan model regresi berbasis kopula bersama dalam memodelkan kebergantungan antara ukuran klaim dan jumlah klaim dengan mengombinasikan distribusi marginal dari frekuensi klaim dan keparahan (severity) dengan kopula bivariat. Model yang diusulkan [20] merupakan pengembangan dari model [21] dan [8]. Konsep pemodelan kopula berdasarkan distribusi bersama adalah sebagai berikut. Misalkan X menyatakan peubah acak kontinu dan Y adalah peubah acak diskret. Diasumsikan Y bernilai 1,2, K . Distribusi bersama X dan Y didefinisikan oleh kopula parametrik C (⋅,⋅ | θ ) yang tergantung pada parameter θ , yakni FX ,Y |θ ( x | y ) = C ( FX ( x), FY ( y ) | θ ). Selanjutnya didefinisikan turunan parsial kopula terhadap peubah pertama yakni ∂ D1 (u , v | θ ) = C (u , v | θ ). ∂u Kemudian fungsi densitas peluang bersama f X ,Y |θ ( x, y | θ ) dari peubah acak kontinu X dan diskret Y diberikan oleh f X ,Y |θ ( x, y | θ ) = f X ( x)[ D1 ( FX ( x), FY ( y ) | θ ) − D1 ( FX ( x), FY ( y − 1) | θ )]. Distribusi bersyarat Y | X = x dapat diperoleh dari model di atas dengan menerapkan aturan peluang bersyarat. Dalam pemodelan polis kerugian (policy loss) didefinisikan kerugian L sebagai perkalian antara rata-rata ukuran klaim X dan jumlah klaim Y sebagai L = XY dan fungsi densitas distribusi kerugian ini diberikan oleh ∞ 1 f L (l ) = ∑ [ D1 ( FX ( ly ), FY ( y ) | θ ) − D1 ( FX ( yl ), FY ( y − 1) | θ )] f X ( ly | θ ) y y =1 untuk l > 0. Persamaan ini diperoleh dengan memarginalkan sepanjang vektor peubah acak diskret l > 0. Dalam formulasi model, [20] menggunakan GLM untuk model regresi marginal dan mengombinasikannya dengan keluarga kopula bivariat.

3.4 Regresi Kopula Data Cacah Nikoloulopoulos dan Karlis [24] mengusulkan model regresi berbasis kopula dengan kovariat yang digunakan tidak saja untuk marginal tetapi juga parameter kopula. Biasanya kopula digunakan untuk analisis data kontinu karena kemampuannya memisahkan marginal dari sifat kebergantungan. Namun, hal ini tidaklah berlaku untuk data cacah karena terdapat perancu (confounding) antara margin univariat dan ukuran asosiasi [24]. Lebih lanjut, menurut [24] informasi kovariat yang berhubungan dengan kebergantungan ada tiga yaitu dengan menempatkan kovariat pada parameter-parameter marginal, pada parameter kopula, dan pada keduanya (marginal maupun kopula). Misalkan model parametrik berbasis kopula bivariat untuk respons cacah Y1 dan Y2 dengan fungsi distribusi H yang diberikan oleh representasi H ( y1 , y2 , α1 , α 2 ;θ ) = C ( F1 ( y1 , α1 ); F2 ( y2 , α 2 );θ )

8

KNM XVII

11-14 Juni 2014

ITS, Surabaya

dengan F1 dan F2 adalah distribusi marginal dengan vektor parameter α1 dan α 2 serta θ adalah parameter kopula. Misalkan akan diselidiki efek informasi kovariat pada struktur kebergantungan. Misalkan pula data ( yij , xij ), i = 1, K , n; j = 1,2 , dengan i adalah indeks untuk individu, j adalah indeks untuk respons cacah, dan xij adalah vektor kovariat untuk individu ke-i yang berasosiasi dengan respons cacah ke-j. Kovariat xij dimasukkan pada model parametrik berbasis kopula dengan mengasumsikan model marginal univariat yij ~ F j (.; α ij ) dengan

α ij = ( µij = g ( β Tj xij , γ j )) ,

µij menyatakan

nilai

tengah

yang

diparameterisasi oleh fungsi tautan (link function) yang sesuai g (.) untuk mengakomodasi kovariat, β j adalah vektor koefisien regresi, dan γ j adalah vektor parameter marginal yang tidak tergantung pada kovariat. Selanjutnya bagian regresi untuk parameter kopula θ menggunakan fungsi kovariat s (.) pada

θ , yakni s (θ ) = bT xi . 3.5 Regresi Kuantil Kopula Regresi klasik menitikberatkan pada nilai harapan peubah takbebas Y bersyarat pada nilai peubah X yang disebut fungsi regresi. Regresi kuantil tidak membatasi perhatian pada harapan bersyarat sehingga memungkinkan untuk mendekati distribusi bersyarat secara keseluruhan dari peubah respons [9]. Regresi kuantil muncul sebagai solusi dari peminimuman (minimization) n

minp ∑ ρτ ( yi − xiT β ) β ∈R

i =1

(lihat [17],[16], dan [18]). Bouyé dan Salmon [2] mengusulkan pendekatan untuk memodelkan regresi kuantil nonlinear berdasarkan fungsi kopula yang mendefinisikan struktur kebergantungan antarpeubah yang diteliti. Lebih lanjut Bouyé dan Salmon [2] memperluas konsep regresi kuantil yang diusulkan oleh [17]. Perluasan ini dilakukan dengan menentukan distribusi untuk peubah acak respons Y bersyarat pada peubah bebas X dengan demikian menspesifikasikan fungsi regresi kuantil. Sebelum membahas model regresi kuantil terlebih dahulu didefinisikan kurva kuantil kopula ke-p. Definisi [2]. Untuk suatu kopula parametrik C (⋅,⋅;θ ) kurva kuantil kopula ke-p dari y bersyarat pada x didefinisikan oleh persamaan berikut p = C1 ( FX ( x), FY ( y ); δ ), (5) dengan θ ∈ Ω himpunan parameter dan C (u , v;θ ) = ∂C (u , v;θ ) / ∂u . Pada beberapa kondisi tertentu, seperti C1 harus terbalikkan sebagian (partially invertible), maka persamaan di atas dapat dinyatakan sebagai y = q(x, p; δ ), dengan q(x, p; δ ) = FY[ −1] ( D( FX ( x), p; δ )) . Contoh 6. Kopula Clayton dengan parameter positif tegas

9

θ

yakni

C (u , v;θ ) = (u −θ + v −θ − 1) −1/ θ memiliki kuantil kopula bersyarat Y | X (lihat [4])

(

)

y = FY−1 (( p −θ /(1+θ ) − 1) FX ( x) −θ + 1) −1/θ . Selanjutnya regresi kuantil kopula didefinisikan sebagai berikut. Definisi [2]. Regresi kuantil kopula ke-p q(x t , p; δ ) adalah solusi dari masalah berikut:   min ∑ p | yt − q(x t , p; δ ) | + ∑ (1 − p ) | yt − q(x t , p; δ ) |   δ  t∈Τ1− p  t∈Τp  dengan Τp = {t : yt ≥ q(x t , p; δ } dan Τ1− p adalah komplemennya. Bentuk ini juga dapat dinyatakan sebagai  T  min ∑ ( p − 1{ yt ≤q ( xt , p;δ )} )( yt − q(x t , p; δ )  . δ  t =1  Allen et al. [1] melakukan studi empiris terhadap enam pasangan data volatilitasreturn dan menyimpulkan bahwa regresi kuantil berbasis kopula memberikan hasil yang lebih baik dibandingkan regresi kuantil biasa dalam hal menangkap ketidaklinearan hubungan volatilitas-return.

4. Estimasi Parameter Secara umum metode pendugaan parameter dapat dilakukan secara parametrik, nonparametrik, dan semiparametrik. 4.1 Metode Parametrik Pada pendugaan parameter secara parametrik dapat dilakukan dengan menggunakan metode kemungkinan maksimum penuh (full maximum likelihood, disingkat FML), metode kemungkinan maksimum dua-tahap (two-step maximum likelihood, disingkat TSML), dan metode momen rampat (generalized method of moments, disingkat GMM). Subbagian hanya membahas metode FML dan TSML. Lihat kembali representasi kanonik pada persamaan (2) yakni d

f ( x1, x2 , K , xd ) = c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ fi ( xi )

(6)

i =1

dengan ∂ d C ( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) . ∂F1 ( x1 )∂F2 ( x2 ) K ∂Fd ( xd ) Apabila diambil sampel acak berdistribusi saling bebas dan identik dari vektor x ( j ) = ( x1( j ) , x2( j ) , K , xd( j ) ) , j = 1,2, K , n , maka likelihood dari bentuk kanonik di pada (6) adalah n n d   f ( x1( j ) , x2( j ) , K , xd( j ) ) = ∏  c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd ))∏ f i ( xi )  ∏ j =1 j =1  i =1  dan log likelihood yang bersesuaian adalah c( F1 ( x1 ), F2 ( x2 ), K , Fd ( xd )) =

10

KNM XVII

11-14 Juni 2014

n

∑ log f ( x

( j) 1

j =1

ITS, Surabaya

n

, x2( j ) , K , xd( j ) ) = ∑ log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) )) j =1 d

(7)

n

+ ∑∑ log f i ( x ). ( j) i

i =1 j =1

Kemudian tuliskan likelihood L = ∑ j =1 log f ( x1( j ) , x2( j ) , K , xd( j ) ) , likelihood dari n

struktur

kebergantungan

LC = ∑ j =1 log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) )) , n

dan

likelihood dari masing-masing margin Li = ∑ j =1 log f i ( xi( j ) ) . Dengan demikian n

representasi bentuk kanonik di atas dapat dituliskan sebagai d

L = LC + ∑ Li . i =1

Misalkan kopula C adalah anggota dari keluarga kopula yang diindeks oleh parameter θ yakni C (u1 , u 2 , K , u d ;θ ) dan margin Fi serta densitas univariat f i diindeks oleh parameter β i yakni Fi = Fi ( xi ; β i ) dan f i = f i ( xi ; β i ) . Penduga kemungkinan maksimum parameter model ( β1 , K , β d ) adalah ( βˆ MLE , βˆ MLE , K , βˆ MLE ;θˆ MLE ) = arg max L( β , K , β ;θ ) 1

2

d

d

1

β1 ,K, β d

n

= arg max ∑ log c( F1 ( x1( j ) , β1 ), K , Fd ( xd( j ) , β d );θ ) β1 ,K, β d d

j =1

n

+ ∑∑ log f i ( xi( j ) , β i ). i =1 j =1

Metode alternatif untuk mengestimasi likelihood (7) adalah metode inference function for margin (IFM) (lihat [29] atau [6]). IFM meliputi dua tahap. Pada tahap pertama, penduga βîIFM diestimasi dari log-likelihood Li pada masingmasing margin βîIFM = arg max Li ( β i ) βi

dengan demikian βˆ1IFM , βˆ2IFM ,K , βˆdIFM didefinisikan sebagai MLE dari parameter model dalam asumsi kebebasan. Pada tahap kedua penduga θˆ IFM dari persamaan kopula θ IFM dihitung dengan memaksimumkan kontribusi likelihood LC dengan parameter marginal β i diganti dengan penduga tahap pertama βˆ IFM = arg max L ( βˆ IFM , βˆ IFM ,K , βˆ IFM ;θ ). i

θi

C

1

2

d

Pada kondisi regularitas tertentu penduga MLE βˆ1MLE , βˆ2MLE ,K, βˆdMLE ,θˆ MLE adalah solusi dari  ∂L ∂L ∂L ∂L   , , K, ,  = 0. ∂β d ∂θ   ∂β1 ∂β 2 Selanjutnya

penduga

tahap

kedua

11

( βˆ1IFM , βˆ2IFM , K, βˆdIFM ,θˆ IFM )

mencari

penyelesaian

 ∂L1 ∂L2 ∂L ∂L   , , L, d ,  = 0. ∂β d ∂θ   ∂β1 ∂β 2 Strategi alternatif penghitungan likelihood adalah algoritma maximation by parts (MBP) yang diusulkan Song [27] (lihat juga [29]). Langkah pertama adalah d mendapatkan estimasi awal ( β1 , K , β d ) dengan memaksimumkan ∑i =1 Li dengan kata lain mengabaikan kebergantungan. Langkah selanjutnya adalah mencari solusi untuk θ . Estimasi awal mengabaikan kebergantungan jadi tidak efisien. Solusi iteratif ( β1MBP , β 2MBP , K , β dMBP ) memberikan suatu estimasi θ . Kemudian θ diberikan estimasi ( β1 , K , β d ) menghasilkan estimasi efisien karena prosedur ini mempertimbangkan kebergantungan. Lebih lanjut jika tidak terdapat kebergantungan, langkah pertama penduga adalah efisien. 4.2 Metode Semiparametrik Metode pendugaan semiparametrik meliputi dua tahap. Pada tahap pertama margin univariat Fi diestimasi secara nonparametrik, yakni dengan distribusi empiris Fˆ atau versi skalanya. Pada tahap kedua, parameter kopula diestimasi i

dari fungsi likelihood LC yakni θˆ = arg max L (θ ) C

θ

n

= arg max ∑ log c( F1 ( x1( j ) ), F2 ( x1( j ) ), K , Fd ( xd( j ) );θ ) θ

j =1

dengan Fî adalah penduga nonparametrik margin univariat Fî . Noh et al. [25] mengusulkan pendekatan semiparametrik dalam menduga regresi berbasis kopula; kopula dimodelkan secara parametrik tetapi distribusi marginal dimodelkan secara parametrik. Kelebihan metode ini adalah keluwesannya dan juga tidak terlalu dipengaruhi oleh curse of dimensionality. Dette et al.[10] memperingatkan pentingnya spesifikasi model. Lebih lanjut, jika salah dalam menspesifikasikan struktur kopula sebenarnya, seringkali pendekatan ini tidak menghasilkan estimasi yang dapat dipercaya. 4.3 Metode Nonparametrik Prosedur estimasi nonparametrik untuk kopula berdasarkan formula invers dari kopula empiris Cˆ (u1 , u2 ,K, ud ) = Fˆ ( Fˆ1−1 (u1 ), Fˆ2−1 (u2 ),K, Fˆd−1 (ud )) dengan Fˆ adalah penduga nonparametric dari fungsi distribusi F berdimensi d dan Fˆ −1 (u ), Fˆ −1 (u ),K, Fˆ −1 (u ) adalah penduga nonparametrik dari pseudo1

1

2

2

d

d

−1

invers Fi ( s ) = {t : Fi (t ) ≥ s} dari margin univariat F1 , F2 , K , Fd . Biasanya fungsi distribusi empiris berdimensi d

12

KNM XVII

11-14 Juni 2014

ITS, Surabaya

1 T Fˆ ( x1 , x2 , K , xd ) = ∑ I ( X 1 ≤ x1 , X 2 ≤ x2 , K , X d ≤ xd ) T t =1 − 1 estimasi pseudo-invers Fî ( s ) = {t : Fî (t ) ≥ s} dan distribusi univariat empiris T Fˆ = 1 ∑ I ( X ≤ x ) . Pendugaan kopula dengan metode nonparametrik dapat T

t =1

i

i

dilihat pada [3]. 5. Diskusi Pada bagian ini dibahas hal-hal yang layak menjadi bahan diskusi. Hal pertama adalah penerapan kopula pada kasus diskret. Genest dan Nešlehová [14] menegaskan bahwa bahaya dan keterbatasan dalam memodelkan dan inferensi dari kasus kontinu ke kasus diskret. Hal berikutnya, meskipun konsep kopula dipahami dengan baik, estimasi empirisnya lebih susah dan banyak perangkap dan kesulitan teknis dan biasanya hal ini diabaikan atau dianggap remeh oleh praktisi (lihat [3]). Daftar Pustaka [1] Allen, D. E., Singh, A. K., Powell, R. J., McAleer, M., Taylor, J. and Thomas, L.The Volatility-Return Relationship: Insights from Linear and Non-linear Quantile Regression, Working Paper 1201, School of Accounting, Finance and Economics & FEMARC Working Paper Series, Edith Cowan University, 2012. [2] Bouyé, E. and Salmon, M. Dynamic Copula Quantile Regressions and Tail Area Dynamic Dependence in Forex Markets, The European Journal of Finance, 15, 721—750, 2009. [3] Charpentier, A., Fermanian, J-D. and Scaillet. The Estimation of Copulas: Theory and Practice. In Copulas: From Theory to Application in Finance, Jörn Rank (eds), Wiley, 2006. [4] Cherubini, U., Gobbi, F., Mulinacci, S. and Romagnoli, S. Dynamic Copula Methods in Finance, John Wiley & Sons, 2012. [5] Cherubini, U., Luciano, E., and Vecchiato, W. Copula Methods in Finance, John Wiley and Sons, 2004. [6] Choroś, B., Ibragimov, R. and Permiakova, E. Copula Estimation. in: Workshop on Copula Theory and its Applications, Durante, F., Härdle, W., Jaworski, P. , Rychlik, T., (eds.), Springer, Dortrecht (NL), 2010. [7] Crane, G. J. and van der Hoek, J., Conditional Expectation Formulae for Copulas, Aust. N. Z. J. Stat., 50, 53—67, 2008. [8] Czado, C., Kastenmeier, R., Brechmann, E., Min, A. A Mixed Copula Model for Insurance Claims and Claim Sizes, Scandinavian Actuarial Journal, 4, 278—305, 2012. [9] Davino, C., Furno, M., and Vistocco, D. Quantile Regression: Theory and Applications, John Wiley and Sons, 2014. [10] Dette, H., Van Hecke, R. and Volgushev, S. Misspecification in Copula-based Regression, arXiv: 1310.8037v1[stat.ME], 30 October, 2013. [11] Embrechts, P. and Hofert, M., Statistics and Quantitative Risk Management for Banking and Insurance, Annual Review of Statistics and Its Application, 1, 493— 513, 2014. [12] Embrechts, P., McNeil, A. and Straumann, D. Correlation: Pitfalls and Alternatives, Dependence in Risk Management: Properties and Pitfalls, Risk Management: Value

13

at Risk and Beyond, ed. M. Dempster, 176—223, New York, Cambridge University Press, 1999. [13] Embrechts, P., McNeil, A. and Straumann, D. Correlation and Dependence in Risk Management: Properties and Pitfalls, Risk Management: Value at Risk and Beyond, ed. M. Dempster, 176—223, New York, Cambridge University Press, 2002. [14] Genest, C. and Nešlehová, A Primer on Copulas for Count, Astin Bulletin, 37, 475—515, 2007. [15] Klugman, S., Panjer, H. and Willmot, G. Loss Models: From Data to Decisions, Second Edition, New York, Wiley, 2004. [16] Koenker, R. Quantile Regression, Cambridge, Cambridge University Press, 2005. [17] Koenker, R. and Bassett, G., Regression Quantiles, Econometrica, 46, 33—50, 1979. [18] Koenker, R. and Hallock, K. F., Quantile Regression, EJournal of Economic Perspectives, 15, 143—156, 2001. [19] Kolev, N. and Paiva, D., Copula-based Regression Models: a Survey, Journal of Statistical Planning and Inference, 139, 3847—3856, 2009. [20] Krämer, N., Brechmann, E. C., Silvestrini, D. and Czado, C.,Total Loss Estimation Using Copula-based Regression Models, Insurance: Mathematics and Economics, 53, 829—839, 2013. [21] de Leon, A. R. and Wu, B., Copula-based Regression Models for a Bivariate Mixed Discrete and Continuous Outcome, Statistics in Medicine, 30, 175—185, 2010. [22] Masarotto, G. and Varin, C., Gaussian Copula Marginal Regression. Electronic Journal of Statistics, 6, 1517—1549, 2012. [23] Nelsen, R. B., An Introduction to Copulas, Second Edition, New York, Springer, 2006. [24] Nikoloulopoulos, A. K. and Karlis, D., Regression in a Copula Model for Bivariate Count Data. Journal of Applied Statistics, 37, 1555—1568, 2010. [25] Noh, H., El Ghouch, A. and Bouezmarni, T., Copula-based Regression Estimation and Inference, Journal of the American Statistical Association, 108, 676—688, 2013. [26] Parsa, R. A., and Klugman, S. A., Copula Regression, Variance: Advancing the Science of Risk, 5, 45—54, 2011. [27] Song, P. X. K., Fan, Y. and Kalbfleisch, J. D, Maximation by Parts in Likelihood Inference, Journal of the American Statistical Association, 100, 1145—1158, 2005. [28] Sungur, E. A., Some Observations on Copula Regression Functions, Communication in Statistics—Theory and Methods, 34, 1967—1978, 2006. [29] Trivedi, P. K. and Zimmer, D. M. Copula Modelling: An Introduction for Practitioners, Foundation and Trends in Econometrics, 1, 1—111, 2005. [30] Venter, G. G., Generalized Linear Models Beyond the Exponential Family with Loss Reserve Applications, Astin Bulletin, 37, 345—364, 2007.

14

Sertfut I Wayan Sumariaya Sebagai

:

PENYAJI MAKAIAH Dengan Judul

Suatu Survei Tentang Regresi Berhasis Kopula

#"' ** ils

l3Juni?{J.14

lr

.o. L

L*. .M.Sa

L4L99LO22m1

IrrY' tr.Eftdi

NuraniR. 1223 198803 2 001

KNMru. fl lrs Jrl zo."']7- n-1,4juni20l4. Koffierems0 Nosnomd Mdernffio. Graha Sepuluh Nopember ITS

Recommend Documents