Estimasi Parameter Copula Dan Aplikasinya Pada Klimatologi
Irwan Syahrir (1309 201 001)
Dosen Pembimbing: Dr. Ismaini Zaini, M.Si Dr.rer.pol. Heri Kuswanto, M.Si
1
1. PENDAHULUAN Latar belakang
Analisis Statistik
Analisis hubungan antara 2 (dua) variabel
Korelasi
-Spearman - Kendall
Asumsi
Distribusi Normal
- Masalah lebih mudah dan sederhana - Mudah perhitungan estimasi
pengukuran dependensi antara variabel
Pearson 2
Latar belakang (lanjutan) Penelitian
Kasus distribusi tidak normal
Kasus Multivariat
Pendekatan “Copula” -
- Biostatistic - Risk management
- insurance/actuaria - Climatology/meteorology, etc
Ketidaknormalan diabaikan dalam perhitungan korelasi
Struktur dependensi Struktur probabilitas fungsi densitas
kompleks
Mengapa?
Mampu mengatasi dependensi variabel yang berdistribusi tak normal Informasi struktur dependen lebih banyak Lebih fleksibel : distribusi marginal dari variabel dependen dapat dibedakan atau bahkan dapat mengetahui distribusi variabel yang tidak diketahui. (Schölzel ,2008) 3
Latar belakang (lanjutan) Penelitian dengan pendekatan Copula :
hidrology : Favre et al. (2004) dan Genest et al. (2007).
Keuangan dan asuransi : Cherubini et al. (2004) dan Mcneil et al. (2005)
Ekonometrika dan time series: Patton (2002;2009).
Klimatologi : Schölzel (2008). Schölzel (2008), menjelaskan pola distribusi dan fungsi densitas dari variabel random multivariat pada data temperatur, curah hujan dan kecepatan angin.
Copula
Theorema Sklar’s Sklar (1959)
Suatu cara untuk menjelaskan struktur dependensi vektor random
Estimasi copula menyatakan bahwa setiap distribusi marginal harus dihitung dan dimasukkan ke dalam estimasi distribusi multivariat
4
Estimasi Parameter Copula
Metode Maximum Likelihood Estimation (MLE). (Choroś et al. ,2010)
Pendekatan model parametrik, semiparametrik dan non parametrik (Charpentier et.al.,2006)
Copula Archimedean
Gumbel
Aplikasi Geoscience (Embrechts et al.,2001)
Kasus Klimatologi
Clayton
5
•
Tujuan Penelitian
1. Menentukan estimasi parameter copula archimedean 2. Mengaplikasikan pada data klimatologi
Manfaat Penelitian
1. Memperkenalkan metode alternatif yaitu pendekatan copula khususnya keluarga archimedean, yang dapat diaplikasikan pada data iklim yang distribusinya tidak normal. • Batasan Masalah 1. Estimasi parameter copula dg pendekatan Kendall’s Tau 2. Parameter Copula gumbel dan Clayton 3. Variabel yang dilibatkan hanya dibatasi 2 (dua) variabel atau bivariat, yaitu data kecepatan angin rata-rata dengan tekanan udara diatas permukaan air laut dan kecepatan angin dengan temperatur udara
6
2. Teori Copula fungsi yang menghubungkan margin univariat menjadi distribusi multivariat, dimana fungsi tersebut merupakan fungsi distribusi bersama dari variabel random uniform standar normal. (Nelsen ,1999)
copula
Variabel random multivariat
Suatu m dimensi vektor random X dengan fungsi distribusi kumulatif marginal (Marginal Cumulative Distribution Function)
Asumsi
FX1 ,....., FX m dengan domain
ℜ
FX1 (−∞) = 0
FX1 (∞) = 1
joint distribusi dari vektor random dapat ditulis sebagai fungsi dari distribusi marginalnya.
Theorema Sklar’s (1959)
FX ( x) = C X ( FX1 ( x1 ),...., FX m ( xm ) 7
FX ( x) = C X ( FX1 ( x1 ),...., FX m ( xm )
C X : [ 0,1] x...x [ 0,1] → [ 0,1]
Uj memiliki distribusi marginal yg uniform. Jika distribusi marginalnya kontinu, maka fungsi copula adalah unik (nelsen,2006)
Distribusi fungsi copula
fungsi distribusi bersama dari transformasi variabel random
U j = FX j ( X j )
u1
um
0
0
j=1,…,m
C X (u1 ,..., um ) = ∫ ... ∫ c X (u1 ,..., um )du1...um u j = FX j ( x j ) 8
Teorema Sklar’s
setiap probabilitas densitas bersama dapat dituliskan sebagai hasil dari probabilitas densitas marginal dan densitas copula.
f X ( x) = f x1 ( x1 )... f X m ( xm ).c X (u1 ,..., um )
Fungsi copula
Fungsi distribusi multivariat dengan marginal uniform standar
9
a. Copula Ellip
Keluarga Copula
b. Copula Archimedian
1
Copula ellip
Copula normal
Fungsi distribusi kumulatif bivariat standar normal dengan korelasi ρ (sklar,1959)
2 Copula Students t
Fungsi copula normal :
Cρ (u1 , u2 ) = Φ ρ ( Φ −1 (u1 ), Φ −1 (u2 ) )
cρ (u1 , u2 ) =
Fungsi densitas copula normal :
dimana
ϕX = , X , ρ ( x1 , x2 ) 1
2
ϕX ,X 1
2 ,ρ
(Φ
−1
(u1 ), Φ −1 (u2 ) )
ϕ ( Φ −1 (u1 ) ) ϕ ( Φ −1 (u2 ) )
1 exp − [ x12 + x2 2 − 2 ρ x1 x2 ] 2 2π 1 − ρ 2 2(1 − ρ ) 1
10
Copula Students t Karakteristik Copula student’s t
Contoh pdf dari t-Copula dengan ρ=0,865 dan v = ∞, 5, 2.5 (dari kiri ke kanan).
Dalam kasus bivariat copula t dapat dituliskan sebagai berikut: tv−−11
tv ( u1 )
Cvt (u1 , u2 , v, ρ ) = ∫tv
−∞
∫
tv−1 ( ud
−∞
v+2 Γ ) 2 v Γ π v (1 − ρ 2 ) 2
x12 − 2 ρ x1 x2 + x22 x 1 + (1 − ρ 2 )v
−
v+2 2
dx1dx2
dimana ρ adalah koefisien korelasi, ν adalah jumlah derajat bebas. 11
Copula Archimedian
(i)
Clayton
(ii) Frank
Fungsi copula archimedian φC = (u ) u −θ − 1 C
eθ F u − 1 φF (u ) = log θ F e −1 φG (u ) = (− log u )θG
(Clayton) (Frank) (Gumbel)
(iii) Gumbel
CX (u1 ,..., = um ) φ −1 (φ (u1 ) + ... + φ (um )) Kasus bivariat
CX= (u1 , u2 ) φ −1 (φ (u1 ) + φ (u2 ))
φ
fungsi disebut fungsi generator dari copula (Nelsen ,2006) 12
3. Estimasi Copula Estimasi parameter copula dapat diperoleh dengan metode Maximum Likelihood Estimation (MLE) (Mikosch ,2006). Dengan mendeskripsikan parameter yang diberikan copula dan distribusi marginal, estimasi ML diperoleh dengan memaksimumkan fungsi log likelihood.
d
f ( x1 , x2 ,..., xd ) = c( F1 ( x1 ), F2 ( x2 ),..., Fd ( xd )∏ f i ( xi ) i =1
c(u1 , u2 ,..., ud ) =
∂C (u1 , u2 ,..., ud ) ∂u1∂u2 ,..., ∂ud
densitas dari d-dimensi copula
C (u1 , u2 ,..., ud ;θ )
model fungsi likelihood Copula
ln = f ( x1 , x2 ;θ , ρ ) ln c( F1 ( x1 ;θ ), F2 ( x2 ;θ ); ρ ) + ln f1 ( x1 ;θ ) + ln f 2 ( x2 ;θ )
13
4. Estimasi Parameter Copula Archimedean Menurut Genest dan rivest (1993) untuk mengkonstruksi estimasi parameter COPULA dapat menggunakan observasi nilai Kendall’s tau
φ (u ) du φ ′(u ) 0
1
τ = 1 + 4∫
φC
Fungsi generator Copula Archimedean
Pengertian Cuaca dan Iklim - Cuaca (weather) - Iklim (climate)
besaran unsur fisika atmosfer
- penerimaan radiasi matahari - suhu udara - kelembaban udara - tekanan udara - Kecepatan angin
-
unsur cuaca atau unsur iklim
arah angin penutupan awan presipitasi (embun, hujan, salju) evaporasi.
Cuaca
keadaan udara pada saat tertentu dan di wilayah tertentu yang relatif sempit dan pada jangka waktu yang singkat.
Iklim
keadaan cuaca rata-rata dalam waktu satu tahun yang dilakukan dalam waktu yang lama dan meliputi wilayah yang luas. 15
Tekanan udara adalah suatu gaya yang timbul akibat adanya berat dari lapisan udara. Besarnya tekanan udara di setiap tempat pada suatu saat berubah-ubah. Makin tinggi suatu tempat dari permukaan laut, makin rendah tekanan udaranya. Besarnya tekanan udara diukur dengan barometer dan dinyatakan dengan milibar (mbar).
Angin adalah udara yang bergerak dari daerah bertekanan udara tinggi ke daerah bertekanan udara rendah. Kecepatan angin dapat diukur dengan suatu alat yang disebut Anemometer Temperatur Udara adalah tingkat atau derajat panas dari kegiatan molekul dalam atmosfer yang dinyatakan dengan skala Celcius, Fahrenheit, atau skala Reamur.
Dari pengertian diatas dapat diketahui bahwa antara tekanan udara,kecepatan angin dan temperatur udara saling berhubungan. Perbedaan tekanan udara di suatu daerah akan mengakibatkan adanya pergerakan angin dari daerah yang bertekanan tinggi ke daerah yang bertekanan rendah. 16
5. Metodology Kajian teori
Aplikasi data
Data klimatologi
Variabel penelitian:
Kecepatan angin rata-rata (km/jam) Tekanan udara diatas permukaan air laut (mbar) Temperatur udara (
Sumber data
0
τ τ
C)
Stasiun Surabaya/Perak Data observasi harian Tahun 2005-2009 Sampel : 1691 pengamatan
17
Metodology (lanjutan) A. Tujuan pertama • Mendefinisikan fungsi distribusi bersama variabel random. • Menentukan fungsi distribusi Copula untuk kasus bivariat. • Menentukan fungsi likelihood Copula • Mengestimasi parameter fungsi Copula dengan metode Maximum Likelihood Estimation (MLE). • Mengestimasi parameter Copula Archimedean untuk keluarga Gumbel dan Clayton dengan pendekatan Kendall’s Tau B. Tujuan kedua: •
Membuat scatter plot antara kedua variabel yaitu : i. Kecepatan angin rata-rata dan tekanan udara ii. Kecepatan angin rata-rata dan temperatur udara
• Menguji ketaknomalan data dengan menggunakan histogram dan uji Kolmogorov-Smirnov • Menghitung parameter dependensi antara kedua variabel dengan observasi nilai Kendall’s Tau • Menghitung parameter pada Copula Archimedean khususnya Copula Gumbel dan Copula Clayton . • Menentukan estimasi fungsi Copula Archimedean pada keluarga Clayton dan Gumbel.
18
5. Hasil dan Pembahasan Copula untuk Kasus Bivariat
Fungsi distribusi bivariat
F ( x1 , x2 ) = C{F1 ( x1 ), F2 ( x2 )} Nelsen (2006)
Transformasi
C (u1 , u2 )
F {F1−1 (u1 ), F2−1 (u2 )},
u1 , u2 ∈ [0,1]
Fungsi copula
∂ 2C (u1 , u2 ) = c(u1 , u2 ) , u1 , u2 ∈ [0,1] ∂u1∂u2
f ( x1 , x2 )
c{F1 ( x1 ), F2 ( x2 )} f1 ( x1 ) f 2 ( x2 ) , x1 , x2 ∈
Fungsi densitas copula bivariat
19
Fungsi likelihood Copula n
L = Π cu1u2 {F1 ( x1 ), F2 ( x2 )} f1 ( x1 ) f 2 ( x2 )
MLE
i =1
ln = f ( x1 , x2 ;θ , ρ ) ln c( F1 ( x1 ;θ ), F2 ( x2 ;θ ); ρ ) + ln f1 ( x1 ;θ ) + ln f 2 ( x2 ;θ )
Estimasi parameter copula
Observasi Kendall’s Tau. Nelsen (2006)
no closed form
numerik
20
Hasil dan Pembahasan Estimasi Parameter Copula Archimedean
φ (u ) du 0 φ '(u )
τ C = 1 + 4∫
1
φ (u )
Gumbel:
φ (u ) du 0 φ ′(u )
τ = 1 + 4∫
1
θG − 1 (− log u )θG =1+4 ∫ du = 0 −θ ( − log(u ))θG −1 / u θG G 1
θG =
1 (1 − τ )
Fungsi generator copula
Clayton : 1 φ (u ) τ = 1 + 4∫ du 0 φ ′(u )
θC (u −θC − 1) / θ c du =1+4 ∫ = 0 θC + 2 −u −θC −1 1
2τ θC = 1−τ
21
21
Fungsi Copula Keluarga Archimedean Versi Bivariat Parameter range Family
Copula (Cθ)
Clayton
Gumbel
−θ 1
Cθ (u1 , u2 ) = (u Cl
+u
−θ 2
− 1)
1
θ
1 θ θ θ Cθ (u1 , u2 ) = exp − ( (log u1 ) + (log u2 ) ) Gu
θ ∈ [ −1, ∞ ] \ {0}
θ ∈ [1, ∞ ]
Sumber : Schmidt (2006)
22
5. Hasil dan Pembahasan (lanjutan) Aplikasi Copula
Scatter plot wind ave vs SLP Scatter plot wind ave vs T mean
. Plot-plot yang terkonsentrasi dalam satu area menunjukkan adanya korelasi yang berdekatan. Sedangkan plot-plot yang outlier menunjukkan hubungan yang sangat jauh antar kedua variabel. Hubungan dependensi antar kedua variabel tidak dapat hanya dideskripsikan dengan korelasi pearson karena banyaknya outlier pada scatter plot. Untuk mengatasi hal tersebut maka struktur dependensi dapat dijelaskan dengan korelasi yang berbasis pada rank yaitu korelasi kendall tau atau spearman.
23
Uji Kenormalan Histogram Wind Ave (kecepatan angin, km/jam)
Variabel Wind_ave SLP T mean
Histogram SLP(Tekanan udara, Mbar)
Kolmogorov-Smirnov Statistic df 0,064 1691 0,046 1691 0.037 1691
Sig. 0,000 0,000 0,029 24
b. Temperatur udara (T mean- 0C)
Histogram T mean (Temperatur udara, 0C)
25
Grafik distribusi bivariat antara kecepatan angin dan tekanan udara
26
Grafik distribusi bivariat antara kecepatan angin dan temperatur udara
27
Transformasi ke distribusi marginal uniform pada domain [0,1]
Scatter plot rank antara Wind_ave dengan SLP pada transformasi uniform [0,1]
Scatter plot rank antara Wind_ave dengan T_mean pada transformasi uniform [0,1]
kedua variabel adalah dependen, meskipun tingkat dependensinya kecil. Plot antar keduanya menunjukkan terkonsentrasi pada beberapa ruang interval yaitu pada ujung scatter, tetapi pada bagian interval tertentu diantara keduanya plot tidak jelas. Bagian plot yang tidak jelas mengindikasikan tail dependence. Dari sini dapat didefinisikan beberapa copula yang memiliki karakteristik bentuk tail dependence. 28
Scatter plot rank bivariat sampel random dari keluarga Gumbel dan Clayton dengan θ = 2 Copula Gumbel
Copula Clayton
Scatter plot rank bivariat sampel random dari keluarga Gumbel dan Clayton dengan θ =4
Gumbel Copula
Clayton Copula
29
Scatter plot rank bivariat sampel random dari keluarga Gumbel dan Clayton dengan θ = 6
Gumbel Copula
Clayton Copula
Scatter plot rank bivariat sampel random dari keluarga Gumbel dan Clayton dengan θ =10
Clayton Copula
Gumbel Copula
30
Sebelum melakukani fitting model copula maka terlebih dulu mengestimasi koefisien korelasi dari kedua variabel tersebut dengan 3 metode, yaitu Pearson, Spearman dan Kendall. Tabel pengukuran korelasi wind_ave vs SLP
Pearson
Kendall
Spearman
Correlation
0,1397741
0,1281978
0,1838372
p-value
7,84 x 10-9
7,772 x 10-15
2,554 x 10-14
α <0,05
Tabel pengukuran korelasi wind_ave vs T mean
Pearson
Kendall
Spearman
Korelasi
0,2069568
0,1474547
0,2120737
p-value
2,2 x 10-16
2,2 x 10-16
2,2 x 10-16
31
Perhitungan parameter copula berbasis Kendall’s Tau Kecepatan angin vs tekanan udara
Parameter copula clayton
Parameter copula gumbel
2τ 1−τ 2(0,1281978) = 1 − 0,1281978 = 0,294098
θG =
θc =
1 1−τ
1 1 − 0,1281978 = 1,147049 =
Kecepatan angin vs temperatur udara
Parameter copula clayton
2τ 1−τ 2(0,1474547) = 1 − 0,1474547 = 0,345213
θc =
Parameter copula gumbel
θG =
1 1−τ
1 1 − 0,1474547 = 1,172958 =
32
Fungsi Copula A. Kecepatan angin dan tekanan udara
B. Kecepatan angin dan tekanan udara
• Copula Clayton −θ 1
Cθ (u1 , u2 ) = (u Cl
+u
• Copula Clayton −θ 2
−0,294098 1
Cθ (u1 , u2 ) = (u Cl
1
− 1)θ
+u
−0,294098 2
−θ 1
Cθ (u1 , u2 ) = (u Cl
− 1)
1 0,294098
• Copula Gumbel 1 exp − ( (log u1 )θ + (log u2 )θ )θ CθGu (u1 , u2 ) = 1 CθGu (u1 , u2 ) = exp − ( (log u1 )1,147049 + (log u2 )1,147049 )1,147049
−0,345213 1
Cθ (u1 , u2 ) = (u Cl
+u
−θ 2
− 1)
+u
1
θ
−0,345213 2
− 1)
1 0,345213
• Copula Gumbel 1 θ θ θ exp − ( (log u1 ) + (log u2 ) ) Cθ (u1 , u2 ) = Gu
1 CθGu (u1 , u2 ) = exp − ( (log u1 )1,172958 + (log u2 )1,172958 )1,172958
33
Estimasi parameter θ dan nilai loglikelihood dihitung untuk mengetahui model struktur dependensi yang terbaik pada copula Tabel Model Fitting Untuk Copula Archimedean Untuk Kecepatan Angin Dan Tekanan Udara Copula
Estimate
Std. error
Z
Log likelihood
Gumbel
1.112993
0.01904045
58.45411
22.87724
Clayton
0.1703254
0.03308843
5.147582
15.99025
Model terbaik
Tabel Model Fitting Untuk Copula Archimedean Untuk Kecepatan Angin Dan Temperatur Udara Copula
Estimate
Std. error
Z
Log likelihood
Gumbel
1,138937
0.01967057
57,90054
32.83936
Clayton
0.2613921
0.03432309
7.615633
37.29556
Model terbaik
34
Fungsi Copula
Model terbaik
A. Kecepatan angin dan tekanan udara 1 θ θ θ Cθ (u1 , u2 ) = exp − ( (log u1 ) + (log u2 ) ) 1 Gu 1,147049 1,147049 1,147049 + (log u2 ) Cθ (u1 , u2 ) = exp − ( (log u1 ) ) Gu
Copula Gumbel
B. Kecepatan angin dan tekanan udara
1
CθCl (u1 , u2 ) = (u1−θ + u2−θ − 1)θ
CθCl (u1 , u2 ) = (u1−0,345213 + u2−0,345213 − 1)
1 0,345213
Copula Clayton
35
Scatter plot rank antara Wind_ave dengan SLP pada transformasi uniform [0,1]
Scatter plot rank dari Copula Gumbel untuk variabel random dengan parameter θ = 1,147049
36
Scatter plot rank antara Wind_ave dengan T_mean pada transformasi uniform [0,1]
Scatter plot rank dari Copula Clayton untuk variabel random dengan parameter θ = 0,345213
37
Kesimpulan 1. Variabel kecepatan angin rata-rata (wind_ave) dan tekanan udara diatas permukaan air laut (SLP) memiliki distribusi yang tidak normal. 2. Copula
archimedean
dapat
digunakan
untuk
menjelaskan
struktur
dependensi kedua variabel iklim tersebut. 3. Copula Archimedean dari keluarga Gumbel merupakan model terbaik untuk menjelaskan struktur dependensi antara variabel kecepatan angin rata-rata dan tekanan udara diatas permukaan air laut. 4. Copula Clayton merupakan model terbaik untuk variabel kecepatan angin rata-rata temperatur udara
38
Saran 1. Dalam penelitian ini peneliti menghitung estimasi parameter Copula Archimedean
dengan pendekatan parametrik, padahal seringkali
kasus yang muncul dalam analisis data adalah pola distribusi data termasuk
katagori non parametrik. Oleh karena itu perlu adanya
perhitungan estimasi dengan pendekatan non parametrik. 2. Perlu juga adanya penelitian pembanding dalam perhitungan estimasi dengan menggunakan keluarga Copula yang lain, misal: Copula Ellip yang meliputi Copula Normal dan Copula Student’s t. 3. Pada penelitian ini struktur dependensi antara kedua variabel dalam bentuk scatter plor rank tidak terlalu kelihatan dengan jelas karena dimungkinkan jumlah sampel data hanya pada observasi selama 5 tahun. Oleh karena itu pada penelitian berikutnya perlu ditambah sampel penelitian hingga 10 tahun atau lebih.
39
Terima Kasih
40