APLIKASI COX PROPORTIONAL HAZARD MODEL DI ASURANSI JIWA (Studi Kasus pada AJB Bumiputera)
AFIEF ARYADHANI
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2011 M/1432 H
APLIKASI COX PROPORTIONAL HAZARD MODEL DI ASURANSI JIWA (Studi Kasus pada AJB Bumiputera)
Skripsi Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh: Afief Aryadhani 107094000260
PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2011 M/1432 H i
LEMBAR PENGESAHAN Skripsi berjudul “Aplikasi Cox Proportional Hazard Model di Asuransi Jiwa” yang ditulis oleh Afief Aryadhani, NIM 107094000260 telah diuji dan dinyatakan lulus dalam Sidang Munaqosyah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada tanggal 7 Juni 2011, skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu (S1) Program Studi Matematika.
Menyetujui, Penguji 1
Penguji 2
Taufik Edy Sutanto, M.Sc.Tech NIP. 19790530 200604 1 002
Yanne Irene, M.Si NIP. 19741231 200501 2 018
Pembimbing 1
Pembimbing 2
Hermawan Setiawan, M.TI NIP. 19740623 199312 2 001
Suma’inna, M.Si NIP. 150408699 Mengetahui,
Dekan Fakultas Sains dan Teknologi
Ketua Prodi Matematika
Dr. Syopiansyah Jaya Putra, M.Sis NIP. 19680117 200112 1 001
Yanne Irene, M.Si NIP. 19741231 200501 2 018 ii
PERNYATAAN DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI PADA PERGURUAN TINGGI ATAU LEMBAGA MANAPUN.
Jakarta, Juni 2011
Afief Aryadhani 107094000260
iii
PERSEMBAHAN Sebuah persembahan satu langkah menuju kesuksesan teruntuk kedua orang tuaku tercinta yang telah bekerja keras, memberikan semangat dan dukungan, serta doa agar anak-anaknya mencapai kesuksesan.
MOTO Setiap individu mempunyai lama waktu yang sama dalam seharinya Sama-sama mempunyai kedua orang tua dengan kasih sayangnya Menuntut ilmu dengan karakteristik yang sama di dalamnya Sekolah dengan fasilitas yang sama, Guru/Dosen dengan tujuan yang sama, serta Buku yang digunakan pun sama Tentunya hasil yang didapat toh harus sama Namun … Terdapat perbedaan hasil yang didapatkannya dengan segudang persamaan Untuk itu jadikanlah semua itu motivasi Karena jika individu lain bisa Maka kita pun sebagai individu akan bisa meraih hasil yang sama iv
ABSTRAK Asuransi merupakan suatu istilah untuk pengalihan resiko. Fungsi utama asuransi adalah sebagai pengalihan resiko yang diderita tertanggung kepada penanggungnya. Karena fungsi tersebut, perusahaan asuransi diharuskan untuk mengetahui faktor-faktor yang mempengaruhinya dan mengetahui probabilitas dimana pada waktu tertentu tertanggung akan banyak mengajukan klaim asuransi. Analisis yang tepat untuk permasalahan ini adalah analisis survival dengan metode Cox Proportional Hazard Model, karena analisis ini berhubungan dengan keadaan survive seseorang dan waktu sebagai faktor utamanya. Faktor-faktor yang digunakan dalam Cox Proportional Hazard Model, yaitu Survival Time merupakan waktu tertanggung dari start point sampai terjadi event atau end point, Status merupakan keadaan tertanggung apakah tertanggung terjadi event atau sampai end point tidak terjadi event, Age merupakan umur tertanggung, Sex merupakan jenis kelamin tertanggung, Smoking merupakan kebiasaan merokok tertanggung, dan Medical Test merupakan keadaan kesehatan tertanggung. Cox Proportional Hazard Model pada akhirnya akan memberikan informasi tentang faktor-faktor yang berpengaruh secara statistika, yaitu variabel Age, Smoking dan Medical Test. Perbandingan probabilitas survival faktor yang sama antar karakteristik yang berbeda yang dihasilkan adalah resiko terjadi event tertanggung dengan usia t+1 adalah 1.168 kali dari tertanggung yang dengan usia t. Resiko terjadi event tertanggung yang merokok adalah 2.407 kali dari tertanggung yang tidak merokok. Resiko terjadi event tertanggung dengan hasil medical test standard adalah 0.038 kali dari tertanggung dengan hasil medical test penyakit berat, resiko terjadi event tertanggung dengan hasil medical test penyakit ringan adalah 0.122 kali dari tertanggung dengan hasil medical test penyakit berat, dan resiko terjadi event tertanggung dengan hasil medical test penyakit sedang adalah 0.123 kali dari tertanggung dengan hasil medical test penyakit berat. Serta informasi tentang waktuwaktu di mana tertanggung akan banyak mengajukan klaim asuransi adalah pada waktu 2 t 6 bulan pertama. Kata kunci: Asuransi Jiwa, Cox Proportional Hazard Model, Survival Analysis.
v
ABSTRACT Insurance is one of term for the transfer of risk. The main function of insurance is as a transfer of risk from the insured to the insurer. Because that function, insurance company are required to determine the factors influencing and know the probability where at a certain time the insured will be many taking insurance claim. The right analysis for this problem is survival analysis by Cox Proportional Hazard Model method, because this analysis relates to someone survival situation and the time as main factor. Another factors are used in the Cox Proportional Hazard Model, that is Survival time is the time of the insured from start point until an event occurs or an end point, Status is insured condition whether the insured event occurs or until end point is not an event occurs, Age is age of the insured, Sex is sex of the insured, Smoking is smoking habits of the insured, and Medical Test is insured’s health condition. Eventually, Cox Proportional Hazard Model will provide information about the factors that influence the survival time statistically, that is Age, Smoking, and Medical Test variable. Comparison of survival probabilities between the different characteristics in the same factors that produced are, the risk of the insured event occurs by age t+1 is 1.168 times from the insured by age t. The risk of the insured event occurs by smoking habits is 2.407 times from the insured by not smoking habits. The risk of the insured event occurs by standard medical test result is 0.038 times from the insured by severe disease medical test result, the risk of the insured event ocuurs by lightly disease medical test result is 0.122 times from the insured by severe disease medical test result, and the risk of the insured event occurs by medium disease medical test result is 0.123 from the insured by severe disease medical test result. As well as information about the times where the insured will be many taking insurance claims are filed at the time 2 t 6 of the first month. Keywords: Cox Proportional Hazard Model, Life Insurance, Survival Analysis.
vi
KATA PENGANTAR بسم اهلل الر حمن الر حيم Seraya memanjatkan puji serta syukur hanya bagi Allah SWT. Tuhan semesta alam, yang mana dengan nikmat dan karunianya kita semua bisa merasakan nikmat dan indahnya kehidupan ini. Shalawat serta salam semoga selalu tercurahkan kepada junjungan kita, yaitu Nabi Muhammad SAW, beserta keluarga, sahabat, serta segenap pengikutnya sampai akhir zaman. Alhamdulillah hirobbil a’lamin penulis ucapkan karena berkat rahmat dan karunia-Nya penulis dapat menyelesaikan skripsi ini sebagai salah satu syarat untuk memperoleh gelar sarjana sains yang berjudul, “Aplikasi Cox Proportional Hazard Model di Asuransi Jiwa”. Dengan segala kerendahan hati, penulis menyadari bahwa dalam penulisan skripsi ini masih terdapat banyak kekurangan, dan penulis mencoba berikhtiar senantiasa memberikan semaksimal mungkin dengan harapan skripsi ini dapat memperoleh hasil yang lebih baik. Dalam kesempatan yang baik ini, perkenankan penulis menghaturkan ucapan Terima Kasih kepada: 1. Dr.Syopiansyah Jaya Putra, M.Sis. selaku Dekan Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta. 2. Yanne Irene, M.Si. selaku Ketua Program Studi Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta dan selaku penguji II. 3. Hermawan Setiawan, M.TI. selaku dosen pembimbing I yang telah menyediakan waktu dan senantiasa membimbing penulis dengan penuh kesabaran dalam mengambil tema, dan menjelaskan dasar-dasar teori sampai selesainya skripsi ini. 4. Suma’inna, M.Si. selaku dosen pembimbing II yang telah membimbing dalam penulisan skripsi ini dan memberikan banyak waktunya dalam menjelaskan berbagai penurunan rumus. vii
5. Sarini Abdullah, M.Stat. yang telah memberikan waktu di tengah kesibukannya untuk membimbing penulis dalam mempelajari dasar teori Survival Analysis. Mohon maaf jika penulis banyak merepotkan ibu dan semoga ilmu ibu bermanfaat. 6. Taufik Edy Sutanto, M.Sc.Tech. selaku penguji I. 7. Seluruh staff AJB Bumiputera, khususnya mas Audi dan mas Didik yang telah membantu penulis dalam memperoleh data. 8. Seluruh dosen dan staff Program Studi Matematika Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta, khususnya ka’ Bambang Ruswandi, M.Stat. yang telah banyak membantu dalam proses penyelesaian skripsi ini. 9. Kedua orang tuaku dan adik-adikku tercinta, yang senantiasa memberikan bantuan, dukungan dan doanya sehingga terselesaikannya skripsi ini. 10. Gadis ungilku, Anggraini yang telah banyak membantu, memberi dukungan dan mendoakan penulis. Susah, senang, panas, dan hujan kita lewati bersama agar terselesaikannya skripsi ini. Je t’aime. 11. Dan Seluruh teman-teman matematika, khsusunya matematika angakatan 2007, yang telah memberikan dukungan dan menerima saya selama 4 tahun ini sebagai teman kalian. Sukses semua. Kritik dan saran konstruktif sangat penulis harapkan berkaitan dengan penyusunan skripsi ini yang masih jauh dari kesempurnaan. Semoga kita semua senantiasa diridhoi dan mendapatkan rahmat dan hidayah-Nya serta selalu berada di jalan yang lurus. Amin.
Jakarta, Juni 2011
Penulis viii
DAFTAR ISI HALAMAN JUDUL ………………………………………………...
i
LEMBAR PENGESAHAN …………………………………………...
ii
PERNYATAAN ……………………………………………………….
iii
PERSEMBAHAN DAN MOTO ……………………………………...
iv
ABSTRAK …………………………………………………………….
v
ABSTRACT ……………………………………………………………
vi
KATA PENGANTAR ………………………………………………...
v ii
DAFTAR ISI …………………………………………………………..
ix
DAFTAR TABEL .……………………………………………………..
xi
DAFTAR GAMBAR .…………………………………………………..
xii
DAFTAR LAMPIRAN ………………………………………………..
xiii
BAB I. PENDAHULUAN 1.1. Latar Belakang ………..……………………………………
1
1.2. Permasalahan ……………………………………………….
3
1.3. Pembatasan Masalah .…………….………………………...
3
1.4. Tujuan Penulisan ………...…………………………………
4
1.5. Manfaat Penulisan ……...…………………………………..
4
BAB II. LANDASAN TEORI 2.1. Definisi Asuransi .………….………….……………………..
5
2.2. Dasar Teori Analysis Survival .……………………………….
6
ix
2.3. Survival Analysis .……………………………………………
10
2.4. Cluster Analysis .……………………………………………..
15
2.5. Penentuan Variabel …………………………………………..
16
BAB III. METODE PENELITIAN 3.1. Metode Pengumpulan Data …………………………………
17
3.2. Metode Pengolahan Data …………………………………...
19
3.3. Metode Analisis Data .……………………………………...
20
3.4. Alur Penelitian ……………………………………………….
25
BAB IV. HASIL DAN PEMBAHASAN 4.1. Deskripsi ………………….………………………………..
26
4.2. Pembuatan Persamaan ……………………………………...
28
4.3. Pengujian Kontribusi Peubah ……………………………….
28
4.4. Model Terbaik ………………………………………………
31
4.5. Estimasi Fungsi Survival ……………………………………
33
4.6. Pengelompokkan Data……………………………………….
35
BAB V. KESIMPULAN DAN SARAN 5.1. Kesimpulan …………………………………………………
38
5.2. Saran ……………………….………………………………..
39
DAFTAR PUSTAKA LAMPIRAN
x
DAFTAR TABEL Tabel 3.1. Nilai variabel dummy pada variabel Medical Test ……..…….
19
Tabel 4.1. Penyebaran pengamatan tiap karakteristik variabel …...……..
26
Tabel 4.2. Penyebaran pengamatan yang tersensor tiap karakteristik variabel …………………………...………………………….. Tabel 4.3. Proses
pemilihan
variabel
dalam
uji
peubah
27
ganda
menggunakan metode backward LR ...……………………….
29
Tabel 4.4. Nilai penduga parameter cox proportional hazard model ……
31
xi
DAFTAR GAMBAR Gambar 2.1. Contoh data sensor kanan …………..………………...……
12
Gambar 3.1. Alur Penelitian ………………..……………………...…….
25
Gambar 4.1. Estimasi fungsi survival berdasarkan variabel kebiasaan merokok ...…………………………………………...……..
33
Gambar 4.2. Estimasi fungsi survival berdasarkan variabel medical test..
34
xii
DAFTAR LAMPIRAN Lampiran 1. Iterasi Newton-Raphson .………………………………….
41
Lampiran 2. Contoh Sebagian Data Analisis ..………………………….
42
Lampiran 3. Deskripsi Variabel Usia …………………………………..
43
Lampiran 4. Output Uji Kontribusi Peubah …………………………….
44
Lampiran 5. Estimasi Fungsi Survival dan Cumulative Hazard ………...
45
Lampiran 6. Dendogram ………………………………………………..
46
Lampiran 7. Anggota Masing-masing Cluster …………………………
47
Lampiran 8. Estimasi Fungsi Survival pada Data Cluster ………………
53
xiii
BAB I PENDAHULUAN 1.1. Latar Belakang Asuransi merupakan suatu istilah yang dikenal sebagai pengalihan resiko. Sedangkan perusahaan asuransi merupakan suatu perusahaan yang bergerak dalam bidang mengatur pengelolaan resiko. Fungsi utama asuransi adalah sebagai pengalihan resiko yang diderita tertanggung kepada penanggungnya, tapi bukan berarti penanggung menanggung semua resiko tertanggung, melainkan sebagai imbalannya tertanggung harus membayarkan sejumlah uang yang disebut premi untuk biaya proteksi resiko yang mungkin akan menimpanya. Besar premi ditentukan pada saat perjanjian asuransi atau polis. Jenis-jenis asuransi beraneka ragam, salah satunya adalah asuransi jiwa, asuransi berkendaraan, asuransi kesehatan dan lain-lain. Walaupun banyak macam-macam asuransi, tetapi hanya terdapat sedikit perbedaan dalam jenis-jenis asuransi tersebut, tujuannya tetap satu yaitu sebagai pengalihan resiko. Dalam kasus ini yang akan dilibatkan dalam permasalahan penelitian hanyalah asuransi jiwa karena asuransi jiwa merupakan jenis asuransi untuk memproteksi jiwa seseorang dan berhubungan dengan ketahanan tubuh seseorang. Dalam memperhitungkan proteksi jiwa tersebut atau dengan kata lain memperhitungkan kapan seseorang akan meninggal diperlukan suatu analisis yang berhubungan dengan waktu, serta mampu mengetahui faktor-faktor yang mempengaruhi kematian tersebut.
1
Aktuaria merupakan salah satu bidang ilmu yang biasa memperhitungkan faktor-faktor
dalam
perhitungan
asuransi,
tetapi
aktuaria
tidak
bisa
memperkirakan seberapa besar resiko yang akan ditanggung perusahaan tersebut di masa yang akan datang, aktuaria hanya sebatas memperhitungkan faktor-faktor untuk menentukan berapa besar jumlah premi yang akan dibayarkan tertanggung. Analisis yang dapat memprediksi waktu kedepannya diperlukan untuk menjawab pertanyaan ini. Terdapat beberapa analisis yang dapat digunakan untuk memprediksi, yaitu regresi dan time series. Time series memang analisis yang berhubungan dengan waktu, tetapi time series tidak menggunakan waktu sebagai faktor utamanya. Jadi regresi yang paling tepat digunakan untuk permasalahan ini, tetapi bukan regresi linier biasa yang digunakan, tetapi regresi yang menjadikan waktu sebagai faktor utamanya, yaitu Regresi Cox atau yang lebih dikenal dengan Cox Proportional Hazard Model. Cox Proportional Hazard Model banyak digunakan dalam survival analysis karena memiliki keuntungan bersifat semiparametrik, sehingga tidak dibutuhkan
asumsi-asumsi
tertentu
dalam
melakukan
analisis
tersebut.
Keuntungan lainnya Cox Proportional Hazard Model tidak membutuhkan secara pasti dalam menentukan bentuk fungsi baseline hazard. Cox Proportional Hazard Model sangat sensitif terhadap waktu, sehingga harus jelas dalam penentuan waktunya. Terdapat tiga kategori dalam penentuan waktu, pertama adalah waktu mulai penelitian (start point), kedua adalah waktu berakhir penelitian (end point) dan waktu kejadian/meninggal tertanggung (event). Start point dalam penelitian ini adalah waktu tertanggung melakukan polis,
2
sedangkan event adalah saat tertanggung meninggal (mengajukan klaim) dan end point adalah waktu selesai penelitian. Faktor-faktor yang digunakan dalam Cox Proportional Hazard Model, yaitu survival time merupakan waktu tertanggung dari start point sampai terjadi event atau end point, status merupakan keadaan tertanggung apakah tertanggung terjadi event atau sampai end point tidak terjadi event, age merupakan umur tertanggung, sex merupakan jenis kelamin tertanggung, smoking merupakan kebiasaan merokok tertanggung, dan medical test merupakan keadaan kesehatan tertanggung. 1.2. Permasalahan Permasalahan yang diambil dalam penelitian ini adalah: 1. Faktor-faktor apa saja yang berpengaruh terhadap pengajuan klaim asuransi? 2. Berapakah perbandingan hazard terjadi pengajuan klaim antara variabel yang sama dengan kategori yang berbeda? 3. Pada selang waktu berapakah tertanggung-tertanggung akan mempunyai resiko terjadi pengajuan klaim paling besar? 1.3. Pembatasan Masalah Penelitian ini hanya akan membahas kasus asuransi jiwa kategori medical tahun 2009. Data yang digunakan penelitian ini berasal dari perusahaan Asuransi Bumiputera, datanya berupa data klaim, usia, jenis kelamin, kebiasaan merokok, dan tes kesehatan (medical test).
3
1.4. Tujuan Penelitian Tujuan penelitian adalah untuk mengetahui faktor-faktor apa saja yang berpengaruh dalam penentuan pengajuan klaim asuransi. Mulanya semua faktor yang dianggap penting dimasukkan dalam analisis, kemudian nantinya akan terlihat faktor-faktor apa saja yang berpengaruh secara statistik dalam penentuan klaim asuransi. Tujuan kedua adalah untuk merumuskan perhitungan secara matematika untuk memprediksi waktu kritis perusahaan dengan kata lain perusahaan akan menanggung banyak tanggungan karena tertanggung mengalami event, dan mengetahui pada waktu yang akan datang sebanyak apa probabilitas perusahaan akan memberikan kewajibannya menanggung resiko tertanggungnya. 1.5. Manfaat Penelitian Secara praktis, manfaat yang diperoleh dalam penelitian ini adalah jika terdapat seseorang yang baru melakukan polis, perusahaan asuransi dapat mengetahui termasuk kelompok tertanggung yang mana berdasarkan faktor-faktor tersebut dan dapat mengetahui waktu di mana perusahaan akan banyak tertanggung yang mengajukan klaim asuransi. Secara teori, manfaat yang diperoleh adalah survival analysis dapat diaplikasikan dalam bidang asuransi untuk mengetahui probabilitas waktu pengajuan klaim berdasarkan faktor-faktor yang mempengaruhi tertanggung satu dengan tertanggung lainnya.
4
BAB II LANDASAN TEORI 2.1. Definisi Asuransi Definisi asuransi menurut Pasal 246 Kitab Undang-undang Hukum Dagang (KUHD) Republik Indonesia, “Asuransi atau pertanggungan adalah suatu perjanjian, dengan mana seorang penanggung mengikatkan diri pada tertanggung dengan menerima suatu premi, untuk memberikan penggantian kepadanya karena suatu kerugian, kerusakan atau kehilangan keuntungan yang diharapkan, yang mungkin akan dideritanya karena suatu peristiwa yang tak tertentu.” Berdasarkan definisi tersebut, maka dalam asuransi terkandung 4 unsur, yaitu:
Pihak tertanggung (insured) yang berjanji untuk membayar uang premi kepada pihak penanggung, sekaligus atau pun bisa juga secara berangsurangsur
Pihak penanggung (insure) yang berjanji akan membayar sejumlah uang (santunan) kepada pihak tertanggung, sekaligus atau secara berangsurangsur apabila terjadi sesuatu yang mengandung unsur tak tertentu (meninggal)
Suatu
peristiwa
(accident)
yang
tak
tertentu
(tidak
diketahui
sebelumnya/tidak disengaja)
Kepentingan (interest) yang mungkin akan mengalami kerugian karena peristiwa yang tak tertentu [1].
5
2.2. Dasar Teori Analysis Survival 2.2.1. probability density function (pdf) dan cumulative density function (cdf) Misal variabel acak kontinu T didefinisikan sebagai waktu survival dan misalkan f (t ) merupakan probability density function (pdf), didefinisikan sebagai [2]: 1. f (t ) 0 , t R .
2.
f (t )dt 1 .
b
3. p(a t b) f (t )dt . a
sehingga diberikan F (t ) merupakan cdf dari persamaan tersebut: t
F (t ) P(T t ) f (u)du .
(2.1)
0
2.2.2. Fungsi Survival (Survival Function) Fungsi survival menyatakan sebagai suatu peluang ketahanan observasi yang diamati selama waktu t. Misal S (t ) adalah fungsi survival, didefinisikan sebagai berikut [4]: S (t ) P(T t ) .
(2.2)
dari persamaan (2.2) di atas diperoleh: S (t ) 1 P(T t ) 1 F (t )
(2.3)
dan diperoleh hubungan: f (t )
dS (t ) S '(t ) . dt
(2.4)
6
hal ini dapat ditunjukkan sebagai berikut [3]: f (t )
dF (t ) F (t t ) F (t ) lim t 0 dt t
lim
P(T t t ) P(T t ) [1 S (t t )] [1 S (t )] lim t 0 t t
lim
[ S (t t ) S (t )] dS (t ) S '(t ) . t dt
t 0
t 0
2.2.3. Fungsi Hazard (Hazard Function) Fungsi
hazard
menyatakan sebagai
perbandingan
rasio
peluang
kematian/kegagalan pada selang waktu antara t dan (t t ) . Misal h(t ) adalah Fungsi hazard yang didefinisikan sebagai berikut [4]: P(t T t t T t ) t 0 t
h(t ) lim
P(t T t t T t ) 1 . t 0 t P(T t )
lim
1 P(t T t t ) . lim P(T t ) t 0 t
1 P(T t t ) P(T t ) . lim t 0 P(T t ) t
1 dF (t ) f (t ) . . S (t ) dt S (t )
(2.5)
berdasarkan persamaan (2.5) dan (2.4) diperoleh hubungan: h(t )
S '(t ) S (t ) d ( ln S (t )) . dt
(2.6)
7
sehingga mempunyai fungsi cumulative hazard H (t ) : t
H (t ) h(u )du 0
d ( ln S (u)) du ln S (t ) . du 0 t
(2.7)
jika persamaan (2.7) ditransformasi dalam bentuk exponensial diperoleh: S (t ) exp(H (t )) .
(2.8)
2.2.4. Maximum Likelihood Estimation (MLE) Untuk menduga parameter model digunakan prosedur maximum likelihood estimation berdasarkan atas kemungkinan bersyarat dikenal dengan nama partial likelihood. Misal Li adalah likelihood dari kegagalan pada suatu waktu dalam himpunan Ri , di mana himpunan resiko pada waktu ti berisi individu-individu yang bertahan hidup hingga waktu ti disebut Ri {R(ti )} dengan i adalah spesifikasi waktu kegagalan sebanyak k waktu kegagalan. Perkalian peluang untuk setiap observasi waktu yang terjadi event membentuk persamaan kemungkinan L( ) yang hanya bergantung pada , sehingga didefinisikan sebagai berikut [5]: k
L( ) L1.L2 . ... .Lk Li i 1
dengan Li
h0 (t ) exp( i X i ) , sehingga diperoleh: h0 (t ) exp(i X l )
lRi
k
L( ) i 1
h0 (t ) exp( i X i ) . h0 (t ) exp(i X l )
(2.9)
lRi
8
Persamaan (2.9) disebut partial likelihood. Persamaan ini tidak bergantung pada h0 (t ) , karena untuk menduga parameter-parameter i di dalam model regresi cox tidak perlu mengetahui h0 (t ) , sehingga diperoleh: k
L( ) i 1
exp( i X i ) . exp(i X l )
(2.10)
lRi
Untuk mempermudah pencarian penduga kemungkinan maksimum L( ) , maka persamaan tersebut ditransformasi dalam bentuk ln menjadi ln( L( )) . Memaksimumkan ln( L( )) dengan cara menurunkannya terhadap , yaitu:
d lnL( ) 0 . d
(2.11)
Untuk kasus sederhana, perhitungan dapat dilakukan secara eksak, namun jika kasus sudah meliputi multivariable dan mempunyai data dalam cakupan besar, maka dilakukan perhitungan secara numerik dengan bantuan software dengan metode pemaksimuman yang digunakan adalah prosedur iterasi NewtonRaphson yang dapat dilihat pada lampiran 1. 2.2.5. Pengujian Kontribusi Peubah A. Uji peubah tunggal Uji peubah tunggal merupakan suatu uji yang dilakukan untuk mengetahui variabel-variabel apa saja yang berpengaruh terhadap model secara masingmasing terhadap model. Dengan mengasumsikan data berdistribusi normal baku atau Z-score, maka digunakan Uji Wald sebagai uji peubah tunggal dengan [5]: W
) SE (
.
(2.12)
9
di mana:
= koefisien penduga parameter ) = standard error penduga parameter . SE(
B. Uji peubah ganda Pengujian peubah ganda berkebalikkan dengan uji peubah tunggal, dalam pengujian peubah ganda dilakukan pengajuan kontribusi peubah secara bersamasama. Uji statistik yang digunakan adalah likelihood ratio (LR) dengan menggunakan log likelihood statistik. LR dikenal juga dengan nama uji ChiSquare ( 2 ) didefinisikan sebagai berikut [5]:
2 2lnLmr (2lnLm ) 2(lnLmr lnLm ) .
(2.13)
dengan: Lm = log likelihood statistik dengan m variabel
Lmr = log likelihood statistik dengan m variabel dan disisihkan sebanyak r variabel. 2.3. Survival Analysis 2.3.1. Definisi Survival Analysis Survival analysis adalah suatu metode yang berhubungan dengan waktu, mulai dari time origin atau start point sampai dengan terjadinya suatu kejadian khusus atau end point. Dengan kata lain, survival analysis memerlukan data yang merupakan waktu survival dari suatu individu. Dalam bidang asuransi jiwa data ini diperoleh dari suatu pengamatan terhadap sekelompok atau beberapa kelompok individu dan dalam hal ini adalah tertanggung pengguna jasa asuransi jiwa, yang diamati dan dicatat waktu terjadinya kegagalan (event) dari setiap
10
individu. Kegagalan yang dimaksudkan antara lain adalah ketika tertanggung meninggal atau mengajukan klaim dikarenakan tertanggung terkena suatu musibah, seperti sakit, kecelakaan atau terkena bencana alam, sehingga pihak perusahaan asuransi harus menanggung biaya klaim yang diajukan itu. Maka waktu survival yang dicatat antara lain sebagai berikut [4]: a. Selisih waktu mulai dilakukannya pengamatan sampai terjadinya pengajuan klaim, dengan kata lain tertanggung meninggal (event) dan data tersebut termasuk data tidak tersensor, b. Jika waktu pengajuan klaim tidak diketahui (tertanggung survive), maka memakai selisih waktu mulai dilakukannya pengamatan sampai waktu terakhir penelitian dan data tersebut termasuk data tersensor (censored data). Data tersensor merupakan data yang mendapatkan penyensoran karena sebab-sebab
tertentu.
Umumnya
terdapat
tiga
alasan
mengapa
terjadi
penyensoran, yaitu: 1.) Seseorang yang tidak terjadi event (meninggal) sampai end point, 2.) Seseorang yang informasinya tidak dapat diketahui kelanjutannya selama masa penelitian, 3.) Seseorang yang meninggal yang kematiannya karena alasan tertentu, karena narkoba, bunuh diri atau yang lainnya yang disengaja [5]. Data tersensor terbagi menjadi dua jenis, yaitu data tersensor kanan dan kiri. Data tersensor kanan merupakan tipe data umum dalam survival analysis. Penyensoran dilakukan ketika diketahui bahwa survival time melebihi suatu nilai tertentu atau akhir masa penelitian, dengan kata lain sampai akhir masa penelitian
11
tertanggung tidak mengalami event. Dalam penelitian ini data termasuk data tersensor kanan, penyensoran pada data tersensor kanan dilakukan karena tertanggung diketahui sampai batas waktu penelitian tidak mengalami event.
Gambar 2.1. Contoh data sensor kanan
Sedangkan yang dinamakan data tersensor kiri adalah data yang mengalami penyensoran saat waktu kejadian kurang dari suatu nilai tertentu. Contohnya adalah penelitian balita yang mampu berjalan pada usia satu tahun, maka data tersensornya adalah balita yang mampu berjalan sebelum usia satu tahun [3]. 2.3.2. Cox Proportional Hazard Model Ada beberapa teori yang pernah membahas tentang survival analysis yaitu di antaranya adalah Kaplan-meier dan Cox. Pada mulanya permodelan dari teori ini digunakan pada cabang ilmu kedokteran, di mana mereka menganalisis kematian atau harapan hidup seseorang, namun permodelan ini semakin berkembang dan digunakan dalam bidang-bidang lain. Setiap pengamatan dalam analisis ketahanan hidup dapat dituliskan
(ti , wi , X i ) , dengan i 1, 2,3,..., n dimana n adalah banyaknya pengamatan
12
ti (0, ~) adalah waktu seorang individu dapat bertahan dari penyakit hingga kejadian, sedangkan wi bernilai 1 apabila individu tersebut mengalami event (meninggal) sehingga mengajukan klaim pada waktu ti dan bernilai 0 apabila individu tersebut tersensor pada ti , X i merupakan variabel dari individu ke-i dimana X i [ X1 X 2 ... X ip ] dengan X ip berupa variabel dummy yang memiliki nilai 0 atau 1. Fungsi hazard yang bergantung pada variabel dapat ditulis sebagai berikut [5]: p
h(t , X ) h0 (t ).exp( i . X i )
(2.14)
i 1
dengan: h(t , X ) = resiko kematian individu pada waktu t dengan karakteristik X
h0 (t )
= fungsi hazard baku
i
= parameter variabel X i
Jika variabel
X1 X 2 ... X p 0 , maka fungsi hazard tersebut
merupakan fungsi baseline hazard atau hazard baku yang hanya bergantung pada waktu, sehingga diperoleh [5]:
h(t, X ) h0 (t ).exp(0)
h0 (t ) Membandingkan persamaan hazard (2.14) dengan variabel sama dan kategori berbeda yang bebas terhadap waktu t, maka diperoleh hazard ratio. Hazard ratio didefinisikan sebagai hazard untuk satu individu dibagi dengan hazard untuk satu individu lain [5]:
13
p
h(t , X *) HR h(t , X )
h0 (t ) exp( i X i *) i 1 p
h0 (t ) exp( i X i ) i 1
p
exp( i ( X i * X i ))
(2.15)
i 1
2.3.3. Estimasi Fungsi Survival Fungsi survival yang bergantung pada variabel adalah sebagai berikut [5]: p
S (t , X ) S0 (t )
exp(
i . X i ) i 1
dengan: S (t , X ) = kemungkinan
(2.16) survive individu
pada waktu t dengan
karakteristik X
S0 (t )
= fungsi survival
i
= parameter variabel X i
Umumnya estimasi fungsi survival menggunakan estimasi Kaplan-Meier yang disebut Product-Limit Estimator. Estimasi ini didefinisikan untuk semua nilai t pada data adalah sebagai berikut [6]: ,t ti ,t ti .
1 S 0 (t ) { di 1 Yi
(2.17)
ti t
dengan: ti = waktu terjadi event di = jumlah kematian pada waktu ti Yi = jumlah tertanggung yang beresiko terjadi event pada waktu ti. Estimasi
kumulatif
hazard
menggunakan
estimasi
Nelson-Aalen
didefinisikan sebagai berikut [6]:
0 (t ) 1 d H { i Yi
,t ti ,t ti .
(2.18)
ti t
14
2.4. Cluster Analysis Cluster analysis adalah suatu teknik untuk menggabungkan observasiobservasi ke dalam beberapa grup atau kelompok dengan: 1. Setiap grup atau kelompok merupakan kelompok yang homogen atau padat dengan karakter yang sama, 2. Setiap grup atau kelompok akan dibedakan dari grup lainnya dengan karakternya masing-masing [7]. Penelitian
ini
menggunakan
algoritma
K-Means
Cluster
dengan
menggunakan bantuan hierarchical clustering terlebih dahulu untuk mengetahui jumlah pengelompokkan yang sesuai dengan datanya. Langkah-langkah algoritma K-Means Cluster adalah seperti dibawah ini [8]: 1) Tentukan q sebagai jumlah cluster yang ingin dibentuk 2) Bangkitkan q centroids sebagai titik pusat cluster awal secara acak 3) Hitung jarak setiap data ke centroids dengan jarak Euclidean seperti dibawah ini: Dij
p
n
(d
i , j 1 k 1
ik
d jk ) 2
(2.19) dengan: Dij = jarak antara observasi i dan j
dik = observasi i pada variabel k
d jk = observasi j pada variabel k 4) Kelompokkan data berdasarkan jaraknya terhadap centroids
15
5) Tentukan posisi centroids baru dengan cara menghitung nilai rata-rata dari data yang mempunyai jarak centroids yang sama dengan:
Cq (
1 p n ) dik nq i 1 k 1
(2.20)
dengan: nq = jumlah data cluster ke-q 2.5. Penentuan variabel Umumnya faktor-faktor yang berperan dalam ilmu asuransi adalah [5]: 1. Usia Usia seseorang mempunyai kaitan langsung terhadap kesehatan, semakin tua tertanggung, maka akan semakin tinggi resiko terkena penyakit. 2. Jenis kelamin Jenis
kelamin
juga
mempengaruhi
kesehatan,
karena
pengalaman
menunjukan, secara rata-rata kehidupan wanita lebih lama lima atau enam tahun dari pada kehidupan pria. 3. Kebiasaan Kebiasaan hidup seseorang juga mempengaruhi kesehatannya. Misal kebiasaan merokok, makan berlebihan atau minum beralkohol akan mempunyai pengaruh besar terhadap kesehatan. Faktor-faktor di atas memang faktor pada umumnya yang berperan dalam asuransi, namun setiap perusahaan asuransi mempunyai faktor-faktor lain yang dianggap berperan terhadap perhitungan asuransi, salah satunya adalah medical test. Medical test adalah salah satu cara untuk mengetahui kesehatan tertanggung dengan menguji kesehatan tertanggung dengan cara medical.
16
BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Jenis data yang digunakan dalam penelitian ini adalah data sekunder tahun 2009 yang diperoleh dari Perusahaan Asuransi Bumiputera. Data yang dikumpulkan berupa hal-hal yang diperlukan dalam melakukan analisis, yaitu waktu klaim, umur, jenis kelamin, kebiasaan merokok, dan medical test. Pendefinisian masing-masing variabel adalah sebagai berikut: 1. Waktu klaim Data waktu klaim dihitung dalam skala bulan yang merupakan pengurangan antara waktu end point dengan waktu start point. Start point untuk data tersensor maupun event adalah waktu tertanggung terdaftar menjadi anggota asuransi, sedangkan untuk end point terdapat perbedaan antara data tersensor dan event. Untuk data tersensor waktu end point adalah waktu selesai penelitian dengan kata lain sampai berakhir masa penelitian tertanggung tidak terjadi event/meninggal, sebaliknya untuk data event waktu end point adalah waktu tertanggung terjadi event/meninggal. 2. Penyensoran Data penyensoran dapat diperoleh dengan melihat waktu pengajuan klaim. Jika tidak terdapat waktu pengajuan klaim diberi nilai 0, menyatakan bahwa data tersebut tersensor yang berarti tertanggung tidak mengajukan klaim, sebaliknya
17
jika terdapat waktu pengajuan klaim diberi nilai 1, menyatakan bahwa data tersebut terjadi event, dengan kata lain tertanggung meninggal. 3. Usia Data usia diukur dalam satuan tahun, dan diperoleh berdasarkan usia tertanggung pada saat masuk menjadi konsumen asuransi pada perusahaan tersebut. 4. Jenis kelamin Data jenis kelamin diperoleh dengan memberikan nilai 0 untuk tertanggung berjenis kelamin perempuan, dan diberi nilai 1 untuk tertanggung berjenis kelamin laki-laki. 5. Kebiasaan merokok Data kebiasaan merokok diperoleh dengan memberi nilai 0 jika tertanggung mempunyai kebiasaan tidak merokok dan diberi nilai 1 jika tertanggung mempunyai kebiasaan merokok. 6. Medical test Data medical test diperoleh dengan membentuk variabel dummy dengan variabel pembanding adalah tertanggung dengan kategori penyakit berat (SS5 & SS6). Kriterianya sebagai berikut, untuk dummy 1 bernilai 1 untuk kategori standard (STD) dan diberi nilai 0 untuk kategori penyakit ringan (SS1 & SS2), penyakit sedang (SS3 & SS4) maupun penyakit berat (SS5 & SS6). Dummy 2 bernilai 1 untuk kategori penyakit ringan (SS1 & SS2) dan diberi nilai 0 untuk kategori standard (STD), penyakit sedang (SS3 & SS4) maupun penyakit berat (SS5 & SS6). Dummy 3 bernilai 1 untuk kategori penyakit sedang (SS3 & SS4)
18
dan bernilai 0 untuk kategori standard (STD), penyakit ringan (SS1 & SS2), maupun penyakit berat (SS5 & SS6). Untuk jelasnya dapat dilihat pada tabel 3.1. di bawah ini: Tabel 3.1. Nilai variabel dummy pada variabel Medical_Test Variabel dummy MEDICAL_TEST dummy 1
dummy 2
dummy 3
Standard
1
0
0
Penyakit Ringan
0
1
0
Penyakit Sedang
0
0
1
Penyakit Berat
0
0
0
3.2. Metode Pengolahan Data Pengolahan data dalam penelitian ini menggunakan bantuan software dengan variabel dependen adalah Waktu klaim (Survt(Y)), penyensoran (Status), dan variabel-variabel independennya adalah usia (Age( X 1 )), jenis kelamin (Sex( X 2 )), kebiasaan merokok (Smoking( X 3 )), dummy 1 ( X 4.1 ), dummy 2 ( X 4.2 ), dan dummy 3 ( X 4.3 ). Uraian penelitian berupa, identifikasi variabel, pembuatan persamaan dengan mengasumsikan semua variabel berpengaruh terhadap model, uji kontribusi peubah untuk mengetahui variabel apa daja yang berpengaruh terhadap model dengan uji Wald dan uji Chi-Square, pembuatan model terbaik, estimasi fungsi survival dengan estimasi Kaplan-Meier dan fungsi kumulatif hazard dengan estimasi Nelson-Aalen, dan terakhir adalah pengelompokkan dengan cluster analysis untuk mempermudah interpretasi.
19
3.3. Metode Analisis Data Analisis data yang digunakan dalam penelitian ini adalah: 1. Deskripsi data Mendeskripsikan data bertujuan untuk menampilkan jumlah keseluruhan data, jumlah data tersensor untuk semua variabel maupun berdasarkan masingmasing variabel dan mengertahui persentase data tersensor. 2. Pembuatan persamaan Bentuk dasar cox proportional hazard model pada persamaan (2.14) adalah sebagai berikut: . X1 2 . X 2 ... p . X p
h(t, X ) h0 (t ).e 1
dengan menganggap semua variabel berpengaruh terhadap model, maka semua variabel dimasukkan ke dalam model, sehingga estimasi model menjadi:
h (t, X ) h0 (t ).e1. AGE2 .SEX 3 .SMOKING4.1.dummy14.2 .dummy 24.3 .dummy3 3. Pengujian kontribusi peubah Pengujian di sini berguna untuk mencari variabel yang berpengaruh terhadap model yang akan dibuat. Dalam hal ini terdapat dua analisis yang digunakan, yaitu analisis peubah tunggal dan analisis peubah ganda. Mula-mula
semua
variabel
diuji
secara
bersama-sama
dengan
menggunakan likelihood ratio (LR) atau dikenal dengan nama uji Chi-Square
( 2 ) . Tujuannya untuk mengetahui apakah semua variabel berpengaruh secara
20
bersama-sama terhadap model. Hipotesis dari pengujian tersebut adalah sebagai berikut [9]: H0: 1 2 ... 43 0 H1: i 0, i 1, 2,3, 4.1, 4.2, 4.3 dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai signifikan > 0.05, maka terima H0, kesimpulannya semua variabel tidak berpengaruh signifikan secara bersama-sama terhadap model. Dan jika nilai signifikan <0.05, maka tolak H0, kesimpulannya semua variabel berpengaruh signifikan secara bersama-sama terhadap model. Jika diketahui bahwa variabel-variabel tersebut tidak berpengaruh signifikan terhadap model, maka variabel-variabel tersebut tidak layak untuk dibentuk dalam model karena akan menghasilkan error yang besar dan tidak sesuai dengan keadaan data sebenarnya. Sebaliknya jika diketahui bahwa variabel-variabel tersebut berpengaruh signifikan terhadap model, maka variabelvariabel tersebut dilanjutkan dengan uji peubah tunggal. Analisis peubah tunggal menggunakan uji Wald dengan hipotesis sebagai berikut [9]: a. Usia/Age ( X 1 ) H0: 1 0 (variabel usia tidak berpengaruh signifikan terhadap model) H1: 1 0 (variabel usia berpengaruh signifikan terhadap model) dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai signifikan > 0.05, maka terima H0, kesimpulannya variabel usia tidak berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05, maka tolak H0, kesimpulannya variabel usia berpengaruh signifikan terhadap model.
21
b. Jenis kelamin/Sex ( X 2 ) H0: 2 0 (variabel jenis kelamin tidak berpengaruh signifikan terhadap model) H1: 2 0 (variabel jenis kelamin berpengaruh signifikan terhadap model) Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai signifikan > 0.05, maka terima H0, kesimpulannya variabel jenis kelamin tidak berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05, maka tolak H0, kesimpulannya variabel jenis kelamin berpengaruh signifikan terhadap pembentukkan model. c. Kebiasaan merokok/Smoking ( X 3 ) H0: 3 0 (variabel merokok tidak berpengaruh signifikan terhadap model) H1: 3 0 (variabel merokok berpengaruh signifikan terhadap model) Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai signifikan > 0.05, maka terima H0, kesimpulannya variabel kebiasaan merokok tidak berpengaruh signifikan terhadap model. Sebaliknya jika signifikan > 0.05, maka tolak H0, kesimpulannya variabel kebiasaan merokok berpengaruh signifikan terhadap model. d. Dummy1 ( X 4.1 ) H0: 4.1 0 (variabel dummy 1 tidak berpengaruh signifikan terhadap model) H1: 4.1 0 (variabel dummy 1 berpengaruh signifikan terhadap model) Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai signifikan > 0.05, maka terima H0, kesimpulannya variabel dummy 1 tidak berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05,
22
maka tolak H0, kesimpulannya variabel dummy 1 berpengaruh signifikan terhadap model. e. Dummy2 ( X 4.2 ) H0: 4.2 0 (variabel dummy 2 tidak berpengaruh signifikan terhadap model) H1: 4.2 0 (variabel dummy 2 berpengaruh signifikan terhadap model) Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai signifikan > 0.05, maka terima H0, kesimpulannya variabel dummy 2 tidak berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05, maka tolak H0, kesimpulannya variabel dummy 2 berpengaruh signifikan terhadap model. f. Dummy3 ( X 4.3 ) H0: 4.3 0 (variabel dummy 3 tidak berpengaruh signifikan terhadap model) H1: 4.3 0 (variabel dummy 3 berpengaruh signifikan terhadap model) Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai signifikan > 0.05, maka terima H0, kesimpulannya variabel dummy 3 tidak berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05, maka tolak H0, kesimpulannya variabel dummy 3 berpengaruh signifikan terhadap model. Variabel yang berpengaruh signifikan secara masing-masing terhadap model, maka akan dimasukkan kedalam model. Sedangkan variabel yang tidak berpengaruh secara masing-masing terhadap model, maka akan diabaikan.
23
4. Pembuatan model terbaik Pembuatan model terbaik dapat dilakukan setelah pengujian kontribusi peubah dilakukan. Hasil pengujian kontribusi peubah akan dapat memperlihatkan variabel apa saja yang berpengaruh signifikan dan tidak berpengaruh signifikan terhadap model. Dengan memasukkan variabel X1,..., X p ke dalam model, di mana
X1,..., X p merupakan variabel yang signifikan terhadap model. Dan membuang variabel yang tidak signifikan terhadap model, sehingga diperoleh cox proportional hazard model terbaik. 5. Estimasi Fungsi Survival Estimasi fungsi Survival tertanggung sampai waktu t dengan variabel X adalah [5]: p
exp( i . X i ) S (t , X ) S0 (t ) i0
(3.1)
Dari persamaan (3.1) terlihat bahwa untuk menduga S (t , X ) , maka S0 (t ) harus diduga terlebih dahulu dengan Product-Limit Estimator pada persamaan (2.17). 6. Pengelompokkan data Cluster analysis berperan untuk mengelompokkan semua probabilitas estimasi nilai survival untuk setiap kombinasi variabel yang digunakan. Jika semua variabel dimasukkan, maka akan menghasilkan kombinasi probabilitas estimasi nilai survival yang relatif banyak. Sehingga digunakan cluster analysis untuk mengelompokkan semua kombinasi tersebut ke dalam beberapa kelompok.
24
3.4. Alur Penelitian Tahapan analisis di atas untuk lebih jelasnya dapat dilihat pada alur dibawah ini:
Pengumpulan Data
Identifikasi Variabel
Tidak
Pembuatan Cox Proportional Hazard Model
Pengujian Kontribusi Variabel
Variabel Berpengaruh Terhadap Model
Ya
Pembuatan Cox Proportional Hazard Model Terbaik
Pengelompokkan Data
Interpretasi
Gambar 3.1. Alur Penelitian
25
BAB IV HASIL DAN PEMBAHASAN 4.1. Deskripsi Dari 2200 data tertanggung yang diperoleh, terdapat sebanyak 1.2% atau 26 tertanggung yang mengalami kematian dalam rentang waktu bulan Januari 2009 sampai bulan Februari 2011, dan terdapat 98.8% atau 2174 tertanggung yang masih menjadi tanggungan perusahaan tersebut. Dari data tersebut dideskripsikan berdasarkan karakteristiknya, untuk lebih jelas penyebaran pada tiap-tiap variabel dapat dilihat pada tabel 4.1. berikut ini: Tabel 4.1. Penyebaran pengamatan tiap karakteristik variabel Variabel
Karakteristik
Jumlah
Persentase
Laki-laki
1217
55.32%
Wanita
983
44.68%
Ya
86
3.91%
Tidak
2114
96.09%
Standard
1495
67.95%
Penyakit Ringan
599
27.23%
Penyakit Sedang
90
4.09%
Penyakit Berat
16
0.73%
Jenis kelamin
Merokok
Medical test
Ket: Variabel lainnya terdapat pada lampiran 3
Tabel 4.1. di atas menggambarkan observasi yang telah dilakukan. Sebanyak 55.32% tertanggung yang berjenis kelamin laki-laki dan sisanya 44.68% adalah tertanggung yang berjenis kelamin perempuan. Tertanggung yang mempunyai kebiasaan merokok adalah sebanyak 3.91% dan sebanyak 96.09% tertanggung
26
yang mempunyai kebiasaan tidak merokok. Tertanggung yang tidak mempunyai penyakit sebelumnya (Standard) adalah sebanyak 67.95%, tertanggung yang mempunyai penyakit kategori Penyakit Ringan sebanyak 27.23%, tertanggung yang mempunyai penyakit kategori Penyakit Sedang sebanyak 4.09% dan sisanya adalah tertanggung yang mempunyai penyakit Penyakit Berat sebanyak 0.73%. Untuk mengetahui penyebaran data tersensor, pada tabel 4.2. berikut ini menjelaskan berdasarkan karakteristik variabelnya: Tabel 4.2. Penyebaran pengamatan yang tersensor tiap karakteristik variabel Status Variabel
Karakteristik
Failur
Sensor
nf
%*
%**
ns
%*
%**
Laki-laki
15
57.69%
1.23%
1202
55.29%
98.77%
Wanita
11
42.31%
1.12%
972
44.71%
98.88%
Ya
2
7.69%
2.33%
84
3.86%
97.67%
Tidak
24
92.31%
1.14%
2090
96.14%
98.86%
17
65.38%
1.14%
1478
67.99%
98.86%
Penyakit Ringan 7
26.92%
1.17%
592
27.23%
98.83%
Penyakit Sedang 1
3.85%
1.11%
89
4.09%
98.89%
Penyakit Berat
3.85%
6.25%
15
0.69%
93.75%
Jenis kelamin
Merokok
Standard
Medical test
1
Ket: *: Persentase dalam variabel dan status yang sama berdasarkan karakteristik yang berbeda **: Persentase dalam variabel dan karakteristik yang sama berdasarkan status yang berbeda
Tabel 4.2. memperlihat penyebaran data tersensor untuk masing-masing variabel dan karakteristiknya. Terlihat bahwa persentase kematian laki-laki (57.69%) lebih tinggi dibandingkan persentase kematian perempuan (42.31%), hal ini berarti resiko kematian tertanggung berjenis kelamin laki-laki lebih besar dari pada
27
resiko tertanggung berjenis kelamin wanita. Untuk variabel medical test, jika dilihat dalam bentuk persentase per karakteristik memang tidak menarik perhatian, tetapi jika dilihat dalam bentuk persentase antara failure dan sensor, maka akan terlihat bahwa tertanggung yang mempunyai kategori penyakit berat dan tertanggung yang merokok mempunyai persentase yang lebih besar dibandingkan yang lainnya, yaitu berturut-turut sebesar 6.25% dan 2.33%, sedangkan yang lainnya hanya sekitar 1%. 4.2. Pembuatan Persamaan Pertama-tama dengan menganggap semua variabel berpengaruh terhadap model, maka semua variabel dimasukkan ke dalam persamaan (2.14), sehingga diperoleh estimasi cox proportional hazard model sebagai berikut:
h (t; X ) h 0 (t ).e0.155*AGE0.012*SEX 0.875*SMOKING2.219*dummy12.1*dummy 22.024dummy3 persamaan tersebut mempunyai nilai sign 0.078 dan berdasarkan likelihood ratio (LR) menghasilkan -2 log likelihood sebesar 377.668. Model ini mempunyai nilai signifikan > 0.05, berarti model ini tidak digunakan karena mempunyai nilai error lebih dari 5%. 4.3. Pengujian Kontribusi Peubah Uji peubah ganda merupakan langkah awal pengujian kontribusi peubah, selanjutnya jika terdapat variabel-variabel yang berpengaruh signifikan dalam pembentukkan model, maka langkah selanjutnya adalah melakukan pengujian variabel secara masing-masing dengan uji peubah tunggal.
28
Tabel 4.3. di bawah ini memperlihatkan proses pemilihan variabel dalam uji peubah ganda: Tabel 4.3. Proses pemilihan variabel dalam uji peubah ganda menggunakan metode backward LR Age
Sex
Smoking
Dummy 1 Dummy 2 Dummy 3
Step 1
√
√
√
√
√
Step 2
√
√
√
√
Step 3
√
√
Step 4
√
Step 5
√
Step 6
√
√
√
Sign
-2 Log Likelihood
√
0.078
377.668
Model 1
√
0.045
377.669
Model 2
0.033
380.239
Model 3
0.027
381.809
Model 4
0.048
378.73
Model 5
0.027
381.809
Model 4
√
Ket
Ket: √ variabel yang masuk model
Terdapat enam langkah dalam menentukan pengujian variabel secara bersama-sama. Metode yang digunakan adalah backward LR, mulanya semua variabel dimasukkan menghasilkan model 1 dengan nilai sign 0.078. Pada langkah ke-2 variabel jenis kelamin dikeluarkan dari model, sehingga menghasilkan model 2 dengan nilai sign 0.045. Pada langkah ke-3 variabel medical test dikeluarkan dari model, menghasilkan model 3 dengan nilai sign 0.033. Pada langkah ke-4 variabel kebiasaan merokok dikeluarkan dari model, menghasilkan model 4 dengan nilai sign 0.027. Pada langkah ke-5 memasukkan kembali variabel medical test ke dalam model, menghasilkan model 5 dengan nilai sign 0.048. dan langkah terakhir kembali mengeluarkan variabel medical test dari model, menghasilkan model yang sama seperti langkah ke-4. Terdapat 4 model dalam uji peubah ganda yang mempunyai nilai signifikan > 0.05, sehingga empat model tersebut mempunyai variabel yang berpengaruh secara bersama-sama terhadap model. Ke empat model itu adalah
29
model 2 dengan tiga variabel di dalamnya yang berpengaruh bersama-sama terhadap model, model 3 dengan dua variabel yang berpengaruh bersama-sama terhadap model, model 4 dengan satu variabel yang berpengaruh bersama-sama terhadap model, dan model 5 dengan dua variabel yang berpengaruh bersamasama terhadap model. Model yang paling signifikan dalam uji peubah ganda adalah model 4, tetapi hanya terdapat satu variabel yang berarti model ini hanya mewakili sebagian kecil variansi dari populasi data, dengan kata lain model ini banyak kehilangan informasi dari populasi data tersebut. Sedangkan model yang signifikan dan dianggap mewakili variansi populasi data adalah model 2 dengan tiga variabelnya, yaitu umur, kebiasaan merokok, dan medical test yang terdiri dari tiga variabel dummy menghasilkan -2 log likelihood 377.669. Terdapat tiga variabel dalam model 2 yang berpengaruh bersama-sama terhadap model secara statistika. Untuk mengetahui variabel tersebut berpengaruh secara masing-masing, maka variabel-variabel tersebut diuji dengan uji peubah tunggal menggunakan uji Wald. Pada lampiran 4 memperlihatkan bahwa variabel Age mempunyai nilai sign 0.023, Smoking mempunyai nilai sign 0.252, dummy 1 mempunyai nilai sign 0.038, dummy 2 mempunyai nilai sign 0.055, dan dummy 3 mempunyai nilai sign 0.158. Sehingga diketahui hanya terdapat dua variabel yang mempunyai nilai signifikan > 0.05, yaitu variabel Age dan dummy 1, yang berarti kedua variabel ini memang berpengaruh signifikan secara masing-masing terhadap pembentukkan model. Sisanya variabel Smoking, dummy 1, dan dummy 2 mempunyai signifikan > 0.05, dengan demikian ketiga variabel tersebut tidak berpengaruh signifikan secara masing-masing terhadap pembentukkan model.
30
4.4. Pembuatan Model Terbaik Terdapat 5 model yang dibentuk dalam uji peubah ganda dan terdapat 4 model yang signifikan. Model yang paling signifikan dalam uji peubah ganda adalah model 4, tetapi hanya terdapat satu variabel yang berpengaruh signifikan terhadap model, mengakibatkan model banyak kehilangan variansi dari populasi data, sehingga dipilih model 2 dengan tiga variabel yang berpengaruh signifikan terhadap model. Namun, setelah diuji secara masing-masing dengan uji peubah tunggal, hanya dua dari tiga variabel yang berpengaruh signifikan terhadap model, sisanya tidak berpengaruh signifikan terhadap model. Untuk lebih jelasnya dapat dilihat pada tabel 4.4. di bawah ini: Tabel 4.4. Nilai penduga parameter cox proportional hazard model β
exp(β)
Sign
Age
0.155
1.168
0.023
Smoking
0.878
2.407
0.252
Dummy 1
-2.221
0.108
0.038
Dummy 2
-2.102
0.122
0.055
Dummy 3
-2.024
0.132
0.158
Variabel
Model 2 tetap dipilih sebagai model terbaik yang mewakili populasi data, sehingga diperoleh cox proportional hazard model:
h(t; X ) h0 (t ).e0.155*AGE 0.878*SMOKING2.221*dummy12.102*dummy 22.024*dummy 3 dengan variabel Age adalah umur, Smoking adalah kebiasaan merokok, dummy 1, dummy 2, dan dummy 3 adalah variabel dummy dari medical test.
31
Nilai dugaan koefisien diperoleh variabel umur bernilai positif yang berarti tertanggung dengan usia t+1 akan mempunyai resiko terjadi event yang lebih besar dibandingkan tertanggung dengan usia t. Demikian juga untuk variabel merokok yang bernilai positif, tertanggung yang merokok mempunyai resiko terjadi event lebih besar dibandingkan tertanggung yang tidak merokok. Untuk tiga variabel terakhir, yaitu variabel dummy 1, 2 dan 3 mempunyai nilai dugaan koefisien negatif yang berarti jika tertanggung dengan hasil medical test standard, tertanggung kategori penyakit ringan dan tertanggung kategori penyakit sedang mempunyai resiko terjadi event lebih rendah dibandingkan tertanggung kategori penyakit berat. Hal ini dipertegas dengan menginterpretasikan nilai exp( ) . Resiko terjadi event tertanggung dengan usia t+1 adalah 1.168 kali dari tertanggung yang dengan usia t, sesuai dengan tabel mortalita yang menyatakan bahwa usia t+1 mempunyai kemungkinan kematian yang lebih besar dibandingkan dengan usia t. Untuk resiko terjadi event tertanggung yang merokok adalah 2.407 kali dari tertanggung yang tidak merokok, hal ini sesuai dengan yang kita ketahui bahwa merokok dapat merusak kesehatan paru-paru, jantung, dan penyakit lainnya. Sedangkan resiko terjadi event variabel dummy 1 adalah 0.038 kali dari variabel pembandingnya, resiko terjadi event variabel dummy 2 adalah 0.122 kali dari variabel pembandingnya, dan resiko terjadi event variabel dummy 3 adalah 0.123 kali dari variabel pembandingnya. Variabel pembandingnya adalah tertanggung kategori penyakit berat, terbukti dengan orang-orang yang
32
mempunyai penyakit kategori penyakit berat akan mempunyai kemungkinan meninggal lebih cepat dibandingkan tertanggung yang sehat atau berpenyakit kategori penyakit ringan. 4.5. Estimasi Fungsi Survival Estimasi fungsi survival menggunakan persamaan (2.17), sehingga diperoleh fungsi survival:
S (t, X ) S 0 (t )exp(0.155*AGE0.878*SMOKING2.221*dummy12.102*dummy 22.024*dummy3) dengan S 0 (t ) adalah estimasi fungsi survival dasar yang hanya dipengaruhi waktu dengan estimasi Kaplan-Meier, sehingga diperoleh estimasi S (t, X ) . Dibawah ini merupakan
gambar estimasi fungsi survival berdasarkan kebiasaan merokok
tertanggung dapat dilihat pada gambar di bawah ini:
Survival Function
SMOKING
1.000
Unsmoked Smoked
Cum Survival
0.995
0.990
0.985
0.980
0.975 0
5
10
15
20
25
30
SURVT
Gambar 4.1. Estimasi fungsi survival berdasarkan variabel kebiasaan merokok
Gambar 4.1. di atas merupakan estimasi fungsi survival yang dilihat berdasarkan kebiasaan merokok. Terlihat bahwa pada umumnya kemungkinan tertanggung yang tidak merokok untuk survive adalah relatif stabil, dibandingkan
33
tertanggung yang merokok. Hal ini memperkuat pernyataan sebelumnya bahwa kemungkinan terjadi event tertanggung yang merokok adalah 2.407 kali dari tertanggung yang tidak merokok. Untuk melihat estimasi fungsi survival berdasarkan medical test tertanggung dapat dilihat pada gambar di bawah ini:
Survival Function
MEDICAL_TEST
1.00
STD SS1&SS2 SS3&SS4
0.98
SS5&SS6
Cum Survival
0.96
0.94
0.92
0.90
0.88
0.86 0
5
10
15
20
25
30
SURVT
Gambar 4.2. Estimasi fungsi survival berdasarkan variabel medical test
Gambar 4.2. memperlihatkan bahwa kemungkinan tertanggung yang mempunyai hasil medical test tergolong kategori standard dan kategori penyakit ringan untuk survive adalah relatif stabil, dibandingkan tertanggung yang mempunyai hasil medical test tergolong kategori penyakit sedang dan kategori penyakit berat. Untuk tertanggung dengan kategori penyakit sedang perlu diperhatikan saat tertanggung memasuki waktu t = 25, sedangkan tertanggung dengan kategori penyakit berat perlu diperhatikan pada saat t = 10, hal ini dikarenakan pada titik-titik tersebut kemungkinan survive tertanggung menurun tajam, sehingga kemungkinan tertanggung untuk terjadi event pun meningkat.
34
4.5. Pengelompokkan Data Terdapat 384 (2x4x48) kombinasi estimasi nilai probabilitas survival karena terdapat 3 variabel yang mempengaruhinya, yaitu variabel age dengan kategori usia antara 15-62 tahun, variabel smoking dengan kategori merokok dan tidak merokok, dan terakhir adalah variabel medical test dengan kategori tertanggung dengan hasil medical test penyakit ringan, penyakit sedang dan penyakit berat. Sehingga diperlukan pengelompokkan data untuk mempermudah interpretasi data. Pertama-tama dilakukan hierarchical clustering untuk memperoleh pengelompokkan yang sesuai dengan data, pada dendogram lampiran 6 menunjukkan bahwa pengelompokkan 2 cluster merupakan pengelompokkan terbaik karena mempunyai jarak pengelompokkan terjauh dibandingkan kelompok cluster lainnya, jarak terjauh kedua adalah pada pengelompokkan 3 cluster. Sehingga dibentuk pengelompokkan 2 cluster dengan metode K-Means Cluster, namun setelah dibentuk 2 cluster terdapat kesulitan untuk memberi nama cluster karena dilihat dari cluster membership pengelompokkan yang dihasilkan masih belum spesifik. Sehingga dilakukan percobaan kedua dengan membentuk pengelompokkan menjadi 3 cluster, diperoleh pengelompokkan data dengan spesifikasi yang lebih jelas dibandingkan 2 cluster. Pada akhirnya dibentuklah 3 cluster dengan cluster 1 adalah tertanggung dengan nilai survival rata-rata yang tertinggi kedua pada setiap t, cluster 2 adalah tertanggung dengan nilai survival rata-rata yang tertinggi pada setiap t dan cluster 3 adalah tertanggung dengan nilai survival rata-rata yang terendah pada setiap t.
35
Cluster 1 diberi nama kelompok dengan pengajuan waktu klaim sedang, cluster 2 diberi nama kelompok tertanggung dengan pengajuan waktu klaim terpanjang, dan cluster 3 diberi nama kelompok tertanggung dengan pengajuan waktu klaim terpendek. Keanggotaan masing-masing cluster dapat dilihat pada lampiran 7. Kelompok tertanggung dengan pengajuan waktu klaim terpanjang mempunyai nilai probabilitas survival 90.32% untuk waktu satu tahun pertama, artinya sampai waktu satu tahun pertama terdapat kemungkinan 9.68% dari jumlah tertanggung yang terjadi event, sehingga jika terdapat 100 tertanggung, hanya 10 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan sampai waktu dua tahun pertama terdapat 85.26% tertanggung yang survive atau tidak terjadi event. Sehingga jika pada tahun pertama sudah terjadi 10 tertanggung yang terjadi event, tahun ke dua hanya terdapat 5 tertanggung yang berkemungkinan terjadi event. Kelompok tertanggung dengan pengajuan waktu klaim sedang mempunyai nilai probabilitas survival 51.17% untuk waktu delapan bulan pertama, artinya sampai waktu delapan bulan pertama terdapat kemungkinan hampir 50% atau tepatnya 48.83% dari tertanggung yang ada akan mengajukan klaim, sehingga jika terdapat 100 tertanggung, ada 49 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan sampai waktu dua tahun pertama terdapat kemungkinan 26.88% tertanggung yang survive atau tidak terjadi event. Sehingga jika pada tahun pertama sudah terjadi 49 tertanggung yang mengajukan klaim, pada tahun ke dua terdapat 24 tertanggung yang berkemungkinan mengajukan klaim.
36
Dan untuk kelompok tertanggung dengan pengajuan waktu klaim terpendek mempunyai nilai probabilitas survival 50.35% dalam waktu tiga bulan pertama, artinya sampai waktu tiga bulan pertama sudah terdapat kemungkinan 50% atau tepatnya 49.65% dari jumlah tertanggung yang akan mengajukan klaim, sehingga jika terdapat 100 tertanggung, ada 50 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan sampai waktu satu tahun pertama hanya mencapai kemungkinan sekitar 1% tertanggung yang survive atau tidak terjadi event. Sehingga pada tahun pertama saja kelompok tertanggung yang dikhawatirkan hanya mempunyai 1 tertanggung yang survive atau tidak mengajukan klaim (Lampiran 8).
37
BAB V KESIMPULAN DAN SARAN 5.1. Kesimpulan Terdapat tiga faktor yang berpengaruh signifikan terhadap model dengan taraf nyata 5%, yaitu usia, kebiasaan merokok dan tiga variabel dummy medical test, yaitu dummy 1 Standard, dummy 2 adalah penyakit ringan, dan dummy 3 adalah penyakit sedang. Perbandingan hazard faktor-faktor antar karakteristik yang berbeda yang dihasilkan adalah sebagai berikut: 1. Usia t+1 adalah 1.168 kali usia t, 2. Smoking adalah 2.407 kali unsmoking, 3. a. dummy 1 (Standard) adalah 0.038 kali penyakit berat, b. dummy 2 (penyakti ringan) adalah 0.122 kali penyakit berat, dan c. dummy 3 (penyakti ringan) adalah 0.123 kali penyakit berat. Pada grafik fungsi survival pada lampiran 8 terlihat bahwa ke tiga cluster mengalami penurunan relatif drastis pada waktu 2 t 6 bulan pertama dibanding pada waktu t lainnya. Sehingga perlu diperhatikan lagi untuk konsumen yang baru akan mengajukan perjanjian asuransi dengan karakteristiknya apakah akan termasuk tertanggung dengan pengajuan waktu klaim terpendek, sedang atau termasuk tertanggung dengan pengajuan waktu klaim terpanjang. Hal ini berguna agar perusahaan tidak mengalami kemunduran karena banyaknya tertanggung yang mengajukan klaim di awal-awal waktu.
38
5.2. Saran Penelitian selanjutnya dapat menambahkan faktor-faktor lain yang diduga berpengaruh terhadap terjadinya pengajuan klaim tertanggung, misalnya jenis pekerjaan, pembagian wilayah (urban, suburban dan plural) dan lainnya, serta dapat membahas analisis residual untuk membuktikan ketepatan estimasi dari model tersebut.
39
DAFTAR PUSTAKA [1]
Morton, G. Principles of Life and Health Insurance. LOMA. 1999.
[2]
Walpole, R. E. Pengantar Statistik. Jakarta: Gramedia Pustaka Utama. 1995.
[3]
Muthma’inna.
Perbandingan
Model
Cox
Proportional
Hazard
Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-paru yang Diperoleh
dari Contoh Data pada Software S-PLUS 2000 dan
Stimulasi untuk Distribusi Eksponensial dan Weibull). Jakarta: Skripsi UIN Syarif Hidayatullah Jakarta. 2007. [4]
Dobson, Annette. J. An introduction to generalized linear models. CRC. New York. 2002.
[5]
Kleinbaum, D. G. dan Klein, M. Survival analysis a self-learning text. Spinger. New York. 2005.
[6]
Klein, J. P. dan Moeschberger, M. L. Survival Analysis Techniques for Censored and Truncated Data. Spinger. New York. 1997.
[7]
Sharma Subhash. Applied Multivariate Techniques. John Wiley & Sons, Inc. USA. 1996.
[8]
Richard, A. Johnson. Applied Multivariate Statistical Analysis. New Jersey.
[9]
Agresti, A. An Introduction to Categorical Data Analysis. John Wiley & Sons, Inc. New York. 1996.
[10]
Mathews, H. John. Numerical Methods for Mathetatics Science, and Engineering. Prentice Hall, Inc. New Jersey. 1992.
40
DAFTAR RIWAYAT HIDUP
-----------------------------------------------------------
Data Pribadi
Nama
: Afief Aryadhani
NIM
: 107094000260
Tempat Tanggal Lahir
: Jakarta, 30 Maret 1989
Alamat Rumah
: Jl. K.H. Dewantoro. Komp Depkes Blok C2/2. Ciputat. Tangsel
Hp
: 081514170930
Email
:
[email protected]
Jenis Kelamin
: Laki-laki
----------------------------------------------------------Riwayat Pendidikan
1. S1
: Program
Studi
Matematika
Fakultas
Sains
dan
Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta, Tahun 20072011 2. SMA : SMA Negeri 1 Ciputat, Tahun 2004-2007 3. SMP : SMP Negeri 2 Ciputat, Tahun 2001-2004 4. SD : SD Negeri 4 Ciputat, Tahun 1995-2001 5. TK : TK An-Nur, Tahun 1994-1995
Lampiran 1 Iterasi Newton-Raphson Untuk fungsi kemungkinan L(1 , 2 ,..., i ) L( ) , di mana L( ) atau log L( ) mencapai maksimum dan memenuhi persamaan:
Ui ( )
log L( ) 0, i
i 1, 2,..., k
Misal U ( ) merupakan turunan pertama dari fungsi log-likelihood untuk menduga parameter . Misalkan 0 merupakan dugaan untuk , kemudian dilakukan ekspansi deret Taylor pada 0 , menghasilkan:
U ( ) U (0 ) G(0 )( 0 ) Dengan G ( ) merupakan turunan kedua dari fungsi log-likelihood, yaitu:
Gij ( )
2 log L( ) i j
) 0 , sehingga parameter pada iterasi ke (i+1) adalah: Karena memenuhi U (
i 1 i G 1 ( i )u( i ) ,
i 1, 2,..., k
Prosedur iterasi dimulai dengan memperoleh dugaan awal 0 0 , kemudian menghitung
U ( 0 )
dan
G( 0 )
untuk
memperoleh
dugaan
1
dari
1 0 G1 (0 )u(0 ) , dan berhenti ketika perubahan fungsi log-likelihood relatif kecil atau ketika U (i ) mendekati 0 [10].
41
Lampiran 2 Contoh Sebagian Data Analisis No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Usia Th 2009 Jumlah Rokok/Hari Jenis Kelamin Cek Medical 15 0 L STD 16 0 L STD 16 0 L STD 16 0 L STD 17 0 L SS1 17 0 P STD 18 0 L STD 18 0 L SS2 19 0 P STD 19 0 L STD 19 0 P STD 19 0 L STD 19 0 L STD 20 0 L STD 20 0 L STD 21 0 L STD 21 8 L SS1 21 0 L STD 21 0 P STD 21 0 P STD 22 0 L SS1 22 0 P STD 22 0 L SS1 23 0 P SS1 23 0 P STD 23 0 L SS1 23 0 P STD 23 0 P STD 23 0 P STD 23 0 P SS1 23 0 L STD 24 0 L SS1 24 0 P STD 24 0 P STD 24 0 P STD 24 0 P STD 24 0 L STD 24 0 P STD 24 0 L STD … … … …
Polis Data Klaim 5/12/2009 11/11/2009 8/19/2009 2/24/2009 5/29/2009 1/30/2009 5/25/2009 7/31/2009 3/6/2009 1/12/2009 6/18/2009 10/23/2009 8/31/2009 12/22/2009 1/5/2009 3/31/2009 5/26/2009 1/21/2009 3/30/2009 3/30/2009 5/24/2009 4/15/2009 9/10/2009 4/1/2009 7/27/2009 6/29/2009 5/1/2009 5/1/2009 1/23/2009 12/16/2009 1/5/2009 6/26/2009 11/17/2009 3/25/2009 7/30/2009 12/7/2009 11/26/2009 4/30/2009 7/27/2009 … …
42
Lampiran 3 Deskripsi Variabel Usia Case Processing Summary
AGE_TH 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 Overall
Total N 1 3 2 2 5 2 5 3 8 9 3 4 10 4 9 8 7 11 7 12 16 14 17 15 14 28 24 11 17 24 8 15 13 10 5 6 40 29 51 420 455 293 219 137 102 79 15 8 2200
N of Events 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 7 2 3 5 3 1 3 0 0 26
Censored Percent 1 100.0% 3 100.0% 2 100.0% 2 100.0% 5 100.0% 2 100.0% 5 100.0% 3 100.0% 8 100.0% 9 100.0% 3 100.0% 4 100.0% 10 100.0% 4 100.0% 9 100.0% 8 100.0% 7 100.0% 11 100.0% 7 100.0% 12 100.0% 16 100.0% 14 100.0% 17 100.0% 15 100.0% 14 100.0% 28 100.0% 24 100.0% 11 100.0% 17 100.0% 24 100.0% 8 100.0% 15 100.0% 13 100.0% 10 100.0% 5 100.0% 6 100.0% 40 100.0% 27 93.1% 51 100.0% 413 98.3% 453 99.6% 290 99.0% 214 97.7% 134 97.8% 101 99.0% 76 96.2% 15 100.0% 8 100.0% 2174 98.8%
N
43
Lampiran 4 Output Uji Kontribusi Peubah Omnibus Tests of Model Coefficientsg,h
Step 1a 2b 3c 4d 5e 6f
-2 Log Likelihood 377.668 377.669 380.239 381.809 378.730 381.809
Chi-square 11.342 11.342 6.823 4.861 9.589 4.861
Overall (score) df 6 5 2 1 4 1
Sig. .078 .045 .033 .027 .048 .027
Change From Previous Step Chi-square df Sig. 12.750 6 .047 .001 1 .977 2.571 3 .463 1.570 1 .210 3.079 3 .380 3.079 3 .380
Change From Previous Block Chi-square df Sig. 12.750 6 .047 12.749 5 .026 10.178 2 .006 8.609 1 .003 11.688 4 .020 8.609 1 .003
a. Variable(s) Entered at Step Number 1: X1 X2 X3 X4 b. Variable Removed at Step Number 2: X2 c. Variable Removed at Step Number 3: X4 d. Variable Removed at Step Number 4: X3 e. Variable(s) Entered at Step Number 5: X4 f. Variable Removed at Step Number 6: X4 g. Beginning Block Number 0, initial Log Likelihood function: -2 Log likelihood: 390.418 h. Beginning Block Number 1. Method = Backward Stepwise (Likelihood Ratio)
Variables in the Equation B Step 1
Step 2
Step 3 Step 4 Step 5
Step 6
X1 X2 X3 X4 X4(1) X4(2) X4(3) X1 X3 X4 X4(1) X4(2) X4(3) X1 X3 X1 X1 X4 X4(1) X4(2) X4(3) X1
.155 .012 .875
SE .068 .405 .773
-2.219 -2.100 -2.024 .155 .878
1.074 1.098 1.434 .068 .766
-2.221 -2.102 -2.024 .148 1.068 .146 .157
1.071 1.096 1.434 .068 .740 .068 .069
-2.454 -2.294 -2.228 .146
1.043 1.079 1.418 .068
Wald 5.193 .001 1.284 4.271 4.266 3.657 1.992 5.193 1.314 4.310 4.303 3.678 1.992 4.785 2.084 4.613 5.215 5.547 5.541 4.522 2.467 4.613
df 1 1 1 3 1 1 1 1 1 3 1 1 1 1 1 1 1 3 1 1 1 1
Sig. .023 .977 .257 .234 .039 .056 .158 .023 .252 .230 .038 .055 .158 .029 .149 .032 .022 .136 .019 .033 .116 .032
Exp(B) 1.168 1.012 2.400 .109 .122 .132 1.168 2.407 .108 .122 .132 1.159 2.911 1.157 1.170 .086 .101 .108 1.157
44
Lampiran 5 Estimasi Fungsi Survival dan Cumulative Hazard Ŝ(t) 1.00000 0.99955 0.99864 0.99773 0.99455 0.99409 0.99273 0.99227 0.99182 0.99136 0.99088 0.99036 0.98980 0.98919 0.98819 0.98696
Time (t) 0≤t<2 2≤t<3 3≤t<4 4≤t<6 6≤t<7 7≤t<8 8≤t<10 10≤t<11 11≤t<14 14≤t<15 15≤t<16 16≤t<17 17≤t<18 18≤t<21 21≤t<22 22≤t<25
Ĥ(t) 0.00000 0.00045 0.00136 0.00227 0.00546 0.00592 0.00729 0.00775 0.00821 0.00867 0.00915 0.00968 0.01025 0.01086 0.01187 0.01311
Log Survival Function
Survival Function
0.000
Censored
Log Survival
-0.005
-0.010
-0.015
-0.020 0
5
10
15
20
25
SURVT
Hazard Function
Survival Function
0.020
Censored
Cum Hazard
0.015
0.010
0.005
0.000 0
5
10
15
20
25
SURVT
45
Lampiran 6 Dendogram * * * H I E R A R C H I C A L
C L U S T E R
A N A L Y S I S * * *
Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E Label Num
0 5 10 15 20 25 +---------+---------+---------+---------+---------+
373 366 356 355 241 323 270 291 97 174 211 190 227 129 85 145 252 215 243 177 275 222 259 1 20 84 107 41 163 195
46
Lampiran 7 No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Cluster 3 Cluster 2 Cluster 1 No. No. Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test 32 Ya P.Berat 1 15 Tidak P.Berat 1 18 Ya P.Berat 33 Ya P.Berat 2 15 Tidak Standar 2 19 Ya P.Berat 34 Ya P.Berat 3 15 Tidak P.Ringan 3 20 Ya P.Berat 35 Ya P.Berat 4 15 Tidak P.Sedang 4 21 Ya P.Berat 36 Ya P.Berat 5 15 Ya P.Berat 5 22 Ya P.Berat 37 Tidak P.Berat 6 15 Ya Standar 6 23 Ya P.Berat 37 Ya P.Berat 7 15 Ya P.Ringan 7 24 Tidak P.Berat 38 Tidak P.Berat 8 15 Ya P.Sedang 8 24 Ya P.Berat 38 Ya P.Berat 9 16 Tidak P.Berat 9 25 Tidak P.Berat 39 Tidak P.Berat 10 16 Tidak Standar 10 25 Ya P.Berat 39 Ya P.Berat 11 16 Tidak P.Ringan 11 26 Tidak P.Berat 40 Tidak P.Berat 12 16 Tidak P.Sedang 12 26 Ya P.Berat 40 Ya P.Berat 13 16 Ya P.Berat 13 27 Tidak P.Berat 41 Tidak P.Berat 14 16 Ya Standar 14 27 Ya P.Berat 41 Ya P.Berat 15 16 Ya P.Ringan 15 28 Tidak P.Berat 42 Tidak P.Berat 16 16 Ya P.Sedang 16 28 Ya P.Berat 42 Ya P.Berat 17 17 Tidak P.Berat 17 29 Tidak P.Berat 43 Tidak P.Berat 18 17 Tidak Standar 18 29 Ya P.Berat 43 Ya P.Berat 19 17 Tidak P.Ringan 19 30 Tidak P.Berat 44 Tidak P.Berat 20 17 Tidak P.Sedang 20 30 Ya P.Berat 44 Ya P.Berat 21 17 Ya P.Berat 21 31 Tidak P.Berat 45 Tidak P.Berat 22 17 Ya Standar 22 31 Ya P.Berat 45 Ya P.Berat 23 17 Ya P.Ringan 23 31 Ya P.Sedang
47
No. 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
Cluster 3 Cluster 2 Cluster 1 No. No. Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test 45 Ya P.Ringan 24 17 Ya P.Sedang 24 32 Tidak P.Berat 45 Ya P.Sedang 25 18 Tidak P.Berat 25 32 Ya P.Ringan 46 Tidak P.Berat 26 18 Tidak Standar 26 32 Ya P.Sedang 46 Ya P.Berat 27 18 Tidak P.Ringan 27 33 Tidak P.Berat 46 Ya Standar 28 18 Tidak P.Sedang 28 33 Ya Standar 46 Ya P.Ringan 29 18 Ya Standar 29 33 Ya P.Ringan 46 Ya P.Sedang 30 18 Ya P.Ringan 30 33 Ya P.Sedang 47 Tidak P.Berat 31 18 Ya P.Sedang 31 34 Tidak P.Berat 47 Ya P.Berat 32 19 Tidak P.Berat 32 34 Ya Standar 47 Ya Standar 33 19 Tidak Standar 33 34 Ya P.Ringan 47 Ya P.Ringan 34 19 Tidak P.Ringan 34 34 Ya P.Sedang 47 Ya P.Sedang 35 19 Tidak P.Sedang 35 35 Tidak P.Berat 48 Tidak P.Berat 36 19 Ya Standar 36 35 Ya Standar 48 Ya P.Berat 37 19 Ya P.Ringan 37 35 Ya P.Ringan 48 Ya Standar 38 19 Ya P.Sedang 38 35 Ya P.Sedang 48 Ya P.Ringan 39 20 Tidak P.Berat 39 36 Tidak P.Berat 48 Ya P.Sedang 40 20 Tidak Standar 40 36 Ya Standar 49 Tidak P.Berat 41 20 Tidak P.Ringan 41 36 Ya P.Ringan 49 Ya P.Berat 42 20 Tidak P.Sedang 42 36 Ya P.Sedang 49 Ya Standar 43 20 Ya Standar 43 37 Tidak P.Sedang 49 Ya P.Ringan 44 20 Ya P.Ringan 44 37 Ya Standar 49 Ya P.Sedang 45 20 Ya P.Sedang 45 37 Ya P.Ringan 50 Tidak P.Berat 46 21 Tidak P.Berat 46 37 Ya P.Sedang 50 Tidak P.Sedang 47 21 Tidak Standar 47 38 Tidak Standar 50 Ya P.Berat 48 21 Tidak P.Ringan 48 38 Tidak P.Ringan
48
No. 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73
Cluster 3 Cluster 2 Cluster 1 No. No. Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test 50 Ya Standar 49 21 Tidak P.Sedang 49 38 Tidak P.Sedang 50 Ya P.Ringan 50 21 Ya Standar 50 38 Ya Standar 50 Ya P.Sedang 51 21 Ya P.Ringan 51 38 Ya P.Ringan 51 Tidak P.Berat 52 21 Ya P.Sedang 52 38 Ya P.Sedang 51 Tidak P.Ringan 53 22 Tidak P.Berat 53 39 Tidak Standar 51 Tidak P.Sedang 54 22 Tidak Standar 54 39 Tidak P.Ringan 51 Ya P.Berat 55 22 Tidak P.Ringan 55 39 Tidak P.Sedang 51 Ya Standar 56 22 Tidak P.Sedang 56 39 Ya Standar 51 Ya P.Ringan 57 22 Ya Standar 57 39 Ya P.Ringan 51 Ya P.Sedang 58 22 Ya P.Ringan 58 39 Ya P.Sedang 52 Tidak P.Berat 59 22 Ya P.Sedang 59 40 Tidak Standar 52 Tidak Standar 60 23 Tidak P.Berat 60 40 Tidak P.Ringan 52 Tidak P.Ringan 61 23 Tidak Standar 61 40 Tidak P.Sedang 52 Tidak P.Sedang 62 23 Tidak P.Ringan 62 40 Ya Standar 52 Ya P.Berat 63 23 Tidak P.Sedang 63 40 Ya P.Ringan 52 Ya Standar 64 23 Ya Standar 64 40 Ya P.Sedang 52 Ya P.Ringan 65 23 Ya P.Ringan 65 41 Tidak Standar 52 Ya P.Sedang 66 23 Ya P.Sedang 66 41 Tidak P.Ringan 53 Tidak P.Berat 67 24 Tidak Standar 67 41 Tidak P.Sedang 53 Tidak Standar 68 24 Tidak P.Ringan 68 41 Ya Standar 53 Tidak P.Ringan 69 24 Tidak P.Sedang 69 41 Ya P.Ringan 53 Tidak P.Sedang 70 24 Ya Standar 70 41 Ya P.Sedang 53 Ya P.Berat 71 24 Ya P.Ringan 71 42 Tidak Standar 53 Ya Standar 72 24 Ya P.Sedang 72 42 Tidak P.Ringan 53 Ya P.Ringan 73 25 Tidak Standar 73 42 Tidak P.Sedang
49
No. 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98
Cluster 3 Cluster 2 Cluster 1 No. No. Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test 53 Ya P.Sedang 74 25 Tidak P.Ringan 74 42 Ya Standar 54 Tidak P.Berat 75 25 Tidak P.Sedang 75 42 Ya P.Ringan 54 Tidak Standar 76 25 Ya Standar 76 42 Ya P.Sedang 54 Tidak P.Ringan 77 25 Ya P.Ringan 77 43 Tidak Standar 54 Tidak P.Sedang 78 25 Ya P.Sedang 78 43 Tidak P.Ringan 54 Ya P.Berat 79 26 Tidak Standar 79 43 Tidak P.Sedang 54 Ya Standar 80 26 Tidak P.Ringan 80 43 Ya Standar 54 Ya P.Ringan 81 26 Tidak P.Sedang 81 43 Ya P.Ringan 54 Ya P.Sedang 82 26 Ya Standar 82 43 Ya P.Sedang 55 Tidak P.Berat 83 26 Ya P.Ringan 83 44 Tidak Standar 55 Tidak Standar 84 26 Ya P.Sedang 84 44 Tidak P.Ringan 55 Tidak P.Ringan 85 27 Tidak Standar 85 44 Tidak P.Sedang 55 Tidak P.Sedang 86 27 Tidak P.Ringan 86 44 Ya Standar 55 Ya P.Berat 87 27 Tidak P.Sedang 87 44 Ya P.Ringan 55 Ya Standar 88 27 Ya Standar 88 44 Ya P.Sedang 55 Ya P.Ringan 89 27 Ya P.Ringan 89 45 Tidak Standar 55 Ya P.Sedang 90 27 Ya P.Sedang 90 45 Tidak P.Ringan 56 Tidak P.Berat 91 28 Tidak Standar 91 45 Tidak P.Sedang 56 Tidak Standar 92 28 Tidak P.Ringan 92 45 Ya Standar 56 Tidak P.Ringan 93 28 Tidak P.Sedang 93 46 Tidak Standar 56 Tidak P.Sedang 94 28 Ya Standar 94 46 Tidak P.Ringan 56 Ya P.Berat 95 28 Ya P.Ringan 95 46 Tidak P.Sedang 56 Ya Standar 96 28 Ya P.Sedang 96 47 Tidak Standar 56 Ya P.Ringan 97 29 Tidak Standar 97 47 Tidak P.Ringan 56 Ya P.Sedang 98 29 Tidak P.Ringan 98 47 Tidak P.Sedang
50
No. 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123
Cluster 3 Cluster 2 Cluster 1 No. No. Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test 57 Tidak P.Berat 99 29 Tidak P.Sedang 99 48 Tidak Standar 57 Tidak Standar 100 29 Ya Standar 100 48 Tidak P.Ringan 57 Tidak P.Ringan 101 29 Ya P.Ringan 101 48 Tidak P.Sedang 57 Tidak P.Sedang 102 29 Ya P.Sedang 102 49 Tidak Standar 57 Ya P.Berat 103 30 Tidak Standar 103 49 Tidak P.Ringan 57 Ya Standar 104 30 Tidak P.Ringan 104 49 Tidak P.Sedang 57 Ya P.Ringan 105 30 Tidak P.Sedang 105 50 Tidak Standar 57 Ya P.Sedang 106 30 Ya Standar 106 50 Tidak P.Ringan 58 Tidak P.Berat 107 30 Ya P.Ringan 107 51 Tidak Standar 58 Tidak Standar 108 30 Ya P.Sedang 58 Tidak P.Ringan 109 31 Tidak Standar 58 Tidak P.Sedang 110 31 Tidak P.Ringan 58 Ya P.Berat 111 31 Tidak P.Sedang 58 Ya Standar 112 31 Ya Standar 58 Ya P.Ringan 113 31 Ya P.Ringan 58 Ya P.Sedang 114 32 Tidak Standar 59 Tidak P.Berat 115 32 Tidak P.Ringan 59 Tidak Standar 116 32 Tidak P.Sedang 59 Tidak P.Ringan 117 32 Ya Standar 59 Tidak P.Sedang 118 33 Tidak Standar 59 Ya P.Berat 119 33 Tidak P.Ringan 59 Ya Standar 120 33 Tidak P.Sedang 59 Ya P.Ringan 121 34 Tidak Standar 59 Ya P.Sedang 122 34 Tidak P.Ringan 60 Tidak P.Berat 123 34 Tidak P.Sedang
51
No. 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146
Cluster 3 Cluster 2 Cluster 1 No. No. Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test 60 Tidak Standar 124 35 Tidak Standar 60 Tidak P.Ringan 125 35 Tidak P.Ringan 60 Tidak P.Sedang 126 35 Tidak P.Sedang 60 Ya P.Berat 127 36 Tidak Standar 60 Ya Standar 128 36 Tidak P.Ringan 60 Ya P.Ringan 129 36 Tidak P.Sedang 60 Ya P.Sedang 130 37 Tidak Standar 61 Tidak P.Berat 131 37 Tidak P.Ringan 61 Tidak Standar 61 Tidak P.Ringan 61 Tidak P.Sedang 61 Ya P.Berat 61 Ya Standar 61 Ya P.Ringan 61 Ya P.Sedang 62 Tidak P.Berat 62 Tidak Standar 62 Tidak P.Ringan 62 Tidak P.Sedang 62 Ya P.Berat 62 Ya Standar 62 Ya P.Ringan 62 Ya P.Sedang
52
Lampiran 8 Estimasi Fungsi Survival pada Data Cluster
53