ANALISIS SURVIVAL DALAM MEMODELKAN SELANG KELAHIRAN ANAK PERTAMA DI INDONESIA
RAHMAT HIDAYAT
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA* Dengan ini saya menyatakan bahwa tesis berjudul Analisis Survival dalam Memodelkan Selang Kelahiran Anak Pertama di Indonesia adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juli 2014 Rahmat Hidayat NIM G551120131
RINGKASAN RAHMAT HIDAYAT. Analisis survival dalam memodelkan selang kelahiran anak pertama di Indonesia. Dibimbing oleh HADI SUMARNO dan ENDAR HASAFAH NUGRAHANI. Banyak hal yang terjadi dalam kehidupan kita yang berkaitan dengan waktu. Waktu dari awal pengamatan sampai terjadinya suatu peristiwa yang dianggap menarik disebut dengan waktu survival. Salah satu contoh data survival adalah selang kelahiran anak pertama. Selang kelahiran anak pertama didefinisikan sebagai selisih antara umur pernikahan dan umur kelahiran anak pertama. Pada kenyataannya panjang selang kelahiran anak pertama dari tiap wanita menikah tidaklah sama. Berdasarkan penelitian yang ada, selang kelahiran anak pertama ditentukan oleh berbagai faktor sosial dan budaya, seperti tempat tinggal, tingkat pendidikan, umur perkawinan, status bekerja, serta faktor fisiologi. Sebagian wanita menikah telah melahirkan anak pertama beberapa bulan setelah perkawinan sehingga data yang diperoleh merupakan data lengkap, namun sebagian lainnya belum mempunyai anak pertama sehingga data yang diperoleh berupa data tersensor. Menganalisis data yang mengandung data tersensor menggunakan metode biasa akan menimbulkan bias, sehingga untuk mengurangi bias tersebut diperlukan suatu metode tertentu, yang disebut analisis survival. Berdasarkan hal tersebut di atas, maka penelitian ini bertujuan menentukan metode analisis terbaik bagi data selang kelahiran anak pertama, dan mempelajari faktor-faktor yang dominan mempengaruhi selang kelahiran anak pertama. Penelitian ini dilakukan dalam dua langkah, langkah pertama melakukan analisis terhadap perilaku model yang biasa digunakan dalam analisis survival. Untuk melihat perilaku model ini digunakan salah satu tekhnik residual dalam analisis survival yaitu residual Cox-Snell. Untuk melihat perilaku model ini digunakan data survival berdistribusi eksponensial dan Weibull yang kemudian dimanipulasi dengan penambahan error. Langkah kedua adalah menggunakan hasil pada langkah pertama untuk memodelkan data selang kelahiran anak pertama di Indonesia. Hasil penelitian menunjukkan bahwa metode Cox proporsinal hazard cukup handal dalam memodelkan suatu data survival, sehingga data tentang selang kelahiran anak pertama di Indonesia dimodelkan dengan metode Cox proporsional hazard. Untuk menguji apakah metode ini memang cocok untuk memodelkan data selang kelahiran anak pertama di Indonesia dilakukan uji terhadap asumsi proporsional terhadap setiap kovariat yang digunakan. Hasil uji menunjukkan bahwa salah satu kovariat yang diteliti tidak memenuhi asumsi proporsional, yaitu kovariat umur pernikahan, sehingga data kembali dimodelkan dengan menggunakan metode Cox extended. Hasil menunjukkan bahwa peubah tempat tinggal, lulus SD, lulus SMP, lulus SMA, dan umur pernikahan merupakan peubah yang berpengaruh nyata terhadap risiko individu melahirkan anak pertama. Dari nilai hazard ratio terlihat bahwa individu yang bertempat tinggal di kota memiliki risiko melahirkan anak pertama lebih kecil dibandingkan individu yang bertempat tinggal di desa sebesar 0.719 kali, serta riwayat pendidikan individu yang lulus SD, lulus SMP, dan lulus SMA atau lebih akan menaikkan risiko melahirkan anak pertama berturut-turut sebesar 1.730, 2.648, 4.235 kalinya
individu yang memiliki riwayat pendidikan rendah atau tidak lulus SD. Setiap penambahan usia pernikahan sebesar satu tahun maka akan meningkatkan risiko melahirkan anak pertama sebesar 7.1% dengan tingkat penurunan yang semakin mengecil pada t yang meningkat.
Kata kunci: sensor, analisis survival, Cox proporsional hazard, Cox extended
SUMMARY RAHMAT HIDAYAT. Survival Analysis Modeling of Birth Interval of The First Child in Indonesia. Supervised by HADI SUMARNO and ENDAR HASAFAH NUGRAHANI. Many things happen in our lives that relates to time. The time from the beginning of the observation until the occurrence of an event that is considered attractive is called the survival time. First birth interval is one of an example of survival data. First birth interval is defined as the difference in the age of marriage and age group should first child's birth. In fact the first birth interval length of each married woman is not the same. Based on existing research, the first birth interval is determined by a variety of social and cultural factors such as: place of residence, education level, marital age, working status and physiological factors. Most married women has given birth to her first child a few months after the marriage so that the data obtained is the complete data, but others do not have a first child so that the data obtained in the form of data censored. To analyze the data contain censored data using ordinary methods would lead to bias, so as to reduce the bias that required a certain method survival analysis. Based on the above, this study aims to determine the best method for the analysis of the first birth interval data, and study the dominant factors affecting the birth of her first child intervals. The research method used is a literature study, the first step to analyze the behavior of the model used in survival analysis. To see the behavior of this model is one of the techniques used in the survival analysis residual namely Cox-Snell residuals. To see the behavior of the model used exponentially distributed survival data and weibul are then manipulated by the addition of an error. The second step is to use the results of the first step to model the interval data first child in Indonesia. The results showed that the method of Cox hazard proporsinal quite reliable in modeling the survival data. Because this method is considered to be quite reliable, the data on the first birth interval in Indonesia modeled by Cox proportional hazard method. To test whether this method is suitable for modeling the data interval first child in Indonesia is carried out to test the assumption of proportional to each covariate were used. The test results showed that one of the covariates under study did not meet the proportional assumption that the covariates of age, so that the data re-modeled using the extended Cox method. The results showed that the variables residence, finished elementary school, junior high school graduation, high school graduation, and age are variables that significantly affect an individual's risk first child. Hazard ratio of values seen that individuals who reside in the city are at risk first child less than individuals who reside in the village by 0.719 times, and the history of education of individuals who graduated from elementary school, junior high school graduate, and graduated from high school or more will increase the risk of giving birth the first child in a row at 1.730, 2.648, 4.235 time individuals who have a history of low education or elementary school. Each additional year of age will increase the risk of having a first child at 7.1% with a much smaller rate of decline is increasing at t,
after about several years of age enhancement will reduce the risk of marriage first child was 3.8%.
Keywords: sensors, survival analysis, Cox proportional hazards, Cox extended
© Hak Cipta Milik IPB, Tahun 2014 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB
ANALISIS SURVIVAL DALAM MEMODELKAN SELANG KELAHIRAN ANAK PERTAMA DI INDONESIA
RAHMAT HIDAYAT
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Matematika Terapan
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. I Gusti Putu Purnaba, DEA
Judul Tesis : Analisis Survival dalam Memodelkan Selang Kelahiran Anak Pertama di Indonesia Nama : Rahmat Hidayat NIM : G551120131
Disetujui oleh Komisi Pembimbing
Dr Ir Hadi Sumarno, MS Ketua
Dr Ir Endar H. Nugrahni, MS Anggota
Diketahui oleh
Ketua Program Studi Matematika Terapan
Dekan Sekolah Pascasarjana
Dr Jaharuddin, MS
Dr. Ir. Dahrul Syah, MScAgr
Tanggal Ujian: (19 Juni 2014)
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Nopember 2013 ini ialah analisis survival, dengan judul Analisis Survival dalam Memodelkan Selang Kelahiran Anak Pertama di Indonesia. Penulisan tesis ini merupakan salah satu syarat memperoleh gelar Magister Sains pada program studi Matematika Terapan Sekolah Pascasarjana Institut Pertanian Bogor. Penulis menyadari bahwa bantuan-bantuan dan arahan-arahan dari kedua pembimbing sangat membantu dalam menyelesaikan karya tulis ini. Terima kasih penulis ucapkan kepada Bapak Dr. Ir. Hadi Sumarno, MS selaku pembimbing I dan Ibu Dr. Ir. Endar Hasafah Nugrahani, MS selaku pembimbing II. Penulis juga menyampaikan terima kasih kepada: 1. Prof Dr Ir Herry Suhardiyanto, MSc selaku Rektor Institut Pertanian Bogor. 2. Dr Ir Dahrul Syah, MSc Agr selaku Dekan Sekolah Pascasarjana Institut Pertanian Bogor. 3. Dr Jaharuddin selaku Ketua Program Studi Matematika Terapan sekaligus sebagai Pembimbing II. 4. Dr. Ir. I Gusti Putu Purnaba, DEA selaku penguji luar komisi pembimbing. 5. Seluruh dosen dan staf pegawai tata usaha Departemen Matematika. 6. Direktorat Jenderal Pendidikan Tinggi (DIKTI) sebagai sponsor Beasiswa Unggulan. 7. Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN). 8. Orang tua, saudara dan seluruh keluarga yang selalu memberikan dorongan dan mendoakan untuk keberhasilan studi bagi penulis. 9. Seluruh mahasiswa Departemen Matematika khususnya teman-teman angkatan tahun 2012 di program studi S2 Matematika Terapan. 10. Sahabat-sahabat yang tak dapat disebutkan satu persatu yang telah banyak membantu penulis dalam penyelesaian tesis ini. Semoga segala bantuan, bimbingan, dan motivasi yang telah diberikan kepada penulis senantiasa mendapat balasan dari Allah Subhanahu wa ta’ala. Akhirnya, semoga penulisan tesis ini dapat memperkaya pengalaman belajar serta wawasan kita semua. Bogor, Juli 2014 Rahmat Hidayat
DAFTAR ISI DAFTAR TABEL
vii
DAFTAR GAMBAR
vii
1 PENDAHULUAN Latar Belakang Perumusan Masalah Tujuan Penelitian Manfaat Penelitian
1 1 1 1 2
2 TINJAUAN PUSTAKA Data Survival Jenis-Jenis Penyensoran pada Data Survival Fungsi Survival Fungsi Kepekatan Peluang Fungsi Hazard Fungsi Likelihood Akaikes Information Criterion(AIC) Uji Hipotesis Interval Kelahiran Anak Pertama Sebaran Eksponensial Model Eksponensial dengan Penyertaan Kovariat Distribusi Weibull Model Weibull dengan Penyertaan Kovariat Model Cox Proporsional Hazard Simulasi
2 2 2 3 3 3 4 4 4 5 5 6 7 7 7 8
3 METODE Data Definisi Operasional
8 8 8
4 HASIL DAN PEMBAHASAN Analisis Perilaku Model Proses Simulasi Data Survival Weibull Analisis Selang Kelahiran Anak Pertama di Indonesia Model Cox Proporsional Hazard dan Cox Extended Pendugaan Parameter Hazard Ratio Hasil Analisis Interpretasi
9 9 10 13 15 16 16 18 19 22
5 SIMPULAN Simpulan
22 22
DAFTAR PUSTAKA
24
RIWAYAT HIDUP
26
DAFTAR TABEL Pendugaan parameter dengan metode parametrik ekponensial dan Cox proporsional hazard Pendugaan parameter dengan metode parametrik Weibull dan Cox proporsional hazard Hasil uji logrank untuk melihat perbedaan tingkat survival kelahiran anak pertama kovariat tempat tinggal Pendugaan parameter, nilai-p, dan hazard ratio dengan menggunakan model Cox proporsional hazard Korelasi dan nilai-p peubah penjelas Nilai AIC model Pendugaan parameter, nilai-p, dan hazard ratio dengan menggunakan model Cox extended
12 15 20 20 21 21 21
DAFTAR GAMBAR Grafik residual Cox-Snell untuk data survival eksponensial tanpa penambahan error dengan model analisis survival parametrik Grafik residual Cox-Snell untuk data survival eksponensial tanpa penambahan error dengan model analisis survival Cox proporsional hazard. Grafik residual Cox-Snell untuk data survival eksponensial dengan penambahan error dengan model analisis survival parametrik Grafik residual Cox-Snell untuk data survival eksponensial dengan penambahan error dengan model analisis survival Cox proporsional hazard. Grafik perbandingan MSE dari model eksponensial dan Cox proporsional hazard Grafik residual Cox-Snell untuk data survival Weibull tanpa penambahan error dengan model analisis survival parametrik Grafik residual Cox-Snell untuk data survival Weibull tanpa penambahan error dengan model analisis survival Cox proporsional hazard. Grafik residual Cox-Snell untuk data survival Weibull dengan penambahan error dengan model analisis survival parametrik Grafik residual Cox-Snell untuk data survival Weibull dengan penambahan error dengan model analisis survival Cox proporsional hazard. Grafik perbandingan MSE dari model Weibull dan Cox proporsional hazard Fungsi survival metode Kaplan-Meier untuk peubah bebas daerah tempat tinggal
11 11
11 11
12 13 13
14 14
14 19
1 PENDAHULUAN Latar Belakang Hasil sensus penduduk menunjukkan bahwa jumlah penduduk Indonesia adalah 237,6 juta jiwa tahun 2010. Angka tersebut menempatkan Indonesia pada urutan keempat dari negara yang berpenduduk paling besar di dunia setelah Republik Rakyat Cina, India, dan Amerika Serikat. Tidak hanya di Indonesia, di berbagai negara di dunia menganggap bahwa masalah kepadatan penduduk merupakan masalah yang harus ditangani karena akan memberikan dampak negatif bagi negara itu sendiri. Dalam demografi ada tiga hal yang sangat berpengaruh, yaitu kematian (mortality), perpindahan (migration), dan kelahiran (fertility). Selang kelahiran anak pertama dapat digunakan sebagai salah satu indikator dari fertilitas. Interval kelahiran anak pertama adalah selisih antara umur perkawinan dengan umur kelahiran anak pertama. Pada kenyataannya panjang selang kelahiran anak pertama dari tiap wanita menikah tidaklah sama. Berdasarkan penelitian yang ada, interval kelahiran anak pertama ditentukan oleh berbagai faktor sosial dan budaya serta faktor fisiologi. Menurut Ibrohim (1994) ada beberapa faktor yang mempengaruhi selang kelahiran anak pertama antar lain daerah tempat tinggal, tingkat pendidikan, umur, pengetahuan tentang alat kontrasepsi dan status bekerja. Sebagian wanita menikah telah melahirkan anak pertama beberapa bulan setelah perkawinan sehingga data yang diperoleh merupakan data lengkap, namun sebagian lainnya belum mempunyai anak yakni data tersensor. Dengan demikian selang kelahiran anak pertama merupakan salah satu contoh dari data survival. Data survival adalah data tentang pengamatan jangka waktu dari awal pengamatan sampai terjadinya sesuatu peristiwa. Ciri khas dari data survival adalah survival time (waktu bertahan hidup) seringkali tidak dapat diamati secara lengkap (tersensor). Jika semua kejadian yang diharapkan terjadi, dan dapat diamati secara utuh maka beberapa metode analisis bisa dilakuakan, namun data survival bersifat sensor (Clark et al. 2003).
Perumusan Masalah Menganalisis data survival menggunakan metode biasa tidak cocok karena akan menimbulkan bias. Untuk mengurangi bias tersebut diperlukan suatu metode tertentu untuk menganalisisnya, yaitu analisis survival.
Tujuan Penelitian Oleh karena itu, tujuan dari penelitian ini adalah untuk memodelkan selang kelahiran anak pertama di Indonesia dengan menggunakan analisis survival serta menganalisis faktor-faktor apa saja yang mempengaruhi selang kelahiran anak pertama di Indonesia.
2 Manfaat Penelitian 1. Bagi keilmuan, dapat menyumbangkan suatu model interval kelahiran anak pertama di Indonesia 2. Bagi pengambil kebijakan seperti BKKBN, sebagai bahan pertimbangan dalam menentukan prioritas kebijakan yang akan diambil.
2 TINJAUAN PUSTAKA Data Survival Data survival adalah data tentang pengamatan jangka waktu dari awal pengamatan sampai dengan terjadinya suatu peristiwa, peristiwa itu dapat berupa kematian, respon, timbul gejala, dan lain-lain. Data survival dapat diamati secara lengkap (data tidak tersensor) dan tidak lengkap (data tersensor) (Lee dan Wang 2003). Data survival digunakan untuk mempelajari waktu survival seorang pasien atau waktu survival binatang percobaan. Namun seiring dengan kemajuan pengetahuan, data survival banyak diaplikasikan dalam dunia industri dan dunia bisnis. Beberapa contoh analisis survival data non-medical adalah kegagalan atau kerusakan komponen mesin, lama bertahannya baterai laptop, dan waktu seseorang setelah lulus untuk mendapat pekerjaan. Allison (2010) menyatakan bahwa beberapa penelitian menganggap analisis data survival semata-mata menggunakan dua metode statistika konvensional, asumsi tersebut benar jika waktu survival dari semua subjek diketahui secara pasti, meskipun pada kenyataanya tidak. Sehingga membutuhkan tekhnik statistik yang baru. Salah satu pengembangan dari tekhnik tersebut yaitu ketika objek amatan tidak bisa diamat secara utuh, karena adanya individu yang hilang ataupun dengan alasan lain, sehingga tidak dapat diambil datanya atau sampai akhir pengamatan individu tersebut belum mengalami peristiwa. Jika berada dalam kondisi sebaliknya maka disebut data tidak tersensor.
Jenis-Jenis Penyensoran pada Data Survival Ada tiga macam penyensoran yang sering digunakan dalam eksperimen waktu survival, yaitu sebagai berikut: 1. Sampel lengkap (tidak tersensor), jika semua komponen yang diuji telah mati atau gagal, maka eksperimen akan dihentikan. 2. Sensor tipe I, semua objek yang diteliti (n) masuk pengujian dalam waktu yang bersamaan, dan pengujian akan dihentikan setelah batas waktu yang ditentukan. 3. Sensor tipe II, semua objek yang diteliti (n) masuk pengujian dalam waktu yang bersamaan, dan pengujian dihentikan setelah mendapatkan objek di antaranya gagal atau mati dengan (Collet 1994).
3 Fungsi Survival Fungsi survival adalah peluang individu dapat bertahan hingga atau lebih dari waktu t yang didefinisikan sebagai berikut: ( ) ( ) ( ) ( ) ( ) Fungsi survival juga adalah integral fungsi Dimana ( ) kepekatan peluang ( ) ( ) ( ) ∫ ( ) .
Fungsi Kepekatan Peluang Fungsi kepekatan peluang didefinisikan sebagai limit dari peluang individu mengalami kejadian dalam interval t sampai . (
( )
)
Fungsi Hazard Fungsi hazard yaitu fungsi yang menyatakan peluang seseorang mengalami risiko atau kejadian seperti kegagalan atau meninggal pada waktu t dengan syarat bahwa seseorang itu telah bertahan hingga waktu t, fungsinya diberikan Cox pada tahun 1972: ( ) ( ) . Dari definisi di atas diperoleh hubungan antara fungsi survival dengan fungsi hazard. Dengan menggunakan definisi peluang bersyarat, diperoleh: (
( )
)
( .
( )
) (
( ) ( ) ( ) ( )
(
)
)
/
( ) ( ) ( )
( )
Persamaan di atas diintegralkan dari 0 sampai t dengan S(0)=1 yaitu ∫ ( )
( )
4 ( )
,
( ) ( ) ( )- (Collet 2003).
Fungsi Likelihood Misalkan adalah peubah acak yang saling bebas dari sebaran yang mempunyai fungsi kepekatan peluang ( ) dengan parameter . Fungsi ) ( ) ( ) likelihood adalah fungsi kepekatan peluang bersama ( yang merupakan fungsi dari yang dinotasikan dengan ( ) ( ) ( ) ( ) ∏ (
)
Penduga yang memaksimumkan fungsi likelihood dapat dicari dengan menentukan solusi dari persamaan ( ) ∑
(
)
Akaikes Information Criterion(AIC) AIC merupakan salah satu ukuran untuk pemilihan model regresi terbaik yang diperkenalkan oleh Hirotugu Akaike pada tahun 1973. Metode tersebut didasarkan pada maximum likelihood estimation (Latif et al. 2008), dengan persamaan ̂ ̂ dengan merupakan fungsi likelihood, q jumlah parameter , dan konstanta yang ditentukan. Nilai α yang sering digunakan yaitu antara 2 dan 6 (Collet 2003).
Uji Hipotesis Uji hipotesis adalah suatu aturan yang digunakan untuk menerima atau menolak suatu hipotesis dari hasil amatan yang diperoleh. Hipotesa mengenai populasi yang akan kita terima kebenarannya sampai ada bukti untuk menolaknya dinamakan hipotesis nol (null hypotesis, H0). Apabila hipotesis ini ditolak kebenarannya, maka ada hipotesis lain yang kita anggap benar, yaitu hipotesis tandingan (Alternatife hypotesis, H1). Dalam peumusan H1 dikenal dua macam hipotesis yaitu: a. Hipotesis eka arah 1. 2. b. Hipotesis dwi arah Untuk menolak atau menerima hipotesis nol maka terlebih dahulu ditentukan taraf nyata . Taraf nyata adalah peluang menolak hipotesis nol saat
5 hipotesis nol benar. Hipotesis ditolak pada saat berada di daerah kritis yang disebut sebagai daerah penolakan H0 (Hogg dan Craig 1995).
Interval Kelahiran Anak Pertama Interval kelahiran anak pertama adalah selisih antara umur kelahiran anak pertama (L) dengan umur perkawinan pertama (K), yaitu L-K.
Sebaran Eksponensial Peneliti biasanya memilih sebaran eksponensial untuk model data survival karena metode statistiknya sederhana. Distribusi exponensial ditandai dengan fungsi hazard yang konstan ( ) Fungsi kepekatan peluang dan fungsi survival-nya adalah ( ) ( ) ( ) ( ) (Lawless 2002) Semakin besar nilai menyebabkan risiko yang tinggi dan waktu survival yang singkat. Sebaliknya semakin kecil nilai menyebabkan risiko yang kecil dan waktu survival-nya panjang. Sifat-sifat distribusi eksponensial: ( ) 1. ( ) ∫ dimana
Bukti: ( )
(
∫
)
(
* (
) )
(
(
∫ ( ∫
))
( )
2.
( ) Bukti:
(
)
( ) ∫
( ( )) (
) (
∫
( ( )) )
(
) (
)
( )
) +
6 [
0
3.
(
∫
)
(
.
] )
∫
(
)
(
)
0
.
(
)
∫
[
(
(
)
)]
∫
(
)
( )
(
)
(
)
/1
/1
Bukti: ( )
∫ (
∫
(
[
4.
( )
( )
(
)
( )
(
)
) )]
(
)
(
)
(
)
( ) , nilai hazard konstan.
Model Eksponensial dengan Penyertaan Kovariat Waktu survival dapat dianalisis dengan menggunakan accelerated failure time (AFT) model. Dalam waktu survival model ini mengasumsikan bahwa hubungan logaritma dari waktu survival T dan kovariat adalah linear dan dapat ditulis ∑ dengan , j=1,2,...,p adalah kovariat, koefisien adalah parameter skala dan adalah error. Love et al. 2003 menjelaskan bahwa untuk penyertaan kovariat dalam distribusi eksponensial, kita menggunakan persamaan di atas dan menggunakan sehingga diperoleh ∑
7 ∑ dengan . T adalah distribusi eksponensial dengan fungsi hazard, fungsi kepekatan, dan fungsi survival berturut-turut ( ) ∑ [ ( )] ( ) ( ) ( ) ( ) ( )
Distribusi Weibull Sebaran ( ) ( ) ( ) hazard
Weibull memiliki fungsi kepekatan peluang ( ) ( ) memiliki fungsi survival ( ) dan fungsi ( )
Model Weibull dengan Penyertaan Kovariat Model Weibull dengan penyertaan kovaraiat memiliki fungsi hazard, fungsi kepekatan, dan fungsi survival berturut-turut ( ) ( ) ( ) . ( ) ( ) ( ) ( ( )( ) ( ) ( ( )( ) )
Model Cox Proporsional Hazard Cox dan Oakes (1984) menyatakan dalam analisis data survival, metode paramatrik digunakan apabila bentuk distribusi survival-nya diketahui. Meskipun demikian dalam prakteknya bentuk pasti dari distribusinya kadang tidak diketahui dan kita mungkin tidak menemukan model yang tepat. Oleh karena itu, menggunakan metode parametrik untuk melakukan analisis terhadap data survival sangat terbatas, sehingga dikembangkan model baru untuk menangani hal tersebut. Model Cox proporsional hazard adalah model yang biasa digunakan. Model ini tidak memerlukan pengetahuan tentang bentuk distribusi. Cox proporsional hazard adalah model yang biasa digunakan untuk pendekatan multivariat untuk analisis data (Brandburn et al. 2003). Model ini memiliki ciri bahwa individu yang berbeda memiliki fungsi hazard yang proporsional yakni , ( ) ( )- , rasio fungsi hazard dari dua individu dengan penyertaan kovariat ( ) dan ( ) adalah konstan. Ini artinya bahwa rasio dari resiko kegagalan dari dua individu adalah sama tidak bergantung pada seberapa lama mereka bertahan. Cox (1972) menjelaskan bahwa bentuk umum dari model Cox proportional hazard adalah: ( ) ( ) ( ). dengan adalah kovariat, tetapi ia tidak membuat asumsi tentang bentuk dari ( ) yang disebut dengan baseline fungsi hazard karena itu adalah nilai dari fungsi hazard saat Ketika menggunakan kovariat * +
8 dimasukkan ke dalam baseline fungsi hazard . Fungsi hazard untuk beberapa pasangan kovariat yang berbeda dan dapat dibandingkan dengan menggunakan hazard rasio. * + HR = ( ) * + { ( )} .
Simulasi Dalam penelitian ini simulasi dilakukan dengan membangkitkan data yang berdistribusi eksponensial dan Weibull dengan menggunakan software statistik untuk melihat model mana yang sesuai untuk memodelkan data tersebut.
3 METODE Data Data yang digunakan dalam penelitian ini adalah hasil Survei Demografi dan Kesehatan Indonesia (SDKI) tahun 2012. Sampel yang digunakan adalah data pada dua provinsi yaitu Jawa Barat dan Daerah Istimewa Yogyakarta sebagai representasi dari daerah yang tingkat fertilitasnya tinggi dan rendah. Data dibatasi hanya untuk interval kelahiran anak pertama, dari wanita yang menikah untuk pertama kali.
Definisi Operasional Peubah tak bebas yang digunakan dalam penelitian ini adalah interval kelahiran anak pertama wanita yang menikah untuk pertama kali. Sedangkan peubah bebas yang diduga mempengaruhi interval kelahiran anak pertama adalah: a. Tempat tinggal, dikelompokkan dalam unit wilayah administrasi terkecil yaitu daerah perkotaan dan pedesaan/ kelurahan. Tempat tinggal dibedakan menjadi dua kategori, yaitu desa = 0 dan kota = 1. b. Pendidikan, sekolah adalah sekolah formal mulai dari pendidikan dasar, menengah dan tinggi, termasuk pendidikan yang disamakan. Tidak lulus SD adalah mereka yang tidak pernah mengikuti pendidikan formal atau pernah di SD tetapi tidak sampai mendapatkan tanda kelulusan. Pendidikan tertinggi dibagi menjadi empat kategori, yaitu tidak lulus SD =0, lulus SD = 1, lulus SMP = 2, dan lulus SMA atau lebih = 3. c. Status pekerjaan, bekerja adalah kegiatan melakukan pekerjaan dengan maksud memperoleh atau membantu memperoleh penghasilan atau keuntungan selama paling sedikit satu jam dalam semimggu berturut-turut dan tidak terputus (termasuk pekerja keluarga tanpa upah yang membantu dalam usaha/kegiatan ekonomi). Status pekerjaan dikategorikan menjadi dua, yaitu tidak bekerja = 0 dan bekerja = 1. d. Pengetahuan tentang alat kontrasepsi, yaitu tidak tau = 0 dan tau=1. e. Umur pernikahan
9
4 HASIL DAN PEMBAHASAN Analisis Perilaku Model Saat sebuah model digunakan dalam penaksiran data survival adalah sangat penting untuk melakukan pengujian kelayakan apakah model yang kita gunakan sudah cocok untuk memodelkan data tersebut (Ortega et al. 2010). Ada beberapa metode yang sering digunakan dalam pengujian kelayakan model ini, salah satunya adalah metode grafik. Menaksir kelayakan suatu model (goodness of fit) dengan residual adalah salah satu metode grafik yang dapat digunakan dalam analisis survival. Selain itu juga,untuk memastikannya dilakukan uji terhadap Mean Squared Error (MSE). Residual yang paling banyak diaplikasikan secara luas dalam data analisis survival adalah residual Cox-Snell, yang didefinisikan secara khusus oleh Cox dan Snell (Collet 2003). Residual Cox-Snell untuk individu ke-i dengan waktu ̂ ( ) dengan pendugaan survival t dan kovariat didefenisikan sebagai akumulasi fungsi hazard berdasarkan model proporsional hazard. Jika tersensor maka juga tersensor. Misalkan dibentuk fungsi hazard dengan subjek i, i=1, 2,…,n seperti di bawah ini: ̂( ) ( ̂ )̂ ( ) dengan ̂ ̂ ̂ ̂ dengan hazard kumulatif: ̂( )
∫̂ ( )
∫
(̂
)̂ ( )
(̂
)∫ ̂ ( )
(̂ )̂ ( ) Berdasarkan persamaan di atas diperoleh residual Cox-Snell pada model Cox proportional hazard untuk subjek ke-i dan waktu ke adalah: (̂ )̂ ( ) dengan ̂ ( ) adalah estimasi dari baseline fungsi hazard kumulatif pada waktu Pada analisis parametrik, model failure time lebih dikenal sebagai “accelerated failure model”. Accelerated model untuk adalah: dengan n
= jumlah data = peubah acak dengan distribusi probabilitas yang sama = variabel terikat = parameter tidak diketahui dengan ( ) =variabel penjelas. Untuk model parametrik, residual Cox-Snell didefinisikan sama dengan residual Cox-Snell pada model Cox proportional hazard. Perbedaan mendasarnya adalah fungsi survival dan fungsi hazard-nya merupakan fungsi parametrik yang bergantung pada distribusi yang diadopsi dari waktu survival (Collet 2003).
10 ̂(
̂( ) dengan ̂( )
̂ (
̂
̂
̂
) ̂
̂
)
keterangan: ̂ ( ) = fungsi survival dari pada model parametrik ̂ = koefisien estimasi dari ̂ ̂ = nilai estimasi dari dan Pada model Weibull, fungsi survival adalah: ( ) ( ) ( ). Untuk model eksponensial, fungsi survival sama seperti pada model Weibull dengan skala parameter ditentukan sama dengan satu. Menurut Pocock et al. 2002 dalam metode grafik ini, jika model yang kita gunakan sesuai, maka grafik akan mengikuti garis 450. Keakuratan sebuah model dapat juga dilihat dari tingkat penyimpangan data dari garis 450 (Terry 2000). Untuk memastikan perbandingan model parametrik dan Cox proporsional hazard maka juga diamati Mean Squared Error (MSE) dari setiap residual hasil simulasi. Dalam statistik, mean squared error adalah satu dari beberapa metode estimasi untuk mengukur perbedaan antara nilai pendugaan dan nilai sebenarnya (Rady 2011). Perbedaan terjadi karena adanya keacakan atau karena pendugaan model tidak sesuai. Adapun rumus untuk menghitung MSE adalah ̂ ) (Kumar 2011). ∑ (
Proses Simulasi Data survival eksponensial Proses simulasi data survival yang berdistribusi eksponensial dilakukan dengan tahap-tahap sebagai berikut: Tahap I 1. Membangkitkan data survival yang berdistribusi eksponensial 2. Penyertaan status pengamatan (sensor/ lengkap) sebagai ciri khas dari analisis survival 3. Data survival hasil bangkitan beserta status pengamatan kemudian dianalisis dengan residual Cox-Snell untuk model parametrik eksponensial dan dengan menggunakan model Cox proporsional hazard. Tahap II 1. Membangkitkan data survival yang berdistribusi eksponensial dengan penambahan error 2. Penyertaan status pengamatan (sensor/ lengkap) sebagai ciri khas dari analisis survival 3. Data survival hasil bangkitan beserta status pengamatan kemudian dianalisis dengan residual Cox-Snell untuk model parametrik eksponensial dan dengan menggunakan model Cox proporsional hazard. 4. Mengulangi langkah 1-3 dengan penambahan error yang bereda-beda.
11 Tahap III Perbandingan grafik hasil analisis Tahap IV Melihat prilaku model berdasarkan Mean Squared Error (MSE). Setelah dilakukan simulasi berulang kali, beberapa Gambar ditampilkan ditampilkan sebagai berikut,
Gambar 1 Grafik residual Cox-Snell Gambar 2 Grafik residual Cox-Snell untuk data survival untuk data survival eksponensial tanpa eksponensial tanpa penambahan error dengan penambahan error dengan model analisis survival model analisis survival parametrik Cox proporsional hazard.
Gambar 3 Grafik residual Cox-Snell Gambar 4 Grafik residual Cox-Snell untuk data survival untuk data survival eksponensial dengan eksponensial dengan penambahan error dengan penambahan error dengan model analisis survival model analisis survival parametrik Cox proporsional hazard.
12 Dari beberapa gambar yang ditampilkan di atas terlihat bahwa saat data survival berdistribusi eksponensial murni, maka baik analisis data survival model parametrik eksponensial maupun Cox proposional hazard keduanya dapat mem-fit data dengan baik. Namun jika dibandingkan, terlihat model parametrik eksponensial lebih baik dari Cox proporsional hazard. Dalam simulasi lanjutan yaitu data bangkitan dengan penambahan error, model parametrik eksponensial terlihat kurang cocok lagi dalam memodelkan data survival tersebut, sebaliknya model Cox proporsional hazard tetap dapat mem-fit data dengan baik. Hasilnya MSE-nya dapat ditampilkan pada Gambar di bawah ini
Ket: error=0 (eksponen murni) error=1 (eksp + 𝜀 ( %)) error=2 (eksp + 𝜀 ( %)) dst
Gambar 5 Grafik perbandingan MSE dari model eksponensial dan Cox proporsional hazard Dari Gambar 5 dapat terlihat bahwa sebelum data survival yang berdistribusi eksponensial ditambahkan error, maka model parametrik eksponensial lebih baik dibandingkan model Cox proporsional hazard. Setelah data survival yang berdistribusi eksponensial dimanipulasi dengan penambahan error kemudian dianalisis dengan menggunakan model parametrik eksponensial maka terlihat error-nya semakin meningkat yang menjelaskan bahwa model tersebut kurang cocok. Sebaliknya apabila data survival dengan manipulasi tersebut dianalisis dengan model Cox proporsional hazard maka terlihat dari gambar bahwa error yang terjadi bersifat konsisten dan error-nya kecil. Salah satu kelompok data yang dibangkitkan dengan penambahan error yang masih bisa ditolerir (error kecil) diolah untuk melihat sejauh mana perbedaan kedua metode(eksponensial dan Cox proporsional hazard) tersebut dalam menduga parameter terhadap kovariat. Hasilnya disajikan sebagai berikut Tebel 1 Pendugaan parameter dengan metode parametrik eksponensial dan Cox proporsional hazard Variable Parameter Estimation Standard Error Hazard Ratio Kov 1.4049 0.2021 4.0751 (eksponensial) kov 1.38046 0.25391 3.977 (Cox PH) Dari tabel di atas terlihat bahwa perbedaan hasil pendugaan parameter antara metode parametrik dan Cox proporsional hazard tidak berbeda jauh yakni
13 1.4049 (SE=0.2021) dan 1.38046 (SE=0.25391). Artinya metode Cox proporsional hazard dapat dengan baik menduga parameter dari data dengan distribusi eksponensial. Data Survival Weibull Proses simulasi data survival yang berdistribusi Weibull dilakukan dengan tahap-tahap sebagai berikut: Tahap I 1. Membangkitkan data survival yang berdistribusi Weibull 2. Penyertaan status pengamatan (sensor/ lengkap) sebagai ciri khas dari analisis survival 3. Data survival hasil bangkitan beserta status pengamatan kemudian dianalisis dengan residual Cox-Snell untuk model parametrik eksponensial dan dengan menggunakan model Cox proporsional hazard. Tahap II 1. Membangkitkan data survival yang berdistribusi Weibull dengan penambahan error 2. Penyertaan status pengamatan (sensor/ lengkap) sebagai ciri khas dari analisis survival 3. Data survival hasil bangkitan beserta status pengamatan kemudian dianalisis dengan residual Cox-Snell untuk model parametrik eksponensial dan dengan menggunakan model Cox proporsional hazard. 4. Mengulangi langkah 1-3 dengan penambahan error yang bereda-beda. Tahap III Perbandingan grafik hasil analisis Tahap IV Melihat prilaku model berdasarkan Mean Squared Error (MSE). Setelah dilakukan simulasi berulang kali, beberapa Gambar ditampilkan ditampilkan sebagai berikut.
Gambar 6 Grafik residual Cox-Snell Gambar 7 Grafik residual Cox-Snell untuk data survival untuk data survival Weibull Weibull tanpa dengan penambahan error penambahan error dengan dengan model analisis model analisis survival survival Cox proporsional parametrik hazard.
14
Gambar 8 Grafik residual Cox-Snell Gambar 9 Grafik residual Cox-Snell untuk data survival untuk data survival Weibull Weibull dengan dengan penambahan error penambahan error dengan dengan model analisis model analisis survival survival Cox proporsional parametrik hazard. Dari beberapa gambar yang ditampilkan di atas terlihat bahwa saat data survival berdistribusi Weibull murni, maka baik analisis data survival model parametrik Weibull maupun Cox proposional hazard keduanya dapat mem-fit data dengan baik. Namun jika dibandingkan, terlihat model parametrik Weibull lebih baik dari Cox proporsional hazard. Dalam simulasi lanjutan yaitu data bangkitan dengan penambahan error, model parametrik weibull terlihat kurang cocok lagi dalam memodelkan data survival tersebut, sebaliknya model Cox proporsional hazard tetap dapat mem-fit data dengan baik. Hasilnya MSE-nya dapat ditampilkan pada gambar di bawah ini: Ket: error=0 (Weibull murni) error=1 (eksp + 𝜀 ( %)) error=2 (eksp + 𝜀 ( %)) dst
Gambar 10 Gambar perbandingan MSE dari model Weibull dan Cox proporsional hazard Dari gambar di atas dapat terlihat bahwa sebelum data survival yang berdistribusi Weibull ditambahkan error, maka model parametrik lebih baik dibandingkan model Cox proporsional hazard. Setelah data survival yang berdistribusi Weibull dimanipulasi dengan penambahan error kemudian dianalisis
15 dengan menggunakan model parametrik maka terlihat error-nya semakin meningkat yang menjelaskan bahwa model tersebut kurang cocok. Sebaliknya apabila data survival dengan manipulasi tersebut dianalisis dengan model Cox proporsional hazard maka terlihat dari gambar bahwa error yang terjadi bersifat konsisten dan error-nya kecil. Salah satu kelompok data yang dibangkitkan dengan penambahan error yang masih bisa ditolerir (error kecil) diolah untuk melihat sejauh mana perbedaan kedua metode (Weibull dan Cox proporsional hazard) tersebut dalam menduga parameter terhadap kovariat. Hasilnya disajikan sebagai berikut Tebel 2. Pendugaan parameter dengan metode parametrik Weibull dan Cox proporsional hazard Variable Parameter Estimation Standard Error Hazard Ratio kov 1.269 0.3660 3.5573 (Weibull) kov 1.01317 0.4574 2.754 (Cox PH) Dari tabel di atas terlihat bahwa perbedaan hasil pendugaan parameter antara metode parametrik dan Cox proporsional hazard tidak berbeda jauh yakni 1.2690 (SE=0.3660) dan 1.0132 (SE = 0.4574). Artinya metode Cox proporsional hazard dapat dengan baik menduga parameter dari data dengan distribusi Weibull. Dari hasil simulasi yang dilakukan, dapat dikatakan bahwa model Cox proporsional hazard cukup handal dalam memodelkan berbagai jenis data, baik data survival yang mengikuti distribusi tertentu ataupun tidak. Sehingga, untuk menganalisis data selang kelahiran anak pertama, cukup digunakan model ini untuk analisisnya.
Analisis Selang Kelahiran Anak Pertama di Indonesia Interval kelahiran anak pertama adalah salah satu contoh data survival. Dalam demografi ada tiga hal yang sangat berpengaruh, yaitu kematian (mortality), perpindahan (migration), dan kelahiran (fertility). Interval kelahiran anak pertama dapat digunakan sebagai salah satu indikator dari fertilitas. Interval kelahiran anak pertama adalah selisih antara umur perkawinan dengan umur kelahiran anak pertama. Dalam analisis selang kelahiran anak pertama ini, risiko diartikan sebagai tingkat keberhasilan dari seorang wanita menikah melahirkan anak pertamanya. Pada kenyataannya panjang interval kelahiran anak pertama dari tiap wanita menikah tidaklah sama. Berdasarkan penelitian yang ada, interval kelahiran anak pertama ditentukan oleh berbagai faktor sosial dan budaya serta faktor fisiologi. Menurut Ibrohim (1994) ada beberapa faktor yang mempengaruhi interval kelahiran anak pertama antar lain daerah tempat tinggal, tingkat pendidikan, umur, pengetahuan tentang alat kontrasepsi dan status bekerja. Sebagian wanita menikah telah melahirkan anak pertama beberapa bulan setelah perkawinan sehingga data yang diperoleh merupakan data lengkap, namun sebagian lainnya belum mempunyai anak yakni data tersensor. Dengan demikian interval kelahiran anak pertama merupakan salah satu contoh dari data survival. Data survival adalah data tentang pengamatan jangka waktu dari awal pengamatan
16 sampai terjadinya sesuatu peristiwa. Ciri khas dari data survival adalah survival time (waktu bertahan hidup) seringkali tidak dapat diamati secara lengkap (tersensor). Jika semua kejadian yang diharapkan terjadi, dan dapat diamati secara utuh maka beberapa metode analisis bisa dilakukan, namun data survival bersifat sensor (Clark et al. 2003). Menganalisis data survival menggunakan metode biasa tidak cocok karena akan menimbulkan bias (Widyaningsih 2006). Untuk mengurangi bias tersebut diperlukan suatu metode tertentu untuk menganalisisnya, yaitu analisis survival.
Model Cox Proporsional Hazard dan Cox Extended Cox (1972) menjelaskan bahwa bentuk umum dari model Cox proportional hazard adalah: ( ) ( ) ( ). dengan adalah kovariat, tetapi ia tidak membuat asumsi tentang bentuk dari ( ) yang disebut dengan baseline fungsi hazard karena itu adalah nilai dari fungsi hazard saat Terkadang ditemukan kovariat yang bergantung terhadap waktu sehingga asumsi proporsional tidak dipenuhi, sehingga bentuk di atas dikembangkan menjadi model Cox extended: ( ) ( ) ( )/ ( ( )) . Untuk memeriksa asumsi proporsional dari kovariat, model Cox extended menjadi: (
( ))
( )
0∑
∑
( )1
dengan ( ) merupakan fungsi terhadap waktu dan penting sekali untuk menentukan bentuk yang tepat dari ( ) Berikut kemungkinan fungsi ( ) menurut: ( ) i. merupakan bentuk yang paling sederhana sehingga menghasilkan model Cox proportinal hazard. ( ) ii. . Jika hasil pengujian signifikan maka model Cox extended lebih baik daripada Cox proportional hazard sehingga hazard ratio merupakan fungsi terhadap waktu. ( ) iii. ( ) ( ) heavyside function. Ketika fungsi ini digunakan maka diperoleh iv. hazard ratio yang konstan untuk interval waktu yang berbeda.
Pendugaan Parameter Dalam menduga parameter Cox menggunakan prosedur maximum likelihood estimation (penduga kemungkinan maksimum) dengan hanya mempertimbangkan peluang individu yang mengalami kejadian saja yang disebut partial likelihood (Kleinbaum dan Klein 2012). Pendugaan
17 menggunakan partial likelihood yaitu memaksimumkan fungsi partial likelihood. Fungsi partial likelihood merupakan fungsi peluang bersama dari data ketahanan tak tersensor berupa fungsi dari parameter yang tidak diketahui nilainya. Collet (2003) menyatakan bahwa pendugaan parameter dapat dibuktikan dengan mengambil kasus individu bertahan hidup sehingga kejadian berupa kematian. Misalkan terdapat individu dengan individu yang mengalami kematian maka ( ) individu tersensor. Asumsikan bahwa hanya terdapat satu individu yang meninggal pada waktu kematian tertentu (tidak terdapat ties). Misalkan pula ( ) ( ) ( ) ( ) merupakan waktu ketahanan terurut tak tersensor. Peluang kematian individu ke- pada saat ( ) dengan syarat ( ) satu-satunya waktu kematian dari ( ) ( ) ( ) ( ) dan kovariat untuk individu yang meninggal pada saat ( ) adalah ( ) dinotasikan sebagai rasio dari peluang individu dengan kovariat ( ) meninggal saat ( ) dan ( ) satu-satunya waktu kematian dari ( ) ( ) ( ) ( ) . Pembilang merupakan risiko kematian individu ke- pada saat ( ) , dinotasikan ( ( ) ), sedangkan penyebut merupakan jumlah risiko kematian saat ( ) untuk semua individu yang mempunyai risiko kematian saat ( ) atau penjumlahan ( ( ) ) dalam ( ( ) ) , dengan ( ( ) ) merupakan himpunan individu yang berisiko mengalami kematian saat ( ) yaitu individu-individu yang hidup dan tak tersensor sesaat sebelum ( ) sehingga ( ( ) ) disebut risk set. Misalkan A adalah kejadian individu ke- dengan kovariat ( ) meninggal saat ( ) dan B adalah kejadian kematian tunggal saat ( ) . Persamaan di atas menjadi (
)
∑
( ( )) ( ( )) ( ( ))
.
Dengan mensubstitusikan persamaan pada model Cox proporsional hazard diperoleh (
)
( ) ∑
( ( ))
(
( ))
( )
(
( )
∑
( ( ))
( ))
(
.
)
Dengan demikian fungsi likelihood dari peluang bersyarat di atas adalah ( ( )) ( ) ∏ ∑ ( ( )) ( ) dengan ( ) merupakan vektor kovariat untuk individu yang meninggal saat ( ) . Besaran ∑ ( ( ) ) ( ) merupakan penjumlahan nilai ( ) untuk setiap individu anggota ( ( ) ). Perkalian pada fungsi likelihood hanya untuk individu yang tak tersensor. Individu yang tersensor tidak termasuk dalam pembilang tetapi terdapat pada penyebut yaitu penjumlahan ( ) untuk setiap anggota ( ( ) ). Misalkan data terdiri dari pengamatan waktu ketahanan yaitu dan adalah indikator kejadian dengan nilai i ivi u t rs s r { 1, i . Maka persamaan fungsi likelihood dapat dinyatakan sebagai
18 ( )
∏,
( ∑
) (
( )
)
-
Jika dilogaritmakan maka diperoleh ( )
(∏ , ∑(
,
∑
(
∑
2
( ∑
) (
( )
( ∑
) (
( )
( ∑
)
- )
) (
( )
)
- )
∑
)
)
(
)3
( )
Penduga parameter ( ), yaitu solusi dari
∑
,
dapat diperoleh dengan memaksimumkan fungsi log ( ) ∑ ∑
( ) ( )
( (
) )
Solusi persamaan tersebut sulit dicari secara analitik tapi lebih mudah diselesaikan dengan menggunakan metode numerik.
Hazard Ratio Hazard ratio merupakan hazard relatif dari individu ke-i dengan kovariat ( ) mengalami peristiwa dibandingkan individu ke-j dengan kovariat ( ) yang konstan atau bebas terhadap waktu. Hazard ratio juga menunjukkan adanya peningkatan atau penurunan risiko individu yang dikenai perlakuan tertentu. Misalkan terdapat dua individu dengan karakteristik tersebut maka dari model umum Cox proporsional hazard, bisa diperoleh formula untuk menduga hazard ratio, yaitu: ( ) ̂ ( ) ( ) ( ) ( ) ( ) { ( ) ( } Untuk kovariat yang bersifat katagorik dengan variabel dummy bernilai 1 dan 0 maka hazard ratio dapat diinterpretasikan sebagai ratio dari pendugahazard untuk individu bernilai 1 terhadap penduga hazard untuk individu yang bernilai 0. sedangkan untuk kovariat yang bersifat kuantitatif, lebih bermakana jika hazard
19 ratio dikrangi 1 lalu dikalikan dengan 100% yang menyatakan perubahan persentase hazard penduga untuk penambahan 1 unit peubah tersebut.
Hasil Analisis Sebagai ilustrasi pada data interval kelahiran anak pertama akan dianalisis dengan metode Kaplan-Meier. Menurut Hoon (2008) Kaplan-Meier merupakan metode yang digunakan untuk membandingkan waktu survival dari dua kelompok kovariat. Keuntungan dari metode ini adalah karena termasuk metode nonparametrik yang tidak memerlukan pengetahuan sebaran tertentu (Kaplan dan Meier 1958). Metode ini cocok sebab data yang digunakan merupakan data individu, selain itu cocok digunakan untuk ukuran data kecil, sedang dan besar. Misalkan waktu kelahiran anak pertama adalah r dan banyaknya wanita yang menikah adalah n, dengan r ≤ n. Peluang kelahiran anak pertama dalam setiap selang j diduga dengan
, dan peluang bertahannya diduga dengan ̂
(
) Penduga
fungsi ketahanan metode Kaplan-Meier diberikan oleh persamaan, ̂( ) ̂ ̂ ̂ ̂ ∏
̂
∏
(
)
̂( ) Untuk Peubah responnya adalah waktu dari menikah sampai melahirkan anak pertama dan peubah yang mempengaruhi tingkat survival adalah daerah tempat tinggal (0=desa,1=kota). Hasil analisis survival menggunakan metode Kaplan-Meier untuk peubah bebas daerah tempat tinggal dalam gambar adalah sebagai berikut.
Gambar 11 Fungsi survival metode Kaplan-Meier untuk peubah bebas daerah tempat tinggal Dari Gambar 11 terlihat bahwa survival individu yang bertempat tinggal di desa berbeda dengan yang bertempat tinggal di kota. Selanjutnya akan dilakukan
20 uji hipotesis untuk melihat apakah perbedaan itu nyata atau kebetulan saja, dengan hipotesis sebagai berikut, ( ) ( ) ( ) ( ) Daerah penolakan adalah jika nilai statistik Logrank, ( ) . Hasil uji logrank berdasarkan kovariat status daerah tempat tingal disajikan dalam tabel berikut, Tabel 3 Hasil uji log rank untuk melihat perbedaan tingkat survival kelahiran anak pertama kovariat tempat tinggal Chi-Square df Sig. Log Rank (Mantel-Cox) 9,136 1 ,003 Dengan taraf nyata 0.05 uji khi-kuadrat berderajat bebas 1 didapat nilai W tersebut cukup signifikan untuk menolak . Jadi dapat disimpulkan bahwa terdapat perbedaan yang nyata antara tingkat survival kelahiran anak pertama individu yang tinggal di desa dan yang di kota. Jika data survival yang akan dibandingkan lebih dari dua kelompok individu, misalnya ingin melihat perbedaan karakteristik daerah tempat tinggal, tingkat pendidikan, umur, pengetahuan tentang alat kontrasepsi dan lain-lain maka metode Kaplan-Meier menjadi tidak praktis. Hal ini dikarenakan dalam metode Kaplan-Meier setiap dua kelompok populasi harus diuji secara tersendiri, sehingga jika ada beberapa kelompok maka harus dilakukan uji berulang-ulang. Jika responden mempunyai beberapa karakteristik, metode Cox proporsional hazard dapat menerangkan pengaruh karakteristik-karakteristik tersebut terhadap peubah respon secara simultan. Tabel 4 Penduga parameter, nilai-p, dan hazard ratio dengan menggunakan model Cox proporsional hazard Penduga Standar Peubah penjelas Nilai -p Hazard ratio parameter error Daerah tempat tinggal -0.32835 0.05896 <0.0001 0.720 Tamat SD 0.53510 0.20082 0.0077 1.708 Tamat SMP 0.97377 0.20284 <0.0001 2.648 Tamat SMA 1.47264 0.22033 <0.0001 4.361 Pengetahuan alat 0.21333 1.01079 0.8343 1.238 kontrasepsi Umur -0.04625 0.00712 <0.0001 0.955 Pekerjaan -0.06678 0.05547 0.2286 0.935 Pada tabel 2 terlihat bahwa peubah penjelas yang berpengaruh nyata terhadap interval kelahiran anak pertama adalah daerah tempat tinggal, tamat SD, tamat SMP, tamat SMA, dan umur. Selanjutnya dilakukan penaksiran terhadap asumsi proporsional untuk setiap kovariat. Dalam tulisan ini hanya digunakan metode Schoenfeld residuals untuk memeriksa kovariat yang tidak memenuhi asumsi proportional pada interval kelahiran anak pertama. Hasilnya disajikan sebagai berikut
21 Tabel 5 Korelasi dan nilai –p peubah penjelas Peubah penjelas Korelasi Nilai –p Daerah 0.05438 0.1489 Tamat SD 0.02557 0.4976 Tamat SMP -0.05312 0.1586 Tamat SMA 0.03078 0.4141 Pengetahuan alat kontrasepsi 0.01169 0.7565 Umur -0.10459 0.0054* Pekerjaan -0.04565 0.2257 Nilai –p kovariat umur kurang dari 0.05 yang berarti terdapat korelasi antara kovariat tersebut dengan peringkat waktu sampai individu melahirkan anak pertama sehingga kovariat umur tidak memenuhi asumsi proporsional. Sehingga data kembali dimodelkan dengan model Cox extended. Sebelum dilakukan analisis, terlebih dahulu dilakukan uji untuk melihat bentuk ( ) yang lebih sesuai. Uji ini menggunakan kriteria AIC. Menurut metode AIC, model regresi terbaik adalah model yang mempunyai nilai AIC terkecil (Love et al. 2003).
No. 1.
Tabel 6 Nilai AIC model Jenis Model Nilai AIC Cox Proportional Hazard 10464.278
Cox extended 2. 10465.014 ( ) 3. 10451.802 ( ) Nilai AIC dengan bentuk ( ) adalah yang paling kecil diantara dua model lainnya. Sehingga model inilah yang terbaik. Selanjutnya dilakukan uji untuk melihat kovariat yang berpengaruh nyata terhadap peubah respon. Hasilnya disajikan sebagai berikut Tabel 7 Penduga parameter, nilai-p, dan hazard ratio dengan menggunakan model Cox extended Penduga Peubah penjelas Standar Nilai -p Hazard parameter error ratio Daerah tempat tinggal Tamat SD Tamat SMP Tamat SMA Pengetahuan alat kontrasepsi Umur Pekerjaan Umur.lt
-0.32996 0.54800 0.98723 1.44341 0.23638
0.05896 0.20091 0.20295 0.22071 1.01985
<0.0001 0.0064 <0.0001 <0.0001 0.8167
0.719 1.730 2.684 4.235 1.267
0.06833 -0.07083 -0.03861
0.03079 0.01017 0.01017
0.0265 0.2020 0.0001
1.071 0.932 0.962
22 Pada Tabel 7 terlihat bahwa peubah penjelas yang berpengaruh nyata terhadap interval kelahiran anak pertama adalah daerah tempat tinggal, tamat SD, tamat SMP, tamat SMA, dan umur.
Interpretasi Tabel 7 menunjukkan bahwa peubah tempat tinggal, lulus SD, lulus SMP, lulus SMA, dan umur merupakan peubah yang berpengaruh nyata terhadap risiko individu melahirkan anak pertama. Dari nilai rasio hazard terlihat bahwa individu yang bertempat tinggal di kota memiliki risiko melahirkan anak pertama lebih kecil dibandingkan individu yang bertempat tinggal di desa sebesar 0.719 kali, serta riwayat pendidikan individu yang lulus SD, lulus SMP, dan lulus SMA atau lebih akan menaikkan risiko melahirkan anak pertama berturut-turut sebesar 1.730, 2.648, 4.235 kalinya individu yang memiliki riwayat pendidikan rendah atau tidak lulus SD. Setiap penambahan usia sebesar satu tahun maka akan meningkatkan risiko melahirkan anak pertama sebesar 7.1% dengan tingkat penurunan yang semakin mengecil pada t yang meningkat.
5 SIMPULAN Simpulan 1. Dari hasil simulasi yang dilakukan, dapat dikatakan bahwa model Cox proporsional hazard cukup handal dalam memodelkan berbagai jenis data, baik data survival yang mengikuti distribusi tertentu ataupun tidak. 2. Karena model Cox proporsional hazard telah terbukti handal dalam memodelkan berbagai jenis data, maka analisis selang kelahiran anak pertama di Indonesia dianalisis dengan menggunakan model ini. 3. Setelah dilakukan uji asumsi proporsional hazard, ternyata salah satu kovariat tidak memenuhi asumsi proporsional sehingga data kembali dimodelkan dengan menggunakan perluasan model Cox proporsional hazard yaitu Cox extended. 4. Meskipun tidak terdapat perbedaan antara peubah penjelas yang berpengaruh nyata dengan menggunakan model Cox proporsional hazard dengan Cox extended, namun interpretasi hasil kedua model tersebut berbeda dan berdasarkan uji yang dilakukan, Cox extended yang terbaik dalam memodelkan data kelahiran anak pertama di Indonesia. 5. Hasil analisis menunjukkan bahwa peubah tempat tinggal, lulus SD, lulus SMP, lulus SMA, dan umur merupakan peubah yang berpengaruh nyata terhadap risiko individu melahirkan anak pertama. Dari nilai rasio hazard terlihat bahwa individu yang bertempat tinggal di kota memiliki risiko melahirkan anak pertama lebih kecil dibandingkan individu yang bertempat tinggal di desa sebesar 0.719 kali, serta riwayat pendidikan individu yang lulus SD, lulus SMP, dan lulus SMA atau lebih akan menaikkan risiko melahirkan anak pertama berturut-turut sebesar 1.730,
23 2.648, 4.235 kalinya individu yang memiliki riwayat pendidikan rendah atau tidak lulus SD. Setiap penambahan usia sebesar satu tahun maka akan meningkatkan risiko melahirkan anak pertama sebesar 7.1% dengan tingkat penurunan yang semakin mengecil pada t yang meningkat.
24
DAFTAR PUSTAKA Allison PD. 2010. Survival Analysis Using SAS: A Practical Guide. 2nd Ed. USA: SAS Institut INC. Bradburn M, Clark TG, Love C. 2003. Multivariate data analysis, an introduction to concepts and methods. British Journal of Cancer. 89(3): 431-436. Clark TG, Bradburn M, Altman DG. 2003. Survival Analysis Part I: basic concepts and first analysis. British Journal of Cancer. 89(2): 232-238. Collet D. 2003. Modelling Survival Data in Medical Research 2nd Ed. London: Chapman & Hall/CRC. Cox DR. 1972. Regression models and life tables (with discussion). J R Statisc Sic B. 34(2): 187-220. Cox DR, Oakes D. 1984. Analysis of Survival Data. Cambridge: University Press. Hogg VR, Craig TA. 1995. Introduction to Mathematical Statistics. 5nd Ed. New Jersey: Prentice Hall, Englewood Cliffs Publisher. Hoon TS. 2008. Using Kaplan-Meier and Cox Regresion in Survival Analysis. Journal ESTEEM 4(2): 3-14. Ibrohim J. 1994. Analisis selang kelahiran anak di Jawa Barat. Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam [Tesis]: Bogor (ID): Program Pascasarjana, Institut Pertanian Bogor. Kaplan EL, Meier P. 1958. Non Proportional Estimation from Incomplete Observation. Journal of the America Statistical Association. 53: 457-481 Kleinbaum DG, Klein M. 2012. Survival Analysis A Self-Learning Text. 3nd Ed. New York: Springer. Kumar S. 2011. Determination of Exponential Smoothing Constant to Minimize Mean Square Error and Mean Absolute Deviation. Global Journal of Research in Engineering 11: Issue 3 Version. Latif M, Hossain Z, Islam A. 2008. Model Selection Using M ifi A i ’s Information Criterion: An Application to Maternal Morbidity Data. Austrian Journal of Statistic. 37(2):174-184. Lawless JF. 2002. Statistical Models and Methods for Lifetime Data. 2nd Ed. Canada: Wiley Series In Probability and Statistics. Lee ET, Wang JW. 2003. Statistical Methods for Survival data Analysis. 3nd Ed. New York: A Wiley Interscience Publication. Love C, Altman DG, Bradburn M. 2003. Multivariate data analysis. British Journal of Cancer, 89(3): 437-443. Ortega E, Silva G, Paula GA. 2010. Residual for log-Burr XII regression models in survival analysis. Journal of Applied Statistics. 38(7): 1435-1445. Pocock SJ, Clayton T, Altman. 2002. Survival Plots of Time-to-event outcomes in Clinical Trials. Lancet. 359:1686-1689. Rady H. 2011. R i’s E tr p M Squ r Err r f r Impr vi g th Convergence of Multilayer Backprobagation Neural Networks: A Comparative Study. International Journal of Electrical & Computer Sciences IJECS-IJENS. 11(5):68-79. Terry T. 2002. Martingale-Based Residuals for Survival Models. JSTOR Biometrika Trust: 147-160.
25 Widyaningsih Y. 2006. Penerapan analisis regresi logistik dan analisis survival pada masa laktasi wanita Indonesia [Tesis]. Bogor (ID): Program Pascasarjana, Institut Pertanian Bogor.
26
RIWAYAT HIDUP Penulis dilahirkan di Watampone pada tanggal 12 Maret 1990 dari ayah Syahruddin dan ibu Salmah. Penulis merupakan putra kedua dari tiga bersaudara. Tahun 2008 penulis lulus SMA Negeri 1 Watampone, kemudian melanjutkan pendidikan di Universitas Negeri Makassar Jurusan Matematika dan lulus 2011. Pada tahun 2012 penulis masuk Program Magister Program Studi Matematika Terapan di Institut Pertanian Bogor melalui jalur Beasiswa Unggulan dan menyelesaikannya pada tahun 2014.