Regresi Cox pada Survei Kompleks (Studi Kasus: Lama Pemberian ASI) Endah Budiarti1 Septiadi Padmadisastra2 Bertho Tantular3 1,2,3
Program Magister Statistika Terapan, FMIPA, Universitas Padjadjaran Email:
[email protected]
ABSTRAK Cox (1972) memperkenalkan metode regresi untuk melihat faktor-faktor yang menyebabkan terjadinya suatu peristiwa dengan peubah respon berupa waktu survival. Pada data yang berasal dari survei kompleks, regresi Cox biasa kurang tepat untuk diterapkan karena peluang setiap unit untuk terpilih sebagai sampel akan berbeda-beda. Binder (1992) mengembangkan regresi Cox dengan memperhatikan desain penarikan sampel. Binder menggunakan simulasi penarikan sampel stratified random sampling. Dalam penelitian ini penggunaan regresi Cox pada survei kompleks akan diilustrasikan pada kasus lama pemberian ASI di Provinsi Riau dengan data Survei Sosial Ekonomi Nasional (Susenas) 2012 dimana desain penarikan sampelnya tiga tahap berstrata. Dari delapan prediktor hanya dua yang signifikan, yaitu umur ibu saat melahirkan dan penolong persalinan. Kata-kata Kunci: Regresi Cox, Survei Kompleks, Pembobot Sampel, Subpopulasi 1. Pendahuluan World Health Organization (WHO) merekomendasikan para ibu di seluruh dunia untuk memberikan Air Susu Ibu (ASI) eksklusif pada enam bulan pertama kehidupan bayi untuk mencapai pertumbuhan optimal, perkembangan dan kesehatan. Setelah itu bayi harus diberi makanan pendamping ASI (MP-ASI) yang bergizi sambil tetap diberikan ASI sampai bayi berusia dua tahun atau lebih. Data dari Badan Pusat Statistik (BPS) menunjukkan rata-rata lama pemberian ASI di Indonesia sebesar 20 bulan pada rentang waktu 2008-2012. Angka ini masih kurang dari yang disarankan WHO yaitu selama dua tahun. Data lama pemberian ASI merupakan data survival. Waktu survival adalah panjang waktu yang diukur dari pertama kali suatu individu masuk ke dalam penelitian sampai ia keluar dari penelitian. Analisis survival banyak diterapkan di bidang kesehatan atau medis untuk menguji tingkat ketahanan pasien terhadap suatu penyakit. Pengumpulan data mengenai lama pemberian ASI diantaranya melalui Survei Sosial Ekonomi Nasional (Susenas) yang dilakukan oleh BPS. Susenas merupakan survei triwulanan yang dilakukan empat kali setahun di seluruh Kabupaten/Kota di Indonesia. Survei ini dirancang untuk mengumpulkan data sosial kependudukan yang relatif sangat luas. Susenas adalah survei dengan desain penarikan sampel tiga tahap berstrata. Metode regresi Cox menggunakan pembobot sampel diperkenalkan oleh Binder [4]. Binder melakukan simulasi pengambilan sampel berstrata dengan alokasi sama dan
1
tidak sama. Pada penarikan sampel berstrata dengan alokasi tidak sama, model dengan pembobot memberikan hasil yang lebih baik dibanding model tanpa pembobot. Penelitian tentang lama pemberian ASI dengan memperhatikan metode penarikan sampel berupa sampling kompleks masih jarang ditemukan. Penelitian ini mencoba mengaplikasikan regresi Cox pada kasus penghentian pemberian ASI menggunakan data Susenas 2012 triwulan I Provinsi Riau. 2. Model Regresi Cox pada Survei Kompleks 2.1 Metode Pengambilan Sampel Susenas Susenas menggunakan desain penarikan sampel tiga tahap berstrata. Strata yang dibentuk adalah strata daerah perkotaan dan perdesaan. Pada tahap pertama, dari kerangka sampel berupa wilayah pencacahan Sensus Penduduk 2010 (SP2010) dipilih wilayah pencacahan sebagai primary sampling unit (PSU) secara PPS (proportional probability to size) dengan ukuran banyak rumah tangga SP2010 pada setiap wilayah cacah. Selanjutnya karena survei ini dilakukan empat kali dalam setahun dengan sampel yang berbeda, maka sampel wilayah cacah akan dialokasikan secara acak pada empat triwulan. Pada tahap kedua, pada tiap sampel wilayah cacah dipilih satu blok sensus secara PPS dengan ukuran banyak rumah tangga SP2010 pada setiap blok sensus. Pada tahap ketiga, dari sampel blok sensus dipilih 10 rumah tangga biasa (non institusional) secara sistematik berdasarkan hasil pemutakhiran rumah tangga. Secara umum, pembobot dari unit sampel adalah kebalikan dari peluang terpilih menjadi sampel. Misalkan peluang sebuah unit terpilih sebagai sampel adalah P i, maka pembobotnya (wi) dapat dinotasikan dengan wi = 1/ P i. Secara sederhana, pembobot sampling adalah jumlah individu dalam populasi yang diwakili oleh masing-masing unit sampel dan jika semua pembobot pada sampel diakumulasikan nilainya akan sama dengan jumlah populasi (∑ = ). Pada desain penarikan sampel multistage, pembobot harus merefleksikan peluang pemilihan sampel pada setiap tahapannya. Misalkan pada penarikan sampel dua tahap, dimana peluang terpilih PSU ke-i pada tahap pertama adalah pi dan pada tahap kedua peluang pemilihan rumah tangga ke-j pada PSU terpilih sebesar pj(i). Maka peluang setiap rumah tangga untuk terpilih sebagai sampel adalah pij = pi × pj(i) dan pembobotnya adalah 1/ pij. Pembobot sampling Susenas pada strata h, PSU i, blok sensus j, rumah tangga k di suatu Kabupaten/Kota adalah:
dimana ∗
∗
=
(1)
: jumlah rumah tangga (kerangka sampel) pada Kabupaten/Kota strata h : jumlah rumah tangga hasil pemutakhiran pada Kabupaten/Kota di strata h, PSU ke-i, blok sensus ke-j : jumlah rumah tangga sampel pada Kabupaten/Kota di daerah h, PSU ke-i, blok sensus ke-j : jumlah rumah tangga sampel blok sensus triwulanan pada Kabupaten/Kota di strata h : jumlah rumah tangga (kerangka sampel) pada Kabupaten/Kota strata h, PSU ke-i, blok sensus ke-j
2
2.2 Analisis Subpopulasi Saat menganalisa data hasil survei, seringkali analisa difokuskan hanya pada subpopulasi tertentu. Dalam penelitian ini, subpopulasi terdiri dari rumah tangga yang di dalamnya terdapat anak terakhir berusia 0-59 bulan yang pernah diberikan ASI. Melakukan eliminasi pada data yang tidak masuk dalam subpopulasi dapat menghilangkan informasi mengenai desain kompleks yang berdampak pada terjadinya kesalahan dalam penghitungan standar error dari estimasi survei. Misalkan S adalah subpopulasi yang akan dihitung estimasinya. West, dkk [10] menyarankan penggunaan indikator pada masing-masing sampel yang bernilai nol untuk sampel di luar S dan bernilai satu pada sampel yang masuk dalam S. 1 jika individu merupakan anggota subpopulasi S I, = 0 jika individu bukan merupakan anggota subpopulasi S Penghitungan derajat bebas pada data subpopulasi yaitu jumlah PSU yang mengandung observasi subpopulasi dikurangi jumlah strata yang mengandung subpopulasi. 2.3 Model Regresi Cox pada Survei Kompleks Misalkan t adalah peubah acak kontinu yang menunjukkan waktu survival dan X adalah vektor kovariat yang independen terhadap waktu. Secara umum model regresi Cox dapat dituliskan sebagai berikut: ℎ( , ) = ℎ ( )exp
(2)
dimana ℎ ( ) merupakan fungsi baseline hazard pada waktu t yang tidak melibatkan X dan = ( , … , )′ adalah vektor koefisien regresi. Andersen dan Gill (1982) telah membuktikan bahwa estimasi parameter regresi Cox mempunyai sifat konsisten dan normal asimtotik. Dengan kata lain, estimasinya akan mendekati unbiased dan distribusi samplingnya akan mendekati normal pada ukuran sampel yang besar. Pada survei kompleks, pembobot sampel diikutsertakan untuk mengestimasi koefisien regresi. Jika data berasal dari pengambilan sampel acak sederhana, pemodelan regresi Cox standar bisa langsung digunakan. Namun jika data berasal dari survei dengan desain sampel kompleks, maka perlu penyesuaian dalam analisisnya. Pendekatan yang banyak digunakan pada data seperti ini adalah weighted partial likelihood yang diperkenalkan oleh Binder [4]. Misalkan data terdiri dari n pengamatan yang telah diurutkan berdasarkan waktu survival dengan ti adalah waktu survival amatan ke-i. Vektor kovariat untuk individu ke-i adalah = ( , … , )′. Ri = {l: tl ≥ ti} berisi individu-individu yang berisiko untuk mengalami kejadian pada waktu ti, baik yang tersensor maupun tidak tersensor. Notasi δi melambangkan indikator sensor yang bernilai nol untuk waktu survival amatan ke-i yang tersensor dan bernilai satu untuk amatan yang tidak tersensor. Pembobot sampel wi dihitung menggunakan persamaan (1). Penaksiran koefisien regresi dilakukan dengan weighted partial likelihood sebagai berikut: , ( ′ ) ( )= (3) ∑∈ ( ′ ) I, Proses penghitungan estimasi dari β dapat diselesaikan dengan iterasi Newton Raphson. Proses diawali dengan menggunakan nilai awal β(0)= 0 dan berulang dengan s =
3
1, 2, ... Proses berhenti saat iterasi sudah konvergen. Algoritma yang digunakan: ( ) ( ) ( ) = ( )− ( ) ( ) ′ Varians dari estimasi β dihitung dengan formula berikut: = dimana ( ) = =
I
∑∈
,
Vs diestimasi dengan:
∑∈
−1 −
=
I
,
I
( ′ )
−
( ′ )
,
(1 − ) −1
(
dimana residual observasinya adalah:
,
̅
=
∙∙,
=
,
=
1
∑∈ I, ∑∈ I
,
I
− ̅ ,
,
∙∙,
,
)′(
( ′ ) ( ′ )
′
− ̅
,
dimana
,
( )
: ( ) ( )
3. Hasil dan Pembahasan
,
,
=
=
1
( )=
− ̅
,
I
I ,
,
( ) exp ′ ( )
,
( ) ( ) exp ′ ( )
1 jika ≤ 0 lainnya
(6)
)
(7)
(9)
,
∙,
exp ′
(5)
(8)
Skor residual untuk amatan ke-(h, i, j, k) dalam subpopulasi adalah: = − ̅ , , −
∙∙,
(4)
(10)
(11) (12)
(13)
Data yang digunakan adalah data Susenas 2012 triwulan I Provinsi Riau. Total seluruh PSU dan blok sensus sebanyak 191 dengan 1.797 rumah tangga sampel. Jumlah PSU yang masuk dalam subpopulasi sebesar 182 dan rumah tangga subpopulasi sebanyak
4
623. Dari amatan tersebut 42,7 persen merupakan amatan tersensor. Hasil pengolahan menggunakan paket program Stata versi 10.1 sebagai berikut: Tabel 1 Hasil Regresi Cox dengan Pembobot Sampel Model dengan Pembobot Peubah
Rasio Hazard
Standard error
p-value
(1)
(2)
(3)
(4)
1.000 1.371 1.221
0.171 0.335
0.065 0.550
1.000 1.268
0.191
0.220
1.000 0.852
0.089
0.074
1.000 0.981
0.121
0.870
1.000 1.232 1.537
0.123 0.206
0.091 0.037
1.000 1.039
0.109
0.720
1.000 1.112
0.118
0.370
Umur ibu saat melahirkan > 35 tahun 20-35 tahun < 20 tahun Penolong persalinan Non Medis Medis Jenis kelamin anak Perempuan Laki-laki Jumlah anak lahir hidup 1 anak > 1 anak Pendidikan ibu Rendah Menengah Tinggi Status bekerja ibu Bekerja Tidak Kerja Tempat tinggal Perdesaan Perkotaan
Dari delapan prediktor yang digunakan terdapat tiga yang signifikan, yaitu ibu yang pada saat melahirkan berusia 20-35 tahun, jenis kelamin anak dan pendidikan ibu. Rasio hazard dari umur ibu saat melahirkan sebesar 1,37 dapat diinterpretasikan bahwa ibu yang pada saat melahirkan berusia 20-35 tahun yang masih memberikan ASI mempunyai 1,371 kali kemungkinan untuk berhenti memberikan ASI pada waktu berikutnya dibandingkan ibu yang melahirkan pada usia di atas 35 tahun. Sementara untuk jenis kelamin anak, hazard berhenti diberikan ASI pada anak perempuan lebih besar dibanding anak laki-laki. Untuk pendidikan ibu, ibu dengan pendidikan menengah dan tinggi mempunyai hazard yang lebih besar dibanding ibu berpendidikan rendah.
5
4. Daftar Pustaka [1] Andersen, P. K., dan Gill, R. D. 1982. Cox’s Regression Model for Counting Processes: A Large Sample Study. The Annals of Statistics Vol. 10, No. 4 (December 1982): 1100-1120. [2] Badan Pusat Statistik. 2009. Indikator Kesejahteraan Rakyat 2009. Jakarta: BPS [3] _________________. 2013. Indikator Kesejahteraan Rakyat 2013. Jakarta: BPS [4] Binder, David A. 1992. Fitting Cox’s Proportional Hazard Model from Survey Data. Biometrika 79: 139-147. [5] Cox, D. R. 1972. Regression Models and Life-Tables. Journal of the Royal Statistical Society B34, 187-220 [6] Cox, D. R. 1975. Partial Likelihood. Biometrika Vol. 62, 269-276 [7] Heeringa, S.G., West, B.T., dan Berglund, P.A. 2010. Applied Survey Data Analysis. Florida: Taylor and Francis Group [8] Lee, E. T., dan Wang, J. W. 2003. Statistical Methods for Survival Data Analysis Third Edition. New Jersey: John Wiley & Sons, Inc. [9] Mukhopadhyay, Pushpal K. 2010. Not Hazardous to Your Health: Proportional Hazards Modeling for Survey Data with the SURVEYPHREG Procedure. SAS Global Forum 2010 Statistics and Data Analysis, Paper 254-2010. [10] West, B. T., Berglund, P., dan Heeringa, S. G. 2008. A Closer Examination of Subpopulation Analysis of Complex-Sample Survey Data. The Stata Journal (2008) 8, Number 4: 520-531 Lampiran Syntax Regresi Cox pada Survei Kompleks menggunakan Stata: · svyset PSU_urut [pweight=weighting], strata (TMPT_TGL) vce(linearized) singleunit(missing) · svy linearized, subpop(ASI_if 1) : stcox X1_UMUR X2_SALIN X3_JK X4_PDDKN X5_KERJA X6_ALH X7_KB X8_TTGL
6