Universitas Hasanuddin
ESTIMASI PARAMETER DISTRIBUSI LOG-LOGISTIK PADA DATA SURVIVAL TERSENSOR TIPE II Ryndha1, Anna2, Nasrah3
ABSTRAK Data survival adalah data yang menunjukkan waktu suatu individu atau objek dapat bertahan hingga terjadinya suatu kegagalan atau kejadian tertentu. Pada makalah ini, dibahas mengenai estimasi parameter distribusi log-logistik pada data survival tersensor tipe II dengan metode penaksir maksimum likelihood estimator. Selanjutnya diterapkan pada data simulasi pasien penyakit ginjal kronik (PGK) tahun 2014 yang berdistribusi Log-logistik. Penelitian ini bertujuan untuk mengetahui peluang pasien untuk dapat bertahan hidup. Berdasarkan hasil olah data simulasi diperoleh peluang hidup pasien yang menderita PGK selama 150 bulan adalah 0,254, sedangkan untuk pasien yang menderita PGK selama 50 bulan peluang hidupnya jauh lebih tinggi yaitu sebesar 0,659. Kata Kunci: Distribusi Log-logistik, Data tersensor tipe II, Maksimum Likelihood Estimator
1.
Pendahuluan Perkembangan ilmu pengetahuan saat ini, khususnya di bidang statistika, menghasilkan penemuan-penemuan alat analisis yang dapat digunakan untuk menganalisis suatu permasalahan. Salah satunya adalah analisis uji hidup yang digunakan untuk meneliti daya tahan hidup suatu unit atau individu pada suatu keadaan tertentu. Analisis yang digunakan untuk menganalisis data waktu hidup tersebut disebut analisis survival. Analisis survival mencakup survival time (waktu tahan hidup) atau failure time (Collet, 1997). Terdapat dua cara yang dapat dilakukan dalam pengambilan sampel pada analisis data tahan hidup yaitu pengamatan tersensor dan pengamatan tidak tersensor (pengamatan lengkap). Pengamatan tidak tersensor merupakan pengamatan yang diambil jika semua individu atau unit data yang diteliti mati atau gagal sampai jangka waktu yang ditentukan. Pengamatan tersensor dilakukan jika waktu tahan hidup dari individu yang diamati tidak diketahui secara pasti. Pengamatan tersensor diindikasi adanya individu yang tetap hidup sampai jangka waktu yang ditentukan (Lee, 2003). Ada tiga jenis penyensoran dalam pengamatan terhadap waktu tahan hidup yaitu sensor tipe I, sensor tipe II dan sensor tipe III. Sebagian besar penelitian menggunakan penyensoran tipe II karena waktu pengamatan dapat dihentikan setelah diperoleh sebanyak r kegagalan, sehingga peneliti dapat menghemat waktu dan biaya. Analisis data survival yang menggunakan data tersensor diperlukan asumsi tertentu tentang distribusi populasinya. Adapun dalam tulisan ini digunakan fungsi survival berdistribusi Log-Logistik pada data survival tersensor tipe II. Dalam bidang kesehatan, distribusi Log-logistik dapat digunakan untuk meneliti data tahan hidup pasien. Misalnya pada pasien penderita penyakit ginjal kronik (PGK). 2. 2.1
Tinjauan Pustaka Data Survival Data survival adalah data yang menunjukkan lamanya individu-individu atau unitunit dari suatu populasi menjalankan fungsinya dengan baik sampai kegagalan individuindividu tersebut. Kleinbaum (2005) mengemukakan bahwa ada tiga elemen yang perlu diperhatikan dalam menentukan waktu survival, antara lain:
1
Universitas Hasanuddin
a. Time origin atau starting point (titik awal) adalah waktu dimulainya suatu penelitian b. Ending event of interest (kejadian akhir) adalah kejadian yang menjadi inti dari penelitian. c. Measurement scale for the passage of time, yaitu skala ukuran untuk berlalunya waktu. Waktu ketahan hidup (T) merupakan variabel random non-negatif yang mewakili ketahanan hidup dari individu-individu dalam populasi yang merupakan variabel random kontinu dalam interval atau ketahanan hidup pada waktu t dengan t>0 (Lawless, 1982). Untuk mengetahui ketahanan hidup dapat diperoleh dengan mengestimasi distribusi fungsi-fungsi ketahanan hidupnya. Distribusi waktu ketahanan hidup dapat dinyatakan oleh tiga fungsi yang ekuivalen yaitu fungsi survival,fungsi Hazard, dan fungsi kepadatan peluang. Fungsi kepadatan peluang f(t) adalah yang didefinisikan sebagai limit probabilitas individu gagal dalam interval periodik t sampai , atau lebih mudahnya ialah probabilitas kegagalan dalam sebuah interval pendek perunit waktu yang didefinisikan sebagai berikut: (
*
(
(
+
(
*
(
+
Fungsi survival adalah peluang bahwa suatu individu akan tetap hidup sampai waktu t (t >0). Jika T merupakan variabel random dari waktu tahan hidup suatu individu, maka S(t) adalah peluang bahwa T lebih besar dari t. (
(
(
Fungsi Hazard menyatakan peluang kegagalan suatu individu pada waktu t, jika diketahui bahwa individu tersebut tetap hidup hingga waktu t. ( 2.2
*
(
+
Data Tersensor
Data tersensor adalah data yang diperoleh sebelum semua data teramati waktu hidupnya, sementara waktu pengamatan telah berakhir. Menurut Lee dan Wang (2003), ada tiga tipe penyensoran yang sering digunakan dalam pengamatan uji hidup yaitu sebagai berikut: 1. Sensor Tipe I, merupakan tipe penyensoran dimana percobaan akan dihentikan setelah mencapai waktu T yang telah ditentukan untuk mengakhiri semua n individu yang masuk pada waktu yang sama. Berakhirnya waktu uji T menjelaskan waktu sensor uji. Dengan kata lain, jika terdapat individu yang hilang secara tiba-tiba maka waktu survival observasi tersensor sama dengan lama waktu pengamatan. 2. Sensor Tipe II, merupakan tipe penyensoran dimana sampel ke-r merupakan observasi terkecil dalam sampel random berukuran n ( Dari total sampel berukuran n, pengamatan akan dihentikan ketika diperoleh sebanyak r individu yang mengalami kegagalan, dimana r
2
Universitas Hasanuddin
2.3
Distribusi Log-Logistik
Distribusi Log-logistik dengan variabel random Y mempunyai fungsi kepadatan peluang, (
(
) (
[
)]
dengan
.
Variabel random T dikatakan mengikuti distribusi Log-logistik dengan parameter dan , jika mempunyai fungsi kepadatan ( )( )
(
( ) ]
[
Fungsi distribusi kumulatifnya adalah (
∫
.
Fungsi survival-nya didefinisikan sebagai peluang suatu individu dapat bertahan hidup sampai waktu t, yaitu (
(
Fungsi Hazard h(t) menyatakan peluang suatu komponen mengalami kegagalan pada waktu t, dituliskan sebagai berikut
(
3. 3.1
(
( (
Hasil dan Pembahasan Estimasi Parameter Distribusi Log-Logistik pada Data Survival tersensor Tipe II
Data tersensor tipe II, mempunyai r pengamatan dari n sampel yang diamati, dan pengamatan akan dihentikan setelah kegagalan ke-r yang terjadi sebelum waktu . Data terdiri dari r tahan hidup terkecil dari sampel random yang terdiri dari n tahan hidup .
3
Universitas Hasanuddin
Fungsi kepadatan peluang bersama dari dapat ditulis sebagai berikut: (
dari data tersensor tipe II
[∏ (
(
(
]
]
Fungsi likelihood dari distribusi Log-logistik untuk data tersensor tipe II memiliki bentuk sebagai berikut
(
( )
( )∏
(
( ) ] ]
[
[
[
(
]
Dalam mengestimasi parameter distribusi Log-logistik dapat dilakukan dengan menurunkan fungsi likelihoodnya terhadap dan kemudian disamadengankan nol menjadi. ̂ ̂
(
̂ ̂
̂
)∑[
̂
( ) ] ̂
( ) ̂
(̂ ) ]
(̂)
̂
̂
( ̂
( ) ̂
( )( ) ̂ ̂
(
Dan ̂
∑
̂
∑
[
(̂ )
( (̂)
(̂)
(̂)
(2)
karena persamaan (1) dan (2) tidak dapat diselesaikan secara langsung, maka untuk mendapatkan nilai estimasi parameternya dapat menggunakan metode iterasi numerik atau dengan bantuan software. 3.2
Aplikasi Pada Data Jenis data yang digunakan adalah data bangkitan dari hasil simulasi pembangkitan data yang berdistribusi Log-logistik sebanyak 100 data dengan variabel yang digunakan adalah lama pasien menderita penyakit ginjal kronik (PGK) yang diukur dalam hitungan bulan. Dari hasil output Minitab didapatkan nilai parameter dari data adalah 4,32895 dan nilai dari parameter adalah 0,631712. Sehingga diperoleh nilai dari parameter ̂ dan ̂ adalah sebagai berikut: ̂
(
(
̂ Dari nilai ̂ dan ̂ yang diperoleh, selanjutnya dibentuk fungsi kepadatan peluang, fungsi Hazard, dan fungsi survival dari data. Berikut ini adalah bentuk fungsi kepadatan peluang dari data pasien PGK:
4
Universitas Hasanuddin
(
(
)(
)
(
[
(
)
]
(
)
(
[
)
]
Distribution Overview Plot for C1 ML Estimates-Failure Censored at 71
P robability D ensity F unction
Loglogistic 99
0.0075 90
P DF
P er cent
0.0050 Distribution Overview Plot for C1
ML Estimates-Failure Censored at 71 0.0025
50
Bentuk fungsi
25
0
500
1000
P er cent
00
0.1
1500
C1
50
S urv iv al F unction 0.012
00
(
(
1
(
[ 10 (
)
100 C1
)
S tatistics 4.32895 0.631712 1164.437 10 100 * C1 75.8646 113.960 H azard F unction 70 30 164.670
0.008
] 1000
Rate
75
10
Table of Loglogistic Loc 1 99 S cale 0.0000 0.1 M ean 0 500 1000 1500 90 S tD ev C1 Sumber: Hasil olah data, 2014 M edian Gambar PGK 501 Kurva fungsi kepadatan peluang dari data pasien IQ R S urv iv al F unction F ailure Hazard dari10 data pasien PGK: 0.012 100 C ensor 1 A D*
P er cent
P robability D ensity F unction
50
0.004
H azard F unction
0 0
500
1000
1500
0.000
0
500
C1
Rate
0.008
50
0.004 0 0
500
1000 C1
1500
0.000
0
500
1000
1500
C1 Sumber: Hasil olah data, 2014
Gambar 2 Kurva fungsi Hazard dari data pasien PGK
Bentuk fungsi survival dari data pasien PGK: ( (
1000 C1
)
5
P er
P
0.0025
10 1
0.0000 0
500
1000
Universitas 0.1 Hasanuddin
1500
1
10
C1 S urv iv al F unction
Hazard F unction 0.012
100
0.008 Rate
P er cent
100 C1
50
0.004 0 0
500
1000
1500
0.000
0
500
C1 Sumber: Hasil olah data, 2014 Gambar 3 Kurva fungsi survival dari data pasien PGK
1000 C1
Berdasarkan hasil pengolahan data yang dilakukan, diketahui peluang seorang pasien untuk bertahan hidup jika mengidap penyakit ginjal kronik (PGK) selama 50 bulan adalah 0,659, selama 90 bulan adalah 0,433, selama 100 bulan adalah 0,392, dan selama 150 bulan adalah 0,254. Dari hasil perhitungan tersebut dapat dilihat bahwa semakin lama seorang pasien mengidap penyakit ginjal kronik maka peluang hidup pasien tersebut akan semakin kecil (mendekati nol), hingga akhirnya mengalami kematian. Berkurangnya ketahanan hidup seorang pasien PGK dipengaruhi oleh banyak faktor, misalnya terdapat komplikasi penyakit atau perawatan pasien yang kurang memadai sehingga menyebabkan penyakit yang diderita semakin akut dan akhirnya menyebabkan kematian. 4. 4.1
Kesimpulan dan Saran Kesimpulan Dari penerapan distribusi Log-logistik pada data survival tersensor pasien penyakit ginjal kronik (PGK) dengan simulasi pembangkitan data, diperoleh nilai estimasi adalah 75,865 dan nilai estimasi untuk adalah 1,583. Dari nilai estimasi yang diperoleh diketahui peluang hidup seorang pasien yang mengidap PGK selama 50 bulan adalah 0,659, selama 90 bulan adalah 0,433, selama 100 bulan adalah 0,392, dan selama 150 bulan adalah 0,254. 4.2
Saran Penelitian ini hanya membahas mengenai estimasi parameter distribusi Loglogistik untuk data survival, sehingga disarankan untuk penelitian selanjutnya agar mengkaji lebih lanjut hingga ketahap estimasi parameter model regresi Log-logistik. Dan dapat diaplikasikan pada data survival lainnya, terkhusus pada data riil pasien penyakit ginjal kronik (PGK) untuk mengetahui faktor-faktor yang dapat mempengaruhi ketahanan hidup dari pasien PGK.
DAFTAR PUSTAKA Collett, David. 2004. Modelling Survival Data in Medical Research. 2nd ed. London: Chapman and Hall. Lawless, J.F. 1982. Statistical Model and Methods for Lifetime data. New Jersey: John Wiley and Sons, Inc. Lawless, J.F. 2003. Statistical Model and Methods for Lifetime Data 2nd ed. New Jersey: John Wiley and Sons Inc.
6
Universitas Hasanuddin
Lee, E.T. 2003. Statistical Methods for Survival Data Analysis 3rd ed. Canada: John Wiley and Sons Inc. Marchin, David, Yin Bun C and Mahesh Parmar. 2006. Survival Analysis A Practical Approach. 2nd. Chiester: John Wiley and Sons Ltd. Rao, G.S. Kantam and K. Rosaih. 2009. “Realiability Estimation in Log-logistic Distribution from Cencored Samples”. Prob. Stat.,02,52-67.
7