BAB I PENDAHULUAN Pada bab ini dijelaskan mengenai latar belakang yang mendasari penelitian ini. Berdasarkan latar belakang yang telah disusun, ditentukan tujuan penelitian agar penelitian ini memiliki arahan yang jelas mengenai apa saja yang ingin dicapai. Selanjutnya pada bab ini juga dijelaskan mengenai manfaat penelitian, tinjauan pustaka dan sistematika penulisan Tesis yaitu sebagai berikut.
1.1
Latar Belakang Analisis survival adalah sekumpulan prosedur statistika yang digunakan
untuk menganalisis data dimana variabel yang diperhatikan adalah waktu sampai terjadinya suatu peristiwa (Kleinbaum and Klein, 2005). Analisis Survival disebut juga sebagai analisis waktu kejadian (time to event analysis), di mana waktu sampai terjadinya suatu kejadian yang dinginkan disebut survival time atau failure time (Danardono, 2012). Waktu dapat dinyatakan dalam tahun, bulan, minggu, atau hari dari awal mula dilakukan studi atau pengamatan pada seorang individu sampai suatu peristiwa terjadi pada individu tersebut. Selain itu, waktu dapat juga dinyatakan dalam usia individu ketika suatu kejadian terjadi. Sedangkan kejadian dapat berupa kematian, munculnya suatu penyakit, kambuhnya suatu penyakit setelah dilakukan operasi, atau beberapa hal lain yang dirancang yang bisa diperhatikan dan dapat terjadi pada seorang individu.
1
2
Data survival dalam analisis semacam ini melibatkan bentuk data time to event, misalnya data waktu sampai terjadinya kematian. Sehimpunan data yang digunakan dapat berupa data eksak ataupun data tersensor, dan mungkin juga data terpancung, tetapi dalam tesis ini hanya akan diguanakan data eksak dan data tersensor. Data eksak apabila waktu tepatnya suatu kejadian yang diinginkan diketahui, sedangkan data tersensor terjadi bila waktu sampai terjadinya suatu kejadian pada individu yang bersangkutan tidak diketahui dengan pasti, hanya informasi bahwa sampai saat tertentu kejadiannya belum teramati. Salah satu tujuan analisis data survival adalah untuk mengetahui hubungan antara waktu kejadian (time to failure) dan variabel prediktor yang terukur pada saat dilakukan penelitian. Dapat dilakukan dengan metode regresi, salah satunya adalah Regresi Cox. Model Cox menyatakan hazard rate dari satu individu pada waktu t dengan diketahui variabel-varabel prediktornya. Model ini melibatkan komponen yang disebut fungsi baseline hazard yang melibatkan waktu t tetapi tidak melibatkan variabel prediktor. Selain itu, model Cox juga melibatkan komponen lain yaitu eksponensial terhadap jumlah perkalian efek dari masing masing prediktornya. Komponen ini menjamin taksiran hazard yang dihasilkan selalu non negatif. Hal ini sesuai dengan yang diharapkan karena variabel dependennya (outcome) adalah waktu sampai terjadinya suatu kejadian, sehingga tidak mungkin negatif. Hanya saja, penggunaan Regresi Cox harus memenuhi proportional hazard, jika asumsi ini tidak dipenuhi dalam memodelkan Regresi Cox, berarti komponen linear yang membentuk model dalam berbagai waktu tidak sesuai,
3
akibatnya pemodelan Regresi Cox tidak tepat. Menurut Collet (1994), disebutkan bahwa jika asumsi ini tidak dipenuhi berarti komponen linear di model Cox berubah-ubah tergantung waktu dan dikatakan nonproportional hazard. Oleh karena untuk mengatasi hal ini, dibutuhkan model yang lebih fleksibel. Model Jaringan Syaraf Tiruan (JST) dapat dilihat sebagai model fleksibel untuk masalah multivariat nonlinear dan telah banyak memperoleh perhatian selama beberapa tahun belakangan ini sebagai alat matematika yang dapat digunakan untuk memecahkan masalah regresi nonlinear atau masalah klasifikasi. Model Jaringan Syaraf Tiruan berpotensi menghasilkan prediksi yang lebih akurat untuk waktu survival daripada model tradisional, sebab salah satu kelebihan utama dari model jaringan syaraf tiruan adalah dapat menggali informasi tersembunyi didata tanpa terkendala pada sifat-sifat data. Salah satu komponen penting dalam pengembangan analisis survival adalah metode analisis data survival dengan data tersensor. Beberapa penelitian terbaru menunjukkan bahwa kinerja Jaringan Syarat Tiruan lebih baik dalam memprediksi waktu survival data tersensor dibandingkan dengan metode konvensional seperti model cox, dll. Berdasarkan uraian tersebut, maka peneliti tertarik untuk mengetahui perbandingan Model Jaringan Syaraf Tiruan dan salah satu model konvensional yaitu model Regresi Cox pada analisis data survival. Dalam penelitian ini, akan dilakukan simulasi analisis data survival dengan tingkat sensor yang berbeda dengan menggunakan model JST dan model Regresi Cox, kemudian
4
membandingkan hasilnya. Pada penulisan tesis ini mengacu pada jurnal “Non linear Survival Regresion Using Artificial Neural Network”. 1.2
Tujuan dan Manfaat Penelitian Berdasarkan uraian pada latar belakang masalah di atas, maka tujuan dari
penelitian ini adalah sebagai berikut. 1. Untuk mengetahui analisis data survival dan pemilihan model terbaik dengan menggunakan Jaringan Syaraf Tiruan 2. Untuk
mengetahui
perbandingan
hasil
analisis
data
survival
menggunakan Regresi Cox dan Jaringan Syaraf Tiruan
Adapun manfaat penelitian ini adalah sebagai berikut. 1. Secara umum diharapkan dapat memberikan sumbangsih terhadap perkembangan ilmu pengetahuan tentang analisis data survival serta untuk menambah wawasan dalam bidang statistika matematika. 2. Secara khusus dapat memberikan gambaran tentang penerapan JST dalam melakukan analisis regresi terutama untuk regresi nonlinear 3. Sebagai alternative model yang dapat digunakan untuk melakukan analisis data survival ketika asumsi model Cox tidak dapat dipenuhi.
1.3
Tinjuan pustaka Banyak penelitian yang telah dilakukan mengenai penerapan jaringan
syaraf tiruan pada bidang statistik, di antaranya yaitu penggunaan jaringan syaraf
5
tiruan pada analisis data survival. Salah satu tujuan analisis data survival adalah untuk mengetahui hubungan antara waktu kejadian (time to failure) dan variabel prediktor yang terukur pada saat dilakukan penelitian. Ripley, Dkk (2004) dalam makalahnya dengan judul Nonlinear survival analysis using neural networks dan Biglarian, Dkk (2013) dalam makalahnya dengan judul Non linear Survival Regresion Using Artificial Neural Network menjabarkan tentang model regresi dengan menggunakan model jaringan syaraf tiruan untuk menganalisis data survival dan membandingkannya dengan model regresi Cox yang selama ini paling sering digunakan untuk analisis data survival. Selain hal diatas, depelajari juga beberapa referensi sebagai pendukung penelitian ini seperti Cox (1984) yang membahas tentang Analysis Of Survival Data, Haykins (1999) yang menbahas tentang Neural Network A Comprehensive Fondation Second Edition, Fauset (1994) yang membahas tentang Fundamental Of Neural Network: Architectures, Algoritthms, and Aplications, Kleinbaum and Klein (2012)
dan Danardono (2012) yang membahas tentang Analisis data
survival, Herman (2006) yang membahas tentang Jaringan Syaraf Tiruan; Teori dan Aplikasi, Hogg (2005) dan Subanar (2012), yang membahas tentang Introduction to Mathematical Statistics, Biglarian (2013) dan Bates (1998) yang membahas tentang Nonlinear Regression Analysis and It’s Aplications, Huet (2004), yang membahas tentang Statistical Tool For Nonlinear Regression A Practical Guid With S-Plus and R Examples, Fox (2002), yang membahas tentang Cox Proporsional Hazard Regresion for Survival Data (Appendix to an R and S-
6
Plus companion to Aplied Regression, dan Hosmer (2008), yang membahas tentang Applied Survival Analysis.
1.4
Metode Penelitian Metode yang dipakai dalam penelitian tesis ini adalah studi literatur yang
diperoleh dari buku-buku perpustakaan, artikel-artikel, dan internet. Studi kasus menggunakan data simulasi dengan tingkat sensor 80%, 60%, 40% dan 20%. Selanjutnya, dilakukan estimasi parameter pada model Cox dan JST dengan menggunakan Maximum Likelihood Estimator pada regresi nonlinear, dan bagian terakhir melakukan analisis data yang telah dibuat, kemudian membuat tabel perbandingan dari hasil analisis data tersebut, untuk model Cox dan Model JST. Pengolahan data menggunakan software R dan Microsoft Excel 2007.
1.5
Sistematika Penulisan Pada penulisan tesis ini, penulis menggunakan sistematika sebagai berikut.
BAB I PENDAHULUAN Bab ini memuat penjelasan mengenai latar belakang masalah, tujuan dan manfaat penelitian, tinjauan pustaka, dan sistematika penulisan. BAB II LANDASAN TEORI Bab ini memuat penjelasan mengenai data survival, survival time, data tersensor, kuantitas dasar analisis survival, model regresi, Maximum Likelihood Estimation, metode iterasi Newton-raphson, Regresi Cox, Akaike Information Criterion, Bayesian Information Criterion, Network Information Criterion.
7
BAB III MODEL REGRESI COX DAN JARINGAN SYARAF TIRUAN Bab ini memuat penjelasan mengenai model jaringan syaraf tiruan dan penerapannya pada data survival.` BAB IV PERBANDINGAN MODEL REGRESI COX DAN JARINGAN SYARAF TIRUAN Bab ini akan membahas mengenai simulasi data survival, pemilihan model terbaik dari Jaringan Syaraf Tiruan, dan membandingkan dengan model Regresi Cox. BAB V PENUTUP Bab ini memuat mengenai kesimpulan dan saran mengenai tesis ini.