BAB I PENDAHULUAN 1.1 Latar Belakang Dalam kehidupan di dunia ini, hampir di setiap aspek banyak ditemui halhal berkaitan dengan data dan terkadang banyak permasalahan yang berkaitan dengan data, baik dalam bidang pendidikan, politik, ekonomi, sosial, budaya, sejarah, kesehatan, dan lain-lain. Dari data-data tersebut dilakukan pengolahan data yang kemudian dapat diperoleh informasi yang berguna untuk memperoleh kesimpulan maupun mengambil suatu keputusan yang tepat dalam menyelesaikan permasalahan yang ada pada masing-masing bidang. Analisis ketahanan hidup atau yang sering disebut dengan analisis survival merupakan suatu metode statistika yang digunakan untuk menguji ketahanan atau kemampuan suatu sampel percobaan. Selain itu, analisis survival menggambarkan analisis data waktu tahan hidup dari awal waktu penelitian sampai kejadian tertentu terjadi. Dalam analisis survival terdapat data yang bernama data tahan hidup (data survival). Data tahan hidup (data survival) merupakan data yang menyatakan lama waktu sampai peristiwa terjadi atau data antar kejadian (time-toevent data). Analisis survival digunakan dalam penelitian di berbagai bidang ilmu yaitu diantaranya bidang Epidemiologi (Kesehatan), Ekonomi, Biologi, Perekayasaan, Sosial, dan bidang lainnya. Khususnya, penelitian dalam bidang kesehatan yang sangat berhubungan dengan waktu tahan hidup. Waktu tahan hidup yang dimaksudkan di sini adalah lamanya pasien bertahan hidup dari penyakit yang dideritanya. Oleh karena itu, data yang biasa digunakan dalam penelitian tersebut adalah data waktu hidup (data survival). Dalam data waktu hidup (data survival) terdapat data yang disebut data tidak lengkap yaitu data tersensor dan data terpotong. Terdapat dua jenis data tersensor dan dua jenis data terpotong yaitu tersensor kanan dan tersensor kiri serta terpotong kanan dan terpotong kiri.
Dalam ilmu statistika dikenal adanya interval konfidensi. Wahyudi, O.B. (2010) menyatakan bahwa interval konfidensi merupakan suatu konsep estimasi interval nilai karakteristik suatu populasi yang diperkirakan dengan suatu tingkat kepastian yang berada di dalam suatu interval. Permasalahan yang timbul adalah metode apa yang dapat digunakan untuk menentukan interval konfidensi pada data tidak lengkap. Interval Konfidensi Pointwise merupakan prosedur mengestimasi interval konfidensi untuk distribusi survival dari data tersensor kanan yaitu interval konfidensi yang diestimasi pada setiap waktu terjadinya event atau pada setiap parameter yang diestimasi. Yang telah dikenal salah satunya adalah dengan formula Greenwood sebagai variansi pada estimator Kaplan-Meier. Namun penaksir Kaplan-Meier biasanya digunakan dengan interval kepercayaan asimtotik yang bisa menyebabkan beberapa masalah mengenai cakupan penaksiran saat jumlah kegagalan yang diamati tidak besar. Maka dikembangkan prosedur yang lain yaitu Beta Product Confidence Procedure (BPCP). BPCP memberikan cakupan penaksiran yang benar secara asimtotik dan secara asimtotik pula setara atau dapat membandingi interval konfidensi pada estimator Kaplan-Meier dengan menggunakan variansi Greenwood (Michael P. Fay et al., 2013). Oleh karena itu, dalam skripsi ini akan dibahas mengenai prosedur yang digunakan untuk menentukan interval konfidensi pada data tersensor kanan yaitu Beta Product Confidence Procedure (BPCP).
1.2 Tujuan Penelitian Tujuan yang ingin dicapai dari penulisan skripsi ini adalah : 1. mempelajari dan memahami Interval Konfidensi Pointwise untuk data tersensor kanan pada distribusi survival yaitu Beta Product Confidence Procedure (BPCP); 2. mengestimasi interval konfidensi pada data tersensor kanan pada distribusi survival dengan menggunakan Interval Konfidensi Pointwise yaitu Beta Product Confidence Procedure (BPCP);
3. mengaplikasikan metode Interval Konfidensi Pointwise yaitu Beta Product Confidence Procedure (BPCP) untuk menyelesaikan permasalahan pada studi kasus.
1.3 Manfaat Penelitian Manfaat dari penulisan skripsi ini adalah : 1. menambah pengetahuan mengenai statistika dalam bidang analisis data survival terutama pada data tersensor kanan dengan jumlah sampel kecil atau tersensor banyak, serta cara menentukan interval konfidensinya; 2. memperkenalkan Interval Konfidensi Pointwise yaitu Beta Product Confidence Procedure (BPCP) sebagai prosedur dalam menentukan interval konfidensi untuk data tersensor kanan pada distribusi survival; 3. memperoleh hasil estimasi Interval Konfidensi Pointwise yaitu Beta Product Confidence Procedure (BPCP) yang dapat menerangkan interval kepercayaan untuk data tersensor kanan pada distribusi survival.
1.4 Pembatasan Masalah Berdasarkan latar belakang masalah maka penulis membatasi penulisan skripsi ini hanya pada pembahasan Beta Product Confidence Procedure (BPCP). Studi kasus dilakukan dengan simulasi untuk membuktikan keunggulan BPCP dibanding Kaplan-Meier dan dengan analisis menggunakan data penelitian data mengenai waktu kematian wanita yang mengidap kanker payudara dari The Ohio State University Hospitals Cancer Registry, data pasien systemic sclerosis dari severe systemic sclerosis pilot trial, dan data death time of psychiatric patient dari University of Lowa Hospitals. Pembatasan masalah sangat diperlukan agar pembahasan yang disampaikan jelas dan fokus pada tujuan.
1.5 Tinjauan Pustaka Estimasi interval konfidensi merupakan suatu konsep yang sangat penting dalam
analisis
statistik,
diantaranya
yaitu
interval
konfidensi
dapat
mendeskripsikan seberapa reliable hasil suatu penelitian. Para ahli statistik mengeluarkan konsep estimasi interval dimana nilai karakteristik suatu populasi diperkirakan dengan suatu tingkat kepastian akan berada didalam suatu interval. Interval inilah yang disebut dengan interval konfidensi. Michael P. Fay et al. (2013) dari National Institute of Allergy and Infectious Diseases dalam sebuah Jurnal Internasional yang berjudul “ Pointwise Confidence Interval for a Survival Distrbution with Smal Samples or Heavy Censoring” menjelaskan tentang estimasi interval konfidensi untuk data tersensor kanan dengan sampel kecil atau tersensor banyak pada distribusi survival yaitu menggunakan prosedur Beta Product Confidence Interval (BPCP). BPCP adalah prosedur konfidensi nonparametrik untuk kurva survival pada waktu yang fixed pada data tersensor kanan atau tersensor banyak dengan asumsi tersensor independen. Michael P. Fay dan Erica H. Brittain juga menulis sebuah jurnal sebagai lanjutan dari jurnal sebelumnya yaitu berjudul “Finite Sample Pointwise Confidence Intervals for a Survival Distribution with Right-Censored Data”. 1.6 Metode Penelitian Metode penelitian yang digunakan dalam skripsi ini adalah berdasarkan studi literatur melalui sumber-sumber resmi seperti jurnal dan buku yang berisi teori-teori berkaitan dengan tema skripsi ini. Sumber lain dari penulisan ini juga diperoleh melalui situs-situs pendukung yang tersedia di internet. Analisis data dilakukan dengan R versi 3.2.3 untuk memperoleh interval konfidensi dengan Beta Product Confidence Procedure (BPCP) untuk data tersensor kanan pada distribusi survival.
1.7 Sistematika Penulisan Skripsi ini disusun dengan sistematika penulisan sebagai berikut BAB I PENDAHULUAN
Bab pendahuluan membahas tentang latar belakang masalah yang diambil, tujuan penulisan, manfaat penulisan, pembatasan masalah, tinjauan pustaka, metode penelitian, dan sistematika penulisan. BAB II DASAR TEORI Bab ini membahas tentang teori-teori yang berhubungan dengan tema. Teori-teori yang dibahas antara lain mengenai matriks, variabel random, konsep dasar survival, data tidak lengkap, beberapa fungsi pada analisis survival (fungsi survival, hazard, dan hazard kumulatif), penyensoran, beberapa jenis distribusi (distribusi eksponensial, distribusi gamma, distribusi beta), transformasi dua variabel, statistik terurut, probabilitas transformasi integral, dan metode momen. BAB III PEMBAHASAN Bab ini merupakan pokok dari permasalahan dan pembahasan dalam skripsi ini adalah Interval Konfidensi Pointwise yaitu Beta Product Confidence Interval (BPCP) dengan tujuan menghasilkan interval konfidensi yang memberikan cakupan yang benar secara asimtotik. BAB IV SIMULASI DAN STUDI KASUS Pada bab ini dibahas tentang aplikasi Beta Product Confidence Interval (BPCP) untuk data penelitian mengenai waktu kematian wanita yang mengidap kanker payudara dari The Ohio State University Hospitals Cancer Registry, data pasien systemic sclerosis dari severe systemic sclerosis pilot trial, dan data death time of psychiatric patient dari University of Lowa Hospitals, serta simulasi untuk membuktikan keunggulan BPCP dibanding KaplanMeier. BAB V PENUTUP Bab ini merupakan kesimpulan yang diperoleh dari hasil pembahasan pada bab-bab sebelumnya dan juga memberikan saran
untuk perkembangan tema skripsi ini pada khususnya serta perkembangan ilmu statistika secara umum.