BAB 2 LANDASAN TEORI
Pada bab ini akan dipaparkan teori-teori yang menjadi dasar dan landasan dalam penelitian sehingga membantu mempermudah pembahasan bab selanjutnya dan pembahasan utama dalam penelitian ini. Teori tersebut meliputi analisis survival data tersensor, fungsi survival dan fungsi hazard, estimasi Kaplan-Meier, model cox proportional hazard.
2.1 Analisis Survival
Armitage dan Berry (1987) mengatakan bahwa analisis survival merupakan analisis yang melibatkan uji statistik untuk menganalisis data yang variabelnya berkaitan dengan waktu atau lamanya waktu sampai terjadinya peristiwa tertentu. Menurut Klein baum dan Klein (2005) analisis survival adalah kumpulan dari prosedur statistik untuk menganalisis data dimana outcome variabelnya adalah waktu hingga terjadi peristiwa muncul. Waktu survival dapat didefinisikan sebagai waktu dari awal observasi hingga terjadinya peristiwa, dapat berupa hari, bulan, maupun tahun. Menurut Le (2003) dalam menentukan waktu survival, T, terdapat tiga elemen dasar yang diperlukan yaitu: 1. Waktu awal (time origin). 2. Peristiwa akhir/waktu akhir (failure event). 3. Skala waktu sebagai satuan pengukuran waktu.
T (lama waktu)
Waktu awal
waktu akhir
T adalah lama dari waktu awal (time origin) harus didefinisikan dengan jelas, yaitu waktu awal melakukan studi. Begitu juga waktu akhir harus didefinisikan secara jelas yaitu kegagalan dalam menyelasaikan studi (skala waktu) (Le, 2003).
Analisis survival memiliki beberapa tujuan (Kleinbaum dan Klein, 2005): 1. Mengestimasi dan mengiterpretasikan fungsi survival dan fungsi hazard. 2. Membandingkan fungsi survival dan fungsi hazard. 3. Mengestimasi hubungan antara variabel penjelas dengan waktu survival.
2.1.1 Data Tersensor Perbedaan antara analisis survival dengan analisis statistika lainnya adalah terjadinya suatu peristiwa yang lama waktu terjadinya terhadap objek adalah bervariasi. Selain itu adanya data tersensor pada analisis survival. Menurut Machin et. al (2006) data dikatakan tersensor jika pengamatan waktu survival hanya sebagian, tidak sampai failure event. Penyebab terjadinya data tersensor antara lain (Le, 2003): 1. Loss to follow up, terjadi bila objek yang kita alami hilang dalam pengamatan. 2. Drop out, terjadi bila perlakuan dihentikan karena alasan tertentu. 3. Termination of study, terjadi bila masa penelitian berakhir sementara objek yang diobservasi belum mencapai failure event.
Sedangkan menurut Kleinbaum dan Klein (2005) ada 3 alasan umum terjadinya penyensoran, yaitu: 1. Objek belum mengalami peristiwa sebelum masa penelitian berakhir. 2. Objek hilang selama masa follow-up ketika masa penelitian
3. Objek ditarik dari penelitian karena kegagalan atau disebabkan alas an lain.
Situasi ini diilustrasikan dengan grafik di bawah ini. Grafik menggambarkan beberapa orang atau objek yang diikuti X menyatakan orang atau objek yang mendapatkan peritiwa.
X Penelitian berakhir
dikeluarkan Penelitian berakhir
hilang X Gambar 2.1 Grafik Data Tersensor
Dalam bukunya Crowder et. al (1991) mengatakan bahwa ada tiga jenis penyensoran, yaitu: 1. Left-censored, pengamatan dikatakan left-cencored jika objek yang diobservasi mengalami peristiwa di bawah waktu yang telah ditetapkan atau ketika masa observasi belum selesai. 2. Right-censored, pengamatan dikatakan right-cencored jika objek masih hidup atau masih beroperasi ketika masa observasi telah selesai. 3. Interval-censored, ketika objek mengalami peristiwa diantara interval waktu
X
tertentu maka pengamatan dikatakan interval-censored.
Menurut Lee dan Wang (2003) ada 3 tipe penyensoran data, yaitu: 1. Tipe I, jika objek-objek diobservasi selama waktu tertentu, namun ada beberapa objek yang mengalami peristiwa setelah periode atau masa observasi selesai, dan sebagian lagi mengalami peristiwa diluar dari yang ditetapkan. 2. Tipe II, masa obsevasi selesai setelah sejumlah objek yang diobservasi diharapkan mengalami peristiwa yang ditetapkan, sedang objek yang tidak mengalami peristiwa disensor. 3. Tipe III, jika waktu awal dan waktu berhentinya observasi dari objek berbeda-beda. Sensor tipe III ini sering disebut sebagai random-censored.
2.1.2. Fungsi Survival dan Fungsi Hazard
Pada analisis survival ada 2 hal yang mendasar yaitu fungsi survival dan fungsi hazard. Fungsi survival merupakan fungsi dasar dari analisis ini, karena meliputi probabilitas survival dari waktu yang berbeda-beda yang memberikan informasi penting tentang data survival. Secara teori, fungsi survival dapat digambarkan dengan kurva mulus dan memilki karakteristik sebagai berikut (Kleinbaum dan Klein, 2005): 1. Tidak meningkat, kurva cenderung menurun ketika t meningkat. 2. Untuk t = 0, S(t) = S(0) = 1 adalah awal dari penelitian, karena tidak ada objek yang mengalami peristiwa, probabilitas dari suatu survival 0 adalah 1. 3. Untuk t = โ, S(t) = S(โ) = 0 secara teori, jika periode penelitian meningkat tanpa limit maka tidak ada satu pun yang bertahan sehingga kurva survival mendekati nol.
Gambar 2.2 Kurva Fungsi Survival
Berbeda dengan fungsi survival yang fokus pada tidak terjadinya peristiwa, fungsi hazard fokus pada terjadinya peristiwa. Oleh karena itu fungsi hazard dapat dipandang senagai pemberi informasi yang berlawanan dengan fungsi survival. Sama halnya dengan kurva fungsi survival, kurva fungsi hazard juga memiliki karakteristik, yaitu (Kleinbaum dan Klein 2005): 1. Selalu nonnegatif, yaitu sama atau lebih besar dari nol 2. Tidak memiliki batas atas
Selain itu fungsi hazard juga digunakan untuk alasan: 1. Member gambaran tentang keadaan failure rate. 2. Mengidentifikasi bentuk model yang spesifik 3. Membuat model matematik untuk analisis survival biasa
h(t)
0
t Gambar 2.3 Kurva Fungsi Hazard
Misalkan T melambangkan waktu survival dari waktu awal sampai terjadinya peristiwa yang merupakan variable acak yang memiliki karakteristik fungsi survival dan fungsi hazard. Jika fungsi survival dinotasikan dengan ๐(๐ก),
didefinisikan sebagai probabilitas suatu objek yang bertahan lebih dari ๐ก waktu,
maka (Le, 2003):
๐(๐ก) = ๐๐(๐ > ๐ก),
(2.1)
๐กโฅ0
๐(๐ก) dikenal juga sebagai rata-rata survival, dan fungsi hazard merupakan laju failure atau kegagalan sesaat dengan asumsi objek telah bertahan sampai waktu ke-t, yang didefinisikan sebagai berikut : ๐(๐ก)
(2.2)
โ(๐ก) = ๐(๐ก)
dengan f(t) adalah fungsi kepadatan probabilitas T. Sekarang misalkan ๐น(๐ก) = ๐ก
Pr(๐ โค ๐ก) = โซ0 ๐(๐ฅ)๐๐ฅ , ๐ก โฅ 0 adalah fungsi distribusi kumulatif dari T, maka fungsi survival menjadi (Korosteleva,2003): โ
๐(๐ก) = ๐๐(๐ > ๐ก) = โซ๐ก ๐(๐ฅ) ๐๐ฅ = 1 โ ๐น(๐ก),
(2.3)
๐กโฅ0
Dan fungsi hazard kumulatif ๐ป(๐ก), didefinisikan sebagai:
๐ก
๐ป(๐ก) = โซ0 โ(๐ฅ)๐๐ฅ๐ก โฅ 0
(2.4)
2.2 Kaplan-Meier
Telah diketahui bahwa salah satu tujuan dari analisis survival ialah mengestimasi dan menginterpretasi fungsi survival dan fungsi hazard. Banyak metode yang digunakan untuk mengestimasi fungsi survival, diantaranya Nelson-Aalen estimator, metode life-table (actuarial), metode Kaplan-Meier, AFT, bayessian counting process dan lain-lain. Namun dalam penelitian ini metode yang digunakan adalah metode Kaplan-Meier. Penelitian ini ialah penelitian statstik nonparametric dengan data tersensor, sehingga penggunaan metode KaplanMeier adalah yang paling baik. Sebenarnya metode life-table sama dengan Kaplan-Meier, namun pada life-table objek di klasifikasikan berdasarkan karakteristik tertentu yang masing-masing karakteristik disusun dengan interval dengan menganggap peluang terjadinya efek selama masa interval adalah konstan, sehingga data yang diperoleh akan lebih umum. Sedangkan pada metode Kaplan-Meier objek dianalisis sesuai dengan waktu aslinya masing-masing. Hal ini mengakibatkan proporsi survival yang pasti karena menggunakan waktu survival secara tepat sehingga diperoleh data yang lebih akurat. Selain itu Kaplan-Meier merupakan metode yang digunakan ketika tidak ada model yang layak untuk data survival. Selama hampir 4 dekade metode estimasi Kaplan- Meier merupakan salah satu dari kunci metode statistika untuk analisis data survival tersensor, estimasi Kaplan-Meier dikenal juga dengan estimasi product limit. Misalkan sebanyak k waktu survival diamati, yang diatur dalam urutan meningkat yaitu ๐ก1 < ๐ก2 < โฏ < ๐ก๐ , andaikan waktu survival diamati secara jelas pada sampel berukuran n dari sebuah populasi yang homogen dengan fungsi
survival ๐(๐ก)(๐ โค ๐๐ ), maka pengestimasi dari fungsi survival ๐(๐ก) ialah (Le,
2003):
๐ฬ (t) =
,tโฅ0
๐๐ = ๐๐๐๐๐ ๐ฆ๐๐๐ ๐๐๐๐๐ ๐๐๐ ๐๐๐๐ข๐ masih bertahan pada ๐ก๐ (1 โค ๐ โค ๐) ๐๐ = menyatakan jumlah objek yang lulus pada ๐ก๐
2.3 Uji Log Rank
Pada statistika, uji log-ran k (uji mantel-cox) adalah sebuah uji hipotesis untuk membandingkan fungsi survival diantara dua kelompok. Uji ini merupakan uji statistik nonparametrik dan sesuai digunakan ketika data tidak simetris yaitu data miring ke kanan. Uji log-rank diperluas untuk analisis stratifikasi, sebagai contoh, pengaruh variabel prognostik yang patut dperhitungkan, dan untuk membandingkan tiga grup atau lebih (Machin et. al, 2006).
Menurut Armitage dan Berry (1987) langkah pengerjaan uji ini ialah menyusun waktu survival, mengurutkan kedua grup yang diobservasi. Misalkan ada dua grup A dan B, jika ๐ก๐ menyatakan waktu ada ๐๐ objek yang mengalami peristiwa
misalnya kelulusan dan ๐๐ด , ๐๐ต masing-masing menyatakan jumlah objek yang memiliki resiko namun masih bertahan dari grup A dan B, maka ekspektasi banyaknya objek yang mengalami peristiwa ialah: ๐ธ(๐๐๐ด ) =
๐๐๐(๐๐๐ด ) =
๐๐๐ด ๐๐ ๐๐
๐๐ (๐๐ โ ๐๐ )๐๐ด ๐๐ต ๐๐2 (๐๐ โ 1)
Uji statistik untuk kesamaan rata-rata peristiwa (misalnya kelulusan) dari kedua grup ialah dengan: ๐22 =
(โ ๐๐๐ด โ โ ๐ธ(๐๐๐ด ))2 (โ ๐๐๐ต โ โ ๐ธ(๐๐๐ต ))2 + โ ๐ธ(๐๐๐ด ) โ ๐ธ(๐๐๐ต )
2.4 Cox Proportional Hazard
Fungsi survival dan fungsi hazard merupakan analisis yang digunakan untuk melihat perbedaan 2 kelompok atau lebih. Namun apabila variabel-variabel kovariat yang ingin dikontrol atau bila menggunakan beberapa variabel penjelas dalam menjelaskan hubungan antara waktu survival maka regresi cox lah yang digunakan. Jadi regresi cox merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan 1 set variabel independen. Variabel independen ini bias kontinu maupun kategorik.
Cox proportional hazard merupakan pemodelan yang digunakan dalam analisis survival yang merupakan model semiparametrik. Regresi cox proportional hazard digunakan bila outcome yang diamati adalah panjang waktu suatu kejadian. Pada mulanya pemodelan ini digunakan pada cabang statistika khususnya biostatistika yaitu digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun seiring perkembangan zaman pemodelan ini banyak dimanfaatkan di berbagai bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik, pertanian dan sebagainya. Menurut Machin et. al (2006) dengan menotasikan rata-rata fungsi hazard โ0 (๐ก), kita dapat menentukan hazard (resiko) objek tertentu โ(๐ก), dengan: โ(๐ก) = ๐(๐ก)โ0 (๐ก)
(2.9)
Dimana ๐(๐ก) adalah fungsi yang mungkin berubah sesuai dengan waktu t. Kemudian persamaan di atas dapat ditulis sebagai rasio dari hazard objek tertentu atau dikatakan sebagai hazard relative, yaitu:
๐(๐ก) =
(2.10)
โ(๐ก)
โ0 (๐ก)
Ketika ๐(๐ก) tidak berubah maka โ(๐ก) = โ, dimana h adalah konstanta. Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi baseline hazard dan bentuk eksponensial untuk penjumlahan linier dari ฮฒiXi ,yaitu penjumlahan dari p variabel independent X (Kleinbaum dan Klein, 2005). โ0 ( t )
ร
baselin hazard melibatkan t tetapi tidak x
๐
๐
โ๐=1 ๐ฝ๐ ๐
๐
Eksponensial melibatkan x tetapi tidak t
Pada model regresi umum, fungsi hazard tergantung pada t dan kovariat dependen ๐ฅ1 (๐ก), ๐ฅ2 (๐ก), โฆ , ๐ฅ๐ (๐ก). Dan pada model cox proportional hazard
sederhana, dimana kovariat ๐ฅ1 , ๐ฅ2 , โฆ , ๐ฅ๐ tergantung pada t maka fungsi hazard
nya adalah sebagai berikut:
โ(๐ก, ๐ฅ1 , ๐ฅ2 , โฆ , ๐ฅ๐ , ๐ฝ1 , ๐ฝ2 , โฆ , ๐ฝ๐ ) = โ0 (๐ก)๐๐ฅ๐{๐ฝ1 ๐ฅ1 + ๐ฝ2 ๐ฅ2 + โฏ + ๐ฝ๐ ๐ฅ๐ } (2.11)
fungsi โ0 (๐ก) dikatakan sebagai fungsi dasar dari hazard, yaitu ketika fungsi hazard dari objek yang nilai semua kovariatnya adalah nol (biasanya sebagai hipotesis) (Korosteleva, 2003). Karakteristik penting dari formula ini ialah mengenai asumsi propotional hazard yuitu baseline hazard ialah fungsi dari t tetapi tidak melibatkan variabel X. Berbeda dengan bentuk eksponensial yang melibatkan variabel X tetapi tidak melibatkan t. X dikatakan time-independent (tidak tergantung waktu). Asumsi pada model cox proportional hazard ialah hazard rasio yang membandingkan 2 kategori dari variabel independen adalah konstan pada setiap waktu atau tidak bergantung pada waktu. Apabila asumsi ini tidak dipenuhi maka model yang digunakan extended cox model. Karakteristik lainnya dari model cox ialah
baseline hazard, h0 (t), ialah fungsi yang tidak ditentukan. Inilah yang membuat cox proportional hazard merupakan model semiparametrik. Model cox proportional hazard merupakan pemodelan yang sangat terkenal pada analisis kesintasan. Menurut Kleinbaum dan Klein (2005) hal yang menyebabkan model ini terkenal dan digunakan secara luas antara lain: 1. Model cox merupakan model semiparametrik 2. Dapat mengestimasi hazard ratio tanpa perlu h0 (t) atau baseline hazard function. 3. Dapat mengestimasi h0 (t), h(t, X), dan fungsi kesintasan walaupun h0 (t) tidak spesifik. 4. Merupakan model robust sehingga hasil dari model cox hampir sama dengan hasil model parametrik. 5. Model yang aman dipilih ketika berada dalam keraguan untuk menentukan model parametriknya, sehingga tidak ada ketakutan tentang pilihan model parametrik yang salah 6. Lebih baik daripada model logistik ketika tersedianya informasi tentang waktu survival dan adanya pensensoran.
2.5 Faktor Lama Studi Mahasiswa
Pendidikan adalah suatu aktivitas sosial yang memungkinkan masyarakat tetap ada dan berkembang. Salah satu jenjang pendidikan yang menjadi persyaratan dasar dalam mencari pekerjaan adalah perguruan tinggi, yang mana perguruan tinggi akan mempersiapkan calon-calon sarjana yang handal dan mempunyai keterampilan dibidangnya. Pada dasarnya setiap perguruan tinggi berusaha semaksimal mungkin meningkatkan mutu kelulusan para mahasiswanya, baik secara kuantitas maupun kualitas. Secara kuantitas diharapkan jumlah mahasiswa yang lulus sama dengan yang terdaftar. Sedangkan secara kualitas diharapkan para mahasiswa dapat lulus dengan IPK yang maksimal dan tepat waktu.
Berdasarkan hal tersebut faktor-faktor yang mempengaruhi kualitas mahasiswa perlu diperhatikan baik dari internal maupun eksternal. Faktor internal yang mempengaruhi kualitas adalah indeks prestasi kumulatif (IPK) dan jalur masuk. Faktor eksternal yang mempengaruhi kualitas adalah asal daerah sekolah SMA, status sekolah SMA dan penghasilan orang tua.
1. Asal daerah sekolah Biasanya mahasiswa yang berasal dari luar daerah akan memiliki daya juang yang tinggi karena ia menyadari orang tuanya sudah berusaha dengan keras untuk memenuhi biaya pendidikannya baik biaya kost, makan, dan biaya kuliah sehingga ia akan berusaha untuk lulus secepat mungkin atau tepat waktu.
2. Status Sekolah Latar belakang pendidikan yang baik akan menghasilkan mahasiswa yang rajin dan disiplin. Hal itu bisa menjadi dasar yang kuat untuk sukses dalam studinya.
3. IPK (Indeks Prestasi Kumulatif) Seorang lulusan dikatakan baik apabila lulus tepat waktu atau waktu lama studi tidak lebih dari 4 tahun (48 bulan) untuk jenjang Strata 1 (S1) dan diikuti dengan nilai atau Indeks Prestasi Kumulatif (IPK) yang baik pula. Berdasarkan buku Akademik Universitas Sumatera Utara, waktu lama studi adalah waktu yang dibutuhkan seorang mahasiswa untuk menyelesaikan pendidikan sesuai dengan jenjang masing-masing. IPK adalah alat ukur berupa angka yang menunjukkan prestasi atau kemajuan belajar mahasiswa secara kumulatif mulai dari semester pertama sampai dengan semester paling akhir yang telah ditempuh. Menurut buku Panduan Mahasiswa Universitas Sumatera Utara, pendidikan program S1 dijadwalkan untuk diselesaikan dalam 8 semester (4 tahun) atau dapat ditempuh kurang dari 8 semester dan selama-lamanya 12 semester (6 tahun). Mahasiswa dikatakan lulus dari PT apabila telah memenuhi syarat kelulusan yakni telah berhasil mengumpulkan sejumlah SKS (satuan kredit semester) yang telah
ditetapkan di dalam kurikulum masing-masing program studi, pada program Managemen yaitu sebanyak 144 sks.
4. Penghasilan orang tua Orang tua yang mempunyai penghasilan yang baik akan mampu membiayai pendidikan mahasiswa. Sehingga mahasiswa bisa fokus dalam belajar karena tidak harus bekerja keras untuk mencari biaya kuliah.
5. Jalur masuk Mahasiswa yang masuk melalui jalur mandiri biasanya lebih santai dibandingkan mahasiswa yang masuk melalui ujian tertulis, karena untuk masuk ke perguruan tinggi ia harus berjuang keras (usaha yang sungguh-sungguh) sehingga ia akan sangat menghargai usahanya.