BAB II TINJAUAN PUSTAKA
2.1
Regresi Logistik Regresi adalah bagaimana satu variabel yaitu variabel dependen dipengaruhi oleh satu atau lebih variabel lain yaitu variabel independen dengan tujuan untuk memprediksi nilai rata-rata variabel dependen didasarkan pada nilai variabel independen yang telah diketahui. Tujuan utama regresi adalah untuk memprediksi nilai variabel dependen berdasarkan satu atau lebih variabel independen (Widarjono, 2010). Banyak kasus dalam analisis regresi dimana variabel dependennya bersifat kualitatif. Variabel dependen ini bisa mempunyai dua kelas atau kategori (biner) dan lebih dari 1 kelas (multinomial). Salah satu pendekatan yang digunakan untuk mengestimasi model regresi dengan variabel dependen bersifat kualitatif adalah dengan model probabilitas logistik atau disingkat logit (Widarjono, 2010). Agresti (2007) menyatakan bahwa variabel dalam regresi logistik dapat berupa kategori atau kualitatif. Menurut Hosmer dan Lemeshow (1989), tujuan melakukan
analisis
data
menggunakan
regresi
logistik
adalah
untuk
mendapatkan model terbaik dan sederhana, namun model tersebut sejalan dengan tinjauan dari ilmu biologi untuk menjelaskan hubungan di antara hasil (variabel respon) dengan variabel-variabel bebas (variabel penjelas). 2.2
Regresi Logistik Biner Regresi logistik biner merupakan suatu metode analisis data yang digunakan untuk mencari hubungan antara variabel respon (y) yang bersifat
5
6
biner atau dikotomus dengan variabel prediktor (x) yang bersifat polikotomus (Hosmer dan Lemeshow, 2000). Keluaran dari variabel respon y terdiri dari 2 kategori yang biasanya dinotasikan dengan y =1 (sukses) dan y=0 (gagal). Hosmer dan Lemeshow (2000) menjelaskan bahwa model regresi logistik dibentuk dengan menyatakan nilai P(Y = 1│x) sebagai π (x) yang dinotasikan sebagai berikut: g( )=
( )
(2.1)
( )
Suatu fungsi dari π(x) dicari dengan menggunakan transformasi logit, yaitu g(x) yang dapat dinyatakan sebagai berikut: g ( ) = ln [
[ ( )] ( )]
= β0 + β 1x 1 + ⋯ . + β2x 2
(2.2)
Pengujian terhadap parameter-parameter model dilakukan baik secara simultan maupun secara parsial. Menurut Hosmer dan Lemeshow (2000), pengujian parameter model secara simultan menggunakan uji nisbah kemungkinan (Likelihood Ratio Tesis), dengan hipotesis. Menurut Kleinbaum dan Klein (2002), regresi logistik adalah suatu model pendekatan matematika yang digunakan untuk menggambarkan hubungan antara beberapa vaiabel penjelas dengan suatu variabel dikotomi. Variabel dikotomi mempunyai dua kemungkinan yang biasanya dinyatakan dengan 0 (gagal) dan 1 (sukses). Diberikan model sebagai berikut: yi = β0 + β1x1i+……+βpxpi + εi
εi ~ N(0,σ2)
(2.3)
Jika Y diberi 0 dan 1, maka P(Yi = 1│X = xi) = π(xi) dan P(Yi = 0│X = xi ) =1-π (xi), nilai harapan dari (yi│xi) adalah E(yi│xi )= π( xi ) Persamaan umum untuk regrsi logistik biner adalah
(2.4)
7
⋯….
π( xi )=
⋯….
(2.5)
Persamaan (1) mempunyai bentuk yang tidak linier. Untuk membuatnya menjadi persamaan yang linier, maka digunakan transformasi log dari odd rasio atau disebut juga transformasi logit. Berikut ini adalah logit dari persamaan (1): ( ) ( )
= β0+ β1x1i +……+ βp xpi
(2.6)
dengan hipotesis: H0 : βi =…..=βp = 0 H1 : minimal ada satu βi ≠ 0 ; i = 1,2,….p statistik uji G dirumuskan: G = -2ln
(2.7)
Diketahui Lo adalah fungsi kemungkinan tanpa peubah penjelas dan merupakan kemungkinan dengan peubah penjelas. Mengasumsikan H0 benar, statistik uji G akan mengikuti sebaran khi kuadrat dengan derajat bebas p. Keputusan tolak H0 jika G > α 2p(α). Interpretasi koefisien untuk model regresi logistik biner dapat dilakukan dengan menggunakan nilai rasio oddsnya. Odds sendiri dapat diartikan sebagai rasio peluang kejadian sukses dengan kejadian tidak sukses dari peubah respon. Rasio odds mengindikasikan seberapa lebih mungkin munculnya kejadian sukses pada suatu kelompok dibandingkan dengan kelompok lainnya. Rasio odds didefinisikan sebagai: Ψ = exp ( ) = exp [g(1)-g(0)]
(2.8)
Interpretasi dari rasio odds ini adalah kecenderungan untuk Y= 1 pada X=1 sebesar Ψ kali dibandingkan pada X= 0 .
8
2.3
Penaksiran Parameter Untuk penaksiran parameter regresi logistik dapat dilakukan dengan dua cara yaitu: a. Maximum Likelihood Estimation (MLE). Metode
ini
pada
dasarnya
memberikan
nilai
estimasi
β
untuk
memaksimumkan fungsi likelihood (Hosmer dan Lemeshow 1989). Secara matematis fungsi likelihood (xi.yi) dapat dinyatakan: f(xi) =π (xi)yi [1-π(xi)]1-yi karena
setiap
pengamatan
diasumsikan
independen
(2.9) maka
fungsi
likelihoodnya merupakan perkalian antara masing-masing fungsi likelihood yaitu: l (β) = ∏
( )
(2.10)
dan logaritma likelihoodnya dinyatakan sebagai: L (β) = ln [l(β)] =∑
( ) +( −
.
)
− ( )
(2.11)
Untuk memperoleh nilai β maka dengan memaksimumkan nilai L(β) dan mendiferensialkan L(β) terhadap β dan menyamakannya dengan nol. Persamaan ini dapat ditulis dalam bentuk sebagai berikut: ∑
[
− ( )] = 0
(2.12)
Dan persamaan likelihood: ∑
[
− ( )] = 0
(2.13)
b. Metode Newton Rhapson Metode ini merupakan metode untuk menyelesaikan persamaan nonlinier seperti menyelesaikan persamaan likelihood dalam model regresi logistik
9
(Agresti, 1990). Metode newton rhapson memerlukan taksiran awal untuk nilai fungsi maksimumnya, yang mana fungsi tersebut merupakan taksiran yang menggunakan pendekatan polynomial berderajat dua. Dalam hal ini untuk menentukan nilai Andaikan q’=
+
dari β yang merupkan fungsi maksimum dari g(β). , … , dan andaikan H dinotasikan sebagai matriks
yang mempunyai anggota hab =
.
. Andaikan q
(t)
dan H(t) merupakan
bentuk evaluasi dari β(t), taksiran t pada β. Pada langkah t dalam proses iterasi (t = 0,1,2,…), g(β) ialah pendekatan β(t) yang merupakan bentuk orde kedua dari ekspansi deret Taylor. Q(t) (β)=gβ(t)+q (t)’(β-β(t))+( )(β-β(t))H(t)( (β-β(t) ) Penyelesaian: ( )
= q(t)+H(t) (β-β(t) )= 0
Β(t+1)= β(t)-(H(t))-1q (t) Dengan mengansumsikan H(t) sebagai matriks nonsingular. 2.4
Pengujian Signifikansi Parameter Setelah menaksir parameter maka langkah selanjutnya yang dilakukan adalah menguji signifikansi parameter tersebut. Untuk itu digunakan uji hipotesis statistik untuk menentukan apakah variabel terikat berpengaruh signifikansi parameter dilakukan sebagai berikut: 2.4.1
Uji parsial Digunakan untuk menguji apakah setiap βi secara individual. Hasil
pengujian secara parsial/individual akan menunjukan apakah suatu variabel terikat layak untuk masuk dalam model atau tidak (Agresti, 1990).
10
Hipotesis : H0 : βi = 0 H0 : βi ≠ 0 Statistik Uji : Wald (W) =
(
)
Rasio yang dihasilkan dari statistik uji, dibawah hipotesis H0 akan mengikuti sebaran normal baku (Hosmer dan Lemeshow, 1989). Sehingga untuk memperoleh keputusan dilakukan perbandingan dengan distribusi normal baku (Z). kriteria penolakan (tolak H0 ) jika nilai W>Zα/2 2.4.2
Uji Serentak Uji serentak disebut juga uji model chi-square, dilakukan sebagai upaya
memeriksa peranan variabel terikat dalam model secara bersama-sama. Hipotesis : H0 : β1 = β2=……..= β k = 0 H1 : paling sedikit ada satu β1 ≠ 0 (i = 1,2,….,k) Statistik uji yang digunakan adalah statistic uji G atau Likelihood Ratio Test: G2 = -2ln = −2
( ∏
)
( (
) )(
)
(2.14)
Atau : G2 = 2
{∑
[yi ln(πi)+(1-yi)ln(1-πi)]-[n1ln(n1)+n0ln(n0)-nln(n)]
dimana: n1 = banyaknya observasi berkategori 1 n0 = banyaknya observasi berkategori 0
}
11
n = banyaknya observasi (n1+n0) L1 = Likelihood tanpa variabel terikat tertentu Statistic uji G2 mengikuti distribusi chi-square, sehingga untuk memperoleh keputusan dilakukan perbandingan dengan X2 tabel. Dimana derajat bebas = k (banyaknya variabel terikat). Kriteria penolakan (tolak H0) jika nilai G > X2(db,α). 2.5
Interpretasi Model Pengujian Signifikansi Parameter Proses selanjutnya adalah mendapatkan interpretasi terhadap model pengujian signifikansi parameter tersebut. Interpretasi koefisien parameter diharapkan dapat menjelaskan tiga hal: a.
Menjelaskan hubungan fungsional antara variabel bebas dan variabel terikat
b.
Menentukan unit-unit perubahan setiap variabel independen
c.
Mendapatkan nilai odds rasio yang menunjukk perbandingan tingkat kecenderungan dari kedua kategori dalam satu variabel terikatnya.
Pada regresi logistik, dalam menginterpretasikan parameter digunakan Odds ratio ( ) . Jika variabel respon y dikategorikan dalam 2 kategori dan dinyatakan dengan 0 dan 1 dan variabel prediktor juga dibagi dalam 2 kategori dan dinyatakan dengan kode 0 dan 1. Sehingga pada model berikut ini ada 2 nilai ( x ) dan 2 nilai 1- ( x ) , menurut Hosmer dan Lemeshow (1989) dapat
ditunjukkan pada tabel 2.1 berikut ini.
12
Tabel 2.1 Nilai model regresi logistik untuk x biner Variabel bebas X1 Variabel
y1
π(1) =
terikat y2
X2 π(0) =
1+
1 − π(1) =
1 1+
1+
1 − π(0) =
1 1+
Dengan menggunakan model regresi logistik sesuai tabel diatas maka odds ratio menjadi:
e( 0 1 ) 1 1 e( 0 1 ) 1 e 0 e 0 1 0 e 1 0 e e 1 0 ( 0 1 ) 1 e 1 e
(2.13)
Sehingga ln odds ratio atau perbedaan logitnya adalah ln ln e 1 1 Nilai odds ratio menunjukkan kecenderungan hubungan suatu variabel pengamatan x terhadap objek pengamatan y. Bila nilai 1 , maka antara kedua variabel tersebut tidak terdapat hubungan. Bila 1 , maka terdapat hubungan negatif terhadap perubahan nilai x bila bernilai benar dan demikian sebaliknya bila 1 . 2.6
Kanker Payudara (Breast Cancer) Breast cancer adalah suatu penyakit neoplasma ganas yang merupakan suatu pertumbuhan jaringan payudara abnormal yang berbeda dengan jaringan disekitarnya (Pane, 2007). Pertumbuhan sel yang abnormal pada jaringan payudara seseorang. Payudara wanita terdiri dari lobulus (kelenjar susu), duktus
13
(saluran susu), lemak dan jaringan ikat, pembuluh darah dan limfe. Sebagian besar breast cancer bermula pada sel-sel yang melapisi duktus (kanker duktal), beberapa bermula di lobulus (kanker lobular), serta sebagian kecil bermula di jaringan lain. Sesuai dengan urutan kanker leher Rahim (serviks) merupakan kanker pembunuh wanita nomor satu di Indonesia dan peringkat kedua di dunia setelah breast cancer (Messwati, 2005). Kanker juga merupakan salah satu penyakit tidak menular yang menjadi masalah kesehatan masyarakat, baik di dunia maupun di Indonesia. Pada breast cancer dimana kondisi sel telah kehilangan pengendalian dan mekanisme normalnya, sehingga mengalami pertumbuhan yang tidak normal, cepat dan tidak terkendali (Hawari, 2004). Efek jangka panjang dari mastektomi berpengaruh sangat besar terhadap kualitas hidup karena rasa sakit dan ketidaknyamanan berikutnya. Pembedahan untuk breast cancer adalah pengalaman yang sangat traumatis dan menakutkan (Galgut, 2010) Abnormal ganas adalah kanker, tumor-tumor ganas dapat menyerang dan merusak jaringan disekitarnya bermetastasis (sel kanker
dan menyebar ke bagian lain dari tubuh,
melepaskan diri dari tumor ganas dan memasuki
aliran darah atau sistem limfatik untuk membentuk tumor sekunder di bagian lain dari tubuh). Ada dua jenis kalsifikasi payudara; a. Makrokalsifikasi (macrocalcifications) adalah klasifikasi yang lebih besar dari 2 mm dan biasanya bukan merupakan indikasi untuk breast cancer. b. Mikrokalsifikasi (Microcalcification) adalah kalsifikasi lebih kecil dari 1 mm yang berkaitan dengan breast cancer. Mereka dapat muncul dalam pola yang berbeda. Jumlah mikrokalsifikasi (microcalcification), pengelompokan
14
mereka terhadap kalsifikasi dan polanya memberikan indikasi untuk kanker payudara (Radstake, 2010). Sun, dkk (2002) menyajikan sebuah pohon biner classifier didasarkan pada penggunaan fitur global yang diambil dari berbagai tingkat dekomposisi 2-D wavelet Quincunx gambar daerah normal dan abnormal. Ada dua jenis kesalahan utama klasifikasi: (1) adalah karena tepi jaringan kepadatan normal yang terang, (2) adalah karena batas antara otot-otot dada dan daerah payudara, yang sebagian besar ditampilkan dalam tampilan MLO. Fitur karakteristik perlu diselidiki lebih lanjut dalam rangka meningkatkan efisiensi pohon keputusan classifier dan mengurangi tingkat kesalahan klasifikasi klinis kritis daerah abnormal (Sun, Babbs, dan Delp, 2002). Kebanyakan breast cancer memiliki asal usul mereka dalam sel-sel dari saluran (ducts) dan beberapa di sel-sel dari lobulus, yang memproduksi kelenjar susu (Radstake, 2010). Pasien yang telah menjalani mastektomi akan merasa cemas terhadap penyakit breast cancer yang mungkin belum hilang sepenuhnya dari tubuhnya (Maguire dan parkes, 1998). Gejala breast cancer Pada tahap awal Breast Cancer, biasanya tidak merasakan sakit atau tidak ada tanda-tandanya sama sekali. Namun, ketika tumor semakin membesar, gejala-gejala ini mungkin muncul (Anita, 2007) 1. Benjolan yang tidak hilang atau permanen dan menggumpal, biasanya tidak sakit dan terasa keras bila disentuh atau penebalan pada kulit payudara atau disekitar ketiak.
15
2. Perubahan ukuran dan bentuk payudara 3. Kerutan pada kulit payudara 4. Keluar cairan tidak normal dari puting susu yang berubah nanah, darah, cairan encer atau keluar air susu pada ibu tidak hamil atau tidak sedang menyusui. 5. Pembengkakan atau adanya tarikan pada puting susu.