Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
METODE REGRESI LOGISTIK
ABSTRAK
UNTUK MENGANALISIS FAKTOR RISIKO PENYAKIT JANTUNG
Penyakit jantung koroner (PJK) adalah
KORONER
suatu kelainan yang disebabkan oleh penyempitan
Astri Atti*
atau
penghambatan
pembuluh arteri. PJK dipengaruhi oleh beberapa faktor di antaranya hipertensi, hiperkolesterol,
ABSTRACT
diabetes
mellitus,
merokok, obesitas, kurang olah raga, Coronary heart disease (CHD) is an
riwayat keluarga, stress, umur, dan bahkan
anomaly that caused by constriction of
jenis kelamin. Metode regresi logistik
artery.
by
merupakan metode yang dapat digunakan
hypercholesterol, hypertension, diabetes
untuk mengungkapakan asosiasi antara
mellitus, smoking, obesity, sport less,
peubah respon dan peubah penjelas untuk
genetic, stress, age, and even sex. Logistic
data-data
regression method was used for describing
menggunakan 827 responden terdiri atas
association between dependent variable
52% penderita PJK dan 48% bukan
and independent variables to categorical
penderita PJK. Tujuan penelitian ini yaitu,
data. There are 827 respondents consist of
untuk menelusuri faktor risiko
52% CHD patient and 48% non CHD
mempengaruhi PJK dengan menggunakan
patient. The goal of this research are to
metode regresi logistik, serta mementukan
investigate risk factor that influences CHD
hasil klasifikasinya. Hasil metode regresi
by logistic regression method, also to
logistik menunjukkan bahwa faktor yang
determine result of classification it. The
mempengaruhi PJK adalah hiperkolesterol,
result of logistic regression method shows
diabetes, Indeks Massa Tubuh (IMT) dan
that CHD status are influenced by
umur dengan total kesalahan klasifikasi
hypercholesterol, diabetes, body mass
sebesar 32,8%.
index
Kata Kunci : regresi logistik, penyakit
CHD
(BMI)
is
and
influenced
age
with
total
misclassification rate is about 32,8%.
kategorik.
Penelitian
ini
yang
jantung koroner, kesalahan klasifikasi
Keywords : logistic regression, coronary heart disease, misclassification
1331
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
Badan Kesehatan Dunia (WHO), mencatat
mengungkapkan
lebih dari 7 juta orang meninggal akibat
hubungan antara dua kelompok peubah,
penyakit jantung koroner di seluruh dunia
yaitu peubah respon dengan sekelompok
pada tahun 2002. Angka ini diperkirakan
peubah penjelas termasuk untuk data-data
akan meningkat hingga 11 juta orang pada
kategorik.
Penerapan
tahun 2020. Badan Kesehatan Dunia
statistika
banyak
memperkirakan bahwa penyakit jantung
penelitian berbagai disiplin ilmu seperti
koroner dan stroke pada tahun 2020 akan
pertanian,
menjadi
kesehatan/kedokteran.
penyebab
terbanyak
kasus
keterkaitan
atau
metode
analisis
digunakan
dalam
sosial,
dan
Regresi
logistik
kematian di seluruh dunia, seiring dengan
adalah salah satu dari metode analisis
perubahan
masyarakat
statistika yang ada. Penelitian ini bertujuan
(Fitriani 2007). Pada tahun 2000 kasus
untuk menelusuri faktor risiko yang secara
penyakit jantung koroner di Rumah Sakit
nyata
Medistra
menggunakan metode regresi logistik serta
pola
hidup
sebanyak 1173 kasus, tahun
mempengaruhi
menentukan
tahun 2002 jumlah kasus PJK sebanyak
tersebut.
1213 kasus. Selanjutnya, data penyakit
MATERI DAN METODE
jantung koroner di Rumah Sakit Dr.
Data yang digunakan dalam penelitian ini
Wahidin
2004
adalah data sekunder dari hasil penelitian
sebanyak 336 kasus, tahun 2005 sebanyak
yang dilakukan di Rumah Sakit Umum Dr.
311 kasus dan tahun 2006 sebanyak 332
Wahidin Sudirohusodo Makassar tahun
kasus (Data morbiditas rekam medik rawat
2004-2007 oleh Kamar (2004) dan Fitriani
inap dalam Fitriani (2007). Menurut
(2007) terhadap pasien yang dirawat di
Palilati (2003), berbagai faktor dapat
rumah sakit tersebut yang datang berobat
menjadi
ke
penyebab
tahun
penyakit
jantung
poliklinik
klasifikasi
dengan
2001 terdapat 1158 kasus, sedangkan
Sudirohusodo
hasil
PJK
penyakit
dalam
metode
yang
hipertensi,
dinyatakan menderita penyakit jantung
mellitus,
koroner (PJK) dan yang tidak menderita
merokok, obesitas, kurang olah raga,
PJK dengan jumlah pasien sebanyak 827
riwayat keluarga, stres, umur dan bahkan
orang. Peubah yang diamati adalah pasien
jenis kelamin.Permasalahan yang kadang
yang menderita penyakit jantung koroner
dihadapi para peneliti dalam bidang
(y=1) dan yang tidak (y=0) menurut kartu
kesehatan maupun dalam bidang penelitian
rekam medik pasien.
lain yaitu bagaimana seorang peneliti bisa
Peubah-peubah penjelasnya adalah:
koroner
di
hiperkolesterol,
antaranya diabetes
1332
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
Peubah penjelas Hipertensi
Kate gori
D1
D2
Ya
1
Tidak
0
Ya
1
Tidak
0
Ya
1
Tidak
0
IMT (Indeks Massa
Kurus
1
0
Tubuh)
Normal
0
0
Hiperkolesterol
Diabetes
D3
D4
Pembanding
Tabel 1 Pengkodean peubah penjelas kategorik
1333
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
Gemuk
0
1
< 40
0
0
0
0
40-49
1
0
0
0
50-59
0
1
0
0
60-69
0
0
1
0
> 69
0
0
0
1
Laki-laki
1
Perempua
0
Umur
Jenis kelamin
n Keterangan : D : Peubah dummy : Sebagai pembanding
Metode Regresi Logistik
Menurut Hosmer & Lemeshow (2000),
Analisis regresi logistik adalah analisis
hasil pengamatan yang memiliki p peubah
yang digunakan untuk melihat hubungan
penjelas yang ditunjukkan oleh vektor x’=
antara peubah respon berupa data kualitatif
(X1,X2,…,Xp) yang berpasangan dengan
dengan
peubah-peubah
penjelas
yang
peubah respon Y yang bernilai 1 dan 0, di
berupa
data
maupun
data
mana y=1
kualitatif
menyatakan
bahwa respon
kuantitatif. Peubah respon dalam regresi
memiliki kriteria yang ditentukan dan y=0
logistik dapat dalam bentuk dikotom
tidak memiliki kriteria yang ditentukan
(biner) maupun polikotom (ordinal atau
merupakan regresi logistik peubah respon
nominal).
biner.
Fungsi regresi logistik antara π(x) dan x adalah : x
exp g(x) ......... (1) 1 exp g(x)
Fungsi regresi di atas berbentuk curvilinear sehingga untuk membuatnya menjadi fungsi linier dilakukan transformasi logit sebagai berikut (Agresti 1990) :
(x) logit [(x)] ln g(x) 1 (x) dimana
g(x) 0 1X1 2 X 2 ... p X p .. (2)
merupakan logit (Hosmer & Lemeshow 2000). 1332
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
Pengujian kesesuaian model dilakukan
nyata pada nilai α yang ditentukan maka
secara simultan dengan menggunakan
peubah tersebut dikeluarkan dari model
statistik
parsial
dan jika nyata maka akan tetap berada
menggunakan statistik uji Wald. Pemilihan
dalam model (Gonzales 2003). Menurut
peubah penjelas menggunakan metode
Hosmer dan Lemeshow (2000), rasio odds
backward elimination, diawali dengan
dilambangkan
semua peubah dimasukkan ke dalam
diinterpretasikan sebagai
model kemudian peubah akan diuji satu
y=1
persatu. Jika ditemukan peubah yang tidak
dibandingkan pada x=0.
uji-G
dan
secara
pada
sebagai
x=1
ψ=exp(βi)
dan
kecenderungan
sebesar
ψ
kali
Selang kepercayaan (1-α)100% bagi rasio odds adalah :
exp[ˆ i Z1 / 2Sˆ E(ˆ i )] .....(3) sedangkan selang kepercayaan (1-α)100% bagi π(x) yaitu : ˆ
e g ( x ) Z1 / 2SE[ g ( x )] ˆ
ˆ
ˆ
1 e g ( x ) Z1 / 2SE[ g ( x )] ˆ
ˆ
.......(4)
dimana :
Sˆ Egˆ (x) Vaˆr gˆ (x) .......... (5) p
dan
p
p
Vâr[ĝ(x)] x 2j Vaˆr(ˆ j ) 2x j x k Coˆ v(ˆ j , ˆ k ) ... (6) j0
j0 k j1
Ketepatan dan Kesalahan Klasifikasi
amatan. Untuk memperoleh ketepatan
Menurut Hosmer dan Lemeshow (2000)
klasifikasi (correct classification) terhadap
salah satu ukuran kebaikan model dalam
amatan harus menentukan nilai cutpoint
regresi logistik adalah jika memiliki
(c) dan dibandingkan dengan peluang
peluang salah klasifikasi yang minimal.
dugaan π(x). Jika π(x) lebih besar atau
Ketepatan dan kesalahan klasifikasi dari
sama
model
termasuk pada respon y = 1 dan selain itu
dapat
mengunakan
diketahui tabel
dengan klasifikasi
dengan
c
maka
nilai
dugaan
y = 0.
(classification table). Tabel klasifikasi
Ketepatan
untuk peubah respon dikotom terdiri atas
classification) terbagi atas dua yaitu
dua kolom nilai dugaan dan dua baris nilai
specificity dan sensitivity. Specificity atau 1331
klasifikasi
(correct
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
ketepatan
klasifikasi
dalam
menduga
kesalahan
kejadian bahwa respon tidak memiliki
klasifikasi
dalam
menduga
kejadian secara keseluruhan.
kriteria yang ditentukan (y=0) dinyatakan sebagai persentase dari dugaan terkoreksi
HASIL DAN PEMBAHASAN
atau nilai dugaan yang sama dengan nilai
Hasil metode regresi logistik
amatan pada kategori nilai amatan y=0.
Model yang dihasilkan dengan melibatkan
Pengertian yang sama juga berlaku untuk
semua peubah penjelas dapat dilihat pada
mengevaluasi ketepatan klasifikasi dalam
Tabel
menduga kejadian bahwa respon memiliki
menunjukkan bahwa model nyata pada α =
kriteria yang ditentukan (y=1) atau disebut
5%. Hal ini dapat dilihat dari statistik-G
juga sensitivity, sedangkan total correct
sebesar 147,400 dengan nilai-p sebesar
classification yaitu ketepatan klasifikasi
0,000. Berdasarkan uji Wald terlihat
dalam
secara
bahwa peubah hipertensi, IMT(kurus) dan
keseluruhan. Selain ketepatan klasifikasi
jenis kelamin tidak nyata pada model
dapat pula diketahui besarnya kesalahan
sehingga
klasifikasi
terhadap
menduga
kejadian
(misclassification
rate).
2.
Pengujian
akan
secara
simultan
dilakukan
pereduksian
peubah-peubah
tersebut.
Kesalahan klasifikasi dalam menduga
Pereduksian
model
kejadian respon terdiri atas kesalahan
metode
backward
positif dan kesalahan negatif. Kesalahan
Berdasarkan Tabel 2, diperoleh tiga tahap
positif
pereduksian yaitu tahap pertama dengan
dinyatakan
sebagai
persentase
dilakukan
dengan
elimination.
besarnya kesalahan ketika respon diduga
menghilangkan
IMT(kurus)
yang
memiliki kriteria yang ditentukan (y=1)
mempunyai nilai-p terbesar, tahap kedua
tapi amatan sebenarnya bernilai y=0 dan
dengan menghilangkan peubah hipertensi
sebaliknya kesalahan negatif dinyatakan
dan tahap ketiga dengan menghilangkan
sebagai persentase besarnya kesalahan
peubah jenis kelamin.
ketika respon diduga tidak memiliki
Tahap ketiga adalah tahap terakhir yang
kriteria yang ditentukan (y=0) namun
merupakan model terbaik yang diperoleh
amatan sebenarnya bernilai y=1. Total
dari hasil pereduksian.
misclassification rate diartikan sebagai Tabel 2 Hasil analisis regresi logistik model penuh Peubah Penjelas Intersep
βi -2,091
SE 0,330
Wald -6,336
1332
Ni
Rasio
SK 95% untuk
lai-p
Odds
Rasio Odds
0,000
0,000
-
-
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
Hipertensi
-0,163
0,159
-1,025
0,306
0,850
0,623 1,160
Hiperkolesterol
1,380
0,159
8,679
0,000*
3,975
2,910 5,430
Diabetes
0,461
0,171
2,696
0,007*
1,586
1,134 2,216
IMT(Gemuk)
0,780
0,168
4,643
0,000*
2,182
1,570 3,033
IMT(Kurus)
-0,014
0,604
-0,023
0,982
0,986
0,302 3,219
Umur(>69)
1,101
0,387
2,845
0,004*
3,007
1,409 6,416
Umur(60-69)
0,953
0,325
2,932
0,003*
2,593
1,371 4,905
Umur(50-59)
0,995
0,315
3,159
0,002*
2,703
1,457 5,016
Umur(40-49)
0,897
0,322
2,786
0,005*
2,453
1,305 4,611
Jenis Kelamin
-0,222
0,154
-1,442
0,150
0,801
0,593 1,084
Statistik-G = 147,400 * Nyata pada α = 5% Nilai-p = 0,000
Tabel 3 Hasil analisis regresi logistik model Backward Elimination (tahap III) Peubah
Nilai-
Rasio
SK 95% untuk
p
Odds
Rasio Odds
βi
SE
Intersep
-2,203
0,323
-6,820
0,000
0,000
-
-
Hiperkolesterol
1,392
0,158
8,755
0,000*
4,024
2,949
5,490
Diabetes
0,435
0,170
2,559
0,011*
1,544
1,106
2,156
IMT
0,781
0,165
0,000*
2,183
1,580
3,017
0,007*
2,782
1,315
5,885
0,007*
2,364
1,265
4,418
Penjelas
(Gemuk) Umur
4,733 1,023
0,382
(>69) Umur (60-69)
Wald
2,678 0,860
0,319 2,696
1332
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
Umur
0,929
0,312
(50-59)
0,003*
2,531
1,373
4,666
0,009*
2,314
1,238
4,327
2,978
Umur
0,839
0,319
(40-49)
2,630 * Nyata pada α = 5%
Statistik-G = 144,142
Nilai-p = 0,000
Dari hasil model reduksi (Tabel 3)
4,666 kali, dan pasien yang berumur 40-49
diperoleh nilai statistik-G sebesar 144,142
tahun berisiko antara 1,238 kali sampai
dengan nilai-p sebesar 0,000 yang berarti
4,327 kali untuk menderita PJK. Semua
secara
bahwa
kategori umur dibandingkan dengan umur
model nyata pada α = 5%. Hasil uji Wald
<40 tahun. Untuk menduga peluang
juga menunjukkan bahwa peubah PJK
seseorang akan terkena PJK diperlukan
dipengaruhi oleh faktor hiperkolesterol,
matriks
diabetes,
Umur(>69),
dianalisis dengan menggunakan persamaan
Umur(60-69), Umur(50-59) dan Umur(40-
(2), persamaan (4), persamaan (5) dan
49) pada α = 5%.
nilai
persamaan (6) maka diperoleh nilai selang
selang kepercayaan 95% bagi rasio odds
kepercayaan (SK) 95% bagi π(x). SK
menunjukkan
penderita
tersebut menyatakan nilai dugaan peluang
hiperkolesterol dibandingkan yang tidak
terkena PJK (untuk 15 kombinasi kategori)
hiperkolesterol berisiko paling rendah
berdasarkan peubah penjelas yang nyata
2,949 kali dan paling tinggi 5,49 kali untuk
(Tabel 4). Berdasarkan kasus yang terjadi
menderita PJK. Penderita diabetes berisiko
di
antara 1,106 kali sampai 2,156 kali untuk
Makassar dapat diduga bahwa seseorang
menderita PJK dibandingkan yang bukan
yang menderita hiperkolesterol, diabetes,
penderita diabetes. Untuk pasien yang
berbadan gemuk dan berusia di atas 69
tergolong gemuk, risiko terkena PJK
tahun, berpeluang antara 69,64% sampai
dibandingkan yang tidak gemuk sebesar
88,35% untuk menderita PJK. Sedangkan
1,58 kali sampai 3,017 kali. Pasien yang
yang tidak menderita hiperkolesterol dan
berumur >69 tahun berisiko antara 1,315
tidak diabetes dengan berat badan yang
kali sampai 5,885 kali untuk terkena PJK,
tergolong
sedangkan yang berumur 60-69 tahun
mempunyai umur di bawah 40 tahun akan
berisiko antara 1,265 kali sampai 4,418
berpeluang sangat kecil untuk menderita
kali. Untuk umur 50-59 tahun berisiko
PJK yaitu antara 5,54% sampai 17,22%.
simultan
menunjukkan
IMT(gemuk),
Berdasarkan
bahwa
paling rendah 1,373 kali dan paling tinggi 1333
RSU
kovarian
Dr.
dugaan.
Wahidin
kurus
atau
Setelah
Sudirohusodo
normal
dan
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
Untuk kombinasi kategori yang lain dapat
dilihat pada Tabel 4.
Tabel 4 Dugaan peluang terkena PJK berdasarkan peubah penjelas yang nyata No
Hiper
Diabetes
kolesterol
IMT
Umur
ˆ ( x )
SK 95% bagi π(x) Bawah
Atas
1
Ya
Tidak
Gemuk
60-69
0,6964
0,6183
0,7646
2
Ya
Tidak
Tidak gemuk
<40
0,3077
0,1873
0,4615
3
Ya
Ya
Tidak gemuk
<40
0,4071
0,2559
0,5782
4
Ya
Ya
Tidak gemuk
40-49
0,6137
0,4987
0,7174
5
Ya
Ya
Gemuk
>69
0,8066
0,6964
0,8835
6
Ya
Tidak
Gemuk
<40
0,4925
0,3536
0,6325
7
Ya
Ya
Gemuk
60-69
0,7799
0,7004
0,8430
8
Ya
Tidak
Tidak gemuk
>69
0,5528
0,4134
0,6843
9
Tidak
Tidak
Tidak gemuk
40-49
0,2036
0,1428
0,2818
10
Tidak
Ya
Gemuk
40-49
0,4631
0,3551
0,5747
11
Tidak
Ya
Tidak gemuk
60-69
0,2874
0,2075
0,3833
12
Tidak
Tidak
Tidak gemuk
60-69
0,2070
0,1464
0,2843
13
Tidak
Ya
Tidak gemuk
<40
0,1458
0,0814
0,2474
14
Tidak
Ya
Gemuk
>69
0,5090
0,3620
0,6544
15
Tidak
Tidak
Tidak gemuk
<40
0,0995
0,0554
0,1722
Tabel 5 Klasifikasi metode regresi logistik Dugaan
Amatan (PJK)
Logistik
Total
(%) Correct classification
Ya
Tidak
Ya
321
109
430
74,7
Tidak
162
235
397
59,2
Total
483
344
827
67,2
(%) Misclassification rate
33,5
31,7
32,8
Tabel 5 menunjukkan bahwa dengan
diperoleh nilai sensitivity sebesar 74,7%
menggunakan nilai cutpoint sebesar 0,5
dan nilai specificity sebesar 59,2% dengan
maka berdasarkan metode regresi logistik
nilai kesalahan positif dan kesalahan 1332
Astri Astiti, Metode Regresi Logistik Untuk Menganalisis Faktor Risiko Penyakit Jantung Koroner
negatif masing-masing sebesar 33,5% dan 31,7%. Sedangkan nilai total correct classification adalah sebesar 67,2%. Nilai total misclassification rate untuk metode regresi logistik sebesar 32,8%.
SIMPULAN Hasil yang diperoleh dari metode regresi logistik menunjukkan bahwa faktor yang mempengaruhi seseorang menderita PJK adalah hiperkolesterol, diabetes, IMT dan umur.
Berdasarkan
nilai
rasio
odds,
diketahui bahwa penderita hiperkolesterol lebih berisiko terkena PJK dibandingkan yang tidak hiperkolesterol, begitu pula pada penderita diabetes dibandingkan yang tidak diabetes. Pasien yang mempunyai IMT gemuk lebih berisiko terkena PJK dibandingkan yang tidak gemuk, dan pasien yang umurnya >=40 tahun juga lebih berisiko terkena PJK dibandingkan yang berumur <40. Berdasarkan hasil klasifikasi
metode
regresi
logistik,
diperoleh nilai sensitivity sebesar 74,7% dan
nilai
Besarnya
specificity nilai
sebesar
59,2%.
misclassification
rate
adalah sebesar 32,8%.
1332
DAFTAR PUSTAKA Agresti A. 1990. “Categorical Data Analysis”. New York: John Wiley & Sons. Bustan MN. 1997. “Epidemologi Penyakit Tidak Menular”. Jakarta: Rineka Cipta. Fitriani. 2007. “Analisis Faktor Risiko Kejadian Penyakit Jantung Koroner di Rumah Sakit Dr.Wahidin Sudirohusodo Makassar”. [Tesis]. Makassar: Program Pascasarjana, UNHAS. Gonzales MP. 2003. “A Model for Profiling Radio Station Listeners using Logistic Regression, CART and CHAID for a given data set”. University of the Philippines. Hosmer DW, Lemeshow S. 2000. “Applied Logistic Regression”. New York: John Wiley & Sons. Kamar N. 2004. “Beberapa Faktor yang Berhubungan dengan Penyakit Jantung Koroner pada Pasien Rawat Inap di RSUP Dr. Wahidin Sudirohusodo Makassar”. [Skripsi]. Makassar: Program Sarjana, UNHAS. Palilati H. 2003. “Beberapa Faktor Risiko Penyakit Jantung Koroner pada Pasien Rawat Inap di RSUP Dr. Wahidin Sudirohusodo Makassar”. [Skripsi]. Sarjana, UNHAS.
* Staf Pengajar Jurusan Matematika, Fakultas Sains dan Teknik-Undana
1330
Makassar: Program