Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
ISSN 2085-7829
Pengklasifikasian Penyakit Jantung Di RSUD Abdul Wahab Sjahranie Samarinda Dengan Menggunakan Regresi Logistik Biner Classification of Heart Disease in RSUD Abdul Wahab Sjahranie Samarinda Using Binary Logistik Regression 1
Andreas Sutanto1, Darnah A. Nohe2, Syaripuddin3
Mahasiswa Program Studi Statistika FMIPA Universitas Mulawarman 2,3 Staf Pengajar Program Studi Statistika FMIPA UNMUL Email:
[email protected],
[email protected] 2,
[email protected] Abstract Binary logistic regression is an analysis to describe the relationship between the dependent variable and independent variables, where the dependent variable dichotomous. The dependent variable in this study consisted of coronary heart disease and non-coronary heart disease. There are many factors that affect a heart disease, which in this study the factor used is the age (X1), glucose levels (X2), cholesterol (X3), systolic blood pressure (X4), and diastolic blood pressure (X5). This study was aim to determine a logistic regression model that describes the relationship between the factors that affect coronary heart disease and also to compare the classification of coronary heart disease in hospitals AW Sjahranie with logistic regression. The results showed that the best regression model describing the relationship beetwen factors affecting a coronary heart disease is: g(x) = 8,896 + 0,046X1 + 0,015X3 + 0,024X5 Age (X1), cholesterol (X2), and diastolic blood (X5) pressure significantly affecting the patients in RSUD A.W.S. to suffer a coronary heart disease. Therefore the classification of patients was obtained, in which 70 patients were classified into a Coronary Heart Disease, 65 patients were properly classified into a Coronary Heart Disease and 5 patients were not properly classified into a Coronary Heart Disease. Keywords: Coronary heart disease, binary logistic regression, classification. Pendahuluan Regresi merupakan suatu analisis yang digunakan untuk mengetahui hubungan antara satu variabel terikat yang bersifat kuantitatif (numerik) maupun kualitatif (kategorik) terikat dengan satu atau lebih variabel bebas. Regresi pada dasarnya untuk menjelaskan dan mengevaluasi hubungan antara variabel terikat (Y) dengan variabel bebas satu atau lebih (X). Dengan analisis dapat diperhitungkan besarnya pengaruh dari perubahan satu variabel terhadapa variabel lain. Secara umum regresi dibagi menjadi dua, yaitu regresi linier dan non linier. Regresi dikatakan linier apabila hubungan antara variabel bebas dan variabel terikat membentuk diagram pencar data dari peubah-peubah tersebut membentuk garis lurus dan dikatakan regresi non linier apabila tidak membentuk garis lurus. Salah satu regresi non linier adalah regresi logistik yang dibagi lagi menjadi tiga, yaitu analisis regresi logistik biner, regresi logistik nominal, dan regresi logistik ordinal. Regresi logistik biner digunakan ketika variabel terikat terdapat dua kategori, regresi logistik nominal digunakan ketika mempunyai ciri berupa lebih dari dua variabel kategorik, dan regresi logistik ordinal digunakan untuk menganalisis variabel terikat yang mempunyai skala ordinal yang terdiri atas tiga kategorik, variabel bebas pada regresi logistik dapat berupa data kategorik kuantitatif ataupun kualitatif.
Penelitian ini bertujuan untuk mengetahui bagaimana model regresi logistik yang diperoleh untuk mencari faktor-faktor yang mempengaruhi penyakit jantung koroner dan pengklasifikasiannya berdasarkan regresi logistik biner. Dalam penelitian ini dibatasi pada pengklasifikasian penyakit jantung pasien RSUD A.W. Syahranie berdasarkan faktorfaktor yang dianggap mempengaruhi penyakit jantung yaitu; faktor usia, glukosa, kolesterol, tekanan darah sistolik dan tekanan darah diastolik dengan menggunakan metode regresi logistik biner. Analisis Regresi Logistik Regresi logistik merupakan pendekatan model matematika yang dapat digunakan untuk menjelaskan hubungan antara beberapa variabel bebas (X) terhadap variabel terikat (Y) yang bersifat biner. Model regresi logistik diperlukan pada saat data bersifat kategorik (variabel terikat) karena akan ada beberapa permasalahan yang muncul tidak memungkinkan untuk tetap menggunakan regresi klasik. Metode regresi logistik adalah suatu metode analisis statistika yang mendeskripsikan hubungan antara variabel bebas yang memiliki dua kategori atau lebih dengan satu atau lebih variabel bebas berkategori dan kontinu atau gabungan keduanya (Hosmer and Lemeshow, 2000).
Program Studi Statistika FMIPA Universitas Mulawarman
153
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
Model Regresi Logistik Regresi logistik memiliki teknik dan prosedur analisis yang tidak jauh berbeda dengan metode regresi linier. Jika regresi linier dalam mengestimasi nilai parameter sering menggunakan metode OLS (Ordinary Least Square), maka regresi logistik dalam mengestimasi nilai parameter menggunakan metode MLE (Maximum Likelihood Estimation). Untuk mencari persamaan logistiknya maka model yang dipakai adalah (Hosmer and Lemeshow, 2000): ๐ ๐ ๐ฝ 0 + ๐=1 ๐ฝ ๐ ๐ฅ ๐ ๐ ๐ฅ = (1) ๐ 1 + ๐ ๐ฝ 0 + ๐=1 ๐ฝ ๐ ๐ฅ ๐ Model tersebut di tranformasikan menjadi persamaan logisik ๐
๐ ๐ฅ = ๐ฝ0 +
๐ฝ๐ ๐ฅ๐ .
(2)
ISSN 2085-7829
dengan l ( ๏ข ) ๏ฝ Likelihood. Untuk memaksimumkan fungsi Likelihood, rumus tersebut diubah kedalam bentuk log- Likelihood dengan notasi L(ฮฒ) untuk memudahkan penyelesaian persamaan matematisnya dan diperoleh persamaan (Hosmer and Lemeshow, 2000): L(๏ข ) ๏ฝ ln l (๏ข ) ๏ฌ
n ๏ฌ ๏ฉ L( ๏ข ) ๏ฝ ln ๏ฏ๏ญ๏ ๏ฏ๏ญ๏ช ๏ฐ ๏จ xi ๏ฉ
๏น ๏บ ๏จ ๏ฉ 1 ๏ญ ๏ฐ x ๏ฏ i ๏ฝ1 ๏ฏ๏ฎ ๏ซ i ๏ป ๏ฎ
yi
n ๏ฌ ๏ฌ ๏ฉ L( ๏ข ) ๏ฝ ๏ฅ ๏ฏ๏ญln ๏ฏ๏ญ๏ช ๏ฐ ๏จ xi ๏ฉ
๏น ๏บ ๏จ ๏ฉ 1 ๏ญ ๏ฐ x i i ๏ฝ1 ๏ฏ ๏ฏ ๏ซ ๏ป ๏ฎ ๏ฎ
L( ๏ข ) ๏ฝ
n
๏ฅ ๏ปy
i
๏ผ๏ผ
๏1๏ญ๏ฐ ๏จ xi ๏ฉ๏๏ฏ๏ฝ๏ฏ๏ฝ ๏ฏ๏พ๏ฏ๏พ
yi
๏ผ๏ผ
๏1๏ญ๏ฐ ๏จ xi ๏ฉ๏๏ฏ๏ฝ๏ฏ๏ฝ ๏ฏ ๏พ๏ฏ ๏พ
ln๏๏ฐ ( xi )๏ ๏ซ (1 ๏ญ y i ) ln๏1 ๏ญ ๏ฐ ( xi )๏๏ฝ
(4)
i ๏ฝ1
๐=1
Penaksiran Parameter Penaksiran parameter pada model regresi logistik yang mempunyai variabel terikat dikotomus adalah menggunakan metode Maximum Likelihood Estimation (MLE). Dalam bentuk persamaan matematis, persamaan logistik dinyatakan dalam bentuk: p
e
๏ฐ ( x) ๏ฝ
๏ข 0 ๏ซ ๏ฅ ๏ข j xi i ๏ฝ1
p
๏ข 0 ๏ซ ๏ฅ ๏ขjxi
(3)
,
i ๏ฝ1 1๏ซ e Fungsi ini merupakan probabilitas dari data dalam menghasilkan nilai estimasi parameter.
๏ข0 ๏ซ
Jika y = 1, maka P(y = 1 | x) =
i ๏ฝ1
e 1๏ซ e
๏ข0 ๏ซ
dan, p
๏ฅ ๏ขjxi j ๏ฝ1
1
jika y = 0, maka P(y = 0 | x) =
1๏ซ e
Untuk nilai parameter
p
๏ฅ ๏ข j xi
๏ฆ ๏ง๏ข ๏ซ ๏ง 0 ๏จ
๏ถ ๏ขjxi ๏ท ๏ท j ๏ฝ1 ๏ธ p
๏ฅ
๏ข ๏ฝ ๏จ๏ข0 ๏ข1 ๏ข2 ... ๏ข p ๏ฉt ,
maka:
P(y = 1 | x) = ๏ฐ ๏จx ๏ฉ P(y = 0 | x) = 1 ๏ญ ๏ฐ ๏จx ๏ฉ Sehingga untuk pasangan (xi,yi) di mana yi = 1, maka kontribusinya terhadap fungsi likelihood adalah ฯ(x) dan untuk yi = 0, kontribusinya adalah 1-ฯ(x). Bentuk fungsi likelihood nya adalah: l (๏ข ) ๏ฝ
n
๏ (๏ฐ ( x )) i
yi
1๏ญ yi
(1 ๏ญ ๏ฐ ( xi ))
,
i ๏ฝ1
n ๏ฉ l ( ๏ข ) ๏ฝ ๏ ๏ช ๏ฐ ๏จ xi ๏ฉ i ๏ฝ1
๏น ๏บ ๏จ ๏ฉ 1 ๏ญ ๏ฐ x i ๏ป ๏ซ
yi
๏1๏ญ๏ฐ ๏จ xi ๏ฉ๏
n
๏ฉ ๏ฐ ๏จxi ๏ฉ ๏น ๏ฅ i ๏ฝ1 l (๏ข ) ๏ฝ ๏ช ๏บ ๏จ ๏ฉ 1 ๏ญ ๏ฐ x i ๏ป ๏ซ 154
yi
๏1 ๏ญ ๏ฐ ๏จxi ๏ฉ๏n
Pengujian Parameter Pengujian parameter dalam regresi penting untuk dilakukan. Hal ini dikarenakan pengujian tersebut digunakan untuk menentukan apakah variabel bebas dalam model signifikan terhadap variebel terikat. Uji Serentak (Uji Likelihood Ratio) Bertujuan untuk mengeteui pengaruh variabel bebas secara terhadap variabel terikat (Hosmer and Lemeshow, 2000). ๏ท Hipotesis H0 : ฮฒ1 = ฮฒ2 = . . . = ฮฒk ( secara simultan variabel bebas tidak berpengaruh terhadap variabel terikat). H1 : Paling sedikit terdapat satu ฮฒj โ 0 dimana j= 1, 2, . . . p (minimal ada satu variabel bebas yang berpengaruh terhadap variabel terikat). ๏ท Statistik uji ๐บ = โ2๐๐
(๐ 1 /๐)๐ 1 (๐ 0 /๐)๐ 0 ๐ ๐ ๐ฆ ๐ (1โ๐)1โ๐ฆ ๐
๐ฟ
= โ2๐๐ ๐ฟ 0 ๐
(5)
Keterangan: G = Uji G likelihood ๐๐ = Nilai regresi logistik n = Jumlah responden n1 = Jumlah responden yang masuk dalam kategori, ๐ฆ bernilai 1 n0 = Jumlah responden yang tidak masuk dalam kategori ๐ฆ bernilai 0 Keputusan uji diperoleh dengan membandingkan nilai G dan nilai
๏ฃ2.
H0 terima, jika G โค ๏ฃ 2 (๏ก ,v )
atau H0 tolak, jika G > ๏ฃ 2 (๏ก ,v ) . Dengan v adalah derajat bebas. Uji Parsial ( Uji Wald) Dalam uji individu ini, pengujian dilakukan dengan menguji setiap ฮฒi secara individual. Hasil pengujian secara individual akan menunjukkan apakah suatu variabel bebas layak untuk masuk Program Studi Statistika FMIPA Universitas Mulawarman
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
dalam model atau tidak (Hosmer and Lemeshow, 2000). ๏ท Hipotesis H0 : ฮฒj = 0 ; j = 0, 1, 2, . . , p (Tidak ada pengaruh variabel bebas ke-i terhadap variabel terikat) H1 : ฮฒj โ 0 ; j = 0, 1, 2, . . , p (Ada pengaruh variabel bebas ke-i terhadap variabel terikat). ๏ท Statistik uji ๐=
๐ท๐
(6)
๐๐ธ ๐ท๐
dimana: W : Wald ๐ท๐ : estimasi koefisien parameter ke - j ๐ ๐(๐ฝ ) : Standar Error estimasi koefisien parameter ke โ i. Statistik Wald mengikuti distribusi normal sehingga untuk memperoleh keputusan pengujian, dibandingkan nilai W dengan nilai z ฮฑ/2 (H0 ditolak jika nilai W > zฮฑ/2 atau p-value < ฮฑ). Uji Kesesuaian Model Regresi Logistik Dalam mencocokkan sebuah model logistik, perlu dipilih sebuah model dengan fungsi penghubung dan variabel bebas yang hasilnya paling cocok. Untuk itu digunakan uji Hosmer and Lemeshow untuk membandingkan kecocokan dalam model-model yang berbeda. ๏ท Hipotesis H0 : Tidak ada perbedaan antara hasil pengamatan dengan nilai dugaan H1 : ada perbedaan antara hasil pengamatan dengan nilai dugaan. ๏ท Statistik Uji ๐
๐ถ= ๐ =1
berdasarkan koefisien yang diestimasi. Interpretasi menyangkut dua hal, yaitu: 1. Perkiraan mengenai hubungan fungsional antara variabel terikat dengan variabel bebas. 2. Menentukan pengaruh pada variabel terikat yang disebabkan oleh tiap unit perubahan pada variabel bebas. Pada model regresi logistik, ฮฒj menunjukkan besar perbedaan antara nilai variabel terikat ketika variabel bebas (x+1) dan nilai variabel terikat ketika variabel bebas x untuk setiap nilai x. Untuk variabel bebas yang bersifat dikotomus, diasumsikan nilai x adalah 0 dan 1, sehingga dalam model akan terdapat dua nilai ฯ(x) dan dua nilai 1ฯ(x). Selanjutnya dibentuk suatu tabel klasifikasi 2x2 sebagai mana dinyatakan pada Tabel 1. Tabel 1. Klasifikasi 2x2 Variabel Terikat (y) y=1 y=0 Total
(7)
Dimana: ๐ : Banyaknya grup (kombinasi dalam model serentak) n' k : Jumlah subjek pada grup ke - i
Variabel Bebas (x) x=1 x=0
Total
n11 ๏ฝ a
n01 ๏ฝ c
n1 ๏ฝ a ๏ซ c
n10 ๏ฝ b n1 ๏ฝ a ๏ซ b
n00 ๏ฝ d
n0 ๏ฝ b ๏ซ d
n0 ๏ฝ c ๏ซ d
a, b, c, dan d mewakili jumlah elemen-elemen pada masing-masing kejadian; (๐ฅ = 1, ๐ฆ = 1), (๐ฅ = 1, ๐ฆ = 0), (๐ฅ = 0, ๐ฆ = 1), dan (๐ฅ = 0, ๐ฆ = 0). Dari pernyataan bahwa semua ๐(๐ฆ = 1|๐ฅ) = ๐(๐ฅ), maka tabel klasifikasi di atas dapat dinyatakan dalam bentuk seperti pada Tabel 2. Tabel 2. Nilai Model Regresi Logistik Untuk Variabel Bebas Bersifat Biner
โฒ
(๐๐ โ ๐ ๐ ๐๐ ๐โฒ ๐ ๐๐ (1 โ ๐๐ )
ISSN 2085-7829
Variabel Terikat (y)
y = 1 y = 0
Variabel Bebas (x) x=1 x=0 ๏ข ๏ซ๏ข e e ๏ข0 ๏ฐ (1) ๏ฝ ๏ฐ (0) ๏ฝ ๏ข ๏ข ๏ข0 1๏ซe 1๏ซe 1 1 1 ๏ญ ๏ฐ (1) ๏ฝ 1 ๏ญ ๏ฐ (0) ๏ฝ ๏ข 0 ๏ซ ๏ข1 ๏ข0 1๏ซe 1๏ซe 0
1
0๏ซ 1
๐ถ
๐ ๐๐ = ๐=1 ๐ฆ๐ : Jumlah nilai variabel terikat pada Ck kombinasi variabel bebas. ๐ถ๐ ๐ ๐ ๐ ๐ ๐๐ = ๐=1 : Rata-rata taksiran ๐โฒ ๐
๏ท
probabilitas dengan mj adalah banyaknya subjek dengan Ck kombinasi variabel bebas. Pengambilan Keputusan Uji ini mengikuti distribusi chi-square dengan derajat bebas ๐ โ 2. Daerah penolakan H0 adalah jika nilai statistik uji > ฯ 2(g-2) atau p-value < ฮฑ.
Interpretasi atau penaksiran dari perbandingan selisih/odds-ratio (ฯ) adalah menjelaskan beberapa kali lipat kenaikan atau penurunan peluang y = 1, jika nilai variabel bebas (x) berubah sebesar nilai tertentu. Perubahan log odds untuk peningkatan sebesar satu unit pada variabel bebas akan menyebabkan resiko terjadinya y = 1 sebesar e ๏ข1 . Bila perubahan pada variabel bebas dinyatakan dengan perubahan sebesar c unit, maka :
g ๏จx ๏ซ c ๏ฉ ๏ญ g ๏จx ๏ฉ ๏ฝ c๏ข1
Odds ratio untuk perubahan tersebut adalah:
๏น ( x ๏ซ c, x) ๏ฝ e c๏ข
1
Penaksiran Koefisien Model Regresi Logistik Penaksiran atau interpretasi dari suatu model terbaik merupakan dasar pengambilan kesimpulan
Program Studi Statistika FMIPA Universitas Mulawarman
(8)
155
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
Persentase Ketepatan Klasifikasi Regresi Logistik Persentase ketepatan klasifikasi adalah rasio antara jumlah observasi-observasi yang diklasifikasikan secara tepat oleh model (sesuai dengan kelompok yang sebenarnya) dengan jumlah seluruh observasi. Untuk lebih jelasnya, dapat dilihat pada ilustrasi Tabel 3. Tabel 3. Prediksi Keanggotaan Suatu Observasi Keanggotaan yang diprediksi
oleh
model
Keanggotaan sebenarnya
๐1
๐2
๐1
๐1๐
๐1
๐2
๐2๐
๐2
Persentase ketetapan klasifikasi yaitu: ๐ 1๐ +๐ 2๐ ๐ฅ 100% ๐ dengan: ๐ = ๐1๐ + ๐2๐ + ๐1๐ + ๐2๐
(9)
Ket : ๐ = Jumlah Data ๐1๐ = Jumlah data yang tepat diklasifikasikan ke kelompok 1. ๐2๐ = Jumlah data yang tepat diklasifikasikan ke kelompok 2. ๐1๐ = Jumlah data yang tidak tepat diklasifikasikan ke kelompok 1. ๐2๐ = Jumlah data yang tidak tepat diklasifikasikan ke kelompok 2. Evaluasi fungsi klasifikasi (fungsi logistik) dilakukan dengan cara membuat tabulasi antara actual group yang diperoleh dari fungsi logistik. Selanjutnya dihitung proporsi pengamatan yang salah diklasifikasikan. Diharapkan proporsi pengamatan yang salah diklasifikasikan tersebut bisa sekecil mungkin. Pada regresi logistik tidak mengasumsikan data harus berdistribusi tertentu. Penyakit Jantung Penyakit jantung adalah dimana sebuah kondisi yang menyebabkan jantung tidak dapat melaksanakan tugasnya dengan baik. Penyakit jantung dapat menyerang siapa saja seperti orang tua, anak kecil, pria maupun wanita. Dari semua golongan manusia dapat terserang penyakit jantung. Pada umumnya penyakit jantung timbul karena pola hidup yang kurang sehat sehingga memicu timbulnya penyakit ini, selain itu ada juga beberapa penyakit yang dapat berdampak pada kesehatan jantung pula. Pengertian penyakit jantung dan serangan jantung adalah berbeda. Dimana kalau serangan jantung adalah sebuah kondisi yang menyebabkan jantung sama sekali tidak berfungsi. 156
ISSN 2085-7829
Macam โ macam Penyakit Jantung 1. Koroner (Aterosklerosis) Aterosklerosis diakibatkan oleh dinding arteri yang mengalami penebalan karena lemak, kolesterol dan buangan sel lainnya yang mengendap sehingga pasokan darah ke sel-sel otot mngalami penghambatan. Ateroskleroris bisa terjadi di seluruh bagian tubuh. Bila terjadi pada dinding jantung maka akan disebut sebagai penyakit jantung koroner atau penyakit jantung iskemik. Penyakit ini dimulai dari adanya lesi dan retakan pembuluh darah khususnya karena ada tekanan kuat pada pembuluh darah khususnya karena ada tekanan kuat pada pembuluh jantung. Kemudian di tahap selanjutnya, tubuh akan berusaha memperbaikin retakan tersebut dengan menempatkan zat-zat lemak pada pembuluh darah. Penyakit jantung koroner juga dapat menyebabkan daya pompa jantung melemah sehingga darah tidak berdar sempurna ke seluruh tubuh (gagal jantung). Penderita gagal jantung akan sulit bernafas karena paru-parunya dipenuhi cairan, merasa sangat lelah, dan bengkak-bengkak di kaki dan persendian. 2. Infark Miokard Akut Infark Miokard merupakan kematian otot jantung yang disebabkan oleh penyumbatan pada arteri koroner. Otot-otot jantung pun akan tidak tersuplai darah sehingga mengalami kerusakan dan bahkan kematian 3. Kelainan Katup Jantung Katup jantung memiliki fungsi untuk mengendalikan aliran darah di dalam jantung. Dan jika katup jantung mengalami kelainan, hal ini akan mengganggu aliran darah tersebut, yakni pengecilan, kebocoran, atau tidak sempurna menutup. Kelainan katup jantung ini bisa merupakan bawaan sejak lahir ataupun karena efek samping pengobatan. 4. Gagal Jantung Kongresif Gagal jantung merupakan jantung yanag tidak mampu lagi memompa darah ke seluruh tubuh secara efektif. Dikatakan gagal bukan kaena jantung berhenti bekerja tetapi juga karena jantung tidak bisa memompa sekuat biasanya. Akibatnya darah bisa masuk ke paru-paru atau bagian tubuh lainnya. 5. Kardiomiopati Penyakit ini adalah karena adanya kerusakan atau gangguan pada otot jantung sehingga dindingdinding jantung menjadi tidak bergerak secara sempurna ketika memompa darah dan menyedot darah. Penderita kardiomiopati pun memiliki resiko tinggi untuk mengidap aritmatia dan gagal jantung. 6. Arritmatia Arritmatia memiliki arti โirama jantung tidak normalโ diakibatkan oleh gangguan rangsangan dan penghantaran rangsangan jantung yang berat ataupun ringan.
Program Studi Statistika FMIPA Universitas Mulawarman
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
7. Penyakit Jantung Rematik Penyakit jantung rematik merupakan penyakit jantung yang disebabkan karena kerusakan katup jantung yang diakibatkan oleh demam rematik. Bakteri streptokokus adalah salah satu penyebabnya. 8. Inflamasi Jantung Penyakit ini terjadi di dinding jantung, selaput yang menyelimuti jantung dan bagian dalam jantung. Hal ini disebabkan oleh racun dan infeksi. (http://adainfo4.blogspot.com) Faktor Resiko Penyebab Penyakit Jantung Faktor-faktor penyebab penyakit jantung dapat dibagi dalam dua golongan besar, yaitu faktor resiko alam dan faktor resiko yang dapat diperbaiki atau dikurangi. Faktor resiko alami adalah faktor yang tidak dapat dicegah antara lain: keturunan atau genetik, usia dan jenis kelamin. Dan faktor resiko yang dapat diperbaiki atau dikurangi antara lain hipertensi (penyakit tekanan darah tinggi), kadar lemak (kolesterol) yang tinggi, diabetes melitus (penyakit kencing manis), gangguan pembuluh darah/jantung. Tingginya jumlah sel darah merah, kegemukan (obesitas) dan faktor resiko perilaku antara lain :merokok (aktif maupun pasif), makanan tidak sehat, minuman alkohol, kurang berolah raga, narkoba. Metode Penelitian Sumber data dalam penelitian ini menggunakan data sekunder, yang diperoleh dari RSUD A. W. Sjahranie dan sampel yang digunakan sebanyak 100 pasien. Variabel terikat dari penelitian ini, yaitu 1=Penyakit Jantung Koroner dan 0=Penyakit Jantung Non Koroner. Variabel bebas dari penelitian ini, yaitu usia, glukosa, kolesterol, tekanan darah sistolik dan diastolik. Adapun teknik analisis data dalam peniltian ini adalah: a. Analisis Statistika Deskriptif terhadap data Penyakit Jantung b. Penentuan Model Regresi Logistik c. Uji Simultan d. Uji Parsial e. Uji Kesesuaian Model Regresi Logistik f. Pemilihan Model Regresi Logistik Terbaik g. Melakukan Interpretasi odds Ratio h. Perhitungan Persentase Ketepatan. Hasil dan Pembahasan Berdasarkan data penelitian penyakit jantung pada tahun 2012 akan dilakukan analisis dengan menggunakan regresi logistik biner. Analisis Deskriptif Usia Berdasarkan hasil penelitian di RSUD A.W. Sjahranie pada tahun 2012, usia dari 100 pasien
ISSN 2085-7829
penyakit jantung yang melakukan Rawat Inap di Rumah Sakit yaitu sebesar 70 pasien (70%) dari jumlah pasien yang berisiko penyakit jantung koroner dengan laki-laki sebanyak 49 % (usia > 45 tahun) dan wanita sebanyak 21 % (usia > 55 tahun).
Grafik Usia Tidak Berisiko 30% Berisiko 70% Gambar 1. Grafik Usia Kadar Glukosa Berdasarkan hasil penelitian kadar glukosa dari 100 pasien penyakit jantung yang melakukan rawat inap di RSUD A.W. Syahranie diketahui bahwa pasien yang memiliki kadar glukosa darah yang normal (60 mg/dL โ 150 mg/dL) sebanyak 60% dan yang memiliki kadar gulokasa tidak normal (< 60 atau > 150 mg/dL) sebanyak 40%.
Grafik Glukosa Normal 60%
Tidak Normal 40%
Gambar 2. Grafik Kadar Glukosa Kadar Kolesterol Berdasarkan hasil penelitian kadar kolesterol dari 100 pasien penyakit jantung yang melakukan rawat inap di RSUD A.W. Syahranie diketahui bahwa pasien yang memiliki kadar kolesterol tidak normal (< 150 atau > 220 mg/dL) sebanyak 56% dan yang memiliki kadar kolesterol normal (150 โ 220 mg/dL) sebanyak 44%.
Grafik Kadar Kolesterol Normal 44%
Tidak Normal 56%
Gambar 3. Grafik Kolesterol Tekanan Darah Sistolik Berdasarkan hasil penelitian tekanan darah sistolik dari 100 pasien penyakit jantung yang melakukan rawat inap di RSUD A.W. Syahranie diketahui bahwa pasien yang memiliki tekanan darah sistolik tidak normal (< 100 atau > 140
Program Studi Statistika FMIPA Universitas Mulawarman
157
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
mmHg) sebanyak 69% dan yang memiliki tekanan darah sistolik normal (100 โ 140 mmHg) sebanyak 31%.
Grafik Tekanan Darah Sistolik Normal 31%
Tidak Normal 69%
ISSN 2085-7829
Berdasarkan Tabel 5 dapat dijelaskan bahwa dari 70 pasien yang dinyatakan menderita penyakit jantung koroner, terdapat 37 pasien menderita penyakit jantung koroner dengan kadar glukosa normal dan 33 pasien dengan kadar glukosa tidak normal. Tabel 6. Tabulasi Silang Kolesterol dengan Penyakit Jantung Penyakit
Gamabar 4. Grafik Sistolik
Jantung
Tekanan Darah Diastolik Berdasarkan hasil penelitian kadar kolesterol dari 100 pasien penyakit jantung yang melakukan rawat inap di RSUD A.W. Syahranie diketahui bahwa pasien yang memiliki tekanan darah diastolik tidak normal (< 60 atau > 90 mmHg) sebanyak 56% dan yang memiliki tekanan darah diastolik normal (60 โ 90 mmHg) sebanyak 44%.
Grafik Tekanan Darah Diastolik Normal 44%
Tidak Normal 56%
Gambar 5. Grafik Diastolik Tabulasi Silang Pada penelitian ini akan dibuat tabulasi silang untuk variabel bebas (X) dan variabel terikat (Y). Nilai setiap sel dalam tabulasi silang diperoleh hasil tabulasi silang untuk mengetahui penyakit jantung. Tabel 4. Tabulasi Silang Usia dengan Penyakit Jantung Usia Penyakit Jantung Total Tidak Beresiko Berisiko Non Koroner 3 27 30 Koroner 18 52 70 Total 21 79 100 Berdasarkan Tabel 4 dapat dijelaskan bahwa dari 70 pasien yang dinyatakan menderita penyakit jantung koroner, 52 pasien diantaranya mempunyai usia berisiko dan 18 pasien mempunyai usia tidak berisiko. Tabel 5. Tabulasi Silang Glukosa dengan Penyakit Jantung Penyakit Jantung Non Koroner Koroner Total
158
Glukosa Tidak Normal Normal 18 12 37 33 55 45
Total 30 70 100
Kolesterol Normal
Tidak
Total
Normal
Non Koroner
13
17
30
Koroner
28
42
70
41
59
100
Total
Berdasarkan Tabel 6 dapat dijelaskan bahwa dari 70 pasien yang dinyatakan menderita penyakit jantung koroner, terdapat 42 pasien menderita penyakit jantung koroner dengan kadar kolesterol tidak normal dan 28 pasien dengan kadar kolesterol normal. Tabel 7. Tabulasi Silang Sistolik dengan Penyakit Jantung Tekanan Darah Sistolik Penyakit Jantung Total Tidak Normal Normal Non Koroner Koroner Total
11 20
19 50
30 70
31
69
100
Berdasarkan Tabel 7 dapat dijelaskan bahwa dari 70 pasien yang dinyatakan menderita penyakit jantung koroner, terdapat 50 pasien menderita penyakit jantung koroner dengan tekanan darah sistolik tidak normal dan 20 pasien dengan tekanan darah sistolik normal. Tabel 8. Tabulasi Silang Diastolik dengan Penyakit Jantung Tekanan Darah Diastolik Penyakit Jantung Total Tidak Normal Normal Non Koroner 6 24 30 Koroner 31 39 70 Total 37 63 100 Berdasarkan Tabel 8 dapat dijelaskan bahwa dari 70 pasien yang dinyatakan menderita penyakit jantung koroner, terdapat 39 pasien menderita penyakit jantung koroner dengan tekanan darah diastolik tidak normal dan 31 pasien dengan tekanan darah diastolik normal.
Program Studi Statistika FMIPA Universitas Mulawarman
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
Model Regresi Logistik Model lengkap regresi logistik biner sesuai persamaan (1) dengan 5 variabel bebas adalah sebagai berikut:
๐ ๐ฝ0 +๐ฝ1 ๐1 +๐ฝ2 ๐2 +๐ฝ3 ๐3 +๐ฝ4 ๐4 +๐ฝ5 ๐5 ๐ ๐ฅ = 1 + ๐ ๐ฝ0 +๐ฝ1 ๐1 +๐ฝ2 ๐2 +๐ฝ3 ๐3 +๐ฝ4 ๐4 +๐ฝ5 ๐5
Uji Parsial (Uji Wald) Pengujian ini dilakukan untuk mengetahui pengaruh dari masing-masing variabel X1, X2, X3, X4 dan X5 terhadap Penyakit Jantung. Tabel 10. Uji Wald Variabel Wald Konstanta 21,336 ๐1 5,007 ๐2 0,519 ๐3 9,754 ๐4 3,199 7,562 ๐5
Keterangan : X1 = Usia X2 = Glukosa X3 = Kolesterol X4 = Tekanan Darah Sistolik X5 = Tekanan Darah Diastolik. Tabel 9. Penaksiran Parameter Variabel Bebas Terhadap Varibel Terikat Variabel
๐ฝ
Konstanta X1 X2 X3 X4 X5
-9,982 0,044 -0,011 0,016 0,019 0,022
Sehingga taksiran model regresi sebagai berikut: g(x) = 9,982 + 0,044X1 โ 0,011X2 + 0,016X3 + 0,019X4 + 0,022X5. Uji Simultan (Uji Likelihood Ratio) ๏ท Hipotesis: H0 : ฮฒ1 = ฮฒ2 = ฮฒ3 = ฮฒ4 = ฮฒ5 = 0, (Secara simultan Usia, Kadar Glukosa, Kadar Kolesterol, Tekanan Darah Sistolik dan Tekanan Darah Diastolik tidak berpengaruh terhadap Penyakit Jantung Koroner). H1 : Paling sedikit satu ฮฒj โ 0 dimana ๐ = 1,2,...5. (Setidaknya ada satu variabel bebas yang berpengaruh terhadap Penyakit Jantung Koroner). ๏ท
Taraf Signifikansi ฮฑ = 0,05 (5%)
๏ท
Statistik Uji: Berdasarkan hasil output software IBM SPSS Statistics 20 diperoleh nilai G sebesar 93,011. Keputusan Jika nilai G > ฯ2(ฮฑ,v) atau nilai p-value < ฮฑ (0,05), maka H0 ditolak Kesimpulan Nilai G adalah 93,011 dimana nilai G > ฯ2(0.05,5) yaitu 93,011 > 11,07 maka H0 ditolak, dapat disimpulkan bahwa setidaknya ada satu variabel bebas yang berpengaruh terhadap Penyakit Jantung Koroner.
๏ท ๏ท
ISSN 2085-7829
p-value 0,000 0,025 0,471 0,002 0,074 0,006
๏ท
Hipotesis: H0โ: ๐ฝ๐ = 0 ; ๐ = 1 (tidak ada pengaruh Usia terhadap Penyakit Jantung Koroner) H0โโ: ๐ฝ๐ = 0 ; ๐ = 2 (tidak ada pengaruh Kadar Glukkosa terhadap Penyakit Jantung Koroner) H0โโโ: ๐ฝ๐ = 0 ; ๐ = 3 (tidak ada pengaruh Kadar Kolesterol terhadap Penyakit Jantung Koroner) H0โโโโ: ๐ฝ๐ = 0 ; ๐ = 4 (tidak ada pengaruh Tekanan Darah Sistolik terhadap Penyakit Jantung Koroner) H0โโโโโ: ๐ฝ๐ = 0 ; ๐ = 5 (tidak ada pengaruh Tekanan Darah Diastolik terhadap Penyakit Jantung Koroner) H1โ: ๐ฝ๐ โ 0 ; ๐ = 1 (ada pengaruh Usia terhadap Penyakit Jantung Koroner) H1โโ: ๐ฝ๐ โ 0 ; ๐ = 2 (ada pengaruh Kadar Glukosa terhadap Penyakit Jantung Koroner) H1โโโ: ๐ฝ๐ โ 0 ; ๐ = 3 (ada pengaruh Kadar Koleterol terhadap Penyakit Jantung Koroner) H1โโโโ: ๐ฝ๐ โ 0 ; ๐ = 4 (ada pengaruh Tekanan Darah Sistolik terhadap Penyakit Jantung Koroner) H1โโโโโ: ๐ฝ๐ โ 0 ; ๐ = 5 (ada pengaruh Tekanan Darah Diastolik terhadap Penyakit Jantung Koroner) ๏ท Taraf Signifikansi ฮฑ = 0,05 (5%) ๏ท Statistik Uji Dengan menggunakan software IBM SPSS Statistic 20 diperoleh nilai Wald untuk masing-masing variabel. ๏ท Kriteria Keputusan Berdasarkan Tabel 7 diambil keputusan : a. Untuk variabel Usia, nilai W = 5,007 > 2 ๐(0,05;1) = 3,841 atau p-value = 0,025 < ฮฑ (0,05) maka H0 ditolak. b. Untuk variabel Glukosa, nilai W = 0,519 2 < ๐(0,05;1) = 3,841 atau p-value = 0,471 > ฮฑ (0,05) maka H0 diterima.
Program Studi Statistika FMIPA Universitas Mulawarman
159
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
c.
Untuk variabel Kolesterol, nilai W = 9,754 2 > ๐(0,05;1) = 3,841 atau p-value = 0,002 < ฮฑ (0,05) maka H0 ditolak. d. Untuk variabel Tekanan Darah Sistolik = 2 3,199 < ๐(0,05;1) = 3,841 atau p-value = 0,074 > ฮฑ (0,05) maka H0 diterima. e. Untuk variabel Tekanan Darah Diastolik = 2 7,562 > ๐(0,05;1) = 3,841 atau p-value = 0,006 < ฮฑ (0,05) maka H0 ditolak. ๏ท Kesimpulan Dari keputusan di atas dapat diambil kesimpulan bahwa : - Usia berpengaruh terhadap Penyakit Jantung Koroner - Kadar Kolesterol berpengaruh terhadap Penyakit Jantung Koroner - Tekanan Darah Diastolik berpengaruh terhadap Penyakit Jantung Koroner Uji Hosmer-Lemeshow Uji Hosmer-Lemeshow atau uji kesesuaian model berfungsi untuk mengetahui kesesuaian model regresi logistik dengan membandingkan hasil pengamatan dengan nilai dugaan. ๏ท Hipotesis H0: Tidak ada perbedaan antara hasil pengamatan dengan nilai dugaan H1: ada perbedaan antara hasil pengamatan dengan nilai dugaan. ๏ท Taraf Signifikansi ฮฑ = 0,05 (5%) ๏ท Statistik Uji Berdasarkan Persamaan (7) dan dengan bantuan software IBM SPSS Statistics 20 diperoleh nilai chi-kuadrat sebesar 6,093 dan p-value sebesar 0,524 seperti pada Tabel 11. Tabel 11. Uji Hosmer-Lemeshow
๏ท
๏ท
ฤ
df
p-value
11,071
8
0,198
Kriteria Penolakan H0 ditolak jika nilai ฤ > ฯ 2(0,05;8) p-value < 0,05 ฯ 2(ฮฑ, g-2) dimana : ฮฑ = 0,05 g = 5C2 = 10 Keputusan H0 gagal ditolak karena
atau
nilai ฤ = 11,071 < ฯ 2(0,05;8) = 15,51 dan p-value (0,198) > ฮฑ = 0,05 ๏ท
160
Kesimpulan Tidak ada perbedaan antara hasil pengamatan dengan nilai dugaan.
ISSN 2085-7829
Pemilihan Model Regresi Logistik Terbaik Pemilihan model regresi terbaik dilakukan agar dapat dilakukan pengambilan keputusan yang terbaik. Nilai koefisien model regresi terbaik dapat dilihat pada Tabel 12. Tabel 12. Nilai Koefisien Model Regresi Terbaik (Backward: LR) Variabel
๐ฝ
Konstanta
-8,896
X1
0,046
X3
0,015
X5
0,024
Berdasarkan Tabel 12 diperoleh model regresi logistik terbaik sebagai berikut: g(x) = 8,896 + 0,046X1 + 0,015X3 + 0,024X5 atau model peluang persamaan logistiknya adalah: ๐(๐ฅ) =
๐๐ฅ๐(โ 8,896 + 0,046๐1 + 0,015๐3 + 0,024๐5) 1 + ๐๐ฅ๐(โ 8,896 + 0,046๐1 + 0,015๐3 + 0,024๐5)
Interpretasi Model Regresi Logistik Interpretasi terhadap koefisien parameter ini dilakukan untuk menentukan hubungan fungsional antara variabel bebas (X) dengan variabel terikat (Y) yaitu untuk mengetahui seberapa besar faktorfaktor tersebut berpengaruh terhadap penyakit jantung koroner. Rasio kecenderungan dapat disederhanakan seperti Tabel 13. Tabel 13. Nilai Odds Ratio Variabel
Odds Ratio
X1
1,047
X3 ๐5
1,015 1,024
๏จ๏น ๏ฉ
Interpretasi odds ratio masing-masing variabel adalah sebagai berikut: 1. Odds Ratio usia dari pasien saat masuk ke rumah sakit (X1) Pada variabel usia diperoleh nilai odds ratio sebesar 1,050. Dari nilai tersebut dapat diartikan bahwa pasien yang memiliki usia berisiko (pria > 45 tahun dan wanita > 55 tahun) berpeluang terkena penyakit jantung koroner 1,050 kali lebih besar dibandingkan dengan pasien yang memiliki umur tidak berisiko (pria โค 45 tahun dan pada wanita โค 55 tahun). 2. Odds Ratio kadar kolesterol dalam tubuh pasien(X3) Pada variabel kadar kolesterol diperoleh nilai odd ratio sebesar 1,015. Dari nilai tersebut dapat diartikan bahwa pasien yang memiliki kadar kolesterol dalam tubuh yang tidak normal (< 150
Program Studi Statistika FMIPA Universitas Mulawarman
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
atau > 220 mg/dL) berpeluang terkena risiko penyakit jantung koroner 1,015 kali lebih besar dibandingkan dengan pasien yang memiliki kadar kolesterol normal (150 โ 220mg/dL). 3. Odds Ratio tekanan darah diastolik (X5) Pada variabel tekanan darah diastolik diperoleh nilai odds ratio sebesar 1,024. Dari nilai tersebut dapat diartikan bahwa pasien yang memiliki tekanan darah diastolik tidak normal (< 60 atau > 90mmHg) berpeluang terkena risiko penyakit jantung koroner 1,024 kali lebih besar dibandingkan dengan pasien yang memilik tekanan darah diastolik normal (60 โ 90 mmHg). Persentase Ketepatan Klasifikasi Persentase ketepatan klasifikasi adalah rasio antara jumlah observasi-observasi yang diklasifikasikan secara tepat oleh model dengan jumlah seluruh observasi.
Penyakit Jantung
Tabel 14. Hasil Klasifikasi Yang diprediksi oleh model Non Koroner Koroner Koroner 65 5 Non 16 14 Koroner
Persentase ketepatan klasifikasi 65+14 x100% = 79% 100 Berdasarkan tabel 14 dengan menggunakan teknik analisis regresi logistik, diperoleh : 1. Dari 100 pasien yang diklasifikasikan ke Penyakit Jantung, 65 pasien tepat diklasifikasikan ke Penyakit Jantung Koroner dan 5 pasien tidak tepat diklasifikasikan ke Penyakit Jantung Koroner. 2. Dari 100 pasien yang diklasifikasikan ke Penyakit Jantung, 14 pasien tepat diklasifikasikan ke Penyakit Jantung Non Koroner dan sisanya 16 pasien tidak tepat diklasifikasikan ke Penyakit Jantung Non Koroner. Perhitungan ketetapan klasifikasi dengan menggunakan persamaan (9) dengan metode regresi logistik diperoleh nilai persentase ketepatan klasifikasi berdasarkan analisis regresi logistik sebesar 79% .
ISSN 2085-7829
diklasifikasikan ke Penyakit Jantung Koroner dan 5 pasien tidak tepat diklasifikasikan ke Penyakit Jantung Koroner. Dan dari 100 pasien yang diklasifikasikan ke Penyakit Jantung Non Koroner 14 pasien tepat diklasifikasikan ke Penyakit Jantung Non Koroner dan sisanya 16 pasien tidak tepat diklasifikasikan ke Penyakit Jantung Non Koroner. Nilai persentase ketepatan klasifikasi analisis regresi logistik sebesar 79%. Daftar Pustaka Agresti, A. 1990. An Introduction to Categorial Data Analysis, New York : Wiley. Ahmad, Mufidah. 2010. Populasi dan Sampel Penelitian. Skripsi. Program Sarjana Fakultas Ilmu Sosial dan Hukum Universitas Negeri Surabaya : Surabaya. Cohran, W. 1991. Teknik Penarikan Sampel edisi ketiga. Penerbit UI: Jakarta. Davidson, C. 2002. Penyakit Jantung Koroner. PT Dian Rakyat : Jakarta. Firdaus, M. 2004. Ekonometrika Suatu Pendekatan Aplikatif. Bumi Aksara. Jakarta. Hilbe, Joseph M. 2009. Logistic Regression Models. Chapman & Hall/CRC Press. Hosmer, D. W. and Lemeshow, S. 2000. Applied Logistic Regression. John Wiley and Sons. Inc. USA. Johnson, R.A. dan Wichern, D.W. (1992). Applied Multivariate Analysis, Third Edition, Prentice Hall Inc: New Jersey. Sugiyono. 2003. Statistika Untuk Penelitian, Alfabeta: Bandung. Suryabrata, Sumadi, 2003. Metodologi Penelitian. PT. Raja Grafindo Persada : Jakarta. Sugiyono. 2007. Statistika Untuk Penelitian. CV Alfabeta. Bandung. Singarimbun, M., dan Effendi, S. (1989). Metode Penelitian Survai. PT.Pustaka LP3ES Indonesia: Jakarta. Utami, Prapti. 2009. Solusi Sehat Mengatasi Penyakit Jantung Koroner. Jakarta: Agromedia Pustaka. (http://adainfo4.blogspot.com/2012/06/macammacam-penyakit-jantung-mematikan.html).
Kesimpulan Berdasarkan hasil analisis yang telah dilakukan diperoleh kesimpulan sebagai berikut: 1. Variabel bebas yang berpengaruh secara signifikan terhadap variabel terikat adalah usia, kadar kolesterol, tekanan darah diastolik dengan model terbaik sebagai berikut. g(x) = 8,896 + 0,046 X1 + 0,015X3 + 0,024X5 2. Dari 100 pasien yang diklasifikasikan ke Penyakit Jantung Koroner 65 pasien tepat Program Studi Statistika FMIPA Universitas Mulawarman
161
Jurnal EKSPONENSIAL Volume 5, Nomor 2, Nopember 2014
162
ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman