Klasifikasi Sinyal Elektrokardiografi Menggunakan Wavelet Transform Dan Neural Network Fuad Lutfi*, Achmad Arifin
Jurusan Teknik Elektro, ITS Surabaya 60111 Phone : (62 31) 594 7302, Fax : (62 31) 593 1237 * email :
[email protected] Abstrak-Elektrokardiografi (EKG) merupakan metode yang umum digunakan untuk mengukur kinerja jantung manusia melalui aktivitas elektrik jantung. Pada penelitian ini telah direalisasikan sebuah sistem yang mampu menganalisis dan mengklasi-fikasikan kelainan sinyal EKG. Continuous Wavelet Transform (CWT) dengan fungsi Morlet digunakan untuk mengeksplorasi karakteristik time-frequency sinyal EKG. Klasifikasi sinyal EKG dilakukan dengan Artificial Neural Network (ANN) metode algoritma backpropagation. Konfigurasi ANN adalah 20.000 neuron pada lapisan masukan, 50 neuron pada lapisan tersembunyi, dan 3 neuron pada lapisan keluaran. Sinyal EKG yang digunakan diambil dari database MIT-BIH Arrhythmia, termasuk sinyal denyut normal dan sinyal denyut bundle branch blok (BBB). Hasil komputasi CWT menunjukkan perbedaan karakteristik time-frequency yang signifikan antara sinyal normal dan sinyal BBB. Dalam pengujian kinerja klasifikasi ANN dengan data yang sebelumnya telah dilatih (sejumlah 25 data untuk 3 kelas : normal, left bundle branch block, right bundle branch block), masing-masing kelas 100% dikenali. Pengujian dengan data yang belum dilatih, ANN mengenali data dengan akurasi 87,04%. Dalam pengujian dengan validasi silang, ANN menunjukkan kinerja yang baik dengan sensitivitas 87% dan spesifisitas 95%. Hasil pengujian menunjukkan efektivitas pengenalan pola sinyal EKG menggunakan CWT dan ANN. Oleh karena itu, metode yang diusulkan ini diharapkan dapat diwujudkan dalam pengembangan Sistem Cerdas Diagnosa Jantung untuk aplikasi klinis. . Kata Kunci: Electrocardiografi (EKG), MIT-BIH Arrhythmia database, Continuous Wavelet Transform (CWT), Artificial Neural Network (ANN), Sistem Cerdas Diagnosa Jantung. 1. PENDAHULUAN Gejala abnormalitas pada jantung seringkali datang secara tiba-tiba. Untuk itu, pengenalan secara dini terhadap penyakit jantung dengan prosedur dan penanganan lanjutan dapat mencegah peningkatan resiko fatal dari serangan jantung. Informasi seputar kerja jantung dapat diperoleh melalui prinsip kelistrikan pada jantung menggunakan sebuah instrumen medis yang disebut Electrocardiograf (EKG). Seperti yang ditunjukkan pada gambar 1, EKG terdiri dari tiga gelombang dasar : P, QRS, dan T.
136
Gambar 1. Komponen Sinyal EKG normal
Gelombang ini sesuai dengan medan jauh yang disebabkan oleh fenomena listrik spesifik pada permukaan jantung, yaitu depolarisasi atrium, P, depolarisasi ventrikel, QRS kompleks, dan repolarisasi ventrikel, T. Sinyal biomedik pada umumnya adalah sinyal nonstasioner. Sinyal elektrik jantung termasuk sinyal biomedik yang nonstationer, dimana sinyal ini mempunyai karakteristik waktu-frekuensi yang sangat kompleks[1], hal ini dikarenakan sifat sinyal nonstationer yang memiliki perubahan frekuensi di setiap waktu. Dengan cara ini maka deteksi bentuk sinyal dan durasi yang memisahkan mereka dapat dilakukan dengan lebih teliti. Ketidaknormalan sinyal EKG dapat diketahui dari berkurang atau berlebihnya durasi waktu dan frekuensi sinyal normal yang telah ditentukan oleh ahli kardiovaskular. Ada banyak metode yang dapat digunakan dalam menganalisa sinyal elektrik jantung berdasarkan timefrequency, beberapa metode yang terkenal adalah wigner-ville distribution (WVD), transformasi fourier (TF), Short Time Fourier Transform (STFT), dan wavelet transform (WT). Pada penelitian sebelumnya telah ditunjukkan bahwa FFT dapat menginformasikan frekuensi yang berharga. Akan tetapi, FFT tidak mempertimbangkan waktu [2]. Pada perkembangan selanjutnya, TF berkembang menjadi Short Time Fourier Transform (STFT) yang dibuat secara terpotong-potong berdasarkan window yang telah ditentukan dan berpengaruh pada resolusi timefrequency yang mampu dianalisa. Apabila panjang window waktunya sempit, maka resolusi frekuensinya buruk. Sebaliknya, apabila panjang window waktunya lebar maka resolusi waktunya buruk. Metode alternatif yang telah berkembang hingga sekarang adalah menggunakan wavelet transform (WT) [3].
WT merupakan suatu multiresolution analysis yang dapat merepresentasikan informasi waktu dan frekuensi sinyal elektrik jantung dengan penggunaan modulasi window yang fleksibel. WT sangat baik dalam menganalisa time-frequency untuk sinyal yang non-stationer [3]. Teknik yang digunakan dalam WT adalah pada menyempit dan melebarnya fungsi mother wavelet yang merupakan fungsi basis yang akan dikonvolusikan terhadap sinyal yang akan diekstrak. Salah satu jenis metode WT yaitu Continuous wavelet transform (CWT) yang memiliki kemampuan analisa spectral lebih tepat dari sinyal yang nonstationer. Hasil studi di literatur telah menunjukkan bahwa WT adalah metode yang paling menjanjikan untuk mengekstrak fitur yang mencirikan perilaku dari sinyal EKG [4]. Hasil ekstraksi parameter-parameter karakteristik sinyal EKG pada domain time-frequency ini mempunyai tingkat variabilitas yang sangat tinggi. Suatu sinyal EKG dapat menampilkan interval waktu dan frekuensi yang berbeda-beda maka akan menghasilkan pola sinyal yang berbeda-beda pula. Untuk membedakan antara sinyal kondisi normal dan abnormal maka diperlukan suatu classifier guna mendapat klasifikasi terbaik pola sinyal. Salah satu cara yang paling handal dalam pengenalan pola adalah artificial neural network (ANN) [5]. ANN mampu menyelesaikan persoalan rumit yang sulit atau bahkan tidak mungkin jika diselesaikan dengan menggunakan komputasi konvensional. ANN merupakan salah satu sistem pemrosesan informasi yang didesain dengan menirukan cara kerja otak manusia dalam menyelesaikan suatu masalah dengan melakukan proses belajar melalui perubahan bobot sinapsisnya. ANN mampu melakukan pengenalan kegiatan berbasis data masa lalu yang akan dipelajari sehingga mempunyai kemampuan untuk memberikan keputusan terhadap data yang belum pernah dipelajari. Peneliti sebelumnya telah efisien meng-gunakan ANN untuk mendeteksi dan mengklasi-fikasikan sinyal EKG seperti yang dilakukan oleh [6][7], namun tidak menggunakan isyarat EKG domain frekuensi serta ukuran jaringan yang digunakan cukup besar sehingga membutuhkan waktu untuk pelatihan dan pengujian sistem. Oleh karena itu, performansi pengklasifikasian ANN sinyal EKG harus dikelola menjadi lebih sensitif dan dapat lebih teliti dalam menganalisa kelainan yang muncul dari karakteristik sinyal EKG. Salah satu jenis ANN yang mampu memberikan unjuk kerja yang bagus adalah ANN dengan pembelajaran Backpropagation[7]. Dengan peningkatan performansi klasifikasi ANN Backpropagation akan diperoleh pengklasifikasi terbaik berbasis pada model saraf biologis manusia sehingga komputer dapat menduplikasi kecerdasan manusia dan diharapkan akan memberikan kemudahan bagi analis medis di lapangan dengan menghadirkan data analisa hasil
komputasi yang lebih objektif pada saat subyektifitas analis menjadi dominan. Analisa sinyal EKG adalah variasi besar dalam bentuk gelombang morfologi EKG yang memiliki kompleksitas dan bersifat nonstationer. Kami mengatasi masalah kinerja pengklasifikasi dengan menggunakan kombinasi CWT dalam rangka mempersiapkan data masukan yang lebih efektif untuk pengklasifikasi neural network, yang menyebabkan hasil klasifikasi yang lebih baik. 2. METODE Skema yang dirancang dari algoritma dalam penelitian ini untuk klasifikasi denyut EKG ditunjukkan pada Gambar 2. Tahap pertama adalah tahap pengolahan data yaitu pemilihan sample data, segmentasi data, dan akhirnya ekstraksi fitur. Tahap berikutnya adalah klasifikasi denyut EKG, yang merupakan tujuan utama dari penelitian ini. 2.1. Pengambilan Data Data dari sinyal EKG yang digunakan dalam penelitian ini diambil dari database sinyal EKG MITBIH Arrhythmia, 10 file dengan panjang waktu 1 menit dan sample frequency 360 Hz, sinyal denyut normal dan dua jenis denyut aritmia yang berbeda. Semua file yang dipilih dilakukan segmentasi 6 detik sehingga didapat 100 sampel data percobaan, Tabel 1 menunjukkan jenis file dan klasifikasinya. Untuk tulisan ini, jenis aritmia yang dipilih adalah right bundle branch block (RBBB) dan left bundle branch block (LBBB). Sinyal EKG Persiapan Data Pengumpulan Data
Segmentasi Data
Komputasi Ekstraksi Fitur CWT Klasifikasi Data ANN Backpropagation Class1 Class2 Class3
Gambar 2. Blok Diagram Penelitian Tabel 1. File dan klasifikasinya dari database MIT-BIH Class Normal RBBB LBBB
Records 100-103-112-115-234 118-124-212 109-111
Jumlah File 50 30 20
137
2.2. Komputasi CWT CWT merupakan pengkonvolusian sinyal x(t) dengan sebuah fungsi window yang dapat berubah disetiap waktu pada skala yang diinginkan. CWT dapat direpresentasikan ke dalam persamaan (1). Dimana a adalah faktor skala dengan nilainya berbanding terbalik dengan frekuensi, b adalah lokasi waktu, ψ adalah fungsi mother wavelet, * adalah fungsi matematis konjungat kompleks. Mother wavelet yang digunakan dalam penelitian ini adalah morlet. Morlet merupakan fungsi Gaussian yang termodulasi oleh eksponential komplek, fungsi mother wavelet morlet ditunjukan dalam persamaan (2), dengan nilai ω 0 =2π (0.849) [7]. Morlet memiliki bagian real dan imaginary. (1)
ψ
morlet
(t ) =
1 4
π
e
−
t2 2
(2)
e − jω0t
Dalam menghitung CWT sinyal EKG, diperlukan berbagai skala tertentu, yang cocok dan tepat untuk ekstraksi fitur. Dengan s = 0.001 maka diperoleh nilai mother wavelet (ψ Re dan ψim ) yang kemudian dikalikan dengan amplitudo sinyal x(t).Perkalian dilakukan pada semua waktu kemudian dijumlahkan (diintegralkan). Hasilnya dikalikan dengan 1/ , sehingga diperoleh nilai CWT real dan CWT imajiner yang dapat dihitung magnitudonya dengan persamaan 3. (3) Dalam penelitian ini, analisis menunjukkan bahwa komputasi CWT dalam kisaran skala s = 0.001, dapat menyebabkan analisis yang lengkap dan berguna. Karena dalam rentang ini, baik noise dari sinyal dan efek perbedaan morfologis dapat dianalisis dan fitur diekstrak akan berguna untuk klasifikasi dari sinyal yang diteliti. Hasil CWT merupakan fitur matriks berukuran 100x200, selanjutnya diubah menjadi vektor 20.000 elemen yang akan menjadi input untuk pengklasifikasi sinyal EKG. Setelah karakteristik ciri dilakukan, langkah berikutnya adalah mengenali ciri yang diambil dari tiap data. Sebagai pengklasifikasi digunakan metode Artificial Neural Network dengan pembelajaran Backpropagation. Klasifikasi data dilakukan dengan memisahkan sinyal EKG ke dalam dua bagian, yaitu data untuk pelatihan dan data untuk pengujian. 75 data Tabel 2. Pola Vektor Keluaran
138
Klasifikasi data Kondisi normal Right Bundle Branch Block Left Bundle Branch Block
vektor CWT sinyal EKG menjadi data pelatihan dan 25 data menjadi data pengujian. Jaringan ini mempunyai input 20.000 (x 1 , x 2 ,…, x 20000 ), 50 hidden node (z 1 , z 2 ,… z 50 ), dan output bertipe Boolean untuk identifikasi kondisi (y 1, y 2, y 3 ). Arsitektur jaringan dapat dilihat pada Gambar 3. Pola keluaran yaitu 3 target keluaran dalam bentuk biner yang akan dilatih sehingga jaringan dapat mengenali pola ini. Jenis pola tersebut dapat dilihat pada Tabel 2. Untuk mengevaluasi hasil klasifikasi, dari hasil pengujian dihitung sensitifitas (Se), spesifisitas (Sp) dan Total akurasi (Ta). Langkah-langkah didefinisikan menggunakan True Positive (TP), True Negative (TN), False Positive (FP) dan False Negative (FN). Keputusan TP terjadi ketika deteksi sinyal normal dari classifier dan dokter dianggap benar. Keputusan TN terjadi ketika classifier dan dokter keduanya menyarankan adanya ketidaknormalan. FP terjadi ketika sinyal normal dianggap sebagai sinyal abnormal oleh sistem. Sedangkan, FN terjadi ketika sinyal abnormal dianggap normal oleh sistem. Sensitifitas dihitung dari jumlah identifikasi benar dari pengujian dengan sinyal EKG normal. Spesifisitas dihitung dari jumlah identifikasi benar dari pengujian sinyal abnormal. Total akurasi dihitung dari total klasifikasi benar dari total pengujian dengan sinyal normal dan abnormal. Sensitivity = TP / (TP + FN)………………....…. Specificity= TN / (FP + TN) …………………… Accuracy = (TP + TN) / N………………………
(4) (5) (6)
3. HASIL DAN PEMBAHASAN
2.3. Klasifikasi Sinyal EKG
No 1 2 3
Gambar 3. Arsitektur Jaringan Backpropagation
Data keluaran biner
100 010 001
Pada penelitian ini, CWT mampu menunjukan karakterisasi perbedaan nilai waktu dan frekuensi kondisi normal dan kelainan bundle branch block (BBB). Sinyal EKG normal dan BBB dalam domain waktu dan koefisien CWT dapat dilihat pada Gambar 4. Perbedaan dominan terlihat dari lebar kompleks QRS, hal ini menggambarkan adanya keterlambatan hantaran impuls saat depolarisasi ventrikel. Rentang waktu kondisi normal < 0.12 detik, sedangkan rentang waktu kondisi BBB > 0.12 detik. Hasil komputasi CWT berupa vektor 20.000 elemen telah siap dijadikan input untuk pengklasifikasi sinyal EKG.
(a) (b) Gambar 4. Sinyal EKG dalam domain waktu dan Koefisien CWT : a) Sinyal EKG normal (file 100); b) Sinyal EKG BBB
Tahap pengujian dibedakan terhadap data yang telah dilatih dan pengujian terhadap data baru. Untuk pengujian terhadap data yang telah dilatih dilakukan dengan menggunakan konfigurasi terbaik dari proses pelatihan yang telah dilakukan. Jumlah data 75 sampel sinyal EKG (40 sinyal normal, 21 sinyal rbbb, dan 14 sinyal lbbb). Tujuan dari pengujian ini adalah untuk melihat kehandalan ANN dalam belajar mengenali pola sinyal pada EKG yang direpresentasikan oleh nilai prosentase akurasi/keberhasilan dan nilai error kerja. Hasil Tabel 3. Persentase Keberhasilan Pengenalan Pola Sinyal EKG pada Sampel Data Latih
Actual class
Klasifikasi
Predicted class
∑
Persentase
0
40
100 %
21
0
21
100 %
0
0
14
14
100 %
40
21
14
75
100 %
Normal
RBBB
LBBB
Normal
40
0
RBBB
0
LBBB ∑
keluaran pengujian data latih diidentifikasikan dengan target keluaran biner, jika nilai keluaran sesuai dengan target maka identifikasi dianggap benar. Dari hasil pengujian jaringan terhadap data yang telah dilatih dapat mengenali semua pola data dengan tingkat akurasi 100%, prosentase keberhasilan untuk setiap kelas data dapat dilihat pada Tabel 3. Hal ini menunjukan bahwa ANN sangat handal dalam melakukan proses pembelajaran terhadap data yang telah dilatih. Untuk melihat kehandalan ANN dalam melakukan klasifikasi pola maka selanjutnya dilakukan pengujian terhadap data baru sebanyak 25 data uji baru yang terdiri dari 10 sinyal normal, 9 sinyal rbbb dan 6 sinyal lbbb. Dari hasil pengujian jaringan terhadap data baru prosentase tingkat akurasi mencapai 87.04%, yaitu ANN dapat mengenali 10 pola data sinyal normal dari 10 jumlah data pengujian, dapat mengenali 7 pola data sinyal rbbb dari 9 jumlah data pengujian, juga dapat mengenali 5 pola data sinyal lbbb dari 6 jumlah data pengujian. Prosentase keberhasilan untuk setiap kelas data dapat dilihat pada Tabel 4. Tabel 4 Persentase Keberhasilan Pengenalan Pola Sinyal EKG pada Sampel Data Test Klasifikasi
Actual class
Hasil CWT dengan jumlah data sebanyak 100 file dalam bentuk file *.txt (50 sampel sinyal normal, 30 sampel sinyal rbbb, dan 20 sampel sinyal lbbb), 75% data digunakan sebagai data pelatihan dan pengujian, 25% data lainnya digunakan sebagai data pengujian tanpa melalui proses pelatihan. Target keluaran merupakan tiga klasifikasi pola sinyal EKG normal, rbbb dan lbbb. Pelatihan dilakukan dengan target error 0,001 dan learning rate 0,5. Jumlah data pelatihan adalah 75 sampel sinyal EKG (40 sinyal normal, 21 sinyal rbbb, dan 14 sinyal lbbb).
Predicted class
∑
Persentase
Normal
RBBB
LBBB
Normal
10
0
0
10
100 %
RBBB
0
7
2
9
77.78 %
0
1
5
6
83.33 %
10
8
7
25
87.04 %
LBBB ∑
139
Pengujian berikutnya dilakukan dengan cara cross validation, yaitu menukar data latih menjadi data test dan sebaliknya data test dijadikan sebagai data latih. Dari 100 data set, 70 data dijadikan sebagai data latih dengan komposisinya adalah 35 klasifikasi sinyal normal, 21 klasifikasi sinyal RBBB dan 14 klasifikasi sinyal LBBB. 30 data lainnya dijadikan validasi data untuk testing dengan komposisinya adalah 15 klasifikasi sinyal normal, 9 klasifikasi sinyal RBBB dan 6 klasifikasi sinyal LBBB. Proses cross validation diulangi sampai 10 kali, dengan setiap sample tepat digunakan sekali sebagai validasi data. Pengujian ini dilakukan pada semua bagian dari data set digunakan untuk training dan testing sehingga setiap bagian mendapatkan perlakuan yang sama. Hasil pengujian cross validation dengan 70 data latih dan 30 data testing selanjutnya dijadikan pedoman untuk mendapatkan nilai Sensitifitas dan Spesifisitas. Sensitifitas (Se) merupakan probabilitas yang mempunyai pengujian benar dari sekelompok data sinyal EKG yang mempunyai klasifikasi benar, sedangkan Spesifisitas (Sp) merupakan probabilitas yang mempunyai pengujian salah dari sekelompok data sinyal EKG yang mempunyai klasifikasi salah. Hasil perhitungan dari 10 kali percobaan yang ditampilkan dalam Tabel 5, didapatkan rata-rata nilai Sensitifitas (Se) 0.87±0.08 (87%) dan nilai Spesifisitas (Sp) 0.95±0.03 (95%). ANN Backpropagation hasil perancangan ini memiliki tingkat akurasi yang lebih baik dalam mengenali pola sinyal normal dengan rata-rata keakuratan 97,33%, sedangkan tingkat akurasi untuk kelas rbbb dan lbbb masing-masing 82.22% dan 86.67%. Ketidakakuratan terjadi disebabkan oleh kemiripan pola sinyal rbbb atau lbbb yang sama-sama memiliki proses melebarnya kompleks QRS sebagai gambaran dari terhambatnya impuls di ventrikel kanan atau kiri. Selain itu, ketidakakuratan juga terjadi untuk pengenalan pola mirip yang belum diajarkan pada jaringan syaraf. Selain itu semakin banyak sample training yang dilatihkan, semakin tinggi persentase keberhasilan dalam pengenalan sinyal EKG. Tabel 5. Nilai Sensitifitas dan Spesifisitas Hasil pengujian cross validation dengan 70 data latih dan 30 data testing Pengujian Ke1 2 3 4 5 6 7 8 9 10
TP 9 8 8 9 10 8 9 8 9 10
Hasil Pengujian FN FP TN 1 1 19 1 1 20 1 1 20 2 2 17 0 0 20 2 2 18 1 2 18 2 1 19 1 1 19 1 0 19
Rata-rata Se dan Sp
140
Sensitifitas Se 0.87 0.89 0.89 0.79 1.00 0.73 0.86 0.83 0.87 0.96
Spesifisitas Sp 0.96 0.95 0.95 0.93 1.00 0.89 0.92 0.92 0.96 0.99
0.87±0.08
0.95±0.03
Keakuratan sistem dituntut mampu mengenali pola yang telah diajarkan maupun pola mirip dan keakuratan data saat pembelajaran awal pola yang dikenalkan, sehingga ANN Backpropagation merupakan kolaborasi seorang programmer yang bertanggung jawab atas keakuratan sistem pemroses dan seorang dokter yang bertanggung jawab atas keakuratan pelatihan 4. KESIMPULAN Pada penelitian ini, sinyal EKG diekstrak menggunakan CWT dengan memanfaatkan mother wavelet Morlet. CWT mampu menunjukan karakterisasi perbedaan nilai waktu dan frekuensi kondisi normal dan kelainan bundle branch block (BBB). Hasil ekstraksi karakteristik parameterparameter sinyal EKG ini selanjutnya dijadikan input dari ANN Backpropagation. ANN Backpropagation hasil perancangan ini mampu mengenali pola yang telah diajarkan dengan tingkat keakuratan 100%, sedangkan kemampuan pengenalan pola terhadap data baru prosentase tingkat akurasinya mencapai 87.04%. Hasil pengujian menunjukkan efektifitas dari pengenalan pola sinyal EKG dengan menggunakan metode CWT dan ANN Backpropagation. Pengembangan sistem diagnosa kelainan jantung ini dapat menghadirkan data analisa sinyal EKG melalui hasil komputasi yang lebih objektif pada saat subyektifitas analis medis menjadi dominan. DAFTAR REFERENSI [1] Akay, Metin (1997). “Wavelet Applications in Medicine”, IEEE Spectrum. Biomed. Eng. p.50-56. [2] Cvetkovic, Dean. Ubeyli, Elif Derya. Cosic, Irena.(2008), “Wavelet Transform Feature Extraction From Human PPG, ECG, and EEG Signal Responses to ELF PEMF Exposures : A Pilot Study,” Digital Signal Processing., vol.18, pp. 861-874. [3] Polikar, Robi. (1996), “The Wavelet Tutorial Part III Multiresolution Analysis and The Continues Wavelet Transform 2nd ed,”. [4] Addison PS. (2005), “Wavelet transforms and the ECG : a review”. Physiological Measurement vol.26,. pp.155-199. [5] Ham, Fredric M. (2000), Principles of Neurocomputing for Science and Engineering. McGraw-Hill Companies, Inc. Singapore. [6] Silipo, R., Marchesi, C. (1998), Artificial Neural Networks for Automatic ECG Analysis, IEEE Transactions on Signal Processing, Vol. 46-5. [7] Heden, B., Ohlson, M., Rittner, R., Pahlm, O., Haisty, W., K., Peterson, C. and Edenbrandt, L. (1996), “Agreement Between Artificial Neural Networks and Experienced Electrocardiographer on Electrocardiographic Diagnosis of Heald Myocardial Infarction”, JACC Elsevier Science Inc, Vol. 28, No. 4.