Rok / Year: 2013
Svazek / Volume: 15
Číslo / Issue: 5
Automatická analýza signálu EKG Automatic ECG signal analysis David Pospíšil1 , Martin Klimek2 , Jiří Kozumplík2
[email protected],
[email protected],
[email protected] 1
Fakultní nemocnice Brno, Interní kardiologická klinika - Pracoviště invazivní a intervenční elektrofyziologie, Invazivní arytmologická laboratoř, 2 Fakulta elektrotechniky a komunikačních technologií VUT
Abstrakt: Článek se zabývá použitím vybraných metod shlukové analýzy na signál EKG s cílem třídění QRS komplexů dle jejich morfologií na normální a abnormální, popřípadě rozlišení jednotlivých typů abnormalit. Je využito hierarchické aglomerativní shlukování a nehierarchická metoda K-Means, pro něž byla v programovém prostředí Mathworks MATLAB vytvořena aplikace.
Abstract: This article deals with the use of some methods of cluster analysis on the ECG signal in order to sort QRS complexes according to their morphology to normal and abnormal, also is engaged in distribution of abnormalities. It is used agglomerative hierarchical clustering and non-hierarchical method K-Means for which an application in Mathworks MATLAB programming equipment was developed.
VOL.15, NO.5, OCTOBER 2013
Automatická analýza signálu EKG David Pospíšil1, Martin Klimek2, Jiří Kozumplík2 1 Fakultní nemocnice Brno Interní kardiologická klinika - Pracoviště invazivní a intervenční elektrofyziologie Invazivní arytmologická laboratoř Jihlavská 20, 625 00 Brno E-mail:
[email protected]
Fakulta elektrotechniky a komunikačních technologií VUT Ústav biomedicínského inženýrství, Kolejní 4, 612 00 Brno E-mail:
[email protected],
[email protected] 2
Abstrakt – Článek se zabývá použitím vybraných metod shlukové analýzy na signál EKG s cílem třídění QRS komplexů dle jejich morfologií na normální a abnormální, popřípadě rozlišení jednotlivých typů abnormalit. Je využito hierarchické aglomerativní shlukování a nehierarchická metoda K-Means, pro něž byla v programovém prostředí Mathworks MATLAB vytvořena aplikace.
1 Úvod Kardiovaskulární onemocnění jsou často velmi závažná a vyžadují rychlá a systematická řešení. Jednou z metod, jak tato onemocnění odhalit v poměrně časném stadiu je tzv. holterovské monitorování, tedy dlouhodobý EKG záznam a jeho následná analýza. Tento záznam se ovšem skládá až ze stovek tisíc srdečních cyklů, a pokud vůbec, je velmi obtížné a časově náročné, aby tento záznam byl cyklus po cyklu prohlédnut a vyhodnocen specializovaným lékařem. V dnešní době je několik možností, jak automatizovaně, s využitím výpočetní techniky a moderních postupů redukovat čas a zvýšit spolehlivost diagnostiky často smrtelných chorob. Jednou z možností je aplikace shlukovacích metod, které z daného dlouhodobého záznamu dokážou vytřídit důležité úseky signálu a připravit je k manuální diagnostice lékařem. Lékař tak vyhodnocuje pouze signifikantní data, klesá tak možnost pochybení lidského faktoru a celý proces se několikanásobně urychluje [1].
2 Shluková analýza Metodou, která byla použita pro analýzu signálu EKG v této práci, je shluková analýza. Jedná se o vícerozměrnou statistickou metodu. Hlavní podstatou metody je vytvoření shluků, které v sobě obsahují jednotlivé cykly shluknuté na základě zvolených kritérií. Každý vytvořený shluk pak může být dále reprezentativním shlukem dané skupiny. Vytvořením takových reprezentativních shluků se délka EKG signálu nutná k manuálnímu zpracování odborníkem zkrátí z několika hodin řádově na několik minut, čímž výrazně klesne časová náročnost kontroly např. výsledku holterovského vyšetření. Takto upravený signál bývá zpravidla dále analyzován lékařem [2], [3].
2.1 Princip shlukové analýzy Princip shlukové analýzy spočívá obvykle v po sobě jdoucích šesti krocích. Jedná se o získání matice dat, standardizace matice dat, výpočet matice podobností, realizace shlukovací metody, přerovnání matice podobností a výpočet korelačního koeficientu. Získáním matice dat rozumíme vytvoření matice, která slouží jako vstupní data pro další kroky. Sloupce matice reprezentují objekty (v našem případě QRS komplexy) a řádky pak atributy těchto objektů. Za atributy byly zvoleny amplitudy jednotlivých vzorků úseků EKG signálů obsahujících QRS komplexy. Standardizace matice dat je volitelným krokem, který v případě potřeby změní originální atributy na bezrozměrná čísla, například pro dodržení určitého číselného rozsahu. Výpočet matice podobností je důležitým krokem, ve výsledné matici jsou pak zaznamenány koeficienty podobností resp. nepodobností mezi jednotlivými páry objektů. Matice je čtvercová a symetrická. Rozdíl mezi podobností a nepodobností je pouze ve způsobu interpretace koeficientů. Pro výpočet těchto koeficientů se používají metriky, v našem případě uvedené v podkapitole 3.2. Dalším krokem v postupu je realizace shlukovací metody, zde je možno volit z několika metod, viz podkapitola 3.2. Jednotlivé shlukovací metody se liší způsobem tvorby shluků z podobnostní matice objektů – např. metoda SLINK – Single Linkage Clustering Method, která využívá nejmenší vzdálenost mezi objekty. Následné přerovnání matice podobností spočívá v seřazení objektů podle toho, jak budou seřazeny v dendrogramu – podle jejich podobností resp. nepodobností. Posledním krokem je výpočet korelačního koeficientu. Využívá se výpočtu Pearsonova korelačního koeficientu pro zjištění zkreslení, které přineslo vytvoření dendrogramu. Zkreslení způsobené dendrogramem se uvažuje jako přijatelné, pokud je Pearsonův korelační koeficient , při〉. čemž jeho hodnoty mohou nabývat z intervalu 〈 Dendrogram je druh diagramu, kterým graficky znázorňujeme výsledky hierarchických metod shlukové analýzy. Jedná se o binární strom. Každý uzel tohoto stromu představuje jeden shluk. Pokud provedeme horizontální řez dendrogra-
303
VOL.15, NO.5, OCTOBER 2013 mem, získáme rozklady ze shlukovací sekvence, vzdálenost ve vertikálním směru pak reprezentuje vzdálenost mezi shluky.
3 Aplikační část Metody byly testovány na 22 signálech z databáze CSE, které byly vybrány pro výskyt extrasystol. Před samotnou analýzou bylo třeba signály předzpracovat (délka vybraných úseků, filtrace dolní propustí a odstranění driftu). 3.1 Předzpracování Volba délky segmentovaných úseků ze signálů byla dána předpokladem, že normální QRS komplex má fyziologicky délku maximálně do 110 ms s tím, že nad 120 ms je vždy považován jako aberantní, proto se jako vhodné jeví vysegmentovat úseky signálu o délce 120 ms. Jelikož QRS detektor detekuje středy komplexů, nastavení bylo 60 ms před středem a 60 ms za středem QRS. Filtrace FIR filtrem jako dolní propustí byla zvolena s délkou filtru (N=51) a mezní frekvencí 70 Hz podle [4], aby bylo dosaženo, co se týče filtrace stejných výsledků a celkové výsledky se pak mohly objektivněji porovnat. Byla však testována i jiná nastavení délek filtru a mezní frekvence, lepších výsledků (vlivu na výslednou klasifikaci QRS komplexů) nebylo dosaženo, proto bylo pevné nastavení zvoleno stejně, jako výše uvedené. Odstranění driftu bylo dosaženo převedením signálu do frekvenční oblasti a vynulováním nultých spektrálních čar. Detektor QRS byl vybrán vícebodový, který je na ústavu UBMI dostupný a na signálech z CSE databáze spolehlivě funkční, [5]. 3.2 Možnosti aplikace Po nastavení parametrů volby délky QRS komplexů, filtrace dolní propustí a odstranění driftu popsanými způsoby byly dále testovány různé kombinace metrik a shlukovacích metod. Pro hierarchické aglomerativní shlukování bylo použito devět metrik: Euklidovská, Euklidovská vážená metrika, Hammingova metrika Manhattan, Minkowského, Čebyševova, Mahalanobisova, korelační, kosinová a Spearmanova vzdálenost. U metody K-Means byly vybrány metriky čtyři a to Euklidovské čtvercové vzdálenosti, Hammingova metrika Manhattan, kosinová vzdálenost a korelační vzdálenost. Zatímco metoda K-Means je sama o sobě metodou pro tvorbu shluků, hierarchické aglomerativní shlukování vyžaduje volbu metody pro shlukování. V práci bylo využito sedm metod a to SLINK, UPGMA, UPGMC, CLINK, WPGMC, WPGMA a Wardova shlukovací metoda [3], [6]. Na obrázku 1 je zobrazen vybraný signál s označením W028.mat. Jedná se o svod V3. Signál obsahuje sinusový rytmus a polymorfní komorové extrasystoly.
Obrázek 1: Průběh analyzovaného signálu W028. Výsledný dendrogram pro signál W028 je na obrázku 2. Automatická analýza správně klasifikovala polymorfní komorové extrasystoly a rozdělila je do samostatného shluku. První typ je na pozicích 3 a 7, druhý typ na pozici 8. Globální nastavení parametrů je uvedeno v podkapitole 3.1 a je platné pro všechny ukázky. Lokální parametry: Svod V3, metrika: Euklidovská, shlukovací metoda: SLINK.
Obrázek 2: Výsledný dendrogram pro signál W028. Dalším příklad správné klasifikace je zobrazen na obrázcích 3 a 4. Na obrázku 3 se jedná o svod V2. Signál obsahuje sinusový rytmus a kombinaci supraventrikulární extrasystoly a tří monomorfních extrasystol. Na obrázku 4 lze vidět, že automatická analýza správně klasifikovala supraventrikulární extrasystolu na pozici 4 a tři monomorfní extrasystoly na pozicích 1, 7 a 10.
304
Obrázek 3: Průběh analyzovaného signálu W103.
VOL.15, NO.5, OCTOBER 2013 první typ je na pozicích 2, 6 a 10, druhý typ pak na pozicích 4, 8 a 12. Nutno podotknout, že kromě úspěšné klasifikace automatická analýza u některých signálů selhala (W020). Příkladem neúspěšné klasifikace je obrázek 7 a 8. Signál W020 obsahuje sinusový rytmus a junkční extrasystoly, první typ na pozici 14 a druhý typ na pozici 17.
Obrázek 4: Výsledný dendrogram pro signál W103. Lokální parametry: Svod: V2, metrika: Mahalanobisova, shlukovací metoda: UPGMA. Pro poslední ukázku správné klasifikace byl vybrán poměrně komplikovaný signál W117, který je zobrazen na obrázku 5. Signál obsahuje kombinaci sinusového rytmu, sinusového rytmu s blokem levého raménka Tawarova, levým předním hemiblokem a polymorfních komorových extrasystol.
Obrázek 7: Průběh analyzovaného signálu W020. Jedná se o svod V3. Na řezu dendrogramu na obrázku 8 pro 3 shluky je patrná nesprávná klasifikace QRS komplexů do daného počtu shluků podle jejich morfologií. Extrasystola na pozici 14 byla sice správně zařazena do jednoho shluku, ale extrasystola na pozici 17 se nachází ve shluku spolu s QRS komplexy pocházejícími ze sinusového rytmu, díky tomu je výsledek považován za nesprávný.
Obrázek 5: Průběh analyzovaného signálu W117. Jedná se o svod V2.
Obrázek 8: Dendrogram signálu W020. Lokální parametry: Svod: V3, metrika: korelační vzdálenost, shlukovací metoda: WPGMC. Další nesprávnou klasifikací byl postižen signál W047, jehož průběh je na obrázku 9. Jedná se o svod V1. Signál obsahuje sinusový rytmus a polymorfní junkční extrasystoly, první typ na pozicích 11 a 16, druhý typ na pozici 16. Obrázek 6: Výsledný dendrogram pro signál W117. Lokální parametry: Svod: V2, metrika: Manhattan, shlukovací metoda: CLINK. Automatická analýza správně klasifikovala kombinaci sinusového rytmu na pozicích 1, 5 a 9, sinusového rytmu s blokem levého raménka Tawarova a levým předním hemiblokem na pozicích 3, 7 a 11, a polymorfních komorových extrasystol,
305
Obrázek 9: Průběh analyzovaného signálu W020.
VOL.15, NO.5, OCTOBER 2013
Na obrázku 10 vidíme dendrogram se 3 shluky. Je patrná nesprávná klasifikace QRS komplexů do daného počtu shluků podle jejich morfologií, extrasystoly byly přiřazeny do shluků obsahující QRS komplexy pocházející ze sinusového rytmu, díky tomu je výsledek považován za nesprávný.
není příliš zašuměn (subjektivní, empirický náhled), lze úspěšně použít jako metriku korelační vzdálenost. Výběr nejvhodnějšího svodu k analýze je opět podmíněn empiricky – je vhodné vybrat svod s co nejmenším viditelným zašuměním a dobře viditelnými abnormalitami (např. výchylka při KES je diskonkordantní s ostatními QRS komplexy). V případě této sady dvanáctisvodových EKG záznamů byly prověřeny všechny svody a nebyly nalezeny signifikantní rozdíly, proto se jako nejvhodnější (nejrychlejší, spolehlivý) postup jeví subjektivní náhled na signál.
5 Závěr
Obrázek 10: Dendrogram pro signál W020. Lokální parametry: Svod: V1, metrika: vážená euklidovská, shlukovací metoda: WPGMA.
4 Diskuze výsledků Z knihovny CSE byla vybrána sada 22 signálů obsahující především extrasystoly, výběr byl takto učiněn ze dvou důvodů. Prvním důvodem je existence některého typu extrasystol (aberantních QRS komplexů) a druhým fakt, že tato sada signálů byla v roce 2012 testována jinými přístupy (algoritmem vycházejícím z R-R intervalů, tvarových faktorů a algoritmem vycházejícím z korelační matice) a bude tedy vhodné s [4] vzájemně porovnat výsledky. Signály s obsahem komorových extrasystol (KES) byly klasifikovány úspěšně, jelikož KES jsou morfologicky velmi odlišné od normálního QRS komplexu. A ve většině případů nebyl problém oddělit i jednotlivé typy při polymorfii. Při supraventrikulárních extrasystolách ve sledovaných signálech, popřípadě při existenci AV bloků nedochází (resp. nemusí docházet) ke změnám na QRS komplexech, v těchto případech je nesmyslné podle shlukové analýzy QRS komplexů hodnotit normální / abnormální cykly, jelikož QRS komplexy jsou z morfologického hlediska všechny stejného typu. Částečného úspěchu lze dosáhnout pouze při výrazně aberantních vlnách P, které se zahrnou do segmentovaného úseku před QRS, vliv je ovšem nevýznamný. Co se týká jednotlivých kombinací metrik a shlukovacích metod, nelze jednoznačně stanovit, která kombinace dosahuje nejhorších a která nejlepších výsledků. Záleží na typu signálu, jeho variabilitě a úrovni zkreslení / zašumění. Výhodnými kombinacemi se však jeví použití euklidovské metriky, či Spearmanovy vzdálenosti v kombinaci s UPGMA či Wardovou metodou minimálního rozptylu. V případě signálu, který
Cílem práce bylo pomocí zvolených přístupů ke shlukové analýze od sebe oddělit normální a abnormální srdeční cykly na základě rozdílů v morfologiích jednotlivých QRS komplexů. Jelikož se v EKG signálu mohou objevit abnormální QRS komplexy různých morfologií, za správný výsledek lze považovat nejen oddělení normálních a abnormálních cyklů (tedy dva shluky – jeden s normálními, druhý s abnormálními cykly), ale navíc i situaci, kdy došlo k úplnému rozdělení do shluků podle jednotlivých morfologií – absolutní rozdělení. Práce byla směřována právě k tomuto úplnému – absolutnímu rozdělení. Bylo testováno 22 signálů z knihovny CSE, tedy 22 signálů po 12 svodech, tzn. celkem 264 svodů. Lze konstatovat, že hierarchické přístupy dosáhly lepších výsledků. Pro splnění kritéria oddělení normálních / abnormálních cyklů hierarchické přístupy správně vyhodnotily 83 % svodů a metoda K–Means byla úspěšná v 73,5 % případů. Za správně vyhodnocený EKG signál považujeme ten, kde existuje alespoň jeden svod, na kterém bylo dosaženo správného rozdělení s pevně daným nastavením. Důvody pro menší úspěšnost metody K–Means lze hledat především v menší robustnosti vůči šumu. Celkově bylo testovanými metodami dosaženo lepších výsledků než v případě [4], jedná se však o úzkou skupinu testovacích signálů a pro relevantní srovnání by bylo třeba testovat větší skupinu a také použít signály obsahující větší počet cyklů. Bylo by také třeba stanovit vhodné počáteční podmínky pro všechny srovnávací metody a přístupy jiných autorů. Ve srovnání s [1], [7], [8] bylo dosaženo horších výsledků, jelikož metody těchto autorů se zakládají na daleko komplexnějších postupech využívajících podrobné parametrické rozměření EKG signálů.
Poděkování Tento článek vzniknul za podpory projektu P102-12-2034.
Literatura [1] CUESTA-FRAU, D., J. C. PÉREZ-CORTÉS a G. ANDREU-GARCÍA. Clustering of electrocardiograph signals in computer-aided Holter analysis. Computer Methods and Programs in Biomedicine [online]. 2003, roč. 2003, č. 72, s. 18 [cit. 2013-05-21]. Dostupné z: http://www.miron.upv.es/vision/membres/gandreu/publica ciones/ClusteringECG.pdf
306
VOL.15, NO.5, OCTOBER 2013 [2] MAESSCHALCK, R.; JOUAN-RIMBAUD, D.; MASSART, D. L. The Mahalanobis distance. Chemometrics and Intelligent Laboratory Systems. 2000, vol. 50, no. 1, pp. 1-18. [3] ROMESBURG, H. Charles. Cluster analysis for researchers. [repr.]. Lulu Pr: Lulu Press, 2004. ISBN 978-1411606-173. [4] CHROBÁK, M. Shluková analýza. Brno: Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií, 2012. 56 s. Diplomová práce. Vedoucí diplomové práce doc. Ing. Jiří Kozumplík, CSc. [5] VÍTEK, M. Automatické rozměření signálů EKG. Brno, 2010. Dizertační práce na Vysokém učení technickém na Ústavu biomedicínského inženýrství. Vedoucí dizertační práce doc. Ing. Jiří Kozumplík, CSc.
[6] KELBEL, J.; ŠILHÁN, D. [online]. 2002 [cit. 2012-0428]. Shluková analýza. Dostupné z: http://staff.utia.cas.cz/nagy/skola/Projekty/Classification/S hlukovaAnalyza.pdf [7] KIRANYAZ, S., T. INCE, J. PULKKINEN a M. GABBOUJ. A Personalized Classification System for Holter Registers. 31st Annual International Conference of the IEEE EMBS Minneapolis, Minnesota, USA. 2009, s. 6. [8] CHUDÁČEK, V., M. PETRÍK, G. GEORGOULAS, M. ČEPEK, L. LHOTSKÁ a Ch. STYLIOS. Comparison of seven approaches for holter ECG clustering and classification. Proceedings of the 29th Annual International Conference of the IEEE EMBS Cité Internationale, Lyon, France. 2007.
307