Využití metody matching pursuit pro detekci ERP vln1 Pavel Mautner, Roman Mouček Katedra informatiky a výpočetní techniky, Zápodočeská univerzita v Plzni, Univerzitní 8, 306 14 Plzeň
[email protected],
[email protected]
Abstrakt Vědní obory jakým je například neuroinformatika se snaží prostřednictvím moderních technologií a metod pomoci lékařům s pochopením některých funkcí lidského mozku. Uplatnění počítačů v lékařských laboratořích a na operač-ních sálech a využití moderních metod zpracování signálů umožňuje změnit a obohatit tradiční způsob interpretace EEG záznamu mozkové aktivity. Tato práce se zabývá využitím metody matching pursuit v oblasti detekce a analýzy jednotlivých komponent evokovaných potenciálů (ERP).
1
Úvod*
Lidský mozek vzhledem ke své složitosti odolával v průběhu většiny 20. století masivnějšímu vědeckému bádání. S prudkým rozvojem výpočetní techniky v posledních dvou dekádách se kromě klasických věd zabývajících se lidským mozkem dlouhodobě (např. psychiatrie) začaly bouřlivě rozvíjet i další vědní obory, které se snaží využít nových technologií a přispět k bližšímu poznání organizace a fungování lidského mozku. Tyto rozvíjející se obory mají pak samozřejmě multidisciplinární charakter. (např. neuroinformatika, neurolingvistika apod.). Jedna z metod měření aktivity lidského mozku, tzv. elektroencefalografie (EEG), je založena na snímání změny elektrických potenciálů elektrodami z povrchu hlavy a následném vyhodnocení získaného EEG signálu. Vzhledem k tomu, že EEG signál má nestacionární charakter, je nutné k jeho zpracování využívat speciálních metod. Jednou z těchto metod je i metoda matching pursuit (MP), která patří do skupiny metod adaptivního zpracování signálů. Matching pursuit aproximuje vstupní signál součtem funkcí (tzv. atomů), které jsou vybírány z tzv. redundantního slovníku funkcí tak, aby nejlépe charakterizovaly jednotlivé úseky analyzovaného signálu. Jednotlivé atomy lze charakterizovat jejich měřítkem, Tato práce vznikla v rámci řešení projektu Ministerstva dopravy České republiky č. 1F84B/042/520
časovým posuvem, frekvencí a fázovým posuvem a tyto parametry nám pak poskytují důležité informace o charakteru signálu a především o výskytu určitých anomálií, kterými mohou být např. artefakty, ERP komponenty, epileptické, popř. spánkové grafoelementy apod. Matching pursuit je často využíván v souvislosti se zpracováním kontinuálního EEG signálu k nalezení určitých typů grafoelementů, popř. spánkových stavů [4][5]. Tento článek se zabývá využitím algoritmu matching pursuit v oblasti detekce přítomnosti ERP vln v segmentovaném EEG signálu. V kap. 2 je uveden popis metody matching pursuit, v kap. 3 je popsán základní princip zpracování segmentovaného EEG signálu a detekce ERP komponent. Na jednoduchém příkladu je uveden způsob detekce ERP komponent s využitím jak standardních metod, tak metody MP. V kapitolách 4 a 5 jsou diskutovány dosažené výsledky a je naznačen směr dalšího výzkumu v této oblasti.
2
Matching Pursuit
Algoritmus matching pursuit byl poprvé publikován Mallatem a Zhangem [1] v roce 1993. Tato metoda aproximuje vstupní signál součtem funkcí, které jsou vybírány z tzv. redundantního slovníku tak, aby co nejlépe charakterizovaly jednotlivé úseky vstupního signálu. Nejčastěji se jako slovníkové funkce používají tzv. Gaborovy atomy, které tvarem odpovídají Gausovskému okénku modulovanému kosinovou funkcí (viz Obr. 1).
1
Obr. 1. Gaborovy atomy
Matematicky lze Gaborovy atomy vyjádřit následujícím vztahem:
g (t ) = e −πt , t −u g ( s ,u ,,v ,w) (t ) = g cos(vt + w) , s 2
(1) (2)
kde parametry s, u, v, w reprezentují v uvedeném pořadí měřítko, posun, frekvenci a fázi jednotlivých atomů. Uvažujme, že γ=(s,u,v,w) je čtveřice parametrů zvoleného atomu a f je vstupní signál, který chceme analyzovat. Vlastní algoritmus matching pursuit lze popsat jako iterační proceduru následovně [2]: 1.
z povrchu hlavy. Tato metoda je široce využívána jak při klinických vyšetřeních v nemocnicích, tak při vědeckých experimentech. Výsledný obraz mozkové aktivity (EEG signál) je velmi hrubý (reprezentuje obrovské množství zdrojů neuronální aktivity) a je velmi obtížné z něj odvodit odpovídající neurokognitivní procesy. Nicméně specifické neuronální odpovědi spojené s konkrétními smyslovými, kognitivními nebo motorickými událostmi (stimuly) jsou součástí EEG aktivity a mohou být z této celkové aktivity celou řadu technik extrahovány a poté dále zpracovávány. Tyto specifické odpovědi se nazývají evokované potenciály (v angličtině častěji používá termín event-related potentials - ERP1).
Ve slovníku funkcí vyber funkci gγ, která nejlépe aproximuje signál f (tj. maximalizuje skalární součin (4) f , gγ Analyzovaný signál f pak může být zapsán jako (5) f = f , g γ g γ + Rf
2.
Opakuj proces v bodě 1 na reziduum Rf, dokud není splněno ukončovací kritérium.
Po M iteracích je možné vstupní signál f vyjádřit ve tvaru: M −1
f = ∑ R k f , gγ gγ k + R M f k =0
(6)
k
kde Rkf označuje residuum zbývající po k krocích. Algoritmus obvykle končí, pokud je residuum ║RMf║2 menší než předem zvolený práh. Dalším často používaným kritériem ukončení je dosažení určitého počtu iterací k (tj. nalezení k atomů, které nejlépe aproximují signál). Na Obr. 2 je znázorněn vstupní signál, jeho aproximace Gaborovými atomy a časově-frekvenční rozložení energie jednotlivých atomů. Z časověfrekvenční mapy je patrné, ve kterém časovém okamžiku se vyskytují jednotlivé „anomálie“ ve vstupním signálu. Toho lze s výhodou využít pro zpracování EEG signálu, ve kterém jednotlivé anomálie odpovídají změně chování (např. usínání, počátek epileptického záchvatu, ERP vlna apod.), popř. přítomnosti rušivých elementů (oční popř. svalové artefakty atd.). Odstranění zvolených atomů, popř. jejich dalším zpracováním pak lze do určité míry „vyčistit“ signál od nežádoucích artefaktů, popř. detekovat přítomnost určitého typu EEG grafoelementu.
3
Detekce ERP vln v EEG signálu
Elektroencefalografie (EEG) je metoda založená na snímání změny elektrických potenciálů elektrodami
Obr. 2. Analyzovaný signál (nahoře), dekompozice na jednotlivé atomy, časově frekvenční zobrazení energie jednotlivých atomů (dole)
Obecně má neuronální odpověď na stimul tvar vln s pozitivní (označené jako P), popř. negativní (označené jako N) amplitudou, které jsou charakterizovány velikostí této amplitudy, latencí (tj. dobou v milisekundách, která uplyne od okamžiku výskytu stimulu do okamžiku výskytu ERP vlny) a rozložením amplitudy na povrchu
1
V češtině se používá pojem evokované potenciály, anglická literatura často rozlišuje mezi evoked potentials – potenciály evokované stimulem a event-related potentials – tímto termínem se označuje obecná množina potenciálů, která vykazuje stabilní časovou souvislost vzhledem k definovatelné referenční události. V tomto textu lze termíny evokované potenciály a event-related potentials považovat za vzájemně zaměnitelné.
hlavy. Např. označení P300 znamená pozitivní vlnu, vyskytující se přibližně 300ms po okamžiku stimulace. ERP vlny mají relativně nízkou amplitudu (1-30µV) v porovnání s EEG aktivitou na pozadí, proto je k jejich extrakci nutné použít metod, které běžnou EEG aktivitu na pozadí (obvykle složenou z α, β, a γ vln) potlačují a zvýrazňují pouze zvolenou ERP komponentu, odpovídající měřenému neurokognitivnímu procesu.
3.1 Nalezení průměrování
ERP
komponent
metodou
Jednou z metod, používaných k potlačení EEG aktivity na pozadí, je průměrování jednotlivých epoch signálu, vzniklých segmentací kontinuálního EEG signálu [3]. Segmentace se provádí na základě synchronizačních impulsů, které jsou generovány při výskytu události (stimulu) a jsou ukládány společně s EEG záznamem. S ohledem na sledovanou ERP komponentu, se během segmentace vezme úsek EEG signálu v okolí synchronizačních značek (např. 0.5 s před značkou a 1 s za značkou) a tyto úseky tvoří epochy, které jsou následně průměrovány. Na následujících obrázcích jsou znázorněna naměřená data získaná v průběhu experimentu, který byl zaměřen na detekci vlny P300. V tomto experimentu sledovala měřená osoba monitor, na kterém se zobrazovali dva znaky O a Q (bílý znak na černém pozadí). Doba zobrazení znaku byla přibližně 800 ms, 200 ms bylo zobrazováno pouze pozadí (černá plocha). Znak O se zobrazoval zhruba 4 krát častěji (tzv. non-target stimul), než znak Q (tzv. target stimul). V případě zobrazení znaku Q dochází u měřené osoby k výskytu vlny P300. Na Obr. 3 je znázorněn průběh naměřeného EEG signálu s vyznačením okamžiků výskytu jednotlivých stimulů (J1-zobrazení znaku O, N1-zobrazení znaku Q).
s latencí přibližně 300 ms, která odpovídá hledané komponentě P300.
3.2 Nalezení ERP matching pursuit
komponent
metodou
Nevýhodou uvedené metody průměrování je, že k extrakci ERP komponent potřebujeme velké množství odpovídajících epoch (a tedy i stimulů). V některých aplikacích (např. v systémech BCI) je potřeba pouze detekovat přítomnost ERP vlny v daném časovém úseku a nejde o zobrazení jejího hladkého průběhu. Tato detekce však musí být provedena s dostatečnou rychlostí a není tedy možné stimulovat měřenou osobu velkým množstvím stimulů. K tomuto účelu se používají metody tzv. single-trial analýzy jednotlivých epoch [6].
a)
b) Obr. 4. Segmentovaný EEG signál: a) non-target stimuly (výskyt znaku O), b) target stimuly (znak Q) Obr. 3. EEG signál doplněný o synchronizační značky Na obrázku 4 jsou znázorněna segmentovaná data pro non-target (Obr. 4a) a target (Obr. 4b) stimuly. Na obrázku 5 jsou znázorněna průměrovaná data z elektrody Fz pro non-target a target stimuly. Pro target stimuly (zobrazení znaku Q) je patrný výskyt vlny
Tyto metody jsou ve většině případů založeny na waveletové dekompozici vstupního signálu a jsou použitelné pouze pro některé ERP komponenty s dostatečně vysokou amplitudou a vhodným tvarem (např. P300). Matching pursuit lze použít k nalezení ERP komponent podobně jako waveletovou dekompozici. Rozdíl je
v tomto případě pouze v použitých funkcích, které se používají k aproximaci segmentovaného signálu. Zatímco u waveletové transformace se k dekompozici vstupního signálu používají funkce (wavelety), které musí splňovat určité matematické podmínky, u metody matching pursuit nejsou na funkce uložené ve slovníku kladeny žádné zvláštní požadavky. To umožňuje vytvořit slovník funkcí, které tvarově pokrývají detekované ERP komponenty, a tím lze dosáhnout poměrně kvalitní aproximace vstupního signálu. Princip použití algoritmu matching pursuit spočívá v tom, že na vstupní signál, který tvoří buďto samostatná epocha nebo průměr několika epoch, opakovaně aplikujeme postup uvedený v kapitole 2 a nalezneme jednotlivé atomy, které co nejlépe aproximují vstupní signál. Poté prohledáváme jednotlivé atomy a hledáme ten, jehož parametr u (časový posun) co nejvíce odpovídá latenci hledané ERP komponenty.
zřejmé, že v časově-frekvenční mapě se v tomto případě neobjevuje žádný atom, jehož časový posun (≈300ms) by odpovídal hledané ERP komponentě. P300
a)
a)
b)
b) Obr. 5. Průměrovaná data z elektrody Fz: a) nontarget stimuly (výskyt znaku O), b) target stimuly (znak Q) Na Obr. 6a je znázorněna jedna epocha segmentovaného EEG signálu (z experimentu popsaného v kap. 3.1), ve kterém je přítomna vlna P300 a odpovídající časově frekvenční mapa atomů aproximujících vstupní signál. Z obrázku je patrný výskyt atomu, jehož posun odpovídá přibližně latenci latenci vlny P300. Obr. 6b znázorňuje časový průběh signálu a odpovídající časově-frekvenční mapu epochy, ve které P300 přítomna není. Z obrázku je
Obr. 6. Segmentovaný EEG signál (jediná epocha) a časově frekvenční mapa atomů: a) target stimuly (znak Q) b) non-target stimuly (znak O)
4
Dosažené výsledky
Algoritmus matching pursuit byl testován na signálech získaných z experimentů, jejichž cílem bylo evokovat potenciál P300 (např. standardní odd-ball experiment zmíněný v kap. 3.1, experiment zaměřený na určení myšleného čísla z EEG signálu apod.). Funkce algoritmu byla názorně prezentována v kap. 3.2. Testy ukázaly, že touto metou lze detekovat přítomnost komponenty P300 buďto přímo v jediné epoše nebo
v relativně nízkém počtu průměrovaných epoch. Úspěšnost detekce vizuální komponenty P300 v samostatných neprůměrovaných epochách dosahovala hodnoty přibližně 85%. Na relativně nízké hodnotě úspěšnosti detekce, měla do jisté míry podíl i přítomnost očních artefaktů. V signálu, vytvořeného průměrováním 10 epoch, dosahovala úspěšnost detekce komponenty P300 přibližně 94%. Bez použití algoritmu MP bylo nutné průměrovat alespoň 20-30 epoch, abychom dosáhly obdobného výsledku. Z toho vyplývá, že metodu matching pursuit je možné využít zejména tam, kde je potřeba rychle detekovat přítomnost dané ERP komponenty (např. v systémech BCI). Na Obr. 7 jsou znázorněny podobné průběhy, ale jako vstupní signál byl použit průměr z 5 epoch stejného typu.
5
Závěr
Jak vyplývá z výsledků provedených experimentů, lze metodu matching pursuit využít i pro zpracování a detekci ERP komponent. V tomto článku bylo prezentováno pouze využití metody MP pro detekci komponenty P300. Využitelnost algoritmu pro detekci ostatních ERP komponent nebyla zatím testována a bude předmětem dalšího výzkumu. V následném výzkumu se také zaměříme na možnost vytvoření vlastního slovníku funkcí, které využívá MP algoritmus k aproximaci vstupního signálu. Vhodnou volbou těchto funkcí by mělo být dosaženo vyšší úspěšnosti detekce jednotlivých ERP komponent.
P300
Literatura
a)
b) Obr. 7. Signál získaný průměrováním 5 epoch a odpovídající časově frekvenční mapa atomů: a) target stimuly (znak Q), b) non-target stimuly (znak O)
[1]
Mallat S. G., Zhang Z.: Matching Pursuit with Time-Frequency Dictionaries, IEEE Trans. On Signal Proc., Vol. 41, No. 12, 1993
[2]
Fernando S.E., Kolasa L.A., Kovačevic N.: A Flexible implementation of Matching Pursuit for Gabor Functions on the Interval, ACM Trans. On Math. Software, Vol 28, No. 3, 2002
[3]
Luck, S. J.: An Introduction to the Event-related Potential Technique, MIT Press, Cambridge, Massachusetts, USA, 2005.
[4]
Durka, P, J.: Blinowska, K. J.: Analysis of EEG transients by means of Matching Pursuit. Ann Biomed Eng. 1995, 23: pp. 608–611
[5]
Malinowska,U.: Piotr J. Durka, P.J., Zygierewicz, W., Szelenberger, J., Wakarow, A.: Explicit parameterization of sleep EEG transients, Computers in Biology and Medicine, Volume 37, Issue 4, April 2007, pp. 534-541,
[6]
Quiroga, R. Q.: Garcia, H.: Single-trial eventrelated potentials with wavelet denoising, Clinical Neurophysiology, Volume 114, Issue 2, February 2003, pp. 376-390, ISSN 1388-2457