ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ Fakulta elektrotechnická katedra kybernetiky
DIPLOMOVÁ PRÁCE
2013
Tomáš Holý
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ Fakulta elektrotechnická katedra kybernetiky
Multivariantní přístup ke zpracování EEG záznamů dětských pacientů s vývojovou dysfázií Diplomová práce
Studijní program : Biomedicínské inženýrství a informatika Studijní obor : Biomedicínské inženýrství Vedoucí práce: Ing. Petr Ježdík PhD. Praha 2013
Bc. Tomáš Holý
Poděkování : Děkuji vedoucímu mé práce Ing. Petru Ježdíkovi za odborné vedení ,Ing. Radku Jančovi za objasnění funkce DTF a v neposlední řadě pak Ing. Jiřímu Balachovi za cenné rady.
Abstrakt Tato práce se zabýva multivariantním přístupem ke zpracování signálů EEG naměřených na dětských pacientech s vývojovou dysfázií. Zvláštní důraz je pak kladen na analýzu pomocí algoritmu directed transfer function - DTF. Dále jsou prezentovány metody zpracování signálu vycházející z vlastností DTF, která je velmi účinná při detekci významných změn aktivity v záznamech EEG. Klíčová slova : Vývojová dysfázie, EEG, DTF, zpracování signálu
Abstract This thesis deals with a multivariate approach for processing EEG signals measured in pediatric patients with developmental dysphasia. Especial emphasis is on analysis algorithm directed transfer function - DTF. There are also presented methods of signal processing based on the properties of DTF, which is very effective in detecting significant changes in activity in EEG records. Keaywords : Developmental dysphasia, EEG, DTF,
Obsah 1. Úvod ....................................................................................................................................... 1 2. Vývojová dysfázie a EEG ....................................................................................................... 2 2.1. Vývojová dysfázie .......................................................................................................... 2 2.1.1. Dysfázie motorická .............................................................................................. 3 2.1.2. Dysfázie senzorická ............................................................................................. 4 2.1.3. Diagnostika vývojové dysfázie............................................................................. 4 2.2. Elektroencefalograf ........................................................................................................ 5 2.2.1. Skalpové EEG ….................................................................................................. 6 2.2.2. Metody zapojení skalpového EEG ....................................................................... 7 2.3. Metody zpracování signálu EEG .................................................................................... 8 2.3.1. Předzpracování signálu ….................................................................................... 8 2.3.2. Directed transfer function (DTF) ....................................................................... 10 2.3.3. Vhodné parametry pro statistiku ........................................................................ 12 3. Data a metodika zpracování …............................................................................................. 15 3.1. Infromace o pacientech ................................................................................................. 15 3.1.1. Vhodné parametry pro statistiku …..................................................................... 15 3.1.2. Problémy s měřením …....................................................................................... 16 3.1.3. Výsledky vyšetření u dalších odborníků ............................................................. 16 3.1.4. Zpracovávané signály …..................................................................................... 17 3.2. Metodika …................................................................................................................... 19 3.2.1. Použité metody zpracování …...…...................................................................... 19 3.2.2. Nalezení fází promluv …....…...…...................................................................... 19 3.2.3. Statistické metody …..........…...…...................................................................... 20 4. Implementace metod ….......…............................................................................................. 21 4.1. Nalezení fází promluv v signálu ................................................................................... 21 4.2. Anova a parametrizace …............................................................................................. 24 4.1. Detekce odlišností v psychologických skupinách ........................................................ 27 5. Výsledky …..............….......…............................................................................................. 29 5.1. Identifikace řečových projevů ….................................................................................. 29 5.2. Porovnání řečových aktivit …....................................................................................... 31 5.3. Statistika …................................................................................................................... 32
6. Diskuze výsledků .....….......…............................................................................................. 37 7. Závěr …..…..............….......…............................................................................................. 38. Seznam použité literatury ...…............................................................................................. 40 Seznam ilustrací ….............…............................................................................................. 41
1. Úvod V současné době stále více dětí trpí různými zdravotními komplikacemi a poruchami. Jednou z nich je i vývojová dysfázie. Jedná se o více či méně závažnou poruchu řeči způsobenou postižením centrální nervové soustavy, která pak provází jedince někdy i po celý život. Tato skutečnost negativně ovlivňuje jeho sebevědomí, sebehodnocení, citový vývoj a často má dopad i na vzdělání, profesní orientaci a osobní život. Existuje celá řada metod, jak tuto poruchu léčit nebo alespoň mírnit, přesto zásadní vliv má, jako u mnoha jiných onemocnění, včasná diagnostika. K té se dospěje na základě série vyšetření. Kromě důležitých vyšetření foniatrických a psychologických se k určení diagnózy používá i několik funkčně – zobrazovacích metod, jako je CT a elektroencefalograf. Každé z těchto vyšetření samozřejmě hraje svou roli a má určitou váhu při tvorbě vhodného léčebného plánu. Vyšetření na EEG se používá spíše jako metoda pro podporu diagnózy, samotná by neměla při diagnostice rozhodující váhu. Zaujala mě příležitost prozkoumat možnost využití EEG jako plnohodnotné metody pro diagnostiku poruch řeči, proto se této problematice věnuji v této diplomové práci. V úvodu práce je stručný souhrn týkající se poruch řeči s důrazem na vývojovou dysfázii. Kromě projevů a rozdělení nemoci je zde zmíněn i běžný postup při určování diagnózy, postup léčby dětských pacientů a v neposlední řadě pak i projevy nemoci na EEG. Následuje popis signálů z těchto vyšetření, které byly k dispozici a shrnutí známých informací o pacientech, kteří se projektu zúčastnili. Uvedeny jsou také základní metody použité k analýze těchto signálů a závěrečné statistice určené k vyhodnocení zjištěných informací. Cílem této práce je aplikovat directed transfer function (DTF) na tyto signály EEG, zhodnotit, zda by se tato funkce dala použít k detekci promluv a rozlišení jednotlivých skupin pacientů, v tomto případě dle psychologické třídy stupně postižení. Celou implementaci pak provést prostředí Matlab.
1
2. Vývojová dysfázie a EEG Vývojová dysfázie projevující se jako porucha postihující vývoj řeči je v podstatě postižení řečových center v mozku a má velmi různorodý charakter. Postižena může být kterákoliv složka verbálního aktu (senzorická, motorická nebo obě najednou) a na základě toho se pak u postižených dětí objevují charakteristické rysy této poruchy. Jednou z možných metod diagnostiky je i neurologické vyšetření na EEG.
2.1.
Vývojová dysfázie
Vývojová dysfázie je specificky narušený vývoj řeči, který má širokou symptomatologii. Je to velmi komplikovaná porucha, což potvrzuje to, že termín „vývojová dysfázie“ nemá jednotné obsahové vymezení. Termín i definice se vyvíjely a stále ještě nejsou přesné a autoři se zde odlišují. Dříve se dysfázie označovala jako alalie (vývojová nemluvnost). V současné době se nejčastěji rozumí, že jde o specificky narušený vývoj řeči projevující se sníženou schopností naučit se verbálně komunikovat, a to i v případě, že tito jedinci mají pro rozvoj řeči příznivé podmínky (dobré sociální prostředí, emocionální vazby, kvalita a četnost podnětů, smyslová připravenost, přiměřená neverbální inteligence). Příčiny vzniku vývojové dysfázie nejsou zatím jasné, oproti dřívějším dělením, které přisuzovali toto onemocnění např.nedostatku společenského prostředí nebo nevyzrálosti CNS, se dnes spíše uvažuje o postižení kognitivních funkcí vlivem pre-, peri- a postnatálního poškození mozku, které postihuje řečové zóny vyvíjejícího se mozku. Předpokládá se, že příčinou tohoto stavu je difúzní postižení CNS. S věkem se projevy mění, změny jsou však čistě individuální. Vzhledem k tomu, že se onemocnění vyskytuje výrazně častěji u chlapců, je možné, že určitý vliv má i dědičnost. [1] V současné době je dysfázie považována buď za jeden typ specifických poruch učení nebo z hlediska narušeného vývoje řeči jako specifická porucha řeči. Příznaky onemocnění mohou být : •
artikulace : dysfatické dítě má mnohem větší problém se spontánně vyjadřovat, než opakovat předříkávaná slova. Jeho schopnost vyslovit větší množství hlásek je narušena a jeho řeč je tak méně srozumitelná, popř. až nesrozumitelná.
•
fonematická diferenciace : děti mají problém rozlišovat odlišné rysy hlásek, zejména 2
pak rozlišování hlásek znělých a neznělých, závěrových a nezávěrových, dlouhých a krátkých •
sluchová analýza a syntéza : na rozdíl od zdravých dětí mají dysfatické děti potíže rozkládat slova na hlásky a z hlásek skládat slova. Často se může stát, že si zapamatují první slabiku slova a zbytek si domyslí. Tyto případy nasvědčují i problému s akustickou verbální pamětí, kterou mnozí autoři pokládají za příčinu vývojové dysfázie.
•
gramatická, sémantická a syntaktická oblast : řeč dysfatických dětí je agramatická, mají problém s použitím správných koncovek, s ohýbáním slov, použitím podmiňovacího způsobu a použitím správného rodu, s použitím přivlastňovacích a zvratných zájmen apod.
•
čtení a výklad textu : prakticky všechny děti s vývojovou dysfázií ignorují při čtení textu interpunkci, čtení je monotónní a neoddělují jednotlivé významové celky, delší slova hláskují [1] Kromě výše zmíněných je i řada méně významných znaků z ostatních oblastí, mezi které
patří i např. nerovnoměrný vývoj v jednotlivých složkách (motorické, kognitivní atp.), nepoměr mezi verbálními a neverbálními schopnostmi, větší sklony k levorukosti atd. Ačkoliv existuje více způsobů, jak by se tato porucha dala dělit, přistupuje se nyní, i v Mezinárodní klasifikaci nemocí, k vyčlenění dvou základních forem specificky narušeného vývoje řeči. 2.1.1.
Dysfázie motorická
Tento problém vzniká v oblasti produkce řeči, řečovém výkonu. Pacienti mají sníženou schopnost samostatného vyjadřování, často problémy s logomotorikou a potíže s prováděním přesných orofaciálních pohybů, což značně ovlivňuje jejich schopnost artikulovaně hovořit. Celkově je vývoj řeči opožděný, což se dá poznat už v počátečních pokusech o mluvené slovo. Děti s tímto druhem poruchy lépe rozumí, ale hůře se vyjadřují. Aktivní slovník je tak výrazně chudší než slovník pasivní. Pacienti mají tak problém s vybavováním si slov a tvorba slova je pro ně tak poměrně obtížná. Mohou se objevovat jevy jako dysnomie – nesprávné pojmenovávání věcí, problém s formováním myšlenek, syntaxi, morfologii a sémantice. Děti tak raději používají k vyjadřování neverbální prostředky komunikace (např.gesta). Vzhledem k
3
tomu, že si tito jedinci často svůj nedostatek uvědomují, s časem přestávají mít zájem o komunikaci. [1] 2.1.2.
Dysfázie senzorická
Zdrojem této poruchy jsou obtíže s fonematickým sluchem, poruchou krátkodobé paměti, poruchou sluchové paměti, obtíže s porozuměním slovům a chápáním jejich obsahu. Pacienti často hovoří plynule, tvoří slova pohotově, ale výsledný projev je značně deformovaný (často i prakticky nesrozumitelný). Prvními příznaky této poruchy jsou nápadně charakteristiké deformace slov (verbální dyspraxie). Naproti tomu počáteční vývoj řeči (první slova a věty) nemusí být vůbec opožděn. Slovník těchto dětí není nikterak chudý, ale často je velké množství slov deformovaných. Toto se může pohybovat od několika zkomolených slov až po prakticky celý nesrozumitelný slovník. Pacienti tak často sami nechápou obsah slov, která sami používají. Mají problémy s chápáním slovních pokynů (často je nutné je opakovat). Objevuje se jev tzv.echolálie – reprodukce frází bez porozumění významu. Pacienti také mají problémy s rozlišením hlásek ve slovech, v hlučných prostředích a se soustředěním se na řeč, kterou slyší. [1]
2.1.3.
Diagnostika vývojové dysfázie
Včasná diagnostika je stejně jako u všech poruch a onemocnění velmi důležitá. Dítě s narušeným vývojem řeči může být velmi negativně ovlivněno během formování osobnosti v sociálním kontextu (rodina, přátelé), v zájmech i v pozdější profesní orientaci. [2] Cílem diagnostiky narušených komunikačních schopností je : •
identifikace dítěte s narušeným vývojem řeči
•
tvorba vhodného intervenčního programu
•
sledování výsledků intervenčního programu a stanovení prognózy
Diagnostika poruchy je stanovena z řady vyšetření. Tato vyšetření jsou především foniatrické, psychologické, neurologické, logopedické a příp. i psychiatrické. Při foniatrickém vyšetření je hodnocena řeč dítěte ve všech jejích složkách (expresivní, senzorická forma řeči, artikulace, fonematický sluch, úroveň porozumění řeči, gramatická stránka řeči, slovní zásoba, celková srozumitelnost) a vyšetřen sluch (sluchová složka, 4
tympánometrie, objektivní audiometrie). Foniatr se dále podílí na vyšetření u všech ostatních odborníků, obvykle zastává vedoucí úlohu a koordinuje diagnostické postupy. [1] Psychologické vyšetření je pak zaměřeno na vývoj psychických schopností a funkcí dítěte a úroveň intelektových schopností. Do psychologických testů patří např. kresba lidské postavy, obkreslování, orientační test školní zralosti a neuropsychologické vyšetření (obor mezi neurologií a psychologií). Při neurologickém vyšetření se klade důraz na vyšetření na EEG a CT. Nálezy na CT bývají většinou negativní. Některé dysfatické děti však mají abnormální nebo dokonce patologický EEG záznam, jiné mohou mít naopak nález negativní. Při pozitivním nálezu jde pravděpodobně o dyfuzní postižení CNS. [1] Psychiatrické vyšetření se neprovádí ve všech případech. V některých případech u dětí s vývojovou dysfázií mohou vznikat vedlejší psychiatrické poruchy, jako např. pomočování, tiky, zvýšená citová dráždivost.
2.2.
Elektroencefalograf
Elektroencefalograf (EEG) je diagnostická metoda záznamu elektrické aktivity mozku. Jde v podstatě o záznam časové změny polarizace neuronů a jejich podpůrných buňek v CNS. Zdrojem aktivity EEG jsou především excitační a inhibiční postsynaptické potenciály (naměřitelná amplituda potenciálů se pohybuje řádově v desítkách μV). V roce 1924 psychiatr Hans Berger pojmenoval frekvenční pásmo, které bylo na EEG záznamu nejlépe vidět. Toto pásmo se dodnes označuje jako alfa a je dominantní během relaxace nebo při zavřených očích. Při kómatu je jeho aktivita označována jako patologická. V současné době rozdělujeme signál EEG na pět základních frekvenčních pásem. Tyto se označují písmeny řecké abecedy a jejich frekvenční pásma jsou vypsány v tabulce 2.1.
Pásmo (Hz) Podmínky
alfa 8 – 12
beta 18 – 30
gamma 30 – 50
delta 0,5 – 4
theta 5–7
kappa 8 – 12
relaxace,zav.Oči
motorický klid
bdění
ospalost
vzrušení, stres
řešení problému
Tab. 2.1 : Základní typy aktivit EEG EEG signál se dá změřit mnoha způsoby, všechny metody se však dají rozdělit do dvou 5
významných skupin – invazivní a neinvazivní. Ve valné většině případů se používá metod neinvazivních, tzv. skalpových. Tyto metody odhalují základní vzorce EEG nad měřenou oblastí mozku, přesné zaměření je však téměř nemožné. Pokud z nějakého důvodu (např. zaměření epileptogenních ložisek před operací) potřebujeme přesnou lokalizaci, používají se invazivní metody EEG (iEEG a EcoG). Při těchto metodách je signál získáván přímo z povrchu nebo zevnitř mozkové tkáně. 2.2.1.
Skalpové EEG
Při skalpovém EEG se snímá elektrická aktivita mozku z povrchu hlavy, jedná se tedy o neinazivní metodu. K tomuto snímání se používá vodivých elektrod propojených s hlavou za pomoci vodivého gelu, který umožňuje lepší přenos signálu (snižuje odpor prostředí). Každá elektroda zaznamenává celkovou elektrickou aktivitu neuronů v místě pod elektrodou. Vzhledem k tomu, že je měřen po průchodu několika prostředími (lebka, přechod mozek – lebka, kůže), je signál značně zeslaben a zarušen (svalové artefakty – pohyby očí a mimika atp.). Na druhou stranu se jedná o bezpečnou, levnou, snadno použitelnou metodu, která umožňuje monitorovat aktivitu mozku pacienta. Při některých procedurách pak může být výhodou i to, že je možno snímat i aktivitu spících pacientů. K záznamu skalpového EEG se využívá metoda označovaná jako 10 – 20 (viz. obr. 2.1). Toto pojmenování vychází ze způsobu rozložení elektrod na povrchu hlavy. Číslice 10 odpovídá úhlu ve stupních mezi první a druhou elektrodou. Všechny ostatní elektrody jsou pak na hlavě posunuty právě o 20 stupňů (druhá číslice). Každá elektroda je označena dvoumístným kódem (písmeno a číslo) označujícím jeho přesnou polohu na hlavě. Písmeno označuje část mozku, nad kterou se elektroda umístí (dle mozkového laloku – čelní lalok F, temenní lalok P, spánkový lalok T a týlní lalok O). Číslice pak označuje hemisféru a přesnou polohu nad daným lalokem. Pro levou hemisféru se používají čísla lichá a pro pravou sudá.
6
10%
20%
20%
20% Fp1
Cz
Fz
20%
Fp2
Cz C3
C3
F3
Pz
F7
P3
Fp1
10%
20%
20%
A1 T5
20%
F8
T3
C3
C4
Cz
T4
C4 Fz
F4
20%
20%
F3
T4
A2
O1
10% A1
F4
20%
F7 T3
Fz
F3
T3 F8
10%
Fp2
Fp1
F7
10%
20% T5
P3 O1
P4
Pz
O2
T6 A2
A1
20%
10%
Obr. 2.1 : Metoda 10 – 20, rozložení elektrod [3] 2.2.2.
Způsoby zapojení skalpového EEG
Kromě toho mohou být dva způsoby, jak přistupovat ke snímání elektrické aktivity u skalpového EEG – tzv. unipolární a bipolární zapojení. Tyto se liší především způsobem propojení elektrod. Unipolární metoda (referenční) zaznamenává elektrický potenciál mezi elektrodami měřícími a elektrodou referenční. Referenční elektrody jsou dvě (pro každou hemisféru jedna, A1 a A2) a jsou umístěny na uších. Přestože je možné nalézt na signálu získaném pomocí této metody všechny druhy grafoelementů, blízké elektrody mohou mít velmi podobnou naměřenou aktivitu. Tento jev je možno potlačit právě použitím bipolárního zapojení, které neměří potenciál mezi elektrodou měřící a referenční, ale mezi jednotlivými elektrodami. Častou chybou tohoto zapojení je pak jev, který se nazývá zvrat fáze. Na sousedních kanálech je pak viditelný velmi podobný signál opačné polarity. Používají se dva způsoby, jak aplikovat bipolární zapojení. Jedná se o zapojení transversální a longitudární (obr. 2.2). [3] Unipolární zapojení je možno přepočítat na bipolární, naopak bipolární na unipolární je složitější. V tomto případě je nutno zvolit si referenci. Většinou se pro tyto účely volí průměr všech kanálů.
7
Fp1
Fp2
Fp1
F7
F8 F3
T3
C3
Cz
T4
T3
F4
Fz
C3
P4
T5
Cz
C4
Pz
P3
T6
O1
O2
T4
P4
T5
T6
O1
F8 F3
C4
Pz
P3
F7
F4
Fz
Fp2
O2
Obr. 2.2 : Transversální a longitudární metoda [3]
2.3.
Metody zpracování signálu EEG
Existuje řada metod určených ke zracování signálů EEG, které jsou ověřené. Vždy se jedná o způsob hledání příznaků známé aktivity, grafoelementů atp. V tomto případě šlo o využití directed transfer function (DTF). Použití této funkce vyžaduje v rámci předzpracování signálu segmentaci signálu, a poté porovnává aktivitu v daném segmentu mezi všemi elektrodami. Ve výsledku nejsou pak důležité žádné příznaky, ale jakákoliv výraznějśí změna v signálu. Tyto změny totiž poukazují na zásadní proměny v chování nebo stavu pacienta (změna fáze vyšetření, záchvat atp.). K ověření a zhodnocení výsledků pak slouží statistika. 2.3.1.
Předzpracování signálu
Vzhledem k požadavkům funkce DTF a dalšího zpracování je potřeba vždy provést některé úpravy signálu před její aplikací. V této fázi se jedná především o filtraci a segmentaci signálu. Filtrace je způsob, jak z dat odstranit nepotřebné informace nebo rušivé vlivy. K tomu se používají číslicové filtry typu FIR nebo IIR. Základním parametrem každého filtru je jeho řád, který určuje strmost přechodu mezi zádržným a propustným pásmem, vliv na fázi signálu a v neposlední řadě i výpočetní náročnost filtru [3]. Podle frekvencí, které propustí, se filtry dělí na horní, dolní a pásmovou propust, popřípadě pásmovou zádrž (viz. obr. 2.3).
8
dolní propust
horní propust
pásmová propust
pásmová zádrž
Obr. 2.3 : Druhy filtrů Návrh filtru pak závisí na výběru jednoho z druhů a účelu, pro který je učen. FIR filtr (finite impulse response) je filtr s konečnou impulzní odezvou (s odkazem na vzorec 1, vztah neobsahuje žádné zpětnovazební koeficienty). Výstup tohoto filtru je definován jako konvoluční suma , n
y ( m)=b 0 x (m)+b 1 x (m−1)+...+bn x ( m−n)=∑ b i x (m−i)
(1)
i=0
Tyto filtry jsou vždy stabilní, jejich návrh je poměrně jednoduchý (intuitivní) a mohou mít lineární fázi, což je užitečné v případě, že potřebujeme dopočítat posun jednotlivých harmonických. Obvykle se při návrhu využívá filtrů vyššího řádu, aby se dosáhlo stejného utlumení jako u filtrů IIR (obr. 2.4). Jelikož vzorec k výpočtu filtrů IIR obsahuje i zpětnovazebné složky (viz. obr. 3.3, vzorec 2), mají tyto nekonečnou odezvu na vstupní signál. Umožňují také použít výrazně nižší řád filtru než u typu FIR. V případě, že je filtr stabilní, vstupní signál je utlumen natolik, že se na výstupu téměř neuplatní. Přestože je jeho fáze nelineární, při správné volbě typu použitého filtru (eliptic, butterworth...) se dá v daném pásmu vhodně nastavit.
y ( m)=
1 (b x ( m)+b1 x (m−1)+...+b p x(m− p)−a 2 y (m−2)−...−a q y (m−q)) a0 0 , nebo též: p
q
1 (∑ b x (m−i)−∑ a j y (m− j)) a 0 i=0 i j=1
9
(2)
Obr. 2.4 : Návrh filtrů Při zpracování signálů EEG se např. používají horní propusti s nižší zádržnou frekvencí (tj. < 2Hz) pro odstranění stejnosměrné složky a odstranění izolinie. Další typy filtrů se volí podle hledaných grafoelementů. Pokud je zkoumána aktivita v jednotlivých pásmech EEG aktivity, použije se pásmová propust s rozmezím daným rozsahem těchto aktivit [3]. Protože potřebujeme pozorovat změny nebo události v signálu, není vhodné zpracovávat celý signál najednou. Je tedy výhodné využít segmentovací (resp. okénkovou) metodu. K tomuto účelu se zvolí požadovaná délka okna a popřípadě i překryv (princip na obr. 2.5). Signál je tak rozdělen a jednotlivé segmenty slouží poté k výpočtu DTF (viz. kapitola 2.3.2) a následně i k výpočtu parametrů signálu. Překryvu se využívá k lepšímu prozkoumání všech částí signálu a velikost okna určuje rozlišení segmentace.
Překryv 2 1
6
4 3
5
7
Velikost okna
Obr. 2.5 : Princip segmentace [3] 2.3.2.
Directed transfer function (DTF)
Funkce DTF je založena na multidimenzionálních autoregresivních modelech popisujících směr a sílu toku elektrické aktivity mozku. Tato metoda se také osvědčila například 10
při hledání epileptických záchvatů v signálech EEG, konkrétně v práci Ing. Radka Janči , ze které jsem také vycházel. [4,10] Signál je nejprve segmentován. Následně je mezi časově odpovídajícími segmenty z různých kanálů vypočtena DTF, která vytvoří tzv. příznakový vektor každého segmentu. Ve výsledku je tak z m-kanálového signálu x vypočten multidimenzionální parametrický autoregresivní model (dále jen AR). N
∑ Ai x t−i=e i
(3)
i=0
kde Ai je matice koeficientů modelu, xt je pak vektor vytvořený z m-kanálů EEG signálu v čase t. N odpovídá řádu modelu a e t je vektor bílého nekorelovaného šumu. Řád AR modelu je počítán podle informačního Akaike kritéria pro každého pacienta individuálně. Vzhledem k tomu, že pozorovaným jevem byly promluvy pacienta, prováděla se segmentace oknem odpovídajícím čtyřem sekundám záznamu s překryvem 25%. Matice Ai je závislá časově a může tedy být odhadnuta pomocí multikanálové kovarianční analýzy. Použitím Fourierovy transformace se definuje matice přenosové funkce H ( f ) [4], N
H ( f )=( ∑ Ai e
(− j π f / f s) −1
)
(4)
i=0
kde f je frekvence a f s je vzorkovací frekvence. Na základě této rovnice poté DTF vyjadřuje přenos z kanálu j do kanálu i následujícím způsobem : 2
2 ij
P ( f )=
∣H ij ( f )∣ m
∑ ∣H ik ( f )∣2
(5)
k =1
2 kde H ij ( f ) je element matice H ( f ) v řádku i a sloupci j. P ij ( f ) je pak normalizovaná
DTF. Kromě toho je původní signál filtrovám do několika frekvenčních pásem (viz. kapitola 3.2.1). Pro každé pásmo je definován střední „tok“ 11
P ij ( pásmo)=mean( P ij ( f k )) z kanálu j do
kanálu i kde f k značí diskrétní frekvence v daném pásmu. „Tok“ aktivity DF j z kanálu j do všech ostatních kanálů je popsán následující rovnicí. [4] m
1 DF j = ∑ P ( pásmo) m−1 i=1 ij
(6)
Tato metoda tak na rozdíl od jiných algoritmů sleduje změny přes všechny kanály a dává tak komplexnější informaci o mozkové aktivitě. 2.3.3.
Vhodné parametry pro statistiku
Metody užívané ke zhodnocení výsledků práce a stanovení úspěšnosti. Z každého signálu je možné za pomoci statistických metod zjistit řadu parametrů, které je následně možno použít k porovnání nebo případné klasifikaci. Vzhledem k tomu, že signály byly nasegmentovány již použitím DTF, bylo nalezení základních parametrů poměrně snadné. Bězně používanými parametry jsou např. průměry (mean), směrodatné odchylky (std), rozptyl (var), skewness anebo kurtosis. Mean je standardní aritmetický průměr části signálu vypočtený dle vzorce 7. n
1 mean= ∑ xi n i=1
(7)
Var (variance, vz. 8) jako další metoda statistiky pro popis pravděpodobnostní distribuce popisuje, jak daleko leží čísla od průměrné hodnoty (mean). Někdy se také nazývá druhý centrální moment. Odmocnina variance je pak směrodatná odchylka (std, vz. 9). n
var =
1 ∑ ( x −mean)2 n−1 i=1 i
√
(8)
n
1 std = ( x i −mean)2 ∑ n−1 i=1
(9)
Třetí centrální moment se používá k výpočtu šikmosti, čtvrtý pak k výpočtu špičatosti. Obecně by se všechny předchozí vzorce daly shrnout tak, jak ukazuje vzorec 10. [3]
12
∞
K −tý obecný moment : μ ' k =∑ xik p i i=1
∞
K −tý centrální moment : μ k =∑ ( x i − μ )k p i i =1
(10)
K porovnání parametrů při následné analýze může sloužit řada funkcí. V této práci je kladen důraz na vzájemné porovnání částí signálu pomocí funkce one-way analysis of variance – anova1. V matlabu je tato funkce jako anova1.m ( one-way analysis), popřípadě jako anova2.m (two way analysis), nebo manova.m (m-way analysis), ale pro účely této práce postačila jednocestná varianta. Jde vlastně o metodu matematické analýzy, která umožní ověřit, zda mají statisticky významný vliv hodnoty některých znaků na hodnotu náhodné veličiny daného signálu. Metoda vedle sebe vykreslí box-grafy jednotlivých částí signálu tvořených hodnotou mean (střed), ¾ tečním kvantilem (nahoře) a ¼ kvantilem (dole) [7]. Pro představu viz. obr. 2.6.
Obr. 2.6 : One-way analysis of variance [7] Pro porovnání parametrů se pak využívá funkcí pro vykreslení histogramů a korelačních diagramů (scatter plot). Histogram je sloupcový graf sloužící ke grafickému znázornění distribuce dat. Skládá se ze sloupců stejné šířky, jejichž výška vyjadřuje četnost znázorněného elementu v signálu. Scatter plot funkce pak zobrazuje hodnoty dvou proměnných v kartézských souřadnicích. Ve výsledku jsou takto data zobrazeny jako množina bodů, přičemž jejich polohu na vodorovné ose stanovuje první a na svislé ose druhý parametr. Pomocí tohoto grafu se dá velmi snadno zjistit vzájemný vztah obou parametrů. 13
Při volbě vhodné distribuce je vhodné ověřit, zda není signál normálně rozdělen. K tomu slouží funkce jbtest.m. Jde o tzv. Jargueho-Berův test, který testuje zároveň šikmost i špičatost. Za předpokladu, že by testované statistiky
√ b1
b 2 byly normálně rozdělené, potom by
a
náhodná veličina
[
J=
√ a 1− μ ( √ a 1) σ ( √ a1 )
měla X 2 rozdělení o dvou stupních volnosti [5].
14
2
][
a − μ (a 2 ) + 2 σ (a 2 )
2
]
(11)
3. Data a metodika zpracování Snahou této práce bylo kromě detekce promluv také odhalit nějakou spojitost mezi parametry signálu a některými vlastnostmi pacientů, zejména pak psychologickým stupněm dysfázie. Z výsledků vyšetření u ostatních specialistů (foniatr, psycholog) byly známy veškeré nutné detaily o pacientech, jako např. právě úroveň postižení, levorukost / pravorukost, věk a pohlaví. Cílem tedy bylo nalézt spojitost mezi těmito daty a naměřenými signály. K tvorbě programu bylo použito vývojové prostředí matlab. Pro úpravu signálů byla nejprve použita funkce directed transfer function (DTF). Následně byly v takto získaných signálech zjištěny a ověřeny jednotlivé fáze vyšetření. Během pokusu o rozdělení bylo zjištěno, že nejlépe lze pozorovat fáze promluv ve vysokofrekvenčních pásmech, především pak v pásmu beta. Se znalostí, které vzorky přísluší jednotlivým fázím a frekvencím, kde je řeč nejlépe pozorovatelná, byly vytvořeny matice obsahující pouze data fáze promluv a "obrázků" v pásmu gama. Na takto získaná data byly následně aplikovány některé statistické metody při snaze zjistit, zda by bylo možné najít spojitost mezi signály a údaji zjištěnými při ostatních vyšetřeních.
3.1.
Informace o pacientech
Měření pacientů nízkého věku (6 – 12 let), kteří navíc trpí vývojovou dysfázií, je o mnoho složitější, než stejné měření u zdravých pacientů a nebo pacientů starších a dospělých. V této kapitole bude popsán průběh měření na pacientech účastnících se tohoto projektu. 3.1.1.
Vyšetření pacientů
Vyšetřeno bylo celkem 39 pacientů ve věku 6 – 12 let, ze kterých bylo posléze 5 pacientů vyřazeno z různých důvodů. Délka měření se pohybovala mezi
30 – 50 minutami, které byly
rozděleny do několika fází. Z celých měření byly pořízeny videozáznamy. Každý pacient nejprve prošel klidovou částí, kdy měl přibližně 8 minut zůstat v co největším klidu a reagovat pouze na základní podněty (otevřít a zavřít oči atp.). V této části vyšetření je v místnosti přítomna pouze lékařka, pacient a rodič. Druhou fázi provádí psycholog, který pacientovi pokládá sérii jednoduchých otázek, popř. ho nechává opakovat jednoduché věty 15
nebo slova. K dalšímu testu použije psycholog sadu obrázků k testování krátkodobé paměti a porozumění významu jednotlivých obrázků. Druhá a třetí fáze byly klíčové pro tuto práci. U většiny pacientů pak následovala krátká fáze hyperventilace, která je podmíněna zdravotními pojišťovnami. V závěrečné části pak byl pacient opět v klidovém režimu. Fáze klidu by velice dobře mohly být využity jako reference k řečovým fázím za předpokladu, že by pacienti při vyšetření dobře spolupracovali (viz kapitola 2.3.2). 3.1.2.
Problémy s měřením
Zásadním problémem, který se výrazně promítl do naměřeného signálu, byla špatná spolupráce ze strany mnoha pacientů. Převážně v klidových fázích se, zejména mladší pacienti, nedokázali řídit pokyny lékaře. Někteří pacienti pouze nevydrží sedět potřebnou dobu v klidu, jiní jsou výrazně rozrušeni a vyšetření je pro ně stresující. Vzhledem k množství pohybů je tak v signálu velké množství svalových artefaktů (viz obr. 2.3). Ve fázi promluv jsou sice pacienti poněkud klidnější, přesto i tam mají někteří značné problémy se soustředěním, což by ale také mohlo souviset s jejich diagnózou. Kromě běžných svalových artefaktů, v této fázi způsobených pohyby mimických svalů, jsou v této části patrné odchylky způsobené např. častými nežádoucími pohyby (viz obr. 2.4). Kromě výše zmíněných také došlo v některých případech k pokusu o seřízení některých kanálů sestrou, čímž se následně část kanálů stala pro zpracování nepoužitelnou a celý kanál pak musel být z výpočtů (DTF) vyloučen. Vzhledem k tomu, že reakce na měření u dětských pacientů, navíc trpících dysfatickou poruchou, byla případ od případu značně odlišná, bylo následné nalezení podobných znaků v signálu po zpracování značně problematické. 3.1.3.
Výsledky vyšetření u dalších odborníků
Jak již bylo napsáno výše, vyšetření na EEG bylo jen jedním z mnoha, a tak bylo k dispozici poměrně velké množství informací o pacientech (tab. 3.1). Samozřejmě, že v souladu se Zákonem o ochraně osobních údajů, nebyla známa žádná nacionále s výjimkou data narození. Každý pacient měl pouze kódové označení, které mu bylo přiřazeno během vyšetření. Ze známých informací uvedených v tabulce je tedy nejzajímavější údaj „úroveň
16
dysfázie“. Jde o stanovenou úroveň postižení. Pacienti úrovně 1 mají nejlehčí formu, tento jev se dal poměrně spolehlivě pozorovat i na kvalitě naměřených signálů. Pacienti byli většínou klidnější a lépe reagovali na požadavky lékařů. Ve sloupci rukost je údaj o tom, kterou ruku pacient preferuje. Přestože jsou v tabulce stupně od jedné do pěti, rozdíl je pouze v tom, zda je číslice sudá, nebo lichá. Liché číslice představují leváky a sudé praváky. Tato vlastnost se nejevila vhodná pro závěrečnou statistiku, protože drtivá většina dětí byla leváků. Podle věku posledního vyšetření byli také pacienti rozděleni do dvou skupin. Skupina 1 byla pro mladší 110 měsíců, skupina 2 pro starší. 3.1.4.
Zpracovávané signály
Získané signály byly standardním výstupem 19ti svodového skalpového EEG. Šlo tedy o matici s devatenácti kanály s 200 naměřenými záznamy na sekundu záznamu ve formátu gdf. Ke každému takovému signálu byl k dispozici i videozáznam celého měření. Signály byly navíc již převážně olabelované, což práci s nimi značně zjednodušilo. V původním signálu se u většiny pacientů dala samotná fáze promluv odlišit jen stěží. Naopak byly dobře patrné všechny artefakty a špatně naměřené kanály, což bylo velmi užitečné při volbě kanálů vhodných k vyřazení před provedením DTF. Jak již bylo zmíněno v kapitole 2.3.2, všechny signály byly značně zarušené z důvodu neklidu pacientů. Pro práci se signály v prostředí Matloab byly použity funkce obsažené v tzv. BioSig toolboxu.
17
Pacient Datum vyšetřeníDatum narozeni Věk(měsíce) Věk 1574 22.9.2010 9.7.2003 88 1662 9.2.2011 14.8.2001 116 1807 7.3.2012 2.4.2002 121 1762 26.10.2011 5.10.2004 86 1811 21.3.2012 10.6.2003 107 1787 11.1.2012 4.7.2003 104 1768 16.11.2011 27.12.2002 108 1702 20.4.2011 5.4.2005 74 1827 16.5.2012 17.12.2001 127 1817 28.3.2012 19.5.2000 144 1790 18.1.2012 20.2.2000 145 1586 10.6.2010 23.6.2004 73 1657 2.2.2011 26.3.2003 96 1698 13.4.2011 18.2.2005 75 1608 10.11.2010 3.6.2002 103 1652 26.1.2011 17.4.2001 119 1645 19.1.2011 2.12.2003 87 1669 23.2.2011 13.8.2003 92 1639 12.1.2011 9.1.2004 85 1628 8.2.2011 3.11.2004 76 1722 25.5.2011 16.2.2002 113 1836 27.6.2012 8.12.2002 116 1732 15.6.2011 3.6.2001 122 1833 13.6.2012 29.8.2003 107 1819 11.4.2012 16.7.2004 94 1705 27.4.2011 26.3.2005 74 1756 12.10.2011 31.1.2003 106 1624 8.12.2010 1.6.2002 104 1665 16.2.2011 2.6.2001 118 1604 3.11.2010 16.2.2000 130 1679 16.3.2011 4.4.2000 133 1797 15.2.2012 19.3.2004 96 1757 19.10.2011 15.3.2003 105 1822 25.4.2012 26.1.2006 76 xx 14.4.2013 4.12.2003 114 xx 7.4.2013 9.5.2002 133 xx 8.2.2013 11.8.2004 103 xx 23.1.2013 1.12.2003 111 xx 12.10.2012 5.6.2002 126
1 2 2 1 1 1 2 1 2 2 2 1 1 1 1 2 1 1 1 1 2 2 2 1 1 1 1 1 2 2 2 1 1 1 2 2 1 2 2
Pohlavi St.dysfasie Rukost Verb.flluen 0 1 2 0 0 1 1 71 1 1 1 0 1 2 1 1 3 97 0 1 3 112 0 1 1 93 0 1 1 -1 0 1 3 1 1 1 76 0 1 1 0 2 1 0 2 1 68 1 2 1 1 2 1 71 1 2 1 102 1 2 1 60 0 2 3 2 1 2 1 79 0 2 3 1 2 2 71 0 2 1 79 0 2 3 97 1 2 1 58 0 2 1 0 2 3 1 2 1 64 0 3 5 0 3 4 71 0 3 1 1 0 3 2 55 0 3 2 0 3 1 0 3 5 0 0 0 0 1 0 1 0 1 0
Tab. 3.1 : Seznam pacientů
18
3.2.
Metodika
Práce na tomto úkolu by se dala shrnout do čtyř částí. Nejprve bylo třeba signály předzpracovat a aplikovat na ně funkci DT. V těchto upravených signálech následně nalézt ty části, o které šlo především. To jest ty zaznamenané během fází promluv. Následně bylo nutné provést parametrizaci nově získaných signálů a porovnání některých parametrů. V závěrečné části jde vlastně o diskuzi výsledků a zhodnocení, zda by se pomocí této metody daly zjistit některé informace o pacientovi. Nejen tedy odlišit jednotlivé části měření, ale především rozlišit jednotlivé psychologické třídy dysfázie. 3.2.1.
Použité metody předzpracování
Původní signál byl segmentován 4 sekundovým oknem s 25% překryvem a následně rozdělen do pěti frekvenčních subpásem představujících základní druhy aktivit EEG. V tomto případě je dostačující rozdělit a porovnat pásma delta, theta, alfa, beta a gamma. K filtraci byl použit FIR filtr 3. řádu. Použitá pásma i rozsahy jsou vypsány v tabulce 3.1.
Pásmo
delta
theta
alfa
beta
gamma
Rozsah (Hz)
2–4
4–8
8 – 12
12 – 25
25 – 70
Tab. 3.2 : Použité aktivity EEG Následně byla na signál aplikován DTF, která zaznamenala aktivitu mezi jednotlivými segmenty všech elektrod. Nově získané signály bylo třeba dobře porovnat a nalézt v nich fáze relevantní pro ověření hypotéz. Šlo samozřejmě o části, kde pacienti promlouvali, a v této fázi i o části klidové, které byly vhodné jako reference. Vzhledem k tomu, že DTF zvýrazní všechny významné změny během měření EEG, dá se vždy využít k porovnání některých statistických metod.
19
3.2.2.
Nalezení fázi promluv
Pro nalezení fází promluv je třeba porovnat signály všech elektrod u každého pacienta. V první řadě by mělo být stanovení frekvenčńího pásma, ve kterém se změna přechodu z fáze klidu do fáze promluv v DTF nejlépe projeví. Na základě znalosti pásma je pak možno porovnat DTF signály jednotlivých svodů u všech pacientů s cílem stanovit ty, které se v řećových fázích nejvíce projeví. Pro ověření je samozřejmě výhodné použít i možnosti porovnání s videozáznamy vyšetření. Pro jednoznačné porovnání je dobré použít například funkci multvariate, která vychazí z výsledků funkce anova1. Na základě výstupu analýzy by pak mělo být možno přesně stanovit fáze promluv a fáze „obrázků“. 3.2.3.
Statistické metody
Jako před každou statistikou je i zde nutno nejprve zvolit a vypočítat správné parametry nutné pro porovnání částí promluv. K tomuto účelu je nejprve nutné upravit signály tak, že se z nich odstraní všechny přebytečné části (viz. 3.2.2). Jediné, co zůstane, jsou stejně dlouhé úseky signálů z fází promluv. Vzhledem k tomu, že signál po DTF je již správně upraven, je možné vyjádřit parametry přímo z něj například volbou některých momentů. Alternativou je pak proložit signály vhodnou distribucí. Nejdříve je vhodné otestovat normalitu signálů např. pomocí funkce jbtest a na základě výsledků pak zvolit vhodný postup. Známé parametry fazí promluv se pak porovnají pomocí statistických metod a na základě pozorování se zhodnotí možná použitelnost této metody jako podpory při diagnóze vývojové dysfázie.
20
4. Implementace metod Úkolem práce tedy bylo rozhodnout, zda by se DTF hodila jako jeden z prostředků pro úpravu signálů EEG a zhodnotit, zda by se pomocí této metody nedaly zjistit některé informace o pacientech, které jinak zjišťuje pouze foniatr nebo psycholog. Na základě informací, které byly známy z ostatních vyšetření, jsem měl k dispozici některé z vlastností pacientů, jako byl jejich věk, levorukost/pravorukost, psychologickou třídu (stupeň dysfázie) atp. (viz. tab. 3.1). Vzhledem k tomu, že většina pacientů trpících vývojovou dysfázíí je levoruká, pohlaví a ani věk dítěte očividně také nehrály větší roli, rozhodl jsem se, že se pokusím diskutovat možnost rozlišení jednotlivých psychologických tříd dysfázie z EEG signálu. Nejprve však bylo nutno zjistit, zda bude možno pomocí DTF vůbec odlišit samotné fáze promluv. K dispozici byly také videozáznamy vyšetření, z nichž se dalo vypozorovat, kdy a která fáze vyšetření nastala. Následně bylo nutné nalézt tyto fáze i v signálech, zvolit vhodná frekvenční pásma a poté přistoupit k parametrizaci signálu. V závěrečné fázi pak již s upravenými signály obsahujícími pouze data naměřená během promluv bylo třeba porovnat nalezené parametry a zhodnotit, zda by se tato metoda dala použít k rozlišení jednotlivých skupin pacientů. Celá implementace metod probíhala v prostředí Matlab. .
4.1.
Nalezení fází promluv v signálu
Jak se ukázalo, DTF je skutečně velmi silnou metodou k odlišení výrazných změn v mozkové aktivitě. Nejprve jsem segmentoval signál po úsecích představujících 4 sekundy záznamu s 25% překryvem a poté ještě vyfiltroval v signálu 5 frekvenčních pásem popsaných v tab. 3.2 . Po aplikaci DTF jsem tak získal sadu 19ti kanálových signálů, kde každý segment představoval „tok“ mezi zkoumanou elektrodou a všemi ostatními. Nejprve bylo třeba stanovit, které frekvenční pásmo a který kanál (svod) bude pro následnou analýzu nejvýhodnější. Jak je patrné i na obrázku 4.2, ukázalo se, že promluvy se nejlépe projeví při vyšších frekvencích, konkrétně pak v pásmu gamma.
21
Obr. 4.1 : Aktivita v jednotlivých frekvenčních pásmech Zatímco výběr vhodného pásma se neukázal být zvlášť složitý, výběr vhodného svodu byl celkem problematický. Mezi pacienty totiž byly v tomto ohledu značné rozdíly. Zatímco u některých se podobná změna aktivity dala pozorovat téměř na všech elektrodách, u jiných se dala pozorovat s problémy i pouze na jedné. Nakonec se ukázalo, že největší shoda mezi pacienty je na třináctém a šestnáctém svodu. Tyto odpovídaly elektrodám T3 a T6, tedy těmi umístěnými nad řečovým a sluchovým centrem mozku (Brocovo a Wernickeovo centrum). Zajímavé bylo, že někteří pacienti měli lépe patrnou aktivitu spíše na pravé straně hlavy, přesto, vzhledem k většině, jsem se rozhodl použít pro analýzu tyto dvě. Na obrázku 4.3 je patrný rozdíl mezi jednotlivými svody u pacienta P0001574. Tento byl dysfatik 1. stupně, pravák a z věkové skupiny 1.
22
Obr. 4.2: Rozdíl v aktivitě na některých svodech pacienta 1574 Výrazné peaky v aktivitě odpovídají většinou fázím s výrazným pohybovým artefaktem, pro mou práci byly naprosto zbytečné. Důležitá je výrazná změna aktivity v oblasti, která se přesně shoduje s promluvami pacienta. Pacient P0001574 (obr. 4.3) měl sice změnu pozorovatelnou téměř na všech kanálech, i tak je ale patrné, že svody třináct a šestnáct jsou přece jen názornější. Součástí aktivity označené na snímcích modře jsou pak fáze klidu na počátku a na konci. Výrazná aktivita těsně po promluvách pak byla naměřena během hyperventilace. Klidové části jsem použil jako reference. Velká aktivita během těchto fází by mohla být způsobena například neklidem dětí, nepozorností atp. Pro ověření jsem využil také zaznamenaných eventů od mého předchůdce. Zde byly veškeré promluvy zaznamenány pod ID typu 102. Načetl jsem tak časové údaje a porovnal je s těmi, která jsem zjistil sám. Se zjištěním, že této metody lze využít pro detekci řeči ze signálu EEG, jsem vytvořil dvě matice obsahující pouze části všech signálů z fáze promluv resp. "obrázků" a přistoupil jsem k provedení statistiky.
23
4.2.
Anova a parametrizace
Aby signály mohly být klasifikovány a vypovědět něco o pacientech, bylo nutné nejdříve zjistit některé významné parametry a vhodně je porovnat. Na základě takového pozorování bych pak následně mohl rozhodnout o tom, zda je možno navrhnout vhodný klasifikátor. Nejprve jsem se použitím Jbtestu rozhodl otestovat normálnost pozorovaných signálů. Vzhledem k tomu, že jsem ve výsledku zjistil, že až na pár výjimek téměř všechny signály normální distribuci nemají, rozhodl jsem se, že signál proložím distribucí extreme value, která by se dala vyjádřit vzorcem 12.
y = f ( x∣μ , σ )=σ −1 exp
( x−σ μ )exp(−exp( x−σ μ ))
(12)
kde μ je parametr vyjadřující umístění a σ měřítko distribuce extreme value. Tato funkce je často používána k modelování nejnižší nebo nejvyšší hodnoty ze signálů tvořených zdánlivě nesouvisejícími hodnotami (viz. obr. 4.4) [6]. Ze zkušenosti vím, že touto funkcí je možno proložit téměř jakýkoliv signál. Pro získání parametrů jsem použil funkcí evfit.m a evstat.m.
Obr. 4.3. Proložení distribucí extreme value [6] V této části jsem měl již k dispozici řadu parametrů signálů promluv a mohl jsem tak
24
vybrat nejvýhodnější pro následné porovnání. Rozhodl jsem se pro porovnání signálů pomocí funkce anova1.m, a poté i pro porovnání parametrů mean, variance, skewness a kurtosis v histogramech a korelačních diagramech. Základní porovnání pomocí fce anova1 přineslo řadu zjištění. Nejprve jsem použil tuto statistickou metodu k ověření, zda je metoda skutečně použitelná pro detekci řeči. V celém signálu jsem zaznačil fáze klidu a fáze promluv. Vypustil jsem fázi hyperventilace, protože ta byla v tomto případě irelevantní. Výsledky na 13. kanále 2 pacientů jsou patrné na obr. 4.5 a 4.6.
Obr. 4.4 : Výsledky multcompare, Pacient 1702, 1 – klid, 2, 3 – promluvy, 4 – klid 2
Obr. 4.5 : Výsledky multcompare, Pacient 1679, 1 – klid, 2, 3 – promluvy, 4 – klid 2 25
Multcompare je metoda vycházející přímo z výsledku funkce anova1. Výsledky zobrazí vertikálně, kdy střed každého pásma je aritmetickým průměrem (mean) sledované části signálu. Rozsah této části je pak ohraničen vlevo čtvrtinovým a vpravo tří-čtvrtečním kvantilem. Pokud se dvě fáze vůbec nepřekrývají, znamená to, že se dají snadno odlišit. Jak patrno, první pacient (obr. 4.5) má skvěle odlišitelnou jak část promluv, tak část, kde reaguje na předkládané obrázky. Druhý pacient (obr. 4.6) má pak dobře odlišitelnou pouze fázi promluv. Obrázková část se zcela překrývá s fázemi klidu. I to by mohlo být způsobeno tím, že pacient P0001679 trpí těžší formou vrozené dysfázie. Při porovnání všech signálů však funkce anova mnoho informací neposkytla. Každá skupina dysfatiků dle psychologických tříd obsahovala jedince, kteří ze skupiny „vyčnívali“. I při zanedbání těchto pacientů však mezi zbylými signály nebyly dostatečné odlišnosti (viz. obr. 4.6).
Obr. 4.6 : Porovnání fází promluv jednotlivých pacientů Navzdory tomu, že výsledky nejsou na první pohled zřejmé, dali by se poměrně dobře odlišit pacienti z psychologické třídy jedna a tři. Skupina dva má v některých případech blíže ke 26
skupině jedna a naopak. Vzhledem k tomu, že anova nepřinesla jednoznačné výsledky, zaměřil jsem se spíše na porovnání dalších parametrů.
4.3.
Detekce odlišností v psychologických skupinách
Po stanovení základních parametrů jsem se rozhodl pro základní porovnání použít histogram. V tomto případě mi však nešlo o rozložení hodnot v úsecích signálů, jako o zařazení pacientů dle hodnoty parametru vzhledem k ostatním při snaze najít shodné znaky pro případnou klasifikaci. Při této analýze tak již měla větší důležitost psychologická třída stupně dysfázie každého pacienta než to, o kterého pacienta přesně jde. Pro tyto operace jsem upravil matice parametrů tak, aby v prvním sloupci byly porovnávané hodnoty a v druhém pak stupně dysfázie daných pacientů. Jednoduché vykreslení histogramu však nestačilo (obr. 4.7 vpravo), a tak jsem pro větší názornost seřadil parametry vzestupně za pomoci funkce sortrows.m (obr. 4.7 vlevo). Pro vyvození závěrů bylo samozřejmě třeba vykreslit větší množství grafů na základě různých
parametrů.
Slušných
výsledků
bylo
dosaženo
například
na
histogramech
porovnávajících std, mean, var, skewness a kurotsis. Nepříliš užitečná pak byla energie signálu, median atd.
Obr. 4.7 : Příklady výsledných histogramů 27
Při pozorování histogramů už bylo možno vyvodit určité závěry. Šlo samozřejmě o vztah pouze jednoho parametru k daným třídám, i tak však tato metoda poskytla několik poznatků. Mnohem lepších výsledků bylo pak dosaženo při použití scatter grafu. V tomto případě šlo o přímé porovnání dvou parametrů. Rozhodl jsem se porovnat parametry mean a var na ose x s parametry skewness a kurtosis na ose y. Příklad grafu je na obr. 4.8.
Obr. 4.8 : Příklad scatter grafu, třída 1 = zelená, třída 2 = modrá, třída 3 = červená
28
5. Výsledky Cílem práce bylo pokusit se aplikovat DTF (directed transfer function) na signály skalpového EEG naměřené na dětských pacientech trpících vývojovou dysfázií a zjistit, zda by se metoda, která je momentálně na ČVUT – Fakultě Elektrotechnické používána k detekci epileptických záchvatů, dala použít i k řešení této problematiky. Teoreticky by to možné být mělo vzhledem k tomu, že tato funkce poskytuje komplexní pohled na mozkovou aktivitu tím, že sleduje veškerý „tok“ mezi sledovanou elektrodou a všemi ostatními. Za předpokladu, že by se pomocí této funkce dalo jasně odlišit, kdy pacient hovoří, bylo mým úkolem zjistit, zda by se touto metodou dalo také zjistit více informací o pacientovi – jako např. míra poruchy řeči. K dispozici bylo 39 záznamů skalpového EEG pocházejících od pacientů neurologického oddělení Fakultní nemocnice v Motole. Šlo o signály ze standardního devatenácti svodového EEG bez referenčních elektrod, označených podle kódu vyšetření každého pacienta. Součástí takového záznamu jsou tak data ze všech devatenácti kanálů při vzorkovací frekvenci 200Hz. Pět dětí bylo následně z projektu vyřazeno z různých důvodů a vzhledem k chybně naměřeným signálům u dvou dalších pacientů jsem následně rozšířil tuto skupinu o další dva. Signály byly silně zarušeny. Vzhledem k neklidu a neposlušnosti řady pacientů obsahovaly velké množství artefaktů. Často se stávalo, že bylo nutno opravit umístění elektrod za běhu.
5.1.
Identifikace řečových projevů
Během předzpracování prošly signály segmentací, kdy byly rozděleny čtyř-sekundovým oknem s 25% překryvem. Na takto upravené signály jsem následně aplikoval DTF, které znázornilo aktivitu mezi všemi segmenty. Výsledný signál byl tak o mnoho kratší a znázorňoval čistě vzájemnou aktivitu. Následně byly za pomoci FIR filtru třetího stupně rozděleny do 5ti frekvenčních pásem. Na základě řady pozorování se dalo určit, že nižší frekvene jsou pro účely této práce zcela zbytečné. V pásmech theta, delta a alfa jsem nezjistil prakticky žádné odchylky. V relaci k těmto třem pak lepší výsledky byly pozorovatelné v pásmu beta (obr. 5.1, vlevo). Nejlepší výsledky pak ale byly pozorovatelné až v pásmu gamma (obr. 5.1, vpravo).
29
Obr. 5. 1 : Rozdíl mezi pásmem beta a gamma Toto zjištění by se dalo generalizovat. Žádný z třiceti dvou pacientů neměl nález v pásmech s nižšími frekvencemi, zatímco všichni alespoň na některých kanálech v pásmu gamma nález měli. Z toho důvodu jsem se rozhodl zbylá čtyři frekvenční pásma z další analýzy vyřadit a pracovat pouze s frekvencemi vyššími. Zbylá aktivita v signálu náleží dalším fázím měření, kterými musel pacient projít. Počáteční klid, otázky a odpovědi, identifikace obrázků, hyperventilace a závěrečný klid. Dalším krokem pak byl výběr vhodných elektrod. Opět na základě zdlouhavých pozorování jsem došel k tomu, že nejvýhodnější je použít pro analýzu elektrody třináct a šestnáct, které se nacházejí nad řečovým a sluchovým centrem (tzv. Brocovo a Wernickeovo centrum). Zajímavé bylo, že zejména někteří pacienti trpící těžší formou poruchy měli během promluv aktivitu zjistitelnou téměř na všech elektrodách. Při znalosti svodů, na kterých je nejlépe zaznamenána aktivita vyvolaná řečí a pásma, ve kterém je nejlépe pozorovatelná, jsem mohl signály upravit dle potřeby. Odstranil jsem fázi hyperventilace, která byla zcela nepotřebná a ponechal v signálu kromě řečových částí pouze 2 klidové fáze jako referenci. Na takto upravené signály jsem pro ověření hypotézy o použitelných elektrodách a pásmu použil funkci anova1.m a následně i multvariate.m. Jedná se o multivariantní analýzy, které jsou součástí statistic toolboxu. S použitím těchto metod se podařilo odlišit aktivitu v jednotlivých kanálech.
30
5.2.
Porovnání řečových aktivit
Jelikož možnost detekovat řeč v signálu EEG za pomoci DTF jsem považoval za ověřenou, zbývalo ověřit, zda by s pomocí této funkce nemohly být detekovány také některé významné vlastnosti pacientů. Jak jsem již zmiňoval výše, rozhodl jsem se diskutovat možnost ověření / zjištění psychologického stupně dysfázie. Pro základní porovnání jsem opět použil funkci anova1. Výsledné grafy poukazovaly na to, že by se pravděpodobně dala odlišit skupina stupně jedna a tři. Zatímco však v těchto dvou skupinách byly signály, až na několik výjimek, podobné, signály nejpočetnější, druhé skupiny, se zařadily jen ztěží. Jednotlivé signály se hodnotou mean i rozptylem blížily vždy jedné ze dvou zbylých skupin (viz. obr. 5.2 a 5.3).
Obr. 5.2 : Analysis of variance, fáze promluv Zde je patrné, že signály 3 a 6 jsou výrazně odlišné. Při bližším přezkoumání jsem zjistil, že šlo o velmi nespolupracující pacienty a proto jsem se rozhodl je pro další analýzy nepoužít. Každopádně i zde je patrné, že pacienti skupiny jedna mají v dané oblasti mozku vyšší aktivitu, než pacienti skupiny 3. 31
Obr. 5.3 : Analysis of variance, fáze "obrázků"
5.3.
Statistika
Z upravených dat jsem si spočetl řadu parametrů, z nichž jsem pro závěrečnou statistiku použil především parametry vypsané v kapitole 4.3. Jak již jsem psal výše, v této fázi jsem porovnával signály dle známých psychologických tříd. Nejprve jsem zkusil vykreslit data do histogramů seřazených podle výše pozorovaného parametru (obr. 5.4 a 5.5).
32
Obr. 5.4 : Porovnání parametru mean a var v závislosti na psychologické třídě pacientů
Obr. 5.5 : Porovnání parametru kurtosis a skewness vzhledem k třídě pacientů 33
I z těchto snímků je na první pohled patrné, že rozlišení jednotlivých skupin bude problematické. Přesto například u parametru kurtosis v třináctém svodu se většina členů první psychologické třídy drží vlevo, a to dokonce i v záporných hodnotách. Skupina 3 je pak spíše v pravé části grafu. Parametr var pak umožnuje odlišit skupinu druhou od třetí atp. Přesto by se pomocí této metody jen velmi těžko hledaly parametry pro případnou klasifikaci. Lepších výsledků jsem dosáhl až při vzájemném porovnání parametrů jednotlivých signálů za pomoci funkce scatter plot. V první části jsem se rozhodl postavit proti sobě parametry mean a skewness nebo kurtosis (obr . 5.6 ) u signálů z fáze promluv.
Obr. 5.6 : Porovnání parametrů mean a skewness/kurtosis ve fázi promluv Na obr. 5.6 představuje zelená barva skupinu pacientu psychologické třídy dysfázie 1, modrá skupinu 2 a červená skupinu 3. Je patrné, že jsou jednotlivé záznamy poměrně snadno rozlišitelné, i když se v některých případech shlukují. Podobných výsledků pak bylo dosaženo i ve fázi "obrázků" (obr. 5.7). Stejným způsobem jsem pak postupoval i při porovnání parametru var s skewness, resp. kurtosis (obr. 5.8, 5.9).
34
Obr. 5.7 : Porovnání parametrů mean a skewness/kurtosis ve fázi "obrázků"
Obr. 5.8 : Porovnání parametrů var a skewness/kurtosis ve fázi promluv 35
Obr. 5.9 : Porovnání parametrů var a skewness/kurtosis ve fázi "obrázků" Jak je zřejmé, na všech grafech jsou jednotlivé skupiny odlišitelné. Nevýhodou je, že se i tak shlukují poměrně blízko k sobě. Na základě těchto grafů jsem již mohl vyhodnotit, že rozlišení jednotlivých skupin pacientů by bylo do určité míry při vhodně nastaveném klasifikátoru možné.
36
6. Diskuze výsledků Na počátku práce byl soubor dat od 39 pacientů trpících vývojovou dysfázií, kteří podstoupili sérii vyšetření. Signály byly různé kvality. Pět pacientů bylo posléze z programu vyřazeno z různých důvodů. Během zpracovávání signálů jsem narazil na to, že dva signály nebyly úplné, chybělo jim více než 10 minut záznamu, a proto jsem je z následné analýzy vyřadil. Přestože byly některé signály silně zarušené, metoda DTF se ukázala být velmi silnou, pokud jde o odlišení významných změn v mozkové aktivitě. Při volbě vhodných kanálů (svodů) a v pásmu gamma byla zřetelná významná změna aktivity v momentě, kdy pacient začal odpovídat na otázky. Přesto, že většina signálů obsahovala velké množství artefaktů, většinu z nich nebylo nutné odstraňovat, protože patrnost změny aktivity po aplikaci DTF neovlivnily. Vzhledem k tomu, že pro následnou statistiku bylo potřeba porovnávat aktivitu stejných elektrod u jednotlivých pacientů, byly stanoveny kanály 13 a 16. Jedná se o elektrody T3 a T6 umístěnými nad Brocovo a Wernickeovo centrem. Kromě toho, že se tyto elektrody nacházejí nad centry řeči a sluchu, byla na nich měřitelná změna aktivity u největšího počtu pacientů. Celkově by se dalo říci, že se metoda DTF osvědčila jako detektor řeči v signálu EEG, resp. jako detektor jakékoliv významné změny aktivity. U dalších výpočtů už bylo pracováno pouze se zjištěnými fázemi promluv. Původní hypotéza počítala s tím, že by v signálu mohly být shodné parametry umožňující rozdělit pacienty do skupin dle známých vlastností. Pro ověření této teorie byla provedena parametrizace signálů. Výsledné parametry byly posléze porovnány pomocí metod anova a multcompare. Kromě toho byly jednotlivé parametry porovnány vzhledem k psychologické třídě pacienta a mezi sebou. Z použití funkce anova byla patrná odlišnost pacientů se stupněm dysfázie 1 a 3. Na první pohled se pak nedala spolehlivě odlišit skupina 2. Velmi podobné výsledky potom přineslo porovnání parametrů variance a kurtosis vzhledem k psychologickým třídám pacientů histogramu. V případě parametru mean byla v některých případech odlišitelná skupina 1 od ostatních. Při vzájemném porovnání parametrů v korelačních grafech se pak ve všech případech daly odlišit jednotlivé skupiny od sebe, přesto se většina bodů shlukovala. Na základě těchto informací si myslím, že by bylo možné navrhnout klasifikátor schopný do určité míry odlišit pacienty s různým psychologickým stupňem dysfázie. Nejproblematičtější by zřejmě bylo odlišit druhou+ skupinu od ostatních dvou. 37
7. Závěr Cílem této práce bylo pokusit se aplikovat directed transfer function na signály EEG dysfatických pacientů, zjistit, zda by bylo možné odlišit jednotlivé fáze měření a ověřit hypotézu, že by se se znalostí vhodných parametrů dali zařadit pacienti do příslušných skupin dle psychologické třídy vyjadřující stupeň dysfázie. Po aplikaci DTF na EEG signály bylo zjištěno, že analýzu příliš neovlivní přítomnost pohybových artefaktů v původním signálu vzhledem k tomu, že nás v tomto případě zajímá pouze významná změna aktivity v signálu. Veškeré promluvy pacientů se projevily pouze ve vyšších frekvencích, a proto se mohla pásma aktivity jako alfa, théta a delta zcela vyřadit. Rozdílné byly většinou i elektrody u různých pacientů, na kterých se fáze řeči projevily. Ukázalo se, že největší shoda byla na elektrodách T3 a T6. Na signálech z těchto svodů a v pásmu gamma bylo prakticky u každého pacienta možno pozorovat výraznou změnu v aktivitě v okamžiku, kdy pacient začal hovořit. Tato výrazná „odchylka“ pak zůstala po celou dobu promluv. Při použití funkce multcompare pro porovnání vzorků signálů z fází klidu a fází promluv je tento rozdíl v aktivitě velmi dobře patrný. Pro účely ověření hypotézy byly provedeny dvě parametrizace signálu. Vzhledem k tomu, že se na základě Jargueho – Beruova testu ukázalo, že téměř žádná z fází promluv není normálně rozdělena, byla první parametrizace provedena v normalizované části (pouze s promluvami) signálů po DTF. Druhá pak se stejnými signály při distribuci extreme value. Pomocí funkce anova byly porovnány záznamy jednotlivých pacientů a ukázalo se, že by se daly odlišit skupiny pacientů v psychologické třídě dysfázie 1 a 3. Třída 2 byla v některých případech zaměnitelná s třídou 1, nebo 3. Čtyři signály pak v tomto testu vykazovaly abnormální aktivitu a nedaly se tak přiřadit ani k jedné třídě. Při porovnání jednotlivých parametrů se vzhledem ke stupni dysfázie pacientů většinou ukázalo, že by bylo možno s určitou tolerancí odlišit pouze dvě ze tří tříd. I v takovém případě by případný klasifikátor mohl s určitou pravděpodobností přiřadit pacientům správnou třídu. Úspěšnost by však zřejmě nebyla příliš vysoká. Lepších výsledků však bylo dosaženo porovnáním jednotlivých parametrů mezi sebou. Použitím korelačních grafů (scatter graph) se ukázalo, že se ve všech porovnáních dali pacienti jednotlivých psychologických tříd odlišit. Některé hodnoty se sice shlukovaly, ale ve většině případů se nepřekrývaly. Klasifikátor navržený podle výsledku této statistiky by mohl pracovat 38
relativně (v relaci k výše zmíněnému) spolehlivě. Návazností na tuto práci by pak mohl být právě návrh a realizace funkčního klasifikátoru schopného odlišit pacienty podle požadovaných parametrů. Pro jednoduché ověření by mohl sloužit klasifikátor GMM, pro průkaznější výsledky by bylo zřejmě nutno realizovat např. klasifikátor SVM.
39
Seznam použité literatury [1] BECHYŇÁKOVÁ, J., Integrace dítěte s diagnózou vývojová dysfázie do základní školy: bakalářská práce, Brno: Masarykova univerzita, Pedagogická fakulta, 2006. [2] MIKULAJOVÁ, M., RAFAJDUSOVÁ, I. Vývinová dysfázia. Špecificky Narušený vývin reči. Bratislava: 1993. ISBN 80-900445-0-6. [3] BALACH, J., Analýza intraoperačního EcoG záznamu pacientů s TLE: diplomová práce. Praha: České vysoké učení technické v Praze, Fakulta elektrotechnická, 2013. [4] POLLÁK, P., ČMEJLA, R., Analýza a zpracování řečových a biologických signálů: sborník prací., Praha: ČVUT, FEL, 2010. [5] MathWorks: Documentation center [online], jbtest, dostupný z WWW :
[6] MathWorks: Documentation center [online], extreme value distribution, dostupný z WWW : [7] MathWorks: Documentation center [online], analysis of variance, dostupný z WWW : [9] DVOŘÁK, J. Vývojová verbální dyspraxie. Žďár nad Sázavou: Edice Logopaedia clinica, 2003. ISBN 80-902536-5-2. [10] JANČA, R., JEŽDÍK, P., ČMEJLA, R., GLAJCAR, R., KRSEK, P., Jahodová, A., Seizure Onset Detection and Localization in iEEG Using DTF, Praha: České vysoké učení technické v Praze, Fakulta elektronická. [11] SWIDERSKI, B., OSOWSKI, S., CICHOCKI,A.,RYSZ,A., Single-class SVM and directed transfer function approach to the localization of the region containing epileptic focus. Warsaw : Warsaw University of Technology, Poland, 2008.
40
Seznam ilustrací Obr. 2.1 : Metoda 10 – 20, rozložení elektrod …..…..…..…..…..…..…..…..…..…..…..…..….. 6 Obr. 2.2 : Transversální a longitudární metoda …..…..…..…..…..…..…..…..…..…..…..…..…. 6 Obr. 2.3 : Druhy filtrů …..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…... 7 Obr. 2.4 : Návrh filtrů …..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…... 8 Obr. 2.5 : Princip segmentace …..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…..…... 9 Obr. 2.6 : One-way analysis of variance …..…..…..…..…..…..…..…..…..…..…..…..…..…... 12 Obr. 4.1 : Aktivita v jednotlivých frekvenčních pásmech …..…..…..…..…..…..…..…..…..… 20 Obr. 4.2: Rozdíl v aktivitě na některých svodech pacienta 1574 …..…..…..…..…..…..…..…. 21 Obr. 4.3. Proložení distribucí extreme value …..…..…..…..…..…..…..…..…..…..…..…..….. 22 Obr. 4.4 : Výsledky multcompare, Pacient 1702, 1 – klid, 2, 3 – promluvy, 4 – klid 2 …..…... 23 Obr. 4.5: Výsledky multcompare, Pacient 1679, 1 – klid, 2, 3 – promluvy, 4 – klid 2 …..….... 23 Obr. 4.6 : Porovnání fází promluv jednotlivých pacientů …..…..…..…..…..…..…..…..…..… 24 Obr. 4.7 : Příklady výsledných histogramů …..…..…..…..…..…..…..…..…..…..…..…..….... 25 Obr. 5. 1 : Rozdíl mezi pásmem beta a gamma …..…..…..…..…..…..…..…..…..…..…..….... 28 Obr. 5.2 : Analysis of variance, fáze promluv …..…..…..…..…..…..…..…..…..…..…..…..… 29 Obr. 5.3 : Analysis of variance, fáze "obrázků" …..…..…..…..…..…..…..…..…..…..…..…... 30 Obr. 5.4 : Porovnání parametru mean a var v závislosti na psychologické třídě pacientů ….... 31 Obr. 5.5 : Porovnání parametru kurtosis a skewness vzhledem k třídě pacientů …..…..…..…. 31 Obr. 5.6 : Porovnání parametrů mean a skewness/kurtosis ve fázi promluv …..…..…..…..…. 32 Obr. 5.7 : Porovnání parametrů mean a skewness/kurtosis ve fázi "obrázků" …..…..…..…..... 33 Obr. 5.8 : Porovnání parametrů var a skewness/kurtosis ve fázi promluv …..…..…..…..…..... 33 Obr. 5.9 : Porovnání parametrů var a skewness/kurtosis ve fázi "obrázků" …..…..…..…..….. 34
41
42