ˇ ´ vysoke ´ uc ˇen´ı technicke ´ Praha Cesk e Fakulta elektrotechnick´a Katedra kybernetiky
Vyuˇ zit´ı znalost´ı experta pˇ ri zpracov´ an´ı EEG sign´ al˚ u
kvˇ eten 2013
Student:
Jakub Kahoun
Vedouc´ı pr´ace:
Ing. V´aclav Gerla, Ph.D.
Podˇ ekov´ an´ı R´ad bych podˇekoval Ing. V´aclavu Gerlovi, Ph.D. za jeho rady, pˇripom´ınky a pomoc pˇri psan´ı t´eto bakal´aˇrsk´e pr´ace. D´ale bych r´ad podˇekoval firmˇe Certicon a panu Marku Obitkovi za cen´e rady a pomoc pˇri uˇcen´ı s programem Fel Ex Expert. V neposledn´ı ˇradˇe bych r´ad podˇekoval rodinˇe a pˇra´tel˚ um za podporu a pomoc bˇehem dosavadn´ıho studia.
Abstrakt C´ılem t´eto bakal´aˇrsk´a pr´ace bylo ovˇeˇren´ı moˇznosti vyuˇzit´ı znalost´ı experta pˇri zpracov´an´ı dlouhodob´ ych EEG z´aznam˚ u. Automatick´e zpracov´an´ı sp´ankov´ ych EEG z´aznam˚ u je velice n´aroˇcn´a a komplexn´ı u ´loha. P˚ uvodn´ım v´ ystupem programu mˇel b´ yt hypnogram, graf popisuj´ıc´ı sp´anek. Bohuˇzel pravidla vyuˇz´ıvan´a l´ekaˇri nebyla lehce aplikovateln´a, a proto jsme u ´lohu zjednoduˇsili na automatickou detekci svalov´ ych artefakt˚ u v EEG z´aznamu. Nicm´enˇe navrˇzen´a metodologie je pouˇziteln´a pro r˚ uzn´e typy dat, pokud jsou sestavena vhodn´a pravidla. Testov´an´ı bylo prov´adˇeno nad laboratorn´ımi daty, kter´a byla namˇeˇrena pro potˇreby t´eto u ´lohy.
Kl´ıˇ cov´ a slova EEG, znalostn´ı syst´emy, klasifikace, sp´anek, biosign´aly, Fel Ex Expert, PSGLab, Java, Weka
Abstract The aim of this bachelor thesis is to verify options of utilization of background knowledge in longterm electroencephalographic (EEG) signal processing. The automated classification of sleep EEG signals is a very difficult and complex task. Original result of code had been hypnogram, sleep graph. Unfortunately, the rules used by doctors are not easily applicable, and therefore we simplify the task for the automatic detection of muscle artifacts in EEG recording. However, the methodology is applicable to various types of data, if there are assembled correct rules. Testing was done over laboratory data, which was measured for the purposes of this task.
Key words EEG, Knowledge systems, classification, sleep, biosignals, Fel Ex Expert, PSGLab, Java, Weka
Obsah ´ 1 Uvod
1
2 Expertn´ı syst´ emy
2
2.1
Pojem expertn´ı syst´emy . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ Uvod do expertn´ıch syst´em˚ u . . . . . . . . . . . . . . . . . . . . . . . . . .
2 4
2.4
Dˇelen´ı expertn´ıch syst´em˚ u . . . . . . . . . . . . . . . . . . . . . . . . . . . ˇ ıd´ıc´ı mechanismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . R´
2.5
Ontologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.5.1
Pˇr´ıklady ontologi´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
3 Fel Ex Expert ´ 3.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Inferenˇcn´ı s´ıt’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.2 2.3
2 5
7 7
3.3
Konzultace
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
3.4
Z´ısk´av´an´ı dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˇ 3.4.1 Cinitel jistoty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˇ ıseln´e hodnoty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 C´
8 9
3.5
Vazby . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
3.6
Taxonomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
8
3.6.1
Zamˇeˇren´ı pozornosti . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.6.2
Hierarchick´e z´avislosti . . . . . . . . . . . . . . . . . . . . . . . . . 10
4 Biomedic´ınsk´ e sign´ aly
11
4.1
EEG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.2
EKG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.3
EMG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.4
EOG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.5
PSG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5 Sp´ anek
14
5.1
REM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.2
NREM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.3
Hypnogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5.4
Sk´orovac´ı syst´emy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 5.4.1
Historie sk´orovac´ıch syst´em˚ u . . . . . . . . . . . . . . . . . . . . . . 16
5.4.2
Rechtschaffen and Kale . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.4.3
AASM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6 WEKA
18
6.1
ARFF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
6.2
Rozhodovac´ı stromy
6.3
Selekce pˇr´ıznak˚ u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
7 ROC kˇ rivka a jej´ı parametry
20
ˇ sen´ı 8 Reˇ
22
8.1
Navrˇzen´a metodologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8.2
Pouˇzit´a data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 8.2.1
Klinick´a data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
8.2.2
Laboratorn´ı data . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
8.3
Metody pˇredzpracov´an´ı dat . . . . . . . . . . . . . . . . . . . . . . . . . . 24
8.4
Rozhodovac´ı pravidla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 8.4.1
Rozhodovac´ı strom . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
8.4.2
Hodnocen´ı pˇr´ıznak˚ u . . . . . . . . . . . . . . . . . . . . . . . . . . 27
8.4.3
Z´avˇerem k pravidl˚ um . . . . . . . . . . . . . . . . . . . . . . . . . . 28
8.5
Chyba vstupn´ıch dat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
8.6
Prov´az´an´ı s aplikac´ı Fel Ex Expert . . . . . . . . . . . . . . . . . . . . . . 30 8.6.1
8.7
Pravidla pro detekci artefakt˚ u . . . . . . . . . . . . . . . . . . . . . 31
Zpracov´an´ı v´ ystupn´ı datab´aze . . . . . . . . . . . . . . . . . . . . . . . . . 32
9 Java GUI
34
9.1
Debug mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
9.2
Normal mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
10 V´ ysledky
36
11 Z´ avˇ er
38
12 Reference
40
1
´ Uvod
Zad´an´ı pr´ace vzniklo ze snahy usnadnit pr´aci l´ekaˇr˚ um a zkr´atit ˇcas potˇrebn´ y pro klasifikaci sp´ankov´ ych EEG z´aznam˚ u. EEG z´aznamy mohou b´ yt dlouh´e i nˇekolik hodin. Takto dlouh´ y z´aznam neurolog hodnot´ı v ˇr´adu hodin. Nav´ıc neexistuje pˇresn´a a jednotn´a definice jednotliv´ ych sp´ankov´ ych f´az´ı, kaˇzd´ y l´ekaˇr m˚ uˇze stejn´ y z´aznam ohodnotit rozd´ılnˇe. V´ ysledkem by mohla b´ yt metodologie umoˇzn ˇuj´ıc´ı vytvoˇren´ı jednotn´e sady pravidel k ohodnocen´ı sp´ankov´ ych EEG z´aznam˚ u l´ekaˇri. C´ılem t´eto pr´ace bylo rozhodnout, zda je moˇzn´e efektivn´ı vyuˇzit´ı expertn´ıch syst´em˚ u v biomedic´ınsk´em oboru, konkr´etnˇe k ohodnocen´ı sp´ankov´ ych EEG z´aznam˚ u. V t´eto souvislosti se nab´ız´ı expertn´ı syst´emy pouˇz´ıt dvˇema zp˚ usoby. V prvn´ım pˇr´ıpadˇe by mohl nahrazovat experta, kter´ y sestavuje hypnogram, pˇr´ıpadnˇe mu usnadn´ı hodnocen´ı tˇechto dat. V druh´em pˇr´ıpadˇe by mohl analyzovat sestaven´ y hypnogram a diagnostikovat pˇr´ıtomnost sp´ankov´ ych poruch. Tato pr´ace se vˇenuje prvn´ımu pˇr´ıpadu, tedy vyuˇzit´ı znalost´ı experta ke klasifikaci EEG z´aznam˚ u. V prvn´ıch dvou kapitol´ach si pˇredstav´ıme expertn´ı syst´emy a konkr´etnˇe syst´em Fel Ex Expert, kter´ y byl pouˇzit v t´eto pr´aci. Dalˇs´ı dvˇe kapitoly pojedn´avaj´ı o EEG, sp´anku a zp˚ usobu jak´ ym neurologov´e tento typ sign´alu hodnot´ı. Kapitola 6 obsahuje z´aklady strojov´eho uˇcen´ı a kapitola 7 popisuje metody pouˇz´ıvan´e k hodnocen´ı bin´arn´ıch klasifik´ator˚ u. V praktick´e ˇca´sti jsme se zab´ yvali metodami strojov´eho uˇcen´ı, kter´e n´am navrhnou optim´aln´ı rozhodovac´ı strom. V´ ysledky tohoto stromu jsme porovnali s v´ ysledky n´ami navrˇzen´eho ˇreˇsen´ı. K ohodnocen´ı v´ ysledk˚ u jsme pouˇzili ROC kˇrivku. V programovac´ım jazyce Java jsme vytvoˇrili jednoduch´e GUI, kter´e slouˇz´ı ke grafick´emu zobrazen´ı v´ ysledk˚ u a spoˇc´ıt´an´ı pˇr´ıznak˚ u sign´alu. Posledn´ı kapitola shrne dosaˇzen´e v´ ysledky. Testov´an´ı bylo prov´adˇeno nad dvˇema typy dat. Klinick´ ymi daty namˇeˇren´ ymi v nemocnici Na Bulovce a psychiatrick´e l´eˇcebnˇe Bohnice. A laboratorn´ımi daty, kter´a byla namˇeˇrena pro potˇreby t´eto u ´lohy. Tyto EEG z´aznamy byly namˇeˇreny v laboratoˇri skupiny Biodat (Katedra Kybernetiky, Elektrotechnick´a Faˇ kulta, CVUT). V´ ystupem t´eto bakal´aˇrsk´e pr´ace nen´ı hotov´ y klasifik´ator, ale metodologie, jak s dan´ ymi daty pracovat.
1
2
Expertn´ı syst´ emy
2.1
Pojem expertn´ı syst´ emy
Oznaˇcen´ı expertn´ı syst´emy se pouˇz´ıv´a pro velkou mnoˇzinu u ´loh, od jednoduch´ ych klasifik´ator˚ u, pˇres neuronov´e s´ıtˇe a rozs´ahl´e diagnostick´e s´ıtˇe aˇz po s´emantick´e weby. V t´eto pr´aci se pod pojmem expertn´ı syst´emy mysl´ı komplexn´ı syst´em obsahuj´ıc´ı vˇsechny 3 z´akladn´ı ˇca´sti: ˇr´ıd´ıc´ı mechanismus, b´aze znalost´ı a b´azy dat. Tento expertn´ı syst´em se snaˇz´ı integrovat znalosti expert˚ u s metodami umˇel´e inteligence. Hlubˇs´ım pohledem do expertn´ıch syst´em˚ u zjist´ıme, ˇze s´emantick´ y web, ˇci neuronov´a s´ıt’ b´ yv´a d˚ uleˇzitou ˇc´ast´ı expertn´ıho syst´emu, ale netvoˇr´ı cel´ y expertn´ı syst´em. [1]
2.2
´ Uvod do expertn´ıch syst´ em˚ u
Prvn´ı expertn´ı syst´emy byly zavedeny na poˇca´tku 80. let. Pˇresn´a, vˇseobecnˇe uzn´avan´a definice expertn´ıho syst´emu zat´ım chyb´ı. Nav´ıc se vize a oˇcek´av´an´ı v ˇcase pr˚ ubˇeˇznˇe mˇen´ı. V souladu s Feigenbaumem lze konstatovat, ˇze: Expertn´ı syst´emy jsou poˇc´ıtaˇcov´e ” programy, simuluj´ıc´ı rozhodovac´ı ˇcinnost experta pˇri ˇreˇsen´ı sloˇzit´ ych u ´loh a vyuˇz´ıvaj´ıc´ı vhodnˇe zak´odovan´ ych, explicitnˇe vyj´adˇren´ ych speci´aln´ıch znalost´ı, pˇrevzat´ ych od experta, s c´ılem dos´ahnout ve zvolen´e probl´emov´e oblasti kvality rozhodov´an´ı na u ´rovni experta“. Postupnˇe si rozebereme jednotliv´e rysy expertn´ıch syst´em˚ u: 1. Program nebude postupovat vˇzdy stejnˇe instrukci po instrukci, jako je tomu u normaln´ıho, procedur´aln´ıho programovan´ı. Syst´em bude muset umˇet s´am vyhodnotit, kter´e v´ ysledky jsou pro nˇej relevantnˇejˇs´ı neˇz jin´e. B´aze znalost´ı je oddˇelena od ˇr´ıd´ıc´ıho mechanismu. 2. Pole p˚ usobnosti tohoto programu bude dostateˇcnˇe velk´e, aby zvl´adl nˇeco ˇreˇsit, ale nesm´ı b´ yt extr´emn´ı, nebot’ by tyto znalosti neˇslo d´at dohromady. Znalosti jsou obsaˇzeny v popisu ontologii v kapitole 2.5. U kaˇzd´eho expertn´ıho syst´emu se jako nejvˇetˇs´ı probl´em uk´azuj´ı vˇseobecn´e znalosti, kter´e expert pouˇz´ıv´a, aniˇz by si to uvˇedomoval. Nˇekter´e situace nemohou v re´aln´em svˇetˇe nastat, a proto mus´ı b´ yt oˇsetˇreny pravidly. Nebo jin´e situace jsou pro n´as tak pˇrirozen´e, ˇze n´am nedoch´az´ı, ˇze to v´ıme (viz. Napˇr´ıklad robot, kter´ y vaˇr´ı ˇspagety na plynov´em vaˇriˇci, pokud by mu utekla voda a uhasila oheˇ n u jeho plynov´eho hoˇr´aku. Mus´ı vˇedˇet, ˇze m´a zastavit pˇr´ıvod plynu.). 3. B´aze znalost´ı popisuje znalosti z dan´e oblasti. Jedn´a se o soubor obecnˇe rozhodovac´ıch pravidel ˇreˇsen´ı konkr´etn´ı u ´lohy znamen´a dosadit“ data o dan´em pˇr´ıpadu do ” obecnˇe formulovan´ ych znalost´ı. 2
Tyto data m˚ uˇze poskytovat uˇzivatel sekvenˇcnˇe, v dialogov´ em reˇ zimu s poˇc´ıtaˇcem. Expertn´ı syst´em se dotazuje uˇzivatele na u ´daje, t´ ykaj´ıc´ı se konzultovan´eho pˇr´ıpadu. Na z´akladˇe odpovˇedi a sv´ ych obecn´ ych znalost´ı si postupnˇe upˇresˇ nuje pˇredstavu“ ” o pˇr´ıpadu a doch´az´ı k z´avˇeru, eventu´alnˇe k ˇreˇsen´ı. Posloupnost ot´azek, dynamicky volen´a s vyuˇzit´ım princip˚ u umˇel´e inteligence, m˚ uˇze br´at v u ´vahu i dalˇs´ı krit´eria, napˇr. cenu z´ısk´an´ı odpovˇedi. U nˇekter´ ych expertn´ıch syst´em˚ u je dialog s uˇzivatelem nahrazen pˇ r´ım´ ym mˇ eˇ ren´ım u ´ daj˚ u, ˇci jejich vyhled´an´ım v databank´ach. Mnoˇzinu vˇsech u ´daj˚ u k dan´emu pˇr´ıpadu naz´ yv´ame b´az´ı dat. 4. Zp˚ usob zpracov´an´ı znalost´ı a dat v expertn´ım syst´emu se mus´ı podobat zp˚ usobu uvaˇzov´an´ı experta. Expertn´ı syst´em mus´ı b´ yt schopen: • vyuˇz´ıvat nejist´ ych znalost´ı, tj. znalost´ı s pˇridˇelenou m´ırou d˚ uvˇery v jejich platnost (hovoˇr´ıme o nejistotˇe v b´azi znalost´ı) • vyuˇz´ıvat odpovˇedi, zahrnuj´ıc´ı nejistotu uˇzivatele (odpovˇedi typu nev´ım“, asi ” ” ano“ apod.). V tom pˇr´ıpadˇe hovoˇr´ıme o nejistotˇ e v b´ azi dat 5. B´aze znalost´ı mus´ı obsahovat n´asobn´e ˇci alternativn´ı cesty vyvozov´an´ı. Zjednoduˇsenˇe ˇreˇceno kaˇzd´ y z´avˇer by mˇel b´ yt podporov´an ˇci vyvracen v´ıce neˇz jedn´ım faktem. Expertn´ı syst´em mus´ı poskytovat radu i v situac´ıch, kdy ˇca´st vyˇzadovan´ ych dat nen´ı dostupn´a. 6. Z hlediska vnˇejˇs´ıho chov´an´ı je na expertn´ı syst´em kladena ˇrada poˇzadavk˚ u odv´ıjej´ıc´ıch se z pˇredstavy, ˇze expertn´ı syst´em nahrazuje odborn´ıka, poskytuj´ıc´ı konzultaci laikovi ˇci m´enˇe zkuˇsen´emu odborn´ıkovi. Poˇc´ıtaˇcov´ y expertn´ı syst´em mus´ı nejen v´est s uˇzivatelem dialog ve formˇe ot´azka-odpovˇed’, ale mus´ı b´ yt tak´e schopen vysvˇetlit a zd˚ uvodnit d´ılˇc´ı z´avˇery i poloˇzit vhodn´ y doplˇ nuj´ıc´ı dotaz. Uveden´ y v´ yˇcet charakteristick´ ych znak˚ u nelze rozhodnˇe ch´apat jako exaktn´ı definici expertn´ıch syst´em˚ u. Syst´emy ˇrazen´e mezi expertn´ı syst´emy nemusej´ı kategoricky splˇ novat vˇsechny zm´ınˇen´e poˇzadavky, napˇr. existuje ˇrada u ´spˇeˇsn´ ych expertn´ıch syst´emu, kter´e neumˇej´ı pracovat s neurˇcitost´ı. [1] Pokud je u ´loha dobˇre specifikovan´a a vˇsechny okruhy znalost´ı jsou jasnˇe zadan´e, n´asleduje konzultace s expertem. Expert je v tomto programu velice d˚ uleˇzit´ y, protoˇze mus´ı ˇr´ıct vˇse, co v´ı a um´ı. Z´aroveˇ n nesm´ı m´ıt pocit, ˇze ho dan´ y projekt ohroˇzuje. Jde sp´ıˇse o psychologick´ y u ´kol, neˇz program´atorsk´ y. Potˇrebujeme s expertem nav´azat lidsk´ y vztah. Aby samotn´ı experti nemˇeli pocit moˇzn´e n´ahrady, kter´a opravdu nen´ı c´ılem tˇechto projekt˚ u,
3
zaˇcalo se expertn´ım syst´em˚ um ˇr´ıkat znalostn´ı. Nebot’ tyto programy maj´ı uchov´avat znalosti a pom´ahat expert˚ um k lepˇs´ı, rychlejˇs´ı a efektivnˇejˇs´ı pr´aci. K efektivn´ımu z´ısk´av´an´ı znalost´ı od experta byl vyvinut program SAZE (Syst´em Automatick´eho Z´ısk´av´an´ı Expert´ız). Tansley a Hayball (Tansley a Heyball,1993) uv´adˇej´ı pˇr´ıznaky podle nichˇz lze uvaˇzovat o vhodnosti aplikace znalostn´ıch (expertn´ıch) syst´emu: • v definici u ´lohy jsou pouˇzity term´ıny typu: pravidla, vztahy, pˇredpoklady, atd. • u ´loha se zd´a b´ yt neˇreˇsiteln´a numerick´ ym v´ ypoˇctem • zpracovan´a fakta se vyznaˇcuj´ı urˇcit´ ym stupnˇem jistoty/ nejistoty • u ´loha nevyˇzaduje manu´aln´ı zruˇcnost • pro u ´lohu existuj´ı kvalifikovan´ı experti
2.3
Dˇ elen´ı expertn´ıch syst´ em˚ u
Expertn´ı syst´emy je moˇzn´e rozdˇelit napˇr´ıklad do tˇechto tˇrech skupin: diagnostick´e, pl´anovac´ı a hybridn´ı. • Diagnostick´ e expertn´ı syst´emy se dˇel´ı jeˇstˇe na povrchov´e a hloubkov´e. – Povrchov´ e jsou v´ ypoˇcetnˇe lehˇc´ı, rychlejˇs´ı a pokaˇzd´e si pouze aktualizuj´ı svoje pravdˇepodobnosti v´ ysledk˚ u. Neum´ı odhalit chyby, kter´e neznaj´ı, a nedok´aˇz´ı odhalit dvˇe nebo v´ıce chyb najednou. – Hloubkov´ e sleduj´ı vstup a v´ ystup a v pamˇeti maj´ı model cel´eho syst´emu, kter´emu pos´ılaj´ı stejn´a data jako re´aln´emu syst´emu a sleduj´ı odchylky v chov´an´ı. V´ yhodou je, ˇze dok´aˇz´ı odhalit i nov´e i v´ıcen´asobn´e chyby. Bohuˇzel model cel´eho syst´emu je velice n´aroˇcn´ y a nˇekdy i neˇreˇsiteln´ y. • U pl´ anovac´ıch expertn´ıch syst´em˚ u zn´ame poˇc´ateˇcn´ı i koneˇcn´ y stav. C´ılem u ´lohy je naj´ıt nejlepˇs´ı cestu, jak se dostat z poˇca´teˇcn´ıho stavu do koneˇcn´eho. Expanze vˇsech stav˚ u je omezov´ana fakty a znalostmi. Pokud je pouˇzito m´alo pravidel, m˚ uˇze syst´em nar˚ ust do ne´ unosn´ ych rozmˇer˚ u. • Hybridn´ı expertn´ı syst´emy jsou kombinac´ı obou pˇredchoz´ıch variant a nejˇcastˇeji se vyuˇz´ıvaj´ı jako inteligentn´ı v´ yukov´e syst´emy, monitorovac´ı syt´emy, atd. Kaˇzd´ y expertn´ı syst´em mus´ı obsahovat b´azi znalost´ı, b´azi dat a ˇr´ıd´ıc´ı algoritmus(viz. obr. 1). B´aze znalost´ı se tak´e naz´ yv´a ontologi´ı, jsou to vˇsechny znalosti, poznatky a postˇrehy, kter´e expert k dan´e problematice m´a a zn´a. Pr´ azdn´ e expertn´ı syst´ emy jsou speci´aln´ı 4
ne´ upln´e expertn´ı syst´emy, kter´e nemaj´ı b´azi dat, ani b´azi znalost´ı, maj´ı naimplementov´an pouze ˇr´ıd´ıc´ı algoritmus. V´ yhodou b´ yv´a pˇrenositelnost na jin´e t´ema. K nov´emu t´ematu je vytvoˇrena pouze nov´a b´aze znalost´ı, neboli ontologie. [1]
Obr´azek 1: Sch´ema expertn´ıho syst´emu
2.4
ˇ ıd´ıc´ı mechanismus R´
urˇcuje v jak´em poˇrad´ı budeme aplikovat pravidla na b´azi znalost´ı: dopˇredn´e, nebo zpˇetn´e ˇretˇezen´ı. [1] • Pomoc´ı dopˇ redn´ eho ˇ retˇ ezen´ı zaˇc´ın´ame listov´ ymi hypot´ezami a bl´ıˇz´ıme se k c´ılov´ ym, strategie ˇr´ızen´a daty. • Zpˇ etn´ eˇ retˇ ezen´ı postupuje obr´acen´ ym smˇerem. Zn´ame v´ ysledek a snaˇz´ıme se naj´ıt optim´aln´ı cestu, jak jsme tohoto v´ ysledku dos´ahli, strategie ˇr´ızen´a c´ılem.
2.5
Ontologie
Znalosti mohou b´ yt reprezentov´any tˇremi zp˚ usoby: s´emantickou s´ıt´ı, inferenˇcn´ı s´ıt´ı, nebo pomoc´ı r´amc˚ u. • S´ emantick´ a s´ıt’ je sloˇzena ze dvou z´akladn´ıch komponent: uzl˚ u a hran. Kaˇzd´ y uzel slouˇz´ı k vyj´adˇren´ı nˇejak´eho stavu, tyto stavy mohou b´ yt poˇc´ateˇcn´ı, uzel nem´a ˇza´dnou vstupn´ı hranu. Mezilehl´e uzly upˇresˇ nuj´ı nˇejakou situaci. Koncov´e uzly jsou v´ ysledn´e hypot´ezy. Hrany urˇcuj´ı vztahy mezi jednotliv´ ymi stavy. 5
• V inferenˇ cn´ı s´ıti se data k´oduj´ı pomoc´ı jednoduch´ ych pravidel ve tvaru: IF (podm´ınka) THEN (d˚ usledek) S JISTOTOU (x). Podm´ınka se tvoˇr´ı pomoc´ı logick´ ych oper´ator˚ u. • Pod pojmem r´ amce se ukr´ yv´a dnes velmi rozˇs´ıˇren´e objektov´e programov´an´ı. Vyuˇz´ıv´a vˇsechny jeho pˇrednosti, jako jsou: zapouzdˇren´ı, dˇediˇcnost a polymorfismus. R´amce se daj´ı vyj´adˇrit pomoc´ı grafu, kter´ y spojuje v´ıce r´amc˚ u do jednoho komplexn´ıho ˇreˇsen´ı. Kaˇzd´ y r´amec obsahuje uzly a relace. Jednoduˇse implementovateln´e pomoc´ı objektovˇe orientovan´eho programovac´ıho jazyka. Ontologie zahrnuje i obecnˇe zn´am´e znalosti, kter´e pouˇz´ıv´a kaˇzd´ y expert i laik, a ani si jejich pouˇz´ıv´an´ı neuvˇedomujeme. Nˇekter´e stavy prostˇe ned´avaj´ı smysl, takˇze je expert nenavrhne. Ale bez spr´avn´eho pouˇzit´ı ontologi´ı expertn´ı syst´em nem´a ˇsanci tyto data spr´avnˇe vyhodnotit. Ontologie se dˇel´ı na dvˇe skupiny: aristotelsk´e a modern´ı • Aristotelsk´ e obsahuj´ı pouze dva vztahy a je to u ´plnˇe nejz´akladnˇejˇs´ı zp˚ usob, jak popsat lidsk´e tˇelo(is-a, part-of). V praxi to znamen´e, ˇze m˚ uˇzeme napsat: lidsk´e tˇelo part-of org´any part-of ledvina. Z´aleˇz´ı jen na n´as, jak moc budeme jednotliv´e dˇelen´ı tˇr´ıdit. • Modern´ı ontologie se dˇel´ı smˇerem od zdola. Napˇr´ıklad, jedna ontologie se nesnaˇz´ı pokr´ yt nˇeco tak sloˇzit´eho, jako je lidsk´e tˇelo. Lid´e uˇz d´avno vˇed´ı, ˇze samotn´ y mozek, ˇci srdce vyd´a na mnohem v´ıce znalost´ı, neˇz mˇeli lid´e dˇr´ıve o cel´em tˇele. Pouˇz´ıv´a mnohem v´ıce sloˇzitˇejˇs´ıch vztah˚ u. Jeden expertn´ı syst´em m˚ uˇze vyuˇz´ıvat i v´ıce ontologi´ı najednou, staˇc´ı vytvoˇrit tzv. tabuli nad vˇsemi ontologiemi. Vˇsechny b´aze znalost´ı sv´e v´ ysledky pˇrepisuj´ı na tuto ta” buli“, kde si ostatn´ı mohou br´at sv´a data pro dalˇs´ı v´ ypoˇcty. V b´azi dat jsou uloˇzeny data o aktu´aln´ı u ´loze. Podle jejich hodnot se ˇr´ıd´ıc´ı algoritmus rozhoduje, kter´a hypot´eza je aktu´alnˇe pravdˇepodobnˇejˇs´ı a jak´ ym smˇerem by se mˇel ub´ırat. 2.5.1
Pˇ r´ıklady ontologi´ı
Ontologie vyv´ıjen´a od roku 1990, kter´a obsahuje na 2 000 000 vˇseobecn´ ych znalost´ı skrze vˇsechny obory se naz´ yv´a CYC. Z oboru medic´ıny tu je UMLS, kter´a je vnitˇrnˇe rozdˇelena na tˇri zdroje z´ısk´av´an´ı znalost´ı: • hierarchick´ y terminologick´ y slovn´ık, metatezaurus • semantick´a s´ıt’ zachycuje obecn´e vztahy mezi kategoriemi • mapa informaˇcn´ıch zdroj˚ u 6
3
Fel Ex Expert
3.1
´ Uvod
Fel Ex Expert je pr´azdn´ y expertn´ı syst´em z kategorie diagnostick´ ych expertn´ıch syst´em˚ u ˇ (viz. obr. 2). Tento syst´em byl vyvinut na CVUT, n´aslednˇe odkoupen firmou CertiCon. Ve vˇsech verz´ıch pouˇz´ıv´a pravdˇepodobnostn´ı pseudobayesovsk´ y pˇr´ıstup pro pr´aci s neurˇcitost´ı a to jak v b´azi dat, tak i b´azi znalost´ı. Tento pˇr´ıstup je pˇrevzat ze syst´emu PROSPECTOR. [17]
Obr´azek 2: Sch´ema diagnostick´eho expertn´ıho syst´emu
3.2
Inferenˇ cn´ı s´ıt’
Z´akladem pro reprezentaci b´aze znalost´ı expertn´ıho syst´emu jsou pravidla ve tvaru • if pˇredpoklad E – then z´avˇer H with pravdˇepodobnost P(H—E) – else z´avˇer H with pravdˇepodobnost P(H—not E) Pro v´ ypoˇcet (pseudo)pravdˇepodobnosti z´avˇeru se pouˇz´ıv´a Bayes˚ uv vztah. Soubor tˇechto pravidel tvoˇr´ı orientovan´ y graf, kde vrcholy jsou tvrzen´ı (E, H) a hrany (ohodnocen´e pravdˇepodobnost´ı) tvoˇr´ı pravidla. Tento graf se naz´ yv´a inferenˇcn´ı s´ıt’. Z´akladn´ı
7
inferenˇcn´ı s´ıt’ doplˇ nuj´ı logick´e kombinace v´ yrok˚ u ve tvarech not E, E1 and E2, E1 or E2, atd. Rozliˇsuje se tedy mezi dvˇema typy uzl˚ u - bayesovsk´ y uzel a logick´ y uzel. Bayesovsk´ y uzel reprezentuje tvrzen´ı, jehoˇz pravdˇepodobnost se d´a vyhodnotit dle Bayesova vztahu. M´a danou apriorn´ı pravdˇepodobnost. Aposteriorn´ı pravdˇepodobnost (po pozorov´an´ı) se bud’ spoˇc´ıt´a z pozorovan´ ych pˇredpoklad˚ u nebo se z´ısk´a pˇr´ım´ ym pozorov´an´ım. Logick´ y uzel reprezentuje tvrzen´ı, jehoˇz pravdˇepodobnost se d´a vyhodnotit dle logick´e kombinace pˇredpoklad˚ u. Pravdˇepodobnost tvrzen´ı se vyhodnocuje pomoc´ı vztah˚ u pˇrevzat´ ych z fuzzy logiky. Uzly (tvrzen´ı) se tak´e daj´ı rozdˇelit dle sv´e polohy v inferenˇcn´ı s´ıti na vrcholov´e, listov´e a mezilehl´e. Vrcholov´e uzly jsou uzly, z nichˇz nevede ˇz´adn´a orientovan´a hrana. Vrcholov´e uzly reprezentuj´ı vrcholov´e hypot´ezy. Listov´e uzly jsou uzly, do nichˇz nevede ˇz´adn´a orientovan´a hrana, reprezentuj´ı tedy tvrzen´ı, kter´a mus´ı b´ yt ovˇeˇrena pozorov´an´ım. Ostatn´ı uzly jsou mezilehl´e. Ty reprezentuj´ı mezilehl´a (d´ılˇc´ı) tvrzen´ı. Kaˇzd´ y uzel m˚ uˇze b´ yt nav´ıc dotazovateln´ y (listov´ y uzel mus´ı b´ yt dotazovateln´ y) nebo m˚ uˇze reprezentovat c´ılovou hypot´ezu. [16]
3.3
Konzultace
Konzultace je proces, pˇri kter´em se syst´em snaˇz´ı zjistit platnost c´ılov´ ych hypot´ez. Syst´em pˇri konzultaci vyb´ır´a nejpravdˇepodobnˇejˇs´ı c´ılovou hypot´ezu a snaˇz´ı se j´ı dok´azat, nebo vyvr´atit. Pomoc´ı sk´orovac´ı funkce (viz. [17]) urˇcuje nejuˇziteˇcnˇejˇs´ı dotazy. Expertn´ı syst´em poloˇz´ı ot´azku a na z´akladˇe odpovˇedi si aktualizuje sv˚ uj model. Tento proces se opakuje, dokud nen´ı hypot´eza kompletnˇe vyˇsetˇrena. Konzultace konˇc´ı v okamˇziku vyˇsetˇren´ı vˇsech c´ılov´ ych hypot´ez. [16] [17]
3.4
Z´ısk´ av´ an´ı dat
Pˇri konzultaci je tˇreba z´ısk´avat data z okoln´ıho svˇeta. Tato data mohou b´ yt v nejr˚ uznˇejˇs´ı podobˇe. Je vˇsak tˇreba vˇzdy zajistit jejich pˇreveden´ı na pravdˇepodobnost, kter´a se pouˇzije pro inferenci. [16] 3.4.1
ˇ Cinitel jistoty
Uˇzivatel m˚ uˇze odpovˇedˇet ano/ne/nev´ım a pˇr´ıpadnˇe pomoc´ı dalˇs´ıho jemnˇejˇs´ıho rozliˇsen´ı mezi tˇemito hodnotami. Hodnota ano se pˇreloˇz´ı jako pravdˇepodobnost 1, hodnota ne jako 0, hodnota nev´ım jako apriorn´ı pravdˇepodobnost tvrzen´ı. Zbyl´e hodnoty se urˇc´ı line´arn´ı interpolac´ı (viz. obr. 3). Pseudopravdˇepodobnost je n´aslednˇe dopoˇc´ıt´ana, dle:
8
Obr´azek 3: Pˇrevod ˇcinitele jistoty na pravdˇepodobnost [17]
( P (E|E 0 ) =
3.4.2
P (E) + (1 − P (E)) ∗ (R/5) pro R ≥ 0 P (E) ∗ (1 − (R/5)) pro R < 0
ˇ ıseln´ C´ e hodnoty
Zde uˇzivatel odpov´ıd´a konkr´etn´ı numerickou hodnotou pozorovan´e veliˇciny. Expert zad´a v´ yznamn´e body a jejich odpov´ıdaj´ıc´ı pravdˇepodobnosti. Hodnota od uˇzivatele se na pravdˇepodobnost pˇrepoˇc´ıt´a interpolac´ı (pˇr´ıp. extrapolac´ı) mezi body zadan´ ymi expertem. K dispozici jsou dva druhy tohoto uzlu, kter´e se liˇs´ı pouze v poˇc´ıt´an´ı pravdˇepodobnosti mimo zadan´e meze. Jeden poˇc´ıt´a hodnoty mimo meze jako hodnoty mez´ı, druh´ y prov´ad´ı line´arn´ı extrapolaci dle krajn´ıch dvou bod˚ u aˇz do hodnoty 0 nebo 1 (viz. obr. 4). [16]
Obr´azek 4: Porovn´an´ı dvou zp˚ usob˚ u moˇzn´eho pˇrepoˇctu vstupn´ıch dat na pravdˇepodobnost [16]
3.5
Vazby
Z´akladn´ı inferenˇcn´ı s´ıt’ popisuje vztahy mezi hypot´ezami. Bohuˇzel tento popis nen´ı dostaˇcuj´ıc´ı, nebot’ nedok´aˇzeme urˇcit nutnost poˇrad´ı vykon´av´an´ı jednotliv´ ych z´aznam˚ u nebo vykon´av´an´ı 9
za zvl´aˇstn´ıch podm´ınek. K upˇresnˇen´ı tˇechto vztah˚ u Fel Ex Expert vyuˇz´ıv´a prioritn´ı a kontextov´e vazby. [16] • Prioritn´ı (nepodm´ınˇen´a) vazba urˇcuje, ˇze nˇekter´ y uzel se mus´ı vyˇsetˇrit pˇred vyˇsetˇren´ım jin´eho uzlu. Je tedy d´ana dvˇema uzly a orientovanou vazbou mezi nimi. • Kontextovou (podm´ınˇenou) vazbu nemus´ıme v nˇekter´ ych pˇr´ıpadech ˇreˇsit. Napˇr´ıklad, nem´a cenu se pacienta pt´at, zda-li m´a nemocn´eho bratra, pokud jsme neprok´azali, ˇze m´a nˇejak´eho bratra. Kontextov´a vazba urˇcuje, ˇze nˇekter´e uzly budou vykon´any pouze, kdyˇz jin´e spln´ı podm´ınku rozsahu.
3.6
Taxonomie
Taxonomie umoˇzn ˇuj´ı d´ale strukturovat znalosti uloˇzen´e v inferenˇcn´ı s´ıti, zvl´aˇstˇe u rozs´ahl´ ych inferenˇcn´ıch s´ıt´ı. Taxonomie se vyuˇz´ıvaj´ı pro zamˇeˇren´ı pozornosti nebo upˇresnˇen´ı hierarchie mezi hypot´ezami. V prvn´ım pˇr´ıpadˇe odstraˇ nuje nadbyteˇcn´e hypot´ezy, v druh´em pˇr´ıpadˇe m˚ uˇzeme pˇreskoˇcit vykon´av´an´ı nˇekter´ ych uzl˚ u, u nichˇz m˚ uˇzeme odhadnout v´ ysledek z jin´eho v´ ysledku. 3.6.1
Zamˇ eˇ ren´ı pozornosti
Pokud m´ame nˇejak´e doplˇ nkov´e informace o konzultovan´em probl´emu, m˚ uˇzeme je vyuˇz´ıt k zamˇeˇren´ı pozornosti na nˇejak´ y seznam hypot´ez podle taxonomie. Tento postup n´am m˚ uˇze sn´ıˇzit poˇcet dotaz˚ u kladen´ ych uˇzivateli a zkr´atit dobu konzultace. [17] 3.6.2
Hierarchick´ e z´ avislosti
Tento typ taxonomie m˚ uˇze b´ yt vyuˇz´ıv´an v pr˚ ubˇehu konzultace. Odpovˇed’ na jednu ot´azku n´am m˚ uˇze poskytnou odpovˇedi i na jin´e ot´azky. Napˇr. pokud jistˇe v´ıme, ˇze je objekt ˇselma koˇckovit´a, pak je i savec, zv´ıˇre atd. [17]
10
4
Biomedic´ınsk´ e sign´ aly
Biomedic´ınsk´e sign´aly se liˇs´ı podle typu sign´alu, kter´ y sn´ımaj´ı. Existuj´ı elektrick´e, magnetick´e, impedanˇcn´ı, akustick´e, mechanick´e a chemick´e. V t´eto pr´aci se budeme zab´ yvat pouze elektrick´ ymi sign´aly a to konkr´etnˇe EEG, EMG, ECG a EOG. Elektrick´e sign´aly lidsk´eho tˇela (elektrick´e biosign´aly) jsou generov´any nervov´ ymi a svalov´ ymi buˇ nkami a jsou v´ ysledkem elektrochemick´ ych proces˚ u uvnitˇr bunˇek a mezi buˇ nkami. Biosign´aly slouˇz´ı v biologii a l´ekaˇrstv´ı k vyj´adˇren´ı informac´ı o sledovan´em biologick´em syst´emu – lidsk´em organismu. Elektrick´e biosign´aly lze sn´ımat ploˇsn´ ymi elektrodami na povrchu tˇela. [6] [4]
4.1
EEG
Elektroencefalograf sn´ım´a elektrickou aktivitu mozku z povrchu hlavy. U EEG se zaznamen´av´a zmˇena hodnoty amplitudy sign´alu v ˇcase. V EEG se objevuj´ı r˚ uzn´e frekvence. Klinicky v´ yznamn´e jsou tyto 4 p´asma: Delta (0 - 4 Hz), Th´eta (4 - 8 Hz), Alfa (8 - 13 Hz) a Beta (13 - 30 Hz). Alfa vlny se objevuj´ı, pokud m´a pacient zavˇren´e oˇci. A to pˇredevˇs´ım na zadn´ıch kan´alech. Pomoc´ı mˇeˇren´ı EEG sign´alu se daj´ı rozpoznat r˚ uzn´e onemocnˇen´ı jako: astmatick´ y z´achvat, n´ador mozku, ˇci porucha sp´anku. Poruchy sp´anku se mohou projevovat r˚ uznˇe, od nemoˇznosti usnout, pˇres n´amˇes´ıˇcnost, aˇz po sp´ankovou apnoi, kdy pacient i nˇekolik vteˇrin ned´ ych´a. EEG sign´al se v´ yraznˇe mˇen´ı s vˇekem pacienta.
Obr´azek 5: Uk´azka u´seku EEG z´aznamu Rozloˇzen´ı elektrod po povrchu hlavy je rovnomˇernˇe rozdˇelen´e, aby zachytily co nejv´ıce elektrick´ ych sign´al˚ u. Na obr. 5 je uk´azka mˇeˇren´ı , kter´e mˇelo vyuˇzit´e kan´aly (Fp1, Fp2, 11
A, O2, O1, F7, Fz, T3, F8, Cz, T4, T5, T6). Toto rozloˇzen´ı kan´al˚ u se naz´ yv´a 10/20 [5], nebot’ elektrody jsou od sebe vzd´aleny 10 - 20 - 20 - 20 - 20 - 10% z jej´ı celkov´e d´elky. Existuj´ı i jin´a rozloˇzen´ı, ale ta maj´ı jin´ y poˇcet kan´al˚ u. Kan´aly jsou pojmenov´any podle poˇca´teˇcn´ıch p´ısmen latinsk´eho pojmenov´an´ı oblast´ı mozku, nad kter´ ymi jsou um´ıstˇeny. Fp - frontpol´arn´ı, F - front´aln´ı, P - parit´aln´ı, T - tempor´aln´ı, O - okcipit´aln´ı a C - centr´aln´ı. Lich´ aˇ c´ısla se nach´azej´ı nad levou hemisf´erou a sud´ aˇ c´ısla nad pravou. Jednotliv´e elektrody se rozdˇeluj´ı na dvˇe skupiny: exploraˇcn´ı a referenˇcn´ı. Jsou tu dvˇe hlavn´ı moˇznosti zapojen´ı: referenˇcn´ı a bipol´arn´ı. U Referenˇ cn´ıho zapojen´ı je exploraˇcn´ı elektroda mˇeˇrena proti referenˇcn´ı elektrodˇe. Toto ˇreˇsen´ı je velice jednoduch´e, pokud se zvol´ı spr´avnˇe referenˇcn´ı elektroda. Nejˇcastˇeji se pouˇz´ıv´a referenˇcn´ı elektrody um´ıstˇen´e na uˇs´ıch pacienta, nebo vytvoˇren´ım referenˇcn´ı elektrody pomoc´ı zpr˚ umˇerov´an´ı sign´alu ze vˇsech eletrod. Bipol´ arn´ı je zapojen´ı p´arov´e. Vˇsechny elektrody jsou zapojeny v p´aru a jsou mˇeˇreny proti sobˇe. Nen´ı jeden referenˇcn´ı svod, proti kter´emu by mˇeˇrily vˇsechny elektrody, jako je to u referenˇcn´ıho zapojen´ı. V´ yhodou t´eto metody je pˇresnost lokalizace loˇziska.
Obr´azek 6: Rozloˇzen´ı elektrod pˇri mˇeˇren´ı EEG
4.2
EKG
Electrokardiograf (EKG) sn´ım´a elektrickou aktivitu srdce z povrchu tˇela. Standartizovan´e mˇeˇren´ı se prov´ad´ı pomoc´ı 12-ti svodov´eho EKG mˇeˇren´ı, nebo holtru, kter´ y v´am dok´aˇze mˇeˇrit srdeˇcn´ı aktivita po cel´ y den. Na v´ ysledn´em sign´alu je pops´ano 5 f´az´ı, kter´e se znaˇc´ı P, Q, R, S a T. Nejv´ yraznˇejˇs´ı je R f´aze, pomoc´ı n´ıˇz se vypoˇc´ıt´a tep. Zjist´ı se ˇspiˇcka 12
ˇspiˇcka za ˇcas a pˇrevede se na jednu minutu.
4.3
EMG
Electromyograf(EMG) sn´ım´a elektrickou aktivitu sval˚ u z povrchu tˇela, nebo pˇr´ımo ze sval˚ u. U sp´ankov´ ych z´aznam˚ u se tato aktivita mˇeˇr´ı na bradˇe pacienta. [2]
4.4
EOG
Electrookulograf (EOG) sn´ım´a elektrickou aktivitu z povrchu hlavy (okolo oˇc´ı). Pouˇz´ıv´a se r˚ uzn´e uspoˇra´d´an´ı podle poˇctu pouˇzit´ ych kan´al˚ u. Okolo obliˇceje se um´ıst´ı 1, 2, nebo 4 elektrody. Oˇcn´ı pohyby jsou d˚ uleˇzit´e pro spr´avnou detekci sp´ankov´e f´aze REM, nebo probuzen´ı pacienta. [2]
4.5
PSG
Polysomnografie (PSG) je simult´aln´ı z´aznam nˇekolika tˇelesn´ ych funkc´ı organismu prov´adˇen´ y bˇehem sp´anku. Na obr. 7 je uk´azka PSG z´aznamu bez EEG kan´al˚ u. Kan´aly na obr. 7 jsou v tomto poˇrad´ı EKG, 2xEOG, 3xEMG. Na prvn´ı pohled je vidˇet, ˇze EKG sign´al je nejjasnˇeji definovateln´ y. Nav´ıc je to sign´al, kter´ ym se l´ekaˇri zaj´ımaj´ı nejd´ele. [2]
Obr´azek 7: Uk´azka ostatn´ıch biologick´ych sign´al˚ u
13
5
Sp´ anek
Norm´aln´ı lidsk´ y sp´anek je rozdˇelen na dvˇe z´akladn´ı f´aze NREM (f´aze bez rychl´ ych oˇcn´ıch pohyb˚ u z angl. non-rapid eye movement) a REM (f´aze rychl´ ych oˇcn´ıch pohyb˚ u z angl. rapid eye movement). [2]
5.1
REM
REM f´aze tvoˇr´ı 20-25% sp´anku. Prvn´ı REM f´aze pˇr´ıch´az´ı asi 60-90 minut po usnut´ı. EEG bˇehem REM f´aze ukazuje tzv. pomal´e delta vlny (1-2 Hz). Je doprov´azen´e n´ızk´ ym napˇet´ım. Na z´akladˇe mˇeˇren´ı EEG, EOG a EMG m˚ uˇzeme REM f´azi rozdˇelit na dvˇe f´aze tonic a phasic. • Pro tonic f´azi je charakteristick´e desynchronizace EEG, ochablost sval˚ u a potlaˇcen´ı monosynaptick´eho a polysynaptick´eho reflexu. • V phasic f´azi se objevuj´ı rychl´e oˇcn´ı pohyby vˇsemi smˇery, spojen´e s v´ ykyvy tlaku, zmˇenou srdeˇcn´ı frekvence, pohyby jazykem a nepravideln´ ym d´ ych´an´ım. Na EEG se zobrazuj´ı pilovit´e vlny s frekvenc´ı v rozmez´ı theta vln. Bˇehem REM sp´anku m˚ uˇze doj´ıt k nˇekolika apnoe (z´astava dechu) nebo hypopnoe (mˇelk´e d´ ych´an´ı). [2] [14]
5.2
NREM
NREM se d´ale dˇel´ı na dalˇs´ı 4 stupnˇe (1, 2, 3 a 4, viz. obr. 8), kde stupnˇe 3 a 4 odpov´ıdaj´ı hlubok´emu sp´anku. V cel´e NREM f´azi str´av´ıme 75-80% doby sp´anku. V 1. stupni NREM f´aze sp´anku str´av´ıme pˇribliˇznˇe 3-8% z celkov´eho sp´ankov´eho ˇcasu. Stupeˇ n 1 se nejˇcastˇeji vyskytuje pˇri pˇrechodu mezi bdˇelost´ı a dalˇs´ım stupnˇem sp´anku nebo n´asleduje po probuzen´ı. V prvn´ım stupni sp´anku se na elektroencefalografu (EEG) objevuje Alfa aktivita (8-13 Hz), kter´a je typick´a pro bdˇelost, sniˇzuje. Nejvyˇsˇs´ı amplituda se pˇresune do oblasti Theta (4-8 Hz). Elektromyogram (EMG) mˇeˇr´ı sn´ıˇzenou aktivitu a elektrookulogram (EOG) ukazuje pomal´e krouˇzen´ı oˇc´ı. Vertex ostr´e vlny (50 aˇz 200 ms) nastupuj´ı smˇerem ke konci 1. stupnˇe NREM sp´anku. 2. stupeˇ n NREM f´aze sp´anku zaˇc´ın´a pˇribliˇznˇe 10-12 min po 1. stupni NREM sp´anku a zahrnuje 45-55% z celkov´eho sp´ankov´eho ˇcasu. Charakteristick´e EEG n´alezy druh´eho stupnˇe NREM f´aze sp´anku jsou sp´ankov´a vˇret´enka a K-komplexy. Sp´ankov´e vˇret´enko je pops´ano 12-14 Hz trv´a nejm´enˇe 0,5 s a tvarem pˇripom´ın´a vˇreteno. K-komplex je grafoelement, kter´ y obsahuje dvˇe sloˇzky: negativn´ı vlnu n´asledovan´a kladnou vlnou, trval´e ˇ v´ıce neˇz 0,5 s. V tomto stupni sp´anku se objevuj´ı delta vlny (0,5-4 Hz). Cinnost EMG je sn´ıˇzena ve srovn´an´ı s bdˇelost´ı.
14
3. a 4. stupeˇ n NREM f´aze sp´anku pˇredstavuje 15-20% z celkov´e doby sp´anku. Pro tˇret´ı stupeˇ n je charakteristick´ y menˇs´ı poˇcet vysok´ ych ˇspiˇcek a pomal´a vlnov´a ˇcinnost. Narozd´ıl od ˇctvrt´eho stupnˇe, kde se vyskytuje velk´e mnoˇzstv´ı vysok´ ych ˇspiˇcek. EOG neregistruje ˇza´dn´e oˇcn´ı pohyby od druh´eho do ˇctvrt´eho stupnˇe NREM f´aze sp´anku. [2] [14]
Obr´azek 8: EEG z´aznam pro jednotliv´e NREM f´aze sp´anku u mlad´eho dospˇel´eho ˇclovˇeka, ˇsipka ukazuje na K-komplex [3]
5.3
Hypnogram
Hypnogram je souˇc´ast´ı polysomnografie (PSG), v´ıce parametrick´eho testu, kter´ y se zab´ yv´a diagnostikou sp´ankov´ ych poruch a sp´ankem samotn´ ym. Jedn´a se o graf z´avislosti f´aze sp´anku na ˇcase (viz. obr. 9). Pro ˇclovˇeka je sp´anek velice d˚ uleˇzit´ y. Aby splnil sp´anek sv˚ uj u ´ˇcel, mus´ı obsahovat nˇekter´e f´aze. Poˇzadavky ˇclovˇeka se s vˇekem mˇen´ı. Jin´ y hypnogram bude m´ıt 70 let´ y ˇclovˇek a jin´ y roˇcn´ı d´ıtˇe. D´ale se hypnogramy m˚ uˇzou dˇelit dle standardu, kter´ y zobrazuj´ı (viz. kapitola 5.4). Sp´anek zaˇc´ın´a kr´atkou periodou NREM f´aze 1. stupnˇe, d´ale postupuje do druh´eho, n´asledov´an 3 a 4. Na konec doraz´ı do REM f´aze. Nicm´enˇe v t´eto f´azi nez˚ ustane po zbytek noci, ale sp´ıˇse se stˇr´ıdaj´ı NREM a REM f´aze po celou noc (viz. obr. 9). D´elka prvn´ıho cyklu je 70-100 minut, druh´ y a vˇsechny n´asleduj´ıc´ı cykly trvaj´ı d´ele, 90-120 minut. U zdrav´ ych dospˇel´ ych jedinc˚ u se s postupem noci prodluˇzuj´ı REM f´aze, nejdelˇs´ı jsou v posledn´ı
15
tˇretinˇe sp´ankov´eho cyklu. S postupem sp´anku se u NREM f´aze objevuje pouze druh´ y stupeˇ n, stupnˇe 3 a 4 u ´plnˇe zmiz´ı. [3]
Obr´azek 9: Popis f´az´ı sp´anku u mlad´eho dospˇel´eho ˇclovˇeka [3]
5.4
Sk´ orovac´ı syst´ emy
Sk´orovac´ı syst´emy se vyuˇz´ıvaj´ı k ohodnocen´ı r˚ uzn´ ych f´az´ı sp´anku (viz. kapitola 5). Kaˇzd´a f´aze m´a sv´e specifick´e prvky a nav´ıc m´a i r˚ uzn´ y vliv na ˇclovˇeka. Vˇsechny f´aze jsou bˇehem noci potˇrebn´e. 5.4.1
Historie sk´ orovac´ıch syst´ em˚ u
Kdyˇz lid´e zaˇcali zaznam´enavat sp´ankov´e EEG, vˇsimli si u ´stupu alfa vln, K-komplex˚ u a dalˇs´ıch zmˇen. Zaˇcali sp´anek rozdˇelovat do 5 f´az´ı (A-E). V roce 1957 p´anov´e Kleitman a Dement [7] pˇripojili k EEG i EOG a poprv´e zaznamenali REM f´azi. N´aslednˇe sp´anek hodnotili tˇemito 6 f´azemi (A-E a REM). [15] 5.4.2
Rechtschaffen and Kale
V roce 1968 p´anov´e Rechtschaffen a Kale [8] sepsali pravidla pro hodnocen´ı jednotliv´ ych f´az´ı sp´anku, kter´ y rozdˇeloval sp´anek na W (vzh˚ uru z angl. wakefulness), 1-4 stupnˇe NREM a REM f´aze. D´ale zavedli standarty na sn´ım´an´ı sp´ankov´eho EEG. Pouˇzit´ı minim´alnˇe jednoho svodu C3 nebo C4 spolu s EOG na obou oˇc´ıch. Doporuˇcovali rozdˇelen´ı EEG z´aznamu na 30 vteˇrinov´e u ´seky, p˚ uvodnˇe z technick´eho hlediska, aby st´ıhali tisk´arny. N´aslednˇe kaˇzd´ ym 30 vteˇrin´am pˇridˇelili jednu f´azi, pokud se v jedn´e periodˇe vyskytovaly znaky dvou r˚ uzn´ ych f´az´ı, oznaˇcilo se to jako ta, co m´a tˇechto znak˚ u v´ıce. [15]
16
5.4.3
AASM
V roce 2004 se American Academy of Sleep Medicine (AASM) rozhodla sestavit nov´ y sp´ankov´ y bodovac´ı syst´em, kter´ y nahrad´ı p˚ uvodn´ı syst´em. Stanoven´ı pravidel se drˇzelo tˇechto z´asad: b´ yt v souladu s potvrzen´ ymi z´avˇery, b´ yt zaloˇzeny na biologick´ ych principech, pouˇziteln´e pro diagnostiku norm´aln´ıho i abnorm´aln´ıho sp´anku a b´ yt snadno pouˇziteln´a pro vˇedce, techniky i l´ekaˇre. V roce 2007 byl vyd´an nov´ y standart hodnocen´ı sp´ankov´ ych f´az´ı. Hlavn´ımi zmˇenami jsou: • Moˇznost pouˇzit´ı v´ıce pˇredn´ıch svod˚ u u EEG, starˇs´ı syst´em dovoloval pouze jeden pˇredn´ı svod. • Doˇslo ke slouˇcen´ı 3 a 4 stupnˇe u NREM f´aze, nebot’ mezi nimi nebyly zjistˇeny ˇza´dn´e rozd´ıly. Nov´ y AASM bodovac´ı syst´em rozliˇsuje W (vzh˚ uru), N1-N3 (3 NREM stupnˇe) a REM f´azi. [15] V roce 2008 EU vytvoˇrila studii s 72 pacienty, kter´e nechali ohodnotit sp´ankov´ y cyklus AASM a R and K syst´emy. Celkov´a schoda u AASM byla 82% oproti 80,6% u R and K. Nov´ y syst´em vyhodnocov´an´ı pˇrinesl zlepˇsenou detekci vˇsech f´az´ı sp´anku. V´ ysledky t´eto studie potvrzuj´ı, ˇze vylepˇsen´ı hodnot´ıc´ıho syst´emu bylo u ´spˇeˇsn´e. [13]
Obr´azek 10: Srovn´an´ı u´spˇeˇsnosti hodnocen´ı dvou sk´orovac´ıch syst´em˚ u [13]
17
6
WEKA
Weka patˇr´ı k nejrozˇs´ıˇrenˇejˇs´ım program˚ um strojov´eho uˇcen´ı. Poch´az´ı z Waikaksk´e univerzity na Nov´em Z´elandu (Waikato Environment for Knowledge Analysis) a proto tento n´azev. Umoˇzn ˇuje snadn´e a rychl´e sestaven´ı rozhodovac´ıch strom˚ u, kter´e by jinak byly jen tˇeˇzko ruˇcnˇe sestaviteln´e, nad obrovk´ ym mnoˇzstv´ım dat. [12]
6.1
ARFF
Weka pracuje s daty v ARFF form´atu, kter´ y se skl´ad´a ze dvou ˇca´st´ı, hlaviˇcky a dat. V hlaviˇcce se nach´az´ı definice vˇsech promˇen´ ych, kter´e jsou pouˇzity spoleˇcnˇe s hodnotou, kter´e mohou nab´ yvat.
Obr´azek 11: Uk´azka hlaviˇcky ARFF form´atu N´aslednˇe v datov´e ˇc´asti je na kaˇzd´em ˇra´dku jedna hodnota pro jednu promˇenou. Poˇcet ˇra´dk˚ u zavis´ı na poˇctu segment˚ u.
Obr´azek 12: Uk´azka dat ARFF form´atu
6.2
Rozhodovac´ı stromy
Jednou z funkc´ı Weky je sestaven´ı rozhodovac´ıho stromu. Jeden z pˇr´ıznak˚ u oznaˇc´ıme jako tˇr´ıdu, podle kter´e se budeme snaˇzit rozdˇelit dan´a data. Program si rozdˇel´ı celou mnoˇzinu dat na dvˇe ˇca´sti, tr´enovac´ı a testovac´ı. Pomoc´ı vstupn´ıch parametr˚ u m˚ uˇzeme upˇresnit rychlost vˇetven´ı a minim´aln´ı poˇcet prvk˚ u ve v´ ysledn´ ych uzlech. T´ım mˇen´ıme celkovou velikost stromu. Tr´enovac´ı mnoˇzina by mˇela odpov´ıdat asi jedn´e tˇretinˇe dat, jinak bude 18
v´ ysledek negativnˇe ovlivnˇen. Pokud by jsme pouˇzili v´ıce tr´enovac´ıch dat, strom bude moc konkr´etn´ı a na dalˇs´ım pˇr´ıkladu nebude pouˇziteln´ y. Samotn´a Weka obsahuje mnoho r˚ uzn´ ych typ˚ u rozhodovac´ıch strom˚ u podrobnˇejˇs´ı informace se daj´ı nal´ezt v kapitole 11.
Obr´azek 13: Uk´azka rozhodovac´ıho stromu. Na obr. 13 je vidˇet u ´k´azkov´ y rozhodovac´ı strom. C´ılem tohoto stromu je rozhodnout, zda p˚ ujdeme ven, nebo z˚ ustaneme doma. Poˇca´teˇcn´ı uzel je ot´azka: ”Jak vypad´a obloha?”. Odpovˇedi mohou b´ yt tˇri: je jasno, je zataˇzeno, prˇs´ı. Pokud je jasno, tak strom pokraˇcuje dalˇs´ı ot´azkou tentokr´at na vlhkost vzduchu. Pokud je vlhkost nad 75% z˚ ustaneme doma (odpovˇed’ je NO, nep˚ ujdeme ven), atd.
6.3
Selekce pˇ r´ıznak˚ u
Dalˇs´ı funkce slouˇz´ı k ohodnocen´ı jednotliv´ ych pˇr´ıznak˚ u, podle uˇziteˇcnosti k rozdˇelen´ı na spr´avn´e tˇr´ıdy. Tato metoda je bohuˇzel dost konkr´etn´ı, takˇze u kaˇzd´eho mˇeˇren´ı se pohybuj´ı mezi nejl´epe hodnocen´ ymi trochu jin´e pˇr´ıznaky. V´ıce informac´ı je uvedeno na [11].
19
7
ROC kˇ rivka a jej´ı parametry
ROC anal´ yza hraje v dneˇsn´ı dobˇe v´ yznamnou roli v l´ekaˇrstv´ı pˇri diagnostice. K sestaven´ı ROC kˇrivky je vyuˇzito bin´arn´ı klasifikace, kter´a se zab´ yv´a rozdˇelen´ım dan´e mnoˇziny objekt˚ u na z´akladˇe pˇr´ıtomnosti, ˇci nepˇr´ıtomnosti urˇcit´e vlastnosti, napˇr´ıklad pˇri testov´an´ı, zda pacient trp´ı, ˇci netrp´ı urˇcitou nemoc´ı. ROC kˇrivka zachycuje vztah mezi specificitou a senzitivitou, kter´e patˇr´ı k nejd˚ uleˇzitˇejˇs´ım parametr˚ um pro hodnocen´ı a grafick´e zn´azornˇen´ı rozhodovac´ıch pravidel. Grafem ROC kˇrivky je dvourozmˇern´ y graf, kde na osu x nan´aˇs´ıme pravdˇepodobnost ˇspatn´eho zaˇrazen´ı objekt˚ u, kter´e jsou ve skuteˇcnosti negativn´ı (1 - Specificita), a na osu y pravdˇepodobnost spr´avn´eho zaˇrazen´ı pozitivn´ıch objekt˚ u (Senzitivita), napˇr´ıˇc vˇsem moˇzn´ ym dˇel´ıc´ım bod˚ um. Pro kaˇzdou hodnotu dostaneme pr´avˇe jeden bod na ROC kˇrivce. V´ ysledkem je funkce, kter´a popisuje ROC kˇrivku (viz. obr. 15). D´ale sestav´ıme tzv. matici z´amˇen (viz. obr. 14). Tato matice je tvoˇrena 2 sloupci a 2 ˇra´dky. [18]
Obr´azek 14: Matice z´amˇen Oznaˇcen´ı pouˇzit´a v tabulce na obr.14: • TP - (z angliˇctiny True Positive) - jedinci, kteˇr´ı jsou ve skuteˇcnosti pozitivn´ı a klasifikaˇcn´ı pravidlo je zaˇradilo mezi pozitivn´ı • FN - (z angliˇctiny False Negavite) - jedinci, kteˇr´ı jsou ve skuteˇcnosti pozitivn´ı avˇsak klasifikaˇcn´ı pravidlo je zaˇradilo mezi negativn´ı • FP - (z angliˇctiny False Positive) - jedinci, kteˇr´ı jsou ve skuteˇcnosti negativn´ı avˇsak klasifikaˇcn´ı pravidlo je zaˇradilo mezi pozitivn´ı • TN - (z angliˇctiny True Negative) - jedinci, kteˇr´ı jsou ve skuteˇcnosti negativn´ı a klasifikaˇcn´ı pravidlo je zaˇradilo mezi negativn´ı K vytvoˇren´ı t´eto matice u ˇreˇsen´ı, kter´e obsahuje 3 a v´ıce tˇr´ıd, je potˇreba pouˇzit´ı mal´eho triku. Vytvoˇr´ıme stejn´ y poˇcet matic, jako je poˇcet tˇr´ıd a pokaˇzd´e oznaˇc´ıme jednu tˇr´ıdu jako TP, pokud je segment z t´eto tˇr´ıdy spr´avnˇe oznaˇcen´ y. A zbyl´e, kter´e jsou tak´e 20
spr´avnˇe oznaˇc´ıme TF. N´aslednˇe spoˇc´ıt´ame pr˚ umˇern´e v´ ysledky ze vˇsech matic, v´ ysledek n´am d´a v´ yslednou matici, kterou pouˇzijeme. Parametry [18]: • Senzitivita vyjadˇruje pravdˇepodobnost, ˇze test d´a kladn´ y v´ ysledek u pozitivn´ıho objektu. TPF (z angliˇctiny True Positive Fraction), neboli relativn´ı ˇcetnost spr´avnˇe klasifikovan´ ych pozitivn´ıch pˇr´ıpad˚ u. TP TP + FN
TPF =
(1)
• Specificita vyjadˇruje pravdˇepodobnost, ˇze test d´a z´aporn´ y v´ ysledek u negativn´ıho v´ ysledku. TNF (z angliˇctiny True Negative Fraction), neboli relativn´ı ˇcetnost spr´avnˇe klasifikovan´ ych negativn´ıch pˇr´ıpad˚ u.
T NF =
TN FP + TN
(2)
• AUC (viz. obr. 15) (z angliˇctiny Area Under Curve), neboli plocha pod ROC kˇrivkou je nejbˇeˇznˇejˇs´ı kvantitativn´ı index popisuj´ıc´ı ROC kˇrivku. Vhodn´ y k porovn´an´ı dvou ROC kˇrivek, kdy celou ROC kˇrivku zredukuje do jedn´e veliˇciny. Jelikoˇz je AUC ˇca´st jednotkov´eho ˇctverce, jeho hodnota bude vˇzdy mezi 0 a 1. Z AU C =
1
ROC(p)dp 0
Obr´azek 15: Graf popisuj´ıc´ı plochu pod kˇrivkou
21
(3)
ˇ sen´ı Reˇ
8 8.1
Navrˇ zen´ a metodologie
Na obr. 16 m˚ uˇzeme vidˇet pouˇzit´ y postup pˇri z´ısk´av´an´ı pravidel. Z p˚ uvodn´ıho PSG si pomoc´ı PSGLabu nech´ame napoˇc´ıtat r˚ uzn´e pˇr´ıznaky sign´alu. Pomoc´ı programu WEKA a l´ekaˇrsk´ ych knih budou sestaveny z´akladn´ı pravidla, kter´a budou aplikov´ana v aplikaci Fel Ex Expert.
Obr´azek 16: Zp˚ usob sestaven´ı pravidel Kaˇzd´e dalˇs´ı spuˇstˇen´ı programu, uˇz tyto pravidla nebude generovat, ale pouze aplikovat. Pomoc´ı PSGLabu si nech´ame opˇet spoˇc´ıtat pˇr´ıznaky zadan´eho sign´alu, kter´e slouˇz´ı jako vstupn´ı datab´aze pro program Fel Ex Expert. V´ ystupem programu bude hypnogram, kter´ y je z´aznamem sp´anku s rozliˇsen´ım jednotliv´ ych sp´ankov´ ych f´az´ı. Na obr. 17 je hypnogram uveden v bloku Java GUI - vykreslen´ı grafu.
Obr´azek 17: Blokov´e sch´ema navrˇzen´e metodologie Z obr. 17 a obr. 18 je vidˇet, ˇze navrˇzen´a metodologie syst´emu by mohla b´ yt uplatnˇena i na typovˇe rozd´ıln´e u ´lohy. Syst´em by byl naprosto schodn´ y, kromˇe bloku v´ ybˇer dotaz˚ u (neboli Ontologie). Tento blok by musel b´ yt nahrazen novou sadou dotaz˚ u a pravidel, vytvoˇren´ ych podle poˇzadavk˚ uu ´lohy. 22
Obr´azek 18: Blokov´e sch´ema expertn´ıho syst´emu, kter´y bude diagnostikovat sp´ankov´e poruchy uˇz z hotov´eho hypnogramu. V kapitole 10 jsme tuto variantu netestovali.
Nebot’ nˇekter´e sp´ankov´e f´aze si jsou velice podobn´e a v ˇradˇe pˇr´ıpad˚ u se ani neurologov´e neshodnou na jeho hodnocen´ı. Proto jsme sjednotili 4 f´aze do dvou a p˚ uvodn´ı poˇcet ˇsesti r˚ uzn´ ych f´az´ı sn´ıˇzili na 4. Doˇslo ke slouˇcen´ı NREM1 a NREM2 do jedn´e f´aze NREM1-2 a NREM3 a NREM4 na NREM3-4. Obˇe tyto dvojice jsou si velice podobn´e a je dost obt´ıˇzn´e je odliˇsit. Kaˇzd´ y odvozen´ y pˇr´ıznak EEG sign´alu je ohodnocen jedn´ım ˇc´ıslem v rozmez´ı 0-1. K vytvoˇren´ı t´eto hodnoty m´a kaˇzd´ y pˇr´ıznak svoj´ı specifickou funkci. Tento nanormovan´ y pˇr´ıznak je vstupn´ı hodnota, kter´a ovlivn´ı hodnotu v´ ystupn´ıch stav˚ u s kter´ ymi je sv´az´ana.
8.2
Pouˇ zit´ a data
V t´eto pr´aci byly pouˇzity dva typy dat, l´ekaˇrsk´e EEG z´aznamy a laboratorn´ı data. Vˇsechna data, kter´a byla k dispozici, byla typu EaSys (”*.D”). 8.2.1
Klinick´ a data
K experiment˚ um jsme mˇeli k dispozici sp´ankov´e EEG z´aznamy. Tyto z´aznamy byly mˇeˇreny v nemocnici Na Bulovce a psychiatrick´e l´eˇcebnˇe Bohnice. Z´ıskali jsme 25 EEG z´aznam˚ u mˇeˇren´ ych v noci na zdrav´ ych pacientech. Z´aznamy jsou od 5 do 9 hodin dlouh´e a vzorkovac´ı frekvence je 250 Hz. Z´aznamy obsahuj´ı 10 EEG kan´al˚ u, 1-2 EOG kan´aly, 1-2 EMG kan´aly, ECG kan´al, dechov´ y z´aznam a saturace krve kysl´ıkem (Sp02). Vˇsechny z´aznamy byly ohodnoceny neorology a byly oznaˇceny po 30 vteˇrinov´ ych u ´sec´ıch. [10]
23
8.2.2
Laboratorn´ı data
Druh´a sada z´aznam˚ u jsou data, vytvoˇren´a pro potˇreby t´eto u ´lohy. Tyto z´aznamy byly namˇeˇreny v laboratoˇri skupiny Biodat (Katedra Kybernetiky, Elektrotechnick´a Fakulta, ˇ CVUT). Data maj´ı d´elku 50-60 s a obsahuj´ı pouze EEG kan´aly. Jsou na nich u ´myslnˇe zaznamen´any dva artefakty (svalov´a aktivita a mrknut´ı).
8.3
Metody pˇ redzpracov´ an´ı dat
Z kaˇzd´eho PSG sign´alu bylo napoˇc´ıt´ano pˇres 120 r˚ uzn´ ych pˇr´ıznak˚ u, kter´e jsme si nechali vyexportovat do ARFF form´atu. Tyto pˇr´ıznaky jsou pops´any v disertaˇcn´ı pr´aci [10]. Jeden sp´ankov´ y z´aznam obsahuje pˇribliˇznˇe 20 kan´al˚ u (16x EEG, EOG, EMG, ECG) s pr˚ umˇernou d´elkou pˇres 8 hodin. A proto je vstupn´ı sada dat obrovsk´a. Z tohoto d˚ uvodu vyplynulo pouˇzit´ı segmentace na 30 vteˇrinov´e u ´seky. V´ ysledkem je matice pˇribliˇznˇe o 960 ˇra´dc´ıch a 2400 sloupc´ıch. Kaˇzd´ y ˇra´dek odpov´ıd´a jednomu segmentu (8 hodin x 60 minut x 2 segmenty v jedn´e minutˇe = 960 ˇra´dk˚ u). Sloupce jsou spoˇc´ıtan´e pˇr´ıznaky vˇsech kan´al˚ u v dan´em segmentu (120 pˇr´ıznak˚ u x 20 kan´alu = 2400 sloupc˚ u). PSGLab [9], kter´ y je pouˇz´ıv´am pˇri v´ ypoˇctu jednotliv´ ych pˇr´ıznak˚ u, zvl´ad´a i adaptivn´ı segmentaci, kter´a rozdˇeluje sign´al na u ´seky r˚ uzn´e d´elky. Snahou je, aby v kaˇzd´em segmentu byl sign´al, co nejv´ıce stacion´arn´ı. T´ımto by se ale zvˇetˇsil poˇcet ˇr´adk˚ u a spoleˇcnˇe s faktem, ˇze vˇsichni doktoˇri, kteˇr´ı z´aznamy hodnot´ı, pouˇz´ıvaj´ı tak´e 30 vteˇrinov´e rozdˇelen´ı, tak jsme z˚ ustali u t´eto varianty. Z´aroveˇ n tak´e m˚ uˇzeme vyuˇz´ıt ohodnocen´e z´aznamy samotn´ ymi l´ekaˇri. Po proveden´ı tˇechto experiment˚ u jsme doˇsli k z´avˇeru, ˇze hodnocen´ı sp´anku bude v´ yraznˇe sloˇzitˇejˇs´ı u ´lohou, neˇz by se zd´alo z p˚ uvodn´ı l´ekaˇrsk´e literatury. Nebot’ hlavn´ım c´ılem t´eto pr´ace je vyzkouˇsen´ı pr´ace expertn´ıho syst´em˚ u pro zpracov´an´ı PSG sign´al˚ u, rozhodli jsme se zjednoduˇsit u ´lohu a splnit tento c´ıl. Pˇreˇsli jsme tedy k detekci artefakt˚ u v EEG sign´alu. Byly namˇeˇreny kr´atk´e z´aznamy, o d´elce 50-60 sekund. Na tˇechto z´aznamech byly mˇeˇreny pouze EEG kan´aly. Pro jednoduchost jsme se rozhodli detekovat pouze dva artefakty, mrknut´ı a svalovou aktivitu. Tˇret´ı stav, kter´ y je vˇzdy mezi tˇemito dvˇema, je klidov´ y stav s otevˇren´ yma oˇcima. Na obr. 19 je vidˇet, ˇze kan´aly mohou m´ıt sv´e pr˚ ubˇehy velice rozd´ıln´e, napˇr´ıklad na kan´alech Fp1 a Fp2 se mrknut´ı projev´ı ˇspiˇckou smˇerem dol˚ u, ale na vˇsech ostatn´ıch ˇspiˇckou smˇerem nahoru. Pˇr´ıprava vstupn´ı datab´aze na konzultaci s programem Fel Ex Expert nen´ı nejjednoduˇsˇs´ı, nebot’ jsme nechtˇeli 18x spouˇstˇet program nad skoro stejn´ ymi daty a n´aslednˇe zpracov´avat 18 v´ ysledk˚ u do jednoho. Vyuˇzili jsme funkce psglab averaging signals.m, kter´a spoˇc´ıt´a pr˚ umˇer pˇres vybran´e elektrody a v´ ysledek uloˇz´ı jako dalˇs´ı kan´al. Na obr. 6 je vidˇet rozloˇzen´ı jednotliv´ ych kan´al˚ u po povrchu hlavy mˇeˇren´e osoby. Tento kan´al m´a oznaˇcen´ı MEAN a pomoc´ı PSGLabu spoˇc´ıt´ame vhodn´e pˇr´ıznaky pouze u toho kan´alu
24
Obr´azek 19: Uk´azka EEG z´aznamu s artefakty. Jednotliv´e artefakty jsou oznaˇceny: OO(Otevˇren´e oˇci), MR(Mrknut´ı) a SA(Svalov´ a aktivita). Znaˇcky jsou um´ıstˇeny na horn´ım ˇr´adku, kan´al Fp1.
a v´ ysledky pouˇzijeme jako vstupn´ı hodnoty do aplikace Fel Ex Expert. N´aslednˇe srovn´ame v´ ysledky dosaˇzen´e s nov´ ym kan´alem a nˇekter´ ym z p˚ uvodn´ıch. Protoˇze pr˚ umˇerov´an´ı sign´alu u EEG nen´ı vhodn´a varianta sluˇcov´an´ı, m˚ uˇze doj´ıt k vyruˇsen´ı a v´ ysledn´a informace se ztrat´ı. Pro tento typ u ´loh by bylo moˇzn´e pouˇz´ıt PCA anal´ yzu (anal´ yza hlavn´ıch komponent). Vstupn´ı datab´aze pro program Fel Ex Expert mus´ı odpov´ıdat form´atov´an´ı, kter´e um´ı zpracovat. Jedn´a se o relaˇcn´ı datab´azi, kter´a je oddˇelov´ana pomoc´ı ˇc´arek a nov´ ych ˇra´dk˚ u. Prvn´ı ˇra´dek mus´ı obsahovat atributy, na kter´e se bude program dotazovat. Na prvn´ı pozici na kaˇzd´em ˇr´adku se nach´az´ı jedineˇcn´ y kl´ıˇc pouˇz´ıvan´ y k indexaci z´aznam˚ u. Pomoc´ı Matlabu, pˇresnˇeji toolboxu PSGLab, kter´ y obsahuje funkci psglab export to weka.m, jsme vytvoˇrili novou, podobnou funkci psglab export to fel expert.m. V kapitole 6 jsme popisovali form´atov´an´ı dat ARFF, kter´e pouˇz´ıv´a program Weka. Program Fel Ex Expert potˇrebuje podobn´e informace, pouze pˇreform´atovan´e do odpov´ıdaj´ıc´ıho tvaru. U toho postupu nastal jeden probl´em, kter´ y se t´ yk´a pˇr´ıznak˚ u, kter´e zaˇc´ınaj´ı ˇc´ıslem. U Fel Ex Expertu nen´ı moˇzn´e poloˇzit ot´azku, kter´a zaˇc´ın´a ˇc´ıslic´ı. Proto mus´ıme pouˇz´ıt pˇred vˇsechny pˇr´ıznaky n´azev kan´alu, kter´ y sice m˚ uˇze b´ yt pro vˇsechny pˇr´ıznaky shodn´ y, ale je to podstatn´e, aby jsme mohli vyuˇz´ıt pˇr´ıznak˚ u jako jsou: 1st diff mean, 1st diff max, atd. V´ ystupem naˇs´ı funkce (psglab export to fel expert.m) jsou dva textov´e soubory. Soubor features-02s-id0001-fel-expert.txt obsahuje vˇsechny napoˇc´ıtan´e pˇr´ıznaky pro vybran´e kan´aly. Druh´ y soubor features-02s-id0001-fel-expert-results.txt obsahuje spr´avn´e ohodno25
cen´ı jednotliv´ ych segment˚ u. Tento soubor bude pouˇzit pˇri zpracov´an´ı kvality ohodnocen´ı.
8.4
Rozhodovac´ı pravidla
K dosaˇzen´ı efektivn´ıho vyuˇzit´ı programu Fel Ex Expert jsme museli nejdˇr´ıve zformulovat pravidla, podle kter´ ych budeme rozhodovat o jednotliv´ ych tˇr´ıd´ach. Jednotliv´a pravidla jsme uˇz ˇcetli v kapitole 5. Ale n´asledn´e aplikov´an´ı se liˇs´ı l´ekaˇr od l´ekaˇre. Proto jsme se rozhodli pro sestaven´ı pravidel pomoc´ı programu Weka. Vybrali jsme si 4 r˚ uzn´e z´aznamy, kter´e byly ohodnoceny stejn´ ym doktorem. U vˇsech 4 z´aznam˚ u byly napoˇc´ıt´any stejn´e pˇr´ıznaky. Program Weka n´am poskytnul 2 moˇzn´e zp˚ usoby, jak urˇcit vhodn´a pravidla: sestaven´ım rozhodovac´ıho stromu, nebo ohodnocen´ım jednotliv´ ych pˇ r´ıznak˚ u. 8.4.1
Rozhodovac´ı strom
Tato metoda vyuˇzije vˇsech pˇr´ıznak˚ u, kter´e jsou k dispozici. Bohuˇzel u kaˇzd´eho mˇeˇren´ı se tento strom vytvoˇr´ı velice odliˇsn´ y. Pokouˇseli jsme se upravovat parametry (rychlost proˇrez´av´an´ı a minim´aln´ı poˇcet prvk˚ u na vˇetvi) jednotliv´ ych strom˚ u. V z´akladn´ım nastaven´ı se algoritmus pokus´ı vytvoˇrit co nejlepˇs´ı rozhodovac´ı strom, kter´ y dosahuje pˇrijateln´ ych v´ ysledk˚ u (kolem 80% u ´spˇeˇsn´eho hodnocen´ı). Bohuˇzel je to obrovsk´ y strom, kter´ y by bylo velice sloˇzit´e pouˇz´ıt ve Fel Ex Expertu. Proto jsme se snaˇzili mˇenit nastaven´ı a naj´ıt hranici, kdy bude v´ ysledek dostateˇcnˇe pˇresn´ y a strom bude m´enˇe sloˇzit´ y. Pouˇzitou metodou na generov´an´ı strom˚ u je algoritmus J48. Hodnota proˇrez´av´an´ı je nastavena na 0.25 a minim´aln´ı poˇcet prvk˚ u na vˇetvi je 40. Oba tyto parametry v´ yraznˇe ovlivn´ı rozvˇetven´ı v´ ysledn´eho stromu. Dalˇs´ı nev´ yhodou rozhodovac´ıch strom˚ u bylo jejich pˇreuˇcen´ı, nebot’ byli tr´enov´any a testov´any na stejn´ ych datech. Doch´az´ı k velk´e specializaci pravidel, kter´a vede k dobr´ ym v´ ysledk˚ um nad tˇemito z´aznamy, ale horˇs´ım nad jin´ ymi. Ovˇeˇren´ı t´eto teorie jsme provedli pomoc´ı vybr´an´ı dvou z´aznam˚ u. Jeden jsme oznaˇcili jako tr´enovac´ı a druh´ y jako testovac´ı. Tento test jsme prov´adˇeli na 3 z´aznamech, to n´am d´av´a 6 moˇzn´ ych kombinac´ı.
Obr´azek 20: V´ysledky jednotliv´ych mˇeˇren´ı. pˇresnost klasifikace [%] Z tabulky na obr. 20 m˚ uˇzeme vidˇet, ˇze na poˇrad´ı z´aznam˚ u moc nez´aleˇz´ı. Jednotliv´ ych tˇr´ıd, kter´ ymi je z´aznam ohodnocen, by mˇelo b´ yt u zdrav´eho sp´anku pˇribliˇznˇe stejnˇe. V naˇsem pˇr´ıpadˇe bylo rozloˇzen´ı tˇr´ıd v z´aznamech n´asleduj´ıc´ı (viz. obr. 21). 26
Obr´azek 21: Rozloˇzen´ı jednotliv´ych tˇr´ıd v z´aznamech. V´ ysledkem t´eto nerovnosti jsou vˇetˇs´ı odchylky v pˇresnosti, kdyˇz byl do mˇeˇren´ı zahrnut z´aznam ˇc´ıslo 3. Pokud by jsme se rozhodovali n´ahodnˇe, tak by naˇse pravdˇepodobnost spr´avn´eho ohodnocen´ı byla 25%. Vˇsechny zvolen´e metody jsou lepˇs´ı, neˇz n´ahodn´ y v´ ybˇer. Bohuˇzel je vidˇet, ˇze pˇri tvoˇren´ı pravidel nad jedn´ım z´aznamem a aplikov´an´ım nad druh´ ym, je v´ ysledek neuspokojiv´ y. Nav´ıc program strojov´eho uˇcen´ı vyuˇz´ıv´a veˇsker´e napoˇc´ıtan´e pˇr´ıznaky, kter´e mu pˇredloˇz´ıme, ale v˚ ubec nebere v potaz pravidla, kter´ ymi se ˇr´ıd´ı l´ekaˇri. 8.4.2
Hodnocen´ı pˇ r´ıznak˚ u
K vyhodnocen´ı nejuˇziteˇcnˇejˇs´ıch pˇr´ıznak˚ u jsme vyuˇzili pouze nˇekter´e kan´aly. A toto ˇreˇsen´ı jsme ovˇeˇrili nad kan´alem F7. Vynechali jsme i EOG, EMG a EKG kan´aly. Algoritmus hodnocen´ı pˇr´ıznak˚ u se naz´ yv´a InfoGainAttributeEval. Tato metoda ohodnot´ı kaˇzd´ y pˇr´ıznak hodnotou, kter´a odpov´ıd´a jeho vlivu na v´ ysledn´e rozliˇsen´ı tˇr´ıd. Nebylo pouˇzito v´ıce kan´al˚ u, nebot’ jsme chtˇeli porovn´avat kvalitu jednotliv´ ych pˇr´ıznak˚ u a ne kanal˚ u. Prvn´ı ˇc´ıslo ud´av´a hodnotu s jakou u ´spˇeˇsnost´ı jde tento pˇr´ıznak pouˇz´ıt na rozdˇelov´an´ı do tˇr´ıd. Tyto hodnoty funguj´ı jako podm´ınˇen´e pravdˇepodobnosti, takˇze klasick´ ym souˇctem hodnot nedos´ahneme na 100% u ´spˇeˇsnost. Druh´e ˇc´ıslo je pouze ˇc´ıslo parametru.
Obr´azek 22: Ohodnocen´ı kvality jednotliv´ych parametr˚ u na datasetu 1
Obr´azek 23: Ohodnocen´ı kvality jednotliv´ych parametr˚ u na datasetu 2 V tabulce na obr. 26 m˚ uˇzeme vidˇet 6 nejˇcastˇeji vyskytovan´ ych pˇr´ıznak˚ u mezi deseti nejl´epe hodnocen´ ymi. Tyto parametry jsou podle v´ ysledk˚ u, kter´e n´am nab´ıdl program 27
Obr´azek 24: Ohodnocen´ı kvality jednotliv´ych parametr˚ u na datasetu 3
Obr´azek 25: Ohodnocen´ı kvality jednotliv´ych parametr˚ u na datasetu 4 Weka, nejvhodnˇejˇs´ı na hodnocen´ı tˇr´ıd. Jedn´a se o EEG parametry, kter´e budou doplnˇeny o ECG, EOG a EMG. Pˇresn´ y popis v´ yznam˚ u jednotliv´ ych parametr˚ u je k nalezen´ı v kapitole 7.1 v disertacni praci [10].
Obr´azek 26: Pr˚ umˇer v´ ysledk˚ u z 5 r˚ uzn´ ych mˇeˇren´ı
8.4.3
Z´ avˇ erem k pravidl˚ um
Pomoc´ı metody NaiveBayes jsme si nechali spoˇc´ıtat u ´spˇeˇsnost rozdˇelen´ı do jednotliv´ ych tˇr´ıd. U kaˇzd´eho z´aznamu bylo dosaˇzeno vysok´e u ´spˇeˇsnosti nad 85%, ale pokaˇzd´e byla pravidla u ´plnˇe jin´a. Na obr. 27 jsou zobrazeny hodnoty pˇr´ıznaku medi´an pro 4 r˚ uzn´e z´aznamy. Vˇsechny z´aznamy byly hodnoceny stejn´ ym expertem a byly mˇeˇreny stejn´ ym pˇr´ıstrojem na stejn´em pacientovi, kter´ y simuloval pouze dva stejn´e artefakty v n´ahodn´em poˇrad´ı. U kaˇzd´eho z´aznamu m´ame vypsanou pr˚ umˇernou hodnotu pˇr´ıznaku, poˇcet v´ yskyt˚ u a pˇresnost. Pˇresnost ud´av´a vhodnost pouˇzit´ı pˇr´ıznaku k rozliˇsen´ı jednotliv´ ych tˇr´ıd. Jak je vidˇet, tak prvn´ı a druh´e mˇeˇren´ı si jsou velice podobn´a. Pomoc´ı tohoto pˇr´ıznaku by se dala v´ ybornˇe rozliˇsit svalov´a aktivita, nebot’ hodnota t´eto tˇr´ıdy je o ˇra´d vyˇsˇs´ı, neˇz u ostatn´ıch dvou tˇr´ıd. Bohuˇzel v dalˇs´ıch dvou mˇeˇren´ıch je tato hodnota jin´a. Nejvyˇsˇs´ı pr˚ umˇernou hodnotu m´a artefakt mrk´an´ı, a to dvojn´asobnˇe neˇz artefakt svalov´e aktivity.
28
Obr´azek 27: Parametr median u jednotliv´ych z´aznam˚ u Zv´ yˇsen´ı pr˚ umˇern´e hodnoty u mrknut´ı m˚ uˇze b´ yt zp˚ usobeno artefaktem, ˇze pacient v dobˇe svalov´e aktivity mrknul. V´ ysledkem je, ˇze dan´ y kousek je oznaˇcen jako mrknut´ı a pr˚ umˇern´a hodnota je zvˇetˇsena o hodnotu svalov´e aktivity. Ale nevid´ım ˇza´dn´ y d˚ uvod, proˇc by mˇela m´ıt pouze svalov´a aktivita menˇs´ı pr˚ umˇernou hodnotu, neˇz v pˇredeˇsl´em mˇeˇren´ı. V´ ysledkem je, ˇze pravidlo postaven´e na tomto pˇr´ıznaku se d´a pouˇz´ıt pouze na detekci artefakt˚ u, a ne na rozliˇsen´ı jednotliv´ ych tˇr´ıd od sebe.
Obr´azek 28: Parametr median ze vˇsech 4 z´aznam˚ u Na obr. 28 je vidˇet pr˚ umˇern´a hodnota tohoto pˇr´ıznaku, kdyˇz jsme data ze vˇsech 4 mˇeˇren´ı spojili do jednoho souboru a nechali spoˇc´ıtat stejnou metodou.
8.5
Chyba vstupn´ıch dat
V naˇsem experimentu s detekc´ı artefakt˚ u byla vstupn´ı data ohodnocena ruˇcnˇe, a jak je vidˇet na obr. 19, na kaˇzd´em kan´alu m˚ uˇze artefakt zaˇc´ınat v jin´em ˇcase. Toto by v praxi u sp´ankov´ ych z´aznam˚ u nemˇelo valn´ y v´ yznam, nebot’ u ´seky jsou segmentov´any po 30 vteˇrin´ach. Bohuˇzel v naˇsem pˇr´ıpadˇe, kdy m´ame segmentaci po 0,2 vteˇriny, je tento efekt znateln´ y. N´aslednˇe z´aleˇz´ı pouze na kan´ale, kter´ y bude zvolen. Nast´avaj´ı pˇr´ıpady, kde prvn´ı segment, kter´ y jeˇstˇe nen´ı artefaktem, ale na z´aznamu je oznaˇcen jako artefakt, je vyhodnocen spr´avnˇe jako klidov´ y stav, ale podle p˚ uvodn´ıch v´ ysledk˚ u by to mˇel b´ yt artefakt. Tato chyba n´am negativnˇe ovlivˇ nuje m´enˇe jak 5% segment˚ u.
29
8.6
Prov´ az´ an´ı s aplikac´ı Fel Ex Expert
Fel Ex Expert m´a r˚ uzn´e moˇznosti na pˇrepoˇcet vstupn´ı hodnoty na pravdˇepodobnost. Vˇsechny tyto moˇznosti jsou uk´az´any nad vzorov´ ymi pˇr´ıklady, nebot’ v naˇsem pˇr´ıpadˇe komunikuje Fel Ex Expert rovnou s datab´az´ı. Takˇze tyto okna nejsou v˚ ubec viditeln´a. • Dialogov´e okno 29 slouˇz´ı k v´ ybˇeru hodnoty z pˇreddefinovan´ ych moˇznost´ı.
Obr´azek 29: Dialogov´e okno - v´ybˇer z moˇznost´ı. • Dialogov´e okno 30 slouˇz´ı k zad´an´ı ˇc´ıseln´e hodnoty.
Obr´azek 30: Dialogov´e okno - ˇc´ıseln´a hodnota. • Dialogov´e okno 31 slouˇz´ı k urˇcen´ı pravdivosti poloˇzen´e ot´azky. Pokud zad´ame prostˇredn´ı variantu ”Don’t know” bude tato ot´azka vynech´ana a v´ ysledn´e hodnoty uzl˚ u se po t´eto ot´azce nezmˇen´ı. • Dialogov´e okno 32 zobraz´ı v´ ysledek konzultace. V´ ysledky jsou seˇrazeny podle jejich v´ ysledn´e pravdˇepodobnosti. Prvn´ı sloupec je index, v druh´em sloupci je n´azev 30
Obr´azek 31: Dialogov´e okno - ˇcinitel jistoty. c´ılov´eho uzlu. Tˇret´ı sloupec obsahuje poˇcateˇcn´ı pravdˇepodobnost uzlu a ˇctvrt´ y sloupec je pravdˇepodobnost stavu po konzultaci.
Obr´azek 32: V´ysledky konzultace
8.6.1
Pravidla pro detekci artefakt˚ u
Dalˇs´ım krokem byla realizace navrˇzen´ ych pravidel, podle kter´ ych bude dan´ y syst´em pracovat. V tomto kroku jsme se snaˇzili vyuˇz´ıt z´avˇery ze vˇsech pˇredchoz´ıch pokus˚ u strojov´eho uˇcen´ı. Na obr. 33 je vidˇet sch´ema navrˇzen´eho syst´emu. V horn´ı ˇradˇe jsou vstupn´ı pˇr´ıznaky, ˇ spodn´ı ˇrada jsou c´ılov´e uzly. Sipky vedouc´ı z poˇc´ateˇcn´ıch pˇr´ıznak˚ u jsou pravidla, kter´a spojuj´ı tyto dva uzly. Na obr. 34 je vidˇet pˇrevodn´ı funkce pro pˇr´ıznak STD (Standardn´ı odchylka). Program Fel Ex Expert si dosad´ı hodnotu toho pˇr´ıznaku do funkce za promˇenou X. V´ ysledek t´eto rovnice je v´ ysledn´a hodnota, kterou pouˇzije Fel Ex Expert k v´ ypoˇct˚ um. Pˇri sekvenˇcn´ı konzultaci, kterou jsme prov´adˇeli se neobjevuj´ı dialogov´a okna, jako jsem uv´adˇel v´ yˇse. Nebot’ algoritmus si automaticky nalezne odpovˇed’ v datab´azi. Takˇze tato forma dialogu je vedena pouze mezi Fel Ex Expertem a textov´ ym souborem, kde je 31
Obr´azek 33: Sch´ema navrˇzen´eho expertn´ıho syst´emu.
Obr´azek 34: Pˇrevodn´ı funkci pro pˇr´ıznak std. datab´aze uloˇzena. Aˇckoli tato konzultace probˇehne u ´spˇeˇsnˇe, program skonˇc´ı zobrazen´ım chybov´eho okna. Tuto chybu se n´am nepovedlo odladit. Chyba nen´ı zp˚ usobena naˇs´ım k´odem, ale vnitˇrn´ım k´odem Fel Ex Expertu.
Obr´azek 35: Chybov´e okno.
8.7
Zpracov´ an´ı v´ ystupn´ı datab´ aze
V´ ystupn´ı datab´aze je generov´ana ve form´atu, kter´ y je uveden na obr. 36. Prvn´ı ˇra´dek obsahuje sloupec, nad kter´ ym je dan´ y program indexov´an, kaˇzd´ y ˇr´adek odpov´ıd´a v´ ysledku z jednoho segmentu, do kter´ ych byly namˇeˇren´e kan´aly rozdˇeleny. D´ale se v prvn´ım ˇra´dku nach´azej´ı vˇsechny c´ılov´e hypot´ezy. Text nen´ı form´atov´an a hodnoty jednotliv´ ych tˇr´ıd jsou 32
oddˇelov´any pouze ˇca´rkou, kaˇzd´ y dalˇs´ı segment nov´ ym ˇr´adkem. V´ ysledkem je pravdˇepodobnost jednotliv´ ych stav˚ u v dan´em segmentu. Tento druh hodnocen´ı odpov´ıd´a fuzzy logice, ˇca´sti matematick´e logiky, kde jsou jednotliv´e stavy rozliˇseny m´ırou pˇr´ısluˇsnosti k dan´e tˇr´ıdˇe. Tyto stavy se mohou navz´ajem pˇrekr´ yvat. Pˇr´ıkladem n´am m˚ uˇze b´ yt vˇek ˇclovˇeka. Pokud je 20 let´ y ˇclovˇek oznaˇcen jako mlad´ y a 35 let´ y ˇclovˇek jako stˇrednˇe star´ y, tak se hodnota jejich stav˚ u line´arnˇe mˇen´ı, jak st´arnou. Pokud by bylo jin´emu ˇclovˇeku 22 let, byl by s hodnotou 0.88 mlad´ y a 0.12 stˇrednˇe star´ y. Vyj´adˇren´ı tˇechto stav˚ u pˇresnou hodnotou je ponˇekud zvl´aˇstn´ı, ale pro ˇclovˇeka je mnohem pˇrirozenˇejˇs´ı vn´ım´an´ı postupn´ ych zmˇen, neˇz n´ahl´ ych skok˚ u. Pokud m´ame vodu z kohoutku, tak´e nen´ı jen hork´a a studen´a.
Obr´azek 36: Uk´azka v´ystupn´ı datab´aze. Fel Ex Expert zapisuje v´ysledky v tomto form´atu. Tento v´ ystup m´a sv´e v´ yhody i nev´ yhody. • Hlavn´ı nev´ yhodou je nutnost n´asledn´eho zpracov´an´ı. V´ ystup ve form´atu: oo, sa, mr, kde v´ ysledn´ y stav by odpov´ıdal stavu s nejvyˇsˇs´ı pravdˇepodobnost´ı, by byl uˇzivatelsky jednoduˇsˇs´ı, ale zkomplikoval by ladˇen´ı programu. Rozhodnˇe je v´ yhodnˇejˇs´ı vˇedˇet jak´ ym smˇerem se v´ ysledek vyv´ yj´ı a o kolik se pˇribliˇzujeme poˇzadovan´e hodnotˇe. • V´ yhoda tohoto ˇreˇsen´ı je, ˇze pokud uˇz se do n´asledn´eho zpracov´an´ı pouˇst´ıme, tak n´am tento v´ ysledek poskytuje ˇsirok´e moˇznosti, jak s n´ım naloˇzit. M˚ uˇzeme si nechat zobrazit graf, kde budou jednotliv´e stavy zobrazeny pouze pokud jejich pravdˇepodobnost je vyˇsˇs´ı neˇz nˇejak´a hranice. Pokud si nech´ame zobrazit graf s jistotou nad 90%, m˚ uˇze tento graf obsahovat pr´azdn´a m´ısta, ale zase m´ame jistotu, ˇze zobrazen´e stavy jsou spr´avnˇe klasifikovan´e. Samozˇrejmˇe n´am to nab´ız´ı moˇznost zpˇetn´e kontroly v´ ysledk˚ u, nebot’ pokud si nech´ame vykreslit graf s jistotou 70% nebo v´ıce, a jeden segment bude oznaˇcen v´ıce znaˇckami, tak jsme naˇsli ”slep´e m´ısto” v definovan´ ych pravidlech. Tento stav by byl pochopiteln´ y a skoro i ˇz´adan´ y, pokud by hranice byla okolo 40% - 50%, nebot’ by jsme vidˇeli, ˇze se program nedok´azal rozhodnout a m´a dvˇe varianty s podobnou hodnotou jistoty. Toto n´am samozˇrejmˇe ukazuje ”slep´a m´ısta”. Nebo si nech´ame vykreslit graf, kde m´a kaˇzd´ y segment pˇridˇelenou pr´avˇe jednu tˇr´ıdu s nejvˇetˇsˇs´ı pravdˇepodobnost´ı. Tento graf nem´a ˇza´dn´e neoklasifikovan´e segmenty, ani segmenty s nejednoznaˇcnou klasifikac´ı.
33
9
Java GUI
K samotn´emu zpracov´an´ı byl pouˇzit programovac´ı jazyk Java. V tomto jazyce jsme napsali jednoduch´e GUI (z angliˇctiny Graphic User Interface), neboli grafick´e uˇzivatelsk´e rozhran´ı, kter´e v´ yraznˇe ulehˇc´ı obsluhu programu vˇsem uˇzivatel˚ um. Toto rozhran´ı m´a jednoduch´e z´akladn´ı menu, kde uˇzivatel vybere 3 textov´e soubory: • Oart.txt je v´ ystupn´ım souborem, kter´ y generuje Fel Ex Expert a obsahuje hodnotu pˇr´ısluˇsnossti k jednotliv´ ych stav˚ u v dan´em segmentu. • features-02s-id0001-fel-expert-results.txt je soubor generovan´ y PSGLabem funkc´ı psglab export to fel expert.m k ovˇeˇren´ı v´ ysledk˚ u. • define-classes.txt obsahuje ˇc´ısla a jm´ena jednotliv´ ych tˇr´ıd, kter´a se vyskytuj´ı v datech.
Obr´azek 37: Uk´azka zobrazen´ı GUI
9.1
Debug mode
Pokud je program vyuˇz´ıv´am k upˇresˇ nov´an´ı pravidel, nebo hled´an´ı ”slep´ ych m´ıst”, zaˇskrtneme ”Debug mode”. Do textov´eho pole se zad´a limit, kter´ y urˇc´ı pravdˇepodobnost, jakou jsme 34
ochotni akceptovat pˇri proch´azen´ı ˇreˇsen´ı za platn´e. N´aslednˇe se potvrd´ı spoˇc´ıt´an´ı v´ ysledk˚ u. Program vytvoˇr´ı textov´e soubory: • Differences.txt, kter´ y um´ıst´ı do stejn´eho adres´aˇre jako se nach´az´ı soubor Oart.txt. Tento v´ ystup obsahuje index segmentu, kde se klasifikace experta a programu liˇs´ı. D´ale pak obsahuje hodnoty vˇsech parametr˚ u v dan´em segmentu a klasifikaci programu a experta (viz. obr.38). • Results Debug.txt, kter´ y obsahuje ˇreˇsen´ı a je um´ıstˇen ve stejn´em adres´aˇri. Tento v´ ystup obsahuje data ve stejn´em form´atu, jako jsou generov´any spr´avn´e v´ ysledky programem Fel Ex Expert.
Obr´azek 38: Uk´azka v´ystupu souboru Differences.txt. Do toho souboru jsou data zapisov´ana v tomto form´ atu.
V debug modu jsou poˇc´ıt´any pouze jednoduch´e parametry jako je: u ´spˇeˇsnost spr´avn´eho ohodnocen´ı, poˇcet neohodnocen´ ych segment˚ u a segment˚ u, kter´e byly ohodnocen´e v´ıce tˇr´ıdami.
9.2
Normal mode
Pro vyhodnocen´ı parametr˚ u probramu ponech´ame ”Debug mode” vypnut´ y a program bude hledat v kaˇzd´em segmentu tˇr´ıdu s nejvyˇsˇs´ı pravdˇepodobnost´ı a tou dan´ y segment ohodnot´ı. Jako v´ ystup programu jsou soubory Results.txt a Differences.txt. Z´aroveˇ n je zobrazeno nov´e okno, kde jsou napoˇc´ıt´any parametry pˇredchoz´ı klasifikace. V tomto oknˇe jsou poˇc´ıtany parametry ROC kˇrivky, protoˇze kaˇzd´ y segment je ohodnocen pr´avˇe jednou tˇr´ıdou.
35
10
V´ ysledky
EEG kan´aly jsou rozdˇeleny do p´ar˚ u podle toho, zda se nach´az´ı nad pravou ˇci levou hemisf´erou. Na naˇse experimenty jsme si vybrali z kaˇzd´e dvojice jeden kan´al a nechali jsme u tohoto kan´alu spoˇc´ıtat vˇsechny parametry. Nav´ıc jsme pˇridali kan´al Mean, kter´ y je umˇele spoˇc´ıt´an zpr˚ umˇerov´an´ım sign´al˚ u ze vˇsech ostatn´ıch kan´al˚ u. Na obr. 39 je z´aznam z pokusu, kter´ y byl proveden nad daty z prvn´ıho mˇeˇren´ı. Mˇeˇren´ı jsme provedli i pro kan´al Fp1, ale tento kan´al jsme nechtˇeli vyuˇz´ıvat, protoˇze na tˇechto kan´alech se pˇr´ıliˇs projevuje ruˇsen´ı zp˚ usoben´e mrknut´ım a jin´e r˚ uzn´e artefakty. Rozd´ıly v kvalitˇe jednotliv´ ych kan´al˚ u jsou velk´e. Pokud si nech´ame kvalitu zv´ yraznit barevnˇe podle jeho pozice na hlavˇe, tak je vidˇet, ˇze pro detekci naˇsich artefakt˚ u jsou vhodnˇejˇs´ı pˇredn´ı kan´aly.
Obr´azek 39: Srovn´an´ı kvality kan´al˚ u z prvn´ıho mˇeˇren´ı V´ ysledky u ostatn´ıch mˇeˇren´ı jsou horˇs´ı, neˇz u prvn´ıho. Rozd´ıl u ´spˇeˇsnosti mezi jednotliv´ ymi kan´aly je podobn´ y. Kvalita hodnocen´ı je horˇs´ı o 0,10-0,15 AUC. Kan´al F7 zaznamenal v´ yrazn´e zhorˇsen´ı, stejnˇe jako kan´al Fz. Jako nejvhodnˇejˇs´ı p´ar kan´al˚ u jsme oznaˇcili dvojici F3 - F4. Tyto prametry na obr. 40 byly spoˇc´ıt´any nad druh´ ym datasetem.
Obr´azek 40: Srovn´an´ı kvality kan´al˚ u z druh´eho mˇeˇren´ı Na obr. 41 je zn´azornˇeno rozloˇzen´ı jednotliv´ ych kan´al˚ u na povrchu hlavy. Kvalita jednotliv´ ych kan´al˚ u je rozliˇsena barevnˇe. Barevn´e rozliˇsen´ı je podle hodnoty parametru AUC z tabulky 39. V dalˇs´ım kroku jsme srovnali kvalitu kan´al˚ u F3 a F4. Na obr. 42 jsme spoˇc´ıtali parametry pro vˇsechny dostupn´e datasety. Kan´al F4 byl ve 3 mˇeˇren´ıch lepˇs´ı neˇz F3. Jednou 36
´ eˇsnost kan´alu podle rozloˇzen´ı Obr´azek 41: Uspˇ
byly oba kan´aly stejnˇe u ´spˇeˇsn´e. Na z´akladˇe tˇechto pokus˚ u jsme se rozhodli pouˇz´ıvat kan´al F4 jako v´ ychoz´ı kan´al pro vˇsechny dalˇs´ı mˇeˇren´ı.
Obr´azek 42: Rozd´ıl mezi p´arov´ymi kan´aly V´ ysledek testov´an´ı jsme hodnotili pomoc´ı parametru AUC, kde byli jednotliv´e body spojov´any pouze pˇr´ımkou. Takˇze v´ ysledn´a hodnota byla niˇzˇs´ı, nebo stejn´a jako skuteˇcn´a plocha pod kˇrivkou. T´ımto postupem jsme v´ ysledky nikdy nepˇrecenili.
37
11
Z´ avˇ er
C´ılem t´eto bakal´aˇrsk´e pr´ace bylo ovˇeˇren´ı moˇznosti nasazen´ı expertn´ıch syst´em˚ u do l´ekaˇrstv´ı, konkr´etnˇe klasifikace sp´ankov´ ych f´az´ı s moˇzn´ ym rozˇs´ıˇren´ım na diagnostiku sp´ankov´ ych poruch. V r´amci bakal´aˇrsk´e pr´ace byla vytvoˇrena reˇserˇse na t´ema Souˇcasn´e trendy v oblasti expertn´ıch syst´em˚ u, kde byly zhodnoceny moˇzn´e v´ yhody a nev´ yhody oproti jin´ ym program˚ um. Zhodnotili jsme ˇsirok´e moˇznosti uplatnˇen´ı pro tento obor a pokusili se vytvoˇrit podobn´ y expertn´ı syst´em. Pro tvorbu expertn´ıho syst´emu jsme si vybrali program Fel Ex Expert, na kter´ y n´am p˚ ujˇcila licenci firma CertiCon, kter´a vlastn´ı pr´ava na tento program. Bohuˇzel pouˇz´ıv´an´ı komerˇcn´ıho programu, kter´ y nebyl na podobnou u ´lohu navrˇzen nebylo nejjednoduˇs´ı. Firma CertiCon sice zveˇrejnila dva dokumenty, kde se popisuje jak syst´em pracuje a jak s n´ım zach´azet, ale napˇr´ıklad uk´azkov´ y pˇr´ıklad v tomto dokumentu nebyl funkˇcn´ı. V´ıce vzorov´ ych program˚ u na internetu nebylo k nalezen´ı. Museli jsme si sehnat kontakt na z´astupce z firmy a zaˇc´ıt tvoˇrit program s n´ım. I kdyˇz mi pan Obitko celou dobu odpov´ıdal na emaily, dostat program do funkˇcn´ı verze trvalo d´ele, neˇz jsme p˚ uvodnˇe pl´anovali. Aˇckoli program funguje, objevuje se chybov´a hl´aˇska. Tuto z´avadu se nepovedlo odstranit. Okno s chybou staˇc´ı zavˇr´ıt a v´ ysledky konzultace se nach´az´ı ve spr´avn´em adres´aˇri. Pˇri samotn´e realizaci byla vˇsechna pravidla zjiˇst’ov´ana pouze z l´ekaˇrsk´e literatury, k pˇresnˇejˇs´ı definici jednotliv´ ych tˇr´ıd by byly potˇreba konzultace s l´ekaˇri. V´ ysledkem bylo zjednoduˇsen´ı u ´lohy na detekci artefakt˚ u v EEG sign´alu, nebot’ sestaven´ı komplexn´ıch pravidel pro hodnocen´ı sp´ankov´ ych z´aznam˚ u bylo nesm´ırnˇe sloˇzit´e. Testov´an´ı bylo hodnoceno podle pravidel hodnocen´ı AUC. V praktick´e ˇca´sti jsme provedli v´ıce mˇeˇren´ı se stejn´ ymi pravidly, ale r˚ uzn´ ymi kan´aly. V´ ysledky pro jednotliv´e kan´aly byly velice rozd´ıln´e. Nov´ y kan´al, napoˇc´ıtan´ y pr˚ umˇerov´an´ım ostatn´ıch, byly napoˇc´ıt´any stejn´e pˇr´ıznaky jako u ostatn´ıch kan´al˚ u. Pr˚ umˇerov´an´ı nen´ı pro tento typ u ´lohy vhodn´e, ale bylo experiment´alnˇe pouˇzito z d˚ uvodu sn´ıˇzen´ı poˇctu kan´al˚ u. V´ ysledek je v´ıce zkreslen´ y, neˇz p˚ uvodn´ı sign´al. Podle polohy kan´alu na pacientovˇe hlavˇe jsme vyhodnotili uˇziteˇcnost dan´eho kan´alu. Jako nejv´ yhodnˇejˇs´ı kan´al byl vybr´an kan´al F4, kter´ y se nach´az´ı d´ale od oˇc´ı, takˇze se pˇr´ımo neprojevuje ruˇsen´ı zp˚ usoben´e mrknut´ım. U t´eto u ´lohy, by mohlo b´ yt uˇziteˇcn´e detekovat mrknut´ı pˇr´ımo z kan´al˚ u Fp1 a Fp2, ale sp´ıˇse jsme se snaˇzili ovˇeˇrit variantu detekov´an´ı artefakt˚ u pouze z EEG sign´alu. U l´ekaˇrsk´ ych pravidel na hodnocen´ı sp´ankov´ ych f´az´ı nen´ı ˇz´adn´e pravidlo spojen´e s mrk´an´ım. Takˇze by jsme tuto v´ yhodu nemohli d´ale vyuˇz´ıt. V t´eto bakal´aˇrsk´e pr´aci jsme se v´ıce zamˇeˇrili na samotn´ y r´amec expertn´ıch syst´em˚ u,
38
neˇz na konkr´etn´ı u ´lohu. Navazuj´ıc´ı pr´ace na by mˇela zaˇc´ıt konzultac´ı s neurologem, kter´ y by sestavil vhodn´a l´ekaˇrsk´a pravidla na detekce sp´ankov´ ych f´az´ı. Tyto pravidla by se napojila na v´ ysledn´e stavy. Napˇr´ıklad l´ekaˇri rozliˇsuj´ı NREM2 od NREM1 pomoc´ı K-komplex˚ u. Na zaˇc´atku expertn´ıho syst´emu by byl algoritmus pro detekci konkr´etn´ıch grafoelement˚ u, napˇr. K-komplexu. V´ ysledn´e sch´ema tohoto expertn´ıho syst´emu by mˇelo l´ekaˇrsk´a pravidla pouze jako mezilehl´e uzly mezi vstupn´ımi pˇr´ıznaky a sp´ankov´ ymi f´azemi. N´aslednˇe by se u ´loha rozloˇzila na v´ıce menˇs´ıch u ´loh, kdy by ˇslo vˇzdy o detekci jednoduch´ ych artefakt˚ u. Na pˇriloˇzen´em CD nen´ı instalaˇcn´ı soubor programu Fel Ex Expert. Tento program je pod licenc´ı firmy CertiCon a podle z´akona je jeho rozˇsiˇrov´an´ı trestn´e.
39
12
Reference
K vytvoˇren´ı citac´ı byla pouˇzita sluˇzba Citace.com dostupn´a na str´ance www.citace.com. ˇ ´IK, Vladim´ır. Umˇel´a inteligence 2. Praha: Academia, 1997, 373 s. ISBN 801. MAR 200-0504-8. 2. LEE-CHIONG, Teofilo L. Sleep: a comprehensive handbook. Hoboken, N.J.: Wiley, c2006, xxxii, 1096 p. ISBN 978-047-1683-711. 3. COLTEN, Harvey R a Bruce M ALTEVOGT. Sleep disorders and sleep deprivation: an unmet public health problem. Washington, DC: National Academies Press, c2006, xviii, 404 p. ISBN 978-030-9101-110. 4. MALMIVUO, Jaakko a Robert PLONSEY. Bioelectromagnetism: principles and applications of bioelectric and biomagnetic fields. New York: Oxford University Press, 1995, xxii, 482 p. ISBN 01-950-5823-2. 5. NIEDERMEYER, Ernst a Fernando H. LOPES DA SILVA. Electroencephalography: basic principles, clinical applications, and related fields. Baltimore: Lippincott Williams & Wilkins, 2005. ´ 6. Webov´e str´anky pˇredmˇetu A0B33BMI: Uvod do biomedic´ınsk´eho inˇzen´ yrstv´ı. [online]. 2012 [cit. 2013-04-28]. Dostupn´e z: http://bio.felk.cvut.cz/~huptycm/ Vyuka/X33BMI_prednasky/ 7. DEMENT, William a Nathaniel KLEITMAN. The relation of eye movements during sleep to dream activity: An objective method for the study of dreaming. Journal of Experimental Psychology. 1957, vol. 53, issue 5, s. 339-346. DOI: 10.1037/h0048189. Dostupn´e z: http://content.apa.org/journals/xge/53/5/339 8. KALES, Anthony a Allan RECHTSCHAFFEN. UNIVERSITY OF CALIFORNIA, Los Angeles. Brain Information Service. A manual of standardized terminology, techniques and scoring system for sleep stages of human subjects. Los Angeles: Brain Information Service, 1968. OCLC 4584860. 9. PSGLAB. Polysomnographic data processing matlab toolbox [online]. 2010 [cit. 2013-04-28]. Dostupn´e z: http://bio.felk.cvut.cz/psglab/ 10. GERLA, V´aclav. Automated Analysis of Long-Term EEG Signals. Prague, 2012. Dostupn´e z: http://bio.felk.cvut.cz/psglab/disertace/disertaceˇ 2012-02-29.pdf Doctoral Thesis. CVUT. 40
11. Weka [online]. 2013 [cit. 2013-04-28]. Dostupn´e z: http://weka.wikispaces.com/ 12. Weka: Homepage [online]. 2013 [cit. 2013-04-28]. Dostupn´e z: http://www.cs. waikato.ac.nz/ml/index.html 13. DANKER-HOPFE, Heidi and others. Interrater reliability for sleep scoring according to the Rechtschaffen. Journal of Sleep Research [online]. 2009, roˇc. 18, ˇc. 1, s. 74-84 [cit. 2013-04-28]. ISSN 09621105. DOI: 10.1111/j.1365-2869.2008.00700.x. Dostupn´e z: http://doi.wiley.com/10.1111/j.1365-2869.2008.00700.x 14. SHATZMILLER, Ron A. Sleep Stages Scoring. [online]. 2012 [cit. 2013-0428]. Dostupn´e z: http://emedicine.medscape.com/article/1188142-overview# aw2aab6b4 15. SHATZMILLER, Ron A. Sleep Stage Scoring: Introduction/ Historical Perspective. [online]. 2012 [cit. 2013-04-28]. Dostupn´e z: http://emedicine.medscape.com/ article/1188142-overview 16. OBITKO, Marek. Uˇzivatelsk´a pˇr´ıruˇcka k syst´emu FEL-Expert 4.0 [online]. 1999 [cit. 2013-04-28]. Dostupn´e z: http://labe.felk.cvut.cz/~obitko/spr/fel-expert/ fel-expert-manual.pdf 17. OBITKO, Marek. Uncertainty processing in FEL-Expert: Lecture notes [online]. 1999[cit. 2013-04-28]. Dostupn´e z: http://labe.felk.cvut.cz/~obitko/ spr/fel-expert/FEL-Expert-Lecture-notes.pdf ˇ 18. BORTL´ICEK, Zbynˇek. ROC kˇrivky. Brno, 2008. Dostupn´e z: http://is.muni.cz/ th/106210/prif_m/Diplomova_prace.pdf. Diplomov´a pr´ace. Masarykova univerzita v Brnˇe.
41