SAPIENTIA ERDÉLYI MAGYAR TUDOMÁNYEGYETEM MŰSZAKI ÉS HUMÁNTUDOMÁNYOK KAR, MAROSVÁSÁRHELY SZOFTVERFEJLESZTÉS SZAK
Agyi tumor felismerése többcsatornás 3D MRI felvételekből fuzzy klaszterezés alkalmazásával
MESTERI DISSZERTÁCIÓ
Témavezető:
Végzős hallgató:
Dr. Szilágyi László egyetemi tanár
Csonka Erik Artur
2015
SAPIENTIA HUNGARIAN UNIVERSITY OF TRANSYLVANIA FACULTY OF TECHNICAL AND HUMAN SCIENCES, TÎRGU-MUREȘ SOFTWARE ENGENEERING
Tumor detection from multispectral brain MRI records using fuzzy clustering
MASTER’S THESIS
Supervisor: Prof. Dr. Szilágyi László
Student:
Csonka Erik Artur
2015
UNIVERSITATEA SAPIENTIA DIN CLUJ-NAPOCA FACULTATEA DE ȘTIINȚE TEHNICE ȘI UMANISTE, TÎRGU-MUREȘ
SPECIALIZAREA DEZVOLTARE DE SOFTWARE
Detectarea tumorii din înregistrări IRM folosind tehnici de clasificare fuzzy
LUCRARE DE DISERTAȚIE
Coordonator științific: Prof. Dr. Szilágyi László
Absolvent: Csonka Erik Artur
2015
UNIVERSITATEA “SAPIENTIA” din CLUJ-NAPOCA FACULTATEA DE ȘTIINȚE TEHNICE ȘI UMANISTE, Specializarea : Dezvoltarea Aplicațiilor Software
LUCRARE DE DISERTAȚIE Candidat Csonka Erik-Artur Anul absolvirii : 2015
Coordonator științific Prof. dr. ing. Szilágyi László
Viza facultății
a) Tema lucrării de disertație: Detectarea tumorii din înregistrări IRM folosind tehnici de clasificare fuzzy b) Problemele principale tratate: 1. Tehnici fuzzy de clasificare nesupravegheată a datelor 2. Tehnici de clasificare cu învățare semi-supravegheate 3. Tehnici de segmentare a imaginilor 4. Metode automate de diagnosticare c) Desene obligatorii: 1. Imagini prin care se demonstrează funcționarea metodelor implementate 2. Caracteristicile funcționale ale algoritmului d) Softuri obligatorii: 1. Implementarea unui algoritm complex bazat pe fuzzy c-means pentru detectarea tumorii în imagini IRM 2. Aplicație de testare pentru identificarea proprietăților algoritmului implementat e) Bibliografia recomandată: 1. Bezdek JC, Keller J, Krishnapuram R, Pal NR, Fuzzy models and algorithms for pattern recognition and image processing. Springer Verlag 2005 2. Gordillo Castillo N, Sobrevilla P, Montseny E: State of the art survey on MRI brain tumor segmentation. Magnetic Resonance Imaging 31:1426-1438, 2013 3. Cai W, Chen S, Zhang D. Fast and robust fuzzy c-means algorithms incorporating local information for image segmentation. Pattern Recognition 40:825–838, 2007 4. MICCAI BRATS webpage: http://braintumorsegmentation.org/ f) Termene obligatorii de consultații: săptămânal g) Locul și durata practicii : Universitatea Sapientia Primit tema la data de: 01.10.2014 Termen de predare: 23.07.2015 Semnătura director departament Semnătura candidatului
Semnătura coordonatorului
Model tip a.
Declaraţie
Subsemnata/ul
.............................................................,
………………………………………………………….,
absolvent(ă)
al/a
promoţia…………
specializării cunoscând
prevederile Legii Educaţiei Naţionale 1/2011 şi a Codului de etică şi deontologie profesională a Universităţii Sapientia cu privire la furt intelectual declar pe propria răspundere că prezenta lucrare de disertație se bazează pe activitatea personală, cercetarea/proiectarea este efectuată de mine, informaţiile şi datele preluate din literatura de specialitate sunt citate în mod corespunzător.
Localitatea, Data:
Absolvent Semnătura………………………
Model tip b.
Declaraţie
Subsemnata/Subsemnatul .................................................., funcţia……………………., titlul ştiinţific………………… declar pe propria răspundere că absolventul specializării de …………………………………………………................. a întocmit prezenta lucrare cu îndrumarea mea. Forma finală a lucrării a fost verificată de mine şi aceasta corespunde cu cerinţele de formă şi conţinut precizate Consiliul Facultăţii de ……………………….. în baza reglementărilor Universităţii ”Sapientia”. Lucrarea/proiectul corespunde şi cerinţelor impuse de Legea Educaţiei Naţionale 1/2011 cu modificări ulterioare, Codului de etică şi deontologie profesională a Universităţii Sapientia referitoare la furt intelectual. Sunt de acord cu susţinerea lucrării în faţa comisiei de examen de disertație.
Localitatea, Data:
Semnătura îndrumătorului,
Tartalomjegyzék
Kivonat ............................................................................................................................................ 1 Abstract ........................................................................................................................................... 2 Extras ............................................................................................................................................... 3 1. Fejezet: Bevezető ........................................................................................................................ 4 1.1
A dolgozat tárgya.............................................................................................................. 4
1.2 A terv célja ............................................................................................................................ 5 1.3 Orvosi megközelítés .............................................................................................................. 5 2. Fejezet: Az agyi tumor szegmentálásának módszerei ................................................................. 8 2.1. Manuális szegmentálás ......................................................................................................... 9 2.2. Félautomatikus szegmentálás ............................................................................................... 9 2.3. Teljesen automatikus szegmentálás ................................................................................... 10 2.4. Felügyelet nélkül és felügyelettel tanuló szegmentálás ..................................................... 11 2.4.1. Felügyelet nélküli szegmentálás.................................................................................. 11 2.4.2. Felügyelettel tanuló szegmentálás ............................................................................... 12 2.5. A szegmentálás módszerei ................................................................................................. 13 2.5.1. Vágás (küszöbölés) alapú szegmentálás ..................................................................... 13 2.5.2. Régió alapú szegmentálás ........................................................................................... 14 2.5.3. Szegmentálás képpontok osztályozásával ................................................................... 15 2.5.4. Neurális hálózatok ....................................................................................................... 17 2.5.5. Modell alapú szegmentálás ......................................................................................... 18 3. Fejezet: Elméleti megalapozás .................................................................................................. 19 3.1 Gépi tanulás ......................................................................................................................... 19 3.2 A Fuzzy c-means algoritmus ............................................................................................... 21 3.3 Adathalmaz.......................................................................................................................... 24 3.4 Jaccard index, mint kiértékelési kritérium .......................................................................... 25 4. Fejezet: Megvalósítás és eredmények ....................................................................................... 26 4.1 Az adatfeldolgozás menete.................................................................................................. 26 4.2 A kaszkád FCM algoritmus................................................................................................. 32 4.3 Félig felügyelt FCM ............................................................................................................ 38 5. Fejezet: Következtetés.............................................................................................................. 45 6. Fejezet: Szakirodalom ............................................................................................................... 46 Ábrák jegyzéke .............................................................................................................................. 49 Táblázatok jegyzéke ...................................................................................................................... 50
Kivonat Napjainkban az orvosi képalkotó rendszerek rendkívüli sebességgel fejlődnek és ezáltal lehetővé teszik az orvos számára, hogy beavatkozás nélkül, non-invazív módon betekintsen a páciens testébe és ez által korai stádiumban felismerje az ott tapasztalható elváltozásokat. Az ilyen rendszerek viszont óriási mennyiségű képadatot hoznak létre, melynek részletes áttekintése komoly időigényeket támaszt a szakember felé. Ezt a problémát a szintén gyorsan fejlődő számítógépes rendszerek képesek áthidalni az egyre nagyobb számító kapacitásuk igénybevételével. Mindezt megvalósítani szükség van olyan algoritmusok kidolgozására, melyek hatékonyan és pontosan osztályozni tudják a regisztrált képanyagot és megbízható tippeket tudnak adni az orvosnak a diagnózis felállításához. Jelen tanulmány is ehhez az irányvonalhoz igyekszik igazodni. Dolgozatom célja megvalósítani egy olyan szoftver tesztrendszert, melynek segítségével mágneses rezonanciás képalkotó berendezéssel készített agyi felvételeket lehet feldolgozni, és megkeresni az ott levő daganatos elváltozásokat. Egy felügyelet nélkül tanuló osztályozó algoritmust (fuzzy c-means klaszterezés) kívánok megvalósítani egy sajátos, kétlépéses (kaszkád) kivitelben, illetve megvizsgálni ezen eljárás félig felügyelettel történő tanításának lehetőségeit és képességeit. A megvalósított rendszer képességeit a MICCAI BRATS adatbázisból kiválasztott 13 volume segítségével értékeltem ki. Ebben az adatbázisban 4 színcsatornás MRI felvételek vannak, melyekben orvosi szakember által készített annotációk jelzik a tumor és ödéma jelenlétét. Tesztelés során a 13 képanyagot az összes lehetséges módon szétválasztottam tanulási és tesztelési adatokra. A klaszterező algoritmus félig felügyelt tanítását úgy valósítottam meg, hogy a tanulási adatokon elért legjobb osztályozási eredményt szolgáltató paraméter beállításokat alkalmaztam a tesztadatok osztályozására. A tesztek igazolták, hogy a tanítási adatok mennyiségének növekedése az osztályozási pontosság javulásához vezet, azaz a tumor pontos behatárolását segíteni tudjuk előzetes információ felhasználásával. A megvalósított módszer jó eséllyel felismeri a 10cm3 térfogatú összefüggő tumort. Ennél kisebb tumort tartalmazó pozitív képanyag nem állt rendelkezésemre. A dolgozat első fejezetében ismertetem a megoldandó feladatot és annak fő kérdéseit. A második fejezet egy szakirodalmi tanulmány az agyi MRI felvételek szegmentálásának és tumorok felismerésének eljárásairól. A harmadik fejezet egy részletes leírást ad az alkalmazott módszerek elméleti hátteréről, különös tekintettel a fuzzy c-means klaszterező eljárásra, az osztályozás pontosságának mérésére, és a MICCAI BRATS adatbázisra. A negyedik fejezet részletesen bemutatja a megvalósított eljárást és kiértékeli a tesztek eredményeit. Végül az ötödik fejezet röviden ismerteti a következtetéseket. Kulcsszavak: mágneses rezonanciás képalkotás, agyi tumor detektálása, korai diagnózis, fuzzy c-means algoritmus, félig felügyelt gépi tanulás, Jaccard index.
1
Abstract Nowadays the medical imaging devices are in high-speed development enabling the physician to have an insight into the patient’s body without actual penetration, exclusively via noninvasive techniques, and thus to discover the presence of lesions in an early stage. Such imaging systems create enormous amount of image data, which would require the expert to spend lots of time browsing. This problem can be bridged by computer systems that are equally developing very fast, through their increasing data processing capacity. To fulfill such demands there is a need for developing such algorithms that can efficiently and accurately process the huge image data records and can provide reliable support for the physician in establishing the diagnosis. This study represents an attempt to contribute to this process. The main goal of this study to build a software that can process MRI brain image data, distinguish tumors from normal tissues, localize and quantify the lesions of the brain. A nonsupervised clustering algorithm (fuzzy c-means) will be employed in a specialized cascade framework, and will be extended to semi-supervised learning. The implemented procedure is evaluated using 13 selected image volumes from the MICCAI BRATS database, which contains multispectral (T1, T2, T1C, FLAIR) MRI data together with annotations manually produced by medical experts. During the test, the set of 13 image volumes was divided into train and test data in all possible ways. The semi-supervision of the clustering algorithm was achieved through applying those parameter settings to test data which provided best segmentation for the train data set. The evaluation process revealed that an increase in the size of the train data set improves the classification accuracy. In other words, tumor delimitation is effectively assisted by prior information. The implemented algorithm is likely to discover contiguous tumors of volume greater than 10cm3. Image volumes with smaller tumors were not available for testing. The first chapter formulates the problem and its main questions. The second chapter is a literature study concerning MRI image segmentation and tumor detection techniques. The third chapter gives a detailed presentation of the employed methods and materials, including fuzzy cmeans clustering, MICCAI BRATS database, and accuracy evaluation indices. The fourth chapter is a detailed report of the implemented algorithms and their detailed evaluation. The last chapter formulates the conclusions. Keywords: magnetic resonance imaging, brain tumor detection, early diagnosis, fuzzy cmeans algorithm, semi-supervised machine learning, Jaccard index.
2
Extras În prezent, dispozitivele de imagistica medicală sunt într-o mare viteză de dezvoltare, care să permit medicului să aibă o imagine de ansamblu a corpului pacientului, fără penetrare actuală, exclusiv prin tehnici non-invazive, și astfel să descopere prezența bolii intr-un stadiu incipient. Astfel de sisteme de formare a imaginii creează o cantitate enormă de date de imagine, care ar necesita expertului să-și petreacă o mulțime de timp navigând între ele. Această problemă poate fi rezolvată cu sisteme informatice foarte performante, prin creșterea capacității lor de prelucrare a datelor. Pentru a îndeplini aceste cerințe este nevoie de dezvoltarea unor astfel de algoritmi care pot procesa eficient și precis înregistrări imense de date de imagine și care pot oferi sprijin de încredere pentru medic in stabilirea diagnosticului. Acest studiu reprezintă o încercare de a contribui la acest proces. Scopul principal al acestui studiu este de a construi un software care poate procesa datele de imagine IRM cerebral, distinge tumorile din tesuturile normale, localizează și cuantifica leziunile creierului. Un algoritm de clusterizare nesupervizat (fuzzy c-means), vor fi folosite într-un cadru cascadă de specialitate, și va fi extins la învățarea semi-supervizată. Procedura implementată este evaluata utilizând 13 volume de imagini selectate din baza de date MICCAI BRATS, care conține date multispectrale (T1, T2, T1C, FLAIR) IRM, împreună cu notări manuale de către experți medicali. În timpul testului, setul de 13 volume de imagine a fost împărțit în datele de învățare și de testare în toate modurile posibile. Semisupervizarea algoritmului de clusterizare a fost realizat prin aplicarea acestor setări ale parametrilor de a testa date care au furnizat cea mai buna segmentare pentru setul de date de învățare. Procesul de evaluare a arătat că o creștere a dimensiunii setului de date pentru învățare, îmbunătățește precizia de clasificare. Cu alte cuvinte, delimitarea tumorii este asistată în mod efectiv de informare prealabilă. Algoritmul implementat poate descoperi tumori învecinate cu volum mai mare de 10cm3. Volume de imagini cu tumori mai mici nu au fost disponibile pentru testare. Primul capitol formulează problema și principalele întrebări. Capitolul al doilea este un studiu de literatură privind technici de segmentare a imaginii IRM și detectare a tumorii. Al treilea capitol oferă o prezentare detaliată a metodelor și materialelor utilizate, inclusiv fuzzy, cmeans de clusterizare, baze de date MICCAI BRATS și indici de evaluare pentru precizie. Capitolul al patrulea este un raport detaliat al algoritmilor implementați și evaluarea lor detaliată. Ultimul capitol formulează concluziile. Cuvinte cheie: imagistica prin rezonanta magnetică, detectare tumoare de creier, diagnostic de devreme, algoritmul fuzzy c-means, învățare semi-supravegheat, Jaccard index. 3
Első fejezet
Bevezető Számítógépes képfeldolgozó rendszereket már az 1960-as években használtak az űrkutatásban és a föld felszínéről készített felvételek kiértékelése érdekében. Az elmúlt ötven évben a számítógépek kapacitása a többszörösére növekedett, és ezzel egyidejűleg a számítógépes képfeldolgozás alkalmazási területeinek köre is kibővült. Az Internet és a multimédia nagymértékben meggyorsította a képfeldolgozáshoz szükséges eszközök fejlesztését, a bővülő felhasználási igény lehetővé tette a gyártási darabszám nagyságrendekkel való megnövelését, ami jelentős árcsökkenést eredményezett. Ennek köszönhető, hogy ma már otthoni használatra is összeállíthatunk olyan személyi számítógépes képfeldolgozó rendszert, amelyet húsz évvel ezelőtt komoly kutató intézetek is szívesen használtak volna. Napjainkban a digitális képfeldolgozással az élet minden területén találkozhatunk, a médiától kezdve a korházakban található gépekig minden képfeldolgozáson alapszik. Ez azért is van így, mert az ember szeret mindent képekben látni, mert ez által az agyunk is könnyebben fel tudja dolgozni az adott információt, sokkal könnyebben és gyorsabban, mintha csupán kódokat vagy jeleket használnánk. A mai világban már nemcsak a programozásban vagy bizonyos munkahelyen használják a képfeldolgozást, hanem otthonról bárki, azáltal, hogy egy saját képet átalakít, feldolgoz, elemez, esetleg kiértékel. Jelen dolgozat egy olyan képfeldolgozáson alapuló rendszert mutat be, amely inkább az orvosi képfeldolgozáshoz áll közelebb.
1.1 A dolgozat tárgya Az agyi tumor mielőbbi detektálása nagyon nagy fontossággal bír az orvostudomány területén. Ezért is tartottam fontosnak egy olyan rendszer kidolgozását, amely automatikusan felismeri az agyban már meglévő tumort és vizualizálja azt egy képen akár az orvos, akár egy másik személy számára. Az elméleti részeknek a célja, hogy a megvalósításnak az elméleti hátterét elmagyarázza részletesebben és a dolgozatom második felében az eredményeket és a megvalósítás részleteit tárgyalja részletesebben. Jelen projekt alapjául a megjelenítési és képfeldolgozási algoritmusok szolgálnak, ez utóbbinak több fontosabb fogalma megtalálható ebben a projektben, mint például szűrők, gradiens, zaj, szegmentálás, klaszterezés stb.
4
1.2 A terv célja A dolgozat célkitűzése tulajdonképpen már a címben megfogalmazódott. De, hogy mit is takar ez a cím, azt az elkövetkező fejezetek részletesen leírják. A cél az volt, hogy egy olyan rendszert dolgozzunk ki, amely MRI felvételekből minél pontosabban határozza meg a tumor helyét és szűrje ki a rákos sejtek helyét. Más szóval különítse el a rákos sejteket az egészséges sejtektől. Hogy miért éppen a tumor detektálása? A szakirodalom szerint 10-20 ezer emberre jut egy ilyen megbetegedés, de sajnos, sok esetben csak egy későbbi stádiumban veszik észre, amikor már késő. Ezért is lenne szükség egy olyan automatizált rendszerre, amely vizsgálatok és kezelések nélkül is megmondaná, hogy vannak-e rákos sejtek az agyunkban, vagy sem.
1.3 Orvosi megközelítés Az agydaganat általában az agy szöveteiből kezd el kifejlődni, viszont gyakori az olyan eset is, amikor a test más részeiben alakulnak ki daganatok, amelyek áttétet képeznek az agyban. Mivel az agyunk a koponyába van bezárva, ezért a tumor esetén nem tud tágulni, éppen emiatt növeli a nyomást, amely nagy kihatással lesz az agyunkra és annak azon részeire, ahol helyezkedik el a daganat. Tüneteit okozhatják a már említett koponyaűri nyomás vagy az agydaganat közvetlen hatása az agyidegekre és ezáltal attól is függhetnek, hogy az agy mely része érintett a tumor által. Az agydaganatok műtétje egy nagyon komplikált és komplex folyamat, ezt csakis idegsebész szakorvosok végezhetik. Az első agyműtétet Rickman Godlee végezte el a 19. század végén, pontosabban 1884-ben. Az agydaganatok csoportjába számos különböző daganattípus tartozik, amely változhat attól függően, hogy hol helyezkedik el, mennyire agresszív, mennyire kezelhető, milyen a szövettani eredete és hogy milyen a várható kimenete. Amikor az agydaganat közvetlenül az agy valamely részében alakul ki, akkor ezt elsődleges ráknak (primer tumor) nevezzük. Abban az esetben, amikor más szervben (leggyakoribban tüdőben, emlőben, vesében vagy bőrön) kialakult daganat miatt áttét keletkezik az agyban, azokat másodlagos ráknak (secunder tumor) nevezzük. Az elsődleges agydaganatok gyakorlatilag bármelyik életkorban előfordulhatnak, a gyerekeknél a leukémia után összességében a második leggyakrabban megjelenő ráktípus. A betegség úgy férfiak, mint nők esetében kialakulhat, viszont az egyes altípusok más-más gyakorisággal fordulnak elő az egyik vagy a másik nem esetében. A statisztika azt mutatja, hogy az áttétes agytumorok száma jelentősen több az elsődleges rosszindulatú agydaganatoknál.
5
Egyértelműen még ma sem foglalhatunk állást arról, hogy mi okozza az agyban kialakuló daganatot. A gyermekkori előfordulás esetében az örökletes tényezők is döntő szereppel bírnak, viszont összességében az ilyen esetek csak kis hányadában mutatták ki, hogy összefüggés van a családban korábban előfordult agydaganat és az aktuális, gyermeki vagy fiatalkori tumor között. Feltételezések vannak arról, hogy a különböző munkahelyi vegyszerek használata vagy a mobiltelefonok hosszú távú káros hatása összefüggésben lehetnek az agydaganat kialakulásával, viszont erre egyértelmű bizonyíték a mai napig nincs. Sőt a koponyasérülések sem befolyásolják az agydaganat kialakulásának kockázatát. A jó-, illetve rosszindulatú, primer vagy áttétes tumorok azonos tünetekkel is jelentkezhetnek. Ez azért van így, mert bárhol is alakuljon ki a daganat, előbb-utóbb az agyban köt ki, ahol nyomásfokozódást eredményez, mivel a fejben levő koponyacsont nem enged a tágulásnak. Ezáltal azt mondhatjuk, hogy elhelyezkedéstől függően képes konkrét vagy általános panaszokat is okozni a betegek körében és emellett károsítja az agyfunkciókat is. A létező panaszok alapján legtöbbször nem is lehet egyből az agydaganatra gondolni, mivel azokat a tüneteket más számos betegség is kiválthatja. Leggyakoribb tünetként a fejfájás szokott jelentkezni, de az sem állandó jelleggel, tehát annak hiánya sem zárja ki a tumor jelenlétét az agyban. Természetesen a fejfájásnak számos egyéb oka is lehet, éppen ezért indokolt az ismételten jelentkező panaszok kivizsgálása. Általános tünetként említhető a gyakori szédülés, hányás és hányinger, amelyet szintén a koponyaűri nyomásfokozódás vált ki. Ez többnyire reggeli órákban fordul elő és a nap folyamán enyhülhet. Továbbá látásproblémák is kialakulhatnak, mint például kettős látás, váratlanul fellépő látásvesztés, pupillaszűkület vagy pupillatágulat. Ezekkel a tünetekkel ellentétben már figyelmeztető jelként szolgál egy epilepsziás roham, tudatzavar vagy részleges személyiségvesztés, beszédzavar vagy súlyosabb esetekben a kommunikációs képesség hiánya, bénultság. Léteznek viszont olyan előrehaladott esetek is, amikor annyira nagy a nyomás az agyban, hogy az agyi állomány egy része bepréselődhet abba a nyílásba, ahol az agy kapcsolódik a gerincvelőhöz. Ilyen esetben a kezelés hiányában a létfontosságú funkciók leállását eredményezheti (például a légzését), amely azonnali halált is okozhat. Amennyiben a vizsgálatok során agydaganat gyanúja merül fel, részletes kivizsgálásra van szükség ahhoz, hogy lehessen tudni a háttérben rejtőzködő tumor jellegét és kialakulásának okait. Ilyenkor a képalkotó eljárások közül a CT-t, illetve az MRI (mágneses rezonancia) berendezést szokták alkalmazni. A vizsgálat történhet kontrasztanyag befecskendezésével, a kóros területek jobb kirajzolódása érdekében, illetve kontrasztanyag nélkül. Az ilyen eljárások mellett még szoktak alkalmazni érfestést is (angiographia), amely az érrendszer kontrasztos 6
röntgenvizsgálatát foglalja magába. A diagnózis megállapításához még gerincfolyadékot is szoktak venni, hogy ez által is megvizsgálják a rákos sejtek esetleges jelenlétét és típusát. Mint azt minden tumor esetében szokták, úgy az agydaganat esetében is, a minél pontosabb diagnózis felállításához az orvosoknak meg kell vizsgálniuk a tumor összetételét. Ehhez szövettani vizsgálatra (biopsziára) van szükség, amely abból áll, hogy a sebész egy nagyon vékony fúróval átfúrja a beteg koponyáját, majd egy tű segítségével mintát vesz a daganatból, hogy azt majd mikroszkóp alatt tudják megvizsgálni. Kisméretű tumorok, illetve a daganat egy mélyebbi elhelyezkedése esetén az orvosok ilyen képalkotó berendezések segítségével hajtják végre a szövettani vizsgálatot, amely folyamatos képkontrollt igényel. Ezt az eljárást a szaknyelven sztereotaxikus biopsziának hívják. Felmerülhet bennünk a kérdés: gyógyítható-e az agydaganat? Erre a kérdésre nincs egyértelmű válasz, mivel ezt nagyon sok tényező befolyásolja. Ilyen tényezők például a tumor észlelésének ideje, annak szövettani sajátosságai, mérete, elhelyezkedése, a kezelés hatékonysága, a beteg hozzáállása, és így tovább. A gyógyítás alapja mégis a legtöbb esetben a tumor eltávolítása, mert csupán ez adhat esélyt a teljes mértékbeli felépülésre. Erre azonban nem minden esetben van lehetőség, főleg azoknál a daganatoknál, amelyek nem megfelelő módon fejlődnek és emiatt nem lokalizálhatóak, mert beszövik a környezetüket is. De léteznek olyan esetek is, amikor a jól körülhatárolt agydaganatok esetében sem végezhető el az eltávolító műtét. Ez akkor van így, amikor a beavatkozás során nagy kockázat van arra, hogy valamilyen létfontosságú központok károsodnak. Azonban elmondhatjuk azt is, hogy az elmúlt időszakban nagyon sokat fejlődött az orvostudomány ezen a területen is, így most már olyan területeket is el tudnak érni az orvosok, amelyeket korábban nem voltak képesek. Mint minden műtéti beavatkozás esetében, az agyműtétnek is van rizikója, amelyről részletes tájékoztatást szoktak nyújtani a beteg számára és az illető beteg (gyerekek esetén a szülők) hozzájárulása szükséges a műtét elvégzéséhez. Mivel a műtéti agysérülés ugyancsak számos átmeneti, illetve maradandó károsodást okozhat, ezért a műtét előnyeiről és hátrányairól kialakuló döntések meghozásáról szintén a betegnek kell döntést hoznia. Az esetleges fertőzések ellen antibiotikumok használatával szokták óvni a beteget, a kialakuló agyödémát szteroidok adagolásával ellensúlyozzák, míg a felhalmozódó agyvíz elfolyása érdekében söntöt alakítanak ki. Az agydaganatok kezelésére a sebészet mellett még más lehetőségek is vannak, ilyenek például a sugárkezelés, kemoterápia, immunterápia és ezek kombinációi. Az agydaganatok gyógyítása számos tumor típus esetében kedvezőtlen még a mai napokban is és kevés a gyógyulásra való esély. Azonban sok ember vesz körül minket, akiknek sikerült legyőzniük a tumort, de olyanok is, akiknél diagnosztizálták a tumort, ellenben hosszú évekig boldog életet élnek együtt a betegségükkel, folyamatos orvosi kontroll mellett. 7
Második fejezet Az agyi tumor szegmentálásának módszerei A végső cél az agydaganat elemzésében az, hogy kinyerjük a beteg specifikus, fontos információkat és ezek diagnosztikai funkcióit. Ezek az információk bele vannak épülve a többdimenziós képadatokba, amely útmutató lehet a tumor detektálásában. Ezeket a folyamatokat egy piramisban lehetne ábrázolni. A piramis minden szintjén különleges technikák találhatók az adatok feldolgozására és az információk kinyerésére. A hatékony feldolgozást, megjelenítést, valamint elemzést az adathalmazon nem lehetne elérni, ha nem lennének nagy teljesítményű számítógépes rendszerek nagy teljesítményű processzorokkal, tárhelyekkel, hálózattal és képfeldolgozó egységgel. És meg ne feledkezzünk a szoftver programokról, amelyek használják ezeket a számítógépes elemeket. Egy ilyen szoftver írásához, amely elvégzi az agyi tumor detektálását, a mögöttes problémák részletes megértése szükséges és egy bizonyos tudás a megszerzett adatokról. Ilyenek például az adatok jellege, a tanulmány célja, tudományos vagy orvosi érdeklődés, stb. A többdimenziós képek több információt és több típusú attribútumot hordoznak magukban, ezáltal döntő szerepet játszanak a képek hatékony szegmentálásában. Mint ahogy azt Bhandar [5] is kimondja, a fő célkitűzése a képek szegmentálásának az, hogy felosszuk a képet egymást kölcsönösen kizáró régiókra oly módon, hogy régiók a térben összefüggők és a pixelek a régión belül homogének legyenek egy előre meghatározott kritérium alapján. Ez a meghatározás önmagában egy jelentős korlátozást jelent a legtöbb szegmentálási módszerrel szemben, főleg amikor kóros szövettípust szeretnénk meghatározni és detektálni. Az agyi tumor is egy ilyen szövettípusnak tekinthető, mivel anatómiai struktúrája, bonyolult alakja és megtalálási helye betegről-betegre változik. Az agydaganatok esetében a szegmentáció folyamata abból áll, hogy elválasztjuk a különböző tumoros szöveteket a normál agyi szövetektől, mint például a szürke állomány (gray matter, GM), fehér állomány (white matter, WM) és agy-gerincvelői folyadék (cerebrospinal fluid, CSF). Az agydaganatok tanulmányozásában az abnormális szövetek létezése könnyen kimutatható volt az idők folyamán. Mindazonáltal, ezeknek a pontos és reprodukálható szegmentálása nem egyszerű feladat. Az agyi tumor szegmentálási metódusokat három kategóriába sorolhatjuk a felhasználói beavatkozás módozata szerint, amelyek a következők: manuális-, félautomata-, és teljesen automata módszerek. Az alábbiakban részletesebben bemutatom ezeket a kategóriákat.
8
2.1. Manuális szegmentálás
Manuális szegmentálás alatt azt értjük, amikor az agytumor határait kézzel (manuálisan) berajzolják. Ezt a folyamatot olyan emberi szakértők (orvos szakértők, radiológusok, vagy képzett technikusok) végzik, akik nem csupán a szemükkel megkülönböztetett színek szerint rajzolják be a tumor régióit, hanem igénybe veszik anatómiai tudásukat is. A kézi körülhatároláshoz egy olyan szoftvereszköz szükséges, amely nagyon kifinomult grafikus felülettel rendelkezik. Ez a bizonyos szoftver megkönnyíti a szakértők számára a régiók kirajzolását és a kép jó minőségű megjelenítését. A gyakorlatban a tumor régióinak kiválasztása egy unalmas és időigényes folyamat. Az MRI képalkotó berendezések számos kétdimenziós keresztmetszetet (szeletet) generálnak az agyról és az emberi szakértőnek szeletenként végig kell mennie a hatalmas adathalmazon és gondosan behatárolnia a legreprezentatívabb területeket. Ellenben, ha ezt a folyamatot nem egy szakértő végzi, akkor a szegmentálás eredménye nagyon gyenge minőségű lesz, az ilyen adat döntéshozatali rendszerek megvalósítására nem használhatóak. A manuális szegmentálás eredménye egy hasznos építőkocka lesz a félautomata és automata módszerek felépítésében. Az ilyen manuálisan szegmentált képeket alapigazságként (ground truth) szokták felhasználni, egyrészt felügyelet nélkül tanuló rendszerek ellenőrzéséhez, másrészt felügyelettel tanuló rendszerek tanításához és teszteléséhez. A félautomata és ideális esetben a teljesen automata, szegmentáló metódusok megbízhatóbban (emberi hibafaktorok miatt) és egyértelműen gyorsabban működnek, mint a manuális szegmentálás. Azonban a kézi szegmentálást még a mai napig széles körben alkalmazzák a klinikai vizsgálatokban, különösen ahol sok az emberi tudás és szakértelem a szövetek megkülönböztetésében.
2.2. Félautomatikus szegmentálás A félautomatikus szegmentálás során gyakran szükség van emberi beavatkozásra, melynek fontos szerepe lehet a metódus inicializálásánál, az eredmény pontossága ellenőrzésénél, vagy akár az eredmény manuális javításában. Az interaktív agyi tumor szegmentálási eljárásoknak fő összetevői a következők: a számítási rész, az interaktív rész és a felhasználói interfész. A számítási rész a programnak egy olyan része, amely néhány paraméter alapján képes körülhatárolni az agydaganatot. Az interaktív rész felelőssége az információk közvetítése a számítási rész és a felhasználó között oly módon, hogy a kiszámított és feldolgozott adatokról ad egy vizuális visszajelzést a felhasználó számára. A tényleges kommunikáció a számítógép és a felhasználó között a kimeneti és bemeneti eszközök segítségével valósul meg a 9
felhasználói felületen keresztül. A felhasználó elemzi a képernyőn vizuálisan megjelenített információt és megfelelően reagál, visszajelzést adva a számítási résznek. A felhasználói beavatkozást az agyi tumor szegmentálásban három fő kategóriába lehet csoportosítani: inicializálás, beavatkozás vagy válasz visszajelzése, és értékelés. A legtöbb módszer egy vagy több interakcióból áll, melyet a következőképpen lehetne összefoglalni:
Inicializálás: Bemenő argumentumok vagy paraméterek (akár billentyűzet, egér vagy más bemeneti eszközökről); képek előfeldolgozása a minőség növelése érdekében (élesítés vagy zaj eltávolítása); a bonyolultság értékelése a bemenő adatok alapján; a felhasználó kiválasztja a célobjektumot egy kezdeti szelet alapján, ami feldolgozásra fog kerülni.
Beavatkozás / Válasz visszajelzése: Az adatfeldolgozás folyamatos irányításából áll a kívánt eredmény felé; a folyamat megállítása félúton nem kívánt eredmény esetén, korrekciók végrehajtása és azt követően a folyamat folytatása.
Értékelés: A folyamat végső eredményének a kiértékelése, hogy megállapítsuk azt, hogy az eredményeink helyesek és kielégítőek voltak-e. Ellenkező esetben, ha nem voltak kielégítőek az eredmények, változásokat hajtunk végre a bemenő argumentumokon és paramétereken és újra megismételjük a teljes folyamatot.
Amióta a félautomatikus módszerek különböző stratégiákat alkalmaznak a számítógépek és az emberek szakértelmének kombinációjában, azóta az eredmények nagyban függnek a stratégiától és a számítási folyamattól. Ezek a stratégiák magukba foglalhatják a felhasználót az inicializálás során, miközben a felhasználó felügyeli az egész folyamatot.
2.3. Teljesen automatikus szegmentálás A teljesen automatikus módszerek azok, amikor a számítógép elvégzi a tumor szegmentálását bármilyen emberi beavatkozás nélkül. Ezek az algoritmusok magukba foglalják az emberi intelligenciát és az előzetesen megszerzett tudást. Az agyi tumor automatikus detektálása egy érdekes kutatási terület a gépi tanulás és formafelismerő rendszerek terén, mert ez egy olyan feladat, amelyet az ember hatékonyan meg tud tanulni. Ugyanakkor egy hasonló rendkívül pontos automatikus rendszer építése és fejlesztése a mai napig egy kihívást jelent a kutatók számára, mivel az emberi magas szintű vizuális feldolgozási képességet nem könnyű a számítógépre kiterjeszteni. Az implicit vagy explicit anatómiai ismeretek használata, mint például a méret, alak, elhelyezkedés, a tumor várható megjelenése és a kétoldalú szimmetria különösen fontos a robosztus automatikus módszereknél. Ezt a tudást be lehetne építeni a szegmentációs modellbe kezdeti feltétel formájában, megszorítva ez által a modellen az alak paramétereit, adatok korlátozását, illetve a modell illesztési eljárásait. Az automatikus 10
szegmentáláshoz lényeges elem, hogy legyen egy modell, amely nemcsak leírja a tumor méretét, alakját, elhelyezkedését és annak megjelenését, hanem lehetővé teszi ezeknek a jellemzőknek a várható variációit is. Azonban ilyen teljesen automatikus szegmentáló algoritmussal rendelkező rendszer még egyetlen orvosi környezetben sem található meg. Jelenleg,
teljesen
automatikus
szegmentáló
módszereket
nagy
mennyiségű
képadathalmazokon alkalmaznak, kizárólag kutatási környezetben. Ugyanakkor meg kell jegyezni, hogy ezek a metódusok nem váltak még népszerűvé a klinikai környezetben gyakorlók (radiológusok, neurológusok, és kisebb-nagyobb mértékben patológusok) körében.
2.4. Felügyelet nélkül és felügyelettel tanuló szegmentálás Mint azt már korábban említettem, a képek szegmentálásában az a fő cél, hogy felosszuk a képet egymást kölcsönösen kizáró régiókra, amelyek homogének egy előre meghatározott kritérium szerint. Az agyi tumorok esetében a szegmentálás abból áll, hogy elválasszuk egymástól a különböző tumoros szöveteket a normál agyi szövetektől (GM, WM, CSF). Az agydaganat detektálásához szükséges egy objektív mutató, amelyet a szövetek közötti homogenitás meghatározására szokás használni. Két módszer segítségével lehet előállítani ezt a mutatót, éspedig felügyelet nélküli és felügyelt szegmentálási módszerek által. A különbség a kettő között az, hogy a felügyelet nélküli módszerek nem használják a manuálisan kiválasztott tanulási adatokat, mint a felügyelt szegmentálási módszerek. A felügyelet nélküli szegmentálás esetében az osztályok (classes, c) száma automatikusan van meghatározva egy bizonyos algoritmus által, amelyik számszerűen csoportosítja a hasonló pixeleket. A következőkben részletesebb leírást adok e két módszerről.
2.4.1. Felügyelet nélküli szegmentálás
Amikor a képadatok nincsenek kiválasztva, manuálisan megjelölve, akkor a kép szegmentálható különböző klaszterező algoritmusok használatával. Ebben az esetben nem emberi tényező által lesznek a tanulási adatok kiválasztva és megjelölve. Ehelyett a képhalmaz összes képpontja alá van vetve egy klaszterező algoritmusnak, és a klaszterek algoritmikusan lesznek meghatározva. Sőt, amikor megtaláltunk egy klasztert, azt algoritmikusan hozzá kell rendelnünk egy fizikai (szövet) elemhez. Ez a fajta szegmentálás egy anatómiai objektív mutató vagy kép-alapú objektív mutató segítségével hajtható végre minél jobb szegmentálási minőség elérése érdekében. Az előbbi cél az volt, hogy a képet különböző homogén régiókra szegmentáljuk és megtudjuk az anatómiai tulajdonságait, míg itt a kép-alapú mutató esetében a
11
szegmentálás minősége a régiók kiértékelésén alapszik a hasonló intenzitások és textúrák által. A felügyelet nélküli szegmentálás célja az, hogy egy anatómiai objektív mutató által szegmentálja a képet legalább két anatómiailag értelmes régióra, amelyek közül az egyik a tumor vagy az ödéma. Ezek a megközelítések az alkalmazási területeken korlátozva vannak, mivel a legtöbb javasolt módszer középpontjában kizárólag a szegmentáció fokozása van jelen a tumoros területeken. Mivel a kép-alapú objektív mutató használatával képesek vagyunk komplikáltabb esetekben is, különböző régiókban is megtalálni a tumoros szöveteket, ezért a felügyelet nélküli szegmentálás nagyobb kihívást jelent a kutatók számára és ezért is próbálnak továbbá nem használni anatómiai objektív mutatót. Viszont ennek a megoldásnak már három nagy hátrányára is rámutattak a kutatók: a régiók számát gyakran előre meg kell határozni, a daganatok több különböző területre lehetnek felosztva, és a tumorok nem egyértelműen meghatározott intenzitással vagy szöveti határokkal rendelkeznek. Ezeket a hátrányokat csökkenteni lehet azáltal, hogy egy előzetes feldolgozási technikát alkalmazunk a képeken az inhomogenitás javítása érdekében. Ilyen például a koponya eltávolítása a képekről az agyi szövetek és nem agyi szövetek intenzitásainak keveredése elkerülése végett. Ez egy fontos folyamat a képek előfeldolgozásában, amelyet el szoktak végezni, még mielőtt alávetik a képadatokat bármilyen szegmentáló algoritmusnak.
2.4.2. Felügyelettel tanuló szegmentálás
A felügyelettel tanuló képszegmentálás módszere különbözik a felügyelet nélküli szegmentálási metódusoktól abban, hogy felhasználja a tanulási adatokat. A felügyelt osztályozás magába foglal egy tanulási szakaszt, amikor a meglevő adatokból megtanul egy modellt, és egy tesztelési szakaszt, amit arra használ, hogy a jelöletlen adatokat is besorolja egy osztályba. Felügyelt szegmentálás esetén a tanulási adatok megválasztása döntő fontossággal bír, mert ez befolyásolhatja a tanulási folyamat idejét és potenciális különbségeket hozhat be a szegmentálás eredményeiben. Ennél a szegmentálási módszernél az üzemeltető dönti el, hogy hány szövet osztály létezik a képen. Az agyi tumor szegmentálási feladatánál felügyelt tanulás esetén ajánlatos a normál és tumoros szöveteket külön osztályokba sorolni az intenzitás különbségek alapján. Ez a koncepció alapján a tanuló fázisban megtanítjuk a modellt, amely az MR képpontok intenzitás különbségét használja a normál és tumoros pixelek meghatározására. A tesztelő fázisban pedig használjuk a már meglévő modellt a jelöletlen pixelek osztályozására és besoroljuk őket az egyik osztályba az intenzitásuk alapján. A tanulási és tesztelési adatok forrása nagy befolyással bír a felügyelettel tanuló algoritmus teljesítményében. Két különböző tanulási és tesztelési forrást különböztetünk meg, a 12
beteg-specifikus tanulást és a betegek közötti tanulást. Az előbbinél a tanulási adatokat a szegmentálási képekből nyerjük ki és ebben az esetben a tanulási és tesztelési adatok ugyanazok. A tanulást egy adott szelettel végezzük el, míg a tesztelést a szomszédos szeleten hajtjuk végre. A betegek közötti tanulás során a tanulást több különböző betegtől nyert adaton végezzük el, míg a tesztelést csupán egy betegtől nyert adathalmazon hajtjuk végre. Itt is a tanulási és tesztelési adatok ugyanazok, a tanulás ugyanazon a szeleten és tumor típuson keresztül történik több betegtől nyert adathalmazon, a tesztelés pedig ugyanazon a tumor típuson megy végre több különböző beteg esetében. A legfőbb előnye a felügyelettel tanuló szegmentálásnak az, hogy a tanulási adatok megváltoztatásával könnyen el lehet végezni különböző agyi szegmentálásokat. Ezzel a módszerrel elérhető a manuális feladatok lényeges csökkentése a jelölt adatok, a megfelelő függvények és paraméterek megválasztása által. Hátránya viszont az, hogy a tumor változatossága miatt a módszer mindig új beteg-specifikus tanulási adatot igényel.
2.5. A szegmentálás módszerei Az MRI felvételek számítógépes feldolgozása gyakorlatilag egyidős az MRI képalkotással. Az utóbbi három évtizedben a számítógépek fejlődése lehetővé tette egyre nagyobb memória- és számításigényű algoritmusok megvalósítását. Kezdetben egyszerű, egy lépésből álló képfeldolgozási eljárásokkal próbálkoztak, míg manapság összetett, a gépi tanulás algoritmusainak széles spektrumát kombináló módszerek látnak napvilágot. Az alábbi alfejezetek a szegmentáló eljárások egy-egy osztályát ismertetik.
2.5.1. Vágás (küszöbölés) alapú szegmentálás
Vágás során egy bemeneti intenzitásképet egy bináris képpé alakítunk egy küszöbértékkel való összehasonlítás útján. A bemeneti kép jellegétől és a keresett régió típusától függ, hogy a kimeneti bináris képen a fehér vagy a fekete folt lesz a keresett régió. A legegyszerűbb vágási művelet globális küszöbértéket alkalmaz. Ilyen esetben minden képpont intenzitását ugyanazzal a konstans küszöbértékkel hasonlítjuk össze. Az optimális küszöbérték meghatározását általában a bemeneti kép hisztogramja alapján végzik el. Mivel a két szétválasztandó régió (a tumor és az agy) intenzitás hisztogramja részben fedi egymást, nem lehetséges ezeknek egy ideális szétválasztása egyetlen globális küszöb alkalmazásával. További nehézséget jelenthet bizonyos árnyékeffektusok, zajok, és az ún. inhomogén intenzitás jelenléte a képen. 13
Gibbs és mtsai [16] 1996-ban bevezettek egy felügyelet nélkül tanuló eljárást T1 súlyozású MRI felvételek szegmentálására. Ez a módszer egy manuálisan beállított ROI segítségével megállapít egy kezdeti küszöbértéket, majd egy iteratív eljárással keres olyan foltokat a képen, amelynek intenzitása lényegesen eltér a környezetének intenzitásától. A vágás alapú szegmentálás rugalmasabbá tehető lokális küszöbérték használatával. A lokális küszöbértéket előzetes információ és lokálisan átlagolt MRI képek statisztikai tulajdonságai alapján határozzák meg. Stadlbauer és mtsai [33] egy Gauss-féle eloszlással közelítette meg a T2 súlyozású képek intenzitásait, majd az extrém (oda nem illő) objektumok (pl. tumor) detektálására az átlag plusz/mínusz 3 standard deviáció küszöbértéket használták.
2.5.2. Régió alapú szegmentálás
A régió alapú szegmentálás célja a képpontokat olyan összefüggő, homogén régiókra osztani, amelyek: (i) diszjunkt régiók, (ii) együttesen lefedik a teljes képet, (iii) bármely két szomszédos régió egyesítése nem homogén területet eredményezne. A régió alapú szegmentálásnak két fő alosztályát alkalmazták agyi MRI képek feldolgozására. Ezek az alosztályok egyrészt a régiónövesztés különféle verzióit, másrészt a víztárolók (watershed) módszerét takarják. A régiónövesztés alapelve az, hogy egy kezdeti jól megválasztott képpontból kiindulva elfoglaljuk mindazon szomszédos képpontokat, amelyek együttesen egy homogén régiót alkotnak. Ezt addig ismételjük, amíg a teljes képet lefedtük régiókkal. Az eredmény nagyban függ a kezdőpontok megválasztásának módjától. Az MRI feldolgozó alkalmazások egy része lehetőséget ad kezdőpontok manuális megválasztására. A kialakult régiók alakja gyakran utólagos módosulásra szorul, morfológiai műveletekkel szokták a határvonalakat kiegyenesíteni. Kaus és mtsai [20] előbb apró homogén régiókra osztották a képet egy statisztikai osztályozó eljárással, majd ezeket egyesítették a régiónövesztés elvei alapján. Végül morfológiai műveletekkel simították ki a tumor körvonalát. Nem vették viszont figyelembe azt, hogy a régiónövesztés nem kezeli helyesen az ún. összetett képpontokat (partial volume effect, PVE). Ez az a jelenség, hogy mivel a képek felbontása nem túl erős, egy képpont tartalmazhat többféle szövetet és ilyenkor az MRI átlagolt intenzitást mutat ezekben a képpontokban. Salman [31] módosította a régiónövesztés algoritmusát, a képi intenzitások gradiensének figyelembe vételével és a PVE kompenzálásával, és kimutatta, hogy a módosított eljárás precízebben határozza meg a tumor körvonalát.
14
Az egyre gyorsabban számoló számítógépek lehetővé tették több intenzitáscsatorna figyelembe vételét a régiónövesztő algoritmusok végrehajtásánál. Egy ilyen megoldással találkozunk Deng és mtsai [11] munkájában. A watershed típusú szegmentáló eljárások egy egycsatornás intenzitásképen az az elv szerint jelölnek ki homogén régiókat, ahogyan a vízgyűjtő medencéket szokták meghatározni domborzati térképeken. A legkevésbé komplex számításokat végző watershed eljárás a domborzatként értelmezett gradiens képre hulló esőcseppek útját követi, azt határozza meg lokálisan minden egyes képpontra, hogy onnan hova folyik kifelé, illetve melyik szomszédoktól folyik befelé a víz [35]. A watershed eljárás túlszegmentált képet eredményez, amelyen kisméretű homogén régiók vannak, melyeket utólag egyesítgetni kell a szomszédosság és homogenitás elve alapján. Watershed típusú szegmentálást számos tumor detektáló eljárás alkalmazott, pl. Letteboer és mtsai [24]. Cates és mtsai [8] félautomatikus hierarchikus watershed szegmentálást alkalmaztak agyi tumor detektálására MRI képekből. Ezzel az eljárással jelentős előrelépést tettek mind kvalitatív, mind kvantitatív vonalon a manuális szegmentáláshoz viszonyítva, és rámutattak a watershed technikák jellegzetes hibájára, amely olyankor jön elő, amikor egy objektum körvonala bizonyos részeken nem nagyon látszik. Kong és társai [22] kidolgoztak egy eljárást a watershed túlszegmentált képeinek utófeldolgozására, fuzzy c-means klaszterezés segítségével.
2.5.3. Szegmentálás képpontok osztályozásával
A képpontok osztályozása legtöbb esetben az intenzitás értékek hasonlósága vagy különbözősége alapján történik. Az osztályozás célja az egymáshoz hasonló intenzitású képpontok azonos csoportba, míg az eltérő intenzitásúak különböző csoportokba való besorolása. Az ilyen eljárások alapvetően nem törekednek összefüggő ponthalmazok kijelölésére, ugyanis a képpont helyét nem veszik figyelembe. A képpontok különbözőségét legtöbb esetben euklideszi vagy Mahalanobis távolsággal mérik [17]. A továbbiakban megkülönböztetünk néhány osztályozó algoritmus családot, melyek gyakran szerepelnek agyi MRI képek szegmentálási alkalmazásaiban.
15
2.5.3.1. Fuzzy c-means klaszterezés
A fuzzy c-means (FCM) klaszterező eljárás egy valószínűségi fuzzy partíciót hoz létre a bemeneti kép vagy volume összes képpontja részére, melyek egy előre meghatározott számú (c) osztályba lesznek besorolva az intenzitásaik és a fuzzy kitevő függvényében [3]. Az agyi régiók (WM, GM, CSF, tumor, stb.) szegmentálásakor az alkalmazások többsége a keresett régiók számát adja meg előre beállított klaszterszámnak [6]. Az eredmények pontosságát korlátozza az a jelenség, hogy a különféle régiók intenzitástartományai részlegesen fedik egymást. E nehézség elkerülése érdekében szoktak osztályozni többcsatornás MRI felvételeket (T1, T2, T1C, PD, FLAIR). Egy másik irányvonalat képviselnek azok a megoldások, amelyek előzetes információt vagy ún. atlaszt használnak: az agy hozzávetőleges térképének a priori ismeretében könnyebb eldönteni egy átfedett intenzitású képpontról, hogy inkább melyik osztályba érdemes sorolni. Clark és mtsai [10] három csatornás MRI metszetekhez (T1, T2 és PD) építettek egy ismeret alapú segítséget használó FCM eljárást, és ez által értek el jelentős javulást a szegmentálás minőségében. Fletcher-Heath és mtsai [14] a fenti eljárást kiegészítették a tumorok térbeli alakjának felismerésével. Az FCM algoritmus alapján működő szegmentáló eljárás kiterjeszthető az inhomogén intenzitású MRI képek kompenzálására is [40]. Ez ugyan lassítja a szegmentálás menetét, de pontos eredményhez vezet inhomogenitás jelenlétében [32]. Szilágyi és mtsai [37] 2012-ben bevezettek egy olyan gyorsított FCM alapú, az inhomogenitás kompenzálását is elvégző, szegmentáló eljárást, mely az iteratív eljárás során a pillanatnyi kompenzált kép hisztogramját használja az azonos intenzitású képpontok együttes kezelésére.
2.5.3.2. Markov véletlen mezők
A Markov véletlen mezők (MVM) elterjedése a képfeldolgozásban annak köszönhető, hogy képesek az egymással szomszédos képpontok közötti összefüggéseket modellezni. Amennyiben egy adott képpont erősen meg van jelölve tumor régióhoz tartozónak, akkor annak szomszédjai is jó eséllyel oda fognak tartozni. Az MVM lehetővé teszi az ilyen erős besorolás kiterjesztését a szomszéd képpontokra. Ennek a tulajdonságának köszönhetően az MVM képes csökkenteni a zaj kedvezőtlen hatását a szegmentálásra nézve [7]. Gering és mtsai [15] egy többszintű MVM modellt vezettek be, melyekkel modellezték a képpontok intenzitását, strukturális koherenciáját, térbeli helyzetét, és a felhasználói bemenetet. Ez a modell képes volt egy képpontnak egy adott szinten levő besorolását befolyásolni a többi szintet meglevő egybehangzó besorolás esetén.
16
Bauer és mtsai [2] háromdimenziós, T1 súlyozású MRI felvételeket feldolgozó, automatikus eljárást dolgoztak ki MVM alkalmazásával. Egy térbeli atlasz és a bemeneti képi adat közti korrelációt egy tumor növekedési modell felhasználásával valósították meg, egy energiaminimalizáló eljárás keretében. Ez a módszer jelentősen gyorsabban működött a kortársainál és hasonló eredményeket adott.
2.5.4. Neurális hálózatok
Amennyiben neurális hálózatokat alkalmazunk képpontok osztályozására, szükséges előzetesen a rendelkezésre álló adatokat felosztani tanulási és teszt adatokra. Mindkét adathalmazból ugyanazokat a jellemzőket nyerjük ki, melyek alapján megvalósítjuk az osztályozó tanítását és tesztelését. Özkan és mtsai [27] paciens specifikus adatokkal tanították a neurális hálózatot. Manuálisan kiválasztottak egy olyan metszetet a volume-ból amelyben tisztán látható a tumor és ennek a metszetnek a jellemzőivel hangolták a neurális hálót. Ezt követően a hálózaton osztályozták a szomszédos szeletet. Azok a képpontok jellemzői, amelyek a két szomszédos szeletben ugyanazon helyen voltak és a besorolásuk is egyezett, tanulási adatul szolgáltak a következő szomszéd feldolgozásához. A módszer hátránya, hogy osztályozás közben is tanul, tehát a működése lassú. Dickson és Thomas [12] megoldása 50 db, más pácienstől származó, de azonos pozíciójú kézzel feldolgozott metszetet használt tanulási célra. Az automatikus osztályozáshoz nem csak intenzitásokat, hanem a szomszédos képpontok intenzitásainak átlagát és a képpont pozícióját is felvették a jellemzők közé. Az önszerveződő hálózatok (self-organizing map, SOM) alkalmazása egy speciális fejezetnek számít az agyi tumorok szegmentálásában, ugyanis az agyi neuronok szerveződési módja erősen hasonlít ehhez a számítási modellhez. Reddick és mtsai [30] megoldásában egy SOM-ot alkalmaztak a multispektrális MRI képek homogén foltjainak megkülönböztetésére, majd ezeket a foltokat egy perceptron hálózattal osztályozták. Vijayakumar és mtsai [39] egy SOM-mal osztályozták a különféle elváltozásokat (tumor, necrosis, ciszta, ödéma, normál szövet) az agyban (T2 és FLAIR súlyozású képekből), valamint az agyi tumor előrehaladottsági fázisát is becsülték. Iftekharuddin és mtsai [19] fraktál és fraktál-wavelet jellemzőket is alkalmaztak a SOM hálózat képességeinek feljavítására. Az ő rendszerük három színcsatornával dolgozott (T1, T2, FLAIR).
17
2.5.5. Modell alapú szegmentálás
A képpontok osztályozását megcélzó alkalmazások leginkább 2D szegmentálásban bizonyultak sikeresnek. A térbeli struktúrák felismerésének magas számításigénye miatt szükség van megközelítő módszerekre, amelyek a kisméretű struktúrákat képesek elhanyagolni. Ez utóbbi kategóriába tartoznak a kontúrmodellek, melyek lehetnek parametrikusak vagy geometrikusak. Léteznek olyan megoldások is, amelyek statisztikai alapon képesek bizonyos alakzatokat és jellegzetes textúrákat megtanulni, de ezek a mi esetünkben nem hatékonyak, mivel a tumorok rendkívül változatos alakokat ölthetnek. A parametrikus kontúrmodell (vagy másik nevén: snake) explicit módon modellez egy mozgó kontúrt, a kontúrpontok koordinátáinak ismeretében. Egy energiafüggvény minimalizáló feladat formájában fogalmazza meg a szegmentálást, ahol a legkisebb energiát várhatóan a keresett
objektum
körvonalánál
érjük
el.
Az
energiafüggvény
külső
és
belső
energiakomponenseket tartalmaz. A belső energiák a kontúr megnyúlását és görbülését szabályozzák és korlátozzák. A külső energiák a képen levő gradiens mezőtől függnek. Az agyi tumorok detektálásában a parametrikus kontúrmodelleket inkább 2D metszetek feldolgozására használták [26]. A geometrikus kontúrmodellek implicit módon, egy skaláris tér zérus szinthalmazaként modellezik a keresett kontúrt. A modellezett határfelületet mozgató és megállító erők megválasztása szerint e módszerek számos variánsa létezik. Legtöbbjük pontos szegmentálást végez 3D adatokon, de rendkívül számításigényesek [9, 18].
18
Harmadik fejezet Elméleti megalapozás
3.1 Gépi tanulás A tanulás fogalmának meghatározása nem olyan egyszerű, hiszen tanulásnak nevezhető az ismeretek, tapasztalatok egyszerű memorizálása, de tanulásnak tekinthető egy, a tapasztalatok alapján kialakított teljes tudományos elmélet létrehozása is. Az élő szervezetek, élőlények tanulásán kívül létezik gépi tanulás is. Ez olyan gépeket foglal magába, amelyek képesek a tanulásra. A gépi tanulás során egy gép vagy tanuló rendszer a környezetéből nyert ismeretek alapján javítja a teljesítőképességét. Valójában a tanulás gépek esetében olyan algoritmusok kifejlesztését jelenti, amelyek segítségével a teljesítőképesség javítása automatikusan történik. A gépi tanulást a neurális hálózatok tanulási képességeivel szokták asszociálni. A neurális hálózatok legfőbb jellemzője az adaptációs tanulási képesség. A neurális hálózatokban a tanulás egyszerűen a rendszer valamilyen képességének javítását jelenti. Így tanulásról beszélhetünk, amikor olyan hálózat-architektúrát illetve paramétereket (súlyvektort) keresünk, amely mellett egy hálózat egy adott függvénynek a minél jobb approximációjára lesz képes, de tanulás során egy hálózat azon képessége is fejleszthető, amely a bemenetére kerülő minták közötti hasonlóság megállapítását teszi lehetővé. A neurális hálózatok főbb tanulási formái:
Tanítóval történő tanulás (ellenőrzött vagy felügyelt tanulás)
Tanulás tanító nélkül (nem ellenőrzött vagy felügyelet nélküli tanulás)
Analitikus tanulás
Ellenőrzött tanulásnál a hálózat összetartozó be- és kimeneti értékei, ún. tanítópárok állnak rendelkezésre. A tanítás azon alapszik, hogy ismertek a hálózatnak valamely bemenetekre adandó kívánt válaszai, így a hálózat tényleges válasza minden esetben közvetlenül összehasonlítható a kívánt válasszal. Az összehasonlítás eredménye- a tényleges és a kívánt válasz különbsége- felhasználható a hálózat olyan módosítására, hogy a tényleges válaszok a kívánt válaszokkal minél inkább megegyezzenek, a hálózat kimenete és a kívánt kimenet közötti különbség csökkenjen. Ellenőrzött tanulásról beszélünk akkor is, amikor a kívánt válasz pontosan nem ismert, csupán annyit tudunk, hogy a hálózat válasza helyes vagy nem. Ezt megerősítő (reinforcement) tanulásnak nevezzük. 19
A neurális hálózatok tanításáról lévén szó, említést kell tenni a tanítási folyamat fontosabb lépéseiről. Amint ismert az információ, egy neurális háló súlyzóiban van eltárolva, és a tanítási folyamat ezen súlyozók meghatározását, beállítását, módosítását jelenti. A tanítás egy ciklikusan ismétlődő folyamat, amely során a tanító halmazból egyenként vesszük a bemeneteket, megmutatjuk a hálónak, felhasználva az aktuális súlyzókat, az adott bemenetre kiszámoljuk a háló kimenetét, majd az elvárt érték és a kiszámolt érték között számolunk egy hibát. A hibát majd alkalmazzuk a súlyzók módosítására. A tanítási algoritmust két különböző osztályba sorolhatjuk, attól függően, hogy milyen módon határozzuk meg a hibát, éspedig minden bementre egyenként számolunk egy hibát, majd minden egyes bemenet után tanítjuk a háló súlyzóit vagy csak a teljes tanító halmazra számolunk egy hibavektort, amely alapján csak egyetlen egyszer módosítjuk a súlyzókat. Első esetben a tanítás a hiba pillanatnyi értéke alapján történik (ezt a tanítási módot szokás online tanításnak nevezni) vagy a tanító halmaz minden egyes elemére kiszámolt globális hiba alapján (ezt a tanítási módot szokás batch tanításnak nevezni). Tanítási ciklus –A tanítás során a tanító halmazból veszünk egy be- és kimeneti elempárt. Az adott bemenetre kiszámoljuk a neuron (neurális háló) kimenetét. Az elvárt érték és kiszámolt értékből számolt hibát felhasználjuk a súlyzók (paraméterek) módosítására. A tanítás során vesszük egyenként a tanító halmazból az elempárokat, és minden elempárra elvégezzük a paraméter módosítást. Egy ilyen ciklust- a háló tanítását az összes elempárra - tanítási ciklusnak nevezünk. Egy neurális háló tanítása a tanítási ciklusok sorozatából tevődik össze. A tanítás befejeződését annak alapján dönthetjük el, hogy közben leellenőrizzük, hogy a háló teljesíti-e az elvárt feltételeket. A felügyelt tanítás esetében például minden tanítási ciklusra számolunk egy globális hibát, melyet ábrázolunk, és ha a hiba egy bizonyos küszöbérték alá kerül, leállítjuk a tanítást. A tanítás lényegében több fázisból tevődik össze -első fázis, amikor tanítjuk a hálót, és erre rendelkezésre áll egy tanító halmaz, amely ki-bemeneti elempárokat tartalmaz -egy tesztelő fázis, amikor leellenőrizzük a háló viselkedését olyan bemenetekre is, amelyek nem voltak jelen a tanító halmazban. Előfordulhat, hogy a tanítás sikerrel jár, de a tesztelés sikertelen. Ebben az esetben újra kell tanítani a hálót. Mindkét esetben százalékban szokták kifejezni, hogy a tanító halmaz hány százalékára viselkedik helyesen a háló. A sikeres tanítás és tesztelés után elmentjük a súlyzókat és alkalmazhatjuk a hálót. Ahhoz, hogy egy adott tizedesnyi pontossággal meg tudjuk határozni, hogy hány százalékban ad helyes eredményt a háló, a tanító halmaznak megfelelő számú elemet kell tartalmaznia. Ha 10 darab elemre tanítjuk a hálót, csak 10%-os 20
pontossággal tudjuk meghatározni a helyes működést. Ha 10 elemből egy elemre téved, azt jelenti, hogy 90% százalékban helyesen működik a háló. Nem ellenőrzött tanulásnál nem állnak rendelkezésünkre adott bemenethez tartozó kívánt válaszok. A hálózatnak a bemenetek és a kimenetek alapján kell valamilyen viselkedést kialakítania, a környezetből nincs semmiféle visszajelzés, ami a hálózat viselkedésének helyességére utalna. Ebben az esetben is rendelkezésünkre áll egy tanító halmaz, de csak bemeneteket tartalmaz, és nem tartalmazza az elvárt kimeneteket. Analitikus tanulás-a megfelelő viselkedést biztosító hálózat kialakítása elméleti úton, a feladatból határozható meg. Ebben az esetben nem is beszélhetünk tanulásról, a hálózat megfelelő kialakítása nem lépésenként, a környezetből szerzett információ fokozatos felhasználása révén, hanem analitikus módszerekkel végezhető el. Tanító halmaz - be és kimeneti elempárok, amelyek rendelkezésünkre állnak. Általában ezt egy táblázatban tároljuk.
3.2 A Fuzzy c-means algoritmus A fuzzy logika nem más, mint a bináris logikának egy általánosított formája. A fuzzy logika egy multivalens logikai rendszer. A bináris logika szerint egy elem egy halmazhoz vagy hozzátartozik, vagy nem, azaz az elemnek a halmazra nézve a tagságfüggvénye csak 0 vagy 1 értéket vehet fel. A fuzzy logika filozófiája szerint egy elemnek egy halmazra nézve a fuzzy tagságfüggvénye 0 és 1 közötti bármilyen valós értéket felvehet. A klasszikus logika szerint egy elem halmazba tartozása egyértelműen megállapítható. Egy tetszőleges elemről el tudjuk dönteni, hogy eleme-e az adott halmaznak vagy sem. Tehát az, hogy {a ϵ U} → {0,1}, egyértelműen eldönthető. Ha hozzá tartozik, akkor egy logikai igaz, ha nem, azt egy logikai hamis értékkel jellemeztük. Ha az egyszerűség kedvéért jelöljük a logikai igaz értéket 1-gyel, a hamis értéket 0-val akkor az, hogy egy elem beletartozik-e, U-ba jellemezhető vagy egy 0-val, vagy egy 1-gyel. A multivalens rendszerben az elem értelmezését így írhatjuk fel: a logikai érték {a ϵ U} → [0,1]. A fuzzy logika abban hoz újat, hogy a halmazba tartozás 0, illetve 1 értékei nem ennyire meghatározottak, hanem köztes értékek is léteznek, amelyek megmutatják, hogy egy adott elem mennyire tartozik bele a halmazba: nagyon, kissé, kevésbé, vagy egyáltalán nem. Így minden U halmazbeli elemhez hozzárendelünk egy számot, általában 0 és 1 közötti értéket, mely jellemzi az elemnek egy adott halmazba tartozásának mértékét.
21
Tehát a különbség a bivalens és multivalens rendszer között a logikai kifejezések értékkészletében van. A bivalens rendszer esetében a {0,1} halmaz két értéket tartalmaz, míg a multivalens rendszer a [0,1] intervallumban végtelen sokat. Szükség van egy rendszerre, amely megadja a logikai értéket a [0,1] intervallumból. A bivalens logikát alkalmazó, ún. hard c-means vagy k-means vagy Lloyd algoritmus, már a fuzzy logika bevezetése előtt is létezett [34]. Zadeh történelmi újítása, a fuzzy logika bevezetése [41], 1965-ben következett be, de ennek gyakorlati hasznosítása még sokáig váratott magára. Az osztályozó algoritmusok elmélete volt az egyik legelső alkalmazási irányvonal, ahol a fuzzy logika gyakorlatba lett ültetve. Ruspini 1969-ben vezette be a valószínűségi fuzzy partíciót [29], amelyben egy elemnek az összes osztály szerinti fuzzy tagságfüggvényének összege egy. Így a Ruspini-féle fuzzy tagságfüggvények az elemnek az adott osztályhoz tartozásának valószínűségét írták le. Ez valójában a fuzzy logika egy speciális értelmezése. A Ruspini-féle valószínűségi partíció számos klaszterező algoritmusban kerültek alkalmazásra. 1974-ben Dunn vezette be a k-means algoritmus első, fuzzy partíciót alkalmazó verzióját [13], melynek egy általánosításaként alkotta meg 1981-ben J. C. Bezdek a mai napig rendkívüli népszerűségnek örvendő fuzzy c-means (FCM) algoritmust [Bezdek81]. Bezdek fő újítása egy fuzzy kitevő (m) bevezetése volt, melynek segítségével hangolni lehet az FCM algoritmus fuzzy jellegét. A fuzzy kitevő értéke egy 1-nél nagyobb valós szám. Az 1-és érték a bivalens logikájú k-means algoritmust eredményezné, míg az m=2 eset egybeesik Dunn algoritmusával. Minden egyéb kitevő érték esetén egy újabb, valószínűségi fuzzy partíciót kapunk. Az FCM algoritmus valamely 𝑋 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 } halmaz elemeit osztályozza egy előre eldöntött számú (c) osztályba, valószínűségi fuzzy partíciót alkalmazva, egy négyzetes költségfüggvény optimalizálásával. Az FCM algoritmus költségfüggvénye:
𝑛
𝑐
𝑛
𝑐
𝑚 𝑚 2 𝐽𝐹𝐶𝑀 = ∑ ∑ 𝑢𝑖𝑘 ‖𝑥𝑘 − 𝑣𝑖 ‖2𝐴 = ∑ ∑ 𝑢𝑖𝑘 𝑑𝑖𝑘 𝑘=1 𝑖=1
𝑘=1 𝑖=1
ahol 𝑣1 , 𝑣2 , … , 𝑣𝑐 az osztályokhoz hozzárendelt reprezentatív elemek (prototípusok), 𝑢𝑖𝑘 az 𝑥𝑘 adatnak a 𝑣𝑖 által reprezentált osztályhoz tartozását leíró fuzzy tagságfüggvény értéke, m>1 a fuzzy kitevő, és 𝑑𝑖𝑘 = ‖𝑥𝑘 − 𝑣𝑖 ‖𝐴 = √(𝑥𝑘 − 𝑣𝑖 )𝑇 𝐴(𝑥𝑘 − 𝑣𝑖 ) az 𝑥𝑘 és 𝑣𝑖 közti általánosított távolság (A egy pozitív definit négyzetes mátrix). A költségfüggvényt valószínűségi megkötések mellett kell optimalizálni, amely szerint:
𝑐
∑ 𝑢𝑖𝑘 = 1
∀𝑘 = 1,2, … , 𝑛.
𝑖=1 22
A JFCM költségfüggvény optimumának megkeresését a parciális deriváltak zérus átmeneteiből számított formulákkal szokták elvégezni, Lagrange szorzók alkalmazásával [Bezdek81]. Az optimum keresés algoritmusát egy iteratív eljárásként kapjuk meg, melynek minden ciklusában az alábbi lépéseket kell elvégezni: 1. Új partíció számítása:
−2/(𝑚−1)
𝑢𝑖𝑘 =
𝑑𝑖𝑘
∀𝑖 = 1,2, … , 𝑐 ∀𝑘 = 1,2, … , 𝑛
−2/(𝑚−1) ∑𝑐𝑗=1 𝑑𝑗𝑘
2. Új osztály prototípusok számítása:
𝑚 ∑𝑛𝑘=1 𝑢𝑖𝑘 𝑥𝑘 𝑣𝑖 = 𝑚 ∑𝑛𝑘=1 𝑢𝑖𝑘
∀𝑖 = 1,2, … , 𝑐.
A fenti számításokat addig kell ismételni, amíg az osztály prototípusok konvergenciája bekövetkezik. Ez hozzávetőleg 20-50 iterációt jelent. Az FCM algoritmus inicializálásakor szükséges megválasztani az osztályok számát, a fuzzy kitevő értékét, és az összes osztály prototípust. Ez utóbbiaknál az a legfontosabb, hogy bármelyik kettő különbözzön egymástól. Érdemes viszont a prototípusokat a várható kialakuló helyük közelében inicializálni, ha lehetőségünk van ezt előre felbecsülni. Az FCM algoritmus, eredeti verziójában, meglehetősen időigényes. Egy iteráció elméleti komplexitása O(nc) rendű, ami azt jelenti, hogy a futási idő arányos az adatok számával és az osztályok számával. Amennyiben az osztályozott adatmennyiség nagy (értsd: milliós nagyságrendű), érdemes megvizsgálni bizonyos gyorsítási lehetőségek alkalmazhatóságát. Például amikor egy egyetlen színcsatornájú intenzitáskép képpontjait akarjuk osztályozni, érdemes annak a hisztogramja alapján számolni, ugyanis az azonos színű képpontok mindvégig ugyanazokat a fuzzy tagságfüggvényeket kapják. Így a milliónyi képpont helyett csupán néhány száz színt osztályozunk, akár 3-4 nagyságrenddel rövidebb idő alatt, az eredmény pedig tökéletesen ugyanaz lesz [36]. Több színcsatornás képek esetén is lehet ezt az elvet követni, de ott már szükség van egymáshoz nagyon hasonló színek azonosként való kezelésére, így a megrövidülő futásidőért az osztályozás pontosságával fogunk megfizetni [38]. Az FCM algoritmus memória igénye elég magas, ugyanis a partíció eltárolásához n×c db valós számot kell eltárolnunk. Ez sok millió adat esetén szintén problémát jelenthet. Létezik viszont egy olyan FCM verzió is a szakirodalomban [21], amely nem igényli a partíciós mátrix eltárolását. Az FCM optimalizáló iterációban az éppen kiszámolt uik értékeket nem tárolják el, (𝑢𝑝)
hanem egyből számolják az 𝑆𝑖
(𝑑𝑛)
𝑚 = ∑𝑛𝑘=1 𝑢𝑖𝑘 𝑥𝑘 és 𝑆𝑖
23
𝑚 = ∑𝑛𝑘=1 𝑢𝑖𝑘 összegeket, majd az
iteráció végén ezek aránya adja meg az új osztály prototípusokat. Ezzel a módosítással 3-4 nagyságrenddel is csökkenhet az FCM memória igénye. Fuzzy partícióból nem csak a Ruspini verziója létezik. Ruspini partíciója valószínűségi megkötést alkalmaz, és ez által leegyszerűsíti a fuzzy tagságfüggvények értelmezését, de ugyanakkor furcsa viselkedést ad az FCM algoritmusnak. Például, egy nagyon messze levő adat 1/c közeli valószínűséggel lesz besorolva minden osztályba, ami anomáliához vezet [4]. Az ilyenek kiküszöbölésére dolgozták ki a lehetőségfüggvényeken alapuló fuzzy logikát, mely szerint egy tagságfüggvény azt írja le, hogy az adott elem mennyire kompatibilis az adott osztállyal, az osztálynak az adott elem mennyire tipikus eleme. A lehetőségfüggvények fuzzy logikáját alkalmazó c-means algoritmust 1993-ban vezette be Krishnapuram és Keller [23]. Ennek viselkedése merőben eltér az FCM algoritmusétól, kiküszöböli annak hibáit, de korántsem tökéletes [1].
3.3 Adathalmaz A gliomák a leggyakoribb elsődleges agydaganatok a felnőttek körében, feltehetően a gliasejtek és a környező szövetekben alakulnak ki. Annak ellenére, hogy jelentős haladást értek el a gliomás agydaganatok kutatásában, mégis a betegeknél a diagnózis felállítása továbbra is gyenge eredményt mutat. Az adathalmaz, amin dolgoztam, a 2012-es Medical Image Computation and Computer Assisted Interventions (MICCAI) konferencia keretében megszervezett „MICCAI Challenge on Multimodal Brain Tumor Segmentation” verseny agyi tumoros képeiből származik. Az adatbázis teljesen anonimizált képeket tartalmaz, amelyek a következő intézményekből származnak: ETH Zürich, University of Bern, Debreceni Egyetem, és University of Utah. A képadatbázis multikontrasztos MR felvételekből áll, 30 gliomás pacienstől származik, amelyek közül 20 előrehaladott állapotban, 10 pedig kezdetleges stádiumban levő paciens. Minden beteg esetén multimodális (T1, T2, FLAIR, és post-Gadonílium T1) MR képek állnak a rendelkezésünkre. A felvételek átestek egy komplex előfeldolgozáson, melynek során minden kép a neki megfelelő T1 súlyozású képhez lett regisztrálva (igazítva), és átméretezve izotropikus 1mm-es pixelméretre. Továbbá minden képről el van távolítva a koponya. Egy 3D felvétel (volume) minden esetben 176 szeletből (metszetből) áll, egy-egy metszet mérete a volume-on belül mindig ugyanolyan, de nem minden volume esetében ugyanakkora. A legkisebb metszetek 160x216 pixelből állnak, míg a legnagyobb méret 216x232 pixel volt. A képek .tiff formátumban voltak közzétéve, melyekben minden képpont intenzitása egy 4 bájtos lebegőpontos számként volt eltárolva. Számszerűleg viszont mindegyik intenzitás érték egy egész szám, melynek értéke kb. 24
50 és 2000 közé esik. A nullás értékű pixeleket figyelmen kívül kell hagyni, azok nem az agy részei. Sajnálatos módon voltak olyan pixelek, amelyek nem mind a négy színcsatornán tartalmaztak nullától eltérő értéket. Ezekről röviden beszámolok az eredmények ismertetésénél. Az egymáshoz regisztrált metszetek ismeretében elmondhatjuk, hogy a vizsgált agyak minden egyes köbmilliméteres részét egy-egy négyelemű vektorral tudunk jellemezni. A vektor elemei a négy színcsatornából származó intenzitásértékek lesznek. Pontosabban: az intenzitás értékek logaritmusával számolunk, ahogyan ezt a szakirodalom javasolja (pl. [25]). Ezen kívül minden pixelnek van egy szakember által megállapított besorolása, amit a „Ground truth” metszetekből tudunk kiolvasni. Itt a nullás érték negatív pixelt jelent, az 1-es érték jelent ödémához tartozó pixelt, míg a 2-es értékek tumor pixeleket jelölnek. Jelen tanulmányban csak a tumor pixeleket próbáljuk megkülönböztetni a többitől.
3.4 Jaccard index, mint kiértékelési kritérium Egy volume képpontjainak osztályozása során mindegyik képpontnak adunk egy besorolást, amely szerint lehet „tumor” vagy „nem tumor” képpont. A kiértékelésnél arról kell valamilyen statisztikai (numerikus) mutatót megadnunk, hogy a képpontok besorolásai mennyire felelnek meg a szakember által felállított „alapigazságnak”. Definíció:
True positive (TP) minden olyan pixel, amit tumornak neveztünk és tényleg az.
True negative (TN) minden olyan pixel, amit nem tumornak neveztünk és tényleg az.
False positive (FP) minden olyan pixel, amit tumornak neveztünk, de nem az.
False negative (FN) minden olyan pixel, amit nem tumornak neveztünk és valójában tumor.
A fenti mutatókból szokták számolni az úgynevezett Jaccard indexet (JI), a következő formula szerint:
JI =
TP TP+FP+FN
Továbbá a szakirodalomban gyakran alkalmazzák a „Dice score” (DS) mutatót, melynek számítási módja:
2TP
DS = 2TP+FP+FN = 25
2 JI 1+JI
Negyedik fejezet Megvalósítás és eredmények 4.1 Az adatfeldolgozás menete Az adatok feldolgozásában az első lépés egy volume beolvasása: a bemeneti adatok 880 db .tif fájlban állnak rendelkezésünkre. Mind a 176 db metszet esetében van 4 színcsatornánk és az alapigazság. A képek előfeldolgozása során kimenetként kaptunk egy olyan tömböt, amely a képpontokat leíró logaritmált 4D intenzitásvektorokat tartalmazza. Továbbá egy másik kimenet egy újabb tömb, amely tárolja minden pixel térbeli helyzetét.
I. ábra: Bemeneti adatok: a HG15-ös volume 108-as metszetének 4 színcsatornája (T1, T2, T1C és FLAIR), valamint az alapigazság (szakember által kézzel bejelölt tumor és ödéma)
26
Beolvasáskor megszámoljuk és kiírjuk a hibás pixelek számát, típus szerint csoportosítva. Hibásnak vagy hiányosnak tekintjük azokat a képpontokat, melyeknek valamely (de nem az összes) színcsatornán zérus az intenzitása. Amelyik képpont mindegyik színcsatornán zérus, az a céltartományon kívül esik. Jelen tanulmány során felhasznált adatok volume-onkénti statisztikáját A tényleges adatfeldolgozásból a hiányos adatú pixelek is kimaradnak.
1. táblázat: A feldolgozott volume-ok fontosabb tulajdonságai. A metszetek száma mindegyikben 176 volt.
Volume
Méret
Pixelek száma
Ödéma
Tumor
Hiányos adat
HG01
160x216
1435938
52073
56743
428
2
160x216
1533860
39672
9029
598
3
176x216
1702191
133029
20558
66402
4
160x216
1198268
46054
60635
62
5
160x216
1469666
35545
24659
4215
6
216x236
1577073
103781
75337
538771
7
176x216
1569615
60181
28156
150
9
160x216
1255130
135135
83564
44426
11
176x216
1333310
98356
45806
81
12
176x216
1508141
13928
6577
106754
13
176x216
1451294
6350
4537
65428
14
176x216
1590059
26081
115286
198
15
160x216
1617051
108706
72310
214
Az I. ábrán megtekinthető a bemeneti adatinknak egy szelete. Az első tekintetre szembetűnik, hogy az agyi szövetek között nincs nagy intenzitás különbség. A tumor körvonala csak a szakavatott szemeknek egyértelmű. A számítógépet megtanítani a pontos szegmentálásra egy elég komoly kihívás. A II. ábra bemutatja egy teljes volume színcsatornánkénti és szövettípusonkénti hisztogramját. Ebből leginkább az látható, hogy a T1 színcsatorna nem igazán tudja megkülönböztetni a szövettípusokat. A többi három színcsatorna valamelyest tükrözi a szövetek különbözőségét. 27
T1 színcsatorna
T2 színcsatorna
2.0%
1.0%
1.0%
0.0% 0
400
800
normál szövet ödéma tumor
0.5%
1200
0.0% 0
1600
T1C színcsatorna 1.0%
0.5%
0.5%
400
800
1200
800
1200
1600
FLAIR színcsatorna
1.0%
0.0% 0
400
0.0% 0
1600
400
800
1200
1600
II. ábra: A HG01-es volume összes képpontjának hisztogramja a 4 színcsatornán külön-külön. A három szín az alapigazság szerint megkülönböztetett szöveteket (normál agy, ödéma, tumor) jelképezik.
A III. ábra megmutatja, hogy a különböző volume-okban található tumor képpontok intenzitásai ugyanazon a színcsatornán (FLAIR) belül is lényegesen eltérnek egymástól. Mindezek tükrében megállapíthatjuk, hogy a tumor felismerése és szegmentálása nem egy egyszerű feladat, hanem sokkal inkább egy erős kihívás a számítógép számára. A feldolgozás második lépése az FCM algoritmus inicializálását szolgálja. Mivel az FCM algoritmus eredménye nagyon függ a kezdeti osztályprototípusok megválasztásától, érdemes a bemeneti adatokat megvizsgálnunk és osztályprototípus vektor jelölteket javasolnunk az algoritmus számára. Ebben a lépésben is FCM algoritmust alkalmazunk, de színcsatornánként különválasztott adatokon. A teljes volume egy színcsatornájából kinyert skaláris adatokat hisztogram alapján gyorsított FCM eljárással osztályozzuk c=3 osztályba. Eredményként mindegyik színcsatornán kapunk három értéket, melyekről joggal feltételezhetjük, hogy az adott színcsatornán ún. agglomerációs pontok, azaz sok képpontnak van ezekhez hasonló intenzitása. A színcsatornánkénti 3 kapott értéket egymás között kombinálva kapunk 34 = 81 db négydimenziós klaszterközéppontot. Ezeket minőség szerint rangsoroljuk, ahol a minőség szempontja az, hogy minél több képpont intenzitásvektora legyen a klaszterközépponttól minimális távolságra. A minőségi rangsorolás után maximum 20-at klaszterközéppontot fogunk az FCM osztályozásnál felhasználni, mindig a legjobbakat.
28
Tumor képpontok intenzitásának hisztogramja a FLAIR színcsatornán HG01 HG02 HG03 HG04 HG05 HG06 HG07
Gyakoriság (%)
1.0
0.5
0.0 100
200
300 500 Abszolút intenzitás
1000
1500
Tumor képpontok intenzitásának hisztogramja a FLAIR színcsatornán 1.6 HG09 HG11 HG12 HG13 HG14 HG15
Gyakoriság (%)
1.2
0.8
0.4
0.0 100
200
300 500 Abszolút intenzitás
1000
1500
III. ábra: Az összes feldolgozott volume tumorhoz tartozó képpontjainak FLAIR színcsatornáján mért intenzitások hisztogramja, külön-külön mindegyik volume esetén
Mielőtt rátérnénk a volume-ok képpontjainak osztályozására alkalmazott eljárás ismertetésére, nézzük meg mi lesz egyetlen agyi metszet osztályozásából. A metszetet úgy választottuk meg, hogy aránylag nagy területen tumort és ödémát tartalmaz. Ez a metszet konkrétan a HG01 volume 100-as számú szelete. Az osztályozás eredményeit a IV. ábra ismerteti, míg a 2. Táblázatban meg lehet tekinteni a kialakult osztályok összetételét, melyet a szakember által megjelölt alapigazság szerint állapítottuk meg. A IV. ábrán a felső két sorban a bemenetet látjuk (négy színcsatorna és alapigazság), míg az ábra alsó két sorában az osztályozott képeket színcsatornánként és a kapott osztályokat színesben.
29
IV. ábra: Egy agyi metszet osztályozása FCM algoritmussal c=10 osztályra
30
Megfigyelhető, hogy az osztályozás minőségével vannak problémák. Például a T1C színcsatornán szabad szemmel jól látszó tumor nem kapott külön dedikált osztályt, hanem beleolvadt a világoskékkel ábrázolt nagyobb osztályba, mely magába foglalja az ödéma nagy részét is. Minden bizonnyal egy nagyobb osztályszám esetén jutott volna külön osztály a tumor képpontoknak is, de ezt az osztályszámot nem tudhatjuk előre. Ugyanakkor azt is megállapíthatjuk,
hogy
a
kialakult
10
osztály tényleg
megkülönböztetett
bizonyos
szövettípusokat egymástól, azaz érdemei is vannak az FCM-nek. Viszont ahhoz, hogy jól körülhatárolhassuk a tumort, szükségünk lenne arra, hogy mondjuk, a világoskékkel jelölt régió képpontjait újból osztályozzuk. Ezt az elvet fogjuk nagyban alkalmazni a volume-okra, ezt a kétlépéses FCM algoritmust fogjuk a továbbiakban kaszkád FCM eljárásnak nevezni. A 2. táblázat ismerteti a 10 kialakult osztály reprezentatív színét és statisztikai összetételét. A táblázat alapján ránézésből megállapíthatjuk, hogy 2 db osztály, konkrétan a 7. és 8. osztály képpontjait kellene jelen esetben átvinnünk a második osztályozási lépésbe, mert ezek mindketten tartalmaznak tumor és ödéma szövethez tartozó képpontokat. Ezt a döntést viszont a számítógépnek önállóan, automatikusan kellene meghoznia. 2. táblázat: Egyetlen szelet fuzzy klaszterezésének eredménye. Tíz osztályból kettő tartalmaz jelentős mennyiségű tumor és ödéma képpontokat
Osztályprototípus intenzitásai (log)
Osztályba sorolt képpontok
Osztály index
T1
T2
T1C
FLAIR
normál
ödéma
tumor
1
6,094
5,767
6,414
5,874
5627
1
0
2
5,599
6,621
5,681
5,194
773
0
0
3
4,099
3,955
4,779
3,669
88
0
0
4
5,303
6,842
5,171
4,361
546
0
0
5
6,027
5,982
6,278
5,996
3816
9
0
6
5,265
6,838
5,204
3,668
416
0
0
7
5,976
6,713
6,155
6,532
207
1149
256
8
5,995
6,215
6,254
6,120
2758
236
27
9
5,814
6,379
6,095
5,774
1522
0
0
10
3,810
0,477
5,203
2,554
24
0
0
15777
1395
283
Összesen
31
Az FCM osztályozó képességeiről még azt is megállapíthatjuk, hogy a 10 osztály között keletkezett 2 nagyon kisméretű (24, illetve 88 képpontból állnak), valamint ahogyan a 3. táblázat mutatja, bizonyos osztályok nagyon közel esnek egymáshoz. Ezek mind azt mutatják, hogy találomra nem lehet optimális osztályszámot választani. 3. táblázat: Az előbbi táblázatban ismertetett osztályozás egymáshoz legközelebb eső klaszterpárosai, távolság szerint rangsorolva
Egyik osztály
Másik osztály
Osztályok közötti távolság
5
8
0,267
1
5
0,290
8
9
0,452
5
9
0,535
1
8
0,545
7
8
0,654
4
6
0,694
1
9
0,751
2
9
0,783
7
9
0,846
5
7
0,916
4.2 A kaszkád FCM algoritmus Mint már említettem, az FCM algoritmus fő célja megkülönböztetni egymástól a vizsgált volume-ban
található
homogén
régiókat.
Továbbá,
egy
gépi
tanulással
létrehozott
döntéstámogató rendszer segítségével meg fogja állapítani, hogy a felismert régiók tumorosak-e vagy sem. A konvencionális FCM algoritmus a bemeneti adathalmaz részére létrehoz egy fuzzy partíciót. A partíció egy előre meghatározott számú (c) klasztert tartalmaz, és minden bemeneti adatnak
(képpont
intenzitás-vektornak)
mindegyik
klaszterre
nézve
lesz
egy fuzzy
tagságfüggvény értéke. Az FCM algoritmus m paramétere (fuzzy kitevő) az algoritmus fuzzy jellegét szabályozza. A kitevő magas értékei elveszik az algoritmusnak a diszkrimináló erejét. Ha m tart a végtelenhez, akkor az összes klaszter egybefolyik a bemeneti adatok átlagértékénél. Ha viszont az m kitevő értéke az 1-hez közelít, a partíció egyre inkább hasonlítani fog egy kétértékű logikát követő partícióhoz. Ez esetben mindegyik bemeneti adat ahhoz a klaszterhez fog 1-es mértékben tartozni, amelyikhez a legközelebb áll, míg az összes többihez zérus mértékig [Bezdek81].
32
Az FCM algoritmus futása során a klaszterek prototípusai (vi, i=1…c) általában olyan helyekre konvergálnak, ahol sok bemeneti vektor van a közelben. Ahhoz, hogy a klaszterezés eredménye pontosan megkülönböztesse a tumoros régiókat a negatívaktól, előre tudnunk kellene, hogy hány ilyen akkumulációs pont van a színtérben, azaz hány lényeges szín van a bemeneti adatok között, és mindegyik ilyen pont közelébe inicializáljunk egy-egy klaszter prototípust. Ezzel a feltételezéssel két probléma merül fel. Egyrészt ha tudnánk előre, hogy hol vannak ezek az akkumulációs pontok, akkor már meg lenne oldva a klaszterezés problémája és nem is lenne szükség FCM-re. Másrészt, ilyen akkumulációs pontok a színtérben több százan is lehetnének. Másfél millió bemeneti adat és több száz klaszter esetén egy FCM algoritmus túl sok ideig futna. Ezek az érvek is mind amellett szólnak, hogy érdemes az FCM algoritmust két fázisban futtatni. Ennek érdekében alkalmazunk egy kaszkád FCM algoritmust, melynek alapgondolata a következő: 1. Első fázisban a teljes bemeneti adathalmazt (egy volume-ot) klaszterezzük c db osztályra, egy valamilyen rögzített m kitevő esetén. Az így kialakuló klaszterek közül kiválogatjuk, hogy melyiknek a színe hasonlít a tumor szövetek színéhez és melyik nem. A klaszterek szétválogatásánál támaszkodunk a fennebb említett döntéstámogató rendszerre. A tumorhoz nem hasonló színű klaszterek képpontjait azonnal negatívnak nyilvánítjuk, és tovább nem számolunk velük. A tumorhoz hasonló színű klaszterek száma 1 és 3 között szokott lenni. 2. Az előző fázisban megszabadultunk a bemeneti adatok nagy részétől, azoktól, amelyeket negatívnak nyilvánítottunk. A többi képpontot újból alávetjük egy FCM klaszterezésnek, ezúttal c’ db osztály és m’ fuzzy exponens alkalmazásával. Az így kapott klasztereket újból szétválogatjuk a döntéstámogató rendszer segítségével, viszont ezúttal a nem negatív klasztereket tumorosnak nyilvánítjuk. 3. Az első fázisban minden volume-ot feldolgoztunk 6-tól 20-ig terjedő osztályszámmal (c) és 1.5-től 2.0-ig tizedenként lépkedő fuzzy kitevő alkalmazásával. Ez minden volume esetében 90 futtatást jelent. A második fázisban a c’ és m’ paraméterekkel végig próbáltuk ugyanazokat az értékeket, mint a c és m paraméterekkel az első fázisban. Így 90 féle folytatás keletkezett az első fázisnak mind a 90 futásához. Tehát a második fázis 8100 alkalommal futott le minden volume esetében, de már az első fázisban lecsökkentett adathalmazon. 4. Az FCM mindkét fázisában alkalmaztuk az osztályprototípusok inicializálásához korábban ismertetett eljárást a 81 potenciális kezdőpont rangsorolásával, mindig az osztályozandó adathalmaz függvényében.
33
A kaszkád FCM eredményeképpen minden volume részére létrejött 8100 darab végeredmény, melyeknek egyenként megállapítottam a Jaccard és Dice-féle minőségi mutatóit.
V. ábra: A kaszkád FCM első lépésének eredménye, c=6 osztály esetén. Az osztályozott képpontok láthatóak négy színcsatornán, továbbá hatszínű ábrázolással a kialakult osztályok, valamint a második fázisra tovább vitt képpontok
Ezen a ponton tekintsük egy teljes volume kaszkád osztályozásának rész- és végső eredményeit, melyet egyetlen szeleten fogunk demonstrálni. Az áttekinthetőség kedvéért az osztályok számát alacsonyra állítottam (c = c’ = 6). A bemenet 108-as szelete az I. ábrán látható. Ennek a szeletnek az alakulását fogjuk megfigyelni a továbbiakban. Az V. ábra bemutatja az első FCM osztályozás kimenetét négy színcsatornán, valamint két színes rajzon a kialakult osztályokat. A bal oldali színes ábrázolás egy-egy színnel mutatja a kialakult osztályokat. Megfigyelhető, hogy a piros szín például a fehérállományt képviseli, míg a világoskék leginkább a nem normális agyi szöveteket.
34
4. táblázat: A kaszkád FCM első osztályozásakor létrejött klaszterek prototípusai és statisztikai összetétele
Osztály index
Osztályba sorolt képpontok
Intenzitás (log) T1
T2
T1C
FLAIR
összes
tumor
1
6,011
6,845
6,491
6,573
224426
67460
2
4,353
4,414
4,456
4,302
32601
16
3
6,081
6,404
6,477
6,269
623529
3220
4
5,719
6,547
6,262
5,636
113013
1095
5
5,568
6,664
5,437
5,123
75185
75
6
6,222
6,086
6,662
6,132
528301
444
1617055
72310
Összesen
A 4. táblázat ismerteti a kialakult c = 6 db osztály tulajdonságait. Mindegyik osztályban van legalább egy tucatnyi tumor pixel. Az osztály prototípusok alapján a döntéstámogató rendszer azt diktálja, hogy az 1-es számú osztály képpontjait vigyük tovább a kaszkád második fázisába. Ezzel valójában a tumor képpontok kb. 7%-át elveszítjük, de a teljes adatmennyiségnek 86%-ától szabadulunk meg. A kaszkád második fázisának kimenetét a VI. ábra ismerteti, míg a kialakuló osztályok statisztikáját az 5. Táblázat mutatja be.
5. táblázat: A kaszkád FCM második osztályozásakor létrejött klaszterek adatai
Osztály index
Osztályba sorolt képpontok
Intenzitás (log) T1
T2
T1C
FLAIR
összes
tumor
1
6,032
6,987
6,309
6,769
65162
2875
2
5,887
6,841
6,338
6,305
33420
4250
3
5,908
6,927
7,189
6,521
42975
41420
4
6,122
6,711
6,478
6,607
58904
4275
5
6,718
6,717
5,389
6,884
4896
0
6
5,872
6,918
6,839
6,443
19069
14640
224426
67460
Összesen
35
VI. ábra: A kaszkád FCM második lépésének eredménye, c’=6 osztály esetén. A feketével ábrázolt képpontok a második fázisban nem vettek részt, mert az első fázis negatívnak nyilvánította őket. Az osztályozott képpontok láthatóak négy színcsatornán, továbbá hatszínű ábrázolással a kialakult osztályok, és az osztályozás végeredménye
Úgy az V., mint a VI. ábrán az utolsó, színes kép azt mutatja, hogy ha ezen a ponton állítjuk le az osztályozást, akkor milyen pontosságot kapunk a szakember által kézzel megadott alapigazsághoz képest. Zöld színnel ábrázoljuk a true positive eseteket, amelyeket tumornak neveztük és tényleg azok. Piros szín jelzi a false negative eseteket, amelyeket nem neveztük tumor képpontoknak, annak ellenére, hogy valójában tumorosak. A kék képpontok false positive esetek, azaz tumornak nyilvánítottuk, pedig nem tumorosak. A kaszkád első fázisában sok false positive van, ez egy természetes jelenség, ezektől szabadulunk meg a második fázisban. Fontos ezektől úgy megszabadulni, hogy közben minél kevesebb piros keletkezzen. Ahogyan az 5. Táblázat is mutatja, a döntéstámogató rendszer a második fázisban két osztályt (3. és 6.) is tumorosnak hozott ki.
36
VII. ábra: A kaszkád FCM végeredménye 25 egymást követő metszetben, összevetve a szakember által adott alapigazsággal (zöld = true positive, piros = false negative, kék = false positive, fehér = true negative)
37
Ugyanezt a színkódolást alkalmazza a VII. ábra a kaszkád FCM végeredményének ismertetéséhez. Feltétlenül meg kell jegyeznem, hogy az ábrán látható osztályok nem a legjobbak, amit az algoritmus adott, hanem a legkisebb tesztelt osztályszámmal (c = c’ = 6) elért eredmény. 4.3 Félig felügyelt FCM Az alap FCM algoritmus egy felügyelet nélkül klaszterező eljárás. Amennyiben felügyeletet akarunk vinni az FCM működésébe, a következő lehetőségeink vannak. 1. Lehetőségünk van előre meghatározott besorolású adatokat hozzáadni a bemeneti adatokhoz, és együtt klaszterezni az összes adatot. Így az előre felcímkézett adatok befolyásolják a kialakuló klasztereket [28]. 2. Lehetőségünk van arra is, hogy egyik volume (tanulási adat) legjobb eredményeket adó beállítását (m, c, m’, c’) alkalmazzunk egy másik volume (tesztelési adat) szegmentálásához. Jelen dolgozat keretében ezt a lehetőséget, ennek képességeit kívánom részletesen tanulmányozni. Felügyelettel tanuló osztályozás esetén egyik alapelv az, hogy a tanulási adatok és a tesztelési adatok között nem lehet közös elem. Munkám során feldolgoztam 13 volume-ot. Mivel egy n elemű halmaz részhalmazainak száma 2n, elvileg 213=8192 módon választhatnék tanulási adathalmazt. Gyakorlatilag ezek között 2 triviális eset is van, ugyanis nem lehet mindegyik volume tanulási adat, illetve nem lehet mindegyik volume tesztelési adat. A többi 8190 esetet mind megvizsgáltam. A kaszkád FCM algoritmus leírásánál ismertettem az FCM futásánál alkalmazott és tesztelt beállításokat. Jelöljük Tc-vel az osztályok számát leíró c és c’ paraméterek vizsgált tartományát (Tc={6,7,8,…,20}), illetve Tm-mel a fuzzy kitevő vizsgált tartományát (Tm={1.5,1.6,1.7,…,2.0}). Ezek alapján a kaszkád algoritmus bármely futása modellezhető a TD = Tc × Tm × Tc × Tm Descartes-szorzat valamely elemével. Az alkalmazott tartományok esetében a TD halmaz 8100 elemű. Jelöljük az összes volume halmazát M-el, illetve a tanulási adatok halmazát P-vel. Értelemszerűen, a tesztelési adatok halmaza az M-P lesz. Továbbá legyen p=|P| a tanulási volume-ok száma, ami 1 és 12 között fog változni. Minden egyes tesztelési volume-nak az eredményeit külön akarjuk megvizsgálni, a tanulási volume-ok számának függvényében. Minden volume a tesztek felében, 4095 alkalommal fog tanulási adatként szerepelni, illetve ugyanannyiszor tesztelési adatként. Bármely wϵM volume 12 12! esetében lesz pontosan ( ) = (𝑝!)(12−𝑝)! olyan teszt, amelyben p db tanulási volume eredménye 𝑝 38
alapján megválasztott legjobb beállítással tesztelünk. Az ilyen tesztelések során kapott Jaccard index vagy Dice score értékeket el kell tárolnunk egy-egy listába a w és p függvényében. Erre a célra létrehozunk egy Ψ[|M|][|M|-1] tömböt, ahol a tömb minden eleme egy FIFO lista. Az első index 1-től |M|=13-ig terjed és a tesztelési volume-ot címezi meg. A második index pedig a tanulási adathalmaz számosságát jelöli. Kezdetben a Ψ minden eleme üres lista. A „felügyelt” tesztelés algoritmusa a következő: for each 𝑃 ⊂ 𝑀, 𝑃 ≠ 𝛷, 𝑃 ≠ 𝑀 𝜗 = arg max{∑𝑤∈𝑃 JI(𝑤, 𝜏), 𝜏 ∈ 𝑇𝐷 } 𝜏
for each 𝑤 ∈ 𝑀 ∖ 𝑃 store(𝛹[𝑤][|𝑃|], JI(𝑤, 𝜗)) end end A fenti algoritmus teljesítése után statisztikailag kiértékeljük a Ψ minden listáját. Minket elsősorban nem a kapott Jaccard indexek abszolút értéke érdekel, hanem a Ψ[w] sorát a w teszt volume-ra kapott legnagyobb és átlagos Jaccard indexhez fogjuk viszonyítani. Ennek megfelelően, vezessük be a következő két jelölést: (max)
𝜓𝑤
= max{JI(𝑤, 𝜏), 𝜏 ∈ 𝑇𝐷 } 𝜏
(avg)
𝜓𝑤
=
1 ∑ JI(𝑤, 𝜏) |𝑇𝐷 | 𝜏∈𝑇𝐷
Minket az fog érdekelni, hogy a Ψ[w][p] listában levő Jaccard indexek átlaga hol (avg)
helyezkedik el a [𝜓𝑤
(max)
, 𝜓𝑤
] intervallumhoz viszonyítva, és mekkora lesz a Jaccard indexek
négyzetes szórása. A fenti formulákat és eljárást átfogalmazhatjuk úgy, hogy Jaccard index helyett mindenütt Dice score paramétert használunk. A következő ábrákon bemutatjuk 12 db hisztogram segítségével, hogy p=1, 2, …,12 db tanulási volume esetén mennyire pontosan sikerül a teszt volume-ok osztályozása. Mint már korábban említettük, minden egyes tesztelési volume-nak (
12 12! ) = (𝑝!)(12−𝑝)! féleképpen tudunk 𝑝
pontosan p db tanulási adatot megválasztani. Mivel a feldolgozott volume-ok száma |M|=13, 12 13! pontosan p db tanulási adattal 13 ( ) = (𝑝!)(12−𝑝)! tesztet tudtunk futtatni. Ennek alapján 𝑝 elmondhatjuk, hogy a p db tanulási adattal végzett tesztelés eredményeinek hisztogramja 13! (𝑝!)(12−𝑝)!
adat eloszlását ábrázolja. Mindegyik osztályozás pontosságát beskáláztuk az adott
39
(avg)
tesztelési volume átlagos (AVG, 𝜓𝑤
(max)
) és maximális (MAX, 𝜓𝑤
) elért pontosságához
viszonyítva. 6. táblázat: A felügyelet nélkül alkalmazott, kaszkád FCM 8100 tesztelt esetéből megállapított átlagos és maximális értékelő mutatószámok, minden volume-ra külön-külön
Volume
Jaccard index
Dice score
átlag
maximum
átlag
maximum
HG01
0,7505
0,8058
0,8575
0,8925
HG02
0,3622
0,6097
0,5318
0,7576
HG03
0,7489
0,8155
0,8564
0,8984
HG04
0,6321
0,6498
0,7746
0,7878
HG05
0,2275
0,3143
0,3706
0,4783
HG06
0,5610
0,5969
0,7188
0,7476
HG07
0,3293
0,4358
0,4955
0,6070
HG09
0,3879
0,4929
0,5590
0,6603
HG11
0,4901
0,5954
0,6578
0,7464
HG12
0,0884
0,1422
0,1625
0,2490
HG13
0,2886
0,6073
0,4480
0,7557
HG14
0,5643
0,6468
0,7215
0,7855
HG15
0,7030
0,7343
0,8256
0,8468
7. táblázat: A félig felügyelt FCM eredményeinek statisztikai összefoglalása, a felügyelet nélkül elért átlagos (AVG) és legjobb (MAX) kimenetelhez viszonyítva. Ez a táblázat nem különbözteti meg a tesztelési volume-okat, azaz a tanulási volume-ok száma szerint egyetlen sorban összegezi az összes oda találó esetet
Tanulási volumeok száma
Tesztek száma darab
JI ≤ AVG
AVG ≤ JI <
AVG+MAX 2
darab
százalék
darab
százalék
AVG + MAX 2 darab százalék JI ≥
p=1
156
19
12,18%
63
40,38%
74
47,44%
p=2
858
99
11,54%
311
36,25%
448
52,21%
p=3
2860
282
9,86%
1032
36,08%
1546
54,06%
p=4
6435
465
7,23%
2162
33,60%
3808
59,17%
p=5
10296
601
5,84%
3280
31,95%
6415
62,31%
p=6
12012
601
5,00%
3721
30,98%
7690
64,02%
p=7
10296
422
4,10%
3243
31,50%
6631
64,40%
p=8
6435
216
3,36%
2056
31,95%
4163
64,69%
p=9
2860
63
2,20%
929
32,48%
1868
65,32%
p = 10
858
11
1,28%
274
31,94%
573
66,78%
p = 11
156
1
0,64%
48
30,77%
107
68,59%
p = 12
13
0
0,00%
4
30,77%
9
69,23%
40
1 volume-mal tanított osztályozás eredményeinek hisztogramja
2 volume-mal tanított osztályozás eredményeinek hisztogramja
12
70 60
10
50 8 40 6 30 4 20 2
10
0 2AVG-MAX
AVG
0 2AVG-MAX
MAX
3 volume-mal tanított osztályozás eredményeinek hisztogramja
AVG
MAX
4 volume-mal tanított osztályozás eredményeinek hisztogramja
250
700 600
200 500 150
400 300
100
200 50 100 0 2AVG-MAX
AVG
0 2AVG-MAX
MAX
5 volume-mal tanított osztályozás eredményeinek hisztogramja
1400
1200
1200
1000
1000
800
800
600
600
400
400
200
200
AVG
MAX
6 volume-mal tanított osztályozás eredményeinek hisztogramja
1400
0 2AVG-MAX
AVG
0 2AVG-MAX
MAX
AVG
VIII. ábra: Az osztályozás relatív pontosságának eloszlása 1-6 tanulási volume esetén
41
MAX
7 volume-mal tanított osztályozás eredményeinek hisztogramja
8 volume-mal tanított osztályozás eredményeinek hisztogramja
1200
800 700
1000
600 800
500
600
400 300
400
200 200
100
0 2AVG-MAX
AVG
0 2AVG-MAX
MAX
9 volume-mal tanított osztályozás eredményeinek hisztogramja
AVG
MAX
10 volume-mal tanított osztályozás eredményeinek hisztogramja
350
120
300
100
250 80 200 60 150 40 100 20
50 0 2AVG-MAX
AVG
0 2AVG-MAX
MAX
11 volume-mal tanított osztályozás eredményeinek hisztogramja
AVG
MAX
12 volume-mal tanított osztályozás eredményeinek hisztogramja
25
2
20
15 1 10
5
0 2AVG-MAX
AVG
0 2AVG-MAX
MAX
AVG
IX. ábra: Az osztályozás relatív pontosságának eloszlása 7-12 tanulási volume esetén
42
MAX
Mind az előbbi hisztogramok, mind az alábbi táblázat, azt igazolják, hogy a tanulási adatok számának növelésével javul az osztályozás pontossága. A hisztogramokon azt látjuk, hogy a magas oszlopok közelednek a maximum felé. A táblázat számszerűen megmutatja, hogy százalékosan csökken az átlagnál is rosszabb osztályozások aránya, illetve növekszik az átlagos és legjobb számtani középarányosánál jobb osztályozások aránya.
Az osztályozás átlagolt eredménye a tanulási volume-ok számának függvényében, mindegyik tesztelt volume esetében külön-külön
MAX HG01 HG02 HG03 HG04 HG05 HG06 HG07 HG09 HG11 HG12 HG13 HG14 HG15
AVG 1
2
3
4
5 6 7 8 A tanulási volume-ok száma
9
10
11
12
X. ábra: Az osztályozás relatív pontossága a tanulási volume-ok számának függvényében, külön-külön ábrázolva mind a 13 teszt volume esetén. Mindegyik görbe átlagolja az adott teszt volume-nak adott tanulási adatmennyiség esetén vizsgált összes kombinációját
Az osztályozás pontosságának átlaga és szórása a tanulási volume-ok számának függvényében
MAX
AVG
1
2
3
4
5 6 7 8 A tanulási volume-ok száma
9
10
11
12
XI. ábra: Az osztályozás relatív pontosságának átlaga és volume-ok szerinti négyzetes szórása, a tanulási volume-ok számának függvényében
43
Az X. ábra megmutatja, hogy hogyan javul az osztályozás minősége a tanulási volume-ok számának növelésével. Mindegyik színes (folytonos vagy szaggatott) görbe egy-egy volume-mal való tesztelések eredményét mutatja. Ezek a görbék minden esetben az összes lehetséges tanulási 12 ) = 792 5
kombináció esetét átlagolják. Pl. öt db tanulási adatot bármelyik tesztadatnak (
féleképpen lehet megválasztani, így a színes görbék értéke az 5-ös abszcisszánál 792 teszt kimenetének az átlagát mutatják. A színes görbék nagy része növekvő tendenciát mutat a tanulási adatok számának növekedése esetén. A leginkább szembetűnő ellenpélda a HG04-es volume, továbbá a HG07-es osztályozásának pontossága fel-le mozog az abszcissza mentén. Még az is elmondható, hogy p=11-től p=12-re változás során már a görbék szinte fele lefelé irányul. Az XI. ábra megmutatja az elért osztályozási relatív pontosság tesztelési volume-ok szerinti átlagát és szórását, a tanulási volume-ok számának függvényében. Tulajdonképpen a X. ábrán látható 13 görbének átlagát és négyzetes szórását mutatja meg. Ebből az ábrázolásból is jól látható, hogy a tanulási adatok számának növekedése lassan javítja az osztályozás relatív és abszolút pontosságát.
44
Ötödik fejezet Következtetés
Jelen dolgozatban megvalósítottunk egy olyan szoftver tesztrendszert, amelynek segítségével agyi MRI felvételekben tumoros elváltozásokat vagyunk képesek detektálni és lokalizálni. A rendszer egy felügyelet nélkül tanuló osztályozó algoritmust ültetett át félig felügyelt tanulású környezetbe, és egy kétfázisú végrehajtás segítségével jelentősen javította az osztályozás pontosságát. A félig felügyelt tanulás abban nyilvánult meg, hogy a tanulási adatokon végrehajtott felügyelet nélküli osztályozás legjobb eredményeket adó paraméter beállítását alkalmaztuk a tesztelési adatok beállításaként. A kiértékelés során azt vizsgáltuk meg, hogy félig felügyelt tanulású rendszerben a két fázisban futó algoritmus mennyire pontos osztályozást végez. A kiértékelés során a MICCAI BRATS 2012/13-as adatbázisának 13 volume-ját használtuk fel. A tesztek egy korszerű 4 magos processzoros számítógépen több mint 60 óráig futottak. A legfontosabb megállapításunk az, hogy a megvalósított módszerrel fel tudjuk ismerni a 10cm3 térfogatú összefüggő tumorok jelenlétét. A tumor pontos körülhatárolását segíteni tudjuk előzetes információ alkalmazásával. Elmondhatjuk, hogy a félig felügyelt üzemmódban minél nagyobb a tanuláshoz használt adathalmaz, annál pontosabban osztályoz az algoritmus. A klaszterező algoritmus osztályainak számának növelésével általában javul az osztályozási pontosság, de ugyanakkor a futási idő is növekszik, így meg kell találnunk a mindkét kritériumnak megfelelő kompromisszumot. A szakirodalom is azt sugallja, hogy felügyelettel tanuló osztályozó algoritmusokkal még jobb eredményeket tudnánk elérni. A MICCAI BRATS verseny díjazottjai is mind felügyelettel tanuló algoritmusok. A tanszéki kutatócsoport, melynek keretében jelen tanulmányt megvalósítottam, is elkezdte a felügyelettel tanuló módszerek vizsgálatát ezeken az adatokon. Az első ilyen irányú kísérletek legjobb tudomásom szerint bináris döntési fákat fog alkalmazni, melyek működését entrópia kritériumok alkalmazásával fogják optimalizálni.
45
Hatodik fejezet Szakirodalom
[1] Barni M, Capellini V, Mecocci A: Comments on a possibilistic approach to clustering. IEEE Transactions on Fuzzy Systems 4:393–396, 1996 [2] Bauer S, Nolte L, Reyes M. Segmentation of brain tumor images based on atlas-registration combined with a Markov-random-field lesion growth model. IEEE International Symposium on Biomedical Imaging: From Nano to Macro (ISBI), pp. 2018–2021, 2011 [3] Bezdek J: Pattern Recognition with Fuzzy Objective Function Algorithms, Plenum: New York, NY 1981 [4] Bezdek JC, Keller J, Krishnapuram R, Pal NR, Fuzzy models and algorithms for pattern recognition and image processing. Springer Verlag 2005 [5] Bhandarkar S, Koh J, Suk M. Multiscale image segmentation using a hierarchical selforganizing map. Neurocomputing 14:241–72, 1997 [6] Cai W, Chen S, Zhang D. Fast and robust fuzzy c-means algorithms incorporating local information for image segmentation. Pattern Recognition 40:825–838, 2007 [7] Capelle A, Alata O, Fernandez C, Lefevre S, Ferrie J. Unsupervised segmentation for automatic detection of brain tumors in MRI. IEEE International Conference on Image Processing (ICIP), pp. 613–616, 2000 [8] Cates J, Whitaker R, Jones G. Case study: an evaluation of user-assisted hierarchical watershed segmentation. Medical Image Analysis 9:566–578, 2005 [9] Chan T, Vese L. Active contours without edges. IEEE Transactions on Image Processing 10(2):266–277, 2001 [10] Clark M, Hall L, Goldgof D, Velthuizen R, Murtagh R, Silbiger M. Automatic tumor segmentation using knowledge-based techniques. IEEE Transactions on Image Processing 17(2):187-201, 1998 [11] Deng W, Xiao W, Deng H, Liu J. MRI brain tumor segmentation with region growing method based on the gradients and variances along and inside of the boundary curve. 3rd IEEE International Conference on Biomedical Engineering and Informatics (BMEI) pp. 393–396, 2010 [12] Dickson S, Thomas B. Using neural networks to automatically detect brain tumours in MR images. International Journal on Neural Systems 4(1):91–99, 1997 [13] Dunn JC: A fuzzy relative of the ISODATA process and its use in detecting compact well separated clusters. Journal of Cybernetics 3:32–57, 1974 46
[14] Fletcher L, Hall L, Goldgof D, Reed F. Automatic segmentation of nonenhancing brain tumors in magnetic resonance images. Artificial Intelligence in Medicine 21:43–63, 2001 [15] Gering D, Grimson W, Kikinis R. Recognizing deviations from normalcy for brain tumor segmentation. Medical Image Computing and Computer-Assisted Intervention – MICCAI, 2488:388–95, 2002 [16] Gibbs P, Buckley D, Blackband S, Horsman A. Tumour determination from MR images by morphological segmentation. Physics in Medicine & Biology 41:2437–2446, 1996 [17] Gordillo Castillo N, Sobrevilla P, Montseny E: State of the art survey on MRI brain tumor segmentation. Magnetic Resonance Imaging 31:1426-1438, 2013 [18] Hamamci A, Kucuk N, Karaman K, Engin K, Unal G: Tumor-Cut: Segmentation of Brain Tumors on Contrast Enhanced MR Images for Radiosurgery Applications. IEEE Transactions on Medical Imaging 31:790-804, 2012 [19] Iftekharuddin K, Zheng J, Islam M, Ogg R. Fractal-based brain tumor detection in multimodal MRI. Applied Mathematics and Computation, 207:23–41, 2009 [20] Kaus M, Warfield S, Nabavi A, Black P, Jolesz F, Kikinis R. Automated segmentation of MRI of brain tumors. Radiology 218(2):586–591, 2001 [21] Kolen JF, Hutcheson T: Reducing the time complexity of the fuzzy c-means algorithm. IEEE Transactions on Fuzzy Systems 10:263–267, 2002 [22] Kong J, Wang J, Lu Y, Zhang J, Li Y, Zhang B. A novel approach for segmentation of MRI brain images. IEEE Mediterranean Electrotechnical Conference (MELECON), pp. 525–528, 2006 [23] Krishnapuram R, Keller JM: A possibilistic approach to clustering. IEEE Transactions on Fuzzy Systems 1:98–110, 1993 [24] Letteboer M, Niessen W, Willems P, Dam E, Viergever M. Interactive multi-scale watershed segmentation of tumors in MR brain images. IMIVA workshop of MICCAI, 2001 [25] Liew AWC, Yan H: An adaptive spatial fuzzy clustering algorithm for 3-D MR image segmentation. IEEE Transactions on Medical Imaging 22:1063-1075, 2003 [26] Luo S. Automated medical image segmentation using a new deformable surface model. International Journal of Computer Science and Network Security 6(5A):109–15, 2006 [27] Ozkan M, Dawant B, Maciunas R. Neural-network-based segmentation of multi-modal medical images: a comparative and prospective study. IEEE Transactions on Medical Imaging 12(3):534–544, 1993 [28] Pedrycz W, Amato A, Di Lecce V, Piuri V: Fuzzy Clustering With Partial Supervision in Organization and Classification of Digital Images. IEEE Transactions on Fuzzy Systems 16:1008-1026, 2008 47
[29] Ruspini EH: A new approach to clustering. Information and Control 16:22–32, 1969 [30] Reddick W, Glass J, Cook E, Elkin T, Deaton R. Automated segmentation and classification of multispectral magnetic resonance images of brain using artificial neural networks. IEEE Transactions on Medical Imaging 16(6):911–918, 1997 [31] Salman Y. Modified technique for volumetric brain tumor measurements. Journal of Biomedical Science and Engineering 2:16–19, 2009 [32] Siyal M, Yu L. An intelligent modified fuzzy c-means based algorithm for bias field estimation and segmentation of brain MRI. Pattern Recognition Letters 26:2052–2062, 2005 [33] Stadlbauer A, Moser E, Gruber S, Buslei R, Nimsky C, Fahlbusch R, et al. Improved delineation of brain tumors: an automated method for segmentation based on pathologic changes of 1H-MRSI metabolites in gliomas. Neuroimage 23:454–461, 2004 [34] Steinhaus H: Sur la division des corp materiels en parties. Bulletin de l’Academie Polonaise des Science C1 III., IV:801–804, 1956 [35] Sun H, Yang J, Ren M: A fast watershed algorithm based on chain code and its application in image segmentation. Pattern Recognition Letters 26:1266-1274, 2005 [36] Szilágyi L, Benyó Z, Szilágyi SM, Adam HS: MR brain image segmentation using an enhanced fuzzy c-means algorithm. 25th Annual International Conference of IEEE Engineering in Medicine and Biology Society, Cancún (Mexico) pp. 724–726, 2003 [37] Szilágyi L, Szilágyi SM, Benyó B: Efficient inhomogeneity compensation using fuzzy cmeans clustering models. Computer Methods and Programs in Biomedicine 108:80-89, 2012 [38] Szilágyi L, Dénesi G, Szilágyi SM: Fast Color Reduction Using Approximative c-Means Clustering Models, Fuzzy Systems (FUZZ-IEEE), 2014 IEEE International Conference on, 194201, 2014 [39] Vijayakumar C, Damayanti G, Pant R, Sreedhar C. Segmentation and grading of brain tumors on apparent diffusion coefficient images using self-organizing maps. Computerized Medical Imaging and Graphics 31:473–484, 2007 [40] Vovk U, Pernus F, Likar B: A Review of Methods for Correction of Intensity Inhomogeneity in MRI. IEEE Transactions on Medical Imaging 26:405-421, 2007 [41] Zadeh LA: Fuzzy sets. Information and Control 8:338–353, 1965
48
Ábrák jegyzéke
I. ábra: Bemeneti adatok: a HG15-ös volume 108-as metszetének 4 színcsatornája (T1, T2, T1C és FLAIR), valamint az alapigazság (szakember által kézzel bejelölt tumor és ödéma) ...... 26 II. ábra: A HG01-es volume összes képpontjának hisztogramja a 4 színcsatornán külön-külön. A három szín az alapigazság szerint megkülönböztetett szöveteket (normál agy, ödéma, tumor) jelképezik................................................................................................................... 28 III. ábra: Az összes feldolgozott volume tumorhoz tartozó képpontjainak FLAIR színcsatornáján mért intenzitások hisztogramja, külön-külön mindegyik volume esetén .............................. 29 IV. ábra: Egy agyi metszet osztályozása FCM algoritmussal c=10 osztályra .............................. 30 V. ábra: A kaszkád FCM első lépésének eredménye, c=6 osztály esetén. Az osztályozott képpontok láthatóak négy színcsatornán, továbbá hatszínű ábrázolással a kialakult osztályok, valamint a második fázisra tovább vitt képpontok .............................................. 34 VI. ábra: A kaszkád FCM második lépésének eredménye, c’=6 osztály esetén. A feketével ábrázolt képpontok a második fázisban nem vettek részt, mert az első fázis negatívnak nyilvánította őket. Az osztályozott képpontok láthatóak négy színcsatornán, továbbá hatszínű ábrázolással a kialakult osztályok, és az osztályozás végeredménye ..................... 36 VII. ábra: A kaszkád FCM végeredménye 25 egymást követő metszetben, összevetve a szakember által adott alapigazsággal .................................................................................... 37 VIII. ábra: Az osztályozás relatív pontosságának eloszlása 1-6 tanulási volume esetén .............. 41 IX. ábra: Az osztályozás relatív pontosságának eloszlása 7-12 tanulási volume esetén ............... 42 X. ábra: Az osztályozás relatív pontossága a tanulási volume-ok számának függvényében, különkülön ábrázolva mind a 13 teszt volume esetén. Mindegyik görbe átlagolja az adott teszt volume-nak adott tanulási adatmennyiség esetén vizsgált összes kombinációját ................. 43 XI. ábra: Az osztályozás relatív pontosságának átlaga és volume-ok szerinti négyzetes szórása, a tanulási volume-ok számának függvényében ........................................................................ 43
49
Táblázatok jegyzéke
1. táblázat: A feldolgozott volume-ok fontosabb tulajdonságai. A metszetek száma mindegyikben 176 volt. ......................................................................................................... 27 2. táblázat: Egyetlen szelet fuzzy klaszterezésének eredménye. Tíz osztályból kettő tartalmaz jelentős mennyiségű tumor és ödéma képpontokat ............................................................... 31 3. táblázat: Az előbbi táblázatban ismertetett osztályozás egymáshoz legközelebb eső klaszterpárosai, távolság szerint rangsorolva ........................................................................ 32 4. táblázat: A kaszkád FCM első osztályozásakor létrejött klaszterek prototípusai és statisztikai összetétele.............................................................................................................................. 35 5. táblázat: A kaszkád FCM második osztályozásakor létrejött klaszterek adatai ........................ 35 6. táblázat: A felügyelet nélkül alkalmazott, kaszkád FCM 8100 tesztelt esetéből megállapított átlagos és maximális értékelő mutatószámok, minden volume-ra külön-külön ................... 40 7. táblázat: A félig felügyelt FCM eredményeinek statisztikai összefoglalása, a felügyelet nélkül elért átlagos (AVG) és legjobb (MAX) kimenetelhez viszonyítva. Ez a táblázat nem különbözteti meg a tesztelési volume-okat, azaz a tanulási volume-ok száma szerint egyetlen sorban összegezi az összes oda találó esetet ........................................................... 40
50
UNIVERSITATEA SAPIENTIA DIN CLUJ-NAPOCA FACULTATEA DE ȘTIINȚE TEHNICE ȘI UMANISTE, TÎRGU-MUREȘ SPECIALIZAREA DEZVOLTAREA APLICAȚIILOR SOFTWARE
Vizat decan Dr. ing. Kelemen András
Vizat director de departament Dr. Kátai Zoltán
51