Számítógépes képelemzés
1
7. SZÁMÍTÓGÉPES KÉPELEMZÉS 7.1. Bevezetés Ebben a fejezetben a számítógépes képfeldolgozás és a képelemzés alapjait kívánjuk bemutatni. Elõször is tisztáznunk kell ezeknek a fogalmaknak a jelentését. A képfeldolgozás alkalmával a képek olyan típusú átalakítását végezzük el, amikor a lényeges információkat a lényegtelentõl különválasztjuk. Ilyen átalakítás során lehet kiszûrni az elektronmikroszkópos képeken meglévõ háttér zajt vagy ezzel a módszerrel lehet a felvételek készítése során keletkezõ elektromos zavarokat elválasztani az anyag szerkezetét bemutató képektõl. A másik lényeges fogalom a képelemzés, ami nem más, mint a képek számszerû adatokkal történõ jellemzése. Azt is mondhatjuk, hogy ekkor végezzük el a kép információ tartalmának mennyiségi interpretációját. Az így nyert paramétereket az adott képi környezetbe visszahelyezve még értelmeznünk is szükséges, ez az ún. képértelmezés*. A képelemzés a mindennapi életben is gyakran elõfordul. Amikor egy helyiség falának területét megbecsüljük azért, hogy tapétát vásároljunk, vagy egy mérõedényben meghatározzuk a folyadék magasságát, esetleg egy térképen végzünk távolságbecslést, akkor tulajdonképpen képelemzést végzünk (7.1-1. ábra). Természetesen a képek számszerû adatokkal történõ jellemzésének a biológiában, az ásványtanban, a kohászatban, a zoológiában, a botanikában, a félvezetõk területén van az igazi jelentõsége. Amikor egy alacsony karbon tartalmú acél ferrit szemcse méretét kívánjuk megbecsülni, vagy egy karbon szálakkal erõsített alumínium mátrixú kompozitot akarunk jellemezni (7.1-2. ábra), esetleg egy biológiai metszet azonosítását vagy ásványtani csiszolat értelmezését szeretnénk elvégezni, a számítógépes képelemzés módszereihez fordulunk. A képelemzés az ipar, a mezõgazdaság és a tudományos kutatás területén is használatos. Amikor a termékek minõségellenõrzését végezzük, vagy éppen gépalkatrészek összeszerelését akarjuk segíteni „látó” robotokkal, vagy esetleg a mûholdak segítségével készült térképeket, ûrfelvé*
A képek, illetve a képek adatainak értelmezése csak az adott szakterületre vonatkozó speciális szakismeretek birtokában lehetséges.
Számítógépes képelemzés
2
teleket kívánunk jellemezni szintén a képfeldolgozást, képelemzést alkalmazzuk.
7.1-1. ábra. Képelemzés a mindennapi életben
7.1-2. ábra. Képelemzés az anyagtudományban (a) ferrites acél, N=100X, (b) karbon szálas kompozit, a szálak elhelyezkedésére jellemzõ hatósugár szerinti vázszerkezettel (Szalai Ibolya, 2000)
7.2. Az emberi látás alapjai Mielõtt részletesen foglalkoznánk a képfeldolgozás mûveleteivel, hasznos megismernünk az emberi látás alapjait. Ugyanis nagyon sok hasonlóság figyelhetõ meg a két terület között. A látás során öt különbözõ információt érzékelünk: a tárgyak világosságát, a tárgyak színét, a tárgyak alakját, a tárgyak mozgását és a tárgyak térbeliségét. A látás legfontosabb eszköze az emberi szem, amelynek sematikus rajzát a 7.2-1. ábra mutatja. Amikor a szemünk egy pontot élesen lát, akkor errõl az ún. fixált pontról a fénysugár a szaruhártyán (cornea), a
Számítógépes képelemzés
3
csarnokvízen és a szemlencsén keresztül jut a szemünkbe. A közegeken áthaladva mindenütt érvényes a fénytörésre vonatkozó Snellius-Descartes törvény, ami azt jelenti, hogy a beesési szög (α) és a törési szög (β) szinuszainak hányadosa az adott közegre jellemzõ fizikai állandó az ún. törésmutató (n): sin α n= (7.2-1) sin β
7.2-1. ábra. Az emberi szem felépítése
A tárgy képe az emberi szem lencserendszerén keresztül a látóidegre vetül, ahol egy valódi, kicsinyített, fordított állású kép jön létre. Az emberi szem belsejét a retina borítja, amelynek két jellegzetes területe a látó gödör* és az ún. vakfolt. Míg a látógödörben a legélesebb a látás, addig a vakfolton nincsenek látóidegek (Ganong (1994)). A lencsét tartó izmok a lencse görbületét változtatva változtatják annak fókusztávolságát, így a szemünk különbözõ távolságban lévõ tárgyak képét tudja a retinára vetíteni. A lencsék fénytörõ képességét dioptriával fejezzük ki, ami nem más, mint a méterben kifejezett fókusztávolság *
fovea centralis
4
Számítógépes képelemzés
reciproka. Míg a szaruhártya fénytörõ képessége 40-43 dioptria, addig a szemlencse fiatalabb korban kb. 17-20 dioptria törõképességgel rendelkezik. A szem mûködéséhez az is hozzátartozik, hogy a szivárványhártya vagy más néven iris a pupillát szûkítõ izmokból áll, amely képes a szembe jutó fény mennyiségét szabályozni. A retinán a fény fotonok érzékelésére alkalmas pálcikák (’rodes’) és csapok (’comes’) találhatók. Az érzékelés alapja, hogy a szemünkben lévõ csapok és pálcikák (7.2-2. ábra) egy fotokémiai folyamat révén a fény fotonokat elektromos impulzussá alakítják, s ez jut el az idegpályákon keresztül az agy látókérgébe. A pálcikák teljes mennyisége kb. 120 millió, s ezek képesek akár egyetlen fény foton érzékelésére is, de közepes intenzitású fénynél már telítõdnek. Így a pálcikák felelõsek a világosság, fényintenzitás érzékeléséért, valamint a sötétben történõ látásért. Ugyanakkor a pálcikák színek érzékelésére nem alkalmasak.
7.2-2. ábra. A pálcika és a csap vázlatos képe
Számítógépes képelemzés
5
A csapok száma kb. 6 millió, ezek kisebb fény érzékenységûek, de a nagy fényintenzitású tartományban mûködnek. A csapok és a pálcikák ilyen irányú különbségét a 7.2-3. ábra mutatja. A sötétben eltöltött idõ függvényében láthatjuk a legkisebb hatásos fényintenzitás értékét. Amennyiben 4-5 percet töltünk el a sötét szobában, viszonylag nagy intenzitású fény szükséges ahhoz, hogy lássunk, ekkor a csapok lépnek mûködésbe. Nagyjából 20-25 perc múlva bekövetkezik az ún. sötét adaptáció, mikor egészen kis intenzitású fény érzékelésére is képesek vagyunk, s ezt a pálcikáknak köszönhetjük.
7.2-3. ábra. A sötét adaptáció
A csapok felelõsek a színes látásért is. A retinában tulajdonképpen háromféle csap van: a vörös (red), a zöld (green) és a kék (blue) hullámhosszúságú fényre legérzékenyebb csap. A szelektivitás viszonylagos, például egy zöld típusú csap, vörös fénnyel is ingerelhetõ, de ehhez jóval nagyobb intenzitású fényre van szükség. Azt, hogy a különbözõ csapok milyen spektrális eloszlású fény érzékelésére alkalmasak a 7.2-4. ábra mutatja*.
*
A vörös szín érzékelését végzõ csapok jele P (protos), míg a zöld D (deuteros) ill. a kékT (tritos) jelet visel.
6
Számítógépes képelemzés
7.2-4. ábra. A különbözõ csapok által érzékelt fény spektruma. A kék hullámhossz tartományban érzékeny csapok neve: “tritos”, míg a zöld csap “deuteros” és a vörös pedig “protos”.
A pálcikák és a csapok mennyiségének eloszlása a retina mentén a látógödörtõl mért szög függvényében nagyon különleges (7.2-5. ábra). Ugyanis a látógödörben egyáltalán nincsen pálcika, ott csak csapok találhatók, s ott van a hatmillió csap kb. 80 %–a! Éppen ezért a látógödör alkalmas a legélesebb, valamint színekben is a leggazdagabb érzékelésére. A pálcikák mennyisége a perifériákon valamelyest nõ, itt viszont a csapok mennyisége minimális. A vakfoltban sem csap, sem pálcika nem található. A szemlencsét mozgató izmok az agy parancsára arra törekednek, hogy a kép mindig a látó gödörben legyen. Ugyanis az optikai ingerületeket továbbító idegrostok száma 1-1,2 millió körül van, így a látógödörben az idegsejtek és az ideg-rostok közötti áttétel 1:1 körüli, míg a retina más részein ez az áttétel 100:1. Ebbõl következik, hogy már a retinában van bizonyos mértékû képfeldolgozás, és így az agyba fõként az élekre, a hirtelen változásokra jutó információ jut.
Számítógépes képelemzés
7
7.2-5. ábra. A csapok és a pálcikák száma a látógödörtõl mért szög függvényében
A két szem optikai tengelye egymástól 60-65 mm távolságban van. A térbeli látásnak az a lényege, hogy a fókuszban lévõ tárgy képe a látógödörbe vetül, míg az ettõl távolabb lévõ tárgy a retinának az egyik felére (nazális), míg a közeli pont a retina másik (temporális) részére (7.2-6. ábra). A tanulási folyamat során az agyunk elsajátította, hogy a retina nazális részén lévõ tárgyak a fixált ponttól távolabb vannak. Minél nagyobb a retinán leképzett tárgyrészletek közötti távolság, annál közelebbinek érzékeljük a fókuszban lévõ tárgyak környezetét.
Számítógépes képelemzés
8
7.2-6. ábra. A térbeli látás
Számítógépes képelemzés
a)
b)
c) d)
*
9
Az emberi látást a következõ paraméterekkel jellemezhetjük: Geometriai felbontás. Az a legkisebb látószög, amely mellett sötét alapon lévõ két világos pont még éppen nem olvad egybe. Ennek nagysága függ a fény hullámhosszúságától, zöld fényben a legjobb a felbontás: 0,5 – 1,0 szögperc*. Fényintenzitás felbontás. Azt a fényerõsség intervallumot jelenti, amelyben a szemünk mûködni képes. Ez az intervallum hihetetlenül nagy (7.2-7. ábra), tudniillik a kétszeres fényerõsség változás, csak természetes logaritmus kettõ-szeres fényérzet növekedést eredményez. Vagyis a százszoros fényerõsség változás csak 4,6 (ln 100) szoros fényérzet erõsödést hoz létre. Színfelbontás. A színárnyalatok elkülönítésének képessége. Errõl a késõbbiekben lesz szó. Idõbeni felbontás. A recehártyánkon megjelenõ képek nem tûnnek el azonnal, az 1/8 másodpercnél rövidebb ideig tartó képek összeolvadnak az érzékelésünkben. Így az 1/15 másodpercnél rövidebb idõre fel villanó képeket nem tudjuk elkülöníteni, ezt használjuk ki a televíziós képek továbbításakor, amikor másodpercenként 16-25 állóképet látunk, amit folyamatos mozgásként érzékelünk.
A kényelmes olvasás szemtávolságában ≈ 250 [mm], ez az érték 0,07 – 0,15 [mm] pontok közötti távolságot jelent.
10
Számítógépes képelemzés
7.2-7. ábra. A szemünk által érzékelhetõ fényintenzitás értékek
Az emberi szem 380-780 [nm] hullámhosszúságú tartományban érzékeli a fényt, ami a természetben elõforduló elektromágneses sugárzásoknak csak keskeny tartománya (7.2-8. ábra). Az agyunkban keletkezõ színérzetet a valóságban elõforduló szín három jellemzõje befolyásolja:
Számítógépes képelemzés
11
1) Színárnyalat (hue) – a fény hullámhosszúságától függ. A szemünk kb. 200-féle színárnyalat megkülönböztetésére képes. 2) Világosság vagy fényintenzitás (intensity) – a fényforrás által kibocsátott fotonok mennyisége, illetve az egységnyi felületre beérkezõ E=hν* energiájú fotonok száma. Például a barna szín spektrális eloszlása a sárgával azonos, de más a világosság értéke. Átlagosan mintegy ötszáz intenzitásfokozatot tudunk a szemünkkel megkülönböztetni. 3) Telítettség (saturation) – a fehér összetevõ mennyiségétõl függ. A spektrum-színek 100 %-os telítettségûek, nincs fehér összetevõjük. Ugyanakkor például a rózsaszín néhány százalékban fehér összetevõt tartalmazó vörös. Az átlagos szem húsz különbözõ telítettségi fokozatot tud elkülöníteni.
*
Minden ν frekvenciájú (λ hullámhosszúságú) elektromágneses sugárzás E = hν = h c/λ energiával rendelkezik, ahol h a Planck-féle állandó, c pedig a fénysebesség.
12
Számítógépes képelemzés
7.2-8. ábra. A különbözõ elektromágneses sugárzások hullámhosszúsága
A színárnyalat, a világosság, és a telítettség jellemzésére a színfát használjuk. Ezt mutatja a 7.2-9. ábra.
Számítógépes képelemzés
13
7.2-9. ábra. A színfa
Amennyiben a tárgy által kibocsátott fény spektruma ϕ(λ), az egyes csapok érzékenységi függvénye pedig p(λ), d(λ) és t(λ), akkor a szemünk által érzéklet színérzetet az alábbi integrál fejezi ki: P=∫
780nm
380nm
D=∫
ϕ (λ )p(λ )dλ ;
780nm
380nm
T =∫
(7.2-2)
780nm
380nm
ahol:
ϕ (λ )d(λ )dλ ;
ϕ (λ )t (λ )dλ ;
P, D, T a protos, deuteros illetve tritos típusú csapok kimenõ jele, p(λ), d(λ), t(λ) az egyes csapok spektrális érzékenysége, ϕ(λ) a csapokat megvilágító fény spektrális eloszlása.
A csapok az õket megvilágító fényt a spektrális érzékenységüknek megfelelõen elnyelik, s az elnyelt energiának megfelelõ ingert továbbítják az agyba. A P, D, T ingerek egymáshoz viszonyított értékei alapján alakul ki a színérzet. Amennyiben ez az integrál azonos, hiába különbözõ a tárgyak által visszavert fény spektrális hullámhossz eloszlása, szemünk azokat nem képes megkülönböztetni. Egyébként a tárgyak valóságban azért lesznek különbözõ színûek (színárnyalatúak), mert a rájuk esõ fénysugárzás
14
Számítógépes képelemzés
színét módosítja a felületük – hullámhossztól függõ - fényvisszaverõ képessége. A tárgyak színét a fényforrás spektrális eloszlásának és a tárgy felületére jellemzõ spektrális reflektancia függvénynek a szorzata határozza meg. A következõkben bemutatjuk az emberi látás néhány olyan jellegzetességét, amelyeknek a képi információk feldolgozásakor különös jelentõsége van: a) A geometriai felbontóképesség a hullámhossz függvénye (7.2-10. ábra), amely zöld fény esetén maximumot mutat. A látható színtartomány széleihez közelebb esõ színek esetén ez a felbontóképesség romlik. b) A relatív fényérzékenység is a hullámhossz függvénye, amennyiben különbözõ hullámhosszúságú fényforrás ugyanolyan intenzitású fényt bocsát ki, a zöld fényforrást érzékeljük fényesebbnek (7.2-11. ábra). Itt is a vörös és a kék tartományban kisebb az érzékenység.
7.2-10. ábra. A relatív felbontóképesség
Számítógépes képelemzés
15
7.2-11. ábra. A relatív érzékenység
c) Összetett alakzatok érzékelésekor törekszünk a folytonosságra, a d) 7.2-12. ábra a) képét egy négyszögvonalból és egy görbe szakaszból összetevõdõnek látjuk és nem három különbözõ geometriai idomnak. Keressük a zárt alakzatokat, a e) 7.2-12. ábra b) rajza nem egy folyamatos vonalnak látszik, hanem két zárt formának. Törekszünk a szimmetria felismerésére a f) 7.2-12. ábra c) képét nem W és M betûkbõl összetevõdõnek, hanem egy szimmetrikus vonalcsoportnak tekintjük. Képesek vagyunk az élek meghosszabbítására, így geometriai alakzatokat láthatunk ott, ahol azok a valóságban nem léteznek (7.2-13. ábra). Egymással érintkezõ sötét és világos képmezõ részletek határvonala mentén a sötétebb rész még sötétebbnek a világost még világosabbnak látjuk, ez az ún. Machféle jelenség (7.2-14. ábra).
16
Számítógépes képelemzés
7.2-12. ábra. Összetett alakzatok a) folytonosság érzékelése, b) zárt alakzatok, c) szimmetria felismerése
7.2-13. ábra. Viruális alakzatok érzékelése az élek meghosszabbításával a) virtuális háromszög, b) hatágú csillag, c) “HÉT” felirat
Számítógépes képelemzés
17
7.2-14. ábra. A Mach-féle jelenség
18
Számítógépes képelemzés
A mindennapi életben többször találkozunk olyan jelenséggel, amely elsõ látásra megtéveszt bennünket. Ezt nevezzük optikai csalódásnak*. Ilyen optikai csalódások: hosszúsági csalódások, iránycsalódások, nagyságbeli csalódások, távlati csalódás, valamint az ún. szétsugárzási jelenség és a többértelmûség. Ezekre mutatunk be példákat a következõkben. Hosszúsági csalódások (7.2-15. ábra). A vonalszakaszok szemünk által érzékelt hosszúságát a vonalszakaszokra rajzolt osztás, a környezetben lévõ más szakaszok hosszúsága vagy a nyilak dõlési iránya egyaránt befolyásolja. A vízszintes hasábokból álló négyszöget keskenyebbnek érzékeljük, mint a függõleges hasábokból összerakottat. A függõlegesen álló hasábokat a valóságosnál szélesebbnek látjuk. A ferde téglalap átlóit az iránytól függõ távolságúra becsüljük. Alakváltozás (7.2-16. ábra). A tárgyak látszólagos alakját befolyásolja, hogy milyen irányú vonalak közé helyezzük. A Poggendorff-féle optikai csalódás az a jelenség, amikor egy vastagabb vonallal rajzolt geometriai idomba befutó ferde vonalak látszólag nem folyamatosan, hanem egy kicsit eltolódva folytatódnak. Ennek oka, hogy a szemünk a vastag vonalon kicsit tovább fut, így a vékonyabb vonal folyamatossága megszakad. Az egymással párhuzamosan futó vastagabb egyenesek a ferde vékonyabb vonalak hatására látszólag összetartanak. Méret csalódások. Az azonos méretû köröket látszólag különbözõnek látjuk (7.2-17. ábra) attól függõen, hogy milyen környezetben helyezkednek el. A négyzetek mérete is megváltozhat, amint ellipszis darabokat rajzolunk a négyzetek végére (7.2-18. ábra). Ezeknek a jelenségeknek az a magyarázata, hogy a szemünk sosem mozdulatlan, hanem akkor is végez rezgéseket, mikor szándékunk szerint egy pontra nézünk. A különbözõ geometriai alakzatok hatására hol a szélen, hol a középpontban látunk, és így az eredeti formák módosulnak. Kontraszthatás (7.2-19. ábra). A sötét háttérben megjelenõ világos mintákat mindig nagyobbnak látjuk, mint a világos alapon lévõ sötét mintát. Ezt a jelenséget világossági kontrasztnak nevezzük. Másik esetben a fekete-fehér vonalak alkotta rácsot nézve a keresztezõdésekben – a valóságban nem létezõ – szürke foltokat veszünk észre. Többértelmûség (7.2-20. ábra). Egy kép környezetét huzamosabb ideig figyelve hol az egyik, hol a másik részlet kerülhet elõtérbe, ami az összképben jelentõs változást okoz. Ha a tárgy vagy ábra kiemelkedik, a háttér vagy alap elmosódottá válik. Ilyen többértelmû kép a Rubin-ábra vagy a Necker-kocka. *
A jelenséget másképpen vizuális illúziónak nevezzük.
Számítógépes képelemzés
7.2-15. ábra. Hosszúsági csalódások a) hosszúsági csalódás, b) hasábok méretének torzulása, c) ferde téglalap átlóinak látszólagos hoszúsága
19
20
Számítógépes képelemzés
7.2-16. ábra. Alakváltozás a) alakváltozás ferde vonalak között, b) Poggendorf-féle optikai csalódás, c) párhuzamos vonalak torzulása
Számítógépes képelemzés
7.2-17. ábra. Nagyságbeli csalódás körök esetén
7.2-18. ábra. Nagyságbeli csalódás különbözõ síkidomoknál a) körök, b) négyzetek
21
Számítógépes képelemzés
22
7.2-19. ábra. Fehér és fekete idomok a) szétsugárzás, b) kontraszt
a)
b) 7.2-20. ábra. Többértelmûség a) Necker- féle kocka, b) Rubin ábra
Számítógépes képelemzés
23
7.3. A képfeldolgozás története Elsõ generációs rendszerek Amikor létrejött a televízió a TV-kamerák segítségével lehetõvé vált a képek elektromos jelekké való átalakítása. Az automatikus képelemzõ rendszerek kialakulása gyakorlatilag ekkor kezdõdött. Az elsõ rendszerek egy TV-kamerából és egy analóg feketedés mérõ mûszerbõl álltak (7.3-1. ábra) A kvantitatív televíziós mikroszkóp (Quantitative Television Microscope), amelyet a Metals Research Ltd. fejlesztett ki (Underwood(1970)), nem volt képes egyedi objektumok mérésére, csupán arra szolgált, hogy meghatározza a teljes látótérben elõforduló sötét – világos területek arányát.
7.3-1. ábra. Kvantítatív televiziós mikroszkóp
A technológia további fejlesztésével ez a kvantitatív televíziós mikroszkóp alkalmassá vált objektumok elemzésére is. A mérés alapja az volt, hogy a TV vonalak hányszor metszettek bele ezekbe az objektumokba. Ezeknek az adatoknak az összegyûjtésével lehetett az objektumok darabszámát és kerületét meghatározni. Ezzel megnyílt az út a modern képelemzõ rendszerek kifejlesztéséhez. Persze ezen az úton még számos problémát kellett megoldani, mint például azt, hogy ha az objektum két vagy több nyúlvánnyal rendelkezett, akkor az elektronsugár az objektumba kétszer vagy háromszor metszett, és így a darabszám több volt a valóságosnál.
Számítógépes képelemzés
24
1968-ban Bausch & Lomb kidolgozta az elsõ képelemzõ rendszert, amely a fekete-fehér képet mikro-számítógép segítségével tárolta. Ebben az idõben a számítógépek memóriája még nem volt eléggé fejlett, ezért nem a teljes képet, hanem csak a szürke szintek átmeneteit (A) rögzítették a berendezésben (7.3-2. ábra). Ezzel a képi információk jelentõs tömörítését lehetett elérni, s a rendszer már alkalmas volt egyedi objektumok vizsgálatára is.
7.3-2. ábra. Képek tömörítése
Második generáció A Bausch & Lomb továbbfejlesztette rendszerét és létrejött a Quantimet 720, az elsõ teljesen digitális elven mûködõ képelemzõ. A berendezés a képet egyedi képpontok (pixel) formájában tárolta, minden egyes képpont 64 különbözõ szürkeségi szinttel rendelkezhetett. Ebben az idõben a számítógép memóriák még eléggé egyszerûek voltak (1969-70.), így a Quantimet alacsony frissítési sebességet használt (10 kép/másodperc). A hetvenes évek elején kezdtek megjelenni az egyre korszerûbb számítógépek, és így a képelemzõ rendszerek is tovább fejlõdtek, képesek voltak egyre több paraméter meghatározására, és az egyedi objektumok minél teljesebb jellemzésére. 1974-ben a LEITZ radikálisan megváltoztatta az addig alkalmazott technológiát, s létrehozta a LEITZ TAS rendszert. A berendezés teljesen új koncepció szerint épült fel, amelynek alapja az a matematikai morfológia volt, amelyet az Ecole de Mines de Paris munkatársai dolgoztak ki. Ekkor
Számítógépes képelemzés
25
vezették be a képfeldolgozás legfontosabb alapmûveleteit: az eróziót, a dilatációt és a vázszerkezet elõállítását. Az erózió/dilatáció segítségével a képelemek (objektumok) méretét egy-egy képponttal csökkenteni/bõvíteni lehet, míg a vázszerkezet elõállítása (szkeletonizáció) egy olyan sok lépésbõl álló eróziót, aminek a végeredménye az objektum egy képpont szélességû vázszerkezete (7.3-3. ábra). A mûveletek végrehajtásával illetve kombinációjával lehetõvé vált a képek még teljesebb elemzése.
7.3-3. ábra. Morfológiai mûveletek
Harmadik generáció 1980-81. között a Kontron és a Cambridge kifejlesztette a teljesen szoftver alapú képelemzõ berendezést (7.3-4. ábra). Ez a rendszer a teljes képet rögzíti a számítógép memóriájában. Így lehetõség van az eredeti (szürke) képek szûrésére, valamint az átalakított képek közötti logikai mûveletek elvégzésére. A szoftverek különbözõ algoritmusokat használnak a képek detektálására, mérésére, illetve az objektumok megkülönböztetésére. A nyolcvanas években tovább fejlõdtek a komputerek, növekedett a memória, s a mûveleti sebesség. A képelemzõ rendszerek sebessége is növekedett: százszor gyorsabbak lettek, mint a hetvenes években. A képek mérete 512x512 vagy 1024x1024 képpont (pixel) volt. A számítógépeknek egy szürke kép átalakítására 5-60 másodpercre volt szükségük, míg egy gyors Fourier transzformációt (FFT – Fast Fourier Transform) 10 másodperc alatt tudtak elvégezni. A kutatólaboratóriumokban és a minõségellenõrzõ központokban ez a sebesség nem volt elegendõ a napi rutin vizsgálatokhoz.
26
Számítógépes képelemzés
7.3-4. ábra. Szoftver alapú képelemzõ
Negyedik generáció A képfeldolgozás és az elemzés sebességének a növelésére több lehetõség kínálkozott. Az egyik esetben a képek rögzítését és a különbözõ képfeldolgozó mûveleteket egy megfelelõ célszámítógép, hardver segítségével végezték el. A speciális integrált áramkörök képesek voltak a képek gyors feldolgozására, szûrésére, az objektumok megkülönböztetésére és a mérésre. Ezekhez az ún. morfológiai processzorokhoz kapcsolt személyi számítógépek csupán az adatok kiolvasását, és a mûveletek irányítását végezték el. Ilyen hardver-alapú képelemzõket az IBM, a Macintosh, a VAX, a SUN fejlesztett ki. Ezen rendszerek hátránya volt, hogy a hardver-alapú integrált áramköröket nehezen lehetett adaptálni a különbözõ alkalmazásokhoz, rendszerint a C nyelven megírt képfeldolgozó programokat nem lehetett módosítani. Annak érdekében, hogy a képfeldolgozás mûvelete mégis felhasználóbarát maradjon, a C nyelvû programokat grafikus felhasználói felülettel kombinálták. Az utóbbiakat személyi számítógépeken futtatták. Ilyen rendszert fejlesztett ki a Clemex Technologies is.
Számítógépes képelemzés
27
7.3-5. ábra. Képelemzõ és morfológiai processzor
Ötödik generáció A személyi számítógépek memóriájának és a CPU sebességének növekedésével lehetõvé vált a szoftver-alapú képelemzõ további fejlesztése. Az ötödik generációs eszközök olyan személyi számítógépek, amelyekben képfeldolgozó kártyát helyeznek el a videokamerák jelének átalakítására és a képek számítógépen való tárolására. Az újabban kifejlesztett teljesen digitális kamerákhoz már ezekre a képfeldolgozó kártyákra (’frame grabber card’) sincsen szükség, mert a képi információt a szabványos párhuzamos porton keresztül is képes a számítógép fogadni. Ezzel a fejlesztéssel a képfeldolgozó rendszerek a kutatólaboratóriumok és az ipari üzemek világából a mindennapi élet területére kerültek át. Újabb fejlõdést az intelligens-rendszerek megjelenése adhat, amelyek a feldolgozott képek alapján már tanulni is képesek, s nemcsak passzív, hanem aktív módon tudják elvégezni a képek feldolgozását, osztályozását.
Számítógépes képelemzés
28
7.4. Digitális képfeldolgozás 7.4.1
Bevezetés
Ebben a fejezetben a képfeldolgozás és a matematikai morfológia azon mûveleteit mutatjuk be, amelyek a gyakorlati képelemzés során kiemelt fontosságúak. Nem nélkülözhetõk az egyes sztereológiai paraméterek mérésekor és nem hagyhatók figyelmen kívül azok értelmezésénél sem. Akár egy egyszerû zajszûrésrõl legyen szó, akár egy összetettebb szemcsehatár-meghatározás legyen terítéken, a szükségtelenül eltávolított, vagy tévesen bevitt információ mind-mind a mérési eredmények megbízhatóságát rontja. A képfeldolgozás alkalmazásakor érvényes általános elv, hogy a kevesebb - jobb, ám maga a szubjektív választás többnyire nem nélkülözhetõ. Itt foglalkozunk a képek mérésre történõ elõkészítésével, ám nem elemezzük a kívánt pontosság eléréséhez statisztikailag szükséges sokaságot (részben a paraméterek sokrétûsége, részben a könyv véges terjedelme miatt), így nem kerül sor az egyes képelemzési hibák számszerûsítésére sem. Ugyancsak nem térünk ki az egyes automatikus képelemzõk, illetve képelemzõ-szoftverek (vö. negyedik és ötödik generáció) számítástechnikai hátterére sem, ugyanis ez eszközönként változó. Ezeket azonban érdemes figyelembe venni legyen szó akár az egyes mért paraméterek közötti korrelációról, akár a mérési hibák számszerûsítésérõl. A paraméterek közötti korreláció gyakran a szoftverek mûködésének eredménye, mivel ezek egy-egy paramétert valamely másik mért értékbõl számítanak, s így mindkettõt "mérni" szükségtelen. Hasonlóan nem elemezzük a veszteséges tömörítéssel elmentett képek hibáit sem. Az egyes matematikai - matematikai morfológiai bizonyításokat, indoklásokat a lehetõségekhez mérten mellõzzük: megpróbáljuk minél gyakorlatiasabban megközelíteni a képfeldolgozást. Felhívjuk azonban a figyelmet arra, hogy a téma (tekintsük akár a konvolúciós elveket, a Fourier-transzformációs módszereket, vagy akár a képtömörítés, esetleg a morfológiai képátalakítások témakörét) kivételesen széles matematikai háttérrel rendelkezik, amelynek irodalma több kötetre rúg (Serra, 1982). Röviden a fogalmakról: "pixel" alatt képpontot (picture element), "bináris kép" alatt két színbõl (fekete és fehér) álló képet, "digitális kép" alatt pedig képpontok alkotta (amelyek 2n szürkeségi szintûek lehetnek, n=8,9,10,…) képet értünk.
Számítógépes képelemzés
7.4.2
29
A képelemzés folyamata
A képelemzés célja a jellemzõ paraméterek pontos és reprodukálható mérése. Ez legkönnyebben számítógéppel végezhetõ el, az alábbi lépésekben (mint ahogy errõl az elõzõ fejezetben már volt szó): 1) Képbevitel: a képek elektronikus formában történõ elõállítása, függetlenül a beviteli eszköztõl, amely lehet videokamera, digitális fényképezõ, scanner, videomagnó, stb. 2) A szürkekép elõállítása, digitalizálása: szürkeségi szintek hozzárendelése a kép egyes intenzitás értékeihez vagy egyes színeihez (RGB/XYZ színrendszerek). 3) Szürkekép-átalakítások: a vizsgálni kívánt jellegzetességek, objektumok kihangsúlyozása annak érdekében, hogy azokat még pontosabban detektálhassuk. 4) Szegmentálás (detektálás): az objektumok és a háttér elkülönítése valamilyen tulajdonságuk (pl. szürkeségi szintjük) alapján, aminek eredményeképpen bináris kép áll elõ. 5) Bináris transzformációk: az objektumok átalakítása, a mérendõ jellegzetességek elvi értelmezésüket leginkább megközelítõ alakra hozása (pl. a képen összetapadt, de a valóságban különálló szemcsék szétválasztása). 6) A kívánt mérés elvégzése, az eredmények értelmezése és dokumentálása. Az elõzõ fejezetben a képbevitelt és a szürkekép elõállítását (1 és 2 pontok) már részletesen bemutattuk, most a szürkekép-átalakításokat, a szegmentálást, a bináris átalakításokat és a mérést tekintjük át. Mielõtt erre rátérnénk, a teljesség kedvéért érintjük a képek tömörítésének témakörét: magyar nyelven is elérhetõ több olyan képfeldolgozással foglalkozó szakkönyv, amelyben a témakör matematikai háttere, hibaanalízise részletesen megtalálható (Álló (1985), Berke (1996, 2000)). Digitális képtömörítésrõl van szó - az eredmény tehát bizonyos matematikai algoritmusok számítógépes implementációja során áll elõ és elsõsorban az adatátvitel és a képarchiválás-dokumentálás fokozódó igénye miatt szükséges. A kép hordozta információ tárolása az egyes számítógépes képformátumokban nem egyformán helytakarékos. Definiáljuk a redundancia fogalmát az „adat” fogalmán keresztül: adat az, ami az információt hor-
30
Számítógépes képelemzés
dozza, így redundánsnak nevezzük azt az adathalmazt, amely nem a legkevesebb adattal jellemzi ugyanazt az információt. Több vállfaját különböztethetjük meg, így például: 1) Kódolási redundancia: ha csak 0 és 255 szürkeségi szint van, az egy byte/képpont helyett ugyanazon képet 0 és 1 értékekkel kódolva egy bit/képpont arány érhetõ el. 2) Képi redundancia: homogén háttér elõtt azonos színû objektumok esetén elegendõ a határvonalakat tárolni, jó tömörítés érhetõ el, ha a határoló vonalak végigjárása során a lépéseknél az elõzõ lépéshez viszonyított irányt tároljuk, valamint akkor, ha az alakzatok szabályosak. 3) Pszichovizuális redundancia: az emberi szem számára információt nem hordozó adatok elhagyásával tömörítés lehetséges (24 bites tárolás csökkentése, zajszûrés, méretcsökkentés). Fontos kihangsúlyozni, hogy a képek tömörítése elsõsorban a redundáns információ kiszûrésével lehetséges. Definiáljuk a tömörítési arány fogalmát a tömörítés utáni adatmennyiség és az azt megelõzõ adatmennyiség hányadosaként. Ez az egyik legfontosabb jellemzõ, ami az egyes tömörítõ-eljárásokat rangsorolja, míg a másik a tömörítés során fellépõ információveszteség. Információveszteség szempontjából megkülönböztethetünk veszteségmentes és veszteséges tömörítési módszereket. Veszteségmentes tömörítési mód például a változó hosszúságú kódolás és a kontúrkövetés. A változó hosszúságú kódolás azon alapul, hogy amíg a szürkeségi szint értékei széles tartományban vehetnek fel értékeket, ezen értékek változásai általában – zajszegény képeken – keskeny értékkészletû, 0 átlagértékû függvénnyel jellemezhetõk. Azaz minél nagyobb a különbség abszolút értéke, annál kisebb valószínûséggel fordul elõ. Így a gyakoribb értékekhez a rendelkezésre álló készletbõl rövid kódot, a ritkábban elõfordulókhoz hosszabbat rendelünk, a kódolt eredmény tároló igénye az eredetinél kisebb lesz. A kontúrkövetés során azt használjuk ki, hogy míg a kontúr egy (x,y) pontja 8 biten adott, a további pontok ehhez viszonyított iránya már 3 biten tárolható. Veszteséges tömörítéssel jóval nagyobb tömörítési arányt érhetünk el, mivel a látvány változatlansága mellett bizonyos részletek elhanyagolhatók. Ez a képelemzõ munka szempontjából kisebb jelentõséggel bír, ugyanis egy, a mikroszerkezetrõl készült felvétel kvantitatív kiértékelése esetén nem a látvány minõsége az elsõdleges szempont. A legfontosabb talán a jpeg-szabvány, a diszkrét cosinus-transzformáció egyik legjellegzetesebb alkalmazási módja: ekkor a kép transzformáltjából a gyors vál-
Számítógépes képelemzés
31
tozásokért felelõs nagyfrekvenciás tagokat elhanyagolva jutunk kisebb tárterületet igénylõ formához, anélkül, hogy a látvány érdemben romlana. 7.4.3
Szürkekép-átalakító mûveletek
A szürkekép elnevezés - a hétköznapi szóhasználatban fekete-fehér kép - arra utal, hogy a képpont mátrix értékei csak világosságkódokat tartalmaznak, azaz a fekete-fehér intervallumon belül különbözõ szürkeségi szintek alkotják a képet. Ez nagyban leegyszerûsíti az elvégzendõ matematikai mûveleteket, attól függõen, hogy 256, 512, 1024, stb. szürkeségi szintre bontottuk fel az adott képet. Színes képek elemzésére e helyütt nem térünk ki, csupán megemlítjük, hogy hasonló mûveleteket végezhetünk a színes kép három színsávja közül külön-külön bármelyiken, mivel a telítetlenséget szürkeségi szintként is felfoghatjuk. Az egyes színsávokban végzett mûveletek kombinációjaként rengeteg információhoz juthatunk. Ennek tárgyalása meghaladja e könyv kereteit. E módszereket napjainkban egyre kiterjedtebben alkalmazzák biológiai és orvostudományi szövetképek elemzésekor. Kiemeljük, hogy léteznek összefüggések színes képek szürkeképként történõ elemzésére, ekkor az egyes színekhez (színsáv-kombinációkhoz) egyegy szürkeségi szintet rendelünk, átalakításokat végzünk, majd az eredményt visszaalakítjuk a hozzárendelési táblázat alapján (Serra (2000)). A digitalizált képek gyakran nem olyan minõségûek, hogy bármiféle átalakítás nélkül méréseket végezhessünk rajtuk (elektromos zaj; szenynyezõdés; csiszolási, maratási hibák, stb.). Ezért szükséges "kijelölnünk", detektálnunk a kép kívánt tartományait, amelyeket azután számszerûen jellemezhetünk. Ezt nevezzük bináris képpé alakításnak, vagy szegmentálásnak, és többnyire - mivel ez a legkézenfekvõbb megoldás - egy-egy szürkeségi szint alatti illetve feletti képpontok elkülönítését értjük alatta. Ekkor a szürkekép átalakító mûveletek célja, hogy az objektumokat, amelyeket mérni kívánunk egy szürkeségi szintre hozzuk, esetleg egy szürkeségi szint-tartományba transzformáljuk. A szegmentálás azonban nem csak a küszöbértékeken keresztül valósítható meg: lehetséges az objektumok más jellemzõjük alapján történõ elkülönítése is, pl. textúra, morfológia. Erre jó példa a lemezes szerkezet azonosítása a periodikus textúra alapján. Ez a szegmentálás azonban nem más, mint egy olyan morfológiai transzformáció, amely az adott textúrát adott szürkeségi szintre alakítja, míg másokat változatlanul hagy. Így a
Számítógépes képelemzés
32
továbbiakban a szürkeségi szint alapján történõ szegmentálásra, az ún. detektálásra szorítkozunk. Érdekesség, hogy léteznek "tanítható" képelemzõ rendszerek is: ezek a felhasználó által megjelölt tartományok sajátosságai alapján azonosítják a többi hasonló tartományt (Komenda (2000)). Megjegyzendõ, hogy sok probléma megoldható mind szürkeképen, mind bináris képen végzett mûveletek segítségével. A szürkeképátalakítások elõnye, hogy a kép teljes információtartalma figyelembe vehetõ, még a binárissá konvertálás elõtt. Szürkekép-átalakításokat a fentiekkel összhangban tehát akkor használunk, ha az elõállított bináris kép információtartalma eltér az eredetitõl. 7.5-1. táblázat. Szürkekép- és bináris átalakítások
Megoldási lehetõség∗ Lyukkeresõ és -kitöltõ algoritmusok mind a szürke-, mind a bináris képen Szakadozott határok Nyitás, Zárás, bármelyik képen Zaj Nyitás a bináris képen; Nyitás fehér, Zárás fekete zaj esetén, a szürkeképen Érintkezõ részecskék Zárás a bináris, Vízválasztó-transzformáció a szürkeképen Az objektumok különbözõGradiens, ezt követõen Detektálás szürkeségi szintûek
Probléma "Lyukas" alakzatok
Szegmentálás szürkeségi szint szerint Ez az ún. detektálás, amely nem más, mint a kép figyelembe venni és elhanyagolni kívánt tartományainak elkülönítése. Értelemszerûen három eset lehetséges: valamely adott szürkeségi szint alatt megtartani a képpontokat, s a többit nem figyelembe venni, ennek inverzeként megtartani az adott szint felettieket, valamint két megadott szint közé esõ képpontokat megkeresni s a továbbiakban ezeket figyelembe venni. A detektálást követõen a képpontok szürkeségi szintjérõl már nem beszélhetünk: az egyes képpontokhoz 0 vagy 1 értéket rendeltünk (amelyeket egy egyszerû inverz képzéssel egymással megcserélhetünk, ha a komplementer halmazon kívánunk mûveleteket végezni). A detektálás a kép∗
A képátalakító mûveleteket a késõbbiekben részletesen bemutatjuk.
Számítógépes képelemzés
33
elemzési folyamat egyik legegyszerûbb, ugyanakkor talán a legkritikusabb pontja: mivel ekkor történik a mérendõ objektumok körvonalainak, határainak kijelölése ugyanakkor szubjektivitást is hordoz, ami a megfelelõ elõzetes szürkekép-átalakítással csökkenthetõ. Look-Up Table (LUT) transzformációk Más néven pontbeli intenzitás-transzformációk, általában egy meghatározott függvénykapcsolatot hajtanak végre az adott pontbeli szürkeségi szinten, így az eredmény csupán az adott pont kiindulási értékétõl függ, szomszédaitól nem. A kapcsolat gyakran matematikai (logaritmus, négyzet, négyzetgyök, exponenciális, komplementer képzés - azaz inverz kép elõállítása, stb.), ide tartozik a gamma-korrekció is: ( S ij ) output S max
( S ij ) input = 1 − max S
1γ
(7.4-1)
valamint a hisztogram-transzformációk∗, így a kiegyenlítés is. Az index nélküli Smax ill. Smin az ábrázolási tartomány határait jelentik (8 bites felbontásnál 0 ill. 255), míg ij indexszel az átalakítás elõtti (input) és utáni (output) kép pontjait jelöltük. Az eredményt az aktuálisan megjeleníthetõ, általában 0..255 szürkeségi szint-tartományba skálázzuk át, ahol a 0 a fekete, 255 a fehér szintjét jelöli: ( S ij )
output
= 1− S
max
( S ij ) input ( S ij ) max
(7.4-2)
Maga a detektálás is egyfajta pontbeli intenzitás-transzformáció. E módszerek célja gyakran csupán a kép megjelenítésének javítása, például a teljes szürkeségi tartomány kihasználásával (STRETCHING∗∗, mint hisztogram-transzformáció): ( S ij ) output =
∗
( S ij ) input − ( S ijmin ) input (S
max input ij
)
− (S
min ij
)
input
( S max − S min ) + S min
(7.4-3)
Hisztogram alatt azt a diagramot értjük, amelynek vízszintes tengelyén a szürkeségi szinteket, függõleges tengelyén az adott szinthez tartozó képpontok számát ábrázoljuk. ∗∗ Stretching – nyújtás.
Számítógépes képelemzés
34
Megemlítjük, hogy a stretching ellentéteként az ún. SHRINKING∗ az alábbi mûvelettel állítható elõ: ( S ij ) output =
S max − S min (( S ij ) input − ( S ijmin ) input ) + S min (7.4-4) max input min input ( S ij ) − ( S ij )
A fényerõ módosítása (angol berendezéseken BRIGHTNESS∗∗) a hisztogram eltolását jelenti, anélkül, hogy annak alakja megváltozna. A hisztogram-kiegyenlítés (EQUALIZATION∗∗∗) egy elterjedt módszer a gyenge kontrasztú képek javítására, funkciójában tehát a stretching-hez hasonlít, ám gyakran kellemesebb látványt eredményez - fõként makrofényképek javításakor hasznos. Eredményként a lehetõ legegyenletesebb hisztogramot kapjuk (míg a stretching során a hisztogram általános alakja változatlan marad). A hisztogram-kiegyenlítés során az átalakítást alábbi lépéssorozatban hajthatjuk végre: 1) Állítsuk elõ a szürkeségi skála egyes értékeihez tartozó kumulatív összegeket! 2) Normáljuk az értékeket a 0..1 tartományba (osztás a képpontok számával)! 3) Szorozzuk meg ezen értékeket a maximális szürkeségi szinttel (8 bites képnél 255)! 4) A szorzat kerekített értékeit sorban rendeljük az egyes szürkeségi szintekhez! Mivel az eloszlásfüggvény a szürkeségi szintek függvényében monoton növekvõ, többé-kevésbé egyenessel közelíthetõ görbét kapunk, s így az output hisztogram közel egyenletes eloszlást tükröz. A hisztogramkiegyenlítés a szürkekép hisztogramjának módosítását jelenti annak érdekében, hogy az egyes szürkeségi tartományokba azonos darabszámú képpont essen. Bár alacsony kontrasztú képeken ez látványos javulást eredményez, az aktuális szürkeségi felbontás valójában nem javul, sõt, romolhat, mert általában több, azt megelõzõen különbözõ szürkeségi szint kerül ugyanazon értékre. A LUT transzformációkat gyakran valamilyen aritmetikai mûvelet követi, amely tulajdonképpen a négy számtani alapmûvelet elvégzését jelenti - értelemszerûen két input képbõl egy outputot elõállítva (amelyek ∗
Shrinking – összehúzás. Brightness – világosság. ∗∗∗ Equalization – kiegyenlítés. ∗∗
Számítógépes képelemzés
35
közül az egyik gyakran az eredeti, a másik pedig a transzformált kép). A transzformációt célszerûen megválasztva rengeteg, általunk nem kívánt információt szûrhetünk ki a képbõl. Egyébként maga a LUT kifejezés a számítástechnikai megvalósítás következménye, mivel a gyakorlatban a 256-féle szürkeségi szinthez tartozó 256-féle hozzárendelést kiszámítani és ezt követõen az egyes képpont értékeket kicserélni jóval kevesebb számítási igényel, mint minden egyes pontban elvégezni magát a transzformációt. Így például az invertálás a gyakorlatban a 7.5-1. ábra szerint zajlik:
7.5-1. ábra. Invertálás LUT transzformáció segítségével a) eredeti képmátrix részlete, b) táblázat, c) módosított képmátrix részlete
Az LUT transzformációk másik csoportja jól szemléltethetõ egy olyan diagramon, ahol az input - output szürkeségi szintek hozzárendelését egyetlen görbe mutatja: az 1-el történõ szorzás tehát 45 fokos egyenesként, míg a kontraszt növelése - minthogy ez is egy pontbeli intenzitás-transzformáció - az egyenes meredekségének növekedéseként jelenik meg (7.5-2. ábra).
36
Számítógépes képelemzés
7.5-2. ábra. LUT transzformáció átviteli függvénye
Az "Auto Contrast" transzformáció nem egyéb, mint a kép szürkeségi szintjének átkalibrálása a 0..255 tartományba az elõzõekben már említett egyenlet szerint. Hasonlóan az elõbbiekhez, az álszínes, "pszeudocolor" képek elõállítása ugyancsak LUT transzformáció: ha nagyon kis szürkeségi szintbeli különbségek (2-3) vizuális érzékeltetésére van szükség. A szem nagy színfelbontását kihasználva színezhetjük a képet, amivel a különbség azonnal nyilvánvalóvá válik (7.5-3. ábra).
Számítógépes képelemzés
37
7.5-3. ábra. Nem valódi színes (pszeud-color) képek elõállítása LUT transzformációval a) eredeti képmátrix részlete, b) táblázat a monitorral
Végül, de nem utolsó sorban némiképp különállóként tárgyaljuk a háttérkorrekciót (shading correction). A megvilágítási vagy lencsehibákból adódó háttér hatásának kiküszöbölése érdekében a képelemzõ berendezések lehetõséget biztosítanak egy teljesen üres látómezõ (a gyakorlatban egy tükör) látványának elmentésére, amelyet - mint korrekciós tényezõt - felhasználva a késõbbiekben az elemzett képek valódi látványát jelenítik meg. Ez pusztán az illetõ korrigálandó képpont helyzetétõl függõ érték kivonását jelenti az elemzendõ kép szürkeségi szintjeibõl. Ekkor tehát nem output szürkeségi szintek hozzárendelése történik input szürkeségi szintekhez, hanem kivonandó szürkeségi szinteket rendelünk az egyes képpontok xy koordinátáihoz.
Számítógépes képelemzés
38
Konvolúció A konvolúciós képátalakító mûvelet során a képpontok szürkeségi szintjét a szomszédok figyelembe vételével módosítjuk az alábbi módon. Helyezzük egy m x m méretû "kernel" (másképpen konvolúciós mátrix) középsõ elemét az input kép elsõ pontjára (7.5-4. ábra), szorozzuk meg a kép minden, a mátrixszal lefedett pontját a mátrix megfelelõ elemével, az eredményt normáljuk, végül helyettesítsük ezzel az értékkel az m x m szomszédság középsõ elemét (ez lesz az output szürkeségi szint a középsõ képpontnak megfelelõ helyen). Ezt követõen léptessük a mátrixot az input kép következõ pontjára és így tovább.
7.5-4. ábra. A konvolúció mûvelete a) eredeti képmátrix részlete, b) konvolúciós mátrix (kernel)
Egyenlettel kifejezve: m2
∑
1 = ki Si (7.4-5) N i =1 Itt N a normalizációs konstans, amely gyakran a konvolúciós mátrix elemeinek összege, de általános esetben bármilyen nullától különbözõ érték lehet. A konvolúciós kernelekre gyakran a szûrõ elnevezéssel hivatkozunk, ugyanis sok zajszûrõ, vagyis átlagoló kernelt alkalmazunk a gyakorlatban. Az átlagolás (AVERAGING, 7.5-5. ábra), lágyítás (SMOOTHING, 7.5-6. és 7.5-7. ábra), élkiemelés (EDGE DETECTION, 7.5-8. ábra), élesítés (SHARPENING, 7.5-9. ábra) igen jó példák arra, hogy milyen áltaS 5módosított
Számítógépes képelemzés
39
lánosan használható mûveletek végezhetõk el az adott pont környezetében lévõ szürkeségi értékek figyelembe vételével. Az átlagolás és a lágyítás hasonló mûveletek, az átlagolás során az egyes képpontok súlyozása azonos, egységnyi, míg lágyításnál a súlyozás biztosít lehetõséget a környezetbõl figyelembe veendõ pontok megadására és hatásának számszerûsítésére. A kernel hatásának mértéke az átlagolt terület nagyságától, azaz a kernel méretétõl is függ. Az élkiemelés (Laplace-, Sobel-kernelek, stb.) értelemszerûen az élek megkeresésére használatosak, függetlenül attól, hogy ez az él egy szemcsehatár, amelyiknek mindkét oldalán azonos szemcse van, avagy második fázisú részecske kontúrja, eltérõ fázisok között.
a) eredeti kép
b) kernel 7.5-5. ábra. Átlagolás, N=9
c) módosított kép
a) eredeti kép, b) kernel, c) módosított kép 7.5-6. ábra. Lágyítás Gauss-típusú szûrõvel
40
Számítógépes képelemzés
a) eredeti kép b) kernel c) módosított kép 7.5-7. ábra. Súlyozott-átlag kernel alkalmazása, N=3
Az élkiemelõ kernelek a képpontok szürkeségi szintje közötti különbséget veszik figyelembe a kép egyes irányaiban: a 7.5-8. ábrán bemutatott kernel a képpont bal és jobb oldala közti különbséget számítja, így a függõleges éleket keresi meg. Az él két oldalán a szürkeségi szint negatív helyettesítési értékhez vezethet: ekkor az értékek abszolút értékét vehetjük figyelembe, vagy átskálázhatjuk a szürkeségi szintek értékeit úgy, hogy pl. 0-127 a negatív, 128-255 a pozitív értékeket tartalmazza.
a) eredeti kép b) kernel c) módosított kép 7.5-8. ábra. Függõleges él keresõ kernel
Számítógépes képelemzés
41
Egy másik érdekes élkiemelõ kernel a Sobel-operátor (7.5-9. ábra), amely a vízszintes éleket keresi meg, de 45 fokonként körbeforgatható, így más irányokban is alkalmazható. Az egyes irányokban kapott eredmények összevetésével a maximumot meghatározva kivételesen jó élképhez juthatunk. Általánosan: azon kernelek, amelyek elemeinek összege 0, élkiemelõ kerneleknek tekinthetõk, ugyanakkor a kapott eredmény nagyban függ az egyes elemek elhelyezkedésétõl.
a) eredeti kép b) kernel c) módosított kép 7.5-9. ábra. Sobel-típusú horizontális él keresõ kernel
Az élesítés nagyon szemléletes és tetszetõs eredményt ad, bár az output gyakran zajosabbá válik, ami meglehetõsen szûk korlátok közé szorítja ezen kernelek alkalmazhatóságát. A kernelek nagyon hasonlatosak az élkiemelésnél használatosakhoz, ekkor az elemek összege többnyire egy, ám ekkor a középsõ elem - az élesítés kívánt mértékétõl függõen - túlhangsúlyozott (7.5-10. ábra ).
Számítógépes képelemzés
42
a) eredeti kép
b) kernel
c) módosított kép
7.5-10. ábra. Élesítõ kernel (a Scanning elektronmikroszkópos felvételt Kovács Árpád készítette)
Szürkeképek morfológiai transzformációi Morfológiai transzformációk során az egyes képpontok szürkeségi szintjét ugyancsak szomszédaitól függõen változtatjuk meg, a bináris képek esetén logikai mûveletek, míg a szürkeképeknél "kisebb" / "nagyobb" relációk segítségével. A morfológiai transzformációk elõnye, hogy a lényegtelen információ kiküszöbölése megbízható módon zajlik, szemben a konvolúcióval, ahol a látvány átalakítása többnyire - bár kevésbé hangsúlyosan - megõrzi a lényegtelen részleteket. A gyakorlat azt mutatja, amennyiben pontos és megismételhetõ mérések elvégzése a cél, a legtöbb képelemzési probléma során a morfológiai transzformáció biztosítja a legmegbízhatóbb eredményt. Meg kell jegyeznünk, hogy mindezek ellenére nincs olyan mûveletsorozat, amely mindig kiemeli az objektumokat, azaz nem létezik általános érvényû eljárás. A módszer mindig a vizsgálat céljától, tárgyától, az elõkészítés és a képalkotás módjától függ. Szerencsére. Hiszen így alkalmasan megválasztott módszerekkel más és más információk nyerhetõk ugyanazon szerkezetrõl, még alaposabban jellemezve ezáltal magát az anyagot. Másrészt, bár lehetséges egy-egy próbatípushoz általános megoldást felállítani, mindig található olyan kép, amelyen az adott mûveletsorozat nem alkalmazható. Így tehát a morfológiai transzformációk célja nem egyetlen általános képátalakító-technika kialakítása, hanem a széleskörû alkalmazhatóság. Az alábbiakban áttekinjük a legygyakrabban alkalmazott morfológiai transzformációkat.
Számítógépes képelemzés
43
Az inferior (INF) és a superior (SUP) mûveletek eredménye két kép összehasonlításából adódik - értelemszerûen képpontonként történõ öszszevetésükkel. Az INF ill. SUP mûvelet az adott helyen álló képpont output szürkeségi szintjének rendre a két input kép megfelelõ képpontjainak szürkeségi szintje közül a kisebbiket ill. nagyobbikat rendeli. A leggyakoribb morfológiai transzformációk az erózió és a dilatáció. A figyelembe vett szomszédság méretét és alakját egy ún. szerkezeti elem (7.5-11. ábra), leggyakrabban egy 3x3-as négyzet jelöli ki. Így a szürkekép eróziója nem más, mint egy-egy pixel értékének helyettesítése az önmaga és nyolc szomszédja által alkotott csoport szürkeségi értékeinek minimumával, míg dilatáció során a maximumával. A morfológiai transzformációk általános jellemzõje, hogy megfordíthatatlanok: egy erodált kép eredetijét nem kaphatjuk vissza inverz mûvelettel, a dilatációval. Ezt a tulajdonságot gyakran kihasználjuk komplex képek átalakításakor (opening, closing, stb.). Az erózió és a dilatáció más megközelítésben komplementer mûveletek: miközben a háttér erodálódik, az objektumok dilatációját figyelhetjük meg (7.5-12.ábra).
7.5-11. ábra. Morfológiai transzformációk szerkezeti elemei
Számítógépes képelemzés
44
a) eredeti kép
c) eredeti kép
b) erodált kép
d) dilatált kép
7.5-12. ábra. Az erózió és a dilatáció eredménye a szürke képen
45
250
250
200
200
Szürkeségi szint
Szürkeségi szint
Számítógépes képelemzés
150 100 50 0
150 100 50 0
0
20
40
60
80
100
0
20
a) eredeti profil részlete
60
80
100
b) erodált profil részlete
250
250
200
200
Szürkeségi szint
Szürkeségi szint
40
Képpont
Képpont
150 100 50 0
150 100 50 0
0
20
40
60
80
Képpont
c) eredeti profil részlete
100
0
20
40
60
80
100
Képpont
d) dilatált profil részlete
7.5-13. ábra. Az erózió és a dilatáció hatása a szürkeségi profilokra
A szürkeségi profilok valamely kép adott képsorán szemléltetik a szürkeségi szintek változását. A 7.5-13. ábra mutatja, hogy a dilatáció nem eredményez (nem eredményezhet) magasabb szürkeségi szintet a képen, mint az eredeti maximuma, míg az erózió nem generál alacsonyabb szintet a kép minimumánál∗. Az opening, és a closing mûveletek az erózióból és a dilatációból származtathatók: a "nyitás" az erózió és az ekvivalens dilatáció, míg a "zárás" a dilatáció és az ekvivalens erózió egymást követõ végrehajtásából tevõdik össze. Az ekvivalens kifejezéssel arra utalunk, hogy nem fel∗
Elõfordulhat az az eset, hogy egy szürkeségi profilon a minimum csökkenését vagy a maximum növekedését látjuk ekkor az alkalmazott szerkezeti elem kétirányú kiterjedése miatt a figyelembe vett lokális minimum, illetve maximum nem az ábrázolt képsorban volt. A kép szürkeségi hisztogramján ez mindig tapasztalható.
Számítógépes képelemzés
46
tétlenül egyetlen alkalommal történik a mûvelet; lehetséges két eróziót követõ két dilatáció végrehajtása is, de ekkor más eredményt kapunk, és így tovább. Az opening az apró és világos objektumokat távolítja el, míg a closing az apró, sötét jellegzetességek eltüntetésére használható (7.5-14. ábra). Az objektumok mérete az alkalmazott eróziók és dilatációk számától, valamint a szerkezeti elem alakjától és méretétõl függ. A szürkeségi hisztogram úgy változik, hogy nyitás során a kép nem lehet világosabb, mint az eredeti volt, azaz a szürkeségi szintek összege (a hisztogram alatti terület) legfeljebb megegyezik az eredetivel.
a) eredeti kép
b) nyitással módosított kép
c) eredeti kép
d) zárással módosított kép 7.5-14. ábra. Nyitás és zárás
Számítógépes képelemzés
47
Több érdekes szûrõ származtatható az erózió, dilatáció, opening, closing egymást követõ alkalmazásával. Alternáló sorozatokon alapuló szûrõk (ASF) például az n-szeres black smoothing vagy a white smoothing mûveletek (7.5-15. ábra), melyeket rendre az alábbi sorozatok definiálnak: 1 open → 1 close → 2 open → 2 close → ... → n open → n close 1 close → 1 open → 2 close → 2 open → ... → n close → n open
a) eredeti kép
b) fehér simítással módosított kép
7.5-15. ábra. A fehér képrészletek simítása
Az open és close mûveletek váltakozásával a lágyítás hatása erõsödik, míg az elkövetett hiba csökken ahhoz képest, amit az n-szeres opening okozna a világos objektumok, vagy az n-szeres dilatáció a sötét objektumok esetén. Más ASF is elõállítható - amelyek keresését fõként a nagy számításigény csökkentése inspirálja, például: 1 open → 3 close → 5 open → 7 close → ... → n-2 open → n close A median szûrõ nem más, mint az adott képpont szürkeségi szintjének helyettesítése környezete mediánjával. A nyitástól és zárástól eltérõen a medián mind az apró világos, mind az apró sötét objektumokat eltávolítja a képbõl. Ez többnyire zajcsökkentés során hasznos, mikor a zaj nem periodikus, véletlenszerû, mivel a nagy objektumok határai többé-kevésbé élesek maradnak. A tophat transzformációkat az alábbi általános egyenlettel definiálhatjuk: Eredeti kép - lágyított kép (smoothing) = ±TOPHAT
48
Számítógépes képelemzés
Azaz: a tophat transzformációk eredményeképpen a kép azon részleteit kapjuk meg, amelyek a lágyítás (amely gyakorlatilag bármely szûrõ eredménye lehet) során elvesztek. A tophat transzformációk így egyfajta felüláteresztõ szûrõknek tekinthetõk, mivel – a Fouriertranszformációknál majd részletesebben szólunk errõl – a kép nagyfrekvenciás összetevõit, részleteit engedik át. A leggyakoribb tophat transzformációk az opening transzformáció eredményének kivonása az eredetibõl (white tophat), vagy az eredeti kivonása a closing eredményébõl (black tophat). Ez utóbbi például az apró és sötét objektumok megkeresésére szolgál (méretük az elõbbiek alapján a closing során használt szerkezeti elem alakjától, méretétõl és az iterációk számától függ). A zárás eltávolítja ezen részeket a képbõl azáltal, hogy környezetük szürkeségi szintjével "tölti fel" õket, így a tophat során kapott output ezen szintek és az eredeti sötét foltok különbsége lesz. Így azt mondhatjuk, hogy a black tophat transzformáció egyfajta lokális kontrasztot ad, ami jól hasznosítható, amennyiben az eredeti kép háttere nem egyenletes (7.5-16. ábra). Értelmezhetõk tophat transzformációk más módszerrel lágyított képek felhasználásával is.
Számítógépes képelemzés
49
a) eredeti kép
b) fekete simítás
c) eredeti kép
d) "black tophat"
7.5-16. ábra. A fekete képrészletek simítása és a black tophat transzformáció
A morfológiai gradienseket az alábbi egyenletek definiálják: Eróziós gradiens = Eredeti kép - Erodált kép Dilatációs gradiens = Dilatált kép - Eredeti kép Gradiens = Dilatált kép - Erodált kép A gradiensek élkeresõ funkciókkal rendelkeznek, mivel az átmeneteket keresik meg - egyik szürkeségi szintbõl a másikba. A gradiens kép valamely képpontjának szürkeségi szintje az adott képpont környezetében
Számítógépes képelemzés
50
jellemzõ szürkeségi szint-változásra utal – természetesen az eredmény a szerkezeti elemtõl és a dilatáció vagy erózió iterációs lépéseinek számától függ (7.5-17. ábra).
a) eredeti kép
b) gradiens
7.5-17. ábra. A gradiens mûvelet eredménye
A képfeldolgozó-képelemzõ szoftverek delineation funkcióját akkor alkalmazzuk, ha – ez még nagy felbontás mellett is általános – az objektumok határai nem tökéletesen élesek. Az élek elmosódottságát meglehetõsen sok tényezõ okozza, kezdve a kamera korlátaitól (nem tud ugrásszerû átmenetet elõállítani nagy szürkeségi különbség esetén) egészen a fókusz és a mélységélesség okozta problémákig. De még ha az optika tökéletesen éles képet alkotna is, a digitalizálás során az élek képpontokat vágnak ketté, így az adott képpont szürkeségi értéke az objektum és a háttér átlagából származik. Az elmosódott élek a detektálás pontosságát rontják, mivel az objektum által a szegmentálást követõen elfoglalt képpontok száma egy-két szürkeségi szinttõl függ. A helyzet még kritikusabb abban az esetben, ha két szürkeségi szint közé esõ objektumokat kívánunk kiválasztani. Ekkor elõfordulhat, hogy valamennyi sötétebb objektum körvonalát (illetõleg az átmeneteket) detektálni fogjuk*. A delineation, mint eróziók és dilatációk speciális sorozata, az objektumok körvonalánál tapasztalható átmeneteket élesíti, csökkentve ezáltal az objektumok detektálása során tapasztalható ingadozásokat (7.5-18. és 7.5-19. ábra). Megjegyezzük, hogy az alacsony kontrasztú képeknél nem mutat érdemleges javulást. *
Ezt nevezzük holdudvar( halo) hatásnak.
Számítógépes képelemzés
a)eredeti kép
51
b)delineate
7.5-18. ábra. A delineation mûvelet eredménye
7.5-19. ábra. A delineation mûvelet hatása a szürkeségi profilra
A lineáris nyitás, lineáris zárás mûveletek az eredeti kép és ennek adott méretû lineáris szerkezeti elemmel végrehajtott opening/closing eredményezte transzformáltja közötti superior/inferior transzformációt jelentik. A lineáris nyitás a szürkekép világos régióira hat: a szerkezeti elem irányában nyújtott világos objektumok megmaradnak, míg a nem nyújtott jellegzetességek eltûnnek. A lineáris zárás ennek komplementer
Számítógépes képelemzés
52
mûvelete: a kép sötét régióira hat, amennyiben az elnyúlt sötét objektumok nem változnak, a körszerûek eltûnnek(7.5-20. ábra). Ha az iteratív lépések száma nagy, a lineáris nyitást követõen geodézikus dilatáció, a lineáris zárás után geodézikus erózió ajánlatos a kép rekonstruálása érdekében.
a) eredeti kép
b) lineáris zárás 7.5-20. ábra. A lineáris zárás
A geodézikus transzformáció elnevezés egy mûvelet két típusát jelöli: a számítógépes grafikában gyakran alkalmazott maszkolásos technika – egyik esetben bináris, a másikban szürkekép maszkkal. Geodézikus erózió során bináris maszk alkalmazásával az eróziót a szürkekép csupán azon tartományaiban hajtjuk végre, ahol a bináris kép, mint maszk, átfedi azt. Másképpen ez egy tetszõleges alakú képkeretként fogható fel. Szürkekép-maszk alkalmazása némiképp bonyolultabb: legyen most a néhányszor erodált kép a "mag", legyen a felhasznált maszk-kép az eredeti, s dilatáljuk a magot úgy, hogy a maszk szürkeségi szintjei horizontálisan korlátozzák a szürkeségi profil terjeszkedését (7.5-21. ábra). Ennek hatására a nemkívánatos részek eltûnnek, s a megmaradó elemek integritása megõrizhetõ.
Számítógépes képelemzés
53
7.5-21. ábra. Geodézikus transzformáció szürkekép maszkkal
A rekonstrukciós szûrõ elnevezés az elõbbiek alapján eróziót vagy dilatációt követõ geodézikus transzformációkat jelöl. A fill mûveletek (fill black, fill white) az opening vagy closing transzformációk második lépéseként a megfelelõ geodézikus transzformációt hajtják végre, azaz például a fill black mûvelet a dilatáció - geodézikus erózió lépéssorozattal egyenértékû és mint a neve is sugallja a kép sötétebb "lyukait" tölti ki környezetük szintjével. A fill mûveletek hasznosak lehetnek a tophat transzformáció során, a lágyítás lépésében átvehetik az open/close szerepét. Említsünk meg egy elnevezésbeli következetlenséget, amelyek fölött a képátalakítások során gyakran elsiklunk: a geodézikus transzformációk fenti tárgyalásából nem következik (illetve a továbbiakban a szkeletonizáció értelmezésénél sem), hogy a mûveletet hány lépésig végezzük. A bemutatott szürkeségi profil azt sugallja, hogy "ameddig csak lehetséges", azaz amíg a maszk (eredeti) korlátaiba ütközünk, ám ezt az angol nyelvû szakirodalom az "exhaustive", kimerítõ avagy teljes ("ameddig csak lehet") jelzõvel illeti. A továbbiakban akkor, ha geodézikus erózióról vagy dilatációról, illetve szkeletonizációról beszélünk mindig a mûveletek kimerítõ változatait értjük alatta. Ugyancsak a rekonsrukciós szûrõk között kell megemlítenünk a flood mûveleteket. Definíció szerint háttérnek nevezzük a kép széleit
54
Számítógépes képelemzés
érintõ, a mérendõ objektumoktól eltérõ tartományokat, míg lyukaknak hívjuk ugyanezeket, ha a kép széleit nem érintik, azaz egy ha egy objektum belsejében vannak. A flood mûveletek a kép széleitõl kiindulva hajtanak végre geodézikus rekonstrukciót, eredményképpen a lyukak azonosítása történik a sötét (flood black) vagy a világos (flood white) objektumokban; másképp megfogalmazva a kép széleit más világos képpontokon keresztül nem érintõ világos (flood black) vagy a kép széleit más sötét képpontokon keresztül nem érintõ sötét (flood white) foltok kitöltése játszódik le. A lokális minimum, lokális maximum olyan képpont-tartományokat jelölnek, amelyeket teljes egészében náluk nagyobb illetve kisebb szürkeségi szintû képpontok vesznek körül. A lokális minimumokat az eredeti kép és egy választott konstanssal minden képpontban megnövelt szürkeségi szintû kép különbségébõl származtathatjuk egy geodézikus erózió (sötét-rekonstrukció) során. A lokális maximumokat az eredeti kép és egy választott konstanssal minden képpontban csökkentett szürkeségi szintû kép különbségébõl származtathatjuk egy geodézikus dilatáció (világosrekonstrukció) segítségével. Az említett konstans a mélységi paraméter, ettõl, valamint az alkalmazott szerkezeti elemtõl függ az output jellege. Az extrémumok lokális jellegûek, így gyakran a zajt is minimumként illetve maximumként találják meg, ezért alkalmazásuk elõtt hasznos lehet egy medián szûrés és a binárissá alakított kép bináris maszkként való használata az eredetin végrehajtott extrémum keresés alkalmával. Sok szürkekép transzformáció jól szemléltethetõ, ha a szürkeségi szinteket topográfiai, háromdimenziós ábrának tekintjük oly módon, hogy a nagyobb szürkeségi szintek a magasabban fekvõ, a kisebbek az alacsonyabban fekvõ pontoknak feleljenek meg. Egyfajta domborzati térképet alkothatunk, amiben az egyes morfológiai mûveletek szemléletes értelmezést nyernek: az erózió a csúcsokról és lejtõkrõl rétegeket távolít el, míg a dilatáció a völgyek és emelkedõk feltöltésével egyenértékû; a gradiens az emelkedõk dõlését mutatja minden pontban; a lokális maximum a csúcsokat, a lokális minimum a medencéket jelöli, a mélységi paraméter pedig meghatározza, hogy milyen magasra láthatunk ki a medence mélyérõl (7.5-22. ábra). A flood white kitölti e medencéket körvonaluk legalacsonyabb pontjáig, a flood black lecsiszolja a csúcsokat, amíg csak össze nem érnek egy-egy vonulaton. A fill mûveletek az adott méretû medencéket töltik fel vagy az adott méretû csúcsokat vágjál le.
Számítógépes képelemzés
55
a) eredeti kép
b) térbeli kép (a felvételt Barkóczy Péter készítette) 7.5-22. ábra. A szürkeségi szintek alapján konstruált térbeli kép
A szürkekép-szkeletonizáció egy sorozatos erózió eredménye oly módon, hogy a vonulatok ne vesszenek el, másképpen olyan feltételes eróziót takar, amelyik megõrzi az egyes világos tartományokat összekötõ éleket. A mûvelet lépésenként történik, így maga a szkeletonizáció egyetlen olyan eróziót jelent, amelyben a vonulatok megmaradnak. A kifejezést a gyakorlatban a teljes, kimerítõ változatra használjuk, ami olyan mûveletnek felel meg, amelyben csupán a vonulatok maradnak meg: ez utóbbi a vázszerkezet-elõállítás. A pruning a vázszerkezet oldalágait keresi meg, majd csökkenti és ("teljes" értelemben) eltávolítja. A watershed transzformáció a morfológiai mûveletek talán legöszszetettebbje. Gyakorlatilag a vázszerkezet-elõállítás és a kimerítõ pruning
Számítógépes képelemzés
56
mûvelet eredményeként áll elõ. Hatása a lokális minimumok feltételes növelésével azonos, amennyiben a feltétel, hogy addig növeljük az egyes lokális minimumok elfoglalta területeket, amíg össze nem érnek. Így topográfiai értelemben vonulatok állíthatók elõ, amelyek mint a watershed – vízválasztó – elnevezés is mutatja, meghatározzák, hogy melyik medence melyik lejtõrõl gyûjti össze a csapadékot, azaz melyik lokális gradiens melyik lokális minimumba tart (7.5-23. ábra).
7.5-23. ábra. A watershed transzformáció
Szegmentálás textúra alapján Ahogyan már említettük, a szürkeségi szint szerinti szegmentálás (detektálás) egyfajta look-up table transzformáció. A szövetelemek textúra alapján történõ elkülönítése viszont kétlépéses folyamat: részben morfológiai mûveletek elvégzését igényli. A módszer lényegére talán egy egyszerû példával világíthatunk rá a legjobban: tekintsünk egy proeutektikus szerkezetet, vagyis amelyben az eutektikumot alkotó két fázis egyike az eutektikus tartományok között is megtalálható. Elemezzük ezt olyan nagyításnál, ahol az eutektikum szerkezete is látszik. Ekkor a proeutektikus szövetelem és az eutektikumot alkotó megfelelõ fázis színe azonos, elkülönítésük közvetlenül szürkeségi szint alapján nem lehetséges (ti. vagy a homogén fázist detektáljuk az eutektikum megfelelõ fázisával együtt, vagy az eutektikum másik fázisát önmagában). Alkalmazzunk e helyett egy, pl. 5x5 pixel méretû szerkezeti elemet: helyettesítsük minden kép-
Számítógépes képelemzés
57
pont értékét a kernel által kijelölt szomszédsága maximum és minimum értékének különbségével. Ez homogén tartományokban nem jelent érdemi változást, periodikus szerkezetbõl viszont többé-kevésbé homogén foltokat képez, ami éppen az elérni kívánt eredmény, így a detektálás már megoldható. Fourier-transzformáción alapuló módszerek Nagyon röviden, csupán a teljesség kedvéért térünk ki a mikroszkópos felvételek elemzésekor egyre elterjedtebben alkalmazott Fouriertranszformáción alapuló módszerekre(7.5-25. ábra). A diszkrét Fouriertranszformáció (numerikus harmonikus analízis) jól hasznosítható például periodikus zajok szûrésekor, és a képtömörítésben, képjavításban is hatékony eszköz. A kétdimenziós képek diszkrét Fourier-transzformációjának az az alapja, hogy a képfüggvény független változóiként a helykoordináták, függõ változóiként pedig az adott képpont szürkeségi értékei tekinthetõk. Folytonos esetben a kétdimenziós Fourier-sor exponenciális alakja a következõ: ∞
∞
f ( x, y ) = ∑∑ C mn e
i 2π ( m
x y +n ) Lx Ly
(7.4-6)
m =0 n =0
ahol x és y a képkoordináták, f(x,y) a képpontok szürkeségi függvénye, Lx és Ly a kép két mérete, m és n a Fourier-sor indexei, Cmn a sor együtthatói, vagyis az illetõ felharmonikusok amplitúdói. Ez trigonometrikus formában az alábbi egyenlettel adható meg*: ∞
∞
f ( x, y ) = ∑∑ {Re(C mn ) cos[2π (m m =0 n =0
x y + n )] + Lx Ly
+ Im(C mn ) sin[2π (m
y x + n )]} Lx Ly
(7.4-7)
Az együtthatókat definiáló összefüggés pedig (amely az Eulerösszefüggés segítségével ugyancsak trigonometrikus alakra hozható): C mn
*
1 = Lx L y
Lx L y
∫ ∫ f ( x , y )e
−i 2π ( m
x y +n ) Lx Ly
dxdy
0 0
Re: a komplex együttható valós, míg Im: annak képzetes része.
(7.4-8)
Számítógépes képelemzés
58
A számítások az f(x,y) mátrixformában adott, diszkrét függvényre az alábbi egyenletek alapján végezhetõk el: 1 F (m, n) = MN
M −1 N −1
∑∑ f ( x, y)e
− i 2π ( m
x y +n ) Lx Ly
(7.4-9)
x = 0 y =0
ahol: M és N a transzformált értéksor periódusát jelöli a két irányban, az F(m,n) pedig az együtthatókat. Az inverz transzformáció pedig: f ( x, y ) =
M −1 N −1
∑∑ F (m, n)e
i 2π ( m
x y +n ) M N
(7.4-10)
m =0 n =0
A frekvenciadomén elnevezéssel olyan képre hivatkozunk, ahol az egyes F(m,n) komplex együtthatók abszolút értékét (illetve általában ennek logaritmusát) m és n függvényében ábrázoljuk (8 bites képként, azaz 256 szürkeségi szinten). A nagyfrekvenciás tagok a gyors képi váltásokért, míg az alacsony frekvenciák a lassú, fokozatos átmenetekért (gradiens, háttér) felelõsek.
a) eredeti kép
b) eredeti kép Fourier-spektruma
Számítógépes képelemzés
c) zajos kép
59
d) zajos kép Fourier-spektruma
7.5-25. ábra. Mikroszkópos felvételek és Fourier-transzformáltjaik
Abban az esetben, ha az eredeti képen periodikus zaj volt (általában elektromos erõsítési hiba), a frekvencia-képen csúcsok jelentkeznek, amit a már említett matematikai morfológiai mûveletekkel szûrhetünk, majd az inverz transzformációval a szûrt képet helyreállíthatjuk. Értelemszerûen, a sor minél több tagját vesszük figyelembe, annál pontosabban közelíthetjük a képet. A magasabb frekvenciájú felharmonikusok elhagyása fõként fényképek tömörítésekor hasznos, mivel ez nem eredményezi a látvány különösebb romlását, ám a kép méretét jelentõsen csökkentheti. A Fourier-transzformáció hasznos és gyors módszer lehet bonyolult konvolúciók esetén, nagyméretû kernelek alkalmazásakor. Ugyanis a konvolúció gyorsabban hajtható végre Fourier-módszer segítségével, mint a korábban ismertetett módon. Képezzük az eredeti kép transzformáltját, hozzuk létre a kívánt kernel transzformáltját is, állítsuk elõ szorzatukat, aminek eredményeképpen az output-kép transzformáltját kapjuk meg. Ezután az inverz-transzformációt alkalmazva megkaphatjuk a kívánt átalakított képet. Két kép hasonlóságának számszerûsítése kivételesen érdekes terület: objektumok azonosítása egy ismert és egy ismeretlen típusú próbatesten, vagy mozgó objektumok azonosítása két egymást követõ kép képkockáin jól példázzák a lehetõségeket. Két kép hasonlóságát a korrelácó számítás segítségével számszerûsíthetjük, minden lehetséges (eltolt) helyzetükre
Számítógépes képelemzés
60
meghatározva egy jellemzõ paramétert (pontonként vett szorzatuk összegének átlagát), amelynek maximumaként elõáll a leginkább egyezõ helyzet (Székely (1994)). E számítások a Fourier-térben kisebb számításigénnyel hajthatók végre. Az autokorrelációs függvényt e mûveletsorozat adja abban az esetben, ha a két input ugyanazon kép. A képhelyreállítás során ugyancsak hasznos eszközt jelent: a megrongálódott képek (elektromágneses interferencia, karcok egy fényképen) korrigálhatók a frekvencia-spektrum különbözõ részeinek módosításával. Ha a képalkotás szisztematikus hibája ismert (defókuszáltság), speciális dekonvolúció során a látvány javulása is elérhetõ. 7.4.4
Bináris képek átalakítása
Emlékezzünk rá, hogy a bináris kép elnevezés egy olyan képre utal, amelyben csak két érték: 0 vagy 1 szerepel. A szürkeképek bináris képpé alakítása a mérni kívánt objektumok kijelölését jelenti, vagyis azon tartományok azonosítását, amelyekrõl információt kívánunk kapni (10.-2. ábra). A binárissá konvertálás azonban gyakran nem eredményezi a jellegzetességek olyan pontosságú megjelölését, hogy megismételhetõ méréseket végezhessünk és pontos értékekhez jussunk. Ezért bizonyos bináris morfológiai mûveletekkel tovább javíthatjuk a detektálás útján kapott képet, amelyen az elemzés már nagyobb biztonsággal elvégezhetõ. A logikai mûveletek, mint az OR (unió), az AND (metszet), valamint a XOR (XOR = OR-AND), szokásos értelmezésükhöz híven két kép által az adott képpont mátrixból együttesen elfoglalt, mindkettejük által elfoglalt, illetve csupán egyikük által elfoglalt képpontokat jelentik. A bináris erózió és a dilatáció képpontok eltávolítását illetve hozzáadását jelenti az objektumokhoz határaik mentén (10-3. ábra). Komplementer mûveletek, tehát az objektum (S=1) eróziója a háttér (S=0) dilatációjával azonos és fordítva. Erodálás során az apróbb részecskék (és a detektált zaj) eltûnhetnek, míg a dilatáció hasonlóan hat a háttér hibáira, vagyis a szürkekép objektumainak konkáv tartományai (apró lyukak) eltûnnek. Az erózió és a dilatáció a logikai mûveleteken keresztül is igen hasznos transzformációt biztosítanak: pl. az eredeti kép és az erodált kép XOR-ja az objektumok egyetlen képpont vastagságú határait adja. A morfológiai mûveletek egy szerkezeti elem segítségével hajthatók végre, amely az egyes képpontok szomszédainak figyelembe vételével határozza meg az erózió és a dilatáció viselkedését. Gyakori szerkezeti
Számítógépes képelemzés
61
elem a négyzetes (7.5-26. ábra), amikor az adott pixel (p) mind a nyolc szomszédját (n1, n2, …., n8) figyelembe vesszük.
7.5-26. ábra. Négyzetes szerkezeti elem
A morfológiai mûveletek úgy zajlanak, hogy az átalakítandó képen a szerkezeti elem valamennyi lehetséges helyzeténél a szerkezeti elem kijelölte szomszédok és az adott képpont viszonyát vizsgáljuk. Ha egy képpont a határon fekszik, legalább egy szomszédja 0 értéket képvisel. Így például az erózió mûveleti definícióját megadhatjuk úgy is, hogy amennyiben a 3x3-as négyzetet alkalmazzuk szerkezeti elemként, a középsõ képpont értékét cseréljük nullára, ha bármelyik – a szerkezeti elem által fedett – szomszédja 0. Ha csak a felsõ éleket akarjuk erodálni, akkor a 7.5-27. ábrán látható szerkezeti elemet alkalmazzuk. Az erózió alkalmával 0 értékûre cserélünk minden olyan képpontot, amely nem felel meg az adott mintának (7.5-27. ábra, X a figyelembe nem vett szomszédokat jelöli). A csere tulajdonképpen nem más, mint a kernel 1 értékkel jelölt elemei (a figyelembe vett szomszédság) és a képpontok 0 vagy 1 értékei közötti AND mûvelet eredménye.
7.5-27. ábra. Szerkezeti elem a felsõ élek eróziójára
Az opening és a closing mûveletek a szürkeképeknél definiált módon egymást követõ eróziók és ekvivalens dilatációk, illetõleg dilatációk és ekvivalens eróziók elvégzését jelentik. Ismételten kiemeljük, hogy az ekvivalens kifejezés nem csupán ellentétes transzformációt jelent, hanem
Számítógépes képelemzés
62
azonos számú iterációs lépést is. A nyitás és a zárás az apróbb objektumok, a zaj eltüntetésére szolgál és attól függõen alkalmazandó, hogy a háttérbõl (0) kívánunk-e szûrni szükségtelenül detektált (1) elemeket (10-4. ábra), avagy az objektumokban maradtak apró detektálatlan képpontok (7.5-28. ábra). Szabálytalan alakú objektum vizsgálata során észrevehetõ, hogy a nyitás az objektumok alakját a körszerûség irányába tolja (a kezdeti eróziós lépés miatt), míg a closing okozta torzítás más jellegû: a nyúlványok megnyúlnak, esetleg addig nem érintkezõ objektumok érintkeznek.
7.5-28. ábra. Bináris nyitás a) és zárás b)
A closing azért használható csoportosulások (mikroszkópos inhomogenitás) azonosítására, mert az addig nem érintkezõ részecskéket a dilatáció "összenöveszti", az erózió pedig közelítõleg visszaállítja a cluster* eredeti méretet (10-5. ábra), így ezek egyként mérhetõk (7.5-29. ábra).
*
Csoportosulás, részecske-halmaz.
Számítógépes képelemzés
63
7.5-29. ábra. Closing mûvelet részecske-csoportosuláson a) részecske- cluster, b) c) closing, d) lineáris closing
Az erózió és a dilatáció a kép egészére hatással van. Elképzelhetõ azonban olyan eset, amikor szûkíteni kívánjuk ezt a tartományt, ekkor csupán egy bináris maszk által kijelölt területen hajtjuk végre a kívánt mûveletet. Ezek a szürkeképek kapcsán már ismertetett geodézikus transzformációk bináris megfelelõi (geodézikus dilatáció és erózió). Ezek a mûveletek leginkább a képek rekonstrukciója során használatosak. A zajcsökkentés során el nem tüntetett objektumok geodézikus dilatációja az eredeti kép maszkként való használatával pontos eredményekhez vezethet (7.5-30. ábra). Ez esetben a zajcsökkentett képet magnak nevezzük.
Számítógépes képelemzés
64
7.5-30. ábra. Geodézikus dilatáció
A lyukak azonosítása hasonló elven történhet, amennyiben lyukakként a háttér azon pontjait azonosítjuk, amelyek nincsenek a háttér más pontjain keresztül "összeköttetésben" a képkerettel. Azt mondhatjuk tehát, hogy lyukak olyan tartományok, amelyek nem rekonstruálhatók a háttér geodézikus dilatációjával a képkeret „magként” történõ felhasználása mellett. A nem zárt objektumokban ez a módszer nem talál lyukat (7.5-31. b) ábra), így egy megelõzõ closing (innen az elnevezés) vagy dilatáció a 7.5-31. b) ábrán is javíthatja az eredményt.
a)
b)
7.5-31. ábra. Lyukak zárt a) és nyitott b) objektumokban
Számítógépes képelemzés
65
A szemcsék és részecskék egyedi paramétereinek mérése során nem hagyható figyelmen kívül, hogy az adott objektum kisebb vagy nagyobb része kívül esik a képkereten. Ezért a méréseket - bizonyos, a következõ fejezetben részletezett, feltételek mellett - a képkeretnél kisebb, ún. mérõkereten belül végezzük. Ha az objektum egy megkülönböztetett pontja (FCP, feature count point) a mérõkereten belül esik, akkor mérjük, ellenkezõ esetben figyelmen kívül hagyjuk. Elõállhat azonban olyan eset, hogy az objektum látható részének FCP-je a mérõkereten belül esik, az objektum nagyobb része mégsem látható a képen. Ennek kiküszöbölése érdekében gyakran eltávolítjuk a képkeretet érintõ pontokat (ez csak a részecske-paramétereknél alkalmazható, amikor is az egyes objektumok jellemzõit számszerûsítjük, ez a módszer a látótér átlagos adatainak meghatározásakor – pl. területhányad – hamis eredményre vezet és értelmetlen is). A gyakorlatban a képkeretet magként használva geodézikus dilatációt hajtunk végre, ahol is az eredeti bináris kép a maszk. Ezt követõen egy XOR mûvelet biztosítja a kívánt eredményt. Ha szemcsehatárokat detektálunk (7.5-32. ábra) az inverz képen végezzük el a mûveleteket (10-6. ábra).
7.5-32. ábra. A képkeretet érintõ részecskék eltávolítása
66
Számítógépes képelemzés
A lineáris nyitás tulajdonképpen a lineáris szerkezeti elemmel történõ opening és az eredeti kép uniója, míg a lineáris zárás nem más, mint egy lineáris szerkezeti elemmel történõ closing és az eredeti kép metszete. A lineáris nyitás a szerkezeti elem nyújtottságának irányában nyújtott alakzatokat tartja meg, míg a lineáris zárás a háttérnek a szerkezeti elem nyújtottságának irányában nyújtott tartományait tartja meg. A szkeletonizáció vagy vázszerkezet-elõállítás egyfajta feltételes eróziót jelent, az objektumok méretének fokozatos csökkentését úgy, hogy azok középvonala ne tûnjön el. Definíció szerint a középvonalat a beírható maximális sugarú körök középpontjai alkotják, elõállításakor az objektum minden pontjához meghatározzuk a határ legközelebbi pontját, s ha ebbõl kettõ van, akkor az illetõ pont a vázszerkezet része. A vázszerkezet – matematikai morfológiai bizonyítás alapján – sorozatos erózióval hozható létre, úgy, hogy 1) a végpontokat ne távolítsuk el, 2) az összefüggõ alakzatok összefüggõek maradjanak és 3) az eróziós szerkezeti elem kijelölte tartományban a vázszerkezetre vonatkozóan ne történjen információvesztés*. A teljes vagy kimerítõ szkeletonizáció során csupán egyetlen képpont szélességû vonal marad meg (7.5-33. ábra). A szkeletonizáció (10-7. ábra) során az objektumok száma nem változik. A vázszerkezeten könnyen azonosíthatók az elágazások: ezek olyan pontok, amelyeknek kettõnél több 1 értékû szomszédja van. Ez például szálas szerkezet elemzésekor, a szálak átlapolódásának kiszûrésére jól használható.
*
Ha a 3x3 kernel középsõ pontja határpont, és csak egyetlen szomszédja 0 értékû, nem lehetünk biztosak a vázszerkezet helyzetében, tehát ebben a lépésben nem távolíthatjuk el.
Számítógépes képelemzés
67
7.5-33. ábra. Különbözõ objektumok vázszerkezete
A pruning* mûvelet a vázszerkezet oldalágait metszi le oly módon, hogy az egyetlen 1 értékû szomszéddal rendelkezõ pontokat (végpontok) eltávolítja (10-8. ábra). Teljes vagy kimerítõ értelmezésben csupán körszerû képzõdmények maradnak, végpontok és ágak nélkül. Ez különösen hasznos szemcsehatár-elemzés során a polírozás hibáiból fakadó vonalak eltüntetésére. Más esetben az összetett objektumok olyan vázszerkezetének elõállításához nyújthat segítséget, amelyen nincsenek felesleges oldalágak (7.5-34. ábra).
*
Pruning - metszés, nyesés.
68
Számítógépes képelemzés
7.5-34. ábra. Oldalágak nélküli vázszerkezet elõállítása a) eredeti kép, b) vázszerkezet, c) oldalágak nélküli vázszerkezet
Az inverz vázszerkezet az inverz képen értelmezett szkeletonizáció (10-9. ábra), avagy az eredeti kép objektumainak dilatációja azzal a feltétellel, hogy ne érjenek össze (7.5-35. a) ábra). Ha ezt a maximális iterációs számig végezzük és egy kimerítõ inverz pruning-gal kombináljuk, akkor a hatósugár szerinti inverz vázszerkezetet állítjuk elõ, másképpen: skiz (inverse skeleton by influence zone) (7.5-35. b) ábra). Ezáltal minden korábbi objektumhoz hozzárendelhetõ egy a képbõl elfoglalt tartomány. Ennek maszk-képpel kombinált verziója az ún. geodézikus skiz különösen a szemcsehatár-rekonstrukció során hasznos.
Számítógépes képelemzés
69
7.5-35. ábra. Inverz vázszerkezet a) és a SKIZ transzformáció b)
A teljes erózió (ultimate erosion) a normál erózió változata, azzal a különbséggel, hogy nem engedi az objektumokat eltûnni (10-10. ábra); eredményként egyetlen ponttá zsugorodott objektumkat kapunk (7.5-36. ábra). A megmaradó képpont eredeti objektumhoz viszonyított helyzete az alkalmazott szerkezeti elemtõl függ. Probléma adódhat szabálytalan alakú vagy átlapolódó részecskék esetén, ugyanis elképzelhetõ, hogy az algoritmus objektumonként nem csupán egyetlen pontot talál. Ennek kiküszöbölésére és a mûvelet gyorsítására a képelemzõ rendszerek csupán bizonyos számú lépés után ellenõrzik, hogy mely objektumok erodálhatók tovább. Ezáltal esetleg nem egy képpontnyi méretû lesz az eredmény.
7.5-36. ábra. Teljes erózió
70
Számítógépes képelemzés
Az érintkezõ objektumok szétválasztása általában két lépésben történik: 1) Különálló és objektumonként egyedüli tartomány vagy képpont azonosítása. Ha nincs átlapolódás, vagy kisebb mint az elkülönítendõ részecskék átlagos mérete, vagy az objektumok nagyobbak, mint a legnagyobb átlapolódás, akkor néhány szoros erózióval egyszerûen elválaszthatók. Amennyiben a részecskék mérete közt szignifikáns a különbség, a teljes erózió mûvelete alkalmazható. 2) Rekonstrukció. A különálló pontokból vagy tartományokból visszaállítja a bináris képet úgy, hogy az objektumok ne érintkezzenek. Ez egy geodézikus SKIZ transzformációval hajtható végre, az eredeti kép maszkként való alkalmazásával. Jó eredmény nyújthat az extrémumszürkekép – minimum és maximum – detektált alakján végrehajtott geodézikus SKIZ is, ha maszkként az eredeti mediánjának detektált alakját használjuk. Ha - mint legkézenfekvõbb megoldást - a teljes eróziót választjuk az objektumok elkülönítésére, a geodézikus rekonstrukció azonos léptékben növeli (dilatációval) az eredetileg különbözõ méretû objektumokat. Mivel az átlapolódások miatt az eredeti képen nem volt értelmezhetõ a két részecske közötti határ, a rekonstrukció eredményeként kapott határok az azonosított képpontok vagy tartományok közti szakaszok felénél húzódnak. Ez jellegzetesen olyan, mintha a kisebb részecskék az átlapolódott nagyobb részecskébõl "kiharapnának" egy darabot. Ugyanakkor a teljesen különálló részecskék jól visszaállíthatók. Megoldás lehet a teljes erózió leállítása bizonyos számú iteráció után, hogy a már elkülönült, de még teljesen nem erodált nagyobb objektumok mérete tovább ne változzon. Így a dilatáció jobb eredményre vezet.
Számítógépes képelemzés
71
7.5. Mérési módszerek és paraméterek A mérnöki gyakorlatban a képelemzés legfontosabb célja a képek számszerû adatokkal történõ jellemzése, vagyis a mérés. Miután a képeken az elemzendõ objektumokat (szemcséket, részecskéket, fázisokat) elválasztottuk a háttértõl és bináris képpé alakítottuk, a megfelelõ bináris átalakításokkal a mérés szempontjából a lehetõ legoptimálisabb alakra hozzuk. Mielõtt részletesen bemutatnánk az ily módon létrehozott bináris képen végzett mérést és ismertetnénk a származtatható paramétereket, röviden szólunk a szürke képen végzett mérésekrõl is. Mérés a szürke képen Közvetlenül a szürke képeken végzett mérésnek azért van jelentõsége, mert néhány esetben az elemezni kívánt objektumokra nem az alakjuk, méretük, hanem képpontjaiknak a szürkeségi szintek szerinti eloszlása, az ún. szürkeségi hisztogramja jellemzõ. Ezt illusztrálja a 7.5-6. ábra, ami három különbözõ típusú szemcsét mutat. Ezek közül az egyik rendkívül porózus (egyenletesen szürke) a), a második rendkívül tömör, ezért az átvilágításos mikroszkópon áttetszõ (világos) b), míg a harmadik típusú por szemcséiben nagyméretû üregek találhatók, aminek következtében a szemcsén egy vagy több fekete foltot látunk c). Ezek a jellegzetességek bináris képeken nem jellemezhetõk, ellenben nagyon jól megfigyelhetõk az objektumok szürkeségi hisztogramjain.
7.5-6. ábra. Különbözõ típusú objektumok a) egyenletes szürke, b) egyenletes világos, c) fekete foltos
Az adott kép szürkeségi hisztogramja nem más, mint a különbözõ szürkeségi értékek elõfordulásának relatív gyakorisága. Amennyiben a hisztogramnak két csúcsa van, úgy kettõ, amennyiben három, abban az
Számítógépes képelemzés
72
esetben pedig három különbözõ fázis detektálható. Nagyon jellemzõ az adott képre az átlagos szürkeségi érték, a minimális és a maximális szint, valamint a szórás értéke is (7.5-7. ábra).
a)
b)
c) 7.5-7. ábra. Különbözõ típusú objektumok szürkeségi hisztogramjai a) egyenletes szürke, b) egyenletes világos, c) fekete foltos
Számítógépes képelemzés
73
Fontos információt szolgáltathat a szürke képen vízszintesen, vagy függõlegesen kijelölt vonal mentén mért szürkeségi profil is. Az optimális képfeldolgozó mûvelet kiválasztására, illetve a különbözõ transzformációk hatására bekövetkezõ változások szemléltetésére vagy éppen a morfológiai erózió, dilatáció, szürke képre kifejtett hatásának elemzésére egyaránt alkalmas ez a módszer. Bináris paraméterek és meghatározásuk A bináris képeken történõ mérésnek alapvetõen kétféle módja van: 1) Mérés a látótér átlagadatai alapján (’field’ paraméterek). 2) Mérés az objektumok (’objects’) vagy jellegzetességek (’features’) egyedi paraméterei alapján. Míg az elsõ esetben a látótér egészére jellemzõ adatokat határozunk meg, addig a második esetben lehetõségünk van az individuális objektumok, illetve részecskék egyedi jellemzésére is. A bináris mérés központi problémája, hogy a vizsgálni kívánt objektumok egy része szükségképpen érinti a kép szélét. Joggal vetõdik fel a kérdés: az objektumok hogyan folytatódnak a látótéren kívül. Vajon az objektumokra vonatkozó információ nagyobb része a látótéren belül van-e? Ezeknek a dilemmáknak a feloldására a képelemzéssel foglalkozó irodalom az ún. kettõs képkeret használatát javasolja. A gondolatmenet lényege a következõ. A képkereten belül, attól kisebb méretben, egy ún. mérõkeretet hozunk létre, s a kettõ közötti tartományt biztonsági tartománynak tekintjük (7.6-3. ábra) Ilyen keret használatakor eldönthetjük, hogy a részecskék a mérõkereten kívül, de még a biztonsági tartományon belül hogyan folytatódnak, s így a részecskék adatait milyen módon vehetjük figyelembe a mérés során. Ebbõl a szempontból nagyon határozott különbség van a látótér átlagadatainak, valamint az objektumok egyedi paramétereinek a meghatározása között. Az elsõ esetben minden egyes képpontot figyelembe kell venni, amely az adott mérõkereten belül van. Amennyiben az objektumok területarányát szeretnénk meghatározni, nyilván ezt a mérési módszert kell választanunk. A másik esetben – amikor az objektumok egyedi átmérõjét, kerületét mérjük – azokat az objektumokat, amelyekrõl biztosan tudjuk, hogy információtartalmuk nagyobb része a látótéren kívül van, nem veszszük figyelembe. Míg azokat, amelyek információtartalmának nagyobb része a látótéren belül van, teljes egészében figyelembe vesszük, függetlenül attól, hogy az objektum egy része esetleg a mérõkereten kívül, de még a biztonsági zónában, vagyis a képkereten belül tartózkodik. Ez utóbbi esetben biztosak lehetünk arról, hogy az így meghatározott egyedi
74
Számítógépes képelemzés
átmérõ (kerület, terület stb.) a valóságoshoz közelebb van. Mindezek alapján világos, hogy más információ tartalma van a látótér átlagadatainak, megint más az objektumok egyedi adatainak, ezért ezek egymásba nem számíthatók át.
7.5-8. ábra. Kettõs keret, a biztonsági zónával
Ugyancsak fontos alapelv, hogy a képelemzés során minden adatot, méretet képpontokban, pixelekben adunk meg. Az eredmények helyes értelmezéséhez természetesen a mért adatokat abszolút egységekbe kell átszámítani, erre szolgál az ún. kalibrációs faktor. Meghatározásakor a mérõkeret pixelben mért hosszát ismert nagyságú objektummal pl. tárgy mikrométerrel hasonlítjuk össze (7.5-9. ábra).
7.5-9. ábra. Hitelesítés, a kalibrációs faktor meghatározása
Számítógépes képelemzés
75
A kalibrációs faktor azt mutatja meg, hogy a képen egy pixel a valóságban hány milliméternek vagy hány mikrométernek felel meg. Nagyon fontos, hogy a képelemzés során a képpont mind a lineáris méretnek mind a területnek alapegysége. Ennek illusztrálására mutatjuk be a 7.5-10. ábra két objektumát, ahol mindkettõ 9 pixelbõl áll, vagyis mind a kettõnek 9 pixel a területe. Az egyik 9 pixel hosszúságú, míg a másik vízszintes mérete csak 3 képpont. Amennyiben az objektum hosszúságára abszolút adatokban van szükségünk, úgy a pixel értékeket a kalibrációs faktorral beszorozzuk és megkapjuk ezt az adatot. Ha a területre van szükségünk, akkor a képpontok darabszámát a kalibrációs faktorok négyzetével kell szoroznunk.
7.5-10. ábra. Különbözõ méretû, azonos területû objektumok
Mérés a látótér átlag adatai alapján A látótér átlag adatainak meghatározásakor a mérõkereten belül történik a mérés, s a következõ paramétereket szokás meghatározni: 1) Terület (’area’). A mérõkereten belül detektált képpontok darabszáma (7.6-6. ábra). 2) Kerület (’perimeter’). A mérõkereten belül detektált és nem detektált objektumok közötti határvonal hosszúsága (7.6-7. ábra). 3) Vízszintes metszésszám (’horizontal intercept’). A mérõkereten belül detektált objektumokon keresztül húzott vízszintes húrok (szakaszok) végeinek darabszáma (7.5-8. ábra). 4) Függõleges metszésszám (’vertical intercept’). A mérõkereten belül detektált objektumokon keresztül húzott függõleges húrok (szakaszok) kezdõpontjainak darabszáma (7.5-9. ábra).
76
Számítógépes képelemzés
5) Darabszám (’count’). A mérõkereten belül megkülönböztethetõ jellegzetességek (objektumok) darabszáma (7.5-10. ábra). 6) Átlagos húrhosszúság (’mean chord length’). A detektált objektumokba húzott vízszintes húrok átlagos hosszúsága.
7.5-11. ábra. Terület értelmezése a látótér átlag adatainak mérésekor
7.5-7. ábra. Kerület értelmezése a látótér átlag adatainak mérésekor
7.5-8. ábra. A látótér vízszintes metszésszámának értelmezése
Számítógépes képelemzés
77
7.5-9. ábra. A látótér függõleges metszésszámának értelmezése
7.5-10. ábra. A látótér átlag darabszámának értelmezése
a)
b)
c)
7.5-11. ábra. A látótér anizotrópiájának értelmezése a) anizotrópia ~1, b) anizotrópia > 1, c) anizotrópia < 1
78
Számítógépes képelemzés
7.5-12. ábra. Mérõkeret területének értelmezése
Ezen adatokból más jellemzõ paraméterek is származtathatók, úgymint: 7) Területarány (’area fraction’). A detektált objektumok látótéren belül mért összes területe osztva a mérõkeret nagyságával. 8) Anizotrópia (’anisotropy’). A detektált objektumok horizontális és vertikális metszésszámainak aránya (7.6-11. ábra). 9) Kitöltöttség (’area fill’). A detektált fázis területe viszonyítva a detektált fázis területével csökkentett mérõkeret nagyságához. 10) Átlagos húrméret (’mean chord’). A detektált területet osztjuk a vízszintes metszésszámmal. 11) Mérõkeret nagysága (’frame area’). Az alkalmazott mérõkeret nagysága képpontokban kifejezve (7.5-12. ábra). A látótér átlag adatainak meghatározásakor elsõsorban a darabszám becslésekor követhetünk el jelentõsebb hibát. Vannak olyan algoritmusok, amelyek abban az esetben, ha az objektumok belsejében lyukak figyelhetõk meg, nem adnak korrekt darabszámot. Ezt úgy küszöbölhetjük ki, hogy a bináris mûveleteknél ezeket a lyukakat kitöltjük. Vigyáznunk kell azonban, hogy ekkor pedig a terület nem lesz pontos. Az újabban alkalmazott számítási módszerek és szoftverek nem olyan érzékenyek az objektumok belsejében lévõ lyukakra, s még ilyen esetekben is precíz értékeket adnak. Az adatok felhasználása elõtt célszerû az általunk használt szoftver ilyen tulajdonságáról meggyõzõdni. A darabszám meghatározásakor a másik probléma az, hogy az objektumok egy része érinti a mérõkeretet. Ma a legáltalánosabban elfoga-
Számítógépes képelemzés
79
dott módszer szerint a látótér átlagadatainak meghatározásakor számított darabszámban csak azok az objektumok szerepelnek, amelyeknek jellegzetes pontja (FCP = Feature Count Point*) a mérõkereten belül van. Érdemes ezt, az adatok értelmezésekor figyelembe venni. Mérés az objektumok egyedi adatai alapján Az objektumok vagy részecskék egyedi paramétereinek meghatározásakor is kitüntetett szerepe van a részecskék jellegzetes pontjának (Feature Count Point). Ennek meghatározásakor figyelembe kell venni, hogy a képelemzés során az x,y koordináta rendszer kezdõpontja a képkeret bal felsõ sarka. A legáltalánosabban használt módszer szerint ez a jellegzetes pont az objektumnak azon képpontja, amely a utolsó pont (leginkább jobbra lévõ), az utolsó (legalul elhelyezkedõ) sorban (7.6-13. ábra). Amennyiben ez a legalsó sorban lévõ utolsó képpont – amely még az objektumhoz tartozik – a mérõkereten belül van, úgy ezt az objektumot az egyedi méréskor figyelembe vesszük. Az objektumok egyedi paramétereinek mérésekor semmilyen adatát nem mérjük, ha ez az FCP pont a mérõkereten kívül van. Ellenkezõ esetben mind a terület, mind a kerület, mind az átmérõk meghatározásakor a teljes objektumot figyelembe vesszük, függetlenül attól, hogy annak egy része esetleg a mérõkereten kívül van (7.5-14. ábra).
7.5-13. ábra. Az objektumok jellegzetes pontjának értelmezése
*
A Feature Count Point (FCP) lehet az objektum középpontja, vagy - sor folytonosan értelmezve - a legelsõ, esetleg a legutolsó pontja.
80
Számítógépes képelemzés
7.5-14. ábra. Az objektumok egyedi paramétereinek mérése
A látótér különálló jellegzetességeinek (’feature’) vagy objektumainak (’object’) jellemzésekor a részecskék individuális adatait határozzuk meg. A paramétereket a következõk szerint csoportosíthatjuk: 1) A részecskék méretével kapcsolatos adatok. 2) A részecskék határfelületének paraméterei. 3) Az objektumok alakjára jellemzõ értékek. 4) Az objektumok helyzetét mutató adatok. 5) Az objektumok orientációját jellemzõ paraméterek. 6) Az objektumok topológiájára jellemzõ tényezõk. A részecskék méretére jellemzõ adatok. 1) Az objektumok területe (’area’). A detektált objektum által elfoglalt terület nagysága képpontokban. Úgy is fogalmazhatunk, hogy azokat a képpontokat vesszük számba, amelyek az objektum belsejében találhatók. (7.6-15. ábra) 2) Konvex terület (’convex area’). A mérendõ objektumokat konvex burokkal vesszük körbe, s ennek a területét határozzuk meg. Amennyiben az objektum belsejében nincsenek lyukak, illetve a határfelületen kevés konkáv beszögellés található, a terület és a konvex terület egymáshoz nagyon közel van. Ellenkezõ esetben az objektum határvonalának konkáv voltát, illetõleg a belsejében lévõ lyukak mennyiségét jellemzõ konvex terület és a terület jelentõsen eltérhet. A konvex területet (Ak) rendszerint az átmérõk alapján becsüljük, az egyik lehetséges megoldás a következõ:
Számítógépes képelemzés
Ak =
π 4
1 n
n
∑ i =1
81 di
2
, ahol di = a mért Feret átmérõk nagysága,
n = pedig azok darabszáma (7.6-16. ábra).
7.5-15. ábra. Az objektumok egyedi területe
7.5-16. ábra. Az objektumok egyedi konvex területe
3) Ekvivalens körátmérõ (’equivalent circle diameter’). Az objektummal azonos területû kör átmérõje. A következõ módon számítható: d eq =
4A π
, ahol A = a részecske területe.
4) Feret átmérõk. Az objektumok maximális mérete valamilyen meghatározott irányban mérve. Azt is szokták mondani, hogy a Feret átmérõk tangens átmérõk, hiszen tulajdonképpen az adott irányban megrajzolt érintõk közül a legmesszebb lévõk távolságát jelenti. Mindezekbõl következik, hogy a Feret átmérõk meghatározásakor mindig meg kell adni a mérés irányát is. Leggyakrabban vízszintesen (0°), vagy függõlegesen (90°) szokás mérni ezeket az adatokat. A leggyakrabban használt irányokat a 7.5-17. ábra mutatja. A mai korszerû képelemzõ programok 64 különbözõ irányban is képesek mérni a maximális átmérõt. A különbözõ irányokban mérhetõ Feret átmérõk értelmezését a
Számítógépes képelemzés
82
7.6-18. ábra mutatja. A Feret átmérõk közül a legnagyobbat a részecske hosszúságának (’length’), míg a legkisebbet a szélességének (’width’) tekintjük. Szokás még az ortogonális Feret átmérõt is meghatározni (’orthogonal Feret’), amely a hosszúságra merõlegesen mért adat (7.6-19. ábra).
7.5-17. ábra. A Feret ámérõk meghatározásakor használt irányok
a)
b)
Számítógépes képelemzés
83
c)
d) 7.5-18. ábra. A különbözõ irányokban mért Feret ámérõk értelmezése a) F0 = a 0°°-os szöghöz tartozó Feret átmérõ b) F90 = a 90°°-os szöghöz tartozó Feret átmérõ c) F22.5 = a 22.5°°-os szöghöz tartozó Feret átmérõ d) F45 = a 45°°-os szöghöz tartozó Feret átmérõ
a)
Számítógépes képelemzés
84
b)
c) 7.5-19. ábra. A különleges Feret ámérõk definiálása a) hosszúság, b) szélesség, c) ortogonális Feret
5) Ívhosszúság (’curve length’). Tûszerû objektumok esetét szokás meghatározni az ívhosszúságot, amely az objektummal azonos területû téglalap hosszabbik oldalának mérete. Az objektum területe és kerülete alapján az ívhosszúság (Lc) a következõ: Lc =
P + P 2 − 16 A 4
, ahol P, A = az objektum kerülete ill. terü-
lete. 6) Ívszélesség (’curve width’). Az objektummal azonos területû téglalap rövidebb oldalának hosszúsága. Lc =
P − P 2 − 16 A 4
.
Számítógépes képelemzés
85
Az objektumok határvonalára jellemzõ adatok. 7) Kerület (’perimeter’). Ez nem más, mint az objektumokat körülvevõ határvonal hosszúsága képpontokban kifejezve (7.5-20. ábra). Az objektumok belsejében lévõ lyukak ún. belsõ határfelülete, pontosabban annak kerülete szintén a paraméter része. Az adatok értelmezésekor ezt a tényt feltétlenül figyelembe kell venni. A gyakorlatban a kerületet rendszerint a vízszintesen és a függõlegesen mért vetített átmérõkbõl becsülik, a sarkok figyelembevételével. 8) Konvex kerület (’convex perimeter’). Amennyiben az objektumok belsejében lyukak vannak, illetõleg a határvonal mentén konkáv beszögellések találhatók, hasznos lehet a konvex kerület meghatározása is. Ekkor az objektumot konvex burokkal veszszük körbe, s ennek a buroknak, mint határvonalnak a hosszúsága a konvex kerület (Pc) (7.6-21. ábra). Ez szintén származtatott n
π , 2n
paraméter: P c = 2 ∑ d i tg i =1
ahol di = a mért Feret átmérõk
nagysága, n = pedig azok darabszáma. 9) Vízszintes vetített átmérõ (’horizontal projection’). A detektált objektumokba rajzolt vízszintes húrok végeinek a darabszáma (7.5-22. ábra), amennyiben az objektum nem tartalmaz belsõ lyukakat, s a határvonala nem rendelkezik konkáv beszögellésekkel, úgy a vetített átmérõ és a Feret átmérõ nagyon közel van egymáshoz. Amennyiben az objektumon belül lyukak találhatók és/vagy a határvonal mentén konkáv beszögellések vannak, a horizontális vetített átmérõ és a Feret átmérõ jelentõsen eltérhet. 10) Függõleges vetített átmérõ (’vertical projection’). Ez nem más, mint a detektált objektumokba rajzolt függõleges húrok kezdõpontjainak száma pixelben (7.5-23. ábra). Ez az adat az objektumok belsejében lévõ lyukakat, s a határvonal mentén lévõ konkáv beszögelléseket jellemzi.
86
Számítógépes képelemzés
7.5-20. ábra. Az objektumok egyedi kerülete
7.5-21. ábra. Az objektumok egyedi konvex kerülete
7.5-22. ábra. Az objektumok vízszintes vetített átmérõje
7.5-23. ábra. Az objektumok függõleges vetített átmérõje
Számítógépes képelemzés
87
11) Körszerûség (’roundness’). Az objektumok alakjára* jellemzõ paraméterek közül az egyik legegyszerûbb a körszerûség. Ez a paraméter (R ) a körtõl való eltérést mutatja. Értéke =1, kör esetén. Amint egy adott területû objektumnak nagyobb a kerülete, mint egy ugyanolyan kerületû körnek, vagyis a határvonala nem körszerû, az adat egyre nagyobbá válik. Értelmezése a következõ: R =
P2 , 4πA
ahol P, A = az objektum kerülete ill. területe.
12) Nyújtottság (’aspect ratio’). Az objektumok alakjára jellemzõ. A nyújtottság (AR) nem más, mint a hosszúság és a szélesség viszonya: AR =
L W
, ahol L, W = a részecske hosszúsága ill. széles-
sége. 13) Kitöltöttség (’fullness ratio’). Szintén az objektumok alakjára jellemzõ, s kifejezi az objektum területének és a konvex területnek a viszonyát. Meghatározása a következõ módon történik. FR =
A A
c
, ahol A, Ac = a részecskék területe ill. konvex terüle-
te. A részecskék helyzetét, elhelyezkedését mutató adatok 14) Jelzõ pont (’Feature Count Point’). A részecskék (objektumok) elhelyezkedését jelzõ adatok közül az egyik legfontosabb az FCP pont x,y koordinátája. A részecskék számbavételekor felhasznált jelzõ pont nem más, mint a részecskéhez tartozó utolsó sorban lévõ legszélsõ pont ill. annak koordinátája. 15) Súlypont (’centroid’). Szintén fontos paraméter az objektumok súlypontjainak x,y koordinátája (x centroid, y centroid). 16) Az objektumhoz tartozó pontok xmin, xmax, ymin, ymax értékei. Az adatok meghatározásakor figyelembe kell vennünk, hogy megállapodás szerint a koordinátarendszer kezdõpontja a kép bal felsõ pontjában van, ez tehát az x=0, y=0 pont, míg a definíciót, a képet szemlélõ oldaláról fogalmazzuk meg. Így az ymax a legalacsonyabban lévõ, még a részecskéhez tartozó pont y koordinátája. Ez tehát a szemlélõdõ szerint a legalacsonyabban van, a koordináta-rendszerben mégis maximális értékkel rendelkezik. Az xmax a leginkább jobbra lévõ, még az objektumhoz tartozó képpont x koordinátája, míg az ymin a legmagasabban lévõ, az objektumhoz tartozó képpont y koordinátája, xmin pe*
Az alak jellemzésével részletesen a következõ fejezetben foglalkozunk.
88
Számítógépes képelemzés
dig a leginkább balra lévõ képpont x koordinátája, amely még éppen az objektumhoz tartozik (7.6-24. ábra).
7.5-24. ábra. Az objektumok minimális és maximális koordinátái
A részecskék orientációjára jellemzõ paraméterek 17) Orientáció (’orientation’). A maximális Feret átmérõhöz (hoszszúság) egy vektort rendelünk, s ennek a vektornak az x tengelylyel bezárt szögét (fokokban mérve) tekintjük orientációnak (7.5-25. ábra). Szokás néhány esetben az ortogonális Feret átmérõ vagy a szélesség (’width’) szögét mérni. 18) Származtatott orientáció. Amennyiben az objektumok éles sarkokkal rendelkeznek, vagy nem eléggé nyújtottak, úgy a maximális Feret átmérõhöz tartozó szögbõl meghatározott orientáció hamis eredményhez vezethet. Ekkor használjuk a származtatott orientációt (’derived orientation’). Ezt a paramétert több Feret átmérõhöz tartozó szög átlagaként határozzuk meg (7.5-26. ábra).
7.5-25. ábra. Az objektumok orientációja
Számítógépes képelemzés
89
7.5-26. ábra. Az objektumok származtatott orientációja
Az objektumok topológiájára vonatkozó adatokat a részecskék vázszerkezete alapján határozzuk meg. A legjellemzõbb paraméterek a következõk. 19) Az elágazások száma (’fork’). A vázszerkezeten lévõ olyan elágazások darabszáma, amelyek lefelé irányulnak. Ekkor a villaszerû leágazások szárai lefelé mutatnak. 20) Végpontok száma (’end’). A lefelé irányuló elágazások végpontjainak a darabszáma. 21) Csomópontok (’joint’). Olyan csomópontok, amelyek az objektum vázszerkezetében fölfelé irányulnak, ekkor a villaszerû elágazás két szára fölfelé mutat. 22) Csúcspontok száma (’top’). A vázszerkezet felfelé irányuló szárainak végén lévõ pontok darabszáma. Bizonyos esetekben szükség van két különbözõ bináris kép közötti egybeesés, vagy más néven koincidencia (’coincidence’) jellemzésére is. Ekkor két különbözõ bináris képre van szükségünk, ahol az egyik tartalmazza a külsõ részecskéket a), míg a másik a belsõ vagy koincidencia fázis b) objektumait. A mérés során a koincidencia szám c) azt mutatja meg, hogy - minden egyes külsõ részecskére vonatkozóan - az adott részecske hány darab, a koincidencia fázishoz tartozó belsõ részecskét tartalmaz. Végül szokás megadni az ún. koincidencia paramétert d) is, mely a koincidencia fázis területét adja meg, külön-külön minden egyes külsõ részecskére vonatkozóan. A mérés részleteit a 7.6-27. ábra mutatja.
Számítógépes képelemzés
90
a)
b)
c)
d)
7.5-27. ábra. A koincidencia értelmezése
Végezetül szólni kell az objektumok mérésekor elkövetett hibákról. Ezek a hibák a következõkbõl származhatnak: 1) A képek rögzítésekor elkövetett hibák. 2) A mérés, az esetleges közelítés vagy becslés pontatlanságai. 3) A mérési eredmények értelmezése, interpretálása során elkövetett hibák Az egyik legkönnyebben kivédhetõ hiba az alkalmazott optikai rendszer, illetve a videokamera geometriai torzítása. Sok esetben elõfordul, hogy a nem megfelelõen beállított rendszerek által létrehozott képen az objektumok hossza, szélessége vagy alakja jelentõsen torzul. A pontosan összehangolt optikai és elektronikus rendszerekkel, valamint nem utolsó
Számítógépes képelemzés
91
sorban ismert méretû és alakú etalonok használatával, ez a hiba nagymértékben csökkenthetõ. Amilyen nagymértékû segítséget jelent a digitális képfeldolgozás és a képelemzés a gyakorló mérnökök számára, olyan megbízhatatlan, hibás eredményekre vezethet a nem pontosan elvégzett szürke kép átalakítás, detektálás vagy éppen bináris transzformáció. A megbízható eredmények létrehozásához nem lehet felállítani általános szabályt. Talán a legfontosabb a kellõ szakértelem, a vizsgálandó anyagról szerzett információk állandó kritikai értékelése, az etalonon végzett mérési eredmények elemzése. Mindezek alapján egy olyan optimális módszer kialakítása, amely mindig az adott képhez és az adott problémához tartozik. A mérés során a legnagyobb hibát az ún. mátrixhatás okozza, amely természetes módon jelentkezik minden digitalizált képen. Amennyiben az objektum kellõen nagy, ez a hatás elhanyagolható. Kis mértékû, 5-10 képpont nagyságú objektumoknál ez a hatás jelentõs lehet. Ekkor a terület, a kerület vagy az alaktényezõk mérésekor könnyen követhetünk el akár 30-40 %-os hibát is (3-4 képpont). Különösen kritikus a kerület pontos meghatározása. A digitális képfeldolgozás alapelvébõl, valamint az optikai és videó rendszerek tökéletlenségébõl fakad, hogy az objektumok határvonala nem éles, hanem elmosódott. Ennek következtében a határvonal erõsen szakadozott. Az összehasonlítható eredmények érdekében nagyon fontos, hogy egyrészt azonos nagyítást és azonos optikai, illetve videó rendszert használjunk, másrészt a kellõ gondossággal kiválasztott szürke kép átalakítás és bináris mûvelet segítségével egy kellõen simított határfelületen mérjünk a kerületet. A Feret átmérõ értelmezésekor figyelembe kell vennünk, hogy nem minden irányban, csak bizonyos irányokban tudjuk meghatározni az átmérõt. Bizonyos esetekben ez is jelentõs hibához vezethet. Az eredmények értékelésekor arra is gondolnunk kell, hogy néhány paraméter nem közvetlenül mért adat, hanem a mérési eredményekbõl közelítések felhasználásával származtatjuk. A származtatás módja, a felhasznált összefüggés ismerete feltétlenül szükséges a paraméter helyes értelmezéséhez. Végül néhány szó az eredmények értelmezésérõl. Sajnos itt sem lehet felállítani általános szabályt, legfeljebb annyit, hogy a kevesebb több. Nem jó módszer az, amikor a képek vizsgálatakor túl sok paramétert veszünk figyelembe. Sokkal helyesebben járunk el, ha kiválasztjuk azt a néhányat, amely valóban hordozza mindazokat az információkat, amelyekre a képelemzés során szükségünk van. És csupán ezeket mérjük. A mérési eredmények értelmezésekor kevés általános támpontunk van, itt elsõsorban a mérnöki pontosságra és a megbízhatóságra, a kellõ arányérzékre, a
92
Számítógépes képelemzés
vizuális információt hordozó anyagról szerzett szakismeretre, s a kellõ gondossággal kiválasztott és alkalmazott etalonok használatára támaszkodhatunk.
Irodalom 7.1-7.4 fejezet: Bernolák K., Szabó D., Szilas L.: A mikroszkóp, Budapest, Mûszaki Könyvkiadó, 1979. Fonyó A.: Az orvosi élettan tankönyve, Budapest, Medicina Könyvkiadó Rt. 1997. Ganong W. F.: Az orvosi élettan alapjai, Budapest, Medicina Könyvkiadó Rt. 1994.
Underwood E. E.: Quantitative Stereology, Addison-Wesley Publishing Company 1970. 7.5 fejezet: Álló Géza: Bevezetés a számítógépes képfeldolgozásba, Budapest, BME Mérnöki Továbbképzõ Intézet, 1985. Berke József: Digitális képfeldogozás és alkalmazásai, Keszthely, Keszthelyi Akadémia Alapítvány (1996, 2000). Gonzalez R. C, Woods R. E.: Digital Image Processing, AddisonWesley Publishing Company, Inc, New York, 1992. Komai K. and Noguchi M.: Fracture Surface Reconstruction Technique and Crack Closure, Fractography, Japanese Materials Research, (1990) pp. 161-186 Komenda J.: Image classifier in application to sintered steel and Ni-based superalloy microstructures, Proceedings of STERMAT 2000, Cracow, pp. 197-202 Leica Qwin Reference Guide (Quantimet 500), 1999. Russ J. C. and Stewart W. D. and Fletcher S.: Image Analysis of Difficult Structures: the Separation of Touching Phase Regions, Microstructural Science, Vol. 17, 1990, pp. 23-37 Serra J.: Morphological Image Segmentation, Acta Stereologica, 14/5, 1995, pp. 99-111 Serra J. and Mlynarczuk M.: Morphological Merging of Multidimensional Data, Proceedings of STERMAT 2000, Cracow, pp. 385-390 Székely V.: Képkorrekció, hanganalízis, térszámítás PC-n (Gyors Fourier-transzformációs módszerek), Computer Books, 1994.
Számítógépes képelemzés
93
7.6. fejezet: Bárczy P., Gácsi Z., Roósz A., Roósz A.-né, Sólyom J., Tranta F.: Alumínium-mangán ötvözetek kristályosodása, Bányászati és Kohászati Lapok, Kohászat, 116 (1983) pp.511-515. Bárczy P., Mertinger V., Gácsi Z., Babcsán N., Meier M.: Melt Motions During Unidirectional Solidification of Al-Al3Ni Eutectics, Materials Science and Engineering. A173 (1993) pp. 137-141. Kovács J., Gácsi Z.: Szemcsehatár rekonstrukció képelemzõvel, Doktoranduszok Fóruma, Kohómérnöki Kar szekciókiadványa, Miskolc, 1998. november 6., 19-25. old. Póliska Cs., Tomolya K., Kovács J., Gácsi Z., Réger M.: Effect of Direction of Solidification on the Dendritic Structure, 3rd International Conference on Solidification and Gravity 2000, Miskolc-Lillafüred, 2000 Trans Tech Publications, Switzerland, Materials Science Forum Vols. 329-330 (2000), pp. 291-296., ISBN 0-87849-852-4 Réger M., Gácsi Z., Csepeli Zs.: Method for quick measuring of dendrite tip using image analyser, International Conference on The Quantitative Description of Materials Microstructure, Warsaw, Poland, 16-19 April 1997, pp. 567-573. Roósz A., Gácsi Z., Fuchs E.: Isothermal formation of Austenite in Eutectoid plain carbon steel, Acta Metallurgica 31. (1983) pp. 509-517. Roósz A., Gácsi Z., Fuchs E.: Solute redistribution during solidification and homogenization of binary solid solution, Acta Metallurgica 32. (1984) pp. 1745-1754. Roósz A., Gácsi Z., Fuchs E.: Eutektoidos ötvözetlen acél izotermás austenitesedése, BKL 118 (1985) pp. 11-18. Sárközi G., Kovács J., Gácsi Z.: Töretfelületek kvantitatív jellemzése, Fiatal Mûszakiak Tudományos Ülésszaka III., Mûszaki Tudományos Füzetek, Kolozsvár, Románia, 1998. március 20-21, 53-56. old.