Digitális képek szegmentálása. 5. Textúra. Kató Zoltán

Digitális képek szegmentálása

5. Textúra Kató Zoltán http://www.cab.u-szeged.hu/~kato/segmentation/

Textúra fogalma Sklansky: Egy képen egy területnek állandó textúrája van, ha a lokális statisztikák vagy egyéb lokális tulajdonságok állandóak, lassan változnak, vagy Megközelítőleg periódikusak

Texel: az ismétlődő minta-elem Értelmezésük szorosan kapcsolódik az emberi látáshoz: Az ismétlődő mintázatot nem egyenként érzékeljük, hanem mint egy felület tulajdonságát (~szín, szürkeárnyalat) Egy textúrált felületet homogénnek érzékelünk

Textúra fajtái: Determinisztikus: jól meghatározott geometriai alakzat ismétlődése Véletlen: változó mintázat rögzített statisztikai tulajdonságokkal (pl. eloszlás)

2

Determinisztikus textúrák

3

Véletlen textúrák

4

Textúra-élek Élek ott keletkeznek, ahol a textúra paraméterek megváltoznak: méret irány sűrűség kontraszt hosszúság szélesség …

Fontos jellemző a szegmentáláshoz

5

Gestalt pszihológia

6

Textúra-érzékelés leírása a Gestalt pszihológiára épül, amely az emberi látás csoportosítási preferenciáival foglalkozik. A csoportosítás lényegében értelmes részekre bontja a látott képet. A csoportosítás alapja: szomszédság hasonlóság folytonosság szimmetria stabilitás bezárás (zárt alakzat)

Textúra-érzékelés egyfajta perceptuális csoportosítás

Gestalt szabályok

7

Az egészet látjuk, nem a részeket

8

Textúrák megkülönböztetése

9

Bela Julesz(1966): Bizonyos textúrákat könnyedén („első ránézésre”) meg tudunk különböztetni. különböző első- és másodrendű statisztikák esetén azonos másodrendű statisztikák esetén nehéz megkülönböztetni

Első- és másodrendű statisztika

10

Első rendű statisztika: az egyes elemek statisztikája például: méret, árnyalat

Másodrendű statisztika: páronkénti előfordulási gyakoriság

Jellemzők ÍÎkapcsolat Irány ÍÎ pozíció

Szín vagy görbület, de nem szín és görbület

11

Textúra leírás

12

A textúrák statisztikai leírása olyan textúrajellemzőket állít elő, melyek egy régión belül homogének Î szegmentálás viszonylag könnyen elvégezhető Három fő típus: hisztogram (elsőrendű statisztika) együttes előfordulási (co-occurence) mátrix (másodrendű statisztika) textúra elemek eloszlása egy ablakon belül

Hisztogram momentumok Egy x valószínűségi változó (itt pixel-érték) n. centrális-momentuma Mn: N Jól jellemzik a kép, vagy egyes régiók textúráltságát.

13

M n = ∑ ( xi − m) p ( xi ) n

i =1

Második momentum jól jellemzi a kontrasztot, ami fontos a textúrák jellemzésében is: Relatív simaság R: konstans intenzitás: R = 0 nagy intenzitás-változás: R ≈ 1

R = 1−

1 1 + σ ( x) 2

3. momentum a hisztogram alakjára (szimmetria), 4. mometum a hisztogram laposságára jellemző Nem írja le a pixelek egymáshoz viszonyított elhelyezkedését.

Együttes előfordulási mátrix

14

A co-occurence mátrix az egymástól adott távolságban és irányban elhelyezkedő azonos szürkeárnyalatú pixel-párok számát adja meg. Ebből a mátrixból azután sokféle textúra-jellemzőt vezethetünk le. C(l,m|∆i,∆j) megadja a valószínűségét annak, hogy egy tetszőleges pixelérték l, amíg a pixel (megfelelő írányban és távolságban levő) szomszédjának pixelértéke m. A co-occurence mátrix szimmetrikus. C (l , m | ∆i, ∆j ) = occurence{I(i, j) = l & I(i + ∆i, j + ∆j ) = m}+ + occurence{I(i, j) = l & I(i − ∆i, j − ∆j ) = m} Írható más alakban is (~polárkoordináta): C(l,m|d,θ)

Együttes előfordulási mátrix - példa Tekintsük az alábbi 6-színű képet és C(l,m|0,1): Horizontálisan szomszéd pixelek együttes előfordulása C(l,m|0,1) 6X6 mátrix (256 árnyalat esetén 256X256)

15

Co-occurence – textúra jellemzők Energia Entrópia Korreláció Inercia

N

16

N

E (d , θ ) = ∑∑ C (l , m | d , θ ) 2 l =0 m=0 N N

H (d , θ ) = ∑∑ C (l , m | d , θ ) log C (l , m | d , θ ) l =0 m=0 N N

S (d , θ ) = ∑ ∑ (l − µ x )(m − µ y )C (l , m | d , θ ) σ xσ y l =0 m =0 N N

I (d , θ ) = ∑ ∑ (l − m) 2 C (l , m | d , θ ) l =0 m =0 N N

Lokális homogenitás L(d , θ ) = ∑ ∑ C (l , m | d , θ ) (1 + (l − m) 2 ) l =0 m =0

Ezen jellemzőknek nincs közvetlen psziho-fizikai értelme, de jól használhatók textúrák megkülönböztetésére.

Gabor textúra jellemzők Multi-channel szűrőzés: Az emberi vizuális rendszer ihlette (Campbell & Robson). Az elmélet szerint a vizuális rendszer felbontja a retinai képet több szűrt képre, melyek mindegyike egy keskeny frekvencia (méret)- és irány-tartomány intenzitás-változásait tartalmazza.

Az él-irányra merőleges.

Gabor szűrők

17

Gabor szűrő - példa

18

Gabor szűrő-sorozat Különböző irányra és frekvenciára érzékeny Gabor szűrők együttese.

19

Többcsatornás szűrőzés

20

Textúra-jellemzők kinyerése szűrősorozat segítségével. Minden egyes szűrő egy bizonyos irányra és egy bizonyos méretre érzékeny

A szűrőzés lépései: A szűrők definiálása (számuk, matematikai formula) Î szűrt képek A szűrt képekről a megfelelő textúra-jellemzők kinyerése Î feature képek A megfelelő feature képek kiválasztása, amelyek segítségével el tudjuk különíteni a képen található textúrákat Î szegmentálás

Gabor szűrő

21

Gabor szűrő impulzus-függvénye:

 1  x2 y2   h( x, y ) = exp −  2 + 2   cos(2πµ0 x)  2  σ x σ y     µ0 - a szinuszos sík frekvenciája az X tengely mentén σx és σy - a Gauss burkoló szórása az X és Y tengely mentén.

Gabor szűrő a Fourier tartományban

22

Fourier tartományban használjuk:   1  (u − u0 ) 2 v 2    1  (u + u0 ) 2 v 2           + H (u, v) = A exp −  exp + − + 2 2  2  2 σ2  2 σ σ σ u v  u v       A = 2πσ xσ y ,

σ u = 1 2πσ x

σ v = 1 2πσ y

Ez a reprezentáció megadja azt, hogy a filter mennyire módosítja az input kép egyes frekvenciakomponenseit.

Diszkrét 2D Fourier traszformáció

23

Egy M x N függvény (kép) diszkrét Fourier transzformáltja: M −1 N −1

1 − j 2π (ux / M +vy / N ) F (u, v) = f ( x, y)e ∑∑ MN x=0 y=0 Az inverz transzformáció: M −1 N −1

f ( x, y ) = ∑∑ F (u , v )e

j 2π ( ux / M + vy / N )

u =0 v =0

Szűrőzés: a kép Fourier transzformáltját szorozzuk a szűrő-függvény Fourier transzformáltjával (H(u,v))

Diszkrét 2D Fourier traszformáció A transzformáció értéke (u, v) = (0,0) -ban:

1 F (0,0) = MN

M −1 N −1

∑∑ f ( x, y) = f ( x, y) átlaga x =0 y =0

Ha f ( x, y) valós, akkor Fourier transzformáltja szimmetrikus *

F (u , v) = F (−u ,−v)

Ebből következik, hogy a Fourier transzformált spektruma szimmetrikus:

F (u, v) = F (−u ,−v)

24

Fourier transzformáció

25

Szűrőzés a frekvencia-tartományban A Fourier frekvenciatartomány tulajdonságai: Alacsony frekvenciák: A kép lassan változó komponensei Magas frekvenciák : A gyorsabb szürkeárnyalatváltozások élek zaj

A képen erős ±45°-os élek láthatók.

26

Gabor jellemzők: 1. szűrődefiníció Farrokhnia-Jain 1991: 4 irány:

θ 0 = 0 ° , 45 ° , 90 ° , 135 °

Radiális frekvencia (µ0) értékei a képmérettől (N = kép szélessége) függenek:

µ0 = 1 2 , 2 2 , 4 2 , ...., ( N / 4) 2 ciklus N A szükséges Gabor szűrők száma:

4 log 2 ( N c / 2).

27

Gabor szűrősorozat Például 256 széles kép esetén 28 szűrőt használunk: 4 irány és 7 radiális frekvencia. Egy adott szűrő az általa lefedett ellipszis alakú tartományba eső frekvenciákat emeli ki.

28

Gabor szűrő példák

29

2. Szűrők kiválasztása

30

A szűrt képek közül ki kell valasztani azokat, amelyek már jól elkülönítik a textúrákat. LSE (Least Square Error) kritérium:

2 ˆ SSE = ∑ [ s ( x, y ) − s ( x, y )] x, y

s ( x, y )

– a szűrt képek összege, jól közelíti az input képet

sˆ( x, y )

– a szűrt képek egy részének összege

COD (Coefficient of Determination): R 2 = 1 − A teljes intenzitás-változásból mennyit tartalmaz sˆ( x, y )

SSE 2 [ s ( x , y )] ∑ x, y

2. Szűrők kiválasztása

31

Mivel az egyes Gabor szűrők között alig van átfedés, s(x,y) energiája (E) jól közelíthető: n

E = ∑ Ei , Ei = ∑ [ri ( x, y )] = ∑ | Ri (u , v) | i =1

2

x, y

2

u ,v

ri(x,y) - i. szűrt kép, Ri(x,y) - i. szűrt kép diszkrét Fourier transzformáltja. Ei 2 Így R közelíthető: 2 i∈s

R ≈

∑

E Az ideális szűrőket úgy választjuk ki, hogy Kiszámoljuk Ei–t minden i=1,2,…,n Rendezzük a szűrőket Ei alapján Kiválasztjuk az első k szűrőt melyekre R2 elegendően nagy (pl. >0.99)

3. Feature képek

32

A megfelelő szűrt képekből olyan feature képeket kell előállítanunk, amelyek megközelítően homogén szürkeértékeket rendelnek a homogén textúrájú részekhez. Ezt a következő eljárással állítjuk elő (FarrokhniaJain 1991): Nem-lineáris transzformációt alkalmazunk a szűrt képekre −2αt (α konstans): 1− e

ψ (t ) = tanh(αt ) =

1 + e − 2αt

Az így kapott képet simítjuk egy Gauss szűrővel, melynek szórása arányos a gabor szűrő frekvenciájával:

σ = k / u0

Feature kép példák

33

Szegmentálás

34

A helyesen kiválasztott feature képek alapján viszonylag könnyen elvégezhetjük a szegmentálást Küszöbölés, klaszterezés, régiónövelés, MRF, stb…

MRF szegmentálás

Digitális képek szegmentálása. 5. Textúra. Kató Zoltán

Recommend Documents