KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
2D ´ es 3D bin´ aris objektumok line´ aris deform´ aci´ o-becsl´ es´ enek numerikus megold´ asi lehet˝ os´ egei Tan´ acs Attila1 , Joakim Lindblad2 , Nataˇsa Sladoje3 , Kat´o Zolt´an1 1
K´epfeldolgoz´ as ´es Sz´ am´ıt´ og´epes Grafika Tansz´ek Szegedi Tudom´ anyegyetem {tanacs,kato}@inf.u-szeged.hu 2 Centre for Image Analysis Swedish University of Agricultural Sciences, Uppsala, Sweden
[email protected] 3 Faculty of Technical Sciences University of Novi Sad, Serbia
[email protected]
Absztrakt. A k´epregisztr´ aci´ o a k´epfeldolgoz´ as egy alapfeladata, amelyet k¨ ul¨ onb¨ oz˝ o id˝ opontokban ´es/vagy n´ez˝ opontokb´ ol k´esz´ıtett felv´etelek k¨ oz¨ otti geometriai viszony meghat´ aroz´ as´ ara haszn´ alnak. Jelen cikk¨ unkben egy a ´ltal´ anos keretrendszert adunk meg, amely tetsz˝ oleges n-dimenzi´ os bin´ aris k´epek/objektumok k¨ oz¨ otti line´ aris regisztr´ aci´ os probl´em´ at k´epes megoldani megfeleltet´esek l´etes´ıt´ese n´elk¨ ul. A megk¨ ozel´ıt´es¨ unk polinomi´ alis egyenletrendszerek gener´ al´ as´ an ´es megold´ as´ an alapul. Szintetikus teszteken kereszt¨ ul a polinom egyenletrendszer k¨ ul¨ onf´ele numerikus megold´ asi lehet˝ os´egeit vizsg´ aljuk, analitikus, iterat´ıv legkisebb n´egyzetes ´es kombin´ alt m´ odszereket vesz¨ unk figyelembe. A tesztjeink alapj´ an az iterat´ıv ´es a kombin´ alt megk¨ ozel´ıt´es biztos´ıtja a legpontosabb eredm´enyt. A tesztek megmutatj´ ak azt is, hogy k´eppont lefedetts´egi inform´ aci´ o felhaszn´ al´ as´ aval pontosabb objektum k¨ orvonal le´ır´ as kaphat´ o, ami a regisztr´ aci´ o pontoss´ ag´ at n¨ oveli. Mivel az egyenletrendszer megalkot´ as´ ahoz csak egyszer kell a k´epeket bej´ arnunk, ez´ert m´ odszereink alkalmasak nagy m´eret˝ u regisztr´ aci´ os probl´em´ ak gyors megold´ as´ ara, f¨ uggetlen¨ ul a deform´ aci´ o m´ert´ek´et˝ ol.
1.
Bevezet´ es
A k´epregisztr´ aci´ o a k´epfeldolgoz´as egy fontos ter¨ ulete, c´elja k´epek k¨oz¨otti geometriai viszonyok meghat´ aroz´asa. Az ut´obbi ´evtizedekben sz´amos megk¨ozel´ıt´es sz¨ uletett probl´em´ ak sz´eles sk´al´aj´ara [1]. 2D-ben a szegment´ alt alakzatok illeszt´ese egy fontos regisztr´aci´os probl´ema. Ilyen feladatokn´ al jellemz˝ oen k´et l´ep´esb˝ol ´all az illeszt´es: El˝osz¨or egy szegment´al´o algoritmus el˝ o´ all´ıtja az alakzatokat, majd ezut´an t¨ort´enik meg ezek illeszt´ese. Ez a megk¨ ozel´ıt´es k¨ ul¨ on¨ osen akkor hasznos, amikor a k´ep intenzit´as´ert´ekei er˝os nemline´ aris torz´ıt´ asnak vannak kit´eve, amely modellez´ese neh´ez, pl. a r¨ontgen
526
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
k´epalkot´ as bizonyos eseteiben. Amennyiben k¨onnyen detekt´alhat´o objektumok tal´ alhat´ ok a k´epen (pl. csontok vagy implant´atumok r¨ontgen vagy CT k´epen), ak´ ar egy egyszer˝ u szegment´ al´o m´odszer is alkalmazhat´o. Parametrikus transzform´aci´obecsl˝o m´odszert javasoltak Haege ´es munkat´arsai sz¨ urke´ arnyalatos k´epekre [2, 3], ahol az intenzit´as´ert´ekek felhaszn´al´as´aval line´aris egyenletrendszert kaphatunk. A helyes m˝ uk¨od´eshez elv´ar´as, hogy ne legyen jelen a k´epen nemline´ aris intenzit´as-torz´ıt´as, valamint a h´att´ert˝ol elt´er˝o intenzit´ as´ert´ek˝ u objektumok egym´asnak min´el pontosabban megfeleltethet˝ok legyenek. Ha k´epek k¨ oz¨ ott az ´ atfed´es nem teljes, akkor meg kell hat´arozni egy ´atfed˝o ter¨ uletet, ami nem trivi´ alis feladat. Ha felt´etelezz¨ uk, hogy egym´asnak megfeleltethet˝ o alakzatok/objektumok egyszer˝ uen szegment´alhat´ok a k´epeken, ´es nem felt´etelezz¨ uk az intenzit´ astartom´any ´alland´os´ag´at, bin´aris objektumok illeszt´es´ere vezethetj¨ uk vissza a probl´em´at. Ilyen esetekre polinomi´alis egyenletrendszerre vezet˝ o megold´ ast Domokos ´es munkat´arsa javasolt [4]. Kor´abbi publik´aci´okban ezen m´ odszer k¨ ul¨ onb¨ oz˝ o vari´ansai ¨osszehasonl´ıt´asra ker¨ ultek m´as szakirodalmi m´ odszerekkel [5, 6]. A 3D k´epalkot´ as orvosi ´es ipari alkalmaz´asokban manaps´ag ´altal´anosan elterjedt. Bin´ aris objektumok j¨ ohetnek l´etre p´eld´aul a k´epalkot´as eredm´enyek´ent (pl. diszkr´et tomogr´ afia), gener´ al´odhatnak geometriai le´ır´asokb´ol (pl. CAD modell), vagy egym´ asnak megfeleltethet˝o ter¨ uletek szegment´al´as´aval. A 3D regisztr´aci´os probl´em´ at a klasszikus m´ odszerek ´altal´aban vagy geometriai jellemz˝ok kinyer´es´evel, vagy a k´eppontintenzit´asok k¨ozvetlen felhaszn´al´as´aval oldj´ak meg. Az adatok k¨ oz¨ otti megfeleltet´eseket rendszerint iterat´ıv keres´es seg´ıts´eg´evel pr´ob´alj´ak meghat´ arozni. A leggyakrabban alkalmazott geometriai jellemz˝ok k¨oz´e a pontok, felsz´ınek [7], v´ azak [8], vagy ponthalmazok [9] tartoznak. K´eppontok hasonl´ os´ ag´ an alapul´ o m´ odszerek jellemz˝oen nem-bin´aris k´epek eset´en ker¨ ulnek alkalmaz´ asra, de bin´ aris esetben is felhaszn´alhat´ok [1]. Mivel az iterat´ıv keres´es ezen m´ odszerek eset´eben minden l´ep´esben felhaszn´alja a k´epjellemz˝o/intenzit´as adatokat, emiatt nagy m´eret˝ u k´epi adatok eset´eben a megold´as id˝oig´enye jelent˝ osen megn˝ o. Fontos d¨ ont´es, hogy milyen geometriai transzform´aci´o t´etelezhet¨ unk fel az objektumok k¨ oz¨ ott? Nemline´aris transzform´aci´ok alkalmaz´as´aval lehet˝os´eg van pl. sz¨ ovetek lok´ alis alakv´ altoz´asainak detekt´al´as´ara. Ilyen megk¨ozel´ıt´es eset´en viszont figyelembe kell venni a k¨ ul¨onb¨oz˝o sz¨ovetek elt´er˝o deform´aci´os jellemz˝oit, ami nagyon neh´ezz´e ´es alkalmaz´as-specifikuss´a teheti a megold´ast. Sok esetben elegend˝ o glob´ alis line´ aris transzform´aci´ot alkalmazni, k¨ ul¨on¨osen ha a gyors sz´ am´ıt´ asi id˝ o elv´ ar´ as. Kor´ abbi publik´ aci´ oinkra ´ep´ıtve jelen cikk¨ unkben egy egys´eges keretrendszert vezet¨ unk be, amely tetsz˝ oleges n-dimenzi´oban haszn´alhat´o. Ez a megk¨ozel´ıt´es polinom egyenletrendszerek gener´al´as´an ´es megold´as´an alapul ´es a szegment´al´ason t´ ul nem ig´enyli megfeleltet´esek keres´es´et. Az egyenletrendszer a k´epek egyszeri bej´ ar´ as´ aval el˝ o´ all´ıthat´ o, annak megold´asa m´ar f¨ uggetlen a k´epek m´eret´et˝ol. Ez k¨ ul¨ on¨ osen alkalmass´ a teszi a m´odszer¨ unket nagy m´eret˝ u, glob´alis line´aris regisztr´ aci´ os probl´em´ ak hat´ekony megold´as´ara. A digit´alis k´ept´er csak korl´atozott pontoss´ agot k´epes biztos´ıtani, ´ıgy az (5)-(9) egyenletekben szerepl˝o integr´alok
527
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
csak k¨ ozel´ıthet˝ ok diszkr´et o¨sszegk´ent. A digit´alis adat´abr´azol´as lehet˝os´egeinek jobb kihaszn´ al´ asa ´erdek´eben kor´abbi publik´aci´oinkban az objektumok k´eppont lefedetts´egi reprezent´ aci´ oj´ anak felhaszn´al´as´at javasoltuk [13, 11] ahol a k´eppontok sz´ am´ert´eke ar´ anyos a k´eppont t´err´esz´enek a val´os objektum ´altal t¨ort´en˝o lefedetts´eg´evel. Bizony´ıt´ asra ker¨ ult, hogy egyez˝o t´erbeli felbont´as eset´en a bin´aris reprezent´ aci´ ohoz k´epest egy ilyen fuzzy reprezent´aci´o nagyobb pontoss´agot biztos´ıt egyes k´epjellemz˝ ok becsl´es´eben [12]. Jelen cikk¨ unk u ´j eredm´enye a regisztr´aci´os elj´ar´as sor´an el˝o´all´o polinomi´alis egyenletrendszerek gyors ´es hat´ekony megold´asi lehet˝os´egeinek r´eszletes t´argyal´ asa. Megvizsg´ aljuk a t´ ulhat´arozott egyenletrendszer eset´en alkalmazhat´o legkisebb n´egyzetes megold´ ast, a nem-szingul´aris esetben haszn´alhat´o k¨ozvetlen analitikus megold´ ast, valamint ezek egy¨ uttes alkalmaz´as´aval el˝o´all´o kombin´alt m´ odszer tulajdons´ agait.
2.
Regisztr´ aci´ os keretrendszer
R¨ oviden ´ attekintj¨ uk a cikk¨ unkben felhaszn´alt, kor´abban publik´alt 2D affin regisztr´ aci´ os m´ odszert [10] ´es kiterjesztj¨ uk tetsz˝oleges n dimenzi´ora. Jel¨olj¨ uk a sablon ´es a megfigyel´es k´epek objektumpont-koordin´at´ait x, y ∈ Pn -el a projekt´ıv t´erben. A projekt´ıv t´er haszn´alata lehet˝ov´e teszi az affin transzform´aci´ok egyszer˝ u jel¨ ol´esm´ od´ u megad´as´at az u ´n. homog´en koordin´at´ak alkalmaz´as´aval. Mivel az affin transzform´ aci´o nem v´altoztatja meg a pontok utols´o (homog´en) koordin´ ata-´ert´ek´et, vagyis az mindig 1 ´ert´ek˝ u lesz, ´ıgy a tov´abbi jel¨ol´esekben esetenk´ent az Euklideszi teret is felhaszn´aljuk, mindig az egyszer˝ ubb jel¨ol´esm´odot alkalmazva. Jel¨ olje A az ismeretlen, meghat´aroz´asra v´ar´o affin transzform´aci´ot. Az egyenl˝ os´eg rel´ aci´ ot az al´ abbi m´ odon defini´aljuk: Ax = y
⇔
x = A−1 y.
A fenti egyenletek akkor is fenn´allnak, ha megfelel˝oen v´alasztott ω : Pn → Pn f¨ uggv´enyeket alkalmazunk mindk´et oldalra [4]: ω(Ax) = ω(y)
⇔
ω(x) = ω(A−1 y).
(1)
Bin´ aris k´epek nem tartalmaznak radiometrikus inform´aci´ot, ez´ert reprezent´ alhat´ ok a 1 : Pn → {0, 1} karakterisztikus f¨ uggv´eny¨ ukkel, ahol 0 ´es 1 ´ert´ekek ker¨ ulnek hozz´ arendel´esre a h´att´er ´es az objektum pontjaihoz. Jel¨olje 1t a sablon, 1o a megfigyel´es karakterisztikus f¨ uggv´eny´et. A pontmegfeleltet´esek elker¨ ul´ese v´egett integr´ aljunk az Ft = {x ∈ Pn |1t (x) = 1} ´es Fo = {y ∈ Pn |1o (y) = 1} objektumpont-tartom´ anyok felett: Z Z |A| ω(x) dx = ω(A−1 y) dy , ´es (2) Ft Fo Z Z 1 ω(y) dy . (3) ω(Ax) dx = |A| Fo Ft
528
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
A transzform´ aci´ o Jacobi determin´ansa (|A|) meghat´arozhat´o: R |A| = RFo
dy
dx Ft
.
(4)
A javasolt m´ odszer alap¨ otlete az, hogy elegend˝o sz´am´ u line´arisan f¨ uggetlen egyenletet gener´ aljunk az (1)-(3) k´epletek alkalmaz´as´aval. Legal´abb annyi egyenletre van sz¨ uks´eg¨ unk, amennyi az n-dimenzi´os affin transzform´aci´o szabads´agi foka. Ez 2D-ben 6, 3D-ben pedig 12. Mivel az ω-f¨ uggv´enyek az ismeretlenekre is hatnak, nem kaphatunk line´aris egyenletrendszert. Ha k¨ozvetlen analitikus megold´ ast szeretn´enk, az egyik legjobb v´alaszt´as a polinomok haszn´alata. (k)
Ennek el´er´es´ere a ω(x)p1 ,...,pn = xp11 . . . xpnn formul´at haszn´aljuk, amely a transzform´ alt pont k-adik koordin´at´aj´at adja, ahol p1 , . . . , pn ∈ N0 . P´eld´aul a Eq. (2) egyenletb˝ ol ezek a f¨ uggv´enyek az al´abbi polinomi´alis egyenleteket gener´ alj´ ak (harmadfokig bez´ar´olag): Z
Z
|A|
1 dx = Ft
Z |A|
xa dx = Ft
Z |A|
n+1 X
xa xb dx =
(5)
Z qai
yi dy ,
n+1 X X n+1
Z qai qbj
xa xb xc dx = Ft
yi yj dy ,
(7)
Fo
i=1 j=1
Z
(6)
Fo
i=1
Ft
|A|
1 dy , Fo
n+1 X n+1 X n+1 X
Z yi yj yk dy ,
qai qbj qck
(8)
Fo
i=1 j=1 k=1
ahol 1 ≤ a, b, c ≤ n, a ≤ b ≤ c, ´es qij jel¨oli az A−1 inverz transzform´aci´o elemeit. Magasabb foksz´ am´ u polinomok formalizmusa anal´og m´odon megkaphat´o. ´ Altal´ aban ezek a f¨ uggv´enyek vegyes momentumokat vezetnek be az egyenletek mindk´et oldal´ an, ´ıgy egy koordin´at´ank´ent nem sz´etv´alaszthat´o egyenletrendszert kapunk. A gyakorlatban ez nem okoz probl´em´at az iterat´ıv megold´okn´ al, de analitikus m´ odszerrel ezek nem oldhat´ok meg hat´ekonyan (a megold´asi m´ odszereket a k¨ ovetkez˝ o fejezetben t´argyaljuk). Sz´etv´alaszthat´o egyenletrendszert kaphatunk az ω f¨ uggv´enyek tov´abbi korl´atoz´as´aval: a pi param´eterek k¨oz¨ ul csak az egyik lehet nem nulla. Ebben az esetben a k-adik szepar´alt egyenletrendszer kompaktabb form´ aban is fel´ırhat´o: Z |A| Ft p−i1 qk1
xpk dx =
p X i1 X p i1
i1
i1 =0
in−1 −in in . . . qkn qk,n+1
Z Fo
529
i2 =0
i2
y1p−i1 y2i1 −i2
in−1
...
X in−1 in i =0 n
. . . ynin−1 −in
dy .
(9)
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
3.
Numerikus megold´ as
S´ıkbeli ´es t´erbeli esetre is k´etf´ele megold´asi strat´egi´at vizsg´alunk: az egyenletrendszer k¨ ozvetlen, analitikus megold´as´at, valamint az iterat´ıv, legkisebb n´egyzetes ´ertelemben optim´ alis keres˝ot. Mindk´et megk¨ozel´ıt´es rendelkezik el˝ony¨os ´es h´ atr´ anyos tulajdons´ agokkal. – Az analitikus megold´ as eset´en az n-dimenzi´os affin transzform´aci´o szabad param´etereinek megfelel˝o sz´am´ u egyenletet tudunk haszn´alni, m´ıg az iterat´ıv esetben dolgozhatunk t´ ulhat´arozott egyenletrendszerrel is, amely nagyobb stabilit´ ast adhat.1 – Gyors ´es hat´ekony analitikus megoldhat´os´aghoz sz¨ uks´eges, hogy az egyenletrendszer koordin´ at´ ank´ent sz´etv´alaszthat´o legyen. Az iterat´ıv technik´an´al nincs ilyen elv´ ar´ as. – Az analitikus m´ odszerek t¨obb sz´az, vagy ak´ar t¨obb ezer lehets´eges megold´ast is adhatnak, ezek k¨ oz¨ ul sok, de ak´ar az ¨osszes is komplex lehet. Ezek k¨oz¨ott tal´ alhat´ o a glob´ alis megold´as is, f¨ uggetlen¨ ul a transzform´aci´o magnit´ ud´oj´at´ol. Sz¨ uks´eg van egy megold´as kiv´alaszt´o s´em´ara, amely ezek alapj´an egy val´os megold´ ast biztos´ıt. Az iterat´ıv megk¨ozel´ıt´es egy val´os eredm´enyt ad, viszont a keres´es elakadhat lok´alis minimumokban. Ezen lok´alis minimumok elker¨ ul´es´ehez ¨ osszetetett keres´esi strat´egi´ara van sz¨ uks´eg. A megold´as sz´am´ıt´ asi ideje jobban megbecs¨ ulhet˝o az analitikus megold´as eset´en, az iterat´ıv technik´ an´ al nagyobb k¨ ul¨onbs´egek is kialakulhatnak. – Az analitikus megold´ ast hat´ekonyan affin esetre tudjuk megadni, az iterat´ıvn´ al megszor´ıt´ asokat vezethet¨ unk be a transzform´aci´o foksz´am´ara vonatkoz´ oan. Val´ os k´epregisztr´aci´os probl´em´akn´al a t¨ ukr¨oz´es ker¨ ulend˝o, mindk´et megk¨ ozel´ıt´es alkalmas az ilyen megold´asok kisz˝ ur´es´ere. A numerikus stabilit´ as ´erdek´eben az objektumpont-koordin´at´akat a [−0.5, 0.5] tartom´ anyba normaliz´ altuk a Nt ´es No transzform´aci´okkal, amelyek eltol´ast ´es sk´ al´ az´ ast tartalmaznak. Vegy¨ uk ´eszre, hogy az (5)-(9) egyenletrendszerek minden ismeretlenje az integr´ alokon k´ıv¨ ul tal´alhat´o, ´ıgy azokat elegend˝o egyszer ki´ert´ekelni. Id˝ obonyolults´ aga O(N ), ahol N az objektumpontok sz´am´at jel¨oli, mivel minden ¨ osszegz´es a k´epek egyszeri bej´ar´as´aval el˝o´all´ıthat´o. A k¨ ovetkez˝ o r´eszben a k´et megold´asi megk¨ozel´ıt´est t´argyaljuk alaposabban. 3.1.
Iterat´ıv legkisebb n´ egyzetes megold´ as
A legkisebb n´egyzetes megold´as t´ ulhat´arozott egyenletrendszerek eset´en haszn´ alatos. A koordin´ at´ ank´enti sz´etv´alaszthat´os´ag nem felt´etel, haszn´alhatjuk a 1
Megjegyezz¨ uk, hogy term´eszetesen egy t´ ulhat´ arozott egyenletrendszer eset´en is lehets´eges n·(n+1) egyenletb˝ ol a ´ll´ o rendszert gener´ alni a transzform´ aci´ o param´eterei szerint vett parci´ alis deriv´ altak alkalmaz´ as´ aval. Ekkor viszont m´ ar koordin´ at´ ank´ent nem lesz sz´etv´ alaszthat´ o az egyenletrendszer n darab f¨ uggetlen r´eszre, ami olyan magas polinom foksz´ amhoz vezethet, amelyet hat´ekonyan m´ ar nem tudunk analitikus m´ odszerrel megoldani.
530
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
(6)-(9) egyenletrendszert. Ez 2D-ben 2 + 3 + 4 = 9, m´ıg 3D-ben 3 + 6 + 10 = 19 egyenletet gener´ al. A numerikus stabilit´as ´erdek´eben u ´jabb 9, illetve 19 egyenletet vesz¨ unk m´eg a Eq. (3)-nek megfelel˝oen, ami a k´et ponthalmaz szerep´enek felcser´el´es´et jelenti. Megjegyezz¨ uk, hogy ez a l´ep´es nem vezet be u ´j ismeretleneket, mivel a A transzform´ aci´ o param´etereit nem-szingul´aris esetben egy´ertelm˝ uen meghat´ arozz´ ak a qij elemek. ´Igy egy maxim´alisan harmadfok´ u, t´ ulhat´arozott egyenletrendszerhez jutunk. Ez az egyenletrendszer legkisebb n´egyzetes ´ertelemben megoldhat´ o pl. a Levenberg-Marquardt (L-M) m´odszerrel. Azt tal´ altuk, hogy a kezdeti forgat´asi param´eter ´ert´ekek er˝osen befoly´asolj´ak a regisztr´ aci´ os eredm´enyt. Olyan gyakorlati alkalmaz´asokban, amelyekben ismert, hogy a forgat´ asbeli k¨ ul¨onbs´egek kicsik az objektumok k¨oz¨ott (pl. a k´epalkot´ as protokollja garant´ alja), vagy j´ol becs¨ ulhet˝ok, az iter´aci´ot elegend˝o egy kezd˝o param´eter´ all´ asb´ ol ind´ıtani. Ha a fenti felt´etel nem garant´alhat´o, akkor az optimaliz´ al´ ast t¨ obb kezd˝ opontb´ ol is elind´ıthatjuk, ´es a megold´asok k¨oz¨ ul a legkisebb hib´ at ad´ ot v´ alasztjuk. 2D-ben 4, 3D-ben 27 k¨ ul¨onb¨oz˝o kezd˝o param´eter´all´ast haszn´ altunk fel, szisztematikusan az orig´o k¨or¨ uli 90◦ -os, valamint a tengelyek ◦ k¨ or¨ uli 120 -os elforgat´ asoknak megfelel˝oen. A sk´al´az´o, ny´ır´o ´es eltol´asi param´eterek az identikus ´ert´ekeiket kapt´ak. Az ¨ osszes keres´esi ir´ any teljes ki´ert´ekel´ese id˝oig´enyes, ´es az esetek egy r´esz´eben nem is sz¨ uks´eges. Amennyiben a keres´est az optimum k¨ozel´eb˝ol ind´ıtjuk, az algebrai hiba gyors cs¨ okken´est mutat, vagyis kev´es iter´aci´osz´am alatt is az optimum k¨ ozel´ebe ´er¨ unk. Ez´ert el˝osz¨or kev´es iter´aci´osz´ammal ind´ıtjuk a keres´est ´es a legkisebb hib´ at ad´ ot v´ alasztjuk ki, ´es azzal folytatjuk tov´abb a teljes keres´est. 2D-ben 50, 3D-ben 20 iter´ aci´ot enged´elyez¨ unk az els˝o k¨orben. Egy m´asik alkalmazott heurisztik´ ank szerint, ha a kezdeti alacsony iter´aci´osz´am´ u szisztematikus keres´es eset´en az algebrai hiba egy megadott k¨ usz¨ob´ert´ek al´a esik, akkor nincs sz¨ uks´eg tov´ abbi jel¨ oltek keres´esre, ezzel folytathatjuk a teljes keres´est. Ez a 3D esetben fontos, ahol a k¨ usz¨ ob´ert´eket 100-ra ´all´ıtottuk. 2D-ben csak n´egy keres´esi ir´ any van, ezek mindegyik´et tesztelj¨ uk. Ezeket a param´etereket tapasztalati u ´ton hat´aroztuk meg. Tov´abbi heurisztik´ ak is bevezethet˝ ok lenn´enek. P´eld´aul ne csak egy potenci´alis jel¨oltet, hanem t¨ obbet is megtartsunk, mindegyikb˝ol ind´ıtsunk teljes keres´est, ´es a legjobbat v´ alasszuk. V´ arhat´ oan ez tov´ abbi, igaz kis m´ert´ek˝ u, javul´ast hozhatna. Ez igaz´ab´ol r´ avil´ ag´ıt az iterat´ıv technika gyenge pontj´ara: egyens´ ulyoznunk kell a sz´am´ıt´asi id˝ o ´es stabilit´ as k¨ oz¨ ott egy ¨ osszetett keres´esi strat´egia param´etereinek finomhangol´ as´ aval. A keres´es k¨ ozben megszor´ıt´asokat alkalmazhatunk az A transzform´aci´ora. Egy ´ altal´ anos A transzform´aci´o t¨ ukr¨oz´eseket is tartalmazhat, amely nem k´ıv´ anatos a legt¨ obb gyakorlati alkalmaz´asban. Ezt elker¨ ulend˝o, magas algebrai hib´ at rendel¨ unk azokhoz az esetekhez, ahol |A| < 0, vagyis t¨ ukr¨oz´es is jelen van. Mivel az A m´ atrix seg´ıts´eg´evel az affinn´al alacsonyabb szabads´agi fok´ u transzform´ aci´ okat is le tudunk ´ırni, k¨onnyen ´at tudjuk alak´ıtani a keres´est merev-test vagy hasonl´ os´ agi transzform´aci´ot ig´enyl˝o probl´em´ak megold´as´ara. Ehhez az algebrai hiba sz´ am´ıt´ asakor a kisebb szabads´agi fok´ u transzform´aci´o param´etereib˝ol meg tudjuk hat´ arozni az A affin m´atrix elemeit, amit felhaszn´alhatunk v´altozat-
531
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
lan form´ aban a keres´eshez. Az 1. algoritmus ¨osszegzi a javasolt iter´aci´os technika l´ep´eseit.
Algorithm 1: Iterat´ıv megold´asi strat´egia Bemenet: Sablon ´es megfigyel´es k´epek. Kimenet: Transzform´ aci´ os param´eterek (A). Step 1 Objektumpont koordin´ at´ ak normaliz´ al´ asa az Nt , No transzform´ aci´ okkal Step 2 Konstru´ aljuk meg az egyenletrendszert (Eq. (5)–(8) k´epletek) Step 3 Legkisebb n´egyzetes megold´ as • Az LM keres˝ o inicializ´ al´ asa (orient´ aci´ ok, kezdeti iter´ aci´ osz´ am) • Minden iter´ aci´ oban sz´ am´ıtsuk ki az E algebrai hib´ at Ha sz¨ uks´eges alkalmazzuk a megszor´ıt´ asokat a param´eterekre Opcion´ alis: Ha E ´ert´eke elegend˝ oen alacsony, akkor a tov´ abbi orient´ aci´ ok kihagy´ asa • A∗ = A legjobb orient´ aci´ ob´ ol ind´ıtott teljes keres´essel eredm´enye ∗ Step 4 Normaliz´ al´ as inverze: A = N−1 o · A · Nt
3.2.
Analitikus megold´ as
A k¨ ozvetlen analitikus megold´ashoz pontosan annyi egyenletre van sz¨ uks´eg¨ unk, amekkora a szabads´ agi foka az n-dimenzi´os affin transzform´aci´onak, vagyis 2Dben 6, 3D-ben 12. Mivel a hat´ekony megoldhat´os´aghoz fontos, hogy koordin´at´ ank´ent sz´etv´ alaszthat´ o egyenletrendszert kapjunk, ez´ert (9) alapj´an v´alasztunk ω-f¨ uggv´enyeket. ´Igy 2D-ben harmadfok´ u, 3D-ben negyedfok´ u polinomi´alis egyenletrendszerhez jutunk. Az el˝ o´ all´ o t¨ obb sz´ az, vagy ak´ar t¨obb ezer val´os ´es/vagy komplex megold´as k¨ oz¨ ul ki kell v´ alasztanunk a legjobbnak t˝ un˝o megold´ast. Erre k¨ ul¨onf´ele kiv´alaszt´ asi s´em´ akat haszn´ alhatunk. (a) Csak a val´ os megold´ asok figyelembe v´etele, a komplexek elhagy´as´aval. A potenci´ alis jel¨ oltek k¨ oz¨ ul azt v´alasszuk, amelyikre a transzform´aci´o Jacobi determin´ ansa ´es a k´eppontok sz´ama alapj´an sz´am´ıtott k¨ozel´ıt˝o ´ert´ek a legk¨ozelebb van egym´ ashoz. A kor´abbi publik´aci´oinkban ez a m´odszer ker¨ ult alkalmaz´ asra [4, 13, 10], ´es mint kider¨ ult, a csupa komplex megold´ast szolg´altat´o esetek miatt ´ allt el˝ o az ott tapasztalt 5%-os megoldhatatlans´agi ar´any. Erre a s´em´ ara RealDet n´even hivatkozunk a szintetikus tesztekben. (b) A val´ os megold´ asok mellett a komplexeket is vegy¨ uk figyelembe, azok val´os r´eszeinek haszn´ alat´ aval. Mivel a komplex megold´asok a komplex konjug´alt p´ arjaikkal jelennek meg, a komplex megold´asok fel´et eleve elvethetj¨ uk. Ezut´an a kiv´ alaszt´ as ugyan´ ugy megy, mint az (a) esetben. Ez a megold´as mindig garant´ alja a megoldhat´ os´agot (amennyiben van legal´abb 1 olyan, amely nem tartalmaz t¨ ukr¨ oz´est). Erre a s´em´ara CplxDet n´even hivatkozunk a tesztek
532
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
sor´ an. Ezt a megk¨ ozel´ıt´est az motiv´alja, hogy az egy´ebk´ent val´os megold´asok komplexsz´e v´ alhatnak zaj vagy diszkretiz´al´asi hiba hat´as´ara. (c) Hasonl´ o (b)-hez, viszont, a megold´as kiv´alaszt´asakor a Jacobi determin´ans helyett azt vizsg´ aljuk, hogy melyik megold´as adja a legkisebb hib´at egy m´ asik, t´ ulhat´ arozott egyenletrendszerbe behelyettes´ıtve. Az egyszer˝ us´eg kedv´e´ert erre a c´elra azt a t´ ulhat´arozott egyenletrendszert haszn´aljuk, amelyet a legkisebb n´egyzetes megold´asn´al is. A s´ema c´ımk´eje EqsSel a tesztekben. Megjegyezz¨ uk, hogy mindh´arom elj´ar´as k´epes kisz˝ urni a nemk´ıv´anatos t¨ ukr¨oz˝ o transzform´ aci´ okat, amelyek eset´eben a forgat´o alm´atrix determin´ansa negat´ıv. Ebb˝ ol k¨ ovetkezik, hogy a (b) ´es (c) s´em´ak csak akkor nem szolg´altatnak eredm´enyt, ha minden megold´ as tartalmaz t¨ ukr¨oz´est. Ilyen eset viszont nem fordult el˝ o a szintetikus tesztjeinkben. A 4. r´eszben megmutatjuk, hogy ´altal´aban a (c) s´ema adja a legjobb megold´ast, haszn´alata 3D-ben elengedhetetlen. A 2. algoritmus ¨ osszegzi az analitikus m´odszer l´ep´eseit. Algorithm 2: Analitikus megold´asi strat´egia Bemenet: Sablon ´es megfigyel´es k´epek. Output: Transzform´ aci´ os param´eterek (A). Step Step Step Step
Objektumpont koordin´ at´ ak normaliz´ al´ asa az Nt , No transzform´ aci´ okkal Konstru´ aljuk meg az egyenletrendszert (Eq. (9) k´eplet) Oldjuk meg az egyenletrendszereket V´ alasszuk ki a legjobbnak t˝ un˝ o megold´ ast (A∗ ) (a), (b) vagy (c) s´ema alkalmaz´ as´ aval ∗ Step 5 Normaliz´ al´ as inverze: A = N−1 o · A · Nt
3.3.
1 2 3 4
Kombin´ alt megk¨ ozel´ıt´ es
Ahogyan a szintetikus tesztekn´el l´atni fogjuk (4. fejezet), az analitikus megold´as altal´ ´ aban a glob´ alis optimumhoz k¨ozeli megold´ast szolg´altat a transzform´aci´o magnit´ ud´ oj´ at´ ol f¨ uggetlen¨ ul, de az iterat´ıv technika t´ ulsz´arnyalja regisztr´aci´os pontoss´ agban. Mivel ez ut´ obbit a glob´alis optimum k¨ozel´eb˝ol c´elszer˝ u ind´ıtani, ez´ert bonyolult, ´es zajjal terhelt esetben id˝oig´enyesebb keres´esi strat´egi´at ig´enyel. (Ne feledj¨ uk, hogy a k´et esetben m´as egyenletrendszerek ker¨ ulnek megold´asra!) Egy kombin´ alt megk¨ ozel´ıt´essel kihaszn´alhatjuk mindk´et m´odszer el˝ony¨os tulajdons´ agait: az analitikus megold´as´aval inicializ´alhatjuk az iterat´ıv keres˝ot, kiv´ altva ezzel annak ¨ osszetett heurisztikus keres´esi strat´egi´aj´at. Erre a m´odszerre Combined n´even hivatkozunk.
4.
Szintetikus tesztek
Egy bin´ aris k´epekb˝ ol ´ all´ o adatb´azis seg´ıts´eg´evel szintetikus teszteken kereszt¨ ul vizsg´ aljuk az egyes megold´ asi strat´egi´akat ´es a fuzzy hat´arvonal reprezent´aci´o hat´ as´ at. A k´epp´ arok ismert affin transzform´aci´ok alkalmaz´as´aval ´alltak el˝o.
533
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
Algorithm 3: Kombin´ alt megold´asi strat´egia Bemenet: Sablon ´es megfigyel´es k´epek. Output: Transzform´ aci´ os param´eterek (A). Step Step Step Step
1 2 3 4
Objektumpont koordin´ at´ ak normaliz´ al´ asa az Nt , No transzform´ aci´ okkal Konstru´ aljuk meg az egyenletrendszert (Eq. (9) k´eplet) Oldjuk meg az egyenletrendszereket V´ alasszuk ki a legjobbnak t˝ un˝ o megold´ ast (A∗ ) (a), (b) vagy (c) s´ema alkalmaz´ as´ aval Step 5 Konstru´ aljuk meg az u ´jabb egyenletrendszert (Eq. (5)–(8) k´epletek) Step 6 Legkisebb n´egyzetes megold´ as A∗∗ = Az optim´ alis transzform´ aci´ o param´eterei az A∗ -b´ ol ind´ıtott teljes keres´essel ad´ odnak ∗∗ Step 7 Normaliz´ al´ as inverze: A = N−1 · Nt o ·A
Az eredm´enyek m´er´ese k´etf´ele hibam´ert´eket vezet¨ unk be. Az -hiba az ´atlagos t´ avols´ agot jelenti a sablon k´ep k´eppontjainak az ismert transzform´aci´oval vett (Ap), valamint a regisztr´ aci´o eredm´enyek´ent kapott transzform´aci´oval el˝o´all´o b helye (Ap) k¨ oz¨ ott. Ezt a m´ert´eket a szintetikus tesztekn´el haszn´alhatjuk, mivel ott ismert az alkalmazott transzform´aci´o. Gyakorlati probl´em´akn´al nem ez a helyzet. A δ-hiba a k´et alakzat k¨oz¨otti ´atfed´es m´ert´ek´et jellemzi. =
1 X b kAp − Apk, |T | p∈T
´es
δ=
|R 4 O| · 100%, |R| + |O|
ahol 4 a szimmetrikus k¨ ul¨ onbs´eg, m´ıg T , R ´es O a sablon, a regisztr´alt ´es a megfigyel´es alakzatot jel¨ oli. Megjegyezz¨ uk, hogy a hibasz´am´ıt´asok el˝ott a fuzzy reprezent´ aci´ ot bin´ ariss´ a alak´ıtjuk egy alfa-v´ag´assal α = 0.5 ´ert´ekkel (a fuzzy tags´ agi f¨ uggv´eny k¨ usz¨ ob¨ ol´es´evel). 4.1.
Kvantitat´ıv ki´ ert´ ekel´ es 2D-ben
A 2D teszthez 56 k¨ ul¨ onb¨ oz˝ o alakzatot ´es transzform´alt v´altozataikat, ¨osszesen 2240 k´epp´ art haszn´ altunk fel. Mivel m´odszer¨ unk jelleg´eb˝ol ad´od´oan nagym´eret˝ u k´epek eset´en m˝ uk¨ odik legjobban, a kor´abbi cikk¨ unkben ilyen k´epekkel dolgoztunk, a k´epek sz´eless´ege ´es magass´aga 500 ´es 100 pixel k¨oz¨otti volt. Szint´en felt´etelezt¨ uk, hogy a fuzzy hat´arvonal reprezent´aci´o alacsonyabb k´epfelbont´as mellett is haszn´ alhat´ ov´ a teszi a m´odszer¨ unket [13]. Emiatt a jelenlegi teszt¨ unkben a k´epm´ereteket nyolcad´ ara cs¨okkentett¨ uk az egyes ir´anyok ment´en. A transzform´ aci´ os param´etereket egyenletes eloszl´assal, v´eletlenszer˝ uen gener´ altuk. A forgat´ asi ´ert´ek tetsz˝oleges lehetett. A sk´al´az´asi t´enyez˝ot az [1, 2] tartom´ anyb´ ol v´ alasztottuk (maxim´alisan k´etszeres nagy´ıt´as), de az esetek fel´eben ennek reciprok´ at v´eve kicsiny´ıt´est hajtottunk v´egre. A ny´ır´asi param´eter tartom´ anya [−1, 1] volt, m´ıg az eltol´as maximuma 150 k´eppont. A sablonok bin´aris k´epek voltak, vagyis 0 vagy 1 fuzzy-tags´agi ´ert´ekkel rendelkeztek. A fuzzy hat´arvonal reprezent´ aci´ ot 16×16 m´eret˝ u t´ ulmintav´etelez´essel k¨ozel´ıtett¨ uk, ¨osszegezve
534
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
milyen ar´ anyban tal´ alhat´ o h´ att´er ´es objektum pont ezen a r´acson. A fuzzy-tags´ag ´ert´ekeket kvant´ altuk k-bites eg´esz ´ert´ekekre ((k = 1, . . . , 8)), ´ıgy el˝o´all´ıtva a k¨ ul¨ onb¨ oz˝ o fuzzy reprezent´ aci´os szinteket. N´eh´any sablon ´es megfigyel´es k´epp´ar l´ athat´ o az 1. ´ abr´ an.
1. ´ abra: P´eld´ ak a 2D adatb´ azisb´ ol: Sablon (fels˝ o sor) ´es megfigyel´es k´epek (als´ o sor)
A k¨ ul¨ onf´ele fuzzy reprezent´aci´os szintekhez ´es kiv´alaszt´asi s´em´akhoz tartoz´ o hibaeloszl´ ast ´es sz´ am´ıt´ asi id˝oig´enyt mutat a 2. ´abra, valamint ´es δ-hib´ak medi´ anjait a 1. t´ abl´ azat. Megfigyelhetj¨ uk, hogy a tapasztalat al´at´amasztja az elm´eleti eredm´enyeket, vagyis a fuzzy reprezent´ aci´ o jelent˝osen jav´ıtja a regisztr´aci´ot. A kor´ abbi cikkekben egyed¨ ulik´ent alkalmazott RealDet s´em´at j´ol l´athat´oan t´ ulteljes´ıti az ¨ osszes javasolt u ´j m´odszer. Az L-M megold´as az egy´ertelm˝ uen legjobb a bin´ aris esetben. Ez a m´odszer 8-bites fuzzy szinten is a kisebb medi´an hib´ at okoz, mint az analitikus m´odszerek, de figyelj¨ uk meg, hogy az EqsSel m´ odszer 4 ´es 8-bites esetben jobb elfogadhat´o hibaar´anyt szolg´altat. 8-bites reprezent´ aci´ on´ al a kombin´ alt m´odszer a legjobb, de ´erdemes megfigyelni, hogy a bin´ aris esetben elmarad az iterat´ıvt´ol. Ez azt sugallja, hogy amennyiben az objektum reprezent´aci´o szinte t¨ok´eletes, az analitikus m´ odszer jobb kezd˝opoz´ıci´ot szolg´altat az iterat´ıv keres´eshez, mint az ahhoz javasolt keres´esi strat´egia. Amikor viszont a reprezent´aci´os hiba magasabb, az analitikus m´ odszer rosszabb eredm´enyt ad. ´Igy a gyakorlati, hib´ara hajlamos alkalmaz´ asokn´ al az iterat´ıv technika v´alaszt´asa jobbnak t˝ unik. A RealDet s´ema teljes´ıtm´enye gyenge, az eredm´enyek ≈20–30%-a nem elfogadhat´o, amiben benne van a 6–7%-nyi megoldhatatlan eset is. Ez az ar´any j´oval kisebb a legjobb analitikus (0.4–7.4%), iterat´ıv (1.3–3.9%) ´es kombin´alt (0.4–7.0%) m´ odszerek eset´eben, amelyek r´aad´asul mindig szolg´altattak eredm´enyt. Az analitikus m´ odszerek eset´en azok kiv´alaszt´asi hat´ekonys´ag´at is vizsg´altuk. Mivel pontosan ismerj¨ uk az alakzatok k¨oz¨otti geometriai transzform´aci´ot, minden lehets´eges megold´ asra ki tudjuk ´ert´ekelni az -hib´at ´es meghat´arozhatjuk ezek minimum´ at – ez az elm´eleti optimum, amit a kiv´alaszt´asi s´em´aink el tudnak ´erni. Azon esetek ar´ anya, amikor a s´ema ´altal adott megold´ashoz ´es az optim´ alishoz tartoz´ o -hib´ ak t´avols´aga nagyobb, mint 1, 6.52% volt a bin´aris, ´es 0.36% a 8-bites reprezent´aci´o eset´en. Meg´allap´ıthatjuk, hogy a bin´aris esetben egyik s´ema sem k¨ ozel´ıti meg az optim´alisan el´erhet˝ot, de 8-bites fuzzy reprezent´ aci´ oval az EqsSel m´ar ¨osszem´erhet˝o vele.
535
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
1. t´ abl´ azat: Medi´ an hib´ ak k¨ ul¨ onb¨ oz˝ o fuzzy reprezent´ aci´ os szintekhez. Az esetek sz´ azal´eka, ahol az -hiba 1 alatti (≈ kit˝ un˝ o) ´es 5 alatti (≈ vizu´ alisan elfogadhat´ o) szint´en felt¨ untet´esre ker¨ ult. A vastag´ıtott sz´ amok a kateg´ ori´ an bel¨ uli legjobb eredm´enyeket mutatj´ ak.
k (pxls.) 1 0.58 2 0.25 4 0.09 8 0.05
RealDet kiv´ alaszt´ asi s´ema δ (%) > 1 (%) > 5 (%) Nem reg. (%) 3.65 43.4 29.2 6.5 1.44 31.3 23.7 6.3 0.61 26.4 21.0 6.3 0.34 24.5 20.5 7.1
k (pxls.) 1 0.47 2 0.19 4 0.06 8 0.04
CplxDet kiv´ alaszt´ asi s´ema δ (%) > 1 (%) > 5 (%) Nem 2.49 34.6 17.3 0.96 19.4 9.3 0.41 11.8 4.2 0.23 7.0 2.5
reg. (%) 0 0 0 0
EqsSel kiv´ alaszt´ asi s´ema k (pxls.) δ (%) > 1 (%) > 5 (%) Nem 1 0.39 1.89 25.8 7.3 2 0.17 0.88 13.3 3.2 0.36 7.5 1.1 4 0.06 8 0.03 0.20 3.9 0.4
reg. (%) 0 0 0 0
L-M megold´ as k (pxls.) 1 0.17 2 0.07 4 0.02 8 0.01
δ (%) > 1 (%) > 5 (%) Nem reg. (%) 0.76 12.2 3.9 0 0.32 6.4 2.2 0 0.13 3.3 1.4 0 0.08 2.5 1.3 0
n (pxls.) 1 0.18 2 0.07 4 0.02 8 0.01
Combined kiv´ alaszt´ asi s´ema δ (%) > 1 (%) > 5 (%) Nem 0.79 14.6 7.0 0.32 7.0 3.0 0.13 3.0 1.0 0.08 1.6 0.4
reg. (%) 0 0 0 0
Az algoritmusokat Matlab-ban implement´altuk. Az analitikus megold´asokhoz a solve, az iterat´ıv technik´ ahoz az fsolve f¨ uggv´enyt haszn´altuk fel. A teszteket egy 2.4 GHz-es Intel Core2 Duo processzorral rendelkez˝o laptopon futtatuk. Az atlagos sz´ ´ am´ıt´ asi id˝ o 1 m´ asodperc alatti, kiv´eve a kombin´alt m´odszert, ahol ez 1.3 m´ asodperc k¨ or¨ ul alakult. Az analitikus megold´ok id˝oig´enye konstansnak tekinthet˝ o. Az iterat´ıv technik´an´al nagyobb k¨ ul¨onbs´egek is kialakulhatnak. A fuzzy reprezent´ aci´ os szint nem befoly´asolja egyik m´odszer id˝oig´eny´et sem.
536
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
5 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0
RealDet 1‐bit CplxDet 1‐bit EqsSel 1‐bit L‐M 1‐bit RealDet 8‐bit CplxDet 8‐bit EqsSel 8‐bit L‐M 8‐bit
2101
1951
1801
1651
1501
1351
1201
901
1051
751
601
451
301
1
Combined 1‐bit
151
Epszzilon hiba
Megoldási módszerek és fuzzy reprezentáció 2D‐ben
Combined 8‐bit
Számítási idő 2D‐ben 6
Id dő (mp)
5 RealDet
4
CplxDet
3
EqsSel 2
L‐M
1
Combined
0
2. ´ abra: Hiba ´es sz´ am´ıt´ asi id˝ o eloszl´ asok a 2240 esetre. Az ´ert´ekek a legjobbt´ ol a legrosszabbig lexikografikusan rendez´esre ker¨ ultek.
4.2.
Kvantitat´ıv ki´ ert´ ekel´ es 3D-ben
A megold´ asi lehet˝ os´egeket 3D objektumokon is tesztelt¨ uk. 15 objektum ¨osszesen 1500 transzform´ alt v´ altozat´at haszn´altuk. A sablon objektumok 200 ezer ´es 2 milli´ o k¨ oz¨ otti k´eppontsz´ am´ uak voltak. A transzform´aci´o param´eterek az al´abbi tartom´ anyokb´ ol ker¨ ultek ki v´eletlenszer˝ uen: elforgat´as [0, 2π); sk´al´az´as [0.5, 1.5]; ny´ır´ as [−1, 1]; eltol´ as [0, 1] (nagyobb eltol´asnak az alkalmazott normaliz´al´as miatt nincs szerepe). Minden sablonra 100 v´eletlenszer˝ u transzform´aci´ot hajtottunk v´egre, amelyek k¨ oz¨ ul 25 merev-test, 25 nem-uniform sk´al´az´o, ´es 50 teljes affin volt. Az 3. ´ abr´ an l´ athatunk n´eh´any p´eld´at az adatb´azisb´ol. A fuzzy reprezent´ aci´ ohoz n × n × n (n ∈ {1, 2, 4, 8}) m´eret˝ u fel¨ ulmintav´etelez´est alkalmaztunk k´eppontonk´ent, a hozz´a tartoz´o fedetts´egi ´ert´ekek a r´acson vett objektum ´es h´ att´erpontok sz´am´anak ar´any´aval ker¨ ult k¨ozel´ıt´esre2 . A δ-hiba sz´ am´ıt´ asa el˝ ott az objektumokat binariz´altuk. A regisztr´aci´os pontoss´agokat a 2. t´ abl´ azat, az -hib´ ak ´es a sz´am´ıt´asi id˝o eloszl´as´at a 4. ´abra mutatja. 2
Megjegyezz¨ uk, hogy ez a fuzzy reprezent´ aci´ o elt´er a 2D-ben alkalmazott´ ol, mivel a 3D eset – nagy m´eret´enek k¨ ovetkezt´eben – m´ as kezel´est k´ıv´ ant.
537
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
3. ´ abra: P´eld´ ak a 3D adatb´ azisb´ ol: sablon (fels˝ o sor) ´es deform´ alt verzi´ oi (als´ o sor) 2. t´ abl´ azat: Medi´ an hiba ´ert´ekek k¨ ul¨ onb¨ oz˝ o fuzzy reprezent´ aci´ os szintekre. Az esetek sz´ azal´eka, ahol a δ-hiba 1 alatti (≈ kit˝ un˝ o) ´es 10 alatti (≈ vizu´ alisan elfogadhat´ o) szint´en felt¨ untet´esre ker¨ ult. A vastag´ıtott sz´ amok a kateg´ ori´ an bel¨ uli legjobb eredm´enyeket mutatj´ ak.
n 1 2 4 8
EqsSel kiv´ alaszt´ asi s´ema δ δ > 1% δ > 10% Id˝ o (mp) 0.2681 1.0613 52.3% 0.87% 2.15 0.1164 0.5569 28.1% 0.07% 2.14 0.1034 0.5106 19.1% 0.00% 2.15 0.1060 0.5351 18.96% 0.00% 2.14 L-M megold´ as
n 1 2 4 8
0.0361 0.0108 0.0069 0.0065
δ 0.1555 0.0627 0.0470 0.0402
δ > 1% 10.67% 3.13% 2.47% 2.47%
δ > 10% Id˝ o (mp) 2.13% 1.54 2.27% 1.56 2.20% 1.54 2.20% 1.52
n 1 2 4 8
Combined kiv´ alaszt´ asi s´ema δ δ > 1% δ > 10% Id˝ o (mp) 0.0359 0.1546 8.95% 0.00% 2.32 0.0108 0.0624 1.07% 0.07% 2.42 0.0069 0.0469 0.33% 0.00% 2.23 0.0065 0.0402 0.27%. 0.00% 2.31
Az eredm´enyek mutatj´ ak, hogy m´ar a bin´aris reprezent´aci´o is k´epes kiv´al´o eredm´enyt adni. Viszont m´ar az alacsonyabb fuzzy reprezent´aci´os szintek is tiszt´ an l´ athat´ o javul´ ast hoznak, k¨ ul¨on¨osen a kiv´al´o regisztr´aci´os eredm´enyek sz´ am´ aban. Az analitikus megold´ as CplxDet s´em´aval nagyon gyeng´en teljes´ıt, 44-54% k¨ oz¨ otti a nem elfogadhat´ o regisztr´aci´os eredm´enyek ar´anya a k¨ ul¨onb¨oz˝o fuzzy szintekre. A RealDet s´em´at nem is tesztelt¨ uk. Az iterat´ıv L-M m´odszer alacsonyabb medi´ an hib´ at ad, mint a legjobb analitikus m´odszer, de az elfogadhat´ o regisztr´ aci´ os eredm´enyek sz´am´aban megel˝ozi az EqsSel s´ema. A 2D esettel ellent´etben a kombin´ alt m´odszer j´ol l´athat´oan a legjobb v´alaszt´as minden fuzzy reprezent´ aci´ os szinten, bele´ertve a bin´aris esetet is. A felt¨ untetett sz´am´ıt´asi
538
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
5 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0
CplxDet 1‐bit EqsSel 1‐bit L‐M 1‐bit Combined 1‐bit CplxDet 8‐bit EqSel 8‐bit L‐M 8‐bit Combined 8‐bit
1 101 201 301 401 501 601 701 801 901 1001 1101 1201 1301 1401
Epszzilon hiba
Megoldási módszerek és fuzzy reprezentáció 3D‐ben
CplxDet EqsSel L‐M
1401
1301
1201
1101
901
1001
801
701
601
501
401
301
201
1
Combined
101
Idő (mp)
Számítási idő 3D‐ben 10 9 8 7 6 5 4 3 2 1 0
4. ´ abra: Hiba ´es sz´ am´ıt´ asi id˝ o eloszl´ asok a 3D adatb´ azis eset´en
id˝ ok nem tartalmazz´ ak az egyenletrendszer gener´al´asnak idej´et, ami ´atlagosan 1 tizedm´ asodperc. Az iterat´ıv m´odszert a Matlab fsolve f¨ uggv´eny´evel val´os´ıtottuk meg. Az analitikus megold´ ashoz a PHCPack csomagot [14] haszn´altuk, mivel a Matlab nem volt k´epes a negyedfok´ u polinomi´alis egyenletrendszer megold´as´ara. 4.3.
Robusztuss´ ag vizsg´ alat 3D-ben
A gyakorlatban a k´epp´ arokon, objektumokon t¨obbf´ele degrad´aci´o is megjelenik, ilyenek p´eld´ aul a hi´ anyz´ o adatok, szegment´aci´os hib´ak. A m´odszer¨ unk robusztuss´ ag´ anak tesztel´es´ere h´ arom f´ele degrad´aci´ot´ıpust modellezt¨ unk a bin´aris k´epeinken (5. ´ abra). A hi´ anyz´o k´eppontok tesztel´es´ere adott sz´azal´eknyi k´eppont ker¨ ult az objektumb´ ol v´eletlenszer˝ uen t¨orl´esre. A szegment´aci´os hiba modellez´es´ere az objektum k¨ orvonala ment´en v´eletlenszer˝ uen kis m´eret˝ u r´egi´okat t´avol´ıtottunk el az objektumb´ol vagy adtunk hozz´a az objektumhoz. A hi´anyz´o t´erfogatr´eszek vizsg´ alat´ ahoz egy v´eletlenszer˝ uen kiv´alasztott objektumpont k¨ornyezet´eb˝ ol t´ avol´ıtottunk el adott mennyis´eg˝ u objektumpontot. Terjedelmi okokb´ ol itt csak az eredm´enyek ´ert´ekel´es´et k¨oz¨olj¨ uk, r´eszletes t´abl´azatok ´es grafikonok n´elk¨ ul. Az egyenletesen elt´ avol´ıtott objektumpontok ´altal´aban nem okoznak probl´em´ at egyik megold´ asi m´ odszer eset´en sem, ak´ar 90% elt´avol´ıt´asa ut´an is elfo-
539
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
5. ´ abra: P´eld´ ak k´epdegrad´ aci´ okra egy 3D objektum 2D szelet´en: K´eppontok 90%nak v´eletlenszer˝ u elt´ avol´ıt´ asa (balr´ ol), k´eppontok 10%-nak m´ odos´ıt´ asa a hat´ ar ment´en kis m´eret˝ u r´egi´ okban (k¨ oz´epen), ´es a 5%-nak elt´ avol´ıt´ asa egy k´eppontb´ ol kiindulva (jobbr´ ol).
gadhat´ ok az eredm´enyek. A szegment´aci´os hiba eset´eben 25%-os degrad´aci´os szintn´el az esetek 70%-ban az objektumok illeszked´ese elfogadhat´o. Mint ´altal´aban a ter¨ ulet-alap´ u m´ odszerek, a mi megk¨ozel´ıt´es¨ unk is ´erz´ekeny a hi´anyz´o t´erfogatr´eszekre. 1 − 2%-os degrad´ aci´os szint felett az eredm´enyek megb´ızhatatlann´a v´ alnak. Azt tapasztaltuk, hogy az analitikus megold´as ¨onmag´aban nem versenyk´epes az iterat´ıv technik´ aval. A kombin´alt megk¨ozel´ıt´es fel¨ ulm´ ulja az iterat´ıvat kis m´ert´ek˝ u degrad´ aci´ ok eset´en. A degrad´aci´o m´ert´ek´enek n¨oveked´es´evel ez az el˝ony ´ viszont elt˝ unik. Eszrevehetj¨ uk azt is, hogy mivel az algebrai hiba magasabb degrad´ aci´ os szint eset´en jelent˝ osen n¨ovekedhet, t¨obb kezd˝o orient´aci´o vizsg´alat´ara ¨ van sz¨ uks´eg, ami megn¨ oveli a sz´am´ıt´asi id˝ot. Osszefoglal´ ask´ent elmondhatjuk, hogy a m´ odszer¨ unk rendszerint j´ol teljes´ıt, am´ıg az objektumunk geometriai momentumai nem v´ altoznak meg nagym´ert´ekben a degrad´aci´o hat´as´ara.
5.
¨ Osszegz´ es
Cikk¨ unkben egy egyes´ıtett regisztr´aci´os keretrendszert mutattunk be amely k´epes 2D ´es 3D bin´ aris objektumok k¨oz¨ott t¨obbf´ele line´aris deform´aci´o becsl´es´ere. A regisztr´ aci´ os probl´ema megold´as´at egy polinom egyenletrendszer gener´al´asa ´ eredm´eny¨ ´es megold´ asa adja. Uj unk a regisztr´aci´os elj´ar´as sor´an el˝o´all´o polinomi´ alis egyenletrendszerek gyors ´es hat´ekony megold´asi lehet˝os´egeinek r´eszletes t´ argyal´ asa. Azt tapasztaltuk, hogy az iterat´ıv legkisebb n´egyzetes megold´as szisztematikus keres˝ o elj´ ar´ assal kombin´alva a legjobb v´alaszt´as 2D probl´em´akra, m´ıg 3D-ben az analitikus ´es az iterat´ıv technik´ak kombin´aci´oj´at c´elszer˝ u v´alasztani. Tesztjeinkben vizsg´altuk a kor´abbi publik´aci´oinkban bevezetett fuzzy reprezent´ aci´ ot, amely a diszkr´et objektumok k´eppont lefedetts´egi inform´aci´oj´at jelenti, ´es kimutattuk ennek el˝onyeit.
K¨ osz¨ onetnyilv´ an´ıt´ as A szegedi szerz˝ ok munk´ aj´ at az OTKA K75637 sz´am´ u p´aly´azat ´es a futurICT.hu ´ nev˝ u, TAMOP-4.2.2.C-11/1/KONV-2012-0013 azonos´ıt´osz´am´ u projekt t´amogatta az Eur´ opai Uni´ o ´es az Eur´opai Szoci´alis Alap t´arsfinansz´ıroz´asa mellett.
540
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
N. Sladoje ´es J. Lindblad munk´aj´at anyagilag t´amogatta a Szerb K¨ozt´arsas´ag Tudom´ anyos Miniszt´eriuma az ON144018 ´es ON144029 projekteken kereszt¨ ul.3 K¨ osz¨ onetet mondunk Niku Corne´anak, aki a szintetikus k´epek egy r´esz´et biztos´ıtotta sz´ amunkra.
Irodalom 1. B. Zitov´ a and J. Flusser, “Image registration methods: A survey,” Image and Vision Computing, vol. 21, no. 11, pp. 977–1000, October 2003. 2. R. Hagege and J.M. Francos, “Linear estimation of sequences of multi-dimensional affine transformations,” in Proc. of International Conference on Acoustics, Speech and Signal Processing, Toulouse, France, May 2006, IEEE, vol. 2, pp. 785–788. 3. R. Hagege and J.M. Francos, “Parametric estimation of affine transformations: An exact linear solution,” Journal of Mathematical Imaging and Vision, vol. 37, no. 1, pp. 1–16, 2010. 4. C. Domokos, Z. Kato, and J.M. Francos, “Parametric estimation of affine deformations of binary images,” in Proc. of International Conference on Acoustics, Speech and Signal Processing, Las Vegas, Nevada, USA, April 2008, IEEE, pp. 889–892. 5. J. Kannala, E. Rahtu, J. Heikkil¨ a, and M. Salo, “A new method for affine registration of images and point sets,” in Proc. of the 14th Scandinavian Conference on Image Analysis (SCIA). 2005, LNCS, pp. 224–234, Springer. 6. T. Suk and J. Flusser, “Affine normalization of symmetric objects,” in Proc. of the 7th International Conference on Advanced Concepts for Intelligent Vision Systems (ACIVS). 2005, LNCS, pp. 100–107, Springer. 7. J. Zhang, Y. Ge, S.H. Ong, C.K. Chui, S.H. Teoh, and C.H. Yan, “Rapid surface registration of 3D volumes using a neural network approach,” Image Vision Comput., vol. 26, no. 2, pp. 201–210, 2008. 8. N.D. Cornea, M.F. Demirci, D. Silver, A. Shokoufandeh, S.J. Dickinson, and P.B. Kantor, “3D object retrieval using many-to-many matching of curve skeletons,” Int. Conf. on Shape Modeling and Appl., pp. 368–373, 2005. ´ c, and N. Sladoje, “On set distances and their application to 9. J. Lindblad, V. Curi´ image registration,” in Proc. of the 6th International Symposium on Image and Signal Processing and Analysis (ISPA). 2009, pp. 449–454, IEEE. 10. C. Domokos and Z. Kato, “Parametric estimation of affine deformations of planar shapes,” Pattern Recognition, vol. 43, no. 3, pp. 569–578, 2010. 11. A. Tan´ acs, J. Lindblad, N. Sladoje, and Z. Kato, “Estimation of linear deformations of 3D objects,” in Proc. of International Conference on Image Processing (ICIP). 2010, pp. 153–156, IEEE. 12. N. Sladoje and J. Lindblad, “Pixel coverage segmentation for improved feature estimation,” in Proc. of ICIAP. 2009, vol. 5716 of LNCS, pp. 929–938, Springer. 13. A. Tan´ acs, C. Domokos, N. Sladoje, J. Lindblad, and Z. Kato, “Recovering affine deformations of fuzzy shapes,” in Proc. of SCIA. 2009, vol. 5575 of LNCS, pp. 735–744, Springer. 14. J. Verschelde, “Algorithm 795: Phcpack: a general-purpose solver for polynomial systems by homotopy continuation,” ACM Trans. Math. Softw., vol. 25, no. 2, pp. 251–276, 1999. 3
N. Sladoje and J. Lindblad are financially supported by the Ministry of Science of the Republic of Serbia through Projects ON144018 and ON144029 of MI-SANU.
541