mobilis robotikai alkalmazásokhoz

Budapesti M˝ uszaki és Gazdaságtudományi Egyetem Irány´ıtástechnika és Informatika Tanszék

Proh´ aszka Zolt´ an ´ ˝ geometriai me ´rte ´keken e ´s Ujszer u ´pjellemzo ˝ ko ¨ n alapulo ´ mozga ´ ssztereo ´ ke ´ sokhoz mobilis robotikai alkalmaza Ph. D. értekezés tézisei

Motion stereo for mobile robot applications based on novel geometric measures and image features Ph. D. Thesis Summary

Konzulens: Prof. Dr. Lantos B´ ela

Budapest, 2010. december 14.

2

3

1.

Bevezet˝ o´ es motiv´ aci´ o

A termelésben alkalmazott ipari robotok többsége csupán 6 csuklószenzor seg´ıtségével látja el feladatát. Ez csak akkor lehetséges, ha a robotnak mindig pontos információja van a környezet pillanatnyi a´llapotáról. Egyre nagyobb teret kapnak viszont azok az alkalmazások, amikor a robotnak ’intelligens’ módszerekkel kell a környezet le´ırásából hiányzó elemeket meghatároznia. K¨ ulönösen ´ıgy van ez olyan feladatok esetében, amikor a robot helyváltoztatása sz¨ ukséges, hiszen egy ilyen mobilis robot környezete sokkal több, el˝ore nem specifikálható elemet tartalmazhat. Erre a célra a vizuális érzékelés kiválóan alkalmas: • Távoli érzékelést tesz lehet˝ové, a környezetet nem változtatja meg a mérés. • Az egyes érzékel˝ocellák igen alacsony költség˝ uek, hiszen egy eszközben több millió is lehet. • A jelek érzékelése és azok feldolgozása jól ismert geometriai viszonyok mellett, illetve o¨sszef¨ uggések alapján zajlik, ´ıgy geometriailag helyes kimenetet lehet el˝oa´ll´ıtani. Nem véletlen, hogy az emberi termel˝o tevékenység során is dominál a vizuális érzékelés felhasználása [2]. A szám´ıtógépes képfeldolgozás fejl˝odése szétválaszthatatlan a szám´ıtógépek fejl˝odését˝ol. Ahogy a gépek memória- és szám´ıtási kapacitása növekszik, u ´gy válik lehet˝ové az egyes, akár évek o´ta ismert o¨tletek, elméleti eredmények gyakorlati ellen˝orzése és módos´ıtása. A képfeldolgozás tisztán elméleti erdeményei ezért mindig megel˝ozik a gyakorlatban bevált módszereket, melyek csak akkor alkalmazhatók a robotikában, ha megb´ızható m˝ uködés¨ uk ki lett dolgozva. Ez utóbbi ter¨ uletet nevezik (angolul) Robot Vision-nek, az ezen a ter¨ uleten elért eredményeket a´ltalában robotikai konferenciákon és folyóiratokban teszik közzé. A szám´ıtógépes látás (Computer Vision) és a ’Robot Vision’ ter¨ uletek között nem egyiránny´ u az információa´ramlás, az egyes módszerek éles robotikai feladatokban való alkalmazhatósága megmutatja az elméleti irányzatok életképességét. Az ilyen alkalmazások perdönt˝ok lehetnek az egymással verseng˝o módszerek jöv˝obeni alkalmazása szempontjából. Mivel a robotok a 3-dimenziós térben fejtik ki tevékenység¨ uket, ezért a 3-dimenziós környezet modelljének kétdimenziós vet¨ uletekb˝ol történ˝o el˝oa´ll´ıtására koncentrálunk. Egy ilyen folyamat elemi lépése két kép viszonyának a meghatározása. Amennyiben el˝ozetes informácó nem áll rendelkezésre a két kép viszonyáról, akkor ez a következ˝o lépésekre bontható: • A fontos képrészletek elhelyezkedésének megállap´ıtása (kulcster¨ ulet lokalizáció). • Az ezen részletek által tartalmazott képi információt reprezentáló le´ıróvektorok kinyerése (le´ıróvektor generálás).

˝ MOTIVACI ´ O ´ 1 BEVEZETO,

4

• Kulcster¨ uletek páros´ıtása a le´ırók hasonlósága és geometriai elhelyezedés¨ uk alapján. Követelmény, hogy a páros´ıtások o¨sszessége összhangban legyen valamilyen transzformációs modellel. Ez a transzformációs modell tehát a lépés során el˝oa´ll. A kapott, és más képpáros´ıtásokból ered˝o transzformációs modellek már térbeli információkat hordoznak, a rekonstrukciós folyamat további lépéseiben ezek kombinálása sz¨ ukséges, hogy a környezet minél pontosabb térbeli modellje a´lljon el˝o. Ennek a lépésnek a komplexitása igen változó lehet, az értekezés ezeket nem tárgyalja részletesen. A képpáros´ıtási feladat megoldását az ezredforduló el˝ott geometriai képjellemz˝ok alapján végezték, m´ıg D. Lowe gyakorlatias módszerének (SIFT, azaz Scale Invariant Feature Transform [8]) hatására az ezredforuló után a momentum, illetve gradiens-histogramm alapján m˝ uköd˝o módszerek domináltak. A módszer két lényeges lépése a stabilan reprodukálható kulcster¨ uletek meghatározása (lokalizációja), illetve a megtalált ter¨ uletek tartalmának tömör´ıtése képrészlet-le´ıró vektorokba. A felhasznált elméleti eredményeket (DoGSS) már a kilencvenes években ismerték [6, 7], de a SIFT detektor olyan módos´ıtásokat adott ezekhez, melyek a gyakorlatban is bizony´ıtották a kutatási irányvonal életképességét. Az u ´j irányvonal igen sok konkurrens megoldást hozott, többek között a PCA-SIFT [5] , GLOH [12], SURF [1], Harris-Affine [11], MSER [10] módszereket. A több kameraképen alapuló 3-dimenziós rekonstrukció alapvet˝o geometria összef¨ uggéseit és algebrai módszereit az 1980-as, 1990-es években dolgozták ki. Ezeket szemléletesen és tömören mutatja be Hartley és Zisserman könyve [4].

1.1.

Az ´ ertekez´ esben megoldott feladatok

Az értekezés a fenti feladatok egyes részfeladataira ad u ´j megoldásokat, ezeket két megközel´ıtésben mutatja be. Az affin Lucas-Kanade (LK) detektor [9] szinguláris eseteinek vizsgálatából adódó eredmények a´ltalánosan használhatók. A kidolgozott eredmények o¨sszekötik az irodalomban eddig k¨ ulön tárgyalt geometriai képjellemz˝okre és a kulcster¨ uletek tartalmának reprezentálására használt le´ıró-vektorokra alapozott megközel´ıtéseket. A tanszéken fejlesztett négyrotoros autonóm beltéri helikopter poz´ıciójának és orientációjának meghatározásához kidolgozott eredmények a fent vázolt feldolgozási folyamat egyéb lépéseit is érintik. A kutatómunka elején, a klasszikus módszerek tanulmányozásakor felt˝ unt, hogy am´ıg a standard Lucas-Kanade detektor szinguláris eseteinek analizálása azonos a Harris Corner detektor [3] formalizmusával, addig az affin LK detektor szinguláris eseteinek vizsgálata ¨ nincs kidolgozva. Ez vezetett az Onaffin Képjellemz˝o (Self Affine Feature Transform, SAFT) kidolgozásához. A kutatás ehhez kapcsolódó részfeladata ezután arra koncentrált, hogy a szinguláris esetek vizsgálata kapcsán feltárt összef¨ uggéseket minél alaposabban formalizáljam, és gyakorlati alkalmazhatóságukat kidolgozzam. A felfedezett o¨sszef¨ uggések

1.1 Kutatási feladatok

5

hamar egyértelm˝ uvé tették, hogy a módszer kiválóan használható (affin invariáns) geometriai információk kinyerésére. Er˝os volt a sejtés, hogy a kinyert információk használhatók le´ıróvektor-alap´ u páros´ıtásra is, mivel a bizony´ıtottan jól m˝ uköd˝o módszerekhez hasonlóan a gradiensek eloszlását kódolják. Siker¨ ult a kidolgozott módszer egy olyan paraméterezését megtalálni, ami ennek a kutatási iránynak a folytatására buzd´ıtott. A továbbiakban az optimális paraméterezés meghatározása kimer´ıt˝o keresés seg´ıtségével történt. Nem várt eredményként fény der¨ ult arra, hogy a kidolgozott formalizmus a kulcshelyzetek lokalizációjának elvégzése közben is használható. Ez a kutatási irány nem tekinthet˝o befejezettnek.

1. ábra. A tanszéken fejlesztett négyrotoros helikopterek protot´ıpusa. Az Irány´ıtástechnika és Robotika csoport egy beltéri négyrotoros autonóm helikoptert fejleszt a Budapesti M˝ uszaki Egyetem Irány´ıtástechnika és Informatika Tanszékén (BME IIT). Kutatási projekt¨ unk 2006 tavaszán kezd˝odött, az MTA SZTAKI és a BME IIT kooperációja keretében. A robot-helikopterek protot´ıpusainak kutatásához elengedhetetlen egy megb´ızható és gyors helyzetmeghatározó megoldás. Ezt a feladatot képfeldolgozással k´ıvántuk megoldani, mivel a felmer¨ ul˝o egyéb módszerek mellett ez az u ´t t˝ unt a leginkább járhatónak. Két, alapvet˝oen eltér˝o konstrukció jött szóba: • Az els˝o változat helikopterre szerelt markereket, k¨ uls˝o kamerákat és földi feldolgozóegységet használ. A szám´ıtott helyzetet rádiókapcsolaton lehet elk¨ uldeni a 6szabadságfok´ u mobilis robotnak. Emiatt ez a megoldás er˝osen helyhez kötött (ami beltéri m˝ uködés esetén mellékes), viszont könnyebben realizálható. • A második elrendezésben mind a kamerák, mind a feldolgozórendszer a helikopteren lehet. Beltéri helikopterek esetében OpenGL ES 2.0-s szabványnak megfelel˝o ’Handheld-PC’ szint˝ u szám´ıtógépek jöhetnek szóba képfeldolgozó egységként, ez esetben érdemes a laboratóriumba telep´ıtett markerekkel csökkenteni a szám´ıtásigényt. K¨ ultéri (némileg er˝osebb) helikopterek esetében OpenCL 1.1 kompatibilis mobilis

˝ MOTIVACI ´ O ´ 1 BEVEZETO,

6

szám´ıtógépek szám´ıtási teljes´ıtménye sz¨ ukséges, mivel a környezetr˝ol nem k´ıvánunk semmit sem feltételezni. A projekt el˝orehaladása érdekében az els˝o változatot kellett záros határid˝on bel¨ ul elkész´ıteni, a második elrendezés jöv˝obeni kutatásokat alapoz meg. A SAFT detektorral és a robothelikopterrel kapcsolatos két kutatási feladat nem szeparált, mindkét ter¨ uleten elért eredmények felhasználhatók, illetve sz¨ ukségesek egy k¨ ultéri helikopter fedélzetén végzett vizuális navigációhoz.

1.2.

Kutat´ asi m´ odszerek

Az elméleti kutatást, levezetéseket kezdetben pap´ıron végeztem. Egy-két hiba igen sokáig rejtve maradt, ezért kipróbáltam a szám´ıtógépes levezetés képességeit. A MATLAB szimbolikus toolbox állt a rendelkezésemre, ami gyakorlatilag a Maple szolgáltatásait használja. A toolbox képességei vegyesek, egyszer˝ ubb kifejezéseket igen hatékonyan egyszer˝ us´ıt, de egy összetett azonosság két oldalának k¨ ulönbségét ritkán képes nullára redukálni. Hamar kider¨ ult, hogy sokkal használhatóbb a levezetések ellen˝orzésére, mint azok elvégzésére. Sajnos mátrixokkal kapcsolatos o¨sszeföggéseket nem ismer (vagy nem alkalmazza azokat hatékonyan). A toolbox integrálási képességei jól használhatók voltak. A levezetések alapján adódó módszerek a´ltalában mátrixokat tartalmaztak. Ezeket leginkább azért el˝ony˝os MATLAB alatt kipróbálni, mert lépésenkénti futtatás esetén az interpreterben bármely használt mátrix saját, illetve szinguláris értékeit le lehet kérdezni. Mérnöki szempontból egy általános (pl. 6 × 6-os) mátrix elemeinek listája alig mond valamit, a sajátvektor-sajátérték felbontása viszont már elegend˝o támpontot ny´ ujt hibakeresés közben. A MATLAB interpreter jellege viszont komoly hátrány a futási id˝ok tekintetében. MATLAB-on bel¨ ul két lehet˝oség van a gyors´ıtásra: A ciklusok mátrixm˝ uveletekké való konvertálásával, illetve C f¨ uggvények .mex-állománnyá való ford´ıtásával. El˝obbi esetében a kód olvashatósága, utóbbi esetben a rendelkezésre a´lló mátrixm˝ uveletek és a hibakeresés lehet˝osége esik áldozatul. A gyakorlati kutatási munkához MS Visual Studio-t használtam C++ programok fejlesztésére. Ebben a környezetben teszteltem az egyes template funkciók megvalós´ıthatóságát. Az egyes, operator overloaddal kapcsolatos megoldások o¨sszehasonl´ıtásához a ford´ıtott és optimalizált kódot vizsgáltam (’show disassembly’ opció). Szintén ezt a fejleszt˝okörnyezetet használtam a grafikus processzorok (GPUk) képfeldolgozásban használható képességeinek vizsgálatához, továbbá az elkész¨ ult f¨ uggvénykönyvtár és a négyrotoros helikopter vizuális navigációját megvalós´ıtó alkalmazás implementálásához. A mátrixokat intenz´ıven használó 3-dimenziós rekonstrukciós f¨ uggvények tesztelése párhuzamos debuggolással történt. A már m˝ uköd˝o, de lass´ u MATLAB kód és annak C++ változata

1.2 Kutatási módszerek

7

egyszerre futott lépésenként a két rendszerben. Mivel egyes numerikus feladatok megoldása nem egyértelm˝ u (SVD, roots), a két környezet akkor is eltér˝o részeredményeket adott ugyanarra a bemenetre, ha mindkett˝o helyesen m˝ uködött. Ezt a problémát az ilyen eredmények o¨sszevetésére és módos´ıtására létrehozott f¨ uggvények használata oldotta meg.

´ EREDMENYEK ´ 2 UJ

8

2.

Az u ´ j tudom´ anyos erdem´ enyek ¨ osszefoglal´ asa

2.1.

A ’Self Affine Feature Transform’ geometriai k´ epess´ egei

Az affin Lucas-Kanade (LK) feladat bizonyos bemenetek esetén egy szinguláris mátrix invertálásához vezet. Az adott mátrix nulla sajátétékéhez (értékeihez) tartozó sajátvektor(ok) az adott képrészlet fontos geometriai tulajdonságait reprezentálják. A kifejlesztett ’Self Affine Feature Transform’ (SAFT) detektor m˝ uködése során a vizsgált képet vezetj¨ uk az affin LK detektor mindkét bemenetére, és a közb¨ uls˝o lépésként kiadódó 6 × 6-os mátrixot vezetj¨ uk a kimenetre. A szám´ıtási szabályt a következ˝o képlet adja meg: M=

Z

(pH ⊗ g)(pH ⊗ g)T wdA,

(1)

ahol g a képen mért gradiens, pH a homogén poz´ıció, w az ablakozó f¨ uggvény és M a kiadódó SAFT mátrix. Ennek a mátrixnak 18 f¨ uggetlen eleme van, valójában ez egy 2 · 2 × 3 · 3-as szimmetrikus tenzor. A kiszám´ıtáshoz használt koordinátarendszer transzformációitól való f¨ uggés ezt jól mutatja. A módszer seg´ıtségével a következ˝o feladatok oldhatók meg: • Változatos gemoetriai mennyiségek meghatározása (zárt kifejezések használatával): – Kör(´ıv) középpontja, sugara. – K´ upszeletek paraméterei. ¨ – Osszetar´ o egyenesek metszéspontja, akár a vizsgálati ablakon k´ıv¨ ul is. – Elliptikus spirálok emelkedése, egyéb paraméterei. • Alakzatok osztályozása a le´ıróba foglalt információ alapján. • Alakzatok affin normalizálása. A módszer kiterjeszthet˝o homogén, térbeli es projekt´ıv esetre is, ráadásul a térbeli kiterjesztéssel a másik kett˝o kombinálható. A homogén kiterjesztésnek képpáros´ıtés esetén van gyakorlati jelent˝osége, m´ıg a térbeli kiterjesztés speciális eseteit régóta ismerik és használják 3-dimenziós tárgyak mérnöki visszafejtésére. 1. T´ eziscsoport. Az Affin Lucas-Kanade detektor szinguláris bemeneteinek a vizsgálata ¨ alapján kifejlesztettem a Self Affine Feature Transform módszert (Onaffin Képjellemz˝o Transzformációt), amely módszer többféle gemoetriai információt képes robusztus módon kinyerni a vizsgált képrészletekb˝ol. Kapcsolódó publikációk: [S7, S11, S5]

2.1 A SAFT detektor

9

2. ábra. Tipikus képek, amelyek analizálásához az 1. téziscsoportban bemutatott módszerek jól alkalmazhatók. 1.1. T´ ezis. Kidolgoztam a Self Affine Feature Transform módszer formalizmusát és koordináta-transzformációs szabályait. A módszerrel kinyert le´ıró (mátrix) a képrészletek affin transzformációkkal szemben mutatott érzékenységét tartalmazza kompakt formában. Szab´ alyt adtam a szám´ıtások közben használandó koordinátarendszer optimális megválasztására a feldolgozási ablak alakjának f¨ uggvényében. Kidolgoztam a módszer 3-dimenziós, illetve projekt´ıv kiterjesztéseit, és bemutattam alkalmazhatóságukat. ´ 1.2. T´ ezis. Araml´ as- és alakzat-osztályozó módszereket dolgoztam ki, melyek a 6 × 6-os SAFT mátrix vizsgálatán alapulnak. Korlátozott diagonalizációt alkalmaztam az algebrai diagonalizáció numerikusan érzékeny eseteinek elker¨ ulésére. 1.3. T´ ezis. Módszereket fejlesztettem, melyek képesek változatos geometriai informáci´ okat kinyerni a SAFT le´ıró mátrixából. Mind osztályf¨ ugg˝o, mind általános esetben alkalmazhat´ o módszereket adtam. Az alakzat osztálytól f¨ ugg˝o módszerek finoman viselkednek az adott osztályon k´ıv¨ uli bemenetek esetében is, képesek kiszám´ıtani annak a folytonos mértékét, hogy mennyire teljes¨ ul az adott osztályhoz tartozás hipotézise.


10

(a)

(b)

(c)

(d)

3. a´bra. A bemutatott módszerek által detektált geometriai mennyiségek a képekre rajzolva jól mutatják a SAFT detektor egyes képességeit. (a): Két invariáns a´ramlást eredményez˝o k´ upszeletek egyenletei zárt alakban megkaphatók. (b): A forgatás, illetve a skálázás középpontja még az ideálistól távol es˝o bemenetekre is meghatározható. (c): Az egységnyi hibát adó a´ramlások akkumulált sebesség-eloszlásának minimuma a kép egyik legkarakterisztikusabb pontja. (d): Az akkumulált sebesség-eloszlás osztályf¨ uggetlen normalizálásra is alkalmazható.

2.2 Képrészlet páros´ıtás

2.2.

11

A ’Self Affine Feature Transform’ haszn´ alata hasonl´ o k´ epr´ eszletek p´ aros´ıt´ as´ ahoz

A SAFT detektor alkalmas képrészletek hasonlóságának megállap´ıtására, ha több képfrekvenciát is figyelembe vesz¨ unk. A gyakorlatban három sáv használata elegend˝onek bizonyult, ez 54 dimenziós le´ıróvektort eredményez. Egy sáv kiszám´ıtásának tág értelemben véve 5 paramétere van, ezek köz¨ ul a három legjelent˝osebb hatását vizsgáltam. A lehetséges utófeldolgozások 36-féle kombinációját vizsgáltam. A módszer vizsgálatához sz¨ ukség van egy kulcshelyzet-lokalizáló eljárásra. Erre a célra a SIFT módszer vonatkozó részeit használtam. A SIFT módszer páros´ıtási képességeit referenciaként használtam az u ´j le´ıró teljes´ıtményének megállap´ıtásához, illetve az optimális paraméterezés meghatározásához. Az els˝o téziscsoportban felhasznált összef¨ uggések a képpáros´ıtási folyamat számos egyéb részfeladata esetében is felhasználhatók. Mivel ez el˝ore prognosztizálható volt, ezért az ilyen képességek plusz motivációt jelentettek a képrészlet-páros´ıtási képességek vizsgálatakor. A legfontosabb ilyen képesség, hogy a SAFT le´ıró használatával lehet˝oség ny´ılik megmondani, hogy két képrészlet páros´ıtása milyen dimenziókban mennyire köti meg a használt transzformációs modell paramétereit. Ha a SAFT (illetve a Harris) detektort végtelen (> 2.5σ) kiterjedés˝ u Gauss-ablakon értékelj¨ uk ki, akkor a kódolt információ le´ırja a Harris detektornak az integrálási ablaktól való f¨ uggését. Ez az eredmény a módszert a kulcshelyzetek meghatározásával is kapcsolatba hozza. 2. T´ eziscsoport. Megmutattam, hogy az általam kifejlesztett Self Affine Feature Transform alkalmazható hasonló képrészletek páros´ıtási feladatához, amennyiben több képfrekvenci´ at is felhasználunk. A képrészletet le´ıró vektorok kinyerése és utófeldolgozása során haszn´ alt paraméterek optimális értékeinek meghatározása érdekében részletes és kimer´ıt˝o keresést végeztem. Megmutattam, hogy a SAFT jellemz˝o analitikus volta olyan képességeket eredményez, amelyek jól használhatók a képpáros´ıtási folyamat számos részfeladat´ anak megoldásakor. Le´ırtam a SAFT képjellemz˝o koordináta-transzformációktól, illetve az integrálási s´ ulyf¨ uggvény alakjától való f¨ uggését. Ezeknek az összef¨ uggéseknek a lineariz´ al´ asa megmutatta a SAFT módszer kapcsolatát a Harris detektoron alapuló Affin Adaptációval. Kapcsolódó publikációk: [S8, S9, S4] 2.1. T´ ezis. Bebizony´ıtottam, hogy az általam kidolgozott Self Affine Feature Transform alkalmazható hasonló képrészletek páros´ıtási feladatához, amennyiben több képfrekvenci´ at is felhasználunk. Részletesen bemutatattam, hogy a képjellemz˝o-szám´ıtás paraméterei hogyan választandók meg az egyes esetekben. Megmutattam, hogy a három sávot haszn´ al´ o 54-dimenziós SAFT-54 le´ıróvektor teljes´ıtménye meghaladhatja a 128-dimenziós SIFT módszerét.


12

(a)

(b)

4. ábra. A képpáros´ıtási képességek tesztelésére használt tipikus képsorozatok 2.2. T´ ezis. Megmutattam, hogy a SAFT jellemz˝o analitikus volta olyan képességeket eredményez, amelyek jól használhatók a képpáros´ıtási folyamat egyes részfeladatainak megoldásakor: • A képjellemz˝o szám´ıtható konvol´ ució seg´ıtségével, felhasználva annak tisztán integrális természetét, mely pl. anizotróp ablakozás esetében el˝onyös. • Két képrészlet között meghatározható a minimális négyzetes pixeldifferenciát adó elforgatás. • Képes olyan képrészletek detektálására és összehasonl´ıtására, amelyek tartalma invariáns valamilyen transzformációra (tipikusan élek és görbék lehetnek ilyenek, az ilyen részleteket több elterjedt mószer nem képes felhasználni) • A SAFT módszer seg´ıtségével meghatározható a kapott transzformációs modellek négyzetes pixeldiferencia értelmében vett hibája. A vizsgált képrészletek tartalmát fi-

2.2 Képrészlet páros´ıtás

13

gyelembe véve zárt alakban megadja a kulcster¨ ulet-páros´ıtások okozta hibáknak a transzformáció paramétereit˝ol való másodfok´ u f¨ uggését. 2.3. T´ ezis. A Gauss-f¨ uggvény speciális tulajdonságait és a SAFT képjellemz˝o utólagos koordináta-transzformálhatóságát felhasználva megmutattam, hogy a SAFT módszer formalizmusa ekvivalens a Harris detektort használó Affin Adaptáció linearizált változatával. Ez u ´j közel´ıt˝o módszerek használatát teszi lehet˝ové mindkét módszer kiértékelése esetében. 2.4. T´ ezis. Módszert dolgoztam ki képjellemz˝o-vektorok négyzetes pixeldifferencia értelmében vett optimális lineáris s´ ulyozásának meghatározására. A kapott eredményeket a SAFT le´ıróra alkalmazva analitikus kifejezést adtam, amely a használt Gauss-ablak kiterjedésének f¨ uggvényében megadja a s´ ulyozómátrix elemeinek optimális mértékét.

(a)

(b)

(c)

(d)

5. a´bra. A SAFT-54 képrészlet-le´ıró seg´ıtségével talált hasonló részletek. A nyilak az a´tlagos s´ıkhoz képesti diszparitást, azaz a projekt´ıv mélységet jelölik


14

2.3.

N´ egyrotoros, auton´ om belt´ eri helikopter vizu´ alis navig´ aci´ oja

A tanszéken ép´ıtett beltéri helikopter irány´ıtási kérdéseinek vizsgálatához sz¨ ukségessé vált egy abszol´ ut mérési eredményeket szolgáltatni képes vizuális navigációs rendszer kifejlesztése. A realizáció során számos olyan probléma mer¨ ult fel, melyek megoldása tudományos megközel´ıtést igényelt, s amelyek megoldása nélk¨ ul a tudományos kutatómunka nem lenne elvégezhet˝o a valósidej˝ u feltételek és beltéri kör¨ ulmények mellett. Ezeket az eredményeket mutatja be a harmadik téziscsoport. A háromdimenziós helyzet le´ırása magában foglalja a térbeli orientáció kezelését. A robotikai, képfeldolgozási és grafikai alkalmazások vonatkozó részeiben meg kell oldani az inverz Rodrigues feladatot. Az elterjedt algebrai módszereknél pontosabb, illetve biztonságosabb, geometriai szemlélet˝ u módszert adtam a feladat megoldására. A képpáros´ıtási feladat során legtöbbször epipoláris viszonyoknak megfelel˝o modell illeszkedik a mérésekre. A mérési eredményekb˝ol el˝oáll´ıtott esszenciális mátrix dekompoz´ıciója sz¨ ukséges a térbeli elrendezés kiszám´ıtásához. Az irodalomban elterjedt algebrai megoldás jelent˝os hibákat okozott, ezért ezeket egy geometriai szemlélet˝ u megoldással kellett megsz¨ untetni. A tézicsoport további részében a helikopter vizuális navigációjának valósidej˝ u m˝ uködéséhez sz¨ ukséges eredményeket mutatom be. A kutatás alatt fejlesztett képfeldolgozó f¨ uggvénykönyvtár számos olyan u ´jszer˝ u elemet tartalmaz, amelyek alkalmazása növeli az egyes implementációk min˝oségét és csökkenti a futásid˝ot. A futásid˝o csökkenése azért is jelent˝os, mert sok más modellillesztési feladatban használható a robusztusság növelésére. A kifejlesztett f¨ uggvénykönyvtár két f˝o komponense a képek manipulálását grafikus proceszszorokon végz˝o és a mátrixokkal kapcsolatos szolgáltatásokat ny´ ujtó modulokból a´ll.

6. a´bra. A robothelikopter felkapcsolt markerekkel. (A sz´ınek beégésének elkerüléséhez a zárid˝ot le kell venni, emiatt zajos a kép)

2.3 Robothelikpter navigációja

15

´ algoritmusokat és valósidej˝ 3. T´ eziscsoport. Uj u módszereket dolgoztam ki beltéri auton´ om négyrotoros helikopterek vizuális navigációjának megvalós´ıtásához. A gyakorlatban széles körben elterjedt algoritmusokat korrigáltam, hogy elker¨ uljem ezek nem megfelel˝o m˝ uködését a pontosság és a biztonság növelése érdekében. Egyes kifejlesztett módszereket grafikus proceszszorokra u ¨ltettem át, hogy lehet˝ové váljon beltéri légi robotok poz´ıciójának és orientációj´ anak valósidej˝ u szám´ıtása, akár 100 fps (képkocka/másodperc) sebességgel is. Kapcsolódó publikációk : [S6, S2, S3, S10, S1] 3.1. T´ ezis. Geometriai megoldást adtam az inverz Rodrigues feladat olyan szingularitásainak a kezelésére, amelyek éles alkalmazásokban kritikus hibákat okoznának. A kifejlesztett algoritmus egyszer˝ ubb, mint más megoldások. Bizony´ıtottam, hogy a módszer a helyes kimenetet szolgáltatja bármilyen bemenet mellett. ´ megoldást dolgoztam ki a sztereó képfeldolgozásban használt esszenci´ 3.2. T´ ezis. Uj alis mátrix dekompoc´ıciója pontosságának növelésére. A módszer mind az esszenciális m´ atrix által hordozott információt, mind pedig a pont-pont megfeleltetéseket felhasználja, m´ıg a szokványos megoldások az utóbbi adatokra nem támaszkodnak. Egy egzakt és egy lineariz´ alt megoldást is kidolgoztam. 3.3. T´ ezis. Tudományos igények megfogalmazása seg´ıtségével u ´jszer˝ u valósidej˝ u megoldásokat fejlesztettem ki, melyek autonóm négyrotoros beltéri robot-helikopterek irány´ıtási és navigációs kérdéseinek kutatásához alkalmazhatók. Ezen megoldások seg´ıtségével olyan mérések, illetve k´ısérletek is elvégezhet˝ok, amelyekre korábban nem volt lehet˝ oség a fennálló valósidej˝ u korlátozások és beltéri peremfeltételek mellett. Egyes kifejlesztett módszereket grafikus processzorokon valós´ıtottam meg, melynek eredményeképpen a beltéri légi robotok poz´ıciója és orientációja akár négy kamera egy¨ uttes képfriss´ıtésének u ¨temében is számolható. Az elért futási id˝o jól illeszkedik az inerciális mér˝oegység mintavételezéséhez és az irány´ıtási algoritmus id˝oz´ıtéséhez.

(a)

(b)

7. ábra. Az el˝ofeldolgozás közben kiadódó képek részletei

´ 3 ALKALMAZAS

16

3.

Alkalmaz´ as

Az els˝o téziscsoport elméleti eredményeinek alkalmazására keretrendszert fejlesztettem, mely az egyes képrészletekb˝ol kinyert geometriai mennyiségeket felrajzolja a képekre. Ennek seg´ıtségével vizsgálhatók az adott módszer képességei, illetve robusztussága. A második téziscsoport (képpáros´ıtási képességek) eredményei részben elméleti, részben gyakorlati jelleg˝ uek. Az ilyen módszerek ellen˝orzése kizárólag a gyakorlati teljes´ıtmény¨ uk alapján mérhet˝o, ezért a kutatómunka egyik fontos része volt, hogy egy m˝ uköd˝o képpáros´ıtási rendszer le´ıró-generáló kompnenseit lecseréltem a SAFT detektorra. A rendszert számos egyéb helyen kellett módos´ıtani, hogy a paraméterek automatikus tesztelése lehet˝ové váljon. Az ´ıgy el˝oa´llt rendszerben statikus térbeli jelenetekr˝ol kész¨ ult képek közötti geometriai viszony emberi beavatkozás nélk¨ ul meghatározható a SAFT detektor használatával. A radiális torz´ıtás korrekciója még nem automatikus, az optikát off-line kalibrálni kell a használt ny´ılásszög f¨ uggvényében. A bemutatott eredmények a Budapesti M˝ uszaki Egyetem Irány´ıtástechnika és Informatika Tanszékén végzett OTKA K71762 (2008-2012) ”Autonóm földi, légi és vizi robotok korszer˝ u irány´ıtáselmélete és mesterséges intelligencia eszközei” kutatási projekt keretében részben alkalmazásra ker¨ ultek, illetve ezen kutatási projekt szempontjai alapján lettek kifejlesztve. Az OTKA K71762 támogatásért ez´ uton is szeretném kifejezni köszönetemet. Az elkész¨ ult robothelikopter-protot´ıpus irány´ıtásának fejlesztése, illetve kutatása jelenleg is az itt bemutatott vizuális navigációs megoldások használatával történik. A rendszer pár milliméteres pontossággal, illetve 100 fps sebességgel detektálja a helikopter helyzetét. A helikopteren 9 marker van elhelyezve, bármelyik kitakarása esetén is helyes eredményt ad a rendszer. A rendszer már több rep¨ ulési o´rát abszolvált, a képfeldolgozás eseti hibái mindig abból adódtak, ha t´ ul sok marker vált a kamera által láthatatlanná. Jelenleg a rendszer egy kamera képe és több felszállás el˝ott felvett kép alapján m˝ uködik. Lényeges kiemelni, hogy a jöv˝oben fomációban haladó járm˝ uegy¨ uttesek képfeldolgozási feladatainak valósidej˝ u ellátását kell a rendszernek megvalós´ıtania, az eddig elkész¨ ult részek ennek szem el˝ott tartásával kész¨ ultek. A munka szakmai tartalma kapcsolódik a ”Min˝oségorientált, összehangolt oktatási és K+F+I stratégia, valamint m˝ uködési modell kidolgozása a M˝ uegyetemen” c. projekt szak´ ´ mai célkit˝ uzéseinek megvalós´ıtásához. A projekt megvalós´ıtását az UMFT TAMOP-4.2.1/B09/1/KMR-2010-0002 programja támogatja. A kutatási eredmények nemzetközi és hazai idegennyelv˝ u folyóiratcikkek és nemzetközi konferenciacikkek révén váltak ismertté a tudományos életben.

´ PUBLIKACI ´ OK ´ SAJAT

17

Saj´ at publik´ aci´ ok [S1] P. Fodor and Z. Prohászka. Mátrixm˝ uveletek integrálása a gpcv++ képfeldolgozási könyvtár fejlesztése során. In Proceedings of: 7th Conference of Hungarian Association ´ for Image Processing and Pattern Recognition (KEPAF2009), pp. 1–8, 2009. [S2] L. Kis, Z. Prohászka, and G. Regula. Calibration and testing issues of the vision, inertial measurement and control of an autonomous indoor quadrotor helicopter. In Proceedings of: RAAD 17th International Workshop on Robotics in Alpe-Adria-Danube Region, pp. 1–10, 2008. [S3] L. Kis, Z. Prohászka, and G. Regula. Calibration and testing issues of the vision, inertial measurement and control system of an autonomous indoor quadrotor helicopter. International Journal of Mechanics and Control, 1(10):29–38, 2009. [S4] Z. Prohászka. Connection of the harris detector-based affine adaptation and the self affine feature transform Accepted to: 8th Conference of Hungarian Association for Image ´ Processing and Pattern Recognition (KEPAF-2011). [S5] Z. Prohászka. Formulation of 3d and projective extensions of the self affine feature transform Accepted to: 8th Conference of Hungarian Association for Image Processing ´ and Pattern Recognition (KEPAF-2011). [S6] Z. Prohászka. Qnx-based realization of the control system of a puma-like robot. In Proceedings of: RAAD 11th International Workshop on Robotics in Alpe-Adria-Danube Region, pp. 399–404, 2002. [S7] Z. Prohászka. Affine invariant features from self-flow. In Proceedings of: RAAD 17th International Workshop on Robotics in Alpe-Adria-Danube Region, pp. 1–10, 2008. [S8] Z. Prohászka. Fine tuning of quasi linear feature descriptors. In Proceedings of: 7th Conference of Hungarian Association for Image Processing and Pattern Recognition ´ (KEPAF2009), pp. 1–8, 2009. [S9] Z. Prohászka. Matching image details with the self affine feature transform. In Proceedings of: V. Magyar Szám´ıtógépes Grafika és Geometria Konferencia, pp. 206–213, 2010. [S10] Z. Prohászka and A. Kerti. Development of the gpu based gpcv++ image processing library. In Proceedings of: IV. Magyar Szám´ıtógépes Grafika és Geometria Konferencia, pp. 102–107, 2007.

18

´ PUBLIKACI ´ OK ´ SAJAT

[S11] Z. Prohászka and B. Lantos. Extracting geometric information from images with the novel self affine feature transform. Accepted to: Periodica Polytechnica, Electrical Engineering, 2010. Accepted:2010 Feb.

´ IRODALOMJEGYZEK

19

Irodalomjegyz´ ek [1] H. Bay, A. Ess, T. Tuytelaars, and L. Van Gool. Surf: Speeded up robust features. Computer Vision and Image Understanding (CVIU), 110(3):346–359, 2008. [2] R. Blake and R. Sekuler. Perception. McGraw-Hill, 5 edition, 2005. [3] C. Harris and M. Stephens. A combined corner and edge detector. In 4th Alvey Vision Conference, pages 147–151, 1988. [4] R. I. Hartley and A. Zisserman. Multiple View Geometry in Computer Vision. Cambridge University Press, ISBN: 0521540518, second edition, 2004. [5] Y. Ke and R. Sukthanar. Representation for local image descriptors. In Proc. Conf. Computer Vision and Pattern Recognition, pages 511–517, 2004. [6] Tony Lindeberg. Detecting salient blob-like image structures and their scales with a scale-space primal sketch:a method for focus-of-attention. International Journal of Computer Vision, 11(3):283–318, 1993. [7] Tony Lindeberg. Scale-space theory: A basic tool for analysing structures at different scales. Journal of Applied Statistics, 21(2):225–270, 1994. [8] D. Lowe. Object recognition from local scale-invariant features. In Int’l Conference on Computer Vision, pages 1150–1157, 1999. [9] B. D. Lucas and Takeo Kanade. An iterative image registration technique with an application to stereo vision. In Imaging Understanding Workshop, pages 121–130, 1981. [10] J. Matas, O. Chum, M. Urban, and T. Pajdla. Robust wide-baseline stereo from maximally stable extremal regions. In Proc. of BMVC-02, pages 384–393, 2002. [11] Krystian Mikolajczyk and Cordelia Schmid. An affine invariant interest point detector. In Proceedings of the 7th European Conference on Computer Vision, pages 128–142. Springer, 2002. Copenhagen. [12] Krystian Mikolajczyk and Cordelia Schmid. A performance evaluation of local descriptors. IEEE Transactions on Pattern Analysis and Machine Intelligence, 10(27):1615– 1630, 2005.

mobilis robotikai alkalmazásokhoz

Recommend Documents