MISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR
TUDOMÁNYOS DIÁKKÖRI DOLGOZAT
Szerelőcella fejlesztése alakfelismerő rendszerrel Sztankovics István II. éves Gépészmérnök (MSc) hallgató
Konzulens: Dr. Kundrák János egyetemi tanár Dr. Deszpoth István mérnöktanár Gépgyártástechnológiai Tanszék
Miskolc, 2010
Tartalomjegyzék: 1. Bevezetés ....................................................................................................................... 3 2. Képfeldolgozó rendszer alkalmazhatósága a gyártásban ............................................... 4 2.1. Képjavítási eljárások............................................................................................... 6 2.2. Geometriai korrekciók .......................................................................................... 10 2.3. Szegmentálás ........................................................................................................ 12 2.4. Képosztályozás ..................................................................................................... 18 3. Alakfelismerés alkalmazása szerelőcellában ............................................................... 20 3.1. Szerelési feladat rövid bemutatása ....................................................................... 20 3.2. Szerelés ütemideje ................................................................................................ 22 3.3. Konklúzió ............................................................................................................. 24
-2-
1. Bevezetés A szerelőrendszerek automatizálásában nagy szerepe van az alkatrészek pontos helyzetének biztosításának. Ezt legegyszerűbben megfelelő készülékezéssel érhetjük el. Azonban a gyártás rugalmasságát ez a módszer jelentősen csökkenti, mivel minden új féle darabhoz új készüléket kell készítenünk. Ez hosszútávon jelentős költséggel is jár. Lényegesen egyszerűbb megoldás lehet a kritikus pontokon alakfelismerő rendszer alkalmazása. Így a rendszer maga képes eldönteni, hogy a munkadarab helyzete megfelelő-e, illetve ha nem, akkor milyen változtatást szükség végrehajtania. Egy robotos állomásnál elegendő az irányító program frissítése, és máris új féle alkatrészt képes beszerelni. A dolgozatom célja a Gépgyártástechnológiai tanszék laborjában található szerelőcella fejlesztése alakfelismerő rendszerrel, valamint e rendszer által nyújtott lehetőségek felmérése. Ehhez részletesen ismertetem a rendszer által használt különböző módszereket, mellyel az érzékelt kép alapján lehetőség van a szerelést végző robot működését befolyásolni. Megvizsgálom, a képfeldolgozó rendszerek alkalmasak-e a szerelési folyamat műveleteinek hatékonyságának növelésére. Ezt követően egy rövid példán bemutatom, milyen hatással van a szerelés ütemidejére egy ilyen rendszer beépítése. Ennek ismeretében mérlegelem a rendszer által nyújtott előnyöket és hátrányokat.
-3-
2. Képfeldolgozó rendszer alkalmazhatósága a gyártásban A számítógépes képfeldolgozáson kétdimenziós, digitális képek létrehozását és feldolgozását értjük. Így két ága van: a számítógépes grafika és a digitális képfeldolgozás. Előbbi mesterséges képek létrehozását jelenti számítógép segítségével. Utóbbi természetes képek elemzését jelenti. Vagyis így a látás automatizálható. A célkitűzés megvalósításához a második tevékenységre van szükség, így részletesebben azzal foglalkozom. A digitális képfeldolgozáson belül három szintet lehet elkülöníteni. A folyamat fizikai szintjén találhatóak a képátalakító módszerek. A kiindulás valamilyen analóg kép, amelyet digitalizálunk. A cél a lényeges képinformációkat megőrző átalakítás, előfeldolgozás. Az eljárások lehetnek lokálisak vagy globálisak. A következő szint a képosztályozás az objektum sajátosságai alapján. Ennek egyik módszere az alakfelismerés, amely makro tulajdonságokat vizsgál. Másrészt lehet textúra elemzés is, mely a kép mikro szerkezetének leírására szolgál. Legmagasabb szintje a képfeldolgozásnak a képfelismerés. Ennek keretében lehetséges az objektum azonosítása valós tárgyal. Ehhez azonban elengedhetetlen megfelelő tudásbázis megléte. A digitális képfeldolgozás alapja a kép létrehozása és megjelenítése. A természetes kép analóg, térben (x, y, z) és időben (t) folytonos, különböző színezeteket (k) tartalmazó jel, függ a megfigyelés irányától (n). A digitalizálás során előbb kétváltozós függvénnyel leírhatóvá válik (x, y) a kép, majd a mintavételezés h(k, l) és kvantálás q(k, l) történik meg. Ahhoz hogy újra látható legyen, analóg jellé kell visszaalakítani.
-4-
A képfeldolgozás első lépéseként képpontokra kell felbontani az analóg képet, azaz a képsík meghatározott pontjain mintát veszünk. Monokróm esetben fénysűrűséget, színes esetben színt mérünk, méghozzá három színre bontva. Mint minden mérés, a fenti művelet is hibával jár. Az ideális mintavételt az alábbi konvolúciós függvény írja le: [1]
h ( k , l ) f ( x, y ) t ( x, y )
( x mx, y ny ) f ( x, y )dxdy
m n
(1)
f (mx, ny )
m n
ahol:
t(x,y) – mintavételi függvény δ – Dirac delta k = mΔx , l = nΔy – mintavételi pontok
A
képfüggvényeknek
két
fontos
tulajdonsággal
kell
rendelkeznie:
stacionáriusnak és gyengén sávkorlátosnak kell lennie. Utóbbi hatására a végtelen összegzés problémája áthidalhatóak. A fenti vizsgálatokat frekvenciatartományban végzik. A képfeldolgozás második lépéseként az A/D átalakító összehasonlítja a jelamlitudókat a lehetséges kimeneti szintjeivel. Ez a folyamat, a kvantálás, további információvesztéssel jár.
-5-
2.1. Képjavítási eljárások
A képfelvételi körülmények, valamint a mintavételező- és kvantáló rendszerek jelentősen befolyásolják a keletkezett digitális kép minőségét. A helyreállítás célja, hogy az adott képből létrehozzuk azt az ideális képet, mely zavaró hatások nélkül keletkezne. Ehhez szükséges a torzító hatásokat leíró matematikai modell kialakítása, majd ennek inverz transzformációját kell alkalmazni a zajok szűréséhez. Valóságban azonban lehetetlen teljes körű torzító modell megalkotása. A képjavítás során a képet a kiértékelés szempontjából kedvezőbb formába hozzuk. Nem cél az ideális kép elérése, elegendő a meghatározott jellegzetességek hangsúlyozása, és így a fontos dolgok kiemelése. Az eljárás történhet frekvenciatartományban vagy képtartományban. Előbbi a konvolúcióelméleten alapszik, mivel a konvolúciós integrál ebben a tartományban szorzássá alakul: [1] g ( x, y) h( x, y) f ( x, y)
(2)
A cél olyan h(x, y) függvény keresése, mellyel elérhető, hogy g(x y) valamilyen szempontból előnyösebb tulajdonsággal rendelkezik, mint (f(x, y). A képtartományban történő képjavító eljárások az elvégzendő művelet célját veszik figyelembe. Elsősorban kontrasztfokozó, zajelnyomó, és él kiemelő eljárásokat különböztethetünk meg. Mivel a szereléstechnológiai képfeldolgozásban ezen eljárások fontosak, így ezeket részletesebben is bemutatom. Kontrasztfokozás: Leggyakoribb képhiba a fényvesztésből adódó kontrasztszegénység. Ennek megoldására értelmeznünk kell egy hisztogramot, mely a világosságkódok eloszlását
-6-
adja az adott képen. Annyi elemű, amennyi a világosságkódok értékkészlete, jelöljük ezt {Q} = {0, 1, …, J}-vel. Értelmezzük továbbá a sűrűségfüggvényt:
J
X (q) N
X (q) N q
és
q 0
ahol:
(3)
q – világosságkód Nq – q világosságkódú pontok száma N – összes képpont száma
Továbbá:
X (q)
c Nq N
feltéve, hogy c=1:
J
X (q) 1
(4)
q 0
Ha a valószínűségi változót folytonosként kezeljük, akkor P a valószínűsége, hogy q és q+Δq közé esik. Vagyis:
s( ) lim q 0
P(q q q) q
(5)
Ez utóbbi a (4) hányadossal közelíthető. A hisztogramot lépcsős függvénnyel közelítjük, a vízszintes tengelyre a világosságkódokat mérjük fel, a függőlegesre az adott q világosságkódú képpontok relatív gyakoriságát. Javulhat a kontraszt a világosságkódok újraskálázásával. Ez egy transzformáció a bemeneti kódokon, így módosul az intervallum. Leggyakoribb a szakaszonkénti lineáris transzformáció. Másik módszer a képpontok küszöbök szerinti átszínezése, vagyis a képvágás.
-7-
Zajelnyomás Képhibák létrejöttének másik gyakori okozója a képen található zaj. Ennek jelentése, hogy véletlenszerű pontokban a kép eredeti világosságkódja megváltozik. Megoldásként a legjobb az eltávolításuk lenne, azonban ha erre nincs mód, akkor elegendő hatásuk csökkentése is. Ez a módszer a simítás, mely történhet a frekvenciatartományban vagy a képtartományban. Fontos azonban megjegyezni, hogy alkalmazásuk csakis gondos megfontolás után lehetséges, mivel adatvesztéssel járhat nem megfelelő használatuk. Előbbi alapja, hogy a zaj a kódokban jelentkező éles átmenetben figyelhető meg, így a kép Fourier transzformáltjának magas frekvenciás tagjai árulkodnak jelenlétükről. Ezért a megoldás egy aluláteresztő szűrő, mely a magas frekvenciás tagokat levágja. Ideális akkor egy ilyen szűrű, hogyha az átviteli függvénye egy adott frekvencia fölött 0, alatta pedig 1. Hátránya ezeknek az eljárásoknak a nagy számítási igény, mely orvoslására különböző gyorsítási eljárásokat dolgoztak ki, mint például a Fourier-transzformáció. Képtartományban végzett simításkor hasonló történik, mint az előbb leírtaknál. A lehetőségek között gyakorlati szempontok alapján szoktak mérlegelni. Itt legelterjedtebbek a konvolúciós szűrők: [1]
r (k , l )
m
n
q(k s, l t )T (s, t )
(6)
s m t n
ahol:
T – szűrőtag s,t – eltolások q – világosságkód k,l – mintavételi pontok
Tehát a képpont világosságkódja a környezetében lévő pontok kódjának súlyozott átlagával módosul.
-8-
Élkiemelés A határátmenetek kiszélesedésével és elmosódásával torzítás jelentkezik. Élkiemeléssel az egyes objektumok közötti átmeneti tartomány szűkíthető, meredekebbé tehető. Gyakran szegmentálással együtt használják. Ez az eljárás is történhet frekvencia- és képtartományban. Előbbi eset a Fourier transzformált használatán alapszik. Az él a kép magasabb frekvenciatartományában helyezkedik el, tehát felül áteresztő szűrűvel elérető az élesítés. Az ideális szűrő függvénye egy határfrekvencia alatt 0, fölötte 1. Képtartományban
differenciálást
használó
eljárás
jöhet
szóba.
Ehhez
leggyakrabban a gradienst illetve a Laplace-operátort használják. Az élkiemelő függvény: [2] D(k , l ) q(k , l ) 2 q(k , l )
ahol:
(7)
q – világosságkód k,l – mintavételi pontok 2 q(k , l ) q(k 1, l ) q(k 1, l ) q(k , l 1) q(k , l 1) 4q(k , l )
Használható még élkiemeléshez statisztikus differeenciáloperátor is. Ebben az esetben a képpont korrigált világosságkódja úgy adódik, hogy elosztjuk a környezetében lévő képponjtok kódjának eloszlása alapján meghatározott szórással.
-9-
2.2. Geometriai korrekciók
A geometriai korrekciók a leggyakoribb kép-helyreállítási eljárások. Céljuk az ideális kép létrehozása, mely leképzési hibáktól mentes. Alkalmazásuk akkor szükségszerű, ha a valós méretarányokat akarjuk létrehozni. Fő okai a következőek lehetnek: -
képfelvevő rendszer optikai hibája
-
perspektívikus torzítás
-
felvétel közben az objektum elmozdulása
A képjavítási módszerekkel ellentétben itt nincs szükség a torzítás okainak vizsgálatára. A korrekció során a bemenő képet áttranszformáljuk a kimenő képre annak érdekében, hogy a megengedettnél nagyobb mértékben a kép által hordozott információ ne sérüljön. Hátrányuk jelentős számításigényük, mivel általában nem lineárisak. A korrekció két lépésben történik. Első lépésként a digitális képet visszaalakítják analóg képpé, mellyel szemben elvárás, hogy az eredetit legjobban megközelítse. Ez az eljárás a koordináta-transzformáció. Második feladatként következik a kapott analóg kép újra-mintavételezése és újra-kvantálása. Ezzel végrehajtható a visszaállítás és az újradigitalizálás. Koordináta-transzformáció Az eljárás lényege röviden: a kép adott P1 (x1,y1) pontjához a P2(x2,y2) pontot rendeljük. Vagyis ez egy leképzés két vektortér (V,W) között a valós számtest felett: L:V»W
- 10 -
Ez a leképzés lineáris transzformáció, ha fennáll: L ( 1 2 ) L ( 1 ) L ( 2 )
(8)
L( 1 ) L( x1 )
ahol:
χ1,2 – tetszőleges λ – tetszőleges valós szám
A P1 és a P2 pont között az alábbi 2x2-es mátrix teremt kapcsolatot: a a A 11 12 a21 a22
Erről a következő megállapításokat tehetjük: -
ha a12=a21=0
léptékváltásról van szó, a11,a22>1 esetén nagyítás,
a11,a22<1 esetén kicsinyítés -
ha a11 vagy a22 <0
tükrözés az y vagy x tengelyre
-
ha a11 vagy a22 =0
projekció, a kép elfajul
-
ha a11=a22=cosφ vagy a12=-a21=cosφ
origó körüli forgatás
Homogén koordináták A pont homogén koordinátái az (x/h,y/h), mely az (x,y,h) számhármas síkbeli megfelelője. Mátrix formátumra áttérve: a11 a12 a 21 a22 a31 a32
a13 A a23 a33 a31 a32
a13 a23 a33
A homogén koordináták mátrixa négy fő részre particionálható. Az „A” mátrix esetleges eredményeit az előző pontban ismertettem. Az a31 és a32 eltolást, az a33 léptékváltást eredményez. Az a13 és a23 segítségével centrális projekciót valósíthatunk meg, vagyis a pont origótól való távolságát befolyásolja.
- 11 -
2.3. Szegmentálás
A szegmentálás a képpontok valamilyen sajátságvektor szerinti osztályozását, majd az osztályokra nézve összefüggő tartományok megkeresését jelenti. Az alapelv kiindulási gondolata, hogy a digitális kép a természetes kép leképezése. A szegmentálással nyert objektumok valós tárgyakat határoló sík vagy görbült felületeknek, textúra elemeknek a síkbeli leképzései lesznek. Az eljárás két problémába ütközik: egyrészt a redundancia, másrészt a harmadik dimenzió hiánya. A szegmentálás három lépésből áll. Először a sajátságvektort kell meghatározni, leggyakrabban ez a világosságkód, hisztogram vagy gradiens. Továbbá szükséges a távolságfüggvény megadására. Küszöböt is definiálni kell, mely lehet statikus vagy dinamikus. Meg kell adni továbbá az összefüggéseket kijelölő osztályjellemzőket. Második lépés az osztályozás. Ennek során a képpontokat hozzárendeljük az osztályokhoz úgy, hogy az s távolság elég kicsi. Előre definiált jellemzőkkel kell dolgozni. Harmadik lépés az összefűzés. Itt megkeressük az egyes osztályokba sorolt képpontok összefüggő halmazait, ennek eredményeként foltokhoz vagy élekhez jutunk. Az eljárás feladata négy főcsoportba sorolható. Ezek: foltkeresés, foltelemzés, mintaillesztés, élkeresés. Foltkeresés Foltnak nevezzük az egy osztályba tartozó összefüggő tartományt alkotó képpontokat, melyek a sajátságra nézve homogének. A folt elemeit értékesnek nevezzük, a többi pont a háttérpont. Ideális esetben a folt homogén, nem tartalmaz lyukakat, valamint a határpontok kellően sima görbeívet alkotnak. A gyakorlatban ez a két feltétel általában nem teljesül.
- 12 -
A foltkereső eljárás lehet globális vagy lokális, attól függően, hogy a kép mekkora tartományát vizsgáljuk. Globális eljárás során gyakorlatilag figyelembe vehető globális képjellemző a hisztogram. Olyan képek esetén ad kielégítő megoldást, amelyeken kevés féle objektum található, és a háttér homogénnek tekinthető. Ilyen esetben a hisztogramon jellegzetes csúcsok és jól meghatározott völgyek találhatóak. Első lépésként ezek helyzetét kell meghatározni, így állapítjuk meg az osztályok sajátszínét, valamint a küszöbök
értékeit.
A
vágási
küszöb
meghatározható
a
szórásnégyzetek
minimalizálásával, ha a kép két csúccsal rendelkezik. Az eljárás levezetéséhez definiálandó az x(q) világosságkódok relatív gyakorisága, μH feltételes várható értékük, a világosságkódok maximális értékéig (J) összegezve. Így: J
J
x(q ) 1
H qx(q)
q 0
(9)
q 0
Először definiáljuk a k küszöbszámot a két szintre vágáshoz, valamint a várhatóérték és a szórásnégyzetet.
k
k
qx(q) S1 q 0
S1 x(q)
1
q 0
S2
J
x(q) 1 S1
q k 1
2
J
qx(q) q k 1 S 2
(q 1 ) 2 x(q ) S1 q 0
(10)
(q 2 ) 2 S x(q ) q k 1 2
(11)
k
12
22
J
A fentiek alapján az osztályok átlagos együttes szórásnégyzete, a különbözőségi szórásnégyzet, valamint a teljes hisztogram szórásnégyzete: A2 12 S1 22 S 2
(12)
D2 ( H 1 ) 2 S1 ( H 2 ) 2 S 2
(13)
H2 ( H 1 ) 2 S1 ( H 2 ) 2 S2
(14)
- 13 -
A vágási küszöb, valamint a megoldandó szélsőérték feladat:
D2 max H2
(2 1 ) 2 S1S 2 max
(15)
Így a diszkrét változó várható értéke: 12 S1 2 2 S 2
(16)
Optimálisnak nevezzük a vágást, ha az osztályok várható értékének a különbsége a lehető legnagyobb, a szórásnégyzetük minimális. Nehézség, hogy a csúcsok helyét nehéz pontosan kijelölni. A leírt globális eljárás hibája, hogy a folytonossági követelményeket nem tudja betartani, a homogén tartományok kilyukadhatnak, a határvonalak zajosak lehetnek, valamint a kelleténél jobban kiszélesednek. Lokális eljárás során a kép egy adott tartományát vizsgáljuk. Egyszerű összefűzésről van szó, ha két képpontot kötünk össze, melyeknek s távolságuk elég kicsi. Ennek bővített, kombinált módszere, ha egy m*x régiót fűzünk össze. Területnövesztő módszerek azok a módszerek, melyek során a még nem osztályozott képpontokat a már kialakított tartományokhoz fűzzük. Ez a növesztés rendszerint soronként történik, az alábbi elvek szerint: -
új tartomány képződik, ha a pont egyik tartományhoz sincs közel
-
ha csak egy tartományhoz van közel, hozzáfűződik
-
ha mindkettőhöz elég közel van, akkor a közelebbihez fűződik, illetve ha egyenlő a távolság, akkor új tartomány keletkezik.
A lokális és globális módszereket együtt, hibrid módon szokás használni.
- 14 -
Foltelemzés További feldolgozás előtt korrigálni kell a szegmentálás eredményét, ha foltok nem felelnek az objektumoknak. Ennek oka legtöbbször a térben közeli vagy egymást takaró tárgyak. A korrigálás az előbbiekben ismertetett területnövesztő eljárás fordítottja. Ha a valós objektumok konvexek, akkor a túl nagy konkáv foltokat szét lehet vágni. Minden lépésben a foltok külső rétegén a határpontokat hámozzuk le. Ennek az eljárásnak a jósága nagyban függ a távolságfüggvénytől és a szomszédság jó meghatározásától. Négy vagy nyolcszögtávolságot használnak általában, így egyenletes a zsugorodás. Végül egyedi pontokhoz jutunk, melyek a csomópontok. Ezek közül a szignifikánsak kijelölhetőek, és ezekből kiindulva foltnövesztést hajthatunk végre. A számozatlanul maradt pontokat 0-val jelöljük. A két csomópont között maradó, 0val jelölt pontok vágóvonalat adnak, ha vonalvékonyító eljárást alkalmazunk. Mintaillesztés A mintaillesztés a geometriai jellemzők szerinti osztályozás. Az objektum képe a mintatárban áll rendelkezésre, így az osztályozás összehasonlítással történik. A cél a mintához legjobban hasonlító alakzat találása. A problémát az jelenti, hogy az objektum mérete, állása tetszőleges, a mintáé meghatározott. Az illesztés jósága mérhető a képrészlet és a minta képpontjai közötti távolsággal. Így definiálható a az illeszkedés pontossága, melynek jele D legyen. Továbbá q(k,l) a digitális képfüggvény, az M(s,t) a (2m+1)*(2n+1) méretű ablakon értelmezett minta. Így p metrikát használva:
D( k , l )
m
n
p(q(k s, l t ) M (s, t ))
s mt n
- 15 -
(17)
Másik gyakori érték a normalizált keresztkorrekciós együttható:
m
N (k , l )
n
q ( k s, l t ) M ( s, t )
s mt n
m n 2 2 q ( k s , l t ) M ( s, t ) s mt n s mt n m
n
(18)
N(k,l)=1 akkor és csak akkor, ha q(k+s,l+t)=cM(s,t), vagyis a képrészlet megegyezik a mintával egy konstans szorzótól eltekintve. Gyakorlatban ez a szigrú szabály ritkán teljesülne, ezért elfogadjuk a N(k,l)>1-x esetet is, ahol x egy előre meghatározott állandó. Az algoritmus használata akkor ütközik akadályba, ha a kép a mintához képest el van fordulva. Élkeresés Élkeresésről akkor beszélünk, ha a szegmentálás különbségi jellemzők alapján történik. Az élek a foltok kontúrvonalai, folytonosak és zártak, valamint élpontokból állnak. Ezen pontokat azon helyeken kell keresni, ahol a sajátvektorok ugrásszerűen változnak. Ezen eljárások általában lokálisak, így nagyon zajérzékenyek. Másik problémát jelenthet az a tény, hogy az élpontok nem alkotnak folytonos vonalat. A gyakorlatban alkalmazott eljárások kétfázisúak: első fázisban az élgyanús pontokat jelölik ki, majd ezt követően alakítják ki a valódi éleket. Két fő módszer alakult ki: gradiens módszerek és iránykereső módszerek. Előbbi esetben a (k,l) pontot akkor minősítik élpontnak, ha ott a gradiens szerinti normája egy adott küszöbnél nagyobb. Az él iránya merőleges a gradiens irányára. A normát a gyakorlatban a parciálisok abszolút értékének összegével közelítik. A ilyen típusú közelítések legfőbb hibája, hogy a vizsgált pontra nézve aszimmetrikusak.
- 16 -
Az iránykereső módszerek lényege, hogy különböző irányokban vizsgálják az átmeneti görbe meredekségét. Az élpontokat ott jelölik ki, ahol a meredekséggörbének maximuma van. Ha 8 konvolúciós szűrőt alkalmazunk egy pont körül, akkor az adott q(k,l) pont akkor élgyanús, ha: max J (q(k , l ) M J ) k
(19)
J 0,1,...,7
Az élkorrekciók célja a folytonos, kellően sima kontúrvonalak előállítása. A kapott élpontokat a megfelelő görbével összekötve kapjuk meg a folytonos éleket. Ezen görbék közül a legegyszerűbb a szakaszonkénti lineáris közelítés. A gyakran alkalmazott polinomos közelítés azt a tételt használja ki, hogy r+1 ed fokú polinom ráfektethető r számú pontra. Ez így a gyakorlatban nem áll fönn, a pontszám jóval több, mint a fokszám. A görbeillesztésre a legkisebb négyzetes hibájú módszert használják. Ennek során az egyes pontok és a görbe távolságának négyzetösszegét minimalizálják. Legyen {kj,lj}; j=1,2,…,r a közelítő pontok halmaza, r a pontok száma, m a főszám. Ekkor a következőnek kell teljesülnie:
r
e a0 a1k j ... am k j j 1
l
2
m
- 17 -
j
min
(20)
2.4. Képosztályozás
Az elemzési szinten a képosztályozó eljárások két nagy csoportba sorolhatóak: alakfelismerés és textúraelemzés. Ezekkel lehetővé válik a kép lényeges jellemzőinek felismerése, így a kép leírása. Előbbiről akkor beszélünk, ha a sajátságok a kép makroszerkezetét, az objektumot jellemzik, melyhez a képet szegmentálni kell. Utóbbiról akkor van szó, ha a mikroszerkezetét vizsgáljuk a képnek. Módszereket tekintve két ágat különböztethetünk meg. Egyrészről lehet statisztikus valószínűség-számítást illetve a matematikai statisztikai módszereket alkalmazva, így az elemek eloszlását írja le. Másrészt lehet a textúraelemek viszonyaira koncentrálni, így szabályos textúrák esetén hatékonyabb az előzőnél. Az eljárások lépései a következőek: sajátságvektorok meghatározása mérése, majd az objektumok, textúrák besorolása, osztályozása. Statisztikus alakfelismerés Az osztályok teljes, statisztikus meghatározottsága esetén a Bayes féle döntési módszereket lehet használni. Részleges meghatározottság esetén távolságmérő módszerek használata szükséges. Minél több sajátosságot kell figyelembe venni, a számításigény annál nagyobb lesz. Így az osztályozás szempontjából legfontosabbnak tartott sajátosságokat kell csak megtartani, melyek dimenziócsökkentő módszerek lévén érhetőek el. Ezen módszerek alapja egy leképzés, legtöbbször lineáris operátorral. Az említett Bayes típusú döntések alapja a következő: Tegyük fel, hogy egy D döntéshalmaz létezik, és ez definiálja a mért objektumok lehetséges osztályait. A feladat egy leképezés előállítása, így a
- 18 -
sajátságtér egy eleméhez egy megfelelően kiválasztott D-beli elemet rendelünk. Ennek eredményeként az objektumot valamelyik lehetséges osztályba soroljuk. A döntésfüggvényről egyrészt feltételezzük, hogy a teljes n dimenziós téren értelmezve van, továbbá egyértelmű,, azaz 1 objektumhoz csak 1 osztályt rendel. A gyakorlatban eme függvényeknek sok, egymásnak ellentmondó követelményt kell kielégíteniük. Így olyan döntésfüggvényt kell választanunk, melynél a rossz döntések száma minimális. A távolságmérő módszerek a mintákról és az eloszlásokról semmit sem tételeznek fel. A döntés alapja a sajátságvektorok és a mintavektorok távolságának mérésén alapul, leggyakrabban euklideszi metrikával. Végül meg kell említeni a klaszterezést. Akkor használják, ha semmilyen előzetes információ nem adott az osztályba soroláshoz. Egy klaszterbe azokat az adatokat kell gyűjteni, amelyek nagyon hasonlítanak egymásra. Szintaktikus alakfelismerés Az eddigiekben ismertetett statisztikus módszerek alkalmazása összetett alakzatok kezelésekor nehézségekbe ütközik. A szintaktikus alakfelismerés más oldalról közelíti a problémát: a vizsgált objektumot olyan elemekre bontja, melyeket már nem célszerű tovább bontani. Így jönnek létre a képelemek. Eme képelemek közötti kapcsolatokkal írják le az objektumot. Az osztály a hozzá tartozó objektumok leírásának halmaza. A szintaktikus alakfelismerés lépései a következőek: -
képelemek meghatározása
-
osztályokat definiáló jelsorozatok meghatározása
-
nyelvtan megadása minden osztályhoz
-
osztályozandó objektum leírásának megválasztása
-
elemzés,
melyik
nyelvtan
jelsorozatot
- 19 -
generálja
az
objektumot
leíró
3. Alakfelismerés alkalmazása szerelőcellában Az elméleti alapok ismertetése után vizsgálatot végeztem az alakfelismerő rendszer alkalmazására egy szerelvény gyártástechnológiájában. A vizsgálat során a rendszer hatását tanulmányozom a szerelés ütemidejére. Ez az idő nagyon fontos mutatószám, különösen a tömeggyártásban. Az alakfelismerő rendszert alkatrészek, konkrétan fogaskerekek, tájolásánál használtam. A
vizsgálat
során
először
bemutatom
a
szerelési
feladatot,
majd
mozdulatelemzés segítségével megállapítom a szükséges időket alakfelismerés nélküli
és
alakfelismerést
használó
műveletek
esetén.
Végeredményként
megmondható, hogy a művelet ütemideje csökkenthető-e a rendszer alkalmazásával. 3.1. Szerelési feladat rövid bemutatása
A szerelendő szerelvény egy fogaskerék-szivattyú, mely az 1. számú ábrán látható. A rajzon a fedél rész nem látszik, a fogaskerekek jobb láthatósága miatt. A szerelés azon műveletét vizsgálom, melynek során a kerekek kerülnek helyükre.
1. ábra Szerelvény 3D-s modellje
- 20 -
A szerelési művelet lépései a következők (eltekintve a palettamozgatástól, hisz az mindkét esetben megegyezik): Alakfelismerő rendszer nélkül: 1. A jelű fogaskerék megfogása, felemelése 2. A jelű fogaskerék szerelési pozícióba vitele 3. A jelű fogaskerék behelyezése a megfelelő helyre 4. B jelű fogaskerék megfogása, felemelése 5. B jelű fogaskerék szerelési pozícióba vitele 6. B jelű fogaskerék behelyezése a megfelelő helyre, ügyelve a fogaskerekek kapcsolódására
Alakfelismerő rendszer segítségével: 1. A jelű fogaskerék megfogása, felemelése 2. A jelű fogaskerék szerelési pozícióba vitele 3. A jelű fogaskerék behelyezése a megfelelő helyre 4. B jelű fogaskerék megfogása, felemelése 5. B jelű fogaskerék kamera elé mozgatása 6. Képfeldolgozás, szükséges módosítások eszközlése 7. B jelű fogaskerék szerelési pozícióba vitele 8. B jelű fogaskerék behelyezése a megfelelő helyre A műveletet még bonyolíthatjuk, ha A jelű kereket is elmozgatjuk a kamera elé, és az esetleges megfogási pontatlanságot korrigáljuk. Most azonban feltételezem, hogy a megfogás a szerelési helyzetnek megfelelő, a kerék tengelye egybe fog esni a házban kialakított süllyeszték tengelyével. A műveletelemek ismeretében kalkulálható a szerelés tervezett ideje.
- 21 -
3.2. Szerelés ütemideje
Az ütemidő számításhoz a mozdulatanalízis módszerét alkalmazom. A műveletet elemi mozdulatokra osztja fel, minden egyes elemi művelethez hozzárendelve egy meghatározott időegységet (TMU = Time Measurement Unit, 1TMU = 1/100.000 óra), amely alatt az adott mozdulat elvégezhető. Így ezen időegységek összegeként kiadódik a teljes művelet szükséges ideje. A művelet felbontása úgy kell történjen, hogy minden részmozdulat fel legyen sorolva. Ezt követően táblázatból lehet kiolvasni az adott mozdulatot jellemző időegységet. Minden esetben mérlegelni kell, hisz adott mozdulathoz többféle lehetőség is tartozik, például annak függvényében, hogy az alkatrész szimmetrikus-e vagy hogy kezelhetősége mennyire bonyolult. Először az alakfelismerő rendszer nélküli megoldást vizsgálom meg. A mozdulatsort az 1. táblázatban foglalom össze. Az táblázat soraiból magyarázatra a 9. sorszámú szorul. Azért vettem nagyobbra a szükségesnél, mert mivel a kerék kis mértékben pontatlanul állhat, ezért több idő szükséges az óvatos behelyezéshez. 1. táblázat Művelet mozdulatelemzése alakfelismerés nélkül Sorszám 1 2 3 4 5 6 7 8 9 10
Művelet megnevezése Kar A jelű kerék felé nyúl A jelű kerék megfogása A jelű kerék ház fölé mozgatása Kerék behelyezése a megfelelő helyre Kerék elengedése Kar B jelű kerék felé nyúl B jelű kerék megfogása B jelű kerék ház fölé mozgatása Kerék behelyezése a megfelelő helyre Kerék elengedése
- 22 -
Jel R50A GC M50C P23B RL R50A GC M50C P33B RL
TMU 23,1 8,7 31,8 26,6 5,0 23,1 8,7 26,6 73,8 2,0 229,4
Az 1. táblázat alapján kiszámítható az alakfelismerés nélküli művelet műveleti ideje: t1 0,036 TMU 0,036 229,4 8,2584s
(21)
Ezt követően a következő, 2. számú táblázatban az alakfelismerő rendszerrel történő műveletvégzést írom le. A sorrend nyílván nagyban hasonlít az előbb ismertetettre, egyedül a 8, 9 és 10 pont jelent különbséget, mely az alakfelismerés folyamatát írja le. Szembeötlő, hogy így a második kerék behelyezése jóval kevesebb időt vesz igénybe, mivel a kerék most pontosan, a meghatározott helyzetben áll. Így lehetőség van a gyorsabb működésre is, az alkatrészek károsodásának veszélye nélkül. 2. táblázat Művelet mozdulatelemzése alakfelismeréssel Sorszám 1 2 3 4 5 6 7 8 9 10 11 12 13
Művelet megnevezése Kar A jelű kerék felé nyúl A jelű kerék megfogása A jelű kerék ház fölé mozgatása Kerék behelyezése a megfelelő helyre Kerék elengedése Kar B jelű kerék felé nyúl B jelű kerék megfogása B jelű kerék kamera fölé mozgatása Vizsgálat Számítás, majd szükséges elforgatás B jelű kerék ház fölé mozgatása Kerék behelyezése a megfelelő helyre Kerék elengedése
Jel R50A GC M50C P23B RL R50A GC M30C EF TSx M30C P11A RL
TMU 23,1 8,7 31,8 26,6 5,0 23,1 8,7 15,1 7,3 10,1 15,1 11,2 2,0 187,8
A 2. táblázat alapján kiszámítható az alakfelismeréssel végzett művelet műveleti ideje: t 2 0,036 TMU 0,036 187,8 6,7608s
- 23 -
(22)
3.3. Konklúzió
A (21) és (22) képlet összevetéséből az alábbi látszik: t1 8,2584 6,7608 t 2
(23)
Vagyis az alakfelismerő rendszerrel nagyjából másfél másodpercet lehet nyerni a szerelés műveleti idején, majdnem 20%-al csökkentve az eredeti időt. Elegendően nagy darabszám mellett ez az érték kellően nagy ahhoz, hogy a rendszer által igényelt ráfordítás behozza az árát. Az alakfelismerő rendszerrel a szerelőcella működése rugalmasabbá tehető, így például a hagyományos fogaskerekek helyett ovál-fogaskerekek szerelése is megvalósítható, ha a szerelvény tervezője utóbbi megoldás mellett döntene. Mindkét feladathoz használjuk ugyanazt a készüléket, megfelelő kialakítás esetén. A rendszer számításigénye bár magas, de korunk számítógépei lehetővé teszik gyors működését. Továbbá a 2. pontban taglaltak alapján látható, hogy az alakfelismerő rendszert sok más esetben is alkalmazhatjuk. Tipikus példa erre felületszerelt áramkörök szerelésekor a forraszanyagok ellenőrzése. Ebben az esetben a kamera segítségével gyorsan ellenőrizhető, elemezhető és tárolható minden egyes darab minősége, mely későbbi, esetleges garanciális problémák esetén segítenek meghozni a megfelelő döntést
Irodalomjegyzék 1 2 3 4 5
Rosenfel, A., Kak, A.C.: Digital picture processing. Academic Press, NY 1982 Gonzales, R., Vintz.P.: Digital image processing. Addison-Wesley, NY 1977 Álló, Hegedűs, Kelemen, Szabó: Digitális képfeldolgozás alapproblémái. AK, BP 1982 Horn, P.: Robot Vision. McGraw-Hill, NY 1986 Pugh, A.: Robot Vision. Springer Verlag, NY 1983
- 24 -
4 Ballard, D.H.: Computer Vision. Prentice-Hall, NJ 1982
- 25 -