KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
G´ epkocsi felismer´ es el¨ oln´ ezeti k´ epek alapj´ an Varjas Viktor, Tan´acs Attila K´epfeldolgoz´ as ´es Sz´ am´ıt´ og´epes Grafika Tansz´ek Szegedi Tudom´ anyegyetem
[email protected],
[email protected]
Absztrakt. Az objektumok k´ep-alap´ u felismer´ese a sz´ am´ıt´ og´epes l´ at´ as egy neh´ez feladata, a hat´ekony m˝ uk¨ od´eshez jellemz˝ oen a felismerend˝ o objektum min´el pontosabb ismerete sz¨ uks´eges. Cikk¨ unkben egy g´epj´ arm˝ u gy´ artm´ any-t´ıpus felismer˝ o elj´ ar´ ast ismertet¨ unk, amely el¨ oln´ezeti k´epekkel dolgozik. Egy szakirodalmi m´ odszerb˝ ol indulunk ki, amelyet m´ odos´ıtunk, hogy az a ´ltalunk o ¨sszegy˝ ujt¨ ott k´epi adatb´ azison megfelel˝ oen m˝ uk¨ odj¨ on, amit az oszt´ alyoz´ o elj´ ar´ as m´ odos´ıt´ as´ aval ´er¨ unk el. A m´ odszer felt´etelezi, hogy a j´ arm˝ u szabv´ anyos rendsz´ amt´ abl´ aval rendelkezik, az j´ ol l´ athat´ o ´es t´ıpusonk´ent el˝ o´ırt helyen tal´ alhat´ o. A rendsz´ amt´ abla ismeret´eben meghat´ aroz´ asra ker¨ ul egy, a g´epkocsi t´ıpus´ at j´ ol jellemz˝ o r´egi´ o (ROI), amelyb˝ ol megfelel˝ o k´epjellemz˝ o kinyer´ese ut´ an v´egrehajt´ odik az oszt´ alyoz´ as egy tan´ıt´ o halmaz seg´ıts´eg´evel. A rendsz´ amt´ abl´ ak manu´ alis kijel¨ ol´es´evel az oszt´ alyoz´ o m´ odszer jellemz´es´et kapjuk, a szegment´ al´ asi hib´ ak hat´ as´ anak minim´ alisra cs¨ okkent´es´evel. T¨ obbf´ele szempont alapj´ an tesztelt¨ uk a felismer˝ ot. 10 oszt´ aly ´es 727 k´ep eset´en k¨ ozel t¨ ok´eletes oszt´ alyoz´ as ´erhet˝ o el. Gyakorlati probl´em´ ak megold´ as´ ahoz bemutatunk egy f´elautomata ´es egy teljesen automata m´ odszert. A szegment´ al´ asi hib´ ak hat´ as´ ara a felismer´esi ar´ any 93% ´es 88% k¨ or¨ ul alakul. A bemutatott m´ odszer sk´ al´ azhat´ o, a tan´ıt´ o halmaz elemsz´ am´ at´ ol f¨ ugg˝ oen az oszt´ alyoz´ asi id˝ o szab´ alyozhat´ o. A k´epek kis m´eret˝ u reprezent´ aci´ oja t¨ obbf´ele, ak´ ar mobil kliens-szerver megval´ os´ıt´ ast is lehet˝ ov´e tesz.
1.
Bevezet´ es
A digit´ alis f´enyk´epez´es elterjed´es´evel felfoghatatlan mennyis´eg˝ u f´enyk´ep ´arasztotta el a vil´ agh´ al´ ot. Az interneten el´erhet˝o sz¨oveges tartalmak keres´ese manaps´ ag m´ ar j´ ol m˝ uk¨ odik, de a k´epek ´abr´azolt tartalom alapj´an t¨ort´en˝o keres´ese a sz´ am´ıt´ og´epeknek egy rendk´ıv¨ ul bonyolult feladat, hiszen gyakran a k´ep magas szint˝ u ´ertelmez´es´et k¨ oveteli meg. Egy k´ep csak sz´amok halmaza, amelyekb˝ol adott esetekben nagyon bonyolult elj´ar´asokkal lehet olyan inform´aci´okat kivonni, amire az emberi agy pillanatok alatt k´epes. Cikk¨ unk egy, az ember sz´am´ara viszonylag egyszer˝ u probl´em´ara keres megold´ ast: a k´epen l´ athat´ o g´epkocsi gy´art´oj´anak ´es t´ıpus´anak felismer´es´ere szemb˝ol k´esz¨ ult felv´etelek alapj´ an. A szakirodalomban t¨obb m´odszer is foglalkozik ezzel a probl´em´ aval. Majdnem az ¨osszes megk¨ozel´ıt´es a rendsz´amt´abl´at haszn´alja fel, mint kiindul´ o pontot a modell-jellemz˝ok kivon´as´ara. A [6] cikkben els˝o l´ep´esk´ent a gy´ art´ ot pr´ ob´ alj´ ak meg azonos´ıtani, a gy´art´o embl´em´aj´anak detekt´al´as´aval ´es
294
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
azonos´ıt´ as´ aval. Ezt k¨ ovet˝ oen a ROI-t tov´abbi r´egi´okra bontj´ak, majd minden r´egi´ ora egy SIFT jellemz˝ ot hat´aroznak meg, amelyeket PNN (Probabilistic Neural Network) seg´ıts´eg´evel oszt´alyozz´ak. Felhaszn´alhat´oak m´eg a kont´ ur pontok orient´ aci´ oi [7], vagy egy, a lok´alis energi´an alapul´o alakle´ır´o hisztogram (LESH Local Energy based Shape Histogram) [8]. A [9] cikkben els˝o l´ep´esk´ent glob´alis ´es k´ezzel annot´ alt jellemz˝ ok seg´ıts´eg´evel vizu´alisan j´ol elk¨ ul¨on¨ ul˝o r´egi´okat vonnak ki, majd ezeket a r´eszeket lok´alis alakjellemz˝ok kivon´as´aval jellemzik. Zhang ´es Zhou Curvelet transzform´aci´o ´es PHOG (Pyramid Histogram of Oriented Gradients) jellemz˝ ok seg´ıts´eg´evel pr´ob´alnak t´ıpus azonos´ıt´ast v´egrehajtani [10]. Petrovic [11] cikk´eben szint´en gradiens alap´ u jellemz˝okkel dolgozik, azzal a k¨ ul¨ onbs´eggel, hogy az oszt´ alyoz´as 2 f´azisb´ol ´all. Az els˝o f´azisban nagyon val´osz´ın˝ u tal´ alatokat ´ allap´ıtanak meg, majd egy m´asodik finom´ıt´asi f´azis k¨ovetkezik, ahol ezek k¨ oz¨ ul a modellek k¨ oz¨ ul v´alasztanak egyet u ´gy, hogy ROI-kat v´eletlen m´odon eltolj´ ak ´es elforgatj´ ak, ezzel kompenz´alva az esetleges ROI kijel¨ol´esi hib´akat. A jellemz˝ ok rengeted m´ odon oszt´alyozhat´oak. Gyakori megold´asok a Bayesalap´ o technik´ ak, legk¨ ozelebbi szomsz´ed m´odszer, d¨ont´esi-fa alap´ uak, neur´alis h´ al´ ok, tov´ abb´ a sz´ amos oszt´alyoz´o ¨osszekapcsol´as´aval is j´o eredm´enyeket lehet el´erni. Az oszt´ alyoz´ ok egy¨ uttese azonban n´eha gyeng´ebb eredm´enyt ´er el, mint a benne szerepl˝ o legjobb oszt´alyoz´o, hiszen a t¨obbi lerontja a teljes´ıtm´eny´et. Mi egy olyan megk¨ ozel´ıt´est v´alasztottunk, amely a k´epeken egy, a gy´art´ot ´es t´ıpust j´ ol jellemz˝ o ter¨ uletet (ROI) igyekszik detekt´alni, ´es egy ¨ossze´all´ıtott tan´ıt´o adathalmaz seg´ıts´eg´evel v´egzi el az oszt´alyoz´ast [1, 2]. A feladat megold´as´ahoz sz¨ uks´eges egy megfelel˝ o k´epi adatb´azis ¨ossze´all´ıt´asa. A szakirodalmi cikkek sok oszt´ allyal (77 darab) ´es oszt´ alyonk´ent viszonylag alacsony sz´am´ u k´eppel, ¨osszesen ezer k¨ or¨ ulivel dolgoztak. Bizonyos t´ıpusokhoz csak 3-4 minta tartozott. Mi arra t¨ orekedt¨ unk, hogy minden oszt´alyhoz igen nagy sz´am´ u minta ´alljon rendelkez´esre ´es min´el v´ altozatosabb m´ odon, t¨obbf´ele kamer´aval k´esz¨ uljenek. Jelenleg az oszt´ alyok sz´ ama 10, plusz egy speci´alis, amely olyan g´epkocsikat tartalmaz, amelyek nem tal´ alhat´ ok meg a tan´ıt´ o adatb´azisban (k´ıv¨ ules˝ok). Az oszt´alyok sz´am´anak n¨ ovel´ese jelenleg is folyamatban van. A szakirodalmi m´ odszerek [1, 2] a Sobel gradiens oper´atorra ´ep¨ ul˝o u ´n. Square Mapped Gradient (SMG) jellemz˝ot tartott´ak a legjobbnak a gradiens alap´ u jellemz˝ ok k¨ oz¨ ul, amit a mi vizsg´alataink is al´at´amasztanak. A kor´abban javasolt oszt´ alyoz´ o elj´ ar´ as viszont nem m˝ uk¨od¨ott elfogadhat´oan a saj´at k´epi adatb´azisunkon, azon m´ odos´ıtani kellett. A szakirodalmi cikkek k¨ ul¨onv´alasztj´ak az oszt´ alyoz´ o jellemz´es´et ´es a gyakorlatban is haszn´alhat´o automatikus m´odszerek t´ argyal´ as´ at. Az els˝ oh¨ oz egy k¨ozel t¨ok´eletes, manu´alis rendsz´amt´abla szegment´al´ ast haszn´ alnak, ´es 97% k¨ or¨ uli tal´alati ar´anyt k´epesek el´erni. A m´asodik, teljesen automatikus gyakorlati esetben ez 87% k¨or¨ ul alakul [1]. A mi eredm´enyeink ezzel osszevethet˝ ¨ ok, ´ altal´ aban valamivel magasabbak is. A k¨ ovetkez˝ o fejezetben el˝osz¨or az oszt´alyoz´o m´odszert ismertetj¨ uk, majd a f´elautomatikus ´es automatikus m´odszer¨ unket ´ırjuk le. Az eredm´enyek t´argyal´as´at a k´epi adatb´ azis ismertet´es´evel kezdj¨ uk, majd t¨obbf´ele szempont szerint tesztelj¨ uk az oszt´ alyoz´ ot.
295
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
2. 2.1.
Oszt´ alyoz´ o m´ odszer ROI kijel¨ ol´ es
Az algoritmus kulcsfontoss´ ag´ u l´ep´ese egy olyan tartom´any meghat´aroz´asa a k´epen, amely egy ´ alland´ o, modelleken bel¨ ul nem v´altoz´o r´eszt hat´aroz meg (ROI – Region Of Interest). K´ezenfekv˝o az ¨otlet, hogy ezt a ROI-t p´eld´aul a rendsz´ amt´ abla j´ ol meghat´arozza, mert modellenk´ent j´o k¨ozel´ıt´essel az aut´o elej´enek ugyanazon r´egi´ oj´ ara van r¨ogz´ıtve (1. ´abra).
1. ´ abra: Egy lehets´eges ROI kijel¨ ol´es a rendsz´ amt´ abla sz´eless´ege alapj´ an [1]
A kocsi felismer˝ o elj´ ar´ as csak a ROI-t haszn´alja fel az aut´o modellj´enek azonos´ıt´ as´ ara, a t¨ obbi k´eppont eldobhat´o. Ha adott a rendsz´amt´abla 3 sarokpontja, abb´ ol m´ ar megmondhat´o a rendsz´amt´abla hossza, magass´aga, k¨oz´eppontja, tov´ abb´ a az a sz¨ og, amellyel a k´ep x-tengely´ehez k´epest el van fordulva a k´epen, ´ıgy korrig´ alhat´ o az aut´o esetleges elforg´asa a k´epen. A ROI kijel¨ol´est elegend˝ o az eredeti k´ep sz¨ urke´arnyalatos v´altozat´an elv´egezni, hiszen a sz´ıninform´ aci´ o semmilyen inform´ aci´ot sem hordoz a k´epen l´athat´o kocsi t´ıpus´ar´ol, ´ıgy eldobhat´ o. Fontos m´eg a rendsz´amt´abla maszkol´asa, hiszen azt semmik´eppen sem szeretn´enk, hogy a rendsz´amt´abl´an tal´alhat´o bet˝ uk ´es sz´amok b´armilyen ir´ anyban befoly´ asolj´ ak az oszt´alyoz´as kimenetel´et, nem hordoznak semmilyen k´epi inform´ aci´ ot az aut´ o t´ıpus´ar´ol. V´eg¨ ul a ROI-t elsim´ıtjuk egy 7x7-es maszkkal t¨ ort´en˝ o medi´ an-sz˝ ur´essel. A szakirodalomban eml´ıtett ROI kijel¨ol´est˝ol mind¨ossze annyiban t´ert¨ unk el, hogy f¨ ugg˝ oleges ir´ anyban 0,8 ´es 0,3 s´ ullyal vessz¨ uk a rendsz´amt´abla hossz´at, mert azt figyelt¨ uk meg, hogy ´ıgy nagyobb es´ellyel alkotj´ak a ROI-t csak a kocsi pixelei. Teh´ at v´ızszintes ir´ anyban 2,6-szor akkora a ROI, mint a rendsz´amt´abla sz´eless´ege, f¨ ugg˝ olegesen pedig 1,1-szer (1. ´abra). Ez a k¨ ul¨onb¨oz˝o rendsz´amt´ablam´eretekb˝ ol ad´ odik ´es ezeket az ´ert´ekeket be kell ´all´ıtani minden u ´j t´ıpus´ u rendsz´ amt´ abla eset´en. Vizsg´ alatunkban mi a Magyarorsz´agon szabv´anyos rendsz´amt´ abla m´erettel dolgoztunk, a speci´alis rendsz´amokkal nem foglalkoztunk. A ROI onmag´ ¨ aban m´eg nem alkalmas az aut´ok t´ıpusazonos´ıt´as´ara, sz¨ uks´eges egy a modellekre jellemz˝ o k´epjellemz˝ ok kinyer´ese. A ROI kinyer´es m˝ uveletsor´at a 2. ´abra szeml´elteti.
296
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
2. ´ abra: A ROI kijel¨ ol´ese, a rendsz´ amt´ abla maszkol´ asa, valamint az esetleges elfordul´ as kompenz´ al´ asa
2.2.
Jellemz˝ o kinyer´ es
A feldolgoz´ as ezen f´ azis´ aban adott egy olyan r´egi´o, amin csak az aut´ot egy j´ol jellemz˝ o r´esze van a k´epnek, nagyr´eszt az aut´o elej´et alkot´o k´eppontok. Ezen ROI m´eretek term´eszetesen tetsz˝olegesen v´altozatosak lehetnek a k´epm´erett˝ol ´es a kocsi f´enyk´epez˝ ot˝ ol m´ert t´avols´ag´at´ol f¨ ugg˝oen. Sz¨ uks´eges, hogy ezeket a k´epeket valamilyen m´ odon egym´assal ¨osszevethet˝ov´e tegy¨ uk. A szerz˝ ok [1]-ben t¨ obbf´ele jellemz˝ot is figyelembe vettek, p´eld´aul a ROI sz¨ urke´ arnyalatos intenzit´ as´ert´ekeit, Sobel ´elk´epet, ´el ir´anyults´agot, FFT f´azis k´epet, Harris sarokpont v´ alaszf¨ uggv´enyt. Legjobb eredm´enyt sz´amukra az u ´n. Square Mapped Gradient (SMG) jellemz˝o adott, amit [2] ´es a mi vizsg´alataink is al´ at´ amasztottak. A ROI k´epb˝ol az SMG jellemz˝ot vertik´alis ´es horizont´alis Sobel gradiens maszkokkal t¨ ort´en˝ o konvol´ uci´o ut´an, a k¨ovetkez˝o k´eplettel sz´amolhatunk ki: s2x − s2y 2sx sy , gy = 2 , gx = 2 sx + s2y sx + s2y ahol sx az x-ir´ any´ u Sobel gradiens k´epet, ´es sy pedig az y-ir´any´ ut jel¨oli. Ez a k´epi jellemz˝ o j´ ol kezeli a megvil´ag´ıt´asbeli ´es sz´ınbeli k¨ ul¨onbs´egeket, hiszen csak a vertik´ alis ´es horizont´ alis gradiensekre t´amaszkodik. Az ´ıgy megkapott k´epeket ´atm´eretezz¨ uk egy el˝ore meghat´arozott m´eretre, ami a [2] cikk szerint 162 × 68 pixel (magass´ag × sz´eless´eg). T¨obb k´epm´eret kipr´ ob´ al´ asa ut´ an azt tapasztaltuk, hogy elegend˝o mind¨ossze 34×80 pixel m´eret˝ u SMG k´epekkel dolgozni. Ezzel egyr´eszt megsz¨ untett¨ uk a k´ep magass´ag´ahoz m´erten nagym´ert´ek˝ u horizont´ alis alulmintav´etelez´est, m´asr´eszt ekkora k´epekkel egy mind¨ ossze 5440 dimenzi´ os vektort´erben kell keresni, ami drasztikusan ler¨ovid´ıti az oszt´ alyoz´ asi proced´ ur´ at. A kisebb k´epek k´epesek elnyelni olyan ROI kijel¨ol´esi pontatlans´ agokat, amelyek egy nagyobb k´epen m´eg l´atsz´odnak. Ezt k¨ ovet˝ oen egy jellemz˝o vektort hozunk l´etre, amit u ´gy kapunk, meg, hogy az x- ´es y-ir´ any´ u SMG k´epeket egy vektorr´a konkaten´aljuk, amit jel¨olj¨on F . V´eg¨ ul a vektor ´ert´ekeit ´ atsk´al´azzuk a [−1, 1] intervallumba: F (i) = 2 · 2.3.
F (i) − Min(F ) − 1 , ahol i = 1, 2, . . . |F | . Max(F ) − Min(F )
Oszt´ alyoz´ as
Az oszt´ alyoz´ as feladata, hogy egy ROI k´epr˝ol meg´allap´ıtsa, azon milyen gy´artm´any´ u ´es t´ıpus´ u aut´ o tal´ alhat´ o. Ehhez sz¨ uks´eges egy adathalmaz, amely manu´alisan
297
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
felc´ımk´ezett jellemz˝ ovektorokat tartalmaz. Az oszt´alyoz´asnak ´ıgy azt kell megallap´ıtania egy bemeneti jellemz˝ovektorr´ol, hogy az adathalmazban szerepl˝ok ´ k¨ oz¨ ul valamelyikhez elegend˝oen k¨ozel van-e? Ha igen, akkor az adott oszt´alyhoz tartozik, egy´ebk´ent sikertelen az oszt´alyba sorol´as. Lehet˝os´eg van nem csak a legk¨ ozelebbi szomsz´ed, hanem a 3 vagy ak´ar t¨obb legk¨ozelebbi megkeres´es´ere, majd t¨ obbs´egi szavaz´ assal eld¨onteni, hogy az adott vektor melyik oszt´alyba tartozik. K´et jellemz˝ ovektor t´ avols´aga sz´amos m´odon defini´alhat´o. A szakirodalmi cikkben [1] k´et vektor t´ avols´ag´an az ´altaluk bez´art sz¨oget ´ertik. Ez a v´alaszt´as logikus az egyszer˝ u Euklideszi t´avols´aggal szemben, mert ´ıgy a jellemz˝ovektor magnit´ ud´ oja nem, csak az ´altaluk meghat´arozott ir´any j´atszik szerepet. Azt tapasztaltuk, hogy a mi adatb´azisunkon ez a metrika nem m˝ uk¨odik j´ol. Helyette a jellemz˝ ovektorok korrel´ aci´oj´at v´alasztva jelent˝osen megugrik a sikeres oszt´alyoz´ asok ar´ anya (l´ asd a 4.2. alfejezetet). Az oszt´ alyoz´ ohoz ¨ ossze kell teh´at ´all´ıtani egy alaphalmazt. T¨obbf´ele konstrukci´ ot tesztelt¨ unk. Az els˝o esetben minden oszt´aly eset´eben 3-4 modell figyelembe v´etel´evel t¨ ort´enik. Ezeket a modelleket a j´o min˝os´eg˝ u k´epek k¨oz¨ ul v´ alasztottuk ki ´es igyekezt¨ unk u ´gy megadni ˝oket, hogy lefedj´ek az esetleg rendsz´ amt´ abla t´ıpus elt´er´eseket, hiszen t¨obb t´ıpus´ u rendsz´amt´abla is forgalomban van, ami befoly´ asolja a ROI kijel¨ol´es´et ´es ´ıgy az oszt´alyoz´ast is.1 Megvizsg´altuk azt az esetet is, amikor oszt´ alyonk´ent jelent˝osen t¨obb, 20-20 jellemz˝ovektor ker¨ ult be az oszt´ alyoz´ o halmazba. V´eg¨ ul a ”leave-one-out” tesztet is v´egrehajtottuk, amikor egy aut´ ohoz tartoz´ o k´epek kiv´etel´evel mindet betessz¨ uk az oszt´alyoz´o halmazba. Term´eszetesen az oszt´alyoz´o halmazba ker¨ ul˝o vektorok nem szerepelnek a teszthalmazban. Az oszt´ alyoz´o id˝oig´enye f¨ ugg az oszt´alyoz´o halmaz elemsz´am´ at´ ol, ´ıgy az elv´ art v´ alaszid˝o is fontos szerepet j´atszik ennek be´all´ıt´as´aban.
3.
F´ elautomatikus ´ es automatikus kiterjeszt´ es
A rendsz´ amt´ abla sarokpontjainak k´ezi meghat´aroz´as´aval lehet˝os´eg ny´ılik az oszt´ alyoz´ o m´ odszer jellemz˝ oinek vizsg´alat´ara, viszont a gyakorlati probl´em´ak megold´ as´ an´ al ez nem kivitelezhet˝o. A vizsg´alt szakirodalmi cikkben [1] is javasolnak egy automatiz´ al´ asi lehet˝os´eget, de csak p´ar mondatban emelik ki a l´enyegi l´ep´eseket, ami alapj´ an a szegment´al´o elj´ar´as nem reproduk´alhat´o. Mi egy f´elautomatikus, ´es egy erre ´ep¨ ul˝o automatikus megk¨ozel´ıt´est mutatunk be. A f´elautomata arra utal, hogy sz¨ uks´eg van felhaszn´al´oi beavatkoz´asra. Felt´etelezz¨ uk, hogy ismert egy pontja a rendsz´amt´abl´anak (kiindul´asi pont), amit p´eld´ aul a felhaszn´ al´ o ad meg okostelefonj´anak ´erint˝ok´eperny˝oje seg´ıts´eg´evel, vagy asztali g´ep eset´en az eg´errel. Az automatikus m´odszer¨ unk a k´ep elemz´es´evel pr´ ob´ al ilyen kiindul´ asi pontot tal´alni. A tesztek sor´an minden kocsira el˝ore le1
Ezekben az esetekben a rendsz´ amt´ abla m´erete ´es elhelyezked´ese nem v´ altozik, csak a rendsz´ amt´ abla tartalma, amely a f´elautomatikus ´es az automatikus m´ odszerek eset´en fontos lesz. Ilyen p´eld´ aul a r´egi, magyar fels´egjelz´est, ´es az u ´j, k´ek h´ att´erben uni´ os z´ aszl´ ot tartalmaz´ o.
298
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
mentett¨ unk egy-egy kiindul´ asi pontot, amely nem a rendsz´amt´abla bet˝ uire/sz´amaira illetve nem azok bels˝ ou ¨regpontjaira esik. 3.1.
F´ elautomata m´ odszer
A szegment´ al´ as egy r´egi´ on¨ ovel˝o elj´ar´ason alapul [4]. A m´odszer l´enyege, hogy adott pontb´ ol indulva pr´ ob´ alunk l´etrehozni egy r´egi´ot, eg´eszen addig, am´ıg van az aktu´ alis r´egi´ o pontjainak olyan szomsz´edja, amelyre a k¨ovetkez˝o felt´etelek teljes¨ ulnek: – Az intenzit´ asa egy adott intervallumba esik. – A kiindul´ asi pontt´ ol m´ert t´avols´aga nem nagyobb egy k¨ usz¨obn´el. Az intenzit´ as intervallumot term´eszetesen c´elszer˝ u az aktu´alis kiindul´asi pont intenzit´ asa alapj´ an meghat´ arozni, vagy annak egy adott k¨ornyezet´eb˝ol. A kiindul´ asi pont intenzit´ as´ anak f¨ uggv´eny´eben finomhangolhat´o a szegment´al´as nagyon s¨ ot´et megvil´ ag´ıt´ as kezel´es´ere is u ´gy, hogy ezekben az esetekben csak sz˝ uk intenzit´ astartom´ anyt enged¨ unk meg. A kiindul´asi pontt´ol m´ert t´avols´agk¨ usz¨ob¨ot a k´ep sz´eless´ege f¨ uggv´eny´eben adtuk meg u ´gy, hogy a k´ep sz´eless´eg´enek harmad´ an´ al messzebb l´ev˝ o pont nem ker¨ ulhet be a r´egi´oba. A r´egi´ o hat´ ar´ an bel¨ ul keletkez˝o lyukakat az algoritmus automatikusan felt¨olti. Gyakran el˝ ofordul, hogy a r´egi´o kifolyik a rendsz´amt´abl´an l´ev˝o egy´eb feliratok, a gyenge megvil´ ag´ıt´ as vagy a koszos rendsz´amt´abla miatt vagy darabokra esik sz´et. Ezeket az eseteket megfelel˝ oen alkalmazott morfol´ogiai m˝ uveletek seg´ıts´eg´evel korrig´ alhatjuk (3. ´ abra).
3. ´ abra: A bal fels˝ o k´epen a r´egi´ on¨ ovel´es eredm´enye l´ athat´ o. Mellette a lyukfelt¨ olt´es eredm´enye, v´eg¨ ul az ut´ ofeldolgoz´ as eredm´enye ´es alul annak visszavet´ıt´ese az eredeti k´epre. A kitakart karakterek anonimit´ asi c´elt szolg´ alnak.
A r´egi´ on¨ ovel´eshez nem a sz¨ urke´arnyalatos k´epet haszn´altuk, hanem az eredeti sz´ınes k´ep k´ek csatorn´ aj´ at. Ennek az az oka, hogy az EU-s rendsz´amt´abl´ak bal oldala k´ek, ami viszonylag magas intenzit´assal jelenik meg a k´ek csatorn´an, ´ıgy az esetek d¨ ont˝ o t¨ obbs´eg´eben nem okoz szegment´al´asi hib´at. Arra az esetre, ha nem siker¨ ulne a rendsz´ amt´ abla szegmenshez hozz´avenni a k´ek EU-s r´eszt, minden modellhez felvett¨ uk a tan´ıt´ o halmazba egy speci´alis tan´ıt´o elemet, amelyn´el a k´ek szegmens n´elk¨ uli rendsz´ amt´ abla sz´am´ıt a t¨ok´eletes szegment´al´asnak, ´ıgy kezelve az oszt´ alyoz´ asn´ al ezt az esetenk´ent bek¨ovetkez˝o szegment´al´asi hib´at (4. ´abra).
299
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
4. ´ abra: Rosszul szegment´ alt, de j´ ol oszt´ alyozott EU-s rendsz´ amt´ abl´ as kocsi. A kitakart karakterek anonimit´ asi c´elt szolg´ alnak.
Az oszt´ alyoz´ o m´ odszer m˝ uk¨od´es´ehez m´eg sz¨ uks´eges, hogy a szegment´alt rendsz´ amt´ abla alapj´ an annak sarokpontjait meghat´arozzuk. A szegment´al´asi ´es reprezent´ aci´ os hib´ ak miatt ez nem trivi´alis feladat. Vessz¨ uk a szegmens kont´ urj´at ´es a szomsz´eds´ agokat vizsg´ alva 4 halmazba osztjuk ˝oket, amelyek a rendsz´amt´abla megfelel˝ o oldalpontjai lesznek. Ezekre a halmazokra illeszt¨ unk 1-1 egyenest u ´gy, hogy minimaliz´ aljuk a pontok egyenest˝ol m´ert t´avols´ag´anak n´egyzet¨osszeg´et. V´eg¨ ul az egyenesek metsz´espontjai lesznek a rendsz´amt´abla sarokpontjai (5. ´abra).
5. ´ abra: A ponthalmazokra illesztett egyenesek ´es azok metsz´espontjai. K´ek sz´ınnel a szegment´ alt kont´ ur l´ athat´ o. A kitakart karakterek anonimit´ asi c´elt szolg´ alnak.
3.2.
Automata m´ odszer
Az automatikus m´ odszert a f´elautomatikusra vezetj¨ uk vissza, vagyis a k´ep elemz´es´evel meg kell tal´ alnunk egy megfelel˝o rendsz´amt´abla pontot. Az algoritmus az eredeti sz´ınes k´ep sz¨ urke´ arnyalatos v´altozat´an dolgozik, nincs sz´ıninform´aci´ora sz¨ uks´eg. Mivel a k´epek egy j´ol meghat´arozott protokoll szerint k´esz¨ ulnek, ´ıgy felhaszn´ alhatjuk ezt az inform´aci´ot, hogy a l´enyegtelen ter¨ uletek egy r´esz´et eldobjuk. A v´ alaszt´ asunk f¨ ugg˝oleges ir´anyban a k´ep als´o k´etharmad, v´ızszintes ir´ anyban a k¨ oz´eps˝ o f´el r´esz´ere esett. A ROI ter¨ uleten egy 9-es kernelm´eret˝ u medi´ an sz˝ ur´est v´egezt¨ unk.
300
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
Az alap¨ otlet Ondrej Martinsky dolgozat´ab´ol sz´armazik, aminek l´enyege, hogy olyan ter¨ ulet lesz nagy val´ osz´ın˝ us´eggel rendsz´amt´abla, amelyen s˝ ur˝ un helyezkednek el az ´elek [5]. A k´epen egy x-ir´any´ u ´elkeres´est v´egz¨ unk, k¨ usz¨ob¨olj¨ uk, ´es kisz´ am´ıtjuk a v´ızszintes ir´ any´ u vet¨ uleteit. Felt´etelezz¨ uk, hogy a maxim´alis vet¨ uleti ´ert´ekhez tartoz´ o sor ´ athalad a rendsz´amt´abl´an (6. ´abra), ´ıgy ezen keres¨ unk megfelel˝ o kiindul´ asi pontot.
6. ´ abra: Rendsz´ amt´ abl´ an a ´thalad´ o v´ızszintes ir´ any detekt´ al´ asa. Bal oldalon a k¨ usz¨ ob¨ olt magnit´ ud´ o k´ep ´es annak v´ızszintes vet¨ uletei, jobb oldalon a rendsz´ amt´ abl´ an a ´tmen˝ o szakasz, amin a kiindul´ asi pontot keress¨ uk a szegment´ al´ ashoz.
A kiindul´ asi pont v´ alaszt´ashoz t¨obb pontot is megvizsg´alunk az egyenesr˝ol. A kezd˝ opont az egyenes k¨ oz´eppontja, ahonnan v´egrehajtjuk a r´egi´on¨ovel´est ´es elmentj¨ uk a hozz´ a tartoz´ o r´egi´o ter¨ ulet´et. Ha ez a ter¨ ulet kisebb, mint egy k¨ usz¨ obsz´ am, akkor karaktert vagy karakter lyukat tal´altunk el ´es nem vessz¨ uk figyelembe. A k¨ ovetkez˝ o pontokat adott t´avols´aggal t¨ort´en˝o jobb ´es bal ir´any´ u ugr´ assokkal vessz¨ uk. Minden ponthoz kisz´am´ıtjuk a bel˝ole n¨ovelhet˝o r´egi´o ter¨ ulet´et u ´gy, hogy a kicsi ter¨ uleteket eldobjuk. Ha 4 r´egi´on¨ovel´es k¨ozel azonos m´eret˝ u ter¨ uletet eredm´enyez, akkor az utolj´ara haszn´alt kiindul´asi pontot elfogadjuk ´es v´egrehajtjuk vele a rendsz´amt´abla szegment´al´ast, majd az oszt´alyoz´ast. Ha v´egig´ert¨ unk az egyenesen, de nem volt 4 hasonl´o ter¨ ulet˝ u r´egi´o, akkor v´eletlenszer˝ uen v´ alaszthatunk vagy valamilyen heurisztika alapj´an, mint p´eld´aul a k´ep m´erete alapj´ an v´ arhat´ o rendsz´amt´abla ter¨ ulet.
4. 4.1.
Eredm´ enyek ki´ ert´ ekel´ ese K´ epi adatb´ azis
Az adatb´ azist 869 szemb˝ ol k´esz¨ ult k´ep alkotja, ´es 11 oszt´aly, amelyek egy 34 h´ onapos peri´ odus sor´ an ker¨ ultek ¨osszegy˝ ujt´esre Szegeden, az utc´an parkol´o aut´ okr´ ol. Ezek k¨ oz¨ ul 727 k´ep azokr´ol az aut´okr´ol k´esz¨ ult, amelyek a felismer´es 10 oszt´ aly´ at k´epzik, a 11. oszt´ aly egy speci´alis ”outlier” oszt´aly, azaz olyan aut´okr´ol is tartalmaz 100 k´epet az adatb´azis, amelyek nem r´eszei a felismerni k´ıv´ant 10 t´ıpusnak. Ezzel azt fogjuk vizsg´alni, hogy mennyire k´epes az algoritmus megmondani egy aut´ or´ ol, hogy r´esze-e a felismerni k´ıv´ant modelleknek. A k´epekb˝ol t´ıpusonk´ent 3-4, ¨ osszesen 42 darab, a t´ıpust j´ol jellemz˝o k´epet kiv´alasztottunk tan´ıt´ asi halmaz elemnek (7. ´abra). A t¨obbi 827 k´epet tesztel´esre haszn´altuk.
301
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
Modell Darabsz´ am Peugeot 206 55 Peugeot 307 47 Opel Astra 100 Skoda Fabia 100 Skoda Octavia 43 Volkswagen Golf 93 Volkswagen Polo 45 Ford Focus 47 Renault Megane 97 Suzuki Swift 100 Oszt´ alyon k´ıv¨ uli 100 7. ´ abra: Modellek eloszl´ asa a teszttel´esi k´epi adatb´ azisban (bal oldal) ´es n´eh´ any k´ep az adatb´ azisb´ ol (jobb oldal)
Az adatb´ azis gy˝ ujt´es´enek gyors´ıt´asa ´erdek´eben minden aut´or´ol 2 darab k´ep k´esz¨ ult, de a m´ asodik m´ as sz¨ogb˝ol ´es/vagy t´avols´agb´ol. Ennek a m´odszernek az is el˝ onye, hogy ´ıgy j´ ol megfigyelhet˝oek az esetleges oszt´alyoz´asi hib´ak t´avols´ag/sz¨og osszef¨ ¨ ugg´esei, hiszen el˝ ofordulhatnak olyan esetek, hogy az egyik k´epen szerepl˝o aut´ ot siker¨ ul felismerni, de a p´arj´at m´ar nem. Egy modellen bel¨ ul ugyanabb´ol az ´evj´aratb´ol gy˝ ujt¨ott¨ unk k´epeket a Suzuki Swift kiv´etel´evel, ahol 2 k¨ ul¨onb¨oz˝o modellr˝ol k´esz¨ ultek felv´etelek. Megvil´ag´ıt´as szempontj´ ab´ ol el˝ ofordulnak ´ejszakai, hajnali, es˝os, ´arny´ekos, t˝ uz˝o napos, valamint olyan k´epek is, ahol az aut´o egyik fele er˝osen megvil´ag´ıtott a m´asik pedig arny´ekban van. Teh´ ´ at sokf´ele, a gyakorlatban el˝ofordul´o megvil´ag´ıt´asi lehet˝os´eget igyekezt¨ unk belevinni az adatb´azisba. A kocsit´ol m´ert t´avols´ag is v´altozatos, el˝ ofordulnak k¨ ozel 1 m´eterr˝ol k´esz¨ ult k´epek, valamint 10 m´etert is meghalad´o t´ avols´ agok. A k´epeket szemb˝ol, k¨ ul¨onb¨oz˝o magass´agb´ol k´esz´ıtett¨ uk, de t¨orekedt¨ unk arra, hogy a rendsz´ amt´abla alakja legfeljebb csak kism´ert´ek˝ u perspekt´ıv torzul´ ast szenvedjen. A k´epek 2 megapixeles m´erettel, h´aromf´ele kamera felhaszn´al´as´aval k´esz¨ ultek: Pentax Optio (kompakt g´ep, 2MP, 4:3-as k´epar´any), Sony Ericsson Xperia Mini (2MP, 4:3-as ´es 16:9-es k´epar´any), Samsung Galaxy S (2MP, 4:3-as k´epar´any). A 3 k¨ ul¨ onb¨ oz˝ o kamera haszn´alat´at az indokolja, hogy ´ıgy a m´odszer k¨ ul¨onb¨oz˝o min˝ os´eg˝ u k´epeken is kipr´ ob´ al´asra ker¨ ul. A 3 kamera elt´er˝o min˝os´eg˝ u k´epet produk´ al, ami k¨ ul¨ on¨ osen Xperia Mini eset´eben vehet˝o ´eszre. A legjobb min˝os´eget a Pentax adta, a legrosszabbat az Xperia. A k´epk´esz´ıt´esi protokoll megk¨oveteli, hogy lehet˝ oleg csak 1 kocsi szerepeljen a k´epeken, ami a k´ep k¨oz´eps˝o r´esz´en helyezkedik el. Sz´ amos olyan k´ep is k´esz¨ ult, ahol az aut´o egy l´enyeges r´esz´et egy oszlop vagy m´ as h´etk¨ oznapi akad´aly eltakarja. Minden k´ephez elt´ aroltuk az ide´alis rendsz´amt´abla sarokpontokat, melyeket manu´ alisan jel¨ olt¨ unk ki. Az szakirodalmi cikkek [1, 2] ´altal t´argyalt m´odszerek felt´etelezik, hogy ismerj¨ uk az ide´alis sarokpontokat. ´Igy lehet˝ov´e v´alik az osz-
302
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
t´ alyoz´ o m´ odszer k¨ ozvetlen vizsg´alata, a szegment´al´asi hib´ak okozta hat´as minim´ alisra cs¨ okkent´es´evel. Az ide´alis sarokpontok ismeret´eben tov´abbi, a robusztuss´ agot vizsg´ al´ o tesztek is elv´egezhet˝ok. A cikkekben 74 ´es 77 oszt´allyal dolgoznak ´es k¨ozel 1000 mint´aval, ami azt jelenti, hogy sokkal kevesebb minta jut egy adott modellre. Olyan eset is el˝ofordul, hogy 2-3 k´eppel tesztelnek egy adott t´ıpust, ami v´elem´eny¨ unk szerint nem igaz´an m´ervad´ o. N´ alunk kevesebb oszt´aly, de sokkal t¨obb minta tal´alhat´o oszt´alyonk´ent. Term´eszetesen az oszt´ alyok ´es k´epek sz´ama tov´abb n¨ovelhet˝o, ez csak id˝o ´es befektetett munka k´erd´ese. 4.2.
Eredm´ enyek
Az el˝ oz˝ o fejezetekben ismertetett m´odszereket t¨obbf´ele szempontb´ol is ki´ert´ekelt¨ uk az adatb´ azisunkon. El˝osz¨or a [1] cikk alapj´an javasolt param´eter-be´all´ıt´ asokat haszn´ altuk, amellyel a szerz˝ok a saj´at adatb´azisukon 97,7%-os tal´alati ar´ anyt ´ertek el. A cikkben javasolt oszt´alyoz´o m´odszer (vektorok bez´art sz¨oge) nem m˝ uk¨ odik a k´epeinken, 45%-k¨ozeli felismer´esi eredm´enyt tudott csak produk´ alni. Ezt lecser´elve a korrel´aci´ora, a sikeres felismer´esi ar´any 96% k¨ozel´ebe ugrik (1. t´ abl´ azat).
Modell Mint´ ak sz´ ama Sikeres Sikertelen Ar´ any 206 55 55 0 100% 307 47 47 0 100% Astra 100 100 0 100% Fabia 100 99 1 99% Focus 43 43 0 100% Golf 93 88 5 94.6% Megane 45 45 0 100% Octavia 47 47 0 100% Polo 97 85 12 87.6% Swift 100 92 8 92% ¨ 727 701 26 96.4% Osszegz´ es 1. t´ abl´ azat: Oszt´ alyoz´ asi eredm´enyek 162 × 88 m´eret˝ u ROI eset´en, SMG jellemz˝ ovel ´es korrel´ aci´ o-alap´ u oszt´ alyoz´ oval
Felmer¨ ult a k´erd´es, hogy sz¨ uks´eges-e a j´ol teljes´ıt˝o korrel´aci´os metrika mellett 162 × 68-as k´epekkel dolgozni, amelyekkel egy 22032 dimenzi´os k´epjellemz˝o t´erben kell keresni ´es olyan m´odon sk´al´azni a k´epet, hogy horizont´alisan rengeteg inform´ aci´ ot eldobunk. Ekkora t´erben keresni id˝oig´enyes feladat, arr´ol nem is besz´elve, hogy az eredm´enyeken sem jav´ıt a nagyobb sz´am´ıt´ast ig´enyl˝o k´epm´eret, ahogy az a k¨ ovetkez˝ o eredm´enyekb˝ol l´athat´o. T¨obb k´epm´eret kipr´ob´al´asa ut´an azt tapasztaltuk, hogy elegend˝o mind¨ossze 34 × 80 pixel m´eret˝ u SMG k´epekkel
303
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
dolgozni. Ebb˝ ol az is l´ atszik, hogy a k´ep magass´ag´ahoz m´erten nagym´ert´ek˝ u horizont´ alis alulmintav´etelez´est is megsz¨ untett¨ uk. Ekkora k´epekkel egy mind¨ossze 5440 dimenzi´ os vektort´erben kell keresni, ami drasztikusan ler¨ovid´ıti az oszt´alyoz´ asi proced´ ur´ at. Egy kocsi a´tlagos oszt´alyoz´asi ideje 0.5 m´asodpercre cs¨okkent.2 A fut´ asi id˝ on t´ ul az eredm´enyek is javultak, ami annak k¨osz¨onhet˝o, hogy a kisebb k´epek k´epesek elnyelni olyan ROI kijel¨ol´esi pontatlans´agokat, amelyek egy nagyobb k´epen m´eg l´ atsz´odnak, ´ıgy n¨ovelve a fed´esben l´ev˝o pixelek sz´am´at. Az is gyakran el˝ ofordul, hogy a rendsz´amt´abla alapb´ol ferd´en van felszerelve vagy eldeform´ al´ odott. A kisebb m´eret˝ u k´epek ezeket a hib´akat is k´epesek lehetnek toler´ alni. A 34 × 80-as SMG k´eppel kapott eredm´enyek m´eg az eddigi eredm´enyeket is fel¨ ulm´ ult´ ak, mind¨ossze 4 kocsit hib´azott el az oszt´alyoz´o a 727-b˝ol, ´ıgy 99,4%-os, k¨ ozel t¨ ok´eletes tal´alati ar´anyt ´ert el. 4.3.
Tan´ıt´ o halmaz vizsg´ alata, ”leave-one-out” teszt
A tov´ abbiakban a legjobbnak bizonyult 34×80-as SMG jellemz˝oket haszn´aljuk, a t´ avols´ agmetrika pedig a korrel´aci´o lesz ´es a tan´ıt´o halmaz k¨ ul¨onb¨oz˝o m´odos´ıt´asait vizsg´ aljuk. Az eddig t´ argyalt eredm´enyek u ´gy sz¨ ulettek, hogy modellenk´ent 3-4 k´ep ker¨ ult bele a tan´ıt´ o halmazba, aminek j´o hat´asa van a fut´asi id˝ore, hiszen min´el kevesebb elem˝ u a tan´ıt´o halmaz, ann´al kevesebb elemmel kell ¨osszevetni az oszt´ alyozand´ o elemet. Felmer¨ ul a k´erd´es, hogy mennyire befoly´asolja az oszt´ alyoz´ as sikeress´eg´et a tan´ıt´o halmaz m´erete, a jellemz˝o t´er nagyobb m´ert´ek˝ u tel´ıtetts´ege? A k´erd´es megv´ alaszol´asa ´erdek´eben 2 tesztet hajtottunk v´egre. Az els˝ o teszt sor´ an a teszt adathalmazb´ol minden oszt´alyra vett¨ uk az els˝o 20 k´epet az adatb´ azisb´ ol ´es tan´ıt´o halmaznak v´alasztottuk. ´Igy egy 200 elem˝ u halmaz j¨ ott l´etre, amelyet 527 mint´aval tesztelt¨ uk, ahol a mint´ak teljesen f¨ uggetlenek a tan´ıt´ o halmazt´ ol. A tan´ıt´ o halmaz moder´alt n¨ovel´ese a tal´alati ar´anyt 100%-ra n¨ ovelte. A fut´ asi id˝ o´ atlagosan 2.1 m´asodperc volt. A m´ asodik teszt egy valid´aci´os teszt, amelyet angolul ”leave-one-out crossvalidation” n´even eml´ıt a szakirodalom [3]. A ”leave-one-out” arra utal, hogy enn´el a tesztn´el az eg´esz adatb´azist tan´ıt´o halmazk´ent kezelj¨ uk, annak a k´epnek a kiv´etel´evel, amit ´eppen oszt´alyozni szeretn´enk ´es ´ıgy tesztelj¨ uk az ¨osszes k´epet az adatb´ azisban. Ennek a tesztnek a fut´asi ideje jelent˝osen nagyobb, mint az eddigieknek, de j´ ol szeml´elteti a m´odszer viselked´es´et nagysz´am´ u tan´ıt´o minta eset´eben. Az adatb´ azisunk strukt´ ur´aj´ab´ol (minden aut´or´ol 2-2 k´ep k´esz¨ ult) ad´od´ oan mindig kivett¨ uk az aktu´alis kocsi p´arj´at is a tan´ıt´o halmazb´ol, ´ıgy 725 elem˝ u tan´ıt´ oval t¨ ort´enik az oszt´alyoz´as. A teszt eredm´enyei nagyon ´ıg´eretesek, mind¨ ossze 1 kocsit hib´ azott el, ´ıgy 99,9%-os eredm´enyt ´ert el. A fut´asi id˝o 9.3 m´ asodperc k¨ or¨ ul mozgott. A 725 elem˝ u tan´ıt´o halmaz remek szerepl´ese t¨obb szempontb´ ol is pozit´ıv. Az els˝o, hogy 10 oszt´aly eset´en tel´ıtettebbnek mondhat´ o jellemz˝ o t´erben is kiv´al´oan szerepel a m´odszer. A m´asodik pedig, hogy olyan modellek is beker¨ ultek ezzel a m´odszerrel a tan´ıt´o halmazba, amiknek 2
A teszteket egy AMD Phenom II X4 Black Edition (3.8 GHz) CPU-n futtattuk. A program p´ arhuzamos´ıt´ as n´elk¨ ul, egy sz´ alon futott.
304
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
am´ ugy nem lenne ott a hely¨ uk, vagyis amelyek nagyon rossz megvil´ag´ıt´asi viszonyok k¨ oz¨ ott k´esz¨ ultek vagy r´eszben kitakartak, ´ıgy val´oj´aban nem alkalmasak a tan´ıt´ o szerepre. Ebb˝ ol megfigyelhet˝o a rendszer robusztuss´aga, hiszen a zajosnak mondhat´ o tan´ıt´ o halmaz ellen´ere szinte hib´atlan eredm´enyeket siker¨ ult el´erni. ¨ Osszefoglalva a tan´ıt´ o halmaz vizsg´alat´at elmondhat´o, hogy a m´odszer nagyon j´ ol sk´ al´ azhat´ o. Az eredm´enyek 20-30 tan´ıt´o k´ep eset´en is kiv´al´oak, de tov´abb jav´ıthat´ oak a halmaz sz´ amoss´ag´anak sokszoroz´as´aval. Ebb˝ol k¨ovetkez˝oen a felhaszn´ al´ asi ter¨ ulethez igaz´ıthat´o. Ahol megb´ızhat´o, de val´os idej˝ u fut´asra van sz¨ uks´eg, ott reduk´ alni lehet a modellek sz´am´at. Olyan alkalmaz´asok eset´en, ahol viszont nem l´enyeges a fut´asi id˝o (p´eld´aul offline elemz˝o szoftverek eset´en), nagysz´ am´ u tan´ıt´ o mint´ aval nagyon stabil eredm´eny ´erhet˝o el. 4.4.
Oszt´ alyokon k´ıv¨ uli esetek vizsg´ alata
Megvizsg´ altuk, hogy a m´ odszer mennyire k´epes az adatb´azisban nem szerepl˝o aut´ okr´ ol meg´ allap´ıtani, hogy ”k´ıv¨ ul´all´ok”, tov´abb´a, hogy az adatb´azisban szerepl˝ o aut´ okr´ ol mekkora es´ellyel v´alaszoln´a azt, hogy nem r´eszei az adatb´azisnak. A k´ıv¨ ul´ all´ ok tesztel´es´ehez egy 100 k´epet tartalmaz´o adatb´azist haszn´altunk, melyek nem szerepelnek a felismerni k´ıv´ant kocsik k¨oz¨ott. Az oszt´alyoz´o minden esetben egy val´ os sz´ amot ad vissza, amely azt m´eri, hogy mennyire ”korrel´al” a legk¨ ozelebbi modell az input k´eppel. Ezt a sz´amot megfelel˝oen k¨ usz¨ob¨olve eg´eszen j´ o ar´ anyban tud olyan diplomatikus v´alaszt adni az oszt´alyoz´o, hogy ”Az adott aut´ o nagy val´ osz´ın˝ us´eggel nem szerepel az adatb´azisban. A hozz´a legk¨ ozelebb ´ all´ o modell: xy”. Ebb˝ol j´ol l´atszik, hogy ez a k¨ usz¨ob nem egy´ertelm˝ uen hat´ arozza meg a k´ıv¨ ul´ all´ okat, de hasznos jelz´es lehet a felhaszn´al´o fel´e, valamint a robusztuss´ agot ´es azt is jellemzi, hogy hogyan viselkedne az algoritmus egy sokkal tel´ıtettebb jellemz˝ o t´erben, sok oszt´allyal. Els˝ o esetben 3-4 modellt tartalmaz´o tan´ıt´o halmazt haszn´al´o m´odszert vizsg´ altuk meg. Amennyiben a k¨ usz¨obsz´amot 0,55-re ´all´ıtottuk u ´gy, hogy a korrel´aci´o metrika eredm´enye a [0,1] intervallumb´ol ker¨ ul ki, ahol 0 t¨ok´eletes egyez´es. A 100 k´ıv¨ ul´ all´ o kocsi k¨ oz¨ ul 96 esetben siker¨ ult meg´allap´ıtani, hogy nem r´eszei az adatb´ azisnak. Ezt k¨ ovet˝ oen azt vizsg´altuk, hogy mennyi, t´enylegesen az adatb´ azisban szerepl˝ o kocsi kapn´a meg a k´ıv¨ ul´all´o c´ımk´et ezzel a k¨ usz¨obsz´ammal. A teszt sor´ an 115 kocsi lett t´evesen k´ıv¨ ul´all´o oszt´alyba sorolt, ami 86,1%-os tal´ alati ar´ any. A k¨ usz¨ obsz´ amot 0,6-ra, majd 0,65-re emelve azt vehetj¨ uk ´eszre, hogy az ismert aut´ ot´ıpusok tal´alati ar´anya n¨ovekszik (91,4% ´es 92,6%), viszont ez azzal j´ ar, hogy a k´ıv¨ ules˝o aut´ok egyre nagyobb ar´anyban t´evesen ker¨ ulnek azonos´ıt´ asra, a 96%-os tal´ alati ar´anyr´ol 81%-ra, majd 59%-ra esik (2. t´abl´azat). M´ asodik k¨ orben az oszt´ alyonk´ent 20-20 modellt tartalmaz´o tan´ıt´o halmazzal el´erhet˝ o eredm´enyt vizsg´ altuk 0,55 k¨ usz¨ob´ert´ekkel. Ez a megk¨ozel´ıt´es a 100-b´ol 83 aut´ or´ ol ´ all´ıtotta meg helyesen, hogy k´ıv¨ ul´all´o. Ez roml´as az el˝oz˝o eredm´enyekhez k´epest, de az adatb´ azisba tartoz´ok k¨oz¨ ul mind¨ossze 42 lett t´evesen k´ıv¨ ul´all´o az 527 esetb˝ ol, ami 8%-os hibaar´anyt jelent. Eml´ıt´esre m´elt´o m´eg, hogy ezekb˝ol az esetekb˝ ol a Swift 22-t tudhat mag´a´enak, amir˝ol az l´atszik, hogy a Swiftek k¨ oz¨ ott nagyobb korrel´ aci´ os t´avols´agok is el˝ofordulhatnak.
305
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
Modell Mint´ ak sz´ ama 206 55 307 47 Astra 100 Fabia 100 Focus 43 Golf 93 Megane 45 Octavia 47 Polo 97 Swift 100 Kiv¨ ul´ all´ o 100 ¨ Osszes´ıt´es 827
Tal´ alati ar´ any 0.55 0.6 0.65 94.4% 100% 100% 78.7% 91.5% 97.9% 91% 96% 100% 82% 93% 98% 100% 100% 100% 93.5% 97.8% 97.8% 86.7% 95.6% 100% 83% 89.4% 100% 84.5% 95.9% 95.9% 63% 76% 89% 96% 81% 59% 86.1% 91.4% 92.6%
2. t´ abl´ azat: Eredm´enyek h´ aromf´ele oszt´ alyoz´ asi k¨ usz¨ ob´ert´ekre a k´ıv¨ ules˝ o oszt´ alyt is tartalmaz´ o tesztben.
V´eg¨ ul a leave-one-out keresztvalid´aci´ot futtattuk le. A 100 k´ıv¨ ul´all´ob´ol 80 kapott helyes c´ımk´et. A 727 k´ep k¨oz¨ ul azonban mind¨ossze 35 kapott t´evesen k´ıv¨ ules˝ o c´ımk´et, ami mind¨ ossze 4,8%-os hibaar´any, amib˝ol ebben ez esetben is a Swiftek domin´ alnak 19 t´eves esettel. 4.5.
F´ elautomata ´ es automata oszt´ alyoz´ as eredm´ enyei
A kor´ abbi vizsg´ alatok az oszt´alyoz´o k´epess´egeinek felm´er´es´ere szolg´altak, a szegment´ al´ asi hib´ ak kisz˝ ur´es´evel. Val´os alkalmaz´asokban a szegment´al´as hib´akat hoz be, ami rontja az felismer´es teljes´ıtm´eny´et. Megvizsg´altuk, hogyan alakulnak az eredm´enyek a javasolt f´elautomatikus ´es automatikus szegment´al´asi m´odszereink felhaszn´ al´ as´ aval. A t´ıpusonk´ent 3-4 tan´ıt´ oelem haszn´alat´aval 93,6%-os tal´alati ar´anyt siker¨ ult el´erni, ami 6%-kal gyeng´ebb, mint az ide´alis sarokpontok esete. A 20-20 elem˝ u tan´ıt´ o halmaz nem hozott sz´amottev˝o v´altoz´ast, mind¨ossze 3 kocsival hib´azott el t¨ obbet az oszt´ alyoz´ o, ´ıgy 93,1%-ot ´ert el. V´eg¨ ul a keresztvalid´aci´os teszt tov´abbi 2 aut´ ot oszt´ alyozott sikertelen¨ ul, ezzel 93%-os eredm´enyt el´erve. A teljesen automatikus m´odszer eset´en tov´abbi 5%-os es´es k¨ovetkezik be a felismer´esi ar´ anyban. A tan´ıt´o halmaz m´eret´et˝ol f¨ uggetlen¨ ul 88% k¨or¨ uli ered¨ m´enyeket kaptunk. Osszehasonl´ ıt´ask´ent, az [1] cikkben a szerz˝ok ´altal javasolt automatikus m´ odszer a k´etf´ele adatb´azisukon 93,3%-os, valamint 87,7%-os eredm´enyt adott.
5.
¨ Osszegz´ es
A szakirodalomban le´ırt m´ odszernek siker¨ ult olyan m´odos´ıt´asait l´etrehozni, amelyek egy val´ os gyakorlati alkalmaz´asn´al el˝ofordul´o f´enyk´epeken is k´epesek g´epko-
306
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
csi gy´ art´ o ´es t´ıpus azonos´ıt´ asra. L´attuk, hogy megfelel˝o m´odos´ıt´asokkal a tal´alati ar´ any ak´ ar 100% k¨ ozel´ebe is emelhet˝o 10 oszt´aly eset´en. A robusztuss´agot m´er˝o tesztekb˝ ol kiindulva elk´esz¨ ult a f´elautomata (93%) ´es automata (88%) v´altozat, amelyek a v´ artnak megfelel˝ oen, az ide´alis esetn´el rosszabbul, de ¨osszess´eg´eben elfogadhat´ o hibasz´ azal´ekkal teljes´ıtettek. A szegment´al´asi elj´ar´as jav´ıt´as´aval az eredm´enyek tov´ abbi javul´ asa v´arhat´o. Az algoritmus teh´at sk´al´azhat´o olyan ´ertelemben, hogy az aktu´ alis ig´enyeknek megfelel˝oen eld¨onthet˝o, hogy a fut´asi id˝ o vagy a nagyobb tal´ alati ar´any a fontos. Egy lehets´eges gyakorlati megval´os´ıt´as lehet p´eld´aul egy mobilalkalmaz´as, ahol a felhaszn´ al´ o mobiltelefonja seg´ıts´eg´evel lef´enyk´epez egy aut´ot ´es elk¨ uldi azt a k´epet egy nagyobb sz´ am´ıt´asi kapacit´as´ u kiszolg´al´onak, ami p´ar m´asodpercen bel¨ ul visszak¨ uldi a k´epen l´ athat´o kocsi pontos t´ıpus´at, esetleg az ´evj´arat´at is. L´ athat´ o volt, hogy az oszt´alyoz´as sor´an sehol sem haszn´altuk ki, hogy g´epkocsikat szeretn´enk felismerni. Egyed¨ ul csak a ROI kijel¨ol´es volt feladat f¨ ugg˝o, hiszen a rendsz´ amt´ abla alapj´an hoztunk l´etre a vizsg´aland´o ter¨ uletet. Ebb˝ol az is ´erezhet˝ o, hogy a t´ argyalt m´ odszer sz´amos egy´eb felismer´esi feladatra is alkalmas lehet, ahol valamilyen m´ odon lehet˝os´eg van egy, a felismerni k´ıv´ant objektumokra jellemz˝ o ROI kijel¨ ol´es´ere. Az algoritmus viszonylag k¨onnyen implement´alhat´o l´ep´esekb˝ ol ´ all ´es megfelel˝ o be´all´ıt´asok mellett, ak´ar n´eh´any tized m´asodperc alatt k´epes lehet eredm´enyt szolg´altatni.
K¨ osz¨ onetnyilv´ an´ıt´ as ´ Jelen kutat´ ast a futurICT.hu nev˝ u, TAMOP-4.2.2.C-11/1/KONV-2012-0013 azonos´ıt´ osz´ am´ u projekt t´ amogatta az Eur´opai Uni´o ´es az Eur´opai Szoci´alis Alap t´ arsfinansz´ıroz´ asa mellett.
Irodalom 1. V.S. Petrovic and T.F. Cootes, “Analysis of Features for Rigid Structure Vehicle Type Recognition”. British Machine Vision Conference, pp. 587–596, 2004. 2. G. Pearce and N. Pears, “Automatic Make and Model Recognition from Frontal Images of Cars”. in Proc. of 8th IEEE International Conference on Advanced Video and Signal-Based Surveillance, IEEE, pp. 373–378, 2011. 3. J.R. Parker, “Algorithms for Image Processing and Computer Vision”. Wiley, 2011. 4. D. Kellner, “Region Growing Implementation”. http://www.mathworks.com/matlabcentral/fileexchange/32532-region-growing2d3d-grayscale/content/regionGrowing.m 5. O. Martinsky, “Algorithmic and Mathematical Principles of Automatic Nuber Plate Recognition Systems”. BSc Thesis, Brno University of Technology, 2007. 6. A. Psyllos, C.N. Anagnostopoulos, E. Kayafas, “Vehicle model recognition from frontal view image measurements”. in Computer Standards and Interfaces, ELSEVIER, pp. 142–151, 2011.
307
KÉPAF 2013 – a Képfeldolgozók és Alakfelismerők Társaságának 9. országos konferenciája
7. X. Clady, P. Negri, M. Milgram, R. Poulenard, “Multi-class Vehicle Type Recognition System”. in 3rd IAPR workshop on Artificial Neural Networks in Pattern Recognition, Springer-Verlag, pp. 228-239, 2008. 8. M.Saquib Sarfraz, Ahmed Saeed, M.Haris Khan, Zahid Riaz, “Bayesian Prior Models for Vehicle Make and Model Recognition”. in 7th International Conference on Frontiers of Information Technology, ACM, Article No. 35, 2009. 9. Meena AbdelMaseeh, Islam Badreldin, Mohamed F. Abdelkader and Motaz El Saban, “Car Make and Model recognition combining global and local cues”. Microsoft Research, Advanced Tehcnology Labs in Cairo, Egypt, ICPR, 2011. 10. Bailing Zhang and Yifan Zhou, “Vehicle Type and Make Recognition By Combined Features and Rotation Forest Ensembel”. in International Journal of Pattern Recognition and Artificial Intelligence, 2012. 11. V.S. Petrovic and T.F. Cootes, “Vehicle Type Recognition with Match Refinement”. ICPR, 2004.
308