2007/12 – 11.4.2007
Lokalizace obličeje v obraze s komplexním pozadím Ing. Jan VLACH, Ing. Jiří PŘINOSIL
[email protected],
[email protected] Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií, Ústav telekomunikací, Purkyňova 118, 612 00 Brno, Česká republika.
Tento článek představuje jeden z možných přístupů při detekci obličeje v obraze s komplexním pozadím. V první části je uveden stručný přehled nejčastěji používaných metod pro lokalizaci obličeje v obraze. Na základě porovnání jejich vlastností byla použita vhodná kombinace několika z nich s určitými navrženými modifikacemi tak, aby bylo dosaženo ideálního poměru rychlosti zpracování, přesnosti a robustnosti. Výsledný algoritmus byl realizován v programovém prostředí Matlab a jeho úspěšnost testována na snímcích z obličejové databáze Georgia Tech face database.
1
Úvod
V posledních letech dochází k zlevnění a zkvalitnění počítačové a snímací techniky, což vede k jejímu masivnímu rozšíření. Počítače musí být stále častěji schopny interakce s okolním prostředím, zejména s člověkem. Tyto důvody mají za následek zvětšující se zájem o výzkum na poli počítačového rozpoznávání objektů. Snad nejvíce energie bylo věnováno rozpoznávání lidského obličeje. Zejména proto, že nachází uplatnění v mnoha oborech (biometrie, dohledové systémy, uživatelské rozhraní, obsahové kódování obrazu), a dále pro komplexnost celého problému s mnoha nejednoznačnými řešeními. Detekce obličeje tvoří první krok v systémech pro rozpoznávání obličeje a jeho případnou analýzu. Na její úspěšnosti závisí úspěšnost celého dalšího zpracovávání. Lidský obličej je velmi různorodý co do tvaru i barvy kůže. Detekční algoritmus se mimo jiné musí vypořádat s různým osvětlením scény, úhlem kamery, nebo natočením a výrazem tváře, hledaný objekt tedy může být velmi proměnlivý. Složitosti úkolu je úměrná nespočetnému množství řešení, které během výzkumu vznikly. Metody využívají znalostí a postupů z mnoha vědeckých oblastí jako je zpracování obrazu, pravděpodobnost a statistika, maticový počet, umělá inteligence, fuzzy logika nebo spektrální analýza.
2
Metody detekce obličeje v obraze
V současnosti existuje řada způsobů jak detekovat obličej v obraze, na základě přístupu lze metody detekce pro obličeje rozdělit do čtyř hlavních tříd [1]. • Znalostní metody – tvář je hledána na základě definovaných pravidel, které popisují „typickou tvář“. Pravidla většinou vyjadřují vztahy mezi částmi obličeje. Tato metoda vyžaduje velmi precizní lokalizaci a popis jednotlivých příznaků, což vede k nutnosti 12-1
2007/12 – 11.4.2007 použití složitých a robustních algoritmů. Z tohoto důvodu tyto metody zpravidla nedosahují požadovaných výsledků. • Invariantní rysy – detekce na základě obecně platných rysů lidské tváře, které nepodléhají změněným podmínkám osvětlení nebo natočení obličeje. Těmito rysy mohou být buď obličejové příynaky(oči, nos atd.), obličejová textura a nebo barva obličeje. Výhodou těchto metod je snadná a rychlá implementace s kvalitními výsledky. • Srovnávání šablon – hledání na základě korelace obrazu s přednastavenými šablonami buď celého obličeje nebo jeho částí. Nevýhodou tohoto přístupu je nutnost vytvořit a mít uloženy v paměti jednotlivé šablony, které je potřeba většinou ručně vytvořit, což je velmi pracné a časově náročné. • Metody založené na zjevu – modely obličeje jsou získány učením z trénovaní množiny, která obsahuje různé vzory tváří. Detekce probíhá srovnáváním částí obrazu s tímto modelem. Opět je zde nutnost vytvořit modely obličeje, i když učení většinou probíhá poloautomaticky. Metody založené na tomto přístupu dosahují velmi dobrých výsledků. Z výše uvedených důvodů se pro naši realizaci jeví nejperspektivněji metody založené na invariantních rysech. V další části jsou jednotlivé metody tohoto přístupu stručně popsány.
2.1
Metody založené na invariantních rysech
Společným jmenovatelem těchto metod je předpoklad, že existují nějaké rysy, které mohou obecně popsat obličej nezávisle na jeho podobě nebo parametrech scény. Jednotlivé metody se ovšem rozcházejí v tom, jak invariantní rysy definovat a jakým způsobem je v obraze hledat. Některé metody vidí invariantní rysy v geometrickém uspořádání jednotlivých částí tváře, jako jsou oči, obočí nebo ústa. Extrakcí těchto částí hranovými detektory a vytvořením statistických modelů jejich vztahů je pak ověřována přítomnost obličeje v obraze. K rozlišení obličejů od ostatních objektů může být použita i jejich specifická textura nebo rozložení jasu.
2.1.1
Obličejové rysy
Tyto techniky se zaměřují přímo na hledání obličejových rysů jako jsou oči, ústa, nos apod. Využívají se různé matematické transformace k zvýraznění těchto rysů vůči zbytku obličeje či celému obrazu. Mezi tyto techniky patří např. detekce hran a další filtrační metody [2]. Pokročilejší algoritmy využívají znalosti, že jedna část obličeje má určitou vzdálenost od jiné popř. ostatních částí, dále se využívá pravděpodobnosti, kde se daná část má nacházet, ale také pravděpodobnost, kde daná část být nemůže. Příkladem může být prostý fakt, že klasifikátor by neměl vyhodnotit testovaný objekt, kde rty se nacházejí mezi očima a nosem, jako obličej. Tato metoda selhává zejména pokud se testovaný obličej nachází v obraze s komplexním prostředím (velká míra hran a jiných strukturálních elementů).
2.1.2
Obličejové textury
Lidské obličeje mají zřetelnou strukturu, která se liší od ostatních objektů v obraze. Obvykle se oddělují do sebe kůže, vlasy a ostatní objekty v obraze. Využívá se barevné informace obrazu pro hledání obličejové textury [3]. Přestože je tato metoda poměrné rychlá, bývá využívána spíše při složitějších realizacích.
12-2
2007/12 – 11.4.2007
2.1.3
Barva kůže
Hledání oblastí barevně odpovídajících barvě kůže v barevném obraze se stalo velice účinnou a využívanou metodou v mnoha aplikacích [4]. Výhodou použití této metody je především rychlost, velmi malá citlivost na změnu světelných podmínek, necitlivost na velikost a úhel natočení tváře, věk, či pohlaví dané osoby. Dále pak ve velké míře umožňuje detekovat obličej s různými strukturálními komponenty obličeje (jako např. vousy, brýle, vlasy padající do čela apod.) a to i na velmi komplexním pozadí. Její největší slabinou ovšem je, pokud se hledaný obličej nachází v obraze, jehož pozadí je barevně shodné s předpokládanou barvou kůže. Proto je vhodné tuto metodu doplnit o rozšíření tak, aby tato nežádoucí vlastnost byla potlačena.
2.2
Detekce kůže
Základní princip všech metod vychází z pozorování, že barva lidské kůže sdílí určitý kompaktní podprostor v barevném prostoru [5]. Ohraničením tohoto prostoru lze modelovat barvu lidské kůže a pak klasifikovat barvu jednotlivých pixelů obrazu. Klasifikaci na základě barvy kůže lze rozdělit do tří hlavních kroků: • výběr vhodného barevného modelu, • zvolení modelu barvy kůže a jeho přesnost, • stanovení kritéria pro klasifikaci.
2.2.1
Výběr vhodného barevného modelu
Výzkum v oblasti kolorimetrie, zobrazování a zpracování obrazu přinesl mnoho barevných modelů s rozdílnými vlastnostmi. Tvar a kompaktnost podprostoru barev kůže se v jednotlivých modelech liší. Výběr vhodného barevného modelu je tedy zásadní pro mnoho metod klasifikace. Za základní barevný model používaný ve zpracování obrazu lze označit barevný model RGB (viz obr. 1, krychle RGB je identická s prostorem RGB ). Barva je definována složením tří základních barev (červená, modrá a zelená) o různé intenzitě. Vzhledem k tomu, že tento barevný model explicitně neodděluje jasovou a barevnou složku, není příliš využívaný. Televizní standard PAL i obrazový kompresní algoritmus JPEG používají barevný model YCbCr. Jde o transformovaný RGB model, kde Y reprezentuje jasovou složku, Cb a Cr barevné chrominanční složky (viz obr. 2, krychle RGB se transformovala ve specifický šestistěn). Vyznačuje se jednoduchým převodním vztahem [1] mezi oběma modely: Y 16 65.481 128.553 24.966 R Cb = 128 + − 37.797 − 74.203 112.000 ⋅ G Cr 128 112.000 − 93.786 − 18.214 B
12-3
(1)
2007/12 – 11.4.2007 Jednoduchost transformace a fakt, že z tohoto modelu vychází často používané formáty, zajistily velkou oblibu tohoto modelu mezi systémy pro klasifikaci.
obr. 1: barevný prostor RGB
2.2.2
obr. 2: barevný prostor YCbCr
Zvolení modelu barvy kůže a jeho přesnost
Podstatou barevné segmentace při detekci obličeje ve scéně, je rozdělení jednotlivých pixelů, podle jejich barevné hodnoty, na pixely barevně spadající do oblasti kůže a pixely, jejichž barevná složka barvě kůže neodpovídá [6]. Nejprve je ovšem nezbytné tuto barevnou oblast kůže nadefinovat. Explicitně lze oblasti barvy kůže vyjádřit podle pravidel, na základě rozložení vzorových barev kůže v barevném modelu. Toto rozložení je získáno experimentálně srovnáním různých testovacích vzorů (viz. obr. 3). Největší výhodou je lehká implementace a tím i velmi výrazná rychlost klasifikace. Kvalita výsledku je velmi závislá na vybraném modelu a přesnosti pravidel, která je nutno určit experimentálně.
obr. 3: vzorová šablona barvy kůže
12-4
2007/12 – 11.4.2007
B Y
G Cr
Cb
R obr. 4: podprostor barvy kůže v modelu RGB
obr. 5: podprostor barvy kůže v modelu YCbCr
Neparametrické modely rozložení barvy kůže Klíčová myšlenka tohoto přístupu je zjistit rozložení barvy kůže z trénovaní množiny bez explicitního vyjádření barevného podprostoru pomocí pravidel. Namísto toho je většinou konstruována takzvaná pravděpodobnostní mapa – jednotlivým bodům diskretizovaného barevného prostoru je přiřazena pravděpodobnost, s jakou má daný bod barvu kůže.
Parametrické modely Parametrické modely se snaží popsat tvar rozložení barvy kůže v rámci barevného modelu vhodným matematickým modelem. Parametry tohoto modelu jsou pak získány z trénovaní množiny. Podprostor barvy kůže má ve většině používaných modelů eliptický tvar a přibližně normální rozložení.
3
Algoritmus pro automatickou lokalizaci obličeje
Při realizaci algoritmu jsme vycházeli z předpokladu, že se v obraze může vyskytovat neomezené množství tváří v různém úhlu natočení a v různé vzdálenosti od snímací kamery, ale pro lokalizaci budeme uvažovat pouze ty, u kterých jsou viditelné obě oči i ústa a které dosahují alespoň minimální velikosti (přibližně 20×20 pixelů). Vlastní lokalizaci lze rozdělit do dvou částí, v první dochází k nalezení pravděpodobných obličejových kandidátů a v druhé jsou neodpovídající kandidáti na základě nalezené pozice očí a rtů vyřazeni.
3.1
Obličejové oblasti
V této části budeme pomocí barevné segmentace kůže, waveletové transformace a morfologických operací hledat pravděpodobné kandidáty obličejových oblastí. Pro barevnou segmentaci kůže bude použit námi vytvořený databázový model nejprve v binární reprezentaci později převedený na pravděpodobnostní reprezentaci.
12-5
2007/12 – 11.4.2007
3.1.1
Binární databáze vzorů
V našem případě jsme nejprve shromáždili dostatečný počet různých obrazových vzorků kůže (celkově přes 400 vzorků), které byly pořízeny třemi odlišnými snímacími zařízeními z různých obličejových částí přibližného počtu 50 lidí. Odtud jsme vytvořili databázi, která byla reprezentována tří-rozměrnou maticí o velikost 256×256×256, kde index každého prvku této matice zastupuje odpovídající barevnou hodnotu z barevného prostoru RGB a je nastaven buď na 1 (daná barevná hodnota spadá do barevné oblasti kůže) nebo 0 (daná barevná hodnota do prostoru kůže nespadá). Nyní jsme již byli schopni na základě srovnávání jednotlivých pixelů testovaného obrazu s touto naší databází vytvořit binární mapu, informující nás, které pixely z testovaného obrazu spadají do barevné oblasti kůže. Výhodou použití databáze, popisující barevnou oblast kůže, oproti matematickému modelu [7] je rychlost zpracování obrazu, ovšem za cenu větších nároků na paměť (je nutno mít v paměti uloženu databázi o velikosti přibližně 16 Mbitů). Avšak dle [8] i praktických pokusů, bylo zjištěno, že barevný prostor RGB není pro detekci obličeje příliš vhodný. V praxi se většinou používají odlišné barevné prostory jako YCbCr,HSV,RG apod. Pro naši aplikaci byl zvolen jako nejvhodnější barevný prostor YCbCr. Podle (1) jsme tedy provedli transformaci z barevného prostoru RGB do YCbCr a dále pracovali s tímto barevným prostorem.
3.1.2
Pravděpodobnostní databáze vzorů
Takovouto databázi lze avšak použít jen za předpokladu, že mimo obličejovou oblast se budou nacházet pixely barevně odpovídající barvě kůže jen velmi zřídka a ještě navíc se nebudou shlukovat ve větších významnějších celcích. Tyto podmínky lze splnit jen při umělém vytvoření snímané scény, což by v praxi nebylo příliš využitelné. Z tohoto důvodu převedeme podle četnosti výskytu jednotlivých barevných vzorků binární matici na matici pravděpodobnostní. Dále pak uvážíme, že barva kůže v obličeji je do značné míry homogenní, tj. její barevná hodnota se mění jen pozvolně. Odtud vyjdeme při další úpravě naší aplikace. Pro zrychlení dalšího zpracování nebudeme již při vyhledávání postupovat po jednotlivých pixelech, ale po blocích 3×3 pixelů. Pro každý pixel v příslušném bloku určíme podle pravděpodobnostní matice pravděpodobnost, že se svou barevnou hodnotou spadá do barevné oblasti kůže, a na základě porovnání prvního a druhého statistického momentu pravděpodobnosti všech pixelů v daném bloku s vhodným adaptivním prahem přiřadíme tomuto bloku buď jedničku (vysoká střední hodnota, nízký rozptyl – blok spadá do barevné oblasti kůže) nebo nulu (vysoká střední hodnota, nízký rozptyl – blok nespadá do barevné oblasti kůže). Takto jsme opět získali binární mapu odpovídající výskytu oblastí barevně spadající do barevné oblasti kůže, tentokrát ovšem má tato mapa oproti předchozí mapě třetinovou velikost a četnost výskytu pixelů nacházejících se mimo obličejovou plochu a spadajících barevně do barevné oblasti kůže je výrazně zredukována. Porovnání výsledků použití binární a pravděpodobnostní matice je možno vidět na obr. 6.
12-6
2007/12 – 11.4.2007
a
b
c
obr. 6: a) originální obraz, b) binární maska podle binární matice, c) binární maska podle pravděpodobnostní matice
Povšimněme si, že se nám sice podařilo zredukovat zobrazené pixely nenáležících do obličejové oblasti, ale zároveň došlo také k mírné redukci pixelů do této oblasti náležících. Je proto nezbytné provést filtraci pomocí dolní propusti (tj. rozmazání obrazu).
3.1.3
Waveletová transformace
I přes použití pravděpodobnostní matice se však v obraze nachází významné množství pixelů nespadajících do obličejové oblasti. Abychom tento počet ještě více zredukovali, podrobíme jasovou složku testovaného obrazu waveletové transformaci. Vycházíme při tom z předpokladu, že v obličeji lze ve vertikálním směru detekovat velmi výrazné přechody jasu v oblasti očí, rtů, apod., zatímco v horizontálním směru jsou tyto přechody zanedbatelné (zvláště pokud obličej splývá s pozadím). Použijeme tedy pouze detailní koeficienty waveletové transformace ve vertikálním směru prvního stupně rozkladu za použití daubeschiho vlnky 2. typu, kde vysoké hodnoty koeficientů určují přítomnost ostrého přechodu (očí, rtů apod.). Abychom těmito vysokými hodnotami byli schopni pokrýt větší plochu obličeje použijeme opět filtraci dolní propustí, tentokrát však vyjdeme z předpokladu, že je důležitější koeficienty roztáhnout více vertikálně než horizontálně (viz. antropologie obličeje) a proto použijeme speciální průměrovací funkci sinusoidního tvaru (obr. 7). Takto získané pole koeficientů upravíme na velikost binární mapy a s touto mapou vynásobíme.
obr. 7: impulsní charakteristika průměrovací funkce waveletových koeficientů
12-7
2007/12 – 11.4.2007
3.1.4
Morfologické operace
Pomocí waveletové transformace jsme redukovali všechny oblasti bodů, které byly ve vertikálním směru homogenní. Ovšem i přesto v binární mapě mohou zůstat body, které nepatří do obličejové oblasti a zatím splňovaly všechna námi stanovená kritéria. Nyní provedeme sérii morfologických operací uzavření a otevření (2) a (3) [9], jež mají za následek odstranění samostatně stojících bodů a seskupení ostatních bodů do kompaktních celků
X • B = ( X ⊕ B)ΘB ,
(2)
X o B = ( XΘB) ⊕ B ,
(3)
kde ⊕ odpovídá morfologické operaci dilatace (4) a Θ morfologické operaci eroze(5).
X ⊕ B = { p ∈ ε 2 : p = x + b, x ∈ X , b ∈ B} ,
(4)
XΘB = { p ∈ ε 2 : p + b ∈ X , ∀b ∈ B} ,
(5)
Tyto celky poté pomocí jednoduchého hranového detektoru a vhodného trasujícího algoritmu prostorově popíšeme. V našem případě jsme je popsali pomocí pravoúhlých čtyřúhelníků se souřadnicemi x1i,y1i,x2i,y2i, kde i udává pořadí čtyřúhelníku a x1,x2,y1,y2 jsou jeho počáteční a koncové souřadnice v horizontálním/vertikálním směru. Na základě poměru velikostí jeho jednotlivých stěn vyřadíme oblasti, které tvarově nevyhovují reprezentaci obličeje [10], dále pak vyřadíme takové oblasti, jež jsou příliš malé na to, aby nám poskytly o případném obličeji více informací. Na obr. 8 jsou znázorněny jednotlivé masky po průměrování, násobení waveletovými koeficienty a po morfologických operacích s výběrem vhodných obličejových kandidátů.
a
b
c
obr. 8: a) zprůměrňovaná binární maska, b) vynásobená zprůměrňovanými waveletovými koeficienty, c) po provedení morfologických operací s výběrem kandidátských oblastí
3.2
Lokalizace obličejových příznaků
Jak je ovšem z obr. 8c patrno, tak jsme stále ještě nevyloučily všechny oblasti, které nejsou oblastmi obličejovými. Provedeme tedy ještě poslední ověřovací test pro vybrané kandidáty, a to nalezení pozice úst a očí. K tomu problému budeme přistupovat pomocí tzv. barevných
12-8
2007/12 – 11.4.2007 map jednotlivých kandidátských oblastí. Nejprve se zaměřme na lokalizaci rtů, jelikož tato část obličej je z velké míry invariantní vůči rotacím hlavy a případným strukturálním komponentům obličeje (vousy, brýle apod.).
3.2.1
Lokalizace úst
V první části provedeme barevnou transformaci FLD [11] (6), která vychází z předpokladu, že barevná skladba rtů se sestává z vysoké hodnoty červené a velmi nízké modré barvy modelu RBG. Bohužel se tato barevná skladba u různých lidí liší a pomocí transformace FLD nejsme schopni všechny možnosti postihnout, z toho důvodu ještě zavedeme barevnou transformaci rg [12](7), která bude v některých případech transformaci FLD doplňovat. R FLD = [−0.289 0.379 0.038] ⋅ G , B
r=
R ( R + G + B)
g=
G . ( R + G + B)
(6)
(7)
Z této transformace budeme využívat pouze složku g, protože složka r se neukázala kvůli redundatnosti a malému rozptylu příliš vhodná. Výsledkem jsou dvě podobné barevné mapy úst jež jsou zobrazeny na obr. 9 (můžeme si povšimnout, že v obou barevných mapách dosahují oblasti odpovídající rtům velmi nízkých hodnot). Nevýhoda použití těchto barevných transformací je možnost výskytu části pozadí s velmi vysokou hodnotou červené a velmi nízkou hodnotou modré barvy (například červený šátek kolem krku apod.). Využijeme však faktu, že máme k dispozici zprůměrňovanou binární masku předpokládaného obličeje, tudíž budeme zpracovávat pouze ty části obrazu, které tato binární maska postihuje. Dalším problémem při lokalizaci rtů může být případ, kdy se červená barva ve větším množství vyskytuje na samotném obličeji (např. silně načervenalé tváře). Využijeme již provedené waveletové transformace ve vertikálním směru (rty se ve vertikálním směru jeví jako ostrý přechod, zejména pokud jsou ústa otevřená) a waveletovými koeficienty vynásobíme obě barevné mapy. Nyní jednotlivé mapy převedeme na binární obraz, pomocí prahování (hodnoty prahů jsou získány na základě histogramů jednotlivých barevných map). Tyto dva binární obrazy sloučíme pomocí vztahu (8) a na výsledný celek aplikujeme algoritmus mean shift [13], jehož výsledkem jsou souřadnice oblasti odpovídající s největší pravděpodobnosti rtům.
1 BinarníObr. = ⋅ ( BinárníObr.1 + BinárníObr.2) + 3 ⋅ BinárníObr.1 ⋅ BinárníObr.2 4 4
12-9
(8)
2007/12 – 11.4.2007
a
b
c
obr. 9: a) barevná mapa g a její binární obraz, b) barevná mapa FLD a její binární obraz, c) výsledný binární obraz dle rovnice (8)
3.2.2
Lokalizace očí
Při lokalizaci očí budeme postupovat obdobně jako při lokalizaci rtů, zde však použijeme pouze jedinou barevnou mapu [14] (9), jelikož barva zornice a bělma je u většiny velmi podobná. Příklad barevné mapy očí je znázorněn na obr. 10 (oblasti odpovídají očím dosahují vysokých hodnot). I zde využijeme zprůměrňovanou binární masku obličeje kvůli rušivým vlivům pozadí (např. bílý límec košile) a aplikujeme násobení waveletovými koeficienty (pro případ zavřených či přivřených očí, kdy se uplatní vliv obočí a očních řas). Barevnou mapu opět převedeme na binární obraz pomocí prahování (hodnota prahu získána z histogramu) a pomocí algoritmu meaning shift lokalizujeme pozice očí (zde je nutné brát v potaz pozici rtů, protože zuby dosahují také velmi vysokých hodnot v barevné mapě očí).
C 2 EyeMap = 1 ⋅ C b + (256 − C r ) 2 + b 3 Cr
a
b
(9)
c
obr. 10: a) barevná oční mapa, b) její binární obraz, c)binární obraz vynásobený waveletovými koeficienty
12-10
2007/12 – 11.4.2007
3.3
Verifikace obličejových oblastí
Na základě vzájemných pozic a vzdáleností mezi rty, oběma očima a s přihlédnutím k vertikálním a horizontálním rozměrům předpokládaného obličeje stanovíme zda se o obličej jedná či nikoli [10]. V případě souhlasu jsou souřadnice obličeje v obraze včetně jeho rozměrů a pozicí očí a rtů uchovány pro další případné zpracování a obličej je zahrnut do výsledného obrazu. V opačném případě je kandidátská oblast zavržena. Touto detekcí jsou postupně podrobeny všechny kandidátské oblasti. Výsledek celého algoritmu je ukázán na obr. 11 (zelené tečky představují přibližnou pozici rtů a očí).
a
b
obr. 11: a) originální obraz, b) detekovaná tvář s vyznačením rtů a očí
4
Zhodnocení
Pro testování námi realizovaného algoritmu byla zvolena databáze Georgia Tech face database [15] , která obsahuje 750 snímků 50 subjektů (muži i ženy různé národnosti i věku). Výhodou této databáze oproti ostatním je, že obsahuje komplexní pozadí kombinované s pozadím barevně odpovídajícím barvě kůže, což představuje pro řadů algoritmů na lokalizaci obličeje značný problém, a dále pak již zmíněná různorodost subjektů, každý s několika různými úhly natočení hlavy, emocionálními výrazy, osvětlením a strukturálními doplňky obličeje (vousy, brýle apod.). Při testování bylo dosaženo úspěšnosti 93, 4%, což vzhledem ke komplexnosti databáze lze považovat za velice slušný výsledek. Hlavní příčinou neúspěšné lokalizace bylo zejména nedostatečné potlačení barevného vlivu pozadí na obličej pomocí waveletových koeficientů, bylo by proto vhodné v budoucí práci nalézt vhodnější způsob separace anebo tento způsob modifikovat. Dalším problémem byla přítomnost hustých vousů, kdy rty již nespadaly do obličejové oblasti a obličejový kandidát musel být tedy zavržen. Tomuto by šlo předejít vertikálním rozšířením oblasti při lokalizaci rtů i mimo kandidátskou obličejovou oblast.
Tato práce vznikla v rámci řešení projektů GA102/07/1303 a je podporována Národním výzkumným programem "Informační společnost" Akademie věd České republiky, ev. č. 1ET301710509.
12-11
2007/12 – 11.4.2007
Literatura [1]
Yang, Ming-Hsuan, Detecting Faces in Images: A Survey. IEEE Transactions on pattern analysis and macgine intelligence. January 2002, Vol. 24, 1.
[2]
K. C. Yow and R. Cipolla, Feature-Based Human Face Detection, Image and Vision Computing, 1997, vol. 15.
[3]
M. F. Augusteijn, T.L. Skujca, Identification of Human Faces through Texture-Based Feature Recognition and Neural Network Technology, Proc. IEEE Conf. Neural Networks, 1993.
[4]
M. J. Jones, J.M. Rehg, Statistical Color Models with Application to Skin Detection, Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1999, Vol. 1.
[5]
H. P. Graf, T. Chen, E. Petajan, and E. Cosatto, Locating Faces and Facial Parts, Proc. First Int’l Workshop Automatic Face and Gesture Recognition, 1995.
[6]
S. Kr. Singh, D. S. Chauhan, M. Vatsa, R. Singh, A Robust Skin Color Based Face Detection Algorithm, Tamkang Journal of Science and Engineering, 2003, Vol. 6.
[7]
C. Garcia, G. Zikos, G. Tziritas, Face Detection in Color Images using Wavelet Packet Analysis, IEEE Int. Conf. on Multimedia Computing and Systems, 1999.
[8]
S. Kawato, J. Ohya, Automatic Skin-color Distribution Extraction for Face Detection and Tracking, ICSP2000: The 5th Int. Conf. on Signal Processing, August 2000, Beijin, China.
[9]
van den Boomgaard, van Balen, Image Transforms Using Bitmapped Binary Images, Computer Vision, Graphics, and Image Processing: Graphical Models and Image Processing, May, 1992.
[10] J. W. Young, Head and Face Anthropometry of Adult U.S. Civilians, U. S. Government Printing Office, 1993. [11] Chaloupka, J., Rozpoznávání akustického signálu řeči s podporou vizuální informace, disertační práce Technická univerzita v Liberci, 2005. [12] Stern H, Efros, B., Adaptive Color Space Switching for Face Tracking in Multi-Colored Lighting Environments, Proceedings of the fifth IEEE International Conference on Automatic Face and Gesture Recognition, 2002. [13] Toth, D., Stuke, I., Wagner, A., Aach, T., Detection of Moving Shadows using Mean Shift Clustering and a Significance Test, Proceedings of the 17th International Conference on Pattern Recognition, August 2004. [14] P. Campadelli, F. Cusmai, and R. Lanzarotti, A Color-Based Method for Face Detection, Proceedings of the International Symposium on Telecommunications (IST2003), August 2003.pp. 186-190 [15] Ara. V. Nefian, Georgia Tech face database, http://www.anefian.com/face_reco.htm
12-12