Tobii Studio filtry Text převzat z materiálů firmy Tobii Technology AB
I-VT filtr Základní myšlenka při použití I-VT filtru je klasifikovat pohyby očí na základě rychlosti směrových posunů oka. Rychlost se nejčastěji uvádí vizualizací stupňů za sekundu (° / s). Je-li rychlost pohybu očí pod určitou prahovou hodnotu, vzorky jsou klasifikovány jako součást fixace. Tobii I-VT filtr je vyvinut pro práci na stacionárních očních trackerech. Vzhledem k tomu filtr I-VT vyžaduje přesné zjištění 3D polohy očí a může dojít k selhání správné klasifikace dat sledování očí z nahrávek s předchozími verzemi Tobii Studia, kde byly použity řady Tobii X očních trackerů (samostatný očí tracker bez vestavěného monitoru – promítání projektorem na zeď). Fixace z filtru I-VT se rovněž nepodaří správně klasifikovat z dat sledování očí zaznamenaných Tobii brýlemi, i když fixace filtru I-VT můžou být povoleny ve výchozím nastavení při analýze snímků. Uživatelé Tobii brýlí by měli než I-VT fixace filtru použít spíše Raw filtr dat. Výchozí hodnoty I-VT parametrů fixace filtru byly nastaveny tak, aby poskytovaly přesné klasifikace fixace pro nejběžnější případy sledování očí, např. web stránky, průzkumy trhu a standardní studie pro čtení. Nicméně, v závislosti na typu oka může být prováděna úprava tak, aby lépe vyhovoval zejména dané studii, aby byly zobrazeny jemnější fixace dat, nebo kompenzace vysokých hladin hluku.
Gap fill-in (interpolace) – základ I-VT filtru Účelem Gap fill-in funkce je vyplnit údaje, kde chybí platná data. Například, aby se preventivně zabránilo fixaci, které několik vzorků chybí a nebyla vykládána jako dva samostatné záznamy. K takové ztrátě platných dat může dojít v důsledku dočasných odrazů v očích, nebo brýlích účastníka. V těchto případech je ztráta dat obvykle omezena na krátkou dobu, obvykle méně než 50 ms. Data mohou být také ztracena z jiných oprávněných důvodů, jako například mrknutí, nebo odvrácení se od sledované plochy. Tyto datové ztráty pak mohou mít za následek nedostatky v údajích delší než 100 ms. Ztráta dat v těchto případech může být naprosto v pořádku, pokud účastníci nic nevidí, nebo když často mrkají, nebo odvrátili zrak. Uživatel Tobii Studia může ovládat limit velikosti rozdílů z údajů, které by měly být vyplněny nastavením parametru "Maximální délka mezery (Max gap length)". Výchozí hodnota "Max. délky mezery" je 75 ms. Podle Komogortseva et. al 2010, je minimální doba mrknutí 75 ms. Data jsou vyplněna v mezeře dat pomocí lineární interpolace. Datové body se přidají po přímce mezi sousední platné datové body. Interpolace se provádí pro každé oko zvlášť. Komogortsev et. Al. 2010. Standardizace automatizovaných analýz okohybných fixací a sakádické chování. IEEE Přenosy biomedicínského inženýrství, sv. 57 (11), str. 2635-2645.
Eye selection Výběr oka/očí. Standardní nastavení je průměr z obou očí, tzn. pokud jdou data alespoň z jednoho oka, nejlépe z obou, pak lze data analyzovat. Lze vybrat přísný průměr – musí být data z obou očí, levé, nebo pravé oko.
Redukce šumu – klouzavý průměr – moving average Všechny měřicí systémy, včetně očních trackerů se setkávají se šumem. Šum může pocházet z nedostatků v nastavení systému, stejně jako z vlivů a rušení z prostředí, ve kterém probíhá měření. V
očním sledování, kde jsou fixace pohybů očí zájmem měření a vznikají další drobné pohyby očí, jako je třes, a mikrosakády (Yarbus 1967), může také být viděn šum. V nejzákladnější podobě, I-VT filtry vypočítávají rychlosti vynásobením změny v poloze mezi dvěma po sobě následujícími body vzorků se vzorkovací frekvencí. Pokud je vzorkovací frekvence nízká, oko bude mít čas udělat dost velké posuny směrem mezi dvěma vzorky, což je pro tracker oka jednodušší rozlišovat mezi skutečnými očními pohyby a šumem. Čím vyšší je vzorkovací frekvence, tím menší pohyb očí bude mezi dvěma po sobě jdoucími vzorky při dané rychlosti očí. Šum bude tedy mít větší dopad na vysokofrekvenční systém, i když jde o stejnou vzdálenost jako v nízko frekvenčním systému. Redukce šumu (klouzavý průměr), funkce je symetrický klouzavý průměr filtru. Ten produkuje výstupní data tvořená aritmetickou střední hodnotou počtu datových bodů ze vstupních dat. Čísla vstupních datových bodů jsou použita k výrobě každého výstupního bodu, jež jsou řízeny parametrem velikosti okna. Každému vytvořenému výstupnímu datovému bodu je dáno časové razítko datového bodu vstupu, který byl ve středu okna: vstupní medián (parametr velikost okna musí být liché číslo). Velikost okna je dynamicky upravována tak, aby se okno nikdy nerozprostíralo mimo platné datové řady. Výchozí hodnota parametru velikosti okna jsou 3 vzorky, což je nejnižší možná hodnota, která má vliv na data. Pomocí aplikace VelocityChart se zkoumají účinky na snížení hluku při použití a nastavení parametrů ve funkci redukce šumu. Yarbus L. 1967. Pohyby očí a vidění. Přeloženo z ruského vydání (Moskva, 1965), Basil Haigh. Lorrin A. Riggs, Překlad Ed. Plénum, New York, 1967. Xiv + 222 s.
Redukce šumu – klouzavý medián – moving median Statisticky, funkce klouzavého mediánu je funkce optimální pro obnovu pohybu očních dat v oku při sledování datové řady v případě, že výkyvy jsou normálně rozděleny, jako je například šum kolem fixace. Nicméně, při normálním rozdělení zde není místo na vysokou pravděpodobnost velké odchylky, které se vyskytují během sakád. To vysvětluje, proč nevzniká výrazné rozhraní mezi fixací a sakádou ba dochází k vyhlazení ve výstupních datech. V případě odchylek se předpokládá, že Laplaceova distribuce, klouzavého mediánu je statisticky optimální. Pro dané odchylky, Laplaceova distribuce klade vyšší pravděpodobnost na náhody, jako jsou sakády než je tomu v normální distribuci. To vysvětluje, proč klouzavý medián funkce redukce šumu toleruje sakády lépe než funkce klouzavého průměru snížení šumu a proč medián odrušovacího filtru redukuje lépe amplitudu sakády rychlosti. Funkce redukce šumu je symetrický klouzavý medián filtru. Ta vytváří výstupní data výpočtem střední hodnoty z řady po sobě jdoucích datových bodů z datové řady vstupu. Počet vstupních datových bodů používá k výrobě každého výstupního datového bodu, který je řízen parametr velikosti okna. Každý vytvořený výstupní datový bod je vzhledem k časovému razítku vstupních dat bodem, který byl ve středu okna: střední bod vstupního okna (parametr velikost okna musí být liché číslo). V případě, že okno není zcela naplněné datovými vstupními body, nebudou vytvořeny žádné výstupní data. Okno může být malé z datových bodů vzhledem k tomu, že se táhne okno mimo datové řady s platného pohledu, nebo malé frakce dat bodů v okně chybí. Typicky, okno se táhne mimo platné datové řady na začátku a na konci mrknutí, nebo na začátku a na konci záznamu. Ke ztráta malých frakcí dat může dojít v důsledku přechodných odrazů, okluzí, atd., a lze to částečně vyřešit pomocí vyplňování funkcí Gap fill-in (interpolace) - výchozí nastavení pro I-VT.
Velocity calculator Funkce Velocity kalkulátor přiřadí úhlovou rychlost (vizuální stupňě/sekunda), aby pohled zachytil datový bod. Úhlová rychlost se týká úhlové rychlosti očí a je relativní při vnímání oka na podněty vzhledem k oční bulvě. Kalkulační rychlost je povinná ve fixační filtru I-VT a pracuje na úhlové rychlosti.
Funkce Velocity kalkulátor odhaduje úhlové rychlosti očí "pro každý datový bod vydělením úhlových rozdílů mezi předchozím a následným datovým bodem s časovým intervalem mezi nimi. Časový interval se nastavuje parametrem. Velocity kalkulátor bude fungovat pouze u výstupních dat a to v případě, že celé okno obsahuje vstupní data. To znamená, že mezery ve vstupních datech (jako jsou ty způsobené mrkáním) budou mít za následek větší mezery ve výstupních datech. Velikost mezery výstupu bude stejná jako vstupní mezera plus počet datových bodů, které převezme z okna. Výchozí hodnota délky parametru je 20 ms.
I-VT Classifier I-VT fixace klasifikátor aplikuje úhlový práh rychlosti na každý datový bod. Prahová hodnota je uvedena ve stupních / sekundu a upraví nastavení parametru práhu rychlosti v dialogovém okně filtru fixace. Datové body s úhlovou rychlostí pod prahovou hodnotou jsou klasifikovány "fixací" a datové body výše, jsou klasifikovány jako "sakády". Práh má výchozí rychlost hodnoty 30 stupňů/sekunda. Výchozí hodnota byla vybrána na základě Tobii interního testování, jakož i přezkoumává očím sledováním dle literatury, např. Rayner, K. et. al. (2007), Over et al. (2007) and Komogortsev et. Al (2010). Komogortsev et. Al. 2010. Standardization of Automated Analyses of Oculomotor Fixation and Saccadic behaviors. IEEETransactions on Biomedical Engineering, vol. 57 (11), pp. 2635-2645. Rayner K., Li X., Williams C.C., Cave K.R., Well A.D., 2007 Pohyby očí během úloh zpracování informací:. Individuální rozdíly a kulturní vlivy. Vision Research, sv. 47 (21), str. 2714-2726. Over E.A.B., Hooge I.T.C., Vlaskamp B.N.S. a Erkelens C.J., 2007. Coarse-to-fine eye movement strategy in visual search.. Vision Research, sv. 47 (17), str. 2272-2280.
Merge adjacent fixations Účelem funkce Sloučení sousedních fixací je sloučit fixace, které byly nesprávně rozděleny na více záznamů. Šum a jiné poruchy mohou způsobit, že I-VT klasifikátor nesprávně zařadí datové body, které by měly patřit k fixaci jako ty, které nejsou součástí. Tím vznikne rozdělení fixací na více záznamů, které jsou umístěny blízko u sebe. Sloučení se sousední fixací pomocí funkce lze nastavit na sloučení těchto více fixací do jedné fixace. Funkce Sloučení sousedních fixací má dva mezní parametry: • Maximální doba mezi fixací definuje maximální časový interval mezi samostatnými záznamy, které by měly být sloučeny. Výchozí hodnota maximální doby mezi fixací je 75 ms, což je méně času, než účastníci budou muset provést při fixaci a pak znovu na plochu předcházející fixace. Salojärvi et. Al. (2005). • Maximální úhel mezi fixací definuje maximální úhel pohledu z očí mezi jednotlivými záznamy, které by měly být sloučeny. Výchozí hodnota maximálního úhlu mezi fixacemi je 0,5 stupňů, což je pro kompenzaci běžných hladin šumů zatímco se neztratí příliš mnoho jemných dat fixací. Navíc hodnota 0,5 stupňů umožňuje provést filtraci. Salojärvi J., Puolamäki K., Simola J., Kovanen L., Kojo I., and Kaski S. 2005. Inferring relevance from eye movements: Feature extraction.Technical Report. Publications in Computer and Information Science, Espoo, Finland. PASCAL EU Network of Excellence challenge. Komogortsev et. Al. 2010. Standardization of Automated Analyses of Oculomotor Fixation and Saccadic Behaviors. IEEETransactions on Biomedical Engineering, vol. 57 (11), pp. 2635-2645.
Yarbus L. 1967. Eye Movements and Vision. Translated from the Russian edition (Moscow, 1965) by Basil Haigh. Lorrin A. Riggs, Translation Ed. Plenum, New York, 1967. xiv + 222 pp.
Discard short fixations Účelem funkce Smazání krátkodobé fixace je odstranit nesprávně klasifikované fixace, které mají příliš krátkou dobu trvání, aby se staly skutečné fixace. Obvykle fixace, které mozek potřebuje, aby se začal tvořit vizuální vstup a chvíli před tím, než má dostatek dat, aby byl schopen fixaci zpracovat (pokud je sbírána v tomto vizuálním vstupu), nemůže být nekonečně krátký. Funkce Smazání krátkých fixací může být nastavena na odstranění těchto nesprávně klasifikovaných fixací. Smazání krátkých fixací lze také použít ke snížení časového rozlišení fixačních údajů. Salojärvi J., Puolamäki K., Simola J., Kovanen L., Kojo I., and Kaski S. 2005. Inferring relevance from eye movements: Feature extraction. Technical Report. Publications in Computer and Information Science, Espoo, Finland. PASCAL EU Network of Excellence challenge. Komogortsev et. Al. 2010. Standardization of Automated Analyses of Oculomotor Fixation and Saccadic Behaviors. IEEETransactions on Biomedical Engineering, vol. 57 (11), pp. 2635-2645.
Tobii Fixation Filter Tobii Fixační Filtr je implementace klasického algoritmu navrženého Olssonem (2007) a je v současné době používán jako výchozí fixační algoritmus pro Tobii Studio. Algoritmus se chová obdobně jako I-VT filtr, který detekuje rychlé změny v pohledu bodu pomocí posuvné metody průměrování. Za předpokladu, že se oči pohybují mezi dvěma různými fixacemi, následující rozdíly jsou: • Je-li segment signálu konstantní, nebo pomalu se měnící okolo střední hodnoty v důsledku unášení, vytváří se jako jedna fixace. • Dojde-li k náhlé změně v umístění fixací, oči se přestěhovaly do jiné fixační polohy. Algoritmus je navržen tak, že vždy, když zjistí změnu v průměru, je schopen skupinu dat umístit do samostatných fixací. Když se tak stane, můžeme odhadnout prostorové polohy jednotlivých fixací na základě informací obsažených v jeho časovém horizontu. Před fixací je algoritmu aplikován na data, systém prochází data nahrávání a identifikuje části s chybějícími údaji. Filtr pak interpoluje chybějící data pro oddíly, které mají délku pod 100 ms (6-7 datových bodů při 60 Hz) a rozbije data nahrávání nastavením do podskupin. Pokud jsou sekce větší než 100 ms. Následující kroky jsou pak aplikovány na každou podmnožinu dat nezávisle. Nejprve se funkce [dif] vypočítá jako rozdíl vektoru dvou datových bodů oken nacházejících se před a po proudu pohledu dat. Každé okno má pevný počet [r] pohledů datových bodů a rozdíl se vypočte s použitím průměrné X a Y souřadnice těchto bodů. Pokud funkce dif byla vypočtena pro všechny datové body v záznamu, pak zjišťujeme špičkové hodnoty, tj. D hodnoty, které jsou větší než obě jeho hodnoty dvou nejbližších sousedů. Dále se prochází seznam vrcholů ještě jednou a odstraňují se všechny vrcholy, které jsou menší, než je nejvyšší vrchol v okně o poloměru r. Vrcholy jsou potom přidány do seznamu s podmínkou, že jsou přinejmenším stejně velké jako uživatelsky definovaný práh - [h] Velocity Threshold. Skutečnost, že prahová hodnota je stanovena vzhledem k velikosti okna r znamená, že algoritmus se chová jako u I-VT filtru. Ve skutečnosti je však velikost okna pevně nastavena na 5 datových bodů, což
pak má stejný účinek, jako by byl dif vydělen 5 a práh byl h x 5 (například, v případě, že rychlost mezní hodnoty se nastaví na 35 pixelů, bude ekvivalentní nastavení prahové hodnoty pro (35 / (16,6 x 5) = 0.42 pixels/ms, pro 60 Hz očí tracker). Seznam vrcholů se pak zpracována do záznamů, kde jsou počáteční a koncové body fixace stanovených dvou po sobě jdoucích vrcholů. Prostorové polohy fixací se vypočítávají jako medián nefiltrovaných datových bodů v tomto intervalu. Po umístění každé fixace bylo stanoveno, že data fixací prochází z posledních opakování. První Euklidovská metrika provádí mezi všemi fixacemi výpočty a v případě, že vzdálenost mezi dvěma po sobě následujícími záznamy klesne pod uživatelem definované prahové hodnoty [d] - vzdálenostní práh, dvě fixace jsou sloučeny do jediné fixace. Tento postup se opakuje tak dlouho, dokud nejsou body fixací blíže k sobě, než je prahová hodnota. Proces identifikace fixace je pak tedy kompletní. Časové razítko fixace je převzato z prvního vzorku obsaženého ve fixacích a doba se měří od uplynutí doby mezi prvním a posledním vzorkem obsaženými ve fixacích. Tobii Fixační Filtr je ovlivněn vzorkovací frekvencí trackeru a rozlišením obrazu, výsledek se vypočítá v pixelech. Například nastavení 35 pixelů odpovídá 35 / (16,6 x 5) = 0.42pixels/ms prahu na trackeru s 60 Hz frekvencí snímání očí, zatímco na trackeru 300 Hz, oční práh bude 35 / (3,3 × 5) = 2.12pixels/ms. Vzhledem k počátečním chybějícím údajům interpolace, nejsou-li významné změny v postavení datových bodů před a po 100 ms chybějících údajů, zůstanou fixace beze změny, tj. jedna fixace. Nicméně, v případě, že po sobě jdoucí chybějící pohledové body dohromady tvoří více než 100 ms (67 datových bodů při 60 Hz), z chybějících údajů, fixace je rozdělena na dvě samostatné fixace, bez ohledu na jejich umístění. P. Olsson. 2007. Real-time and offline filters for eye tracking. Msc thesis, KTH Royal Institute of Technology, April 2007.