Projekt TE01020229 (Centrum digitální optiky) je řešen s finanční podporou TA ČR
Roční zpráva o stavu řešení projektu 2012
Dílčí výstup projektu TE01020229 (Centrum digitální optiky) Pracovní balíček: Management projektu Identifikační číslo výstupu: TE01020229DV001 Datum dosažení dílčího výstupu: 31. 12. 2012 Předkládá: doc. Mgr. Jaroslav Řeháček, Ph.D., řešitel projektu
Průběh řešení projektu v roce 2012 Projekt Centrum digitální optiky byl zahájen 1. března 2012 v souladu s návrhem projektu. Byla ustavena organizační struktury centra, nastaveny mechanizmy komunikace, vytvořeny intranetové i veřejné webové stránky, bylo zahájeno řešení projektu ve všech pěti pracovních balíčcích, byla prováděna kontrola stavu řešení 2x ročně na jednáních Řídícího výboru Centra, byl organizován Technický seminář Centra, kde byly prezentovány dosažené výsledky, byla důsledně implementována pravidla pro publicitu projektů financovaných TA ČR. Postup prací. Řešení projektu v roce 2012 probíhalo v souladu s plánem. Výsledky projektu byly prezentovány na prestižní konferenci SPIE Defense, Security, and Sensing 2012 v Baltimore. Některé výsledky dosažené nad rámec plánu byly publikovány. Týká se to zejména podpůrného teoretického a experimentálního výzkumu nových metod manipulace, detekce a zpracování optického signálu. Tyto nové ideje budou v dalších letech využity při aplikovaném výzkumu v rámci jednotlivých pracovních balíčků projektu. Výsledky jsou prezentovány v této zprávě. Podrobný popis postupu prací v roce 2012 je uveden níže v členění po jednotlivých pracovních balíčcích. Za zmínku stojí, že plnění plánu strategické výzkumné agendy pracovního balíčku Digitální zobrazování s podporou technologií PMS v roce 2012 naznačilo možnost nových technických a konstrukčních alternativ. V návrhu projektu se předpokládalo, že prostorová modulace světla bude realizována pomocí počítačem řízených optoelektronických zařízení, která využívají elektrooptického jevu v kapalných krystalech. V průběhu řešení projektu byly navrženy nové způsoby provedení PMS, které otevírají prostor pro náhradu dosud používaných modulátorů světla difraktivními prvky vyrobenými standardními technologiemi. Tato změna by měla zásadní význam pro konstrukci celého systému a kromě výrazného snížení nákladů by vedla k mnohem jednoduššímu a kompaktnějšímu technickému řešení. Pozitivní výsledek těchto aktivit nelze s dostatečnou jistotou zaručit, jejich význam je ale natolik zásadní, že bude vhodné možnost změny technologie PMS prověřit, i když tato činnost nebyla v návrhu projektu plánována. Čerpání prostředků. Plánované náklady projektu v roce 2012 byly 39 mil Kč, z toho 26 mil. Kč hrazených z veřejné podpory a 13 mil. Kč hrazených z neveřejných prostředků. V průběhu roku došlo k některým přesunům nákladů mezi pracovními balíčky a mezi jednotlivými kategoriemi nákladů v mezích povolených poskytovatelem. Tyto změny byly prováděny ve snaze využít prostředky projektu co nejúčelněji. V důsledku výše zmíněného pozdějšího než předpokládaného poskytnutí podpory došlo u některých účastníků projektu k mírnému nedočerpání prostředků. V dalších letech lze očekávat, že budou prostředky čerpány v plné výši. U účastníka Meopta-optika, s.r.o. došlo v průběhu roku ke změně druhu pořizované investice a výrazné změně pořizovací ceny investice. Tato změna neměla vliv na rozložení uznaných nákladů projektu. Změna byla oznámena poskytovateli a následně poskytovatelem schválena. Řešitelský tým. V průběhu roku nedošlo v řešitelském týmu k podstatným změnám s výjimkou změny zodpovědné osoby balíčku Multi senzorické a hyperspektrální zobrazovací systémy. Ukázalo se, že vlastní výzkumná činnost Dr. Radka Čelechovského bude úzce souviset s výzkumem prováděným v rámci balíčků Digitální ramanova spektroskopie a Ramanova optická aktivita a Digitální zobrazování s podporou technologie PMS. Dr. Čelechovský rozšíří své působení i do výzkumné a vývojové činnosti dalších dvou balíčků, čímž byla významně posílena provázanost těchto třech balíčků. Úvazek Dr. Čelechovského u společnosti Pramacom-HT, spol. s r.o. pokrývá jeho činnosti v balíčku Multi senzorické a hyperspektrální zobrazovací systémy, jak byly uvedeny v návrhu projektu, neumožňuje mu však převzít odpovědnost za celý balíček, který proniká do působení dalších pracovišť. Proto byl zodpovědnou osobou nově
určen Mgr. Filip Chlup, který s Dr. Čelechovským dlouhodobě spolupracuje a nadále se problematice bude věnovat plným úvazkem. Mgr. Filip Chlup pracuje ve společnosti Pramacom-HT od ukončení studia na Přírodovědecké fakultě UP v Olomouci, specializace optoelektronika v roce 2008. Věnuje se problematice optických měření v IR oblasti, optické konstrukci a rádiové komunikaci. Byl zapojen do řešení projektů TIP a POTENCIÁL, publikoval v odborných časopisech a je spoluautorem knihy Fyzikální základy radaru. Na zasedání Řídícího výboru Centra byla tato změna prodiskutována a odsouhlasena. Řídící výbor. Byl ustaven Řídící výbor Centra digitální optiky ve složení: doc. Mgr. Jaroslav Řeháček, Ph.D. (UP), řešitel – manažer projektu Mgr. Petr Přikryl (Meopta – optika, s.r.o.) Mgr. Jiří Oulehla (PRAMACOM-HT, spol. s r.o.) Lukáš Kapitán (ZEBR s.r.o.) prof. RNDr. Zdeněk Hradil, CSc. (UP) doc. RNDr. Radim Chmelík, Ph.D. (VUT Brno) Mgr. Roman Burianec (Meopta – optika, s.r.o.) Ing. Kamil Odstrčil (Meopta – optika, s.r.o.) Mgr. Filip Chlup (PRAMACOM-HT, spol. s r.o.) Mgr. Vladimír Chlup (PRAMACOM-HT, spol. s r.o.) Ing. Lubomír Husák (ZEBR s.r.o.) RNDr. Josef Kapitán, Ph.D. (UP) prof. RNDr. Zdeněk Bouchal, Dr. (UP) Ing. Martin Antoš, Ph.D. (VUT Brno) prof. RNDr. Pavel Zemánek, Ph.D. (Ústav přístrojové techniky AV ČR, v.v.i.) doc. Mgr. Kamil Postava, Dr. (VŠB-TU Ostrava) Složení Výboru a jeho status je přílohou Smlouvy o spolupráci na řešení programového projektu č. TE01020229 ze dne 20. července 2012. Účast v Řídícím výboru přijali dva externí odborníci z významných institucí podílejících se na aplikovaném výzkumu a vývoji v ČR. Pro účely interní komunikace bylo zřízeno internetové rozhraní s využitím technologie Wiki se zabezpečeným přístupem (omezeným na členy řešitelského týmu) na adrese http://intra.optol.cz/Wiki/CentrumDigitalniOptiky/. Dále byly zřízeny internetové stránky pro veřejnost http://cdo.optol.cz. Komunikace uvnitř Centra dále probíhá prostřednictvím pravidelných jednání Řídícího výboru a písemných zápisů z těchto jednání, a prostřednictvím pravidelných technických seminářů.
Plnění plánu Management projektu Činnosti • Ustavování organizační struktury centra, nastavování mechanizmů komunikace. Ukončeno. • Průběžné řízení projektu. Probíhá. Milníky • Pravidelné zasedání řídícího výboru 2x. Splněno. • Pravidelný technický seminář. Splněno. Dílčí cíle • Webové rozhraní Centra digitální optiky. Splněno. • Dosažení deklarovaných cílů a milníků projektu pro rok 2012. Splněno. Dílčí výstupy • Roční zpráva o stavu řešení projektu. Splněno Digitální Ramanova spektroskopie a Ramanova optická aktivita Činnosti • Provádění analýzy komplexního optického uspořádání spektrometru. Probíhá. • Volba materiálů a technologií opracování pro stavbu objektivů v UV oblasti. Probíhá. • Provádění analýzy využití různých typů polohovacích zařízení pro pohyblivé části spektrometru. Probíhá. Milníky, dílčí cíle a dílčí výstupy nebyly plánovány. Multi senzorické a hyperspektrální zobrazovací systémy Činnosti • Aplikovaný výzkum v oblasti analýza a syntéza optických soustav pro IR oblast. Probíhá. • Aplikovaný výzkum opracování netradičních optických materiálů pro zobrazovací pásmo (1,0 μm až 15 μm). Probíhá. • Aplikovaný výzkum tenkých optických vrstev pro spektrální pásma (1,0 μm až 15 μm). Probíhá. Milníky, dílčí cíle a dílčí výstupy nebyly plánovány. Digitální zobrazování s podporou technologie PMS Činnosti • Teoretická analýza technik zobrazování pomocí PMS a metod digitální rekonstrukce obrazu.
• • • • •
Probíhá. Návrh metod pokročilé holografické rekonstrukce. Probíhá. Vývoj softwaru pro řízení PMS. Status: Probíhá. Návrh numerických modelů pro simulaci zobrazování pomocí PMS. Probíhá. Realizace experimentů pro ověření zobrazovacích vlastností systémů pracujících s využitím PMS. Probíhá. Návrh optimalizovaných systémů pro holografický záznam a digitální rekonstrukci obrazu. Probíhá.
Milníky, dílčí cíle a dílčí výstupy nebyly plánovány. Zpracování dat S-H senzoru v metrologii a zobrazování. Činnosti • Analyzování současné technologické špičky v oblasti S-H detekce po hardwarové a softwarové stránce. Ukončeno. • Aplikovaný výzkum v oblasti informačních protokolů pro S-H detekci. Probíhá. • Programování software pro kontrolu dat z S-H senzoru a diagnostiku intenzity a vlnoplochy. Probíhá. • Aplikovaný výzkum možností měření kvality optických ploch pomocí S-H technologie. Probíhá. Milníky nebyly plánovány. Dílčí cíle • Analýza současné technologické špičky v oblasti S-H detekce po hardwarové a softwarové stránce. Splněno. Dílčí výstupy • Výzkumná zpráva: Analýza současné technologické špičky v oblasti S-H detekce. Splněno. Závěr: Bylo dosaženo všech plánovaných milníků, dílčích cílů a dílčích výstupů.
Pracovní balíček: Digitální Ramanova spektroskopie a Ramanova optická aktivita Analýza komplexního optického uspořádání spektrometru. Ramanův rozptyl je neelastický rozptyl fotonů vznikající při interakci dopadajícího záření s vibračními nebo rotačními stavy molekul. Rozptýlené záření má obecně jinou vlnovou délku než záření dopadající a na základě jeho analýzy můžeme získat velké množství informací o charakteru a struktuře studovaného systému. Ramanova optická aktivita (ROA) spočívá v měření velmi malého rozdílu v intenzitě Ramanova rozptylu z chirálních molekul odpovídající levotočivě a pravotočivě kruhově polarizovanému záření. Toto rozšíření techniky Ramanova rozptylu o citlivost k optické aktivitě molekul pak informační obsah ve spektrech ještě dále významně rozšiřuje, obzvláště o data týkající se prostorového uspořádání, konformačního chování a případně i dynamiky studovaných molekul. Ramanův rozptyl je dvoufotonový proces a je tedy možné volit vlnovou délku excitačního záření, geometrii rozptylu, tj. úhel mezi dopadajícím a rozptýleným zářením, a v případě Ramanovy optické aktivity i tzv. modulační schéma, kdy je detekován rozdíl v odezvě molekuly vůči dopadajícímu levo- a pravotočivě kruhově polarizovanému záření a/nebo se detekuje rozdíl mezi kruhově polarizovanými složkami rozptýleného záření.
Obr. 1: Základní schéma Ramanova spektrometru. Spektrální analyzátor může být jak disperzní spektrograf vybavený např. difrakční mřížkou, tak i interferometr. Na UP je v rámci projektu je prováděna komplexní analýza optické soustavy Ramanova spektrometru a spektrometru pro měření ROA. Jde o komplexní proces zahrnující optiku pro přenos excitačního záření na vzorek, přenos rozptýleného záření ze vzorku na vstup spektrografu a optiku samotného spektrografu zobrazující spektrum na plošný detektor. Analýza optické soustavy Ramanova spektrometru je prováděna za účelem zjištění optimálního experimentálního uspořádání spektrometru za účelem maximalizace poměru signál/šum se zohledněním optimálního spektrálního rozlišení, maximální intenzity ozáření (W/m2) vzorku, která ještě nezpůsobí jeho degradaci, množství vzoru potřebného experiment a jeho koncentrace, možnosti měnit fyzikální parametry vzorku (teploty), možnosti minimalizovat degradaci vzorku zářením pomocí rotující nebo průtočné kyvety apod.
Vlnová délka excitačního záření ovlivňuje především intenzitu Ramanova rozptylu, který je nepřímo úměrný její čtvrté mocnině (v případě ROA dokonce její páté mocnině). S klesající vlnovou délkou ovšem také často výrazně roste intenzita nežádoucího fluorescenčního pozadí buď vzorku samotného nebo stopových nečistot. To představuje velký experimentální problém především díky tomu, že fluorescence má o mnoho řádů vyšší účinný průřez a často i intenzitu než Ramanův rozptyl. V případě biologicky zajímavých molekul (proteinů, nukleových kyselin, sacharidů apod.) je obvykle jako volena excitační vlnová délka záření v oblasti kolem 532 nm (historicky také 488 nebo 514 nm) jako dobrý kompromis mezi intenzitou Ramanova rozptylu a nepříliš velkou úrovní fluorescenčního pozadí. Je-li naproti tomu excitační vlnová délka záření nižší než cca 260 nm, tedy v hluboké ultrafialové spektrální oblasti (DUV), dochází k spektrálnímu oddělení fluorescence a Ramanova rozptylu a fluorescence tak přestává být experimentální omezením při záznamu spekter. Kromě vyšší intenzity Ramanova rozptylu je také velkou motivací rezonanční zesílení Ramanových spekter, ke kterému dochází v případech, kdy je energie dopadajícího záření vyšší nebo alespoň srovnatelná s rozdílem mezi elektronovými stavy molekul. Změnou excitační vlnové délky je tak možné studovat signál z vybraných částí molekuly (chromoforů).
Obr. 2: Závislost Ramanových spekter myoglobinu na vlnové délce excitačního záření. Při excitační vlnové délce 415 nm dochází k rezonančnímu zesílení vibračních módů poryrinového kruhu, při vlnové délce 229 nm postranních skupin tryptofanu a při vlnové délce 206 nm peptidových vazeb (Asher et al. Chem. Rev. 2012, 112, 2604-2628) . Při návrhu optické sestavy Ramanova spektrometru je nutné respektovat zákon zachování optického rozsahu (étendue, Abbého invariant) s cílem optimálně využít tok záření vycházející ze vzorku. Situace je komplikovanější v tom, že záření vychází z objemu vzorku (a nikoliv plochy) odpovídajícímu např. fokusovanému Gaussovskému svazku, přičemž osa svazku není obecně paralelní se vstupní rovinou spektrografu. Intenzita Ramanova rozptylu i Ramanovy optické aktivity závisí na geometrii rozptylu, přičemž Ramanův rozptyl má největší intenzitu v pravoúhlém uspořádání. Optimální poměr signálu a šumu se u ROA naproti tomu dosahuje ve zpětném rozptylu, což je právě případ, kdy osa svazku není paralelní, ale kolmá na štěrbinu spektrografu. Svazek rozptýleného záření je v případě geometrie zpětného (popř. i přímého) rozptylu nutné transformovat tak, aby nedocházelo ke ztrátám záření na štěrbině spektrografu. Tento úkol je z optického hlediska velmi náročný, jednoduchých optických prvků (např. válcové čočky) není možné využít, neboť díky zákonu zachování étendue by došlo k nežádoucí změně výstupního úhlu záření v jednom směru a výsledný kužel záření by pak nebyl dobře navázán na spektrální analyzátor
(spektrograf).
Obr. 3: Porovnání části optické sestavy Ramanova spektrometru v a) pravoúhlé geometrii a b) geometrii zpětného rozptylu. V druhém případě je osa svazku kolmá na vstup spektrografu. V rámci prováděné analýzy se pokoušíme vyhodnotit parametry několika řešení tohoto problému, které byly v minulosti navrženy a případně vybrat to, které by bylo nejvhodnější pro Ramanovu spektroskopii. Mezi ně patří sestavy několika multimódových optických vláken (W. Hug, J. Raman Spectrosc. 1999, 30, 841), využití sestavy úzkoprofilových zrcadel metodou krájení štěrbiny (I. S. Bowen, Astrophys. J., 1938, 88, 113) nebo pomocí kódovaných apertur (např. Hadamardovy masky, M. E. Germ, Appl. Optics, 2006, 45, 2965) a následného matematického zpracování zaznamenaného obrazu. V poslední době se také ukazuje použití speciálních interferometrů (J. Harlander et. Al, Astrophys. J., 1992, 396, 730) jako velmi zajímavé a slibné řešení spektrálních analyzátorů pro Ramanovu spektroskopii. Výsledkem prováděné analýzy bude v březnu 2013 protokol, který bude sloužit jako zadávací specifikace pro optické soustavy vyvíjené v rámci projektu. Jedním z možných spektrálních analyzátorů vhodný pro záznam Ramanových spekter v hlubohé ultrafialové oblasti spektra je spektrograf v Czerny-Turnerově uspořádání vybavený reflexní difrakční mřížkou, v němž jsou zrcadla nahrazena objektivy. V rámci analýzy optického uspořádání spektrometru bylo ve firmě Meopta, s.r.o. provedeno detailní testování již dříve vyvinutých a zhotovených UV objektivů se světelností F/2 a ohniskovou délkou 100 mm. Objektivy byly navrženy tak, aby poskytovaly rozlišení 80 čar/mm s kontrastem vyšším než 50%. Z materiálů, použitelných pro DUV a umožňující spektrální korekci objektivů, byla zvolena kombinace taveného křemene a CaF2. Nejprve bylo provedeno měření optických parametrů samostatného UV objektivu. Naměřená hodnota průměru vstupní pupily byla 53,6±0,1mm. Ohnisková vzdálenost byla měřena pro předmětový úhel 1° pro vlnové délky 234, 242, 254, 262, 266 a 270nm. Výsledky ukazují, světelnost objektivu je oproti jmenovité přibližně o 6% vyšší, což příznivě ovlivňuje energetickou bilanci. Funkce přenosu kontrastu byla měřena na optické ose objektivu pro tytéž uvedené vlnové délky. Hodnoty kontrastu pro prostorovou frekvenci 80č/mm a polohy zaostření odpovídající použitým vlnovým délkám jsou v intervalu 0,66 – 0,73. Protože nebylo možné provést současné měření v tangenciální a radiální orientace objektivu, bylo měření opakováno pro otočení objektivu o 90° dle optické osy se srovnatelnými naměřenými hodnotami. Dosažené výsledky dosahují dobrou stablitu pro celé sledované spektrum. Rovněž prakticky shodné výsledky pro tangenciální a radiální orientaci objektivu svědčí o výborné realizaci z hlediska dosažené centricity optiky. Výsledky měření spektrální propustnosti jsou pro celou funkční oblast 229÷274nm vyšší než 70% ,
přičemž maximální hodnota na 265nm je 88%. Pro devítičočkový netmelený objektiv vyrobený z taveného křemene (celková tloušťka 43,3mm) a CaF2 (celková tloušťka 50,2 mm) lze tento výsledek považovat za velmi dobrý. AR vrstvy byly optimalizovány pro oblast 229–274 nm s požadovanou zbytkovou reflexivitou Ravg < 0.2%.
Obr. 4: Naměřená spektrální propustnost UV objektivu pro osový bod. Dalším krokem bylo měření optických parametrů dvojice UV objektivů v sestavě s difrakční mřížkou s 3600 vrypy/mm (typ Richardson 53009BK01-170R).
Obr. 5: a) Schéma optické soustavy spektrografu, b) sestava objektivů a difrakční mřížky použitá pro testování. Nejdříve byla proměřena účinnost difrakční mřížky pro zjištění její správné orientace. Difrakční účinnost v +1. řádu (ve směru blazovacího úhlu) byla 33%, v -1. řádu pak 9%. První difrakční řád byl proto využíván v měřících sestavách, které jsou popsány dále. Požadované spektrální rozlišení celé sestavy bylo řádově 0,045 nm. Dosažitelné spektrální rozlišení uvedené difrakční mřížky o využitém rozměru 50×50 mm je řádově vyšší, kolem 0,0014 nm. Výsledné spektrální rozlišení je tedy určováno geometrickou šířkou štěrbiny a zobrazovacími parametry objektivu.
V první fázi určování spektrálního rozlišení sestavy byly použity dva zdroje záření: nízkotlaká argon-rtuťová výbojka poskytující intenzivní spektrální čáru kolem 265,2 nm a Nd:YAG laser s vlnovou délkou 266nm. Nízkotlakou výbojkou Hg (Ar) Oriel model 6035 byla prosvětlena štěrbina o šířce 5 um a výšce několika mm, která byla umístěna v předmětové rovině objektivu 1. Štěrbina byla nastavena tak, aby z objektivu 1 vycházel kolimovaný svazek. Tento svazek dopadal téměř kolmo na difrakční mřížku. Pomocí goniometru, na němž byla upevněna difrakční mřížka, byl do požadovaných úhlů nastaven objektiv 2, který zobrazuje svazek záření vystupující z difrakční mřížky. Obraz byl snímán za pomoci UV CCD kamery s mikroskopovým objektivem o zvětšení 15x. Pro ideální objektivy by spektrální šířka obrazu štěrbiny byla 0,014 nm, s uvážením, že přirozená spektrální šířka atomové čáry rtuti je mnohem nižší, než tato hodnota. Naměřená spektrální pološířka profilu napříč obrazem štěrbiny (tedy ve směru difrakce) byla přibližně 0,027nm.
Obr. 6: a) Intenzitní profil spektrální čáry rtuti ve směru difrakce (řez kolmo na obraz štěrbiny). Pološířka profilu napříč obrazem štěrbiny (tedy ve směru difrakce) je přibližně 90pixelů, což ve skutečnosti odpovídá 0,028 mm. To dává hodnotu spektrální pološířky přibližně 0,027nm. b) Zvětšený obraz difrakcí rozšířené štěrbiny (snímáno pomocí kamery s mikroskopovým objektivem 15x ). Další měření spektrální pološířky bylo provedeno s laserovým zdrojem o střední vlnové délce 266 nm. Laserový svazek byl nejprve pomocí mikroskopového objektivu 40x0,3 zaostřen do bodu, který tvořil předmět objektivu 1 sestavy spektrografu. UV objektiv 1 byl vůči předmětu nastaven tak, aby předmět byl na optické ose objektivu a přitom z objektivu vycházel kolimovaný svazek, podobně, jako v předchozím případě. Obraz objektivu 2 byl opět sledován pomocí UV CCD kamery s mikroskopovým objektivem se zvětšením 15x. Spektrální šířka laserového zdroje byla určena jako 0,09 nm a je tedy limitujícím faktorem určujícím rozlišení. Jelikož bylo předmětem objektivu 1 fokusovaný pas laserového svazku o šířce řádově jednotek um, vertikální profil obrazu difraktovaného laserového zdroje udává prostorové rozlišení optické sestavy spektrografu ve vertikální směru. Jak měření samotného objektivu, tak měření v předpokládané tandemové sestavě s difrakční mřížkou nasvědčují, že může být dobrým základem pro stavbu Ramanova spektrometru, pracujícího v UV oblasti. V další období bude probíhat další testování optických parametrů spektrografu ve spektrální oblasti 229-270 nm.
Obr. 7: a) Intenzitní profil laserového svazku ve směru difrakce. Pološířku svazku ve směru difrakce je přibližně 300 pixelů. Z velikosti pixelu použité kamery 4,65 um a zvětšení mikroskopu 15 vychází skutečná pološířka svazku přibližně 0,093 mm. Tento úhel odpovídá spektrální pološířce zdroje 0,09 nm. b) Obraz nasnímaný kamerou s mikroskopovým objektivem 15x zaostřeným do obrazové roviny Probíhá také patentová rešerše v oblasti aplikací optických soustav pro UV Ramanovu spektroskopii. Cílem je podání patentu, jehož součástí je vyvinutá soustava dvojice UV objektivů v uspořádání určeném pro UV Ramanovu spektroskopii.
Volba materiálů a technologií opracování pro stavbu objektivů v UV oblasti. Provádění činností ve firmě Meopta-optika, s.r.o. se v rámci vývoje technologií opracování materiálů pro UV oblast prolíná s pracovním balíčkem č. 3 „Multisenzorické a hyperspektrální systémy“ a činností „Aplikovaný výzkum opracování netradičních optických materiálů pro zobrazovací pásmo (1,0um až 15um)“, neboť použité materiály jsou v některých případech shodné (např. fluorid vápenatý). Prvním úkolem a základem prováděných činností bylo vytipovat vhodné materiály pro UV, IR oblast pro první zkoušky technologie opracování. V roce 2012 probíhalo také řešení základního strojního vybavení pro úvodní zkoušky a testování technologií opracování neskleněných materiálů pro UV a IR oblasti. Došlo k seznámení se s materiály doporučenými pro UV a IČ oblast, při výběru materiálů byly zohledněny otázky škodlivosti materiálů pro lidské zdraví. Pro technologické zkoušky opracování byly vybrány pro UV oblast materiály fluorid vápenatý (CaF 2) a tavený křemen (fused silica), přičemž tavený křemen se v Meoptě standardně používá pro výrobu optických elementů. Technologii pro opracování CaF2 je teprve nutné v rámci řešení projektu vyvinout. Pro IČ oblast byly vybrány materiály s minimem zdravotní závadnosti CaF2, germánium (Ge), tavený křemen a ZnS.
Obr. 8: Křivka propustnosti desek o tloušťce 10 mm z materiálu CaF2 a tavený křemen v UV oblasti (dle katalogu firmy Linos). Křivky propustnosti výrazně 0závisí na kvalitě použitého matriálu.
Obr. 9: Degradace materiálů pro UV oblast po aplikaci UV záření o vlnové dílce 193 nm a 8000 J/cm2 (250000 pulsů). (zdoj: katalog firmy Linos) Tavený křemen je mnohem více náchylný k degradaci než CaF2. Byly stanoveny tvary a rozměry vhodných polotovarů a jejich množství pro technologické zkoušky (byl proveden návrh na nákup 30-ti kusů kotoučků průměru = 35±0,5 mm, tloušťky 8 ± 0,5 mm od každého z materiálů, nebo jejich násobků s přídavky 3mm na prořez pily). Byla provedena poptávka polotovarů vybraných materiálů (kromě taveného křemene, který se v Meoptě standardně používá) u dodavatelských firem s ohledem na orientaci krystalů a jejich využití pro UV a IČ oblast. Materiál CaF 2 byl poptán u firmy Hellma Materials, Ge a ZnS u firmy Korth Kristalle. Byly dodány polotovary Ge (10x tyč o průměru 35mm, tloušťka 30mm, monokrystal s osou růstu v ose kotoučku), ZnS Flir Grade (10x tyč o průměru 35mm, tloušťka 30mm, monokrystal s osou růstu v ose kotoučku). Byl proveden výběr vhodných brusiv a leštiv. Vzhledem k jednoznačné výhodě při opracování rovinných ploch, rychlosti, spolehlivosti a
reprodukovatelnosti v tvorbě lešticích nástrojů bylo dohodnuto, že úvodní základní zkoušky a testování leštiv, podložek a metody bude probíhat na substrátech s rovinnými plochami. Proto byly v této úvodní fázi zajišťovány zvolené materiály: germanium, CaF 2, tavený křemen (fused silica), křemík (Si) a ZnS v podobě kotoučků s rovnoběžnými rovinnými plochami. Byl proveden návrh na nákup hmotného investičního majetku a dalších provozních nákladů pro Centrum digitální optiky za rok 2012. Pro provádění leštění byl vytipován v první polovině roku 2012 rovinný lešticí stroj Lapmaster 36“, který by měl být zakoupen v roce 2013. Všechny důležité parametry jako je geometrická přesnost, čistota povrchů, drsnost ploch a celková propustnost včetně vrstev budou po dodání tohoto stroje a vakuové aparatury v roce 2013 prakticky vyvíjeny a testovány. Práce na opracování materiálů ale započaly již v r.2012 na provizorní technice. Pro následné zkoušky opracování (především leštění) daných materiálů byl poptán Laserový analyzátor velikosti částic FRITSCH Analysette 22- NanoTec plus, umožňující granulometrický rozbor vybraných leštiv. Druhým zařízením je Planetový kulový mlýnek p-5/2 FRITSCH pro mletí (zjemnění zrn) leštiv (v optické výrobě se zjemněná leštiva běžně používají). Pro další testy s ohledem na připravované vývoje přímo na sférických plochách byly nárokovány klasické stroje od fy. Optotech. Jsou to stroje s klasickou autorotační kývavou kinematikou umožňující v operaci broušení použití brousicích litinových nástrojů a v leštění nástrojů zejména smolné povahy, ale též použití nástrojů z moderních materiálů jako je polyuretanová lešticí fólie a též fólie typu Desmopan, Desmoflex a další. Tyto relativně jednoduché stroje Optotech jsou pod dodávány tímto výrobním označením: HM 300.1 NC-P HM 300.2 Lapping Machine 20-400 rpm – weights HM 300.2 Traditional Polisher 5-50 rpm – weights HM 500.1 Traditional Machine with Excenter (n=150/min) HM 500.1 Traditional Machine with Excenter (n=50/min) K těmto strojům byly korespondenčně získány další technické parametry a rovněž cenové nabídky. Pro leštění především CaF2 a podobných materiálů byly dále vytipovány stroje od firmy Stock Konstruktion GmbH. Vhodnost těchto strojů se dále potvrdila po návštěvě firmy Hellma Materials, které jsou zde používány. Provedli jsme dále zjištění ceny této technicky lepší techniky a zjistili, že jsou lacinější než alternativní stroje firmy Optotech. Místo strojů HM 300.2 a HM 500.1 firmy Opatech budou pro nákup zvoleny výhodnějších stroje NLP 220 DAS, NLP 330 DAS a NLP 400 DAHS firmy Stock Konstruktiv Gmbh. Byla uskutečněna návštěva firmy Hellma Materials, kde byly diskutovány otázky týkající se specifikace materiálu CaF2 pro UV a IČ oblast, včetně odpovídající orientace krystalu, homogenity, pnutí i laserové odolnosti. Probrána byla i technologie opracování surového „ingotu“ pro potřeby zorientování krystalu, nařezání polotovarů a jejich měření. Dále byl předveden strojní park a poskytnuty základní informace a rady týkající se opracování tohoto materiálu (viz. Prezentace firmy Hellma Materials HMAT – Meeting Meopta).
Obr. 10: Monokrystal CaF2. a znázornění osy (111) krystalu. Při leštění ploch orientovaných kolmo na tento směr dochází k nejlepším výsledným parametrům po opracování povrchu. Přímo na místě u firmy Hellma Materials bylo zjištěno, že v oblasti technologie opracování se firma pohybuje v základních polohách a kvalitách. Jde jim jen o to materiál uřezat, frézovat, zjemnit broušením či lapováním a zprůhlednit leštěním. Tato operace leštění je z našeho pohledu a našich potřeb bez patřičné kvality, geometrie, čistoty a drsnosti povrchu. Přesto zde byly získány cenné informace a bylo možné se fyzicky seznámit se stroji, na kterých probíhá leštění. Tyto stroje původně dodávala firma Naicotec, nyní jsou dodávány výrobcem Stock Konstruktion GmbH.
Obr. 11: Zlomová struktura na leštěných rovinných plochách materiálu CaF2 s náhodnou orientací krystalu. Uskutečněná návštěva fy. Helma umožnila dále zadat správné technické specifikace a v současné době probíhá nákup materiálu CaF2 s určenou osou růstu krystalu ve směru 111. Takto orientovaný materiál umožňuje získání vyšší finální kvality z titulu geometrického tvaru a drsnosti povrchů u takto tvořené optiky.
Byly zahájeny zkoušky opracování materiálu Ge, CaF2 na prvních polotovarech „předskokanech“, které byly již dříve objednány k prvním zkouškám vrstvení. Polotovary – kotoučky o průměru 20mm a tloušťce 2mm byly nakoupeny od firmy MaTecK GmbH, Ge - monokrystal s orientací (111), CaF2 - IR grade, monokrystal s náhodnou orientací. Zkoušky opracování byly započaty klasickou brousicí a lešticí technologií na smole i umělých podložkách standardními optickými leštivy. Po leštění Ge, CaF2 klasickou technologií byla dosažena drsnost a rovinnost u germánia: Sq = 1,5nm, 3/0,5(0,7) a u CaF2: Sq = 3,7nm, 3/0,5(0,1 až 1). Měřením na interferometru Zygo byla u CaF 2 odhalena zlomovitá struktura vzniklá opracováním materiálu nařezaného bez ohledu na osu (111) tedy s náhodnou orientací os krystalu Byly zahájeny zkoušky opracování Ge, CaF 2 technologií CNC na umělých podložkách. Dále byly dodány stroje Laserový analyzátor velikosti částic FRITSCH Analysette 22- NanoTec plus, planetový kulový mlýnek p-5/2 FRITSCH a bylo provedeno zaškolení obsluhy. V roce 2013 budou po obdržení konkrétní specifikace sférických čoček a výše uvedených strojů zahájeny zkoušky opracování a testování sférických ploch na žádaných materiálech. Provádění analýzy využití různých typů polohovacích zařízení pro pohyblivé části spektrometru. V rámci projektu byly testovány a porovnávány možnosti polohovacích zařízení, které jsou používány na výrobních linkách firmy ZEBR s.r.o. Díky poptávce po plně automatizovaných strojích je kladen stále větší důraz na spolehlivost, rychlost a přesnost výroby, zároveň však i na jednoduchost obsluhy a ekonomičnost provozu. Proto v rámci technického zdokonalování a nabídky lepších parametrů zařízení byly hledány varianty náhrady jednotlivých prvků dosavadního technického řešení. Zásadní vliv na přesnost a rychlost výroby mají prvky vytvářející na stroji mechanický pohyb a tím ovládající jednotlivé mechanizmy stroje. Obecně používané prvky v automatizaci vytvářející pohyb můžeme rozdělit z našeho pohledu na dvě kategorie. První kategorii tvoří prvky založené na principu energie uložené ve formě stlačeného vzduchu nebo tlaku hydraulického oleje. Celá soustava je pak tvořena vždy zdrojem natlakovaného média (kompresor případně hydraulické čerpadlo), prvky rozvádějícími médiu (hadice, trubky), řídicími a spínacími členy (ventily, senzory) a samozřejmě vlastními akčními členy, které převádí energii na lineární, rotační nebo kyvný pohyb (pneumatické a hydraulické válce, pneumotory). Druhou kategorii akčních prvků vytvářející pohyb tvoří elektrické pohony. Elektrický pohon je souhrnem zařízení, která zajišťují ovládání přeměny elektrické energie v mechanickou energii. Hlavní součástí elektrického pohonu je elektrický motor, který je však doplněn ovládacími a řídicími přístroji, které ovládají motor řiditelnými zdroji elektrické energie. Řízením elektrického pohonu rozumíme změny rychlosti, momentu, výkonu a dalších požadovaných proměnných parametrů. Automatizované stroje firmy ZEBR jsou již řadu let osazovány pneumatickými prvky renomované firmy FESTO. Díky pravidelnému školení a množství realizovaných aplikací, byla získána řada zkušeností v nasazování celé škály různých typů ovládacích ventilků a pneumatických válců, vždy specializovaná pro konkrétní úlohu. Díky požadavku zvyšování rychlosti a spolehlivosti mechanických pohybů ovládaných pneumatikou se otevřela problematika vyhodnocení a seřízení průběhu pneumatického cyklu. Porovnání jednotlivých prvků a zvolení optimální varianty je vždy vázáno na měření časových průběhů jednotlivých veličin. Zde je potřeba ale vždy převést neelektrickou veličinu
na elektrickou pomocí převodníků/snímačů. Byly proto pořízeny převodníky průtoku a tlaku vzduchu na elektrickou veličinu, monitorující spotřebu a časové průběhy tlaku v měřených částech pneumatického systému. Dále byla zakoupena vysokorychlostní kamera typu SBOx, která je schopna díky pořízení velkého množství snímků za sekundu zaznamenat rychlé pohyby a zpětně připojeným PC na časové ose analyzovat jednotlivé snímky průběhu. Díky tomuto vybavení byly pozorovány rozdíly rychlostí pohybu při použití různých typů pneumatických válců (průměry pístnic, typy plynulých dorazů válců), způsobu přívodu vzduchu (tloušťka hadiček, škrtící a zpětné klapky) a typů řídicích ventilů. Pro nejvíce časově náročnou aplikaci, kdy bylo potřeba pomocí pneumatiky vykonat rychlý pohyb sevření v co nejkratším čase, bylo dosaženou vhodnou volbou pneumatických prvků, reakční doby daného pohyb do 5 ms od vystavení elektrického povelu. Při takto rychlých aplikacích dochází v pneumatickém systému k jevům, které ovlivňují správnou činnost systému, snižují jeho spolehlivost pro práci ve výše uvedených krátkých časech. Tyto jevy aktuálně zkoumáme, konzultujeme s vývojovým oddělením německého výrobce pneumatických prvků, provádíme testování. Po pořízení nových měřících a testovacích zařízení jsme ovšem zjistili, že problém sestává z většího množství okolností, které činnost systému ovlivňují, všechny jevy nám zatím nejsou zcela srozumitelné. Specialisté od výrobce pneumatiky se s obdobnými aplikacemi, kde velké množství pneumatických prvků má vykonat přesnou práci v krátkém čase, ještě nesetkali a celou problematiku řešíme s výrobcem společně. Jsme na začátku cesty a následující období bude věnováno dalšímu zkoumání této problematiky. Dalším z problémů, se kterými se potýkáme, je vhodné měřící, zaznamenávací a vyhodnocovací zařízení, které dále na trhu hledáme. Doposud pořízený soubor zahrnutý do měřící stolice nedostačuje všem našim potřebám. Elektrické pohony nacházejí v automatizaci stále větší oblibu při řízení pohybů díky své komfortnosti, variabilitě, jednoduché řiditelnosti a ekonomické výhodnosti. Protože stroje firmy ZEBR jsou vybavovány asynchronními a servomotorickými pohony několika předních světových výrobců, je získávání odborných znalostí v této oblasti prioritou. Problematika elektrických pohonů se ovšem neomezuje jen na samotný výběr vhodného typu servomotoru a servozesilovače (jeho řízení), ale zahrnuje kompletní integraci do mechaniky stroje a zároveň napojení na nadřazený řídicí systém stroje (PLC - Programmable Logic Controller) s příslušným softwarovým vybavením. Právě možnosti softwaru na straně PLC i servozesilovače prochází neustálým vývojem a výrobci se snaží co nejvíce usnadňovat integraci motorických pohonů tvorbou pomocných SW nástrojů a ladících prostředků. Kromě základních funkcí servozesilovače, kdy slouží jako regulátor proudové, rychlostní a polohové smyčky se zpětnou vazbou, je trendem výrobců využít výpočetní výkon servozesilovačů na přídavné funkce, kterým může být řízení pomocí integrovaných vstupně-výstupních portů. Takto lze realizovat rychlé odezvy procesu v řádu mikrosekund v návaznosti na koordinaci s řízeným pohybem servomotoru. Pro srovnání, při řízení procesu pomocí PLC dosahujeme odezvy „jen“ v řádech milisekund. V našich aplikacích používáme víc typů servozesilovačů, ale pro nejrychlejší polohovací úlohy byl vybrán digitální, typ AKD firmy Kollmorgen. Ten díky digitální proudové (0,67 µs), rychlostní (62,5 µs) a polohové regulační smyčce (125 µs) zajišťuje vysokou dynamiku pohonu a opakovatelnost nastavených pracovních pohybů. Zde využíváme i přídavné funkce zastavení na značku, tj. zachycení nástupné hrany digitálního vstupu a dopolohování o definovanou vzdálenost. Zde proběhl dlouhodobý vývoj SW jak na straně řídicího PLC, tak i firmwaru servozesilovače, kdy byly s výrobcem komunikovány naše návrhy pro dokonalejší funkce systému, které jsme získali důkladným zkoumáním procesů, analýzami a testováním. Tyto činnosti vedly k dosažení požadované přesnosti a opakovatelnosti. Díky tomu mohla být zvýšena nejen produktivita strojů firmy ZEBR, ale zároveň i přesnost výrobků. Do paměti servozesilovače lze jednoduchým způsobem zapsat krátký uživatelský program, který může v sobě zahrnout příkazy a parametry využívané vlastním firmwarem
servozesilovače. Tím se doba odezvy v řízené technologii zkracuje pod dobu 1 mikrosekundy! V minulosti se pro pohon válcovacích tratí používaly AC servomotory v kombinaci se servozesilovačem, jehož výstupní proud se pohyboval okolo 6A. Starší typy motorů díky svojí konstrukci měly velmi nízký koeficient Ke – což je konstanta udávající točivý moment na hřídeli v Nm, při proudu servozesilovače 1A. Pokud tedy byl zapotřebí v aplikaci větší krouticí moment, přistupovalo se ke snižování provozní rychlosti např. z 3000 rpm na 2000 rpm i méně. Tabulka používaných typů AC motorů typ AC motoru koeficient Ke SBL40750560 1,5 Nm/A BSH 1003 1,2 Nm/A BDH 1082 1,4 Nm/A N4-0960-30-560 1,6 Nm/A
Max. otáčky Nmax 3000 rpm 4000 rpm 3000 rpm 3000 rpm
Tyto na pohled stejné motory však dosahují při budícím proudu 6A, což je trvale možný dodávaný proud servozesilovačem, rozdílné krouticí momenty při provozních otáčkách v rozmezí od 7,2 do 9,6 Nm. Je zde větší rezerva pro špičkový krouticí moment a také energetická úspora při běžném provozu. Nejnovější typy střídavých synchronních servomotorů mají ve statoru rozložené trojfázové vinutí a permanentní magnety na rotoru. Tenká vrstva magnetů ze vzácných zemin neodym/železo/bór je umístěna na povrchu rotorové hřídele, čímž je dosažen malý moment setrvačnosti motoru. Vyšší krouticí moment, tedy i vyšší výkon motorů nové řady je dosažen zlepšením odvodu tepla ze statoru motoru do přední příruby spolu s optimalizovaným magnetickým obvodem. Zkrácení statorových svazků použitím segmentového vinutí spolu s dosažením vyššího plnění vinutí má za důsledek zkrácení délky celého motoru. Uvedené přednosti zvyšují poměr krouticího momentu k zastavěnému objemu servomotoru a rozšiřují oblasti použití z konstrukčního hlediska. Jednou z důležitých částí komplexních strojů vyráběných ve firmě Zebr jsou válcovací trati. Již z principu válcování je patrné, že u tvářeného materiálu procházejícího tratí dochází k prokluzům mezi válcovacími koly a materiálem. Vzhledem k tomu že potřebujeme válcovaný materiál polohovat s přesností do 0,2 mm na jednom metru, je nutné na polohu válcovaného materiálu navázat přesné externí odměřování. Nastává zde nárok na servozesilovač, aby jeho externí zpětná vazba mohla být dle potřeby aktivována (v provozu válcování) a deaktivována (když v trati není materiál, nebo je právě zaváděn obsluhou a externí odměřování je neaktivní). Většina výrobců servozesilovačů toto přepínání vazby neumožňuje – vyžadují pouze jednu a to trvalou vazbu. Někteří dokonce neumožňují ani tuto trvalou externí zpětnou vazbu. Z tohoto důvodu nebylo možné používat servozesilovače, byť nové generace, výrobců jako je Schneider Electric nebo Beckhoff. Výrobce Kollmorgen má ve výrobním programu servozesilovače které vyhovují jak po stránce připojení odměřování, tak i po stránce doby odezvy v regulačních smyčkách. Předpokládáme proto použití těchto prvků, přičemž budeme aktivně sledovat jejich vývoj s ohledem na naše požadavky. V návaznosti na inovaci servomotorických pohonů bylo hledáno řešení k zvýšení výkonu řídicího systému, který díky své omezené rychlosti datové komunikace, takto nepřímo ovlivňuje reakční dobu celého systému. To bylo docíleno tím, že byl vytipován nový vizualizační operátorský panel, který díky svým vlastnostem ulehčí výpočetní výkon PLC, který pak může být využit více pro řízení pohonů. V rámci plánovaných činností pro rok 2013 bude firma Zebr provádět další zkoumání činnosti rychlých pneumatických systémů, vzájemné ovlivňování prvků, nežádoucí tlakové spády a další nežádoucí jevy,
které činí pneumatiku nespolehlivou pro rychlé a přesné polohování při použití většího množství prvků na malém prostoru. Podobná činnost bude prováděna na hydraulických systémech, kde předpokládáme zahájení činností v druhé polovině roku. Nadále budou pokračovat práce na vylepšení funkcí nových řad servozesilovačů a to jak na straně námi požadovaných úprav firmwarů výrobce, tak na straně obsluhy servozesilovače z řídicího PLC. Dosažené parametry a výsledky budou dokumentovány měřeními. V rámci inovace a zlepšení spolehlivosti strojů budou nahrazeny vytipované mechanizmy, poháněné současně pneumatikou, servomotorickými pohony. Na UP dochází v rámci prováděné činnosti k výběru vhodných motorizovaných polohovacích zařízení s ohledem na jejich využití v Ramanově spektrometru a ve spektrometru pro měření Ramanovy optické aktivity. Bylo zahájeno zjišťování dostupných možností pro provedení rotačních nebo lineárních posuvů, jejich specifických vlastností, se zaměřením na použití výsledků pro polohování komponent spektrometru. Použití motorizovaných posuvů je plánováno především pro: - polohování polarizačních komponent, - pro rotaci a/nebo lineární posuv kyvety se vzorkem (pro polohování vzorku i snížení jeho degradace intenzivním UV/VIS zářením).
Obr. 12: Základní schéma spektrometru pro měření Ramanovy optické aktivity (ROA) s vyznačením motorizovaných jednotek (podklad pro obr. převzat a upraven z Disertační práce J. Haeslera, Fribourg 2006). Základem pro vývoj spektrometrů pro měření Ramanovy optické aktivity je spektrometr vyvinutý prof. Wernerem Hugem (H. Hug, Measurement of Raman optical aktivity, Comprehensive Chiroptical Spectroscopy Vol. 1, 2012, 147-177), který je základem komerčně dostupného přístroje, v současné době vyráběném pouze jedinou firmou Biotools. Ve spektrometru se nachází motorizované jednotky
trojího druhu (viz obr.): 1. Kontinuálně rotující jednotky: rychlý lineární rotátor 1 a 2 (LR1, LR2) a pomalý lineární rotátor 3 (LR3). Lineární rotátor je rotující půlvlnná deska. Je-li na vstupu lineárně polarizované záření, výstupem je taktéž lineárně polarizované záření, jehož směr polarizace rotuje v závislosti na úhlu otočení motoru. Doba rotace LR1 udává časovou jednotku (TU, time unit), u komerčního přístroje je 1 TU = 4,59 ms (odpovídající rychlosti rotace asi 13000 rpm). Doba rotace LR2 je 15/16 TU a doba rotace LR3 je 16 TU, takže orientace všech rotátorů se zopakuje za 16 TU (LR1 provede 16 otáček, LR2 15 otáček a LP3 jednu otáčku). Důležitá je rovnoměrná rotace s přesně definovanou frekvencí. Není-li rotace rovnoměrná, určité polarizační stavy záření (polohy polarizačního prvku) se vyskytují s nerovnoměrnou četností a dochází k vytváření systematických chyb při měření. Přesně definovaná frekvence určuje časování ostatních událostí měřicího cyklu. 2. Jednotky pro přesné opakované polohování polarizačních optických komponent: čtvrtvlnné desky. Dopadá-li na čtvrtvlnnou desku kruhově polarizované záření, výstupem je záření lineárně polarizované. Ortogonálně lineárně polarizované záření je možné generovat otočením čtvrtvlnné desky o +/- 90°. Cílem jednotky je velice přesné a co nejrychlejší polohování fázové desky pro minimalizaci nevyužitelné doby měření. 3. Jednotky zasouvající a vysouvající optické prvky do optické dráhy: cirkulární převodník 1 (CP1) a cirkulární převodník 2 (CP2). Cirkulární převodník je půlvlnná deska, která má tu vlastnost, že dopadající pravotočivě kruhově polarizované záření mění na levotočivě kruhově polarizované záření a naopak. V rámci činnosti byly provedeny přípravné práce a základní měření na motorizovaných jednotkách dostupných na katedře optiky ve všech třech uvedených kategoriích. Bylo započato testování DC motorů firmy Faulhaber s dutou hřídelí s ohledem na rovnoměrnost rotace s přesně definovanou frekvencí. Byly provedeny první testy PID řízení těchto kontinuálně rotujících jednotek. Byly provedeny první testy polohování čtvrtvlnných desek pomocí krokových motorů s dutou hřídelí o průměru 40 mm od firmy Precistep. Ovládání je prováděno pomocí jednotek (driverů) firmy Technosoft umožňující přesný, plynulý chod a provádění polohování v mikrokrocích. Řízení motorů bylo vyvinuto v jazyku C++ s využitím knihoven dodávaných firmou Technosoft. Výsledky prvních testů jsou velice slibné a toto řešení bude nadále podrobně zkoumáno a rozvíjeno. Byly provedeny testy lineární motorizované jednotky M-683 firmy Physik Instrumente založené na piezomotorech. Tyto jednotky umožňují rychlost posuvu řádově 350 mm/s a délku posuvu 50 mm. Řízení jednotek bylo vyvinuto v jazyku C++ s využitím knihoven dodávaných výrobcem lineárních piezomotorů. Tyto jednotky jsou benchmarkem pro další vývoj lineárních posuvů. V roce 2012 docházelo k pravidelným konzultacím s partnerem projektu firmou Zebr s.r.o. Zkušenosti firmy Zebr s.r.o. s použitím elektrických pohonů i jejich integrací do komplexních zařízení se ukazují jako nedocenitelné a bylo navrženo několik inovativních řešení ve zmiňovaných oblastech. Byly diskutovány možnosti synchronizace rotačních zařízení. K vzájemné úzké spolupráci bude docházet i v následujícím období, budou zkoumány další možnosti realizace jednotlivých polohovacích jednotek.
Pracovní balíček: Multi senzorické a hyperspektrální zobrazovací systémy Analýza a syntéza optických soustav pro IR oblast. Bylo detailněji analyzováno pět nových US patentů optických soustav, které jsou určeny pro sledovaná spektrální pásma – SWIR, eSWIR, MWIR, LWIR, případně jejich kombinace. Konstrukční analýza probíhala pomocí software OSLO Premium. Program OSLO byl doplněn několika vlastními podprogramy, které umožní snadnější zacházení s analyzovanými daty. Konstrukční syntéza byla prováděna na základě aberační teorie prvního a třetího řádu s následným využitím řady optimalizačních algoritmů. Byly sledovány limitní možnosti dosažení fyzikálně dokonalého zobrazení soustavami pouze s refraktivními kulovými plochami a rotační symetrií. První konstrukční zkušenosti byly prováděny i s cílem budoucího využití jak refraktivních asferických ploch, tak i difraktivních ploch. Je zřejmé, že použití těchto typů ploch v optických systémech pro LWIR a MWIR je velmi efektivní a výzkum i vývoj systémů s těmito prvky uskutečňovaný v rámci tohoto projektu zreální možnosti jejich nasazení. Důležitou roli hrají dostupné refraktivní materiály pro všechny čtyři uvažované spektrální oblasti. Byla studovány odborné publikace k tomuto tématu stejně, jako příslušné materiálové listy jednotlivých výrobců a potenciálních dodavatelů. Databáze využívaného programu OSLO byla částečně doplněna o optické konstanty vztahujících se k těmto materiálům. Byly zvoleny základní materiály vhodné pro refraktivní či difraktivní zobrazovací optické IR systémy, které budou v rámci tohoto úkolu dále vyvíjeny a používány. V pásmu LWIR se analýza zaměřuje zejména na materiály: Ge, ZnSe, ZnS a chalkogenní sklo AMTIR 1, případně jeho alternativy od jiných výrobců vyráběné pod různými obchodními názvy. Úzká vazba mezi vlastním detektorem a optickým systémem vyžaduje efektivní napojení parametrů. V oblasti LWIR je vzhledem k velké vlnové délce záření nutné zajistit, aby optický systém byl fyzikálně dokonalý. Spojíme-li požadavek dokonalého zobrazení ve smyslu Rayleighova kritéria s Nyquistovou vzorkovací frekvencí, dostaneme pro oblast LWIR mezní frekvenci νR-N (bod nulového kontrastu křivky MTF), kterou musí fyzikálně dokonalý optický systém dosáhnout. Tyto hodnoty uvádíme v následující tabulce společně s údaji o některých nechlazených LWIR čipech, které jsou na trhu (regulovaném státy výrobců) k dispozici. V tabulce je také uvedeno k nim odpovídající krajní clonové číslo cR-N. Je zřejmé, že v oblasti LWIR miniaturizace velikosti pixelů dosáhla z hlediska rozlišovací schopnosti své praktické meze a další zmenšování velikosti pixelů nemá podstatný smysl. Z teoretického hlediska má mezní velikost pixelu pro střední vlnovou délku 10 μm velikost 12,5 x12,5 μm. Pro názornost uvádíme i dva příklady optimalizovaných dvou optických systémů LWIR. První příklad LWIR objektivu, znázorněný na obr. 1A představuje jednoduchý triplet se sférickými plochami, v kombinaci materiálů AMTIR1- ZnS-AMTIR1, který rámcově splňuje požadavky odpovídající prvnímu řádku v tab. 1. Opomeneme-li další důležité požadavky na konstrukci IR objektivu, jako jsou atermalizace a odstranění narcisismu, je zřejmé, že i jednoduchá stavba tripletu je schopna, na rozdíl od optických soustav určených pro VIS oblast, dosáhnout korekčního stavu, který odpovídá fyzikálně dokonalému systému a splňuje požadavky na kvalitu zobrazení celého systému. počet pixelů 320 x 240
velikost pixelu velikost senzoru úhlopříčka νR-N krajní clonové f' pro 2τ =20° [μm] [mm] [mm] [č/mm] číslo cR-N [mm] 50
16 x 12
20
50
2
57
160 x 120
30
4,8 x 3,6
6
83
1,2
17
384 x 288
25
9,6 x 7,2
12
100
1
34
384 x 288
17
5,9 x4,9
7
147
0,68
20
640 x 480
25
16 x 12
20
100
1
57
640 x 480
17
10,9 x 8,2
13,6
147
0,68
39
1024 x768
17
17,5 x 13,1
21,8
147
0,68
62
Tab. 1: Nechlazené detektory na bázi amorfního Si a optické systémy v pásmu LWIR
Obr. 1A: Objektiv LWIR 1,7/57 pro zorné pole 20° Při přechodu k vyšším světelnostem je problematika optické konstrukce složitější. Vysoké požadavky na kvalitu zobrazení a vysoké světelnosti jsou protichůdné a v případě použití jen kulových ploch vedou k mnohačlenným systémům. Použití asférických nebo difraktivních ploch jeproto téměř nezbytné pro zachování „jednoduchosti“ systému s malým počtem ploch. Obr. 1B ukazuje alternativu dvojčlenného objektivu jen ze dvou germániových čoček, který vychází z patentu US7848015. Na první pohled jednoduchá dvojčlenná stavba je ovšem jak konstrukčně, tak i technologicky a výrobně značně sofistikovaným systémem. Každá ze čtyř ploch je rotačně symetrická asférická plocha až do stupně y12. Soustava je sice fyzikálně dokonalá, ale pro případ čipu s velikosti pixelů 17 x17 μm , který je uveden na čtvrtém řádku tabulky 1, má nízkou světelnost. V tomto případě je clonové číslo příliš nízké a bude výrazně omezovat kvalitu zobrazení celého systému. Použijeme-li čip se stejným počtem pixelů 384x288, ale s jejich větší velikostí, to je 25 x 25 μm , musíme dle tabulky 1 použít objektiv o ohniskové vzdálenosti 34mm. Výsledky pro stejnou stavbu objektivu jsou zobrazeny na obr. 1C. V tomto případě je objektiv téměř fyzikálně dokonalý a svými parametry jen mírně překračuje meze pro dosažení úrovně, kdy neomezuje rozlišení dané vzorkovací frekvencí čipu.
Obr. 1B: Objektiv LWIR 1,1/20 pro zorné pole 20°
Obr. 1C: Objektiv LWIR 1,1/34 pro zorné pole 20° V pásmu MWIR se v optických systémech nejčastěji používají materiály: germánium, CaF2, AMTIR 3, IG5, ZnSe , ZnS v úpravě Cleratran, tavený křemen a Si. Nejčastější rozměry čipů a velikosti jejich pixelů v současnosti nabízených systémů jsou uvedeny v tab. 2 současně s mezní frekvenci ν R-N a krajním clonovým číslem cR-N.
počet pixelů
velikost pixelu velikost senzoru úhlopříčka νR-N krajní clonové [μm] [mm] [mm] [č/mm] číslo cR-N
f' pro 2τ =20°[mm]
320 x 256
30
16 x 12
12,3
83
3
35
640 x 512
15
16 x 12,8
20,5
165
1,5
58
1280 x 1024
15
19,2 x 15,4
24,6
165
1,5
70
Tab. 2: Chlazené detektory a optické systémy v pásmu MWIR na bázi Hg-Cd-Te Příklad objektivu MWIR 3/150 s pevnou ohniskovou vzdáleností je uveden na obr. 2. Objektiv je určen pro úzké zorné pole 4,7°. Je zřejmé, že z hlediska rozlišovací schopnosti splňuje požadavky uvedené v tab. 2 v prvním řádku. Významné je i to, že aperturní clona je za optickými členy v obrazovém prostoru a lze ji ztotožnit se studenou clonou, která je u MWIR objektivů většinou nutná. Oproti pásmu LWIR více jak dvakrát kratší vlnová délka neklade z hlediska kvality zobrazení na světelnost objektivu již tak velké požadavky. Pro větší zorná pole a vyšší světelnosti diktované nyní zdůrazněním požadavku na zvýšení poměru S/N začíná převažovat omezení kvality působené aberacemi optické soustavy. V pásmu SWIR (alespoň v pásmu kratšího SWIR – 0,9 až 1,7 μm) lze z hlediska spektrální propustnosti použít většinu obvyklých optických skel. Negativem ovšem je, že disperzní vlastnosti mnohých skel se v pásmu SWIR poněkud unifikují a neposkytují již tak velké možnosti ke korekci barevných vad jak tomu je v pásmu VIS. Rozšířené pásmo eSWIR (0,9 až 2,5 μm) představuje téměř 3 oktávy spektra a barevná korekce je tak obzvlášť komplikovaná. Pro konstrukční činnost má proto velký význam krystalický CaF2.
Obr. 2: Objektiv MWIR 2/150 pro zorné pole 4,7°; studená clona v zadní části objektivu Vzhledem k následujícím milníkům s konkrétními výstupy, byla oblasti SWIR věnována největší pozornost a byly studovány možnosti dosažení širokopásmové achromatizace. V tomto bodě činnost navazuje výzkum na výsledky získané v rámci řešení projektu TIP FR-TI1/364, který byl v roce 2012 ukončen. V tabulce 3 jsou uvedeny čtyři typy detektorů InGaAS, které se uplatňují v oblasti 0,9 až 1,7 μm . V tabulce již neuvádíme údaje hodnoty pro krajní clonové číslo cR-N , ani mezní frekvenci ν R-N , protože v oblasti SWIR již většinou neurčují kvalitu zobrazení. počet pixelů
velikost pixelu velikost senzoru [μm] [mm]
úhlopříčka [mm]
f' pro 2τ =40° [mm]
f' pro 2τ =20° [mm]
320 x 256
30
12,3
17
35
16 x 12
640 x 512
25
16 x 12,8
20,5
28
58
320 x 240
40
12,8 x 9,6
16
22
45,4
1280 x 1024
15
19,2 x 15,4
24,6
374
70
Tab. 3: Nechlazené detektory a optické systémy v pásmu SWIR na bázi In-Ga-As Některé nejnovější výsledky optické konstrukce (US2012/0243114) naznačují, že významným prvkem pro širokopásmové zobrazovací systémy mohou být tvarově svobodné nesymetrické odrazné plochy, které se také stávají předmětem našeho studia. Část výsledků z konstrukční analýzy optických systémů pro IR oblast byla shrnuta v příspěvku na semináři v Meoptě, jehož prezentační část je k dispozici na webu k projektu. Tam jsou také rámcově uvedeny dosažené výsledky s objektivy SWIR.
Opracování netradičních optických materiálů pro zobrazovací pásmo (1,0 μm až 15 μm) V rámci řešení ve firmě Meopta-optika, s.r.o. proběhla v první fázi poptávka polotovarů vybraných optických materiálů (kromě Fused silici, která se ve společnosti Meopta-optika, s.r.o. standardně používá pro výrobu opt. elementů) u dodavatelských firem s ohledem na orientaci krystalů a jejich využití pro IČ oblast. Materiál CaF2 byl poptán u firmy Hellma, Ge a ZnS u firmy Korth Kristalle. Ve druhé fázi došlo k dodání polotovarů Ge (10x rod průměr 35mm, tloušťka 30mm, monokrystal s osou růstu v ose kotoučku), ZnS Flir Grade (10x rod průměr 35mm, tloušťka 30mm, monokrystal s osou růstu v ose kotoučku) Pro následné zkoušky opracování (především leštění) daných materiálů byl poptán LASEROVÝ ANALYZÁTOR VELIKOSTI ČÁSTIC FRITSCH Analysette 22- NanoTec plus, umožňující granulometrický rozbor vybraných leštiv. Druhým dodaným zařízením byl Planetový kulový mlýnek p5/2 FRITSCH pro mletí (zjemnění zrn) leštiv. Dále proběhly zkoušky opracování materiálu Ge, CaF2 na polotovarech tzv. „předskokanech“, které byly objednány RNDr. Jankujem k jeho prvním zkouškám vrstvení. Polotovary – kotoučky o průměru 20 mm a tloušťce 2 mm byly nakoupeny od firmy MaTecK GmbH, Ge - monokrystal s orientací (111), CaF 2 - IR grade, monokrystal s náhodnou orientací. Zkoušky opracování byly započaty klasickou brousicí a lešticí technologií na smole i umělých podložkách standardními optickými leštivy. Proběhla návštěva firmy Hellma Materials, kde byly diskutovány otázky týkající se specifikace materiálu CaF2 pro IČ oblast, včetně odpovídající orientace krystalu, homogenity, pnutí i laserové odolnosti. Probrána byla i technologie opracování surového „ingotu“ pro potřeby zorientování krystalu, nařezání polotovarů a jejich měření. Dále byl předveden strojní park a poskytnuty základní informace a rady týkajicí se opracování tohoto materiálu (viz. Prezentace firmy Hellma Materials HMAT – Meeting Meopta). O této cestě byla pro potřeby projektu vytvořena cestovní zpráva. V následujících testech byla zvyšovaná přesnost rovinnosti pro Germánium. Kontrolní měření probíhala na interferometru Zygo. Dále bylo testováno opracování Ge technologií CNC na umělých podložkách. V závěru roku byl dodán stroj pro opracování LASEROVÝ ANALYZÁTOR VELIKOSTI ČÁSTIC FRITSCH Analysette 22- NanoTec plus.
Tenké optické vrstvy pro spektrální pásma (1,0 μm až 15 μm). V rámci řešení projektu zavedení IR technologii v Meoptě-optice byla v roce 2012 pozornost zaměřena zejména na specifikaci vakuové aparatury vhodné pro tuto činnost, studiu literatury k dané problematice, vytipování a nákupu potřebných napařovacích materiálů, lodiček a podložných materiálů. Přestože vakuové aparatury byla specifikovány ve spolupráci s firmami LO a Umicore byla v rámci minimalizace nákladu rozhodnuto o nákupu již použité vakuové aparatury Bak 760, která bude přestavena Vakuum servisem Rožnov za cca 3 miliony korun. Vzhledem k opožděnému finálnímu objednání vakuové aparatury z důvodu diskusí v Meoptě Přerov a nepřítomností majitele k závěrečnému souhlasu s tímto řešením se nepodařilo vakuovou aparatury zajistit do konce roku, a proto plánovaný termín dodávky do Meopty je až 3-4 měsíc roku 2013. Současně s objednávkou vakuové aparatury se řešil i problém jejího umístění a rozsah potřebných úprav nového pracoviště. Vzhledem k nedostatku řešitelských kapacit v oblasti technologií vrstvení byl v 10 měsíci uvolněn 1 pracovník z výroby, který pracoval jako obsluha obdobné vakuové aparatury Bak 760 a je postupně zaškolován jako pracovník oddělení tenkých vrstev. Po dodání nové vakuové aparatury převezme hlavní technologickou odpovědnost za její činnost.
Pracovní balíček: Digitální zobrazování s podporou technologie PMS Teoretické i experimentální činnosti probíhaly v koordinaci UP a VUT s aplikačním pracovištěm firmy Meopta-optika, s.r.o. Toto pracoviště rovněž provedlo rešerši přístupů k aplikaci PMS v optické metrologii a aktuální průzkum trhu. Na tomto základě vyhodnotilo vhodné přístupy k metrologické aplikaci PMS a s tím související nutné vybavení laboratoře. Bylo vytvořeno potřebné technické zázemí pro plánované činnosti.
Zobrazování pomocí PMS a metod digitální rekonstrukce obrazu. Prostorová modulace světla (PMS), která představuje základní techniku pracovního balíčku, je moderní optoelektronickou technologií s širokým aplikačním potenciálem. PMS je založena na elektrooptickém jevu v kapalných krystalech, umožňujícím řízenou změnu indexu lomu jednotlivých buněk. Podle konstrukčního typu zařízení je změna indexu lomu využita k modulaci amplitudy nebo fáze dopadajícího záření. Index lomu jednotlivých buněk lze měnit pomocí vhodného softwaru téměř v reálném čase, takže metoda je z hlediska praktického využití dostatečně operativní a univerzální. Schválený program balíčku se zaměřuje na zobrazovací a metrologické aplikace PMS. V průběhu řešení projektu byla hlavní pozornost zaměřena na metody digitálního zobrazování s podporou PMS. Pracovní činnost byla rozdělena do dvou základních aktivit orientovaných na vlastní výzkum digitálního korelačního zobrazení a na systematické studium principů a vlastností metod PMS zobrazování, založené na mezinárodních odborných publikacích. Digitální korelační zobrazování s nekoherentním světlem Aktivita byla zaměřena na výzkum metody, jejíž teoretické a experimentální základy byly ve spolupráci VUT Brno a UP Olomouc vytvořeny před zahájením projektu (P. Bouchal et al, Opt. Express 19, 15603, 2011). Metoda pracuje s korelačními záznamy zobrazovaného objektu, které jsou pomocí PMS pořízeny v prostorově nekoherentním světle. Digitální 3D rekonstrukce obrazu je provedena zpracováním korelačních záznamů pomocí vhodných algoritmů. V roce 2012 byly získány výsledky, které metodu rozvíjejí jak z hlediska využívaných fyzikálních mechanismů, tak i nových experimentálních konfigurací a modifikací. Získané výsledky mají praktický význam a vedou ke zvýšení výkonu metody a rozšíření spektra možných aplikací. Prokazatelnými výstupy jsou odborné publikace, vytvořené teoretické a technické zázemí a funkční experimenty, které poskytují základ pro následující etapy řešení projektu. Hlavní výsledky teoretické analýzy lze shrnout následovně: •
Byl vytvořen matematický model metody, který umožňuje kompletní popis záznamu a rekonstrukce pozorovaných objektů a určení základních parametrů zobrazení.
•
Na základě matematického modelu bylo vytvořeno zázemí pro numerické simulace používané k ověřování nových principů zobrazení a návrhů optimalizovaných experimentálních sestav.
•
S využitím výpočetních modelů a provedených experimentů byl ověřen hybridní koherenční charakter metody. Ten kombinuje záznam objektu provedený v prostorově nekoherentním záření s jeho následnou digitální rekonstrukcí, která probíhá v plně koherentním režimu. Tento
mechanismus umožňuje s kvazimonochromatickými prostorově nekoherentními zdroji dosáhnout efektů, které jsou v plně optických experimentech dostupné jen s koherentním zářením. •
Byla navržena a experimentálně ověřena metoda, která pro rekonstrukci obrazu využívá vírových stavů světla. V realizovaných experimentech byly světelné víry implementovány opticky při záznamu hologramů pomocí PMS, nebo digitálně při rekonstrukci standardních záznamů. Vírové stavy světla umožňují dosažení izotropního i anizotropního zvýraznění hran rekonstruovaných objektů. Proti dříve známým technikám je metoda originální tím, že pracuje s nekoherentním zářením a umožňuje zvýšení kontrastu hran u 3D objektů [1].
•
Byly navrženy a experimentálně ověřeny modifikace sestavy zajištující maximální optický výkon z hlediska rozlišení, velikosti zorného pole [2] a spektrální odolnosti.
Rešerše známých metod zobrazování s využitím PMS Součástí řešení bylo vytvoření systematického přehledu metod využívajících technologií PMS. K průniku PMS do zobrazovacích a metrologických aplikací dochází teprve v posledních letech, takže informace bylo nutné získávat z aktuálních odborných publikací v mezinárodních časopisech. Cílem rešeršní práce bylo rozšíření dosavadních poznatků o možnostech PMS a nalezení vhodných principů využitelných v oblastech digitální mikroskopie a průmyslové metrologie. S ohledem na rozsáhlost této problematiky, byla pozornost věnována zejména metodám jednocestného korelačního zobrazování a filtrace prostorového spektra, které při zachování kompaktnosti systému poskytují informaci nad rámec klasického zobrazení. Základní zobrazovací metodou aktivně rozvíjenou v průběhu řešení projektu je digitální korelační zobrazování s nekoherentním světlem. Porovnání jednotlivých metod provedené v rešerši bude využito pro další rozvoj a modifikace této metody, a to jak z hlediska využívaných principů, tak i optimální volby parametrů experimentu. V rámci metrologických aplikací je hlavní pozornost zaměřena na střihovou interferometrii realizovanou pomocí PMS. Návrhy dalších možných metod budou provedeny s ohledem na předpokládané využití pro kontrolu optických ploch. Výsledky teoretické analýzy principů zobrazování pomocí PMS, včetně poznatků provedené rešerše, budou zpracovány ve výzkumné zprávě s plánovaným termínem dokončení 03/2013.
Návrh metod pokročilé holografické rekonstrukce. Při holografickém zobrazování v některých případech vznikají v rekonstruované obrazové komplexní amplitudě optické víry, tedy singularity, které se vyznačují nenulovou hodnotou fázového rozdílu na uzavřené křivce obsahující bod nulové intenzity. Tyto víry způsobují problémy při navazování fáze (odstranění skoků fáze s hodnotou 2π). Pokud je sama funkce propustnosti vzorku vírová, pak je případný vír přenesen i do zobrazení. Při zobrazení reálných vzorků, kdy fázové posuvy závisejí na rozdílu optických drah daných rozdíly v rozložení indexu lomu vzorku, však obvykle signální svazek tyto singularity neobsahuje. Případné víry v obrazové fázi pak mají původ v koherentním zobrazovacím procesu, případně vznikají při rozptylu svazku v difuzním prostředí, které může obklopovat vzorek. Cílem činnosti je vytipovat vhodné metody navazování fáze, které jsou odolné vůči přítomnosti vírů v obrazové fázi, jednak najít možnost rekonstrukce nevírové funkce propustnosti vzorku. Z testovaných známých algoritmů navazování fáze se jako nejvhodnější nyní jeví modifikovaný Goldsteinův algoritmus, který je nyní testován z hlediska maximální rychlosti a adaptován pro použití v holografické rekonstrukci. Vznik vírů během zobrazení lze objasnit a
simulovat pomocí teoretického popisu zobrazení v holografickém mikroskopu, který byl rozpracován [3]. Příklad vzniku vírů při zobrazení modelového vzorku s nevírovou funkcí propustnosti je na obrázku 1. Tento teoretický popis byl zobecněn také pro přítomnost difusního prostředí v zobrazovací cestě [4]. Bylo zjištěno, že vznik a vývoj optických vírů při změně parametrů simulovaného zobrazení je ve shodě se známou teorií (viz např. Allen et al. Ultramicroscopy 88 (2001) 85–97).
Obr. 1: Příklad simulace vzniku optických vírů při holografickém zobrazení fázového objektu s bezvírovou funkcí propustnosti, jejíž fáze je znázorněna na obrázku a). Optické víry (vyznačeny šipkami) v obrazové fázi na obrázku b) vznikly v důsledku omezeného rozlišení optické soustavy. Činnost bude pokračovat zobecněním teoretických poznatků a ověřením vhodné metody rekonstrukce bezvírového předmětového pole na základě naměřené obrazové fáze. Za vhodný přístup považujeme korekci obrazové fáze pomocí fitování teoretických dat na výsledky experimentu. Tento přístup je aktuálně testován. Software pro řízení PMS Základem řešení je technologie prostorové modulace světla (PMS), která využívá elektrooptického jevu v kapalných krystalech. V laboratořích UP Olomouc jsou k dispozici systémy firem Hamamatsu, Boulder a Holoeye, které umožňují energeticky efektivní fázovou modulaci vstupního záření. Požadovaná změna fáze světelné vlny je určena elektrickými signály, které mění index lomu jednotlivých buněk LCD. Provedení PMS vyžaduje realizaci fázových hologramů a jejich přenos na LCD. Příprava počítačem generovaných hologramů je realizována pomocí algoritmů připravovaných v prostředí Matlab, jejich přenos na LCD byl řešen pomocí jednoduchého uživatelského softwaru. V průběhu roku 2012 probíhal podle stanoveného plánu vývoj řídícího softwaru jak na úrovni algoritmů pro přípravu hologramů, tak i automatizace jejich přenosu na LCD. V digitálním zobrazování vyvíjeném v pracovním balíčku je rekonstrukce obrazu prováděna ze tří korelačních záznamů, které vyžadují odeslání tří rozdílných fázových hologramů na LCD. Tyto operace nelze dostatečně rychle a efektivně provést pomocí standardního uživatelského softwaru. Pro řízení experimentu byl proto využit systém LabView, který je na VUT běžně užíván a na UP Olomouc byla pořízena akademická licence z prostředků projektu. V průběhu řešení projektu bylo úspěšně vyřešeno automatické odesílání počítačem generovaných hologramů na LCD a načítání korelačních záznamů ze CCD do počítače. V následném období bude řešena komunikace se softwarem pro rekonstrukci obrazu z pořízených korelačních záznamů. Řešení probíhá v souladu s původním plánem a ukončení vývoje softwaru ve stanoveném termínu je reálné.
Návrh numerických modelů pro simulaci zobrazování pomocí PMS. Prostorová modulace světla (PMS) je v zobrazovacích aplikacích nejčastěji využívána pro realizaci strukturovaného osvětlení, filtraci prostorového spektra, nebo dělení vlnoplochy. Korelační zobrazovací metody vyvíjené v balíčku jsou založeny na interferenci vln, které vznikají rozdělením vstupní vlny pomocí PMS. Zobrazovací systém představuje jednocestný interferometr, který může pracovat s prostorově nekoherentním zářením a pro korelační záznam využívá časovou koherenci. Zobrazení má v tomto případě část optickou, ve které je proveden záznam objektu, a část digitální, ve které jsou záznamy numericky zpracovány a následně rekonstruovány. Celý proces je závislý na velkém počtu experimentálních parametrů, jejichž vlivy je nutné vyšetřit pomocí numerických simulačních modelů. Pro návrhy a optimalizaci systémů byly v prostředí Matlab vytvořeny virtuální experimenty, které byly použity k řešení následujících problémů: • •
•
•
Určení impulzní odezvy při záznamu a rekonstrukci bodových objektů v monochromatickém záření. Určení parametrů experimentu pro optimální rozlišení systému a kvantifikace subdifrakčního rozlišení. Subdifrakční rozlišení bylo experimentálně prokázáno a příspěvek k diskuzi překročení difrakčního limitu je v přípravě k publikaci. Analýza korelačních záznamů při použití záření s proměnnou šířkou spektra a stanovení závislosti rozlišení detailů na koherenční délce použitého zdroje. Analýza umožnila určení parametrů, se kterými byla experimentálně ověřena možnost záznamu a rekonstrukce 3D objektů v bílém světle. Výsledky jsou originální jak z hlediska základní teorie, tak i aplikací a připravují se k publikaci. Ověření rotace obrazu při diskrétní spirální filtraci prostorového spektra. Výsledky byly publikovány [5] a je zvažováno jejich další využití v metodách umožňujících přesnou lokalizaci pozorovaných objektů.
Úkoly, které byly pro simulační aktivity stanoveny v původním návrhu projektu, jsou již v této fázi řešení splněny. V průběhu řešení projektu se ale objevila řada nových námětů, a je zřejmé, že optické simulace budou významnou aktivitou i po stanoveném termínu 03/2013. Jedním z důležitých podnětů je ověření možnosti realizace PMS pomocí standardních difraktivních elementů. Tuto možnost je nutné prověřit pomocí přesných virtuálních experimentů a mohla by mít zásadní význam pro další průběh řešení projektu. Nahrazení prostorových modulátorů prvky vyrobenými metodami elektronové litografie by zvýšilo kompaktnost systému a výrazně snížilo náklady konstruovaného systému. Realizace experimentů pro ověření zobrazovacích vlastností systémů pracujících s využitím PMS. Ověřovací experimenty, které byly v průběhu řešení projektu realizovány, demonstrují nestandardní vlastnosti a široký aplikační potenciál digitálních zobrazovacích metod využívajících technologie prostorové modulace světla (PMS). Návrhy ověřovacích experimentů vycházely jak z vlastních teoretických podnětů, tak i studia nových odborných publikací. Realizaci ověřovacích experimentů předcházely návrhy a optimalizace parametrů provedené v připravených simulačních modelech. Na ověření základního principu záznamu a rekonstrukce 3D objektů v kvazimonochromatickém prostorově nekoherentním záření navázaly pokročilé experimenty, které prokázaly možnost vírového záznamu a rekonstrukce obrazu, dosažení subdifrakčního rozlišení a zobrazení s využitím širokospektrálního záření. Ověřovací experimenty byly zaměřeny i na dílčí úkoly, které jsou motivované aplikacemi a návrhy výhodného konstrukčního uspořádání systému. Tyto činnosti budou pokračovat a v optimálním
případě by mohly vést k realizaci PMS pomocí difraktivních prvků připravených standardními technologiemi. Zvýraznění kontrastu amplitudových přechodů 3D objektů v nekoherentním světle Hybridní koherenční režim digitálního zobrazování, umožňující nekoherentní záznam a koherentní rekonstrukci objektů, se stal základem experimentů založených na využití koherentních vírových stavů světla. Vírové zobrazení je používáno v mikroskopii pro zvýšení kontrastu hran transparentních objektů. Tato metoda byla navržena v roce 2005 a její princip vyžaduje použití koherentního záření. Spirální mikroskopie využívá efektů konstruktivní a destruktivní interference, které při zobrazování s vírovou impulzní odezvou vedou ke zvýraznění gradientů amplitudy nebo fáze pozorovaných objektů.
Obr. 2: Standardní a vírové digitální zobrazení USAF testu: a) standardní způsob záznamu a rekonstrukce hologramů, b) rekonstrukce hologramů zaznamenaných pomocí vírové referenční vlny, c) rekonstrukce standardních záznamů provedená pomocí digitální spirální filtrace.
Obr. 3: Trojrozměrné zobrazení jehly umístěné před kruhovou clonou: a) přímý optický obraz, b) vírová rekonstrukce obrazu při zaostření na jehlu, c) vírová rekonstrukce s numerickým přeostřením na clonu. Srovnání různých režimů zobrazení blechy: d) přímý optický obraz, e) standardní rekonstrukce korelačních záznamů, f) rekonstrukce s digitální spirální filtrací. Ověřovací experimenty provedené v balíčku prokázaly možnost vytvořit vírovou impulsní odezvu i v digitálním korelačním zobrazení při použití prostorově nekoherentního světla. Pro dosažení vírového režimu zobrazení byly navrženy dvě rozdílné techniky, realizované buď v optické, nebo digitální části experimentu. Optická realizace je založena na korelačním záznamu, ve kterém je standardní referenční vlna nahrazena vírovou vlnou se šroubovitou vlnoplochou. Realizace takové referenční vlny byla provedena návrhem vhodného počítačem generovaného hologramu a jeho odesláním na LCD.
Hologramy objektu vytvořené pomocí vírových korelačních záznamů jsou potom rekonstruovány obvyklým způsobem. V digitální realizaci se pracuje se standardními korelačními záznamy objektu a vírová impulsní odezva je získána spirální modulací prostorového spektra, provedenou při rekonstrukci záznamů. Rekonstrukce získané diskutovanými postupy jsou uvedeny v obrázku 2. Optická i digitální alternativa vírového zobrazení byla realizována a funkčnost a použitelnost návrhu byla ověřena na rozlišovacích testech i reálných objektech. Metoda je specifická tím, že umožňuje zvýraznění amplitudových gradientů v nekoherentním světle, a jejím hlavním přínosem je možnost použití i v trojrozměrném zobrazování – viz obrázek 3. Podle našich informací se jedná o první demonstraci tohoto typu zobrazení. Získané výsledky prezentované v obrázcích 2 a 3 byly publikovány v prestižním optickém časopise [1] s impaktním faktorem. Korelační holografické zobrazení v bílém světle Zobrazovací systém, který byl v průběhu řešení projektu analyzován a rozvíjen, představuje jednocestný interferometr s dělením vlnoplochy pomocí prostorové modulace světla (PMS). Tento systém poskytuje interferenční záznamy jednotlivých bodů pozorovaného objektu, které jsou vzájemně zcela nekorelované. Takový způsob záznamu nevyžaduje prostorovou koherenci použitého záření, ale pracuje s koherencí časovou. Korelační bodové záznamy mohou vzniknout pouze tehdy, když rozdíl optických drah interferujících vln nepřesáhne koherenční délku použitého záření. V základní experimentální konfiguraci byly pro záznam používány vlny vyžadující šířku spektra použitého zdroje 10 až 20 nm. V odborných publikacích zveřejněných v roce 2012 (X. Lai et al, Opt. Lett. 37, 2445, 2012) byl proveden návrh geometrie interferujících vln, která vede k výraznému zmenšení rozdílu optických drah. Na základě těchto publikačních podnětů byla v rámci řešení projektu provedena série experimentů, která prokázala možnost výrazného rozšíření spektra použitého záření. Bylo tak možné pracovat s LED o šířce spektra 60 nm bez použití spektrálních filtrů. V optimalizovaném systému byl úspěšně proveden záznam a rekonstrukce objektů v podmínkách extrémně nízké časové koherence odpovídající bílému světlu. Výsledky získané v experimentální konfiguraci poskytující nejvyšší odolnost z pohledu snížené koherence světla jsou v obrázku 4.
Obr. 4: Rekonstrukce korelačních záznamů pořízených při rozdílné časové koherenci světla určené spektrálními filtry o pološířce: a) 10 nm, b) 40 nm a c) 70 nm. d) Rekonstrukce korelačních záznamů vytvořených v bílém světle halogenové žárovky.
Pro záznamy bylo v tomto případě použito bílé světlo halogenové žárovky v kombinaci se spektrálními filtry. Porovnání výsledků získaných při záření o spektrální šířce 10 nm a v bílém světle ukazuje zřejmý pokles rozlišení. Pro vysvětlení tohoto efektu byl navržen výpočetní model, který umožňuje najít přímou souvislost mezi koherenční délkou použitého zdroje a dosaženým rozlišením. Teoretické výsledky jsou v dobrém souladu s experimenty a jsou připraveny k publikaci. Závěry provedené analýzy jsou příslibem pro rozvoj PMS interferometrie v bílém světle a zejména pro využití vyvíjené zobrazovací metody ve fluorescenční mikroskopii. Návrh optimalizovaných systémů pro holografický záznam a digitální rekonstrukci obrazu. V průběhu řešení projektu byla realizována řada experimentů rozvíjejících digitální zobrazovací technologie s ohledem na nové netradiční principy a vlastnosti zobrazení. Na základě odborných publikací a vlastních návrhů byly ale také provedeny experimenty, jejichž cílem bylo vytvoření sestav, které budou optimální jak z hlediska optického výkonu, tak i technických a konstrukčních řešení. Byla nalezena a úspěšně experimentálně prověřena konfigurace zajištující optimální rozlišovací schopnost systému, při které je překročen difrakční limit použitého mikroskopového objektivu. Dále byl vytvořen a úspěšně experimentálně testován nový návrh sestavy zajištující úplné korelační překrytí interferujících vln, které vedlo k výraznému zvětšení využitelného zorného pole. Optimalizace systému z hlediska rozlišovací schopnosti a ověření subdifrakčního rozlišení Při standardním optickém zobrazování je rozlišení detailů omezeno difrakčním limitem, který je jednoznačně daný pracovní vlnovou délkou a numerickou aperturou systému. V digitálním zobrazování je situace složitější a dosažené rozlišení závisí nejen na parametrech použitého mikroskopového objektivu, ale také na geometrii, ve které je proveden záznam hologramů. V sestavě studované v projektu jsou klíčovými parametry ohnisková vzdálenost čočky vytvořené pomocí PMS a poloha CCD při záznamu hologramů. Souvislost mezi parametry použitého optického systému, záznamovou geometrií a dosaženým rozlišením byla podrobně studována ve vytvořených modelech a správnost výpočtů byla ověřována experimentálně. Tento postup umožnil provést optimální nastavení systému a prokázal možnost dosáhnout v předmětovém prostoru rozlišení detailů, které jsou za hranicí difrakčního limitu použitého mikroskopového objektivu. V tomto smyslu lze tedy hovořit o subdifrakčním rozlišení, které je významnou vlastností zobrazovacích systémů. Ve zkoumané metodě digitálního zobrazování plyne možnost překonání difrakčního limitu přímo z vlastností systému a lze jí dosáhnout vhodnou kombinací parametrů PMS a geometrických parametrů použitých při záznamu hologramů. Dvoustupňový proces zobrazení, který kombinuje optickou a digitální část, nemá předmětovou a obrazovou aperturu vázanou s příčným měřítkem zobrazení prostřednictvím Lagrangeova invariantu, jak je tomu v čistě optickém zobrazení. Tato vlastnost umožňuje měnit rozlišení systému volbou jeho základních parametrů a v optimálním případě překročit difrakční limit optického zobrazení vytvořeného použitým objektivem.
Obr. 5: Demonstrace subdifrakčního rozlišení: a) přímý difrakčně limitovaný optický obraz s rozlišením 40,3 č/mm, b) digitálně rekonstruovaný obraz s rozlišením 57 č/mm. Experimentální demonstrace subdifrakčního rozlišení v popsaném systému digitálního zobrazení je na obrázku 5. Experiment byl proveden s nízkou numerickou aperturou objektivu, při které se neprojeví optické vady a systém pracuje jako fyzikálně dokonalý. Tímto způsobem byla ověřena možnost překonání difrakčního limitu, ale pro praktické použití je nutné experiment realizovat s vyšším obrazovým výkonem. Tento úkol bude dále řešen s ohledem na technické a konstrukční problémy. Zvětšení korelačního zorného pole Velikost využitelného zorného pole a rozlišovací schopnost jsou nejdůležitějšími optickými parametry každého zobrazovacího systému. V klasických optických systémech je zorné pole vymezeno mechanicky v rovině obrazu nebo meziobrazu a jeho velikost určují rozměry účinné plochy detektoru nebo clony zorného pole. V korelačním zobrazování o velikosti oblasti, ve které je obraz úspěšně rekonstruován, navíc rozhoduje míra překrytí signálního a referenčního pole. Přestože korelační překrytí má zásadní význam, v dostupné odborné literatuře nebyla tato problematika dosud systematicky zpracována. Při řešení projektu byla pozornost zaměřena jak na teoretickou analýzu, tak i na experimentální ověření korelačně podmíněného zorného pole.
Obr. 6: Demonstrace zvětšení zorného pole: a) zorné pole redukované nedostatečným korelačním překryvem ve standardní konfiguraci, b) zvětšené zorné pole v sestavě s přizpůsobovacím optickým systémem – dostupné zorné pole je omezené účinnou plochou detektoru, c) rekonstrukce korelačního záznamu v plném zorném poli objektivu při použití optimalizovaného systému. Výsledky ukázaly, že ve známých konfiguracích je korelační překrytí signální a referenční vlny zajištěno jen v omezené části zorného pole použitého mikroskopového objektivu. Pro určení míry korelačního překrytí byl zaveden faktor, který umožnil jednoduchou kvantifikaci překrytí ve
všech používaných experimentálních konfiguracích. Analýzou bylo prokázáno, že zmenšení zorného pole mikroskopového objektivu způsobené nedostatečným korelačním překrytím se projevuje nevýrazněji při použití objektivu s velkým zvětšením a při nastavení parametrů, které vedou k optimálnímu rozlišení. V návaznosti na provedenou analýzu byla navržena modifikace systému, která zabezpečuje úplné korelační překrytí signální a referenční vlny v celém zorném poli použitého objektivu. Tohoto efektu bylo dosaženo pomocí dvoučlenného přizpůsobovacího optického systému, který byl vřazen mezi PMS a CCD. Po této úpravě bylo možné provést rekonstrukci obrazu v zorném poli, které bylo ve srovnání s dříve užívaným systémem až několikanásobně větší. Průkazné experimentální výsledky jsou demonstrovány v obrázku 6 a jsou zpracovány v publikaci, která je v recenzním řízení [2]. Literatura [1] P. Bouchal and Z. Bouchal, Selective edge enhancement in three-dimensional vortex imaging with incoherent light, Opt. Lett. 37, 2949-2951 (2012). [2] P. Bouchal and Z. Bouchal, Wide-field common-path incoherent correlation microscopy with perfect overlaping of interfering beams, J. Europ. Opt. Soc.Rap. Public (zasláno). [3] R. Chmelík, Coherent Imaging with Incoherent Light in Digital Holographic Microscopy. Proc. SPIE (v tisku). [4] M. Henzlová, Theoretical study of coherence-controlled holographic microscopy in the presence of scattering media. Proc. SPIE (v tisku). [5] M. Baránek and Z. Bouchal, Rotating point spread function in spiral phase contrast imaging with discrete phase modulation, Proc. SPIE (v tisku).
Pracovní balíček: Zpracování dat S-H senzoru v metrologii a zobrazování Analyzování současné technologické špičky v oblasti S-H detekce. Tato činnost měla za úkol přehledně zmapovat technologickou úroveň nejnovějších S-H detektorů na světovém trhu a dát tak řešitelům informace o tom, jaké technologie jsou dnes komerčně dostupné, jaké možnosti tyto systémy nabízí a kde je potencionální prostor pro aplikaci nově vzniklých technologií v rámci projektu. Na trhu se vyskytují i uzavřené jednoúčelové metrologické systémy, jejichž základem je S-H detekce, ty ovšem nebyly do analýzy zahrnuty, protože v projektu jde o technologii S-H jako takovou. S-H systémy mají svou hardwarovou a softwarovou část, proto se při analyzování senzoru musí brát v potaz obě složky. Softwarová část má obecně na výkon systému větší vliv, což je dáno různou úrovní použitých algoritmů. Jelikož žádný výrobce neposkytne přímé informace o druhu jím využívaných algoritmů, byly udávané vlastnosti systémů konfrontovány se současnou odbornou literaturou a byly tak vytipovány nejpravděpodobněji využívané algoritmy. Hardwarová část S-H detektoru má dva základní prvky a to CCD kameru a mikročočkové pole. Jelikož většina výrobců S-H detektorů tyto klíčové prvky nakupuje, byly do analýzy zahrnuty i možnosti výrobců těchto jednotlivých komponent a bylo sledováno, kteří výrobci nejčastěji poskytují své komponenty pro S-H detektory. Pro přímý kontakt s výrobci byly navštíveny veletrhy v Baltimore-USA a Frankfurtu-Německo. Zejména u nějvětších výrobců S-H detektorů, což jsou Imagine Optics a Optocraft, byl zachycen trend využívání velkých CCD čipů, což umožňuje konstrukci detektorů s velkým prostorovým rozlišením. Je to dáno zejména rozvojem čipů na kinofilmový formát. Nevýhodou takovýchto čipů je velké množství přenášených dat a tím malá frekvence snímkování, velké nároky na výpočetní techniku a velká pořizovací cena. Přes tyto nevýhody bylo rozhodnutu zakoupit takovouto kameru pro potřeby projektu a sestavit tak systém s co možná nejvyšším prostorovým rozlišením. Nejlepším zdrojem informací byly získané manuály systémů firem Imagine Optics, Thorlabs a Flexible Optical. Z těchto manuálů jde vyčíst důležité informace a používaných algoritmech a toku dat v senzoru. Tyto informace jsou zvláště cenné pro sestavování Meopta software pro S-H detektor. Některé již byly v průběhu roku zapracovány, větší část bude zapracována v roce příštím v rámci činnosti „Programování software pro kontrolu dat z S-H senzoru a diagnostiku intenzity a vlnoplochy“. O S-H detekci je velký zájem i výzkumné sféře a tato problematika se často vyskytuje i v současné odborné literatuře. Zejména se jedná o nové typy algoritmů pro zlepšení dynamického rozsahu a citlivosti senzoru. Některé z těchto algoritmů byly vybrány a budou se realizovat v Meopta software v následujícím roce. Obecně lze říci, že úroveň současných SH systémů pro optickou metrologii se blíží úrovni dosud dominantní digitální interferometrie, což je dáno zejména rozvojem CCD prvků a velkému pokroku v digitálním zpracování obrazu v posledních letech. Z analýzy též vyplývá, že u všech systémů podstatnou část ceny tvoří vždy software. Meopta jako člen řešitelského týmu již svůj základní software vlastní, ten ovšem ještě úrovně software zavedených firem nedosahuje. Závěry učiněné při této analýze dávají jasný přehled potřebných vylepšení a lze říci, že všechny cíle jsou dosažitelné. Ze zkušeností učiněných na vlastních sestavách jsme narazili též na problém s maskováním signálu pro výpočet aberací, který ani v konkurenčních software není spolehlivě vyřešen. Významnost tohoto problému je diskutována i v literatuře. Zde se tedy nabízí možnost předstihnout konkurenci.
Informační protokoly pro S-H detekci. Cílem našeho snažení je prozkoumat možnosti detekce netradičního stavu světla pomocí S-H senzoru. Proces detekce je úzce spjatý s digitální rekonstrukcí stavu analyzovaného optického signálu. Výzkum na katedře optiky se zaměřil na statistickou analýzu detekovaného signálu S-H detektoru z hlediska informačních protokolů využívaných ve kvantové informatice. Bylo vyjasněno, že informace odpovídající detekci za jednotlivými ohraničenými mikročočkami odpovídá navzájem se nepřekrývajícím (ortogonálním) detekcím. Z tohoto pohledu neposkytuje měření tomograficky kompletní informaci na neomezeném prostoru signálních stavů. Byla studována otázka, za jakých dodatečných omezujících podmínek je možné získanou informaci považovat za úplnou. Tento výzkum je nezbytnou součástí pro následnou úspěšnou praktickou aplikaci tomografické rekonstrukce na reálný signál. Výzkum v oblasti nových informačních protokolů se dále zabýval otázkou výsledné meze rozlišitelnosti jednotlivých parametrů. V rámci vypsané bakalářské práce je ve zjednodušeném modelu studovaná difrakční mez S-H detekce pro úhlové rozlišení s využitím Fisherovy informace. Následné rozšíření pak povede k vyjasnění meze rozlišení pro další detekovatelné parametry, např. stupeň koherence mezi dvěma překrývajícími se rovinnými vlnami. Popis S-H detekce úzce souvisí s aperturní syntézou a proto se činnost zaměřila i na studium a modifikací metod využívaných v této oblasti. Jako základní stav optického pole pro tyto úvahy byla vybrána superpozice rovinných vln. Z fourierovského popisu optiky víme, že ze superpozice rovinných vln jde připravit jakýkoli stav pole a tyto vlny je možno navíc jednoduše připravovat laboratorně. Příkladem stavu světla, který není možné detekovat tradičními S-H metodami je částečně koherentní superpozice dvou a více vzájemně nakloněných rovinných vln. Takto připravený stav světla lze popsat pomocí koherenční matice, což je hermitovská matice, která pro výše zmíněnou superpozici d vln má hodnost d a obsahuje d(d+1)/2 nezávislých elementů. V první fázi úvah jsme zanedbali interferenci mezi jednotlivými mikročočkami. Proces měření S-H senzoru lze popsat jednoduchým vztahem, který je založený na výpočtu stopy součinu koherenční matice a matice měření. Matice měření charakterizuje proces měření intenzity na konkrétním pixelu detektoru při využití určité mikročočky. Našim cílem bylo nejprve uvážit za jakých podmínek je možné z libovolné známé superpozice nakloněných rovinných vln rekonstruovat z daného měření S-H senzoru koherenční matici a diskutovat, jak je tato rekonstrukce odolná vzhledem k případnému šumu na detektoru. Za účelem další diskuze byly odvozeny matice měření pro mikročočky s čtvercovou a kruhovou propustností. Tyto matice obsahují podle typu propustnosti sinc nebo jinc funkce doplněné o příslušné fázové faktory. Dobrou mírou odolnosti daného měření vzhledem k šumu se ukazují být tzv. singulární hodnoty matice měření. Aby bylo možné rekonstrukci provést, je nutné mít k dispozici stejný počet nenulových singulárních hodnot matice měření, jako je počet nezávislých elementů koherenční matice. Pro vyšší singulární hodnoty bude rekonstrukce odolnější. Z numerické analýzy tohoto problému vyplynula výrazná závislost singulárních hodnot na volbě konkrétní superpozice rovinných vln. Z tohoto důvodu byly numericky zjištěny singulární hodnoty
v závislosti na volbě daných náklonů. Grafy na obr. 1 znázorňují nejnižší singulární hodnotu v závislosti na volbě superpozice náklonů rovinných vln. Obrázek vlevo demonstruje situaci pro 2 mikročočky a 10 pixelů za každou z nich. Pro srovnání je na obrázku vpravo stejný graf pro 40 mikročoček a 15 pixelů za každou z nich. Z obou grafů je patrné výrazné zlepšení napříč celým prostorem nakloněných vln po přidání mikročoček a pixelů.
Obr. 1: Singulární hodnoty matice měření pro systém rovinných vln o různém náklonu. V blízké budoucnosti bude provedena optimalizace počtu a velikosti mikročoček a velikosti pixelů s ohledem na singulární hodnoty. V současné době probíhá analýza vlivu interference mezi jednotlivými mikročočkami. Za účelem ověřování nových informačních protokolů pro SH detekci byla v laboratoři Univerzity Palackého vytvořena experimentální sestava, na které se provádí základní experimenty a současně analyzují technologické problémy vyplývající ze zcela nového pohledu na S-H detekci, viz. obr. 2. Protože obecně se bude zkoumat signál částečně koherentní, obsahuje sestava dva nezávislé laserové zdroje, které umožňují vytvářet současně nekoherentní i koherentní superpozice vln. Dále sestava obsahuje prostorový modulátor světla pro vytváření různých typů optických signálů, jako například optických vortexů. Jako S-H senzor se používá systém firmy Flexible Optical, který má hexagonální pole mikročoček a 1/2palce USB CCD. Ten bude v příštím roce řešení nahrazen vhodnějším senzorem vlastní konstrukce, kde parametry budou určeny na základě současných poznatků s novými detekčními technikami a výsledky první výzkumné zprávy balíčku. Pro matematické zpracování jsou využívány programy v systému OCTAVE. Základním kamenem nových metod po technologické stránce je věrný matematický popis měřícího zařízení, který determinuje rozlišení metody a její přesnost. Prvním poznatkem při uplatnění protokolů kvantové tomografie na reálný signál byl velký vliv šumu a vzorkování na rozlišitelnost jednotlivých stavů světla. Pro vyřešení problému šumu lze s výhodou uplatnit na signál frekvenční propusti, hrozí zde ale distorze užitečného signálu, proto jsou v současnosti studovány možnosti sofistikovanějších algoritmů. Pro problém vzorkování a také vzájemné orientace mikročoček a CCD je vyvíjena vlastní metoda kalibrace pomocí základní vlny studovaného systému. Může to být například rovinná vlna nebo základní gaussovský svazek. Při této kalibraci jsou určovány posuvy intenzitních težišť za každou mikročočkou jako při klasické rekonstrukci, mohou zde tudíž najít uplatnění existující algoritmy. Také tvar apertur jednotlivých mikročoček hraje významnou roli, proto bylo potřeba u stávající sestavy pracovat s difrakcí na hexagonální apertuře.
Obr. 2: Experimentální sestava pro výzkum v oblasti informačních protokolů: SM1-jednomodové vlákno s navázaným He-Ne laserem, f1- kolimační čočka, SLM- prostorový modulátor světla, 4ffiltrační 4f systém s prostorovou filtrací, BS- dělič svazku, SM2- jednomodové vlákno s navázanou laserovou diodou, f2- kolimační čočka, S-H- Shack-Hartmann detektor . Dva nezávislé zdroje umožňují vytváření částečně koherentních signálů. Aplikovaný výzkum nových informačních protokolů ve firmě Meopta-optika, s.r.o. byl zaměřen na možnost měřění paraxiálních ohnisek optických systémů pomocí S-H detektoru. Při klasickém způsobu měření ohnisek je přístupná pouze efektivní hodnota tohoto parametru, protože jsou přítomny vlnové aberace vyšších řádů. Komplexní detekce pomocí S-H senzoru může tento problém vyřešit. Metoda navíc nevyžaduje nejdražší část konvečních systémů-kolimátor. Může tak poskytnout cenově výhodné řešení. Vlastní experiment je proveden v následujícím uspořádání. Svazek laseru je navázán do optického vlákna, jehož konec slouží jako bodový zdroj sférické vlny. Tento bodový zdroj je umístěn přibližně do předmětového ohniska měřené čočky. V obrazovém prostoru v dané vzdálenosti od čočky jsou následně pomocí S-H senzoru detekovány Zernikovy koeficienty vlnoplochy. Speciálně nás zajímá Seidelův koeficient rozostření. Abychom ho určili, je nutné znát dva Zernikovy koeficienty (Z3 a Z8). Změnou vzdálenosti předmětového bodu v kombinaci se souběžným měřením koeficientů získáváme postupně závislost, kterou fitujeme teoreticky odvozeným vztahem. Ohnisko čočky měříme nepřímo, jako jeden z parametrů získaných fitováním. Aby bylo možné měření optimalizovat vzhledem k různému počtu poloh bodového zdroje a jejich vzájemným vzdálenostem, byl vytvořen numerický model v programu Mathematica popisující proces měření. Tento model je schopný pro určitou ohniskovou vzdálenost čočky odhadnout nejistotu měření ohniska. Hlavní úlohu hraje v modelu nejistota měření polohy a nejistota měření daných Zernikových koeficientů.
S problematikou úzce souvisí znalost základních parametrů S-H senzoru, popřípadě metody jejich zjišťování. Mezi základní parametry patří vzdálenost L matice mikročoček od detektoru, velikost pixelu a vzdálenost mikročoček. Jestliže o těchto parametrech nemáme přesnou informaci, výsledné měření ohniska bude vykazovat systematickou odchylku. Existují dvě metody, jak tyto parametry měřit. Doposud bylo provedeno měření vzdálenosti L pomocí nakloněné rovinné vlny. S-H senzor je umístěn na goniometru, který mění náklon rovinné vlny vytvořené kolimátorem. Výsledky byly zpracovány numericky v program Mathematica. V blízké době plánujeme předchozí výsledek porovnat s metodou, která využívá sférické vlny, jejíž poloměr křivosti je v průběhu měření postupně měněn. Poloměr křivosti je současně měřen na S-H senzoru a výsledná závislost fitována teoreticky odvozeným vztahem. Jestliže bodový zdroj sférické vlny neleží na ose měřené čočky, bude vlna za čočkou vykazovat určité zklenutí. Tento příspěvek je v průběhu detekce vlnoplochy započítán do Zernikova koeficientu Z3, což může negativně ovlivnit přesnost metody měření paraxiálního ohniska. V programu Oslo byly zjištěny pro zvolené čočky koeficienty vlnových aberací charakterizující zklenutí. V současnosti probíhá závěrečná fáze analýzy vlivu náklonu čočky na výpočet ohniska. Teoretické úvahy jsou doprovázeny paralelně probíhajícími experimenty, které ověřující teoreticky nabyté zkušenosti. Pro tyto účely jsme vytvořili experimentální sestavu. Z výsledků experimentů měření ohniska tří vybraných čoček jsou patrny poměrně velké systematické odchylky (půl procenta až procento) od hodnoty paraxiálního ohniska, které bylo vypočítáno v programu Oslo. Našim cílem je v nejbližší době tyto odchylky vysvětlit. Pokud by byly způsobeny zklenutím čočky, bude nutné diskutovat vhodný způsob justáže čočky do měřící sestavy. Software pro kontrolu dat z S-H senzoru a diagnostiku intenzity a vlnoplochy. Firma Meopta-optika, s.r.o. disponovala vlastním software pro vyhodnocování vlnoplochy již před začátkem projektu, jeho vlastnosti ovšem nebyly optimální a to jak v otázce použitých algoritmů, tak ve vnitřní organizační struktuře. V rámci této činnosti je proto rozvíjen zcela nový software, který bude obsahovat všechny prvky moderních konkurenčních řešení a přitom bude maximálně otevřený a modulární, tak aby ho bylo snadné využívat pro nové postupy a aplikace při řešení celého pracovního balíčku. Předně bylo rozhodnuto vytvořit celý systém jako přísně objektový, tzn. podle principů objektového programování. V tomto systému je každá část procesu zpracování dat z S-H senzoru koncipována jako samostatná jednotka a celý systém je pak kompozicí těchto základním jednotek. Po naprogramování těchto jednotek je stavba nového systému velice rychlá a je tak snadné sestavit zcela nový S-H software podle aktuálních potřeb. Při jakékoli inovaci některé části kódu je také snadné provést aktualizaci všech existujících aplikací. Třetí velkou výhodou je snadný přístup k datům v kterémkoli místě měřícího řetězce. To je důležité pro rozvoj nových detekčních postupů, což je náplní řešení pracovního balíčku v příštích letech. Během prvního roku se podařilo naprogramovat všechny základní jednotky a v současnosti je tedy možno využít všech výše uvedených výhod.
Obr. 3: Mapa zpracování dat v S-H senzoru.Diagram zhruba odpovídá objektové struktuře problému a každá činnost znamená určitý algoritmus.
Obr. 4: Vliv decentralizace masky a optického svazku obsahujícího sférickou vadu velikosti 1λ na aberační Zernikův koeficient C31. Parametr a je relativní posun masky vůči poloměru masky a C31 je v λ. Je vidět že i pro malou chybu decentralizace 2% je vygenerován chybný koeficient 0,15λ. Vzorkování svazku mikročočkami je přitom na úrovni chyby decentralizace 4-10%. Pro nalezení možných vylepšení a analyzování konkurenčního software byla sestavena mapa zpracování dat v S-H senzoru, viz. obr. 3. Řešitelský se pak zaměřil na jednotlivé kroky a snažil se nalézt v dostupné odborné literatuře současný trend řešení příslušného problému. Inspirací je též řešení daného problému komerčními výrobci. V prvním roce se pozornost zaměřila především na konec celého řetězce tj. na problémy rekonstrukce OPD, maskování a výpočet aberací. V oblasti rekonstrukce OPD byl naprogramován nový postup, tak aby bylo možno snadno využívat jak modální tak zonální rekonstrukci. V rámci výpočtu vlnových aberací byla provedena zásadní inovace. Současný systém
umožňuje vyčíslování Zernikových polynomů různých řazení a jejich převod na Seidlovy aberace a také umožňuje vyčíslovat Strehl koeficienty pro jednotlivé aberace. Vzhledem k neortogonalitě dat z SH senzoru je plánován přechod na SVD algoritmus, což je u komerčních systému standard, v našem software zatím chybí. Problém maskování je zvlášť zajímavý, protože není uspokojivě řešen u žádného komerčního výrobce S-H senzorů a nabízí se zde tedy možnost inovačního náskoku. Problém umísťování masky do optického svazku je u S-H senzoru velmi důležitý kvůli nízkému vzorkování a tudíž malé přesnosti tohoto úkonu. Přitom vliv na koeficienty aberací je velmi značný, jak ukazuje obr.4 na příkladu komy a svazku obsahujícího sférickou vadu. V Meoptě byl implementován postup, který umožňuje zpřesnit maskování až o jeden řád. V plánu jsou další zpřesnění tohoto postupu a pro zákazníky Meopty-optika by to měla být zvláště zajímavá součást S-H software. Měření kvality optických ploch pomocí S-H technologie. Tato činnost má podpůrný charakter pro jeden z výstupů projektu a to měřící stanice tvaru optických prvků rovinné a sférické optiky. V prvních třech letech řešení by prováděné činnosti měly dát podklad pro finální návrh, nákupy a montáž stanice. V prvním roce se řešitelé zaměřili především na vztah hardwarových parametrů senzoru a metrologických parametrů jako je dynamický rozsah, přesnost a rozlišení. Na základě těchto úvah byly navrženy první nákupy klíčových komponent- CCD kamery a mikročočkových polí. Byl proveden průzkum systémů využívajících S-H senzor pro měření optických prvků. Komerčně dostupné systémy S-H senzorů představují po softwarové stránce uzavřená řešení použitelná na omezený okruh aplikací. Jen zřídka jsou nabízena ucelená řešení pro měření optických prvků (např. Trioptics, Optocraft). Takový systém je vzhledem ke značné různorodosti měřených součástí náročný z hlediska své stavby a rozsahu dodávaného příslušenství. Je zpracován přehled porovnávající možnosti měření optických prvků interferometricky a pomocí S-H senzoru. Uvedené metody si konkurují jen částečně, v některých ohledech se doplňují. Orientační měření ukazují, že při použití S-H senzoru je důležité, aby kontrolovaná apertura byla zobrazena na vstupní otvor S-H senzoru, což u zařízení, které má pokrýt širší sortiment optických prvků, vede ke komplikovanější optické konstrukci. Byla navržena první sestava pro měření rovinných ploch do průměru 190 mm pomocí S-H senzoru. Pro tuto sestavu byly zakoupeny její základní součásti a pokračuje se v návrhu sestavy mechaniky.
Seznam prezentací a publikací Prezentace: 1. B. Stoklasa, J. Řeháček, Z. Hradil, Adaptive IR and VIS image fusion, SPIE Defense, Security + Sensing 2012, Baltimore, USA 2. B. Stoklasa, J. Řeháček, Z. Hradil, L.L. Sanchez-Soto, Shack-Hartmann tomography and Laguerre-Gaussian beam characterization, Fifth International Conference "Singular Optics SO'2012", Sevastopol, Ukrajina Publikace: 1. B. Stoklasa, J. Řeháček, Z. Hradil, Adaptive IR and VIS image fusion, Multisensor, multisource information fusion: Architectures, algorithms and applications 2012 Book Series: Proceedings of SPIE 8407, 84070Y (2012). 2. P. Bouchal and Z. Bouchal, Selective edge enhancement in three-dimensional vortex imaging with incoherent light, Opt. Lett. 37, 2949-2951 (2012). 3. P. Bouchal and Z. Bouchal, Wide-field common-path incoherent correlation microscopy with perfect overlaping of interfering beams, J. Europ. Opt. Soc. Rap. Public (zasláno). 4. R. Chmelík, Coherent Imaging with Incoherent Light in Digital Holographic Microscopy, Proc. SPIE (v tisku). 5. M. Henzlová, Theoretical study of coherence-controlled holographic microscopy in the presence of scattering media, Proc. SPIE (v tisku). 6. M. Baránek and Z. Bouchal, Rotating point spread function in spiral phase contrast imaging with discrete phase modulation, Proc. SPIE (v tisku). 7. Y.S. Teo, B. Stoklasa, B.-G. Englert, et al., Incomplete quantum state estimation: A comprehensive study, Phys. Rev. A 85, 042317 (2012). 8. D. Mogilevtsev, J. Řeháček, Z. Hradil, Self-calibration for self-consistent tomography, New Journal of Physics 14, 095001 (2012). 9. D. Sych, J. Řeháček, Z. Hradil, et al., Informational completeness of continuous-variable measurements, Phys. Rev. A 86, 052123 (2012).
July 15, 2012 / Vol. 37, No. 14 / OPTICS LETTERS
2949
Selective edge enhancement in three-dimensional vortex imaging with incoherent light Petr Bouchal1 and Zdeneˇk Bouchal2,* 1
Central European Institute of Technology, Brno University of Technology, Technická 10, 616 00 Brno, Czech Republic 2 Department of Optics, Palacký University, 17. listopadu 1192/12, 771 46 Olomouc, Czech Republic *Corresponding author:
[email protected] Received March 30, 2012; revised May 27, 2012; accepted May 29, 2012; posted May 30, 2012 (Doc. ID 165784); published July 13, 2012 We demonstrate a new imaging method enabling a selective edge contrast enhancement of three-dimensional amplitude objects with spatially incoherent light. The imaging process is achieved in a spiral modification of Fresnel incoherent correlation holography and uses a vortex impulse response function. The correlation recordings of the object are acquired in a one-way interferometer with the wavefront division carried out by a spatial light modulator. Two different methods based on applying a helical reference wave in the hologram recording and a digital spiral phase modulation in image reconstruction are proposed for edge enhancement of amplitude objects. Results of both isotropic and anisotropic spiral imaging are demonstrated in experiments using an LED as an incoherent source of light. © 2012 Optical Society of America OCIS codes: 090.1995, 260.6042, 110.3010.
Contrast enhancement of the edges is an operation that is often used in optical image processing. Previously, the edge contrast enhancement of amplitude objects was performed in a coherent imaging using the radial Hilbert transform to modulate the Fourier spectrum [1]. This filtering technique acts isotropically so that all the edges in a sample are highlighted independently of their local direction. The anisotropic spiral filtering resulting in an apparent shadow effect was also demonstrated [2,3]. All the methods based on a spiral filtering create the image by the convolution of a complex function representing the sample with a vortex impulse response function of the optical system. Since the edge enhancement is a consequence of constructive and destructive interference of individual vortices, the use of coherent light is required [4,5]. In this Letter, we propose and experimentally demonstrate a new imaging technique enabling the edge contrast enhancement of amplitude objects using incoherent light. Our method is based on the Fresnel incoherent correlation holography (FINCH) technique, which was modified to operate with a vortex imaging. In its basic form, FINCH includes both optical and digital steps and allows reconstruction of three-dimensional (3D) objects. This method requires quasi-monochromatic spatially incoherent light and utilizes a spatial light modulator (SLM) to perform correlation recordings of the object. The holograms are then processed and reconstructed using suitable numerical algorithms [6]. We modified the experiment to ensure that the FINCH imaging created with an incoherent light will have some benefits of the spiral contrast methods previously presented with a fully coherent light. This is possible due to special coherence properties of the FINCH configuration that result from a combination of optical and digital imaging techniques [7]. Object information is contained in optical correlation recordings that are created using an incoherent light. Subsequent digital reconstruction takes place in a fully coherent regime [7] and allows interference of vortex structures required to emphasize edges of amplitude objects [5]. We propose two different methods that allow 0146-9592/12/142949-03$15.00/0
switching from standard FINCH to the spiral contrast imaging operation. The first method relates to changes in the optical recording of the object being based on application of a helical reference wave. The second method works with standard FINCH recordings, and the vortex imaging is achieved by a digital spiral phase modulation during their processing. A basic principle of the method is shown in Fig. 1. A source emitting quasi-monochromatic spatially incoherent light illuminates the object. Its individual points represent secondary sources that emit spherical waves. These light waves are collimated by the lens CL and directed to the SLM. By the SLM operation, each incident wave is doubled and the signal and reference waves are formed. Because the waves originate from the same point, they are spatially coherent. If the optical path difference of the waves does not exceed the coherence length of the source, they can interfere. At the CCD, the complex amplitude of the light emitted by a single point of the object is given as A0j ar expiΦr as expiΦs − iϑj , j 1, 2, 3, where as , Φs and ar , Φr denote amplitudes and phases of the signal and reference waves, respectively, and ϑj are constant phase shifts imposed on the signal wave by the SLM. Intensity records I 0j jA0j j2 are repeated three times for different phase shifts of the signal wave allowing the elimination of the holographic twin image [6]. The basic difference between the standard FINCH and its optical spiral modification consists in preparation of the phase maps to generate the signal and reference waves. While in the
Fig. 1. (Color online) Standard and spiral configurations for a correlation imaging with incoherent light. © 2012 Optical Society of America
2950
OPTICS LETTERS / Vol. 37, No. 14 / July 15, 2012
standard configuration Φs and Φr correspond to the phases of spherical and plane waves, respectively, in the optical spiral method, a helical reference wave is generated by the SLM. Its phase involves a term depending on the azimuthal angle φ and integer parameter m called the topological charge, Φr ≈ mφ. The phase maps that drive the SLM to create the signal and reference waves are shown in the middle part of Fig. 1, where (a) and (b) correspond to the plane and helical reference waves, respectively. Intensities I 0j represent the point correlation records, and their shape is shown in the right panel of Fig. 1. The upper snapshot is obtained in the standard configuration being similar to the Fresnel zone plate. For the spiral contrast, the point correlation record has a typical shape of the spiral pattern, known from the interference of optical vortices. Before digital image reconstruction, three intensity records I 0j are processed [6], and a complex function T is created, T ≈ exp iΦs − Φr . In [7], it was shown that T corresponds to the quadratic phase of a diffractive lens whose parameters depend on both the experiment geometry and a position of the object point. For the helical reference wave, T corresponds to the vortex diffractive lens having a spiral phase with the topological charge m. In the point imaging, the complex amplitude is obtained using the Fresnel transform, A00 ≈ FrfTg. For a plane reference wave, the point spread function (PSF) with the shape of the Airy pattern is obtained. If the reconstruction is performed from the spiral correlation records, the vortex PSF with an annular shape appears in the digital image (Fig. 1). The vortex imaging can be achieved even if the reconstruction is performed using standard recordings taken with a plane reference wave. Here the reconstruction is carried out in the frequency domain and a spiral phase mask modulates the spatial spectrum of the complex function T. This effective and operational technique represents a digital analogy of the spiral contrast previously used in a coherent optical imaging [1,5]. Edge enhancement of real incoherently illuminated objects with the transmission t is possible because the image is formed in a hybrid mode of spatial coherence. As separate object points are mutually uncorrelated, the intensity records of the whole object are given by a convolution, I j ≈ t I 0j . It shows that the intensity records of individual object points I 0j are superimposed incoherently to obtain the final intensity. Before the digital image reconstruction, three intensity records of the object point are processed to create the phase function T, which represents a diffractive lens. As demonstrated in [7], its transmission, focal length, and lateral axis position carry information about the amplitude and the spatial position of the recorded point of the observed object. Information about the entire object is encoded in the coherent superposition of individual diffractive lenses [7]. This is why the resulting complex amplitude of the digitally reconstructed image A0 is obtained in a coherent mode as a convolution A0 ≈ t A00 . The complex amplitude A00 has a typical vortex structure with an annular amplitude and a spiral phase given by the term expimφ. Each point of the digital image has a vortex phase so that a phase difference of mπ appears at a symmetric position in any radial line with respect to the vortex core. This
Fig. 2. (Color online) Scheme of the experiment. SF, spectral filter; CL, collimating lens; D, diaphragm; P, polarizer; BS, beam splitter; SLM, spatial light modulator.
property allows interference effects leading to the edge enhancement of amplitude objects [1,5]. The proposed method has been experimentally verified in the system illustrated in Fig. 2. The collimated LED (Thorlabs, 625 nm) with the spectral filter (FWHM 3 nm) was used as a light source. To create object correlation records, the achromatic lens (f 150 mm) and the SLM (Hamamatsu, 800 × 600 pixels) were used. Two lenses (f 1 470 mm and f 2 523 mm) were randomly multiplexed on the SLM to realize the dual lens FINCH with spherical signal and reference waves [8,9]. The CCD (Retiga 4000 R) was placed at a distance 495 mm behind the SLM to capture holograms of the object. Results obtained using both optically and digitally implemented spiral contrast methods are shown in Fig. 3. Three intensity patterns representing correlation records of a point object I 0j are shown in the FINCH column. The image obtained by a direct reconstruction of standard records of the United States Air Force (USAF) test is in the left panel (label DR). If the spiral phase mask (m 1) is applied during processing of the standard records, the image with an apparent edge contrast enhancement is obtained (left panel, label SM). The PSF obtained by the direct and spiral reconstruction of standard records of a point object is shown at the bottom of Fig. 3. The spiral correlation records of a point object created by using a helical reference wave (m 1) are shown in the S-FINCH column. The PSF obtained by their direct reconstruction is at the bottom. The image of the USAF test obtained by a direct reconstruction of its spiral records is in the right panel. Edge enhancement is comparable with results of the digital spiral phase modulation. The anisotropic edge enhancement of a pinhole is shown in Fig. 4. The results were obtained by a sine-modulated
Fig. 3. (Color online) Demonstration of the standard and spiral imaging in the FINCH configuration. Images labeled DR and SM were obtained by the direct reconstruction and the digital spiral phase modulation, respectively.
July 15, 2012 / Vol. 37, No. 14 / OPTICS LETTERS
Fig. 4. (Color online) Demonstration of isotropic and anisotropic edge contrast enhancement: (a) standard FINCH reconstruction, (b) isotropic spiral FINCH, (c)–(e) anisotropic spiral FINCH with preferred directions.
Fig. 5. (Color online) Needle placed some distance in front of a pinhole: (a) optical imaging, (b) spiral reconstruction with the needle in focus, and (c) spiral reconstruction numerically refocused on the pinhole. Images of a flea: (d) optical imaging, (e) standard FINCH, and (f) isotropic spiral reconstruction.
spiral modulation [3] during reconstruction of the standard FINCH records. In Fig. 5, the edge enhancement in 3D spiral imaging is demonstrated. As an object, eye of a needle placed in front of a pinhole was used. Though the needle and the pinhole are slightly longitudinally shifted, the sharp edges can be successively reconstructed from the same recordings provided that the reconstruction distances are appropriately chosen. In the top row, the optical image (a) is compared with the spiral reconstruction, where the needle (b) and the pinhole (c) are in focus. In the bottom row, three different images of a flea are shown. The optical imaging (d), the standard FINCH imaging (e), and the spiral reconstruction (f) are demonstrated there. In conclusion, we proposed and experimentally verified a vortex image reconstruction in FINCH based on a spiral modulation of light. The spiral imaging carried
2951
out optically or digitally, either in the space or frequency domain, was demonstrated. The main advantage of the method is the edge contrast enhancement of the 3D objects that can be achieved even when incoherent light is used. In experiments, both the isotropic and anisotropic edge enhancement were demonstrated. The proposed spiral modification of FINCH extends the variability and application potential of the method. The digital spiral modulation seems to be especially advantageous. It works with standard correlation FINCH recordings so that imaging conditions can be changed even during reconstruction. Though FINCH is a holographic method, the initial phase related to the refractive index of the object cannot be reconstructed. The reason is that the correlation recordings are made in a one-way interferometer so that a constant reference phase is not available. There are two ways to reconstruct the phase objects: to do a phase conjugation of the reference wave or to operate with a partial spatial correlation of light during the object reconstruction. These ideas are a challenge for the future and are subject to further research. This work was supported by the Czech Ministry of Education, project MSM6198959213, the Technology Agency of the Czech Republic, project TE01020229, IGA project of the Palacký University PrF 2012-05, and the project Central European Institute of Technology (CEITEC) CZ.1.05/1.1.00/02.0068 from European Regional Development Fund. Adrian Bradu from University of Kent is acknowledged for valuable comments on the manuscript. References 1. J. A. Davis, D. E. McNamara, D. M. Cottrell, and J. Campos, Opt. Lett. 25, 99 (2000). 2. A. Jesacher, S. Furhapter, S. Bernet, and M. Ritsch-Marte, Phys. Rev. Lett. 94, 233902 (2005). 3. M. K. Sharma, J. Joseph, and P. Senthilkumaran, Appl. Opt. 50, 5279 (2011). 4. S. Bernet, A. Jesacher, S. Furhapter, Ch. Maurer, and M. Ritsch-Marte, Opt. Express 14, 3792 (2006). 5. C. Maurer, A. Jesacher, S. Bernet, and M. Ritsch-Marte, Laser Photon. Rev. 5, 81 (2011). 6. J. Rosen and G. Brooker, Opt. Lett. 32, 912 (2007). 7. P. Bouchal, J. Kapitán, R. Chmelík, and Z. Bouchal, Opt. Express 19, 15603 (2011). 8. B. Katz, J. Rosen, R. Kelner, and G. Brooker, Opt. Express 20, 9109 (2012). 9. X. Lai, Y. Zhao, X. Lv, Z. Zhou, and S. Zeng, Opt. Lett. 37, 2445 (2012).
Wide-field common-path incoherent correlation microscopy with perfect overlapping of interfering beams ∗
Petr Bouchal1 and Zdenˇ ek Bouchal2 1
Central European Institute of Technology, Brno University of Technology, Technick´a 10, 616 00 Brno, Czech Republic
2
Department of Optics, Palack´y University, 17. listopadu 1192/12, 771 46 Olomouc, Czech Republic ∗
Corresponding author:
[email protected]
Keywords: spatial light modulator, digital holography, optical microscopy Incoherent correlation microscopy is recently discovered technique for digital imaging of three-dimensional objects in a quasi-monochromatic spatially incoherent light. Its operation is based on wavefront division carried out by a spatial light modulator and capturing correlation recordings of the observed scene. To achieve image reconstruction, at least a partial overlapping of the signal and reference waves created by the spatial light modulator is necessary. In the known experimental configurations, the overlapping of interfering beams is strongly reduced in off-axis areas of the object and the image can be reconstructed only in a very small portion of the field of view provided by the used microscope objective lens. Here we propose and successfully demonstrate modified experimental system working with two-component relay optics inserted between the microscope objective and the spatial light modulator and providing full overlapping of correlated beams in all areas of the field of view of the objective lens. The benefits and applicability of the proposed system design are clearly demonstrated on the imaging of the USAF resolution targets.
1
1
Introduction
Digital holographic microscopy is a powerful imaging technique suitable for both metrology and bio-photonic applications including surface analysis or marker-free dynamic live cell imaging [1, 2]. It is based on the principles of optical holography, which are advantageously combined with the recording of the holograms by a digital image sensor. The subsequent reconstruction of the holograms is performed numerically with a computer, and enables three-dimensional imaging without scanning. The digital holographic reconstruction was also used in the coherence-controlled microscope, where a quantitative phase contrast imaging and a coherence gating optical sectioning were demonstrated [3]. In recent years, the development of microscopy was favorably influenced by modern technologies enabling light shaping by a spatial light modulator (SLM). The SLM can be used in both illuminating and imaging paths of the optical microscope, where it ensures a structured specimen illumination, or amplitude and phase modulation of the spatial spectrum, respectively [4]. Using these phase modulation techniques, the spatial light interference microscopy (SLIM) [5, 6] and the spiral phase contrast imaging [7] were presented as powerful techniques capable of measuring nanoscale structures and dynamics in live cells or enhancing standard phase contrast methods. A variability of operations provided by the SLM was also used to design the universal microscope, that operatively combines the standard techniques of optical microscopy [8,9]. Light shaping by the SLM is also useful for digital microscopy. In the common-path phase-shifting lensless holographic microscopy, the SLM was used for a wave multiplexing ensuring a holographic recording and digital reconstruction of the specimen [10]. In its basic configuration, the digital holographic microscopy is limited to applications operating with coherent light needed to create holograms. Such a requirement is not necessary in the recently proposed Fresnel incoherent correlation holography that utilizes a SLM for holographic recording of observed objects illuminated by a quasi-monochromatic spatially incoherent light [11]. This technique removes many barriers for practical development of holography using incoherent light and is especially attractive for fluorescence microscopy. Recently, new modifications of the original system improving signal to noise 2
ratio and allowing the use of sources with a broader spectrum have emerged [12, 13]. The potential of the incoherent correlation microscopy has been further demonstrated by the imaging beyond the Rayleigh diffraction limit and by the spiral recording and reconstruction of holograms resulting in selective edge contrast enhancement of three-dimensional objects [14]. The spiral edge contrast enhancement was successfully verified due to a hybrid coherence regime of the method leading to a fully coherent vortex reconstruction of the correlation records even though they were created in spatially incoherent light [15]. Although the incoherent correlation microscopy was presented in several experiments as a promising method with the wide application potential, the available field of view (FOV) of the method has not yet been investigated in any approach. In this paper, the FOV is studied in detail both theoretically and experimentally. In the investigated common-path incoherent correlation microscopy, the FOV is not directly determined by the microscope objective lens, but some restrictions due to the correlation overlapping of interfering beams must be taken into account. Here we show that a reduction of the FOV caused by the insufficient correlation overlapping becomes particularly critical when using the microscope objective with a high magnification. The overlapping coefficient was defined by ray optics calculations and used to quantify the FOV in known experimental configurations. We also showed that a significant extension of the FOV is possible in the modified system using a two-component relay optics to achieve a perfect overlapping of the correlated beams. In the improved configuration, the common-path incoherent correlation microscopy allows image reconstruction in the full FOV of the used microscope objective. Theoretical predictions were successfully verified by the experiments demonstrating image reconstruction of the USAF resolution targets illuminated by a light-emitting diode.
2
FOV in basic configurations of the common-path incoherent correlation microscopy
In the correlation microscopy, the FOV is not uniquely determined by geometric conditions for the passage of light as in the direct imaging, but a correlation overlapping of the
3
interfering beams associated with the basic principle of the method must also be taken into consideration. A simplified scheme of the method is in Fig. 1. To explain its operation, it is reasonable to assume that the observed object is composed of an infinite number of point sources that emit mutually uncorrelated light. Light waves originating
Figure 1: Demonstration of the image reconstruction in the common-path incoherent correlation microscopy. from separate object points are collimated by a microscope objective (MO) and directed towards the SLM. Each wave incident on the SLM is divided into two waves, called the signal and reference wave. These waves are spatially correlated because originate from the same object point. If their optical path difference does not exceed the coherence length of the used source, they can interfere. The interference pattern has a shape of the Fresnel zone plate and carries information about the amplitude and the three-dimensional position of the relevant object point. A final record of the observed object is created by the addition of intensities of individual interference patterns because different points of the object are mutually uncorrelated. Information about the object is extracted by the processing and reconstruction of three object recordings acquired with different phase shifts of the signal wave. Experimental setup shown in Fig. 1 allows both direct and correlation imaging. In the direct imaging, the SLM produces a quadratic phase modulation and operates as the lens with a focal length fd . The image on the CCD is then created by a two-lens system consisting of the MO and the SLM lens with the focal lengths f0 and fd , respectively.
4
The FOV is determined by a ray tracing shown in Fig. 2a.
Figure 2: Illustration of ray trajectories in (a) the direct imaging and the common-path incoherent correlation microscopy with (b) standard and (c) dual lens configurations.
In the correlation imaging, each point of the object must be recorded as the Fresnel interference pattern. This is achieved in a common-path interferometer based on the wave splitting implemented by the SLM. Using the control software, the SLM transmission function tj = a exp(iθr ) + b exp(iθs + iϑj ) is set, where a and b are coefficients providing desired power distribution between the reference and signal waves, ϑj , j = 1, 2, 3, are constant phase shifts imposed on the signal wave, and θr and θs are phase functions for a wavefront transformation of the signal and reference wave. Three object recordings implemented with different phase shifts ϑj allow to eliminate the holographic twin image [16]. The phase functions θr and θs enable two different modes of imaging, here called the standard and dual lens imaging. In the standard common-path correlation imaging, 5
θr corresponds to a constant phase shift. For object points located near the focal plane of the MO, the reference wave corresponds to a collimated beam. The signal wave is generated by the quadratic phase function θs that represents a lens with the focal length fd . In the dual lens imaging, both θr and θs are quadratic phase functions representing lenses with the focal lengths fd 1 and fd 2 , respectively [12,13]. In this case, the correlation record of the object point is produced by interference of two spherical waves. In the case of the correlation imaging, the FOV must be determined with respect to the desired overlapping of the signal and reference waves. The situation is illustrated in Fig. 2b for the standard correlation imaging working with the plane reference wave and the spherical signal wave. Capturing the signal and reference waves on the CCD is not sufficient for imaging of the examined off-axis point. It can be successfully reconstructed only when the signal and reference waves are at least partially overlapped on the CCD. In the known configurations of the correlation imaging this condition can hardly be satisfied, especially if the best resolution is required. This is due to significant differences in the direction of propagation of the signal and reference waves. In the correlation imaging, the FOV is reduced in comparison with the direct imaging. This effect is remarkable when the MO with a high magnification is used. Reduction of the FOV caused by the lack of correlation overlapping is estimated for both the standard and dual lens configurations using simple ray optics calculations. Standard configuration In the standard configuration, the SLM acts as a beam splitter, which transforms the signal wave as a lens with the focal length fd , while the reference wave transmits unaffected. To estimate the degree of overlapping of interfering beams, the chief rays of the signal and reference waves must be traced and their positions on the CCD determined. The transverse coordinates of the intersections xs and xr are calculated by geometry shown in Fig. 2b and can be written as x0 ∆1 ∆1 + , xs = ∆2 1 − f0 fd ∆2
x0 ∆1 xr = ∆2 1 + , f0 ∆2
(1)
where f0 is the focal length of the MO, ∆1 is the separation distance between the MO 6
and the SLM, ∆2 is a position of the CCD with respect to the SLM and 2x0 is the FOV of the used MO. The FOV of the MO is given by the field number F and the magnification m0 , 2x0 =
F . m0
(2)
A separation of the signal and reference waves on the CCD can be conveniently defined by a distance of the spot centers and can be written as ∆x = |xs − xr | = x0
∆1 ∆2 . f0 fd
(3)
The correlation overlapping also depends on the spot size of the detected signal and reference beams Ds and Dr given as Ds =
|∆2 − fd | D0 , fd
Dr = D0 ,
(4)
where D0 is the diameter of the exit pupil of the MO. It can be expressed by its numerical aperture NA as D0 = 2NAf0 . If we distinguish the beam spots according to their size as DM = max{Ds , Dr } and Dm = min{Ds , Dr }, a measure of the area overlapping of the interfering beams can be simply quantified by a coefficient P defined as 1, for ∆x ≤ D− , P = ∆S/Sm , for D− < ∆x < D+ , 0, for ∆x > D+ , where ∆S =
X
∆Sj ,
Sm =
j=m,M
2 πDm , 4
q Dj2 2hj Dj ∆Sj = arccos 1 − − − hj hj (Dj − hj ), 4 Dj 2
hm =
(D+ − ∆x)(∆x + D− ) , 2∆x D+ =
hM =
DM + Dm , 2
(D+ − ∆x)(∆x − D− ) , 2∆x
D− = 7
j = m, M,
DM − Dm . 2
(5)
A partial overlapping of beams is determined by 0 < P < 1, whereas the limit value P = 1 stands for a full overlapping of beams and P = 0 for fully separated beams. Dual lens configuration In the dual lens configuration, the SLM splits an input wave into the signal and reference waves and transforms them as a dual lens with two different focal lengths fd 1 and fd 2 , respectively. In this case, the signal and reference waves are spherical waves and the positions of their chief rays on the CCD are determined by ∆1 ∆1 x0 + , xs = ∆2 1 − f0 fd 1 ∆2
x0 ∆1 ∆1 xr = ∆2 1 − + . f0 fd 2 ∆2
(6)
The geometrical separation of beam spots ∆x is obvious from Fig. 2c and can be expressed as ∆x = x0
∆1 ∆2 ∆f , f0 fd 1 fd 2
(7)
where ∆f = |fd 1 − fd 2 |. The spot size of the signal and reference beams is given as Ds =
|∆2 − fd 1 | D0 , fd 1
Dr =
|∆2 − fd 2 | D0 . fd 2
(8)
The overlapping coefficient P can again be determined by (5) as a ratio of the overlapping area of the signal and reference beams ∆S and the beam spot area Sm . For object points close to the optical axis, the signal and reference waves have a full overlapping, P = 1. For off-axis points, the overlapping is reduced and P rapidly decreases with the distance x of the object point from the axis. A smaller beam overlapping causes a quality degradation of the correlation imaging and the image reconstruction is impossible when the signal and reference beams are completely separated, P = 0. The coefficient P can thus be used to define the usable FOV of the correlation imaging. In numerical calculations, the relative FOV x/x0 is used, where 2x denotes the evaluated FOV in correlation microscopy and 2x0 is the maximal FOV provided by the field number F of the MO (in our analysis F = 26.5 mm is used). With both the standard and dual lens configurations, a required beam overlapping strongly limits the FOV and the correlation imaging utilizes only a fraction of the FOV available in a direct imaging provided by the MO. In Fig. 3, the dependence of the coefficient P on ∆2 is illustrated for both the standard and dual lens 8
configurations. The distance ∆2 determines the position of the CCD owing to the SLM and represents an important parameter of the correlation imaging. With the positioning of the CCD, the magnification of the correlation imaging can be changed. If the observed object is placed near the focal plane of the MO with the focal length f0 , the magnification is simply given by m = ∆2 /f0 [15]. The CCD position ∆2 also significantly affects the resolution of the correlation imaging. In the standard configuration, the best resolution is achieved with the condition ∆2 = 2fd , where fd is the focal length of the lens realized by the SLM. In the double lens configuration, the best resolution is achieved in the setting ∆2 = 2fd 1 fd 2 /(fd 1 + fd 2 ), where fd 1 and fd 2 are the focal lengths of the SLM lenses [13]. The correlation overlapping significantly changes with the CCD position ∆2 and reaches its minimum just in the most important positions, where the best resolution is achieved. This is clearly demonstrated for both standard Fig. 3a and double lens configuration Fig. 3b. On the plane of the best resolution, the correlation coefficient P has the same value in both configurations. For the MO with NA = 0.28 and f0 = 20 mm its value is P ≈ 0.6 for the relative FOV x/x0 = 0.05 and P ≈ 0.3 for x/x0 = 0.1. For the MO with higher magnification (NA = 0.55, f0 = 4 mm), the FOV is further reduced. For the relative FOV x/x0 = 0.05, the coefficient P ≈ 0.15 is obtained, while for x/x0 = 0.1 the signal and reference beams are completely separated, P = 0. If we assume with regard to the experimental experience that the overlapping P ≈ 0.3 is sufficient for reconstructing the image with acceptable quality, the FOV for the correlation imaging is approximately 10× smaller than in the direct imaging when the MO with f0 = 20 mm is used. In the case of the MO with f0 = 4 mm, the correlation FOV is more than 20× smaller than in the direct imaging realized by the MO. The size of the correlation FOV can be extended by shortening the distance ∆1 between the MO and the SLM. In Fig. 4, the dependence of P on the relative FOV is demonstrated for two different settings ∆1 = 150 and 250 mm. The situation is identical for both standard and dual lens configurations and corresponds to the CCD positions ∆2 ensuring the best resolution. In terms of theory, ∆1 shortening leads to a steady overlapping improvement of the interfering beams and in the limit ∆1 → 0, the full overlapping is achieved. Unfortunately, the shortening of ∆1 has
9
Figure 3: Dependence of the correlation overlapping of interfering beams on the distance ∆2 for different parameters of the MO (NA = 0.28, f0 = 20 mm and NA = 0.55, f0 = 4 mm) and different parts of the relative FOV (x/x0 = 0.05 and x/x0 = 0.1): (a) standard configuration with ∆1 = 250 mm, fd = 247.5 mm, (b) dual lens configuration with ∆1 = 250 mm, fd 1 = 400 mm and fd 2 = 649 mm. technical limitations. In most cases, a reflective SLM is used and a sufficient distance ∆1 is required for an insertion of the beam splitter and the polarizer or for an implementation of angular separation of incident and reflected beams. The distance ∆1 used in numerical simulation corresponds to real experimental possibilities.
Figure 4: Dependence of the correlation overlapping of interfering beams on the relative FOV for different parameters of the MO (NA = 0.28, f0 = 20 mm and NA = 0.55, f0 = 4 mm) and various settings ∆1 .
10
3
FOV in the common-path incoherent correlation microscopy with relay optics
As was demonstrated, the overlapping of interfering beams is negatively influenced by increasing the distance between the MO and the SLM. As is clear from (3) and (7), an ideal beam overlapping is achieved in both standard and dual lens configurations when the SLM is placed just behind the objective lens, ∆1 = 0. In this case, the chief rays
Figure 5: Demonstration of a perfect correlation overlapping of interfering beams in the setup with two-component relay optics. of the signal and reference waves coincide so that ∆x = 0 for all points of the FOV of the used MO. Unfortunately, this condition cannot be met neither in the standard nor dual lens configurations for technical reasons. Here we present a novel setup modification where effects requiring the setting ∆1 = 0 are effectively achieved using two-component relay optics. An operation of the system is obvious from the ray paths illustrated in Fig. 5. The setup is supplemented by two lens system that is placed between the MO and the SLM and ensures imaging of the exit pupil of the MO on an active area of the SLM. This is achieved when the inserted relay optics is configured as the 4F system operating with the unitary magnification. The exit pupil of the MO is then placed at the front focal plane of the lens L1 and the SLM is positioned at the back focal plane of the lens L2 . Such a configuration is adequate to the technically unattainable setting ∆1 = 0 in the standard and dual lens experiments. The relay optics ensures that the chief rays of the signal and reference waves coincide and a perfect overlapping of interfering beams is achieved in the full FOV of the used MO. This modification of the system is of great practical importance, because the FOV of the correlation imaging is as large as the FOV
11
of the used MO regardless of the experimental parameters and the CCD positioning. The benefits of this method are evident from the experimental results. The common-path correlation microscopy is essentially a digital holography method in which the continuous spatial distribution of optically generated holograms is sampled by the discrete sensitive pixels on a CCD array. In these systems, the space-bandwidth product (SBP) is introduced as a quantity that is directly related to the information capacity of the hologram [17]. To compare the demands imposed on detection devices, the SBP was determined for standard and dual lens configurations, and consequently also for both systems supplemented by the relay optics. In accordance with the traditional definition, the SBP was calculated as SW = Lx Wx , where Lx is the transverse size of the detector needed to capture the hologram and Wx stands for the highest spatial frequency contained in the hologram. In all examined configurations, Lx = max{xs , xr } was used, where xs and xr are the transverse positions of the spot centers of the signal and reference waves on the CCD. The maximal spatial frequency Wx was determined by evaluating the relationship for a local frequency of the hologram. It can be written as Wx = (1/2π)(∂∆Φ/∂x)|x=xm , where ∆Φ is the phase difference of the signal and reference wave at the hologram plane and xm denotes the transverse coordinate where the local spatial frequency reaches its maximal value. In all examined configurations, the SBP was evaluated for the full FOV of the MO and the CCD positions for the best resolution. It was verified that the SBP becomes minimal in the dual lens configuration with the relay optics. In comparison with earlier experiments, the use of the relay system provides not only full correlation overlapping, but it also reduces the SPB at the same object size. In such a manner the relay optics reduces demands on the hologram detection.
4
Experimental results
Reduction of the FOV in standard and dual lens configurations and the proposed modification for the full overlapping of interfering beams were verified experimentally in the setup illustrated in Fig. 6. The collimated LED (Thorlabs, 625nm) with the spectral filter SF (FWHM 10 nm) was used as an incoherent source of light. The FOV was examined 12
Figure 6: Set-up for the common-path incoherent correlation microscopy using the relay optics for a perfect correlation overlapping and an extended FOV: SF - spectral filter, MO - microscope objective, P - polarizer, L1 , L2 - two-component relay optics, BS - beam splitter, SLM - spatial light modulator. using USAF resolution targets placed at the front focal plane of the Melles Griot MO (NA = 0.28, f0 = 20 mm and NA = 0.55, f0 = 4 mm). The signal and reference waves were created using the SLM (Hamamatsu, 800 × 600 pixels) and the correlation records were captured on the CCD (Retiga 4000 R). The polarizer was used to achieve an optimal phase modulation by the SLM. In initial experiments, the setup was used without relay optics to demonstrate a reduction of the FOV of the MO due to the lack of the correlation overlapping of the signal and reference waves. Subsequently, the experimental system was supplemented by the relay optics for a perfect overlapping of interfering beams. It was composed of two identical achromatic doublets with the focal length 150 mm. As is evident from Fig. 7, the correlation recordings made in the standard setup and the modified experiment with relay lenses are fundamentally different. When using the relay optics, the defocused correlated images of the USAF target created by the signal and reference waves are in a perfect overlapping and coincide (Fig. 7a). In the standard configuration, a sufficient overlapping is reached only in the center of the FOV indicated by a dashed line in Fig. 7d. For off-axis parts of the object, the images created by the signal and reference waves are mutually shifted by a large distance ∆x and are almost separated. The correlation recordings can not be successfully reconstructed in this part of the FOV. In the dual lens imaging, the shift of interfering waves can be positively influenced by reducing the 13
distance ∆f , which is the difference of the focal lengths of the SLM lenses. This effect is evident from Figs. 7b and 7c illustrating the correlation recordings taken with ∆f1 = 53 mm and ∆f2 = 249 mm, respectively. Unfortunately, the reduction of ∆f does not lead to an increase of the FOV, because the signal and reference waves reduce not only their lateral separation but also the areas of their spots and the overlapping area remains unchanged. The correlation recordings shown in Fig. 7 were taken by the Melles Griot
Figure 7: Correlation recordings of the USAF resolution targets demonstrating various degrees of overlapping of the signal and reference waves in different experimental configurations: (a) perfect overlapping in the setup with relay optics, (b) dual lens configuration with ∆f1 = 53 mm and (c) ∆f2 = 249 mm, (d) insufficient overlapping in standard configuration. MO with NA = 0.28 and f0 = 20 mm. The separation distance between the MO and the SLM was set to the minimal achievable value ∆1 = 270 mm. The best resolution of the system was ensured by the fixed position of the CCD, ∆2 = 495 mm, which was combined with the focal length of the SLM lens fd = 247.5 mm in the standard configuration and fd1 = 470 mm and fd2 = 523 mm in the dual lens configuration. The final images of the USAF resolution targets created by the processing and reconstruction of the demonstrated correlation recordings are shown in Fig. 8. Advantages of the proposed modification of the setup are more apparent there, because the image is not reconstructed in areas with insufficient overlapping of interfering beams. The images of the groups 6 and 7 of the USAF target obtained by the reconstruction of the correlation recordings acquired in the standard and dual lens configurations are shown in Figs. 8a 14
and 8c, respectively. The FOV specified by the correlation overlapping is approximately 2x ≈ 0.3 mm and remains the same in both the standard and dual lens configurations. This experimental finding is consistent with the theoretical results demonstrated in Fig. 3. Significant improvement of the FOV arises in both configurations when the relay lenses are used. The reconstructed images are shown in Figs. 8b and 8d. As is obvious, the FOV completely fills a detection area of the CCD in this case. Although the benefits of the relay system are indisputably demonstrated, the images 8b and 8d still cannot demonstrate the full potential of the modified setup, because the correlation field used in the image reconstruction is not fully captured by a single CCD frame. In order to demonstrate the full FOV when using the relay system, nine records were carried out at different lateral positions of the CCD while other system settings remained unchanged. The resulting correlation record used in the image reconstruction was then created by a fusion of the partial CCD records. The obtained wide-field image is shown in Fig. 8e. Compared with the image reconstructed from a single CCD frame, the groups 4 and 5 additionally may be seen there. Thus, the correlation FOV obtained in known configurations (Figs. 8a and 8c) is only a fraction of the FOV available in the proposed system with the relay optics (Fig. 8e). To demonstrate a full functionality of the system modification in the conditions of digital microscopy, the experiment was also performed using the Melles Griot MO with higher magnification (NA = 0.55, f0 = 4 mm). The results obtained are presented in Fig. 9. Here, the finest elements of the groups 8 and 9 of the USAF target were reconstructed in the dual lens configuration that was adjusted to achieve the best resolution. Extension of the FOV in the system using the relay optics Fig. 9b is again significant in comparison with usual arrangement Fig. 9a. Moreover, the reconstructed image 9b still does not show all the available FOV, because the correlation field exceeded a detection area of the CCD and it was not fully captured by a single CCD frame.
15
Figure 8: Images of the USAF resolution target reconstructed from the correlation recordings captured in different experimental configurations using the Melles Griot MO with NA=0.28 and f0 = 20 mm: (a) standard configuration (SC), (b) SC with relay optics, (c) dual lens configuration (DLC), (d) DLC with relay optics, (e) DLC with relay optics and image reconstructed from the correlation recordings obtained by a fusion of nine partial CCD frames.
5
Conclusions
In the paper, the basic configurations of incoherent correlation microscopy were examined in a connection with the available FOV. As the main result, the new modification of experiments was proposed that provides a perfect overlapping of interfering beams and allows a significant extension of the FOV. The partial results of the paper may be summarized as follows:
• It was first demonstrated that in the common-path incoherent correlation microscopy the image is reconstructed in the FOV determined by the conditions of 16
Figure 9: Images of the USAF resolution target reconstructed from the correlation recordings captured in the dual lens configuration (DLC) using the Melles Griot MO with a higher magnification (NA=0.55 and f0 = 4 mm): (a) usual DLC and (b) DLC with the relay optics. the correlation overlapping of interfering beams. • Ray optics calculations were performed allowing a simple estimation of the FOV by the conveniently defined correlation coefficient. • It was shown that the correlation FOV depends on the parameters of the experiment and significantly reduces the FOV of the used MO in both the standard and dual lens configurations. We verified that the reduction of the FOV caused by the lack of the correlation overlapping occurs mostly in the settings ensuring the best resolution and when the MO with higher magnification is used. • The use of relay lenses was proposed to ensure a perfect correlation overlapping of interfering beams in all known configurations of the common-path correlation microscopy regardless of used parameters of the experiment.
The common-path incoherent correlation microscopy is a promising imaging technique supported by modern light shaping technologies. It allows numerical reconstruction of three-dimensional objects from the correlation recordings acquired in spatially incoherent quasi-monochromatic light. Recently, the special properties of the method including sub-diffraction resolution, improved signal to noise ratio [12], extension of the permissible spectral bandwidth of the used light sources or spiral edge enhancement [14] were successfully demonstrated and considered for application in fluorescence microscopy. The 17
proposed modification of the setup resulting in a full correlation overlapping and extension of the FOV considerably increases optical parameters and application potential of the method.
Acknowledgment This work was supported by the Czech Ministry of Education, project No. MSM6198959213, the Technology Agency of the Czech Republic, project No. TE01020229, the IGA project of the Palack´ y University PrF 2012-05 and the project CEITEC - ”Central European Institute of Technology” No. CZ.1.05/1.1.00/02.0068 from European Regional Development Fund.
REFERENCES [1] P. Marquet, B. Rappaz, P. J. Magistretti, E. Cuche, Y. Emery, T. Colomb, and Ch. Depeursinge, ”Digital holographic microscopy: a non invasive contrast imaging technique allowing quantitative visualization of living cells with sub wavelength accuracy,” Opt. Lett., 30(5), 468-470 (2005). [2] L. Lovicar, J. Komrska, and R. Chmel´ık, ”Quantitative-phase-contrast imaging of a two-level surface described as a 2D linear filtering process,” Opt. Express 18(20), 20585-20594 (2010) [3] P. Kolman, and R. Chmel´ık, ”Coherence-controlled holographic microscope,” Opt. Express 18(21), 21990-22003 (2010). [4] C. Maurer, A. Jesacher, S. Bernet, and M. Ritsch-Marte, ”What spatial light modulators can do for optical microscopy,” Laser Photonics Reviews 5, 81-101 (2011). [5] Z. Wang, L. Millet, M. Mir, H. Ding, S. Unarunotai, J. Rogers, M. U. Gillette, and G. Popescu, ”Spatial light interference microscopy (SLIM),” Opt. Express 19(2), 1016-1026 (2010).
18
[6] Z. Wang, I.S. Chun, X. Li, Z.Y. Ong, E. Pop, L. Millet, M. Gillette, and G. Popescu, ”Topography and refractometry of nanostructures using spatial light interference microscopy,” Opt. Lett. 35(2), 208-210 (2010). [7] S. Furhapter, A. Jesacher, S. Bernet, M. Ritsch-Marte, ”Spiral phase contrast imaging in microscopy,” Opt. Express 13(3), 689-694 (2005). [8] M.Warber, S. Zwick, T. Haist, and W. Osten, SLM-based phase-contrast filtering for single and multiple image acquisition, Optics and Photonics for Information Processing III, Proceedings of SPIE 7442, 74420E-74420E-12 (2009). [9] M. Hasler, T. Haist, W. Osten, ”SLM-based microscopy,” Optical Micro-and Nanometrology, Proceedings of SPIE 8430 84300V-84300V-8 (2012). [10] V. Mic´o, and J. Garc´ıa, ”Common-path phase-shifting lensless holographic microscopy,” Opt. Lett. 35(23) 3919-3921 (2010). [11] J. Rosen and G. Brooker, ”Fluorescence incoherent color holography,” Opt. Express 15(5), 2244-2250 (2007). [12] X. Lai, Y. Zhao, X. Lv, Z. Zhou, and S. Zeng, ”Fluorescence holography with improved signal-to-noise ratio by near image plane recording,” Opt. Lett. 37(13), 24452447 (2012). [13] B. Katz, J. Rosen, R. Kelner, and G. Brooker, ”Enhanced resolution and throughput of Fresnel incoherent correlation holography (FINCH) using dual diffractive lenses on a spatial light modulator (SLM),” Opt. Express 20(8), 9109-9121 (2012). [14] P. Bouchal, and Z. Bouchal, ”Selective edge enhancement in three-dimensional vortex imaging with incoherent light” Opt. Lett. 37(14), 2949-2951 (2012). [15] P. Bouchal, J. Kapit´an, R. Chmel´ık, and Z. Bouchal, ”Point spread function and twopoint resolution in Fresnel incoherent correlation holography,” Opt. Express 19(16), 15603-15620 (2011).
19
[16] I. Yamaguchi and T. Zhang, ”Phase-shifting digital holography,” Opt. Lett. 22(16), 1268-1270 (1997). [17] L. Xu, X. Peng, Z. Guo, J. Miao, and A. Asundi, ”Imaging analysis of digital holography,” Opt. Express 13(7), 2444-2452 (2005).
20
Coherent Imaging with Incoherent Light in Digital Holographic Microscopy Radim Chmelika,b a
CEITEC – Central European Institute of Technology, Brno University of Technology, Technicka 10, Brno, 616 00, Czech Republic; b Institute of Physical Engineering, Faculty of Mechanical Engineering, Brno University of Technology, Technicka 2, Brno, 616 00, Czech Republic ABSTRACT Digital holographic microscope (DHM) allows for imaging with a quantitative phase contrast. In this way it becomes an important instrument, a completely non-invasive tool for a contrast intravital observation of living cells and a cell drymass density distribution measurement. A serious drawback of current DHMs is highly coherent illumination which makes the lateral resolution worse and impairs the image quality by a coherence noise and a parasitic interference. An uncompromising solution to this problem can be found in the Leith concept of incoherent holography. An off-axis hologram can be formed with arbitrary degree of light coherence in systems equipped with an achromatic interferometer and thus the resolution and the image quality typical for an incoherent-light wide-field microscopy can be achieved. In addition, advanced imaging modes based on limited coherence can be utilized. The typical example is a coherence-gating effect which provides a finite axial resolution and makes DHM image similar to that of a confocal microscope. These possibilities were described theoretically using the formalism of three-dimensional coherent transfer functions and proved experimentally by the coherence-controlled holographic microscope which is DHM based on the Leith achromatic interferometer. Quantitative-phase-contrast imaging is demonstrated with incoherent light by the living cancer cells observation and their motility evaluation. The coherence-gating effect was proved by imaging of model samples through a scattering layer and living cells inside an opalescent medium. Keywords: holographic microscopy, quantitative phase contrast, coherence of light, coherence gate, imaging in turbidmedia
1. DIGITAL HOLOGRAPHIC MICROSCOPY The reason of still growing interest in digital holographic microscopes is their quantitative-phase-contrast (QPC) imaging mode1. Unlike standard light microscopy techniques including the Zernike phase contrast or the Nomarski DIC, the QPC image directly represents phase shifts introduced by an object. This allows for applications of a variety of advanced image-processing algorithms such as numerical focusing1, or complex-field deconvolution2. Digital holographic microscopes (DHM) are usually based on the classical off-axis holographic setup1,3 following that proposed in 1966 by Van Lighten and Osterberg4 (cf. Fig. 1). Microscope optics is built into one arm of a conventional (i.e. Mach-Zehnder or Michelson) interferometer. Advantage of this setup in comparison with phase-shifting techniques is a high frame rate especially when it is completed with the Fourier reconstruction algorithms5. This enables a stable record even of very fast processes to carry out. DHM is applied frequently as a living-cells-observation tool providing a strong imaging contrast by a completely noninvasive intravital method3,6-11. In addition, QPC images are interpreted as the signal proportional to the density distribution of a cell dry-mass11,12. Living cells’ motility and growth can be optically measured11 by processing of QPC signal, as well as their reactions to external stimuli10, which makes DHM an excellent tool for cytopatogenicity and cytotoxicity tests. Digital image focusing can be accomplished using a single hologram record and cells can be thus traced in 3D by processing of holographic time-lapse series13. Reflected-light DHMs are typically applied for surface topography measurements1 including measurements of dynamical systems (MEMS, MOEMS)14. Subnanometer resolution can be achieved in z-axis8,15.
At present, DHM is often combined with another imaging modalities or manipulation techniques: epifluorescence microscopy16,17, optical tweezers18, and second-harmonic generation19. However, the basis of the holographic optical system itself has remained in principle unchanged since 1966. M
D BS O Sp C
S
BS
M
Figure 1. Typical set-up of a contemporary digital holographic microscope: S…source (laser diode), BS…beam splitters, M…mirrors, C…condenser lens, Sp…specimen, O…objective lens, D…detector (CCD camera).
This classical off-axis holographic system works properly with a coherent illumination, which brings some substantial disadvantages about: images are impaired with a coherence noise (speckles) and unintended interference patterns. Moreover, the lateral resolution for a coherent light is twice the value for an incoherent illumination (cf. Section 3 below). For this reason, partially coherent light is a preferable option for DHM imaging20–23. It is known that the reduction of spatial coherence attenuates the region of numerical refocusing20, but, on the other hand, it suppresses the influence of scattering media surrounding an observed object, whilst simultaneous reduction of temporal coherence makes this effect stronger21,23. For these reasons, to have an off-axis holographic system working perfectly with completely incoherent illumination is strongly desirable.
2. COHERENCE-CONTROLLED HOLOGRAPHIC MICROSCOPY The incoherent off-axis holography concept has been proposed by Leith and Upatnieks24 in 1967. A conventional interferometer is replaced by the so-called achromatic interferometer24,25, which exhibits also the feature of spatial invariance26. As interference fringes are also the image of a diffraction grating, the fringe pattern is independent of inputbeam direction and wavelength. This means that incoherent off-axis holography is feasible with arbitrarily broad and broadband light sources27. Use of this concept in microscopy promises the image quality and the resolving power typical for a wide-field microscopy with incoherent illumination. Moreover, a strong reduction of light coherence is expected to result in the coherence-gating effect. Light scattered outside the object plane is suppressed in the output image, which makes the incoherent-holography imaging process similar to that of a confocal microscope28,29. The first off-axis DHM with the achromatic Leith interferometer was built and experimentally verified in 1999 by Chmelik and Harna for reflected light30–32. Optical sectioning with a broad source was demonstrated30 becoming stronger with a broad and broadband source31. DHM based on the Leith interferometer (at present called “coherence-controlled holographic microscope” – CCHM) has been then designed and completed for transmitted-light33. A new generation of CCHM34 designed for the attachment of classic condenser lenses, infinity-corrected objective lenses and with multimodal imaging capability is presently developed.
Figure 2. Optical setup of the transmitted-light coherence-controlled holographic microscope: S...light source, L...relay lens, M...mirrors, G...diffraction grating, C...objective lenses used as condenser ones, R...reference plane, Sp...specimen, O...objective lenses, OP...output plane, OL...output lens, D...detector (CCD camera).
The optical setup of the transmitted-light CCHM is explained in Fig. 2. Light beam emitted by the source S (typically a halogen lamp, with an interference filter or a stop possibly attached to) is split by the diffraction grating G to the interferometer arms. The specimen Sp and the reference object R are imaged to the output plane OP, where a highcontrast image-plane hologram is formed for both coherent and incoherent illumination. The interference pattern is recorded by a camera D and numerically processed by an attached PC. Image processing is based on the method of carrier removal in the Fourier plane5. Image intensity and quantitative phase are on-line computed with the rate of 12 fps. The capability of a high-quality QPC imaging in CCHM has been verified on living cancer cells10. A time-lapse study accomplished by CCHM has shown differences in dry mass dynamics between cells of diverse malignancy stressed by nutritional and energy deprivation10. The coherence-gating effect was proved experimentally by applying a diffuser over a specimen and illumination with a broad source. Fig. 3a shows that a conventional bright-field image of a model amplitude specimen is destroyed by scattering of light within the diffuser, while CCHM intensity still clearly reveals its features33. The coherence gating effect exhibited by CCHM allowed for QPC imaging of living cells in a medium containing active phospholipids (Fig. 3b) which caused strong scattering of light. It was experimentally proved that in the presence of this turbid medium the classic Zernike phase contrast was not applicable.
Figure 3. a) Images of a Cu foil with rectangular openings covered by a diffuser demonstrate coherence-gating by CCHM: bright field (BF) image is destroyed by scattering of light within the diffuser, while CCHM intensity signal still clearly reveals the object features. Halogen-lamp illumination with a narrow-band filter at 650 nm (FWHM 10 nm), and objective lenses 10x/NA = 0.25 were used. b) Quantitative phase contrast CCHM images of living cells of human breast carcinoma, cell line G3S2 in vitro, in two moments of a time-lapse observation (the times are indicated). Halogen-lamp illumination with a narrow-band filter at 650 nm (FWHM 10 nm), and objective lenses 20x/NA = 0.40 were used.
The images in Fig. 3 were formed by ballistic light separated from diffuse one by the effect of coherence gating. The diffuse light is usually assumed to be only ballast light decreasing the image contrast (cf. e.g. Ref. 35). However, CCHM allows obtaining images also by diffuse light. This light hits the image plane out of the relevant Gaussian image points
being deflected by a scattering medium. All the diffuse light which is laterally shifted by a certain distance in the image plane can be collected and separated from the remaining part of diffuse and ballistic light by introduction of the same lateral shift to the reference wave36.
3. THEORY OF IMAGING BY CCHM 3.1 Fundamentals of 3D imaging theory, the influence of coherence on imaging The numerically reconstructed complex image signal of CCHM is described (with the help of the linear-systems theory and in the 1st Born approximation of the scattering theory) by the inverse Fourier transform29
u i ( x i , y i , z i ) T (m, n, s)c(m, n, s) exp[ 2 i(mxi ny i sz i )] dmdnds .
(1)
The transverse position of an image point is described by the Cartesian coordinates xi, yi of the conjugated point in the object plane, zi is the defocus of an object measured positively towards an objective lens, and m, n, s are spatial frequencies in the directions of Cartesian coordinate axes. The object is described by the Fourier transform T(m,n,s) of its three-dimensional (3D) scattering potential, c(m,n,s) is a 3D coherent transfer function (CTF), which depends29 on the numerical apertures of objective and condenser lenses, and on the coherence properties of a source. Integrations in (1) are carried out over the interval (-∞, ∞). It is obvious from the form of (1) that imaging by CCHM is coherent for any degree of coherence of illumination. However, the range of object spatial frequencies transferred by CCHM strongly depends on the coherence of light. This dependence is demonstrated with the help of CTF supports (spatial-frequency passbands) calculated according (1) and depicted in Fig. 4. Objective and condenser lenses are assumed to be aplanatic with the same numerical aperture NA.
Figure 4. Cross-sections of CCHM passbands (i.e. support of c(m,n,s), in grey), for a reflected-light set-up (a-c) and for a transmitted-light set-up (d, e), for a point monochromatic source (a, d), for a broad monochromatic source (b, e), and for a broad broadband source (c). 3D CTFs have cylindrical symmetry about the s axis; s, m are axial and transverse spatial frequencies, respectively, NA is the numerical aperture both of condenser and objective lenses, and λv is a wavelength in vacuum.
For a point monochromatic (i.e. coherent) source (Fig. 4a, d), the transverse cut-off frequency of CCHM equals to NA/λv, where λv is a wavelength in vacuum. As the 3D point spread function (PSF) of CCHM is the 3D Fourier transform of its
3D CTF and the CTF support has a zero width in the axial direction for a coherent source (see Fig. 4a, d), the axial resolution approaches infinity in this case. This means CCHM (or any other DHM) has no capability to resolve in axial direction with a coherent illumination despite of the possibility to numerically refocus. This is why coherent-light DHM imaging completed with numerical refocusing is sometimes classified not as 3D, but as 2½D imaging37. The use of a broad monochromatic source filling the aperture of condenser lenses increases the transverse cut-off frequency to 2NA/λv, which is twice the value for a coherent illumination (Fig. 4b, e). Moreover, the passband for a reflected-light set-up (Fig. 4b) has a non-zero width in the axial direction, which means that the axial resolution has now a finite value (the microscope is capable of optical sectioning), which can be further decreased by broadening of the source spectrum (Fig. 4c). 3.2 Fundamentals of 2D imaging theory, point spread function and two-point resolution A two-dimensional (2D) object is characterized by the function T2D(m,n), which is the 2D Fourier transform of the object transmission function t2D(x,y). It follows from (1) that the complex signal of CCHM for an in-focus object is then expressed by the 2D inverse Fourier transform
u i ( x i , y i ,0) T2D (m, n)c2D (m, n) exp[ 2 i(mxi ny i )] dmdn ,
(2)
where 2D CTF c2D(m,n) is the projection of 3D CTF c(m,n,s) along the s axis
c2D (m, n) c(m,n,s) ds .
(3)
According to the convolution theorem, the signal (2) can be expressed also by the convolution
u i ( x i , y i ,0) t 2D ( x i , y i ) h2D ( x i , y i ) ,
(4)
where h2D(xi,yi) denotes 2D PSF of CCHM, which is the 2D Fourier transform of 2D CTF c2D(m,n). 2D PSF can be derived analytically in the paraxial approximation from 3D CTF29. For a point monochromatic source
h2 D ( x i , y i )
2J1 (v) NA , where v 2 ( xi )2 ( yi )2 , v v
(5)
where NA is the numerical aperture of both condenser and objective lenses, λv is a wavelength in vacuum, and J1 is the Bessel function of the first kind and of the first order. For a broad monochromatic source, 2D PSF of CCHM is identical with that for incoherent (bright-field) imaging 2
NA 2 J (v ) h2 D ( x , y ) 1 , where v 2 (xi )2 ( yi )2 . v v i
i
(6)
The substantial difference follows from the fact that imaging in CCHM is coherent, described by Eq. (4). This is why we have to consider possible phase shifts introduced by an object. For example, a two-point object is described by the transmission function
t 2D ( x i , y i ) ( x i ) ( y i ) exp(i ) ( x i x i ) ( y i ) ,
(7)
where δ denotes the Dirac delta function, φ is the phase shift introduced by one of the point objects, and Δxi is its transverse shift. Then, according to (4),
u i ( x i , y i ,0) h2D ( x i , y i ) exp(i )h2D ( x i x i , y i ).
(8)
For a broad monochromatic source and in the paraxial approximation, 2D PSF is expressed by Eq. (6). Then, it is evident from (8) that the Rayleigh criterion is appropriate for two-point resolution assessment in the case of a zero phase shift φ. Otherwise, the resolution is better than indicated by the Rayleigh criterion. The extreme case corresponds to φ = π, when two principal maxima of |ui| are separated by a line of its zero value for any Δxi.
4. CONCLUSIONS A great potential of a digital holographic microscopy consists in the fact that imaging parameters depend considerably on the coherence of illumination. One extreme corresponds to classic coherent-illumination off-axis holography including full possibility of numerical focusing and the other to confocal-microscopy-like imaging without coherence noise and artifacts and with the quality and resolution comparable with a wide-field microscopy. The coherence can be made a free parameter controlling the nature of imaging by means of a specific DHM design based on the Leith achromatic and spatially invariant interferometer. This possibility was proved experimentally by the coherence-controlled holographic microscope (CCHM), which is DHM based on the Leith achromatic interferometer. Quantitative phase contrast provided by CCHM is a promising instrument of future evaluation of living cancer cells behavior, particularly, from the point of view of intracellular motility. Coherence gating was demonstrated by CCHM imaging of a model sample through a scattering obstacle as well as of living cells in a turbid medium. It has been proved theoretically that the overall imaging process of CCHM is coherent for any degree of coherence of illumination. 3D spatial-frequency passbands of CCHM were studied theoretically in dependence on coherence properties of a source. It is evident that lower coherence of illumination corresponds to better transverse and axial resolution of CCHM. Point spread functions (PSF) for 2D objects were derived in the paraxial approximation. For a broad monochromatic source 2D PSF of CCHM is identical with that for classic incoherent imaging. This is why the two-point resolution limit of CCHM is given by the Rayleigh criterion assuming that two point objects introduce the same phase shift.
ACKNOWLEDGEMENT This work is supported by the project “CEITEC – Central European Institute of Technology” (CZ.1.05/1.1.00/02.0068) from European Regional Development Fund, by MIT CR (project FR-TI4/660), and by TA CR (project TE01020229).
REFERENCES [1] Cuche, E., Bevilacqua, F., and Depeursinge, C., “Digital holography for quantitative phase-contrast imaging,” Opt. Lett. 24, 291-293 (1999). [2] Cotte, Y., Toy, M. F., Pavillon, N., and Depeursinge, C., “Microscopy image resolution improvement by deconvolution of complex fields,” Optics Express 18, 19462 (2010). [3] Cuche, E., Marquet, P., and Depeursinge, C., “Simultaneous amplitude-contrast and quantitative phase-contrast microscopy by numerical reconstruction of Fresnel off-axis holograms,” Appl. Opt. 38, 6994-7001 (1999). [4] Van Lighten, R. F., Osterberg, H., “Holographic Microscopy,” Nature 211, 282 (1966). [5] Kreis, T., “Digital holographic interference-phase measurement using the Fourier-transform method,” JOSA A 3, 847-855 (1986). [6] Carl, D., Kemper, B., Wernicke, G., and von Bally, G., “Parameter-optimized digital holographic microscope for high-resolution living-cell analysis,” Appl. Opt. 43, 6536 -6544 (2004). [7] Ikeda, T., Popescu, G., Dasari, R .R., and Feld, M. S., “Hilbert phase microscopy for investigating fast dynamics in transparent systems,” Opt. Lett. 30, 1165-1167 (2005). [8] Marquet, P., Rappaz, B., Magistretti, P. J., Cuche, E., Emery, Y., Colomb, T., and Depeursinge, C., “Digital holographic microscopy: a noninvasive contrast imaging technique allowing quantitative visualization of living cells with subwavelength axial accuracy,” Opt. Lett. 30, 468-470 (2005). [9] Kemper, B., Carl, D., Schnekenburger, J., Bredebusch, I., Schäfer, M., Domschke, W., and von Bally, G., “Investigation of living pancreas tumor cells by digital holographic microscopy,” J. Biomed. Opt. 11, 034005 (2006). [10] Janeckova, H., Vesely, P., and Chmelik, R., “Proving Tumour Cells by Acute Nutritional/Energy Deprivation as a Survival Threat: A Task for Microscopy,“ Anticancer Research 29, 2339-2346 (2009). [11] Sridharan, S., Mir, M., and Popescu, G., “Simultaneous optical measurements of cell motility and growth,” Biomed. Opt. Expr. 2, 2815-2820 (2011).
[12] Barer, R., “Interference microscopy and mass determination,” Nature 169(4296), 366-367 (1952). [13] Langehanenberg, P., Ivanova, L., Bernhardt, I., Ketelhut, S., Vollmer, A., Dirksen, D., Georgiev, G., von Bally, G., and Kemper, B., “Automated three-dimensional tracking of living cells by digital holographic microscopy,” J. Biomed. Opt. 14, 014018 (2009). [14] Emery, Y., Cuche, E., Marquet, F., Aspert, N., Marquet, P., Kühn, J., Botkine, M., Colomb, T., Montfort, F., Charrière, F., Depeursinge, C., Debergh, P., and Conde, R., “Digital Holographic Microscopy (DHM) for metrology and dynamic characterization of MEMS and MOEMS,” Proc. SPIE 6186, 61860N (2006). [15] Kühn, J., Charrière, F., Colomb, T., Cuche, E., Montfort, F., Emery, Y., Marquet, P., and Depeursinge, C., “Axial sub-nanometer accuracy in digital holographic microscopy,” Meas. Sci. Technol. 19, 074007 (2008). [16] Pavillon, N., Benke, A., Boss, D., Moratal, C., Kühn, J., Jourdain, P., Depeursinge, C., Magistretti, P. J., and Marquet, P., “Cell morphology and intracellular ionic homeostasis explored with a multimodal approach combining epifluorescence and digital holographic microscopy,” J. Biophoton. 3, 432–436 (2010). [17] Makhlouf,H., Perronet,K., Dupuis,G., Lévêque-Fort, S., and Dubois, A., “Simultaneous optically sectioned fluorescence and optical coherence microscopy with full-field illumination,” Opt. Lett. 37, 1613-1615 (2012). [18] DaneshPanah, M., Zwick, S., Schaal, F., Warber, M., Javidi, B., and Osten, W., “3D Holographic Imaging and Trapping for Non-Invasive Cell Identification and Tracking,“ J. Display Technol. 6, 490-499 (2010). [19] Shaffer, E., Moratal, C., Magistretti, P., Marquet, P., and Depeursinge C., “Label-free second-harmonic phase imaging of biological specimen by digital holographic microscopy,” Opt. Lett. 35, 4102-4104 (2010). [20] F. Dubois, L. Joannes, and J.-C. Legros, “Improved three-dimensional imaging with a digital holography microscope with a source of partial spatial coherence,” Appl. Opt. 38, 7085-7094 (1999). [21] Dubois, F., Yourassowsky, C., Monnom, O., Legros, J.-C., Debeir, O., Ham, P. V., Kiss, R., and Decaestecker, C., “Digital holographic microscopy for the three-dimensional dynamic analysis of in vitro cancer cell migration,” J. Biomed. Opt. 11, 054032-054037 (2006). [22] Dubois, F., Callens, N., Yourassowsky, C., Hoyos, M., Kurowski, P., and Monnom, O., “Digital holographic microscopy with reduced spatial coherence for three-dimensional particle flow analysis,” Appl. Opt. 45, 864871 (2006). [23] Dubois, F., Yourassowsky, C., Callens, N., Minetti, C., and Queeckers, P., “Applications of digital holographic microscopes with partially spatial coherence sources,” Journal of Physics: Conference Series 139, 012027 (2008). [24] Leith, E. N., and Upatnieks, J., “Holography with Achromatic-Fringe Systems,” JOSA 57, 975-980 (1967). [25] Leith, E. N., and Swanson, G. J., “Achromatic interferometers for white light optical processing and holography,” Appl. Opt. 19, 638-644 (1980). [26] Leith, E. N., and Chang, B. J., “Space-Invariant Holography with Quasi-Coherent Light,” Appl. Opt. 12, 19571963 (1973). [27] Leith, E. N., Chien, W.-C., Mills, K. D., Athey, B. D., and Dilworth, D. S., “Optical sectioning by holographic coherence imaging: a generalized analysis,” JOSA A 20, 380–387 (2003). [28] Sun, P.-C., and Leith, E. N., “Broad-source image plane holography as a confocal imaging process,” Appl. Opt. 33, 597-602 (1994). [29] Chmelík, R., “Three-dimensional scalar imaging in high-aperture low-coherence interference and holographic microscopes,” J. Mod. Opt. 53, 2673-2689 (2006). [30] Chmelík, R., and Harna, Z., “Parallel–mode confocal microscope,” Opt. Eng. 38, 1635-1639 (1999). [31] Chmelík, R., “Holographic confocal microscopy,” Proc SPIE 4356, 118-123 (2000). [32] Chmelík, R., and Harna, Z., ”Surface profilometry by a parallel-mode confocal microscope,” Opt. Eng. 41, 744745 (2002). [33] Kolman, P., and Chmelík, R., “Coherence-controlled holographic microscope,” Opt. Expr. 18, 21990 (2010). [34] Slabý, T., Antoš, M., Dostál, Z., and Chmelík, R., “Coherence-controlled holographic microscope,” Proc. SPIE 7746, 77461R-1-77461R-8 (2010). [35] Kempe, M., Genack, A. Z., Rudolph, W., and Dorn, P., “Ballistic and diffuse light detection in confocal and heterodyne imaging systems,” JOSA A 14, 216-223 (1997). [36] Lošťák, M., Kolman, P., Dostál, Z., Chmelík, R., “Diffuse light imaging with a coherence controlled holographic microscope,” Proc. SPIE 7746, 77461N-1-77461N-9 (2011). [37] Kou, S. S., and Sheppard, C. J. R., “Imaging in digital holographic microscopy,” Opt. Expr. 15 13641-13648 (2007).
Theoretical study of coherence-controlled holographic microscopy in the presence of scattering media Michala Henzlov´a∗a,b , Martin Loˇst’´aka,b and Radim Chmel´ıka,b a CEITEC-Central
European Institute of Technology, Brno University of Technology, Technick´a 10, Brno, 616 00, Czech Republic; b Institute of Physical Engineering, Faculty of Mechanical Engineering, Brno University of Technology, Technick´a 2, Brno, 616 00, Czech Republic ABSTRACT In this paper the theoretical description of the imaging process of a coherence-controlled holographic microscope (CCHM) is carried out for the case when the object beam is influenced by a scattering medium (a diffuser) present between an observed object and an objective lens of the microscope. The calculation is based on the decomposition of the diffuser transmission function into its frequency components. The complete holographic image is then computed as the superposition of holographic images for individual frequency components. The dependence of fundamental imaging characteristics on the coherence state of an illumination is demonstrated. Keywords: holographic microscopy, coherence gate, turbid-media imaging
1. INTRODUCTION The Coherence-Controlled Holographic Microscopy (CCHM)1 is a novel holographic-microscopy technique for a quantitative-phase-contrast observation of living cells with the illumination of arbitrarily low coherence. In conventional digital holographic microscopes with a coherent illumination (e.g. laser-diode one), a speckle field is usually generated by the presence of any obstacle (dust particles, scratches etc.) in the optical system. In the CCHM, the generation of the coherent noise is prevented by a low-coherence illumination. In addition, a coherence gate separates a ballistic light from a diffuse one, allowing to reveal structures hidden behind a diffusive medium. A coherent transfer function (CTF), which is the function describing the transfer of spatial frequencies of an object by an optical system, has already been derived for CCHM.2 In this paper, a similar approach is used for the calculation of CTF for CCHM with a diffuser placed in the object space. An observed object, a reference object and the diffuser are assumed to be two-dimensional planar objects. Thus, the geometric factor2 (necessary for the calculation) C = 1 for each of these objects.
2. COHERENCE-CONTROLLED HOLOGRAPHIC MICROSCOPE The coherence-controlled holographic microscope3 (see Fig.1) is a two beam interferometer completed with an imaging optics. It consists of two optically equivalent arms – an object arm and a reference arm. The light from a source is split by a beamsplitter (BS) into these two arms. The source is imaged to the front focal planes of condenser lenses thus forming the K¨ohler illumination. In the object arm the light passes through a specimen (Sp) while in the reference arm it passes through a reference object (R). Both the specimen and the reference object are imaged into the output plane. The essential component of CCHM is a diffraction grating, which is placed in the reference arm and imaged also into the output plane. In this way, a contrast off-axis image-plane hologram is generated with an illumination of arbitrarily low coherence. The interference pattern of the hologram is recorded in the output plane by a CCD camera. The image intensity and phase are then obtained from the recorded image by numerical processing.3 The object planes, the image planes and the output plane are optically conjugated planes in the both of the arms. Then, we can express the image amplitude in the output plane by the help of the object-space coordinates. Let o (r t , κ) be a complex amplitude of the object wave and r (r t , κ) a complex amplitude of the reference wave ∗
[email protected];
phone +420 541 142 833
C
R
O
TL
BS
a
Diffraction grating
M Reference beam Output lens
Light source BS
b
M M
Output plane
M
Lens
Output lens Object beam M
M Sp D O
C
TL
BS
Figure 1. Scheme of the transmitted-light coherence-controlled holographic microscope3 with diffuser in the object space: (BS) beamsplitters, (M) mirrors, (C) condenser lenses, (Sp) specimen, (R) reference object, (D) diffuser or diffraction grating in the object space, (O) infinity-corrected objective lenses, (TL) tube lenses, (α, β) angles of diffraction and interference.
in the output plane, where κ = (κx , κy , κz ) is a reduced wavevector (|κ| = 1/λ, λ is a wavelength) corresponding to a plane wave in the object space, and r = (r t , z) = (x, y, z) is a position vector in the Cartesian coordinate system in the object space with the origin at the intersection of the optical axis and the object plane. The signal resulting from the numerical reconstruction of the recorded hologram can be described by the expression2 ∫ ∫∞∫ u (r) =
o (r, κ) r∗ (r, κ) κz κ−3 d3 κ ,
(1)
−∞
where an asterisk marks a complex conjugate function in the whole text.
2.1 Imaging characteristics of CCHM In the 1st Born approximation of a scattering theory, the numerically reconstructed signal is given by the inverse Fourier transform2 ∫ ∫∞∫ u (r) = T (µ) c (µ) exp (2πiµ · r) d3 µ , (2) −∞
where µ = (µx , µy , µz ) is a vector of spatial frequencies – a scattering vector, T (µ) is the Fourier transform of a scattering potential t (r) of an object and c (µ) is a 3D coherent transfer function (CTF) given by the expression2 ∫ ∫∞∫
{ [ ]1/2 } κ z 3 2 2 2 d κ , (3) i (κ) |Pc (κ)| P (κ) P (κ + µ) δ (κz + µz ) − κ − (κx + µx ) − (κy + µy ) κ3 2
c (µ) = −∞
∗
where P (κ) and Pc (κ) are 3D pupil functions2 of the objective and the condenser lenses in the κ-space, i (κ) is the spectral intensity of a source in the κ-space (κ is the reduced wavevector of a plane wave in the object space corresponding to one point and one wavelength of the source) and δ (κz ) denotes the Dirac delta function. For a monochromatic light with a wavelenght λ0 , the projections of the supports of the 3D pupil functions P (κ), Pc (κ) to the µx -µy plane are circles of radii NAo /λ0 , NAc /λ0 , where NAo and NAc are numerical apertures
of the objective and the condenser lenses,2 respectively. As the relation (3) has the form of 3D pupil functions correlation, the projection of the support of 3D CTF to the same plane µx -µy (the transverse passband of CCHM, i.e. the area of transferred transverse spatial frequencies) is a circle with the radius µt,max = (NAc + NAo ) /λ0 . See Fig. 4a for illustration.
3. THE EFFECT OF A DIFFRACTION GRATING In this section, we suppose that a diffraction grating with a single spatial frequency g = (gx , gy , 0) in its spectrum is placed between the observed object and the objective lens of the microscope, and describe its influence on the imaging process. Results are then used in the Section 4 for the calculation of CTF with the presence of a diffuser in the object space. The calculation is based on the decomposition of the diffuser transmission function into its frequency components. Also the possibility of a mutual shift of beams in the object and the reference arm is taken into account.
3.1 Scattering potential of a diffraction grating The diffraction grating located in a plane z = zg (see Fig. 2) can be described2, 4 by the scattering potential tg (x, y, z) = exp [2πi (gx x + gy y)] δ (z − zg ) ,
(4)
where gx , gy are spatial frequencies of the diffraction grating. For the following calculation it is useful to derive ( ) the Fourier transform Tg µg of the function tg (r) ( ) Tg µ g =
∫ ∫∞∫
( ) tg (r) exp −2πiµg · r d3 r = δ (µg,x − gx ) δ (µg,y − gy ) exp (−2πiµg,z zg ) ,
(5)
−∞
where µg = (µg,x , µg,y , µg,z ) is a scattering vector corresponding to the diffraction grating. An angular spectrum U3 (κ3,t ) of a scattered wave can then be expressed2 by the relation U3 (κ3,t ) = U2 (κ3,t − g) exp [−2πi (κ3,z − κ2,z ) zg ] , where U2 (κ2,t ) is the angular spectrum of a primary wave, and √ 2 2κ3,t · g t − |g t | . κ3,z − κ2,z = κ3,z − κ3,z 1 + κ23,z Object
(6)
(7)
Objective lens
Diffraction grating
Condenser lens
Figure 2. Configuration of elements in the object space.
3.2 Approximation In the following text we will suppose |g| ≪ κ3,z ,
|κ3,t | ≪ κ3,z .
(8)
Then we can approximate the expression (7) as follows 2
κ3,t · g t |g | − t , κ 2κ and in this way modify the argument in the exponential function in Eq. (6). κ3,z − κ2,z ≈
(9)
3.3 Shift of the reference beam The diffraction grating in the object space causes that the rays coming from the sample are focused into different points of the output plane than undeviated rays. This suggests an assumption that a convenient transverse displacement of the reference beam in the output plane will allow interference of the reference beam with equally deviated rays of the object beam. See Fig. 3 for illustration. b)
a) Image plane
Object beam
Image plane
Ao
Ao
Object Diffuser Condenser lens
Object Diffuser Condenser lens
Objective lens
Objective lens
Image plane
Reference beam
Image plane
Ar Ar
Ar
Reference object
Reference object
Figure 3. Effect of the reference beam shift in the output (image) plane. For the sake of simplicity, the arms are depicted separately. a) If no shift of the reference beam is introduced, rays of the reference beam coincide with the rays of the object beam, which are undeviated by the diffraction grating (diffuser). b) If a shift ∆r t of the reference beam (in the image plane) is introduced, rays of the reference beam coincide with the rays of the object beam, which are deviated by the diffraction grating by the same ∆r t .
Suppose the shift ∆r t of the reference beam with respect to the object beam in the output plane. The shift is expressed in the object-space coordinate system. Now, we have to modify Eq. (1) by the substitution of the vector r t in the argument of the reference-wave complex amplitude for the vector r t − ∆r t . Then the resulting signal is expressed by the relation ∫ ∫∞∫ u (r) =
o (r t , κ) r∗ (r t − ∆r t , κ) κz κ−3 d3 κ .
(10)
−∞
3.4 Coherent transfer function The CTF is calculated by an approach similar to that used previously for the description of CCHM imaging without a diffraction grating in the object space.2 Scattering by the diffraction grating is described by Eq. (5) and the approximation (9) is applied. The resulting CTF is then described by the relation ∫ ∫∞∫
)] [ ( z g 2 i (κ) |Pc (κ)| P ∗ (κ) P (κ + µ + g) exp 2πiκ · g − ∆r t × κ −∞ { ) [ ]1/2 } κ ( zg z 3 2 2 2 d κ ; (11) × exp 2πi µ · g δ (κz − µz ) − κ − (κx + µx + gx ) − (κy + µy + gy ) κ κ3
cg (µ, g) = exp (2πig · r t )
the resulting signal is given by Eq. (2) with cg (µ, g) inserted instead of c (µ).
4. THE EFFECT OF A DIFFUSER 4.1 Diffuser as a superposition of diffraction gratings Consider a diffuser to be a random medium described by a complex transmission function a (r t ). This function is zero outside a finite diffracting aperture A and the probability density of its phase is uniform in the interval (−π, π⟩.5 The scattering potential of the diffuser placed in the plane z = zg is then2 td (r) = a (r t ) δ(z − zg ), and its Fourier transform Td can be written as ∞ ∫∫
Td (µd ) = exp (−2πiµd,z zg )
( ) ( ) a (r t ) exp −2πiµd,t · r t d2 r t = exp (−2πiµd,z zg ) A µd,t ,
(12)
−∞
which, according to Eq. (5), we can write as the superposition of diffraction gratings with spatial frequencies g ∞ ∫∫
(
∞ ∫∫
)
A (g) δ µd,t − g exp (−2πiµd,z zg ) d g =
Td (µd ) =
2
−∞
A (g) Tg (µd ) d2 g .
(13)
−∞
4.2 Coherent transfer function With respect to Eq. (13), the relation for CTF of CCHM with a defocused diffuser can be derived as ∞ ∫∫
A (g) cg (µ, g) d2 g .
cd (µ) =
(14)
−∞
After the substitution of the formula (11) for cg (µ, g) to (14) we obtain ∞ ∫∫
cd (µ) =
∫ ∫∞∫
[ ( z )] g 2 i (κ) |Pc (κ)| P ∗ (κ) P (κ + µ + g) exp 2πiκ · g − ∆r t × κ −∞ −∞ ( ) { [ ]1/2 } κ zg z 3 2 2 × exp 2πi µ · g δ (κz − µz ) − κ2 − (κx + µx + gx ) − (κy + µy + gy ) d κ d2 g . (15) κ κ3 A (g) exp (2πig · r t )
The following calculations are made for a monochromatic source with a wavelength λ0 . We express its spectral intensity by the relation i (κ) ∝ i2 (κt ) δ (κ − κ0 ) , (16) where κ0 = 1/λ0 and i2 (κt ) describes the spatial distribution of the intensity. The function i2 (κt ) will be specified later. Then, CTF for a monochromatic source is described by the expression )] [ ( zg 2 − ∆r t × i2 (κt ) |Pc (κ)| P ∗ (κ) P (κ + µ + g) exp 2πiκ · g κ0 −∞ −∞ ) { } ( [ ]1/2 zg 2 2 d2 κt d2 g , (17) × exp 2πi µ · g δ (κz − µz ) − κ20 − (κx + µx + gx ) − (κy + µy + gy ) κ0 √ 2 where κz = κ20 − |κt | . The resulting signal is again given by Eq. (2). cd (µ) =
κ−2 0
∞ ∫∫
∞ ∫∫
A (g) exp (2πig · r t )
4.3 A point monochromatic source A point source is described by the function i2 (κt ) = δ (κx /κ) δ (κy /κ) = κ2 δ (κx ) δ (κy ) .
(18)
After the substitution of (18) for i2 (κt ) in the expression (17) we can integrate over the variables κx and κy . In this way we obtain 2
∗
∞ ∫∫
cd (µ) = |Pc (κ0 )| P (κ0 ) −∞
) zg P (κ0 + µ + g) A (g) exp (2πig · r t ) exp 2πi µ · g × κ0 { [ ]1/2 } 2 2 2 × δ (κ0 + µz ) − κ0 − (µx + gx ) − (µy + gy ) d2 g , (19) (
where κ0 = (0, 0, κ0 ). We can modify the Dirac delta function as follows { [ ]1/2 } 2 2 δ (κ0 + µz ) − κ20 − (µx + gx ) − (µy + gy ) = [ ( )] √ κ0 + µz =√ δ gy − −µy + −2 (κ0 µz + gx µx ) − (µ2x + µ2z + gx2 ) . (20) −2 (κ0 µz + gx µx ) − (µ2x + µ2z + gx2 ) The integration over the spatial frequency gy then gives the expression ∫∞ −∞
κ0 + µ z × −2 (κ0 µz + gx µx ) − (µ2x + µ2z + gx2 ) ] [ zg × A [f (gx , µ, κ0 )] exp [2πif (gx , µ, κ0 ) · r t ] exp 2πi µ · f (gx , µ, κ0 ) dgx , (21) κ0
|Pc (κ0 )| P ∗ (κ0 ) P [κ0 + µ + f (gx , µ, κ0 )] √ 2
cd (µ) =
where the vector function f (gx , µ, κ0 ) is defined as follows ) ( √ f (gx , µ, κ0 ) = gx , −µy + −2 (κ0 µz + gx µx ) − (µ2x + µ2z + gx2 ) .
(22)
In Eq. (21) we shall notice the function A [f (gx , µ, κ0 )] integrated over gx . This function is random being the Fourier transform of another random function (see Eq. (12)) and also it is a function of spatial frequencies µ. This is why the result of the integration, CTF for coherent light source, must be another complex random function. Finally, a point spread function is then given by the inverse Fourier transform of a random function – so it is a random function, too. This result corresponds to the formation of a coherent noise (speckles) when a coherent light source is used.
4.4 A broad monochromatic source Start again with Eq. (17), while assuming now that the source image fills the aperture of condenser lenses with a constant intensity. Then we can set i2 (κt ) = const. > 0, (23) because the illumination-beam aperture is limited by the condenser-lens pupil function Pc (κ) in the integrand in Eq. (17). The integration over κt in this equation can be written as ∞ ∫∫
−∞
)] [ ( zg − ∆r t d2 κt , ξ (κt ) exp 2πiκ · g κ0
(24)
where ξ (κt ) is a slowly varying function within the supports of the 3D pupil functions. This is why we suppose that this expression differs significantly from zero only for zg g ≈ ∆r t . (25) κ0 Then, the expression (17) can be roughly approximated by the following formula cd (µ) ≈
κ−2 0
∞ ∫∫
∞ ∫∫
A (g) exp (2πig · r t ) −∞
−∞
( ) zg 2 − ∆r t × |Pc (κ)| P ∗ (κ) P (κ + µ + g) δ g κ0
( ) { [ ]1/2 } zg 2 2 2 × exp 2πi µ · g δ (κz − µz ) − κ0 − (κx + µx + gx ) − (κy + µy + gy ) d2 κt d2 g , (26) κ0 where a constant factor has been omitted. Finally, after the integration over g we get the formula for CTF ( ) ( ) κ0 κ0 1 exp 2πi ∆r t · r t × cd (µ) ≈ 3 2 exp (2πiµ · ∆r t ) A ∆r t κ0 zg zg zg ∞ ( ) [ ] ∫∫ √ κ0 2 2 × |Pc (κ)| P ∗ (κ) P κ + µ + ∆r t κ3z δ (κz + µz ) − κ20 − |κt + µt + ∆r t κ0 /zg | d2 κt , (27) zg −∞
where κz =
√ κ20 − κ2x − κ2y .
In the expression (27), the random function A (∆r t κ0 /zg ) plays the role of a factor independent of the spatial frequency µ. That means CTF itself is not a random function of µ. Consequently, the object structure is revealed in the CCHM image, which is in agreement with the experimental results.6 The insertion of the relation (27) into the relation (2) for the resulting image signal makes it clear that: • The resulting image is laterally shifted by ∆r t . • The linear phase term 2πir t · ∆r t κ0 /zg is added to the image phase. • The image signal is multiplied by the random factor A (∆r t κ0 /zg ), which is however a constant for a given beam shift ∆r t . • The transverse passband (area of transferred transverse spatial frequencies or the projection of the support of 3D CTF to the plane µx -µy ) of the microscope has the same circular form and radius as for the case without a diffuser, but it is shifted in the κ-space by ∆µt = ∆r t κ0 /zg , which means that higher spatial frequencies are transferred than in the case of the zero shift (ballistic-light imaging). This result is illustrated in Fig. 4.
CONCLUSIONS In this paper we demonstrate theoretically the ability of CCHM to image a specimen through a defocused thin plane diffuser in the object space using a broad (spatially incoherent) monochromatic source. This result is in agreement with the experiment.6 The approximate formula for the related CTF has been derived in the paraxial approximation. The transverse passband of CCHM has unchanged form in this case, but it is possibly shifted by ∆µt = ∆r t κ0 /zg , according to the vector ∆r t of the reference-beam shift in the output plane. The imaging with the shift allows for the transfer of frequencies with the maximum value greater than in the case of imaging with the zero shift (Fig. 4). Nevertheless the possible achievement of superresolution effects by a numerical processing of images with different ∆r t is complicated by the presence of the random factor A (∆r t κ0 /zg ) in (27). Imaging with a coherent illumination (a point monochromatic source) through a diffuser is destroyed by a coherent noise which precludes the observation of a specimen.
a)
b)
Figure 4. The transverse passband of CCHM (the projection of the support of 3D CTF to the plane µx -µy ) for imaging with a broad monochromatic source a) without a diffuser in the object space, b) with the diffuser and the reference beam shifted by ∆r t . The size of the area is limited by the numerical apertures of condenser lenses (NAc ) and objective lenses (NAo ): µt,max = (NAc + NAo ) /λ0 according to the section 2.1. The passband is shifted proportionally to the shift ∆r t .
ACKNOWLEDGMENTS This work is supported by MIT CR (project FR-TI4/660), by TA CR (project TE01020229), by the project ”CEITEC - Central European Institute of Technology” (CZ.1.05/1.1.00/02.0068) from European Regional Development Fund, and by MEYS CR (project CZ.1.07/2.2.00/28.0250).
REFERENCES 1. P. Kolman and R. Chmel´ık, “Coherence-controlled holographic microscope,” Optics Express 18(21), pp. 21990–22003, 2010. 2. R. Chmelik, “Three-dimensional scalar imaging in high-aperture low-coherence interference and holographic microscopes,” Journal of Modern Optics 53(18), pp. 2673–2689, 2006. y, M. Antoˇs, Z. Dost´al, P. Kolman, and R. Chmel´ık, “Coherence-controlled holographic microscope,” 3. T. Slab´ in Proceedings of SPIE, 7746, p. 77461R, 2010. 4. E. Leith and G. Swanson, “Achromatic interferometers for white light optical processing and holography,” Applied Optics 19, pp. 638–644, 1980. 5. J. C. Dainty, “An introduction to ’Gaussian’ speckle,” in Proc. Soc. Photo-Opt. Instrum. Eng, 243, pp. 2–8, 1980. 6. M. Loˇst’´ak, P. Kolman, Z. Dost´al, and R. Chmel´ık, “Diffuse light imaging with a coherence controlled holographic microscope,” in Proceedings of SPIE, 7746, p. 77461N, 2010.
Rotating point spread function in spiral phase contrast imaging with discrete phase modulation M. Baránek and Z. Bouchal* Department of Optics, Palacký University in Olomouc, 17. listopadu 1192/12, 771 46 Olomouc, Czech Republic ABSTRACT Spiral phase contrast imaging is one of the modern methods of optical microscopy applicable to edge contrast enhancement of amplitude and phase samples. The method is based on modulation of the spatial spectrum realized by a spiral phase element at the focal plane of the Fourier lens. In this paper, the results of a paraxial wave model of the spiral imaging are presented which allow to calculate the point spread function for real parameters of the spiral modulation and to analyze defocusing effects. A particular attention is given to the analysis of the spiral imaging implemented by a phase mask with a finite number of discrete phase levels. As the main result, a defocusing-induced rotation of the point spread function is discovered and analyzed in detail. Theoretical predictions are verified in experiments using a spatial light modulator for generation of the discrete spiral phase mask.
Keywords: Rotating point spread function, phase modulation, spatial light modulator, discrete spiral phase mask, spiral phase contrast imaging
1. INTRODUCTION Recently, many different imaging methods and techniques aided by a spatial light modulator (SLM) has emerged in optical microscopy. The SLM technology is used to control and shape the sample illumination, or it can be utilized for Fourier filtering of the spatial spectrum of observed objects in the imaging path of microscope1 . The spiral phase contrast imaging was proposed as one of the promising methods based on a phase modulation of the object spatial spectrum2. By this technique, a strong edge contrast enhancement for both amplitude and phase samples was achieved due to the Fourier plane filtering of the microscopic image with a spiral phase element displayed at a high resolution SLM. The spiral phase contrast method was subsequently improved for quantitative reconstruction of both amplitude and phase of the complex microscopic samples based on processing of a sequence of the CCD records acquired with different rotational orientations of the spiral phase plate3. The spiral phase contrast imaging realized using a commercially available filter was also demonstrated in the upgraded version of a standard optical microscope4. Recently, new methods of optical imaging allowing depth estimation from diffracted rotation were discovered5. It was shown that depth estimation can be improved relative to the classical methods by exploiting three-dimensional diffraction effects. In optical imaging, the required effects are achieved by a spatially rotating point spread function (PSF) which shows increased sensitivity to defocusing. Usability of the rotating PSF was subsequently demonstrated both theoretically and experimentally. The PSF rotation was also used for 3D super-localization of single molecules6 and 3D tracking of fluorescent microparticles7. In this paper, the rotating PSF in spiral phase contrast imaging is first demonstrated both theoretically and experimentally. It is verified that the defocusing-induced rotation of the PSF occurs naturally when the spiral phase mask with a suitable number of phase levels is used. An exception is also found and explained, in which the PSF remains rotationally invariant under defocusing even if the discrete phase mask is used. This situation is determined by the exact relation between the intrinsic topological charge of the mask and the number of its phase levels. A paraxial wave model of the experiment is proposed in order to describe the rotational effect mathematically and explore it thoroughly. In calculations, the real experimental parameters and a Gaussian aperture of optical components are considered. The proposed mathematical treatment allows analytical calculation of the PSF for both image defocusing and the spiral filtering implemented by a discrete phase structure. Dependence of the PSF rotation on image defocusing is studied in *
email:
[email protected]
detail for various parameters of the experiment. Theoretical predictions are then verified in the set-up that uses the SLM to realize the spiral phase modulation of the spatial spectrum.
2. IMAGE FORMATION IN SPIRAL PHASE CONTRAST MICROSCOPY 2.1 Calculation model of the spiral phase contrast imaging with defocusing In spiral phase contrast microscopy, the spatial spectrum of an observed sample is modulated in the 4F optical system using the spiral phase mask. Here, we propose a paraxial computational model which operates with real parameters of the experimental set-up and allows determination of the PSF taking into account both aperture bounding of light waves in optical system and defocusing effects. The PSF is initially determined for a general phase modulation and then the calculation model is modified to be valid for a realizable mask consisting of a finite number of discrete phase levels. The calculation is based on the scheme shown in Fig. 1.
Figure 1. Spiral phase contrast imaging implemented by a phase modulation in the 4F optical system.
Observed 2D sample with a transmittance t is located at the distance z = f1 − ∆z from the lens L1 with the focal length
f1 . To take into account lateral bounding of light waves, a Gaussian aperture of the lens L1 is considered. If the object is illuminated by a monochromatic plane wave with unitary amplitude and the wavelength λ , L1 performs the Fourier transformation. If the half width of the Gaussian aperture w0 is much larger than λ , the spatial spectrum at the focal plane of the lens (xF , yF ) can be written as
[
]
where G j = exp a j (xF2 + yF2 ) ,
x y x y U F F , F = GPH (xF , yF ) G A (xF , y F ) T F , F , λf1 λf1 λf1 λf1 j = PH , A ,
(1)
t denotes the Fourier a PH = iπ∆z λf12 , a A = − z 2 w02 f12 , and T = FT {}
transform of the object transmittance t . In the focal plane of the lens L1 , the object spatial spectrum U F is modulated
by the spiral mask given by a general function S (xF , yF ) which will be specified later. The modulated light propagates towards the lens L2 and the complex amplitude U L , just before it, can be written as a convolution U L = (U F S ) ⊗ h f 2 ,
where h f 2 denotes the impulse response function for light propagation through the distance f 2 . The lens L2 affects the
[ (
) ]
incident light by a quadratic phase, PL = exp − iπ xL2 + yL2 / λf 2 . The complex amplitude U´ at the distance z´= f 2 + ∆z´ behind the lens L2 is then given as a convolution of the light field transformed by the lens and the impulse response
function for a free propagation of light to the distance z´, U´= (PLU L ) ⊗ hz´. Performing the Fourier transformation of a Gaussian function and taking into account the Fresnel approximation of the impulse response function, we can write
U ´(x´, y´, ∆z´) =
(
π ∆z ∆z´ x y T F , F S ( xF , y F )G A ( xF , y F )exp i 2 − 2 xF2 + y F2 − ∞ λf1 λf1 f 2 λ f1
∫∫
∞
)
(2) x´ y´ dxF dyF . × exp − i 2π xF + yF λf 2 λf 2 Eq. (2) describes imaging of a general 2D object implemented by the spiral phase modulation S in the 4F optical system. The calculation considers a Gaussian lens aperture resulting in a bounding of the spatial spectrum G A and is valid for an arbitrary longitudinal position of the object and detector. The image is in focus when the quadratic phase in the integral
is eliminated. This is achieved if the condition ∆z´= ( f 2 f1 )2 ∆z is fulfilled. In this paper, Eq. (2) is used to discuss the PSF rotation that occurs as a result of defocusing when a discrete spiral phase modulation is used. 2.2 PSF for the spiral imaging with a continuous phase mask
To determine the PSF, we consider imaging of a point object that is placed on the optical axis to simplify notation. In this case, t is expressed by the Dirac delta function as t = δ (x, y ) . The Fourier transformation T = FT {t} then can be simply calculated and substituted into (2). Using the cylindrical coordinates in both the Fourier plane (rF , ϕ F ) and the
image plane (r´,ϕ´) , the transparency of the continuous spiral phase mask can be written as S = exp(imϕ F ) , where m = 1,2K , represents the topological charge of the mask. After integration, the complex amplitude of the point image can be written using the modified Bessel functions as
U ´(r´,ϕ´, ∆z´) = A´i m exp(imϕ )
2 R´
)[
(
( )
( )]
exp − R´2 I (m −1) 2 R´2 − I (m +1) 2 R´2 ,
πγ where A´ denotes an unimportant amplitude and R´ and γ are given by
m > −2,
(3)
2
π ∆z ∆z´ 1 ∆z 1 − − i − . 2 f1 λ f12 f 22 w0 The PSF determines the spatial distribution of the normalized intensity obtained for a point object. It is defined as the ratio I N' = | U ´ |2 | U 0´ |2 , where |U 0´ |2 is the maximal intensity at the center of the image spot. The PSF calculated by (3) includes image scaling given by geometrical parameters of the 4F system and diffraction effects associated with the Gaussian bounding of light and enables analysis of the image degradation caused by defocusing. The PSF is independent of ϕ´ and the image spot expands while keeping its rotational symmetry under defocusing. This property is exactly valid only for the continuous spiral modulation. In the case of a discrete spiral phase modulation, the PSF becomes rotationally unsymmetrical, and in some cases it rotates due to defocusing. R´=
πr´ , 2γ λf 2
γ =
2.3 Defocusing-induced PSF rotation in the spiral imaging with a discrete phase mask In the previous section, a spiral modulation of the Fourier spectrum realized by the continuous phase mask S = exp(imϕ F ) was considered. In experiments, the mask is generated by the SLM, or can be prepared using photolithography techniques. In both cases, a mask with a finite number of discrete phase levels is created. If we consider l -th segment of a mask defined by the interval of angles ϕ F ∈ 2π (l − 1) L, 2πl L , its transparency is given as
Sl = exp[im2π (l − 1) L ] , where m is the intrinsic topological charge of the mask, L is the total number of phase levels and l = 1,2,K L, denotes the sequence number of the phase segments. Because the mask is periodic in the angle ϕ F , it can be written using the Fourier series, S (ϕ F ) =
∞
∑c
n
exp (inϕ F ).
n = −∞
If the transparency of the mask is known, the Fourier coefficients can be obtained by
(4)
1 cn = 2π When the mask S =
∑S l
l
2π
∫ S (ϕ
F
)exp (− inϕ F )dϕ F .
(5)
0
composed of L segments is inserted into (5), its Fourier coefficients can be calculated and
8
arranged to the form
cn = exp(i nπ L )sin c(n L ), n = m − sL, s = 0,±1,±2,K, 0, others.
(6)
To facilitate calculations, it is appropriate to adjust (4) so that only positive indices are included. If the Fourier series of a discrete phase mask is inserted into (3) and then integration is performed, we get
U ´(r´,ϕ´, ∆z´) = A´i m exp(imϕ ) ×
∞
∑ i [c n
n =1
−n
2 R´
πγ
(
exp − R´2
)
[
( )
( )]
(7)
exp(− inϕ´) + c− n exp(− inϕ´)] I (m −1) 2 R´ − I (m +1) 2 R´ , 2
2
where c− n and cn denote the Fourier coefficients of the discrete phase mask given by (5). Normalized intensity calculated by the complex amplitude (7) represents the PSF for spiral imaging implemented by a discrete phase mask. Unlike the case with a continuous mask, the PSF does not have rotational symmetry and the intensity profile depends on the azimuthal angle ϕ´. The argument of the Bessel function R´ depends on the parameter γ , which becomes complex in the case of defocusing with ∆z´≠ ( f 2 f1 )2 ∆z. In this case, the Bessel functions are also complex and their phase leads to a change in the azimuthal profile of the PSF under defocusing. This effect was first studied using approximate analytical calculations and subsequently simulated numerically. The calculation of the PSF can be simplified by the fact that the discrete spiral mask may be represented in a good approximation by only two dominant members of the Fourier series. It can be shown that the spiral phase mask with the intrinsic topological charge m and the number of phase levels L is represented with a sufficient accuracy by the terms cm and cm − L . The normalized intensity that determines the PSF can then be written in the form π 2ℜ{γ }r ´2 [P + Q cos(Lϕ´+ ∆ϕ´+π )] , I ´N ≈ r ´2 exp − (8) λ2 f 2 γ 2 2 where P and Q are the functions depending on both the radial coordinate and the defocusing shift. The image intensity (8) is determined by a product of the radial coordinate r´ , the rotationally symmetric Gaussian function whose width varies with defocusing, and the rotationally unsymmetrical expression, whose form resembles the interference law. The rotation angle ∆ϕ´ is given by amplitudes and phases of the modified Bessel functions and depends on the defocusing. Due to this dependence, the PSF exhibits azimuthal changes that can be interpreted as the defocusing-induced rotation of the PSF. To study this effect in more detail, P , Q and ∆ϕ´ were examined as complicated functions of the intrinsic topological charge of the used discrete spiral phase mask, m , and the number of phase levels, L . Analysis of the discrete spiral modulation showed that the PSF remains invariant under defocusing only when the number of phase levels is twice the intrinsic topological charge, L = 2m . In this case, the PSF expands but does not rotate under defocusing. In all other numbers of phase levels of the spiral mask, the PSF rotates and becomes a sensitive indicator of the defocusing. Numerical analysis of (7) shows that the angle of rotation of the PSF increases linearly with defocusing, if small shifts are used. Positive and negative defocusing causes inverse PSF rotation of the same size. At larger shifts, the rotation slows down, and when exceeding a certain critical value of the shift, the PSF does not rotate with increasing defocusing. This means that for each experimental configuration, there is a maximal rotation of the PSF, which can be achieved through defocusing. These theoretically predicted effects are in good agreement with experimental results.
3. EXPERIMENTAL DEMONSTRATION OF THE PSF ROTATION Experimental verification of the rotational effects appearing in the spiral imaging with a discrete phase modulation was performed in the set-up shown in Fig. 2. The beam of He-Ne laser coupled into a single-mode fiber FC was used as a point source. The Fourier transform of an input optical signal was created by the microscope objective MO and subsequently transferred on an active display of the SLM using relay optics composed of the lenses L1 and L2. The spatial spectrum was modulated by a discrete spiral phase mask displayed on the SLM. Only the first diffraction order reflected by the SLM was used in the imaging experiment. The inverse Fourier transform was implemented by the lens L3 and the examined PSF was detected on the CCD.
Figure 2. Set-up for experimental verification of the PSF rotation in the spiral imaging with a discrete phase modulation: FC - optical fiber NA=0.1 (He-Ne laser, 20 mW, 632.8 nm), MO - microscope objective (Melles Griot NA=0.55, 50x), SLM - spatial light modulator (Hamamatsu X 10468, 800x600), BS - beam splitter, M - mirror, L1, L2, L3 - lenses (f1=f2=200 mm, f3=400 mm), CCD - Olympus, F-View II.
Comparison of theoretical and experimental results is shown in Fig. 3 and 4. The defocusing-induced rotation of the PSF is demonstrated for the discrete spiral mask with the intrinsic topological charge m = 1 and the number of phase levels L = 3 and L = 4 , respectively. Theoretical results (top row) were obtained by numerical simulations using Eq. (7), experimental verification (bottom row) was carried out in the set-up shown in Fig. 2. The object-side numerical aperture of the microscope objective MO ( 50×, NA = 0.55 ) was limited by the output numerical aperture of the used optical fiber ( NA = 0.1 ). Defocusing was performed in the object space by a longitudinal shift of the fiber ( ∆z = ±40µm ), the CCD was located at the paraxial focal plane of the lens L3 ( ∆z´= 0 ). As is obvious, the number of phase levels of the mask L determines the number of side lobes of the PSF. The PSF expands and rotates in a direction dependent on the orientation of the defocusing shift in a very good agreement with the numerical simulation.
Figure 3. Numerical simulations (top row) and experimental verification (bottom row) of a defocusing- induced rotation of the PSF in the spiral imaging with the discrete phase mask (object-side numerical aperture NA=0.1, intrinsic topological charge m=1, number of phase levels L=3, defocusing shift ∆z=40 µm, ∆z´=0).
Figure 4. The same as in Fig. 3, but for the topological charge m=1 and the number of phase levels L=4.
In Fig. 5, a validity of the theoretically determined condition for a rotational invariance of the PSF is verified both numerically and experimentally. In the case demonstrated, the discrete mask with the intrinsic topological charge m = 2 and the number of phase levels L = 4 is used. The PSF has four lobes again but under defocusing it expands and remains without any rotation because the condition L = 2m is fulfilled. Dependence of the PSF rotation on defocusing ∆z is demonstrated in Fig. 6. In some range of distances, the PSF rotation is a linear function of the defocusing. A sensitivity of the defocusing-induced rotation increases with increasing numerical aperture of the microscope objective. For given experimental parameters, there is a rotational saturation meaning that the PSF does not rotate when a certain critical value of the defocusing is exceeded.
Figure 5. Numerical simulations (top row) and experimental verification (bottom row) of a rotation invariant defocusing of the PSF guaranteed by the sampling condition of the discrete phase mask L=2m (object-side numerical aperture NA=0.1, intrinsic topological charge m=2, number of phase levels L=4, defocusing shift ∆z=40 µm, ∆z´=0).
Figure 6. Theoretical and experimental dependence of the PSF rotation on object-side defocusing ∆z for the spiral mask with m=1 and L=3 and different numerical apertures of the microscope objective.
4. CONCLUSIONS The paper presents the main results of a paraxial wave model of the spiral phase contrast imaging, which in good approximation takes into account real experimental conditions. Using the analogy between spatial and spectral bounding of light, the PSF valid for both in focus and out of focus images is obtained analytically. The PSF is expressed by the modified Bessel functions, and allows analysis not possible with previous results based on the use of the Struve functions [9]. The main results obtained by the presented simulation model can be summarized as follows: • The spiral phase contrast imaging realized with the helical mask specified by the intrinsic topological charge, m , and the chosen number of phase levels, L , was analyzed. • The defocusing - induced rotation of the PSF was discovered and analyzed in detail using approximate analytical relations and numerical simulations. • It was shown that the PSF is rotationally invariant under defocusing only if the continuous spiral mask is used or parameters of the discrete mask satisfy condition L = 2m . • Dependence of the PSF rotation was studied numerically for the mask with m = 1 and L = 3 and various input numerical apertures of the microscope objective. The PSF rotation is linear in a well-defined range of defocusing shifts and the rotation sensitivity significantly increases with the input numerical aperture. • Rotation of the PSF has a saturation limit - it does not continue when defocusing exceeds a certain critical value. The discrete spiral phase modulation was verified to be a simple and effective tool to achieve the PSF rotation, which can be used as a sensitive method of three-dimensional localization of micro objects in optical microscopy.
ACKNOWLEDGEMENTS This work was supported by the Technology Agency of the Czech Republic, project No. TE01020229, and IGA project of the Palacký University PrF 2012-05.
REFERENCES [1] Maurer, Ch., Jesacher, A., Bernet, S. and Ritsch-Marte, M., "What spatial light modulators can do for optical microscopy," Laser Photonics Rev. 5, 81-101 (2011). [2] Furhapter, S., Jesacher, A., Bernet, S. and Ritsch-Marte, M., "Spiral phase contrast imaging in microscopy," Opt. Express 13, 689-694 (2005). [3] Jesacher, A., Furhapter, S., Bernet, S. and Ritsch-Marte, M., "Shadow effects in spiral phase contrast microscopy," Phys. Rev. Lett. 94, 233902 (2005).
[4] Maurer, C., Jesacher, A., Furhapter, S., Bernet, S. and Ritsch-Marte, M., "Upgrading a microscope with a spiral phase plate," Journal of Microscopy 230, 134-142 (2007). [5] Greengard, A., Schechner, Y. Y. and Piestun, R., "Depth from diffracted rotation," Opt. Lett. 31, 181-183 (2006). [6] Pavani, S. R. P., DeLuca, J. G. and Piestun, R., "Polarization sensitive, three-dimensional, single molecule imaging of cells with a double-helix system," Opt. Express 17, 19644-19655 (2009). [7] Pavani, S. R. P. and Piestun, R., "Three dimensional tracking of fluorescent microparticles using a photonlimited double-helix response system," Opt. Express 16, 22048-22057 (2008). [8] Guo, Ch.S., Xue, D.M. and Han, Y.J., "Optimal phase steps of multi-level spiral phase plates, " Opt. Commun. 268, 235-239 (2006). [9] Situ, G., Pedrini, G. and Osten, W., ”Spiral phase filtering and orientation-selective edge detection enhancement,” J. Opt. Soc. Am. A 26, 1788–1797 (2009).
PHYSICAL REVIEW A 85, 042317 (2012)
Incomplete quantum state estimation: A comprehensive study ˇ acˇ ek,3 and Zdenˇek Hradil3 Yong Siah Teo,1,2 Bohumil Stoklasa,3 Berthold-Georg Englert,1,4 Jaroslav Reh´ 1
2
Centre for Quantum Technologies, National University of Singapore, Singapore 117543, Singapore Graduate School for Integrative Sciences and Engineering, National University of Singapore, Singapore 117597, Singapore 3 Department of Optics, Palacky University, 17. listopadu 12, 77146 Olomouc, Czech Republic 4 Department of Physics, National University of Singapore, Singapore 117542, Singapore (Received 8 February 2012; published 16 April 2012) We present a detailed account of quantum state estimation by joint maximization of the likelihood and the entropy. After establishing the algorithms for both perfect and imperfect measurements, we apply the procedure to data from simulated and actual experiments. We demonstrate that the realistic situation of incomplete data from imperfect measurements can be handled successfully. DOI: 10.1103/PhysRevA.85.042317
PACS number(s): 03.67.−a, 03.65.Ud, 03.65.Wj
I. INTRODUCTION
Quantum state preparation is the first important step for any protocol that makes use of quantum resources. Examples of such protocols are quantum state teleportation and quantum key distribution, which require entangled quantum states. In order to verify the integrity of the quantum state of the source prepared, one carries out quantum state tomography on the source. Measurements are performed on a collection of identically prepared copies of quantum systems (electrons, photons, etc.) that are emitted from the source. Then, the quantum state of the source is inferred from the measurement data obtained from this ensemble. The measurements are generically described by a set of positive operators j that compose a probability operator measurement (POM). The procedure of state inference, which shall be our main focus in this article, is also known as quantum state estimation. If the size of the ensemble is infinite, the estimation procedure will yield the unique true quantum state of the source; this is the frequentist’s definition of the true state, which we accept as the best description of what the source prepares. However, such an ensemble is never achievable in any laboratory setting, as one can only perform measurements on a finite ensemble of quantum systems. As a result, the state estimator obtained will be different from the true state and depends on the details of the estimation procedure. To make statistical predictions, the corresponding operator ρˆ describing this estimator must be a statistical operator, which is positive. This will ensure that the estimated probability pˆ j = tr{ρ ˆ j } for an outcome j of any set of POM is positive. We shall denote all estimated quantities with a hat symbol. There are two popular methods for quantum state estimation: Bayesian and maximum-likelihood (ML). The Bayesian state estimation method [1–3] constructs a state estimator from an integral average over all possible quantum states. The likelihood functional, which yields the likelihood of obtaining a particular sequence of measurement detection with a given quantum state, serves as a weight for the average. This approach includes all the neighboring states near the maximum of the likelihood functional as possible guesses for the unknown ρtrue . These neighboring states are given especially significant weight when N is small, in which case the likelihood functional is only broadly peaked at the maximum. However, the integral average unavoidably depends 1050-2947/2012/85(4)/042317(9)
on how one measures volumes in the state space, and there is no universal and unambiguous method for that. The ML approach [4–7], on the other hand, simply chooses the estimator as the statistical operator that maximizes the likelihood functional. Rather than identifying a unique estimator, as the Bayesian approach always does, the ML method may only yield a convex set of estimators if the estimated probabilities pˆ j are consistent with more than one statistical operator. If the ML estimator is unique and the number of copies is sufficiently large, both approaches give the same estimator since the likelihood functional peaks very strongly at the maximum. When the measurement outcomes form an informationally complete set, the measurement data obtained will contain maximal information about the source. Thus, a unique state estimator can be inferred with ML. Unfortunately, in tomography experiments performed on complex quantum systems with many degrees of freedom, it is not possible to implement such an informationally complete set of measurement outcomes. As a result, some information about the source will be missing and its quantum state cannot be completely characterized. The ML estimator obtained from these informationally incomplete data is no longer unique and there will in general be infinitely many other ML estimators that are consistent with the data. In Ref. [8], we briefly reported an iterative maximum-likelihoodmaximum-entropy algorithm (MLME) to estimate unknown quantum states from incomplete measurement data by maximizing the likelihood and von Neumann entropy functionals. In that Letter, we assumed that the measurement detections are perfect with no detection losses (that is, j j = 1). The application of this algorithm was illustrated with examples of homodyne tomography and we concluded that, together with a more objective Hilbert space truncation, this approach can serve as a reliable and statistically meaningful quantum state estimation with incomplete data. In this article, we will present more details on the recently proposed MLME algorithm and apply it to various other situations. First, we give a brief review of the mathematical formalism for quantum state estimation in Sec. II to set the stage for the subsequent discussions. Next, we derive the numerical MLME algorithms respectively for both perfect and imperfect measurement detections in Sec. III, with the latter being particularly useful for actual experiments. We illustrate applications of the two algorithms with two examples in Sec. IV and conclude in Sec. V.
042317-1
©2012 American Physical Society
YONG SIAH TEO et al.
PHYSICAL REVIEW A 85, 042317 (2012)
II. FORMALISM OF QUANTUM STATE ESTIMATION
In a tomography experiment, an ensemble of N copies of quantum systems, identically prepared, is measured using a POM, which consists of positive measurement outcomes j . For simplicity, we first assume that all measurement detections are perfect and hence j j = 1. The problem of imperfect detections will be dealt with in Sec. III B. For each outcome, its number of occurrences is denoted by nj such that j nj = N . The likelihood functional L({nj }; ρ), for a particular sequence of independent detections, is then nj L({nj }; ρ) = pj . (1) j
As a consequence of perfect measurement detections, j pj = 1. The ML procedure searches for the estimator ρˆML , which maximizes L({nj }; ρ). For a D-dimensional Hilbert space, when a POM comprises D 2 or more measurement outcomes, of which D 2 of them are linearly independent, it is informationally complete. In this case, there exists a unique estimator ρˆML for a given set of measurement data {nj }. One can also define the outcome frequencies fj = nj /N out of these measurement data such that j fj = 1. The corresponding functional L({nj }; ρ) due to this informationally complete POM will peak at the unique global maximum ρˆML over the space of ρ, whereby ρˆML is solely determined by the frequencies fj and does not depend on the total number N of measured copies. The situation is different when the POM is informationally incomplete. In this case, there will be infinitely many ML estimators satisfying a smaller set of linearly independent constraints imposed by the incomplete measurement data. These ML estimators form a convex set of operators that maximize the convex functional L({nj }; ρ). Geometrically, L({nj }; ρ) possesses a convex plateau structure hovering over the space of ρ. The task, now, is to select one of these estimators for future statistical predictions. To do this, we adopt the well-known maximum-entropy (ME) principle advocated by Jaynes [9]. That is, we look for the estimator with the largest von Neumann entropy S(ρ) = −tr{ρ ln ρ}
(2)
among the convex set of ML estimators. This supplementary step introduces a small and smooth convex hill over the plateau structure so that a unique maximum can be obtained. The corresponding MLME estimator ρˆMLME is the least-bias estimator for the given set of incomplete measurement data; it can be regarded as the most conservative guess of the unknown quantum state out of the convex set of ML estimators. At this point, we would like to comment on the distinction between this MLME technique and the conventional ME technique [10,11]. The ME technique takes the outcome frequencies fj as bona fide estimates for the probabilities pj and tries to search for the positive operator
ρˆME =
e tr{e
j
λj j
j
λj j
}
(3)
that maximizes S(ρ), subjected to the probability constraints which are mediated by the Lagrange multipliers λj . The fundamental problem with this scheme is that fj cannot always
be treated as probabilities since there may not be any statistical operator ρ for which fj = tr{ρj }. This is due to the statistical noise that is inherent in the outcome frequencies arising from measuring a finite ensemble of quantum systems. Therefore, in such cases, the ME technique fails as there simply is no positive operator that is consistent with the measurement data to begin with. The MLME algorithm, on the other hand, looks for the unique MLME estimator by confining the search within the plateau region inside the space of statistical operators. Thus, positivity is ensured. In cases where fj are probabilities, both the ME and MLME schemes yield the same estimator by construction since the estimated probabilities pˆ j = fj correspond to a statistical operator. III. NUMERICAL ALGORITHMS A. Perfect measurements
Assuming that the measurement detections are perfect, the likelihood functional L({nj }; ρ) in Eq. (1) gives a complete statistical description of all possible sequences of detections for the N measured copies of quantum systems. Equivalently, one can consider the optimization of the normalized log-likelihood functional ln[L({nj }; ρ)]/N to simplify the subsequent calculations, in view of the monotonic nature of the logarithmic function. The motivation for introducing the normalization will become clear soon. The MLME scheme can then be perceived as a standard constrained optimization problem: maximize ln[L({nj }; ρ)]/N subjected to the constraint that S(ρ) takes the maximal value Smax . This is equivalent to maximizing S(ρ) with the constraint that ln[L({nj }; ρ)]/N is maximal, as discussed above. The Lagrange functional for this optimization problem is defined as 1 ln L({nj }; ρ), (4) N where λ is the Lagrange multiplier corresponding to the constraint for S(ρ). We denote the estimator that maximizes I(λ; ρ) by ρˆI,λ . Incidently, the functional I(λ; ρ) is a sum of two different types of entropy, up to an irrelevant additive constant j fj ln fj : the von Neumann entropy S(ρ) that quantifies the lack of information, and the negative of the relative entropy S({fj }|{pj }) = j fj ln(fj /pj ) that quantifies the gain of information from the measurement data. The scheme can now be interpreted as a simultaneous optimization of two complementary aspects of information, with an appropriately assigned constant relative weight λ. In addition, the normalization of ln L({nj }; ρ) renders the optimal value of λ to be independent of N . When λ = 0, we recover the Lagrange functional for the log-likelihood functional alone. Owing to the informational incompleteness of the measurement data, there exists a convex plateau structure for the log-likelihood functional. As λ → ∞, the von Neumann entropy becomes increasingly more significant and the resulting estimator ρˆI,λ→∞ approaches the maximally-mixed state 1/D. Naturally, when λ takes on a very small positive value, the contribution from λS(ρ) becomes much smaller than ln[L({nj }; ρ)]/N and the variation of the von Neumann entropy functional is only significant over the plateau region in which the likelihood is maximal. Figure 1 illustrates all the aforementioned points. This means that, in
042317-2
I(λ; ρ) = λ[S(ρ) − Smax ] +
INCOMPLETE QUANTUM STATE ESTIMATION: A . . .
PHYSICAL REVIEW A 85, 042317 (2012)
are satisfied. Therefore, to solve these extremal equations numerically, we iterate the equation †
ρk+1 =
†
(Ak + δAk )(Ak + δAk ) †
†
tr{(Ak + δAk )(Ak + δAk )}
(11)
starting from some statistical operator ρ1 , until k = k such that the norm of ρk Rk is less than some prechosen value. We then take ρˆMLME ≡ ρk as the MLME estimator. Maximizing I(λ → 0; ρ) will require δI(λ → 0; ρ) to be positive whenever I(λ → 0; ρ) is less than the maximal value. A straightforward way to enforce positivity is to set †
δAk ≡ (δAk )† ≡ Ak Rk ∝
FIG. 1. (Color online) Schematic diagrams of I(λ,ρ) on the space of statistical operators. The maximally mixed state resides at the center of the square base which represents the Hilbert space. At the extremal points of λ, I(λ = 0; ρ) = ln[L({nj }; ρ)]/N , with a convex plateau at the maximal value, and I(λ → ∞; ρ) = λS(ρ). Plot (c) shows the functional with an appropriate choice of value for λ for MLME. An additional hill-like structure resulting from S(ρ) is introduced over the plateau, so that the estimator with the largest entropy can be selected from the convex set of ML estimators within the plateau.
general, λ should be chosen so small that S(ρˆI,λ ) is very close to the minimum, and below which there are only very slight changes in the two entropy functionals [8]. Let us derive the iterative algorithm for maximizing I(λ → 0; ρ) with respect to ρ. After varying I(λ → 0; ρ), we have δI(λ → 0; ρ) = −λ tr{δρ ln ρ} +
fj δpj . pj j
(5)
The variations δpj , or δρ, have to be such that ρ stays positive after these variations. To choose their appropriate forms, we first parametrize the positive operator ρ = A† A/tr{A† A} with an auxiliary complex operator A. Under this parametrization, δρ =
δA† A + A† δA − ρ tr{δA† A + A† δA} . tr{A† A}
Substituting δρ in Eq. (6) into Eq. (5), we have δA† A A† δA δI(λ → 0; ρ) = tr R + R , tr{A† A} tr{A† A}
(6)
(7)
where R = R − 1 − λ(ln ρ − tr{ρ ln ρ})
(8)
with R=
fj j . pj j
(9)
When I(λ → 0; ρ) is maximal, we have δI(λ → 0; ρ) = 0 and the extremal equations ρ R = Rρ = 0
(10)
∂I(λ; ρ) , ∂Ak
(12)
with being a small positive constant. This is the steepestascent method. We have thus established a numerical MLME scheme as a set of iterative equations (11) and (12) to search for the MLME estimator using the measurement data obtained from perfect measurement detections. More compactly, the relevant iterative equations are ρk+1 =
(1 + Rk ) ρk (1 + Rk ) , tr{(1 + Rk ) ρk (1 + Rk )}
Rk = Rk − 1 − λ (ln ρk − tr{ρk ln ρk }) .
(13)
We note that a more efficient algorithm, using the conjugategradient method, can be derived from this steepest-ascent algorithm, which is the subject of a separate discussion. B. Imperfect measurements
In actual experiments, the measurement detections will usually be imperfect in the sense that the detection efficiency ηj of a particular measurement outcome j is less than unity. In this case, the overall outcome probabilities p˜ j ≡ ηj pj
(14)
will not sum to unity. Hence, we have aset of POM ˜ j ≡ ηj j such that G ≡ j ˜ j < 1. A with outcomes consequence of this is that the true total number M of copies received is not known, since only N < M are detected (N = M when all ηj = 1 as in Sec. III A). The likelihood functional that accounts for all M copies of quantum systems in an experiment with imperfect detections is given by ⎞ ⎛ nj M! ˜ j }; ρ) = ⎝ p˜ j ⎠ (1 − η)M−N , (15) L({n N ! (M − N )! j where η = j p˜ j < 1. The additional combinatorial prefactor arises from the indistinguishability in the ordering of the detection sequence resulting from losses. With the help of Stirling’s approximation for the factorials, the variation of the corresponding log-likelihood functional is given by ˜ j }; ρ) = tr N R˜ − M − N G δρ δ ln L({n 1−η (1 − η)M , + δM ln M −N
042317-3
YONG SIAH TEO et al.
PHYSICAL REVIEW A 85, 042317 (2012)
˜ j /p˜ j . Adopting the concept of maxiwhere R˜ = j fj mum likelihood, we derive an expression for M such that ˜ j }; ρ) is maximized for any given ρ. This implies ln L({n that the coefficient of the arbitrary δM must vanish and we have M = N/η as the most-likely value of M. With this, the ˜ j }; ρ) reduces to the simple form expression for L({n pj nj ˜ (16) L({nj }; ρ) = η j up to an irrelevant multiplicative factor, with its corresponding logarithmic variation G ˜ ˜ δρ . (17) δ ln L({nj }; ρ) = N tr R − η The additional term −δρG/η in the argument of the trace accounts for copies that have escaped detection. ˜ j }; ρ) Defining I(λ → 0; ρ) for the new POM and its L({n in Eq. (16), one can derive the iterative equations ˜ k) ˜ k )ρk (1 + R (1 + R , ˜ k )ρk (1 + R ˜ k )} tr{(1 + R (18) ˜ k = R˜ k − G − λ(ln ρk − tr{ρk ln ρk }), R η(k) with η(k) = j p˜ j(k) . To highlight the importance of a proper treatment of imperfect measurement detections, we perform a simulation on 103 randomly generated qubit states. Figure 2 compares the performance of the MLME algorithm derived in Sec. III A, with which we search for the MLME estimator by assuming that the measured data {nj } are all we have while ignoring ρk+1 =
1.0
Dtravg
0.8 0.6 0.4 0.2 0.0 0.5
0.6
0.7
0.8
0.9
1.0
tr{ρ2true } FIG. 2. (Color online) A comparison of two different schemes with 103 random qubit true states distributed uniformly with respect to the Hilbert-Schmidt measure. Fifty experiments were simulated for every true state, with N = 5000 for each experiment, and the avg respective average trace-class distances Dtr were computed. The entire simulation was done with a set of randomly generated, informationally incomplete POM consisting of two imperfect measurement outcomes. The plot markers denoted by “+” represent reconstructed states using the algorithm in Eq. (13) while ignoring the imperfection of the measurements, and those denoted by “” represent the reconstructed states using the algorithm in Eq. (18) that accounts for this imperfection. The significant improvement in tomographic efficiency with the latter algorithm is a strong indication of the importance of a proper treatment of imperfect measurements.
the possible missing data, with that of the MLME algorithm derived in this section. The trace-class distance Dtr = 12 tr{|ρˆMLME − ρtrue |}
(19)
is used as the figure of merit to quantify the distance between ρˆMLME and ρtrue . The lesson to be learnt here is that if one neglects the consequence of imperfect measurements in performing state reconstruction, the quality of the resulting reconstructed state estimator will typically be much lower than that obtained from a scheme that accounts for this imperfection. IV. APPLICATIONS A. Time-multiplexed detection tomography
First, we apply the MLME technique to simulation experiments on time-multiplexed detection (TMD) tomography [12]. For experiments of this type, photon pulses of a particular quantum state containing more than one photon are sent through a series of beam splitters [13], each associated with a certain transmission probability. Behind each of the output ports of such a series is a single-photon detector that either registers a click from an incoming split photon pulse, with some detection efficiency, or does nothing. Thus, each output port has a certain overall efficiency η˜ j , which is related to the relevant transmission probabilities and detection efficiency (see Fig. 3). As a consequence, the POM outcomes |ncj n n| (20) j = n
will be a mixture of Fock states, with the coefficients cj n related to ηj [14]. If there are Nports output ports, where all ηj are different, there will be 2Nports distinct POM outcomes due to the binary nature of the single-photon detectors. In 2Nports Nports binary sequences addition, j =1 j = 1 since the 2 of detection configurations constitute all possible events. By counting photon pulses with the POM of Fig. 3, information about the unknown quantum state can be obtained. However, these POM outcomes commute and a measurement of these outcomes only gives information about the diagonal entries of the statistical operator of the true state in the Fock basis. In order to obtain information about the off-diagonal entries, one can, for instance, displace the current set of 2Nports POM outcomes in phase space with some complex value αk away from the origin using the displacement operator †
∗
D(αk ) = eαk A −αk A , ρ
T1
T2
1 − T1
1 − T2
η1
η2
(21)
...
TK
ηK+1
1 − TK ηK
FIG. 3. A schematic diagram representing the time-multiplexed setup with K + 1 output ports. The Tj are the respective transmission probabilities for the j th beam splitter. The overall efficiency
for, say, the kth port is given by η˜ k = ηk (1 − Tk + TK+1 δk,K+1 ) jk−1 =1 Tj .
042317-4
INCOMPLETE QUANTUM STATE ESTIMATION: A . . .
PHYSICAL REVIEW A 85, 042317 (2012)
where A is the standard photon annihilation operator. Then, the new set of outcomes 1 j (αk ) = D(αk )j D† (αk ), (22) N with N being the total number of such displaced set of 2Nports outcomes, does not commute with the undisplaced set. These displaced outcomes are suitable for a measurement that is designed to obtain information about the unknown true state by sampling over multiple αk s. Experimentally, these displaced POM outcomes can be realized with unbalanced homodyne detection [15]. In the simulations, four output ports, corresponding to a total of 24 = 16 POM outcomes, are considered. Two different true states are selected to illustrate the results of MLME. The first true state is chosen to be a stationary state of a laser given by ρss = e−μ
∞ n=0
|n
μn n|, n!
(23)
where μ is the mean number of photons [16]. For the second true state, the statistical operator ρα = |M(α )M(α )|, where |α + |−α |M(α ) = 2(1 + e−2|α |2 )
(24)
is the superposition of the coherent states |α and |−α , is chosen. Quantum states of this kind, introduced in Ref. [17], have been studied experimentally in various situations [18,19]. The notation |M(α ) is used to denote the ket for the male Schr¨odinger’s cat state [20]. See, for example, Ref. [21] for a survey of the family of cat states. Statistical operators are first reconstructed from the simulated data. For this reconstruction, one has to decide on the dimension Dsub of the truncated Hilbert space for the reconstructions. This procedure, also commonly known as state-space truncation, depends on the prior information about the unknown state. In our case, suppose one knows that the mean number of photons of the source is μ ≈ 4, which is the value assigned in the simulation. Then, one may anticipate that all the relevant information about the true state should be contained in a Hilbert space of a dimension which is close to μ. In fact, it is a common practice to choose Dsub , compatible with this information, such that the displaced operators form an informationally complete POM. Then, the standard ML method can be applied to state estimation. We shall compare the result of this approach with another, perhaps more objective, methodology in which we select a larger subspace compatible with this prior information and estimate the state with MLME. After obtaining the reconstructed statistical operators, the Wigner functions W (x,p) of the dimensionless position and momentum quadrature values, x and p respectively, are calculated in accordance with ∞ ∞ −|α|2 W (x,p) = 2e m|ρ|n ⎡ × ⎣(−1)j<
m=0 n=0
⎤ 2j> j< ! (|m−n|) (x + i sgn(n−m) p)|m−n| Lj< (2|α|2 )⎦, 2j< j> ! (25)
where α = x + ip and L(ν) n (y) is the degree-n associated Laguerre polynomial in y of order ν, for all the statistical operators. Here, we define j< ≡ min{m,n} and j> ≡ max{m,n}. To quantify the nonclassicality of the statistical operators, we make use of the concept of nonclassicality depth introduced in Ref. [22]. Let us define the function √ 1 |α/ 2 − w|2 R(α,τ ) = (dw) exp − P (w), (26) πτ τ where w is a complex variable, (dw) denotes the integral measure over the real and imaginary parts of w, P (w) is the Glauber-Sudarshan P function, and the parameter τ is in the range 0 τ 1. From the above definition, it follows that R(α,τ ) is a continuous interpolating function of √ τ from the typically singular, as well as nonpositive, P (α/ 2) (τ → 0), to the Wigner function W (α) (τ = 1/2), to the posi√ √ and finally tive Husimi Q function Q(α) = α/ 2|ρ|α/ 2/π (τ → 1). The nonclassicality depth is then defined as the smallest value τ = τ˜ , above which R(α,τ ) 0. Any mixture of coherent states is therefore a classical state since, in this case, τ˜ = 0. A quantum state with τ˜ > 0 is a nonclassical state. This measure of nonclassicality captures the nonclassical nature of quantum states through a one-parameter family of functions, which can otherwise be invisible to measures involving a fixed value of τ , such as the conventional negativity of the Wigner function. Although quantifying nonclassicality with τ˜ is a somewhat arbitrary procedure, we adopt it here as a measure of nonclassicality that is not worse than other proposals. The generalization of (25) to arbitrary τ values, j> |α|2 ∞ ∞ e− 2τ j< j< ! 1 − τ R(x,p,τ ) = m|ρ|n (−1) τ m=0 n=0 j> ! τ |m−n| |α|2 x + i sgn(n−m) p (|m−n|) × Lj< , (27) √ 2τ (1 − τ ) 2(1 − τ ) is useful for the numerical computation of τ˜ . For the stationary state in Eq. (23), Eq. (27) simplifies to Rss (x,p,τ ) =
e−
|α|2 2τ
τ
∞ −μ
μn (−1) n! n=0 n
1−τ τ
n Ln
|α|2 . 2τ (1 − τ )
(28) The performances of both MLME and the standard ML method on the true states defined in Eqs. (23) and (24) are illustrated by the Wigner function plots of the respective statistical operators obtained from both methods. These are shown in Figs. 4 and 5. The respective nonclassicality depths are also computed for Fig. 4. For the state ρα , all the corresponding reconstructed statistical operators are highly nonclassical, with τ˜ = 1 [23] for all of them. Hence, rather than comparing the τ˜ values, the structure of the Wigner functions for various reconstruction subspaces will be briefly analyzed instead in Fig. 5. B. Light-beam tomography
Finally, we make use of the MLME algorithm to reconstruct states of classical light beams that are measured using the
042317-5
YONG SIAH TEO et al.
PHYSICAL REVIEW A 85, 042317 (2012)
(a) True state
(b) 5-dimensional ML estimator
(c) 11-dimensional MLME estimator
FIG. 4. (Color online) Density plots of the Wigner functions, in phase space, of various statistical operators for (a) the true state (twenty-dimensional stationary state of a laser, μ = 4) with τ˜ ≈ 0.394, (b) the five-dimensional ML estimator with τ˜ ≈ 0.921 and (c) the eleven-dimensional MLME estimator with τ˜ ≈ 0.489. Here, brighter regions indicate the locations of larger Wigner function values, and vice versa. The statistical operator for (b) is obtained using ML by assuming a five-dimensional subspace in which the displaced POM outcomes are informationally complete. The statistical operator for (c) is obtained by assuming a larger subspace of dimension 11 using MLME. Numerous artificial nonclassical features of the ML estimator, a signature of its highly oscillatory Wigner function, are manifested as an abnormally large value of τ˜ , an inevitable byproduct of state-space truncation. One can see that with MLME, extraneous artifacts of the Wigner function resulting from such a truncation can be largely removed.
Shack-Hartmann (SH) wave front sensor. An incoming light beam is transformed by a regular array of microlens apertures and detected in its rear focal plane by a charge-coupled device (CCD) camera (see Fig. 6). A plane wave traversing in the transverse plane of the SH sensor gives rise to a detection, where the individual diffraction patterns are centered at the corresponding optical centers of the microlenses. For a distorted wave front, the observed diffraction pattern behind the kth microlens aperture will be deflected by an angle θk . Since the set of angles θk is related to the local wave front tilts with respect to the transverse plane of the SH sensor, the shape of the wave front can be inferred. Clearly, this standard technique of wave front reconstruction fails in the presence of imperfect coherence, where the notions of wave front and optical phase are no longer well defined and a more general description of the state of the light beam is necessary. Recently, an alternative theory for SH detection, based on the principles of quantum state tomography, has been introduced. It was shown that a complete characterization of a beam of light is possible from the measurement data obtained with the SH sensor under certain assumptions with regard
(a) True state
(b) 8-dimensional ML estimator
(c) 10-dimensional MLME estimator
(d) 15-dimensional MLME estimator
FIG. 5. (Color online) Density plots of the Wigner functions, in phase space, of various statistical operators for (a) the true state (ρα , α = 5), (b) the eight-dimensional ML estimator, (c) the tendimensional, and (d) fifteen-dimensional MLME estimators. In this case, the Wigner function of the ML estimator differs greatly from that of the true state, an example of misleading information obtained via state-space truncation. A transition in the structure of the Wigner function occurs at Dsub = 10, with the MLME estimator for Dsub = 15 giving a more accurate estimated picture of the Wigner function of the true state.
FIG. 6. Schematic diagram of the diffraction patterns of an incoming light beam that is obtained from a SH wave front sensor. The light beam is transformed by an array of microlenses (apertures). A CCD camera is placed at the rear focal plane of the array. The measurement data consist of the measured intensities of the beam. The intensity at the j th pixel, located at position xj , behind the kth microlens aperture is denoted by Ik (xj ).
042317-6
INCOMPLETE QUANTUM STATE ESTIMATION: A . . .
PHYSICAL REVIEW A 85, 042317 (2012)
to the aperture profiles [24]. Analogously to quantum states, we can describe a coherent beam (mode), with a complex amplitude ψ(x), by a ket |ψ, such that ψ(x) = x|ψ. It should be understood, that this ψ(x) is not a quantummechanical probability amplitude, but a mathematical symbol with analogous properties that we exploit. At the focal plane of the kth microlens aperture, the amplitude ψk (x) of the transformed beam is given by ψk (x) = dx hk (x − x )ak (x )ψ(x ), (29) where ak (x) is the aperture function of the kth microlens aperture and the response function hk (x) describes the free propagation from the kth microlens to the SH sensor. Now, suppose a generic partially coherent beam is detected by the SH sensor. We can describe the state of such a beam with a coherence operator ρcoh . When using a computational basis of orthonormal modes |ψn , we have coh ρcoh = |ψm ρmn ψn |. (30) mn
By defining the aperture operator (a) Mk = dx |x ak (x )x |
(31)
for the kth microlens aperture and the unitary propagation operator Uk , where x|Uk |x = hk (x − x ), that describes the free propagation from the kth microlens to the SH sensor, the representation of the corresponding transformed state ρcoh , †
ρcoh = Uk Mk(a) ρcoh Mk(a) Uk † coh = Uk Mk(a) |ψm ρmn ψn |Mk(a) Uk mn
=
≡|ψm
≡ψn |
coh |ψm ρmn ψn |,
(32)
mn
on the focal plane of the apertures follows from the linearity of optics transformations. The intensity Ik (xj ) at position xj [25] on the rear focal plane of the kth aperture is Ik (xj ) ≡ xj |ρcoh |xj coh = xj | |ψm,j ρmn ψn,k | |xj
=
mn coh ρmn
ψm,k (xj )ψn,k (xj )∗ ,
(33)
mn where ψn,k (xj ) = xj |ψn,k are the complex amplitudes of the transformed light beam obtained from the amplitudes ψn (xj ) = xj |ψn of Eq. (29). Since ρcoh possesses all the properties of a statistical operator, the MLME technique can be true used to estimate the true coherence operator ρcoh of a partially coherent beam. To this end, we need to compute the corresponding POM describing the measurement outcomes of the SH sensor. By relating Ik (xj ) to the corresponding probabilities of the outcomes k (xj ) = mn |ψm k,nm (xj )ψn |, we have
Ik (xj ) = tr{ρcoh k (xj )} coh ρmn k,nm (xj ). = mn
(34)
FIG. 7. (Color online) Experimental setup involving a singlemode fiber (SMF), a spatial light modulator (SLM), an aperture stop (A), and a Shack-Hartmann (SH) sensor.
Comparing Eqs. (33) and (34), the positive operator describing the detection outcome at the j th pixel of the CCD camera behind the kth aperture has matrix elements given by (xj )ψn,k (xj )∗ . k,nm (xj ) = ψm,k
(35)
As an illustrative example, the POM outcomes considered in this section are commuting operators in the infinitedimensional Hilbert space with regard to the coherence operators. Equivalently, the aperture functions for the respective microlenses do not overlap in position. This is a special case of a more general theory on Shack-Hartmann detection, which is a subject for future study. In the experiment, a controlled preparation of optical beams is realized using the principles of digital holography [26]. Figure 7 shows the setup. The essence of the beam preparation lies in the numerical construction of a digital hologram that is programmed to produce a superposition of a reference plane true of interest. This is wave and a beam with the true state ρcoh achieved with the help of an amplitude spatial light modulator (OPTO SLM) with a resolution of 1024 × 768 pixels. The hologram is then illuminated by the reference plane wave that is considered in the superposition. To approximately produce this plane wave, a collimated Gaussian beam is generated by placing the output of a single-mode fiber at the focal plane of a collimating lens. In this way, the digital hologram can be fully situated at the center of the collimated Gaussian beam of a larger beam waist, where this beam can then be approximated to be a plane wave with high accuracy. The resulting diffraction spectrum, after illuminating the digital hologram with the collimated Gaussian beam, involves several diffraction orders, true of which only one contains useful information about ρcoh . To filter out the unwanted diffraction orders, a 4-f optical processor, with a small circular aperture stop placed at the rear focal plane of the second lens, is used for this purpose (the aperture stop in Fig. 7). The resulting light beam with the state true ρcoh is then focused at the rear focal plane of the third lens. This completes the preparation stage. The measurement of the light beam involves a Flexible Optical SH sensor with 128 microlenses that form a hexagonal array. Each microlens has a focal length of 17.9 mm and a hexagonal aperture with a diameter of 0.3 mm. The signal at the focal plane of the array is detected by a uEye CCD camera that has a resolution of 640 × 480 pixels, with each pixel being 9.9 μm × 9.9 μm in size. The aforementioned setup is used for generating and analyzing low-order Laguerre-Gaussian (LG) modes. The LG modes can serve as important resources in quantum information processing [27]. In this experiment, only LG
042317-7
YONG SIAH TEO et al.
PHYSICAL REVIEW A 85, 042317 (2012)
modes with no radial nodes are considered. Such modes form a one-parameter orthonormal basis, where the modes are specified by the orbital angular momentum quantum number l. In polar coordinates, the relevant part of the complex amplitude of a LG mode, for a fixed l, is given by s,ϕ|LGl ∝ s l eilϕ e−s . 2
(36)
Nonzero values of l give rise to helical wave fronts, for which each photon carries an orbital angular momentum of l¯h. For the source of light beams, we would like to prepare the sup true state ρcoh = ρcoh = |ψsup ψsup |, where 1 |ψsup = (|LG0 − |LG1 i − |LG2 ) √ , 3
(37)
using the OPTO SLM. In the presence of experimental true prepared this way imperfections, however, the true state ρcoh sup will not be exactly the same as ρcoh . After measuring this beam with the SH sensor, the data are processed using the MLME true MLME for ρcoh , algorithm in Eq. (18) to obtain the estimator ρˆcoh MLME since G < 1. To quantify the quality of ρˆcoh , we investigate sup MLME and ρcoh . the fidelity between ρˆcoh true Figure 8 shows the CCD image for the state ρcoh . Each aperture gives rise to a bright spot in the CCD image. To maximize the signal-to-noise ratio, only the pixel with the highest intensity within each spot is selected as a measurement datum. The set of intensities, corresponding to maximumintensity pixels, constitutes the measurement data to be used for state reconstruction. In our case, the corresponding POM consists of 35 linearly independent outcomes described by Eq. (35). This measurement is, therefore, informationally complete for Dsub 5. In cases where state reconstruction on informationally complete subspaces gives unsatisfactory results, the MLME approach can be used on the informationally incomplete data to give reasonable estimators on a larger subspace, as illustrated in Fig. 9. So far, the procedure of state-space truncation is performed true in the basis of the LGl modes. In this basis, when ρcoh is sup known to be quite close to ρcoh , the truncation of modes of higher orders will not result in a great loss of reconstruction sup information, as implied by the structure of ρcoh in Eq. (37). The situation will be very different when there is no such prior true knowledge about ρcoh , except for the fact that the possible values of l lie in a certain range. In this situation, there is no appropriate strategy to choose a computational basis in which the state-space truncation can be done effectively and true justifiably. More generally, estimating the unknown state ρcoh on a truncated subspace will, as a rule, result in missing important reconstruction information and this will lead to
FIG. 9. (Color online) MLME state estimation from informationally incomplete data for Dsub = 9. The real (left) and imaginary (right) MLME are shown. parts of the reconstructed coherence operator ρˆcoh The reconstruction subspace is spanned by the modes LGl , with l = 0,1, . . . ,8. In this case, 56 out of 91 independent outcomes, true , are not accessible, required for complete characterization of ρcoh sup MLME is close to ρcoh , with a fidelity of yet the MLME estimator ρˆcoh 92%.
strongly biased estimators. A remedy for this problem is to perform state reconstruction on a sufficiently large subspace that is compatible with the knowledge about the range of values of l. To emphasize this point, we simulate the following scenario. (1) The set of measurement data, obtained from the CCD image shown in Fig. 8, is distributed to 50 parties. The possible true values of l for the true state ρcoh are known to lie in the range l ∈ [0,7]. (2) Each party selects a computational basis and estimates the state of the beam for Dsub = 3,4, . . . ,8 using either the ML (for Dsub 5) or the MLME algorithm (for Dsub > 5). (3) The reconstructed estimators for the six values of Dsub are reported by each party and the average fidelity of the estimators for every value of Dsub are calculated. A typical outcome of this scenario is shown in Fig. 10. As can be seen, performing state-space truncations in order to true reconstruct ρcoh with an informationally complete set of data generally leads to low fidelities in the estimators. Increasing the number of degrees of freedom and using the MLME algorithm
fidelity
true FIG. 8. CCD image for the state ρcoh . The relevant part of the SH readout used for the beam reconstruction is shown. Contributions from the individual SH apertures are indicated by bright spots, with each spot made up of multiple pixels. Note that the two void regions sup correspond to the phase singularities of the state ρcoh . This hints that sup true ≈ ρcoh . ρcoh
Dsub
FIG. 10. Average fidelities, computed over 50 random choices of computational bases, of the estimators for different dimensions Dsub of the reconstruction subspace. The unfilled (filled) circular plot markers correspond to informationally complete (incomplete) tomography, respectively.
042317-8
INCOMPLETE QUANTUM STATE ESTIMATION: A . . .
PHYSICAL REVIEW A 85, 042317 (2012)
to cope with the completeness issue seems to be a much better strategy. V. CONCLUSION
additional unsampled degrees of freedom, that is compatible with any prior information about a given unknown state. Such a more objective way of state estimation results in a much better tomographic quality of the reconstructed estimator.
We derived the iterative algorithms for informationally incomplete quantum state estimation respectively for perfect and imperfect measurements. Next, we applied these algorithms to time-multiplexed detection tomography and light-beam tomography. From these two applications, we learned that one should not restrict the state reconstruction to a subspace in which the relevant measurements are informationally complete. Doing so can result in reconstruction artifacts that originate in the state-space truncation and may result in inaccurate estimators for the unknown true state. Instead, one should perform the reconstruction on a larger subspace, with
This work is supported by the National University of Singapore Graduate School for Integrative Sciences and Engineering and the Centre for Quantum Technologies, which is a Research Centre of Excellence funded by Ministry of Education and National Research Foundation of Singapore, as well as the Czech Ministry of Education, Project No. LC06007, IGA Project No. PRF_2011_005, and the Czech Ministry of Industry and Trade, Project No. FR-TI1/364.
[1] R. Schack, T. A. Brun, and C. M. Caves, Phys. Rev. A 64, 014305 (2001). [2] R. Blume-Kohout and P. Hayden, e-print arXiv:quant-ph/0603116 (2006). [3] R. Blume-Kohout, New J. Phys. 12, 043034 (2010). [4] R. A. Fisher, Phil. Trans. R. Soc. London A 222, 309 (1922). [5] C. W. Helstrøm, Quantum Detection and Estimation Theory (Academic Press, New York, 1976). ˇ acˇ ek, Lecture Notes in Physics-Quantum [6] M. Paris and J. Reh´ State Estimation (Springer, Berlin, 2004). ˇ acˇ ek, Z. Hradil, E. Knill, and A. I. Lvovsky, Phys. Rev. A [7] J. Reh´ 75, 042108 (2007). ˇ acˇ ek, and Z. Hradil, [8] Y. S. Teo, H. Zhu, B.-G. Englert, J. Reh´ Phys. Rev. Lett. 107, 020404 (2011). [9] E. T. Jaynes, Phys. Rev. 106, 620 (1957); 108, 171 (1957). [10] V. Buˇzek, G. Adam, and G. Drobny, Ann. Phys. (NY) 245, 37 (1996). [11] A. R. Rossi and M. G. A. Paris, Eur. Phys. J. D 32, 223 (2005). ´ [12] D. Achilles, C. Silberhorn, C. Sliwa, K. Banaszek, and I. A. Walmsley, Opt. Lett. 28, 2387 (2003); O. Haderka, M. Hamar, and J. Peˇrina, Eur. Phys. J. D 28, 149 (2004). [13] The word beam splitter, used in this context, represents a class of possible apparatuses for splitting photon pulses, which includes conventional beam splitters, optical fibers, etc. ˇ acˇ ek, Z. Hradil, O. Haderka, J. Peˇrina Jr., and M. Hamar, [14] J. Reh´ Phys. Rev. A 67, 061801(R) (2003). [15] S. Wallentowitz and W. Vogel, Phys. Rev. A 53, 4528 (1996). [16] H. M. Wiseman and J. A. Vaccaro, Phys. Rev. A 65, 043605 (2002).
[17] V. V. Dodonov, I. A. Malkin, and V. I. Man’ko, Physica 72, 597 (1974). [18] A. Ourjoumtsev, H. Jeong, R. Tualle-Brouri, and P. Grangier, Nature (London) 448, 784 (2007). [19] S. Del´eglise, I. Dotsenko, C. Sayrin, J. Bernu, M. Brune, J.-M. Raimond, and S. Haroche, Nature 455, 510 (2008). [20] This is a regrettably popular abuse of terminology. Such superpositions of two coherent states are, at best, a poor metaphor of Schr¨odinger’s cat example [28], for which the entanglement of a few quantum degrees of freedom with the very many degrees of freedom of a macroscopic object is essential. [21] J. Janszky, I. F¨oldesi, S. Szabo, P. Adam, and M. S. Kim, Acta Phys. Slov. 46, 269. [22] C. T. Lee, Phys. Rev. A 44, R2775 (1991). [23] M. Takeoka, M. Ban, and M. Sasaki, J. Opt. B 4, 114 (2002). ˇ acˇ ek, and L. L. S´anchez-Soto, Phys. Rev. Lett. [24] Z. Hradil, J. Reh´ 105, 010401 (2010). [25] In order to talk about a physical position ket |xj , it is important to understand that the specification of xj comes with a certain finite precision. As such, these physical kets now normalize to the Kronecker delta, that is xj xj = δjj . [26] N. R. Heckenberg, R. McDuff, C. P. Smith, and A. G. White, ˇ Opt. Lett. 17, 221 (1992); Z. Bouchal and R. Celechovsk´ y, New J. Phys. 6, 131 (2004). [27] A. Mair, A. Vaziri, G. Weihs, and A. Zeilinger, Nature (London) 412, 313 (2001). [28] E. Schr¨odinger, Naturwissenschaften 23, 807 (1935); 23, 823 (1935); 23, 844 (1935); [English translation J. D. Trimmer, Proc. Am. Philos. Soc. 124, 323 (1980)].
ACKNOWLEDGMENTS
042317-9
PHYSICAL REVIEW A 86, 052123 (2012)
Informational completeness of continuous-variable measurements ˇ acˇ ek,2 Z. Hradil,2 G. Leuchs,1,3 and L. L. S´anchez-Soto1,4 D. Sych,1 J. Reh´ 1
Max-Planck-Institut f¨ur die Physik des Lichts, G¨unther-Scharowsky-Straße 1, Bau 24, 91058 Erlangen, Germany 2 Department of Optics, Palack´y University, 17. listopadu 12, 771 46 Olomouc, Czech Republic 3 Universit¨at Erlangen-N¨urnberg, Staudtstraße 7/B2, 91058 Erlangen, Germany 4 ´ Departamento de Optica, Facultad de F´ısica, Universidad Complutense, 28040 Madrid, Spain (Received 17 August 2012; published 30 November 2012) We justify that homodyne tomography turns out to be informationally complete when the number of independent quadrature measurements is equal to the dimension of the density matrix in the Fock representation. Using this as our thread, we examine the completeness of other schemes when continuous-variable observations are truncated to discrete finite-dimensional subspaces. DOI: 10.1103/PhysRevA.86.052123
PACS number(s): 03.65.Wj, 03.65.Ta, 42.50.Dv
I. INTRODUCTION
Measurement lies at the very heart of quantum information. It is an indispensable tool for identifying how well one can prepare or can create a particular quantum state. Such an assessment is achieved by performing suitable measurements on a sequence of identically prepared systems. A set of measurements, whose outcome probabilities are sufficient to determine an arbitrary quantum state, is called informationally complete (IC) [1], whereas, the process of reconstructing the state itself is broadly called quantum tomography [2]. Investigations on IC measurements have been extensively carried out for discrete Hilbert spaces [3]. For continuous variables, the archetypical example is homodyne tomography, first suggested in the seminal paper of Vogel and Risken [4] and implemented by Smithey et al. [5]. Still, the reconstruction of the measured state is inexorably accomplished in some finite subspace chosen by an educated guess. In many experimental situations, one has some additional prior information that can be efficiently used for reducing the number of relevant unknown parameters, making the reconstruction much simpler. For example, the knowledge about the Gaussian character of the state reduces the problem to the evaluation of its 2 × 2 covariance matrix, which is formally analogous to the estimation of a spin 1/2 [6]. In the same vein, if the system can be represented (say, in the Fock basis) by a finite density matrix, the number of quadratures needed for an accurate reconstruction in homodyne tomography is precisely equal to the dimension of that matrix [7]. Note, in passing, that this is indeed very closely related to the quantum version of the sampling theorem [8]. With the advent of powerful nonlinear estimation techniques that offer amazing performance and robustness in most applications, matching the signal space used for coding the information in an experimental setup is more relevant than ever. This is, in fact, a dual problem: One is interested not only in what can be reconstructed from a particular scheme, but also in identifying the best option for a given signal. Any measurement is represented by an operator, and what matters for tomography is the number of linearly independent operators required for the reconstruction. Keeping in mind the lesson from homodyne detection, the question of how to select those operators appears far from trivial. In this paper, we examine the informational completeness of various schemes. We derive a surprisingly simple connection 1050-2947/2012/86(5)/052123(4)
between the different measurement settings and the number of linearly independent elements induced by them. In addition, the analysis displays the information provided by each acquired piece. Such knowledge is certainly of great interest both for the optimization of feasible tomographic protocols and for the design of new ones. II. PRELIMINARIES
A d-dimensional quantum system is represented by a positive semidefinite d × d density matrix that requires d 2 − 1 independent real numbers for its specification. A von Neumann measurement fixes at most d − 1 real parameters, so d + 1 tests have to be performed to reconstruct the state. This means that d 2 + d histograms have to be recorded: The approach is, thus, suboptimal for this number is higher than the number of parameters in the density matrix. The von Neumann strategy can be further optimized regarding this redundancy when the bases in which the measurements are performed are mutually unbiased [9]. Besides, it is known that more general measurements exist. Such generalized measurements appeared as positive operatorvalued measures (POVMs) in the quantum theory of detection in the early 1970s. It was soon realized that, for numerous reasons, they provided greater efficiency [10–14]. In short, a POVM is described by a set of linear operators {Eˆ n } furnishing the correct probabilities in any experiment (we assume, for simplicity, discrete outcomes) through the Born rule, pn = Tr(ρˆ Eˆ n ) (1) for any state described by the density operator ρ. ˆ Here, Tr denotes the trace of a complex matrix. Compatibility with the properties of ordinary probability imposes the requirements of positivity, Hermiticity, and resolution of the identity, ˆ Eˆ n 0, Eˆ n = 1. Eˆ n = Eˆ n† , (2) n
The case of the projective von Neumann test is recovered when all the operators in set {Eˆ n } commute. A quite general way of implementing a POVM is to properly combine the system to be tested with an auxiliary system whose initial state is known and then to perform a von Neumann test on the combined system [15]. When the coupling with the auxiliar system and the von Neumann measurement
052123-1
©2012 American Physical Society
D. SYCH et al.
PHYSICAL REVIEW A 86, 052123 (2012)
are judiciously chosen, one can get IC POVMs, which, in addition, are optimal in the sense that minimize the number of independent detections that must be obtained during the tomographic process [16]. Below, we will exploit a similar idea to perform IC measurements from incomplete ones by cutting the dimensionality of the signal space [17]. III. QUADRATURE MEASUREMENT
To get the backbone of our proposal, we start with states that can be written as a finite sum in the Fock basis. We wish to characterize a d-dimensional subspace 1ˆ d = d−1 n=0 |nn| from projections onto the quadrature eigenstates |xθ , which can be expressed as n|xθ ∝ Hn (x)e
−x 2 /2 inθ
e
.
(3)
Our task is to find out how many different phase settings θ (also referred to as cuts) are needed to make the scheme complete. It is clear that the complex argument of n|xθ is independent of x, so one quadrature can never generate a complete POVM. For example, the three states (|00| + |11|)/2 √ and (|0 ± i|1)/ 2 have the same position distribution, and hence, the position measurement (θ = 0) cannot discriminate among them. Obviously, since n|xθ=0 is real for all x, such projections fail to generate the σy component. This difficulty persists in higher dimensions. Fortunately enough, this topic can be fully analyzed in a closed form. Indeed, the probability distribution of the homodyne detection can be written, up to a normalization factor, as p(x,θ ) ∝
d−1
ρk Hk (x)H (x)e−x ei(k−)θ , 2
(4)
k,=0
where x is the measured amplitude. Let us take all matrix elements ρk to be nonzero and calculate the number N of linearly independent combinations of the density matrix (4) that can be generated from different choices of x and θ . For every polynomial term with a maximum power x n , we have the following different combinations of Hermite polynomials [omitting, for brevity, the associated factor ei(k−)θ ]: x0: x1: x2: x3:
H0 H0 , H0 H1 ,H1 H0 , H0 H2 ,H2 H0 ,H1 H1 , H0 H3 ,H3 H0 ,H1 H2 ,H2 H1 , ... x 2d−4 : Hd−2 Hd−2 ,Hd−1 Hd−3 ,Hd−3 Hd−1 , x 2d−3 : Hd−2 Hd−1 ,Hd−1 Hd−2 , x 2d−2 : Hd−1 Hd−1 .
(5)
TABLE I. The number of linearly independent POVM elements induced by m different quadrature measurements in a d-dimensional Fock subspace. The bold font indicates IC POVMs. d 2 3 4 5 6 7 8
m=1 3 5 7 9 11 13 15
m=2 4 8 12 16 20 24 28
m=3 4 9 15 21 27 33 39
m=4 4 9 16 24 32 40 48
m=5 4 9 16 25 35 45 55
m=6 4 9 16 25 36 48 60
An alternative way to get the same result is by noticing that, after measuring the first quadrature, 2d − 1 linear combinations of ρk are fixed, and there remain d 2 − 1 − (2d − 1) = (d − 1)2 − 1 free parameters entering the probability (4). This effectively lowers the dimension of the problem by one. Thus, N2 = 2(d − 1) − 1 = 2d − 3, N3 = 2(d − 2) − 1 = 2d − 5, etc. The procedure can be repeated until the number of cuts m equals d when N reaches its maximum value of d 2 . One can draw an important conclusion from this discussion: By measuring each new quadrature, the prior information is updated in such a way that the dimension of the unknown part of the system becomes one unity less. mIn consequence, m different phase settings induce N = k=1 Nk linearly independent POVM elements; that is, ⎧ ⎨m(2d − m), m < d, N= (6) ⎩d 2 , m d, which can be conveniently summarized as in Table I. This relation is the main achievement of this paper as it provides a full description of the IC for the problem at hand. As we can see, to fully characterize a d-dimensional Fock subspace, one needs d different quadratures. For a fixed m, the number N scales quadratically with d until d = m due to the completeness of the generated POVMs. For d > m, the size of the POVM grows only linearly, hence, in the asymptotic case of sufficiently large dimensionality, the measurement becomes more and more incomplete. In this respect, we wish to highlight that our results do not rely on a particular reconstruction scheme as in Ref. [7], but rather, they emerge from the properties of the measurement itself and pervade all the continuous-variable detection schemes. IV. PHYSICAL DISCUSSION
For a single quadrature θ1 , the number N1 is determined by the term Hd−1 Hd−1 with the highest polynomial power and is equal to N1 = 2d − 1 (the total number of first elements Hk H in all rows of the above array). Since we have all the polynomial powers from 0 up to 2d − 2, there are no more linearly independent elements. The second value θ2 additionally gives us N2 = 2d − 3 linearly independent combinations of ρk (the total number of second elements Hk H in all rows), the third value θ3 gives N3 = 2d − 5, and so on.
The analysis presented so far has significant consequences; some of which are explored here. Notice that the IC quadrature operators with d phases approximate the structure of mutually unbiased measurements. Without the Hilbert-space truncation, the projectors with the same phase setting are orthogonal, whereas, for different phases, they overlap. These complementary properties become modified in a finite-dimensional subspace, although they approach their continuous-variable counterpart as long as the cutoff d is sufficiently large. Loosely speaking, the orthogonal measurements always bring a completely new bit of information, whereas, the
052123-2
INFORMATIONAL COMPLETENESS OF CONTINUOUS- . . .
PHYSICAL REVIEW A 86, 052123 (2012)
overlapping ones verify the previously acquired information and add a new piece thereof. This is the essence of the tomography where afterwards, all the space is covered by an “operator” mesh. Since the homodyne detection on finitedimensional subspaces is feasible, this gives an excellent opportunity to investigate the information gained in the process of the measurement. We emphasize that even a single quadrature actually generates IC POVMs, provided that the signal space is properly matched to such a detection. For example, Table I shows that, in a five-dimensional Fock subspace, a single quadrature generates nine independent POVM elements. These are IC in a suitably chosen three-dimensional subspace. Put differently, a single quadrature provides characterization of a qutrit in a five-dimensional space or two entangled qubits in a nine-dimensional space. Similarly, all Pauli matrices are induced by just two quadratures (say, x and p). Such kinds of prior knowledge about the signal space can significantly reduce the number of measurements required for the complete state reconstruction. A particularly natural situation is the case of symmetric and antisymmetric subspaces [18]: A complete characterization of an arbitrary two-qutrit state requires nine different quadratures, whereas, an antisymmetric two-qutrit state can be inferred with just one quadrature measurement. The previous results can be simplified in some cases where prior information is available. For instance, some elements of the density matrix can be known to vanish, and we can reach the complete POVM with less settings. Let us consider an analog of a squeezed vacuum of the form | = c0 |0 + c1 |4 + c2 |8 + · · · + ck |4k + · · · .
H0 H0 , H0 H4 ,H4 H0 , H4 H4 ,H0 H8 ,H8 H0 H4 H8 ,H8 H4 , H8 H8 .
V. PHOTON-NUMBER RESOLVING DETECTION
To obtain our main result (6), we have essentially relied on the polynomial representation of the quadrature (3), namely, that the probability distribution (4) can be written with the help of polynomials up to a certain power, defined by dimensionality of the quantum state. This property also holds for many other situations; indeed, almost any physical measurement satisfies this property [12]. For example,√an approximation 2 n of coherent state |α = e−|α| /2 ∞ n=0 α / n!|n by a finite sum, neglecting tiny contributions of sufficiently high n, is essentially the same situation as above: Linearly independent POVM elements can be obtained from projections of a finitedimensional state onto a properly matched basis. In the simplest scenario, the strategy can be photon-numberresolving detection. In fact, instead of (4), we now have
(7)
The coefficients ck gradually decrease with k, which makes setting them to zero at some threshold value ck = 0 for k d possible. The resulting state lives in a d-dimensional subspace, so one may think that m = d phase settings would be needed to characterize that subspace. Surprisingly, the prior information about photons being generated in quadruples modifies the structure of the induced POVM, and the number of linearly independent measurements is found to be different from that calculated before. Let us take a look at the case d = 3. The coefficients in Eq. (4) contain polynomial powers up to 4(d − 1) × 4(d − 1) = 16, x0: x4: x8: x 12 : x 16 :
where [ ] denotes the integer part. Hence, the family of states (7) can be characterized with roughly half as many quadratures that would be required for a truncated Fock subspace of the same dimension. As our last contention, we insist that proper matching conditions are essential [19]. Particularly, without a deeper understanding, too dense binning of quadratures may be useless, whereas, the quadrature phase may easily become undersampled. In other words, the number of quadrature bins multiplied by the number of phase settings does not, in general, equal the number of free parameters in the homodyne detection.
(8)
By explicitly writing the power expansion of the coefficients H0 H8 = 256x 8 − 3584x 6 + 13 440x 4 − 13 440x 2 + 1680 and H4 H4 = (16x 4 − 48x 2 + 12)2 , we see that they are linearly independent. Indeed, H0 H8 cannot be written as a linear combination of H0 H0 , H0 H4 , and H4 H4 due to the lack of all needed polynomial powers in contrast to the general case. Hence, the number of linearly independent POVM elements is much higher now: Instead of N1 = 2d − 1, N2 = 2d − 3, N3 = 2d − 5, etc., we have the modified expressions N1∗ = N1 + N3 + N5 + · · · , N2∗ = N2 , N3∗ = N4 , N4∗ = N6 , . . . . The number of different phase settings for the scheme to be complete is m∗ = [d/2] + 1,
p(α,n) = |n|α|2 = e−|α|
2
|α|2n . n!
(9)
An obvious drawback of this choice is phase insensitivity since coherent states with the same amplitude and different phases give identical statistics. To avoid this degeneracy, the photon-number detection can be preceded by a suitable displacement [20] or even more complicated “steering” operation. A detailed examination of this point is out of the scope of the present paper. VI. CONCLUDING REMARKS
We have addressed the fundamental question of how many independent measurements can be generated by a given experimental setup. The analysis clarifies the issue of necessary and sufficient complexity for tomographical schemes. It turns out that the effective size of quantum tomography for any finite-dimensional system can be related to the number of different quadratures observed, which illustrates an exciting link between discrete and continuous-variable systems. We stress that such a reconstruction cannot be accomplished without the appropriate delimitation of the reconstruction space since the space touched by the observation then exceeds the amount of available data. Our central result indicates that for a d-dimensional system a single quandrature can be discretized up to 2d − 1 bins. This appears to be very similar to the classical Nyquist frequency in the Kotelnikov-Shannon coding theorem. By finding a simple analytical rule, we have provided a full characterization of informational completeness for a wide class
052123-3
D. SYCH et al.
PHYSICAL REVIEW A 86, 052123 (2012)
of continuous-variable measurements and made a step towards a better understanding of quantum resources in quantum optics and quantum information processing. The analysis is applicable for arbitrary dimensionality and, thus, serves as a good alternative to other traditional approaches based, e.g., on mutually unbiased bases and symmetric IC POVMs. Finally, note that only data-acquisition issues have been addressed here: The subsequent reconstruction must be capable of dealing with generic nonequivalent detections. The mathematical method best suited for this purpose is the maximum likelihood estimation; however, even in this case, the continuous data are discretized due to the very nature
of the measurement and the finite amount of memory and computational time available. We believe that our theory can be helpful in future optimizations of continuous-variable measurements.
[1] E. Prugoveˇcki, Int. J. Theor. Phys. 16, 321 (1977); P. Busch and P. J. Lahti, Found. Phys. 19, 633 (1989). [2] Quantum State Estimation, edited by M. G. A. Paris and ˇ acˇ ek, Lecture Notes in Physics Vol. 649 (Springer, Berlin, J. Reh´ 2004). [3] G. M. D’Ariano, P. Perinotti, and M. F. Sacchi, J. Opt. B 6, S487 (2004); S. T. Flammia, A. Silberfarb, and C. M. Caves, Found. Phys. 35, 1985 (2005); S. Weigert, Int. J. Mod. Phys. B 20, 1942 (2006); T. Durt, Open Syst. Inf. Dyn. 13, 403 (2006). [4] K. Vogel and H. Risken, Phys. Rev. A 40, 2847 (1989). [5] D. T. Smithey, M. Beck, M. G. Raymer, and A. Faridani, Phys. Rev. Lett. 70, 1244 (1993). ˇ acˇ ek, S. Olivares, D. Mogilevtsev, Z. Hradil, M. G. A. [6] J. Reh´ Paris, S. Fornaro, V. D’Auria, A. Porzio, and S. Solimeno, Phys. Rev. A 79, 032111 (2009). [7] U. Leonhardt and M. Munroe, Phys. Rev. A 54, 3682 (1996); U. Leonhardt, J. Mod. Opt. 44, 2271 (1997). [8] A. V. Oppenheim, A. S. Willsky, and S. Hamid, Signals and Systems, 2nd ed. (Prentice Hall, Upper Saddle River, NJ, 2010). [9] J. Schwinger, Proc. Natl. Acad. Sci. USA 46, 570 (1960); W. K. Wootters and B. D. Fields, Ann. Phys. 191, 363 (1989); A. B. Klimov, J. L. Romero, G. Bj¨ork, and L. L. S´anchez-Soto, J. Phys. A: Math. Theor. 40, 3987 (2007); A. B. Klimov, D. Sych, L. L. S´anchez-Soto, and G. Leuchs, Phys. Rev. A 79, 052101 (2009); T. Durt, B.-G. Englert, I. Bengtsson, and K. Zyczkowski, Int. J. Quantum Inf. 8, 533 (2010).
[10] R. L. Stratonovich, J. Stochastics 1, 87 (1973). [11] B. A. Grishanin, Tekn. Kibernetika 11, 127 (1973) [arXiv: quant-ph/0301159v1]. [12] C. W. Helstrom, Quantum Detection and Estimation Theory (Academic, New York, 1976). [13] A. S. Holevo, Probabilistic and Statistical Aspects of Quantum Theory, 2nd ed. (North-Holland, Amsterdam, 2003). [14] V. B. Braginski and F. Y. Khalili, Quantum Measurement (Oxford University Press, Oxford, 1992). [15] C. W. Helstrom, J. W. S. Liu, and J. P. Gordon, Proc. IEEE 58, 1578 (1970). [16] J. M. Renes, R. Blume-Kohout, A. J. Scott, and C. M. Caves, J. Math. Phys. 45, 2171 (2004); D. M. Appleby, S. T. Flammia, and C. A. Fuchs, ibid. 52, 022202 (2011); R. Salazar, D. Goyeneche, A. Delgado, and C. Saavedra, Phys. Lett. A 376, 325 (2012). ˇ acˇ ek, Z. Hradil, Z. Bouchal, R. Celechovsk´ ˇ [17] J. Reh´ y, I. Rigas, and L. L. S´anchez-Soto, Phys. Rev. Lett. 103, 250402 (2009). [18] D. Sych and G. Leuchs, New J. Phys. 11, 013006 (2009); 11, 113040 (2009). [19] A. Ourjoumtsev, R. Tualle-Brouri, J. Laurat, and P. Grangier, Science 312, 83 (2006). [20] C. Wittmann, U. L. Andersen, M. Takeoka, D. Sych, and G. Leuchs, Phys. Rev. Lett. 104, 100505 (2010); Phys. Rev. A 81, 062338 (2010).
ACKNOWLEDGMENTS
Financial support from the EU FP7 (Grant Q-ESSENCE), the Spanish DGI (Grant No. FIS2011-26786), the UCMBSCH program (Grant No. GR-920992), the Czech Technology Agency (Grant No. TE01020229), the Czech Ministry of Trade and Industry (Grant No. FR-TI1/384), and the IGA of Palack´y University (Grant No. PRF-2012-005) is acknowledged.
052123-4