Univerzita Palackého v Olomouci Přírodovědecká fakulta
Tenké vrstvy Jaromír Křepelka
Olomouc 2012
Oponenti: Ing. Jiří Jankůj, CSc. Mgr. Zdeněk Hubička, Ph.D.
Publikace byla připravena v rámci projektu Investice do rozvoje vzdělávání Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky
1. vydání © Jaromír Křepelka, 2012 © Univerzita Palackého v Olomouci, 2012 Neoprávněné užití tohoto díla je porušením autorských práv a může zakládat občanskoprávní, správněprávní, popř. trestněprávní odpovědnost. ISBN 978-80-244-3109-3 NEPRODEJNÉ
Obsah Stručný úvod do optiky tenkých vrstev ………………………………. 5 Omezení volných parametrů soustavy tenkých vrstev v důsledku principu reverzibility …………………………………………………………… 21 Využití optimalizačních algoritmů pro návrh soustav tenkých vrstev .. 35 Analysis of ellipsometric data obtained from curved surfaces ………. 45
3
4
Vzdeˇla´va´nı´ vy´zkumny´ch pracovnı´ku˚ v Regiona´lnı´m centru pokrocˇily´ch technologiı´ a materia´lu. ˚ CZ.1.07/2.3.00/09.0042 1
Strucˇny´ u´vod do optiky tenky´ch vrstev Jaromı´r Krˇepelka Abstrakt. Cı´lem prˇ´ıspeˇvku je podat strucˇny´ u´vod do teorie optiky soustav tenky´ch vrstev. Prˇ´ıstup vycha´zı´ z rˇesˇenı´ Helmholtzovy rovnice pro rovinne´ elektromagneticke´ vlny v homogennı´m, obecneˇ anizotropnı´m prostrˇedı´. Je objasneˇn fyzika´lnı´ vy´znam interferencˇnı´ matice transformujı´cı´ tecˇne´ slozˇky intenzity elektricke´ho a magneticke´ho pole jednou a vı´ce tenky´mi vrstvami, prˇenosove´ matice transformujı´cı´ tecˇne´ slozˇky intenzity elektricke´ho pole rozdeˇlene´ho na protibeˇzˇne´ vlny celou soustavou tenky´ch vrstev a matice transformujı´cı´ norma´love´ slozˇky Poyntingova vektoru. S jejich pomocı´ jsou definova´ny odrazivosti a propustnosti jako meˇrˇitelne´ makroskopicke´ parametry za´visle´ na vlnove´ de´lce, u´hlu dopadu a polarizaci dopadajı´cı´ho sveˇtla. Jsou diskutova´ny prˇ´ıpady idea´lnı´ch tenky´ch cˇi tlusty´ch vrstev nebo jejich kombinacı´ a rovneˇzˇ vrstev v cˇa´stecˇneˇ koherentnı´m sveˇtle. Uzˇitı´m prˇedstavy o prostorove´ symetrii je odvozen princip reverzibility platny´ pro tenke´ (absorbujı´cı´ nebo neabsorbujı´cı´) vrstvy. Cˇla´nek koncˇ´ı demonstracı´ neˇkolika prˇ´ıklad˚u vy´pocˇt˚u soustav tenky´ch vrstev upotrˇebitelny´ch samostatneˇ nebo jako vy´chozı´ soustavy pro dalsˇ´ı na´vrhy, vesmeˇs za pomoci vy´pocˇetnı´ techniky. Je uveden prˇ´ıklad odrazivosti proste´ho rozhranı´, antireflektova´nı´ jednou, dveˇma a trˇemi vrstvami ve srovna´nı´ s idea´lnı´ soustavou s maxima´lneˇ plochy´m pr˚ubeˇhem odrazivosti v okolı´ pracovnı´ vlnove´ de´lky a prˇ´ıklad periodicke´ soustavy s vyhlazeny´mi bocˇnı´mi maximy. 1
ˇ eske´ republiky. Projekt je spolufinancova´n Evropsky´m socia´lnı´m fondem a sta´tnı´m rozpocˇtem C
5
Jaromı´r Krˇepelka: Strucˇny´ u´vod do optiky tenky´ch vrstev
1
´ vod U
Metody rˇesˇenı´ ota´zek spojeny´ch s interakcı´ elektromagneticke´ho pole s la´tkou lze zhruba rozdeˇlit do na´sledujı´cı´ch teoreticky´ch skupin (v za´vorce jsou uvedeny prˇ´ıklady jejich mozˇny´ch pouzˇitı´): - paprskova´ nebo geometricka´ optika (opticke´ zobrazovacı´ soustavy), - skala´rnı´ vlnova´ teorie (opticke´ svazky, Fourierova optika, koherentnı´ opticke´ syste´my, holografie), - vektorova´ vlnova´ teorie (polarizace a disperze sveˇtla, interference, vlnovody, opticka´ vla´kna), - kvantova´ teorie (interakce opticke´ho za´rˇenı´ s la´tkou, vznik a detekce sveˇtla, vlnove´ smeˇsˇova´nı´), - Maxwellovy rovnice formulovane´ v ra´mci obecne´ teorie relativity (sˇ´ırˇenı´ pole v zakrˇiveny´ch prostorocˇasovy´ch sourˇadnicı´ch, naprˇ. sˇ´ırˇenı´ elektromagneticke´ho pole v gravitacˇnı´m poli cˇerny´ch deˇr). Elektromagneticke´ pole a prostrˇedı´, v neˇmzˇ se sˇ´ırˇ´ı, lze modelovat r˚uzny´mi matematicky´mi metodami na za´kladeˇ jejich vlastnostı´, ktere´ mohou do modelu vstupovat nebo naopak se v neˇm nevyskytovat. Podle vlastnostı´ elektromagneticke´ho pole lze takove´ modely omezit na: - tvar vlnoplochy (idea´lnı´ prˇ´ıpady: vlna rovinna´, sfe´ricka´, gaussovska´, hermitovska´, laguerrovska´, besselovska´), - spektra´lnı´ rozklad (monofrekvencˇnı´, multifrekvencˇnı´), zapocˇtenı´ koherencˇnı´ch a statisticky´ch vlastnostı´ pole. Podle vlastnostı´ prostrˇedı´ se lze zaby´vat sˇ´ırˇenı´m pole v prostrˇedı´, ktere´ m˚uzˇe by´t: - linea´rnı´, nelinea´rnı´, - izotropnı´, anizotropnı´, - homogennı´, nehomogennı´, - ztra´tove´, bezeztra´tove´ (dielektricke´),
6
Vzdeˇla´vacı´ text projektu RCPTM-EDU
- pasivnı´, aktivnı´, - magneticke´, nemagneticke´. Vy´beˇr vhodne´ metody modelova´nı´ take´ za´lezˇ´ı na rozmeˇrech prostrˇedı´ vzhledem k vlnove´ de´lce a na rychlosti zmeˇn charakteristicky´ch cˇasovy´ch a proˇ esˇenı´ se neobejde bez znalosti pocˇa´tecˇnı´ch storovy´ch parametr˚u prostrˇedı´. R a okrajovy´ch podmı´nek.
1.1
Vy´chozı´ prˇedpoklady
Fenomenologicka´ teorie tenky´ch vrstev ve sve´ za´kladnı´ podobeˇ prˇedpokla´da´, zˇe: - Prostrˇedı´ je linea´rnı´, po cˇa´stech homogennı´ (vrstevnate´), anizotropnı´ (s tenzory permitivity ǫ, permeability µ a vodivostı´ σ). - Elektromagneticke´ pole je popsa´no vektorovou vlnovou teoriı´ vycha´zejı´cı´ z Maxwellovy´ch rovnic, ktere´ pro vektory (E, H) intenzity elektricke´ho a magneticke´ho pole a vektory (D, B) elektricke´ a magneticke´ indukce lze formulovat ve tvaru platne´m pro prostrˇedı´ bez na´bojovy´ch zdroj˚u ve tvaru rot E = −
∂B , ∂t
div B = 0,
rot H =
∂D + j, ∂t
div D = 0.
- Interakci elektromagneticke´ho pole s la´tkou popisujı´ materia´love´ vztahy: D = ǫ E,
B = µ H,
j = σE.
- Elektromagneticka´ vlna je rovinna´ a monofrekvencˇnı´, tj. platı´ prˇedpoklad E(r, t) = E(z) exp [i (ωt − (kx x + ky y))] , H(r, t) = H(z) exp [i (ωt − (kx x + ky y))] .
7
(1)
Jaromı´r Krˇepelka: Strucˇny´ u´vod do optiky tenky´ch vrstev
2
Maxwellova-Berremanova rovnice
Smeˇr dopadu rovinne´ elektromagneticke´ vlny necht’urcˇujı´ sfe´ricke´ sourˇadnice ϕ0 a θ0 . Tecˇne´ slozˇky vlnove´ho vektoru jsou
kx =
ω n0 c x , c
ky =
ω n0 c y , c
se smeˇrovy´mi kosiny
cx = cos ϕ0 sin θ0 ,
cy = sin ϕ0 sin θ0 ,
ω je u´hlova´ frekvence sveˇtla, c rychlost sveˇtla ve vakuu, n0 index lomu vneˇjsˇ´ıho prostrˇedı´ (superstra´tu), z neˇhozˇ sveˇtlo na vrstevnate´ prostrˇedı´ dopada´, r = (x, y, z) polohovy´ vektor, t cˇas. Pro tecˇne´ slozˇky rovinne´ vlny (pode´lne´ slozˇky jsou linea´rnı´mi kombinacemi tecˇny´ch slozˇek) odvodı´me z Maxwellovy´ch rovnic
dΨ(z) ω = −i DΨ(z), dz c
kde Berreman˚uv vektor Ψ obsahuje tecˇne´ slozˇky intenzity elektricke´ho a magneticke´ho pole kombinovane´ do prvk˚u stejne´ho fyzika´lnı´ho rozmeˇru √
Ψ(z) =
ε √ 0 µ √ 0 ε √0 − µ0
8
Ex (z) Hy (z) Ey (z) Hx (z)
(2)
Vzdeˇla´vacı´ text projektu RCPTM-EDU
a matice D, neza´visla´ na prostorovy´ch sourˇadnicı´ch, ma´ prvky s obecneˇ komplexnı´mi slozˇkami tenzoru permitivity a permeability D11 D12 D13 D14 D21 D22 D23 D24 D31 D32 D33 D34 D41 D42 D43 D44
2.1
εzx − cyµµzzyz , = − cxεzz 2 = − cεxzzε0 + µµyy0 − µµyzzzµµzy0 , εzy = − cxεzz + cxµµzzyz , = − cxεczzy ε0 − µµyx0 + µµyzzzµµzx0 , c2 µ
= − µyzz0 + εεxx − εεxzzzεεzx , 0 0 cy µzy cx εxz = − εzz − µzz , y µ0 = cxµczz + εεxy0 − εεxzzzεεzy0 , = cyµµzzzx − cyεεzzxz , = cyµµzzxz − cyεεzzzx , = − cxεczzy ε0 − µµxy0 + µµxzzzµµzy0 , εzy = − cyεzz − cxµµzzxz ,
(3)
c2 ε
= − εyzz0 + µµxx − µµxzzzµµzx , 0 0 c x c y µ0 εyx εyz εzx = µzz + ε0 − εzz ε0 , εyz + cxµµzzzy , = − cxεzz 2µ 0 + εεyy0 − εεyzzzεεzy0 , = − cµxzz εyz = − cyεzz − cxµµzzzx .
ˇ esˇenı´ Maxwellovy-Berremanovy rovnice R
Tecˇne´ slozˇky pole lze z Maxwellovy-Berremanovy rovnice zjistit pro kazˇdou k-tou vrstvu, k = 1, . . . , N , metodou rozkladu matice D do soucˇinu Dk = Tk Lk T−1 ˇ nı´ matice (obsahuje ve sloupcı´ch k , kde Tk je impedanc vlastnı´ vektory matice Dk ) a diagona´lnı´ matice Lk ma´ vlastnı´ cˇ´ısla λk,j , j = 1, . . . , 4 lezˇ´ıcı´ na diagona´le matice Dk . Pro transformaci tecˇny´ch slozˇek pole z jedne´ hranice tenke´ vrstvy na druhou pak dostaneme vztah ω Ψk = Tk exp i Lk hk T−1 k Ψk+1 = Mk Ψk+1 , c
(4)
kde Mk je tzv. interferencˇnı´ matice, hk je tlousˇt’ka vrstvy. Pro transformaci tecˇny´ch slozˇek pole celou soustavou tenky´ch vrstev vyuzˇijeme podmı´nky jejich spojitosti na rozhranı´ch, odkud platı´ na´sledujı´cı´ transformacˇnı´ vztah
9
Jaromı´r Krˇepelka: Strucˇny´ u´vod do optiky tenky´ch vrstev
mezi tecˇny´mi slozˇkami pole na hranicı´ch soustavy tenky´ch vrstev Ψ0 =
N Y
Mk ΨN +1 .
(5)
k=1
2.2
Amplitudove´ odrazivosti a propustnosti
Admitancˇnı´ matice substra´tu TN +1 a impedancˇnı´ matice superstra´tu T−1 0 dovolujı´ rozdeˇlit celkove´ elektromagneticke´ pole na jednotlive´ mo´dy, ktery´mi v prˇ´ıpadeˇ izotropnı´ho prostrˇedı´ jsou vlny sˇ´ırˇ´ıcı´ se opacˇny´mi smeˇry prˇ´ıslusˇne´ s a p polarizacı´m. Transformaci teˇchto cˇtyrˇ mo´d˚u Φj soustavou tenky´ch vrstev popisuje prˇenosova´ matice ve tvaru
Φ1I Φ2I Φ3I Φ4I
N Y −1 = T0 Mk TN +1 k=1
Φ1II Φ2II Φ3II Φ4II
= S
Φ1II Φ2II Φ3II Φ4II
,
(6)
s jejı´zˇ pomocı´ se definujı´ amplitudove´ reflexe a transmise, celkem 16 komplexnı´ch velicˇin podle obr. 1.
Obr. 1: Soustava N tenky´ch vrstev, oznacˇenı´ mo´d˚u Naprˇ´ıklad odrazivost 3. mo´du prˇi dopadu 1. mo´du zleva se definuje r13 =
Φ3I , Φ4II = Φ3II = Φ2I = 0. Φ1I
(7)
Z osmi amplitudovy´ch odrazivostı´ a osmi propustnostı´ lze naopak jednoznacˇneˇ rekonstruovat vsˇechny prvky matice prˇenosu S.
10
Vzdeˇla´vacı´ text projektu RCPTM-EDU
2.3
Princip reverzibility
Ne vsˇechny odrazivosti a propustnosti jsou neza´visle´, jak lze odhalit z principu reverzibility. Ten lze odvodit v r˚uzne´ podobeˇ z ekvivalence p˚uvodnı´ soustavy se zrcadloveˇ symetrickou soustavou (podle obr. 2), ktera´ musı´ vykazovat stejne´ prˇ´ıslusˇne´ amplitudove´ reflexe a transmise.
Obr. 2: Soustava N tenky´ch vrstev, oznacˇenı´ mo´d˚u v zrcadloveˇ symetricke´ soustaveˇ S uva´zˇenı´m vlastnostı´ inverznı´ch interferencˇnı´ch matic a porovna´nı´m prvk˚u matice prˇenosu jako funkce index˚u n = (n1 , n2 , . . . , nN ), dostaneme s11 (n) = s∗22 (n∗ ), s12 (n) = s∗21 (n∗ ).
(8)
Je-li matice prˇenosu q funkcı´ fa´zovy´ch tlousˇteˇk vrstev ϕ = (ϕ1 , ϕ2 , . . . , ϕN ), 2π pak ϕk = λ hk n2k − (n0 sin θ0 )2 , s11 (ϕ) = s22 (−ϕ), s12 (ϕ) = s21 (−ϕ).
(9)
Zjednodusˇenı´ nastane v prˇ´ıpadeˇ bezeztra´tovy´ch dielektricky´ch vrstev, pro ktere´ s11 = s∗22 , s12 = s∗21 . (10) V prˇ´ıpadeˇ bezeztra´tove´ho prostrˇedı´ se potom pocˇet rea´lny´ch parametr˚u snı´zˇ´ı na 3 (nebot’ navı´c det S = YN +1 /Y0 ) a matici prˇenosu lze skutecˇneˇ vyja´drˇit pouze trˇemi rea´lny´mi cˇ´ısly: 1 S = q Y0 /YN +1 (1 − |rR |2 ) exp(iδt ) ×
1 −|rR | exp [i(2δt − δr + π)] |rR | exp (iδr ) exp(i2δt )
11
!
,
Jaromı´r Krˇepelka: Strucˇny´ u´vod do optiky tenky´ch vrstev
kde q
rR = |rR | exp(iδr ), tR = Y0 /YN +1 (1 − |rR |2 ) exp(iδt ), rL = |rR | exp [i(2δt − δr + π)] , tL = YN +1 /Y0 tR . Admitance prostrˇedı´ jsou definova´ny jako pomeˇry tecˇny´ch slozˇek intenzity magneticke´ho a elektricke´ho pole. Pro prostrˇedı´ k-te´ izotropnı´ vrstvy platı´ q n2k − (n0 cos θ0 )2 pro s polarizaci, 1 n2k Yk = (11) q pro p polarizaci, Z0 2 2 nk − (n0 cos θ0 ) q
Z0 = µ0 /ǫ0 je impedance vakua spocˇtena´ z permitivity µ0 a permeability ǫ0 vakua. Ekvivalentnı´ vyja´drˇenı´ tohoto principu reverzibility ve tvaru platne´m pro bezeztra´tova´ prostrˇedı´ je rR rR∗ + tR t∗L = 1, rR t∗R + tR rL∗ = 0.
(12)
Pro ztra´tova´ prostrˇedı´ s komplexnı´mi indexy lomu dostaneme formulace s explicitnı´m vyja´drˇenı´m za´vislosti na indexech lomu nebo fa´zovy´ch tlousˇt’ka´ch vrstev rR (n)rR∗ (n∗ ) + tR (n)t∗L (n∗ ) = 1, rR (n)t∗R (n∗ ) + tR (n)rL∗ (n∗ ) = 0.
(13)
rR (ϕ)rR (−ϕ) + tR (ϕ)tL (−ϕ) = 1, rR (ϕ)tR (−ϕ) + tR (ϕ)rL (−ϕ) = 0.
(14)
Podobne´ vy´razy lze odvodit ze stejne´ho principu i pro anizotropnı´ vrstevnate´ syste´my, naprˇ´ıklad pro matici prˇenosu bezeztra´tovy´ch anizotropnı´ch vrstev platı´ (SK)∗ = KS, (15) kde
K=
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
.
Vztahy pro izotropnı´ vrstvy jsou zvla´sˇtnı´m prˇ´ıpadem poslednı´ relace.
12
(16)
Vzdeˇla´vacı´ text projektu RCPTM-EDU
2.4
Vy´konove´ odrazivosti a propustnosti
Pro prˇenos vy´konu (z neˇhozˇ lze usuzovat na absorbci) soustavou tenky´ch vrstev jsou rozhodujı´cı´ norma´love´ slozˇky Poyntingova vektoru jednotlivy´ch mo´d˚u, jejichzˇ strˇednı´ cˇasove´ hodnoty se vyja´drˇ´ı z tecˇny´ch slozˇek pole c P z (z) = Ψ† (z)S1 Ψ(z), 4
(17)
kde matice
S1 =
0 1 0 0
1 0 0 0
0 0 0 1
0 0 1 0
.
(18)
Pro kazˇdy´ mo´d α = 1, . . . , 4 norma´love´ slozˇky Poyntingova vektoru elektromagneticke´ho pole sˇ´ırˇ´ıcı´ho se prostrˇedı´m superstra´tu a substra´tu platı´ Pz,αI = 4c Φ†αI T†0 S1 T0 ΦαI , Pz,αII = 4c Φ†αII T†N +1 S1 TN +1 ΦαII .
(19)
S vyuzˇitı´m tohoto vztahu a ze znalosti transformace tecˇny´ch slozˇek pole jednotlivy´ch mo´d˚u lze definovat vy´konove´ odrazivosti a propustnosti, tj. velicˇiny meˇrˇene´ kvadraticky´mi detektory. Celkem zı´ska´me 16 rea´lny´ch velicˇin, z nichzˇ lze naopak sestavit matici N prˇena´sˇejı´cı´ norma´love´ slozˇky jednotlivy´ch mo´d˚u.
2.5
Pz,1I Pz,2I Pz,3I Pz,4I
= N
Pz,1II Pz,2II Pz,3II Pz,4II
.
(20)
Tenke´ versus tluste´ vrstvy
Idea´lnı´ tenke´ vrstvy jsou teoreticky specia´lnı´m prˇ´ıpadem, kdy se vy´sledku meˇrˇenı´ intenzity sveˇtla (norma´love´ slozˇky Poyntingova vektoru) u´cˇastnı´ dokonale interferujı´cı´ amplitudy vsˇech vnitrˇneˇ odrazˇeny´ch vln. Druhy´m krajnı´m prˇ´ıpadem jsou idea´lnı´ tluste´ vrstvy, kdy vy´sledek meˇrˇenı´ urcˇuje soucˇet intenzit dı´lcˇ´ıch odrazˇeny´ch vln, nebot’k interferenci v˚ubec nedocha´zı´.
13
Jaromı´r Krˇepelka: Strucˇny´ u´vod do optiky tenky´ch vrstev
V tomto prˇ´ıpadeˇ transformaci norma´lovy´ch slozˇek Poyntingova vektoru urcˇuje diagona´lnı´ matice s u´tlumovy´mi faktory ω Uj = exp − |Im(λj − λ∗j )|hj c
ve tvaru
1 U1 0 0 0
N=
0 0 0 1 U2 0 0 0 U3 0 0 0 U4
.
(21)
V prˇ´ıpadeˇ kombinace strˇ´ıdajı´cı´ch se soustav tenky´ch a tlusty´ch vrstev s maticemi prˇenosu norma´lovy´ch slozˇek Poyntingova vektoru lze zı´skat vy´sledne´ odrazivosti a propustnosti z celkove´ matice jakozˇto soucˇinu dı´lcˇ´ıch matic: N = N1 N2 . . . N2p+1 . (22) Liche´ indexy zde oznacˇujı´ soustavy tenky´ch vrstev, sude´ indexy tluste´ vrstvy. Kazˇda´ z podsoustav m˚uzˇe by´t pra´zdna´, p+1 je pocˇet soustav tenky´ch vrstev, p je pocˇet tlusty´ch vrstev:
2.6
Vrstvy v cˇa´stecˇneˇ koherentnı´m sveˇtle
Prˇi vy´pocˇtu makroskopicky´ch parametr˚u (odrazivostı´ a reflexı´) lze v prˇ´ıpadeˇ cˇa´stecˇneˇ koherentnı´ho sveˇtla vyjı´t z pojmu normalizovane´ spektra´lnı´ hustoty za´rˇenı´ g(ν), ν je frekvence za´rˇenı´, cozˇ je funkce s vlastnostı´ Z
∞
g(ν)dν = 1.
(23)
0
Naprˇ´ıklad vy´slednou vy´konovou odrazivost ρ meˇrˇenou detektorem spektra´lneˇ vsˇude stejneˇ citlivy´m lze pak pocˇ´ıtat ze spektra´lneˇ za´visly´ch odrazivostı´ ρ(ν) va´zˇeny´m integra´lem ρ=
Z
∞
g(ν)ρ(ν)dν.
(24)
0
Analyticke´ vy´sledky lze najı´t v uzavrˇene´m tvaru naprˇ. pro jednu vrstvu s vyuzˇitı´m Fourierovy transformace spektra´lnı´ hustoty za´rˇenı´ na vza´jemnou korelacˇnı´ funkci za´rˇenı´ (Wiener˚uv-Chincˇin˚uv teore´m).
14
Vzdeˇla´vacı´ text projektu RCPTM-EDU
3
Prˇ´ıklady analy´zy a synte´zy
Na obr. 3 je zna´zorneˇna odrazivost rozhranı´ dvou prostrˇedı´ v za´vislosti na u´hlu dopadu pro prˇ´ıpad odrazu z prostrˇedı´ opticky rˇidsˇ´ıho (vlevo) a z prostrˇedı´ opticky hustsˇ´ıho (vpravo). Trˇi krˇivky se vztahujı´ k s a p polarizacˇnı´mu stavu dopadajı´cı´ vlny a nepolarizovane´mu sveˇtlu. V druhe´m prˇ´ıpadeˇ nasta´va´ pro u´hly dopadu veˇtsˇ´ı nezˇ je u´hel tota´lnı´ reflexe. Odrazivost jednoducheho rozhrani
Odrazivost jednoducheho rozhrani
1
1
0.9
0.9
0.8
0.8
0.6
modra − s polarizace cervena − p polarizace cerna − prumer s a p
0.5
rozhrani indexu lomu 1,00/1,52
0.6
modra − s polarizace cervena − p polarizace cerna − prumer s a p
0.5
rozhrani indexu lomu 1,52/1,00
0.7 odrazivost
odrazivost
0.7
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
10
20
30
40
50
60
70
80
90
o
θ0 [ ]
0
0
10
20
30
40
50
60
o
θ0 [ ]
Obr. 3: Odrazivost rozhranı´ dvou izotropnı´ch materia´l˚u v za´vislosti na u´hlu dopadu ´ cˇinek jedne´ tenke´ vrstvy na odrazivost v za´vislosti na vlnove´ de´lce U zna´zornˇuje obr. 4. Vlevo velikost indexu lomu vrstvy lezˇ´ı mezi indexy lomu substra´tu a superstra´tu a takove´ impedancˇnı´ prˇizp˚usobenı´ snizˇuje odrazivost pod hodnotu odrazivosti pouhe´ho substra´tu, na rozdı´l od situace vpravo, kdy naopak docha´zı´ ke zvy´sˇenı´ odrazivosti. Opticka´ tlousˇt’ka vrstvy je uvedena v na´sobcı´ch jednotkove´ opticke´ tlousˇt’ky ∆. Tenka´ vrstvy v sˇikme´m dopadu ma´ podobne´ chova´nı´, avsˇak rozsˇteˇpene´ podle orientace vektoru intenzity elektricke´ho pole vzhledem k rovineˇ dopadu, jak ukazuje obr. 5. Lze pozorovat, zˇe p polarizovana´ vlna vykazuje v cele´m rozsahu vlnovy´ch de´lek nizˇsˇ´ı odrazivost. K zı´ska´nı´ nulove´ reflexe na jedne´ vlnove´ de´lce dveˇma vrstvami s urcˇeny´mi indexy lomu potrˇebujeme spocˇ´ıtat vhodne´ tlousˇt’ky vrstev. V takove´m prˇ´ıpadeˇ existujı´ dveˇ rˇesˇenı´, jak ukazuje obr. 6 vlevo, z nichzˇ jedno ma´ poneˇkud plosˇsˇ´ı pr˚ubeˇh odrazivosti na vlnove´ de´lce. Vpravo je vy´sledek optimalizace soustavy dvou vrstev s pozˇadavkem na co nejmensˇ´ı odrazivost v sˇirsˇ´ı oblasti viditelne´ cˇa´sti spektra.
15
Jaromı´r Krˇepelka: Strucˇny´ u´vod do optiky tenky´ch vrstev
Odrazivost jedne tenke vrstvy v kolmem dopadu
Odrazivost jedne tenke vrstvy v kolmem dopadu
0.34
0.024
0.33 0.022
0.32 nL=1,38, 1/L/1,52, ∆ = 137,5 nm
0.31 odrazivost
odrazivost
0.02
0.018
0.3 nH=2,35, 1/H/1,52, ∆ = 137,5 nm
0.29 0.28
0.016
0.27 0.014
0.26 0.012 400
450
500
550 λ [nm]
600
650
0.25 400
700
450
500
550 λ [nm]
600
650
700
Obr. 4: Spektra´lnı´ odrazivost jedne´ tenke´ vrstvy Odrazivost jedne tenke vrstvy v sikmem dopadu
Odrazivost jedne tenke vrstvy v sikmem dopadu
0.06
0.05
0.5 modra − s polarizace cervena − p polarizace cerna − prumer s a p
0.45
0.4 odrazivost
odrazivost
0.04
0.03
modra − s polarizace cervena − p polarizace cerna − prumer s a p
0.35
0.3
0.02 0.25 0.01
0 400
o
nL=1,38, 1/L/1,52, ∆ = 137,5 nm, θ = 45
450
500
550 λ [nm]
600
0.2
650
700
400
n =2,35, 1/H/1,52, ∆ = 137,5 nm, θ = 45o H
450
500
550 λ [nm]
600
650
700
Obr. 5: Spektra´lnı´ odrazivost tenke´ vrstvy v sˇikme´m dopadu S pomocı´ trˇ´ı r˚uzny´ch materia´l˚u lze zı´skat protiodraznou soustavu s daleko plosˇsˇ´ım a sˇirsˇ´ım pa´smem nı´zke´ odrazivosti, jak zna´zornˇuje obr. 7. Idea´lnı´ trˇetı´ krˇivka s hodnotami odrazivosti hluboko pod jednou desetinou procenta se ty´ka´ soustavy trˇ´ı λ/4 vrstev s indexy lomu (technologicky zpravidla nedostupny´mi) zajisˇt’ujı´cı´mi co nejplosˇsˇ´ı pr˚ubeˇh odrazivosti v okolı´ zvolene´ pracovnı´ vlnove´ de´lky. Periodicke´ soustavy tenky´ch vrstev, strˇ´ıdajı´cı´ v nejjednodusˇsˇ´ım prˇ´ıpadeˇ dva materia´ly s r˚uzny´mi indexy lomu, vykazujı´ (podobneˇ jako vsˇechna periodicka´ prostrˇedı´) zaka´zane´ pa´smo, to je v opticke´ oblasti pa´smo zvy´sˇene´ odrazivosti, jak lze videˇt z obr. 8 pro soustavu vrstev, jejichzˇ opticke´ tlousˇt’ky jsou vsˇechny λ/4. Tento teoreticky´ vy´sledek lze numericky optimalizovat tak, aby byla
16
Vzdeˇla´vacı´ text projektu RCPTM-EDU
Antireflektovani dvema tenkymi vrstvami
Antireflektovani dvema tenkymi vrstvami
0.1
0.1
0.09
modra − nL=1,38, nH=2,35, 1/0,702L 1,801H/1,52, ∆ = 137,5 nm
0.09
0.08
cervena − nL=1,38, nH=2,35, 1/1,298L 0,199H/1,52, ∆ = 137,5 nm
0.08 0.07 odrazivost
odrazivost
0.07
nL=1,38, nH=2,35, 1/1,193L 0,125H/1,52, ∆ = 137,5 nm
0.06 0.05
0.06 0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
0 400
450
500
550 λ [nm]
600
650
700
0 400
450
500
550 λ [nm]
600
650
700
Obr. 6: Spektra´lnı´ odrazivost dvou antireflektujı´cı´ch vrstev vyhlazena bocˇnı´ maxima, jejichzˇ pocˇet je u´meˇrny´ pocˇtu vrstev. Spektra´lnı´ odrazivost takto vyhlazene´ho filtru ukazuje obr. 9. Zobrazena´ soustava ma´ slozˇenı´ (relativnı´ opticke´ tlousˇt’ky vrstev jsou v na´sobcı´ch jednotkove´ opticke´ tlousˇt’ky 136,3636 nm): 1/0,614L 1,829H 0,150L 0,423H 1,655L 0,225H 1,729L 0,230H 1,720L 0,247H 1,704L 0,266H 1,692L 0,291H 1,683L 0,298H 1,680L 0,295H 1,681L 0,297H 1,677L 0,306H 1,674L 0,307H 1,680L 0,295H 1,690L 0,280H 1,704L 0,274H 1,722L 0,265H 1,742L 0,246H 1,777L 0,211H 1,815L 0,166H 1,848L 0,149H 1,630L/1,52, indexy lomu vrstev nL = 1,38 a nH = 2,35 a podlozˇky ns = 1,52.
4
Metody synte´zy tenky´ch vrstev
Pro synte´zu soustav tenky´ch vrstev lze prˇedevsˇ´ım vyuzˇ´ıt: - vkla´da´nı´ λ/2 vrstev a tzv. buffer vrstev souvisejı´cı´ch s vnitrˇnı´ antireflexı´, ktere´ nemeˇnı´ makroskopicke´ parametry na pracovnı´ vlnove´ de´lce, avsˇak meˇnı´ je v jejı´m okolı´, - Herpinova teore´mu o ekvivalenci symetricke´ soustavy tenky´ch vrstev s jednou vrstvou s efektivnı´m indexem lomu a efektivnı´ fa´zovou tlousˇt’kou, - analyticky´ch vy´sledk˚u teorie (naprˇ. antireflektova´nı´ jednou vrstvou, dveˇma vrstvami, procedura vy´pocˇtu maxima´lneˇ ploche´ antireflexe,
17
Jaromı´r Krˇepelka: Strucˇny´ u´vod do optiky tenky´ch vrstev
Antireflektovani tremi tenkymi vrstvami 0.05 0.045 0.04
nL=1,38, nH=2,35, nM=1,9, ∆ = 137,5 nm modra: 1/0,943L 1,649H 0,581M/1,52
odrazivost
0.035 0.03 0.025
cervena: 1/1,065L 0,327H 1,435M/1,52 nA=1,054, nB=1,233, nC=1,442, ∆ = 137,5 nm zelena: 1/1A 1B 1C/1,52
0.02 0.015 0.01 0.005 0 400
450
500
550 λ [nm]
600
650
700
Obr. 7: Spektra´lnı´ odrazivost trˇ´ı antireflektujı´cı´ch vrstev, srovna´nı´ s maxima´lneˇ plochou antireflexı´ formule pro sˇ´ırˇku pa´sma a velikost potlacˇene´ propustnosti periodicke´ soustavy tenky´ch vrstev apod.), - aproximativnı´ch rozvoj˚u (Furman˚uv rozvoj aj.), - numericky´ch metod, vcˇetneˇ optimalizacˇnı´ch metod vesmeˇs zalozˇeny´ch na hleda´nı´ minima cı´love´ funkce vı´ce promeˇnny´ch (simplexova´ metoda, Levenberg˚uv-Marquardt˚uv algoritmus, metoda konjugovane´ho gradientu, metoda promeˇnne´ metriky, Newtonova metoda tecˇny´ch hyperploch, evolucˇnı´ a geneticke´ algoritmy aj.)
5
Souhrn
V prˇ´ıspeˇvku je naznacˇeno, jak - spocˇ´ıtat amplitudove´ a vy´konove´ odrazivosti a propustnosti libovolne´ soustavy tenky´ch a tlusty´ch vrstev v obecne´m prˇ´ıpadeˇ anizotropnı´ch prostrˇedı´, - princip reverzibility omezuje pocˇet volny´ch parametr˚u pro jednoznacˇne´ urcˇenı´ meˇrˇitelny´ch makroskopicky´ch velicˇin, - se projevı´ interference cˇa´stecˇneˇ koherentnı´ho sveˇtla na meˇrˇeny´ch makroskopicky´ch parametrech.
18
Vzdeˇla´vacı´ text projektu RCPTM-EDU
Odrazivost periodicke soustavy tenkych vrstev 1 0.9 n =1,38, n =2,35 L
0.8
H
20
1/(0,352L 1,623H) ∆ = 136,3636 nm
0,352L/1,52
odrazivost
0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 300
350
400
450
500 λ [nm]
550
600
650
700
Obr. 8: Spektra´lnı´ odrazivost periodicke´ soustavy tenky´ch vrstev Odrazivost soustavy tenkych vrstev 1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
odrazivost
odrazivost
Odrazivost soustavy tenkych vrstev 1
0.5 0.4
0.5 0.4
0.3
0.3
0.2
0.2
0.1
0.1
0 300
350
400
450
500 λ [nm]
550
600
650
700
modra − s polarizace cervena − p polarizace cerna − prumer s a p
0 300
350
400
450
500 λ [nm]
550
600
650
700
Obr. 9: Spektra´lnı´ odrazivost numericky vyhlazene´ho filtru Bylo uvedeno neˇkolik prˇ´ıklad˚u aplikace teorie na - antireflektova´nı´ jednou a vı´ce vrstvami, vcˇetneˇ maxima´lneˇ plochy´ch antireflexı´, - na´vrh vysoce odrazny´ch vrstev s potlacˇeny´mi bocˇnı´mi maximy odrazivosti a nakonec byly hesloviteˇ shrnuty neˇktere´ prˇ´ıstupy k synte´ze soustav tenky´ch vrstev.
19
Jaromı´r Krˇepelka: Strucˇny´ u´vod do optiky tenky´ch vrstev
Literatura [1] Knittl Z.: Optics of thin films, John Wiley & Sons, London – New York – Sydney – Toronto 1976. [2] Krˇepelka J.: Optika tenky´ch vrstev, Univerzita Palacke´ho v Olomouci, 1993
20
Vzdeˇla´va´nı´ vy´zkumny´ch pracovnı´ku˚ v Regiona´lnı´m centru pokrocˇily´ch technologiı´ a materia´lu˚. CZ.1.07/2.3.00/09.0042 1
Omezenı´ volny´ch parametru˚ soustavy tenky´ch vrstev v du˚sledku principu reverzibility Jaromı´r Krˇepelka Abstrakt. V prˇ´ıspeˇvku jsou naznacˇena ideova´ vy´chodiska pro hodnocenı´ platnosti fyzika´lnı´ch za´konu˚ prˇi obra´cenı´ chodu v rea´lny´ch soustava´ch obecneˇ a specia´lneˇ pak jako tzv. princip reverzibility v soustava´ch tenky´ch vrstev. Jsou uka´za´ny du˚sledky tohoto principu pro soustavy tenky´ch dielektricky´ch (bezeztra´tovy´ch) vrstev, ale take´ vrstev ztra´tovy´ch s imagina´rnı´m indexem lomu, ktere´ se projevı´ ve snı´zˇenı´ pocˇtu parametru˚ dovolujı´cı´ch u´plny´ popis makroskopicky´ch parametru˚ soustav tenky´ch vrstev.
´ vod U
1
Invarianci fyzika´lnı´ch za´konu˚ vu˚cˇi otocˇenı´ chodu cˇasu na fyzika´lneˇ-matematicke´ u´rovni formuloval v roce 1849 George Stokes v principu reverzibility. Podle neˇj, zameˇnı´me-li v soustaveˇ cˇa´stic, v nı´zˇ sı´ly za´visejı´ pouze na jejich poloze, zname´nka rychlostı´, budou se cˇa´stice pohybovat po stejny´ch draha´ch, ale v opacˇne´m smeˇru. To je zrˇejmy´ du˚sledek invariantnosti pohybovy´ch rovnic, naprˇ´ıklad Newtonova gravitacˇnı´ho za´kona, vu˚cˇi za´meˇneˇ chodu cˇasu t → −t. Skutecˇneˇ, kdybychom si pustili film zaznamena´vajı´cı´ naprˇ. pohyb planety kolem Slunce pozpa´tku, nezpozorovali bychom nic nerealisticke´ho, azˇ na to, zˇe by Slunce vycha´zelo na za´padeˇ a zapadalo na vy´chodeˇ. Proble´my by ovsˇem nastaly, pokud bychom chteˇli mezi gravitacˇnı´ jevy zahrnout slapove´ sı´ly (prˇ´ıliv nelze zameˇnit za odliv, vzdalova´nı´ Meˇsı´ce 1
ˇ eske´ republiky. Projekt je spolufinancova´n Evropsky´m socia´lnı´m fondem a sta´tnı´m rozpocˇtem C
21
Jaromı´r Krˇepelka: Omezenı´ volny´ch parametru˚...
od Zemeˇ za jeho prˇiblizˇova´nı´, prodluzˇova´nı´ dne o 15 µs/rok za jeho zkracova´nı´), cˇi existenci gravitonu˚ prˇedpovı´dany´ch obecnou teoriı´ relativity. Prˇitom vsˇechny za´kladnı´ fyzika´lnı´ za´kony jsou invariantnı´ vu˚cˇi obra´cenı´ chodu cˇasu. Od zmeˇny zname´nka cˇasu je trˇeba rozlisˇovat invarianci fyzika´lnı´ch za´konu˚ vu˚cˇi posunutı´ v cˇase, jejı´mzˇ du˚sledkem je za´kon zachova´nı´ energie, a invarianci vzhledem k posunutı´ v prostoru vedoucı´ k zachova´nı´ hybnosti. Specia´lnı´ teorie relativity obeˇ invariance sjednocuje a vede k zachova´nı´ cˇtyrˇhybnosti. Fyzika´lnı´ za´kony jsou tedy invariantnı´ vzhledem k posunutı´ v cˇasoprostoru, pokud ovsˇem nebereme v u´vahu velky´ trˇesk a rozpı´na´nı´ vesmı´ru. Zkusˇenost na´m ukazuje, zˇe procesy rea´lneˇ obra´tit nelze, nehledeˇ na to, zˇe obra´tit chod cˇasu a vra´tit se do minulosti, na rozdı´l od mozˇne´ cesty do budoucnosti po uzavrˇene´ trajektorii vysokou rychlostı´ prˇ´ıpousˇteˇne´ teoriı´ relativity, nelze vu˚bec. Film zachycujı´cı´ pa´d sklenice ze stolu a jejı´ roztrˇ´ısˇteˇnı´ o podlahu pusˇteˇny´ pozpa´tku vyvola´ u diva´ka u´smeˇv, stejneˇ jako skokan do vody vyskakujı´cı´ zpeˇt na odrazne´ prkno, prˇestozˇe existujı´ na´zory podporˇene´ Poincare´ho rekurzı´vnı´m teore´mem (Poincare´ recurrence theorem), zˇe budeme-li dosti dlouho cˇekat, pak se v konzervativnı´m syste´mu docˇka´me libovolneˇ blı´zke´ho na´vratu do vy´chozı´ho stavu. V nasˇem zˇivoteˇ jsou vsˇechny deˇje nevratne´, jak ukazujı´ na´sledky dopravnı´ch nehod, a teˇzˇko budeme na´sledovat obyvatele Puntanely ze zna´me´ho televiznı´ho seria´lu a sta´rnout od sta´rˇ´ı smeˇrem k mla´dı´. Je te´meˇrˇ jiste´, zˇe cestova´nı´ v cˇase zpeˇt mozˇne´ nenı´, i kdyzˇ existujı´ kurio´znı´ prˇedstavy o vyuzˇitı´ naprˇ. cˇervı´ch deˇr pro tento u´cˇel. Jestlizˇe bychom sledovali jednotlive´ molekuly vonne´ la´tky expandujı´cı´ z otevrˇene´ lahvicˇky do mı´stnosti, videˇli bychom na mikroskopicke´ u´rovni vratny´ proces pruzˇny´ch sra´zˇek mikrocˇa´stic popsatelny´ cˇasoveˇ symetricky´mi pohybovy´mi rovnicemi, takzˇe i cely´ proces, jehozˇ se u´cˇastnı´ velke´ mnozˇstvı´ cˇa´stic, by meˇl by´t rovneˇzˇ vratny´. Matematicky proble´m v tomto prˇ´ıpadeˇ mu˚zˇe spocˇ´ıvat v pozˇadavku na dokonale prˇesne´ nastavenı´ pocˇa´tecˇnı´ch podmı´nek v situaci, kdy vy´sledek je znacˇneˇ citlivy´ na jejich male´ zmeˇny. Kdybychom pro jisty´ okamzˇik odecˇetli pocˇa´tecˇnı´ podmı´nky a rˇesˇili pohybove´ rovnice s dostatecˇnou prˇesnostı´, dostali bychom v opacˇne´ cˇasove´ posloupnosti stejne´ polohy cˇa´stic a jejich hybnosti. Potı´zˇ je pra´veˇ s dostatecˇneˇ prˇesny´m nastavenı´m oneˇch pocˇa´tecˇnı´ch podmı´nek pro zpeˇtny´ proces, cozˇ je prakticky nemozˇne´ vzhledem k tomu, zˇe by to vyzˇadovalo
22
Vzdeˇla´vacı´ text projektu RCPTM-EDU
ohromnou souhru a koordinaci na mikroskopicke´ u´rovni. Procesy, ktery´ch se u´cˇastnı´ velky´ pocˇet prvku˚ (trˇeba sra´zˇky atomu˚ cˇi molekul v plynu), tak vykazujı´ nahodilost, ktera´ se projevuje jako chaos, tato znacˇna´ citlivost vy´voje slozˇiteˇjsˇ´ıch syste´mu˚ na pocˇa´tecˇnı´ch podmı´nka´ch se nazy´va´ deterministicky´ chaos (stochasticky´ chaos vznika´ jako du˚sledek vneˇjsˇ´ıch neprˇedvı´datelny´ch za´sahu˚) a zajisˇt’uje prˇesypa´va´nı´m mı´cˇku˚ v osudı´ vy´hru jen na´hodny´m vy´hercu˚m cˇi sta´lou kritiku meteorologu˚ za chybnou prˇedpoveˇd’ pocˇası´. Vy´pocˇty podobne´ho druhu jsou zalozˇeny na prˇedpokladu existence rˇesˇenı´ prˇ´ıslusˇny´ch diferencia´lnı´ch rovnic v oboru rea´lny´ch cˇ´ısel. Ve skutecˇnosti, vzhledem k diskre´tnı´ strukturˇe hmoty, nic nelze donekonecˇna zjemnˇovat a vzhledem k Heisenbergoveˇ principu neurcˇitosti ani nic nekonecˇneˇ prˇesneˇ meˇrˇit.
Pozorujeme, zˇe stavy, ktere´ byly na zacˇa´tku usporˇa´dane´, jsou-li ponecha´ny samy sobeˇ, prˇejdou dı´ky nahodilosti prˇi sra´zˇka´ch do stavu neusporˇa´dane´ho. Prˇipomenˇme v te´to souvislosti 2. termodynamicky´ za´kon a jednu z jeho formulacı´ ve tvaru neklesajı´cı´ entropie izolovane´ho syste´mu, ktery´ sˇipku cˇasu umı´ rozlisˇit. Jina´ z ekvivalentnı´ch definic entropie vyuzˇ´ıva´ pojmu logaritmicke´ mı´ry usporˇa´danosti energie v soustaveˇ, ktera´ souvisı´ s pocˇtem ru˚zny´ch zpu˚sobu˚, ktery´mi lze dosa´hnout urcˇite´ho rozdeˇlenı´. Pro vysveˇtlenı´ te´to za´hady bylo navrzˇeno, zˇe za´kladnı´ za´kony by ve skutecˇnosti nemeˇly by´t symetricke´, naprˇ´ıklad se argumentuje tı´m, zˇe Maxwellovy rovnice majı´ vadu, protozˇe vedle tzv. retardovany´ch vln prˇipousˇteˇjı´ i vlny advancovane´, ktere´ porusˇujı´ princip kauzality. Rovneˇzˇ meˇrˇenı´ v kvantove´ mechanice je nevratny´ proces, prˇestozˇe (relativisticka´) Schro¨dingerova rovnice je vzhledem k cˇasu symetricka´. Spı´sˇe bychom si meˇli uveˇdomit, zˇe pouze znalost fyzika´lnı´ch za´konu˚ nevede ihned k pochopenı´ slozˇity´ch prˇ´ırodnı´ch deˇju˚.
Prˇ´ıcˇinnost (odezva na´sleduje prˇ´ıcˇinu) vyzˇaduje, aby reakce na podneˇty byly matematicky popsa´ny holomorfnı´mi funkcemi, tedy funkcemi, ktere´ majı´ derivaci v oboru komplexnı´ch funkcı´. Nenulovost imagina´rnı´ cˇa´sti funkcı´ (jejich Fourierovy obrazy) popisujı´cı´ch odezvu prostrˇedı´ na podneˇt (v optice jsou to velicˇiny susceptibilita, permitivita, index lomu) zase souvisejı´ s disipacı´ energie a protozˇe prakticky zˇa´dny´ deˇj neprobı´ha´ bez ztra´ty energie, lze se domnı´vat, zˇe je mozˇno nevratnost take´ zjednodusˇeneˇ zna´zornit
23
Jaromı´r Krˇepelka: Omezenı´ volny´ch parametru˚...
kauzalita → holomorfnı´ funkce odezvy → disipace energie → neklesa´nı´ entropie → smeˇrova´nı´ cˇasu.
2
Reverzibilita v optice
Zda´ se, zˇe v souvislosti s obra´cenı´m toku cˇasu by bylo trˇeba objasnit neˇkolik okolnostı´: - invariance Maxwellovy´ch rovnic vzhledem k inverzi cˇasu, - CPT symetrie aplikovana´ na Maxwellovy rovnice, - Lorentzu˚v vztah vza´jemnosti, - parita elektromagneticke´ho pole - fotonu, - entropie elektromagneticke´ho pole - fotonu, 2. termodynamicky´ za´kon, - princip kauzality, - deterministicky´ chaos. Prosta´ inverze cˇasu v opticke´ soustaveˇ Na hornı´ polovineˇ obra´zku obr. 1 vidı´me, zˇe pouhy´m obra´cenı´m chodu cˇasu se odrazˇena´ vlna vracı´ zpeˇt k rozhranı´ a prosˇla´ vlna vstupuje zpa´tky do opticke´ soustavy tak, zˇe se zkombinujı´ na vystupujı´cı´ pu˚vodneˇ dopadajı´cı´ vlnu. Spra´vneˇ rekonstruovanou prosˇlou vlnu dostaneme pouze tehdy, jestlizˇe opticke´ prostrˇedı´ nenı´ absorbujı´cı´. Situaci mu˚zˇe zachra´nit jen to, zˇe prostrˇedı´ zmeˇnı´me z pasivnı´ho na aktivnı´, cozˇ je ekvivalentnı´ zmeˇneˇ zname´nka imagina´rnı´ cˇa´sti indexu lomu. Zara´zˇejı´cı´ je i velmi specia´lnı´ okrajova´ podmı´nka pro velikosti amplitud dvou vln vstupujı´cı´ch z opacˇny´ch stran do opticke´ soustavy. Podobna´ u´vaha platı´ i pro situaci ve spodnı´ polovineˇ obra´zku, kde naopak je trˇeba uva´zˇit zmeˇnu zname´nka indexu lomu prostrˇedı´ pro vlnu vstupujı´cı´ do opticke´ soustavy zleva. Situaci komplikujı´ jesˇteˇ ad hoc pozˇadavky na soucˇasne´ komplexnı´ sdruzˇenı´ amplitud pole. Transformaci slozˇek pole optickou soustavu s maticı´ prˇenosu S podle obr. 2 popisujı´ na´sledujı´cı´ vztahy
24
Vzdeˇla´vacı´ text projektu RCPTM-EDU
Obr. 1: Pole prˇi proste´m obra´cenı´ chodu cˇasu
EtRI EtLI
!
=S
EtRII EtLII
!
EtLI EtRI
,
!
=S
EtLII EtRII
!
.
(1)
Za prˇedpokladu soucˇasne´ platnosti obou vztahu˚ dostaneme pro prvky matice prˇenosu nespra´vny´ pozˇadavek s22 = s11 a s21 = s12 . Vy´sledkem te´to u´vahy je, zˇe prosta´ inverze cˇasu nevede ke spra´vne´ formulaci principu reverzibility. Vyjdeˇme z Maxwellovy´ch rovnic platny´ch pro elektromagneticke´ pole v izotropnı´m prostrˇedı´ ve tvaru rotE = −µ ∂H div(µH) = 0, ∂t , ∂E rotH = σE + ǫ ∂t , div(ǫE) = ρ.
(2)
Nejdrˇ´ıve si vsˇimneˇme, zˇe jejich cˇasto diskutovane´ teoreticke´ rˇesˇenı´ ve tvaru fyzika´lneˇ nerealisticke´ monofrekvencˇnı´ (s kruhovou frekvencı´ ω) rovinne´ vlny v izotropnı´m absorbujı´cı´m prostrˇedı´ s indexem lomu n = η ± iκ, η, κ ≥ 0, za´lezˇ´ı na tom, zda volı´me cˇasovou za´vislost exp(iωt) nebo exp(−iωt). V prve´m prˇ´ıpadeˇ je nutno volit imagina´rnı´ cˇa´st indexu lomu odvozenou od vodivosti prostrˇedı´ nekladnou, v druhe´m prˇ´ıpadeˇ naopak
25
Jaromı´r Krˇepelka: Omezenı´ volny´ch parametru˚...
Obr. 2: Transformace pole prˇi proste´m obra´cenı´ chodu cˇasu neza´pornou, aby platilo, zˇe obeˇ prˇ´ıpustne´ vlny, sˇ´ırˇ´ıcı´ se opacˇny´mi smeˇry, jsou v pasivnı´m prostrˇedı´ absorbova´ny, tzn.
exp(it) exp(−it)
i h exp −i ω (η − iκ)z pro R vlnu (sˇ´ırˇ´ıcı´ se v + z), c h i ω exp +i (η − iκ)z pro L vlnu (sˇ´ırˇ´ıcı´ se v − z), c h i exp +i ω (η + iκ)z pro R vlnu (sˇ´ırˇ´ıcı´ se v + z), i h c ω exp −i (η + iκ)z pro L vlnu (sˇ´ırˇ´ıcı´ se v − z). c
Maxwellovy rovnice jsou invariantnı´ vzhledem k transformacı´m [6] t −t −t
E E −E
H −H H
σ −σ −σ
ρ ρ −ρ
Z te´to symetrie lze urcˇit vztahy mezi amplitudovy´mi odrazivostmi a propustnostmi zna´my´mi jako princip reverzibility, ktery´ v prˇ´ıpadeˇ absorbujı´cı´ch prostrˇedı´ zameˇstnal v minulosti rˇadu badatelu˚. Zajı´mave´ je, zˇe k podobny´m za´veˇru˚m lze dospeˇt uzˇitı´m Lorentzova vztahu vza´jemnosti pro dveˇ ru˚zna´ rˇesˇenı´ Maxwellovy´ch rovnic (jedno rˇesˇenı´ s okrajovou podmı´nkou ve tvaru zna´me´ vlny dopadajı´cı´ na optickou soustavu zleva a druhe´ s vlnou dopadajı´cı´ zprava) a soucˇasneˇ uka´zat, zˇe tento vztah neplatı´ v prˇ´ıpadeˇ gyrotropnı´ho prostrˇedı´. Z tabulky transformacı´ plyne, zˇe nestacˇ´ı pouze zmeˇnit zname´nko cˇasu, ale je nutno zmeˇnit i zname´nko jednoho z vektoru˚ intenzity pole a soucˇasneˇ i zname´nko vodivosti, tj. vzı´t mı´sto absorbujı´cı´ho materia´lu materia´l aktivnı´. Prˇi te´to prˇ´ılezˇitosti je snad vhodne´ prˇipomenout CPT teore´m, podle neˇhozˇ tato u´vaha ukazuje na u´zkou souvislost symetrie fyzika´lnı´ho za´kona
26
Vzdeˇla´vacı´ text projektu RCPTM-EDU
prˇedstavene´ho Maxwellovy´mi rovnicemi prˇi transformacı´ch, ktere´ zahrnujı´ soucˇasnou inverzi na´boje (za´meˇna hmoty za antihmotu, C), parity (zrcadlenı´, P) a cˇasu (T) - CPT teore´m. Prˇesneˇji, podle CPT teore´mu platı´, zˇe kazˇda´ lorentzovsky invariantnı´ loka´lnı´ kvantova´ teorie pole s hermitovsky´m hamiltonia´nem musı´ vykazovat CPT symetrii. Lze take´ tvrdit, zˇe narusˇenı´ CPT symetrie ma´ za na´sledek nevyhoveˇnı´ Lorentzoveˇ invarianci, tedy za´kladnı´mu pozˇadavku Einsteinova principu relativity. Ota´zka je, jak cha´pat CPT invarianci Maxwellovy´ch rovnic. Za´meˇna t → −t znamena´ obra´cenı´ chodu cˇasu, tj. za´meˇnu dopadajı´cı´ho paprsku za odrazˇeny´.
3
Reverzibilita v optice tenky´ch vrstev
Rˇesˇenı´ Maxwellovy´ch rovnic v homogennı´m izotropnı´m prostrˇedı´ lze najı´t ve tvaru linea´rnı´ kombinace funkcı´ exp [−iω/c (yn sin θ ± zn cos θ)], cozˇ platı´ pro monofrekvencˇnı´ pole (s cˇasovou za´vislostı´ exp(iωt), kde ω je frekvence vlny, t cˇas), c rychlost sveˇtla ve vakuu a (viz obr. 3) θ u´hel sˇ´ırˇenı´ v prostrˇedı´ s indexem lomu n, θ0 je u´hel dopadu (odrazu) meˇrˇeny´ v prostrˇedı´ s indexem lomu nq ´ kon lomu n0 sin θ0 = n sin θ nebo 0 , prˇitom platı´ za ekvivalentneˇ n cos θ = n2 − (n0 sin θ0 )2 pro libovolne´ komplexnı´ n a θ. Vlna se zname´nkem + v exponencia´lnı´ funkci prˇedstavuje vlnu sˇ´ırˇ´ıcı´ se ve smeˇru poloosy +z (R vlna), zatı´mco vlna se zname´nkem − prˇedstavuje vlnu sˇ´ırˇ´ıcı´ se ve smeˇru opacˇne´m −z (L vlna). Prˇitom obeˇ vlny budou tlumene´ tehdy, jestlizˇe imagin8rnı´ cˇa´st permitivity (indexu lomu) byla zvolena neza´porna´. Jina´ situace by nastala, pokud by monofrekvencˇnı´ vlna byla reprezentovana´ funkcı´ typu exp(−iωt), pak je nutno volit imagina´rnı´ cˇa´st permitivity (indexu lomu) nekladnou. Pro nalezenı´ explicitnı´ho vyja´drˇenı´ vsˇech slozˇek elektromagneticke´ho pole je nutno rozlisˇit dveˇ za´kladnı´ polarizace, kdy vektor intenzity elektricke´ho pole je kolmy´ na rovinu dopadu (vlna s polarizovana´, TE) nebo lezˇ´ı v rovineˇ dopadu (vlna p polarizovana´, TM). Oba typy rˇesˇenı´ lze shrnout do jedine´ za´pisu s pomocı´ matice M nazy´vane´ interferencˇnı´ matice, ktera´ transformuje tecˇne´ slozˇky vektoru˚ intenzity elektricke´ho Et a magneticke´ho pole Ht (tj. stojate´ vlny slozˇene´ superpozicı´ vln sˇ´ırˇ´ıcı´ch se proti sobeˇ) mezi plochami urcˇeny´mi sourˇadnicemi zI a zII o tlousˇt’ce h = zII − zI (tj. naprˇ´ıklad mezi hranicemi vrstvy), M=
cos ϕ i/Y sin ϕ iY sin ϕ cos ϕ
27
!
,
(3)
Jaromı´r Krˇepelka: Omezenı´ volny´ch parametru˚...
Obr. 3: K sˇ´ırˇenı´ rovinne´ monofrekvencˇnı´ vlny v izotropnı´m prostrˇedı´ kde nutno odlisˇit admitance prostrˇedı´ Y pro obeˇ polarizace (Z0 je impedance vakua) 1 Y = Z0
(
n cos θ pro s polarizaci, n/ cos θ pro p polarizaci
(4)
a ϕ = 2π/λhn cos θ je zmeˇna fa´ze vlny prˇi jednom pru˚chodu prostrˇedı´m s indexem lomu n a tlousˇt’ce h, λ = 2πc/ω je vlnova´ de´lka ve vakuu. Vsˇimneˇme si vlastnostı´ inverznı´ interferencˇnı´ matice M
−1
=
cos ϕ −i/Y sin ϕ −iY sin ϕ cos ϕ
!
,
(5)
ktera´ hraje rozhodujı´cı´ roli prˇi formulaci principu reverzibility v optice tenky´ch vrstev: 1. det (M) = 1, 2. M je unita´rnı´ pouze pro rea´lne´ indexy lomu n vcˇetneˇ sˇ´ırˇenı´ v oblasti tota´lnı´ reflexe, kdy je konstanta sˇ´ırˇenı´ ryze imagina´rnı´, 3. M−1 (n) = M∗ (n∗ ), ∗ znamena´ operaci komplexnı´ho sdruzˇenı´, pod M(n) se rozumı´ funkce indexu lomu n, 4. M−1 (ϕ) = M(−ϕ), pod M(ϕ) se rozumı´ funkce zmeˇny fa´ze ϕ prˇi jednom pru˚chodu vlny vrstvou.
28
Vzdeˇla´vacı´ text projektu RCPTM-EDU
Prˇ´ıslusˇnost interferencˇnı´ matice tenky´ch dielektricky´ch vrstev do grupy SU(2) je matematicky´m vyja´drˇenı´m platnosti invariantnosti prˇ´ıslusˇne´ho fyzika´lnı´ho procesu vzhledem k obra´cenı´ toku cˇasu. Pro soustavu N tenky´ch vrstev podle obr. 4 dostaneme, vzhledem ke
Obr. 4: Orientace vln sˇ´ırˇ´ıcı´ch se opacˇny´mi smeˇry v soustaveˇ tenky´ch vrstev spojitosti tecˇny´ch slozˇek intenzity elektricke´ho a magneticke´ho pole uvnitrˇ soustavy tenky´ch vrstev, pro transformaci tecˇny´ch slozˇek na vneˇjsˇ´ıch hranicı´ch soustavy vy´slednou interferencˇnı´ matici jako soucˇin interferencˇnı´ch matic jednotlivy´ch vrstev Mj , j = 1, 2, . . . N ve spra´vne´m porˇadı´, tedy EtI HtI
!
EtII HtII
= M1 M2 . . . MN
!
.
(6)
S uva´zˇenı´m rozdeˇlenı´ pole rovinne´ stojate´ vlny na protibeˇzˇne´ vlny v poloprostorech obklopujı´cı´ch vrstvy EtRI EtLI EtII HtII
!
!
=
1 = 2
1 1/Y0 1 −1/Y0
!
EtI HtI
1 −YN +1
!
EtRII EtLII
1 YN +1
!
, !
(7)
,
(8)
je pak transformacˇnı´ vztah pro matici prˇena´sˇejı´cı´ tecˇne´ slozˇky pole rozdeˇlene´ho na protibeˇzˇne´ vlny soustavou tenky´ch vrstev EtRI EtLI
!
=S
29
EtRII EtLII
!
,
(9)
Jaromı´r Krˇepelka: Omezenı´ volny´ch parametru˚...
s celkovou maticı´ prˇenosu 1 S= 2
1 1/Y0 1 −1/Y0
!
M1 M2 . . . MN
1 YN +1
1 −YN +1
!
,
(10)
s jejı´zˇ pomocı´ se definujı´ 4 komplexnı´ velicˇiny charakterizujı´cı´ amplitudovou odrazivost zleva rR a zprava rL a amplitudovou propustnost zleva tR a zprava tL ! 1 1 −rL S= . (11) t R rR t R t L − rR rL Pokud bychom se zajı´mali o vy´konove´ parametry odrazivosti a propustnosti, mu˚zˇeme je odvodit analy´zou prˇenosu Poyntingova vektoru pole rozdeˇlene´ho na protibeˇzˇne´ vlny v prostrˇedı´ch obklopujı´cı´ch soustavu tenky´ch vrstev. Podle obr. 5 lze na orientaci vln rovneˇzˇ nahlı´zˇet zrcadloveˇ symetricky, prˇitom obeˇ soustavy musı´ by´t fyzika´lneˇ identicke´.
Obr. 5: Orientace vln sˇ´ırˇ´ıcı´ch se opacˇny´mi smeˇry v zrcadloveˇ symetricke´ soustaveˇ tenky´ch vrstev Proto v prˇ´ıpadeˇ zrcadloveˇ symetricke´ soustavy platı´ pro prˇenos tecˇny´ch slozˇek intenzity elektricke´ho pole rozdeˇlene´ho na protibeˇzˇne´ vlny (nutno spra´vneˇ uva´zˇit smeˇry sˇ´ırˇenı´ vln a porˇadı´ vrstev a obklopujı´cı´ch prostrˇedı´) EtLII EtRII
!
= Sd
EtLI EtRI
!
,
(12)
s maticı´ prˇenosu 1 Sd = 2
1 1/YN +1 1 −1/YN +1
!
MN MN −1 . . . M1
30
1 1 Y0 −Y0
!
.
(13)
Vzdeˇla´vacı´ text projektu RCPTM-EDU
Protozˇe transformacˇnı´ vztahy s maticemi S, Sd popisujı´ stejnou realitu, musı´ platit pro jejich prvky vztah σ 1 S = Sd σ 1 , σ 1 =
0 1 1 0
!
.
(14)
Pro porovna´nı´ prvku˚ matic je trˇeba jesˇteˇ spocˇ´ıtat inverzi S−1 d S−1 d
1 = 2
1 1/Y0 1 −1/Y0
!
−1 M−1 1 M2
. . . M−1 N
1 YN +1
1 −YN +1
!
. (15)
S uva´zˇenı´m ru˚zny´ch mozˇnostı´ vyja´drˇenı´ inverze interferencˇnı´ch matic dostaneme ru˚zne´ formulace podmı´nek, ktere´ musı´ splnˇovat prvky matice prˇenosu. Prˇedstavı´me-li si matici prˇenosu jako funkce indexu˚ lomu vrstev n = (n1 , n2 , . . . , nN ), dostaneme na´sledujı´cı´ podmı´nky s11 (n) = s∗22 (n∗ ), s12 (n) = s∗21 (n∗ ),
(16) (17)
z matice prˇenosu jako funkce fa´zovy´ch tlousˇteˇk ϕ = (ϕ1 , ϕ2 , . . . , ϕN ) vrstev ma´me s11 (ϕ) = s22 (−ϕ), s12 (ϕ) = s21 (−ϕ),
(18) (19)
ktere´ se v prˇ´ıpadeˇ bezeztra´tovy´ch dielektricky´ch vrstev s rea´lny´mi indexy lomu zjednodusˇ´ı na s11 = s∗22 , s12 = s∗21 .
(20) (21)
Jak je videˇt, lze uzˇitı´m poslednı´ identity zredukovat v tomto prˇ´ıpadeˇ pocˇet parametru˚ na 3, ktere´ plneˇ popisujı´ soustavu tenky´ch dielektricky´ch vrstev, a dospeˇt k vyja´drˇenı´ matice prˇenosu (S) ve tvaru S= r
1 Y0 (1 − |r |2 ) R Y N +1
exp(−iδt ) |rR | exp [−i(δt − δr )] |rR | exp [−i(δt − δr )] exp(iδt )
!
(22)
31
,
Jaromı´r Krˇepelka: Omezenı´ volny´ch parametru˚...
kde rR = |rR | exp(iδr ), tR = |tR | exp(iδt ) = r
1 Y0 (1 − |r |2 ) R Y
exp(iδt ).
N +1
(23) Uvedene´ vtzahy jsou ekvivalentnı´ obvykle´mu vyja´drˇenı´ principu reverzibilty ve tvaru platne´m pro beztra´tova´ prostrˇedı´ rR rR∗ + tR t∗L = 1, rR t∗R + tR rL∗ = 0.
(24)
rR rR∗ + tR t∗L = 1, rR t∗R + tR rL∗ = 0.
(25)
Uzˇitı´m obecneˇjsˇ´ıch vy´razu˚ platny´ch pro ztra´tova´ prostrˇedı´ s komplexnı´mi indexy lomu rR (n)rR∗ (n) + tR (n)t∗L (n) = 1, (26) rR (n)t∗R (n) + tR (n)rL∗ (n) = 0. rR (ϕ)rR (−ϕ) + tR (ϕ)tL (−ϕ) = 1, rR (ϕ)tR (−ϕ) + tR (ϕ)rL (−ϕ) = 0.
(27)
Princip reverzibility prˇedstaveny´ za´vislostmi mezi amplitudovy´mi odrazivostmi opticke´ soustavy meˇrˇeny´mi zleva a zprava ve skutecˇnosti nemusı´ s reverzibilitou sˇ´ırˇenı´ elektromagneticky´ch vln souviset, u´vahy s obra´cenı´m chodu cˇasu nejsou uspokojive´ a vyzˇadujı´ dodatecˇne´ prˇedpoklady. Prˇi jejich odvozenı´ vystacˇ´ıme s P-symetriı´ a s formulacı´ okrajovy´ch podmı´nek typu znalosti dopadajı´cı´ a prosˇle´ vlny. Ukazuje se, zˇe pro soustavu tenky´ch vrstev slozˇenou z neabsorbujı´cı´ch vrstev stacˇ´ı pro u´plne´ urcˇenı´ jejich parametru˚ zna´t pouze trˇi rea´lna´ cˇ´ısla celkem sˇest pro TE a TM polarizace. Analogicky lze odvodit vztahy mezi prvky matice prˇenosu i pro soustavy anizotropnı´ch tenky´ch vrstev, rozdı´l je v dimenzi interferencˇnı´ matice 4 × 4 namı´sto 2 × 2.
Literatura [1] G. Stokes, Cambridge Dublin Math. J 4 (1849) 1.
32
Vzdeˇla´vacı´ text projektu RCPTM-EDU
[2] Archie I. Mahan, A Mathematical Proof of Stokes’ Reversibility Principle, Journal of the Optical Society of America, 1943, v. 33, 11 [3] Clark J. R., On reversibility and irreversibility in optics, Journal of the Optical Society of America, 1953, v. 43, 2 [4] A. Vasicek, Optics of Thin Films, North-Holland, Amsterdam, 1960, p. 173 [5] Vasˇ´ıcˇek A., Zeitschrift fu¨r Physik 161 (1961), 26 [6] Sˇantavy´ I., On the Reversibility of Light Beams in Conducting Media, Journal of Modern Optics (Optica Acta), Volume 8, Number 4, October 1961 , pp. 301 - 307 [7] Zdeneˇk Knittl, The Principle of Reversibility and Thin Film Optics, Journal of Modern Optics, 1362-3044, Volume 9, Issue 1, 1962, pages 33 – 45 [8] Ladislav Dunajsky´, Princip reverzibility a reflexibility v optike tenky´ch vrstev, Mathematica Slovaca, Vol. 12 (1962), No. 4, p. 301 - 308 [9] Ladislav Dunajsky´, On the genereralized principle of reversibility in the optics of thin films, Czechoslovak Journal of Physics, Vol. 16, No. 8/August, 1966, p. 654 [10] I. Sˇantavy´, The generalized theorem of reversibility in the optics of thin films, Czechoslovak Journal of Physics, Vol. 17, No. 11/November, 1967, p. 948 [11] Zdeneˇk Knittl; Ivan Sˇantavy´: Note on the Reversibility of Light Beams in Conducting Media, Journal of Modern Optics, 1362-3044, Volume 14, Issue 1, 1967, p. 51 – 56 [12] Ladislav Dunajsky´, Invariance of Maxwell’s Equations and the Principles of Reversibility for a Plane Harmonic Wave, Optics and Spectroscopy, Vol. 11, p. 295 [13] C. Altman and S. G. Lipson, Reciprocity Relations in Light Propagation through a Multilayer Birefringent System, Journal of the Optical Society of America, Vol. 61, No. 10, 1373 - 1379
33
Jaromı´r Krˇepelka: Omezenı´ volny´ch parametru˚...
[14] J. Krˇepelka, The symmetry of the transfer matrix and the reversibility theorem, Acta Universitatis Palackianae Olomucensis, vol. 76, Physica XXII, 1983 p. 81 - 86 [15] S. H. Russev, New derivation of the reversibility theorem for the optics of stratified media, Journal of Modern Optics, 36, 1989, p. 1139 - 1142 [16] J. Krˇepelka, Reversibility theorem for anisotropic stratified medium, Journal of Modern Optics, Vol. 40, 8 August 1993, p. 1581 - 1586 [17] M. A. Dupertuis, B. Acklin, M. Proctor, Generalized energy balance and reciprocity relations for thin-film optics, J. Opt. Soc. Am., Vol. 11, No. 3/March 1994/A, 1167 - 1174 [18] Jean Marie Vigoureuxa, Remo Giustb, Explicit Stokes reciprocity relations for plane stratified media, Optics Communication, 176 (2000) 1-8 [19] G. S. Agarwal, S. Dutta Gupta, Reciprocity relations for reflected amplitudes, Optics Letters, July 15, 2002 / Vol. 27, No. 14 / 1205 1207 [20] R. J. Potton, Reciprocity in optics, Rep. Prog. Phys. 67 (2004) 717 – 754 [21] http://www.mathpages.com/home/kmath552/kmath552.htm [22] R. P. Feynman, O povaze fyzika´lnı´ch za´konu˚, Aurora, Praha 2001
34
Vzdělávání výzkumných pracovníků v Regionálním centru pokročilých technologií a materiálů. CZ.1.07/2.3.00/09.0042
Využití optimalizačních algoritmů pro návrh soustav tenkých vrstev Jaromír Křepelka Abstrakt. V článku jsou shrnuty algoritmy, které se dají využít pro numerický návrh soustav tenkých vrstev. Předpokládá se, že pro požadované makroskopické parametry tenkých vrstev je zadána cílová funkce problému ve tvaru součtu druhých mocnin odchylek, takže optimalizaci lze provést metodou nejmenších čtverců. Pro výpočet derivací cílové funkce jsou uvedeny analytické výrazy, které dovolují hodnoty derivací spočítat s požadovanou přesností. 1. Cílová funkce optimalizačního problému pro tenké vrstvy Požadované vlastnosti soustav tenkých vrstev lze definovat podle vlnové délky, polarizace a úhlu dopadu pro řadu veličin v závislosti na přání zákazníka: – odrazivost, propustnost, elipsometrické parametry, – fázové charakteristiky, – barevné vlastnosti. Nejčastěji je požadavek formulován ve tvaru vyhledání minima funkce více proměnných zadané jako součet (případně integrál) kvadrátu odchylek žádoucí veličiny od teoretické, např. pro odrazivost: 2 2 1 m 1 (1a) f ( h ) = ∑ ( ρ ( λk ,h ) − ρ p ( λk ) ) = r ( h ) , 2 k =1 2 r ( h ) = ρ ( h ) − ρ p , rk ( h ) = ρ ( λk ,h ) − ρ p ( λk ) , k = 1,..., m, (1b) kde ρ p ( λk ) je požadovaná hodnota odrazivosti pro vlnovou délku λk ,
Projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. 35
Vzdělávací text projektu RCPTM–EDU
ρ ( λk ,h ) je teoretická hodnota odrazivosti na stejné vlnové délce spočtená standardní metodou násobení interferenčních matic vrstev se zadanými parametry, případně přibližně metodami aproximativních rozvojů například poměru výkonové odrazivosti a propustnosti, h = ( h1 ,...hN ) je vektor tlouštěk N tenkých vrstev ( N ≤ m ) ve funkci hledaných veličin. Hledanými optimalizovanými veličinami mohou být vedle tlouštěk také indexy lomu vrstev, případně obojí. Do optimalizovaného vztahu (1a) lze rovněž doplnit váhovou funkci a tak zdůraznit nebo naopak potlačit požadavek pro vybrané rozsahy vlnových délek. 2. Derivace cílové funkce podle hledaných parametrů Mnohé algoritmy hledající minimum cílové funkce vyžadují počítání derivací funkcí. V našem případě dostaneme: ∂f ( h ) m ∂ρ ( λk ,h ) = ∑ ( ρ ( λk ,h ) − ρ p ( λk ) ) (2a) , j = 1,..., N , ∂h j ∂h j k =1 ∂ 2 f ( h)
∂ρ ( λk ,h ) ∂ρ ( λk ,h ) ∂ 2 ρ ( λk ,h ) = ∑ + ( ρ ( λk ,h ) − ρ p ( λk ) ) , ∂hi ∂h j ∂h j ∂hi ∂h j k =1 ∂hi (2b) i, j = 1,..., N . Vzhledem k specifickým vlastnostem tenkých vrstev lze derivace cílové funkce snadno počítat analyticky, neboť interferenční matice vrstvy má speciální tvar i cos ϕ sin ϕ M= (3) , Y iY sin ϕ cos ϕ 2π h n 2 − (n0 sin θ 0 ) 2 je změna fáze během jednoho průchodu kde ϕ = m
λ
rovinné elektromagnetické vlny vrstvou. Vzhledem k platnosti zákona lomu ve tvaru n0 sin θ 0 = n sin θ ( θ0 je úhel dopadu měřený v prostředí s indexem lomu n0 ), lze také vyjádřit n 2 − (n0 sin θ0 )2 = n sin θ , Y je admitance prostředí rozdílná pro s nebo p polarizovanou vlnu:
36
Jaromír Křepelka: Využití optimalizačních algoritmů …
Y=
n 2 − (n sin θ ) 2 pro s polarizaci 0 0 ε 0 2 ⋅ , n pro p polarizaci µ0 2 2 n − (n0 sin θ 0 )
ε0 je admitance vakua. µ0
Potom ∂M 2 π 2 2 − sin ϕ = n − (n0 sin θ0 ) λ ∂h iY cos ϕ
i cos ϕ , Y − sin ϕ
(4)
∂ 2M 2π 2 = − n − (n0 sin θ 0 ) 2 M. (5) 2 ∂h λ Odrazivost a další makroskopické parametry tenkých vrstev se počítají z prvků matice přenosu transformující tečné složky elektromagnetického pole rozděleného na protiběžné vlny 1 1 Y 1 1 1 0 Μ1...Μ N S= (6) , Ys −Ys 1 2 1 − Y 0 2
kde Ys a Y0 jsou admitance substrátu a superstrátu. Například výkonová odrazivost vlny dopadající na soustavu tenkých vrstev směrem k substrátu se spočte pro každou vlnovou délku takto: S* S ρ = 21* 21 , (7) S11S11 hvězdička označuje komplexně sdružené číslo. První derivace prvků matice přenosu je tedy 1 1 Y ∂M j 1 1 ∂S 1 0 Μ1...Μ j −1 = M j +1...Μ N (8) , Ys −Ys 1 ∂h j 2 ∂h j 1 − Y 0 podobně získáme druhé derivace matice přenosu, kdy je třeba rozlišit případy i = j , i < j , i > j , protože při násobení matic záleží na jejich pořadí (viz rovnice 5). Proto
37
Vzdělávací text projektu RCPTM–EDU
1 ∂S 21 1 ∂S11 ∂ρ (9) = 2 ρ Re − , S21 ∂h j S11 ∂h j ∂h j kde Re označuje reálnou část komplexního čísla. Pro případnou druhou derivaci dostaneme: ∂2 ρ 1 ∂ρ ∂ρ = + ∂hi ∂h j ρ ∂hi ∂h j (10) 1 ∂S 21 ∂S 21 1 ∂ 2 S 21 1 ∂S11 ∂S11 1 ∂ 2 S11 + + − 2 ρ Re − 2 . S 21 ∂hi ∂h j S21 ∂hi ∂h j S112 ∂hi ∂h j S11 ∂hi ∂h j Tyto analytické vztahy jsou užitečné pro přesný výpočet derivací veličin vstupujících do některých numerických optimalizačních procesů.
3. Metody minimalizace funkcí více proměnných Pro minimalizaci funkcí více proměnných se využívají tyto metody: – Levenbergův-Marquardtův algoritmus (LMA), – Newtonova metoda tečných hyperploch, – metoda konjugovaného gradientu, – metoda proměnné metriky, – simplexová metoda, – evoluční a genetické algoritmy, – metoda simulovaného žíhání. Na některé metody se podíváme podrobněji, metoda simulovaného žíhání se spíše hodí pro úlohy kombinatorického typu jako je například problém obchodního cestujícího a ve výčtu je uvedena jen pro úplnost. 4. Levenbergův-Marquardtův algoritmus Tento algoritmus je speciálně určen pro hledání minima funkce více proměnných zadané jako součet čtverců odchylek – metoda nejmenších čtverců. (a) Lineární funkce V případě, kdy je vektorová funkce odchylek (složky viz rovnice 1b) lineární, platí s využitím definice jacobiánu (tj. matice prvních derivací) ∂r ( h0 ) ∂ρ ( λ j , h0 ) (11) r ( h ) = r ( h0 ) + J ( h0 ) ⋅ ( h − h0 ) , J ji ( h0 ) = j ≡ ∂hi ∂hi a cílová funkce má tvar
38
Jaromír Křepelka: Využití optimalizačních algoritmů …
2 1 r ( h0 ) + J ( h0 ) ⋅ ( h − h0 ) . (12) 2 Její minimum (extrém) nastane v bodě, v němž grad f ( h ) = 0, a protože vzhledem k rovnici 12 platí (index T označuje transponovanou matici) (13) grad f ( h ) = J T (h0 ) ( r ( h0 ) + J ( h0 )( h − h0 ) ) , získáme minimum v explicitním tvaru
f ( h) =
−1
hmin = h0 − J T ( h0 ) ⋅ J ( h0 ) ⋅ J T ( h0 ) ⋅ r ( h0 ) ,
(14)
přitom hessián (matice druhých derivací) je H ( h0 ) =grad 2 f ( h0 ) = J T (h0 )J ( h0 ) .
(15)
(b) Nelineární funkce V případě, kdy je cílová funkce nelineární, lze předpokládat pouze přibližnou platnost vztahů (13) a (15), nicméně lze je využít pro konstrukci iterační metody. Nechť k označuje pořadí iterace, předpokládá se znalost výchozího stavu, tj. nulté iterace. Výpočet je ukončen po dosažení dostatečně malé změny v hledaných veličinách nebo určeného počtu iteračních kroků. (a) Gaussova-Newtonova metoda Tato metoda je prostou aplikací předchozího algoritmu, kdy je nelineární problém řešen linearizací v iteračních krocích:
( ) ) J ( h( ) ) ⋅ ( h(
J T h(
k
k
k +1)
− h(
k)
) = −J ( h( ) ) ⋅ ( ρ ( h( ) ) − ρ ) . k
T
k
p
(16)
Vzhledem k tomu, že grad f ( h ) ≈ J T (h) ⋅ r ( h ) = J T (h) ⋅ ( ρ ( h ) − ρp ) , lze
tuto metodu kombinovat s gradientní metodou a získat tak (b) Levenbergovu metodu J T h( k ) J h( k ) + τ ⋅ I ⋅ h( k +1) − h( k ) = −J T h( k ) ⋅ ρ h( k ) − ρp , (17) kde I je jednotková matice a τ tzv. tlumicí konstanta, to je numerický parametr, kterým se může regulovat rychlost konvergence a stabilita metody. Marquardtův příspěvek spočívá v tom, že místo jednotkové matice se zvolí diagonální matice s prvky na diagonále totožnými s prvky matice
( ) ( )
(
)
( ) ) J ( h( ) ) . Dostaneme pak
J T h(
k
k
(c) Levenbergovu-Marquardtovu metodu
39
( )( ( )
)
Vzdělávací text projektu RCPTM–EDU
{J ( h ) J ( h ) + τ ⋅ diag J ( h ) J ( h )} ⋅ ( h (k )
T
−J
T
(k )
T
(k )
(k )
( h ) ⋅ ( ρ ( h ) − ρ ). (k )
(k )
( k +1)
)
− h( k ) = (18)
p
Tato metoda bývá standardní součástí programovacích prostředí, například MATLABu. 5. Newtonova metoda tečných hyperploch Z prvních tří členů Taylorova rozvoje cílové funkce (viz rovnice 2a, 2b) lze pro nalezení jejího extrému zkonstruovat iterační proces vyhledání nulového bodu soustavy funkcí více proměnných založený na Newtonově algoritmu tečných hyperploch, který vychází z aproximace ∂f ( h ) ∂f ( h0 ) N ∂ 2 f ( h0 ) ≈ + ∑ ( hi − h0i ) , neboli ∂h j ∂h j ∂hi ∂h j i =1
grad f ( h ) ≈ grad f ( h0 ) + H ( h0 )( h − h0 ) ,
(19)
kde H ( h0 ) je Hessova matice druhých derivací. Iterační proces lze pak napsat ve tvaru h(
k +1)
( ) ) ⋅ grad f ( h( ) ) .
= h( ) − H −1 h( k
k
k
(20)
Pro účely optimalizace soustav tenkých vrstev je díky explicitním a snadno spočitatelným prvním a druhým derivacím cílové funkce výhodné takový algoritmus použít. 6. Metoda konjugovaného gradientu Je variantou Powellovy metody, která využívá konceptu tzv. konjugovaných vektorů. Variace gradientu je δ grad f ( h0 ) =H ( h0 ) δ h podle
(19) a dá se proto očekávat, že po předchozím pohybu ve směru vektoru u nový směr v k nalezení minima z bodu h0 by měl být kolmý ke gradientu, tj. mělo by platit 0 = u ⋅ δ grad f ( h0 ) =u ⋅ H ( h0 ) v. Dvojice takových jednotkových vektorů se nazývají konjugované a minimum se hledá postupně podél každého z nich jako minimum funkce jedné proměnné. Ukazuje se, že posloupnost N takových konjugovaných směrů minimalizuje kvadratickou formu, proto se metody s touto vlastností označují jako kvadraticky konvergentní.
40
Jaromír Křepelka: Využití optimalizačních algoritmů …
V případě, že umíme počítat v daném bodě nejen funkční hodnotu cílové funkce, ale také její první derivace, ušetříme výpočet hodnot funkce nutných pro minimalizaci podél jednoho směru. Gradientní metoda, tj. hledání minima ve směru −grad f ( h0 ) , může mít problém ve velkém počtu kroků při pohybu úzkým údolím. Konstrukce konjugovaných směrů připomíná Gramm-Schmidtův ortonormalizační proces známý z algebry lineárních vektorových prostorů. Nechť H je symetrická pozitivně definitní matice, g0 libovolný vektor, algoritmus je založen na výpočtu posloupnosti: (21) h0 = g0 , gi +1 = gi − λi Hhi , hi +1 = gi +1 + γ i Hhi , kde g ⋅g g ⋅ Hhi λi = i i , γ i = i +1 (22) , gi ⋅ Hhi hi ⋅ Hhi potom gi ⋅ g j = 0, hi ⋅ Hh j = 0, i ≠ j. (23) Minimalizace se provádí podél konjugovaných směrů (detaily viz [1] a odkazy tamtéž). 7. Metoda proměnné metriky Vyžaduje rovněž výpočet gradientu a je také kvadraticky konvergentní. Má dvě varianty: – metoda Davidon-Fletcher-Powell (DFP), – metoda Broyden-Fletcher-Goldfarb-Shanno (BFGS).
( ) ) ⋅ grad f ( h( ) ) pro zápis iterač-
Využívá rovnice hmin − h( ) = − H −1 h( k
k
k
ního procesu (srv. s rovnicí 20) a heuristický přístup k vyhledání minima iteračním postupem podle algoritmu k +1 k k k +1 k h( ) − h( ) = H −1 h( ) ⋅ grad f h( ) − grad f h( ) . (24) Iterační korekce Hessovy matice pak vypadá takto k k k k δ( ) ⊗ δ( ) χ ( ) ⊗ χ ( ) k +1 k k k k k H ( ) = H ( ) + ( k ) ( k ) − ( k ) ( k ) + ∆( ) ⋅ χ ( ) u( ) ⊗ u( ) , (25) δ ⋅∆ ∆ ⋅χ kde
( )
(
)
41
( )
Vzdělávací text projektu RCPTM–EDU
δ( k ) = h( k +1) − h( k ) ,
(
)
( )
∆( k ) = grad f h( k +1) − grad f h( k ) ,
(26)
χ ( k ) = H ( k ) ∆( k ) a
δ( k ) χ (k ) u = (k ) (k ) − (k ) (k ) . (27) δ ⋅∆ ∆ ⋅χ Operand ⊗ označuje direktní součin vektorů a poslední příspěvek v rovnici (25) pochází z varianty BFGS. (k )
8. Simplexová metoda Je to metoda (Melder, Mead 1965) pro vyhledání minima cílové funkce, která vyžaduje znalost pouze funkčních hodnot cílové funkce. Pracuje s pojmem simplex, tj. v N dimenzionálním prostoru útvar tvořený N + 1 vrcholy spolu se všemi hranami a stěnami, který má nenulový objem, tedy není degenerovaný. Postup výpočtu spočívá v tom, že ze startovního bodu h0 se zkonstruuje simplex s vrcholy hi = h0 + λi ei , i = 1,..., N (28) a zjistí se, v kterém z bodů je cílová funkce nejvyšší a v kterém nejnižší a další simplex bližší minimu se hledá jednou z operací: – reflexe z nejvyššího bodu, – reflexe a expanze, – kontrakce podél jedné hrany simplexu, – kontrakce podél všech hran simplexu. 9. Evoluční a genetické algoritmy S pomocí analogie mající svůj původ v živé přírodě hledají takové algoritmy většinou globální extrém cílové funkce. Příkladem je samoorganizující se migrační algoritmus (SOMA [2]). V něm se konkrétní hodnoty hledaných veličin (tlouštěk) h o počtu N nazývají jedinci, skupina P (různých) jedinců umístěných do řádků matice X dimenze P × N nese jméno populace. Definují se vektory dimenze N , které omezují velikost tloušťky vrstev zdola, resp. shora, nechť jsou to Llow , resp. Lhigh . Optimalizační postup obsahuje dva základní kroky: 1. Generování výchozí populace
42
Jaromír Křepelka: Využití optimalizačních algoritmů …
X ( i, j ) = Llow ( j ) + RND ⋅ ( Lhigh ( j ) − Llow ( j ) ) ,
i = 1,..., P, j = 1,..., N ,
(29)
kde RND je náhodná funkce nabývající hodnot z intervalu ( 0, 1) , tzn., že i -tý jedinec je hi = ( X ( i,1) , X ( i, 2 ) ,..., X ( i, N ) )
(30)
a jeho kvalitu lze ohodnotit pomocí cílové funkce veličinou f ( hi ) . (2a) S pomocí numerického parametru 0 < PRT < 1 a náhodné funkce RND se generuje tzv. perturbační vektor p , který náhodně určuje pořadí měněných parametrů (tzv. mutací) v jednom kroku výpočtu, a to takto: 1 pro RND < PRT (31) p( j) = , j = 1,..., N . 0 pro RND ≥ PRT V případě metody all to one se z populace vybere jedinec nazvaný leader, který má nejlepší (při hledání minima nejmenší) hodnotu cílové funkce, (jeho pořadí indexujme ileader ) a nová populace se vytvoří ze staré předpisem X new ( i, j ) = X old ( i, j ) + ( X old ( ileader , j ) − X old ( i, j ) ) ⋅ t ⋅ p ( j ) , (32) i = 1,..., P, j = 1,.., N . Po definici nových jedinců se kontroluje, zda hodnoty jejich parametrů nepřekračují zadané meze. Po spočtení hodnot cílových funkcí nových jedinců se nahradí novými ti staří jedinci, kteří mají hodnotu cílové funkce horší (větší) než noví jedinci. Tento krok nazvaný migrace se provádí v cyklu s parametrem cyklu t, který se mění od nuly do nějaké zvolené hodnoty se zadaným krokem. Při každém novém kroku se generuje nový perturbační vektor. (2b) Varianta all to all spočívá v náročnějším generování nové populace ze staré podle rovnice (32), kde ovšem index ileader proběhne přes všechny jedince v populaci. Výpočet lze vylepšit vícenásobným opakováním migrace, stejně jako generováním nové výchozí populace a konečným výběrem nejlepších výsledků. Algoritmus SOMA má tendenci přibližovat k sobě parametry jedinců.
43
Vzdělávací text projektu RCPTM–EDU
Literatura [1] William H. Press, Brian P. Flannery, Saul A. Teukolsky, William T. Vetterling: Numerical Recipes in Fortran 77, Cambridge University Press, 1986 [2] Zelinka Ivan, In : G. Onwubolu, B. V. Babu, New Optimization Techniques in Engineering, Springer-Verlag, 2004, ISBN 3-540-20167X chap. 7 „SOMA – Self Organizing Migrating Algorithm“, 51 p.
44
Vzdělávání výzkumných pracovníků v Regionálním centru pokročilých technologií a materiálů. CZ.1.07/2.3.00/09.0042
Analysis of ellipsometric data obtained from curved surfaces Jaromír Křepelka Abstract: This article deals with quantitative error analysis resulting from ellipsometric data obtained from measurement on curved surfaces including the influence of non-collimated beams. Numerical model based on the combination of geometrical and wave optics is restricted to the example of single dielectric layer deposited on the substrate with complex index of refraction. Three methods for averaging measurable ellipsometric data are compared. Keywords: ellipsometry, curved surface, non-collimated beam 1. Normal to the curved surface Let z = z ( x, y ) is a function describing the curved surface in a Cartesian coordinate system, then a vector perpendicular to the tangential plane in the point r ( x, y ) = ( x, y, z ( x, y )) of the surface is u( x, y ) = −grad( z ( x, y ) − z ) . Hence the unit normal vector is u( x , y ) n( x , y ) = , where u ( x, y ) = u( x, y ) is a size (norm) of the vector u ( x, y ) u( x, y ) . Especially for the upper half-sphere z ( x, y ) = R 2 − x 2 − y 2 , x 2 + y 2 ≤ R 2 , where R is a sphere radius (and centre of the sphere coincides with the origin of coordinate system), we have a unit vector normal to the surface at the point r ( x, y ) = ( x, y, z ( x, y ))
Projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. 45
Vzdělávací text projektu RCPTM–EDU
( x, y , R 2 − x 2 − y 2 ) r ( x, y ) r ( x , y ) = ≡ . (1a) R r ( x, y ) R This surface appears to be convex from the point of view of incident n( x , y ) =
beam. Similarly, for the bottom half-sphere z ( x, y ) = − R 2 − x 2 − y 2 the unit vector normal to the concave surface is
( − x, − y , R 2 − x 2 − y 2 ) − r ( x, y ) − r ( x , y ) = ≡ . R r ( x, y ) R Probably the formula x2 + y 2 R2 R − R2 − x2 − y2 = R x2 + y 2 1+ 1− R2 can be useful for numerical purposes when x 2 + y 2 ≪ R 2 . n( x , y ) =
(1b)
(1c)
2. Light beam incidenting the curved surface Usually for the beam incidenting the curved surface we can define the central (mean or chief) ray that is for instance possible to identify with the symmetry axis of a wide beam of circular cross-section. For the converged beams with angle of convergence β > 0 or divergent beams with angle of divergence β < 0 or collimated beams ( β = 0) we can define the propagation direction of the central ray by a unit vector ni,centr = (ni,centr,x , ni,centr,y , ni,centr,z ) . Using standard spherical coordinates
ϕi ∈ 0, 2π , θi ∈ π/2, π ( cos θi ≤ 0 ) this vector can be expressed as ni,centr = (cos ϕi sin θ i ,sin ϕi sin θi , cos θi ) .
(2)
Let r0 = (0, 0, R ) is a point where the central beam incidents the sphere surface, then a circle with centre r0 and diameter d in the plane perpendicular to ni,centr is a set of points
C ≡ {r: r − r0 ≤ d / 2 ∧ ni,centr ⋅ (r − r0 ) = 0}.
(3)
We may construct C (that can be generalised for arbitrary beam cross sections) using two unit vectors a1 , a2 composing the orthonormal base together with ni,centr in the following way:
46
Jaromír Křepelka: Analysis of ellipsometric data obtained from curves surfaces
π (or niz = 0 , i.e. tangential incidence), then 2 a1 = (ni,centr,y , − ni,centr,x , 0) ≡ (sin ϕi , − cos ϕi , 0) .
(a) When θi =
(b) When θi >
(4)
π , (i.e. −1 ≤ ni,centr,z = cos θi < 0 ), then for instance 2
a1 = (− ni,centr,z , 0, ni,centr,x ) / 1 − ni,centr,y 2 ≡ (− cos θ i , 0, cos ϕi sin θi ) / 1 − ( sin ϕi sin θ i )
2
.
(5)
Of course in these both cases the scalar product a1 ⋅ ni,centr = 0 . Especially
ϕi = π/2 gives ni,centr = (0,sin θi , cos θi ) and a1 = (1, 0, 0) , since − cos θi / 1 − sin 2 θi = 1 . The other required vector a2 can be obtained as a cross product: a2 = a1 × ni,centr . (6) Especially we have π (a) θi = , a2 = (0, 0,1) , 2 π (b) θi > , a2 = (− ni,centr,x ni,centr,y ,1 − ni,centr,y 2 , − ni,centr,y ni,centr,z ) / 1 − ni,centr,y 2 2 and descriptive example ϕi = π/2 provides a2 = (0, − cos θi , sin θi ) . We can express an arbitrary element of C using local Cartesian coordinates ( x′, y′) in the form of a sum of two vectors r0 + a ( x ', y ') , where (7) a ( x′, y′) = a1 x′ + a2 y′ is a linear combination of the base vectors a1 , a2 meeting the condition x′2 + y′2 ≤ d 2 / 4 . Another possibility for construction of C employs polar coordinates ( γ , q ) defined by identities x′ = γ cos(q ) , y′ = γ sin(q ) ,
where 0 ≤ γ ≤ d / 2 and 0 ≤ q < 2 π . The unit vector characterising the direction of the single ray propagation, however changing linearly (as postulated) with the distance a = a , is then
47
Vzdělávací text projektu RCPTM–EDU
d β ni,centr − a tan 2 2 , (8) ni = d β ni,centr − a tan 2 2 other variances of this simple premise are also acceptable. For the denominator in (Eq. 8) we can find
d β β d ni,centr − a tan = + a 2 tan 2 . (9) 2 2 2 2 A vector line equation with parameter ti ∈ ( −∞, +∞ ) representing single ray of the incident beam is therefore: (10) ri (ti ) = r0 + a + ti ni and a first intersection of this ray with the reflecting surface derived from the quadratic equation ri (ti ) = R is in detail 2
ri = r0 + a + ti ni ,
(11a)
(11b) ti = − ( Rniz + a ⋅ ni ) − ( Rniz + a ⋅ ni )2 − (a 2 + 2 Raz ) , where index z means z -component of the vector. Generally (except collimated beams) vectors a , ni are not mutually perpendicular. The discriminant (i.e. an expression under the root sign in Eq. 11b) of the solved quadratic equation has to be positive for existing ray intersection with the sphere and is just equal to zero for tangential incidence.
3. Polarisation of incident rays The normal to the surface is n = ri / ri ( ri is defined in Eqs. 11a, b) and therefore two local unit vectors, projecting two orthogonal components and allowing to define in this way the polarisation state of the electric fields, are n ×n s= i , p = s × ni . (12a) ni × n To be noted that the polarisation state is not defined in the case of normal incidence when ni = − n . Vectors p, s, ni create right-handed orthonormal system, so s polarisation component of electric field is its projection to the vector s , similarly for p polarisation component. In addition to the
48
Jaromír Křepelka: Analysis of ellipsometric data obtained from curves surfaces
local quantities (Eq. 12a), varying with particular convergent or divergent rays, we can define similar useful quantities related to the central ray by formulae: n ×n scentr = i,centr centr , pcentr = scentr × ni,centr , where ncentr = (0, 0,1) . (12b) ni,centr × ncentr The polarisation state of the incident light, characterised by the complex electric field vector Ei,centr = ( Eix , Eiy , Eiz ) , provided that it is the same for all beam rays (what can be certainly generalised to arbitrary beam polarisation profiles), can be determined just using vectors specified in (Eq. 12b). The complex variables Ei,centr,s = Ei,centr ⋅ scentr , Ei,centr,p = Ei,centr ⋅ pcentr (13) are s and p components of electric field of the central beam and presumably also of all rays of the incident beam, hence the electric field vector of the arbitrary ray is (14) Ei = Ei,centr,s s + Ei,centr,p p . Actually, for each ray the s and p components of the field are the same as for the central ray in consistency with postulation Ei,s ≡ Ei ⋅ s = Ei,centr,s , Ei,p ≡ Ei ⋅ p = Ei,centr,p . (15) The polarisation state of the incident beam can be also defined applying ellipsometric parameters ψ centr , ∆ centr according to the formula Ei,p / Ei,s ≡ Ei,p,centr / Ei,s,centr = tanψ centr exp(i∆ centr ) , from which we have Ei,p = E0 tanψ centr exp(i∆ centr ) , Ei,s = E0 ,
(16a) (16b)
where E0 is nonzero complex constant with absolute value proportional to the square root of incident light intensity. It is obvious that instead of the vector base a1 , a2 we can choose vectors scentr , pcentr satisfying the transformation identities a1 = cos(q0 ) scentr + sin(q0 ) pcentr , a2 = − sin(q0 ) scentr + cos(q0 ) pcentr , (17a) where cos(q0 ) = a1 ⋅ scentr = a2 ⋅ pcentr , sin(q0 ) = a1 ⋅ pcentr = −a2 ⋅ scentr . (17b)
4. Polarisation of the reflected beam Unit vectors defining the directions of the locally reflected rays can be obtained from the equation
49
Vzdělávací text projektu RCPTM–EDU
nr = ni − 2(ni ⋅ n)n
(18)
and local angles of incidence α i (identical to the angles of reflection α r ) are α i ≡ α r = arccos(n ⋅ nr ) = − arccos(n ⋅ ni ) . (19) Designating the local amplitude reflectivities of the curved surface for s and p electromagnetic waves by rs , rp (they are complex numbers depending on the angle of incidence, wavelength and optical properties of reflecting material) we can calculate the amplitudes of reflected electric field for each polarisation state of the ray (20a) Er,s = rs Ei,s , Er,p = rp Ei,p , so that the electric field vector of the reflected ray is (20b) Er = Er,s s + Er,s p taking into account that unit vector s (normal to the plane of incidence) and unit vector p (lying in the plane of incidence) are both identical for the ray incidenting the surface and ray reflected from the surface. The correct ellipsometric parameters ψ corr , ∆ corr of the reflected wave are then defined from the relation (21) tanψ corr exp(i ∆ corr ) = rp / rs , hence Er,p Ei,s Er,p 1 tanψ corr exp(i ∆ corr ) = = . (22) Er,s Ei,p Er,s tanψ centr exp(i∆ centr ) Using (Eq. 22) it is possible to solve the inverse ellipsometric problem, for instance for single dielectric layer deposited on the substrate of known refraction index, for all rays incidenting the curved surface under different local angles of incidence, and then to obtain the same index of refraction and thickness of the layer, although evidently the input ellipsometric parameters locally differ. Otherwise, in the case when a light detector (for instance ideal rotating analysator capable to distinguish and analyse single beam rays with sufficient space resolution) is calibrated for the central ray (see definition of vectors scentr and pcentr by Eq. 12b), we obtain (intentionally) inaccurate ellipsometric parameters (E ⋅ p ) 1 . (23) tanψ exp(i ∆) = r centr ( E r ⋅ scentr ) tanψ centr exp(i∆ centr )
50
Jaromír Křepelka: Analysis of ellipsometric data obtained from curves surfaces
It is clear that quantities ψ a ∆ from (Eq. 23) hold true precisely only for the central ray, however for all other rays of the light beam allow to determine quantitatively the deviations from the correct values and therefore to estimate the error emerged from measurement ellipsometric parameters of curved surfaces in comparison with a flat surface and also to analyse the effect of beam convergence or divergence in comparison with collimated beam.
5. Inverse ellipsometric problem for a single thin dielectric layer The aim of this section is to find the thickness and index of refraction of single dielectric layer from known ellipsometric parameters ψ and ∆ . For this purpose we define quantities n0 – index of refraction of external environment (superstrate, air), n1 – (unknown) real index of refraction of the layer with (unknown) thickness h1 , ng – index of refraction of the substrate (generally complex number), α 0 – angle of incidence measured in the superstrate and λ – wavelength of light in vacuum. We also use the admittance of vacuum y0 = ε 0 / µ0 ( µ0 , ε 0 – permeability and permittivity of vacuum) for definition of relative admittances for both light polarisations of all media considering the law of refraction in the form n0 sin α 0 = n1 sin α1 = ng sin α g , see for instance [1]
Y0 (s) = n0 2 − (n0 sin α 0 ) 2 = n0 cos α 0 , Y0 (p) = n0 2 / n0 2 − (n0 sin α 0 ) 2 = n0 / cos α 0 , Y1(s) = n12 − (n0 sin α 0 )2 = n1 cos α1 , Y1( p ) = n12 / n12 − (n0 sin α 0 ) 2 = n1 / cos α1 ,
(24)
Yg (s) = ng 2 − (n0 sin α 0 ) 2 = ng cos α g , Yg ( p ) = ng 2 / ng 2 − (n0 sin α 0 ) 2 = ng / cos α g . The phase shift of plane wave propagating once through the layer ϕ1 is independent on the polarisation and is equal to 2π ϕ1 = h1 n12 − (n0 sin α 0 ) 2 . (25)
λ
51
Vzdělávací text projektu RCPTM–EDU
The solution of Maxwell equations for plane monochromatic waves in isotropic medium can be expressed by 2 × 2 matrix S (s,p) physically representing transform operators for tangential components of electric field vectors, however separated into counter-propagating waves 1 i 1 Y (s,p) cos ϕ sin ϕ1 1 1 1 1 0 (s,p) (s,p) Y1 S = (s,p) (s,p) (26) Yg − Y 1 (s,p) 2 g cos ϕ1 1 − Y (s,p) iY1 sin ϕ1 0 for both polarisation states. From matrix elements of S (s,p) we can compute eight amplitude coefficients, namely amplitude reflectivities for waves propagating in the direction from superstrate to the substrate in the form S (s,p) (27) rs,p = 21(s,p) . S11 Employing the definition of ellipsometric parameters rp tanψ exp(i∆ ) = , (28) rs considered in this moment as known (for instance as a result of measurement) we can derive from (Eqs. 27, 28) the quadratic equation - a condition for the wanted layer parameters [1] a0 exp(−4iϕ1 ) + b0 exp(−2iϕ1 ) + c0 = 0 . (29) Here a0 = b (s) d (p) tanψ exp(i∆ ) − d (s)b (p) ,
b0 = (a (s) d (p) + b (s) c (p) ) tanψ exp(i∆ ) − (d (s) a (p) + c (s)b (p) ) ,
(30)
c0 = a c tanψ exp(i∆ ) − c a , where quantities with s or p indices (not all are independent) a (s,p) = (1 − Y1(s,p) / Y0 (s,p) )(1 + Yg (s,p) / Y1(s,p) ) , (s) (p)
(s)
(p)
b(s,p) = (1 + Y1(s,p) / Y0 (s,p) )(1 − Yg (s,p) / Y1(s,p) ) , c
(s,p)
= (1 + Y
(s,p) 1
/ Y0
(s,p)
)(1 + Yg
(s,p)
(s,p) 1
/Y
(31)
),
d = (1 − Y / Y0 )(1 − Yg / Y ) . The solution of (Eq. 29) has to be in the form of complex units (due to the fact that ϕ1 is real), therefore the complex conjugated equation (s,p)
(s,p) 1
(s,p)
(s,p)
52
(s,p) 1
Jaromír Křepelka: Analysis of ellipsometric data obtained from curves surfaces
c0∗ exp(−4iϕ1 ) + b0∗ exp(−2iϕ1 ) + a0∗ = 0 , (32) where asterisk means complex conjugated quantities, have to be fulfilled too. Therefore we can reduce the quadratic equation for exp(−2iϕ1 ) to the linear equation and a condition for index of refraction 2
f (n1 ) ≡ b0∗c0 − b0 a0∗ − a0 − c0 2
2 2
= 0.
Admittable layer thicknesses are then σ hk = k − hper , k = 1, 2,... , 2π where b ∗c − b a ∗ λ exp(iσ ) = 0 02 0 02 , 0 ≤ σ < 2 π , hper = , a0 − c0 2 n12 − (n0 sin α 0 ) 2
(33)
(34)
(35)
hper is a period of the layer thickness. This method is more efficient than least square method applied for two unknown variables at the same time. From local ellipsometric variables ψ corr , ∆ corr (Eq. 22) and using the above relations we can compute a local layer parameters identical with the given layer index of refraction and its thickness because these quantities have to be independent on the ray selection. Certainly, we have different values when computing the ellipsometric parameters obtained from the detector calibrated for the central beam (Eq. 23), which are intentionally affected by the systematic error due to the measuring method. 6. Averaging of ellipsometric parameters To average values of quantities over the beam cross-section we can use an equidistant grid so that the electric field of each ray is considered with the same weight what allows to approximate integrals over surface sufficiently. For this purpose the following equidistant square grid spread over C may be suitable d k −1 (36a) xk′ = −1 + 2 , k = 1,..., N , N −1 2 d l −1 (36b) yl′ = −1 + 2 , l = 1,..., N . N −1 2
53
Vzdělávací text projektu RCPTM–EDU
But only the subset M of the ordered pairs of natural numbers refers actually to the beam, namely in the case of the circular beam cross-section it is a set 2 d M = (k , l ) ∈< 1, N > × < 1, N > : xk′ 2 + yl′2 ≤ . (37) 2 The points r0 + a1 xk′ + a2 yl′ , ( k , l ) ∈ M (their number is m( M ) ) may be used for calculation of averaged variables expecting the more precise result for larger N . There are at least three ways of averaging: (a) Averaging local index of refraction n1 (k , l ) and thickness h1 (k , l ) following the relations 1 1 (a) (a) = = n1,aver n1 (k , l ) , h1,aver ∑ ∑ h1 (k , l ) . (38) m( M ) ( k ,l )∈M m( M ) ( k ,l )∈M (b) Averaging local ellipsometric parameters obtained via (Eq. 23) 1 1 (b) ψ aver = ψ (k , l ) , ∆ (b) ∑ ∑ ∆(k , l ) (39) aver = m( M ) ( k ,l )∈M m( M ) ( k ,l )∈M and then applying the algorithm explained in the section 5 for calculation (b) (b) and h1,aver . averaged quantities n1,aver (c) Averaging the electric field vector of the reflected beam (Eq. 20) 1 Er,aver = (40) ∑ Er (k , l ) , m( M ) ( k ,l )∈M then using (Eq. 23) in the form (E ⋅p ) 1 tanψ exp(i ∆ ) = r,aver centr (41) ( E r,aver ⋅ scentr ) tanψ centr exp(i∆ centr ) (c) (c) and finally calculating n1,aver and h1,aver from such obtained ellipsometric parameters.
7. Numerical simulation The following example demonstrates the effect of the curved surface and convergence or divergence of the incident beam on the evaluation of ellipsometric data: the spherically shaped silicon substrate with radius R = 1 m and a complex index of refraction ng = 3.855 − 0.024i is covered by a thin layer with index of refraction n1 = 1.461 (silicon oxide) and
54
Jaromír Křepelka: Analysis of ellipsometric data obtained from curves surfaces
thickness h1 = 112 nm , the index of refraction of superstrate is n0 = 1 (air). The circular beam with diameter d (variable quantity) and wavelength λ = 632.8 nm incidents the sphere from the direction ϕi = 90o ,
θi = 110o , it means that the angle of incidence measured in the superstrate is α 0 ≡ α i = 70o and a central beam is parallel to the plane x = 0 . Considered ellipsometric parameters of the linearly polarised incident beam are ψ centr = 45o , ∆ centr = 0o and a number of grid division N = 150 . Figures illustrating maps of local quantities are depicted for the diameter of the collimated beam d = 2 R(1 − sin α i ) ≈ 120.6 mm , it is an extreme case when just one boundary ray incidents the sphere tangentially. It is clear that the problem exhibits the dimensionless characteristic number d /R. The change of the local angle of incidence of the collimated beam ( β = 0) could be seen in Fig. 1, the values vary between 61,57 o and 90o .
Fig. 1 Local angle of incidence of the collimated beam with the diameter 120.6 mm impinging the sphere with radius 1 m; angle of incidence of the central beam is 70o .
Fig. 2 Local ellipsometric parameters ψ (left) ∆ (right) for same conditions as in Fig. 1.
55
Vzdělávací text projektu RCPTM–EDU
Fig. 3 Local index of refraction (left) and thickness (right) of the layer with (intentional) error for same conditions as in Fig. 1.
Fig. 2 demonstrates local changes of ellipsometric parameters. Using local angles of incidence it is possible to calculate the correct layer index of refraction and its thickness. The Fig. 3 shows local erroneous values of layer index of refraction and its thickness obtained from ellipsometric parameters according to (Eq. 23) when the local polarisation state of the each beam is replaced by the polarisation state of the central beam.
Fig. 4 Averaged values of the layer index of refraction (left) and its thickness (right) obtained by three methods in dependence on collimated beam diameter d , the radius of the sphere is R = 1 m . From Fig. 4 we can deduce the error rate for determination of thin layer parameters with increasing diameter of the collimated beam. The more precise seems to be (a) method in comparison with (b) method, the result is nearly constant for d / R roughly less than 5 %. The more adverse method is (c) using for detection the resulting electric field of the reflected beam, but it is just a method supposed to approximate the physical measurement conditions more realistically. However, also for relatively wide beam with diameter 50 mm we obtain the deviation only 0.01 from
Jaromír Křepelka: Analysis of ellipsometric data obtained from curves surfaces
the correct index of refraction 1.461 and for layer thickness the value 111 nm while the correct value is 112 nm. The effect of beam convergence or divergence on the measurement precision is demonstrated in Figs. 5 – 8.
Fig. 5 Averaged index of refraction of thin layer obtained by three averaging methods (a, b, c from left to right) from measurement of ellipsometric parameters for convergent beam with angle of convergence β = 0o – 10o .
Fig. 6 Averaged thickness of thin layer obtained by three averaging methods (a, b, c from left to right) from measurement of ellipsometric parame-
ters for convergent beam with angle of convergence β = 0o – 10o . Fig. 7 Averaged index of refraction of thin layer obtained by three averaging methods (a, b, c from left to right) from measurement of ellipsometric parameters for divergent beam with angle of divergence β = −10o – 0o .
57
Vzdělávací text projektu RCPTM–EDU
Fig. 8 Averaged thickness of thin layer obtained by three averaging methods (a, b, c from left to right) from measurement of ellipsometric parameters for divergent beam with angle of divergence β = −10o – 0o . These figures allow to estimate quantitatively the effect of beam convergence or divergence on the inaccuracy of results obtained from ellipsometric measurements. Surprisingly we can expect better results for convergent beams in comparison with collimated beams but only for suitable diameter of the beam. In the simulated case the smallest deviations of the index of refraction and thickness from the correct values occur when the convergent angle is about five degrees. Divergent beams unambiguously exhibit worse results for all angles of beam divergence with increasing beam diameter and angle of divergence. The averaging method using the local index of refraction and thickness obtained from locally measured ellipsometric parameters (i.e. method (a)) is minimally sensitive to the beam diameter and its degree of convergence or divergence.
8. Conclusion This paper using the combination of geometrical and wave optics quantitatively examines the effect of curved surface and also beam convergence or divergence on the accuracy of the results obtained from ellipsometric measurements. For this purpose three averaging methods for estimation the measurable quantities were proposed and results numerically compared applying the example of one thin dielectric layer deposited on the spherically shaped substrate. Acknowledgement This work was supported by the project No. 1M06002 of the Ministry of Education, Youth and Sports of the Czech Republic. References [1] Křepelka J.: Optika tenkých vrstev, Univerzita Palackého v Olomouci, 1993
58
Ing. Jaromír Křepelka, CSc.
Tenké vrstvy Výkonný redaktor: prof. RNDr. Tomáš Opatrný, Dr. Odpovědná redaktorka: Vendula Drozdová Návrh a grafické zpracování obálky: Jiří K. Jurečka Vydala a vytiskla Univerzita Palackého v Olomouci Křížkovského 8, 771 47 Olomouc www.upol.cz/vup Olomouc 2012 1. vydání ISBN 978-80-244-3109-3 Neprodejné