Multimediální učební text Katedry fyziky Přírodovědecké fakulty Ostravské Univerzity Daniel Hrivňák
Ivan Janeček
René Kalus
© Ostravská Univerzita v Ostravě, 2004
Realizováno díky finanční podpoře Fondu rozvoje vysokých škol, projekt číslo 1427/2004. Zpracování dat a technická podpora: Bc. Petr Řehánek. Kvantová fyzika 1.
2.
3.
Experimentální východiska kvantové teorie 1.1 Záření DČT 1.2 Klasická teorie záření DČT 1.3 Fotoelektrický jev
2.1 2.2 2.3 2.4 2.5 2.6 2.7
Stará kvantová teorie Planckova kvantová hypotéza Planckova teorie záření DČT Einsteinova fotonová hypotéza Einsteinova teorie fotoelektrického jevu Sommerfeldova kvantová teorie Sommerfeldova teorie lineárního harmonického oscilátoru Sommerfeldova teorie atomu vodíku
Vlnové vlastnosti částic 3.1 Davisson-Germerův pokus
4.
Kvantová mechanika 4.1
Vlnová funkce
4.2
Stacionární Schrödingerova rovnice
4.3
Nestacionární Schrödingerova rovnice
4.4 Korespondence mezi klasickou a kvantovou mechanikou 4.5
Dynamické proměnné
1
4.6
Částice ve vnějším elektromagnetickém poli
4.7 Kvantová mechanika a teorie relativity 4.8
Vícečásticové systémy
4.9
Jednoduché kvantově-mechanické systémy4.10
5.
Přibližné metody v kvantové teorii
Kvantová teorie pole
6.
Matematické dodatky 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8
Separace proměnných Fourierova transformace Pravděpodobnost Hilbertův prostor Operátory na HP Vlastní hodnoty a vektory samosdružených operátorů Algebraické operace s operátory na Hilbertových prostorech Permutace
Atomová fyzika 1.
Vznik a vývoj atomové teorie 1.1 Základní chemické zákony 1.2 Daltonova atomová hypotéza 1.3
Thomsonův model atomu
1.4
Rutherfordův model atomu
2.
Atom vodíku 2.1
Znázornění atomových orbitalů
2.2 Kvantová čísla (popisující stav elektronu v atomu) 3.
Víceelektronové atomy 3.1 Metoda efektivního potenciálu 3.2 Výstavba atomového obalu 3.3
Metoda slabé vazby
3.4 Metoda silné vazby 4.
Atom v elektrickém a magnetickém poli 4.1 Starkův jev 4.2 Zeemanův jev 4.3 5.1 5.2 5.3 5.4 5.5
6.
Magnetický moment atomu Zpřesnění popisu spekter atomů Zbytková interakce Relativistické korekce Relativistické korelační interakce Korekce ovlivněné vlastnostmi jádra Korekce kvantové teorie pole
Interakce atomů 6.1 Podmínky vzniku chemické vazby 6.2 Dvouatomové molekuly 6.3 Molekula vodíku - objasnění homopolární kovalentní vazby 6.4 Víceatomové molekuly 6.5 Spektrum molekul Testy
2
KVANTOVÁ FYZIKA Kvantová teorie se zrodila na počátku 20. století z pokusů řešit rozpory mezi výsledky některých experimentů na jedné straně a jejich klasickým popisem na straně druhé. Podobně jako u ostatních fyzikálních teorií stály i u zrodu nově vznikající kvantové teorie experimenty. Hovoříme proto o experimentálních východiscích kvantové teorie. Její základy byly položeny v prvních dvou desetiletích 20. století v teoretických pracích, které krok za krokem odstraňovaly výše zmíněné rozpory a paradoxy. Vůdčí ideou této první fáze rozvoje kvantové teorie, která se obvykle nazývá stará kvantová teorie, bylo kvantování fyzikálních veličin, zejména energie, ad hoc včleněné do jinak bezezbytku klasického popisu světa. Mocným impulzem pro další rozvoj kvantové teorie byla de Broglieho hypotéza o dualitě částicových a vlnových vlastností klasických částic. Z podloží této hypotézy totiž ve druhé polovině dvacátých let 20. století vyrostla moderní kvantová fyzika soustav s konečně mnoha stupni volnosti (soustavy hmotných bodů), kvantová mechanika. Její zobecnění na soustavy s nekonečně mnoha stupni volnosti (fyzikální pole), kvantová teorie pole, následovalo v průběhu let třicátých a čtyřicátých. Jak kvantová mechanika, tak i kvantová teorie pole jsou dodnes aktivně rozvíjeny předními pracovišti na celém světě. Jsou totiž mimořádně úspěšné při popisu široké škály jevů, zejména těch, které probíhají v mikrosvětě. Jsou proto základním teoretickým nástrojem atomové a jaderné fyziky i fyziky elementárních částic.
1. Experimentální východiska kvantové teorie 1.1 Záření DČT 1.2 Klasická teorie záření DČT 1.3 Fotoelektrický jev
1.1 ZÁŘENÍ DOKONALE ČERNÉHO TĚLESA Dokonale černé těleso (absolutně černé těleso, ideální zářič) je tepelný zářič dokonale absorbující veškeré elektromagnetické záření, které dopadne na jeho povrch. Ve skutečnosti se jedná o idealizovaný model, v přírodě se dokonale černá tělesa nevyskytují. Mnohé tepelné zářiče se však svými vlastnostmi tomuto modelu velmi blíží (např. Slunce a ostatní
3
hvězdy, nebo dokonce i vlákno žárovky). V pozemských podmínkách bývá dokonale černé těleso reprezentováno dutinovým zářičem. Tepelné záření v dutině, které je v termodynamické rovnováze s jejími stěnami o teplotě T, je obvykle popisováno spektrální hustotou energie ε(ω,T). Teoretická formulace závislosti spektrální hustoty energie na frekvenci (vlnové délce) byla velkou výzvou pro fyziky konce 19. století. Popisuje ji několik empirických zákonů. Prvním z nich je Rayleighův-Jeansův zákon. Lze jej odvodit v rámci klasické teorie, platí však pouze v oblasti nízkých frekvencí a osudově selhává pro frekvence vysoké. Další empirický zákon, Wienův, popisuje vyzařování dokonale černého tělesa v oblasti vysokých frekvencí, selhává ale naopak pro frekvence nízké. Teprve zákon Planckův přinesl úplný popis záření dokonale černého tělesa. V rámci klasické fyziky jej však není možno odvodit. Pro jeho teoretické zdůvodnění musel Max Planck postulovat svou proslulou kvantovou hypotézu. Problém záření dokonale černého tělesa tak stál u samotného zrodu kvantové fyziky.
VYBRANÉ VZORCE A VZTAHY Spektrální hustota energie Označme ∆ε (ω , ∆ω , T ) objemovou hustotu energie tepelného záření o teplotě T nesenou monochromatickými složkami o úhlových frekvencích z intervalu (ω , ω + ∆ω ); pak pod spektrální hustotou energie tohoto záření rozumíme ∆ε (ω , ∆ω , T ) . ∆ω → 0 ∆ω
ε (ω , T ) = lim
Rayleighův - Jeansův zákon
ε (ω , T ) =
ω2 k BT , π 2 c3
kde k B je Boltzmannova konstanta. Wienův zákon
ε (ω , T ) = aω 3 exp −b
ω
, T
kde a a b jsou konstanty určované pomocí experimentálních dat. Planckův zákon
4
ε (ω , T ) = aω 3
1 ω exp b − 1 T
,
kde a a b jsou konstanty určované pomocí experimentálních dat. LITERATURA [1] [2]
PLANCK, M. Verhandlungen der Deutschen physikalischen Gesellschaft, 1900, Bd. 2. HAJKO, V., aj. Fyzika v experimentoch. 1. vyd. Bratislava: Veda, 1988. 415 s. s. 55-61.
1.2 KLASICKÁ TEORIE ZÁŘENÍ DOKONALE ČERNÉHO TĚLESA Elektromagnetické pole (záření) uzavřené v dutině konečného objemu V je možno chápat jako soustavu nezávislých lineárních harmonických oscilátorů. Například pro dutinu ve tvaru kvádru lze Maxwellovy rovnice převést pomocí Fourierových řad na nekonečnou soustavu nezávislých obyčejných diferenciálních rovnic, které svým tvarem odpovídají pohybovým rovnicím pro netlumené lineární harmonické oscilátory. Tyto oscilátory mají obecně různé charakteristické úhlové frekvence (záření dokonale černého tělesa není monochromatické) a jednoduchým výpočtem je možno určit, kolika z nich přísluší úhlové frekvence ze zadaného intervalu (ω,ω+∆ω) [1]: ω 2V ∆N (ω , ∆ω ) ≈ 2 3 ∆ω . π c Z klasické statistické fyziky je známo, že střední energie e(T) lineárního harmonického oscilátoru, který je v kontaktu s termostatem o teplotě T, je dána vztahem (viz též ekvipartiční teorém) +∞ E ∫0 E exp − kBT dE e(T ) ≡ +∞ = k BT , E ∫0 exp − kBT dE kde kB je Boltzmannova konstanta. Pro energii oscilátorů reprezentujících elektromagnetické pole v dutině, jejichž frekvence jsou z intervalu (ω,ω+∆ω), můžeme tedy psát ω 2V ∆ε (ω , ∆ω , T ) = ∆N (ω , ∆ω ) e(T ) ≈ 2 3 k BT ∆ω π c a pro spektrální hustotu energie 1 ∆ε (ω , ∆ω , T ) ω 2 ε (ω , T ) = lim = 2 3 k BT . V ∆ω → 0 ∆ω π c Poslední uvedený vztah nese na paměť anglických fyziků, kteří jej odvodili, název RayleighůvJeansův zákon. Tento zákon však souhlasí s experimentálními daty jen pro malé hodnoty úhlových frekvencí (a tedy jen pro dlouhé vlnové délky). V oblasti vysokých frekvencí zcela selhává. Kromě toho celková 5
objemová hustota energie elektromagnetického záření v dutině, ∫
+∞
ε (ω , T )dω
, je podle Rayleighova-Jeansova zákona nekonečná. Osudové selhání klasické teorie v oblasti vysokých frekvencí bylo příznačně nazváno ultrafialovou katastrofou. 0
LITERATURA [1]
BEISER, A. Úvod do moderní fyziky. 1. vyd. Praha: Academia, 1978. 628 s. s. 389-392.
1.3 FOTOELEKTRICKÝ JEV •
Emise elektronů z látky, na kterou dopadá elektromagnetické záření, se nazývá fotoelektrickým jevem.
Při vnějším fotoelektrickém jevu jsou elektrony uvolňovány z vodivostního pásu kovů a samotný krystal kovu opouštějí. V polovodičích pak může docházet pod vlivem elektromagnetického záření k uvolňování elektronů z elektronových obalů atomů. Tyto elektrony zpravidla samotný polovodič neopouštějí, pouze zvyšují jeho vodivost. Pak hovoříme o tzv. vnitřním fotoelektrickém jevu. Fotoelektrický jev sehrál fundamentální roli při formulování základů kvantové teorie světla. Vnější fotoelektrický jev byl objeven v poslední čtvrtině 19. století nezávisle na sobě vícero fyziky (Hertz 1887, Stoletov 1888) a následně velmi podrobně experimentálně prostudován Lenardem [1]. Samotný fakt fotoemise elektronů z kovu nebyl pro klasickou fyziku překvapující, neboť již od dob Maxwellových bylo známo, že elektromagnetické záření nese energii. V mezích klasické fyziky byly však nepochopitelné některé experimentální závěry: •
K fotoemisi elektronů dochází bezprostředně po dopadu elektromagnetického záření, a to bez ohledu na jeho intenzitu. Dokonce i pro velmi slabé intenzity dopadajícího záření, kdy -8 -9 klasická teorie předpovídá prodlevu několika měsíců, je zpoždění kratší než 10 -10 s.
•
Pro každý kov existuje maximální vlnová délka dopadajícího záření, λmax , pro kterou ještě může dojít k fotoemisi. Pro větší vlnové délky k emisi elektronů nedochází ani při velmi vysokých hodnotách intenzity dopadajícího záření.
•
Maximální hodnota kinetické energie
(max) Ekin
elektronů vylétávajících z krystalu kovu
ozařovaného elektromagnetickým zářením nezávisí na jeho intenzitě, ale pouze na jeho vlnové (max) délce λ < λmax . Experimentálně byl zjištěn vztah Ekin = C (1/ λ − 1/ λmax ) , kde C je konstanta
nezávislá na použitém kovu. Klasická teorie předpovídá ale závěry zcela odlišné. Např. časová prodleva mezi počátkem ozařování povrchu kovu světlem a emisí elektronů z něj může být podle klasické fyziky velmi dlouhá - hodiny, dny, týdny či dokonce i měsíce, je-li dopadající světlo slabé (viz např. [2]). To, zda k fotoemisi dojde, záleží podle klasických představ pouze na intenzitě dopadajícího záření, nikoliv na jeho vlnové délce. A konečně i kinetická energie emitovaných elektronů by měla být ovlivněna
6
pouze množstvím elektromagnetické energie absorbované v krystalu kovu. O její závislosti na vlnové délce dopadajícího záření nemůže být v rámci klasických představ vůbec řeč. Jednoduché vysvětlení fotoelektrického jevu podal v roce 1905 na základě své fotonové hypotézy A. Einstein (Einsteinova teorie fotoelektrického jevu). LITERATURA [1] [2] [3]
LENARD P. Annalen der Physik, 1902, Bd. 8, S. 149. BEISER, A. Úvod do moderní fyziky. 1. vyd. Praha: Academia, 1978. 628 s. s. 65-69. HAJKO, V., aj. Fyzika v experimentoch. 1. vyd. Bratislava: Veda, 1988. 415 s. s. 61-62.
2. Stará kvantová teorie 2.1 2.2 2.3 2.4 2.5 2.6 2.7
Planckova kvantová hypotéza Planckova teorie záření DČT Einsteinova fotonová hypotéza Einsteinova teorie fotoelektrick0ho jevu Sommerfeldova kvantová teorie Sommerfeldova teorie lineárního harmonického oscilátoru Sommerfeldova teorie atomu vodíku
2.1 PLANCKOVA KVANTOVÁ HYPOTÉZA Podle Maxe Plancka [1] nemůže lineární harmonický oscilátor kmitající s frekvencí ν (resp. úhlovou frekvencí ω = 2πν ) nabývat všech klasicky přípustných, tj. nezáporných energií, ale pouze těch, které splňují tzv. Planckovu kvantovou podmínku En = nhν = n ω , kde h je univerzální fyzikální konstanta, která dnes nese Planckovo jméno, Planckova konstanta, = h 2π je tzv. „škrtnutá“ Planckova konstanta a n nezáporné celé číslo. Ve skutečnosti je však množina přípustných energií (energetické spektrum) lineárního harmonického oscilátoru poněkud odlišná od té, která vyplývá z Planckovy kvantové podmínky. Přesný tvar kvantovací podmínky pro lineární harmonický oscilátor, En = (n + 1/ 2) ω , poskytuje až řešení stacionární Schrödingerovy rovnice. Planckově konstantě byla jako jedné z fundamentálních fyzikálních konstant věnována experimentátory velmi velká pozornost. Její v současnosti uváděná hodnota činí [2] (viz též [3]) h = 6, 626 06876.10−34 J.s,
7
= 1, 054571596.10−34 J.s. Kvantové hypotézy formulované pro lineární harmonický oscilátor využil Planck k vytvoření kvantové teorie záření dokonale černého tělesa. LITERATURA [1] [2] [3]
PLANCK, M. Annalen der Physik, 1901, Bd. 4, S. 553. GROOM, DE., et al. The European Physical Journal, 2000, vol. C15, p. 1. BROŽ, J., ROSKOVEC, V. a VALOUCH, M. Fyzikální a matematické tabulky. 1. vyd. Praha: SNTL, 1980. 305 s.
2.2 PLANCKOVA TEORIE ZÁŘENÍ DOKONALE ČERNÉHO TĚLESA Planckova teorie záření dokonale černého tělesa (ideálního zářiče) vychází z teorie klasické, v jejímž rámci je aplikována kvantová hypotéza pro lineární harmonický oscilátor.
Podle této hypotézy (a statistické mechaniky) je nutno střední energii lineárního harmonického oscilátoru o charakteristické úhlové frekvencí ω počítat podle vztahu E exp − n n =0 k BT , e(T ) = +∞ E exp − n ∑ n=0 k BT +∞
∑E
n
kde k B je Boltzmannova konstanta a En = n ω . Dosazením za En se jmenovatel uvedené formule změní na prostou geometrickou řadu
∑
+∞ n =0
qn
, kde
ω q = exp − . k BT Její součet nalezneme snadno pomocí známého vzorce +∞
∑ q = (1 − q ) n
−1
.
n =0
Obdobně získáme pro čitatele výše uvedené formule pro e(T) po dosazení za En a po úpravách +∞ +∞ En d +∞ n ωq n exp . − = = E ω nq ω q q = ∑ ∑ ∑ n 2 dq n = 0 n=0 n=0 (1 − q ) k BT A nakonec kombinací výrazů pro jmenovatele a čitatele, do nichž dosadíme zpět za pomocnou proměnnou q = exp ( − ω / k BT ) , získáme konečný vzorec pro střední tepelnou energii lineárního harmonického oscilátoru
8
ω ω
e(T ) =
.
exp −1 k BT
Ten pak užijeme postupem stejným jako v případě klasické teorie k nalezení formule udávající závislost spektrální hustoty energie dutinového záření na zadané teplotě a úhlové frekvenci. Tato formule tentokrát nabývá tvaru
ε (ω , T ) =
ω3 π c
2 3
ω ω
,
exp −1 k BT
což je proslulý Planckův zákon [1]. Tento zákon dokonale souhlasí s empirickým Planckovým zákonem, a tudíž velmi přesně vystihuje dostupná experimentální data. V limitě nízkých frekvencí,
ω << k BT , je možno užít přibližného výrazu ω ω exp , ≈ 1+ k BT k BT
který po dosazení převede Planckův zákon na klasický zákon Rayleighův-Jeansův. Můžeme tedy formulovat následující závěr: Klasický popis záření dokonale černého tělesa je vhodný, pokud střední tepelná energie lineárních harmonických oscilátorů, jejichž pomocí elektromagnetické pole popisujeme, je mnohem větší než odpovídající Planckovo kvantum energie. LITERATURA [1]
PLANCK, M. Annalen der Physik, 1901, Bd. 4, S. 553.
2.3 EINSTEINOVA FOTONOVÁ HYPOTÉZA Chápeme-li elektromagnetické pole jako soustavu nezávislých lineárních harmonických oscilátorů, můžeme podle Planckovy kvantové hypotézy předpokládat, že se jeho celková energie bude měnit skokem - pro danou vlnovou délku λ (resp. frekvenci ν ) o kvantum hν, kde h je (neškrtnutá) Planckova konstanta. Zatímco Planck pohlížel na elektromagnetické pole jako na zvláštní typ kontinua, jehož energie se mění skokem, německý fyzik A. Einstein šel v této představě ještě dále. Předpokládal, že toto kontinuum je ve skutečnosti samo tvořeno kvanty elektromagnetické energie, částicemi pohybujícími se rychlostí světla [1]. Ty byly později nazvány fotony. Celková energie každé z těchto částic je podle Einsteina dána vztahem
9
E = hν. Již dříve však bylo známo, že elektromagnetické záření nese nenulovou hybnost, která souvisí s jeho energií prostřednictvím jednoduchého vztahu E = pc. Sloučením této rovnice a Einsteinova vztahu pro energii fotonu získáme proto pro jeho hybnost p=
h . λ
Skoková změna celkové energie elektromagnetického pole je pak ovšem podmíněna procesem vzniku (vyzářením) či zániku (absorpcí) jednoho fotonu. Částicové představy o elektromagnetickém záření byly s velkým úspěchem využity samotným Einsteinem při vysvětlení v rámci klasické fyziky nepochopitelného chování elektronů v tzv. fotoelektrickém jevu (Einsteinova teorie fotoelektrického jevu) a experimentálně prokázány A. H. Comptonem při rozptylu paprsků X na volných elektronech (Comptonův jev). Zatímco fyzika 19. století nahlížela na světlo jako na vlnění, Einstein se svou fotonovou hypotézou částečně navrací k částicovým představám Newtonovým. Ve skutečnosti však elektromagnetické záření (a tedy i světlo) není pouze vlněním, ani pouze proudem částic: je současně obojím. Vše totiž závisí na experimentálních podmínkách, v nichž se nachází. Elektromagnetické pole je fyzikální objekt, u nějž za jistých okolností převažují vlnové vlastnosti a jindy zase vlastnosti částicové. Hovoříme proto o vlnově-korpuskulárním dualismu světla. Konzistentní interpretaci Einsteinovy fotonové hypotézy poskytla až kvantová elektrodynamika. LITERATURA [1]
EINSTEIN, A. Annalen der Physik, 1905, Bd. 17, S. 132.
2.4 EINSTEINOVA TEORIE FOTOELEKTRICKÉHO JEVU Při teoretickém zdůvodnění [1] některých klasicky nepochopitelných závěrů, které byly učiněny na základě experimentálního studia fotoemise elektronů z kovu (vnější fotoelektrický jev), vycházel A. Einstein ze své fotonové hypotézy. Podle Einsteina je fotoemise každého elektronu důsledkem pohlcení (absorpce) jednoho kvanta elektromagnetického záření, fotonu. Během tohoto procesu foton zaniká a předává svou energii elektronu. Ta je pak částečně využita k úniku elektronu z kovu a zbytek přeměněn na jeho kinetickou energii. Einstein pracoval s velmi jednoduchým modelem krystalu kovu, který si představoval jako krabici, v níž je elektron vázán konstantní vazebnou energií. K opuštění krystalu musíme proto elektronu dodat energii, která je alespoň rovna této energii vazebné. Ta se obvykle nazývá výstupní práce a je pro daný kov charakteristickou konstantou. Ze zákona zachování energie vyplývá 10
hν = A + ∆E + Ekin , kde hν je energie dopadajícího fotonu, A výstupní práce, Ekin kinetická energie emitovaného elektronu a ∆E reprezentuje energetické ztráty elektronu doprovázející jeho emisi z krystalu kovu (např. v důsledku nepružných srážek s krystalickou mřížkou). Maximální kinetické energie dosáhne elektron, pokud jsou ztráty ∆E nulové. Pak můžeme psát (max) hν = A + Ekin
a po přechodu k vlnovým délkám
1 1 (max) Ekin = hc − , λ λmax kde h je Planckova konstanta, c rychlost světla ve vakuu a kde jsme zavedli A=
hc
λmax
.
Výraz získaný Einsteinem pro maximální kinetickou energii elektronů vylétávajících z kovu po ozáření elektromagnetickým zářením je v dokonalé shodě, na rozdíl od závěrů klasických, s experimentálním zákonem. Také další experimentální fakta jsou v rámci Einsteinovy teorie vysvětlena zcela přirozeně: •
Časová prodleva mezi dopadem záření na krystal kovu a fotoemisí elektronů je dána typickým −9 časem absorpce fotonu elektronem. Ten je, jak bylo experimentálně zjištěno, řádově roven 10
s. •
Existence maximální vlnové délky záření, pro kterou ještě může dojít k fotoemisi elektronu, vyplývá z nezápornosti kinetické energie. Musí totiž platit
1 1 (max) = hc − 0 ≤ Ekin , λ λmax a tedy i
λ ≤ λmax . Velký význam fotoelektrického jevu pro další rozvoj fyziky na přelomu 19. a 20. století spočíval především v tom, že byl prvním pozorovaným dokladem částicového chování elektromagnetického záření. 11
LITERATURA [1]
EINSTEIN, A. Annalen der Physik, 1905, Bd. 17, S. 132.
2.5 SOMMERFELDOVA KVANTOVÁ TEORIE SOMMERFELDOVA-WILSONOVA KVANTOVACÍ PODMÍNKA Zobecněním Planckovy kvantové hypotézy a Bohrova modelu atomu vodíku dospěli německý fyzik Sommerfeld a jeho americký kolega Wilson k obecné metodě kvantování systémů s periodickými stupni volnosti [1], [2], [3], tj. s takovými stupni volnosti, jejichž zobecněné souřadnice qi a jim přidružené hybnosti pi jsou periodickými funkcemi času. Výše zmíněná metoda kvantování periodických stupňů volnosti spočívá ve splnění tzv. Sommerfeldovy-Wilsonovy kvantovací podmínky, která říká, že ze všech klasicky přípustných evolucí periodického stupně volnosti ( pi , qi ) systému jsou realizovatelné pouze ty, které splňují
∫ p dq i
i
= ni h,
kde h je (neškrtnutá) Planckova konstanta a ni v závislosti na charakteru studovaného systému vhodně zvolené celé číslo. Integrál na levé straně Sommerfeldovy-Wilsonovy kvantovací podmínky počítáme obvyklým způsobem
∫ p dq i
i
=
t0 +Ti
∫
pi (t )qi (t )dt ,
t0
kde časové závislosti hybnosti pi (t ) a zobecněné souřadnice qi (t ) jsou dány řešením klasických pohybových rovnic (např. rovnic Hamiltonových). Časový počátek t0 můžeme zvolit zcela libovolně. Je-li integrand periodický s periodou Ti , výsledek integrace na této volbě nezávisí. Použití Sommerfeldovy-Wilsonovy kvantovací podmínky je tedy dvoustupňové a zahrnuje •
řešení klasických pohybových rovnic pro studovaný systém nebo nalezení závislosti pi (qi ),
•
aplikaci Sommerfeld-Wilsonovy podmínky na periodické stupně volnosti.
Velmi názorné je její použití pro následujících dva jednoduché systémy •
lineární harmonický oscilátor,
•
atom vodíku.
12
SYSTÉMY S JEDNÍM STUPNĚM VOLNOSTI Poměrně jednoduše můžeme integrál na levé straně Sommerfeldovy-Wilsonovy kvantovací podmínky vypočítat, je-li možno hybnost pi psát jako funkci zobecněné souřadnice qi . Např. pro systém popsaný jedinou zobecněnou souřadnicí q, v němž se zachovává celková energie p2 E= + V (q ), 2m platí
p ( q ) = ± 2m ( E − V ( q ) ) , kde znaménko „+“ odpovídá pohybu od qmin k qmax a znaménko „-“ pohybu v opačném směru. Souřadnice qmin < qmax reprezentují tzv. klasické body obratu, a splňují tedy V(q) = 0. V tomto speciálním případě je možno integrál na levé straně Sommerfeldovy-Wilsonovy kvantovací podmínky přepsat do jednoduchého tvaru
∫
pdq =
qmax
∫
2m ( E − V (q) )dq +
qmin
qmin
∫
qmax
=2
qmax
∫
− 2m ( E − V (q) ) dq =
2m ( E − V (q) )dq.
qmin
LITERATURA [1] [2] [3]
SOMMERFELD, A. Annalen der Physik, 1916, Bd. 51, S. 1. WILSON, W. Philosophical Magazine, 1915, vol. 29, p. 795. WILSON, W. Philosophical Magazine, 1916, vol. 31, p. 156.
2.6 SOMMERFELDOVA TEORIE LINEÁRNÍHO HARMONICKÉHO OSCILÁTORU Teoretický popis lineárního harmonického oscilátoru zahrnuje v rámci Sommerfeldovy kvantové teorie dva kroky: •
řešení klasických pohybových rovnic elektronu v poli bodového jádra,
•
aplikaci Sommerfeldovy-Wilsonovy kvantovací podmínky.
ŘEŠENÍ KLASICKÝCH POHYBOVÝCH ROVNIC Řešením klasických pohybových rovnic (např. rovnic Hamiltonových) pro lineární harmonický oscilátor o hmotnosti m a kruhové frekvenci ω získáme následující časové závislosti souřadnice q a hybnosti p: q (t ) = q0 cos(ω t + φ ), 13
p (t ) = -mω q0 sin(ω t + φ ). Hodnoty integračních konstant q0 (amplituda) a φ (fáze oscilací) určujeme pomocí počátečních podmínek.
POUŽITÍ SOMMERFELDOVY-WILSONOVY KVANTOVACÍ PODMÍNKY Dosazením výše uvedených klasických výrazů pro časový vývoj souřadnice a hybnosti do Sommerfeldovy-Wilsonovy kvantovací podmínky získáme T
2π ω
0
0
∫ p(t )q(t )dt = ∫
a po snadné úpravě, kdy zavedeme
mq02 ω 2 sin 2 (ω t + φ ) dt = mq02ωπ = nh
= h / 2π , 1 mq02ω 2 = n ω . 2
Uvědomíme-li si však, že levá strana poslední z uvedených formulí je celková energie lineárního harmonického oscilátoru, vidíme, že výsledek plynoucí ze Sommerfeldovy-Wilsonovy kvantovací podmínky je totožný se Planckovou kvantovou hypotézou En = n ω , kde n je celé nezáporné číslo.
POZNÁMKA Zajímavé je zajisté porovnání výše získaného výsledku s formulí plynoucí z řešení stacionární Schrödingerovy rovnice pro lineární harmonický oscilátor En = ( n +1/ 2 ) ω . Oba výsledky, kvantověmechanický a Sommerfeldův, souhlasí navzájem pouze pro vyšší hodnoty kvantového čísla n. To ovšem nepřekvapuje, vezmeme-li v úvahu to, co je uvedeno v části věnované kvaziklasickému přiblížení. Podle toho je totiž Sommerfeldova kvantová teorie pouhým přiblížením přesné teorie kvantové. Na příkladu lineárního harmonického oscilátoru tak velmi názorně vidíme, jak Sommerfeldova kvantová teorie leží co do přesnosti popisu fyzikálních systémů někde mezi klasickou a kvantovou mechanikou.
2.7 SOMMERFELDOVA TEORIE ATOMU VODÍKU Sommerfeldův model atomu vodíku vychází z Rutherfordovy představy atomu: Téměř celá hmotnost atomu je soustředěna v jeho kladně nabitém jádře, které považujeme vzhledem k jeho rozměrům za bodové. Kolem něj obíhají podle zákonů klasické mechaniky záporně nabité elektrony. I je považujeme za bodové částice. Relativistické efekty, které je možno do Sommerfeldovy teorie zahrnout, níže neuvažujeme. Sommerfeldův model atomu vodíku je zobecněním jednoduššího modelu Bohrova. 14
Popis atomu vodíku zahrnuje v rámci Sommerfeldovy kvantové teorie dva kroky: •
řešení klasických pohybových rovnic elektronu v poli bodového jádra,
•
aplikaci Sommerfeldovy-Wilsonovy kvantovací podmínky.
KLASICKÁ TEORIE ATOMU VODÍKU Pohyb elektronu kolem jádra můžeme s rozumnou mírou přesnosti popsat jako pohyb záporně nabité částice v poli kladného bodového náboje umístěného v počátku souřadnic. Elektron a jádro na sebe navzájem působí elektrostatickou silou popsanou Coulombovým zákonem. Proto je možno potenciální energii (potenciál) systému psát ve tvaru 1 e2 , V (r ) = − 4πε 0 r kde r je vzdálenost elektronu od počátku souřadnic, e elementární elektrický náboj a ε 0 permitivita vakua. Problém pohybu elektronu v poli jádra tedy odpovídá problému pohybu bodové částice v poli centrální síly. Podle klasické mechaniky je tento pohyb rovinný a bez újmy na obecnosti můžeme tedy předpokládat, že se studovaný elektron pohybuje v souřadnicové rovině (x,y). Vzhledem k symetrii potenciálu V je výhodné užít při řešení problému tzv. polární souřadnice r a ϕ a pro celkovou energii elektronu psát pϕ2 p2 E= r + + V (r ), 2me 2me r 2 kde pr a pϕ jsou zobecněné hybnosti sdružené se zobecněnými souřadnicemi r a ϕ a me je hmotnost elektronu. Z klasické mechaniky navíc plyne, že zobecněná hybnost pϕ je, podobně jako celková energie E, integrálem pohybu. Protože pϕ není ničím jiným než momentem hybnosti studovaného elektronu, budeme ji v dalším označovat symbolem L. Z výše uvedeného výrazu pro celkovou energii proto plyne L2 pr (r ) = ± 2me E − − V (r ) . 2 2me r
POUŽITÍ SOMMERFELDOVY-WILSONOVY KVANTOVACÍ PODMÍNKY Pohyb nabité částice v coulombickém poli je periodický. Můžeme tedy pro oba stupně volnosti – radiální (r , pr ) i úhlový (ϕ , pϕ ) – použít Sommerfeldovu-Wilsonovu kvantovací podmínku. Pro (ϕ , pϕ ) je možno integrál na levé straně kvantovací podmínky snadno spočítat – nezapomeňme, že pϕ je konstanta, kterou jsme označili L,
∫
pϕ dϕ =
2π
∫ Ldϕ = 2π L. 0
Kvantovací podmínka pro úhlový stupeň volnosti proto nabývá tvaru
2π L = nL h,
15
kde nL je tzv. vedlejší kvantové číslo. Protože moment hybnosti elektronu obíhajícího kolem kladně nabitého jádra nemůže být nulový, může nL nabývat pouze kladných celočíselných hodnot,
nL = 1, 2,... Všimněte si též, že výše uvedená kvantovací podmínka pro moment hybnosti je totožná s kvantovací podmínkou Bohrovou. Pro radiální stupeň volnosti je Sommerfeldova-Wilsonova podmínka poněkud komplikovanější rmax
2
∫
rmin
L2 1 e2 2me E − + dr = nr h, 2me r 2 4πε 0 r
kde nr je radiální kvantové číslo a klasické body obratu rmin a rmax nalezneme řešením nelineární rovnice pr2 L2 1 e2 + − = 0. 2me 2me r 2 4πε 0 r Přes nemalé technické potíže je možno integrál na levé straně kvantovací podmínky pro radiální stupeň volnosti po jistém úsilí vypočítat a získat tak vztah pro kvantování celkové energie E En = −
me e 4 1 , 8ε 02 h 2 n 2
kde n ≡ nr + nL je tzv. hlavní kvantové číslo. Z uvedené formule vyplývá, že toto kvantové číslo musí nabývat kladných celočíselných hodnot, n = 1, 2 atd., neboť celková energie elektronu vázaného v poli kladně nabitého jádra musí být, pokud disociovanému stavu přiřadíme nulovou energii, záporná. Všimněme si, že kvantování energie v rámci Sommerfeldova modelu souhlasí bezezbytku s výsledky jednoduššího modelu Bohrova. Zatímco však v rámci Bohrova modelu odpovídá každé hodnotě energie jediná trajektorie elektronu – kružnice, v modelu Sommerfeldově je to soustava elips navzájem se lišících hodnotou vedlejšího kvantového čísla nL . Vzhledem k tomu, že radiální kvantové číslo nr nemůže být záporné, musí nL pro zadané hlavní kvantové číslo n nabývat hodnot nL = 1, 2,..., n − 1. Připojený obrázek znázorňuje tvar těchto elips pro vybrané hodnoty hlavního kvantového čísla.
16
n=1
n=2
n=3
nL = 3 nL = 2
nL = 2 nL = 1
nL = 1
3. Vlnové vlastnosti částic 3.1 Davisson-Germerův pokus
3.1 DAVISSONŮV - GERMERŮV POKUS Roku 1927 prokázali Američané Davisson a Germer [1] a nezávisle na nich i Angličan G. P. Thomson [2], [3] správnost de Broglieho vlnové hypotézy prostřednictvím experimentu, v němž pozorovali difrakci elektronů na krystalické mřížce niklu.
METODA Samotná de Broglieho hypotéza předpokládající za jistých okolností vlnové chování částic je v rámci klasické fyziky natolik neobvyklá, že by byla bez experimentálního potvrzení zajisté zavržena. S trochou nadsázky můžeme proto říci, že jí pevné místo v rámci moderní fyziky zajistila teprve Davissonova, Germerova a Thomsonova měření. Jak ovšem vlnové chování klasických částic experimentálně prokázat? Inspiraci mohli zmínění experimentátoři hledat, a taky najít, v optice první poloviny 19. století. Tehdy se totiž podařilo nade vši pochybnost prokázat vlnové vlastnosti světla prostřednictvím jeho ohybu (difrakce) na malých aperturách (viz např. slavný experiment Youngův). Podat experimentální důkaz vlnových vlastností klasických částic znamená proto pozorovat jejich difrakci. 17
To ovšem může být technicky velmi obtížné, protože ohybové (difrakční) jevy pozorujeme v optice jen tehdy, je-li charakteristický rozměr soustavy, na níž difrakci hodláme pozorovat - např. mřížková konstanta - srovnatelný s vlnovou délkou použitého záření. Předpokládáme, že stejné omezení zůstává v platnosti i pro vlny de Broglieho. Proto si nejdříve udělejme alespoň namátkovou inventuru vlnových délek, které můžeme podle de Broglieho hypotézy u některých těles očekávat. Objekt
Rychlost
Hmotnost
běžící člověk
[m/s] 2
[kg] 70
zrnko písku
1
10−3
6, 6 .10−31
502
5, 0 .10−26
2, 6 .10−11
4,3 .104
1, 7 .10−27
9, 0 .10−12
1,8 .106
10 −30
3, 7 .10−10
molekula dusíku proton elektron
a
b
c
De Broglieho vlnová délka [m] 4, 7 .10−36
(a) Molekula dusíku pohybující rychlostí odpovídající střední kvadratické rychlosti molekul v plynu při teplotě 300 K, (b) proton urychlený potenciálovým rozdílem 10 V, (c) elektron urychlený potenciálovým rozdílem 10 V.
Z uvedené tabulky, jakkoliv neúplné, je zřejmé, že de Broglieho vlnové délky přiřazené makroskopickým objektům (A, B) jsou beznadějně malé na to, abychom pro ně vůbec nějakou difrakci mohli pozorovat. I pro těžší objekty mikrosvěta (molekuly, atomy či protony) jsou získané vlnové délky velmi malé. K pozorování difrakce bychom museli mít v případě těchto objektů k dispozici příliš jemnou mřížku. Naopak poměrně příznivá situace nastává pro lehké, nepříliš urychlené elektrony. Jejich vlnové délky totiž odpovídají zhruba vzdálenostem krystalických rovin v krystalech pevných látek. Přímo se proto nabízí možnost pokusit se pozorovat difrakci lehkých elektronů na krystalických rovinách vhodně zvoleného monokrystalu. Tato idea nebyla koneckonců v roce 1927 nová. Již dříve ji využil německý fyzik Max von Laue k důkazu vlnového charakteru Röntgenových paprsků X.
EXPERIMENT
Z D
Davisson a Germer pozorovali difrakci elektronů na krystalických rovinách monokrystalu niklu. Elektronovým dělem Z ozařovali ve vysokoteplotní peci vyžíhaný monokrystal niklu N a detektorem D měřili počet odražených elektronů v různých směrech. A získali velmi zajímavé výsledky: Kromě výrazného a v rámci částicové interpretace dobře pochopitelného maxima počtu elektronů odražených od povrchu krystalu ve směru zpět k elektronovému dělu pozorovali navíc i další maximum. To souviselo s difrakčními efekty.
N 18
elektrony
Velmi zřetelné bylo toto maximum pro elektrony urychlené potenciálovým rozdílem 54 V, kdy se difrakční maximum elektrony odrážely, jak ukazuje připojený obrázek, s převahou do směru svírajícího s krystalovými o rovinami monokrystalu niklu úhel θ = 65 . o Tomuto výraznému ohybovému maximu odpovídá Θ = 65 vlnová délka dopadajících elektronů λ = 0,165 nm. Z experimentálních dat ji můžeme krystalické monokrystal vypočítat, zanedbáme-li výstupní práci krystalu roviny niklu niklu, z Braggovy rovnice N λ = 2a sin θ , v níž položíme řád difrakčního maxima N = 1 a kde a je vzdálenost krystalových rovin v monokrystalu niklu (0,091 nm) a θ výše uvedený úhel. Podle de Broglieho teorie je vlnová délka elektronu urychleného na energii Ek = 54 eV rovna λ = 0,166 nm, což je ovšem v dokonalé shodě s hodnotou experimentální. Na základě výše uvedeného můžeme tedy vyslovit závěr, že elektrony vykazují při rozptylu na krystalu niklu vlnové chování (difrakční maximum). Experimentální data jsou navíc v kvantitativní shodě s teoretickou předpovědí plynoucí z de Broglieho vztahů.
ROZŠÍŘENÍ EXPERIMENTU Difrakce na krystalických mřížkách byla pozorována nejen pro elektrony, ale i pro těžší částice. Tak např. v roce 1930 němečtí fyzikové Esterman, Frisch a Stern pozorovali difrakční efekty pro atomy helia bombardující monokrystal fluoridu lithia (LiF) a později Mitchell a Powers i pro neutrony bombardující monokrystal oxidu hořečnatého (MgO) [4]. LITERATURA [1] [2] [3] [4] [5] [6]
DAVISSON, C. and GERMER, LH. Physical Review, 1927, vol. 30, p. 705. THOMSON, GP. and REID, A. Nature, 1927, vol. 119, p. 890. THOMSON, GP. Proceedings of the Royal Society of London, 1928, vol. 117, p. 600. MITCHELL, DP. and POWERS, PN. Physical Review, 1936, vol. 50, p. 486. HAJKO, V., aj. Fyzika v experimentoch. 1. vyd. Bratislava: Veda, 1988. 415 s. s. 70-75. BEISER, A. Úvod do moderní fyziky. 1. vyd. Praha: Academia, 1978. 628 s. s. 100-104.
4. Kvantová mechanika 4.1 Vlnová funkce 4.1.1 4.1.2 4.1.3 4.1.4 4.1.5 4.1.6
Monochromatické de Broglieho vlny Vlnové balíky Princip superpozice X a P-reprezentace vlnové funkce První Bornův postulát Druhý Bornův postulát
19
4.1.7 Střední hodnoty a fluktuace polohy a hybnosti 4.1.8 Heisenbergovy relace neurčitosti pro polohu a hybnost 4.1.9 Obecná reprezentace stavu v kvantové mechanice 4.1.10 Bra-ketová symbolika
4.2 Stacionární Schrödingerova rovnice 4.2.1 Okrajové podmínky pro SSR 4.2.2 Energetické spektrum
4.3 Nestacionární Schrödingerova rovnice 4.3.1 Rovnice kontinuity pro hustotu pravděpodobnosti 4.3.2 Obecné řešení NSR 4.3.3 Kvantový determinismus
4.4 Korespondence mezi klasickou a kvantovou mechanikou 4.5 Dynamické proměnné 4.5.1 4.5.2 4.5.3 4.5.4 4.5.5 4.5.6 4.5.7
Dirakovy kvantovací podmínky Poloha a hybnost Energie Moment hybnosti Střední hodnoty a střední kvadratické fluktuace Relace neurčitosti Relace neurčitosti - podrobné odvození
4.6 Částice ve vnějším elektromagnetickém poli 4.6.1 Hamiltonova funkce nabité částice ve vnějším elektromagnetickém poli 4.6.2 Spin
4.7 Kvantová mechanika a teorie relativity 4.8 Vícečásticové systémy 4.8.1 4.8.2 4.8.3 4.8.4 4.8.5
Nerozlišitelné částice Soustavy neinteragujících částic Slaterovy determinanty Pauliho vylučovací princip Hartree-Fockova metoda self-konzistentního pole
4.7 Jednoduché kvantově-mechanické systémy 4.9.1 Volná částice 4.9.2 Volná částice - podrobné řešení 4.9.3 Jednorozměrná pravoúhlá potenciálová jáma nekonečné hloubky 4.9.4 Jednorozměrná pravoúhlá potenciálová jáma nekonečné hloubky - podrobné řešení SSR 4.9.5 Jednorozměrná pravoúhlá potenciálová jáma konečné hloubky 4.9.6 Jednorozměrná pravoúhlá potenciálová jáma konečné hloubky - podrobné řešení SSR 4.9.7 Trojrozměrná pravoúhlá potenciálová jáma nekonečné hloubky 4.9.8 Trojrozměrná pravoúhlá potenciálová jáma nekonečné hloubky - podrobné řešení SSR 4.9.9 Lineární harmonický oscilátor 4.9.10 Lineární harmonický oscilátor - podrobné řešení SSR 4.9.11 Trojrozměrný harmonický oscilátor 4.9.12 Trojrozměrný harmonický oscilátor - podrobné řešení SSR 4.9.13 Tuhý rotátor 4.9.14 Rovinný tuhý rotátor - podrobné řešení 4.9.15 Pole centrálních sil 4.9.16 Jednorozměrná potenciálová bariéra 4.9.17 Jednorozměrná pravoúhlá potenciálová bariéra 4.9.18 Jednorozměrná pravoúhlá potenciálová bariéra - podrobné řešení SSR
20
4.10 Přibližné metody v kvantové teorii 4.10.1 Stacionární poruchová teorie 4.10.2 Variační metoda 4.10.3 Kvaziklasické přiblížení 4.10.4 Bornova-Oppenheimerova aproximace 4.10.5 Nestacionární poruchová teorie 4.10.6 Stacionární poruchová teorie. Podrobný výpočet pro nedegenerované diskrétní spektrum. 4.10.7 Nestacionární poruchová teorie. Podrobný výpočet pro nedegenerované diskrétní spektrum.
4.1.1 MONOCHROMATICKÉ DE BROGLIEHO VLNY ROVINNÉ MONOCHROMATICKÉ DE BROGLIEHO VLNY De Broglie přiřazuje volné částici s přesně zadanou hybností p a energií E vlny charakterizované ostrou hodnotou vlnového vektoru k a úhlové frekvence ω. Souvislost mezi částicovými a vlnovými parametry udávají de Broglieho vztahy. Volné částici je přiřazena rovinná monochromatická vlna
{(
)}
ψ (r , t ) = A exp i k .r − ω t , kterou můžeme pomocí de Broglieho vztahů přepsat též do tvaru i ( p.r − Et ) .
ψ (r , t ) = A exp
Připomeňme, že stav volné částice s přesně definovanou hybností a energií není v rámci kvantové mechaniky přípustný.
OBECNÉ MONOCHROMATICKÉ DE BROGLIEHO VLNY To, co není přípustné pro volné částice, je možno za jistých okolností realizovat v případě částic nacházejících se ve vnějším silovém poli. Částice se v takovém případě může nacházet ve stavu s přesně definovanou energií a v rámci de Broglieho teorie jí přiřazujeme monochromatickou vlnu, tentokrát však již nikoliv rovinnou. Speciální charakter takové vlny se projeví v separaci prostorové a časové závislosti odpovídající vlnové funkce:
i
ψ (r , t ) = Ψ (r ) exp ( −iω t ) = Ψ (r ) exp − Et . Vlnové funkce výše uvedeného tvaru se obvykle nazývají stacionárními vlnovými funkcemi. Jejich prostorová část Ψ je dána řešením stacionární Schrödingerovy rovnice. Stacionární vlnová funkce odpovídá částici s přesně definovanou a během časového vývoje se zachovávající energií. Z klasické mechaniky však víme, že se energie hmotného bodu zachovává 21
pouze v časově neproměnných potenciálových polích. Monochromatická de Broglieho vlna tedy reprezentuje speciální stav bodové částice v časově neproměnném poli vnějších sil. Podle prvního Bornova postulátu je fyzikálně relevantní pouze kvadrát absolutní hodnoty vlnové 2
2
funkce. Pro stacionární vlnové funkce však platí ψ (r , t ) = Ψ (r ) a fyzikálně relevantní část vlnové funkce je tedy časově nezávislá. Odtud je zřejmý i původ názvu „stacionární vlnová funkce“.
ČÁSTICE VÁZANÁ NA PŘÍMKU Často je výhodné, zejména z důvodu snadné řešitelnosti konkrétních problémů a úloh, předpokládat, že se studovaná částice může pohybovat pouze podél zadané přímky. Souřadnici takové částice pak popisujeme jediným reálným parametrem x. V takovém případě nabývají vlnové funkce reprezentující de Broglieho monochromatické vlny jednodušších tvarů: i ( px − Et )
ψ ( x, t ) = A exp pro rovinnou monochromatickou vlnu a
i
ψ ( x, t ) = Ψ ( x) exp − Et pro monochromatickou vlnu obecnou. Uvedené tvary vlnových funkcí částice vázané na přímku budeme nazývat jednorozměrnými stacionárními vlnovými funkcemi.
POZNÁMKA V tuto chvíli by mohla být vyslovena oprávněná námitka, proč v případě rovinných monochromatických de Broglieho vln neuvažujeme i tvar i ψ (r , t ) = A exp i k .r + ω t = A exp ( p.r + Et , který rovněž vyhovuje vlnové rovnici, a pro obecnou monochromatickou vlnu i tvar i ψ (r , t ) = Ψ (r ) exp ( iω t ) = Ψ (r ) exp Et . Důvod je poměrně prostý. Ukážeme si jej na jednoduchém případě rovinné monochromatické vlny.
{(
)}
Vlnová funkce ψ ( r , t ) = A exp{i ( k .r − ω t )} popisuje totiž vlnu, jejíž rovinné vlnoplochy se šíří ve směru vlnového vektoru k , a tedy i ve směru hybnosti p částice, jíž je tato vlna přiřazena. Na druhé straně však vlnová funkce ψ ( r , t ) = A exp{i ( k .r + ω t )} zadává vlnoplochy šířící se ve směru − k , tedy proti směru pohybu studované částice. První vlnová funkce je proto pro vlnový popis částice s hybností p přijatelná a druhá musí být odmítnuta jako nefyzikální.
22
Ač podobnou úvahu nemůžeme provést pro obecnou monochromatickou vlnu, jistě nepřekvapí, že i v tomto, obecnějším případě předpokládáme časový faktor ve tvaru exp ( −iω t ) a nikoliv ve tvaru
exp ( iω t ) . Abychom však byli korektní, uveďme, že zde odmítnuté tvary monochromatických vlnových funkcí hrají jistou roli v rámci relativistické kvantové mechaniky.
4.1.2 VLNOVÉ BALÍKY VLNOVÁ FUNKCE REPREZENTUJÍCÍ VOLNOU ČÁSTICI Stav volné částice s ostře definovanou hybností (a tedy i energií), reprezentovaný v rámci de Broglieho vlnové teorie rovinnou monochromatickou vlnou, není fyzikálně přípustný (viz též důsledky prvního Bornova postulátu). V rámci vlnových představ nemůže mít proto volná částice přesně zadánu ani energii, ani hybnost. I v klasické fyzice je však nutno tvrzení, že nějaká veličina - např. energie - nabývá ostře definované hodnoty, chápat jako nadsázku. Hodnoty všech veličin totiž zjišťujeme měřením a každé měření je zatíženo nenulovými experimentálními chybami. Korektní kvantitativní výpověď o libovolné veličině X proto vždy současně s její (střední) hodnotou x udává i odhad chyby měření této veličiny ∆x. Říkáme-li pak, že veličina X nabývá hodnoty x , máme vždy na mysli, že ve skutečnosti může, zhruba řečeno, nabývat všech hodnot z intervalu ( x − ∆x, x + ∆x ). To ovšem naznačuje možnost, jak částici s dostatečně „ostře definovanou“ energií a hybností v rámci de Broglieho vlnového modelu reprezentovat. Odpovídající
vlnovou
funkci
můžeme
psát
ve
tvaru
lineární
kombinace
rovinných
monochromatických vln, jejichž vlnové vektory (a tedy i frekvence) se navzájem příliš neliší. Neurčitost energie a hybnosti pak zaniká v experimentálních chybách. Takovou vlnovou funkci nazveme vlnovým balíkem. Protože máme k dispozici nespočetné množství těchto vln, bude odpovídající lineární kombinace nabývat integrálního tvaru
{(
)}
ψ (r , t ) = ∫ ψ (k ) exp i k .r − ω t d 3k , 3
kde funkční hodnoty ψ (k ) jsou nenulové (nezanedbatelné) pouze na „malém“ okolí vybrané hodnoty vlnového vektoru k0 . Závislost úhlové frekvence ω, vyskytující se v integrandu výše uvedeného integrálu, na vlnovém vektoru k je dána disperzní relací pro de Broglieho vlny. Pro vlnovou funkci ψ navíc požadujeme, aby byla silně lokalizována kolem vybraného bodu v prostoru. Tento předpoklad je jistě přirozený, má-li ψ reprezentovat bodovou částici s dostatečnou přesností. Speciálně musí být tento požadavek splněn ve zvoleném počátečním čase, např. t = 0. Pak ovšem funkce
23
( )
ψ 0 (r ) = ψ (r , 0) = ∫ ψ (k ) exp ik .r d 3 k 3
může nabývat nezanedbatelných hodnot pouze na „malém“ okolí vybraného bodu r0 .
ŠÍŘENÍ VLNOVÉHO BALÍKU PROSTOREM - PŘIBLÍŽENÍ PRVNÍHO ŘÁDU Výpočet integrálu popisujícího vlnový balík je v obecném případě poměrně komplikovanou matematickou úlohou. Zjednodušit ji můžeme, uvědomíme-li si, že k tomuto integrálu přispívá jeho integrand významně jen pro hodnoty vlnového vektoru k , které jsou blízké zvolené hodnotě k0 . Jinde jsou totiž funkční hodnoty ψ (k ) nulové (nebo alespoň zanedbatelně malé). Proto můžeme argument imaginární exponenciály aproximovat v počítaném integrálu pomocí Taylorova rozvoje na okolí bodu k0 . Pro jednoduchost se omezíme na rozvoj prvního řádu v mocninách k − k0 k .r − ω (k )t ≈ k0 .r − ω (k0 )t + r − ∇ k ω (k0 )t .(k − k0 ), kde ∇ k označuje gradient podle složek vlnového vektoru. Po jednoduchých úpravách můžeme pro vlnovou funkci ψ v uvedeném přiblížení psát
(
)
{
}
ψ (r , t ) ≈ exp −i ω (k0 ) − k0 .∇ k ω (k0 ) t ∫ ψ (k ) exp i r − ∇ k ω (k0 )t .k d 3k , 3
a využijeme-li výše uvedené počáteční podmínky
( )
ψ 0 (r ) = ψ (r , 0) = ∫ ψ (k ) exp ik .r d 3 k , 3
též
(
) (
)
ψ (r , t ) = exp −i ω (k0 ) − k0 .∇ k ω (k0 ) t ψ 0 r − ∇ k ω (k0 )t .
Jak vyplývá z prvního Bornova postulátu, je přímo měřitelný a fyzikálně podstatný pouze kvadrát absolutní hodnoty ψ , pro který lze psát 2
(
ψ (r , t ) = ψ 0 r − ∇ k ω (k0 )t
)
2
.
Můžeme proto konstatovat, že s přesností do prvního řádu v mocninách k − k0 se vlnový balík pohybuje prostorem rovnoměrně přímočaře rychlostí v g = ∇ k ω (k0 ) a jeho tvar se nemění. Tuto rychlost nazýváme rychlostí grupovou. Pro de Broglieho vlny odpovídá rychlosti částice s hybností p0 = k0 . Získaný výsledek je tak zcela v souladu s očekáváním klasické mechaniky volná částice se pohybuje prostorem rovnoměrně přímočaře rychlostí, která jí byla udělena v počátečním čase (1. Newtonův zákon).
24
ŠÍŘENÍ VLNOVÉHO BALÍKU PROSTOREM - NEKLASICKÉ EFEKTY Naprostý soulad klasického a vlnového popisu, kterého jsme pro volnou částici v předcházejícím odstavci dosáhli, je dán lineárním přiblížením pro argument imaginární exponenciály
{
}
exp i (k .r − ω t ) ,
v jehož rámci jsme po celou dobu pracovali. Pokud bychom započetli i další příspěvky Taylorova rozvoje nebo celý výpočet provedli přesně, zjistili bychom, že vlnový popis volné částice vede i k efektům, které klasická fyzika nepředpokládá. Jedním z nich je tzv. rozplývání vlnového balíku, kdy se během času vlnový balík nejen přemisťuje prostorem, ale současně mění i svůj tvar. Podrobná analýza však vzhledem k matematickým komplikacím zcela přesahuje naše možnosti. Je ji možno nalézt ve specializované literatuře [1]. Pohyb jednorozměrného vlnového balíku ilustruje připojená animace. LITERATURA [1]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 195-200.
Taylorův rozvoje Viz např. REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 369.
4.1.3 PRINCIP SUPERPOZICE Libovolnou vlnovou funkci popisující fyzikálně přípustný stav daného systému je možno získat jako lineární kombinaci vlnových funkcí odpovídajících de Broglieho monochromatickým vlnám (stacionárních vlnových funkcí). Zmíněná lineární kombinace může mít podle okolností konečně i nekonečně mnoho členů. Podle prvního Bornova postulátu jsou přípustné vlnové funkce nutně kvadraticky integrovatelné. Princip superpozice proto říká, že každou kvadraticky integrovatelnou vlnovou funkci můžeme získat jako lineární kombinaci vlnových funkcí stacionárních. Monochromatické de Broglieho vlny (stacionární vlnové funkce) odpovídají řešením stacionární Schrödingerovy rovnice. Princip superpozice říká, že stacionárních vlnových funkcí je pro daný systém dostatek k tomu, aby jejich pomocí bylo možno zkonstruovat libovolnou vlnovou funkci popisující přípustný stav systému. Speciální aplikací principu superpozice je konstrukce vlnového balíku reprezentujícího vlnovou funkci volné částice pomocí rovinných monochromatických vln.
4.1.4 X A P- REPREZENTACE VLNOVÉ FUNKCE Podle principu superpozice je možno libovolnou vlnovou funkci odpovídající fyzikálně realizovatelnému stavu volné částice získat jako lineární kombinaci rovinných monochromatických de Broglieho vln
{
}
ψ (r , t ) = ∫ ψ (k ) exp i (k .r − ω t ) d 3 k = ∫ ψˆ (k , t ) exp(ik .r ) d 3 k , 3
25
3
kde jsme ve druhém integrálu provedli formální náhradu ψˆ ( k , t ) = ψ ( k ) exp( −iω t ). Z uvedeného vyjádření je vidět, že vlnová funkce ψ ( r , t ) je Fourierovou transformací funkce ψˆ ( k , t ). Na souvislost mezi funkcemi ψ a ψˆ můžeme tedy nahlížet jako na vztah čistě matematický a na chvíli odhlédnout od fyzikálního pozadí problému. Platnost výše uvedené formule není proto omezena pouze na vlnové funkce odpovídající volné částici, ale můžeme ji rozšířit i na obecnou (kvadraticky integrovatelnou) vlnovou funkci. Formuli 1 i ψ (r , t ) = ψˆ ( p, t ) exp p.r d 3 p, 3/ 2 ∫ ( 2π ) 3 v níž jsme místo vlnového vektoru k užili hybnost p a doplnili formálně výhodný multiplikativní faktor 1 ( 2π
)
3/ 2
, můžeme tedy použít i pro částici nacházející se v poli vnějších sil. V obecném případě již ale neplatí ψˆ (k , t ) = ψ ( k ) exp( −iω t ), časová závislost ψˆ je zpravidla
komplikovanější. Funkci ψˆ je možno určit, známe-li vlnovou funkci ψ , pomocí inverzní Fourierovy transformace 1 i ψˆ ( p, t ) = ψ (r , t ) exp − p.r d 3r . 3/ 2 ∫ ( 2π ) 3 Obě funkce, ψ i ψˆ , jsou tedy ve vzájemně jednoznačném vztahu a jsou pro popis stavu částice stejně vhodné. Proto budeme o obou hovořit jako o funkcích vlnových. První z nich je závislá na souřadnicích částice, hovoříme proto o vlnové funkci v souřadnicové nebo prostě x-reprezentaci. Druhá vlnová funkce závisí naopak na složkách hybnosti (impulzu) částice. Proto o ní hovoříme jako o vlnové funkci v impulzové nebo stručněji p-reprezentaci. Obě vyjádření vlnové funkce hrají významnou roli při její fyzikální interpretaci. Zatímco vlnová funkce v x-reprezentaci je interpretována prostřednictvím prvního Bornova postulátu, vlnová funkce v p-reprezentaci hraje ústřední roli při formulaci druhého Bornova postulátu.
X A P- REPREZENTACE JEDNOROZMĚRNÉ VLNOVÉ FUNKCE Pro jednorozměrné vlnové funkce používáme vztahy 1 i ψ ( x, t ) = ψˆ ( p, t ) exp px dp, 1/ 2 ∫ ( 2π )
ψˆ ( p, t ) =
1
( 2π
i
ψ ( x, t ) exp − ) ∫ 1/ 2
v nichž změněná mocnina v multiplikativním faktoru 1/ ( 2π proměnných na jedinou.
26
)
px dx,
1/ 2
odpovídá redukci prostorových
4.1.5 PRVNÍ BORNŮV POSTULÁT První Bornův postulát První Bornův postulát [1], [2] podává fyzikální interpretaci vlnové funkce částice v x-reprezentaci. Obdobným způsobem je pomocí druhého Bornova postulátu interpretována vlnová funkce částice v p-reprezentaci. Výraz
∫ ψ (r , t )
2
d 3r
∫ ψ (r , t )
2
d 3r
Ω
3
udává pravděpodobnost, že částici ve stavu popsaném vlnovou funkcí ψ nalezneme v čase t v prostorové oblasti Ω (pravděpodobnost výskytu částice).
DŮSLEDKY PRVNÍHO BORNOVA POSTULÁTU Všimněme si několika velmi významných důsledku výše uvedeného tvrzení. Především první Bornův postulát implicitně předpokládá, že kvadrát absolutní hodnoty vlnové funkce je integrovatelný na libovolné měřitelné podmnožině 3 , speciálně i na celém 3 . Zkráceně v takovém případě hovoříme o kvadraticky integrovatelné vlnové funkci. Na vlnovou funkci popisující fyzikálně realizovatelný stav bodové částice takto klademe významnou omezující podmínku. Jedním z důsledků této podmínky je fakt, že rovinná monochromatická vlna nereprezentuje žádný fyzikálně realizovatelný stav volné částice. Odpovídající vlnová funkce totiž na 3 kvadraticky integrovatelná není. Pouze výše uvedená pravděpodobnost je měřitelnou veličinou. Samotnou vlnovou funkci měřit neumíme - obsahuje tudíž částečně i informaci, která není fyzikálně relevantní. Například měřitelné důsledky teorie se nezmění, pokud zadanou vlnovou funkci násobíme nenulovou, obecně imaginární konstantou. Vždy proto můžeme přejít k nové vlnové funkci
ψ (r , t ) =
ψ (r , t )
∫ ψ (r , t )
2
d 3r
3
∫ ψ (r , t )
2
d 3 r = 1.
splňující normovací podmínku 3 O takto zavedené funkci hovoříme jako o vlnové funkci normované k jednotce. Kvadrát její absolutní hodnoty má pak význam hustoty pravděpodobnosti nalezení částice v čase t v místě zadaném polohovým vektorem r . Mějme ovšem na paměti, že samotný stav částice je stejně dobře popsán normovanou i nenormovanou vlnovou funkcí.
27
Ani po normování není vlnová funkce určena jednoznačně. Stále ještě můžeme měnit její fázi iα (násobit ji imaginární jednotkou e ), aniž se to jakkoliv dotkne měřitelných výsledků teorie. Proto se obvykle hovoří o fázi vlnové funkce jako o nefyzikálním stupni volnosti. V rámci Bornovy statistické interpretace vlnové funkce hovoříme o pravděpodobnosti nalezení částice v jisté oblasti prostoru. Znamená to, že odpovídající pravděpodobnost vždy existuje, a měření polohy částice je tedy statisticky regulární proces. K podobnému závěru docházíme na základě druhého Bornova postulátu i pro měření hybnosti částice. A uvedené tvrzení se dokonce v rámci kvantové teorie rozšiřuje i na všechna ostatní měření, která mají zpravidla, podobně jako měření polohy a hybnosti, pouze pravděpodobnostní charakter. V kvantové teorii tudíž vždy pohlížíme na měření jako na statisticky regulární proces.
JEDNOROZMĚRNÉ VLNOVÉ FUNKCE V případě částice vázané na přímku je nutno výše uvedené trojrozměrné integrály nahradit integrály jednorozměrnými. Pravděpodobnost nalezení částice popsané v čase t vlnovou funkcí ψ ( x, t ) na intervalu (a,b) je pak dána výrazem b
∫ ψ ( x, t )
2
∫ ψ ( x, t )
2
a +∞
dx . dx
−∞
LITERATURA [1] [2]
BORN, M. Zeitschrift für Physik, 1926, Bd. 37, S. 863. BORN, M. Zeitschrift für Physik, 1926, Bd. 38, S. 803.
4.1.6 DRUHÝ BORNŮV POSTULÁT Druhý Bornův postulát [1], [2] podává měřitelnou interpretaci vlnové funkce částice v preprezentaci. Hraje tedy pro vlnové funkce v p-reprezentaci obdobnou roli jako první Bornův postulát pro vlnové funkce v x-reprezentaci. Budiž ψˆ vlnová funkce částice v p-reprezentaci,
ψ (r , t ) =
1
( 2π
i
ψˆ ( p, t ) exp ) ∫ 3/ 2
3
pak výraz
∫ ψˆ ( p, t )
2
d3 p
∫ ψˆ ( p, t )
2
d3 p
Π
3
28
p.r d 3 p,
udává pravděpodobnost, že částice bude mít v čase t hybnost z oblasti Π impulzového prostoru. Také druhý Bornův postulát má, podobně jako postulát první, některé velmi významné důsledky. Nejdůležitější z nich jsou • kvadratická integrovatelnost vlnové funkce v p-reprezentaci, •
statistická regularita procesu měření hybnosti bodové částice.
JEDNOROZMĚRNÁ VLNOVÁ FUNKCE V případě částice vázané na přímku je nutno výše uvedené trojrozměrné integrály nahradit integrály jednorozměrnými. Tak například přechod mezi x- a p-reprezentací vlnové funkce je dán vztahem +∞ 1 i ψ ( x, t ) = ψˆ ( p, t ) exp px dp 1/ 2 ∫ ( 2π ) −∞ a pravděpodobnost, že částice bude mít hybnost z intervalu (α,β), výrazem β
∫ ψˆ ( p, t ) α
2
∫ ψˆ ( p, t )
2
+∞
dp . dp
−∞
LITERATURA [1] [2]
BORN, M. Zeitschrift für Physik, 1926, Bd. 37, S. 863. BORN, M. Zeitschrift für Physik, 1926, Bd. 38, S. 803.
4.1.7 STŘEDNÍ HODNOTY A FLUKTUACE POLOHY A HYBNOSTI MĚŘENÍ POLOHY A HYBNOSTI Podle prvního a druhého Bornova postulátu můžeme pro částici v zadaném stavu (popsaném kvadraticky integrovatelnou vlnovou funkcí) určit pouze pravděpodobnosti, že ji nalezneme v konkrétním místě prostoru a že bude mít jistou konkrétní hybnost. Při opakovaném měření polohy i hybnosti částice získáme proto různé číselné výsledky. Četnosti takto změřených hodnot polohy a hybnosti odpovídají při dostatečně velkém počtu opakování s vysokou přesností pravděpodobnostem v obou zmíněných postulátech vystupujícím. Sledujeme-li obvyklý experimentální postup, vyhodnotíme provedená měření tak, že určíme pro získaný soubor dat střední hodnotu měřené veličiny a odhad chyby - buď jednotlivého měření, nebo vypočítané střední hodnoty. Pomocí Bornových postulátů můžeme obě veličiny určit, známe-li odpovídající vlnovou funkci, i výpočtem.
29
STŘEDNÍ HODNOTA A STŘEDNÍ KVADRATICKÁ FLUKTUACE POLOHY Podle prvního Bornova postulátu a na základě úvahy uvedené na jiném místě můžeme střední hodnotu polohy bodové částice ve stavu popsaném normovanou vlnovou funkcí ψ určit pomocí vztahu r =
∫ r ψ (r , t )
2
d 3r ,
3
který můžeme zapsat rovněž po složkách xi =
∫ x ψ (r , t )
2
i
d 3 r , i = 1, 2,3.
3
Odpovídající střední kvadratické fluktuace jednotlivých složek polohy pak počítáme pomocí normované vlnové funkce jako
∫ (x − x )
∆xi =
i
i
2
2
ψ (r , t ) d 3r .
3
Tyto střední fluktuace odpovídají ve výše naznačené experimentální proceduře střední kvadratické chybě jednotlivého měření polohy částice.
STŘEDNÍ
HODNOTA
A
STŘEDNÍ
KVADRATICKÁ
FLUKTUACE
HYBNOSTI Pomocí vlnové funkce ψˆ v p-reprezentaci, 1 i ψ (r , t ) = ψˆ ( p, t ) exp p.r d 3 p, 3/ 2 ∫ ( 2π ) 3 a druhého Bornova postulátu můžeme určit střední hodnotu hybnosti částice prostřednictvím formule (viz též zde)
p=
∫ p ψˆ ( p, t )
2
d3 p
3
3 ∫ ψˆ ( p, t ) d p 2
,
3
nebo ekvivalentně pro normovanou vlnovou funkci ψˆ pomocí formule p=
∫ p ψˆ ( p, t )
2
d 3 p.
3
I formuli zadávající střední hodnotu hybnosti můžeme zapsat po složkách pi =
∫ p ψˆ ( p, t )
2
i
d 3 p, i = 1, 2,3.
3
Střední kvadratické fluktuace složek hybnosti částice v zadaném stavu, které reprezentují současně střední kvadratické chyby jednotlivého měření složek hybnosti, určíme pro normovanou vlnovou funkci ψˆ pomocí vztahu
30
∆pi =
∫(p − p ) i
2
i
2
ψˆ ( p, t ) d 3 p .
3
4.1.8 HEISENBERGOVY RELACE NEURČITOSTI PRO POLOHU A HYBNOST Statistická interpretace de Broglieho vlnového modelu (první a druhý Bornův postulát) vede k mnoha v klasické fyzice neočekávaným závěrům. Jedním z nejpodivuhodnějších z nich je zjištění, že polohu a hybnost bodové částice není možno současně měřit neomezeně přesně. Uvedený závěr, který poprvé odvodil německý fyzik Werner Heisenberg [1], je možno rozšířit i na další měřitelné veličiny. V této kapitole se ale soustředíme pouze na vzájemný vztah polohy a hybnosti. Dříve, než zformulujeme obecné relace neurčitosti pro polohu a hybnost, uveďme jeden inspirující příklad.
GAUSSŮV VLNOVÝ BALÍK Proveďme výpočet středních hodnot polohy a hybnosti a odpovídajících středních kvadratických fluktuací (definice použitých pojmů je možno najít zde) pro částici, jejíž stav je reprezentován speciální jednorozměrnou vlnovou funkcí ve tvaru Gaussova vlnového balíku ( x − x0 )2 1 i ψ ( x) = exp − exp p0 x . 2 4 4σ x 2πσ x2 Časová závislost vlnové funkce ψ není v tuto chvíli podstatná, proto ji ve formuli explicitně neuvádíme. Skryta je v možné závislosti „konstant“ σ x , x0 a p0 na čase. Je jen otázkou technické zručnosti ověřit, že • uvedená vlnová funkce je normovaná k jedničce, •
střední hodnota polohy je rovna x0 a
•
střední kvadratická fluktuace polohy je rovna σ x .
Nalezněme dále p-reprezentaci výše uvedené vlnové funkce. Pomocí inverzní Fourierovy transformace je to opět jen výpočetní problém. Máme totiž určit integrál +∞ 1 i ψˆ ( p) = ψ ( x) exp − px dx, 1/ 2 ∫ ( 2π ) −∞ který po provedení naznačené integrace vede k ( p − p0 )2 1 i ψˆ ( p) = exp − exp − ( p − p0 ) x0 , 2 2 4 2πσ 4σ p p 31
kde σ p =
( 2σ x ) .
Stejně jako pro vlnovou funkci v x-reprezentaci i nyní snadno ověříme, že • vlnová funkce v p-reprezentaci je normovaná k jedničce, •
střední hodnota hybnosti je rovna p0 a
•
střední kvadratická fluktuace hybnosti je rovna σ p .
V tuto chvíli je pro nás nejzajímavější vztah mezi středními kvadratickými fluktuacemi polohy a hybnosti studované částice. Z výše uvedeného plyne závěr ∆x∆p = σ xσ p =
2
,
který má velmi zajímavý důsledek: Čím přesněji bude lokalizována poloha částice reprezentované Gaussovým vlnovým balíkem, tím méně ostře bude zadána její hybnost a naopak. Hybnost a polohu bodové částice nelze současně zadat ani změřit neomezeně přesně! Obecná formulace relací neurčitosti pro polohu a hybnost Výše uvedené závěry, které jsme získali pro Gaussův vlnový balík, je možno po malé modifikaci rozšířit i na obecné vlnové funkce. Pro částici vázanou na přímku je možno ukázat, že střední kvadratické fluktuace její polohy a hybnosti jsou v libovolném stavu svázány podmínkou ∆x ∆p ≥ . 2
Ta se od výše uvedeného vztahu pro Gaussův vlnový balík liší pouze náhradou rovnosti znamením nerovnosti. V trojrozměrném případě jsou Heisenbergovy relace neurčitosti poněkud komplikovanější - poloha a hybnost jsou totiž v tomto případě trojrozměrné vektory: ∆xk ∆pk ≥
2 a ∆x j ∆pk ≥ 0 (pro j ≠ k )
∆x j ∆xk ≥ 0 a ∆p j ∆pk ≥ 0 (j, k libovolná).
32
Způsobem obdobným jako v případě částice vázané na přímku se tedy ovlivňují pouze odpovídající si složky polohy a hybnosti. Křížové efekty pro j ≠ k ani vzájemná ovlivnění jednotlivých složek polohy, resp. hybnosti, neexistují. LITERATURA [1]
HEISENBERG, W. Zeitschrift für Physik, 1927, Bd. 43, S.172.
normovaná k jedničce +∞
∫
2
ψ ( x) dx = 1
−∞
střední hodnota polohy +∞
x≡
∫ x ψ( x)
2
dx
−∞
střední kvadratická fluktuace polohy +∞
∫ (x − x)
∆x ≡
2
2
ψ ( x) dx
−∞
střední hodnota hybnosti +∞
p≡
∫ p ψˆ ( p)
2
dp
−∞
střední kvadratická fluktuace hybnosti +∞
∆p ≡
∫ ( p − p)
2
2
ψˆ ( p ) dp
−∞
4.1.9 OBECNÁ REPREZENTACE STAVU V KVANTOVÉ TEORII PROSTOR STAVŮ Stavy jednočásticového systému popisujeme obvykle v kvantové mechanice pomocí kvadraticky integrovatelných vlnových funkcí (viz důsledky prvního Bornova postulátu). Kvadraticky integrovatelná vlnová funkce zadává tedy v konkrétním čase kvantový stav studovaného systému. Odhlédněme v tuto chvíli od všudypřítomného časového vývoje a závislost vlnových funkcí na čase neuvažujme. Množinu všech stavů jednočásticového systému můžeme takto ztotožnit s množinou všech (komplexních) kvadraticky integrovatelných funkcí tří reálných proměnných. O této množině však fyzikové i matematikové v době formulování základů kvantové teorie věděli, že má speciální matematickou strukturu. Množina všech kvadraticky integrovatelných funkcí je separabilní Hilbertův prostor. Toto poznání vedlo anglického fyzika P. Diraka k postulování tvrzení: Množina všech stavů libovolného kvantověmechanického systému je jistý abstraktní Hilbertův prostor, obvykle nekonečné dimenze.
33
Prvky tohoto abstraktního prostoru můžeme v konkrétních výpočtech a aplikacích reprezentovat speciálním způsobem - vlnovými funkcemi v x-reprezentaci, vlnovými funkcemi v p-reprezentaci, či dokonce úplně jinak - např. nekonečnými posloupnostmi komplexních čísel. Podrobnější analýza ukazuje, že konkrétní speciální reprezentace stavového Hilbertova prostoru odpovídají, zhruba řečeno, speciálním volbám báze na něm.
KONSTRUKCE PROSTORU STAVŮ Při konstrukci abstraktního Hilbertova prostoru stavů zohlednil Dirac dvě vůdčí ideje kvantové teorie •
kvantování některých veličin (tj. fakt, že některé veličiny mohou nabývat jen vybraných hodnot, kterých je obvykle spočetně mnoho),
•
existenci veličin, které nelze současně měřit neomezeně přesně (viz např. Heisenbergovy relace neurčitosti).
Měření vůbec hraje v kvantové teorii dominantní roli. Spolu s teorií relativity totiž kvantová teorie snad poprvé v dějinách novodobé vědy explicitně přiznává, že úkolem každé teorie je systematizace, popis a vysvětlení výsledků pozorování a experimentů, měření. Proto Dirac ve své konstrukci stavového prostoru z pojmu měření vychází. Stav systému v kvantové mechanice zadáváme hodnotami měřitelných veličin, pozorovatelných. Veličiny, které můžeme současně měřit neomezeně přesně (např. složky polohového vektoru), budeme nazývat kompatibilními pozorovatelnými. Podle potřeby je můžeme sdružovat do skupin, které nazýváme množinami kompatibilních pozorovatelných. Pozor však, kompatibilita pozorovatelných není tranzitivní! Významnou roli hrají v kvantové teorii tzv. úplné množiny kompatibilních pozorovatelných (ÚMKP), k nimž již žádnou další pozorovatelnou, kompatibilní se všemi ostatními, nemůžeme přidat. A(1) ,..., A( n ) } . Vyberme si jednu z těchto ÚMKP - { Nechť všechny v ní obsažené veličiny jsou kvantovány a výsledky jejich současného měření tvoří spočetnou množinu uspořádaných n-tic (1) (n) a (1) ,..., ak(nn ) . reálných čísel k1 Přípustné výsledky měření veličin A , ..., A přitom odlišujeme pomocí tzv. kvantových čísel k1 , ..., kn . Dirac předpokládal, že každé takové n-tici odpovídá a (1) ,..., ak( nn ) . vektor ve stavovém prostoru systému. Tento vektor obvykle označujeme symbolem k1 Podle Diraka jsou navíc vektory odpovídající různým výsledkům měření zvolené ÚMKP navzájem
ortogonální a na Hilbertově prostoru stavů tvoří bázi. Každý stavový vektor ξ a (1) ,..., ak(nn ) , zapsat jako (obecně spočetnou) lineární kombinaci vektorů k1
ξ =
∑ξ
k1 ,..., kn
k1 ,..., kn
můžeme tedy
ak(1)1 ,..., ak(nn ) ,
a (1) ,..., ak(nn ) kde ξ k1 ,...,kn jsou komplexní konstanty – souřadnice vektoru ξ v bázi k1 .
Reprezentujeme-li Hilbertův prostor stavů pomocí množiny kvadraticky integrovatelných vlnových a (1) ,..., ak(nn ) funkcí, odpovídají vektorům k1 vlnové funkce speciálního tvaru.
34
Výše naznačenou konstrukci můžeme pochopitelně provést i pro další ÚMKP, které definují na prostoru stavů alternativní bázové systémy. Každá ÚMKP je ke konstrukci Hilbertova stavového prostoru stejně vhodná.
POZNÁMKA Podrobná analýza obecné reprezentace stavu v kvantové teorii se zcela vymyká rámci této encyklopedie. Vynikající pojednání o tomto problému je možno najít např. v původní práci Dirakově [1] nebo v monografii Formánkově [2]. LITERATURA
[1] [2]
DIRAC, PAM. The Principles of Quantum Mechanics. 3rd ed. Cambridge: University Press, 1947. 311 s. FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s.
BRA-KETOVÁ SYMBOLIKA Popis stavu studovaného systému pomocí vlnové funkce ψ je jen jednou z možných reprezentací abstraktního stavového vektoru systému. Anglický fyzik P. Dirac přiřadil takovému vektoru speciální symbol ψ a nazval jej ket-vektorem ψ. Název pochází z anglického výrazu pro hranaté závorky
- bracket, z nichž jsme použili jen pravou polovinu (tedy ket).
Přestože v rámci našeho výkladu pracujeme důsledně s vlnovými funkcemi, je občas výhodné přejít k bra-ketovému značení. To může totiž mnohé vztahy a vzorce, alespoň formálně, významně
∫ ϕ *(r )ψ (r ) d r , 3
zjednodušit. Často se například setkáváme s výrazy typu
3
pro něž v rámci bra-
ketové symboliky zavádíme mnohem přehlednější zkratku ϕ ψ . V Dirakově notaci označuje tato zkratka současně skalární součin stavových vektorů ϕ a ψ . (pozn.) Protože v symbolu ϕ ψ bra-vektorem.
používáme pro vektor ϕ levou polovinu hranaté závorky, nazýváme jej
()
Je známo, že na prostoru všech kvadraticky integrovatelných funkcí hraje výraz skalárního součinu. Zavedení výše uvedené zkratky je tedy korektní.
∫
3
ϕ *(r ) ψ(r ) d 3 r
skutečně roli
4.2 STACIONÁRNÍ SCHRÖDINGEROVA ROVNICE Stavy bodové částice s přesně zadanou energií reprezentujeme v poli časově nezávislého potenciálu monochromatickými de Broglieho vlnami. Ty popisujeme tzv. stacionárními vlnovými funkcemi i ψ (r , t ) = Ψ (r ) exp {−iω t} = Ψ (r ) exp − Et , v nichž je separována závislost na prostorových proměnných od závislosti časové. Zatímco časová závislost je pro monochromatické de Broglieho vlny explicitně daná, prostorová část vlnové funkce Ψ ( r ) se mění podle charakteru konkrétního potenciálu V ( r ), pod jehož vlivem se částice nachází. V této kapitole si ukážeme, jak potenciál tvar prostorové části stacionární 35
vlnové funkce ovlivňuje prostřednictvím tzv. stacionární (bezčasové) Schrödingerovy rovnice [1], [2] −
2
2M
∆Ψ (r ) + V (r ) Ψ (r ) = E Ψ (r ).
SESTAVENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Je jistě rozumné předpokládat, že de Broglieho vlny, stejně jako kterékoliv jiné vlnění, s nímž se ve fyzice setkáváme, splňují univerzální vlnovou rovnici 1 ∂ 2ψ (r , t ) ∆ψ ( r , t ) − 2 = 0, ∂ t2 vf kde ∆ je Laplaceův operátor a v f fázová rychlost de Broglieho vln. Po dosazení stacionární vlnové funkce do této rovnice (a po snadných úpravách) získáme rovnici pro její prostorovou část ω2 ∆Ψ (r ) − 2 Ψ (r ) = 0. vf
Tu můžeme dále upravit, uvědomíme-li si, že ω v f = k , kde k je velikost vlnového vektoru de Broglieho vlny, a že podle de Broglieho vztahů zobecněných na případ částice v poli vnějšího potenciálu můžeme dále psát k = p . Výše uvedená rovnice tedy nabývá tvaru ∆Ψ (r ) −
p2 2
Ψ (r ) = 0.
Pro časově nezávislý potenciál V ( r ) se však zachovává celková energie částice E, p2 + V (r ) = E = konst., 2M 2 a pro kvadrát hybnosti částice můžeme tedy psát p = 2M [ E − V (r )] . Po dosazení tohoto výrazu do rovnice pro prostorovou část stacionární vlnové funkce získáme tak nakonec po jednoduchých úpravách proslulou stacionární (bezčasovou) Schrödingerovu rovnici
−
2
2M
∆Ψ (r ) + V (r ) Ψ (r ) = E Ψ (r ).
ENERGETICKÉ SPEKTRUM Stacionární Schrödingerova rovnice je parciální diferenciální rovnicí druhého řádu. Musíme ji proto doplnit, jak víme z matematiky, okrajovými podmínkami. Teprve pak bude její řešení určeno víceméně jednoznačně. Společně se stacionární Schrödingerovou rovnicí vybírají okrajové podmínky ze všech klasicky přípustných energií systému jen některé, které jsou přípustné i v rámci kvantového popisu. To 36
znamená, že reálný parametr E může nabývat ve výše uvedené rovnici pro konkrétní potenciál V ( r ) jen některých vybraných hodnot. O množině těchto přípustných hodnot energie hovoříme zpravidla jako o energetickém spektru studovaného systému.
JEDNOROZMĚRNÁ STACIONÁRNÍ SCHRÖDINGEROVA ROVNICE Provedeme-li výše uvedené úvahy pro jednorozměrné stacionární vlnové funkce, získáme postupem obdobným tomu, jaký jsme užili v obecném trojrozměrném případě, speciální tvar stacionární Schrödingerovy rovnice −
2
d2 Ψ ( x) + V ( x) Ψ ( x) = E Ψ ( x), 2M dx 2
který obvykle nazýváme jednorozměrnou stacionární Schrödingerovou rovnicí. Jednorozměrná Schrödingerova rovnice je velmi důležitá zejména z didaktických důvodů. Jedná se totiž o obyčejnou diferenciální rovnici, kterou je možno zpravidla řešit mnohem jednoduššími matematickými prostředky než odpovídající rovnici obecnou. Navíc pro mnohé trojrozměrné systémy umíme obecnou, trojrozměrnou stacionární Schrödingerovu rovnici převést na jednu či více rovnic jednorozměrných. O konkrétní postupech k tomu užívaných více v části věnované jednoduchým kvantověmechanickým systémům. LITERATURA
[1] [2]
SCHRÖDINGER, E. Annalen der Physik, 1926, Bd. 79, S. 361. SCHRÖDINGER, E. Annalen der Physik, 1926, Bd. 79, S. 489.
4.2.1 OKRAJOVÉ PODMÍNKY PRO STACIONÁRNÍ SCHRÖDINGEROVU ROVNICI Stacionární Schrödingerova rovnice je parciální diferenciální rovnicí. Má-li být její řešení určeno (až na multiplikativní faktor) jednoznačně, musí být proto splněny jisté okrajové podmínky omezující chování vlnové funkce v prostorovém nekonečnu.
OKRAJOVÁ PODMÍNKA I Reprezentuje-li vlnová funkce fyzikálně realizovatelný stav částice, omezuje její chování v asymptotické oblasti první Bornův postulát. Taková vlnová funkce musí být totiž v libovolném čase kvadraticky integrovatelná, což pro stacionární vlnovou funkci ψ (r , t ) = Ψ (r ) exp {− ( i ) Et} znamená, že
∫
2
Ψ (r ) d 3 r < +∞.
R3
Má-li být ovšem tato podmínka splněna, musí prostorová část stacionární vlnové funkce konvergovat v nekonečnu k nule (pozn.): 37
lim Ψ (r ) = 0.
r →+∞ −3/ 2 A to dostatečně rychle, rychleji než r .
OKRAJOVÁ PODMÍNKA II Podle principu superpozice je možné libovolnou vlnovou funkci reprezentující fyzikálně realizovatelný stav částice, tedy vlnovou funkci kvadraticky integrovatelnou, získat jako lineární kombinaci (obecně nekonečnou) stacionárních vlnových funkcí - řešení stacionární Schrödingerovy rovnice. Pro mnoho systémů však kvadraticky integrovatelné stacionární vlnové funkce - tedy ta řešení stacionární Schrödingerovy rovnice, která splňují okrajovou podmínku typu I - k tomuto účelu nestačí. Musíme k nim přidat ještě další řešení, která sice nejsou kvadraticky integrovatelná, a nereprezentují tedy žádný fyzikálně realizovatelný stav studované částice, jsou však nezbytná pro doplnění kvadraticky integrovatelných funkcí na úplný systém. Ukazuje se, že tyto dodatečné stacionární vlnové funkce nedivergují v prostorovém nekonečnu a jsou v asymptotické oblasti prostoru omezené. Pro každou z těchto vlnových funkcí existuje tedy kladná konstanta K taková, že
Ψ (r ) < K pro každé r splňující r > r0 , kde r0 je vhodně zvolená vzdálenost od počátku souřadnic.
JEDNOROZMĚRNÉ STACIONÁRNÍ VLNOVÉ FUNKCE V případě jednorozměrné stacionární Schrödingerovy rovnice musí její řešení splňovat výše uvedené okrajové podmínky v poněkud modifikovaném tvaru: +∞
∫
2
Ψ ( x) dx < +∞,
−∞
a tedy i lim Ψ ( x ) = 0,
x →±∞
pro vlnové funkce reprezentující realizovatelný stav studované částice a
Ψ ( x) < K pro každé x splňující x > x0 pro ostatní stacionární vlnové funkce. Podobně jako výše je x0 vhodně zvolená vzdálenost od počátku souřadnicové osy a K pevně zvolená kladná konstanta. ()
38
Pamatujme si však, že konvergence vlnové funkce k nule není postačující, ale pouze nutnou podmínkou kvadratické integrovatelnosti. Při jejím použití musíme být proto obezřetní.
4.2.2 ENERGETICKÉ SPEKTRUM Množinu všech energií přípustných v rámci kvantověmechanického popisu studovaného systému, tzv. vlastních energií (energetických hladin), nazýváme energetickým spektrem systému. Ze všech klasicky přípustných energií jsou vybírány okrajovými podmínkami pro stacionární Schrödingerovu rovnici.
DISKRÉTNÍ A SPOJITÉ ENERGETICKÉ SPEKTRUM Energie, pro něž jsou odpovídající stacionární vlnové funkce kvadraticky integrovatelné, nazveme energiemi diskrétními, nebo též diskrétními energetickými hladinami.
Kvadraticky integrovatelné vlnové funkce reprezentují realizovatelný stav studované částice, diskrétní energetické hladiny tedy odpovídají ostrým hodnotám energie, kterých může studovaný systém nabývat. Diskrétních energií může být pro každý systém nejvýše spočetně mnoho a jsou navzájem odděleny konečnými intervaly energií zakázaných. Můžeme je tedy očíslovat pomocí celých čísel, která obvykle nazýváme hlavními kvantovými čísly. Množina všech diskrétních energií tvoří tzv. diskrétní část energetického spektra systému. V této části energetického spektra se může energie systému měnit jen skokem, je tedy kvantována. Stav s nejnižší energií se obvykle nazývá základním stavem, ostatní stavy excitovanými. Všimněte si, že oproti staré kvantové teorii není kvantování energie v rámci kvantové mechaniky nezávislým postulátem, ale pouhým důsledkem stacionární Schrödingerovy rovnice a jí odpovídajících okrajových podmínek (které vyplývají z prvního Bornova postulátu). Množinu energií odpovídajících vlnovým funkcím, které sice nejsou kvadraticky integrovatelné, a nereprezentují tedy žádný fyzikálně realizovatelný stav systému, ale nedivergují v nekonečnu, nazveme spojitou částí energetického spektra. Energie ze spojité části spektra nemohou být studovaným systémem ostře nabývány. Vždy však můžeme zkonstruovat integrální lineární kombinace stacionárních vlnových funkcí odpovídajících jen málo odlišným energiím ze spojité části energetického spektra. A takové lineární kombinace již realizovatelný stav systému reprezentovat mohou. Částice sice nebude mít v podobném stavu ostře definovanou energii, její kvantověmechanické fluktuace však mohou být velmi malé a zaniknout popř. v experimentálních chybách. Nebudou proto měřitelné a energii systém můžeme s jistou mírou nepřesnosti považovat za (v rámci experimentálních chyb) „přesně“ danou. O energetickém spektru, jehož spojitá část je prázdná, hovoříme jako o spektru čistě diskrétním. Naopak spektrum bez diskrétních energetických hladin nazveme spektrem čistě spojitým.
39
Příkladem systémů s čistě diskrétním spektrem mohou být částice v jednorozměrné potenciálové jámě nekonečné hloubky, částice v trojrozměrné potenciálové jámě nekonečné hloubky, lineární harmonický oscilátor, trojrozměrný harmonický oscilátor a tuhý rotátor. Čistě spojité spektrum má například volná částice a smíšené energetické spektrum nacházíme kupříkladu u částice v potenciálové jámě konečné hloubky.
ORTOGONALITA STACIONÁRNÍCH VLNOVÝCH FUNKCÍ Prostorové části stacionárních vlnových funkcí Ψ n a Ψ m odpovídajících různým diskrétním energiím En a Em ( En ≠ Em ) splňují následující relaci (ověřte pro jednoduché kvantověmechanické systémy)
∫Ψ
R3
* (r )Ψ (r ) d 3 r = m
n
∫Ψ
* (r )Ψ (r ) d 3 r = 0. n
m
R3
Tu můžeme pomocí bra-ketové symboliky přepsat do formálně jednoduššího tvaru
Ψ n Ψ m = Ψ m Ψ n = 0.
Protože však symbol označuje současně i skalární součin na stavovém prostoru systému, interpretujeme výše uvedené formule jako vyjádření ortogonality stacionárních vlnových funkcí. Snadno se totiž přesvědčíme, že v libovolném čase stejné relace splňují i stacionární vlnové funkce samotné, nejen jejich prostorové části. V případě systému s čistě diskrétním spektrem, jehož stacionární vlnové funkce jsou normovány k jedničce, můžeme proto pro libovolnou dvojici vlnových funkcí psát Ψ n Ψ m = δ nm , kde δ je Kroneckerův symbol.
DEGENERACE ENERGETICKÝCH HLADIN Z homogenity stacionární Schrödingerovy rovnice i připojených okrajových podmínek vyplývá, že splňuje-li prostorová část stacionární vlnové funkce pro vybranou hodnotu energie z diskrétní či spojité části energetického spektra stacionární Schrödingerovu rovnici a současně i odpovídající okrajovou podmínku, splňuje obé i její libovolný násobek. Řešení stacionární Schrödingerovy rovnice není tedy pro zadanou hodnotu energie určeno bezezbytku jednoznačně. Vždy totiž existuje volnost ve volbě multiplikativního faktoru. Jedná-li se o jedinou nejednoznačnost, nazveme odpovídající energii nedegenerovanou. Často též hovoříme o nedegenerované energetické hladině. Pokud ale naopak závisí pro danou energii řešení stacionární Schrödingerovy rovnice i na dalších volně nastavitelných konstantách, hovoříme o energii degenerované nebo též o degenerované energetické hladině.
Poněkud přesnější popis degenerace energetické hladiny můžeme podat, uvědomíme-li si, že množina všech řešení stacionární Schrödingerovy rovnice tvoří pro vybranou energii z diskrétní či 40
spojité části energetického spektra lineární vektorový prostor. Je-li dimenze tohoto prostoru rovna jedné, jedná se zřejmě o hladinu nedegenerovanou. Je-li naopak větší než jedna, je příslušná energetická hladina degenerovaná. Příkladem systémů s nedegenerovanými energetickými hladinami mohou být částice v jednorozměrné potenciálové jámě nekonečné hloubky a lineární harmonický oscilátor. Degenerované energetické hladiny má naopak kupříkladu volná částice. Částice v trojrozměrné potenciálové jámě nekonečné hloubky, trojrozměrný harmonický oscilátor či tuhý rotátor mají některé hladiny degenerované a jiné nikoliv.
4.3 NESTACIONÁRNÍ SCHRÖDINGEROVA ROVNICE Časový vývoj reprezentujeme v kvantové mechanice závislostí vlnové funkce na čase. Abychom dokázali v konkrétních případech tuto závislost určit, potřebujeme znát odpovídající evoluční rovnici. Rovnici, která by v rámci vlnového popisu částic nahradila pohybové rovnice klasické mechaniky. Vlnění popisujeme, ať již se s ním setkáváme v nejrůznějších oblastech fyziky, obvykle vlnovou rovnicí. Pro potřeby kvantové mechaniky ji však musíme poněkud upravit, neboť vlnová rovnice samotná připouští jako svá řešení i v rámci kvantové mechaniky odmítnuté tvary stacionárních vlnových funkcí (viz též zde) i ψ (r , t ) = Ψ (r ) exp Et . Pohybová rovnice kvantové mechaniky musí brát v úvahu nejen vlnový popis částic, ale i speciální tvar vlnových funkcí reprezentujících monochromatické de Broglieho vlny i ψ (r , t ) = Ψ (r ) exp − Et . Je jí proslulá nestacionární (časová) Schrödingerova rovnice [1] i
2 ∂ψ (r , t ) =− ∆ψ (r , t ) + V (r )ψ (r , t ). ∂t 2M
SESTAVENÍ NESTACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Podle principu superpozice můžeme libovolnou vlnovou funkci popisující fyzikálně realizovatelný stav systému zapsat jako lineární kombinaci stacionárních vlnových funkcí. Pro jednoduchost se omezme na jednočásticový systém s čistě diskrétním a nedegenerovaným spektrem. Pak můžeme psát i ψ (r , t ) = ∑ An Ψ n (r ) exp − En t , n kde indexem n číslujeme jednotlivé diskrétní energie En , symbolem Ψ n označujeme prostorovou část stacionární vlnové funkce odpovídající energii En a An jsou komplexní
41
konstanty. V pohybové rovnici se zřejmě budou vyskytovat derivace vlnové funkce podle času. Pro první z nich můžeme psát ∂ψ (r , t ) i i = − ∑ An En Ψ n (r ) exp − En t . ∂t n Prostorové části stacionárních funkcí však splňují stacionární Schrödingerovu rovnici −
2
2M
∆Ψ n (r ) + V (r ) Ψ n (r ) = En Ψ n (r ),
z níž můžeme do výrazu pro ∂ψ ∂ t dosadit:
∂ψ (r , t ) i =− ∂t
2 i − A ∑n n 2M ∆Ψ n (r ) + V (r )Ψ n (r ) exp − Ent ,
a získaný výraz ještě dále upravit do tvaru 2 ∂ψ i i i = − − ∆ ∑ An Ψ n exp − Ent + V ∑ An Ψ n exp − Ent . ∂t n 2M n
ψ (r , t ) = ∑ An Ψ n (r ) exp − ( i ) Ent n S použitím a po formálních úpravách obdržíme takto nakonec nestacionární (časovou) Schrödingerovu rovnici 2 ∂ψ (r , t ) =− ∆ψ (r , t ) + V (r )ψ (r , t ). i ∂t 2M
Na tomto místě je však nezbytné čtenáře upozornit, že výše nastíněný postup není odvozením nestacionární Schrödingerovy rovnice! Měl jen podat přijatelné argumenty k ní vedoucí a poukazující na její úzkou souvislost s principem superpozice a rovnicí stacionární. V rámci kvantové mechaniky je nestacionární Schrödingerova rovnice jedním ze základních postulátů. Zajímavým důsledkem nestacionární Schrödingerovy rovnice je rovnice kontinuity pro hustotu 2
pravděpodobnosti ψ .
NESTACIONÁRNÍ SCHRÖDINGEROVA ROVNICE JAKO MATEMATICKÝ PROBLÉM Nestacionární Schrödingerova rovnice je parciální diferenciální rovnicí prvního řadu v časové proměnné a druhého řádu v proměnných prostorových. Přítomnost parciálních derivací podle prostorových proměnných vyžaduje podobně jako v případě stacionární Schrödingerovy rovnice doplnění okrajové podmínky. Tou je pro vlnové funkce reprezentující fyzikálně realizovatelné stavy částice požadavek jejich kvadratické integrovatelnosti, v libovolném čase t. 42
∫ ψ (r , t )
R3
2
d 3 r < +∞,
který musí být splněn
Protože nestacionární Schrödingerova rovnice obsahuje navíc i derivaci časovou, musíme k podmínce okrajové přidat ještě podmínku počáteční. Ta vzhledem k tomu, že příslušná časová derivace je prvního řádu, nabývá tvaru ψ (r , t0 ) = ψ 0 (r ), kde t0 je zvolený čas, který považujeme za počáteční, a ψ 0 (r ) zadaná kvadraticky integrovatelná funkce reprezentující stav systému v tomto čase. Nalezení řešení nestacionární Schrödingerovy rovnice pro zadanou počáteční podmínku je v obecném případě velmi obtížný problém. Ten se ovšem významně zjednoduší, známe-li úplný systém řešení odpovídající rovnice stacionární. Podrobný výpočet je možno najít zde. Z něj, kromě jiného vyplývá, že počáteční podmínka určuje vývoj vlnové funkce v budoucích časech jednoznačně. Nestacionární Schrödingerova rovnice takto činí kvantovou mechaniku deterministickou. Vzhledem k pravděpodobnostní interpretaci vlnové funkce však hovoříme, kvůli odlišení od determinismu klasické mechaniky, o determinismu kvantovém.
JEDNOROZMĚRNÁ NESTACIONÁRNÍ SCHRÖDINGEROVA ROVNICE V jednorozměrném případě lze způsobem obdobným tomu, který jsme nastínili výše, dospět k následujícímu tvaru nestacionární Schrödingerovy rovnice i
2 ∂ψ ( x, t ) d 2ψ ( x, t ) =− + V ( x)ψ ( x, t ). ∂t 2m dx 2
LITERATURA
[1]
SCHRÖDINGER, E. Annalen der Physik, 1926, Bd. 81, S. 109.
4.3.1 ROVNICE KONTINUITY PRO HUSTOTU PRAVDĚPODOBNOSTI ROVNICE KONTINUITY Pod rovnicí kontinuity pro veličinu X, která je spojitě rozložená v prostoru s prostorovou hustotou ρ ( r , t ) a jejíž přemisťování v prostoru je popsáno hustotou toku j (r , t ), můžeme zapsat ve tvaru ∂ρ + div j = 0, ∂t
kde div je operátor divergence. S rovnicí kontinuity se můžeme setkat v různých oborech fyziky, vždy je však její interpretace stejná - jedná se o zákon zachování veličiny X. Integrováním obou stran rovnice kontinuity přes vybranou oblast prostoru V totiž získáme
43
d ρ d 3 r = − ∫ div j d 3r ∫ dt V V a po použití Gaussovy-Ostrogradského věty (viz též [1]), známé z vektorové analýzy, dále též d ρ d 3r = − ∫∫ j . dS , ∫ dt V ∂V kde jsme symbolem ∂V označili hranici oblasti V. Vzhledem k obvykle volené orientaci elementu plochy dS ve směru vnější normály k hranici ∂V můžeme získaný integrální vztah popsat velmi názorně slovy: Časová změna množství veličiny X obsažené v oblasti V je rovna tomu, co do této oblasti přiteče nebo z ní odteče hraniční plochou. To je ovšem formulace, kterou můžeme bezpochyby nazvat zákonem zachování veličiny X.
ROVNICE KONTINUITY PRO HUSTOTU PRAVDĚPODOBNOSTI Ukažme si nyní, že rovnici kontinuity lze formulovat i pro hustotou pravděpodobnosti výskytu 2
částice v zadaném bodě prostoru - ψ ( r , t ) . Vzhledem ke struktuře obecné rovnice kontinuity budeme potřebovat časovou derivaci ∂ψ ∂ (ψ *ψ ) ∂ψ * ∂ψ = = ψ +ψ * , ∂t ∂t ∂t ∂t kde ψ * označuje komplexně sdruženou funkci k vlnové funkci ψ. Z nestacionární Schrödingerovy rovnice ovšem plyne V ∂ψ ∂ψ * V =− ∆ψ + ψ , = ∆ψ * − ψ *, 2iM i 2iM i ∂t ∂t 2
což po dosazení a úpravách dává následující výraz pro časovou derivaci hustoty pravděpodobnosti
ψ (r , t )
2
2
∂ψ =− (ψ * ∆ψ − ψ∆ψ *) . ∂t 2iM Získaný vztah je dále možno upravit pomocí identity známé z vektorové analýzy, f ∆g = div ( f ∇ g ) − ∇ f .∇ g , v níž jsme symbolem ∇ označili vektorový operátor gradient, a obdržet tak rovnici kontinuity v obvyklém tvaru 2
∂ψ + div (ψ * ∇ψ − ψ∇ψ *) = 0. ∂t 2iM
44
JEDNOROZMĚRNÁ
ROVNICE
KONTINUITY
PRO
HUSTOTU
PRAVDĚPODOBNOSTI Obdobným způsobem můžeme z jednorozměrné nestacionární Schrödingerovy rovnice získat odpovídající jednorozměrnou rovnici kontinuity
∂ (ψ *ψ ) ∂ + ∂x 2iM ∂t
∂ψ ∂ψ * −ψ ψ * = 0. ∂x ∂x
HUSTOTA TOKU PRAVDĚPODOBNOSTI Porovnáním s obecným tvarem rovnice kontinuity vidíme, že výraz j=
2iM
(ψ * ∇ψ − ψ∇ψ *) ,
resp. v jednorozměrném případě výraz j=
∂ψ ∂ψ * −ψ ψ * , 2iM ∂x ∂x
musíme interpretovat jako hustotu toku pravděpodobnosti. Uvedené výrazy tedy popisují, jak se zmíněná pravděpodobnost přelévá během časového vývoje, určovaného nestacionární Schrödingerovou rovnicí, prostorem. Za povšimnutí stojí fakt, že hustota toku pravděpodobnosti je reálná veličina, tj. že platí
j = j *,
resp. v jednorozměrném případě j = j *. LITERATURA
[1]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 230-232.
4.3.2 OBECNÉ ŘEŠENÍ NESTACIONÁRNÍ SCHRÖDINGEROVY ROVNICE ČISTĚ DISKRÉTNÍ SPEKTRUM Podle principu superpozice můžeme vlnovou funkci popisující fyzikálně realizovatelný stav systému psát ve tvaru lineární kombinace vlnových funkcí stacionárních. V případě systému s čistě diskrétním spektrem proto platí i ψ (r , t ) = ∑ An,s Ψ n,s (r ) exp − Ent , n ,s 45
kde vektorovým indexem s = ( s1 , ..., sK ) zohledňujeme možnou degeneraci jednotlivých energetických hladin systému. V případě nedegenerovaného spektra by se tento sčítací index ve výše uvedené sumě nevyskytoval. Vzhledem k tomu, že princip superpozice byl vůdčí ideou při formulování nestacionární Schrödingerovy rovnice, musí jí nutně výše uvedená suma vyhovovat, což můžeme snadno ověřit prostým dosazením. Lineární kombinace stacionárních vlnových funkcí proto zadává obecné řešení nestacionární Schrödingerovy rovnice systému s čistě diskrétním spektrem. K jednoznačnému určení tohoto řešení musíme však najít zatím neznámé koeficienty An ,s . Učiníme tak pomocí počáteční podmínky ψ (r , t0 ) = ψ 0 (r ), v níž je ψ 0 (r ) zadaná komplexní funkce. Musí tedy platit
i
ψ 0 (r ) = ∑ An,s Ψ n ,s (r ) exp − Ent0 . n ,s
K osamostatnění konstant An ,s využijeme ortogonality prostorových částí stacionárních vlnových funkcí, o nichž navíc budeme předpokládat, že jsou normalizovány k jedničce. S využitím braketové symboliky můžeme proto psát delta.
Ψ m ,q Ψ n ,s = δ mnδ qs ,
kde δ qs je zobecněné Kroneckerovo
Po vynásobení obou stran počáteční podmínky, kterou pomocí bra-ketové symboliky zapisujeme ve
ψ 0 = ∑ An ,s Ψ n,s exp ( −i / Ent0 ),
n ,s tvaru stacionárních vlnových funkcí získáme
a dále též
zleva bra-vektorem
Ψ m ,q
a s využitím ortogonality
i i Ψ m,q ψ 0 = ∑ An ,s Ψ m,q Ψ n,s exp − Ent0 = ∑ An ,sδ mnδ qs exp − Ent0 = n ,s n ,s i = Am ,q exp − Em t0 i i Am ,q = exp Em t0 Ψ m,q ψ 0 ≡ exp Emt0 ∫ Ψ m ,q* (r )ψ 0 (r ) d 3 r . 3
Pro zadanou počáteční podmínku ψ 0 (r ) jsou tedy koeficienty
Amq , a proto i vlnová funkce
ψ ( r , t ), určeny jednoznačně. Musíme však mít na paměti, že různé počáteční vlnové funkce, které se navzájem liší pouze nenulovým multiplikativním faktorem, popisují počáteční stav systému stejně dobře. Podobná nejednoznačnost se pochopitelně přenáší i na obecné řešení nestacionární Schrödingerovy rovnice. Vybereme-li si však jednu ze všech možných ekvivalentních počátečních podmínek, bude již toto řešení určeno jednoznačně. Snadným výpočtem dále zjistíme, že v každém čase platí
46
∫
2
ψ (r , t ) d 3r =
3
∫
3
ψ 0 (r ) d 3r = ∑ An,s . 2
2
n ,s
Normalizace vlnové funkce, která splňuje nestacionární Schrödingerovu rovnici, se tedy s časem nemění.
ČISTĚ SPOJITÉ SPEKTRUM Pro systém s čistě spojitým spektrem je možno podle principu superpozice psát obecnou kvadraticky integrovatelnou vlnovou funkci ve tvaru
i S s kde integrujeme přes množinu všech spojitých energií a vektorovým indexem s zohledňujeme možnou degeneraci jednotlivých energetických hladin.
ψ (r , t ) = ∫ ∑ AE ,s Ψ E ,s (r ) exp − Et dE ,
I právě uvedená integrální lineární kombinace splňuje nestacionární Schrödingerovu rovnici, a zadává tedy její obecné řešení. Neznámé koeficienty AE ,s získáme pomocí počáteční podmínky
i S s z níž lze vhodným postupem [1], přesahujícím však rámec této encyklopedie, získat při vhodné „normalizaci“ Ψ E ,s
ψ 0 (r ) = ∫ ∑ AE ,s Ψ E ,s (r ) exp − Et0 dE ,
i AE ,s = exp Et0 ∫ Ψ E ,s* (r )ψ 0 (r ) d 3 r . 3 LITERATURA
[1]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 51-56.
4.3.3 KVANTOVÝ DETERMINISMUS Je kvantová mechanika teorií deterministickou? Zdá se, že nikoliv. Zatímco klasická mechanika hovoří přesnou řečí čísel reprezentujících hodnoty různých měřitelných veličin, mechanika kvantová dává jen „nepřesné“, pravděpodobnostní předpovědi. Podívejme se na tento problém podrobněji.
KLASICKÝ DETERMINISMUS Stav soustavy hmotných bodů zadáváme v klasické mechanice jejich souřadnicemi a rychlostmi a jejich časový vývoj popisujeme např. Newtonovými pohybovými rovnicemi. Zadáme-li stav soustavy hmotných bodů ve zvoleném počátečním čase, tj. zadáme-li v tomto čase polohy a rychlosti všech částic, můžeme, alespoň teoreticky, pomocí Newtonových pohybových rovnic určit jednoznačně též stav soustavy (polohy a rychlosti částic) v libovolném čase budoucím. 47
Uvedený fakt, často zobecňovaný na celou klasickou fyziku, se obvykle nazývá klasickým determinismem. Jeho zhuštěnou a velmi efektní formou je Laplaceův výrok, že bude-li mít k dispozici počáteční polohy a rychlosti všech částic ve vesmíru, bude schopen předpovědět jednoznačně jeho budoucnost.
MEZE KLASICKÉHO DETERMINISMU Ve skutečnosti naráží ovšem klasický determinismus, a to i v rámci samotné klasické mechaniky, na nepřekonatelné meze. Především přesná předpověď budoucnosti vyžaduje přesné zadání počátečního stavu. To je ovšem, jako každá jiná experimentální procedura, zatíženo experimentálními chybami. Ačkoliv klasická fyzika věří, že je možno tyto chyby neomezeně minimalizovat, moderní teorie dynamických systémů ukazuje, že někdy i zanedbatelně malé chyby mohou vést k nepředvídatelnému chování systému v budoucnosti. Druhé omezení spočívá v matematické náročnosti řešení klasických pohybových rovnic. I dnešní výkonné superpočítače umožňují, s přijatelnými výpočetními náklady, numerickou integraci klasických pohybových rovnic soustav, které obsahují maximálně několik tisíc částic, a to ještě −10 −8 navíc pouze pro reálné časové úseky v rozmezí 10 − 10 s. Klasická předpověď může být proto v důsledku technických komplikací i pro velmi malé makroskopické systémy (kapka vody) prakticky nedosažitelná.
ZOBECNĚNÝ DETERMINISMUS Pojmu determinismus však můžeme dát i poněkud volnější obsah. Pod deterministickou můžeme rozumět, v zobecněném slova smyslu, i takovou teorii, která pro zadaný počáteční stav systému umožňuje určit jednoznačně jeho stav v libovolném čase budoucím. Přitom však blíže nespecifikujeme míru informace o systému, která je v zadání stavu obsažena. Deterministická teorie musí potom splňovat následující dvě podmínky: • v rámci této teorie je definována procedura, jejíž pomocí můžeme jednoznačně definovat stav studovaného systému, •
je formulována pohybová rovnice, která umožňuje k zadanému počátečnímu stavu určit jednoznačně stavy budoucí.
KVANTOVÝ DETERMINISMUS Ve výše uvedeném zobecněném smyslu je kvantová mechanika teorií deterministickou. V jejím rámci umíme popsat stav studovaného systému pomocí vlnové funkce i zformulovat pohybovou rovnici, nestacionární Schrödingerovu rovnici, jejíž řešení je pro zadanou počáteční podmínku určeno jednoznačně (viz zde). Míra informace obsažené ve vlnové funkci pochopitelně neobstojí ve srovnání s mírou informace klasické. Polohy i rychlosti částic nemůžeme v rámci kvantové mechaniky měřit neomezeně přesně, a navíc v důsledku Heisenbergových relací neurčitosti platí, že čím přesněji změříme polohy jednotlivých částic, tím méně přesně můžeme změřit jejich rychlosti, a naopak. Informace vyžadovaná klasickou mechanikou je v rámci mechaniky kvantové poskytována pouze v pravděpodobnostní, statistické formě, což může vést k představě kvantové mechaniky jako teorie indeterministické. Vzhledem k výše řečenému je však takový pohled poněkud nespravedlivý. V rámci klasických požadavků, které jsou však, jak jsme naznačili výše, dokonce i klasickou fyzikou
48
nesplnitelné, jistě kvantová mechanika indeterministická je. V zobecněném slova smyslu se však jedná o dokonalou deterministickou teorii.
4.4 KORESPONDENCE MEZI KLASICKOU A KVANTOVOU MECHANIKOU EXISTUJE VZTAH MEZI KLASICKÝM A KVANTOVÝM POPISEM? Klasická a kvantová mechanika jsou na první pohled naprosto odlišné teorie, a to jak svou matematickou strukturou, tak i fyzikálními představami. Tak např. stav jednočásticového systému popisujeme v rámci klasické mechaniky uspořádanou šesticí reálných čísel (poloha a hybnost) a pohybové rovnice jsou obvykle psány jako obyčejné diferenciální rovnice (Newtonovy pohybové rovnice). V mechanice kvantové popisuje stav částice, pokud odhlédneme od časové závislosti, komplexní funkce tří reálných proměnných (vlnová funkce) a časový vývoj se řídí parciální diferenciální rovnicí (známou nestacionární Schrödingerovou rovnicí). Na druhé straně však tušíme, že mezi oběma teoriemi musí existovat úzký vztah. Naše zkušenosti s vývojem fyziky totiž naznačují, že nová, přesnější teorie zpravidla zahrnuje i teorii starší jako své více či méně přesné přiblížení. Jistě tomu tak bude i s kvantovou a klasickou mechanikou. Zatímco pro určité systémy (např. atomy) musíme použít, chceme-li obdržet kvantitativně spolehlivou předpověď, model kvantový, bude pro jiné (např. sluneční soustava) přijatelný jak model kvantový, tak i klasický. A tehdy musí oba modely poskytovat velmi blízká experimentálně verifikovatelná data. Podrobněji se tímto problémem zabýváme v kapitole věnované kvaziklasickému přiblížení, kde ukazujeme, že klasická mechanika je přiblížením kvantové mechaniky nultého řádu v mocninách Planckovy konstanty. Přesněji, že jedna z pohybových rovnic klasické mechaniky, tzv. rovnice Hamiltonova-Jacobiho, je nultým přiblížením nestacionární Schrödingerovy rovnice. V této kapitole se ale soustřeďme na jinou formu hledané souvislosti. Na to, jak z nestacionární Schrödingerovy rovnice vyplývají pohybové rovnice Newtonovy. Pro jednoduchost se omezíme na jednočásticový systém.
2. NEWTONŮV ZÁKON V kvantové mechanice nemohou souřadnice polohy a hybnosti bodové částice nabývat ostře definovaných hodnot. To, co obvykle v rámci klasického popisu jako polohu či hybnost částice označujeme, jsou ve skutečnosti střední hodnoty těchto veličin. Tak například pod polohou částice v čase t ve stavu popsaném normalizovanou vlnovou funkcí ψ rozumíme r (t ) =
∫ r ψ (r , t )
2
d 3r .
3
Vzhledem k časové závislosti vlnové funkce závisí na čase i odpovídající střední hodnota. V rámci klasické interpretace to znamená, že se částice pohybuje prostorem, přičemž okamžitá (střední)
49
rychlost tohoto pohybu je zřejmě dána první časovou derivací (střední) polohy, v (t ) ≡ d r (t ) / dt , což po dosazení dává 2
∂ ψ (r , t ) 3 d 2 3 r r t d r r d r= ψ ( , ) = v (t ) = ∫3 dt ∫3 ∂t kde hvězdičkou označujeme komplexní sdružení.
∂ψ
∫ r ψ * ∂t
+ψ
3
∂ψ * 3 d r, ∂t
Časová závislost vlnové funkce ψ však reprezentuje kvantověmechanický vývoj systému, samotná vlnová funkce musí tedy splňovat nestacionární Schrödingerovu rovnici. Do výrazu pro rychlost proto můžeme za časové derivace ψ a ψ* z této rovnice dosadit V ∂ψ ∂ψ * V =− ∆ψ + ψ = ∆ψ * − ψ * ∂t 2iM i 2iM i a ∂t a získat tak po úpravách vztah dr i v ≡ = ψ * ∇ψ d 3 r = − ψ * ∇ψ d 3 r , ∫ ∫ dt iM 3 M 3 v němž symbolem ∇ označujeme vektorový operátor gradient. K formulaci druhého Newtonova zákona však potřebujeme znát zrychlení částice. Získaný vztah proto musíme derivovat ještě jednou dv i d i ∂ψ 3 ∂ψ * =− ∇ψ + ψ * ∇ a≡ ψ * ∇ψ d 3 r = − ∫ d r. ∫ ∂t dt M dt 3 M 3 ∂t Po opětném dosazení z nestacionární Schrödingerovy rovnice a po úpravách obdobných těm, které jsme provedli výše, získáme M a = ∫ ψ * [ −∇V (r )]ψ d 3 r . 3
Výraz na levé straně poslední rovnosti můžeme i bez velké představivosti interpretovat jako střední hodnotu záporně vzatého gradientu potenciálu, v němž se studovaná částice pohybuje, nebo též jako střední hodnotu působící síly. Získaný vztah můžeme proto číst takto: Součin hmotnosti částice a jejího středního zrychlení je roven střední hodnotě působící síly. To ovšem velmi připomíná tvrzení, které je obsahem 2. Newtonova zákona - jednoho ze základních postulátů klasické mechaniky. Nyní jsme jej však obdrželi jako důsledek pohybové rovnice mechaniky kvantové, jako důsledek nestacionární Schrödingerovy rovnice. Ještě zřetelnější souvislost s klasickým popisem vidíme, bude-li mít částice v zadaném stavu ostře lokalizovanou polohu. Tehdy odpovídající vlnovou funkci reprezentujeme vlnovým balíkem, pochopitelně normovaným k jedničce. Integrand na pravé straně poslední získané rovnosti je v tomto případě nenulový pouze na malém okolí střední hodnoty polohy r a při výpočtu příslušného integrálu můžeme použít větu o střední hodnotě
∫ ψ * ( −∇V (r ) )ψ d r ≈ ( −∇V (r ) ) ∫ ψ *ψ d r . 3
3
3
3
Kvantovou verzi 2. Newtonova zákona můžeme proto s ohledem na normování vlnové funkce ψ přepsat pro silně lokalizovaný vlnový balík do tvaru
50
M a ≈ −∇V( r ) , což je až na zanedbatelné nepřesnosti, které se objevily v důsledku aplikace věty o střední hodnotě, 2. Newtonův zákon ve své klasické podobě.
4.4.1 ÚPRAVY VÝRAZU v ≡
∂ψ
∫ r ψ * ∂t
+ψ
3
∂ψ * 3 d r ∂t
Dosadíme-li v upravovaném výrazu za časové derivace z nestacionární Schrödingerovy rovnice, V ∂ψ ∂ψ * V =− ∆ψ + ψ = ∆ψ * − ψ *, ∂t 2iM i 2iM i a ∂t odečtou se členy obsahující potenciál V a pro střední hodnotu rychlosti dostaneme
r (ψ∆ψ * −ψ * ∆ψ ) d 3r . 2iM ∫3 Je pouhým cvičením (pozn.) z vektorové analýzy ukázat, že v =
xkψ∆ψ * = div ( xkψ∇ψ *) − ψ
a analogicky
∂ψ * − xk ∇ψ *.∇ψ ∂ xk
xkψ * ∆ψ = div ( xkψ * ∇ψ ) − ψ *
∂ψ − xk ∇ψ *.∇ψ , ∂ xk
kde ∇ a div jsou vektorové operátory gradientu a divergence, ∆ Laplaceův operátor a xk složky polohového vektoru r . Dosazením těchto vztahů do výrazu pro v obdržíme ∂ψ * ∂ψ 3 3 −ψ * ∫ div ( xkψ∇ψ *) − div ( xkψ * ∇ψ ) d r − ∫ ψ d r . ∂xk ∂xk 2iM 3 3 První z integrálů vyskytujících se na pravé straně získané rovnosti je však nulový. Podle GaussovyOstrogradského věty (viz též [1]) můžeme totiž např. psát vk =
∫ div ( x ψ∇ψ *) d r = lim ∫∫ ( x ψ∇ψ *) .dS , 3
k
3
r →+∞
k
∂K r (0)
kde symbolem ∂K r (0) označujeme povrch koule o poloměru r a se středem v počátku souřadnic. Vzhledem ke kvadratické integrovatelnosti (důsledek prvního Bornova postulátu) musí vlnová −α funkce ψ v asymptotické oblasti klesat dostatečně rychle k nule, ψ ∝ r , kde α > 3 / 2. Integrand plošného integrálu na levé straně Gaussovy-Ostrogradského věty proto v asymptotické oblasti splňuje xkψ∇ψ * ∝ r −2α −3
a klesá tedy k nule rychleji než r . Na druhé straně element povrchu koule o poloměru r je 2 úměrný kvadrátu r, dS ∼ r . Počítaný integrál proto v asymptotické oblasti klesá k nule rychleji než reciproká hodnota poloměru r, a jeho limita je tedy nulová. Pro střední hodnotu rychlosti můžeme tedy psát 51
v =−
∫ (ψ∇ψ * −ψ * ∇ψ ) d r 3
2iM
3
.
Tento vztah je možno ještě dále upravit na konečný tvar v =
∫ ψ * ∇ψ d r , 3
iM
3
uvědomíme-li si, že
∫ (ψ∇ψ * −ψ * ∇ψ ) d r = ∫ [∇(ψ *ψ ) − 2ψ * ∇ψ ] d r 3
3
3
3
a podle modifikované verze Gaussovy-Ostrogradského věty (viz též [1])
∫ ∇(ψ *ψ )d r = lim ∫∫ (ψ *ψ ) dS . 3
r →+∞
3
∂K r (0)
Pomocí stejných argumentů, jakých jsme použili výše, však již snadno ukážeme, že plošný integrál na pravé straně poslední rovnosti konverguje v nekonečnu k nule. LITERATURA
[1]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 230-232.
() 3
div ( xk a∇b ) ≡ ∑ i =1
∂ ∂xi
∂b 3 ∂xk ∂b ∂a ∂b ∂ 2b = + + x a a x x a = k ∑ k k ∂xi i =1 ∂xi ∂xi ∂xi ∂xi ∂xi 2
3 3 ∂a ∂b ∂b ∂ 2b ∂b = a ∑ δ ki + xk ∇a .∇b + xk a∆b + xk ∑ + xk a ∑ 2 = a x x x x xk ∂ ∂ ∂ ∂ ∂ i =1 i =1 i =1 i i i i 3
4.5 DYNAMICKÉ PROMĚNNÉ Pod dynamickými proměnnými (pozorovatelnými) rozumíme veličiny charakterizující stav studovaného systému (poloha, hybnost, energie atd.) V kvantové mechanice je reprezentujeme samosdruženými operátory.
PROČ SAMOSDRUŽENÉ OPERÁTORY - INSPIRUJÍCÍ PŘÍKLAD Podle prvního Bornova postulátu počítáme střední hodnotu k-té souřadnice polohy bodové částice, k = 1, 2 a 3, ve stavu popsaném vlnovou funkcí ψ podle vztahu xk =
∫x
k
3
ψ d 3 r = ∫ ψ * xk ψ d 3 r . 2
3
Pomocí bra-ketové symboliky je možno tento vztah dále přepsat do formálně jednoduššího tvaru ˆ ψ , x = ψ X k
k
ˆ v němž jsme zavedli operátor X k , který působí na vlnovou funkci tak, že násobí její funkční ˆ ψ ≡ X ˆ ψ =x ψ . X k k Tento operátor je definován na hodnoty nezávislou proměnnou xk , k stavovém prostoru studovaného systému (množině všech kvadraticky integrovatelných funkcí), který je, jak je uvedeno na jiném místě, prostorem Hilbertovým.
52
ˆ Operátor X k je tedy operátorem na Hilbertově prostoru stavů studovaného systému. Snadno
ověříme, že se jedná o operátor lineární, který má navíc některé speciální vlastnosti. Platí totiž
ϕ Xˆ kψ ≡ ∫ ϕ * ( xkψ ) d 3 r =
∫ ( x ϕ *)ψ d r ≡ 3
k
3
ˆ ϕψ X k
3
ˆ X k je tedy operátorem symetrickým a podrobnější analýza, která však přesahuje rámec našeho
výkladu, vede dokonce k závěru, že se jedná dokonce o operátor samosdružený. Podobnou úvahu, jakou jsme právě provedli pro polohu studované částice, můžeme provést i pro její hybnost. Na jiném místě je ukázáno, že střední hodnotu k-té složky hybnosti částice ve stavu popsaném vlnovou funkcí ψ můžeme určit ze vztahu ∂ψ 3 pk ≡ M v k = ∫ ψ * −i d r, ∂xk 3 což je možno přepsat pomocí bra-ketové symboliky do tvaru p = ψ Pˆ ψ , k
k
ˆ kde jsme zavedli operátor Pk ≡ −i ∂ / ∂xk . Tento operátor je rovněž lineární a samosdružený. Podrobnější analýza však opět přesahuje rámec této encyklopedie, ačkoliv ověření samotné symetrie není nikterak komplikované (pro jednoduchost je provádíme jen v jednorozměrném případě): +∞ dψ ϕ Pˆ ψ ≡ ∫ ϕ * −i dx = −i dx −∞
+∞
dψ
+∞
dϕ * dϕ *ψ −ψ dx = dx dx −∞
∫ ϕ * dx dx = − i ∫
−∞
+∞ dϕ * dϕ * ˆ = −i [ϕ *ψ ]−∞ + i ∫ ψ dx = ∫ ψ −i dx = Pϕ ψ . dx dx −∞ −∞ Zde vzhledem ke kvadratické integrovatelnosti vlnových funkcí ϕ a ψ pokládáme (pozn.) +∞
+∞
[ϕ *ψ ]−∞ = 0. +∞
REPREZENTACE DYNAMICKÝCH PROMĚNNÝCH OPERÁTORY Anglický fyzik P. Dirac, zcela jistě inspirován závěry podobnými těm, k nimž jsme dospěli ve výše uvedeném příkladu, navrhl (viz např. [1]), aby dynamické proměnné byly v rámci kvantové teorie reprezentovány samosdruženými operátory působícími na stavovém prostoru studovaného systému. Na samosdruženost těchto operátorů ukazují zřetelně výše nastíněné úvahy, sama má však ještě další, hlubší význam. Dirac totiž předpokládal, že vlastní hodnoty operátorů odpovídajících dynamickým proměnným reprezentují přípustné, měřitelné hodnoty těchto dynamických proměnných, jichž může systém nabývat.
53
Ty jsou ovšem vždy reálné, a proto ze zřejmých důvodů požadujeme, aby takové byly i zmíněné vlastní hodnoty. A právě samosdružené operátory nabývají pouze reálných vlastních hodnot (viz zde). Metodu, jak konkrétním dynamickým proměnným přiřadit kvantověmechanické operátory, shrnul Dirac do svých proslulých kvantovacích podmínek. Jejich pomocí je pak možno zkonstruovat víceméně přijatelným způsobem operátory všech významných dynamických veličin - např. polohy a hybnosti, energie či momentu hybnosti. A nejen to. V rámci operátorové verze kvantové mechaniky je možno zobecnit výpočet středních hodnot a středních fluktuací dynamických proměnných systému v zadaném stavu, jakož i formulaci obecných relací neurčitosti. Dirakovo uvedení Hilbertových prostorů a operátorů na nich do formalismu kvantové teorie bylo vůbec na přelomu dvacátých a třicátých let 20. století mocným impulzem pro její další rozvoj. A to jak v rozvíjení teorie samotné, tak i v konkrétních aplikacích.
POZNÁMKA S Dirakovým operátorovým formalismem je možno seznámit se v jeho vynikající původní učebnici [1] či v monografii Formánkově [2]. Zde jsme se museli nutně omezit jen na vybraná základní fakta a závěry. Pro úplnost je však nutno uvést, že Dirakem navržené postupy nejsou matematicky zcela korektní. Zejména reprezentace vlastních hodnot a vlastních vektorů operátorů se spojitým spektrem přináší s sebou nemalé potíže. Proto se brzy po publikování Dirakových idejí objevilo jejich matematicky přesné zpracování [3] (viz též [4]). V konkrétních výpočtech však fyzikové téměř bezezbytku používají byť ne zcela korektní, formálně však podstatně jednodušší Dirakův formalismus. Získané výsledky jsou vždy v dokonalém souladu s experimentem. LITERATURA
[1] [2] [3] [4]
DIRAC, PAM. The Principles of Quantum Mechanics. 3rd ed. Cambridge: Cambridge University Press, 1947. 311 s. FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. NEUMANN, JV. von. Mathematische Grundlagen der Quanten-mechanik. Berlin: Springer, 1932. BLANK, J., EXNER, P. a HAVLÍČEK, M. Lineární operátory v kvantové fyzice. 1. vyd. Praha: Karolinum, 1993. 678 s. ISBN 80-7066-586-6.
()
{ϕ * ( x) ψ( x)} − xlim {ϕ *( x) ψ( x)} [ϕ * ψ ]−∞ ≡ xlim →+∞ →−∞ +∞
4.5.1 DIRAKOVY KVANTOVACÍ PODMÍNKY Podle anglického fyzika Diraka přiřazujeme v rámci kvantové mechaniky dynamickým proměnným samosdružené operátory působící na stavovém prostoru systému. Předpis, jak to udělat, udávají následující dva postuláty.
DIRAKOVY KVANTOVACÍ PODMÍNKY Nechť C je dynamická proměnná definovaná prostřednictvím jiných dynamických proměnných A a B vztahem
C = { A, B}P ,
54
kde
{ A, B}P
jsou tzv. Poissonovy závorky známé z klasické mechaniky. Nechť jsou dále
ˆ Pak proměnné C ˆ a B. dynamickým proměnným A a B přiřazeny samosdružené operátory A ˆ definovaný vztahem odpovídá operátor C ˆ ˆ = i C, ˆ A,B ˆ B ˆ A, ˆ ˆ a B. označuje tzv. komutátor operátorů A kde ˆ ˆ=i C ˆ A,B Proč se na pravé straně rovnosti vyskytuje multiplikativní faktor i ? Z definice Poissonových závorek a z rozměrové analýzy plyne především, že rozměr proměnné C je dán podílem součinu rozměrů veličin A a B a součinu rozměrů hybnosti a souřadnice. Ten je ovšem J.s (Joule krát sekunda) a na pravé straně operátorové relace musí tedy nutně stát multiplikativní konstanta stejného rozměru – tedy J.s. Ukázalo se, že takovou vhodnou konstantou je „škrtnutá“ ˆ ˆ ˆ musí být tato konstanta konstanta Planckova. Vzhledem k samosdruženosti operátorů A, B i C navíc ryze imaginární.
PRINCIP KORESPONDENCE Samotné Dirakovy kvantovací podmínky k jednoznačnému přiřazení operátorů jednotlivým dynamickým proměnným nestačí. Proto se k nim zpravidla připojuje další postulát - princip korespondence. Nechť je dynamická proměnná C funkcí dynamických proměnných A1 , ..., AK , C = f ( A1 ,..., AK ) . Pak jí v rámci kvantové teorie přiřadíme operátor
(
)
ˆ= f A ˆ ,...,A ˆ , C 1 K ˆ ˆ kde A1 , ..., A K jsou operátory přiřazené dynamickým proměnným A1 , ..., AK .
Výše uvedená funkce f obvykle reprezentuje algebraický výraz v proměnných A1 , ..., AK . K jeho převedení do operátorové formy užíváme definic algebraických operací pro operátory. Ty můžeme pomocí McLaurinova rozvoje využít i k nalezení obecnějších operátorových funkcí. Potíže při použití principu korespondence může působit fakt, že násobení operátorů není obecně komutativní. Pak totiž velmi záleží na pořadí činitelů v operátorových součinech. Jejich uspořádání musí být tedy v konkrétních případech vhodně zvoleno (tak, aby teorie byla vnitřně bezesporná a její výsledky souhlasily s experimentem) a lze na ně pohlížet jako na dodatečný postulát. Každou dynamickou proměnnou je možno vyjádřit jako funkci zobecněných souřadnic a hybností studovaného systému. Proto operátory přiřazené dynamickým proměnným můžeme vždy psát jako funkce operátorů přiřazených souřadnicím a hybnostem. Dirakových kvantovacích podmínek proto musíme nejdříve využít právě k nalezení těchto, v jistém smyslu základních, operátorů. Jejich pomocí a s využitím principu korespondence pak již relativně snadno nalezneme operátory všech
55
dalších dynamických proměnných. Mezi jinými i těch, které hrají v rámci klasické i kvantové mechaniky velmi významnou roli - energie a momentu hybnosti.
4.5.2 POLOHA A HYBNOST Na základě úvah souvisejících s výpočty středních hodnot (viz zde) se přiřazují souřadnicím polohy xk a hybnosti pk bodové částice samosdružené operátory
ˆ =x , X k k Pˆ k = −i
∂ ∂xk ,
nebo přesněji ˆ ϕ ≡ x ϕ (r ), X k k
∂ϕ ( r ) Pˆ k ϕ ≡ −i , ∂xk kde ϕ je vlnová funkce, jejíž nyní nepodstatnou časovou závislost zanedbáváme. Na levých stranách definičních rovností tuto vlnovou funkci zapisujeme pomocí bra-ketové symboliky.
Ukažme si, že takto definované operátory splňují Dirakovy kvantovací podmínky.
POLOHA Pro Poissonovy závorky
{ xk , xm }P
{ xk , xm }P
můžeme podle definice psát 3 ∂x ∂x ∂x ∂x 3 ≡ ∑ k m − k m = ∑ (δ kj 0 − 0δ mj ) = 0, ∂p j ∂x j j =1 j =1 ∂x j ∂p j
kde δ ij je Kroneckerovo delta. Podle Dirakových kvantovacích podmínek musí být tedy nulový i ˆ ,X ˆ . X komutátor k m Přesněji, pro libovolnou vlnovou funkci ϕ z definičního oboru součinu obou operátorů musí platit ˆ ˆ ˆ ˆ ˆ ˆ X k , Xm ϕ ≡ Xk Xm ϕ − XmXk ϕ = 0 , kde 0 označuje vlnovou funkci nulovou na celém prostoru. Je tomu skutečně tak? Na základě definic operátorů přiřazených jednotlivým souřadnicím polohy snadno ověříme, že platí ˆ X ˆ ϕ −X ˆ X ˆ ϕ ≡ x x ϕ ( r ) − x x ϕ ( r ) = 0, X k
m
m
k
k
m
m k
neboť násobení reálnými čísly je komutativní. Odpovídající komutátor je proto nulový a definice operátorů přiřazených jednotlivým souřadnicím polohy částice je kompatibilní s Dirakovými kvantovacími podmínkami.
56
HYBNOST I pro složky hybnosti jsou Poissonovy závorky { pk , pm }P nulové, a tedy takovými musí být i odpovídající komutátory. Pro libovolnou vlnovou funkci ϕ z definičního oboru součinu operátorů Pˆ k a Pˆ m musí proto platit Pˆ k , Pˆ m ϕ ≡ Pˆ k Pˆ m ϕ − Pˆ m Pˆ k ϕ = 0 ,
kde symbol 0 rovnosti.
označuje, stejně jako výše, nulovou vlnovou funkci. Ověřme platnost této
Na základě definice operátorů složek hybnosti můžeme psát 2 ∂ ∂ϕ ∂ ∂ϕ ∂ 2ϕ 2 ∂ ϕ − = − − Pˆ k Pˆm ϕ − Pˆ m Pˆk ϕ ≡ − 2 . ∂xk ∂xm ∂xm ∂xk ∂xk ∂xm ∂xm ∂xk Poslední uvedený výraz je však, vzhledem k záměnnosti pořadí parciálních derivací pro dostatečně derivovatelné funkce, nutně nulový. Nulovost komutátoru je tedy ověřena i pro operátory složek hybnosti.
POLOHA A HYBNOST Abychom dokončili ověření Dirakových kvantovacích podmínek pro operátory složek polohy a hybnosti bodové částice, musíme se ještě věnovat jejich vzájemným komutacím. Pro odpovídající Poissonovy závorky snadno získáme ∂pk ∂xm ∂pk ∂xm 3 − = ∑ ( 0 − δ kjδ mj ) = −δ km , ∂p j ∂x j j =1 j =1 ∂x j ∂p j ˆ Pˆ , X kde δ km opět označuje Kroneckerovo delta. Komutátor k m musí tedy podle Dirakových podmínek splňovat 3
{ pk , xm }P ≡ ∑
ˆ = −i δ . Pˆ k , X m km ˆ ˆ Pro libovolnou vlnovou funkci z definičního oboru součinu operátorů Pk a X m musí tedy platit ˆ ϕ −X ˆ Pˆ ϕ = −i δ ϕ . Pˆ X k
m
m k
km
Na základě definic uvedených operátorů však můžeme psát ˆ ϕ ≡ −i ∂ ( x ϕ ) = −i δ ϕ − i x ∂ϕ , Pˆ k X m m km m ∂xk ∂xk ˆ Pˆ ϕ ≡ −i x ∂ϕ , X m k m ∂xk a tedy též ˆ ϕ −X ˆ Pˆ ϕ = −i δ ϕ ≡ −i δ ϕ . Pˆ X k
m
m k
km
km
Dirakovy kvantovací podmínky jsou proto ověřeny i pro vzájemné komutace operátorů souřadnic polohy a složek hybnosti. 57
4.5.3 ENERGIE HAMILTONŮV OPERÁTOR Samosdružený operátor, který v rámci kvantové teorie přiřazujeme celkové energii bodové částice, nalezneme pomocí principu korespondence. Celkovou energii částice o hmotnosti M, která se pohybuje ve vnějším poli potenciálu V, reprezentujeme v klasické mechanice tzv. Hamiltonovou funkcí p2 H ( p, r ) = + V (r ). 2M Odpovídající kvantověmechanický operátor, který se často nazývá operátorem Hamiltonovým, stručněji hamiltoniánem, získáme podle principu korespondence dosazením operátorů polohy a hybnosti do výše uvedeného vztahu. Tedy ˆ2 ˆ ˆ = P + V (X), H 2M
ˆ ˆ ˆ ,X ˆ ,X ˆ . P ≡ Pˆ1 , Pˆ 2 , Pˆ3 X ≡ X 1 2 3 kde jsme zavedli vektorové operátory a (Hranaté závorky nyní označují složkový zápis vektoru, nikoliv komutátor!) Druhou mocninu operátoru hybnosti a ˆ funkci V (X) počítáme obvyklým způsobem. Pro libovolnou vlnovou funkci ϕ z definičního oboru hamiltoniánu tedy můžeme pomocí definic operátorů hybnosti a polohy psát (v níže uvedeném vztahu užíváme částečně bra-ketovou symboliku) ˆ2 ∂ ∂ϕ (r ) 1 3 ˆ ˆ ϕ = P ϕ + V (X) ϕ =− H −i −i + V (r )ϕ (r ) ∑ ∂xk ∂xk 2M 2 M k =1 a po úpravách 2 ∂ 2ϕ (r ) + V (r )ϕ (r ) = − ∆ϕ (r ) + V (r )ϕ (r ), ∑ 2 M k =1 ∂xk 2 2M kde symbol ∆ označuje Laplaceův operátor. Stručněji tedy
ˆ ϕ =− H
2
3
ˆ =− H
2
2M
∆ + V (r ).
58
VLASTNÍ
HODNOTY
HAMILTONOVA
OPERÁTORU,
STACIONÁRNÍ
SCHRÖDINGEROVA ROVNICE Podle Dirakovy interpretace reprezentují vlastní hodnoty samosdružených operátorů v kvantové mechanice měřitelné hodnoty odpovídajících dynamických proměnných. Vlastní hodnoty Hamiltonova operátoru zadávají proto realizovatelné hodnoty celkové energie a odpovídající vlastní vektory (vlnové funkce) stavy, v nichž jsou tyto přípustné hodnoty energie nabývány. Rovnici pro vlastní hodnoty hamiltoniánu jednočásticového systému můžeme psát v kompaktním tvaru ˆ ϕ =E ϕ H ˆ též a po rozvinutí symbolu H
−
2
2M
∆ϕ (r ) + V (r )ϕ (r ) = Eϕ (r ).
To je ovšem proslulá stacionární Schrödingerova rovnice. Rovnice pro vlastní hodnoty hamiltoniánu je tedy totožná se stacionární Schrödingerovou rovnicí studovaného systému a odpovídající vlastní vlnové funkce odpovídají vlnovým funkcím stacionárním.
NESTACIONÁRNÍ SCHRÖDINGEROVA ROVNICE Dále též vidíme, že nestacionární Schrödingerovu rovnici můžeme psát pomocí Hamiltonova operátoru v kompaktním tvaru ˆ ϕ =i ∂ ϕ . H ∂t
4.5.4 MOMENT HYBNOSTI OPERÁTORY SLOŽEK MOMENTU HYBNOSTI Samosdružené operátory, které v rámci kvantové teorie přiřazujeme složkám momentu hybnosti, nalezneme pomocí principu korespondence. V klasické fyzice je moment hybnosti bodové částice definován jako vektorový součin jejího polohového vektoru a hybnosti L = r × p, což přepsáno do složek dává s použitím Levi-Civitova symbolu
Lj =
3
∑ε
k ,l =1
x pl .
jkl k
Pro odpovídající kvantověmechanické operátory proto můžeme psát 59
Lˆ j =
3
∑ε
k ,l =1
jkl
ˆ Pˆ ≡ −i X k l
3
∑ε
k ,l =1
x
jkl k
∂ . ∂xl
Moment hybnosti hraje velmi významnou roli pro částice nacházející se v poli centrálních sil popsaných sféricky symetrickým potenciálem V ( r ) . V klasické fyzice je totiž v takovém případě integrálem pohybu a zachovává se během časového vývoje. Protože je obvykle výhodné popisovat systémy se sférickou symetrií pomocí sférických souřadnic, uveďme pro úplnost i odpovídající vyjádření operátorů složek momentu hybnosti: ∂ ∂ Lˆ 1 = i sin ϕ + cotgθ cos ϕ , ∂θ ∂ϕ ∂ ∂ Lˆ 2 = i − cos ϕ + cotgθ sin ϕ , ∂θ ∂ϕ ∂ Lˆ 3 = i . ∂ϕ
OPERÁTOR KVADRÁTU MOMENTU HYBNOSTI Velmi významnou roli hraje v kvantové mechanice kvadrát velikosti momentu hybnosti, jemuž na základě principu korespondence přiřazujeme operátor 2 2 2 Lˆ 2 ≡ Lˆ 1 + Lˆ 2 + Lˆ 3 .
Ve sférických souřadnicích můžeme pro něj psát
Lˆ 2 = −
2
1 ∂ ∂ 1 ∂2 + θ sin . sin θ ∂θ ∂θ sin 2 θ ∂ϕ 2
KOMUTACE OPERÁTORŮ PŘIŘAZENÝCH MOMENTU HYBNOSTI ˆ ˆ ˆ Operátory L1 , L 2 a L3 navzájem nekomutují. Dá se ukázat, že platí Lˆ j , Lˆ k = i ε jkl Lˆ l ,
kde hranatými závorkami označujeme komutátor vepsaných operátorů a ε jkl je Levi-Civitův symbol. Podle kapitoly věnované obecným relacím neurčitosti není proto možno změřit všechny tři složky momentu hybnosti neomezeně přesně. Vektor momentu hybnosti není tedy v rámci kvantové mechaniky měřitelnou veličinou a jeho složky nejsou kompatibilní pozorovatelné. Na druhé straně je však možno dokázat, že operátor kvadrátu momentu hybnosti Lˆ 2 komutuje s Lˆ , Lˆ 2 = 0. každou z jeho složek, k 60
V rámci kvantové teorie jsou tedy kvadrát momentu hybnosti a libovolná z jeho složek, obvykle se volí složka třetí, současně měřitelné. Navíc hodnoty L2 a Lk jsou maximální možnou informací, kterou můžeme o momentu hybnosti částice v rámci kvantové mechaniky podat.
VLASTNÍ HODNOTY A VLASTNÍ FUNKCE OPERÁTORU KVADRÁTU MOMENTU HYBNOSTI Vlastní hodnoty operátoru Lˆ 2 odpovídají podle Dirakovy teorie měřitelným (přípustným) hodnotám kvadrátu momentu hybnosti. Získáme je pomocí charakteristické rovnice Lˆ 2 ψ = L2 ψ . Řešení této rovnice je poměrně obtížné a vyžaduje netriviální matematické znalosti. Zde uveďme jen, že je ve sférických souřadnicích reprezentováno kulovými funkcemi Ylm (θ , ϕ ) (viz též [1] a [2]) splňujícími
Lˆ 2Ylm ≡ −
2
1 ∂ ∂ 1 ∂2 + θ Y = l (l + 1) 2Ylm , sin sin θ ∂θ 2 2 lm ∂ ∂ θ θ ϕ sin
kde l je celé nezáporné číslo a m nabývá pro zadané l hodnot -l, -1+1, …, l-1, l. V atomové fyzice se první z těchto čísel obvykle nazývá vedlejším kvantovým číslem a druhé kvantovým číslem magnetickým. Navíc je možno ukázat, že platí ∂Ylm Lˆ 3Ylm ≡ −i = m Ylm . ∂ϕ
ˆ Kulové funkce jsou tedy společnými vlastními funkcemi operátorů Lˆ 2 a L3 .
LITERATURA
[1]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 787-792.
[2]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 601-605.
4.5.5 STŘEDNÍ HODNOTY A STŘEDNÍ KVADRATICKÉ FLUKTUACE STŘEDNÍ HODNOTA
61
Střední hodnotu veličiny A, kterou v kvantové mechanice reprezentuje samosdružený operátor ˆ A, můžeme ve stavu zadaném normalizovanou vlnovou funkcí ψ , pomocí vzorce (v němž částečně používáme bra-ketovou symboliku)
∫ ψ (r ) 3
2
d 3 r = 1,
počítat
( )
ˆ ψ ≡ ψ* A ˆ ψ d 3r . a= ψ A ∫ R3
Výraz použitý pro výpočet střední hodnoty obecné veličiny A je inspirován vztahy, který je možno v rámci kvantové mechaniky získat pro střední hodnotu polohy a hybnosti částice (viz úvodní příklad zde).
STŘEDNÍ KVADRATICKÁ FLUKTUACE Střední kvadratická fluktuace veličiny A odpovídá podle definice střední hodnotě kvadrátu její
okamžité fluktuace
(A−a)
2
, což přepsáno do operátorového tvaru dává
(
)
(
)
2 2 3 ˆ − a1ˆ ψ ≡ ψ * A ∆a 2 = ψ A ∫3 ˆ − a1ˆ ψ d r , R
ˆ kde 1ˆ je operátor identity, tj. pro každou vlnovou funkci ψ splňuje relaci 1 ψ = ψ . Získaný výraz můžeme dále převést umocněním výrazu v závorce v integrálu na levé straně do obvykle používaného tvaru
∆a 2 = a 2 − a 2 ,
v němž jsme zavedli
(≡ ψ
ˆ 2ψ d 3 r a2 ≡ ∫ ψ * A R3
)
ˆ2 ψ . A
umocněním výrazu v závorce
∫ ψ * ( Aˆ − a1ˆ )
R3
=
2
(
)
2 ˆ 2 − 2aA+ ˆ a 2 1ˆ ψ d 3 r = ψ d 3r = ∫ ψ * A R3
∫ ψ * Aˆ ψ d r − 2a ∫ ψ * Aˆ ψ d r + a ∫ ψ * ψ d r = 2
R
3
3
3
R
3
3
R
ˆ 2 ψ d 3 r − 2a a + a 2 = = ∫ ψ*A R3
2
3
2 3 2 ∫ ψ * Aˆ ψ d r − a
R3
4.5.6 RELACE NEURČITOSTI Na jiném místě ukazujeme, že střední kvadratické fluktuace hybnosti a polohy částice nejsou nezávislé veličiny. Nyní si ukážeme, že k obdobným závěrům můžeme dospět i pro další dvojice veličin, k čemuž s velkým užitkem využijeme Dirakovy operátorové reprezentace dynamických proměnných. Důsledně též budeme používat bra-ketovou symboliku. 62
RELACE NEURČITOSTI ˆ a B ˆ jsou samosdružené operátory, které v rámci kvantové mechaniky přiřazujeme Nechť A ˆ ˆ dynamickým proměnným A a B, a [A, B] nechť je jejich komutátor. Pak platí tzv. Robertsonův vztah
∆a ∆b ≥
1 ψ [ Aˆ , Bˆ ] ψ , 2
kde ∆a a ∆b jsou střední kvadratické fluktuace veličin A a B a ψ funkce popisující zadaný stav studované částice.
je normalizovaná vlnová
Výše uvedená formule, jejíž podrobné odvození je možno nalézt zde, je zcela jistě vhodným vyjádřením relace neurčitosti pro veličiny A a B.
KOMPATIBILNÍ A NEKOMPATIBILNÍ VELIČINY ˆ a B ˆ může být buď nulový, nebo nenulový. Výše uvedený komutátor operátorů A
ˆ ˆ ˆ a B ˆ komutují. V tomto případě Je-li nulový, tj. platí-li [A, B] = 0, říkáme, že operátory A přechází relace neurčitosti pro A a B na triviální tvar ∆a ∆b ≥ 0, který je ovšem vzhledem k definici středních kvadratických fluktuací vždy splněn. Získaný výsledek můžeme proto interpretovat slovy, že měření veličin A a B se v zadaném stavu nijak neovlivňují a obě veličiny je možno v rámci kvantového popisu současně měřit neomezeně přesně. Takové veličiny nazýváme kompatibilními (viz též zde).
Je-li naopak uvedený komutátor nenulový, je součin odpovídajících středních kvadratických fluktuací vždy větší či roven zadanému nezápornému (zpravidla kladnému) číslu a zmenšení chyby měření jedné veličiny znamená proto růst chyby veličiny druhé. Obě veličiny proto nelze současně měřit neomezeně přesně. Takové veličiny nazýváme obvykle nekompatibilními.
POLOHA A HYBNOST Pro komutátory operátorů přiřazených odpovídajícím si složkám polohy a hybnosti bodové částice, jak odvozujeme na jiném místě, platí ˆ = −i , k = 1, 2,3. Pˆ k , X k Dosazením do Robertsonova vztahu dostáváme tak vzhledem k normalizaci vlnové funkce ψ 1 ∆xk ∆pk ≥ ψ ( −i ) ψ = ψ ψ = . 2 2 2 ˆ ˆ ,X ˆ Pˆ , X X Pˆ , Pˆ , Pro j ≠ k jsou komutátory j k nulové. Nulové jsou i komutátory j k a j k tentokrát dokonce pro libovolné hodnoty indexů j a k (viz též zde). Pomocí Robertsonova vztahu proto můžeme psát 63
∆x j ∆pk ≥ 0 (pro j ≠ k ), ∆x j ∆xk ≥ 0 a
∆p j ∆pk ≥ 0 (pro j a k libovolné).
To je ale obvyklý tvar Heisenbergových relací neurčitosti pro polohu a hybnost.
4.5.7 RELACE NEURČITOSTI - PODROBNÉ ODVOZENÍ Střední kvadratické fluktuace veličin A a B, reprezentovaných v kvantové mechanice ˆ ˆ a B, samosdruženými operátory A počítáme ve stavu popsaném normalizovanou vlnovou funkcí
ψ pomocí definičních vztahů
(
)
2
ˆ − a1ˆ ψ ∆a 2 = ψ A
a
(
)
2
ˆ − b 1ˆ ψ . ∆b 2 = ψ B
ˆ ˆ ≡B ˆ − b 1, ˆ ≡A ˆ − a1ˆ a ∆B Zavedeme-li nové samosdružené operátory ∆A můžeme uvedené formule přepsat do tvaru ∆a 2 = α α a ∆b 2 = β β ,
ˆ kde α ≡ ∆A ψ
ˆ a β ≡ ∆B ψ , a pro součin středních kvadratických fluktuací psát
∆a ∆b =
αα β β .
Podle Cauchyho-Buňakovského nerovnosti však platí 2
αα β β ≥ α β
,
a tedy též ∆a ∆b ≥ α β .
Vrátíme-li se zpět k vlnové funkci ψ přepsat do tvaru
ˆ ˆ a ∆B, a operátorům ∆A je možno poslední formuli
∆a ∆b ≥ ψ ∆Aˆ ∆Bˆ ψ ˆ ˆ a ∆B, užijeme-li a dále též pomocí komutátoru a antikomutátoru operátorů ∆A
{
do tvaru
}
ˆ ∆B ˆ ∆B ˆ ∆B ˆ = 1 ∆A, ˆ + 1 ∆A, ˆ , ∆A 2 2 ∆a ∆b ≥
(
{
}
1 ˆ ∆B ˆ ∆B ˆ ψ + ψ ∆A, ˆ ψ ψ ∆A, 2
).
{
}
ˆ ˆ ˆ a ∆B ˆ je ovšem možno ukázat, že ψ ∆A, ∆B ψ Vzhledem k samosdruženosti operátorů ∆A ˆ ∆B ˆ ψ ψ ∆A, ryze imaginární číslo. Z trojúhelníkové nerovnosti pro komplexní je reálné a čísla je proto zřejmé, že platí ˆ ∆B ˆ ∆B ˆ ∆B ˆ ψ + ψ ∆A, ˆ ψ ≥ ψ ∆A, ˆ ψ , ψ ∆A, a tedy též
{
}
64
∆a ∆b ≥
1 ˆ ∆B ˆψ . ψ ∆A, 2
Jednoduchým algebraickým výpočtem se snadno přesvědčíme, že
a dospějeme tak ke kýžené formuli
ˆ ∆B ˆ ˆ ˆ = A, ∆A, B ,
∆a ∆b ≥
1 ˆ B ˆψ . ψ A, 2
CAUCHYHO-BUŇAKOVSKÉHO NEROVNOST Nechť α β Pak platí
označuje skalární součin dvou vektorů z nějakého lineárního vektorového prostoru.
αα β β ≥ α β
2
.
DŮKAZ: Je-li některý z vektorů α či β nulový, je uvedená nerovnost vzhledem k axiomům skalárního součinu splněna automaticky. Přechází totiž na triviální nerovnost 0 ≥ 0. Je proto nezbytné provést důkaz jen pro případ, kdy jsou oba vektory nenulové. Pak ovšem můžeme zavést nový, pomocný vektor β α ξ= . γ = α − ξ β , kde β β Vzhledem k vlastnostem skalárního součinu vidíme, že platí (hvězdičkou označujeme komplexní sdružení) 2
α β γ γ = α α − ξ α β − ξ * β α + ξξ * β β = α α − . β β Protože však γ γ ≥ 0, platí i nerovnost
αα β β ≥ α β jednoduchým algebraickým výpočtem ˆ ∆B ˆ ∆B ˆ = A ˆ − a1ˆ B ˆ − a1ˆ = ˆ ≡ ∆A ˆ − ∆B ˆ ∆A ˆ − b 1ˆ − B ˆ − b 1ˆ A ∆A, ˆ ˆ −A ˆ b 1ˆ − a1B ˆ ˆ + a 1ˆb 1ˆ − BA ˆ ˆ + b 1ˆa1ˆ = ˆ ˆ −B ˆ a1ˆ − b 1A = AB
(
( ) (
)(
) (
)
)(
ˆ ˆ − bA ˆ − aB ˆ − a b = AB ˆ ˆ − BA ˆ ˆ ˆ + a b − BA ˆ ˆ + aB ˆ + bA ˆ ˆ ≡ A,B = AB
65
)
2
.
4.6 ČÁSTICE VE VNĚJŠÍM ELEKTROMAGNETICKÉM POLI STACIONÁRNÍ A NESTACIONÁRNÍ SCHRÖDINGEROVA ROVNICE PRO NABITOU ČÁSTICI VE VNĚJŠÍM ELEKTROMAGNETICKÉM POLI V této kapitole si ukážeme, jak je možno sestavit stacionární a nestacionární Schrödingerovu rovnici pro bodovou částici ve vnějším elektromagnetickém poli. Jak je ukázáno na jiném místě, můžeme obě rovnice napsat, známe-li tvar Hamiltonova operátoru pro studovaný systém. Ten nalezneme snadno pomocí klasické Hamiltonovy funkce a principu korespondence. Klasická Hamiltonova funkce nabývá pro bodovou částici o hmotnosti M, která nese náboj q a je umístěna ve vnějším elektromagnetickém poli popsaném vektorovým potenciálem A a skalárním potenciálem ϕ, tvaru 2
p − qA ( r , t ) + qϕ r , t + V r H ( p, r , t ) = ( ) ( ) 2M .
V uvedeném vztahu označují r a p polohový vektor a kanonickou hybnost studované částice, prostřednictvím potenciálu V jsou do něj zahrnuty i další interakce. Po dosazení operátorů polohy a hybnosti a po užití principu korespondence získáme kvantověmechanický hamiltonián nabité částice 2
−i ∇ − qA ( r , t ) + qϕ r , t + V r ˆ = H ( ) ( ) 2M
a jeho pomocí i nestacionární Schrödingerovu rovnici 2 ∂ψ ( r , t ) −i ∇ − qA ( r , t ) . + qϕ ( r , t ) + V ( r ) ψ ( r , t ) = i 2M ∂t Tu můžeme ještě dále upravit do obvykle uváděného tvaru
2 ∂ψ ( r , t ) iq iq q2 2 A A A + qϕ + V ψ ( r , t ) = i − ∆ + . ∇ + div + . M 2M 2M ∂t 2M
Ve výše uvedených vztazích označují symboly ∇, div a ∆ vektorové operátory gradientu a divergence a operátor Laplaceův. Nachází-li se částice v časově neproměnném elektromagnetickém poli, můžeme hledat její vlastní energie a odpovídající stacionární vlnové funkce pomocí stacionární Schrödingerovy rovnice 66
2 iq iq q2 2 − ∆ + ∇ + + A . div A A + qϕ + V Ψ ( r ) = EΨ ( r ) . 2M 2M M 2M
ČÁSTICE V HOMOGENNÍM MAGNETICKÉM POLI Homogenní magnetické pole o konstantní magnetické indukci B můžeme popsat vektorovým 1 A = B×r , 2 potenciálem skalární potenciál je po vhodné kalibraci roven nule. Hamiltonův operátor pak pro nabitou částici pohybující se v tomto poli nabývá tvaru ˆ 2 2 L q2 q ˆ B × r + V , B. + H=− ∆− 2M 2M 8M
(
)
ˆ kde L je kvantověmechanický operátor momentu hybnosti. V nepříliš silných magnetických polích lze třetí člen na pravé straně uvedené rovnosti zanedbat.
Zlomek µ0 ≡ q 2M se obvykle nazývá magnetonem částice a v případě elektronu −23 2 ( µ 0 0,927 .10 Am [1], [2]) magnetonem Bohrovým.
PAULIHO ROVNICE Po započtení elektromagnetické interakce do kvantového popisu začíná hrát významnou roli spin studované částice. Podle významného švýcarského fyzika W. Pauliho se kvantová evoluční rovnice s explicitně zahrnutým spinem nazývá rovnicí Pauliho [3]. Spin je dynamická proměnná, která nemá v klasické fyzice odpovídající protějšek. Je často interpretována jako vlastní moment hybnosti částice a úzce souvisí s jejím vlastním magnetickým momentem. Ten reprezentujeme v kvantové teorii operátorem
sˆ µˆ ≡ µ , s kde sˆ je operátor spinu, s jeho velikost a µ konstanta charakteristická pro studovanou částici. Pro elementární částice se spinem s = 1/2 a o hmotnosti M vede kvantová teorie pole k hodnotě µ = e 2M , kde e je elementární elektrický náboj. Proto se výraz pro vlastní magnetický moment částice píše často v alternativním tvaru e ˆ µˆ = g s, 2M v němž multiplikativní faktor g, tzv. g-faktor, popisuje anomální chování vlastního magnetického momentu hadronů (např. nukleonů). Pro elektron je g-faktor s velmi vysokou přesností roven dvěma [1], [2] ( g e 2 × 1, 00115966).
67
Částice s nenulovým spinem nese tedy nenulový magnetický moment a ten nutně interaguje s vnějším elektromagnetickým polem. Do hamiltoniánu takové částice musíme proto přidat člen ˆ B (r,t), −µ. který odpovídá potenciální energii magnetického momentu µ v poli o magnetické indukci B. Hamiltonův operátor pak píšeme ve tvaru 2
−i ∇ − qA ( r , t ) + qϕ r , t − µ. ˆ = ˆ H ( ) ˆ B ( r , t ) + V, 2M
kde stříškou nad V naznačujeme, že i další interakce studované částice mohou být spinově závislé. Po nezbytných úpravách můžeme tedy napsat kvantověmechanickou pohybovou rovnici nabité částice s nenulovým spinem, která se nachází ve vnějším elektromagnetickém poli, ve tvaru 2 iq iq q2 2 ˆ ˆ ψ = i ∂ψ , divA + A.∇ + A − µ.B + qϕ + V ∆+ − 2M 2M ∂t M 2M
kde ψ je vícesložková vlnová funkce zahrnující spolu s orbitálními i spinové stupně volnosti. Tato rovnice se nazývá rovnicí Pauliho. Jí odpovídající rovnice stacionární pak pro časově neměnná pole nabývá tvaru 2 iq iq q2 2 ˆ ˆ Ψ ( r ) = E Ψ ( r ) . divA + ∆+ A.∇ + A − µ.B + qϕ + V − M 2M 2M 2M
LITERATURA
[1] [2] [3]
BROŽ, J., ROSKOVEC, V. a VALOUCH, M. Fyzikální a matematické tabulky. 1. vyd. Praha: SNTL, 1980. 305 s. GROOM, DE., et al. The European Physical Journal, 2000, vol. C15, p. 1. PAULI, W. Zeitschrift für Physik, 1927, Bd. 43, S. 601.
4.6.1 HAMILTONOVA FUNKCE NABITÉ ČÁSTICE VE VNĚJŠÍM ELEKTROMAGNETICKÉM POLI Konstrukce klasické Hamiltonovy funkce je pro nabitou částici ve vnějším elektromagnetickém poli poměrně komplikovanou záležitostí, a to především proto, že síly na tuto částici působící závisejí nejen na její poloze, ale i na rychlosti. Výklad, který zde pro úplnost uvádíme, vyžaduje netriviální znalosti klasické mechaniky, které je možno nalézt ve specializovaných učebnicích [1]. Níže uvádíme jen shrnutí základních faktů.
KANONICKÁ HYBNOST, ZOBECNĚNÝ POTENCIÁL, KLASICKÁ HAMILTONOVA FUNKCE Kanonickou hybnost bodové částice definujeme v klasické mechanice výrazem
68
p≡
∂L(r , υ , t ) , ∂υ
kde L je tzv. Lagrangeova funkce studované částice,
r
její zobecněné souřadnice (zde
souřadnice kartézské) a υ její rychlost, υ = dr / dt . Symbol parciální derivace na pravé straně uvedené definiční rovnosti je zkratkou pro derivování podle jednotlivých složek rychlosti υ. (pozn.) Lagrangeova funkce je dána rozdílem kinetické energie částice a jejího zobecněného potenciálu. V
kartézských souřadnicích nabývá tvaru L(r , υ , t ) ≡
1 M υ 2 − U (r , υ , t ), 2
kde zobecněný potenciál U může záviset obecně nejen na poloze, ale i na rychlosti studované částice. Je definován vztahem pro sílu, kterou vnější pole na tuto částici působí, F≡
d ∂U − ∇U , dt ∂υ
kde ∇ je operátor gradientu. Z uvedeného vztahu bezprostředně vyplývá, že v případě rychlostně nezávislých sil splývá zobecněný potenciál U s „řádným“ potenciálem splňujícím F = −∇U . Hamiltonovu funkci definujeme v klasické mechanice předpisem H ≡ p.υ − L.
Obvykle ji vyjadřujeme jako funkci kanonické hybnosti p , polohy r a případně i času t. V potenciálových polích je totožná s celkovou energií částice.
ZOBECNĚNÝ POTENCIÁL PRO NABITOU ČÁSTICI VE VNĚJŠÍM ELEKTROMAGNETICKÉM POLI Silové účinky elektromagnetického pole popsaného elektrickou intenzitou E a magnetickou indukcí B na částici nesoucí elektrický náboj q a pohybující se rychlostí υ jsou dány tzv. Lorentzovou sílou
(
)
F = q E +υ × B . Pomocí výše uvedené definice snadno ověříme, že pro zobecněný potenciál můžeme v tomto případě psát U ( r , υ , t ) = q ϕ ( r , t ) − υ . A ( r , t ) . 69
Symboly ϕ a A označují skalární a vektorový potenciál studovaného elektromagnetického pole, které splňují definiční vztahy ∂A − ∇ϕ E=− ∂t a B = rot A , kde rot je vektorový operátor rotace.
HAMILTONOVA
FUNKCE
NABITÉ
ČÁSTICE
VE
VNĚJŠÍM
ELEKTROMAGNETICKÉM POLI Pro Lagrangeovu funkci nabité částice v elektromagnetickém poli můžeme psát L(r , υ , t ) ≡
1 M υ 2 − q ϕ ( r , t ) − υ . A ( r , t ) 2
a podle definice máme tedy pro odpovídající kanonickou hybnost p≡
∂L(r , υ , t ) = M υ + qA . ∂υ
Všimněme si, že kanonická hybnost p není v tomto případě totožná s hybností M υ, jak ji obvykle chápeme. Dosazením výše uvedených výrazů pro Lagrangeovu funkci a kanonickou hybnost do definičního vztahu pro Hamiltonovu funkci získáme po nezbytných úpravách, nepředpokládáme-li působení dalších vnějších polí, H ≡ p.υ − L =
2 1 p − qA ( r , t ) + qϕ ( r , t ) . 2M
LITERATURA
[1]
KVASNICA, J. Teorie elektromagnetického pole. 1. vyd. Praha: Academia, 1985. 450 s. s. 211-214.
()
∂L ∂L ∂L ∂L ≡ , , ∂υ ∂υ x ∂υ y ∂υ z
4.6.2 SPIN Spin je dynamická proměnná, která nemá v klasické fyzice odpovídající protějšek. Nutnost jeho zavedení do kvantového popisu částic vyplynula ze slavného experimentu Sternova-Gerlachova. 70
Spin je interpretován jako vlastní moment hybnosti částice (pozn.) a jemu v rámci kvantové teorie
přiřazené operátory mají podobné vlastnosti jako operátory odpovídající orbitálnímu momentu hybnosti. To znamená, že operátory přiřazené jednotlivým složkám spinového vektoru nekomutují a samotné složky nejsou kompatibilními veličinami. Současně proto můžeme s neomezenou přesností určit například pouze velikost spinu a hodnotu jedné jeho vybrané složky, zpravidla třetí, z-tové. Velikost spinu s
je kvantována stejně jako velikost orbitálního momentu hybnosti. Její přípustné
hodnoty jsou proto dány vztahem 2
s = s ( s + 1) 2 ,
v němž
s
je tzv. spinové kvantové číslo. Pro danou částici je toto číslo charakteristickou
konstantou podobně jako například její hmotnost či náboj. V odborných textech bývá často spinové kvantové číslo se spinem částice zaměňováno. Pak hovoříme stručně o částici se spinem s. Také třetí složka spinu sz je kvantována podobně jako třetí složka orbitálního momentu hybnosti: sz = ms , kde ms je tzv. magnetické spinové kvantové číslo. To může pro částici se spinem s nabývat celkem (2s+1) hodnot: -s, -s+1, …, s-1, s. I magnetické spinové kvantové číslo bývá často zaměňováno s třetí složkou spinu sz .
VÍCESLOŽKOVÉ VLNOVÉ FUNKCE Zatímco velikost spinu je pro libovolnou částici vždy konstantní a charakteristická, jeho třetí, z-tová složka může nabývat všech výše uvedených hodnot. Aby byl stav částice určen jednoznačně, musíme kromě její polohy (nebo hybnosti) zadat i okamžitou hodnotu třetí složky jejího spinu. V rámci kvantověmechanického popisu se to projeví tím, že vlnová funkce bude záviset i na spinové proměnné sz . Tak např. v x-reprezentaci musíme psát, bereme-li v úvahu spin částice, ψ = ψ ( r , ms , t ) . V matematickém formalismu kvantové teorie je však obvyklejší popis pomocí tzv. vícesložkových (multikomponentních) vlnových funkcí (spinorů)
71
ψ-s (r , t ) ψ (r , t ) ≡ ... , ψ (r , t ) s kde ψξ ( r , t ) ≡ ψ ( r , ms = ξ , t ). Multikomponentní vlnová funkce je reprezentována sloupcovým vektorem, jehož jednotlivé složky odpovídají vlnové funkci studované částice se zadanou z-tovou komponentou spinu. Takový sloupcový vektor má pro částici se spinem s celkem (2s+1) řádků. Tak např. pro částici se spinem 1/2 (např. elektrony) musíme použít dvoukomponentní vlnovou funkci. sz
∑∫ ξ
Je-li vícesložková vlnová funkce normovaná k jedničce,
∫ ψξ (r , t )
2
d 3r
Ω
=− sz
2
ψξ (r , t ) d 3 r = 1,
udává výraz
3
pravděpodobnost, že částici nalezneme v oblasti prostoru Ω a její třetí složka
spinu bude mít hodnotu ξ. Pravděpodobnost nalezení částice v oblasti Ω, bez ohledu na z-tovou sz
komponentu jejího spinu, je pak dána jako
∑ ∫ ψξ (r , t ) ξ =− sz Ω
2
d 3r
a konečně výraz
∫ ψξ (r , t )
2
d 3r
3
udává pravděpodobnost, že třetí komponenta spinu částice nabývá v zadaném stavu hodnoty ξ.
OPERÁTOR SPINU Při použití vícesložkových vlnových funkcí odpovídají spinovým stavům částice se spinem s vektory z (2s+1)-rozměrného Hilbertova prostoru. Operátory, které jednotlivým komponentám spinu v rámci kvantové mechaniky přiřadíme, budou proto samosdruženými operátory na tomto prostoru a můžeme je reprezentovat hermitovskými maticemi o (2s+1) řádcích a sloupcích. Tak např. pro částice se spinem 1/2 vystačíme s maticemi 2 x 2, pro částice se spinem 1 potřebujeme matice 3 x 3 atd. Operátory přiřazené jednotlivým složkám spinu částice splňují obdobné komutační relace, s jakými se setkáváme u orbitálního momentu hybnosti, sˆ j ,sˆ k = i ε jkl sˆ l . Pro elektrony (a další částice se spinem 1/2) lze pro operátor spinu psát
sˆ = 1/ 2 σ , 0 1
1 0 0 −i σz = 0 a 0 −1 jsou tzv. Pauliho matice.
σx = , σ y = 1 0 i kde
72
() Vzhledem k tomu, že spin nemá klasický protějšek, není možné jej chápat jako důsledek vlastní rotace studované částice kolem nějaké prostorové osy. Spin je prostě jen další veličinou charakterizující tuto částici, podobně jako např. její hmotnost či náboj.
4.7 KVANTOVÁ MECHANIKA A TEORIE RELATIVITY V rámci Dirakovy operátorové formulace nečiní zahrnutí základních principů speciální teorie relativity do schématu kvantové mechaniky vážné potíže. Stačí najít s využitím principu korespondence relativistický Hamiltonův operátor studovaného systému a jeho pomocí formulovat relativistickou verzi stacionární či nestacionární Schrödingerovy rovnice. Níže si ukážeme, jak je možno tento obecný program naplnit alespoň v nejjednodušším případě systému obsahujícího jedinou volnou částici. Je však třeba předeslat, že relativistické efekty, projevující se zejména v oblasti vysokých energií, narušují základní postulát kvantové mechaniky o zachování počtu a typu částic v popisovaném systému. Plného skloubení speciální teorie relativity a kvantových představ se proto podařilo dosáhnout až v rámci kvantové teorie pole.
KLEINOVA-GORDONOVA ROVNICE Relativistický vzorec pro celkovou energii volné částice 2
E = c p 2 + m0 c 2 , kde p je hybnost studované částice, m0 její klidová hmotnost a c rychlost světla ve vakuu, převedeme snadno pomocí principu korespondence do operátorového tvaru ˆ = c − 2 ∆ + m 2c 2 , H 0 v němž symbolem ∆ označujeme Laplaceův operátor. Pomocí takto zkonstruovaného Hamiltonova operátoru již bez obtíží nalezneme i relativistickou verzi nestacionární Schrödingerovy rovnice c − 2 ∆ + m0 c 2 ψ ( r , t ) = i 2
∂ψ ( r , t ) . ∂t
Struktura diferenciálního operátoru na levé straně získané rovnice je však díky přítomnosti Laplaceova operátoru pod odmocninou velmi komplikovaná, a proto se ji pokusme zjednodušit. Nabízí se přímočaré řešení. Aplikací relativistického Hamiltonova operátoru na obě strany rovnice získáme
(
)
2 2 2 c − 2 ∆ + m0 c 2 c − 2 ∆ + m0 c 2 ψ = c 2 − 2 ∆ + m0 c 2 ψ ,
73
∂ ∂ ∂ψ ∂ψ 2 2 c − 2 ∆ + m0 c 2 i c − 2 ∆ + m0 c 2ψ = i i =i =− ∂t ∂t ∂t ∂t
2
∂ 2ψ ∂t 2
a spojením obou výrazů dále též ∆ψ −
1 ∂ 2ψ m0 c 2 − 2 ψ = 0, c 2 ∂t 2 2
relativistickou kvantověmechanickou pohybovou rovnici, která se obvykle nazývá rovnicí Kleinovou-Gordonovou [1], [2]. Dosazením předpokládaného tvaru pro stacionární vlnové funkce je pak dále možno získat i odpovídající rovnici bezčasovou. Do Kleinovy-Gordonovy rovnice je možno doplnit i členy reprezentující interakci studované částice s okolím. Například zahrnutí elektromagnetické interakce umožnilo aplikovat tuto rovnici na atom vodíku a získat tak relativistické korekce, které nejsou nerelativistickou Schrödingerovou teorií postiženy. Provedené výpočty však ukázaly, že Kleinova-Gordonova rovnice v tomto případě uspokojivé výsledky neposkytuje. Později byla zjištěna příčina tohoto selhání. Získaná rovnice totiž přesně popisuje pouze relativistickou dynamiku částic s nulovým spinem (např. π-mezonů, pionů). Pro částice se spinem nenulovým (např. elektrony) použitelná není. Pro takové částice musíme použít rovnici jinou. Tu na konci dvacátých let 20. století sestavil anglický fyzik P. Dirac.
DIRAKOVA ROVNICE Během řešení problému, jak v rámci kvantové mechaniky formulovat relativisticky kovariantní pohybovou rovnici pro elektrony, Dirac usoudil, že je nutné provést ve výše uvedeném výrazu pro relativistický hamiltonián naznačenou odmocninu. V případě volné částice vypočítat tedy 2
c − 2 ∆ + m0 c 2 . Výsledek naznačeného odmocnění Dirac předpokládal ve tvaru c − 2 ∆ + m0 c 2 = −i cα .∇ + β m0 c 2 , 2
v němž ∇ označuje vektorový operátor gradient. Protože nelze nalézt takový vektor α a číslo β, aby naznačená rovnost byla splněna, obrátil Dirac svou pozornost k maticím. Tedy α je podle něj uspořádaná trojice čtvercových matic a β čtvercová matice stejného typu. V rámci tohoto zobecnění se Dirakovi podařilo kupř. zjistit, že nejmenší matice, které splňují podmínky vyplývající z výše uvedené rovnosti, mají čtyři řádky a sloupce. Úvahy, které však přesahují rámec našeho výkladu (podrobnosti je možno najít např. v [3]), vedou k závěru, že je možno tyto matice volit ve tvaru I
0 σ , 0
0
β = α = σ 0 −I a 74
kde I a 0 jsou jednotková a nulová matice 2 x 2 a σ matice Pauliho. Nutno ovšem podotknout, že uvedené tvary matic α a β nejsou jediné možné. Kromě této tzv. Dirakovy realizace existují i další reprezentace těchto matic, které jsou však s maticemi nalezenými Dirakem ekvivalentní. Reprezentace relativistického hamiltoniánu prostřednictvím čtvercových matic 4 x 4 odpovídá bodovým částicím se spinem 1/2, např. elektronům. Vlnové funkce musí mít proto pro takové částice čtyři komponenty. Obvykle se nazývají Dirakovými bispinory (pozn.). Maticovou reprezentaci relativistického hamiltoniánu je možno získat i pro částice s vyššími hodnotami spinu (viz např. [3]). Relativistickou pohybovou rovnici pro volnou částici s nenulovým spinem, která se podle svého objevitele nazývá rovnicí Dirakovou [4], [5], můžeme nakonec napsat ve tvaru ∂ψ r , t ( −i cα .∇ + β m0c2 )ψ ( r , t ) = i ∂(t ) nebo, zavedeme-li γ 0 = β a γ = βα , ve tvaru častěji používaném mc 1 ∂ψ ( r , t ) + γ .∇ψ ( r , t ) + i 0 ψ ( r , t ) = 0. γ0 c ∂t I do Dirakovy rovnice je možno zahrnout interakci studované částice s okolím, například interakci elektromagnetickou. LITERATURA
[1] [2]
[4] [5]
KLEIN, O. Zeitschrift für Physik, 1926, Bd. 37, S. 895. GORDON, W. Zeitschrift für Physik, 1926, Bd. 40, S. 117. [3] FORMÁNEK, J. Úvod do relativistické kvantové mechaniky a kvantové teorie pole 1. 1. vyd. Praha: Karolinum, 2000. 344s. ISBN 80-246-0060-9. s. 55-62. DIRAC, PAM. Proceedings of the Royal Society of London, 1928, vol. 117, p. 610. DIRAC, PAM. Proceedings of the Royal Society of London, 1928, vol. 118, p. 351.
Bispinory Porovnejte tento výsledek (i název) s nerelativistickým popisem částic se spinem 1/2, kdy vystačíme s vlnovými funkcemi dvoukomponentními (spinory).
4.8 VÍCEČÁSTICOVÉ SYSTÉMY VLNOVÉ FUNKCE Stav systému o
N
částicích popisujeme v rámci kvantové mechaniky vlnovými funkcemi
ψ ( r1 , ξ1 ,..., rN , ξ N , t ) , kde rK a ξ K reprezentují polohy a třetí komponenty spinu studovaných částic. Pro jednoduchost budeme často používat zkráceného zápisu ψ ( rJ , ξ J , t ) . 75
Uvedený tvar vlnových funkcí je sice v rámci kvantové mechaniky nezávislým postulátem, nicméně postulátem velmi přijatelným. Používáme-li totiž v případě jediné částice vlnovou funkci ψ ( r , ξ , t ) , jejímiž argumenty jsou poloha a z-tová komponenta jejího spinu, je přirozené zobecnit tento popis pro systémy mnoha částic tak, že každá z nich přispěje k argumentům mnohočásticové vlnové funkce právě svou polohou a třetí složkou spinu. Podobně jako v případě jediné částice můžeme i pro popis mnohočásticového systému použít vlnovou funkci v p-reprezentaci definovanou vztahem 1 i N 3 3 ˆ p t ψ ( rJ , ξ J , t ) = ψ ξ ( , , ) exp J J ∑ pK .rK d p1...d pN . 3N / 2 ∫ 3N K =1 ( 2π ) Mnohočásticovým vlnovým funkcím můžeme dát, inspirováni prvním a druhým Bornovým postulátem, názornou měřitelnou interpretaci. Výraz
ψ ( rJ , ξ J , t ) d 3 r1...d 3 rN 2
∫
Ω1 ×...×Ω N
∑ξ ∫ ψ ( r ξ
K
1 ,..., N
, ξ K , t ) d 3 r1...d 3 rN 2
3N
udává pravděpodobnost, že první částici nalezneme v oblasti Ω1 s hodnotou třetí komponenty spinu ξ1 , druhou v oblasti Ω 2 se spinem ξ2 atd. Zcela analogicky je
ψˆ ( pJ , ξ J , t ) d 3 p1...d 3 pN 2
∫
Π1 ×...×Π N
∑ξ ∫ ψˆ ( p ξ 1 ,..., N
, ξ K , t ) d 3 p1...d 3 pN 2
K
3N
pravděpodobnost, že jednotlivé částice budou mít hybnosti z oblastí
Π1 , ..., Π N
impulzového
prostoru a třetí složky spinu budou rovny ξ1 , ..., ξ N .
DYNAMICKÉ PROMĚNNÉ I v mnohočásticových systémech reprezentujeme jejich dynamické proměnné samosdruženými operátory. Tak například poloze J-té částice přiřazujeme vektorový operátor
ˆ ˆ ,Y ˆ , Zˆ = [ x , y , z ] . X J ≡ X J J J J J J Každá z jeho složek působí na mnohočásticovou vlnovou funkci tak, že ji, jako v jednočásticovém případě, násobí odpovídající souřadnicí J-té částice. Obdobně hybnosti J-té částice přiřazujeme operátor (viz též jednočásticový případ)
76
∂ ∂ ∂ ˆ PJ = −i ∇ J ≡ −i , −i , −i . ∂xJ ∂z J ∂z J Indexem J u operátoru gradientu zdůrazňujeme, že odpovídající parciální derivace se týkají pouze souřadnic J-té částice. Zřejmě nejdůležitější kvantověmechanický operátor, hamiltonián, můžeme pro systém N částic vzhledem k výše uvedenému a v souladu s principem korespondence zapsat ve tvaru 2 N ˆ ˆ H = ∑ − ∆J + V ( r1 ,..., rN ) , 2M J J =1
kde M J je hmotnost J-té částice a indexem u Laplaceova operátoru opět zdůrazňujeme derivování pouze podle souřadnic J-té částice. Stříškou nad symbolem pro potenciál naznačujeme jeho možnou spinovou závislost. Speciálně v případě neinteragujících částic nabývá Hamiltonův operátor systému N částic tvaru součtu hamiltoniánů jednočásticových 2 N N ˆ = ∑ − ˆ ( r ) = ∑ H ˆ . H ∆J + V J J J 2 M J =1 J J =1
ˆ Symbolem VJ označujeme obecně spinově závislý potenciál popisující interakci J-té částice s vnějšími poli (okolím). Pokud na sebe studované částice působí prostřednictví párově aditivní interakce (např. interakce elektrostatické popsané Coulombovým zákonem), můžeme pro odpovídající mnohočásticový hamiltonián psát N N N ˆ ˆ ˆ = ∑H ˆ + ∑ ∑ u X H J K − X j , J =1 J =1 K = J +1 kde k sumě jednočásticových hamiltoniánů přidáváme člen popisující interakční energii všech možných párů částic.
STACIONÁRNÍ A NESTACIONÁRNÍ SCHRÖDINGEROVA ROVNICE Stacionární Schrödingerovu rovnici zapisujeme pomocí mnohočásticového hamiltoniánu ve tvaru ˆ Ψ = EΨ, H
kde Ψ je prostorová část mnohočásticové stacionární vlnové funkce ψ ( rJ , ξ J , t ) ≡ Ψ ( rJ , ξ J ) exp ( −i / Et ) a E jí odpovídající vlastní energie (viz též zde). Řešení této 77
rovnice je v obecném případě, s výjimkou soustav neinteragujících částic, velmi obtížné a je zpravidla nutné sáhnout po vhodné přibližné metodě, např. po metodě Hartreeho-Fockově. Podobně zapisujeme i nestacionární Schrödingerovu rovnici (viz též zde) ˆ ψ = i ∂ψ . H ∂t
POZNÁMKA Výše jsme o studovaném mnohočásticovém systému mlčky předpokládali, že je tvořen rozlišitelnými částicemi. Není-li tomu tak, je zapotřebí nastíněný postup poněkud modifikovat. Protože vlastnosti systémů obsahujících více nerozlišitelných částic (např. elektrony v atomu či molekule) vykazují nemálo překvapujících rysů a samotné systémy hrají významnou roli v atomové a molekulové fyzice, věnujeme jim speciální podkapitolu.
4.8.1 NEROZLIŠITELNÉ ČÁSTICE PRINCIP NEROZLIŠITELNOSTI V rámci kvantověmechanického popisu jsou totožné částice nerozlišitelné. Totožné částice je nutno v kvantové mechanice chápat poněkud odlišně od toho, nač jsme zvyklí v mechanice klasické. V rámci klasického popisu totiž vždy předpokládáme, že i částice, jejichž všechny fyzikální vlastnosti jsou shodné, je možno alespoň v principu navzájem odlišit. Např. tak, že každé z nich přidělíme pozorovatele, který bude mít za úkol sledovat její trajektorii. Takovému pozorovateli můžeme přidělit identifikační číslo a to můžeme pak použít i k odlišení „jeho“ částice od ostatních. Zajímáme-li se v budoucnosti o některou ze studovaných částic, např. částici K, stačí se obrátit na pozorovatele K a ten nám na ni podle potřeby ukáže. V kvantovém světě ovšem nic takového možné není! Především částice už nejsou lokalizovány v prostoru, jejich vlnové funkce se mohou nejrůznějším způsobem překrývat a klasické trajektorie neexistují. Proto je nemůže žádný pozorovatel „uhlídat“. Navíc se v případě mikroskopických částic jejich sledování pozorovatelem neobejde bez podstatného ovlivnění jejich pohybu. Tak kupř. pozorovat částici znamená, že ji musíme osvítit světlem a následně registrovat odražené (rozptýlené) fotony. Srážka fotonu s mikroskopickou částicí však může velmi významně ovlivnit její další vývoj.
VLNOVÉ FUNKCE Jakákoliv vlnová funkce soustavy N nerozlišitelných částic musí nutně zohlednit fakt, že libovolnou permutací (záměnou) těchto částic není možno změnit stav studovaného systému. Chceme-li proto při popisu nerozlišitelných částic využít formalismu, který jsme zavedli pro částice rozlišitelné (viz zde), je nezbytně nutné požadovat, abychom permutací dvojic polohových a spinových proměnných jednotlivých částic, rK , ξ K , získali vlnovou funkci, která popisuje stejný kvantověmechanický stav 78
jako funkce původní. Dvě vlnové funkce popisují ale, vzhledem ke své statistické interpretaci, stejný stav systému, je-li jedna (komplexním) násobkem druhé. Permutace argumentů mnohočásticové vlnové funkce se může tedy v případě nerozlišitelných částic projevit nanejvýš odlišností v komplexním multiplikativním faktoru. Pracujeme-li s normovanými vlnovými funkcemi, má tento faktor navíc jednotkovou velikost. Speciálním případem permutace je výměna (transpozice) dvou částic, např. částice K a L. Té ˆ můžeme přiřadit operátor PKL splňující Pˆ ψ (..., r , ξ ,..., r , ξ ,...) ≡ ψ (..., r , ξ ,..., r , ξ ,...) . KL
K
K
L
L
L
L
K
K
Má-li vlnová funkce ψ správně popisovat systém nerozlišitelných částic, musí podle výše řečeného splňovat pro libovolnou dvojici indexů K a L vztah (α je komplexní číslo) Pˆ KL ψ = αψ . Vzhledem k nerozlišitelnosti studovaných částic musí být navíc toto číslo stejné pro všechny možné dvojice indexů K a L. Je velmi snadné určit jeho hodnotu. Dvojí aplikace téhož operátoru transpozice vede totiž k původní vlnové funkci ψ = Pˆ Pˆ ψ = Pˆ αψ = α 2ψ . KL KL
KL
2 Odtud již vidíme, že α = 1 a samotný multiplikativní faktor tedy nabývá hodnot ±1.
Vhodnými kandidáty na vlnové funkce systému N nerozlišitelných částic jsou proto jen ty funkce, které se při výměně libovolné dvojice částic nemění nebo nanejvýš změní své znaménko. První z uvedených funkcí se nazývají vlnovými funkcemi symetrickými a druhé vlnovými funkcemi antisymetrickými. Při provedení libovolné permutace částic se symetrické vlnové funkce nezmění a
antisymetrické změní své znaménko podle znaménka provedené permutace. Je možno dokázat následující tvrzení, podrobnější analýza však překračuje rámec této encyklopedie a je ji možno najít ve specializované literatuře [1]. Charakter vlnové funkce libovolného systému obsahujícího nerozlišitelné částice se nemění ani v důsledku samovolného časového vývoje, ani v důsledku vnějších zásahů do něj. Systémy nerozlišitelných částic se takto přirozeně dělí na dvě velké skupiny •
ty, které popisujeme symetrickými vlnovými funkcemi,
•
ty, které popisujeme vlnovými funkcemi antisymetrickými.
Z kvantové teorie pole vyplývá, že první typ částic nese celočíselný spin a typ druhý má spin poločíselný. Částice s celočíselným spinem se obvykle nazývají bosony, neboť ve velkých (makroskopických) systémech vyhovují tzv. Boseho-Einsteinově statistice. Částice nesoucí spin poločíselný se ze stejného důvodu nazývají fermiony. V makroskopické limitě totiž vyhovují tzv. Fermiho-Dirakovu rozdělení. 79
VYJÁDŘENÍ VÍCEČÁSTICOVÝCH VLNOVÝCH FUNKCÍ POMOCÍ FUNKCÍ JEDNOČÁSTICOVÝCH Vlnové funkce vícečásticových systémů často vyjadřujeme pomocí vlnových funkcí jednočásticových. Možné je to například pro soustavy neinteragujících částic, s přibližnou platností ale i pro částice interagující (viz např. Hartreeho-Fockova aproximace). Označme ϕ K (rK , ξ K ) normované jednočásticové vlnové funkce. Pak zřejmě jejich součin ϕ (r1 , ξ1 ,..., rN , ξ N ) ≡ ϕ1 (r1 , ξ1 )...ϕ N (rN , ξ N ) můžeme chápat jako jednu z možných vlnových funkcí studovaného N-částicového systému. V případě rozlišitelných částic bezezbytku, v případě částic nerozlišitelných je třeba zajistit správné chování této funkce vzhledem k permutaci částic. Tak např. pro bosony musíme použít vlnovou funkci symetrickou,
ψ (r1 , ξ1 ,..., rN , ξ N ) =
1 ∑ ϕ1 (rP (1) , ξ P (1) )...ϕ N (rP ( N ) ,ξ P ( N ) ). N! P
Suma naznačená v uvedeném výrazu probíhá přes všechny různé permutace částic a faktor 1/ N ! je do něj zahrnut v zájmu zachování normalizace vícečásticové vlnové funkce. Pro fermiony musíme naopak použít vlnovou funkci antisymetrickou
ψ (r1 , ξ1 ,..., rN , ξ N ) =
1 ∑ sign( P)ϕ1 (rP (1) ,ξ P (1) )...ϕ N (rP ( N ) ,ξ P ( N ) ), N! P
kde suma probíhá opět přes všechny různé permutace částic a sign(P) označuje znaménko konkrétní permutace P. Významným důsledkem získaného tvaru antisymetrické vlnové funkce fermionů je Pauliho vylučovací princip. Vícečásticové vlnové funkce konstruované jako antisymetrizovaný součin vlnových funkcí jednočásticových hrají významnou roli při popisu elektronů v elektronových obalech atomů a molekul. V atomové fyzice se obvykle vyjadřují pomocí Slaterových determinantů. LITERATURA
[1]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 558-566.
4.8.2 SOUSTAVY NEINTERAGUJÍCÍCH ČÁSTIC ROZLIŠITELNÉ ČÁSTICE Řešení stacionární (a tím spíše nestacionární) Schrödingerovy rovnice je pro obecný mnohočásticový systém velmi obtížnou úlohou. Ta se však významně zjednoduší, pokud studované částice spolu nijak neinteragují nebo je-li možno jejich vzájemné interakce zanedbat. 80
V takovém případě totiž možno psát Hamiltonův operátor ve tvaru součtu operátorů jednočásticových 2 N N ˆ = ∑ − ˆ ( r ) = ∑ H ˆ , H ∆J + V J J J 2M J J =1 J =1
ˆ kde VJ reprezentuje interakci, obecně spinově závislou, J-té částice o hmotnosti M J s okolím a stacionární Schrödingerova rovnice nabývá proto tvaru N ˆ ∑ H K Ψ (rJ , ξ J ) = E Ψ (rJ , ξ J ). K =1 Její řešení je možné pomocí separace proměnných, kdy mnohočásticovou vlnovou funkci Ψ předpokládáme ve tvaru součinu vlnových funkcí jednočásticových Ψ (r1 , ξ1 ,..., rN , ξ N ) ≡ Φ1 (r1 , ξ1 )...Φ N (rN , ξ N ). Po dosazení do původní rovnice pak získáme obvyklým postupem N
ˆ Φ =E Φ , H K K K K
∑E K =1
K
= E.
Jednočásticové vlnové funkce Φ K jsou tedy dány řešením odpovídajících jednočásticových stacionárních Schrödingerových rovnic. Umíme-li řešit tyto jednočásticové rovnice, umíme najít řešení i u obecného problému mnohočásticového.
NEROZLIŠITELNÉ ČÁSTICE Výše naznačený postup, zejména však jeho výsledky, je možno použít i v případě neinteragujících částic, které nejsou rozlišitelné. Je jen třeba zaručit správnou symetrii mnohočásticové vlnové funkce. Pro bosony můžeme stacionární vlnové funkce odpovídající energii E = ∑ K =1 EK psát jako symetrizovaný součin odpovídajících vlnových funkcí jednočásticových, 1 Ψ (r1 , ξ1 ,..., rN , ξ N ) = ∑ Φ1 (rP (1) , ξ P (1) )...Φ N (rP ( N ) , ξ P ( N ) ), N! P ˆ splňujících H K Φ K = EK Φ K . Na pravé straně uvedené rovnosti provádíme sčítání přes všechny možné permutace částic. N
Pro fermiony musíme ve stejném případě užít vlnových funkcí antisymetrických 1 Ψ (r1 , ξ1 ,..., rN , ξ N ) = ∑ sign( P)Φ1 (rP (1) , ξ P (1) )...Φ N (rP ( N ) , ξ P ( N ) ), N! P kde opět sčítáme přes všechny možné permutace; jejich znaménko označujeme symbolem sign(P).
81
4.8.3 SLATEROVY DETERMINANTY Antisymetrickou vlnovou funkci soustavy N nerozlišitelných fermionů vyjadřujeme často jako antisymetrizovaný součin vlnových funkcí jednočásticových 1 ψ (r1 , ξ1 ,..., rN , ξ N ) = ∑ sign( P)ϕ1 (rP (1) ,ξ P (1) )...ϕ N (rP ( N ) , ξ P ( N ) ), N! P kde suma na pravé straně probíhá všechny možné permutace N-prvkové množiny indexů a sign(P) označuje znaménko konkrétní permutace P. Nápadná je jistě podobnost užívaného výrazu s definiční formulí pro determinant čtvercové matice det A ≡ ∑ sign( P) a1P (1) ...aNP ( N ) . N×N: P Porovnáme-li obě uvedené formule, vidíme, že vlnovou funkci ψ můžeme psát ve tvaru determinantu ϕ1 (r1 , ξ1 ) ϕ1 (r2 , ξ 2 ) ϕ (r , ξ ) ϕ 2 (r2 , ξ 2 ) 1 ψ (r1 , ξ1 ,..., rN , ξ N ) = det 2 1 1 ... ... N! ϕ N (r1 , ξ1 ) ϕ N (r2 , ξ 2 )
... ϕ1 (rN , ξ N ) ... ϕ 2 (rN , ξ N ) , ... ... ... ϕ N (rN , ξ N )
který je obvykle nazýván determinantem Slaterovým.
4.8.4 PAULIHO VYLUČOVACÍ PRINCIP Dva fermiony se nemohou nacházet ve stejném jednočásticovém stavu [1]. Důvod je jednoduchý. Popisujeme-li totiž soustavu fermionů pomocí antisymetrizovaného součinu jednočásticových vlnových funkcí (Slaterova determinantu) 1 ψ (r1 , ξ1 ,..., rN , ξ N ) = ∑ sign( P) ϕ1 (rP (1) , ξ P (1) )...ϕ N (rP ( N ) , ξ P ( N ) ), N! P kde P označuje permutace N-prvkové množiny indexů {1, …, N} a sign(P) jejich znaménko, a pokud by byly některé z uvedených jednočásticových funkcí stejné, např. ϕ J = ϕ K , byla by nutně pravá strana nulová. Velmi zřetelně to vyplyne, zapíšeme-li vícečásticovou vlnovou funkci pomocí Slaterova determinantu. V případě rovnosti jednočásticových vlnových funkcí ϕ J a ϕ K by totiž měl tento determinant dva stejné řádky, a jak je známo z algebry, je takový determinant nulový. Nulová vlnová funkce ovšem znamená, že odpovídající stav není možno ve skutečnosti realizovat. LITERATURA
[1]
PAULI, W. Zeitschrift für Physik, 1925, Bd. 31, S. 765.
82
4.8.5 HARTREEHO - FOCKOVA METODA SELFKONZISTENTNÍHO POLE HARTREEHO-FOCKOVA APROXIMACE V rámci Hartreeho-Fockovy aproximace [1]-[3] hledáme vlnovou funkci základního stavu systému navzájem interagujících fermionů ve tvaru Slaterova determinantu ϕ1 (r1 , ξ1 ) ϕ1 (r2 , ξ 2 ) ϕ (r , ξ ) ϕ 2 (r2 , ξ 2 ) 1 ψ (r1 , ξ1 ,..., rN , ξ N ) = det 2 1 1 ... ... N! ϕ N (r1 , ξ1 ) ϕ N (r2 , ξ 2 )
... ϕ1 (rN , ξ N ) ... ϕ 2 (rN , ξ N ) , ... ... ... ϕ N (rN , ξ N )
kde ϕ K jsou normalizované jednočásticové vlnové funkce a symboly rJ , resp. ξ J
označují
polohový vektor a magnetické spinové číslo J-tého fermionu. Předpokládaný tvar stacionární vlnové funkce má však v případě interagujících částic jen přibližnou platnost. Proto hledáme jednočásticové vlnové funkce ϕ K takové, aby výše uvedený Slaterův determinant aproximoval přesné řešení stacionární Schrödingerovy rovnice co nejlépe. K tomuto účelu užijeme variační metodu a tvrzení, že základnímu stavu kvantového systému odpovídá vlnová funkce (ket-vektor) ψ , která minimalizuje funkcionál E (ψ ) =
ψ Hˆ ψ , ψψ
ˆ je hamiltonián studovaného mnohočásticového systému. Výše uvedený Slaterův kde H determinant ψ bude proto aproximovat vlnovou funkci základního stavu systému interagujících fermionů nejpřesněji, bude-li nabývat funkcionál
ˆ ψ ≡ E (ψ ) = ψ H
∑ξ ∫ ψ * (r , ξ ,..., r ξ 1
1 ,..., N
N
1
ˆ ψ (r , ξ ,..., r , ξ )d 3 r ...d 3 r , ξ N )H N N N 1 1 1
3N
své minimální hodnoty. V posledním uvedeném vztahu jsme využili normalizaci Slaterova determinantu k jedničce,
ψψ ≡
∑ξ ∫ ψ * (r ,ξ ,..., r ξ 1
1 ,..., N
1
N
,ξ N )ψ (r1 ,ξ1 ,..., rN ,ξ N )d 3r1...d 3rN = 1.
3N
Minimalizace funkcionálu E (ψ ) je zajisté velmi komplikovanou úlohou, která svým obsahem patří do matematické disciplíny zvané variační počet. Naším úkolem je totiž nalézt minimum funkce, jejímiž nezávislými proměnnými jsou jiné funkce (jednočásticové vlnové funkce ϕ K ), na něž navíc klademe jisté vazebné podmínky - jednočásticové vlnové funkce jsou podle předpokladu normalizovány. Dá se ukázat, že tato úloha je ekvivalentní hledání vázaného extrému funkce nekonečně mnoha proměnných. Bližší poučení o jejím řešení je možno najít např. v [4]. 83
Aniž bychom zabíhali do zbytečných podrobností, připomeňme si, že nutnou podmínkou minima funkce konečně mnoha reálných proměnných je nulovost všech jejích parciálních derivací. Tato podmínka vede obvykle k soustavě nelineárních algebraických rovnic, jejíž řešení poskytuje „podezřelé“ body, v nichž může studovaná funkce minima nabývat. Obdobně se postupuje i v úloze, kterou řešíme v této podkapitole. Snad jen s tou obměnou, že rovnice pro „podezřelé“ jednočásticové vlnové funkce (tedy ty, které minimalizují výše uvedený funkcionál) nabývají tentokrát tvaru nelineárních integrodiferenciálních rovnic, po svých objevitelích obvykle nazývaných rovnicemi Hartreeho-Fockovými. Jejich konkrétní vyjádření závisí ovšem na konkrétním studovaném systému.
HARTREEHO-FOCKOVY ROVNICE PRO VÍCEELEKTRONOVÝ ATOM Jako ilustraci uveďme tvar Hartreeho-Fockových rovnic pro soustavu elektronů pohybujících se v poli jádra pevně umístěného v počátku souřadnic. Pro jednoduchost předpokládejme mezi nabitými částicemi pouze elektrostatickou interakci. Pak hledané rovnice nabývají tvaru 2 1 Ze 2 ∆− − ϕ K (r , ξ ) + 4πε 0 r 2M
+∑
J ≠K
−∑
J ≠K
e2 1 1/ 2 ∫3 4πε 0 r − r′ η =−∑1/ 2 ϕ J (r′,η )ϕ J (r ′,η ) ϕ K (r ,ξ ) −
e2 1 1/ 2 ∫3 4πε 0 r − r′ η =−∑1/ 2ϕ J (r′,η )ϕ K (r′,η ) ϕ K (r ,ξ ) = ε Kϕ K (r ,ξ ),
kde K = 1, …, N. Svou strukturou připomínají uvedené rovnice jednočásticové stacionární Schrödingerovy rovnice pro jednoelektronové vlnové funkce ϕ1 , …, ϕ N . Vskutku, první člen na levé straně odpovídá operátoru kinetické energie K-tého elektronu, druhý člen interakční energii tohoto elektronu s jádrem atomu a člen třetí interakční energii K-tého elektronu se zbývajícími elektrony, rozloženými v prostoru s pravděpodobností odpovídající vlnovým funkcím ϕ1 , …, ϕ N . Jen čtvrtému členu levé strany Hartreeho-Fockových rovnic pro víceelektronový atom není možno dát podobnou názornou interpretaci, především proto, že nemá žádný klasický protějšek. Tento člen je zodpovědný za čistě kvantové výměnné efekty, které souvisejí s nerozlišitelností elektronů. Jeho zanedbáním získáme formálně jednodušší, avšak méně přesné rovnice Hartreeho. Každá z uvedených Hartreeho-Fockových rovnic odpovídá stacionární Schrödingerově rovnici pro jediný elektron, který se pohybuje v poli jádra a současně i v jakémsi středním poli reprezentujícím jeho interakce s ostatními elektrony.
84
Protože je toto pole ovlivňováno i samotnými jednoelektronovými vlnovými funkcemi, hovoříme o něm obvykle jako o poli self-konzistentním. Parametry ε K vyskytující se na pravých stranách Hartreeho-Fockových rovnic hrají pak zřejmě roli vlastních jednoelektronových energií. Upozorněme však, že jejich součet není roven celkové energii studovaného atomu v základním stavu. V tomto součtu jsou totiž příspěvky odpovídající vzájemné interakci libovolné dvojice elektronů I a J nesprávně započteny dvakrát - jednou v jednočásticové energii ε I a podruhé v energii ε J . Energii základního stavu atomu musíme počítat pomocí vztahu ˆ ψ . E (ψ 0 ) = ψ 0 H 0 V něm ψ 0
je Slaterův determinant sestavený z normalizovaných jednočásticových vlnových
funkcí, které jsme získali řešením odpovídajících Hartreeho-Fockových rovnic. Samotné řešení Hartreeho-Fockových rovnic je zpravidla velmi obtížnou matematickou úlohou, u které se obvykle neobejdeme bez dalších aproximací a pokročilých numerických metod [5]. Protože se Hartreeho-Fockova metoda stala základním nástrojem teoretického studia elektronové struktury atomů a molekul, byla jí v minulosti věnována značná pozornost. Přehled hlavních prací o Hartreeho-Fockově metodě je možno nalézt v libovolné učebnici kvantové chemie, viz např. [6]. LITERATURA
[1] [2] [3] [4] [5] [6]
HARTREE, DR. Proceedings of the Cambridge Philosophical Society, 1927, vol. 24, p. 89. FOCK, V. Zeitschrift für Physik, 1930, Bd. 61, S. 126. FOCK, V. Zeitschrift für Physik, 1930, Bd. 62, S. 795. REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 840-857. FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 593. POLÁK, R. a ZAHRADNÍK, R. Kvantová chemie, 1. vyd. Praha/Bratislava: SNTL/Alfa, 1985. 466 s. ISBN 04-621-85.
4.9 JEDNODUCHÉ KVANTOVĚMECHANICKÉ SYSTÉMY Matematická struktura kvantové teorie je velmi komplikovaná. Proto je možno rozřešit v analyticky uzavřeném tvaru jen některé nejjednodušší problémy. Pro naprostou většinu alespoň částečně realistických modelů je zapotřebí použít přibližných metod nebo řešení provést numericky. Mezi nejvýznamnější modelové systémy, pro něž je možno řešit stacionární a nestacionární Schrödingerovu rovnici jednoduchými matematickými prostředky, patří •
volná částice,
•
jednorozměrná pravoúhlá potenciálová jáma nekonečné hloubky,
•
jednorozměrná pravoúhlá potenciálová jáma konečné hloubky,
•
trojrozměrná pravoúhlá potenciálová jáma nekonečné hloubky,
•
lineární harmonický oscilátor,
•
trojrozměrný harmonický oscilátor, 85
•
tuhý rotátor,
•
pole centrálních sil,
•
jednorozměrná pravoúhlá potenciálová bariéra.
4.9.1 VOLNÁ ČÁSTICE POTENCIÁL Pod volnou rozumíme částici, na kterou nepůsobí žádné síly. Ve Schrödingerově rovnici můžeme proto považovat potenciál vnějších sil za nulový, tj. V = 0.
STACIONÁRNÍ STAVY Stacionární Schrödingerovu rovnici pro volnou částici o hmotnosti M −
2
2M
∆ψ = Eψ
řešíme pomocí separace proměnných. Podrobné řešení je možno najít zde. Z něj vyplývá, že stacionární vlnové funkce můžeme pro volnou částici psát ve tvaru
ψ = A exp i ( k x x + k y y + k z z ) , kde A je (obecně komplexní) konstanta a vektor k = [k x , k y , k z ] splňuje podmínku 2
2
2
kx + k y + kz =
2 ME 2
.
Nemají-li vlnové funkce divergovat v nekonečnu, jsou přípustné pouze nezáporné energie, E ≥ 0. Výše uvedené vlnové funkce nejsou však kvadraticky integrovatelné a neodpovídají tedy žádnému fyzikálně realizovatelnému stavu. Diskrétní část energetického spektra volné částice je proto prázdná a nezáporné energie patří k části spojité. Až na základní (E = 0) je každá z energetických hladin degenerovaná, neboť konkrétní volbě energie odpovídá nespočetně mnoho vlnových funkcí zadaných vektory k , které splňují 2
2
2
podmínku k x + k y + k z = 2 ME /
2
.
86
Výše uvedené stacionární vlnové funkce odpovídají prostorovým částem de Broglieho rovinných monochromatických vln. Vektor k je tedy vlnovým vektorem a podle de Broglieho vztahů souvisí s hybností studované částice prostřednictvím vztahu p = k . Získané stacionární vlnové funkce odpovídají (nerealizovatelným) stavům volné částice s přesně definovanou hybností.
ČASOVÝ VÝVOJ Řešení nestacionární Schrödingerovy rovnice je možno pro systémy s čistě spojitým spektrem najít zde. Z něj pro volnou částici vyplývá, že časový vývoj vlnové funkce ϕ, kterou je možno v počátečním čase t0 psát ve tvaru
ϕ ( r , t0 ) =
∫ Φ(k ) exp ( ik .r ) d k , 3
3
je dán vztahem
ϕ (r ,t ) =
∫ Φ(k )exp i ( k .r − ωt ) d k , 3
3
kde
ω=
E
(k
=
2
x
2
+ k y + kz
2
)
2M
je de Broglieho úhlová frekvence přiřazená volné částici s ostře definovanou energií E. Je-li funkce Φ nenulová pouze na malém okolí pevně zvoleného vlnového vektoru k0 , popisuje výše uvedený integrál šíření tzv. vlnového balíku prostorem.
4.9.2 VOLNÁ ČÁSTICE - PODROBNÉ ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerovu rovnici pro volnou částici −
2
2M
∆ψ = Eψ
řešíme pomocí metody separace proměnných, kdy neznámou funkci ψ hledáme ve tvaru ψ ( x, y, z ) = ψ x ( x ) ψ y ( y ) ψ z ( z ). Po dosazení do výše uvedené rovnice a po nezbytných úpravách získáme
87
2 1 d 2ψ x 1 d ψ y 1 d 2ψ z 2ME + + =− 2 . 2 2 2 ψ x dx ψ y dy ψ z dz
Tato rovnice je ekvivalentní následující soustavě obyčejných diferenciálních rovnic 1 d 2ψ x = −α x , ψ x dx 2
2 1 d ψy 1 d 2ψ z = − α = −α z , y 2 ψ y dy 2 a ψ z dz
kde konstanty α x , α y a α z splňují podmínku
αx + α y + αz =
2 ME 2
.
Získané obyčejné diferenciální rovnice mají pro všechny tři funkce ψ x , ψ y a ψ z stejný tvar. Bude tedy stačit, vyřešíme-li jednu z nich. Tak například první z těchto rovnic můžeme přepsat do tvaru d 2ψ x + α xψ x = 0 dx 2 a řešit standardním způsobem (pozn.). Takto získáme
ψ x = A+ exp
(
ψ x = A0 + B0 x
(
)
(
α x x + B+ exp − α x x
)
(
)
ψ x = A− exp i α x x + B− exp −i α x x
)
pro α x < 0, pro α x = 0, pro α x > 0.
Stacionární vlnová funkce nesmí divergovat v nekonečnu (viz též zde), proto musíme položit A+ = B+ = B0 = 0. Stejné závěry můžeme učinit i pro zbývající funkce ψ y a ψ z . Vidíme tedy, že konstanty α x , α y a α z musí být nutně nezáporné, a podle očekávání se tudíž můžeme v dalších úvahách soustředit jen na nezáporné energie, E ≥ 0. Tento fakt v dalším zohledněme zavedením nových konstant k x , k y a k z : 2 kx = α x , k y = α y a kz 2 = α z , které již mohou nabývat všech reálných hodnot. 2
Obecné řešení stacionární Schrödingerovy rovnice pro volnou částici s ostře definovanou energií E pak můžeme psát jako (obecně integrální) lineární kombinaci funkcí ψ = exp i ( k x x + k y y + k z z ) , kde 2 ME 2 2 2 kx + k y + kz = 2 .
88
Všimněte si, že tento tvar vyhovuje i v případě k x = k y = k z = 0, kdy dává ve shodě s výše uvedeným ψ = konst. ( = A0 ) . () Uvedená rovnice je lineární obyčejná diferenciální rovnice s konstantními koeficienty a nulovou pravou stranou. O způsobu jejího řešení se může čtenář poučit např. v REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 649-652.
4.9.3 JEDNOROZMĚRNÁ PRAVOÚHLÁ POTENCIÁLOVÁ JÁMA NEKONEČNÉ HLOUBKY POTENCIÁL Jednorozměrná pravoúhlá potenciálová jáma nekonečné hloubky odpovídá modelovému potenciálu
x ∈ ( 0, L ) ,
V ( x ) = 0,
V
x
V(x) = 0 x=0
x=L
x ∉ ( 0, L ) .
V ( x ) = +∞,
Částice pohybující se v poli tohoto potenciálu bude zřejmě „uvězněná“ na úsečce (0,L). Volba nulové hladiny potenciálu i umístění jámy na ose x jsou pochopitelně ponechány na naší libovůli a fyzikálně relevantní výsledky na nich nezávisejí. Typický průběh pravoúhlého potenciálu nekonečné hloubky je znázorněn na obrázku. V poli tohoto potenciálu budeme studovat stacionární stavy a pohyb jediné částice, jejíž hmotnost označme M.
STACIONÁRNÍ STAVY Podrobné řešení stacionární Schrödingerovy rovnice je možno najít zde. Z něj plyne, že energetické spektrum částice v jednorozměrné potenciálové jámě nekonečné hloubky je čistě diskrétní a nedegenerované. Přípustné hodnoty celkové energie jsou dány vztahem 89
En =
π2
2
2M
n2 ,
kde n je přirozené číslo. Těmto energiím odpovídají až na multiplikativní konstantu jednoznačně určené vlastní vlnové funkce 2 MEn x 2 L
ψ n ( x) = B sin
pro x ∈ ( 0, L ) ,
2
|ψ|
n=4
n=3
n=2
n=1 x=0
x=L
pro x ∉ ( 0, L ) .
ψ n ( x) = 0 Průběh kvadrátů jejich modulů ψ n ( x ) obrázek.
x
2
znázorňuje pro různé volby kvantového čísla n připojený
ČASOVÝ VÝVOJ Podrobné řešení nestacionární Schrödingerovy rovnice pro systémy s čistě diskrétním spektrem je možno najít zde. Z něj pro částici v nekonečně hluboké pravoúhlé potenciálové jámě vyplývá, že časový vývoj vlnové funkce ϕ, kterou je možno v počátečním čase t0 psát ve tvaru +∞
ϕ ( x, t0 ) = ∑ cnψ n ( x), n =1
je dán formulí +∞
i
ϕ ( x, t ) = ∑ cn exp − En ( t − t0 ) ψ n ( x), n =1
90
kde En a ψ n jsou výše uvedené vlastní energie a odpovídající vlastní vlnové funkce. Jako ilustraci této obecné formule znázorňuje přiložená animace časový vývoj kvadrátu absolutní hodnoty vlnových funkcí ϕ ( x, t ), které jsou v počátečním čase t0 zadány superpozicí dvou sousedních stacionárních stavů ϕ ( x, t0 ) = ψ n ( x) + ψ n +1 ( x).
4.9.4 JEDNOROZMĚRNÁ PRAVOÚHLÁ POTENCIÁLOVÁ JÁMA NEKONEČNÉ HLOUBKY - PODROBNÉ ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerovu rovnici řešíme pro potenciál reprezentující jednorozměrnou pravoúhlou potenciálovou jámu nekonečné hloubky odděleně na intervalu (0,L) a mimo něj. Jednotlivé části vlnové funkce zúžené na odpovídající intervaly osy x označme (pozn. 1) x ∈ ( −∞, 0 , ψ I ( x) pro ψ II ( x) pro x ∈ ( 0, L ) , x ∈ L, +∞ ) . pro Pro potenciál s nespojitostmi typu nekonečného skoku v bodech x = 0 a x = L má každá stacionární vlnová funkce v uvedených bodech nespojité derivace prvního a druhého řádu. Sama však musí být spojitá. To znamená, že je nutno splnit tzv. sešívací podmínky ψ I (0) = ψ II (0), ψ II ( L) = ψ III ( L).
ψ III ( x)
ŘEŠENÍ SCHRÖDINGEROVY ROVNICE VNĚ JÁMY Stacionární Schrödingerovu rovnici přepíšeme vně intervalu (0,L) do tvaru 2 1 d 2ψ ( x) + Eψ ( x) , ψ ( x) = − 2 V 2M dx
což po dosazení V = +∞ dá jednoduchý výsledek ψ I ( x) = ψ III ( x) = 0.
To ovšem není vůbec překvapující, neboť částice nacházející se vně jámy by musela mít nekonečnou celkovou energii.
ŘEŠENÍ SCHRÖDINGEROVY ROVNICE UVNITŘ JÁMY Uvnitř jámy je potenciál nulový. Stacionární Schrödingerova rovnice nabývá tedy po úpravách tvaru d 2ψ ( x) κ= − κ 2ψ ( x) = 0, 2 dx kde
2ME 2
2ME d 2ψ ( x) , k= + k 2ψ ( x) = 0, 2 2 dx kde 91
,
pro E ≤ 0, pro E > 0.
Řešení těchto rovnic je možno najít obvyklým způsobem (pozn. 2) ψ II ( x) = Aeκ x + Be−κ x pro E < 0,
ψ II ( x) = A + Bx
pro E = 0,
ψ II ( x) = A cos(kx) + B sin(kx)
pro E > 0.
POUŽITÍ SEŠÍVACÍCH PODMÍNEK Výše uvedená řešení stacionární Schrödingerovy rovnice jsou zřejmě kvadraticky integrovatelná a odpovídají tedy vlastním energiím z diskrétní části spektra. Energetické spektrum studovaného systému je proto čistě diskrétní. K jeho jednoznačnému určení musíme užít sešívací podmínky, které nabývají vzhledem k nulovosti vlnové funkce vně jámy jednoduchého tvaru ψ II (0) = ψ II ( L) = 0. Pro E ≤ 0 vedou tyto podmínky k závěru A = B = 0, což znamená, že pro zvolený obor energií neexistuje žádný stacionární stav. Pro E > 0 musí být splněno současně A cos(0) + B sin(0) = 0, A cos(kL) + B sin(kL) = 0. Proto A = 0 a navíc kL = nπ, kde n je libovolné přirozené číslo. Poslední vztah je možno přepsat do tvaru En =
π2
2
n2 ,
2M který udává přípustné hodnoty celkové energie částice o hmotnosti M nacházející se v poli výše uvedeného potenciálu. Těmto energiím pak odpovídají až na multiplikativní konstantu jednoznačně definované vlnové funkce 2 MEn x 2 L
ψ n ( x) = B sin
ψ n ( x) = 0 (1)
pro x ∈ ( 0, L ) , pro x ∉ ( 0, L ) .
( a, b
a a, b ) zde označujeme polouzavřené intervaly, tedy množiny všech reálných x splňujících a < x ≤ b, resp. a ≤ x < b. Podobně symbolem a, b resp. ( a, b ) označujeme interval uzavřený resp. otevřený, tj. množiny všech reálných x splňujících a ≤ x ≤ b resp. a < x < b. Symboly
(2) Uvedené rovnice jsou lineární obyčejné diferenciální rovnice s konstantními koeficienty a nulovou pravou stranou. O způsobu jejich řešení se může čtenář poučit např. v REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 649-652.
92
4.9.5 PRAVOÚHLÁ POTENCIÁLOVÁ JÁMA KONEČNÉ HLOUBKY POTENCIÁL Jednorozměrná pravoúhlá potenciálová jáma konečné hloubky odpovídá modelovému potenciálu
x ∈ ( 0, L ) ,
V ( x ) = 0,
V
V(x) = V0
V(x) = V0
x
V(x) = 0 x=0
x=L
x ∉ ( 0, L ) ,
V ( x) = V0 ,
kde V0 je kladná konstanta. Volba nulové hladiny potenciálu i umístění jámy na ose x jsou pochopitelně ponechány na naší libovůli a fyzikálně relevantní výsledky na nich nezávisejí. Typický průběh pravoúhlého potenciálu konečné hloubky je znázorněn na obrázku. V poli tohoto potenciálu budeme studovat stacionární stavy a pohyb jediné částice, jejíž hmotnost označme M.
STACIONÁRNÍ STAVY Podrobné řešení stacionární Schrödingerovy rovnice je možno pro studovaný systém najít zde. Z něj plyne, že energetické spektrum částice v jednorozměrné potenciálové jámě konečné hloubky sestává z diskrétní a spojité části. Diskrétní energetické hladiny jsou nedegenerované a na intervalu (0,V0) jsou určeny rovnicemi
κ tg ( ka ) − k = 0,
k tg ( ka ) + κ = 0,
kde 93
κ=
2 M (V0 − E ) 2
,
k=
2ME 2
.
Tyto rovnice nejsou analyticky řešitelné, můžeme je však řešit numericky nebo graficky (blíže viz např. [1]). Průběhy kvadrátů modulů vybraných stacionárních vlnových funkcí znázorňuje obrázek. 2
|ψ |
n=3 n=2
n=1 x=0
x=L
x
Spojitá část energetického spektra studovaného systému odpovídá intervalu energií
(V0 , +∞).
Každá energie patřící ke spojité části energetického spektra je dvakrát degenerovaná. Pro libovolnou energii E > V0 můžeme totiž vždy najít dvě nezávislá řešení stacionární Schrödingerovy rovnice ψ E a ψ E (viz zde), která sice nejsou kvadraticky integrovatelná, nedivergují však v nekonečnu. Tato řešení odpovídají, zhruba řečeno, částici nalétávající na jámu zleva, resp. zprava. +
−
ČASOVÝ VÝVOJ Známe-li stacionární stavy systému, můžeme nestacionární Schrödingerovu rovnici řešit standardním způsobem. V následujícím se omezíme na vlnové funkce, které je možno získat jako lineární kombinaci stacionárních vlnových funkcí příslušejících diskrétním energetickým hladinám. Tyto vlnové funkce reprezentují vázané stavy částice a jejich časový vývoj je zadán formulí i
ϕ ( x, t ) = ∑ cnψ n ( x)exp − En ( t − t0 ) , n
kde En a ψ n jsou příslušné diskrétní energie a jim odpovídající stacionární vlnové funkce a koeficienty cn jsou jednoznačně určeny z počáteční podmínky
ϕ ( x, t0 ) = ∑ cnψ n ( x). n
Jako ilustraci výše uvedené formule uvádíme animaci časového vývoje kvadrátu absolutní hodnoty vlnové funkce ϕ ( x, t ), která je v počátečním čase t0 dána superpozicí základního a prvního excitovaného stavu částice v potenciálové jámě konečné hloubky. 94
Časový vývoj vlnových funkcí, které konstruujeme v nějakém počátečním čase t0 jako integrální lineární kombinaci vlnových funkcí příslušejících ke spojitým energetickým hladinám
ϕ ( x, t 0 ) =
+∞
∫ (a ψ E
+ E
+ bEψ E− ) dE ,
V0
je dán formulí
ϕ ( x, t ) =
+∞
∫ (a ψ E
V0
+ E
i + bEψ E− ) exp − E ( t − t0 ) dE.
LITERATURA
[1]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 83-85.
4.9.6 JEDNOROZMĚRNÁ PRAVOÚHLÁ POTENCIÁLOVÁ JÁMA KONEČNÉ HLOUBKY - PODROBNÉ ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerovu rovnici řešíme pro potenciál reprezentující jednorozměrnou pravoúhlou potenciálovou jámu konečné hloubky odděleně na intervalu (0,L) a mimo něj. Jednotlivé části vlnové funkce zúžené na odpovídající intervaly osy x označme (pozn.)
ψ I ( x) pro x ∈ ( −∞, 0 ,
ψ II ( x) pro x ∈ ( 0, L ) , ψ III ( x) pro x ∈ L, +∞ ) . Pro potenciál s nespojitostmi typu konečného skoku v bodech x = 0 a x = L musí být vlnová funkce ψ v uvedených bodech spojitá a mít v nich spojitou první derivaci (pozn.). To znamená, že je nutno splnit tzv. sešívací podmínky dψ I dψ II (0) = (0), ψ I (0) = ψ II (0), dx dx dψ II dψ III ( L) = ( L). ψ II ( L) = ψ III ( L), dx dx Splněny musí být pochopitelně i podmínky okrajové.
ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerova rovnice nabývá po výše naznačeném rozdělení vlnové funkce ψ na tři části a po jednoduchých úpravách tvaru d 2ψ I , III ( x) 2 M ( E − V0 ) + ψ I , III ( x) = 0, 2 dx 2 d 2ψ II ( x) 2ME + 2 ψ II ( x) = 0. dx 2 Řešení uvedených rovnic můžeme hledat obvyklým způsobem. Vzhledem k charakteru potenciálu je ovšem nezbytné odděleně analyzovat tyto speciální případy 95
• E < 0, • E = 0, • 0 < E < V0 , • E = V0 , • E > V0 . To by však bylo velmi zdlouhavé, a proto se v následujícím omezíme jen na tzv. vázané stavy charakterizované podmínkou 0 < E < V0 . Nejdříve si ale u ostatních možností uveďme alespoň hlavní výsledky, k nimž bychom dospěli. Hodnoty energie E ≤ 0 a E = V0 nejsou přípustné. Částice nacházející se v jednorozměrné
•
potenciálové jámě konečné hloubky jich tedy nemůže nabývat. Hodnoty energie E > V0 patří ke spojité části spektra. Každá z těchto hladin je navíc dvakrát
•
+ degenerovaná. Každé energii E > V0 odpovídají totiž dvě nezávislé vlastní vlnové funkce ψ E − a ψ E , které můžeme volit např. ve tvaru (pozn.)
ψ E+ = A f I+ ( k I , k II ) exp ( ik I x ) + g I+ ( k I , k II ) exp ( −ik I x ) x ∈ ( −∞, 0 , pro ψ E+ = A f II+ ( k I , k II ) exp ( ik II x ) + g II+ ( k I , k II ) exp ( −ik II x ) pro x ∈ 0, L , ψ E+ = A exp ( ikI x ) pro x ∈ L , +∞ ) ,
ψ E− = A exp ( −ikI x ) pro x ∈ ( −∞, 0 , ψ E− = A f II− ( k I , k II ) exp ( ik II x ) + g II− ( k I , k II ) exp ( −ik II x ) pro x ∈ 0, L , ψ E− = A f III− ( k I , k II ) exp ( ik I x ) + g III− ( k I , k II ) exp ( −ik I x ) pro x ∈ L , +∞ ) , kde
k I = 2M ( E − V0 )
2
, k II = 2 ME
± neuváděné výrazy pro f I − III ( k I , k II )
2
, A je libovolná konstanta a zde explicitně ± a g I − III ( k I , k II ) vyplývají ze sešívacích podmínek.
VÁZANÉ STAVY Pro splňující 0 < E < V0 můžeme výše uvedené rovnice přepsat do tvaru d 2ψ I , III ( x) d 2ψ II ( x) 2 + k 2ψ II ( x) = 0, − = κ ψ ( x ) 0, I , III dx 2 dx 2 kde
κ = 2M (V0 − E )
2
a k = 2 ME
2
. Jejich obecné řešení je dáno formulemi
ψ I ( x) = AI exp(−κ x) + BI exp(κ x), 96
L L 2 2 (pozn.) ψ III ( x) = AIII exp(−κ x) + BIII exp(κ x),
ψ II ( x) = AII cos(k x − k ) + BII sin(k x − k ),
v nichž neznámé konstanty A a B určíme z okrajových podmínek lim ψ ( x ) ≡ lim ψ I ( x ) = 0, x →−∞
x →−∞
lim ψ ( x) ≡ lim ψ III ( x) = 0
x →+∞
x →+∞
(jinak by uvedená vlnová funkce divergovala v ±∞ ) a výše uvedených podmínek sešívacích. Okrajové podmínky jsou splněny, platí-li AI = BIII = 0. sešívací podmínky vedou k soustavě čtyř homogenních lineárních algebraických rovnic pro neznámé konstanty BI , AII , BII a AIII . Aby tyto rovnice měly nenulové řešení, musí být determinant soustavy nulový. Po nezbytných úpravách nabývá tato podmínka tvaru
kde a = L/2.
k κ tg ( ka ) − k tg ( ka ) + κ = 0,
Numerickým řešením poslední rovnice získáme přípustné hodnoty energie a po dosazení do odpovídajících vztahů i stacionární vlnové funkce částice vázané v jednorozměrné pravoúhlé potenciálové jámě konečné hloubky. Značení intervalu
( a, b
a a, b ) zde označujeme polouzavřené intervaly, tedy množiny všech reálných x splňujících a < x ≤ b, resp. a ≤ x < b. Podobně symbolem a, b resp. ( a, b ) označujeme interval uzavřený resp. otevřený, tj. množiny všech reálných x splňujících a ≤ x ≤ b resp. a < x < b. Symboly
9.1.4.9.6.a 2
2 M (V − E )
d ψ = ψ 2 Ze Schrödingerovy rovnice zapsané ve tvaru dx2 vyplývá, že pro potenciál s nespojitostmi typu konečného skoku bude mít stejné nespojitosti i druhá derivace vlnové funkce ψ. Z diferenciálního počtu ale víme, že v takovém případě bude funkce sama i její první derivace spojitá.
Obvyklým způsobem Uvedené rovnice jsou lineární obyčejné diferenciální rovnice s konstantními koeficienty a nulovou pravou stranou. O způsobu jejich řešení se může čtenář poučit např. v REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 649-652. @ 9.1.4.9.6.b
Jen z technických důvodů použijeme zde uvedený tvar obecného řešení pro ψ II místo obvyklého tvaru ψ II ( x) = AII cos(k x) + BII sin(k x). Významně to totiž zjednoduší řešení problému.
97
4.9.7 TROJROZMĚRNÁ PRAVOÚHLÁ POTENCIÁLOVÁ JÁMA NEKONEČNÉ HLOUBKY Zde studovaný potenciál je trojrozměrným protějškem jednorozměrné pravoúhlé potenciálové jámy nekonečné hloubky. Protože níže na mnohé výsledky získané pro tento jednorozměrný model odkazujeme, doporučujeme čtenáři, aby si jej, pokud tak již neučinil, podrobně prostudoval.
POTENCIÁL Trojrozměrná pravoúhlá potenciálová jáma nekonečné hloubky odpovídá modelovému potenciálu V ( x, y , z ) = 0 pro x ∈ ( 0, Lx ) , y ∈ ( 0, Ly ) , z ∈ ( 0, Lz ) , V ( x, y , z ) = +∞ jinde.
V poli tohoto potenciálu budeme studovat stacionární stavy a pohyb jediné částice, jejíž hmotnost označme M. V analogii s jednorozměrným modelem můžeme říci, že tato částice je „uvězněna“ v kvádru o hranách Lx , Ly a Lz .
STACIONÁRNÍ STAVY Podrobné řešení stacionární Schrödingerovy rovnice je možno pro studovaný systém najít zde. Z něj vyplývá, že energetické spektrum částice nacházející se v trojrozměrné potenciálové jámě nekonečné hloubky je čistě diskrétní. Přípustné hodnoty celkové energie jsou dány vztahem Enx , ny , nz =
π2
2
(n 2M
x
2
2
2
)
+ n y + nz ,
kde kvantová čísla nx , n y a nz nabývají kladných celočíselných hodnot. Odpovídající vlastní vlnové funkce mohou být uvnitř jámy psány ve tvaru
ψ n ,n x
y , nz
(
)
( x, y, z ) = B sin ( knx x ) sin kny y sin ( knz z ) ,
kde knx = π nx / Lx , kny = π ny / Ly a knz = π nz / Lz .
Vně jámy jsou vlnové funkce z pochopitelných důvodů nulové.
98
Energetické spektrum studovaného systému je, až na základní hladinu
( nx = n y = nz = 1 ),
degenerované. E = 6 (π 2 2 ) ( 2 M ) je třikrát degenerovaná, neboť Např. první excitovaná energetická hladina 1 energii E1 odpovídají následující tři volby kvantových čísel nx , n y a nz :
•
nx = 2, n y = 1, nz = 1,
•
nx = 1, n y = 2, nz = 1,
•
nx = 1, n y = 1, nz = 2.
ČASOVÝ VÝVOJ Podrobné řešení nestacionární Schrödingerovy rovnice pro systémy s čistě diskrétním spektrem je možno najít zde. Z něj pro částici v trojrozměrné pravoúhlé potenciálové jámě nekonečné hloubky vyplývá, že časový vývoj vlnové funkce ϕ, kterou je možno v počátečním čase t0 psát ve tvaru +∞
+∞
+∞
ϕ (r , t0 ) = ∑ ∑ ∑ cn n n ψ n n n (r ), nx =1 n y =1 nz =1
x y z
x y z
je dán formulí +∞
+∞
+∞
i
ϕ (r , t ) = ∑ ∑ ∑ cn n n exp − En n n ( t − t0 ) ψ n n n (r ), nx =1 n y =1 nz =1
Enx ny nz
kde
a
ψn n n
x y z
x y z
x y z
x y z
jsou výše uvedené vlastní energie a odpovídající vlastní vlnové funkce.
4.9.8 TROJROZMĚRNÁ PRAVOÚHLÁ POTENCIÁLOVÁ JÁMA NEKONEČNÉ HLOUBKY - PODROBNÉ ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Podobně jako v případě jednorozměrné jámy nekonečné hloubky řešíme stacionární Schrödingerovu rovnici pro částici v trojrozměrné pravoúhlé jámě nekonečné hloubky odděleně na oblasti, v níž je potenciál nekonečný, a na oblasti, v níž je potenciál nulový. Jistě nepřekvapí, že •
vlnová funkce je pro daný potenciál spojitá na celém prostoru,
•
vně potenciálové jámy je nulová (pozn. 1).
99
Uvnitř jámy je potenciál nulový a stacionární Schrödingerova rovnice nabývá tvaru (M je hmotnost částice) −
2
2M
∆ψ ( x, y, z ) = Eψ ( x, y, z ).
Na rozdíl od jednorozměrné potenciálové jámy máme nyní co činit s parciální diferenciální rovnicí. Její řešení nalezneme pomocí metody separace proměnných, kdy neznámou vlnovou funkci předpokládáme ve tvaru ψ ( x, y, z ) = ψ x ( x) ψ y ( y ) ψ z ( z ). Dosazením do výše uvedené Schrödingerovy rovnice získáme po provedení příslušných derivací 2 d 2ψ y d 2ψ x d 2ψ z ψ ψ ψ ψ ψ ψ − + + y z = Eψ x ψ y ψ z x z x y dx 2 dy 2 dz 2 2 M a po úpravách 2 1 d 2ψ x 1 d ψ y 1 d 2ψ z + + = −k 2 , 2 2 2 ψ x dx ψ y dy ψ z dz kde jsme zavedli
2ME
k=
2
.
Poučeni řešením jednorozměrného modelu předpokládáme, že fyzikálně přijatelné jsou pouze kladné hodnoty energie E. Výraz pod odmocninou bude proto vždy kladný a definice parametru k je tedy korektní. Sčítance na levé straně poslední uvedené rovnice závisejí vždy jen na jedné z nezávislých proměnných x, y či z. Proto musí být každý z nich konstantní, tj. musí platit 2 1 d ψy 1 d 2ψ x 1 d 2ψ z 2 2 2 = − k k , = − = −k z , y x 2 2 2 ψ y dy ψ x dx a ψ z dz kde konstanty k x , k y a kz splňují vazebnou podmínku 2
2
2
kx + k y + kz = k 2. Tímto je ovšem problém řešení parciální diferenciální rovnice převeden na mnohem jednodušší úlohu řešení tří nezávislých obyčejných diferenciálních rovnic (pozn. 2). Navíc jsou získané obyčejné diferenciální rovnice totožné s těmi, které řešíme v rámci jednorozměrného modelu. Proto můžeme pro přípustné hodnoty energie bez zdlouhavých výpočtů přímo psát Enx , ny , nz =
π2
2
(n 2M
x
2
2
2
)
+ n y + nz ,
kde kvantová čísla nx , n y a nz nabývají všech kladných celočíselných hodnot. Odpovídající vlnové funkce pak nabývají uvnitř jámy (vně jsou, jak víme, nulové) tvaru
ψ n ,n x
y
, nz
(
)
( x, y, z ) = B sin ( knx x ) sin kny y sin ( knz z ) ,
kde knx = π nx / Lx , kny = π ny / Ly a knz = π nz / Lz .
100
(1) Pokud by se částice nacházela vně studované potenciálové jámy, musela by mít nutně nekonečnou celkovou energii. Viz též jednorozměrný případ. (2) Uvedené rovnice jsou lineární obyčejné diferenciální rovnice s konstantními koeficienty a nulovou pravou stranou. O způsobu jejich řešení se může čtenář poučit např. v REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 649-652.
4.9.9 LINEÁRNÍ HARMONICKÝ OSCILÁTOR POTENCIÁL Lineární harmonický oscilátor je modelový systém zahrnující částici vázanou na přímku, která se nachází v poli sil popsaných potenciálem 1 V ( x) = γ x 2 , 2
kde γ je kladná konstanta. Typický průběh potenciálu V znázorňuje obrázek. V
x
Tento model je ve fyzice mimořádně významný a užitečný, protože malé kmity naprosté většiny reálných systémů kolem jejich rovnovážných poloh je možno s dostatečnou přesností popsat právě pomocí kvadratického potenciálu. V poli tohoto potenciálu budeme studovat stacionární stavy a pohyb jediné částice, jejíž hmotnost označme M.
STACIONÁRNÍ STAVY Podrobné řešení stacionární Schrödingerovy rovnice je možno pro studovaný systém najít zde. Z něj vyplývá, že energetické spektrum lineárního harmonického oscilátoru je čistě diskrétní a nedegenerované. Přípustné hodnoty celkové energie jsou dány vztahem 101
En = ( n + 1/ 2 ) ω , kde ω = γ / M
je, podobně jako v klasickém případě, úhlová frekvence oscilátoru a kvantové
číslo n nabývá nezáporných celočíselných hodnot. Těmto energiím odpovídají až na multiplikativní konstantu jednoznačně určené vlastní vlnové funkce, které je možno po normalizaci k jedničce psát ve tvaru
2
|ψ|
n=4
n=3
n=2
n=1
x
ψ n ( x) =
4
Mω Mω 2 H n x exp − x . 2 2n n !
Mω
1
π
Symbolem H n ( z ) označujeme Hermiteův polynom n-tého stupně (viz též [1] a [2]). Průběh kvadrátů modulů vlnových funkcí ψ n ( x) následující obrázek.
2
znázorňuje pro vybrané volby kvantového čísla n
ČASOVÝ VÝVOJ Podrobné řešení nestacionární Schrödingerovy rovnice pro systémy s čistě diskrétním spektrem je možno najít zde. Z něj pro lineární harmonický oscilátor vyplývá, že časový vývoj vlnové funkce ϕ, pro kterou je možno v počátečním čase t0 psát +∞
ϕ ( x, t0 ) = ∑ cnψ n ( x), n =1
je dán formulí +∞
i
ϕ ( x, t ) = ∑ cn exp − En ( t − t0 ) ψ n ( x), n =1
102
kde En a ψ n jsou výše uvedené vlastní energie a odpovídající vlastní vlnové funkce lineárního harmonického oscilátoru. 2
Jako ilustraci uvedené formule znázorňuje připojená animace časový vývoj ϕ ( x, t ) pro vlnové funkce, které jsou v počátečním čase t0 dány superpozicí dvou sousedních stacionárních stavů,
ϕ ( x, t0 ) = ψ n ( x) + ψ n +1 ( x). LITERATURA
[1] [2]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 793-796. REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 607.
4.9.10 LINEÁRNÍ HARMONICKÝ OSCILÁTOR PODROBNÉ ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerova rovnice nabývá pro lineární harmonický oscilátor tvaru 2
d2 1 − ψ ( x) + γ x 2ψ ( x) = Eψ ( x), 2 2M dx 2 kde symbolem M označujeme hmotnost částice. V zájmu zjednodušení řešení této rovnice je výhodné přejít od nezávislé proměnné x k nové, bezrozměrné proměnné ξ
Mω
ξ=
x,
kde ω = γ M . Tím se totiž výše uvedená rovnice převede na formálně jednodušší tvar d2 ψ (ξ ) + ( ε − ξ 2 )ψ (ξ ) = 0, dξ 2 v němž ε označuje bezrozměrnou „energii“, ε = 2 E ω . Řešení této rovnice není možno najít jednoduchými matematickými prostředky a vyžaduje poněkud komplikovanější úvahy. Standardní postup zahrnuje zpravidla dva kroky: •
Nejdříve se odhadne chování vlnové funkce ψ v asymptotické oblasti rozhodující pro její integrovatelnost (viz zde).
•
Pak se získané řešení upřesní v oblasti konečných hodnot ξ (viz zde).
103
(ξ → ±∞ ), která je
ODHAD ŘEŠENÍ V ASYMPTOTICKÉ OBLASTI Pro hodnoty ξ → ±∞ je možno energii ε ve výše uvedené rovnici zanedbat a psát d2 ψ ∞ (ξ ) − ξ 2ψ ∞ (ξ ) = 0, 2 dξ kde indexem odlišujeme asymptotické řešení od řešení přesného. Přesné řešení této rovnice sice stále ještě není možné najít jednoduchými matematickými prostředky, můžeme je však alespoň odhadnout. Proměnná ξ se totiž v řešené rovnici vyskytuje pouze ve druhé mocnině. Proto i ψ ∞ bude záviset 2 na ξ jen prostřednictvím jeho druhé mocniny. Položme tedy na chvíli ξ = η. Pak ovšem můžeme psát 2 2 d 2ψ ∞ dψ ∞ d 2ψ ∞ 2 d ψ∞ 2 d ψ∞ ξ ξ η = 4 + 2 ≈ 4 = 4 , dξ 2 dη 2 dη dη 2 dη 2
kde jsme s ohledem na předpoklad ξ → ±∞ zanedbali člen 2dψ ∞ dη vůči dominantnímu členu 4ξ 2 ( d 2ψ ∞ dη 2 ) . Po dosazení do rovnice pro ψ ∞ takto získáme
d 2ψ ∞ 1 − ψ ∞ = 0. 4 dη Tuto rovnici již můžeme snadno řešit obvyklým postupem. Její obecné řešení je η η ψ ∞ (η ) = A exp + B exp − 2 2
nebo též
ξ2 ξ2 B exp + − , 2 2
ψ ∞ (ξ ) = A exp vrátíme-li se k původní proměnné ξ.
Vzhledem k tomu, že divergentní vlnové funkce nemohou reprezentovat vlastní stavy žádného kvantověmechanického systému, musíme položit A = 0. Proto v asymptotické oblasti platí přibližně
ξ2 ψ (ξ ) ≈ B exp − . 2
ZPŘESNĚNÍ ŘEŠENÍ MIMO ASYMPTOTICKOU OBLAST Mimo asymptotickou oblast získané přibližné řešení původní rovnici pochopitelně nevyhovuje. Přejít k řešení přesnému, a to pro všechny hodnoty ξ, znamená předpokládat, že B na ξ závisí. Pak ovšem musíme psát přesné řešení stacionární Schrödingerovy rovnice pro lineární harmonický oscilátor ve tvaru
104
ξ2 ψ (ξ ) = B(ξ )exp − . 2 Dosazením tohoto předpisu do rovnice pro ψ získáme novou rovnici pro neznámou funkci B(ξ) d 2B dB − 2ξ + (ε − 1) B = 0. 2 dξ dξ +∞
B (ξ ) = ∑ bkξ k .
k =0 Její řešení hledáme ve tvaru mocninné řady obvyklým postupem [1], který zahrnuje • dosazení řady pro B do odpovídající rovnice,
•
Neznámé koeficienty bk pak získáme
k porovnání členů se stejnými mocninami ξ .
Po jistém úsilí takto získáme (1 − ε )(5 − ε )...(2k − 3 − ε ) b0 , pro k = 2, 4,6,..., k! bk = (3 − ε )(7 − ε )...(2k − 3 − ε ) b1 , pro k = 3,5,7,... . k! Protože B je řešením obyčejné diferenciální rovnice druhého řádu, závisí podle očekávání na dvou volitelných konstantách b0 a b1. Ukazuje se však, že pro obecné hodnoty b0 , b1 a ε nekonečná
exp ( − ξ 2 2 ) diverguje pro řada B (ξ ) vynásobená asymptotickým tvarem vlnové funkce ξ → ±∞, a samotná vlnová funkce nemůže tedy reprezentovat žádný stacionární stav studovaného systému. Existuje jediná možnost, jak se zmíněné divergenci vyhnout. Zajistit, aby řada
B(ξ ) = ∑ k =0 bkξ k +∞
měla konečný počet členů a byla ve skutečnosti polynomem. Tj. aby od jisté hodnoty indexu k byly všechny koeficienty bk nulové. Toho je možno dosáhnout, objeví-li se v čitateli výrazů pro bk nula, tj. je-li splněna jedna z dvou následujících podmínek: •
b0 = 0 a 2k − 3 − ε = 0 pro k = 3,5,7,…,
•
b1 = 0 a 2k − 3 − ε = 0 pro k = 2,4,6,… .
První volba znamená, že příslušná řada bude zahrnovat jen liché členy a ε může nabývat hodnot 1, 5, 9… atd. V druhém případě budou nenulové jen členy sudé a ε bude nabývat hodnot 3, 7, 11… atd.
ENERGETICKÉ SPEKTRUM Lineární harmonický oscilátor může proto nabývat jen některých klasicky přípustných hodnot celkové energie. Ty jsou popsány souhrnnou formulí ε n = 2n + 1, 105
kde n je nezáporné celé číslo, nebo též vzhledem k definici ε 1 En = n + ω . 2
STACIONÁRNÍ VLNOVÉ FUNKCE Polynomy odpovídající jednotlivým přípustným hodnotám ε n jsou až na multiplikativní konstanty b0 a b1 totožné s tzv. Hermiteovými polynomy H n (ξ ), dobře známými z matematiky. Hledané stacionární vlnové funkce ψ n můžeme proto pro konkrétní volbu kvantového čísla n psát ve tvaru
ξ2 2
ψ n (ξ ) = K H n (ξ )exp − nebo též vzhledem k definici ξ
Mω Mω 2 x exp − x , 2
ψ n ( x) = K n H n
kde K n jsou již skutečné konstanty. Požadujeme-li, aby stacionární vlnové funkce byly normovány k jedničce, můžeme položit Kn =
4
Mω
1
π 2n n !
.
Stacionární vlnové funkce lineárního harmonického oscilátoru jsou kvadraticky integrovatelné. Jeho energetické spektrum je proto čistě diskrétní. Navíc jsou určeny kvantovým číslem n (až na multiplikativní konstantu K n ) jednoznačně. Všechny energetické hladiny jsou tudíž nedegenerované. LITERATURA
[1]
BEISER, A. Úvod do moderní fyziky. 1. vyd. Praha: Academia, 1978. 628 s. s. 189-193.
obvyklým postupem
Uvedená rovnice je lineární obyčejná diferenciální rovnice s konstantními koeficienty a nulovou pravou stranou. O způsobu jejího řešení se může čtenář poučit např. v REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 649-652.
4.9.11 TROJROZMĚRNÝ HARMONICKÝ OSCILÁTOR Trojrozměrný harmonický oscilátor je prostorovým protějškem lineárního harmonického oscilátoru. Protože níže na mnohé výsledky získané pro tento jednorozměrný model odkazujeme, doporučujeme čtenáři, aby jej, pokud tak již neučinil, podrobně prostudoval. 106
POTENCIÁL Trojrozměrný harmonický oscilátor je zadán modelovým potenciálem V ( x, y , z ) =
1 γ x x2 + γ y y 2 + γ z z 2 ) , ( 2
kde γ x , γ y a γ z jsou kladné konstanty. Platí-li γ x = γ y = γ z = γ , hovoříme obvykle o izotropním harmonickém oscilátoru. Potenciál V můžeme v tomto speciálním případě psát ve tvaru 1 V ( x, y , z ) = γ r 2 , 2 2 2 2 2 kde r = x + y + z .
V poli tohoto potenciálu budeme studovat stacionární stavy a pohyb jediné částice, jejíž hmotnost označme M.
STACIONÁRNÍ STAVY Podrobné řešení stacionární Schrödingerovy rovnice je možno pro studovaný systém nalézt zde. Z něj plyne, že energetické spektrum trojrozměrného harmonického oscilátoru je čistě diskrétní. Přípustné hodnoty celkové energie jsou dány vztahem Enx , ny , nz = ( nx + 1/ 2 ) ω x + ( n y + 1/ 2 ) ω y + ( nz + 1/ 2 ) ω z ,
kde kvantová čísla nx , n y a nz nabývají nezáporných celočíselných hodnot a kde parametry
ωx =
γy γx γ , ωy = ωz = z M M M a
odpovídají vlastním úhlovým frekvencím oscilací studovaného systému. Speciálně pro izotropní harmonický oscilátor platí Enx , ny , nz = ( nx + n y + nz + 3/ 2 ) ω ,
kde ω = γ / M . Pro normalizované vlastní vlnové funkce studovaného systému můžeme psát
107
ψ n n n ( x, y, z,) = ψ n( x ) ( x) ψ n( y ) ( y ) ψ n( z ) ( z ) , x y z
x
y
z
kde
ψ n( x ) ( x) = 4
Mωx
Mωx Mωx 2 H nx x exp − x , 2 π 2 n x nx !
Mω y
Mω y H ny n π 2 y ny !
1
x
ψ n( y ) ( y ) = 4
1
y
ψ n( z ) ( z ) = 4
Mω y 2 y exp − y , 2
Mωz Mωz 2 H nz z exp − z 2 π 2 n z nz !
Mωz
1
z
jsou normalizované vlastní funkce pro lineární harmonický oscilátor a symbolem H n označujeme Hermiteův polynom stupně n. Míra degenerace energetických hladin trojrozměrného harmonického oscilátoru závisí na konkrétních hodnotách parametrů γ x , γ y a γ z . Tak např. pro izotropní harmonický oscilátor je základní energetická hladina E0 = 3/ 2 ω nedegenerovaná, neboť odpovídá jediné volbě kvantových čísel nx = n y = nz = 0. Na druhé straně je ale kupř. první excitovaná hladina izotropního harmonického oscilátoru třikrát degenerovaná, neboť energie E1 = 5/ 2 ω odpovídá následujícím třem volbám kvantových čísel: •
nx = 1, n y = 0, nz = 0,
•
nx = 0, n y = 1, nz = 0,
•
nx = 0, n y = 0, nz = 1.
ČASOVÝ VÝVOJ Podrobné řešení nestacionární Schrödingerovy rovnice pro systémy s čistě diskrétním spektrem je možno najít zde. Z něj pro trojrozměrný harmonický oscilátor vyplývá, že časový vývoj vlnové funkce ϕ, kterou je možno v počátečním čase t0 psát ve tvaru +∞
+∞
+∞
ϕ (r , t0 ) = ∑ ∑ ∑ cn n n ψ n n n (r ), nx =1 n y =1 nz =1
x y z
x y z
je dán formulí +∞
+∞
+∞
i
ϕ (r , t ) = ∑ ∑ ∑ cn n n exp − En n n ( t − t0 ) ψ n n n (r ), nx =1 n y =1 nz =1
kde
Enx ny nz
a
ψn n n
x y z
x y z
x y z
x y z
jsou výše uvedené vlastní energie a odpovídající stacionární vlnové funkce.
108
4.9.12 TROJROZMĚRNÝ HARMONICKÝ OSCILÁTOR PODROBNÉ ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerova rovnice nabývá pro částici o hmotnosti M pohybující se v poli potenciálu 1 V ( x, y , z ) = ( γ x x 2 + γ y y 2 + γ z z 2 ) 2 tvaru 2 1 − ∆ψ ( x, y, z ) + (γ x x 2 + γ y y 2 + γ z z 2 )ψ ( x, y, z ) = Eψ ( x, y, z ). 2M 2 Na rozdíl od lineárního harmonického oscilátoru musíme tedy nyní řešit parciální diferenciální rovnici, k čemuž využijeme metody separace proměnných a neznámou vlnovou funkci budeme hledat ve tvaru ψ ( x, y , z ) = ψ x ( x ) ψ y ( y ) ψ z ( z ). Po dosazení do výše uvedené stacionární Schrödingerovy rovnice získáme d 2ψ y d 2ψ x d 2ψ z ψ ψ ψ ψ − + + ψ yψ z + x z x y 2 M dx 2 dy 2 dz 2 1 + {γ x x 2 + γ y y 2 + γ z z 2 }ψ xψ yψ z = Eψ xψ yψ z 2 2
a po dalších úpravách
2 2 2 1 d 2ψ x 1 1 d ψy 1 2 + γ xx + − + γ y y2 + − 2 2 2 2 2 M ψ x dx 2 M ψ y dy
2 1 d 2ψ z 1 + γ z z2 = E . − 2 2 2M ψ z dz
Sčítance na levé straně poslední uvedené rovnice závisejí vždy jen na jediné nezávislé proměnné x, y, či z. Každý z nich proto musí být konstantní, tj. musí platit −
1 d 2ψ x 1 + γ x x 2 = Ex , 2 2M ψ x dx 2
−
2 1 d ψy 1 + γ y y 2 = Ey , 2 2M ψ y dy 2
−
1 d 2ψ z 1 + γ z z 2 = Ez , 2 2M ψ z dz 2
2
2
2
kde nově zavedené konstanty Ex , E y a Ez splňují podmínku E x + E y + E z = E.
109
Rovnice pro neznámé funkce ψ x , ψ y a ψ z ovšem po jednoduché úpravě nabývají tvaru stacionární Schrödingerovy rovnice pro lineární harmonický oscilátor. Jejich řešení proto můžeme napsat okamžitě. Především přípustné hodnoty parametrů E x , E y a E z jsou dány vztahy
Ex = ( nx + 1/ 2 ) ω x , E y = ( n y + 1/ 2 ) ω y , Ez = ( nz + 1/ 2 ) ω z , v nichž
ωx =
γy γx γ , ωy = ωz = z M M M a
a kvantová čísla nx , n y a nz nabývají nezáporných celočíselných hodnot. Celková energie trojrozměrného harmonického oscilátoru je tedy kvantována podle vzorce
E = ( nx + 1/ 2 ) ω x + ( n y + 1/ 2 ) ω y + ( nz + 1/ 2 ) ω z . Energetické spektrum trojrozměrného harmonického oscilátoru je čistě diskrétní.
Pro normalizované vlnové funkce ψ x , ψ y a ψ z můžeme pro konkrétní volbu kvantových čísel nx , n y , nz psát na základě vztahů, které jsme získali pro stacionární vlnové funkce lineárního harmonického oscilátoru:
ψ n( x ) ( x) = 4
Mωx
Mωx Mωx 2 H nx x exp − x , 2 π 2 n x nx !
Mω y
Mω y H ny n π 2 y ny !
Mω y 2 y exp − y , 2
Mωz
Mωz H nz π 2 n z nz !
Mωz 2 z exp − z . 2
x
ψ n( y ) ( y ) = 4 y
ψ n( z ) ( z ) = 4 z
1
1
1
O míře degenerace jednotlivých energetických hladin nemůžeme v obecném případě tedy říci nic konkrétního. Ta totiž závisí jak na hodnotách parametrů γ x , γ y , γ z , tak i na hladině (kvantových číslech nx , n y , nz ) samotné. Vybrané příklady nedegenerované a degenerované energetické hladiny je možno najít zde. Izotropní harmonický oscilátor se vyznačuje zajímavým rysem - sférickou symetrií. To umožňuje v jeho případě i jiný způsob separace proměnných než ten, který jsme probrali výše. O tomto alternativním způsobu se zmiňujeme blíže v kapitole věnované poli centrálních sil (viz též [1]). LITERATURA
[1]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 124-129.
110
4.9.13 TUHÝ ROTÁTOR Pod tuhým rotátorem rozumíme hmotný bod o hmotnosti M pohybující se v neměnné vzdálenosti kolem počátku souřadnicové soustavy. Nahradíme-li hmotnost M redukovanou hmotností, můžeme tento model použít v nezměněné formě i při popisu rotace soustavy dvou hmotných bodů kolem společného těžiště, během níž se jejich vzájemná vzdálenost nemění. Model tuhého rotátoru se dá snadno rozšířit i na obecnou tuhou soustavu lineárně uspořádaných hmotných bodů. V rámci klasické mechaniky je pohyb tuhého rotátoru rovinný. Přestože v mechanice kvantové podobné omezení neplatí, řešíme a porovnáváme níže pro názornost oba případy – rovinný i obecný, prostorový tuhý rotátor.
ROVINNÝ TUHÝ ROTÁTOR - STACIONÁRNÍ STAVY Rovinu pohybu rotátoru můžeme bez újmy na obecnosti ztotožnit se souřadnicovou rovinou (x,y). Vzhledem k symetrii problému je výhodné v této rovině přejít do polárních souřadnic, kdy Laplaceův operátor nabývá tvaru [1] ∆=
∂2 1 ∂ 1 ∂2 + + . ∂r 2 r ∂r r 2 ∂ϕ 2
Protože je vzdálenost studovaného hmotného bodu od počátku souřadnicové soustavy konstantní, nebude na ní vlnová funkce Ψ sytému záviset, Ψ = Ψ(ϕ). Derivace podle r můžeme tedy ve výše uvedeném výrazu pro Laplaceův operátor zanedbat. Stacionární Schrödingerova rovnice nabývá takto tvaru −
d 2Ψ = E Ψ. 2Mr 2 dϕ 2 2
Její podrobné řešení je možno najít zde. Z něj vyplývá, že energetické spektrum rovinného rotátoru je čistě diskrétní: El =
2 2
l . 2 Mr 2
Kvantové číslo l nabývá nezáporných celočíselných hodnot. Odpovídající vlastní vlnové funkce je možno pro l ≠ 0 psát jako lineární kombinace dvou + − nezávislých řešení výše uvedené Schrödingerovy rovnice Ψ l (ϕ ) = exp ( ilϕ ) a Ψ l (ϕ ) = exp ( −ilϕ ) . Pro l = 0 degenerují tato dvě řešení v jediné Ψ 0 (ϕ ) = konst. Spektrum rovinného tuhého rotátoru je tedy navíc, s výjimkou základní hladiny, degenerované.
111
ROVINNÝ TUHÝ ROTÁTOR - ČASOVÝ VÝVOJ Podrobné řešení nestacionární Schrödingerovy rovnice pro systémy s čistě diskrétním spektrem je možno najít zde. Z něj pro rovinný tuhý rotátor vyplývá, že časový vývoj vlnové funkce Φ, kterou je možno v počátečním čase t0 psát ve tvaru +∞
Φ (ϕ , t0 ) = A0 + ∑ Al Ψ l+ (ϕ ) + Bl Ψ l− (ϕ ) , l =1
je dán formulí
+∞ i Φ (ϕ , t ) = A0 + ∑ Al Ψ l+ (ϕ ) + Bl Ψ l− (ϕ ) exp − El ( t − t0 ) , l =1
kde El a Ψ l jsou výše uvedené vlastní energie a odpovídající vlastní funkce.
PROSTOROVÝ TUHÝ ROTÁTOR - STACIONÁRNÍ STAVY V případě prostorového rotátoru je výhodné využít jeho sférické symetrie a přejít do sférických souřadnic, v nichž Laplaceův operátor nabývá tvaru
1 ∂2 2 ∂ 1 ∂2 ∂ ∂2 ∆= 2 + + + cot g(θ ) + . ∂r ∂θ sin 2 (θ ) ∂ϕ 2 r ∂r r 2 ∂θ 2 [1] Všimněme si, že úhlová část Laplaceova operátoru připomíná operátor kvadrátu momentu hybnosti vyjádřený ve sférických souřadnicích
Lˆ 2 = −
2
∂2 1 ∂ ∂2 cot g( ) . + + θ ∂θ 2 ∂θ sin 2 (θ ) ∂ϕ 2
Vlnová funkce systému opět nezávisí na vzdálenosti od počátku, která je podle definice tuhého rotátoru neměnná a hraje tedy roli konstantního parametru, Ψ = Ψ(θ,ϕ), a stacionární Schrödingerova rovnice nabývá proto tvaru 1 ˆ2 L Ψ = EΨ 2 Mr 2 neboli
Lˆ 2 Ψ = 2 Mr 2 E Ψ.
Stacionární vlnové funkce prostorového tuhého rotátoru odpovídají vlastním funkcím operátoru kvadrátu momentu hybnosti, které jsou obvykle reprezentovány funkcemi kulovými (viz též [2] a [3]), Ψ lm (θ , ϕ ) = Ylm (θ , ϕ ), kde l je nezáporné celé číslo a m = −l , − l + 1, ..., l − 1, l . Odpovídající vlastní energie získáme z výrazu pro vlastní hodnoty kvadrátu momentu hybnosti 2 Mr 2 El = l (l + 1) 2 .
112
Spektrum prostorového tuhého rotátoru je tedy čistě diskrétní a kromě základní energetické hladiny degenerované. Každé vlastní energii
El
odpovídá totiž celkem 2l+1 nezávislých vlnových
funkcí.
PROSTOROVÝ TUHÝ ROTÁTOR - ČASOVÝ VÝVOJ Z podrobného řešení nestacionární Schrödingerovy rovnice pro systémy s čistě diskrétním spektrem vyplývá pro tuhý rotátor, že časový vývoj vlnové funkce Φ, kterou je možno v počátečním čase t0 psát ve tvaru +∞
l
Φ (θ ,ϕ , t0 ) = ∑ ∑ AlmYlm (θ ,ϕ ), l =1 m =− l
je dán formulí
+∞ l i Φ(θ ,ϕ , t ) = ∑ ∑ AlmYlm (θ ,ϕ ) exp − El ( t − t0 ) , l =1 m =− l
kde El a Ψ lm jsou výše uvedené vlastní energie a odpovídající vlastní vlnové funkce. LITERATURA
[1] [2]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. ISBN . s. 228. FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 787-792.
[3]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 601-605.
4.9.14 ROVINNÝ TUHÝ ROTÁTOR - PODROBNÉ ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerova rovnice nabývá pro hmotný bod o hmotnosti M, který obíhá kolem počátku souřadnicové soustavy po kružnici o neměnném poloměru r (rovinný tuhý rotátor), tvaru 2 d 2Ψ − = EΨ, 2Mr 2 dϕ 2 kde ϕ je úhel, který svírá průvodič studovaného hmotného bodu s osou x (polární úhel). Po úpravě je možno tuto rovnici přepsat do tvaru d 2Ψ − k 2Ψ = 0 dϕ 2
pro E < 0,
d Ψ =0 dϕ 2
pro E = 0,
d Ψ + k 2Ψ = 0 2 dϕ
pro E > 0,
2
2
kde jsme zavedli 113
k = 2 Mr 2 E /
2
.
Získané rovnice můžeme řešit obvyklým způsobem. Obecná řešení jsou pro jednotlivé případy dána vztahy Ψ (ϕ ) = A exp( kϕ ) + B exp(− kϕ ) Ψ (ϕ ) = A + Bϕ Ψ (ϕ ) = A exp(ikϕ ) + B exp(−ikϕ )
pro E < 0, pro E = 0, pro E > 0,
kde A a B jsou integrační konstanty. Funkce Ψ a její první derivace musí být navíc spojité. Vzhledem k tomu, že ϕ je polární úhel ( 0 ≤ ϕ < 2π ), musí výše uvedená obecná řešení splňovat podmínky Ψ (0) = Ψ (2π ), dΨ dΨ (0) = (2π ), dϕ dϕ
z nichž plyne A=B=0 B=0 k=l
pro E < 0, pro E = 0, pro E > 0,
kde l je kladné celé číslo. Záporné energie nejsou tedy pro rovinný tuhý rotátor povoleny. Z nezáporných energií připouští kvantová mechanika pro rovinný tuhý rotátor jen ty, které splňují podmínku El =
2 2
l , 2 Mr 2 l = 0,1,2,… .
Pro vlastní funkci odpovídající nejnižší přípustné energii, l = 0, je možno psát Ψ 0 (ϕ ) = A.
Vlastní vlnové funkce odpovídající kladným hodnotám kvantového čísla l, l = 1, 2, …, získáme jako lineární kombinaci Ψ l (ϕ ) = Al Ψ l+ (ϕ ) + Bl Ψ l− (ϕ ), + − kde Ψ l (ϕ ) = exp ( ilϕ ) a Ψ l (ϕ ) = exp ( −ilϕ ) .
obvyklým způsobem Uvedené rovnice jsou lineární obyčejné diferenciální rovnice s konstantními koeficienty a nulovou pravou stranou. O způsobu jejich řešení se může čtenář poučit např. v REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 649-652.
114
4.9.15 POLE CENTRÁLNÍCH SIL POTENCIÁL Pole centrálních sil popisujeme potenciálem, který závisí na polohovém vektoru r = [ x, y , z ] pouze prostřednictvím vzdálenosti od zadaného silového centra. Bez újmy na obecnosti můžeme silové centrum ztotožnit s počátkem souřadnicové soustavy a potenciál V používat ve tvaru
V = V(r), 2 2 2 kde r = x + y + z . Nulovou hladinu potenciálu pokládáme obvykle do nekonečna, platí tedy lim V ( r ) = 0. r →+∞
Speciálním příkladem pole centrálních sil je elektrostatické pole bodového náboje popisované Coulombovým zákonem.
STACIONÁRNÍ STAVY Stacionární Schrödingerovu rovnici pro částici o hmotnosti M pohybující se v poli centrálních sil, −
2
2M
∆ψ + V (r )ψ = Eψ ,
je výhodné, vzhledem k symetrii potenciálu, řešit ve sférických souřadnicích. V nich nabývá Laplaceův operátor tvaru [1]
∆= nebo též
1 ∂2 2 ∂ 1 ∂2 ∂ ∂2 cot g( ) + + + + θ ∂r 2 r ∂r r 2 ∂θ 2 ∂θ sin 2 (θ ) ∂ϕ 2
∂2 2 ∂ 1 + − 2 2 Lˆ 2 , 2 ∂r r ∂r r 2 kde Lˆ je operátor kvadrátu momentu hybnosti studované částice. ∆=
Řešení stacionární Schrödingerovy rovnice hledáme pomocí metody separace proměnných. Stacionární vlnovou funkci předpokládáme ve tvaru součinu radiální a úhlové části, tj. ψ (r ,θ , ϕ ) = ψ ( r ) (r ) ψ ( t ) (θ , ϕ ), a po dosazení a úpravách získáme 2 1 ˆ 2 (t ) d 2ψ ( r ) 2 dψ ( r ) r 2 (r ) L ψ = 0. − + + (V − E )ψ + (r ) 2 ψ 2 M dr r dr 2 M
Tato nová rovnice je ekvivalentní s dvojicí rovnic
115
2 d 2ψ ( r ) 1 dψ ( r ) r 2 (r ) ψ V E − + + − ( ) = −α , ψ ( r ) 2 M dr 2 r dr
1 ˆ 2 (t ) Lψ = α, 2M
v nichž α označuje zatím neznámou konstantu. Z první rovnice vyplývá, že pro úhlovou část vlnové funkce můžeme psát (viz též zde)
ψ (t ) (θ , ϕ ) = Ylm (θ , ϕ ), kde Ylm jsou kulové funkce (viz též [2] a [3]) a kvantová čísla l a m (vedlejší a magnetické kvantové číslo) nabývají těchto hodnot: l je nezáporné celé číslo a pro zadanou hodnotu l je m = l, -l+1, …, l-1, l. Pro konkrétní volbu vedlejšího kvantového čísla l je konstanta α rovna rovnici pro radiální část vlnové funkce můžeme proto přepsat do tvaru
2
l (l + 1) /(2M ), a
2 d 2ψ ( r ) 2 dψ ( r ) l (l + 1) ( r ) (r ) V + + + ψ = Eψ . 2 2 2M dr 2 Mr r dr (r ) (r ) Její další zjednodušení je možné pomocí substituce ψ = χ / r. Díky ní získává tato rovnice tvar formálně totožný s jednorozměrnou stacionární Schrödingerovou rovnicí
−
2
−
2 d 2 χ (r ) l (l + 1) ( r ) (r ) V + + χ = Eχ , 2 2 2M dr 2Mr 2
pro částici o hmotnosti M pohybující se v poli potenciálu 2 l (l + 1) Veff = V + . 2Mr 2 Tento potenciál se obvykle nazývá potenciálem efektivním. Kromě V je do něj zahrnut i příspěvek odpovídající energii rotačního pohybu. Rovnici pro radiální část vlnové funkce musíme obvykle řešit numericky. Pouze pro některé jednoduché potenciály, např. pro potenciál coulombický je možno řešení najít pomocí analytických metod (viz Schrödingerův model atomu vodíku). Stacionární vlnovou funkci částice nacházející se v poli centrálních sil můžeme tedy psát jako součin radiální a úhlové části. Radiální část vlnové funkce je určena celkovou energií částice a vedlejším kvantovým číslem, část úhlovou zadává spolu s vedlejším kvantovým číslem číslo magnetické. Pro stacionární vlnovou funkci můžeme proto psát
ψ Elm (r ,θ , ϕ ) = ψ El( r ) (r )Ylm (θ , ϕ ) a vidíme, že je bezezbytku určena hodnotou celkové energie částice a hodnotami vedlejšího a magnetického kvantového čísla. 116
ENERGETICKÉ SPEKTRUM Energetické spektrum částice nacházející se v poli centrálních sil má neprázdnou diskrétní i spojitou část. Kladné hodnoty energie patří do spojité části energetického spektra, která pokrývá celý interval (0, +∞ ). Diskrétní energie jsou záporné a jejich hodnoty, které obvykle odlišujeme tzv. hlavním kvantovým číslem, závisejí na tvaru použitého potenciálu. Obecně o nich nelze říci nic
určitějšího. Z rovnice pro radiální část vlnové funkce dále vidíme, že diskrétní hodnoty celkové energie mohou záviset i na vedlejším kvantovém čísle. Ne však na čísle magnetickém, které se v této rovnici nevyskytuje. V případě coulombického potenciálu však vlastní energie nezávisejí ani na kvantovém čísle vedlejším (viz atomu vodíku). Diskrétní i spojité energetické hladiny jsou degenerované. V rovnici pro radiální část vlnové funkce se totiž nevyskytuje magnetické kvantové číslo a zadané hodnotě energie (ať již diskrétní či spojité) odpovídá nejméně 2l+1 nezávislých vlnových funkcí lišících se různými hodnotami magnetického kvantového čísla m, m = -l, -l+1, …, l-1, l (pozn.). V případě coulombického potenciálu je míra degenerace v důsledku nezávislosti celkové energie na vedlejším kvantovém čísle dokonce ještě vyšší. LITERATURA
[1] [2]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. ISBN . s. 228. FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 787-792.
[3]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 601-605.
() Tato degenerace zmizí, je-li narušena sférická symetrie systému - např. jeho vložením do vnějšího pole. Intenzita tohoto pole určí významný směr (osu z) a energie se stane závislou i na magnetickém kvantovém čísle. Viz např. Starkův a Zeemanův jev v atomu vodíku.
4.9.16 JEDNOROZMĚRNÁ POTENCIÁLOVÁ BARIÉRA POTENCIÁL Typický potenciál zadávající jednorozměrnou bariéru je znázorněn na obrázku. Má tyto charakteristické rysy: •
je nenulový jen na omezené oblasti osy x (zde interval (a,b) ), vně této oblasti je nulový,
•
na zadané oblasti je kladný,
•
á na ní právě jedno lokální maximum a žádné lokální minimum. 117
V
x=a
x=b
x
ŘEŠENÁ ÚLOHA Budeme studovat částici pohybující se v poli potenciálu reprezentujícího jednorozměrnou potenciálovou bariéru. Ve zvoleném počátečním čase umístíme částici vlevo od bariéry do (libovolného) bodu, v němž je potenciál nulový, a udělíme ji nenulovou rychlost orientovanou směrem k bariéře. Zajímáme se zejména o to, zda částici nalezneme v dostatečně vzdálené budoucnosti, kdy se již opět pohybuje mimo dosah potenciálu, vlevo či vpravo od bariéry.
KLASICKÝ POPIS Řešení výše uvedené úlohy můžeme v rámci klasické mechaniky najít poměrně snadno například pomocí zákona zachování energie 1 1 2 M v 2 + V ( x) = M v 0 , 2 2
kde M je hmotnost částice, x a v její poloha a rychlost a v 0 rychlost počáteční. Charakter pohybu částice pochopitelně závisí na její počáteční rychlosti v 0 , a tedy i celkové energii 2
E = 1/ 2M v 0 . Typické situace ilustruje pro dvě rozdílné počáteční podmínky E < V0 a E > V0 ( V0 je výška potenciálové bariéry) pro jednoduchou pravoúhlou bariéru připojená animace:
Z této animace i z výše uvedené rovnice jsou zřejmé následující závěry (pozn. 1) •
částice s energií E menší než V0 se od bariéry vždy odrazí,
•
částice s energií větší než V0 bariérou vždy prochází.
KVANTOVÝ POPIS V rámci kvantové mechaniky není chování částice tak jednoznačné jako v případě klasickém.
118
Bez ohledu na svou energii může částice s jistou pravděpodobností bariérou projít a s jinou pravděpodobností se od ní odrazí. Speciálně může dojít k průchodu bariérou i v případě, kdy klasická fyzika předpovídá odraz (tunelový jev), a naopak částice se může od bariéry odrazit i v případě, kdy klasický popis připouští pouze průchod. Pravděpodobnosti průchodu bariérou a odrazu od ní jsou přímo měřitelné veličiny. Jsou definovány takto: Označme N celkový počet částic o energii E, které byly proti bariéře vyslány. Dále nechť N R označuje počet částic, které se od bariéry odrazily, a NT počet částic bariérou prošlých. Předpokládáme ovšem, že během interakce s bariérou žádné částice nezanikají ani nové nevznikají, tj. N = N R + NT . Pravděpodobnost průchodu částice bariérou PR a pravděpodobnost jejího odrazu od bariéry PT pak definujeme vztahy (pozn. 2)
N NR PT = lim T . N →+∞ N N →+∞ N a
PR = lim
Vzhledem k zachování počtu částic platí PR + PT = 1. Pravděpodobnost průchodu částice bariérou či odrazu od ní je tedy nutno chápat statisticky jako veličinu měřenou na základě velkého množství identických pokusů provedených s identickými částicemi. V některých z těchto pokusů částice bariérou procházejí, v jiných se od ní odrážejí. Vždy ale nastává jen jedna z obou možností! Pokud například v konkrétním pokusu najdeme částici za bariérou, nemohla se tatáž částice současně od bariéry odrazit a nemůžeme ji tedy najít před bariérou. A naopak, nalezneme-li částici v konkrétním pokusu před bariérou, nemohla tatáž částice F_QM_4
bariérou projít. Viz též připojená animace. Pravděpodobnosti PR a PT závisejí na energii částice E i na parametrech charakterizujících potenciálovou bariéru. Konkrétní závislosti je možno získat pro zadaný potenciál řešením odpovídající stacionární Schrödingerovy rovnice. Jako ilustraci tohoto postupu uvádíme příklad pravoúhlé potenciálové bariéry (pozn. 3) pozn. 1
V singulárním případě E = V0 dosáhne částice v závislosti na průběhu potenciálu během konečného, či nekonečného času bodu, v němž potenciál nabývá svého maxima, a zůstane zde v klidu, není-li z této vratké rovnovážné polohy vychýlena působením vnější poruchy. pozn. 2 Během konkrétního měření musíme pochopitelně vystačit s konečným počtem pokusů N a uvedené pravděpodobnosti přiblížit pomocí relativních četností, PR ≈ N R / N a PT ≈ NT / N . pozn. 3
V případě klasického popisu platí ovšem vždy PR ( E ) = 1, E > V0 .
PT ( E ) = 0 pro 0 < E < V0 a PR ( E ) = 0,
119
PT ( E ) = 1 pro
4.9.17 JEDNOROZMĚRNÁ PRAVOÚHLÁ POTENCIÁLOVÁ BARIÉRA POTENCIÁL Jednorozměrná pravoúhlá potenciálová bariéra odpovídá modelovému potenciálu
V ( x) = V0 , x ∈ ( 0, L ) , V ( x ) = 0, x ∉ ( 0, L ) ,
kde V0 je kladná konstanta. Typický průběh pravoúhlé potenciálové bariéry je znázorněn na V
V(x) = V0
V(x) = 0
V(x) = 0
x x=0
x=L
obrázku.
ŘEŠENÁ ÚLOHA Pro částici s danou energií E hledáme pravděpodobnosti průniku výše zadanou bariérou a odrazu od ní. Jak je popsáno na jiném místě, měření těchto pravděpodobností můžeme uspořádat následujícím způsobem: Bariéru ozařujeme zleva ustáleným proudem částic, jemuž odpovídající hustotu toku označíme symbolem j. Některé z částic, které dopadnou na bariéru, se od ní odrazí, jiné bariérou projdou. Odraženým částicím odpovídá jistá stacionární hustota toku, kterou označíme jR . Částicím prošlým bariérou pak přiřadíme hustotu toku jT . Z orientace směrů pohybu dopadajících, odražených a prošlých částic plyne: j > 0, jR < 0 a jT > 0. Pravděpodobnosti odrazu a průchodu bariérou pak můžeme určit ze vztahů
PR =
jR j j j PT = T = T . =− R j j a j j
120
lim N N . Vzhledem Podle definice počítáme totiž například pravděpodobnost odrazu PR jako N →+∞ R ke stacionárnímu uspořádání dopadne na bariéru za čas t celkem N = j t částic a za stejný čas se od bariéry odrazí N R = jR t částic. Limitní přechod N → +∞ odpovídá zřejmě přechodu
t → +∞. Proto můžeme psát
jR t j j = lim R = R . t →+∞ j jt j
PR = lim
t →+∞
Podobné úvahy můžeme provést, a získat tak odpovídající vztah, i pro pravděpodobnost průchodu PT . Výše popsaný experiment má stacionární uspořádání a navíc požadujeme, aby částice dopadající na bariéru měly zadanou energii. Hlubší analýza, která však zcela překračuje rámec našeho výkladu, ukazuje, že hustoty toků pravděpodobnosti odpovídající stacionárním vlnovým funkcím je možno ztotožnit s výše zavedenými hustotami toků částic. Přímo se proto nabízí možnost hledat pravděpodobnosti PR a PT pomocí stacionární Schrödingerovy rovnice.
ODRAZ OD PRAVOÚHLÉ POTENCIÁLOVÉ BARIÉRY - ŘEŠENÍ POMOCÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Jako ilustraci toho, jak se stacionární Schrödingerova rovnice používá při nalezení pravděpodobností průchodu a odrazu částic od pravoúhlé potenciálové bariéry, si uveďme výsledky plynoucí pro částice, jejichž energie E je menší než výška bariéry V0 . Podrobné řešení pro částici o hmotnosti M nacházející se v poli výše uvedeného potenciálu je možno nalézt zde. Z něj vyplývá, že stacionární vlnové funkce nabývají pro zadanou energii E < V0 tvaru pro x ∈ ( −∞,0 ) , ψ ( x) = AII exp(κ x) + BII exp(−κ x) pro x ∈ 0, L ,
ψ ( x) = AI exp(ikx) + BI exp(−ikx)
ψ ( x) = AIII exp(ikx) + BIII exp(−ikx) pro x ∈ ( 0, +∞ ) , kde k = 2 ME
2
a κ = 2M (V0 − E )
2
.
Vlnovým funkcím tohoto tvaru odpovídají hustoty toků pravděpodobnosti
(
)
k 2 2 AI − BI M k 2 jIII = AIII − BIII M
jI =
(
2
)
pro x ∈ ( −∞,0 ) , pro x ∈ ( 0, +∞ ) .
Vlevo od bariéry je hustota toku dána součtem příspěvků odpovídajících dopadajícím a odraženým částicím:
121
j = ( k M ) AI
2
a jR = − ( k M ) BI . 2
Vpravo od bariéry se mohou podle zadání nacházet pouze částice prošlé. Jim zřejmě odpovídá tok jT = ( k M ) AIII . V této oblasti se naopak nemohou nacházet žádné částice pohybující se v opačném směru. Proto musíme položit BIII = 0. 2
Pro pravděpodobnosti průchodu částice pravoúhlou bariérou a odrazu od ní takto získáme j B PR ≡ R = I j AI
2
2
j A PT ≡ T = III . j AI a
Konstanty AI , BI a AIII nejsou ovšem navzájem nezávislé. Z podrobné analýzy vyplývá, že např. konstanty BI a AIII jsou násobky konstanty AI , kde příslušné multiplikativní faktory závisejí pouze na energii E a parametrech zadávajících potenciálovou bariéru. Konečné formule pro pravděpodobnosti odrazu a průchodu částice studovanou bariérou můžeme takto psát ve tvaru 2
κ 1 PR = 1 − 16 2 k ∆
2
κ 1 PT = 16 2 , k ∆ a
kde
κ κ 1− i 1+ i k k . ∆ = det κ κ 1 + i k exp(κ L) 1 − i k exp(−κ L) Hustota toku Pod hustotou toku částic v zadaném bodě rozumíme počet částic, které projdou detektorem umístěným v tomto bodě za jednotku času. Toto číslo navíc opatříme znaménkem. Pokud se částice pohybují v kladném směru, přiřadíme toku kladné znaménko a naopak.
4.9.18 JEDNOROZMĚRNÁ PRAVOÚHLÁ POTENCIÁLOVÁ BARIÉRA - PODROBNÉ ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerovu rovnici řešíme pro jednorozměrnou pravoúhlou potenciálovou bariéru odděleně na intervalu (0,L) a mimo něj. Jednotlivé části vlnové funkce zúžené na odpovídající intervaly osy x označme (pozn. 1) x ∈ ( −∞,0 , ψ I ( x) pro ψ II ( x) pro x ∈ ( 0, L ) , 122
x ∈ L, +∞ ) , pro Pro potenciál s nespojitostmi typu konečného skoku v bodech x = 0 a x = L musí být vlnová funkce ψ v uvedených bodech spojitá a mít v nich spojité první derivace (pozn. 2). To znamená, že je nutno splnit tzv. sešívací podmínky dψ I dψ II (0) = (0), ψ I (0) = ψ II (0), dx dx dψ II dψ III ( L) = ( L). ψ II ( L) = ψ III ( L), dx dx
ψ III ( x)
ŘEŠENÍ STACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Stacionární Schrödingerova rovnice nabývá po výše naznačeném rozdělení vlnové funkce ψ na tři části a po jednoduchých úpravách tvaru d 2ψ I , III ( x)
2 ME
ψ I , III ( x) = 0, 2 dx d 2 ψ II ( x) 2M ( E − V0 ) + ψ II ( x) = 0 2 dx 2 . 2
+
Řešení nově získaných rovnic můžeme hledat obvyklým způsobem (pozn. 3). V následujícím výkladu se soustředíme jen na speciální případ 0 < E < V0 , pro E > V0 bychom postupovali stejně. Pro energie z intervalu
( 0,V0 )
můžeme výše uvedené rovnice přepsat do tvaru
d 2ψ I , III ( x) dx 2
kde k = 2 ME
2
+ k 2ψ I , III ( x) = 0,
a κ = 2M (V0 − E )
2
d 2ψ II ( x) − κ 2ψ II ( x) = 0, dx 2
. Jejich obecné řešení je dáno formulemi
ψ I ( x) = AI exp(ikx) + BI exp(−ikx), ψ II ( x) = AII exp(κ x) + BII exp(−κ x), ψ III ( x) = AIII exp(ikx) + BIII exp(−ikx). Zatím neznámé konstanty A a B určíme pomocí sešívacích podmínek a dalších speciálních požadavků na vlnovou funkci ψ. Především, ze všech řešení jsou přijatelná jen ta, která odpovídají (podle zadání problému) proudu částic bombardujících studovanou bariéru zleva. Vpravo od bariéry se proto mohou částice pohybovat pouze od bariéry pryč, tedy v kladném směru osy x. Jak je ukázáno na jiném místě, je tato podmínka splněna, je-li
BIII = 0. Dále, sešívací podmínky poskytují čtyři homogenní lineární algebraické rovnice pro zbývajících pět neznámých integračních konstant:
123
AI + BI = AII + BII , ikAI − ikBI = κ AII − κ BII , AII exp(κ L) + BII exp(−κ L) = AIII exp(ikL) + BIII exp(−ikL), κ AII exp(κ L) − κ BII exp(−κ L) = ikAIII exp(ikL) − ikBIII exp(−ikL). Čtyři z těchto konstant můžeme proto vyjádřit pomocí jedné vybrané. Mají-li být tedy sešívací podmínky splněny, můžeme například psát
BI =
κ 2 1 + [ exp(−κ L) − exp(κ L) ] k ∆
κ − 1 i exp(−κ L) k AII = 2 AI , ∆ κ AIII = −4i k
AI ,
κ + 1 i exp(κ L) k BII = −2 AI , ∆ exp(−ikL) ∆
AI ,
kde
κ κ 1− i 1+ i k k . ∆ = det κ κ 1 + i k exp(κ L) 1 − i k exp(−κ L) (1)
( a, b
a a, b ) zde označujeme polouzavřené intervaly, tedy množiny všech reálných x splňujících a < x ≤ b, resp. a ≤ x < b. Podobně symbolem a, b resp. ( a, b ) označujeme interval uzavřený resp. otevřený, tj. množiny všech reálných x splňujících a ≤ x ≤ b resp. a < x < b. Symboly
(2) 2
2 M (V − E )
d ψ = ψ 2 Ze Schrödingerovy rovnice zapsané ve tvaru dx2 vyplývá, že pro potenciál s nespojitostmi typu konečného skoku bude mít stejné nespojitosti i druhá derivace vlnové funkce ψ. Z diferenciálního počtu ale víme, že v takovém případě bude funkce sama i její první derivace spojitá.
(3) Uvedené rovnice jsou lineární obyčejné diferenciální rovnice s konstantními koeficienty a nulovou pravou stranou. O způsobu jejich řešení se může čtenář poučit např. v REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 649-652.
4.10 PŘIBLIŽNÉ METODY V KVANTOVÉ TEORII Pro většinu realistických systémů má Hamiltonův operátor poměrně komplikovanou matematickou strukturu, takže přesné řešení odpovídající stacionární či nestacionární Schrödingerovy rovnice není možno najít pomocí jednoduchých analytických metod. Tehdy jsou užitečné buď numerické metody, nebo metody poskytující přibližné, leč přesto vyhovující řešení. Tj. takové řešení, které se liší od řešení přesného jen velmi málo, takže odpovídající odchylky je možno v rámci dosažitelné 124
experimentální přesnosti zanedbat. Souhrnně tyto metody nazýváme metodami přibližnými a zahrnujeme mezi ně obvykle •
stacionární poruchovou teorii,
•
variační metodu,
•
kvaziklasické přiblížení,
•
Bornovu-Oppenheimerovu aproximaci,
•
nestacionární poruchovou teorii.
4.10.1 STACIONÁRNÍ PORUCHOVÁ TEORIE V této kapitole budeme důsledně používat braketovou symboliku.
ÚVOD Stacionární poruchová teorie, poprvé formulovaná E. Schrödingerem [1], je přibližnou metodou
pro výpočet vlastních hodnot samosdružených operátorů. V rámci kvantové teorie se obvykle využívá při výpočtu přípustných energií systému (vlastních hodnot Hamiltonova operátoru) v případech, kdy není možno najít přesné řešení odpovídající stacionární Schrödingerovy rovnice. Alternativní metodou pro obdobný výpočet je metoda variační. Při aplikaci stacionární poruchové metody předpokládáme, že operátor energie je možno rozložit na součet dvou členů ˆ =H ˆ +H ˆ , H 0
P
ˆ kde operátor H P tvoří v jistém smyslu velmi malý příspěvek (poruchu) k dominantnímu členu ˆ . ˆ ˆ ˆ H 0 Můžeme tedy psát H P = ε .H P ', kde ε je malé kladné reálné číslo. Proto o operátoru H 0 ˆ jako o hamiltoniánu obvykle hovoříme jako o neporušeném hamiltoniánu a o operátoru H porušeném.
ˆ Umíme-li řešit neporušenou stacionární Schrödingerovu rovnici H 0 ψ 0 = E0 ψ 0 , můžeme pomocí ˆ poruchové teorie najít i přibližné řešení rovnice H ψ = E ψ , a to ve tvaru poruchové řady v mocninách ε.
NEDEGENEROVANÉ ČISTĚ DISKRÉTNÍ SPEKTRUM ˆ Předpokládejme nejdříve, že neporušený hamiltonián systému H 0 má nedegenerované a čistě diskrétní spektrum. Platí tedy ˆ ψ =E ψ , H 0 n0 n0 n0 n = 1,2,… , ψ m 0 ψ n 0 = δ mn , 125
kde vlnové funkce ψ n 0
tvoří bázi na stavovém prostoru systému. Pro vlastní energie a ˆ pak můžeme výše zmíněné odpovídající vlastní vlnové funkce porušeného hamiltoniánu H poruchové řady psát ve tvaru +∞
+∞
k =0
k =0
En = ∑ ε k Enk , ψ n = ∑ ε k ψ nk .
Vzhledem k technické náročnosti výpočtů se spokojíme s přiblížením prvního řádu En ≈ En 0 + ε En1 ,
ψ n ≈ ψ n 0 + ε ψ n1 , kde En 0 a ψ n 0 jsou vlastní energie a vlastní vlnová funkce neporušeného hamiltoniánu odpovídající kvantovému číslu n. Pro korekce prvního řádu pak po dosazení do původní rovnice získáme
ε En1 = ψ n 0 Hˆ P ψ n 0 , (1) ε ψ n1 = ∑ cmn ψ m0 , m≠n
kde
(1) cmn =
ψ m 0 Hˆ P ψ n 0 . En 0 − Em 0
Podrobné odvození je možno najít zde.
DEGENEROVANÉ ČISTĚ DISKRÉTNÍ SPEKTRUM Podobným, nicméně poněkud komplikovanějším postupem je možno najít i přibližné vyjádření vlastních energií a vlastních vlnových funkcí pro systémy s degenerovaným diskrétním spektrem.
ψ 0 nk , Degenerované neporušené hladině En0, nabývané pro normalizované vlastní vlnové funkce k = 1, 2,..., K , odpovídají s přesností do prvního řádu vlastní energie porušeného hamiltoniánu, které jsou současně vlastními čísly matice ˆ ψ H ij ≡ ψ 0 ni H 0 nj
, i, j = 1, 2,..., K .
LITERATURA
[1]
SCHRÖDINGER, E. Annalen der Physik, 1926, Bd. 80, S. 437.
126
4.10.2 VARIAČNÍ METODA V této kapitole budeme důsledně používat braketovou symboliku.
ÚVOD Variační metoda se používá k nalezení nejmenší vlastní hodnoty a odpovídajícího vlastního vektoru
zadaného samosdruženého operátoru. V rámci kvantové teorie se zpravidla využívá k nalezení základního stavu Hamiltonova operátoru. Alternativní metodou pro obdobný výpočet je metoda poruchová.
RITZŮV VARIAČNÍ TEORÉM Základem variační metody je následující tvrzení: Funkcionář energie
E (ψ ) =
ψ Hˆ ψ ψψ
ˆ a nabývá své minimální hodnoty pro vlnovou funkci ψ , která je vlastní funkcí hamiltoniánu H
odpovídá nejmenší vlastní hodnotě E0 tohoto operátoru. Uvažujeme-li pouze normalizované vlnové funkce, ψ ψ = 1, úloha nalezení základní energetické hladiny systému odpovídá matematické úloze minimalizace funkcionálu ˆ ψ . E (ψ ) = ψ H Důkaz uvedeného tvrzení je snadný pro systémy s nedegenerovaným, čistě diskrétním energetickým ˆ spektrem, H ψ n = En ψ n , n = 0, 1, ... Pak totiž můžeme pro normalizované vlnové funkce psát +∞
ψ = ∑ cn ψ n n =0
+∞
a
∑c n =0
n
2
=1
a pro studovaný funkcionál platí +∞
ˆ ψ = ∑ En cn 2 ≥ E0 , E (ψ ) ≡ ψ H n =0
kde se rovnosti nabývá jen a pouze pro ψ = ψ 0 .
POUŽITÍ VARIAČNÍ METODY Praktické použití variační metody spočívá v konstrukci vhodné třídy normalizovaných vlnových funkcí ψ závislých na konečném počtu reálných parametrů α1 , ..., α K . Na této třídě pak ˆ minimalizaci funkcionálu E (ψ ) = ψ H ψ
provádíme. Řešený problém se takto převede na 127
mnohem jednodušší úlohu nalezení minima funkce K reálných proměnných, jejíž vyřešení, zpravidla s využitím numerických metod, poskytuje jak horní odhad energie základního stavu E0 , tak i přibližný tvar odpovídající vlnové funkce. Předpokládáme ovšem, že při dostatečném počtu nastavitelných parametrů (ve velmi přesných výpočtech až několik tisíc) jsou oba přibližné výsledky dostatečně přesné. ˆ Často hledáme minimum funkcionálu E (ψ ) = ψ H ψ na nějakém velmi pečlivě zvoleném konečněrozměrném podprostoru stavového prostoru. Vybranou bázi na tomto podprostoru označme φ1 , ..., φ K a předpokládejme, že je ortonormální - φi φ j = δ ij , i, j = 1, ..., K . Obecná úloha nalezení minima výše uvedeného funkcionálu se pak redukuje na nalezení minima kvadratické funkce K komplexních proměnných K
∑H c c ,
E ( c1 ,..., cK ) ≡
* ij i j
i , j =1
kde
ˆ φj , H ij = φi H
při současném splnění vazebné podmínky K
∑c c
* i i
=1
. Metodou Lagrangeových multiplikátorů [1] získáme ekvivalentní soustavu lineárních algebraických rovnic i =1
K
∑H c ij
j
= Eci , i = 1, ..., K ,
j =1
kde multiplikátory E jsou podle tzv. minimaxového teorému horními odhady K nejnižších ˆ vlastních energií hamiltoniánu H.
POZNÁMKA Variační metoda je spolu s metodou poruchovou základním teoretickým nástrojem pro výpočet vlastních energií víceelektronových atomů a molekul. Mezi nejdůležitější aplikace této metody patří bezesporu Hartreeho-Fockova metoda optimalizace elektronických vlnových funkcí reprezentovaných Slaterovými determinanty. LITERATURA
[1]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 388-394.
minimaxového teorému inf Sup ϕ H ϕ = En , Sn ϕ ∈Sn , ϕ ϕ =1 Teorém, ve fyzikálním žargonu obvykle nazývaný minimaxem, říká, že kde se S E příslušné infimum bere přes všechny n-rozměrné podprostory n stavového prostoru. Symboly n označují vlastní
energie systému uspořádané podle velikosti, E1 ≤ E2 ≤ E3 ≤ ... .
128
4.10.3 KVAZIKLASICKÉ PŘIBLÍŽENÍ ÚVOD Kvaziklasické přiblížení je metodou pro přibližné řešení stacionární i nestacionární Schrödingerovy
rovnice. V jeho rámci předpokládáme vlnovou funkci ve speciálním tvaru, který vzdáleně připomíná de Broglieho monochromatickou vlnu, i
ψ (r , t ) = exp S (r , t ) , a obě řešené rovnice zapisujeme pomocí nově zavedené funkce S ( r , t ). Jejich přibližné řešení hledáme ve tvaru rozvoje této funkce podle mocnin Planckovy konstanty.
KVAZIKLASICKÉ
PŘIBLÍŽENÍ
PRO
NESTACIONÁRNÍ
SCHRÖDINGEROVU ROVNICI V nestacionární Schrödingerově rovnici 2 ∂ψ =− ∆ψ + V (r )ψ ∂t 2M
i
předpokládejme vlnovou funkci ve tvaru i
ψ (r , t ) = exp S (r , t ) ,
kde i je imaginární jednotka a
„škrtnutá“ Planckova konstanta. Takto získáme rovnici novou −
∂S 1 i 2 = ∆S ( ∇S ) + V ( r ) − 2M ∂t 2 M ,
jejíž řešení budeme hledat jako mocninnou řadu +∞
n
S (r , t ) = ∑ Sn (r , t ) . i n=0 Dosazením do výše uvedené rovnice pro S a porovnáním členů u stejných mocnin Planckovy konstanty získáme takto soustavu rovnic pro koeficienty S0 , S1 atd. −
1 ∂S0 2 = ( ∇S0 ) + V (r ), 2M ∂t
129
−
∂S1 1 1 = ∆S 0 ( ∇S0 .∇S1 ) + ∂t M 2M atd.
Ze získaných rovnic vidíme především, že v nultém řádu rozvoje podle mocnin Planckovy konstanty získáváme klasickou Hamiltonovu-Jacobiho rovnici [1] a funkce S 0 není ničím jiným než klasickým účinkem. V nultém přiblížení tedy kvantová mechanika odpovídá zcela mechanice klasické. Teprve druhá z uvedených rovnic reprezentuje některé kvantové efekty. A sice ty, které se projeví již v prvním řádu poruchového rozvoje podle mocnin Planckovy konstanty. Vezmeme-li v úvahu pouze tyto první dva členy poruchového rozvoje funkce S, tj. S (r , t ) ≈ S0 (r , t ) + S1 (r , t ) , i hovoříme o tzv. kvaziklasickém přiblížení. Je možno ukázat, že kvaziklasické přiblížení poskytuje výsledky přijatelné přesnosti, není-li významná relativní změna hybnosti studované částice na vzdálenostech rovných její de Broglieho vlnové délce. Kvaziklasické přiblížení proto kupříkladu zcela selhává v klasických bodech obratu.
KVAZIKLASICKÉ PŘIBLÍŽENÍ PRO STACIONÁRNÍ SCHRÖDINGEROVU ROVNICI Použití kvaziklasického přiblížení při řešení stacionární Schrödingerovy rovnice je přímočaré. Stacionární vlnovou funkci je totiž možno psát ve tvaru i ψ (r , t ) = Ψ (r ) exp − Et , což vede k S0 (r , t ) = − Et + s0 ( r ), S n (r , t ) = sn (r ), n = 1,2,… . V rámci kvaziklasického přiblížení se opět omezíme jen na příspěvky nultého a prvního řádu. Funkce s0 je redukovaný účinek [1] známý z klasické mechaniky a funkce s1 splňuje rovnici
( ∇s0 .∇s1 ) +
1 ∆s0 = 0. 2
Vzhledem k interpretaci funkce s0 vidíme, že ∇s0 je klasická hybnost studované částice. Můžeme tedy psát 2 ∇s0 (r ) = p(r ), kde p(r ) = 2M ( E − V (r ) ) .
130
Naznačený postup přibližného řešení stacionární Schrödingerovy rovnice se obvykle nazývá podle svých autorů WKB (Wentzel-Kramers-Brillouin) aproximací [2]-[4]. Při výpočtu vlastních energií z diskrétní části spektra vede WKB aproximace ke stejným hodnotám, jaké vyplývají ze Sommerfeldovy-Wilsonovy kvantovací podmínky. LITERATURA
[1] [2] [3] [4]
LANDAU, LD. a LIFŠIC, JM. Úvod do teoretickej fyziky 1. Mechanika. Elektrodynamika. 1. Vyd. Bratislava: Alfa, 1980. 286 s. s.125-127. WENTZEL, G. Zeitschrift für Physik, 1926, Bd. 38, S. 518. KRAMERS, HA. Zeitschrift für Physik, 1926, Bd. 39, S. 828. BRILLOUIN, L. Comptes Rendus, 1926, vol. 183, p. 24.
4.10.4 BORNOVA - OPPENHEIMEROVA APROXIMACE ÚVOD Bornova-Oppenheimerova aproximace [1] je přibližnou metodou pro řešení stacionární a
nestacionární Schrödingerovy rovnice pro systémy mnoha částic, jejichž hmotnosti se výrazně liší. Její podstata spočívá v separaci stupňů volnosti lehkých a těžkých částic. Vyložíme si ji na příkladu molekuly, kterou popíšeme jako soustavu N těžkých jader a n lehkých elektronů. Pro jednoduchost se omezíme na nerelativistické přiblížení a elektrostatickou interakci mezi oběma typy částic. Jádra v rámci tohoto přiblížení považujeme za částice bez vnitřní struktury.
BORNOVA-OPPENHEIMEROVA APROXIMACE PRO MOLEKULY Stacionární Schrödingerovu rovnici pro systém tvořený N jádry a n elektrony můžeme psát ve tvaru 2 2 n N ∆J − ∑ ∆ j + V RJ , r ψ RJ , r = Eψ RJ , rj , −∑ j =1 2me J =1 2M J
(
) (
)
(
)
kde první a druhý člen levé strany odpovídají kinetické energii jader a elektronů, ∂2 ∂2 ∂2 ∆J = + + 2 2 2 ∂X J ∂YJ ∂Z J
∆j = a
∂2 ∂2 ∂2 , + + 2 2 2 ∂x j ∂y j ∂z j
a člen třetí reprezentuje interakční energii studované soustavy. V elektrostatickém přiblížení je dán jako součet odpovídajících coulombických příspěvků pro všechny páry jader, elektronů a jader s elektrony navzájem: e2 ZI ZK e2 1 e2 ZI V RJ , rj = . + − ∑ ∑ ∑ 4πε 0 I < K RK − RI 4πε 0 i < k rk − ri 4πε 0 I , k rk − RI
(
)
V uvedeném vzorci je Z I protonové číslo I-tého jádra a e elementární elektrický náboj.
131
Řešení výše uvedené mnohočásticové Schrödingerovy rovnice je obecně velmi obtížné, pro větší molekuly technicky nerealizovatelné. Problém lze však významně zjednodušit, vezmeme-li v úvahu, že hmotnosti jader jsou mnohem, o více než tři řády, větší než hmotnost elektronů. Proto se nedopustíme velké chyby, budeme-li předpokládat, že tento poměr roste nade všechny meze. Prakticky to znamená, že v Schrödingerově rovnici položíme M J → +∞ a dostaneme tak rovnici novou
n 2 ∆ j + V RJ , rj −∑ j =1 2me
(
) ψ ( R , r ) = W ( R ) ψ ( R , r ) , J
j
J
J
j
v níž se vliv jader omezuje na parametrickou závislost vlnové funkce ψ (a pochopitelně i energie, kterou nyní označujeme symbolem W ) na polohových vektorech RJ . Získanou rovnici můžeme chápat jako rovnici pro vlastní stavy a energie elektronového subsystému při zadané konfiguraci jader. V energii W jsou zahrnuty jak elektrostatické interakce jader, tak i vliv elektronového oblaku na jaderný subsystém. Můžeme ji proto chápat jako efektivní interakční energii jader. Pak je ovšem možno např. hledat stacionární stavy jaderného subsystému jako řešení stacionární Schrödingerovy rovnice psané ve tvaru 2 N ∆ J + W RJ Ψ RJ = E Ψ RJ . −∑ J =1 2M J
( ) ( )
( )
Časový vývoj soustavy jader můžeme v uvedeném přiblížení popsat pomocí nestacionární Schrödingerovy rovnice
i
(
∂Ψ RJ , t ∂t
) = −
N
2
∑ 2M J =1
∆ J + W RJ Ψ RJ , t ,
( ) (
J
)
nebo dokonce klasicky, např. pomocí Newtonových pohybových rovnic d 2 RK MK = −∇ KW ( RJ ), K = 1,..., N . dt 2 Vzhledem k vysoké hmotnosti jader je totiž mnohdy přijatelná pro popis jejich pohybu i klasická aproximace. To ovšem značně zjednodušuje řešení problému dynamiky jaderného subsystému, neboť řešení klasických pohybových rovnic je vždy mnohem jednodušší než řešení odpovídající nestacionární Schrödingerovy rovnice.
POZNÁMKA V rámci Bornovy-Oppenheimerovy aproximace je oddělen pohyb lehkých elektronů od pohybu mnohem těžších jader. Studium molekul (či atomů) je takto rozděleno do dvou kroků: 1) získání efektivní interakční energie jader
( )
W RJ ,
tzv. nadplochy potenciální energie, 2) její následné
užití ve výpočtech struktury a dynamiky jaderného subsystému. I po provedení všech výše uvedených aproximací je zejména první krok velmi obtížně realizovatelný. Tvoří obsah moderního, velmi bouřlivě se rozvíjejícího oboru - kvantové chemie 132
[2]. Oba kroky pak vyžadují, zejména v případě soustav s mnoha elektrony a jádry (větší atomy a molekuly), užití pokročilých metod numerické matematiky a ty nejvýkonnější počítače. LITERATURA
[1] [2]
BORN, M. und OPPENHEIMER, R. Annalen der Physik, 1927, Bd. 84, S. 457. POLÁK, R. a ZAHRADNÍK, R. Kvantová chemie, 1. vyd. Praha/Bratislava: SNTL/Alfa, 1985. 466 s. ISBN 04-621-85.
4.10.5 NESTACIONÁRNÍ PORUCHOVÁ TEORIE V této kapitole budeme důsledně používat braketovou symboliku.
ÚVOD Nestacionární poruchová teorie, původně formulovaná P. Dirakem [1], [2], je přibližnou metodou
pro řešení nestacionární Schrödingerovy rovnice pro systémy, jejichž Hamiltonův operátor je možno psát ve tvaru
ˆ =H ˆ +H ˆ , H 0 P ˆ kde operátor H P tvoří v jistém smyslu velmi malý příspěvek (poruchu) k dominantnímu členu
ˆ . ˆ ˆ H 0 Abychom tento fakt zdůraznili, budeme níže psát H P = ε H P ', kde ε je malé kladné reálné číslo. Nestacionární poruchová teorie se obvykle používá k výpočtu pravděpodobnosti přechodu systému ∧
z jistého vlastního stavu ψ r 0
neporušeného hamiltoniánu H 0 do jiného vlastního stavu ψ s 0 , je-li systém vystaven během časového intervalu (t0 , t1 ) působení malé a obecně časově závislé
ˆ poruchy H P (t ). Změnu stavu systému obvykle označujeme jako kvantový přechod.
PŘIBLIŽNÉ ŘEŠENÍ NESTACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Poruchovou metodu pro řešení nestacionární Schrödingerovy rovnice si ilustrujeme na příkladu ˆ systému, jehož neporušený hamiltonián H 0 má nedegenerované a čistě diskrétní spektrum. Platí tedy ˆ ψ = E ψ , n = 1, 2, ... , H 0
n0
n0
n0
kde normalizované vlnové funkce ψ n 0 , ψ m 0 ψ n 0 = δ mn , tvoří bázi na prostoru stavů studovaného systému. Časový vývoj libovolné vlnové funkce ϕ (t ) rovnice
je dán řešením nestacionární Schrödingerovy
∧ ∂ϕ ∧ + H ε H . 0 P' ϕ = i ∂t
133
Studujeme-li speciálně přechody mezi vlastními stavy neporušeného hamiltoniánu, musíme doplnit počáteční podmínku ve tvaru ϕ (t0 ) = ψ r 0 . Řešení Schrödingerovy rovnice budeme hledat ve tvaru poruchové řady +∞
ϕ = ∑ ε k ϕk , k =0
jejíž členy splňují počáteční podmínky ϕ0 (t0 ) = ψ r 0 a ϕ k (t0 ) = 0 pro k ≥ 1. Vzhledem k technické náročnosti výpočtů se spokojíme s přiblížením prvního řádu
ϕ ≈ ϕ0 + ε ϕ1 . Podrobné řešení problému je možno najít na jiném místě. Zde shrňme pouze základní výsledky: i
ϕ 0 (t ) = exp − Er ( t − t0 ) ψ r 0 , +∞
ε ϕ1 (t ) = ∑ cn(1) (t ) ψ n 0 , n =1
kde pro koeficienty druhého rozvoje můžeme psát (1) n
c
t
i i ∧ = − exp − En ( t − t0 ) ∫ exp ( En − Er )( t '− t0 ) H P( nr ) (t ') dt ', ( nr ) H P (t ') = ψ n 0 H P (t ') ψ r 0 . t0 i
PRAVDĚPODOBNOST PŘECHODU Pravděpodobnost nalezení systému, jehož stav je v čase t1 popsán vlnovou funkcí +∞
ϕ (t1 ) = ∑ cn (t1 ) ψ n 0 ,
ˆ v s-tém vlastním stavu neporušeného hamiltoniánu H 0 je rovna kvadrátu absolutní hodnoty koeficientu cs (t1 ). n =1
Splňuje-li navíc vlnová funkce ϕ
výše uvedenou počáteční podmínku, ϕ (t0 ) = ψ r 0 , udává
| cs (t1 ) |2 pravděpodobnost přechodu systému ze stavu ψ r 0
do stavu ψ s 0 v důsledku poruchy
∧
H P působící v časech t0 až t1. (1) V prvním řádu poruchové teorie pokládáme cs ≈ cs , a proto pro zmíněnou pravděpodobnost přechodu můžeme psát
134
Psr ( t1 , t0 ) ≈
1 2
2
t1
∧ i − − exp E E t H ϕ P (t ) ϕ r dt . ( ) s r s ∫t 0
POZNÁMKA Nejčastějšími konkrétními aplikacemi nestacionární poruchové metody jsou výpočty atomových a molekulárních absorpčních a emisních spekter a studium vzájemných srážek atomů, molekul a iontů a jejich srážek s elementárními částicemi (zpravidla s elektronem). Velký význam má nestacionární poruchová metoda v kvantové teorii pole, kde je úspěšně užívána ke studiu srážek a vzájemných přeměn elementárních částic. LITERATURA
[1] [2]
DIRAC, PAM. Proceedings of the Royal Society of London, 1926, vol. A112, p. 661. DIRAC, PAM. Proceedings of the Royal Society of London, 1927, vol. A114, p. 243.
4.10.5 NESTACIONÁRNÍ PORUCHOVÁ TEORIE V této kapitole budeme důsledně používat braketovou symboliku.
ÚVOD Nestacionární poruchová teorie, původně formulovaná P. Dirakem [1], [2], je přibližnou metodou
pro řešení nestacionární Schrödingerovy rovnice pro systémy, jejichž Hamiltonův operátor je možno psát ve tvaru
ˆ =H ˆ +H ˆ , H 0 P ˆ kde operátor H P tvoří v jistém smyslu velmi malý příspěvek (poruchu) k dominantnímu členu
ˆ . ˆ ˆ H 0 Abychom tento fakt zdůraznili, budeme níže psát H P = ε H P ', kde ε je malé kladné reálné číslo. Nestacionární poruchová teorie se obvykle používá k výpočtu pravděpodobnosti přechodu systému ∧
z jistého vlastního stavu ψ r 0
neporušeného hamiltoniánu H 0 do jiného vlastního stavu ψ s 0 , je-li systém vystaven během časového intervalu (t0 , t1 ) působení malé a obecně časově závislé
ˆ poruchy H P (t ). Změnu stavu systému obvykle označujeme jako kvantový přechod.
PŘIBLIŽNÉ ŘEŠENÍ NESTACIONÁRNÍ SCHRÖDINGEROVY ROVNICE Poruchovou metodu pro řešení nestacionární Schrödingerovy rovnice si ilustrujeme na příkladu ˆ systému, jehož neporušený hamiltonián H 0 má nedegenerované a čistě diskrétní spektrum. Platí tedy 135
ˆ ψ =E ψ , H 0 n0 n0 n0
n = 1, 2, ... ,
kde normalizované vlnové funkce ψ n 0 , ψ m0 ψ n 0 = δ mn , tvoří bázi na prostoru stavů studovaného systému. Časový vývoj libovolné vlnové funkce ϕ (t ) rovnice
je dán řešením nestacionární Schrödingerovy
∧ ∂ϕ ∧ + H ε H . 0 P' ϕ = i ∂t
Studujeme-li speciálně přechody mezi vlastními stavy neporušeného hamiltoniánu, musíme doplnit počáteční podmínku ve tvaru ϕ (t0 ) = ψ r 0 . Řešení Schrödingerovy rovnice budeme hledat ve tvaru poruchové řady +∞
ϕ = ∑ ε k ϕk , k =0
jejíž členy splňují počáteční podmínky ϕ0 (t0 ) = ψ r 0 a ϕ k (t0 ) = 0 pro k ≥ 1. Vzhledem k technické náročnosti výpočtů se spokojíme s přiblížením prvního řádu
ϕ ≈ ϕ0 + ε ϕ1 . Podrobné řešení problému je možno najít na jiném místě. Zde shrňme pouze základní výsledky: i
ϕ 0 (t ) = exp − Er ( t − t0 ) ψ r 0 , +∞
ε ϕ1 (t ) = ∑ cn(1) (t ) ψ n 0 , n =1
kde pro koeficienty druhého rozvoje můžeme psát t
i i i ∧ cn(1) = − exp − En ( t − t0 ) ∫ exp ( En − Er )( t '− t0 ) H P( nr ) (t ') dt ', ( nr ) H P (t ') = ψ n 0 H P (t ') ψ r 0 . t0
PRAVDĚPODOBNOST PŘECHODU Pravděpodobnost nalezení systému, jehož stav je v čase t1 popsán vlnovou funkcí +∞
ϕ (t1 ) = ∑ cn (t1 ) ψ n 0 ,
ˆ v s-tém vlastním stavu neporušeného hamiltoniánu H 0 je rovna kvadrátu absolutní hodnoty koeficientu cs (t1 ). n =1
136
Splňuje-li navíc vlnová funkce ϕ
výše uvedenou počáteční podmínku, ϕ (t0 ) = ψ r 0 , udává
| cs (t1 ) |2 pravděpodobnost přechodu systému ze stavu ψ r 0
do stavu ψ s 0 v důsledku poruchy
∧
H P působící v časech t0 až t1. (1) V prvním řádu poruchové teorie pokládáme cs ≈ cs , a proto pro zmíněnou pravděpodobnost přechodu můžeme psát
Psr ( t1 , t0 ) ≈
1 2
2
t1
∧ i − − exp E E t H ϕ ( ) s r ∫ s P (t ) ϕ r dt . t0
POZNÁMKA Nejčastějšími konkrétními aplikacemi nestacionární poruchové metody jsou výpočty atomových a molekulárních absorpčních a emisních spekter a studium vzájemných srážek atomů, molekul a iontů a jejich srážek s elementárními částicemi (zpravidla s elektronem). Velký význam má nestacionární poruchová metoda v kvantové teorii pole, kde je úspěšně užívána ke studiu srážek a vzájemných přeměn elementárních částic. LITERATURA
[1] [2]
DIRAC, PAM. Proceedings of the Royal Society of London, 1926, vol. A112, p. 661. DIRAC, PAM. Proceedings of the Royal Society of London, 1927, vol. A114, p. 243.
4.10.6 STACIONÁRNÍ PORUCHOVÁ TEORIE PODROBNÝ VÝPOČET PRO NEDEGENEROVANÉ DISKRÉTNÍ SPEKTRUM Předpokládejme, že je možno hamiltonián systému psát ve tvaru ˆ =H ˆ +H ˆ , H 0
P
ˆ ˆ kde operátor H P je malou poruchou k neporušenému hamiltoniánu H0 . Dále předpokládejme, že ˆ neporušený hamiltonián H 0 má nedegenerované a čistě diskrétní spektrum. Platí tedy ˆ ψ =E ψ , H 0 n0 n0 n0 n = 1,2,… , ψ m0 ψ n 0 = δ mn , kde vlnové funkce ψ n 0 tvoří bázi na prostoru stavů studovaného systému. Předpokládáme ovšem, že neporušenou stacionární Schrödingerovu rovnici umíme řešit. Hodnoty vlastních energií En 0 i odpovídající vlnové funkce ψ n 0
tedy známe.
ˆ ˆ ˆ Porucha H P je v jistém smyslu velmi malá, což vyjádříme vztahem H P = ε H P ', kde ε je malé kladné číslo. Proto její zahrnutí do hamiltoniánu systému změní energetické spektrum i odpovídající
137
vlnové funkce jen velmi málo. Tuto změnu můžeme proto vyjádřit prostřednictvím poruchových řad +∞
En = ∑ ε k Enk , k =0
+∞
ψ n = ∑ ε k ψ nk . k =0
Vlnové funkce ψ n a vlastní energie En přitom splňují „porušenou“ Schrödingerovu rovnici ˆ ψ =E ψ , H n n n nebo podrobněji
(
+∞ +∞ +∞ ˆ + εH ˆ ' ∑ ε k ψ = ∑ ε m E ∑ ε k ψ . H 0 p nk nm nk k =0 m=0 k = 0
)
Po roznásobení a porovnání členů se stejnými mocninami ε dává poslední z uvedených rovnic následující podmínky pro koeficienty hledaných poruchových rozvojů do prvního řádu: ˆ ψ =E ψ , H 0 n0 n0 n0 ˆ ψ = E ψ +E ψ −H ˆ 'ψ . H 0 n1 n0 n1 n1 n0 p n0
ˆ První ze získaných rovnic je stacionární Schrödingerovou rovnicí pro neporušený hamiltonián H 0 , její řešení tedy podle předpokladu známe. Pomocí tohoto řešení nalezneme prostřednictvím druhé z uvedených rovnic korekce prvního řádu En1 a ψ n1 a pomocí dalších, zde explicitně neuvedených rovnic, i korekce vyšší. Teoreticky takto můžeme získat odpovídající korekce libovolného řádu a jejich dosazením do výše uvedených poruchových řad i přesná řešení porušené Schrödingerovy rovnice. Nalezení poruchových příspěvků vyšších řádů je však často technicky velmi komplikovaným problémem. Zpravidla se proto omezujeme jen na několik málo prvních poruchových příspěvků, přičemž předpokládáme, že námi zanedbaný zbytek poruchových řad je opravdu zanedbatelný. Nezřídka se spokojíme s přiblížením prvního řádu En ≈ En 0 + ε En1 , ψ n ≈ ψ n 0 + ε ψ n1 . Ukažme si, jak poruchy prvního řádu najít. Především můžeme bez újmy na obecnosti předpokládat, že vlnové funkce ψ n1
a ψ n0
jsou ortogonální. Pak ovšem platí
ψ n 0 Hˆ 0 ψ n1 = En 0 ψ n 0 ψ n1 = 0 ˆ ′ a z rovnice pro ψ n1 plyne En1 = ψ n 0 H P ψ n 0 , neboli E
n
ˆ ψ . ≈ E n0 + ψ n0 H P n0
Poslední z uvedených formulí tedy poskytuje vyjádření vlastní energie porušeného hamiltoniánu ˆ v prvním řádu poruchové teorie. H
138
Proveďme nyní obdobný výpočet pro odpovídající vlnovou funkci. Především můžeme díky ˆ úplnosti systému vlastních funkcí neporušeného hamiltoniánu H 0 psát (viz princip superpozice) (1) (1) ψ n1 = ∑ m ≠ n cmn ψ m0 , kde cmn = ψ m 0 ψ n1 . Vynásobením rovnice pro ψ n1 zleva bra-vektorem
ψ m0
( m ≠ n) pak již ale snadno získáme hledané koeficienty ψ Hˆ ' ψ (1) cmn = m0 P n0 . En 0 − Em 0
4.10.7 NESTACIONÁRNÍ PORUCHOVÁ TEORIE PODROBNÝ VÝPOČET PRO NEDEGENEROVANÉ DISKRÉTNÍ SPEKTRUM Předpokládejme, že je možno hamiltonián systému psát ve tvaru ˆ =H ˆ +H ˆ , H 0
P
ˆ ˆ ˆ ˆ kde operátor H P je jen malou poruchou neporušeného hamiltoniánu H 0 , tj. H P = ε H P ', kde ε ˆ je malé kladné číslo. Dále předpokládejme, že neporušený hamiltonián H 0 má nedegenerované a čistě diskrétní spektrum. Platí tedy ˆ ψ =E ψ , H 0 n0 n0 n0 n = 1,2,… , ψ m0 ψ n 0 = δ mn , kde vlnové funkce ψ n 0 tvoří bázi na stavovém prostoru systému (viz též princip superpozice). Předpokládáme ovšem, že neporušenou stacionární Schrödingerovu rovnici umíme řešit a hodnoty vlastních energií En 0 i odpovídající vlnové funkce ψ n 0
tedy známe.
Časově závislou vlnovou funkci ϕ (t ) , která splňuje nestacionární Schrödingerovu rovnici ∧ ∂ϕ H ϕ =i ∂t a současně vyhovuje i počáteční podmínce ϕ (t0 ) = ψ r 0 , hledáme ve tvaru poruchové řady +∞
ϕ = ∑ ε k ϕk . k =0
Její členy splňují počáteční podmínky ϕ0 (t0 ) = ψ r 0 Dosazením poruchového rozvoje pro ϕ
a ϕ k (t0 ) = 0 pro k ≥ 1.
do nestacionární Schrödingerovy rovnice, v níž ˆ vezmeme v úvahu rozklad hamiltoniánu systému na neporušenou část H 0 a malou poruchu ˆ =εH ˆ ', H P P získáme 139
∧ ∂ +∞ k ∧ +∞ k + = H ε H ' ε ϕ i P 0 ∑ ε ϕk . ∑ k ∂t k = 0 k =0
Po roznásobení a porovnání členů se stejnými mocninami ε dává poslední z uvedených rovnic následující podmínky pro hledané funkce ϕ k ∧
H0 ϕ0 = i ∧
∧
∂ ϕ0 ∂t
H 0 ϕ1 + H P ' ϕ 0 = i
, ∂ ϕ1 ∂t
,
kde jsme se pro jednoduchost omezili pouze na členy nultého a prvního řádu. První z uvedených rovnic odpovídá neporušené nestacionární Schrödingerově rovnici. Vezmeme-li v úvahu počáteční podmínku ϕ0 (t0 ) = ψ r 0 , můžeme pro její řešení psát (viz též obecné řešení nestacionární Schrödingerovy rovnice) i
ϕ 0 (t ) = exp − Er (t − t0 ) ψ r 0 . Výše jsme požadovali, aby vlnové funkce ψ n 0 funkci ϕ1
tvořily bázi na stavovém prostoru systému. Pro
můžeme proto psát +∞
ε ϕ1 (t ) = ∑ cn(1) (t ) ψ n 0 n =1
a po dosazení do rovnice pro ϕ1 +∞
∑c n =1
(1) n
En 0 ψ n 0
ˆ ˆ obdržíme následně, využijeme-li současně H P = ε H P ', +∞ dc (1) i ∧ + exp − Es (t − t0 ) H P ψ r 0 = i ∑ n ψ n 0 . n =1 dt
Vynásobíme-li tuto rovnici zleva bra-vektorem ψ k 0 , k = 1,2, …, a uvědomíme-li si, že vlastní vlnové funkce neporušeného hamiltoniánu jsou ortogonální a podle předpokladu normované k (1) jednotce, získáme soustavu nezávislých diferenciálních rovnic pro zatím neznámé koeficienty ck
dck(1) i i − ck(1) Ek 0 = exp − Es (t − t0 ) H P( kr ) , dt ∧
( kr ) kde H P = ψ k 0 H P ψ r 0 . (1) Tyto rovnice řešíme standardním způsobem. Vezmeme-li navíc v úvahu fakt, že koeficienty ck musí splňovat počáteční podmínku
140
+∞
ε ϕ1 (t0 ) ≡ ∑ cn(1) (t0 ) ψ n 0 = 0 n =1
a vzhledem k ortogonalitě ket-vektorů ψ n 0
(pozn.) i ck(1) (t0 ) = 0
pro libovolný index k, můžeme pro ně psát (1) n
c
t
i i = − exp − En ( t − t0 ) ∫ exp ( En − Er )( t '− t0 ) H P( nr ) (t ') dt '. t0 i
standardním způsobem Uvedené rovnice jsou lineárními obyčejnými diferenciálními rovnicemi prvního řádu. O způsobu jejího řešení se může čtenář poučit např. v REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 618-621. ()
Vynásobíme-li rovnost
ψk 0
∑
+∞
c (t0 ) ψ n 0
(1) n =1 n
∑ =∑
+∞ (1) n =1 n
c (t0 ) ψ n 0 = 0
+∞
zleva bra-vektorem ψ k 0 , získáme
c (t0 ) ψ k 0 ψ n 0 = ∑ n =1 cn(1) (t0 ) δkn = ck(1) (t0 ) = 0,
(1) n =1 n
+∞
a to pro libovolné k.
5 KVANTOVÁ TEORIE POLE Kvantová teorie pole je univerzální teorií popisující chování elementárních částic a jejich vzájemné
interakce. Částice i nositelé fyzikálních interakcí jsou v rámci této teorie považovány za excitace jim přiřazených kvantových polí. Jednotlivé částice jakožto excitace kvantového pole se mohou navzájem přeměňovat, vznikat i zanikat.
V rámci kvantové teorie pole jsou s vysokou přesností popsány základní fyzikální interakce. Speciálními případy jsou kvantová elektrodynamika – kvantová teorie elektromagnetických interakcí – a kvantová chromodynamika – teorie silných interakcí. Ve spojení s teorií kalibračních polí poskytla kvantová teorie pole prostředek k formulování sjednocené teorie všech interakcí. Byla vytvořena a experimentálně potvrzena kvantová teorie elektroslabých interakcí sjednocující popis elektromagnetických jevů a jevů, za něž je zodpovědná slabá interakce. V současné době je rozpracovávána obecnější teorie sjednocující popis elektromagnetických, slabých i silných interakcí. Konečným cílem je pak vytvoření jednotné teorie, která by kromě výše uvedených zahrnovala i interakci gravitační. Vážným problémem kvantové teorie pole je, že ve vyšších řádech poruchových výpočtů diverguje a poskytuje jen nekonečné výsledky. Naštěstí existuje procedura, jak tato nekonečna z teorie 141
odstranit. Ta pak poskytuje data, která jsou v dokonalém souladu s experimentem. Odstraňování nekonečných veličin z kvantově-polních výpočtů je známo jako teorie renormalizace. LITERATURA
[1]
FORMÁNEK, J. Úvod do relativistické kvantové mechaniky a kvantové teorie pole 1, 2. 1. vyd. Praha: Karolinum, 2000. 932s. ISBN 80-246-0063-3. … a literatura tam citovaná.
6. MATEMATICKÉ DODATKY 6.1 Separace promìnných 6.2 Fourierova transformace 6.3 Pravdìpodobnost 6.4 Hilbertùv prostor 6.5 Operátory na HP 6.6 Vlastní hodnoty a vektory samosdružených operátorù 6.7 Algebraické operace s operátory na Hilbertových prostorech 6.8 Permutace
6.1 METODA SEPARACE PROMĚNNÝCH Metoda separace proměnných je metodou řešení parciálních diferenciálních rovnic, které jsou v rámci této metody převáděny na matematicky snadněji řešitelnou soustavu obyčejných diferenciálních rovnic. Bližší poučení o ní je možno najít např. v příručce Rektorysově [1]. Řešme parciální diferenciální rovnici
ˆ f ( x ,..., x ) = 0, D 1 n ˆ je nějaký diferenciální operátor obsahující parciální derivace podle nezávislých kde D proměnných x1 ,..., xn . Ve fyzikálních aplikacích bývá obvykle n = 2 nebo n = 3 a nezávislé
proměnné odpovídají souřadnicím (ne vždy nutně kartézským) bodové částice. Řešená parciální ˆ ˆ ˆ je diferenciální rovnice je pak zpravidla stacionární Schrödingerovou rovnicí a D = H − E , kde H Hamiltonův operátor a E energie studovaného systému. Řešení výše uvedené rovnice hledáme ve tvaru f ( x1 ,..., xn ) = f1 ( x1 ) f 2 ( x2 )... f n ( xn ), tedy jako součin n nových funkcí, z nichž každá je funkcí jen jediné reálné proměnné. Očekáváme, že po dosazení speciálního tvaru funkce f do původní rovnice získáme novou rovnici ˆ f (x ) + D ˆ f ( x ) + ... + D ˆ f (x ) = α , D 1
1
1
2
2
2
142
n
n
n
ˆ kde diferenciální operátory D k (k = 1,…,n) již obsahují pouze obyčejné derivace podle proměnné xk a α je nějaká konstanta. Pokud se nám podaří dosáhnout tohoto speciálního tvaru, říkáme, že řešená parciální diferenciální rovnice je v proměnných x1 ,..., xn separovatelná. Nově získanou rovnici je ovšem možno převést na ekvivalentní soustavu n obyčejných diferenciálních rovnic ˆ f (x ) = α , D 1
1
1
1
ˆ f (x ) = α , D 2 2 2 2 …, ˆ f (x ) = α , D n
n
n
n
v nichž nově zavedené konstanty splňují
α1 + α 2 + ... + α n = α . To proto, že pokud např. přiřadíme nezávislým proměnným x2 ,..., xn pevné hodnoty a měníme pouze proměnnou x1 , vidíme ze separované rovnice, kterou můžeme dočasně přepsat do tvaru
ˆ f (x ) = α − D ˆ f ( x ) − ... − D ˆ f ( x ), D 1 1 1 2 2 2 n n n ˆ že výraz D1 f1 ( x1 ) zůstává i při změnách x1 konstantní. Konstantní je totiž pravá strana uvedené
rovnice. Pak ale musí existovat taková konstanta α1 , že ˆ f (x ) = α . D 1 1 1 1
Analogickou úvahu můžeme provést i pro ostatní nezávislé proměnné. Má-li být ovšem splněna původní rovnice, nemohou být konstanty α1 ,...,α n libovolné. Musí splňovat výše uvedenou vazebnou podmínku α1 + α 2 + ... + α n = α . Při použití metody separace proměnných se během řešení zadané rovnice omezujeme jen na vybrané funkce speciálního tvaru. Není to na újmu obecnosti řešení? Není. Je možno například ukázat, že libovolné fyzikálně přijatelné řešení Schrödingerovy rovnice lze napsat jako lineární kombinaci takto získaných speciálních řešení. LITERATURA
[1]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 901.
6.2 FOURIEROVA TRANSFORMACE Níže podáváme jen stručný výklad základních pojmů a vět. Podrobnosti může čtenář nalézt např. v příručce Rektorysově [1].
DEFINICE Nechť f :
n
→
je v absolutní hodnotě integrovatelná funkce, 143
∫
f ( x1 ,..., xn ) dx1...dxn < +∞.
n
Potom funkci f :
n
→ , která je definována předpisem
1
f (k1 ,..., kn ) ≡
( 2π )
n/2
∫
n
n f ( x1 ,..., xn ) exp i ∑ xm km dx1...dxn , m =1
nazýváme Fourierovou transformací funkce f. A funkci f : f (k1 ,..., kn ) ≡
1 (2π ) n / 2
∫
n
n
→ ,
n f ( x1 ,..., xn ) exp −i ∑ xm km dx1...dxn , m =1
nazýváme inverzní Fourierovou transformací funkce f.
POZNÁMKA Fourierova transformace přiřazuje každé v absolutní hodnotě integrovatelné funkci f novou funkci f . Označíme-li množinu všech v absolutní hodnotě integrovatelných funkcí na n symbolem L1 ( n ) , G : L1 ( n ) → H, můžeme říci, že zmíněný předpis definuje zobrazení kde H je n L . množina všech funkcí, které můžeme získat Fourierovou transformací nějaké funkce z 1 ( ) n L . Pak ovšem můžeme ve zkratce psát f = G ( f ). Funkce f však nemusí být obecně z 1 ( ) n G :L → H -1 , Obdobně definuje předpis pro inverzní Fourierovu transformaci zobrazení −1 1 ( ) n L . jehož pomocí můžeme psát f = G−1 ( f ). Ani funkce f nemusí být obecně z 1 ( ) Všimněte si, že obě zobrazení G i G−1 jsou lineární.
VĚTA (O FOURIEROVĚ TRANSFORMACI) Budiž f spojitá funkce z
L1 (
n
)
L taková, že její Fourierův obraz f je rovněž z 1 (
n
).
Pak
platí
G (G−1 ( f )) = G−1 (G ( f )) = f .
POZNÁMKA n , V kvantové teorii nepracujeme zpravidla s funkcemi v absolutní hodnotě integrovatelnými na n n L , . tedy z 1 ( ) ale s funkcemi, jejichž absolutní hodnota je kvadraticky integrovatelná na n L Obecně však taková funkce nemusí do 1 ( ) patřit. Proto použití věty o Fourierově transformaci na kvadraticky integrovatelné funkce vyžaduje jistou obezřetnost.
144
PŘÍKLAD Jako ilustraci výše nastíněných obecných tvrzení nalezněme inverzní Fourierovu transformaci funkce ( x − x0 )2 f ( x) = A exp − exp ( ik0 x ) , α 2 (A, α, x0 a k0 jsou konstanty, α > 0), kterou reprezentujeme v kvantové mechanice tzv. Gaussův vlnový balík. Podle definice máme 1 f (k ) ≡ 2π
+∞
∫
f ( x) exp ( −ik x ) dx
−∞
a po dosazení A f (k ) ≡ 2π
( x − x0 )2 ∫ exp − α 2 exp {−i ( k − k0 ) x} dx −∞ . +∞
Celý výpočet zjednoduší vhodná substituce. Proveďme ji proto a položme z = ( x − x0 ) / α . Pak můžeme psát +∞
A α exp {−i ( k − k0 ) x0 } ∫ exp {− z 2 } exp {−iα ( k − k0 ) z} dz, 2π −∞
f (k ) ≡
a ke konečnému vyřešení úlohy je tedy nutno vypočítat integrál I (κ ) ≡
+∞
∫ exp ( − z ) exp ( −iκ z ) dz, 2
−∞
v němž jsme zavedli κ ≡ α ( k − k0 ) . Nezbytný výpočet můžeme provést například derivováním podle parametru. Platí totiž +∞
+∞
dI (κ ) ∂ exp ( − z 2 ) exp ( −iκ z ) dz = −i ∫ z exp ( − z 2 ) exp ( −iκ z ) dz = ∫ dκ κ ∂ −∞ −∞ a vzhledem k větě o integrování per partes též +∞
∫ z exp ( − z ) exp ( −iκ z ) dz = 2
−∞
=−
iκ 2
+∞
1
∫ exp ( − z ) exp ( −iκ z ) dz − 2 exp(− z 2
−∞
2
+∞
) exp(−iκ z ) . −∞
Druhý člen na pravé straně poslední rovnosti je zřejmě nulový a pro hledaný integrál získáváme proto diferenciální rovnici
145
dI (κ ) κ = − I (κ ), dκ 2
jejíž řešení (pozn.) je I (κ ) = I 0 exp ( −κ 2 / 4 ) .
I 0 ≡ I (0) = ∫ exp ( − z 2 ) dz +∞
Integrační konstantu
∫
+∞
−∞
−∞
určíme snadno pomocí známého vzorce (viz [2])
exp ( − z 2 ) dz = π .
LITERATURA
[1] [2]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 925-933. REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 481.
()
Z rovnice
dI dκ
= − κ2 I plyne
dI I
= − κ2 d κ a po integrování obou stran dále ln I = − κ4 + C , kde C je integrační 2
( )
I = I 0 exp − κ4 , 2
konstanta. Odtud již okamžitě máme výsledek
v němž jsme zavedli I 0 ≡ exp(C ).
6.3 PRAVDĚPODOBNOST V přírodních i technických vědách se velmi často setkáváme se situací, kdy výsledek experimentu, pozorování či měření není jednoznačný. I když zmíněný experiment opakujeme tak, že všechny kontrolovatelné počáteční podmínky jsou ve všech opakováních stejné, mohou se získané výsledky navzájem lišit. Maximální informaci, kterou můžeme o jednotlivých výsledcích získat, je míra očekávání, že ten či onen výsledek v konkrétním opakování nastane. Níže podáváme zjednodušený výklad pojmů a postupů, které dovolují tuto míru očekávání kvantifikovat. Bližší poučení o problému je možno nalézt například v příručce Rektorysově [1].
STATISTICKÝ EXPERIMENT Experiment s několika možnými výstupy, které nedokážeme jednoznačně předpovědět, nazveme experimentem statistickým. Statistický experiment provádíme opakovaně se stejným systémem, všechny kontrolovatelné počáteční podmínky experimentu jsou v jednotlivých opakováních stejné. O jednotlivých opakováních experimentu budeme hovořit jako o pokusech. O konkrétní sérii pokusů budeme hovořit jako o realizaci statistického experimentu.
RELATIVNÍ ČETNOST, PRAVDĚPODOBNOST Označme N celkový počet pokusů, které jsme v rámci realizace daného statistického experimentu provedli, a N k počet pokusů vedoucích ke k-tému výsledku. Pak poměr N k N nazveme relativní četností k-tého výsledku.
146
Je jasné, že se relativní četnosti daného výsledku mohou pro různé realizace experimentu lišit, zejména v závislosti na různých počtech pokusů N. Proto definujeme veličinu, která již na počtu pokusů nezávisí - pravděpodobnost k-tého výsledku Nk . N →+∞ N
Pk ≡ lim
V uvedené definici pravděpodobnosti mlčky předpokládáme, má-li být korektní, že limita na levé straně rovnosti existuje. Pokud tomu tak je pro každý možný výsledek, nazveme příslušný experiment statisticky regulárním. V opačném případě hovoříme o statisticky neregulárním experimentu. Pravděpodobnost jednotlivých výsledků přibližujeme v konkrétní realizaci statisticky regulárního experimentu s dostatečně vysokým počtem provedených pokusů prostřednictvím relativních četností - Pk ≈ N k N . Věříme, stejně jako v případě jakéhokoliv jiného měření, že dostatečný počet opakování zajistí pouze minimální odchylku relativních četností od limitních pravděpodobností.
ROZDĚLENÍ PRAVDĚPODOBNOSTI, NÁHODNÉ VELIČINY Předpokládejme, že daný statistický experiment má konečný počet, řekněme n, možných výsledků. Uspořádanou n-tici pravděpodobností jednotlivých výsledků statisticky regulárního experimentu [ P1,..., Pn ] nazveme rozdělením pravděpodobnosti. Vzhledem k definici pravděpodobnosti zřejmě platí n
∑P
k
k =1
= 1.
Říkáme proto, že rozdělení [ P1 ,..., Pn ] je normováno k jedničce. Často však bývá výhodné pracovat s pravděpodobnostmi nenormovanými, které se od normovaných liší kladným multiplikativním faktorem. Provádíme-li v rámci daného experimentu měření nějaké veličiny X, může tato v závislosti na výsledku konkrétního pokusu nabývat obecně různých hodnot x1 , ..., xn . O veličině X proto hovoříme jako o veličině náhodné, neboť s různými pravděpodobnostmi nabývá náhodně různých hodnot.
STŘEDNÍ HODNOTA, STŘEDNÍ KVADRATICKÁ FLUKTUACE Pro náhodnou veličinu definujeme její střední hodnotu 1 N →+∞ N
x ≡ lim
N
∑x K =1
K
,
kde N je celkový počet pokusů provedených v konkrétní realizaci daného experimentu a xK hodnota veličiny X naměřená v K-tém pokusu. 147
V konkrétním měření ovšem střední hodnotu x přibližujeme, za předpokladu velkého počtu opakování, vztahem 1 N x ≈ ∑ xK . N K =1 Střední hodnotu veličiny X je však možno získat i jiným způsobem. Stačí si uvědomit, že v celkovém počtu N pokusů se vyskytne první výsledek N1 krát, druhý N 2 krát atd. Proto můžeme
∑
sumu
N
x K =1 K přepsat do tvaru
∑
n k =1
N k xk
a pro střední hodnotu psát
n 1 n Nk N x = ∑ ∑ k k Nlim →+∞ N N →+∞ N k =1 k =1
x = lim
n x = k ∑ Pk xk . k =1
Střední hodnota veličiny X zadává průměrný výsledek, jehož měřením dosáhneme. Konkrétní výsledky získané v konkrétních pokusech (opakováních experimentu) se od této střední hodnoty obecně liší. Míru odlišnosti popisujeme tzv. střední kvadratickou fluktuací
1 N 2 ∆x ≡ lim ∑ ( xK − x ) , N →+∞ N K =1 kterou můžeme, podobně jako střední hodnotu x , počítat pomocí alternativní formule
∆x =
n
∑P (x k =1
k
k
− x) . 2
Tento vzorec je možno dále po snadných úpravách (pozn.) převést do formálně jednoduššího, a proto často používaného tvaru
∆x ≡ x 2 − x 2 ,
x 2 ≡ ∑ k =1 Pk xk 2 . n
kde veličiny X.
Střední kvadratická fluktuace je vhodnou veličinou pro odhad chyby měření
LITERATURA
[1]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 1025-1056.
() n
∑P (x k =1
k
k
n
n
n
n
n
n
k =1
k =1
k =1
k =1
k =1
k =1
− x ) = ∑ Pk ( xk 2 − 2 xk x + x 2 ) = ∑ Pk xk 2 − 2 x ∑ Pk xk + x 2 ∑ Pk = ∑ Pk xk 2 − 2 x x + x 2 = ∑ Pk xk 2 −x 2 . 2
6.4 HILBERTŮV PROSTOR Hilbertův prostor je úplný lineární vektorový prostor se skalárním součinem.
148
Níže podáváme stručný výklad některých použitých pojmů. Bližší poučení lze nalézt např. v učebnici Formánkově [1].
LINEÁRNÍ VEKTOROVÝ PROSTOR (Komplexní) lineární vektorový prostor (LVP) je libovolná množina V, na které jsou definovány operace sčítání a násobení (komplexním) číslem splňující níže uvedené axiomy. Prvky LVP nazýváme vektory a v souladu s konvencí přijatou v kvantové teorii je budeme označovat symboly a , b ap. Axiomy LVP
• • •
a + b = b + a , a +( b + c )=( a + b )+ c ,
∃ o ∈V ∀ a ∈V :
a + o = o + a = a ,
•
α ( a + b ) =α a +α b ,
•
(α + β ) a = α
•
α ( β a ) = (αβ ) a ,
•
1a = a
a +β a ,
(⇔ 0 a
= o ).
se obvykle nazývá nulovým vektorem. Násobek vektoru číslem, α a , budeme někdy označovat alternativním symbolem α a . Podobně i pro součet a + b užijeme občas ekvivalentní zápis a + b .
Vektor o
Podle výše řečeného tedy existuje zobrazení V × V → V, které každé dvojici vektorů a a b z V přiřazuje jejich součet a + b , a zobrazení × V → V, které komplexnímu číslu α a vektoru a přiřazuje násobek α a . Tyto operace musí splňovat výše uvedenou soustavu axiomů platných pro všechny vektory z V a všechna komplexní čísla.
SKALÁRNÍ SOUČIN Pod skalárním součinem na LVP V rozumíme zobrazení V×V → , které libovolné dvojici vektorů z V přiřazuje (komplexní) číslo a splňuje níže uvedenou soustavu axiomů. Skalární součin vektorů a a b budeme označovat v souladu se zvyklostmi zažitými v kvantové teorii symbolem
ab .
Axiomy skalárního součinu
149
•
a b = b a *,
•
a βb = β a b ,
•
a b+c = a b + a c ,
•
a a ≥ 0;
a a =0⇔ a = o .
Hvězdičkou označujeme v prvním axiomu komplexní sdružení. Pomocí skalárního součinu definujeme dále na V tzv. Eukleidovskou normu vektoru
a =
aa.
ÚPLNOST LVP SE SKALÁRNÍM SOUČINEM Z matematické analýzy víme, že každá posloupnost {α n } reálných (či komplexních) čísel splňující tzv. Cauchyovu podmínku
∀ε > 0 ∃n0 ∈
: m, n > n0 ⇒ α m − α n < ε
má limitu, je konvergentní. Na obecném LVP se skalárním součinem však posloupnost vektorů { an } splňujících Cauchyovu podmínku ∀ε > 0 ∃n0 ∈
: m, n > n0 ⇒ am − an < ε
konvergentní nutně být nemusí. Její eventuální limita může např. ležet mimo prostor V. LVP se skalárním součinem, jehož každá posloupnost vektorů splňujících Cauchyovu podmínku je konvergentní, a má tedy limitu z tohoto prostoru, nazveme úplným.
SEPARABILITA Hilbertovy prostory, které hrají významnou roli v kvantové teorii, jsou separabilní. Osvětleme proto stručně i tento pojem. Obecná definice separability Hilbertova prostoru je komplikovaná a zcela překračuje rámec této encyklopedie. Pro naše účely postačí, budeme-li pod separabilním Hilbertovým prostorem rozumět takový Hilbertův prostor V, na němž existuje
nejvýše spočetná množina vektorů lineární kombinaci
en
taková, že libovolný vektor
a = ∑ n α n en . 150
a
můžeme psát jako
V případě nekonečněrozměrných prostorů přechází suma na levé straně na nekonečnou řadu +∞
a = ∑ α n en , n =1
jejíž konvergenci vyšetřujeme pomocí výše zavedené Eukleidovské normy. LITERATURA
[1]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 712-721.
6.5 OPERÁTORY NA HILBERTOVĚ PROSTORU Teorie lineárních operátorů na Hilbertových prostorech tvoří velmi obtížnou matematickou disciplínu. Proto níže uvádíme pouze některé základní pojmy. Bližší poučení je možno nalézt ve specializované literatuře nebo též v monografii Formánkově [1].
LINEÁRNÍ OPERÁTORY ˆ na Hilbertově prostoru V nazveme zobrazení z tohoto prostoru do sebe sama, Operátorem A
ˆ : V → V. A Množinu všech vektorů z V, pro které je toto zobrazení definováno, nazveme definičním oborem ˆ Vektor přiřazený tímto zobrazením vektoru a budeme označovat symbolem operátoru A. ˆ Aa
ˆ nebo též A a .
Splňuje-li navíc toto zobrazení pro libovolnou dvojici vektorů
a
a b
a libovolné komplexní
číslo α relace ˆ ( a + b )=A ˆ a +A ˆ b , A ˆ (α a ) = α A ˆ a , A ˆ lineárním. nazveme operátor A
U lineárních operátorů navíc vyžadujeme, aby jejich definiční obor byl lineárním podprostorem prostoru V. Musí být tedy uzavřený vzhledem ke sčítání vektorů a násobení vektorů komplexním číslem.
NEOMEZENÉ OPERÁTORY Skalární součin a b
zadává na Hilbertově prostoru normu vektoru:
a =
Operátor, pro nějž existuje taková kladná konstanta K, že pro každý vektor oboru platí 151
aa.
a
z definičního
ˆ a ≤K a , A nazveme operátorem omezeným. Operátor, který není omezený, nazveme operátorem neomezeným. Neomezené operátory nejsou zpravidla definovány na celém prostoru V. Vždy proto musíme dbát na jejich definiční obor. Jednou z velkých matematických komplikací kvantové teorie je, že operátory přiřazené dynamickým proměnným jsou až na řídké výjimky neomezené. Omezené operátory je naopak možno vždy definovat tak, aby jejich definiční obor splýval s V.
HUSTÉ PODMNOŽINY HILBERTOVA PROSTORU ˆ Má-li operátor A, jehož definiční obor nesplývá s celým Hilbertovým prostorem V, pokrývat V dostatečně účinně, musí jeho definiční obor vytvářet na tomto prostoru dostatečně hustou síť. ˆ byl hustou podmnožinou Hilbertova prostoru Požadujeme proto, aby definiční obor operátoru A V.
Pod hustou podmnožinou přitom rozumíme takovou množinu M ⊂ V, že pro libovolný vektor a ∈ V a libovolné kladné číslo ε existuje vektor c ∈ M takový, že jeho vzdálenost od a je a − c < ε. menší než zvolené ε, tj.
SDRUŽENÝ OPERÁTOR ˆ a A ˆ * jsou lineární operátory definované na V. Nechť navíc pro libovolnou dvojici Nechť A vektorů a a b z nějaké husté podmnožiny V platí ˆa = A ˆ *b a . bA
ˆ ˆ * nazveme sdruženým operátorem k operátoru A. Pak operátor A
SAMOSDRUŽENÉ OPERÁTORY ˆ ˆ* Je-li operátor roven svému sdruženému, A = A , nazveme jej samosdruženým. ˆ =A ˆ * neznamená pouze, že je na nějaké husté podmnožině V splněn Pozor však! Rovnost A ˆa = A ˆb a . bA ˆ *. ˆ a A vztah Navíc si musí být navzájem rovny i definiční obory operátorů A
Operátor splňující pouze podmínku
ˆa = A ˆb a bA
se nazývá operátorem symetrickým.
V základních kursech kvantové teorie se obvykle nebere zřetel na definiční obory operátorů, a proto jsou často symetrické a samosdružené operátory zaměňovány. To ovšem není zcela korektní, neboť pro neomezené operátory samosdruženost sice implikuje symetrii, opak ale obecně neplatí.
152
Protože vzhledem k symetrii samosdruženého operátoru není významné, zda stojí u prvního či ˆ druhého činitele skalárního součinu, píšeme obvykle skalární součin pro samosdružený operátor A ˆ ve tvaru b A a ,
ˆ a ≡ bA ˆa = A ˆb a . bA
LITERATURA
[1]
FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 722-753.
6.6 VLASTNÍ HODNOTY A VLASTNÍ VEKTORY SAMOSDRUŽENÝCH OPERÁTORŮ Část teorie lineárních operátorů na Hilbertových prostorech zabývající se jejich vlastními vektory a vlastními hodnotami se obvykle nazývá spektrální analýza operátorů. I pro speciální případ samosdružených operátorů se jedná o velice komplikovanou matematickou teorii, z níž si můžeme nastínit pouze základní pojmy a fakta. Bližší poučení je možno nalézt ve specializované literatuře (viz např. [1]) či v monografii Formánkově [2].
VLASTNÍ HODNOTY A VLASTNÍ VEKTORY ˆ je lineární operátor na Hilbertově prostoru V. Nenulový vektor Nechť A
a
z tohoto prostoru
ˆ odpovídajícím vlastní hodnotě (vlastnímu číslu) α, jenazveme vlastním vektorem operátoru A
li splněna podmínka ˆ a =α a . A Množinu všech vlastních hodnot nazýváme pak obvykle též spektrem vlastních hodnot operátoru ˆ A. Vlastními vektory operátorů reprezentujících v kvantové mechanice dynamické proměnné studovaného systému jsou speciální vlnové funkce. Obvykle je nazýváme funkcemi vlastními. ˆ Lineární kombinace dvou vlastních vektorů, které odpovídají téže vlastní hodnotě operátoru A, je zřejmě rovněž vlastním vektorem odpovídajícím stejné vlastní hodnotě. Proto množina všech vlastních vektorů odpovídajících téže vlastní hodnotě, k níž přidáme nulový vektor, tvoří na V lineární podprostor.
153
VLASTNÍ
HODNOTY
A
VLASTNÍ
VEKTORY
SAMOSDRUŽENÝCH
OPERÁTORŮ Vlastní hodnoty samosdružených operátorů jsou reálné. ˆ a odpovídající vlastní hodnotu Pro (nenulový) vlastní vektor a samosdruženého operátoru A α totiž platí ˆ a = a αa = α a a ˆ a a = αa a = α * a a . a A A a ˆ ˆ ˆ platí ale též a Aa = Aa a , a tedy i α = α *. Vzhledem k samosdruženosti operátoru A
Vlastní vektory samosdruženého operátoru, které odpovídají různým vlastním hodnotám, jsou navzájem ortogonální. Jsou-li totiž a psát
a b
vlastní vektory příslušné k různým vlastním hodnotám α a β, můžeme ˆ a = b αa = α b a , bA ˆ a = βb a = β * b a = β b a . Ab
Dále však platí ˆa = A ˆb a , bA a proto též
α b a =β b a . Vlastní hodnoty α a β jsou ale podle předpokladu různé, proto musí nutně platit
b a = 0. LITERATURA
[1] [2]
BLANK, J., EXNER, P. a HAVLÍČEK, M. Lineární operátory v kvantové fyzice. 1. vyd. Praha: Karolinum, 1993. 678 s. ISBN 80-7066-586-6. FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 722-753.
154
6.7 ALGEBRAICKÉ OPERACE S OPERÁTORY NA HILBERTOVÝCH PROSTORECH SČÍTÁNÍ OPERÁTORŮ ˆ a B ˆ jsou dva operátory na Hilbertově prostoru V s definičními obory DA a DB . Nechť A
Součtem těchto operátorů, který budeme označovat symbolem
ˆ + B, ˆ A
rozumíme operátor s
definičním oborem DA + B = D A ∩ DB splňující pro každý vektor a ∈ V
( Aˆ + Bˆ ) a
ˆ a +B ˆ a . ≡A
Všimněme si rozdílu v interpretaci symbolu „+“ na levé a pravé straně uvedené definiční rovnosti. ˆ +B ˆ označuje sčítání na množině operátorů definovaných na Hilbertově prostoru Zatímco výraz A ˆ ˆ V, tedy operaci nově zaváděnou, A a + B a je „obyčejný“ součet vektorů z tohoto prostoru. Matematickou indukcí je možno operátorové sčítání rozšířit na libovolný konečný počet sčítanců. Vzhledem k axiomům lineárního vektorového prostoru snadno vidíme, že sčítání operátorů je komutativní i asociativní.
NÁSOBENÍ OPERÁTORU ČÍSLEM ˆ je operátor na Hilbertově prostoru V a α obecně komplexní číslo. Pak α-násobkem Nechť A
ˆ tohoto operátoru, který budeme označovat symbolem α A, rozumíme operátor splňující pro každý
vektor
a ∈ DA (definiční obor operátoru α A ˆ je tedy totožný s definičním oborem operátoru
ˆ A)
(α Aˆ ) a
(
)
ˆ a . ≡α A
Podobně jako výše sčítání je nyní i násobení na levé a pravé straně definiční rovnosti poněkud ˆ působící na Hilbertově prostoru V, odlišné. Zatímco na levé straně násobíme číslem operátor A na straně pravé vektor z tohoto prostoru.
NÁSOBENÍ OPERÁTORŮ ˆ a B ˆ jsou dva operátory na Hilbertově prostoru V s definičními obory DA a DB . Nechť A
ˆˆ Součinem těchto operátorů, který budeme označovat symbolem AB, rozumíme operátor splňující
pro každý vektor a ∈ V, pro nějž jsou požadované operace definovány, 155
ˆ ˆ) a ( AB
(
)
ˆ B ˆ a . ≡A
Působení součinu dvou operátorů není tedy ničím jiným než výsledkem postupné aplikace jednotlivých operátorů, a to v pořadí, v jakém jsou v součinu zapsány. Definiční obor operátoru ˆ ˆ ˆ je proto zřejmě dán následujícím předpisem: D AB = a ∈ D B : B a ∈ D A . AB
{
}
Operátory na Hilbertově prostoru V jsou podle definice zobrazeními tohoto prostoru do sebe sama. Násobení operátorů pak ovšem odpovídá skládání těchto zobrazení. Matematickou indukcí je možno operátorové násobení rozšířit na libovolný konečný počet činitelů tak, že bude asociativní. Násobení operátorů však není komutativní, obecně záleží na pořadí činitelů v operátorovém součinu. Je ovšem distributivní vůči operátorovému sčítání.
KOMUTÁTOR A ANTIKOMUTÁTOR OPERÁTORŮ ˆ ˆ ˆ ˆ a B, Komutátor operátorů A zpravidla označovaný symbolem [A, B], je operátor definovaný
předpisem ˆ B] ˆ ˆ − BA. ˆ ≡ AB ˆˆ [A,
V kvantové teorii bývá často užitečný i analogicky definovaný antikomutátor dvou operátorů: ˆ B} ˆ ˆ + BA. ˆ ≡ AB ˆˆ {A,
UMOCŇOVÁNÍ OPERÁTORŮ Pomocí násobení operátorů můžeme přímočaře definovat jejich obecnou mocninu s kladným exponentem
ˆ n ≡ A...A, ˆ ˆ A n− krát
n = 1, 2,...
ˆ −1 a pro operátory, k nimž existuje operátor inverzní A , též mocninu s exponentem záporným
( ) ( )
ˆ −n ≡ A ˆ −1 ... A ˆ −1 , A n − krát
n = 1, 2,... .
Obě definice můžeme ještě dále doplnit velmi přijatelným vztahem ˆ 0 ≡ 1, ˆ A
ˆ kde 1ˆ je operátor identity, tj. 1 a = a pro každé a ∈ V.
156
FUNKCE OPERÁTORU Nechť f(x) je analytická funkce, kterou je možno na okolí x = 0 rozvést do McLaurinovy (viz +∞
f ( x) = ∑ ξ k x k ,
(k ) ˆ je operátor na Hilbertově kde ξ k = f (0) / k !, a nechť A ˆ prostoru V. Pak pod funkcí operátoru f (A) rozumíme
např. [1]) řady
k =0
+∞
ˆ ≡ ξA f (A) ∑ k ˆ k. k =0
Částečné součty uvedené řady je možno bez větších potíží vyčíslit pomocí výše uvedených definic sčítání a umocňování operátorů a násobení operátoru číslem. Konvergenci samotné řady je pak nutno vyšetřovat bodově pro různé vektory z V. Tj. musíme vyšetřovat konvergenci řad typu
∑ (ξ Aˆ +∞
k =0
k
k
)
a ,
kde a ∈ V.
Analogickým způsobem můžeme definovat i funkce více operátorů. Musíme však dávat velký pozor na to, že násobení operátorů není obecně komutativní! LITERATURA
[1] [2]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 565. FORMÁNEK, J. Úvod do kvantové teorie. 1. vyd. Praha: Academia, 1983. 903 s. s. 722-753.
6.8 PERMUTACE Pod permutací P N-prvkové množiny M = {m1 ,..., mN } rozumíme její vzájemně jednoznačné zobrazení na sebe sama, P : M → M.
Chápeme-li tuto množinu jako uspořádanou N-tici prvků, znamená permutace změnu jejich pořadí. Celkový počet permutací, které můžeme pro zadanou N-prvkovou množinu zkonstruovat, je dán, bereme-li v úvahu i triviální permutaci, při níž se pořadí prvků nemění, faktoriálem počtu jejich prvků, N ! ≡ 1.2...N . Speciálním typem permutace je výměna dvou zvolených prvků. Tuto permutaci obvykle nazýváme transpozicí.
Je možno ukázat, že libovolnou permutaci můžeme získat následnou aplikací jistého počtu transpozic. Pochopitelně existuje více (nekonečně mnoho) způsobů, jak zadanou permutaci získat. 157
Proto není počet potřebných transpozic určen jednoznačně. Pro zadanou permutaci P je však jednoznačně určeno, zda tento počet bude dán lichým či sudým číslem. Podle toho přiřazujeme permutaci určité znaménko, které označujeme obvykle symbolem sign(P). Je-li počet transpozic nutných ke konstrukci permutace P lichý, přiřadíme jí znaménko sign(P) = -1 a hovoříme o ní jako o permutaci liché, je-li naopak sudý, pokládáme sign(P) = +1 a permutaci nazveme sudou. LITERATURA
[1]
REKTORYS, K., aj. Přehled užité matematiky. 4. vyd. Praha: SNTL, 1981. 1139 s. s. 48-50.
158
ATOMOVÁ FYZIKA Tento obor fyziky se zabývá studiem a popisem atomů (atomistika). Původně byl zaměřen jak na oblast atomového obalu, který je tvořen elektrony (elektronový obal atomu), tak na atomové jádro. Dnes se pod tento obor zahrnuje především studium a popis elektronového obalu, zatímco strukturou a přeměnami atomového jádra se zabývá jaderná fyzika (fyzika atomového jádra, nukleonika). Poznatky atomové fyziky využívají též jiné vědecké obory, jako je fyzika pevných látek, chemie aj. Znalost fyziky elektronového obalu je východiskem pro objasnění vzniku vazeb mezi atomy a uplatňuje se rovněž při popisu struktury a fyzikálních vlastností látek. Atomy byly původně chápány jako nejmenší částice látky, jež nejsou dále dělitelné. Dnes přesněji říkáme, že atomy nejsou dále chemicky dělitelné. Po objevu vnitřní struktury atomu a jeho jádra víme, že atomy nepředstavují základní částice látky, ale jsou pouze jednou z jejích hierarchických strukturních jednotek. Atomy se skládají z atomového obalu, který je tvořen elektrony, a atomového jádra, které je tvořeno nukleony. Za běžných podmínek představují atomy elektroneutrální systém, záporný elektrický náboj elektronového obalu je kompenzován kladným elektrickým nábojem atomového jádra. Pokud dojde k odtržení jednoho či více elektronů z atomového obalu, hovoříme o ionizaci. Vzniká aniont, při zachycení elektronu naopak vzniká kationt. Existenci atomů předpokládali již Leukippos (460-370 př.n.l.) a Demokritos (500-440 př.n.l.), jejich úvahy ale měly čistě spekulativní charakter, jejich hypotéza tehdy ještě nebyla ověřena experimentem. Atomová teorie vzniká teprve na přelomu 18. a 19. století n.l. LITERATURA
[1] [2] [3] [4] [5] [6] [7] [8] [9] [10]
ÚLEHLA, I., SUK, M., TRKA, Z. Atomy, jádra, částice. 1.vyd. Praha : SNTL, 1990. 500 s. VANOVIČ, J. Všeobecná fyzika 4 : Atómová fyzika. 1.vyd. Bratislava; Praha : Alfa; SNTL, 1980. 456 s. TRKAL, V., Populární přednášky o fyzice 18 – Stavba atomů a molekul. 2.doplněné vyd. Praha : SNTL, 1980. 192 s. DAVYDOV, AS. Kvantová mechanika. Přel. L. Valenta. 1.vyd. Praha : SPN, 1978. 688 s. Přel. z rus. orig.: Kvantovaja mechanika, Moskva : Nauka, 1973. LANDAU, LD., LIFŠIC, JM. Úvod do teoretickej fyziky 2 – Kvantová mechanika. Přel. J. Šebesta., 1.vyd. Bratislava; Moskva : Alfa; MIK, 1982, 360 s. Přel. z rus. orig.: Kratkij kurs teoretičeskoj fyziky 2 – Kvantovaja mechanika. Moskva : Nauka, 1972. MATTHEWS, PT. Populární přednášky o fyzice 27 – Základy kvantové mechaniky. Přel. I. Úlehla, 1.vyd. Praha : SNTL, 1976. 256 s., Přel. z angl. orig.: Introduction to Quantum Mechanics, Maidenhead : Mc GrawHill Publishing Company, 1974. VACÍK, J. Obecná chemie. 1.vyd. Praha : SPN, 1986. 304 s. POLÁK, R., ZAHRADNÍK, R. Kvantová chemie – Základy teorie a aplikace. 1.vyd. Praha : SNTL, 1985. 468 s. PIŠÚT, J., ZAJAC R. O atómoch a kvantování. 1.vyd. Bratislava : Alfa, 1983. 264 s. ČELEDA, J., KUBA, J., Cesta do nitra hmoty. 2.doplněné vyd. Praha : SNTL, 1981. 448 s.
Chemicky dělitelné Tj. nedělitelné chemickými postupy. Těch se přímo účastní pouze elektronový obal atomu. Při jejich použití tak může docházet pouze k odtržení elektronu z atomu. To ale nepovažujeme za proces „dělení“ atomu z toho důvodu, že atom daného chemického prvku je identifikován svým jádrem. Jádro je možné štěpit za použití metod jaderné fyziky. Běžné podmínky Slabá pole, nízké teploty.
159
1. VZNIK A VÝVOJ ATOMOVÉ TEORIE 1.1 Základní chemické zákony 1.2 Daltonova atomová hypotéza 1.3 Thomsonův model atomu 1.3.1 Objev elektronu 1.3.2 Elementární el náboj 1.4 Rutherfordův model atomu 1.4.1 Rutherfordův pokus 1.5 Bohrův model atomu 1.5.1 Objasnění čárového spektra 1.5.2 Franckův - Hertzův pokus 1.6 Sommerfeldův model atomu (relativistický) jemná struktura spekter
1. VZNIK A VÝVOJ ATOMOVÉ TEORIE První atomovou teorii, která vychází z experimentálních poznatků, podal počátkem 19. století J. Dalton. Daltonova atomová teorie představovala revoluční změnu zejména v pohledu na chemické procesy. Později se především fyzikové snažili na základě experimentálních faktů vytvořit modely atomů. První modely, pudinkový model a planetární model, používaly k teoretickému popisu atomu metod klasické fyziky. Protože však tyto modely nedokázaly objasnit nové experimentální skutečnosti, vytvořil Niels Bohr model atomu (Bohrův model atomu), ve kterém významnou roli hraje tzv. kvantovací podmínka, kterou není možno získat ze zákonů klasické fyziky. Tento postup byl později zobecněn v Sommerfeldově kvantové teorii použité ke zpřesnění popisu spektra atomu vodíku (Sommerfeldův model atomu). Bohrův model atomu představuje jedno z východisek kvantové teorie. Dnes se řešení fyzikálních problémů v atomové fyzice bez kvantové teorie neobejde. Nejčastěji se vychází ze Schrödingerovy rovnice (SR) v tzv. elektrostatickém přiblížení, resp. z Pauliho rovnice, ve které je zahrnut dodatečně vliv spinu elektronu. V principu je možné pro přesnější popis přejít k relativistické teorii na bázi Diracovy rovnice (DR) či použít ještě obecnější kvantovou teorii pole, ale v praxi je většinou nezbytné nebo alespoň jednodušší použít přibližných metod, které spočívají v započtení korekcí pomocí poruchové teorie. Přesné řešení SR (i DR) je možné získat pro atom vodíku. Přibližných metod je nutno použít až pro víceelektronové atomy Experimentální poznatky Zejména ze základních chemických zákonů.
160
1.1 ZÁKLADNÍ CHEMICKÉ ZÁKONY Pro zrod atomové teorie vytvořilo předpoklady formulování základních chemických zákonů. Mezi tyto zákony patří: •
Zákon zachování hmotnosti
Hmotnost všech látek do reakce vstupujících je rovna hmotnosti všech reakčních produktů. Poprvé tento zákon formuloval Lomonosov (1748) a později nezávisle na něm Lavoisier (1774). •
Zákon zachování energie
Energii nelze vytvořit ani zničit. Zákon opět poprvé formuloval Lomonosov (1748), ve známost vstoupil až po novější, nezávislé formulaci Mayerem (1848). Dnes víme, že vzhledem k platnosti Einsteinova vztahu ekvivalence mezi hmotností m a energií E 2 (vztah E = mc ) představují oba zákony zákon jediný. Celková hmotnost a energie izolované
soustavy se nemění. Změny hmotnosti, které odpovídají měřitelným změnám energie při chemických reakcích, jsou tak malé, že je prakticky nelze detekovat. 5 Sloučením 1 g vodíku s přibližně 8 g kyslíku na vodu se uvolní energie 1, 4 ⋅10 J , což odpovídá −12 snížení hmotnosti o 1, 6 ⋅10 kg .
•
Zákon stálých poměrů slučovacích
Hmotnostní poměr prvků či součástí dané sloučeniny je vždy stejný a nezávislý na způsobu přípravy sloučeniny. Zákon byl formulován nezávisle Proustem a Daltonem (1799) Například ve vodě je poměr hmotností kyslíku a vodíku přibližně 8 : 1. •
Zákon násobných poměrů slučovacích
Tvoří-li dva prvky více podvojných sloučenin, pak hmotnosti jednoho prvku slučujícího se vždy se stejným množstvím prvku druhého jsou pro tyto sloučeniny v poměrech, které lze vyjádřit přibližně podílem malých celých čísel. Zákon byl formulován nezávisle Richterem (1791) a Daltonem (1802). Kyslík, který se sloučí bezezbytku s 1 g vodíku na vodu, má hmotnost asi 8 g. Kyslík, který se sloučí bezezbytku s 1 g vodíku na peroxid vodíku, má hmotnost přibližně 16 g. Poměr uvedených hmotností kyslíku je 1:2.
161
•
Zákon stálých poměrů objemových
Při stálém tlaku a teplotě jsou objemy plynů vstupujících spolu do reakce, popřípadě též objemy plynných produktů reakce, vždy ve stejném poměru, který je možno vyjádřit malými celými čísly. Zákon formuloval Gay-Lussac (1805). Kyslík s objemem 1 m 3 se bezezbytku sloučí s vodíkem o objemu 2 m 3 na vodu ve formě páry o objemu 2 m 3 . • Zákon Avogadrův Ve stejných objemech různých plynů či par je za stejného tlaku a teploty stejný počet molekul. Tento zákon formuloval Avogadro spolu se zavedením pojmu molekula. Molekula představuje nejmenší částici látky, která má ještě její chemické vlastnosti. Molekula se skládá buď z více atomů různých prvků (heteronukleární molekula) nebo z více atomů stejného prvku (homonukleární molekula), může ji tvořit i jeden atom (jednoatomová molekula). Z platnosti zákona stálých poměrů objemových (viz uvedený příklad) a Avogadrova zákona vyplývá existence dvouatomových molekul vodíku a kyslíku. Zavedení pojmu molekula si vyžádala i kinetická teorie. Její vztahy dávají správné výsledky, jen když budeme považovat za základní částice látek, které v této teorii vystupují, molekuly (nikoliv atomy). V případě prvků, s výjimkou vzácných plynů, které mají jednoatomové molekuly, to musí být molekuly tvořené více atomy daného prvku. Nejčastěji jsou to dvouatomové molekuly jako např. u dusíku, kyslíku nebo vodíku. •
Faradayův zákon elektrolýzy
Hmotnost látky
m
přeměněné při elektrolýze na elektrodě je úměrná prošlému náboji
Q:
m = AQ,, kde A je elektrochemický ekvivalent. Nejmenší náboj přenesený při elektrolýze je roven elementárnímu elektrickému náboji e, což je důkazem kvantování elektrického náboje. m u A= r Z e , kde mr je relativní atomová Dnes můžeme na základě atomistických představ psát hmotnost daného atomu, Z je stupeň ionizace atomu (iontu) v elektrolytu (odpovídá mocenství), m Nmr u A= = Q NZe , u je atomová hmotnostní konstanta a e elementární elektrický náboj. Platí totiž kde N je počet prošlých iontů, a tedy i atomů vyloučených na elektrodě. Nositeli elektrického náboje v elektrolytu jsou ionty s nábojem Ze , které na elektrodě zachytí či odevzdají elektrony a vylučují se jako atomy s hmotností mru.
162
Animace Elektrolýza Spustit animaci
Látky do reakce vstupující Tyto látky se označují jako reaktanty. Přibližně Na počátku 19. století byly odchylky skutečných hodnot poměrů od hodnoty příslušného podílu celých čísel v rámci přesnosti tehdejších měřících metod. Na základě současných přesnějších měření víme, že poměry se od podílu celých čísel o něco málo liší, což souvisí s rozdílem v hmotnosti neutronů a protonů a hmotnostním úbytkem jádra atomu. Elektrochemický ekvivalent Tato veličina je pro danou látku konstantní Elementární elektrický náboj - nejmenší přenesený náboj Celkový přenesený náboj je tedy pouze celistvým násobkem e.
1.2 DALTONOVA ATOMOVÁ HYPOTÉZA Na základě rozboru základních chemických zákonů vyslovil Dalton domněnku, že látky se skládají ze základních stavebních částic – atomů. Zároveň postuloval základní vlastnosti atomů, čímž položil základy atomové teorie. Daltonovy představy o atomární struktuře látky umožnily objasnit pozorované chemické zákonitosti a staly se východiskem pro objasnění dalších experimentálních skutečností zejména z oblasti chemie a fyziky. o
Základní postuláty Daltonovy atomové teorie:
o
prvky se skládají z velmi malých dále nedělitelných částic – atomů,
o
atomy téhož prvku jsou stejné, atomy různých prvků se liší hmotností, velikostí a dalšími vlastnostmi,
163
o
v průběhu chemických dějů se atomy spojují, oddělují nebo přeskupují, přičemž ale nemohou vznikat nebo zanikat,
o
slučováním dvou či více prvků vznikají chemické sloučeniny, slučování probíhá jako spojování celistvých počtů atomů těchto prvků.
Tyto představy později doplnil Avogadro o pojem molekuly. Dle současných poznatků je nutno představy původní Daltonovy teorie poněkud korigovat a doplnit. Nedělitelnost atomu je nutno omezit pouze na chemické děje, přičemž neměnné zůstává pouze jádro atomu, které atom identifikuje (viz protonové číslo). Hmotnost atomů daného prvku může být různá (viz izotopy). Základní stavební částice Existenci atomů předpokládali již řečtí filozofové Leukippos a Démokritos.
1.3 THOMSONŮV MODEL ATOMU Na základě objevu elektronu, lehké částice se záporným elektrickým nábojem, která může být emitována elektroneutrálním atomem, navrhl Thomson první model struktury atomu. Thomsonovy představy o struktuře atomu můžeme dnes formulovat asi takto: o
Hlavní část hmotnosti atomu představuje látka s kladným elektrickým nábojem.
o
Hmotnost a kladný elektrický náboj jsou spojitě rozloženy v celém objemu atomu.
o
Velmi lehké elektrony jsou umístěny uvnitř kladně nabité látky v rovnovážných polohách.
Animace Thomsonův model atomu Spustit animaci
164
Na základě těchto představ se pokusil interpretovat některé v té době známé jevy: •
ionizaci - jako emisi elektronu z atomu; dodáním energie je možné uvolnit elektron
z rovnovážné polohy; •
spektrum záření emitovaného atomem; na základě představy, že elektron kmitající s určitou
frekvencí kolem rovnovážné polohy budí elektromagnetickou vlnu se shodnou frekvencí.
NEDOSTATKY THOMSONOVA MODELU Výpočty už v případě Thomsonova modelu atomu vodíku ukázaly, že frekvence kmitů elektronů nemají žádnou souvislost s frekvencemi, které odpovídají naměřeným spektrálním čarám. Definitivně byl Thomsonův model atomu vyvrácen Rutherfordovým experimentem, který prokázal, že kladně nabitá látka tvořící téměř veškerou hmotnost atomu je soustředěna v malém objemu v centrální části atomu, v tzv. atomovém jádře.
Thomsonův model atomu vodíku Elektron uprostřed spojité kladně nabité koule. Ironií je, že současná názorná představa založená na výsledcích kvantové mechaniky je téměř opačná, kladně nabité jádro uprostřed atomu „obalené záporným elektronovým oblakem“
1.3.1 OBJEV ELEKTRONU V polovině 19. století pozoroval Geissler a další fyzikové tzv. katodové paprsky. Při experimentu byla používána katodová trubice, což je skleněná trubice, popř. baňka, s elektrodami. Pokud byl vzduch, případně i jiný plyn, uvnitř trubice zředěn (asi na tisícinu atmosférického tlaku) a na elektrody bylo připojeno vysoké napětí (vyšší než asi 1000 V), začal plyn v trubici zářit. W. Crookes kolem roku 1880 zjistil, že při dalším snížení tlaku začíná kromě plynu uvnitř světélkovat i skleněná stěna baňky v místech, která leží naproti záporné elektrodě (katodě). Předpokládal tedy, že katoda emituje záření, katodové záření, resp. katodové paprsky. Prováděl další experimenty, z kterých vyplynulo, že záření přenáší energii (záření roztáčelo lopatky miniaturního „mlýnku“) a elektrický náboj (částice záření jsou elektricky nabité a proto se jejich dráha zakřivuje v magnetickém poli). Podstatu katodového záření odhalil v roce 1897 J. J. Thomson, který na základě výše uvedených experimentů předpokládal, že záření je tvořeno proudem malých částic (tzv. korpuskulární záření) se záporným nábojem. Studiem pohybu těchto částic určil jejich hmotnost a náboj. Velikost tohoto náboje je rovna elementárnímu elektrickému náboji. Nové částice byly pojmenovány elektrony.
165
1.3.2 ELEMENTÁRNÍ ELEKTRICKÝ NÁBOJ Elementární elektrický náboj e představuje nejmenší hodnotu elektrického náboje, která je v experimentech pozorována. Elektrický náboj se může přenášet nebo měnit pouze po celistvých násobcích této hodnoty. (U kvarků se sice předpokládají hodnoty 1/3 e, resp. 2/3 e, tyto částice ale nebyly pozorovány jako volné).
Mezi experimenty, které potvrzují existenci elementárního elektrického náboje, patří elektrolýza, při které je nejmenším přeneseným nábojem e (viz Faradayův zákon elektrolýzy), objev elektronu, který má velikost elektrického náboje rovnu e , a zejména Millikanův experiment. Millikan v letech 1910–1913 prováděl následující experiment: Umístil ve vzduchu dvě ploché elektrody nad sebou. Mezi elektrody rozprášil kapičky oleje. Působením ultrafialového světla rozštěpil molekuly vzduchu na elektricky nabité ionty. Pokud se na elektrody připojilo vysoké napětí (asi 1 000 V), mohly se ionty působením elektrické síly pohybovat. Pohyb bylo možno sledovat, pokud ionty narazily na kapičku oleje či jí byly zachyceny. Kapičku bylo možno pozorovat pod mikroskopem.
166
Pro určení elektrického náboje q částečky (v daném případě olejové kapky) je možno využít situaci, kdy se částečky při určité hodnotě elektrického napětí vznášejí („levitují“) mezi elektrodami. E Na částečku, např. kapičku oleje, působí ve směru svislice (osa z) jednak elektrická síla Fz = qE z , G jednak gravitační síla Fz = −mg , kde Ez je složka intenzity elektrického pole, m je hmotnost částečky a g gravitační zrychlení. Pokud částečka stojí na místě, je splněna podmínka rovnováhy FzE + FzG = 0 . Pro elektrickou intenzitu mezi dvěma rovinnými elektrodami, jejichž vzdálenost je
d a na které je připojeno napětí U, platí vztah
Ez =
U d .
V případě kapiček oleje můžeme jejich hmotnost zjistit např. ze známé hustoty oleje a z objemu kapičky, který spočteme z jejích rozměrů. Z podmínky rovnováhy pak dostáváme pro elektrický dmg q= U . náboj: Obdobným způsobem Millikan zjistil, že nejmenší náboj kapiček, který je možno naměřit, je e. Ostatní hodnoty byly pak celistvým násobkem této základní hodnoty. 167
Existence elementárního elektrického náboje je jedním z projevů kvantové povahy látek. Srovnej Daltonovu atomovou hypotézu. Elementární elektrický náboj e = 1, 6021892 ⋅10−19 C
1.4 RUTHERFORDŮV MODEL ATOMU Na základě rozboru rozptylových experimentů (Rutherfordův pokus) usoudil Rutherford (roku 1911), že atomy mají jádro, které má kladný elektrický náboj a připadá na ně téměř celá hmotnost atomu. Na rozdíl od Thomsonova modelu atomu však musí toto jádro zaujímat pouze malou část objemu atomu. Její lineární rozměr je asi desettisíckrát až stotisíckrát menší než lineární rozměr atomu. S využitím těchto skutečností vytvořil Rutherford model atomu, ve kterém obíhají elektrony kolem těžkého a velmi malého jádra analogicky jako planety obíhají kolem Slunce. Z tohoto důvodu se uvedený model atomu označuje též jako planetární model atomu. Na rozdíl od planet, které jsou na dráze kolem Slunce drženy gravitační silou (viz Newtonův gravitační zákon), jsou elektrony se záporným elektrickým nábojem přitahovány k jádru s kladným elektrickým nábojem silou elektrostatickou (viz Coulombův zákon). Rutherfordův model atomu vodíku
NEDOSTATKY RUTHERFORDOVA MODELU ATOMU Z modelu vyplývá spojité spektrum, zatímco v experimentu pozorujeme čárové spektrum atomů. V Rutherfordově modelu atomu se může poloha elektronu r i jeho rychlost v měnit spojitě. V rámci tohoto modelu se tedy bude spojitě měnit i celková energie atomu, která je spojitou funkcí polohového vektoru a rychlosti. Např. u atomu vodíku můžeme pro celkovou energii atomu psát: m v2 e2 E = EKinetická + EPotenciální = e − 2 4πε o r . Předpokládejme kruhovou dráhu elektronu se středem mev 2 Fd = r , kde r je v jádře atomu. Při pohybu po kružnici platí pro velikost dostředivé síly vztah v poloměr kružnice a je velikost rychlosti částice – elektronu. V případě Rutherfordova modelu e2 Fd = 4πε 0 r 2 . hraje úlohu dostředivé síly elektrostatická síla, pro niž dle Coulombova zákona platí e2 2 mev = 4πε 0 r . Po dosazení tohoto výsledku do vztahu pro Porovnáním obou vztahů dostáváme
168
E= celkovou energii máme E.
1 e2 e2 1 e2 − =− 2 4πε o r 4πε o r 2 4πε o r . Při spojité změně r se mění spojitě i
Elektron v Rutherfordově modelu atomu by ztrácel energii a pohyboval by se po spirále směrem k jádru, s nímž by se nakonec spojil. Atom by tedy zanikl. Z výpočtu plyne, že by se tak stalo v čase řádově 10
−10
s.
V Rutherfordově modelu atomu obíhají elektrony kolem jádra po zakřivených drahách. Pohybují se tedy s určitým okamžitým zrychlením. Elektrony mají záporný elektrický náboj. Z výsledků klasické elektrodynamiky vyplývá, že částice s elektrickým nábojem, které se pohybují se zrychlením by měly vyzařovat energii ve formě elektromagnetického záření. Pád elektronu na jádro Rutherfordův model je vzhledem k uvedeným nedostatkům jakožto model popisující dynamiku atomu nesprávný, jako model vnitřní struktury atomu však zůstává v platnosti. Lineární rozměr jádra
Lineární rozměr této oblasti je řádově 10
−14
m až 10−15 m .
Lineární rozměr atomu
Lineární rozměr atomu činí řádově 10
−10
m.
Celková energie atomu Protože jádro je v prvním přiblížení nepohyblivé, můžeme též hovořit o celkové energii elektronu v poli jádra. Zakřivená dráha elektronu Např. v nejjednodušším případě mohou obíhat elektrony po kruhové dráze. Zrychlení elektronu U pohybu po kružnici to je dostředivé zrychlení. Model vnitřní struktury atomu Elektrony obíhají kolem jádra, jež kladným náboj, velkou hmotností ve srovnání s hmotností elektronu a velmi malým rozměrem ve srovnání s rozměrem atomu.
1.4.1 RUTHERFORDŮV POKUS Roku 1909 zkoumali na Rutherfordův návrh jeho asistenti Geiger a Marsden průchod tzv. paprsků alfa (viz záření alfa) kovovou fólií. Jednalo se o proud částic alfa, které byly emitovány zářičem při radioaktivním rozpadu. Pomocí kolimátoru byl vytvořen úzký svazek částic alfa, které dopadaly na tenkou kovovou fólii. Pomocí scintilačního stínítka, na kterém se po dopadu částice objeví záblesk, bylo zjišťováno (počítáním záblesků), kolik částic fólií projde. Bylo pozorováno, že většina částic prochází fólií poměrně snadno. Později bylo zjištěno, že menší počet částic se značně odchyluje od původního směru letu nebo se dokonce odráží zpět před fólii, což bylo v rozporu s představami Thomsonova modelu atomu, dle kterého kladně nabitá část atomu měla být rozprostřena rovnoměrně v jeho objemu. (Pozn.). 169
Výsledky Rutherfordova experimentu bylo možné objasnit na základě představy, podle níž je podstatná část hmoty atomu soustředěna v kladně nabitém atomovém jádře, tj. v centrální oblasti atomu, jehož objem je ve srovnání s objemem atomu velmi malý. Později byla uskutečněna detailní měření počtu rozptýlených částic v závislosti na rozptylovém úhlu. Rutherford provedl teoretický výpočet pro rozptyl dvou bodových částic s kladným elektrickým nábojem, tzn. s využitím Coulombova zákona. Výsledky souhlasily s experimentálně zjištěnými hodnotami. Ze znalosti energie částic alfa Eα pak bylo možno určit minimální
q1 q 2 Eα 4πε 0 , na kterou se částice alfa s nábojem q1 = 2e mohou přiblížit jádru vzdálenost s nábojem q2 = Ze . Vzdálenost 2rmin odpovídá dle Rutherfordových představ rozměru jádra. rmin =
Lineární rozměr atomového jádra je řádově 10-14 až 10 -15 m, zatímco u atomu to je řádově 10
170
−10
m.
Rozptyl částic alfa na atomovém jádře Spustit animaci
Uvedené představy Rutheford rozpracoval v planetárním modelu atomu. Kolimátor Soustava stínítek sloužící k vymezení rovnoběžného svazku částic. Tenká kovová fólie V původním pokusu zlatá fólie o tloušťce asi 0,1 µm. Poznámka Srážky s lehkými elektrony jsou pro rozptyl poměrně těžkých částic alfa nepodstatné.
1.5 BOHRŮV MODEL ATOMU Tento model atomu vychází z představ Rutherfordova modelu atomu a pojmů klasické mechaniky. Aby Bohr mohl odstranit hlavní nedostatky Rutherfordova modelu, musel ovšem postulovat platnost tzv. kvantovací podmínky, kterou nebylo možno získat ze základních zákonů klasické fyziky. Bohr v roce 1913 navrhuje svůj model atomu vodíku. Model je použitelný i pro tzv. vodíku podobné ionty. Předpoklady Bohrova modelu atomu: o
Elektrony se pohybují jen po kruhových drahách, pro které je splněna kvantovací podmínka: 2π me rv = nh, n = 1, 2, 3, 4, 5.... , kde me je hmotnost elektronu, r poloměr kruhové
dráhy a v je rychlost elektronu; veličina n se označuje jako kvantové číslo a h je Planckova konstanta. 171
o
Elektrony při pohybu po drahách splňujících kvantovací podmínku nevyzařují energii.
o
Energie může být vyzářena, resp. přijata, pouze při přechodu elektronu z jedné dráhy na druhou.
Na základě uvedených předpokladů je možno odvodit kvantovací podmínku pro energii atomu vodíku, která je ve shodě s experimentem.
ODVOZENÍ ENERGETICKÉHO SPEKTRA PRO BOHRŮV MODEL ATOMU VODÍKU Vyjdeme z dvojího vyjádření dostředivé síly (viz Rutherfordův model) a z Bohrovy kvantovací podmínky, tedy ze vztahů mev 2 e2 = 4πε 0 r a 2π me r v = nh . r Je to soustava dvou rovnic pro dvě neznámé r a v, n je parametr. Pro zjednodušení výpočtu je 2 2 výhodné zavést si konstanty = h / 2π a e0 = e / 4πε 0 . Vyřešením soustavy vzhledem k těmto neznámým dostáváme kvantovací podmínky pro poloměr dráhy r a rychlost elektronu v: 2
e2 1 rn = ⋅ n2 vn = 0 ⋅ 2 m e e 0 n a . e2 1 mev 2 − 0 r , která 2 Po dosazení těchto podmínek do vztahu pro celkovou energii atomu vodíku je v případě přiblížení nekonečně těžkého, a tudíž nepohyblivého jádra celkovou energií elektronu v poli jádra, dostáváme kvantovací podmínku pro energii neboli energetické spektrum: E=
En = −
1 me e04 1 2 2 n2 .
S rostoucím n se zvyšuje hodnota energie, která je záporná, až k nule pro n → ∞ , což odpovídá volnému elektronu (ionizace atomu). V přírodě spějí systémy samovolně do základního energetického stavu, což je stav s nejnižší energií. V případě Bohrova modelu atomu vodíku je základním stavem první hladina (n = 1) s energií 1 me e04 E1 = − 2 2 což odpovídá kvantové dráze s nejmenším poloměrem, který se označuje jako Bohrův poloměr atomu DEF
a0 = r1 =
172
2
me e02
−11 ( a0 = 5, 291772083 ⋅ 10 m ). Ze vztahů vyplývá, že s rostoucím n vzdálenost mezi dráhami narůstá, zatímco vzdálenost energetických hladin klesá (pro vysoké n lze spektrum považovat za kvazi spojité).
Výsledky lze použít i v případě spektra vodíku podobného iontu (ionizovaný atom, s protonovým 2 2 číslem Z, s jedním elektronem), pokud provedeme substituci Ze0 ↔ e0 . Vztahy byly spočteny v limitě nekonečně těžkého jádra. Pohyb jádra je možné zohlednit nahrazením hmotnosti elektronu 1 1 1 = + tzv. redukovanou hmotností µ, která je definována vztahem µ me m J , kde mJ je hmotnost jádra. Ze znalosti energetického spektra můžeme určit absorpční či emisní elektromagnetické spektrum atomu vodíku.
NEDOSTATKY BOHROVA MODELU ATOMU Bohrův model atomu, přestože dává principiálně správné výsledky pro energetické spektrum (totožné s řešením Schödingerovy rovnice pro atom vodíku v elektrostatickém přiblížení), je dnes již překonán. Posloužil jako jedno z východisek tehdy vznikající kvantové teorie, která popisuje stav systému (tedy i např. atomu) jiným způsobem, než to činila klasická mechanika. Podle této nové teorie je např. v případě atomu neudržitelná představa, že elektron obíhá po přesně určené 173
dráze (trajektorii). Často se uvádí skutečnost, že Bohrův model atomu neobjasňuje jemnou strukturu spekter a že je obtížné jej zobecnit pro víceelektronové atomy. Tyto nedostatky ale nejsou hlavními důvody pro opuštění Bohrova modelu. První nedostatek se částečně podařilo odstranit v Sommerfeldově modelu atomu, který můžeme chápat jako snahu o rozpracování postupů založených na pojmech a aparátu klasické fyziky, ovšem s využitím kvantovacích podmínek. Mezitím se ale rozvinula kvantová teorie, která byla obecně platnou a logicky konstruovanou fyzikální teorií a ne pouze jednoúčelově zaměřeným modelem. Druhý nedostatek je obecným problémem v případě řešení úloh většího počtu vzájemně na sebe působících částic, ať už se jedná o oblast klasické, či kvantové fyziky (viz víceelektronové atomy). Pro názornost je zobrazení elektronů na drahách vycházející z původních představ Bohrova modelu atomu stále používáno. Dnes je ale musíme chápat pouze jako schéma, které nás informuje o stavbě atomového obalu, nikoliv jako skutečný obraz reálného atomu. Vztah je tedy analogický vztahu skutečného elektrického obvodu a jeho schématu zakresleného pomocí značek. Pro úspornost schématu se často nedodržuje růst poloměru kvantové dráhy s druhou mocninou kvantového čísla n.
Schematické znázornění atomu
Pomocí značek Odpor (resistor) nemusí být váleček, stejně jako elektron není kulička.
1.5.1 OBJASNĚNÍ ČÁROVÉHO SPEKTRA Při odvození emisního, resp. absorpčního spektra atomu vodíku vycházíme ze znalosti jeho energetického spektra a skutečnosti, že k emisi, resp. absorpci elektromagnetického záření může dojít dle Bohrových předpokladů pouze při přechodu z vyšší energetické hladiny na nižší (emise fotonu, deexcitace atomu), resp. z nižší energetické hladiny na hladinu vyšší (absorpce fotonu, excitace atomu). Energie fotonu E f , tj. kvanta elektromagnetického záření, je v obou případech podle zákona zachování energie rovna změně energie atomu, tedy při přechodu z j-té hladiny na itou E f = ∆E = E j − Ei . Podle Einsteinovy fotonové hypotézy je úhlová frekvence fotonu ω = E f / (pro kmitočet ν = E f / h ). Po dosazení vztahu pro energetické spektrum atomu vodíku tedy dostáváme:
ω ij = −
1 me e04 1 1 − 2 3 j 2 i 2 . 174
Ve spektroskopii se používá tzv. vlnočet, což je reciproká hodnota vlnové délky λ . Mezi kmitočtem a vlnovou délkou fotonu platí vztah ν = c / λ , kde c je rychlost světla ve vakuu, a tedy ω = 2πν = 2π c (1/ λ ) . Potom je možno zapsat vztah pro vlnočet 1 λ ij
4 1 me e 4 e e0 = − R ⋅ 12 − 12 , kde R = 1 m = je Rydbergova konstanta. 3 2 3 j i π c ε h c 2 2 8 0
Stejně jako v případě energetického spektra lze provést opravu na pohyb jádra zavedením nahrazením hmotnosti elektronu redukovanou hmotností. Odvozené spektrum je graficky znázorněno na obrázku: Bohrův model atomu. Obrázek kromě energetických hladin v Bohrově modelu atomu ukazuje souvislost sérií spektrálních čar s přechody mezi těmito hladinami při emisi, nebo naopak absorpci, fotonu atomem. Odvozené spektrum v hlavních rysech odpovídalo tomu, co bylo pozorováno v experimentu. Při použití spektroskopů s vyšším rozlišením se ale čáry rozpadají na několik blízkých čar, je pozorovatelná tzv. jemná a hyperjemná struktura spektra.
1.5.2 FRANCKŮV - HERTZŮV POKUS J. Franck a G. Hertz provedli v letech 1913-1914 sérii pokusů, v nichž prokázali v elektronových obalech atomů existenci kvantovaných energetických hladin. Svými výsledky tak potvrdili správnost nedlouho předtím formulovaného Bohrova modelu atomu vodíku nespektroskopickou metodou.
POPIS EXPERIMENTU Obecné schéma pokusů prováděných Franckem a Hertzem je uvedeno v následujícím obrázku. Triodu T plnili Franck a Hertz parami různých prvků. Ze žhavené katody K vystupují elektrony a jsou unášeny elektrickým polem ke kladně nabité mřížce M. Potenciálový rozdíl mezi katodou a mřížkou označme symbolem V. Na své cestě se elektrony srážejí s atomy par vyplňujících vnitřní prostor triody, přičemž tyto srážky schéma Franckova - Hertzova pokusu mohou být jak pružné, tak i nepružné. Slabé brzdicí napětí mezi mřížkou a anodou dále způsobí, že jen elektrony s jistou minimální kinetickou energií dopadnou na anodu a přispějí k proudu tekoucímu galvanometrem A. Elektrony s menší kinetickou energií ke katodě nedospějí a jsou odvedeny mřížkovou větví obvodu. 175
VÝSLEDKY EXPERIMENTU Franck a Hertz měřili v takto sestaveném obvodu závislost proudu I tekoucího galvanometrem A na napětí V mezi katodou a mřížkou. Získali tak voltampérové charakteristiky podobné té, kterou pro ilustraci uvádíme na následujícím obrázku.
Franckův - Hertzův pokus - voltampérová charakteristika
INTERPRETACE VÝSLEDKŮ EXPERIMENTU Výsledek experimentu je na první pohled v rámci klasické fyziky nepochopitelný. Podle ní bychom totiž ve shodě s Ohmovým zákonem očekávali spíše monotónní závislost proudu na mřížkovém napětí. Výrazná lokální maxima, ekvidistantně rozložená na experimentální křivce, jsou pochopitelná pouze, přijmeme-li Bohrovu představu o kvantování vnitřní energie atomů. Popišme si proto procesy, které v triodě probíhají, podrobněji. Elektrony vystupující z katody jsou, jak již bylo uvedeno výše, urychlovány elektrickým polem mezi katodou a mřížkou. Kdyby nebylo srážek s atomy par v triodě, pohybovaly by se rovnoměrně zrychleně s energií rostoucí lineárně se vzdáleností od katody. Zmíněné srážky ovšem charakter pohybu elektronů ovlivňují. Pružné srážky mění jeho směr. Vzhledem k velkému rozdílu mezi hmotnostmi elektronů a atomů nedochází během nich k téměř žádným změnám kinetické energie elektronů. Naopak ve srážce nepružné, která je doprovázena excitací srážejícího se atomu, se kinetická energie elektronů zmenšuje. A zde je třeba hledat původ oněch záhadných maxim a minim na voltampérových charakteristikách změřených Franckem a Hertzem. Je-li vnitřní energie atomů kvantována, může se měnit jen skokem. Navíc je naprostá většina atomů za běžných pokojových teplot v základním stavu. Ve Franckově-Hertzově pokusu se tedy elektrony srážejí právě jen s atomy v základním stavu. Označme rozdíl energií mezi základním a prvním excitovaným stavem atomu ∆E. Pak ovšem elektron s kinetickou energií nižší než ∆E nemůže atom, s nímž se sráží, excitovat. Proto pro urychlující napětí V < ∆E / e , kde e je elementární elektrický náboj, nedochází v prostoru mezi katodou a mřížkou k žádným nepružným srážkám. Pro jednoduchost předpokládáme, že elektrony vystupují z katody s nulovou počáteční rychlostí. 176
Situace se ovšem zcela změní, dosáhne-li napětí V hodnoty ∆E / e . Pak totiž mají elektrony urychlené tímto napětím dostatečnou kinetickou energii na to, aby mohly během srážky atom excitovat. Pro napětí V = ∆E / e proto dochází poblíž mřížky k velkému počtu nepružných srážek elektronů s přítomnými atomy par, ve kterých elektrony ztrácejí téměř beze zbytku svou kinetickou energii. Nemohou pak ale překonat brzdicí napětí mezi mřížkou a anodou a dochází proto k prvnímu prudkému poklesu proudu tekoucího galvanometrem A. Podobně i další poklesy proudu tekoucího galvanometrem A odpovídají ztrátám energie elektronů v nepružných, tentokrát násobných srážkách s atomy par. Za druhý pokles odpovídají první nepružná srážka někde v polovině vzdálenosti mezi mřížkou a katodou a druhá u mřížky. Urychlující napětí je v tomto případě V = 2∆E / e . Třetí pokles proudu je způsoben třemi nepružnými srážkami, a to v třetině a dvou třetinách vzdálenosti katoda - mřížka a u mřížky. Urychlující napětí je tentokrát V = 3∆E / e . A tak dále. Pro páry rtuti zjistili Franck a Hertz, že první pokles proudu nastává pro mřížkové napětí V = 4,9 V. Energetický rozdíl mezi základní a první excitovanou hladinou v atomu rtuti by tedy měl být ∆E = 4, 9 eV . V dokonalém souladu s tímto závěrem pozorujeme v absorpčním spektru rtuťových par spektrální čáru o vlnové délce 253,6 nm, jíž odpovídá energie fotonu rovná právě oněm 4,9 eV. Páry různých prvků V základní literatuře se obvykle uvádějí výsledky získané pro páry rtuti.
1.6 SOMMERFELDŮV MODEL ATOMU (RELATIVISTICKÝ) Přestože Bohrův model atomu v hrubých rysech správně popisoval energetické spektrum atomu vodíku a iontů s jedním elektronem, případně po určitých úpravách i vodíku podobných atomů, zjistilo se, že u mnoha atomů včetně atomu vodíku se při použití spektrometrů s vyšším rozlišením začala pozorovat tzv. jemná struktura spekter, ukázalo se, že některé spektrální čáry jsou ve skutečnosti skupinami blízkých čar, tzv. multiplety.
SHRNUTÍ PŘEDPOKLADŮ A VÝSLEDKŮ SOMMERFELDOVA MODELU ATOMU o
Sommerfeld se pokusil objasnit jemnou strukturu spekter představou oběhu elektronů po eliptických drahách
o
Bylo nutné vyjít z kvantovacích podmínek zobecněných pro případ obecných drah elektronů.
o
V rámci nerelativistického řešení je spektrum atomu vodíku v Sommer-feldově modelu atomu totožné se spektrem Bohrova modelu atomu.
o
V rámci relativistického řešení spektrum atomu vodíku částečně objasňuje jemnou strukturu spekter. 177
Vznik modelu předcházely následující úvahy.
VZNIK SOMMERFELDOVA MODELU Sommerfeld zobecnil původní jednoduchou Bohrovu kvantovací podmínku pro moment hybnosti pro případ pohybu částice po libovolné uzavřené dráze. Tzv. Sommerfeldovy-Wilsonovy kvantovací podmínky tvoří základ Sommerfeldovy kvantové teorie, která pracuje s aparátem klasické fyziky. Kvantovací podmínky jsou v rámci této teorie doplněny jako dodatečný postulát, jehož aplikace pak vede zprostředkovaně i ke kvantování dalších fyzikálních veličin, např. energie. Aby objasnil jemnou strukturu spekter, předpokládal Sommerfeld, že elektrony se mohou pohybovat i po eliptických drahách. Na rozdíl od pohybu po kruhové dráze, při kterém se nemění vzdálenost elektronu od jádra a lze tudíž vystačit s popisem pomocí jediného stupně volnosti, musíme při pohybu po elipse uvažovat stupně volnosti dva. Je tedy třeba uvažovat na rozdíl od Bohrova modelu dvě kvantovací podmínky s dvěma kvantovými čísly. o
Sommerfeld předpokládal, že energie bude záviset na obou kvantových číslech, což by mohlo objasnit pozorované multiplety.
Konkrétní výpočet provedený pro atom vodíku (viz Sommerfeldova kvantová teorie atomu vodíku) bez uvážení efektů teorie relativity, vedl k energetickému spektru, které bylo shodné se spektrem získaným v rámci Bohrova modelu. Jistý pokrok přinesl teprve následující relativistický výpočet.
RELATIVISTICKÉ ŘEŠENÍ SOMMERFELDOVA MODELU PRO ATOM VODÍKU me =
m0,e
1 − vc2 Teprve když vzal Sommerfeld v úvahu relativistickou závislost hmotnosti elektronu na jeho rychlosti v, začala celková energie elektronu záviset na dvou kvantových číslech. Celková energie elektronu v poli jádra s Coulombovým potenciálem U je dána jako funkce velikosti rychlosti v či hybnosti p = mv:
E = me c 2 + U = o
m0,e c 2 1−
2
v c2
−
Ze 2 = 4πε 0 r 1
p 2 c 2 + m0,2 e c 4 + U (r ) .
178
2
Viz teorie relativity. Srovnej s nerelativistickým výpočtem. První člen ve vztahu zahrnuje jak kinetickou, tak klidovou energii elektronu, proto při srovnání s nerelativistickými vztahy musíme 2 klidovou energii m0,e c odečíst. (Pozor, v nerelativistické fyzice navíc me ≡ m0,e !) Podívejme se na výsledky relativistického výpočtu.
POHYB
RELATIVISTICKÉHO
ELEKTRONU
V SOMMERFELDOVĚ
MODELU
Z řešení relativistických pohybových rovnic výplývá, že elektron se v Sommerfeldově relativistickém modelu již nepohybuje po eliptické dráze, ale po dráze ve tvaru růžice. Kinematicky lze dráhu elektronu získat jako složení pohybu elektronu po elipse s ohniskem v jádře a pohybu této elipsy, jejíž poloosa se otáčí s konstantní úhlovou rychlostí.
ENERGETICKÉ
SPEKTRUM
RELATIVISTICKÉHO
ELEKTRONU
V SOMMERFEL-DOVĚ MODELU ATOMU Pokud vyjdeme z řešení úlohy získaného metodami nekvantové relativistické fyziky, pak aplikací kvantovacích podmínek po úpravách dostaneme následující vztah pro kvantování energie:
179
En ,l
2 Z α ( ) = m0 c 2 1 + 2 2 2 nr + nϕ − ( Zα )
−
1 2
m0 c 2
( Zα ) 1+
o
n2
2
( Zα ) 2 1 + n ⋅l
e02 e2 1 e2 α= = c= c 4πε 0 2πε 0 hc 137 je tzv. konstanta jemné struktury, n = nr + nϕ a l = nϕ kde jsou hlavní a vedlejší kvantové číslo. Srovnej s nerelativistickým výpočtem. Uvedený model ovšem dokázal objasnit jemnou strukturu spekter pouze částečně, nedokázal např. objasnit dublety u atomu vodíku, které souvisí s existencí spinu elektronu. Ukázalo se, že představa pohybu elektronu s určitou hybností po určité dráze je neudržitelná. Viz též Heissenbergovy relace neurčitosti. V další fázi svého vývoje vycházela kvantová teorie z teoretického popisu částic pomocí vlnových rovnic. Proto se modely na bázi Sommerfeldovy kvantové teorie dále nerozvíjely. Energetické spektrum získané na základě Sommerfeldova modelu zahrnuje z relativistických korekcí pouze relativistickou hmotnostní korekci. Spektrum je analogické (objevuje se l+1/2 místo l, viz srovnání vztahů pro LHO) se spektrem získaným řešením Kleinovy-Gordonovy rovnice, což je relativistická vlnová rovnice nezahrnující spin částic. Nekvantová fyzika Zde rozumíme klasickou fyzikou fyziku nekvantovou.
2. ATOM VODÍKU 2.1 Znázornění atomových orbitalů 2.1.1 Znázornění elektronovým oblakem 2.2 Kvantová čísla (popisující stav elektronu v atomu)
2. ATOM VODÍKU Atom vodíku je nejjednodušším atomem. Představuje systém dvou částic, elektronu a jádra, vázaných elektromagnetickou interakcí. Vzhledem ke skutečnosti, že hmotnost jádra atomu vodíku je řádově 1000krát vyšší než hmotnost elektronu, je možné v základním přiblížení (tzv. limitní přiblížení nekonečně velké hmotnosti, které neuvažuje pohyb jádra) popisovat pouze pohyb elektronu v poli jádra. Model atomu vodíku je nutno popisovat kvantově. Musíme tedy pro tento systém sestavit a vyřešit Schrödingerovu rovnici (SR). Pokud uvažujeme v atomu vodíku pouze elektrostatickou interakci (tzv. elektrostatické přiblížení), která je popsána Coulombovým zákonem, dostáváme bezčasovou SR pro atom vodíku v následujícím tvaru
180
h2 e2 ∆− − 2m 4πε 0
Ψ ( x, y , z ) = E Ψ ( x, y , z ) x 2 + y 2 + z 2 . 1
Jádro je umístěno v počátku systému souřadnic, m je hmotnost elektronu. Vzhledem ke tvaru coulombického potenciálu není možné řešit rovnici separací proměnných v kartézských souřadnicích. Protože je potenciál sféricky symetrický, je výhodné pro řešení SR použít sférické souřadnice. Viz pole centrálních sil. Rovnice pak přejde na tvar: 2 e2 − ∆ r ,ϑ ,ϕ − 4πε 0 2m
1 Ψ (r ,ϑ ,ϕ ) = EΨ (r ,ϑ ,ϕ ) r ,
1∂ 2 ∂ 1 ∂ ∂ 1 ∂2 + sin + r ϑ 2 2 2 ∂ ∂ sin ∂ ∂ r r r ϑ ϑ ϑ sin ϑ ϕ ∂ . kde Vlnová funkce je tedy funkcí sférických souřadnic r, ϑ a ϕ. Řešení Schrödingerovy rovnice je potom možné nalézt ve tvaru ∆ r ,ϑ ,ϕ =
Ψ n l m ( r , ϑ , ϕ ) = Rn l ( r )Yl m (ϑ , ϕ ) ,
kde funkce Rn l ( r ) je radiální část vlnové funkce a funkce Yl m (ϑ , ϕ ) je angulární (úhlová) část vlnové funkce. Čísla n, l a m jsou tzv. kvantová čísla, která číslují dovolené hodnoty celkové energie En , velikosti orbitálního momentu hybnosti hybnosti l z , m .
l
a z-tové složky orbitálního momentu
,
Vlnová funkce atomu určená hodnotami kvantových čísel n, l a m se označuje jako atomový orbital (AO). 2
Protože Ψ určuje hustotu pravděpodobnosti nalezení elektronu v daném bodě prostoru, bývá vhodné zobrazit buď přímo daný atomový orbital, nebo jemu odpovídající hustotu pravděpodobnosti. Takové zobrazení (i když často zjednodušené) se často používá v chemii, protože dává představu o směrech s výraznějším výskytem elektronu. Viz též znázornění atomových orbitalů. Řešení Schrödingerovy rovnice Řešení Schrödingerovy rovnice se hledá tak, aby výsledná vlnová funkce nebyla pouze vlastní funkcí hamiltoniánu, ale také vlastní funkcí operátorů velikosti orbitálního momentu hybnosti a z-ové složky orbitálního momentu hybnosti.
2.1 ZNÁZORNĚNÍ ATOMOVÝCH ORBITALŮ Atomové orbitaly je možno znázornit různými způsoby. Radiální část vlnové funkce pro několik prvních hodnot kvantových čísel n a l je uvedena v tabulce:
181
n
l
Rnl(r)
1
0
r 2a 0−3 / 2 exp − a0
2
0
r r exp − 2 −1/ 2 a0−3 / 2 1 − 2 a 2 a 0 0
2
1
r (24) −1/ 2 a0−5 / 2 r exp − 2a0
3
0
3
1
r r exp − 23 / 2 3−7 / 2 a0−5 / 2 r 2 − 3a0 3a0
3
2
r 23 / 2 3−9 / 2 5−1/ 2 a0−7 / 2 r 2 exp − 3 a 0
2⋅3
−5 / 2
−3 / 2 0
a
r 2r 2 r 2 3 − + 2 exp − a0 9a0 3a0
Konstanta a0 je Bohrův poloměr atomu. Protože radiální část vlnové funkce závisí pouze na r, je možné zobrazit její průběh pomocí grafu ve dvou osách. Buď se zobrazuje přímo funkce Rn ,l ( r ) , nebo její druhá mocnina, tj. R 2 , popřípadě 2 2 2 2 hodnota 4π r R , jelikož výraz 4π r R dr představuje pravděpodobnost nalezení elektronu ve vzdálenosti r až r + dr od jádra bez ohledu na směr. Jinak řečeno, jde o pravděpodobnost nalezení elektronu v kulové vrstvě o poloměru r a tloušťce dr.
Angulární část vlnové funkce představují tzv. kulové funkce (též sférické funkce), jejichž tvar pro několik prvních hodnot l a m je uveden v tabulce:
L
m
Ynl(θ, ϕ )
0
0
1 4π
1
0
3 cosϑ 4π
1
±1
2
0
∓
−
182
3 sin ϑ exp(±iϕ ) 8π 5 (1 − cos 2 ϑ ) 16π
2
±1
2
±2
∓
15 cosϑ sin ϑ exp(±iϕ ) 8π 15 sin 2 ϑ exp(±iϕ ) 32π
∓
Kulové funkce jsou funkcemi dvou úhlů, navíc se jedná o komplexní funkce, proto je jejich znázornění obtížnější než v případě radiální vlnové funkce. Z tohoto důvodu se znázorňuje většinou 2
veličina Ylm (θ , ϕ ) , která už je reálnou funkcí a navíc závisí jen na úhlu θ . Výraz 2
Ylm (θ , ϕ ) sin θ dθ dϕ má význam pravděpodobnosti nalezení elektronu ve směrech určených úhly mezi θ a θ + dθ a mezi ϕ a ϕ + dϕ . Jinak řečeno, jde o pravděpodobnost nalezení elektronu v elementu prostorového úhlu dΩ = sin θ dθ dϕ . Funkci |Ynl|2 je možno znázornit ve formě
polárního diagramu, tj. ve směru daném úhly θ a ϕ se vykreslují body ve vzdálenosti Ylm počátku. Graf tedy představuje plochu v prostoru. Vzhledem k tomu, že Ylm
2
od
2
závisí pouze na úhlu 2
θ , je tato plocha symetrická podle osy z. Pro získání představy o tvaru funkce Ylm stačí znázornit řez s libovolnou rovinou procházející osou z, např. rovinnou xz ( ϕ = 0 ). Znázornění celých atomových orbitalů (AO) je podstatně těžší než zobrazení samostatné radiální části AO nebo angulární části AO. Jedná se o komplexní funkce tří proměnných r, θ a ϕ. Abychom nemuseli zobrazovat reálnou a imaginární část AO , volí se pro zobrazení 2
* a) hustota pravděpodobnosti nalezení elektronu v bodě r , tedy veličina Ψ nlm = Ψ nlm Ψ nlm ,
b) reálné atomové orbitaly Ψ′nl µ , které se získají vhodnou lineární kombinací původních (komplexních) atomových orbitalů Ψ nlm s pevnou hodnotou n a l , ale různou hodnotou m, c) hustota pravděpodobnosti nalezení elektronu v bodě r pro stavy odpovídající reálným Ψ′nl µ = ( Ψ′nl µ ) 2
atomovým orbitalům z bodu b),
2
(viz též následující kapitolu).
V případě b se využívá skutečnosti, že libovolná lineární kombinace řešení bezčasové Schrödingerovy rovnice je rovněž jejím řešením. Reálné orbitaly pro dané n a l už ovšem nejsou na rozdíl od původních funkcí vlastními funkcemi operátoru z-ové komponenty orbitálního momentu hybnosti lz . Obecně tedy nepopisují stavy s určitou hodnotu lz . Např. reálné AO typu p dostaneme kombinacemi: 1 Ψn 1 x = (Ψn 1 −1 + Ψn 11 ) 2 , −i (Ψn 1 −1 − Ψn 1 1 ) Ψn 1 y = 2 , Ψn 1 z = Ψn 1 0 .
183
Obrázek Prostorový model reálných orbitalů typu p
2.1.1 ZNÁZORNĚNÍ ELEKTRONOVÝM OBLAKEM V následující tabulce jsou zobrazeny vybrané reálné atomové orbitaly. Simulace vycházejí z představy orbitalu jako "elektronového oblaku", jehož hustota je dána druhou mocninou modulu příslušné vlnové funkce, tj. hustotou pravděpodobnosti výskytu elektronu v daném bodě (viz 1. Bornův postulát). Tento oblak je pozorován z určitého směru, přičemž jas každého bodu obrázku je úměrný integrálu hustoty oblaku přes délku paprsku. V prvním sloupci tabulky se jedná o pohled na orbital ve směru osy x, přičemž vodorovná osa odpovídá ose y a svislá ose z. V druhém sloupci jde o pohled ve směru osy y, kdy vodorovná osa odpovídá ose x a svislá ose z. Ve třetím sloupci je zobrazen pohled ve směru osy z, přičemž vodorovnou osou je osa x a svislou osou osa y.
184
Orbital 1s - pohled ve směru Orbital 1s - pohled ve směru Orbital 1s - pohled ve směru osy y osy z osy x
Orbital 2s - pohled ve směru Orbital 2s - pohled ve směru Orbital 2s - pohled ve směru osy y osy z osy x
Orbital 2px -pohled ve směru osy x
Orbital 2px -pohled ve směru osy y
Orbital 2px -pohled ve směru osy z
Orbital 2py - pohled ve směru osy x
Orbital 2py - pohled ve směru osy y
Orbital 2py - pohled ve směru osy z
Orbital 2pz - pohled ve směru osy x
Orbital 2pz - pohled ve směru osy y
Orbital 2pz - pohled ve směru osy z
185
Orbital 3s - pohled ve směru Orbital 3s - pohled ve směru Orbital 3s - pohled ve směru osy y osy z osy x
Orbital 3px - pohled ve směru osy x
Orbital 3px - pohled ve směru osy y
Orbital 3px - pohled ve směru osy z
Orbital 3py - pohled ve směru osy x
Orbital 3py - pohled ve směru osy y
Orbital 3py - pohled ve směru osy z
Orbital 3pz - pohled ve směru osy x
Orbital 3pz - pohled ve směru osy y
Orbital 3pz - pohled ve směru osy z
Orbital 3dxy - pohled ve směru osy x
Orbital 3dxy - pohled ve směru osy y
Orbital 3dxy - pohled ve směru osy z
186
Orbital 3dxz - pohled ve směru osy x
Orbital 3dxz - pohled ve směru osy y
Orbital 3dxz - pohled ve směru osy z
Orbital 3dyz - pohled ve směru osy x
Orbital 3dyz - pohled ve směru osy y
Orbital 3dyz - pohled ve směru osy z
Orbital 3dx2-y2 - pohled ve Orbital 3dx2-y2 - pohled ve Orbital 3dx2-y2 - pohled ve směru osy y směru osy z směru osy x
Orbital 3dz2 - pohled ve směru osy x
Orbital 3dz2 - pohled ve směru osy y
Orbital 3dz2 - pohled ve směru osy z
2.2 KVANTOVÁ ČÍSLA Hlavní kvantové číslo n může nabývat hodnot
1, 2, 3, 4, 5 … Zejména ve spektroskopii se používá alternativní značení pomocí velkých písmen. Určuje tzv. slupku atomu (všechny atomové orbitaly se stejným n patří do téže slupky). V elektrostatickém 187
1 n 2 , kde E0 je energie základního stavu. přiblížení n čísluje dovolené hodnoty energie Tento vztah je identický s výsledkem, který dostaneme v rámci Bohrova modelu atomu. Soubor těchto dovolených hodnot představuje energetické spektrum atomu vodíku. E n = E0
Vedlejší kvantové číslo l může nabývat hodnot
0, 1, 2, 3 až n-1 kde n je hlavní kvantové číslo. Opět se používá alternativní značení, zde ovšem pomocí malých písmen. Určuje tzv. podslupku dané slupky. Tedy n-tá slupka se skládá z n podslupek Všechny atomové orbitaly dané slupky, tj. orbitaly s určitým n, které mají určeno i l, patří do l-té podslupky, n-té slupky). Hodnota l určuje dovolené hodnoty velikosti orbitálního momentu hybnosti l = l (l + 1)
. V případě započtení relativistických korekcí závisí hodnota energie i na kvantovém čísle l. Magnetické kvantové číslo m může nabývat pouze následujících hodnot: − l , − l + 1, − l + 2, − l + 3,..... − 2, − 1, 0, 1, 2, ..... l − 3, l − 2, l − 1, l .
I zde se používá alternativní značení, tentokráte pomocí řeckých písmen. Spolu s hlavním a vedlejším kvantovým číslem určuje magnetické kvantové číslo atomový orbital. V l-té podslupce může být pouze 2l + 1 orbitalů:
Hodnota (Pod)slupka
2l+1 orbitalů
l
0
s
1
1
p
3
2
d
5
3
f
7
Hodnota m čísluje dovolené hodnoty z-ové složky orbitálního momentu hybnosti: l z = m . Pojmenování magnetického čísla má svůj původ ve skutečnosti, že na něm závisí energie atomu v magnetickém poli (viz Zeemanův jev) Orbitální moment hybnosti elektronu (též dráhový moment hybnosti) souvisí s pohybem elektronu v prostoru a je klasicky definován vztahem l = r × p , kde r je polohový vektor a p hybnost. V kvantové mechanice nelze určit všechny tři jeho složky, ale pouze jeho velikost a některou ze složek (volí se z-ová složka), jejichž dovolené hodnoty jsou určeny hodnotami vedlejšího kvantového čísla a magnetického kvantového čísla.
Protože částice mohou mít kromě orbitálního momentu hybnosti ještě vlastní moment hybnosti s neboli spin, je třeba jejich stav popsat ještě spinovým číslem s a magnetickým spinovým číslem ms , které může nabývat hodnot 188
− s, − s + 1, − s + 2, ... s − 3, s − 2, s − 1, s
Velikost spinu částice je určena hodnotou spinového čísla: s = s ( s + 1) spinu pak hodnotou magnetického spinového čísla sz = ms .
, hodnota z-ové složky
Pro danou částici je hodnota s jednoznačně určena, proto se pro určení stavu částice uvádí pouze hodnota ms . Navíc se v rámci kvantové mechaniky pro zjednodušení i o ms často hovoří pouze jako o spinovém čísle nebo jako o „spinu“, či „hodnotě spinu“. Elektron má s = 1/ 2 , a tedy ms = ±1/ 2 . V případě elektronu tedy platí s =
3 2
1 a sz = ± 2
.
Existenci spinu elektronu poprvé předpokládali Uhlenbeck a Goudsmit, za její důkaz se dnes považuje zejména Sternův-Gerlachův experiment a Einsteinův-de Haasův pokus. Alternativní značení hodnot hlavního kvantového čísla Hodnota n 1 2 3 4 5 6 7 …
Alternativní značení
K L M N O P Q …
Alternativní značení hodnot vedlejšího kvantového čísla Hodnota l 0 1 2 3 4 5 6 7 8
…
Alternativní značení
…
s
p
d
f
g
h
i
k
l
Alternativní značení hodnot magnetického kvantového čísla Hodnota m … -2 -1 0 1 2
Alternativní značení
…
−δ
−π σ
π
δ
3
4
5
6
7
8
…
ϕ
γ
η
ι
κ
λ
…
V rámci kvantové mechaniky V rámci kvantové mechaniky není obecně moment hybnosti jakožto vektor definován, neboť nelze určit současně všechny tři jeho složky. Navíc spin – vlastní moment hybnosti jakožto základní charakteristika částice se zavádí až v kvantové mechanice.
3. VÍCEELEKTRONOVÉ ATOMY 3.1 Metoda efektivního potenciálu 3.2 Výstavba atomového obalu 3.3 Metoda slabé vazby 3.3.1 Landého pravidlo intervalů 3.3.2 Vektorový model atomu 3.4 Metoda silné vazby
189
3. VÍCEELEKTRONOVÉ ATOMY V případě atomů s více elektrony narážíme na problémy, které jsou ve fyzice (klasické i kvantové) obvyklé v případě řešení systémů tří a více interagujících částic. Pokud interakční energie částic nemá vhodný tvar, který by umožňoval přímo rozdělit systém n částic na n jednočásticových systémů, je nutno použít jednočásticové přiblížení, což je postup, kterým je možno dosáhnout separaci rovnice popisující n částic na n rovnic pro jednu částici. Použitá metoda přitom může být různá. Ve většině případů se jedná o přibližné metody, které zanedbávájí při popisu systému některé „malé“ vlivy. Tyto metody můžeme rozdělit do tří skupin: •
Přiblížení neinteragujících částic. V případě „malé“ interakce je možno ji zanedbat. Výpočet je
možné následně zpřesnit použitím poruchové metody. •
Metoda efektivního potenciálu. Interakční energie se rozdělí na dvě části. První část, tzv. efektivní potenciál (též střední pole), představuje zprůměrované působení zbývajících n-1 částic
na danou částici. Tuto část je možno separovat. Druhá, neseparovatelná část se označuje jako zbytková interakce (též korelační energie), kterou je možno zanedbat, pokud je „slabá“. Opět je
možné dodatečně zpřesnit výpočet započtením zbytkové interakce jako poruchy. •
Metoda kvazičástic. Provede se transformace souřadnic tak, aby v nových souřadnicích už bylo
možné provést separaci interakční energie (buď přímo, nebo opět po zanedbání „malých členů). Nové souřadnice zpravidla už nepopisují stav jednotlivých původních částic systému, ale jednotlivých myšlených částic, tzv. kvazičástic (ve speciálním případě dvou částic viz metoda redukované hmotnosti). Pro řešení problému víceelektronových atomů se volí zpravidla metoda efektivního potenciálu, která se aplikuje na elektronový obal atomu.
3.1 METODA EFEKTIVNÍHO POTENCIÁLU Při řešení problému atomu s více elektrony je možno vyjít ze Schrödingerovy rovnice pro Z elektronů a jádro. Pro základní výpočet se využívá přiblížení nekonečně velké hmotnosti jádra a elektrostatické přiblíženía to stejně jako při řešení atomu vodíku. Vliv pohybu jádra je možné započíst metodou redukované hmotnosti). I v rámci těchto přiblížení není možné zmíněnou Schrödingerovu rovnici řešit a je třeba použít v dalším textu uvedeného postupu spočívajícího hlavně v zanedbání tzv. zbytkové interakce, která souvisí se vzájemnou korelací pohybu elektronů. Tento postup se označuje jako metoda efektivního potenciálu. Pro zpřesnění popisu spekter je možno započíst zbytkovou interakci a neelektrostatické interakce dodatečně s využitím poruchové metody. 190
Schrödingerova rovnice pro atom se Z elektrony a s jádrem v počátku souřadnic má za výše uvedených předpokladů tvar Z Z Hˆ (∆ , r ) + U ee (r , r ) Ψ (r , r , r ,...r , r ) = E Ψ (r , r , r ,...r , r ) ∑ ij i i 1 2 3 Z −1 Z 1 2 3 i i i Z −1 Z ∑ i , j =1 i =1 < i j kde platí 2 Ze 2 e2 ee Hˆ i = − ∆i + U = ij 4πε 0 | rj − ri | , přičemž 4πε 0 | ri | a 2me
r = ( xi , yi , zi ) je polohový vektor a
∆i =
∂2 ∂2 ∂2 + + ∂xi2 ∂yi2 ∂zi2 je příslušný Laplaceův operátor.
ee ˆ Výraz H i má analogický tvar jako hamiltonián atomu vodíku. Člen U ij představuje energii elektrostatické interakce mezi elektrony i a j. Interakci mezi elektrony nelze zanedbat a vzhledem ee k tvaru U ij ji ani není možné rozepsat jako součet energií příslušejících i-tému elektronu.
Proto se zavádí EF efektivní potenciál i-tého elektronu U i , který představuje průměrnou hodnotu energie interakce
tohoto elektronu se všemi zbývajícími elektrony. K jeho výpočtu se používá zpravidla Hartreeho-Fockovy metody, která uvažuje i princip nerozlišitelnosti identických částic. Tento potenciál není obecně sféricky symetrický, a proto se ještě „středuje“, tak aby sféricky symetrický byl. V tomto případě se hovoří o přiblížení centrálního pole. Schrödingerova rovnice potom přechází na tvar Z Z ˆ EF R H r ( , ) ∆ + ∑ i i i ∑ U i (| ri |) + U (r1 ,.., rZ ) Ψ (r1 ,.. , rZ ) = E Ψ (r1 ,.., rZ ) i =1 i =1 . R Zbytková interakce U
představuje zbývající část elektrostatické interakce nezapočtenou do
příslušného efektivního potenciálu. Je to tedy ta část elektrostatické interakce mezi elektrony, která souvisí s jejich korelacemi. R R Pokud můžeme v předcházející rovnici U zanedbat (alespoň v základním přiblížení, tzn. že U lze považovat za poruchu), dostáváme řešení Schrödingerovy rovnice (s neporušeným hamiltoniánem) ve tvaru, který je podobný řešení Schrödingerovy rovnice pro atom vodíku, tzn. stavy elektronů v atomu můžeme v rámci jednočásticového přiblížení popsat opět kvantovými čísly n, l, m a ms .
Hodnoty energetických hladin se budou ale lišit od hodnot, které jsme získali řešením Schrödingerovy rovnice pro atom vodíku (navíc jsou funkcí n i l). Rovněž se budou lišit i příslušné 191
radiální části atomových orbitalů. Obsazování jednočásticových stavů elektrony se řídí pravidly výstavby atomového obalu. Pokud potřebujeme získat přesnější obraz spektra víceelektronového atomu, je třeba navíc uvažovat další interakce (viz zpřesnění popisu spekter atomů). Jejich vliv se započítává nejčastěji s využitím poruchové metody. Podle vzájemného poměru velikosti dvou nejvýznamějších interakcí, již LS zmíněné zbytkové interakce a spin-orbitální interakce U , rozlišujeme v přístupu k řešení a popisu R LS stavu víceelektronového atomu dva mezní případy. Pro U > U , tzv. vazbu LS (též slabou vazbu R LS neboli tzv. Russelovo-Saundersovo přiblížení) a pro U < U tzv. vazbu jj (též silnou vazbu).
„středuje“ Potenciál se nahradí jeho průměrnou hodnotou pro všechny směry.
3.2 VÝSTAVBA ELEKTRONOVÉHO OBALU ATOMU V případě víceelektronového atomu se řídí obsazování jednotlivých elektronů do jednočásticových stavů pravidly výstavby atomového obalu: o
Princip minima energie
Libovolný systém (v daném případě atom) nepodléhající vnějšímu působení přechází samovolnými procesy do stavu s nejnižší možnou energií. o
Pauliho vylučovací princip
Dva fermiony (v případě atomu dva elektrony) se nemohou nacházet ve stejném stavu, jejich stavy se musí lišit alespoň v jednom kvantovém čísle. o
Hundovo pravidlo maximální multiplicity
Součet magnetických spinových čísel ms všech elektronů v podslupce, resp. tzv. 2
multiplicita o
∑
podslupka
ms + 1
, musí být maximální.
Madelungovo pravidlo n+l
Ze dvou elektronů má větší energii elektron v podslupce s větším součtem n+l, pokud je tento součet stejný, má větší energii elektron v podslupce s vyšší hodnotou čísla n. První dvě pravidla představují univerzální principy s obecnější platností, která aplikujeme na atom. Druhá dvě pravidla jsou původně empirickými pravidly, která je nutno ověřit výpočtem pro každý atom zvlášť, přičemž pro některé atomy a jejich konfigurace existují výjimky z pravidla. Princip minima energie. Tento princip představuje univerzální zákonitost systémů, jejich snahu dostat se do rovnovážného stavu, který je charakterizován minimální energií – tzv. základní stav. Do tohoto základního stavu se ovšem systém dostane pouze procesy, které splňují další zákony, např. zákony zachování a v případě fermionů Pauliho vylučovací princip.
192
Pauliho vylučovací princip. Pro elektrony v atomu z tohoto principu vyplývá, že v daném atomovém orbitalu (určeném čísly n, l, m) se mohou nacházet nejvýše dva elektrony s opačnou hodnotou ms , tj. ms = ±1/ 2 (pozn.). Hundovo pravidlo maximální multiplicity. Splnění pravidla zajistíme tím, že při obsazování orbitalů dané podslupky elektrony obsadíme nejdříve všechny tyto orbitaly elektrony se „spinem“ ↑ ( ms = +1/ 2 ) a poté doplníme případné zbývající elektrony se „spinem“ ↓ ( ms = −1/ 2 ), tak aby
byl současně splněn Pauliho princip. Madelungovo pravidlo n + l, někdy též ve spojení s principem minima energie označované jako výstavbový princip. Toto pravidlo je pouze empirickým pravidlem, ze kterého existují výjimky. Pořadí podslupek podle energetických hladin (splňující pravidlo n+l) můžeme získat pomocí výstavbového trojúhelníka. Viz dále. Výstavbový trojúhelník: l→ s p d f n
↓ ↓ ↓ ↓ ↓ ↓ ↓
V tabulce jsou uvedeny hodnoty n pro jednotlivé hodnoty l, kterým odpovídají jednotlivé sloupce. Pořadí podslupek podle rostoucí energie, tj. podle pravidla n+l, dostaneme, pokud čteme hodnoty n po řádcích zprava doleva a se shora dolů a připisujeme k nim odpovídající hodnoty l uvedené v prvním řádku příslušného sloupce (nl).
1 2 3
2
4
3
5
4
3
6
5
4
7
6
5
4
8
7
6
5
↓
↓
↓
↓ →
S využitím výstavbového trojúhelníka tedy dostáváme následující pořadí podslupek. Ty členíme do tzv. period, které se sdružují po dvou do tzv. cyklů.
1s 2s 2p 3s 3p 4s 3d 4p 5s 4d 5p 6s 4f 5d 6p 7s 5f 6d 7p …… 1. 2.
3.
4.
5.
6.
7.
H Typické Primární Sekundární Prvky Doplnění Doplnění
← perioda ← cyklus
Místo period se zejména v chemii hovoří o „slupkách“, jež nesmíme zaměnit za slupky K, L, M …, které sdružují podslupky se stejnou hodnotou n . Viz kvantová čísla. Např. plně obsazená „slupka“ (tj. 3. perioda) u argonu neznamená, že by byla obsazena celá slupka M (tj. 3. slupka), neobsazena je podslupka 3d. Elektrony
Elektrony jsou fermiony se spinovým číslem
s = 1/ 2 . 193
Poznámka Pro jednoduchost se v kvantové fyzice hovoří o „opačné orientaci spinu“, tj. ↑↓., byť je to v konzistenci s klasickou fyzikou poněkud nepřesné. V kvantové teorii nelze orientaci vektoru momentu hybnosti jednoznačně určit.
3.3 METODA SLABÉ VAZBY (VAZBA LS, RUSSELOVO-SAUNDERSOVO PŘIBLÍŽENÍ) Metoda slabé vazby vychází při popisu víceelektronového atomu z předpokladu, že interakce mezi spinem a orbitálním momentem hybnosti (spin-orbitální interakce) pro jednotlivý elektron je mnohem menší než zbytková interakce mezi elektrony navzájem. V takovém případě je možno v rámci poruchové teorie považovat spinorbitální interakci za poruchu a popisovat stav víceelektronového atomu v nultém přiblížení pomocí vlnových funkcí neporušeného hamiltoniánu.
Při zanedbání spinorbitální interakce je možno vlnové funkce (vlastní funkce neporušeného ˆ ˆ hamiltoniánu H 0 ) hledat současně jako vlastní funkce operátorů z-ové složky S z a velikosti Sˆ Z
celkového vlastního momentu hybnosti
S = ∑ si i =1
a rovněž jako vlastní funkce operátorů z-ové Z
L = ∑ li
ˆ i =1 , kde si a li složky Lz a velikosti Lˆ celkového vlastního momentu hybnosti představují spin a orbitální moment hybnosti i-tého elektronu v atomu se Z elektrony.
To je dáno tím, že v nepřítomnosti spinorbitální interakce by se kromě celkového momentu hybnosti J zachovávaly rovněž S a L , což v kvantové mechanice znamená, že jsou splněny komutační relace v následujícím tvaru: Hˆ 0 , Sˆ = 0ˆ Hˆ 0 , Lˆ = 0ˆ Hˆ 0 , Sˆz = 0ˆ Hˆ , Lˆ = 0ˆ , , a 0 z , kde 0ˆ je nulový operátor a hranaté závorky označují komutátor. Formálně je splnění relací ˆ ˆ ˆ ˆ ˆ zajištěno tím, že H 0 neobsahuje členy závislé na spinech. Všechny operátory L, S , Lz , S z tedy komutují s neporušeným hamiltoniánem, navíc z vlastností momentu hybnosti v kvantové mechanice plyne, že komutují i mezi sebou navzájem. Odtud vyplývá, že vlnové funkce je možno skutečně hledat jako společné vlnové funkce výše uvedených operátorů. Tyto vlastní funkce pak můžeme číslovat odpovídajícími kvantovými čísly L, S, M L a M S . V metodě slabé vazby se volí pro popis víceelektronového atomu jiný soubor kvantových čísel. Protože J se zachovává, platí současně komutační relace ˆ ˆ ˆ ˆ ˆ ˆ H0 , J = 0 a H0 , J z = 0 . ˆ ˆ ˆ ˆ ˆ Můžeme tedy hledat vlastní funkce H 0 jako společné vlastní funkce systému operátorů L, S , J , J z . Stav víceelektronového atomu je pak popsán odpovídajícími kvantovými čísly L, S, J a M J . Pro vlastní hodnoty operátorů velikostí a z-ových komponent jednotlivých momentů hybnosti platí:
194
J = J ( J + 1) , J z = M J ,
M J = − J , − J + 1, − J + 2, ... J − 2, J − 1, J
,
L = L( L + 1) , Lz = M L ,
M L = − L, − L + 1, ..., − 1, 0, 1, 2, ... , L − 1, L
,
S = S ( S + 1) , S z = M S ,
M S = − S , − S + 1, − S + 2, ... S − 2, S − 1, S
.
Protože J = L + S , platí navíc podle pravidel skládání momentu hybnosti:
J = L − S , L − S + 1, L − S + 2, ..., L + S − 2, L + S − 1, L + S
.
Číslo J tedy nabývá pro L ≥ S celkem 2S + 1 a pro L ≤ S celkem 2 L + 1 různých hodnot. Čísla M ve vztazích se označují v analogii s atomem vodíku jako magnetická kvantová čísla. Stav s určitou hodnotou kvantových čísel L a S se označuje jako term. Stav víceelektronového atomu v rámci slabé vazby se popisuje pomocí Rusellovy-Saundersovy symboliky 2 S +1
LJ
kde 2S + 1 bývá zvykem označovat jako multiplicitu (termu). Takto definovaná multiplicita je ovšem skutečnou multiplicitou, tj. násobností termu, pouze pro L ≥ S . Hodnoty multiplicity a J se uvádějí číslem, místo hodnoty L se uvádí odpovídající značení pomocí písmen obdobně jako v případě vedlejšího kvantového čísla l u atomu vodíku, ale s tím rozdílem, že se používají odpovídající velká písmena abecedy: S, P, D, … (odpovídají L = 0, 1, 2, …). Příklad: Pro excitovaný stav He: 1s12s1 můžeme dostat dva různé termy: 1 S0 (singlet, multiplicita rovna 1, S = 0, též parahelium) a 3 S1 (triplet, multiplicita rovna 3, S = 1, též ortohelium). Pokud není započtena zbytková interakce, mají všechny termy pro danou konfiguraci stejnou energii. Po započtení zbytkové interakce mají různé termy různou energii (sejmutí degenerace v L a S), ale všechny stavy odpovídající danému termu mají energii stejnou. Vektory L a S se stále zachovávají. Hladina daného termu (L,S) je (2 L + 1) (2 S + 1) krát degenerovaná. V případě započtení spin-orbitální interakce dochází k sejmutí degenerace i v J. Zůstává degenerace v M J . Energetická hladina odpovídající danému termu se tedy po započtení spin-orbitální interakce rozpadá na 2S + 1 (pro L ≥ S ), resp. 2 L + 1 (pro L ≤ S ). Ve druhém případě není počet energetických hladin roven dříve zavedené multiplicitě.
195
Pro danou elektronovou konfiguraci atomu mají nejnižší energii stavy s nejvyšší hodnotou S (viz Hundovo pravidlo), mezi stavy s daným S mají nejnižší energii stavy s nejvyšší hodnotou L. Energii pro danou konfiguraci můžeme tedy zapsat ve tvaru E ({ A},{L, S } , J ) = E0 ({ A}) + ER ({ A},{L, S }) + ELS ({ A},{L, S} , J ),
kde { A} je elektronová konfigurace atomu v jednoelektronovém přiblížení, {L, S } představuje term odpovídající této konfiguraci, E0 je energie v jednoelektronovém přiblížení, ER je korekce energie odpovídající zbytkové interkci a ELS je korekce energie vlivem spinorbitální interakce. Vzdálenost mezi sousedními energetickými hladinami určuje Landého pravidlo intervalů. Pro schematické znázornění stavu atomu v metodě slabé vazby se používá vektorový model atomu. R LS Předpoklad metody slabé vazby ( U > U ) je dobře splněn pro lehké atomy.
196
komutují Znamená to, že splňují komutační relaci. Jinak řečeno nezaleží na pořadí aplikace operátorů na příslušnou funkci. Např.
ˆ a Bˆ komutují, pak AB ˆ ˆ Ψ = BA ˆ ˆΨ pokud A
3.3.1 LANDÉHO PRAVIDLO INTERVALŮ V rámci metody slabé vazby můžeme celkovou spinorbitální interakci popsat jako vzájemnou vazbu mezi celkovým orbitálním a celkovým vlastním momentem hybnosti ˆˆ U LS = α ({ A},{L, S }) ⋅ LS , kde α je parametr. Protože | J |2 =| L + S |= | L |2 +2 LS + | S |2 , platí U LS =
(
)
α ˆ 2 ˆ 2 ˆ 2 | J | − | L | +| S | ,
2 a tedy pro korekci energie máme
ELS ({ A},{L, S }, J ) = { A},{L, S }, J , M J U LS { A}, {L, S }, J , M J = =
α 2 α ( L, S ) J ( J + 1) − ( L( L + 1) + S ( S + 1) ) . | J | − | L |2 +| S |2 = 2
(
)
2
Pro vzdálenost sousedních energetických hladin (J se liší o 1), které příslušejí danému termu (pevné L a S), tedy platí
α
( J ( J + 1) − ( J − 1) J ) = α J 2 , což je tzv. Landého pravidlo intervalů: ∆E = E ( J ) − E ( J − 1) =
Vzdálenost energetických hladin daného termu je přímo úměrná kvantovému číslu J, tj. ∆E = α J .
3.3.2 VEKTOROVÝ MODEL ATOMU Na základě výsledků metody slabé vazby se stav víceelektronového atomu často znázorňuje vykreslením vektorů momentů hybnosti J , L a S (značí postupně: celkový, orbitální a vlastní moment hybnosti atomu). Protože v kvantové mechanice není možno současně měřit jednotlivé složky momentu hybnosti, ale lze současně určit např. jeho z-obou komponentu a velikost, musíme možné polohy vektorů znázornit ve formě kuželů (v analogii s klasickou mechanikou označovaných často jako precesní kužely). Takové znázornění bývá zvykem nazývat vektorový model atomu. Dovolené hodnoty velikosti a z-ové složky celkového momentu hybnosti atomu J = L + S se získají v kvantové mechanice na základě pravidel o skládání momentu hybnosti.
197
3.4 METODA SILNÉ VAZBY (VAZBA JJ) Metoda silné vazby vychází při popisu víceelektronového atomu z opačného předpokladu než metoda slabé vazby. Interakce mezi spinem a orbitálním momentem hybnosti (spin-orbitální interakce) pro jednotlivý elektron je mnohem větší než zbytková interakce mezi elektrony navzájem. V takovém případě je možno na základě poruchové teorie považovat zbytkovou interakci elektronů za poruchu a popisovat stav víceelektronového atomu v nultém přiblížení pomocí vlnových funkcí neporušeného hamiltoniánu.
Při zanedbání zbytkové interakce je možno vlnové funkce (vlastní funkce neporušeného ˆ ˆ ˆ hamiltoniánu H 0 ) hledat současně jako vlastní funkce operátorů z-ové složky ji , z a velikosti ji celkového vlastního momentu hybnosti ji = li + si , i = 1,2…Z, kde si a li představují spin a orbitální moment hybnosti i-tého elektronu v atomu se Z elektrony. To je dáno tím, že v nepřítomnosti zbytkové interakce by se kromě celkového momentu hybnosti J zachovávaly rovněž ji , což v kvantové mechanice znamená, že jsou splněny komutační relace ve tvaru: Hˆ 0 , ˆji = 0ˆ
a
Hˆ 0 , ˆji , z = 0ˆ ,
kde 0ˆ nulový operátor a hranaté závorky označují komutátor. Odtud vyplývá, že vlnové funkce je možno skutečně hledat jako společné vlnové funkce výše uvedených operátorů. Tyto vlastní funkce 198
( m j )i . Analogicky jako u metody pak můžeme číslovat odpovídajícími kvantovými čísly ji a slabé vazby můžeme volit pro popis víceelektronového atomu jiný soubor kvantových čísel. Protože J se zachovává, platí současně komutační relace Hˆ 0 , Jˆ = 0ˆ Hˆ 0 , Jˆ z = 0ˆ a . ˆ ˆ ˆ ˆ Můžeme tedy hledat vlastní funkce H 0 jako společné vlastní funkce systému operátorů ji , J , J z . Stav víceelektronového atomu je pak popsán odpovídajícími kvantovými čísly ji , J a M J , nikoliv
však jednoznačně, protože pro dané ji můžeme určitou hodnotu J a M J dostat pro různé kombinace hodnot
(m ) . j i
Na rozdíl od slabé vazby se případ silné vazby nevyskytuje v „čisté podobě“, tzn. zbytková interakce u atomů nebývá výrazně menší než spinorbitální interakce. Nejlépe splňují předpoklady metody silné vazby elektrony ve vyšších excitovaných stavech u těžších atomů. U těchto těžších atomů je třeba pro získání spektra odpovídajícího experimentu uvažovat superpozice stavů získaných v rámci metody silné a slabé vazby, přičemž pro elektrony vnitřních slupek se jedná téměř o „čistou“ slabou vazbu.
4. ATOM V ELEKTRICKÉM A MAGNETICKÉM POLI 4.1 Starkův jev 4.2 Zeemanův jev 4.3 Magnetický moment atomu 4.3.1 Sternův-Gerlachův pokus 4.3.2 Einsteinův-de Haasův pokus
4.3 MAGNETICKÝ MOMENT ATOMU Celkový magnetický moment atomu µ J dostaneme jako součet orbitálních a vlastních magnetických momentů jednotlivých elektronů atomového obalu. Magnetický moment jádra můžeme zanedbat, protože je velmi malý (viz jaderný magneton). Orbitální magnetický moment hybnosti elektronu µ l souvisí s pohybem elektronu v prostoru, je vázán na orbitální moment hybnosti elektronu a je možno jej interpretovat i v rámci nekvantové fyziky (pozn.). Vlastní (též spinový) magnetický moment elektronu µ s je základní vlastností elektronu, souvisí s vlastním momentem hybnosti elektronu – spinem. Za důkaz existence vlastního magnetického momentu elektronu můžeme považovat Sternův-Gerlachův pokus a Einsteinův-de Haasův pokus.
V kvantové mechanice jsou µ l a µ s určeny kvantovacími vztahy pro µl a µ l , z , resp. µ s a µ s , z . 199
Při určení celkového magnetického µ J na rozdíl od výpočtu celkového momentu hybnosti musíme vzít v úvahu rozdílné hodnoty gyromagnetických poměrů, resp. Landého faktorů, pro orbitální momenty ( gl = −1 ) a pro vlastní momenty ( g s = −2 ). Magnetický moment atomu je tedy roven
µB
µJ = −
{L + 2S } ,
kde L a S jsou celkový orbitální moment hybnosti a celkový vlastní moment hybnosti a µ B je Bohrův magneton. Podle definice Landého faktoru gJ pro atom platí
µJ =
µB
µB Porovnáním obou vztahů získáme po vydělení
gJ J
.
vztah − g J J = L + 2S , který zprava skalárně
vynásobíme celkovým momentem hybnosti atomu J = L + S . 2
Máme tedy vztah pomocí identit: 2
2
− g J J = L J + 2S J 2
S = J − L = J − 2 JL + L
2
2
2
a
, ve kterém skalární součiny na pravé straně vyjádříme 2
L = J − S = J − 2 JS + S
2
.
Po úpravě tak rovnice přejde na tvar 2 2 2 2 2 2 2 1 2 1 2 1 2 1 −gJ J = J + L − S + J + S − L = 3 J + S − L 2 2 2 2 .
(
)
Protože případ J = 0 je triviální, neboť z výše uvedeného pak plyne µ J = 0 , budeme dále uvažovat 2
J X = X ( X + 1) a dosazení vztahů pro velikosti pouze J ≠ 0 . Po vydělení rovnice jednotlivých momentů hybnosti (viz metoda slabé vazby), kde X = J, L a S , dostáváme 1 L( L + 1) − S ( S + 1) gJ = − 3 + 2 J ( J + 1) , kde druhý člen v závorce může nabývat hodnot od –1 (J = L) do + 1 ((J = S), a tudíž velikost Landého faktoru atomu nabývá hodnot z intervalu 1, 2 . Pro krajní případy nulového vlastního momentu hybnosti, resp. nulového orbitálního momentu hybnosti máme normální ( g J = gl = −1 ), resp. anomální ( g J = g s = −2 ) hodnotu gyromagnetického poměru. Dosazením Landého faktoru do vztahu pro celkový magnetický moment atomu dostáváme pro jeho velikost a z-ovou složku
µ J = g J J ( J + 1) µ B a µ J = g J M J µ B , 200
kde M J = − J , − J + 1, − J + 2, ... J − 2, J − 1, J . Poznámka Podle klasické elektrodynamiky pohybující se elektrické náboje budí magnetické pole. Každá elektricky nabitá částice, tedy i elektron, tak má magnetický moment související s jejím pohybem v prostoru.
4.3.1 STERNŮV-GERLACHŮV POKUS V roce 1921 fyzikové Stern a Gerlach realizovali experiment, jehož cílem bylo určení magnetického momentu atomů různých prvků (nejdříve stříbro - Ag, později atomy dalších prvků), přesněji jeho projekce do směru magnetického pole. Pokud vektor indukce magnetického pole je ve směru osy z ( B = (0, 0, B ) ), představuje tato projekce z-ovou komponentu µ J , z celkového magnetického momentu atomu µ J . Shrňme nejdříve významné výsledky experimentu. o
Při měření byl objeven nenulový magnetický moment u atomů, o nichž se předpokládalo, že jejich magnetický moment je roven nule. Jednalo se o atomy, které mají nulový orbitální magnetický moment, který souvisí s pohybem částic v prostoru. Jiný původ magnetického momentu se původně nepředpokládal. V experimentu objevený „nadbytečný“ magnetický moment byl objasněn teprve předpokladem o existenci vlastního magnetického momentu elektronu.
o
Magnetické momenty jsou kvantovány, projekce momentu do směru magnetického pole může nabývat pouze určitých hodnot. V případě vlastního magnetického momentu elektronu nabývá pouze dvou opačných hodnot.
Princip a uspořádání Sternova-Gerlachova experimentu jsou uvedeny dále.
USPOŘÁDÁNÍ A PRINCIP EXPERIMENTU V experimentu byla jako zdroj atomů použita pícka (pokovená platinová spirála), z níž se do různých směrů odpařovaly jednotlivé atomy. Pomocí kolimátoru („štěrbiny“) byl vybrán proud („paprsek“) atomů, které prolétaly nehomogením magnetickým polem a následně byly detekovány na stínítku. Směr magnetické indukce je kolmý na směr pohybu atomů (např. směr osy x). Pokud nedochází k jejich ionizaci, interagují atomy s magnetickým polem pouze prostřednictvím svého magnetického momentu. Atom tak získává v magnetickém poli dodatečnou energii U (r ) = − µ J B(r ) = − µ J , z B(r ) , což není nic jiného než potenciální energie magnetického momentu v magnetickém poli.
201
Animace Sternův- Gerlachův pokus Spustit animaci
Na atomy pak působí síla F = −∇U (r ) = µ J , z ∇B(r ) , která je nulová nejen v případě nepřítomnosti pole (B = 0), ale též v případě homogenního magnetického pole (B = konst v r ). Proto bylo v experimentu použito magnetické pole nehomogenní ve směru osy z (B = B(z)), které bylo vytvořeno pomocí speciálně tvarovaných pólových nadstavců magnetu. Tedy nenulová bude složka d B( z ) Fz = µ J , z dz . síly ve směru osy z: Průmět magnetického momentu do směru z můžeme vyjádřit pomocí jeho velikosti µJ a úhlu ϕ, který svírá s osou z: µ J , z = µ J z0 = µ J cos ϕ . Z pohledu klasické fyziky může tedy průmět nabývat všech hodnot z intervalu − µ J , µ J , to znamená, že Fz se rovněž bude spojitě měnit od určité minimální po maximální hodnotu, a tedy atomy po vychýlení ve směru osy z mohou dopadat na stínítko v určitém intervalu − zmax , zmax , tudíž „stopa“ pozorovaná po dopadu částic by měla být spojitá.
PROSTOROVÉ KVANTOVÁNÍ V experimentu ovšem nikdy nebyla pozorovaná spojitá stopa, ale několik (kolem roviny xy rozložených) diskrétních stop. Vznik diskrétních stop je důsledkem kvantováním magnetického momentu, resp. s ním souvisejícího momentu hybnosti. Z historických důvodů se tento jev označuje často jako „prostorové kvantování“, což vychází z klasické představy, že vektor příslušného momentu může zaujímat pouze určité polohy v prostoru. Srovnej vektorový model atomu.
202
VLASTNÍ MAGNETICKÝ MOMENT ELEKTRONU Kromě důkazu kvantování momentu hybnosti ovšem z výše uvedeného experimentu vyplynuly také další skutečnosti. Podle stavu tehdejších znalostí se předpokládalo, že celkový magnetický moment souvisí pouze s pohybem elektronů v prostoru („obíhají kolem jádra“), jedná se tedy o celkový orbitální magnetický moment. Předpokládalo se, že atomy, jejichž celkový orbitální moment hybnosti je roven nule, budou mít celkový magnetický moment rovněž nulový. V některých případech se ale zjistilo, že tyto atomy přesto magnetický moment mají. Byly to např. stříbro (Ag), zlato (Au), lithium (Li), sodík (Na), draslík (K), později též vodík (H), u nějž se místo pícky použil elektrický výboj. Interpretace u atomů těchto prvků je jednodušší než v případech jiných atomů, protože mají pouze jeden elektron ve valenční (pod)slupce (celkové momenty zcela obsazených slupek jsou nulové) a tato (pod)slupka je typu s (orbitální momenty elektronu jsou nulové). V případě uvedených prvků případech byly pozorovány dvě diskrétní stopy (rozložené kolem roviny xy). Podařilo se je interpretovat teprve v roce 1925 na základě hypotézy Uhlenbecka a Goudsmita o existenci vlastního momentu hybnosti elektronu – spinu a s ním souvisejícího vlastního magnetického momentu elektronu, jejichž z-ové komponenty mohou nabývat pouze dvou hodnot. 203
Později se potvrdilo, že i v případě atomů s nenulovým orbitálním momentem se může objevit nadbytečný moment související s vlastními momenty elektronů. Další prvky Jednalo se o zlato (Au), měď (Cu), železo (Fe), lithium (Li), sodík (Na), draslík (K). Kvantování magnetického momentu Velikost a z-tová komponenta magnetického momentu mohou nabývat jen určitých hodnot.
4.3.2 EINSTEINŮV-DE HAASŮV POKUS V roce 1915 prováděli fyzikové Einstein a de Haas měření gyromagnetického poměru γ vzorků různých látek (feromagnetika a paramagnetika). Přemagnetováním vzorku s magnetickým momentem µ vz docházelo současně ke změně momentu hybnosti vzorku bvz , neboť oba momenty jsou vzájemně vázány vztahem
µvz = γ bvz Shrňme nejdříve důležité výsledky experimentu. Magnetický moment měly i vzorky látek, u jejichž atomů se předpokládal celkový magnetický moment
rovný nule (nulový orbitální magnetický moment). Srovnej Sternův-Gerlachův
experiment. Později byla tato skutečnost objasněna existencí vlastního magnetického momentu elektronu. Pro některé látky, resp. jejich atomy, nabýval gyromagnetický moment odlišné hodnoty, než jaká vyplývá z klasické teorie (magnetický moment vznikající v důsledku pohybu nabité částice – elektronu, tzv. orbitální magnetický moment). Nejvyšší hodnota gyromagnetického poměru vycházela pro elektron ve slupkách s (nulové orbitální momenty) a byla rovna dvojnásobku klasické hodnoty. Anomální hodnotu je možné objasnit až v rámci relativistické teorie, konkrétně její existence vyplývá z Diracovy rovnice pro elektron v magnetickém poli.
USPOŘÁDÁNÍ A PRINCIP EXPERIMENTU Váleček z feromagnetické nebo paramagnetické látky umístěný v cívce je zavěšen v podélné ose z na torzní niti. Pokud pustíme elektrický proud do indukční cívky, vzniklé magnetické pole ( B || z ) způsobí zmagnetování vzorku v jednom směru (magnetický moment µvz ↑↑ B ). Pokud poté provedeme komutaci elektrického proudu protékajícího cívkou, dojde k překlopení magnetické indukce a tím i k přemagnetování vzorku.
204
Animace Einsteinův-de Haasův pokus Spustit animaci Změna magnetického momentu ∆µvz ve směru osy z pak souvisí s odpovídající změnou momentu hybnosti ∆bvz , kterou lze určit z úhlu pootočení vzorku na závěsu. V experimentu odpovídá kladné hodnotě ∆µvz záporná hodnota ∆bvz . ∆µ vz ∆bvz , což je dáno skutečností, že platí µ vz , z = γ bvz , z , Gyromagnetický poměr pak lze určit jako ∆µvz = max( µvz , z ) − [− max( µvz , z )] = 2 max( µvz , z ) a analogicky též ∆bvz = 2 max(bvz , z ) .
γ=
Pokud předpokládáme, že vzorek je tvořen N atomy daného prvku, můžeme oba momenty (moment hybnosti i magnetický moment) získat jako součet odpovídajících momentů jednotlivých atomů a výše uvedený gyromagnetický poměr vzorku je rovněž gyromagnetickým poměrem atomu, neboť max( µ vz , z ) N 2 max( µ J , z ) max( µ J , z ) ∆µ γ = vz = − =− =− = γ at max(bvz , z ) N 2 max( J z ) max( J z ) ∆jvz Zatímco v případě orbitálních momentů můžeme už i na základě klasické fyziky odvodit, pro e γl = − 2me , což je tzv. normální hodnota, v řadě případů lze naměřit gyromagnetický poměr hodnotu odlišnou. Navíc se ukazuje, že k celkovému momentu, ať už se jedná o moment magnetický nebo moment hybnosti, přistupuje další dodatečný moment, který se podařilo interpretovat teprve na základě hypotézy o spinu elektronu. V případě atomů s celkovým orbitálním momentem rovným nule pak dostáváme hodnotu
γs = −
e me , což se označuje jako anomální hodnota gyromagnetického poměru.
205
Nejjednodušší je interpretace tohoto gyromagnetického poměru v případě atomů, které mají jediný elektron ve valenční (pod)slupce, která je typu s (orbitální moment elektronu roven nule, např. stříbro, tj. Ag). V tomto případě totiž představuje γ s gyromagnetický poměr pro vlastní (též spinové) momenty elektronu. Pro elektron tedy platí
v případě orbitálních momentů
a v případě vlastních momentů
γl = γl =
µl , z lz
µs, z sz
=−
e 2me , tj. normální hodnota
=−
e me , tj. anomální hodnota.
Zde µ l , z , l z , µ s , z a s z jsou postupně z-ové komponenty orbitálního magnetického momentu, orbitálního momentu hybnosti, vlastního (resp. spinového) magnetického momentu a vlastního momentu hybnosti (spinu) elektronu.
LANDÉHO FAKTOR Protože v kvantové mechanice je výhodné uvádět momenty hybnosti v násobcích Planckovy konstanty a magnetické momenty elektronu nebo atomů v násobcích Bohrova magnetonu e µ µ µB = γ = −1 ⋅ B γ s = −2 ⋅ B 2me , můžeme pro gyromagnetické poměry elektronu psát l , resp. , µ γ = g⋅ B . pro atomový gyromagnetický poměr pak obecně Bezrozměrový faktor g se označuje jako Landého faktor. Pro orbitální (též dráhový) magnetický moment elektronu dostáváme vztahy pro velikost a z-ovou složku: µl = l (l + 1) µ B a µl , z = − mµ B , kde l je vedlejší kvantové číslo a m je magnetické kvantové číslo. Pro vlastní (též spinový) magnetický moment elektronu dostáváme vztahy pro velikost a z-tovou složku: µ s = 2 s( s + 1) µ B a µl , z = −2ms µ B , kde s = 1/2 je spinové kvantové číslo a ms = ±1/2 je magnetické spinové kvantové číslo. Tedy µ s = 3µ B a µl , z = ∓ µ B .
5. ZPŘESNĚNÍ POPISU SPEKTER ATOMŮ 5.1 Zbytková interakce 5.2 Relativistické korekce 5.3 Relativistické korelační interakce 5.4 Korekce ovlivněné vlastnostmi jádra 5.5 Korekce kvantové teorie pole 206
5. ZPŘESNĚNÍ POPISU SPEKTER ATOMŮ Při použití spektrometrů s velkým rozlišením zjistíme, že spektra atomů jsou daleko složitější (hovoří se např. o jemné a hyperjemné struktuře spekter), než ta, která vyplývají z řešení Schrödingerovy rovnice v rámci elektrostatického přiblížení metodou efektivního potenciálu. Pro detailní popis struktury spekter atomů je nutné použít obecnější teorie , které by měly vycházet z principů kvantové mechaniky, ale současně zahrnovat též relativistický popis, případně započítat další, ve srovnání s elektrostatickou interakcí méně významné, interakce. Někdy je možné či nutné přímo řešit pohybové rovnice obecnější teorie, často je jednodušší nebo dokonce nezbytné započítat tyto vlivy přidáním dodatečných členů do Schrödingerovy rovnice obsahující původně pouze elektrostatickou interakci. Tyto členy se často formálně označují jako interakce, i když se někdy nejedná o další zanedbané interakce, ale pouze o členy získané z pohybových rovnic obecnějších teorií v rámci nějakého aproximativního postupu. Nejjednodušší z těchto obecnějších teorií je teorie založená na relativistické vlnové rovnici, tzv. Kleinově-Gordonově rovnici, která neuvažuje spin, a proto dává dobré výsledky pouze pro částice s nulovým spinem. Význam této rovnice v relativistické kvantové teorii je jen omezený. Elektron je částicí se spinovým kvantovým číslem 1/2, kterou je nutno popsat pomocí rovnice Diracovy. Ukazuje se, že v mnoha případech (např. ultrarelativistické rychlosti, silná pole) není představa o pohybu jedné izolované částice přijatelná. Dokonce i ve vakuu mohou vznikat páry částic a antičástic. Je nutné popisovat pohyb pole částic a interakce mezi poli částic, tak jak to dělá kvantová teorie polí – zatím nejobecnější kvantově relativistická fyzikální teorie. Vlivy, které je nutno uvažovat pro zpřesnění popisu spekter jsou: • Zbytková interakce, též korelační interakce, podstatná pro víceelektronové atomy. •
Relativistické korekce na bázi Diracovy teorie.
•
Relativistické korelační korekce ve víceelektronových atomech. Patří sem a) křížová spinorbitální interakce, b) spin-spinová interakce, c) orbitálně-orbitální interakce, d) retardační korekce, e) kontaktní elektron – elektronová interakce.
•
Korekce ovlivněné vlastnostmi atomového jádra; v atomech je nutné uvážit kromě dominantní elektrostatické interakce elektronů s jádrem atomu též další korekce spojené s přítomností jádra. Můžeme sem zahrnout a) interakci magnetického momentu elektronu s magnetickým momentem jádra, b) izotopovou hmotnostní korekci.
•
Korekce kvantové teorie pole. 207
5.1 ZBYTKOVÁ INTERAKCE Též korelační interakce – nejedná se o principiálně nový typ interakce, ale pouze o tu část elektrostatické interakce mezi elektrony, kterou není možné zahrnout do efektivního potenciálu nebo do potenciálu v rámci přiblížení centrálního pole pro víceelektronové atomy. Spolu se spinorbitální interakcí představuje nejdůležitější korekci při popisu víceelektronových atomů.
5.2 RELATIVISTICKÉ KOREKCE Většinou se tak označují opravy energetického spektra atomu, které vycházejí z (jednočásticové) Diracovy rovnice. Pro atom vodíku je možné rovnici vyřešit. U víceelektronových atomů se pak volí kvazirelativistické přiblížení - aproximativní postup, který je založen na rozvoji vlnové funkce do mocninné řady podle členů (1/c2)n. V případě víceelektronových atomů je často nutné uvažovat též relativistické korelační korekce mezi jednotlivými elektrony. Po dosazení rozvoje jednočásticové vlnové funkce do (jednočásticové) Diracovy rovnice můžeme podle požadované přesnosti uvažovat pouze členy do určitého řádu n. Pro jednoduchost se obvykle volí n = 1. (Pro n = 0 v případě přítomnosti magnetického pole plyne z Diracovy rovnice Pauliho rovnice, a tedy i existence vlastního magnetického momentu elektronu s anomální hodnotou Landého faktoru g = −2). Diracova rovnice pak přechází na tvar Shrödingerovy rovnice s hamiltoniánem: Hˆ = Hˆ 0 + Vˆm + VˆLS + Vˆδ . Hˆ 0 = −
2
∆ + U (r ) 2m0 První člen je identický s hamiltoniánem v rámci elektrostatického přiblížení s potenciálem U(r) = eϕ(r), kde ϕ je elektrický potenciál. Zbývající tři operátory pak odpovídají relativistickým korekcím, které je možno vypočítat poruchovou metodou. Tyto členy se označují jako relativistická hmotnostní korekce, spin-orbitální interakce a kontaktní interakce. 4 DEF pˆ 4 Vˆm = − 3 2 = − 3 2 ∆ 2 8m0 c 8m0 c • Relativistická hmotnostní korekce se objevuje jako důsledek
relativistické závislosti hmotnosti částice na její rychlosti. (Tato oprava je obsažena již v Sommerfeldově relativistickém modelu atomu a při popisu atomu s využitím KleinGordonovy rovnice.) Skutečně, rozvojem vztahu pro kinetickou energii relativistické částice
Ek = c 2 p 2 + m02c 4 − m0 c 2 do Taylorovy řady podle hybnosti dostáváme při uvážení členů do 4 řádu p , resp. (1/c2)1, vztah
Ek
p2 p4 − + ... 2m0 8m03c 2 .
Výraz se též přepisuje do tvaru ( E − m0 c − U (r )) Vˆm = − 2m02 c 2 , 2
208
2
kde veličina E představuje celkovou energii elektronu a U(r) je sféricky symetrický potenciál jednočásticového přiblížení, obvykle potenciál získaný v rámci přiblížení centrálního pole. DEF
•
Spin-orbitální interakce
VˆLS =
σ 2 2 0
4m c
(∇U ( r ) × pˆ ) =
1 ∂U ( r ) ˆ ˆ ( sl ) 2 2 2m0 c r ∂r představuje jednu
z nejvýznamějších korekcí, která spolu se zbytkovou interakcí významně ovlivňuje energetické spektrum atomu (viz popis víceelektronových atomů). DEF
sˆ =
σ 2 , kde σ je formální vektor Pauliho matic, je operátor spinu, operátor Operátor ˆ DEF l = r × pˆ je operátor orbitálního momentu hybnosti. Pro coulombický potenciál Ze2 1 U (r ) = − 4πε 0 r dostáváme VˆLS =
Ze2 ˆˆ) ( sl 2 2 3 8πε 0 m0 c r . DEF
•
Kontaktní interakce, též Darwinův člen,
U (r ) = − potenciál (
Vˆδ =
2
8m02 c
∇ 2U (r ) 2
pro U ∼ 1 r
∼
δ (r )
je pro coulombický
Ze2 1 1 ∇ 2 = −4πδ ( r ) 4πε 0 r ), který je úměrný 1/r a tedy r , popsána Diracovou δ-
funkcí, tedy Ze2 2 Vˆm = δ (r ) 8m02 c 2ε 0 . Tento příspěvek je významný pouze pro orbitaly s. Tato třetí relativistická korekce se někdy ˆ −i (∇U (r )) pˆ = − Ed 2 2 ponechává v netransformovaném tvaru 4m0 c , kde E = −∇U ( r ) a ˆ d =i
4m02 c 2
pˆ
se pak formálně interpretuje jako operátor imaginárního elektrického momentu
elektronu. V rámci kvazirelativistického přiblížení je tedy relativistický popis atomu zajištěn dodáním dodatečných členů - relativistických korekcí k nerelativistické Schrödingerově rovnici, kterou je možné ve srovnání s Diracovou rovnicí jednoduše rozšířit na víceelektronový atom.
5.3 RELATIVISTICKÉ KORELAČNÍ KOREKCE Jedná se o další relativistické korekce, resp. interakce, které je nutno spolu s jednočásticovými relativistickými korekcemi započítat pro detailní popis struktury spekter ve víceelektronových atomech: 209
•
Křížová spin-orbitální interakce představuje část spin-orbitální interakce, která souvisí
s interakcí orbitálního magnetického momentu daného elektronu se spinovým momentem jiného elektronu. Korekce související s tímto členem jsou méně významné než korekce přímé spin-orbitální interakce mezi magnetickými momenty daného elektronu. •
Spin-spinová interakce, též spin-spinová vazba (s-s vazba), se objeví v případě
víceelektronových atomů jako důsledek interakce mezi vlastními magnetickými momenty elektronů. •
Orbitálně-orbitální interakce je interakce mezi orbitálními magnetickými momenty
elektronů v případě víceelektronových atomů. •
Retardační korekce představuje opravu na zpožďování (retardaci) elektrostatické interakce
pohybujících se elektronů, ke kterému dochází v důsledku konečné rychlosti světla ve vakuu. •
Kontaktní elektron – elektronová interakce. Jedná se v podstatě o Darwinův člen, který
ovšem vyjadřuje vzájemnou interakci elektronů. V popisu víceelektronových atomů se korelace elektronů dané vazbou magnetických momentů dvou různých elektronů obvykle započtou přibližně v rámci příblížení j-j vazby. Konkrétní tvar těchto členů je možno získat na základě kvazirelativistického přiblížení z tzv. Breitovy rovnice, která představuje určité zobecnění Diracovy rovnice pro dvě částice. Breitova rovnice ovšem nevyhovuje všem požadavkům teorie relativity. Postup získání členů použitelných jako korekce k Schrodingerově či Pauliho rovnici je rovněž poněkud problematický, protože původní členy získané v rámci kvazirelativistického přiblížení obecně nesplňují některé požadavky kvantové teorie na operátory fyzikálních veličin (nejsou hermitovské, resp. samosdružené). Ve Schrödingerově rovnici víceelektronového atomu vystupuje coulombická neboli elektrostatická interakce, která je párovou interakcí, tzn., že hodnota interakce páru vybraných částic závisí pouze na vlastnostech a poloze těchto dvou částic a není ovlivněna přítomností dalších částic. Coulombická interakce je úměrná součinu elektrických nábojů obou částic a závisí na (je nepřímo úměrná) jejich vzdálenosti. Analogicky je možné použít členy získané z Breitovy dvoučásticové rovnice jako korekce i v případě více než dvou elektronů. Výsledná korekce je tak v případě víceelektronového atomu rovna součtu párových příspěvků pro všechny dvojice elektronů. I když jsou korekce zde uvedené obecně méně významné než např. spinorbitální interakce, nemusí tak tomu být vždy, záleží na konkrétním systému a jeho stavu. Ukazuje se, že nejčastěji je vhodné započítat vedle celkové spin-orbitální interakce též spin-spinovou interakci.
210
5.4 KOREKCE OVLIVNĚNÉ VLASTNOSTMI JÁDRA Protože atom není pouze systémem elektronů, ale též jádra, dá se očekávat, že jeho vlastnosti ovlivní výsledné energetické spektrum atomu. Kromě v atomech dominantní elektrostatické interakce elektronů s jádrem je pro zpřesnění popisu spektra nutné započítat následující korekce: • Interakce magnetického momentu elektronu s magnetickým momentem jádra (I-J vazba). Započtení této interakce vede k objasnění tzv. hyperjemné struktury spekter atomů. Magnetický DEF
moment jádra nabývá hodnot řádově rovných jadernému magnetonu
µN =
m e = e µB 2m p m p .
Protože hmotnost protonu je řádově 1000krát větší než hmotnost elektronu, je jaderný magneton řádově 1000krát menší než Bohrův magneton µB. Totéž lze tedy říci o magnetických momentech jádra a elektronu, a proto tato interakce je řádově 1000krát menší než v případě interakce magnetických momentů elektronů, což se projeví jen velmi malým rozštěpením spektrálních čar (hyperjemná struktura). (V rámci elektrostatického přiblížení se tato slabší magnetická
část
elektromagnetické
interakce
elektronu
s jádrem
neuvažuje.)
c) Izotopová hmotnostní korekce se objeví jako důsledek konečné hmotnosti atomového jádra. V základním přiblížení jádra s nekonečně velkou hmotností se elektrony pohybují v pevně daném neměnném potenciálu jádra. Při detailnějším popisu je ovšem nutno uvážit též pohyb jádra. Řešíme tedy problém Z elektronů a jednoho jádra. Celková energie atomu E na rozdíl od výše uvedeného přiblížení bude navíc funkcí hmotnosti jádra MJ. Pro započtení tohoto vlivu je možné použít např. metodu redukované hmotnosti, podle které postačí v řešeních získaných v limitě MJ → ∞ nahradit klidovou hmotnost elektronu m0 = me jeho redukovanou hmotností
µ e = (1/ me + 1/ M J ) −1 . Pokud pozorujeme spektrum atomů prvků v přírodních látkách, které nejsou čistým izotopy, ale směsí více izotopů téhož prvku, pozorujeme vzhledem k závislosti E(MJ) rozštěpení spektrálních čar, které je dáno rozdílnou hodnotou MJ pro jednotlivé izotopy ve směsi.
5.5 KOREKCE KVANTOVÉ TEORIE POLE Veškerá řešení na bázi nerelativistických nebo relativistických vlnových rovnic uvažují atom jako systém více částic s elektromagnetickou interakcí. Veličiny charakterizující elektromagnetické pole v popisu vystupují pouze jako parametry, ne jako neznámé. Obecněji musíme atom řešit jako systém vzájemně interagujících polí (viz kvantová teorie pole), a to alespoň elektromagnetického (fotonového) a elektron-pozitronového. Kvantová teorie elektromagnetického pole se označuje jako kvantová elektrodynamika. Experimentálně se např. pozoruje u atomu vodíku malé zvýšení (posunutí) energie stavu 2S1/2 oproti stavu 2P1/2, v rámci Diracovy teorie mají oba stavy stejnou energii. Uvedený jev se označuje jako Lambovo posunutí.
211
6. INTERAKCE ATOMŮ 6.1 Podmínky vzniku chemické vazby 6.2 Dvouatomové molekuly 6.3 Molekula vodíku - objasnění homopolární kovalentní vazby 6.3.1 Metoda valenční vazby 6.3.2 Metoda LCAO 6.4 Víceatomové molekuly 6.5 Spektrum molekul 6.5.1 Vibrace molekuly 6.5.2 Rotace molekuly
6. INTERAKCE ATOMŮ Jednotlivé atomy mohou mezi sebou interagovat prostřednictvím elektromagnetické interakce a případně vytvářet jejím prostřednictvím vázané systémy. Bývá zvykem rozlišovat podle síly interakcí dva typy meziatomových (neboli chemických) interakcí: o
Silnou interakci mezi atomy – chemickou vazbu, jejímž prostřednictvím mohou vznikat vázané systémy dvou nebo několika atomů – molekuly nebo dokonce vázané systémy mnoha atomů pevné látky (skla, krystaly), makromolekuly. Systémy řádově desítek až stovek atomů se často označují jako shluky – clustery.
o
Slabou interakci mezi atomy a molekulami – slabou mezimolekulovou interakci; někdy se interakce tohoto typu označují též jako „van der Waalsovy síly“. Tyto interakce se uplatňují např. při tvorbě „molekul“ (clusterů) či krystalů inertních plynů nebo molekulových krystalů.
Pozn.: Nesmíme zaměňovat v chemii používané pojmy „silné“ a „slabé“ interakce, pod kterými se rozumí „chemické“ interakce mezi atomy, s pojmy, které označují základní fyzikální interakce (silná a slabá interakce). Výše uvedené interakce mezi atomy jsou projevem elektromagnetické interakce, ta je jednou ze čtyř základních fyzikálních interakcí.
6.1 PODMÍNKY VZNIKU CHEMICKÉ VAZBY Prostřednictvím elektromagnetické interakce mohou spolu atomy vytvářet vázané systémy (molekuly, clustery, pevné látky apod.). Hovoříme o chemické vazbě mezi atomy. Podle zvyklostí v chemii sice nepovažujeme za chemickou vazbu slabé mezimolekulové interakce (malá vazebná energie), nicméně níže uvedené podmínky platí i pro „slabě vázané“ systémy atomů a molekul. (Polohy atomů určujeme polohami jejich jader.) V případě vázaného systému atomů, kterým molekula je, musí být splněna o
podmínka rovnováhy, podle níž musí existovat polohy jader atomů (rovnovážné polohy), pro
něž je výslednice sil působící na každý atom v molekule nulová, 212
o
podmínka stability, podle které musí mít systém pro rovnovážné polohy jader atomů minimální
energii; postačuje přitom lokální minimum energie, které zajistí, že pro dostatečně malé výchylky jader atomů z rovnovážných poloh budou na tyto atomy působit síly, které budou jádra těchto atomů vracet do jejich rovnovážných poloh (ve skutečnosti jádra atomů vždy kolem rovnovážných poloh kmitají). Nutným předpokladem pro splnění podmínky rovnováhy je existence odpudivých a přitažlivých sil. Pokud známe závislost interakční energie atomů na polohách jejich jader (viz např. adiabatické přiblížení), můžeme formulovat podmínky vzniku vazby v konkrétnější podobě. ( n) Podmínky vzniku chemické vazby: Nechť U ( R1 , R2 , R3 ,...Rn ) je interakční energie (často
označovaná jako potenciál) systému n atomů, Ri jsou polohové vektory jader atomů. Pro názornost uvažujme i případ dvouatomové molekuly se sféricky symetrickým potenciálem: U (2) ( R1 , R2 ) = U (| R2 − R1 |) = U ( R ) . •
Podmínka rovnováhy – musí existovat prostorová konfigurace ( R1,0 , R2,0 , R3,0 ,...Rn ,0 ) , pro niž
jsou výslednice sil
Fi = ∇ RiU ( n )
, jimiž ostatní atomy působí na daný atom, pro všechny
atomy nulové:
Fi = 0,
i = 1, 2,3...n, , popř. dU ( n ) = 0 .
Pro potenciál U(R) dostáváme: dU dR
•
=0
.
R = R0
(n) Podmínka stability – interakční energie U musí mít pro konfiguraci ( R1,0 , R2,0 , R3,0 ,...Rn ,0 )
splňující podmínku rovnováhy lokální minimum. Pro potenciál U(R) stačí: d 2U d R2
≥0 R = R0
Vzdálenost atomů R0 v dvouatomové molekule se obvykle označuje jako délka vazby, ve víceatomových systémech se spíše používá termín meziatomová vzdálenost. Hodnota EV = U(R0) se označuje jako vazebná energie nebo též disociační energie (vazby, resp. dvouatomové molekuly). 213
PŘITAŽLIVÉ A ODPUDIVÉ SÍLY Nutnou podmínkou existence minima v závislosti interakční energie je existence přitažlivých a odpudivých sil mezi atomy. Jejich význam nejlépe objasníme opět na případu dvouatomové molekuly. Přitažlivé síly Fod převládají nad odpudivými na vzdálenostech větších než je délka vazby a hrají důležitou roli při vytváření chemické vazby – pokud se atomy přiblíží na určitou vzdálenost, musí se začít přitahovat. Podstatu přitažlivých sil objasňují teorie chemické vazby, které se liší podle typu vazby v molekule. Původ sil je třeba hledat hlavně v interakci elektronových obalů atomů. Odpudivé síly Fpř naopak převládají nad přitažlivými na vzdálenostech menších než je délka vazby a prudce rostou zejména při těsném přiblížení jader. Zabraňují tak splynutí jader atomů a vytvoření tzv. sjednoceného atomu. Ve vzdálenosti R0 musí dojít k vyrovnání účinku obou typů sil, tak jak to vyžaduje podmínka rovnováhy.
Původ odpudivých sil je třeba hledat zejména v elektrostatickém odpuzování kladně nabitých jader. Při velmi těsném přiblížení odpovídá závislost odpudivých sil alespoň přibližně Coulombovu zákonu, při větších vzdálenostech ubývají podstatně rychleji než coulombické síly, což je dáno tím, že kladný elektrický náboj jader je částečně stíněn záporně nabitým elektronovým obalem atomu. a U od (r ) = e − kr r , Empiricky je možné potenciál odpudivých sil popsat potenciálem Yukawova typu: q1q2 kde a a k jsou konstanty (a je analogií členu 4πε 0 v coulombickém potenciálu a k je tzv. stínící
α n konstanta). Více se ale používá potenciál mocninný: r , kde α a n jsou konstanty (n bývá většinou přirozené číslo, nejčastěji 12).
Větší vzdálenosti Řádově rozměr atomu.
214
Potenciál Yukawova typu Označovaný též jako stíněný Coulombův potenciál.
6.2 DVOUATOMOVÉ MOLEKULY Sestávají ze dvou atomů stejných prvků – homonukleární molekula, nebo dvou atomů různých prvků – heteronukleární molekula. (Viz též víceatomové molekuly) Podle polarity molekuly můžeme rozlišovat vazbu: o
nepolární (homopolární), kdy na žádném z atomů není parciální elektrický náboj; tak tomu je
u homonukleárních molekul, o
polarizovaná (semipolární), též polární, kdy na každém z atomů je stejně velký parciální
náboj opačného znaménka, o
silně polarizovaná (heteropolární), též iontová neboli
elektrovalenční, kdy na každém
z atomů je elektrický náboj s velikostí blížící se hodnotě elementárního elektrického náboje („elektron přešel od jednoho atomu k druhému“). Stejným způsobem je možné klasifikovat vazbu ve víceatomových molekulách, pokud u nich lze vyjít z modelu lokalizovaných vazeb. Při objasnění vazby je vhodné se zaměřit nejdříve na oba extrémní případy, tj. na vazbu iontovou a vazbu nepolární. Druhá z nich se často označuje termínem kovalentní vazba, který je ale v literatuře užíván v různém smyslu.
RŮZNÉ VÝZNAMY TERMÍNU KOVALENTNÍ VAZBA •
Kovalentní vazba v nejobecnějším slova smyslu je chápána jako synonymum pro chemickou
vazbu. Dalším ekvivalentním termínem, používaným zejména ve starší literatuře, je atomová vazba. Kovalentní vazba je zde chápána jako protiklad slabých mezimolekulových interakcí.
V tomto smyslu máme tedy kovalentní vazbu nepolární i polarizovanou. •
Kovalentní vazba jako protiklad delokalizovaných vazeb, např. kovové vazby, odpovídá
klasické Lewisově představě o vzniku vazby sdílením elektronových párů sousedních atomů. Ve starší literatuře se používá ekvivalentní termín valenční vazba. •
Kovalentní vazba ve smyslu nepolární vazby, vazba vznikající v důsledku společného sdílení
elektronového páru; v tomto smyslu je protikladem vazby iontové vznikající v důsledku přitažlivé interakce mezi opačně nabitými ionty. V případě, že oba elektrony sdíleného elektronového páru (tj. elektrony v tzv. vazebném orbitalu) pocházejí formálně pouze od jednoho z atomů, hovoříme o vazbě kovalentní koordinační, resp. koordinačněkovalentní. 215
IONTOVÁ VAZBA Objasnění původu přitažlivých sil v případě iontové vazby nečiní problém, protože je možné dospět ke správné představě i bez uvážení zákonitostí kvantové mechaniky. Nejlépe to pochopíme na příkladu silně polarizované dvouatomové molekuly, u které je na každém z atomů lokalizován elektrický náboj téměř rovný hodnotě − e , resp. + e . Molekula má tedy dipólový elektrický moment o velikosti přibližně R0 e , kde R0 je délka vazby a e elementární elektrický náboj. Podle zjednodušené modelové představy tak stačí předpokládat, že spolu interagují nikoliv dva elektroneutrální atomy, ale kladně a záporně nabitý iont. Pro dostatečně vzdálené atomy můžeme ionty nahradit bodovými náboji v místě jader. Potenciál odpudivých sil iontů pak lze popsat pomocí e2 1 U od ( R) , R ≥ a0 4πε 0 R Coulombova zákona: .
Iontová vazba
+ − Typickým představitelem iontové molekuly je molekula chloridu sodného Na Cl , který se ovšem + − většinou vyskytuje v krystalické formě s kubickou mřížkou, v níž se střídají ionty Na a Cl .
NEPOLÁRNÍ VAZBA Objasnění nepolární vazby v dvouatomové molekule je na rozdíl od vazby iontové možné teprve na základě kvantové mechaniky. Při řešení se vychází ze Schrödingerovy rovnice pro molekulu, důležitou úlohu při objasnění podstaty nepolární vazby pak hraje princip nerozlišitelnosti identických částic, jehož přímým důsledkem je tzv. výměnná interakce. S využitím kvantověmechanických výpočtů je pak možné objasnit i polární vazbu a zpřesnit popis vazby iontové. Nejjednodušší je řešení kvantově mechanického problému molekuly vodíku – H 2 . (V případě, že + se neomezíme jen na elektroneutrální molekuly, je ještě jednodušším systémem iont H 2 ).
POLÁRNÍ VAZBA Polární vazbu lze popsat obdobně jako vazbu nepolární s tím rozdílem, že se u ní výrazně uplatňuje tzv. iontový příspěvek k vazbě a molekula je vždy heteronukleární. Dostatečně vzdálené atomy
216
Vzdálenost rovná řádově lineárnímu rozměru atomu, tj. a0 ≈ 10
−10
m , nebo větší.
6.3 MOLEKULA VODÍKU HAMILTONIÁN MOLEKULY VODÍKU Molekula vodíku představuje systém čtyř interagujících částic, dvou protonů a dvou elektronů. V rámci elektrostatického přiblížení uvažujeme pouze elektrostatickou interakci mezi těmito částicemi popsanou Coulombovým zákonem:
Hˆ = −
2
2m
2
∑ ∆ ri − i =1
2
2M
2
∑ ∆ Rj − j =1
e2 2 1 1 1 ∑ − − 4πε 0 i , j =1 R j − ri R2 − R1 r2 − r1
,
kde m a M představují postupně hmotnost elektronu a hmotnost jádra (hmotnost protonu), ri jsou polohové vektory elektronů a R j polohové vektory jader, u nichž budeme dále místo indexů j = 1, 2 psát indexy A,B, a to pro lepší odlišení značení jader od značení elektronů. Protože Schrödingerovu rovnici s tímto hamiltoniánem není možné vyřešit analyticky, musí se při jejím řešení použít řada přibližných postupů. Zejména je vhodné nejdříve s využitím BornovaOppenheimerova přiblížení (resp. adiabatického přiblížení) oddělit řešení problému pohybu iontů, tj. vibrace a rotace molekuly, a řešení problému pohybu elektronů neboli řešení elektronového problému.
HAMILTONIÁN ELEKTRONOVÉHO PROBLÉMU MOLEKULY VODÍKU V rámci adiabatického přiblížení řešíme rovnici v limitě M → ∞ a neuvažujeme tedy v hamiltoniánu operátory kinetické energie jader. Hamiltonián pak můžeme přepsat do následujícího tvaru: Hˆ = Hˆ A + Hˆ B + VRA , RA
Hˆ A = −
kde
2
2m
∆ r1 −
e2 1 4πε 0 RA − r1
Hˆ B = −
, resp.
2
2m
∆ r2 −
,
e2 1 4πε 0 RB − r2
představují hamiltoniány izolovaných atomů vodíku a poslední člen VRA , RB (r1 , r2 ) = −
e2 1 1 1 1 + − − 4πε 0 RA − r2 RB − r1 r2 − r1 RB − RA
pak představuje interakční energii obou atomů. 217
Schrödingerovu rovnici elektronového problému molekuly vodíku poprvé vyřešili fyzikové Heitler a London metodou valenční vazby, později též Mulliken a Hund metodou LCAO. Druhá metoda se dodnes s úspěchem používá i pro řešení problému pohybu elektronů ve složitějších molekulách.
6.3.1 METODA VALENČNÍ VAZBY Tato metoda byla navržena v roce 1927 Heitlerem a Londonem pro objasnění nepolární vazby v homonukleárních molekulách. Poprvé byla použita v případě nepolární vazby v molekule vodíku. I když získané hodnoty vazebné energie nebyly v příliš dobré shodě s experimentem, umožnila metoda alespoň v principu objasnit podstatu vazeb v nepolárních dvouatomových molekulách. Heitler a London vyšli původně z představy, podle níž v základním přiblížení neuvažujeme interakci mezi atomy a můžeme tedy popsat vlnovou funkci elektronů v molekule vodíku molekulový orbital - pomocí součinu obou atomových orbitalů, které jsou posunuty o vzdálenost R = | RB - RA | . Později se ukázalo, že je třeba uvážit princip nerozlišitelnosti identických částic, což se v matematickém popisu vlnových funkcí projeví skutečností, že musí mít určitou symetrii. Protože se v hamiltoniánu zatím neuvažují členy závislé na spinu, postačí pracovat s prostorovou částí vlnové funkce, která musí být buď symetrická, nebo antisymetrická. Molekulový orbital podle metody valenční vazby (valence bond – VB) je tedy ve tvaru: ± ± ΦVB (r , r ) = ΦVB (1, 2) = K ( Ψ A (1)Ψ B (2) ± Ψ A (2)Ψ B (1) ) R RA , RB 1 2
K=
kde
,
1 2(1 ± S 2 ) je konstanta zajišťující splnění normovací podmínky. Veličina
S = Ψ A ΨB se označuje jako překryvový integrál. Překryvový integrál je většinou pro atomy vzdálené na délku vazby malý, a proto se zanedbává, 1 K= 2 . Pro jednoduchost se často pracuje i s nenormovanými funkcemi (K = 1). tedy V rámci adiabatického přiblížení neuvažujeme kinetickou energii jader A a B, jejich polohy tedy vystupují v molekulovém orbitalu jako parametry. Pro jednoduchost se volí RA = (0, 0, 0) a RB = ( R, 0, 0) . Jako jediný parametr pak vystupuje vzdálenost jader R. Pro zjednodušení se uvádí pouze indexy proměnných.
Pokud dosadíme konkrétní tvar atomových orbitalů, v případě molekuly vodíku orbitaly 1s vodíkových atomů (orbital atomu B je posunut o R), můžeme spočítat střední hodnotu energie vodíkové molekuly
218
± ˆ ± ± ± , kde Hˆ 0 =Hˆ A +Hˆ B E ± ( R ) = ΦVB H 0 ΦVB + ΦVB VR ΦVB R R R R
ˆ ˆ přičemž H A a H B jsou hamiltoniány izolovaných vodíkových atomů A a B a VR jejich interakční energie. Protože molekulový orbital popisuje stav neinteragujících atomů a je tedy řešením Schrödingerovy ˆ rovnice s hamiltoniánem H 0 , můžeme metodu valenční vazby považovat za aplikaci poruchové ˆ metody, kde H 0 je neporušený hamiltonián a VR porucha. Po dosazení tvaru molekulového orbitalu a úpravách využívajících vlastnosti atomových orbitalů můžeme střední hodnotu energie molekuly vodíku vyjádřit ve tvaru
E ± ( R ) = E A + EB +
Q± A 1± S 2
kde první dva členy představují energie izolovaných atomů vodíku, zbývající člen, označme jej ∆E ( R ) , představuje energii interakce obou atomů. Závislost této energie na R je vynesena v grafu pro případ –A, +A a A = 0.
Q = Ψ A (1)Ψ B (2) VR (1, 2) Ψ A (1)Ψ B (2) je tzv. coulombický integrál, který představuje střední hodnotu elektrostatické interakce mezi atomy bez uvážení nerozlišitelnosti částic.
A = Ψ A (1)Ψ B (2) VR (1, 2) Ψ A (2)Ψ B (1) je tzv. výměnný integrál, který se objeví teprve v případě uvážení principu nerozlišitelnosti identických částic. Někdy se označuje jako výměnná interakce, nejedná se však o nový typ interakce, ale o kvantověmechanický projev elektromagnetické interakce, který nelze interpretovat v rámci klasické fyziky (pozn.). Závislosti energie molekuly vodíku pro symetrický a antisymetrický orbital získané metodou valenční vazby jsou vyneseny v grafu. Pro srovnání je též uvedena energie pro nesymetrizovaný molekulový orbital (A=0).
219
Obrázek Molekula vodíku metodou valenční vazby
Z obrázku vidíme, že pro případ A = 0 má interakční energie ∆E ( R ) jen plytké minimum, což pro objasnění vazby v molekule vodíku nestačí. Při uvážení principu nerozlišitelnosti ( A ≠ 0 ) vidíme, že pro antisymetrický molekulový orbital nemá ∆E(R) žádné minimum a nemůže vést ke vzniku chemické vazby, ∆E ( R ) je navíc větší než nula v celém rozsahu R, a proto elektron v tomto molekulovém orbitalu dokonce působí proti vzniku vazby – takový orbital se označuje jako antivazebný orbital, resp. protivazebný orbital. Pro symetrický orbital má ∆E ( R ) výrazné minimum v bodě R = R 0 a může tedy dojít ke vzniku vazby. Takový orbital přispívající ke vzniku vazby označujeme jako vazebný orbital. Energie VB + koval molekuly vodíku v rámci metody valenční vazby je tedy: E = E ( R0 ) = E0 + E , kde E0 = E A + EB představuje energii neinteragujících atomů vodíku a E koval =
Q+ A 1+ S 2
tzv. kovalentní příspěvek k vazbě. U molekul mohou obecně existovat i orbitaly, jejichž energie je stejná jako energie odpovídající energii původních atomových orbitalů; jedná se o tzv. nevazebné orbitaly. Experimentálně zjištěná hodnota vazebné energie molekuly vodíku je však přece jen o něco větší (hlubší minimum), což je dáno zejména zanedbáním tzv. iontového příspěvku. Neinteragujících atomů Neinteragující atomy se často pro názornost interpretují jako nekonečně vzdálené atomy.
220
Elektromagnetické interakce Konkrétně se jedná o elektrostatickou interakci. Poznámka Při populárním výkladu se nepřesně interpretuje jako důsledek skutečné výměny elektronů.
6.3.2 METODA LINEÁRNÍ KOMBINACE ATOMOVÝCH ORBITALŮ (LCAO) Metoda, která se používá pro řešení vazebných poměrů ve víceatomových molekulách – systém N jader (či iontových zbytků) a n elektronů. Molekulové orbitaly se hledají ve tvaru lineární kombinace atomových orbitalů jednotlivých atomů v molekule N
Φ R1 , R2 ,... RN (ri ) = ∑ cij Ψ R j (ri ), i = 1, 2,...n LCAO
j =1
,
N
zjednodušeným zápisem
Φ LCAO (i ) = ∑ cij Ψ j (i) j =1
, kde Ψj představují atomové orbitaly posunuté do
poloh jader R j . Molekulové orbitaly představují řešení elektronového systému v rámci adiabatické aproximace a R j tedy představují parametry. Hodnoty koeficientů c se určí minimalizací střední hodnoty energie i (hledáme základní stav systému) E (c1 , c2 ,...cn ) = Φ LCAO Hˆ Φ LCAO
s normovací podmínkou
Φ LCAO Φ LCAO = 1
(vázaný extrém).
Metoda je aplikací variační metody pro třídu funkcí ΦLCAO, která tak vede v případě předem určeného efektivního potenciálu pro elektrony k homogenní soustavě lineárních rovnic pro koeficienty cij . Z podmínky řešitelnosti soustavy dostáváme vztah pro energii. Pokud není efektivní potenciál znám, je třeba použít k řešení variačního problému Hartreeho-Fockovu metodu, která ovšem vede k soustavě nelineárních rovnic (efektivní potenciál je fcí cij).
METODA LCAO PRO MOLEKULU VODÍKU Poprvé byla metoda použita Mullikenem a Hundem pro molekulu vodíku. Molekulové orbitaly mají v tomto případě tvar 221
Φ iLCAO (i ) = ci , A Ψ A (i ) + ci , B Ψ B (i ), i = 1, 2 . ,R
Vzhledem k symetrii molekuly vodíku musí být stejná pravděpodobnost nalezení každého z 2 i, A
elektronů u jádra A a jádra B, proto c
=c
2 i,B
a současně c + c 2 i, A
2 i,B
= 1 , odkud
ci , A = ci , B = ±
1 2.
Výsledný molekulový orbital (prostorovou část vlnové funkce) bychom měli vzít jako symetrickou nebo antisymetrickou kombinaci obou jednoelektronových molekulových orbitalů, jak to požaduje princip nerozlišitelnosti identických částic. Pro jednoduchost napišme výsledný molekulový orbital jako součin výše uvedených jednoelektronových orbitalů 1 ( Ψ A (1) ± Ψ B (1) )( Ψ A (2) ± Ψ B (2) ) 2 . Vidíme, že pouze jedna kombinace odpovídá stavu s určitou symetrií, je to symetrický molekulový orbital (srovnej metodu valenční vazby): (1, 2) = Φ LCAO R
+ (1, 2) = Φ LCAO R
1 ( Ψ A (1)Ψ A (2) + Ψ B (1)Ψ A (2) + Ψ A (1)Ψ B (2) + Ψ B (1)Ψ B (2) ) . 2
Vypočteme-li s využitím této vlnové funkce střední hodnotu energie molekuly ELCAO, zjistíme, že oproti výsledku získanému v rámci metody valenční vazby EVB bude výraz obsahovat navíc další integrály typu Ψ A (i )Ψ B ( j ) Hˆ (1, 2) Ψ A (k )Ψ B (l ) , i, j , k , l = 1, 2 ,
které představují dodatečný příspěvek k energii vazby vodíkové molekuly označovaný jako iontový příspěvek k vazbě Eiont . Protože oproti metodě valenční vazby, která uvažuje pouze tzv. kovalentní stavy Ψ A (1)Ψ B (2) a Ψ A (2)Ψ B (1) , zde vystupují též součiny Ψ A (1)Ψ A (2) a Ψ B (1)Ψ B (2) , které odpovídají stavům, kdy oba elektrony jsou u atomu A, resp. B, a popisují tedy situaci silně polarizované molekuly vodíku ( H + H − , resp. H − H + ). Tedy Φ LCAO = Φ koval + Φ iont ,
kde Φ koval = ΦVB a pro energii molekuly v rámci metody LCAO platí E LCAO = E VB + E iont , resp. E LCAO = E0 + E koval + E iont (viz metoda valenční vazby). Ve srovnání s experimentem vychází ale hodnota vazebné energie vyšší a více vzdálená od skutečné hodnoty než u metody valenční vazby. Je to dáno zanedbáním korelací mezi elektrony. Názorně to lze vysvětlit tak, že oba elektrony se elektrostaticky odpuzují, a proto iontové stavy Φiont jsou méně pravděpodobné než stavy kovalentní Φkoval, a tudíž koeficienty před členy, tzv.
222
amplitudy pravděpodobnosti, které odpovídají iontovým stavům, musí mít nižší hodnotu, tedy Φ R (1, 2) ∼
∼ c AAΨ A (1)Ψ A (2) + cBAΨ B (1)Ψ A (2) + c AB Ψ A (1)Ψ B (2) + cBB Ψ B (1)Ψ B (2) , 2
2
2
2
2
2
a jak bylo uvedeno c AA < c AB , navíc platí c AA = cBB , c AB = cBA , což je důsledek symetrie molekuly vodíku (identické atomy). Molekulový orbital v rámci modifikované metody můžeme brát jako Φ LCAO ∼ Φ koval + k Φ ion , kde 0 < k < 1.
Nejlepší shodu s experimentem dostáváme pro k
0.17.
Zatímco metoda valenční vazby iontový příspěvek nerespektuje, metoda LCAO jej výrazně přeceňuje. Podmínky řešitelnosti soustavy Determinant soustavy musí být roven nule. Amplituda pravděpodobnosti Kvadrát modulu tohoto obecně komplexního koeficientu určuje pravděpodobnost realizace příslušného stavu, který je popsán vlnovou funkcí za koeficientem.
6.4 VÍCEATOMOVÉ MOLEKULY Sestávají z více atomů, a to buď ze stejných atomů (atomy stejného prvku, atomy se stejnými jádry) – homonuklearní molekuly, či z různých atomů (atomy více různých prvků, atomy s různými jádry) – heteronukleární molekuly. Chemickou vazbu mezi atomy ve víceatomové molekule je možné s úspěchem popsat v rámci dvou odlišných modelů. •
Model lokalizovaných vazeb vychází z představy, že vazba mezi dvěma sousedními atomy ve
víceatomové molekule není podstatně ovlivněna vazbami zbývajících atomů v molekule. Vazba, resp. vazebné elektrony jsou tedy podle tohoto modelu lokalizovány („vázány“) pouze na dané sousední atomy. Toto pojetí odpovídá klasické představě vazby v chemii prostřednictvím sdílení elektronů, jak ji zavedl Lewis. Výpočet energie vazby se provádí pro každou dvojici sousedních atomů zvlášť analogicky jako v případě dvouatomové molekuly. Tento model je úspěšný u řady anorganických látek (s výjimkou kovů) a organických molekul s nasycenými vazbami. •
Model delokalizovaných vazeb je nutné použít v případech kdy model lokalizovaných vazeb
selhává. Vazebné elektrony zde nejsou lokalizovány u konkrétních atomů. Tento model více odpovídá představám kvantové mechaniky, podle kterých existuje nenulová pravděpodobnost výskytu elektronu kdekoliv v molekule.
223
Celou molekulu je nutno řešit jako celek, např. v rámci metody LCAO, kde molekulový orbital základního přiblížení je konstruován jako lineární kombinace všech valenčních atomových orbitalů jednotlivých atomů. Uvedený model delokalizovaných vazeb je vhodné použít např. u kovů, kde se hovoří o kovové vazbě, a organických molekul s nenasycenými vazbami (např. tzv. π−elektrony u benzenu).
6.5 SPEKTRA MOLEKUL Při řešení molekul (ale též jiných systémů, např. pevných látek) se většinou vychází z BornovyOppenheimerovy aproximace, resp. adiabatické aproximace, která umožňuje rozdělit řešení kvantového problému pro jádra a elektrony na řešení dvou pohybových rovnic: Schrodingerovu rovnici elektronového systému v poli nehybných jader či obecněji iontových zbytků a pohybovou rovnici těchto iontových zbytků, v níž jako dodatečný potenciál vystupuje energie elektronového systému. Pokud tedy chceme určit energetické spektrum molekuly, bývá prvotní spočtení jejího elektronového spektra, tj. určení dovolených hodnot energie elektronů Ee. V případě izolovaného atomu se vliv pohybu jádra v těžišťové soustavě může započítat metodou redukované hmotnosti. U molekuly ovšem mohou jednotlivé iontové zbytky vykonávat v těžišťové soustavě jednak rotační pohyb (rotace molekuly jako celku), jednak vibrační pohyby (vibrace molekuly, kdy se jednotlivé iontové zbytky pohybují vůči sobě navzájem). Celková energie molekuly E je součtem energie elektronového systému Ee , vibrační energie molekuly Ev a rotační energie molekuly Er , tedy
E = Ee + E v + E r . Výsledné spektrum je kombinací elektronového, rotačního a vibračního spektra. Pro vzdálenosti dvou sousedních čar elektronového, vibračního a rotačního spektra platí přibližně ∆Ee
∆Ev
∆Er .
Původní degenerované elektronové energetické hladiny se v případě vibrací rozpadají na blízké vibrační hladiny, pokud navíc molekula rotuje, rozpadne se dále každá z vibračních hladin na velmi blízké rotační hladiny, které tvoří kvazispojité pásy rotačně-vibračního spektra. Emisní či absorpční spektrum molekuly je v tomto případě pásové. Rotačně-vibrační elektromagnetická spektra se pozorují v infračervené oblasti. Pokud dochází pouze ke změně rotačního stavu pozorujeme rotační, spektrum ve vzdálené infračervené a mikrovlnné oblasti.
224
6.5.1 VIBRACE MOLEKUL HARMONICKÉ PŘIBLÍŽENÍ V případě obecné víceatomové molekuly mohou jednotlivé atomy (jejich jádra) vykonávat vůči těžišti molekuly kmitavý pohyb – vibrace okolo rovnovážných poloh R0, j = ( X 0, j , Y0, j , Z 0, j ) . Obecně se tedy jedná o soustavu vázaných anharmonických oscilátorů. V případě malých kmitů, tj. malých odchylek od rovnovážných poloh, můžeme nahradit potenciál U Taylorovým rozvojem do členů druhého řádu (harmonické přiblížení): n
U ( n ) ( R ( n ) ) U ( n ) ( R0( n ) ) + ∑ ∇ R j U ( n ) j =1
+
∑ 2 (∇ n
1
j , k =1
kde
Rj
R0( n )
( R1 , R2 , R3 ,...Rn ) jeho
∆R j +
)
∇ Rk U ( n )
R0( n )
(
( ∆R ∆ R ) j
R ( n ) = ( R1 , R2 , R3 ,...Rn ), R0( n ) = ( R0,1 , R0,2 , R0,3 ,...R0,n ) a ∆R j = R j − R0, j
225
(n)
k
).
První člen rozvoje je konstanta, kterou v případě potenciálu můžeme bez újmy na obecnosti položit rovnu nule, druhý člen je roven nule, což plyne z podmínky rovnováhy. Zbývá tedy pouze třetí, tzv. harmonický člen.
ROZKLAD NA NEZÁVISLÉ HARMONICKÉ OSCILÁTORY Vhodnou transformací lze převést potenciál molekuly v harmonickém přiblížení, tj. třetí člen Taylorova rozvoje potenciálu, na kanonický tvar (diagonalizovat), což znamená, že vypadnou smíšené členy ( j ≠ k ):
U ( n ) ( R′( n ) )
n
∑ 2 k ( R′ − R′ ) 1
j
j =1
j
2
0, j
, kde
( )
k j = ∆ R′ U ( n ) j
R0′( n )
kde čárkou jsou označeny transformované souřadnice. V hamiltoniánu pro jádra pak musíme provést stejnou transformaci i v případě operátoru kinetické 2
n
∑−
∆ R′j
′ energie. Ten lze po transformaci formálně opět zapsat jako výraz , kde parametry M j nejsou rovny původním hmotnostem atomů a označují se jako efektivní hmotnosti (srovnej redukovanou hmotnost v případě dvou částic) myšlených částic – kvazičástic (označují se též jako jednočásticové excitace). j =1
2 M ′j
V takovém případě je možno v pohybové rovnici pro jádra provést separaci proměnných: nejdříve ′ separaci pro transformované vektory R0, j a dále separaci pro tři souřadnice těchto ′ ′ ′ vektorů X 0, j , Y0, j , Z 0, j . Pohybová rovnice se tak rozpadne na celkem 3n rovnic, z nichž každá je pohybovou rovnicí pro lineární harmonický oscilátor (LHO). Vibrační energie molekuly je tedy rovna součtu energií těchto nezávislých LHO: n
Ev = ∑
∑
i =1 j = X ′,Y ′, Z ′
1
ω j n j, i + 2
, kde
ωj =
kj M ′j
.
Transformace souřadnic je obvykle taková, že jedna z pohybových rovnic popisuje rovnoměrný přímočarý pohyb těžiště, v tom případě sčítáme v první sumě pouze do n-3. Kvantová čísla n j , i se označují jako vibrační čísla. Pokud navíc můžeme zanedbat vazbu mezi rotačními a vibračními pohyby atomů, je možné zvlášť uvažovat též rotaci molekuly jako celku a budeme tedy sčítat pouze do n-6.
VIBRACE DVOUATOMOVÉ MOLEKULY Lineární dvojatomová molekula má šest jaderných stupňů volnosti, po odečtení tří translací a dvou rotací molekuly jako celku zbývá jeden normální vibrační mód, znázorněný v animaci. V případě homonukleární dvouatomové molekuly (např. H 2 ), ve které konají atomy vibrace ve směru osy x rovnoběžné se spojnicí jader atomů, platí pro redukovanou hmotnost 226
1 d 2U MM M = k M′ = = 2 dR 2 R = R M +M 2 a 0 . Zde M představuje hmotnost atomu a R0 je délka vazby odpovídající rovnovážné poloze – „nekmitající atomy“.
Pro frekvenci kmitů tedy máme tak dostaneme vztah
ω=
k = M′
Ev =
dU dR
( R0 ) M . Pro vibrační energii dvouatomové molekuly
2 d 2U M dR 2
(ν + 12 ) R0
,
kde ν je příslušné vibrační kvantové číslo.
VIBRACE TROJATOMOVÉ LINEÁRNÍ SYMETRICKÉ MOLEKULY Lineární trojatomová molekula má devět jaderných stupňů volnosti, po odečtení tří translací a dvou rotací molekuly jako celku zbývají čtyři normální vibrační módy, které jsou znázorněny v animacích.
Symetrický vazebný vibrační mód Asymetrický vazebný vibrační mód Deformační vibrační mód (dvojnásobně degenerován, obdobná deformace může probíhat v rovině kolmé k nákresně)
„nekmitající atomy“ Podle kvantové teorie (viz např. lineární harmonický oscilátor) musí částice i v základním stavu (nejnižším dovoleném energetickém stavu) kmitat s nenulovou kinetickou energií (energie nulových kmitů). U harmonického oscilátoru je střední výchylka částice z rovnovážné polohy nulová pro všechny energetické stavy. U oscilátoru anharmonického, jsou odchylky z rovnovážných poloh malé jen pro nejnižší energetické stavy. Přibližná představa o zaujmutí rovnovážných poloh atomy je tedy přijatelná.
6.5.2 ROTACE MOLEKUL Předpokládejme obecnou víceatomovou molekulu. Osu rotace procházející těžištěm označme jako osu z. Pokud nebudeme uvažovat vibrace, tzn. jádra atomů s hmotnostmi M j leží v pevně daných rovnovážných polohách R0, j kde
J2 = ( X 0, j , Y0, j , Z 0, j ) , můžeme pro kinetickou energii rotace psát Er = 2 I ,
I = ∑ M j Z 2j j
227
je moment setrvačnosti molekuly a J je celkový moment hybnosti molekuly. Protože v kvantové J = J ( J + 1) mechanice je jeho velikost kvantována podle vztahu , kde J je rotační kvantové číslo, dostáváme kvantovací podmínku pro energii rotace (rotační energii) tuhé molekuly Er =
2
2I
J ( J + 1)
Rozdíl energií mezi dvěma sousedními rotačními hladinami je tedy úměrný rotačnímu číslu ∆Er = Er ( J ) − Er ( J − 1) =
2
I
J
.
Srovnej Landého pravidlo intervalů.Viz též kvantová teorie tuhého rotátoru.
ROTACE DVOUATOMOVÉ MOLEKULY V případě homonukleární dvouatomové molekuly (např. H2) rotující kolem osy z procházející těžištěm molekuly a kolmé ke spojnici obou atomových jader je moment setrvačnosti R2 R 2 MR02 I = M +M = 2 . Zde M představuje hmotnost atomu a R0 je délka vazby. 2 2 Pro rotační energii této molekuly tak dostaneme vztah Er =
2
MR02
J ( J + 1) .
ROTACE LINEÁRNÍ MOLEKULY Lineární molekula může nezávisle rotovat kolem dvou navzájem kolmých os, které jsou kolmé k její hlavní ose symetrie (dána směrem spojnic atomů). Rotace kolem hlavní osy nevede ke změně konfigurace atomových jader v prostoru. U nelineárních molekul existují tři nezávislé rotace molekuly jako celku.
Rotace lineární molekuly (dvojnásobně degenerována, stejná rotace může probíhat vzhledem k ose kolmé k nákresně)
228