1
Palivové články Zdeněk Samec Ústav fyzikální chemie J. Heyrovského AV ČR, Dolejškova 3, 18223 Praha 8 Tel.: (+420 2) 6605 2017
E-mail:
[email protected]
1. Úvod V posledních deseti letech byla vývoji palivových článků jako novému zdroji elektrické energie věnována enormní pozornost jak ze strany vědeckých a výzkumných organizací, tak ze strany průmyslu. Všeobecně se předpokládá, že palivové články naleznou uplatnění jako distribuované zdroje elektrického proudu zejména v automobilovém průmyslu, dále jako pevně instalované drobné zdroje a jako zdroje pro přenosná zařízení, ve kterých nahradí dosavadní monočlánky a akumulátory. Přes nespornou přitažlivost nedosáhly dosud palivové články většího komerčního úspěchu a jsou stále považovány za spíše exotickou technologii vhodnou pro zvláštní účely jako je kosmický program. V současné době však neexistuje nějaká zásadní technická překážka, která by bránila jejich rozšíření. Je zřejmé, že hlavní překážkou jsou vysoké výrobní náklady. Existují tři faktory, které pravděpodobně povedou k výraznějšímu rozšíření palivových článků v blízké budoucnosti: 1) trvalý (i když asi ne převratný) technologický vývoj ve směru snižování nákladů, 2) tlak na decentralizaci zdrojů energie v důsledku zvýšené poptávky, potřeby deregulace a zvýšené ochrany zdrojů energie i přírody a 3) tlak na zvýšenou energetickou účinnost a snížení emisí v automobilovém průmyslu. 1.1. Základní pojmy Vícefázovou soustavu tvořenou dvěma elektrodami v prostředí elektrolytu nazýváme galvanickým článkem. Článek znázorňujeme pomocí chemických symbolů, přičemž fázová rozhraní naznačíme svislými čarami. U vodných roztoků uvádíme rozpuštěné látky případně jejich koncentrace, u nevodných roztoků ještě rozpouštědlo. Např. Daniellův článek Zn⏐ZnSO4, c1⏐CuSO4, c2⏐Cu
(I)
se skládá ze dvou poločlánků, tj. zinkové elektrody s vodným roztokem síranu zinečnatého o objemové koncentraci c1 a měděné elektrody s vodným roztokem síranu měďnatého o objemové koncentraci c2. Elektrodou v klasickém smyslu rozumíme rozhraní vodiče elektronů (kov, polovodič) a vodiče iontů (elektrolyt). Za rovnováhy, kdy galvanickým článkem neprochází elektrický proud ani nedochází ke změnám složení v důsledku chemických nebo transportních procesů, existuje mezi kovovými přívody k elektrodám rozdíl elektrických potenciálů, který označujeme jako rovnovážné napětí galvanického článku Er (ve starší literatuře elektromotorická síla nebo elektromotorické napětí). Protože lze napětí definovat dvojím způsobem, byla dohodnuto, že rovnovážným napětím rozumíme elektrický potenciál poslední fáze stojící vpravo (zde Cu), od kterého se odečte elektrický potenciál poslední fáze stojící vlevo (zde Zn) - konvence I, Er = φ (Cu ) − φ ( Zn )
(1)
Toto napětí lze případně vyjádřit jako součet rozdílu elektrických potenciálů pro jednotlivá rozhraní článku, tj. v článku (I) jako součet rozdílů elektrických potenciálů mezi Zn a roztokem ZnSO4, mezi roztoky ZnSO4 a CuSO4 (tzv. kapalinový potenciál) a mezi roztokem CuSO4 a Cu.
2 Každý galvanický článek má dvě funkce. V případě, že elektrody spojíme přes vhodnou zátěž (odpor), vyvolá napětí článku usměrněný tok elektronů ve vnějším obvodu a článek funguje jako elektrochemický zdroj proudu. Protože se jedná o uzavřený okruh, protéká stejný elektrický proud i článkem. S průtokem proudu je spojena změna chemického složení článku, kterou označujeme jako článkovou reakci. Složky, které se účastní této reakce označujeme jako elektroaktivní látky. Protože článkovou reakci lze zapsat dvojím způsobem, bylo dohodnuto, že zápis musí odpovídat průchodu kladného náboje článkem zleva dopravakonvence II, např. v článku (I) probíhá reakce Zn + CuSO4 → ZnSO4 + Cu
(2)
V případě, že vložíme na galvanický článek elektrické napětí opačné a větší, než je rovnovážné napětí článku, vyvoláme v článku změnu chemického složení odpovídající opačné reakci, tj. ZnSO4 + Cu
→ Zn + CuSO4
(3)
a článek funguje jako elektrolyzér. Jestliže zvolenou elektrodou protéká elektrický proud tak, že dochází k přechodu záporného náboje z kovu elektrody do roztoku, je odpovídající proud definován jako katodický, elektroda je definována jako katoda a reakce, která na ní probíhá je označována jako katodická nebo redukční. V opačném případě se proud nazývá anodický, elektroda je definována jako anoda, a elektrodový děj označován jako děj anodický nebo oxidační. Podle konvence má anodický proud kladné znaménko. V případě, že článek funguje jako elektrochemický zdroj proudu je zvolená elektroda katodou (resp. anodou), zatímco v případě, že článek funguje jako elektrolyzér je stejná elektroda anodou (resp. katodou). Existence rozhraní mezi dvěma vodnými roztoky elektrolytů ZnSO4, c1⏐CuSO4, c2 v článku (I) představuje jistou obtíž, která je společná řadě galvanických článků. Na takovém rozhraní se totiž nemůže ustanovit termodynamická rovnováha, neboť rozdíl koncentrací elektrolytů (koncentrační gradient) vyvolává nevratný děj- difúzi ve směru poklesu koncentrace. Tento problém se řeší oddělením elektrolytů v katodovém (katolytu) a anodovém (anolytu) prostoru tzv. solným můstkem (v laboratoři), případně iontoměničovou membránou (výroba chloru elektrolýzou solanky). V prakticky využívaných elektrochemických zdrojích proudu mají obě elektrody obvykle jeden společný elektrolyt (např. roztok kyseliny sírové v olověném akumulátoru). 1.2. Klasifikace elektrochemických zdrojů elektrického proudu Podle povahy elektroaktivních látek je rozdělujeme do tří skupin. 1. Primární články obsahují elektroaktivní látky již při sestavení článku. Funkce článku končí spotřebováním alespoň jedné z elektroaktivních látek, vybitím článku. Příkladem je klasický Leclancheův salmiakový článek, ve kterém jsou elektroaktivními látkami MnO2 a Zn, a produkty MnOOH a Zn(NH3)xCl2. 2. V sekundárním článku čili akumulátoru se elektroaktivní látky vytvoří předchozí elektrolýzou, nabitím článku. Příkladem je olověný akumulátor, ve kterém jsou elektroaktivními látkami PbO2 a Pb, a produktem PbSO4. 3. U palivových článků se elektroaktivní látky přivádějí do článku kontinuálně během provozu článku. Materiál elektrod se článkové reakce účastní pouze jako akceptor nebo donor
3 elektronů. V těchto článcích reagují na elektrodách plyny, např. kyslík a vodík, nebo se anodického procesu účastní jednoduché organické látky, např. metanol. V literatuře (zvl. americké) se elektrochemické zdroje proudu často označují jako baterie. Historie elektrochemických zdrojů proudu začíná r. 1800, kdy Alessandro Volta realizoval první baterii tvořenou dvěma různými střídavě uspořádanými kovy (Zn,Cu) které byly odděleny papírem napojeným zředěnou kyselinou sírovou (tzv. Voltův sloup), viz též schéma Daniellova článku (I). Palivový článek objevil r. 1839 Sir William Grove. Tento článek lze znázornit schématem (II) Ni⏐H2 ⏐KOH, H2O⏐O2⏐Ag
(II)
1.3. Termodynamika a účinnost elektrochemického zdroje proudu Článkovou reakci můžeme realizovat přímo jako reakci chemickou, např. vhozením kousků zinku do roztoku síranu měďnatého. Každá chemická reakce je charakterizována rovnovážnou konstantou K rov , která rozhoduje o poloze rovnováhy a která je určena standardní Gibbsovou energií reakce, ∆G 0 , např. pro reakci (2)
K rov
⎛ ∆G 0 ⎞ aCu aZnSO4 aZn2 + = exp ⎜ − = ⎟= ⎝ RT ⎠ aZn aCuSO4 aCu2 +
(4)
kde symbolem a jsou označeny rovnovážné aktivity reagujících částic. Zjednodušení rovnice (4) je důsledkem jednotkové aktivity složky jednosložkové fáze a faktu, že síranové anionty se reakce neúčastní. Při zacházení s těmito veličinami je opět třeba dát pozor na uvažovaný směr chemické reakce, tj. definovat předem její reaktanty a produkty. Standardní Gibbsova energie má při konstantní teplotě T dva příspěvky,
∆G 0 = ∆H 0 − T ∆S 0
(5)
kde ∆H 0 představuje standardní enthalpii a ∆S 0 standardní entropii reakce. Z energetického hlediska je chemická reakce charakterizována reakčním teplem q , přijatým reakční soustavou při jednotkovém průběhu, tj. při zreagování 1 molu Zn a 1 molu CuSO4 . Toto teplo je určeno standardní enthalpií reakce,
q = ∆H 0
(6)
Poznamenejme, že hnací silou reakce je nenulový rozdíl Gibbsových energií produktů a reaktantů, ∆G ∆G = ∆G 0 + RT ln
aCu (t )aZnSO4 (t ) aZn (t )aCuSO4 (t )
(7)
4
kde a (t ) jsou aktuální aktivity v čase t . Reakce dospěje do rovnováhy, když ∆G dosáhne nulové hodnoty (podmínka rovnováhy). Rovnice (7) pak přejde na rovnici (4). Tento poměrně zdlouhavý termodynamický rozbor chemické reakce je důležitý pro pochopení termodynamiky galvanického článku a následně energetické účinnosti elektrochemického zdroje proudu. Po sestavení galvanického článku jsme z energetického hlediska ve stejné situaci, jako v chemickém reaktoru před spuštěním chemické reakce mezi složkami o stejných výchozích aktivitách (počtech molů, koncentracích), a ta situace trvá dokud z galvanického článku nezačneme odebírat elektrický proud. Význam Gibbsovy energie obecně spočívá v tom, že její pokles vyjadřuje maximální neobjemovou práci, kterou systém může vykonat. Protože chemický reaktor, ve kterém probíhá jen chemická reakce, může konat pouze objemovou práci, závisí energetický zisk hlavně na reakčním teple, které podle 2. věty termodynamické nelze přeměnit zcela na práci. Maximální účinnost přeměny tepla z chemického reaktoru na práci je dána účinností Carnotova cyklu tepelného stroje, ε
ε=
T1 − T2 T1
(8)
kde T1 a T2 jsou teploty tepelné lázně, ze které je teplo odebíráno a tepelné lázně, do které se teplo odevzdává. Na druhé straně, může elektrochemický zdroj proudu přímo vykonat elektrickou práci wel rovnou součinu náboje prošlého vnějším okruhem a napětím, tedy v limitě nulového proudu a při zachování konvence I a konvence II,
wel = nFEr = −∆G
(9)
Tato rovnice, ve které n je počet elektronů spotřebovaných v článkové reakci (např. v reakci (2) je n =2) a F je Faradayova konstanta, vyjadřuje současně vztah mezi rovnovážným napětím galvanického článku Er a rozdílem Gibbsových energií, ∆G . Termodynamická účinnost elektrochemického zdroje proudu, ε th , je pak definována rovnicí
ε th =
∆G T ∆S = 1− ∆H ∆H
(10)
a představuje vlastně korelaci dvou energetických účinků, maximální práce a reakčního tepla. Pro srovnávání účinnosti elektrochemických zdrojů proudu se často používá elektrochemická účinnost ε el definovaná rovnicí
ε el =
− nFE ∆G
(11)
kde E je aktuální napětí. Elektrochemická účinnost je lepším kritériem funkce elektrochemického zdroje proudu, protože vyjadřuje poměr aktuální vykonané práce a teoretické práce, kterou by systém mohl vykonat v ideálním případě.
5
Protože elektrochemický zdroj proudu poskytuje vedle elektrické energie také (Joulovo) teplo, je z hlediska účinnosti výhodné využít toto teplo k produkci více elektřiny (např. v plynové nebo parní turbíně) případně k vytápění (teplá voda). Účinnost takového systému je pak charakterizována vztahem
ε=
q '− nFE q
(12)
kde q a q ' představují reakční teplo resp. teplo přijaté zdrojem. Tento způsob využití palivového článku se označuje jako kogenerace. Z rovnic (7) a (9) odvodíme rovnici pro rovnovážné napětí, např. pro Daniellův článek
Er = E 0 +
RT aCu2+ ln 2 F aZn2+
(13)
kde tzv. standardní rovnovážné napětí E 0 = −∆G 0 / nF . Jako elektrodový potenciál se označuje rovnovážné napětí článku, ve kterém je na pravé straně uvažovaná elektroda a na levé straně vhodná referentní elektroda, např. standardní vodíková elektroda (SHE=standard hydrogen electrode). V případě měděné elektrody máme článek, ve kterém probíhá reakce H2 (p=0.101MPa) + Cu2+ → 2H+(a=1) + Cu
(14)
Jeho rovnovážné napětí je popsáno Nernstovou rovnicí Er = E 0 +
RT ln aCu2+ 2F
(15)
1.4. Funkce elektrochemického zdroje proudu Při proudové zátěži se napětí článku odchyluje od rovnovážné hodnoty. Tuto odchylku označujeme jako přepětí článku η
η = E ( I ) − Er
(16)
kde aktuální napětí E ( I ) je funkcí intensity elektrického proudu I . Přepětí má původ jednak v tzv. ohmické ztrátě ( IR , R je vnitřní odpor článku), jednak v pomalé kinetice reakcí probíhajících na jednotlivých elektrodách (kinetické přepětí), jednak v pomalém transportu elektroaktivních látek k fázovým rozhraním elektrod (koncentrační přepětí).
6
Potenciál
Oblast koncentračního přepětí
Ohmické ztráty Oblast kinetického přepětí Er
Proud
Obr. 1 Schématický průběh závislosti potenciálu anody na elektrickém proudu
Charakteristický průběh závislosti potenciálu anody na protékajícím proudu je znázorněn na obr. 1. Podobný průběh, kvalitativně zrcadlový vzhledem k potenciálu, má i závislost potenciálu katody na procházejícím proudu. Obě závislosti lze experimentálně zjišťovat měřením tzv. polarizačních křivek na jednotlivých elektrodách ve zvláštním uspořádání galvanického článku- tříelektrodové elektrochemické cele (nádobce).Vynesením obou závislostí do jednoho grafu můžeme porovnat očekávaný a skutečný (přímo měřitelný) průběh funkce E ( I ) a také závislost výkonu článku P P = EI
(17)
Výkon
na proudu, viz obr. 2.
Proud
Napětí
Katoda Článek Anoda Proud
Obr. 2 Schématický průběh závislosti potenciálu katody, anody, napětí článku a jeho výkonu na elektrickém proudu.
7 2. Typy palivových článků 2.1. Důležité elektrodové reakce v palivových článcích Anodickou reakcí v palivových článcích je buď přímá oxidace vodíku, nebo oxidace metanolu. Ve vývoji jsou také kombinované systémy, ve kterých se vodík získává reformací uhlovodíku nebo alkoholu v tzv. reformeru a pak se oxiduje na anodě. Katodickou reakcí je obvykle redukce kyslíku, jehož zdrojem je zpravidla vzduch. Elektrochemická redukce kyslíku může probíhat dvěma základními mechanismy. 1) přímá čtyřelektronová redukce kyslíku a) v alkalickém prostředí:
O2 + 2H2O + 4 e- → 4 OH-
E 0 (vs. SHE) = 0,401 V
(18)
E 0 (vs. SHE) = 1,229 V
(19)
b) v kyselém prostředí: O2 + 4 H+ + 4 e- → 2H2O
2) redukce s peroxidem vodíku jako meziproduktem a) v alkalickém prostředí O2 + H2O + 2 e- → HOO- + OH-
E 0 (vs. SHE) = -0,065 V
(20)
E 0 (vs. SHE) = 0,867 V
(21)
následovaná redukcí peroxidu HOO- + H2O + 2 e- → 3 OHnebo jeho rozkladem 2 HOO- → 2 OH- + O2
(22)
b) v kyselém prostředí O2 + 2 H+ + 2 e- → HOOH
E 0 (vs. SHE) = 0.670 V
(23)
E 0 (vs. SHE) = 1,77 V
(24)
následovaná redukcí peroxidu HOOH + 2 H+ + 2 e- → 2 H2O nebo jeho rozkladem 2 HOOH → 2 H2O + O2
(25)
Článek, ve kterém probíhá přímá čtyřelektronová redukce kyslíku má vyšší účinnost. Tato elektrodová reakce však zahrnuje řadu elementárních kroků spojených s adsorpcí a disociací molekulárního kyslíku na povrchu elektrody s následnou rekombinací s vodíkovým iontem a její výsledná rychlost zavisí faktorech, které lze jen obtížně ovlivňovat. Elektrochemická oxidace molekulárního vodíku probíhá snadno na elektrodách platinových kovů, případně na katalytických elektrodách palivových článků obsahujících Pt. Mechanismus zahrnuje adsorpci plynného vodíku na povrchu elektrody, následovanou jeho disociací a elektrochemickou oxidací za vzniku dvou protonů (v kyselém prostředí), tj. sumárně
8
H2 → 2 H+ + 2 e-
E 0 (vs. SHE) = 0 V
(26)
resp. v krocích 2 Pt(s) + H2 → Pt-Hads + Pt-Hads Pt-Hads → H+ + e- + Pt(s)
(27) (28)
kde Pt(s) representuje volné aktivní místo na povrchu Pt a Pt-Hads representuje adsorbovaný atomární vodík. Využití vodíku jako paliva komplikují nečistoty v plynném vodíku, které blokují aktivní místa na povrchu Pt elektrody, což vede ke značnému zpomalení (inhibici) jinak velmi rychlé reakce (26). Alternativní přístup je založen na využití zemního plynu, propanu nebo alkoholů, které je ovšem nutno nejdříve reformovat na vodík a vyčistit (viz dále). Odstranění stop nečistot jako je CO z reformovaného paliva je obtížné.To platí i pro palivové články využívající jako palivo přímo metanol. Elektrochemická oxidace metanolu. Elektrodové materiály obsahující Pt jsou vhodné i pro přímou oxidaci metanolu místo vodíku. Elektrochemická reakce je v tomto případě popsána sumární rovnicí CH3OH + H2O → CO2 + 6 H+ + 6 e-
E 0 (vs. SHE) = 0,046 V
(29)
Mechanismus této reakce je obecně popsán tzv. Bagockého schématem (30) CH 3OH → CH 2OH → CHOH → C OH x
xx
↓
↓
xxx
(30)
↓
CH 2O → CHO → CO x
x
↓
↓
HCOOH → COOH x
↓ CO2
a může zahrnovat řadu následných reakcí disociace atomu vodíku (ve schématu zleva doprava) a řadu následných oxidačních reakcí (ve schématu shora dolů), křížkem jsou naznačeny vazby C-Pt. Molekula CO vznikající v průběhu oxidace jako jeden ze stabilních meziproduktů blokuje povrch a brzdí další kroky. Odstraňování CO je založeno na katalytických vlastnostech bimetalických slitin, zejména Pt a Ru, z nichž jedna složka podporuje oxidaci CO na CO2. 2.1. Klasifikace palivových článků Palivové články jsou obvykle klasifikovány podle použitého elektrolytu. Výjimkou je metanolový článek nazvaný podle použitého paliva. Články lze rovněž rozdělit podle jejich provozní teploty na nízkoteplotní a vysokoteplotní. Seřazením podle rostoucí provozní teploty se jedná o následující články: - alkalický článek (Alkaline Fuel Cell, AFC),
9
- článek s tuhým polymerním elektrolytem (Proton Exchange Membrane Fuel Cell, PEMFC, označovaný též jako Polymer Electrolyte Fuel Cell, PEFC nebo Solid Polymer Electrolyte Fuel Cell, SPEFC), - metanolový článek (Direct Methanol Fuel Cell, DMFC), - článek s kyselinou fosforečnou (Phosphoric Acid Fuel Cell, PAFC), - článek s taveninou uhličitanu (Molten Carbonate Fuel Cell, MCFC), - článek s tuhým oxidem (Solid Oxide Fuel Cell). 2.2. Alkalický palivový článek (AFC) Alkalický palivový článek, viz. obr. 3, má mezi palivovými články nejvyšší elektrochemickou účinnost. Jeho správná funkce však značně závisí na čistotě použitých plynů, což představuje jeho největší nevýhodu. Vysoká účinnost souvisí s alkalickým prostředím, ve kterém je kinetika katodické reakce, tj. redukce kyslíku (18), podstatně rychlejší, než v prostředí kyselém. Na druhé straně, je anodická reakce, tj. oxidace vodíku podle rovnice (31) (31) H2 + 2 OH- → 2 H2O + 2 eponěkud pomalejší než v kyselém prostředí, rovnice (26). Článková reakce je popsána rovnicí O2 + 2H2 → 2H2O
(32)
V prvních AFC článcích (50. léta) byly používány Ni katoda a NiO anoda (s nízkým obsahem Li kvůli zvýšení vodivosti), 30% KOH, provozní teplota 200ºC a tlak 5MPa, výkon 5 kW. V současné době se používají jako katoda i anoda Pt/C plynově-difúzní elektrody (viz. kap. 2.3.), provozní teplota je běžně nižší, než 100ºC. Ve stadiu výzkumu jsou další materiály, jako jsou slitiny Pt/Co pro katodu. S vyjímkou zvláštních aplikací (kosmický program) vyžadujících stabilizaci elektrolytu např. gelem, se jako vhodné jeví uspořádání článku s cirkulujícím elektrolytem, což umožňuje regulovat pracovní teplotu, průběžně čistit článek a odstraňovat z anodového prostoru hlavní reakční produkt -vodu. Další výhodou je možnost odpojit článek prostým vyčerpáním elektrolytu např. v hybridních systémech pro trakci (elektromobil). Hybridní systém s olověným akumulátorem a AFC H2/vzduch a s cirkulujícím elektrolytem byl poprvé použit již v 70. letech. Vedle plynných nečistot, které snižují katalytickou aktivitu elektrod (např. CO), je v alkalickém prostředí základním problémem tzv. karbonizace elektrolytu, CO2 + 2 OH- → H2O + CO32-
(33)
která vede k zaplňování pórů elektrod a k rychlému poklesu výkonu článku. CO2 je jednak přítomen ve vzduchu jako zdroji kyslíku pro palivový článek, jednak vzniká při vedlejší oxidaci uhlíku Pt/C elektrody. Z plynného paliva ho lze odstraňovat reakcí s Fe. AFC nalezl významné uplatnění zejména v kosmickém výzkumu (programy Apollo, Space Shuttle), ve kterém brzy nahradil PEMFC (program Gemini). V programu Space Shuttle slouží AFC (3 moduly, každý s maximálním výkonem 12 kW) jako zdroj energie, pro ochlazování vnitřního prostoru a pro produkci pitné vody. Uplatnění AFC pro trakci a jako pevně instalovaného zdroje se testuje.
10
Obr. 3. Schéma alkalického palivového článku.
Obr. 4. Schéma PEMFC.
2.3. Palivový článek s tuhým polymerním elektrolytem (PEMFC) Článková reakce v PEMFC, rovnice (32) je kombinací dílčích elektrodových reakcí, rovnice (19) a (26), které probíhají v kyselém prostředí. Z praktických důvodů je zdrojem kyslíku vzduch, zatímco vodík je získán budˇelektrolýzou vody nebo reformací vhodného uhlovodíku případně alkoholu. V PEMFC je elektrolytem protonově vodivá polymerní membrána, viz obr. 4. V prvních článcích použitých v kosmickém programu Gemini (1kW) byl materiálem membrány polystyrensulfonát, který se však ukázal jako málo stálý, a článek byl v dalším programu nahrazen AFC. Průlomem ve vývoji PEMFC byla příprava nového typu protonově vodivých membrán na bázi sulfonovaného polytetrafluoroetylénu uvedených na trh firmou DuPont pod komerčním názvem Nafion. Jedná se o materiál s vysokou koncentrací vodíkových iontů kompenzujících náboj sulfo- skupin navázaných na řetězce PTFE, který má vysokou vodivost a je chemicky velmi inertní. Jeho struktura je znázorněna na obr. 5. Pro své pozoruhodné vlastnosti nalezl Nafion uplatnění i mimo oblast palivových článků např. v membránové elektrolýze (elektrolytická produkce chloru elektrolýzou solanky) nebo jako zdroj protonů v acido-bazické katalýze. Podobné materiály obsahující vedle sulfo- skupin ještě karboxyskupiny byly uvedeny na trh dalšími výrobci (Dow, Aciplex, Gore, Asahi Chemical). V ideálním případě funguje membrána pouze jako protonový vodič, tj. zabraňuje průniku vodíku a kyslíku na druhou stranu článku. Pro optimální provoz PEMFC má značný význam vodní režim článku. Voda je jednak produktem katodické reakce, jednak dochází k jejímu transportu elektro-osmotickým tokem směrem ke katodě a zpětnou difúzí směrem k anodě. Protože je elektrická vodivost membrány přibližně přímo úměrná počtu molekul vody připadajících na jednu sulfo- skupinu, má nerovnoměrná distribuce vody v membráně za následek nerovnoměrný elektrický odpor. Vodním režim lze zlepšit zvlhčováním plynů vstupujících do palivového článku, nebo přímým zvlhčováním membrány prostřednictvím zabudovaných porézních polymerních hydrofilních knotů, případně disperzí SiO2 nebo TiO2.
11
Obr. 5. Struktura Nafionu
Obr. 6. Schéma plynově-difúzní elektrody
Základním požadavkem na elektrody PEMFC je třífázové rozhraní mezi plynou fází, elektronově vodivou fází (kovem) a protonově vodivou fází (tuhým elektrolytem). Toho se dosahuje realizací tzv. plynově-difúzní elektrody (gas diffusion electrode, GDE), viz obr. 6. Přívod elektronů z a do vnějšího obvodu zajišťuje elektronově-vodivý nosič např. tenká uhlíková fólie, na které je nanesena vrstva Pt/C. I když jsou plynově-difúzní elektrody komerčně dostupné, je kvalita těchto elektrod různá, v závislosti na detailech výrobního procesu. Přes rozsáhlý výzkum vhodných elektrod v podstatě vedený snahou nahradit drahou platinu, zůstává tento kov nejvhodnějším materiálem jak pro katodu tak pro anodu PEMFC. K přijatelnějším nákladům vede snižování obsahu Pt (tzv. loading), ovšem na úkor výkonu palivové článku. Funkci anody nepříznivě ovlivňuje přítomnost stop nečistot některých prvků nebo sloučenin, jako jsou CO, S a NH3. Tento problém lze řešit zařazením čistící jednotky mezi reformer a palivový článek, což ovšem vede ke zvýšení nákladů. Jinou cestou je náhrada Pt již zmíněnou slitinou s Ru, případně dalším kovem (Pt/Ru, Pt/Ru/W). Jedná se v podstatě o bifunkční katalyzátor, na jehož povrchu probíhá jednak oxidace vodíku, jednak vznikají snáze než na Pt adsorbované reaktivní radikály OH.ads, které oxidují CO na CO2. PEMFC, jehož provozní teplota je 85-105ºC, řadíme k nízkoteplotním článkům. 2.4. Metanolový palivový článek (DMFC) DMFC je zvláštním případem nízkoteplotního palivového článku s tuhým polymerním elektrolytem, ve kterém dochází k přímé elektrochemické oxidaci metanolu, bez jeho reformace na vodík, viz obr. 7. Článková reakce v DMFC je kombinací dílčích elektrodových reakcí, rovnice (19) a (29), 2CH3OH + 3O2 → 2CO2 + 4 H2O
(34)
Provozní teplota článku je podobná jako u PEMFC, případně poněkud vyšší v závislosti na použité polymerní membráně a způsobu přívodu metanolu. Výhodou metanolu jako paliva je skutečnost, že ho lze snadno získat ze zemního plynu nebo obnovitelných zdrojů biomasy, má vysokou specifickou energii, je kapalný při provozní teplotě článku a, především, existující infrastruktura transportu a distribuce benzínu a nafty může být snadno využita pro metanol. DMFC může spalovat jak plynný tak kapalný metanol. V druhém případě je metanol dodáván do článku ve formě vodného roztoku (1-2 mol/dm3). Protože se při tom spotřebuje jenom část rozpuštěného metanolu, spotřebované palivo se obohacuje a recykluje.
12
Obr. 7. Schéma DMFC.
Obr. 8. Schéma PAFC.
Mechanismus oxidace je obecně popsán schématem (30). Základním materiálem pro anodu je opět platina. Výrazného zvýšení rychlosti oxidace lze dosáhnout kombinací Pt a dalšího kovu, jako Re, Ru, Os, Rh a další. Princip katalytického působení je stejný jako u výše popsaného efektu Ru na oxidaci CO, který je meziproduktem elektrochemické oxidace metanolu. Materiál katody je většinou stejný jako u PEMFC. K problému vodního režimu článků s tuhým polymerním elektrolytem přistupuje u DMFC ještě problém permeability membrány vůči metanolu. Pronikání metanolu od anody ke katodě difúzí totiž výrazně snižuje proudovou účinnost redukce kyslíku na katodě, a tím i výkon článku. Problém lze řešit např. náhradou protonu v membráně ionty Cs+, které mají výrazně nižší hydratační energii a jejichž přítomnost vede ke snížení permeability membrány Nafion 117 vůči metanolu až o dva řády. Jiný přístup je založen na použití katodových materiálů, na kterých probíhá redukce kyslíku se srovnatelnou rychlostí i v přítomnosti metanolu, což je případ metaloporfyrinu Fe na uhlíkovém nosiči. 2.5. Palivový článek s kyselinou fosforečnou (PAFC) PAFC je schematicky znázorněn na obr. 8. Vývoj tohoto palivového článku dospěl nejblíže k rozsáhlému praktickému využití. Elektrárny založené na PAFC s výkonem 0,2 - 20 MW jsou ve výstavbě po celém světě jako pevně instalované zdroje elektrického proudu, tepla a teplé vody pro města, nákupní centra a nemocnice. Výhodou PAFC je jednoduchá konstrukce, vysoká tepelná, chemická a elektrochemická stabilita, a nízká těkavost elektrolytu při provozní teplotě článku 150-200ºC. Článková reakce je stejná jako v PEMFC. Kvůli korozním problémům byla v počátcích vývoje jako elektrolyt používána zředěná kyselina fosforečná. Současné konstrukční materiály umožnily zvýšit koncentraci kyseliny na 85%, kyselina je obvykle stabilizována v SiC matrici. Vyšší koncentrace kyseliny zvýšila vodivost elektrolytu a vedla k omezení koroze elektrod na uhlíkovém nosiči. Elektrody používané v PAFC jsou podobně jako v PEMFC plynově-difúzní Pt/C elektrody. 2.6. Palivový článek s taveninou uhličitanu (MCFC) Článková reakce v MCFC, rovnice (32), je kombinací dílčích elektrodových reakcí probíhajících na anodě
13
H2 + CO32- → H2O + CO2 + 2 e-
(35)
a na katodě O2 + 2 CO2 + 4 e- → 2 CO32-
(36)
Elektrolytem je tavenina uhličitanu (Li2CO3/ K2CO3 nebo Na2CO3 ) stabilizovaná v anorganické matrici (LiAlO2). Na rozdíl of AFC, není funce článku ovlivňována produkcí CO2. Výhodou článku, jehož provozní teplota je 600-700ºC, je možnost přímé oxidace uhlovodíku nebo metanolu na CO2 a H2O. Vysoká teplota rovněž vede k výraznému vzrůstu rychlosti redukce kyslíku, což umožňuje snížit obsah Pt až k nule. Vhodnou katodou pro MCFC je pak NiO, který se připravuje in situ oxidací Ni při startování článku. Alternativou k NiO jsou podvojné oxidy Li, zejména LiFeO2, Li2MnO3 a LiCoO2 případně kombinované s NiO. Anody pro tento článek se vyrábějí ze slitin Ni/Al nebo Ni/Cr, nebo z keramickometalických materiálů (Cermet). Vysoká teplota článku klade značné nároky na konstrukční materiály, k dispozici jsou některé Ni/Co/Fe nebo Cr/Al slitiny. MCFC, který dosahuje účinnosti 50%, se vyvíjí pro použití hlavně jako pevně instalovaného zdroje elektrického proudu.
Obr. 9. Schéma planární konstrukce SOFC.
2.6. Palivový článek s tuhým oxidem (SOFC) Článková reakce v SOFC, rovnice (32), je kombinací dílčích elektrodových reakcí probíhajících na anodě H2 + O2- → H2O + 2 e-
(37)
a na katodě O2 + 4 e- → 2 O2-
(38)
Dílčích reakcí se tedy podobně jako v MCFC účastní ionty elektrolytu. Provozní teplota článku je 800-1000 ºC. Výhody a nevýhody články jsou podobné jako u MCFC.
14
Protože se však jedná o dvoufázový systém plyn-tuhá látka, odpadají problémy s únikem elektrolytu a vodním režimem. Jako elektrolyt se používá oxid zirkoničitý stabilizovaný ytriem (YSZ). Materiálem katody je obvykle kompozitní LaSrMnO3/ZrO2 elektroda, materiálem anody pak kompozitní Ni/Zr keramika. Planární konstrukce SOFC je znázorněna na obr. 9. 3. Zpracování paliva pro palivové články Vodík jako hlavní palivo pro palivový článek lze uchovávat v materiálech jako jsou nanotrubice, uhlíkata vlákna, kovové hydridy a řada chemických sloučenin, zejména alkoholy (metanol) a uhlovodíky (metan, propan). Dalšími zdroji může být amoniak a hydrazin, jejichž krakováním lze vodík přímo připravit. Alkoholy a uhlovodíky je nutno reformovat na plyny s vysokým obsahem vodíku parciální oxidací, parní reformací nebo autotermální reformací. V ideálním případě vznikají tímto postupem pouze H2 a CO2. V důsledku rovnováhy
CO2 + H2
CO + H2O
(39)
je však v plynu přítomen také katalytický jed CO, který je třeba odstranit čištěním plynného produktu. Parciální oxidace metanolu je exotermická reakce katalyzovaná Pd na ZnO nosiči, 2 CH3OH + O2
2 CO2 + 4 H2
∆H 0 =- 66,7 kJ/mol
(40)
Parní reformace metanolu probíhá po jeho smíchání s vodou, převedením směsi do plyného stavu a zahřátím na teplotu 300 ºC v přítomnosti katalyzátoru (Cu/ZnO) současně podle dvou mechanismů, rovnice (41) a (42) CH3OH CO + H2O
CO + 2 H2 CO2 + H2
∆H 0 =-41,2 kJ/mol
(41a) (41b)
∆H 0 =49 kJ/mol
(42a) (42b)
a CO2 + 3 H2 CH3OH + H2O CO2 + H2 CO + H2O
Autotermální reformace spočívá v kombinaci endotermické parní reformace a exotermické parciální oxidace za adiabatických podmínek ve sférickém reaktoru, ve kterém první reakce probíhá katalyticky na vnější straně a druhá katalyticky na vnitřní straně reaktoru za účinné výměny tepla pláštěm. Jednou z nejčistších metod přípravy čistého vodíku (a kyslíku) je elektrolýza vody s využitím vodní, solární nebo větrné energie. 4. Doporučená literatura
K. Kordesch, G. Simader: Fuel Cells and Their Applications, VCH, Weinheim, 1996. M.L. Perry, T.F. Fuller: A Histrorical Perspective of Fuel Cell Technology in the 20th Century, J. Electrochem. Soc., 149 (7) S59-S67 (2002).
15 Vícerozměrný svět
Rikard von Unge Ústav teoretické fyziky a astrofyziky PřF MU v Brně Kotlářská 2, Brno, 611 37 mailto:
[email protected] tel. 541 129 459
Extra dimenze Co vlastně rozumíme tím, když užijeme slova dimenze (nebo rozměr)? Proč věříme tomu, že náš svět je čtyřdimenzionální (tři dimenze prostoru a jedna času), jak nás poučil Einstein? A ještě zajímavější otázka – můžeme si představit svět, který má více rozměrů? A pokud odpověď na poslední otázku je ano, jaké by to mělo pozorovatelné důsledky? Na tyhle otázky bych chtěl v přednášce odpovědět. Dimenze prostoru těsně souvisí s počtem souřadnic (počtem čísel), který potřebujeme k tomu, abychom přesně určili, kde se nějaký objekt (třeba částice) v tomto prostoru nachází. Myslíme si, že náš svět má prostorovou dimenzi tři, protože právě třemi čísly můžeme přesně určit, kde se nacházíme. Jedno číslo určí výšku, jedno určí polohu podél pravo-levé osy a jedno podél osy dozadu-dopředu. Ta tři čísla mohou označovat jiné veličiny, ale jsou vždy právě tři. Například, pro polohu letadla letícího přes Atlantik můžeme používat výšku nad hladinou a zeměpisnou šířku a délku. Teď si pro určitost představme, že držíme v ruce list papíru. Je to v podstatě dvojrozměrný objekt, protože pro určení polohy libovolného bodu na papíře potřebujeme dvě čísla. Nyní srolujme tento list tak, že vznikne válec. Když budeme stále více zmenšovat poloměr tohoto válce, začne se jevit jako jednorozměrný objekt - čára. Původní kartézské souřadnice, nejjednodušší pro zadání polohy bodu na listu papíru, nahradíme po stočení papíru do válce novými: první souřadnice určuje polohu podél površky válce a druhá souřadnice určuje polohu bodu na obvodu válce. Ale k určení polohy bodu na válci velmi malého poloměru je podstatně důležitější určit souřadnici podél válce, protože dokonce i když vůbec nevíme, kde na obvodu válce se daný bod nachází, chyba nemůže být větší než poloviční obvod válce. Tím, že můžeme libovolně zmenšovat obvod válce, přibližujeme se k jednodimenzionálnímu prostoru. Tímto jednoduchým způsobem můžeme „skrývat“ dimenze a otázka kolika dimenzionální je náš svět už nemá jednoduchou odpověď. Abychom mohli zjistit skutečný stav, musíme nejdříve uvážit, k jakým experimentálním výsledkům nás přivádí svět s několika skrytými dimenzemi, navinutými do malých kružnic.
Kaluza - Klein Takové vícedimenzionální scénáře nejsou ve fyzice vůbec novinkou. Objevily se totiž poprvé ve dvacátých letech minulého století, když Theodor Kaluza a potom Oskar Klein navrhli, že teorie gravitace a elektromagnetismu mohou být sjednoceny jako gravitace ve 4+1 dimenzionálním prostoru, ale právě s jednu dimenzí navinutou do malé kružnice. Podobné teorie jsou proto nazývány Kaluzovými - Kleinovými teoriemi. Otázkou teď je, jak můžeme pozorovat, zda náš svět má extra dimenze popsaného typu nebo ne. Abychom to mohli snadněji diskutovat, uvažme ještě jednou příklad s listem papíru navinutým do válce. Když je list srolován je jasné, že několik bodů na papíru je na stejném místě na válci. Můžeme například propíchnout papír jehlou a když jej opět rozvineme, uvidíme, že jehla udělala několik děr, periodicky se na papíře opakujících. Tento příklad ukazuje, že místo svinuté dimenze (matematicky komplikovaný popis) můžeme vzít
16 normální přímou dimenzi (matematicky jednoduchý popis) s podmínkou, že fyzikální situace se v tomto směru periodicky opakuje. Můžeme si to představit jako nekonečněpatrový panelový dům. Jedno každé patro je úplně stejné jako druhé. Když chodím a dívám se nahoru, vidím sám sebe ze spodu jak chodím, a když se dívám dolů, vidím sám sebe shora jak chodím. Zajímavé výsledky dostaneme, když teď zkusíme v takovém prostoru myslet na kvantovou mechaniku. Základem popisu kvantového světa je totiž vlnová funkce, jejíž čtverec absolutní hodnoty v nějakém bodě je interpretován jako hustota pravděpodobnosti, že právě tam nalezneme částici, popisovanou touto vlnovou funkcí. Aby taková interpretace měla smysl je jasné, že vlnová funkce musí být jednoznačná. Nemohou přece existovat v stejném bodě dvě různé pravděpodobnosti! To nás přivede k závěru, že vlnová funkce musí být pro svinuté dimenze periodická. Typicky musí mít tvar
exp (i k x) , kde x je souřadnice podél kružnice. Řekneme-li, že
kružnice má poloměr R znamená to, ze fyzikální situace se musí opakovat po každých
2 π R . Pro naši vlnovou
funkci to znamená, že k = n R , kde n je libovolné celé číslo. Znamená to také, že částice nemohou nabývat libovolných hodnot impulzu ve směru x. Povolené hodnoty impulzu jsou diskrétní a vzdáleny o 1 R (v jednotkách, kdy
h =1 ), což může být značně velká hodnota, pokud je rozměr periodické dimenze malý.
V relativistické teorii jsou energie a hmota nerozlišitelné. A protože
E 2 = m 2 c 4 + k 2 c 2 , vidíme, že
částice s impulzem k = n R má energii minimálně c n R . Pokud je uvažovaná dimenze velmi malá, nevidíme žádný pohyb, ale pozorujeme jeho energii jako hmotu. Znamená to, že v Kaluzově -Kleinově světě má každá částice svou nekonečnou rodinu částic úplně stejných vlastností, lišících se pouze hmotami s faktorem n ( c R ) . Například, kdybychom pozorovali foton s hmotou 1 TeV a potom foton s hmotou 2 TeV a potom foton s hmotou 3 TeV atd., řekli bychom, ze jsme objevili skrytou dimenzi s poloměrem
R = 10−19 m. Odsud také hned plyne
vysvětlení toho, že jsme dosud žádné extra dimenze nepozorovali. Když je poloměr dimenze R dostatečně malý, hmotnější partneři částic našeho světa budou příliš hmotní a protože nemáme v současných urychlovačích odpovídající velké energie k disposici, extra dimenze nepozorujeme. Je zajímavé srovnat tuto situaci se známou situací v optice. Tam víme, že pro rozlišení detailů s rozměrem r musíme používat vlnění s vlnovou délkou kratší než r. Tady to funguje v podstatě stejně: abychom mohli vidět malé dimenze, musíme používat vlnění s vlnovou délku kratší než je rozměr dimenze. Můžeme uvažovat o tom, jak vypadá v prostoročase s extra dimenzí elektromagnetické pole bodového náboje. Použijeme představy extra dimenze jako přímé, ale s fyzikální situací periodickou v jejím směru. Potom k uvažovanému bodovému náboji musíme přidat jeho periodické (vzhledem k transformaci
x → x + 2π R )
obrazy. Místo jednoho náboje máme teď nekonečně mnoho nábojů uspořádaných na přímce v směru kompaktní dimenze a vzdálených o
2 π R . Celkový elektromagnetický potenciál není teď potenciálem jednoho bodového
náboje, ale celkovým potenciálem všech nekonečně mnoha nábojů. Daleko od nábojů se tyto jeví jako nekonečně dlouhý nabitý drát. Na druhé straně, když jsme velmi blízko náboje, mnohem blíž než
2 π R , ostatní
(obrazové) náboje jsou relativně daleko a mají malý vliv. Potenciál v této oblasti proto vypadá jako potenciál jednoho bodového náboje. Ve třech dimenzích má bodový náboj potenciál 1 r , což je singulární řešení třídimenzionální Laplaceovy rovnice. Nekonečný nabitý drát má potenciál
ln( r ) , což je řešeni
17 dvojdimenzionální Laplaceovy rovnice. V d dimenzích má Laplaceova rovnice řešení, které vypadá jako
1 r ( d − 2) a potenciál nekonečného nabitého drátu je 1 r ( d − 3) , což je řešení Laplaceovy rovnice v d −1 dimenzích. Celkový efekt je tedy takový, že v blízkosti náboje pozorujeme potenciál, který je d dimenzionální, ale daleko od náboje, když pozorujeme potenciál od celého drátu, je potenciál d −1 dimenzionální. Takže druhou metodou jak pozorovat extra dimenze by bylo zkoumat, zda se pro malé vzdálenosti Coulombův zákon nějak změní. Víme totiž, že pro makroskopické vzdálenosti je síla mezi dvěma náboji F = q1q2 r . Kdyby 2
existovala extra kompaktní dimenze, musela by se závislost síly F na vzdálenosti r změnit pro malé vzdálenosti na F = q1q2 r . Bohužel je zatím Coulombův zákon zkoumán pro vzdálenosti větší než r = 10 3
−17
m, což
znamená, že extra dimenze, pokud existují, musí být velmi malé. V následujícím odstavci uvedeme ale příklad, který tento závěr poněkud vyvrátí.
Velké extra dimenze Z výše uvedeného příkladu je vidět, že extra dimenze, pokud existují, musí být velmi malé. Fakt, že umíme v laboratoři vytvořit částice s energiemi kolem 100 GeV, což odpovídá vlnové délce 10
−18
m znamená,
že skryté extra dimenze musí být menší než tato hodnota, když není jejich vliv v experimentech pozorován. Existuje ale nová modifikovaná verze předchozího příkladu, kde by extra dimenze mohli být velké, možná až 1 mm. Tato modifikace spočívá v předpokladu, že pouze gravitony jsou citlivé na extra dimenze. Zní to docela divoce, ale předpoklad má své pevné základy v teorii strun. Tam existuje možnost, ze náš svět je 3+1 dimenzionální hyperplocha, v teorii strun známá jako D3 - brána, vložená do 9+1 dimenzionálního prostoročasu. Normální částice jako fotony a elektrony jsou tady popsány pomocí otevřené struny, která je navázána na bráně. Znamená to, že fotony a elektrony nemají možnost prozkoumat těch zbývajících šest extra dimenzí a proto o nich nic nevědí. Gravitony ale jsou popsány jako uzavřené struny, které se mohou volně pohybovat ve všech 9 prostorupodobných dimenzích. Kdybychom chtěli zkoumat vlastnosti extra dimenze, musíme tedy používat gravitony. Gravitační případ funguje úplně stejně jako elektromagnetický příklad uvedený výše. Hmotný bod v d dimenzích (hmota je gravitační náboj) má ve své blízkosti gravitační pole, které vypadá jako 1 r
( d − 2)
a je to
také řešení Laplaceovy rovnice. V periodické dimenzi bude nekonečné množství obrazů vypadat jako hmotný drát, který má kolem sebe gravitační pole 1 r
( d − 3)
. V gravitačním případě musíme ale zkoumat Newtonův
zákon, který je analogií Coulombova zákona v elektromagnetickém případě. Otázka tedy je, zda se Newtonův zákon nezmění pro malé vzdálenosti z 1 r
2
3
na 1 r . Z experimentálního hlediska je rozdíl v tom, že gravitační
působení je ověřováno mnohem obtížněji než elektromagnetické. Například tvar Newtonova zákona jako 1 r
2
je ověřen je pro vzdálenosti větší než r = 1 mm. Řekneme-li tedy, že pouze gravitace je citlivá na extra dimenze, je možné, že extra dimenze jsou až 1 mm velké. Jiným důsledkem tohoto scénáře je, že gravitační síla začne vzrůstat už pro mnohem nižší energie než se doposud předpokládalo. Kdybychom v experimentech na další generaci urychlovačů (LHC apod.) zjistili, že energie nám někde „mizí“, může to být tím, že chybějící energii odnesly gravitony do extra dimenzí. Trošku divočejší případ by nastal, kdybychom měli vedle sebe dva takové „bránové světy“. Lidé na opačných branách nemohou komunikovat jinak než prostřednictvím gravitonů. Znamená to, že je pak možné, že
18 máme také svou „stínovou“ planetu, která leží na jiné bráně než naše. Proto není ta planeta vůbec vidět. Můžeme ji pozorovat jenom prostřednictvím jejího gravitačního působení. Něco podobné době, kdy byl „objeven“ Pluto, ale když se dalekohledem pozorovalo vypočtené místo, kde by ta nová planeta měla být, nic nebylo vidět. Nebo si můžeme představit, že naše Slunce by bylo na druhé „stínové“ bráně: sluneční soustava by vypadala úplně stejně pokud jde o dráhy planet, ale protože světlo je elektromagnetického původu vůbec by Slunce nebylo vidět, bylo by pro nás úplně tmavé.
19
Dědičné metabolické poruchy: Viktor Kožich Universita Karlova- 1.lékařská fakulta Ústav dědičných metabolických poruch Ke Karlovu 2, Praha 2 Tel: +420/224967679 nebo 224920293 E-mail:
[email protected]
V souvislosti s publikací sekvence lidského genomu v roce 2001 se veřejnost táže po praktických dopadech tohoto významného objevu. Tématem dnešní přednášky je ukázat na modelu úzce vymezené oblasti lidské genetiky, jaké jsou současné diagnostické, léčebné a preventivní přístupy k léčbě genetických nemocí. Pro demonstraci přístupů jsem si vybral skupinu dědičných poruch metabolismu a uvnitř této skupiny oblast poruch metabolismu homocysteinu. Níže uvedený materiál je pomůckou pro přednášku a obsahuje pouze některé vybrané pasáže diskutované problematiky.
A. Dědičné metabolické poruchy Dědičné poruchy metabolismu (DMP) představují skupinu více než 400 různých genetických onemocnění, která se vyznačují následujícími vlastnostmi: • příčinou je obvykle homozygotní deficit enzymu, jeho aktivátoru, transportního proteinu, nebo vzácněji proteinu s jinou funkcí • důsledkem enzymové či proteinové dysfunkce je obvykle nahromadění substrátů a nedostatek produktů v odpovídajících metabolických cestách; kombinace těchto faktorů vede k systémovým nebo tkáňově specifickým projevům onemocnění • DMP se dědí nejčastěji autosomálně recesivně, mohou se však přenášet i gonosomálně recesivně či maternálně • výskyt jednotlivých DPM v populaci není sice příliš častý jednotlivé DMP jsou onemocnění poměrně vzácná, celkově je však výskyt všech DMP jako skupiny nezanedbatelný a incidence se odhaduje nejméně na 1:1000; předpokládá se, že řada pacientů s DMP uniká diagnose a že skutečný výskyt je mnohem vyšší • přenašečem pro některou z DMP je podle odhadů nejméně každý 15. jedinec v populaci • DMP se mohou projevovat v každém věkovém období, nejčastěji v novorozeneckém až batolecím věku • DMP mohou postihovat všechny orgány • ačkoliv existují známky vysoce specifické pro DMP (jako např. abnormální zápach či zbarvení moči nebo charakteristické změny při očním vyšetření), většina DMP se projevuje nespecifickými příznaky jako je např. neprospívání, psychomotorická retardace, nebo poruchy vědomí • typickým rysem DMP je přítomnost abnormálních koncentrací různých metabolitů v tělesných tekutinách a prokazatelná dysfunkce enzymů ve tkáních • DMP postihující funkci organel (lysosomů, mitochondrií či peroxisomů) jsou obvykle neléčitelné, i když u některých lysosomálních nemocí se začíná používat enzymová therapie nebo inhibitory synthesy glykolipidů • DMP zasahující do metabolismu aminokyselin, organických kyselin, amoniaku, do přeměny sacharidů a mastných kyselin jsou poměrně často therapeuticky ovlivnitelné speciálními dietami nebo podáváním některých vitaminových kofaktorů • u některých DMP se hromadí vysoce toxické metabolity, které vedou k akutním metabolickým dekompensacím a poruchám vědomí; pacienti s těmito chorobami vyžadují celoživotně a opakovaně intensivní péči • většinu DMP lze diagnostikovat prenatálně analysou enzymové aktivity nebo mutací v choriových klcích či amniocytech, nebo vyšetřením metabolitů v plodové vodě
20
B. DMP v České republice Problematice dědičných metabolických poruch je v ČR věnována pozornost od konce 60.let, v roce 1975 byl zaveden celopopulačního screeningu fenylketonurie a hyperfenylalaninemií v bývalé ČSR. S následným rozvojem technik pro diagnostiku DMP vzniklo na území ČR několik laboratoří zabývajících se diagnostikou DMP, přičemž dostupnost metodik v naší republice je srovnatelná s běžným evropským průměrem.
Naše pracoviště disponuje přístrojovou technikou a týmovou zkušeností v rozsahu, který umožňuje diagnostikovat většinu DMP na úrovni metabolitů a velký počet DMP na úrovni enzymatické či molekulové. U části pacientů s extrémně vzácnými DMP nelze diagnosu stanovit vlastními silami a je nezbytné požádat o ověření diagnosy některé z vysoce specialisovaných zahraničních pracovišť. Protože naše pracoviště stanovuje konečnou diagnosu DMP u většiny pacientů z celé ČR a u některých pacientů ze zahraničí, přehled případů diagnostikovaných naší laboratoří odráží s velkou pravděpodobností situaci v ČR. Podrobnější analysu výskytu jsme provedli pro roky 1994-1998, kdy naše pracoviště diagnostikovalo 373 převážně českých pacientů s DMP, zastoupeno bylo 70 různých nosologických jednotek. Přesnou incidenci nelze spolehlivě určit z řady příčin, např. vzhledem k různému věku manifestace DMP, vyšetřování pouze symptomatických jedinců, diagnostice lysosomálních a mitochondriálních chorob v naší laboratoři nejen u pacientů z ČR ale i ze SR. Přibližný odhad incidence je založený na počtu novorozenců v ČR za toto pětileté období a pohybuje se kolem 1:1270, podobný trend byl zachován i v následujících letech. Z přehledu jednotlivých skupin onemocnění (viz obrázek níže) vyplývá, že nejčastějšími diagnostikovanými DMP v naší populaci jsou mitochondriální poruchy, hyperfenylalaninemie a fenylketonurie, a lysosomální enzymopathie. Do incidence DPM v ČR nejsou započítány poruchy metabolismu lipoproteinů, porfyrie a hyperurikemie.
Zastoupení DMP v ČR (1994-1998) puriny/pyrimidiny 6% sacharidy 9%
mitochondriální 21%
beta-oxidace a OAU 9%
AMK bez HPA 12%
lysosomální 19%
HPA a PKU 21%
peroxisomální 3%
C. Poruchy metabolismu homocysteinu jako model DMP
21 Homocystein je neesenciální aminokyselina obsahující thiolovou funkční skupinu. Poruchy metabolismu této aminokyseliny jsou popsány jak u vzácných genetických onemocnění, tak u nemocí tak častého výskytu jako je např. atherosklerosa. Poruchy metabolismu homocysteinu použijeme při přednášce jako model DMP, na němž lze demonstrovat různé úhly pohledu na lidská genetická onemocnění, od studia příčin, pathogenese choroby, přes léčbu a prevenci až po dopady celopopulační.
Metabolismus homocysteinu Homocystein (Hcy), aminokyselina obsahující thiolovou funkční skupinu, je meziproduktem při metabolismu methioninu a S-adenosylmethioninu (viz obrázek níže). Homocystein vzniklý hydrolysou Sadenosylhomocysteinu se ocitá na rozhraní dvou metabolických cest. Jednak může být remethylován zpět na methionin za katalytického účinku methioninsynthasy (MS), která obsahuje kovalentně vázaný vitamin B12, za použití methylové skupiny z methyltetrahydrofolátu. Při tvorbě methyltetrahydrofolátu hraje důležitou úlohu enzym methylentetrahydrofolátreduktasa (MTHFR). Druhou metabolickou cestou homocysteinu je jeho transsulfurace na cystathionin, cystein a konečně na anorganický sulfát. Na katalyse v této metabolické cestě se podílí několik enzymů, dva z nich obsahují pyridoxal 5´-fosfát (cystathionin beta-synthasa, CBS, a gamacystathionasa). Remethylace homocysteinu probíhá ve většině tkání, transsulfurace je kvantitativně významná především v játrech a pankreatu, v menší míře i v CNS, ledvinách a dalších orgánech. Převaha jedné nebo druhé cesty je závislá nejen na tkáni a věku osoby, ale i na exogenních vlivech jako je např. množství methioninu a cholinu v potravě. Existuje hypothesa, že optimální koncentrace S-adenosylmethioninu se udržuje navzájem propojenou regulací jeho synthetické a degradační cesty.
Příčiny hyperhomocysteinemie Fysiologické koncentrace celkového homocysteinu v plasmě se pohybují mezi 5-15 µmol/l v závislosti na věku a pohlaví. Zvýšená koncentrace homocysteinu se nazývá hyperhomocysteinemií (HHC). V populaci se různé typy HHC vyskytují různě často: mírná hyperhomocysteinemie (mHHC) v rozmezí 16-30 µmol/l postihuje 1020% populace, naproti tomu těžká hyperhomocysteinemie s koncentracemi tHcy až do 500 µmol/l se vyskytuje
methionin FH4
1A 1B
S-adenosylmethionin 5
methylenFH4 8
B2
B12
7
S-adenosylhomocystein
6
methylFH4
2
homocystein 3
B6
cystathionin 4
B6
cystein
glutathion
jen vzácně u klasické či remethylační homocystinurie, která má prevalenci cca 1:60.000- 1:340.000. K hyperhomocysteinemii může dojít jednak při zvýšené tvorbě homocysteinu nebo při jeho zpomaleném odbourávání v transsulfurační nebo remethylační cestě. U každé osoby s HHC se na jejím vzniku v různé míře podílejí faktory zevní i vnitřní, hlavní příčina zvýšené koncentrace homocysteinu může být u různých osob naprosto odlišná. Mezi exogenní příčiny HHC patří velký přívod methioninu, deficit folátů, kobalaminu či pyridoxinu a podání některých léků (např. azauridinu, methotrexátu, aminofylinů, L-DOPY, inhalace oxidu dusného). Mezi endogenními příčinami HHC dominují genetické odchylky, i když příčinou HHC mohou být i chorobné procesy s méně významnou genetickou složkou (např. renální insuficience či psoriasa). Interakce mezi jednotlivými faktory, které nakonec vedou ke vzniku HHC u daného jedince jsou komplexní povahy a mohou sloužit jako příklad ekogenetické nemoci.
22 Geny, genové produkty a mutace Genetické příčiny zvýšených koncentrací homocysteinu mohou obecně spočívat v mutacích, které sníží aktivitu enzymů odbourávajících homocystein nebo změní aktivitu enzymů podílejících se na jeho tvorbě. Většina genů i genových produktů v metabolismu homocysteinu je již známa (viz tabulka 1), u řady genů jsou známé i mutace (viz tabulka 2). Thermolabilní varianta methylentetrahydrofolátreduktasy (MTHFR) byla popsána v 80.letech, příčinou této enzymové varianty je mutace 677 C>T v genu pro MTHFR. Mutace vede k nahrazení alaninu 222 valinem (A222V), čímž se naruší vazba kofaktoru flavinadenindinukleotidu a dochází ke snazší disociaci enzymových podjednotek tetrameru. Protože homozygotie pro tuto variantu je poměrně častá a vyskytuje se u 10% bělochů v Evropě i Severní Americe, sledovala se v řadě studií souvislost této genetické odchylky s HHC, atherosklerosou a rozštěpy nervové trubice. Ve velkých studiích je zjevné, že homozygoti pro 677 C>T mají vyšší koncentrace homocysteinu o cca 2 µmol/l než zdraví homozygoti, naproti tomu risiko atherosklerosy je zvýšeno jen mírně (odds ratio TT homozygotie pro atherosklerosu je ve velké metaanalyse 1.16). Mutace 677 C>T je tady běžnou příčinou mírné hyperhomocysteinemie, ale její příspěvek ke vzniku atherosklerosy se zdá být poměrně málo významný. Souvislost mezi mutací 677 C>T nebo nově popsaným polymorfismem 1298 A>C na straně jedné a rozštěpy neurální trubice na straně druhé je nejasná. Protichůdné výsledky nizozemských a italských studií svědčí pro to, že varianty v genu pro MTHFR mohou hrát roli v rozvoji rozštěpů nervové trubice pouze v některých populacích. Nejasná je otázka, proč je mutace 677 C>T v bělošských populacích tak častá. Jedním z možných vysvětlení je to, že tato genetická varianta by mohla poskytovat svým nositelům nějakou selekční výhodu. Existuje teorie, že mutantní MTHFR může chránit před karcinogenesou. Methioninsynthasa (MS) je kromě methylmalonyl-CoA mutasy jediným savčím enzymem, který obsahují kovalentně vázaný kobalamin, mRNA pro tento enzym byla popsána nedávno. Methioninsynthasa je aktivní ve většině tkání, po několika katalytických cyklech se však kobaltový kation v MS oxiduje a musí být následně redukován. V roce 1998 byla popsána sekvence mRNA pro reduktasu methionin synthasy (MRR). V témže roce se objevila zpráva, že redukci by mohly zajišťovat pravděpodobně i jiné reduktasy používající jak NADH, tak i NADPH. Cystathionin beta-synthase (CBS) je tradičně věnována pozornost při úvahách o pathogenesi hyperhomocysteinemie. Jedním důvodem je to, že deficit CBS je nejčastější příčinou klasické homocystinurie u člověka, dalším je fakt, že průběh zátěžového testu s L-methioninem u části pacientů s atherosklerosou je totožný s průběhem testu u obligatorních heterozygotů pro deficit CBS. Cystathionin beta-synthasa je cytoplasmatický enzym, který váže kromě substrátů i pyridoxal 5´-fosfát, S-adenosylmethionin a hem. Genetické poruchy v lokusu pro CBS jsou nejčastější příčinou těžké hyperhomocysteinemie, není proto překvapením, že je v něm nyní známo více než 120 různých mutací, aktuální seznam mutací je udržován na webové stránce http://www.uchsc.edu/sm/cbs.
23
Tabulka 1. Geny a genové produkty Číslo
Název
Mr
Ligandy enzymu Lokalisace Kodující Exprese v orgánu a velikost oblast mRNA genu
44 kDa
Methionin ATP AdoMet Methionin ATP AdoMet AdoHcy NAD+
10q22
20cen-q13.1
1296
Většina orgánů
Hcy, serin, hem, PLP, AdoMet
21q22.3
1653
Pankreas, játra, CNS, ledviny
23 kbp 16
1218
Játra, ledviny
140 kDa Methylkobalamin, methytetrahydrofolát, homocystein 78 kDa Methionin synthasa? NADPH, FAD, FMN
1q43
3795
Většina orgánů
5p15
2094
Většina orgánů
BHMT
45 kDa
Betain Homocystein
5q13.1
2.1.1.5 MTHFR
70 kDa
FAD, NADPH, methylentetrahydrofolát
1p36.3
Zkratka E.C.
1A 1B 2 3 4 5 6 7 8
Methionin adenosyltransferasa 1 Methionin adenosyltransferasa 2 S-adenosylhomocystein hydrolasa Cystathionin beta-synthasa Gamma cystathionasa Methionin synthasa Reduktasa methionin synthasy Betain: homocystein methyltransferasa Methylentetrahydrofolát reduktasa
MAT1A 2.5.1.6 MAT2A 2.5.1.6 AHH 3.3.1.1 CBS 4.2.1.22 4.4.1.1 MS 2.1.1.13 MTRR
1.5.1.20
podjednotek
53 a 38 kDa 47 kDa 63 a 48 kDa
40 kDa? Cystathionin, PLP
1185
2p11.2
17 kbp
Játra Většina orgánů
Ledviny, játra 1249
Většina orgánů
25
Tabulka 2. Mutace a polymorfismy Gen
Mutace přítomné u těžké homocystinurie
Polymorfismy pathogenita mutací nízká nebo neurčená prevalence > 1% alel
pathogenita mutací vysoká prevalence < 1% alel Počet Nejčastější mutace známých mutací
Polymorfismus
Methionin adenosyltransferasa 1 Cystathionin beta-synthasa Methionin synthasa
16
Privátní mutace
---
≈120
G307S, I278T, 1224-2 A>C a dále privátní mutace
≈7
Reduktasa methionin synthasy Methylentetrahydrofolát reduktasa
Prevalence alely v populaci
Klinické implikace
844ins68
≈ 5%
Atherosklerosa? Rozštěpy nervové trubice?
Privátní mutace
3150 A>G (D919G)
≈ 17%
Asociace s atherosklerosou zatím nepotvrzena
2
Privátní mutace
1004 G>T 1158 G>A ---
≈15
Privátní mutace
≈30% ≈30%
Hyperhomocysteinemie, zřejmě bez doprovázející atherosklerosy Rozštěpy nervové trubice?
677 C>T 1298 A>C
26 Deficit CBS jako příčina klasické homocystinurie Deficit CBS je porucha metabolismu methioninu s autosomálně recesivním způsobem přenosu, která se manifestuje postižením centrálního nervového systému, pojiva a cévního systému. V různých populacích na světě se tento typ homocystinurie vyskytuje s incidencí cca 1:20,000 až 1:900,000. Při snížené aktivitě CBS dochází k akumulaci metabolitů před blokem v místě CBS a současně vzniká deficit metabolitů distálně od místa aktivity CBS. V pathogenesi onemocnění se předpokládají následující mechanismy: a) zvýšená hladina homocysteinu vede k poškození centrálního nervového sytému (CNS) interferencí s N-methyl-D-aspartátovým receptorem, dále vede k poškození cévního endotelu, interferuje s metabolizmem oxidů dusíku, způsobuje proliferaci svalových buněk cévní médie a zásahem do metabolizmu prostaglandinů zvyšuje agregabilitu trombocytů; homocystein také narušuje tvorbu správné struktury kolagenu, b) snížená hladina cysteinu vede k poruše metabolizmu pojivové tkáně - byla vyslovena hypotéza o tom, že nedostatek cysteinu vede ke zhoršení tvorby disulfidových vazeb mezi kolagenovými vlákny, c) kromě toho existují další hypotézy o patogenetických mechanismech: akumulace kyseliny homocysteové se může podílet na postižení pojiva stimulací buněčné proliferace, dále na postižení CNS interakcí s glutamátovými receptory; akumulace S-adenosylhomocysteinu se dává do souvislosti s poškozením CNS zprostředkovaně snížením hladiny adenosinu; změny v koncentraci sirovodíku jako modulátoru aktivity N-methyl-D-aspartátových receptorů by se mohly podílet na postižení CNS. Klinický obraz homocystinurie je variabilní. Tíže postižení koreluje s responsivitou na podávání pyridoxinu: průběh onemocnění je u pacientů s pyridoxinresponsivní formou mírnější než u pacientů s pyridoxinrezistentní formou. Responsivitu na pyridoxin lze objektivisovat vyšetřením hladiny celkového homocysteinu v krvi během podávání vitaminu B6 v dávce 5-10mg/kg/den. Responsivita na podávání pyridoxinu je podmíněna molekulárně genetickými faktory - konkrétním typem mutace v genu pro CBS u jednotlivých pacientů. Výskyt jednotlivých mutací se u různých etnických skupin liší (např. mutace 919G→A je vysoce prevalentní v populacích keltského původu a způsobuje pyridoxinrezistentní formu homocystinurie, naopak mutace 833T→C je ubikviterní a vede k mírné pyridoxinresponsivní formě onemocnění; mutace IVS11-2A→C spojená s pyridoxinrezistentní formou nemoci je relativně často zastoupena ve střední Evropě). Různý výskyt mutací vysvětluje rozdílné zastoupení pyridoxinresponzivních pacientů a variabilitu klinického obrazu v různých populacích. Homocystinurie je onemocnění léčitelné, přičemž efekt léčby je přímo úměrný včasnosti zahájení léčby. U pacientů zachycených novorozeneckým screeningem je úspěšnost léčby velmi vysoká, nedochází k postižení CNS, pojivové tkáně ani cév. U pacientů, kteří byli diagnostikováni až na základě klinických projevů, léčba umožňuje zpomalit progresi postižení pojiva a snižuje risiko tromboembolie. V léčbě se uplatňuje dieta s velmi přísným omezením přívodu přirozených bílkovin a podáním směsi esenciálních aminokyselin bez methioninu, podání vitaminu B6 (v dávce 5-10 mg/kg/den) jako kofaktoru stimulujícího zbytkovou aktivitu CBS, a podpora remethylace homocysteinu betainem (v dávce 50-200 mg/kg/den), foláty (v dávce 5 mg 2-4x týdně) a vitaminem B12 (v dávce 1000 µg několikrát ročně). Podání vitaminu B6 je obvykle prvním terapeutickým opatřením u nově diagnostikovaných pacientů. Pokud pyridoxin sám o sobě nevede ke snížení hladiny homocysteinu v plazmě pod 30-50 µmol/l, je potřebné přistoupit k omezení příjmu methioninu ve stravě, eventuálně i podávání betainu. Pro prognózu onemocnění je kromě časného stanovení diagnózy zásadně důležité dodržování dieto- a farmakoterapie ze strany pacienta. Pro potřeby genetického poradenství je možné zjištění heterozygotie metodikami molekulární genetiky; prenatální diagnostika je dostupná v prvním trimestru molekulárně genetickými metodami a v trimestru druhém enzymologicky.
Homocysteinová teorie atherosklerosy Homocysteinu jako možné příčině atherosklerosy je věnována pozornost od 60.let, kdy McCully popsal poprvé cévní komplikace u vzácné choroby homocystinurie. Následné experimenty na zvířatech prokázaly atherogenní vlastnosti vysokých dávek homocysteinu. U člověka však homocystein v krvi tehdy dostupnými metodikami nebyl prokazatelný. Teprve na konci 70.let se objevily techniky, umožňující měření tzv. celkového homocysteinu ( tHcy podle „total homocysteine“). Celkový homocystein je směsí redukovaného volného homocysteinu a oxidovaného homocysteinu (v podobě disulfidů homocystinu, cystein-homocysteinu či cysteinylglycin-homocysteinu) včetně homocysteinu vázaného na plasmatické bílkoviny. Od první studie homocysteinu u pacientů s koronární atherosklerosou v sedmdesátých letech byl metabolismus homocysteinu vyšetřen již u velkého množství pacientů na celém světě, dosud byly publikovány výsledky studií u více než 10.000 pacientů s atherosklerosou. Autoři dvou rozsáhlých metaanalys, shrnuli výsledky z více než 80 epidemiologických studií a došli k závěru, že zvýšená plasmatická koncentrace tHcy je nezávislý risikový faktor pro atherosklerosu podobné síly jako je hypercholesterolemie či kouření. Tento názor je však opakovaně zpochybňován a existují alternativní teorie vysvětlující zvýšené koncentrace tHcy u pacientů s atheroskleorosou.
27 Podle diskutovaných názorů může být mírná hyperhomocysteinemie skutečným vyvolávajícím faktorem pro atherosklerosu, zvýšené koncentrace tHcy mohou však být pouhým sekundárním projevem zánětu při atherosklerotickém procesu, nebo mohou být důsledkem vitaminových deficitů, které se podílejí na vzniku atherosklerosy. Souhrnem lze konstatovat, že epidemiologický průkaz asociace mírné HHC s kardiovaskulárními onemocněními je v retrospektivních studiích přesvědčivý a nevyžaduje již další studie typu case-control zaměřené pouze na průkaz souvislosti mezi Hcy a atherosklerosou. V budoucnosti bude nutné uskutečnit ještě velké množství studií, které budou zjišťovat, zda mírná hyperhomocysteinemie je skutečnou příčinou atherosklerosy nebo jen jejím důsledkem. Dalším důležitým prvkem při posouzení role homocysteinu v atherogenesi jsou právě zahájené intervenční studie, které budou studovat, zda snížení hladin homocysteinu pomocí vitaminotherapie povede ke snížení mortality a morbidity na kardiovaskulární onemocnění.
Léčba mírné hyperhomocysteinemie- prevence atherosklerosy? Je známo již delší dobu, že mírnou hyperhomocysteinemii lze ovlivnit výživou, především přívodem folátů, kobalaminu a pyridoxinu, i když zatím není jasné, zda snížení koncentrace homocysteinu dosažené podáváním vitaminů povede ke snížení morbidity a mortality na cévní onemocnění. Doporučená denní dávka vitaminů je různá v různých zemích, např. v USA je pro dospělé 400 µg folátu, 1.7 mg pyridoxinu a 2.4 µg vitaminu B12 denně, doporučená dávka je vyšší u těhotných a kojících žen. Léčebné či preventivní snahy o zvýšení přívodu vitaminů mohou směřovat buď k ohroženým jednotlivcům, nebo dokonce k celým populacím. Názory na therapeutické ovlivnění mírné hyperhomocysteinemie se postupně vyvíjejí. K léčbě mHHC byly navrhovány foláty, pyridoxin, vitamin B12 a event. betain. Jedno z doporučení pro léčbu mHHC vydáno v roce 1999 komisí pro výživu American Heart Association. Jako první opatření po zjištění mHHC je doporučená úprava diety s kontrolou koncentrace homocysteinu po jednom měsíci. Nedojde-li k poklesu koncentrace celkového homocysteinu nalačno pod 10 µmol/l, doporučuje se podávání multivitaminů s obsahem 400 µg folátu, 6 µg vitaminu B12 a 2 mg pyridoxinu. Pokud nedojde při této léčbě k poklesu koncentrace homocysteinu pod 10 µmol/l, doporučuje American Heart Association podávat 1 mg folátu, 25 mg pyridoxinu a 0.5 mg vitaminu B12 denně. Nevede-li ani tento režim ke snížení koncentrace homocysteinu v plasmě, doporučují autoři uvážit podání 3 g betainu 2x denně. Příkladem celopopulačního zásahu je fortifikace stravy foláty s cílem snížit incidenci mírné hyperhomocysteinemie a tím i risiko rozštěpových vad neurální trubice a atherosklerosy. Tento přístup byl zvolen v USA, kde je od roku 1998 např. mouka obohacena o 140 µg kys.listové/100g, fortifikovaná je např. i pomerančová šťáva. Jenom samotný přívod 100 µg folátu/den v obohacené pomerančové šťávě vedl ke zdvojnásobení plasmatických hladin folátů a poklesu prevalence mHHC z 20% na 15%.
Závěrem můžeme konstatovat, že vitaminová therapie představuje levný a málo risikový způsob intervence u osob s hyperhomocysteinemií, fortifikace stravy foláty se možná v budoucnosti stane doporučeným postupem. Efekt podávání vitaminů na snížení mortality na kardiovaskulární onemocnění však bude vyžadovat ještě dlouhou dobu, dokud nebudou zhodnoceny právě probíhající prospektivní studie.
D. Má smysl studovat vzácné genetické choroby? Studium vzácných genetických onemocnění má podle mého názoru smysl ze dvou hlavních důvodů: a/ pochopení příčiny nemocí a jejich mechanismů je podmínkou pro účinnou a cílenou léčbu a pro prevenci a b/studium mechanismů vzácných těžkých poruch napomáhá pochopení fysiologických procesů v buňce. Náklady vynaložené společností na financování výzkumu genetických onemocnění se tak v konečném důsledku vracejí zpět společnosti v podobě nových poznatků a zlepšení kvality života nemocných jedinců.
Při přípravě tohoto textu jsem použil materiály z následujících článků: Kožich V, Hyánek J, Kraus JP: Homocystein, geny a vitaminy: souvislost s kardiovaskulárními onemocněními a komplikacemi těhotenství, Diabetologie, metabolismus, endokrinologie, výživa 2, 1999, 113-120
Orendáč M, Kožich V, Zeman J, Hyánek J, Bzdúch V, Mišovicová N, Marklová E, Vaďurová L, Pijáčková A: Klinický obraz homocystinurie z deficitu cystathionin βsynthasy u devatenácti českých a slovenských pacientů, Čas Lék Čes 139, 2000, 500507
28
Kožich V, Poupětová H, Hřebíček M, Zeman J, Chudoba D, Šťastná S a Elleder M: Dědičné metabolické poruchy ve fetální medicíně. Sborník přednášek z Velostátní konference Sekce fetální medicíny, Praha 2000
29 Léčebné využití urychlených hadronů Miloš Lokajíček, Pavel Kundrát E-mail:
[email protected],
[email protected]
Tel.: +420 266052135 Fyzikální ústav Akademie věd ČR, Na Slovance 2, 182 21 Praha 8
Abstrakt Urychlené protony a lehké ionty předávají při průchodu prostředím nejvíce své energie až v oblasti těsně před vlastním doběhem. Oblast předávané dávky lze proto u těchto částic ve srovnání s konvenčními způsoby ozařování (fotony, elektrony) velmi dobře vymezit, takže je možné výrazně snížit zatížení zdravých tkání v okolí nádorového ložiska. Výhody prostorového rozložení předané dávky jsou dále znásobeny vyšší biologickou účinností těchto částic. Po vysvětlení základních principů hadronové terapie se podrobněji věnujeme vlastnímu radiobiologickému mechanismu, jehož detailní znalost je nezbytná k tomu, aby možnosti této léčebné metody byly optimálně využity. Rovněž shrnujeme současné využití hadronové radioterapie ve světovém měřítku a stav přípravných prací pro realizaci této metody u nás.
Úvod Nádorová onemocnění jsou druhou hlavní příčinou úmrtí jak v evropském měřítku, tak i v České republice. Jejich počet má přes všechny snahy o prevenci stále vzrůstající tendenci. Podle studií WHO (World Health Organization) lze očekávat, že ve vyspělých zemích bude během svého života postižen tímto onemocněním každý třetí občan. V České republice je každoročně odhaleno téměř 60.000 nových případů nádorových onemocnění. Zhoubné novotvary jsou příčinou úmrtí přibližně 28.000 osob ročně (tato onemocnění tedy tvoří příčinu cca 25% všech úmrtí). Celkem u nás žije téměř 285 tisíc osob, u kterých byl novotvar zjištěn.
30
Při včasné diagnostice lze přibližně 45% těchto onemocnění vyléčit, a to především pomocí chirurgie a radioterapie, případně kombinací obou metod. Asi v 5% případů se uplatňuje také chemoterapie, často ve spojení s oběma předcházejícími postupy; úspěšnost léčby schematicky zachycuje obrázek 1. chirurgie 22%
radioterapie 12% chirurgie + radioterapie 6%
chemoterapie 5%
paliativní léčba 37%
selhání lokální léčby 18%
obrázek 1: Úspěšnost léčby nádorových onemocnění
Radioterapie nádorových onemocnění Radioterapie představuje spolu s chirurgickým odnětím ložiska hlavní metodu léčby nádorových onemocnění v lokalizovaném stadiu. Tato metoda je založena na biologickém účinku ionizujících částic. K odstranění nádorového ložiska je nutné inaktivovat (usmrtit) prakticky všechny nádorové buňky. Pravděpodobnost buněčné inaktivace narůstá s aplikovanou dávkou1. Do cílového objemu je proto zapotřebí dopravit dostatečnou, tzv. kanceroletální dávku. Zpravidla jsou však při tom určité radiační zátěži vystaveny i zdravé buňky okolních tkání. Jejich poškození pak může vést ke vzniku nežádoucích komplikací. Nachází-li se nádorové ložisko v blízkosti citlivých zdravých struktur, omezuje riziko vedlejších účinků léčby celkovou dávku, kterou lze do ložiska aplikovat, a pravděpodobnost úplného odstranění nádoru klesá.
1
Dávka je energie, předaná na jednotku hmotnosti příslušného prostředí.
31
Při konvenčních radioterapeutických postupech se využívají svazky fotonů a elektronů. Fotony vykazují prakticky exponenciální pokles předávané energie s hloubkou průniku tkání, maximální dávka je předávána tkáním ležícím blízko povrchu pacientova těla. Podobná charakteristika platí i v případě elektronů, viz obrázek 2. Tuto nepříznivou skutečnost částečně kompenzuje ozařování z více směrů, kdy lze oblast maximální předávané dávky umístit do potřebné hloubky a do jisté míry uzpůsobit podle tvaru ložiska. K omezení rizika vzniku komplikací se dále využívá frakcionované ozařování, při kterém lze dosáhnout rozdílného biologického účinku na zdravou a nádorovou tkáň; viz např. [1].
Braggovo maximum a hadronová radioterapie Urychlené protony a lehké ionty jsou charakterizovány zcela odlišným průběhem předávané energie v závislosti na hloubce průniku tkání. Při průchodu prostředím ztrácejí tyto částice svoji energii srážkami s atomovými elektrony, srážkami s jádry a jadernými reakcemi. V terapeuticky významné oblasti energií jsou dominantní elektronové ztráty. Ty jsou popsány Betheho-Blochovou rovnicí, viz např. [2] −
⎤ Z 1 ⎡ 1 2me c 2 β 2γ 2Tmax dE ln − β 2⎥ , ( E ) = Kz 2 2 ⎢ 2 A β ⎣2 dx I ⎦
kde K = 4πN A re2 me c 2 (NA – Avogadrovo číslo, re=e2/(4πε0mec2) klasický poloměr elektronu, me hmota elektronu, c rychlost světla ve vakuu), z je náboj dopadající částice, β = v/c její rychlost, γ =(1-β 2) −1/2, Z je protonové číslo prostředí, A jeho atomová hmotnost. Tmax značí maximální kinetickou energii, která může být v jedné srážce předána volnému elektronu, I je střední excitační energie. Modifikovaná formule, platná i v nízkoenergetické oblasti, je uvedena např. v práci [3]. Pro ionty je nutné započítávat i jaderné reakce. Přibližně jsou tedy energetické ztráty těchto částic nepřímo úměrné druhé mocnině jejich rychlosti. Proto předávají protony a lehké ionty nejvíce energie v oblasti těsně před svým doběhem, viz obrázek 2. Tkáně ležící před tzv. Braggovým maximem jsou zasaženy výrazně
32
menší dávkou, tkáně ležící za ním nejsou vystaveny prakticky žádné zátěži. Těžké nabité částice navíc jen slabě podléhají bočnímu rozptylu. Díky fyzikálním vlastnostem těchto částic lze oblast maximální předávané dávky velmi přesně vymezit.
obrázek 2: Křivky hloubkových dávek pro různé druhy záření, které jsou používány k ozařování nádorových onemocnění.
Poloha Braggova maxima je dána energií částic. Pro dosažení potřebné hloubky průniku tkání cca 2 až 25 cm je nutné částicím udělit odpovídající energii, která činí pro protony cca 60 až 250 MeV, pro lehké ionty cca 120 až 400 MeV na nukleon. Šířka Braggova maxima bývá často menší než rozměr nádoru. Úzkou oblast maxima předávané energie lze pomocí speciálních absorpčních filtrů rozšířit na potřebné rozmezí hloubek podle polohy a rozměru nádoru (tzv. pasivní rozptyl svazku), viz obrázek 3 a obrázek 4. Pro vymezení průřezu svazku podle nepravidelného tvaru ložiska se používají kolimátory, k přizpůsobení oblasti ozáření podle zadní stěny nádoru jsou využívány speciální kompenzátory (obrázek 5). Tyto pomůcky jsou vyráběny individuálně pro každého pacienta a pro každé ozařovací pole.
33
obrázek 3: Rozšířené Braggovo maximum
obrázek 4: Stupňovité disky pro hloubkové rozšíření svazku (Harvard Cyclotron Laboratory, USA)
obrázek 5: Kolimátory a kompenzátory, používané pro uzpůsobení oblasti ozařování podle tvaru nádoru (Harvard Cyclotron Laboratory, USA)
Výhodnější postup modulace svazku představuje metoda aktivního skenování nádorového ložiska, kdy je cílový objem meandrovitým způsobem projížděn úzkým svazkem částic v několika rovnoběžných rovinách. Princip této metody ilustruje obrázek 6. Zařízení pro aktivní skenování spojené s možností ozařování pacienta z různých směrů (gantry systém), které je v provozu v Paul Scherrer Institute (PSI) ve švýcarském Villigenu, zachycuje obrázek 7.
34
obrázek 6: Princip aktivního skenování nádorového ložiska [4].
obrázek 7: Léčebná místnost v PSI s hlavicí gantry systému pro aktivní skenování ložiska.
Tkáně ležící za cílovou oblastí nejsou při použití pasivní či aktivní techniky modulace svazku vystaveny prakticky žádné dávce. Poměrně malá je i zátěž tkání před touto oblastí, zvláště v případě aktivního skenování, které umožňuje přizpůsobit i přední a boční okraj oblasti ozáření podle tvaru nádorového ložiska. Výrazného snížení zátěže okolních tkání lze podobně jako v konvenční radioterapii dosáhnout kombinací ozáření z více polí. Pro dosažení výhodného poměru mezi biologickým účinkem na zdravou a na nádorovou tkáň se i v případě hadronové terapie využívá frakcionované ozařování.
Rozdělení absorbované dávky a biologická účinnost Základní výhodou radioterapie pomocí svazků protonů a lehkých iontů je tedy možnost umístit oblast maximální předávané dávky do nádorového ložiska a přesněji ji přizpůsobit podle jeho tvaru. Lze dosáhnout výrazného gradientu mezi dávkou aplikovanou v cílové oblasti a dávkou v jejím okolí (obrázek 8). Proto lze výrazně zvýšit ložiskovou dávku a tím i pravděpodobnost odstranění nádoru, aniž by došlo ke zvýšení rizika vzniku komplikací. Přesné ozáření ložiska s minimálním poškozením okolních tkání je nezbytné zejména pro léčbu neoperabilních nádorových ložisek, která se nacházejí v těsné blízkosti kritických zdravých tkání značně citlivých vůči ozáření. Do této skupiny patří např. některé nádory očí, spodiny lebeční, mozku či páteře.
35
Záření X
Protony
obrázek 8: Karcinom prostaty – srovnání konvenčního záření X a protonových svazků při ozařování jedním a čtyřmi, resp. třemi poli [5].
Protony a zejména lehké ionty dále vykazují vyšší hodnoty lineárního přenosu energie2, a to zvláště v oblasti Braggova maxima. Z radiobiologických experimentů je přitom známo, že záření s vyšším lineárním přenosem energie má vyšší biologickou účinnost [1]. Hlavní výhoda hadronové terapie, tedy ostré vymezení oblasti předávané energie, je tak znásobena vyšší biologickou účinností tohoto záření. Rovněž nepříznivý kyslíkový efekt, kdy se u nedostatečně okysličených buněk uvnitř nádoru snižuje jejich citlivost vůči záření, se u záření s vyšším lineárním přenosem energie uplatňuje ve snížené míře [1]. Od ozařování pomocí urychlených protonů a lehkých iontů se proto očekává významný přínos i u některých radioresistentních nádorů.
2
Energie předaná na jednotku dráhy jedné částice ozařovacího svazku.
36
Radiobiologický mechanismus a jeho modelování K tomu, aby mohly být všechny výhody hadronové radioterapie optimálně léčebně využity, je nezbytná podrobná znalost radiobiologického mechanismu, zejména v oblasti Braggova píku. Porozumění příslušným procesům je nutné jak pro optimalizaci prostorového rozložení dávky z hlediska výsledného biologického účinku ozařovacího postupu, tak pro optimalizaci časového rozdělení dávky aplikované různými ionty. Detailnímu pochopení a matematickému modelování příslušných procesů je proto v současné době celosvětově věnována značná pozornost; na tomto výzkumu se významně podílejí i naše pracoviště. Několik základních charakteristik procesů, které probíhají v buňkách a tkáních po dopadu ionizujících částic, shrneme v tomto odstavci. Biologický účinek daného léčebného ozařovacího postupu není určen pouze prostorovým rozložením předané energie (dávky), ale závisí významně na celé řadě faktorů. Z praktického hlediska to je především lineární přenos energie (linear energy transfer, LET) a druh buněčné populace, dále přítomnost molekulárního kyslíku a případně dalších chemických činidel v buňce v průběhu ozařování. Může záviset též na dávkové rychlosti, s níž jsou jednotlivé frakční dávky aplikovány; tento faktor však lze při klinické aplikaci prakticky zanedbat. Radiobiologický účinek na příslušnou buněčnou populaci je v obecném případě kombinací účinku v několika postupných krocích, které odpovídají jednotlivým fázím příslušného procesu (fyzikální, fyzikálně-chemická a biologická fáze). V následujícím popíšeme námi navržený obecný matematický model, s jehož pomocí lze příslušné procesy reprezentovat. V první fázi se jedná o statistické rozdělení přenosu energie částicemi ozařovacího svazku na jednotlivé buňky, tj. o energii předanou ionizujícími částicemi jednotlivým buněčným jádrům, respektive jednotlivým chromozomálním systémům. Předpokládáme-li, že jedna ionizující částice předá svou energii většímu počtu jader, lze pro pravděpodobnost, že dané buňce bude předána nějaká část energie, psát
37
(hdν ) k −hdν e Pk = . k! Při odvození tohoto vzorce byla uvažována určitá oblast kolem dráhy částice, ve které dochází k předávání energie. Veličina ν udává pravděpodobnost, že při průchodu částice uvažovanou oblastí bude zasaženo dané buněčné jádro (primární částicí nebo částicemi sekundárními), k je počet jednotlivých přenosů energie do daného buněčného jádra, d je aplikovaná dávka v daném místě a h je konstanta úměrnosti udávající nárůst počtu (vícenásobných) předání energie s dávkou; obecně jsou h i ν funkcemi λ. V jednotlivých případech pak částice ozařovacího svazku předávají buněčným jádrům energii (dávku) δ, která leží v intervalu (0, δmax), přičemž lze předpokládat, že příslušné pravděpodobnostní rozdělení bude vykazovat maximum uvnitř daného intervalu; v prvním přiblížení lze toto rozdělení parametrizovat např. funkcí
π 1 (δ ) = An sin ξ
δπ δ max
e −β δ
δ max
,
kde An je normovací koeficient stanovený tak, aby platilo
∫
δ max 0
π 1 (δ ) dδ = 1. Pro výsledné spektrum πk(δ)
energie předané při zásahu k částic platí
π k (δ ) = ∫
δ max 0
dω π 1 (ω ) π k −1 (δ − ω ) ,
∫
k δ max 0
dδ π k ( δ ) = 1 .
Dávka předaná jednotlivým buněčným jádrům (respektive příslušným chromozomálním systémům) vede ke vzniku dvojných zlomů molekuly DNA (double strand break, DSB), které se obecně pokládají za rozhodující poškození vedoucí k buněčné inaktivaci. Diploidní buňky jsou schopny jednotlivé DSB opravovat, inaktivačním poškozením je párové poškození homologických chromozomů. Inaktivační účinek bude záviset na počtu DSB v jednotlivých buňkách a jejich poměrně detailním rozložení po příslušném chromozomálním systému. V první aproximaci lze pro pravděpodobnost inaktivace buňky, jejímuž jádru byla celkem předána energie δ, psát
p (i ) (δ ) = 1 − exp(−Φ (m 2 )) , kde celkový počet DSB vzniklých v příslušném chromozomálním systému, označený m, je úměrný předané energii δ : m = γδ. Funkce Φ(m2) reprezentuje vlastní inaktivační mechanismus; je poměrně složitá podle průběhu tohoto mechanismu.
Pro křivku přežití, která udává podíl přežívajících buněk v závislosti na aplikované dávce d (tedy pro pravděpodobnost, že buňka nebude inaktivována), pak platí s (d ) = 1 −
∑
P k k
∫
k δ max 0
dδ π k (δ) p (i ) (δ ) .
Právě popsaný model lze aplikovat v podstatě obecně v celém intervalu hodnot lineárního přenosu energie λ. Existují však dva důležité extrémní případy, kdy lze tento obecný model významně zjednodušit. Jedná se o velmi malé anebo velmi vysoké hodnoty veličiny λ. V prvém případě bude parametr ν úměrný dávce d a bude stěží možno přesněji určit, jaký vliv má veličina λ na rozdělení předávané energie δ. Je proto třeba vycházet již z rozdělení předané energie δ, respektive přímo z rozdělení m počtu vzniklých DSB v jednotlivých chromozomálních systémech. Označíme-li rozdělení počtu DSB tvořených jednou částicí jako f1(m), bude pro distribuci počtu dvojných zlomů vytvořených k částicemi platit
f k (m) = ∑ j =0 f1 ( j ) f k −1 (m − j ) . m
Pravděpodobnost, že buňka nebude inaktivována (křivka přežití) je pak dána vztahem
38 s (d ) = 1 −
∑P
f k ( m) p ( i ) ( m) .
k
k ,m
Podrobněji byl tento případ (záření s nízkým lineárním přenosem energie) popsán v práci [6]. Druhý extrém (velké hodnoty λ) má pak za následek, že ν(λ)→1 a δ(λ)→δ0 (tj. energie předávaná buněčným jádrům je poměrně ostře vymezena). To zase způsobí, že se prakticky ztratí vliv rozdělení DSB po chromozomálním systému na výsledný účinek a inaktivační pravděpodobnost bude přímo úměrná δ0. Jako základní parametr modelu lze v tomto případě uvažovat hodnotu lineárního přenosu energie λ. Inaktivační pravděpodobnost p1(i) po zásahu jednotlivou částicí narůstá s energií předanou buněčnému jádru, která je úměrná hodnotě λ. Příslušná křivka přežití je pak určena odpovídajícími pravděpodobnostmi Pk zasažení buňky k částicemi a pravděpodobnostmi následné inaktivace pk(i):
s (d ) = 1 −
∑ P (λ ) k
p k(i ) (λ ) .
k
Logaritmus křivky přežití lze psát rovněž jako mocninnou řadu (viz [2])
σ (d ) =
∑α
k
dk ,
(1)
k
kde jednotlivé koeficienty jsou s inaktivačními pravděpodobnostmi spojeny vztahy
α 1 = hp1(i ) , α 2 = h 2 [(1 − p1(i ) ) 2 − (1 − p 2(i ) )] / 2 , α 3 = h 3 [−2(1 − p1(i ) ) 3 + 3(1 − p1(i ) )(1 − p 2(i ) ) − (1 − p 3(i ) )] / 6 , ... Je zřejmé, že pravděpodobnosti inaktivace narůstají s počtem částic, které zasáhly buňku. Pokud by tyto pravděpodobnosti narůstaly podle vzorce
p k +1 = 1 − (1 − p k )(1 − p1 ) , měla by křivka přežití (1) lineární
průběh. Experimentální data však vykazují přibližně parabolický charakter. Označíme-li jako ε malou odchylku od geometrického růstu inaktivačních pravděpodobností,
pk +1 = 1 − (1 − pk )(1 − p1 )(1 + ε ) , bude pro koeficienty v rozvoji (1) platit
α1 = hp1 , α 2 = − h 2 (1 − p1 ) 2 ε / 2 , α 3 = h 3 (1 − p1 ) 3 (ε − ε 2 ) / 6 , ... Příslušná křivka přežití bude tedy popsána polynomem se střídajícími se znaménky. Podrobnější popis tohoto modelu je obsažen v nedávných pracích [7-9]. Analýzu křivek přežití pomocí tohoto modelu ilustruje obrázek 9, nárůst inaktivační pravděpodobnosti p1(i) s hodnotou λ zachycuje obrázek 10. Výsledky analýzy experimentálních dat týkajících se relativní biologické účinnosti pro částice alfa v oblasti Braggova píku zobrazuje obrázek 11.
39
obrázek 9: Křivky přežití buněk T1g ozařovaných částicemi alfa. Experimentální data podle [10], [1]; křivky představují fit pomocí popsaného modelu. Hodnoty LET byly 25 keV/µm (křivka A), 61 keV/µm (B), 88 keV/µm (C), 110 keV/µm (D), resp. 165 keV/µm (křivka E).
obrázek 10: Nárůst inaktivační pravděpodobnosti p1(i) s hodnotou lineárního přenosu energie LET.
obrázek 11: Relativní biologická účinnost (RBE) v závislosti na lineárním přenosu energie (LET) aplikovaného záření pro různé podíly přežívajících buněk. Experimentální data podle [10], [1]; křivky představují fit pomocí popsaného modelu.
Obecný model, který jsme zde popsali, umožňuje zachytit významné charakteristiky jednotlivých fází radiobiologického mechanismu. Tento model umožňuje velmi přesně reprodukovat experimentálně měřené křivky přežití. Je pak možné odvodit hodnoty relativní biologické účinnosti daného záření, což je nezbytné pro optimalizaci ozařovacího postupu z hlediska výsledného biologického účinku na zdravou a nádorovou tkáň.
40
Využití hadronové terapie Hadronová radioterapie představuje ve světovém měřítku již osvědčenou metodu léčby nádorových onemocnění. Do současné doby bylo tímto způsobem léčeno cca 35000 pacientů, převážně ve fyzikálních centrech vybavených potřebnými urychlovači (Harvard Cyclotron Laboratory, Boston, USA; Paul Scherrer Institut, Villigen, Švýcarsko aj.). Na základě dosažených léčebných výsledků se začínají budovat speciální lékařská střediska vybavená příslušnými technickými prostředky. Od roku 1990 je v provozu centrum Loma Linda (USA), které pro ozařování využívá protonový synchrotron, v roce 1993 byl v japonské Chibě spuštěn specializovaný synchrotron pro radioterapii lehkými ionty. Do provozu jsou uváděna střediska v Bostonu (USA) a v Tsukubě (Japonsko), která budou využívat protony, a středisko Hyogo (Japonsko), kde budou k disposici i lehké ionty. Budováno je dalších cca 25 středisek po celém světě, viz [11]. Vybudovat síť několika těchto pracovišť je plánováno i v Evropě.
Na základě předběžných klinických výsledků, radiobiologických experimentů a epidemiologických studií se odhaduje, že využití hadronové terapie může přinést zvýšení úspěšnosti léčby nádorových onemocnění ze současných cca 45% až na 55% případů [11].
Přípravná činnost v ČR Interdisciplinární skupina „Využití ionizujících částic v lékařství a biologii“, která zahrnuje pracovníky z FzÚ a ÚJV AVČR, 1.LF UK a dalších institucí, se aktivně podílí na výzkumu v tomto oboru již od 70. let. Kromě hadronové terapie se skupina věnuje i neutronové záchytové terapii, která u nás již dospěla do stadia základních klinických testů. V oblasti hadronové terapie byla vypracována řada dílčích studií zabývajících se jednotlivými aspekty této metody. V letech 1996-2000 byl vypracován projekt specializovaného protonového synchrotronu PRAMES ve spolupráci FzÚ a ÚJF AVČR, JINR Dubna (Rusko), nadace Onkologie 2000 a MFF UK. V roce 2002 jsme se zapojili do evropské spolupráce ENLIGHT (European Network for Research in Light Ion Hadrontherapy), jejímž cílem je zhodnocení biologického účinku lehkých iontů, vymezení vhodných indikací, vypracování příslušných epidemiologických studií, vývoj optimálních ozařovacích postupů pro jednotlivé ionty i koordinace úsilí jednotlivých evropských pracovišť, která hodlají hadronovou terapii používat. V květnu 2002 byla rovněž dokončena základní studie „Onkologické centrum s hadronovou radioterapií“ [11], která obsahuje návrh na vybudování příslušného centra v ČR a která by měla sloužit především odborné veřejnosti a zodpovědným činitelům jako podklad pro rozhodování o definitivním projektu tohoto střediska. Tato studie uvádí hlavní přednosti ozařování pomocí svazků protonů a iontů, klinické indikace této metody, otázky spojené s její technickou realizací apod. Jako zdroj terapeutických svazků je uvažován jeden ze čtyř urychlovačů: komerční cyklotron belgické firmy IBA či synchrotron americké firmy Optivus, zmíněný synchrotron PRAMES nebo synchrotron PIMMS, navržený skupinou odborníků z Evropské laboratoře pro jaderný výzkum CERN. Tento synchrotron umožňuje jako jediný urychlovat kromě protonů i lehké ionty. Projekt PIMMS zahrnuje rovněž tzv. gantry systém (tj. systém, který umožní ozařovat pacienta z libovolného směru) dovolující používat metodu aktivního skenování nádorového ložiska jak pro protony, tak pro lehké ionty. Vzhledem ke svým vynikajícím parametrům, jež byly optimalizovány z hlediska léčebného využití, představuje synchrotron PIMMS pravděpodobně nejvhodnější variantu urychlovače pro navrhované onkologické centrum. Předpokládá se, že toto centrum bude vybaveno 5 ozařovacími místnostmi (z toho 2 gantry pro aktivní skening) a bude mít kapacitu 1000 až 1200 pacientů ročně. Odhad pořizovacích nákladů střediska činí za předpokladu použití synchrotronu PIMMS cca 2,1 mld. Kč, odhad ročních provozních nákladů činí 200 mil. Kč.
Literatura [1] G. G. Steel (Ed.), Basic Clinical Radiobiology, Arnold, London 1997.
41 [2] D. E. Groom et al., Passage of particles through matter, European Physical Journal C15, 1, 2000. [3] ICRU Report 49, Stopping Powers and Ranges for Protons and Alpha Particles, ICRU 1993. [4] E. Pedroni, Europhysics News 6, 31, 2000. [5] Optivus Technology, prezentace firmy, PowerPoint (cd) [6] M. Lokajíček: Biophysical mechanism of cell inactivation by ionizing particles; výzkumná zpráva IC/86/399, ICTP Terst, 1986. [7] L. Judas, M. Lokajíček: Cell inactivation by ionising particles and the shapes of survival curves; Journal of Theoretical Biology 208, 15-21, 2001. [8] M. Lokajíček et al.: Inactivation of individual cells by divers ions at different LET values; Physica Medica XVII, Supplement 1, 170-172, 2001. [9] L. Judas, P. Kundrát, M. Lokajíček: Bragg peak and relative biological efficiency of different ions; připravuje se k publikaci. [10] G. W. Barendsen, Responses of cultured cells, tumours and normal tissues to radiations of different linear energy transfer, Current Topics Rad. Res. Quart. 4, 293-356, 1968. [11] M. Lokajíček, P. Kundrát, J. Sedlák, K. Prokeš, H. Honová, L. Judas, B. Konopásek, P. Mareš, L. Petruželka, F. Spurný, J. Štursa, P. Řepa, J. Vaňásek, T. Čechák, Onkologické centrum s hadronovou radioterapií, zpráva Fyzikálního ústavu AVČR, Praha 2002.
42
Kvantová teleportace a kvantová kryptografie – nová vlna aplikací kvantové mechaniky na basi kvantového entanglementu Miroslav Bednář
Fyzikální ústav AV ČR Na Slovance 2, 182 21 Praha 8 Kontakt: +420 266 052 669 E-mail:
[email protected]
Motto k teorii:
„Jednu věc jsem během svého dlouhého života pochopil: že ve srovnání s realitou je veškerá naše věda primitivní a dětinská - a přesto je nejcennější věcí, kterou máme." A. Einstein Na místo úvodu k této přednášce uvedu text abstraktu k sérii přednášek, konaných na toto téma v roce 1999 v CERN:
1998-1999 ACADEMIC TRAINING PROGRAMME
LECTURE SERIES SPEAKER TITLE TIME PLACE
: : : :
N. GISIN & H. ZBINDEN, University of Geneva Testing the Foundations of Quantum Mechanics 12,13,14 & 15 January, from 11.00 to 12.00 hrs Auditorium/ CERN ABSTRACT
Quantum mechanics is certainly one of the most fascinating field of physics. In recent years, the new field of "quantum information processing" based on the most fundamental aspect of quantum mechanics, like linearity and entanglement, even increased the interest for quantum physics and its peculiarities. In this series of 4 lectures we shall present some of the issues and experiments that test quantum theory. Entanglement leads, on the one hand side, to the measurement problem, to the EPR paradox and to quantum nonlocality (entanglement between distant systems). We will derive the Bell inequality, present experimental results that provide huge evidence in favor of quantum nonlocality and discuss some loopholes that are still open. On the other side, entanglement offers many new possibilities for information processing. Indeed, it provides means to carry out tasks that are either impossible classically (like quantum cryptography and quantum teleportation) or that would require significantly more steps to perform on a classical computer (like searching a database, factorizing large integers). We will discuss some possibilities and limits of this new quantum technology.
43 Text tohoto abstraktu postihuje fakticky všechny hlavní aspekty mimořádného zájmu o tuto problematiku a to jak v oblasti základního výzkumu – fyzikální problémy současné kvantové mechaniky, tak i v oblasti experimentu, jehož úspěchy jsou předpokladem pro nové technologické aplikace mimořádného významu. Existuje dnes obrovské množství literatury – článků ve fyzikálních časopisech a knih věnovaných všem možným aspektům této problematiky . Orientovat se v tomto množství informací je dnes nesmírně obtížné a proto jedním z cílů této přednášky bude zmínit z literatury to nejpodstatnější, co bylo již publikováno, a to jak v češtině (Čs. čas. fyz., Vesmír), tak v angličtině a ruštině, aby každý, kdo se chce zamýšlet nad těmito problémy hlouběji, měl možnost nahlédnout do srozumitelné a dostupné literatury. Dominantní postavení v celé této literatuře mají především tři knihy: Jagdish Mehra: „The golden age of theoretical physics,“ vol. 1,2 World Scientific, Singapore, (2001) Gennard Auletta: „Foundations and Interpetations of Quantum Mechanics“ World Scientific, Singapore (2000), R.P. Feymman, R.B. Leighton, M. Sands: „Feymmanovy přednášky z fyziky s řešenými příklady, díl 3“ Vyd. Fragment, (2002) První kniha pojednává na 1400 stranách – nepochybně nejkvalifikovanějším možným způsobem - o historickém vývoji teoretických idejí rozvíjených v průběhu dvacátého století. V této knize je podán snad nejrozsáhlejší a nejsrozumitelnější rozbor EPR (Einstein-Podolsky-Rosen) paradoxu. Druhá z uvedených knih představuje nepochybně nejúplnější přehled všech možných filozofických a interpretačních otázek a problémů z kvantové mechaniky, jež se až dosud objevily v literatuře. Tato kniha představuje fakticky nejúplnější encyklopedii kvantové mechaniky, presentovanou na 950 stranách. Třetí z uvedených knih představuje na rozdíl od předchozích knih, excelentní úvod do fyziky spinů, spinových systémů, v jejichž rámci jsou kvantová teleportace a kryptografie prakticky realizovány. Tato kniha věnuje jen okrajovou pozornost filosofickým problémům, EPR paradoxu, apod., zato představuje základní zdroj informací o spinovém formalismu a fyzikálně nejzávažnějších otázkách, bez nichž nelze fyzikální problémy teleportace a kryptografie ani formulovat a ani fakticky chápat.
44 V příloze Lidových novin, věnované vědě, byl 27.7.(2002) publikován následující článek:
Tento článek, i když patří k těm nejlepším, jež byly v našich novinách a časopisech na dané téma publikovány, obsahuje řadu informací, buď nešťastně formulovaných, nebo zcela chybných. Aby bylo možné o těchto složitých problémech vědecky korektně hovořit, uvedeme několik informací o již zmíněných realizovaných experimentech. Prestižní vědecko populární časopis CERN COURIER přinesl ve svém březnovém čísle v roce 2000 následující informaci /1/:
Photon teleportation achieved Teleportation - the instantaneous transportation of an object (like Captain Kirk in Star Trek) across space - may seem to be solely the stuff of science fiction. However, at the quantum level, the dream has already become a reality. Experiments in Austria and Italy pioneered "teleported" information about photon polarization (not the photon itself) from a sender to a receiver using the trick of "entanglement" a deep quantum mechanical connection between particles that was first pointed out by Einstein, Podolsky and Rosen. For example, with two entangled photons (A and B). determining the polarization of one of them (say. 0°) automatically defines the polarisation of the other - the second photon
must "collapse" into the complementary state (90°). Therefore to teleport the information "45° polarization", a messenger photon of 45° polarization is made to entangle with photon A. thus obliging A then to be in the complementary polarization state. This in turn means that photon B now has the same polarization as the messenger photon, which is complementary to that of A. Then measuring the 45° polarization of B means "message received". Experimenting with entangled photons is quite difficult, however. Now UK researchers are proposing a much simpler technique of conveying information - by leleporting the quantum state of an atom trapped in a cavity to a second atom in a distant cavity,
45 Tento článek přináší informaci o fundamentálním experimentu, realizovaném v Insbrucku /2/, experimentu, prokazujícím existenci fenoménu teleportace v přírodě. Nezávisle na tomto experimentu byl téměř současně realizován analogický experiment v Římě /3/, potvrzující rovněž reálnou existenci fenoménu teleportace. Článek z CERN COURIER uvádím takto explicitně proto, poněvadž jsou v něm uvedena vědecky precizně formulována následující zásadní tvrzení jež jsou zcela pomíjena v novinových článcích o této problematice: 1) Experimenty v Rakousku a Itálii prokázaly praktickou možnost „Teleportovat“ informaci o fotonové polarizaci (nejedná se o teleportaci fotonu samotného). 2) Fenomén teleportace může existovat díky „entanglementu“ dvou-fotonových systémů, tj. fenoménu „provázanosti“ fyzikálních vlastností jednotlivých částic, provázanosti, na význam které v kvantové mechanice poprvé poukázali Einstein, Podolsky a Rosen – tzv. EPR effect. 3) Experimentování s entanglovanými fotony ( a týká se to každého jednotlivého fotonu –samotného rovněž) je nesmírně složité samo o sobě (viz dále). Kromě kvantové teleportace je intensivně studován ještě jiný fundamentální fenomén – „Quantum Cryptography“, založený rovněž na fyzikálních vlastnostech entanglovaných fotonových stavů. Aktuální pokrok v experimentech v „Quantum Cryptography“ je popsán v následujících dvou článcích /4/,/5/.
Cryptography goes far Physicists in the US have sent a quantum key - a secret code made of single photons -over a record distance through the Karth's atmosphere. Richard Hughes and co-work-ers at the Los Alamos National Laboratory transmitted the stream of polarized photons over a distance of 10 km during the day and also at night. The technique means that the security of satellite communications could eventually be safeguarded by quantum mechanics (2002 New Journal of Physics at press). Cryptography has long been used to com-municate confidential messages. Perfect se-crecy can be guaranteed by combining a binary message with a secret sequence of binary numbers, known as a key. However, encryption only works if the sender and receiver share the same key to scramble and unscramble the messages. Protecting the key from an cavesdropper is therefore crucial and can be achieved by exploiting the quan-tum properties of photons (Physics World May 1999 pp3l-35). Earlier this year, physicists at the Univer-sity of Geneva sent a quantum key along a 67 km length of optical fibre. Now Hughes and co-workers at Los Alamos have in-creased the distance for "free-space" quan-tum cryptography from 0. 5 km to 10 km.
In quantum cryptography, the sender transmits the key as a sequence of single photons that are linearly polarized. Photons that are polarized in either the horizontal direction or at +45° represent the binary value "0", while those polarized in the ver-tical direction or at -45° denote the value "I". In the Los Alamos experiment, the sender transmitted the photons from Pa-jarito Mountain near the lab to a receiver located some 10 km away. Following a bright timing pulse, the sender randomly picked one of four diode lasers to emit a photon with a particular polarization and made a note of this state. Using a telescope to collect the photons, the receiver randomly selected one of two analysers to measure the polarization state and reported this choice to the sender. One polarizer was able to distinguish between horizontal and vertical photons, while the other could tell the difference between the +45° and -45°states. Finally, the sender told the receiver which photons were measured correctly. These photons formed a secret key that was used to encrypt images sent via a wireless Ethernet link. The Los Alamos team has managed to extend the range of free-space quantum cryptography by synchronizing the photon signals with nanosecond precision and by keeping the transmitter and receiver aligned throughout the day in spite of heating.
46
News from Australia Australian Quantum Cryptography Moves out of the Laboratory Following the successful transfer of a quantum key in a laboratory environment last year, researchers at the. University of Canberra and University College (ADFA) have now succeeded in transmitting polarised singlephoton qubits over a 50 metre free space path at Mt Stromlo in Canberra. Project leader Professor Paul Edwards (UC) and Dr Peter Lynam (ADFA) recently demonstrated daylight qubit transmission at a rate of 100 bits per second with a bit error rate of less than 2%. They used a pulsed InGaN LED transmitter operating at a wavelength of 532 nm. The receiver was i n stalled at the Coude focus of the 750 mm satellite ranging tele-scope on Mt Stromlo constructed and operated by Electro Optic Systems for AUSLIG, the Australian Surveying and Land In-formation Group. Their latest results were presented at an international quantum electronics conference held in Nice and at the Adelaide meeting of the Australian Optical Society in December. With the assistance of EOS and AUSLIG, project team members are establishing a quantum key distribution (QKD) test range based at the AUSLIG observatory. With ARC support they plan to investigate the feasibility of global quantum key transfer using active optical earth satellites. Colleagues at Macquarie University and the University of Wollongong are providing support in quantum information theory and classical cryptographic techniques. The team also plans to develop single-photon sources based on correlated light-emitting quantum dot arrays in collaboration with colleagues at Stanford University, DERA (Malvern, UK) and Sheffield University. For further information: http://beth.canberra.edu.au/atrc/atrc.htm or email:
[email protected] [Paul Edwards]
47 Uvedené články přinášejí korektní vědecké informace o experimentálních výsledcích, získaných při studiu kvantové teleportace a kryptografie a uvádějí na pravou míru informace, publikované u nás ve sdělovacích prostředcích např. rovněž v /6/. V českých vědeckých a vědeckopopulárních časopisech byla věnována již značná pozornost problematice kvantové teleportace a kryptografie. Bude nepochybně užitečné připomenout články jež jsou běžně dostupné, a jež umožní získat hlubší pohled na mnohé spletité fyzikální problémy. Jedná se především o mimořádný seriál pěti článků, nazvaných „Kvantové hlavolamy“ I, II, III, IV, V, jež jsou publikovány v časopisu Vesmír /7/. Dále jsou to články M. Duška /8/ o kvant. teleportaci a kryptograpii. Dále pak překlad článku a interview A. Zeilingera /9/. Obsáhlé informace o kvantové teleportaci jsou obsaženy v článcích /10/. Řada užitečných informací je obsažena rovněž v následujících překladech /11/. V literatuře existuje dnes obrovské množství časopiseckých článků a knih – monografií, jež jsou věnovány detailním rozborům nejrůznějších aspektů fundamentárních kvantových systémů a pojmů s nimiž kvantová teleportace a kvantová kryptografie pracuje. Patří k nim především: 1) Einstein – Podolsky – Rosen paradox, existence a teoreticky popis entanglovaných stavů v kvantové mechanice; 2) Problém existence Bellových stavů, reprezentujících specifický typ entanglementu kvantových konstituentů, a mimořádná role právě těchto stavů při realizaci praktických cílů v teleportaci a v kryptografii; 3) Problematika reálného generování a reálné detekce Bellových entanglovaných stavů, bez nichž by nebylo možné prakticky realizovat cíle jak fyzikálního procesu teleportace, tak kryptografie; 4) Je nutné řešit mnohé dosud otevřené problémy, jež souvisí s efektivními praktickými manipulacemi s jednotlivými reálnými fotony, ale rovněž elektrony a jinými objekty – atomy, ionty apod., jejichž pomocí lze vytvářet entanglované kvantové systémy, s nimiž lze cíle teleportace a kryptografie prakticky realizovat. S kvantovou mechanikou, jež představuje hlavní instrument pro realizaci zmíněných cílů, souvisí ovšem dodnes řada principiálních otevřených problémů, jež jsou i nadále, po téměř sto letech existence kvantové mechaniky, intenzivně diskutovány, ve snaze nalézt optimální řešení těchto otevřených problémů, souvisejících především s interpretací závěrů kvantové mechaniky. Bylo by proto užitečné opřít se v teoretických úvahách a v otázkách interpretace závěrů kvantové mechaniky o stanovisko, jež lze dnes považovat za optimální jak z hlediska teorie tak experimentu. Ujasnění si všech aspektů takového stanoviska umožní potom snáze převádět teoretické ideje do stadia praktických aplikací. To optimální stanovisko ke kvantové mechanice je dnes nejúplněji zformulováno v již zmíněné v 1000 stránkové knize G. Auletta: “ Foundations and Interpretation of Quantum Mechanics“/12/. V recenzi na tuto knihu píše autor této recenze: Gennaro Auletta believes that the historical context should form a vital part of our understanding of the foundations of quantum physics, and this approach is embedded in this book, which reviews the whole subject from its
inception until the end of the twentieth century. Historický kontext souvislostí, za nichž kvantová mechanika vznikala a byla rozvíjena, je mimo jakoukoliv pochybnost naprosto nejlépe, podle mého přesvědčení, popsán ve fascinující dvoudílné knize, jejímž
48 autorem je velký znalec moderní fyziky Jagdish Mehra. Dva díly jeho knihy /14/ mají název: „The golden age of theoretical physics“. V obou těchto dílech jsou shrnuty ty nejzávažnější fyzikální výsledky, jež byly získány ve fyzice v průběhu dvacátého století a jež tvoří základ všech dnešních moderních technologií ve všech oborech lidské činnosti. Soupis jednotlivých kapitol dává možnost nalézt v jeho knize vše podstatné, co bylo a je známo o spinu částic, o Einstein-Podolsky-Rosen paradoxu, o entanglovaných stavech apod. Nahlédnutím do Mehrových knih získá čtenář ty nejpodstatnější racionálně popsané informace o fundamentálních fyzikálních veličinách, s nimiž se běžně setkáváme v kvantovém fyzikálním popisu a jež nemají ve většině případů ani klasický analog. Názvy kapitol Mehrových knih jsou patrné z následujícího:
49
Contents Volume 1 Foreword· A Personal Introduction 1. 2. 3. 4. 5. 6.
xiii
Albert Einstein's 'First' Paper Max Planck and the Law of Blackbody Radiation Planck's Half-Quanta: A History of the Concept of Zero-Point Energy Josiah Willard Gibbs and the Foundations of Statistical Mechanics Einstein and the Foundation of Statistical Mechanics Albert Einstein and Marian von Smoluchowski: Early History of the Theory of Fluctuation Phenomena
7. The Historical Origins of the Special Theory of Relativity 8. The Historical Origins of the General Theory of Relativity 9. 10. 11. 12. 13. 14. 15. 16. 17. 18.
Albert Einstein and the Origin of Light-Quantum Theory Niels Bohr and the Quantum Theory of the Atom Arnold Sommerfeld and Atoms as Conditionally Periodic Systems The Göttingen Tradition of Mathematics and Physics from Gauss to Hubert and Born and Franck The Bohr Festival in Göttingen: Bohr's Wolfskehl Lectures and the Theory of the Periodic System of Elements Satyendra Nath Bose, Bose-Einstein Statistics, and the Quantum Theory of an Ideal Gas Louis de Broglie and the Phase Waves Associated with Matter Wolfgang Pauli and the Discovery of the Exclusion Principle The Discovery of Electron Spin The Discovery of the Fermi-Dirac Statistics
1 19 56 94 123 153
210 229 326 351 372 404 459 501 546 571 585 612
Volume 2 19. Werner Heisenberg and the Birth of Quantum Mechanics 20. 'The Golden Age of Theoretical Physics': P.A.M. Dirac's Scientific Work from 1924 to 1933 21. Erwin Schrödinger and the Rise of Wave Mechanics. I. Schrödinger's Scientific Work Before the Creation of Wave Mechanics
639 668 706
22. Erwin Schrödinger and the Rise of Wave Mechanics. II. The Creation of Wave Mechanics 761 23. Erwin Schrödinger and the Rise of Wave Mechanics. III. Early Response and Applications 803 24. Niels Bohr's Discussions with Albert Einstein, Werner Heisenberg, and Erwin Schrödinger: The Origins of the Principles of Uncertainty and Complementarity 872 25. Eugene Paul Wigner: Aspects of His Life, Work, and Personality 912 26. Lev Davidovich Landau: Some Aspects of His Life and Personality 951 27. The Origin of Quantum Field Theory 959 28. The Solvay Conferences of 1927 and 1930 and the Consistency Debate 991 29. Relativistic Electrons and Quantum Fields 1030 30. New Elementary Particles in Nuclear and Cosmic-Ray Physics 1092 31. Between Hope and Despair: Quantum Electrodynamics in the 1930s 1155 32. Universal Nuclear Forces and Yukawa's New Intermediate Mass Particle (1933-1937) 1188 33. New Fields Describing Elementary Particles, Their Properties and Interactions 1204 34. Energy Generation in Stars and the Origins of Nuclear Fission 1260 35. The Einstein-Bohr Debate on the Completion of Quantum Mechanics and Its Description of Reality (1931-1936) 1274 36. The Quantum Principle: Its Interpretation and Epistemology 1319 37. The Dream of Leonardo da Vinci 1387
50 Bylo již nejednou zmíněno, že fyzikální podstata jevů, nazývaných dnes „kvantová teleportace“ a „kvantová kryptografie“ souvisí s kvantovým popisem souborů mikročástic (fotonů, elektronů, atomů, apod.), které se nacházejí v dynamicky „ kvantově korelovaných“ stavech, jež jsou nazývány „entanglovanými“ (resp. provázanými, zapletenými) stavy systému částic. Obsah fyzikálních informací o daném systému částic, obsažených v těchto „entanglovaných“ stavech, souvisí s tzv.EPR – paradoxem, jehož původní formulace a myšlenkový obsah je precizně popsán v kapitole 35 Mehrovy knihy /14/. EPR Paradox zformulovali Einstein-Podolsky-Rosen ve svém slavném článku, nazvaném: „Can Quantum-Mechanical Description of Physical Reality be Considered Complete?“, ve kterém hluboce proanalyzovali důsledky faktu, že klasické dynamické veličiny musí být v kvantové mechanice representovány operátory, pro něž ovšem neplatí, že všechny navzájem kumutují. Důsledkem nekomutativity konkrétních operátorů, reprezentujících dynamické veličiny, je, že nemohou být současně exaktně měřitelné, poněvadž nejsou současně diagonalizovatelné. Absence možnosti měřit všechny dynamické veličiny současně exaktně vedla autory Einsteina, Podolského a Rosena k přesvědčení, že kvantová mechanika, popisující dynamické veličiny pomocí nekomutujících operátorů, je
fakticky neúplnou fyzikální teorií. My zde budeme ovšem
diskutovat reformulaci tohoto problému pro systémy spinů, předloženou v roce 1952 Davidem Bohmem a popsanou jím v § 15-19 kapitoly 22 jeho kvantové mechaniky /15/. Tato Bohmova reformulace je od té doby považována za klasickou formulaci EPR-paradoxu pro kvantové systémy interagujících spinů. Ačkoliv kvantová teleportace a kvantová kryptografie – reálné fyzikální fenomény byly prakticky realizovány s fotonovými systémy, připomeneme Bohmovu reformulaci EPR problému na příkladu systému částic se spiny 1/2. Nejjednodušším takovým systémem je přirozeně dvou-částicový systém, sestávající ze dvou částic se spiny ½ (např. elektrony, atomy se spiny ½ apod.). Předpokládejme, že máme molekulu se spinem 0 složenou ze dvou atomů se spiny ½. Předpokládejme, že tato molekula je v čase nestabilní a rozpadne se na jednotlivé atomy, jež v klidové soustavě molekuly letí v opačných směrech, s nulovým orbitálním momentem vůči poloze původní molekuly. Rotační invariance „skalární“ molekuly vede k zákonu zachování totálního spinu v procesu.rozpadu, což znamená, že spiny obou atomů musí být v každém okamžiku orientovány v opačných směrech. Pokud by spiny jednotlivých atomů byly
r
r
r
popisovány klasickými vektory s 1, s 2 a totální spin systému S byl dán jejich součtem,
r r r S = s 1+s 2 r
díky zákonu zachování totálního spinu by muselo platit S = 0, což je spin molekuly. Díky konečnému dosahu sil (v prostoru) mezi jednotlivými atomy, letícími v opačných směrech, přestanou tyto síly mezi nimi fakticky působit, přesto však korelace jejich spinů – díky zákonu zachování totálního spinu systému nadále trvá.
r
Zjistíme-li tedy, po dlouhém čase, že spin jednoho atomu je popsán vektorem s 1, víme spolehlivě, že
r
r
r
spin druhého atomu s 2 je dán: s 2 = - s 1. Jinými slovy: spiny obou atomů, vzniklých rozpadem molekuly, jsou striktně korelovány.
r
r
V kvantové mechanice je spin ½ atomu 1 popisován vektorovým Pauliho operátorem s = { s 1k, k = 1,2,3}, jehož komponenty sˆ 1k splňují komutační relace [ sˆ 1i, sˆ 1j]= iεijk sˆ 1k.
51
Díky těmto komutačním relacím nelze, na rozdíl od klasické mechaniky v kvant. mechanice změřit u jednoho atomu současně všechny tři nezávislé komponenty jeho spinu, ale pouze jednu z nich, např. třetí. Obdobně, jako v klas. mech., musí platit i v kvantové mechanice, že totální spin systému spinů je nulový, tj.,na operátorové úrovni platí
r r r S = s 1 + s 2 =0, a tudíž měří-li se reálně třetí komponenty obou spinů, musí pro změřené hodnoty platit: s13 + s23 = 0 Z kvantové mechaniky plyne, že současně měřitelnými spinovými veličinami u takového dvou-atomového systému mohou být např:
r S 2, Sz = s1z + s2z; r nebo : S 2, Sy = s1y + s2y; r nebo : S 2, Sx = s1x + s2x. r
Vlastní hodnoty operátoru S 2 jsou pro dvou-atomový systém dány:
r S 2 = S(S + 1) S= 1,0. Případ stavu s nulovým totálním spinem, S = 0, je kvantovým analogonem klasického systému, v němž by byl klasický totální spin nulový. Kvantový stav s totálním spinem S = 0 je nazýván singletním spinovým stavem systému, a je popsán vlnovou funkcí:
ΨS=0 =
1 2
(u1 (1/2) u2(-1/2) - u1(-1/2) u2 (1/2), kde
ui(± ½), (i = 1,2) jsou spinové funkce, jednotlivých atomů, a tvoří tak basické vektory v Hilbertových prostorech popisujících spinové stavy jednotlivých částic (i = 1,2) s projekcemi spinu (± ½) do téhož směru, jenž může být libovolný reálném troj.-dim. prostoru. A právě tato triviální singletní spinová funkce ΨS=0 sehrála naprosto klíčovou roli při diskusi všech aspektů EPR paradoxu pro dvou-částicové spinové systémy dvou kvantových spinů ½. Funkce ΨS=0 popisuje nejjednodušší možný případ entanglementu, tj., silné dynamické korelace spinů ½ obou nezávislých konstituentů systému. Reálným faktem tedy je, že je-li u dvou-částicového systému, jenž je popsán vlnovou funkcí ΨS=0, zjištěno, že nachází-li se částice 1 ve stavu s projekcí spinu + ½ (na jakkoliv vybranou osu v prostoru), druhá částice (korelována dynamicky s první) se musí nutně nacházet ve stavu s projekcí spinu – ½ na tutéž osu v prostoru, přičemž tento fakt je názornou ilustrací vysoce netriviálního praktického přenosu informace v daném případě, informace o spinovém stavu částice, vzdálené od první částice, s níž je druhá dynamicky korelována, na jakkoliv velkou vzdálenost.
52 A právě tohoto druhu korelace, realizované ne v dvou-částicových, ale v troj-částicových systémech, umožňují prakticky realizovat kvantovou teleportaci a kvantovou kryptografii.
r
Bylo zmíněno, že v kvantové mechanice jsou spiny částic 1,2 popsány vektorovými operátory s
1
=
r {s1i, i = 1,2,3} a s 2 = {s2j, j= 1,2,3}. Pomocí těchto šesti operátorů s1i, s2j, (i,j = 1,2,3) lze zkonstruovat bilineárních 9 kombinací, daných součiny Τij = s1i s2j (i, j = 1,2,3) Když není možné měřit současně všechny s1i a s2i (i = 1,2,3), vzniká otázka, kolik existuje operátorů Τij, jež navzájem komutují a jsou současně diagonalizovatelné, jež tedy lze současně měřit. Odpověď je jednoznačná: Existují 3 operátory Τij, jež navzájem komutují. Vybírat je lze různě, a jednou z možností je následující: trojici komutujících operátorů tvoří: Τ11, Τ22, Τ33. A právě tato trojice má výjimečné postavení, poněvadž platí:
1 r 2 1 r2 r2 S - ( s1 + s 2 ) 2 2 i =1 r r r r r kde S = s 1+ s 2 je totální spin s 1 s 2 = (s11s21+ s12s22)+ s13s23 =Bo + s13s23, 3
ΣΤ
ii
r r
= s 1s 2=
kde Bo je speciální tvar tzv. Bellova operátoru, jehož pomocí Bell analyzoval vlastnosti korelací spinů r r v uvažovaném dvou spinovém systému. Poněvadž vektory s 1, s 2 spinů ½ jsou popsány 2-dimensionálními Pauliho maticemi
r r
σ , s a=
1 r σ a (a = 1,2 je index částic), pro něž platí : 2
σa1σa2 = i σa3 (σai)2 = 1,( i = 1,2,3, i - je index prostorových komponent )je evidentní, že platí Τ11 . Τ22 = ½ Τ33, a tudíž pouze dva operátory z trojice Τii jsou lineární nezávislé. Množinu vlastních funkcí všech tří operátorů Τii. (i = 1,2,3) tvoří v dvou-spinovém systému následující čtveřice funkcí: |ψ-- >12 = |ψ+ >12 = |Φ+ >12 = |Φ- >12 =
1 2 1 2 1 2 1 2
(|1/2>1|-1/2>2 - |-1/2>1|1/2>2) (|1/2>1|-1/2>2 + |-1/2>1|1/2>2) (|1/2>1|1/2>2 + |-1/2>1|-1/2>2) (|1/2>1|1/2>2-|1/2>1|-1/2>2),
běžně takto označována v literatuře čtveřice, jež je nazývána Bellovými stavy. A právě tato čtveřice stavů popisujících specifické korelace spinových projekcí jednotlivých konstituentů představuje fundament všech článků a úvah o kvant. teleportaci a kryptografii. Kvantová teleportace, fyzikální efekt přenosu informace o spinovém stavu částice, je realizována v systému tří částic se spiny ½, a je bezprostředním důsledkem matematické relace, identity, již lze zapsat následovně |ψ>1|ψ->23 = |Ψ- >12 + |Ψ+ >12
1 (α|1/2 >3+β|−1/2>3) 2
1 (-α|1/2 >3+β|−1/2>3) 2
53
1 (-β|1/2 >3+α|−1/2>3) 2 1 +|Φ->12 (β|1/2 >3+α|−1/2>3) 2
+ |Φ+ >12
kde |Ψ>1= α|1/2>1 +β|−1/2>1 je obecný spinový stav částice 1, daný superpozicí stavů s projekcemi ± ½ na vybranou osu v prostoru |ψ- >23 =
1 2
(|1/2>2|-1/2>3 - |-1/2>2|1/2>3)
je Bellův stav |Ψ- >23 na systému částic 2,3. A právě nyní bylo popsáno dostatečné množství informací proto, aby bylo možné uvést principiální schéma, umožňující prakticky realizovat teleportaci informace o spinovém stavu částice. Mějme částici 1, popsanou vlnovou funkcí |ψ >1. Mějme zdroj EPR páru částic 2,3, jež se nacházejí ve stavu, popsaném Bellovou funkcí |Ψ- >23. V místě, nazvaném ALICE, kde se nacházejí částice1,2 je provedeno měření
(Bell measurement), jehož cílem je zjistit, ve kterém ze čtyř možných Bellových stavů se nachází systém částic 12. Tato informace je důležitá tím, že výsledek tohoto měření umožňuje pomocí matematické identity pro |ψ >1|Ψ- >23 – stanovit spinový stav částice 3. Konkrétně: je-li systém částic 12 v Bellově stavu |Ψ ->12, je spinový stav částice 3 popsán funkcí: (α|1/2>3 + β|-1/2>3) ≡|ψ >3, tj. téhož typu funkcí jako částice 1. Zcela analogicky, je-li systém 12 ve stavu |Ψ+ >12, je spinový stav částice 3 popsán funkcí (-α|1/2>3 + β|-1/2>3), atd. Důležitým faktem, jenž se týká výjimečně částic se spinem ½, je, že všechny možné stavy částice 3, jež se objevují na pravé straně dříve zmíněné identity, lze získat prostorovou rotací stavu |ψ>3. Zjistí-li tedy ALICE, ve kterém z možných Bellových stavů |Ψ±>12, |Φ±>12 se nachází systém 12, a sdělí-li výsledek svého měření Bobovi klasickým „telefonem“, tak Bob okamžitě ví, v jakém spinovém stavu se nachází částice 3, kterou on detekuje. Dochází tak k teleportaci – přenosu informace o spinovém stavu částice, aniž by se původní částice 1 objevila v Bobově detektoru. Reálné experimenty s teleportací v Insbrucku a v Římě byly ovšem realizovány nikoliv s částicemi se spinem ½, ale s fotony, jejichž vlastností je, že mohou existovat pouze ve dvou možných stavech, charakterizovaných dvěma možnými hodnotami jejich spinové polarizace.
54
FIGURE IX-5. An electromagnetic wave of blue light travelling in the direction shown by the wave vector. The waves of electric and magnetic fields are coupled to each other. The mutually perpendicular directions of the vectors E, B, and k are shown in the lower right hand corner.
r
Je známo, že polarizace fotonů, spojených s elektromagnetickou vlnou, je určena vektorem E této
r
vlny. Leží-li vektor E v horizontální rovině, mají odpovídající fotony polarizací H a odpovídající spinové stavy
r
jsou značeny |Η>. Leží-li E ve vertikální rovině mají fotony polarizaci V a spinové stavy jsou značeny|V>. Pro dvou-fotonové stavy lze definovat rovněž Bellovy stavy |ψ±>,|Φ±>. Z dřívějších formulí je lze získat záměnou: |+1/2 >→ |Η>, |-1/2 >→ |V>. Všechno, co bylo v předchozím textu uvedeno o teleportací spinových stavů částice 1/2 , platí analogicky, po provedení uvedené záměny, rovněž pro teleportaci spinových stavů fotonů. Idea teleportace informace o spinovém stavu částic (fotonů, elektronů, atomů,…) je nepochybně jasná. Spousta nesmírně složitých praktických otázek souvisí s tím, jak spolehlivě a efektivně generovat a detekovat Bellovy stavy v dvou-částicových, eventuálně, více částicových stavech. Dvou-fotonové stavy lze získávat např. v rozpadech positronia, πo mesonu, řady dalších částic, viz /13/. Prakticky nejjednodušší metodou je však entangled-photon microscopy /17/. Velice netriviální problémy souvisí rovněž s experimentální detekcí entanglovaných stavů. Nejkvalifikovaněji je současný stav těchto problémů popsán v přehledných článcích /18/, /19/, /20/, /21/. Nyní, když byl popsán fyzikální princip, v jehož rámci je realizován fenomén teleportace, zbývá se zmínit již jen krátce o fenoménu, nazývaném kvantová kryptografie, jehož realizace v poslední době je opět spojena s existencí entanglovaných stavů. Historie kryptografie v minulosti a současný stav kvantové kryptografie, je nepochybně nejkvalifikovaněji popsán v obsáhlém článku /18/. Existuje celá řada praktických realizací kryptografických projektů. V této přednášce se zmíníme explicitně především o těch, jež jsou realizovány pomocí entaglovaných stavů EPR- párů polarizovaných fotonů:
55
FIG. 3. Einstein-Podolsky-Rosen (EPR) protocol, with the source and & Poincaré representation of the four possible stales measured independently by Alice and Bob.
FIG. 4. Illustration of protocols exploiting EPR quantum systems. To implement the BB84 quantum cryptographic protocol. Alice and Bob use the ume bases to prepare and measure their particles.A representation of their Miles on the Poincaré sphere a shown. A similar setup. but with Bob's bases routed by 45°, can be used to test the violation of Bell's inequality. Finally, in the Ekert protocol. Alice and Bob may use the vio-lation of Bell's inequality to test for eavesdropping.
FIG. 21. Typical system for quantum cryptography exploiting photon pairs entangled in polarization: PR, active polarization rotator; PBS, polarizing beamsplitter; APD, avalanche photo-diode.
Kromě těchto případů, využívajících spinové korelace fotonových párů, existuje řada dalších versí kvantových kryptografů, využívajících korelací v energii a času pro entanglované páry:
FIG. 24. Quantum cryptography system exploiting photons entangled in energy-time and active basis choice. Note the simi-larity to the faint-laser double Mach-Zehnder implementation depicted in Fig. 16.
Existují kryptografy, využívající korelace fáze a času pro jednotlivé fotony z entanglovaného páru. Podrobné informace lze najít v citované práci /18/. Nesmírně užitečným zdrojem informací o dosažených výsledcích v kvantové kryptografii, je maximálně přehledný článek: W.Tittel, G.Weihs: „Photonic entanglement for fundamental tests and quantum ,communication“, publikovaný v nedávno nově vzniklém časopisu: Quantum Information and Communication, vol. 1, No 2 (2001), p 3-56. Tento článek je mimořádně významný tím, že obsahuje především úplný soubor informací o již realizovaných experimentech, jejichž cílem bylo původně studovat Bellovy spinové korelace v dynamicky vázaných dvou – a více – částicových stavech, jež jsou nazývány entanglovanými stavy těchto systémů mikročástic. Idea těchto experimentů – viz obr.
56
Coincidence Fig. 13. General set-up for Bell experiment. A source emits correlated particles, each of which can be described in a two-dimensional Hubert space. The qubits then fly back to back towards two qubit analyzers making projection measurements in bases defined by parameters a and b, respectively. The outcomes of the measurements are correlated, enabling to test via Bell inequalities whether the twoparticle system can be described by a local or by a non-local theory. Note that it is sufficient to project on two different bases with eigenvalues located on a one-dimensional sub-space within the shell of the respective qubit-spheres, in contrast to quantum tomography (Section 2.2.3).
a přehled realizovaných experimentů – viz obr. History The following table is a necessarily incomplete account of events in the history of tests of Bell inequalities. More experiments can be found in Refs. [74, 30, 31, 75, 39, 76, 40, 77, 78, 79, 80]. 1972 Freedman and Clauser perform the Erst experimental test based on polarization entangled photons generated via cascaded atomic transitions, demonstrating that indeed a Bell inequality is violated for an entangled system and thus ruling out a local realistic description [6]. 1982 Aspect et al. measure polarization correlations with two-channel analyzers [81]. Later they carry out an experiment in which they vary the analyzers during the flight of the particles under test [82]. 1986 Alley and Shih first report non-locality experiments using parametric down-conversion sources to create polarization entanglement [83]. In 1988 Ou and Mandel [34] and Shih and Alley [84] present stronger violations of Bell's inequality with this technique. 1990 Rarity and Tapster observe the violation of a Bell inequality using momentum entanglement [85]. 1992 Brendel et al.[48] and a bit later Kwiat et al. [49] realize Franson's idea of a test based on energy-time entanglement [47]. Although the source itself does not produce entangled qubits directly (see Section 2.2.2), the use of qubit-analyzers post-projects on such states. 1997 Tittel et al. show that the quantum correlations between energy-time entangled photons are preserved even over distances of more than 10 km [86, 87]. 1998 Weihs et al. close the spacelike separation (Einstein locality) loophole using randomly switched analyzers. This experiment was based on polarization entanglement [88]. 2001 Rowe et al. perform the first test violating a strong Bell inequality. Ιn contrast to all other tests that where based on photons, this experiment took advantage of entangled ions [89].
jsou popsány ve zmíněné práci autorů: W.Tittel, G.Weihs. Soubor těchto experimentů v jistém smyslu vyvrcholil experimentem, realizovaným v Ženevě, viz obr.
57
Fig. 14. Experimental arrangement for a test of Bell's inequality with measurements made more than 10 km apart. Source (in Geneva) and observer stations (interferometers in Bellevue and Bernex, respectively) were connected by a fiber optic telecommunications network.
Tento experiment byl popsán rovněž v článku, publikovaném nedávno rovněž v Čs. čas. fyz 49, No 4 (1999) p 217. Problematika kvantové kryptografie, odvíjející se od schématu, popsaného obrázkem
fig. 23. For each photon she sends to Bob, Alice chooses randomly a bit value (row 1) and a basic (h/v, or ±45°), and prepares the ρhoton in the corresponding state. Every time Bob expects photon to arrive, be activates his detectors and chooses randomly to analyze in the h/v basis, or in the ±45° basis. He records which basis he used (row 2) and, in case of a successful detection, which result (in tcrms of bits) he got (rov 3). After exchange of sufficient large number of photons, he publicly announces the cases where be detected a photon and the basis used for the measurements. However, he does not reveal which results he got. Alice compares event by event whether or not Bob's analyser was compatible to her choice of bases. Ιf they are incompatible or if Bob failed to detect the photon, the bit is discarded. For the remaining bits (row 4), Atice and Bob know for sure that they have t he same value. These bits form the so-called sifted key. The security of the key distribution is, roughly speaking, based on the fact that a measurement of an unknown quantum system will, in most cases, disturb the sysem: If Alice's and Dob's sifted keys are perfectly correlated, no Cavesdropper tried to cavesdrop the transmission and the key can be used for encoding a confidential messsage using the one-time pad. If the sifted keys are not 100% correlated, then, depending on the QBER, A Lee and Bob can either distill a secret key via error correction and privacy amplification, or the key is discarded and a new distribution has to be started.
58 uvedeným rovněž v práci autorů: W.Tittel, G.Weihs, je v této práci doplněna přehledem experimentů, studujících entanglement v polarizovaných systémech mikročástic, v systémech, jež jsou prakticky používány v kvantové kryptografii. Přehled těchto fundamentálních experimentů je patrný z obr.
1982
Interestingly enough, the first experiment that fulfills the above definition is the test of Bell inequalities using time-varying analyzers, performed by Aspect et al. [82] with polarization entangled qubits in order to close the locality loophole (see also Section 3.1.1) — at a time where quantum cryptography was not yet known, not even the single photon based version.
1998
Weihs et al. demonstrate a violation of Bell inequalities with polarization entangled qubits at 700 nm wavelength and randomly switched analyzers, separated by 360 km of optical fiber [88]. This experiment has been devised to close the locality loophole. 1999 Tittel et al. perform a Bell experiment, again to be seen in the context of the locality loophole, incorporating a passive choice of bases [98J. Two fiberoptical interferometers are attached to each side of a source creating energytime entangled photons at 1.3 µm wavelength. However, similar to both beforementioned experiments, the bases chosen for the measurements are chosen in order to allow a test of Bell inequalities and not to establish a secret key. 2000 Three publications on entanglement based cryptography appear in the same issue of Phys. Rev. Lett.; 1.) Using a set-up similar to the one mentioned already in the second entry of this table, Jennewein et al. realize a quantum cryptography system including error correction over a distance of 360 m [127]. Two different protocols are implemented, one based on Wigner's inequality (a special form of Bell inequality), the other one following BB84. Sifted key rates of around 400 and 800 bits/s, respectively, are obtained, and QBERs of around 3% observed. Using the same assumptions that lead to Fig. 24, this amounts to a secret key rate of 300 and 600 bits/s, respectively. 2.) Naik et al. demonstrate the Ekert protocol, in a free space experiment over a short (laboratory) distance [128]. The experiment takes advantage of polarization entangled qubits at a wavelength of around 800 nm. Sifted key rates of around 10 bits/s paired with a QBER of 3% are reported, leading to a secret key rate of 6 bits/s after implementation of error correction and privacy amplification. In addition to the key exchange, the authors simulate different eavesdropping strategies and find an increase of the QBER with increasing information of the cavesdrop-per, according to theory. The experiment has recently been extended [129] to realize the so-called six state protocol [130, .131]. 3.) .Tittel et al. [90] report on a fiber-optical realization of quantum cryptography in a laboratory experiment using the BB84 protocol. This experiment is based on time-bin entangled qubits at telecommunication wavelength of 1.3 µm and takes advantage of phase-time coding and a passive choice of bases. Sifted key rates of 33 Hz and a QBER of 4% are obtained, leading to a calculated secret key rate of 21 bits/s. 2001 Ribordy et al. [132] realize a QC system based on energy-time entanglement. In contrast to the schemes mentioned before, this realization takes advantage of an asymmetric set-up, optimized for QC, instead of a set-up designed for tests of Bell inequalities where the source is generally located roughly in the middle between Alice and Bob. Here, one photon (at 810 nm wavelength) is send to a bulk-optical interferometer, located directly next to the source, the other one (at 1550 nm wavelength) is transmitted through 8.5 km of fiber on a spool to a fiber optical interferometer. Implementing the BB84 protocol and a passive choice of bases, a sifted key rate of 134 bits/s and a mean QBER of 8.6% (over 1 hour) is observed. From these values, one can calculate a secret key rate of 45 bits/s.
59 Nakonec autoři W.Tittel, G.Weihs uvádějí rovněž přehled fundamentálních experimentů, v nichž byla realizována kvantová teleportace, viz obr. 1997
Bouwmeester et αl. [136] are the first to demonstrate quantum telepor- . tation based on a Bell measurement using linear optics. Although this allows in principle to teleport in 50% of all cases, only the projection onto the Ψ - state is used in the experiment. The result of the measurement is shown in Fig. 29. 1998 Bοschi el al. [137] demonstrate a teleportation set-up in which all four Bell states can be identified — even using only linear optics. The entangled state is realized using k-vector (mode) entanglement, and the polarization degree of freedom of one of the entangled photons is employed to prepare the unknown state. However, this scheme can not be implemented for photons that come from independent sources as required for instance for entanglement swapping (see Section 4.4).
2001
Kim et al. [55] demonstrated quantum teleportation based on a Bell measurement implementing non-linear interaction. This enables a projection onto all four Bell states, however, with very small efficiency of around one out of 1010. In order to compensate for the efficiency, the input state (send by Charlie) is a classical pulse from a fs laser. Nevertheless, this experiment shows that a complete Bell measurement is in principle possible, even when using single-photons and without having to take advantage of additional degrees of freedom of the entangled pair.
Experiment, realizovaný v roce 2001, je popsán v práci: Yon-Ho Kim,Sergei P. Kulik, Y.Shin: „Quantum teleportation of a Polarization State with a Complete Bell State Measurement“ Phys. Rev. Lett. 86, No 7 (2001) p 1370. Běžně jsou v této souvislosti připomínány experimenty z let 1997 a 1998. Informace o nových experimentech z roku 2001, jsou v tomto článku nové, a doplňují tak soubor dobře známých informací o nové, aktuální informace. Na závěr výčtu těch nejfundamentálnějších a nejkvalifikovanějších zdrojů informací lze doporučit ještě na víc jednu knihu mimořádných pedagogických kvalit. Tři autoři: D.Bouwmeester, A.Ekert, A.Zeilinger vydali mimořádně zdařilou publikaci, nazvanou: „The Physics of Quantum Information“, s podtitulem: „Quantum Cryptography, Quantum Teleportation, Quantum Computation“(Springer Verlag, 2000), v níž s mimořádným citem, cobě vlastním, rozebírají detailně současný stav všech třech rozvíjených směrů, přičemž třetí z nich nebyl až dosud fakticky experimentálně realizován, a je dnes intensivně studován teoreticky. Množství vědeckých aktivit, jejichž cílem je prakticky realizovat kvantové počítače, o nichž jako první začal uvažovat R.P.Feynman, je dnes obrovské. Svědčí o tom nejen množství již publikované literatury, ale rovněž řada konferencí, věnovaných tomuto tématu. Jednou z nich je rovněž konference v ICTP Terst. Vstupní informace o obsahu pojednávaných témat, umožňuje udělat si vskutku reálnou představu o spektru dnes aktuálně studovaných problémů.
60
WORKSHOP ON QUANTUM
INFORMATION AND QUANTUM COMPUTATION
14 - 25 October 2002 Miramare Trieste, Italy
PURPOSE AND NATURE Quantum Information Theory and Quantum Computation represent an emerging interdisciplinary research frontier which has seen in recent years a tremendous growth and has raised a more and more increasing interest within the scientific community. There are various reasons for this. First of all, the highly interdisciplinary nature of the subject which involves at the same time diverse topics such as, on the theoretical side, information theory and foundational issues of quantum mechanics and on the experimental side the physics of quantum optical, atomic and solid state systems (both nanoscopic and mesoscopic). Secondly, the field seems extremely promising for the potentially revolutionary technological implications it might have in the near future. It is now perfectly clear that one can use quantum mechanics to process and trasmit information in a way which does not have a classical analogue, and that using quantum techniques one can implement fully secure cryptographic systems. Recent breakthroughs, such as the realization of elementary quantum logic gates using ions traps, cavity QED and NMR technology, the introduction of error correcting and search algorithms, the practical implementation of quantum teleportation, have led to extremely rapid progresses in a fascinating new field and, as a consequence, have attracted the interest of many scientists from varied disciplines. Even though important breakthroughs are still necessary before the stage which will allow, by resorting to quantum mechanics, the overcoming of the inherent barrier posed by the rapid miniaturization of microchip components to computer technology, there is a shared hope that relevant improvements will be probably achieved in a short time. The purpose of the Workshop is to provide a compact and comprehensive introduction to quantum information theory to young researches and newcomers in the field. Chtěl bych na závěr opakovaně zdůraznit, že fundamentálními pojmy, s nimiž celá tato oblast výzkumu pracuje, jsou: spin a
entanglement v systémech spinových částic. Přes enormní, jak teoretické, tak
experimentální úsilí, jež bylo až dosud vynaloženo při studiu fenoménů, spojených s těmito pojmy, zůstává i nadále řada otevřených problémů, jež bude nutné dořešit.
61 Literatura: [1] CERN Courier, March 2000 p 9 [2] D. Bouwmeester,…,A.Zellinger: Nature 390, (1997) p 575. [3] D. Boschi,…, S.Popescu: Phys. Rev. Lett. 80, (1998) p 1121. [4] Physics World July (2002) p 3. [5] AAPPS Bulletin, vol.11, No 2, p 30 (AAPPS: Association of Asia Pacific Physical Societies) [6] EKONOM č. 26, (2002), str 50, Právo 18.6.(2002) str. 1 LN 27.2.02, M.Vejvoda: „Vědci teleportovali laserový paprsek“ [7] P. Cejnar, M. Dušek: „Kvantové hlavolamy“ I : Vesmír 77, březen 1998, str. 129 II.: Vesmír 77, duben 1998, str. 189 III: Vesmír 77, květen 1998, str. 272 IV: Vesmír 77, červen 1998, str. 333 V: Vesmír 77, červenec 1998 str. 393 [8] M.Dušek: „Kvantová optika a základy kvantové teorie“ Čs.čas. fyz 47, (1997) p 9, M.Dušek: „Kvantová teleportace PMFA (pokroky) 43, (1998) No 4 p 293, M.Dušek, O.Haderka, M.Hendrych: „Foton jako důvěrný kurýr“ Co je kvant. kryptografie Vesmír 77 (1998) p 633. [9] D.Greenberger, A. Zeilinger: „Kvantová teorie: Jak málo zmůže čas“ Čs čas. fyz. 46, (1996) p 107. Interview „S prof. A. Zeilingerem o kvantové informaci, kvantové teleportaci a kvantové kryptografii,“ Čs. čas. fyz. 51, No.3, (2001) p 213 [10] L. Andrej, M.Bednář, M.Čerňanský „Kvantová teleportace“. Čs čas. fyz. 49No 4 (1999) p 196, L. Andrej, M. Bednář, M. Čerňanský, K.Král, J.Souček: „Kvantová teleportace a kvantová informace“ Čs. čas. fyz. 50, No 1, (2000) p 19 [11] T.Sudbery: „Nejrychlejší cesta z A do B“ Čs. čas. fyz, 49, No 4, (1999) p 207 T.Sudbery: „Instantní teleportace“ Čs.čas. fyz. 49, No 4, (1999) p 209 W. Tittel,…, H.Zbinden: „Kvantová kryptografie“ Čs.čas. fyz. 49, No 4 (1999) p 217 [12] Gennaro Auletta: „Foundations and Interpretation of quantum Mechanics“ World Scientific (2000) [13] R.P. Feynman, R.B.Leightom, M.Sands. „Feynmanovy přednášky z fyziky s řešenými příklady, díl 3“ Vyd. Fragment (2002). [14] J. Memra: „The Golden Age of Theoretical Physics“ vol. 1, vol.2 World Scientific, (2001). [15] D.Bohm: „Quantum Mechanics“ Prentice-Hall, New York (1952) Ruský překlad: „Kvantová mechanika“ , Izd. Fiziko-Matem. lit. Moskva 1961 [16] C.H. Bennet et al: Phys. Rev. Lept, 70, (1993) 1895. [17] M.C.Teich, B.E.A. Saleh: „Mikroskopie s kvantově provázanými stavy“ Čs.čas. fyz. 47, (1997) p 3-8. [18] N.Gisin, G.Ribordy, W.Tittel, H. Zbinden: „Quantum Cryptography“, Rev. Mod. Phys. 74, (2002) p 145. [19] A.Galindo, M.A.Martin-Delgado: „Information and Computatin: Classical and Quantum Aspects“ Rev. Mod.Phys. 74, (2002) p 347. [20] V.Vedral: „The role of Relative Entropy in Quantum Mechanics“ Rev.Mod.Phys. 74 (2002) p 197. [21] J.M.Raimond, M.Brune, S.Horoche: „Manipulating Quantum Entanglement with Atoms and Photons in a Cavity“ Rev. Mod. Phys. 73 (2001) p 565.
62 Bioinformatika – základní nástroj genomiky
Jan Pačes (
[email protected]), Ústav molekulární genetiky AVČR, Flemingovo nám. 2, 16637 Praha 6
Molekulární genetika v datech 1859 Darwinova práce „O původu druhů“ 1865 1869 1879
Mendelovy zákony dědičnosti Poprvé izolovaná DNA Objev mitózy
1902 Dědičné choroby se řídí mendelovými zákony 1902 Chromozómová teorie dědičnosti 1909
Vznik termínu gen
1911 Na mušce octomilce dokázána chromozómová teorie dědičnosti 1911 Gen jako základní jednotka dědičnosti 1941 Jeden gen, jeden enzym 1943 1944 1952 1953 1955 1955 1958 1959 1961 1961 1966 1968 1972 1973 1975 1977 1981 1982 1983 1983 1987 1989 1990 1994 1994 1994 1995 1996 1996 1996 1998 1998 1999 2000 2000 2000
Rentgenová difrakce DNA DNA (ne proteiny) je „transformující princip“ Geny jsou z DNA Dvoušroubovicová struktura DNA Člověk má 46 chromozómů DNA polymeráza – enzym kopírující DNA Semikonzervativní replikace DNA Identifikovány chromozomové abnormality (Downův syndrom) mRNA přenáší genetickou informaci v buňce První kontrola dědičných metabolických poruch u novorozenců Rozluštěn genetický kód Objev prvního restrikčního enzymu První rekombinantní DNA Naklonován první zvířecí gen Sekvenování DNA Objev intronů První transgení myš a moucha Vznik GenBank, databáze „přečtené“ DNA Identifikován první gen zodpovědný za genetickou chorobu (Huntingtonova nemoc) Vynález PCR Genetická mapa lidského genomu Genetické markery (mikrosatelity, STS) HUGO: Projekt sekvenace lidského genomu Prodej první geneticky modifikované plodiny: FLAVR SAVR rajče Detailní genetická mapa člověka První mikrobiální genomový projekt První mikrobiální genom osekvenován: Haemofilus influenza První eukaryotický genom osekvenován: kvasinka Saccharomyces cerevisiae První archea genom osekvenován: Methanococcus janaschii Začátek faktické sekvenace lidského genomu Privátní projekt sekvenace lidského genomu (Celera) První mnohobuněčný organismus osekvenován: červ Caenorhabtitis elegans Osekvenován nejmenší lidský chromozóm 22 Osekvenován genom mušky octomilky Lidský chromozóm 21 První pracovní verze „kompletního“ lidského genomu
63
Současný stav genomiky Současné metody sekvenování DNA jsou tak účinné, že se daří stanovit nukleotidové sekvence celých genomů. Obor genomiky se zaměřuje na komplexní analýzu genomů založenou právě na znalosti pořadí nukleotidů v DNA. V současné době je známa úplná struktura téměř stovky genomů (viz například http://kegg.genome.ad.jp/kegg/catalog/org_list.html nebo http://www.tigr.org/tdb/mdb). Většina jsou bakteriální genomy. Tyto genomy jsou zpravidla tvořeny jedním chromozómem případně ještě jedním nebo několika malými cirkulárními molekulami DNA zvanými plazmidy. Celkový počet nukleotidů v prokaryotickém genomu se pohybuje v řádu miliónů. Byly ale již stanoveny úplné nukleotidové sekvence genomů vyšších organismů, například kvasinky Saccharomyces cerevisiae (12 Mbp), hlístice Caenorhabditis elegans (97 Mbp) a mušky octomilky (137 Mbp). V roce 2000 byla stanovena prakticky úplná nukleotidová sekvence lidského genomu (3000 Mbp). Téměř ukončeny jsou analýzy genomů mnoha dalších bakterií a několika vyšších organismů (myš, rostlina Arabidopsis thaliana aj.). Z těchto čísel je zřejmé, že není možné zpracovávat takové množství nukleotidových sekvencí v genomech bez velmi účinného počítačového vybavení. Vznikl nový obor, bioinformatika, který se mimo jiné věnuje právě zpracování a počítačové analýze velkých souborů nukleotidových sekvencí, jaké jsou generovány například právě v genomových projektech a na ní navazující analýze aminokyselinových sekvencí proteinů.
Pro získání úplné nukleotidové sekvence genomu skládáme do kontinuálních lineárních řetězců nukleotidové sekvence získané sekvenováním jednotlivých klonů. V typickém případě stanovíme jedním sekvenováním pořadí několika set až jednoho tisíce nukleotidů. Z takových parciálních sekvencí pak postupně skládáme delší a delší řetězce (tzv. kontigy) až v ideálním případě získáme celou sekvenci, například sekvenci genomu nebo velkého úseku DNA který studujeme. To jsou první počítačové operace v sekvenačních projektech. Takto získanou sekvenci pak podrobíme další počítačové analýze. Snažíme se identifikovat všechny geny přítomné ve stanovené nukleotidové sekvenci, jejich strukturu (například exonintronovou organizaci), elementy regulující expresi genů (například promotory, enhancery, terminátory transkripce) a další důležité úseky DNA. Geny překládáme do sekvence aminokyselin proteinů a stanovíme jejich základní charakteristiky, například základní rysy sekundární struktury. Obvykle stanovíme celkovou charakteristiku DNA, jako je zastoupení jednotlivých bází. Po této základní charakterizaci DNA přistupujeme zpravidla ke srovnání nukleotidové sekvence s údaji v mezinárodních databázích. Ty jsou dnes již velmi rozsáhlé. Například databáze nukleotidových sekvencí EMBL obsahuje skoro čtrnáct miliard nukleotidů tvořících mnoho genů a genomů z různých organismů. Následuje vyhodnocování identifikovaných homologií. Z něho potom můžeme sestavit mnoho metabolických drah, které tvoří podstatu života buňky. Důležitým výsledkem srovnávacích studií jsou evoluční vztahy mezi organismy, kterými lze charakterizovat velmi přesně jednotlivé taxony.
64
Databáze biologických sekvencí na internetu Formátů pro záznam sekvencí a jejich variant je skoro tolik, jako je programů a databází, které s nimi pracují. Zmíníme se jenom o nejběžnějších z nich, tj. těch, které jsou používány v základních databázích a které jsou v textové formě a jsou použitelné i pro nespecialistu. DNA/RNA sekvence se ukládají v jednopísmenném IUB kódu, ve kterém lze zaznamenat i variantní sekvence nukleotidů v určité poloze (Tab. 1A). Protože má DNA dvoušroubovicovou strukturu, kde jsou obě vlákna k sobě navzájem antiparalelní, můžeme ke každému kódu přiřadit i jeho kód komplementární. Pro aminokyseliny v proteinech se také převážně používá jednopísmenný IUB kód, i když je možné se ve starších archívech setkat i s třípísmenným kódem (Tab. 1B). U proteinů se variantní kód nepoužívá s výjimkou asparagová kys./asparagin a glutamová kys./glutamin a samozřejmě X pro jakoukoliv aminokyselinu. Tabulka 1: A: IUB kód pro nukleotidy kód nukleotidy komplement A A T C C G G G C T T A (U U) A M AC K R AG Y W AT S S CG W Y CT R K GT M V ACG B H ACT D D AGT H B CGT V N ACGT N mezera -
B: IUB kód pro aminokyseliny kód třípísmenný kód aminokyselina A Ala alanin C Cys cystein D Asp asparagová kyselina G Glu glutamová kyselina H His histidin I Ile isoleucin K Lys lysin L Leu leucin M Met methionin N Asn asparagin P Pro prolin Q Gln glutamin R Arg arginin S Ser serin T Thr threonin V Val valin W Trp tryptofan Y Tyr tyrosin B Asx asparagová k. nebo asparagin Z Glx glutamová k. nebo glutamin X Xxx jakákoliv aminokyselina * --stop
65
Nejpoužívanější programy a formáty dat pro bioinformatiky FASTA
FASTA je formát pro archivaci a práci s biologickými sekvencemi. Je to nejběžnější a (když pomineme "holou" sekvenci) nejjednodušší formát. Jeho hlavní výhoda – úspora místa - je současně i jeho nevýhodou: je kompaktní a obsahuje pouze minimum dodatečných informací o sekvenci.
EMBL databáze
Databáze EMBL je organizována Evropskou molekulárně biologickou laboratoří (EMBL). Je to veřejná evropská primární nukleotidová databáze se sídlem v Anglii na adrese http://www.ebi.ac.uk/embl. Databáze je vytvářena v součinnosti s ostatními nukleotidovými databázemi GENBANK (USA) a DDBJ (Japonsko) a je velmi dobře přístupná spolu s mnoha odvozenými a dalšími databázemi přes SRS (Sequence Retrieval System) například na adrese http://srs6.ebi.ac.uk. Databáze obsahuje všechna data zaslaná vědeckou komunitou, a to bez kontroly. Z tohoto důvodu může obsahovat určité procento chyb
SWISSPROT
SWISSPROT je formát proteinových sekvencí podobný formátu EMBL. Databáze SWISSPROT je anotovaná proteinová databáze organizovaná hlavně švýcarským bioinformatickým institutem. Přístupná je na adrese http://www.expasy.ch/sprot. Úzce spolupracuje s EMBL a společně vytvářejí TrEMBL, také proteinovou databázi. Tyto dvě databáze dohromady pokrývají všechny "existující" či "smysluplné" proteinové sekvence. Autoři z literatury průběžně doplňují nové informace a v současné době se pravděpodobně jedná o nejkvalitnější molekulárně-biologickou databázi. Pro vědecké použití je SWISSPROT volně k dispozici.
GENBANK
Distribuční formát nukleotidové databáze GENBANK, který je podobný formátu EMBL je lépe čitelný – místo dvoupísmenného identifikátoru používá celé slovo. Databáze GENBANK je nukleotidová databáze, kterou organizuje Národní institut zdraví (NIH) v USA. Díky výměnné spolupráci s ostatními nukleotidovými databázemi obsahuje v podstatě stejná data jako EMBL. GENBANK je výborně propojena s mnoha dalšími databázemi a výše uvedená adresa je výchozím bodem hledání pro velkou část vědecké komunity. Bohužel, je třeba mít při práci na paměti, že (stejně jako EMBL) neobsahuje všechny dostupné sekvence, hlavně z velkých genomových projektů. Podrobnější informace o databázi lze najít například na adrese http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html
PIR
Stejně jako v případě EMBL/SWISSPROT je i formát PIR formát požíván pro proteiny. Organizován je podobně jako GENBANK v NCBI. Zde s dalšími organizacemi vytváří PIR-International, anotovanou databázi analogickou SWISSPROT. Obě databáze jsou přístupné na adrese http://www-nbrf.georgetown.edu.
66
Porovnávání biologických sekvencí Porovnávání sekvencí, ať už nukleotidových nebo proteinových, se v jednom směru významně liší od všech ostatních typů vyhledávání – většinou se snažíme najít sekvenci pouze podobnou sekvenci jiné a ne s ní totožnou, tedy sekvence lišící se mnoha záměnami, inzercemi a delecemi. Proto není možné použít běžný vyhledávací algoritmus ale bylo nutno vyvinout algoritmus specifický pro tento typ problému. Automatická metoda vyhledávání byla prvně popsána v roce 1970 a je známa jako Needleman-Wunschovo hledání. Jejím principem je tzv. "pairwise alignment", srovnávání sekvencí pár po páru a nalezení maximální podobnosti ("similarity"). Posléze byla rozšířena a upravena pro identifikaci lokálních podobností a tato moderní verze je známa jako Smith-Watermanovo hledání.
Princip
Vezměme dvě sekvence (nukleotidové či aminokyselinové)
a = a1,a2,a3 .. am b = b1,b2,b3 .. bn
Chceme je porovnat mezi sebou a vytvořit alignment A, který sestává z řady párů A = (ai bj) .. (ak bl) kde
1 ≤ i < .. < k ≤ m 1 ≤ j < .. < l ≤ n Pro výpočet skóre alignmentu A přiřadíme každému páru hodnotu s(ai,bj) (pozitivní nebo negativní) v závislosti na tom, zda se jedná o totožný, příbuzný nebo nepříbuzný pár. Dále ohodnotíme mezery ("gaps") v alignmentu, nejčastěji funkcí
wx = y + zx
pro x ≥ 0; y,z ≤ 0
kde x je délka mezery ("gap"). Parametr y bývá nazýván "open gap penalty" nebo "gap existence penalty", parametr z "gap extension penalty" nebo "per residue gap penalty". Celkové skóre alignmentu je tak S = Σ s(ai,bj)
pro i=1..m, j=1..n
Hledání nejlepšího alignmentu je vlastně hledáním maximálního skóre ze všech možných alignmentů. Toto skóre je nazýváno "Smith-Watermann score" a bývá často uváděno jako jedna z veličin charakterizujících alignment. Jak je uváděn výše zmíněný princip do praxe si nejlépe ukážeme na příkladu: Vezměme dva oligopeptidy:
AGTDRCTDKRL ACTDKLRCTKRL
67 Nejprve vytvoříme tabulku podobností ("similarity matrix"). V nejjednodušším případě totožnost ohodnotíme 1 a vše ostatní 0. Pak můžeme spočítat tabulku všech možných alignmentů ("sum matrix"). Pak skóre subalignmentu Si,j získáme jako maximální skóre předcházejících subalignmentů plus skóre páru si,j:
Si,j = max ( Si-1,j, Si,j-1, Si-1,j-1 ) + si,j
Po spočtení celé tabulky vybereme z posledního sloupce/řádku nejvyšší skóre a zpětně vyhledáváním nejvyšších předcházejících skóre rekonstruujeme nejlepší "alignment". V našem případě získáme alignment:
AGTD--RCTDKRL * ** *** *** ACTDKLRCT-KRL
Evoluční stromy Při porovnávání dvou nukleotidových sekvencí se nemusíme zabývat tím, jak si jsou jednotlivé nukleotidy v páru příbuzné a vystačíme s totožností (i když ani toto zjednodušení neplatí vždy). Jiná je situace u aminokyselinových sekvencí. Při porovnávání evolučně příbuzných sekvencí bylo objeveno, že pro funkčnost enzymu je často důležitá pouze obecná biochemická vlastnost jeho aminokyselin na určitém místě (například hydrofóbní aminokyseliny v transmembránové doméně) a proto můžeme jednotlivé aminokyseliny seskupit podle jejich biochemické příbuznosti (hydrofobicita, náboj, velikost, polárnost atd.). Záměna podobných aminokyselin pak může být penalizována méně než záměna aminokyselin nepříbuzných. Zároveň bychom také měli uvažovat i genetickou (evoluční) příbuznost. Například tryptofan je kódován pouze jedním kodónem, UGG. Jednokrokovou mutací z něj může vzniknout kodón pro glycin (GGG), serin (UCG) a leucin (UUG), dva kodóny pro cystein (UGU,UGC), arginin (CGG,AGG) a dva stop kodóny (UGA,UAG). Je tedy pravděpodobnější, že dojde k záměně tryptofanu na arginin než například na glycin. Přesto jsou biochemické vlastnosti tryptofanu a argininu maximálně odlišné – tryptofan je hydrofóbní aromatická aminokyselina, arginin naopak hydrofilní polární kladně nabitá aminokyselina. Z těchto úvah vycházíme při tvorbě tabulek pravděpodobností přechodu z jedné aminokyseliny na jinou. Vezmeme-li homologní proteiny z několika druhů a spočteme logaritmy pravděpodobností, se kterými došlo k přechodům mezi jednotlivými aminokyselinami, získáme evoluční strom například bakterií nebo savců, ale též základních typů organizmů (Obr. 1).
68
Obrázek 1: Evoluční strom základních typů organizmů.
Kde na internetu začít Veškerá data získaná sekvenováním a mnoho analýz a databází je přístupných veřejně na internetu. V české republice je při Centru integrované genomiky organizována databáze užitečných bioinformatických linek na adrese http://bio.img.cas.cz/links. Velká bioinformatická centra v evropě, která nabízejí celou řadu zajímavých služeb a databází jsou na adresách http://www.ebi.ac.uk (European Bioinformatic Institute) a http://www.expasy.org (Expert Protein Analysis System). V USA je nejvýznamnější adresa http://www.ncbi.nlm.nih.gov (National Center for Biotechnology Information). Databáze a analýzy lidského genomu jsou k dispozici na adresách http://genome.ucsc.edu nebo http://www.ensembl.org.
69
Názvosloví organických sloučenin a jeho doporučené změny Josef Pacák Přírodovědecká fakulta UK
Katedra učitelství a didaktiky chemie, Albertov 3, 128 43 Praha 2 Tel.: +420 221951348, E-mail:
[email protected]
Úvod Názvosloví (méně vhodně nazývané nomenklatura) sloučenin je pro chemii něčím podobným čím je gramatika pro výuku jazyků. Má svá přesná, někdy velmi složitá pravidla, nutná k tomu, aby si chemici mezi sebou jednoznačně porozuměli. S názvoslovím organických sloučenin jsou podstatně větší problémy než s názvoslovím sloučenin anorganických. To se pro popis organických sloučenin naprosto nehodí. Vyplývá to z jejich ohromného počtu, jenž se dnes odhaduje na víc než 17 milionů, i z nesmírné strukturní rozmanitosti jejich molekul. Situace je navíc komplikována tím, že se v organické chemii stále používá
názvosloví
několika druhů a to triviálního, funkčně skupinového i různých druhů názvosloví systematických. Proto se k němu váží stovky často velmi složitých pravidel.
Až do roku 2000 se české názvosloví
organických sloučenin řídilo pravidly, vycházejícími z mezinárodního názvosloví, odbornou skupinou
IUPAC v roce 1979
a v češtině
mezinárodní názvosloví doznalo změn v roce 1993 (cit. 2)
vypracovaného
publikovaného v roce 1985 (cit.1). Toto a jeho česká verze vyšla v
roce 2000
pod názvem „Průvodce názvoslovím organických sloučenin“(cit. 3) . „Průvodce“ vychází z dosud používaného názvosloví, ale přináší, jak je uvedeno v jeho podtitulu, nově určitá doporučení. Je třeba zdůraznit, že navrhované úpravy nepředstavují zásadní změnu dosud užívaného názvosloví IUPAC, ale jen některé jeho, byť významné úpravy. budou zřejmě postupně přijaty a respektovány především
Ty ale
v naší odborné chemické literatuře.
Smyslem jejich zavádění je, aby rozdíly mezi národním a mezinárodním názvoslovím IUPAC se neustále zmenšovaly a aby studentovi, znalého českého názvosloví,
nevznikaly při práci
se
zahraniční chemickou literaturou, používající mezinárodní názvosloví , zbytečné problemy.
Důležité
termíny
organického
názvosloví
se
zapracovanými
doporučeními Jednotlivé druhy názvosloví ( s uvedenými příklady): 1.Triviální (močovina, glukosa, kyselina vinná, kokain) 2.Semisystematické, též semitriviální ( methan, aceton, glycerol, cholesterol, styren) 3.Systematické a) substituční (propanon, hexanal, 2-chlorpentan) b) záměnné (2H-thiopyran)
70 c] konjunktivní (kyselina benzenoctová) d] aditivní, vzniklé spojením několika shodných seskupení (bifenyl, biacetyl) e) funkční skupinové, dříve radikálově funkční nebo dvousložkové (dimethylether, propylamin, terc. butylbromid, benzylkyanid) f) subtraktivní (2-deoxy-D-glukosa, demethylmorfin) g) násobné (4,4‘-peroxydibenzoová kyselina) Základní struktury 1)
Hydridy nesubstituované: uhlovodíky (acyklické i cyklické) nebo heterocykly,
např. methan, butan, cyklohexan, naftalen, thiofen, pyrrol, pyridin 2)
Některé vybrané deriváty hydridů, např. aceton, kyselina octová, kyselina benzoová , fenol
nebo anilin Skupiny 1)
Substituenty: atom nebo skupina atomů, nahrazující v základních strukturách jeden nebo
několik H a) Uhlovodíkové zbytky, např. alkyly nebo aryly b)
Funkční
(charakteristické)
skupiny,
např.
hydroxyskupina,
karbonylová
skupina,
aminoskupina, halogen 2)
Hlavní funkční skupina - funkční skupina hierarchicky nejvyšší, vyjádřená vždy názvoslovnou
příponou (např. 2-hydroxycyklohexanon) Ligandy atom nebo skupina atomů vázané k centrálnímu atomu (pozn. H je ligand, ale nikoli substituent) Lokanty číslice nebo písmena , určující polohu substituentu
Stereodeskriptory písmena, vyjadřující konfigraci, např. D, L, cis, trans, α, β Vazebné číslo (dříve vaznost) součet vazeb, vycházejících z uvažovaného atomu ( OH - 1, NH4+ 4, H3O+ 3) Standardní vazebné číslo (dříve základní vaznost) součet vazeb v molekule nejjednoduššího hydridu ( CH4 4, NH3 3, H2O 2, HF 1).
Možnosti substituce základních struktur 1.
Povolené triviální názvy jako základní struktura s neomezenou možností substituce:
Např. toluen (jen na kruhu), fenol, kyselina octová, akrylová, malonová, jantarová, ftalová, tereftalová, maleinová, fumarová, anilin, benzidin, kyselina barbiturová, guanidin nebo močovina. 2.
Povolené triviální názvy jako základní struktura bez možností substituce:
Např. isobutan, isopentan, neopentan, isopren, xyleny, isopropyl, isobutyl, sek-butyl, terc-butyl, glycerol , kresoly, pyrokatechol, resorcinol, hydrochinon, kyselina pikrová, mravenčí, propionová, máselná, šťavelová, mléčná nebo citronová.
71
Přehled nejvýznamnějších doporučovaných změn Dříve: a)
Nyní:
Umístění lokantů 1-buten
but-1-en
1,3-butadien
buta-1,3-dien
1,4-butandiol
butan-1,4-diol
2-butyl
but-2-yl
2-cyklohexenol
cyklohex-2-en-1-ol
kyselina 1,2-cyklohept-3-endikarboxylová kyselina cyklohept-3-en-1,2-dikarboxylová b)
Přípona pro C ≡C alkin
alkyn
ethin
ethyn
1-penten-3-in
pent-1-en-3-yn
1,3-hexadien-5-in
c)
hexa-1,3-dien-5-yn
Spojovníky v názvech esterů a solí, změna přípony -at na -át ethylacetat natriumacetat
ethyl-acetát natrium-acetát
trimethylamoniumchlorid
trimethylamonium-chlorid
natriumdihydrogencitrat natrium-dihydrogen-citrát
d)
natriummethylbutandioat
natrium-methyl-butandioát
benzendiazoniumchlorid
benzendiazonium-chlorid
Závorky u názvů polymerů polyvinylacetat polymethylmethakrylat
e)
poly(methyl-methakrylát)
Nové alternativní názvy amoniak, hydrazin voda, peroxid vodíku methylamin
azan, diazan oxidan, dioxidan methylazan
trimethylamin
trimethylazan
fenylhydrazin
fenyldiazan
methoxyethan merkaptohexamethylenf)
poly(vinyl-acetát)
ethyl(methyl)oxidan sulfanylhexan-1,6-diyl-
Upřednostňování systematických názvů před triviálními propionaldehyd kyselina propionová
propanal kyselina propanová
72 g)
Upřednostňování číselných lokantů γ-butyrolakton
pentano-4-lakton
Pozn. Název oxidan je víceméně teoretický a nelze předpokládat, že by kdykoli v budoucnosti nahradil název voda! Pravopisné zásady Zásadně používat mezinárodní pravopis, tedy methan, ether, thiol, glukosa, isobutan. Nedoporučují se názvy typu octan ethylnatý, ale ethyl-acetát. Nedoporučuje se kombinovat substituční předpony s triviálními názvy, tedy nikoli kyselina α-aminopropionová nebo kyselina β-oxomáselná, ale kyselina 2-aminopropanová nebo kyselina 3-oxobutanová. U triviálních i systematických názvů kyselin je možné používat obě možnosti řazení slov, tedy např. kyselina octová i octová kyselina. Poznámka Vedle názvosloví IUPAC existují i další názvosloví jako názvosloví používané v časopisu Chemical Abstracts (CA) nebo v kompendiu Beistein. Ty některá doporučení IUPAC nepřijaly, např. u CA má každá sloučenina
jen jediný petrifikovaný
název,
např.
1-buten, 2-propanol, v Beilsteinově
kompendiu se užívá pro amoniak název amin. Latinské a mezinárodní názvy karboxylových kyselin a některých jejich derivátů Tyto názvy jsou významné zejména v biochemii a nová doporučení se jich nijak nedotkla. Název český
Latinský název
Kyselina
Acidum
mravenčí
formicum
Mezinárodní název
Sůl nebo ester
Acyl
Formiát
Formyl
(též formicicum) octová
aceticum
Acetát
Acetyl
propionová
propionicum
Propionát
Propionyl
máselná
butyricum
Butyrát
šťavelová
oxalicum
Oxalát
Oxylyl
jantarová
succinicum
Sukcinát
Sukcinyl
fumarová
fumaricum
Fumarát
Fumaryl
maleinová
maleicum
Maleát
mléčná
lacticum
Laktyl
malicum
Malát
vinná
tartaricum
Tartarát
citronová
citricum
isocitronová
isocitricum pyruvicum
Maleinyl
Laktát
jablečná
pyrohroznová
Butyryl
Maleyl Tartaryl
Citrát
Citryl Isocitrát
Pyruvát
Isocitryl Pyruvyl
benzoová
benzoicum
Benzoát
Benzoyl
skořicová
cinnamicum
Cinnamát
Cinnamyl
73 Pozn. : Názvy acylů, odvozených od systematických názvů, mají příponu -oyl, např. ethanoyl, butanoyl, dekanoyl atd.
Problémy výuky chemického názvosloví na základní a střední škole Ve výuce organické chemie na základní škole má smysl se zaměřit především na triviální názvy a jenom se zminit, že existuje též systematické názvosloví, užívané ve vědecké literatuře. Jako příklady systematických názvů bych uvedl methanol nebo ethanol případně propanon. Ve vztahu k výuce organické chemie na střední škole, především na gymnáziu,
je situace
složitější a tam vyvstává problém, do jaké hloubky je zapotřebí - z hlediska všeobecného vzdělávání - se chemickému názvosloví věnovat. Existuje nebezpečí , že příliš důkladným probíráním názvosloví se ztrácí čas, potřebný především k hlavnímu cíli výuky chemie, to je porozumění příčinám přeměn vnitřní struktury hmoty v průběhu chemických reakcí, probíhajících v živé i neživé přírodě, a seznámení studentů s chemickými materiály, s nimiž se běžně setkávají a bez nichž by dnešní civilizace na současné úrovni
už nemohla existovat. Není proto
v časových možnostech
středoškolské výuky chemie seznámit studenty s organickým názvoslovím do větší hloubky a ani by to nemělo valný smysl. Vždyť ani ve vysokoškolských přednáškách a učebnicích z organické chemie nelze věnovat organickému názvosloví mnoho času. Na střední škole bych zaměřil výuku organického názvosloví
především na triviální názvy
některých významných sloučenin jako jsou např. glycerin, fenol, močovina, jednoduché kyseliny
organické
a významné přírodní sloučeniny. Nevýhodou triviálních názvů je ovšem to, že z nich
nelze odvozovat jim odpovídající vzorce a těm se potom student musí naučit nazpamět. Za užitečné považuji stručně probrat na střední škole názvy funkční skupinové jednoduchých alkylhalogenidů, alkoholů, ketonů nebo etherů (např. isobutylalkohol, terc-butylchlorid, dimethylketon či ethylmethylether). Vytváření
systematických názvů sloučenin, zvlášť těch složitějších, je často obtížné a pro
studenty, kteří v budoucnu nehodlají chemii na vysoké škole studovat jakými jsou např. budoucí právníci, psychologové či ekonomové , nepovažuji jejich podrobnější znalost za nezbytnou. Výklad bych omezil především na názvosloví základních typů uhlovodíků, na jejich deriváty převážně
jen s
jednou funkční skupinou a na nejjednodušší heterocykly. Problém výuky organického názvosloví je ovšem u studentů, kteří chtějí uspět u přijímacích zkoušek na vysokou školu, kde je chemie jedním ze zkoušených předmětů, tedy ať už půjde o budoucí chemiky, učitele chemie, lékaře, farmaceuty, veterináře či zemědělce. Ti musí mít ovšem znalosti z chemie, a tedy i z chemického názvosloví, hlubší než ti , kteří se studiem chemie již dále nebudou zabývat. U těchto studentů je třeba probírat systematické názvosloví poněkud podrobněji, nejspíš v rámci nepovinných seminářů v posledním gymnaziálním ročníku..
74
Přijímací zkoušky na vysokou školu a jejich vliv na středoškolskou výuku Při této příležitosti bych chtěl
zdůraznit
skutečnost, že nároky, kladené na uchazeče o
vysokoškolské studium při přijímacích zkouškách často výrazně deformují středoškolskou výuku. Učitel se snaží své studenty, směřujíci na vysokou školu, především připravovat tak, aby při přijímacích zkouškách uspěli. Přitom tyto zkoušky mnohdy zjištují pouze formální vědomosti uchazeče a nikoli jeho schopnost logického úsudku. Je to ovšem do jisté míry dáno skutečností, že při velkém množství zájemců o studium je zapotřebí konstruovat takové testy, které lze rychle a objektivně vyhodnotit a taková forma, jakou jsou např. testy s několika nabídnutými odpověďmi, obvykle neumožňuje ověřit vhodnost uchazeče pro vysokoškolské studium. Je nepochybné, že absolvent střední školy musí mít určitou zásobu konkretních znalostí. Nelze studovat cizí jazyky bez zvládnutí potřebné slovní zásoby. Ale
zaměření výuky jen na to, aby uchazeč o vysokoškolské studium
úspěšně zodpověděl otázky, zkoumající pouze jeho vědomostní potenciál, se negativně podepisuje na její celkové koncepci.
Závěr Na závěr bych chtěl uvést svůj názor na středoškolskou výuku organického názvosloví s ohledem
na stávající doporučení. Učitel by měl vykládat názvosloví
- jak již bylo řečeno,
rozumném rozsahu - tak, jak to dělal doposud, ale měl by upozornit na nejvýznamnější
v
změny, jak
vyplývají ze současných doporučení (za takové bych např. považoval změnu v umísťováníní lokantů funkčních skupin a na přípony -yn u alkynů). V žádném případě ale nelze zavrhnout až dosud užívané názvoslovná pravidla, doporučovaná k obměně, protože ve stávajících učebnicích organické chemie jsou uváděny a tato literatura bude ještě delší dobu čtenářům k dispozici.
A je i skutečností, že
mnohé nejmodernější zahraniční
učebnice organické chemie tato nová názvoslovná doporučení na své stránky stále ještě nezavedly. Tedy nebuďme papežštější než papež .... Na některých vysokých školách se při letošních přijímacích zkouškách již objevily nebo v budoucnu jistě objeví otázky zahrnující výše uvedená názvoslovná doporučení. Protože míra znalostí nových názvoslovných úprav bude u studentů na různých gymnáziích různá podle rozhodnutí učitele, považoval bych za danné situace za normální, kdyby vysoké školy v nejbližší budoucnosti otázky z organického názvosloví do přijímacích zkoušek vůbec nezahrnovaly. Literatura: 1. K.Bláha, M.Ferles, J.Staněk: Nomenklatura organické chemie. Academia, Praha 1985. 2. R.Panico,:W.H.Powell, J.-C. Richer: A Guide to IUPAC Nomenclature of Organic Compounds, Recommendations 1993, Black Science Ltd. 1993. 3. Průvodce názvoslovím organických sloučenin podle IUPAC, Doporučení 1993. Academia , Praha 2000.
75
Slunce - naše nejbližší hvězda RNDr. Petr Heinzel, DrSc. Astronomický ústav AV ČR, Fričova ul., 251 65 Ondřejov Tel: +420.204.620146, E-mail:
[email protected]
Slunce je celkem průměrná hvězda, jedna z milionů hvězd nacházejících se v naší Galaxii. Její vyjímečnost je však v tom, že je středem naší sluneční soustavy a zdrojem života naší planety. Proto je jejímu studiu věnováno v celosvětovém měřítku velké úsilí a obor zvaný
sluneční fyzika je významnou součástí dnešní astronomie resp. astrofyziky. Na prvý pohled je Slunce hvězda celkem poklidná (ve srovnání s některými aktivními hvězdami), nacházející se na tzv. hlavní posloupnosti vývojového Hertzsprung-Russelova diagramu.
Jak se však
ukázalo zejména v poslední době díky pozorováním ze sondy SOHO (ESA-NASA), dochází i na Slunci k celé řadě velmi aktivních procesů, z nichž nejrozsáhlejší jsou výrony koronální
hmoty (CME) do heliosféry - tyto procesy mohou zasáhnout i naši Zemi a jejich studium a předpovídání je předmětem zcela nového oboru nazývaného "Kosmické počasí". Veškerá energie Slunce je generována v jeho nitru, kde dochází k reakcím jaderné fúze. Přeměnou vodíku na hélium se uvolňuje obrovské množství energie, která se posléze transportuje směrem k povrchu Slunce a ze Slunce potom vychází v podobě záření a částic. Nejzajímavější částice jsou neutrina, která k nám přicházejí přímo ze slunečního nitra a jejich tok závisí na jeho struktuře a probíhajících jaderných reakcích. Energie v podobě záření se šíří z nitra skrze zářivou zónu a pod povrchem Slunce pak prochází zónou konvektivní, kde hlavním mechanismem jejího přenosu je konvekce. Nakonec energie prochází sluneční
atmosférou, což je poměrně tenká vrstva plazmy, ale velmi důležitá neboť právě v ní se formuje sluneční spektrum, které představuje nejvýznamnější diagnostickou informaci pro studium Slunce. Spektroskopie je tradičním oborem sluneční fyziky a je dlouhodobě rozvíjena i na ondřejovské observatoři. Pomocí spektroskopie lze dnes podrobně studovat nejen strukturu a dynamiku sluneční atmosféry, ale lze nahlédnout i do samotného slunečního nitra (nový obor zvaný helioseismologie ). Velmi významným činitelem na Slunci je magnetické pole. Slunce má jednak poměrně slabé dipólové pole, avšak během cyklu sluneční aktivity, který trvá 11 let, se formují aktivní
oblasti s velmi silným magnetickým polem. Tato koncentrace pole je potom příčinou celé řady aktivních procesů probíhajících ve sluneční atmosféře,
jako jsou erupce, CME,
76
protuberance, ale i známé sluneční skvrny apod. Tyto jevy jsou opět velmi dobře zdokumentovány pomocí sondy SOHO a v současné době podrobně studovány.
77
Zmražené světlo VLADIMÍR DVOŘÁK Fyzikální ústav AV ČR Na Slovance 2, 182 21 Praha 8 e-mail:
[email protected] , tel.: -2- 6605 2123 Úvod
V posledních letech se několik vědeckých skupin ve Spojených státech intenzivně experimentálně zabývá zpomalováním světla v průhledných prostředích. V roce 1998 bylo světlo zpomaleno na rychlost dopravního letadla a o rok později již jen na neuvěřitelných 17 m za vteřinu [1]. Světlo se jak známo šíří ve vakuu rychlostí c ≈ 300.000 km za vteřinu; ke Slunci dorazí zhruba za 8 minut, k Měsíci asi za 1 vteřinu, ale jelikož si vesmírné vzdálenosti nedovedeme dobře představit, je možná názornější si uvědomit, že za vteřinu by světlo oběhlo zeměkouli po rovníku téměř osmkrát. Bylo tedy dosaženo zpomalení světla víc jak desetmilionkrát ! V minulém roce se podařilo světlo dokonce na okamžik zastavit [2,3]. , jakoby v průhledném prostředí zmrazit, zapsat jej do stavu atomů a pak zase v původní podobě obnovit. Popíšeme tyto pokusy se světlem, pokusíme se je vysvětlit a upozorníme na možnosti využití takových manipulací se světlem. Grupová rychlost světelného pulsu
Připomeňme si čím je určena rychlost světla v hmotném prostředí. Uvažujme nejprve rovinnou harmonickou vlnu E=E0cos(kx-ω0t) šířící se v prostoru ve směru osy x; elektrické pole E leží v rovině kolmé na osu x a je v ní všude stejně velké.Vlna má vlnovou délku λ=2π/k a kruhovou frekvencí ω0. Rychlost s jakou se šíří místo stejné fáze (kx-ω0t) se nazývá fázová rychlost rovinné vlny v a je rovna ω0/k. V hmotném prostředí se světelná vlna šíří pomaleji než ve vakuu a v důsledku toho se v něm láme. Veličina n=c/v, která udává kolikrát je rychlost vlny v prostředí menší než rychlost světla ve vakuu c, se proto nazývá indexem lomu. Jeho velikost závisí na druhu prostředí a na frekvenci vlny, což se nazývá disperzí n(ω). Zdálo by se tedy, že k tak drastickému zpomalení světla by bylo třeba nalézt průhlednou látku (aby v ní světlo nebylo pohlceno) s obrovským n - řádově desítky milionů . Taková látka nejenže neexistuje (jeden z největších n má diamant a to pouhých 2,4), ale navíc by do ní světlo vůbec neproniklo, téměř dokonale by se od ní odrazilo. Rovinnou vlnu, která by vyplňovala celý prostor a trvala nekonečně dlouho pochopitelně nelze realizovat. Experimentálně se vždy pracuje se světelným pulsem trvajícím jen určitou dobu a který je tedy lokalizován v určitém prostorovém úseku. Konečnou dobu trvání pulsu je možné modelovat časovou závislostí amplitudy E0, např. ve tvaru Gaussovy křivky E0(t) ~ exp(-αt2) (viz obr.1a). Charakteristická doba trvání pulsu (šířka Gaussovy křivky) je ∆t~α-1/2. Takový puls můžeme složit z harmonických vln s frekvencemi v okolí (∆ω) nosné frekvence ω0 , ∆ω= ω-ω0 ~∆t-1 (obr.1b). Čím kratší dobu puls trvá, tím větší počet harmonických vln obsahuje. V hmotném prostředí se každá vlna pohybuje různou fázovou rychlostí a následkem toho se střed pulsu, tj. místo kde se všechny vlny konstruktivně sčítají (obr.1c), pohybuje jinou rychlostí než v=c/n. Na pulsu složeném pro jednoduchost jen ze dvou vln si kvalitativně ukážeme proč tomu tak je (viz obr.1c). Nechť se vlna s delší vlnovou délkou λ pohybuje rychleji než vlna s kratší λ. Maxima obou vln se setkají až opět delší vlna dohoní vlnu kratší,
78
Obr.1. a) časový průběh amplitudy E0 rovinné harmonické vlny. b) frekvenční závislost amplitud Eω harmonických vln, které tvoří puls. c) prostorový průběh dvou vln, které spoluvytvářejí puls. Delší vlna se šíří (ve směru → ) větší rychlostí než vlna kratší, takže se maximum 0 kratší vlny posune dále než místo, ve kterém maximum 2 již dostihne maximum 1; místo, ve kterém mají obě vlny současně maxima se tedy pohybuje pomaleji než samotné maximum kratší vlny. Čárkované části vln ukazují jejich polohy v pozdějším čase. ∆xg a ∆x0 značí vzdálenosti, o které se za stejnou dobu posunulo maximum pulsu a maximum 0 kratší, pomalejší vlny.
mezitím se však maximum kratší vlny posune dál než společné maximum obou vln. Dá se poměrně snadno ukázat, že rychlost s jakou se pohybuje střed pulsu, tzv. grupová rychlost vg= dω/dk v "bodě" ω0; dω/dk = d(vk)/dk = v + k.dv/dk = v + k .(dv/dλ).(dλ/dk) = v − λ.dv/dλ. Pokud tedy delší vlny mají větší (menší) rychlost, vg
v). Grupovou rychlost je snadné vyjádřit pomocí n(ω) s využitím vztahu ωn = ck, ze kterého plyne d(ωn)/dω=cdk/dω: vg = dω/dk = c/[d(ωn/dω)] = c/[n(ω0)+ω0{dn/dω}0] . Jestliže tedy bude v okolí ω0 index lomu vlny růst s rostoucí frekvencí, tzv. normální disperze n, rychlost světelného pulsu se zmenší. Musíme tedy hledat prostředí s obrovskou normální
79
disperzí indexu lomu (tj. obrovské {dn/dω}0>0), které je navíc průhledné, tzn. nebude světelný puls pohlcovat a přeměňovat jej na "neužitečné" teplo. Elektromagneticky indukovaná průhlednost prostředí
Jak se vlastně šíří světelná vlna v hmotném prostředí. Je to velmi složitý děj s jednoduchým výsledkem: elektrické pole světelné vlny rozkmitá elektrony připoutané k atomovým jádrům a tyto mikroskopické, kmitající elektrické dipóly začnou vyzařovat elektromagnetické vlny o stejné frekvenci; všechny tyto vlny se nakonec složí ve výslednou, "zlomenou" a pomalejší světelnou vlnu. Není překvapující, že nejrychleji se index lomu mění s frekvencí ( n má velikou disperzi) v okolí rezonance, tj. když frekvence světelné vlny je právě rovna frekvenci, s kterou elektrony kmitají kolem svých jader. Ve správnějším popise kvantové mechaniky to znamená, že k největší disperzi n dochází v okolí tzv. rezonanční frekvence ωr, která odpovídá rozdílu energií εk-εi (=[h/2π]ωr, h značí Planckovu konstantu) dvou kvantových stavů atomu
Obr.2. Tři energetické hladiny potřebné k vyvolání jevu EIT. Šipky symbolizují přechody mezi kvantovými hladinami, na které jsou naladěny zkušební a kontrolní lasery. U atomu sodíku se využívají hladiny 1 a 2, jejichž vzdálenost je pouhých 1,8.109 Hz a hladina 3 je od nich vzdálena o 3.1015 Hz. Frekvence laserů ve dvojí rezonanci se tedy liší o méně než desetitisícinu procenta a lasery musí být naladěny s úctyhodnou přesností.
prostředí. Malá odchylka frekvence světelné vlny od rezonanční frekvence má za následek velkou změnu jejího indexu lomu n. Světelný puls s ω0 rovnou rezonanční frekvenci ωr, který jak říkáme je naladěn na přechod mezi dvěma kvantovými stavy, vybudí atomy z kvantového stavu s nižší energií do stavu s energií vyšší na úkor své vlastní energie a je proto v prostředí atomů rychle pohlcen. Aby k tomu nedošlo a mohla se projevit velká disperze n v okolí rezonanční frekvence potřebná ke zpomalení světelného pulsu, využívá se jevu
80
"elektromagneticky indukované průhlednosti" (angl. electromagnetically induced transparency - EIT): jestliže se prostředím šíří dva světelné, laserové pulsy naladěné na přechody ze dvou různých hladin energie atomů na stejnou hladinu vyšší, prostředí se pro ně stane průhledným, i když každý zvlášť by byl pohlcen! Laserový puls, který bude v prostředí zpomalován, zastaven a uskladněn, budeme dále nazývat pulsem zkušebním (angl. probe) a druhý laserový puls, potřebný k vyvolání jevu EIT, pulsem kontrolním (angl. control; častěji se používá termín "coupling laser", pro který ale nemáme vhodný český výraz). Schéma energetických hladin atomu je na obr.2 K vysvětlení jevu EIT si musíme ještě připomenout některé poznatky kvantové mechaniky. Každý atom se může nacházet v celé řadě kvantových stavů -popisují se tzv. vlnovými funkcemi ψi - s danými hodnotami energie. (Vlnová funkce volného atomu má skutečně tvar klasické vlny s vlnovou délkou λ, která je podle slavného de Broglie-ova vztahu nepřímo úměrná hybnosti atomu p, λ=h/p.) K EIT může docházet v tzv. tří-hladinových systémech, ve kterých ze všech možných kvantových stavů jednotlivých atomů hrají roli jen tři. Budeme je značit - podle rostoucí energie - 1,2 a 3 (stav 1 má tedy nejnižší energii) a popisovat vlnovými funkcemi ψi (i=1,2,3). Pro jev EIT je podstatné, že se atom může nacházet také v několika kvantových stavech současně, v každém s určitou pravděpodobností │ci│2 ; jinými slovy, ve stavu, který je jejich superpozicí:
ψ(t) = c1(t)ψ1 + c2(t)ψ2 + c3(t)ψ3
(1)
V souboru stejných atomů tyto pravděpodobnosti určují obsazení kvantových stavů, tj. kolik atomů bychom v určitém čase nalezli v jednotlivých kvantových stavech. Představme si nyní, že se atomy nacházejí v superpozici stavů 1 a 2 (tzn. c3=0) a že na ně současně posvítíme zkušebním a kontrolním pulsem. Jestliže lasery budou ve dvojí rezonanci, tzn. zkušební laser bude naladěn na přechod 1→3 a kontrolní na přechod 2→3, dojde k destruktivní kvantové interferenci mezi uvedenými dvěma přechody: pravděpodobnosti, že se atom ocitne ve stavu 3 při současném působení zkušebního a kontrolního pulsu ve dvojí rezonanci se vzájemně vyruší. Žádný atom nikdy nezůstane trvale ve stavu 3, do kterého by přešel působením zkušebního (či kontrolního) laseru samotného a zkušební puls (stejně jako kontrolní puls) proto nemůže být pohlcen; jakoby vůbec nevnímal atomy prostředí, prostředí se pro něj stalo průhledným. Podstatné je, že malé rozladění zkušebního pulsu od rezonanční frekvence ω31 s přechodem 1→3 má za následek velkou změnu indexu lomu n (obr.3). Máme tedy průhledné prostředí s velkou disperzí indexu lomu, ve kterém může docházet ke zpomalování světla aniž by bylo pohlcováno. Vysvětleme si ještě jednou poněkud jiným způsobem jak dochází k EIT. Aby se prostředí stalo dokonale průhledným, nesmí jej světelná vlna vůbec vnímat čili polarizovat, tzn. indukovat v něm elektrické dipólové momenty, které svým vyzařováním spoluvytvářejí výslednou, pozměněnou vlnu šířící se prostředím. Při přechodu atomu z jednoho stavu do druhého se mění rozložení elektrického náboje, čímž zpravidla vzniká dipólový moment µ. K jevu EIT dochází proto, že se dipólové momenty, vznikající při přechodech 1→3 (µ13) a 2→3 (µ23) vybuzených zkušebním a kontrolním pulsem, vzájemně vyruší; prostředí se při současném působení obou laserů ve dvojí rezonanci nezpolarizuje. Pro zkušební vlnu naladěnou přesně na přechod 1→ 3 se prostředí chová jako vakuum; zkušební puls -vlnové klubko složené z mnoha vln a které se šíří rychlosti vg- ovšem "cítí" velkou disperzi n v okolí ω31 a zpomalí se.
81
Obr.3. Závislost indexu lomu n a koeficientu absorpce κ zkušební vlny na její frekvenci ω, je-li kontrolní laser v rezonanci s přechodem 2→3. Při ω=ω31≈3.1015 Hz dochází ke dvojí rezonanci a k EIT. V okolí ω31 je absorpce zanedbatelná a n(ω) má neobyčejně strmý průběh; vzdálenost maxim (či minim) n je totiž pouhých řádově 10 MHz. Frekvenční průběhy napomínají dvě velmi blízké absorpční čáry (s anomální disperzí), čímž je způsobena neobyčejně velká normální disperze n v okolí ω0; v důsledku kvantových interferenčních jevů, nejsou však jejich pouhým složením. Bez kontrolního laseru obě absorpční linie musí splynout a mít maximum na frekvenci ω31 (čárkovaná křivka). S klesající intensitou kontrolního laseru se tedy maxima κ k sobě přibližují, disperze n v okolí ω31 ještě vzrůstá a rychlost zkušebního pulsu se dále zmenšuje; je přímo úměrná intenzitě kontrolního pulsu. Plné křivky odpovídají intenzitě kontrolního pulsu několik miliwattů na cm2. Tmavé stavy atomů
To co jsme právě popsali slovy je ovšem možné postupy kvantové mechaniky přesně odvodit. Časový vývoj vlnové funkce (1) popisující stav atomu, na který působí zkušební a kontrolní lasery, se řídí časovou Schrödingerovou rovnicí
82
i(h/2π)[∂ψ(t)/∂t] = [H0 + H'] ψ(t)
(2)
kde H0 představuje energii "tří-hladinového" atomu bez působení laserů a H' = ─ µ13Ez(t) ─ µ23Ek(t) je interakce atomu se zkušebním a kontrolním laserem. H' není nic jiného než energie elektrických dipólových momentů v elektrickém poli a popisuje přechody mezi kvantovými stavy vybuzené lasery (viz obr.2). Řešení rovnice (2) záleží na počátečním stavu atomu v čase t=0. Nechť jsou oba lasery naladěny na příslušné přechody a c1(0)=Ωk/Ω, c2(0)=─Ωz/Ω, c3(0)=0, kde Ωk=2πµ12E0k/h, Ωz=2πµ13E0z/h a Ω2=Ωk2+Ωz2. (Přesně řečeno µik má nyní význam maticového elementu dipólového momentu. Veličiny Ω se v odborné literatuře nazývají Rabi-ho frekvence.) Ukazuje se [řešením rovnice (2) po dosazení ψ ve tvaru (1) s uvedenými počátečními podmínkami], že následující koherentní superpozice stavů 1 a 2 ψ = (Ωk/Ω)ψ1 − (Ωz/Ω)ψ2
(3)
se s časem nemění, i když na atom působí časově proměnná elektrická pole zkušebního a kontrolního laseru. Podstatné je, že stav 3 není v této stacionární superpozici stavů zastoupen, takže atom jakoby vůbec nevnímal zkušební ( a ani kontrolní) světlo (nepřejde do stavu 3), zůstává v temnotě a stav atomu popsaný vlnovou funkcí (3) se proto nazývá tmavý (angl. dark). Kdyby na atom působil jen zkušební laser, nutně by vyvolal přechody atomu do stavu 3 a byl by pak v systému atomů pohlcen. Spolupůsobení kontrolního laseru způsobilo, že zkušební laser nevyvolá přechody atomů do stavu 3 a prostředí se proto pro něj stalo průhledným. Koherentní superpozice stavů (3) znamená, že koeficienty jejich lineární kombinace (tj. superpozice těchto stavů) jsou přesně určeny a může mezi nimi docházet k interferenci, podobně jako u dvou vln. Důležité je, aby koherentní superpozice stavů 1 a 2 , kterou vytvářejí společným působením oba lasery, byla po dostatečně dlouhou dobu (ve srovnání s délkou trvání pulsu) pro všechny atomy stejná. Jak je vidět z výrazu (3), aby docházelo k jevu EIT, superpozice stavů 1 a 2 musí být v poměru velikosti amplitud elektrických polí kontrolního a zkušebního laserových pulsů; zastoupení stavu 1 v superponovaném stavu je tím vyšší, čím je v daném místě prostředí větší amplituda elektrického pole kontrolního pulsu E0k a obráceně, zastoupení stavu 2 je tím větší čím je v daném místě větší amplituda elektrického pole zkušebního pulsu E0z. Jestliže se amplituda elektrického pole kontrolního pulsu E0k bude s časem adiabaticky měnit, tj. dostatečně pomalu v porovnání s ω32-1, tmavý stav bude stále koherentní superpozicí tvaru (3). To znamená, že při snižování E0k se bude zmenšovat počet atomů ve stavu 1 rovný │c1│2; podobně při adiabatických změnách E0z. Laserové pulsy jsou složeny z fotonů, kvant světla, a můžeme proto říci, že fotonové a atomové stavy (tj. počty fotonů a atomů ve stavech 1 a 2) jsou vzájemně "propleteny" (angl. entangled). Okamžitě se vnucuje otázka, jak připravit tmavé stavy, aby se prostředí stalo průhledným a světlo se v něm zpomalovalo? Odpověď je překvapivě jednoduchá: nastaví se v podstatě samy. Jelikož stav 1 má nejnižší energii, převážná část atomů se bude nacházet právě v něm. Na tom se nic nezmění zapneme-li nejprve kontrolní laser naladěný na přechod 2→3, který v podstatě nemůže budit přechody 1→3. Jakmile čelo zkušebního pulsu dorazí k první vrstvě vzorku, začne převádět atomy ze stavů 1 do stavů 3, které však pod působením kontrolního laseru přecházejí do stavů 2 (přitom se tzv. stimulovanou emisí vyzařuje světlo) tak dlouho, dokud se nenastaví "správná" koherentní superpozice (3) stavů 1 a 2 - tmavé stavy. K vytváření tmavých stavů dochází v prostředí po vrstvách, tak jak k nim postupně doráží čelo zkušebního pulsu. Čelo pulsu postupně ztrácí část své energie na vytvoření
83
tmavých stavů, hlavní část zkušebního pulsu však již prochází prostředím s tmavými stavy beze ztrát - stalo se pro něj průhledným. Experimentální uspořádání
Popíšeme nyní pokusy se zpomalováním světla prováděné ve skupině dánské fyzičky Lene V. Hau [2]. Aby byl pokus úspěšný, bylo zapotřebí udržet koherentní superpozici stavů 1 a 2 po dostatečně dlouhou dobu ve srovnání s délkou trvání zkušebního pulsu. Koherenci narušují zejména srážky mezi atomy, kterých je za pokojové teploty příliš mnoho a proto se přistoupilo k systémům zchlazeným na velmi nízké teploty. Tím se také podstatně zúží absorpční (přechody 1,2→3) a emisní (přechody 3→1,2) čáry atomů a v důsledku toho se zúží i obor frekvencí, pro které se prostředí stane průhledným -tzv. frekvenční okno propustnosti-, což se nakonec žádoucně projeví v ještě strmější disperzi indexu lomu n v okolí ω0. Uspořádání pokusu je na obr.4.
Obr.4. Schéma uspořádání pokusu provedeného skupinou Lene V. Hau. Na obrázku je průřez vakuovou komorou se sodíkovým obláčkem v magnetické pasti. Velikost obláčku je zveličena, magnety nejsou znázorněny. Fotonásobič měří příchod pulsu s lepší přesností než 1 mikrosekunda. Zobrazovací laser promítá stín obláčku do CCD kamery, čímž se měří jeho délka.
Obláček sodíkových atomů, 2 desetiny mm dlouhý a 5 setin mm v průměru, byl zachycen v magnetické pasti a postupně ochlazen až na teplotu 50 miliontin stupně nad absolutní nulovou teplotou. (Bylo tak vytvořeno nejstudenější místo ve vesmíru.) Při tak nízké teplotě většina atomů přejde do společného kvantové stavu - vznikne tzv. Boseho-Einsteinův kondenzát- , ve kterém mají nulovou hybnost. Ke kondenzaci atomů do jednoho kvantového stavu dochází když de Broglie-ova vlnová délka λ atomu je větší než střední vzdálenost mezi atomy a začne se projevovat vlnová povaha atomů. Proto musí být hustota atomového plynů velká (aby byly
84
atomy blízko sebe) a teplota dostatečně nízká, aby hybnost atomů v důsledku tepelného pohybu byla malá. V kondenzátu, ve kterém se podstatně lépe udržuje koherentní superpozice atomových stavů, se ocitlo asi 10 milionů atomů. Tři potřebné kvantové stavy 1, 2 a 3 se realizují takto: stavy 1 a 2 mají jen nepatrně odlišné energie (viz výklad k obr.2) a vzniknou rozštěpením základního stavu atomu sodíku v důsledku interakce magnetických momentů valenčního elektronu a atomového jádra; ve stavu 1 jsou tyto momenty orientovány proti sobě a ve stavu 2 souhlasně. Stav 3 má valenční elektron v nejbližším excitovaném stavu. Osvítí-li sodíkový obláček jen zkušební laserový puls (naladěný na přechod 1→3), začne excitovat atomy do stavů 3 a je proto rychle pohlcen. Vzápětí dojde ke zpětnému přechodu 3→1 atomů a světlo se opět vyzáří, ale náhodně do všech možných směrů - obláček se rozzáří žlutým světlem, které dobře známe z pouličního osvětlení sodíkovými výbojkami; informace, kterou by event. puls na sobě nesl, by byla navždy ztracena. Šíření světelného pulsu
Co se stane dorazí-li zkušební puls k sodíkovému obláčku, na který již svítí kontrolní puls a lasery jsou naladěny na dvojí rezonanci. Čelo zkušebního pulsu se začne zpomalovat, takže puls je při pronikání do obláčku postupně prostorově stlačován. Puls trvající několik mikrosekund , který by byl ve vakuu dlouhý několik kilometrů, se při zpomalení pulsu na metry za vteřinu scvrkne na pouhých několik setin milimetru. Jelikož v důsledku EIT je prostředí průhledné (n≈1), amplitudy vln, ze kterých se puls skládá zůstanou stejné, nezmění se ani velikost pulsu. Celková energie zkušebního pulsu se ale drasticky zmenší –desetmilionkrát−, protože při stejné hustotě je nyní jeho energie uložena v nepatrném objemu. Kam se tedy poděla? Její převážná část přejde do kontrolního pulsu. Děje se to takto: jak jsme se již zmínili, zkušební puls si v prostředí vytváří s pomocí kontrolního pulsu tmavé stavy v podstatě sám. Převádí atomy ze základního stavu 1 do 3, odkud pak působením kontrolního pulsu přecházejí do stavu 2, přičemž vyzařují -do kontrolního pulsu- příslušnou energii (tzv. stimulovaná emise záření), dokud se nenastaví tmavé stavy atomů Jelikož energie stavů 1 a 2 se liší jen nepatrně, hlavní část energie zkušebního pulsu tedy přejde do pulsu kontrolního; lasery si spolu prostřednictvím atomového prostředí vyměňují energii. Jakmile zkušební puls začne vycházet z prostředí, odčerpává zejména z kontrolního pulsu energii potřebnou k opětovnému roztažení pulsu ve vakuu a atomy se vracejí do základního stavu 1. Na obr.5 je schematicky znázorněno jak se stlačený zkušební puls šíří prostředím společně se svým přesným otiskem zaznamenaným v tmavých stavech atomů, tj. v koherentní superpozici stavů 1 a 2 podle velikostí elektrických polí zkušebního a kontrolního pulsu v každém místě prostředí. Stlačený zkušební puls a společně s ním postupující atomové tmavé stavy vytvářejí propletený stav, který se odborně nazývá tmavý polariton. Tento polariton lze ovládat kontrolním pulsem jak je patrné z obr.6. Na obr.7a je ukázka měření časových průběhů zkušebního a kontrolního pulsu. Záznam a čtení světelného pulsu
Vysvětleme si nyní jakým způsobem může být světelný puls zapsán do hmotného prostředí a pak opět přečten. Záznam zkušebního pulsu, event. i informace, kterou na sobě nese, bychom mohli přirovnat k záznamu na magnetickou pásku anebo k hologramu pulsu. Informaci lze nejen zapsat, ale i skladovat a pak kontrolním laserem přečíst. Vysvětleme si jak. Když je kontrolní puls vypnut, zkušební puls se zastaví (viz výklad pod obr.3). Obsazení stavů 1 a 2 se pak začne měnit ve prospěch stavů 2 [viz vzorec (3)]), ale jen velmi málo, protože stlačený
85
Obr.5. Schematické znázornění průchodu pulsu (červené křivky) prostředím. Puls se zúží (podstatně více než je znázorněno) a vytváří v prostředí tmavé stavy atomů. Různě natočené šipky představují různé superpozice stavů 1 a 2. Šipka otočená dolů znázorňuje základní stav 1. Jelikož oblast průhlednosti je vymezena úzkým intervalem frekvencí ∆ω v okolí rezonance, puls se po počátečním radikálním zúžení v prostředí postupně roztahuje; zhruba řečeno proto, že se jakoby prodlužuje doba trváni pulsu ∆t ~∆ω-1 a puls je lokalizován v úseku ∆x=vg∆t.
puls má již jen nepatrnou energii. Nakonec zkušební puls zcela zanikne; jeho věrný obraz však zůstane otištěn v prostředí v podobě koherentní superpozice stavů 1 a 2. Jakmile se kontrolní puls znovu zapne, zkušební puls se obnoví v původní podobě obráceným pochodem: kontrolní puls začne převádět atomy ze stavů 2 do stavů 3, odkud pak přecházejí do stavů 1 tak dlouho, dokud se nenastaví "správná" superpozice stavů 1 a 2 -tmavé stavy, zaznamenané před vypnutím kontrolního pulsu (viz obr.6 a 7b); přitom se vyzáří původní stlačený zkušební puls. Souhrnně a trochu odborněji řečeno, zápis a čtení zkušebního pulsu probíhá výměnou fotonů mezi laserovými pulsy stimulovanými emisemi. Puls ovšem nelze skladovat při zachování jeho tvaru neomezeně dlouho, protože koherentní superpozice stavů 1,2 se postupně vytrácí. Podařilo se to až jednu a půl milisekundy, což je velmi dlouhá doba v porovnání s délkou trvání pulsu (několik mikrosekund) a za kterou by puls ve vakuu urazil asi 300 km. Tím ale kouzla se světlem ještě nekončí. Intenzitu přečteného, obnoveného pulsu lze dokonce zvětšit a to tím, že se zvětší intenzita kontrolního - čtecího pulsu; je to možné proto, že zaznamenané tmavé stavy vyžadují v každém místě zachování poměru velikostí obou pulsů. Zkušební puls je potom po výstupu z prostředí užší, protože při větší intenzitě kontrolního laseru se rychlost zkušebního pulsu uvnitř vzorku zvýší a čelo pulsu při výstupu ze vzorku neuteče tolik konci pulsu. Zaznamenaný zkušební puls je také možné číst postupně, střídavým vypínáním a zapínáním kontrolního laseru. Tímto způsobem se podařilo vytvořit až
86
Obr.6. Výsledek modelového výpočtu šíření tmavého polaritonu podle [4]. Polaritonový puls P nemění svůj tvar a jak je vidět na obr.b, s klesající velikostí kontrolního pulsu Ek (obr.a) se zpomaluje - za stejný časový okamžik urazí kratší vzdálenost (viz výklad pod obr.3). Polariton je superpozicí zkušebního pulsu Ez a koherentních tmavých stavů atomů v poměru, který závisí na Ek (obr.c,d). Tmavé stavy jsou charakterizovány počtem N atomů ve stavu 2. Při Ek=0 je celý polariton uložen jen v atomech a zkušební puls zanikne.
tři po sobě jdoucí zkušební pulsy (obr.8). Kontrolní pulsy čtou "atomovou paměť" po částech, postupným vyprazdňováním stavů 2 doprovázeným vyzářením zkušebních pulsů. Možnosti využití
Je možné tyto podivuhodné manipulace se světlem k něčemu využít? Zmiňme se nejprve o možnostech čistě vědeckých, o návrzích zcela nových a poněkud exotických pokusů s kondenzátem zchlazených atomů. Jsou samozřejmě založeny na interakci světelného pulsu s atomy kondenzátu. Bude-li kondenzátem procházet zpomalený světelný puls právě rychlostí zvuku (několik centimetrů za vteřinu), dá se očekávat, že atomy po něm budou ochotně "klouzat" a tento pomalý světelný puls tak vybudí zvukovou vlnu šířící se kondenzátem. Excitované stavy kondenzátu (připomeňme si, že v základním stavu jsou skoro všechny atomy v klidu) představují vířivý pohyb atomů - v kondenzátu se vytvářejí víry. Bude-li zpomalené světlo procházet takovým vírem, bude do něj strhováno podobně jako do černé díry - černá díra vytvořená v laboratoři! Velké praktické možnosti se otevírají v nelineární optice a optické komunikaci. Světelné pulsy v hmotném prostředí mezi sebou interagují velmi slabě, takže nelineární jevy
87
Obr.7. Časové průběhy zkušebního a kontrolního laserového pulsu podle [2]. Na horním obrázku je zkušební puls těsně před vstupem do vzorku a těsně po výstupu. Zpoždění pulsu je11,8 mikrosekund, což odpovídá rychlosti asi 30 metrů za vteřinu. Šipkou je označen okamžik kdy je stlačený puls již celý uvnitř vzorku. Tvar zkušebního pulsu se nezměnil, ale má menší intenzitu, protože EIT není dokonalá. Po celou dobu měření byl kontrolní laser zapnut (čárkovaná křivka). Na dolním obrázku byl kontrolní laser vypnut jakmile byl celý zkušební puls uvnitř vzorku. Po uplynutí necelých 40 mikrosekund byl kontrolní laser znovu zapnut a zkušební puls obnoven.
88
Obr.8. Čtení atomové paměti po částech třemi slabšími, krátkými kontrolními pulsy podle [2]. Celková energie tří generovaných pulsů je stejná jako když je zápis přečten jedním dlouhým pulsem, protože v obou případech je na začátku čtení paměti obsazení stavů stejné.
se projevují jen při velkých intenzitách pulsů. To je sice výhodné pro bezpečný přenos informací optickými signály (nedochází k jejich deformaci), ale nevýhodné pro jejich další zpracovávání. Nelineární jevy lze výrazně zesílit v prostředí, které je ve stavu EIT. Tak např. působením slabého (na úrovni několika fotonů) laseru, naladěného na přechod ze stavu 2 do nějakého jiného excitovaného stavu, lze posouvat hladinu 2 (tzv. střídavý Starkův jev) a tím narušit podmínku dvojí rezonance. V důsledku toho se index lomu zkušební vlny výrazně pozmění (gigantický Kerrův jev, milionkrát větší než u dosud známých látek). Při velkém rozladění se prostředí stane neprůhledným a pracuje tedy jako optická závěrka ovládaná optickým pulsem. Zpomalování světla bude moci být využito v optických zpožďovacích linkách, potřebných přichází-li najednou příliš mnoho optických informací. Velikost zpoždění bude možné nastavovat intenzitou kontrolního laseru. Ke zpoždění řádově milisekundy by stačilo prostředí dlouhé desetinu milimetru, zatím co obyčejné optické vlákno by muselo být dlouhé stovky kilometrů. Přehled celé řady dalších návrhů jak využívat EIT lze nalézt v pracích [5,6]. Informace přenášené optickými signály je třeba před dalším zpracováváním nejprve převést na signály elektrické a ty pak zas na optické, což optickou komunikaci značně zpomaluje. Viděli jsme, že v našem systému takové konverze signálů není vůbec zapotřebí: optické signály lze zapsat přímo, uskladnit, event. je upravit jinými optickými signály a nakonec výsledný signál opticky přečíst a odeslat dál. Uvažuje se o možnosti využít těchto vlastností kondenzátu v kvantových počítačích, od kterých se očekává vyřešení problémů, které daleko přesahují možnosti současných počítačů. Klasický dvouhodnotový bit je v nich nahrazen mnoha-hodnotovým kvantovým bitem (tzv. qubitem), v tomto případě realizovaným různou superpozicí atomových koherentních stavů 1 a 2. "Fotonové" (různá lineární nebo kruhová polarizace fotonů) a "atomové" qubity by mohly být na sebe převáděny přímo, což bude nezbytně třeba pro konstrukci velkých kvantových počítačů.
89
Závěrem ještě zmínka o jiných systémech, ve kterých se podařilo uskladnit světlo. Současně s uveřejněním výsledků, které jsme popisovali, bylo oznámeno, že se podařilo skladovat světlo (po dobu půl milisekundy) v parách atomů rubidia a to dokonce při dosti vysokých teplotách, 70-90 oC [3]. Z hlediska možných využití je ještě zajímavější oznámení [7] o skladování světla v krystalu křemičitanu yttritého (Y2SiO5) dopovaném praseodymem (0,05 at. %), při teplotě 5 K. Lze očekávat, že se budou postupně objevovat další systémy s příhodnými vlastnostmi, a že se v nich podaří realizovat pozoruhodné návrhy jak v praxi využívat zastavování světla.
CITOVANÁ LITERATURA [1] Hau L.V., Harris S.E., Dutton Z., Behroozi C.H.: Light speed reduction to 17 metres per second in an ultracold atomic gas, Nature 397, 594-598, 1999 [2] Liu Ch., Dutton Z., Behroozi C.H., Hau L.V.: Observation of coherent optical information storage in an atomic medium using halted light pulses, Nature 409, 490-493, 2001 [3] Phillips D.F., Fleischauer A., Mair A., Walsworth R.L., Lukin M.D.: Storage of light in atomic vapor, Phys.Rev.Lett. 86, 783-786, 2001 [4] Fleischhauer M., Lukin M.D.: Dark-state polaritons in electromagnetically induced transparency, Phys. Rev. Lett. 84, 5094-5097, 2000 [5] Harris S.E.: Electromagnetically induced transparency, Phys. Today 50, 36-42, 1997 [6] Lukin M.D., Imamoglu A.: Controlling photons using electromagnetically induced transparency, Nature 413, 273-276, 20015] [7] Turukhin A.V., Sudarshanam V.S., Shahriar M.S., Musser J.A., Ham B.S., Hemmer P.R.: Observation of ultraslow and stored light pulses in a solid, Phys.Rev.Lett. 88, 023602-1 - 023602-4, 2002
90 HIV nepřítel nebo pomocník? Aneb od AIDS ke genovým terapiím Tomáš Ruml, Ústav biochemie a mikrobiologie VŠCHT, Technická 5, 166 28 Praha 6 [email protected] , tel. 224353022 HIV - nepřítel V roce 1981 byly identifikovány příznaky nového onemocnění, které bylo později pojmenováno AIDS (z angl. Acquired Immunodeficiency Syndrome; tj. syndrom získané imunitní nedostatečnosti). V roce 1983 objevili nezávisle na sobě vědecké týmy dr. Galla v USA a dr. Montagniera ve Francii původce tohoto onemocnění, virus HIV (z angl. Human Immunodeficiency Virus). Po dlouhou dobu byly vedeny spory o prvenství tohoto objevu, které bylo nakonec přiznáno francouzské laboratoři. Odhaduje se, že na konci roku 2001 žilo na světě cca 40 milionů lidí nakažených HIV a navíc jich od počátku epidemie cca 5 milionů zemřelo v důsledku AIDS. V České republice bylo celkem zjištěno 551 HIV positivních osob (zde se nejedná o odhad, ale o počet positivně testovaných osob - skutečnost může být podstatně vyšší). Tyto údaje byly převzaty ze stránky Státního zdravotního ústavu (). Zákeřnost HIV spočívá ve výběru hostitelských buněk, tj. skupiny bílých krvinek (T lymfocytů obsahujících receptory CD4), které jsou zodpovědné za regulaci imunitního systému. V důsledku jejich poklesu (při AIDS) dochází k selhání imunity a u pacienta se objevuje řada onemocnění na něž umírá. Jak vypadá průběh onemocnění? Průběh infekce lze rozdělit do tří fází. Během prvních 8 týdnů po exposici dochází přibližně u poloviny infikovaných k akutní infekci HIV, projevující se nejčastěji jako běžné chřipkové onemocnění. Tato primární HIV infekce zpravidla spontánně odezní bez zjevných následků. Poté nastává různě dlouhé období latence bez klinických projevů a subjektivních obtíží. Po celou tuto dobu je však HIV positivní člověk infekční a dochází u něj k postupnému poklesu počtu CD4+ T-lymfocytů. K prvním pozorovatelným příznakům snížení imunity dochází při poklesu počtu těchto buněk v krvi pod hodnoty 500 buněk/ml. V této fázi začínáme hovořit o symptomatické fázi HIV infekce, která se vyznačuje trvalými či opakovanými mikrobiálními a virovými onemocněními. Nejčastěji se jedná o mykosy jako orofaryngeální kandidosa a herpes zoster. Dostavují se i obecné příznaky jako jsou únava, horečky, průjmy a hubnutí. Později nastává stadium AIDS, při němž se začínají objevovat tzv. oportunní infekce jako nádorová onemocnění (nejčastěji tzv. Kaposiho sarkomy), HIV encefalopatie a wasting syndrom (kachexie). Toto stadium je důsledkem těžké poruchy imunitního systému spojené s hlubokým poklesem počtu CD4+ T-lymfocytů. HIV patří do čeledi Retroviridae, do níž patří i další obávané patogeny jako např. leukemický virus HTLV (Human T-cell leukemia virus). Struktura všech retrovirů je podobná (Obr. 1). Jedná se o částice o průměru kolem 100 nm obalené lipoproteinovým obalem na jehož povrchu jsou zakotveny obalové glykoproteiny (Env); a sice transmembránový (TM) a povrchový (SU) glykoprotein. Uvnitř je schránka kapsidy tvořená matrixovým proteinem (MA), která obaluje ribonukleoproteinovou strukturu tzv „core“. Core obsahuje genom (dvě identická vlákna RNA) s navázaným nukleokapsidovým proteinem (NC) a kapsidovým proteinem (CA). Všechny tyto strukturní proteiny tvořící kapsidu vznikají z prekursoru Gag. Kromě strukturních proteinů obsahuje retrovirová partikule enzymy; reverzní transkriptasu, (RT; pro replikaci genetické informace viru), proteasu (PR; uplatňující se při zrání viru a jeho přechodu na infekční formu) a integrasu (IN; zodpovědnou za vložení virové genetické informace do chromosomu hostitelské buňky čímž vzniká chronická infekce). Enzymy vznikají rovněž z prekursoru (Pol). Za štěpení retrovirových prekursorů je zodpovědná již zmíněná proteasa.
91
Obr. 1
Struktura HIV
1 - povrchový glykoprotein; 2 - transmembránový glykoprotein; 3 - dvojvrstva fosfolipidů; 4 - polyproteinový prekursor Gag; 5 - polyproteinový prekursor Gag - Pol; 6 - genomová RNA; 7 - matrixový protein; 8 - „core“ tvořené kapsidovým proteinem; 9 - proteasa; 10 - integrasa; 11 - reversní transkriptasa1 Životní cyklus retrovirů začíná jejich interakcí s povrchem hostitelské buňky. HIV primárně napadá T lymfocyty nesoucí receptor CD4. Tento výběr hostitelských buněk je řízen právě specifickou interakcí virových glykoproteinů s CD4 receptory. V pozdějším stadiu může HIV infikovat i jiné buňky. Po navázání viru na buněčný povrch dochází ke splynutí virové a buněčné membrány a ke vstupu „core“ do cytoplasmy a k jeho rozpadu (Obr.2, krok 3). Následuje reversní transkripce, jejímž výsledkem je přepsání jednořetězcového RNAgenomu do dvojřetězcové DNA pomocí RT (Obr.2, krok 4). Je nutno poznamenat, že reversní transkripce je značně nepřesná a je zdrojem mnoha mutací. Proto je terapie pacientů trpících AIDS komplikována velmi rychlým vznikem mutantů resistentních k použitým lékům, a z těchto důvodů se zatím jako optimální možnost jeví aplikace tří různých inhibitorů (dosud pouze kombinace inhibitorů reversní transkriptasy a proteasy), tzv. kombinovaná terapie. Prvním krokem tzv. pozdní fáze životního cyklu je integrace produktu reversní transkripce (DNA) do genomu hostitelské buňky za vzniku proviru (Obr.2, krok 5). Produkce nových virů pak začíná transkripcí provirové DNA buněčnou DNA polymerasou (Obr.2, krok 6). Při její iniciaci se kromě promotoru uplatňuje řada retrovirových regulačních elementů, transkripčních faktorů hostitelské buňky a u komplexních retrovirů také vlastních transkripčních aktivátorů. Část vznikající RNA je sestřižena (Obr.2, krok 9), opatřena methylovanou čepičkou na 5‘ konci a polyadenylována na 3‘ konci. Všechny formy RNA jsou pak exportovány do cytoplasmy, kde nesestřižená RNA slouží jako virová genomová RNA a mRNA pro translaci genů gag a pol (Obr.2, krok 10). Sestřižených RNA je využito k expresi Env, případně dalších virových proteinů (v případě HIV malé regulační proteiny). Prekursor povrchových glykoproteinů Env vzniká na drsném endoplasmatickém retikulu (Obr.2, krok 11) a jeho štěpením vznikají proteiny SU a TM, které jsou transportovány do Golgiho komplexu (Obr.2, kroky 13, 15), kde probíhá jejich glykosylace, a následně jsou vystaveny na povrch buňky (Obr.2, krok 17). Polyproteinový prekursor Gag vzniká translací genu gag na volných polysomech v cytoplasmě. Přibližně s 5 - 20% účinností dochází k posunu čtecího rámce před koncem gag, a zaniká tak stop kodón. Tím vzniká fusní genový produkt Gag - Pol. Tímto mechanismem je u HIV regulován poměr množství Gag: Gag-Pol. Tyto prekursory tvoří nezralou kapsidu, která je uvolňována z buňky pučením, při němž získávají retroviry svůj vnější
92 obal - fosfolipidovou dvojvrstvu mající původ v buněčné plasmatické membráně. Vzájemnou interakcí Gag a TM jsou do membrány viru selektivně inkorporovány virové obalové glykoproteiny.
Obr. 2: Schematické znázornění životního cyklu retrovirů 1-interakce s buněčnými receptory, 2-fuse membrán a vstup core do cytoplasmy, 3-„rozbalení“ core, 4reversní transkripce, 5-integrace provirové DNA do chromosomu, 6, 7-transkripce, 8,9-export RNA z jádra, 9-
93 sestřih RNA, 10,11-translace, 13,15,18-posttranslační modifikace a sekrece obalových glykoproteinů, 12,14,17skládání kapsidy. Po uvolnění z buňky je aktivována proteasa a dochází ke štěpení prekursorů a zrání kapsidy (vzniká struktura schematicky znázorněná na Obr. 1) Z průběhu životního cyklu logicky vyplývají důležité kroky, jejichž inhibicí by se dalo zabránit tvorbě nových částic a tím infektivitě HIV. Kromě vakcín se jedná zejména o inhibici interakce povrchových glykoproteinů s buněčnými receptory, inhibice enzymových reakcí katalyzovaných retrovirovými enzymy (RT, PR, IN), inhibice tvorby kapsidy nebo inhibice některých regulačních proteinů produkovaných HIV. Všechny tyto oblasti jsou předmětem výzkumu mnoha světových laboratoří. Z výše uvedených kategorií inhibitorů se v současné době terapeuticky používají pouze inhibitory reversní transkriptasy a proteasy. V poslední době se objevily slibné informace o pokroku ve vývoji vakcíny proti HIV. Zatím však zůstává pravdou, že jedinou spolehlivou obranou proti infekci HIV je prevence, neboť všechny používané léky pouze zmírňují příznaky a prodlužují dobu života. Jak je však zřejmé ze životního cyklu HIV, nelze těmito látkami virus eliminovat, neboť jeho genom je integrován v genetické výbavě pacienta. HIV - pomocník Retroviry však nejsou známy jenom v souvislosti s těmito zákeřnými chorobami, ale jejich studium významně přispělo k rozvoji moderních biotechnologií, zejména genového inženýrství. Objev retrovirového enzymu reversní transkriptasy (RT) znamenal změnu centrálního dogmatu molekulární genetiky, tj. názoru na jednosměrný tok genetické informace: DNA › RNA › Protein, neboť tento enzym katalyzuje syntézu DNA podle templátu RNA. Tento enzym je velkým přínosem, neboť může sloužit k získání nepřerušovaných eukaryotických (např. živočišných nebo rostlinných) genů bez interních nekódujících sekvencí (intronů). Tyto sekvence jsou z genů vystřiženy až při modifikaci mRNA a takto upravená mRNA může sloužit pro translaci (syntézu proteinů). RT umožňuje zpětnou syntézu DNA z takto upravené mRNA. Reversně přepsané geny jsou vhodné pro klonování a následné sekvenování (zjištění sekvence genu) nebo expresi např. v bakteriálních buňkách, vhodných pro získání velkého množství produktu. Retroviry lze také využít pro konstrukci vektorů pro genové terapie, což je technika založená na vnesení opravného genu do buněk s poškozenou genetickou informací. Cílem genových terapií je nejen léčba genetických chorob, ale i nádorových nebo infekčních onemocnění jako právě AIDS. Cíl genový terapií je jednoduchý - gen, který je nefunkční v důsledku genetického poškození, je nahrazen kopií téhož genu nově vnesenou do postižené buňky prostřednictvím vektoru. Jednou z kategorií vhodných nosičů pro genové terapie jsou právě retroviry. Je zde využito jejich vlastností infikovat buňky a integrovat geny do chromosomů prostřednictvím RT. Retrovirové vektory jsou samozřejmě upraveny tak, aby nezpůsobovaly onemocnění a nebyly schopné replikace, takže nemůže docházet k jejich uvolňování z buněk a přenosu na další osoby. Genové terapie jsou velmi zajímavým a slibným odvětvím moderní medicíny a přinesly celou řadu slibných výsledků. Jedná se však o metodiku, která je v počátcích a její aplikace je zatím spojena s celou řadou problémů, jak s dostupností vhodných a účinných vektorů, tak i s řadou etických otázek. V současné době, kdy známe celou genetickou informaci lidského genomu bude dokonalé zvládnutí této techniky znamenat nejen možnost léčby jinak nezvládnutelných nemocí, ale i možnost manipulace s lidským genomem.
94
Nové poznatky v systematice cévnatých rostlin Lubomír Hrouda Katedra botaniky PřF UK Benátská 2 128 01 PRAHA 2 kontakt: e-mail: [email protected] tel. +420 221 953 122 Klasifikace vyšších resp. cévnatých rostlin byla ke konci 20. století považována za stagnující, prakticky bezproblémovou disciplinu. Mechorosty byly považovány za jednotnou skupinu společného původu, rovněž tak kapraďorosty. Složitější byla situace u nahosemenných, kde byl soubor recentních i vymřelých skupin členěn do dvou vývojových větví s původem ve skupině tzv. progymnospermofyt, vedly se však spory o společném původu těchto větví, tj. zda nahosemenné jsou monofyletické nebo difyletické. V rámci krytosemenných platilo klasické členění na dvouděložné a jednoděložné a v rámci nich pak bylo uznáváno několik skupin (podtříd), lišících se jenom drobně v pojetí dvou hlavních morfologických systematiků velkých skupin – Tachtadžjana (Tachtadžjan 1987), uznávaného v našich novějších příručkách, a Cronquista (Cronquist 1988). Z těchto faktů vycházely středoškolské i vysokoškolské učebnice. Změny v interpretaci fylogenetického stromu cévnatých rostlin zejména v posledním desetiletí 20. století způsobily tři faktory: (1) masivní nástup nové fylogenetické metody – kladistiky, (2) studium rozsáhlého souboru molekulárních znaků a jejich srovnání se souborem klasických „morfologických“ znaků a (3) výrazný nárůst paleobotanických poznání. Abychom lépe pochopili následné komentování základních změn v pohledu na příbuzenské vztahy mezi skupinami cévnatých, velmi krátce se o těchto faktorech zmíním.
Kladistika je klasifikační metoda studující příbuznost organizmů založená na principu striktní monofylie, pracující pouze s tzv. monofyletickými taxony. Velmi zjednodušeně řečeno, každý taxon v sobě musí obsahovat všechny potomky společného předka, tj. vytváříme-li fylogenetický „strom“ příbuznosti, musíme do taxonu vyšší kategorie zahrnout všechny skupiny (např. do jedné třídy všechny řády), u nichž předpokládáme stejného, jen jim výlučného předka. Přiblížení z živočišné říše: je obecně známo, že (1) plazi (Reptilia) a ptáci (Aves) mají společného předka a že (2) zatímco ptáci jsou vývojově jednotnou skupinou, plazi jsou tvořeny několika souběžnými vývojovými liniemi. Nekladistické fylogenetické metody pracovaly vedle monofyletických i s tzv. parafyletickými taxony – ty sice musejí obsahovat potomky společného předka, ale nikoli všechny. V našem příkladu tedy plazi a ptáci jsou klasickými parafyletickými taxony; aby byly splněny požadavky kladistiky, je nutno (1) je spojit do jednoho vyššího taxonu (Sauropsida) a (2) existenci skupiny plazi prakticky zrušit (viz obr. 1). Je to metoda jistě nejobjektivnější, její formální nevýhodou je „nekonečný“ počet taxonomických kategorií, jak je možno vidět z některých kladogramů demonstrujících dále vztahy uvnitř krytosemenných; proto mnohdy kladistické klasifikace respektují jen taxonomické kategorie od řádu níže a naopak nejvyšší obecně užívané (např. Magnoliophyta – krytosemenné) a pro „mezitaxony“ užívají neformální jména. Klasické fylogenetické klasifikace pracovaly s termíny primitivní (původní) a odvozené (pokročilé) znaky, jež snad netřeba vysvětlovat. Těm v podstatě odpovídají v současnosti užívaná označení plesiomorfní a apomorfní znaky, doplněné však termíny společné pleziomorfní znaky (sympleziomorfie) a společné apomorfní znaky (synapomorfie). Zejména tyto synapomorfie jsou velmi důležité ve fylogenetických úvahách, představují totiž evoluční novinku, vzniklou na určité vývojové větvi a tedy vlastní všem taxonům, které do této větve náležejí, naopak však chybějící všem taxonům, odštěpivším se před jejím vznikem (obr. 2). Za zmínku stojí možná střípek z historie kladistiky. Otcem metody je německý fylogenetik a zoolog Hennig, který ji publikoval již v r. 1950 knižně, avšak německy. Metoda zůstala napovšimnuta téměř dvacet let; teprve po překladu Hennigovy knihy do angličtiny byla „objevena“ a během dalších dvaceti let prakticky vytlačila klasickou evoluční (fyletickou) metodu.
Molekulární systematika cévnatých rostlin se zrodila později, v roce 1993, publikací prvního fylogenetického stromu krytosemenných rostlin (Chase et al. 1993) založeného na sekvenci nějakého genu DNA; jako první byl užit tzv. rbcL gen chloroplastové DNA, kódující velkou podjednotku enzymu RuBisCO, hrajícího významnou úlohu ve fotosyntetickém procesu. Tento gen mají prakticky všechny zelené rostliny a pravděpodobně od začátku jejich
95 vzniku, není tedy pochyb, že má odrážet jejich historii a vývoj. V průběhu dalších let se počet sekvenovaných genů zvýšil a samozřejmě začaly být vytvářeny fylogenetické stromy na základě kombinace těchto sekvencí, resp. na základě kombinace těchto molekulárních znaků s morfologickými. V klasifikaci rostlin samozřejmě již dávno nejsou užívány jen znaky klasické morfologie, popř. anatomie. Velký „boom“ zažily v druhé polovině 20. století např. znaky karyologické (základní chromosomové číslo, karyotyp) či fytochemické (např. syntéza specifických sekundárních metabolitů), které se výrazně uplatnily jako charakteristické pro vyšší taxonomické jednotky (řády, podtřídy apod.). Byť se mnohé tyto znaky zjišťují obtížně, jsou jednoznačně vyjádřitelné („uchopitelné“), na rozdíl od „znaků“ molekulárních získaných sekvenováním. S vědomím tohoto zásadního rozdílu užívá obvykle současná fylogenetická literatura pojmy znaky „molekulární“ a „morfologické“; pod druhý termín pak schovává veškeré výše zmíněné nemolekulární znaky. V tomto smyslu jsou tyto termíny dále užívány i v našem článku.
Paleobotanika má nejsilnější výpovědní hodnotu u fylogeneticky starých skupin. Je sice znevýhodněna tím, že u vymřelých skupin, bez nichž nemůže dobrý fylogenetický strom existovat, nemůže zatím užít molekulárních znaků, přesto již zmíněný nárůst poznatků o jednotlivých skupinách a užití kladistických metod přinesly nový pohled zejména na vzájemné vztahy nejstarších skupin cévnatých rostlin (podrobněji viz např. Kenrick et Crane 1997, Doyle 1998).
Jak se předcházející faktory projevují v současných vývojových schematech Za předchůdce všech cévnatých rostlin jsou vcelku objektivně považovány ryniové rostliny (Rhyniophyta) . Pohled na současnou představu o odštěpování jednotlivých skupin rostlin (obr. 3, 4) však jasně ukazuje různorodost této skupiny. Již dvě desetiletí je tradováno jejich rozčlenění na tři skupiny – Rhyniophyta, Zosterophyllophyta a Trimerophyta. Ukazuje se však, že první skupina je vlastně souborem několika paralelních větví (reprezentovaných fosilními rody jako Horneophyton, Aglaophyton, Rhynia), z nichž žádná není přímým předchůdcem recentních skupin cévnatých rostlin. Obě další skupiny ryniových rostlin se na vzniku dalších cévnatých podílejí velmi asymetricky. Zosterofylofyty daly vzniknout pouze skupině plavuní (podrobněji viz u nich), zatímco z trimerofyt vznikly veškeré další skupiny (recentních i vymřelých) cévnatých rostlin; dokazuje to řada synapomorfií, např. schopnost i jiného než vidličnatého typu větvení apod. Mechorosty nejsou přímo naším tématem; pohled na uvedený obr. 3 však dokazuje, že nepředstavují monofyletickou skupinu; tři tradované větve – jatrovky, hlevíky a mechy se oddělily v evoluci postupně. Zajímavé je i postavení ryniových rostlin rodu Horneophyton, charakteristických existencí středního sloupku ve výtrusnicích; původně se, zejména pro tento znak, považovaly za možné předchůdce mechorostů, současné schéma je však ukazuje jako nejstarší ryniovou rostlinu, stojící více méně mezi mechorosty a cévnatými.
Současná klasifikace kapraďorostů uznává základní schema oddělení plavuní (Lycopodiophyta), přesliček (Equisetophyta) a kapradin (Polypodiophyta) a členění kapradin na eusporangiátní a leptosporangiátní, liší se však od tradiční morfologické v několika bodech. Zásadní je vývojový vztah plavuně vs. ostatní kapraďorosty: zatímco tradiční systematika pojímá plavuně, přesličky i kapradiny jako 3 víceméně souběžné vývojové větve, podle současná paleobotaniky představují plavuně (Lycopodiophyta) zcela samostatnou skupinu, oddělivší se v historii podstatně dříve než ostatní kapraďorosty, a to od zcela jiné skupiny ryniových rostlin – zosterofylofytů (viz. obr. 3, 4). S nimi pojí plavuně soubor výlučných charakteristických znaků (synapomorfií): jediný výskyt tzv. mikrofylů (trvale v evoluci jehlicovitých, jednožilných listů – na rozdíl od přesliček nebo jehličnanů, u jejichž původních typů byly listy vícežilné, ploché, tzv. megafyly), žádný jiný než nejpůvodnější vidličnatý typ větvení stonku, výtrusnice v paždí listových orgánů – sporofylů. Rovněž některé znaky anatomické či vývojové jsou výlučné; příkladem může být odbočování cévních svazků do větví (či listů) bez porušení středního válce, nevytvářejí se tedy tzv. lakuny („gaps“). Dalším problémem je, co s psilotopsidy,
96 malou tropickou skupinou kapraďorostů, obývajících zejména vlhké biotopy. Byla donedávna považována za samostatné oddělení Psilotophyta a obvykle představována jako nejprimitivnější skupina kapraďorostů – zejména na základě primitivní stavby kořenů, považovaných ještě za nepravé kořeny (tzv. rhizoidy) a absence pravých listů u zástupců rodu Psilotum, kde jsou na ose vyvinuty jen výrůstky připomínající ostny (zvané enafyly), do nichž neodbočuje cévní svazek. Paleobotanické doklady o jejich existenci jsou však až z pozdního terciéru. Přesto je mnozí autoři řadili do příbuzenství ryniových rostlin, původně zvaných psilofyty – odtud podobný název Psilotum. Počátkem devadesátých let se však objevily názory, že jde o zvláštní skupinu eusporangiátních kapradin, podobnou v některých rysech, zejména stavbou podzemního gametofytu a spor, skupině Ophioglossidopsida. Ke stejnému názoru pak došla molekulární analýza těchto skupin (Pryer et al. 1995) (obr. 3). Tím se ovšem dostáváme k související otázce, co jsou podivné eusporangiátní ophioglossidopsidy? Známe ji spíše pod českými jmény rodů jako vratička (Botrychium) a jazyk (Ophioglossum) a do učebnic se občas dostávají jako nositelé rekordu v počtu chromosomů u organizmů (2n=ca 1460). Jsou izolovanou skupinou kapradin, o jejichž minulosti není mnoho známo a podobně jako u psilotopsid jsou fosilní nálezy velmi mladého data. Mnohé znaky, zejména dlouhodobý vývoj podzemního gametofytu, však hovoří pro jejich starobylost. Byly tradovány jako souběžná skupina eusporangiátních kapradin k tropickým, ve sklenících občas pěstovaným marattiopsidům, i od nich se však liší některými nápadnými znaky: jako jediná skupina kapradin mají od počátku vývoje rovně rostoucí listy, nemající typickou fázi pomalu se spirálně rozvinující čepele (tzv. circinátní vernaci). Jsou též jedinou skupinou kapradin, u nichž existují náznaky druhotného tloustnutí; to vedlo některé autory k vyslovení představy, že ophioglossidy vůbec nejsou příbuzné s kapradinami a mají možná blíže k nahosemenným rostlinám. Výše zmíněná molekulární analýza (Pryer et al. 1995) však tento názor nepotvrzuje. Při velké heterogenitě kapradin jako celku však nelze vyloučit, že s dalšími analýzami dospěje systematika k vytvoření samostatného „koše“ pro psilotopsidy a ophioglossidopsidy. Poslední nejednotně řešenou otázkou, týkající se jinak dobře vymezené skupiny leptosporangiátních kapradin, je postavení heterosporických „vodokapradin“. Nám lépe známé, časté akvarijní nepukalky (Salviniales) a méně známé marsilky (Marsileales), vytvářející jako jediné kapradiny dvojí typy výtrusů – mikrospory a megaspory, prošly ve fylogenetických „stromech“ různým postavením. Kvůli význačné morfologické odlišnosti v mnoha znacích (morfologie vegetativních orgánů, stavba sporokarpů – orgánů uzavírajících výtrusnice apod.) byly dlouho pojímány jako zcela samostatné skupiny; od sedmdesátých let dokonce převládal názor významného pteridologa Picchi-Sermolliho (Picchi-Sermolli 1977), že jde o dvě konvergentní větve, z nichž každá je příbuzná jiné skupině izosporických kapradin – jakkoli se představa dvojího vzniku široko daleko neexistující heterosporie poněkud vzpírala selskému rozumu. Molekulární analýzy vrátilily tyto úvahy na zem a jednoznačně se vyslovily pro společný původ obou těchto skupin (obr. 3).
Nahosemenné a jejich problematika byly zmíněny již v úvodu. Na rozdíl od kapraďorostů jsou sice pravděpodobně jednotného (monofyletického) původu, jejich „strom“ však představuje značné množství vývojových větví (k tomu většinou vymřelých) a je zakončen skupinou krytosemenných, jejichž vznik je stále zahalen určitým oparem neznalosti (obr. 5). Pokud bychom zůstali u recentních skupin, neměli bychom mnoho problémů – cykasy, jinany, jehličnany a liánovce (obalosemenné rostliny) jsou jednoduše charakterizovatelné skupiny rostlin. Ponoříme-li se však do minulosti, zjistíme, že s příbuzenskými vztahy je to složitější. První fosilní skupinou, uváděnou i v učebnicích nižších stupňů, jsou semenné kapradiny, nešťastně česky také nazývané rostliny lyginodendrové (Lyginodendrophyta), první rostliny s tvorbou primitivního vajíčka a semene. Otázkou však je co všechno jsou a jak dlouho existovaly semenné kapradiny? Učebnicová představa k nim řadí 4 skupiny existující v různých časových posunech od karbonu po období jury. Už u prvohorních skupin (Lyginodendron, Medullosa) však panuje velmi značná diverzifikace např. v předpokládaném průběhu oplození, v anatomii stonku či v morfologii pylu (resp. postupné přeměně spory v pylové zrno); zatímco u rodu Lyginodendron tvorba primitivního semene není podpořena dalšími atributy semenné rostliny, Medullosa již je typickou semennou rostlinou v mnoha znacích (sulkátní pylová zrna, kompletní vajíčko s otvorem klovým, kruhové uspořádání středního válce s dření uprostřed), mající mnoho shodného s cykasy. Naopak permské (Glossopteris) až jurské (Caytonia) skupiny mají již velmi složité struktury
97 v samiččích i samčích pohlavních orgánech, které jasně ukazují, že náležejí k části vývojového stromu nahosemenných, směřujícího ke krytosemennosti. Semenné kapradiny ve zde vymezeném úzkém smyslu tvoří spolu s cykasy (Cycadophyta) první, poměrně jasnou vývojovou linii nahosemenných, kterou si můžeme charakterizovat souborem znaků (tab. 1). Jádrem druhé hlavní vývojové linie nahosemenných jsou jehličnany (Pinophyta) a jim relativně blízce příbuzné prvohorní kordaity (Cordaitophyta) – viz opět soubor znaků v tab. 1. Horkým bramborem bylo vždy příbuzenské postavení jinanů, reprezentovaných v současnosti pouze živoucí fosilii Ginkgo biloba. Jsou zcela samostatnou skupinou od počátku vývoje nebo mají k některé ze dvou výše zmíněných druhově bohatších skupin nahosemenných blíže? Subjektivně lze snést znaky pro jednu i druhou variantu. V současných kladistických analýzách však jednoznačně vycházejí jako bazální skupina „jehličnanové“ vývojové větve. S jehličnany mají společnou zejména anatomii dřeva a postavení pohlavních orgánů na útvarech stonkového původu (toho jsou i tzv. semenné šupiny v šišticích jehličnanů!); naopak za konvergentní starobylý znak musíme považovat oplození pomocí pohyblivého spermatozoidu, společné cykasům a jinanům – poslední samostatný pohyb samčí pohlavní buňky v evoluci rostlin. Nejméně jasné jsou příbuzenské vztahy fosilních větví, směřujících stále komplikovanější stavbou pohlavních, zejména samiččích orgánů ke krytosemenosti. Stále je nejasné postavení jihopolokoulových glossopterisů, dominujících na konci prvohor na tehdy ještě kompaktní pevnině Gondwana: vytvářely již zmíněnou první nedokonalou ochranu vajíček polouzavřenými útvary listového původu, na druhé straně anatomií dřeva nebo platyspermií se blíží jehličnanové větvi. Bezesporně na cestě ke krytosemennosti již stojí nejmladší „semenné kapradiny“, jurské Caytoniales, s téměř uzavřenými „plodolisty“ a samčími útvary připomínajícími prašník. Kandidáty na krytosemenným rostlinám nejblíže stojící skupinu zůstávají však stále jen dvě: druhohorní bennetitové rostliny a recentní liánovce (Gnetophyta). Bennetitové rostliny jsou jedinými předchůdci krytosemenných, u nichž se vytvořil oboupohlavný orgán, odpovídající květu – na rozdíl od krytosemenných s velmi komplikovanou strukturou samčích orgánů („tyčinek“) a velmi jednoduchou stavbou orgánů samiččích („pestíku“); evoluce u krytosemenných se ubírala opačným směrem. Někteří paleobotanikové předpokládají, že bennetity a krytosemenné jsou „opačně“ se vyvíjejícími větvemi vzniklými ze společného předchůdce (Stewart et Rothwell 1993). Velmi různorodá skupina recentních liánovců (z nichž pro nás nejznámější jsou chvojníky – Ephedra) má dvoudomé, nenápadné „květy“, zcela nepodobné tradovanému primitivnímu oboupohlavnému květu typu magnolie. Setkáváme se u nich však se znaky (byť v netypických podobách) výlučnými pro krytosemenné – cévy v xylému, zárodečný vak namísto samiččího prothalia, náznak druhotného oplození. To vše je do jisté míry favorizuje, zejména když jednou z předpokládaných nejprimitivnějších skupin krytosemenných je tropická čeleď Chloranthaceae s velmi podobnými dvoudomými květy. Chybí však ukotvení v minulosti – fosilní nálezy liánovců z období vzniku prvních krytosemenných chybějí.
Krytosemenné (Magnoliophyta) jsou přes své obrovské druhové bohatství považovány za monofyletickou skupinu; tento původ krytosemených nezpochybňovala na rozdíl od nahosemenných skupin ani klasická ani současná systematika. V morfologických klasifikacích pak platilo klasické členění na třídy dvouděložných (iMagnoliopsida) a jednoděložných (Liliopsida), uvnitř nichž se ustálilo členění na několik podtříd a větší počet řádů, jen mírně se lišící v systémech dvou hlavních krytosemenných systematiků – Tachtadžjana (Tachtadžjan 1987) a Cronquista (Cronquist 1988). S těmito systematickými jednotkami se obvykle pedagog setkával v průběhu vysokoškolského studia, do učebnic středních škol však (vcelku oprávněně) nepronikly – tam trvale panuje pro praxi nejužitečnější kategorie čeledi. Na rozdíl od předcházejících skupin zde nový vítr nepřinesla paleobotanika, ale až nástup molekulární systematiky. Od roku 1993, kdy byl publikován první molekulární pohled na příbuzenské vztahy jednotlivých skupin krytosemenných (Chase et al. 1993), rostou velmi rychle informace o vzájemných příbuzenských vztazích, získávané jak analýzou dalších částí genomu, tak srovnáváním těchto informací s morfologickými znaky. Ke sjednocení pohledu na vzájemnou příbuznost jednotlivých skupin se v roce 1998 vytváří skupina badatelů APG (Angiosperm phylogeny group), která v témže roce publikovala svou klasifikaci krytosemenných (Angiosperm phylogeny group 1998). Kladogramy více či méně vycházející z této klasifikace se pak stávají
98 součástí vysokoškolských učebnic tištěných (např. Judd et al. 1999, Bremer et al. 1999) nebo internetových (Stevens 2002) (obr. 6, 7) Pravděpodobně nejnápadnějším „vkladem“ molekulární systematiky je to, že přestává platit klasické členění do dvou tříd – dvouděložných (Magnoliopsida) a jednoděložných (Liliopsida), podporované množstvím znaků nebo spíše znakových trendů. Vytvářejí se tři skupiny, obtížně směstnatelné do klasických taxonomických kategorií, takže latinská jména tříd a podtříd, uvedená dále v závorkách, jim přisuzují jen některé středoevropské učebnice (např. Ehrendorfer 1998):
Bazální dvouděložné (Magnoliopsida), jednoděložné (Liliopsida), pravé dvouděložné (Rosopsida, eu-dicots, tricolpates). Bazální dvouděložné jsou svou náplní velmi podobné tachtadžjanovské podtřídě Magnoliidae. Obsahují vesměs čeledi s tropickými nebo alespoň subtropickými kořeny, ze známějších šácholanovité (Magnoliaceae), leknínovité (Nymphaeaceae), vavřínovité (Lauraceae), podražcovité (Aristolochiaceae) nebo pepřovníkovité (Piperaceae). Morfologickou specifitou posledních dvou je výskyt společných znaků s jednoděložnými a kladistické analýzy o nich vypovídají jako o skupinách skutečně jednoděložným nejpříbuznějších. Díky velké znakové rozkolísanosti jsou bazální dvouděložné jako celek obtížně morfologicky charakterizovatelné (viz tab. 2). Náplň této skupiny je však u všech současných autorů konstantní. Problémy však nastávají, položíme-li si otázku oblíbenou i v populárních přírodovědných publikacích či pořadech:
Která je nejpůvodnější (nejprimitivnější) krytosemenná rostlina? Kladogramy vyjadřující vnitřní strukturu této skupiny se v průběhu posledního desetiletí různily a nalezli bychom ca 8 čeledí (včetně i u nás rostoucí malé vodní čeledi růžkatcovitých – Ceratophyllaceae či liánovcům podobné čeledi Chloranthaceae), jimž se této pocty dostalo. Analýzy posledních let se ustálily na exotické, monotypické čeledi Amborellaceae, která je domovem na Nové Kaledonii v Tichomoří. Přesto tuto otázku nelze mít za zcela uzavřenou; je to patrné i z toho, že některé VŠ učebnice se uchylují k variantě „hřebenového kladogramu“ (Bremer et al. 1999 – cf. obr. 6), pojímající všechny čeledi na stejné rovině příbuznosti. S jistotou je však možno říci, že bazální dvouděložné představují „podstavec“, z něhož se odštěpily obě další, vzájemně velmi dobře diferencované skupiny krytosemenných. Ačkoliv tato otázka není rovněž doposud jednoznačně vyřešena, nejčastěji jsou jako pravým dvouděložným nejblíže stojící uvažovány čeledi kolem magnoliovitých a vavřínovitých, naopak jako sesterské k jednoděložným vycházejí zejména pepřovníkovité a podražcovité; ty jsou často označovány jako „paleoherbs“ – i tento termín koresponduje s téměř výhradně bylinnými jednoděložnými. Jednoděložné si zachovávají statut monofyletické skupiny, charakterizované dostatečně i souborem morfologických znaků (tab. 2). Ani do vnitřní struktury nevnesla molekulární systematika mnoho dramatických změn. Snad je to, že bazální, nejprimitivnější recentní jednoděložnou se ukazuje puškvorec (Acorus calamus), představující pravděpodobně samostatnou vývojovou větev; druhdy řadový druh čeledi Araceae má mnoho znaků, které se u jednoděložných nevyskytují nebo jen výjimečně, a v dané kombinace vůbec ne (siličné buňky, výskyt perispermu v semenech, tzv. sekreční tapetum v prašnících apod.). Tři hlavní vývojové větve odpovídají v podstatě podtřídám Alismatidae, Liliidae a Commelinidae morfologické klasifikace. Současný stav poznání jednoznačně podporuje velkou diverzifikaci entomogamních liliidů – na řády Asparagales a Liliales a v rámci nich na množství drobných čeledí (vedle kompaktní obrovské čeledi Orchidaceae); často velmi podobné rostliny tak jsou příslušníky vzdálenějších vývojových větví (viz Tab.3). Toto členění založené na množství uchopitelných znaků (typ nektarií, anatomie semen) je relativně staršího data (poprvé Huber 1969), do učebnic a běžně užívaných příruček však pronikalo jen velmi pomalu. Největších změn doznaly vývojové vztahy uvnitř třetí hlavní skupiny krytosemenných, kterou můžeme nazvat pravé dvouděložné. Tato skupina podobně jako jednoděložné vychází jako monofyletická a odpovídá všem ostatním podtřídám tachtadžjanovského systému dvouděložných (s výjimkou Magnoliidae – viz obr. 8). Její vymezení oproti oběma předcházejícím spočívá vedle znaků molekulárních v jediném znaku dalším – trikolpátním typu pylu (odtud též označení „tricolpates“) (obr. 9). Tento znak je považován za zásadní kvalitativní skok, neboť u všech předchozích skupin tvořících pylová zrna nahosemenné nevyjímaje existuje jen sulkátní (monokolpátní) typ
99 pylu. Oddělením bazálních a pravých dvouděložných však vznikla možnost mnohem pregnantnějšího odlišení jednoděložných a pravých dvouděložných (tab. 2) – drtivá většina výjimek či přesahů v klasických znacích typu četnosti květů, anatomie středního válce apod. skončila v „podstavci“ bazálních dvouděložných. Základními skupinami vývojového „stromu“ pravých dvouděložných (jež budeme raději označovat neformálními jmény vycházejícími z označení podtříd morfologického Tachtadžjanova systému) jsou dvě velké skupiny: rosidy a asteridy. Jim vývojově předchází několik menších skupin, z nichž pro nás jsou zajímavé zejména ranunculidy, „proteidy“ a caryophyllidy. Ranunculidy jsou velmi homogenní bazální skupinou, vymezenou dobře i morfologickými znakovými trendy (mnohočetnost květních částí, specifické benzylizochinolinové alkaloidy jako sekundární metabolity) a zcela odpovídající morfologické podtřídě Ranunculidae. „Proteidy“ jsou parafyletickou skupinou převážně dřevinných čeledí, řazených předtím do zcela jiných vývojových větví. Základ tvoří skupina označovaná dříve jako „nižší hamamelidy“ (platanovité – Platanaceae a exotické východoasijské čeledi Trochodendraceae a Tetracentraceae), k nimž se druží čeleď subtropů jižní polokoule Proteaceae (v posledních létech často prodávaná i v našich luxusnějších květinářstvích) a kupodivu vodní čeleď lotosovitých (Nelumbonaceae). Kladistické analýzy molekulárních znaků nám zde předkládají (z pohledu klasické morfologické systematiky) pravděpodobně nejpodivnější sdružení čeledí. Při bližším ohledání však můžeme dospět k několika závěrům: (a) všechny čeledi se do skupin, kam byly řazeny v rámci morfologického systému, alespoň některými znaky jaksi „nehodily“; (b) dají se vysledovat i určité společné morfologické znakové trendy (jednopohlavnost květů, primitivní stavba dřeva, volné až nepravidelně srostlé pestíčky gynecea); (c) pro většinu dřevinných čeledí (Platanaceae, ale i Trochodendraceae) existují velmi staré paleobotanické doklady. První nálezy platanů jsou řazeny do stejných geologických údobí mezofytika jako nálezy prvních magnolidů. Z těchto skutečností můžeme usuzovat, že toto uskupení je tvořeno koncovými zbytky několika velmi starobylých vývojových větví, jež buď nikdy nepředstavovaly zásadní složku flóry nebo byly v průběhu vývoje potlačeny adaptivnějšími skupinami dvouděložných.
Nelze nepodotknout, že zjištěná příbuznost platanů, proteí a lotosů dostala molekulární systematiku krytosemenných dokonce do vln éteru a na stránky denního tisku. Poslední velkou skupinou před oběma hlavními poli rosid a asterid jsou caryophyllidy. Základ této skupiny tvoří tachtadžjanovská podtřída Caryophyllidae, dobře charakterizovaná znaky velké systematiky, např. odlišným typem plastidů sítkovic, odlišnými pigmenty betalainy apod. Jako u jedné z mála velkých skupin lze u tohoto základu caryophyllidů vysledovat i společnou ekologickou konstituci – vyskytují se zde bylinné, převážně suchomilné až pouštní, výrazně světlomilné čeledi, rostoucí nejraději na místech s malou konkurencí ostatních rostlin (Cactaceae, kosmatcovité - Aizoaceae, merlíkovité - Chenopodiaceae, většina hvozdíkovitých – Caryophyllaceae). Kladistická molekulární analýza sem však řadí navíc skupinu masožravých čeledí, vzájemně blízce příbuzných (rosnatkovité – Droseraceae, láčkovkovité – Nepenthaceae) a v caryophyllidech téměř nepatřičnou dřevinnou čeleď tamariškovitých (Tamaricaceae). Opět jde o skupiny v morfologických systémech nepříliš pevně ukotvené, přesto však je jejich postavení i vzájemná příbuznost překvapující. Jako podpůrný argument blízké příbuznosti zde pokulhává i masožravost – tato vlastnost jistě vznikla v evoluci více než jednou (viz např. bublinatky – Utriculariaceae). Komentovat obrovské vývojové stromy rosidů a asteridů v krátkosti nelze. Zaměřím se zde proto jen na (1) několik na několik shrnujících poznatků a (2) několik příkladů odlišně pojímaného příbuzenství v morfologické a molekulární systematice. Obě skupiny (a) jsou charakterizovatelné větším počtem morfologickch znakových trendů (v květních poměrech, embryologických znacích, anatomii semen či fytochemicky hlavními typy vytvářených sekundárních metabolitů); platí to zejména u pokročilejších asterid; (b) mají relativně (druhově) máločetné bazální skupiny (soubory čeledí, řády), u nichž výše zmíněná morfologická znaková podpora platí jen zčásti. (c) Ve srovnání s morfologickou klasifikací se hlavní vývojové větve liší relativně málo (obr. 10) a většinou jde o pochopitelný „přesun“ z koncové pozice nižší (mladší) vývojové větve do bazální pozice vyšší (pokročilejší) vývojové větve. Příkladem mohou být čeledi prvosenkovitých (Primulaceae) a vřesovcovitých (Ericaceae), jež morfologická systematika řadila na konec středně pokročilé větve dillenidů a v rámci stávající klasifikace tvoří jednu z výše zmíněných bazálních větví asteridů.
100
Přes tato kontstatování jsou některé příbuzenské vztahy velmi překvapivé. Markantním případem je skupina rosidů, kde se v rámci jedné vývojové linie sešly i v morfologických systémech spojované entomogamní řády bobokvětých (Fabales) a růžokvětých (Rosales) s anemogamní skupinou našich listnatých dřevin (řád bukokvětých – Fagales) a liánami (často jednoletými) řádu tykvokvětých (Cucurbitales). Pravděpodobně zásadním znakem v rámci tohoto příbuzenství je (různě rozvinutá) schopnost fixovat vzdušný dusík, která je však nápadná a tradovaná pouze u bobovitých. Druhým příkladem je evidentní příbuznost řádů miříkokvětých (Apiales) a složnokvětých (Asterales) v rámci asteridů; Apiales představovaly donedávna koncovou větev středně pokročilých rosidů (ve smyslu Tachtadžjana). Pravděpodobně blízká příbuznost, jíž se morfologická klasifikace bránila, byla však již delší dobu zdůrazňována fytochemiky – obě skupiny tvoří sekundární metabolity typu polyacetylenů a seskviterpenů; a rovněž tendence k vytváření biologických květů u miříkovitých, kde listenové obaly a obalíčky jsou obdobou zákrovu složnokvětých, je nabíledni. „Nepatřičným“ znakem v rámci pokročilých asteridů jsou nesrostlé korunní lístky; podle studia raných ontogenetických stadií vývoje květu se však i u miříkovitých zakládají korunní lístky srostlé a jejich „volnost“ je v podstatě sekundární. Obecně je možno říci, že současné výsledky kladistických molekulárních analýz se téměř nedotkly homogenity a náplně jednotlivých čeledí krytosemenných; tato kategorie byla zjevně vymezena již v minulosti velmi přirozeně. Snad jedinou výjimku najdeme v rámci asteridů: před očima se nám rozpadla a se sousedními čeleděmi propletla i v učebnicích občas zmiňovaná čeleď krtičníkovitých (Scrophulariaceae). Ve vysokoškolských učebnicích se záhy setkáme se 3 známými jmény čeledí, ovšem se zcela odlišnou náplní (tab. 4). Při podrobnějším pohledu však opět nejde o výsledek až tak překvapivý: čeleď zárazovitých (Orobanchaceae) shromažďuje veškeré rody poloparazitické a parazitické, zatímco ostatním dvěma čeledím tento znak zcela chybí. Pro zúženou čeleď krtičníkovitých (z našich divizna – Verbascum a krtičník – Scrophularia) jsou specifické srostlé prašné váčky; ty jsou známy už dávno, avšak nikdo nepřikládal tomuto znaku zásadní hodnotu. V nejroztodivnější čeledi jitrocelovitých (Plantaginaceae) se pak s převážně anemogamními jitrocely setkává zbytek zcela autotrofních krtičníkovitých.
Co říci závěrem: stojíme asi na prahu skutečně objektivního poznání vývojových vztahů rostlin i všech dalších organismů; přes záplavu informací z molekulárních i dalších analýz však musíme říci, že víme stále málo: v některých byť podivných příbuzenských vztazích nás další poznatky utvrdí, některé možná odvane čas. Takže snad jen dva pokusy o zobecnění a na závěr jeden standardní paradox. (1) morfologický, subjektivní fylogenetický systém nebyl v zásadě nikterak špatný; převážná většina změn v postavení čeledí či vyšších skupin nastala tam, kde jejich postavení v systému nebylo „pevné“; (2) Stahují se mraky nad klasickou taxonomickou hierarchií; i středoevropan, byť nerad, se bude muset smířit s faktem, že nad kategorií řádu začíná oblast symbolických, neformálních označení. (3) Čím více poznatků, tím méně jistot aneb jen moudřejší umí říci nevím: povšimněme si na nejnovějším shrnujícím kladogramu krytosemenných (obr. xx) označení „unplaced“; skrývají čeledi či skupiny čeledí, s jejichž ukotvením si nevíme rady. to by se v klasickém morfolgickém systému nemohlo stát!
Literatura Angiosperm Phylogeny Group (1998): An ordinal classification for the families of flowering plants. – Ann. Missouri Bot. Gard. 85:531-553. Bremer K. et. al. (1999): Introduction to phylogeny and systematics of flowering plants. – Uppsala Univ. (učební text). Chase M. et al. (1993): Phylogenetics of seed plants: An analysis of nucleotide sequences from the plastid gene rbcL.- Ann. Missouri Bot. Gard. 80:528-580. Cronquist A. (1988): The evolution and systematics of flowering plants. Ed. 2. – New York Bot. Garden Doyle J. (1998): Phylogeny of vascular plants. – Annu. Rev. Ecol. Syst. 29:567-599. Ehrendorfer F. (1998): Evolution und Systematik. – In: Strasburger Lehrbuch der Botanik für Hochschulen, ed. 34, P. 459-819. – Gustav Fischer Stuttgart. Judd W.S. et. al. (1999): Plant systematics. – Sinauer Inc., Sunderland, Mass. Kenrick P. et Crane P. R. (1997): The origin and early diversification of land plants: a cladistic study. – Smithsonian Institut, Washington. Picchi-Sermolli R.E. G. (1977): Tentanem Pteridophytorum genera in taxonomicum ordinem redigendi. – Webbia (Firenze) 31:313-512.
101 Pryer K. et al. (1995): Phylogenetic relationships of extant ferns based on evidence from morphology and rbcL sequences. – Amer. Fern. J. 85:205-282. Stevens P. (2002): Angiosperm phylogeny site. – http://www.mobot.org/MOBOT/research/Apweb/ Stewart W.N. et Rothwell G. W. (1993): Paleobotany and the evolution of plants. – Cambridge Univ. Press Tachtadžjan A. (1987): Sistěma magnoliofitovych. – Nauka, Leningrad.
Tab. 1 - Vývojově důležité rozlišovací znaky dvou hlavních skupin nahosemenných „Gymnospermae I“ semenné kapradiny, cykasy
„Gymnospermae II“ jinany, jehličnany, kordaity
____________________________________
____________________________________
manoxylické dřevo (sekundární dřevo pórovité pyknoxylické dřevo s bohatým dřevním parenchymem) sekundárního xylému)
(kompaktní
s
převahou
velké listy původně se zpeřenou žilnatinou
tendence k redukci listů → jednožilné žilnatina původně vějířovitá až souběžná
tyčinky se srůstajícími mikrosporangii › synangia
tyčinky se 2-více mikrosporangii, která nesrůstají
vajíčka na okraji megasporofylů
vajíčka stopkatá ›› přisedlá na semenných šupinách (útvarech stonkového původu)
v principu entomogamie (u cykasů)
striktní anemogamie
radiospermie – vajíčka a semena s radiální symetrií
platyspermie – vajíčka a semena zploštělá, bisymetrická
102 Tab. 2 - Hlavní rozlišovací znaky tří základních skupin (tříd) krytosemenných
Rosopsida
Magnoliopsida
(„pravé dvouděložné")
Liliopsida
(„basální dvouděložné")
2 dělohy
2 dělohy
trikolpátní
pyl sulkátní
(jednoděložné)
1 děloha pyl pyl sulkátní
eustélé, často kambium eustélé (ale i více kruhů ataktostélé, kambium 0 →ataktostélé), kambium + nebo 0 radikula→hlavní kořen radikula→hlavní kořen radikula zaniká → nebo adventivní kořeny adventivní kořeny listy celistvé až složené listy velké, celistvé. listy celistvé, se obvykle se zpeřenou nejčastěji se síťnatou souběžnou žilnatinou nebo síťnatou žilnatinou žilnatinou řapík→0, často pochva palisty častěji volné
palisty 0 nebo srůstají
palisty 0
květy převážně cyklické květy spirocyklické nebo 5(4)četné → redukce cyklické a pak obvykle 3 četné
květy obvykle cyklické, 3četné → redukce
nektaria z C nebo žláznaté disky
nektaria jako speciální orgán vzácně
nektaria často septální
endosperm málo → 0 perisperm zřídka
endosperm hojně, často i perisperm
endosperm dosti hojně perisperm výjimečně
plastidy sítkovic S-typu plastidy sítkovic S-typu, (škrob) nebo P2-typu řidčeji Prtypu (bílkovinné vlákno) (bílkovinné krystaly)
plastidy sítkovic P1-typu
první listy na úžlabní větvi 2 v transversále > dřeviny
první list na úžlabní větvi 1 v mediáně > byliny
první list na úžlabní větvi většinou 1 v mediáně dřeviny i byliny
103 Tab. 3 – Současná diverzifikace řádů Asparagales a Liliales na drobné čeledi (uvedeny pouze ty, které jsou zastoupeny nebo častěji pěstovány v naší květeně Asparagales Liliales Asparagaceae Trilliaceae Convallariaceae Melanthiacceae Anthericaceae Colchicaceae Asphodelaceae Liliaceae Hemerocallidaceae Hostaceae Hyacinthaceae Alliaceae Amaryllidaceae Iridaceae Orchidaceae ___________________________________________________________________________ Tab. 4 – Současné členění krtičníkovitých (Scrophulariaceae) a příbuzných čeledí na základě molekulárních analýz 1. Plantaginaceae (incl. Scrophulariaceae p.p., Callitrichaceae, Globulariaceae, Hippuridaceae) tj. naše rody Plantago, Veronica, Linaria, Antirrhinum, Gratiola, digitalis, Mimulus, Callitriche,
Globularia, Hippuris 2. Scrophulariaceae (incl. Buddlejaceae) tj. rody Verbascum, Scrophularia, Buddleja 3. Orobanchaceae (incl. Scrophulariaceae poloparazitické rody) tj. rody Orobanche, Pedicularis, Euphrasia, Odontites, Bartsia, Melampyrum, Rhinanthus
104
Obr. 1 – Monofyletické a parafyletické pojetí taxonů na příkladu plazů a ptáků
105
Obr. 2 – Pleziomorfie a apomorfie na příkladu fylogenetického postavení rodů Ranunculus (pryskyřník) a Adonis (hlaváček): synapomorfie vymezují (charakterizují) rody – jsou společné pro všechny druhy rodu (tj. pro všechny potomky společného předka); naopak sympleziomorfie rody nevymezují, jsou společné všem rodům čeledi.
106
Obr. 3 – Současný pohled na základní fylogenetické vztahy vyšších rostlin (zejména mechorostů, ryniových rostlin a kapraďorostů, s ukotvením semenných rostlin); vyobrazeny a označeny jsou některé základní synapomorfie společné další části kladogramu (Doyle 1998).
Vysvětlení některých označení: Bryo – mechorosty; Lycopsids – plavuně; Psilophyton – nejznámějši trimerofyt; Ligno – semenné rostliny; Ferns – kapradiny; Filicales – leprtosporangiátní kapradiny.
107
Obr. 4 – Základní fylogenetické vztahy vyšších rostlin – schematizace
Obr. 5 – Fylogenetické vztahy hlavních vývojových větví nahosemenných
108
Obr. 6 – Vývojové schema krytosemenných založené na morfologických a vybraných molekulárních znacích (Bremer et al. 1999)
109
Obr. 7 – Současný vývojový kladogram hlavních skupin krytosemenných (Stevens 2002)
110
Obr. 8 – Dvouděložné – schema vztahů podtříd podle Tachtadžjana (1987)
111
Obr. 9 – Sulkátní (a) a trikolpátní (b) pylové zrno (Ehrendorfer 1998)
112
Obr. 10 – Hlavní změny v rámci pravých dvouděložných, odlišující Tachtadžjanovo a současné molekulární schema vztahů hlavních skupin
113
PODZIMNÍ ŠKOLA 2002
OBSAH SBORNÍKU
1.
Z.Samec :Elektrochemie-palivové články.............................................................1
2.
Rikard von Unge : Teorie strun...........................................................................15
3.
V.Kožich : Dědičné metabolické poruchy – model genetické nemoci. ..............19
4.
M.Lokajíček : Urychlené hadrony v léčbě nádorových onemocnění..................29
5.
M.Bednář : Teleportace a kvantová kryptografie................................................42
6.
J.Pačes :Bioinformatické nástroje pro studium lidského genomu.......................62
7.
J.Pacák : Chemické názvosloví. ..........................................................................69
8.
P.Heinzel : Procesy na Slunci. ............................................................................75
9.
Vl.Dvořák : Mražené světlo. ...............................................................................77
10.
T.Ruml : HIV nepřítel nebo pomocník, aneb od AIDSke genovým terapiím. ...90
11.
L.Hrouda : Systematika rostlin. ..........................................................................94
Praha říjen 2002