Teorie čísel
Nerozuměl jsem všemu. Ale to, čemu jsem porozuměl, mně nahánělo hr˚ uzu z toho, čemu jsem nerozuměl. F.X. Šalda
Obsah Obsah
1
1
Prvočísla
4
1.1
Prvočísel je nekonečně mnoho . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.2
Rozložení prvočísel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.3
Mertensovy věty
1.4
Počty dělitelů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2
3
4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Trocha algebry
20
2.1
Grupy, okruhy, tělesa - základní pojmy . . . . . . . . . . . . . . . . . . . . 20
2.2
Dělitelnost v oborech integrity . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3
Okruhy polynom˚ u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4
Konstrukce těles a tělesové automorfismy . . . . . . . . . . . . . . . . . . . 26
Něco o polynomech
30
3.1
Polynomy nad C a nad R . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2
Polynomy nad Q a nad Z . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3
Cyklotomické polynomy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4
Symetrické polynomy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Algebraická číselná tělesa
39
4.1
Algebraická čísla, minimální polynom . . . . . . . . . . . . . . . . . . . . . 39
4.2
Vlastnosti množiny algebraických čísel . . . . . . . . . . . . . . . . . . . . 41
4.3
Algebraická číselná tělesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4
Izomorfizmy těles Q(α) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.5
Tělesový polynom, norma, stopa . . . . . . . . . . . . . . . . . . . . . . . . 51
4.6
Příklady algebraických číselných těles . . . . . . . . . . . . . . . . . . . . . 53
1
5
6
7
8
9
10
Diofantické rovnice
56
5.1
Kvadratická rezidua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.2
Lineární diofantické rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.3
Pythagorejské trojice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.4
Součet dvou čtverců
5.5
Součet čtyř čtverců . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.6
Pellova rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Diofantické aproximace
72
6.1
Fareyovy zlomky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.2
Řetězové zlomky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.3
Aproximace sblíženými zlomky . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.4
Řetězový zlomek kvadratických čísel . . . . . . . . . . . . . . . . . . . . . 83
6.5
Aplikace řetězových zlomk˚ u pro diofantické rovnice . . . . . . . . . . . . . 87
Transcendentní čísla
92
7.1
Liouvilleova čísla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.2
Transcendentnost Eulerova čísla e . . . . . . . . . . . . . . . . . . . . . . . 96
7.3
Transcendentnost čísla π . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7.4
Řetězový zlomek Eulerova čísla e . . . . . . . . . . . . . . . . . . . . . . . 102
Okruh celých čísel v číselném tělese
106
8.1
Algebraická celá čísla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.2
Integrální báze okruhu celých čísel
8.3
Hledání integrální báze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8.4
Integrální báze v cyklotomických tělesech . . . . . . . . . . . . . . . . . . . 114
. . . . . . . . . . . . . . . . . . . . . . 108
Dělitelnost a faktorizace v okruhu celých čísel
118
9.1
Jednotky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
9.2
Jednotky v kvadratických tělesech . . . . . . . . . . . . . . . . . . . . . . . 119
9.3
Prvočísla, ireducibilní prvky, faktorizace . . . . . . . . . . . . . . . . . . . 121
9.4
Faktorizace v kvadratických tělesech . . . . . . . . . . . . . . . . . . . . . 125
Aplikace algebraických těles
131
10.1 Řešení diofantických rovnic . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
2
10.2 Lucas-Lehmerův test prvočíselnosti . . . . . . . . . . . . . . . . . . . . . . 136 10.3 Konstrukce pomocí kružítka a pravítka . . . . . . . . . . . . . . . . . . . . 138 10.4 Nekomutativní tělesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 Literatura
148
3
1
Prvočísla
1.1
Prvočísel je nekonečně mnoho
V množině přirozených čísel, kterou budeme značit N = {1, 2, 3, . . .}, mají úlohu stavebních kamen˚ u prvočísla. Za prvočíslo považujeme to přirozenné číslo, které má právě dva různé dělitele, a to jedničku a sebe sama. Množinu prvočísel značíme P = {2, 3, 5, 7, . . .}. Mezi prvočísla tedy neřadíme jedničku. Proto platí věta, kterou budeme mnohokrát využívat: každé přirozené číslo n > 1 lze jednoznačně až na pořadí zapsat jako součin prvočísel. Že je pvočísel nekonečně mnoho, věděli lidé odedávna. První rigorózní d˚ ukaz lze nalézt v Eukleidových základech. Důkaz. Předpokládejme, že konečný seznam p1 , p2 , . . . , pr obsahuje všechna prvočísla. Označme n = p1 p2 . . . pr + 1. Zřejmě n není v seznamu. Protože číslo n není dělitelné žádným prvočíslem ze seznamu, je n bud’ samo prvočíslo, nebo je n dělitelné prvočíslem, které není v seznamu – spor s tím, že seznam p1 , p2 , . . . , pr vyčerpal všechna prvočísla. Jiný d˚ ukaz nekonečnosti množiny P pochází z dopisu Christiana Goldbacha Leonhardu Eulerovi z roku 1730. Důkaz. Uvažujme posloupnost Fermatových čísel definovaných vztahem n
Fn = 22 + 1 pro n = 0, 1, 2, . . .
(1.1)
Speciálně F0 = 3 a F1 = 5. Indukcí dokážeme, že pro n ≥ 1 platí n−1 Y
Fk = Fn − 2 .
(1.2)
k=0
Pro n = 1 je tvrzení pravdivé, protože F0 = 3 = F1 − 2. Pro n > 1 využijeme indukční předpoklad a m˚ užeme psát n Y k=0
Fk =
³n−1 Y
´ ´ ¡ 2n ¢ ¡ 2n ¢ ³ 2n+1 Fk Fn = (Fn − 2)Fn = 2 − 1 2 + 1 = 2 − 1 = Fn+1 − 2 .
k=0
4
Vztah (1.2) spolu s lichostí Fn implikuje, že každá dvě r˚ uzná Fermatova čísla Fk a Fn jsou nesoudělná. Tedy prvočísla nacházející se v rozkladu Fk a Fn jsou navzájem r˚ uzná. Protože Fermatových čísel je nekonečně, je nekonečně i prvočísel. Množinu prvočísel lze uspořádat podle velikosti do ostře rostoucí posloupnosti (pn )n∈N , tedy p1 = 2, p2 = 3, p3 = 5, p4 = 7, . . . Z Goldbachova důkazu plyne, že n-té prvočíslo pn je menší než Fn−1 . Máme tedy první odhad na velikost prvočísla n−1
pn ≤ 22
+ 1.
Jak častý je výskyt prvočísel mezi přirozenými čísly bude vystihovat posloupnost π(n) = #{p ≤ n | p ∈ P} . Nekonečnost množiny P lze v tomto značení zapsat limn→∞ π(n) = +∞. Následující věta pocházející od Eulera odhaduje rychlost r˚ ustu π(n) a jejím přímým d˚ usledkem je opět d˚ ukaz nekonečnosti P. Věta 1.1. Pro počet π(n) prvočísel nepřevyšujících n platí π(n) ≥ ln n − 1. Důkaz. Využijeme odhadu Z
n
ln n = 1
n−1 Z k n−1 X X X1 1 1 1 dx = dx ≤ ≤ , x x k k k−1 k=1 k=1 k∈M
kde M = {m ∈ N | m má v rozkladu pouze prvočísla menší nebo rovna n}. Označme r = π(n). Pak prvek M lze napsat ve tvaru m = pα1 1 pα2 2 . . . pαr r pro nějaká αi ≥ 0. Tedy m˚ užeme upravit +∞ X +∞ +∞ r X +∞ r X X Y Y X1 1 1 pi = ... = = . α α1 α2 i αr k p p . . . p p p − 1 i 1 2 r i α =0 α =0 α =0 i=1 α =0 i=1 k∈M 1
r
2
Využijeme toho, že funkce
x x−1
i
je pro x ≥ 2 klesající a jednoduchého odhadu pi ≥ i + 1.
Celkově dostaneme ln n ≤
r Y i+1 i=1
i
= r + 1 = π(n) + 1 .
5
Když do předchozí věty za n dosadíme k-té prvočíslo, dostaneme ln pk ≤ 1 + π(pk ) = 1 + k , a tedy pk ≤ ek+1 , což je lepší odhad pro velikost pk než z Goldbachova d˚ ukazu. Že i tento horní odhad je P velice nadsazený věděl už Euler, který dokázal divergenci p∈P p1 . D˚ ukaz sporem, který uvedeme, pochází od Erdöse z roku 1938. Věta 1.2. Řada
P
1 p∈P p
diverguje.
P Důkaz. Předpokládejme, že řada p∈P p1 konverguje. Podle Bozanova Cauchyova kritéria P existuje přirozené k takové, že i≥k+1 p1i < 12 . Tedy X N N < pi 2 i≥k+1
pro každé N ∈ N.
(1.3)
Pro tuto chvíli budeme prvočísla p1 , p2 , . . . , pk nazývat malá a prvočísla pk+1 , pk+2 , . . . velká. Pro zvolené N ∈ N označme Ns velikost množiny těch přirozených čísel n ≤ N , která jsou dělitelná pouze malými prvočísly, a Nb velikost množiny těch přirozených čísel n ≤ N , která mají za dělitele alespoň jedno velké prvočíslo. Podle definice je N = Ns +Nb . Spor bude spočívat v tom, že odvodíme Ns + Nb < N . Počet n ≤ N , které jsou dělitlné velkým prvočíslem pi je b N c. Proto je podle (1.3) pi Nb ≤
X jN k N < . p 2 i i≥k+1
Nyní odhadneme Ns . Každé n lze napsat jako n = an b2n , kde an je čtvrcuprosté přirozené číslo. Je-li n dělitelné pouze malými prvočísly, je an součinem r˚ uzných malých prvočísel. Proto pro vytvoření an máme maximálně 2k možností. Na druhé straně b2n ≤ n ≤ N , a √ tedy bn nabývá nanejvýš N hodnot. Proto je √ Ns ≤ 2k N . Celkově máme
√ N + 2k N pro každé N ∈ N. 2 √ Spor dostaneme, když zvolíme N tak, aby 2k N ≤ N2 . Např. volba N = 22k+2 vyhovuje. N = N s + Nb <
Divergence
P
1 p∈P p
znamená, že množina, přes kterou sčítáme, je nekonečná. Dali jsme
tak další d˚ ukaz nekonečnosti P. Existuje však celá řada dalších d˚ ukazů. 6
1.2
Rozložení prvočísel
Prvočísla nejsou v přirozených číslech rozmístěna nijak pravidelně. Pro libovolné n ∈ N lze najít úsek n po sobě jdoucích přirozených čísel, z nichž žádné není prvočíslo: (n + 1)! + 2, (n + 1)! + 3, (n + 1)! + 4, . . . , (n + 1)! + n + 1 Tedy mezery mezi sousedními prvočísly mohou být libovolně velké. Na druhé straně už v antice byla vyslovena hypotéza, že existuje nekonečně mnoho prvočíselných dvojčat, tedy nekonečně mnoho takových prvočísel p, že také p + 2 je prvočíslo. Takové dvojčata jsou např. pár 11 a 13, pár 17 a 19, pár 41 a 43, atd. Počítačové experimenty potvrzují zmíněnou hypotézu, ale dokázat se jí zatím nikomu nepodařilo. Fakt, že v úseku přirozených čísel začínajícím n natrefíme na prvočíslo dříve, než dojdeme k číslu 2n, pozoroval první Joseph Bertrand. On také toto tvrzení, dnes nazývané Bertrandův postulát, empiricky ověřil pro n < 3.106 . První důkaz pochází z roku 1850 od Pafnutija Čebyševa. Důkaz, který později uvedeme, pochází od Paula Erdöse z roku 1932. Před tím však odvodíme několik důležitých tvrzení. Věta 1.3 (Legendre). Prvočíslo p ∈ P se nachází v rozkladu čísla n! právě Xjnk krát. k p k≥1 Důkaz. Tvrzení plyne z faktu, že mezi čísly 1, 2, 3, . . . , n je právě b np c násobků čísla p, právě b pn2 c násobků čísla p2 , právě b pn3 c násobků čísla p3 , atd. D˚ usledek 1.4. Prvočíslo p ∈ P se nachází v rozkladu kombinačního čísla
¡2n¢ n
nanejvýš
r krát, kde r = max{r | pr ≤ 2n}. Důkaz. Z Legendreovy věty plyne, že prvočíslo p se nachází v rozkladu čísla právě
¡2n¢ n
=
(2n)! (n!)2
j n k´ X ³j 2n k − 2 krát. pk pk k≥1
Pro libovolné reálné x > 0 je b2xc−2bxc bud’ 0 nebo 1. Proto lze sumu odhadnout počtem nenulových sčítanců. Pro index k, pro který je pk > 2n, je sčítanec sumy nulový. Lemma 1.5. Pro každé n ∈ N, n ≥ 2 platí Y
p ≤ 4n−1 .
p∈P,p≤n
7
Důkaz. D˚ ukaz provedeme indukcí. Pro n = 2 a n = 3 tvrzení platí. Pro n > 3 najdeme největší prvočíslo q ≤ n. Zřejmě je q liché, tj. q = 2m + 1 a Y
p
p∈P, p≤n
Číslo
¡2m+1¢ m
=
Y
=
p
=
p
p∈P p≤m+1
p∈P p≤2m+1
(2m+1)(2m)(2m−1)...(m+2) m!
Y
Y
·
p.
(1.4)
p∈P m+1
je celé. Přitom prvočíslo p, pro nějž m < p ≤ 2m+1,
se vysytuje pouze v čitateli zlomku, a ne ve jmenovateli. Tedy takové p se určitě vyskytne ¡ ¢ v rozkladu 2m+1 na prvočísla. Proto m Y
µ p ≤
p∈P m+1
2m + 1 m
¶ 1 2
≤
2m+1 Xµ k=0
2m + 1 k
¶ = 22m .
(1.5)
Využitím indukčního předpokladu na (1.4) a odhadu (1.5) dostaneme Y
p
=
p∈P, p≤n
Y
p
≤ 4m · 22m ≤ 4n−1 .
p∈P p≤2m+1
Věta 1.6. Pro každé přirozené číslo n existuje prvočíslo p takové, že n < p ≤ 2n . Důkaz. Nejdříve dokážeme větu pro n < 4000. Uvažujme posloupnost těchto 14 prvočísel q1 , . . . , q14 : 2, 3, 5, 7, 13, 23, 43, 83, 163, 317, 631, 1259, 2503, 4001 . Každé následující je menší než dvojnásobek předchozího prvočísla. Libovolné n < 4000 leží mezi nějakými dvěma sousedními prvočísly z této posloupnosti, t.j. qi < n ≤ qi+1 < 2qi < 2n. K d˚ ukazu věty pro n ≥ 4000 budeme odhadovat číslo
¡2n¢ n
. Protože je to největší číslo
ve 2n-tém řádku Pascalova trojúhelníku, lze jej zdola odhadnout takto µ ¶ ¶ 2n µ 2n 1 X 2n 4n . ≥ = n 2n k=0 k 2n Necht’ pα1 1 pα2 2 . . . pαs s je rozklad
¡2n¢ n
(1.6)
na prvočísla. Využijeme tří pozorování, které plynou
z d˚ usledku (1.4). • pαi i ≤ 2n pro každé i. 8
• Prvočíslo p >
√
2n se v rozkladu
¡2n¢ n
nachází nanejvýš jednou.
• Prvočíslo p splňující 23 n < p ≤ n se v rozkladu Proto
µ
¶ Y 2n ≤ 2n n p∈P
Y
·
¡2n¢ n
p
nenachází v˚ ubec.
·
p∈P √ 2n
√ p≤ 2n
Y
p
(1.7)
p∈P n
Větu dokážeme sporem. Předpokádejme, že mezi n a 2n neexistuje žádné prvočíslo. Kombinací odhad˚ u (1.6), (1.7) a lemmatu 1.5 dostaneme √ 2 4n ≤ (2n) 2n 4 3 n 2n
=⇒
Srovnáním rychlosti r˚ ustu posloupností n,
2n ≤ 3(1 + √
√
2n)(1 + ln2 n) .
(1.8)
n a ln2 n je na první pohled vidět, že poslední
nerovnost pro velká n neplatí. Abychom dostali spor, potřebujeme však dokázat, že ”velká” n jsou v našem případě všechna n ≥ 4000. Za tímto účelem definujeme funkce √ g(x) = 2x a f (x) = 3(1 + 2x)(1 + ln2 x). Nyní stačí ověřit, že g(4000) > f (4000) a g 0 (x) > f 0 (x) pro x > 4000. Tuto úlohu ze základní analýzy přenecháme čtenáři. D˚ usledek 1.7. Existuje konstanta A taková, že všechny členy posloupnosti ¹ Aº ¥ A ¦ j 2A k j 22A k 22 2 , 2 , 2 , 22 ,... jsou prvočísla. Důkaz. Definujme posloupnost (qn ) rekurzivně: q1 = 2 a qn+1 jako nejmenší prvočíslo větší než 2qn . Z Bertrandova postulátu tedy plyne 2qn < qn+1 < 21+qn . Mohli jsme použít dvě ostré nerovnosti, protože prvočíslo qn+1 není sudé, a tedy 1 + qn+1 ≤ 21+qn . Ani v této nerovnosti nemůže však nastat rovnost. Jelikož 1 + qn je pro n > 1 sudé číslo, řekněme 1 + qn = 2k, znamenala by rovnost 1+qn+1 = 21+qn , že qn+1 = 21+qn −1 = (2k −1)(2k +1). To je v rozporu s prvočíselnosti qn+1 . Platí proto 2qn < qn+1 < 1 + qn+1 < 21+qn . Zlogaritmujme se základem 2 předchozí nerovnost n + 1 krát. (Pro n krát interovaný (n)
logaritmus použijeme značení ln2 .) Dostaneme (n)
(n+1)
ln2 qn < ln2
(n+1)
qn+1 < ln2
9
(n)
(1 + qn+1 ) < ln2 (1 + qn )
(1.9)
¡ (n) ¢ ¡ (n) ¢ Posloupnost ln2 qn je ostře rostoucí a posloupnost ln2 (1+qn ) je ostře klesající. Proto ¡ (n) ¢ posloupnost ln2 qn má konečnou limitu, označme ji A. Z nerovností (1.9) dostaneme (n)
(n)
ln2 qn < A < ln2 (1 + qn ) . Zpětným n násobným odlogaritmováním pak qn < 2 2
A .2 ..
< 1 + qn .
Aplikováním funkce celá část na poslední nerovnost odvodíme, že posloupnost uvedená ve tvrzení věty, je posloupnost prvočísel (qn ). Poznámka 1.8. Zobecnění Bertrandova postulátu představuje následující tvrzení: ¡
¢¡ ¢¡ ¢¡ ¢¡ ¢ ∀ε > 0 ∃n0 ∀n > n0 , n ∈ N ∃p ∈ P n < p < (1 + ε)n .
Jinými slovy pro dostatečně velké n lze najít prvočíslo mezi n a (1 + ε)n. Bez odpovědi je zatím slavný problém, zda mezi n2 a (n + 1)2 leží vždycky alespoň jedno prvočíslo.
Asymptotické chování π(n) počtu prvočísel nepřevyšujících n dlouho odolávalo matematik˚ um. Už Gauss předpověděl, že lim
n→∞
π(n) n ln n
= 1,
kde ln je logaritmus se základem e. Nejdříve se podařilo Čebyševovi ukázat, že kdyby limita nalevo existovala, pak by to byla jednička. Existenci této limity, a tedy poslední krok v důkazu, udělali v roce 1896 nezávisle na sobě dva francouzští matematici Hadamard a de la Valleé-Poussin. Jejich důkaz je komplikovaný a využívá aparát komplexní analýzy. My dokážeme elementárními prostředky slabší tvrzení. Věta 1.9. Existují kladné konstanty a, b ∈ R takové, že a
n n < π(n) < b . ln2 n ln2 n
¡ ¢ Důkaz. Kombinační číslo 2n neobsahuje ve svém rozkladu prvočísla větší než 2n. Proto n ¡2n¢ α π(2n) lze napsat n = pα1 1 pα2 2 . . . pπ(2n) pro αi ∈ {0, 1, 2, . . .}. Z definice kombinačního číslo
10
plyne, že prvočíslo p > n a p ≤ 2n se nachází v rozkladu
¡2n¢ n
právě jednou. Na druhé
straně, z důsledku 1.4 získáme pro každý index i nerovnost pαi i ≤ 2n. Proto µ ¶ Y 2n απ(2n) π(2n)−π(n) n ≤ ≤ (2n)π(2n) . p ≤ = pα1 1 pα2 2 . . . pπ(2n) n p∈P
(1.10)
n+1≤p≤2n
Předchozí odhady zkombinované s odhadem 2n ≤
¡2n¢ n
≤ 22n dávájí dva důležité vztahy
2n ≤ (2n)π(2n)
(1.11)
nπ(2n)−π(n) ≤ 22n .
(1.12)
a
Zlogaritmovaním (1.11) a po jednoduché úpravě odvodíme n ≤ π(2n) ln2 (2n)
=⇒
1 2n ≤ π(2n) . 2 ln2 (2n)
V případě sudé proměnné bychom tak mohli vzít za konstantu a zlomek
1 . 2
Pro liché
hodnoty využijeme toho, že π(n) ln2 n je rostoucí posloupnost. 2n + 1 ≤ n ≤ π(2n) ln2 (2n) ≤ π(2n + 1) ln2 (2n + 1) 3 ⇓ 1 2n + 1 ≤ π(2n + 1) . 3 ln2 (2n + 1) Dolní odhad na π(n) ve větě bude platit pro sudé i liché n zároveň, když položíme a = 13 . Zlogaritmovaním (1.12) odvodíme ¡ ¢ π(2n) − π(n) ln2 n ≤ 2n
=⇒
π(2n) ln2 (2n) − π(n) ln2 n ≤ 2n + π(2n) ≤ 4n . (1.13)
Definujme pro i = 0, 1, 2, . . . čísla Ai := π(2i ) ln2 (2i ). Podle (1.13) pro členy této posloupnosti platí Ai+1 − Ai ≤ 4 · 2i
pro každé i = 0, 1, 2, . . .
Sečtením předchozích nerovností pro i = 0, . . . , k − 1 dostaneme Ak ≤ 4
k−1 X
2i = 4(2k − 1) ≤ 4 · 2k .
i=0
Uvažujme nyní libovolné n. Najdeme k ∈ N tak, aby 2k−1 < n ≤ 2k . Opět využijeme, že π(n) ln2 n je rostoucí posloupnost. Proto π(n) ln2 n ≤ π(2k ) ln2 (2k ) = Ak ≤ 4 · 2k = 8 · 2k−1 < 8n . Za konstantu b lze tedy položit b = 8. 11
Zatím jsme ukázali, že k-té prvočíslo pk je menší než ek+1 . Předchozí věta nám umožní daleko lépe vystihnout růst pk . D˚ usledek 1.10. Existují konstanty c a d takové, že pro k-té prvočíslo platí c k ln2 k < pk < d k ln2 k . Důkaz. Použijeme nerovnost z předchozí věty na k-té prvočíslo n = pk . Dostaneme a pk ≤ k ln2 pk ≤ b pk . Když využijeme, že k < pk , dostaneme dolní odhad k ln2 k ≤ b pk . Stačí tedy položit c = b−1 . Na druhé straně platí pk ≤ a−1 k ln2 pk
(1.14)
a po zlogaritmovaní ln2 pk ≤ ln2 k + ln2 ln2 pk − ln2 a . Od jistého k počínaje lze odhadnout ln2 pk ≤ ln2 k + 2 ln2 ln2 pk ≤ ln2 k + 12 ln2 pk
=⇒
ln2 pk ≤ 2 ln2 k
Dosazením do (1.14) získáme od jistého k pk ≤ 2a−1 k ln2 k .
1.3
Mertensovy věty
Čebyševovy výsledky byly podnětem pro Mertensovy asymptotické formule, které pocházejí z roku 1874. Věta 1.11. Existuje konstanta K taková, že pro každé n ∈ N platí ln n − K ≤
X ln p p p∈P,p≤n
≤ ln n + K .
Důkaz. Označme r := π(n) a využijme rozkladu n! = pα1 1 pα2 2 . . . pαr r . Podle věty 1.3 je αi = b pni c+b pn2 c+. . .+b pnqi c, kde qi je největší takové celé číslo, že pqi i ≤ n. Zlogaritmovaním i
dostaneme
i
µj k j k r j n k¶ X n n + 2 + . . . + qi ln n! = ln pi . pi pi pi i=1 12
(1.15)
Odhadněme ln n! shora: ¶ µ r r X X 1 1 1 1 + 2 + . . . + qi ln pi ≤ n ln pi . ln n! ≤ n p p p p − 1 i i i i i=1 i=1 S použitím ln p ln p ln p ln p 1 = + ≤ + √ p−1 p p(p − 1) p p p m˚ užeme pokračovat v odhadu +∞ X ln p X 1 √ . + n p k k p∈P,p≤n k=2
ln n! ≤ n Protože
+∞ X k=2
Z
1 √
+∞
<
k k
1
je celkově
1 √ dx = 2 , x x
X ln p + 2n . p p∈P,p≤n
ln n! ≤ n
(1.16)
Odhadujme (1.15) zdola: r j k r r r X X X X n ln pi ln pi ln n! ≥ ln pi ≥ n − ln pi ≥ n − r ln n . p p p i i i i=1 i=1 i=1 i=1
Písmenem r bylo označeno π(n). Proto r ≤ b ln 2 jsme tak dolní odhad
n , ln n
kde b je konstanta z věty 1.9. Získali
X ln p − n b ln 2 . p p∈P,p≤n
ln n! ≥ n
(1.17)
K zakončení d˚ ukazu potřebujeme ještě nerovnosti nn ≥ n! >
³ n ´n e
.
(1.18)
Jedna z těchto nerovností je zřejmá, druhou lze snadno odvodit matematickou indukcí, když si vzpomeneme, že
µ
1 1+ n
¶n < e.
Indukční krok má tvar µ µ ¶n+1 ¶n ³ ´ ³ n ´n n+1 1 1 n n = (n + 1) 1 + > (n + 1) > (n + 1)n! e n e e e Zkombinováním odhadu (1.17) a zlogaritmované nerovnosti (1.18) dostaneme X ln p − n b ln 2 , p p∈P,p≤n
n ln n ≥ ln n! ≥ n
13
což po zkrácení faktorem n je už část tvrzení dokazované věty. Podobně z (1.16) a (1.18) získáme nerovnost X ln p + 2n , p p∈P,p≤n
n(ln n − 1) ≤ ln n! ≤ n kterou opět lze zkrátit faktorem n.
Věta 1.12. Existuje konstanta C taková, že pro každé n ∈ N platí ln ln n − C ≤
X 1 ≤ ln ln n + C . p p∈P,p≤n
Důkaz. Připomeňme nejdříve Abelovou sumační formuli. Jsou daná čísla a1 , a2 , . . . , an a b1 , b2 , . . . , bn . Pro i = 1, 2, . . . , n označme Bi := a1 + a2 + . . . + ai . Pak platí n X
ai bi = an Bn +
n−1 X
i=1
(ai − ai+1 )Bi
i=1
Opět položíme r = π(n) a aplikujme sumační formuli na ai =
1 ln pi
a bi =
ln pi . pi
Podle věty
1.6 je pi ≥ 12 pi+1 . Pro Bi proto z věty 1.11 platí ln pi+1 − ln 2 − K ≤ ln pi − K < Bi :=
i X ln pk k=1
pk
≤ ln pi + K .
M˚ užeme tedy odhadnout shora r r r−1 ³ X X ¢ X 1 1 ln pi 1 1 ¡ 1 ´ = ≤ ln pr + K + − (ln pi + K) = p ln pi pi ln pr ln pi ln pi+1 i=1 i i=1 i=1 r−1
X 1 ¡ ¢ K = +1+ ln pi+1 − ln pi . ln p1 ln pi+1 i=1 Jelikož funkce
1 x
je pro kladná x klesající, lze odhadnout
¢ 1 ¡ ln pi+1 − ln pi = ln pi+1
Z
ln pi+1 ln pi
1 dx ≤ ln pi+1
Z
ln pi+1 ln pi
1 dx = ln ln pi+1 − ln ln pi . x
Ted’ dokončíme horní odhad r X K K 1 ≤ + 1 + ln ln pr − ln ln p1 ≤ + 1 − ln ln 2 + ln ln n . p ln p1 |ln 2 {z } i=1 i =:C1
Pro dolní odhad r r−1 ³ r X X ¢ X 1 ¡ 1 1 ´ 1 ln pi 1 = ≥ ln pr − K − ln 2 + − (ln pi+1 − K − ln 2) p ln pi pi ln pr ln pi ln pi+1 i=1 i=1 i=1 i
14
= − Monotonie funkce
r−1 X ¢ K 1 ¡ ln pi+1 − ln pi . + ln 2 ln pi i=1
1 x
poskytne s využitím integrálu dolní odhad na sčítance sumy Z ln pi+1 ¢ 1 ¡ 1 ln pi+1 − ln pi ≥ dx = ln ln pi+1 − ln ln pi . ln pi x ln pi
Celkově dostaneme r ³K ´ X 1 K + ln ln pr − ln 2 ≥ − + ln 2 + 1 + ln ln n . ≥ − p ln 2 } | ln 2 {z i=1 i =:C2
Pro poslední nerovnost jsme použili, že z Bertrandova postulátu plyne n ≥ pπ(n) ≥ n2 , a pak jednoduchý vztah ln ln n2 > ln ln n − 1. Abychom dostali tvrzení věty stačí položit C = max{C1 , C2 }. Poznámka 1.13. Větě 1.11 se říká první Mertensova věta. Věta 1.12 je slabší formou tzv. druhé Mertensovy věty. My jsme dokázali omezenost posloupnosti X 1 − ln ln n . p p∈P,p≤n Jemnějšími metodami lze dokonce dokázat, že tato posloupnost má limitu β = 0.26149 . . .. Někdy se pod pojmem druhá Mertensova věta rozumí formule Y³
1−
1 p
´−1
= eγ ln n + O(1) ,
p≤n
kde γ je Eulerova konstanta γ = lim
n7→+∞
n X 1 k=1
k
− ln n .
Tato formule implikuje větu 1.12.
1.4
Počty dělitelů
Počet všech dělitelů čísla n budeme značit τ (n), počet prvočíselných dělitelů čísla n budeme značit ω(n). Formálně τ (n) =
X
1
a
d∈N, d|n
ω(n) =
X
1.
p∈P, p|n
Určit hodnotu τ (n) a ω(n) je snadné, když známe rozklad n na prvočísla: n = pα1 1 pα2 2 . . . pαk k
=⇒
τ (n) = (α1 + 1)(α2 + 1) . . . (αk + 1) a ω(n) = k 15
(1.19)
Vztah (1.19) mimo jiné říká, že funkce τ (n) je multiplikativní a ω(n) aditivní, tj. τ (mn) = τ (m)τ (n) a ω(mn) = ω(m) + ω(n)
pro nesoudělná m a n .
Věnujme se nejdříve funkci τ (n). S rostoucím n se funkce τ (n) chová velice nepravidelně; zřejmě lim inf τ (n) = 2
a
lim sup τ (n) = +∞
Zajímavé je, že průměrnou hodnotu τ (n) m˚ užeme popsat dobře. Věta 1.14. Pro průměrnou hodnotu počtu dělitelů prvních n přirozených čísle platí n 1 X τ (k) = ln n + 2γ − 1 + εn , n k=1
kde γ je Eulerova konstanta a lim εn = 0. Důkaz. Použijeme geometrickou interpretaci τ (k) =
X
1=
X
1.
uv=k
d|k
pomocí celočíselné mřížky v rovině. Počet bodů (u, v) ∈ N × N, které leží na hyperbole Pn xy = k, je právě τ (k). Tedy suma k=1 τ (k) je rovna počtu mřížkových bodů (u, v) ležících v prvním kvadrantu pod hyperbolou nebo na hyperbole xy = n. Rozdělme tyto body do tří skupin: 1. 1 ≤ u ≤ 2. 1 ≤ u ≤ 3. 1 ≤ v ≤
√ √ √
n a 1≤v≤ n ,
n ,
√ √
n
√
n;
a uv ≤ n ;
n < u a uv ≤ n .
√ Bodů v první skupině je b nc2 . Bod˚ u ve druhé skupině je X ³j n k √ ´ − b nc = u √
1≤u≤ n
X jnk √ − b nc2 u √
1≤u≤ n
a ze symetrie je stejný počet i bodů ve třetí skupině. Proto je celkový počet bodů n X k=1
τ (k) = 2
X jnk X ³ n n n o´ ¡√ √ √ ¢2 − b nc2 = 2 − − n − { n} = u u u √ √
1≤u≤ n
1≤u≤ n
X nno √ √ √ 2 1 = 2n − n + 2 n{ n} − { n} − 2 u √ u √ 1≤u≤ n 1≤u≤ n | {z } zbytek X
16
√ Zbytek je v absolutní hodnotě nanejvýš 1 + 2 n. Pro průměrnou hodnotu počtu dělitelů tak platí
n X 1 1 X zbytek τ (k) = 2 − 1 − . n k=1 n √ u 1≤u≤ n
Tvar průměru, který uvádí věta, dostaneme, když využijeme, že z definice Eulerovy konstanty γ plyne 2
X
√ 1≤u≤ n
¡ √ ¢ 1 = 2 ln n + γ + δn = ln n + 2γ + 2δn , u
kde lim δn = 0. Věta 1.15. Pro průměrnou hodnotu počtu prvočíselných dělitelů prvních n přirozených čísel platí
n 1 X ω(k) = ln ln n + γn , n k=1
kde (γn ) je omezená posloupnost. Důkaz. n X1 1X 1 X 1 Xj n k 1 X 1 Xn n o 1 = 1 = ω(k) = = − . n k=1 n n n p≤n p p n p≤n p p≤n k≤n, p|k
p≤n, p|k
Podle věty 1.9 je
1 Xn n o 1X b ≤ 1 ≤ . n p≤n p n p≤n ln2 n P K ukončení důkazu věty už stačí aplikovat na sumu p≤n p1 druhou Mertensovu větu. 0 ≤
Kapitolu uzavřeme slavným výsledkem Hardyho a Ramanujana z roku 1920. Ten říká, že většina čísel k z množiny 1, 2, . . . , n má ω(k) blízké hodnotě ln ln n. Důkaz, který předvedeme, pochází od P. Turána (1934). Jeho důkaz se často uvádí jako demonstrace účinnosti pravděpodobnostních metod v kombinatorice. Abychom se vyhnuli odkazům na teorii pravděpodobnosti, vyslovíme nejdříve dvě technická lemmata. Čtenář obeznámený s pravděpodobností ve druhém z nich snadno rozpozná Čebyševovu nerovnost. Lemma 1.16. Existuje konstanta K taková, že pro každé n ∈ N platí n X ¡
¢2 ¡ ¢2 ω(k) ≤ n ln ln n + Kn ln ln n .
k=1
17
Důkaz. V celém důkazu budou proměnné p a q prvočísla, proměnné k a n jsou přirozenná čísla. n X X¡ X X ¢ X¡ X ¢¡ X ¢ ¡ ¢2 ω(k) = 1 1 = 1+ 1 = k=1
k≤n
=
p|k
XX
k≤n
q|k
1+
pq≤n pq|k p6=q k≤n
X
pq|k p6=q
Xj n k
ω(k) =
pq≤n p6=q
k≤n
p|k
pq
+ n (ln ln n + γn ) .
Pro druhou rovnost bylo podstatné, že dvě různá prvočísla p a q dělí k, právě když součin pq dělí k. V poslední rovnosti jsme využili tvrzení věty 1.15, kde γn je omezená posloupnost. K důkazu lemmatu ted’ postačí ukázat, že V :=
Xj n k pq≤n p6=q
pq
¡ ¢2 ≤ n ln ln n + αn ln ln n + βn
(1.20)
pro nějaké konstanty α a β. Odhadujeme V shora a využijeme větu 1.12: V =
Xj n k pq≤n p6=q
pq
≤ n
³X 1 ´2 X 1 X 1 ¡ ¢2 ≤ n ln ln n + C . ≤ n = n pq pq p pq≤n p,q≤n p≤n p6=q
Nerovnost (1.20) je splněna pro α = 2C a β = C 2 . Lemma 1.17. Necht’ S je konečná podmnožina N a f reálná funkce definovaná na S. Necht’ µ a t jsou reáná čísla, t > 0. Pak počet prvků k ∈ S takových, že |f (k) − µ| ≥ t , nepřesáhne číslo
¢2 1 X¡ f (k) − µ . 2 t k∈S
Důkaz. Z nerovnosti |f (k) − µ| ≥ t plyne nerovnost 1 ≤ #{k ∈ S | t ≤ |f (k) − µ|} =
X
1 =
k∈S |f (k)−µ|≥t
(f (k)−µ)2 . t2
Proto
X (f (k) − µ)2 ¢2 1 X¡ ≤ f (k) − µ . 2 2 t t k∈S k∈S
|f (k)−µ|≥t
Věta 1.18 (Hardy, Ramanujan). Pro každé kladné δ je 1 © ª # k ≤ n | (ln ln n) 2 +δ ≤ |ω(k) − ln ln n| lim n→∞ n
18
= 0.
Důkaz. Z lemmatu 1.17 aplikovaného na funkci f (k) = ω(k), množinu S = {1, 2, . . . , n}, 1
čísla µ = ln ln n a t = (ln ln n) 2 +δ získáme odhad 1 © ª # k ≤ n | (ln ln n) 2 +δ ≤ |ω(k) − ln ln n| n
≤
´2 X³ 1 ω(k) − ln ln n . n(ln ln n)1+2δ k≤n (1.21)
Stačí ukázat, že limita zlomku na pravé straně nerovnosti je nula. Upravme čitatele zlomku s použitím lemmatu 1.16 a věty 1.15. Dostaneme X³ k≤n
´2 X ¡ X X¡ ¢2 ¢2 ω(k) + ln ln n ≤ ω(k) − ln ln n = ω(k) − 2 ln ln n k≤n
k≤n
k≤n
¡ ¢ ≤ n (ln ln n)2 + Kn ln ln n − 2 ln ln n n ln ln n + nγn + n (ln ln n)2 = (K − 2γn )n ln ln n , kde K je konstanta a γn je omezená posloupnost. Proto limita pravé strany nerovnosti (1.21) je nula, jak jsme chtěli ukázat.
19
2
Trocha algebry
V této kapitole připomeneme definice základních pojmů z teorie grup a těles, se kterými budeme pracovat. Bez důkazu uvedeme věty, které jsou náplní každého základního kurzu algebry. Dokazovat budeme věty méně obvyklé nebo ty, jejichž d˚ ukazy jsou z pohledu dalšího použití v našem textu ilustrativní. Pod pojmem binární operace na množině M rozumíme zobrazení ◦ kartézského součinu M × M do M . Operace ◦ je asociativní, když x ◦ (y ◦ z) = (x ◦ y) ◦ z pro každé x, y, z ∈ M ; komutativní, když x ◦ y = y ◦ x pro každé x, y, z ∈ M .
2.1
Grupy, okruhy, tělesa - základní pojmy
Definice 2.1. Množinu G spolu s asociativní binární operací ◦ na G nazveme grupou, pokud: • v G existuje neutrální prvek e, tj. takový, že x ◦ e = x pro každé x ∈ G, • ke každému x ∈ G existuje inverzní prvek y ∈ G, tj. takový, že x ◦ y = e. Je-li navíc operace ◦ komutativní, nazýváme G komutativní nebo Abelovou grupou. Někdy se pro operaci ◦ používá symbol +, v tom případě se neutrální prvek značí 0 a inverznímu prvku k prvku x se říká opačný a značí se −x. Takovému zápisu grupy se říká aditivní. Jindy operaci ◦ značíme symbolem ×, pak se pro neutrální prvek používá 1 a inverzní prvek k prvku x se značí x−1 . Takovému zápisu grupy se říká multiplikativní a znak pro operaci × se vynechává, jak je to zvykem u běžného násobení. Příklad 2.2. Množina {0, 1, . . . , n − 1} s operací + mod p je grupa pro každé n ∈ N. Tato grupa je komutativní a značí se Zn . Vybavíme-li množinu {1, . . . , n − 1} operací × mod p, získáme grupa, právě když n ∈ P. Definice 2.3. Grupa G1 s operací ◦1 je izomorfní s grupou G2 s operací ◦2 , pokud existuje bijekce π : G1 7→ G2 taková, že π(x ◦1 y) = π(x) ◦2 π(y) pro každé x, y ∈ G1 . 20
Zobrazení π se nazývá izomorfizmem grup G1 a G2 . Příklad 2.4. G1 = {0, 1, 2, 3} s operací + mod 4 je izomorfní grupě G2 = {1, 2, 3, 4} s operací × mod 5. Snadno se ověří, že π : G1 7→ G2 dané předpisem π(0) = 1 , π(1) = 2 , π(2) = 4 , π(3) = 3 vyhovuje předchozí definici. Definice 2.5. Množinu R se dvěma asociativními binárními operacemi + a × nazýváme okruhem, pokud R s operací + je komutativní grupa s neutrálním prvkem 0 a operace + a × jsou svázány distributivním zákonem, tj. (x + y) × z = x × z + y × z
a z × (x + y) = z × x + z × y pro všechna x, y, z ∈ R .
Okruh R se nazývá obor integrity1 , pokud • operace × je komutativní, • x × y = 0 implikuje x = 0 nebo y = 0, pro každé x, y ∈ R, • v R \ {0} existuje neutrální prvek vzhledem k operaci ×; tento prvek značíme 1. Nejtypičtějším příkladem oboru integrity jsou celá čísla Z. Pojmy jako dělitelnost a prvočísla, známé z oboru celých čísel, lze zobecnit na libovolný obor integrity, jak připomeneme v sekci 2.2. Definice 2.6. Okruh R s operacemi + a ×, pro který je R \ {0} s operací × grupa, se nazývá těleso. Je-li operace × komutativní, nazýváme R komutativním tělesem. Příklad 2.7. Množina {0, 1, 2 . . . , p−1} s operacemi + mod p a × mod p je komutativním tělesem pro každé prvočíslo p. Vžilo se, že toto těleso se značí Zp , tedy stejně jako jeho aditivní grupa. Tato nejednoznačnost pojm˚ u však nepůsobí žádné problémy.
2.2
Dělitelnost v oborech integrity
Definice 2.8. V oboru integrity R řekneme, že y dělí x, jestliže existuje z ∈ R takové, že x = yz. Tento vztah značíme y|x. Prvky x, y ∈ R jsou asociované v R, jestliže x|y i y|x, zapisujeme x ∼ y. O prvku u ∈ R řekneme, že je jednotka v R, jestliže u ∼ 1. Množinu jednotek oboru integrity R značíme U (R). 1
Obvykle se v definici oboru integrity nepožaduje existence neutrálního prvku vzhledem k operaci ×. Těmto obecnějším oborům integrity se zde však nevěnujeme.
21
Protože každá jednotka u dělí jednotkový prvek 1, tj. 1 = uv pro nějaké v ∈ R, je u v R invertovatelné a prvek v m˚ užeme značit v = u−1 . Snadno lze ukázat, že U (R) je multiplikativní grupa. Je také vidět, že dva prvky x, y ∈ R jsou asociované, pokud existuje jednotka u ∈ U (R) tak, že x = uy. Je zřejmé, že relace ∼ je ekvivalence a bylo by tedy možné obor R faktorizovat na třídy této ekvivalence a pracovat pouze s reprezentanty jednotlivých tříd. To je vhodné například pro okruhy polynom˚ u, jak uvidíme dále. Definice 2.9. Nenulový prvek x ∈ R \ U (R) se nazývá ireducibilní v R, jestliže pro každé y, z ∈ R platí, že x = yz implikuje y ∈ U (R) nebo z ∈ U (R). Nenulový prvek x ∈ R\U (R) se nazývá prvočíslo v R, jestliže pro každé y, z ∈ R platí, že x|yz implikuje x|y nebo x|z. Zřejmě platí, že každý prvek asociovaný s ireducibilním prvkem je ireducibilní a každý prvek asociovaný s prvočíslem je prvočíslo v R. Příklad 2.10. V oboru integrity Z je grupa jednotek dvouprvková, U (Z) = {±1}. Asociované jsou tedy vždy jen prvky x a −x. Ireducibilními v Z jsou právě všechna prvočísla. V obecném oboru integrity lze dokázat, že každé prvočíslo v R je ireducibilní v R. Implikaci ovšem nelze obecně obrátit, jak uvidíme na příkladech dále v textu. Věta 2.11. Všechna prvočísla v R jsou ireducibilní v R. Důkaz. Nechť x je prvočíslo v R. Předpokládejme, že x = yz pro nějaké y, z ∈ R. Pak ale x|yz a z prvočíselnosti plyne x|y nebo x|z. Jestliže x|y, pak z x = yz máme y|x, a proto x ∼ y. Snadno nahlédneme, že pak z ∼ 1, a tedy z ∈ U (R). Lze vyslovit r˚ uzné postačující podmínky pro to, aby implikace v předchozí větě šla obrátit. Jednou z nich je vlastnost jednoznačné faktorizace. Definice 2.12. Obor integrity R nazveme Gauss˚ uv, jestliže pro každý nenulový prvek x ∈ R \ U (R) existují ireducibilní prvky y1 , . . . , yr ∈ R tak, že x = y1 · · · yr , a navíc platí, že je-li x = z1 · · · zs , pak r = s a yi ∼ zπ(i) pro nějakou permutaci π množiny {1, 2, . . . , r}. Gaussovy obory integrity se někdy nazývají obory jednoznačné faktorizace. Jednoznačná faktorizace zaručuje existenci největšího společného dělitele libovolného páru nenulových prvk˚ u v oboru R, který je jednoznačný až na ekvivalenci ∼. Jednoznačná faktorizace platí například v okruzích hlavních ideál˚ u.
22
Definice 2.13. Množina I ⊂ R je ideál v oboru integrity R, pokud x + y ∈ I pro všechna x, y ∈ I a navíc x × y ∈ I, pro každé x ∈ I, y ∈ R. Ideál generovaný jedním prvkem, tj. tvaru I = xR, kde x ∈ R, se nazývá hlavní a značí se (x). Jestliže všechny ideály v R jsou hlavní, pak o R řekneme, že to je okruh hlavních ideál˚ u. u, pak je R Gauss˚ uv Věta 2.14. Nechť R je obor integrity. Je-li R okruh hlavních ideál˚ obor. Opačná implikace opět obecně neplatí, i když ve speciálním případě číselných obor˚ u, kterými se budeme zabývat v tomto textu, jsou oba pojmy ekvivalentní. Ještě speciálnějším typem obor˚ u integrity jsou obory Eukleidovy. V těch platí pravidla dělitelnosti velmi obdobná těm, které známe z oboru celých čísel Z. Definice 2.15. Obor integrity R se nazývá Eukleid˚ uv, jestliže existuje funkce φ : R \ {0} 7→ N s následujícími vlastnostmi: (i) pro každé nenulové x, y ∈ R platí, že x|y implikuje φ(x) ≤ φ(y); (ii) pro každé nenulové x, y ∈ R existuje z, w ∈ R takové, že x = yz + w, přičemž buď w = 0 nebo φ(w) < φ(y). Věta 2.16. Nechť R je obor integrity. Je-li R Eukleid˚ uv, pak je okruhem hlavních ideál˚ u. Speciálně je i Gauss˚ uv, a každý ireducibilní prvek v R je prvočíslem v R. V oboru celých čísel jsou dobře známy dva postupy hledání největšího společného dělitele čísel a, b ∈ Z, který existuje, protože Z je Gaussův obor. Jeden z postup˚ u využívá rozkladu a i b na prvočísla. Hledání rozkladů je časově náročné a pro mnohamístná a, b v podstatě nemožné. Druhý, mnohem rychlejší algoritmus využívá vlastnosti nsd(a, b) = nsd(a − b, b), a tím převádí úlohu na čísla s menší absolutní hodnotou. V Z totiž absolutní hodnota hraje roli funkce φ z definice Eukleidova oboru. Práce v Eukleidových oborech je tedy příjemnější.
2.3
Okruhy polynom˚ u
Necht’ R je okruh. Výraz f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 ,
ai ∈ R ,
se nazývá (formální) polynom nad R. Když n je nejvyšší takový index, že an 6= 0, pak řekneme, že f je polynom stupně n, značíme stf = n. Když ai = 0 pro všechna i, pak 23
f je nulový polynom, a pro něj stupeň nedefinujeme. Koeficient an polynomu stupně n nazýváme vedoucí koeficient f . Je-li an = 1, nazveme f monický polynom. Na množině polynom˚ u zavádíme operaci sčítání po složkách, tj. je-li f (x) = an xn + · · · + a0 ,
g(x) = bm xm + · · · + b0 ,
a bez újmy na obecnosti m ≤ n, pak položíme bm+1 = bm+2 = · · · = bn = 0 a (f ± g)(x) = (an ± bn )xn + · · · (a1 ± b1 )x + a0 ± b0 . Součin polynom˚ u f, g je polynom (f g)(x) =
m+n X
c k xk ,
kde
ck = a0 bk + a1 bk−1 + · · · + ak b0 =
k=0
X
ai bj .
i+j=k
Množina polynom˚ u nad okruhem R s těmito operacemi tvoří okruh, který značíme R[x]. M˚ užeme postupovat indukcí a definovat i polynomy více proměnných, které budou tvořit okruh R[x1 , . . . , xm ] = (R[x1 , . . . , xm−1 ])[xm ], jehož prvky lze zapsat ve tvaru X
f (x1 , x2 , . . . , xm ) =
ak1 k2 ...km xk11 x2k2 · · · xkmm , kde ak1 k2 ...km ∈ R .
k1 ,k2 ,...,km
Všechny pojmy zavedené v sekci 2.2 lze zkoumat i pro tuto množinu, protože platí následující věta. u R[x1 , . . . , xm ], kde m ∈ N, je Věta 2.17. Je-li R obor integrity, pak i okruh polynom˚ obor integrity. Až do konce sekce 2.3 se zaměříme na okruhy T [x], kde T je komutativní těleso. Pro ně totiž platí následující věta. u T [x] je Eukleid˚ uv obor. Roli Věta 2.18. Je-li T komutativní těleso, pak okruh polynom˚ funkce φ : T [x] 7→ N hraje stupeň polynomu, φ(f ) = stf , pro f ∈ T [x]. Pro okruh T [x] tedy m˚ užeme tedy vyslovit větu o dělení se zbytkem. Věta 2.19 (o dělení polynom˚ u). Necht’ f, g ∈ T [x], a necht’ g je nenulový polynom. Pak existují jednoznačně určené polynomy q, r ∈ T [x] tak, že f = qg + r, přičemž r je bud’ nulový polynom nebo str < stg. Úlohu jednotek v okruhu T [x] hrají konstantní polynomy a ∈ T \ {0}, polynomy f a g jsou asociované f ∼ g, jestliže f = ag. Někdy je vhodné pracovat pouze s třídami 24
ekvivalence ∼ a z každé z nich vybrat jako reprezentanta jediný monický polynom, který se v třídě nachází. Protože T [x] je Eukleid˚ uv obor, splývají pojmy ireducibilního prvku a prvočísla, a to jsou v T [x] právě polynomy ireducibilní nad T . Definice 2.20. Polynom h ∈ T [x] kladného stupně se nazývá ireducibilní nad T , jestliže jej nelze rozložit na součin h = f g, kde f, g ∈ T [x] a platí stf < sth, stg < sth. V obecném Gaussově okruhu je rozklad na ireducibilní prvky jednoznačný až na pořadí a násobení jednotkou. Ve Větě o jednoznačné faktorizaci na ireducibilní polynomy m˚ užeme přidat podmínku, že hledané ireducibilní polynomy jsou monické. Věta 2.21. Necht’ f je monický polynom kladného stupně nad tělesem T . Pak existují monické polynomy g1 , . . . , gk ∈ T [x] ireducibilní nad T tak, že f = g1 g2 · · · gk . Polynomy g1 , . . . , gk jsou určeny jednoznačně až na pořadí. Připomeňme formální definici největšího společného dělitele dvou polynom˚ u. Abychom vyloučili nejednoznačnost z d˚ uvodu násobení konstantou, požadujeme od nsd(f, g) monickost. Definice 2.22. Necht’ f, g jsou nenulové polynomy nad tělesem T . Monický polynom h ∈ T [x] nazveme největší společný dělitel polynom˚ u f , g, jestliže • h|f a h|g, ˜ ∈ T [x] takový, že h|f ˜ a h|g, ˜ dělí h. • každý polynom h Takový polynom značíme h = nsd(f, g). Snadno ověříme, že nsd(f, g) = nsd(f − qg, g) pro každý polynom q ∈ T [x]. Jako d˚ usledek máme následující tvrzení, které nám bude několikrát užitečné. Věta 2.23. Necht’ f, g jsou nenulové polynomy nad tělesem T . Pak existují polynomy u, v ∈ T [x] tak, že uf + vg = nsd(f, g). Důkaz. Větu dokážeme indukcí na součet stupň˚ u polynom˚ u f a g. Bez újmy na obecnosti předpokládejme, že oba polynomy jsou monické. Pokud stf + stg = 0, znamená to, že f (x) = g(x) = 1. Potom nsd(f, g) = 1 a lze volit u(x) = 1 a v(x) = 0. Nechť nyní stf + stg > 0 a bez újmy na obecnosti stf ≥ stg. Pak buď g|f , a tedy nsd(f, g) = g a volíme u(x) = 0 a v(x) = 1. Nebo g 6 |f , a proto existují polynomy q a r takové, že f = qg + r, přičemž str < stg. Protože str + stg < stf + stg, z indukčního 25
předpokladu existují polynomy u˜, v˜ tak, že u˜r + v˜g = nsd(r, g). Protože platí nsd(f, g) = nsd(f − qg, g) = nsd(r, g), a proto nsd(f, g) = nsd(r, g) = u˜r + v˜g = u˜(f − qg) + v˜g = u˜f + (˜ v − u˜q)g . Za polynomy u, v lze tedy volit u = u˜ a v = v˜ − u˜q.
2.4
Konstrukce těles a tělesové automorfismy
Definice 2.24. Necht’ T s operacemi + a × je těleso a K ⊂ T . Pokud K s operacemi + a × zúženými na K je také těleso, pak K nazýváme podtělesem tělesa T . Na těleso T pak lze nahlížet jako na vektorový prostor nad tělesem K. Dimenzi tohoto vektorového prostoru značíme [T : K]. Příklad 2.25. Reálná čísla R jsou podtělesem komplexních čísel C; čísla 1 a i tvoří bázi C nad R. Proto je [C : R] = 2. Rovněž je Q podtělesem R. V tomto případě je [R : Q] = +∞. Věta 2.26. Necht’ K je podtěleso tělesa L s [L : K] < +∞ a necht’ L je podtěleso tělesa M s [M : L] < +∞. Pak [M : K] = [M : L][L : K] . Důkaz. Označme [L : K] = n a [M : L] = m. Necht’ e1 , e2 , . . . , en ∈ L je báze L nad K a necht’ f1 , f2 , . . . , fm ∈ M je báze M nad L. Snadno lze ověřit, že soubor vektorů ei fj ∈ M pro i = 1, 2, . . . , n a j = 1, 2, . . . , m tvoří bázi vektorového prostoru M nad K. Tělesa, se kterými běžně pracují všechny oblasti matematiky, jsou nekonečná tělesa Q, R, C a konečná tělesa Zp , pro provočíslo p. Připomeneme si postup, jak konstruovat i další tělesa. Věta 2.27. Necht’ T je komutativní těleso a f ∈ T [x] je ireducibilní polynom stupně n. Definujme M := {g ∈ T [x] | stg < n} a operace ⊕ a ⊗ na M takto: součet g1 ⊕ g2 je definovaný stejně jako v okruhu polynomů T [x], součin definujeme g1 ⊗ g2 := zbytek po dělení polynomu g1 g2 polynomem p . Pak množina M s operacemi ⊕ a ⊗ je těleso. Budeme jej značit T [x]/f .
26
Důkaz. Kvůli vlastnostem okruhu T [x] je důkaz této věty jednoduchý. Uzavřenost na operace ⊕ a ⊗ je zřejmá, zrovna tak jako platnost distributivního zákona a existence opačného prvku k prvku g vzhledem k ⊕. Pro existenci inverzního prvku k nenulovému prvku g ∈ M vzhledem k ⊗ využijeme Větu 2.23, podle které najdeme polynomy u a v tak, že ug + vf = nsd(g, p). Protože při konstrukci požadujeme iraducibilitu polynomu f , je nsd(g, f ) = 1, a proto je zbytek po dělení součinu polynomů ug roven 1. Z konstrukce T [x]/f je jasné, že T je podtěleso nového tělesa T [x]/f . Proto má smyslu otázka na dimenzi vektorového prostoru T [x]/f nad T . Jelikož polynomy 1, x, x2 , . . . , xn−1 jsou lineárně nezávislé nad T a lze z nich pomocí koeficientů z T nakombinovat libovolný prvek v M , dostaneme následující tvrzení. D˚ usledek 2.28. Necht’ T je komutativní těleso a f ∈ T [x] je ireducibilní polynom stupně n. Pak
£
T [x]/f : T ] = n .
Příklad 2.29. Když uvažujeme ve větě 2.27 těleso R a nad ním ireducibilní polynom f (x) = x2 + 1, dostaneme těleso R[x]/f , jehož prvky jsou polynomy stupně nanejvýš 1, tj. tvaru a + xb, kde a, b ∈ R. Když místo písmenka x použijeme pro proměnnou písmenko i dostaneme obvyklý zápis tělesa komplexních čísel C. Předchozí příklad demonstruje, že tělesa C a R[x]/f jsou stejná, jenom jejich prvky různě zapisujeme. Formalizujme tento vágní pojem „stejnosti”. Definice 2.30. Bijektivní zobrazení ψ : T1 7→ T2 tělesa T1 s operacemi +1 a ×1 na těleso T2 s operacemi +2 a ×2 se nazývá izomorfizmus, pokud ψ(x +1 y) = ψ(x) +2 ψ(y) a ψ(x ×1 y) = ψ(x) ×2 ψ(y)
pro každé x, y ∈ T1 .
Pokud jsou si tělesa T1 a T2 rovny, nazýváme ψ automorfizmem tělesa T = T1 = T2 . Množina automorfizmů tělesa spolu s operací skládání zobrazení tvoří grupu, tu budeme značit Aut T . Poznámka 2.31. Když zvolíme v okruhu Zp [x] dva ireducibilní polynomy f a g stejného stupně n, pak lze dokázat, že tělesa Zp [x]/f a Zp [x]/g jsou izomorfní. Proto prvočíslo p a stupeň polynomu n určují těleso až na izomorfizmus jednoznačně. Takové těleso má pn prvků a zapisuje se GF (pn ), bez udání konkrétního polynomu. To však není obecným pravidlem. Jak uvidíme v kapitole o algebraických tělesech, pro tělesa Q[x]/f bude tvar polynomu f důležitý. 27
Věta 2.27 nám dala návod, jak zkonstruovat k tělesu T nějaké jeho nadtěleso. Následující jednoduchý fakt nám dá návod, jak hledat podtělesa tělesa T . Lemma 2.32. Necht’ pro všechny parametry α indexové množiny I je T (a) podtělesem tělesa T . Pak
\
T (a) je podtělesem tělesa T .
a∈I
Poznámka 2.33. Průnik všech podtěles tělesa T je minimálním podtělesem tělesa T a nazývá se prvotěleso tělesa T . Protože prvotěleso musí obsahovat 0 a 1 a také musí být uzavřené na operace + a ×, rozhoduje o tvaru prvotělesa fakt, zda součtem konečně mnoha jedniček v T lze dostat výsledek 0. Když tomu tak není, řekneme, že charakteristika tělesa T je 0 a jeho prvotělesem je Q, v opačném případě nazveme charakteristikou tělesa T číslo p, kde p je minimální počet jedniček jejichž součet je roven nule. Prvotělesem tělesa T je pak těleso Zp . Příklad 2.34. Uvažujme L podtěleso tělesa C. Vezměme komplexní α, které je kořenem polynomu f (x) = x2 + ax + b pro a, b ∈ L. Zkoumejme minimální těleso, které obsahuje L i číslo α, L(α) :=
\
{S | S je podtěleso C, L ⊂ S, α ∈ S} .
Je-li samotné α ∈ L, pak L(α) = L. V opačném případě je polynom f ireducibilní nad L a L(α) je izomorfní tělesu L[x]/f . Podle D˚ usledku 2.28 je [L(α) : L] = 2. Jak jsme už konstatovali, množina automorfizmů Aut T tělesa T tvoří grupu. Běžně používaným automorfizmem (aniž mu tak říkáme) je komplexní združení ψ(a + ib) = a + ib = a − ib v tělese C. Žádný běžně používaný automorfizmum tělesa R se nám nevybaví. Důvod je jednoduchý, jak ukážeme za chvilku: grupa Aut R obsahuje pouze indentitu. Lemma 2.35. Necht’ T1 , T2 jsou tělesa s prvotělesem K. Nechť ψ : T1 7→ T2 je izomorfizmus. Pak ψ(x) = x
pro každé x ∈ K .
Důkaz. Připomeňme, že prvotělesem K může být buď těleso Zp nebo Q. Nejdříve ukážeme, že z vlastností ψ(x + y) = ψ(x) + ψ(y) plyne ψ(0) = 0 a ψ(−x) = −ψ(x). Máme totiž ψ(0) = ψ(0 + 0) = ψ(0) + ψ(0)
=⇒
ψ(0) = 0 ,
0 = ψ(0) = ψ(x + (−x)) = ψ(x) + ψ(−x)
=⇒
ψ(−x) = −ψ(x) .
28
(2.1)
Uvažujme prvek x0 ∈ T , pro který ψ(x0 ) 6= 0. Pro k ∈ N máme ψ(k)ψ(x0 ) = ψ(kx0 ) = ψ(x0 ) + · · · + ψ(x0 ) = kψ(x0 )
=⇒
ψ(k) = k .
(2.2)
Je-li prvotělesem Zp , je důkaz hotov. Předpokládejme proto, že K = Q. Ze vztahů (2.1) a (2.2) plyne ψ(k) = k pro každé k ∈ Z. Pro p ∈ Z a q ∈ N dostaneme ¡ ¢ ¡ ¢ ¡ ¢ p = ψ(p) = ψ q pq = ψ(q)ψ pq = qψ pq
=⇒
ψ
¡p¢ q
=
p q
.
Věta 2.36. Jediným automorfizmem tělesa R je identita. Důkaz. Využijeme následujících tří vlastností tělesa R: 1. prvky R jsou uspořádané podle velikosti, 2. s každým kladným prvkem leží v R i jeho odmocnina, 3. mezi libovolnými dvěma prvky z R leží racionální číslo. Nejdřív ukážeme, že automorfizmus zachovává uspořádání. Uvažujme a, b ∈ R, b > a. Najděme c ∈ R tak, že b − a = c2 . Z definice automorfizmu plyne ψ(b) − ψ(a) = ψ(b − a) = ψ(c2 ) = (ψ(c))2 > 0
=⇒
ψ(b) > ψ(a) .
Ted’ použijeme tvrzení Lemmatu 2.35. Kdyby pro a ∈ R platilo a 6= ψ(a), muselo by podle vlastnosti 3. existovat y ∈ Q takové, že a < y < ψ(a) nebo ψ(a) < y < a. Je-li například a < y, pak protože ψ zachovává uspořádání, máme ψ(a) < ψ(y) = y < ψ(a), a to je spor. Případ y < a vyloučíme stejně. Poznámka 2.37. V důkazu předchozí věty jsme využili jenom tří vyjmenovaných vlastností R (nepotřebovali jsme např. úplnost R). Proto jediným automorfizmem každého tělesa, které má zmíněné vlastnosti, je identita.
29
3
Něco o polynomech
3.1
Polynomy nad C a nad R
Kořenem polynomu f ∈ T [x] rozumíme prvek α (obecně z nějakého nadtělesa U tělesa T ) takový, že f (α) = 0. Je-li α kořenem f , pak f je dělitelný polynomem (x − α). Pro polynomy s koeficienty v tělese komplexních čísel platí základní věta algebry, která říká, že každý polynom kladného stupně má v C alespoň jeden kořen. Odtud už lze snadno odvodit, že každý polynom f ∈ C[x] stupně stf = n má právě n kořen˚ u v C a lze tedy zapsat ve tvaru f (x) = c
n Y
(x − αi ) ,
kde c ∈ C .
i=1
Není těžké ukázat, že αj musí být navzájem r˚ uzné, pokud je polynom f ireducibilní nad Q. Lemma 3.1. Necht’ f ∈ Q[x] je monický polynom ireducibilní nad Q. Pak f má n r˚ uzných kořen˚ u v C. Důkaz. Označme h největší společný dělitel f a f 0 . Protože f je ireducibilní nad Q, je h = f nebo h = 1, ale h|f 0 , a proto h = 1. Protože h = nsd(f, f 0 ), existují polynomy u, v tak, že h = uf + vf 0 . Jestliže β je alespoň dvojnásobný kořen polynomu f , pak f (β) = f 0 (β) = 0, a proto taky h(β) = 0, což je spor s h = 1.
3.2
Polynomy nad Q a nad Z
Podívejme se nyní blíž na polynomy s koeficienty v tělese Q a okruhu Z. Pro takové polynomy lze vyslovit několik zajímavých tvrzení ohledně jejich dělitelnosti. Lemma 3.2 (Gaussovo lemma). Necht’ f, g ∈ Z[x] a každý koeficient součinu h = f g je dělitelný prvočíslem p. Pak p dělí bud’ všechny koeficienty polynomu f nebo všechny koeficienty polynomu g.
30
Důkaz. Necht’ f (x) =
n X
i
ai x ,
g(x) =
i=0
Potom h(x) =
m X
b j xj ,
a i , bj ∈ Z .
(3.1)
j=0
m+n X
ck xk ,
kde
ck =
k=0
X
ai bj .
(3.2)
i+j=k
Pro spor předpokládejme, že existuje prvočíslo p, které dělí všechny koeficienty polynomu h = f g, a přitom p nedělí ani všechny koeficienty ai , ani všechny koeficienty bj . Označme i0 , j0 nejmenší indexy takové, že p 6 |ai0 a p 6 |bj0 . Koeficient polynomu h u mocniny xi0 +j0 je roven ci0 +j0 =
X
ai bj = ai0 bj0 +
X
ai bj ,
i+j=i0 +j0
kde ve druhé sumě sčítame ´ přes indexy i, j takové, že i + j = i0 + j0 a přitom i < i0 nebo j < j0 . V této sumě je každý sčítanec dělitelný p, takže celkově koeficient ci0 +j0 dělitelný p není, což je spor. Poznámka 3.3. Tvrzení lemmatu je někdy ekvivalentně formulováno pomocí pojmu primitivního polynomu. Polynom f ∈ Z[x] se nazývá primitivní, jestliže největší společný dělitel jeho koeficient˚ u je roven 1. Gaussovo lemma pak říká, že součin dvou primitivních polynom˚ u je opět primitivní polynom. Ukážeme, že monický polynom v Q[x], který dělí nějaký monický polynom v Z[x], má sám celočíselné koeficienty. Lemma 3.4 (o faktorizaci celočíselných polynom˚ u). Necht’ f ∈ Q[x], h ∈ Z[x] jsou monické polynomy. Jestliže f |h, pak f ∈ Z[x]. Důkaz. Jestliže f |h, pak h = f g pro nějaký polynom g ∈ Q[x]. Protože f a h jsou monické, je i polynom g monický. Polynomy f , g lze vynásobit celými čísly r, s ∈ Z tak, aby rf a sg byly primitivní polynomy v Z[x]. Podle Gaussova lemmatu je součin primitivních polynom˚ u zase primitivní, ale přitom všechny koeficienty polynomu rsh = rsf g jsou dělitelné číslem rs. Proto nutně rs = 1 a r = ±1, s = ±1. Odtud už ale zřejmě plyne f ∈ Z[x]. D˚ usledkem Věty 3.4 je zajímavé kritérium ireducibility polynom˚ u. Věta 3.5 (Eisensteinovo kriterium ireducibility). Necht’ p ∈ Z je prvočíslo a necht’ h(x) = P j xn + n−1 j=0 cj x ∈ Z[x]. Necht’ dále platí: 31
• p | cj pro všechna j ∈ {0, 1, 2, . . . , n − 1}, • p2 6 | c0 . Pak h je ireducibilní nad Q. Důkaz. Myšlenka d˚ ukazu je podobná jako u Gaussova lemmatu. Předpokládejme pro spor, že polynom h je reducibilní nad Q, tedy že existují polynomy f, g stupně menšího než n tak, že h = f g. Z Věty 3.4 plyne, že lze tyto polynomy zvolit monické, s celočíselnými koeficienty, tedy ve tvaru (3.1), kde an = bm = 1 a proto p 6 |an a p 6 |bm . Označme i0 , j0 nejmenší indexy takové, že p 6 |ai0 a p 6 |bj0 . Ukážeme, že i0 = n a j0 = m. V opačném případěby totiž bylo i0 + j0 < m + n. Polynom h = f g je pak tvaru (3.2). V sumě ci0 +j0 =
X
ai bj = ai0 bj0 +
X
ai bj ,
i+j=i0 +j0
kde ve druhé sumě sčítame ´ přes indexy i, j takové, že i + j = i0 + j0 a přitom i < i0 nebo j < j0 . V této sumě je každý sčítanec dělitelný p. Protože ai0 bj0 není dělitelné p, i koeficient ci0 +j0 není dělitelný p. Z předpokladu věty plyne i0 + j0 = m + n a proto i0 = n a j0 = n. Proto jsou oba koeficienty a0 i b0 dělitelné p a jejich součin c0 = a0 b0 je dělitelný p2 . To je ovšem spor. Příklad 3.6. Necht’ p je prvočíslo. Pomocí Eisensteinova kritéria ukážeme ireducibilitu polynomu 2
f (x) = 1 + x + x + · · · + x
p−1
=
p−1 X j=0
xj =
xp − 1 , x−1
Abychom kritérium mohli vhodně použít, zaved’me polynom f˜(x) = f (x + 1). Pak ! Ã p µ ¶ p µ ¶ p X X (x + 1) − 1 1 p 1 p j j f˜(x) = = x −1 = x = x x j=0 j x j=1 j ¶ p µ ¶ p−1 µ X p j−1 X p = x = xj . j j + 1 j=1 j=1 ¡¢ Protože koeficient u nejvyšší mocniny xp−1 je roven pp = 1, je polynom f˜ monický. Ostat¡¢ ní koeficienty polynomu f˜ jsou tvaru pi , kde 0 < i < p, jsou proto dělitelné prvočíslem ¡¢ p. Koeficient u x0 je roven p1 = p, tj. není dělitelný p2 . Polynom f˜ tedy splňuje předpoklady Eisensteinova kritéria, a proto není reducibilní nad Q. Odtud plyne, že ani f není reducibilní nad Q. V opačném případě je f (x) = g(x)h(x) a f˜(x) = g(x + 1)h(x + 1) je pak faktorizace f˜. 32
3.3
Cyklotomické polynomy
Číslo ζ ∈ C takové, že ζ n = 1, se nazývá n-tý kořen z jedničky. Tyto kořeny mají tvar e
2πik n
, pro k = 0, 1, . . . , n. Tvoří multiplikativní cyklickou grupu Wn , jejíž generátory
jsou primitivní n-té kořeny z jedničky, tj. ty, jejichž řád v grupě Wn je roven n. Je-li ζ primitivní n-tý kořen z jedničky, pak ζ k je primitivní n-tý kořen z jedničky, právě když k je nesoudělné s n. Proto je primitivních n-tých kořen˚ u z jedničky právě ϕ(n), kde ϕ je Eulerova funkce. Definice 3.7. Necht’ ζ je nějaký primitivní n-tý kořen z jedničky. Polynom Y
Φn (x) =
(x − ζ k )
k≤n, k⊥n
nazýváme n-tý cyklotomický polynom nad Q. Poznámka 3.8. Stupeň n-tého cyklotomického polynomu je ϕ(n). Polynom Φn (x) je vlastně součinem Φn (x) =
Q
(x − λ) přes všechny kořeny z jedničky
řádu n. Odtud snadno plyne následující rozklad polynomu xn − 1. Věta 3.9. Necht’ n ∈ N. Pak platí xn − 1 =
Y
Φd (x) .
d|n
Protože stupeň n-tého cyklotomického polynomu je roven ϕ(n), odvodili jsme následující vztah pro Eulerovu funkci. Věta 3.10. Necht’ n ∈ N. Potom n =
P d|n
ϕ(d).
Příklad 3.11. Rozložme na součin ireducibilních faktor˚ u polynom x6 − 1. Z Věty 3.9 máme x6 − 1 = Φ1 (x)Φ2 (x)Φ3 (x)Φ6 (x) . Jednotlivé cyklotomické polynomy v součinu určíme přímo z definice, když si uvědomíme, že mezi ζ k , k = 0, 1, . . . , 6, ζ = e 3 mají ζ 2 = e
2πi 3
a ζ4 = e
4πi 3
2πi 6
, má ζ 0 = 1 řád 1 v grupě W6 , ζ 3 = −1 řád 2, řád πi
primitivní prvky grupy W6 (řádu 6 ve W6 ) jsou ζ 1 = e 3 a
33
ζ5 = e
5πi 3
. Je proto Φ1 (x) = x − 1 Φ2 (x) = x + 1 ³ ´³ ´ 2πi 4πi 2π 3 3 Φ3 (x) = x − e x−e = x2 − 2x cos + 1 = x2 + x + 1 3 ³ ´³ ´ πi 5πi π Φ6 (x) = x − e 3 x − e 3 = x2 − 2x cos + 1 = x2 − x + 1 3
Věta 3.12. Φn (x) má celočíselné koeficienty a koeficient absolutního členu je ±1. Důkaz. Tvrzení dokážeme indukcí ne n. Víme, že Φ1 (x) = x−1 splňuje žádanou vlastnost. Předpokládejme pro n > 1, že pro všechny d < n tvrzení platí. Máme Y Y xn − 1 = Φd (x) = Φn (x) Φd (x) d|n
d|n,d
M˚ užeme psát Φn (x) = a0 + a1 x + a2 x2 · · · + al xl pro nějaké l ∈ N. Podobně označme Q 2 j d|n,d
x :
−1 = a0 b0 0 = a0 b1 + a1 b0
⇒
a0 = −b−1 0 = ±1 ,
⇒
a1 = −b−1 0 a0 b1
0 = a0 b2 + a1 b1 + a2 b0 ⇒
a2 =
−b−1 0 (a0 b2
∈ Z, + a1 b1 ) ∈ Z ,
atd. Příklad 3.13. Nechť n = p je prvočíslo. Z Věty 3.9 platí xp − 1 = Φp (x)Φ1 (x) a proto je p-tý cyklotomický polynom Φp (x) roven Φp (x) =
xp − 1 = 1 + x + x2 + · · · + xp−1 . x−1
Z Příkladu 3.6 víme, že tento polynom je ireducibilní nad Q. Pro n = pk , kde p je prvočíslo a k ∈ N, opět použijeme Větu 3.9, x
pk
−1=
k Y
Φpj (x) = Φpk (x) · (xp
k−1
− 1) .
j=1
Odtud dostaneme k
xp − 1 k−1 k−1 k−1 = 1 + xp + x2p + · · · + x(p−1)p . Φpk (x) = pk−1 x −1 34
Viděli jsme, že p-tý cyklotomický polynom pro p prvočíslo je ireducibilní nad Q. Ireducibilita Φn platí i obecně, d˚ ukaz ovšem přesahuje rámec tohoto textu. Věta 3.14. Polynom Φn (x) je ireducibilní nad Q pro každé n ∈ N.
3.4
Symetrické polynomy
Každý polynom f stupně n s komplexními koeficienty má v C právě n kořen˚ u. Mezi kořeny a koeficienty tohoto polynomu existuje vztah. V případě kvadratického polynomu máme (x − α1 )(x − α2 ) = x2 − (α1 + α2 )x + α1 α2 . Podobně pro polynom třetího stupně je (x − α1 )(x − α2 )(x − α3 ) = x3 − (α1 + α2 + α3 )x2 + (α1 α2 + α1 α3 + α2 α3 )x − α1 α2 α3 . Není těžké ukázat, že obecně pro monický polynom stupně n s kořen˚ y α1 , . . . , αn platí f (x) =
n Y
n X (x − αi ) = x + (−1)i ei (α1 , α2 , . . . , αn )xn−i , n
i=1
i=1
kde ei jsou tzv. elementární symetrické funkce v n proměnných, definované takto: X e1 (x1 , . . . , xn ) = x1 + x2 + · · · + xn = xi , i
e2 (x1 , . . . , xn ) = x1 x2 + x1 x3 + · · · + xn−1 xn
=
X
xi xj ,
i<j
e3 (x1 , . . . , xn ) = x1 x2 x3 + x1 x2 x4 + · · · + xn−2 xn−1 xn =
X
xi xj xk ,
(3.3)
i<j
.. . en (x1 , . . . , xn ) = x1 x2 x3 · · · xn . Platí tedy násedující tvrzení.
Věta 3.15 (Vi`etovy vztahy). Pro každý monický polynom f (x) = xn +
Pn−1 i=0
ai xi s kořeny
α1 , . . . , αn platí an−i = (−1)i ei (α1 , α2 , . . . , αn ). Zabývejme se ted’ polynomy v n proměnných. Necht’ f ∈ T [x1 , x2 , . . . , xn ], tj. f (x1 , x2 , . . . , xn ) =
X
ak1 k2 ...kn xk11 xk22 · · · xk12 ,
ak1 k2 ...kn ∈ T .
k1 ,k2 ...kn
Jednotlivé sčítance s nenulovým koeficientem nazýváme členy polynomu. Exponent ki se nazývá stupeň členu ak1 k2 ...kn xk11 xk22 · · · xk12 v proměnné xi . Podobně součet k1 + k2 + · · · + 35
kn je celkový stupeň členu, uspořádané n-tici (k1 , k2 , . . . , kn ) říkáme výška členu. Často je výhodné uspořádat členy polynomu lexikograficky podle jejich výšek. Řekneme, že výška (k1 , k2 , . . . , kn ) je lexikograficky ostře větší než výška (k˜1 , k˜2 , . . . , k˜n ), jestliže první nenulový člen posloupnosti k1 − k˜1 , k2 − k˜2 , k3 − k˜3 , . . . je kladný. Zapisujeme (k1 , k2 , . . . , kn ) Â (k˜1 , k˜2 , . . . , k˜n ) . Člen polynomu f s lexikograficky největší výškou se nazývá vedoucí člen polynomu f . Definice 3.16. Polynom f ∈ T [x1 , x2 , . . . , xn ] se nazývá symetrický, jestliže platí f (x1 , x2 , . . . , xn ) = f (xπ(1) , xπ(2) , . . . , xπ(n) ) , pro každou permutaci π ∈ Sn . Připomeňme, že v definici porovnáváme polynomy jako formální sumy, nikoliv hodnoty polynomů v konkrétních n-ticích hodnot x1 , x2 , . . . , xn . Příklad 3.17. Je zřejmé, že polynom f (x1 , x2 , x3 ) = x41 + x42 + x43 + 3x1 x2 x3 je symetrický polynom ve třech proměnných. Není ovšem symetrický, je-li chápán jako polynom čtyř proměnných. Výšky člen˚ u polynomu f jsou po řadě (4, 0, 0), (0, 4, 0), (0, 0, 4) a (1, 1, 1). Příklad 3.18. Polynom g(x1 , x2 , x3 ) = x21 x2 + x22 x3 + x23 x1 není symetrický, protože g(x1 , x2 , x3 ) 6= g(xπ(1) , xπ(2) , xπ(3) ) = x1 x22 + x2 x23 + x3 x21 , pro každou lichou permutaci π ∈ Sn . Poznámka 3.19. Výška (k1 , k2 , . . . , kn ) vedoucího členu symetrického polynomu splňuje k1 ≥ k2 ≥ · · · ≥ kn . Pro výšku (k˜1 , k˜2 , . . . , k˜n ) jakéhokoli jiného členu platí k˜i ≤ k1 . Polynom, který vzniká součtem člen˚ u vytvořených z jediného členu permutací proměnných, se nazývá jednoduchý symetrický polynom. Výšky člen˚ u jednoduchého symetrického polynomu jsou navzájem zpermutované n-tice. Jednoduchý symetrický polynom lze tedy charakterizovat pomocí jediné výšky. Za tu volíme výšku vedoucího členu, tj. tu lexikograficky největší. Příklad 3.20. Polynom f z Příkladu 3.17 je součtem dvou jednoduchých symetrických polynom˚ u
f1 (x1 , x2 , x3 ) = x41 + x42 + x43 ,
s výškou (4, 0, 0) ,
f2 (x1 , x2 , x3 ) =
s výškou (1, 1, 1) .
3x1 x2 x3 , 36
Elementární symetrické funkce jsou jednoduché symetrické polynomy. Je zřejmé, že P e1 (x1 , . . . , xn ) = má výšku (1, 0, 0, 0 . . . , 0) , i xi , P e2 (x1 , . . . , xn ) = má výšku (1, 1, 0, 0 . . . , 0) , i<j xi xj , P e3 (x1 , . . . , xn ) = má výšku (1, 1, 1, 0 . . . , 0) , i<j
má výšku
(1, 1, 1, 1, . . . , 1) .
Lemma 3.21. Symetrický polynom definovaný součinem ej11 · · · ejnn má vedoucí člen tvaru xk11 xk22 · · · xknn , kde ki = ji + ji+1 + ji+2 + · · · + jn , pro i = 1, 2, . . . , n. Důkaz. Stačí si uvědomit, že vedoucí člen součinu polynom˚ u získáme násobením vedoucích člen˚ u jednotlivých činitel˚ u a využít znalosti výšek určujících elementární symetrické funkce. Například proměnná x1 se vyskytuje ve vedoucím členu všech elementárních symetrických funkcí, a proto vedoucí člen polynomu ej11 · · · ejnn má v proměnné x1 stupeň k1 = j1 + j2 + j3 + · · · + jn . Proměnná x2 se nevyskytuje ve vedoucím členu e1 , proto k2 = j2 + j3 + · · · + jn , atd. Vzájemný vztah exponent˚ u j1 , . . . , jn a k1 , . . . , kn lze tedy napsat takto: k1 k2
= j1 + j2 + j3 + · · · + jn , = j2 + j3 + · · · + jn , .. .
kn−1 = jn−1 + jn , kn = jn ,
j1 j2
= k1 − k2 , = k2 − k3 , .. .
jn−1 = kn−1 − km , jn = kn .
Věta 3.22 (Základní věta o symetrických polynomech). Každý symetrický polynom f ∈ T [x1 , . . . , xn ] lze vyjádřit jako f = g(e1 , . . . , en ) pro nějaké g ∈ T [x1 , . . . , xn ] . Důkaz. Budeme postupovat matematickou indukcí na výšku vedoucího členu polynomu f . Protože výšky jsou lexikograficky uspořádané, je tento postup korektní. Pro první krok indukce vezměme polynom f , jehož vedoucí člen má výšku (0, 0, . . . , 0). Takový polynom je konstantní, tudíž už je zapsán v žádaném tvaru. Nyní předpokládejme, že f má výšku vedoucího členu (k1 , k2 , . . . , kn ) a pro polynomy s výškou vedoucího členu lexikograficky nižší než (k1 , k2 , . . . , kn ) už tvrzení věty platí. K dané výšce (k1 , k2 , . . . , kn ) zkonstruujeme polynom ej11 ej22 · · · ejnn , kde ji = ki − ki+1 pro i = 1, 2, . . . , n − 1 a jn = kn . Je-li ak1 k2 ...kn koeficient vedoucího členu polynomu f , pak podle Lemmatu 3.21 polynom f˜ = f − ak1 k2 ...kn ej11 ej22 · · · ejnn 37
má výšku vedoucího členu lexikograficky ostře menší než (k1 , k2 , . . . , kn ). Proto podle indukčního předpokladu existuje polynom g˜ ∈ T [x1 , . . . , xn ] tak, že f˜ = g˜(e1 , . . . , en ). Snadno odtud dostaneme, že f = f˜ + ak1 k2 ...kn ej11 ej22 · · · ejnn = g˜(e1 , . . . , en ) + ak1 k2 ...kn ej11 ej22 · · · ejnn . Proto hledaný polynom g ∈ T [x1 , . . . , xn ] má tvar g = g˜ + ak1 k2 ...kn xj11 xj22 · · · xjnn D˚ ukaz předchozí věty je konstruktivní, popisuje postup hledání polynomu g k danému symetrickému polynomu f . Postup ilustrujeme v následujícím příkladě. Příklad 3.23. Určíme polynom g z Věty 3.22 k polynomu f ∈ Q[x1 , x2 , x3 ] zadanému f (x1 , x2 , x3 ) = x31 x2 + x31 x3 + x1 x32 + x1 x33 + x32 x3 + x2 x33 . Zřejmě f je jednoduchý symetrické polynom určený výškou (3, 1, 0). Uvažujme polynom ej11 ej22 ej33 , kde j1 = 3 − 1 = 2, j2 = 1 − 0 = 1, j3 = 0, tedy polynom e21 e2 = (x1 + x2 + x3 )2 (x1 x2 + x1 x3 + x2 x3 ) = = (x21 + x22 + x23 + 2x1 x2 + 2x1 x3 + 2x2 x3 )(x1 x2 + x1 x3 + x2 x3 ) = = (x31 x2 + x31 x3 + x1 x32 + x32 x3 + x1 x33 + x2 x33 ) + 5(x21 x2 x3 + x1 x22 x3 + x1 x2 x23 )+ + 2(x21 x22 + x21 x23 + x22 x23 ) . Pak platí (f − e21 e2 )(x1 , x2 , x3 ) = −2(x21 x22 + x21 x23 + x22 x23 ) − 5(x21 x2 x3 + x1 x22 x3 + x1 x2 x23 ) , což je opět polynom symetrický v proměnných x1 , x2 , x3 , tentokrát s nižší výškou ve2−0 0 2 doucího členu, a to (2, 2, 0). Součin e2−2 1 e2 e3 = e2 je tvaru
e22 (x1 , x2 , x3 ) = (x1 x2 +x1 x3 +x2 x3 )2 = (x21 x22 +x21 x23 +x22 x23 )+2(x21 x2 x3 +x1 x22 x3 +x1 x2 x23 ) , a proto máme (f − e21 e2 + 2e22 )(x1 , x2 , x3 ) = −(x21 x2 x3 + x1 x22 x3 + x1 x2 x23 ) = −(x1 + x2 + x3 )x1 x2 x3 , Celkem tedy platí f = e21 e2 − 2e22 − e1 e3 .
38
4
Algebraická číselná tělesa
4.1
Algebraická čísla, minimální polynom
Definice 4.1. Číslo α ∈ C se nazývá algebraické, jestliže existuje monický polynom f ∈ Q[x] tak, že f (α) = 0. Množinu všech algebraických čísel značíme A. Číslo, které není algebraické, se nazývá transcendentní. Příklad 4.2. Každé racionální číslo x−
p q
p q
∈ Q je algebraické, protože je kořenem polynomu
∈ Q[x]. Je tedy Q ⊂ A.
Věta 4.3 (o minimálním polynomu). Necht’ α ∈ A. Pak existuje právě jeden monický polynom f ∈ Q[x] minimálního stupně, pro který f (α) = 0. Tento polynom splňuje následující vlastnost: necht’ g ∈ Q[x] a g(α) = 0. Pak f |g. Důkaz. Necht’ existuje kromě f ještě jiný monický polynom f˜ ∈ Q[x], pro který f˜(α) = 0 a necht’ má stejný stupeň jako f . Pak nenulový polynom h = f −f˜ je stupně sth < stf = stf˜. ˜ = a−1 h, kde a je vedoucí Přitom je h(α) = 0. Snadno vyrobíme monický polynom h ˜ taky splňuje h(α) ˜ ˜ < stf . To je ale spor s koeficient polynomu h. Polynom h = 0 a sth definicí minimálního polynomu f . Necht’ nyní g ∈ Q[x], g(α) = 0. Z věty o dělení polynom˚ u lze napsat g = qf + h, kde q, h ∈ Q[x] a je-li h nenulový polynom, pak sth < stf . Navíc h(α) = g(α) − q(α)f (α) = 0, což vede opět ke sporu s definicí f . Proto h je nulový polynom, a tedy f dělí g. Definice 4.4. Necht’ α ∈ A a necht’ f je monický polynom v Q[x] nejnižšího stupně, pro který f (α) = 0. Polynom f nazveme minimálním polynomem čísla α. Jeho stupeň nazýváme řádem čísla α. Příklad 4.5. • Je zřejmé, že racionální čísla jsou algebraická čísla řádu 1.
39
√ • Je-li k, n ∈ N, k, n ≥ 2, pak k n ∈ Q implikuje n = mk pro nějaké m ∈ N. Je-li totiž √ k n = mr pro navzájem nesoudělná m, r ∈ N, pak z rovnosti nrk = mk plyne n|mk a z nesoudělnosti m a r zároveň mk |n. Proto n = mk . • Číslo
√
2 je tedy iracionální, přitom je kořenem kvadratického polynomu s celočísel-
nými koeficienty, proto je to algebraické číslo řádu 2. • Číslo
√ 3
2 je algebraické řádu 3. Je kořenem polynomu x3 − 2. Zároveň není kořenem
žádného monického polynomu druhého stupně s racionálními koeficienty. Pak by totiž
√ 3
√ 3 4 + a 2 = −b ,
pro nějaké a, b ∈ Q. Umocněním dostaneme √ √ 3 3 a2 4 + 2 2 = b2 − 4a . Tyto dvě rovnosti lze chápat jako soustavu dvou rovnic pro dvě neznámé
√ 3
4a
√ 3
2s
racionálními koeficienty. Z Cramerova pravidla vyplývá, že řešením takové soustavy √ je číslo racionální, což je spor s iracionalitou 3 2. Lemma 4.6. Minimální polynom algebraického čísla α je ireducibilní nad Q. Naopak je-li g ∈ Q[x] monický polynom ireducibilní nad Q takový, že g(α) = 0, pak g je minimálním polynomem čísla α. Důkaz. Označme f minimální polynom čísla α. Pro spor předpokládejme, že f je reducibilní. Pak f = gh pro nějaké polynomy g, h ∈ Q[x] takové, že sth, stg < stf . Máme 0 = f (α) = g(α)h(α), tj. alespoň jedno z g(α), h(α) je rovno 0. Necht’ například g(α) = 0. Pak z Věty 4.3 polynom f dělí polynom g. To ovšem nelze, protože g je nenulový polynom stupně ostře menšího než f . Naopak je-li g ∈ Q[x] monický polynom ireducibilní nad Q takový, že g(α) = 0, pak podle Věty 4.3 platí, že f dělí g. Ale protože g je ireducibilní, nutně g = cf pro nějaké c ∈ Q. Ale protože oba polynomy f i g jsou monické, musí být c = 1, takže f = g. Každému algebraickému číslu α ∈ A řádu n přísluší tzv. matice společnice2 Mα ∈ Qn×n Pn−1 ai xi čísla α definovaná pomocí koeficient˚ u minimálního polynomu f (x) = xn + i=0 2
Anglický termín „companion matrix” zatím nemá standardizovaný český ekvivalent. U nás v kanceláři se však již vžil uvedený termín „matice společnice”. Má někdo zajímavější návrh?
40
předpisem
Mα =
0
1
0
···
0
0
0
0
1
···
0
0
0 .. .
0 .. .
0 .. .
··· .
0 .. .
0 .. .
0
0
0
···
0
1
..
.
−a0 −a1 −a2 · · · −an−2 −an−1 Charakteristický polynom této matice je právě minimální polynom čísla α. Vlastní číslo α odpovídá vlastnímu vektoru vα = (1, α, . . . , αn−1 )T .
4.2
Vlastnosti množiny algebraických čísel
Vrat’me se nyní k množině algebraických čísel. Ukážeme, že množina A má zajímavou algebraickou strukturu, je to totiž číselné těleso. Věta 4.7. Algebraická čísla tvoří podtěleso C. ekvivalentně, necht’ α, β ∈ A. Potom α+β, α − β, αβ leží v A. Když navíc α 6= 0, pak α−1 ∈ A. Důkaz. Zjevně stačí ukázat, že množina A je uzavřená na operace sčítání a násobení a na inverzní prvek. Formálně, chceme ukázat, že je-li α, β ∈ A, pak α + β, α − β, αβ leží v A, a když navíc α 6= 0, pak α−1 ∈ A. První část tvrzení snadno odvodíme pomocí matic společnic. Nechť α je algebraické číslo řádu n a β algebraické číslo řádu m. Tenzorový součin matic Mα ⊗ Mβ a (Mα ⊗ Im ) ± (In ⊗ Mβ ) jsou pak matice řádu mn s racionálními koeficienty. Navíc platí ¡
(Mα ⊗ Mβ )(vα ⊗ vβ ) = αβ(vα ⊗ vβ ) ¢ (Mα ⊗ Im ) ± (In ⊗ Mβ ) (vα ⊗ vβ ) = (α ± β)(vα ⊗ vβ )
Číslo αβ (resp. α ± β) je tedy vlastní číslo matice Mα ⊗ Mβ ∈ Qmn×mn (resp. (Mα ⊗ Im ) ± (In ⊗ Mβ ) ∈ Qmn×mn ) příslušné vlastnímu vektoru vα ⊗ vβ . Charakteristické polynomy těchto matic jsou monické polynomy v Q[x], a proto jsou čísla αβ (resp. α±β) algebraická. Zbývá dokázat, že převrácená hodnota nenulového algebraického čísla je také algeP i braické číslo. Necht’ α 6= 0, α ∈ A, a necht’ f (x) = xn + n−1 i=0 ai x je jeho minimální polynom. Protože f je ireducibilní, je a0 6= 0. Lze tedy dělit rovnici f (α) = 0 číslem a0 αn . Máme 1 0= a0 αn
à αn +
n−1 X
! ai αi + a0
i=1
41
n−1
=
X an−i 1 + α−i + α−n . a0 i=1 a0
Máme proto monický polynom g(x) = xn +
Pn−i i=1
−1 i an−i a−1 0 x +a0 s racionálními koeficienty
a kořenem α−1 . Proto α−1 ∈ A. D˚ ukaz věty dává návod k nalezení monického polynomu v Q[x], který má kořen α ± β, resp. αβ. V případě, že tento polynom je ireducibilní nad Q, pak je podle Lemmatu 4.6 zároveň minimálním polynomem daného čísla. √ 2, β = 3. V tomto případě máme µ ¶ µ ¶ 0 1 0 1 = a Mβ = , 2 0 3 0 √ √ a vβ = (1, 3) . = (1, 2)
Příklad 4.8. Necht’ α = Mα vα
√
Příslušné tenzorové součiny 0 0 0 0 0 2 Mα ⊗ Mβ = 0 3 0 6 0 0
matic jsou pak tvaru 1 0 0 2 a (Mα ⊗ I2 ) + (I2 ⊗ Mβ ) = 3 0 0 0 √ √ √ Vlastnímu vektoru vα ⊗ vβ = (1, 2, 3, 6)T těchto matic odpovídají
1 0 0 3
1 0 0 2
0 1 . 1 0
vlastní hodnoty
αβ, resp. α + β. Snadno vypočítáme, že charakteristický polynom matice (Mα ⊗ I2 ) + (I2 ⊗ Mβ ) je √ √ p(x) = x4 − 10x2 + 1 = (x2 − 5 − 2 6)(x2 − 5 + 2 6) = q q q q ³ √ ´³ √ ´³ √ ´³ √ ´ = x− 5−2 6 x+ 5−2 6 x− 5+2 6 x+ 5+2 6 , p
√ √ √ 5 + 2 6 = 2 + 3. Je vidět, že polynom p(x) = x4 − 10x2 + 1 je √ √ ireducibilní nad Q a proto číslo 2+ 3 je algebraické čtvrtého řádu a p je jeho minimální není těžké ověřit, že
polynom. Naopak charakteristický polynom matice Mα ⊗ Mβ je q(x) = x4 − 12x2 + 36 = (x2 − 6)2 = (x − je nad Q reducibilní takže číslo
√
6)2 (x +
√
6)2 ,
√ √ √ 2 3 = 6 je druhého řádu. Jeho minimální polynom
je x2 − 6. D˚ ukaz Věty 4.7 umožňuje nalézt minimální polynom součtu, resp. součinu algebraických čísel. Ve skutečnosti ale existuje mnohem jednodušší zp˚ usob. Budeme potřebovat pojem sdružených kořen˚ u. Připomeňme, že algebraické číslo α řádu n má minimální polynom f stupně stf = n. Podle základní věty algebry lze monický polynom f rozložit na součin n kořenových 42
činitel˚ u, f (x) =
Qn
j=1 (x
− αj ), kde αj jsou (obecně komplexní) kořeny polynomu f a
například α1 = α. Protože minimální polynom algebraického čísla je ireducibilní nad Q, αj jsou navzájem r˚ uzné. Definice 4.9. Necht’ α je algebraické číslo řádu n a necht’ f je jeho minimální polynom. Necht’ f (X) =
n Y
(x − αj ) ,
α1 = α .
j=1
KO kořenech αj , j = 1, . . . , n, řekneme, že jsou navzájem sdružené. Poznámka 4.10. Je zřejmé, že kořeny αj splňují podmínky Definice 4.1, proto jsou to algebraická čísla. Navíc mají stejný minimální polynom jako α, proto jsou to algebraická čísla stejného řádu jako α. √ Příklad 4.11. Algebraické číslo α = α1 = 2 má pouze jeden sdružený kořen, a to √ √ √ √ α2 = − 2, protože x2 − 2 = (x − 2)(x + 2). Podobně sdružený kořen k β = β1 = 3 p √ √ √ √ je β2 = − 3. Z Příkladu 4.8 vidíme, že sdružené kořeny k číslu 2 + 3 = 5 + 2 6 p p p √ √ √ jsou 5 − 2 6, − 5 + 2 6 a − 5 − 2 6. Přepíšeme-li tato čísla do jiného tvaru, q q √ √ √ √ √ √ 5 + 2 6 = 2 + 3, 5 − 2 6 = − 2 + 3, q q √ √ √ √ √ √ − 5 − 2 6 = 2 − 3, − 5 + 2 6 = − 2 − 3. zjistíme, že sdružené kořeny polynomu p(x) = x4 − 10x2 + 1 jsou právě αi + βj , i = 1, 2, j = 1, 2. Podobná zákonitost jako v Příkladu 4.11 platí obecně v poněkud slabší formě. Tvrzení 4.12. Necht’ α ∈ A, řádu n má sdružené kořeny α1 = α, α2 , . . . , αn , a necht’ β ∈ A řádu m má sdružené kořeny β1 = β, β2 , . . . , βn . Potom sdružené kořeny čísla α + β, resp. αβ, najdeme mezi αi + βj , i = 1, . . . , n, j = 1, . . . , m, resp. αi βj , i = 1, . . . , n, j = 1, . . . , m. Důkaz. Dokážeme, že n Y m Y
(x − αi − βj ) ∈ Q[x] ,
i=1 j=1
n Y m Y
(x − αi βj ) ∈ Q[x] .
i=1 j=1
Pak bude z Věty 4.3 zřejmé, že minimální polynom čísla α + β, resp. αβ dělí (po řadě) výše uvedené polynomy nad Q, a d˚ ukaz bude hotov. Myšlenku předvedeme na prvním z dvojných produkt˚ u. Vyjádříme jej jako polynom v elementárních symetrických funkcích 43
proměnných α1 , . . . , αn , respektive β1 , . . . , βm , což jsou – coby koeficienty minimálního polynomu čísla α, resp. β – racionální čísla. Součin F (x; α1 , . . . , αn ; β1 , . . . , βm ) =
m n Y Y
(x − αi − βj )
i=1 j=1
lze chápat jako polynom v proměnných β1 , . . . , βm s parametry x a α1 , . . . , αn . V těchto proměnných je symetrický a jako takový lze (podle Věty 3.22) napsat jako polynom v elementárních symetrických funkcích e1 , . . . , em kořen˚ u β1 , . . . , β m , F (β1 , . . . , βm ; x, α1 , . . . , αn ) = G(e1 , . . . , em ; x, α1 , . . . , αn ) , kde e1 = e1 (β1 , . . . , βm ), . . . , em = em (β1 , . . . , βm ) jsou nyní racionální hodnoty. Polynom G lze teď také chápat jako symetrický polynom v proměnných α1 , . . . , αn , přičemž x je parametr. Proto lze psát G(α1 , . . . , αn ; x) = H(˜ e1 , . . . , e˜n ; x) , kde opět e˜1 = e˜1 (α1 , . . . , αn ), . . . , e˜n = e˜n (α1 , . . . , αn ) jsou racionální čísla. Polynom H (jako polynom v proměnné x) má tedy racionální koeficienty, což jsme měli ukázat. Dokázali jsme, že všechny sdružené kořeny čísla α+β (resp. αβ) jsou tvaru αi +βj (resp. αi βj ). Narozdíl od Příkladu 4.11, v obecném případě nemusí všechna čísla αi + βj (resp. αi βj ) být sdruženými kořeny k α + β. M˚ uže se tak stát v případě, že řád algebraického čísla α + β (resp. αβ) nebude součinem řád˚ u čísel α a β. Podobný argument jako v d˚ ukazu předchozího tvrzení umožňuje dokázat, že těleso A je algebraicky uzavřené, tedy že každý nekonstantní polynom s koeficienty v A má v A alespoň jeden kořen. To už implikuje, že každý polynom stupně n s koeficienty v A má v A právě n kořen˚ u. Technický d˚ ukaz pomocí symetrických polynom˚ u zde ovšem provádět nebudeme, protože větu bude možno dokázat velmi elegantně na konci příští sekce. O množině A ale m˚ užeme dokázat ještě jednu zajímavou vlastnost. Tvrzení 4.13. A je spočetná množina. Důkaz. Každé algebraické číslo je kořenem nějakého polynomu v Z[x]. Takových polynom˚ u pevného stupně je spočetně mnoho. Nyní si stačí uvědomit, že spočetné sjednocení spočetných množin je spočetné.
44
4.3
Algebraická číselná tělesa
Pro číslo α ∈ C definujme množinu Q(α) :=
\
{ T | T je podtělesem C, α ∈ T } .
(4.1)
Tedy Q(α) je minimální podtěleso tělesa C, které obsahuje číslo α. Snadno nahlédneme, že množina n Pn a α i i=0 i Pm F := j j=0 bi α
m ¯ o X ¯ bi αj 6= 0 ¯ n, m ∈ N0 , ai , bj ∈ Q,
(4.2)
j=0
musí být nutně obsažená v Q(α). Na druhé straně je tato množina uzavřená na odčítání a dělení, a je to tedy podtěleso tělesa C. Proto Q(α) = F . Poznámka 4.14. Pokud α je transcendentní, tedy není kořenem žádného polynomu s racionálními koeficienty, jsou jeho mocniny 1 = α0 , α, α2 , α3 , α4 . . . lineárně nezávislé nad Q, a tedy [Q(α) : Q] = +∞. Jinými slovy pokud dimenze tělesa Q(α) jako vektorového prostoru nad Q je konečná, musí být α ∈ A. Je-li α algebraické číslo, lze prvky tělesa Q(α) vyjádřit jednodušeji, než jako prvky množiny F ze vztahu (4.2). Příklad 4.15. Uvažujme těleso Q(i), kde i2 = −1. Jak víme, pro a, b, c, d ∈ Q je a + bi a + bi c − di ac + bd + i(bc − ad) = = . c + di c + di c − di c2 + d 2 Proto je Q(i) = {a + bi | a, b ∈ Q}. Věta 4.16. Necht’ α je algebraické číslo řádu n. Potom Q(α) = {a0 + a1 + · · · + an−1 αn−1 | ai ∈ Q} .
(4.3)
Důkaz. Označme pravou stranu jako množinu M := {a0 + a1 + · · · + an−1 αn−1 | ai ∈ Q} = {g(α) | g ∈ Q[x], g = 0 nebo stg < n}. Především je zřejmé, že M ⊂ Q(α). Ukažme, že M = {g(α) | g ∈ Q[x]}. Inkluze ⊂ je zřejmá. Naopak je-li g ∈ Q[x], pak existují polynomy q, h ∈ Q[x] tak, že g = qf + h, kde f je minimální polynom čísla α. Protože h = g − qf , je h(α) = g(α), přitom h je bud’ nulový polynom, nebo sth < n, takže M ⊃ {g(α) | g ∈ Q[x]}. Protože Q[x] je okruh, je i M okruh. Zbývá dokázat, že ke každému nenulovému prvku obsahuje M i inverzní prvek. Necht’ 0 6= β ∈ M . Pak β = g(α) pro nějaký polynom 45
g ∈ Q[x]. Kdyby f dělilo g, pak g(α) = β = 0. Proto f 6 |g. Necht’ h = nsd(f, g) v Q[x]. Protože f je ireducibilní, h je bud’ rovno konstantnímu polynomu 1 nebo f . Ale h = f nelze, protože f 6 |g. Proto h = 1. Z Věty 2.23 existují polynomy u, v ∈ Q[x] tak, že h = 1 = uf +vg. Ale u(α)f (α)+v(α)g(α) = v(α)g(α) = 1, takže β −1 = (g(α))−1 = v(α) ∈ M . Ukázali jsme, že množina M je těleso. Protože Q(α) je minimální podtěleso C obsahující α, musí být M ⊃ Q(α), a tedy M = Q(α). Čtenář si jistě uvědomil, že předchozí d˚ ukaz kopíruje d˚ ukaz faktu, že pro ireducibilní polynom f je Q[x]/f těleso. Rozdíl spočívá pouze v tom, že Q[x]/f je množina polynomů, kdežto Q(α) je podmnožina C. Nicméně tělesa Q[x]/f a Q(α), kde f je minimální polynom čísla α ∈ A, jsou izomorfní s izomorfismem ψ(g) = g(α) pro g ∈ Q[x]/f . Vztah (4.3) vyjadřuje, že je-li n řád čísla α, pak prvky 1, α, α2 , . . . , αn−1 tvoří bázi tělesa Q(α) nad Q. Definice 4.17. Těleso Q(α) pro α ∈ A se nazývá číselné těleso, jeho dimenze jako vektorového prostoru nad tělesem Q se nazývá řád Q(α). Zobecníme definici (4.1), Q(α, β) :=
\
{ T | T je podtělesem C, α, β ∈ T } .
(4.4)
Ukažme, že pro α, β ∈ A lze prvky tohoto tělesa hezky popsat. Věta 4.18 (O primitivním prvku). Necht’ α, β ∈ A. Pak existuje γ ∈ A tak, že Q(α, β) = Q(γ). Důkaz. Necht’ α, β jsou algebraická čísla řádu n, resp. m. Je jasné, že těleso Q(α, β) obsahuje množinu M :=
( n−1 m−1 XX
) ¯ ¯ cjk αj β k ¯¯ cjk ∈ Q .
j=0 k=0
Je snadno vidět, že tato množina je uzavřená na odčítání a násobení, je to okruh. Ukážeme, že je to těleso, a to tak, že předvedeme, že je rovna Q(γ) pro vhodné γ ∈ A. Nechť f (x) =
n Y
(x − αi ) ,
resp.
g(x) =
i=1
m Y
(x − βj ) .
j=1
jsou minimální polynomy čísel α, resp. β. Pro jednoduchost uvažujme α = α1 , β = β1 . Rovnice α + xβ = αi + xβj 46
má právě jedno řešení xij =
αi −α β−βj
pro každé i = 1, 2, . . . , n a každé j = 2, 3, . . . , m. Zvolme
libovolné nenulové c ∈ Q takové, že c 6= xij pro všechna i a j, a položme γ = α + cβ. Dokážeme, že Q(γ) = M . Zřejmě γ ∈ M , což je okruh. Proto platí inkluze Q(γ) ⊂ M . Pro opačnou inkluzi stačí ukázat, že α, β ∈ Q(γ). Definujme polynom h(x) = f (γ − cx) ∈ T [x], kde T = Q(γ). Protože c 6= 0, je sth = stf = n. Navíc platí h(β) = f (γ − cβ) = f (α) = 0. Polynomy h a g mají tedy společný kořen β. Ukažme, že nemají žádný jiný společný kořen. Kdyby totiž existovalo δ tak, že h(δ) = g(δ) = 0, pak δ musí být jeden ze sdružených kořen˚ u k β, tj. δ = βj pro nějaké j = 2, 3, . . . , m. Pak ale h(βj ) = f (γ − cβj ) = 0, takže γ − cβj je rovno jednomu ze sdružených kořen˚ u k α, například γ − cβj = αi , odtud ale γ = α + cβ = αi + cβj , což dále implikuje c = xij . To ovšem odporuje volbě parametru c. Když ovšem polynomy g a h mají jediný společný kořen β, pak jejich největším společným dělitelem jako polynom˚ u nad tělesem C je lineární polynom x − β. Protože ale oba polynomy g a h mají koeficienty ve stejném tělese T = Q(γ), při hledání nsd(g, h) Eukleidovým algoritmem v rámci dělení polynom˚ u dostáváme koeficienty opět v T , a proto nsd(g, h) ∈ T [x]. Proto β ∈ Q(γ) a α = γ − cβ ∈ Q(γ). Tím je d˚ ukaz dokončen. √ √ 3 je číslo γ = 2 + 3 √ √ algebraické, a to řádu 4. Je to zárověn vhodné γ do Věty 4.18, tj. těleso Q( 2, 3) = √ √ √ √ √ √ Q( 2 + 3). Protože 2, 3 ∈ Q( 2 + 3) musí existovat polynom g ∈ Q[x], stg < 4, √ √ √ tak, že g( 2 + 3) = 2. Polynom g je tedy tvaru g(x) = a + bx + cx2 + dx3 . Po dosazení Příklad 4.19. V Příkladu 4.8 jsme viděli, že pro α =
máme
√
2, β =
√
√ √ √ √ √ √ √ √ g( 2 + 3) = a + b( 2 + 3) + c( 2 + 3)2 + d( 2 + 3)3 √ √ √ = a + 5c + 2(b + 11d) + 3(b + 9d) + 2c 6 .
√ √ √ Protože prvky 1, γ, γ 2 , γ 3 tvoří bázi Q(γ) nad Q, snadno nahlédneme, že i 1, 2, 3, 6 √ √ √ tvoří takovou bázi, tj. jsou lineárně nezávislé nad Q. Má-li tedy být g( 2 + 3) = 2, stačí porovnat koeficienty u těchto bazických prvk˚ u, a + 5c = 0 ,
b + 11d = 1 ,
b + 9d = 0 ,
což snadno implikuje a = c = 0, b = − 92 a d =
1 . 2
2c = 0 ,
Polynom g je tudíž tvaru g(x) =
− 92 x + 21 x3 . Je zřejmé, že matematickou indukcí bychom snadno dokázali Větu 4.18 dále zobecnit. Lze pak vyslovit následující d˚ usledek. 47
Věta 4.20. Pro každé podtěleso K tělesa C konečné dimenze nad Q existuje číslo α ∈ A tak, že K = Q(α). Důkaz. Nechť dimenze tělesa K nad Q je n. Pak existuje n prvk˚ u β1 , β2 , . . . , βn ∈ K lineárně nezávislých nad Q. Těleso Q(βi ) je podtělesem tělesa K, a proto musí mít rovněž konečnou dimenzi nad Q. Proto jsou podle poznámky 4.14 všechna βi ∈ A. Z matematické indukce pomocí Věty 4.18 je snadno vidět, že že pro každé r lze těleso Q(β1 , β2 , . . . , βr ) vyjádřit jako Q(α) pro nějaké α ∈ A. Protože β1 , . . . , βn jsou bazické prvky tělesa K, je Q(β1 , . . . , βn ) = Q(α) = K. Poznámka 4.21. Každé podtěleso K tělesa C konečné dimenze n nad Q je tedy algebraické číselné těleso ve smyslu Definice (4.17). Číslo α splňující K = Q(α) se nazývá primitivní prvek v tělese K. Poznamenejme, že samozřejmě není určen jednoznačně, lze volit libovolné číslo β ∈ K, jehož řád je roven řádu K, protože prvky 1, β, . . . , β n−1 jsou rovněz lineárně nezávislé nad Q. Jako zajímavý d˚ usledek Věty 4.20 uvedeme následující tvrzení. Věta 4.22. A je algebraicky uzavřené těleso. Důkaz. Nechť f ∈ A[x] je polynom stupně n > 0 s koeficienty v tělese algebraických čísel. Musíme ukázat, že v A leží alespoň jeden jeho kořen. D˚ ukaz provedeme matematickou indukcí na n. Je-li n = 1, pak f (x) = αx + β, kde α, β ∈ A. Jediný kořen polynomu f je roven −β/α ∈ A. Nechť nyní n > 1. Podle Věty 4.18 existuje těleso K = Q(γ), které obsahuje všechny koeficienty polynomu f , tj. f ∈ K[x]. Mohou nastat dvě možnosti. Buď je f reducibilní nad K, f = gh, kde g, h ∈ K[x], kde stg, sth < n. Pak ale z indukčního předpokladu polynomy g, h mají v A alespoň jeden kořen, a tudíž i f má v A kořen. Pokud je f ireducibilní nad K, lze zkonstruovat těleso K[x]/f . Označíme-li α ∈ C jeden z kořen˚ u polynomu f , pak těleso K[x]/f je izomorfní tělesu K(α), tedy minimálnímu podtělesu tělesa C, které obsahuje K i α. Těleso K(α) má dimenzi n = stf nad K. Protože ale K = Q(γ), pro nějaké γ ∈ A, je dimenze m tělesa K nad Q konečná, rovna řádu algebraického čísla γ. Celkem máme £
¤ £ ¤ £ ¤ K(α) : Q = K(α) : K · K : Q = n · m < +∞ .
S použitím Věty 4.20 vidíme, že K(α) je číselné těleso a všechny jeho prvky, tedy i α, jsou algebraická čísla. 48
4.4
Izomorfizmy těles Q(α)
Necht’ α1 , . . . , αn jsou sdružené kořeny k algebraickému číslu α = α1 . Zkoumejme, jaký vztah mají tělesa Q(α1 ), . . . , Q(αn ). Příklad 4.23. Necht’ α je algebraické číslo druhého řádu, a nechť f (x) = x2 + ax + b, a, b ∈ Q, je jeho minimální polynom. Označme α0 druhý kořen polynomu f . Z Vi`etových vztah˚ u víme, že α + α0 = −a. Proto α0 = −a − α ∈ Q(α). Pro každé těleso druhého řádu tedy platí Q(α) = Q(α0 ). Obecně ale takto jednoduchý vztah neplatí, jak si ukážeme na následujícím příkladě. √ Příklad 4.24. Polynom f (x) = x3 − 2 má pouze jeden reálný kořen α = 3 2. Další dva √ 2πi √ 4πi kořeny, α0 = 3 2e 3 , α00 = 3 2e 3 jsou navzájem komplexně sdružená čísla. Protože je ale Q(α) ⊂ R, je nutně Q(α) 6= Q(α0 ). V předcházejícím příkladě neplatí rovnost mezi tělesy Q(α) a Q(α0 ), protože těleso Q(α) obecně neobsahuje všechny kořeny minimálního polynomu f pro α. Nejmenší podtěleso tělesa C, nad kterým je f úplně reducibilní, tj. ve kterém leží všechny kořeny polynomu f , se nazývá rozkladové těleso polynomu f . Rozkladové těleso T polynomu f ∈ Q[x] s kořeny α1 , . . . , αn je tedy rovno T = Q(α1 , . . . , αn ). Lze ukázat, že toto těleso má řád nejvýše n!. Příklad 4.25. Pokračování Příkladu 4.24. Rozkladové těleso polynomu f (x) = x3 − 2 √ najdeme rozšířením tělesa Q o všechny kořeny f , tj. o algebraická čísla α1 = 3 2, α2 = √ √ 4πi 2πi 3 2e 3 a α3 = 3 2e 3 . Rozšíření provedeme pomocí návodu v d˚ ukazu věty o primitivním √ √ 2πi prvku (Věta 4.18). Položme α = 3 2, β = 3 2e 3 . Je zřejmé,že α i β mají stejné sdružené kořeny. Číslo γ volíme jako α + cβ pro nějaké nenulové c ∈ Q takové, že c 6=
αi − α1 . α2 − αj
To zajistíme například volbou c = 2. Najděme polynom, který má γ = kořen, Y (x − αi − βj )
= (x −
i,j
× (x − × (x −
√ 3 √ 3
2e 2e
√ 3
√ 3
√ 2πi 2 + 2 3 2e 3 za
√ √ √ √ √ 2πi 4πi 3 3 3 3 3 2 − 2 2e 3 )(x − 2 − 2 2)(x − 2 − 2 2e 3 ) ×
2πi 3
√ √ √ √ √ 2πi 2πi 2πi 4πi 3 3 3 3 3 − 2 2e 3 )(x − 2e 3 − 2 2)(x − 2e 3 − 2 2e 3 ) ×
4πi 3
√ √ √ √ √ 2πi 4πi 4πi 4πi 3 3 3 3 3 − 2 2e 3 )(x − 2e 3 − 2 2)(x − 2e 3 − 2 2e 3 ) =
= (x6 + 108)(x3 − 54) . 49
Je zřejmé, že hledaný ireducibilní polynom nad Q, který má γ za kořen, je x6 + 108. To je tedy minimální polynom čísla γ. Těleso √ √ √ √ 2πi 2πi 3 3 3 3 Q(α, β) = Q( 2, 2e 3 ) = Q( 2 + 2 2e 3 ) = Q(γ) je tedy 6. řádu. Toto těleso už je rozkladové těleso polynomu x3 − 2. K tomu stačí ukázat, √ 4πi že kořen α2 = 3 2e 3 už v tělese Q(γ) leží. Ale to je zřejmě pravda. Z Vi`etových vztah˚ u totiž víme, že α1 + α2 + α3 = Je tedy
√ 3
2e
4πi 3
√ 3
2+
√ 3
2e
2πi 3
+
√ 3
2e
4πi 3
= 0.
√ √ √ √ 2πi 2πi 3 3 3 3 = − 2 − 2e 3 ∈ Q( 2, 2e 3 ) = Q(γ) .
Přestože obecně neplatí Q(α) = Q(αj ), tato tělesa mají stejnou strukturu. Jsou totiž isomorfní. Definujme zobrazení σj : Q(α) → Q(αj ) předpisem σj (g(α)) := g(αj ) . Tato zobrazení jsou dobře definovaná. Lze-li prvek β ∈ Q(α) zapsat pomocí dvou r˚ uzných polynom˚ u g1 , g2 , tj. je-li β = g1 (α) = g2 (α), pak (g2 − g1 )(α) = 0, proto podle Věty 4.3 f |g2 −g1 . Odtud plyne, že také (g2 −g1 )(αj ) = 0, tudíž g1 (αj ) = g2 (αj ). Definice zobrazení σj je tedy korektní. Ukažme, že σj je isomorfismus těles Q(α), Q(αj ). Věta 4.26. Necht’ αj je sdružený kořen k α. Zobrazení σj : Q(α) → Q(αj ) definované předpisem σj (g(α)) := g(αj ) je isomorfismus těles Q(α), Q(αj ). Důkaz. Necht’ β = g(α), γ = h(α) jsou dva prvky z tělesa Q(α). Pak σj (β + γ) = σj (g(α) + h(α)) = σj ((g + h)(α)) = = (g + h)(αj ) = g(αj ) + h(αj ) = σj (β) + σj (γ) . Naprosto analogicky ukážeme σj (βγ) = σj (β)σj (γ). Protože zobrazení σj zobrazí bázi tělesa Q(α) na bázi tělesa Q(αj ) (tj. soubor 1, α, . . . , αn−1 na soubor 1, αj , . . . , αjn−1 ), je zobrazení σj bijekce a tedy izomorfizmus. Poznámka 4.27. Speciálně máme σj (cβ) = cσj (β) pro c ∈ Q, β ∈ Q(α), a σj (c) = c pro c ∈ Q. Taky σj (h(β)) = h(σj (β)) pro každé h ∈ Q[x]. Věta 4.28. Nechť α ∈ A. Jediná podtělesa tělesa C izomorfní s Q(α) jsou Q(αi ), kde αi jsou sdružené kořeny k α. 50
Důkaz. Použijeme Lemma 2.35. Je-li totiž T ⊂ C podtěleso tělesa komplexních čísel a ψ : Q(α) 7→ T je izomorfismus, pak ψ zachovává Q, tj. ψ(c) = c pro každé c ∈ Q. Ukážeme, že ψ je roven zobrazení σi pro nějaké i = 1, . . . , n. Zřejmě stačí ukázat, že Pn−1 ψ(α) = σi (α) = αi pro nějaké i ∈ {1, 2, . . . , n}. Nechť f (x) = xn + i=0 ai xi je minimální polynom čísla α. Platí f (α) = 0 a proto ¡ ¢ ¡ ¢ 0 = ψ(0) = ψ f (α) = f ψ(α) . Proto je ψ(α) nutně kořenem minimálního polynomu f , a tedy rovno αi pro nějaké i. Není překvapivé, že tělesa Q(αi ), i = 1, . . . , n, kde α1 , . . . , αn jsou kořeny stejného polynomu f , jsou navzájem izomorfní, protože jsou izomorfní tělesu Q[x]/f . Fakt, že jinému podtělesu tělesa C izomorfní nejsou, už tak triviální není. Spočívá v tom, že jsou-li f a f˜ různé monické polynomy ireducibilní nad Q, pak Q[x]/f , Q[x]/f˜ jsou neizomorfní tělesa. To m˚ uže být překvapující, uvědomíme-li si, ze zaměníme-li Q libovolným koneňým tělesem, takové tvrzení neplatí. Podobně i v případě záměny Q za těleso reálných čísel. Například těleso R[x]/x2 +1 je izomorfní tělesu R[x]/x2 +x+1 , a obě jsou izomorfní C. Věta 4.28 vyjadřuje, že každé podtěleso C konečné dimenze n nad Q (tedy každé algebraické číselné těleso řádu n) má v C n izomorfních kopií. Je zajímavé poznamenat,že celé těleso A všech algebraických čísel má pouze jeden neidentický automorfismus, a to komplexní sdružení. Z Poznámky 2.37 totiž plyne, že jediný automorfismus tělesa A ∩ R je identita. Analogicky k d˚ ukazu Věty 4.28 bychom ukázali, že i se při libovolném automorfismu A zobrazuje na sebe nebo na −i. Dohromady je tedy jediným neidentickým automorfismem tělesa A = (A ∩ R) + i(A ∩ R) komplexní sdružení. Poznámka 4.29. Těleso Q(α), pro které platí, že σj (Q(α)) = Q(α) pro všechna j, se nazývá Galoisovo těleso. Isomorfismy σj jsou pak Galoisovy automorfismy tělesa Q(α), které tvoří jeho tzv. Galoisovu grupu. Galoisovým tělesem je každé číselné těleso druhého řádu, jak jsme viděli v Příkladu 4.23. Další d˚ uležitý případ Galoisových těles rozebereme v sekci 4.6.
4.5
Tělesový polynom, norma, stopa
Definice 4.30. Necht’ α je algebraické číslo řádu n, β ∈ Q(α). Polynom n Y
(x − σi (β))
i=1
51
nazýváme tělesový polynom čísla β v tělese Q(α). Věta 4.31. Necht’ α ∈ A, β ∈ Q(α). Tělesový polynom čísla β patří do Q[x]. Důkaz. Necht’ β = g(α) pro nějaký polynom g ∈ Q[x]. Tělesový polynom prvku β má tvar
n Y
n
(x − σi (β)) = x +
i=1
n−1 X
b i xi .
i=0
Koeficienty bi tělesového polynomu prvku β jsou podle Vi`etových vztah˚ u až na znaménko ¡ ¢ rovny elementárním funkcím v proměnných σ1 (β), . . . , σn (β). Protože σj (β) = σj g(α) = g(αj ), jsou koeficienty bi zároveň symetrickými polynomy v proměnných α1 , . . . , αn . Podle hlavní věty o symetrických polynomech (Věta 3.22) existují polynomy g1 , . . . , gn ∈ Q[x1 , . . . , xn ] tak, že bi = gi (e1 , . . . , en ), kde ei jsou elementární symetrické funkce v proměnných α1 , . . . , αn . Ty jsou ovšem až na znaménko rovny koeficient˚ um minimálního polynomu čísla α. Proto patří do Q a rovněž koeficienty bi tělesového polynomu prvku β patří do Q. Tvrzení 4.32. Necht’ α ∈ A, β ∈ Q(α). Pak pro každé j má číslo σj (β) stejný minimální polynom jako β. Ekvivalentně, σj (β) jsou sdružené kořeny k β. Důkaz. Necht’ h je minimální polynom čísla β. Z Poznámky 4.27 víme, že 0 = σj (0) = σj (h(β)) = h(σj (β)) , což znamená, že σj (β) je kořen polynomu h. Musí tedy být jedním se sdružených kořen˚ u k číslu β. V případě, že β je nižšího řádu než α, mají kořeny tělesového polynomu čísla β v tělese Q(α) násobnost větší než 1. Z Tvrzení 4.32 a Věty 4.3 lze odvodit následující tvrzení. Tvrzení 4.33. Tělesový polynom čísla β v tělese Q(α) je mocninou minimálního polynomu čísla β. Důkaz. Označme h minimální polynom čísla β. Necht’ k ≥ 0 je maximální takové, že Q Q hk dělí ni=1 (x − σi (β)) nad Q. Pak ni=1 (x − σi (β)) = hk g, kde g ∈ Q[x] je monický polynom takový, že h6 |g. Kdyby g 6= 1, pak má nějaký kořen tvaru σi (β). To má ale podle Tvrzení 4.32 také minimální polynom h a podle Věty 4.3 musí h dělit g, a to je spor. D˚ usledek 4.34. Prvky číselného tělesa řádu n jsou algebraická čísla řádu d, kde d je dělitel n. 52
Mezi koeficienty tělesového polynomu xn +
Pn−1 i=0
bi xi čísla β ∈ Q(α) jsou významné
dva, a to koeficient b0 u absolutního členu a koeficient bn−1 . Pomocí nich definujeme dvě d˚ uležitá zobrazení. Definice 4.35. Necht’ α ∈ A. V tělese Q(α) Definujeme zobrazení normy N : Q(α) → Q a stopy T : Q(α) → Q předpisem N (β) =
n Y
σj (β) ,
T (β) =
j=1
n X
σj (β) ,
pro
β ∈ Q(α) .
j=1
Z Vi`etových vztah˚ u je zřejmé, že N (β) je až na znaménko rovna absolutnímu koeficientu tělesového polynomu čísla β. Podobně T (β) je až na znaménko rovna koeficientu u mocniny xn−1 . Uved’me některé jednoduché vlastnosti N (β), T (β). Tvrzení 4.36. Necht’ α ∈ A je řádu n. Pro zobrazení N , T v tělese Q(α) platí: • Norma je multiplikativní, tedy pro β, γ ∈ Q(α) platí N (βγ) = N (β)N (γ). • Stopa je aditivní, tedy pro β, γ ∈ Q(α) platí T (β + γ) = T (β) + T (γ). • N (c) = cn a T (c) = nc pro c ∈ Q. • N (cβ) = cn N (β) a T (cβ) = cT (β) pro c ∈ Q, β ∈ Q(α). • N (0) = T (0) = 0, Naopak je-li β 6= 0, pak N (β) 6= 0. Pro stopu toto obecně neplatí. Poznámka 4.37. N (β), T (β) závisí na tělese, např N (c) = cn , pro c ∈ Q.
4.6
Příklady algebraických číselných těles
Uveďme dva nejklasičtější a zároveň nejd˚ uležitější příklady algebraických číselných těles.
4.6.1
Reálná a imaginární kvadratická tělesa
√ Popišme všechna číselná tělesa druhého řádu. Je zřejmé, že stačí studovat Q( m), kde m √ je racionální číslo takové, že m ∈ / Q. Je dokonce možné omezit se na m celočíselné. Jinak q q √ by bylo m = pq a Q( pq ) = Q(q pq ) = Q( pq). Navíc m˚ užeme uvažovat pouze m ∈ Z, která nejsou dělitelná druhou mocninou žádného prvočísla, tj. m neobsahující čtverec. √ Definice 4.38. Necht’ m ∈ Z neobsahuje čtverec. Číselné těleso Q( m) pro m > 0 nazýváme reálné kvadratické těleso, a pro m < 0 imaginární kvadratické těleso. 53
√ √ Těleso Q( m) je číselné těleso řádu 2. Minimální polynom čísla m je x2 − m a √ √ √ √ sdružený kořen k m je tedy − m. Protože Q( m) = Q(− m), je to Galoisovo těleso a zobrazení σ1 , σ2 jsou jeho automorfismy, přičemž σ1 = id . Označme proto jediný netriv√ √ iální automorfismus tělesa Q( m) jako σ = σ2 . Prvky kvadratického tělesa Q( m) jsou √ √ tvaru g( m) = a + b m, a, b ∈ Q. Máme proto √ √ σ(a + b m) = a − b m , √ √ √ N (a + b m) = (a + b m)(a − b m) = a2 − mb2 , √ √ √ T (a + b m) = (a + b m) + (a − b m) = 2a .
4.6.2
Cyklotomická tělesa
Jiným d˚ uležitým příkladem číselných těles jsou tělesa generovaná kořenem z jedničky. Definice 4.39. Cyklotomické těleso je číselné těleso Q(ζ), kde ζ = e
2πi n
.
Z kapitoly o cyklotomických polynomech víme, že ζ je kořenem n-tého cyklotomického polynomu Φn . Protože Φn je monický polynom s celočíselnými koeficienty ireducibilní nad Q, je ζ algebraické číslo řádu ϕ(n), Q(ζ) = {a0 + a1 ζ + · · · + aϕ(n)−1 ζ ϕ(n)−1 | ai ∈ Q} . Sdružené kořeny k ζ jsou právě všechny kořeny polynomu Φn , tj. ζ k , kde k, 1 ≤ k ≤ n je nesoudělné s n. Vzledem k tomu, že sdružené kořeny k ζ jsou jeho mocniny, je ζ k ∈ Q(ζ), a protože ζ k je pro k nesoudělné s n algebraické číslo stejného řádu jako ζ, je zřejmé, že Q(ζ) je Galoisovo těleso, Q(ζ k ) = Q(ζ). Toto těleso má ϕ(n) automorfism˚ u, kromě σ1 = id., ještě netriviální ¡ ¢ σk a0 + a1 ζ + · · · + aϕ(n)−1 ζ ϕ(n)−1 = a0 + a1 ζ k + · · · + aϕ(n)−1 ζ k(ϕ(n)−1) , pro 1 < k < n, nesoudělné s n. Automorfizmus σk je zřejmě jendoznačně zadán hodnotou σk (ζ) = ζ k . Pro složení automorfism˚ u σi , σj pak platí ¡ ¢ ¢i ¡ ¢ ¡ ¢j ¡ ¢j ¡ ¢i ¡ σi σj (ζ) = σi (ζ j ) = σi (ζ) = ζ i = ζ j = σj (ζ) = σj (ζ i ) = σj σi (ζ) , a tedy automorfizmy σi a σj komutují. Nejjednodušším případem je n = p, prvočíslo. Pak Φp (x) = xp−1 + xp−2 + · · · + x + 1 =
p−1 Y j=1
54
(x − ζ j ) ,
(4.5)
číslo ζ = e
2πi p
je řádu ϕ(p) = p − 1 a sdružené kořeny jsou ζ j , 1 ≤ j ≤ p − 1. V takovém
případě je každému automorfizmu σk jednoznačně přirazen prvek k ∈ {0, 1, 2, . . . , p − 1} a naopak. Protože ζ p = 1, složení automorfizmů σi a σj odpovídá podle (4.5) automorfizmus σij modp . Proto je grupa Aut Q(ζ) izomorfní grupě Zp \ {0} s násobením modulo p. Shrňme výsledky do tvrzení, které využijeme později. Věta 4.40. Grupa automorfism˚ u Aut(Q(ζ)) cyklotomického tělesa Q(ζ), kde ζ = e
2πi n
,
je komutativní. V případě, že n = p je prvočíslo, je Aut(Q(ζ)) izomorfní multiplikativní grupě tělesa Zp .
55
5
Diofantické rovnice
Pod heslem diofantické rovnice se rozumí rovnice tvaru f (x1 , x2 , . . . , xk ) = b, u které hledáme řešení v přirozených, celých nebo racionálních číslech. Obvykle f (x1 , x2 , . . . , xk ) značí polynom s racionálními nebo celými koeficienty. Název pochází od řeckého matematika Diofanta, který žil v Alexandrii asi ve druhém století. Nejslavnější diofantická rovnice je rovnice xn + y n = z n . Už v starém Řecku veděli, že tato rovnice má nekonečně mnoho řešení pro n = 2. My řešení rovnice x2 + y 2 = z 2 popíšeme v kapitole 5.3. O tom, že pro žádné n ≥ 3 rovnice nemá řešení, byl přesvědčen už Pierre Fermat, důkaz tohoto faktu podal až Wiles v roce 1996. O historii tzv. poslední Fermatovy věty viz [11]. Nejdřív potřebujeme doplnit vlastnosti konečných grup Zn .
5.1
Kvadratická rezidua
Definice 5.1. Necht’ n ∈ N. Prvek y okruhu Zn , pro který má rovnice y = x2
mod n
řešení, se nazývá kvadratické reziduum modulo n. Množinu kvadratických reziduí modulo n značíme Rn , tj. Rn = {x2 mod n | x ∈ Z} Příklad 5.2. R6 = {0, 1, 4, 3}, R8 = {0, 1, 4}, R11 = {0, 1, 4, 9, 5}. Věta 5.3. Pro každé n ∈ N platí #Rn ≤ 1 + b n2 c . Je-li n prvočíslo, pak v (5.1) platí rovnost.
56
(5.1)
Důkaz. Protože (n ± x)2 = x2 mod n , je Rn = {x2 mod n | x ∈ Z, 0 ≤ x ≤ n2 }, a tedy počet prvků Rn nepřevýší 1 + b n2 c, jak tvrdí první část věty. Počet prvků v Rn by byl ostře menší než právě odvozená mez, kdyby x21 = x22 mod n pro nějaká různá x1 , x2 ∈ {0, 1, . . . , b n2 c}. Pro taková x1 , x2 je x1 ± x2 6= 0 mod n. Je-li n prvočíslo, je Zn těleso a součin dvou nenulových prvků se nerovná nule, tj. (x1 + x2 )(x1 − x2 ) 6= 0
mod n
=⇒
x21 6= x22
mod n .
Poznamenejme, že rovnost v (5.1) může nastat i pro neprvočíselná n, viz R6 . D˚ usledek 5.4. Pro každé prvočíslo p > 2 má rovnice x2 + y 2 + 1 = 0 mod p řešení vyhovující nerovnostem 0 ≤ x <
p 2
a 0 ≤ y < p2 .
Důkaz. Obě množiny Rp a 1 − Rp mají
p+1 2
prvků. Jelikož jejich sjednocení leží v p
prvkové množině Zp , je jejich průnik neprázdný, tj. existuje x, y ∈ Zp takové, že x2 = 1−y 2 mod p. Protože pro každé z je z 2 = (p − z)2 mod p, lze nalézt x a y v požadovaném intervalu. Věta 5.5. Necht’ p ∈ P. Pak platí −1 ∈ Rp
⇐⇒
p = 2 nebo p = 1 mod 4
Důkaz. Pro p = 2 tvrzení platí. Předpokládejme, že p je liché prvočíslo, a v množině Zp \ {0} definujme ekvivalenci x∼y
⇐⇒
x = ±y
mod p nebo x = ±y −1
mod p
Každá třída ekvivalence má tvar {x, −x, x−1 , −x−1 }, je tedy nanejvýš čtyřprvková. Zkoumejme, které ze tříd, mají méně prvků. Protože uvažujeme p > 2, je x 6= −x mod p. Rovnost x = x−1 mod p implikuje x = 1 a jedná se o třídu {1, −1}. Kdyby pro nějaké x nastalo x = −x−1 mod p, měli bychom další třídu o dvou prvcích {x, −x}. Ostaní třídy ekvivalence jsou čtyřprvkové. Uvažovaná ekvivalence je na množině mohutnosti p−1. Další dvouprvková třída kromě třídy {1, −1} existuje proto právě tehdy, když 4 dělí p − 1. Jelikož x = −x−1
mod p
⇐⇒
je důkaz hotov. 57
x2 = −1 mod p ,
5.2
Lineární diofantické rovnice
Věta 5.6. Necht’ ai , a2 , . . . , ak jsou celočíselné parametry ne všechny rovny nule, b ∈ Z. Rovnice a1 x1 + a2 x2 + . . . + ak xk = b
(5.2)
pro neznámé xi , x2 , . . . , xk má řešení v celých číslech, pravě když nsd(ai , a2 , . . . , ak ) dělí pravou stranu rovnice b. Důkaz. Označme d = nsd(ai , a2 , . . . , ak ). Číslo d dělí levou stranu rovnice (5.2), a proto podmínka d | b je nutná. Ukážeme, že je i postačující. Předpokládejme b = db0 , pro b0 ∈ Z. Uvažujme množinu M := {ai z1 + a2 z2 + . . . + ak zk | zi , z2 , . . . , zk ∈ Z} Zřejmě 1. M je uzavřena na sčítání svých prvků a násobení libovolným celým číslem. 2. M obsahuje ai pro každé i = 1, 2, . . . , k. 3. d dělí každý prvek množiny M . Položme s := min{z ∈ M | z > 0} Nejdříve uká žeme, že s dělí každé ai . Necht’ ri je zbytek po dělení čísla ai číslem s, tj. ai = ki s + ri , pro nějaké ki , ri ∈ Z, 0 ≤ ri < s. Protože s ∈ M , je podle vlastností 1 a 2 také ri ∈ M . Z definice čísla s a nerovnosti 0 ≤ ri < s plyne, že ri = 0. Protože s dělí každé ai , nutně s dělí d. Vlastnost 3 říká speciálně, že d dělí s. Proto d = s ∈ M , a tedy existují z1 , . . . zk ∈ Z takové, že ai z1 +a2 z2 +. . .+ak zk = d = nsd(ai , a2 , . . . , ak ) . (5.3) Z toho už plyne, že b = b0 d = ai (b0 z1 ) + a2 (b0 z2 ) + . . . + ak z(b0 zk ) . Tedy rovnice (5.2) má řešení xi = b0 zi . Pro řešení rovnice (5.2) byla podstatná vlastnost (5.3). Pro její platnost je důležité, že zi ∈ Z. Když však hledáme řešení rovnice (5.2) v nezáporných celých číslech vlastnost (5.3) nám nepomůže. Např. rovnice 3x1 + 5x2 = 7 má řešení v celých číslech, ne však v přirozených. V dalším textu budeme bez újmy na obecnosti předpokládat, že nsd(ai , a2 , . . . , ak ) = 1. 58
Věta 5.7. Necht’ a1 , a2 , . . . , ak a b jsou přirozená čísla a nsd(a1 , a2 , . . . , ak ) = 1. Když (ak − 1)
k−1 X
ai ≤ b ,
(5.4)
i=1
pak existují nezáporná celá čísla x1 , x2 , . . . , xk taková, že a1 x1 + a2 x2 + . . . + ak xk = b
(5.5)
Důkaz. Popíšeme algoritmus hledání řešení. Nejdříve podle věty 5.6 najdeme y1 , . . . , yk ∈ Z tak, aby b = a1 y1 + a2 y2 + . . . + ak yk . Pro i = 1, . . . , k − 1 položíme xi rovno zbytku po dělení čísla yi posledním koeficientem ak , tj. yi = ak qi + xi
a
0 ≤ xi ≤ ak − 1 .
Abychom dostali řešení rovnice, musíme vhodně zvolit poslední proměnnou xk . Protože b = a1 (ak q1 + xi ) + a2 (ak q2 + x2 ) + . . . + ak−1 (ak qk−1 + xk−1 ) + ak yk = ³ = a1 x1 + a2 x2 + . . . + ak−1 xk−1 + ak yk + stačí položit xk := yk +
Pk−1 i=1
k−1 X
´ a i qi ,
i=1
ai qi . Jelikož a1 x1 +a2 x2 +. . .+ak−1 xk−1 ≤ (ak −1)
(5.6) Pk−1 i=1
ai , a
předpokládame platnost (5.4), je nutně poslední sčítanec ak xk v rovnosti (5.6) nezáporný, tj. xk ≥ 0. Předchozí věta říká, že každé dostatečně velké b lze nakombinovat pomocí nezáporných celočíselných koeficientů z hodnot a1 , a2 , . . . , ak . To znamená, že pro přirozená nesoudělná čísla a1 , a2 , . . . , ak existuje minimální takové celé číslo F (a1 , a2 , . . . , ak ) s vlastností b ≥ F (a1 , a2 , . . . , ak )
=⇒
b ∈ {a1 x1 + a2 x2 + . . . + ak xk | x1 , . . . , xk ∈ N0 } .
Úloha určit hodnotu F (a1 , . . . , ak ) se nazývá Frobeniův problém. Hodnota F (a1 , . . . , ak ) je známá pro k = 2 a k = 3. Obecně však Frobeniův problém není vyřešen. Pro přehled částečných výsledků viz [7]. Není těžké ukázat, že v pří padě k = 2 je F (a1 , a2 ) = (a1 − 1)(a2 − 1) a mezi ”malými” pravými stranami b ∈ {0, 1, 2, . . . , F (a1 , a2 )−1} je přesně polovina, pro které rovnice (5.5) má řešení.
59
5.3
Pythagorejské trojice
Cílem této kapitoly bude popsat všechna řešení diofantické rovnice x2 + y 2 = z 2 . Pro trojici x, y, z, která je řešením této rovnice, zřejmě platí: • Trojice y, x, z a trojice ±x, ±y, ±z jsou řešeními. • Trojice kx, ky, kz je řešením pro každé k ∈ Z. • Když k | x a k | y, pak také k | z a trojice xk , ky , kz je řešením. • Když x a y jsou nesoudělná, pak x a y nemohou být obě současně lichá. Proto pro popis všech řešení rovnice x2 + y 2 = z 2 stačí popsat řešení s vlastnostmi: x, y, z ∈ N ,
x a y nesoudělná a x sudé
(5.7)
Takovému řešení se říká pythagorejská trojice. Věta 5.8. Trojice x, y, z ∈ N je pythagorejská, právě když existují nesoudělná celá čísla m a n s opačnou paritou, m > n ≥ 1, taková, že x = 2mn , y = m2 − n2 a z = m2 + n2 Důkaz. Protože (2mn)2 + (m2 − n2 )2 = (m2 + n2 )2 , je jedna implikace věty zřejmá. Předpokládejme proto, že x, y, z je pythagorejská trojice. Sudost x vynucuje lichost y a z a nesoudělnost x a y vynucuje nesoudělnost y a z. Proto jsou celá a nesoudělná i čísla z+y 2
a
z−y . 2 2
Úpravami zíi skáme: 2
x +y =z
2
=⇒
2
x = (z + y)(z − y)
=⇒
³ x ´2 2
=
z+y z−y . 2 2
Ted’ si stačí uědomit, že vztah c2 = pq pro nesoudělná čísla p a q implikuje, že p i q jsou kvadráty dvou celých nesoudělných čísel. Proto existují taková nesoudělná m, n ∈ N, že z+y = m2 2
a
z−y = n2 . 2
(5.8)
Protože v pythagorejské trojici je z > y, je m > n > 0. Vyjádřením z, y ze vztahu (5.8) a x z rovnice x2 + y 2 = z 2 už dostaneme tvrzení věty. 60
Poznámka 5.9. Geometrická představa nám dá velice jednoduchý návod, jak lze snadno najít řešení diofantické rovnice x2 + y 2 = z 2 . Ke každému celočíselnému řešení lze zkonstruovat racionální bod rovniny (X, Y ) = ¢ , y , který splňuje X 2 + Y 2 = 1, a tedy leží na jednotkové kružnici. Přímka p, která z z
¡x
prochází racionálním bodem kružnice (X, Y ) a bodem (−1, 0), má tedy racionální směrnici, označme ji
m . n
Našli jsme korespondenci mezi řešeními diofantické rovnice a racionál-
ními směrnicemi. Ted’ naopak. Zkoumejme průsečíky jednotkové kružnice X 2 + Y 2 = 1 a přímky Y = m (X n
+ 1) s racionální směrnicí, která prochází bodem (−1, 0). Tedy hledáme řešení
kvadratické rovnice 1 = X2 +
³
m (X n
+ 1)
´2
=⇒
2
2
(m + 1)X 2 + 2 m X+ n2 n2
m2 n2
− 1 = 0.
Bod (−1, 0) je bodem přímky i kružnice, a proto jedno z řešení kvadratické rovnice je X1 = −1. Protože součin kořenů kvadratické rovnice je koeficient u absolutního členu po normalizování kvadratického polynomu na monický, je druhý kořen naši rovnice X2 =
1− m2 n2
m2 n2
+1
=
n2 − m2 m2 + n2
=⇒
Y2 =
m 2mn (X2 + 1) = 2 . n m + n2
Ze souřadnic racionálního bodu jednotkové kružnice už odvodíme řešení (x, y, z).
5.4
Součet dvou čtverců
Cílem této kapitoly bude popsat taková přirozená čísla n, pro která diofantická rovnice x2 + y 2 = n
(5.9)
má řešení v celých číslech, neboli popsat celá čísla, která lze reprezentovat jako součet dvou čtverců. Při popisu pythagorejských trojic v kapitole 5.3 jsme zkoumali tuto otázku v případě, kdy pravá strana n je kvadrát celého čísla, tj. n = z 2 . Ukázali jsme, že x2 + y 2 = z 2 má řešení, když samotné z je součtem dvou čtverců. Charakterizovat parametry n, pro něž má rovnice (5.9) řešení, znamená studovat množinu M := {x2 + y 2 | x, y ∈ Z} . Ukažme nejdříve několik jednoduchých vlastností množiny M . 61
• Když n = 3 mod 4, pak n ∈ / M. Tento fakt plyne z toho, že pro liché číslo k je k 2 = 1 mod 4, pro sudé číslo k je k 2 = 0 mod 4. Proto x2 + y 2 mod 4 nabývá pouze hodnoty 0, 1 nebo 2. • Když n ∈ M , pak k 2 n ∈ M pro každé k ∈ Z. Z rovnosti n = x2 + y 2 totiž plyne k 2 n = (kx)2 + (ky)2 . • Když n1 ∈ M a n2 ∈ M , pak také n1 n2 ∈ M . ¡ ¢2 Pro n1 = x21 + y12 a n2 = x22 + y22 lze snadno ověřit, že n1 n2 = x1 x2 − y1 y2 + ¡ ¢2 x1 y2 + x2 y1 Z vyjmenovaných vlastností množiny M je zřejmé, že klíčový problém tkví v tom, zda prvočíslo tvaru 4k + 1 patří do M . Kladnou odpověd’ na tuto otázku dal v roce 1747 Euler. První důkaz, který uvedeme, pochází z roku 1902 od norského matematika Axela Thueho. S myšlenkou druhého důkazu přišel Heath Brown v roce 1971. My prezentujeme zjednodušení jeho důkazu, které publikoval v roce 1990 Don Zagier. Věta 5.10. Necht’ p je prvočíslo tvaru 4k +1. Pak existují x, y ∈ Z takové, že p = x2 +y 2 . Důkaz. (A. Thue) Protože prvočíslo p má tvar p = 4k + 1, je −1 kvadratické reziduum mod p. Existuje tedy s ∈ {1, 2, . . . , p − 1} takové, že s2 = −1 mod p. √ Uvažujme páry (x0 , y 0 ), kde x0 , y 0 ∈ {0, 1, 2, . . . , b pc} a hodnoty x0 − sy 0 mod p. √ Protože párů je (1 + b pc)2 > p, existují podle holubníkového princípu dva různé páry (x0 , y 0 ) a (x00 , y 00 ) takové, že x0 − sy 0 = x00 − sy 00
mod p .
(5.10)
√ Položme x := |x0 − x00 | a y := |y 0 − y 00 |. Zřejmě x, y ∈ {0, 1, 2, . . . , b pc} a (x, y) 6= (0, 0), protože páry (x0 , y 0 ) a (x00 , y 00 ) jsou různé. Platí tedy odhady 0 < x2 + y 2 < 2p .
(5.11)
Podle (5.10) a v důsledku volby s dostaneme x = ±sy
mod p
=⇒
x2 = s2 y 2
mod p
=⇒
x2 = −y 2
x2 + y 2 je dělitelné číslem p. To však spolu s (5.11) znamená p = x2 + y 2 .
62
mod p
Thueho důkaz využíval důležité tvrzení o tom, kdy je −1 kvadratické reziduum. Následující důkaz se neopírá o žádné výsledky teorie čísel. Důkaz. (D. Zagier) Položme S := {(x, y, z) ∈ Z3 | 4xy + z 2 = p a x, y > 0} . Tato množina je konečná. Žádný bod množiny S nemá třetí souřadnici z = 0, v tom případě by totiž p = 4xy, a to by byl spor s prvočíselností p. Jelikož (x, y, z) ∈ S ⇔ (x, y, −z) ∈ S, má množina S sudý počet prvků, přičemž přesně polovina jejích prvků leži v prvním oktantu. Označme tuto polovinu T := {(x, y, z) ∈ S | z > 0} . Našim cí lem bude ukázat, že tato plovina, tj. T má lichý počet prvků. Lichost #T zaručí, že zobrazení h : T → T dané předpisem h(x, y, z) = (y, x, z) má v T pevný bod. Ten je tvaru (x, x, z). To znamená, že p = 4x2 + y 2 je součet dvou čtverců. K ukončení důkazu tedy stačí, abychom ukázali, že polovina počtu prvků S je lichá. K tomu využijeme množinu U := {(x, y, z) ∈ S | x − y + z > 0} . Ukážeme, že 1. U tvoří polovinu množiny S; 2. počet prvků množiny U je lichý. 1) Uvažujme zobrazení f : S → S dané předpisem f (x, y, z) = (y, x, −z). Pro žádné (x, y, z) ∈ S není možné, aby x − y + z = 0. To by totiž implikovalo p = 4xy + z 2 = 4xy + (x − y)2 = (x + y)2 , a to by odporovalo p ∈ P. Z tvaru f plyne, že (x, y, z) ∈ U , právě když f (x, y, z) ∈ / U . Proto S = U ∪ f (U )
=⇒
#S = 2#U .
2) Definujme na U zobrazení g(x, y, z) = (x − y + z, y, 2y − z) . 63
Ověřme, že g zobrazuje U do U : Protože 4(x − y + z)y + (2y − z)2 = 4xy + z 2 = p, je g(x, y, z) ∈ S. Navíc je (x − y + z) − y + (2y − z) = x > 0, a tedy g(x, y, z) ∈ U . Snadno lze ukázat, že g 2 je identita. To mimo jiné znamená, že g je bijekcí U na U . Zkoumejme pevné body g. g(x, y, z) = (x, y, z)
=⇒
y=z
=⇒
p = 4xy + y 2 = y(4x + y)
Protože p je prvočíslo tvaru p = 4k + 1, je nutně y = 1 a x = k. Zobrazení g má na U jediný pevný bod (k, 1, 1). To spolu s faktem, ze g 2 je identita, implikuje že U má lichý počet prvků. Tím je důkaz hotov. Věta 5.11. Číslo n ∈ N lze zapsat jako součet dvou čtverců, právě když prvočísla tvaru 4k + 3 se v rozkladu čísla n nacházejí v sudé mocnině. Důkaz. Nutnost podmínky dokážeme sporem. Předpokládejme, že existuje n, které je součtem dvou čtverců, a přitom se v jeho rozkladu nachází v liché mocnině prvočíslo tvaru 4k + 3. Vezměme nejmenší možné n s touto vlastností. Máme tedy n = x2 + y 2 a prvočíslo p = 4k + 3, které dělí n. Odvodíme, že p dělí x i y. Kdyby totiž p nedělilo x, v tělese Zp by bylo x 6= 0 mod p a existoval by k němu inverzní prvek x−1 . Protože p dělí n, platí 2
³
2
x + y = 0 mod p
=⇒
1 + yx
−1
´2
=0
mod p .
Číslo −1 by tak bylo kvadratickým reziduem, a to je v tělese Zp s prvočíslem p = 4k + 3 nemožné. Ze stejných důvodů p dělí y. M˚ užeme psát x = px0 a y = py 0 . Rovnost n = x2 + y 2 = (px0 )2 + (py 0 )2 implikuje, že p2 je dělitelem n a n0 :=
n = (x0 )2 + (y 0 )2 . p2
Číslo n0 je součtem dvou čtverců. Jelikož p se nacházelo v rozkladu n v liché mocnině, nachází se p v rozkladu n0 také v liché mocnině. Protože n0 < n, dostali jsme spor s volbou n. Obrácená implikace plyne z věty 5.10 a vlastností množiny M .
5.5
Součet čtyř čtverců
Jak jsme viděli v předchozí kapitole, ne všechna přirozená čísla lze zapsat jako součet dvou čtverců. Ani součet tří čtverců není vždy postačující. Protože x2 mod 8 nabývá 64
pouze hodnoty 0, 1 nebo 4, leží x21 + x22 + x23 mod 8 v množině {0, 1, 2, 3, 4, 5, 6}. Žádné číslo n tvaru n = 8k + 7 nelze tedy zapsat jako součet tří čtverců. Náplní této kapitoly bude dokázat, že čtyři čtverce už stačí. Věta 5.12. Pro každé n ∈ N existují x1 , x2 , x3 , x4 ∈ Z takové, že n = x21 + x22 + x23 + x24 . Už v roce 1621 Bachet tvrdil, aniž by své tvrzení dokázal, že každé číslo lze zapsat jako součet čtyř čtverců. První důkaz podal Lagrange v roce 1770. Důkaz, který uvedeme my, pochází z dopisu Dirichleta Liouvilleovi z roku 1856. V roce 1834 Jacobi dokonce určil, kolika způsoby lze n takto zapsat. Následující lemma, které plyne bezprostředně z tzv. Eulerovy identity 10.20, nám umožňuje omezit se v důkazu věty 5.12 na prvočíselné n. Lemma 5.13. Když čísla n1 a n2 lze vyjádřit jako součet čtyř čtverců, pak i jejich součin n1 n2 lze vyjádřit jako součet čtyř čtverců. Lemma 5.14. Necht’ p ∈ P a m ∈ N, 1 < m < p. Když mp lze zapsat jako součet čtyř čtverců, pak existuje n ∈ N, 1 ≤ n < m takové, že np lze také zapsat jako součet čtyř čtverců. Důkaz. Necht’ mp = x21 + x22 + x23 + x24 .
(5.12)
Definujme y1 , y2 , y3 a y4 tak, aby pro i = 1, 2, 3, 4 platilo y i = xi
mod m
a
−
m 2
< yi ≤
m 2
.
(5.13)
Z volby yi plyne, že 0 ≤ y12 + y22 + y32 + y42 ≤ m2
(5.14)
Ukážeme, že obě nerovnosti jsou ostré: 0 = y12 + y22 + y32 + y42
⇒
xi = 0 mod m
⇒
m2 dělí mp .
To je vzhledem k předpokladu p ∈ P nemožné. A podobně y12 + y22 + y32 + y42 = m2
⇒
xi =
m 2
mod m
65
⇒
m2 dělí x21 + x22 + x23 + x24 = mp .
Ze vztahů (5.12) a (5.13) plyne, že y12 + y22 + y32 + y42 = 0 mod m, a tedy existuje n ∈ Z takové, že y12 + y22 + y32 + y42 = nm .
(5.15)
Protože nerovnosti v (5.14) jsou ostré, je 0 < n < m. Kombinací (5.15), (5.12) a Eulerovy identity 10.20 získáme z1 , z2 , z3 , z4 takové, že m2 np =
¡
¢¡ ¢ x21 + x22 + x23 + x24 y12 + y22 + y32 + y42 = z12 + z22 + z32 + z42 ,
(5.16)
přičemž z1 = x1 y1 + x2 y2 + x3 y3 + x4 y4 ,
z2 = x1 y2 − x2 y1 − x3 y4 + x4 y3 ,
z3 = x1 y3 − x3 y1 + x2 y4 − x4 y2 ,
z4 = x1 y4 − x4 y1 − x2 y3 + x3 y2 .
Z definice yi proto plyne z1 = x21 + x22 + x23 + x24
mod m
z 2 = x1 x2 − x2 x1 − x3 x 4 + x4 x3
=⇒
mod m
m | z1 =⇒
m | z2
a analogicky m | z3 a m | z4 . Ted’ už stačí položit ui =
zi ∈ Z pro i = 1, 2, 3, 4 m
a po zkrácení rovnice (5.16) faktorem m2 dostaneme np = u21 + u22 + u23 + u24 .
Máme tak vše nachystáno na důkaz věty 5.12. Důkaz. Jak jsem už konstatovali, lemma 5.13 nás opravňuje se omezit při důkazu na prvočísla. Necht’ p ∈ P. Podle důsledku 5.4 existují x, y ∈ Z takové, že x2 + y 2 + 1 = 0
mod p
a
0 ≤ x, y <
p 2
.
Označme x1 = x, x2 = y, x3 = 1, x4 = 0. V tomto značení můžeme (5.17) přepsat x21 + x22 + x23 + x24 = 0 mod p
a
0 < x21 + x22 + x23 + x24 < p2 .
To znamená, že existuje m ∈ Z takové, že 1≤m
a
x21 + x22 + x23 + x24 = mp .
Na tento vztah aplikujeme opakovaně lemma 5.14 tak dlouho, až je m = 1. 66
(5.17)
Poznámka 5.15. Lagrange první dok´zal, že každé n ∈ N lze zapsat jako n = x21 + x22 + x23 + x24 , kde x1 , . . . , x4 jsou nezáporná celá čísla. Wieferich dokázal, že každé přirozené číslo lze zapsat jako sumu devíti třetích mocnin, tj. n = x31 + x32 + . . . + x39 , kde x1 , . . . , x9 jsou nezáporná celá čísla. Oba tyto výsledky jsou speciální případy Waringova problému, jednoho z nejslavnějších problému teorie čísel. Waringův problém zní: pro každý exponent k ∈ N existuje h ∈ N takové, že každé přirozené číslo n lze zapsat jako součet h k-tých mocnin. V roce 1909 toto tvrzení dokázal David Hilbert pro každý exponent k.
5.6
Pellova rovnice
Věnujme se diofantické rovnici x2 − Dy 2 = 1
(5.18)
s parametrem D ∈ N a celočíselnými proměnnými x, y. Zřejmě (1, 0) a (−1, 0) jsou řešeními této rovnice. Tato řešení nazveme triviální. Když D = m2 pro nějaké m ∈ N, lze rovnici urpavit x2 −m2 y 2 = (x−my)(x+my) = 1. To implikuje x−my = 1 a x+my = 1 nebo x−my = −1 a x+my = −1. A tedy rovnice √ / N. To je má pouze triviální řešení. Proto se od této chvíle zaměříme na případ, kdy D ∈ √ ekvivalentní podmínce, že D je iracionální. Rovnici (5.18) s požadavkem na iracionalitu √ D se říká Pellova rovnice. Tento název začal používat Euler, i když není jasné z jakých důvodů. Cílem této kapitoly bude ukázat, že Pellova rovnice má nekonečně mnoho řešení. Také popíšeme strukturu množiny řešení. Následující věta je z roku 1842 a pochází od Dirichleta. Její důkaz je jedním z nejhezčích použití banálního holubníkového principu. Proto není divu, že se v zemích ze silným vlivem německé matematiky pro holubníkový princip ujal název Dirichletův princip. Věta 5.16. Necht’ α ∈ R \ Q. Pak existuje nekonečně mnoho zlomků tvaru takových, že
¯ ¯ ¯α −
p q
ve zkráceném
p ¯¯ 1 ¯ < 2. q q
£ ¢ £ ¢ £ ¢ Důkaz. Zvolme Q ∈ N, ≥ 2 a uvažujme Q intervalů 0, Q1 , Q1 , Q2 , . . . , Q−1 , 1 ; délka Q každého z nich je
1 . Q
Dále uvažujme Q + 1 zlomkových částí {0α}, {1α}, {2α}, . . . , {Qα}.
Podle Dirichletova principu do jednoho z intervalů padnou dvě zlomkové části. Tedy existují indexy 0 ≤ j < i ≤ Q takové, že ¯ ¯ ¯ ¯ 1 > ¯{iα} − {jα}¯ = ¯(i − j)α − [iα] + [jα]¯ . Q 67
Označme p := [iα] − [jα] a q := i − j. Z konstrukce plyne, že 1 ≤ q ≤ Q. Ukázali jsme pomocné tvrzení ¡
¢¡ ¢³¯¯ ∀Q ∈ N, Q ≥ 2 ∃p, q ∈ Z, 1 ≤ q ≤ Q ¯α −
p ¯¯ 1 ´ < . ¯ q qQ
(5.19)
Z tvaru nerovnosti plyne, že bez újmy na obecnosti můžeme předpokládat nesoudělnost p a q. Je zřejmé, že pro každé pevné Q je množina ¯ n¯ p ¯¯ 1 o p ¯¯ ¯ ¯ MQ := ¯α − ¯ | p, q ∈ Z, 1 ≤ q ≤ Q, ¯α − ¯ < q q qQ konečná. Z iracionality α plyne, že její minimum je kladné. Abychom našli nekonečně mnoho zlomků pq vyhovujících nerovnosti ve zneění věty, ¡ ¢ zkonstruujme posloupnost pqii . Zvolme libovolně Q1 ∈ N, Q1 ≥ 2 a posloupnost (Qi ) tak, aby 1 < min MQi . Qi+1 Pro každé Qi nalezneme podle (5.19) zlomek pqii ve zkráceném tvaru. Z definice MQi je ¡ ¢ vidět, že qi+1 > qi , a tedy posloupnost pqii má nekonečně mnoho různých členů. Každý z nich splňuje
¯ 1 1 pi ¯¯ ¯ ≤ 2. ¯α − ¯ < qi qi Qi qi
Věta 5.17. Každá Pellova rovnice x2 − Dy 2 = 1, kde D ∈ N a
√
D je iracionální, má
netriviální řešení v celých číslech. Důkaz. Podle věty 5.16 existuje nekonečně mnoho párů (p, q) nesoudělných čísel takových, ¯ √ ¯ že ¯p − q D¯ < 1q . Pro tyto páry platí √ √ √ √ ´ √ 1 ³1 |p2 − Dq 2 | = |p − q D| . |p − q D + 2q D| < + 2q D ≤ 1 + D . q q √ √ Proto mezi celými čísly v intervalu (−1 − D, 1 + D) existuje m ∈ Z takové, že pro √ nekonečně mnoho párů (p, q) je p2 − Dq 2 = m. Z iracionality D plyne, že m 6= 0. Z Dirichletova principu dostaneme, že existují dva různé pá ry (p1 , q1 ) a (p2 , q2 ) vyhovující p21 − Dq12 = m ,
p22 − Dq22 = m ,
p 1 = p2
mod m ,
q1 = q2
mod m . (5.20)
Z prvních dvou rovností získáme m2 = (p21 − Dq12 )(p22 − Dq22 ) = (p1 −
√
Dq1 )(p1 + 68
√
Dq1 )(p2 −
√
Dq2 )(p2 +
√
Dq2 ) =
³ √ ¡ √ ¡ ¢´³ ¢´ = p1 p2 − q1 q2 D + D q1 p2 − p1 q2 p1 p2 − q1 q2 D − D q1 p2 − p1 q2 ;
(5.21)
z dalších dvou vlastností (5.20) dostaneme p1 p2 − q1 q2 D = 0 mod m
a
q1 p2 − p1 q2 = 0
p1 p2 − q1 q2 D ∈Z m
a
Y :=
mod m .
Proto X :=
q1 p2 − p1 q2 ∈ Z. m
Jelikož (p1 , q1 ) a (p2 , q2 ) byly dva různé páry nesoudělných čísel, je Y 6= 0. S použitím X a Y lze rovnici (5.21) přepsat √ √ ¡ ¢ ¡ ¢ ¡ ¢ m2 = mX + DmY . mX − DmY = m2 X 2 − DY 2 . To znamená, že X, Y je řešení Pellovy rovnice. Jelikož Y 6= 0, je to netriviální řešení. Ted’ popíšeme množinu všech řešení Pellovy rovnice. Uvažjme množinu √ √ M (D) := {a + b D | a, b ∈ Z , a2 − Db2 = 1, a + b D > 0} . Ukážeme, že M (D) je spolu s operací standardního násobení v R grupou. Stačí ukázat √ √ uzavřenost M (D) na násobení a na inverzní prvek. Necht’ a + b D a c + d D ∈ M (D). Protože
¡
√ √ ¢¡ √ ¢ + a + b D c + d D = ac + bdD D (bc {z ad}) > 0 , | {z } | + =:A ∈Z
=:B ∈Z
máme ověřit, že A2 − DB 2 = (A +
√
DB)(A −
√
√ ¢¡ √ ¢¡ √ ¢¡ √ ¢ ¡ DB) = a + b D c + d D a − b D c − d D = 1 .
√ √ √ Jelikož pro každý prvek a + b D z M (D) platí 1 = a2 − Db2 = (a + b D)(a − b D), je √ √ (a + b D)−1 = a − b D ∈ M (D), a množina M (D) je uzavřena na obrácený prvek. Triviálnímu řešení Pellovy rovnice (1, 0) odpovídá 1 ∈ M (D). Charakterizujme prvky √ √ z M (D), které jsou větší než 1. Protože platí 1 = a2 −b2 D = (a+b D)(a−b D), vynucuje √ √ √ √ nerovnost a + Db > 1, aby 0 < a − Db < 1. Ze vztahu a − D b < 1 < a + Db plyne √ √ b > 0. To spolu s nerovností 0 < a − Db implikuje a > 0. Pro prvky a + Db ∈ M (D) jsme odvodili a+
√
Db > 1
⇐⇒
69
a, b > 0 .
(5.22)
Věta 5.18. Existuje takové řešení aD , bD Pellovy rovnice x2 − Dy 2 = 1, že pro každé jiné její řešení a, b je a+
√
√ ¡ ¢n D b = ± aD + D bD
pro nějaké n ∈ Z. Důkaz. Z věty 5.17 víme, že množina M (D) obsahuje i jiný prvek než 1, proto je M (D) netriviální grupou. Bez újmy na obecnosti necht’ X, Y > 0 je netriviální řešení Pellovy rovnice. Položme aD +
√
√ √ √ D bD := min{ a + b D ∈ M (D) | a, b > 0 , a + b D < X + Y D } .
√ Existence minima plyne z konečnosti uvažované množiny: Pro dva prvky a1 + b1 D √ a a2 + b2 D z této množiny nerovnost a1 < a2 implikuje b1 < b2 . Tedy vzdálenost √ mezi každými dvěma prvky je alespoň 1 + D, a přitom celá množina leží v intervalu √ ¢ ¡ 1, X + Y D . Sporem ukážeme, že definovaná čísla aD , bD mají vlastnosti z tvrzemí věty. Necht’ a, b √ √ je řešení Pellovy rovnice; bez újmy na obecnosti necht’ a + b D > 0, tj. a + b D je prvkem grupy M (D). Kdyby existovalo k ∈ Z tak, že ¡
aD +
√
D bD
¢k
√ √ ¡ ¢k+1 < a + b D < aD + D bD ,
dostali bychom po vynásobení inverzním prvkem k prvku aD +
√
DbD nerovnost
√ ¢¡ √ √ ¡ ¢−k 1 < a + D b a D − D bD < aD + D bD . √ √ ¡ √ ¢¡ ¢−k Jelikož a+ D b aD − D bD je rovněž prvkem grupy M (D) je to číslo tvaru c+ Dd. Podle (5.22) jsou c, d > 0. To je ovšem ve sporu s definicí aD a bD . Poznámka 5.19. Dvojice aD , bD ve znění věty 5.18 se nazývá minimální řešení Pellovy rovnice. K hledání minimálního řešení poslouží řetězové zlomky (Sekce 6.5). V následující tabulce najdeme minimální řešení pro počátečné hodnoty D.
D 2 3 5 6 7 8 10 11 12 13 14 15 17 18 ... 27 28 29 30 aD 3 2 9 5 8 3 19 10 7 649 15 4 33 17 ... 26 127 9801 11 bD 2 1 4 2 3 1 6 3 2 180 4 1 8 4 ... 5 24 1820 12
Hodnoty aD , bD přesáhnou prvně mez 1000 pro parametr D = 29, konkrétně a29 = 9801 a b29 = 1820. Je zajímavé, že v jednom ze starých indických matematických textů 70
(Brahmagupta kolem roku 600) je za matematika pokládan ten, kdo umí řešit rovnici x2 − 29y 2 = 1. Rovnici x2 − Dy 2 = 1 se věnoval také Fermat. V roce 1657 vyzval svého přítele Frénicle de Bessy, aby řešil rovnici x2 − 61y 2 = 1. V tomto případě jsou hodnoty minimálního řešení rovny a61 = 1766319049 a b61 = 226153980. D˚ usledek 5.20. Necht’ m ∈ Z a D ∈ N,
√
D ∈ / Q. Pokud má zobecněná diofantická
rovnice x2 − Dy 2 = m alespoň jedno řešení, pak má nekonečně mnoho řešení. Důkaz. Necht’ pár x1 , y1 ∈ Z vyhovuje rovnici x21 − Dy12 = m1 a pár x2 , y2 ∈ Z rovnici x22 − Dy22 = m2 . Pak √ √ √ √ m1 m2 = (x1 − y1 D)(x1 + y2 D)(x2 − y2 D)(x2 + y2 D) = √ ¢ √ ¢¡ ¡ = x1 x2 + Dy1 y2 − (y1 x2 + x1 y2 ) D x1 x2 + Dy1 y2 + (y1 x2 + x1 y2 ) D = ¡ ¢2 ¡ ¢2 = x1 x2 + Dy1 y2 − D y1 x2 + x1 y2 . Tedy pár x := x1 x2 + Dy1 y2
a
y := y1 x2 + x1 y2
je řešením diofantické rovnice x2 −Dy2 = m1 m2 . Tímto postupem z jednoho řešení rovnice x2 − Dy 2 = m a nekonečně mnoha řešení Pellovy rovnice x2 − Dy 2 = 1 zkonstruujeme nekonečně mnoho řešení rovnice x2 − Dy 2 = m.
71
6
Diofantické aproximace
Množina racionálních čísel je hustá v R. Proto lze libovolné reálné číslo ξ libovolně přesně aproximovat zlomkem pq . Otázka ovšem je, jak tyto aproximace hledat a jak ‘měřit’ jejich přesnost. Prvním naivním zp˚ usobem hledání racionálních aproximací je tento: Chceme-li zlomek p , q
který by splňoval |ξ − pq | < ε, uvažujme q > (2ε)−1 a rozdělme reálnou osu na intervaly
typu [ kq , k+1 ), k ∈ Z. Číslo ξ padne do některého z nich. Za q
p q
stačí vzít krajní bod tohoto
intervalu, a to ten, který je blíž ke ξ. Máme pak ¯ ¯ ¯ ¯ p ¯ξ − ¯ < 1 < ε . ¯ q ¯ 2q Pro každé ξ ∈ R a pro každé q ∈ N proto existuje p ∈ Z tak, že |ξ − pq | <
1 . 2q
V
následujícím textu uvidíme, že k danému reálnému číslu lze nalézt nekonečně mnoho mnohem přesnějších racionálních aproximací.
6.1
Fareyovy zlomky
Oproti předchozí naivní úvaze získáme jemnější aproximaci reálného čísla, budeme-li místo zlomk˚ u s pevným jmenovatelem n uvažovat zlomky se všemi jmenovateli menšími než n. Bez újmy na obecnosti se m˚ užeme omezit na zlomky mezi 0 a 1, protože pro aproximaci čísla ξ 6∈ (0, 1) bychom uvažovali zlomkovou část {ξ} := ξ − bξc a k aproximujícímu zlomku
p q
bychom ve výsledku přičetli bξc.
Definice 6.1. Nechť n ∈ N. Uvažujme všechny zlomky
p q
∈ [0, 1], p ⊥ q a q ≤ n.
Uspořádané podle velikosti je označme 0 = f0 < f1 < · · · < fm = 1. Seznam Fn = {fi | i = 0, 1, . . . , m} nazveme Fareyovy zlomky řádu n. Příklad 6.2. Vypišme Fareyovy zlomky řádu 5. Máme 0=
0 1 1 1 2 1 3 2 3 4 1 < < < < < < < < < < = 1. 1 5 4 3 5 2 5 3 4 5 1 72
Než předvedeme, jak dobře lze s pomocí Fareyových zlomk˚ u aproximovat reálná čísla, všimneme si několika zajímavostí: • V seznamu Fn je právě ϕ(k) zlomk˚ u se jmenovatelem právě k, pro 1 ≤ k ≤ n, kde ϕ je Eulerova funkce. Celkem je tedy počet Fareyových zlomk˚ u řádu n roven Pn 1 + k=1 ϕ(k). • Mezi třemi po sobě jdoucími zlomky v Fn je vždy prostřední roven podílu součtu čitatel˚ u a součtu jmenovatel˚ u krajních zlomk˚ u. Např. 1 0+1 = , 1+4 5
2+3 1 = , 5+5 2
u ab < • Pro libovolný pár po sobě jdoucích zlomk˚
3+3 2 = . 5+4 3 c d
v seznamu Fn platí, že bc−ad = 1.
V jistém smyslu jsou tedy Fareyovy zlomky nejblíže u sebe. Je totiž c a bc − ad 1 − = ≥ d b db db a čitatel tedy nabývá nejmenší možné meze. Zatímco první z uvedených pozorování je triviální, další dvě vyžadují d˚ ukaz. Věta 6.3 (Cauchy). Nechť Důkaz. Pro zlomek
a b
a b
<
c d
jsou sousední položky seznamu Fn . Pak bc − ad = 1.
platí a ⊥ b. Proto podle Věty 5.6 existují celá čísla x, y ∈ Z taková,
že bx−ay = 1. Navíc je-li x0 , y0 řešením této rovnice, pak je řešením i dvojice x1 = x0 +ra, y1 = y0 + rb, protože b(x0 + ra) − a(y0 + rb) = bx0 − ay0 + bra − arb = 1 . Pro vhodné r pak řešení x1 , y1 ∈ Z splňuje 0 ≤ n − b < y1 ≤ n .
(6.1)
Navíc bx1 − ay1 = 1 implikuje 1 x1 a − = > 0. y1 b by1 Zlomek
x1 y1
má tedy jmenovatel omezený číslem n a je ostře větší než ab . Nejmenší takový
zlomek je dc , a proto
x1 y1
≥ dc . Nám stačí dokázat platnost rovnosti.
Pro spor předpokládejme, že
x1 y1
> dc . Pak ale
c dx1 − cy1 1 x1 − = ≥ , y1 d y1 d y1 d
ale také 73
c a bc − ad 1 − = ≥ . d b bd bd
Po sečtení obou nerovností máme 1 x1 a 1 1 b + y1 n = − = + = > , by1 y1 b y1 d bd bdy1 bdy1 kde první rovnítko plyne z faktu, že bx1 − ay1 = 1 a poslední odhad z (6.1). Vyšlo tedy 1 > nd , tj. d > n, což je spor s předpokladem, že zlomek a b
Tvrzení 6.4 (Mediánová vlastnost). Necht’
<
c d
<
c d e f
patří do Fn . jsou tři po sobě jdoucí položky
seznamu Fn . Pak c a+e = . d b+f Důkaz. Z předchozí věty víme, že platí ed − cf = 1 a cb − ad = 1. Vynásobením první z rovností číslem b a druhé číslem f a sečtením dostaneme d(eb − af ) = b + f . Podobně násobením první z rovností číslem a a druhé číslem e dostaneme po sečtení c(eb − af ) = a + e. Odtud už plyne tvrzení. Hledáme-li nyní racionální aproximaci
p q
reálného čísla ξ ∈ (0, 1) s omezeným jmeno-
vatelem q ≤ n, stačí sevřít ξ mezi dva po sobě jdoucí Fareyovy zlomky řádu n. S pomocí právě dokázaných vlastností nebude těžké ukázat, že je-li fi < ξ < fi+1 , potom pro ¯ ¯ ukaz Dirichletovy věty. nebo pq = fi+1 platí ¯ξ − pq ¯ < q12 . Tím dostáváme další d˚
p q
= fi
D˚ ukaz Věty 5.16. Necht’ n ∈ N a necht’ ab , dc jsou sousední položky seznamu Fn takové, že a b
< ξ < dc . Je-li například b ≤ d, pak ¯ a ¯¯ c a 1 1 ¯ ≤ 2, ¯ξ − ¯ < − = b d b bd b
kde jsme použili Větu 6.3. Pokud by b ≥ d, stejným zp˚ usobem ukážeme, že |ξ − dc | < Protože sousední položky seznamu Fn mají vzdálenost
1 , n
1 . d2
je zřejmé, že zvětšováním n
dostaneme nekonečně mnoho r˚ uzných zlomk˚ u splňujících tvrzení. V dalším textu ukážeme méně triviální zp˚ usob hledání dobré racionální aproximace reálného čísla. Tentokrát ovšem bude možno ukázat, že tyto aproximace jsou v jistém smyslu nejlepší.
6.2
Řetězové zlomky
Nechť ξ ∈ R. Položme ξ0 = ξ a pro i ≥ 0 ai := bξi c ,
a pokud ξi ∈ / Z ξi+1 := 74
1 . ξi − ai
(6.2)
Z algortimu jasně vyplývá, že a0 ∈ Z a ai ∈ N pro i ≥ 1. Protože ξi = ai +
1 , ξi+1
dostáváme po n-tém kroku výše uvedeného algoritmu vyjádření čísla ξ ve tvaru 1
ξ = a0 +
,
1
a1 +
(6.3)
1
... +
an +
1 ξn+1
Je zřejmé, že pokud je v nějakém kroku ξk ∈ Z, algoritmus se zastaví, dostaneme pouze konečnou posloupnost a0 , . . . , ak a ξ je rovno zlomku 1
ξ = a0 + a1 +
∈ Q.
1 ..
.+
1 ak
Naopak každé racionální číslo pq , p ⊥ q, lze vyjádřit v tomto tvaru. Pro nalezení koeficient˚ u ai použijeme Eukleid˚ uv algoritmus hledání největšího společného dělitele. p = a0 q + r1 ,
=⇒
q = a1 r1 + r2 ,
=⇒
r1 = a2 r2 + r3 ,
=⇒ .. .
p q q r1 r1 r2
= a0 + = a1 + = a2 +
1
,
1
,
1
,
q r1 r1 r2 r2 r3
Snadno nahlédneme, že tato procedura odpovídá algoritmu (6.2). Protože q > r1 > r2 > · · · ≥ 0, je ai = bri /ri+1 c. Je zřejmé, že po konečném počtu krok˚ u nastane rk+2 = 0. Pak je rk+1 = nsd(p, q) = 1 a tudíž
rk rk+1
∈ Z.
Poznámka 6.5. Protože v Eukleidově algoritmu je rk+1 < rk , je poslední koeficient řetězového zlomku racionálního čísla
p q
roven ak =
rk rk+1
≥ 2. Poznamenejme, že zlomek
p q
m˚ užeme vyjádřit také jako p = a0 + q
1 a1 +
1 ...
1
= a0 + a1 +
1 + ak
.
1 ...
+
1
1 1 Toto vyjádření však nevznikne z uvedeného algoritmu. Podmínka, že poslední koeficient ak − 1 +
splňuje ≥ 2, však jednoznačnost vyjádření zaručuje. Definice 6.6. Posloupnost (ai )i∈N0 (respektive (ai )ki=0 ) získaná algoritmem (6.2) se nazývá řetězovým zlomkem čísla ξ ∈ R \ Q (respektive ξ ∈ Q). Značíme ξ = [a0 , . . . , an , . . . ] (repsektive ξ = [ao , . . . , ak ]). 75
Řetězový zlomek čísla ξ ∈ R je konečný, právě když ξ ∈ Q. Vzhledem k tomu, že se v této kapitole zabýváme racionálními aproximacemi reálných čísel, budeme nadále 1 předpokládat ξ ∈ / Q. Racionální aproximace ke ξ získáme vynecháním ‘zbytku’ ∈ ξn+1 (0, 1) ve vyjádření (6.3). Tak dostaneme racionální číslo a m˚ užeme se ptát, jak dobře tento zlomek aproximuje ξ. Abychom mohli snáze studovat vlastnosti těchto zlomk˚ u, představíme si ho jako racionální lomenou funkci v proměnných ai , kde obecně povolíme libovolné ai > 0 pro i ∈ N a a0 ∈ R. Tato racionální lomená funkce je tedy podíl polynom˚ u v proměnných ai . Pro několik prvních hodnot n snadno vypočítáme a0 =
a0 , 1
a0 +
1 1 + a0 a1 = , a1 a1
a0 +
1 1 a1 + a2
=
a0 + a2 + a0 a1 a2 , 1 + a1 a2
atd.
Matematickou indukcí snadno dokážeme následující tvrzení. Tvrzení 6.7. Pro x0 ∈ R, xi > 0, i ∈ N platí 1
x0 + x1 +
=
1 ... +
Kn+1 (x0 , . . . , xn ) , Kn (x1 , . . . , xn )
1 xn
kde polynomy Kn (x1 , . . . , xn ) jsou zadány rekurencí K0 = 1, K1 (x1 ) = x1 a pro n ≥ 2 Kn (x1 , . . . , xn ) = Kn−2 (x1 . . . , xn−2 ) + xn Kn−1 (x1 , . . . , xn−1 ), . Definice 6.8. Necht’ n ∈ N0 . Polynom Kn (x1 . . . , xn ) definovaný výše se nazývá n-tý kontinuální polynom v proměnných x1 , . . . , xn . Nem˚ uže-li dojít k nedorozumění, index n obvykle vynecháváme. Pro zlomky, které dostaneme zanedbáním 1/ξn+1 ve výrazu (6.3), zavedeme jednodušší značení. Definice 6.9. Necht’ ξ ∈ R\Q a necht’ [a0 , . . . , an , . . . ] je jeho řetězový zlomek. Pro n ≥ 0 položme pn = Kn+1 (a0 , . . . , an ) Zlomek
pn qn
a
nazýváme n-tý sblížený zlomek čísla ξ.
76
qn = Kn (a1 , . . . , an ) .
Nyní lze vyjádření (6.3) čísla ξ přepsat v kompaktnějším tvaru, Kn+1 (a0 , . . . , an−1 , an + 1/ξn+1 ) = Kn (a1 , . . . , an−1 , an + 1/ξn+1 ) ξn+1 Kn+1 (a0 , . . . , an−1 , an ) + Kn (a0 , . . . , an−1 ) = = ξn+1 Kn (a1 , . . . , an−1 , an ) + Kn−1 (a1 , . . . , an−1 ) ξn+1 pn + pn−1 = . ξn+1 qn + qn−1
ξ=
(6.4)
Přímo z definice pomocí kontinuálních polynom˚ u je zřejmé, že posloupnosti (pn )∞ n=0 , (qn )∞ n=0 splňují následující rekurentní vztahy p0 = a0 , p1 = 1 + a0 a1 , q0 = 1, q1 = a1 ,
pn = an pn−1 + pn−2 , qn = an qn−1 + qn−2 ,
pro n ≥ 2 , pro n ≥ 2 .
(6.5)
Poznámka 6.10. Vzhledem k tomu, že koeficienty ai řetězového zlomku jsou vždy ∞ kromě a0 - kladné, posloupnosti (pn )∞ n=2 , (qn )n=1 jsou ostře rostoucí.
Další zajímavou vlastnost ukazuje následující lemma. Lemma 6.11. Nechť
pn pn−1 , qn qn−1
jsou n-tý a (n − 1)-ní sblížený zlomek čísla x ∈ R \ Q. Pak
platí pn−1 qn − pn qn−1 = (−1)n . Důkaz. Použijeme matematickou indukci. Pro n = 1 vztah platí, protože p0 q1 − p1 q0 = a0 a1 − (1 + a0 a1 ) = (−1)1 . ∞ Pro n ≥ 2 pak máme s využitím rekurence pro posloupnosti (pn )∞ n=2 a (qn )n=1 a indukčního
předpokladu µ pn−1 qn − pn qn−1 = det
pn−1 pn qn−1 qn
¶
µ = det
pn−2 pn−1 qn−2 qn−1
¶
µ det
0 1 1 an
¶ =
¡ ¢ = pn−2 qn−1 − pn−1 qn−2 · (−1) = (−1)n−1 · (−1) = (−1)n .
Poznámka 6.12. Předchozí lemma mimo jiné říká, že čísla pn a qn jsou navzájem nesoudělná (viz Věta 5.6). Sblížený zlomek
pn qn
je tedy v základním tvaru. Uvědomíme-li si,
jak jsou definovaná čísla pn a qn , můžeme přepsat tvrzení Lemmatu 6.11 pro kontinuální polynomy, tedy K(a0 , . . . , an−1 )K(a1 , . . . , an ) − K(a0 , . . . , an )K(a1 , . . . , an−1 ) = (−1)n , což platí pro libovolné koeficienty a0 , . . . , an ∈ N. 77
(6.6)
6.3
Aproximace sblíženými zlomky
Zkoumejme nyní, jak dobře je dané iracionální číslo aproximováno svými sblíženými zlomky. Zajímá nás tedy rozdíl ξ −
pn , qn
který m˚ užeme s pomocí (6.4) a Lemmatu 6.11
přepsat ξ−
pn (−1)n ξn+1 pn + pn−1 pn pn−1 qn − qn−1 pn = . = − = qn ξn+1 qn + qn−1 qn qn (ξn+1 qn + qn−1 ) qn (ξn+1 qn + qn−1 )
(6.7)
Z tohoto vyjádření lze odvodit základní vlastnosti sblížených zlomk˚ u. První vlastnost, kterou bychom po nekonečné posloupnosti ‘dobrých’ aproximací čísla ξ měli požadovat, je to, aby konvergovala, a to právě ke ξ. Věta 6.13. Nechť ξ ∈ R \ Q a nechť
pn , qn
n ≥ 0, jsou jeho sblížené zlomky. Potom
pn =ξ. n→∞ qn lim
Důkaz. Protože pro ξ ∈ R \ Q je εn ∈ (0, 1) a qn−1 , qn ∈ N, dostaneme z (6.7) odhad ¯ ¯ ¯ ¯ 1 1 ¯ξ − pn ¯ = < . ¯ ¯ qn qn (ξn+1 qn + qn−1 ) qn Posloupnost (qn )n∈N roste s n do nekonečna, a proto limn→∞ |ξ −
pn | qn
= 0.
Z rovnosti (6.7) lze ovšem odvodit o konvergenci sblížených zlomk˚ u ještě více. Především je vidět, že výraz ξ −
pn qn
střídá s n znaménko. Máme tedy pro n ≥ 0, p2n p2n+1 <ξ< . q2n q2n+1
(6.8)
Uvědomíme-li si, jak ξn+1 figuruje v algoritmu výpočtu řetězového zlomku, m˚ užeme použít an+1 = bξn+1 c < ξn+1 , abychom dostali horní odhad ¯ ¯ ¯ ¯ 1 1 1 ¯ξ − pn ¯ = < = . ¯ ¯ qn qn (ξn+1 qn + qn−1 ) qn (qn−1 + an+1 qn ) qn qn+1
(6.9)
Podobně použitím ξn+1 < an+1 + 1 dostáváme ¯ ¯ ¯ ¯ 1 p 1 n ¯ξ − ¯ = > = ¯ ¯ qn qn (ξn+1 qn + qn−1 ) qn (qn−1 + (an+1 + 1)qn ) =
1 1 1 ≥ = . qn (qn + qn+1 ) qn (qn + an+2 qn+1 ) qn qn+2
(6.10)
Z nerovností (6.9) a (6.10) snadno dostaneme · · · < |pn+1 − qn+1 ξ| <
1 qn+2
< |pn − qn ξ| <
1 qn+1
< ··· ,
(6.11)
což vlastně znamená, že vzdálenost qn ξ od nejbližšího celého čísla je v každém kroku menší. Tento fakt se nám bude brzy hodit. 78
Poznámka 6.14. Odhadneme-li (6.10) dále, pomocí 1/(qn qn+2 ) > 1/(qn+1 qn+2 ), m˚ užeme také odvodit ne tak jemný, ale zřejmější fakt, ¯ ¯ ¯ ¯ ¯ ¯ pn ¯¯ pn+1 ¯¯ 1 1 ¯ ¯ < ¯ξ − ¯ < , < · · · < ¯ξ − ¯ qn+1 qn+1 qn+2 qn qn qn+1
(6.12)
totiž že aproximace sblíženým zlomkem se s každým n ostře zlepšuje. Poznamenejme, že z odhadu (6.9) m˚ užeme odvodit |ξ −
pn | qn
< 1/qn2 pro každé n ∈ N,
čímž jsme vlastně provedli ještě jeden d˚ ukaz Dirichletovy věty 5.16. u číslo ξ = Příklad 6.15. Aproximujme pomocí sblížených zlomk˚
√
2. Nejprve musíme √ √ určit koeficienty řetězového zlomku. Z algoritmu máme ξ0 = ξ = 2 a0 = [ 2] = 1, √ √ √ ξ1 = 1/( 2 − 1) = 2 + 1, a1 = [ξ1 ] = 2, ξ2 = 1/(ξ1 − a1 ) = 1/( 2 − 1) = ξ1 . Protože jsme získali stejnou hodnotu ξi , která se vyskytovala již pro menší index, je jasné, že výpočet se zacyklí, speciálně ai = a1 = 2 pro všechna i ∈ N. Pomocí (6.5) můžeme napsat následující přehled. n
0 1
2
an pn qn
1 2 1 3 1 2
2 2 2 7 17 41 5 12 29
Například pátý sblížený zlomek
3
4
p5 q5
=
5
6
2 2 99 239 70 169
99 70
7 2 577 408
8
···
2 ··· 1393 · · · 985 · · ·
= 1.4142857 · · · se liší od
√
2 = 1.41421356 · · ·
až na pátém desetinném místě. To odpovídá odhadu (6.9) √ p5 1 1 1 | 2− |< = = < 10−4 . q5 q5 q6 70 · 169 11830 Následující lemma je podstatné pro d˚ ukaz několika dalších tvrzení o přesnosti aproximace čísla ξ jeho sblíženými zlomky. Lemma 6.16. Nechť ξ ∈ R\Q. Jestliže
p q
pro dva po sobě jdoucí sblížené zlomky
pn pn , , qn qn
∈ Q není sblížený zlomek čísla ξ a qn−1 < q ≤ qn pak platí
|qξ − p| ≥ |qn ξ − pn | + |qn−1 ξ − pn−1 | . Důkaz. Uvažujme soustavu rovnic µpn−1 + νpn = p µqn−1 + νqn = q 79
Protože determinant matice soustavy je podle Lemmatu 6.11 roven pn−1 qn − pn qn−1 = (−1)n , je její řešení µ = (−1)n (pqn − qpn )
ν = (−1)n−1 (pqn−1 − qpn−1 ) .
a
Zjevně platí µ, ν ∈ Z. Navíc také µ, ν 6= 0, protože
p q
6=
pn p , qn q
6=
pn−1 . qn−1
Čísla µ, ν mají r˚ uzná
znaménka, což plyne z rovnosti µqn−1 + νqn = q a faktu, že qn−1 < q ≤ qn . Ze vztahu p − qξ = µpn−1 + νpn − (µqn−1 + νqn )ξ = µ(pn−1 − qn−1 ξ) + ν(pn − qn ξ) proto m˚ užeme odvodit odhad |p − qξ| = |µ||pn−1 − qn−1 ξ| + |ν||pn − qn ξ| ≥ |pn−1 − qn−1 ξ| + |pn − qn ξ| , kde pro první rovnítko využíváme, že i výrazy pn−1 −qn−1 ξ a pn −qn ξ mají r˚ uzná znaménka, což snadno vyplývá z (6.8). D˚ usledek 6.17. Nechť ξ ∈ R \ Q a nechť p q
pn , qn
n ≥ 0, jsou jeho sblížené zlomky. Nechť
∈ Q je zlomek takový, že 0 < q ≤ qn a pq 6= pqnn . Pak platí ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ξ − p ¯ > ¯ξ − pn ¯ . ¯ q¯ ¯ qn ¯
Důkaz. Je-li qn−1 < q ≤ qn , je z Lemmatu 6.16 zřejmé, že |qξ − p| > |qn ξ − pn |. Podělením obou stran nerovnice kladným číslem q dostaneme ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ qn ¯ ¯ ¯ ¯ p p p n n ¯ξ − ¯ > ¯ξ − ¯ ≥ ¯ξ − ¯ . ¯ q¯ q ¯ qn ¯ ¯ qn ¯ Pokud q < qn−1 , pak qm−1 < q ≤ qm pro nějaké m ∈ N, m < n. Pak ale ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ p p p m n ¯ξ − ¯ > ¯ξ − ¯ > ¯ξ − ¯ , ¯ q¯ ¯ qm ¯ ¯ qn ¯ kde poslední nerovnost je d˚ usledkem (6.12). Definice 6.18. Nechť ξ ∈ R \ Q. Zlomek p q
∈ Q,
p q
r s
takový, že |r − sξ| < |p − qξ| pro všechny
6= rs , q ≤ s, se nazývá nejlepší aproximace čísla ξ.
Věta 6.19 (Lagrange). Nejlepší aproximace čísla ξ ∈ R \ Q jsou právě jeho sblížené zlomky. usledkem LemDůkaz. Fakt, že n-tý sblížený zlomek je nejlepší aproximací je přímým d˚ matu 6.16, protože pro každý zlomek
p q
se jmenovatelem qm < q ≤ qm , kde m ≤ n, s
použitím (6.11) platí |qξ − p| > |qm ξ − pm | ≥ |qn ξ − pn | . 80
Naopak nechť by
r s
6=
pn , qn
r s
je nejlepší aproximace. Najděme n takové, že qn−1 < s ≤ qn . Pokud
pak podle Lemmatu 6.16 je |sξ − r| > |qn−1 ξ − pn−1 |, což odporuje vlastnosti
nejlepší aproximace. Proto
r s
=
pn . qn
Věta 6.20. Nechť ξ ∈ R \ Q. Jeden ze dvou po sobě jdoucích sblížených zlomk˚ u čísla ξ splňuje
¯ ¯ ¯ξ − ¯
Důkaz. Pro spor předpokládejme, že ¯ ¯ ¯ ¯ ¯ξ − pn ¯ ≥ 1 ¯ qn ¯ 2qn2
¯ p ¯¯ 1 < 2. ¯ q 2q ¯ ¯ ¯ ¯ ¯ξ − pn−1 ¯ ≥ 1 . 2 ¯ qn−1 ¯ 2qn−1
a
Máme ¯ ¯ ¯ ¯ ¯ ¯ 2 ¯ pn ¯ pn pn−1 ¯ ¯ ¯ qn2 + qn−1 pn−1 ¯¯ 1 1 1 ¯ ¯ ¯ ¯ ¯ ξ − = + ≥ = ¯ − − ξ + = , 2 2 ¯ qn ¯ ¯ qn qn−1 qn qn−1 ¯ qn−1 ¯ 2qn2 2qn−1 2qn2 qn−1 což implikuje (qn − qn−1 )2 ≤ 0. To je ovšem spor, protože posloupnost (qn )n∈N je ostře rostoucí. Věta 6.21 (Legendre). Necht’ ξ ∈ R \ Q a necht’ ¯ ¯ ¯ξ − ¯ Pak
p q
p q
je zlomek takový, že
¯ p ¯¯ 1 < 2. ¯ q 2q
je sblížený zlomek čísla ξ.
Důkaz. Nechť
p q
není sblížený zlomek čísla ξ. Najděme n tak, že qn−1 < q ≤ qn . Z Lem-
matu 6.16 vyplývá |pn−1 − qn−1 ξ| < |p − qξ| <
1 . 2q
Odtud máme ¯ ¯ ¯ ¯ ¯ ¯ ¯p ¯ p pn−1 ¯ ¯ ¯ pn−1 ¯¯ 1 1 1 ¯ ¯ ¯ ¯ ¯ ≤ ¯ − ξ ¯ + ¯ξ − < ≤ ¯ − + . ¯ ¯ 2 qqn−1 q qn−1 q qn−1 2q 2qqn−1 Potom ovšem q < qn−1 , což je spor. Dirichletova věta 5.16, kterou jsme dokázali několika zp˚ usoby, říká, že každé reálné číslo ξ lze aproximovat nekonečně mnoha zlomky
p q
ve vzdálenosti menší než 1/q 2 od
ξ. Věta 6.20 ukazuje, že pro každé ξ ∈ R existuje dokonce nekonečněmnoho zlomk˚ u
p q
vzdálených od ξ méně než 1/2q 2 . V následující větě předvedeme, jak nejlépe lze tuto vzdálenost vylepšit. 81
Věta 6.22 (Hurwitzova věta). Pro každé ξ ∈ R \ Q existuje nekonečně mnoho r˚ uzných p q
racionálních čísel
takových, že ¯ ¯ ¯ξ − ¯
¯ p ¯¯ 1 <√ . ¯ q 5q 2 √ √ Tvrzení neplatí, nahradíme-li 5 konstantou C > 5. u Důkaz. Ukážeme, že nerovnost splňuje jeden ze tří po sobě jdoucích sblížených zlomk˚ čísla ξ. D˚ ukaz provedeme sporem. Nechť pro k = n − 1, n, n + 1 platí ¯ ¯ ¯ ¯ ¯ξ − pk ¯ ≥ √1 . ¯ qk ¯ 5qk2
(6.13)
Uvažujeme-li nejprve k = n − 1, n, máme podobně jako v d˚ ukazu Věty 6.20 ¯ ¯ ¯ ¯ ¯ ¯ 2 ¯ pn pn−1 ¯ ¯ pn ¯ ¯ ¯ qn2 + qn−1 p 1 n−1 ¯ = ¯ − ξ ¯ + ¯ξ − ¯ ≥ √1 + √ 1 √ = ¯¯ − = , ¯ qn ¯ ¯ 2 2 qn qn−1 qn qn−1 ¯ qn−1 ¯ 5qn2 5qn−1 5qn2 qn−1 z čehož lze odvodit
Označíme-li x =
√
qn qn−1
2 qn2 + qn−1 qn qn−1 = + . qn qn−1 qn−1 qn √ √ ≥ 1, platí 5 > x + x−1 (protože 5 ∈ / Q). Odtud ovšem
2
x − Proto x ∈ odvodíme
¡ √5−1 2 qn+1 qn
<
,
√
5+1 2
√ 5+1 . 2
√
5 ≥
³
√
5x + 1 = x −
5 − 1 ´³ x− 2
√
5 + 1´ < 0. 2
¢ . Analogicky z předpokladu platnosti (6.13) pro k = n, n + 1 Dohromady tedy máme qn+1 qn−1 − < qn qn
√
5+1 2 −√ = 1. 2 5+1
Z rekurentního vztahu pro posloupnost (qn )n∈N pak plyne, že levá strana této nerovnosti je rovna koeficientu an+1 rětězového zlomku čísla ξ. Vychází tedy an+1 < 1, což je spor, protože koeficienty řetězového zlomku jsou (kromě a0 ) přirozená čísla. Abychom dokázali druhou část Hurwitzovy věty, stačí najít reálné číslo ξ, pro které √ √ nerovnost |ξ − pq | < 1/Cq 2 (při C > 5) implikuje, že q je omezené. Položíme ξ = 5−1 . 2 Předpokládejme, že máme nekonečně mnoho zlomk˚ u pq splňujících |ξ − pq | < 1/Cq 2 . Odtud je ξ=
p ε + q Cq 2
pro nějaké |ε| < 1 .
Po vynásobení číslem q dostaneme √ q ε 5 q − = ξq = p + , 2 2 Cq 82
což je ekvivalentní s
√
5 ε q q− =p+ . 2 Cq 2 Umocněním obou stran rovnice a drobnou úpravou dostaneme √ ε2 5ε − = p2 + pq − q 2 ∈ Z . 2 2 C q C Přitom je ale |
√ 5ε | C
<
√ 5 C
< 1, takže pro dostatečně velké q je levá strana rovnosti v
absolutní hodnotě menší než 1. Celé číslo p2 + pq − q 2 je tedy pro dost velké q nutně rovno 0. Pak ovšem 4(p2 + pq − q 2 ) = (2p + q)2 − 5q 2 = 0 ,
tj.
√
5=
2p + q ∈ Q, q
což je spor. Číslo q je tedy omezené a nem˚ uže existovat nekonečně mnoho zlomk˚ u splňujících |ξ − pq | < 1/Cq 2 . √ Poznámka 6.23. Pro d˚ ukaz přesnosti konstanty 5 v Hurwitzově větě jsme využili číslo √ √ ξ = 21 ( 5 − 1), což je bez 1 zlatý řez, τ = 12 (1 + 5) = ξ − 1. Dalo by se tedy říct, že zlatý řez patří mezi nejh˚ uře aproximovatelná iracionální čísla. Ačkoliv pro skoro všechna reálná √ ξ jsou jeho sblížené zlomky pn /qn výrazně blíže ke ξ, než je uvedená hranice 1/( 5qn2 ), sblížené zlomky zlatého řezu τ (např. 5/3, 8/5, 13/8, atd.) jsou téměř přesně ve vzdálenosti dané Hurwitzovou větou. D˚ uležitou roli v d˚ ukazu hrál fakt, že koeficienty ai , i ∈ N, řetězového zlomku zlatého řezu jsou všechny rovny 1. Lze ukázat, že každé reálné číslo tvaru
a+bτ , c+dτ
kde a, b, c, d ∈ Z
splňují ad − bc = ±1, sdílí se zlatým řezem tuto vlastnost špatné aproximovatelnosti. Kdybychom všechna tato čísla v Hurwitzově větě vynechali, bylo by možné tvrzení √ zlepšit, a to na konstantu 2 2. Zase by existovala čísla, pro která by tato mez byla nejlepší možná. Tak by bylo možno pokračovat dál.
6.4
Řetězový zlomek kvadratických čísel
Věta 6.24 (Lagrange). Necht’ ξ ∈ R \ Q. Jeho řetězový zlomek ξ = [a0 , a1 , a2 , . . . ] je od jistého místa periodický, právě když ξ je algebraické číslo řádu 2. Důkaz. Pro implikaci zleva doprava, vezměme iracionální ξ s periodickým řetězovým zlomkem ξ = [a0 , a1 , . . . , ak−1 , ak , ak+1 , . . . , ak+l−1 ]. Máme ξ = a0 +
1 ..
.+
,
1 ak−1 +
kde ξk = [ak , ak+1 , . . . , ak+l−1 ] .
1 ξk 83
(6.14)
Protože ξk má čistě periodický řetězový zlomek, platí ξk+l = ξk , a tedy podle (6.4) máme 1
ξk = al + ak+1 +
=
1 ..
. ak+l−1 +
ξk K(ak , . . . , ak+l−1 ) + K(ak , . . . , ak+l−2 ) . ξk K(ak+1 , . . . , ak+l−1 ) + K(ak+1 , . . . , ak+l−2 )
1 ξk
Po malé úpravě dostaneme kvadratickou rovnici pro číslo ξk s celočíselnými koeficienty. Díky vztahu (6.14) leží číslo ξ v tělese Q(ξk ), které je nejvýše druhého řádu. Protože ξ je iracionální, je to kvadratické číslo. D˚ ukaz opačné implikace je poněkud techničtější. Nechť ξ splňuje kvadratickou rovnici aξ 2 + bξ + c = 0 pro a, b, c ∈ Z, a 6= 0. Dosaďme do této rovnice vztah (6.4). Postupnými úpravami získáme kvadratickou rovnici pro každé ξn+1 , n ∈ N, ve tvaru 2 An ξn+1 + Bn ξn+1 + Cn = 0 .
kde An = ap2n + bpn qn + cqn2 ,
(6.15)
Bn = 2apn pn−1 + b(pn−1 qn + pn qn−1 ) + 2cqn qn−1 ,
(6.16)
2 Cn = p2n−1 + bpn−1 qn−1 + cqn−1 .
(6.17)
Nyní ukážeme, že trojice koeficient˚ u (An , Bn , Cn ) je omezená. Snadno ověříme, že An−1 = Cn
a
Bn2 − 4An Cn = b2 − 4ac .
(6.18)
První z těchto vztah˚ u je zřejmý, pro ověření druhého musíme dosadit z (6.15), (6.16) a (6.17) a ve výpočtu využít pn−1 qn − pn qn−1 = (−1)n z Lemma 6.11. Vzhledem k vztah˚ um (6.18) stačí ukázat omezenost koeficient˚ u An . Do vyjádření (6.15) dosadíme pn = ξqn − kde |δ| < 1 je takové, že ¯ pn ¯¯ 1 ¯ ξ − ¯ ¯< 2, qn qn
δ , qn
a tedy
ξ=
pn δ + 2. qn qn
Máme potom δ2 ) + b(ξqn2 − δ) + cqn2 = qn2 δ2 = qn2 (aξ 2 + bξ + c) + a 2 − 2aξδ − bδ = qn 2 δ = a 2 − 2aξδ − bδ , qn
An = a(ξ 2 qn2 − 2ξδ +
84
kde jsme využili kvadratickou rovnici pro ξ. Nyní je vidět, že exituje K ∈ N takové, že |An |, |Bn |, |Cn | < K ,
pro všechna n ∈ N .
Pro trojice (An , Bn , Cn ) ∈ Z3 tedy existuje pouze konečný počet možností. Proto musí existovat (A, B, C) ∈ Z, do kterého se trojice (An , Bn , Cn ) trefí pro nekonečně mnoho hodnot n. Existují tedy navzájem r˚ uzná n1 , n2 , n3 ∈ N taková, že (An1 , Bn1 , Cn1 ) = (An2 , Bn2 , Cn2 ) = (An3 , Bn3 , Cn3 ) = (A, B, C) . Tudíž čísla ξn1 , ξn2 , ξn3 splňují stejnou kvadratickou rovnici Ax2 + Bx + C = 0, a proto nejméně dvě z nich musí splývat. Bez újmy na obecnosti ξn1 = ξn2 a tedy řetězový zlomek čísla ξ je periodický s periodou |n2 − n1 |. Příklad 6.25. V předchozí větě jsme ukázali, že číslo ξ s periodickým řetězovým zlomkem je kvadratické. Pro ilustraci najděme minimální polynom čísla ξ = [1, 3, 3, 3, . . . ]. Číslo µ = ξ + 2 má čistě periodický zlomek [3], a proto µ = 3 + µ1 . Odtud snadno plyne √ µ2 − 3µ − 1 = 0. Proto (ξ + 2)2 − 3(ξ + 2) − 1 = ξ 2 + ξ − 3 = 0. Je tedy ξ = 21 (−1 + 13). Lagrangeova věta říká, že řetězový zlomek kvadratického čísla je od jistého členu periodický. Předchozí příklad podněcuje zvědavost, která kvadratická ξ mají řetězový zlomek dokonce čistě periodický. To popisuje následující tvrzení. Teorém 6.26. Nechť ξ je algebraické číslo druhého řádu se sdruženým kořenem ξ 0 . Pak jeho řetězový zlomek je čistě periodický, právě když ξ > 1 a ξ 0 ∈ (−1, 0). Důkaz. Pro implikaci zleva doprava předpokládejme, že řetězový zlomek čísla ξ je čistě periodický, ξ = [b0 , b1 , . . . , bl−1 ]. Nutně bi ≥ 1 pro všechna i = 0, . . . , l − 1. Proto ξ > 1. Označme ξ0 = ξ a ξj jako v algoritmu (6.2). Zřejmě platí ξ = ξ0 = ξl . Proto dosazením n = l − 1 do vztahu (6.4) dostaneme kvadratickou rovnici pro ξ ve tvaru ξ 2 ql−1 − ξ(pl−1 − ql−2 ) − pl−2 = 0 . Polynom f (x) = ql−1 x2 − (pl−1 − ql−2 )x − pl−2 má tedy kořeny ξ a ξ 0 . Protože f (−1) = ql−1 −ql−2 +pl−1 −pl−2 > 0 (posloupnosti (pn ), (qn ) jsou ostře rostoucí) a f (0) = −pl−2 < 0, musí jeden z kořenů f , (a je to jasně ξ 0 ), ležet v intervalu (−1, 0). Pro opačnou implikaci předpokládejme, že ξ = ξ0 > 1 je kvadratické číslo se sdruženým kořenem ξ 0 ∈ (−1, 0). Označme jeho řetězový zlomek [b0 , b1 , . . . ]. Nejprve dokážeme 85
indukcí, že pro pro každé j ≥ 0 je ξj > 1 kvadratické číslo se sdruženým kořenem ξj0 ∈ (−1, 0). První krok indukce je triviální. Dále je třeba si uvědomit, že čísla ξj , j ∈ N, leží všechna ve stejném kvadratickém tělese Q(ξ) a jeho Galoisův automorfismus σ přiřazuje ξj jeho algebraicky sdružené číslo, σ(ξj ) = ξj0 . Ze vztahu (6.2) proto odvodíme 0 ξj+1 =σ
³
1 ´ 1 = 0 . ξj − bj ξj − bj
Protože z indukčního předpokladu máme ξj > 1 a ξ 0 ∈ (−1, 0), je bj = [ξj ] ≥ 1 a 0 ξj0 − bj < −1. Proto platí také ξj+1 = 1/(ξj0 − bj ) ∈ (−1, 0), čímž je indukce hotova.
Ze vztahu ξj0 = bj + −
1 0 ξj+1
1 0 ξj+1
∈ (−1, 0) plyne pro j ≥ 0, že
− 1 < bj < −
j
1 0 ξj+1
,
a proto
bj =
−
1 k 0 ξj+1
,
což využijeme následovně. Z Věty 6.24 je zřejmé, že řetězový zlomek ξ je od jistého členu periodický. Označme k, l ∈ N0 nejmenší indexy takové, že ξk = ξl a k < l. Stačí dokázat, že k = 0. Pokud ale k > 0, můžeme psát j bk−1 =
−
1 k j 1k = − 0 = bl−1 , ξk0 ξl
0 a proto ξk−1 = bk−1 +
1 1 0 = bl−1 + 0 = ξl−1 , 0 ξk ξl
což implikuje ξk−1 = ξl−1 , a to je spor s volbou minimálního k. Proto k = 0 a řetězový zlomek ξ je čistě periodický. Poznámka 6.27. Je zajímavé, že na rozdíl od kvadratických čísel, o řetězových zlomcích algebraických čísel řádu vyššího než 2 se neví téměř nic. Řetězový zlomek žádného z nich nebyl explicitně popsán. Hypotéza praví, že koeficienty řetězového zlomku algebraického čísla řádu n ≥ 3 nejsou omezené. Existují příklady transcendentních čísel, jejichž řetězové zlomky jsou známé. Je to třeba Eulerovo číslo e, viz. Sekce 7.4. Většina iracionálních čísel nemá nijak pravidelný řetězový zlomek. Nicméně Khinchin dokázal, že pro skoro všechna reálná x má posloupnost ai , i ∈ N, překvapivou vlast¢1/n ¡Q , je roven pevné konstantě K ≈ nost: jejich geometrický př˚ uměr, tj. limn→∞ ni=1 ai 2.6854520010... nezávislé na x, které se říká Khinchinova konstanta. Lévy zase dokázal, že pro skoro všechna x má n-tá odmocnina jmenovatele n-tého √ sblíženého zlomku čísla x limitu limn→∞ n qn ≈ 3.2758229187.... Ta se nazývá Lévyho konstanta.
86
6.5
Aplikace řetězových zlomk˚ u pro diofantické rovnice
Kromě samozřejmého využití řetězových zlomků pro hledání dobrých racionálních aproximací k iracionálním číslům je jednou z nejd˚ uležitějších aplikací řetězových zlomk˚ u hledání řešení Pellovy rovnice. Uvedeme zde postup, nikoliv však všechny d˚ ukazy k použitým tvrzením, protože jsou poněkud technické. Nejprve předvedeme, že pro ne příliš velkou pravou stranu všechna řešení zovecněné Pellovy rovnice odpovídají nějakému sblíženému zlomku kvadratického čísla. Teorém 6.28. Nechť m ∈ N je takové, že
√
m ∈ / N, a nechť B ∈ Z, |B| <
√
m. Pak
každé řešení (x, y) ∈ Z2 diofantické rovnice x2 − my 2 = B je tvaru (±pn , ±qn ), kde √ nějaký sblížený zlomek čísla m. Důkaz. Nechť p, q ∈ N splňují p2 − mq 2 = B. Uvažujme nejprve 0 < B < ³ p √ ´³ p √ ´ B p2 − m = + m − m = 2, q2 q q q a proto
√
pn qn
je
m. Pak
√ m p √ B 1 0< − m= 2 p √ < 2√ < 2 . q 2q q ( q + m) 2q m
√ Podle Věty 6.21 proto musí být zlomek pq roven některému ze sblížených zlomk˚ u čísla m. √ B Pokud − m < B < 0, stačí si uvědomit, že p2 − mq 2 = B implikuje q 2 − m1 p2 = − m . √ Protože 0 < −B/m < m, m˚ užeme stejně jako před chvílí odvodit, že zlomek pq je sblížený √ zlomek k číslu 1/ m. Ovšem řetězový zlomek k tomuto číslu je roven [0, a0 , a1 , . . . ], kde √ [a0 , a1 , a2 , . . . ] je řetězový zlomek čísla m. To, spolu s definičními vztahy pro posloup√ nosti pn , qn , implikuje, že n-tý sblížený zlomek čísla m je převrácenou hodnotou (n − 1)√ ního sblíženého zlomku čísla 1/ m. Tím je tvrzení dokázáno. Všimněme si, že předchozí věta neříká nic o tom, pro které pravé strany B, |B| <
√
m
řešení Pellovy rovnice existuje. Abychom toto rozhodli, musíme znát řetězový zlomek čísla √ m. Není těžké si uvědomit, že je tvaru √
m = [a0 , a1 , . . . , al−1 , 2a0 ] ,
kde l ∈ N .
√ m + [ m], máme ξ 0 ∈ (−1, 0). Podle Věty 6.26 má takové ξ čistě ¥√ √ ¦ √ periodický řetězový zlomek, jehož nultý koeficient je roven m+b mc = 2b mc = 2a0 . Položíme-li totiž ξ =
√
Následující věta ukazuje, že pro každé m existuje řešení Pellovy rovnice s pravou √ stranou B = ±1, a dokonce ukazuje, kterému sblíženému zlomku čísla m odpovídá. 87
Teorém 6.29. Nechť m ∈ N, [a0 , a1 , . . . , al−1 , 2a0 ]. Označme
√ pn qn
√ m ∈ / N. Nechť l ∈ N je minimální takové, že m = √ n-tý sblížený zlomek čísla m. Je-li l sudé, pak rovnice
x2 − my 2 = −1 nemá řešení (x, y) ∈ Z2 a minimální řešení (x, y) Pellovy rovnice x2 − my 2 = 1 je rovno (pl−1 , ql−1 ). Je-li l liché, pak minimální řešení rovnice x2 − my 2 = −1 je rovno (pl−1 , ql−1 ), a minimální řešení rovnice x2 − my 2 = 1 je rovno (p2l−1 , q2l−1 ). Použití věty ilustrujeme na následujícím příkladě. Příklad 6.30. Najděme minimální řešení Pellovy rovnice x2 − 29y 2 = ±1. Postupným √ výpočtem podle algoritmu (6.2) najdeme řetězový zlomek čísla 29 ve tvaru √
29 = [5, 2, 1, 1, 2, 10] ,
což odpovídá Větě 6.29. Řetězový zlomek čísla
√
29 je tedy periodický a minimální délka √ periody je l = 5. Protože l je liché, měli bychom pomocí sblížených zlomk˚ u čísla 29 najít minimální řešení dané Pellovy rovnice pro obě pravé strany, tj. +1 i −1. Snadno získáme následující tabulku. n
0
1
2
an pn qn
5 5 1
2 1 11 16 2 3
1 2 27 70 5 13
p2n − 29qn2
-4
5
4
-5
3
4
-1
5
6
10 2 727 1524 135 283 -4
-5
7
8
1 2251 418
1 3775 701
5
-4
9
10
2 10 9801 101785 1820 18901 1
-4
··· ··· ··· ··· ···
Vidíme, že opravdu pro n = l − 1 = 4 dává n-tý sblížený zlomek řešení (x, y) = (p4 , q4 ) = (70, 13) Pellovy rovnice x2 − 29y 2 = −1. Že je to řešení minimální, plyne z Věty 6.28. Podobně minimální řešení základní Pellovy rovnice je (x, y) = (p9 , q9 ) = (9801, 1820). Poznamenejme, že posloupnost (p2n − 29qn2 )n∈N je periodická s periodou délky 10, takže √ podle Věty 6.28 jsou jediné pravé strany B, |B| < 29, pro které je zobecněná Pellova rovnice x2 − 29y 2 = B řešitelná, rovny B = ±1, ±4, ±5. Mezi další příklady použití řetězových zlomk˚ u patří d˚ ukaz následující věty. Věta 6.31. Každé prvočíslo tvaru 4k + 1, k ∈ N, lze jednoznačně rozložit na součet dvou čtverc˚ u. Připomeňme, že existenci rozkladu prvočísla p ≡ 1 mod 4 na součet dvou čtverc˚ u jsme dokázali již dříve, ve Větě 5.10. Pomocí řetězových zlomk˚ u lze tvrzení dokázat jiným elegantním způsobem, a navíc lze ukázat i jednoznačnost rozkladu. 88
Důkaz. K důkazu využijeme následujících vlastností kontinuálních polynomů, které lze snadno odvodit z definice, Kn (x1 , x2 , . . . , xn−1 , xn ) = Kn (xn , xn−1 , . . . , x2 , x1 ) Kn (x1 , . . . , xn ) = K(x1 , . . . , xl )K(xl+1 , . . . , xn ) +
(6.19)
+ K(x1 , . . . , xl−1 )K(xl+2 , . . . , xn ) , přičemž druhý vztah platí pro n ≥ 2 a 1 ≤ l ≤ n − 1 . Mějme nyní prvočíslo p = 4k + 1. Uvažujme řetězové zlomky racionálních čísel p/1, p/2, . . . , p/(2k). Pro každé j ∈ {1, 2, . . . , 2k} je zlomek p/j ve zkráceném tvaru a navíc p/j ≥ 2. Proto p/j = [a0 , . . . , an ] pro nějaké n ∈ N0 , přičemž koeficienty splňují ai ∈ N, navíc a0 = [p/j] ≥ 2 a an ≥ 2, což plyne z Poznámky 6.5. Je tedy p K(a0 , . . . , an ) = . j K(a1 , . . . , an ) Protože K(a0 , . . . , an ), K(a1 , . . . , an ) jsou zároveň čitatel a jmenovatel n-tého sblíženého zlomku k číslu ξ = p/j, jsou to tedy čísla navzájem nesoudělná a můžeme psát p = K(a0 , . . . , an ). Ze symetrie také p = K(an , . . . , a0 ). Zlomek [an , . . . , a0 ] =
K(an , . . . , a0 ) K(an−1 , . . . , a0 )
tedy musí také odpovídat racionálnímu číslu p/i pro nějaké i ∈ {1, 2, . . . , 2k}. Číslo p/j tedy můžeme spárovat s číslem p/i, který má k němu zrcadlově symetrický řetězový zlomek. Samo číslo p/1 = [p] má ale palindromický řetězový zlomek, takže je spárováno samo se sebou. Protože jmenovatelů j ∈ {1, 2, . . . , 2k} je sudý počet, musí tedy existovat ještě další číslo p/j0 s palindromickým řetězovým zlomkem, [b0 , . . . , bt ] =
p = [bt , . . . , b0 ] . j0
Ukažme, že t musí být sudé. Kdyby totiž t = 2l + 1, pak p/j0 = [b0 , . . . , bl , bl+1 , bl . . . , b0 ] a platí p = Kn (b0 , . . . , bl , bl+1 , bl , . . . , b0 ) = = K(b0 , . . . , bl )K(bl+1 , . . . , b0 ) + K(b0 , . . . , bl−1 )K(bl , . . . , b0 ) = ¡ ¢ = K(b0 , . . . , bl ) K(bl+1 , . . . , b0 ) + K(b0 , . . . , bl−1 ) . Číslo p je tedy složené, protože b0 ≥ 2 znamená, že oba faktory jsou ≥ 2. Proto t = 2l, pro nějaké l ≥ 1, řetězový zlomek p/j0 = [b0 , . . . , bl , bl . . . , b0 ] a máme p = Kn (b0 , . . . , bl , bl , . . . , b0 ) = = K(b0 , . . . , bl )K(bl , . . . , b0 ) + K(b0 , . . . , bl−1 )K(bl−1 , . . . , b0 ) = ¡ ¢2 ¡ ¢2 = K(b0 , . . . , bl ) + K(b0 , . . . , bl−1 ) . 89
Prvočíslo p je tedy součtem dvou čtverců. Ukažme, že rozklad je jednoznačný. Předpokládejme, že p = a2 + b2 = c2 + d2 pro nějaké a, b, c, d ∈ N. Bez újmy na obecnosti předpokládejme a > b a c > d. Protože p je prvočíslo, platí a ⊥ b, c ⊥ d. Zlomky ab ,
c d
jsou tedy ve zkráceném tvaru. Pomocí
Eukleidova algoritmu najdeme jejich řetězové zlomky a = [b0 , . . . , bt ] b
a
c = [d0 , . . . , ds ] , d
kde t, s ≥ 0 a b0 , . . . , bt , d0 , . . . , ds ∈ N. Navíc podle Poznámky 6.5 je bt , ds ≥ 2. Uvažujme nejprve zlomek a K(b0 , . . . , bt ) = . b K(b1 , . . . , bt ) Platí tedy a = K(b0 , . . . , bt ) a b = K(b1 , . . . , bt ). Po dosazení do p = a2 + b2 dostaneme s použitím vlastností (6.19), že p = a2 + b2 = K(bt , . . . , b0 )K(b0 , . . . , bt ) + K(bt , . . . , b1 )K(b1 , . . . , bt ) = = K(bt , . . . , b0 , b0 , . . . , bt ) . Z rekurentního vztahu pro kontinuální polynomy máme p = K(bt , . . . , b0 , b0 , . . . , bt ) = K(bt , . . . , b0 , b0 , . . . , bt−2 ) + bt K(bt , . . . , b0 , b0 , . . . , bt−1 ) . Pro x := K(bt , . . . , b0 , b0 , . . . , bt−1 ), tedy můžeme psát nerovnost p ≥ 2x + 1, kde jsme využili bt ≥ 2. Platí proto 2 ≤ x ≤ (p − 1)/2. Nyní využijeme rovnost (6.6), K(bt , . . . , b0 ,b0 , . . . , bt−1 )K(bt−1 , . . . , b0 , b0 , . . . , bt ) − − K(bt , . . . , b0 , b0 , . . . , bt )K(bt−1 , . . . , b0 , b0 , . . . , bt−1 ) = = x2 + p K(bt−1 , . . . , b0 , b0 , . . . , bt−1 ) = (−1)2t+1 , což znamená, že x2 ≡ −1 mod p. Kdybychom uvažovali zlomek
c d
= [d0 , . . . , ds ], stejným způsobem bychom odvodili,
že p = K(ds , . . . , d0 , d0 , . . . , ds ) a číslo y definované jako y := K(ds , . . . , d0 , d0 , . . . , ds−1 ) splňuje 2 ≤ y ≤ (p − 1)/2 a y 2 ≡ −1 mod p. Dohromady tedy máme x2 − y 2 = (x − y)(x + y) ≡ 0 mod p. Protože p je prvočíslo, musí platit buď x − y ≡ 0 mod p nebo x + y ≡ 0 mod p. S ohledem na nerovnosti 2 ≤ x, y ≤ (p − 1)/2 možnost x ≡ −y mod p vyloučíme a odvodíme x = y. Proto platí K(bt , . . . , b0 , b0 , . . . , bt ) p p K(ds , . . . , d0 , d0 , . . . , ds ) = = = . K(bt−1 , . . . , b0 , b0 , . . . , bt ) x y K(ds−1 , . . . , d0 , d0 , . . . , ds )
90
Odvodili jsme tedy [bt , . . . , b0 , b0 , . . . , bt ] = [ds , . . . , d0 , d0 , . . . , ds ] . Rozvoj do řetězového zlomku je ale podle poznámky 6.5 jednoznačný, a proto t = s a bi = di pro i = 0, . . . , t. To také implikuje a = K(b0 , . . . , bt ) = K(d0 , . . . , ds ) = c
a
což jsme měli ukázat.
91
c = K(b1 , . . . , bt ) = K(d1 , . . . , ds ) = d ,
7
Transcendentní čísla
Množina racionálních čísel se ukazuje býti chudá ve dvou situacích: • Polynomy s koeficenty v Q nemusejí mít v Q řešení. • Cauchyovské posloupnosti racionálních čísel nemusejí mít v Q limitu. Neexistence racionálního kořene polynomu má různé projevy. Např. o polynomu x2 − 2 už Řekové dokázali, že nemá racionální kořen. Nicméně lze nalézt posloupnost racionálních čísel (rn )n∈N takovou, že rn jsou “skoro kořeny”, v dnešní terminologii lim(rn2 − 2) = 0. Naproti tomu pro polynom x2 + 1 se nám ani nepodaří najít posloupnost “skoro kořenů”. Jak už víme z kapitoly o algebraických číslech, když definujeme množinu A jako množinu všech kořenů polynomů s racionálními koeficienty a vhodně dodefinujeme operaci sčítání a násobení, dostaneme tzv. těleso algebraických čísel. Toto těleso je už z pohledu kořenů dostatečně bohaté, tj. každý polynom s koeficienty v A má kořen v A. Když zavedeme na prostoru racionálních cauchyovských posloupností ekvivalenci (xn )n∈N ∼ (yn )n∈N ,
pokud
lim(xn − yn ) = 0 ,
lze třídy ekvivalence opatřit sčítáním a násobením tak, že dostaneme těleso dnes značené R a nazývané reálná čísla. Toto těleso je už z pohledu limit dostatečně bohaté, tj. každá posloupnost reálných čísel má v R limitu. Těleso A tedy řeší otázku existence kořenů, těleso R pak otázku existence limit, ale ne naopak. O reálných číslech se jednoduše ukáže, že selhávají z pohledu hledání kořenů, např. kořen polynomu x2 + 1 nemůže být reálný. Ukázat, že A neobsahuje limity všech racionálních cauchyovských posloupností, se dlouho nedařilo, i když většina matematiků o tom byla přesvědčena. Proto se ujala známá konstrukce, která uvažuje minimální těleso obsahující R a kořen rovnice x2 + 1, tzv. imaginární jednotku i. Výsledkem je těleso komplexních čísel C. Toto těleso je už bohaté z obou pohledů. Snadno se ukáže, že C obsahuje limity všech komplexních cauchyovských posloupností. Slavný výsledek Gausse 92
z roku 1799, že každý polynom s koeficienty v C má v C kořen, pak vyjadřuje algebraickou uzavřenost C. Otázka, zda není zbytečné konstruovat C, neboli zda už náhodou neplatí A = C, zůstala však i po Gaussovi nevyřešena. Prvky množiny C \ A, se nazývají transcendentní. Nezodpovězena tedy byla otázka, zda existuje transcendentní číslo. Všichni tušili, že e a π jsou transcendentní. Ale až v roce 1944 Joseph Liouville explicitně zkonstruoval transcendentní číslo. Průlomovým okamžikem v pohledu na transcendentní čísla byly Cantorovy výsledky spojené s definicí ekvivalence množin z roku 1873. Vedly k překvapivě jednoduchému důkazu faktu, že téměř každé komplexní číslo je transcendentní. Cantorův důkaz však naposkytuje návod, jak - byt’ jediné - transcendentní číslo zkonstruovat. Ve stejném roce Ch. Hermit dokázal, že Eulerovo číslo e je transcendentní. Tento výsledek ve své době zastínil Cantorův důkaz, který byl pouze existenční. V roce 1882 Hermitův žák F. Lindemann odvodil transcendentnost čísla π. Proslavil se tak důkazem nemožnosti kvadratury kruhu, viz kapitola o konstrukcích pomocí kružítka a pravítka.
7.1
Liouvilleova čísla
Liouville udělal elegantní pozorování, že algebraické číslo nemůže být příliš dobře aproximováno zlomkem s malým jmenovatelem. Věta 7.1. Necht’ α je algebraické číslo řádu d ≥ 2. Pak existuje c = c(α) > 0 takové, že ¯ ¯ ¯α − p ¯ ≥ c q qd
pro každé
p ∈ Q. q
Důkaz. Necht’ polynom f (x) = ad xd +. . .+a1 x+a0 s celočíselnými koeficienty je minimální polynom čísla α. Protože f nemá žádný racionální kořen, je f (p/q) 6= 0. Proto d d−1 d−1 ¯ ¡ p ¢¯ ¯ + a0 q d ¯¯ 1 ¯f ¯ = ¯ ad p + ad−1 p q + . . . + a1 pq ≥ d. d q q q
(7.1)
Použijeme-li Lagrangeovu větu o přírustku funkce na interval s krajními body α a p/q , dostaneme pro nějaké ξ z tohoto intervalu ¯ ¡ p ¢¯ ¯ ¡ ¢ ¯ ¯ ¡ ¢¯ ¯f ¯ = ¯f p − f (α)¯ = ¯f 0 (ξ) α − p ¯ . q q q Položme
© c := min 1,
ª
1 maxξ∈[α−1,α+1]
93
|f 0 (ξ)|
.
(7.2)
Při této volbě c zřejmě platí p ∈ / [α − 1, α + 1] q
¯ ¯ ¯α − p ¯ ≥ 1 ≥ 1 ≥ c q qd qd
=⇒
a ze vztahů (7.1) a (7.2) také p ∈ [α − 1, α + 1] q
¯ 1 ¯¯ p¯ p¯ |f 0 (ξ)| . ¯α − ¯ ≤ α− ¯ ξ∈[α−1,α+1] q c q
1 ≤ qd
=⇒
max
Nyní můžeme představit první známé transcendentní číslo. D˚ usledek 7.2. Číslo
P+∞
1 n=1 10n!
je transcendentní.
Důkaz. Pro spor předpokládejme, že α :=
P+∞
1 n=1 10n!
je algebraické řádu d. Definujme pN
a qN pro každé N ∈ N takto N X pN pN 1 = = . N ! n! 10 qN 10 n=1
Z věty 7.1 dostaneme odhad ¯ c c pN ¯¯ = d ≤ ¯α − = N ! d (10 ) qN qN
+∞ X
+∞ X
1 ≤ n! 10 n=N +1
n=(N +1)!
1 1 10 = . n (N +1)! 10 10 9
Z toho plyne 10(N +1)!−d N ! ≤
10 . 9c
Protože exponent (N + 1)! − d N ! = N !(N + 1 − d) má limitu +∞, je limita posloupnosti na levé straně +∞ a ta by měla být menší než konstanta Poznámka 7.3. Když budeme uvažovat číslo α =
10 9c
- spor.
P+∞
an n=1 10n! ,
kde (an )n∈N je libovolná
posloupnost z 0 a 1 obsahující nekonečně mnoho jedniček, dokážeme stejným postupem transcendentnost α. Tedy takto zkonstruujeme tolik transcendentních čísel, kolik je posloupností z 0 a 1. Protože {0, 1}N je ekvivalentní s R, množina transcendentních čísel má mohutnost kontinua. To dokázal už Cantor, ale narozíl od Cantorova důkazu, umíme kontinuun transcendentních čísel zkonstruovat. D˚ usledek 7.4. Necht’ α je iracionální číslo. Necht’ existuje prostá posloupnost racionálních ¡ ¢ čísel pqnn n∈N taková, že ¯ ¯ ¯α − pn ¯ ≤ 1 qn qnn
pro každé n ∈ N .
Pak α je transcendentní. 94
Důkaz. Pro spor předpokládejme, že α je algebraické číslo. Protože α je iracionální, je jeho řád d alespoň 2. Podle 7.1 existuje c > 0 tak, že pro každé n ∈ N platí ¯ ¯ c ¯α − pn ¯ ≤ 1 . ≤ qnd qn qnn To implikuje qnn−d ≤ 1/c. Jelikož nejvýše jedno qn může být jednička, je limita posloupnosti qnn−d rovna +∞. To odporuje tomu, že je shora omezená konstantou 1/c. Definice 7.5. Číslo α nazveme Liouvilleovým, když vyhovuje předpokladům důsledku 7.4. Samozřejmě každé Liouvilleovo číslo je transcendentní. Všechna čísla
P+∞
an n=1 10n!
definovaná
v poznámce za 7.2 jsou Liouvilleova, a tedy má množina Liuouvilleových čísel mohutnost kontinua. Lze však ukázat, že tato množina má Lebesgueovu míru 0. Tedy většina transcendentních čísel není Liouvilleova. V této souvislosti je proto zajímavé zmínit následující větu. Věta 7.6. Každé reálné číslo lze zapsat jako součet dvou Liouvilleových čísel. Důkaz. Z definice Liouvilleova čísla plyne, že když α je Liouvilleovo pak α + 1 a α − 1 jsou Liouvilleova též. Proto bez újmy na obecnosti stačí větu dokázat pro reálné číslo β ∈ (0, 1]. Necht’ β = 0.d1 d2 d3 d4 . . . je zápis čísla β v decimální soustavě, který obsahuje nekonečně mnoho nenulových koeficientů di (např.
1 2
= 0.249999999 . . .). Položme
L1 := 0 . 0 d2 d3 0 0 0 0 0 0 d10 d11 . . . d33 0 0 ... L2 := 0 . d1 0 0 d4 d5 d6 d7 d8 d9 0 0 ... 0 d34 d35 . . . Bloky nul mají v zápisech čísel L1 a L2 na střídačku délky 1!, 2!, 3!, 4!, . . .. Zřejmě platí β = L1 + L2 . Ukažme, že L2 je Liouvilleovo číslo. Definujme pn pn = = 0.d1 00d4 . . . dI , I 10 qn kde poslední index I je I = 1! + 2! + 3! + . . . + (2n − 1)!, tj. desetinný zápis pn /qn obsahuje desetinná místa čísla L2 až po index I - na tomto indexu končí n-tý blok nenul v zápisu L2 . Jmenovatele qn klademe 10I . Proto L2 −
pn = 0. 000 . . 000} dJ dJ+1 dJ+2 . . . , | .{z qn I+(2n)! nul
95
kde J = I + (2n)! + 1 .
Dostáváme kýžený odhad 0 < L2 −
pn 1 1 1 < < = n. I+(2n)! In qn 10 10 qn
Využili jsme přitom platnost nerovnosti nI < I + (2n)!, kterou jedinnou zbývá ověřit: nI = n
2n−1 X
k! < n
k=1
2n−2 X
k!+n(2n−1)! < n(2n−1)(2n−2)!+n(2n−1)! = (2n)! < I +(2n)! .
k=1
Důkaz liouvilleovskosti L1 je obdobný. Poznámka 7.7. V předchozích důkazech liouvilleovskosti jsme podstatně využívali, že desetinný zápis zkoumaného čísla obsahoval dlouhé bloky nul. Tato vlastnost samotná však nestačí. V roce 1930 Kurt Mahler ukázal o čísle M := 0.1234567891011121314151617181920212223 . . . , jež vznikne postupným psaním po sobě jdoucích přirozených čísel, že je transcendentní, ale není Liouvilleovo. Přitom desetinný zápis Mahlerova čísla obsahuje bloky nul libovolné délky. Poznámka 7.8. Podle Liouvilleovy věty 7.1 se nelze k algebraickému číslu α řádu d ≥ 2 přiblížit racionálním číslem rovnicích víme
p q
pod hranici
¯ ¯ ¯α − p ¯ < 1 q q2
c . qd
Na druhé straně z kapitoly o diofantických
pro nekonečně mnoho
Jak moc lze snížit exponent d ve jmenovateli
1 , qd
p ∈ Q. q
aby platila Liouvilleova nerovnost? Na
tuto otázku odpověděl v roce 1955 Klaus Roth. Dokázal, že pro každé algebraické číslo α řádu d ≥ 2 a každé kladné ε existuje c = c(α, ε) > 0 takové, že ¯ ¯ ¯α − p ¯ ≥ c q q 2+ε
pro každé
p ∈ Q. q
Bohužel tato vlastnost necharakterizuje algebraická čísla: stejné tvrzení platí, když v Rothově větě zvolíme za α Eulerovo číslo e.
7.2
Transcendentnost Eulerova čísla e
Čtenář si jistě pamatuje důkaz iracionality čísla e z prvoročníkové analýzy. Pro závěrečný spor poslouží jednoduchý fakt, že v intervalu (0, 1) neleží žádné celé číslo. Tento fakt je používaný i v mnoha důkazech o transcendentnosti, proto jej např. v [3] nazývají ”základní 96
princip teorie čísel”. Budeme jej využívat i v našem důkazu. Důležitou technickou roli v důkazu bude mít polynom definovaný pro libovolné přirozené číslo n a prvočíslo p > n f (x) :=
xp−1 (x − 1)p (x − 2)p . . . (x − n), . (p − 1)!
(7.3)
Polynom f je tedy polynom stupně (n + 1)p − 1. Dvě potřebné vlastnosti f v bodech 0, 1, 2, . . . , n dokážeme v následujících lemmatech. Lemma 7.9. Pro derivace polynomu f v bodě 0 platí 1. f (r) (0) je celé číslo pro každé r ∈ N0 , 2. f (p−1) (0) není dělitelné prvočíslem p ; 3. f (r) (0) je dělitelné prvočíslem p pro každé r ∈ N0 \ {p − 1}. Důkaz. Případ r > (n + 1)p − 1. Protože f je polynom stupně (n + 1)p − 1, jsou všechny jeho r-té derivace identicky rovny nule. Pro takové r je číslo f (r) (0) = 0, a tedy celé a dělitelné číslem p. Případ r < p − 1. Připomeňme jednoduché tvrzení o polynomech: pokud číslo α je k násobný kořen polynomu q(x) pro nějaké k ∈ N, má derivace q 0 (x) číslo α za svůj (k − 1) násobný kořen. Jelikož 0 je p − 1 násobným kořenem našeho polynomu f , je 0 kořenem všech jeho derivací f (i) pro i = 0, 1, . . . , p − 2. Proto opět pro takové r je f (r) (0) = 0. Pro zbylé případy spočítame r-tou derivaci f podle Newtonova vzorce pro výpočet derivace součinu dvou funkcí: ¶(k) ³ r µ ¶µ X £ ¤p ´(r−k) r xp−1 (r) (x − 1)(x − 2) . . . (x − n) . f (x) = k (p − 1)! k=0 | {z }
(7.4)
A
Případ r = p − 1. Dosad’me do rovnosti x = 0. V tomto případě je výraz A nenulový pouze pro sčítací index k = p − 1. Pro takové k je hodnota A = 1. Proto dostaneme £ ¤p f (p−1) (0) = (−1)(−2) . . . (−n) = (−1)np (n!)p ∈ Z . Ted’ využijeme, že prvočíslo p > n. To zaručuje, že p nedělí f (p−1) (0). Případ p − 1 < r ≤ (n + 1)p − 1. 97
Po dosazení 0 do vztahu (7.4) si opět zahraje pouze sčítací index k = p − 1 a A = 1. Polynom
£ ¤p h(x) := (x − 1)(x − 2) . . . (x − n)
je pro r > p − 1 alespoň jednou zderivován. Z tvaru derivace £ ¤p−1 £ ¤0 h0 (x) = p (x − 1)(x − 2) . . . (x − n) (x − 1)(x − 2) . . . (x − n) vidíme, že h0 (x) lze napsat jako pg(x), kde g(x) je polynom s celočíselnými koeficienty. Takový polynom má všechny své derivace v celočíselných bodech celočíselné. Proto je ¡ ¢(r−p+1) h(x) v bodě 0 násobkem p.
Lemma 7.10. Pro každé j ∈ {1, 2, . . . , n} a r ∈ N0 je f (r) (j) dělitelné prvočíslem p. Důkaz. Upevněme j. Polynom f lze napsat ve tvaru f (x) =
´ 1 ³ Bp (x − j)p + Bp+1 (x − j)p+1 + . . . , (p − 1)!
kde Bp , Bp+1 , . . . ∈ Z
Jelikož číslo j je p násobným kořenem polynomu f (x), platí f (r) (j) = 0
pro r = 0, 1, . . . , p − 1 .
Pro r ≥ p dostaneme f (r) (j) =
1 Br r! = Br r(r − 1) . . . p , (p − 1)!
a tedy je to číslo dělitelné p. Lemma 7.11. Necht’ q je libovolný polynom stupně s. Položme F (x) := q(x) + q 0 (x) + . . . + q (s) (x) . Pak
Z
x
ex−t q(t) dt = −F (x) + ex F (0)
0
Důkaz. Aplikujme metodu per partes Z x Z x−t x−t x e q(t) dt = [−e q(t)]0 + 0
x
Z x−t 0
e
x
x
q (t) dt = e q(0) − q(x) +
0
0
a pak indukci na stupeň polynomu q. 98
ex−t q 0 (t) dt
Věta 7.12. Číslo e je transcendentní. Důkaz. Pro spor předpokládejme, že existují celá čísla c0 , c1 , . . . , cn tak, že c0 + c1 e + . . . + cn en = 0,
kde c0 6= 0 .
(7.5)
Tvrzení lemmatu 7.11 použijeme na polynom f definovaný v (7.3), kde za x postupně dosadíme j = 0, 1, . . . , n. Po vynásobení koeficientem cj a sečtením dostaneme s přihlédnutím k (7.5)
n X
Z
j
cj
j=0
e
j−t
f (t) dt = −
0
n X
cj F (j) .
(7.6)
j=0
Podle Lemmat 7.9 a 7.10 je pravá strana rovnosti celé číslo, které je modulo p rovno c0 F (0), a to pro každé prvočíslo p > n. Zvolíme-li prvočíslo p > c0 6= 0, je podle 7.9 pravá strana 6= 0 mod p. Proto je pravá strana celé nenulové číslo. Spor dostaneme tak, že o levé strané rovnosti (7.6) ukážeme, že jí vhodnou volbou prvočísla p > c0 dokážeme udělat v absolutní hodnotě menší než 21 . Odhadujme Z j n ¯X ¯ p−1 pn n ¯ ¯ j−t n n cj e f (t) dt¯ ≤ (n + 1)n max |cj |e . ¯ j=0,...,n (p − 1)! 0 j=0 Uvědomme si, že n je pevné - je to řád čísla e, o kterém pro spor předpokládame, že je algebraické. Protože (nn+1 )p = 0, p7→+∞ (p − 1)! lim
lze pro dostatečně velké prvočíslo p odhadnout levou stranu (7.6) zlomkem 21 .
7.3
Transcendentnost čísla π
Číslu π se v zemích s vlivem německé matematiky říká Ludolphovo číslo. Ludolph van Ceulen byl německý matematik, který působil v holandském Leidenu. V roce 1596 určil π s přesností na 20 míst. Myšlenky důkazu transcendentnosti π jsou stejné jako u čísla e, jenom volba vhodného polynomu f je více rafinovaná. Využijeme faktu, že komplexní číslo α je transcendentní právě tehdy, když iα je transcendentní. Budeme tedy sporem dokazovat transcendentnost iπ. Necht’ iπ je algebraické číslo řádu n. Označme iπ = α1 , α2 , . . . , αn kořeny jeho minimálního monického polynomu. V našich úvahách budeme využívat, že koeficienty minimálního polynomu jsou jednak racionální čísla a jednak jsou to hodnoty elementárních 99
symetrických polynomů v proměnných α1 , α2 , . . . , αn . Protože eiπ + 1 = 0, platí ¡
¢¡ ¢ ¡ ¢ eα1 + 1 eα2 + 1 . . . eαn + 1 = 0 .
(7.7)
Po roznásobení dostaneme na levé straně sumu mocnin čísla e, kde v exponentech jsou součty všech možných výběru kořenů z množiny α1 , α2 , . . . , αn . Např. levá strana bude obsahovat sčítance eαi +αj pro všechny i, j = 1, 2, . . . , n, i 6= j,. Koeficienty polynomu g2 (x) :=
Y
(x − αi − αj )
i6=j
jsou symetrické polynomy v proměnných α1 , . . . , αn . Podle základní věty o symetrických polynomech lze koeficienty polynomu g2 (x) vyjádřit jako polynomy v elementárních symetrických polynomech, které nabývají pro proměnné α1 , α2 , . . . , αn racionálních hodnot. Proto g2 (x) je polynom s racionálními koeficienty. Podobně lze dokázat, že polynom g3 (x) definovaný tak, aby měl za kořeny všechny sčítance αi + αj + αk tří různých kořenů, má racionální koeficienty. Analogicky definujeme také racionální polynomy g4 , . . . , gn . Pak rovnice g1 (x)g2 (x) . . . gn (x) = 0 je polynomiální rovnice s racionálními koeficienty a má kořeny všechny možné sumy vytvořené z α1 , α2 , . . . , αn . Označme β1 , . . . , βr všechny nenulové kořeny této polynomiální rovnice. Zkrácením polynomu g1 (x)g2 (x) . . . gn (x) faktorem x umocněným na násobnost nuly a vynásobením vhodným celým číslem dostaneme polynom stupně r s celočíselnými koeficienty, označme jej g(x), tj. g(x) = cxr + c1 xr−1 + . . . + cr ,
kde c, cr 6= 0 .
(7.8)
Nenulová čísla β1 , β2 , . . . , βr jsou tedy kořeny polynomu g a zároveň pro ně podle vztahu (7.7) platí eβ1 + eβ2 + . . . + eβr + e|0 + .{z . . + e}0 = 0 , k
Nyní definujme polynom f (x) := crp−1
kde k > 0 .
(7.9)
krát
¢p xp−1 ¡ g(x) . (p − 1)!
Na tento polynom stupně r(p + 1) − 1 aplikujeme lemma 7.11 pro hodnotu x = βj . Dostaneme
Z
βj
βj
−F (βj ) + e F (0) = 0
100
eβj −t f (t) dt .
Po sčítání a využití (7.9) −
r X
F (βj ) − kF (0) =
r Z X
j=1
j=1
βj
eβj −t f (t) dt .
(7.10)
0
Opět ukážeme, že při vhodné volbě prvočísla p pravou stranu rovnosti umíme udělat menší než 12 . Za tímto účelem označme L minimální uzavřený kruh v komplexní rovině s počátkem v 0, který obsahuje β1 , . . . , βr , tj. jeho poloměr je R := max{|βj |}. Hodnoty holomorfních funkcí g(x), x a eβj −x můžeme omezit na kompaktu L v absolutní hodnotě společnou konstantnou, označme ji M . Proto lze odhadnout r Z βj ¯X ¯ M p−1 ¯ ¯ eβj −t f (t) dt ¯ ≤ rRM crp−1 Mp . ¯ (p − 1)! j=1 0 Pravá strana v naši nerovnosti má limitu 0 při rostoucím p, a tedy vhodnou volbou p lze levou stranu udělat libovolně malou. Abychom získali kýžený spor, potřebujeme ukázat, že levá strana v (7.10) je celé nenulové číslo. Tento fakt bezprostředně plyne z těchto dvou lemmat. Lemma 7.13. Pro každé t ∈ N0 platí r X
f (t) (βj ) je celé číslo dělitelné číslem p .
j=1
Důkaz. Jelikož každé βj je p násobný kořen polynomu f a tento polynom má stupeň rp + p − 1, je tvrzení netriviální pouze pro derivace řádu t, kde p ≤ t ≤ rp + p − 1. Uvažujme takové t. Derivace f (t) (βj ) je celočíselným polynomem v proměnné βj stupně nanejvýš rp − 1. Navíc každý koeficient polynomu f (t) (βj ) je dělitelný faktorem p a crp−1 . Pr (t) Suma j=1 f (βj ) je symetrickým polynomem v proměnných β1 , . . . , βr , a proto lze Pr (t) j=1 f (βj ) napsat jako celočíselný polynom stupně nanejvýš rp − 1, kde proměnné jsou elementární polynomy v β1 , . . . , βr . Ze vztahu (7.8) plyne, že i-tý elementární polynom v β1 , . . . , βr má hodnotu ci /c. Faktor crp−1 v definici polynomu f zaručuje, že po dosazení ci /c, je výsledek celé číslo, které je dělitelné prvočíslem p. Lemma 7.14. Necht’ p > max{cr , c} je prvočíslo. Pak f (t) (0) je celé číslo pro každé t ∈ N0 . Navíc • p dělí f (t) (0) pro každé t ∈ N0 \ {p − 1}; • f (p−1) (0) = cpr crp−1 a není dělitelné číslem p. Důkaz. Toto lemma se dokazuje stejně jako lemma 7.9, úlohu polynomu h(x) ted’ hraje polynom crp−1 g(x). 101
7.4
Řetězový zlomek Eulerova čísla e
Kdybychom spočítali několik prvních členů řetězových zlomků čísel e a π dostali bychom e = [2, 1, 2, 1, 1, 4, 1, 1, 6, 1, 1, 8, 1, 1, 10, 1, 1, 12, 1, 1, 14, 1, 1, 16, 1, 1, 18, 1, 1, . . . π = [3, 7, 15, 1, 292, 1, 1, 1, 2, 1, 3, 1, 14, 2, 1, 1, 2, 2, 2, 2, 1, 84, 2, 1, 1, 15, 3, 13, 1, 4, 2, 6, 6, 99, 1, 2, . . .] U čísla e tušíme zákonitost, jak bude řada koeficientů dále pokračovat. Cílem této kapitoly bude potvrdit toto tušení. Zato koeficienty v řetězovém zlomku čísla π vypadají velice náhodně a zatím se nepodařilo nic zajímavého o nich vypozorovat. Kromě kvadratických iracionalit, které mají řetězový zlomek od jistého místa periodický, má pravidelný tvar řetězového zlomku i další skupina čísel, jež umíme vyjádřit pomocí známe funkce tgh (x) =
sinh(x) ex − e−x = x . cosh(x) e + e−x
Budeme využívat rozvojů funkcí sinh(x) a cosh(x) do Taylorovy řady, které odvodíme snadno z rozvoje exponenciály: sinh(x) =
+∞ X k=0
x2k+1 (2k + 1)!
Věta 7.15. Řetězový zlomek čísla tgh tgh
¡1¢ n
a
¡1¢ n
cosh(x) =
+∞ X x2k . (2k)! k=0
(7.11)
je
= [0, n, 3n, 5n, 7n, . . .] pro každé n ∈ N .
Důkaz. Pro parametr c ∈ R \ {0, −1, −2, −3, . . .} definujme funkci F (c, x) :=
+∞ X k=0
xk . c(c + 1) . . . (c + k − 1) k!
Nejdříve ověřme, že pro tuto funkci platí x F (c + 2, x) . c(c + 1)
F (c, x) = F (c + 1, x) +
(7.12)
Protože se jedná o rovnost mezi mocninnými řadami, stačí ověřit, že se rovnají koeficienty u mocnin xk pro každé k. K tomu stačí ověřit, že 1 c(c+1)···(c+k−1) k!
=
1 (c+1)(c+2)···(c+k) k!
+
102
1 1 c(c+1) (c+2)(c+3)···(c+2+k−2) (k−1)!
.
Po dosazení x = z 2 do (7.12) a jednoduché úpravě dostaneme z F (c + 1, z 2 ) = c F (c, z 2 )
1 c z
+
z F (c+2,z 2 ) c+1 F (c+1,z 2 )
.
(7.13)
Aplikováním (7.13) s parametrem c zvýšeným o 1 na druhý sčítanec jmenovatele prvé strany (7.13) dostaneme z F (c + 1, z 2 ) = c F (c, z 2 )
1 c z
+
.
1
c+1 z F (c+3,z 2 ) + c+2 z F (c+2,z 2 )
V tomto postupu bychom mohli pokračovat libovolně dlouho. Pokud by navíc platilo, že • výrazy zc ,
c+1 c+2 c+3 , z , z ,... z
• pro každé k ∈ N patří
jsou přirozená čísla a
z F (c+k+1,z 2 ) c+k F (c+k,z 2 )
do intervalu (0, 1),
, c+2 , c+3 , . . .]. získali bychom řetězový zlomek [0, zc , c+1 z z z Splnění předchozích podmínek nám zaručí volba c =
1 2
a z =
1 2n
pro libovolné n ∈ N:
z definice funkce F (c, x) totiž plyne, že pro kladné x a kladná c1 < c2 platí F (c1 , x) > F (c2 , x). Nalezli jsme řetězový zlomek čísla 1 F ( 32 , 4n1 2 ) = [0, n, 3n, 5n, 7n, . . .] . n F ( 12 , 4n1 2 )
(7.14)
Z definice funkce F a využitím (7.11) upravíme F
¡3
F
¡1
2
,w
,w 2
¢ ¢
= =
+∞ X 3 k=0 2 +∞ X 1 k=0 2
Po nahrazení w = dostaneme
+∞ X w2k (2w)2k 1 = = sinh(2w) , 5 2k+1 (2k + 1)! 2w · 2 ··· 2 · 1 · 2 · 3···k k=0 +∞ X w2k (2w)2k = = cosh(2w) . (2k)! · 32 · · · 2k−1 · 1 · 2 · 3 · · · k 2 k=0
1 2n
v předchozích rovnostech a dosazením do levé strany (7.14)
sinh( n1 ) 1 F ( 32 , 4n1 2 ) = = [0, n, 3n, 5n, 7n, . . .] . n F ( 12 , 4n1 2 ) cosh( n1 )
Věta 7.16. Pro řetězový zlomek [a0 , a1 , a2 , . . .] Eulerova čísla e platí: a0 = 2 a a3k−2 = 1,
a3k−1 = 2k,
a3k = 1
103
pro každé k ∈ N .
e+1 e−1
Důkaz. Označme α :=
=
1
1
e 2 +e− 2
1 1 e 2 −e− 2
= cotg
¡1¢ 2
. Z věty 7.15 získáme řetězový zlomek
α = [b0 , b1 , b2 , . . .] = [2, 6, 10, 14, . . .], tj. bk = 2 + 4k pro každé k ∈ N0 . Definujme ξ jako číslo s řetězovým zlomkem [2, 1, 2, 1, 1, 4, 1, 1, 6, 1, 1, 8, . . .]. Pokud ukážeme, že ξ je rovno Necht’
rn sn
α+1 α−1
budeme hotovi, protože
je n-tý sblížený zlomek k číslu α a rn n→∞ sn
α = lim
pn qn
α+1 α−1
= e.
je n-tý sblížený zlomek k číslu ξ, tj. platí pn . n→∞ qn
a ξ = lim
(7.15)
Nejdříve ukážeme, že p3n+1 = rn + sn
a
q3n+1 = rn − sn
pro každé n ∈ N0 .
(7.16)
Pro n = 0: p1 q1
=2+
1 1
=
3 1
a
r0 s0
=
2 1
=⇒
p1 = 3, q1 = 1, r0 = 2, s0 = 1 ,
pro n = 1: p4 q4
=2+
1 1+
1
1 2+ 1+1
=
19 7
a
r1 s1
=2+
1 6
=
13 6
=⇒
p4 = 19, q4 = 7, r1 = 13, s1 = 6 .
Tedy (7.16) platí pro n rovno 0 a 1. Z kapitoly o sblížených zlomcích víme, že posloupnost čitatelů (rn ) i posloupnost jmenovatelů (sn ) sblížených zlomků
rn sn
vyhovují stejnému
rekurentnímu vztahu, v našem případě: xn = (4n + 2)xn−1 + xn−2 .
(7.17)
Tento rekurentní vztah je lineární, a proto ho splňují i posloupnosti (rn + sn ) a (rn − sn ). Když ukážeme, že (7.17) platí i pro posloupnosti (p3n+1 ) a (q3n+1 ), bude rovnost (7.16) dokázána, protože když se dvě posloupnosti, které řeší stejnou lineární diferenční rovnici druhého řádu, shodují v prvních dvou členech, pak jsou totožné. Potřebujeme tedy ověřit, že p3n+1 = (4n + 2)p3n−2 + p3n−5
a q3n+1 = (4n + 2)q3n−2 + q3n−5 .
Víme, že pro posloupnost (pn ) čitatelů platí pn = an pn−1 + pn−2 ,
104
(7.18)
kde an jsou dány v tvrzení věty. Napišme rekurentní vztahy pro pět po sobě jdoucích indexů. Vhodným vynásobením rovností a sečtením, jak je naznačeno níže získáme p3n−3 = p3n−4 + p3n−5
×1
p3n−2 = p3n−3 + p3n−4
×(−1)
p3n−1 = 2n p3n−2 + p3n−3
×2
p3n
×1
= p3n−1 + p3n−2
p3n+1 = p3n + p3n−1
×1 P
p3n+1 = (4n + 2)p3n−2 + p3n−5
Podobně ověříme platnost (7.18) pro posloupnost (q3n+1 ). Ted’ můžeme provést poslední krok, ve kterém využijeme (7.15) a (7.16) p3n+1 rn + sn ξ = lim = lim = lim n→∞ q3n+1 n→∞ rn − sn n→∞
105
rn sn rn sn
+1 −1
=
α+1 = e. α−1
8 Okruh celých čísel v číselném tělese 8.1
Algebraická celá čísla
Definice 8.1. Číslo β ∈ C se nazývá algebraické celé, jestliže existuje monický polynom f ∈ Z[x] tak, že f (β) = 0. Množinu všech algebraických celých čísel B. Příklad 8.2. Každé celé číslo a ∈ Z je algebraické celé, protože je kořenem polynomu x−a ∈ Z[x]. Je tedy Z ⊂ B. Pro rozlišení budeme někdy pro okruh celých čísel Z používat název racionální celá čísla. Pokud minimální polynom čísla α ∈ A leží v Z[x], pak α je algebraické celé číslo, tj. α ∈ B. Platí i opačná implikace. Věta 8.3. Číslo α ∈ A je algebraické celé, právě když jeho minimální polynom má koeficienty v Z. Důkaz. Je-li α kořenem celočísleného monického polynomu g, pak minimální polynom f čísla α dělí g. Z Věty 3.4 polynom f leží nutně v Z[x]. Následující tvrzení dává do vztahu algebraická a algebraická celá čísla. Tvrzení 8.4. Pro každé α ∈ A existuje nenulové d ∈ Z tak, že dα ∈ B. Důkaz. Necht’ α je algebraické číslo řádu n a necht’ f ∈ Q[x] je jeho minimální polynom, n
f (x) = x +
n−1 X
ai xi ,
kde ai =
i=0
Položme d =
Qn−1 i=0
pi ∈ Q. qi
qi . Rovnici f (α) = 0 vynásobíme číslem dn a dostaneme n
0 = (dα) +
n−1 X pi i=0
Polynom g(x) = xn +
Pn−1
pi n−i i x i=0 qi d
qi
dn−i (dα)i .
je monický, má celočíselné koeficienty a číslo dα je
jeho kořenem. Proto dα ∈ B. 106
Je zřejmé, že množina algebraických celých čísel je podmnožinou všech algebraických čísel. Podobně jako množina A má i množina B zajímavou algebraickou strukturu. Vzhledem k operacím sčítání a násobení v C je to okruh, což přímo vyplývá z Tvrzení 4.12. Věta 8.5. Množina B je podokruh C. Ekvivalentně, nechť α, β ∈ B, potom α + β, α − β, αβ leží v B. Podobnou roli jako v tělese racionálních čísel hraje okruh Z, má množina algebraických celých čísel obsažená v algebraickém číselném tělese. Vzhledem k Větě 8.5 je to samozřejmě okruh. Definice 8.6. Necht’ α ∈ A. Pro těleso Q(α) = K nazveme okruhem celých čísel OK množinu algebraických celých čísel v K, tj. OK := Q(α) ∩ B. Následující věta charakterizuje prvky OK pomocí celočíselnosti koefcient˚ u jejich tělesového polynomu v tělese K. Věta 8.7. Necht’ α ∈ A, β ∈ Q(α). Pak β ∈ OK , právě když všechny koeficienty tělesového polynomu čísla β jsou celočíselné. Důkaz. Je-li tělesový polynom čísla β ∈ Q(α) prvek Z[x], pak z definice algebraických celých čísel přímo plyne β ∈ OK . Naopak, je-li β ∈ OK , pak jeho minimální polynom má podle Věty 8.3 celočíselné koeficienty. Ovšem, jak plyne z Tvrzení 4.33, tělesový polynom čísla β je mocninou minimálního polynomu čísla β, takže musí rovněž patřit do Z[x]. Příklad 8.8. V případě kvadratických těles lze tvrzení Věty 8.7 přepsat následujícím √ zp˚ usobem. Je-li K = Q( m), kde m ∈ Z neobsahuje čtverec, pak √ √ √ √ OK = Q( m) ∩ B = {a + b m | a, b ∈ Q, N (a + b m) ∈ Z, T (a + b m) ∈ Z} . Chceme-li explicitně popsat prvky okruhu OK , musíme tedy charakterizovat prvky tělesa √ √ Q( m), které mají celočíselnou normu a stopu. Uvažujme a+b m, a, b ∈ Q. Požadujeme √ N (a + b m) = a2 − mb2 ∈ Z
and
√ T (a + b m) = 2a ∈ Z .
Ze druhé podmínky máme rovnou a ∈ 12 Z. Z první podmínky máme po vynásobení 4, √ √ √ 4mb2 = 4a2 − 4N (a + b m) = T 2 (a + b m) − 4N (a + b m) ∈ Z .
107
Protože m neobsahuje čtverec, plyne z 4mb2 = m(2b)2 ∈ Z, že 2b ∈ Z. Jinak by totiž 2b =
2
p q
pro nějaké p, q ∈ Z, q ≥ 2, p ⊥ q. Pak ale m(2b)2 = m pq2 ∈ Z implikuje q 2 |m, což
je spor. Dokázali jsme tedy zatím, že OK ⊂
¯ ª √ ¯ c, d ∈ Z . (c + d m) 2
©1
Pro opačnou inkluzi je třeba zjistit, pro které páry celých čísel c, d ∈ Z je N ¡ √ ¢ Z. (Protože T 21 (c + d m) = c ∈ Z vždy.) Máme N
¡1
√ ¢ 1 2 (c + d m) = (c − md2 ) ∈ Z 2 4
⇐⇒
¡1
√ ¢ (c+d m) ∈ 2
c2 − md2 ≡ 0 mod 4
Pokud jsou čísla c, d obě sudá, kongruence je splněna. Jestliže c nebo d je liché, je třeba si uvědomit, že (2k + 1)2 = 4k 2 + 4k + 1 ≡ 0 mod 4. Snadno odvodíme, že kongruenci pak lze splnit pouze pro m ≡ 1 mod 4, budou-li c i d lichá čísla. Pro m 6≡ 1 mod 4 jsme tedy dokázali OK =
©1 2
¯ ª © ª √ √ ¯ (c + d m) ¯ c, d ∈ 2Z = a + b m ¯ a, b ∈ Z .
Pro m ≡ 1 mod 4 máme OK =
√ ¯ ¯ ª © ª √ ¯ c, d ∈ Z , c ≡ d mod 2 = a + b 1+ m ¯ a, b ∈ Z . (c + d m) 2 2
©1
√ Pro kvadratické těleso Q( m) jsme v Příkladu 8.8 tedy našli čísla β1 , β2 taková, že OK = {a1 β1 + a2 β2 | a1 , a2 ∈ Z}. Souboru takových čísel budeme říkat integrální báze okruhu celých čísel. √ Tvrzení 8.9. Necht’ K = Q( m), kde m ∈ Z neobsahuje čtverec. Integrální báze okruhu OK je
√ 1, m √
1, 1+2 m
8.2
pro m 6≡ 1 mod 4 , pro m ≡ 1 mod 4 .
Integrální báze okruhu celých čísel
Nejjednodušším případem okruhu celých čísel číselného tělesa je Z = OQ . Obecněji, okruh celých čísel číselného tělesa K řádu n je isomorfní Zn , jinými slovy je to volná abelovská grupa ranku n. To znamená, že existuje soubor β1 , . . . , βn prvk˚ u z OK takový, že každý prvek okruhu OK lze jednoznačně vyjádřit ve tvaru a1 β1 + · · · + an βn , ai ∈ Z. Tomuto souboru se říká integrální báze. Abychom dokázali existenci integrální báze, budeme studovat pojem diskriminantu souboru čísel. 108
Definice 8.10. Necht’ K je číselné těleso řádu n. Pro soubor čísel β1 , . . . , βn ∈ K definujeme matici M (β1 , . . . , βn ) ∈ Qn×n , ¡ ¢ M (β1 , . . . , βn ) jk = T (βj βk ) . Diskriminantem čísel β1 , . . . , βn rozumíme determinant matice M (β1 , . . . , βn ), značíme ∆(β1 , . . . , βn ) = det M (β1 , . . . , βn ) . Poznámka 8.11. Protože stopa prvk˚ u tělesa K je racionální, tj. T (βj βk ) ∈ Q, je diskriminant každého souboru n čísel β1 , . . . , βn racionální číslo. Diskriminant daného souboru čísel lze výpočítat přímo z definice. Následující věta umožňuje výpočet diskriminantu výhodnějším zp˚ usobem. Věta 8.12. Necht’ K je číselné těleso řádu n a necht’ β1 , . . . , βn ∈ K. Potom ¡ ¢2 ∆(β1 , . . . , βn ) = det N (β1 , . . . , βn ) , kde matice N (β1 , . . . , βn ) je definována ¡
¢ N (β1 , . . . , βn ) jk = σk (βj ) .
Důkaz. Označme pro jednoduchost M = M (β1 , . . . , βn ), N = N (β1 , . . . , βn ). Máme (N N T )jk =
n X
σi (βj )σi (βk ) =
i=1
n X
σi (βj βk ) = T (βj βk ) .
i=1
Proto M = N N T a odtud det M = det N · det N T = (det N )2 . Příklad 8.13. Necht’ α je algebraické číslo řádu n. Určíme ∆(1, α, α2 , . . . , αn−1 ) v tělese K = Q(α). Označíme-li α1 = α, . . . , αn kořeny sdružené k α, máme ¯2 ¯ ¯ ¯ 1 1 · · · 1 ¯ ¯ ¯ α α2 · · · αn ¯¯ ¯ Y 2 ¯ α22 · · · αn2 ¯¯ = (αk − αj )2 6= 0 . ∆(1, α, α2 , . . . , αn−1 ) = ¯ α ¯ ¯ .. .. . . .. .. ¯ 1≤j
Důkaz. Označme Nβ = N (β1 , . . . , βn ) a Nγ = N (γ1 , . . . , γn ). Protože γj =
Pn
k=1 bjk βk
a
zobrazení σi je izomorfismus, máme à n ! n X X bjk βk = bjk σi (βk ) . σi (γj ) = σi k=1
k=1
Proto Nγ = BNβ a z Věty 8.12 plyne tvrzení. Věta 8.15. Necht’ K je číselné těleso řádu n. Pak soubor β1 , . . . , βn ∈ K tvoří bázi K jako vektorového prostoru nad Q, právě když ∆(β1 , . . . , βn ) 6= 0. Důkaz. Necht’ K = Q(α) pro nějaké α ∈ A řádu n. Pak 1, α, α2 , . . . , αn−1 tvoří bázi K jako vektorového prostoru nad Q. Proto čísla β1 , . . . , βn lze vyjádřit jako lineární kombinaci čísel 1, α, α2 , . . . , αn−1 s racionálními koeficienty, tedy βj =
n X
bji αi−1 ,
kde bji ∈ Q .
(8.1)
i=1
Označíme-li matici B = (bji ), pak z Lemmatu 8.14 máme ∆(β1 , . . . , βn ) = (det B)2 ∆(1, α, α2 , . . . , αn−1 ) . Proto ∆(β1 , . . . , βn ) 6= 0 právě když det B 6= 0. To je ale přesně podmínka invertovatelnosti vztahu (8.1) a tedy podmínka pro to, aby soubor β1 , . . . , βn tvořil bázi prostoru K nad tělesem Q. Definice 8.16. Necht’ K je číselné těleso řádu n a necht’ OK je jeho okruh celých čísel. Pak soubor β1 , . . . , βn ∈ OK tvoří integrální bázi okruhu OK , jestliže má každý prvek P γ ∈ OK jednoznačné vyjádření ve tvaru γ = nj=1 bj βj , pro nějaká bj ∈ Z. Protože stopa algebraického celého čísla je v Z, je zřejmé, že diskriminant souboru β1 , . . . , βn ∈ OK bude také celočíselný. Věta 8.17. Necht’ K je číselné těleso řádu n. Pak existuje soubor β1 , . . . , βn ∈ OK , který tvoří integrální bázi okruhu OK . Důkaz. Nejprve ukážeme, že soubor β1 , . . . , βn ∈ OK s nejmenší nenulovou absolutní hodnotou diskriminantu tvoří integrální bázi okruhu OK . Necht’ β ∈ OK . Protože β1 , . . . , βn má nenulový diskriminant, je to báze tělesa K jako P prostoru nad Q. Proto existují koeficienty bi ∈ Q tak, že β = ni=1 bi βi . Stačí ukázat, že bi ∈ Z. Sporem předpokládejme, že bj ∈ Q \ Z pro nějaké j ∈ {1, 2, . . . , n}, tedy bj = b + θ, 110
kde b ∈ Z a θ ∈ (0, 1). Položme γj = β − bβj =
Pj−1 i=1
bi βi + θβj +
Pn
i=j+1 bi βi
pro ostatní i ∈ {1, 2, . . . , n}. Máme γ1 1 β1 γ2 β2 1 . . ... . . . . γ 1 j−1 βj−1 = γj b1 b2 · · · bj−1 θ bj+1 · · · bn βj 1 γj+1 βj+1 . . .. .. .. . γn 1 βn
a γi = β i
Protože determinant matice přechodu je θ, platí s využitím Lemmatu 8.14 ∆(γ1 , . . . , γn ) = θ2 ∆(β1 , . . . , βn ) . Ovšem γi = βi ∈ OK pro i ∈ {1, 2, . . . , n}, i 6= j, ale i γj = β − bβj ∈ OK . Našli jsme tedy v okruhu OK soubor čísel s menší absolutní hodnotou diskriminantu, 0 < |∆(γ1 , . . . , γn )| < |∆(β1 , . . . , βn )| , což je spor s volbou souboru β1 , . . . , βn . Nyní stačí ukázat, že v okruhu OK existuje soubor čísel γ1 , . . . , γn , který má nenulový diskriminant. Z Příkladu 8.13 víme, že v tělese K = Q(α) existuje soubor s nenulovým diskriminantem, a to např. 1, α, α2 , . . . , αn−1 . Vezměme d ∈ Z z Tvrzení 8.4 takové, že dα je algebraické celé číslo, a tedy dα ∈ OK . Položme γi = di−1 αi−1 pro i = 1, 2, . . . , n. Pak soubor γ1 , . . . , γn zjevně patří do OK . Navíc z Lemmatu 8.14 platí ∆(γ1 , . . . , γn ) = dn(n−1) ∆(1, α, . . . , αn−1 ) 6= 0. Integrální báze okruhu celých čísel tělesa není dána jednoznačně. Platí ale následující věta, která říká, že diskriminant všech integrálních bází je stejný. Věta 8.18. Necht’ K je číselné těleso řádu n a necht’ β1 , . . . , βn je integrální báze jeho okruhu celých čísel OK . Necht’ γ1 , . . . , γn ∈ OK . Pak γ1 , . . . , γn je integrální báze OK , právě když ∆(β1 , . . . , βn ) = ∆(γ1 , . . . , γn ) . Důkaz. Označme opět vektory β T = (β1 , . . . , βn ) a γ T = (γ1 , . . . , γn ). Protože β1 , . . . , βn je integrální báze okruhu OK , existuje celočíselná matice B = (bij ) tak, že γ = Bβ. Podle Lemmatu 8.14 pak platí ∆(γ1 , . . . , γn ) = (det B)2 ∆(β1 , . . . , βn ) . 111
Ovšem det B = ±1, právě když matice B má inverzní matici C = B −1 ∈ Zn×n . Platí β = Cγ a tedy soubor γ1 , . . . , γn tvoří integrální bázi okruhu OK . Definice 8.19. Necht’ K je číselné těleso řádu n a necht’ OK je jeho okruh celých čísel. Nenulové celé číslo ∆K = ∆(β1 , . . . , βn ), kde β1 , . . . , βn je nějaká integrální báze okruhu OK , nazýváme diskriminant tělesa K. √ Příklad 8.20. Vypočítejme diskriminant kvadratického tělsa K = Q( m). Musíme tedy √ určit diskriminant integrální báze okruhu OK , tedy soboru β1 = 1, β2 = m, je-li m 6≡ √ 1 mod 4, respektive β1 = 1, β2 = 12 (1 + m), pro m ≡ 1 mod 4. Necht’ nejdříve m 6≡ 1 mod 4. Máme matici à ! µ √ ¶ T (1) T ( m) √ 2 0 M (1, m) = = . √ 0 2m T ( m) T (m) Determinant této matice je hledaný diskriminant tělesa, √ √ ∆K = ∆(1, m) = det M (1, m) = 4m . Necht’ nyní m ≡ 1 mod 4. Pak ¯ ¡ √ ¢ ¯ T 1+2 m √ ¡ 1+ m ¢ ¯ T (1) ∆K = det M 1, 2 = ¯¯ ¡ √ ¢ √ ¢ ¡ ¯ T 1+ m T 1+m+2 m 2 4
¯ ¯ ¯ ¯ ¯ 2 ¯=¯ ¯ ¯ 1 ¯
1 1+m 2
¯ ¯ ¯ = m. ¯
√ Diskriminant tělesa K = Q( m) jsme v tomto případě počítali z definice. Šlo by samozřejmě použít Věty 8.12 nebo Příkladu 8.13.
8.3
Hledání integrální báze
Lemma 8.14 implikuje, že jsou-li soubory β1 , . . . , βn a γ1 , . . . , γn dvě báze tělesa K jako vektorového prostoru nad Q, a B matice přechodu těchto bází, pak se jejich diskriminanty liší faktorem (det B)2 =
p2 q2
∈ Q. Je-li navíc soubor β1 , . . . , βn integrální bází okruhu OK
a γ1 , . . . , γn jsou prvky OK , pak diskriminanty obou soubor˚ u jsou celá čísla a platí ∆(γ1 , . . . , γn ) = k 2 ∆(β1 , . . . , βn ) , kde k = det B ∈ Z. Jako jednoduchý d˚ usledek máme následující tvrzení. Tvrzení 8.21. Necht’ β1 , . . . , βn je soubor čísel z okruhu OK takový, že jeho diskriminant ∆(β1 , . . . , βn ) ∈ Z neobsahuje čtverec. Pak β1 , . . . , βn tvoří integrální bázi okruhu OK . 112
Poznamenejme, že opačná implikace neplatí, jak je vidět z příkladu 8.20, protože √ ∆K = 4m, pro K = Q( m) a m 6≡ 1 mod 4. Pro zjednodušení výpočtu diskriminantu souboru 1, α, α2 , . . . , αn−1 , kde α je generátor číselného tělesa řádu n, poslouží následující tvrzení. Tvrzení 8.22. Necht’ α je algebraické číslo řádu n s minimálním polynomem f . Pro diskriminant souboru 1, α, α2 , . . . , αn−1 platí ∆(1, α, α2 , . . . , αn−1 ) = (−1)
n(n−1) 2
Důkaz. Zderivováním minimálního polynomu f (x) = 0
f (x) =
n n X Y
¡ ¢ N f 0 (α) .
Qn
j=1 (x
− αj ) čísla α máme
(x − αj )
k=1 j=1,j6=k
a po dosazení kořene αi dostaneme f 0 (αi ) =
Qn
j=1,j6=i (αi
− αj ). M˚ užeme proto pokračovat
ve výpočtu z příkladu 8.13, ∆(1, α, α2 , . . . , αn−1 ) =
Y
(αi − αj )2 = (−1)
1≤i<j≤n
= (−1)
n(n−1) 2
Y
n(n−1) 2
(αi − αj ) =
1≤i,j≤n, i6=j n Y
f 0 (αi ) = (−1)
n(n−1) 2
¡ ¢ N f 0 (α) .
i=1
Příklad 8.23. Necht’ α je algebraické číslo s minimálním polynomem x3 +x+1. Ověříme, že soubor 1, α, α2 tvoří integrální bázi okruhu celých čísel v tělese K = Q(α). Z příkladu 8.13 a Tvrzení 8.22 víme, že Y ∆(1, α, α2 ) = (αk − αj )2 = −N (3α2 + 1) = (3α12 + 1)(3α22 + 1)(3α32 + 1) = 1≤j
= −27α12 α22 α32 − 9(α12 α22 + α12 α32 + α22 α32 ) − 3(α12 + α22 + α32 ) − 1 . Diskriminant souboru 1, α, α2 je tedy symetrický polynom v proměnných α1 , α2 , α3 , což jsou kořeny sdružené k α. Podle hlavní věty o symetrických polynomech (Věta 3.22) lze tento polynom vyjádřit jako polynom v elementárních symetrických funkcích e1 , e2 , e3 v proměnných α1 , α2 , α3 . To by ovšem bylo poměrně zdlouhavé. M˚ užeme si ale všimnout, že diskriminant už je zapsaný ve formě kombinace elementárních symetrických funkcí e˜1 , e˜2 , e˜3 v proměnných α12 , α22 , α32 , a to konkrétně jako ∆(1, α, α2 ) = −27˜ e23 − 9(˜ e22 − 2˜ e1 e˜3 ) − 3(˜ e21 − 2˜ e2 ) − 1 . 113
(8.2)
Hodnoty funkcí e˜1 , e˜2 , e˜3 ovšem nelze přímo vyčíst z minimálního polynomu čísla α. Potřebujeme polynom, který by měl za kořeny čísla α12 , α22 , α32 . Ten ovšem snadno nalezneme. Q Máme-li totiž polynom f (x) = (x−αi ) s kořeny αi , vynásobením polynomem g(x) = Q Q (x + αi ) s kořeny −αi dostaneme polynom f g(x) = (x − αi2 ) s kořeny αi2 . Přitom je z Vi`etových vztah˚ u jasné, že polynom g má oproti f jen střídavě zaměněná znaménka u koeficient˚ u. Je tedy f (x)g(x) = (x3 + x + 1)(x3 + x − 1) = x3 + 2x2 + x − 1 . Odtud zjistíme
e˜1 = α12 + α22 + α32 = −2 , e˜2 = α12 α22 + α12 α32 + α22 α32 = 1 , e˜3 = α12 α22 α32 = 1 ,
a po dosazení do (8.2) ∆(1, α, α2 ) = −31. To je celé číslo neobsahující čtverec. Podle Tvrzení 8.21 je tedy soubor 1, α, α2 integrální bází okruhu OK . Lze tedy psát OK = {a + bα + cα2 | a, b, c ∈ Z} . Naneštěstí ne každé číselné těleso má diskriminant bez čtverce (jako příklad jsme viděli √ těleso Q( m), kde m 6≡ 1 mod 4). Lze ale dokázat, že diskriminant číselného tělesa K splňuje ∆K ≡ 0 nebo 1 mod 4. Ani to nám ovšem neumožní vždy rozhodnout o tom, zda nalezený soubor už je integrální bází uvažovaného tělesa. Existuje dokonce těleso, jehož okruh celých čísel nemá žádnou integrální bázi ve tvaru 1, β, β 2 . Příkladem takového tělesa je K = Q(α), kde α je kořenem polynomu f (x) = x3 + x2 − 2x + 8. Diskriminant souboru 1, α, α2 je roven ∆(1, α, α2 ) = 2012 = 4 · 503. Tento soubor ovšem není integrální bází tělesa K, protože lze ukázat, že ∆K = 503. Čtenář se m˚ uže divit, proč jsme jako příklad neuvedli žádné těleso, jehož diskriminant by byl roven ±1. D˚ uvodem je to, že všechna tělesa generovaná algebraickým celým číslem mají diskriminant ≥ 3. Neexistuje totiž žádný monický polynom f ∈ Z[x] stupně n > 1 s kořenem α takovým, že ∆(1, α, . . . , αn−1 ) = ±1.
8.4
Integrální báze v cyklotomických tělesech
Kromě kvadratických těles, v nichž je okruh celých čísel dobře popsán, je známa integrální báze také u další třídy algebraických číselných těles, se kterou jsme se seznámili, a to u těles cyklotomických, generovaných n-tým kořenem z jedničky. Protože ζ = e 114
2πi n
je kořenem
n-tého cyklotomického polynomu Φn ∈ Z[x], který je monický, je samo ζ algebraické celé číslo. Popíšeme integrální bázi okruhu celých čísel tělesa Q(ζ) a vypočítáme jeho diskriminant. Postup ovšem provedeme pouze v nejjednodušším případě, kdy n = p je prvočíslo. Pak Φp (x) = x
p−1
+x
p−2
+ ··· + x + 1 =
p−1 Y
(x − ζ j ) ,
j=1
číslo ζ = e
2πi p
je řádu p − 1 a sdružené kořeny jsou ζ j , 1 ≤ j ≤ p − 1. Polynom Φp je
zároveň tělesovým polynomem čísla ζ v tělese Q(ζ), a proto m˚ užeme rovnou vyčíst normu a stopu čísla ζ v tomto tělese. Kromě toho využijeme i znalost normy a stopy čísla 1 − ζ. Lemma 8.24. Necht’ p je liché prvočíslo, ζ = e
2πi p
. Potom v tělese Q(ζ) platí T (ζ) = −1,
N (ζ) = 1, T (1 − ζ) = p, N (1 − ζ) = p. Důkaz. Norma a stopa čísla ζ jsou dány koeficieny polynomu Φp (x) = xp−1 + xp−2 + · · · + x + 1. Dále máme T (1 − ζ) = T (1) − T (ζ) = p ,
N (1 − ζ) =
p−1 Y
(1 − ζ j ) = Φp (1) = p .
j=1
Věta 8.25. Necht’ p je liché prvočíslo, ζ = e
2πi p
. Potom pro okruh celých čísel tělesa
K = Q(ζ) platí OK = {a1 + a2 ζ + · · · + ap−2 ζ p−2 | a1 , . . . , ap−1 ∈ Z} =: Z[1, ζ, . . . , ζ p−2 ] , a tedy soubor 1, ζ, ζ 2 ,. . . ,ζ p−2 tvoří integrální bázi okruhu OK . Důkaz. Je zřejmé, že množina {a0 + a1 ζ + · · · + ap−2 ζ p−2 | aj ∈ Z} je podmnožinou okruhu celých čísel OK . Abychom ukázali opačnou inkluzi, vezměme β ∈ OK . Protože soubor 1, ζ, ζ 2 ,. . . ,ζ p−2 tvoří bázi tělesa K, jako prostoru nad Q, musí existovat racionální P j koeficienty b0 , . . . , bp−2 tak, že β = p−2 j=0 bj ζ . Musíme ukázat, že bj ∈ Z. Protože ζ −k = ζ p−k , je číslo βζ −k − βζ ∈ OK . Stopa tohoto čísla je tedy celočíselná, T (βζ
−k
− βζ) = T
p−2 ³X
bj ζ
j−k
−
p−2 X
j=0
= T (bk ) +
´ bj ζ j+1 =
j=0 p−2 X
bj T (ζ
j−k
)−
p−2 X j=0
j=0,j6=k p−2
= (p − 1)bk +
X j=0,j6=k
115
bj T (ζ j+1 ) =
bj (−1) −
p−2 X j=0
bj (−1) = pbk ,
kde jsme využili vlastností stopy a Lemmatu 8.24. Odvodili jsme tedy, že pbk ∈ Z pro každé k ∈ {0, 1, . . . , p − 2}. Chceme ale ukázat, že i bk ∈ Z. Označme λ = 1 − ζ. Pak pβ = p
p−2 X
k
bk ζ =
k=0
p−2 X
k
pbk (1 − λ) =
p−2 X
cj λj ,
(8.3)
j=0
k=0
kde z binomické věty a záměnou sum získáme cj = (−1)
p−2 µ ¶ X k
j
k=j
j
pbk ,
pro j ∈ {0, 1, . . . , p − 2} .
Protože λ = 1 − ζ, analogickým argumentem odvodíme, že platí j
pbj = (−1)
p−2 µ ¶ X k k=j
j
ck ,
pro j ∈ {0, 1, . . . , p − 2} .
(8.4)
Výše jsme odvodili, že pbk ∈ Z, a proto jsou koeficienty cj celá čísla. Díky vztahu (8.4) tedy stačí ukázat, že všechny koeficienty c0 , . . . , cp−2 jsou dělitelné p. To provedeme matematickou indukcí. Pro c0 máme c0 =
p−2 X
¡ ¢ ¡ ¢ pbk = p pb0 − (p − 1)b0 + b1 + · · · + bp−2 = p pb0 − T (β) ,
k=0
a protože pb0 i T (β) ∈ Z, vidíme, že p dělí c0 . Předpokládejme, že p|cj pro j ≤ k − 1. Ze vztahu (8.3) plyne k
ck λ = pβ −
k−1 X
p−2 X
j
cj λ −
j=0
cj λj .
(8.5)
j=k+1
Všimněme si, že p = Φp (1) =
p−1 Y j=1
j
p−1
(1 − ζ ) = (1 − ζ)
p−1 Y
(1 + ζ + · · · + ζ j−1 ) = λp−1 κ ∈ λp−1 OK
j=1
Protože však p = λp−1 κ dělí c0 , . . . , ck−1 , máme z (8.5) ck λk = λk+1 κ0 , pro nějaké κ0 ∈ OK . Proto ck = λκ0 a znormováním tohoto vztahu dostaneme cp−1 = N (ck ) = N (λ)N (κ0 ) = pN (κ0 ) . k Protože κ0 ∈ OK , je N (κ0 ) ∈ Z, z čehož plyne p|cp−1 k . Protože p je prvočíslo, máme p|ck a d˚ ukaz je hotov. D˚ usledek 8.26. Necht’ p je liché prvočíslo, ζ = e ∆K = (−1)
p−1 2
pp−2 .
116
2πi p
. Diskriminant tělesa K = Q(ζ) je
Důkaz. Diskriminant tělesa je z definice diskriminant nějaké jeho integrální báze. Díky Tvrzení 8.22 je tedy 2
∆K = ∆(1, ζ, ζ , . . . , ζ
p−2
) = (−1)
(p−1)(p−2) 2
p−1 Y
¡ ¢ N Φ0p (ζ) .
i=1
Protože
µ Φ0p (x)
=
xp − 1 x−1
¶0 =
pxp−1 (x − 1) − (xp − 1) , (x − 1)2
máme Φ0p (ζ) = pζ p−1 /(ζ − 1), kde jsme použili ζ p = 1. Znormováním dostaneme pomocí Lemmatu 8.24
¢ N (p)N p−1 (ζ) ¡ N Φ0p (ζ) = = pp−2 . N (ζ − 1)
Protože p je liché, platí (−1)
(p−1)(p−2) 2
= (−1)
p−1 2
a d˚ ukaz je hotov.
Studovali jsme okruh celých čísel v cyklotomickém tělese Q(ζ), kde ζ = e2πi/p pro p liché prvočíslo. Obdobná tvrzení platí pro cyklotomické těleso generované m-tým kořenem z jedničky pro libovolné m ∈ Z, m > 2. Vyslovíme následující větu bez d˚ ukazu. Věta 8.27. Necht’ m ∈ Z, m > 2, a necht’ ζ = e2πi/m . Potom soubor 1, ζ, ζ 2 , . . . , ζ ϕ(m)−1 je integrální bází okruhu celých čísel OK v tělese K = Q(ζ) a diskriminant tohoto tělesa je roven ∆K = (−1)
ω(m)ϕ(m) 2
Q
mϕ(m) , ϕ(m)/(q−1) q|m q
kde ω(m) je počet r˚ uzných prvočíselných faktor˚ u čísla m.
117
9 Dělitelnost a faktorizace v okruhu celých čísel V této kapitole se budeme zabývat zobecňováním pojm˚ u dělitelnosti, faktorizace, prvočísel z oboru Z na obory celých čísel v číselných tělesech. Množství algebraických pojm˚ u a tvrzení jsme připomněli již v Kapitole 2.2. Některá tvrzení se ovšem v případě číselných obor˚ u dají vylepšit, a použitím normy. Budeme se také podrobněji zabývat dělitelností v okruzích celých čísel kvadratických těles, které jsme popsali v Tvrzení 8.9. Jednoznačnou faktorizaci v kvadratických tělesech
9.1
Jednotky
Pokud máme studovat dělitelnost v okruzích celých čísel číselných těles, musíme nejdřív vyjasnit pojem jednotka. K popisu grupy jednotek U (OK ) nám velmi pom˚ uže norma v tělese K. Věta 9.1. Necht’ K je číselné těleso. Prvek β ∈ OK je jednotka, právě když N (β) = ±1. Důkaz. Nechť β ∈ U (OK ). To znamená, že β i 1/β patří do OK , a proto N (β), N (1/β) ∈ Z. Pak ale máme N (β)N (1/β) = N (1) = 1, tudíž nutně N (β) = N (1/β) = ±1 . Naopak předpokládejme, že β ∈ OK splňuje N (β) = ±1. Potom ±1 = N (β) =
n Y
σj (β) = β
j=1
n Y
σj (β) ,
(9.1)
j=2
kde n je řád tělesa K a σj jsou jeho Q-isomorfismy. Z rovnosti (9.1) je vidět, že 1/β = Q ± nj=2 σj (β) ∈ K. Zároveň ale 1/β je algebraické celé číslo, protože β ∈ B a čísla σj (β) mají stejný minimální polynom (viz Tvrzení 4.32). Proto 1/β ∈ K ∩ B = OK a tedy β ∈ U (OK ). Jako nejjednodušší příklad m˚ užeme uvést těleso K = Q, s okruhem celých čísel OK = Z. To je obor integrity, ve kterém množinu jednotek tvoří U (OK ) = {±1}. To odpovídá 118
faktu, že norma na tělese Q splývá s absolutní hodnotou a |m| = 1 pro m ∈ Z, právě když m = ±1. Existují ale i tělesa K, jejichž okruhy OK mají nekonečnou grupu jednotek. √ √ Příklad 9.2. V tělese K = Q( 2) tvoří okruh celých čísel prvky tvaru β = a+b 2, a, b ∈ √ Z. Snadno ověříme, že kromě ±1 splňuje podmínku N (β) = −1 také číslo β = 1 + 2. Protože β > 1 a množina jednotek je uzavřená na násobení, platí {β n | n ∈ N} ⊂ U (OK ), a jednotek je tedy nekonečné mnoho. Později uvidíme, že dokonce U (OK ) = {±β n | n ∈ Z}. √ To, že všechny jednotky v okruhu tělesa Q( 2) lze zapsat až na znaménko jako mocninu jednoho generátoru, není náhoda, jak plyne z následující obecné věty, jejíž d˚ ukaz však daleko přesahuje možnosti tohoto textu. Věta 9.3 (Dirichletova věta o jednotkách). Nechť K je algebraické číselné těleso a nechť α je jeho primitivní prvek, tj. K = Q(α). Nechť minimální polynom čísla α má r1 reálných a 2r2 komplexních kořen˚ u. Pak grupa jednotek v okruhu OK je tvaru ¯ © ª U (OK ) = ξ j η1j1 · · · ηrjr ¯ j ∈ Z j1 , . . . , jr ∈ Z , kde r = r1 + r2 − 1, čísla η1 , . . . , ηr > 0 jsou tzv. fundamentální jednotky a ξ je k-tý kořen z jedničky pro maximální k takové, že e
2πi k
∈ K.
Je zřejmé, že pro imaginární kvadratická tělesa r1 = 0, r2 = 1 a proto r = r1 + r2 − 1 = 0, tudíž nemají žádnou fundamentální jednotku. Pro reálná kvadratická tělesa je r1 = 2, r2 = 0, tj. r = r1 +r2 −1 = 1. Explicitně popíšeme grupu jednotek v okruzích kvadratických těles v sekci 9.2.
9.2
Jednotky v kvadratických tělesech
Jednotky v imaginárních kvadratických tělesech lze popsat snadno. Věta 9.4. Nechť m ∈ Z, m < 0, neobsahuje čtverec. {±1, ±i} © 4πi ª 2πi U (OK ) = ±1, ±e 3 , ±e 3 {±1}
√ Je-li K = Q( m), pak pro m = −1 , pro m = −3 , jinak .
Důkaz. Tvar množiny jednotek snadno odvodíme pomocí Věty 9.1. Rozlišíme případy m 6≡ 1 mod 4 a m ≡ 1 mod 4. Pro m 6≡ 1 mod 4 je obecný prvek okruhu OK tvaru √ √ a + b m. Rovnost N (a + b m) = a2 + |m|b2 = ±1 má jediná řešení (a, b) = (±1, 0) 119
kromě m = −1, kdy lze navíc volit (a, b) = (0, ±1). Je zřejmé že tato řešení odpovídají √ jednotkám ±1 a pro m = −1 navíc ± −1 = ±i. √ Jestliže m ≡ 1 mod 4, je obecný prvek okruhu OK tvaru 12 (c + d m), kde c, d jsou celá čísla se stejnou paritou. Řešíme tedy rovnost √ ¡ c + d m ¢ c2 + |m|d2 N = = ±1 ⇐⇒ 2 4
c2 + |m|d2 = ±4 .
Jediná možná řešení jsou nyní (c, d) = (±2, 0), kromě případu m = −3 ≡ 1 mod 4, kdy lze navíc (c, d) = (±1, ±1). Ťemto řešením odpovídají opět jednotky ±1 a pro m = −3 navíc ±
1+
√
−3
2
= ±e
2πi 3
√ 4πi −1 + −3 ± = ±e 3 , 2
a
což jsme měli dokázat. Popsat grupu jednotek v reálných kvadratických tělesech je mnohem obtížnější. Existence alespoň jedné jednotky ξ > 1 vyplývá z existence řešení základní Pellovy rovnice. Věta 9.5. Nechť K je reálné kvadratické těleso. Pak existuje η ∈ OK , η > 1, takové, že U (OK ) = {±η j | j ∈ Z} . Důkaz. Existuje alespoň jedna jednotka ξ > 1 z Pellovy rovnice nebo Minkowskeho teoremu. Ukažme, že existuje pouze konečně mnoho jednotek ε ∈ OK takových, že 1 < ε ≤ ξ. √ Ať už je m jakékoliv, je obecná jednotka ε v OK tvaru 21 (c + d m) pro nějaké c, d ∈ Z. Máme pak
√ 1 ε = (c + d m) ∈ OK 2
√ 1 1/ε = ± (c − d m) ∈ OK . 2
a
Odtud plyne c = ε+1/ε, a protože 1 < ε ≤ ξ, platí 1/ε ∈ (0, 1) a odtud dále 0 < c < ξ +1. Proto je pouze konečný počet možností volby celého čísla c. To ale určuje d jednoznačně až na znaménka. Celkově je tedy konečně mnoho možností pro ε. Nechť nyní η je nejmenší jednotka splňující 1 < η ≤ ξ. Protože takových jednotek je konečný počet, η existuje. Chceme ukázat, že všechny ostatní jednotky jsou už tvaru ±η j pro j ∈ Z. Nechť δ je libovolná jednotka. Protože −δ je také jednotka, lze bez újmy na obecnosti předpokládat, že δ > 0. Platí (0, +∞) =
[
[η j , η j+1 ) ,
j∈Z
a proto jistě existuje j ∈ Z takové, že η j ≤ δ < η j+1 . 120
Odtud 1 ≤ δη −j < η. Přitom ale číslo δη −j je jednotka. To vyplývá z faktu, že množina jednotek je multiplikativní grupa. Protože ale η je minimální jednotka větší než jedna, musí platit δη −j = 1. Proto jsou všechny jednotky tvaru ±η j . Definice 9.6. Číslo η z Věty 9.5 se nazývá fundamentální jednotka. √ Poznámka 9.7. Pokud hledáme jednotky v tělese Q( m), pro m ≡ 1 mod 4, nemusí odpovídat fundamentální jednotka řešení základní Pellovy rovnice, protože η je obecně √ √ tvaru η = a+b2 m . Ale i kdyby a, b bylo liché, je η 3 už element Z[1, m], tj. odpovídá celočíselnému řešení Pellovy rovnice s pravou stranou ±1 a číslo η 6 dokonce řešení základní Pellovy rovnice. Platí totiž µ √ ¶3 √ √ ¢ a+b m 1¡ = a3 + 3a2 b m + 3ab2 m + b3 m m = 2 8 a(a2 + 3mb2 ) b(3a2 + b2 m) √ = + m= 8 8 a(a2 − mb2 + 4mb2 ) b(−a2 + b2 m + 4a2 ) √ = + m= 8 8 a(±1 + mb2 ) b(∓1 + a2 ) √ = + m, 2 2 √
2
2
kde jsme využili fakt, že N ( a+b2 m ) = a −mb = ±1, tj. a2 − mb2 = ±4. Nyní je ovšem 4 ¡ √ ¢3 √ zřejmé, že a+b2 m = c + d m, protože a, b i m jsou lichá čísla. √ Příklad 9.8. Najděme fundamentální jednotku v tělese Q( 29). Protože 29 ≡ 1 mod 4, √ hledáme tedy číslo η = 12 (a+b 29), a, b ∈ Z takové, že N (η) = 41 (a2 −29b2 ) = ±1. Řešíme tedy zobecněnou Pellovu rovnici x2 −29y 2 = ±4. Z toho, co jsme odvodili v Příkladu 6.30, víme, že minimální takové pozitivní řešení je (x, y) = (5, 1), což odpovídá fundamentální √ jednotce η = 21 (5 + 29). √ √ √ Výpočtem snadno zjistíme, že η 3 = 70 + 13 29 ∈ Z + 29Z a η 6 = 9801 + 1820 29, což odpovídá minimálním řešením Pellovy rovnice x2 − 29y 2 = −1 a x2 − 29y 2 = 1.
9.3
Prvočísla, ireducibilní prvky, faktorizace
Následující lemma obsahuje velmi jednoduché tvrzení, které ovšem budeme hustě používat, protože nám bude usnadňovat práci při počítání v OK . Lemma 9.9. Necht’ β, γ ∈ OK . Jestliže β|γ v OK , pak N (β)|N (γ) v Z. Důkaz. Nechť γ = βδ pro nějaké δ ∈ OK . Pak také N (γ) = N (βδ) = N (β)N (δ). Protože všechny vystupující normy jsou celočíselné, platí N (β)|N (γ) v Z. 121
Poznámka 9.10. Opačná implikace neplatí. Jako příklad m˚ užeme vzít čísla β = 1 + 2i √ a γ = 1 − 2i v okruhu OK pro K = Q( −1). Máme N (β) = N (γ) = (1 + 2i)(1 − 2i) = 1 + 22 = 5, proto N (β)|N (γ) v Z. Pokud by ale mělo β dělit γ v OK , musely by být prvky β a γ asociované, tj. γ = βξ pro nějaké ξ ∈ U (OK ) = {±1, ±i}. Snadno ověříme, že toto není možné. D˚ usledek 9.11. Necht’ pro β ∈ OK platí, že N (β) je prvočíslo v Z. Potom β je ireducibilní v OK . Poznámka 9.12. Opačná implikace neplatí. Příkladem je třeba číslo 3 ∈ Z[1, i], které je ireducibilní v Z[1, i], ale jeho norma přitom není prvočíselná, N (3) = 9. Ireducibilitu čísla β = 3 v Z[1, i] m˚ užeme ověřit například takto: Kdyby bylo β reducibilní pak existují δ, γ ∈ Z[1, i] \ {±1, ±i} takové, že 3 = γδ. Porovnáme-li normu čísel na obou stranách, dostaneme 9 = N (3) = N (γ)N (δ). Protože γ, δ nemají být jednotky, muselo by N (γ) = N (δ) = ±3. To ale není možné, protože norma čísla v Z[1, i] je tvaru a2 + b2 , a, b ∈ Z. Věta 9.13. Necht’ β ∈ OK je prvočíslo v OK , pak existuje právě jedno prvočíslo p v Z, takové, že β dělí p v OK . Důkaz. Je zřejmé, že β dělí alespoň jedno racionální celé číslo, přotože je-li K číselné Q Q těleso řádu n, máme N (β) = β ni=2 σi (β), a přitom ni=2 σi (β) ∈ OK . Necht’ p je nejmenší přirozené číslo takové, že β|p v OK . Ukážeme, že p je prvočíslo v Z. Zřejmě p 6= 1. Jinak by totiž β|1, tj. β ∈ U (OK ), což je spor s předpokladem, že β je prvočíslo v OK . Kdyby p bylo číslo složené, tedy β|p = p1 p2 , pak by z prvočíselnosti β plynulo β|p1 nebo β|p2 v OK . To by ovšem byl spor s volbou čísla p. Proto p je prvočíslo v Z. Necht’ β dělí dvě r˚ uzná racionální prvočísla p, q. Protože p ⊥ q, musí existovat x, y ∈ Z tak, že px + qy = 1. Pak by ale β|1, což vede ke sporu. Věta 9.14. Nechť K je číselné těleso a nechť β ∈ OK \ U (OK ), β 6= 0. Potom existují ireducibilní prvky γ1 , . . . , γr ∈ OK tak, že β = γ1 · · · γr . ¯ ¯ Důkaz. Použijeme indukci na ¯N (β)¯, což je pro β ∈ OK nezáporné celé číslo. Protože ¯ ¯ β ∈ / U (OK ), β 6= 0, je ¯N (β)¯ ≥ 2. Pokud β je samo ireducibilní, položíme r = 1 a γ1 = β. Jesliže je β reducibilní, pak existují nenulová čísla β1 , β2 ∈ OK \ U (OK ) taková, ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯¯ ¯ že β = β1 β2 . Pak ale ¯N (β1 )¯, ¯N (β2 )¯ > 1 a protože ¯N (β)¯ = ¯N (β1 )¯¯N (β2 )¯, musí být 122
¯ ¯ ¯ ¯ ¯ ¯ ¯N (β1 )¯, ¯N (β2 )¯ < ¯N (β)¯. Z indukčního předpokladu existují faktorizace čísel β1 , β2 na ireducibilní prvky. Jejich kombinací dostaneme faktorizaci čísla β. Podle předchozí věty lze v okruhu celých čísel každého číselného tělesa nalézt faktorizaci libovolného prvku na konečný součin ireducibilních prvk˚ u. Na příkladě ovšem ukážeme, že ne vždy je faktorizace na ireducibilní prvky jednoznačná, takový okruh celých čísel pak není Gauss˚ uv obor. Příklad 9.15. Příkladem tělesa, jehož okruh celých čísel není Gauss˚ uv obor, je K = √ Q( −5). Platí √ √ (1 + 2 −5)(1 − 2 −5) = 21 = 3 · 7 . (9.2) √ √ čísla 1 + 2 −5, 1 − 2 −5, 3, 7 jsou ireducibilní v OK . Jejich normy jsou totiž po řadě rovny 21, 21, 9 a 49. Měla by-li existovat faktorizace některého z nich, označme ho γ, na součin γ = βδ, β, δ ∈ OK \ U (OK ), musely by normy N (β), N (δ) patřit do množiny √ √ {±3, ±7}. To ale v tělese Q( −5) není možné, protože N (a + b −5) = a2 + 5b2 . To, že faktorizace dané rovností (9.2) jsou neekvivalentní souvisí opět s normami, protože asociované prvky mají stejné normy. √ Všimněme si, že číslo γ = 1 + 2 −5 dělí v okruhu OK součin 3 · 7, ale nedělí žádný z činitel˚ u. Prvek γ je tedy sice ireducibilní v OK , ale není tam prvočíslem. √ √ Jiným příkladem nejednoznačnosti je faktorizace −6 · (− −6) = 6 = 2 · 3 v okruhu √ celých čísel tělesa Q( −6). Argumenty dokazující nejednoznačnost faktorizace jsou zde √ obdobné jako u tělesa Q( −5). Jak jsme viděli v příkladu, nejednoznačnost faktorizace na ireducibilní prvky souvisí s tím, že obecně ne všechny ireducibilní prvky jsou prvočísla. Tato souvislost není náhodná, jak je zřejmé z následující věty. Věta 9.16. Okruh OK je okruh s jednoznačnou faktorizací, právě když každý ireducibilní prvek v OK je prvočíslo v OK . Důkaz. Necht’ OK je okruh s jednoznačnou faktorizací a necht’ β ∈ OK je libovolný ireducibilní prvek. Jestliže existují γ, δ ∈ OK tak, že β|γδ, lze psát αβ = γδ pro nějaké α ∈ OK . Po rozkladu obou stran této rovnosti na součin ireducibilních prvk˚ u máme α1 · · · αr β = γ1 · · · γs δ1 · · · δt
123
pro nějaké r, s, t ∈ N. Protože OK je okruh s jednoznačnou faktorizací, musí β být asociované s jedním z ireducibilních prvk˚ u na pravé straně rovnosti, např. γi . Pak ale β|γ v OK , tzn. β je prvočíslo v OK . Pro opačnou implikaci uvažujme libovolné nenulové β ∈ OK \ U (OK ). Použijeme indukci na |N (β)| ∈ N. Je-li číslo β samo ireducibilní v OK , je tvrzení zřejmé. Necht’ tomu tak není a necht’ γ1 · · · γs = δ1 · · · δt jsou dva rozklady čísla β na součin ireducibilních prvk˚ u. Pak γ1 dělí δ1 · · · δt a protože γ1 je z předpokladu prvočíslo v OK , musí dělit jedno z čísel δ1 , . . . , δt , bez újmy na obecnosti δ1 . M˚ užeme tedy psát δ1 = ξγ1 pro nějaké ξ ∈ OK . Ovšem δ1 je ireducibilní, tedy ξ nebo γ1 musí být jednotka. Ale γ1 je ireducibilní prvek, proto ξ ∈ U (OK ). Máme tedy β/γ1 = γ2 · · · γs = (ξδ2 )δ3 · · · δt , což jsou dva rozklady čísla β/γ1 ∈ OK na součin ireducibilních prvk˚ u. Přitom |N (β/γ1 )| = |N (β)|/|N (γ1 )| < |N (β)|, kde poslední nerovnost plyne z faktu, že γ1 ∈ / U (OK ). Lze tedy použít indukční předpoklad a tvrdit, že γ2 · · · γs = (ξδ2 )δ3 · · · δt jsou ekvivalentní rozklady na ireducibilní prvky. Potom ale i γ1 · · · γs = δ1 · · · δt jsou ekvivalentní rozklady a d˚ ukaz je hotov. Ověřovat platnost jednoznačné faktorizace, či ekvivalentní podmínky o splývání ireducibilních prvk˚ u a prvočísel není přímočaré. Věta 2.16 je proto užitečnou postačující podmínkou: jednoznačnou faktorizaci v OK zaručuje jeho eukleidovskost. Následující tvrzení dává kritérium eukleidovskosti číselného okruhu, kde roli funkce φ v Definici 2.15 hraje norma. Poznamenejme, že Věta 9.17 nic neříká o tom, zda okruh OK nem˚ uže být eukleidovský s jinou funkcí φ. Věta 9.17. Okruh celých čísel v číselném tělese K je eukleidovský s funkcí φ = |N |, právě když pro každé µ ∈ K existuje δ ∈ OK splňující ¯ ¯ ¯N (µ − δ)¯ < 1 . Důkaz. Nejprve je třeba si uvědomit, že první podmínka z Definice 2.15 pro funkci ϕ = |N | je automaticky splňena ve všech okruzích celých čísel číselných těles, což je přímý d˚ usledek Lemma 9.9. Předpokládejme nyní, že OK je eukleidovský s funkcí φ = |N |. Nechť µ ∈ K. Pak µ = β/γ pro nějaké prvky β, γ ∈ OK , γ 6= 0. Z vlastnosti eukleidovského okruhu existují 124
¯ ¯ ¯ ¯ ¯ ¯ δ, ε ∈ OK tak, že ¯N (ε)¯ = ¯N (β − δγ)¯ < ¯N (γ)¯. Proto ¯ ¯ ¯ ¯ ¯ ¯ ¯ N (β − δγ) ¯ ¯N (µ − δ)¯ = ¯N (β/γ − δ)¯ = ¯ ¯ ¯ N (γ) ¯ < 1 . Pro opačnou implikaci předpokládejme, že pro každé µ ∈ K existuje δ ∈ OK tak, že ¯ ¯ ¯N (µ − δ)¯ < 1. Nechť β, γ jsou libovolné prvky z OK takové, že γ 6= 0. Položme µ = β/γ. ¯ ¯ Pak z předpokladu existuje δ ∈ OK splňující ¯N (µ − δ)¯ < 1. Položme ε = β − δγ. Potom ¯ ¯ ¯ ¯ ¯ ¯¯ ¯ ¯ ¯ ¯N (ε)¯ = ¯N (β − δγ)¯ = ¯N (γ)¯¯N (µ − δ)¯ < ¯N (γ)¯ , a proto okruh OK splňuje Definici 2.15 s funkcí φ = |N |. √ Příklad 9.18. Jak jsme viděli v Příkladu 9.15, okruh celých čísel tělesa K = Q( −6) není Gauss˚ uv obor. Proto nem˚ uže být ani Eukleidovým oborem. Podle předchozí Věty 9.17 ¯ ¯ tedy musí existovat µ ∈ K tak, že pro každé δ ∈ OK platí ¯N (µ − δ)¯ < 1. Ukážeme, že √ √ za toto µ lze volit µ = 21 (1 + −6). Libovolný prvek δ ∈ OK je tvaru δ = a + b −6, a, b ∈ Z. Pak máme ¯ ¯ ¯N (µ − δ)¯ = (1/2 − a)2 + 6(1/2 − b)2 ≥ 1 + 6 > 1 , 4 4 kde jsme použili faktu, že |c − 1/2| ≥ 1/2 pro každé celé číslo c. O problému faktorizace v okruzích celých čísel číselných těles by se dalo říct ještě mnoho dalších fakt˚ u. Jejich hloubka však přesahuje možnosti tohoto textu. Zmiňme pouze, že u číselných okruh˚ u splývají pojmy okruh hlavních ideál˚ u a Gauss˚ uv obor, ačkoliv v obecném případě mezi nimi platí pouze vztah daný Větou 2.14.
9.4
Faktorizace v kvadratických tělesech
Zaměřme se nyní podrobněji na zkoumání jednoznačnosti faktorizace v okruzích celých čísel kvadratických těles. Tato otázka je v popředí zájmu matematik˚ u už více než 200 let a dodnes není kompletně vyřešena. Algebraická teorie čísel však byla snahami o její zdolání obohacena o mnoho zajímavých výsledk˚ u. Zde si předvedeme jen zlomek toho, co je známo. √ Věta 9.19. Okruh celých čísel OK v imaginárním kvadratickém tělese K = Q( m) pro m = −1, −2, −3, −7, −11 je eukleidovský.
125
Důkaz. Ukážeme, že za funkci ϕ z definice eukeidovského okruhu stačí vzít ϕ = |N | a k √ tomu použijeme Větu 9.17. Nechť µ ∈ K, tj. µ = a + b m, a, b ∈ Q. K němu musíme ¯ ¯ najít δ ∈ OK tak, aby ¯N (µ − δ)¯ < 1. Rozlišíme dva případy, podle m mod 4. √ Nechť m 6≡ 1 mod 4, tj. m = −1, −2. Hledáme δ tvaru δ = c+d m, c, d ∈ Z. Zvolímeli c jako nejbližší celé číslo k racionálnímu číslu a a podobně d jako nejbližší celé číslo k b, platí |a − c| ≤
1 2
a |b − d| ≤
1 2
a odtud už plyne
¯ ¯ ¯ √ √ ¯ ¯N (µ − δ)¯ = ¯N (a + b m − c − d m)¯ = (a − c)2 − m(b − d)2 ≤ 1 + |m| ≤ 3 < 1 . 4 4 4 √
Pro m ≡ 1 mod 4, tj. m = −3, −7, −11, hledáme δ tvaru δ = c + d 1+2 m , c, d ∈ Z. Protože nyníje √ ¯ ³ ´2 ³ ´2 ¯ ¯ ¯ ¡ ¢ √ ¯N (µ − δ)¯ = ¯¯N a + b m − c − d 1 + m ¯¯ = a − c − d − m b − d , 2 2 2 provedeme volbu c, d ∈ Z jemněji. Vezmeme
d 2
jako nejbližší polocelé číslo k číslu b a
následně c jako nejbližší celé číslo k číslu a − d2 . Potom platí |b − d2 | ≤ a odtud
1 4
a |a − c − d2 | ≤
1 2
¯ ¯ ¯N (µ − δ)¯ ≤ 1 + |m| ≤ 15 < 1 . 4 16 16
√ Věta 9.20. Okruh celých čísel OK v reálném kvadratickém tělese K = Q( m) pro m = 2, 3, 5, 13 je eukleidovský. Důkaz. Postup je analogický d˚ ukazu Věty 9.19. Opět podle Věty 9.17 k danému µ = ¯ ¯ √ a + b m ∈ K, a, b ∈ Q hledáme δ ∈ OK tak, aby ¯N (µ − δ)¯ < 1. √ Pro m = 2, 3 je libovolné δ ∈ OK tvaru δ = c + d m, a proto N (µ − δ) = (a − c)2 − m(b − d)2 . Je-li c nejbližší celé číslo k a a podobně d nejbližší celé číslo k b, pak 1 3 − ≤ −m(b − d)2 ≤ N (µ − δ) ≤ (a − c)2 ≤ , 4 4 ¯ ¯ 3 což implikuje ¯N (µ − δ)¯ ≤ 4 < 1. √ Je-li m = 5, 13, hledáme δ tvaru δ = c + d m, c, d ∈ Z. Opět volíme
d 2
jako nejbližší
polocelé číslo k číslu b a následně c jako nejbližší celé číslo k číslu a − d2 . Potom √ ³ ¡ √ 1 + m¢ ³ d ´2 d ´2 N (µ − δ) = N a + b m − c − d = a−c− −m b− , 2 2 2 126
a tu lze odhadnout ³ ³ 13 d ´2 d ´2 1 − ≤ −m b − ≤ N (µ − δ) ≤ a − c − ≤ , 16 2 2 4 ¯ ¯ 13 což implikuje ¯N (µ − δ)¯ ≤ 16 < 1. Poznamenejme, že z nerovností v d˚ ukazech Vět 9.19 a 9.20 je zřejmé, že postup nelze zobecnit na další m ∈ Z. To ale neznamená, že okruhy celých čísel v ostatních kvadratických tělesech nemohou být eukleidovské. Otázkou eukeidovosti a jednoznačné faktorizace se zabýval už Gauss. Ve svých 19 letech publikoval práci Disquisitiones Arithmeticae, ve kterých rozvinul velmi zajímavé a komplikované koncepty, na kterých staví moderní algebraická teorie čísel, a vyslovil hypotézy, z nichž některé z˚ ustávají dodnes nedokázány. Následující poznámka shrnuje, co je známo o faktorizaci v kvadratických tělesech. Poznámka 9.21. • Dodnes není známý úplný popis těch m ∈ Z, pro které je okruh OQ(√m) eukleidovský. Jsou známé pouze částečné výsledky. • Je-li m < 0, pak okruh celých čísel OQ(√m) je eukleidovský obor, právě když m = −1, −2, −3, −7, −11. • Je-li m > 0, pak okruh OQ(√m) je eukleidovský s funkcí φ = |N |, právě když m = 2, 3, 5, 6, 7, 11, 13, 17, 19, 21, 29, 33, 37, 41, 55, 73. √ • Okruh OK v tělese K = Q( 69) je eukleidovský s jinou funkcí φ. Není známo, zda existují ješte další m s touto vlastností. √ • Okruh OK v tělese K = Q( −19) má jednoznačnou faktorizaci, ale není euklei√ dovský. Podobně okruh OK v tělese K = Q( 14) má jednoznačnou faktorizaci, není eukleidovský s funkcí φ = |N |, ale není známo, zda není eukleidovský s jinou funkcí. • Je-li m < 0, pak okruh OQ(√m) má jednoznačnou faktorizaci, právě když m = −1, −2, −3, −7, −11, −19, −43, −67, −163. Jednoznačnou faktorizaci u těchto těles prokázal už Gauss a vyslovil hypotézu, že jsou jediná s touto vlastností. Jeho hypotézu později dokázalo nezávisle několik matematik˚ u.
127
• Není známo, zda existuje nekonečně mnoho m > 0 takových, že okruh OQ(√m) má jednoznačnou faktorizaci. Hypotézu, že tomu tak je, vyslovil opět už Gauss, dodnes tato otázka ovšem nebyla vyřešena. Poznamenejme, že není ani známo, zda v˚ ubec existuje nekonečně mnoho číselných těles (libovolného řádu), jejichž okruhy mají jednoznačnou faktorizaci. D˚ ukazy Vět 9.19 a 9.20 nám dávají návod, jak získat podíl a zbytek při dělení dvou √ čísel z OK v daném tělese K = Q( m), jehož obor celých čísel je eukleidovský s funkcí φ = |N |. Postup ilustrujeme na případě K = Q(i). Okruh celých čísel je v tomto případě roven OK = {a + bi | a, b ∈ Z} a jeho prvk˚ um se někdy říká Gaussova celá čísla. Příklad 9.22. V Gaussových celých číslech vydělme se zbytkem číslo β = 7 + 5i číslem γ = 3 + i. Máme β 7 + 5i (7 + 5i)(3 − i) 1 = = = (13 + 4i) . γ 3+i 10 5 Číslo δ = c + di ∈ Z[i] splňující |N (β/γ − δ)| < 1, najdeme tak, že vezmeme celá čísla c, d nejbližší k a =
13 , 5
b = 45 , a tedy c = 3, d = 1. Pak δ = 3 + i. ‘Zbytek’ ε při dělení získáme
snadno, jako ε = β − γδ = 7 + 5i − (3 + i)(3 + i) = 7 + 5i − (8 + 6i) = −1 − i . Snadno ověříme, že N (ε) = 2 < N (γ) = 4 . Pro úplné popsání aritmetiky v oboru Gaussových celých čísel ještě potřebujeme popsat ireducibilní prvky, které jsou v tomto případě shodné s prvočísly. Věta 9.23. Prvočísla v okruhu Gaussových celých čísel jsou právě ta čísla β ∈ OQ(i) , která jsou asociovaná s právě jedním z následujících prvk˚ u. • 1+i • p, kde p je racionální prvočíslo p ≡ 3 mod 4. • a + bi, kde a > 0 je sudé, a a2 + b2 = p, kde p je racionální prvočíslo p ≡ 1 mod 4. Důkaz. Nechť β je prvočíslo v Z[i]. Podle Věty 9.13 existuje právě jedno racionální prvočíslo p takové, že β dělí p v Z[i]. Diskusi rozdělíme na případy podle typu p. Nechť p = 2. Jestliže β = a + bi dělí 2 v Z[i], pak N (β) = a2 + b2 dělí 4 v Z. Pro pár © ª (a, b) ∈ Z2 máme tedy možnosti (a, b) ∈ (±1, ±1), (±2, 0), (0, ±2) . Ovšem čísla daná 128
páry (±2, 0), (0, ±2) nejsou ireducibilní, protože 2 = (1 + i)(1 − i). Zbývá pár (±1, ±1), tj. čísla ±1±i, která jsou ovšem asociovaná, protože 1+i = −(−1−i) = i(1−i) = −i(−1+i). Stačí tedy vybrat jeden z nich, např. 1 + i. To je prvek ireducibilní v Z[i], protože jeho norma N (1 + i) = 2 je racionální prvočíslo. Nechť nyní p ≡ 3 mod 4. Potom β|p implikuje N (β) = a2 + b2 = p nebo a2 + b2 = p2 . První z možností je nepřípustná kv˚ uli Větě 5.11. Proto a2 + b2 = p2 . Protože ale Z[i] je obor jednoznačné faktorizace, musí být p ˇrvek a + bi asociovaný s p. Nechť na závěr p ≡ 1 mod 4. V tomto případě opět β|p implikuje N (β) = a2 + b2 = p nebo a2 + b2 = p2 . Tentokrát ovšem p lze (podle Věty 5.10) rozložit na součet dvou čtverc˚ u, a proto p není ireducibilní v Z[i]. Možnost a2 + b2 = p2 tedy odpadá, protože pak by β = a + bi byl prvek asociovaný s p, a tudíž by nebyl ireducibilní. Proto tedy p = a2 + b2 , kde právě jedno z a, b je sudé. Lze proto volit a > 0 sudé, ostatní řešení {±a ± bi, ±ai ± b} jsou asociované. Na závěr této kapitoly uvedeme ještě jeden příklad, a to okruh celých čísel v tělese √ K = Q( −3), jehož prvky se někdy nazývají Eisensteinova celá čísla. Příklad ilustruje, že nevhodnou volbou číselného oboru m˚ užeme ztratit cennou vlastnost jednoznačné faktorizace. © ª √ √ Příklad 9.24. Nechť K = Q( −3). Okruh OK = 21 (a + b −3) | a, b ∈ Z je podle Věty 9.19 eukleidovský a proto v něm platí jednoznačná faktorizace. Uvažujme nyní jeho √ nevlastní podokruh, R = Z + −3 Z. S překvapením zjišťujeme, že v tomto okruhu už jednoznačná faktorizace není! Máme totiž (1 + Prvky 1 ±
√
−3)(1 −
√
−3) = 4 = 2 · 2 .
(9.3)
√
−3, 2 jsou ireducibilní v R, protože mají normu rovnu 4 a jejich reducibilita √ by implikovala existenci prvku a + −3b ∈ R, a, b ∈ Z, takového, že a2 + 3b2 = ±2, což je spor. Rozklady na levé a pravé straně (9.3) jsou ale neasociované. Grupa jednotek v R je totiž pr˚ unikem U (OK ) ∩ R = {±1}. Eisensteinova celá čísla OK oproti okruhu R obsahují √ √ další jednotky, a to 21 (±1 ± −3), a proto jsou čísla 1 + −3 a 2 v OK asociovaná. Nejednoznačnost faktorizace u oboru Z +
√
−3 Z není překvapující pro toho čtenáře,
který zná pojem integrální uzavřenosti okruh˚ u. Je-li K podílové těleso okruhu R, pak o R řekneme, že je integrálně uzavřený, pokud každý element α ∈ K, který je kořenem monického polynomu s koeficienty v R, sám leží také v R. Lze ukázat, že každý obor s 129
√ jednoznačnou faktorizací je integrálně uzavřený. Protože podílové těleso Q( −3) oboru √ √ Z + −3 Z obsahuje prvek 12 (1 + −3), který je kořenem polynomu x2 + x + 1 ∈ (Z + √ √ √ −3 Z)[x], ale nepatří do Z + −3 Z, obor Z + −3 Z tedy není integrálně uzavřený a nem˚ uže tedy splňovat jednoznačnou faktorizaci. Není těžké ověřit, že okruh celých čísel každého číselného tělesa je integrálně uzavřený, a proto má největší šanci mít vlastnost jednoznačné faktorizace. Jak jsme ovšem viděli √ např. na tělese Q( −5) v Příkladu 9.15, integrální uzavřenost není postačující podmínka pro jednoznačnost faktorizace.
130
10
Aplikace algebraických těles
10.1
Řešení diofantických rovnic
Nejprve uvedeme velmi jednoduchý příklad diofantické rovnice, kterou úplně vyřešíme elementárními metodami. Příklad 10.1. Najděme všechna celočíselná řešení rovnice x2 − y 2 = 35. Obě strany rovnosti rozložíme na součin, (x − 3y)(x + 3y) = 5 · 7. Protože pravou stranu dále faktorizovat nelze, máme pouze několik možností řešení. Ze znaménkové symetrie stačí uvažovat pouze dvě soustavy lineárních rovnic, x − y = 5, x + y = 7,
a
x − y = 1, x + y = 35 .
První soustava má řešení x = 6, y = 1; druhá soustava x = 18, y = 17. Všechna řešení rovnice x2 − y 2 = 35 jsou tedy (±6, ±1), (±18, ±17). Tento příklad jsme snadno vyřešili s použitím faktorizace čísla 35 na prvočísla. V dalších příkladech uvidíme, že metoda postupu je obdobná, potřebujeme ovšem faktorizaci v obecnějších číselných okruzích. Následující příklad je zobecněná Pellova rovnice. V D˚ usledku 5.20 jsme viděli zp˚ usob, jak z jednoho řešení vyrobit nekonečně mnoho řešení. Nebylo však zdaleka zřejmé, zda daná rovnice v˚ ubec nějaké řešení má, a jestli množina řešení získaná naším postupem je úplná. Příklad 10.2. Najděme všechna celočíselná řešení rovnice x2 − 29y 2 = 35. Levou stranu √ √ opět faktorizujeme, tentokrát na součin (x − 29y)(x + 29y). Je zřejmé, že výhodou √ bude znalost vlastností okruhu celých čísel tělesa K = Q( 29), tj. okruhu OK = { 12 (a + √ b 29) | a, b ∈ Z}. Připomeňme, jak vypadají jednotky v tomto oboru, což jsme popsali v Příkladu 9.8. Platí √
U (OK ) = {±( 5+2 29 )k | k ∈ Z} , √ √ U (OK ) ∩ (Z + 29Z) = {±(70 + 13 29)k | k ∈ Z} . 131
Z tabulky v Příkladu 6.30 popisující řetězový zlomek čísla
√
29 lze dále vyčíst, že
√ √ 5 = (11 + 2 29)(11 − 2 29) , √ přičemž čísla 11 ± 2 29 jsou ireducibilní v OK , protože mají prvočíselnou normu. Navíc také 7 = (6 +
√
29)(6 −
√
29) ,
√ přičemž čísla 6 ± 29 jsou ze stejného d˚ uvodu rovněz ireducibilní v OK . Zadnaná rovnice lze tedy napsat jako (x −
√
29y)(x +
√
√ √ √ √ 29y) = (11 + 2 29)(11 − 2 29)(6 + 29)(6 − 29) .
Hledejme nyní rozklad na ireducibilní prvky jednotlivých faktor˚ u z levé strany. Protože √ okruh celých čísel tělesa Q( 29) je eukleidovský, stačí rozdělit ireducibilní prvky z pravé strany na dvě skupiny. Ne všechny možnosti jsou ale přípustné. √ √ Nejdříve ukažme, že čísla 11 ± 2 29 nemohou zároveň dělit x + 29y. Použitím au√ tomorfismu σ tělesa Q( 29) totiž máme √ √ (11 − 2 29)|(x + 29y)
√ √ √ √ σ(11 − 2 29) = 11 + 2 29|σ(x + 29y) = x − 29y .
⇒
√ √ √ Proto by tedy 11 + 2 29 dělilo x + 29y i x − 29y a tudíž i jejich součet 2x a rozdíl √ 2 29y. Normováním ovšem získáme √ √ (11 + 2 29) | 2x ⇒ N (11 + 2 29) = 5 | N (2x) = 4x2 ⇒ 5|x, √ √ √ √ (11 + 2 29) | 2 29y ⇒ N (11 + 2 29) = 5 | N (2 29y) = 4 · 29y 2 ⇒ 5 | y . Proto by platilo 25|(x2 − 29y 2 ) = 35 a to je spor. √ √ Obdobným zp˚ usobem ukážeme, že čísla 6 ± 29 nemohou zároveň dělit x + 29y. √ √ √ √ Jinak by totiž 6 + 29 dělilo x + 29y i x − 29y, a tedy i součet 2x a rozdíl 2 29y. Platí (6 +
√
29) | 2x √ √ (6 + 29) | 2 29y
7 | 4x2
⇒ ⇒
což je opět spor. Protože x −
7 | 4 · 29y √
2
7|x
⇒ √
7|y
) ⇒ 49 | (x2 − 29y 2 ) = 35 ,
29y), musí i rozklad tohoto čísla na ire√ ducibilní prvky být obrazem rozkladu čísla x + 29y. Máme proto následující možnosti, √ √ 29)(11 + 2 29) = 124 + 23 29 , √ √ √ √ x + 29y = (6 − 29)(11 − 2 29) = 124 − 23 29 , √ √ √ √ x + 29y = (6 + 29)(11 − 2 29) = 8 − 29 , √ √ √ √ x + 29y = (6 − 29)(11 + 2 29) = 8 + 29 . x+
√
29y = σ(x +
⇒
29y = (6 +
√
132
Každé z těchto řešení ještě m˚ užeme vynásobit libovolnou jednotkou, pro kterou součin √ nevypadne z množiny Z + 29Z. Proto o √ √ k x+ 29y, x− 29y ∈ ±(8± 29)(70+13 29) , ±(124±23 29)(70+13 29) , k ∈ Z . √
n
√
√
√
k
Dalším typem příkladu je diofantická rovnice kombinující druhé a vyšší mocniny neznámých. Opět nejprve uvedeme příklad řešitelný elementárními metodami. Příklad 10.3. Najděme všechna celočíselná řešení rovnice y 2 + 5 = x3 . Takové řešení musí splňovat y 2 ≡ x3 − 1 mod 4. Protože čtverec celého čísla je vždy roven 0 nebo 1 modulo 4, musí být x3 rovno 1 nebo 2 modulo 4. Kongruence x3 ≡ 2 mod 4 ale nemá řešení, a proto máme x3 ≡ 1 mod 4. Číslo x je tedy liché. Možnost x = 4k + 3 vede snadno ke sporu, a tudíž x ≡ 1 mod 4. Rovnici y 2 + 5 = x3 m˚ užeme přepsat ve tvaru y 2 +4 = x3 −1 = (x−1)(x2 +x+1). Protože x2 +x+1 ≡ 3 mod 4, musí existovat prvočíslo p ≡ 3 mod 4 tak, že p | y 2 + 4. Násobíme-li obě strany kongruence y 2 + 4 ≡ 0 mod p druhou mocninou prvku 2−1 inverzního k prvku 2 v tělese Zp , dostaneme (y · 2−1 )2 + 1 mod p. To je ovšem spor, protože pro p ≡ 3 mod 4 číslo −1 není kvadratickým reziduem. Celočíselné řešení rovnice y 2 + 5 = x3 proto neexistuje. V Příkladu 10.3 jsme měli štěstí, že rovnice neměla řešení. Obecně lze říci, že dokázat neexistenci řešení bývá mnohem jednodušší, než nějaké řešení najít, natož popsat všechna řešení. Uvedeme několik příklad˚ u, kde k hledání celočíselných řešení využijeme právě jednoznačnou faktorizaci v okruzích celých čísel kvadratických těles. Příklad 10.4. Najděme všechna celočíselná řešení rovnice y 2 +2 = x3 . Je zřejmé, že x a y mají stejnou paritu. Kdyby x, y byla sudá čísla, pak y 2 +2 ≡ 2 mod 4 a x3 ≡ 0 Ale xmod 4 √ √ a to je spor. Proto x, y jsou lichá čísla. Opět budeme faktorizovat, (y + −2)(y − −2) = √ x3 , tentokrát v okruhu celých čísel tělesa K = Q( −2), což je opět eukleidovský obor a tedy v něm platí jednoznačná faktorizace. Připomeňme, že jediné jednotky v OK jsou ±1.
√
−2 = ±β1a1 β2a2 · · · βkak je faktorizace na ireducibilní prvky, βi ∈ OK jsou √ navzájem neasociované, ai ∈ N. Odtud s použitím automorfismu tělesa Q( −2) plyne Nechť y +
x3 = (y +
√
−2)(y −
√
−2) = β1a1 β2a2 · · · βkak σ(β1 )a1 σ(β2 )a2 · · · σ(βk )ak .
(10.1)
Ukažme, že v tomto součinu není βi asociované s žádným σ(βj ). Kdyby totiž βi = ±σ(βj ), √ √ √ muselo by číslo βi dělit y + −2, ale také y − −2, a proto βi |2 −2. Znormováním 133
dostaneme N (βi )|8. Zároveň ale znormováním βi |(y +
√
−2) odvodíme N (βi )|(y 2 + 2),
to je ale liché číslo. Jediná možnost pro N (βi ) je tedy N (βi ) = ±1. To ale není možné, protože βi je ireducibilní prvek, tj. βi ∈ / U (OK ). Rovnost (10.1) tedy dává faktorizaci čísla x3 na ireducibilní prvky, kde všechny činitele už jsou navzájem neasociované. Z jednoznačné faktorizace v okruhu OK plyne, že faktorizace x3 = (faktorizace x)3 , a tudíž √ exponenty ai v (10.1) musí být dělitelné třemi. Odtud plyne, že y + −2 = ±γ 3 pro √ nějaké γ = a + b −2, a, b ∈ Z. Máme proto √ √ √ √ y + −2 = ±(a + b −2)3 = ±(a3 + 3a2 b −2 − 3 · 2ab2 − b3 2 −2) = ³ ´ (10.2) √ = ± (a3 − 6ab2 ) + −2(3a2 b − 2b3 ) . Protože zápis čísla z OK pomocí integrální báze je jednoznačný, m˚ užeme porovnat koeficienty u 1, 1 = ±(3a2 b − 2b3 ) = ±b(3a2 − 2b3 )
⇒
b = ±1 = (3a2 − 2b2 ) ,
což implikuje řešení a = ±1, b = ±1. Dosazením do rovnice vzniklé z rovnice (10.2) porovnéním koeficient˚ u u 1 odvodíme y = ±(a3 − 6ab2 ) = ±a(a2 − 6b2 ) = ±5 . Číslo x lze k tomuto y dopočítat snadno ze zadané rovnice x3 = y 2 + 2 = 27, a tedy x = 3. Rovnice má tedy jediné celočíselné řešení, a to x = 3, y = ±5. Příklad 10.5. Velmi známá je diofantická rovnice Ramanujan-Nagellova, x2 + 7 = 2n . Ramanujan v roce 1913 vyslovil hypotézu, že jediná řešení (x, n) ∈ Z2 jsou (±1, 3), (±3, 4), (±5, 5), (±11, 7) a (±181, 15). Tuto hypotézu pak ve 40. letech dokázal norský matematik Trygve Nagell. Naznačme postup řešení. Bez újmy na obecnosti lze uvažovat pouze kladné x a n > 3. Případ sudého n lze vyřešit snadno. Potom 2n − x2 = (2n/2 − x)(2n/2 + x) = 7. Protože 2n/2 + x > 2n/2 − x, musí být 2n/2 + x = 7 a 2n/2 − x = 1. Odtud 2 · 2n/2 = 8, a tedy n = 4. Pak je nutně x = 3. Pro řešení při lichém n lze použít jednoznačnou faktorizaci v oboru celých čísel tělesa √ √ K = Q( −7), tedy OK = {a + b 1+ 2 −7 | a, b ∈ Q}. Pro zjednodušení značení položme m = n − 2 ≥ 2. Potom můžeme psát ³ x + √−7 ´³ x − √−7 ´ x2 + 7 ³ 1 + √−7 ´m ³ 1 − √−7 ´m m = =2 = , 2 2 4 2 2 134
√
kde jsme využili fakt, že 2 = N ( 1+ 2 −7 ). Protože 2 je prvočíslo v Z, podle Důsledku 9.11 √ √ jsou prvky α := (1 + −7)/2 a β := (1 − −7)/2 ireducibilní v OK . Navíc ani jedno z √ √ nich nemůže dělit zároveň čísla (x + −7)/2 a (x − −7)/2, protože pak by dělilo i jejich √ √ rozdíl −7. A to nelze, protože N (α) = N (β) = 26 | N ( −7) = 7. Jelikož U (OK ) = {±1}, √ je rozklad čísla (x + −7)/2 na ireducibilní prvky roven (x +
√
−7)/2 = ±αm
a odpovídající rozklad čísla (x − (x −
√
√
nebo
(x +
√
−7)/2 = ±β m ,
−7)/2 je po řadě
−7)/2 = ±β m
nebo
(x −
√
−7)/2 = ±αm ,
kde znaménko je vždy stejné u obou rozkladů. Po odečtení těchto rozkladů dostaneme √ ± −7 = αm − β m . Dokážeme, že tato rovnost platí pouze se znaménkem minus na levé √ √ straně. Předpokládejme pro spor, že αm − β m = −7. Protože také α − β = −7, je αm − α = β m − β .
(10.3)
Všimněme si, že α2 = (1 − β)2 = 1 − 2β + β 2 = 1 − αβ 2 + β 2 = 1 + β 2 (1 − α) = 1 + β 3 , kde jsme využili, že N (α) = αβ = 2. Proto αm − α = α(α2 )(m−1)/2 − α = α(1 + β 3 )(m−1)/2 − α = β 3 γ , pro nějaké γ ∈ OK . Po dosazení do (10.3) máme β m − β = αm − α = β 3 γ, odkud plyne β m−1 − 1 = β 2 γ a posléze 1 = β(β m−2 − βγ). Tudíž β dělí 1 v OK . To je ale spor, protože jak jsme řekli výše, β je ireducibilní prvek v OK . Tím jsme dokázali ³ 1 + √−7 ´m ³ 1 − √−7 ´m √ m m − −7 = α − β = − . 2 2 Potom platí −2
m
√
−7 = (1 +
√
m
−7) − (1 −
√
m m X X √ √ i −7) = ( −7) − (− −7)i . m
i=0
Protože se členy se sudým exponentem odečtou, platí µ ¶ µ ¶ ³µm¶ ´ m m 2 m −2 = 2 −7 +7 − ··· =⇒ 1 3 5
i=0
2m−1 ≡ −m mod 7 .
(10.4)
Protože ale platí 23k ≡ 1 mod 7, 23k+1 ≡ 2 mod 7 a 23k+2 ≡ 4 mod 7, pro k ∈ N, může (10.4) platit pouze pro m ≡ 6 nebo 5 nebo 3 mod 7. V případě m ≡ 6 mod 7 musí 135
být 2m−1 ≡ −6 ≡ 1 mod 7 a to nastane jen pro m − 1 = 3k pro nějaké k ∈ N, a tedy m ≡ 1 mod 3. Dohromady proto m ≡ 1 mod 3
7m ≡ 7 mod 21
⇒
m ≡ −1 mod 7
3m ≡ −3 mod 21
⇒
m ≡ 13 mod 21 .
Podobně v případě m ≡ 5 mod 7 je 2m−1 ≡ −5 ≡ 2 mod 7, což implikuje m ≡ 2 mod 3, takže m ≡ 2 mod 3 m ≡ −2 mod 7
7m ≡ 14 mod 21
⇒
⇒
3m ≡ −6 mod 21
m ≡ 26 ≡ 5 mod 21 .
Poslední případ m ≡ 3 mod 7 dává 2m−1 ≡ −3 ≡ 4 mod 7, což implikuje m ≡ 0 mod 3, a tedy m ≡ 0 mod 3 m ≡ 3 mod 7
⇒
7m ≡ 0 mod 21 3m ≡ 9 mod 21
⇒
m ≡ −18 ≡ 3 mod 21 .
Tím jsme odvodili, že exponenty n, pro které existuje celočíselné řešení x RamanujanNagellovy rovnice, splňují n = m+2 ≡ 5 nebo 7 nebo 15 mod 21. K hodnotám n = 5, 7, 13 snadno najdeme odpovídající x = 5, 11, 181. Je ovšem třeba ukázat, že žádná jiná n celočíselné řešení x neumožnují. Postup by využíval podobné metody jako doposud, je ovšem technicky ještě náročnější, a tak si ho odpustíme.
10.2
Lucas-Lehmerův test prvočíselnosti
Metody, které jsme viděli v předchozích příkladech, lze využít i k d˚ ukazu zajímavého kritéria pro prvočíselnost Mersennových čísel Mn = 22 − 1. Snadno ověříme, že Mn má šanci být prvočíslem, pouze pokud n samo je prvočíslo. Je-li totiž n složené, tedy n = ab pro a, b > 1, pak (2ab − 1) = (2a − 1)(1 + 2a + 22a + · · · + 2(b−1)a ) . Protože a, b ≥ 2, je 2a − 1 ≥ 3 a 1 + 2a + 22a + · · · + 2(b−1)a ≥ 5, a číslo 2n − 1 je tedy rovněz složené. Zdaleka ovšem neplatí, že Mp je prvočíslo pro každé prvočíslo p. Dnes je známo na 46 prvočísel tvaru Mn . Prvních osm z nich jsou M2 = 3,
M3 = 7,
M17 = 131071,
M5 = 31,
M7 = 127,
M19 = 524287,
M13 = 8191,
M31 = 2147483647 .
(10.5)
Jejich prvočíselnost tipoval už v roce 1644 francouzský matematik Marin Mersenne, podle kterého dnes nesou jméno. Mersenne dále předpokládal, že prvočísly jsou i M67 , M127 a 136
M257 a žádná další Mp pro p < 257. Zde se ovšem mýlil, protože prvočísly jsou kromě (10.5) ještě M61 , M89 , M107 a M127 , a nikoliv M67 a M257 . Tuto chybu bylo ovšem možno odhalit až o tři století později. Největší známé prvočíslo vůbec je dnes (březen 2009) číslo Mp , kde p = 43112609. Toto prvočíslo má 12978189 cifer! V posledních letech bylo největší známé prvočíslo vždy Mersennovo číslo. D˚ uvodem je to, že pro Mp existuje následující jednoduchý test prvočíselnosti. Teorém 10.6 (Lucas–Lehmer˚ uv test). Definujme posloupnost (an )n∈N předpisem a1 = 4 a an+1 = a2n − 2 pro n ≥ 1. Nechť p je liché prvočíslo. Potom Mp = 2p − 1 je prvočíslo, právě když ap−1 ≡ 0 mod Mp . Ověrit nebo vyvrátit prvočíselnost Mp tedy vyžaduje “pouze” p − 1 kroků, i když jednotlivé kroky vyždaují operace s obrovskými čísly. Přesto nám počítání modulo Mn n
výrazně zjednoduší výpočet. Prvky posloupnosti an se totiž řádově rovnají 22 , přitom v testu nikdy není nutné použít číslo větší než Mn2 ≈ 22n . Příklad 10.7. Ověřme prvočíselnost Mersennova čísla M17 = 217 − 1 = 131071. Máme a1 = 4 ,
a2 = 14 ,
a3 = 194 ,
a4 = 37634 ,
a5 = 218767 ≡ 95799 mod M17 ,
a6 = 957992 − 2 = 9177448399 ≡ 119121 mod M17 ,
a7 = 66179 mod M17 ,
a8 = 53645 mod M17 ,
a9 = 122218 mod M17 ,
a10 = 126220 mod M17 ,
a11 = 70490 mod M17 ,
a12 = 69559 mod M17 ,
a13 = 99585 mod M17 ,
a14 = 78221 mod M17 ,
a15 = 130559 mod M17 ,
a16 = 0 mod M17 .
V šestnácti krocích jsme tedy ověřili, že M17 je prvočíslo. Podle velikosti je to šesté prvočíslo tvaru Mp . Kdybychom chtěli prvočíselnost M17 zjistit faktorizací na prvočinitele, √ museli bychom ověřit dělitelnost všemi prvočísly menšími než [ M17 ] = 362, kterých je je 72. Kdybychom podobně dokazovali prvočíselnost už jen osmého Mersennova prvočísla M31 = 231 −1, stačilo by nám 30 kroků. Rozklad na prvočinitele by ale tentokrát vyžadoval √ ověřit dělitelnost π( M31 ) = 4792 prvočísly! Poznamenejme, že kromě čistě estetické hodnoty jsou Mersennova prvočísla i užitečná. Používají se například v generátorech pseudo-náhodných čísel, jako je Mersennův twister, využívaný v programech typu Matlab.
137
10.3
Konstrukce pomocí kružítka a pravítka
Nemožnost vyjádřit délku uhlopříčky čtverce s jednotkovou stranou pomocí podílu dvou √ racionálních čísel, jinými slovy iracionálnost čísla 2, přispěla k tomu, že se matematici v antice zaměřili na velikosti, které bylo možné zkonstruovat geometricky. Hned vznikla otázka, které velikosti lze zkonstruovat. Dvě úlohy, na které se antice nepodařilo dát odpověd’, jsou známé pod názvy zdvojení krychle a kvadratura kruhu. Úloha zdvojení krychle vyžaduje zkonstruovat stranu krychle, která by měla dvojnásobný objem než krychle jednotková; vyřešit kvaraturu kruhu znamená zkonstruovat čtverec tak, aby měl stejnou plochu jako kruh s jednotkovým poloměrem. V první části této kapitoly dokážeme, že zkonstruovat lze pouze algebraická čísla, jejichž řád je mocninou dvojky. To má za okamžitý důsledek nemožnost zdvojení krychle, √ protože 3 2 je algebraická iracionalita řádu 3. Nemožnost kvadratury kruhu pak ze zmíněného výsledku vyplynula, až když F. Lindemann dokázal transcendentnost čísla π. V druhé části se budeme věnovat otázce konstrukcí pravidelných n-úhleníků. Dokážeme slavnou Gaussovu větu z roku 1796: Věta 10.8. Necht’ n ∈ N, n ≥ 3. Pak pravidelný n-úhelník lze zkonstruovat pomocí pravítka a kružítka právě tehdy, když n je mocnina dvojky nebo n = 2j Fk1 Fk2 . . . Fkm ,
(10.6)
kde j ∈ N0 a Fk1 , Fk2 , . . . , Fkm jsou navzájem různá Fermatova prvočísla. n
Připomeňme, že Fermatovo číslo je číslo tvaru Fn = 22 + 1 pro n = 0, 1, 2, . . .. Je-li Fn prvočíslo, nazývame jej Fermatovo prvočíslo. Čísla F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65637 jsou prvočísla. Pierre de Fermat (1601-1665) tvrdil, že všechna Fn jsou prvočísla. V roce 1732 Leonhard Euler toto tvrzení vyvrátil, když ukázal, že F5 = 641 × 6700417. Definice 10.9. Číslo α ∈ C nazveme konstruovatelné, pokud lze v pravouhlé souřadné soustavě roviny se zadanou jednotkovou vzdáleností zkonstruovat pomocí kružítka a pravítka bod, jehož x-ová souřadnice je <α a y-ová souřadnice je =α. Prvítko nám slouží jenom na to, abychom mohli spojit úsečkou dva body a abychom mohli úsečku dostatečně prodloužit. Nevyužíváme centimetrovou škálu, ani rysku pro 138
vztyčování kolmic. I tak umíme zkonstruovat k zadané přímce p a bodu B ∈ / p rovnobežku k p resp. kolmici na p, která prochází bodem B. Poznámka 10.10. α ∈ C je konstruovatelné právě tehdy, když jsou konstruovatelná čísla <α a =α. Připomeňme znalosti se středoškolské geometrie. Když jsou konstruovatelná reálná čísla α a β, pak jsou jednoduše konstruovatelná i α ± β. Podobností trojúhelníků lze využít na konstrukci αβ a α/β. Protože aritmetické operace v komplexních číslech jsou definovány pomocí operací v reálných číslech, umíme zkonstruovat α ± β, αβ a α/β, pro libovolné konstruovatelné α, β ∈ C. Poznámka 10.11. Množina konstruovatelných čísel tvoří podtěleso tělesa C. Speciálně je konstruovatelné každé racionální číslo. Množina konstruovatelných čísel je však větší než Q. Z Eukleidovy věty pro výšku pravoúhlého trojúhelníka plyne, že umíme zkonstruovat i odmocninu z libovolného reálného konstruovatelného čísla. A protože pomocí kružítka a pravítka umíme půlit úhel, je √ konstruovatelná také α pro libovolné konstruovatelné komplexní číslo α. Ze vzorečku pro výpočet kořenů kvadratické rovnice plyne následující tvrzení. Lemma 10.12. Necht’ a, b, c jsou konstruovatelná čísla a 6= 0. Pak jsou konstruovatelné i kořeny kvadratické rovnice ax2 + bx + c = 0. Věta 10.13. Necht’ α ∈ C. Číslo α je konstruovatelné právě tehdy, když existuje posloupnost podtěles Q = T0 ⊂ T1 ⊂ T2 ⊂ . . . ⊂ Tr ⊂ C taková, že α ∈ Tr a [Ti : Ti−1 ] = 2 pro každé i = 1, 2, . . . , r. Důkaz. (⇐) Postupujme indukcí na r. Tvrzení pro r = 0 je obsaženo v 10.11. Necht’ r > 0 a α ∈ Tr . Bez ztráty obecnosti předpokládejme, že α ∈ / Tr−1 . Protože [Tr : Tr−1 ] = 2, je 1 a α bází vektorového prostoru Tr nad tělesem Tr−1 , tedy speciálně pro α2 ∈ Tr existují a, b ∈ Tr−1 takové, že α2 = aα + b, tj. α je kořen kvadratické rovnice x2 − ax − b = 0. Z indukčního předpokladu jsou a, b konstruovatelná a podle 10.12 je konstruovatelné také α. (⇒) Nyní postupujme indukcí na počet kroků konstrukce. Každý nový bod, který vytvoříme, vznikne bud’ jako průsečík dvou přímek, nebo jako průsečík dvou kružnic,
139
nebo jako průsečík přímky a kružnice. Tedy jeho souřadnice (x0 , y0 ) jsou řešením systému dvou rovnic: y = a1 x + b1
a y = a 2 x + b2
nebo rovnic y = a1 x + b1
a (x − c1 )2 + (y − d1 )2 = r12
nebo rovnic a (x − c2 )2 + (y − d2 )2 = r22 .
(x − c1 )2 + (y − d1 )2 = r12
V každém případě po vyloučení proměnné y hledáme x0 jako kořen nanejvýš kvadratické rovnice a y0 pak dopočítáme pomocí x0 z lineární rovnice. Všechny parametry ai , bi , ci , di , ri , které vystupují v rovnicích, jsou podle indukčního předpokladu už konstruovatelná čísla patřící nějakému tělesu Tr , které tvoří poslední těleso v posloupnosti do sebe vnořených těles. Bud’ x0 ∈ Tr , a tím je důkaz hotov. V opačném případě je x0 kořenem kvadratického polynomu ireducibilního nad Tr , a se značením Příkladu 2.34 můžeme psát x0 ∈ Tr+1 := Tr (x0 ). Pro toto těleso platí [Tr+1 : Tr ] = 2. D˚ usledek 10.14. Necht’ α je konstruovatelné číslo. Pak α je algebraické číslo, jehož řád je mocnina dvojky. Pravidelný n-úhelník vepsaný jednotkové kružnici má v komplexní rovině vrcholy 2π
ei n k ,
kde k = 0, 1, . . . , n − 1, . 2π
Tedy n-úhelník umíme zkonstruovat právě tehdy, když je n-tý kořen z jedničky ω := ei n
konstruovatelné číslo. Q(ω) je cyklotomické těleso studované v kapitole 4.6. Jeho řád je roven hodnotě Eulerovy funkce ϕ(n). Přímým důsledkem 10.14 je následující věta. Věta 10.15. Necht’ lze pomocí pravítka a kružítka zkonstruovat pravidelný n-úhelník, n ≥ 3. Pak ϕ(n) = 2r pro nějaké r ∈ N. Popis čísel, pro které je hodnota Eulerovy funkce mocninou dvojky, nám poskytne nutnou podmínku na počet vrcholů n-úhelníka konstruovatelného podle pravítka a kružítka. Věta 10.16. Necht’ n ∈ N. Pak ϕ(n) je mocninou dvojky právě tehdy, když n je mocnina dvojky nebo n = 2j Fk1 Fk2 . . . Fkm , kde j ∈ N0 a Fk1 , Fk2 , . . . , Fkm jsou navzájem různá Fermatova prvočísla. 140
(10.7)
Důkaz. Necht’ n = q1a1 q2a2 . . . qsas je rozklad n na prvočísla, tj. q1 , q2 , . . . , qs jsou různá prvočísla a a1 , . . . , as ≥ 1. Hodnotu Eulerovy funkce lze určit podle vzorce ϕ(n) = q1a1 −1 (q1 − 1)q2a2 −1 (q2 − 1) . . . qsas −1 (qs − 1) . Když n = 2k , je ϕ(n) = 2k−1 . Když n je tvaru (10.7), jsou exponenty ai u všech lichých ¢¡ ¢ ¡ ¢ ¡ prvočísel rovny 1, a proto ϕ(n) = 2j−1 Fk1 − 1 Fk2 − 1 . . . Fkm − 1 je mocnina dvojky. `
(Připomeňme, že `-té Fermatovo číslo je definováno jako F` = 22 + 1.) Pro důkaz obrácené implikace předpokládejme, že ϕ(n) = 2r . Tato rovnost vynucuje pro prvočíslo qi ≥ 3 exponent ai = 1 a samotné prvočíslo je tvaru qi = 2ki + 1 pro nějaké ki ∈ N. Jelikož snadno dokážeme, že číslo 2k + 1 je provčíslo, pouze když k je mocnina dvojky, je nutně qi Fermatovo prvočíslo. Tedy zkonstruovatelné n-úhelníky mají n tvaru (10.7). Dokázat platnost obrácené implikace v Gaussově větě, bude složitější. Nejdříve uved’me jedno jednoduché pozorování. Lemma 10.17. Necht’ s a t jsou nesoudělná přirozená čísla. Pokud lze zkonstruovat pravidelný s-úhelník a t-úhelník, pak lze zkonstruovat i pravidelný (st)-úhelník. Důkaz. Nesoudělnost s a t implikuje existenci čísel x, y ∈ Z takových, že sx + ty = 1, a tedy 2iπ
³x t
+
y´ 1 = 2iπ s st
=⇒
y
x
1
e2iπ t e2iπ s = e2iπ st
Periodičnost exponenciály zaručuje, že najdeme k ∈ {0, 1, . . . , t − 1} a ` ∈ {0, 1, . . . , s − 1} x
k
y
`
k
`
tak, aby platilo e2iπ t = e2iπ t a e2iπ s = e2iπ s . Protože e2iπ t a e2iπ s jsou vrcholy t resp. 1
s-úhelníka, a ty umíme zkonstruovat, umíme zkonstruovat i jejich součin e2iπ st . To je vrchol pravidelného (st)-úhelníka. Již v antice bylo známo, že lze zkonstruovat libovolný n-úhelník, kde n je tvaru 2j 3k 5` , pro j ∈ N0 , k, ` ∈ {0, 1}. Z pravidelného n-úhelníka lze totiž snadno zkonstruovat pravidelný (2n)-úhelník. A protože Řekové uměli zkonstruovat rovnostranný trojúhelník, čtverec a pravidelný pěti úhelník, předchozí pozorování jim umožňilo zkonstruovat libovolný n-úhelník, kde n je zmíněného tvaru. Nám předchozí lemma říká, že pro důkaz Gaussovy věty stačí ukázat konstrukci pravidelného n-úhelníka, kde n je Fermatovo prvočíslo. K tomu však potřebujeme složitější matematický aparát.
141
2π
Věta 10.18. Necht’ p je Fermatovo prvočíslo. Označme p − 1 = 2r a ω = ei p . V grupě Aut Q(ω) existuje posloupnost automorfizmů Id = γ0 , γ1 , . . . , γr a posloupnost podgrup G0 ⊂ G1 ⊂ . . . ⊂ Gr taková, že G0 = {Id}, Gr = Aut Q(ω) a pro každé i = 1, 2, . . . , r platí Gi = hGi−1 , γi i
a
γi2 ∈ Gi−1 .
(10.8)
Důkaz. Podle Věty 4.40 je grupa Aut Q(ω) izomorfní s multiplikativní grupou tělesa Zp . Proto stačí zkonsturovat grupy Gi a prvky γi s vlastností (10.8) v grupě Zp \ {0} s operací násobení modulo p. Využijeme toho, že multiplikativní grupa konečného tělesa je cyklická, tj. existuje prvek x ∈ Zp \ {0} takový, že Zp \ {0} = {x, x2 , x3 , . . . , xp−1 = 1}. Stačí proto položit Gi := hγ0 , γ1 , . . . , γi i , kde γi = x
p−1 2i
r−i
= x2
pro i = 0, 1, . . . r.
Věta 10.19. Necht’ p je Fermatovo prvočíslo. Pak lze pomocí pravítka a kružítka zkonstruovat pravidelný p-úhelník. Důkaz. Využijeme tvrzení 10.13 a 10.18 a také jejich značení. Pro i = 0, 1, 2, . . . , r definujme tělesa Ti := {x ∈ Q(ω) | γ(x) = x pro každé γ ∈ Gr−i } . Snadno lze ověřit, že Ti jsou tělesa. Protože Gr−i = hGr−i−1 , γr−i i ⊃ Gr−i−1 , je Ti ⊂ Ti+1 . Uvažujme x0 ∈ Ti+1 \ Ti , tj. γr−i (x0 ) 6= x0
a γ(x0 ) = x0 pro každé γ ∈ Gr−i−1 .
(10.9)
Ukážeme však, že A := x0 + γr−i (x0 ) ∈ Ti
a B := x0 .γr−i (x0 ) ∈ Ti .
Potřebujeme ověřit, že pro každé γ ∈ Gr−i−1 je γ(A) = A a navíc A = γr−i (A). Stejné 2 ∈ Gr−i−1 a (10.9). vlastnosti mají platit i pro B. Nejdříve využijeme faktu, že γr−i
¡ ¢ 2 (x0 ) = γr−i (x0 ) + x0 = A . γr−i (A) = γr−i x0 + γr−i (x0 ) = γr−i (x0 ) + γr−i Ted’ využijeme komutativity automorfizmů ¡ ¢ ¡ ¢ ¡ ¢ γ(A) = γ x0 + γr−i (x0 ) = γ(x0 ) + γ γr−i (x0 ) = x0 + γr−i γ(x0 ) = x0 + γr−i (x0 ) = A . 142
Stejně ověříme, že B ∈ Ti . Protože x0 ∈ / Ti+1 je kořenem kvadratické rovnice ¡ ¢¡ ¢ ¡ ¢ ¡ ¢ x − x0 x − γ(x0 ) = x2 − x0 + γ(x0 ) x + x0 .γ(x0 ) | {z } | {z } =A
=B
s koeficienty v Ti , podle Příkladu 2.34 platí [Ti (x0 ) : Ti ] = 2. Z inkluze Ti+1 ⊃ Ti (x0 ) plyne, [Ti+1 : Ti ] ≥ 2. Abychom mohli použít Větu 10.18, potřebujeme ukázat rovnost [Ti+1 : Ti ] = 2, která je ekvivalentní s rovností Ti+1 = Ti (x0 ). K tomu využijeme tvrzení 2.26. Podle něj, z nerovností [Ti+1 : Ti ] ≥ 2, které platí pro každé i = 0, . . . , r − 1, plyne [Tr : T0 ] ≥ 2r . Protože však Tr = Q(ω) a T0 = Q, je [Tr : T0 ] rovno řádu algebraického čísla ω, a ten je 2r . Tedy nutně [Ti+1 : Ti ] = 2 pro každé i = 0, . . . , r − 1. Tím je důkaz hotov. Gaussova věta převedla otázku konstruovatelnosti pravidelného n-úhelníka na úlohu popsat Fermatova prvočísla. Čísla Fn pro 0 ≤ n ≤ 4 jsou prvočísla a jsou to jediná známa Fermatova prvočísla. Euler v roce 1732 ukázal, že číslo F5 není prvočíslo a zároveň našel jeho rozklad na prvočísla F5 = 641 × 6700417. V roce 1855 Clausen ukázal, že číslo F6 je složené, rozklad čísla F6 na prvočísla byl však nalezen až v roce 1970 s použitím počítače. Dnes se ví, že Fn je složené číslo pro 5 ≤ n ≤ 32. Rozklad na prvočísla je znám u čísel Fn pro 5 ≤ n ≤ 11. Nepodařilo se zatím ani dokázat ani vyvrátit existenci dalšího Fermatova prvočísla.
10.4
Nekomutativní tělesa
Nejznámějším nekomutativním tělesem jsou kvaterniony. Popíšeme toto těleso v maticové formě. Uvažujme množinu matic K :=
½³
¾ ¯ α β ´ 2×2 ¯ ∈ C ¯ α, β ∈ C −β α
spolu se standardním sčítaním a násobením v C2×2 . Snadno lze ověřit, že K je uzavřeno na obě tyto operace. Zřejmě je K s operací sčítaní komutativní grupa s neutrálním prvkem Protože
³ 0 0 ´ . 0 0
³ α β ´ det = αα + ββ ≥ 0 , −β α
je každá matice z K kromě matice ze samých nul regulární. Platí navíc ³ α β ´−1 ³ α −β ´ 1 = ∈ K. −β α β α αα + ββ 143
To ovšem znamená, že K bez neutrálního prvku je spolu s nasobením grupou. Tedy K je těleso. Není však komutativní, protože např. ³ 0 1 ´³ i 0 ´ ³ i 0 ´³ 0 1 ´ 6= 0 −i −1 0 −1 0 0 −i Prvek tělesa K je popsaán čtyřmi reálnými parametry, a to reálnými a imaginárními složkami čísel α a β. Proto se prvkům tělesa K říká kvaterniony. Pro reálné parametry x1 , x2 , x3 , x4 a y1 , y2 , y3 , y4 definujme α := x1 − ix2 , β := −x3 − ix4 , γ := y1 + iy2 , δ := y3 + iy4 . Uvažujme součin kvaternionů ³ α β ´³ γ δ ´ ³ αγ − βδ αδ + βγ ´ = −δ γ −β α −αδ − βγ αγ − βδ Ze vzorce pro determinant součinu matic plyne. ¡
¢¡ ¢ ¡ ¡ ¢ ¡ ¢¡ ¢ αα + ββ γγ + δδ = αγ − βδ) αγ − βδ + αδ + βγ αδ + βγ
Po dosazení za α, β, γ, δ dostaneme tzv. Eulerovu identitu, kterou využijeme při reprezentaci čísla jako součtu čtyř čtverců. Lemma 10.20. Pro libovolná reálná čísla x1 , x2 , x3 , x4 a y1 , y2 , y3 , y4 platí ¡
¢¡ ¢ ¡ ¢2 x21 + x22 + x23 + x24 y12 + y22 + y32 + y42 = x1 y1 + x2 y2 + x3 y3 + x4 y4 +
¡ ¢2 ¡ ¢2 ¡ ¢2 + x1 y2 − x2 y1 − x3 y4 + x4 y3 + x1 y3 − x3 y1 + x2 y4 − x4 y2 + x1 y4 − x4 y1 − x2 y3 + x3 y2 Kdybychom při konstrukci kvaternionů místo 4 reálých parametrů uvažovali pouze ta α a β, která mají reálné a imaginární složky v Q, dostali bychom také těleso. To by bylo nekomutativní a spočetné. Analogicky Q lze nahradit libovolným tělesem T ⊂ R a konstrukci zopakovat. Pokaždé dostaneme nekomutativní těleso, které bude nekonečné. Zkonstruovat konečné nekomutativní těleso se nám nepodaří. Toto tvrzení dokázal v roce 1905 Wedderburn. Elegantní důkaz, který uvádíme, však pochází od Ernsta Witta z roku 1931. Věta 10.21. Každé konečné těleso je komutativní. Důkaz. Větu dokážeme sporem. Necht’ F je konečné nekomutativní těleso. Označme Cs := {x ∈ F | xs = sx} 144
pro každé s ∈ F .
Z definice tělesa plyne, že 0 ∈ Cs , 1 ∈ Cs ; dále −x ∈ Cs pro libovolné x ∈ Cs a x−1 ∈ Cs pro libovolné x ∈ Cs , 0 6= x. Využitím distributivního zákona dostaneme pro x, y ∈ Cs (x + y)s = xs + ys = sx + ys = s(x + y)
=⇒
x + y ∈ Cs ,
využitím asociativního zákona pak (xy)s = x(ys) = x(sy) = (xs)y = (sx)y = s(xy)
=⇒
xy ∈ Cs .
Množina Cs je tedy podtělesem tělesa F a průnik C :=
\
Cs
s∈F
je navíc komutativním podtělesem tělesa F . Poznamenejme, že dokonce každý prvek x ∈ C komutuje s libovolným s ∈ F . Tato vlastnost by se dala použít na ekvivalentní zavedení C. Uvažujme tělesa Cs a F jako vektorové prostory nad tělesem C. Když označíme ns := dim Cs ,
n := dim F
a q := #C ,
tak z předpokladu nekomutativity tělesa F je n > 1,
#Cs = q ns
a #F = q n .
(10.10)
Na mutliplikativní grupě F ∗ := F − {0} zavedeme relaci equivalence r ∼ r0
⇐⇒
r0 = x−1 rx pro nějaké x ∈ F ∗
Protože nenulové prvky z C komutují s kaž’.ym x, tvoří jednoprvkové třídy ekvivalence. Jelikož F není komutativní těleso, existují i více prvkové třídy ekvivalence, jejich reprezentatny označme x1 , . . . , xt a třídy Tx1 , . . . , Txt . Zřejmě Txi = {x−1 xi x | x ∈ F ∗ } Abychom určili, jak je velká třída Txi , zavedeme zobrazení f : F 7→ Txi předpisem f (x) := x−1 xi x . Snadnými úpravami dostaneme pro x, y ∈ F − {0} f (x) = f (y)
⇔
x−1 xi x = y −1 xi y
⇔
145
yx−1 xi = xi yx−1
⇔
yx−1 ∈ Cxi
Tedy y má stejný obraz jako x, když y ∈ (Cxi − {0}) x, proto vzor každého prvku z množiny Txi má #Cxi − 1 prvků. To znamená #F ∗ = #Txi · (#Cxi − 1)
=⇒
#Txi =
qn − 1 . q nxi − 1
Protože F ∗ je disjunktním sjednocením všech tříd ekvivalence platí t X qn − 1 q − 1 = #C − 1 + . q nxi − 1 i=1 n
(10.11)
Z faktu, že zlomek vyjádřující počet prvků třídy Txi je celé číslo, odvodíme nejprve, že nxi dělí n. Označme r zbytek po dělní čísla n číslem nxi , tj. n = knxi + r pro nějaké k ∈ N a 0 ≤ r < nxi . Potom qn − 1 Z 3 nx q i −1
k−1
X q r (q knxi − 1) + q r − 1 qr − 1 r nxi ` + = = q (q ) q nxi − 1 q nxi − 1 `=0 {z } | ∈ Z
Jelikož 0 ≤ r < nxi , je 0 ≤
q r −1 q nxi −1
< 1. Z celočíselnosti tohoto zlomku pak plyne, že
r = 0, a tedy n je dělitelné číslem nxi . Dopracovat se k závěrečnému sporu nám pomohou cyklotomické polynomy Φ` (x), viz kapitolu 3.3. Jejich vlastnosti nám umožňují úpravu xn − 1 =
Y
Φd (x) = Φn (x)
Y
Φd (x)
d|nxi
d|n
|
{z
= xnxi −1
}
Y
Φd (x)
(10.12)
d-nxi d|n, d
Důležitou roli při úpravách hrála dělitelnost čísla n číslem nxi . Dosad’me do (10.12) za proměnnou x = q počet prvků podtělesa C. Cyklotomické polynomy mají celočíselné koeficienty, proto i hodnoty Φ` (q) jsou celočíselné. Dostaneme, že číslo q n − 1 i číslo q n −1 q nxi −1
jsou dělitelné číslem Φn (q). Proto ze vztahu (10.11) plyne, že číslo #C − 1 = q − 1
je také dělitelné číslem Φn (q). Pro získání sporu ted’ už stačí ukázat, že |Φn (q)| > q − 1. Podle definice cyklotomického polynomu je Φn (x) =
Y
(x − ωnj ) ,
2π
kde ω = ei n .
j⊥n 1≤j
Ukážeme, že každý člen součinu po dosazení q je větší než q − 1: Označme ωnj = a + ib. Jelikož |ωnj | = 1 = a2 + b2 a ωnj 6= 1, je reálná složka a < 1. Upravme |q − ωnj |2 = |q − a − ib|2 = (q − a)2 + b2 = q 2 − 2qa + 1 > q 2 − 2q + 1 = (q − 1)2 . 146
Celkově dostaneme slíbený spor |Φn (q)| =
Y
(x − ωnj ) > |q − 1| ,
j⊥n 1≤j
protože n > 1, viz (10.10), implikuje, že součin definující Φn (x) má alespoň jeden člen.
147
Literatura [1] M. Aigner, G. M. Ziegler, Proofs from The Book, Third edition. Springer-Verlag, Berlin, 2004. [2] E. B. Burger, Exploring the Number Jungle: An Interactive Journey into Diophantine Analysis, AMS Student Mathematical Library Series, Providence, 2000. [3] E. B. Burger, R. Tubbs, Making transcendence transparent. An intuitive approach to classical transcendental number theory, Springer-Verlag, New York, 2004. [4] R. Chapman, Algebraic Number Theory – summary of notes, http://www.secamlocal.ex.ac.uk/people/staff/rjchapma/notes/ant2.pdf [5] P.Erdös, J. Surányi, Topics in the Theory of Numbers, Springer-Verlag, 2001. [6] M. Filaseta, Algebraic Number Theory – instructor’s notes, http://www.math.sc.edu/~filaseta/gradcourses/TheMath784Notes.pdf [7] R. K. Guy, Unsolved problems in number theory, Third edition. Problem Books in Mathematics. Springer-Verlag, New York, 2004. [8] D. Hensley, Continued fractions, World Scientific, Hackensack, NJ, 2006. [9] M. Klazar, Kaleidoskop teorie čísel, KAM-DIMATIA Series, UK, 2000. [10] V. Kořínek Základy algebry, NČSAV, Praha, 1956. [11] M. Křížek, F. Luca, L. Somer, 17 Lectures on Fermat Numbers: From Number Theory to Geometry, CMS Books in Mathematics, vol. 9, Springer-Verlag, New York, 2001. [12] J. Mareš, Algebra (Úvod do obecné algebry), 3. vyd. ČVUT, Praha, 1998. [13] J. S. Milne, Algebraic Number Theory, http://www.jmilne.org/math/CourseNotes/ANT301.pdf 148
[14] M. B. Nathanson, Elementary methods in number theory, volume 195 of Graduate Texts in Mathematics. Springer-Verlag, New York, 2000. [15] P. Ribenboim, Classical Theory of Algebraic Numbers, Springer-Verlag, 2001. [16] T. Šalát, Reálne čísla, Alfa, Bratislava, 1982. [17] G. Tenenbaum, M. Mend`es France, The prime numbers and their distribution, AMS Student Mathematical Library Series, Providence, RI, 2000.
149