Elementaire Deeltjes Fysica
M. de Roo Instituut voor Theoretische Natuurkunde Rijksuniversiteit Groningen Nijenborgh 4, 9747 AG Groningen
Reprinted November 2004
Inhoudsopgave
1
1.
Inleiding
2. 2.1. 2.2. 2.3. 2.4.
Symmetrie N re¨ele scalaire velden Locale symmetrie in QED Yang-Mills theorie Locale ijkinvariantie en de stroom
6 6 10 12 15
3. 3.1. 3.2. 3.3. 3.4.
Zwakke interacties Het zwakke verval van het muon en het V–A model De zwakke interacties en pariteit Het gedrag van het Fermi model bij hoge energie Het massieve vectorveld
17 17 18 20 21
4. 4.1. 4.2.
Het GSW-model: zwakke interacties van leptonen De symmetrie van de zwakke interacties Zwakke interacties en locale symmetrie
23 23 26
5. 5.1. 5.2. 5.3.
Het GSW-model: de massa van ijkvelden en fermionen De stelling van Goldstone Het Higgs-mechanisme Massa in het GSW-model
31 31 33 36
6. 6.1. 6.2.
Het GSW-model: quarks en de zwakke interacties De eerste generatie Meer dan een generatie quarks en leptonen
40 40 42
7. 7.1. 7.2. 7.3. 7.4.
Quantisatie van Yang-Mills theorie IJkbrekende termen in de padintegraal De Faddeev-Popov ghost velden Feynman regels voor Yang-Mills velden De vacuumpolarisatie van het Yang-Mills veld
47 47 52 55 56
8. 8.1. 8.2. 8.3.
Het GSW-model: experimentele consequenties De W - en Z-bosonen Het Higgs-deeltje De top-quark
60 60 61 63
2
9. 9.1. 9.2. 9.3. 9.4.
Sterke interacties en quarks Nucleonen en pionen: isospin Vreemdheid, SU(3) en quarks Experimentele aanwijzingen voor quarks: ep-verstrooiing Experimentele aanwijzingen voor kleur
66 66 68 70 74
10. 10.1. 10.2. 10.3. 10.4. 10.5.
Quantum Chromo Dynamica Sterke interacties als ijktheorie Renormalisatie en countertermen: een voorbeeld Green functies en asymptotische vrijheid De β-functie voor φ4 theorie De β-functie in Yang-Mills theorie
77 77 79 83 87 89
11. 11.1. 11.2. 11.3. 11.4. 11.5.
Unificatie Motivatie De SU(5)-structuur De ijkvelden en de koppelingsconstante Het protonverval De effectieve koppelingsconstanten
95 95 96 100 103 105
A. A.1. A.2.
Appendix: Groepentheorie Lie-groepen en Lie-algebras Representaties
110 110 112
B.
Appendix: Het complete GSW-model
116
Referenties
119
3
1
Inleiding
In dit college zullen we een aantal aspecten van elementaire deeltjes en hun interacties behandelen. In het curriculum zijn ook andere colleges over dit onderwerp opgenomen. “Elementaire Deeltjes Fysica” onderscheidt zich van die andere colleges doordat gebruik gemaakt wordt van de quantumveldentheorie. Deze theorie vormt de basis van ons begrip van de interacties tussen elementaire deeltjes, zowel in het geval van de electromagnetische interacties als in dat van de sterke en zwakke wisselwerkingen. Bij het college Quantumveldentheorie [1] ligt de nadruk op de quantum electrodynamica (QED), de theorie die de electromagnetische wisselwerking tussen geladen spin-1/2 deeltjes beschrijft. De nadruk bij dit college zal liggen op de zwakke interactie, verantwoordelijk voor β-verval van kernen (en vele andere processen), en de sterke interacties, die de deeltjes in de kern (het proton en neutron) bij elkaar houden. Een vierde interactie is de zwaartekracht, deze zal in dit college slechts terloops aan de orde komen. De quantumveldentheorie gaat ervan uit dat de elementaire deeltjes puntdeeltjes zijn, dat wil zeggen, geen voor ons waarneembare structuur hebben. Elementair is daarom een tijdafhankelijk begrip – de elementaire deeltjes van 20 jaar geleden zijn, voor een deel, niet elementair gebleken. Zo blijken de vele sterk wisselwerkende deeltjes te zijn opgebouwd uit quarks, die we nu (nog) elementair noemen. Welke zijn dan, volgens onze huidige inzichten, de elementaire deeltjes? We maken een onderverdeling in materiedeeltjes, en in ijkdeeltjes. De ijkdeeltjes zijn verantwoordelijk zijn voor de krachten tussen de materiedeeltjes, waaruit letterlijk de materie is opgebouwd. Eigenschappen van de bekende ijkdeeltjes zijn gegeven in Tabel 1.1. massa (GeV/c2 )
lading
0
0
zwak
Z0
80.22 ± 0.26
±1
zwak
0
gluonen (Aaµ , a = 1, . . . 8)
91.187 ± 0.007
sterk
0
0
graviton
zwaartekracht
0
0
deeltje
interactie
foton (γ)
electromagnetisch
W±
Tabel 1.1
IJkdeeltjes en hun eigenschappen.
Het foton, de W ± en Z 0 bosonen, en de gluonen worden in de quantumveldentheorie beschreven door vectorvelden. De dynamica van het vrije foton wordt gegeven
4
door de Maxwell vergelijkingen, en de koppeling van de fotonen aan geladen deeltjes wordt bepaald door locale ijkinvariantie. De Lagrangedichtheid van QED is invariant onder de volgende transformaties van het fotonveld Aµ (het ijkveld van de locale symmetrie) en het fermionveld ψ: Aµ → Aµ + ∂µ θ(x) , ψ → e−ieθ(x) ψ(x) ,
(1.1)
waarbij dus de parameter van de transformatie, θ, afhangt van het punt x in de ruimtetijd. Soortgelijke locale ijktransformaties bepalen ook de structuur van de sterke en zwakke wisselwerkingen. De extra complicatie is, dat dan de symmetrietransformaties door meer dan ´e´en parameter worden bepaald. Een van de hoofddoelen van dit college is de bij dergelijke transformaties behorende Yang-Mills theorie te introduceren, en toe te passen op de sterke en zwakke wisselwerkingen. Het graviton wordt beschreven door een tensorveld, gµν (de metrische tensor). De klassieke theorie van het zwaartekrachtsveld, de algemene relativiteitstheorie, kan ook worden opgevat als een ijktheorie, maar voor de constructie van de bijbehorende quantumtheorie moeten nog vele problemen worden overwonnen. Er zijn twee soorten materie-deeltjes. Dit zijn de leptonen, die alleen electromagnetische en zwakke wisselwerkingen hebben, en de quarks, die daarnaast ook sterk wisselwerken. In Tabel 1.2 geven we een overzicht van de eigenschappen van de nu bekende leptonen. massa (MeV/c2 ) lading (e)
deeltje
naam
levensduur
e
electron
> 1.9 × 1023 jaar
0.511
−1
µ
muon
2.197 × 10−6 sec
105.66
−1
τ
tau
0.305 × 10−12 sec
1784.1
−1
νe
electron-neutrino
stabiel?
< 7.3 × 10−6
0
νµ
muon-neutrino
stabiel?
< 0.27
0
ντ
tau-neutrino
stabiel?
< 35
0
Tabel 1.2 Leptonen en hun eigenschappen. De onzekerheid over de stabiliteit van de neutrinos hangt samen met de onzekerheid in de massa van de neutrinos. In de tabel zijn experimenteel vaststaande eigenschappen genoemd. Voor de levensduur van het electron is daarom een ondergrens gegeven. We gaan er echter van uit dat het electron en de neutrinos stabiel zijn, en de neutrinos massaloos. Al deze deeltjes heben spin-1/2, de neutrinos zijn electrisch neutraal.
5
Bij alle interacties is er sprake van behoud van leptongetal. Er zijn drie leptongetallen, Le , Lµ en Lτ . Le is gelijk aan ´e´en voor e en νe , en gelijk aan nul voor de andere leptonen. Op soortgelijke wijze zijn Lµ en Lτ gedefinieerd. Bij elk van de leptonen behoort een anti-deeltje, waarvan lading en leptongetal het tegengestelde teken hebben. Het onderscheid tussen deeltje en anti-deeltje zullen we aangeven door middel van de lading (e− en e+ ) of ook door een bar (νe en ν¯e ). Het muon en het tau-deeltje zijn instabiel. Het muon vervalt meestal als µ− → e− + ν¯e + νµ , τ − heeft een groot aantal verschillende vervalswijzen, bijvoorbeeld τ − → µ− + ν¯µ + ντ . De electrozwakke eigenschappen van de geladen leptonen zijn gelijk, alleen door hun verschil in massa zijn verschillende vervalswijzen mogelijk. Electriciteit was al bij de oude Grieken bekend, maar het was J.J. Thomson die rond de eeuwwisseling het electron ontdekte. Het muon werd in 1937 in kosmische straling ontdekt [2], terwijl het τ -deeltje in 1975 werd gevonden [3]. Het behoud van het leptongetal speelt een rol in het feit dat het vervalsproces µ → eγ (een mogelijk electromagnetisch verval) niet optreedt. Beschouw QED met alle geladen leptonen. Behoud van de afzonderlijke leptongetallen is gegarandeerd in de volgende Lagrangedichtheid: L=
X
i=e,µ,τ
ψ¯i (i(∂/ + ieA/) − mi )ψi − 14 Fµν F µν ,
waarbij ψi Dirac-spinoren zijn voor de verschillende leptonvelden. Duidelijk is dat interactie vertices tussen leptonen en foton geen overgangen van het ene lepton naar het andere bewerkstelligen. In de theorie van de zwakke interacties werkt een soortgelijk mechanisme. In Tabel 1.3 geven we een lijst van de zes quarks. De ontdekking van de topquark vond plaats in 1994: overigens lagen alle eigenschappen van dit deeltje (behalve de massa) al geheel vast door de structuur van de theorie van de zwakke wisselwerkingen. Merk op dat zowel de leptonen als de quarks een duidelijke generatie-structuur hebben: zo vormen (e, νe ), (u, d) de eerste generatie, etc. Voor de structuur van de stabiele materie waar we in het dagelijks leven mee te maken hebben speelt aleen de eerste generatie een rol. Quarks zijn de bouwstenen van de hadronen, de deeltjes met sterke wisselwerking die we in het laboratorium waarnemen. Het baryongetal van de quarks geeft een onderscheid tussen twee soorten hadronen: de baryonen, opgebouwd uit drie quarks, met baryongetal ´e´en, en de mesonen, bestaand uit een quark en een anti-quark, met baryongetal nul. De quarks zelf komen niet als vrije deeltjes voor.
6
Deze, en andere eigenschappen van quarks worden beschreven door de theorie van de sterke interacties tussen quarks, door middel van uitwisseling van gluonen: de quantumchromodynamica (QCD). Belangrijk is dat de sterke interacties het soort quark (de flavour) behouden, net als de electromagnetische interacties het soort lepton behouden. massa (MeV/c2 )
lading (e)
up
350
2/3
d
down
350
−1/3
c
charm
1500
2/3
s
strange
500
−1/3
t
top
174000
2/3
b
bottom
4500
−1/3
deeltje
naam
u
Tabel 1.3 Quarks en hun eigenschappen. Alle quarks hebben spin 1/2 en baryongetal 1/3. Anti-quarks hebben tegengestelde lading en baryongetal. De “standaard”-deeltjes (p, n, pionen, . . .) bestaan uit u- end d-quarks: ¯ π − = (¯ ¯ . p = (uud), n = (udd), π + = (ud), ud), π 0 = (¯ uu), (dd) In de jaren vijftig werden “vreemde” deeltjes ontdekt, zoals het Λ-baryon en het Kmeson. De Λ- en K-deeltjes bevatten een nieuw type quark, de s-quark. Aangezien de sterke interacties het type quark behouden, kunnen de Λ- en K-deeltjes alleen via zwakke interacties vervallen in lichtere deeltjes: K ± → µν, π ± π 0 , . . . ; Λ0 → pπ − , nπ 0 , . . . , waarbij dan vreemdheid niet behouden is. Later (1974) [4, 5] is nog een nieuw type quark ontdekt (charm), en kort daarna (1977) de b-quark [6]. In 1994 is de al lang voorspelde top-quark (waarschijnlijk) ontdekt [46]. De wereld van de elementaire deeltjes is dus betrekkelijk overzichtelijk. Er zijn een klein aantal elementaire deeltjes (ijkdeeltjes, leptonen en quarks) waarvan de dynamica wordt beschreven door het standaard model (Glashow, Salam, Weinberg (GSW) model). Een belangrijk gedeelte van dit college zal dan ook besteed worden aan de structuur en de eigenschappen van dit model. We zullen dan ontdekken dat er toch nog veel vrije parameters zijn in het GSW-model, en een aantal onzekere punten. We zullen daarom aan het eind van dit college ook uitbreidingen van het GSW-model, zoals Grand Unified Theories, bespreken.
7
In dit college volgen we in grote lijnen de aanpak van het boek van Cheng en Li [7]. Daarnaast verwijzen we regelmatig naar andere literatuur, zoals originele artikelen, overzichtsartikelen en boeken. Een aantal van de belangrijkste artikelen op dit gebied zijn verzameld in [8, 9]. Het boek van Cheng en Li [7] bevat tevens een uitgebreide bibliografie. Het is van belang om bij dit college enig idee te hebben van de fenomenologische aspecten van de elementaire deeltjes. Dat begint noodzakelijkerwijze met een blik in een tabel waarin massas, levensduren, vervalswijzen en quantumgetallen zijn opgenomen. Een dergelijke tabel wordt jaarlijks uitgebracht [10]. Het is zeer nuttig om deze tabel te leren gebruiken. De belangrijkste artikelen over de experimentele elementaire deeltjes fysica zijn herdrukt in [11]. Daarin zijn de originele publicaties over de ontdekking van de belangrijkste elementaire deeltjes te vinden, met deskundig commentaar. In dit collegedictaat kiezen we onze eenheden steeds zo, dat h ¯ = c = 1.
8
2
Symmetrie
De symmetrie-eigenschappen van veldentheoretische modellen spelen in de elementaire deeltjesfysica een belangrijke rol. In de quantumveldentheorie zijn we al een aantal fundamentele symmetrie¨en tegengekomen, zoals de ruimtetijd-symmetrie¨en (translaties en Lorentz-transformaties) en de ijktransformaties in QED. De eerste twee zijn voorbeelden van co¨ordinaattransformaties: xµ → xµ + aµ xµ → Λµν xν
(translaties) , met Λµν Λρσ gµρ = gνσ
(Lorentz) .
(2.1)
De aanwezigheid van deze symmetrie¨en vertelt ons dat we geen onderscheid kunnen maken tussen experimenten die alleen verschillen door een verschuiving in de ruimtetijd en/of door een Lorentz-transformatie. In de theorie bereiken we dit door ervoor te zorgen dat de bewegingsvergelijkingen van de theorie covariant zijn onder deze transformaties, d.w.z. dezelfde vorm aannemen in getransformeerde co¨ordinatenstelsels. In dit hoofdstuk ligt de nadruk op de zogenaamde interne symmetrie¨en, d.w.z. symmetrie¨en die de co¨ordinaten van de ruimtetijd punten ongemoeid laten. We onderscheiden dan globale symmetrie¨en, waarbij de parameters van de transformatie constant in ruimte en tijd zijn, en locale symmetrie¨en, waarbij de parameters van het ruimtetijd punt mogen afhangen. Om een aantal begrippen (nogmaals) te introduceren beginnen we met een voorbeeld van globale symmetrie, daarna bekijken we locale symmetrie in de quantumelectrodynamica. Tenslotte introduceren we locale symmetrie geassocieerd met een niet-abelse groep, de zogenaamde Yang-Mills symmetrie. De hier behandelde symmetrie-transformaties vormen een groep. De groepentheorie speelt dan ook een belangrijke rol in dit deel van elementaire deeltjes fysica. Een aantal aspecten van de groepentheorie wordt behandeld in Appendix A. Voor een uitgebreider overzicht zie bijvoorbeeld [7], hoofdstuk 4. Referenties naar boeken over groepentheorie in de elementaire deeltjes fysica zijn te vinden in [7], Bibliography. 2.1
N re¨ ele scalaire velden
Voor het re¨ele scalaire veld is de Lagrangedichtheid L = 21 (∂µ φ)(∂ µ φ) − 12 m2 φ2 ,
(2.2)
waaruit als bewegingsvergelijking de Klein-Gordon vergelijking volgt: ∂L ∂L − ∂µ → (u t + m2 )φ = 0 , ∂φ ∂(∂µ φ)
9
(u t = ∂µ ∂ µ ) .
(2.3)
Het veld φ is een scalair veld, hetgeen een bepaald transformatie gedrag impliceert onder ruimtetijd-transformaties. In een ander co¨ordinatenstelsel zal gelden: (u t 0 + m2 )φ0 (x0 ) = 0 .
(2.4)
Aangezien u t0 = u t , zowel onder translaties als Lorentztransformaties, is deze vergelijking alleen covariant als geldt: φ0 (x0 ) = φ(x) ,
(2.5)
of ook wel, voor infinitesimale transformaties: x0 = x + δx ⇒ φ0 (x) = φ(x) − δxµ ∂µ φ ⇒ δφ(x) = −δxµ ∂µ φ .
(2.6)
Dit is (per definitie) het transformatie-karakter van een scalair veld . Gecompliceerdere veldvergelijkingen (Dirac, Maxwell voor spin-1/2, spin-1 velden) vereisen een ander transformatiekarakter: dat van een spinor-veld resp. vectorveld. Interne symmetrie¨en spelen in het geval van ´e´en scalair veld geen rol. We breiden de discussie daarom uit tot het geval van N re¨ele scalaire velden. De Lagrangedichtheid is dan: L = 21 ∂µ φi ∂ µ φi − 12 m2 φi φi ,
(2.7)
waarbij gesommeerd wordt over de index i (i = 1, . . . , N). De actie is invariant onder: φ0i = Oij φj , (2.8) als de re¨ele matrix O voldoet aan O −1 = O T . Dergelijke matrices noemen we orthogonaal. Voor matrices O die maar infinitesimaal van de eenheidsmatrix verschillen kunnen we schrijven: O = I − ia Ta , (2.9)
waarbij a re¨ele infinitesimale parameters zijn, en Ta N × N matrices. Vanwege O −1 = O T geldt: I + ia Ta = I − ia (Ta )T , (2.10)
dus Ta moet imaginair (φi en a zijn re¨eel!) en anti-symmetrisch zijn. Er zijn 1 N(N −1) onafhankelijke anti-symmetrische matrices, en dus 21 N(N −1) onafhanke2 lijke parameters a : a = 1, . . . , 21 N(N − 1). Deze transformaties vormen een groep, de rotatiegroep in N dimensies: O(N). De anti-symmetrische matrices Ta noemen we de generatoren van O(N), deze matrices vormen een lineaire ruimte, die we de Lie-algebra van de groep noemen. Voor details zie Appendix A.
10
Bij elke continue symmetrie van de actie hoort een stroom en een behouden lading. Wat is de stroom in dit geval? Beschouw infinitesimale transformaties, δφi ≡ φ0i (x) − φi (x) = −ia (Ta )ij φj .
(2.11)
Dan geldt: #
"
∂L ∂L δφi + δ∂µ φi 0 = δS = dx ∂φi ∂(∂µ φi) " !# Z ∂L ∂L ∂L 4 = dx δφi − ∂µ δφi + ∂µ δφi . ∂φi ∂(∂µ φi ) ∂(∂µ φi ) Z
4
(2.12)
Als de velden voldoen aan de bewegingsvergelijkingen volgt hieruit: ∂µ
"
#
"
#
∂L ∂L δφi = 0 ⇒ ∂µ (−ia (Ta )ij φj ) = 0 , ∂(∂µ φi ) ∂(∂µ φi )
(2.13)
met andere woorden (a willekeurig): ∂µ
"
#
∂L (−i(Ta )ij φj ) = ∂µ jaµ = 0. ∂(∂µ φi )
(2.14)
We zien dat voor iedere onafhankelijke parameter (elke generator T ) er een een behouden grootheid is. Met het model (2.7) model corresponderen dus 21 N(N − 1) behouden grootheden: Qa ≡
Z
d3 x ja0
= −i = −i
Z
Z
d3 x
∂L (Ta )ij φj ∂(∂0 φi )
d3 x πi (Ta )ij φj ,
(2.15)
waarbij πi de kanonieke impuls is behorend bij de co¨ordinaat φ. De Ta voldoen aan commutatie-relaties die de groepsstructuur weerspiegelen (zie Appendix A): [Ta , Tb ] = ifab c Tc , (2.16) waarbij fab c de structuurconstanten van de groep genoemd worden. Tot nog toe hebben we eigenlijk alleen naar de klassieke veldentheorie gekeken. We beschouwen nu op de gebruikelijke manier de velden φi als operatoren, die met de kanonieke impulsen πi voldoen aan de gebruikelijke gelijketijds commutatierelaties: →
→
→
→
[φi (t, x), πj (t, y )] = iδij δ( x − y ) , → → → → [φi (t, x), φj (t, y )] = [πi (t, x), πj (t, y )] = 0 .
11
(2.17)
De commutatie-relaties tussen de Ta impliceren nu commutatie-relaties tussen de behouden ladingen: [Qa , Qb ] = − = −
Z
Z
= −i =
Z
Z
d3 x 3
dx
Z
Z
d3 y [πi (x)(Ta )ij φj (x), πk (y)(Tb)kl φl (y)] d3 y [πi (x)(Ta )ij [φj (x), πk (y)](Tb)kl φl (y) +πk (y)(Tb )kl [πi (x), φl (y)](Ta )ij φj (x)]
d3 x [πi (x)(Ta Tb )il φl (x) − πk (x)(Tb Ta )kj φj (x)]
d3 x π(x)fab c Tc φ(x)
= ifab c Qc .
(2.18)
We zien dat de behouden ladingen de structuur van de groep van orthogonale matrices respecteren. Ze voldoen aan dezelfde commutatie-relaties als de generatoren Ta , en genereren dus een representatie van de groep. De Qa zijn operatoren die werken op de Fock-ruimte, de ruimte opgespannen door de toestanden met n deeltjes met gegeven impulsen, de bijbehorende representatie van de groep wordt ook wel de Fock-ruimte representatie genoemd. Op de velden werken de Qa als: ia [Qa , φi(x)] = −ia (Ta )ij φj (x) = δφi .
(2.19)
Deze transformatie van de veldoperatoren is de infinitesimale versie van φ0i = Uφi U −1
met U = exp(ia Qa ) .
(2.20)
De unitaire operatoren U zijn elementen van de Fock-ruimte representatie van de groep. We hebben gevonden dat uit een continue symmetrie een stroom, een behouden lading, en dus een unitaire representatie van de groep op de Fock-ruimte volgt. We kunnen nu aantonen dat, als de grondtoestand |0i invariant is onder de symmetrie transformaties, de overgangswaarschijnlijkheden ook invariant zijn. We zien dan immers: h0|φ0i1 (x1 ) . . . φ0in (xn )|0i = < 0|Uφi1 (x1 )U −1 . . . Uφin (xn )U −1 |0i = h0|φi1 (x1 ) . . . φin (xn )|0i .
(2.21)
De continue symmetrie van de actie heeft dus directe consequenties voor de overgangswaarschijnlijkheden.
12
2.2
Locale symmetrie in QED
Quantumelectrodynamica is gebaseerd op de Dirac-theorie voor spin-1/2 velden, en op de Maxwell theorie voor het electromagnetisch veld. De Lagrangedichtheid voor het vrije Dirac veld en voor het vrije electromagnetische veld luiden: ¯ µ ∂µ − m)ψ , LDirac = ψ(iγ LMaxwell = − 41 Fµν F µν ,
(2.22) (2.23)
Fµν = ∂µ Aν − ∂µ Aν .
(2.24)
met De bewegingsvergelijkingen die uit (2.22,2.23) volgen zijn (i∂/ − m)ψ = 0 , ∂µ F µν = 0 .
(2.25) (2.26)
De bijbehorende acties zijn invariant onder de volgende transformaties (naast de gebruikelijke translaties en Lorentz-transformaties): ψ(x) → ψ 0 (x) = exp(iθ)ψ(x) , ¯ ¯ , ψ(x) → ψ¯0 (x) = exp(−iθ)ψ(x) Aµ (x) → A0µ (x) = Aµ (x) + ∂µ Λ(x) .
(2.27) (2.28)
De transformatie van ψ is een globale transformatie. Net als in de vorige sectie kunnen we een stroom en een behouden lading vinden: ¯ µ ψ, j µ = −ψγ
Q=
Z
d3 x j 0 (x) .
(2.29)
Als ψ voldoet aan de Dirac vergelijking geldt ∂µ j µ = 0, en is de lading Q onafhankelijk van de tijd. Q is zo gekozen dat een ´e´en-deeltjes toestand als eigenwaarde van Q −1 heeft (de lading van het electron in eenheden e). Dit implicert tevens dat [Q, ψ] = ψ. De ijkinvariantie van (2.23) is een gevolg van het feit dat we de klassieke fysische variabelen, het electrisch en magnetisch veld, hebben uitgedrukt in Aµ . Dit lost ´e´en van de Maxwell vergelijkingen op, namelijk ∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν = 0 ,
(2.30)
maar het feit dat de oplossing niet uniek is geeft dan aanleiding tot de invariantie onder de ijktransformatie (2.28). Als we interacties willen introduceren verandert de situatie. De ijkinvariantie van het electromagnetisch veld moeten we handhaven. Deze speelt een belangrijke
13
rol bij de quantisatie van Aµ , en zonder ijkinvariantie zouden niet slechts de twee gebruikelijke transversale vrijheidsgraden van het Maxwell veld vinden. De volgende procedure leidt tot een theorie met locale ijkinvariantie waarin het Dirac veld wisselwerkt met een vectorveld, dat we vervolgens kunnen identificeren met het Maxwell veld. In de eerste plaats maken we de transformaties van het veld ψ locaal, dus: ψ 0 = exp(iθ(x))ψ . (2.31) We willen nu dat (2.22) invariant wordt onder (2.31). Dit kunnen we bewerkstelligen door een zogenaamde covariante afgeleide in te voeren, Dµ , die de eigenschap heeft dat Dµ ψ op dezelfde wijze transformeert als ψ: (Dµ ψ)0 = exp(iθ(x))Dµ ψ .
(2.32)
¯ µ Dµ − m)ψ triviaal invariant onder de locale transforIn dat geval is L = ψ(iγ maties (2.31). De eigenschap (2.32) vereist het invoeren van een veld in Dµ dat transformeert met een term ∂µ θ(x). We nemen: Dµ ψ ≡ (∂µ + ieAµ )ψ ,
(2.33)
en bepalen de transformatieregel van Aµ . Dus: (∂µ + ieA0µ ) exp(iθ(x))ψ = exp(iθ(x))(∂µ + i(∂µ θ) + ieA0µ )ψ = exp(iθ(x))(∂µ + ieAµ )ψ , waaraan we voldoen door te kiezen 1 A0µ = Aµ − ∂µ θ(x) . e
(2.34)
De gevonden transformatie van het veld Aµ is dus precies die van het ijkveld van de Maxwell vergelijkingen. Daarmee hebben we een ijkinvariante interactie gevonden tussen het Dirac-veld en een vectorveld. Voor het vectorveld kunnen we nu als kinetische term (2.23) toevoegen. Dat levert ¯ µ (∂µ + ieAµ ) − m)ψ − 1 Fµν F µν , L = ψ(iγ 4
(2.35)
de Lagrangedichtheid van de quantumelectrodynamica. De constante e hebben we nu iets anders ingevoerd dan bij het college Quantumveldentheorie, dit kunnen we gemakkelijk herstellen door de parameter θ te herschalen. Merk op dat de interactieterm van de vorm ej µ Aµ is. Op dit punt komen we in sectie (2.4) terug. De bewegingsvergelijking van ψ¯ levert de Dirac-vergelijking met een covariante afgeleide: (iγ µ (∂µ + ieAµ ) − m)ψ = 0 , (2.36) 14
terwijl de bewegingsvergelijking van ψ de volgende vergelijking geeft: ¯ ¯ µ 0 = ψ(−eA / − m) − i(∂µ ψ)γ ¯ µ − mψ¯ = −i(∂µ − ieAµ )ψγ ¯ µ + mψ) ¯ . = −(iDµ ψγ
(2.37)
Deze bewegingsvergelijkingen zijn natuurlijk invariant onder ijktransformaties. Merk op dat de covariante afgeleide op ψ¯ een andere vorm heeft dan die op ψ. Dit is een gevolg van het feit dat ψ en ψ¯ verschillend transformeren onder ijktransformaties (zie (2.27)). De covariante afgeleide is gedefinieerd als afgeleide die, werkend op een veld met een zeker transformatiekarakter, op dezelfde wijze transformeert als dat veld. De hier gebruikte methode om een ijkinvariante actie af te leiden zullen we in de volgende sectie generaliseren naar een niet-abelse transformatiegroep. 2.3
Yang-Mills theorie
We zullen Yang-Mills theorie invoeren aan de hand van een voorbeeld. We beginnen met de Lagrangedichtheid voor N fermionvelden: L = ψ¯i (iγ µ ∂µ − m)ψi .
(2.38)
Deze Lagrangedichtheid is invariant onder de volgende globale symmetrie: ψi → ψi0 = Uij ψj
(2.39)
met UU † = U † U = I. De matrices U vormen de groep U(N) van N × N unitaire matrices. Voor infinitesimale transformaties geldt nu U = I − ia (Ta )ij → δψi = −ia (Ta )ij ψj ,
(2.40)
waarbij de matrices Ta hermitisch moeten zijn. Er zijn in dit geval N 2 parameters a . De bijbehorende stromen zijn: jaµ = ψ¯i γ µ (Ta )ij ψj .
(2.41)
Dit is dus geheel analoog aan wat we in sectie (2.1) besproken hebben, met het verschil dat we nu met N complexe velden te maken hebben. We willen nu, net als in het geval van QED de symmetrie uitbreiden tot een locale symmetrie1 . In QED hebben we dit gedaan door de globale symmetrie van 1
Het voorbeeld dat Yang en Mills [12] in gedachten hadden was isospin symmetrie. Dit is een symmetrie van de sterke interacties in de atoomkern. Deze interacties tussen protonen en
15
(2.22) uit te breiden tot een locale symmetrie. We gaan nu op dezelfde wijze te werk. We zoeken dus een covariante afgeleide, van de vorm Dµ = ∂µ − igAaµ Ta ,
(2.42)
die, werkend op ψ, net zo transformeert als ψ zelf: (Dµ ψ)0 = U(Dµ ψ) .
(2.43)
We gaan er hierbij al van uit dat nu meer dan ´e´en ijkveld nodig zal zijn. De transformatiegroep heeft nu immers N 2 parameters, en de afleiding bij QED suggereert dat voor elke parameter, of elke generator van de groep, een ijkveld nodig is. Hoe moet Aµ nu transformeren? We eisen dat (Dµ ψ)0 = ∂µ (Uψ) − igA0µ · T Uψ = (∂µ U)ψ + U∂µ ψ − igA0µ · T Uψ = U(∂µ ψ − igAµ · T ψ) ,
(2.44)
waarbij we de notatie Aµ · T = Aaµ Ta gebruiken. Dus: 0 = (∂µ U)ψ − igA0µ · T Uψ + igUAµ · T ψ
= (−igA0µ · T + igUAµ · T U −1 + (∂µ U)U −1 )Uψ ,
(2.45)
zodat voor de getransformeerde ijkvelden moet gelden: i A0µ · T = UAµ · T U −1 − (∂µ U)U −1 . g
(2.46)
Als N = 1 krijgen we met T = I en g = e hetzelfde resultaat als bij QED. Voor infinitesimale transformaties U = I − ia Ta geldt 1 δA0µ · T = −ia [Ta , Aµ · T ] − (∂µ a )Ta g 1 = a Abµ fab c Tc − (∂µ c )Tc , g
(2.47)
zodat 1 δAcµ = a Abµ fab c − ∂µ c . g
(2.48)
neutronen zijn (vrijwel) ladingsonafhankelijk, zodat er een symmetrie optreedt waardoor proton en neutron in elkaar worden overgevoerd. Deze SU (2) symmetrie is globaal, als in ´e´en punt in de ruimtetijd wordt vastgelegd welk kerndeeltje een proton is, dan is er geen vrijheid om in andere ruimtetijd punten een andere keuze te maken. Yang en Mills wilden, naar analogie van QED, nagaan of er ook zoiets als locale isospin symmetrie gedefinieerd kon worden. Achteraf blijkt er in de natuur geen locale isospin symmetrie te zijn, maar het formalisme kon onveranderd worden overgenomen voor andere situaties.
16
Het is nuttig hier nu onderscheid te maken tussen de groepen U(N) en SU(N). Het verschil is een fase-transformatie, ofwel een U(1)-groep. Voor deze ondergroep van U(N) is de structuurconstante gelijk aan nul, en treedt alleen de tweede term in (2.46) en (2.48) op. De structuurconstanten zijn de matrix-elementen van de geadjungeerde representatie (A.13) (ta )cb = ifabc . (2.49) De matrices ta voldoen aan de commutatierelaties van SU(N). Vergelijking (2.48) is nu te schrijven als: 1 δAcµ = −ia (ta )c b Abµ − ∂µ c . (2.50) g We concluderen dat onder globale transformaties de ijkvelden transformeren volgens de geadjungeerde representatie. Het aantal ijkvelden is gelijk aan de dimensie van de groep. De generalisatie van de U(1) symmetrie in QED naar U(N) symmetrie geeft dus voor het fermiongedeelte van de Lagrangedichtheid: L = ψ¯i iγ µ (∂µ δij − igAaµ (Ta )ij )ψj − mψ¯i ψi .
(2.51)
We hebben nu nog geen kinetische term voor de ijkvelden gevonden. In QED is deze term − 41 Fµν F µν met Fµν als in (2.24 De generalisatie naar niet-abelse symmetriegroepen gaat als volgt. We beginnen met (2.43), de defini¨erende eigenschap van de covariante afgeleide. Dan geldt ook: (Dµ (Dν ψ))0 = UDµ (Dν ψ) .
(2.52)
Laten we nu kijken naar: Dµ (Dν ψ) − Dν (Dµ ψ) = (∂µ − igAµ · T )(∂ν − igAν · T )ψ − (µ ↔ ν) = ∂µ ∂ν ψ − ig∂µ Aν · T ψ − igAν · T ∂µ ψ −igAµ · T ∂ν ψ − g 2 Aµ · T Aν · T − (µ ↔ ν) = −ig(∂µ Aν − ∂ν Aµ ) · T − g 2 [Aµ · T, Aν · T ]ψ ≡ −igFµν · T ψ (2.53) met: Fµν · T = (∂µ Aν − ∂ν Aµ ) · T − ig[Aµ · T, Aν · T ] .
(2.54)
Verder geldt vanwege (2.52):
(Dµ (Dν ψ) − Dν (Dµ ψ))0 = U(Dµ (Dν ψ) − Dν (Dµ ψ)) = U(−igFµν · T ψ) 0 · T ψ0 . = −igFµν 17
(2.55)
Dit geeft: 0 Fµν · T = UFµν · T U −1 .
(2.56)
De gevonden generalisatie van de electromagnetische veldsterktetensor transformeert dus volgens de geadjungeerde representatie van de groep SU(N), en is invariant onder de groep U(1). We zien nu dat: 0 tr Fµν · T F 0µν · T = tr UFµν · T F µν · T U −1 = tr Fµν · T F µν · T .
(2.57)
Dus trFµν F µν is invariant onder locale ijktransformaties, en is geschikt als kinetische term voor de Yang-Mills ijkvelden. We kunnen het spoor nog herschrijven door in te voeren: a Fµν · T = Fµν Ta = (∂µ Aaν − ∂ν Aaµ + gfbc a Abµ Acν )Ta . (2.58) Kiezen we de basis van de generatoren nu zo, dat tr[Ta Tb ] ∼ δab , dan geldt: a a trFµν · T F µν · T = trFµν F µνb Ta Tb ∼ Fµν F µνa .
(2.59)
Dit geeft ons de totale Lagrangedichtheid: a L = iψ¯i γ µ (∂µ δij − igAaµ (Ta )ij )ψj − mψ¯i ψi − 41 Fµν F µνa .
(2.60)
Dit is het prototype van een niet-abelse ijktheorie, ook wel Yang-Mills theorie genoemd. Ook van het eerder behandelde model van scalaire velden met O(N) invariantie kan een Yang-Mills theorie gemaakt worden. In dat geval krijgen we: a L = − 14 Fµν F µνa + 21 (Dµ φ)i (D µ φ)i − 21 m2 φi φi ,
(2.61)
a waarbij nu Fµν de structuurconstanten van O(N) bevat en Dµ φ gegeven wordt door: Dµ φi = [∂µ δij − igAaµ (Ta )ij ]φj , (2.62)
met Ta de generatoren van O(N). Het aantal ijkvelden is weer gelijk aan de dimensie van de groep. 2.4
Locale ijkinvariantie en de stroom
Laten we even teruggaan naar de sectie (2.2) over QED. We hebben daar gevonden dat de interactieterm tussen fermionen en fotonen gelijk is aan eAµ j µ . Kunnen we meer in het algemeen begrijpen dat een dergelijke bijdrage in de interactieterm moet voorkomen?
18
Beschouw daartoe het model van sectie (2.1). De actie (2.7) is invariant onder de globale transformaties (2.11). Als we nu een transformatie (2.11) in (2.7) uitvoeren met een x-afhankelijke parameter a , wat gebeurt dan? We vinden: ∂L ∂L δφi + δ∂µ φi ∂φi ∂(∂µ φi) ∂L ∂L (Ta )ij φj − ia (Ta )ij ∂µ φj = −ia ∂φi ∂(∂µ φi ) ∂L +(∂µ a ) (−i(Ta )ij φj ) . ∂(∂µ φi )
δL =
(2.63)
De eerste twee termen zijn samen gelijk aan nul omdat de Lagrangedichtheid invariant is onder globale transformaties. Ze hangen niet van ∂µ a af. De laatste term blijft over, en kan geschreven worden als: δL = (∂µ a )jaµ .
(2.64)
Willen we nu, uitgaande van (2.7), een actie construeren die invariant is onder locale transformaties, dan moeten we de resterende bijdrage laten wegvallen tegen de variatie van een nieuwe term in de actie. We schrijven: L0 = (2.7) + gAaµ jaµ .
(2.65)
De variatie van L0 is nu gelijk aan δL0 = (∂µ a )jaµ + g(δAaµ )jaµ + gAaµ δjaµ .
(2.66)
We kiezen δAaµ = − g1 ∂µ a , zodat overblijft: δL0 = gAaµ δjaµ .
(2.67)
In het geval dat de stroom zelf invariant is onder locale ijktransformaties, is nu dus al δL0 gelijk aan nul, en is de constructie klaar. In het geval dat jaµ niet invariant is, zijn we nog niet klaar, en moeten nog termen aan de actie en/of aan de transformatie van Aaµ worden toegevoegd. Merk op dat de resterende variatie van L0 evenredig met g is. De procedure is systematisch in de zin dat er een ontwikkeling in g van de actie en van de transformaties ontstaat. In het geval van QED is de stroom invariant, hetgeen verklaart waarom de volledige interactieterm daar gegeven wordt door eAµ j µ . In het geval van het voorbeeld van sectie (2.1), en ook in dat van sectie (2.3), is de stroom niet invariant, en moeten we de procedure voortzetten. Dit leidt dan tot de resultaten die in sectie (2.3) worden gegeven.
19
3
Zwakke interacties
Voordat we nu onze kennis van Yang-Mills theorie gaan gebruiken voor de constructie van een ijktheorie voor de zwakke interacties, zullen we eerst in dit hoofdstuk wat algemene opmerkingen over de zwakke interacties maken. 3.1
Het zwakke verval het muon en het V-A model
Zwakke interacties zijn ontdekt bij vervalsprocessen. In eerste instantie betrof dat vervalsprocessen in de kern waarvoor vaak het zwakke verval van het neutron verantwoordelijk is: n → p + e + ν¯e .
(3.1)
Neutron en proton zijn opgebouwd uit quarks, en om de complicaties ten gevolge van samengestelde deeltjes te vermijden is het verstandig de zwakke interacties te introduceren aan de hand van processen met alleen leptonen. Een geschikt proces is het verval van het muon: µ− → e− + ν¯e + νµ . Beschouw eerst de kinematica van dit proces. betekent voor een muon in rust:
(3.2)
Behoud van impuls en energie
mµ = Ee + Eν¯ + Eν → → → 0 = p e + p ν¯ + p ν
(3.3)
We verwaarlozen nu de electronmassa ten opzichte van de muonmassa. Dan geldt: →
→
→
Ee2 = (pe )2 = ( p ν¯ + p ν )2 = Eν2 + Eν¯2 + 2Eν Eν¯ cos α,
(3.4)
waarbij α de hoek tussen de neutrino-impulsen is. De energie van het electron is maximaal als α = 0. Deze is dan gelijk aan: (Ee )max = Eν + Eν¯ = 21 mµ ,
(3.5)
zodat het electron hoogstens een energie gelijk aan de halve muon-massa kan meenemen. Zwakke interacties werden voor het eerst in een veldentheoretisch model beschreven door Fermi. Hij veronderstelde dat de interactie tussen de leptonen een interactie tussen twee stromen was, van de vorm: GF LF = − √ j µ† jµ . 2
20
(3.6)
De vorm van de stroom j µ is in de loop der jaren aangepast aan veranderende inzichten. De definitieve versie is gelijk aan [15]: j λ = ψ¯e γ λ (1 − γ5 )ψνe + ψ¯µ γ λ (1 − γ5 )ψνµ .
(3.7)
Hier is γ 5 = iγ 0 γ 1 γ 2 γ 3 . In (3.6) is GF een constante met dimensie massa−2 . GF is ongeveer gelijk aan 10−5 /(mp )2 GeV−2 , als mp de massa van het proton in GeV is. De voor het muonverval relevante bijdrage aan (3.6) is dan: GF L ∼ √ [ψ¯e γ λ (1 − γ5 )ψνe ψ¯νµ γλ (1 − γ5 )ψµ ] + h.c. 2 3.2
(3.8)
De zwakke interacties en pariteit
Waarom de keuze (3.7) voor de zwakke stroom? Het Fermi model, in de vorm (3.8), is een fenomenologisch model, gebaseerd op overeenkomst met het experiment. A priori is de meest algemene vier-fermion interactie voor het muonverval, die invariant is onder beperkte Lorentz transformaties, van de vorm: L∼
X
ψ¯e OI (a + bγ5 )ψνe ψ¯νµ OI ψµ + h.c.
(3.9)
I
met I = S, V, T, A, P en OI : OS OV OT OA OP
= = = = =
I γλ [γ λ , γ ρ ] γ λγ 5 γ5
scalair, vector, tensor, axiale vector, pseudoscalair.
De keuze (3.8) wordt daarom het V-A model genoemd. Zoals gezegd is (3.8) invariant onder beperkte Lorentz transformaties. Dit zijn de Lorentz transformaties die continu met de eenheid zijn verbonden. Daarnaast zijn er de pariteitstransformatie, → die de ruimtelijke co¨ordinaten xi van teken verandert, en de tijdomkeertransformatie, die x0 van teken verandert. De interactie Lagrangedichtheid (3.8) is niet invariant onder pariteitstransformaties, en de door dit model beschreven zwakke interacties behouden dus pariteit niet. Dit is in overeenstemming met de in 1956 ontdekte breking van pariteit [16, 17]. Wat breking van pariteit betekent laten we aan de hand van een voorbeeld zien. → → Onder een pariteitstransformatie gaat x0 → x0 , x → − x. Ook de richting van de impuls verandert, maar die van het impulsmoment (spin) niet. Beschouw nu het verval van een gepolariseerd muon voor (A) en na (B) een pariteitstransformatie (zie fig. 3.1).
21
Als pariteit behouden is, dan moet de eindtoestand van het pariteitsgetransformeerde proces (B) met dezelfde waarschijnlijkheid voorkomen als de eindtoestand bij (A). Dus als Γ(θ) de waarschijnlijkheid (ook wel vervalsbreedte genoemd) is voor het uitzenden van een electron onder een hoek θ, dan zou moeten gelden Γ(θ) = Γ(θ − π). Uit experimenten is gebleken dat dit niet het geval is, pariteit is dus gebroken. Het V-A model van Feynman en Gell-Mann blijkt het verval van het muon correct te beschrijven.
Figuur 3.1 Verval van een gepolariseerd muon in rust voor (A) en na (B) een pariteitstransformatie. Onder de pariteitstransformatie verandert de richting van de electronimpuls, maar de richting van de spin van het muon blijft hetzelfde. Een berekening van dit vervalsproces in het vier-fermi model levert de levensduur τµ van het muon in rust (met me = 0): (τµ )−1 =
G2F m5µ . 192π 2
(3.10)
Op dimensionele gronden hadden we al kunnen bepalen dat het resultaat evenredig moet zijn met G2F m5µ . In onze eenheden heeft een levensduur dimensie massa−1 . De amplitude voor het proces is evenredig met GF , de waarschijnlijkheid voor het proces dus met G2F . Dan moet een factor (mµ )5 voor de juiste dimensie zorgen. In hoofdstuk 1 hebben we al opgemerkt dat de verschillende generaties leptonen en quarks zich op dezelfde wijze gedragen, en een soort replica van elkaar zijn. Daarom verwachten we voor de vervalsbreedte van het τ -deeltje naar leptonen dat !5
mτ Γ(µ− → e− + ν¯e + νµ ) , Γ(τ → e + ν¯e + ντ ) = mµ Γ(τ − → e− + ν¯e + ντ ) = Γ(τ − → µ− + ν¯µ + ντ ) . −
−
De veronderstelling hierbij is dat GF de sterkte van alle zwakke processen bepaalt. Dit noemen we wel de universaliteit van de zwakke interacties. Dit is in goede overeenstemming met de experimentele gegevens. We verwaarlozen in de tweede van bovenstaande relaties de massa van het muon ten opzichte van die van τ -deeltje.
22
3.3
Het gedrag van het Fermi model bij hoge energie
Toch is het V-A model voor de zwakke stroom (3.7) (waaraan we nog een term met τ en ντ kunnen toevoegen) met de vier-fermion interactie (3.8) geen bevredigende theorie voor de zwakke interacties. Dat zien we bijvoorbeeld door te kijken naar het proces ν¯µ e− → ν¯µ e− . (3.11)
We kijken naar de werkzame doorsnede van dit proces. Deze heeft de dimensie van een oppervlakte. De amplitude voor dit proces is evenredig met GF , dus σ is evenredig met G2F . Verder bekijken we dit proces bij hoge energie, zodat we de massa van het electron ten opzichte van de neutrinoimpuls kunnen verwaarlozen. De enige dimensievolle grootheid die overblijft is dan de neutrinoimpuls. Dus moeten gelden: σ ∼ G2F | k |2 . (3.12) Dus σ neemt toe met | k |2 . Dit is in strijd met het behoud van waarschijnlijkheid. We weten dat de differenti¨ele werkzame doorsnede geschreven kan worden als: 1 dσ = | F (k, cos θ) |2 , dΩ | k |2
(3.13)
met de verstrooiingsamplitude F (k, cos θ) =
X
(2l + 1)fl (k)Pl (cos θ) .
(3.14)
l
Verder moet worden voldaan aan de unitariteitsrelatie (behoud van waarschijnlijkheid) Imfl ≥ | fl |2 (3.15)
(zie [18], blz. 384). Maar uit (3.12) blijkt dat fl (k) evenredig is met | k |2 . Bij hoge impulsen wordt dus niet meer aan (3.15) voldaan. Dit gebeurt in de beurt van | k |2 ∼ 1/GF = 105 m2p . Dus bij een energie¨en in de buurt van 300 GeV voldoet het Fermi model niet meer. Een alternatief is om de zwakke interacties te beschrijven met behulp van de uitwisseling van vector deeltjes, net zoals het electromagnetisme. Dat betekent dat we in de berekening van bijvoorbeeld het muonverval het Feynman diagram van de vier-fermion interactie vervangen door een diagram met uitwisseling van een geladen vectordeeltje, waarbij de interactiesterkte evenredig is met een dimensieloze koppelingsconstante g. We zien dat de factor GF bij de berekening van het diagram in feite wordt vervangen door de constante g 2 vermenigvuldigd met de propagator van dat veld: GF →
g2 , k 2 − M 2 + i 23
(3.16)
waarbij M de massa van het vectorveld is. Voor de vervalsbreedte betekent dat G2F
→
g2 k2 − M 2
!2
.
(3.17)
Figuur 3.2 Diagrammen voor µ-verval in de vier-fermion theorie van Fermi, en in een theorie met uitwisseling van een vector deeltje. Bij lage energie kunnen we de impuls verwaarlozen ten opzichte van M, en zien we dat g 2 2 GF → . (3.18) M Dit geeft voor het muon verval, waarbij de impulsen inderdaad klein zijn, hetzelfde resultaat geeft als de vier-fermion theorie. In een verstrooiingsproces bij energie¨en die veel groter zijn dan M moeten we echter de vervanging !2 g2 2 (3.19) GF → k2 maken. Dat betekent dan dat (3.12) zich gedraagt als 1/k 2 . De problemen die bij het Fermi model voor hoge energie ontstaan zijn daarmee opgelost. We kunnen natuurlijk voor allerlei processen tussen leptonen kijken naar het hoge-energie gedrag van de werkzame doorsnede. Als we eisen dat de werkzame doorsnede niet te snel groeit, kunnen we successievelijk alle ingredi¨enten van het GSW model achterhalen. Een dergelijke analyse is gedaan in [19, 20]. 3.4
Het massieve vectorveld
Bij de beschrijving van de zwakke interacties door middel van uitwisseling van massieve vectorvelden hebben we natuurlijk de propagator van dergelijk velden nodig.
24
De theorie van massieve vectorvelden staat bijvoorbeeld beschreven in [21]. Voor een massief vectorveld Vµ gaan we uit van de Lagrangedichtheid: 1 1 L = − Fµν F µν + m2 Vµ V µ , 4 2
(3.20)
Fµν = ∂µ Vν − ∂ν Vµ .
(3.21)
met: De massaterm in L is hier zo gekozen dat de ruimtelijke componenten positief bijdragen aan de Hamiltondichtheid. De bewegingsvergelijking is: ∂ ν (∂µ V µ ) − ∂µ ∂ µ V ν − m2 V ν = 0 .
(3.22)
∂ν V ν = 0 ,
(3.23)
Contractie met ∂ν geeft:
zodat de bewegingsvergelijking vereenvoudigd tot: u t V µ + m2 V µ = 0 .
(3.24)
Dus elk van de componenten van het vectorveld voldoet aan de Klein-Gordon vergelijking. Merk op dat de Lorentz conditie (3.23) hier een onderdeel van de bewegingsvergelijking is (als m2 6= 0 !) en niet een ijkconditie. Quantisatie, en de bepaling van de twee-puntsfunctie (propagator) verloopt het eenvoudigst in analogie met de Maxwell-theorie. Voeg een term λ(∂µ V µ )2 toe aan de actie, bepaal de propagator en neem vervolgens de limiet λ → 0. Dit geeft voor de twee-puntsfunctie: −i [
kρ kσ gρσ 1 − ]. k 2 − m2 + i m2 k 2 − m2 + i
(3.25)
De laatste term in (3.25) is evenredig met de impulsen van de propagator. In het geval dat het massieve vectorveld alleen interacties heeft van de vorm Lint ∼ Vµ j µ
met
∂µ j µ = 0 ,
(3.26)
zal deze laatste term niet bijdragen bij de berekening van diagrammen. Dan blijft effectief dus alleen de eerste term in (3.25) over. Dit is wat we gekregen zouden hebben in de limiet λ → 1.
25
4
Het GSW-model: zwakke interacties van leptonen
In de vorige sectie hebben we duidelijk gemaakt dat het invoeren van massieve vectorvelden in de theorie van de zwakke interacties onvermijdelijk is, als we zwakke processen ook bij hoge energie¨en goed willen beschrijven. Bij het invoeren van vectorvelden zullen we uitgaan van locale ijkinvariantie. Een Yang-Mills theorie voor de zwakke interacties is in de jaren zestig geconstrueerd door Glashow, Salam en Weinberg [22, 23, 24, 25]. In dit hoofdstuk zullen we het lepton gedeelte van dit model construeren. 4.1
De symmetrie van de zwakke interacties
We zullen ons beperken tot leptonen van de eerste generatie, dat wil zeggen, het electron en het electronneutrino. De zwakke stroom is dan (3.7) j µ = ψ¯ν γ µ (1 − γ 5 )ψe .
(4.1)
Laten we eerst de rol van de matrix γ 5 duidelijker maken. Omdat (γ 5 )2 = 1, kunnen we met γ 5 twee projectieoperatoren maken: P± = 21 (1 ± γ 5 ) .
(4.2)
Deze projectieoperatoren voldoen aan P+ P− = 0 , P±2 = P± , P+ + P− = I .
(4.3)
De spinoren P± ψ zijn eigenspinoren van γ 5 met eigenwaarde ±1. De gebruikelijke nomenclatuur is ψL = P− ψ, ψR = P+ ψ , (4.4) waarbij de labels L(R) voor links(rechts)-handig staan. Deze naamgeving is geinspireerd op het feit dat de richting van spin en impuls van ψL(R) volgens een linksdraaiende (rechtsdraaiende) schroefbeweging met elkaar samenhangen. Merk op dat in de zwakke stroom alleen het linkshandig deel van het electron en het neutrino voorkomt. Voor het electron speelt het rechtshandig deel wel een rol in de electromagnetische stroom, zodat voor het electron essentieel beide “handigheden” voorkomen2 . Het neutrino heeft echter alleen zwakke interacties, en dat 2
De handigheid van een fermion wordt ook wel chiraliteit genoemd. Als een fermion een specifieke chiraliteit heeft, spreken we van een chiraal fermion.
26
betekent dat het rechtshandig deel zich op geen enkele manier manifesteert3 . We zullen dan ook veronderstellen, dat het rechtshandig neutrino niet bestaat. Deze veronderstelling over het neutrino moet dan wel in overeenstemming zijn met Lorentz invariantie, met andere woorden, een spinor moet zijn handigheid behouden onder een Lorentz transformatie. Het is gemakkelijk in te zien dat de projectie-operatoren commuteren met infinitesimale Lorentz transformaties, die op fermionen de vorm S = I + 14 iµν [γµ , γν ] hebben. De eigenwaarde van γ 5 is dus invariant onder beperkte (met de eenheid verbonden) Lorentz-transformaties. Is de handigheid van een spinor ook invariant onder de dynamica van de Diracvergelijking? Dan moet gelden (i6 ∂ − m)γ 5 ψ = 0
als
(i6 ∂ − m)ψ = 0 .
(4.5)
We vinden dat (i6 ∂ − m)γ 5 ψ = −γ 5 (i6 ∂ + m)ψ ,
(4.6)
zodat alleen voor m = 0 een spinor zijn handigheid behoudt. Dit betekent dat alleen massaloze spinoren een vaste handigheid kunnen hebben. Het neutrino is inderdaad massaloos, en we kunnen dus veilig stellen dat het rechtshandig deel van het neutrino niet bestaat. Na deze lange discussie over de handigheid van fermionen kunnen we nu de ladingen behorend bij de zwakke stroom analyseren. De ladingen behorend bij (4.1) zijn: 1 2
T+ =
Z
d3 x j 0 =
T− = T+† =
Z
Z
† d3 x ψν,L ψe,L ,
† d3 x ψe,L ψν,L .
(4.7) (4.8)
Zoals we in sectie (1.1) gezien voldoen de ladingen aan dezelfde commutatierelaties als de generatoren van de symmetriegroep. We berekenen dus: [T+ , T− ] = 2 T3 , met: T3 =
1 2
Z
† † d3 x (ψν,L ψν,L − ψe,L ψe,L ) .
(4.9) (4.10)
De stromen die horen bij T± noemen we de geladen zwakke stromen4 en de stroom bij T3 de neutrale zwakke stroom. Verder is er voor de leptonen natuurlijk ook nog 3
Behalve eventueel door de zwaartekracht. Ook massaloze deeltjes hebben energie en impuls, en in de algemene relativiteitstheorie manifesteren energie- en impuls-dichtheden zich door een bijdrage aan de zwaartekracht. 4 Geladen omdat [Q, T± ] 6= 0. Deze ladingen en stromen transformeren dus onder de transformaties van het electromagnetisme, en hebben dan ook een electrische lading.
27
een behouden electrische lading: Q=−
Z
d3 x ψe† ψe = −
Z
† † d3 x (ψe,L ψe,L + ψe,R ψe,R ) ,
(4.11)
en een behouden lading die hoort bij het leptongetal Le : QL =
Z
† † † ψe,R ) . ψe,L + ψe,R ψν,L + ψe,L d3 x (ψν,L
(4.12)
De ladingen T± , T3 en Q vormen een gesloten algebra met: [T± , T3 ] = ∓T± , [T± , Q] = ∓T± , [T3 , Q] = 0 ,
(4.13)
terwijl alle ladingen commuteren met QL . We voeren nu in: Q1 Q2 Q3 Y
= 21 (T+ + T− ) , = − 12 i (T+ − T− ) , = T3 , = 2 (Q − T3 ) .
(4.14)
Deze ladingen voldoen aan: [Qa , Qb ] = iabc Qc , [Y, Qa ] = 0 ,
(4.15)
terwijl QL natuurlijk met Qa , Y commuteert. We zien dat de onderliggende structuur SU(2) × U(1) × U(1) is, met Qa de generatoren van SU(2), Y en QL die van de twee U(1) groepen. Zijn de ladingen wel behouden? Oftewel, geldt ∂µ j µ = 0 voor de bijbehorende stromen? Bij het bewijs van ladingsbehoud hebben we de Dirac vergelijking voor de fermion velden nodig, en op grond van onze discussie over chiraliteit en de Dirac vergelijking is het duidelijk dat de ladingen alleen voor me = 0 behouden zijn. We stellen daarom in eerste instantie de massa van het electron gelijk aan nul, we zullen in het volgende hoofdstuk zien hoe we op een ijkinvariante manier een electronmassa kunnen introduceren. We kunnen het kinetisch deel van de actie nu schrijven als: L = ψ¯e,L i6 ∂ ψe,L + ψ¯e,R i6 ∂ ψe,R + ψ¯ν,L i6 ∂ ψν,L .
(4.16)
We voeren nu in het doublet: ψL =
ψν ψe
28
!
, L
(4.17)
zodat (4.16) wordt:
L = ψ¯L i6 ∂ ψL + ψ¯e,R i6 ∂ ψe,R .
(4.18)
Deze notatie maakt ook de SU(2) × U(1) structuur duidelijk: in het doublet ψL werkt SU(2) en de U(1) factor Y , in het singlet (van SU(2)) ψe,R alleen Y . De eigenwaarden zijn van Y = 2(Q − T3 ) (de zwakke hyperlading) voor de verschillende deeltjes zijn: Y (eL ) = Y (νL ) = −1 ; Y (eR ) = −2 . (4.19) Alle deeltjes hebben als eigenwaarde van QL +1, alle anti-deeltjes −1.
4.2
Zwakke interacties en locale symmetrie
De actie (4.18) is invariant is onder SU(2) × U(1) × U(1) transformaties. Van een deel van deze symmetrie¨en willen we locale symmetrie¨en maken. Bij de locale symmetriegroep moet in elk geval de symmetrie gegenereerd door Q zijn, en, gezien onze ervaringen in sectie (3.3), ook de symmetrie gegenereerd door de ladingen die bij de zwakke stroom horen. QL commuteert met al deze ladingen, en kan dus afzonderlijk behandeld worden. We zullen ervoor kiezen, de SU(2) × U(1) symmetrie gegenereerd door Qa en Y locaal te maken, en het leptongetal als globale symmetrie te handhaven. De reden voor deze laatste beslissing is, dat er geen enkele aanwijzing is voor een extra kracht die werkt tussen deeltjes met hetzelfde type leptongetal. We zullen dus van SU(2) × U(1) een locale symmetrie maken door ijkvelden in te voeren. Dit gaat op de standaard manier. Voor SU(2) voeren we drie ijkvelden Aaµ in en voor U(1) ´e´en ijkveld Bµ . De leptonvelden transformeren als volgt onder infinitesimale transformaties δψL = −i~τ · ~ ψL + 21 iα ψL , δψe,R = 0 +iα ψe,R .
(4.20)
We voeren nu covariante afgeleiden in: ~ µ + 1 ig 0 Bµ )ψL , Dµ ψL = (∂µ − ig~τ · A 2 Dµ ψe,R = (∂µ + ig 0 Bµ )ψe,R .
(4.21)
Hier zijn g en g 0 onafhankelijke dimensieloze koppelingsconstanten. Het transformatiekarakter van de ijkvelden is dan af te lezen uit de resultaten in sectie (2.3). De actie met locale ijkinvariante wordt nu: L = ψ¯L iγ µ Dµ ψL + ψ¯e,R iγ µ Dµ ψe,R .
(4.22)
Naast de kinetische termen hebben we dus interactietermen tussen de leptonen en de ijkvelden: gAaµ ψ¯L γ µ τa ψL − 21 g 0 Bµ ψ¯L γ µ ψL − g 0Bµ ψ¯e,R γ µ ψe,R . 29
(4.23)
Als we dit uitschrijven dan zien we dat A1µ ± iA2µ koppelen aan de geladen zwakke stromen, en A3µ en Bµ aan neutrale stromen. We voeren nu in de velden Aµ (het foton) en Zµ (het zwakke neutrale vectorboson), die een combinatie van A3µ en Bµ moeten zijn. Daartoe gaan we uit van de neutrale bijdragen aan (4.23): ( 12 gA3µ − 12 g 0 Bµ )ψ¯ν,L γ µ ψν,L − ( 21 gA3µ + 21 g 0Bµ )ψ¯e,L γ µ ψe,L −g 0 Bµ ψ¯e,R γ µ ψe,R .
(4.24)
We weten dat het neutrino niet aan het foton koppelt, zodat moet gelden: 1 gA3µ 2 − 12 gA3µ
− 21 g 0 Bµ = c1 Zµ ,
− 21 g 0 Bµ = c2 Zµ − eAµ , −g 0 Bµ = c3 Zµ − eAµ ,
(4.25)
waarbij c1 , c2 en c3 te bepalen constanten zijn. Kijk tevens naar de kinetische termen: − 41 Fµν (A)a F µν (A)a − 41 Fµν (B)F µν (B) . (4.26)
We willen dat de normering van het foton zo is dat we − 41 Fµν F µν krijgen, en verder willen we geen koppeling (∂µ Aν )(∂ µ Z ν ), want het foton koppelt niet aan neutrale deeltjes. Dan moeten de paren (A3µ , Bµ ) en (Zµ , Aµ ) door middel van een rotatie samenhangen: A3µ = cos θZµ + sin θAµ , Bµ = − sin θZµ + cos θAµ .
(4.27)
De hoek θ heet de Weinberghoek. Vergelijking (4.25) en (4.27) geven nu: e ; c2 = −e cot 2θ ; sin 2θ e e ; g0 = . g = sin θ cos θ
c1 =
c3 = e tan θ ; (4.28)
De interactietermen (4.24), uitgewerkt in termen van Aµ en Zµ , worden dan − eAµ ψ¯e γ µ ψe e + Zµ (ψ¯ν γ µ (1 − γ 5 )ψν 4 sin θ cos θ + ψ¯e γ µ ((4 sin2 θ − 1) + γ 5 )ψe ) ,
(4.29)
waarbij we alles weer in de oorspronkelijke spinoren ψν en ψe geschreven hebben. Voor de geladen stromen hebben we de interactie: 1 g 2
ψ¯ν ψ¯e
h
i
L
γ
µ
"
0 A1µ − iA2µ 0 A1µ + iA2µ
30
#"
ψν ψe
#
.
(4.30)
We defini¨eren nu:
1 Wµ± = √ (A1µ ∓ A2µ ) 2
(4.31)
zodat (4.30) wordt in termen van Wµ± : 1 e √ (Wµ+ ψ¯ν,L γ µ ψe,L + Wµ− ψ¯e,L γ µ ψν,L ) 2 sin θ 1 e = √ (Wµ+ ψ¯ν γ µ (1 − γ 5 )ψe + Wµ− ψ¯e γ µ (1 − γ 5 )ψν ) . sin θ 2 2
(4.32)
Met (4.29) en (4.32) hebben we alle interacties tussen leptonen en ijkvelden bepaald. De bijbehorende kinetische termen voor de leptonen zijn tenslotte ψ¯e i6 ∂ ψe + 21 ψ¯ν i6 ∂ (1 − γ 5 )ψν .
(4.33)
We bekijken nu de bijdragen die alleen van de ijkvelden afhangen: − 41 Fµν (A)a F µν (A)a − 14 Fµν (B)F µν (B)
(4.34)
Fµν (A)a = ∂µ Aaν − ∂ν Aaµ + gabc Abµ Acν , Fµν (B) = ∂µ Bν − ∂ν Bµ .
(4.35)
met:
Ook dit willen we schrijven in termen van W ± , Zµ en Aµ . We herschrijven eerst: Fµν (A)1 F µν (A)1 + Fµν (A)2 F µν (A)2 = (Fµν (A)1 + iFµν (A)2 )(F µν (A)1 − iF µν (A)2 )
(4.36)
met: Fµν (A)1 + iFµν (A)2 = ∂µ (A1ν + iA2ν ) − ∂ν (A1µ + iA2µ )
+g (A2µ A3ν − A3µ A2ν ) + ig(A3µ A1ν − A1µ A3ν ) √ √ 2 (∂µ Wν− − ∂ν Wµ− ) + 2 (igA3µ Wν− − igA3ν Wµ− ) = √ ie = 2 [∂µ Wν− − ∂ν Wµ− + (cos θZµ + sin θAµ )Wν− sin θ ie (cos θZν + sin θAν )Wµ− ] − sin θ √ 2 [(∂µ + ieAµ )Wν− − (∂ν + ieAν )Wµ− = +ie cot θ(Zµ Wν− − Zν Wµ− )] . (4.37)
31
Merk op dat we keurig de covariante afgeleide voor een geladen deeltje met de lading van het electron terugvinden: daarom ook de notatie Wµ± . Verder geldt: Fµν (A)3 = cos θ(∂µ Zν − ∂ν Zµ ) + sin θ(∂µ Aµ − ∂ν Aµ ) ie − (Wµ+ Wν− − Wµ− Wν+ ) , sin θ
(4.38)
en: Fµν (B) = − sin θ(∂µ Zν − ∂ν Zµ ) + cos θ(∂µ Aν − ∂ν Aµ ) .
(4.39)
Met behulp van bovenstaande relaties schrijven we nu (4.34) uit. Het resultaat is: − − + − + + +
1 F (A)F µν (A) − 14 (∂µ Zν − ∂ν Zµ )2 4 µν 1 (Dµ Wν− − Dν Wµ− )(D µ W ν+ − D ν W µ+ ) 2 1 ie cot θ ((Dµ Wν− − Dν Wµ− )(Z µ W ν+ − Z ν W µ+ ) − h.c.) 2 1 2 e cot2 θ (Zµ Wν− − Zν Wµ− )(Z µ W ν+ − Z ν W µ+ ) 2 1 ie cot θ (∂µ Zν − ∂ν Zµ )(W µ+ W ν− − W µ− W ν+ ) 2 1 ie (∂µ Aν − ∂ν Aµ )(W µ+ W ν− − W µ− W ν+ ) 2 e2 + − − + µ+ W ν− − W µ− W ν+ ) . 2 (Wµ Wν − Wµ Wν )(W
4 sin θ
(4.40)
Hiermee hebben we nu een model dat, behalve de zwakke interacties tussen leptonen, een hele verzameling nauwkeurig voorgeschreven interacties tussen de W - en Z-bosonen en het foton beschrijft. Bovenstaande interacties kunnen triviaal worden uitgebreid tot de andere generaties leptonen.
Figuur 4.1 Feynman diagram voor het verstrooiingsproces νµ e → νµ e. Dit experiment kan gedaan worden met aan een atoom gebonden electronen. Kenmerk voor de neutrale stroom is dat in de eindtoestand geen muon voorkomt. Dit model voor de zwakke interacties van leptonen beschrijft natuurlijk in de eerste plaats de gebruikelijke zwakke interacties door de geladen stroom, zoals het muonverval (zie fig. 3.2, het vectordeeltje is het W − boson). Voor de ontdekking van het GSW-model waren alleen de geladen zwakke interacties bekend. Via de commutatierelaties tussen de ladingen van de geladen stroom hebben we gezien dat
32
het bestaan van een neutrale zwakke stroom, en het bijbehorend ijkveld, onvermijdelijk is. Er zijn ook processen waarbij all´e´en de neutrale stroom voorkomt, zoals νµ e → νµ e, een proces dat we al kort in sectie (3.3) tegenkwamen (zie fig. 4.1). Neutrale stromen werden voor het eerst ontdekt [26] in 1973, in het proces νµ N → νµ N, waarbij N voor een nucleon staat. Dit vormde een belangrijke steun in de rug van het GSW-model. Het is op grond van deze experimentele bevestiging dat aan Glashow, Salam en Weinberg in 1979 de Nobelprijs werd toegekend. In (4.40) zien we een grote verzameling drie- en vier-punts interacties tussen W en Z bosonen onderling, en met het foton. Merk nog op, dat er een interactie tussen fotonen en W -bosonen is, die niet de vorm van een gewone covariante afgeleide heeft. Dit is de term waarin Fµν (A) wisselwerkt met het W -boson. Koppelingen van Fµν (A) aan fermionen zijn niet mogelijk zonder dat een nieuwe, dimensievolle koppelingsconstante wordt ingevoerd, met geladen vectorvelden kunnen dergelijke koppelingen echter wel bestaan.
33
5
Het GSW-model: de massa van ijkvelden en fermionen
In het vorige hoofdstuk besproken model werken we met massaloze vectorvelden en massaloze leptonen. Dit was nodig om een ijkinvariant model met de bekende zwakke interacties te construeren. Massa-termen in de actie breken immers ijkinvariantie, de theorie van een massief vectorveld, L = − 41 Fµν (V )F µν (V ) + 12 m2 Vµ V µ
(5.1)
is niet ijkinvariant. We moeten dus op een ijkinvariante manier massa’s invoeren. Een methode om dat te realiseren werd in de jaren zestig ontwikkeld. Vooral de namen van Goldstone [27] en Higgs [28, 29] zijn daaraan gekoppeld, alhoewel in dezelfde periode dit mechanisme onafhankelijk ook door anderen werd ontdekt [30, 31, 32]. 5.1
De stelling van Goldstone
Er zijn tenminste twee manieren om de symmetrie van een model te breken. De eerste, vanzelfsprekende, is door het toevoegen van een niet-invariante term aan de actie. Dit wordt expliciete symmetriebreking genoemd. De tweede manier doet zich voor als de actie weliswaar invariant is, maar de grondtoestand niet. We hebben tot nu toe nog steeds verondersteld, dat de grondtoestand geannihileerd wordt door de generatoren (ladingen) van de symmetriegroep: Qa |0i = 0 ,
(5.2)
en daarop de consequenties van de symmetrie voor Green functies gebaseerd. Is aan (5.2) niet voldaan voor alle ladingen Qa , dan spreken we van spontane symmetriebreking. Een consequentie van spontane symmetriebreking ligt in de stelling van Goldstone: voor elke generator Qa die het vacuum niet annihileert, is er een massaloze toestand (een Goldstone boson) in het model aanwezig. We geven een schets van het bewijs (zie [27, 30], en ook [7], sectie (5.3)). We R gaan uit van een stroom jµ die voldoet aan ∂µ j µ = 0; Q = d3 x j 0 is de bijbehorende lading. Een veld φ transformeert onder infinitesimale transformaties gegenereerd door Q als: φ(x) → φ0 (x) = eiQ φ(x)e−iQ = φ(x) + i[Q, φ(x)] + . . .
(5.3)
Verder weten we: 0 =
Z
= ∂0 =
d3 x [∂µ j µ (x, t), φ(0)] Z
d3 x [j 0 (x, t), φ(0)] + randtermen
d [Q, φ(0)] = 0 , dt
34
(5.4)
waarbij we veronderstellen dat de randtermen nul zijn. Veronderstel nu dat Q|0i = 6 0, zodat: h0|[Q, φ(0)]|0i ≡ η 6= 0 . (5.5) Hieruit kunnen we het volgende afleiden: η =
X n
=
h0|Q|nihn|φ(0)|0i − . . .
XZ n
=
XZ n
=
XZ n
=
X n
d3 x h0|j 0 (x, t)|nihn|φ(0)|0i − . . . d3 xh0|eiP ·x j 0 (0)e−iP ·x |nihn|φ(0)|0i − . . . ~
d3 x e+iPn ·~x h0|j 0 (0)|nihn|φ(0)|0ie−iEnt − . . .
δ 3 (p~n )(2π)3 {h0|j 0(0)|nihn|φ(0)|0ie−iEnt −h0|φ(0)|nihn|j 0|0ie+iEnt } .
(5.6)
Het linkerlid is onafhankelijk van t en ongelijk aan nul. Dit kan alleen als er een intermediaire toestand |ni is met En = 0 voor p~n = 0, dus een massaloze toestand. Een klassiek voorbeeld van spontane symmetriebreking doet zich voor in het volgende veldentheoretisch model: L = 21 (∂λ σ)2 + 21 (∂λ π)2 − V (σ 2 + π 2 ) ,
(5.7)
V (x) = − 21 µ2 x + 14 λx2 .
(5.8)
met: Merk op dat, in tegenstelling tot wat we gewend zijn, het teken van de massaterm in de Lagrangedichtheid positief is. Wel is de potentiaal, voor λ > 0, van onder begrensd. Dit model heet een σ-model en is bekend als een fenomenologisch model voor"de beschrijving van π-mesonen [33]. Het model is invariant onder O(2) rotaties # σ van : π # " #" # " # " cos θ sin θ σ σ σ0 = . (5.9) → − sin θ cos θ π π0 π De potentiaal V (x) heeft een extremum voor: µ2 = v2 λ µ2 ⇒ σ2 + π2 = . λ
− 12 µ2 + 21 λx ⇒ x =
35
(5.10)
De minima corresponderen met punten op een cirkel met straal (µ2 /λ)1/2 , die aan elkaar gerelateerd zijn door O(2) rotaties. Als we een keuze maken voor ´e´en van deze punten, breken we daarmee de symmetrie. Dit is het verschijnsel dat bekend staat onder de naam spontane symmetriebreking. We kiezen: h0|σ|0i = v;
h0|π|0i = 0 .
(5.11)
Vervolgens voeren we een herdefinitie van de velden in: σ 0 = σ − v;
π0 = π ,
(5.12)
en berekenen opnieuw de lagrangedichtheid5 : L =
1 (∂ σ 0 )2 + 21 (∂λ π 0 )2 − λv 2 σ 02 2 λ −λvσ 0 (σ 02 + π 02 ) − 14 λ(σ 02 + π 02 ) .
(5.13)
√ √ We zien dat het veld σ 0 massa 2λv 2 = 2µ2 heeft, nu met het gebruikelijke teken. Het veld π 0 is massaloos, het is het Goldstone boson van het σ-model. Merk op dat de Lagrangedichtheid (5.13) nog steeds invariant is onder de transformaties (5.9), mits we deze uitdrukken in de nieuwe velden σ 0 en π 0 . Spontane symmetriebreking behoudt de symmetrie van de actie! In termen van σ 0 en π 0 geven infinitesimale transformaties (5.9): δσ 0 = θπ 0 ,
δπ 0 = −θσ 0 − θv ,
(5.14)
zodat het Goldstone boson verschoven wordt met een constante θv. De waarde van π 0 in de grondtoestand wordt door de transformaties inderdaad niet behouden. 5.2
Het Higgs-mechanisme
In veldentheoretische modellen met locale symmetrie en spontane symmetriebreking kan zich een ander verschijnsel voordoen: het Higgs-mechanisme. We zullen dit toelichten aan de hand van het volgende voorbeeld: L = (Dµ φ)∗ D µ φ + µ2 φ∗ φ − λ(φ∗ φ)2 − 41 Fµν F µν ,
(5.15)
5 Voor de berekening van de potentiaal in de nieuwe variabelen is het handig als volgt te werk te gaan:
V (x)
= V (x0 ) + (x − x0 )V 0 (x0 ) + 12 (x − x0 )2 V 00 (x0 ) = const. + 14 (x − v 2 )2 λ
= const. + 14 λ(σ 2 + π 2 − v 2 )2 λ = const. + (σ 02 + π 2 + 2vσ 0 )2 . 4
36
met: Dµ φ = (∂µ − igAµ )φ , Fµν = ∂µ Aν − ∂ν Aµ . Dit model heeft locale ijkinvariantie: φ → φ0 = e−iα(x) φ , 1 Aµ → A0µ = Aµ − ∂µ α(x) . g
(5.16)
De grondtoestand wordt bepaald door het minimum van de potentiaal. Dit ligt bij (x = φ∗ φ): q met v = µ2 /λ . x0 = 21 µ2 /λ = 21 v 2 (5.17)
Ook in dit model is dus sprake van spontane symmetriebreking. In termen van √ re¨ele velden φ1 en φ2 (φ = (φ1 + iφ2 )/ 2) kiezen we voor de grondtoestand h0|φ1|0i = v,
h0|φ2 |0i = 0 .
(5.18)
φ02 = φ2 .
(5.19)
Opnieuw herdefini¨eren we de velden: φ01 = φ1 − v,
De potentiaal ontwikkelen we net als in het vorige voorbeeld, en het lijkt er dan weer op dat φ2 een massaloos Goldstone boson wordt. De ontwikkeling van de kinetische term levert nu echter een verrassing: |Dµ φ|2 = =
+ gAµ φ2 )2 + (∂µ φ2 − gAµ φ1 )2 ) + gAµ φ02 )2 + (∂µ φ02 − gAµ φ01 )2 −2gvAµ (∂µ φ02 − gAµ φ01 ) + g 2 v 2 Aµ Aµ ) . 1 ((∂µ φ1 2 1 ((∂µ φ01 2
(5.20)
De laatste term is een massaterm voor het ijkveld Aµ ! De actie bevat echter ook een term −gvAµ ∂µ φ2 , die een interpretatie van de velden φ2 en Aµ belemmert. Daarom is het handiger de herdefinitie op een andere manier uit te voeren. In plaats van met φ1 en φ2 kunnen we φ ook als volgt parametriseren met η en ξ: iξ(x) 1 φ = √ (v + η(x)) exp v 2 1 = √ (v + η + iξ + . . .) . 2
37
!
(5.21)
Alleen voor kleine η en ξ komen de twee parametrisaties overeen. We herdefini¨eren de velden opnieuw: !
iξ(x) 1 φ0 = exp − φ = √ (v + η(x)) , v 2 1 Bµ = Aµ − ∂µ ξ(x) . gv Dit heeft de vorm van een ijktransformatie, dus vinden we:
(5.22)
!
ξ(x) Dµ (B)φ0 Dµ φ = exp +i v ! ξ 1 √ (∂µ η − igBµ (η + v)) , = exp +i v 2
(5.23)
oftewel: |Dµ φ|2 = 21 |∂µ η − igBµ (v + η)|2 .
(5.24)
De Lagrangedichtheid (5.15) wordt dan in termen van de nieuwe velden: L =
1 (∂ η)(∂ µ η) − µ2 η 2 − 41 Fµν (B)F µν (B) 2 µ + 21 g 2 v 2 Bµ B µ + 12 g 2 Bµ B µ η(2v + η) −λvη 3 − 41 λη 4 .
(5.25)
De Lagrangedichtheid (5.25) heeft de volgende opmerkelijke eigenschappen: 1. Het veld ξ is verdwenen. √ 2. η is een massief scalair veld met massa µ 2. 3. Bµ is een massief vectorveld met massa gv. Zo te zien is er geen Goldstone boson meer. Het veld Aµ had twee vrijheidsgraden (polarisatierichtingen), en de velden φ1 en φ2 elk ´e´en, in totaal waren er dus vier vrijheidsgraden. Nu hebben we een veld η en een massief vector B. Het massieve vectorveld heeft het Goldstone boson ’geabsorbeerd’ heeft en er een longitudinale polarisatierichting bij gekregen. Dit mechanisme staat bekend als het Higgs-mechanisme, en we zullen het gebruiken om massa’s in te voeren in het GSW-model. De laatste vraag is natuurlijk, wat er nu gedaan is om de stelling van Goldstone te omzeilen. In aanwezigheid van locale symmetrie en ijkvelden moeten we subtieler werken met de eigenschappen van fysische toestanden dan we in sectie (5.1) gedaan hebben. In het bijzonder moeten we het Gupta-Bleuler mechanisme toepassen, en daarmee toestanden van negatieve norm verwijderen. Toestanden met norm nul kunnen dan nog overblijven, maar dragen niet bij aan de verwachtingswaarde van observabelen. Bij het bewijs van de stelling van Goldstone is impliciet uitgegaan van de afwezigheid van toestanden met norm nul.
38
5.3
Massa in het GSW-model
We gaan nu het Higgs-mechanisme toepassen in ons model voor de zwakke en electromagnetische interacties van leptonen. Daarbij moeten we voorzichtig te werk gaan, omdat ´e´en van de vier ijkvelden, het foton, massaloos moet blijven. Dit betekent dat de symmetrie behorend bij ´e´en van de symmetriegeneratoren, Q, niet gebroken mag worden. Dus we moeten SU(2) × U(1) breken tot U(1), waarbij de ongebroken symmetrie gegenereerd wordt door Q = 21 Y + T3 . Om te beginnen moeten we het GSW-model aanvullen met scalaire velden. We kiezen een doublet van complexe scalaire velden: φ=
!
φ+ φ0
,
Y (φ) = 1 .
(5.26)
De namen van de twee componenten hangt natuurlijk samen met hun electrische lading. Als Lagrangedichtheid kiezen we Lφ = (Dµ φ)† D µ φ − V (φ) ,
(5.27)
~ µ − 1 ig 0 Bµ )φ Dµ φ = (∂µ − ig~τ · A 2
(5.28)
waarbij:
2 †
†
2
V (φ) = −µ φ φ + λ(φ φ) .
(5.29)
Bovendien voeren we een ijkinvariante koppeling tussen de leptonen en φ in: LY = fe ψ¯L φ ψR,e + h.c. .
(5.30)
Een dergelijke koppeling wordt wel een Yukawa-koppeling genoemd. Deze interactieterm is invariant onder SU(2)- en Y -transformaties. Vanwege de vorm van (5.29) treedt ook hier spontane symmetriebreking op. We kunnen voor de grondtoestand kiezen: 0
h0|φ|0i =
√1 v 2
!
.
(5.31)
We zien dat door deze keuze de symmetrie gegenereerd door Q niet gebroken wordt. We voeren de herdefinitie weer uit zoals in het vorige voorbeeld: φ(x) = U met:
−1
0 √1 (v + η) 2
(ξ)
U(ξ) = exp iξ~ · ~τ /v .
39
!
,
(5.32)
(5.33)
We parametriseren φ+ en φ0 (samen vier re¨ele velden) dus als ξi (i = 1, . . . , 3) en η. De vacuumverwachtingswaarde van ξi en η is nul. We nemen nu: 0 √1 (v + η) 2
0
φ = U(ξ)φ =
!
,
(5.34)
en herdefini¨eren de ijkvelden met dezelfde transformatie. Voor de covariante afgeleide van φ geeft dit: 0 ~0 − i g B0 ) (Dµ φ)0 = (∂µ − ig~τ · A µ 2 µ
0 √1 (v + η) 2
!
,
(5.35)
~ 0µ · ~τ = U(ξ)A ~ µ · ~τ U −1 (ξ) − i (∂µ U(ξ))U −1 (ξ) , A g 0 0 0 Bµ = Bµ , ψL = U(ξ)ψL , ψe,R = ψe,R .
(5.36)
waarbij:
We werken nu het effect van deze transformatie verder uit. Om te beginnen kijken we naar de Yukawa-interactie tussen φ en de leptonen. In termen van de geherdefini¨eerde velden wordt dit: 0 = fe ψ¯L0 φ0 ψe,R 1 1 0 0 0 0 = √ fe ψ¯e,L ψe,R η + √ vfe ψ¯e,L ψe,R + h.c. 2 2 1 1 (5.37) = √ fe ψ¯e0 ψe0 η + √ vfe ψ¯e0 ψe0 . 2 2 We zien dat er een massaterm voor het electron ontstaat, en een interactie tussen de electronen en η. De potentiaal V (φ0 ) kan worden uitgeschreven als:
LY
V (φ0 ) = µ2 η 2 + λvη 3 + 14 λη 4 .
(5.38)
We zien dat er een massaterm voor het veld η optreedt. Tenslotte de termen met de covariante afgeleide (Dµ φ)0 . Van de covariante afgeleide blijft het volgende over: (Dµ φ)
0
1 = √ 2
"
∂µ η +
1 20 ig(A10 µ − iAµ )(v + η) 2 1 0 0 1 igA30 µ (v + η) − 2 ig Bµ (v 2
+ η)
#
en in de kinetische term voor de scalaire velden levert dat: e2 0 † µ 0 2 0+ µ0− 1 (Dµ φ ) D φ = 2 (∂µ η) + (v + η)2 2 Wµ W 4 sin θ e2 (Z 0 )2 (v + η)2 . + 8 sin2 θ cos2 θ µ We geven een overzicht van het resultaat:
40
,
(5.39)
(5.40)
1. De velden ξi zijn verdwenen. √ 2. η is een re¨eel scalair veld met massa µ 2. Het veld η noemen we het Higgs boson. 3. De termen kwadratisch in het electronveld zijn nu: 1 ψ¯e i6 ∂ ψe + √ vfe ψ¯e ψe , 2
(5.41)
dus er is een electronmassa met 1 me = − √ vfe . 2
(5.42)
Het neutrino is massaloos. Er is ook een interactieterm tussen η en ψe , met koppeling: m 1 √ fe = − e . (5.43) v 2 De interactiesterkte is evenredig met de electronmassa. 4. De massa van de vectorbosonen kunnen we aflezen uit (5.40). De vorm van de massatermen is 2 MW Wµ+ W µ− + 21 MZ2 Zµ Z µ , (5.44) zodat we concluderen dat 2 MW =
1 2 2 g v 4
MZ2 =
1 2 2 v e 4
= 41 v 2 e2
1 , sin2 θ
1 . cos2 θ sin2 θ
(5.45) (5.46)
Daarmee is het gelukt zowel fermionen als ijkbosonen een massa te geven. Merk op dat onze discussie van het Higss-mechanisme en het genereren van de massa-termen zich op klassiek niveau afspeelt. Belangrijk is bijvoorbeeld of de quantumtheorie van het model dat we hier besproken hebben renormaliseerbaar is, zodat we in de storingstheorie eindige resultaten voor Green functies kunnen afleiden. Daarbij dient te worden opgemerkt, dat de veldentheorie van een massief vectorveld, met ad hoc interactietermen met andere velden, in het algemeen niet renormaliseerbaar is. Lange tijd was dit dan ook een groot bezwaar tegen het GSW model, en tevens de reden dat de artikelen van GSW in eerste instantie weinig aandacht trokken. De eerste belangrijke stap op weg naar de aanvaarding van het GSW model was het bewijs dat Yang-Mills theorie zelf, met massaloze ijkvelden, renormaliseerbaar is [34]. Vervolgens kan men concluderen, dat in het geval van spontane symmetriebreking de resulterende actie nog steeds ijkinvariant is, zodat
41
de Ward identiteiten die op grond van ijkinvariantie kunnen worden afgeleid in Yang-Mills theorie nog steeds gelden. Dit bleek voldoende om vervolgens ook de renormaliseerbaarheid van het GSW-model aan te tonen [35]. Na het bewijs van ’t Hooft werd het GSW-model in korte tijd algemeen aanvaard. Naast de theoretische discussie die we in dit hoofdstuk hebben gegeven is het natuurlijk belangrijk in te gaan op de experimentele consequenties van het GSW-model. Dat zullen we doen nadat we in het volgende hoofdstuk het model hebben uitgebreid tot de quarks.
42
6
Het GSW-model: quarks en de zwakke interacties
Naast de leptonen hebben we als elementaire deeltjes de quarks. Alle baryonen en mesonen, de sterk wisselwerkende deeltjes, zijn uit quarks opgebouwd. Daarnaast hebben deze baryonen en mesonen ook zwakke interacties, die in het GSW-model terug te voeren zijn tot de zwakke interacties van de quarks. Ter voltooiing van de structuur van het GSW-model zullen we nu eerst de zwakke interacties van quarks bespreken, en pas in een later stadium ingaan op de manier waarop de sterke interacties tot stand komen. In dit hoofdstuk zullen we de fermionen aangeven met de naam van het deeltje, dus we gebruiken uL in plaats van ψL,u , etc. 6.1
De eerste generatie
Het doel van dit hoofdstuk is het invoeren van de quarks in het GSW-model. Er zijn drie generaties quarks, te weten (u, d), (c, s) en (t, b). We zullen ons eerst tot de eerste generatie beperken. We gaan op dezelfde wijze te werk als met de leptonen, dus we veronderstellen eerst dat de quarks massaloze deeltjes zijn. We splitsen de quarkvelden weer op in een links- en rechtshandig deel. Het is een experimenteel gegeven dat in de geladen stromen alleen linkshandige componenten voorkomen. Dit betekent dat alleen het linkshandig deel van de quarkvelden onder SU(2) hoeft te transformeren. We hebben dus: " # u qL ≡ , uR , dR , (6.1) d L waarbij uR en dR singlets onder SU(2) zijn. Aangezien uiteindelijk beide quarks massief zijn, moeten we vanaf het begin beide rechtshandige componenten meenemen. Dit is het voornaamste verschil tussen de lepton- en de quark-sector van het GSW-model. De eigenwaarden van de zwakke hyperlading Y = 2 (Q − T3 ) zijn: Y (uL ) = Y (dL) = 31 ,
Y (uR ) = 34 ,
Y (dR ) = − 32 ,
(6.2)
zodat voldaan is aan Q(u) = 32 , Q(d) = − 13 . Deze ladingen volgen uit de quarkstructuur van de hadronen, we zullen hierop nog terugkomen als we de sterke interacties behandelen. We beginnen met een actie voor massaloze deeltjes: L = q¯L i6 ∂ qL + u¯R i6 ∂ uR + d¯R i6 ∂ dR .
(6.3)
Dit is invariant onder globale SU(2)×U(1) transformaties. De overgang naar locale symmetrie vereist weer het invoeren van een covariante afgeleide: ~ µ − 1 ig 0 Bµ )qL , Dµ qL = (∂µ − ig~τ · A 6 43
Dµ uR = (∂µ − 32 ig 0 Bµ )uR , Dµ dR = (∂µ + 13 ig 0 Bµ )dR .
(6.4)
Hiermee liggen de interacties tussen ijkvelden en quarks vast. ~ µ en Bµ al uitgedrukt in e, θ, W ± , Zµ en In hoofdstuk 3 hebben we g, g 0, A µ Aµ , dus voor de quarks hoeven we alleen nog maar het ´e´en en ander verder uit te werken. Na enig rekenwerk zien we dat de interactietermen van de volgende vorm zijn: +
2 e u¯γ µ uAµ 3
¯ µ dAµ − 31 e dγ
e Zµ (¯ uγ µ (1 − 38 sin2 θ − γ5 )u 4 sin θ cos θ ¯ µ (−1 + 4 sin2 θ + γ5 )d) + dγ 3 e µ ¯ µ (1 − γ5 )u W − ) . (¯ uγ (1 − γ5 )d Wµ+ + dγ + √ µ 2 2 sin θ +
(6.5)
Dit geeft de gebruikelijke interacties met het foton, een neutrale stroom, en de verwachte koppeling van het W -boson aan de geladen stroom. Het verval van het neutron kunnen we nu beschrijven met het diagram in fig. 6.1. Hier gaat ´e´en van de d-quarks in het neutron over in een u-quark, onder uitzending van een W − -boson.
Figuur 6.1
Feynman diagram voor het verval van het neutron.
Om massa’s voor de quarks te genereren zullen we weer de fermionen aan scalaire velden koppelen in de vorm van een Yukawa koppeling. De Y -eigenwaarde van het Higgs doublet is Y = +1, zodat de volgende SU(2) × U(1) invariante koppeling gemaakt kan worden: fd q¯L φ dR , (6.6) waarmee na spontane symmetriebreking het d-quark een massa krijgt. Nu moet het u-quark nog een massa krijgen. Daartoe beschouwen we het doublet φ˜ = iσ2 φ∗ .
(6.7)
Vanwege de conjungatie heeft dit Y = −1. Verder is het inderdaad een doublet onder SU(2) als φ een doublet is: φ˜0 = iσ2 (φ0 )∗ = iσ2 U ∗ φ∗ = iUσ2 φ∗
44
= U φ˜ ,
(6.8)
omdat σ2 U ∗ σ2 = U. Hier maken we dus gebruik van het feit dat voor SU(2) de representaties U en U ∗ equivalent zijn (zie Appendix A). We kunnen dus twee Yukawa termen construeren: fd q¯L φ dR + fu q¯L φ˜ uR .
(6.9)
Als we nu voor φ φ=
0 √1 (η + v) 2
!
(6.10)
nemen vinden we de volgende massa- en interactietermen voor de quarks: η ¯ + fu u¯u) + √1 v (fd dd ¯ + fu u¯u) , √ (fd dd 2 2
(6.11)
op dezelfde wijze als bij de leptonen. Voor de massa’s van de quarks vinden we dus vfq mq = − √ , 2
(6.12)
zodat de interactiesterkte tussen het Higgs-boson en de quarks gelijk is aan −
mq , v
(6.13)
en dus het sterkst voor de zwaardere quarks. 6.2
Meer dan ´ e´ en generatie quarks en leptonen
Er is meer dan alleen de eerste generatie. Er zijn tenminste drie generaties deeltjes, met linkshandige doubletten van de vorm: lA,L =
"
νA0 e0A
qA,L =
"
u0A d0A
#
#L
,
ν 0 = (νe0 , νµ0 , ντ0 ) ,
,
u0 = (u0 , c0 , t0 ) ,
e0 = (e0 , µ0, τ 0 ) , d0 = (d0 , s0 , b0 ) ,
(6.14)
L
waarbij het label A = 1, 2, 3 de generatie aangeeft. Ook zijn er natuurlijk de bijbehorende rechtercomponenten. We geven hier alle velden een accent. De reden is dat we nu onderscheid moeten gaan maken tussen de zogenaamde ijk-eigentoestanden, dat wil zeggen de velden zoals we die tot nu toe gebruikt hebben, met gegeven quantumgetallen onder ijktransformaties, en massa-eigentoestanden, dus velden die op de gebruikelijke kwadratische manier met massa-termen in de Lagrangedichtheid
45
voorkomen. De ijk-eigentoestanden geven we een accent. Zij koppelen op de bekende manier aan de ijkvelden, en in termen van deze velden kunnen we dus de Yukawa termen toevoegen. Dit doen we nu op de meest algemene manier: (e) (u) (d) fAB ¯lAL φ e0BR + fAB q¯AL φ˜ u0BR + fAB q¯AL φ d0BR + h.c.
Dit geeft als massa- en interactietermen: η (e) 0 (u) (d) √ (fAB e¯AL e0BR + fAB u¯0AL u0BR + fAB d¯0ALd0BR ) 2 v (e) (u) (d) + √ (fAB e¯0AL e0BR + fAB u¯0ALu0BR + fAB d¯0ALd0BR ) + h.c. 2
(6.15)
(6.16)
De massatermen zijn nu niet noodzakelijkerwijze diagonaal. De massa-matrix is: v (i) (i) MAB = − √ fAB , i = e, u, d . (6.17) 2 We veronderstellen dat de massa-matrix M niet-singulier is. Verder heeft M geen bijzondere eigenschappen. We zullen nu bewijzen dat M gediagonaliseerd kan worden door: S † MT = Md , (6.18) waarbij S en T unitaire matrices zijn. Het bewijs gaat als volgt: MM † is hermitisch, positief, en kan dus gediagonaliseerd worden met een unitaire matrix S:
S † (MM † )S = Md2 =
m21
m22
m23
waarbij S uniek bepaald is op een matrix F van de vorm
F =
eiφ1 eiφ2 iφ3
e
,
na. Er geldt immers ook (SF )† (MM † )(SF ) = Md2 . Definieer nu: H = SMd S † , V = H −1 M . Dan is H hermitisch en V unitair. Dit laatste zien we als volgt: VV† = = = =
H −1 MM † H −1 H −1 SMd2 S † H −1 H −1 SMd S † SMd S † H −1 H −1 HHH −1 = I .
46
(6.19)
(6.20)
en dus: S † MT = Md ,
(6.21)
met T = V † S (ook unitair!). Immers, S † HS = S † MV −1 S = S † MV † S = Md . Door op deze wijze de matrices met Yukawa koppelingen te diagonaliseren kunnen we de massa-eigentoestanden vinden. In een voorbeeld ziet dat er als volgt uit: ψ¯L0 M ψR0 = (ψ¯L0 S)(S † MT )(T † ψR0 ) = ψ¯L Md ψR ,
(6.22)
met: ψL0 = SψL ,
ψR0 = T ψR .
(6.23)
Hierbij bevatten ψL en ψR dus de fermionen van drie generaties, en zijn M en Md 3 × 3-matrices. Laten we dit nu toepassen op de quarks en leptonen. We diagonaliseren alle massa-matrices met matrices S en T , zodat we matrices S(e) , S(u) , S(d) en T(e) , T(u) , T(d) hebben. De massa-eigentoestanden zijn de deeltjes die we in de natuur waarnemen, dus moeten we nu de interactietermen in het GSW-model uitdrukken in de massa-eigentoestanden. Dit speelt alleen een rol voor de interacties tussen de fermionen en de ijkvelden, dus de termen die de zwakke stromen bepalen. De interacties tussen het Higgs-deeltje en de fermionen hebben dezelfde vorm als de massa-termen, en worden, uitgedrukt in massa-eigentoestanden, ook meteen diagonaal. Laten we beginnen met de zwakke stromen voor de quarks. Aangezien in de zwakke stromen alleen de linkshandige componenten van de velden voorkomen, zien we daar alleen de matrices S. De geladen stroom ziet er als volgt uit: j µ = u¯0ALγ µ d0AL † = u¯ALγ µ (S(u) S(d) )AB dBL µ = u¯ALγ (U)AB dBL ,
(6.24)
u0L = S(u) uL ,
(6.25)
vanwege de herdefinities d0L = S(d) dL .
De matrix † S(d) U = S(u)
(6.26)
die we in (6.24) ge¨ıntroduceerd hebben is unitair. Deze matrix heet voor drie generaties de Kobayashi-Maskawa matrix [36], voor twee generaties de Cabbibo-matrix
47
[37]. U bepaalt de overgangen die mogelijk zijn tussen verschillende generaties. In het geval dat U diagonaal zou zijn, zijn dergelijke overgangen niet mogelijk. De vorm van U is echter iets dat door het experiment bepaald moet worden. Merk op dat de neutrale zwakke stroom diagonaal is in de velden uA en dA , zodat door de unitariteit van de matrices S daar geen matrix zoals U optreedt. In de lepton-sector is er een soortgelijke matrix V , en ziet de geladen stroom er na de herdefinitie dus uit als: jeµ = ν¯AL γ µ (V )AB eBL .
(6.27)
De matrix V kunnen we echter verwijderen door een herdefinitie, met V −1 , van de neutrino-velden, die immers massa nul hebben en dus niet ’gevoelig’ zijn voor een dergelijke herdefinitie. In de lepton-sector treedt de bovenstaande koppeling tussen generaties dus niet op. Het aantal parameters in de 3 × 3 unitaire matrix U is a priori 9, maar dit kunnen we door herdefinities terugbrengen tot een kleiner aantal. Merk op dat we U kunnen vereenvoudigen door elk van de quarkvelden (6 stuks) met een fasefactor te herdefinieren. Nu is U invariant als we alle quarks met dezelfde fase veranderen, dus 5 parameters kunnen uit U verwijderd worden (zie [7], sectie (12.2)). Er blijven dus 4 parameters over. Meer in het algemeen, voor n generaties, is U een matrix met n2 parameters. Daarvan kunnen we er 2n − 1 verwijderen door herdefinities van quarkvelden, we houden dus over n2 − 2n + 1. Voor n = 2 is dit 1, in dat geval kunnen we U als volgt parametriseren: ! cos θc sin θc UC = . (6.28) − sin θc cos θc De hoek θc heet de Cabbibo-hoek [37]. Experimenteel geldt dat θc ongeveer gelijk is aan 15◦ , zodat we zien dat onze exercitie met menging van quark-flavours niet overbodig is. De implicatie van θc voor het experiment is, dat de quarks uit de tweede generatie (c, s), kunnen vervallen naar quarks uit de eerste generatie. Voor drie generaties hebben we dus 4 parameters, en staat U bekend als de Kobayashi-Maskawa [36] matrix, meestal geparametriseerd als: UKM
c1 s1 c3 s1 s3 iδ c1 c2 s3 + s2 c3 eiδ = −s1 c2 c1 c2 c3 − s2 s3 e iδ iδ −s1 s2 c1 s2 c3 + c2 s3 e c1 s2 s3 − c2 c3 e .
(6.29)
Alleen voor δ = 0 is dit een re¨ele, orthogonale matrix. De fase δ in de Kobayashi-Maskawa matrix is om de volgende reden speciaal. We hebben al opgemerkt in hoofdstuk 3 dat de zwakke interacties de pariteit symmetrie breken. Een symmetrie als pariteit wordt een discrete symmetrie genoemd, omdat er geen continue parameters mee geassocieerd zijn. Naast pariteit zijn er nog
48
twee discrete symmetrie¨en in de elementaire deeltjes fysica: de ladingsconjugatie C, die ruwweg alle deeltjes door anti-deeltjes vervangt, en T , die de tijd omkeert. Alle bekende veldentheorie¨en zijn invariant onder het product CP T . Aangezien de zwakke interacties P breken, breken ze dus ook het product van C en T . De complexe fase δ zorgt ervoor dat de actie niet meer invariant is onder CP transformaties, en dus ook niet meer onder T . Processen die CP en dus T breken komen voor bij het verval van de neutrale K-mesonen. We zullen dit onderwerp uit de deeltjesfysica in dit college niet verder behandelen. Sectie (12.2) van [7] geeft een overzicht hierover. De menging van de verschillende generaties quarks leidt dus tot de zogenaamde ’flavour-changing charged current’ processen. Deze zijn bijvoorbeeld verantwoordelijk voor het verval van K-mesonen, en andere vreemde deeltjes. Neem bijvorbeeld K ± . K ± bestaat uit s en u quarks: K + = (u¯ s), K − = (¯ us). Het ± meest voorkomende verval van deze deeltjes is naar µ ν (met natuurlijk een muonneutrino). Het bijbehorende proces is:
Figuur 6.1
Feynman diagram voor het verval van het K ± -meson.
¯ en (d¯ ¯ 0 deeltje, opgebouwd uit (ds) Voor het K 0 en K s) is er geen verval naar + − bijvoorbeeld µ µ (in laagste orde). De reden is dat de neutrale stroom, dus de koppeling aan Z 0 , w´el flavour behoudt. K 0 vervalt daarom voornamelijk naar pionen via andere processen.
49
7
Quantisatie van Yang-Mills theorie
In dit hoofdstuk bespreken we de quantisatie van Yang-Mills ijkvelden in het padintegraal formalisme. Hierbij treden in eerste instantie dezelfde problemen op als bij de quantisatie van het electromagnetisch veld. De oplossing die daar werd gevonden, de quantisatiemethode van Gupta en Bleuler, blijkt nu niet te werken. We volgen voor Yang-Mills velden de Faddeev-Popov [13] methode. Deze wordt in veel boeken over quantumveldentheorie besproken, ook in [7], hoofdstuk 9. Een heldere beschrijving van de Faddeev-Popov methode is te vinden in het boek van Pokorski [14]. 7.1
IJkbrekende termen in de padintegraal
Het Maxwell veld wordt beschreven door de Lagrangedichtheid L = − 14 Fµν F µν = 21 Aν (u t Aν − ∂ν ∂µ Aµ ) + totale afgeleide .
(7.1)
Bij de quantisatie van het Maxwell veld treedt een probleem op. Dit kunnen we op twee manieren constateren: in het kanoniek formalisme, waarbij de velden operatoren zijn, en dan voldoen aan commutatierelaties bij gelijke tijd, en in het padintegraal formalisme. In het kanoniek formalisme is de kanonieke impuls behorend bij de co¨ordinaat A0 gegeven door ∂L π0 ≡ = 0. (7.2) ∂ A˙ 0 Hierdoor kan π 0 niet als operator met de gebruikelijke commutatierelaties opgevat worden. In de padintegraal hebben we in de Lagrangedichtheid (7.1) het probleem dat de differentiaaloperator u t gµν − ∂µ ∂ν (7.3)
geen inverse heeft. Immers, ∂ ν Λ is voor elke Λ eigenvector bij eigenwaarde nul. Dit betekent dat de twee-puntsfunctie voor het vrije veld niet gedefinieerd kan worden. De oplossing die in [1] wordt besproken is de Gupta-Bleuler methode. In het padintegraal formalisme voegen we een ijkbrekende term −
1 (∂µ Aµ )2 2a
(7.4)
aan de Lagrangedichtheid toe, en defini¨eren vervolgens op de gebruikelijke manier de n-puntsfuncties. In [1] hebben we deze methode verdedigd door te verwijzen naar het kanoniek formalisme.
50
Hetzelfde probleem treedt ook op bij Yang-Mills theorie. We hebben nu a Fµν = ∂µ Aaν − ∂ν Aaµ + gfbc a Abµ Acν ,
(7.5)
a L = − 41 Fµν F µν a
(7.6)
en de kinetische term in is van dezelfde vorm als in de Maxwell theorie. De andere termen geven drie- en vierpunts-interacties voor de ijkvelden. Voor elke Aaµ hebben we hetzelfde probleem als in de Maxwell-theorie. Het invoeren van een ijkbrekende term alleen is voor Yang-Mills theorie niet voldoende. Een manier om dat te ontdekken is het berekenen van de Yang-Mills Feynman regels met alleen de ijkbrekende term −
1 (∂µ Aaµ )2 . 2a
(7.7)
De resulterende propagator voor het vrije veld is dan voor elke a van dezelfde vorm als die van het Maxwell veld. Yang-Mills theorie is echter geen theorie van vrije velden zoals het electromagnetisme. De interactietermen in (7.6) veroorzaken correcties op de twee-puntsfunctie, en met deze keuze van de Feynman regels is de ´e´en-lus bijdrage aan de vacuumpolarisatie niet transversaal. Deze transversaliteit volgt uit de Ward identiteit voor de twee-puntsfunctie, die we op soortgelijke wijze als voor het electromagnetisme kunnen afleiden. De storingstheorie, gebaseerd op de bovenstaande na¨ıve keuze van de Feynman regels, is dus niet in overeenstemming met de symmetrie¨en van Yang-Mills theorie. Wat gaat er fout? Om daar achter te komen moeten we het invoeren van ijkbrekende termen precieser analyseren. Het probleem van quantisatie in ijktheorie¨ en is eigenlijk het volgende: als we R in de padintegraal integreren over alle Aµ in DAµ , dan doen we eigenlijk teveel. Immers, bij het uitrekenen van een ijkinvariante grootheid zullen elke Aµ en A0µ , waarbij A0µ aan Aµ gerelateerd is door een ijktransformatie, dezelfde bijdrage geven. De integraal over alle Aµ zou dus te herschrijven moeten zijn in de vorm Z
Dg
Z
D A¯µ ,
(7.8)
waarbij Dg, voor elke x, een integraal over de groep is (het volume van de groep). A¯µ is dan de representant van de verzameling van ijkvelden die door middel van ijktransformaties verbonden zijn met A¯µ . We kunnen dit schematisch weergeven zoals in fig. 7.1. De lijntjes in fig. 7.1 stellen de “orbits” van Aµ onder ijktransformaties voor. We willen nu een sectie maken door de orbits die elke orbit maar ´e´en keer doorsnijdt. Dit doen we door een functionaal F [Aµ ] te kiezen, zodanig dat de vergelijking F [Agµ ] = 0 (7.9)
51
voor elke beginwaarde van Aµ maar ´e´en oplossing voor g heeft6 . De functionaal F defini¨eert dus de ijking.
Figuur 7.1
Orbits van Aµ onder ijktransformaties.
Bovendien moeten we een invariante integratiemaat voor de ijkgroep G defini¨eren, dat wil zeggen een integratiemaat die voldoet aan waarbij
Dg = D(g 0g) ;
(7.10)
Y
(7.11)
Dg =
dg(x) .
x
Voor elke x afzonderlijk bestaat zo’n maat, de zogenaamde Hurwitzmaat. De algemene vorm zullen we niet nodig hebben. We defini¨eren nu een functionaal ∆[Aµ ] door: 1 = ∆[Aµ ]
Z
Dg δ F [Agµ ] .
(7.12)
De δ-functie is hierin een product van δ-functies voor elke x. De functionaal ∆ is ijkinvariant: ∆[Aµ ] = ∆[Agµ ] . (7.13) Dit volgt uit: ∆−1 [Agµ ] = =
Z
Dg 0 δ F [Agg µ
Z
0
0
=
Z
0
D(gg 0) δ F [Agg µ ]
Dg 0 δ F [Agµ ] = ∆−1 [Aµ ] .
Daarom hangt ∆[Aµ ] alleen van de orbit af. We voeren de decompositie van 1, gegeven door (7.12), in de padintegraal in: Z = = 6
Z
Z
DAµ exp(iS[Aµ ]) Dg
Z
DAµ ∆[Aµ ] δ(F [Agµ ]) exp(iS[Aµ ]) .
(7.14)
In het geval van Yang-Mills theorie verwachten we dat er evenveel condities als ijkvelden zullen moeten zijn. We kunnen de condities dus een label a, waarbij a = 1, . . . , dim G , geven. Tevens moet er voor elke x een conditie zijn. We moeten dus eigenlijk schrijven F a ([Agµ ], x) = 0. We zullen voorlopig deze extra labels niet expliciet aangeven.
52
R
De integratievolgorde hebben we verwisseld. De integrand van Dg is nu onafhankelijk van g. Immers, DAµ = DAgµ omdat we integreren over alle Aµ , en ∆[Aµ ] en S[Aµ ] zijn ijkinvariant. Daarom geldt: Z
DAµ ∆[Aµ ] δ(F [Agµ ])
Z
exp(iS[Aµ ]) =
Z
=
DAgµ ∆[Agµ ] δ(F [Agµ ]) exp(iS[Agµ ]) DAµ ∆[Aµ ] δ(F [Aµ ]) exp(iS[Aµ ]) .
R
De integraal Dg geeftRdus een normalisatiefactor die verder niet relevant is. In de resterende integraal DAµ levert door de δ-functie van iedere orbit slechts ´e´en representant een bijdrage. Nu moeten we nog ∆[Aµ ] uitrekenen. Daartoe gaan we terug naar de definitie (7.12) en werken de δ-functie uit. Deze levert alleen bijdragen voor de nulpunten van F . We kunnen nu overgaan op F als variabele, hetgeen geeft7 Z
δF [Agµ ] DF det δg
!−1
δF [Agµ ] δ(F ) = det δg
!−1
zodat we vinden
F =0
,
(7.15)
δF [Agµ ] . (7.16) δg F [Agµ ]=0 Omdat ∆ ijkinvariant is, kunnen we ∆ bepalen voor een geschikt gekozen Aµ . We kiezen Aµ z´o, dat al geldt F [Aµ ] = 0. Dan immers is g = I in (7.16): ∆[Aµ ] = det
∆[Aµ ] = det
δF [Agµ ] ; F [Aµ ] = 0 . δg g=1
(7.17)
Om de afgeleide bij g = 1 te bepalen kijken we naar de infinitesimale transformatie: g() = I − ia (x)Ta .
(7.18)
De integratiemaat over de groep is dan: D =
X
da (x) .
(7.19)
a,x
Invariantie van deze maat voor willekeurige vaste g(θ) volgt doordat g(θ0) = g(θ)g() = g(θ + ), zodat dθ0 = d voor infinitesimale . Met deze parametrisatie van g wordt (7.17): ∆[Aµ ] = det M a b (x, y) ;
M a b (x, y) =
δF a ([Aµg() ], x) ; =0 δb (y)
7
R
F a ([Aµ ], x) = 0 .
Denk aan de volgende analoge berekening voor gewone integralen en functies: df δ(f )/f 0 (x) = 1/f 0 (x) |x0 waarbij x0 bepaald wordt door f (x0 ) = 0.
53
(7.20) R
dx δ(f (x)) =
De indices van F , en de resulterende structuur van M, hebben we nu expliciet gemaakt. De matrix M heeft twee soorten “indices”, ten eerste de indices a en b (a, b = 1, . . . , dim G ) en ten tweede de continue labels x en y. Voor beide moet de determinant berekend worden. De matrix M kunnen we gemakkelijk verder uitwerken: δF a ([Aµ ], x) δAcλ (z) δAcλ (z) δb (y) =0 ! Z δF a ([Aµ ], x) 1 c c d = dz fbd Aλ (z) − δb ∂λ,z δ(z − y) , δAcλ (z) g
a
M b (x, y) =
Z
dz
(7.21)
waarbij we gebruik gemaakt hebben van de wijze waarop Aµ onder ijktransformaties transformeert (zie (2.48)). De padintegraal (7.14) is dus: Z=
Z
DAµ det M δ(F [Aµ ]) exp(iS[Aµ ]) ,
(7.22)
met M gegeven in (7.21). We kunnen dit iets generaliseren, door niet F = 0, maar bijvoorbeeld F [A, x] − B(x) = 0 te nemen waarbij B een willekeurige ijkinvariante functie van x is. Omdat B ijkinvariant is blijft det M onveranderd. In de F −B = 0 ijking zouden we dus gevonden hebben: Z=
Z
DAµ det M δ(F [Aµ ] − B) exp(iS[Aµ ]) ,
(7.23)
hetgeen, omdat Z ijkinvariant is, onafhankelijk is van B. Dan kunnen we integreren over B met een willekeurige B-afhankelijke gewichtsfactor: Z = =
Z
Z
DAµ det M exp(iS[Aµ ])
Z
DB δ(F [Aµ ] − B)G[B]
DAµ det M exp(iS[Aµ ]) G[F [Aµ ]] .
(7.24)
Dit verandert alleen de normalisatie van Z. Neem bijvoorbeeld: i G[B] = exp − 2a h
Z
i
dx B(x)2 ,
(7.25)
met a een re¨ele constante. We zien dat we dan de oorspronkelijke Lagrangedichtheid effectief vervangen door 1 (7.26) L → L − F ([Aµ ], x)2 . 2a Hiermee hebben we nu de ijkbrekende term in de Lagrangedichtheid gekregen. Bovenstaande analyse verduidelijkt de oorsprong van de ijkbrekende term. Met
54
een ijkbrekende term is de Lagrangedichtheid niet langer ijkinvariant. De padintegraal (7.24) natuurlijk wel. Deze is bovendien gelijk aan de oorspronkelijke (7.14), op normeringsconstanten na. Daarbij is dan echter wel de bijdrage van de determinant van M essentieel. In het geval van het electromagnetisme kunnen we voor de functionaal F kiezen: F ([Aµ ], x) = ∂µ Aµ (x) .
(7.27)
Dan is de matrix M: M(x, y) = −
1 e
Z
1 dz (∂µ,x g µλ δ(x − z)) ∂λ z δ(z − y) = − u t x δ(x − y) , e
hetgeen onafhankelijk is van het ijkveld Aµ . Dan is M dus een normalisatiefactor in de padintegraal en speelt geen rol. We krijgen dus de gebruikelijke padintegraal voor het Maxwell veld terug. Het verschil tussen het Maxwell en het Yang-Mills veld in de padintegraal zal zijn dat voor het Yang-Mills veld M wel een niet-triviale rol speelt. 7.2
De Faddeev-Popov ghost velden
Voor het algemene geval moeten we nog altijd de determinant van de matrix M (7.21) uitrekenen. Bij het invoeren van de padintegraal in [1] hebben we al eens een determinant gevonden (zie [1], sectie (2.6)) in de berekening van de padintegraal van het vrije, niet-relativistische deeltje. We berekenden daar de integraal: Z
n X
in π n/2 √ dx1 . . . dxn exp( xi Aij xj ) = . det A i,j=1
(7.28)
De berekening van deze integraal gaat als volgt. Zonder verlies van algemeenheid kan de matrix A symmetrisch worden gekozen. We diagonaliseren dan de symmetrische matrix A met een orthogonale transformatie: A = O T DO, en gaan dan over op nieuwe integratievariabelen yi = Oij xj . De Jacobiaan van deze transformatie van integratievariabelen is gelijk aan ´e´en, en in de y-variabelen kan de integraal dan gemakkelijk worden berekend. Een soortgelijke integraal is8 : Z
dz1 dz1∗
. . . dzn dzn∗
exp(
n X
i,j=1
zi∗ Aij zj ) ∼
1 . det A
(7.29)
We kunnen immers A nu hermitisch kiezen, en diagonaliseren met een unitaire transformatie. De berekening van de integraal verloopt dan net als bij (7.28). In de integratiemaat geldt dzi dzi∗ = dxi dyi , waarbij xi en yi het re¨ele en imaginaire deel van zi zijn. 8
55
Grassmann variabelen zijn ge¨ıntroduceerd in [1], sectie (5.2). Als we in plaats van over commuterende variabelen z integreren over elementen van een Grassman algebra in integralen als (7.28, 7.29) vinden we een ander resultaat. Voor basiselementen Ci van een Grassman algebra geldt: Z
dCi Cj = δij .
(7.30)
Voor een n-dimensionele Grassman algebra vinden we Z
dC1 · · · dCn C1 · · · Cn = 1 .
(7.31)
We voeren nu onafhankelijke Grassman variabelen Ci , Ci† in, en vinden dan de volgende integraal: Z
dC1 dC1† · · · dCn dCn† exp(
n X
i,j=1
Ci† Aij Cj ) ∼ det A ,
(7.32)
Deze berekening kan gedaan worden door de exponent te ontwikkelen. Dan leveren alleen die termen een bijdrage aan de integraal, waarin alle Ci , Ci† precies ´e´en keer voorkomen. De coeffici¨enten van deze termen geven, vanwege het anti-commuterend karakter van de Grassman variabelen, de determinant van A, op een numerieke factor na die door de ontwikkeling van de exponent ontstaat. Faddeev en Popov [13] hebben anti-commuterende velden ca (x) en c†a (x) ingevoerd om op dezelfde wijze de determinant uit sectie (7.1) te herschrijven: a
det M b (x, y) =
Z
†
Dc Dc exp(i
Z
dx dy
X
c†a (x)M a b (x, y)cb (y)) .
(7.33)
a,b
Bedenk steeds dat, ondanks de wellicht wat verwarrende notatie, c en c† onafhankelijke velden zijn. Gebruik makend van de resultaten van sectie (7.1) kunnen we nu de volledige actie voor Yang-Mills theorie, met ijkbrekende term, opschrijven: S = +
Z
Z
a d4 x − 14 Fµν F µνa −
1 a F ([Aµ ], x)2 2a
d4 y c†a (x)M a b (x, y)cb(y) ,
(7.34)
waarbij M wordt gegeven door (7.21). Als voorbeeld werken we het geval uit dat F a ([Aµ ], x) = ∂µ Aµa (x). Deze ijkkeuze staat bekend als de covariante ijking, vanwege de Lorentz invariante vorm. Dan is δF a ([Aµ ], x) = ∂µx {g µλ δ(x − z)δca } , δAcλ (z)
56
(7.35)
en a
M b (x, y) =
∂µ,x g µλ δca
Z
1 dz δ(x − z) fbd a Adλ (z) − δbc ∂λ,z δ(z − y) g
1 t x δ(x − y)δba + ∂µ,x (fbd a Aµd (x)δ(x − y)) . = − u g Dus kan de laaste term in (7.34) geschreven worden als: Z
dx dy c†a (x)M a b (x, y) cb(y) = =
Z
=−
dx dy c†a (x)
!
1 − u t x δ(x − y)δba + ∂µ,x (fbd a Aµd (x)δ(x − y)) cb (y) g
Z 1Z dx c†a u t ca − dx (∂µ c†a (x))fbc a Aµc (x)cb (x) . g
We kunnen nu een factor −1/g in het veld c† absorberen. Dan is het resultaat: S =
1 (∂µ Aµa )2 + c†a (x)u t ca (x) 2a +g(∂µ c†a (x) fbc a Aµc (x) cb (x) .
Z
h
a d4 x − 14 Fµν F µνa −
(7.36)
In de padintegraal wordt ge¨ıntegreerd over DAµ Dc† Dc. De extra ingevoerde velden ca en c†a (met a = 1, . . . ,dim G ) zijn de zogenaamde Faddeev-Popov ghosts: de spookdeeltjes van Faddeev en Popov. Het zijn elementen van een Grassman algebra en anti-commuteren dus. Het zijn echter geen fermionen, zoals het electronveld in QED, maar scalaire velden. De bewegingsvergelijking van c†a is u t ca = 0 (als g = 0), hetgeen alleen Lorentz invariant is als ca een scalair veld is. De ghost velden voldoen dus niet aan de gebruikelijke relatie tussen spin en statistiek. Omdat we dit verband als ervaringsfeit wel zullen aannemen, zullen we nooit diagrammen hoeven uit te rekenen met ghosts als uitwendige lijnen. Merk op dat de ghost termen in (7.36) invariant zijn onder de globale symmetrie transformaties c†a → (c†a )0 = exp(−iθ)c†a ,
ca → (ca )0 = exp(iθ)ca .
(7.37)
We kunnen dus aan de ghosts een lading toekennen, die behouden is bij de interacties met het Yang-Mills veld. Daarom kunnen ghost lijnen in een Feynman diagram niet zomaar ergens eindigen, de ghosts kunnen alleen voorkomen in gesloten lussen. Als we te maken hebben met een abelse groep (zodat fab c = 0) zijn de ghosts vrije deeltjes en kunnen we meteen de padintegraal over c en c† uitvoeren. Dit levert weer een constante, die verder geen rol speelt; alleen voor niet-abelse groepen hebben we de ghosts nodig. We zullen meestal in de covariante ijking werken.
57
7.3
Feynman regels voor Yang-Mills velden
Nu we de actie voor Yang-Mills theorie hebben, kunnen we de Feynman regels bepalen. We hebben de volgende kinetische term: Sf =
Z
4
d x
1 µ A (u t gµν 2 a
a−1 ∂µ ∂ν )Aνa + c†a (x)u t ca (x) , − a
(7.38)
en de volgende interactietermen: Si =
Z
d4 x − g(∂µ Aaν )Aµb Aνc fbc a − 14 g 2 fbc a fdea Abµ Acν Aµd Aνe +
+ g (∂µ c†a ) fbc a Aµc cb .
(7.39)
We voegen de gebruikelijke brontermen toe: Sb =
Z
d4 x (Jaµ Aaµ + c†a η a + ηa† ca ) .
(7.40)
We kunnen nu op de standaard manier de Feynman regels afleiden. De genererende functionaal is: Z[Jaµ , η a , η †a ]
=
Z
DAµ DcDc† exp(i(Sf + Si + Sb )) .
(7.41)
De propagatoren voor de Yang-Mills en ghost velden volgen uit (7.38). We geven alleen de resultaten in de impulsruimte: Aaµ propagator : iδab kµ kν − 2 gµν − (1 − a) 2 k + i k ghost propagator : iδ b − 2 a k + i
!
(7.42)
(7.43)
Merk op dat de ghost propagator een ander teken heeft dan de propagator van een gewoon scalair veld. Dit komt door onze keuze van het teken van de kinetische term voor de ghost velden. Vanwege de behouden ghost lading hebben de ghost lijnen een orientatie. Verder zijn er drie soorten interactievertices. Net als bij QED kunnen we de bijbehorende Feynman regels bepalen door eerst de bijbehorende n-puntsfuncties te berekenen. Het resultaat is:
58
(∂A)AA vertex : gf abc ((k1 − k2 )λ gµν + (k2 − k3 )µ gνλ + +(k3 − k1 )ν gλµ )
(7.44)
AAAA vertex : −ig 2 (f eab f ecd (gµλ gνρ − gµρ gνλ ) + f eac f edb (gµρ gλν − gµν gλρ ) + +f ead f ebc (gµν gρλ − gµλ gρν ))
(7.45)
c† cA vertex : −g fbc a pµ
(7.46)
Bij de vertices zijn de alle impulsen ingaand, de som van de impulsen is steeds gelijk aan nul. 7.4
De vacuumpolarisatie van het Yang-Mills veld
ab , wordt gegeven door De volledige twee-puntsfunctie voor het Yang-Mills veld, Dµν de volgende relatie: ab −1 ab −1 ab (Dµν ) (k) = (D(0) µν ) (k) + iΠµν (k) .
(7.47)
Hierin is D0 de kale propagator, en Π de vacuumpolarisatietensor, die gegeven wordt door de som van de ´e´en-deeltjes irreducibele diagrammen in de twee-puntsfunctie (zie [1]) (vermenigvuldigd met een factor i). Gebruik makend van de invariantie onder ijktransformaties, kunnen we bewijzen dat de vacuumpolarisatie transversaal moet zijn: k µ Πab µν (k) = 0 .
(7.48)
Het bewijs verloopt op dezelfde wijze als voor QED. Dit bewijs is onafhankelijk van storingstheorie. Natuurlijk moet wel (7.48) voor elke orde in de storingsreeks
59
kloppen, met andere woorden, de storingstheorie moet de symmetrie van de theorie, waaruit (7.48) is afgeleid, respecteren. Het is de moeite waard dit te verifi¨eren met de nu gevonden Feynman regels. Er dragen drie diagrammen aan de berekening van de vacuumpolarisatie bij in orde g 2. Deze zijn getekend in fig. 7.2. Bij de berekening maken we gebruik van dimensionele regularisatie. Er zijn dan bijdragen die zich gedragen als 1/, waarbij = 4 − d, d de dimensie waarin we het diagram uitrekenen9 . Deze parametriseren het divergente deel van de diagrammen, en verdwijnen in de renormalisatieprocedure. De eindige bijdragen zijn in de limiet → 0 onafhankelijk van . Zowel het divergente deel als het eindig deel van de vacuumpolarisatie moeten transversaal zijn.
Figuur 7.2 isatie.
De drie diagrammen die in orde g 2 bijdragen aan de vacuumpolar-
De bijdrage van het eerste diagram is: ab Π(1) µν (p) =
1 2 ig µ fcd a f cdb 2
Z
1
0
dα gµν ((2d − 1)J1 (a2 ) +
+ p2 (5 − 4α(1 − α))J2 (a2 )) +
+ pµ pν (d − 6 − (4d − 6)α(1 − α))J2 (a2 ) ,
(7.49)
waarbij a2 = −p2 α(1 − α). De parameter µ, met de dimensie van een massa, is ingevoerd om ervoor te zorgen dat g dimensieloos is. De integralen JA (a2 ), gedefinieerd door Z dd k 1 JA (a2 ) = , (7.50) d 2 (2π) (k − a2 )A
zijn berekend in [1]. Gebruik makend van de daar gegeven eigenschappen van 9
Denk eraan dat deze niets te maken heeft met de in de Feynman regels voor de propagatoren.
60
JA (a2 ) en van de Γ-functies, vinden we na ontwikkeling van het resultaat in 1/: i h 19 2 2( 6 p gµν − 11 p p )/ + 3 µ ν (4π)d/2 +(− 21 − 19 γ)p2 gµν + (− 32 + 11 γ)pµ pν + 6 3
ab Π(1) µν (p) =
1 2 ig µ fcd a f cdb 2
+
Z
1
0
dα ln a2 ((11α(1 − α) − 5)p2 gµν + i
+ (10α(1 − α) + 2)pµ pν ) .
(7.51)
De bijdrage van het tweede diagram is gelijk aan nul, als dimensionele regularisatie wordt gebruikt. De reden is dat het resultaat evenredig is met de integraal Z
1 ∼ J1 (0) = 0 . k2
dd k
(7.52)
Daarmee hebben we een opmerking uit sectie (7.1) geverifieerd. Immers, deze eerste twee diagrammen geven de totale vacuumpolarisatie als we alleen de bijdragen van het Yang-Mills veld meenemen. Dit is het resultaat als we doen alsof quantisatie van het Yang-Mills veld net zo gaat als bij het electromagnetisme, en dat volstaan kan worden met het toevoegen van een ijkbrekende term. We zien dat de eerste twee diagrammen inderdaad geen transversale vacuumpolarisatie geven, en dus zijn deze na¨ıve Feynman regels in strijd met de Ward identiteit. Nu voegen we het derde diagram toe. Dit geeft: ab 2 a cdb Π(3) µν (p) = −ig µ fcd f
Z
0
1
dα
1 g J (a2 ) 2 µν 1
− α(1 − α)pµ pν J2 (a2 )
i h 1 2 2 ( 6 p gµν + 13 pµ pν )/ + d/2 (4π) 1 + 6 (1 − γ)p2 gµν − 31 γpµ pν +
1 2 ig µ fcd a f cdb 2
=
+
Z
0
1
i
dα ln a2 ( − α(1 − α)p2 gµν − 2α(1 − α)pµ pν ) . (7.53)
In dit stadium van de berekening constateren we dat de bijdragen evenredig met 1/ inderdaad transversaal zijn. De bijdrage van het eindig deel vereist nog het berekenen van twee integralen. Deze zijn: Z
1
0
Z
0
1
dα ln(−p2 α(1 − α)) = −2 + ln(−p2 ) ,
(7.54)
5 + 16 ln(−p2 ) . dα α(1 − α) ln(−p2 α(1 − α)) = − 18
(7.55)
Dit leidt dan tot het volgende resultaat voor de volledige vacuumpolarisatie: a cdb 1 2 Πab µν (p) = 2 ig µ fcd f
i h 2 (p gµν − pµ pν )( 20 + 3 (4π)d/2 61
62 9
−
10 γ 3
−
10 3
i
ln(−p2 ) .(7.56)
We concluderen, dat deze inderdaad transversaal is. Dit wekt vertrouwen in de quantisatiemethode die we in deze sectie hebben ingevoerd. We zien dat Π alleen afhangt van de keuze van de groep door de factor fcd a f cdb . Deze is evenredig met δ ab (zie (A.23), net als de kale propagator (7.42).
62
8
Het GSW-model: experimentele consequenties
In dit hoofdstuk zullen we een aantal consequenties van het GSW-model voor de zwakke en electromagnetische interacties (het standaard model) bespreken. Vanzelfsprekend zullen we verre van volledig zijn. In de vorige hoofdstukken hebben we de Lagrangedichtheid voor het het GSWmodel in stukjes en beetjes bij elkaar verzameld. Het is daarom handig ergens een complete versie van dit model op te schrijven. We vinden deze in Appendix B. 8.1
De W - en Z-bosonen
Het standaard model voor de zwakke en electromagnetische interacties voorspelt het bestaan van massieve intermediaire ijkdeeltjes, namelijk de geladen W ± -bosonen en het neutrale Z-boson. Het standaard model doet bovendien een voorspelling voor de verhouding van de massa van deze deeltjes. De W - [38, 39] en Z-bosonen [40, 41] zijn in 1983 ontdekt bij CERN in Gen`eve, het Europese centrum voor experimentele elementaire deeltjesfysica. Deze ontdekkingen werden gedaan met een versneller waarbij protonen en anti-protonen op elkaar botsen. Deze deeltjes worden in de versneller opgeslagen en in tegengestelde richting versneld. Op deze wijze kon men een totale zwaartepuntsenergie van 540 GeV bereiken. Bij dit proces botsen de quarks en anti-quarks uit proton en anti-proton op elkaar, waarbij onder andere W - en Z-bosonen kunnen ontstaan. Typische processen die kunnen optreden zijn bijvoorbeeld u¯ + d → W − → e− + ν¯e , u¯ + u → Z 0 → e+ + e− . Bij een versneller met botsende bundels is het in het algemeen heel moeilijk deeltjes te detecteren die in de richting van de bundels worden geproduceerd. Kenmerkend voor de processen met W - en Z-bosonen is, dat deze gevormd worden met weinig kinetische energie. Dat betekent dat hun vervalsproducten in alle richtingen kunnen vertrekken, en daarbij springen dan natuurlijk de richtingen loodrecht op de bundels in het oog. In het geval van het W -deeltje kijkt men naar processen met ´e´en electron dat loodrecht op de bundel vertrekt, en waarbij dan verder geen productie van hadronen optreedt. De impuls van het electron wordt dan niet in de tegengestelde richting gecompenseerd. Deze “missing transverse momentum” wordt door het niet gedetecteerde neutrino meegenomen. Aangezien het een twee-deeltjes verval betreft kan dan de massa van het W -boson worden berekend. Voor het Z-boson kijkt men naar soortgelijke processen waarbij een electron en een positron met tegengestelde impulsen loodrecht op de bundels worden waargenomen.
63
Deze experimenten werden gedaan door twee groepen, die bekend staan onder de namen UA1 en UA2 , waarbij UA een afkoritng is van Underground Area. Beide groepen vonden dezelfde resultaten. Inmiddels is er veel meer bekend over de eigenschappen van deze ijkbosonen dan in 1983. In het bijzonder is dat het geval voor het Z-boson. Bij CERN heeft men nu een versneller in gebruik waarbij hoog-energetische electronen en positronen op elkaar botsen (LEP, Large Electron Positron collider). Met de totale zwaartepunts energie gelijk aan de massa van het Z-boson worden vele Z-bosonen geproduceerd. Men kan dan zorgvuldig de verschillende vervalswijzen van de Z-bosonen bekijken en op deze wijze een deel van het GSW-model toetsen. Om met LEP ook W bosonen waar te nemen is meer energie nodig. Men hoopt over enige tijd met voldoende energie te kunnen werken om het proces e+ + e− → Z 0 → W + + W −
(8.1)
waar te nemen. Daarbij speelt dus een vertex tussen ijkbosonen, die specifiek is voor een niet-abelse ijkgroep, een rol, en wordt dus een heel ander gedeelte van het GSW-model gecontroleerd. Alle experimenten van de laatste jaren geven een perfecte overeenstemming met het standaard model. De onduidelijke kanten van het GSW-model hebben te maken met het Higgs-deeltje, dat nog niet is waargenomen. 8.2
Het Higgs-deeltje
Het Higgs-boson speelt een wat merkwaardige rol in het standaard model. Het Higgs-doublet wordt ingezet om te zorgen dat de W - en Z-bosonen via spontane symmetriebreking massa krijgen. Dit is een methode om massieve vectordeeltjes te introduceren zonder de renormaliseerbaarheid van massaloze Yang-Mills theorie te verstoren. Het is duidelijk dat elk ander mechanisme waarmee hetzelfde doel bereikt wordt even acceptabel is als het Higgs-mechanisme. Een even betrouwbaar mechanisme als dat van Higgs is door de theoretici evenwel nog altijd niet gevonden. Daarom gaat het zoeken naar het Higgs-deeltje voort, en een eventuele ontdekking van dit deeltje is dan ook voor ons begrip van de fysica van elementaire deeltjes van groot belang. Laten we nagaan op welke wijze het Higgs-boson interactie heeft met de andere deeltjes in het standaard model (zie Appendix B). De volgende interactietermen met het scalaire veld η treden op: √ 2η (3) (e) (u) (d) Lint = − (¯ eA MAB eB + u¯A MAB uB + d¯A MAB dB ) , (8.2) v (4)
Lint = e2 (2vη + η 2 )(
1 1 + µ− + (Zµ )2 ) , 2 Wµ W 2 4 sin θ 8 sin θ cos2 θ
64
(8.3)
(5)
Lint = −λv 2 η 3 − 41 λ η 4 .
(8.4)
In de eerste plaats merken we op dat de massa van het Higgs-deeltje, µ, in het GSW-model een vrije parameter is. De enig meetbare parameter die de Higgs sector betreft is de combinatie v 2 = µ2 /λ. L(3) is de interactie van η met de fermionen. We zien dat de sterkte van de interactie wordt gegeven door mf /v, waarbij mf de massa van het betrokken fermion is, en v de parameter uit de Higgs potentiaal. Zoals we in hoofdstuk 6 gezien hebben zijn de massas van de W - en Z-bosonen afhankelijk van de parameters ev en sin θ. Een eenvoudig rekensommetje leert dat q
2 MW MZ2 − MW 1 , ev = 2 MZ
(8.5)
waarmee we met de experimentele waarden van MW en MZ komen tot de ruwe schatting v = 250 GeV. De koppeling van het Higgs deeltje aan de fermionen wordt dus fors onderdrukt door de factor 1/v, en het is duidelijk dat de top-quark, die heel zwaar is, de beste kans op het produceren van een Higgs deeltje geeft. Bij de LEP versneller geeft de koppeling tussen de Z-bosonen en het Higgs deeltje in principe een mogelijkheid. Merk op dat deze koppeling, in L(4) , evenredig is met v! We kunnen ons dus het proces e+ + e− → Z → η + Z
(8.6)
√ voorstellen. Als s de energie in het zwaartepuntsysteem van het electron-positron √ paar is, dan kan op deze wijze een Higgs deeltje met een massa to s − MZ in principe ontdekt worden. Als de verbeterde LEP versneller, die W + W − -paren kan produceren, in gebruik wordt genomen, geeft dit proces in principe een mogelijkheid het Higgs deeltje te produceren. In de toekomst zal bij de Large Hadron Collider (LHC) bij CERN in Gen`eve in pp-botsingen een energie van 14 TeV bereikt kunnen worden. Dit geeft weer nieuwe mogelijkheden voor de ontdekkking van het Higgs deeltje. Bij deze versnellers zijn er twee favoriete processen: de zogenaamde gluon fusie10 , en de W W fusie (zie fig. 8.1). Bij het gluon fusie proces zal de zwaarste quark, dus de top-quark, de belangrijkste bijdrage leveren. Bij W W fusie wordt weer gebruik gemaakt van de vertex tussen η en de ijkbosonen, die evenredig is met v. Bij beide processen moet men zich natuurlijk afvragen hoe het Higgs-deeltje uiteindelijk wordt waargenomen. Het Higgs-deeltje is niet stabiel, en kan vervallen naar q q¯-paren, of ook naar ZZ- of 10
We bespreken gluonen, de ijkdeeltjes van het model voor de sterke interacties tussen quarks, in hoofdstuk 10.
65
W W -paren, als de massa van η voldoende groot is. Bij pp botsingen is de detectie van q q¯-paren, waarbij de bij voorkeur zware quarks natuurlijk ook weer vervallen, vrijwel uitgesloten. De beste kans op ontdekking doet zich dan ook voor bij zware Higgs-deeltjes, die vervallen in ZZ. De geproduceerde Z-bosonen vervallen in bijvoorbeeld geladen lepton paren, die gemakkelijk te detecteren zijn. Voor meer informatie over het Higgs deeltje verwijs ik naar [42, 43].
Figuur 8.1 versnellers. 8.3
Mogelijke processen met Higgs-deeltjes bij hoog-energetische pp-
De top-quark
De top-quark is in 1994 ontdekt bij experimenten in Fermilab. Ondanks het feit dat het zoeken naar de top-quark heel lang geduurd heeft, is er nooit veel twijfel over het bestaan van de top-quark geweest. Het is interessant na te gaan, waar deze zekerheid over het bestaan van dit deeltje op berust. Het moge duidelijk zijn dat het beeld van drie gelijke generaties een mooi beeld oplevert, maar dat alleen mag niet voldoende zijn. Een serieuze reden om een top quark te wensen heeft te maken met het verschijnsel anomalie. De analyse van het standaard model is volledig gebaseerd op de symmetrie¨en van het model. Het is essentieel, dat alle Green functies ook inderdaad voldoen aan de Ward identiteiten die volgen uit de invariantie van de actie. In principe moeten we voor die Green functies ook in hogere orden in de storingsreeks nagaan, of nog wel aan de Ward identiteiten voldaan is. Dit lijkt gegarandeerd, omdat de Ward identiteiten immers op een heel algemene manier zijn afgeleid, maar er zit hier toch een addertje onder het gras. Bij het afleiden van de Ward identiteiten wordt verondersteld dat de integratiemaat in de padintegraal invariant is onder de uitgevoerde transformaties. Aangezien we nooit erg precies geweest zijn in de definitie van deze integratiemaat, is deze aanname moeilijk te verifi¨eren. Dit probleem van de integratiemaat [44] blijkt zich te manifesteren in een aantal specifieke Feynman diagrammen, die een violatie van de Ward identiteit, de anomalie, kunnen veroorzaken. Deze diagrammen zijn de zogenaamde driehoeks diagrammen met chirale fermionen (zie fig. 8.2). Voor de details van de berekening van degelijke
66
diagrammen verwijs ik naar het boek van Ryder [45]. Dergelijke diagrammen treden in het GSW model zeker op. Er is echter de mogelijkheid, dat de bijdragen van de links- en rechtshandige chirale fermionen precies tegen elkaar wegvallen. Het blijkt nu, dat de quantumgetallen in het standaard model precies zo zijn gekozen, dat deze anomalie cancellatie ook inderdaad optreedt. Dit geldt voor elke generatie afzonderlijk, en dus ook voor de derde generatie, mits daarin de top-quark aanwezig is.
Figuur 8.2
Driehoeks diagrammen die kunnen bijdragen aan een anomalie.
Laten we dit nagaan. In de twee diagrammen van fig. 8.2 treedt op een factor tr (Ta Tb Tc + Tb Ta Tc ), waarbij de Ta de generatoren zijn van de representatie van de ijkgroep waaronder de fermionen transformeren. Zowel alle links-, als alle rechtshandige fermionen komen in de fermionlus voor. De bijdrage aan het diagram die de matrix γ 5 bevat (het is juist deze bijdrage die de anomalie oplevert) is dan evenredig met het verschil van de bijdragen van de linkshandige en de rechtshandige fermionen: tr (Ta Tb Tc + Tb Ta Tc )L − tr (Ta Tb Tc + Tb Ta Tc )R . (8.7) We hebben nu verschillende mogelijkheden. De indices a, b, c kunnen slaan op SU(2) of U(1). Als tenminste ´e´en van de indices bij SU(2) hoort, is de rechter bijdrage aan (8.7) gelijk aan nul, omdat er geen rechtshandige doubletten zijn. Als ´e´en of drie11 van de indices bij SU(2) horen, dan is het resterende spoor gelijk aan nul, omdat dan tr Ta = 0. Als er twee SU(2) indices zijn, blijft als conditie voor de anomalie cancellatie over: tr YL = 0 . (8.8) Als geen van de indices bij SU(2) hoort, moet gelden tr (YL)3 − tr (YR )3 = 0 .
(8.9)
Als we (8.8) en (8.9) gaan verifi¨eren12 met eigenwaarden van Y uit de eerste generatie, zien we dat alleen dan aan deze conditie voldaan is als elke quark drie maal 11
In het geval van drie SU (2) indices maken we gebruik van de eigenschap Ta Tb + Tb Ta ∼ δab , die specifiek voor SU (2) geldt, maar niet algemeen voor SU (N ) groepen. 12 Een handige manier om deze condities te verifi¨eren is om gebruik te maken van Y = 2(Q−T3).
67
geteld wordt. In het volgende hoofdstuk zullen we zien dat quarks inderdaad een extra vrijheidsgraad hebben, kleur, die drie waarden kan aannemen. Dankzij deze kleureigenschap van quarks is elke generatie dus vrij van anomalie¨en, mits natuurlijk de top-quark bestaat. Het bestaan van de top-quark is dus belangrijk voor de interne consistentie van het standaard model. Zonder top-quark heeft het model een anomalie, die het bewijs van de renormaliseerbaarheid van de theorie ongeldig maakt. Met andere woorden: de top-quark moet bestaan. Andere quarks zijn als gebonden toestand ontdekt in e+ e− → q q¯ processen. In principe is dit proces ook mogelijk voor de top-quark, maar de energie van de LEP versneller is daartoe onvoldoende. Uiteindelijk is de top-quark dan ook ontdekt bij hoog-energetische p¯ p botsingen. Bij dit proces wordt een tt¯-paar geproduceerd. ¯ De t (t) vervalt naar een b (¯b) quark, onder emmissie van een W + (W − ) deeltje. Gemeten worden de geladen leptonen die uit het verval van W ± ontstaan, alsmede de hadron jets ten gevolge van de bottom quarks. De conclusie van een moeilijke analyse is dat de massa van de top-quark ongeveer 174 GeV is [46].
Uit (8.8) volgt dan de conditie tr QL = 0, aangezien het spoor van T3 gelijk is aan nul. Nu is natuurlijk QL = QR , zodat moet gelden tr Q = 0. Als we op dezelfde wijze (8.9) uitwerken blijft over tr (Q3L + 32 QL − Q3R ) = 0, hetgeen na gebruikmaking van QL = QR dezelfde conditie als (8.8) oplevert: tr Q = 0.
68
9 9.1
Sterke interacties en quarks Nucleonen en pionen: isospin
Deeltjes met sterke wisselwerking zijn te onderscheiden in baryonen (“zware deeltjes”) en mesonen. Dit onderscheid wordt expliciet gemaakt door de deeltjes een quantumgetal toe te kennen, het baryongetal B, dat gelijk is aan ´e´en voor alle baryonen, en aan nul voor de mesonen. Baryongetal is bij alle interacties behouden. Het behoud van baryongetal verklaart een aantal eigenschappen van sterk wisselwerkende deeltjes. Zo moet bijvoorbeeld het lichtste baryon stabiel zijn. Dat is het proton, dat net iets lichter is dan het neutron (zie Tabel 9.1 voor een overzicht van de stabiele baryonen en mesonen van de eerste generatie). Het neutron kan wel vervallen, maar alleen via de zwakke interacties. In de sterke interacties alleen kunnen we geen onderscheid maken tussen proton p en neutron n: de sterke interacties zijn ladingsonafhankelijk. In een theorie van de sterke interacties kunnen we dan de velden corresponderend met p en n als een doublet schrijven, ! p N= . (9.1) n waarbij de bijbehorende sterke wisselwerkingen invariant moeten zijn onder SU(2)transformaties die p en n in elkaar overvoeren. Deze SU(2) groep noemt men de (sterke) isospin. De SU(2) groep van de zwakke interacties wordt ook wel zwakke isospin genoemd. Uiteindelijk blijken de twee SU(2) groepen echter een heel andere rol te spelen. De zwakke isospin hebben we verheven tot een locale symmetrie, met de sterke isospin correspondeert g´e´en kracht, en het zal dan ook een globale symmetrie blijven. Bovendien is de sterke isospin slechts bij benadering een symmetrie, denk bijvoorbeeld aan het massaverschil tussen p en n. Bovendien zijn p en n geen puntdeeltjes, en moeten we dus oppassen met veldentheoretische modellen die rechtstreeks in termen van p- en n-velden geschreven worden. Het (p, n)-doublet heeft B = 1, en I = 12 , waarbij we met het isospin quantumgetal I bedoelen dat de eigenwaarde van de operator (I1 )2 + (I2 )2 + (I3 )2 gelijk is aan I(I + 1) (vergelijk het impulsmoment L in de quantum mechanica). We zien dat voor de ladingen geldt: Q = I3 + 12 B (9.2) tenminste, zolang we geen andere quantumgetallen beschouwen. B speelt dus dezelfde rol als Y in de zwakke interacties, maar ook met B correspondeert alleen een globale symmetrie. Een doublet (p, n) heeft een SU(2) invariante wisselwerking met een triplet π a van scalaire deeltjes: als ψN het veld van het nucleon doublet is, kunnen we schrijven: ψ¯N,i γ5 (τa )ij ψN,j π a . (9.3)
69
Hier zijn de τa (a = 1, . . . , 3) weer de generatoren van SU(2) in de fundamentele representatie, en nemen de indices i de waarden 1 en 2 aan. De scalaire deeltjes π zijn de π-mesonen, met spin 0. Er moeten er dus drie zijn: π 0 , π + , π − , die tesamen een triplet (met B = 0) vormen onder isospin. Vanwege de isospin symmetrie moet de massa van de π-mesonen gelijk zijn. Hieraan is niet geheel voldaan, het is duidelijk dat de electromagnetische interactie de isospin symmetrie van de sterke interacties breekt. deeltje
quarks
verval
massa
spin
Q
S
B
I
I3
p
uud
stabiel
928.3
1 2
1
0
1
1 2
1 2
n
udd
peν
939.6
1 2
0
0
1
1 2
π±
¯ u¯d ud,
− 12
µ± νµ
139.6
0
0
0
1
π0
¯ u¯u, dd
±1
±1
γγ
135.0
0
0
0
0
1
0
η0
¯ u¯u, dd
γγ
547.5
0
0
0
0
0
0
Tabel 9.1 Eigenschappen van nucleonen, π-mesonen en η. De massa van de deeltjes is gegeven in MeV. We vermelden alleen de meest voorkomende vervalswijze. De interactieterm (9.3) was lang het model voor de sterke wisselwerking tussen p en n (het pion-uitwisselingsmodel). De interactieterm wordt een Yukawa-term genoemd naar Yukawa, die een dergelijke interactie postuleerde en de eigenschappen van de sterke interacties in de kern gebruikte om een schatting te maken voor de massa van het pion. ¯ 5 ψ is een pseuMerk op dat er een γ5 in de koppeling staat: de combinatie ψγ doscalar, en verandert van teken onder een pariteitstransformatie. Dit moet ook, want het pion is een deeltje met intrinsieke pariteit −1. Omdat de sterke interacties pariteit behouden, moet het pionveld zelf onder een pariteitstransformatie ook van teken veranderen. Dit is in overeenstemming met experimentele gegevens. In Tabel 9.1 geven we alleen stabiele deeltjes aan. Dat zijn de deeltjes die niet vervallen via de sterke wisselwerkingen, maar uitsluitend via de zwakke en/of electromagnetische wisselwerkingen. Naast deze stabiele deeltjes zijn er nog vele andere deeltjes die dezelfde quantumgetallen hebben als de deeltjes in de tabel, behalve massa en spin: ze zijn in het algemeen zwaarder en hebben hogere spin. Deze deeltjes worden resonanties genoemd, vanwege het feit dat ze sterk vervallen is hun levensduur zeer kort.
70
9.2
Vreemdheid, SU(3) en quarks
Het proton is bekend vanaf het moment dat de structuur van het waterstofatoom werd gevonden door Rutherford en Bohr. Het neutron werd in 1932 ontdekt door Chadwick [47]. Het pion werd ontdekt in kosmische straling in 1947 [48]. Het systematisch onderzoek van elementaire deeltjes kon eigenlijk pas in het begin van de jaren vijftig van start gaan met de bouw van de eerste grote versnellers. Dat leverde al spoedig een grote hoeveelheid nieuwe mesonen en baryonen op [11]. deeltje
quarks
verval
massa
spin
Q
S
B
I
I3
K+
s¯u
µ+ νµ
493.6
0
1
1
0
1 2
1 2
K0
s¯d
π’s
497.7
0
0
1
0
1 2
¯0 K
¯ ds
π’s
497.7
0
0
−1
0
1 2
− 12
K−
u¯s
µ− ν¯µ
493.6
0
−1
0
1 2
− 12
Λ0
uds
pπ −
1115.6
1 2
−1 0
1
0
0
Σ+
uus
pπ 0
1189.4
1 2
−1
1
1
1
1
Σ0
uds
Λγ
1192.6
1 2
−1
0
1
1
0
Σ−
dds
nπ −
1197.4
1 2
−1
1
1314.9
1 2
0
1
Ξ−
dss
Λπ −
1321.3
1 2
−2
1 2
−1
uss
Λπ 0
−1
1
Ξ0
−1
−2
1
1 2
− 12
Ω−
sss
ΛK −
1672.4
3 2
−1 −1
−3
1
0
0
1 2
1 2
Tabel 9.2 Eigenschappen van vreemde mesonen en baryonen. De massa van de deeltjes is gegeven in MeV. We vermelden alleen de meest voorkomende vervalswi¯ 0 , elkaars anti-deeltje. jze. K + en K − zijn, evenals K 0 en K Sommige van deze nieuwe baryonen en mesonen zijn weer stabiel, in de zin dat ze alleen zwak en/of electromagnetisch kunnen vervallen, en niet via de sterke interacties. Dit suggereert de introductie van een nieuw quantumgetal, dat behouden is bij de sterke interacties, maar niet bij de zwakke en electromagnetische wisselwerkingen. Dit naar analogie van isospin. Het nieuwe quantumgetal werd vreemdheid (strangeness) genoemd. In Tabel 9.2 geven we de eigenschappen van een aantal vreemde mesonen en baryonen. Deze blijken ook weer in isospin multipletten onder te brengen te zijn. De relatie (9.2) geldt nu niet meer. De eerste stap naar een klassificatie van de vreemde deeltjes werd gegeven door Gell-Mann en Nishijima [49, 50], die de correcte
71
generalisatie van (9.2) vonden: Q = I3 + Y /2 ,
met
Y =B+S,
(9.4)
waarbij Y de sterke hyperlading werd genoemd13 . De ontdekking van vreemdheid leidde tot een klassifikatie met de groep SU(3), een uitbreiding van de isospin-groep. Men kan als eerste benadering veronderstellen dat de sterke interacties invariant zijn niet alleen in de twee-dimensionale ruimte van twee isospin componenten die p en n in elkaar overvoeren, maar ook in een drie-dimensionale ruimte waarin ook vreemdheid een rol speelt. De vraag is op welke deeltjes de fundamentele representatie werkt, met andere woorden, wat is de generalisatie van het isospin doublet van proton en neutron? Na een lange periode van speurwerk ontdekte Gell-Mann [51] dat de hele puzzle van stabiele deeltjes en resonanties kon worden opgelost door te veronderstellen dat de fundamentele representatie van SU(3) werkte op een drietal hypothetische deeltjes u, d, s, door hem quarks genoemd, waarvan we de quantumgetallen in Tabel 9.3 geven14 . deeltje
Q
S
B
I
I3
u
2 3
0
1 3
1 2
1 2
d
− 13
0
1 3
1 2
−1
1 3
− 12
0
0
s Tabel 9.3
− 13
De quantumgetallen van de u, d en s quarks.
De waargenomen mesonen en baryonen moeten dan uit quarks worden opgebouwd. We verkrijgen alle mogelijke deeltjes, met het bijbehorend transformatiekarakter onder SU(3), door op de wijze aangegeven in Appendix A productrepresentaties te vormen. Het fundamentele triplet van quarks wordt aangegeven met 3, de bijbehorende anti-quarks met ¯3. De representatie ¯3 transformeert onder de geconjugeerde representatie, die voor SU(3) niet equivalent is aan de fundamentele representatie. Een product dat we kunnen vormen is bijvoorbeeld 3 × ¯3. Dit spant een 9-dimensionale ruimte op, waarvan ´e´en element invariant is onder SU(3). De 13
Tabel 9.2 is in zoverre verwarrend dat daarin informatie is weergegeven die in verschillende periodes werd ontdekt. De Gell-Mann-Nishijima relatie was gebaseerd op gegevens over Q, B, S en I3 , waarbij we ons moeten realiseren dat op dat moment niet alle deeltjes uit de tabel bekend waren. De quark inhoud van de deeltjes was natuurlijk onbekend, en vormde een latere verklaring van de Gell-Mann-Nishijima relatie 14 Het artikel [51] is ´e´en van de meest invloedrijke artikelen uit de historie van de deeltjesfysica, maar werd desalniettemin nooit in een tijdschrift gepubliceerd. Het heeft een aantal jaren als preprint gecirculeerd, en is vervolgens herdrukt in [52].
72
andere 8 elementen transformeren onder de geadjungeerde representatie. Het blijkt nu dat alle mesonen onder te brengen zijn in dergelijke oktet-representaties. Mesonen zijn dus opgebouwd uit ´e´en quark en ´e´en anti-quark. De baryonen worden gevormd uit de product representatie 3 × 3 × 3. Dit splitst op in representaties van dimensie 10, 8, 8 en 1. De baryonen blijken onder de tiendimensionale representatie van SU(3) te transformeren, en zijn dus opgebouwd uit drie quarks. Het quark-model bleek een doorslaggevend succes, vooral omdat het Ω− -deeltje, dat op grond van het quark-model door Gell-Mann voorspeld was, inderdaad werd gevonden [53]. Lange tijd werden quarks slechts als mathematische hulpmiddelen bij de klassifikatie van deeltjes beschouwd. Het feit dat quarks niet werden waargenomen speelde daarbij vanzelfsprekend een grote rol. Na een aantal jaren kwamen er aanwijzingen voor het bestaan van verborgen bouwstenen. 9.3
Experimentele aanwijzingen voor quarks: ep-verstrooiing
Na het werk van Gell-Mann is er natuurlijk uitgebreid gezocht naar quarks. Dit werk, dat uit ging van de mogelijkheid dat quarks als vrije deeltjes voorkomen, is zonder resultaat gebleven. Toch zijn er in een aantal experimenten overtuigende bewijzen gevonden voor het feit dat baryonen en mesonen daadwerkelijk zijn opgebouwd uit de quarks van Gell-Mann. We zullen in dit hoofdstuk twee experimenten behandelen. Dat is in de eerste plaats diep-inelastische verstrooiing van electronen aan protonen, en ten tweede de productie van hadronen bij electron-positron annihilatie. Dit laatste experiment geeft tevens een aanwijzing voor de zogenaamde kleur-eigenschap van quarks. Bij diep-inelastische verstrooiing worden hoog-energetische electronen verstrooid aan protonen (zie fig. 9.1). De verstrooiing vindt plaats door uitwisseling van een foton. We kijken dus als het ware met het uitgewisselde foton in het proton, en om zo klein mogelijke structuren te kunnen waarnemen, moeten we dus zoveel mogelijk energei in het foton steken. Bij dit proces valt in het algemeen het proton uiteen in hadronen, vandaar de naam diep-inelastische verstrooiing. We vergelijken diep-inelastische verstrooiing met het proces eµ → eµ. De uitwisseling van ´e´en foton is ook in dit proces dominant, en kan geheel met QED berekend worden. De kinematica in het laboratoriumsysteem is wordt beschreven met de volgende variabelen (zie fig. 9.2): p = (M, 0) k = (E, ~k) k 0 = (E 0 , k~0 )
(muon-impuls) (electron-impuls, in) (electron-impuls, uit)
73
De vier-impuls van het foton, q = k − k 0 , voldoet aan q 2 = (k − k 0 )2 = −2kk 0 = −2EE 0 + 2~k · k~0 = −2EE 0 + 2|~k||k~0 | cos θ = −2EE 0 (1 − cos θ) = −4EE 0 sin2 θ/2 ,
(9.5)
waarbij we me , de massa van het electron, verwaarloosd hebben. q is de impulsoverdracht van het electron naar het muon. Een andere nuttige variabele is: ν≡
p·q 1 = (E − E 0 ) · M = E − E 0 , M M
(9.6)
het energieverlies van het electron. M is hier de massa van het stilstaande target.
Figuur 9.1 Feynman diagram voor diep-inelastische verstrooiing van electronen aan protonen (a), en het Feynman diagram voor verstrooiing van een electron aan een muon (b). Beide processen worden gedomineerd door ´e´en-foton uitwisseling.
Figuur 9.2
Kinematica van ep → eX en eµ → eµ in het laboratorium systeem.
Nu zijn voor het elastisch proces eµ → eµ q 2 en ν niet onafhankelijk. We vinden met (9.5) en (9.6): q 2 = (p − p0 )2 = 2M 2 − 2M(E + M − E 0 ) = −2Mν .
(9.7)
In termen van deze variabelen kunnen we de werkzame doorsnede dσ/dΩ voor het
74
proces eµ → eµ uitrekenen. We vinden15 d2 σ α2 E 0 q2 µν = 4 lµν (e)l (µ)δ(ν + ) dE 0 dΩ q E 2M " # 4α2 0 2 q2 q2 2 θ 2 θ = cos ( (E ) ) − sin ( ) δ(ν + ), q4 2 2M 2 2 2M
(9.8) (9.9)
met α = e2 /4π. Hierbij hebben we gebruik gemaakt van het feit dat uit (9.5, 9.7) volgt dat: e . (9.10) E0 = E 1 + 2 M sin2 ( 2θ ) Integreren we nu nog over E 0 dan vinden we: cos2 ( θ2 ) dσ α2 θ q2 = tan2 ( ) . 1 − 4 θ 2 θ E 2 2 dΩ 2M 2 4E sin ( 2 ) 1 + 2 M sin ( 2 ) "
#
(9.11)
De eerste term is de gebruikelijke doorsnede voor Rutherford verstrooiing van een geladen (scalair) deeltje aan een Coulomb potentiaal. De tweede factor is een correctie die de spin van de deeltjes en de eindige massa van het target, en dus de terugstoot-energie, in rekening brengt. Het product van de eerste twee bijdragen staat bekend als Mott-verstrooiing. De laatste term is een gevolg van het feit dat spin-1/2 deeltjes een magnetisch moment hebben. In het eµ-proces worden beide vertices gegeven door QED. Het proton is echter geen puntdeeltje, maar heeft een ladingsverdeling, zodat we voor het proton een ander resultaat krijgen. De werkzame doorsnede is nu van de vorm: α2 E 0 d2 σ = |M|2 , met |M|2 = lµν (e)Wµν (p) . dE 0 dΩ q4 E
(9.12)
Hier is lµν (e), het effect ten gevolge van de eeγ-koppeling, bekend. Er geldt qµ lµν (e) = 0, vanwege stroombehoud. De vraag rest nu wat Wµν is. We schrijven alle mogelijke termen op, en aangezien Wµν van p en q af kan hangen vinden we: pµ pν qµ qν pµ qν + pν qµ Wµν = −gµν W1 + W2 + W4 + W5 . (9.13) 2 2 M M M2 met vier willekeurige functies W1 , W2 , W4 , W5 , die van ν en q 2 kunnen afhangen16 . 15
In dit college zullen we de berekening van werkzame doorsneden en vervalstijden niet behandelen. In de standaardwerken over quantumveldentheorie, zoals [21] wordt in detail beschreven hoe dergelijke berekeningen gedaan worden. 16 De naamgeving suggereert het bestaan van een vijfde functie, W3 . Er is inderdaad nog een vijfde mogelijkheid, namelijk µνλρ pλ qρ W3 . De tensor µνλρ is is echter niet invariant onder pariteitstransformaties. Aangezien de zwakke interactie bij dit proces geen rol speelt, kunnen we W3 meteen weglaten.
75
Alleen de eerste twee termen doen mee vanwege stroombehoud. Het resultaat is: θ 4α2 0 2 θ d2 σ = (E ) W2 (ν, q 2 ) cos2 ( ) + 2W1 (ν, q 2 ) sin2 ( ) 0 4 dE dΩ q 2 2 "
#
(9.14)
W1 en W2 kunnen dan gemeten worden voor verschillende waarden van ν en q 2 (waarbij altijd geldt dat q 2 + 2Mν ≥ 0).
Figuur 9.3 Plot van q 2 en ν. Lijnen onder een hoek van 45◦ corresponderen met exclusieve processen. Merk op dat bij dit inelastisch proces q 2 en ν onafhankelijke kinetische variabelen zijn. Nog steeds geldt (9.5), maar van (9.6) geldt nu alleen de definitie van ν. In fig. 9.3 geven we een beeld van het kinematisch bereik van de variabelen q 2 en ν. De lijn −q 2 = 2Mν komt overeen met p2X = M 2 , elastische verstrooiing. Andere lijnen onder 45◦ hebben vaste p2X , dus corresponderen b.v. met p2X = M∆2 , de massa van een resonantie. Dit zijn exclusieve processen, waarbij naar een specifieke eindtoestand gekeken wordt (bijvoorbeeld ep → e∆). In inclusieve processen wordt niet naar een specifieke eindtoestand gekeken. We defini¨eren dan: q2 (9.15) 2Mν met 0 ≤ x ≤ 1, en kijken bij vaste x. Het blijkt nu dat bij vaste x en grote q 2 (diepinelastisch) W1 en νW2 alleen onafhankelijk zijn van q 2 (dit heet Bjorken-scaling). Dan hebben we dus: x2 = −
MW1 (ν, q 2 ) → F1 (x) ,
νW2 (ν, q 2 ) → F2 (x) .
(9.16)
We vergelijken dit met het eµ → eµ resultaat, waarbij we het resultaat (9.9) omq2 ) = δ(1 − x2 )/ν geldt: schrijven naar de parameter x. Met δ(ν + 2M d2 σ 4α2 0 2 1 x2 2 θ 2 θ = (E ) cos ( ) + sin ( ) δ(1 − x2 ) . dE 0 dΩ q4 ν 2 M 2 "
#
(9.17)
We zien dat het resultaat voor Wi , dat wil zeggen de afhankelijkheid van x alleen, overeenkomt met het resultaat voor verstrooiing aan puntdeeltjes. Het experimentele resultaat voor de diep-inelastische ep verstrooiing geeft daarom een belangrijke aanwijzing voor het feit dat het proton bestaat uit puntdeeltjes, die door het
76
foton met grote q 2 worden waargenomen. Het uiteindelijk resultaat, dat we hier niet in detail zullen bespreken, is dat diep-inelastische ep verstrooiing overeenkomt met de verstrooiing aan geladen, vrije, puntvormige bestanddelen. Deze kunnen we identificeren met de quarks. Dat de quarks zich in het gegeven kinematische gebied als vrije deeltjes gedragen zullen we in hoofdstuk 10 nog bespreken. Deze experimenten [54, 55] hebben in 1990 de Nobelprijs voor de natuurkunde opgeleverd voor Friedman, Kendall en Taylor. De experimenten werden eind jaren zestig gedaan met de lineaire electron versneller (SLAC) van Stanford in de U.S.A., met electron energie¨en van 7 to 17 GeV. Met de versneller HERA in Hamburg, waarbij voor zowel de electronen als de protonen opslagringen gebruikt worden, worden 30 Gev electronen en 800 GeV protonen gebruikt. De energie is dus vele malen groter dan bij SLAC, zodat wellicht zelfs een eventuele structuur van quarks bekeken kan worden. 9.4
Experimentele aanwijzingen voor kleur
Het tweede experiment dat het bestaan van quarks aannemelijk maakt is de e+ e− annihilatie met hadronen in de eindtoestand: e+ e− → hadronen. We zullen dit weer vergelijken met een proces dat we met QED goed kunnen beschrijven (zie fig. 9.4): e+ e− → µ+ µ− . (9.18)
Figuur 9.4 QED Feynman diagram voor het proces e+ e− → µ+ µ− (a). In de tweede figuur (b) geven we de kinematica van dit proces in het zwaartepuntsysteem. De werkzame doorsnede voor dit proces, gemiddeld over spins van de begintoestand en gesommeerd over de spins van de eindtoestand is: dσ e4 ∼ 2 (1 + cos2 θ); dΩ E
σtot ∼
e4 , E2
(9.19)
met E de energie van het electron in het zwaartepuntssysteem, en θ de hoek tussen het muon en het electron. De factor 1 + cos2 θ is typisch voor spin- 12 deeltjes. Vanzelfsprekend is (9.19) alleen geldig als de totale energie kleiner is dan de massa
77
van het Z-boson. Anders treedt een tweede diagram op waarin het foton vervangen is door het Z-boson. De factor e4 is ontstaat door het product qe2 qµ2 , waarbij q de lading van het deeltje is. We veronderstellen dat het proces e+ e− → hadronen verloopt als aangegeven in fig. 9.5. Het foton geeft een quark-anti-quark paar, dat daarna door de sterke wisselwerking overgaat in hadronen. De precieze vorm van deze hadronisatie is voor ons niet van belang. De essenti¨ele koppeling is dus weer die van een foton aan geladen puntdeeltjes, de quarks. We vinden dus (9.19) σtot ∼
qe2 X 2 q , E 2 quarks quarks
(9.20)
waarbij de som genomen wordt over alle quark-anti-quark paren die bij energie E gemaakt kunnen worden.
Figuur 9.5 Het proces e+ e− → hadronen. We veronderstellen dat alle hadronen ontstaan vanuit een quark-anti-quark paar. De functie:
2 σtot (hadronen) quarks qquarks = (9.21) R= σtot (µ+ µ− ) e2 is dus een stapfunctie van de energie. Steeds als de energie weer een drempel voor productie van de volgende quark passeert, wordt R groter. Beschouw de waarde van R voor 2E > 10GeV. We vinden dan experimenteel dat R = 11/3. De som van q 2 voor de verschillende quarks bij deze energie is echter:
P
1 1 4 1 11 4 = + + + = (u, d, s, c, b) , 9 9 9 9 9 9 een factor drie te klein. Overigens is het stapgedrag van R goed te zien bij 3 GeV, de energie van het c¯ c-paar. De vorm van R als functie van de energie is wel goed, maar R is drie maal groter dan op grond van de ladingen alleen verwacht. Dit is in dit experiment te verklaren door te veronderstellen dat het aantal quarks drie maal zo groot is als we tot nog toe dachten [56, 57]. Dat er een extra vrijheidsgraad met drie toestanden moet zijn, wordt ook vereist door het quarkmodel. Het deeltje ∆++ (1232), een ∆-resonantie met spin 3/2 en
78
lading 2, is volgens het quarkmodel opgebouwd uit drie up-quarks: ∆++ = (uuu). Als we ervan uitgaan dat de quarks geen onderling baan-impulsmoment hebben, dan moeten noodzakelijkerwijze twee van de quarks in dezelfde toestand zijn, en is de golffunctie symmetrisch onder verwisseling van die twee quarks. Dit is in strijd met het Pauli-principe voor spin-1/2 deeltjes. De ∆++ moet dus anti-symmetrisch zijn onder verwisseling van de quarks. Een oplossing van al deze problemen is het invoeren van het quantumgetal kleur. De u-quarks komen in drie soorten voor: ur , ug , ub waarbij de indices staan voor rood, groen en blauw. De quarkgolffunctie voor ∆++ zal dan zijn: ur1 ug2 ub3 + ub1 ur2ug3 + ug1 ub1 ur3 − ug1 ur2 ub3 − ub1 ug2 ur3 − ur1 ub2 ug3 ,
(9.22)
en dit is volledig anti-symmetrisch onder verwisseling van de drie quarks. We kunnen ook een kleurindex k met k = 1, 2, 3 gebruiken. We kunnen (9.22) dan schrijven als: ijk uiuj uk . (9.23) Als we met de kleurvrijheidsgraad een SU(3)-groep associ¨eren, dus als we de kleuren in elkaar over laten vloeien onder de transformatie: ui → Uij uj , U ∈ SU(3) ,
(9.24)
dan is (9.23) invariant onder SU(3). Immers: ijk Uil Ujm Ukn = lmn det U = lmn .
(9.25)
Aangezien we het kleur-quantumgetal niet in de gebonden toestanden toestanden terugvinden, moeten alle hadronen invariant (singlets) zijn onder SU(3). De enige mogelijkheden zijn dan ijk qi 0 qj 00 qk 000 ,
(9.26)
waarbij q 0 , q 00 en q 000 verschillende quark-flavours kunnen zijn. Dit zijn deeltjes met half-tallige spin, de baryonen. Daarnaast kunnen we de invariant q¯i 0 qi 00
(9.27)
construeren, de quark-anti-quark toestanden. Deze hebben heel-tallige spin, en komen met de mesonen overeen. Het volledige spectrum van de hadronen kan met dit quarkmodel gereconstrueerd worden. Het idee is nu dat sterke interacties ontstaan door wisselwerkingen tussen de gekleurde quarks, waarbij deze interacties weer bepaald worden door het principe van de locale ijkinvariantie. De hieruit voortvloeiende theorie zullen we in het volgende hoofdstuk behandelen.
79
10
Quantum Chromo Dynamica
De theorie voor de sterke interacties is gebaseerd op de wisselwerking tussen gekleurde quarks ψi , i = 1, 2, 3 (drie kleuren), en op het gebruik van het principe van ijkinvariantie. We zullen in dit hoofdstuk deze theorie (QCD) formuleren en analyseren. Een belangrijk begrip dat een grote rol speelt in QCD is asymptotische vrijheid [58, 59]. Dit kunnen we echter pas bespreken na een vrij uitgebreide discussie over renormalisatie in quantumveldentheorie. Daarbij zullen we weer gebruik maken van φ4 -theorie als voorbeeld. 10.1
Sterke interacties als ijktheorie
We nemen voorlopig aan dat er ´e´en soort (flavour) quark is, en drie kleuren. Dan is L = ψ¯i (i6 ∂ − m)ψi (10.1) invariant onder SU(3)-transformaties: ψi → ψi 0 = Uij ψj , U ∈ SU(3) .
(10.2)
We maken deze SU(3)-symmetrie tot een locale symmetrie door een covariante afgeleide in te voeren, tevens voegen we een kinetische term voor de ijkvelden toe: a F µνa . L = ψi (i6D − m)ij ψj − 41 Fµν
(10.3)
(Dµ ψ)i = (∂µ δ ij − igλaij Aaµ )ψj ,
(10.4)
Hierin is dus: waarbij de matrices λa een basis vormen voor de Lie-algebra van SU(3), en dus 3 × 3 hermitische, spoorloze, matrices zijn. Ze voldoen aan: [λa , λb ] = ifabc λc , tr λa λb = 21 δ ab .
(10.5) (10.6)
De dimensie van de groep SU(3) is acht, zodat we in (10.4) acht ijkvelden Aµ a hebben toegevoegd. Dit zijn de gluonen. De veldsterktetensor Fµν is als voorheen gegeven door: a Fµν = ∂µ Aaν − ∂ν Aaµ + gfabc Abµ Acν . (10.7) Een geschikte basis voor de λa werd al gegeven door Gell-Mann:
0 1 0 1 λ1 = 2 1 0 0 ; 0 0 0
0 −i 0 1 λ2 = 2 i 0 0 ; 0 0 0 80
1 0 0 1 0 −1 0 λ3 = 2 ; 0 0 0
0 0 1 1 λ4 = 2 0 0 0 ; 1 0 0
0 0 0 λ7 = 12 0 0 −i ; 0 i 0
0 0 −i 1 0 0 0 λ5 = 2 ; i 0 0
0 0 0 1 λ6 = 2 0 0 1 ; (10.8) 0 1 0
0 √ 1 0 0 λ8 = 61 3 0 1 . 0 0 −2
Voor meer dan ´e´en quark-flavour nemen we eenvoudig de som over de flavours, aangegeven door f , zodat (10.3) wordt: L=
X f
a ψ¯f,i (i6D − mf )ij ψf,j − 14 Fµν F µνa .
(10.9)
Deze theorie heet QCD: de dynamica van de kleurinteractie, ofwel quantum chromo dynamica. De interactie tussen quark en gluonen is voor elk soort quark hetzelfde. De massa’s mf kunnen we bijvoorbeeld gelijk nemen aan de massa’s die we in het standaard-model met het Higgs-mechanisme genereerden. Verder moeten we natuurlijk denken aan de vereiste toevoeging van Faddeev-Popov ghost velden voor de quantisatie van (10.9): LGF = −
1 (∂µ Aµa )2 + c†a u t ca + g(∂µ c†a )fbc a Aµc cb , 2a
(10.10)
voor covariante ijking. Vergelijkingen (10.9) en (10.10) samen leiden dan tot Feynman regels voor QCD. Voor ijkvelden en ghosts zijn deze al in sectie (3.3) gegeven. Daar moeten we nu aan toevoegen een Feynman regel voor de interactie tussen quarks en gluonen. Deze is van de vorm: ¯ : Aaµ ψψvertex a igγµ (λ )ij
(10.11)
Een aantal dingen willen we berekenen uit (10.9) en (10.10). Om te beginnen moet, zoals we in diep-inelastische ep-verstrooiing gezien hebben, een proton zich bij grote q 2 gedragen als een verzameling vrij puntdeeltjes, dat wil zeggen dat de quarks zich als vrije puntdeeltjes gedragen bij hoge q 2 , en dus bij kleine afstanden. Anderzijds mogen quarks niet als vrije deeltjes voorkomen: de theorie moet voorspellen dat de quarks door wisselwerking onderling en met gluonen bij elkaar blijven. Het eerste aspect is goed begrepen, voor het tweede is de verklaring uit QCD meer schetsmatig. Beide aspecten hebben te maken met het gedrag van Green functies als functie van de impulsen van de uitwendige lijnen. Het blijkt dat we
81
uit de renormalisatieprocedure informatie over de impulsafhankelijkheid kunnen afleiden. Voordat we dat in QCD zullen doen, is het wellicht goed deze procedure voor de wat eenvoudiger φ4 -theorie te herhalen. 10.2
Renormalisatie en countertermen: een voorbeeld
De actie die φ4 theorie defini¨eert is: S=
Z
d4 x
h
1 ∂ φ∂ µ φ 2 µ
− 21 m2 φ2 −
g 4i φ . 4!
(10.12)
Bij het college Quantumveldentheorie [1] hebben we reeds de renormalisatie procedure ge¨ıntroduceerd. Als we de tweepuntsfunctie voor φ berekenen dan vinden we in laagste orde: i . (10.13) D (2) (p) = 2 p − m2 De inverse propagator Γ is dan:
Γ(2) (p) = −i(p2 − m2 ) .
(10.14)
Dit verandert als we quantumcorrecties uit lusdiagrammen toevoegen. Dan krijgen we Γ(2) (p) = −i(p2 − m2 − Σ(p)) , (10.15) waarbij (−iΣ(p)) de som is van alle 1PI diagrammen (zie fig. 10.1).
Figuur 10.1 Bijdragen tot orde g 2 aan de zelfenergie van het re¨ele scalaire veld φ in φ4 -theorie. Tot orde g is de bijdrage aan Σ onafhankelijk is van de impulsen: Σ(p) = 21 igµ∆F (0) ,
(10.16)
Hierin is µ een parameter met de dimensie van een massa, die we invoeren om de koppelingconstante g bij dimensionele regularisatie dimensieloos te houden. = 4 − d, waarbij d het aantal dimensies is. Σ veroorzaakt dus een verschuiving van de
82
pool van de twee-puntsfunctie. De pool moet liggen bij de (eindige) fysische massa, ofwel: (10.17) lim 2 Γ(2) (p2 ) = 0 . p2 →mF
Dit betekent met de correctie (10.16): m2F = m2 + 21 igµ ∆F (0) gm2 + eindige termen . = m2 − 16π 2
(10.18)
Gegeven mF is dit een definitie van de (oneindige) parameter m2 .
Figuur 10.2 Bijdragen tot orde g 2 aan de 1PI vier-puntsfunctie Γ(4) in φ4 -theorie. Een soortgelijke procedure is nodig voor de vierpuntsfunctie. We vinden als correcties op Γ(4) de bijdragen in fig. 10.2. Deze zijn berekend in [1], met als resultaat: h 3g Γ(4) (p1 , . . . , p4 ) = −igµ 1 − + eindige constante termen 2 i 16π +C(p1 , p2 , p3 , p4 ) , (10.19)
waarbij de functie C naar nul gaat als de impulsen naar nul gaan. C en de niet expliciet gegeven constante termen zijn vanzelfsprekend van orde g. We kunnen de divergentie 1/ opnemen in een gerenormaliseerde koppeling gF met
i g 2 µ h 6 + eindige termen . (10.20) 32π 2 Deze definitie komt overeen met een relatie tussen gF en de eindige, meetbare, werkzame doorsnede voor elastische φφ-verstrooiing in de limiet van kleine impuls:
gF = gµ −
dσ ∼ lim |Γ(4) |2 ∼ gF2 . dΩ p→0 p→0
(10.21)
We hebben vanzelfsprekend de vrijheid om meer of minder constante eindige bijdragen in de renormalisatie op (10.20) op te nemen. Ook een andere definitie van gF , bijvoorbeeld bij een andere waarde van de impulsen in (10.21), is mogelijk.
83
Naast bovenstaande divergenties treedt nog een onafhankelijke divergentie op in de twee-lus diagrammen voor Σ. We kunnen een eindige, gerenormaliseerde Γ(2) r defini¨eren door i lim 2 Γ(2) = 1. (10.22) r 2 2 p − m2F p →mF Dit kan worden bereikt door aan Γ(2) een multiplicatieve renormalisatieconstante toe te voegen: (2) Γ(2) (10.23) r = Zφ (g, m1 , µ)Γ (p, m1 , µ) ,
waarbij Zφ en Γ(2) in het rechterlid divergent zijn, maar Γ(2) eindig. Zφ heet de r golffunctie renormalisatie constante. Zoals we al besproken hebben, zit er in deze procedure een zekere willekeur. We hebben de vrijheid om de renormalisatiecondities, (10.17, 10.21, 10.22) anders te kiezen. Bovendien zijn we natuurlijk vrij in de keuze van de parameter µ. Dit zal in het algemeen andere Green functies opleveren, maar uiteindelijk leiden tot dezelfde fysische grootheden als werkzame doorsneden en vervalstijden. Om de afhankelijkheid van de Green functies van het renormalisatieschema te onderzoeken is het handig de renormalisatie uit te voeren met behulp van countertermen. Deze formulering is volledig equivalent aan wat we eerder in deze sectie besproken hebben. We beginnen ook hier met (10.12), maar beschouwen m en g nu als fysische waarden van massa en koppelingsconstante. We berekenen vervolgens de Green functie Γ(2) en Γ(4) . In laagste orde voldoen deze dan aan (10.17, 10.21, 10.22). De correcties van orde g en hoger zorgen echter dat aan deze condities niet meer voldaan is. We lossen dit probleem op door aan de actie extra termen, countertermen, toe te voegen die de fout herstellen17 . We beginnen opnieuw met de twee-puntsfunctie en de fysische massa. De orde g correctie op de twee-puntsfunctie zal de positie van de pool van de propagator veranderen. Om dit te voorkomen voeren we een extra term, een counterterm, toe aan de Lagrangedichtheid. Deze is van de vorm: L1 = − 21 δm2 φ2 .
(10.24)
Dit levert een nieuwe Feynman regel, want we vatten deze term op als een extra interactie. De nieuwe regel is: φ2 counterterm vertex : − 21 iδm2 17
(10.25)
Deze methode om te renormaliseren wordt in de meeste boeken over quantumveldentheorie besproken. Veel auteurs vallen bij de behandeling van dit onderwerp (en vele andere onderwerpen) terug op de colleges die S. Coleman gegeven heeft voor de zomerschool in Erice. Deze zijn gebundeld in [60].
84
Met deze nieuwe regel berekenen we nogmaals Γ(2) tot orde g. Het resultaat is nu:
Γ(2) = −i p2 − m2 − 21 igµ ∆F (0) + δm2 , zodat we zien dat de pool van de propagator bij de fysische massa blijft als we kiezen gm2 + eindige termen . (10.26) δm2 = 12 igµ ∆F (0) = − 16π 2 Op soortgelijke wijze kunnen we de ´e´en-lus bijdrage aan de vier-puntsfunctie behandelen. We voegen daar aan L toe: L2 = −gµ Bφ4 /4! ,
(10.27)
waarbij dan de constante B zodanig bepaald wordt dat ook na de ´e´en-lus correcties aan de renormalisatieconditie (10.21) voldaan is. We vinden een nieuwe Feynman regel: φ4 counterterm vertex : −igµ B/4!
(10.28)
Deze regel gebruiken we nu in de berekening van de vier-puntsfunctie. We vinden vanzelfsprekend: h
Γ(4) (p1 , . . . , p4 ) = −igµ 1 + B − i
+C(p1 , p2 , p3 , p4 ) .
3g + eindige constante termen 16π 2 (10.29)
Als we nu opnieuw aan (10.21) willen voldoen dan moeten we dus kiezen: B=
3g − eindige constante termen 16π 2
(10.30)
Figuur 10.3 Twee extra bijdragen aan de twee-puntsfunctie tot orde g 2 ten gevolge van de countertermen (10.24) en (10.27).
85
Voor de golffunctie renormalisatie kijken we nu opniew naar de diagrammen van orde g 2 in de twee-puntsfunctie. We hebben nu twee nieuwe vertices van orde g, zodat er twee extra bijdragen zijn. Deze zijn gegeven in fig. 10.3. Toch is het totale resultaat nog divergent, en dwingt ons tot het invoeren van de golffunctie renormalisatie constante. Wanneer we countertermen gebruiken, komt dit erop neer dat we een counterterm van de vorm: L3 = 12 A(∂µ φ)2
(10.31)
moeten toevoegen. Het is duidelijk dat deze correctie de propagator be¨ınvloedt, en dat we door deze constante geschikt te kiezen ervoor kunnen zorgen dat aan (10.22) voldaan is. De totale actie is, na het toevoegen van de drie countertermen: Lren = L + LCT
+ A)(∂µ φ)2 − 21 (m2 + δm2 )φ2 − (1 + B)
=
1 (1 2
=
1 (∂ φ)2 Zφ 2 µ
=
1 (∂ φ )2 2 µ B
− 21 m2B φ2 Zφ −
− 21 m2B φ2B −
1 gB φ4 Zφ2 4!
gµ 4 φ 4!
1 gB φ4B 4!
(10.32) (10.33)
met: φB = (Zφ )1/2 φ ; mB = Zm ; gB = µ Zg g ;
Zφ = 1 + A 2 Zm = (m2 + δm2 )(Zφ )−1 Zg = (1 + B)(Zφ )−2
(10.34)
Het subscript B staat voor ”bare”: de kale parameters zijn oneindig in dit model en worden via renormalisatieconstantes Z uitgedrukt in de fysische, eindige parameters. De Lagrangedichtheid (10.33) heeft precies dezelfde vorm als de oorspronkelijke Lagrangedichtheid in (10.12), maar met andere waarden van de parameters. Het resultaat (10.33) wordt ook wel de gerenormaliseerde Lagrangedichtheid genoemd. 10.3
Green functies en asymptotische vrijheid
We willen nu met de Lagrangedichtheid (10.32) een Green functie D (n) berekenen. Vanwege D (n) ∼< φ(x1 ) · · · φ(xn ) > zal gelden −n/2
D (n) (p1 , . . . , pn , mB , gB , ) = Zφ
(n)
DB (p1 , . . . , pn , mB , gB , ) ,
(10.35)
waarbij DB dezelfde Green functie is uitgerekend met (10.33). Voor de 1PI Green functie geldt dan: n/2 (n)
Γ(n) (p, mB , gB , ) = Zφ ΓB (p, mB , gB , ) .
86
(10.36)
We zullen de afhankelijkheid van de n impulsen pi samenvatten in de impuls p. De extra factoren Zφ ontstaan omdat de 1PI Green functies geamputeerd zijn, en dus geen uitwendige propagatoren meer bevatten. Het linkerlid van (10.36) is eindig als → 0. Het is immers de Green functie uitgerekend met de Lagrangedichtheid m´et de countertermen. We kunnen natuurlijk Γ(n) uitdrukken in m, g en µ door gebruik te maken van (10.34). Dit levert het volgende resultaat op: (n)
−n/2 (n)
ΓB (p, mB , gB , ) = Zφ
Γ
(p, m, g, µ, ) .
(10.37)
In deze vergelijking vatten we nu m en g op als functies van mB , gB en µ. Dan is het linkerlid van (10.37) onafhankelijk van µ, en geldt: µ
∂ (n) Γ =0⇒ ∂µ B # " ∂ ∂g ∂ ∂m ∂ n ∂ ln Zφ (n) Γ = 0. µ +µ +µ −µ ∂µ ∂µ ∂g ∂µ ∂m 2 ∂µ
(10.38)
Definieer nu: m ∂g , ) ≡ µ , µ ∂µ ∂ ln Zφ m γd (g, , ) ≡ 12 µ , µ ∂µ µ ∂m ∂ ln m2 m = . γm (g, , ) ≡ 12 µ µ ∂µ m ∂µ β(g,
(10.39) (10.40) (10.41)
De functies β, γd, γm zijn dimensieloos en moeten dus geschreven kunnen worden in termen van dimensieloze grootheden. Daarom hangen ze alleen van m/µ af en niet van m of µ apart. Ze staan bekend onder de naam renormalisatiegroep functies. ∂ We kunnen ook op geheel andere wijze informatie krijgen over µ ∂µ Γ. Veron(n) derstel dat we in Γ (p, m, g, µ, ) een verandering van energieschaal uitvoeren: p → tp, m → tm, µ → tµ. Alle grootheden met de dimensie van een massa worden dus met t vermenigvuldigd. De dimensie van Γ(n) is dim Γ(n) = −n + 4 + 21 (n − 2) ,
(10.42)
waarbij = 4 − d. Dat kunnen we als volgt nagaan. De dimensie van een scalair veld in d dimensies is (d − 2)/2. Een Green functie wordt gegeven door D (n) (x1 , . . . , xn ) ∼< φ(x1 ) · · · φ(xn ) >, zodat dim D (n) gelijk aan n(d − 2)/2. Dus is de dimensie van D (n) (p) gelijk aan n2 (d − 2) + d(1 − n), omdat de Green functie in de impulsruimte wordt gekregen door integratie over de d ruimtelijke co¨ordinaten, waarbij dan nog een δ-functie δ(p1 + . . . + pn ) in de d-dimensionale impulsruimte
87
wordt verwijderd. Verder worden nog de uitwendige propagatoren geamputeerd om uiteindelijk Γ(n) te krijgen. We zien dus: n (d − 2) + d(1 − n) + 2n 2 = 4 − n + 21 (n − 2) .
D ≡ dim Γ(n) =
(10.43)
Als we nu de impulsen herschalen in Γ(n) dan vinden we: Γ(n) (tp, tm, g, tµ, ) = tD Γ(n) (p, m, g, µ, ) ,
(10.44)
Γ(n) (tp, m, g, µ, ) = tD Γ(n) (p, t−1 m, g, t−1µ, ) ,
(10.45)
ofwel: zodat: t
∂ (n) Γ (tp1 , . . . , tpn , m, g, µ, ) = ∂t" # ∂ ∂ D (n) D−m t Γ (p, t−1 m, g, t−1 µ, ) . −µ ∂m ∂µ
(10.46)
De herschaling geeft dus: "
#
∂ ∂ ∂ µ +m + t − D Γ(n) (tp, m, g, µ, ) = 0 , ∂µ ∂m ∂t
(10.47)
∂ (n) waarbij we weer gebruik hebben gemaakt van (10.45). We kunnen nu µ ∂µ Γ oplossen uit (10.38) en (10.47). Het resulaat is:
#
"
∂ ∂ ∂ −β + nγd − D Γ(n) (tp, m, g, µ, ) = 0 . t − m(γm − 1) ∂t ∂m ∂g
(10.48)
Dit is een belangrijke vergelijking, de zogenaamde renormalisatiegroep18 vergelijking. Als we (10.48) kunnen oplossen, dan kennen we het gedrag van Γ(n) onder een herschaling van de impulsen. De onbekenden zijn γm − 1, β en γd . Deze moeten we uit de storingsreeks bepalen. Merk op dat als γm − 1 = β = γd = 0, de tafhankelijkheid geheel bepaald wordt door D, de dimensie van Γ(n) . Dus geven β, γm − 1 en γd de afwijking aan van het “normale” schalingsgedrag van Γ(n) . Hoe kunnen we echter (10.48) op lossen? Het probleem is dat γm , γd en β zowel van g als van m/µ kunnen afhangen. We zullen straks zien dat er een renormalisatievoorschrift is, zodanig dat er in de renormalisatiegroep functies geen afhankelijkheid van m/µ is. Dan is het eenvoudig een oplossing van (10.48) te vinden. 18
Dit is een onderwerp dat inmiddels ook in de leerboeken is opgenomen. Zie bijvoorbeeld [61].
88
Hiervoor voeren we in g¯(t) en m(t) ¯ met: d¯ g (t) = β (¯ g (t)) , g¯(t = 1) = g , dt dm(t) ¯ = m(t) ¯ (γm (¯ g (t)) − 1) , m(t ¯ = 1) = m . t dt t
(10.49) (10.50)
Dan is Γ
(n)
D
(tp, m, g, µ) = t Γ
(n)
(p, m(t), ¯ g¯(t), µ) exp ( − n
Z
1
t
dt0 γd (¯ g (t0 ))) 0 t
(10.51)
een oplossing van (10.48). Dit kunnen we gemakkelijk expliciet verifi¨eren. In feite is (10.51) het belangrijkste resultaat van dit hoofdstuk. Het vertelt ons dat het gedrag van Green functies bij herschaalde impulsen bepaald wordt door effectieve, schaal afhankelijke koppelingen en massa’s g¯(t) en m(t). ¯ Deze worden de ”running” koppelingsconstanten en massa’s genoemd. We moeten wel g¯(t) en m(t) ¯ op kunnen lossen uit (10.49, 10.50). Dat kan door rechtstreekse berekening van β, γm en γd uit storingstheorie. Duidelijk is dat β(0) = 0 als er geen interacties zijn. Interessant is nu de vraag of β(g) nog andere nulpunten heeft. In fig. 10.4a geven we een mogelijk gedrag van β als functie van g aan. De nulpunten van β noemen we ”fixed points”, fixpunten. Als β > 0 dan is g 0 (t) > 0 en g neemt dus toe bij toenemende t, en gaat naar g0 . Voor β < 0 (g > g0 ) geldt juist dat bij toenemende t g afneemt naar g0 . Dus een nulpunt met dβ/dg < 0 is een ultraviolet fixpunt, g zal naar de waarde in het fixpunt naderen voor toenemende t. Omgekeerd is een nulpunt met dβ/dg > 0 een infrarood fixpunt.
Figuur 10.4 Twee manieren waarop de β-functie zich kan gedragen als functie van g. In geval (a) is g = 0 een infrarood fixpunt, en g = g0 een ultraviolet fixpunt. In geval (b) is g = 0 een ultraviolet fixpunt, en is er asymptotische vrijheid. Een andere mogelijkheid is aangegeven in fig. 10.4b. Nu is g = 0 een ultraviolet fixpunt: voor grote impulsen nadert g(t) naar nul en gedragen de deeltjes zich effectief vrij. Deze eigenschap heet asymptotische vrijheid. Anderszijds is nu g0 infrarood fixpunt.
89
We zien dus dat het gedrag van β voor kleine g, dat we betrouwbaar kunnen uitrekenen in storingstheorie, essentieel is voor het optreden van asymptotische vrijheid. Op grond van de al eerder besproken fysica van QED en QCD zouden we hopen en verwachten dat in QED β(e) > 0 voor kleine e, en in QCD β(g) < 0 voor kleine g. 10.4
De β-functie voor φ4 theorie
Voordat we daadwerkelijk een berekening kunnen uitvoeren, moeten we eerst laten zien dat er inderdaad geen m/µ-afhankelijkheid is in de functies β, γm en γd , voor een geschikt gekozen renormalisatie procedure. Deze procedure is heel eenvoudig: we kiezen de renormalisatieconstantes zo, dat ze geen eindige delen bevatten. Meer precies is het voorschrift als volgt: we kunnen gB , mB en Zφ ontwikkelen in een Laurentreeks in 1/ (zie [61]): gB m2B Zφ
∞ a (g, m ) i X k m µ = µ a0 (g, , ) + , k µ k=1 ∞ b (g, m ) i h X k m µ 2 , = m b0 (g, , ) + k µ k=1
h
(10.52)
∞ c (g, m ) X k m µ = c0 (g, , ) + , k µ k=1
waarin de co¨effici¨enten ai , bi , ci dimensieloos zijn. Zo vonden we: Γ(4) = −igµ (1 −
3g + eindige termen), 16π 2
(10.53)
hetgeen leidde tot:
3g + eindige termen. (10.54) 16π 2 Welke eindige stukken aan de renormalisatieconstanten worden toegevoegd hangt af van het renormalisatievoorschrift, en we besluiten nu geen eindige stukken toe te voegen. Dat betekent in ons voorschrift dat a0 = g, a1 = 3g 2/16π 2 en, in een 1-lus benadering, ak = 0 voor k > 2. Deze termen zijn massa-onafhankelijk. De reden is, dat we met deze procedure alleen naar de echte ultraviolet divergenties kijken; elke pool in correspondeert met het extreme ultraviolet gedrag van een impulsintegraal. We verwachten dat dit gedrag onafhankelijk is van de massa’s in het model. Met deze procedure geldt: B=
h
gB = µ g +
∞ X
ak (g) i . k k=1
90
(10.55)
Beschouw nu weer gB als onafhankelijk, en dus g afhankelijk van gB en µ. Dan: 0 = µ
∞ X ak (g) i ∂ h µ (g + ⇒ k ∂µ k=1
0 = (g +
∞ X
∞ X ak a0k ∂g ) + µ (1 + ). k k ∂µ k=1 k=1
(10.56)
Hiermee kunnen we nu β ontwikkelen: β(g) = −(g +
∞ X
∞ X ak a0 k −1 )(1 + ) k k k=1 k=1
= −g − a1 + ga01 ,
(10.57)
want vanwege het feit dat β(g) eindig is kunnen geen termen in 1/ voorkomen. We vinden dus voor φ4 theorie dat β(g) = +
3g 2 16π 2
(10.58)
als ´e´en-lus resultaat. We zien dat β(g) > 0, zodat φ4 theorie niet asymptotisch vrij is. Merk op dat de eindigheid van β in (10.57) voor → 0 relaties tussen ak+1 en ak vereist: ak+1 − ga0k+1 + ak (−a1 + ga01 ) = 0 . (10.59) Dit kan voor φ4 -theorie vanzelfsprekend expliciet geverifieerd worden voor de lage orden in de storingsreeks (en voor kleine k). We zien dat voor φ4 -theorie g = 0 geen ultraviolet fixpunt is. Vergelijking (10.49) wordt nu voor het ´e´en-lus resultaat: t
d¯ g 3¯ g2 = , dt 16π 2
(10.60)
met als oplossing: g¯(t) = g¯(1)/(1 −
3 3 g¯(1) ln t) = g/(1 − g ln t) . 2 16π 16π 2
(10.61)
We zien dat g¯(t) een pool heeft, de zogenaamde Landau-pool. Dit lijkt een catastrofe voor φ4 -theorie, want de Green functies zouden dan een singulariteit bevatten voor voldoende grote impulsen. We moeten ons echter realiseren dat als g¯(t) groot wordt de ´e´en-lus storingsrekening niet meer betrouwbaar is. Algemeen zij opgemerkt dat de renormalisatiegroep functies β, γm en γd afhangen van de manier waarop we de eindige gedeelten bij de renormalisatie behandelen. Er kan bewezen worden dat de plaats van de fixpunten van β(g), alsmede het teken van de eerste afgeleide, onafhankelijk zijn van het gekozen voorschrift.
91
10.5
De β-functie in Yang-Mills theorie
In deze sectie willen we de β-functie voor Yang-Mills theorie gekoppeld aan fermionen berekenen. Zoals we in de vorige sectie gezien hebben, doen we er dan verstandig aan bij de renormalisatie alleen de divergente bijdragen aan de n-puntsfuncties in de countertermen op te nemen. Dat blijkt bovendien de berekeningen aanzienlijk te vereenvoudigen. Laten we eerst kijken naar de divergentiegraad van Feynman diagrammen in Yang-Mills theorie, Dit geeft ons een idee van de divergente diagrammen die we mogen verwachten. Daarbij zij opgemerkt, dat de divergentiegraad groter kan zijn dan de werkelijke divergentie van een diagram, net zoals dat bij QED het geval is. In een typisch diagram in Yang-Mills theorie hebben we n3 n4 nf ng Ev Ef Iv If Ig
vertices met drie gluonen vertices met vier gluonen vertices met een gluon en twee fermionen vertices met een gluon en twee ghosts externe gluon lijnen externe fermion lijnen interne gluon-lijnen interne fermion lijnen interne ghost lijnen.
De divergentiegraad in d dimensies is dan: D = dL − 2Iv − If − 2Ig + n3 + ng .
(10.62)
De vertex met drie gluonen en de ghost-ghost-gluon vertex zijn impuls afhankelijk, en treden hier dus ook op. L is het aantal lussen, dat gelijk is aan het aantal onafhankelijke impulsen waarover ge¨ıntegreerd wordt. Er geldt: L = Iv + If + Ig − (n3 + n4 + +nf + ng ) + 1 .
(10.63)
De aantallen interne lijnen zijn weer uit te drukken in de aantallen externe lijnen en het aantal vertices. De relaties zijn: 4n4 + 3n3 + nf + ng = 2Iv + Ev , 2nf = 2If + Ef , 2ng = 2Ig .
(10.64)
Dit geeft dan: D = − 21 (d − 2)Ev − 21 (d − 1)Ef + (d − 4)(n4 + 21 n3 + 21 nf + 12 ng ) + d ,
92
(10.65)
zodat we voor d = 4 vinden: D = 4 − Ev − 32 Ef .
(10.66)
Dit is hetzelfde resultaat als voor QED. Er is dus weer een eindig aantal primitieve divergenties, hetgeen een noodzakelijke voorwaarde is voor renormaliseerbaarheid. Dat de theorie inderdaad renormaliseerbaar is werd bewezen in [34, 35]. De renormaliseerbaarheid van de theorie garandeert dat de countertermen die bij de renormalisatie optreden dezelfde vorm hebben als de oorspronkelijke termen in de actie. Met deze kennis is het mogelijk de β-functie voor QCD te onderzoeken. We zullen dus nagaan wat het gedrag is van: β(g) ≡ µ
∂g . ∂µ
(10.67)
De koppelingconstante g is de coeffici¨ent van de vertex g ψ¯f,i γ µ (λa )ij ψf,i Aaµ ,
(10.68)
waarbij gesommeerd wordt over f , de verschillende soorten fermionen. In de actie waaraan de countertermen zijn toegevoegd zal de vorm van deze interactie zijn: gB ψ¯B f,i γ µ (λa )ij ψB f,j AB aµ = = gB Z2 (Z3 )1/2 ψ¯f,i γ µ (λa )ij ψf,j Aaµ = = gµ/2Z1 ψ¯f,i γ µ (λa )ij ψf,j Aa , µ
(10.69)
naar analogie met (10.32, 10.33). De kale koppelingsconstante is dus −1/2
gB = gµ/2Z1 Z2−1 Z3
.
(10.70)
De renormalisatie constanten zijn: Z1 : Z2 : Z3 :
voor de quark-quark-gluon vertex voor de fermion velden voor de gluon velden.
We zullen deze renormalisatieconstantes nu berekenen tot orde g 2 . De te berekenen diagrammen zijn getekend in fig. 10.5. Een deel ervan, de diagrammen (a1-a3) hebben we reeds uitgerekend in sectie (3.4). Daarnaast is er nog ´e´en bijdrage aan de vacuumpolarisatie, namelijk het diagram (a4) met de fermionlus. Op een groepsfactor na levert dit dezelfde bijdrage als in QED. De totale divergente bijdrage aan
93
de vacuumpolarisatie is dan: i (g µν p2 − pµ pν ) 16π 2 i (g µν p2 − pµ pν )Nf − 83 ig 2 tr λa λb 16π 2 g 2 δab µν 2 (g p − pµ pν ) (− 10 T + 38 TF Nf ) , = 3 A 2 16π
Πµν ab (p) =
10 2 ig fcd a f cdb 3
(10.71)
waarbij Nf het aantal soorten fermionen is.
Figuur 10.5 De ´e´en-lus diagrammen die in Yang-Mills theorie met fermionen die moeten worden berekend voor de bepaling van de β-functie. Merk op dat de bijdrage van het fermion op zichzelf transversaal is. Dat is natuurlijk vanzelfsprekend, want in het geval van QED is dat ook de enige bijdrage. Verder hebben we groepsfactoren ge¨ıntroduceerd: δ ab TA = fcd a f cdb ,
δ ab TF = tr λa λb ,
δij CF =
X
(λa λa )ij ,
(10.72)
a
die we ook al in Appendix A hebben besproken. Voor de geadjungeerde representatie maken we geen onderscheid tussen CA en TA . We kunnen zonder extra werk de berekening van de β-functie voor een willekeurige SU(N)-groep doen. De berekening van de vacuumpolarisatie levert ons de golffunctie renormalisatie constante Z3 : Z3 = 1 +
g 2 10 ( TA − 83 TF Nf ) . 16π 2 3
94
(10.73)
De berekening van de zelfenergie van het fermion zal ons Z2 opleveren. Opnieuw is dit diagram (b1) op een groepsfactor na gelijk aan het resultaat dat voor QED gevonden wordt. De berekening van het divergente deel van dit diagram levert: g2 (−p/ + 4m) 2 (λa λa )ij 16π 2 g2 (−p/ + 4m) 2 δij CF . = 16π 2
Σij (p) =
(10.74)
We vinden nu:
g2 2 CF . (10.75) 16π 2 Tenslotte zijn er nog de twee diagrammen die een vertex correctie geven, (c1) en (c2). Voor deze diagrammen vinden we de volgende divergente bijdragen: Z2 = 1 −
ig 3 µ b γ (λ λa λb )ij 8π 2 ig 3 µ γ (λa )ij (2CF − TA ) , = 16π 2 ig 3 µ (c2 ) = γ (λa )ij (3TA ) . 16π 2
(c1 ) =
(10.76)
De vertex correcties zijn over het algemeen het moeilijkst, in dit geval vallen de technische problemen mee ondat we ons beperken tot het divergente deel van het diagram. Het resultaat voor de bijbehorende renormalisatieconstante is: Z1 = 1 −
g2 (2CF + 2TA ) . 16π 2
(10.77)
We kunnen nu alle gegevens combineren en gB bepalen: gB = gµ
/2
g2 11 2 (− 1+ T + N ) . A f 3 3 16π 2
(10.78)
We hebben hierbij TF = 12 gekozen, onze gebruikelijke normering voor de fundamentele representatie. Merk op dat de twee factoren CF , die voorkomen in de diagrammen (b1) en (c1), tegen elkaar wegvallen. Dit kunnen we als volgt begrijpen. In QED zijn dit de enige bijdragen aan Z1 en Z2 (TA = 0 voor QED). De Ward-identiteit voor de drie-puntsfunctie in QED relateert een contractie van Γ(3) aan de fermion propagator. Aan deze identiteit is in QED alleen voldaan als Z1 = Z2 . Dit vinden we dan ook inderdaad. In Yang-Mills theorie zijn er ook andere bijdragen aan deze Ward-identiteit, en hoeven dus Z1 en Z2 niet aan elkaar gelijk te zijn.
95
Met TA = N vinden we nu de β-functie voor SU(N)-Yang-Mills theorie: g3 (− 11 β(g) = N + 23 Nf ) . 3 2 16π
(10.79)
Het gedrag van de β-functie wordt nu bepaald door het aantal quark-flavours, en β wordt positief als: N + 23 Nf > 0 ⇒ Nf > 11 N, − 11 3 2 terwijl β juist negatief wordt voor: Nf <
11 N 2
.
(10.80)
We concluderen dat QCD, met N = 3 en 6 soorten quarks, asymptotisch vrij is [58, 59]19 . Voor QED vinden we het volgende. Zoals eerder besproken geldt daar Z1 = Z2 , en dus komt alleen Z3 in gB voor. In Z3 doet alleen de term evenredig met Nf mee, nu met als interpretatie dat in principe alle geladen fermionen daar mogen voorkomen. De factor met het negatieve teken in (10.79) is afwezig, en QED is dus niet asymptotisch vrij. In de ´e´en-lus berekening voor QCD vonden we β(g) = −
g3 2 (11 − Nf ) ≡ −bg 3 . 2 16π 3
(10.81)
Dit betekent dat de koppelingsconstante g¯(g, t) voldoet aan de vergelijking: t
d¯ g = −b¯ g3 , dt
ofwel: g¯2 (t) =
g2 . 1 + 2bg 2 ln t
(10.82)
(10.83)
Voor grote t, dus voor grote impulsen, vinden we dat g¯(t) → 0 en dus asymptotische vrijheid. De afname met t is logaritmisch en daardoor langzaam. In termen van de sterke interactie ”fijnstructuur-constante” αs ≡ g¯2/4π geeft dit: αs (t) =
αs (1) . 1 + 8πb αs (1) ln t
We kunnen invoeren t2 =
q2 , µ2
19
(10.84)
(10.85)
Het negatieve teken van de β-functie in Yang-Mills theorie was al eerder bekend bij ’t Hooft (Triangle Conference, Marseille 1972), maar door hem niet gepubliceerd.
96
zodat (10.84) geschreven kan worden als: αs (q 2 ) =
αs (µ2 ) . 1 + 4πb αs (µ2 ) ln(q 2 /µ2 )
(10.86)
Hiermee hebben we een parameter αs (µ2 ) ≡ g 2 /4π geintroduceerd. Vergelijking (10.86) geeft de impulsafhankelijkheid van de effectieve sterke koppelingsparameter aan. In de literatuur wordt ook wel de parameter Λ gebruikt, gedefinieerd door: ln Λ2 = ln µ2 − hetgeen oplevert: αs (q 2 ) =
1 , αs (µ2 )4πb 4π
(11 −
2 N ) ln(q 2 /Λ2 ) 3 f
.
(10.87)
De parameter Λ moet dan door metingen van αs bij verschillende energie¨en bepaald worden. Als q 2 klein wordt in (10.87), wordt αs groter. We moeten er dan aan denken dat de storingtheorie dan eigenlijk niet meer opgaat. Hierdoor is het infrarood gedrag van QCD een verschijnsel dat niet goed met storingstheorie onderzocht kan worden. Experimenteel worden vrije quarks of gluonen niet waargenomen, hetgeen er op wijst dat de krachten tussen de deeltjes toenemen als de afstanden groter worden. Het gedrag van αs is daarmee in overeenstemming, maar kan natuurlijk niet als bewijs worden opgevat. De opsluiting of ’confinement’ van quarks is een probleem dat met heel andere technieken, zoals computersimulatie van de dynamica van QCD, onderzocht wordt.
97
11
Unificatie
In de vorige hoofdstukken hebben we het standaard model voor de electromagnetische, zwakke en sterke wisselwerkingen gepresenteerd. Laten we voorop stellen dat dit model werkt: het is volledig in overeenstemming met alle experimentele gegevens. Toch kunnen we ons, als theoretici, een aantal verbeteringen van het model voorstellen. In de eerste plaats zouden we graag gravitatie erin opnemen. Dat is nog altijd een onopgelost probleem, dat we echter in het kader van dit college niet verder zullen bespreken. Daarnaast zouden we graag een aantal parameters in het model willen verklaren, zoals de waarden van de drie koppelingsconstanten, en de fermion massa’s. In dit hoofdstuk zullen we een Grand Unification model bespreken dat aan een aantal van deze wensen voldoet. Het specifieke model dat we zullen behandelen is inmiddels in strijd met een aantal experimentele resultaten, en dus niet meer acceptabel. Maar we zullen het opvatten als een prototype van een grote klasse van dergelijke modellen, waarvan ´e´en misschien wel aan alle eisen voldoet. 11.1
Motivatie
Het standaard-model voor de sterke en electrozwakke wisselwerkingen is gebaseerd op de symmetriegroep SU(3) × SU(2) × U(1) . (11.1) Hierin is SU(3) de ijkgroep behorend bij de sterke interacties, en SU(2) × U(1) de ijkgroep van de zwakke en electromagnetische wisselwerkingen. Het model heeft de volgende parameters: koppelingsconstanten : αS , e, massa’s : 6 voor 6 voor menghoeken : 4 voor Higgs potentiaal : λ, µ
sin2 θ de leptonen de quarks 3 generaties
Verder zijn er nog een aantal aspecten die door het model weliswaar beschreven worden, maar niet uit ´e´en of ander achterliggend principe verklaard worden. Hierbij denken we bijvoorbeeld aan de quantumgetallen van de fermionen in SU(2) × U(1). Het is daarom een aantrekkelijke gedachte de drie interacties onder te brengen in ´e´en model, met ´e´en groep en ´e´en koppelingsconstante. Er zijn veel modellen van dit type ge¨ıntroduceerd, die een aantal eigenschappen ´en problemen gemeen hebben. Theoretisch gezien zijn ze echter aantrekkelijk en het is niet uitgesloten dat een variant van een dergelijk model met de werkelijkheid overeenkomt. Wij zullen ´e´en van deze modellen, het eenvoudigste, in dit hoofdstuk bespreken.
98
Wat we zoeken is een Lie-groep G , die de groep SU(3) × SU(2) × U(1) bevat. We willen maar ´e´en onafhankelijke koppelingsconstante hebben, dus moet G een simpele groep zijn, d.w.z. G mag niet uiteenvallen in een product van factoren, zoals (11.1). De rang van een groep is de dimensie van de grootste abelse ondergroep, oftewel het maximale aantal onderling commuterende generatoren. Voor (11.1) is dat 4 (in het algemeen: N − 1 voor SU(N)). Voor de (11.1) kunnen we als unificatie groep dus G = SU(5) kiezen. Het idee bij een unificatie is, dat de G -symmetrie via het Higgs-mechanisme breekt tot SU(3) × SU(2) × U(1). SU(3) × SU(2) × U(1) heeft 12 generatoren en SU(5) heeft er 24, dus moeten er 12 generatoren breken. De massa van de bij de gebroken ijksymmetrie horende velden moet groot zijn (omdat we de bij deze velden horende krachten (nog) niet kennen). Een tweede Higgs-mechanisme moet dan voor de massa van de W - en Z-bosonen zorgen. Dergelijke modellen heten GUT’s (Grand Unified Theories). Het prototype van de GUT werd ge¨ıntroduceerd in [62], de SU(5) theorie is in detail uitgewerkt in [63]. 11.2
De SU(5) structuur
Om te beginnen moeten we besluiten hoe we de materiedeeltjes, leptonen en quarks, zullen indelen in SU(5)-representaties. Er zijn per generatie 3×2×2 quarks en 3 leptonen in totaal dus 15 linkshandige fermionen (we tellen links- en rechtshandig afzonderlijk). De dimensie van een aantal bekende representaties van SU(N) is voor N = 5 gelijk aan: 5 10 15 24
: : : :
fundamentele representatie , anti − symmetrische representatie , symmetrische representatie , geadjungeerde representatie .
(11.2)
Het lijkt aantrekkelijk de vijftien fermionen van elke generatie onder te brengen in de symmetrische representatie. Dit blijkt echter niet te werken. Om in te zien waarom dit niet werkt moeten we beginnen de quantumgetallen van de fermionen voor SU(3) × SU(2) × U(1) verzamelen. Deze zijn gegeven in Tabel 11.1. Gebruik makend van de notatie (dim SU(3)-repr., dim SU(2)-repr.) vinden we dus: (3, 2) + 2(3, 1) + (1, 2) + (1, 1) . (11.3) Hoe splitsen de representaties van SU(5) op? We nemen de standaard inbedding van SU(3) × SU(2) × U(1) in SU(5): de fundamentele representatie van SU(5) transformeert dan onder SU(5) matrices U (5 × 5), waarin de ondergroepen als volgt terug te vinden zijn:
99
deeltje
SU(3)
SU(2)
U(1)
(u1 d1 )L , (u2 d2 )L , (u3 d3 )L
triplet
doublet
1 3
u1,R ,
u2,R ,
u3,R
triplet
singlet
4 3
d1,R ,
d2,R ,
d3,R
triplet
singlet
− 23
(ν , e)L
singlet
doublet
−1
eR
singlet
singlet
−2
Tabel 11.1 Representaties van de vijftien fermionen van de eerste generatie voor de symmetriegroep SU(3) × SU(2) × U(1). U=
"
SU(3) 0 0 SU(2)
#
,
(11.4)
terwijl de generator van U(1) gegeven wordt door (niet genormeerd):
Y5 =
1 1 1 − 23
− 32
,
(11.5)
waarbij Y5 spoorloos en hermitisch is, en commuteert met alle matrices van de vorm (11.4). Voor een fermion multiplet dat transformeert via de fundamentele representatie van SU(5) hebben we dus: ψi → ψi0 = Uij ψj .
(11.6)
Als we de SU(5) matrix beperken tot (11.4) zien we dat de 5-dimensionale representatie opsplitst in: 5 → (3, 1) + (1, 2) . (11.7) We bekijken ook de anti-symmetrische en de symmetrische representatie. Deze splitsen op als: 10 → (3, 2) + (¯3, 1) + (1, 1) 15 → (6, 1) + (3, 2) + (1, 3)
(11.8) (11.9)
Dit kunnen we nagaan voor bijvoorbeeld de 10-dimensionele representatie. Fermionen die transformeren in de anti-symmetrische representatie kunnen we onderbrengen in een anti-symmetrische matrix ψij = −ψji . Er geldt: ψij → ψij0 = Uik Ujl ψkl , 100
(11.10)
hetgeen voor infinitesimale transformaties impliceert: δψij = ia Ta ik ψkj + ia Ta jk ψik .
(11.11)
Als we nu de generatoren Ta van SU(5) achtereenvolgens beperken tot SU(3) en SU(2) zoals in (11.4) kunnen we zien hoe de representatie opsplitst. Zo transformeert ψij met i ≤ 3, j >3 onder SU(3) (Ta ij = 0 voor i, j > 3) als volgt: δψij = ia Ta ik ψkj
met k ≤ 3 ,
(11.12)
δψij = ia Ta jk ψik
met k > 3 .
(11.13)
en onder SU(2) als:
Voor i ≤ 3 en j > 3 (of andersom natuurlijk) transformeren de velden ψij onder SU(3) dus als een triplet en onder SU(2) als een doublet. Dit deel van de anti-symmetrische representatie gaat dus over in de representatie (3, 2) van SU(3) × SU(2). De andere onderdelen van de opsplitsing (11.8) en (11.9) worden op soortgelijke wijze gevonden. Uit (11.9) blijkt dat de 15-dimensionele representatie niet voldoet. Immers, er is geen kleur-representatie van dimensie zes aanwezig in het standaard model. Daarentegen voldoen de 5- en 10-dimensionele representaties samen wel. Daar zullen we dus de fermionen in onder moeten brengen. Beschouw nu (11.7). Daarin moeten we, als we vergelijken met de Tabel 11.1, het doublet (ν , e) en een triplet van quarks onderbrengen. In (11.5) zien we dat de verhouding van de Y -quantumgetallen voor deze quarks en leptonen −2/3 moet zijn. Daaruit blijkt dat we moeten kiezen voor de rechtshandige d-quarks. Dat leidt echter tot een schijnbaar conflict, aangezien het electrondoublet linkshandig is, en we natuurlijk geen fermionen met verschillende handigheid onder willen brengen in ´e´en SU(5)-representatie. De oplossing voor dit dilemma is om naast de rechtshandige d-quarks het ladings-geconjugeerde neutrino-electron doublet te nemen. Dit heeft Y = +1, hetgeen in overeenstemming is met (11.5), en is rechtshandig. Ladingsconjugatie hebben we nog niet eerder ge¨ıntroduceerd. De ladingsgeconjugeerde spinor van ψ is gedefinieerd als ¯T, ψ c ≡ C −1 (ψ) (11.14) waarbij C de ladingsconjugatiematrix is, gedefinieerd door: T
Cγ µ C −1 = −γ µ .
(11.15)
De reden voor deze definitie is dat nu de spinor ψ c weer voldoet aan de Diracvergelijking als dat voor ψ het geval is. Uit (11.15) volgt: Cγ 5 C −1 = i(γ 3 γ 2 γ 1 γ 0 )T = i(γ 0 γ 1 γ 2 γ 3 )T = (γ 5 )T .
101
(11.16)
Hiermee kunnen we afleiden dat wanneer ψ linkshandig is, dat dan ψ c rechtshandig zal zijn. Dit gaan we als volgt na: voor een linkshandige spinor geldt γ5 ψ = ψ, dus: ψ c = C −1 (ψ † γ 5† γ 0 )T = = = = =
T
C −1 γ 0T γ 5T ψ † C −1 γ 0T γ 5T γ 0T ψ¯T C −1 (Cγ 0 C −1 )(Cγ 5 C −1 )(Cγ 0 C −1 )ψ¯T −γ 5 C −1 ψ¯T −γ 5 ψ c .
(11.17)
Door de conjugatie is het Y -quantumgetal van ψ c natuurlijk tegengesteld aan dat van ψ. We kunnen nu in de 5-dimensionele representatie de volgende fermionen plaatsen: d1 d2 (11.18) ψR = d3 . c e νc R Quarks en leptonen komen dus in ´e´en multiplet van SU(5) terecht. Dat heeft meteen consequenties. De generator (11.5) moet, op een multiplicatieve constante na, gelijk zijn aan de generator van de zwakke hyperlading. Dus geldt dat YdR = − 32 Yec . Deze verhouding is een gevolg van het feit dat Y5 een generator van SU(5) is, en dus spoorloos. We zien dat de SU(5)-indeling relaties geeft tussen de quantumgetallen van de leptonen en de quarks. Dat geldt ook voor de electrische ladingen. De ladingsoperator Q is gelijk aan
Q=
− 31
− 13
− 13
1 0
,
(11.19)
Ook Q is nu een generator (of een lineaire combinatie van generatoren) van SU(5), en moet dus spoorloos zijn. Dit betekent dat (3 × lading d-quark) + (lading ec ) gelijk moet zijn aan nul. Hier staat 3 voor het aantal kleuren, de unificatie legt dus een verband tussen het aantal kleuren en de lading van quarks en leptonen! Met de resterende quarks en leptonen vullen we nu een anti-symmetrische ma-
102
trix. Deze wordt:
ψij, L =
0 uc3 −uc2 u1 c −u3 0 uc1 u2 uc2 −uc1 0 u3 −u1 −u2 −u3 0 −d1 −d2 −d3 −e+
d1 d2 d3 e+ 0
.
(11.20)
L
Laten we verifieren dat (11.19) de goede ladingen geeft. Een transformatie gegenereerd door Q geeft: δψi = i Qij ψj = i qi ψi , δψij = i Qik ψkj + i Qjk ψik = i (qi ψij + qj ψij ) ,
(11.21)
(geen sommatie over i en j), waarbij qi de diagonaalelementen van Q zijn. We vinden dan bijvoorbeeld: δψ12 = i (q1 ψ12 + q2 ψ12 ) = i (− 32 )ψ12 , δψ34 = i (q3 ψ34 + q4 ψ34 ) = i (+ 32 )ψ34 .
(11.22)
We vinden dus inderdaad de juiste ladingen behorend bij uc (- 23 ) en u (+ 23 ). 11.3
De ijkvelden en de koppelingsconstante
Nu de fermionen zijn ingedeeld in SU(5) representaties, kunnen we gaan kijken naar de structuur van de interacties tussen fermionen en ijkvelden. De infinitesimale transformaties van de 5- en 10-dimensionele representaties zijn: δψR,i = ia Ta ij ψR,j , δψL,ij = ia Ta ik ψL,kj + ia Ta jk ψL,ik , waarin Ta de generatoren van SU(5) zijn. We gaan nu in de actie over op covariante afgeleiden: L = iψ¯R,i γ µ (∂µ δij − ig5 Aaµ Ta ij )ψR,j +iψ¯L,ij γ µ (∂µ δik δjl − ig5 Aaµ Ta ik δjl − ig5 Aaµ Ta jl δik )ψL,kl a − 41 Fµν F µνa .
(11.23)
We kiezen een specifieke vorm voor de matrices Ta . In overeenstemming met (11.4) kiezen we: Ta =
"
λa 0 0 0
#
a = 1, . . . , 8 ,
Ta+20 =
"
0 0 0 τa
#
a = 1, 2, 3 ,
103
(11.24)
met λa en τ a de generatoren van SU(3) en SU(2). Verder kiezen we: √ 1
T 24 =
10
15
− 23
− 32
− 23
1 1
De normering is hier zo gekozen dat:
.
(11.25)
tr (T a T b ) = 21 δ ab .
(11.26)
De resterende matrices zijn:
9
T =
1 2
1 0 0 0 0 0 ,
0 1 0 0 0 0 0
0
T
10
=
1 2
−i 0 0 0 0 0 ,
0 i 0 0 0 0 0
0
etc. De veel voorkomende combinatie Aaµ Ta is dan van de vorm: 24 X
Aaµ Ta =
a=1
P8 b b=1 Aµ λb + Xµ1∗ Xµ2∗
Yµ1∗ Yµ2∗
met:
Aaµ ; a = 1, . . . , 8 : Wµa ; a = 1, . . . , 3 : : A24 µ
Xµ1 Yµ1 Xµ2 Yµ2 Xµ3 Yµ3
√1 A24 15 µ
Xµ3∗ Yµ3∗
Wµc τc −
(11.27)
√3 A24 2 15 µ
,
(11.28)
de 8 gluonen van SU(3) , Wµ± , en een combinatie van Z en γ , een combinatie van Z en γ .
Verder hebben we dan nog de nieuwe ijkvelden Xµ1,2,3 en Yµ1,2,3 . We weten hoe de ijkvelden onder SU(5) transformeren: A0µ · T = UAµ · T U −1 −
i (∂µ U)U −1 , g5
(11.29)
met U ∈ SU(5). Laten we nu nagaan wat de transformaties van de ijkvelden in (11.28) onder SU(3) × SU(2) × U(1) zijn. We moeten dan (11.29) beperken tot de symmetriegroep van het standaardmodel. We vinden dan: 24 = (1, 1) + A24 µ
(1, 3)
+ (3, 2) +
(¯3, 2)
Wµ1,2,3
X, Y
(X, Y )∗
104
+ (8, 1) A1,...,8 µ
(11.30)
We vinden dus de bekende representaties voor de gluonen en de electrozwakke ijkvelden. Verder zien we dat de velden Xµi en Yµi onder SU(3) transformeren als een triplet, en de combinaties (Xµi , Yµi ) onder SU(2) als een doublet. De lading van de X en Y velden kan nu ook bepaald worden. Hiervoor gebruiken we: δAµ · T = i [Q, Aµ · T ] ,
(11.31)
zodat: δXµi = i (− 43 )Xµi , δYµi = i (− 31 )Yµi .
(11.32)
De lading van de X-bosonen is dus − 43 en die van de Y -bosonen − 31 . In dit model hebben dus niet alleen de quarks, maar ook sommige ijkvelden een fractionele lading. De covariante afgeleiden kunnen we nu eenvoudig uitwerken. Laten we dat in wat meer detail doen voor de eerste term in (11.23), de 5-dimensionele representatie: Dµ ψR =
∂µ − ig5
8 X
a=1
Aaµ Ta − ig5
3 X
Wµa Ta+20
a=1
−ig5 A24 µ T24 − ig5 (bijdrage X, Y -bosonen) ψR .
(11.33)
We kunnen nu een preciezere identificatie met de velden van het standaard model maken. De groep SU(5) bevat de ondergroep SU(3) × SU(2) × U(1), waarbij we de koppelingsconstanten van de SU(3), SU(2) en U(1) zullen aangeven met g3 , g2 en g1 , waarbij dan dus geldt g1 = g2 = g3 = g5 . Gezien de normering van T a , a = 1, . . . , 8 en T a+20 , a = 1, . . . , 3, is duidelijk dat g3 de koppelingsconstante van SU(3) is zoals we die in hoofdstuk 10 hebben ingevoerd, en g2 de koppelingsconstante g van SU(2) in het GSW-model. Bij de constante g1 moeten we iets voorzichtiger zijn. De normering van de kinetische termen is zodanig dat we moeten kiezen voor A24 µ = Bµ , waarbij Bµ het ijkveld van U(1) uit hoofdstuk 4 is. De koppeling van Bµ aan een veld ψ met zwakke hyperlading Y was van de vorm − 21 ig 0 Bµ Y ψ, zodat geldt: 1 0 ig Y = ig1 T 24 . (11.34) 2 Dit vergelijken we nu met de vorm voor T 24 , en de werkelijke waarden van Y voor bijvoorbeeld de 5-dimensionele representatie. Dat geeft dan: g0 =
q
3 g 5 1
105
.
(11.35)
Aangezien g 0 /g = tan θ (zie hoofdstuk 4) vinden we: tan θ = 2
sin θ =
q 3 8
3 5
,
= 0.375 .
(11.36)
In het SU(5)-model (en in elke andere GUT) wordt dus een voorspelling van sin2 θ gedaan. Deze voorspelling is niet in overeenstemming met de werkelijke waarde (0.23), maar we moeten niet vergeten dat (11.36) is afgeleid in de veronderstelling dat SU(5) een exacte symmetrie is. In hoofdstuk 10 hebben we gezien dat de effectieve koppelingsconstante samenhangt met de energieschaal. We weten dat de koppelingsconstanten g1 (U(1)), g2 (SU(2)) en g3 (SU(3)) bij de energie¨en die met de huidige versnellers bereikt worden verschillende waarden hebben. De SU(5) theorie kan pas een rol gaan spelen bij die energie¨en waarvoor de interacties, behorend bij U(1), SU(2) en SU(3) van vergelijkbare sterkte zijn. We zullen zien dat dit bij zeer hoge energie¨en inderdaad het geval is. In dit verband moeten we (11.36) zien als een hoge-energie voorspelling voor een verhouding tussen effectieve koppelingsconstanten, die bij lage energie¨en een andere numerieke waarde kan hebben. We zullen hier later op terugkomen. 11.4
Het protonverval
Bij welke energie moeten we de SU(5) symmetrie serieus nemen? Deze energie zal van dezelfde orde van grootte zijn als de massa de X- en Y -bosonen, zoals in het standaardmodel de massa van de W - en Z-bosonen de energieschaal van de zwakke interacties aangeeft. In het standaardmodel schatten we de massa van het W -boson als volgt. Het W -deeltje speelt een rol in het muon-verval. De levensduur van het muon is dan: 1 M4 . (11.37) τµ ∼ 4 W g2 m5µ Met de aanname dat g2 van de orde e is, en de ontbrekende constante van de orde ´e´en, kunnen we dan MW schatten. In het SU(5) model hebben we onder andere interacties van de vorm: iψ¯R, i γ µ (−igAaµ Ta ij ) ψR, j + h.c.
(11.38)
hetgeen aanleiding geeft tot de termen: # Xµ1 Yµ1 " ψ4 µ1 2 2 ¯ ¯ ¯ g [ψ1 ψ2 ψ3 ] γ 2 (1 + γ5 ) Xµ Yµ + h.c. ψ5 3 3 Xµ Y µ
oftewel:
1 g 2
3 X
[ d¯i γ µ (1 + γ5 ) Xµi ec + d¯i γ µ (1 + γ5 ) Yµi ν c ] + h.c. .
i=1
106
(11.39)
(11.40)
We zien dus dat het X-boson overgangen bewerkstelligt tussen d-quarks en positronen, en het Y -boson tussen d-quarks en neutrino’s. We hebben maar ´e´en generatie bekeken, dus vinden we geen menging. De bijbehorende Feynman regels zijn: ¯ vertex : X de − 12 igγµ(1 + γ5 )δij ¯ vertex : Y dν − 21 igγµ(1 + γ5 )δij Op dezelfde manier kunnen we uit de bijdrage van de 10-dimensionale representatie de vertices tussen X- en Y -bosonen en u-quarks en leptonen bepalen. In het bijzonder zijn er vertices met een Y -boson, een u-quark en een positron, en vertices met een X-boson, een d-quark en een positron. Dit zijn de vertices die behoud van lepton-getal en baryon-getal breken. Gegeven dat deze unificatie theorie baryon- en/of leptongetal breekt, is een proces als het verval van het proton mogelijk. Een aantal mogelijke vervalswijzen voor het proton zijn in fig. 11.1 getekend.
Figuur 11.1
Voorbeelden van processen die protonverval veroorzaken.
Evenals bij het µ-verval zouden we een schatting willen maken van de massa van
107
het X- en Y -deeltje door te kijken naar het protonverval. Het protonverval is echter nog nooit waargenomen. In ieder geval geldt: τp > 1030 jaar
(11.41)
voor de levensduur van het proton. De schatting van de massa het X- en Y -boson gaat op dezelfde manier als bij het muon-verval: τp ∼ c
1 (MX,Y )4 . g 4 m5p
(11.42)
Met de veronderstelling dat g ∼ e en c ∼ 1 vinden we dan (Mp /Mµ = 938/105 = 9):
MX,Y MW
4
1030 ∗ 3 ∗ 107 > 2 ∗ 10−6
mp mµ
!5
⇒
MX,Y > 1012 , MW
(11.43)
zodat MX,Y > 1014 GeV .
(11.44)
De X- en Y -deeltjes moeten dus zeker een zeer grote massa hebben; hun effect in het energiegebied van de W - en Z-bosonen is daarom te verwaarlozen. 11.5
De effectieve koppelingsconstanten
Een andere manier om een waarde voor de karakteristieke energieschaal van de GUT-effecten te verkrijgen is door te kijken naar de effectieve koppelingsconstanten. We hebben al bepaald voor QCD: α3 (µ2 ) 2 , 1 + 4πb3 α3 (µ2 ) ln µq 2
(11.45)
1 q2 1 = + 4πb3 ln 2 . α3 (q 2 ) α3 (µ2 ) µ
(11.46)
α3 (q 2 ) = waaruit volgt
De factor b3 wordt bepaald door de ´e´en-lus bijdragen aan de vacuumpolarisatie. Voor willekeurige niet-abelse ijkgroep G , en een koppeling van de ijkvelden aan Nf Dirac fermionen in de fundamentele representatie van G , geldt b=
1 (11TA − 4Nf TF ) . 48π 2
(11.47)
Als we overgaan naar SU(3), met de gebruikelijke normering van de generatoren, vinden we dus 1 (33 − 2N3 ) . (11.48) b3 = 48π 2
108
N3 is het aantal soorten fermionen dat koppelt aan de gluonen. Voor SU(2) vinden we dan 1 (22 − 2N2 ) , (11.49) b2 = 48π 2 waarbij N2 het aantal fermionen is dat aan de SU(2)-ijkvelden koppelt. Een U(1)groep geeft alleen de bijdrage evenredig met het aantal fermion flavours: b1 = −
1 4N1 , 48π 2
(11.50)
aangezien nu de factor TF niet in rekening gebracht hoeft te worden.
Figuur 11.2 Typisch vacumpolarisatie diagram dat bijdraagt aan het gedrag van de effectieve koppelingsconstantes. Om voor ons voorbeeld van unificatie in SU(5) te bepalen wat de getallen N3 , N1 en N2 zijn, moeten we even terug naar de oorsprong van deze termen. Ze ontstaan doordat in de vacuumpolarisatie van een ijkveld een fermionlus optreedt (zie fig. 11.2). Elk Dirac fermion draagt dan gelijkelijk bij, als de koppeling aan het ijkveld althans gelijk is. Voor SU(3) en SU(2) is dit laatste inderdaad het geval. Voor SU(3) vinden we dan dat N3 gelijk is aan het aantal kleur-triplets, hetgeen gelijk is aan Nf , het aantal quark flavours. We vinden dus dat N3 = 6. Voor N2 moeten we het aantal doubletten van SU(2) tellen. Er zijn vier linkshandige doubletten per generatie, namelijk drie voor de quarks, die immers drie kleuren hebben, en ´e´en voor de leptonen. Totaal tellen we dus twaalf linkshandige doubletten. Een linkshandig fermion is echter geen Dirac fermion, omdat het rechtshandig deel ontbreekt, en draagt daarom met een factor 1/2 bij in de berekening van de vaccuumpolarisatie, vergeleken bij een Dirac spinor20 . Daarom is ook N2 = 6. Kijken we tenslotte naar de U(1)-groep. De koppeling aan het ijkveld A24 µ gaat met een sterkte die evenredig is met de eigenwaarde van T 24 , en in het diagram van fig. 11.2 vinden we dus het kwadraat van deze eigenwaarde. We vinden daarom voor U(1): b1 = −
1 4 ( 40 × 48π 2 3
15 100
× 12 × NG )
De reden voor de factor 1/2 is dat er in de vertices nu factoren 12 (1 ± γ 5 ) staan. Na het uitwerken van de γ-matrices blijft ´e´en factor 12 (1 ± γ 5 ) over. Bij het nemen van het spoor over de γ-matrices verdwijnt dan de bijdrage evenredig met γ 5 , en blijft alleen de factor 1/2 over. 20
109
= −
1 2Nf . 48π 2
(11.51)
Hierin is de factor 40/3 de som van de kwadraten van alle Y -eigenwaarden van de deeltjes in ´e´en generatie, 15/100 de normering van T 24 , 1/2 de correctie omdat elk van de fermionen links- dan wel rechts-handig is, en NG het aantal generaties. De afhankelijkheid van Nf is dus voor de verschillende bi hetzelfde. Voor α1 en α2 (αi = gi2/4π) hebben we een soortgelijke vergelijking als (11.46), maar dan met b1 resp. b2 . Dus geldt 1 1 q2 − = 4πb ln i αi (q 2 ) αi (M 2 ) M2
(i = 1, 2, 3) .
(11.52)
Veronderstel nu dat de sterkte van de verschillende interacties bij een zekere waarde M 2 aan elkaar gelijk worden: αi (M 2 ) = α(M 2 ). Dan geldt dus: 1 1 q2 − = 4π(b1 − b2 ) ln 2 α1 (q 2 ) α2 (q 2 ) M 2 q 22 ln 2 , = − 12π M
(11.53)
hetgeen onafhankelijk is van Nf . Nu geldt: α(q 2 ) , cos2 θ(q 2 ) α(q 2 ) , α2 (q 2 ) = sin2 θ(q 2 )
α1 (q 2 ) =
5 3
(11.54) (11.55)
met α(q 2) = e2 (q 2 )/4π. Dus vinden we: 1 11 q2 3 cos2 θ sin2 θ 1 − = ln = − α1 (q 2 ) α2 (q 2 ) 6π M 2 5 α α
(11.56)
zodat we de volgende uitdrukking voor sin2 θ krijgen: sin2 θ(q 2 ) =
3 55 q2 + α(q 2 ) ln 2 . 8 48π M
(11.57)
We krijgen sin2 θ(M 2 ) = 38 : dit is de waarde van de Weinberg-hoek bij de unifi2 catiemassa. Nemen we nu q 2 = MW , dan vinden we daarentegen: 2 sin2 θ(MW )=
oftewel:
3 55 M2 2 + α(MW ) ln W2 , 8 48π M
"
#
M 3 24π 2 = exp ( − sin2 θ(MW )) . 2 MW 55α(MW ) 8
110
(11.58)
(11.59)
2 2 Om M te berekenen moeten we dus sin2 θ(MW ) en α(MW ) kennen. Met de schattin2 2 −1 gen sin θ(MW ) = 0.23 en α ' 129 (niet 137, want dat is bij nog lagere energie!) vinden we: M = 1012 ⇒ M = 1014 GeV (11.60) MW De energie waarbij de koppelingsconstanten bij elkaar komen is dus niet ver verwijderd van de energie die we eerder vonden uit de limiet van het protonverval: we zien dat metingen voor het protonverval een wezenlijke restrictie voor M kunnen opleveren.
11.6
Conclusies
Om te zien of een SU(5) unificatietheorie levensvatbaar is, is het dus belangrijk de ”running” koppelingsconstanten, alsmede de levensduur van het proton nauwkeurig te bepalen.
Figuur 11.3
Gedrag van de koppelingsconstanten als functie van
√
q2.
Het beeld voor de koppelingsconstanten is weergegeven in fig. 11.3. De energieschaal wordt verdeeld in 4 gebieden: voor q 2 > M 2 is er een exacte SU(5) symmetrie en zijn alle ijkbosonen relatief licht. Een Higgs-mechanisme breekt SU(5), bij q 2 = M 2 , tot SU(3)×SU(2)×U(1). Voor q 2 < M 2 blijven de W - en Z-bosonen vri2 jwel massaloos, tot we bij q 2 ∼ MW komen, waar SU(2) × U(1) breekt tot de U(1) symmetrie van de Maxwell theorie. Voor deze unificatie is het natuurlijk belangrijk dat de derde koppelingsconstante, α3 , door het snijpunt gaat bij q 2 = M 2 . Met een 2 redelijke schatting van α3 (MW ) is dit inderdaad het geval! Een ander belangrijk 2 punt is dat dit beeld een groot energiegebied openlaat tussen MW en M 2 , waarin
111
niets gebeurt! Aangezien we de schaling van αi berekenen met de nu bekende deeltjes, veronderstellen we impliciet dat er geen nieuw niveau van elementaire deeltjes 2 is tussen MW en M 2 . Dit lege gebied wordt ook wel de woestijn genoemd. Zoals al opgemerkt, het SU(5) model is bedoeld als een typisch voorbeeld van een dergelijk GUT-model. Experimenteel is inmiddels de grens voor protonverval boven de 1031 jaar gekomen. (Het protonverval wordt onderzocht in grote, ondergrondse bassins, gevuld met water. Daarin zou een verval p → e+ π 0 waargenomen kunnen worden.) Hiermee is de experimentele ondergrens voor de unificatiemassa boven het snijpunt van de koppelingsconstanten komen te liggen. Daarmee is de basis van het SU(5) model wel heel wankel geworden. Echter, andere GUT’s gebaseerd op andere groepen hebben dit probleem niet. De grafiek eindigt bij MP l , de Planck-massa. Dit is de energiewaarde waarbij de structuur van de ruimte-tijd, en dus ook de quantumgravitatie, een rol begint te spelen. Als je algemene relativiteitstheorie gevolgd hebt, dan weet je dat een lichaam met massa m een Schwarzschildstraal rs = 2mG/c2 heeft. Als een lichaam geheel binnen zijn eigen Schwarzschildstraal zit, is het een zwart gat. In strikte zin zou dit dus zeker gelden voor elementaire puntdeeltjes! Een deeltje met impuls p heeft een Comptongolflengte h λ= , (11.61) p ook wel een maat voor de onzekerheid in de plaatsco¨ordinaat voor een deeltje met impuls p. Als nu λ ' rs dan is het duidelijk dat de structuur van de ruimte-tijd en de elementaire deeltjes fysica elkaar ontmoeten. De bijbehorende impuls is mc voor een ultra relativistisch deeltje. Dus λ = rs betekent: h 2mG hc = 2 ⇒ m2 = ≡ MP2 l mc c 2G
(11.62)
Dit correspondeert met MP l = 4 ∗ 10−5 gram = 2 ∗ 1019 GeV, dus enkele ordes van grootte boven de unificatiemassa. Elementaire deeltjes fysica bij de Planck massa vereist een quantumtheorie voor de gravitatie. Dit is nog altijd een onopgelost probleem, ondanks vele pogingen om tot een oplossing te komen. String theorie [64] zou een serieuze mogelijkheid zijn, maar heeft als nadeel dat het moeilijk is rechtstreeks contact te maken met de fysica van de elementaire deeltjes zelf. Ongetwijfeld zullen de ontwikkelingen in dit gebied in hoog tempo doorgaan.
112
A
Appendix: Groepentheorie
Bij de beschrijving van ijktheorie¨en van elementaire deeltjes is groepentheorie een handig instrument. Daarom volgt hier een samenvatting van de voor ons belangrijke definities en eigenschappen. A.1
Lie-groepen en Lie-algebras
Een groep G is een verzameling waarop een product is gedefinieerd met de volgende eigenschappen: 1. (Geslotenheid) als g1 en g2 elementen zijn van G , dan is ook g3 = g1 ∗ g2 element van G . 2. (Associativiteit) als g1 , g2 en g3 elementen zijn van G , dan geldt (g1 ∗g2 )∗g3 = g1 ∗ (g2 ∗ g3 ). 3. (Eenheidselement) er is een element e van G met de eigenschap dat e ∗ g = g ∗ e = g voor elk element g van G . Hiervoor gebruiken we ook de symbolen g0 of I. 4. (Inverse) als g element is van G dan is er een element g −1 van G met de eigenschap dat g −1 ∗ g = g ∗ g −1 = e. Is het product bovendien commutatief, dat wil zeggen g1 ∗g2 = g2 ∗g3 als g1 en g2 elementen zijn van G , dan heet G abels. Is dit niet het geval dan heet G niet-abels. De door ons gebruikte groepen hebben een continue structuur; de elementen g kunnen gelabeld worden met continu vari¨erende parameters α. We schrijven dan g = g(α1, . . . , αn ). Dan geldt g(α1 , . . . , αn )g(β1 , . . . , βn ) = g(γ1, . . . , γn ) vanwege groepseigenschap (1). Zijn nu γ1 , . . . , γn niet-singuliere analytische functies van α en β dan heet G een Lie-groep met n parameters. De volgende verzamelingen zijn voorbeelden van Lie-groepen. • De N × N unitaire matrices met matrixproduct. Deze groep heet U(N) en heeft N 2 parameters. Unitariteit houdt in dat U † U = UU † = I. Dus is U † de inverse van U en unitair, aan (4) is voldaan. Bovendien is U3 = U1 U2 unitair als U1 en U2 dat zijn, de eenheidsmatrix is unitair, en omdat het product een matrixproduct is, is ook aan associativiteit voldaan. Deze verzameling voldoet dus aan de groepseigenschappen. In het bijzonder is U(1) een Liegroep, welke we kunnen representeren met U = eiα . Deze groep is bovendien abels. We zijn deze groep al tegengekomen bij de behandeling van QED. • De N ×N unitaire matrices met matrixproduct en determinant 1. Deze groep heet SU(N) (special unitary group) en heeft vanwege de eis det U = 1 ´e´en
113
parameter minder dan U(N). Met behulp van det(AB) = det(A) det(B) is eenvoudig aan te tonen dat aan alle groepseisen is voldaan. • De N × N re¨ele matrices O met matrixproduct, en de voorwaarde O T O = I. Dit zijn de orthogonale matrices, de groep heet O(N). Er zijn 21 N(N − 1) parameters omdat OkiOkj = δij symmetrisch is in i en j en er dientengevolge 1 N(N + 1) condities zijn. De extra eis det O = 1 geeft de groep SO(N). 2 We zullen nu de groep SU(2) wat meer in detail bekijken. Een element U is te schrijven als " # a b U= , (A.1) c d met a, b, c en d complex. Er geldt det U = ad − bc = 1, en †
U =
"
a∗ c∗ b∗ d∗
#
=U
−1
=
"
d −b −c a
#
.
(A.2)
Met a = a0 + ia3 en b = a2 + ia1 , ai re¨eel, volgt nu uit (A.2) dat U te schrijven is als: " # a0 + ia3 a2 + ia1 U= , (A.3) −a2 + ia1 a0 − ia3 met a20 + a21 + a22 + a23 = 1. We bekijken nu elementen van G in de omgeving van de eenheid (g0 ). Zij g zo’n element, dan schrijven we: g = exp(i
n X
a Ta ) = g0 + i
n X
a Ta + . . . ,
(A.4)
a=1
a=1
waarbij a infinitesimale parameters zijn en Ta de generatoren van de groep. Sommatie over gelijkgenoemde indices zullen we nu verder impliciet veronderstellen. Deze generatoren zijn lineair onafhankelijk en spannen een vectorruimte op, de zogenaamde Lie-algebra van G . Ze worden gedefini¨eerd door: Ta = −i
∂ g(α1, . . . , αn ) |g=g0 . ∂αa
(A.5)
Een eerste belangrijke eigenschap van de generatoren is dat de commutator van twee generatoren weer als een lineaire combinatie van generatoren te schrijven is. Er geldt [Ta , Tb ] = ifab c Tc , (A.6) waarin fab c constanten zijn, de zogenaamde structuurconstanten van G . Duidelijk is dat de structuurconstanten voldoen aan fab c = −fba c . 114
(A.7)
We kunnen (A.6) als volgt bewijzen. Neem twee groepselementen, g1 en g2 in de buurt van de eenheid: g1 = exp(ia Ta ) = g0 + ia Ta + 12 (ia Ta )2 , g2 = exp(iδ a Ta ) = g0 + iδ a Ta + 12 (iδ a Ta )2 . Omdat G een groep is, is ook g3 = g1 g2 g1−1g2−1 een element van G . We werken dit product uit tot termen kwadratisch in de generatoren: g3 = g1 g2 g1−1 g2−1 = (g0 + ia Ta + 21 (ia Ta )2 )(g0 + iδ b Tb + 12 (iδ b Tb )2 ) × = = = =
×(g0 − ic Tc + 21 (ic Tc )2 )(g0 − iδ d Td + 21 (iδ d Td )2 )
g0 − a δ b Ta Tb + a δ d Ta Td + δ b c Tb Tc − c δ d Tc Td g0 − a δ b (Ta Tb − Tb Ta ) g0 + i(ia δ b [Ta , Tb ]) g0 + iη a Ta .
De laatste regel geldt omdat g3 een groepselement is. Uit de laatste en voorlaatste regels volgt nu (A.6). Een tweede eigenschap is de Jacobi-identiteit, die volgt uit de associativiteit van de groep: [[Ta , Tb ], Tc ] + [[Tc , Ta ], Tb ] + [[Tb , Tc ], Ta ] = 0 . (A.8) Dit kan op soortgelijke wijze worden bewezen als (A.6). A.2
Representaties
Een representatie van een groep G is een afbeelding van de groep naar een verzameling lineaire transformaties D(g), die werken op een vectorruimte (ook wel representatieruimte genoemd). Dus elk element g van G wordt gekoppeld aan een transformatie D(g). Deze transformaties voldoen ook weer aan de groepsstructuur, dus D(g1 )D(g2) = D(g1 g2 ). In feite zijn we zulke representaties al tegengekomen in de vorm van de definities van U(N), SU(N), etc. als matrixgroepen. De matrices werken, in het geval van (S)U(N) als lineaire transformaties in een complexe Ndimensionale ruimte. Deze representatie wordt wel de fundamentele representatie genoemd. De groepen waar wij in dit collegedictaat zullen tegenkomen, zoals SU(N), hebben oneindig veel representaties. We kunnen deze representaties onderscheiden in reducibele en irreducibele representaties. Zij V de representatieruimte behorend bij de representatie D. Als V geen invariante deelruimtes V 0 heeft (deelruimtes die onder alle transformaties D(g) in zichzelf worden afgebeeld), behalve natuurlijk de triviale 0 en V zelf, dan heet de representatie D irreducibel, anders reducibel. 115
Als voorbeeld van een representatie beschouwen we de fundamentele representatie van SU(N). De bijbehorende representatieruimte wordt gevormd door complexe vectoren v van dimensie N. Beschouw een tweede ruimte met N-dimensionale complexe vectoren w. Dan geldt vi 7→ vi0 = Uij vj ,
wi 7→ wi0 = Uij wj .
(A.9)
We kunnen dan de N 2 dimensionele complexe ruimte, die uit paren (v, w) bestaat, vormen. Een element kan dan geschreven worden als γij = vi wj , waarbij vi en wj componenten zijn van v en w. Omdat ze transformeren als in (A.9) kunnen we voor de transformatie van γ schrijven γij0 = vi0 wj0 = Uik Ujl vk wl = Vij,klγkl ,
(A.10)
Vij,kl = Uik Ujl
(A.11)
met Deze productrepresentatie is reducibel, want zowel het symmetrisch als het antisymmetrisch deel van de ruimte gevormd door (v, w) vormen invariante deelruimtes. Voor SU(N) blijken deze symmetrische en anti-symmetrische deelruimtes ireducibel te zijn. We geven nu een lijst van representaties van SU(N) die we in dit college zullen tegenkomen. • fundamentele representatie (N-dimensionale representatieruimte) • symmetrische representatie ( 21 N(N + 1)-dimensionaal) • antisymmetrische representatie ( 12 N(N − 1)-dimensinaal) • geconjungeerde representatie (N-dimensionaal) Ga uit van de fundamentele representatie. Zij U hiervan een element, dan vormt de verzameling bestaande uit de elementen U ∗ ook een representatie. • geadjungeerde representatie (N 2 − 1)-dimensionaal) Begin met de bij de fundamentele representatie behorende generatoren Ta . Vanwege de commutatierelatie en de Jacobi-identiteit (A.8) en (A.7) vinden we: 0 = [Ta [Tb , Tc ]] + [Tc , [Ta , Tb ]] + [Tb , [Tc , Ta ]] = fbc d [Tb , Td ] + fab d [Tc , Td ] + fca d [Tb , Td ] = (fbc d fad e + fab d fcd e + fca d fbd e )Te , zodat vanwege de lineaire onafhankelijkheid van de generatoren geldt: fbc d fad e + fab d fcd e + fca d fbd e = 0 .
116
(A.12)
Definieer nu (ta )cb = ifab c .
(A.13)
Dan kunnen we (A.12) herschrijven als [ta , tb ] = ifab c tc .
(A.14)
Dit is een representatie van de Lie-algebra en genereert een representatie van de groep. De indices nemen N 2 − 1 waarden aan voor SU(N). Het moge duidelijk zijn dat de geadjungeerde representatie voor elke niet-abelse Liegroep gedefinieerd kan worden. • triviale representatie Elk element van de groep wordt afgebeeld op de eenheidstransformatie. Als voorbeeld van het bovenstaande beschouwen we de groep SU(2). We kiezen als generatoren de matrices: τi ≡ 21 σi , (A.15)
waarbij de σi de Pauli-matrices zijn: σ1 =
"
0 1 1 0
#
,
σ2 =
"
0 −i i 0
#
,
σ3 =
"
1 0 0 −1
#
.
(A.16)
De structuurconstanten zijn dus [τa , τb ] = iabc τc .
(A.17)
Hierbij is abc de volledig anti-symmetrische tensor in drie indices, met 123 = 1. Elementen van de fundamentele representatie zijn dus U = exp(ia τa ) .
(A.18)
Twee representaties D1 (U) en D2 (U) heten equivalent als er een W , onafhankelijk van het groepselement U, is, zodanig dat D1 (U) = W D2 (U)W −1 . Vanwege σa2 = I en σ2 σa∗ σ2 = −σa geldt σ2 U ∗ σ2 = U .
(A.19)
Dit is gemakkelijk na te gaan door U te ontwikkelen naar de matrices τa , zoals in (A.3). De geconjungeerde en fundamentele representatie blijken dus voor SU(2) equivalent te zijn. Voor SU(N), N 6= 2, is dit niet het geval. De geadjungeerde representatie wordt gegenereerd door de matrices (ta )cb = iabc . Deze matrices zijn anti-symmetrisch en zuiver imaginair, en genereren dus de groep SO(3) (zie de discussie in sectie (2.1)). De expliciete uitdrukkingen zijn:
0 −1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 −1 t1 = i . , t3 = i , t2 = i 0 0 0 −1 0 0 0 1 0 117
(A.20)
De fundamentele representatie van SO(3) wordt dus gegenereerd door dezelfde matrices als de geadjungeerde representatie van SU(2). We concluderen dat de twee groepen isomorf zijn. Afsluitend nog enige opmerkingen. Veelal bekijken we representaties van de groep die volgen uit een representatie van de Lie-algebra. Dan krijgen we alleen dat deel van de groep dat continu verbonden is met de eenheid. De groep O(N) bestaat uit twee componenten, ´e´en met determinant 1, de ander met determinant −1. De eenheid zit in eerste component, die we SO(N) noemen. Dit is het gedeelte dat voor N = 3 isomorf is met SU(2). De structuurconstanten van G hangen af van de basiskeuze die gemaakt wordt voor de generatoren. Voor de interne symmetriegroepen die we bij dit college tegenkomen kunnen we de basis zo kiezen dat deze bestaat uit hermitische matrices die voldoen aan tr(Ta Tb ) = TR δab (A.21) waar TR een constante is. Uit de hermiticiteit van de Ta volgt dat fab c re¨eel is: [Ta , Tb ]† = Tb† Ta† − Ta† Tb† = −[Ta , Tb ] = −ifab c Tc = −ifab c∗ Tc† = −ifab c∗ Tc . Een gevolg van (A.21) is dat fabc volledig antisymmetrisch is. Dat kunnen we bewijzen door fabc te schrijven als: fabc = −i tr([Ta , Tb ] Tc ) ,
(A.22)
en door gebruik te maken van de cyclische eigenschap van het spoor van een product van matrices. De constante TR in (A.21) hangt af van de representatie (dat is dan ook de betekenis van het label R). In het geval van SU(N) zullen we de fundamentele representatie steeds zo normaliseren dat TF = 21 . De (ta )bc van de geadjungeerde representatie geven dan TA = N. Voor SU(2) is dit gemakkelijk te controleren. P Met de generatoren van de Lie-algebra kunnen we ook de grootheid a Ta Ta (de kwadratische Casimir operator). Deze matrix is diagonaal: X
Ta Ta = CR I .
a
In het geval van SU(N) geldt CF = (N 2 − 1)/(2N), CA = N.
118
(A.23)
B
Appendix : Het complete GSW-model
De velden in het standaard model hebben specifieke eigenwaarden voor de operatoren Q, Y , T3 , B en QL die in de tekst ge¨ıntroduceerd zijn. We verzamelen hier deze eigenwaarden in een tabel (zie Tabel B.1). deeltje
Q
Y
T3
B
QL
νe,L , νµ,L , ντ,L
0
−1
1 2
0
1
eL , µL , τL
−1
−1
− 12
0
1
eR , µR , τR
−1
−2
0
0
1
1 3
1 2
1 3
0
uL , cL , tL
2 3
uR , cR , tR
2 3
4 3
0
1 3
0
dL , sL , bL
− 13
1 3
− 12
1 3
0
0
1 3
0
− 13
− 32
φ+
1
1
1 2
0
0
φ0
0
1
− 12
0
0
dR , sR , bR
Tabel B.1 De deeltjes van het standaard model en hun quantumgetallen. We vermelden achtereenvolgens de electrische lading (in eenheden e), de zwakke hyperlading, de “derde component van de zwakke isospin”, het baryongetal, en het leptongetal. We merken op dat elke generatie leptonen een eigen, onafhankelijk, leptongetal heeft. We schrijven de Lagrangedichtheid van het standaardmodel in de volgende vorm: LGSW = Lkin,
fermion + Lkin, ijk + Lkin, Higgs (1) (2) (3) (4) (5) +Lint + Lint + Lint + Lint + Lint
+LQCD .
De onderdelen bevatten de volgende informatie: Lkin, fermion Lkin, ijk Lkin, Higgs
kinetische en massatermen voor de leptonen en quarks kinetische en massatermen voor de ijkvelden kinetische en massatermen voor het Higgsveld
119
(B.1)
(1)
interacties tussen fermionen en ijkvelden
(2)
interacties tussen ijkvelden onderling
Lint
Lint
(3) Lint (2) Lint (5) Lint
LQCD
interacties tussen fermionen en Higgsveld interacties tussen ijkvelden en Higgsveld zelfinteracties Higgsveld alle bijdragen van gluonen
We geven de fermion-velden aan met de naam van het betreffende deeltje van de eerste generatie, en een label A = 1, 2, 3 geeft dan de generatie aan. De massamatrices MAB voor de fermionen zijn diagonaal. De relatie tussen v, µ en λ is v=
s
µ2 . λ
(B.2)
We geven deze bijdragen nu zonder verder commentaar: Lkin,
fermion
=
(e)
δAB )(1 − γ 5 ) νB + e¯A (i6 ∂ δAB − MAB ) eB (u) (d) + u¯A (i6 ∂ δAB − M ) uB + d¯A (i6 ∂ δAB − M ) dB ,
1 ν¯ (i6 ∂ 2 A
AB
Lkin,
Lkin,
ijk
Higgs
AB
= − 41 Fµν (A)F µν (A) − 41 (∂µ Zν − ∂ν Zµ )2 − 12 (Dµ Wν− − Dν Wµ− )(D µ W ν+ − D ν W µ+ ) , 1 1 + µ− 2 +e2 v 2 , W W + (Z ) µ µ 4 sin2 θ 8 sin2 θ cos2 θ =
1 (∂µ η)2 2
− µ2 η 2 ,
(B.3)
(B.4) (B.5)
(1) Lint = eAµ (−¯ eA γ µ eA + 23 u¯A γ µ uA − 31 d¯A γ µ nA )
+
1 eZµ /(sin θ cos θ) ν¯A γ µ (1 − γ 5 )νA 4 + e¯A γ µ (4 sin2 θ − 1 + γ 5 )eA + u¯γ µ (1 − 38 sin2 θ − γ5 )u ¯ µ (−1 + 4 sin2 θ + γ5 )d + dγ 3
e (¯ νA γ µ (1 − γ5 )δAB eB + u¯A γ µ (1 − γ5 )UAB dB ) Wµ+ 2 2 sin θ e † (¯ eA γ µ (1 − γ5 )δAB νB + d¯A γ µ (1 − γ5 )UAB uB ) Wµ−(B.6) , + √ 2 2 sin θ
+
√
120
(2)
Lint =
(3)
Lint
1 ie cot θ ((Dµ Wν− − Dν Wµ− )(Z µ W ν+ − Z ν W µ+ ) − h.c.) 2 − 21 e2 cot2 θ (Zµ Wν− − Zν Wµ− )(Z µ W ν+ − Z ν W µ+ ) + 21 ie cot θ (∂µ Zν − ∂ν Zµ )(W µ+ W ν− − W µ− W ν+ ) + 21 ie (∂µ Aν − ∂ν Aµ )(W µ+ W ν− − W µ− W ν+ ) e2 + − − + µ+ W ν− − W µ− W ν+ ) , + 2 (Wµ Wν − Wµ Wν )(W
4 sin θ √ 2η (e) (u) (d) = − (¯ eA MAB eB + u¯A MAB uB + d¯A MAB dB ) , v
(4)
Lint = e2 (2vη + η 2 )(
1 1 + µ− + (Zµ )2 ) , 2 Wµ W 2 4 sin θ 8 sin θ cos2 θ
(5)
Lint = −λv 2 η 3 − 14 λ η 4 ,
+ gAaµ u¯iA γ µ ( 12 λ)ij ujA + d¯Ai γ µ ( 21 λ)ij dAj
De massas van de W - en Z-bosonen zijn: ev , 2 sin θ
(B.8) (B.9) (B.10)
a LQCD = − 41 Fµν F µνa
MW =
(B.7)
MZ =
ev 2 sin θ cos θ
(B.11)
(B.12)
In LQCD geeft de index i de kleur van de quarks aan, i = 1, 2, 3, en zijn de λi de standaard Gell-Mann matrices. De index a wordt gesommeerd van a = 1, . . . 8.
121
References [1] M. de Roo, Quantumveldentheorie, Collegedictaat Groningen 1988. [2] S.H. Neddermeyer and C.D. Anderson, Note on the nature of cosmic-ray particles, Phys. Rev. 51 (1937) 884. [3] M. Perl et al., Evidence for anomalous lepton production in e+ − e− annihilation, Phys. Rev. Lett. 35 (1975) 1489. [4] J.J. Aubert et al., Experimental evidence of a heavy particle J, Phys. Rev. Lett. 33 (1974) 1404. [5] J.-E. Augustin et al., Discovery of a narrow resonance in e+ e− annihilation, Phys. Rev. Lett. 33 (1974) 1406. [6] S.W. Herb et al., Observation of a dimuon resonance at 9.5 GeV in 400-GeV proton-nucleus collisions, Phys. Rev. Lett. 39 (1977) 252. [7] T.-P. Cheng en L.-F. Li, Gauge theory of elementary particle physics, Clarendon Press, Oxford 1984. [8] C.H. Lai, Gauge theory of weak and electromagnetic interactions, World Scientific, Singapore 1981. [9] R.N. Mohapatra en C.H. Lai, Gauge theories of fundamental interactions, World Scientific, Singapore 1981. [10] Review of Particle Properties, Phys Rev. D45 (1992) S1. [11] R.N. Cahn en G. Goldhaber, The experimental foundations of particle physics, Cambridge University Press, Cambridge 1989. [12] C.N. Yang en R.L. Mills, Conservation of isotopic spin and isotopic gauge invariance, Phys. Rev. 96 (1954) 191. [13] L.D. Faddeev en V.N. Popov, Feynman diagrams for the Yang-Mills field, Phys. Lett. B25 (1967) 29. [14] S. Pokorski, Gauge field theories, Cambridge University Press, Cambridge 1987. [15] R.P. Feynman en M. Gell-Mann, Phys. Rev. 109 (1958) 193.
Theory of the Fermi interaction,
[16] T.D. Lee en C.N. Yang, Question of parity conservation in weak interactions, Phys. Rev. 104 (1956) 254.
122
[17] C.S. Wu et al., Experimental test of parity conservation in beta decay, Phys. Rev. 105 (1957) 1413. [18] S. Gasiorowicz, Quantum Physics, John Wiley, New York 1974. [19] C.H. Llewellyn Smith, High energy behaviour and gauge symmetry, Phys. Lett. B46 (1973) 233. [20] J.S. Bell, High-energy behavior of tree diagrams in gauge-theories, Nucl. Phys. B60 (1973) 427. [21] C. Itzykson en J.-B. Zuber, Quantum field theory, McGraw-Hill, New York 1980. [22] S.L. Glashow, Partial-symmetries of weak interactions, Nucl. Phys. 22 (1961) 579. [23] A. Salam en J.C. Ward, Electromagnetic and weak interactions, Phys. Lett. 13 (1964) 168. [24] S. Weinberg, A model of leptons, Phys. Rev. Lett. 19 (1967) 1264. [25] A. Salam, Weak and electromagnetic interactions, in Elementary particle theory, ed. N. Svartholm, Almqvist and Wiksell, Stockholm 1968. [26] F. Hasert et al., Observation of neutrino-like interactions without muon or electron in the Gargamelle neutrino experiment, Phys. Lett. B46 (1973) 138. [27] J. Goldstone, Field theories with superconductor solutions, Nuovo Cimento 19 (1961) 154. [28] P.W. Higgs, Broken symmetry, Phys. Lett. 12 (1964) 132.
massless particles and gauge fields,
[29] P.W. Higgs, Spontaneous symmetry breakdown without massless bosons, Phys. Rev. 145 (1966) 1156. [30] Y. Nambu en G. Jona-Lasinio, Dynamical model of elementary particles based on an analogy with superconductuvity, Phys. Rev. 122 (1961) 345. [31] F. Englert en R. Brout, Broken symmetry and the mass of gauge vector bosons, Phys. Rev. Lett. 13 (1964) 321. [32] G.S. Guralnik, C.R. Hagen en T.W.B. Kibble, Global conservation laws and massless particles, Phys. Rev. Lett. 13 (1964) 585.
123
[33] M. Gell-Mann en M. L´evy, An axial vector current in beta decay, Il Nuovo Cimento, 16 (1960) 705. [34] G. ’t Hooft, Renormalization of massless Yang-Mills fields, Nucl. Phys. B33 (1971) 173. [35] G. ’t Hooft, Renormalizable Lagrangians for massive Yang-Mills fields, Nucl. Phys. B35 (1971) 167. [36] M. Kobayashi en M. Maskawa, CP -violation in the renormalizable theory of weak interactions Prog. Theor. Phys. 49 (1973) 652. [37] N. Cabbibo, Unitary symmetry and leptonic decays, Phys. Rev. Lett. 10 (1963) 531. [38] UA1 Collaboration, Experimental observation of isolated √ large transverse s = 540 GeV, energy electrons with associated missing energy at Phys. Lett. 122B (1983) 103. [39] UA2 Collaboration, Observation of single isolated electrons of high transverse momentum in events with missing transverse energy at the CERN p¯ p-collider, Phys. Lett. 122B (1983) 476. [40] UA1 Collaboration, Experimental observation of lepton pairs of invariant mass around 95 GeV/c2 at the CERN SPS collider Phys. Lett. 126B (1983) 398. [41] UA2 Collaboration, Evidence for Z 0 → e+ e− at the CERN p¯p collider Phys. Lett. 129B (1983) 130. [42] J.F. Gunion, H.E. Haber, G.L. Kane en S. Dawson, The Higgs hunter’s guide, Addison-Wesley 1990. [43] G.L. Kane, editor, Perspectives on Higgs physics, World Scientific, Singapore 1993. [44] K. Fujikawa, Path-integral measure for gauge-invariant fermion theories Phys. Rev. Lett. 42 (1979) 1195. [45] L.H. Ryder, Quantum Field Theory, Cambridge University Press, 1985. [46] CDF Collaboration, F. Abe et al., Evidence for top quark production in p¯p √ collisions at s = 1.8 TeV Phys. Rev. D50 (1994) 2966. [47] J. Chadwick, Possible existence of a neutron, Nature 129 (1932) 312.
124
[48] C.M.G. Lattes, G.P.S.Occhialini en C.F. Powell, Observations on the track of slow meson in photographic emulsions, Nature 159 (1947) 694. [49] M. Gell-Mann, Isotopic spin and new unstable particles, Phys. Rev. 92 (1953) 833. [50] K. Nishjima en T. Nakano, Charge independence Prog. Theor. Phys. 10 (1953) 581.
for V -particles,
[51] M. Gell-Mann, The eight-fold way: a theory of strong interaction symmetry, CalTech Report CTSL-20, 1961. [52] M. Gell-Mann en Y. Ne’eman, The eightfold way, Benjamin, New York 1969. [53] V. E. Barnes, Observation of a hyperon with strangeness minus three, Phys. Rev. Lett. 12 (1964) 204. [54] E.D. Bloom et al., High-energy inelastic ep scattering at 6◦ and 10◦ , Phys. Rev. Lett. 23 (1969) 930. [55] M. Breidenbach et al., Observed behavior of highly inelastic electron-proton scattering, Phys. Rev. Lett. 23 (1969) 935. [56] O.W. Greenberg, Spin and unitary-spin independence in a paraquark model of baryons and mesons, Phys. Rev. Lett. 13 (1964) 598. [57] M.Y. Han en Y. Nambu, Three-triplet model with double SU(3) symmetry, Phys. Rev. 139 (1965) B1006. [58] H.D. Politzer, Reliable perturbative results for stong interactions?, Phys. Rev. Lett. 30 (1973) 1346. [59] D.J. Gross en F. Wilczek, Asymptotically free gauge theories I, Phys. Rev. D8 (1973) 3633. [60] S. Coleman, Aspects of symmetry; Selected Erice lectures, Cambridge University Press, Cambridge 1985. [61] P. Ramond, Field theory; a modern primer, Benjamin/Cummings, Reading, Mass. 1981. [62] H. Georgi en S. Glashow, Unity of all elementary-particle forces, Phys. Rev. Lett. 32 (1974) 438. [63] A.J. Buras, J. Ellis, M.K. Gaillard en D.V. Nanopoulos, Aspects of the grand unification of strong, weak and electromagnetic interactions, Nucl. Phys. B135 (1978) 66.
125
[64] M.B. Green, J.H. Schwarz en E. Witten, Superstring theory; Volumes I and II, Cambridge University Press, Cambridge 1987.
126