Krótkie wprowadzenie do klasycznej teorii pola z cechowaniem

Transkrypt

Krótkie wprowadzenie do klasycznej teorii pola z cechowaniem
Krótkie wprowadzenie do klasycznej teorii pola
z cechowaniem nieabelowym
Michał Dobrski
wersja z 8 listopada 2013 (robocza, do sprawdzenia)
Uwagi wstępne
Niniejsze notatki stanowią zapis zwięzłego seminarium poświęconego wprowadzeniu do klasycznej
(niekwantowej) teorii pola z cechowaniem nieabelowym. Jako podstawowe założenie przyjęto maksymalne uproszczenie formalizmu matematycznego i stosowanie oznaczeń zbieżnych z większością standardowej literatury fizycznej. W związku z tym, zostały całkowicie pominięte piękne i ważne struktury
matematyczne, które naturalnie pojawiają się w teorii pola, i które tworzą teorię wiązek. Także teoria
grup i algebr Liego zostały potraktowane w sposób czysto użytkowy. Zainteresowany czytelnik może
stosunkowo łatwo zacząć przechodzić na wyższy poziom matematycznej elegancji, sięgając po jeden z
wielu podręczników geometrii i topologii dla fizyków, np. [1].
W całym poniższym tekście stosujemy układ jednostek naturalnych, w którym ~ = c = 1. W przypadku elektromagnetyzmu przyjmujemy ponadto układ Heaviside’a–Loren a, w którym ε0 = µ0 = 1.
Metrykę Minkowskiego ηµν zadajemy w konwencji (+, −, −, −). Symbol ϵ z k indeksami oznacza całkowicie antysymetryczne wyrażenie, dla którego ϵ12...k = 1. Indeksy czasoprzestrzenne dane są małymi
literami greckimi. Małe litery łacińskie indeksują pola, a duże – współrzędne w grupie symetrii. Symbole pogrubione oznaczają trójwymiarowe wektory.
Jest pewne, że dokument ten zawiera mniejsze lub większe błędy. Będę wdzięczny za przesłanie
mi informacji o wszystkich spostrzeżonych problemach1 .
1
Elektromagnetyzm jako prototyp teorii pola z cechowaniem
Elektromagnetyzm wyrażony przy użyciu czteropotencjału stanowi prototyp dla teorii pola z cechowaniem nieabelowym. Przyjrzymy się jego strukturze i uwypuklimy elementy, które będziemy następnie
uogólniać.
1 Mój
adres mailowy to [email protected].
1
1.1
Czteropotencjał i równania Maxwella
Wiemy, że równania Maxwella można zapisać w elegancki, relatywistycznie współzmienniczy sposób przy użyciu czteropotencjału Aµ = ηµν Aν , gdzie Aµ = (ϕ, A). Łączy on w jeden obiekt potencjał
elektryczny ϕ i trójwymiarowy potencjał wektorowy pola magnetycznego A. Z Aµ tworzymy antysymetryczny tensor pola elektrycznego
Fµν = ∂µ Aν − ∂ν Aµ ,
którego składowe wyrażają się przez składowe pola elektrycznego i magnetycznego
∂A
∂t
B =∇×A
E = −∇ϕ −
w następujący sposób



Fµν = 

0
−E1
−E2
−E3
E1
0
B3
−B2
E2
−B3
0
B1
E3
B2
−B1
0



.

Równania Maxwella wyprowadzamy dwojako. Pierwsza para równań Maxwella jest prostą konsekwencją definicji Aµ i Fµν
∂[ρ Fµν] = ∂[ρ ∂µ Aν] − ∂[ρ ∂ν Aµ] = 0.
(1)
W zapisie wykorzystującym pola E i B powyższa zależność sprowadza się do równań
∂B
=0
∂t
div B = 0
rot E +
Pozostałe dwa równania pochodzą z zasady wariacyjnej. Niech j µ = (ρ, j) będzie czterowektorem
prądu, w którym ρ oznacza gęstość ładunku, a j trójwymiarową gęstość prądu. Zapiszmy działanie w
postaci
∫
∫
1
Fµν F µν dΩ
(2)
S = − Aν j ν dΩ −
4
Obliczmy wariację jako zmienną dynamiczną biorąc Aµ .
∫
∫
∫ (
)
1
δS = − δAν j ν dΩ −
δFµν F µν dΩ = −
δAν j ν dΩ + (∂µ δAν )F µν dΩ
2
Całkując przez części drugi wyraz dochodzimy do
∫ (
)
δS = −
δAν j ν dΩ − δAν ∂µ F µν dΩ
co prowadzi nas do równań ruchu
∂µ F µν = j ν
2
(3)
które przy wykorzystaniu wektorów E i B można zapisać jako
∂E
=j
∂t
div E = ρ
rot B −
Z postaci (3) natychmiast dostajemy, że prąd j ν musi być zachowany
∂ν j ν = ∂ν ∂µ F µν = 0
gdyż zwężamy indeksy symetryczne z antysymetrycznymi.
Widzimy łatwo, że cała klasyczna teoria pola elektromagnetycznego jest niezmiennicza na transformacje cechowania
Aµ → A′µ = Aµ + ∂µ ϵ
(4)
Wynika to wprost z tego, że klasyczne równania Maxwella wyrażają się całkowicie przez składowe
tensora Fµν , który nie zmienia się pod wpływem transformacji (4).
1.2
Oddziaływanie z materią
Rozpatrzmy ruch klasycznego ładunku q o masie m w polu elektromagnetycznym opisanym czteropotencjałem Aµ . Odpowiednia, loren owsko niezmiennicza całka działania ma postać
∫
S=−
b
(m ds + qAµ dxµ )
a
Działanie to jest również niezmiennicze na transformacje (4) (sprowadzają się one bowiem do dodania
do S stałej, a zatem nie zmieniają położenia ekstremów tego funkcjonału). Dokonując wariacji po liniach
świata cząstki xµ możemy obliczyć, że równaniem ruchu jest zależność
m
duµ
= qFµν uν
ds
gdzie uµ jest czteroprędkością ładunku. Zatem również klasyczny ruch ładunku jest określony wyłącznie przez natężenie pola. Wobec tego, na poziomie klasycznym potencjał cechowania i jego transformacje wydają się być co najwyżej użytecznym narzędziem matematycznym.
Ciekawe rzeczy pojawiają się gdy przechodzimy do opisu kwantowego. Zadowolimy się przypadkiem nierelatywistycznym2 . Wybierając jako zmienną zależną x0 można działanie (1.2) przepisać w
postaci
∫ tb ( √
)
S[xi (t)] = −
m 1 − v 2 − qA · v + qϕ dt
ta
Stąd relatywistyczny lagranżjan cząstki wynosi
√
Lrel = −m 1 − v 2 + qA · v − qϕ
2 Jest on wystarczający do wstępnego zilustrowania głębszej roli transformacji cechowania. Omówienie relatywistycznych
wariantów równania Schrödingera jest zadaniem niebanalnym, prowadzącym nieuchronnie do kwantowej teorii pola.
3
Po przejściu do granicy małych prędkości v ≪ 1 dostajemy lagranżjan nierelatywistyczny
Lnrel =
mv 2
+ qA · v − qϕ
2
Pęd kanoniczny dla tego lagranżjanu dany jest wzorem
P =
∂Lnrel
= mv + qA = p + qA
∂v
gdzie p = mv jest pędem kinematycznym. W zwykły sposób otrzymujemy hamiltonian
H = P · v − Lnrel =
1
2
(P − qA) + qϕ
2m
który stanowi punkt wyjścia do teorii kwantowej. Hamiltonian kwantowy otrzymujemy zastępując
pęd kanoniczny P przez operator P̂ = −i∇
)2
1 (
1
2
Ĥ =
P̂ − qA + qϕ =
(i∇ + qA) + qϕ
2m
2m
Równanie Schrödingera i∂0 Ψ = Ĥψ ma zatem następującą postać
)
∂Ψ
1 (
2
i
=
(i∇ + qA) + qϕ Ψ
∂t
2m
Widzimy, że pod wpływem transformacji cechowania (4) postać równania się zmienia. Może to prowadzić do pochopnego wniosku, że dla różnych cechowań otrzymamy „różne fizyki” n. odmiennie
przewidziane zostaną wyniki pewnych pomiarów. Tak jednak nie jest. Aby to stwierdzić przekształćmy powyższe równanie do
)
(
)2
1 (
∂
+ iqϕ Ψ = −
∇ − iqA Ψ
(5)
i
∂t
2m
i wprowadźmy operator
Dµ = ∂µ + iqAµ
z wykorzystaniem którego przepiszemy zależność (5) jako
iD0 Ψ =
1
Di D i Ψ
2m
(6)
Pod działaniem (4) Dµ transformuje się do
Dµ → Dµ′ = Dµ + iq∂µ ϵ
Zauważmy, że jeśli zażądamy by wektor stanu (funkcja falowa) równocześnie ulegał transformacji według reguły
Ψ → Ψ′ = e−iqϵ Ψ
(7)
wówczas spełniona będzie zależność
Dµ Ψ → Dµ′ Ψ′ = e−iqϵ Dµ Ψ
(8)
czyli Dµ Ψ transformować będzie się tak samo jak Ψ. Ma to zasadnicze znaczenie dla interpretacji równania (6) z następujących przyczyn.
4
1. Zapiszmy równanie Schrödingera(6) dla innego cechowania
iD0′ Ψ′ =
1 ′ ′i ′
DD Ψ
2m i
(9)
Z (8) wynika, że jeśli położymy Ψ′ = e−iqϵ Ψ to sprowadzi się ono do
ie−iqϵ D0 Ψ = e−iqϵ
1
Di D i Ψ
2m
co oznacza, że Ψ′ jest rozwiązaniem (9) wtedy i tylko wtedy gdy Ψ jest rozwiązaniem (6).
2. Przekonajmy się, że Ψ i Ψ′ opisują tę samą fizykę. Niech F będzie klasyczną wielkością obserwowalną wyrażającą się jako wielomianowa funkcja współrzędnych położenia xi i składowych
pędu kinematycznego3 pi . W mechanice kwantowej odpowiada jej operator F̂ będący pewnym
wielomianem w operatorach x̂i oraz p̂j . Operatory położenia nie zależą od wyboru cechowania
n. x̂′i = x̂i . Natomiast pj = Pj − qAj co oznacza, że p̂j zależy od wyboru cechowania i jest dany
wzorem p̂j = −iDj . Wobec tego również F̂ zależy od wyboru cechowania, niemniej ze względu
na
p̂′j ψ ′ = e−iqϵ p̂j ψ
x̂′i ψ ′ = e−iqϵ x̂i ψ
zachodzić musi
F̂ ′ ψ ′ = e−iqϵ F̂ ψ
Stąd wartości własne F̂ ′ i F̂ muszą być takie same4 , natomiast wektory własne transformują się
według reguły (7). Zatem dopuszczalne wyniki pomiarów wielkości F nie zależą od wyboru
cechowania. Nie zależą od niego również prawdopodobieństwa otrzymania w wyniku pomiaru
konkretnej wartości własnej f , albowiem transformacja (7) działa w sposób unitarny ( n. nie
zmienia iloczynu skalarnego). W szczególności
∫
∫
⟨ψ ′ |Ψ′ ⟩ = ψ ′∗ Ψ′ d3 x = ψ ∗ eiqϵ e−iqϵ Ψd3 x = ⟨ψ|Ψ⟩
co upewnia nas, że obliczane prawdopodobieństwa będą niezależne od wyboru cechowania.
Przypatrzmy się teraz strukturze, które wyłoniła się z naszych rozważań. Opiszemy ją teraz z użyciem oznaczeń i w kolejności, które zasugerują, jakie są naturalne uogólnienia takiej teorii.
• Jako punkt wyjścia weźmy pole materii, którym w naszym przypadku jest funkcja falowa Ψ. Na
pole to działa w sposób unitarny grupa cechowania, w tym przypadku U (1), przy czym działanie
to zależy od punktu w czasoprzestrzeni.
Ψ → Ψ′ = U Ψ = eiλ Ψ
3 Pęd
(10)
kanoniczny P nie jest obserwablą nawet w sensie klasycznym, gdyż zależy bezpośrenio od A i nie jest niezmienniczy
na transformacje (4).
4 Jeśli ψ jest wektorem własnym F̂ z wartością własną f to
F̂ ′ ψ ′ = e−iqϵ F̂ ψ = e−iqϵ f ψ = f ψ ′
i na odwrót.
5
• Na pola materii działa w sposób współzmienniczy operator pochodnej kowariantnej
Dµ = ∂µ − iq õ
w którym potencjał cechowania5 õ transformuje się według reguły
õ → Ã′µ = U Aµ U −1 −
1
1
U ∂µ U −1 = Aµ + ∂µ λ
iq
q
(11)
dzięki czemu spełniona jest zależność
Dµ Ψ → Dµ′ Ψ′ = U Dµ Ψ
• Z pochodnej kowariantnej można utworzyć natężenie pola F̃µν zdefiniowane zależnością
[Dµ , Dν ]Ψ = (Dµ Dν − Dν Dµ )Ψ = −iq F̃µν Ψ
która to wielkość, dzięki temu, że grupa U (1) jest abelowa, sprowadza się do
F̃µν = ∂µ Ãν − ∂ν õ
i nie zależy od wyboru cechowania. Ulegnie to zmianie w teorii nieabelowej.
• Równania, które spełnia potencjał cechowania są dwojakiego rodzaju. Po pierwsze, są to tożsamości (1)
∂[ρ F̃µν] = 0.
spełnione dla dowolnych õ . Po drugie, z działania (2) otrzymujemy równania (3)
∂µ F̃ µν = −j ν
które opisują dynamikę pól õ . W obu przypadkach w równaniach występują pochodne cząstkowe F̃µν . Jak się przekonamy, w teorii nieabelowej pochodne te muszą być zastąpione przez
odpowiednio zdefiniowane pochodne kowariantne.
Na zakończenie prześledźmy jeszcze inny, „heurystyczny” sposób, w jaki możemy otrzymać ten
sam rezultat dotyczący transformacji cechowania. Równanie Schrödingera cząstki swobodnej
i∂0 Ψ =
jest niezmiennicze na globalne transformacje U (1)
1
∂j ∂ j Ψ
2m
n. przekształcenia
Ψ → Ψ′ = eiλ Ψ
gdzie λ jest stałą. (Odpowiada to globalnej zmianie fazy funkcji falowej, co jak wiadomo nie ma wpływu na fizykę, którą ona opisuje). Jeśli teraz zażądamy, aby symetria U (1) miała charakter lokalny i
5 Wprowadzamy à = −A aby zapisać wzór na pochodną kowariantną w konwencji, która jest najbardziej popularna w
µ
µ
przypadku bardziej ogólnych grup cechowania.
6
ΓI (x)
OI
Z
SI
x0
E
M
x
SII
ΓII (x)
OII
parametr λ stał się dowolną funkcją punktów czasoprzestrzeni, wówczas nieuchronnie rozbijamy się
o niekompatybilność zwykłej pochodnej z takim rodzajem symetrii
(
)
∂µ eiλ(x) Ψ ̸= eiλ(x) ∂µ Ψ
Ratunkiem jest zastąpienie pochodnych cząstkowych ∂µ przez pochodne kowariantne Dµ = ∂µ −iq õ ,
w których wielkość õ transformuje się jednocześnie z funkcją falową według reguły (11). W ten sposób, promując symetrię globalną do lokalnej, dochodzimy znowu do (6). W teorii pola analogiczne
rozumowanie przeprowadza się najczęściej na poziomie lagranżjanu, zamieniając w nim pochodne
cząstkowe na kowariantne i otrzymując w efekcie kowariantne równania pola.
1.3
Zjawisko Aharonova-Bohma
Szczególne znaczenie potencjału cechowania w mechanice kwantowej można dostrzec analizując zjawisko Aharonova–Bohma. Rozważmy układ jak na rysunku. Ze źródła Z emitowane są elektrony. Przechodzą przez szczeliny SI oraz SII i trafiają na ekran, na którym wytwarzają pewien układ prążków
interferencyjnych. W obszarze M , niedostępnym dla elektronów, umieszczony jest, prostopadle do
płaszczyzny rysunku, bardzo długi, cienki solenoid. Jeśli wytwarza on pole magnetyczne, to jest ono
uwięzione wewnątrz solenoidu. We współrzędnych walcowych zaczepionych w środku M potencjał
wektorowy pola magnetycznego można zadać jako
Br
wφ
2
BR2
A=
wφ
2r
A=
7
dla r ¬ R
(12)
dla r > R
gdzie R jest promieniem M , a wφ wersorem (wektorem jednostkowym) w kierunku φ. Łatwo widać6 ,
że tak określony A jest ciągły, daje stałe, skierowane prostopadle do rysunku pole magnetyczne B wewnątrz M , oraz B ≡ 0 na zewnątrz M . Interesuje nas czy włączenie pola magnetycznego ma wpływ na
obraz interferencyjny na ekranie. Sytuację możemy opisać w następujący, przybliżony sposób. Funkcję falową elektronu w przypadku braku pola magnetycznego zapiszemy jako (pomijamy kwestię poprawnej normalizacji)
Ψ = ΨI + ΨII
1
gdzie ΨI i ΨII są rozwiązaniami swobodnego równania Schrödingera i∂t ΨI,II = − 2m
∇2 ΨI,II odpowiednio w obszarach OI i OII . Przejdźmy teraz do przypadku z włączonym polem magnetycznym.
Funkcję falową odnajdziemy teraz jako
e =Ψ
eI + Ψ
e II
Ψ
eI i Ψ
e II – rozwiązań równania Schrödingera z potencjałem wektorowym
dla Ψ
(
)2
e I,II = − 1 ∇ − iqA Ψ
e I,II
i∂t Ψ
2m
(13)
eI i
w obszarach OI i OII . Za Dirakiem zauważamy (łatwo to sprawdzić wstawiając (14) do (13)), że Ψ
e
ΨII możemy wygenerować z ΨI i ΨII poprzez zależność
∫
iq
A(τ )·τ dτ
e
ΨI (x, t) = e ΓI (x)
ΨI (x, t)
∫
(14)
iq
A(τ )·τ dτ
ΓII (x)
e
ΨII (x, t) = e
ΨII (x, t)
gdzie ΓI (x) i ΓII (x) oznaczają drogi całkowania łączące dowolny punkt x0 znajdujący się w części
wspólnej OI ∩ OII w pobliżu Z z punktem x i leżące odpowiednio w obszarach OI i OII . Całka w
wykładniku nie zależy od wyboru konkretnej drogi – różnica między całkami po różnych drogach
będzie równa całce po krzywej zamkniętej, a ta, zgodnie z twierdzeniem Stokesa, równa jest całce z
rot A = B ≡ 0 po powierzchni ograniczonej drogami7 . Mamy zatem
∫
iq
A(τ )·τ dτ
ΨI (x, t) + e ΓII (x)
ΨII (x, t)
∫
∫
∫
(
)
iq
A(τ )·τ dτ
iq
A(τ )·τ dτ −iq
A(τ )·τ dτ
ΓI (x)
= e ΓI (x)
ΨI (x, t) + e ΓII (x)
ΨII (x, t)
∫
∮
(
)
iq
A(τ )·τ dτ
iq
A(τ )·τ dτ
= e ΓI (x)
ΨI (x, t) + e ΓII (x)−ΓI (x)
ΨII (x, t)
iq
e
Ψ(x,
t) = e
∫
ΓI (x)
A(τ )·τ dτ
Całka po drodze zamkniętej (oznaczyliśmy ją jako ΓII (x) − ΓI (x)) daje tym razem różny od zera wynik, gdyż droga ta ogranicza powierzchnię, przez którą przechodzi strumień Φ pola magnetycznego
6 Łatwo,
o ile zna się wzór na rotację we współrzędnych walcowych. Ma on postać
(
rot A =
1 ∂Az
∂Aφ
−
r ∂φ
∂z
)
(
wr +
∂Ar
∂Az
−
∂z
∂r
)
wφ +
1
r
(
∂(rAφ )
∂Ar
−
∂r
∂φ
)
wz
gdzie wr , wφ , wz są wersorami w kierunkach r, φ, z.
7 Zauważmy, że kluczowe znaczenie ma tutaj fakt, że obszary O i O
I
II są każdy z osobna jednospójne oraz nie zawierają M .
Co za tym idzie, żadna krzywa zamknięta leżąca wewnątrz nich nie może otaczać niezerowego strumienia pola magnetycznego.
8
uwięzionego wewnątrz solenoidu. Stąd
∫
)
(
iq
A(τ )·τ dτ
e
Ψ(x,
t) = e ΓI (x)
ΨI (x, t) + eiqΦ ΨII (x, t)
Przybliżymy ΨI i ΨII w pobliżu ekranu postacią falową
ΨI = eifI (x,t)
ΨII = eifII (x,t)
dla fI i fII – funkcji rzeczywistych. Nietrudno w takim przypadku obliczyć, że
(
)
e 2 ∼ 1 + cos fII (x, t) − fI (x, t) + qΦ
|Ψ|
Oznacza to, że włączenie wewnątrz solenoidu pola magnetycznego powoduje na ekranie przesunięcie
prążków interferencyjnych. Wynik ten został wielokrotnie potwierdzony eksperymentalnie.
Zastanówmy się jakie znaczenie ma zjawisko Aharonova–Bohma dla naszego rozumienia elektromagnetyzmu jako teorii pola z cechowaniem.
• Okazuje się, że w teorii kwantowej potencjał wektorowy zaczyna mieć fizyczne znaczenie. Oto bowiem elektron podróżował w obszarze, w którym nie było pola magnetycznego i elektrycznego,
ale uległ oddziaływaniom elektromagnetycznym. Jeśli obstajemy przy lokalności oddziaływań
(a są dobre powody, by przy tym obstawać, np. przyczynowość) to za oddziaływanie odpowiedzialny musiał być potencjał wektorowy. Nie oznacza to jednak, że wybór konkretnego cechowania ma znaczenie fizyczne. Otrzymany przez nas wynik zależy ostatecznie od strumienia pola
magnetycznego wewnątrz solenoidu, który nie zależy od wyboru cechowania.
• W mechanice kwantowej pojawił się nowy, niezależny od wyboru cechowania obserwowalny
obiekt. Jest nim całka po drodze zamkniętej z potencjału wektorowego (ogólniej – czteropotencjału) nie dającego wkładu do natężenia pola. Całki takie mogą być niezerowe przy nietrywialnej
topologii. Istotnie, płaszczyzna z wyjętym obszarem M ma nietrywialną pierwszą grupę kohomologii, a potencjały wektorowe (12) dla różnych wartości B odpowiadają czteropotencjałom,
które są jednoformami należącymi do różnych klas kohomologii.
Na koniec wypada zauważyć, że w naszej (całkowicie standardowej) analizie zjawiska AharonovaBohma dopuszczamy się w zasadzie dość poważnego nadużycia. Usiłujemy bowiem zamaskować fakt,
że nie wprowadzamy dobrze określonej funkcji falowej w całym obszarze dostępnym dla poruszającego się elektronu. Można jednak pokazać [8], choć nie jest to trywialne, że odpowiednie wysubtelnienie
podanych wyżej argumentów prowadzi do znalezienia funkcji falowych poprawnie określonych wszędzie. Zasadnicze przewidywania fizyczne pozostają wówczas bez zmian.
2
Teorie pola z cechowaniem nieabelowym
Zauważyliśmy już, że elektromagnetyzm jest teorią w której cechowanie zadane jest przez grupę U (1).
Jej uogólnienie – teorie typu Yanga-Millsa – oparte są o „większe”, bardziej skomplikowane grupy.
9
2.1
Grupy cechowania
Zajmować się będziemy grupami macierzowymi. W teorii pola interesują nas głównie grupy Liego. Są
to takie grupy, których elementy można (przynajmniej lokalnie) sparametryzować pewnym zestawem
ciągłych zmiennych. (Np. grupę obrotów na płaszczyźnie SO(2) można sparametryzować kątem obrotu θ). Zasadnicza użyteczność grupy Liego zasadza się w tym, że wszystkie jej elementy, do których
można w ciągły sposób „dojść” od elementu jednostkowego, można przedstawić w postaci
g = eiα
A
tA
(15)
gdzie tA stanowi pewien zestaw niezależnych liniowo macierzy bazowych (generatorów), wspólnych
dla wszystkich elementów grupy, a αA możemy interpretować jako wspomniane wyżej parametry –
A
współrzędne opisujące różne elementy grupy. Weźmy dowolne dwa elementy grupy f = eiα tA oraz
B
g = eiβ tB . Zawsze możemy napisać f g = sgf , przy czym dla grup abelowych (przemiennych) s = e
dla wszystkich f, g. W ogólnym przypadku s może być różne od elementu jednostkowego i wtedy
wyrażenie s = f gf −1 g −1 jest nietrywialne. Jeśli wstawimy do niego postać wykładniczą elementów
f , g, f −1 , g −1 oraz pracowicie rozpiszemy potęgi w we wszystkich wyrazach do kwadratowej w tA
włącznie, wówczas przekonamy się, że
s = f gf −1 g −1 = 1 − αA β B (tA tB − tB tA ) + O(t3 ) = 1 − αA β B [tA , tB ] + O(t3 )
(16)
Płynie stąd następująca nauka.
• Ponieważ każdy element grupy powinien dać się wyrazić w postaci (15), więc dotyczy to także s.
D
Zatem s = eiγ tD . To zaś jest możliwe do uzgodnienia z (16) tylko wtedy gdy każdy komutator
generatorów należy do przestrzeni liniowej rozpinanej przez zbiór generatorów, czyli
[tA , tB ] = iC DAB tD
(17)
gdzie C DAB oznacza pewien zestaw stałych nazywanych stałymi struktury.
• Komutatory generatorów (a co za tym idzie stałe struktury) „mierzą” nieabelowość grupy. Dla
grupy abelowej wszystkie stałe struktury są równe 0.
• Przestrzeń liniowa rozpięta przez macierze tA wyposażona jest w iloczyn określony przez komutator. Jest to algebra Liego rozważanej grupy Liego. Algebra Liego bezpośrednio opisuje „infinitezymalne” (leżące bardzo blisko elementu jednostkowego) elementy grupy Liego8 . Faktycznie jeśli
zażądamy by αA = εα̃A gdzie ε → 0 jest „parametrem małości”, wówczas w rozwinięciu funkcji
wykładniczej możemy pozostawić tylko wyraz liniowy, co oznacza, że pracujemy z elementami
postaci 1 + iεα̃A tA . Co więcej, zachodzi również zależność odwrotna – jeśli znamy wszystkie infinitezymalne elementy grupy postaci 1 + iεχ, wówczas łatwo zauważamy, że macierze χ tworzą
przestrzeń liniową i w wybranej bazie generatorów można obliczyć stałe struktry. Okazuje się, że
jest to dokładnie pełna algebra Liego danej grupy. Elementy tej grupy (leżące w spójnej składowej
elementu jednostkowego) można wówczas zapisać w postaci wykładniczej (15).
8 Oczywiście, wszystkie elementy grupy (a dokładniej – wszystkie elementy spójnej składowej jedności grupy) są zakodowane
w strukturze algebry Liego poprzez wykładniczą postać (15).
10
Przypatrzmy się własnościom stałych struktury. Ponieważ komutator jest antyprzemienny więc
stałe struktury muszą być antysymetryczne w dolnych indeksach
C DAB = −C DBA
(18)
Ponadto dla każdej trójki generatorów tA , tB , tC spełniona jest tożsamość Jacobiego
[[tA , tB ], tC ] + [[tC , tA ], tB ] + [[tB , tC ], tA ] = 0
co po użyciu stałych struktury i liniowej niezależności generatorów daje
C DAB C EDC + C DCA C EDB + C DBC C EDA = 0
(19)
Związki między stałymi struktury (18,19) określają algebrę Liego i odpowiadającą jej grupę Liego.
Mogą one być jednak realizowane przez różne zestawy macierzy t spełniających (17). Mówimy wówczas o różnych reprezentacjach algebry Liego, a po skorzystaniu z postaci wykładniczej (15) o różnych
reprezentacjach grupy Liego. Jeśli jeden z zestaw generatorów uznamy za „definiujący” (niech będzie
to nasz wyjściowy zestaw tA ), wówczas inne zestawy macierzy (niekoniecznie niezależnych liniowo)
spełniające te same związki przemienności oznaczymy przez tR
A , gdzie górny indeks określa reprezenA
A
tację. Określa nam to odwzorowanie liniowe α tA 7→ d(α tA ) = αA tR
A . Jeśli d jest odwzorowaniem
R
1-na-1, wówczas reprezentację nazwiemy wierną, a tA są niezależnymi liniowo generatorami. Dla dowolnego zestawu stałych spełniających (18,19) możemy wskazać zestaw macierzy tad
A o wyrazach
B
B
(tad
A ) C = −iC CA
które spełniają warunki komutacji (17). Określają one reprezentację dołączoną algebry Liego.
Z przyczyn fizycznych nakładamy ograniczenia na grupy cechowania, reprezentacje i generatory
tA . Omówimy je teraz.
R
• Unitarność. Powiedzmy, że macierze U R = eiχ z pewnej wiernej reprezentacji grupy cechowania
będą działały (analogicznie do (10)) na pola, które ułożymy w wektor kolumnowy


Ψ1
 . 
. 
Ψ=
 . 
Ψk
Iloczyn skalarny dwóch takich wektorów (Ψ̃, Ψ) dany jest przez Ψ̃+ Ψ, a będziemy potrzebować
go choćby po to, żeby zapisać skalarną gęstość lagranżjanu. Powinien on nie zależeć od wyboru
+
cechowania co oznacza, że żądamy aby Ψ̃+ Ψ = Ψ̃+ U R U R Ψ dla dowolnych Ψ i Ψ̃. Stąd wniosek,
+
że U R U R = 1, czyli U R są macierzami unitarnymi. Na infinitezymalnym poziomie algebry Lie+
+
go dostajemy, że (1 − iεχR )(1 + iεχR ) = 1. Wynika stąd, że χR = χR , więc wszystkie elementy reprezentacji algebry Liego powinny być macierzami hermitowskimi. Dotyczy to oczywiście
A
również generatorów tR
A , wobec czego współrzędne α powinny być rzeczywiste. Komutator
R +
R R
macierzy hermitowskich jest antyhermitowski, w szczególności [tR
A , tB ] = −[tA , tB ]. Sprzęgając stronami (17) i wykorzystując ten fakt łatwo dostajemy, że stałe struktury C DAB muszą być
liczbami rzeczywistymi.
11
• Dodatnio określona metryka. Budując lagranżjan będziemy potrzebowali metryki w algebrze Liego,
która określona będzie dla każdej reprezentacji w postaci ⟨αR , β R ⟩ = 2 Tr(αR β R ). Metrykę między reprezentacjami uzgadniamy poprzez żądanie takiego wyboru generatorów aby spełniony
był warunek9
R
R R
⟨tR
(20)
A , tB ⟩ = 2 Tr(tA tB ) = δAB
Zwróćmy uwagę, że przez samą postać zależności (20) wymuszamy aby metryka była dodatnio
określona. Będzie to dla nas istotne, z przyczyn fizycznych, przy budowaniu gęstości lagranżjanu
Yanga–Millsa. Jednak wymaganie dodatniej określoności metryki niesie poważne skutki dla grupy cechowania i jej algebry Liego. Okazuje się, że spełnić je mogą jedynie algebry Liego będące
sumą prostą zwartych podalgebr prostych10 i podalgebr u(1). Dla ustalenia uwagi zażądamy aby
nasza algebra była zwartą prostą algebrą Liego – nie musimy się wówczas martwić o różne stałe
sprzężeń dla różnych podprzestrzeni prostych lub u(1).
Zauważmy jeszcze, że tak określona metryka może nam posłużyć do podnoszenia i opuszczania wskaźników związanych z algebrą. Nietrudno obliczyć, że zachodzi przy tym równość
(
)
CABC = δAD C DBC = 2 Tr tA tD C DBC = −2i Tr (tA [tB , tC ]) = −2i Tr (tA tB tC − tA tC tB ) =
− 2i Tr (tB tC tA − tB tA tC ) = −2i Tr (tB [tC , tA ]) = CBCA = −CBAC
Udowodniliśmy, że stałe struktury (z wszystkimi indeksami „na dole”) są antysymetryczne również
w dwóch pierwszych indeksach
CABC = −CBAC
(21)
Przytoczmy wreszcie standardową konwencję dotyczącą oznaczeń grup i algebr Liego. Grupy oznaczamy wielkimi literami, np. G, H, SU (2) lub SO(5); natomiast ich algebry małymi (niekiedy stosuje
się wtedy pismo gotyckie), czyli odpowiednio: g, h, su(2) i so(5). Przejdźmy teraz do dwóch prostych
przykładów.
Przykład 1. Grupą cechowania elektromagnetyzmu jest U (1) czyli grupa liczb zespolonych o wartości
bezwzględnej 1. Każdą taką liczbę z można zapisać jako
z = eiχ
Stąd widzimy, że grupa ta ma jeden generator, który możemy wybrać np. jako t1 = 1. W oczywisty sposób stałe, a właściwie stała, struktury sprowadza się do C 111 = 0. Wobec tego reprezentacja dołączona
1
jest trywialna (tad
1 ) 1 = 0.
Przykład 2. Bardzo ważną grupą w fizyce jest grupa SU (2). Tworzą ją zespolone macierze 2 × 2 spełniające warunki U + U = 1 i det(U ) = 1. Zapiszmy infinitezymalny element grupy jako U = 1 + iεχ.
9 Przypomnijmy,
że odwzorowania między reprezentacjami zadajemy poprzez ustalenie odpowiedniości między generatoR̃ = αA tR̃ oraz β R = β A tR 7→ β R̃ = β A tR̃ wówczas warunek (20) zapewnia, że
rami. Jeśli zatem αR = αA tR
A
A
A
A 7→ α
R̃
R̃
R
R
⟨α , β ⟩ = ⟨α , β ⟩
10 Podalgebra Liego to podprzestrzeń liniowa, która jest zamknięta ze względu na nawias Liego. Podalgebrę nazywamy niezmienniczą jeśli jej komutator z całą algebrą zawiera się w niej samej. Algebra jest prosta jeśli nie zawiera nietrywialnych algebr
niezmienniczych. Prosta algebra zwarta odpowiada grupie Liego, która jest zwarta w sensie topologicznym.
12
Jak to już stwierdziliśmy, warunek unitarności pociąga za sobą hermitowskość χ. Dowolną macierz
hermitowską 2 × 2 możemy zapisać w postaci
[
]
a
b − ic
χ=
b + ic
d
dla rzeczywistych a, b, c, d. Obliczając wyznacznik U i przyrównując go do 1 otrzymujemy warunek
1 = det(1 + iχ) = 1 + iε(a + d) + O(ε2 )
Ponieważ interesują nas elementy infinitezymalne, więc istotne jest zachodzenie powyższej zależności
do rzędu ε. Oznacza to, że wyraz stojący przy ε powinien znikać, a zatem d = −a i w efekcie Tr χ =
0. Ostatecznie widzimy, że grupa SU (2) jest parametryzowana przez 3 niezależne liczby rzeczywiste
a, b, c, zaś algebrę możemy rozpiąć np. w następujący sposób
[
]
[
]
[
]
[
]
a
b − ic
0 1
0 −i
1 0
χ=
=b
+c
+a
b + ic
−a
1 0
i 0
0 −1
[
Macierze
σ1 =
0
1
1
0
]
[
σ2 =
−i
0
0
i
]
[
σ3 =
1
0
0
−1
]
to macierze Pauliego, które spełniają zależność (możliwą do sprawdzenia bezpośrednim rachunkiem)
∑
σA σB = δAB 1 + i
ϵABC σC
(22)
C
W teorii pola jako generatory wybieramy nie σA , ale
tA =
1
σA
2
(23)
Jak łatwo obliczyć z (22), spełniony jest wówczas warunek unormowania Tr(tA tB ) = 12 δAB . Nietrudno
również sprawdzić, że stałe struktury zadane są zależnością CABC = δAD C DAB = ϵABC . Wynika stąd,
że generatorami reprezentacji dołączonej algebry su(2) są macierze






0 0 0
0 0 i
0 −i 0






tad
tad
0 0  tad
0 0 
1 =  0 0 −i 
2 = 0
3 = i
0 i 0
−i 0 0
0 0 0
2.2
Obiekty teorii pola z cechowaniem nieabelowym
Możemy teraz przystąpić do formułowania teorii z cechowaniem nieabelowym . Jak się przekonamy,
jej struktura jest niemal całkowicie analogiczna do tej, którą wyłuskaliśmy z omawianego wyżej sformułowania elektromagnetyzm.
Powiedzmy, że dane są pola materii, które organizujemy w wektor


Ψ1
 . 
. 
Ψ=
 . 
Ψk
13
Na pole Ψ działa transformacja cechowania z reprezentacji R grupy Liego G danej przez unitarne
macierze k × k.
Ψ → Ψ′ = U R Ψ
(24)
R
dla U R = eiχ , gdzie χR jest elementem odpowiedniej reprezentacji algebry Liego g. Pochodną kowariantną określmy w postaci
DµR = ∂µ − igAR
(25)
µ
R
gdzie AR
µ są macierzami z reprezentacji R algebry Liego g. O Aµ żądamy, aby transformowały się
według reguły
1
−1
′R
R R R −1
(26)
AR
− U R ∂µ U R
µ → Aµ = U Aµ U
ig
Dzięki temu mamy zapewnione, że pochodne kowariantne transformują się jak pola materii
DµR Ψ → Dµ′R Ψ′ = U R DµR Ψ
(27)
Określamy natężenie pola zależnością
R
Ψ
[DµR Ψ, DνR Ψ]Ψ = −igFµν
(28)
Nietrudno obliczyć, że to określenie jest poprawne ( n. (DµR ΨDνR −DνR ΨDµR )Ψ faktycznie nie zawiera
pochodnych Ψ), oraz że
R
R
R
R
Fµν
= ∂µ A R
(29)
ν − ∂ν Aµ − ig[Aµ , Aν ]
R
Zapisując (28) dla przetransformowanych pól możemy stwierdzić, że Fµν
transformuje się według reguły
R
′R
R R −1
Fµν
→ Fµν
= U R Fµν
U
(30)
R
Zastanówmy się jak wyglądają infinitezymalne transformacje Ψ, AR
µ i Fµν . Weźmy w tym celu infinitezymalny element reprezentacji algebry Liego χR i utwórzmy transformację U R = 1 + iχR leżącą
nieskończenie blisko identyczności. Dostaniemy wówczas
δΨ = Ψ′ − Ψ = iχR Ψ
1
′R
R
R
R
R
δAR
µ = Aµ − Aµ = −i[Aµ , χ ] + ∂µ χ
g
(31)
R
′R
R
R
δFµν
= Fµν
− Fµν
= −i[Fµν
, χR ]
R
R
Jeśli zapiszmy teraz powyższe zależności wyrażając AR
µ , Fµν i χ w bazie generatorów danej repreA R
R
A R
R
A R
zentacji, n. AR
µ = Aµ tA , Fµν = Fµν tA oraz χ = χ tA wówczas
1
B D A
A
δAA
µ = Aµ χ C BD + ∂µ χ
g
(32)
A
B D A
δFµν
= Fµν
χ C BD
przy czym z (29) możemy łatwo obliczyć, że
A
A
A
B C
Fµν
= ∂µ AA
ν − ∂ν Aµ + gC BC Aµ Aν
14
(33)
Nie bez przyczyny pominęliśmy indeks dotyczący reprezentacji we wzorach (32). Rzecz bowiem w
tym, że polami AA
µ możemy określać pochodną kowariantną pól materii z różnych reprezentacji. Analogicznie jeden zestaw pól χA może nam opisywać transformacje cechowania w różnych reprezentacjach. Nic bowiem nie stoi na przeszkodzie, aby mając inną reprezentację R̃ z polami materii Φ zadać
A R̃
R̃
dla nich transformację cechowania Φ → Φ′ = eiχ tA Φ oraz pochodną kowariantną DµR̃ = ∂µ − igAA
µ tA .
A
Zauważmy teraz, że jeśli potraktujemy Fµν jako składowe pewnego pola materii, n. zapiszemy je
jako wektor kolumnowy


1
Fµν
 . 
. 
Fµν = 
 . 
N
Fµν
wówczas, zgodnie z (32) i definicją generatorów tad
A , pole Fµν transformuje się według reguły
ad
δFµν = iχA tad
A Fµν = iχ Fµν
czyli w reprezentacji dołączonej. Stosując opisaną wyżej ogólną zasadę konstrukcji pochodnej kowariantnej z reprezentacji, możemy stwierdzić, że dla natężenia pola będzie miała ona postać
ad
Dρad Fµν = ∂ρ Fµν − igAC
ρ tC Fµν
2.3
(34)
Działanie Yanga-Millsa i równania pola
Podobnie jak w przypadku elektromagnetyzmu, równania pola dzielą się na dwie grupy – wynikające
z samego określenia natężenia pola Fµν (analogicznie do pierwszej pary równań Maxwella) i otrzymywane z zasady wariacyjnej (tak jak druga para równań Maxwella).
Zajmijmy się najpierw równaniami, które są nietrudną konsekwencją definicji natężenia pola. Stwierdziliśmy już, że transformuje się ono w reprezentacji dołączonej. Zapiszmy zależność (34) dla składowych Fµν (indeks określający reprezentację w symbolu pochodnej kowariantnej będziemy pomijać).
A
A
A
B
Dρ Fµν
= ∂ρ Fµν
− gAC
ρ C BC Fµν
A
Wstawiając do tej zależności Fµν
ze wzoru (33) możemy po uporządkowaniu wyrazów w miarę rosnących potęg stałej sprzężenia napisać
(
)
A
A
A
A
B C
B
C
C
B
C
B
Dρ Fµν
= Fµν
= ∂ρ ∂µ AA
ν − ∂ρ ∂ν Aµ + gC BC ∂ρ Aµ Aν + Aµ ∂ρ Aν − Aρ ∂µ Aν + Aρ ∂ν Aµ
D E
− g 2 C ABC C BDE AC
ρ Aµ Aν
Jeśli teraz zantysymetryzujemy powyższe wyrażenie w indeksach ρ, µ i ν wówczas przekonamy się,
że
A
D[ρ Fµν]
=0
(35)
Dzieje się tak, ponieważ po antysymetryzacji znikają niezależnie wyrazy stojące przy wszystkich potęgach g. Dla g 0 jest to oczywiste (antysymetryzujemy symetryczne pochodne cząstkowe), dla g 1 należy
15
skorzystać z antysymetrii stałych struktury, a w przypadku g 2 interweniuje zależność (19). Zauważmy
jeszcze, że (35) można równoważnie zapisać jako
A
A
A
Dρ Fµν
+ Dν Fρµ
+ Dµ Fνρ
=0
(36)
Zależności (35) (lub alternatywnie (36)) nazywamy tożsamościami Bianchiego. Podkreślmy, że faktycznie
A
są to tożsamości – n. związki, które Fµν
musi spełniać, niezależnie od tego czy potencjał cechowania
A
Aµ jest rozwiązaniem jakiś dodatkowych równań pola, czy nie.
A
Przejdźmy do równań na Fµν
pochodzących od dynamiki potencjału cechowania. Napiszmy działanie
∫
∫
A
4
S[Aµ ] = L d x = (LY M + LM ) d4 x
gdzie LM (Ψ, DρR Ψ) jest gęstością lagranżjanu pól materii, zależną od pól Ψ i ich pochodnych kowariantnych, natomiast LY M jest gęstością lagranżjanu Yanga–Millsa daną wzorem
1
1 R R µν
,F
⟩ = − FAµν F Aµν
LY M = − ⟨Fµν
4
4
Tak określone LY M jest niezmiennicze na transformacje cechowania11 . Dodatnia określoność metryki
w algebrze Liego zapewnia, że energia powiązana z polami cechowania będzie ograniczona od dołu i teoria będzie stabilna na poziomie kwantowym. Równania Eulera–Lagrange’a są dane w ogólnej
postaci
∂L
∂L
=0
(37)
∂µ
−
A
∂(∂µ AA
)
∂A
ν
ν
LM nie zależy od pochodnych potencjału cechowania. Obliczmy zatem
∂LY M
1 ∂(FBρσ F Bρσ )
1 ∂FBρσ Bρσ
∂(∂ρ ABσ ) Bρσ
=
−
=−
F
=−
F
= −FAµν
A
A
A
∂(∂µ Aν )
4 ∂(∂µ Aν )
2 ∂(∂µ Aν )
∂(∂µ AA
ν)
Analogicznie wyznaczamy pochodną LY M po AA
ν
E
∂AD
∂(AD
∂LY M
1 ∂FBρσ Bρσ
1
ρ
ρ Aσ ) Bρσ
=
−
F
=
−
F
=
−gC
AE F Bρσ
gC
BDE
BDE
A
A
A σ
∂AA
2
∂A
2
∂A
∂A
ν
ν
ν
ν
Bνσ
Bµν
= −gCBAE AE
= −gCABC AC
σF
µF
Należy wreszcie znaleźć pochodną LM po AA
ν pamiętając, że potencjał cechowania w LM pojawia się
tylko w pochodnych kowariantnych pól materii.
R
∂LM
∂LM ∂DµR Ψ
∂LM ∂(−igAB
∂LM R
µ tB Ψ)
=
=
= −ig
t Ψ
A
R
A
R
A
∂Aν
∂Dµ Ψ ∂Aν
∂Dµ Ψ
∂Aν
∂DνR Ψ A
Wstawiając powyższe wyrażenia do (37) otrzymujemy
Bµν
−∂µ FAµν + gCABC AC
+ ig
µF
11 Możemy
∂LM R
t Ψ=0
∂DνR Ψ A
ten fakt łatwo wyprowadzić obliczając
′R
⟨Fµν
, F ′R µν ⟩
′R ′R µν
R R µν R
= 2 Tr(Fµν
F
) = 2 Tr(U R Fµν
F
U
−1
) = 2 Tr(U R
−1
R R µν
R
U R Fµν
F
) = ⟨Fµν
, F R µν ⟩
przy czym korzystamy z tego, że kolejność czynników pod śladem można cyklicznie zmieniać.
16
W pierwszych dwóch wyrazach rozpoznajemy wziętą ze znakiem minus pochodną kowariantną (Dµ F µν )A .
Wprowadźmy dodatkowo oznaczenie na nieabelowy prąd
ν
JA
= −ig
∂LM R
t Ψ
∂DνR Ψ A
Możemy teraz zapisać równania ruchu w zwięzłej postaci
ν
Dµ FAµν = −JA
(38)
ν
Zauważmy jeszcze, że prąd JA
jest w kowariantny sposób zachowany. Istotnie
ν
Dν JA
= −Dν Dµ FAµν = −
) 1
1 ( ad )
1(
Dν Dµ FAµν − Dµ Dν FAµν = [Dµ , Dν ]FAµν = − ig Fµν
F Bµν
AB
2
2
2
1 C
= − gFµν
CABC F Bµν
2
C
F Bµν jest symetryczne w indeksach B i C, więc jego zwężenie z antysymetryczjednak wyrażenie Fµν
nymi stałymi struktury daje ostatecznie
ν
=0
Dν JA
Jako podsumowanie tej części sporządźmy krótkie zestawienie podstawowych różnic teorii nieabelowej w stosunku do abelowej.
• Natężenie pola zależy od wyboru cechowania.
• Natężenie pola jest nieliniowe w potencjale cechowania. Już na poziomie niekwantowym przekłada się to na znaczące komplikacje. Różniczkowe równania pola stają się nieliniowe i przestaje
obowiązywać zasada superpozycji (suma dwóch rozwiązań równań pola nie jest nowym rozwiązaniem). Pod tym względem teorie z cechowaniem nieabelowym są podobne do ogólnej teorii
względności12 .
• Stała sprzężenia g występuje w natężeniu pola i równaniach (38) dla pól swobodnych (gdy LM
µ
i JA
są równe zero). Wobec tego wszystkie pola materii powinny mieć tę samą stałą sprzężenia w pochodnej kowariantnej. W przeciwnym wypadku powstawałaby niejednoznaczność w
A
określeniu Fµν
i dynamiki pól swobodnych. W teorii abelowej możemy bez wprowadzania tej
niejednoznaczności przeskalować stałą sprzężenia dla różnych pól materii i zinterpretować ten
zabieg jako wprowadzenie różnych ładunków. W teorii nieabelowej możemy co najwyżej zażądać, aby dane pole nie sprzęgało się w ogóle do pewnych grup cechowania (kładąc wszystkie
generatory odpowiedniej reprezentacji równe 0).
3 Spontaniczne złamanie symetrii
Omówimy teraz pokrótce zjawiska określane jako spontaniczne złamanie symetrii. Są one ściśle powiązane z masą pól, ta zaś jest określona, jako wzięta z odpowiednim znakiem połowa współczynnika
12 Podobieństwo
to istnieje również (do pewnego stopnia) pod względem geometrycznym.
17
µ
T
2
przy wyrazach kwadratowych w polach w lagranżjanie – n. wyrazów typu AA
µ AA , ϕ ϕ lub ρ (ścisłe
uzasadnienie dlaczego właśnie te wyrazy odpowiadają za masę pochodzi z teorii kwantowej i wykracza poza ramy niniejszych notatek).
3.1
Złamanie symetrii globalnych - pola Goldstone’a
W ścisłym sensie, twierdzenie Goldstone’a jest wynikiem kwantowej teorii pola. Jednak nawet na poziomie klasycznym możemy przeanalizować zasadniczy mechanizm prowadzący do powstawania bezmasowych pól pod wpływem złamanej symetrii globalnej.
Rozważmy pole


ϕ1 (x)


..

ϕ(x) = 
.


ϕn (x)
gdzie ϕi (x) są polami rzeczywistymi oraz gęstość lagranżjanu
L=
1
∂µ ϕT ∂ µ ϕ − V (ϕ)
2
która jest niezmiennicza na globalne transformacje δϕ = iχϕ dla infinitezymalnych macierzy χ = const z
algebry Liego g. Niech ϕmin będzie rozwiązaniem minimalizującym energię, n. ϕmin = const i w ϕmin
potencjał V osiąga minimum. (W teorii kwantowej ϕmin odpowiada stan próżniowy). Dopuszczamy
sytuację, a nawet jest ona szczególnie interesująca, w której minimum jest zdegenerowane, n. istnieją
punkty w każdym otoczeniu ϕmin , dla których V ma taką samą wartość jak w ϕmin . Mamy zatem
∂V
(ϕmin ) = 0
∂ϕi
(39)
Wprowadźmy ponadto oznaczenie
(M 2 )ij =
∂V
(ϕmin )
∂ϕi ∂ϕj
(40)
Z określenia M 2 wynika, że jest to symetryczna, nieujemnie określona macierz. Niezmienniczość V
możemy zapisać w następujący sposób
0 = δV = V (ϕ + δϕ) − V (ϕ) =
∂V
∂V
(ϕ)δϕi = i
(ϕ)(χ)ji ϕj
∂ϕi
∂ϕi
Wobec tego
∂V
(ϕ)(χ)ji ϕj = 0
∂ϕi
Zróżniczkujmy powyższy wzór po ϕk
∂V
∂V
(ϕ)(χ)ji ϕj +
(ϕ)(χ)ki = 0
∂ϕi ∂ϕk
∂ϕi
i obliczmy wynik dla ϕ = ϕmin wykorzystując (39) i (40)
(M 2 )ki (χ)ji (ϕmin )j = 0
18
albo w notacji macierzowej
M 2 χϕmin = 0
Warunek ten może być spełniony dwojako.
• χϕmin = 0. Zauważmy, że elementy χ tego rodzaju tworzą podalgebrę Liego13 h ⊂ g. Jest to
algebra Liego grupy nienaruszonych symetrii, czyli tej grupy, która zachowuje „próżnię” ϕmin .
• χϕmin ̸= 0. Wtedy v = χϕmin musi być wektorem własnym macierzy M 2 z wartością własną
0. W tym przypadku wektory v tworzą pewną przestrzeń liniową, która jest podprzestrzenią14
przestrzeni własnej M 2 o wartości własnej 0. Wektory te pochodzą od naruszonych (złamanych)
symetrii.
Powiedzmy, że generatory tA algebry g zostały dobrane w ten sposób, że pierwszych N z nich nie należy do podalgebry h ( n. t1 , . . . , tN ∈
/ h), natomiast pozostałe rozpinają h (czyli span(tN +1 , . . . , tn ) = h).
Wówczas wektory vI = tI ϕmin , gdzie I = 1, . . . , N stanowią układ niezależnych liniowo15 wektorów
własnych M 2 o wartości własnej 0. Macierz M 2 jako rzeczywista i symetryczna może być zdiagonalizowana przez macierz ortogonalną S, n.


0


..


.






0

ST M 2S = 


2
m1




..


.


2
mn−N
dla S T S = 1. Z naszej analizy wektorów vI wynika, że na przekątnej zdiagonalizowanej macierzy
znajduje się co najmniej N zer – tyle ile „złamanych” generatorów. Ostatni krok polega na redefinicji
pól. Wprowadźmy najpierw zmienną ϕ′ , która mierzy odchylenie od pola ϕmin zależnością
ϕ = ϕmin + ϕ′
Wyraźmy teraz nasz lagranżjan przy użyciu ϕ′ rozwijając jednocześnie V wokół ϕmin . Dostajemy
L=
∂V
1 ∂2V
1
∂µ ϕ′T ∂ µ ϕ′ − V (ϕmin ) −
(ϕmin )ϕ′i −
(ϕmin )ϕ′i ϕ′j + . . .
2
∂ϕi
2 ∂ϕi ∂ϕj
Pomijając stały wyraz V (ϕmin ) i wykorzystując (39) i (40) otrzymujemy
L=
1
1
∂µ ϕ′T ∂ µ ϕ′ − ϕ′T M 2 ϕ′ + . . .
2
2
13 Zarówno
kombinacja liniowa, jak i komutator elementów g spełniających χϕmin = 0, również spełnia ten warunek.
mamy gwarancji, że w ten sposób wygenerujemy całą przestrzeń własną M 2 o wartości własnej 0, dlatego mówimy
tylko o podprzestrzeni.
15 Gdyby istniały niezerowe współczynniki cI takie, że cI v = 0 wówczas cI t ∈ h, czyli c1 t + · · · + cN t
1
1
I
I
N = d tN +1 + · · · +
dn−N tn co przeczyłoby liniowej niezależności generatorów.
14 Nie
19
Ostatecznie obróćmy wszystkie pola macierzą S kładąc
ϕ′ = S ϕ̃
a wówczas lagranżjan przyjmie postać
L=
1
1
∂µ ϕ̃T S T S∂ µ ϕ̃ − ϕ̃T S T M 2 S ϕ̃ + . . .
2
2
czyli


0





1
1
T µ
T 
L = ∂µ ϕ̃ ∂ ϕ̃ − ϕ̃ 
2
2




..





 ϕ̃ + . . .





.
0
m21
..
.
m2n−N
Postać wyrazów typu ϕ̃2i mówi nam teraz, że pola ϕ̃1 , . . . , ϕ̃N , odpowiadające złamanym symetriom są
bezmasowe. Są to pola Goldstone’a, a odpowiadające im w teorii kwantowej cząstki to bozony Goldstone’a.
Przykład. Niech V (ϕ) = λ4 (ϕT ϕ − v 2 )2 , dla λ, v ∈ R+ . Lagranżjan
L=
1
∂µ ϕT ∂ µ ϕ − V (ϕ)
2
jest niezmienniczy na globalne, rzeczywiste transformacje ϕ → Rϕ, gdzie R ∈ O(n), n. RT R = 1.
Stałymi polami ϕmin minimalizującymi potencjał są te , które spełniają warunek |ϕmin |2 = ϕTmin ϕmin = v 2 .
Wszystkie takie pola można przez przekształcenie symetrii sprowadzić do



ϕmin = 


0
..
.
0
v






(41)
Dla ustalenia uwagi, oraz aby otrzymać M 2 od razu w postaci diagonalnej, ograniczamy się do powyższej postaci ϕmin . Łatwo obliczyć, że
∂V
= 2λϕi ϕj + λ(ϕT ϕ − v 2 )δij
∂ϕi ∂ϕj
a stąd



M =


2

0
..





.
0
2λv 2
20
√
Wobec tego, pola ϕ1 , . . . , ϕn−1 są polami Goldstone’a, a pole ϕn ma masę v 2λ. Zauważmy jeszcze, że
symetrie zachowujące (41) opisać można macierzami postaci
[
]
R̃ 0
0 1
gdzie R̃ ∈ O(n−1), a więc nienaruszona grupa symetrii to O(n−1). Grupa O(n) jest n(n−1)
–parametrowa,
2
wobec tego ilość naruszonych symetrii wynosi
n(n − 1) (n − 1)(n − 2)
−
=n−1
2
2
czyli faktycznie tyle, ile bezmasowych pól.
3.2
Mechanizm Higgsa
Potencjał cechowania AA
µ występujący w teorii Yanga–Millsa jest bezmasowy. Co więcej, nie jest możliwe dopisanie do gęstości lagranżjanu wyrazu postaci 21 mAµA AA
µ , gdyż nie byłby on niezmienniczy
na transformacje cechowania. Z drugiej strony, w fizycznych zastosowaniach teorii Yanga–Millsa obserwujemy masywne cząstki odpowiadające polom AA
µ . Rozwiązanie tego problemu daje mechanizm
Higgsa–Englerta–Brouta (możliwe jest wymienienie z tej okazji jeszcze innych nazwisk), który omówimy przez podanie przykładu. (Pochodzi on z książki [3]). Jak wie zapewne każdy, kto w minimalnym
choćby stopniu odbiera przekaz mediów, w ostatnim czasie eksperymentalnie odnaleziono ostatni element potwierdzający fizyczną słuszność tego modelu w obrębie fizyki cząstek elementarnych – cząstkę
Higgsa, czyli kwantowe wzbudzenie pola analogicznego do tego, które teraz opiszemy.
Rozważmy pole
[
]
ϕ1
ϕ=
ϕ2
gdzie ϕ1 i ϕ2 są zespolone, transformujące się w reprezentacji (23) grupy SU (2). W przeciwieństwie do
przypadku pól Goldstone’a żądamy, aby symetria ta była lokalną symetrią cechowania. Prostą konsekwencją tego żądania jest fakt, że każde pole ϕ można teraz przez transformację cechowania sprowadzić
wszędzie do postaci
[
]
0
′
ϕ → ϕ = Uϕ =
(42)
|ϕ|
√
gdzie |ϕ| = ϕ+ ϕ. Faktycznie, kładąc
[
]
ϕ2 −ϕ1
1
U=
∈ SU (2)
|ϕ| ϕ∗1 ϕ∗2
dostajemy wymaganą postać ϕ′ . Gęstość lagranżjanu zadajmy w postaci
L = LY M + LH
gdzie
LH = (Dµ ϕ)+ (Dµ ϕ) − V (ϕ)
21
dla
λ +
(ϕ ϕ − v 2 )2
4
Tak samo jak w przykładzie ilustrującym powstawanie pól Goldstone’a, polami o najniższej energii są
2
te, które spełniają warunki ϕmin = const oraz |ϕmin |2 = ϕ+
min ϕmin = v i bez straty ogólności możemy
położyć
[
]
0
ϕmin =
v
V (ϕ) =
Jednak tym razem, również pole ϕ możemy „obrócić” lokalną transformacją SU (2) do postaci (42).
Ustalmy zatem cechowanie w ten właśnie sposób i wprowadźmy rzeczywiste pole ρ, które mierzy
odchylenie od „próżni” ϕmin
[
]
0
ϕ=
v + √ρ2
i wstawmy je do LH pamiętając, że
Dµ = ∂µ − igAA
µ tA
dla tA = 21 σA . Otrzymujemy
LH
1
= ∂µ ρ∂ µ ρ − igAA
µ
2
(
[
0
∂√µ ρ
2
[
]
+g
tA
2
0
v + √ρ2
Bµ
AA
µA
]
−
[
0 v+
[
0
√ρ
2
v+
√ρ
2
[
]
tA tB
[
]
tA
0
v + √ρ2
])
0
∂√µ ρ
2
]
−
(
)2
λ 2
ρ
ρ v+ √
2
2 2
Łatwo obliczyć, że wyraz liniowy w potencjale cechowania znika dla zupełnie dowolnych macierzy tA .
(
)2
2
Natomiast wyraz kwadratowy, po przekształceniach16 daje g4 AAµ AAµ v + √ρ2 . Stąd ostatecznie w
cechowaniu wyróżnionym przez ϕmin
(
)2
(
)2
g2
ρ
1
λ
ρ
1
+ ∂µ ρ∂ µ ρ − ρ2 v + √
L = − FAµν F Aµν + AAµ AAµ v + √
4
4
2
2
2
2 2
m
mA
Aµ
i − 2ρ ρ2 .
2 AAµ A
g v
2
2 i mρ = λv . Pod-
Masa pól AA
µ i ρ jest dana przez współczynniki stojące odpowiednio w wyrazach
2 2
Wobec tego, złamanie symetrii cechowania przez potencjał V daje nam mA =
kreślmy jeszcze na koniec różnicę między złamaniem symetrii globalnych i lokalnych. Pierwsza sytuacja generuje bezmasowe pola Goldstone’a, natomiast w drugiej większa elastyczność symetrii pozwala
się ich pozbyć, a masywny okazuje się być potencjał cechowania (oraz samo pole Higgsa). W literaturze
często pojawia się z tej okazji zaklęcie „potencjał cechowania zjada pola Goldstone’a i nabywa masy”.
16 Pomocna
jest tutaj zależność (22).
22
Literatura
[1] M. Nakahara Geometry, topology and physics, IOP, Bristol 2003
[2] S. Weinberg Teoria pól kwantowych, t. I–II, PWN, Warszawa 1999
[3] K. A. Meissner Klasyczna teoria pola, PWN, Warszawa 2002
[4] L. Álvarez–Gaumé i M. Á. Vázquez–Mozo An invitation to quantum field theory, Springer–Verlag,
Berlin Heidelberg 2012
[5] H. Georgi Weak interactions and modern particle theory, Dover Publications, New York 2009
[6] L. Landau i E. Lifszyc Mechanika kwantowa. Teoria nierelatywistyczna, PWN, Warszawa 1979
[7] L. Landau i E. Lifszyc Teoria pola, PWN, Warszawa 2009
[8] M. V. Berry Exact Aharonov-Bohm wavefunction obtained by applying Dirac’s magnetic phase factor, Eur.
J. Phys. l (1980) 240-244
23

Podobne dokumenty