Niezmienniki relatywistyczne i ich wykorzystanie w opisie

Transkrypt

Niezmienniki relatywistyczne i ich wykorzystanie w opisie
Niezmienniki relatywistyczne i ich wykorzystanie
w opisie zjawisk fizycznych
Henryk Czyż
29 listopada 2011
1
Wprowadzenie
Konstrukcja niezmienników relatywistycznych jako kontrakcji tensorów dowolnego rzędu pozwala nie tylko na przejrzysty opis zjawisk fizycznych, ale ułatwia
rozwiązanie wielu problemów fizycznych. Weźmy przykład cząstki elementarnej
o masie spoczynkowej m i czteropędzie p
pµ = (E/c, p) ,
(1)
gdzie E jest energią cząstki p jej pędem a c prędkością światła.
Wiedząc, że pµ jest czterowektorem (kontrawariantnym) możemy skonstuować odpowiadający mu wektor kowariantny
pµ = gµν pν = (E/c, −p) .
(2)
Gdzie tensor metryczny w przestrzeni Minkowskiego jakiej używamy do opisu
zjawisk fizycznych ma postać

gµν
1
 0
=
 0
0
0
−1
0
0
0
0
−1
0

0
0 
.
0 
−1
(3)
Niezmiennik p2 ≡ pµ pµ można wyrazić przez masą m cząstki elementarnej
p2 = m2 c2 ,
(4)
który wyraża związek między energią, pędem i masą cząstki elementarnej
E 2 = p2 c2 + m2 c4 .
1
(5)
Związek (4) mówi też, że masa ma taką samą wartość w każdym układzie
odniesienia (nie będziemy w tym wykładzie używać pojęcia masy relatywistycznej
(mr ), której użył Einstein w słynnym wzorze E = mr c2 ).
Pamiętając o związku prędkości, oznaczonej przez v z energią i pędem cząstki
dostajemy
v = c2
p
p
= c2 p
.
2
2
E
p c + m2 c4
(6)
Widać stąd, że długość prędkości
|v| = c p
c|p|
p2 c2 + m2 c4
(7)
nie może przekroczyć prędkości światła c.
Musimy tu nawiązać do ważnego dla całej fizyki pomiaru prędkości neutrin lecących z laboratorium CERN w Szwajcarii do laboratorium Gran Sasso
we Włoszech [1]. Wynik pomiaru wykazuje, że neutrina poruszają się szybciej
niż światło. Gdyby ten pomiar został potwierdzony musielibyśmy zmienić wiele
w naszym opisie zjawisk fizycznych. Pomiar ten mimo koncepcyjnej prostoty mierzymy odległość i czas przelotu neutrin i stąd wyznaczamy ich prędkość jest jednak bardzo trudny pod wzgędem technicznym i wymagał zastosowania
wielu skomplikowanych technik eksperymentalnych (m. in. konieczna jest bardzo dokładna synchronizacja zegarów używanych w obydwu laboratoriach). W
związku z tym, by można było uwierzyć w wyniki tego eksperymentu konieczny
jest niezależny pomiar przez inną grupę badawczą.
Najprostszy sposób w jaki można otrzymać prędkości większe od prędkości
światła nie wychodząc poza szczególna teorię względności to dopuszczenie, że
masa cząstki może być liczbą zespoloną (urojoną). Wtedy m2 < 0 i |v| > c.
Takie koncepcje pojawiły się o wiele wcześniej niż pomiar kolaboracji OPERA,
zaś cząstki o takiej własności nazywamy tachionami. Tego typu rozszerzenie
pojęcia masy prowadzi jednak do poważnych problemów przy konstrukcji teorii oddziaływania cząstek elementarnych, które do teraz nie zostały pomyślnie
rozwiązane.
2
Rozpad β jąder i hipoteza istnienia neutrina
W oparciu o dane eksperymentalne z rozpadów β jąder, i proste wyliczenia kinematyczne z użyciem niezmienników realtywistycznych Wolfgang Pauli w roku
1930 zapostulował istnienie cząstki, która została nazwana neutrino. Prześledzimy tutaj jego tok rozumowania.
Rozpad β jąder to proces
A
ZX
−
→A
Z−1 Y + e + ν̄e
2
(8)
zmiany jednego typu jąder w inne o tej samej liczbie atomowej A i ładunku różnym o 1. Dodatkowo następuje emisja elektronu i antyneutrina elektronowego.
Tyle wiemy dzisiaj, ale problem polega na tym, że w większości prowadzonych
eksperymentów mierzymy tylko energię elektronu. Neutrino tak słabo oddziaływuje z materią, że nie jesteśmy go w stanie zarejestrować bez dedykowanych
temu bardzo skomplikowanych urządzeń pomiarowych, które nie istniały w czasach Pauliego. Nie jesteśmy też w stanie zmierzyć energii powstającego jądra
A
Z−1 Y bo nie wylatuje ono z radioaktywnego źródła, którego używamy. Skąd
więc wiemy, że powstaje tam cząstka unosząca część energii jeśli nie jesteśmy w
stanie tej energii zmierzyć? Rozpatrzmy dwa przykłady: pierwszy z rozpadem
cząstki o masie M na dwie cząstki o masach m1 i m2 drugi z rozpadem cząstki
o masie M na trzy cząstki o masach m1 , m2 i m3 . Postaramy się zobaczyć,
czy z pomiaru energii dla jednej cząstki w stanie końcowym jesteśmy w stanie
wiedzieć na ile cząstek rozpadła się cząstka o masie M .
Kluczowe do rozwiązania tego problemu jest znalezienie ilości niezależnych
niezmienników, ktore możemy skonstruować w każdym z tych przypadków, bo
cały process możemy opisać używając takiej samej ilości zmiennych. Oznaczmy
czteropędy cząstek uczestniczących w tych procesach przez p (czteropęd cząstki
rozpadającej się) oraz p1 , p2 (p3 ) ( czteropędy cząstek powstających w rozpadzie). Wykorzystamy tutaj zasadę zachowania czteropędu
p = p1 + p2
(9)
dla rozpadu na dwie cząstki oraz
p = p1 + p2 + p3
(10)
dla rozpadu na trzy cząstki.
W pierwszym przypadku z 6-ciu niezmienników (p2 ,p21 ,p22 ,p · p1 ,p · p2 ,p1 · p2 )
tylko trzy są niezależne, bo z równania (9) możemy otrzymać 3 niezależne
związki między niezmiennikami mnożąc to równanie przez wszystkie (3) dostępne czteropędy. W przypadku rozpadu na trzy cząstki z 10-ciu niezmienników
6 jest niezależnych bo jesteśmy w stanie dostać tylko cztery niezależne związki
między nimi mnożąc równanie (10) przez wszystkie cztery dostępne czteropędy.
Zatem dla przypadku rozpadu na dwie cząstki wszystkie wielkości kinematyczne ( w tym energie ) powinniśmy być w stanie wyrazić poprzez masy cząstek
uczestniczących w rozpadzie (patrz (4). Zrobimy to poniżej.
Rozpad cząstki na dwie cząstki:
Chcemy wyznaczyć energie dwóch cząstek po rozpadzie przy zadanych masach cząstki ulegającej rozpadowi (M ) i cząstek na jakie się rozpada (m1 , m2 ).
W tym celu definiujemy dla każdej z cząstek czterowektor pędu:
P = (E/c, p~)
P1 = (E1 /c, p~1 )
P2 = (E2 /c, p~2 )
oraz korzystamy z zasady zachowania energii:
E = E1 + E2
3
i zasady zachowania pędu:
p~ = p~1 + p~2
Ponadto z naszego układu równań możemy od razu wyeliminować jedną ze
zmiennych rozpatrując rozpad w układzie środka masy, gdzie cząstka rozpadająca się M znajduje się w spoczynku, stąd:
P = (E/c, ~0)
oraz
~0 = p~1 + p~2 ⇒ p~1 = −p~2
Zdefiniujmy to wszystko w środowisku sage’a: (worksheet rozpad2.sws zawiera ten przykład)
var("c, M, m1, m2, E, E1, E2, p, p1, p2, P, P1, P2, BB, EE, N1, N2")
Pv = vector([E/c, p])
P1v = vector([E1/c, p1])
P2v = vector([E2/c, p2])
energia = E == E1+E2
#zachowanie energii
ped = p == p1+p2
#zachowanie pędu
p0 = p == 0
#układ środka masy
p2 = (solve(ped, p2)[0]).subs(p0)
show(p2)
p2 = −p1
(11)
Korzystając z zależności:
E 2 = p2 c2 + m2 c4
i z wcześniej zdefiniowanych czterowektorów pędu wyznaczamy niezmienniki
rozpadu:
E/c
1 0
α β
T
~
P P = gαβ P P = P gP = (E/c, 0)
~0
0 −1
E
= (E/c, ~0) ~
= (E/c)2 = M 2 c2
(12)
0
1 0
Ei /c
Pi Pi = gαβ Piα Piβ = Pi gPiT = (Ei /c, p~i )
0 −1
p~i
Ei /c
= (Ei /c, −~
pi )
= (Ei /c)2 − p2i = m2i c2 i = 1, 2
p~i
metryka = matrix(2, 2, [1, 0, 0, -1])
PP = P*P == (Pv*metryka*Pv.column())[0]
PP = PP.subs(p0)
PPa = P*P == M^2*c^2
P1P1 = P1*P1 == (P1v*metryka*P1v.column())[0]
P1P1a = P1*P1 == m1^2*c^2
4
(13)
P2P2 = P2*P2 == (P2v*metryka*P2v.column())[0]
P2P2 = P2P2.subs(p2)
P2P2a = P2*P2 == m2^2*c^2
PP1 = P*P1 == (Pv*metryka*P1v.column())[0]
PP1 = PP1.subs(p0)
PP2 = P*P2 == (Pv*metryka*P2v.column())[0]
PP2 = PP2.subs(p0)
P1P2 = P1*P2 == (P1v*metryka*P2v.column())[0]
P1P2 = P1P2.subs(p2)
co pozwala na wyznaczenie związku między energiami
r1 = (energia^2).full_simplify()
show(r1)
E 2 = E12 + 2 E1 E2 + E22
(14)
i pamiętając, że całe obliczenia prowadzimy w układzie spoczynkowym cząstki
rozpadającej się
r1 = r1.subs(solve(PP, E)[0])
r1 = r1.subs(solve(PPa, P)[0])
pom = sqrt(r1.rhs()) == sqrt(r1.lhs())
assume(M>0)
pom = pom.full_simplify()
show(pom)
dostajemy
E1 + E2 = M c2
(15)
Pozostało nam znaleźć drugi związek między energiami E1 i E2
r2 = ((P1P1 - P2P2)).full_simplify()
show(r2)
r2 = r2.subs(P1P1a)
r2 = ((r2.subs(P2P2a)).divide_both_sides(1/c^2)).full_simplify()
show(r2)
c4 m21 − c4 m22 = E12 − E22
Rozwiązujemy te równania ((15) i (16)) korzystając z narzędzi sage’a
rozwiazania = solve([pom,r2],E1,E2)
show(rozwiazania)
5
(16)
M 2 c2 + c2 m21 − c2 m22
M 2 c2 − c2 m21 + c2 m22
E1 =
, E2 =
.
2M
2M
(17)
Z rozwiązań (17) można zobaczyć, że dla naszego przypadku domniemanego
rozpadu jądra na dwie cząstki energia elektronu powinna się wyrażać przez masy
jąder i masę elektronu a zatem powinna przyjmować tylko jedną wartość. W eksperymentach obserwowano jednak ciągły rozkład energii elektronu a nie jedną
wartość, co pozwala wnioskować, że w procesie rozpadu powstaje więcej niż dwie
cząstki. Już dla trzech cząstek mamy 6 niezależnych wielkości i prócz 4 mas cząstek możemy wybrać energie dwóch cząstek końcowych jako niezależne zmienne.
Oczywiście mając tylko do dyspozycji informację o rozkładzie energii elektronu
nie wiemy ile dokładnie powstaje cząstek, ale zwykle najprostsze założenia (w
tym przypadku 3 cząstki) sprawdzają sie bardzo dobrze. Pauli mógł oczywiście
przyjąć, tak jak sugerowali inni fizycy, że obserwacja świadczy o niezachowaniu
energii i/lub pędu, bo z nich wynikają wyprowadzone przez nas związki, ale
wtedy pewnie w mojej dyskusji pojawiłoby się inne nazwisko.
Problem na ćwiczenia:
Znaleźć graficznie na płaszczyźnie E1 − E2 dopuszczalne wartości obydwu
energii.
Wskazówka: Rozpatrzeć cały proces w układzie spoczynkowym cząstki rozpadającej się. Rozpatrzeć ograniczenia na energię wynikających ze związków
enerii, pędu i masy oraz zasady zachowania energii. Z zasady zachowania pędu
można znaleźć związek między cosinusem kąta między pędami p1 i p2 a energiami:
M 2 c4 + c4 m21 + c4 m22 − c4 m23 − 2 E1 c2 + E2 c2 M + 2 E1 E2
p
p
cos (a) =
2 −c4 m22 + E22 −c4 m21 + E12
(18)
Jeden sposób rozwiązania postawionego problemu znajduje się w worksheetcie rozpad3.sws, gdzie zakres dopuszczalnych wartości energii znaleziono numerycznie.
3
Konstrukcja funkcji Lagrange’a dla elektrodynamiki
Chcąc znaleźć funkcję Lagrange’a opisującą pole elektromagnetyczne - lagrangian elektrodynamiki - szukamy jej w postaci niezmienniczej względem grupy
Lorentza. Zajmiemy się tutaj częścią lagrangianu opisującą same pole elektromagnetyczne. Równania ruchu jakie dostaniemy nie powinny być oczywiście niczym innym niż równaniami Maxwella, ale zobaczymy poniżej, że bardzo proste
argumenty nie pozwalają na zbudowanie teorii różnej od tej opisywanej równaniami Maxwella. Do opisu używamy czteropotencjału zbudowanego z potencjału
skalarnego i wektorowego
6
Aµ = (φ/c, A) ,
(19)
który jest zwązany z polami elektrycznym E i magnetycznym B poprzez
B = rot(A) , E = −grad(φ) −
∂A
.
∂t
(20)
Zauważmy od razu, że dwa z czterech równań Maxwella są spełnione automatycznie:
∂B
=0
∂t
divB = 0 .
rotE +
(21)
Zatem używając do opisu czteropotencjału Aµ razem ze związkami (20) nie
musimy pamiętać o równaniach (21).
Budując lagrangian oddziaływania pola elektromagnetycznego z ładunkami
używaliśmy tensora pola elektromagnetycznego
F µν = ∂ µ Aν − ∂ ν Aµ .
(22)
Razem z tensorem metrycznym g µν i tensorem Levi-Civita µναβ są to wszystkie wielkości z których możemy zbudować niezmienniczy relatywistycznie lagrangian poprzez kontrakcję tensorów i czterowektorów. Wyższych pochodnych
pól niż pierwsze nie używamy do konstrukcji lagrangianu z takich samych powodów, dla których wcześniej lagrangian nie zależał od przyśpieszenia. Część
lagrangianu, którą teraz konstruujemy nie może zależeć też w jawny sposób ani
od czteropołożenia ani od czteroprędkości bo wtedy uległyby zmianie równania,
które wyprowadziliśmy wcześniej, opisujące oddziaływanie pola elektromagnetycznego z prądami. Możliwe niezmienniki to Ñ1 = F µν Fµν , Ñ2 = µναβ Fµν Fαβ ,
Ñ3 = Aµ Aµ i oczywiście każda funkcja tych niezmienników. Jednak gdy chcemy
by w naszej teorii była zasada superpozycji pól, co oznacza liniowe równania
pola nie możemy mieć w lagrangianie wyższych potęg pól niż druga, zostają
więc do dyspozycji tylko te trzy niezmienniki. Uważny czytelnik zauważy, że
mogliśmy jeszcze skonstruować niezależny tensor symetryczny ∂ µ Aν + ∂ ν Aµ i
użyć go do konstrukcji niezmienników. Dlaczego go nie używamy i dlaczego wyrzucimy z dalszych rozważań niezmiennik Ñ3 wyjaśnimy dopiero gdy będziemy
omawiać prawa zachowania. Wyprzedzając fakty powiemy teraz tylko, że gdybyśmy ich użyli do konstrukcji lagrangianu nie mielibyśmy prawa zachowania
ładunku elektrycznego.
Zostały nam zatem niezmienniki Ñ1 i Ñ2 . Wyraźmy je na początek poprzez
natężenia pól elektrycznego i magnetycznego. By się nie zanudzić mnożeniem
macierzy zróbmy to w sagu. Zdefiniujmy na początek tensory F i g o składowych
kontrawariantnych
7
var(’E1,E2,E3,c,B1,B2,B3’)
F = matrix(4,[0,-E1/c,-E2/c,-E3/c,E1/c,0,-B3,B2,E2/c,B3,0,-B1,E3/c,-B2,B1,0])
g = matrix(4,[1,0,0,0,0,-1,0,0,0,0,-1,0,0,0,0,-1])
show(F)
show(g)


F µν = 

0
E1
c
E2
c
E3
c
− Ec1
0
B3
−B2
− Ec2
−B3
0
B1


− Ec3
1
 0
B2 
 , gµν = 
 0
−B1 
0
0

0
0
0
−1
0
0 

0 −1
0 
0
0 −1
(23)
oraz tensor F o składowych kowariantnych
FT =g*F*g
show(FT)

0
 − E1
c
Fµν = gµα gνβ F αβ = 
 − E2
c
− Ec3
E1
c
E2
c
0
B3
−B2
−B3
0
B1
E3
c

B2 
.
−B1 
0
(24)
Zauważając, że N1 jest po prostu śledem iloczynu tensora F µν i transpozycji
tensora Fµν , który jest antysymetryczny, dostajemy
inv1 = (-F*FT).trace()
show(inv1)
Ñ1 = 2 B12 + 2 B22 + 2 B32 −
2 E12
2 E22
2 E32
−
−
.
c2
c2
c2
(25)
By dostać drugi z niezmienników zdefiniujmy w sagu tensor Levi-Civity o
wskaźnikach kontrawariantnych:
def eps(i1,i2,i3,i4):
if i1==i2 or i1==i3 or i1==i4 or i2==i3 or i2==i4 or i3==i4:
return 0
else:
if (i1==0 and i2==1 and i3==2 and i4==3) or (i1==0 and i2==2 and i3==3 and i4==1) or
return 1
else:
return -1
i pomnóżmy go przez tensor Fµν by otrzymać drugi z niezmienników
8
inv2 = 0
for l1 in range(0,4):
for l2 in range(0,4):
for l3 in range(0,4):
for l4 in range(0,4):
inv2=inv2+eps(l1,l2,l3,l4)*FT[l1,l2]*FT[l3,l4]
show(inv2)
Ñ2 = −
8 B2 E2
8 B3 E3
8 B1 E 1
−
−
.
c
c
c
(26)
By nie pisać zbyt wielu stałych przedefiniujmy te niezmienniki
inv1p = inv1/2
inv2p = (-inv2/8*c).full_simplify()
show(inv1p)
show(inv2p)
N1 = B12 + B22 + B32 −
E12
E22
E32
−
−
, N2 = B1 E1 + B2 E2 + B3 E3
c2
c2
c2
(27)
lub krócej
N1 = B2 − E2 /c2 , N2 = B · E .
(28)
Zauważmy tutaj, że N2 można zapisać jako pochodną zupełną
Ñ2 = µναβ Fµν Fαβ
= 4µναβ [∂µ Aν ∂α Aβ + Aν ∂µ ∂α Aβ ]
= 4∂µ µναβ Aν ∂α Aβ ,
(29)
gdzie w drugiej linii dodaliśmy zero (drugi człon w nawiasie). Jak wiadomo
dodanie pochodnej zupełnej do lagrangianu nie zmienia równań ruchu, więc do
zbudowania lagrangianu został nam tylko niezmiennik N1 . Zajmiemy się tym
później.
Teraz zobaczmy jakie wnioski możemy wyciągnąć z wiedzy, że N1 i N2 są
niezmiennikami relatywistycznymi:
• Jeżeli pola E i B są prostopadłe w jakimś wybranym układzie odniesienia
(N2 = 0) to są prostopadłe w każdym układzie odniesienia
• Jeżeli |E/c| > |B| w jakimś wybranym układzie odniesienia (N1 < 0) to
jest to prawdziwe w każdym układzie odniesienia
9
• Jeżeli pola E i B nie są prostopadłe w jakimś wybranym układzie odniesienia (N2 6= 0) to można znaleźć układ odniesienia, w którym są one
równoległe (lub antyrównoległe)
Dwa pierwsze wnioski w oczywisty sposób wynikają z postaci niezmienników,
choć bez wiedzy że N1 i N2 są niezmiennikami ich pokazanie nie jest proste. By
wykazać punkt trzy zauważmy, że by istniał układ odniesienia, w którym pola
E i B są równoległe (lub antyrównoległe) powinno zachodzić
N1 = B 2 − E 2 /c2 , N2 = (−)BE ,
(30)
gdzie E = |E| i B = |B| są długościami wektorów E i B. Znak minus pojawia
się gdy niezmiennik N2 jest ujemny. Wtedy pola E i B są antyrównoległe. Możliwość znalezienia takiego układu wymaga by układ równań (30) miał zawsze
rozwiązania dodatnie (E i B są długościami wektorów), niezależnie od wielkości
niezmienników N1 i N2 . Rozwiążmy te równania korzystając z sage’a
rr1 = N1 == BB^2 -EE^2/c^2
rr2 = N2 == BB*EE
rr3 = N2 == -BB*EE
rozwiazania1 = solve([rr1,rr2],EE,BB)
rozwiazania2 = solve([rr1,rr3],EE,BB)
show(rozwiazania1[0])
show(rozwiazania1[1])
show(rozwiazania2[0])
show(rozwiazania2[1])
gdzie rozwiązaliśmy osobno układ równań dla przypadku N2 dodatniego

r
√
√

2N2

p
√
−N1 c + N12 c2 + 4 N22 c

r
√
q
√
1
2N
2
EE =

−N1 c2 + N12 c2 + 4 N22 c 2, BB = q
p
√ (31)
2
2
2
2
−N1 c + N1 c + 4 N2 c
EE = − 1
2

−N1 c2 +
q
N12 c2 + 4 N22 c 2, BB = − q
i N2 ujemnego

r
√
N12 c2 + 4 N22 c 2, BB = q
√

2N2
EE = − 1 −N1 c2 +

p
√
2
−N1 c + N12 c2 + 4 N22 c


r
√
q
√
1
2N
2
EE =

−N1 c2 + N12 c2 + 4 N22 c 2, BB = − q
p
√ . (32)
2
2
2
2
−N1 c + N1 c + 4 N2 c
q
10
Jak łatwo zauważyć w obydwu przypadkach druga para rozwiązań daje rozwiązania dodatnie niezależnie od wartości niezmienników N1 i N2 . Gdy interesuje nas rozwiązanie zagadnienia znalezienia toru cząstki naładowanej w polach
magnetycznym i elektrycznym, z wyprowadzonych własności wynika, że można
rozwiązać to zagadnienie tylko dla dwóch przypadków, gdy pola E i B są równoległe i gdy pola E i B są prostopadłe. W przypadku gdy interesuje nas rozwiązanie w układzie gdy pola są dowolnie skierowane szukamy najpierw układu
gdzie pola są równoległe i transformujemy znane rozwiązanie dla pól równoległych do wyjściowego układu. Pamiętając jak skomplikowane było znalezienie
rozwiązania dla pól równoległych możemy sobie wyobrazić, że zaproponowana
metoda będzie prostsza od próby bezpośredniego rozwiązania równań ruchu dla
dowolnie skierowanych pól.
4
Bibliografia
[1] “Measurement of the neutrino velocity with the OPERA detector in the
CNGS beam.” OPERA Collaboration (T. Adam et al.). Sep 2011.; arXiv:1109.4897
11

Podobne dokumenty