Niezmienniki relatywistyczne i ich wykorzystanie w opisie
Transkrypt
Niezmienniki relatywistyczne i ich wykorzystanie w opisie
Niezmienniki relatywistyczne i ich wykorzystanie w opisie zjawisk fizycznych Henryk Czyż 29 listopada 2011 1 Wprowadzenie Konstrukcja niezmienników relatywistycznych jako kontrakcji tensorów dowolnego rzędu pozwala nie tylko na przejrzysty opis zjawisk fizycznych, ale ułatwia rozwiązanie wielu problemów fizycznych. Weźmy przykład cząstki elementarnej o masie spoczynkowej m i czteropędzie p pµ = (E/c, p) , (1) gdzie E jest energią cząstki p jej pędem a c prędkością światła. Wiedząc, że pµ jest czterowektorem (kontrawariantnym) możemy skonstuować odpowiadający mu wektor kowariantny pµ = gµν pν = (E/c, −p) . (2) Gdzie tensor metryczny w przestrzeni Minkowskiego jakiej używamy do opisu zjawisk fizycznych ma postać gµν 1 0 = 0 0 0 −1 0 0 0 0 −1 0 0 0 . 0 −1 (3) Niezmiennik p2 ≡ pµ pµ można wyrazić przez masą m cząstki elementarnej p2 = m2 c2 , (4) który wyraża związek między energią, pędem i masą cząstki elementarnej E 2 = p2 c2 + m2 c4 . 1 (5) Związek (4) mówi też, że masa ma taką samą wartość w każdym układzie odniesienia (nie będziemy w tym wykładzie używać pojęcia masy relatywistycznej (mr ), której użył Einstein w słynnym wzorze E = mr c2 ). Pamiętając o związku prędkości, oznaczonej przez v z energią i pędem cząstki dostajemy v = c2 p p = c2 p . 2 2 E p c + m2 c4 (6) Widać stąd, że długość prędkości |v| = c p c|p| p2 c2 + m2 c4 (7) nie może przekroczyć prędkości światła c. Musimy tu nawiązać do ważnego dla całej fizyki pomiaru prędkości neutrin lecących z laboratorium CERN w Szwajcarii do laboratorium Gran Sasso we Włoszech [1]. Wynik pomiaru wykazuje, że neutrina poruszają się szybciej niż światło. Gdyby ten pomiar został potwierdzony musielibyśmy zmienić wiele w naszym opisie zjawisk fizycznych. Pomiar ten mimo koncepcyjnej prostoty mierzymy odległość i czas przelotu neutrin i stąd wyznaczamy ich prędkość jest jednak bardzo trudny pod wzgędem technicznym i wymagał zastosowania wielu skomplikowanych technik eksperymentalnych (m. in. konieczna jest bardzo dokładna synchronizacja zegarów używanych w obydwu laboratoriach). W związku z tym, by można było uwierzyć w wyniki tego eksperymentu konieczny jest niezależny pomiar przez inną grupę badawczą. Najprostszy sposób w jaki można otrzymać prędkości większe od prędkości światła nie wychodząc poza szczególna teorię względności to dopuszczenie, że masa cząstki może być liczbą zespoloną (urojoną). Wtedy m2 < 0 i |v| > c. Takie koncepcje pojawiły się o wiele wcześniej niż pomiar kolaboracji OPERA, zaś cząstki o takiej własności nazywamy tachionami. Tego typu rozszerzenie pojęcia masy prowadzi jednak do poważnych problemów przy konstrukcji teorii oddziaływania cząstek elementarnych, które do teraz nie zostały pomyślnie rozwiązane. 2 Rozpad β jąder i hipoteza istnienia neutrina W oparciu o dane eksperymentalne z rozpadów β jąder, i proste wyliczenia kinematyczne z użyciem niezmienników realtywistycznych Wolfgang Pauli w roku 1930 zapostulował istnienie cząstki, która została nazwana neutrino. Prześledzimy tutaj jego tok rozumowania. Rozpad β jąder to proces A ZX − →A Z−1 Y + e + ν̄e 2 (8) zmiany jednego typu jąder w inne o tej samej liczbie atomowej A i ładunku różnym o 1. Dodatkowo następuje emisja elektronu i antyneutrina elektronowego. Tyle wiemy dzisiaj, ale problem polega na tym, że w większości prowadzonych eksperymentów mierzymy tylko energię elektronu. Neutrino tak słabo oddziaływuje z materią, że nie jesteśmy go w stanie zarejestrować bez dedykowanych temu bardzo skomplikowanych urządzeń pomiarowych, które nie istniały w czasach Pauliego. Nie jesteśmy też w stanie zmierzyć energii powstającego jądra A Z−1 Y bo nie wylatuje ono z radioaktywnego źródła, którego używamy. Skąd więc wiemy, że powstaje tam cząstka unosząca część energii jeśli nie jesteśmy w stanie tej energii zmierzyć? Rozpatrzmy dwa przykłady: pierwszy z rozpadem cząstki o masie M na dwie cząstki o masach m1 i m2 drugi z rozpadem cząstki o masie M na trzy cząstki o masach m1 , m2 i m3 . Postaramy się zobaczyć, czy z pomiaru energii dla jednej cząstki w stanie końcowym jesteśmy w stanie wiedzieć na ile cząstek rozpadła się cząstka o masie M . Kluczowe do rozwiązania tego problemu jest znalezienie ilości niezależnych niezmienników, ktore możemy skonstruować w każdym z tych przypadków, bo cały process możemy opisać używając takiej samej ilości zmiennych. Oznaczmy czteropędy cząstek uczestniczących w tych procesach przez p (czteropęd cząstki rozpadającej się) oraz p1 , p2 (p3 ) ( czteropędy cząstek powstających w rozpadzie). Wykorzystamy tutaj zasadę zachowania czteropędu p = p1 + p2 (9) dla rozpadu na dwie cząstki oraz p = p1 + p2 + p3 (10) dla rozpadu na trzy cząstki. W pierwszym przypadku z 6-ciu niezmienników (p2 ,p21 ,p22 ,p · p1 ,p · p2 ,p1 · p2 ) tylko trzy są niezależne, bo z równania (9) możemy otrzymać 3 niezależne związki między niezmiennikami mnożąc to równanie przez wszystkie (3) dostępne czteropędy. W przypadku rozpadu na trzy cząstki z 10-ciu niezmienników 6 jest niezależnych bo jesteśmy w stanie dostać tylko cztery niezależne związki między nimi mnożąc równanie (10) przez wszystkie cztery dostępne czteropędy. Zatem dla przypadku rozpadu na dwie cząstki wszystkie wielkości kinematyczne ( w tym energie ) powinniśmy być w stanie wyrazić poprzez masy cząstek uczestniczących w rozpadzie (patrz (4). Zrobimy to poniżej. Rozpad cząstki na dwie cząstki: Chcemy wyznaczyć energie dwóch cząstek po rozpadzie przy zadanych masach cząstki ulegającej rozpadowi (M ) i cząstek na jakie się rozpada (m1 , m2 ). W tym celu definiujemy dla każdej z cząstek czterowektor pędu: P = (E/c, p~) P1 = (E1 /c, p~1 ) P2 = (E2 /c, p~2 ) oraz korzystamy z zasady zachowania energii: E = E1 + E2 3 i zasady zachowania pędu: p~ = p~1 + p~2 Ponadto z naszego układu równań możemy od razu wyeliminować jedną ze zmiennych rozpatrując rozpad w układzie środka masy, gdzie cząstka rozpadająca się M znajduje się w spoczynku, stąd: P = (E/c, ~0) oraz ~0 = p~1 + p~2 ⇒ p~1 = −p~2 Zdefiniujmy to wszystko w środowisku sage’a: (worksheet rozpad2.sws zawiera ten przykład) var("c, M, m1, m2, E, E1, E2, p, p1, p2, P, P1, P2, BB, EE, N1, N2") Pv = vector([E/c, p]) P1v = vector([E1/c, p1]) P2v = vector([E2/c, p2]) energia = E == E1+E2 #zachowanie energii ped = p == p1+p2 #zachowanie pędu p0 = p == 0 #układ środka masy p2 = (solve(ped, p2)[0]).subs(p0) show(p2) p2 = −p1 (11) Korzystając z zależności: E 2 = p2 c2 + m2 c4 i z wcześniej zdefiniowanych czterowektorów pędu wyznaczamy niezmienniki rozpadu: E/c 1 0 α β T ~ P P = gαβ P P = P gP = (E/c, 0) ~0 0 −1 E = (E/c, ~0) ~ = (E/c)2 = M 2 c2 (12) 0 1 0 Ei /c Pi Pi = gαβ Piα Piβ = Pi gPiT = (Ei /c, p~i ) 0 −1 p~i Ei /c = (Ei /c, −~ pi ) = (Ei /c)2 − p2i = m2i c2 i = 1, 2 p~i metryka = matrix(2, 2, [1, 0, 0, -1]) PP = P*P == (Pv*metryka*Pv.column())[0] PP = PP.subs(p0) PPa = P*P == M^2*c^2 P1P1 = P1*P1 == (P1v*metryka*P1v.column())[0] P1P1a = P1*P1 == m1^2*c^2 4 (13) P2P2 = P2*P2 == (P2v*metryka*P2v.column())[0] P2P2 = P2P2.subs(p2) P2P2a = P2*P2 == m2^2*c^2 PP1 = P*P1 == (Pv*metryka*P1v.column())[0] PP1 = PP1.subs(p0) PP2 = P*P2 == (Pv*metryka*P2v.column())[0] PP2 = PP2.subs(p0) P1P2 = P1*P2 == (P1v*metryka*P2v.column())[0] P1P2 = P1P2.subs(p2) co pozwala na wyznaczenie związku między energiami r1 = (energia^2).full_simplify() show(r1) E 2 = E12 + 2 E1 E2 + E22 (14) i pamiętając, że całe obliczenia prowadzimy w układzie spoczynkowym cząstki rozpadającej się r1 = r1.subs(solve(PP, E)[0]) r1 = r1.subs(solve(PPa, P)[0]) pom = sqrt(r1.rhs()) == sqrt(r1.lhs()) assume(M>0) pom = pom.full_simplify() show(pom) dostajemy E1 + E2 = M c2 (15) Pozostało nam znaleźć drugi związek między energiami E1 i E2 r2 = ((P1P1 - P2P2)).full_simplify() show(r2) r2 = r2.subs(P1P1a) r2 = ((r2.subs(P2P2a)).divide_both_sides(1/c^2)).full_simplify() show(r2) c4 m21 − c4 m22 = E12 − E22 Rozwiązujemy te równania ((15) i (16)) korzystając z narzędzi sage’a rozwiazania = solve([pom,r2],E1,E2) show(rozwiazania) 5 (16) M 2 c2 + c2 m21 − c2 m22 M 2 c2 − c2 m21 + c2 m22 E1 = , E2 = . 2M 2M (17) Z rozwiązań (17) można zobaczyć, że dla naszego przypadku domniemanego rozpadu jądra na dwie cząstki energia elektronu powinna się wyrażać przez masy jąder i masę elektronu a zatem powinna przyjmować tylko jedną wartość. W eksperymentach obserwowano jednak ciągły rozkład energii elektronu a nie jedną wartość, co pozwala wnioskować, że w procesie rozpadu powstaje więcej niż dwie cząstki. Już dla trzech cząstek mamy 6 niezależnych wielkości i prócz 4 mas cząstek możemy wybrać energie dwóch cząstek końcowych jako niezależne zmienne. Oczywiście mając tylko do dyspozycji informację o rozkładzie energii elektronu nie wiemy ile dokładnie powstaje cząstek, ale zwykle najprostsze założenia (w tym przypadku 3 cząstki) sprawdzają sie bardzo dobrze. Pauli mógł oczywiście przyjąć, tak jak sugerowali inni fizycy, że obserwacja świadczy o niezachowaniu energii i/lub pędu, bo z nich wynikają wyprowadzone przez nas związki, ale wtedy pewnie w mojej dyskusji pojawiłoby się inne nazwisko. Problem na ćwiczenia: Znaleźć graficznie na płaszczyźnie E1 − E2 dopuszczalne wartości obydwu energii. Wskazówka: Rozpatrzeć cały proces w układzie spoczynkowym cząstki rozpadającej się. Rozpatrzeć ograniczenia na energię wynikających ze związków enerii, pędu i masy oraz zasady zachowania energii. Z zasady zachowania pędu można znaleźć związek między cosinusem kąta między pędami p1 i p2 a energiami: M 2 c4 + c4 m21 + c4 m22 − c4 m23 − 2 E1 c2 + E2 c2 M + 2 E1 E2 p p cos (a) = 2 −c4 m22 + E22 −c4 m21 + E12 (18) Jeden sposób rozwiązania postawionego problemu znajduje się w worksheetcie rozpad3.sws, gdzie zakres dopuszczalnych wartości energii znaleziono numerycznie. 3 Konstrukcja funkcji Lagrange’a dla elektrodynamiki Chcąc znaleźć funkcję Lagrange’a opisującą pole elektromagnetyczne - lagrangian elektrodynamiki - szukamy jej w postaci niezmienniczej względem grupy Lorentza. Zajmiemy się tutaj częścią lagrangianu opisującą same pole elektromagnetyczne. Równania ruchu jakie dostaniemy nie powinny być oczywiście niczym innym niż równaniami Maxwella, ale zobaczymy poniżej, że bardzo proste argumenty nie pozwalają na zbudowanie teorii różnej od tej opisywanej równaniami Maxwella. Do opisu używamy czteropotencjału zbudowanego z potencjału skalarnego i wektorowego 6 Aµ = (φ/c, A) , (19) który jest zwązany z polami elektrycznym E i magnetycznym B poprzez B = rot(A) , E = −grad(φ) − ∂A . ∂t (20) Zauważmy od razu, że dwa z czterech równań Maxwella są spełnione automatycznie: ∂B =0 ∂t divB = 0 . rotE + (21) Zatem używając do opisu czteropotencjału Aµ razem ze związkami (20) nie musimy pamiętać o równaniach (21). Budując lagrangian oddziaływania pola elektromagnetycznego z ładunkami używaliśmy tensora pola elektromagnetycznego F µν = ∂ µ Aν − ∂ ν Aµ . (22) Razem z tensorem metrycznym g µν i tensorem Levi-Civita µναβ są to wszystkie wielkości z których możemy zbudować niezmienniczy relatywistycznie lagrangian poprzez kontrakcję tensorów i czterowektorów. Wyższych pochodnych pól niż pierwsze nie używamy do konstrukcji lagrangianu z takich samych powodów, dla których wcześniej lagrangian nie zależał od przyśpieszenia. Część lagrangianu, którą teraz konstruujemy nie może zależeć też w jawny sposób ani od czteropołożenia ani od czteroprędkości bo wtedy uległyby zmianie równania, które wyprowadziliśmy wcześniej, opisujące oddziaływanie pola elektromagnetycznego z prądami. Możliwe niezmienniki to Ñ1 = F µν Fµν , Ñ2 = µναβ Fµν Fαβ , Ñ3 = Aµ Aµ i oczywiście każda funkcja tych niezmienników. Jednak gdy chcemy by w naszej teorii była zasada superpozycji pól, co oznacza liniowe równania pola nie możemy mieć w lagrangianie wyższych potęg pól niż druga, zostają więc do dyspozycji tylko te trzy niezmienniki. Uważny czytelnik zauważy, że mogliśmy jeszcze skonstruować niezależny tensor symetryczny ∂ µ Aν + ∂ ν Aµ i użyć go do konstrukcji niezmienników. Dlaczego go nie używamy i dlaczego wyrzucimy z dalszych rozważań niezmiennik Ñ3 wyjaśnimy dopiero gdy będziemy omawiać prawa zachowania. Wyprzedzając fakty powiemy teraz tylko, że gdybyśmy ich użyli do konstrukcji lagrangianu nie mielibyśmy prawa zachowania ładunku elektrycznego. Zostały nam zatem niezmienniki Ñ1 i Ñ2 . Wyraźmy je na początek poprzez natężenia pól elektrycznego i magnetycznego. By się nie zanudzić mnożeniem macierzy zróbmy to w sagu. Zdefiniujmy na początek tensory F i g o składowych kontrawariantnych 7 var(’E1,E2,E3,c,B1,B2,B3’) F = matrix(4,[0,-E1/c,-E2/c,-E3/c,E1/c,0,-B3,B2,E2/c,B3,0,-B1,E3/c,-B2,B1,0]) g = matrix(4,[1,0,0,0,0,-1,0,0,0,0,-1,0,0,0,0,-1]) show(F) show(g) F µν = 0 E1 c E2 c E3 c − Ec1 0 B3 −B2 − Ec2 −B3 0 B1 − Ec3 1 0 B2 , gµν = 0 −B1 0 0 0 0 0 −1 0 0 0 −1 0 0 0 −1 (23) oraz tensor F o składowych kowariantnych FT =g*F*g show(FT) 0 − E1 c Fµν = gµα gνβ F αβ = − E2 c − Ec3 E1 c E2 c 0 B3 −B2 −B3 0 B1 E3 c B2 . −B1 0 (24) Zauważając, że N1 jest po prostu śledem iloczynu tensora F µν i transpozycji tensora Fµν , który jest antysymetryczny, dostajemy inv1 = (-F*FT).trace() show(inv1) Ñ1 = 2 B12 + 2 B22 + 2 B32 − 2 E12 2 E22 2 E32 − − . c2 c2 c2 (25) By dostać drugi z niezmienników zdefiniujmy w sagu tensor Levi-Civity o wskaźnikach kontrawariantnych: def eps(i1,i2,i3,i4): if i1==i2 or i1==i3 or i1==i4 or i2==i3 or i2==i4 or i3==i4: return 0 else: if (i1==0 and i2==1 and i3==2 and i4==3) or (i1==0 and i2==2 and i3==3 and i4==1) or return 1 else: return -1 i pomnóżmy go przez tensor Fµν by otrzymać drugi z niezmienników 8 inv2 = 0 for l1 in range(0,4): for l2 in range(0,4): for l3 in range(0,4): for l4 in range(0,4): inv2=inv2+eps(l1,l2,l3,l4)*FT[l1,l2]*FT[l3,l4] show(inv2) Ñ2 = − 8 B2 E2 8 B3 E3 8 B1 E 1 − − . c c c (26) By nie pisać zbyt wielu stałych przedefiniujmy te niezmienniki inv1p = inv1/2 inv2p = (-inv2/8*c).full_simplify() show(inv1p) show(inv2p) N1 = B12 + B22 + B32 − E12 E22 E32 − − , N2 = B1 E1 + B2 E2 + B3 E3 c2 c2 c2 (27) lub krócej N1 = B2 − E2 /c2 , N2 = B · E . (28) Zauważmy tutaj, że N2 można zapisać jako pochodną zupełną Ñ2 = µναβ Fµν Fαβ = 4µναβ [∂µ Aν ∂α Aβ + Aν ∂µ ∂α Aβ ] = 4∂µ µναβ Aν ∂α Aβ , (29) gdzie w drugiej linii dodaliśmy zero (drugi człon w nawiasie). Jak wiadomo dodanie pochodnej zupełnej do lagrangianu nie zmienia równań ruchu, więc do zbudowania lagrangianu został nam tylko niezmiennik N1 . Zajmiemy się tym później. Teraz zobaczmy jakie wnioski możemy wyciągnąć z wiedzy, że N1 i N2 są niezmiennikami relatywistycznymi: • Jeżeli pola E i B są prostopadłe w jakimś wybranym układzie odniesienia (N2 = 0) to są prostopadłe w każdym układzie odniesienia • Jeżeli |E/c| > |B| w jakimś wybranym układzie odniesienia (N1 < 0) to jest to prawdziwe w każdym układzie odniesienia 9 • Jeżeli pola E i B nie są prostopadłe w jakimś wybranym układzie odniesienia (N2 6= 0) to można znaleźć układ odniesienia, w którym są one równoległe (lub antyrównoległe) Dwa pierwsze wnioski w oczywisty sposób wynikają z postaci niezmienników, choć bez wiedzy że N1 i N2 są niezmiennikami ich pokazanie nie jest proste. By wykazać punkt trzy zauważmy, że by istniał układ odniesienia, w którym pola E i B są równoległe (lub antyrównoległe) powinno zachodzić N1 = B 2 − E 2 /c2 , N2 = (−)BE , (30) gdzie E = |E| i B = |B| są długościami wektorów E i B. Znak minus pojawia się gdy niezmiennik N2 jest ujemny. Wtedy pola E i B są antyrównoległe. Możliwość znalezienia takiego układu wymaga by układ równań (30) miał zawsze rozwiązania dodatnie (E i B są długościami wektorów), niezależnie od wielkości niezmienników N1 i N2 . Rozwiążmy te równania korzystając z sage’a rr1 = N1 == BB^2 -EE^2/c^2 rr2 = N2 == BB*EE rr3 = N2 == -BB*EE rozwiazania1 = solve([rr1,rr2],EE,BB) rozwiazania2 = solve([rr1,rr3],EE,BB) show(rozwiazania1[0]) show(rozwiazania1[1]) show(rozwiazania2[0]) show(rozwiazania2[1]) gdzie rozwiązaliśmy osobno układ równań dla przypadku N2 dodatniego r √ √ 2N2 p √ −N1 c + N12 c2 + 4 N22 c r √ q √ 1 2N 2 EE = −N1 c2 + N12 c2 + 4 N22 c 2, BB = q p √ (31) 2 2 2 2 −N1 c + N1 c + 4 N2 c EE = − 1 2 −N1 c2 + q N12 c2 + 4 N22 c 2, BB = − q i N2 ujemnego r √ N12 c2 + 4 N22 c 2, BB = q √ 2N2 EE = − 1 −N1 c2 + p √ 2 −N1 c + N12 c2 + 4 N22 c r √ q √ 1 2N 2 EE = −N1 c2 + N12 c2 + 4 N22 c 2, BB = − q p √ . (32) 2 2 2 2 −N1 c + N1 c + 4 N2 c q 10 Jak łatwo zauważyć w obydwu przypadkach druga para rozwiązań daje rozwiązania dodatnie niezależnie od wartości niezmienników N1 i N2 . Gdy interesuje nas rozwiązanie zagadnienia znalezienia toru cząstki naładowanej w polach magnetycznym i elektrycznym, z wyprowadzonych własności wynika, że można rozwiązać to zagadnienie tylko dla dwóch przypadków, gdy pola E i B są równoległe i gdy pola E i B są prostopadłe. W przypadku gdy interesuje nas rozwiązanie w układzie gdy pola są dowolnie skierowane szukamy najpierw układu gdzie pola są równoległe i transformujemy znane rozwiązanie dla pól równoległych do wyjściowego układu. Pamiętając jak skomplikowane było znalezienie rozwiązania dla pól równoległych możemy sobie wyobrazić, że zaproponowana metoda będzie prostsza od próby bezpośredniego rozwiązania równań ruchu dla dowolnie skierowanych pól. 4 Bibliografia [1] “Measurement of the neutrino velocity with the OPERA detector in the CNGS beam.” OPERA Collaboration (T. Adam et al.). Sep 2011.; arXiv:1109.4897 11