Tytuł dokumentu

Transkrypt

Tytuł dokumentu

Franciszek Łada
Jednolita teoria wszystkiego
Kraków, październik 2013
Spis treści
Przedmowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
V
Rozdział 1. Własności pola niesymetrycznego . . . . . . . . . . . . . . . . . . . . . .
1
1.1.
1.2.
1.3.
1.4.
1.5.
1.6.
1.7.
1.8.
1.9.
1.10.
1.11.
Czasoprzestrzenie strukturalne spójne . . . . . . . . . . . . . . . . . .
Podstawowe definicje i oznaczenia . . . . . . . . . . . . . . . . . . . .
Tensor podstawowy i tensor metryczny . . . . . . . . . . . . . . . . .
Pole elektromagnetyczne . . . . . . . . . . . . . . . . . . . . . . . . .
Koneksja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Zwężony tensor krzywizny . . . . . . . . . . . . . . . . . . . . . . . .
λ-niezmienniczość . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Pochodna kowariantna . . . . . . . . . . . . . . . . . . . . . . . . . .
Lokalna i wzdłużna afiniczność . . . . . . . . . . . . . . . . . . . . . .
Zmiana długości wektora przy przeniesieniu równoległym . . . . . . .
Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 1
. 1
. 3
. 4
. 6
. 7
. 7
. 9
. 10
. 11
. 12
Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni . . . . . . . . . . . . 15
2.1.
2.2.
2.3.
Zasada wariacyjna . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Wyprowadzenie równań pola czasoprzestrzeni . . . . . . . . . . . . .
Wnioski z równań pola czasoprzestrzeni . . . . . . . . . . . . . . . . .
2.3.1. Wzór na pochodną kowariantną tensora podstawowego . . . .
2.3.2. Zmiana długości wektora przy jego przeniesieniu równoległym
2.3.3. Rozkład naturalny koneksji liniowej . . . . . . . . . . . . . . .
2.3.4. Równania pola elektromagnetycznego . . . . . . . . . . . . . .
2.3.5. Prawa zachowania . . . . . . . . . . . . . . . . . . . . . . . .
2.3.6. Dalsze wnioski z równań pola . . . . . . . . . . . . . . . . . .
2.3.7. Komentarz do równań pola . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
17
19
19
20
21
23
23
25
25
Rozdział 3. Ogólne własności czasoprzestrzeni niesymetrycznych . . . . . . . . . . . 27
3.1.
3.2.
Linie geodezyjne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.1. Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych 27
3.1.2. Cząstki i antycząstki . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.3. Oddziaływania elektromagnetyczne i słabe . . . . . . . . . . . . . . . 28
3.1.4. Oddziaływanie silne . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.1.5. Lokalna afiniczność względem koneksji będącej sumą Γikl i tensorów pozostałych oddziały
Równania falowe i funkcje falowe . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.1. Równania falowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.2. Rozwiązania równań falowych . . . . . . . . . . . . . . . . . . . . . . 33
3.2.3. Czasoprzestrzenie odwrotne . . . . . . . . . . . . . . . . . . . . . . . 36
Rozdział 4. Rozwiązania równań falowych . . . . . . . . . . . . . . . . . . . . . . . . 37
4.1.
Funkcje falowe typu elektronowego . . . . . . . . . . . . . . . . . . . . . . . 37
III
IV
4.2.
Spis treści
Funkcja falowa typu mionowego i taonowego . . . . . . . . . . . . . . . . . . 40
4.2.1. Funkcja falowa typu lastonowego . . . . . . . . . . . . . . . . . . . . 48
4.2.2. Lokalna i wzdłużna afiniczność . . . . . . . . . . . . . . . . . . . . . 50
Rozdział 5. Kwarki. Uwagi ogólne . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Dodatek A. Geneza pojęć przestrzeni i czasu . . . . . . . . . . . . . . . . . . . . . . 61
Dodatek B. Nieliniowa elektrodynamika Borna-Infelda . . . . . . . . . . . . . . . . . 67
Przedmowa
Prezentowana teoria jest pierwszą geometryczną unifikacją wszystkich czterech oddziaływań. Taką możliwość stwarza oparcie geometrycznej struktury czasoprzestrzeni na niesymetrycznym tensorze podstawowym gik oraz niesymetrycznej koneksji
liniowej Ikli . Tensor metryczny γik jest częścią symetryczną tensora podstawowego.
Część antysymetryczna tensora podstawowego spełnia uogólnione równania Maxwella, które są częścią równań pola tej teorii. Część antysymetryczna tensora podstawowego jest więc tensorem pola elektromagnetycznego. Niesymetryczność koneksji
prowadzi do istnienia torsji Ikli . Pozwala to, między innymi, określić pojęcie ładunku
e
słabego i elektrycznego.
W prezentowanej teorii nie przyjmuje się założenia o istnieniu oddziaływań, a ich
pojawienie oraz podział na cztery różne oddziaływania, ujawnia się w sposób naturalny jako wniosek z równań pola niesymetrycznej czasoprzestrzeni. Analiza ich
własności pozwala zidentyfikować te oddziaływania jako grawitacyjne, silne, elektromagnetyczne i słabe. Tak wyodrębnione oddziaływania wyrażane są za pomocą
czysto geometrycznych wielkości. Ten podział na cztery oddziaływania ujawnia się
we wzorze (wyprowadzonym w rozdziale 2.) na część symetryczną koneksji liniowej
w niesymetrycznej czasoprzestrzeni
1
1
s
s
+ gkl Iiss ) − (δti Iks
+ δtk Iiss ),
Iikt = Γtik + γtl (gis Ikls + gks Iils ) − γtl (gil Iks
3
3
ee
ee
ee
ee
e
e
gdzie wszystkie wskaźniki mogą przyjmować wartości 0, 1, 2, 3 oraz stosowana jest
umowa sumacyjna, oznaczająca sumowanie od zera do trzech w przypadku występowania jednakowego wskaźnika literowego dolnego (kowariantnego) i górnego (kontrawariantnego). Kreska pod wskaźnikami oznacza symetrię względem tych wskaźników, a znak „∼” pod wskaźnikami, antysymetrię względem tych wskaźników.
Wszystkie cztery oddziaływania są więc w tej teorii składnikami jednej wielkości geometrycznej. Jednym z tych składników jest pseudotensor Christoffela Γikl
określający oddziaływanie grawitacyjne. Pozostałe oddziaływania ukazują się jako
symetryczne tensory trzeciego rzędu, zbudowane z symetrycznej i antysymetrycznej
części tensora podstawowego oraz torsji.
Przedstawiona jest tu jawna, ścisła zależność wszystkich czterech oddziaływań
od wielkości określających strukturę geometryczną czasoprzestrzeni. Jest to również
teoria jednolita w tym znaczeniu, że opisuje jednakowo zarówno obiekty astronomiczne jak też cząstki elementarne, a nawet cząstki subelementarne, jakimi są kwarki.
Różne są tylko typy rozwiązań tych samych równań różniczkowych dla tych, tak bardzo różniących się od siebie obiektów. Jest więc to teoria bardziej ogólna niż teoria
wszystkiego w dotychczasowym znaczeniu tej nazwy. Terminem teoria wszystkiego
V
VI
Przedmowa
zwykło się określać takie teorie, których celem jest tylko geometryczna unifikacja
wszystkich oddziaływań, bez konsekwencji dla struktury materii. Ta teoria, po dopracowaniu kilku szczegółów, ma szansę stać się teorią dosłownie wszystkiego.
Jest też istotne, że wychodząc z bardzo ogólnych założeń, otrzymuje się wyrażenia określające wszystkie cztery znane oddziaływania. Gdyby istniały jeszcze
jakieś dodatkowe oddziaływania, to przy tak wyrafinowanej technice doświadczalnej
byłyby już od dawna znane. Nie ma więc obawy o powtórzenie się sytuacji, gdy wielu
fizyków, podejmując próbę geometrycznej unifikacji grawitacji i elektromagnetyzmu,
określali swoje teorie jako teorie wszystkiego, a później okazało się, że istnieją jeszcze
dwa nieznane im oddziaływania.
Konieczność rezygnacji z przestrzeni afinicznej jako modelu czasoprzestrzeni powoduje, że chcąc tworzyć teorię fizyczną, opisaną za pomocą równań różniczkowych,
musimy zapewnić różniczkowalność obiektów geometrycznych określających strukturę geometryczną czasoprzestrzeni. Do tego celu wystarczy, aby czasoprzestrzeń
była tylko lokalnie afiniczna. Jak następnie zobaczymy, oznacza to, że lokalnie powinna znikać tylko część symetryczna koneksji liniowej. W przedstawionym wyżej
wzorze tylko człon grawitacyjny jest koneksją właściwą. Pozostałe składniki są symetrycznymi tensorami trzeciego rzędu. Nie wnoszą one wkładu do nieaficzności
czasoprzestrzeni. Ale suma członu grawitacyjnego i dowolnego z tych składników
lub sumy tych składników jest również koneksją liniową. Można w ten sposób utworzyć osiem różnych rodzajów symetrycznych koneksji liniowych. Należy więc dopuścić osiem różnych warunków lokalnej afiniczności. Istnieje więc osiem rodzajów
czasoprzestrzeni o różnej strukturze geometrycznej, gdyż znikanie odpowiedniej koneksji wiąże się z lokalnym znikaniem odpowiednich oddziaływań. Wyjaśnia to dlaczego istnieją cząstki elementarne, w których pewne oddziaływania nie występują,
gdyż lokalnie znika grawitacja oraz oddziaływanie, lub oddziaływania, które razem
z członem grawitacyjnym tworzą odpowiednią koneksję. Grawitacja musi lokalnie
znikać w każdym przypadku. Przykładowo, tzw. leptony są pozbawione oddziaływań silnych. Dokładniej mówiąc, oddziaływanie silne oraz grawitacyjne jest w nich
tak bardzo osłabione, że obecnie dostępnymi metodami nie są wykrywalne. Widać,
że oddziaływanie grawitacyjne odgrywa szczególną rolę nie tylko w obiektach kosmologicznych, lecz również w strukturze geometrycznej cząstek elementarnych.
Warunek lokalnego znikania odpowiedniej koneksji prowadzi do równań różniczkowych, których całkowalność jest wystarczającym warunkiem lokalnej afiniczności
czasoprzestrzeni. Rozwiązaniami tych równań są transformacje do układu współrzędnych, w których lokalnie taka koneksja znika. Powszechnie znane jest tylko
jedno, chyba najmniej interesujące rozwiązanie tych równań. Jest to rozwiązanie,
które nie ma wpływu na strukturę geometryczną czasoprzestrzeni. Okazuje się,
że istnieje mnóstwo rozwiązań, które decydują o jej strukturze. Te nieznane rozwiązania stanowią transformacje osobliwe. Jacobian tych transformacji równa się
zeru. W rezultacie, czasoprzestrzeń, w której lokalnie znika część symetryczna koneksji, zachowuje tę własność, gdyż transformacja odwrotna nie istnieje. To dlatego,
między innymi, elektron zachowuje swoje własności. Istnienie dużej różnorodności
takich rozwiązań powoduje, że należy mówić nie o jednej totalnej czasoprzestrzeni, a o zbiorze czasoprzestrzeni z różnymi strukturami geometrycznymi. Modelem
geometrycznym Wszechświata jest wiec zbiór takich czasoprzestrzeni.
VII
Istnienie rozwiązań zależnych periodycznie od czasu wyczerpuje struktury
wszystkich znanych i jeszcze nieznanych cząstek elementarnych oraz subelementarnych, jakimi są kwarki. W tym przypadku, równania będące warunkiem lokalnej afiniczności są prawzorami równań falowych mechaniki kwantowej. Rozwiązania
nieperiodyczne w czasie określają struktury obiektów kosmologicznych, będących
tworami pierwotnymi. Materia złożona z cząstek elementarnych skupia się wokół
centrów tych obiektów i powoduje, że są one dostrzegalne. Znane są jednak obiekty
kosmologiczne pozbawione balastu normalnej materii. O takich obiektach mówi się,
że są ciemną materią.
W tej teorii pojawia się osiem różnych rodzajów koneksji liniowej, co prowadzi do ośmiu różnych układów równań będących warunkiem lokalnej afiniczności.
Jeśli uwzględnimy, że dla każdego z tych układów istnieją różne typy rozwiązań,
to dochodzimy do wniosku, że zabezpieczenie różniczkowalności czasoprzestrzeni,
przy wstępnie wprowadzonej maksymalnie bogatej strukturze geometrycznej, prowadzi do obserwowanej różnorodności obiektów materialnych. Dotyczy to zarówno
cząstek elementarnych, jak też tworów kosmologicznych takich jak planety, gwiazdy
i galaktyki.
Z powyższych uwag wynika, że ta teoria jest adresowana do specjalistów z zakresu
teorii czasoprzestrzeni oraz jej związku z teorią cząstek elementarnych i kosmologią.
Zdaję sobie sprawę z tego, że są to ludzie, którym często brakuje czasu nawet na własne opracowania. Trudno oczekiwać, aby bez specjalnej zachęty zechcieli śledzić
i sprawdzać poprawność moich, nieraz bardzo skomplikowanych rachunków. Dlatego
już w rozdziale wstępnym przedstawione są konsekwencje teorii oraz niektóre wyniki
tych rachunków. Są one wystarczająco interesujące, aby uznać, że warto aktywnie
włączyć się do rozwijania tej teorii. Mam podstawy sądzić, że przyniesie to więcej
satysfakcji niż tworzenie opracowań, opartych na znanych już koncepcjach i teoriach, takich jak ogólna teoria względności, mechanika kwantowa, kwantowa teoria
pola, model standardowy, teoria superstrun, teoria supersymetrii. Wszystkie te teorie wyjaśniają tylko określony obszar zjawisk, a niektóre z nich są nawet wzajemnie
sprzeczne.
Ta teoria obejmuje wszystkie zjawiska i dotyczy wszystkich podstawowych obiektów materialnych występujących lub mogących wystąpić w Naturze.
Zaproszenie do rozwijania tej teorii jest podyktowane również tym, że mam już
82 lata, więc nie mogę liczyć na to, że sam poradzę sobie z licznymi problemami,
jakie pozostały do rozwiązania.
Franciszek Łada
Kraków, październik 2013
Rozdział 1
Własności pola niesymetrycznego
1.1. Czasoprzestrzenie strukturalne spójne
Istnienie ciążenia powszechnego sprawia, że porządków otoczenia nie można modelować czasoprzestrzenią euklidesową, że zarówno na poziomie mikroświata, jak
też w skali astronomicznej, linie proste nie występują. Dlatego wektory jako zorientowane odcinki linii prostych lokalizowane są w fikcyjnej czasoprzestrzeni stycznej
Minkowskiego. Z tego też powodu z reguły układ współrzędnych będą stanowiły
cztery rodziny zorientowanych krzywych. Współrzędne x0 , x1 , x2 , x3 będą więc odcinkami łuków tych krzywych, licząc od ustalonego punktu jako początku układu
współrzędnych. Przyjmujemy x0 jako współrzędną czasową.
Zakładamy też, że modelem porządków Wszechświata jest czasoprzestrzeń strukturalnie niespójna, ale będąca zbiorem czasoprzestrzeni strukturalnie spójnych. Będziemy rozważać tylko elementy strukturalnie spójne tego zbioru. Dlatego wyrażenie
„strukturalnie spójna” będziemy pomijać.
Czasoprzestrzenią strukturalnie spójną nazywać będziemy czasoprzestrzeń,
w której funkcje określające jej strukturę geometryczną są zapisane w wybranym
układzie współrzędnych jednakowo w każdym jej punkcie. W takiej czasoprzestrzeni
można też (z założenia) określić globalny układ współrzędnych, stanowiący cztery
rodziny globalnie gładkich krzywych zorientowanych. Rozpatrywane czasoprzestrzenie są więc wyjątkowo prostymi rozmaitościami. Dlatego tylko w niewielkim stopniu
będziemy korzystać z dorobku geometrii różniczkowej, która musi sprostać potrzebom różnych zastosowań. Niektóre zastosowania wymagają rozpatrywania tak bardzo skomplikowanych rozmaitości, że pojęcie układu współrzędnych ma sens tylko
jako lokalna parametryzacja punktów. Jeśli też uwzględnimy teorio-mnogościową formalizację obecnej geometrii różniczkowej, to taka nauka staje się niezwykle skomplikowaną teorią, operującą bardzo bogatym asortymentem pojęć. Na przykład, wykaz
symboli geometrii różniczkowej J. Gancarzewicza liczy dwieście trzydzieści pozycji.
Dla naszych potrzeb wystarczą tylko dwa obiekty geometryczne, niesymetryczny
tensor podstawowy gik oraz niesymetryczna koneksja liniowa Iikl . Pojęciem wektora posługiwać się będziemy tylko jako zorientowanym odcinkiem prostej stycznym
do krzywej, zlokalizowanym w stycznej czasoprzestrzeni Minkowskiego i nie mającym
wpływu na strukturę geometryczną czasoprzestrzeni.
1.2. Podstawowe definicje i oznaczenia
Zakładamy, że w rozpatrywanej czasoprzestrzeni mamy wybrany krzywoliniowy
układ współrzędnych xi . Nie interesuje nas pochodzenie takiego sposobu parametry1
2
Rozdział 1. Własności pola niesymetrycznego
zowania punktów; gdyż nie ma potrzeby odnoszenia się do afinicznej czasoprzestrzeni
więcej niż czterowymiarowa, do której nasza rozmaitość różniczkowa mogłaby być
włożona. Taka afiniczna czasoprzestrzeń nie istnieje. Jest tylko wytworem ludzkiego
umysłu, a zwłaszcza umysłów matematyków, którzy to pojęcie uogólnili na wszelkie
możliwe sposoby.
Jeśli istnieją
funkcje x̄i = x̄i (x0 , x1 , x2 , x3), (i = 0, 1, 2, 3), takie że jakobian
cztery
i
∂x̄ transformacji k jest różny od zera, to te cztery funkcje możemy traktować jako
∂x
∂x̄i
inny układ współrzędnych. Możemy więc wyznaczyć dx̄i = k dxk , gdzie przyjmu∂x
jemy umowę sumacyjną oznaczającą sumowanie od 0 do 3 po powtarzających się
wskaźnikach k.
Pojęcie wektora kontrawariantnego określimy transformacyjnie jako czteroskładnikową wielkość V i , której składowe transformują się jak różniczki współrzędnych, czyli
∂x̄i
(1.1)
V̄ i = α V α .
∂x
Wprowadzamy też pojęcie wektora kowariantnego Vi , którego składowe transformu∂s
∂s ∂xα
ją się jak pochodna skalara i = α i , czyli
∂x ∂x̄
∂x̄
V̄i =
∂xα
Vα .
∂x̄i
(1.2)
We wzorach (1.1, 1.2) również obowiązuje umowa sumacyjna w przypadku występowania jednakowych literowych wskaźników górnych (kontrawariantnych) i dolnych
(kowariantnych), np.
3
X
i
Ai B ≡
Ai B i .
(1.3)
i=0
Ogólnie, tensorem p-krotnie kontrawariantnym i q-krotnie kowariantnym nazywać
będziemy wielkość transformującą się według wzoru
i ...i
T j11 ...jpq =
∂x̄ip ∂xl1
∂x̄i1
∂xlq k1 ...kp
.
.
.
.
.
.
.
T
∂xk1
∂x̄ jq l1 ...lq
∂xkp ∂x̄ j1
(1.4)
Zgodnie z tą regułą, wektor kontrawariantny jest tensorem 1-krotnie kontrawariantnym i 0-krotnie kowariantnym, a wektor kowariantny jest tensorem 0-krotnie kontrawariantnym i 1-krotnie kowariantnym, a skalar jest tensorem 0-krotnie kontrawariantnym i 0-krotnie kowariantnym.
Definicje wektorów kontrawariantnych i kowariantnych są takie, aby ich iloczyn
skalarny był niezmiennikiem, czyli Āi B̄i = Ai Bi . Taki iloczyn nazywa się iloczynem
skalarnym wektorów A i B.
Oprócz tradycyjnego zapisu pochodnych cząstkowych będzie też stosowany przecinek przed wskaźnikiem, np.
∂V i
(1.5)
V,ki ≡ k .
∂x
1.3. Tensor podstawowy i tensor metryczny
3
1.3. Tensor podstawowy i tensor metryczny
Za pomocą kowariantnej funkcji tensorowej drugiego rzędu gik możemy iloczyn skalarny wektorów A i B zapisać w postaci
Ai Bi = gik Ak Bi .
(1.6)
Tensor gik , określony w całej czasoprzestrzeni, nazywać będziemy kowariantnym
tensorem podstawowym. Zauważmy, że wzór (1.6) nie wymaga symetrii tensora gik ,
dlatego zakładamy, że jest on tensorem niesymetrycznym. Żądamy, aby był macierzą
nieosobliwą, czyli że wyznacznik g = det gik , 0. Istnieje więc macierz odwrotna gkr
taka, że
gik gkr = δri ,
(1.7)
gdzie δri jest tensorem Kroneckera. Wzór (1.6) jest przykładem zastosowania tensora gik do obniżania wskaźników, tzn. do transformacji wektorów kontrawariantnych
na kowariantne
Ai = gik Ak .
(1.8)
Istnienie macierzy odwrotnej pozwala na podwyższanie wskaźników, tzn. transformację wektorów kowariantnych na kontrawariantne
grk Ak = Ar .
(1.9)
Tensor podstawowy pozwala określić odległość między punktami (zdarzeniami)
w czasoprzestrzeni, gdyż na podstawie wzoru (1.6) dla infinitezymalnie bliskich
punktów, otrzymujemy
ds2 = gik dxi dxk = γik dxi dxk ,
(1.10)
gdzie
1
gik + gki
(1.11)
2
jest częścią symetryczną tensora podstawowego gik . Tensor γik nazywać będziemy
tensorem metrycznym, a skalar ds elementem odległości czasoprzestrzennej. W bliskim otoczeniu dowolnie wybranego punktu czasoprzestrzeni, możemy składowe tensora γik traktować jako stałe, a że γik jest macierzą symetryczną, to zawsze może być
zdiagonalizowana. Jest to równoważne sprowadzeniu formy (1.10) do postaci kanonicznej w bliskim otoczeniu dowolnego punktu. Aby zachować spójność logiczną tej
teorii ze Szczególną i Ogólną Teorią Względności, zakładamy że w każdym punkcie
postać kanoniczna wzoru (1.10) pokrywa się z odpowiednim wzorem w czasoprzestrzeni Minkowskiego. Inaczej mówiąc, można skonstruować czasoprzestrzeń Minkowskiego styczną w dowolnie wybranym punkcie rozpatrywanych czasoprzestrzennych modeli. Oznacza to, że zakładamy iż tensor γik ma sygnaturę (+, −, −, −).
Dodać jeszcze należy, że wzór (1.10) nie straci na ogólności, jeśli współrzędną
czasową określimy jako x0 = ct, gdzie c jest maksymalną prędkością, z jaką można
przesłać informację między punktami czasoprzestrzeni. Ze względu na powyższą sygnaturę, wyznacznik γ = det γik będzie ujemny w każdym punkcie. Bez szczegółowej
analizy nie możemy tego powiedzieć o wyznaczniku tensora podstawowego
g = det gik = det γik + ηik ,
(1.12)
γik =
4
gdzie
1
ηik = gik =
gik − gki
(1.13)
e 2
jest częścią antysymetryczną tensora podstawowego.
W celu przeprowadzenia analizy wyznacznika g, posłużymy się kombinatoryczną
definicją wyznacznika macierzy
g = det gik = εijkl gi0 g j1 gk2 gl3 = εijkl γi0 + ηi0 γ j1 + η j1 γk2 + ηk2 γl3 + ηl3 ,
(1.14)
iklm
gdzie ε
jest zupełnie antysymetrycznym tensorem Levi Civity. Przy wymnażaniu
wyrażeń w nawiasach należy uwzględnić, że
εiklm γi0 γ j1 γk2 γl3 = det γik = γ,
(1.15)
εijklm γi0 γ j1 γk2 ηl3 + γi0 γ j1 ηk2 γl3 + γi0 η j1 γk2 γl3 + ηi0 γ j1 γk2 γl3 = 0,
(1.16)
εijkl ηi0 η j1 ηk2 γl3 + ηi0 η j1 γk2 ηl3 + ηi0 γ j1 ηk2 ηl3 + γi0 η j1 ηk2 ηl3 = 0.
(1.17)
W ten sposób otrzymujemy
g = γik + F = γ + F
2
= γ + η01 η23 + η02 η31 + η03 η12
+ γ00 γ11 η23 η23 + γ00 γ22 η31 η31 + γ00 γ33 η12 η12 + γ11 γ22 η03 η03
+ γ11 γ33 η02 η02 + γ22 γ33 η01 η01
+ 2 γ00 γ12 η23 η31 + γ00 γ23 η12 η31 + γ00 γ31 η12 η23 + γ11 γ03 η02 η23 + γ22 γ01 η03 η31
+ γ33 γ02 η01 η12 + γ01 γ12 η03 η23 + γ01 γ23 η03 η12 + γ02 γ31 η01 η23 + γ02 γ23 η01 η31
− γ01 γ01 η23 η23 − γ02 γ02 η31 η31 − γ03 γ03 η12 η12 − γ12 γ12 η03 η03 − γ23 γ23 η01 η01
− γ31 γ31 η02 η02
− 2 γ01 γ02 η23 η31 + γ01 γ03 η12 η23 + γ01 γ23 η02 η31 + γ01 γ31 η02 η23 + γ02 γ03 η12 η31
+ γ11 γ23 η02 η03 + γ22 γ03 η01 η31 + γ22 γ31 η01 η03 + γ33 γ01 η02 η12 + γ33 γ12 η01 η02 .
(1.18)
1.4. Pole elektromagnetyczne
Dwukwadratowa forma F, składowych γik i ηik , może w pewnych punktach czasoprzestrzeni przyjmować dodatnią wartość, kompensującą ujemną wartość γ, co prowadziłoby do osobliwości tensora gik . Musimy zatem nałożyć na tę formę warunki, które
taką możliwość wykluczają. Wykluczenie takiej możliwości zabezpieczają warunki
sprowadzające nieosobliwość tensora gik do nieosobliwości tensora γik . Będzie tak,
gdy zażądamy, aby było g = γ. Warunki te muszą być niezmiennicze, obowiązujące
we wszystkich układach współrzędnych. Wynika stąd, że formę F musimy wyrazić
5
1.4. Pole elektromagnetyczne
za pomocą niezmienników. Można to uzyskać, gdy wyrazimy tensor ηik przez tensor ∗Fik dualny do pewnego antysymetrycznego tensora Fik . Dopasowanie wymiarów
wymaga też posłużenia się mianowanym współczynnikiem. Przyjmiemy, że
1∗
1 √
−γεiklm Flm .
Fik =
(1.19)
b
2b
Operator Hodge’a we wzorze (1.19) wyraża się więc zgodnie z definicją za pomocą
wyznacznika tensora metrycznego, a nie tensora gik .
Po tych uwagach możemy wrócić do wzoru (1.18). Zauważmy najpierw,
że wzór (1.19) daje nam następujące przyporządkowanie:
ηik =
1√
1√
1√
−γF23 ,
−γF31 ,
−γF12 ,
η02 =
η03 =
b
b
b
1√
1√
1√
−γF03 ,
−γF02 ,
−γF01 .
η12 =
η31 =
η23 =
(1.20)
b
b
b
Stosując to przyporządkowanie we wzorze (1.18) możemy ten wzór zapisać jako
2
γ2 1
γ
il km
ik lm
.
(1.21)
g = γ − γik γlm F F + 2 εiklm F F
2b
4b 2
Wyrażenie
S = γik γlm Fik Fkm
(1.22)
η01 =
jest skalarem, a wyrażenie
1
(1.23)
P = eiklm Fik Flm
2
jest pseudoskalarem zmieniającym znak przy transformacjach ze zmianą orientacji,
natomiast występujące w tym wzorze P2 jest pełnym skalarem. Widać, że sugestywne
określenie we wzorze (1.19) ηik przez Fik nie było przypadkowe, gdyż S oraz P2 są
znanymi niezmiennikami pola elektromagnetycznego, a tensor tego pola zwyczajowo
oznacza się przez Fik . Ubocznym efektem tej analizy jest więc natrafienie na pierwszy
ślad naturalnego pojawienia się pola elektromagnetycznego. Oczywiście, jest to tylko
pierwszy ślad, gdyż, aby tensor ηik = gik określał pole elektromagnetyczne, to mue Wyprzedzając fakty można potwierdzić,
si również spełniać równania Maxwella.
że równania Maxwella (uogólnione) okażą się wnioskami z równań pola czasoprzestrzeni niesymetrycznych oraz że spełnia je właśnie tensor gik . Naszym głównym
obecnie celem jest wykluczenie osobliwości tensora gik , gdyż ebez tego dalsze rozwijanie teorii nie miałoby sensu. Takie zabezpieczenie gwarantuje przyjęcie dwóch
warunków: S = 0 oraz P = 0. Każde nałożenie warunków prowadzi do uproszczenia
teorii. Jest to jednak dopuszczalne tylko wówczas, gdy teoria wymaga cechowania.
Na razie nie mamy do tego żadnych podstaw. Okazuje się jednak, że równania pola,
które wyprowadzimy w następnym rozdziale wymagają cechowania przez spełnienie
aż ośmiu dowolnych warunków. Dwa z nich będą wyżej wspomnianymi warunkami.
Zgodnie z wcześniej przyjętymi ustaleniami, w bliskim otoczeniu dowolnie wybranego punktu, możemy macierz gik sprowadzić do postaci


F01
F02 F03 
 1
 −F01 −1
F12 F13 
(1.24)
gik = 
.
 −F02 −F12 −1 F23 


−F03 −F13 −F23 −1
6
Dla uproszczenia przyjęto, że b = 1 oraz usunięto gwiazdkę operatora Hodge’a.
Wyznacznik tej macierzy równa się
g = −1 − (F21 )2 − (F32 )2 − (F13 )2 + (F01 )2 + (F02 )2 + (F03 )2 + (F01 F32 + F02 F13 + F03 F21 )2 .
(1.25)
Ten sam wynik otrzymamy ze wzoru (1.18) po zastosowaniu przyporządkowania (1.17) oraz założenia, że γik = µik , gdzie µik jest tensorem Minkowskiego. Stosując
odpowiednie przyporządkowanie, możemy wzór (1.25) wyrazić również za pomocą
trójwymiarowych wektorów pola elektrycznego E i magnetycznego H
(1.26)
g = −1 − H2 − E2 + (EH)2 .
Jak widać, wystarczy założyć wzajemną ortogonalność pola elektrycznego i magnetycznego oraz H2 = E2 , aby zapewnić nieosobliwość tensora gik w dowolnie wybranym
punkcie czasoprzestrzeni. Mamy wówczas g = γ = −1.
Z niesymetrii tensora gik wynika konieczność uwzględnienia istnienia czasoprzestrzeni, w których
g̃ik = gki .
(1.27)
Takie czasoprzestrzenie nazywać będziemy transponami. Macierzą odwrotną
do transponowanej jest transponowana macierz odwrotna, dlatego
gik gkr = gki grk = δri .
(1.28)
Należy zwracać uwagę na kolejność wskaźników, gdyż na ogół
gik grk = gki gkr , δri .
(1.29)
1.5. Koneksja
W rozpatrywanych czasoprzestrzeniach dopuszczamy dowolne nieosobliwe, nieliniowe transformacje układu współrzędnych. Z tego powodu różniczka wektora dV i
nie jest wektorem, gdyż jest różnicą wektorów w dwóch różnych punktach. W różnych punktach składowe wektora (i innych wielkości tensorowych) różnie się transformują, gdyż we wzorach (1.1) i (1.2) współczynniki są funkcjami współrzędnych.
Odejmowanie wektorów w bliskich punktach umożliwia wyposażenie czasoprzestrzeni w pole koneksji liniowej Ikli , zwanej również obiektem przeniesienia równoległego.
Wzór
δV i = −Ikli V k dxl
(1.30)
pozwala określić wektor V i w infinitezymalnie bliskim punkcie jako V i +δV i . Możemy
w ten sposób odejmować od siebie wektory w infinitezymalnie bliskich punktach.
Taka różnica (różniczka)
DV i = V i + dV i − V i + δV i = dV i + Ikli V k dxl
(1.31)
jest więc wektorem. Zauważmy, że podobnie jak wzór (1.6) nie wymaga symetrii
tensora gik , to we wzorze (1.30) nie jest wymagana symetria koneksji względem
7
1.6. Zwężony tensor krzywizny
wskaźników k, l. Taką niesymetryczną koneksję oznaczamy symbolem Ikli , gdyż powszechnie używany symbol Γikl rezerwujemy dla symboli Chistoffela
Γikl
!
1 is ∂γsk ∂γsl ∂γkl
.
+ k −
= γ
2
∂xs
∂xl
∂x
(1.32)
Wzór (1.30) pozwala obliczyć zmianę wektora V i przy przeniesieniu równoległym
wzdłuż nieskończenie małego konturu zamkniętego, czyli
I
i
∆V = − Ikli V k dxl .
(1.33)
Po prostych obliczeniach znajdujemy
1
∆V i = − Riklm V k ∆Slm ,
2
(1.34)
gdzie ∆Slm jest polem powierzchni rozpostartej na tym konturze, a wielkość
i
i
i s
s
Riklm = Ikl,m
− Ikm,l
+ Ism
Ikl − Isli Ikm
(1.35)
nazywa się tensorem krzywizny.
1.6. Zwężony tensor krzywizny
Z tensora Riklm określonego wzorem (1.35) możemy utworzyć jego postać zwężoną Rik
za pomocą operacji zwężenia polegającej na zsumowaniu składowych z tymi samymi wskaźnikami, górnym i dolnym. Jest to równoważne zmianie wskaźnika m na i
z zastosowaniem konwencji sumacyjnej. W ten sposób otrzymujemy
s
s
Rik = Iik,s
− Iis,k
+ Iikl Ilss − Iisl Ilks .
(1.36)
Zwężenie tensora Riklm względem wskaźników i, l daje ten sam wynik, tylko z przeciwnym znakiem. Ale zwężenie względem i, k daje antysymetryczny tensor w postaci
s
s
Pik = Isi,k
− Isk,i
.
(1.37)
Z tensorów gik oraz Rik możemy utworzyć skalary
R = gki Rik
lub
R̃ = gik Rik .
(1.38)
1.7. λ-niezmienniczość
Wzory (1.35), (1.36), (1.37) posiadają własność nazwaną przez Einsteina
λ-niezmienniczością. Gdy zastąpimy w nich Ikli przez
Ĩkli = Ikli + δik λ,l
(1.39)
8
gdzie λ jest dowolną funkcją skalarną, to człony z λ redukują się i wzory nie ulegają zmianie. Jest to zrozumiałe, gdyż, jeśli to samo zrobimy we wzorze (1.33),
to otrzymamy
I
I
i
i
k
l
˜ = − I V dx −
∆V
V k δik λ,l dxl .
(1.40)
kl
Druga z tych całek równa się zeru, mianowicie
I
I
I
k i
l
i
i
V δk λ,ldx =
V dλ = V
dλ = 0
(1.41)
Wektor V i można było wyciągnąć przed znak całki, gdyż jednoznacznie określony
wektor nie zależy od dowolnej funkcji λ. Całka okrężna z różniczki zupełnej w ob˜ i = ∆V i .
szarze jednospójnym równa się zeru, więc mamy ∆V
Już w następnym rozdziale tensor Rik będzie podstawą do wyprowadzenia równań
pola. Wyprowadzone równania będą więc również λ-niezmiennicze. Mogłoby się wydawać, że taka niejednoznaczność jest wadą teorii, bo wymaga cechowania, które ma
znamiona dowolności. Do tej dowolności dodamy też dowolność układu współrzędnych, gdyż zasada wariacyjna prowadząca do równań pola, musi wykluczyć wariacje
będące transformacją układu współrzędnych niemające wpływu na strukturę geometryczną czasoprzestrzeni. Pozwala to na nakładanie czterech warunków na funkcje
pola. Jeśli dodamy do tego cztery warunki na składowe gradientu funkcji λ, to razem
możemy nakładać osiem dowolnych warunków na te funkcje. Wydaje się, że najbardziej korzystnymi warunkami, znacznie uproszczającymi teorię, są
γik =
1
gik + gki = 0
2
dla i , k,
(1.42)
S = γik γlm Fil Fkm = 0,
(1.43)
1
P = eiklm Fik Flm = 0.
(1.44)
2
Dwa ostatnie warunki zabezpieczają nieosobliwość tensora podstawowego gik . Otrzymujemy w ten sposób
g = det gik = det γik = γ , 0.
(1.45)
Ten wzór pozwala na posługiwanie się wyznacznikiem γ, zamiennie z wyznacznikiem g, w operatorze Hodge’a zastosowanym we wzorze (1.19). Warunek (1.42)
nie jest niezmienniczy, ale ma bardzo ważne znaczenie, gdyż pozwala znacznie uprościć i tak już bardzo skomplikowane rachunki. Mimo tego uproszczenia, nie będziemy
z niego korzystać przy wyprowadzaniu ogólnych wzorów i równań.
Koneksja Ikli transformuje się według wzoru
ν
Īαβ
= Ikli
∂2 xi ∂x̄ν
∂x̄ν ∂xk ∂xl
+
.
∂xi ∂x̄α ∂x̄β ∂x̄α ∂x̄β ∂xi
(1.46)
To prawo transformacyjne otrzymuje się w przestrzeni afinicznej i uogólnia się na dowolną przestrzeń z koneksją. Koneksja (1.32) również transformuje się w ten sposób.
Ze względu na niesymetrię koneksji Ikli , wskazane jest rozróżnianie jej części symetrycznej
1 i
(1.47)
Ikl + Ilki ,
Ikli =
2
9
1.8. Pochodna kowariantna
która również transformuje się według wzoru (1.46) oraz części antysymetrycznej
1 i
Ikli =
Ikl − Ilki
(1.48)
e 2
transformującej się jak tensor 1-krotnie kontrawariantny i 2-krotnie kowariantny
ν
(1.49)
Īαβ
= Ikli i α β .
∂x ∂x̄ ∂x̄
e
e
Wielkości transformujące się według wzoru (1.46) są pseudotensorami transformującymi się jak tensory tylko przy liniowych transformacja współrzędnych. Kreska pod
wskaźnikami we wzorze (1.47) oznacza symetrię względem tych wskaźników. Znakiem „∼” pod wskaźnikami oznaczyliśmy antysymetrię względem tych wskaźników.
Dla tensora Ikli używać też będziemy rozpowszechnionej nazwy torsja.
e
1.8. Pochodna kowariantna
W oparciu o wektorową różniczkę (1.31) można utworzyć kowariantną (w sensie
współzmienniczości) pochodną wektora kontrawariantnego:
V i: l
∂V i
=
+ Ikli V k .
l
∂x
(1.50)
Dla odróżnienia od pochodnej kowariantnej w czasoprzestrzeniach z koneksją Γikl
oznaczamy ją dwukropkiem, a nie średnikiem. Można łatwo przekonać się, że pochodna kowariantna określona wzorem (1.50) jest tensorem. Pochodne kowariantne tensorów wyższych rzędów można znaleźć zakładając, że są one takie same jak
dla tensorów stanowiących iloczyny proste wektorów oraz że pochodna kowariantna
spełnia wzór Leibniza. W ten sposób dla pochodnej kowariantnej kontrawariantnego
tensora podstawowego gik otrzymujemy:
gik: l =
∂gi k
+ g jk Iijl + gij Ikjl .
∂xl
(1.51)
Wymnożenie tego wzoru przez gsi gkt i skorzystanie z (1.28) daje
− gkt gik gsi: l = −gkt gik
∂gsi
+ gsi Itli + gkt Islk ,
∂xl
(1.52)
czyli
∂gst
(1.53)
+ gsi Itli + gkt Islk .
∂xl
Po odpowiedniej zamianie wskaźników otrzymujemy wzór na kowariantną pochodną
kowariantnego tensora podstawowego gik w postaci
− gst : l = −
gik : l =
∂gik
j
j
− gij Ikl − g jk Iil .
l
∂x
(1.54)
10
Teraz możemy znaleźć wzór na pochodną kowariantną wektora kowariantnego
Vi: l = gik V k = gik : l V k + gik V k: l .
(1.55)
:l
Korzystając ze wzorów (1.54) i (1.50) znajdujemy
Vi: l =
∂Vi
j
− Iil V j .
l
∂x
(1.56)
Wnioskujemy stąd, że zmiana wektora kowariantnego przy przeniesieniu równoległym równa się
j
δVi = Iik V j dxk .
(1.57)
1.9. Lokalna i wzdłużna afiniczność
Do pojęcia koneksji dochodzi się w przestrzeniach afinicznych, przy transformacjach
do krzywoliniowych układów współrzędnych. W przestrzeniach afinicznych można
więc za pomocą transformacji do pierwotnych współrzędnych kartezjańskich uczynić ją równą zeru w całej przestrzeni. W rozpatrywanych w tej teorii modelach
czasoprzestrzennych jest to z założenia niemożliwe.
Rozkładając koneksję we wzorze transformacyjnym (1.46) na część symetryczną
i antysymetryczną, otrzymujemy
ν
k
l
∂2 xi ∂x̄ν
∂xk ∂xl
i ∂x̄ ∂x ∂x
+
+ Ikl i α β .
∂x ∂x̄α ∂x̄β ∂x̄α ∂x̄β ∂xi
e ∂x ∂x̄ ∂x̄
ν
i ∂x̄
Ikl i
(1.58)
=
e
Z porównania części symetrycznych i antysymetrycznych po obu stronach tej równości wynika, że wzór (1.46) jest w istocie sumą dwóch wzorów. Jednym z nich jest
wzór (1.49), a drugi ma postać
ν
Īαβ
+
ν
Īαβ
ν
Īαβ
= Ikli
∂2 xi ∂x̄ν
+
.
Ten wzór możemy w prosty sposób przekształcić do postaci
!
ν
∂2 x̄ν ∂xk ∂xl
ν
i ∂x̄
Īαβ = Ikl i − k l
.
∂x
∂x ∂x ∂x̄α ∂x̄β
(1.59)
(1.60)
Najcenniejszym osiągnięciem Ogólnej Teorii Względności jest myśl, że scenerią
zjawisk Natury nie jest czasoprzestrzeń afiniczna. Jednocześnie metody rachunkowe
teorii pola wymagają posługiwania się rachunkiem różniczkowym. W przestrzeniach
afinicznych można zawsze przejść do kartezjańskiego układu współrzędnych, w którym koneksja znika, co umożliwia odejmowanie wektorów zaczepionych w różnych
punktach, a tym samym tworzenie różniczek wektorów i innych wielkości tensorowych. Aby w czasoprzestrzeniach nieafinicznych również można było tworzyć różniczki wektorów, to wystarczy, by czasoprzestrzeń miała te same własności jak czasoprzestrzeń afiniczna, tylko lokalnie. Oznacza to, że musi istnieć taki układ współrzędnych, aby w dowolnie wybranym, ale ustalonym, punkcie P różniczka wektora
1.10. Zmiana długości wektora przy przeniesieniu równoległym
11
transformowała się jak wektor. Inaczej mówiąc, musimy z własności czasoprzestrzeni afinicznej zachować tylko to, co pozwala operować rachunkiem różniczkowym.
Ale ze wzoru (1.60) wynika, że od koneksji Iikl nie musimy wymagać, aby lokalnie miała własności takie, jak koneksja w czasoprzestrzeni afinicznej. Wystarczy,
aby te własności miała tylko część symetryczna tej koneksji. Inaczej mówiąc, wystarczy, aby istniał taki układ współrzędnych x̄ν , w którym znika część symetryczna
koneksji w dowolnie wybranym, ale ustalonym punkcie P. Ze wzoru (1.60) wynika,
że wystarczającym warunkiem lokalnej afiniczności czasoprzestrzeni jest całkowalność równania
∂2 x̄ν
∂x̄ν i
I (P) = 0.
(1.61)
−
∂xk ∂xl ∂xi kl
Każde rozwiązanie równań (1.61) wyznacza układ współrzędnych związany
z punktem P, w którym znika część symetryczna koneksji. Znana jest i przytaczana
w podręcznikach transformacja
1
x̄ν = xν − xνP + Iklν (P) xk − xkP xl − xlP ,
2
(1.62)
jako rozwiązanie równań (1.61). Istnienie tej transformacji jest tylko dowodem na to,
że lokalną afiniczność można zrealizować, ale nie ma ona wpływu na własności strukturalne czasoprzestrzeni. Widać to stąd, że jakobian tej transformacji jest różny
od zera. Można więc zawsze za pomocą transformacji odwrotnej wrócić do pierwotnego stanu. W rozdziale trzecim znajdziemy transformacje realizujące lokalną
afiniczność będące rozwiązaniami równań (1.61) z jakobianem równym zeru. Konsekwencje takich transformacji są nieodwracalne. Jeśli, na przykład, realizacja lokalnej
afiniczności prowadzi do własności, jakie ma elektron, to nie można tych własności
zlikwidować za pomocą odwrotnej transformacji, bo taka nie istnieje.
Za pomocą nieosobliwej transformacji układu współrzędnych można też spowodować znikanie części symetrycznej koneksji wzdłuż krzywej. Dla odróżnienia od lokalnej afiniczności, będziemy realizację tej afiniczności nazywać wzdłużną afinicznością.
Realizacja lokalnej afiniczności wzdłuż dowolnej krzywej jest jednak mało interesująca z punktu widzenia struktury czasoprzestrzeni. Jest to ważne tylko dlatego, że tym samym dotyczy również linii geodezyjnych. Gotowymi równaniami linii
geodezyjnych w czasoprzestrzeniach niesymetrycznych nie dysponujemy, bowiem takiego problemu jeszcze nikt nie rozwiązał. Musimy więc wyprowadzić te równania
w oparciu o ogólną definicję linii geodezyjnej. Najpierw jednak musimy wyprowadzić
wzór na zmianę długości wektora przy przeniesieniu równoległym w czasoprzestrzeniach niesymetrycznych.
1.10. Zmiana długości wektora przy przeniesieniu równoległym
Korzystając ze wzoru (1.30) możemy znaleźć zmianę iloczynu skalarnego wektorów
przy przeniesieniu równoległym
(1.63)
δ gik Ai Bk = gik (2) Ai + δAi Bk + δBk − gik (1)Ai Bk ,
12
gdzie gik (2) oraz gik (1) są wartościami gik odpowiednio w drugim i w pierwszym
punkcie. Z dokładnością do małych pierwszego rzędu, mamy
∂gik
Ai Bk dxl − gik Ai Islk Bs dxl − gik Bk Isli As dxl .
δ gik Ai Bk =
l
∂x
Zamieniając odpowiednio wskaźniki, możemy ten wzór zapisać w postaci
!
∂gik
s
s
i k
− gis Ikl − gsk Iil Ai Bk dxl = gik : l Ai Bk dxl .
δ gik A B =
l
∂x
(1.64)
(1.65)
Teraz możemy określić zmianę długości wektora przy jego przeniesieniu równoległym. Na podstawie wzoru (1.65), otrzymujemy
(1.66)
δ A2 = 2AδA = δ gik Ai Ak = gik : l Ai Ak dxl = γik : l Ai Ak dxl ,
więc
δA =
1
γik : l Ai Ak dxl .
2A
(1.67)
1.11. Równania linii geodezyjnych w czasoprzestrzeniach
niesymetrycznych
Linią geodezyjną nazywa się krzywą posiadającą taką własność, że wektor
Ui =
dxi
dσ
(1.68)
(gdzie: xi — współrzędne punktu krzywej; σ — parametr zmieniający się wzdłuż
tej krzywej), styczny do niej w punkcie M, przeniesiony równolegle do bliskiego
punktu N na tej krzywej, ma ten sam kierunek co wektor styczny do niej w punki
cie N. Oznacza to, że różnica tych wektorów również ma ten kierunek, czyli UU ,
a różnica długości równa się zmianie δU długości wektora przy przeniesieniu równoległym. Zmiana ta może być dodatnia lub ujemna, w zależności od skrętności
krzywej. Zgodnie z tą definicją mamy
Ui
i
i
i
i
U + dU − U + δU = dU − δU = ± δU.
U
i
i
(1.69)
Na podstawie wzoru (1.67) zmianę długości wektora stycznego do krzywej przy jego
przeniesieniu równoległym określamy jako
δU =
1
1
γik : l Ui Uk dxl =
γik : l Ui Uk Ul dσ.
2U
2U
(1.70)
Podstawiając do równania (1.69) wzory (1.68) i (1.70) oraz
δUi = −Ikli Uk
dxk dxl
dxl
dλ = −Ikli
dσ,
dσ
dσ dσ
(1.71)
1.11. Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych
13
po podzieleniu przez dσ, otrzymujemy
k
l
dxi
d2 xi
i dx dx
+
I
=
±ρ
,
kl
dσ2
dσ dσ
dσ
(1.72)
gdzie
1
dxk dxl dxm
γ
.
(1.73)
kl: m
2U2
dσ dσ dσ
Po lewej stronie równań (1.72) występuje tylko część symetryczna koneksji, gdyż jest
dxk dxl
.
ona symetryzowana przez iloczyn
dλ dλ
Wybierając parametr τ = τ(σ) spełniający równanie
ρ(σ) =
d2 τ
dτ
= ±ρ(σ) ,
2
dλ
dσ
(1.74)
można równania (1.72) sprowadzić do postaci
k
l
d2 xi
i dx dx
+
I
= 0.
kl
dτ2
dτ dτ
(1.75)
Taki parametr nazywa się parametrem afinicznym. Równania (1.72) pokazują,
że konsekwentne, zgodne z definicją, wyprowadzenie równań linii geodezyjnych prowadzi do wniosku, że istnieją dwa podstawowe ich rodzaje. Będziemy je nazywać lewoskrętnymi i prawoskrętnymi. Na lewoskrętnych geodezyjnych wektor styczny przy
przeniesieniu równoległym ulega wydłużeniu (znak „+” po prawej stronie równań).
Na prawoskrętnych geodezyjnych wektor styczny przy przeniesieniu równoległym
ulega skróceniu (znak „-” po prawej stronie równań). Jest to niezwykle ważna różnica
między tu wyprowadzonymi równaniami linii geodezyjnych i spotykanymi w podręcznikach. Wkrótce przekonamy się, że w tym szczególe tkwi zagadkowa własność
oddziaływań słabych, które występują w lewoskrętnych cząstkach elementarnych,
a w prawoskrętnych nie występują.
Wymóg lokalnej afiniczności jest prawem geometrycznym czasoprzestrzeni i spełniać go muszą wszystkie czasoprzestrzenne modele obiektów obserwowalnych. Istnieją przypadki, gdy warunek wzdłużnej afiniczności nie może być spełniony, a jego
realizacja wymaga specjalnych zabiegów. Można się domyśleć, że te przypadki dotyczą czasoprzestrzennych modeli kwarków, gdy kombinacja odpowiednich dwóch
lub trzech takich subelementarnych cząstek umożliwia realizację wzdłużnej afiniczności.
Rozdział 2
Równania pola niesymetrycznych czasoprzestrzeni
2.1. Zasada wariacyjna
Z dotychczasowych rozważań wynika, że strukturę geometryczną czasoprzestrzeni
określają tylko dwa obiekty geometryczne: niesymetryczny tensor podstawowy gik
oraz niesymetryczna koneksja liniowa Iikl . Własności metryczne czasoprzestrzeni wynikają z tensora podstawowego gik , gdyż tensor metryczny γik jest jego częścią symetryczną. Odrzucamy możliwość nieistnienia związków między Iikl i gik jako całkowicie
nieciekawą. Takie funkcyjne związki nazywa się równaniami pola. Najogólniej zapiszemy to jako
j = 1, 2, . . . , 80 .
(2.1)
F j gik , Iikl = 0,
Ilość tych związków określa warunek rozwiązywalności względem poszczególnych
składowych wielkości gik oraz Iikl , a jest ich łącznie osiemdziesiąt. Możemy zawsze zażądać, aby funkcje F j były formalnymi pochodnymi pewnej wielkości skalarnej Λ(gik , Iikl ) względem tych funkcji. Równania (2.1) mogą więc być zapisane
w postaci
∂Λ
∂Λ
= 0.
(2.2)
= 0,
∂gik
∂Iikl
Ale z tego wynika, że Λ nie może być funkcją skalarną, gdyż równania (2.2) oznaczałyby wówczas, że ta funkcja od tych wielkości nie zależy. Wielkość Λ jest więc
funkcjonałem skalarnym, którego wartość zależy od wyboru na gik oraz Iikl odpowiednich funkcji ze zbioru funkcji konkurencyjnych. Równania (2.2) muszą zachodzić
∂Λ
∂Λ
tylko w przypadku, gdy
i l są współczynnikami przy pewnych, dowolnych
∂gik ∂Iik
wielkościach, odpowiednio δgik oraz δIikl zwanych wariancjami, w równaniu
δΛ =
∂Λ
∂Λ
δgik + i δIikl = 0.
∂gik
∂Ikl
(2.3)
W ten sposób doszliśmy do warunku na ekstremum tego funkcjonału. Funkcjonał Λ
przyjmuje wartości ekstremalne dla ściśle określonych funkcji gik oraz Iikl . Funkcjonał o takich własnościach możemy skonstruować dla nieskończonej, strukturalnie
spójnej czasoprzestrzeni, wyodrębnionej z całego Wszechświata jako zbioru takich
strukturalnie spójnych czasoprzestrzeni. W tym miejscu zwróćmy uwagę na fakt,
że od rozpatrywanych tu czasoprzestrzeni nie wymagaliśmy jeszcze, aby były one
15
16
Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni
lokalnie afiniczne, a to jest warunkiem istnienia tych czasoprzestrzeni. Aby tak było,
to muszą one spełniać warunek (1.47).
√
W poprzednim rozdziale stwierdziliśmy, że wyrażenie −gdΩ, gdzie dΩ jest
elementemR czteroobjętości, jest skalarem. Skalarem jest również całka z gęstości
√
skalarnej S −gdΩ. Z tensora gik oraz koneksji Iikl można utworzyć kilka różnych niezmienników, ale tylko jeden taki, który zależy od wszystkich funkcji gik
oraz wszystkich funkcji Iikl :
Z
Z
√
√
(2.4)
ℜ̃ = ℜ̃ −gdΩ = gik Rik −gdΩ
(posłużenie się skalarem R prowadzi do tych samych wyników).
W tym wyrażeniu również stosujemy konwencję sumacyjną. Całkowanie po współrzędnych przestrzennych powinno obejmować całą trójwymiarową przestrzeń,
gdyż nie ma podstaw do z góry danych, sensownych ograniczeń. Natomiast całkowanie po współrzędnej czasowej musi mieć ograniczenie, bo nieograniczone całkowanie
po czasie nie ma sensu. Oznacza to, że całkowaniem obejmujemy całą trójwymiarową przestrzeń ograniczoną hiperpowierzchniami x01 = ct1 oraz x02 = ct2 . Zakładamy,
że na tych hiperpowierzchniach wariacje równają się zeru, czyli
δgik (t1 ) = δgik (t2 ) = δIikl (t1 ) = δIikl (t2 ) = 0.
(2.5)
Wariacje δgik oraz δIikl powstają również w wyniku nieosobliwych transformacji
współrzędnych, które z założenia nie zmieniają struktury geometrycznej czasoprzestrzeni. Takie nieistotne wariacje możemy wykluczyć przez nałożenie na funkcje
pola czterech dowolnych warunków. Zauważmy, że każda nieosobliwa transformacja
układu współrzędnych jest tego typu, gdyż zawsze możemy zastosować transformację odwrotną kasującą tak powstałe wariacje. Wariacje pochodzące z transformacji układu współrzędnych, których nie możemy wykluczyć, pochodzą więc tylko
od transformacji osobliwych. Istnieją rozwiązania równań falowych będące osobliwymi transformacjami układu współrzędnych. Transformacje osobliwe z natury rzeczy
prowadzą do trwałych zmian struktury geometrycznej, gdyż transformacje do nich
odwrotne nie istnieją. Takie transformacje są zespolonymi funkcjami czasu. Ściśle
trwałe transformacje są wtedy, gdy jest to czysto urojona zależność. Gdy występuje
również część rzeczywista, to takie transformacje są względnie trwałe, gdyż takie
czasoprzestrzenie mają określony średni czas życia, więc ulegają rozpadowi i dalszym tego rodzaju transformacjom. Łatwo się domyśleć, że takie czasoprzestrzenie
określają strukturę geometryczną cząstek elementarnych. Osobliwe transformacje
układu współrzędnych, prowadzące do lokalnej afiniczności czasoprzestrzeni, nazywać będziemy kreacjami.
Równanie (2.3) jest warunkiem na ekstremum funkcjonału (2.4) i to wystarcza
do wyprowadzenia równań pola czasoprzestrzeni niesymetrycznych. W ten sposób
możemy sformułować zasadę wariacyjną dla tych czasoprzestrzeni jako:
Z
√
δℜ̃ = δ gik Rik −gdΩ = 0
(2.6)
z warunkami (2.5) na hiperpowierzchniach ograniczających.
17
2.2. Wyprowadzenie równań pola czasoprzestrzeni
2.2. Wyprowadzenie równań pola czasoprzestrzeni
Z równania (2.6) otrzymujemy
Z h
i
√
√
√
Rik −gδgik + gik Rik δ −g + −ggik δRik dΩ = 0.
(2.7)
√
Aby obliczyć δ −g zauważmy, że zgodnie z zasadą rozwijania wyznacznika mamy
∂g
= ∆ki ,
∂gki
(2.8)
gdzie ∆ki jest minorem elementu gki macierzy gki , a zgodnie z zasadą tworzenia
macierzy odwrotnej oraz składowej gik , wzór (2.8) można zapisać w postaci
∂g
= ggik ,
∂gki
(2.9)
dg = ggik dgki = −ggki dgik .
(2.10)
√
1√
1
−ggki δgik .
δ −g = − √ δg = −
2
2 −g
(2.11)
więc
Na podstawie tego wzoru otrzymujemy
Aby ułatwić zapis dalszych operacji wprowadźmy chwilowo oznaczenie
p=
√
−g.
Równanie (2.7) możemy więc zapisać jako
Z
Z 1
Rik − gki R̃ pδgik dΩ + gik pδRik dΩ = 0.
2
(2.12)
(2.13)
Korzystając ze wzoru (1.67), przekształćmy teraz drugą całkę:
Z
Z
h i
ik
g pδRik dΩ = pgik δIiks ,s − δIiss ,k +Itss δIikt + Iikt δItss − Itks δIist − Iist δItks dΩ.
(2.14)
Skorzystaliśmy tu z przemienności wariacji i różniczkowania. Zajmijmy się najpierw
całką z dwóch pierwszych wyrazów w nawiasie kwadratowym. Otrzymujemy
Z
i
h pgik δIiks ,s − δIiss ,k dΩ
Z Z Z Z =
pgik δIiks ,s dΩ −
pgik δIiss ,k dΩ +
pgik ,k δIiss dΩ −
pgik ,s δIiks dΩ.
(2.15)
18
Pierwsze dwie całki możemy zamienić na całki powierzchniowe po hiperpowierzchniach ograniczających całą trójwymiarową przestrzeń. Wariacje δgik oraz δIkli zgodnie z warunkami (2.5) znikają na tych hiperpowierzchniach. Tak więc, te dwie całki
równają się zeru. Otrzymujemy zatem
Z h
Z
i
i
h s
s
ik
(2.16)
pgik ,k δIiss − pgik ,s δIiks dΩ.
pg δIik ,s − δIis ,k dΩ =
Podstawienie tego wyniku do (2.14) daje
Z
gik pδRik dΩ =
Z h
i
pgik ,k δIiss − pgik ,s δIiks + pgik Itss δIikt + Iikt δItss − Itks δIist − Iist δItks dΩ =
=
Z h
i
=
pgik ,k δIiss − pgik ,s δIiks + p gik Itss δIikt + gik Iikt δItss − gik Itks δIist − gik Iist δItks dΩ.
(2.17)
Teraz należy tak pozmieniać wskaźniki, uzupełniając w koniecznym przypadku tensorem Kroneckera, aby pod znakiem wariacji wszędzie było Iiks . Wyciągając następnie δIiks przed nawias otrzymujemy
Z
gik pδRik dΩ =
Z h
i
(2.18)
pgik ,t δks − pgik ,s +p gik Istt + glt Ilti δks − git Istk − gtk Itsi δIiks dΩ.
=
Podstawienie tego wzoru do równania (2.13) daje
Z 1
Rik − gki R̃ p δgik +
2
o
i
h ik t
lt i k
k
ik
it
+ pg ,t δs − pg ,s +p g Ist + g Ilt δs − git Istk − gtk Itsi δIiks dΩ = 0.
(2.19)
Aby to równanie zachodziło dla dowolnych wariacji δgik oraz δIiks , to współczynniki
przy nich muszą równać się zeru. Tak dochodzimy do szesnastu równań
1
Rik − gki R̃ = 0,
2
(2.20)
które można natychmiast uprościć, gdyż mnożąc je przez gik mamy
1
1
gik Rik − gki gik R̃ = R̃ − δkk R̃ = −R̃ = 0.
2
2
W ten sposób pierwszy układ równań pola ma postać
Rik = Iiks ,s −Iiss ,k +Iikt Itss − Iist Itks = 0.
(2.21)
(2.22)
Z przyrównania do zera współczynników przy δIiks otrzymujemy drugi układ równań
pola:
√
√
√ −ggit ,t δks − −ggik ,s + −g gik Istt + glt Ilti δks − git Istk − gtk Itsi = 0.
(2.23)
Skorzystaliśmy tu z oznaczenia (2.12).
2.3. Wnioski z równań pola czasoprzestrzeni
19
2.3.1. Wzór na pochodną kowariantną tensora podstawowego
Drugi układ równań pola (2.20) nie ma zbyt przejrzystej postaci i wymaga odpo√
wiedniej obróbki. Najpierw podzielimy to równanie przez −g:
1 √
1 √
−ggit ,t δks − √
−ggik ,s +gik Istt + glt Ilti δks − git Istk − gtk Itsi = 0.
√
−g
−g
(2.24)
Dodajmy teraz do siebie cztery równania o jednakowych wskaźnikach k, s. Jest to
równoważne operacji zwężenia względem tych wskaźników. Otrzymujemy interesujący wynik, przypominający podobny z Ogólnej Teorii Względności:
1 √
2
(2.25)
−ggik ,k = −gtk Itki + gik Itkt .
√
3 e
−g
Dla gik = γik oraz Itki = Γitk wręcz się z tym wzorem pokrywa. Wstawienie tego wzoru
do (2.23) daje
2
1 √
− √
−ggik ,s + git Iltl δks + gik Istt − git Istk − gtk Itsi = 0.
3 e
−g
Wykonując różniczkowanie wyrażenia w nawiasie, mamy
1 √ ik 2 it l k
− gik,s − √
−g ,s g + g Ilt δs + gik Istt − git Istk − gtk Itsi = 0.
3 e
−g
(2.26)
(2.27)
Wymnożenie tego równania przez tensor gki daje
czyli
1 √ 2
− gki gik,s − 4 √
−g ,s + Ilsl + 4Istt − Istt − Itst = 0,
3e
−g
(2.28)
1 √ 4
− gki gik,s − 4 √
(2.29)
−g ,s +2Istt + Istt = 0.
3e
−g
Należało skorzystać ze wzoru (1.9) oraz z tego, że gki gik = δkk = 4, a po zamianie
wskaźników dokonać stosownej redukcji. Ze wzoru (2.10) łatwo otrzymujemy
√
∂gik
1 ∂g
1 ∂ −g
1 √ − gki s =
=
2
=
2
−g ,s .
(2.30)
√
√
∂x
g ∂xs
−g ∂xs
−g
Podstawienie tego wyniku do (2.29) daje ostatecznie
2
5
1 √ −g ,s = Istt + Istt = Istt + Istt .
√
3e
3e
−g
(2.31)
Dla Iikt = Γtik i gik = γik , wzór ten przechodzi w znany z Ogólnej Teorii Względności.
Podstawiając (2.31) do równania (2.25), przerzućmy część wyrazów na drugą stronę.
Otrzymujemy
2
2
gik,s + git Istk + gtk Itsi = gik Itst + git Iltl δks .
(2.32)
3 e 3 e
20
To równanie możemy również zapisać w postaci
2 it l k
ik
it k
tk i
l k
g,s + g Ist + g Its = g Ils δt + Ilt δs .
(2.33)
3
e
e
Wskazane jest jeszcze przeniesienie drugiego wyrazu po lewej stronie na prawą stronę oraz dodanie do obu stron wyrażenia git Itsk . Otrzymujemy w ten sposób bardzo
ciekawy wynik:
1 l k 1 l k
it k
tk i
it k
ik
ik
g : s = g,s + g Its + g Its = 2g Its + Ils δt + Ilt δs .
(2.34)
3e
e 3e
Lewa strona jest pochodną kowariantną tensora gik . Z postaci prawej strony natychmiast wnioskujemy o jej charakterze tensorowym. Widzimy też, że taka pochodna równa się zeru w czasoprzestrzeniach bez torsji. Dla odróżnienia od pochodnej
kowariantnej w przestrzeniach Riemana, stosujemy dwukropek przed wskaźnikiem
zamiast zwyczajowo przyjętego średnika.
Równania (2.33) możemy zapisać w innej postaci. W tym celu wymnóżmy je
przez tensor g ji gkm . Korzystając z równości gkm gik,s = −gik gkm ,s oraz ze wzoru (1.13)
po prostych przekształceniach i odpowiedniej zamianie wskaźników otrzymujemy
2
s
s
s
s
gik Ils + glk Iis .
(2.35)
gik ,l −gsk Ili − gis Ikl =
3
e
e
Jeśli drugi wyraz po lewej stronie przeniesiemy na prawą stronę i od obu stron
odejmiemy gsk Iils , to równanie (2.35) możemy zapisać w postaci
1
1
gik : l = gik ,l −gsk Iils − gis Ikls = 2gtk Ilit + δti Ilss + δtlIiss .
(2.36)
3
3
e
e
e
Lewa strona jest pochodną kowariantną tensora gik . Tu również jest widoczny jej
tensorowy charakter i jej znikanie w czasoprzestrzeniach bez torsji.
Z drugiego układu równań pola (2.20) otrzymujemy jeszcze jeden niezwykle ciekawy wniosek. Gdy zwęzimy je względem wskaźników i, s to otrzymamy
√
ik
−gge ,k = 0.
(2.37)
W ten sposób równania (2.25) automatycznie zapisują się w postaci
2
1 √
−ggik ,k = −gtk Itki + gik Itkt .
√
3 e
−g
(2.38)
2.3.2. Zmiana długości wektora przy jego przeniesieniu równoległym
W rozdziale pierwszym był wyprowadzony wzór na zmianę iloczynu skalarnego wektorów przy ich przeniesieniu równoległym
δ gik Ai Bk = gik : l Ai Bk dxl .
(2.39)
Korzystając z równania (2.35), które jest wnioskiem z drugiego układu równań pola,
otrzymujemy
1 ts 1 ts i k l
i k
t
δ(gik A B ) = 2gtk Ili + δi Ils + δl Iis A B dx .
(2.40)
e 3 e 3 e
21
Widać, że zmiana iloczynu skalarnego wektorów przy ich przeniesieniu równoległym
równa się zeru tyko w czasoprzestrzeniach bez torsji. Przy przeniesieniu równoległym
wektora ulega więc zmianie jego długość, gdyż na podstawie wzoru (2.40) mamy
δV =
1
1
1
1
1
1
δ(V 2 ) =
δ(gik V i V k ) =
δ(γik V i V k ) = γtk (Ilit + δti Ilss + δtl Iiss )V i V k dxl .
2V
2V
2V
V
e 3 e 3 e (2.41)
Gdy wektor V i jest wektorem stycznym do krzywej
Vi =
dxi
,
dσ
(2.42)
gdzie σ jest parametrem zmieniającym się wzdłuż krzywej, to otrzymamy
1
1 t s 1 t s dxi dxk dxl
t
δV = γtk Ili + δi Ils + δl Iis
dσ.
(2.43)
V
e 3 e 3 e dσ dσ dσ
Pierwszy wyraz w nawiasie znika ze względu na antysymetrię względem wskaźników i, l. Mamy więc
dxi dxk s dxl
2
γik
Ils dσ,
(2.44)
δV =
3V dσ dσ e
dσ
ale
dxi dxk
= V2.
(2.45)
γik
dσ dσ
Otrzymujemy więc ostatecznie
2
(2.46)
δV = VIlss dxl .
3 e
Jeśli krzywa może być sparametryzowana w sposób naturalny oraz s jest jej długością
łuku, wówczas
dxi
Ui =
(2.47)
ds
jest jednostkowym wektorem stycznym do krzywej. Zgodnie z (2.46) mamy
2
δ(u) = Ilss dxl .
(2.48)
3e
Jednostkowy wektor styczny do krzywej, przeniesiony równolegle do bliskiego punktu
na tej krzywej, nie jest więc wektorem jednostkowym.
2.3.3. Rozkład naturalny koneksji liniowej
W rozdziale pierwszym doszliśmy do wniosku, że część symetryczna koneksji liniowej Ikli jest potrzebna do formułowania warunków lokalnej afiniczności. Wielkość ta
będzie również potrzebna w równaniach linii geodezyjnych. Dlatego wyrażenie tej
wielkości przez pozostałe funkcje pola jest szczególnie ważne, a wyprowadzenie takiego wzoru można uznać za najciekawszy wniosek z drugiego układu równań pola.
W tym celu zapiszemy tu jeszcze raz równania (2.35):
2
gik ,l −gsk Ilis − gis Ikls = (gik Ilss + glk Iiss ).
3
e
e
(2.49)
22
Zamieńmy w tych równaniach miejscami wskaźniki i, l:
2
glk ,i −gsk Iils − gls Ikis = (glk Iiss + gik Ilss ).
3
e
e
(2.50)
Zamieniając w równaniach (2.49) miejscami wskaźniki k, l mamy:
2
s
gil ,k −gsl Ikis − gis Ilks = (gil Iks
+ gkl Iiss ).
3
e
e
(2.51)
Dodanie stronami równań (2.50) i (2.51) oraz odjęcie równań (2.49) daje
1
1
s
+ gkl Iiss ).
γls Ikis = (gil ,k +glk ,i −gik ,l ) + gis Ikls + gsk Ilis − (gil Iks
2
3
e
e
e
e
(2.52)
Przyrównując części symetryczne lewej i prawej strony względem wskaźników i, k
otrzymujemy
1
1
s
γls Iiks = (γli ,k +γlk ,i −γik ,l ) + gis Ikls + gks Iils − (gil Iks
+ gkl Iiss ).
2
ee
ee 3
e
e
(2.53)
Wskazane jest jeszcze rozłożenie tensora podstawowego w drugim nawiasie na części,
symetryczną i antysymetryczną:
1
1
1
s
s
γls Iiks = (γli ,k +γlk ,i −γik ,l ) + gis Ikls + gks Iils − (gil Iks
+ gkl Iiss ) − (γil Iks
+ γkl Iiss ). (2.54)
2
ee
ee 3 ee
ee 3
e
e
Wymnożenie tych równań przez tensor γtl odwrotny do γls daje bardzo ciekawy
wynik:
1
1
s
s
+ gkl Iiss ) − (δti Iks
+ δtk Iiss ).
Iikt = Γtik + γtl (gis Ikls + gks Iils ) − γtl (gil Iks
3
3
ee
ee
ee
ee
e
e
(2.55)
Taki rozkład części symetrycznej koneksji liniowej nazywać będziemy naturalnym rozkładem, dlatego że występuje w nim symbol Christoffela Γtik odpowiedzialny
za oddziaływanie grawitacyjne. Można się domyślać, że pozostałe trzy człony wyraźnie różniące się w zapisie, są odpowiedzialne za pozostałe trzy znane oddziaływania.
Ujawnienie się czterech oddziaływań może być potwierdzeniem, że rozpatrywane
czasoprzestrzenne modele są przede wszystkim modelami cząstek elementarnych,
a to dlatego, że według obecnej wiedzy, wszystkie cztery oddziaływania manifestują się w tej dziedzinie. Oczywiście, nie wyklucza to możliwości występowania
oddziaływania silnego i słabego również w obiektach astronomicznych, zwłaszcza
typu gwiazd neutronowych. Występującego tu pola grawitacyjnego nie wolno zaniedbywać (co nagminnie robią wszystkie dotychczasowe teorie cząstek elementarnych),
nie tylko dlatego, że nie wiadomo, czy nie odgrywa to oddziaływanie znaczącej roli na bardzo małych odległościach od centrów tych cząstek, ale przede wszystkim
dlatego, że Γtik jest jedynym pseudotensorem we wzorze (2.55). Zaniedbanie tego wyrazu prowadziłoby do afiniczności czasoprzestrzeni, co jest sprzeczne z pierwotnym
założeniem.
23
2.3.4. Równania pola elektromagnetycznego
Pełną identyfikacją oddziaływań zajmiemy się w następnym rozdziale, a we wzorze (2.55) warto jeszcze zwrócić uwagę na to, że czterdzieści składowych koneksji Iikt
wyraża się przez dwadzieścia cztery składowe antysymetrycznej części koneksji Ikll ,
e
dziesięć funkcji γik oraz sześć funkcji gik . Z osiemdziesięciu funkcji pola pozostało
e osiemdziesiąt. Stąd wynika, że czterdziewięc tylko czterdzieści, a równań pola jest
ści równań było zależnych. Skorzystaliśmy już z tego faktu, wyprowadzając kilka
wzorów oraz bardziej prostych równań i jeszcze będziemy z tego korzystać. Cztery
takie zależności otrzymamy z przyrównania części antysymetrycznych lewej i prawej
strony wzoru (2.52) względem wskaźników i, k:
1
γls Iiks + γks Ilis + γis Ikls = (gik ,l +gli ,k +gkl ,i ).
(2.56)
e
e
e
e
e 2 e
Przyporządkowanie (1.23) sugerowało możliwość potraktowania gik jako tensora pola
e
elektromagnetycznego. Tu mamy bardzo ważki argument przemawiający
za trafnością takiej sugestii, gdyż w czasoprzestrzeni bez torsji lewa strona równań (2.56)
znika, a wtedy otrzymujemy dosłownie pierwszą parę równań Maxwella
gik ,l +gli ,k +gkl ,i = 0.
(2.57)
e
e
e
Można to osiągnąć również przez wprowadzenie czteropotencjału Ai spełniającego
związek
Fik = Ak ,i −Ai ,k .
(2.58)
Wprowadzenie potencjału wektorowego automatycznie prowadzi do tożsamościowego spełniania się równań (2.57). Prowadzi to do znacznego, nieuzasadnionego uproszczenia równań pola. Dlatego, wbrew powszechnie stosowanemu zastosowaniu tego
uproszczenia, nie będziemy tego potencjału wprowadzać, dopóki nie zajdzie tego
wyraźna potrzeba.
Do pełnej identyfikacji gik jako tensora pola elektromagnetycznego potrzebna jest
jeszcze druga para równań eMaxwella. Te brakujące równania, to równania (2.37),
które tu jeszcze raz przytoczymy
√
ik
(2.59)
−gge ,k = 0.
2.3.5. Prawa zachowania
Wszystkie dotychczasowe wnioski dotyczyły wyłącznie drugiego układu równań pola czasoprzestrzeni niesymetrycznych (2.22). Teraz wyprowadzimy równania będące
wnioskiem z obydwu tych układów. Postać tych równań upoważni nas do potraktowania ich jako prawa zachowania dla czasoprzestrzeni niesymetrycznych. Te równania uzyskał również Einstein w swojej Teorii Pola Niesymetrycznego, ale tylko
przy pewnych uproszczeniach. Tu wyprowadzimy te równania bez żadnych uproszczeń. Zauważmy najpierw, że pierwszy układ równań pola (2.2) można zapisać w postaci
t
(Iiks − Iitt δsk ),s = Iits Isk
− Iiks Istt .
(2.60)
24
Różniczkując to równanie po xl , otrzymujemy
t s
t
(Iiks − Iitt δsk ),ls = Isk
Iit ,l +Iits Isk
,l −Istt Iiks ,l −Iiks Istt ,l .
(2.61)
√
Wymnóżmy teraz to równanie przez −ggik wchodząc z tym wyrażeniem pod znak
pochodnej po xs :
i
√
h√
−ggik Iiks − Iitt δsk ,l ,s − −ggik ,s Iiks − Iitt δsk ,l =
√ t s
t
= −g gik Isk
Iit ,l +gik Iits Isk
,l −gik Istt Iiks ,l −gik Iiks Istt ,l .
(2.62)
Przenosząc drugi wyraz po lewej stronie na prawą stronę, po lewej stronie otrzymamy
i
h√
(2.63)
−ggik Iiks − Iitt δsk ,l ,s .
Prawa strona, po wykonaniu różniczkowania po xl w przeniesionym wyrazie, będzie
miała postać
√
√
t s
t
( −ggik ),s Iiks ,l −( −ggik ),k Iitt ,l +gik Isk
Iit ,l +gik Iits Isk
,l −gik Istt Iiks ,l −gik Iiks Istt ,l .
(2.64)
Wykażemy, że to wyrażenie jest tożsame z drugim układem równań pola (2.23)
wymnożonym przez Iiks ,l , czyli że jest równe zeru. Dla uniknięcia pomyłek, musimy też
zmienić wskaźniki l na j występujące w trzecim nawiasie równania (2.23). W ten
sposób otrzymujemy
√
√
√
( −ggit ),t Iikk ,l −( −ggik ),s Iiks ,l + −g(gik Istt Iiks ,l +g jt Iijt Iikk ,l −git Istk Iiks ,l −gtk Itsi Iiks ,l ) = 0.
(2.65)
ik
Zamieniając wskaźniki tak, aby wszędzie występowało g , mamy
√
√
√
t s
t
( −ggik ),k Iitt ,l −( −ggik ),s Iiks ,l + −g(gik Istt Iiks ,l +gik Iiks Istt ,l −gik Isk
Iit ,l −gik Iits Isk
,l ) = 0.
(2.66)
Wyrażenie po lewej stronie jest równe (tylko z przeciwnym znakiem) wyrażeniu (2.65), które jest jednocześnie równe wyrażeniu (2.64). Mamy zatem
h√
i
−ggik (Iiks − Iitt δsk ),l ,s = 0.
(2.67)
Te cztery równania świadczą o tym, że wielkość
√
Tls = −ggik (Iiks − Iitt δsk ),l
(2.68)
zachowuje się, a prawo zachowania tej wielkości ma postać
Tls ,s = 0.
(2.69)
Prawo zachowania (2.67) jest również λ-niezmiennicze, co może świadczyć o tym,
że nie został popełniony błąd przy tym dość skomplikowanym wyprowadzaniu.
To prawo zachowania uzyskał Einstein w swojej Teorii Pola Niesymetrycznego,
ale tylko dla szczególnego rodzaju pól. Przedstawiony powyżej sposób wyprowadzania dotyczy wszystkich pól spełniających równania pola niesymetrycznych czasoprzestrzeni. Einstein interpretuje to jako prawo zachowania pędu i energii. Wydaje się jednak, że jest to zbyt daleko idący wniosek.
25
2.3.6. Dalsze wnioski z równań pola
W równaniach pola występuje zwężona postać części symetrycznej koneksji, czyli Iikk .
Korzystając ze wzoru (2.55) możemy tę wielkość wyrazić przez inne funkcje pola.
Zwężając wzór (2.55) względem wskaźników t, k, otrzymujemy
1 s
5
(2.70)
− Iiss .
Iikk = Γkik + γkl gks Iils − gil Iks
3e
ee 3 ee
Do identyfikacji oddziaływań mogłyby posłużyć równania ruchu, ale w ich określeniu zawarte jest pojęcie „cząstki próbnej”. Takie pojecie nie ma sensu w odniesieniu do cząstek elementarnych, gdyż cząstką próbną mogłaby być tylko inna cząstka
elementarna. Taka sytuacja sprowadza się do zagadnienia dwóch ciał, czyli do problemu oddziaływania dwóch różnych, czy też równoważnych czasoprzestrzeni elementarnych. Do identyfikacji oddziaływań posłużymy się więc równaniami linii geodezyjnych, które geometrycznie są uogólnieniem równań linii prostej w przestrzeni
afinicznej, a fizycznie są uogólnieniem równań ruchu, bez potrzeby posługiwania się
pojęciem „cząstki próbnej”.
2.3.7. Komentarz do równań pola
Po operacjach przeprowadzonych na równaniach pola (2.22) oraz (2.23) możemy
układ równań pola przestawić w postaci
Rik = Iiks ,s −Iiss ,k +Iikt Itss − Iist Itks = 0,
2
1 √
−ggik ,k = −gtk Itki + gik Itkt ,
√
3 e
−g
1 √
2
5
√ ( −g),s = Istt + Istt = Istt + Istt ,
3e
3e
−g
2
gik,s + git Istk + gtk Itsi = git Ilsl δkt + Iltl δks ,
3
e e
2
s
s
s
gik ,l −gsk Ili − gis Ikl =
gik Ils + glk Iiss ,
3
e
e
√
ik
−gge ,k = 0,
s
s
s
gik ,l +gli ,k +gkl ,i = 2 γls Iik + γks Ili + γis Ikl ,
e
e
e
e
e
e
1 ts
1 tl
t
s
s
t
tl
s
s
Iik = Γik + γ (gis Ikl + gks Iil ) − γ (gil Iks + gkl Iis ) − (δi Iks + δtk Iiss ),
e e ie e 3 e
e e he e 3
e
√
ik s
t s
−gg (Iik − Iit δk ),l ,s = 0.
(I)
(II)
(III)
(IV)
(V)
(VI)
(VII)
(VIII)
(IX)
Związki te spełniają się w dowolnym układzie współrzędnych i z koneksją określoną z dokładnością do gradientu dowolnej funkcji skalarnej λ, zgodnie ze wzorem (??).
Zasada wariacyjna nie wyklucza wariacji będących efektem transformacji układu
współrzędnych i dowolnego wyboru czterech składowych gradientu funkcji λ. Te dowolności możemy wykluczyć przez nałożenie ośmiu dowolnych warunków na funkcje
26
pola. Nie jest istotne, czy te warunki nałożymy na funkcje gik , czy na funkcje Iikl ,
gdyż są one ze sobą powiązane równaniami pola. W pierwszym rozdziale doszliśmy
do wniosku, że jest wskazane przyjęcie dwóch warunków
S = γik γlm Fil Fkm = 0,
(2.71)
1
(2.72)
P = eiklm Fik Flm = 0.
2
Prowadzi to do równości g = γ, co zabezpiecza nieosobliwość macierzy gik . Pozostałe
sześć warunków wybierzemy tak, aby tensor metryczny γik był macierzą diagonalną.
Oznacza to żądanie, aby
gki = −gik
dla i , k.
(2.73)
Tak wycechowana teoria traci niezmiennoczość, ale się ujednoznacznia i w znaczny
sposób upraszcza. Z tych uproszczeń będziemy korzystali tylko przy konkretnych
rozwiązaniach. Przy wyprowadzaniu ogólnych wzorów i równań nie będziemy z tych
uproszczeń korzystać.
Rozdział 3
Ogólne własności czasoprzestrzeni
niesymetrycznych
3.1. Linie geodezyjne
3.1.1. Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych
W rozdziale drugim stwierdziliśmy, że w czasoprzestrzeniach z torsją ulega zmianie
długość wektora przy jego przeniesieniu równoległym. Korzystając ze znanej definicji
linii geodezyjnej musimy ten fakt uwzględnić. Linią geodezyjną nazywa się krzywą
posiadającą taką własność, że wektor
Ui =
dxi
dσ
(3.1)
(gdzie: xi — współrzędne punktu krzywej; σ — parametr zmieniający się wzdłuż tej
krzywej), styczny do niej w punkcie M, przeniesiony równolegle do bliskiego punktu N na tej krzywej, ma ten sam kierunek, co wektor styczny do niej w punkcie N.
Oznacza to, że wektor styczny jest po takim przeniesieniu nadal styczny, a zmianie
ulega tylko jego długość. Ale zmiana długości oznacza jego wydłużenie lub skrócenie.
Przy tym przeniesieniu zmienia się więc o ±δU. Zgodnie z tą definicją mamy
(Ui + dUi ) − (Ui + δUi ) = dUi − δUi = ±
Ui
δU.
U
(3.2)
W rozpatrywanych tu czasoprzestrzeniach niesymetrycznych zmianę długości wektora stycznego do krzywej przy przeniesieniu równoległym, określa wzór (2.46)
2
δU = UIlss dxl .
3 e
Podstawiając do wzoru (3.2) wzory (3.1) i (3.3) oraz
i
δU =
dx
−Ikli Uk
l
dσ
dσ −
dxl
dσ
dσ dσ
dx
Ikli
k
(3.3)
(3.4)
i dzieląc całość przez dσ otrzymujemy równania linii geodezyjnych w postaci
k
l
d2 xi
2 s dxk dxi
i dx dx
+
I
=
±
Iks
.
kl
dσ2
dσ dσ
3e
dσ dσ
(3.5)
Widać, że istnieją dwa rodzaje linii geodezyjnych. Będziemy je nazywać lewoskrętnymi i prawoskrętnymi. Dla lewoskrętnych krzywych wektor styczny przy przeniesieniu równoległym będzie ulegał wydłużeniu (znak „plus” po prawej stronie równań).
27
28
Rozdział 3. Ogólne własności czasoprzestrzeni niesymetrycznych
Dla prawoskrętnych geodezyjnych wektor styczny przy przeniesieniu równoległym
będzie ulegał skróceniu (znak „minus” po prawej stronie równań).
Po lewej stronie równania (3.5) występuje tylko część symetryczna koneksji,
dxk dxl
gdyż jest ona symetryzowana przez iloczyn
. Dlatego możemy tu podstawić
dσ dσ
wzór (2.54), który po odpowiedniej zmianie wskaźników ma postać
1
1
s
s
) − (δik Ilss + δil Iks
Ikli = Γikl + γit (gks Ilts + glt Ikts ) − γit (gkt Ilss + glt Iks
).
3
3
ee ee
ee ee
e
e
Podstawiając ten wzór do równań (3.5) otrzymujemy
(3.6)
k
k
k
l
l
l
2 it
2 s dxk dxi
2 s dxk dxi
d2 xi
i dx dx
it
s dx dx
s dx dx
+
Γ
+
2γ
g
I
−
γ
g
I
−
I
=
±
Iks
.
ks lt
kt ls
kl
ks
dσ2
dσ dσ
3e
dσ dσ
e e dσ dσ 3
e e dσ dσ 3 e dσ dσ
(3.7)
3.1.2. Cząstki i antycząstki
We wzorze (3.6) i w równaniach (3.7) występuje pseudotensor Γlik odpowiedzialny
za oddziaływania grawitacyjne oraz trzy różne symetryczne tensory trzeciego rzędu, odpowiedzialne za pozostałe oddziaływania. Jedyną wielkością mogącą zmienić
znak na przeciwny wszystkich oddziaływań oprócz grawitacji jest torsja Ikli . Dlatego
e
zmiana
∗
Iikl →Iikl = Ikil
(3.8)
powinna być zamianą czasoprzestrzeni na antyczasoprzestrzeń, będącą czasoprzestrzennym modelem cząstki elementarnej. Tensory dwóch oddziaływań zależą od
iloczynu tensora gik i torsji. Później stwierdzimy, że ma to konsekwencje w braku
e
symetrii między cząstkami
i ich antycząstkami. Ten brak symetrii wyjaśnia największą tajemnicę Wszechświata, że tzw. antymateria nie występuje na równych prawach
z materią.
3.1.3. Oddziaływania elektromagnetyczne i słabe
Wielkość skalarną
2 s dxk
ρ(σ) = Iks
(3.9)
3 e dσ
nazywać będziemy ładunkiem słabym. Oprócz oddziaływania grawitacyjnego reprezentowanego przez symbol Γikl , zidentyfikowaliśmy w rozdziale pierwszym oddziaływanie elektromagnetyczne reprezentowane przez tensor gik . Przyjęliśmy dla niego
e
oznaczenie F̆ik , ale w rozdziale drugim wprowadziliśmy tensor pola elektromagnetycznego za pomocą wzoru (2.67) jako Fik = 1b gik , gdzie tensor gik spełnia uogólnione
e linii geodezyjnych
e
równania Maxwella (2.56) i (2.59). W równaniach
(3.7) tensor Fik
jest wymnożony przez tensor γit , ale ten tensor nie służy do podwyższania wskaźników, więc te równania po uwzględnieniu (3.9) zapiszemy w postaci
k
k
l
l
dxi
dxi
d2 xi
dxk
i dx dx
it
s dx dx
it
+ Γkl
+ 2γ gks Ilt
− ργ gkt
−ρ
= ±ρ ,
dσ2
dσ dσ
dσ
dσ
e e dσ dσ
e dσ
(3.10)
29
3.1. Linie geodezyjne
gdzie
q = bρ.
(3.11)
Wielkość q nazywać będziemy ładunkiem elektrycznym. Mamy więc podstawy,
aby uznać, że tensorem oddziaływania elektromagnetycznego we wzorze (3.6) jest
1 it
i
s
s
εkl = − γ gkt Ils + glt Iks .
(3.12)
3
ee ee
Widać, że równanie (3.10) stanowi dwa układy równań dwóch różnych linii geodezyjnych:
k
k
l
l
dxk
dxi
d2 xi
i dx dx
it
s dx dx
it
+
Γ
+
2γ
g
I
−
qγ
F
=
2ρ
,
(3.13)
ks lt
kt
kl
dσ2
dσ dσ
dσ
dσ
e e dσ dσ
oraz
k
k
l
l
d2 xi
dxk
i dx dx
it
s dx dx
it
+
Γ
+
2γ
g
I
−
qγ
F
= 0.
(3.14)
ks lt
kt
kl
dσ2
dσ dσ
dσ
e e dσ dσ
Obydwa równania dotyczą tej samej czasoprzestrzeni, a różnią się wyrazem
określającym najprostsze z oddziaływań. Dotychczasowe teoretyczne opracowania
doświadczeń z cząstkami elementarnymi za najprostsze uznają oddziaływania słabe. Wskazują również na ich powinowactwo do oddziaływań elektromagnetycznych.
W powyższych równaniach manifestuje się to tym, że istnieje wspólny tensor pola
elektrosłabego. Jest nim tensor podstawowy gik . Rzeczywiście, wzór (3.6) możemy
zapisać w postaci
1 it
s
s
i
i
it
s
s
(3.15)
Ikl = Γkl + γ gks Ilt + gls Ikt − γ gkt Ils + glt Iks ,
3
ee ee
e
e
gdzie suma tensora oddziaływania elektromagnetycznego (3.12) i tensora oddziaływania słabego
1 i s
1 it
i
s
s
i s
Λkl = − δk Ils + δl Iks = − γ γkt Ils + γlt Iks
(3.16)
3
3
e
e
e
e
jest zapisana jako
1 it
s
s
i
i
(3.17)
εkl Λkl = − γ gkt Ils + glt Iks .
3
e
e
Znana jest też własność oddziaływań słabych, że występują tylko w lewoskrętnych cząstkach i prawoskrętnych antycząstkach, zaś prawoskrętne cząstki i lewoskrętne antycząstki są tych oddziaływań pozbawione. Ta zbieżność faktów wystarcza,
aby uznać, że ostatni wyraz w równaniu (3.10) określa słabe oddziaływanie.
3.1.4. Oddziaływanie silne
We wzorze (?? ) pozostał jeszcze do identyfikacji tensor
i
it
s
s
Hkl = γ gks Ilt + gls Ikt ,
(3.18)
ee ee
a jednocześnie z czterech znanych nam oddziaływań brakuje nam w tym wzorze
oddziaływań silnych. Wnioskujemy więc, że tensor Hkli , określony wzorem (3.18)
jest odpowiedzialny za oddziaływanie silne. Dodatkowym argumentem na to jest
wyraźnie widoczna w równaniach (3.13, 3.14) jego niezależność od ładunków ρ, q.
30
Jest to więc niezależność ładunkowa jako znana własność silnego oddziaływania.
Bardzo ważną własnością tensora silnego oddziaływania jest jego niezmienniczość
ze względu na jednoczesną zamianę gik na gki oraz Ikli na Ilki . Później stwierdzimy,
że konsekwencją tej niezmienniczości jest istnienie dwóch różnych kwarków w każdej
generacji, na przykład kwarka u oraz kwarka d. Konsekwencją tej niezmienniczości
jest również brak symetrii między materią i tzw. antymaterią.
3.1.5. Lokalna afiniczność względem koneksji będącej sumą Γikl i tensorów
pozostałych oddziaływań
Dodając do koneksji właściwej Γikl tensory oddziaływań silnych, elektromagnetycznych lub słabych albo wszystkie możliwe sumy tych tensorów otrzymujemy nowe
koneksje. W ten sposób otrzymujemy koneksje
i
it
i
s
s
Lkl = Γkl + γ gks Ilt + gls Ikt ,
(3.19)
ee ee
1
s
L̇ikl = Γikl + γit gks Ilts + gls Ikts − δik Ilss + δil Iks
,
(3.20)
3
ee ee
e
e
1
s
L̈ikl = Γikl + γit gks Ilts + gls Ikts − γit gkt Ilss + glt Iks
,
(3.21)
3
ee ee
ee ee
1 it
i
s
s
i
(3.22)
Łkl = Γkl − γ gkt Ils + glt Iks ,
3
ee ee
1 i s
1 it
i
s
s
i s
i
(3.23)
Ł̇kl = Γkl − γ gkt Ils + glt Iks − δk Ils + δl Iks ,
3
3
ee ee
e
e
1 i s
i
i
i s
Ł̈kl = Γkl − δk Ils + δl Iks .
(3.24)
3
e
e
Oczywiście siódmą postacią części symetrycznej koneksji jest jej pełna postać Ikli
określona wzorem (3.6), a ósmą — koneksja właściwa, czyli Γikl . Żądanie lokalnej
afiniczności względem tych koneksji powoduje lokalne znikanie odpowiednich oddziaływań.
3.2. Równania falowe i funkcje falowe
3.2.1. Równania falowe
Stwierdzenie, że czasoprzestrzenne modele realnych obiektów nie są afiniczne, przeznacza w tej teorii szczególną rolę transformacji (1.56). Pozwala ona ustalić warunki,
aby czasoprzestrzeń była lokalnie afiniczna, co wystarcza, aby w rozpatrywanej czasoprzestrzeni można było stosować rachunek różniczkowy dla wielkości tensorowych.
W rezultacie otrzymujemy równania (1.56) jako wystarczający warunek lokalnej afiniczności
∂x̄ν i
∂2 x̄ν
−
I (P) = 0.
(3.25)
31
Każde rozwiązanie tych równań wyznacza układ współrzędnych związany z punktem, w którym znika część symetryczna koneksji Ikli . Znana i przytaczana w podręcznikach jest transformacja
1
ϕ(P) : x̄ν = xν − xνP + Iklν (P)(xk − xkP )(xl − xlP ).
2
Różniczkując te funkcje otrzymujemy
∂x̄ν
= δνi + Iikν (P)(xk − xkP ),
∂xi
∂2 x̄ν
= Iklν (P).
∂xk ∂xl
(3.26)
(3.27)
Podstawienie tych wyników do równania (3.25) daje
Iisν (P)Ikli (P)(xs − xsP ) = 0.
(3.28)
Transformacja (3.26) realizuje lokalną afiniczność czasoprzestrzeni, ale spełnia równania (3.25) tylko w wybranym punkcie P oraz z odpowiednim przybliżeniem w małym otoczeniu punktu P, gdy wymiary liniowe xk − xkP są wystarczająco małe. Taka
interpretacja tej transformacji podawana jest w podręcznikach. Widać, że transformację (3.26) wymyślono dla potrzeb Ogólnej Teorii Względności, aby wytłumaczyć,
dlaczego dla swobodnie spadającej wzdłuż geodezyjnej cząstki próbnej, otrzymujemy
d2 x̄ν
= 0. Pozwala to identyfikować małe otoczenie punktu P ze styczną czasoprzeds2
strzenią Minkowskiego. Cząstka próbna (z założenia) nie zmienia własności pola,
w którym się znajduje. Jest to więc realizacja lokalnej afiniczności nie wpływająca
na strukturę czasoprzestrzeni. Zauważmy, że transformacja (3.26) jest nieosobliwa,
więc za pomocą odwzorowania ϕ(P′ )◦ϕ−1 (P) można przejść do układu współrzędnych
związanego z innym punktem P′ .
Wszystkie ścisłe rozwiązania szczególne równań (3.25) można ogólnie przedstawić
w postaci
i
α(P) : x̄ν = Kν eβi x ,
(Kν , βi = const).
(3.29)
Te transformacje są osobliwe. Każde takie rozwiązanie, gdzie βi wyraża się różnie
przez stałe Iikl (P), określa czasoprzestrzeń o innych własnościach. Gdyby takie transformacje były nieosobliwe, to można by było zmieniać własności czasoprzestrzeni
za pomocą odwzorowania α′ (P) ◦ α−1 (P). Osobliwość (Jakobian równy zeru) takich
transformacji uniemożliwia zmianę własności czasoprzestrzeni w wyniku transformacji układu współrzędnych. Osobliwość tych transformacji jest więc ważną pozytywną
własnością. Konsekwencje takich transformacji są nieodwracalne. Jeśli na przykład
realizacja lokalnej afiniczności prowadzi do własności, jakie ma elektron, to nie można tych własności zlikwidować za pomocą odwrotnej transformacji, gdyż taka nie istnieje.
Z postaci równań (3.25) wynika, że wszystkie współrzędne x̄ν jednakowo zależą
od współrzędnych xi . Takie szczególne rozwiązania możemy więc zapisać w postaci
x̄ν = Kν Ψ,
(3.30)
gdzie Kν są dowolnymi stałymi. Dla funkcji Ψ otrzymujemy równania
∂Ψ
∂2 Ψ
− i Ykli = 0,
k
l
∂x
∂x ∂x
(3.31)
32
gdzie
Ykli = Ikli (P).
(3.32)
Oznaczenie przez Ykli stałych, będących wartościami koneksji w punkcie P, należy
traktować tak, że dotyczy to każdej z ośmiu wyżej wyliczonych koneksji. Wielkość Ykli
może więc oznaczać również, na przykład, Γikl (P). Pozwala to uniknąć wprowadzania
zbyt wielu oznaczeń. Można mieć nadzieję, że nie doprowadzi to do nieporozumień.
Spośród dziesięciu równań (3.31) tylko w czterech następujących
∂2 Ψ
∂Ψ 0
∂Ψ 1
∂Ψ 2
∂Ψ 3
− 0 Y00
− 1 Y00
− 2 Y00
− 3 Y00
= 0,
0
2
∂(x )
∂x
∂x
∂x
∂x
(3.33)
∂Ψ 1
∂Ψ 0
∂Ψ 2
∂Ψ 3
∂2 Ψ
− 1 Y11
− 0 Y11
− 2 Y11
− 3 Y11
= 0,
1
2
∂(x )
∂x
∂x
∂x
∂x
(3.34)
∂Ψ 2
∂Ψ 0
∂Ψ 1
∂2 Ψ
∂Ψ 3
− 2 Y22
− 0 Y22
− 1 Y22
= 0,
− 3 Y22
2
2
∂(x )
∂x
∂x
∂x
∂x
(3.35)
∂2 Ψ
∂Ψ 3
∂Ψ 0
∂Ψ 1
∂Ψ 2
− 3 Y33
− 0 Y33
− 1 Y33
=0
− 2 Y33
3
2
∂(x )
∂x
∂x
∂x
∂x
(3.36)
możemy dokonać rozdzielenia zmiennych dla funkcji Ψ w postaci
Ψ = T(x0 )R(x1 )Θ(x2 )Φ(x3 ).
(3.37)
Kombinacja liniowa uzyskanych w ten sposób rozwiązań szczególnych będzie
ogólnym rozwiązaniem, ale jak już stwierdziliśmy, każde szczególne rozwiązanie jest
lub może być zrealizowane w Naturze. Pozostałe równania, po podstawieniu otrzymanych rozwiązań, będą określać związki między wielkościami Yikl w rozpatrywanej
czasoprzestrzeni.
Postać równań (3.25) pozwoliła na chwilowe pozbycie się stałych Kν , ale należy
pamiętać o zaopatrzeniu w te stałe otrzymanych rozwiązań. Podstawiając (3.37)
do równań (3.33–3.36) otrzymujemy
1 dT 0
1 dR 1
1 dΘ 2
1 dΦ 3
1 d2 T
−
Y00 −
Y00 −
Y00 −
Y = 0,
0
2
0
1
2
T d(x )
T dx
R dx
Θ dx
Φ dx3 00
(3.38)
1 dR 1
1 dT 0
1 dΘ 2
1 dΦ 3
1 d2 R
−
Y
−
Y
−
Y
−
Y = 0,
11
11
11
R d(x1 )2 R dx1
T dx0
Θ dx2
Φ dx3 11
(3.39)
1 dΘ 2
1 dT 0
1 dR 1
1 d2 Θ
1 dΦ 3
−
Y
−
Y
−
Y = 0,
Y
−
22
22
22
Θ d(x2 )2 Θ dx2
T dx0
R dx1
Φ dx3 22
(3.40)
1 d2 Φ
1 dΦ 3
1 dT 0
1 dR 1
1 dΘ 2
−
Y33 −
Y33 −
Y33 −
Y = 0.
3
2
3
0
1
Φ d(x )
Φ dx
T dx
R dx
Θ dx2 33
(3.41)
33
3.2.2. Rozwiązania równań falowych
Rozwiązaniem równań (3.38–3.41) w postaci (3.37) mogą być funkcje
0
T = eβ0 x ,
1
R = eβ1 x ,
2
Θ = eβ2 x ,
3
Φ = eβ3 x ,
(3.42)
więc
i
Ψ = eβi x ,
i
czylix̄ν = Kν eβi x ,
(3.43)
gdzie Kν są dowolnymi stałymi. Podstawienie (3.43) do równań (3.33–3.36) prowadzi
do układu równań charakterystycznych
0
1
2
3
β20 − β0 Y00
− β1 Y00
− β2 Y00
− β3 Y00
= 0,
(3.44)
0
1
2
3
β21 − β0 Y11
− β1 Y11
− β2 Y11
− β3 Y11
= 0,
(3.45)
0
1
2
3
β22 − β0 Y22
− β1 Y22
− β2 Y22
− β3 Y22
= 0,
(3.46)
0
1
2
3
β23 − β0 Y33
− β1 Y33
− β2 Y33
− β3 Y33
= 0.
(3.47)
Tak dochodzimy do sposobu klasyfikowania czasoprzestrzeni według rodzaju i typu. Klasyfikacja czasoprzestrzeni według rodzaju zależeć będzie od tego, jakie oddziaływanie jest w niej dominujące. Dominującymi nazywać będziemy oddziaływania, które nie biorą udziału w realizacji lokalnej afiniczności. Klasyfikacja według
typu będzie zależała od typu rozwiązania układu równań algebraicznych (3.44–3.47)
względem wielkości βi .
Równania (3.44–3.47) stanowią układ jednorodnych równań kwadratowych.
Nie ma ogólnego warunku na rozwiązywalność takiego układu równań, jak to ma
miejsce dla układu liniowych równań jednorodnych. Nie ma też ogólnej metody
na rozwiązywanie takiego układu równań, więc nie można go rozwiązać inaczej niż
przez kolejne podstawianie, a to prowadzi już w pierwszym podstawieniu do równań
czwartego stopnia. W tym miejscu musimy podać definicję:
Dowolna metoda sprowadzająca rozwiązania równania algebraicznego do wykonania ciągu operacji wymiernych i wyciągania z już znanych wielkości tych pierwiastków nazywa się rozwiązaniem przez pierwiastniki.
Z teorii Galois wynika niemożliwość rozwiązania przez pierwiastniki w ogólnym
przypadku równań stopnia n > 4. W ten sposób stwierdzamy niemożliwość rozwiązania układu równań (3.44–3.47) przez kolejne podstawianie. A że tego układu inaczej
rozwiązywać nie można, to dochodzimy do wniosku, że bez specjalnych założeń ten
układ równań jest nierozwiązywalny. Rozwiązalność równań (3.25), czyli spełnienie
wystarczającego warunku lokalnej afiniczności wymaga więc nałożenia na rozwiązania układu równań (3.44–3.47) takich warunków, aby przez kolejne podstawianie
uzyskać wielomian stopnia nie wyższego niż czwarty.
W ogólności należy dopuszczać zespolone rozwiązania równań (3.44–3.47), a to
oznacza istnienie rozwiązań równań (3.31) dla funkcji Ψ z periodyczną zależnością
od czasu. Z tego powodu nazywać będziemy funkcję Ψ funkcją falową, a równania (3.31) równaniami falowymi. Rozwiązania z periodyczną zależnością od czasu są
szczególnie interesujące, gdyż takie właśnie rozwiązania występują w dziedzinie cząstek elementarnych i prowadzą do zjawisk kwantowych. Takie rozwiązania cechuje
34
całkowicie nieokreślona wartość współrzędnych x̄ν , a tym samym całkowicie nieokreślona lokalizacja zjawisk. Można tego dokonać tylko z dokładnością do prawdopodobieństwa. Wynika stąd konieczność normowania rozwiązań tak, aby lokalizacja
zjawiska w całej przestrzeni miała prawdopodobieństwo równe jedności. Zaczniemy
od rozpatrywania tylko periodycznych w czasie rozwiązań, gdyż dysponujemy bardzo
bogatym materiałem doświadczalnym w tej dziedzinie, co nam pozwoli konfrontować
otrzymane wyniki ze znanymi wynikami doświadczeń i dotychczasowymi ustaleniami
teoretycznymi w dziedzinie cząstek elementarnych. Musimy jednak zagospodarować
również rozwiązania z nieperiodyczną zależnością od czasu i znaleźć dla nich w Naturze obiekty, których czasoprzestrzenne modele taką zależnością od czasu się legitymują, gdyż każde rozwiązanie tych równań jest, lub może być realizowane w Naturze.
Z jednej strony mamy niezagospodarowane czasoprzestrzenie z funkcjami falowymi
o nieperiodycznej zależności od czasu, a z drugiej około osiemdziesięciu procent materii Wszechświata jako tzw. ciemną materię. Rozsądnym byłoby powiązanie tych
faktów i uznanie, że rozwiązania z rzeczywistą zależnością od czasu opisują czasoprzestrzenie globalne, będące czasoprzestrzennymi modelami czarnych dziur. W tej
dziedzinie dysponujemy niezwykle ubogim materiałem doświadczalnym, więc otrzymywane tu tego typu rozwiązania mogą mieć tylko wartość hipotez. Z tego powodu tego typu rozwiązania rozpatrzymy w dalszej kolejności. Obecnie rozpatrywane
funkcje Ψ będą więc z reguły wielkościami zespolonymi. Rozwiązania równań (3.25)
i
mają więc postać (3.35) x̄ν = Kν eβi x , gdzie β0 z założenia jest wielkością zespoloną.
Do klasyfikowania czasoprzestrzeni elementarnych pod względem typu funkcji falowej będziemy używać nazw najbardziej znanych leptonów, czyli oddziaływujących
elektromagnetycznie. Będą więc funkcje falowe typu elektronowego, typu mionowego, typu taonowego oraz typu tetaonowego i lastonowego. Te dwa ostatnie leptony
jeszcze nie są znane, ale w tym rozdziale udowodnimy, że istnieją, więc mogą być
doświadczalnie wykryte. Nazwa laston bierze się stąd, że więcej tego typu leptonów już być nie może. Obecnie termin lepton jest zarezerwowany dla cząstek, które
nie oddziaływują silnie. Na ogół przyjmuje się też, że leptony mają prostą strukturę
w odróżnieniu od hadronów, które silnie oddziaływują i składają się z kwarków.
Podział na leptony i hadrony bierze się stąd, że praktycznie dotychczas nie wykryto
w leptonach żadnej struktury oraz silnego oddziaływania. Z praktycznych trudności
nie można jednak wyciągać tak daleko idących wniosków, zwłaszcza że w tej teorii
wykażemy bezpodstawność takiego podziału cząstek elementarnych.
i
Za pomocą funkcji Ψ = Ψ0 eβi x , sprowadziliśmy rozwiązywanie równań falowych (3.25) do problemu rozwiązywania układu równań algebraicznych (3.44–3.47).
Stwierdziliśmy też, że stopień równania otrzymanego przez kolejne podstawianie
nie może być wyższy niż czwarty. Aby ograniczyć stopień równań uzyskanych przez
koejne podstawianie do stopnia nie wyższego niż czwarty, to należy na wielkości βi
nakładać z góry określone wartości nie wyrażające się przez pierwiastki. Przy tym
nie możemy dla tych wielkości dopuścić wartości zerowych, gdyż należy odrzucić
możliwość transformacji układu współrzędnych pomijającej jakieś współrzędne.
Przy rozwiązywaniu równań (3.44–3.47) należy brać pod uwagę, że stałe Ykli są
rzeczywiste. Rzeczywisty charakter wielkości Iiki wynika z jej określenia. Dotyczy to
również każdej koneksji zdefiniowanej wzorem (1.38), który wymaga, aby wektor
przeniesiony równolegle do infinitezymalnie bliskiego punktu nie zmieniał jego rze-
35
czywistych składowych na zespolone. Z tego powodu te z góry określone rozwiązania
dla βi będą wiec rzeczywiste.
Każde rozwiązanie równań (3.44–3.47), spełniające wymienione wymagania,
spełnia wystarczające warunki lokalnej afiniczności, więc jest lub może być realizowane w Naturze. Zaczniemy od nałożenia jednego warunku na stałe βi . Numeracja współrzędnych przestrzennych jest umowna, więc numeracja odpowiadających
im stałych βk również jest umowna, a zatem bez straty na ogólności możemy przyjąć, że ten warunek dotyczy stałej β3 . Odrzucając wartość zerową widać, że można
z równania (3.47) wyeliminować tę wielkość
3
β3 = Y33
.
(3.48)
Z równania (3.47), przy tym warunku, otrzymujemy
0
1
2
β0 Y33
+ β1 Y33
+ β2 Y33
= 0.
(3.49)
Uwzględnienie tego równania w równaniach (3.44–3.47) pozwala, przez kolejne podstawianie, uzyskać dla stałej β0 równanie czwartego stopnia. Rozwiązanie tego problemu jako dość skomplikowanego zostawimy na później. Bardziej proste rozwiązania
otrzymamy nakładając na stałe βi drugi warunek. Żądamy, aby oprócz (3.48) było
1
β1 = Y11
.
(3.50)
Uwzględnienie tego warunku oraz warunku (3.48) w równaniu (3.45) daje
0
2
3
3
β0 Y11
+ β2 Y11
= −Y33
Y11
.
(3.51)
A z równania (3.49) otrzymujemy
0
2
1
1
β0 Y33
+ β2 Y33
= −Y11
Y33
.
(3.52)
Stałe β0 oraz β2 wyznaczone z tych równań byłyby rzeczywiste, co jest sprzeczne
z założeniem, że stała β0 musi być zespolona. Zakładając, że obie te stałe są zespolone, czyli
β0 = a0 + b0 i,
β2 = a2 + b2 i,
(3.53)
możemy równania (3.49–3.51) zapisać jako dwa układy równań
oraz
0
2
3
3
a0 Y11
+ a2 Y11
= −Y33
Y11
(3.54)
0
2
1
1
a0 Y33
+ a2 Y33
= −Y11
Y33
(3.55)
2
0
= 0,
+ b2 Y11
b0 Y11
(3.56)
0
2
b0 Y33
+ b2 Y33
= 0.
(3.57)
Uwzględnienie wzorów (3.52) w równaniach (3.44) i (3.46) prowadzi do równań
3
1
3
2
1
0
= 0,
Y00
Y00
− Y33
− a2 Y00
− Y11
a20 − b20 − a0 Y00
(3.58)
3
3
1
1
2
0
= 0,
Y22
− Y33
Y22
− Y11
− a2 Y22
a22 − b22 − a0 Y22
(3.59)
36
(3.60)
0
2
2a0 b0 − b0 Y00
− b2 Y00
= 0,
(3.61)
0
2
2a2 b2 − b0 Y22
− b2 Y22
= 0.
Otrzymaliśmy osiem równań na wyznaczenie czterech wielkości. Prowadzi to
do związków między stałymi Yikl . Istnienie takich związków wyznacza odpowiednią
symetrię w rozpatrywanej czasoprzestrzeni elementarnej. Każde rozwiązanie równań (3.54–3.61) określa transformację układu współrzędnych zapewniającą lokalną
afiniczność czasoprzestrzeni elementarnej, więc jest, lub może być, realizowana w Naturze.
3.2.3. Czasoprzestrzenie odwrotne
Wzorem (3.8) wprowadziliśmy pojęcie antyczasoprzestrzeni. Antyczasoprzestrzeń
od czasoprzestrzeni różni się więc znakiem ładunku elektrycznego i słabego. Ze wzoru (3.6), czyli
1
1
s
s
s
Ikli = Γikl + γit (gks Ilts + gls Iks
) − (δik Ilss + δil Iks
),
(3.62)
) − γit (gkt Ilss + glt Iks
3
3
ee ee
ee ee
e
e
widzimy, że czasoprzestrzeń, w której koneksja Ikli jest zamieniona na Ilki i jednocześnie tensor podstawowy gik jest zamieniony na tensor gki , różni się od normalnej
czasoprzestrzeni tylko tensorem oddziaływania słabego. Takie czasoprzestrzenie nazywać będziemy czasoprzestrzeniami odwrotnymi. Dla czasoprzestrzeni odwrotnych
otrzymamy inne rozwiązania równań falowych niż dla normalnych czasoprzestrzeni.
Bierze się to stąd, że w równaniach falowych (3.31) występujące tam stałe różnią się
od odpowiednich stałych w czasoprzestrzeniach odwrotnych. Jeśli te stałe w czasoprzestrzeniach odwrotnych oznaczymy przez Zikl , to otrzymamy związki
Zikl
=
Ykli
2 i s
i s
+ δk Ils (P) + δl Iks (P) .
3
e
e
(3.63)
Otrzymujemy stąd
s
s
1
0
(P), Z111 = Y11
+ 43 I1s
(P), Z222
Z000 = Y00
+ 34 I0s
s
s
0
0
0
(P), Z002 = Y02
+ 23 Ie
Z001 = Y01
+ 23 Ie
2s (P), Z03
1s
2 e
1
s
s
2
2
3
Z101 = Y01
+ 32 Ie
0s (P), Z02 = Y02 + 3 I0s (P), Z03
s
s
(P), Z2 = Y2 + 2 Ie
(P), Z3
Z2 = Y2 + 2 Ie
12
12
3 1s
e
32
32
3 3s
e
13
s
3
s
2
(P), Z333 = Y33
+ 34 I3s
= Y22
+ 34 I2s
(P),
e
e
2
= Y0 + Is (P)
03
3 3s
s
3
= Y03
+ 32 Ie
0s (P)
s
s
3
3
(P).
= Y13
+ 32 Ie
(P), Z323 = Y23
+ 32 I2s
1s
e
e
(3.64)
Rozdział 4
Rozwiązania równań falowych
4.1. Funkcje falowe typu elektronowego
Zachodzi sprzeczność między układem równań (3.54–3.55) i układem równań (3.56–3.57), gdyż pierwszy z nich ma nietrywialne rozwiązania, gdy wyznacznik podstawowy jest różny od zera, a drugi z nich ma nietrywialne rozwiązania,
gdy ten sam wyznacznik równa się zeru. Musimy rozpatrzyć wszystkie warunki,
przy których te dwa układy nie są sprzeczne i dają rozwiązania zgodne z wcześniej
ustalonymi wymaganiami. Najprostszym jest przypadek, gdy wyrazy wolne w równaniach (3.54–3.55) znikają. Będzie tak, gdy
3
1
Y11
= Y33
= 0.
(4.1)
0
2
a0 Y11
+ a2 Y11
= 0,
(4.2)
0
2
a0 Y33
+ a2 Y33
= 0.
(4.3)
W ten sposób otrzymujemy
Jednoczesne trywialne rozwiązanie tych równań oraz równań (3.56–3.57) traci sens,
ale trywialne rozwiązania każdego z tych układów z osobna należy rozpatrzyć. Trywialne rozwiązanie układu (3.56–3.57) daje rzeczywiste rozwiązania dla wszystkich βi . Tego przypadku nie będziemy teraz rozpatrywać, gdyż w czasoprzestrzeniach elementarnych b0 , 0 z założenia. Trywialne rozwiązanie a0 = a2 = 0 równań (4.2–4.3) natychmiast upraszcza równania (3.58–3.61), z których otrzymujemy
1
1
3
3
b20 = −Y11
Y00
− Y33
Y00
,
(4.4)
1
1
3
3
Y22
− Y33
Y22
,
b22 = −Y11
(4.5)
0
2
b0 Y00
+ b2 Y00
= 0,
(4.6)
0
2
b0 Y22
+ b2 Y22
= 0.
(4.7)
Związek między stałymi b0 i b2 określa również układ równań (3.56–3.57). Ten układ
oraz układ równań (4.6–4.7) muszą być równoważne, dlatego w tej czasoprzestrzeni
elementarnej mamy cztery równoważne rozwiązania
b2 = −b0
0
Y11
2
Y11
= −b0
0
Y33
2
Y33
37
= −b0
0
Y00
2
Y00
= −b0
0
Y22
2
Y22
.
(4.8)
38
Rozdział 4. Rozwiązania równań falowych
Z równań (4.4–4.5) otrzymujemy
b0 = ±
q
3
3
1
1
−(Y11
Y00
+ Y33
Y00
),
(4.9)
b2 = ±
q
3
3
1
1
−(Y11
Y22
+ Y33
Y22
).
(4.10)
Na podstawie związków (4.8) możemy ostatni wynik zapisać również, między
innymi, w postaci
0 q
Y11
3
3
1
1
−(Y11
Y00
+ Y33
Y00
).
(4.11)
b2 = ∓ 2
Y11
W tej czasoprzestrzeni zachodzi też związek
0 2
1
1
3
3
2 2
1
1
3
3
(Y11
) (Y11
Y00
+ Y33
Y00
) = (Y11
) (Y11
Y22
+ Y33
Y22
).
(4.12)
Na podstawie związków (4.8) możemy wypisać również inne tego typu związki między stałymi Yikl . Zgodnie z zapisem (3.53) stałe b0 , b2 są rzeczywiste. Konieczność
1
dostosowania funkcji falowej do miary prawdopodobieństwa wymaga, aby stała Y11
1
3
była ujemna dla dodatniej wartości współrzędnej x . Podobnie stała Y33 ma być
ujemna dla dodatniej wartości współrzędnej x3 . Pozostałe wielkości Yikl muszą mieć
takie wartości, aby wyrażenia podpierwiastkowe były dodatnie. Na podstawie związków (4.8) możemy określić bezwymiarową wielkość
0 0 0 0 Y11
Y00
Y22
Y33
b2 δe = = = = = .
(4.13)
2 2 2 2 b0
Y11
Y33
Y00
Y22
Wprowadzając oznaczenia
ωe = |b0 | c =
q
3
3
1
1
−(Y11
Y00
+ Y33
Y00
),
ke = |b2 | = δe |b0 | = δe
ωe
1
2π
= δe = δe ,
c
λe
λ
(4.14)
(4.15)
gdzie δe jest określone wzorem (4.13)
1
ε1 = −Y11
> 0,
(4.16)
3
ε3 = −Y33
> 0,
(4.17)
możemy funkcję falową dla tego typu czasoprzestrzeni elementarnej zapisać w postaci
2
3
2
Ψe = e−(ε2 x +ε3 x ) e±i(ke x −ωe t) .
(4.18)
Zostało tu uwzględnione, że funkcje sprzężone również są rozwiązaniami równań
falowych. Taka funkcja falowa opisuje falę płaską, biegnącą w dodatnim kierunku
linii koordynacyjnej x2 . Moduł tej funkcji maleje wykładniczo z odległością od tej
linii. Ze wzoru (4.18) widać, że cząstka elementarna, której czasoprzestrzennym modelem jest opisana tu czasoprzestrzeń elementarna jest cząstką trwałą. Taką cząstką
o prostej, leptonowej strukturze, jest przede wszystkim elektron. To dlatego częstość
39
4.1. Funkcje falowe typu elektronowego
kołowa i liczba falowa opatrzone są indeksem „e”. Istnieją też inne cząstki elementarne, posiadające funkcję falową tego samego typu co elektron. Taką cząstką jest
chociażby neutrino elektronowe, które przyjęto oznaczać symbolem νe . Uogólnimy tę
zasadę oznaczania na pozostałe cząstki elementarne posiadające ten sam typ funkcji
falowej.
Było powiedziane, że numeracja współrzędnych przestrzennych jest przypadkowa, a to dlatego, że rozwiązywaliśmy równania dla dowolnych układów współrzędnych. Stwierdziliśmy jednak, że cząstki elementarne mają wyraźną przestrzenną symetrię centralną. Mamy więc do czynienia z problemem podobnym jak dla pola
Schwarzschilda. Tam są wprowadzane współrzędne „nibysferyczne”. Jeśli posłużymy się również takimi współrzędnymi, to już nie jest obojętne dla których βi przyjmiemy te z góry określone wartości. To dlatego ustalone zostały wielkości β3 oraz β1 .
Gdybyśmy wybrali β2 zamiast β1 , to wzór (4.18) opisywałby falę płaską, biegnącą
w dodatnim kierunku linii koordynacyjnej x1 , która w tym układzie współrzędnych
jest współrzędną radialną r. Wynik (4.18) określałby więc falę wybiegającą z początku układu współrzędnych. Taki punkt byłby źródłem fali. Pojęcie źródła jest
pojęciem hydrodynamicznym, dla którego nie ma uzasadnienia w teorii czasoprzestrzeni. Dlatego taka możliwość została z góry odrzucona. We współrzędnych „nibysferycznych” linia koordynacyjna x2 jest krzywą równoleżnikową x2 = rϕ sin θ,
więc wzór (4.18) określa wirującą falę. Pozwala to wyjaśnić istnienie spinu jako
wirującej fali.
Prędkość liniową przemieszczania się amplitudy tej fali wzdłuż linii koordynacyjnej x2 otrzymamy z przyrównania fazy do zera. Otrzymujemy w ten sposób
x2
ωe
=V= .
t
ke
(4.19)
Jeśli częstość kołowa obiegu tej fali równa się ω, to w płaszczyźnie równikowej, czyli
dla θ = π2 , ta prędkość równa się ωr. Otrzymujemy w ten sposób
ωr =
ωe
.
ke
(4.20)
Na podstawie (4.15) możemy więc napisać
λe
ω
= αe ,
ωe
r
(4.21)
gdzie αe = δ1e jest bezwymiarową stałą określoną wzorem (4.13) za pomocą stałych
określających strukturę geometryczną rozpatrywanej czasoprzestrzeni. Mamy też
V = αe c.
(4.22)
Wszystko wskazuje na to, że αe jest słynną stałą struktury subtelnej elektronu.
Nie przypadkowo prędkość tej fali równa się prędkości światła pomnożonej przez
tę stałą. Byłaby więc to prędkość równa prędkości elektronu na pierwszej orbicie
Bohra w atomie wodoru. Gdy ω = ωe , to ta wielkość określa stosunek promienia
do długości fali dzielonej przez 2π, co możnaby interpretować jako stosunek klasycznego promienia elektronu do jego comptonowskiej długości fali.
40
Zinterpretowania wymaga wzór (4.14) na liczbę falową, który różni się od znanego
wzoru w czasoprzestrzeni euklidesowej tym, że jest wymnożony przez bezwymiarową
β1
wielkość δe określoną wzorem (4.13). Mamy również (4.16) δe = , a to oznacza,
β0
βk xk
że w funkcji falowej e wielkość δe jest stosunkiem czynnika skali współrzędnej przestrzennej x2 , do czynnika skali współrzędnej czasowej x0 . Efekt ten jest równoważny
takiemu zakrzywieniu czasoprzestrzeni, że stosunek obwodu okręgu do promienia
równa się 2πδe .
4.2. Funkcja falowa typu mionowego i taonowego
Musimy wrócić do równań (3.54–3.55), których zerowe rozwiązanie a0 = a1 = 0
prowadzi do pojęcia elektronu jako trwałej cząstki elementarnej oraz innych trwałych cząstek. Dopuszczając niezerowe rozwiązania tych równań, musimy zapewnić
znikanie głównego wyznacznika tego układu, co zapewnia niesprzeczność z układem (3.58–3.59). Znikanie tego wyznacznika jest zapewnione, gdy
0
0
1. Y22
= Y33
= 0,
1
1
2. Y22
= Y33
= 0,
0
1
3. Y22 = Y22 = 0,
0
1
4. Y33
= Y33
= 0,
0
1
1
0
= Y33
= 0.
5. Y22 = Y33 = Y22
W przypadku 1. z równań (3.58–3.59) otrzymujemy, że b1 = 0, a wówczas z równania (3.57) wynika, że również b0 = 0. W przypadku 2. natychmiast mamy b0 = 0.
Obydwa te przypadki należy więc odrzucić. Rozpatrzymy teraz pozostałe trzy przypadki, dla których b0 , 0 oraz b1 , 0. Dla przypadku 3. z równania (3.59) otrzymujemy
Y0
b1 = −b0 33
,
(4.23)
1
Y33
a z równania (3.54) mamy
1 2 2
3
3
) = 0.
Y33
Y22
+ (Y22
2
Postawienie (4.23) do równań (3.56–3.57) daje
(4.24)
0 !
Y33
1 0
1
a0 =
Y − Y00 1 ,
2 00
Y33
(4.25)
!
0
1 1 Y33
0
a1 =
Y 1 − Y11 .
2 11 Y33
(4.26)
Podstawiając te wzory do równania (3.52) otrzymujemy
s
b0 = ±
0
0 !
Y33
1 1 2 (Y33 )2 1 0 2 1 1
1 2 2
3
3
0
1
.
Y00 + Y33
Y00
(Y00 ) 1 2 − (Y00 ) + Y00 Y11 − Y11 1 − Y22
4
4
2
2
(Y33 )
Y33
(4.27)
41
Na podstawie wzoru (4.23) otrzymujemy również
s
0
0 2
0 !
Y33 1 1 (Y33
)
Y33
1 0 2 1 1
1 2 2
3
3
0
1
2
b1 = ∓ 1
(Y00 ) 1 2 − (Y00 ) + Y00 Y11 − Y11 1 − (Y22
Y00 + Y33
Y00
).
4
2
2
Y33 4
(Y33 )
Y33
(4.28)
Podstawienie wzorów (4.25–4.26) do równań (3.53) daje dla tej wielkości wynik
0
1
0
1
Y22
= Y22
= Y33
= Y33
= 0.
(4.29)
Należy wyraźnie zaznaczyć, że nie są to z góry narzucone, dodatkowe warunki na stałe Yikl , a tylko jeden ze sposobów likwidowania sprzeczności między układami równań.
Oznacza to, że wielkości a0 , a1 , b0 , b1 mogą być dowolne ze względu na te dwa układy
równań. Te cztery wielkości możemy więc wyznaczyć tylko z równań (3.52), (3.53),
(3.56), (3.57), które tu dla wygody przepiszemy
1 2 2
3
3
0
1
Y00 + Y33
Y00
) = 0,
a20 − b20 − a0 Y00
− a1 Y00
− (Y22
2
(4.30)
1 2 2
0
1
3
3
a21 − b21 − a0 Y11
− a1 Y11
− (Y22
Y11 + Y33
Y11
) = 0,
2
0
1
2a0 b0 − b0 Y00
− b1 Y00
= 0,
(4.31)
2a1 b1 −
0
b0 Y11
−
1
b1 Y11
= 0.
(4.32)
(4.33)
Natomiast z równań (3.54–3.55) otrzymujemy
1 2 2
3
3
Y33
Y22
+ (Y22
) = 0,
2
(4.34)
1 3 2
2
2
Y22
Y33
+ (Y33
) = 0.
(4.35)
2
Rozwiązywanie układu równań (??) zaczniemy od równań (??). Możemy te równania
zapisać w postaci
1
1 0
1
= 0,
(4.36)
b0 a0 − Y00 − b1 Y00
2
2
1
1 1
0
b0 Y11 − b1 a1 − Y11 = 0.
(4.37)
2
2
Otrzymujemy stąd
0
1
Y11
Y00
1 1
,
(4.38)
a1 − Y11 = 0
2
4 a0 − 12 Y00
0
2 a0 − 12 Y00
b0 .
(4.39)
b1 =
1
Y00
Równania (??) możemy zapisać w postaci
1 0
a0 − Y00
2
2
−
b20
1 1
1 0 1 1 1
2
2
3
3
1
− a1 − Y11 Y00
Y00
+ Y33
Y00
− Y00
− Y11 Y00 + Y22
= 0,
2
4
2
(4.40)
42
2
1 0
1 1 1 0 0
2
2
3
3
0
− − a0 − Y00 Y11
− Y00 Y11 + Y22
Y11
+ Y33
Y11
= 0.
− Y11
2
4
2
(4.41)
Wyprowadzając oznaczenia
1 0
w = a0 − Y00
,
(4.42)
2
1 0 2 1 1 1
2
2
3
3
Y00
+ Y33
Y00
,
(4.43)
− Y11 Y00 + Y22
d0 = − Y00
4
2
1 1 2 1 0 0
2
2
3
3
d1 = − Y11
(4.44)
Y11
+ Y33
Y11
− Y00 Y11 + Y22
4
2
i korzystając ze wzorów (4.38–4.39), możemy równania (4.40–4.41) zapisać jako
1 1
a1 − Y11
2
b21
2
w −
0
1 2
(Y11
Y00
)
16w2
0
1 2
Y11
(Y00
)
(4.45)
b20
−
−
4w2 2
0
b − Y11
w + d1 = 0.
1 2 0
(Y00
)
4w
+ d0 = 0,
(4.46)
Eliminując z tych równań b20 , otrzymujemy równanie
6
4
w + w d0 − w
2
1 2
(Y00
)
4
d1 −
0 2
1 4
(Y11
) (Y00
)
64
= 0.
(4.47)
Oczywiście wskazane jest podstawienie
(4.48)
w2 = u > 0.
Otrzymujemy więc równanie trzeciego stopnia
u3 + u2 d0 − u
1 2
(Y00
)
4
d1 −
0 2
1 4
(Y11
) (Y00
)
64
= 0.
(4.49)
Wielkość w jest rzeczywista, więc liczą się tylko dodatnie rozwiązania równania (4.49). Za pomocą podstawienia
1
u = y − d0
3
(4.50)
przekształcamy to równanie do postaci zredukowanej
y3 + py + q = 0,
(4.51)
gdzie
1
1 1 2
) d1 − d20 ,
(4.52)
p = − (Y00
4
3
2
1 0 2 1 4
1 1 2
) d0 d1 + d30 − (Y11
) (Y00 ) .
(4.53)
q = (Y00
12
27
64
Przed przystąpieniem do rozwiązywania równania (4.51) musimy ocenić stałe
występujące w określeniach współczynników tego równania, gdyż od tego zależy
sposób jego rozwiązywania. Przede wszystkim należy zauważyć, że wielkość
1 2 2
3
3
0
1
Y00 + Y33
Y00
)
b20 = a20 − a0 Y00
− a1 Y00
− (Y22
2
(4.54)
43
wyznaczona z równania (??) oraz wielkość
1 2 2
0
1
3
3
b21 = a21 − a0 Y11
− a1 Y11
− (Y22
Y11 + Y33
Y11
)
2
(4.55)
wyznaczona z równania (??) muszą być dodatnio określone w każdym punkcie, czyli dla każdej wartości stałych Yikl . Ograniczając rozważania do dodatnich wartości
2
3
współrzędnych xi stwierdziliśmy już, że stałe Y22
i Y33
muszą być ujemne, więc stałe
3
3
2
2
Y00 , Y00 , Y11 , Y11 muszą być dodatnie. Mamy więc
2
Y00
> 0,
3
Y00
> 0,
2
Y11
> 0,
3
Y11
> 0.
(4.56)
0
1
1
0
Jeśli z założenia stałe a0 i a1 muszą być ujemne, to stałe Y00
, Y11
, Y00
, Y11
muszą
być dodatnie. Mamy więc
0
Y00
> 0,
1
Y11
> 0,
1
Y00
> 0,
0
Y11
> 0.
(4.57)
Oczywiście dla ujemnych wartości współrzędnych xi wszystkie te stałe muszą być
ujemne. Dla tak dobranych wartości tych stałych, stałe b20 i b21 będą dodatnie, niezależnie od otrzymanych rozwiązań równania (??).
Warunki, jakie powyżej nałożyliśmy, ograniczają ilość rozwiązań. Spowodowane
jest to tym, że zgodnie z wnioskiem (4.57) wielkość w określona wzorem (??) może być dla dodatnich wartości x0 tylko ujemna, podczas gdy wzór (??) dopuszcza
ujemne i dodatnie wartości w niezależnie od znaku współrzędnej x0 . Dlatego pozostawimy wzór (??)bez zmiany, ale będziemy pamiętać, że znak plus rezerwowany jest
0
dla ujemnej wartości współrzędnej x0 . Wtedy oczywiście zmienia się również znak Y11
na ujemny. Otrzymane rozwiązania będą miały postać stabilną, więc cząstki, które
te rozwiązania reprezentują, zaliczamy do stabilnych.
Przed przystąpieniem do rozwiązywania równania (??) wypiszemy też znane wzory wyrażające związek między współczynnikami tego równania i jego rozwiązaniami
y1 + y2 + y3 = 0.
(4.58)
p = y1 y2 + y2 y3 + y3 y1 ,
(4.59)
q = −y1 y2 y3 ,
(4.60)
Zachodzą też związki
y21 + y22 + y23 = −2p,
2
D = (y1 − y2 )(y1 − y3 )(y2 − y3 ) = −4p3 − 27q2 .
(4.61)
y3 + py = −q.
(4.63)
(4.62)
Można wykazać, że gdy wyróżnik D jest dodatni, to równanie (??) ma wszystkie trzy pierwiastki rzeczywiste. Natomiast, gdy D > 0, to jeden pierwiastek jest
rzeczywisty, a dwa pozostałe są zespolone, wzajemnie sprzężone. Równanie (??) rozwiążemy metodą trygonometryczną. W tym celu zapiszemy to równanie w postaci
Stosując podstawienie
r
y=z
4
|p|
3
(4.64)
44
otrzymujemy
r
3
r


4
4


|p| + zp
|p| = −q.
z3 
3
3
3
q
Pomnożenie tego równania przez
|p|
4z3 + 3z
(4.65)
daje
4
|p|
3
p
=C=
|p|
3q
q
|p|
.
(4.66)
4
|p|
3
To równanie możemy w zależności od znaku p zapisać w jednej z dwu możliwych
postaci
4z3 + 3z = C,
(4.67)
4z3 − 3z = C.
(4.68)
4 cos3 α − 3 cos α = cos 3α.
(4.69)
Równanie (4.67) otrzymujemy w przypadku, gdy p > 0. Ten przypadek nas nie interesuje, gdyż ze wzoru (??) wynika, że p jest ujemne. Równanie (4.68) rozwiążemy
w dwóch przypadkach, gdy |C| < 1 oraz gdy C > 1. W pierwszym przypadku otrzymujemy wyróżnik D > 0, a w drugim D < 0. Zajmiemy się najpierw tym pierwszym
przypadkiem, o którym już wiemy, że prowadzi do wszystkich trzech pierwiastków
rzeczywistych. W tym przypadku stosujemy wzór na cosinus kąta potrójnego
Z porównania tego wzoru z równaniem (4.68) wynika, że rozwiązaniem jest
(4.70)
z = cos α
takiego kąta α, dla którego
cos 3α = C,
czyliα =
1
arc cos C.
3
(4.71)
W pełnym zakresie zmienności C kąt α zmienia się więc w zakresie 0 < α < π3 . Ale
2
cos 3α = cos(3α + 2π) = cos 3(α + π)
3
(4.72)
2
cos 3α = cos(3α − 2π) = cos 3(α − π).
3
Mamy więc trzy rozwiązania
z1 = cos α
(4.73)
oraz
2
z2 = cos(α + π),
3
4
2
z3 = cos(α − π) = cos(α + π).
3
3
(4.74)
(4.75)
(4.76)
45
Zgodnie ze wzorem (4.64) mamy więc
r
r
4
4
2
y1 =
|p| cos α,
y2 =
|p| cos(α+ π),
3
3
3
r
y3 =
4
4
|p| cos(α+ π). (4.77)
3
3
Te pierwiastki spełniają równanie (4.58), gdyż zachodzi tożsamość
4
2
cos α + cos(α + π) + cos(α + π) ≡ 0.
3
3
(4.78)
Spełnia się też tożsamość
2
4
3
cos2 α + cos2 (α + π) + cos2 (α + π ≡ .
3
3
2
(4.79)
Korzystając z ostatniej tożsamości można stwierdzić spełnianie się wzoru (4.61).
Oczywiście, po uwzględnieniu, że w tym przypadku |p| = −p. Spełniają się też tożsamości
2
4
sin α + sin(α + π) + sin(α + π) ≡ 0,
(4.80)
3
3
3
4
2
(4.81)
sin2 α + sin2 (α + π) + sin2 (α + π) ≡ .
3
3
2
Ustaliliśmy, że rozwiązania równania (??) muszą być dodatnie, więc ze wzoru (??)
wnioskujemy, że również rozwiązania równania (??) muszą być dodatnie, a nawet
większe od wielkości 13 d0 . Musimy więc ustalić zakresy zmienności rozwiązań (4.77),
gdyż z równania (4.58) wynika, że mogą być najwyżej dwa dodatnie rozwiązania. Jeśli α zmienia się w pełnym zakresie określonym warunkiem (4.71), to rozwiązanie y1
jest w tym zakresie dodatnie, a y2 jest w tym zakresie ujemne, więc nie może być
w ogóle brane pod uwagę. Rozwiązanie y3 jest w tym zakresie i ujemne, i dodatnie.
Zakres zmienności α musimy więc dobrać tak, aby y3 było również tylko dodatnie.
Możemy tego dokonać za pomocą przesunięcia fazowego wielkości α o wartości 61 π.
Na takie przesunięcie pozwala tożsamość (4.78). Rozwiązanie y2 będzie po tym przesunięciu nadal ujemne. Rozwiązania y1 i y3 mają teraz postać
r
4
π
y1 =
|p| cos(α + ),
(4.82)
3
6
r
r
r
4
4
4
π 4
3
y3 =
|p| cos(α + + π) =
|p| cos(α + π) =
|p| sin α.
(4.83)
3
6 3
3
2
3
Sprowadziliśmy w ten sposób te rozwiązania do pierwszej ćwiartki zmienności kąta α, co ułatwi dalszą analizę tych rozwiązań. Przede wszystkim musimy zgodnie
ze wzorem (??) ograniczyć zakres zmienności α tak, aby dla obydwu tych rozwiązań
wielkość u była dodatnia. W ten sposób łatwo znajdujemy, że
√
√
3 d0
3 d0
π
arc sin
(4.84)
p < α < − + arc cos
p .
6
6
6
|p|
|p|
Po tym przesunięciu uwidacznia się zasadnicza różnica między tymi dwoma rozwiązaniami, gdyż y1 jest funkcją parzystą argumentu α+ π6 , a y3 jest funkcją nieparzystą
46
argumentu α. Te funkcje przyjmują te same wartości, ale dla różnych wartości α, czyli
w różnych punktach czasoprzestrzeni. Parzystość rozwiązania y1 sprawia, że cząstka,
którą to rozwiązanie reprezentuje może istnieć również przy ujemnych wartościach
argumentu α + π6 , czyli również dla odpowiedniego zakresu ujemnych α, podczas
gdy rozwiązanie y3 jest dla ujemnych wartości α niedopuszczalne. Jak następnie
stwierdzimy, poza tymi różnicami obie cząstki mają tę samą częstość, czyli te same
masy oraz ten sam czas życia. Są więc pod tym względem nierozróżnialne. Konsekwencjami tego niezwykle ciekawego problemu zajmiemy się później, a teraz zajmiemy się dalszymi ustaleniami dla tych cząstek.
Możemy już wyznaczyć stałe a0 , b0 , a1 , b1 potrzebne do określenia stałych β0 , β1 ,
które są potrzebne do określenia funkcji falowych dla tych dwóch rozwiązań, czyli
dla tych dwóch czasoprzestrzeni elementarnych. Wielkości wyznaczone za pomocą
rozwiązania y3 oznaczymy symbolami a′0 , b′0 , a′1 , b′1 . Ze wzoru (??) oraz wzorów (??)
i (4.82–4.83), otrzymujemy
sr
w1 = −
π
1
4
|p| cos(α + ) − d0 .
3
6
3
(4.85)
Uwzględnione tu zostało, że w dla dodatnich wartości współrzędnej x0 jest ujemne.
Na podstawie wzoru (??) możemy więc wyznaczyć stałą a0
1 0
1 0
a0 = Y00
+ w1 = Y00
−
2
2
sr
4
π
1
|p| cos(α + ) − d0 .
3
6
3
(4.86)
Z równania (??) możemy też wyznaczyć b20
b20
=
w21
−
0
1 2
Y11
(Y00
)
4w1
r
+ d0 =
4
π
2
1
|p| cos(α + ) + d0 + r q
3
6
3
4
0
1 2
Y11
(Y00
)
4
|p| cos(α
3
,
+ π6 ) − 31 d0
(4.87)
więc
v
u
r
u
u
u
u
u
π
2
1
t 4
b0 = ±
|p| cos(α + ) + d0 + r q
3
6
3
4
0
1 2
Y11
(Y00
)
4
|p| cos(α
3
.
(4.88)
.
(4.89)
+ π6 ) − 13 d0
Na podstawie wzoru (??) i (4.86) otrzymujemy
0
1
Y11
Y00
1 1
1
1 1
= Y11
+
− rq
a1 = Y11
1
0
2
4
4(a0 − 2 Y00 ) 2
4
3
0
1
Y11
Y00
|p| cos(α + π6 ) − 13 d0
47
Stałą b1 możemy wyznaczyć za pomocą wzoru (??)
0
2 a0 − 12 Y00
b1 =
b0 =
1
Y00
sr
4
2
π
1
=∓ 1
|p| cos(α + ) − d0
3
6
3
Y00
v
u
r
u
u
0
1 2
u
u
Y11
(Y00
)
u
π
2
1
t 4
.
|p| cos(α + ) + d0 + r q
3
6
3
4
4
|p| cos(α + π6 ) − 13 d0
3
(4.90)
Ten wzór możemy zapisać w postaci
s
rq
q
4
4
0
1 2
|p| cos2 (α + π6 ) + 31 d0 43 |p| cos(α + π6 ) − 29 d20 + 14 Y11
(Y00
)
|p| cos(α + π6 ) − 31 d0 .
b1 = ∓ Y21
3
3
00
(4.91)
Stałe a′0 , b′0 , a′1 , b′1 potrzebne do wyznaczenia funkcji falowej czasoprzestrzeni eler
4
|p| sin α otrzymamy
mentarnej, dla której rozwiązaniem równania (??) jest y3 =
3 π
oczywiście z nieprimowanych wielkości przez zmianę funkcji cos α +
na funk6
cję sin α we wszystkich powyższych wzorach. W ten sposób otrzymujemy
sr
4
1
1 0
−
|p| sin α − d0 ,
(4.92)
a′0 = Y00
2
3
3
v
u
r
u
u
u
u
Y0 (Y1 )2
u
2
1
t 4
′
,
(4.93)
b0 = ±
|p| sin α + d0 + r q 11 00
3
3
4
4
|p| sin α − 13 d0
3
a′1
b′1 = ∓
2
1
Y00
sr
0
1
Y11
Y00
1
1 1
,
= Y11 − r q
2
4
4
|p| sin α − 31 d0
3
(4.94)
v
u
r
u
u
0
1 2
u
Y11
(Y00
)
u
1 u
2
1
4
t 4
|p| sin α − d0
|p| sin α + d0 + r q
.
3
3
3
3
4
4
|p| sin α − 31 d0
3
(4.95)
Ostatni wzór zapiszemy również w postaci:
v
u
sr
t
r
4
4
4
1
2
1 0 1 2
1
2
|p| sin2 α + d0
|p| sin α − d20 + Y11
(Y00 )
|p| sin α − d0 .
b′1 = ∓ 1
3
3
9
4
3
3
Y00 3
(4.96)
48
Dokładniejszą analizę otrzymanych tu wyników przeprowadzimy dopiero po wyznaczeniu parametrów funkcji falowej ostatniego już leptonu, gdyż pozostało jeszcze
tylko jedno możliwe rozwiązanie równania (??).
4.2.1. Funkcja falowa typu lastonowego
To rozwiązanie otrzymamy z równania (4.68) dla przypadku, gdy C > 1. Łatwo
można stwierdzić, że wyróżnik D jest wtedy ujemny, więc istnieje tylko jedno rozwiązanie rzeczywiste i dwa sprzężone rozwiązania zespolone, które nas nie interesują.
Do rozwiązania tego równania można użyć znanej tożsamości.
4 cosh3 α − 3 cosh α = cosh 3α.
(4.97)
Z porównania tego wzoru z równaniem (4.68) wynika, że rozwiązaniem tego równania
jest
z = coshα,
(4.98)
gdzie
1
arccosh C.
(4.99)
3
Na podstawie wzoru (4.64) stwierdzamy więc, że interesującym nas rozwiązaniem
równania (??) jest
r
4
1
y=
|p| cosh arccosh C .
(4.100)
3
3
α=
Stosując związek między cosinusem hiperbolicznym i logarytmem naturalnym, możemy sprowadzić ten wzór do postaci
s
s
r
r
3
1
1 2
1 2
1 3 3 1
1
yλ = − q +
q + p + − q−
q + p3
(4.101)
2
4
27
2
4
27
zgodnej ze wzorem Cardana dla rzeczywistego pierwiastka równania trzeciego stopnia (??) w przypadku ujemnej wartości wyróżnika D. Indeks λ wprowadzamy dla
odróżnienia od innych rozwiązań.
Teraz już możemy wyznaczyć wielkości a0 , b0 , a1 , b1 , co pozwoli określić β0 i β1 ,
a tym samym określić funkcje falowe rozważanego tu przypadku. Dla odróżnienia
od poprzednich dwóch rozwiązań, oznaczymy te stałe symbolami a′′0 , b′′0 , a′′1 , b′′1 .
Wzory na te stałe otrzymamy
(4.86), (4.88), (4.89), (4.2), (4.91), przez
r ze wzorów
4
π
na yλ określone wzorem (4.101)
|p| cos α +
prostą zamianę rozwiązania
3
6
r
1
1
0
a′′0 = Y00
− yλ − d0
(4.102)
2
3
v
u
u
0
1
t
1 Y11 (Y00 )2
2
′′
,
(4.103)
b0 = ± yλ + d0 + q
3
4
1
yλ − 3 d0
49
0
1
1 1
1 Y Y00
a′′1 = Y11
,
− q 11
2
4
1
yλ − 3 d0
v
r
u
u
0
t
1
2
1 Y11 (Y00 )2
1
2
′′
.
b1 = ∓ 1
yλ − d0 yλ + d0 + q
3
3
4
Y00
1
yλ − 3 d0
Ostatni wzór zapiszemy również w postaci
s
r
2
2
1
1
1
0
1 2
b′′1 = ∓ 1
(Y00
)
y2λ + d0 yλ − d20 + Y11
yλ − d0 .
3
9
4
3
Y00
(4.104)
(4.105)
(4.106)
Chcąc przypisać trzy osobne rozwiązania odpowiednim cząstkom, musimy te rozwiązania ze sobą porównać. Będziemy kierowali się żądaniem, aby znana już cząstka,
czyli taon miała mniejszą częstość fali niż jeszcze nieznane leptony.

v

 u
u
t
0
1
2


Y
(Y
)
2
1
00
11

(4.107)
ωτ = |b0 |c = c  y1 + d0 − q

3
4


1
y1 − 3 d0
jako częstość kołową fali cząstek typu taonowego, która jest mniejsza od częstości
kołowej fali cząstek typu lastonowego
v

 u

u
0
1
 t
1 Y11 (Y00 )2 
2

 .
ωλ = |B0 |c = c  y1 + d0 − q
(4.108)

3
4

1

y1 − d0
3
Podobnie jak dla cząstek typu mionowego określamy średni czas życia cząstek typu
taonowego
r



 1 0
1
στ = −a0 c = −c  Y00 + y1 − d0  > 0
(4.109)
2
3
oraz średni czas życia cząstek tupu lastonowego
r



 1 0
1
σλ = −A0 c = −c  Y00 − y1 − d0  > 0.
2
3
(4.110)
Średni czas życia cząstek typu lambdonowego jest więc krótszy niż cząstek typu
taonowego. Wprowadzamy, podobnie jak dla funkcji falowych typu elektronowego
i mionowego, oznaczenia
kτ = |b1 | = δτ |b0 | = δτ
ωτ 2πδτ
=
c
λτ
0
1
1 1
1 Y Y00
τ1 = −a1 = − Y11
> 0,
− q 11
2
4
1
y1 − 3 d0
(4.111)
(4.112)
50
1 2
,
τ2 = − Y22
2
(4.113)
1 3
τ3 = − Y33
,
2
(4.114)
gdzie
2
δτ = 1
Y00
r
1
y1 − d0
3
(4.115)
jest stałą struktury subtelnej taonu. Stosując powyższe oznaczenia, możemy funkcję
falową typu taonowego zapisać w postaci
k
α −δ t
τ
Ψτ = eβk x = e−τα x
1
e±i(kτ x −ωτ t) ,
gdzie α = 1, 2, 3.
(4.116)
Dla funkcji falowych typu lambdonowego wprowadzamy oznaczenia
kλ = |B1 | = δλ |B0 | = δλ
ωλ 2πδλ
,
=
c
λλ
0
1
1 Y11 Y00
1 1
λ1 = −A1 = − Y11 + q
,
2
4
y1 − 31 d0
(4.117)
(4.118)
1 2
,
λ2 = − Y22
2
(4.119)
1 3
,
λ3 = − Y33
2
(4.120)
gdzie
2
δλ = 1
Y00
r
1
y1 − d0
3
(4.121)
jest stałą struktury subtelnej lambdonu. Stosując powyższe oznaczenia, możemy
funkcję falową typu lambdonowego zapisać w postaci
k
α −σ
Ψλ = eβk x = e−λα x
λt
e±(kλ x −ωλ t) ,
l
(4.122)
gdzie α = 1, 2, 3.
Widać, że taon i tetaon są cząstkami bliźniaczymi. Różnią się tylko częstością fali
funkcji falowej i średnim czasem życia. Można powiedzieć, że tetaon jest po prostu
ciężkim taonem.
4.2.2. Lokalna i wzdłużna afiniczność
Do pojęcia koneksji dochodzi się w przestrzeniach afinicznych, przy nieliniowych
transformacjach układów współrzędnych. W przestrzeniach afinicznych można więc
za pomocą transformacji współrzędnych uczynić ją równą zeru w całej przestrzeni.
Przyjmując nazwę koneksja lokalnie afiniczna, żądamy, aby lokalnie miała ona takie
własności jak koneksja w przestrzeniach afinicznych. Możliwość spełnienia warunku
51
lokalnej afiniczności daje wzór transformacyjny (1.44). Rozkładając tam koneksję
afiniczną na część symetryczną i antysymetryczną otrzymujemy
k
ν
l
∂2 xi ∂x̄ν
ν
i ∂x̄ ∂x ∂x
ν
+ Īαβ
+
I
= Ikli
Īαβ
+
.
(4.123)
kl
i ∂x̄α ∂x̄β
∂x
e
e
Z porównania części symetrycznych i antysymetrycznych po obu stronach tej równości wynika, że wzór (1.44) jest w istocie sumą dwóch wzorów. Jednym z nich jest
wzór (1.46), a drugi ma postać
∂xk ∂xl
∂2 xi ∂x̄ν
+
.
=
∂x ∂x̄α ∂x̄β ∂x̄α ∂x̄β ∂xi
Ten wzór możemy w prosty sposób przekształcić do postaci
!
ν
∂2 x̄ν ∂xk ∂xl
i ∂x̄
ν
Īαβ = Ikl i − k l
.
∂x
∂x ∂x ∂x̄α ∂x̄β
ν
Īαβ
ν
i ∂x̄
Ikl i
(4.124)
(4.125)
Ze wzoru (1.56) wynika, że można określić warunki, aby czasoprzestrzeń lub wybrana podczasoprzestrzeń była afiniczna. Wymaga to, aby w odpowiednim układzie
współrzędnych część symetryczna koneksji równała się zeru w całej czasoprzestrzeni
lub w wybranej podczasoprzestrzeni. Dlatego określenie tych warunków wyniknie
ze znikania części symetrycznej koneksji. Ze wzoru (1.57) wnioskujemy, że warunkiem wystarczającym znikania części symetrycznej koneksji w tym układzie jest
całkowalność równania
∂x̄ν i
∂2 x̄ν
I = 0.
(4.126)
−
Różniczkując to równanie i podstawiając drugą pochodną wyznaczoną z równa∂3 x̄ν
∂3 x̄ν
nia (1.58), możemy na podstawie równości s k l = k s l otrzymać równa∂x ∂x ∂x
∂x ∂x ∂x
nie
∂x̄ν i
i
i t
i t
−
I
+
I
(4.127)
I
I
−
I
I
st
kl
kt sl = 0.
∂xi lk,s ls,k
Wielkość w nawiasie jest tensorem, więc jeśli równa się zeru w jednym układzie
współrzędnych, to równa się zeru w każdym układzie współrzędnych. Jeśli więc
i
i
Silks = Ilk,s
− Ils,k
+ Isti Iklt − Ikti Islt = 0,
(4.128)
to równanie (1.59) spełnia się dla dowolnej transformacji współrzędnych. Tensor Silks
jest tensorem krzywizny utworzonym ze składowych symetrycznej części koneksji.
Dla odróżnienia od tensora krzywizny Rilks , określonego wzorem (1.43), będziemy go
nazywać tensorem ugięcia. Jeśli uwzględnimy założone wcześniej znikanie torsji,
to ten warunek sprowadza się do znikania tensora krzywizny. W całej czasoprzestrzeni ten warunek (z założenia) nie może być spełniony. Pozostaje więc rozpatrzenie
spełnienia tego warunku w różnych jej podczasoprzestrzeniach. Ale w nieafinicznych
czasoprzestrzeniach zapewnienie możliwości różniczkowania daje już sama lokalna
afiniczność, czyli w każdym, dowolnie wybranym, ale ustalonym punkcie P jako
najprostszej podczasoprzestrzeni. Sprowadza się to do problemu rozwiązania równań (1.58) w postaci
∂x̄ν i
∂2 x̄ν
−
(4.129)
I (P) = 0.
Rozdział 5
Kwarki. Uwagi ogólne
Otrzymane rozwiązania szczególne równań falowych
x̄ν = Kν eai x e±i(b1 x −b0 x )
i
2
0
(5.1)
są funkcjami zespolonymi. Posługiwanie się współrzędnymi zespolonymi nie jest
czymś nowym, gdyż jest stosowana tzw. kompleksyfikacja czasoprzestrzeni. Takie
rozwiązanie można by interpretować podobnie jak w mechanice kwantowej jako
prawdopodobieństwo, że lokalna afiniczność czasoprzestrzeni elementarnej jest realizowana w punkcie o współrzędnych (x0 , x1 , x2 , x3 ). Oczywiście miarą tego prawdopodobieństwa byłby wówczas kwadrat modułu odpowiednio unormowanych funkcji (5.1).
Istnienie rozwiązań zespolonych (5.1) wzbogaca strukturę czasoprzestrzeni i prowadzi do problemu istnienia pochodnej zespolonej, a tym samym również do rozwiązań
w postaci funkcji analitycznych. Nie można też pominąć możliwości istnienia rozwiązań dwuokresowych w postaci funkcji Weierstrassa i innych funkcji eliptycznych.
Prowadzi to do istnienia cząstek rezonansowych i objaśnienia w ten sposób znanej klasyfikacji Reggego dla tych cząstek. Możemy uniknąć zespolonych rozwiązań
równań falowych, przyjmując jako dwa niezależne rozwiązania.
i
i
(5.2)
oraz
x̄ν = Kν eai x sin b2 x2 − b0 x0
x̄ν = Kν eai x cos b1 x1 − b0 x0
Rozwiązania (transformacje) (5.1) lub (5.2) powinny lokalnie spełniać te warunki,
jakie spełniają współrzędne kartezjańskie w czasoprzestrzeni afinicznej w każdym
jej punkcie. Jeśli jednak w czasoprzestrzeni afinicznej koneksja znika we współrzędnych kartezjańskich w każdym jej punkcie, to znika również wzdłuż linii geodezyjnych, którymi są linie proste. W rozpatrywanych przez nas czasoprzestrzeniach
współrzędne x̄ν mają więc realizować nie tylko znikanie części symetrycznej koneksji
w dowolnym, ustalonym punkcie, ale również wzdłuż dowolnej, ale ustalonej linii
geodezyjnej. Własność znikania częsci symetrycznej koneksji wzdłuż wybranej krzywej będziemy nazywali wzdłużną afinicznością. W czasoprzestrzeniach typu cząstki
powinno to mieć miejsce wzdłuż krzywej typu czasowego. Każda krzywa gładka tego typu, o nieograniczonej długości, może być czasową linią koordynacyjną x0 . Dlatego żądamy, aby we współrzędnych x̄ν znikała część symetryczna koneksji wzdłuż
linii geodezyjnej, będącej również linią koordynacyjną x0 .
Łatwo widzieć, że w rozpatrywanych czasoprzestrzeniach wzdłużna afiniczność
nie jest realizowana, gdyż wszystkie funkcje pola, a więc również składowe części symetrycznej koneksji są wzdłuż tej linii funkcjami uwikłanymi funkcji (5.2), są więc
wzdłuż tej linii funkcjami periodycznymi współrzędnej x0 . W ten sposób składowe
53
54
Rozdział 5. Kwarki. Uwagi ogólne
części symetrycznej koneksji nie mogą być wielkościami stałymi wzdłuż tej krzywej. W szczególności nie mogą być równymi zeru. Wynika stąd, że współrzędne x̄ν
nie w pełni spełniają w czasoprzestrzeni nieafinicznej tę samą rolę co współrzędne
kartezjańskie w czasoprzestrzeni afinicznej.
Chociaż współrzędne x̄ν nie realizują wzdłużnej afniniczności, to istnieje bardzo
prosty sposób na utworzenie czasoprzestrzeni, w której realizowana jest wzdłużna
afiniczność. Aby na początku zbytnio problemu nie komplikować, rozważmy rozwiązanie (5.2) dla przypadku, gdy a0 = 0. Dla takiego rozwiązania, wzdłuż linii
koordynacyjnej x0 , otrzymujemy
x̄ν = Kν cos(b0 x0 ).
(5.3)
Takie rozwiązanie jest cyklicznie zmienne w czasie, ale jest trwałe. Dopuśćmy również istnienie czasoprzestrzeni, w której lokalną afiniczność realizują współrzędne
i
ξ̄ν = Kν eci ξ cos(d1 ξ1 − d0 ξ0 )
(5.4)
oraz czasoprzestrzeni, w której lokalną afiniczność realizują współrzędne
i
η̄ν = Kν e gi η cos(h2 η2 − h0 η0 ).
(5.5)
Liniowe transformacje nie zmieniają postaci równań falowych. Dlatego dokonajmy
teraz prostej liniowej transformacji układu współrzędnych
ξ0 =
b0 0 2π
x +
,
d0
3d0
(5.6)
b0 0 4π
x +
,
(5.7)
h0
3h0
pozostawiając resztę współrzędnych bez zmian. Niech też te dwie czasoprzestrzenie
będą tego samego rodzaju, co pierwsza, tzn. że c0 = g0 = 0. Są to również czasoprzestrzenie cyklicznie zmienne w czasie, ale trwałe. W czasoprzestrzeni będącej sumą
tych trzech czasoprzestrzeni, wzdłuż linii koordynacyjnej x0 , otrzymujemy
4
2
0
ν
ν
ν
ν
ν
0
0
ȳ = x̄ + ξ̄ + η̄ = K cos b0 x + cos b0 x + π + cos b0 x + π ≡ 0. (5.8)
3
3
η0 =
W takiej czasoprzestrzeni wzdłuż wspólnej linii koordynacyjnej x0 funkcje pola
są stałe. Stałe są więc również części symeryczne koneksji, które możemy zawsze
uznać za równe zeru. Tak więc w takiej czasoprzestrzeni współrzędne realizujące
lokalną afiniczność spełniają wzdłuż linii koordynacyjnej x0 tę samą rolę, co współrzędne kartezjańskie w czasoprzestrzeni afinicznej. W takich czasoprzestrzeniach
operacja różniczkowania jest dobrze określona. Prawa fizyczne w takich czasoprzestrzeniach mogą być formułowane za pomocą równań różniczkowych. Takie czasoprzestrzenie mogą być obserwowane bezpośrednio w eksperymentach. Poszczególne
składowe czasoprzestrzenie nie spełniają tych warunków, więc nie mogą samodzielnie
istnieć. Oczywiście, dla drugiego z rozwiązań (5.2) otrzymamy takie same wyniki.
Podobnie, wystarczy założyć istnienie czasoprzestrzeni będącej sumą dwóch czasoprzestrzeni, mających wspólną linię koordynacyjną x0 , ale mających wzdłuż tej
55
linii przesunięcie fazowe o π. Niech x̄ν oraz ξ̄ν będą współrzędnymi określonymi
wzorami, odpowiednio (5.2) i (5.4) z tym samym założeniem, że a0 = c0 = 0. Dokonując transformacji
π
b0
(5.9)
ξ 0 = x0 + ,
d0
d0
otrzymujemy
h
i
ȳν = x̄ν + ξ̄ν = Kν cos(b0 x0 ) + cos(b0 x0 + π) ≡ 0.
(5.10)
Tak samo jak w poprzednim przypadku realizowana jest wzdłużna afiniczność
wzdłuż całej linii koordynacyjnej x0 . Oczywiście, podobne wyniki otrzymamy
dla drugiego z rozwiązań (5.2).
To te składowe czasoprzestrzenie nazwano kiedyś kwarkami. I próżno szukano ich
samodzielnego istnienia, bo wszystkie rozwiązania równań (5.1) i (5.2) nie spełniają
podstawowego warunku, jakim jest afiniczność wzdłuż wybranej całej krzywej typu
czasowego. W ten sposób możemy stwierdzić, że wszystkie cząstki elementarne muszą
składać się z kwarków, gdyż tylko taka struktura umożliwia korzystanie z tożsamości
trygonometrycznych (5.8) i (5.10). Rozważyliśmy dla uproszczenia tylko rozwiązania
ze stałymi a0 = c0 = g0 = 0. W ogólniejszym przypadku można również dobrać odpowiednie transformacje liniowe tak, aby możliwe było korzystanie z tożsamości (5.8)
i (5.10). Stałe ai oraz bi występujące w rozwiązaniu (5.2) zależą od składowych
części symetrycznej odpowiedniej koneksji, określonej w rozpatrywanym punkcie P.
W trzecim rozdziale stwierdziliśmy, że istnieje osiem różnych rodzajów koneksji. Wynika stąd, że istnieje osiem rozwiązań typu (5.2), różniących się rodzajami koneksji.
Istnieje więc również osiem rodzajów kwarków. Tylko struktura kwarkowa pozwala realizować wzdłużną afiniczność czasoprzestrzeni elementarnych, więc wszystkie
cząstki elementarne muszą mieć strukturę kwarkową. Jeśli fizycy pozwolili sobie
na wprowadzenie zmysłowych nazw dla odróżniania kwarków w postaci kolorów
i zapachów, to można by dalej bawić się w tego typu nazewnictwo. Jeśli kwarki są kolorowe i pachnące, to mogłyby mieć osiem różnych smaków. Jestem jednak przeciwny
wprowadzaniu do fizyki tego typu nazw. Realizacja lokalnej i wzdłużnej afiniczności
przez różne rodzaje koneksji jest odpowiedzialna za istnienie cząstek elementarnych
pozbawionych określonych oddziaływań. Przykładowo, jeśli realizuje to koneksja
1 it
i
i
s
s
Łkl = Γkl − γ gkt Ils + glt Iks ,
(5.11)
3
ee ee
to takie cząstki nie oddziaływują silnie. Takie cząstki nazywa się (obecnie) leptonami. Trzeba tu jeszcze raz podkreślić, że takie cząstki nie są całkowicie pozbawione
silnego oddziaływania, że jest ono w tych cząstkach tylko na tyle mocno osłabione,
że stosowanymi obecnie metodami nie jest wykrywalne.
Wymienione wyżej przykłady (5.3–5.5) zastosujemy najpierw do kwarków, w których lokalną afiniczność realizuje koneksja właściwa, czyli Γikl . Takie kwarki nazywać będziemy kwarkami Γ. W cząstkach elementarnych składających się z takich
kwarków dominującymi są oddziaływania silne, elektromagnetyczne i słabe. Tylko
grawitacja, tak jak w każdym przypadku, jest (z założenia) bardzo osłabiona. To tego
(i tylko tego) rodzaju kwarki są obecnie uznane przez fizyków. Pozostałe siedem rodzajów kwarków nie są im znane , ale mają z nimi do czynienia w eksperymentach,
56
co miesza szyki wszelkich prób usystematyzowania zbioru cząstek elementarnych
i stworzenia jakiejś sensownej teorii tych cząstek. Zauważmy, że zgodnie ze wzorem
1 i s
1 it
s
s
i s
i
i
it
s
s
Ikl = Γkl + γ gks Ilt + gls Ikt − γ gkt Ils + glt Iks − δk Ils + δl Iks ,
(5.12)
3
3
ee ee
ee ee
e
e
cześć symetryczną koneksji antykwarka otrzymujemy z tego wzoru przez podstawienie e
Ikli = Ilki , czyli
1 it
1 i s
i
it
s
s
i
s
s
i s
e
Ikl = Γkl − γ gks Ilt + gls Ikt + γ gkt Ils + glt Iks + δk Ils + δl Iks .
(5.13)
3
3
ee ee
ee ee
e
e
i
Przy tej samej koneksji Γkl należy też uwzględnić istnienie kwarków odwrotnych,
⌢
to znaczy takich, w których tensor g ik = gki . W takich kwarkach część symetryczną
koneksji określa wzór
⌢
1 it
1 i s
it
i
s
s
s
s
i s
i
Ikl = Γkl − γ gks Ilt + gls Ikt + γ gkt Ils + glt Iks − δk Ils + δl Iks .
(5.14)
3
3
ee ee
ee ee
e
e
Przy tej samej koneksji Γikl należy też uwzględnić istnienie również antykwarków
⌢
odwrotnych, to znaczy takich, w których e
Ikli = Ilki oraz g ik = gki . W takich kwarkach
część symetryczną koneksji określa wzór
⌢
1 i s
1 it
s
s
i s
s
i
it
s
i
e
(5.15)
Ikl = Γkl + γ gks Ilt + gls Ikt − γ gkt Ils + glt Iks + δk Ils + δl Iks .
3
3
ee ee
ee ee
e
e
Koneksja antykwarka odwrotnego różni się od koneksji kwarka tylko znakiem ostatniego członu, czyli tylko znakiem tensora oddziaływań słabych.
Istnieją więc kwarki i kwarki odwrotne. Taką parę kwarków nazywać będziemy
generacją. Z porównania wzorów (5.13) i (5.14) wynika, że w kwarku odwrotnym
tensor oddziaływania silnego oraz tensor oddziaływania elektromagnetycznego mają
przeciwny znak niż kwark, natomiast tensor oddziaływania słabego jest tego samego
znaku. Kwarki oraz cząstki składające się z kwarków trwałych, w których lokalna
afiniczność realizowana jest przez koneksję właściwą Γikl , nazwiemy pierwszą generacją. Kwarki należące do tej generacji nazwiemy kwarkami górnymi (up). Kwarki
odwrotne należące do tej generacji nazwiemy kwarkami dolnymi (down). Oznaczymy je odpowiednio, przez „u” oraz „d”.
Interesujące jest, że spośród cząstek składających się z kwarków trwałych, tylko
protony są cząstkami trwałymi. Neutrony ze średnim czasem życia 0, 917 · 103 sek
ulegają rozpadowi na proton, elektron i antyneutrino elektronowe ν̄e . Żadna ze znanych koncepcji teoretycznych nie umie wytłumaczyć, dlaczego cząstka składająca się
z kwarków trwałych nie jest trwała. W ramach tej teorii postaramy się teraz tę dziwną sytuację wyjaśnić.
Wyżej stwierdziliśmy, że prawdziwie elementarnymi cząstkami są tylko kwarki.
Wszystkie cząstki dotychczas nazywane elementarnymi są tworami złożonymi z odpowiednich kwarków. Trzeba więc uwzględniać, że własności cząstek będących sumą
odpowiednich kwarków wynikają z własności linii geodezyjnej wiążącej kwarki. Z kolei własności tej linii zależą od własności poszczególnych kwarków wzdłuż tej linii.
57
Poza tą linią, we własnych układach współrzędnych, kwarki zachowują swoje indywidualne własności. To dlatego w protonie stwierdza się istnienie ładunku ujemnego
obok dwóch ładunków dodatnich.
Równania linii geodezyjnych czasoprzestrzeni, więc również kwarków, określa
wzór (3.7) z rozdziału trzeciego.
k
k
k
l
l
l
2 it
2 r dxk dxi
2 r dxk dxi
d2 xi
i dx dx
it
s dx dx
r dx dx
+
Γ
+
2γ
g
I
−
γ
g
I
−
I
=
±
Ikr
.
ks
kt
kl
lt
lr
kr
ds2
ds ds
3e
ds ds
e e ds ds 3
e e ds ds 3 e ds ds
(5.16)
Wprowadzamy naturalny parametr s, gdyż dla kwarków z założenia ds = γik dxi dxk ,
0. Te równania możemy zapisać w postaci
gdzie
k
k
l
l
d2 xi
2 it
dxk 2 dxi
2 dxi
i dx dx
it
s dx dx
+
Γ
+
2γ
g
I
−
γ
g
q
−
q
=
±
q ,
ks lt
kt
kl
ds2
ds ds
3 ds
3 ds
e e ds ds 3
e ds
(5.17)
dxl
(5.18)
q = q(s) = Ilrr
ds
e
jest wielkością skalarną, którą nazywać będziemy ładunkiem słabym. Periodyczna
zależność współrzędnych x̄ν od współrzędnej x0 powoduje, że kwarkom nie można
przypisać stałych wartości ładunków, takich jak + 32 i − 13 . Takie stałe wartości można
„przydzielić” kwarkom tylko jako amplitudy ładunków. Jeśli w cząstce trójkwarkowej, zgodnie ze wzorem (5.8) wprowadzimy nazwy:
— czerwony, dla kwarka nieprzesuniętego fazowo,
— zielony, dla kwarka przesuniętego o 32 π,
— niebieski, dla kwarka przesuniętego o 34 π,
to widzimy, że takie ustalenie jest tylko chwilowe, że kwarki zmieniają swój kolor
w czasie. Fizycy wprowadzili pojęcie koloru, jako dodatkową kwantową wielkość,
umożliwiającą rozróżnianie cząstek będących w stanie podstawowym, opisywanym
przez symetryczną funkcję falową. Tu widać, że pojęcie koloru nie ma istotnego
znaczenia.
Z postaci równań (5.14) wynika, że możemy przyjąć takie ustalenie, które zgadza się z doświadczalnym ustaleniem, że tylko lewoskrętne cząstki oraz prawoskrętne
antycząstki oddziałują słabo. Musimy w tym miejscu ustalić, co rozumiemy przez pojęcie skrętności cząstki elementarnej. Powszechnie uważa się, że cząstki elementarne
posiadają wewnętrzny moment pędu nazywany spinem. Sugeruje to, że spin zależy
od masy. Wiemy jednak, że tak nie jest, że przykładowo elektron i mion posiadają
taki sam spin równy 21 ~. Do braku konsekwencji fizyka cząstek elementarnych już nas
przyzwyczaiła. Tłumaczy się to zazwyczaj niezwykłością tych elementarnych tworów. Prezentowana teoria w takich przypadkach odkrywa jakiś brak wiedzy o tych
cząstkach. Również w tym przypadku musimy wprowadzić istotne uściślenie pojęcia
skrętności cząstki elementarnej.
Pojęcie skrętności przypisuje się krzywym. Nie można mówić o lewej, czy też
prawej skrętności całej rozpatrywanej czasoprzestrzeni. Dlatego, gdy zapisujemy
równanie linii geodezyjnej kwarka, to musimy ustalić, czy ma to być lewoskrętna,
czy też prawoskrętna linia geodezyjna. Następnie wskazana jest przyjęta w rozdziale
trzecim zasada, że znak „plus” w równaniach tych linii mają geodezyjne lewoskrętne w czasoprzestrzeniach oraz prawoskrętne w antyczasoprzestrzeniach, natomiast
58
znak „minus” mają geodezyjne prawoskrętne w czasoprzestrzeniach oraz lewoskrętne
w antyczasoprzestrzeniach. Jeśli więc mówimy, że kwark jest lewoskrętny, to nie mamy na myśli jakiegoś bąka wirującego w lewo, a tylko to, że w równaniach (5.16) lewoskrętnych linii geodezyjnych tego kwarka zapisujemy znak „plus”. Prawoskrętnym
kwarkiem nazywać będziemy takie kwarki, których linie geodezyjne mają znak „minus”. Dla antykwarków, czyli takich kwarków, w których koneksją pełną jest e
Ikli = Ilki ,
należy zmienić te znaki na przeciwne. Jest to tylko czysto formalna umowa. Oczywiście, konsekwencją takiej umowy będzie istnienie, bądź nieistnienie, oddziaływania
słabego w równaniach linii geodezyjnych kwarków. W układzie złożonym z kwarków
będą więc występować zarówno lewoskrętne jak też prawoskrętne linie geodezyjne.
Natomiast o skrętności takiego układu i o istnieniu oddziaływania słabego możemy
mówić tylko w odniesieniu do linii geodezyjnej wiążącej kwarki. Będzie to zależało od skrętności kwarków wzdłuż tej linii. Dlatego musimy wypisać równania linii
geodezyjnych różnych odmian kwarków. W ten sposób z równań (5.17), dla lewoskrętnego kwarka uL otrzymujemy
k
k
l
l
2 it
dxk 4 dxi
d2 xi
i dx dx
it
r dx dx
+
Γ
+
2γ
g
I
−
γ
g
q
= q ,
kr lt
kt
kl
ds2
ds ds
3 ds
e e ds ds 3
e ds
(5.19)
k
k
l
l
d2 xi
2 it
dxk
i dx dx
it
r dx dx
+
Γ
−
2γ
g
I
+
γ
g
q
= 0.
kr lt
kt
kl
ds2
ds ds
e e ds ds 3
e ds
(5.20)
k
k
l
l
2 it
dxk
d2 xi
i dx dx
it
r dx dx
+
Γ
+
2γ
g
I
−
γ
g
q
= 0,
kr lt
kt
kl
ds2
ds ds
e e ds ds 3
e ds
(5.21)
k
k
l
l
2 it
dxk
4 dxi
d2 xi
i dx dx
it
r dx dx
+ Γkl
− 2γ gkr Ilt
+ γ gkt q
=− q .
ds2
ds ds
3 ds
e e ds ds 3
e ds
(5.22)
a dla lewoskrętnego antykwarka ūL mamy
Natomiast dla prawoskrętnego kwarka uP otrzymujemy
a dla prawoskrętnego antykwarka ūP mamy
Natomiast dla lewoskrętnego kwarka dL otrzymujemy
k
k
l
l
d2 xi
2 it
dxk 4 dxi
i dx dx
it
r dx dx
+
Γ
−
2γ
g
I
+
γ
g
q
= q ,
(5.23)
kr
kt
kl
lt
ds2
ds ds
3 ds
e e ds ds 3
e ds
a dla prawoskrętnego kwarka dP oraz lewoskrętnego antykwarka d¯L otrzymujemy
k
k
l
l
2 it
dxk
d2 xi
i dx dx
it
r dx dx
+
Γ
−
2γ
g
I
+
γ
g
q
= 0,
kr lt
kt
kl
ds2
ds ds
e e ds ds 3
e ds
(5.24)
d2 τ 4
dτ
= q(s) ,
2
ds
3
ds
(5.25)
Można dobrać parametr τ spełniający równanie
względem którego prawa strona w równaniu (5.18) równa się zeru. Taki parametr
nazywa się parametrem afinicznym. Względem tego parametru równania (5.18) zapisują się w postaci
k
k
l
l
2 it
dxk
d2 xi
i dx dx
it
r dx dx
+ Γkl
+ 2γ gkr Ilt
− γ gkt q
= 0,
dτ2
dτ dτ
e e dτ dτ 3
e dτ
(5.26)
59
Całkując równanie (5.26) dla całki pierwszej otrzymujemy
R
4
dτ
3
= κe qds ,
ds
(5.27)
gdzie κ jest stałą dowolną, czyli drugim parametrem obok parametru naturalnego s.
Parametr afiniczny τ jest więc funkcją od dwóch parametrów τ = τ(κ, s).
Na podstawie równań (5.18), dla lewoskrętnego kwarka uL , równania linii geodezyjnych we współrzędnych x̄ν oraz względem parametru s mają postać
λ
λ
λ
κ
κ
κ
d2 x̄ν
2 ντ
4 ρ dx̄κ dx̄ν
ρ dx̄ dx̄
ρ dx̄ dx̄
ν dx̄ dx̄
ντ
+
Γ̄
+
2
γ̄
−
γ̄
=
Ī
, (5.28)
ḡ
ḡ
Ī
Ī
κρ
κτ
κλ
λτ ds ds
λρ ds ds
ds2
ds ds
3
3 κρ ds ds
e
e e
e
e
a dla prawoskrętnego kwarka uP , na podstawie (5.19), mamy
κ
λ
λ
λ
κ
κ
2 ντ
d2 x̄τ
ρ dx̄ dx̄
ρ dx̄ dx̄
ν dx̄ dx̄
ντ
+
Γ̄
−
2
γ̄
−
γ̄
= 0.
ḡ
ḡ
Ī
Ī
κρ
κτ
κλ
λτ
λρ
ds2
ds ds
3
e e ds ds
e e ds ds
(5.29)
Dla lewoskrętnego antykwarka ūL , na podstawie równania (5.23), mamy
κ
λ
λ
λ
κ
κ
d2 x̄ν
2 ντ
4 ρ dx̄κ dx̄ν
ρ dx̄ dx̄
ρ dx̄ dx̄
ν dx̄ dx̄
ντ
+
Γ̄
−
2
γ̄
+
γ̄
=
−
Ī
. (5.30)
ḡ
ḡ
Ī
Ī
κρ
κτ
κλ
λτ
λρ
ds2
ds ds
3 κρ ds ds
e e ds ds
e e ds ds 3
e
Dodatek A
Geneza pojęć przestrzeni i czasu
Sukces Ogólnej Teorii Względności w geometryzacji oddziaływania grawitacyjnego
zachęcił wielu fizyków do poszukiwań tzw. teorii wszystkiego. Było to w czasach,
gdy to oznaczało geometryczną unifikację grawitacji i elektromagnetyzmu, gdyż oddziaływania silne i słabe nie były jeszcze znane. Obecnie również są fizycy, którzy w geometrycznej unifikacji wszystkich oddziaływań widzą szanse na rozwiązanie
trudnych problemów w fizyce. Powstaje natychmiast pytanie: dlaczego geometryzacja ma być panaceum na dolegliwości fizyki współczesnej. Prezentowana tu teoria
wykazuje, że modele czasoprzestrzenne, a więc geometryczne, wszystkich zjawisk
i obiektów Natury, przedstawiają prawdziwy ich obraz. Wytłumaczenie, dlaczego tak
się dzieje, wymaga zgłębienia przynajmniej podstaw mechanizmu postrzegania otoczenia przez człowieka.
Przyzwyczailiśmy się traktować Wszechświat jako obiektywnie istniejące ciała materialne, umieszczone w obiektywnie istniejącej przestrzeni, niczym rodzynki
w cieście. Bierze się to stąd, że w naszych wrażeniach zmysłowych obiekty materialne prezentują się nam w takiej właśnie, przenikliwej i nienamacalnej szacie.
Z pojęciem przestrzeni łączy się w jakiś tajemniczy sposób inny — równie tajemniczy i nienamacalny twór — czas. W życiu codziennym, wykonując różne czynności,
nie analizujemy istoty pojęć przestrzeni, czasu i materii oraz ich wzajemnego powiązania. Fizyków taka analiza obowiązuje i dlatego powinni szukać odpowiedzi,
między innymi, na następujące proste pytanie: dlaczego obiekty materialne mają
tę samą własność rozciągłości, co sama przestrzeń?
W tym pytaniu kryje się jeden z najbardziej podstawowych problemów poznania.
Stąd następne pytanie. Poznania czego i przez kogo? — To człowiek jako obserwator
(w najszerszym sensie tego słowa) ma poznać siebie i swoje otoczenie. To człowiek,
czy też cała ludzka cywilizacja jako część (drobna część) Wszechświata, stoi przed zadaniem poznania całego Wszechświata.
Powstaje natychmiast jeszcze bardziej podstawowe pytanie: czy materia może
poznać samą siebie? — gdyż do tego ostatecznie sprowadza się ten problem. Należy
najpierw ustalić, co rozumiemy przez poznanie. Jeśli przez poznanie rozumie się
poznanie istoty materii, to należy agnostycznie stwierdzić, że materia samej siebie
poznać nie może. Jest natomiast możliwe poznanie w sensie odwzorowania porządków całości w pewnej części tej całości. Ten problem rozstrzygnęła już matematyka,
a dokładniej — teoria mnogości. Można mianowicie odwzorować cały zbór mocy
continuum w jego części o mocy continuum. Nie można więc wykluczyć możliwości poznania (odwzorowania) porządków Wszechświata w jego części, tym bardziej,
gdy bogata jest struktura tej części. Nie będzie przesady, jeśli zaryzykuje się twier-
61
62
Dodatek A. Geneza pojęć przestrzeni i czasu
dzenie, że struktura sieci neuronalnej ludzkiego mózgu, a zwłaszcza stanów tej sieci,
przewyższa bogactwem strukturę całej reszty Wszechświata.
Chemia związków węgla w najdoskonalszym znanym nam wydaniu, obleczonym
w ludzką skórę, pozwala na więcej niż odwzorowanie porządków otoczenia. To z tego
powodu nauka odżegnuje się od parapsychologii i mistycyzmu. Jest to wyrazem obrony przed przewartościowaniem poznawczym, przed nadużywaniem bogactwa struktury naszych mózgów przy odwzorowywaniu porządków otoczenia. Z historii nauki
wiemy, że miało to już nieraz miejsce i dlatego niezbędna jest wnikliwa selekcja tego, co jest istotne w poznawaniu otoczenia, od tego, co człowiek chciałby otoczeniu
niepotrzebnie przypisać.
Człowiek dysponuje takimi pojęciami jak duch, myśl, uczucie, melodia, dźwięk,
barwa, które nie występują w otoczeniu, a stanowią tylko funkcję naszej mózgowej
materii. Niektóre z tego rodzaju pojęć służą do odwzorowywania porządków otoczenia oraz ustalania naszego z nim związku. Myśl, że przestrzeń i czas mogą również
należeć do tej kategorii pojęć wydaje się absurdalna, gdyż te pojęcia są od nas
jak gdyby niezależne i bardzo ściśle związane z obiektami otoczenia, a poza tym, czujemy się jakby zanurzeni w tej zewnętrznej przestrzeni. Można powiedzieć, że wręcz
widzimy ją na zewnątrz siebie. Ale czy to prawda?
Fotony podrażniają siatkówki naszych oczu, a podrażnienia zakończeń nerwowych, po skomplikowanej obróbce i kodowaniu, docierają do mózgu, gdzie odbywa się
percepcja wzrokowa. Nie jest to więc proste rzutowanie, a bardzo skomplikowane odwzorowanie porządków otoczenia. W rezultacie otrzymujemy nie zewnętrzne,
a wewnętrzne widzenie — „the inner show”, jak to nazywa David Bohm w książce „Relativity”. To wewnętrzne widzenie jest odwzorowaniem porządków otoczenia
na kanwie przestrzeni stanów sieci neuronalnej mózgu. Pojęcia przestrzeni i czasu,
podobnie jak dźwięk i barwa, są tylko naszymi, ludzkimi tworami, które w Naturze
nie występują. Pojęcia przestrzeni i czasu, jakie jawią się w naszej jaźni, nie stanowią
zbiorów dobrze uporządkowanych. Dopiero kontakt z otoczeniem i niektóre porządki otoczenia (na przykład zegar) porządkują te zbiory, określając w nich metrykę
i kolejność zdarzeń. Podczas snu, czy też w doświadczeniach izolujących człowieka
od bodźców otoczenia, porządki w tej naszej czasoprzestrzeni bywają silnie zakłócone, ale doznawanie pojęcia przestrzeni i czasu we śnie, najlepiej świadczy o tym,
że są one naszą, a nie otoczenia własnością. Fakt, że to my sami w kontakcie z otoczeniem, modelujemy jego porządki za pomocą naturalnie nam danych pojęć przestrzeni
i czasu, umyka naszej uwadze. Wiadomo jednak, że każdy automat cybernetyczny
musi być wyposażony w taśmę diagramową, na której zapisuje dane o stanie własnej
struktury oraz struktury otoczenia (maszyny Turinga). Bez takiej taśmy automat
cybernetyczny nie może działać. Automaty biologiczne też muszą taką taśmę posiadać. Można ją zlokalizować, ale nie można jej namacać, gdyż jest to niematerialna
struktura wygenerowana w naszych mózgach na bazie sieci neuronalnej. Pojęcie wymiaru, tzn. trójwymiarowość tej „taśmy”, a dodając czas — jej czterowymiarowość,
również nie jest własnością otoczenia i da się również wytłumaczyć na bazie sieci
neuronalnej naszego mózgu. Korzystania z tej „taśmy” człowiek uczy się od urodzenia, w aktywny sposób badając jej własności za pomocą wszystkich zmysłów.
Oczywiście ludzie pozbawieni od urodzenia pewnych zmysłów, zwłaszcza wzroku,
mają zubożone pojęcie przestrzeni.
63
Możemy nawet domyśleć się, w jaki sposób sieć neuronalna generuje czasoprzestrzenną strukturę. Ośrodek decyzyjny w mózgu musi bez przerwy porównywać ze sobą wartości różnych bodźców, aby zadysponować odpowiednie działanie.
Do mózgu docierają informacje o bezwzględnych wartościach bodźców, gdyż czujniki
zmysłowe nie działają różnicowo. Wyniku takiego porównania dostarczyć więc musi
sieć neuronalna, która jest zespołem neuronów oraz synapsów pobudzających i hamujących, odpowiednio ze sobą połączonych. Taki układ może realizować dowolne
funkcje logiczne. Musimy znaleźć warunki, jakie powinna spełniać sieć neuronalna, aby za pomocą funkcji logicznych można było dokonywać porównywania dwóch
wartości i stwierdzić, która z nich jest większa. Neurony są elementami cyfrowymi,
których stopień pobudzenia oraz progi zadziałania mogą być w sposób ciągły modyfikowane. Sieć neuronalna może więc realizować nie tylko dwuznaczeniowe funkcje
logiczne oparte na pojęciach „absolutnej prawdy” i „absolutnego fałszu” („ jedynki” i „zera”), ale również funkcje logiki ciągłej, oparte na pojęciach porównawczych:
„mniej”, „więcej”, „bliżej”, „dalej”, „wcześniej”, „później”, „ jaśniej”, „ciemniej” itp.
W takiej logice operuje się pojęciem stopnia prawdziwości. Wartości zmiennych p, q
oraz wartości funkcji logicznych przyjmują dowolne wartości z przedziału (0, 1).
W tym również wartość „0” i „1”.
Funkcje logiczne można jednakowo zapisać zarówno w logice dwuznaczeniowej,
jak też w logice ciągłej tego typu, jeśli określimy alternatywę jako wybór wartości
większej, czyli
1
p ∨ q ≡ max(p, q) = (p + q + /p − q/),
2
(A.1)
koniunkcję jako wybór wartości mniejszej, czyli
1
p ∧ q ≡ min(p, q) = (p + q − /p − q/)
2
(A.2)
p̄ ≡ 1 − p.
(A.3)
oraz negację jako
Są podstawy, aby przypuszczać, że w procesie myślowym sieć neuronalna realizuje logikę dwuznaczeniową, w której jest określone pojęcie „absolutnej prawdy”
i „absolutnego fałszu”, a do odwzorowywania porządków otoczenia posługuje się
logiką ciągłą, w której te pojęcia nie są określone. Nie jest też określony stopień
prawdziwości wielkości p, q. Negację można w tym przypadku określić jako p̄ = −p,
a zakres zmienności argumentów oraz funkcji logicznych rozszerzyć do całej osi liczb
rzeczywistych (−∞, +∞). (Pojęcie negacji oraz wartości ujemnej generują synapsy
hamujące). Negacja w takiej logice nie jest funkcją logiczną. Za pomocą wyżej zdefiniowanych funkcji alternatywy i koniunkcji oraz znanych związków między funkcjami
logicznymi, możemy formalnie określić wszystkie pozostałe funkcje logiczne. Pomijając funkcje powtarzające lub negujące swoje argumenty, otrzymujemy w ten sposób
64
następujące określenia pozostałych funkcji logicznych
implikacja
implikacja
równoważność
różnica symetryczna
funkcja Sheffera
funkcja Pirsa
1
p =⇒ q = p ∨ q̄ = (p − q + |p + q|),
2
1
q =⇒ p = p̄ ∨ q = (q − p + |p + q|),
2
1
p ≈ q = (p ∨ q̄) ∧ (p̄ ∨ q) = (|p + q| − |p − q|),
2
1
p #q = (p ∧ q̄) ∨ (p̄ ∧ q) = − (|p + q| − |p − q|),
2
1
p/q = (p̄ ∨ q̄) = − (p + q − |p − q|),
2
1
p ⇓ q = p̄ ∧ q̄ = − (p + q + |p − q|).
2
(A.4)
(A.5)
(A.6)
(A.7)
(A.8)
(A.9)
W tej interpretacji, różnica symetryczna jest ujemną wartością równoważności,
a funkcje Sheffera i Pirsa są ujemnymi wartościami odpowiednio koniunkcji i alternatywy, natomiast druga implikacja powstaje z pierwszej przez zamianę wielkości p
i q. Istotnie różnymi są więc tylko cztery funkcje: alternatywa, koniunkcja, równoważność i jedna z implikacji. Jeśli sieć neuronalna ma za zadanie porównywanie
wartości, to musi na podstawie wartości wyjściowych porównać wartości wejściowe.
Na wyjściach z sieci otrzymuje się wartości funkcji logicznych. Zauważmy więc, że zadając wartości wyżej wymienionych czterech funkcji, możemy wyznaczyć wielkości p
i q, a tym samym określić, która z nich jest bardziej prawdziwa. Wprowadzając
dla wartości tych funkcji oznaczenia
1
(p − q + |p + q|) = x0
2
1
(p + q + |p − q|) = x1
2
1
(p + q − |p − q|) = x2
2
1
(|p + q| − |p − q|) = x3
2
stopień prawdziwości implikacji
(A.10)
stopień prawdziwości alternatywy
(A.11)
stopień prawdziwości koniunkcji
(A.12)
stopień prawdziwości równoważności
(A.13)
możemy jednoznacznie wyrazić wielkości p i q przez wartości x0 , x1 , x2 , x3 . Dodając
stronami równanie (A.10) do równania (A.12) i odejmując równanie (A.13), otrzymujemy
p = x0 + x2 − x3 ,
(A.14)
a odejmując od równania (A.11) równanie (A.10) i dodając równanie (A.13), mamy
q = −x0 + x1 + x3 .
(A.15)
Istotne jest, że maksymalny układ nieprzywiedlnych funkcji logicznych, potrzebny
do wyznaczenia wielkości p i q składa się z czterech wyżej wymienionych funkcji.
Otrzymane tu wyniki korespondują ze znanym twierdzeniem Posta w algebrze Bool’a
dla przypadku, gdy pojęcie „prawdy” i „fałszu” nie jest określone. Twierdzenie to
stwierdza, że maksymalny, nieprzywiedlny układ funkcji logicznych, pełny w sensie
65
mocnym (bez określenia pojęcia „prawdy” i „fałszu”), musi składać się z trzech
funkcji symetrycznych (np. alternatywy, koniunkcji oraz równoważności) i jednej
funkcji niesymetrycznej (np. jednej z implikacji).
Zauważmy, że w przedstawionym wyżej systemie logiki ciągłej, mamy akurat takie istotnie różne funkcje. System logiczny oparty na zbiorach wartości tych czterech
funkcji potrafi ocenić, która z wartości p, czy q jest większa oraz wyznaczyć wartości
pozostałych funkcji. Zasady logiki ciągłej, uwzględniającej twierdzenie Posta, wymagają więc istnienia czterech zbiorów uporządkowanych relacją mniejszości. Zbiory
wartości trzech funkcji symetrycznych X1 , X2 , X3 rozpinają symetryczną przestrzeń
stanów sieci neuronalnej, natomiast niesymetryczny zbiór X0 ciągu implikacyjnego „ jeśli, to” generuje pojęcie czasu. Każdy nabór (x0 , x1, x2 , x3 ) jest zdarzeniem
w czasoprzestrzeni stanów sieci neuronalnej. Funkcje logiczne są więc bazą naszej
niematerialnej, trójwymiarowej „taśmy diagramowej” i czasu. Są one również bazą pojęcia wymiaru. W ramach przewartościowania poznawczego możemy wymyślać różne geometrie i czasoprzestrzenie o dowolnej liczbie wymiarów, a następnie
próbować, czy taki model odpowiada rzeczywistości, ale jak to napisał Einstein:
„Należy wówczas wytłumaczyć, dlaczego kontinuum posiada pozornie tylko cztery
wymiary”. Właśnie powyższe rozważania były próbą wytłumaczenia tej „pozornej
czterowymiarowości”. Oczywiście jest to tylko próba wytłumaczenia, a nie ścisły
dowód, gdyż ten problem powinni rozwiązać specjaliści od sieci neuronalnej, logiki ciągłej i cybernetycy. Wadą teorii sieci neuronalnej (Mc Culloch, Pitts, Kleene)
jest to, że przestrzeń i czas traktowane są w nich jako własność otoczenia. Możliwość kreacji tych pojęć w naszych mózgach, nie jest tam uwzględniana. Zauważmy,
że logikę, w której pojęcia „prawdy” i „fałszu” są określone, można modelować za pomocą obszarów na płaszczyźnie. Logikę, w której te pojęcia nie są określone, trzeba
modelować obszarami w przestrzeni trójwymiarowej z możliwością przemieszczeń
w czasie. Można więc powiedzieć, że sieć neuronalna realizuje modelowanie związków
funkcyjnych w logice ciągłej, w której nie są określone wartości stopnia prawdziwości zmiennych p, q, ale do tego potrzebne jest wygenerowanie czasoprzestrzennego
tworu jako podłoża takiego modelowania. Wynika stąd wniosek, że znane pomysły
na czasoprzestrzeń więcej niż czterowymiarową są sprzeczne z twierdzeniem Posta,
gdyż dodatkowe funkcje logiczne będą przewidywalne. W odwzorowaniu porządków
otoczenia nie otrzymujemy gotowych wyników, że p jest większe od q lub odwrotnie,
gdyż to sieć neuronalna, pracująca w systemie logiki ciągłej, tworząc modele w tej
czterowymiarowej czasoprzestrzeni, odwzorowuje porządki otoczenia według relacji
mniejszości na podstawie naborów (x0 , x1, x2 , x3 ) ze zbiorów wartości wymienionych
funkcji logicznych. Przestrzenne modele obiektów otoczenia jako podzbiory trójwymiarowej „taśmy diagramowej” mają więc tę samą własność rozciągłości, co sama
przestrzeń.
Zgłębiając pojęcie własnej osobowości, można dojść do wniosku, że to nie my
mamy mózgi, a odwrotnie, to mózgi mają resztę ciała jako swoje najbliższe otoczenie. Jest to ta część otoczenia, na którą mózg ma bezpośredni wpływ i stan
struktury tego otoczenia może w bardzo dużym zakresie kształtować według potrzeb. To przede wszystkim do sterowania mięśniami potrzebne jest wygenerowanie
czasoprzestrzennego tworu. Pojęcie dalszego otoczenia jest tylko ubocznym produktem. Jest pewnym poziomem abstrakcji otoczenia najbliższego, czyli własnego ciała.
66
Do kształtowania struktury najbliższego otoczenia (sterowania), wystarcza pojęcie
przestrzeni euklidesowej i czas absolutny, a warunki, w jakich ewoluował człowiek,
nie wymuszały wygenerowania bardziej bogatego strukturalnie czasoprzestrzennego
tworu. Były to warunki bliskiego otoczenia i małych w porównaniu ze światłem
prędkości, które również można modelować przestrzenią euklidesową i czasem absolutnym. Taką więc czasoprzestrzeń generuje w naszych mózgach sieć neuronalna.
Jest ona „wkonstruowana” w zmysły i mózg człowieka i to nie otoczenie objawia nam
swoją przestrzenno-czasową naturę, a odwrotnie, to my, zapisując odpowiednio zakodowane porządki otoczenia na swoich euklidesowych, trójwymiarowych „taśmach”
diagramowych, nadajemy obiektom otoczenia tę przestrzenną postać, podobnie jak
oblekamy je w barwy, których one nie mają. Nic też dziwnego, że Euklides wymyślił
swoje postulaty właśnie takimi, gdyż taką geometrię miał wkonstruowaną w swój
mózg.
Nie można również dziwić się, że mając wręcz konstruowane pojęcie euklidesowej przestrzeni i czasu absolutnego, tak trudno było nam zrezygnować z piątego
postulatu Euklidesa i pojęcia eteru. Tym większa chwała dla geniuszu Einsteina,
którego obie teorie względności można by najkrócej określić jako wniosek, że porządków otoczenia nie można modelować przestrzenią euklidesową i czasem absolutnym. Z prezentowanej tu teorii wynika, że również znane nam zaskakujące własności
cząstek elementarnych wynikają z nieeuklidesowego charakteru ich czasoprzestrzennych modeli. Mamy naturalne ograniczenia poznawcze, wynikające z ewolucyjnego ukształtowania, ale bogactwo struktury naszego mózgu pozwala wyjść poza te
ograniczenia, a to modelarskie „tworzywo” czasoprzestrzenne jest na tyle podatne,
że przy pomocy przyrządów oraz aparatu matematycznego, jest w stanie zamodelować porządki (strukturę) zarówno Wszechświata w całości, jak też i jego najdrobniejszych części — cząstek elementarnych. Gdy chcemy pozostać przy czterowymiarowym, czasoprzestrzennym modelowaniu jako dla nas wyłącznie zrozumiałym,
to wnikając w mikrostrukturę materii oraz ogarniając większe obszary naszego otoczenia, których nasze zmysły bezpośrednio nie analizują, musimy wzbogacić to czasoprzestrzenne „tworzywo modelarskie” o dodatkowe własności. Musimy pozwolić mu
krzywić się i skręcać. Dlatego rozpatrywane w tej teorii czasoprzestrzenne modele
są całkowicie niesymetryczne. Oznacza to, że tensor podstawowy jest w tej teorii
wielkością niesymetryczną, a tensor metryczny stanowi jego symetryczną część. Koneksja liniowa również jest wielkością niesymetryczną, co oznacza, że istnieje torsja,
czyli skręcenie czasoprzestrzeni. Właśnie takie mają być czasoprzestrzenne modele
cząstek elementarnych.
Dodatek B
Nieliniowa elektrodynamika Borna-Infelda
Chociaż w tej teorii z zasady nie robimy żadnych uproszczeń problemów, to wyjątkowo pozwolimy sobie na taką nieprawidłowość. Przyjmiemy założenia strukturalne
takie, jakie występują w nieliniowej elektrodynamice Borna-Infelda, czyli metrykę
w postaci
ds2 = (dx0 )2 − (dx1 )2 − (dx2 )2 − (dx3 )2
(B.1)
oraz potencjalność pola elektromagnetycznego przy sferycznej symetrii potencjału skalarnego. Pierwsze założenie pomija wpływ pola grawitacyjnego. Jest to duże uproszczenie, gdyż w bliskim otoczeniu centrum cząstek elementarnych wpływu
pola grawitacyjnego nie można pomijać. Wyprowadzając wzory elektrodynamiki
Borna-Infelda przy tak grubym uproszczeniu, wykazujemy tym samym, że taka
elektrodynamika oraz inne tego typu nieliniowe elektrodynamiki, nie mają sensu,
że są sztucznymi tworami, które mają się nijak do rzeczywistości. Drugie z tych
założeń oznacza, że równania (??) spełniają się tożsamościowo. Wzór (B.1) możemy
interpretować jako wniosek, że tensor podstawowy spełnia warunek
dla i , k.
gik = −gki
(B.2)
Mamy więc również
gik = gik
dla i , k.
e
Bez straty na ogólności możemy przyjąć, że
(B.3)
1
gik = Fik ,
e b
(B.4)
gdzie Fik jest tensorem pola elektromagnetycznego, a stała b jest wielkością dopasowującą wymiary. Założyliśmy istnienie potencjału wektorowego Ak , takiego, że
(B.5)
Fik = Ak,i − Ai,k .
Podstawienie wzoru (B.4) do równań (??), przy założeniu (B.5), prowadzi do tożsamości
Fik,l + Fli,k + Fkl,i ≡ 0.
(B.6)
Dokonamy teraz przyporządkowania
F01 = E1 ,
F02 = E2 ,
F03 = E3 ,
F12 = −H3,
67
F13 = H2 ,
F23 = −H1 .
(B.7)
68
Dodatek B. Nieliniowa elektrodynamika Borna-Infelda
Jeśli składową zerową potencjału wektorowego oznaczymy przez ϕ, a pozostałe skła~ to wzór (B.5) definiuje trójdowe uznamy za składowe trójwymiarowego wektora A,
~iH
~ jako
wymiarowe wektory E
~
~ = 1 ∂A − gradϕ,
E
c ∂t
(B.8)
~
~ = −rotA.
H
(B.9)
~ ≡ 0,
‘divH
(B.10)
Podstawienie wzorów (B.8–B.9) do tożsamości (B.6) daje
~
1 ∂H
.
(B.11)
c ∂t
Działając operatorem rotacji na równanie (B.8) oraz operatorem dywergencji na równanie (B.9), otrzymujemy odpowiednio równanie (B.10) oraz (B.11), wyrażone znakiem równości, a nie tożsamości.
Dwa ostatnie równania stanowią pierwszą parę równań Maxwella. Drugą parę równań Maxwella stanowią równania (??), ale wygodniej jest korzystać z równań (??), z których te równania się wywodzą. Aby wykazać, że jest to druga para
równań Maxwella, wystarczy wymnożyć wzór (B.4) przez gsi gtk . W ten sposób otrzymujemy
~≡−
rotE
1
1
1
ts
gik gsi gtk = (gtk gsi gik − gsi gtk gki ) = (gts − gst ) = ge = Fts .
2
2
b
e
Jeśli ten końcowy wynik podstawimy do równań (??), to otrzymamy
√
−gFik = 0.
,k
(B.12)
(B.13)
Z tych równań można już w dość prosty sposób otrzymać dosłownie drugą parę
równań Maxwella. Będą więc nam potrzebne składowe kontrawariantne tensora podstawowego, wyrażone przez składowe pola elektrycznego Ei oraz magnetycznego Hi .
Najpierw musimy tego dokonać dla kowariantnych składowych tensora podstawowego. Na podstawie metryki (B.1) oraz wzorów (B.3), (B.4) i przyporządkowania (B.7)
mamy


1
1
1
E1
E2
E3 
 1
b
b
b
 1

 − b E1 −1 − 1b H3 1b H2 

.
(B.14)
(gik ) =  1
1
−1 − 1b H1 
 − b E2 b H3
 1

− b E3 − 1b H2 1b H1
−1
Wyznacznik tej macierzy równa się
g = −1 +
1 2
1
1 ~~ 2
(E1 + E22 + E23 ) − 2 (H12 + H22 + H32 ) + 4 (E
H) ,
2
b
b
b
(B.15)
gdzie
~H
~ = E1 H 1 + E2 H 2 + E3 H 3 .
E
(B.16)
69
Korzystając ze wzoru
gik = (−1)i+k
Mik
,
g
(B.17)
gdzie Mik jest minorem macierzy transponowanej do macierzy (B.14), znajdujemy
kontrawariantne składowe tensora podstawowego
1
1
[−1 − 2 (H12 + H22 + H32 )],
g
b
(B.18)
g11 =
1
1
[1 + 2 (H12 − E22 − E23 )],
g
b
(B.19)
g22 =
1
1
[1 + 2 (H22 − E21 − E23 )],
g
b
(B.20)
g33 =
1
1
[1 + 2 (H32 − E21 − E22 )],
g
b
(B.21)
1 1
1
1
~ H)],
~
[− E1 + 2 (E3 H2 − E2 H3 ) − 3 H1(E
g b
b
b
(B.22)
1
1
1 1
~ H)],
~
[ E1 + 2 (E3 H2 − E2 H3 ) + 3 H1 (E
g b
b
b
(B.23)
1 1
1
1
~ H)],
~
[− E2 + 2 (E1 H3 − E3 H1 ) − 3 H2(E
g b
b
b
(B.24)
1
1
1 1
~ H)],
~
[ E2 + 2 (E1 H3 − E3 H1 ) + 3 H2 (E
g b
b
b
(B.25)
1 1
1
1
~ H)],
~
[− E3 + 2 (E2 H1 − E1 H2 ) − 3 H3(E
g b
b
b
(B.26)
1
1
1 1
~ H)],
~
[ E3 + 2 (E2 H1 − E1 H2 ) + 3 H3 (E
g b
b
b
(B.27)
1 1
1
1
~ H)],
~
[− H3 + 2 (E1 E2 + H1 H2 ) + 3 E3 (E
g b
b
b
(B.28)
g21 =
1 1
1
1
~ H)],
~
[ H3 + 2 (E1 E2 + H1H2 ) − 3 E3 (E
g b
b
b
(B.29)
g13 =
1
1
1 1
~ H)],
~
[ H2 + 2 (E1 E3 + H1H3 ) − 3 E2 (E
g b
b
b
(B.30)
g31 =
1 1
1
1
~ H)],
~
[− H2 + 2 (E1 E3 + H1 H3 ) + 3 E2 (E
g b
b
b
(B.31)
g23 =
1
1
1 1
~ H)],
~
[− H1 + 2 (E2 E3 + H2 H3 ) + 3 E1 (E
g b
b
b
(B.32)
1 1
1
1
~ H)].
~
[ H1 + 2 (E2 E3 + H2H3 ) − 3 E1 (E
g b
b
b
(B.33)
g00 =
g01 =
g10 =
g02 =
g20 =
g03 =
g30 =
g12 =
g32 =
70
Trochę żmudnym wyliczeniem można stwierdzić, że elementy macierzy (B.14)
oraz przedstawione tu elementy macierzy odwrotnej spełniają równania
(B.34)
gik gkl = δlk .
Do równań (??) będą potrzebne części antysymetryczne składowych tensora gik .
Ze wzorów (B.22–B.33) otrzymujemy
1 1
1
01
~
~
ge =
− E1 − 3 H1 (EH) ,
(B.35)
g b
b
1
1 1
~
~
− E2 − 3 H2 (EH) ,
ge =
g b
b
1 1
1
03
~
~
ge =
− E3 − 3 H3 (EH) ,
g b
b
1
1 1
12
~
~
− H3 + 3 E3 (EH) ,
ge =
g b
b
1 1
1
23
~
~
ge =
− H1 + 3 E1 (EH) ,
g b
b
1 1
1
31
~
~
ge =
− H2 + 3 E2 (EH) .
g b
b
02
(B.36)
(B.37)
(B.38)
(B.39)
(B.40)
Podstawiając wzory (B.35–B.40) do równań (??) otrzymujemy równania
ik
Se
= 0,
,k
(B.41)


D1 D2 D3 
 0
 −D
0 −B3 B2 

1
(Sik ) = 
.
 −D2 B3
0 −B1 


−D3 −B2 B1
0
(B.42)
ik
gdzie Se są składowymi tensora
~ oraz B
~ mają postać
Trójwymiarowe wektory D
~ = q
D
1+
~= q
B
1+
~+
E
1 ~ ~~
H(EH)
b2
1 ~2
(H
b2
~ 2)
E
−
−
~−
H
1 ~ ~~
E(EH)
b2
1 ~2
(H
b2
~2) −
−E
,
(B.43)
.
(B.44)
1 ~~ 2
(EH)
b4
1 ~~ 2
(EH)
b4
Równania (B.41) możemy więc zapisać jako
~ =−
rotB
~
1 ∂D
,
c ∂t
~ = 0,
divD
(B.45)
71
które z dokładnością do znaku stanowią drugą parę równań Maxwella dla wekto~ i B.
~
rów D
W rozdziale pierwszym zwróciliśmy uwagę na to, że musimy określić warunki
√
zapewniające rzeczywisty charakter −g. W tym celu zauważmy, że istnieje grupa
transformacji liniowych
ρ
Λνµ Λλ γνρ = γµλ ,
(B.46)
zachowujących tensor metryczny γik , określony wzorem (B.1), na kwadrat elementu
odległości czasoprzestrzennej. Jeśli dodatkowo zażądamy, aby 4-wymiarowe macierze Λνµ spełniały warunek
det Λ = ενρµλΛ0ν Λ1ρ Λ2µ Λ3λ = 1
oraz Λ00 > 1,
(B.47)
~ i magnetyczne H
~
to będzie to grupa transformacji Lorentza. Pole elektryczne E
nie jest niezmiennikiem tych transformacji. Są nimi wyrażenia w nawiasach pod pierwiastkiem. Możemy więc w ramach transformacji Lorentza wybrać taki układ współ√
rzędnych, który zapewnia rzeczywistą wartość −g. Najprostszym jest przypadek,
kiedy obydwa niezmienniki są równe zeru. Wtedy pole elektryczne jest prostopadłe
do pola magnetycznego, a ich kwadraty są równe. Wtedy również mamy równo~ =E
~ oraz B
~ = H.
~ W tym przypadku równania (B.45), z dokładnością do znaku,
ści D
stanowią drugą parę równań Maxwella w próżni.
Można również rozpatrywać takie układy współrzędnych, w których znika pole elektryczne lub pole magnetyczne. Gdy znika pole elektryczne, to wyrażenie
pod pierwiastkiem jest rzeczywiste dla każdej wartości stałej b. Gdy znika pole
magnetyczne, to musimy wymagać, aby w każdym punkcie czasoprzestrzeni speł~ 2 < 1. Rozważmy ten ostatni przypadek bardziej dokładnie.
niała się nierówność b12 E
~ = 0. W tym przypadku otrzymujemy
Zakładamy więc, że H
~
~ = q E
D
,
1 ~2
1 − b2 E
~ = 0.
B
(B.48)
~ = 0. Wobec tego możemy
Z równań (B.11) otrzymujemy w tym przypadku, że rotE
przyjąć, że
~ = −gradϕ.
E
(B.49)
Równania (B.45) sprowadzają się do postaci
~
∂D
= 0,
∂t
~ = 0.
divD
(B.50)
Korzystając ze wzoru
~ = Ψ divV
~ + VgradΨ,
~
div(Ψ V)
(B.51)
gdzie Ψ — funkcja skalarna, możemy drugie z równań (B.50) zapisać w postaci
1
~ = −E
~ · grad q 1
divE
.
q
1 ~2
1 ~2
1 − b2 E
1 − b2 E
(B.52)
72
Następnie znajdujemy
3
1
1 ~2 − 2
~ 2,
= 2 1 − 2E
grad q
gradE
2b
b
~2
1 − b12 E
1
(B.53)
ale
1
~ 2 = (E
~ · grad)E
~+E
~ × rotE
~ = (E
~ · grad)E.
~
gradE
2
Korzystając z tych wzorów możemy równanie (B.52) zapisać jako
~=
divE
~
E
b2
~2
−E
~ · grad)E].
~
[(E
(B.54)
(B.55)
Podstawiając (B.49), możemy to równanie zapisać w postaci
∆ϕ =
▽ϕ{[(▽ϕ) · ▽]▽ϕ}
.
b2 − (▽ϕ)2
(B.56)
Tego równania w ogólnym przypadku rozwiązać nie można, ale jest to możliwe
dla pola kulistosymetrycznego ϕ = ϕ(r), co również należy do założeń nieliniowej
elektrodynamiki Borna-Infelda. We współrzędnych sferycznych mamy wtedy
!
dϕ ~r
1 d 2 dϕ
▽ϕ =
,
∆ϕ = 2
r
.
(B.57)
dr drr
r dr
dr
Podstawiając te wzory do równania (B.56) otrzymujemy

!2 
!
("
#
)
 2
dϕ  1 d 2 dϕ
dϕ~r dϕ~r ~r d dϕ~r

b −
·
r
=−
,

dr  r2 dr
dr
dr r dr r r dr dr r
(B.58)
czyli

!2 
!
("
#
)
 2
dϕ  1 d 2 dϕ
dϕ~r dϕ d dϕ~r
b −

r
=−
.

dr  r2 dr
dr
dr r dr dr dr r
Uwzględnienie, że drd ~rr = 0, daje

!2 
!
!2
 2
dϕ  1 d 2 dϕ
dϕ d2 ϕ

b −
.
r
=−

dr  r2 dr
dr
dr dr2
(B.59)
(B.60)
Przekształcając lewą stronę otrzymujemy ostatecznie
Podstawienie
!
!3
dϕ
b2 d 2 dϕ
r
=2
.
r dr
dr
dr
(B.61)
dϕ
u
= 2,
dr
r
(B.62)
73
daje
2 dr
du
=
.
u3
b2 r5
(B.63)
1
1
1
= 2 4 + 2,
2
u
q
br
(B.64)
Całkując to równanie mamy
gdzie dla uniknięcia osobliwości przyjmujemy dodatnią stałą całkowania, a oznaczenie jej przez q12 , pozwala na powiązanie jej z tradycyjnym pojęciem ładunku
punktowego. Z równania (B.64) otrzymujemy
u=±q
qr2
q2
b2
+
(B.65)
.
r4
Podstawienie tego wzoru do (B.62) daje
dϕ
q
=±q
,
dr
4
4
r0 + r
gdzie
q
r20 = ,
b
czyli b =
(B.66)
q
r20
.
(B.67)
Wzór na natężenie pola elektrycznego przyjmuje więc postać
q
~r
~ = −gradϕ = ∓ q
E
4 r3 .
1 + rr0
(B.68)
Ten wzór jest identyczny z otrzymanym przez Borna i Infelda, co jest ciekawe o tyle,
że podstawą ich elektrodynamiki jest wprawdzie interesujące, ale dość spekulatywne określenie gęstości lagrangianu, podczas gdy tu elektrodynamika Borna-Infelda
jest konsekwencją równań pola czasoprzestrzeni elementarnych. Istotne jest również,
że Born i Infeld do wyprowadzenia wzoru (B.68) posługiwali się pojęciem ładunku
punktowego i równaniem Poissona, podczas gdy do przedstawionego tu wyprowadzenia pojęcie ładunku i równanie Poissona nie są potrzebne. Obie strony równania (B.56) są czysto polowe. Możemy prawą stronę tego równania formalnie zapisać
jako −4πρ i wówczas otrzymujemy równanie Poissona
∆ϕ = −4πρ,
gdzie
ρ=
1 ▽ϕ{[(▽ϕ) · ▽]▽ϕ}
4π
b2 − (▽ϕ)2
(B.69)
(B.70)
możemy nazwać gęstością ładunku elektrycznego. Podstawiając tu wzór (B.68), mamy
qr40
.
(B.71)
ρ=∓
3
2πr(r40 + r4 ) 2
74
W tym wzorze wielkość q nie jest ładunkiem elektrycznym w sensie fizycznym,
gdyż jest tylko stałą całkowania, wprowadzoną we wzorze (B.64). Ilość ładunku
zawartego w kuli o promieniu R, równa się
ZR
QR = 4π
0
q
ρr2 dr = ∓ q
4 .
1 + rR0
Całkowity ładunek w całej trójwymiarowej przestrzeni wynosi więc
∞


q

Q= ∓q
r 4  = ∓q.
1 + R0 
0
Widzimy, że całkowity ładunek równy jest stałej całkowania q.
(B.72)
(B.73)

Tytuł dokumentu

Transkrypt

Podobne dokumenty

Układy równań, z których jedno jest drugiego stopnia

Metoda niezmienników w teorii liniowych równań funkcyjnych

1. Modelowanie matematyczne w fizyce i chemii

Rozwiązywanie numeryczne równań różniczkowych zwyczajnych

załącznik nr 3 do uchwały nr 369/XLVIII/2016 Senatu PW z

Portal DWINGiK Nowy tekst jednolity ustawy Prawo budowlane

Lista zadań 3 – Macierze, Wyznaczniki, Układy Równań

Komentarze sprawdzających do rozwiązań zadań T1, T2 i

MATEMATYKA JK I tura zajęć 2016/17 Zagadnienia na fakultety