Tytuł dokumentu
Transkrypt
Tytuł dokumentu
Franciszek Łada Jednolita teoria wszystkiego Kraków, październik 2013 Spis treści Przedmowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V Rozdział 1. Własności pola niesymetrycznego . . . . . . . . . . . . . . . . . . . . . . 1 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7. 1.8. 1.9. 1.10. 1.11. Czasoprzestrzenie strukturalne spójne . . . . . . . . . . . . . . . . . . Podstawowe definicje i oznaczenia . . . . . . . . . . . . . . . . . . . . Tensor podstawowy i tensor metryczny . . . . . . . . . . . . . . . . . Pole elektromagnetyczne . . . . . . . . . . . . . . . . . . . . . . . . . Koneksja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zwężony tensor krzywizny . . . . . . . . . . . . . . . . . . . . . . . . λ-niezmienniczość . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pochodna kowariantna . . . . . . . . . . . . . . . . . . . . . . . . . . Lokalna i wzdłużna afiniczność . . . . . . . . . . . . . . . . . . . . . . Zmiana długości wektora przy przeniesieniu równoległym . . . . . . . Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . 1 . 3 . 4 . 6 . 7 . 7 . 9 . 10 . 11 . 12 Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni . . . . . . . . . . . . 15 2.1. 2.2. 2.3. Zasada wariacyjna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wyprowadzenie równań pola czasoprzestrzeni . . . . . . . . . . . . . Wnioski z równań pola czasoprzestrzeni . . . . . . . . . . . . . . . . . 2.3.1. Wzór na pochodną kowariantną tensora podstawowego . . . . 2.3.2. Zmiana długości wektora przy jego przeniesieniu równoległym 2.3.3. Rozkład naturalny koneksji liniowej . . . . . . . . . . . . . . . 2.3.4. Równania pola elektromagnetycznego . . . . . . . . . . . . . . 2.3.5. Prawa zachowania . . . . . . . . . . . . . . . . . . . . . . . . 2.3.6. Dalsze wnioski z równań pola . . . . . . . . . . . . . . . . . . 2.3.7. Komentarz do równań pola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 17 19 19 20 21 23 23 25 25 Rozdział 3. Ogólne własności czasoprzestrzeni niesymetrycznych . . . . . . . . . . . 27 3.1. 3.2. Linie geodezyjne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.1.1. Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych 27 3.1.2. Cząstki i antycząstki . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.1.3. Oddziaływania elektromagnetyczne i słabe . . . . . . . . . . . . . . . 28 3.1.4. Oddziaływanie silne . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.1.5. Lokalna afiniczność względem koneksji będącej sumą Γikl i tensorów pozostałych oddziały Równania falowe i funkcje falowe . . . . . . . . . . . . . . . . . . . . . . . . 30 3.2.1. Równania falowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.2.2. Rozwiązania równań falowych . . . . . . . . . . . . . . . . . . . . . . 33 3.2.3. Czasoprzestrzenie odwrotne . . . . . . . . . . . . . . . . . . . . . . . 36 Rozdział 4. Rozwiązania równań falowych . . . . . . . . . . . . . . . . . . . . . . . . 37 4.1. Funkcje falowe typu elektronowego . . . . . . . . . . . . . . . . . . . . . . . 37 III IV 4.2. Spis treści Funkcja falowa typu mionowego i taonowego . . . . . . . . . . . . . . . . . . 40 4.2.1. Funkcja falowa typu lastonowego . . . . . . . . . . . . . . . . . . . . 48 4.2.2. Lokalna i wzdłużna afiniczność . . . . . . . . . . . . . . . . . . . . . 50 Rozdział 5. Kwarki. Uwagi ogólne . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Dodatek A. Geneza pojęć przestrzeni i czasu . . . . . . . . . . . . . . . . . . . . . . 61 Dodatek B. Nieliniowa elektrodynamika Borna-Infelda . . . . . . . . . . . . . . . . . 67 Przedmowa Prezentowana teoria jest pierwszą geometryczną unifikacją wszystkich czterech oddziaływań. Taką możliwość stwarza oparcie geometrycznej struktury czasoprzestrzeni na niesymetrycznym tensorze podstawowym gik oraz niesymetrycznej koneksji liniowej Ikli . Tensor metryczny γik jest częścią symetryczną tensora podstawowego. Część antysymetryczna tensora podstawowego spełnia uogólnione równania Maxwella, które są częścią równań pola tej teorii. Część antysymetryczna tensora podstawowego jest więc tensorem pola elektromagnetycznego. Niesymetryczność koneksji prowadzi do istnienia torsji Ikli . Pozwala to, między innymi, określić pojęcie ładunku e słabego i elektrycznego. W prezentowanej teorii nie przyjmuje się założenia o istnieniu oddziaływań, a ich pojawienie oraz podział na cztery różne oddziaływania, ujawnia się w sposób naturalny jako wniosek z równań pola niesymetrycznej czasoprzestrzeni. Analiza ich własności pozwala zidentyfikować te oddziaływania jako grawitacyjne, silne, elektromagnetyczne i słabe. Tak wyodrębnione oddziaływania wyrażane są za pomocą czysto geometrycznych wielkości. Ten podział na cztery oddziaływania ujawnia się we wzorze (wyprowadzonym w rozdziale 2.) na część symetryczną koneksji liniowej w niesymetrycznej czasoprzestrzeni 1 1 s s + gkl Iiss ) − (δti Iks + δtk Iiss ), Iikt = Γtik + γtl (gis Ikls + gks Iils ) − γtl (gil Iks 3 3 ee ee ee ee e e gdzie wszystkie wskaźniki mogą przyjmować wartości 0, 1, 2, 3 oraz stosowana jest umowa sumacyjna, oznaczająca sumowanie od zera do trzech w przypadku występowania jednakowego wskaźnika literowego dolnego (kowariantnego) i górnego (kontrawariantnego). Kreska pod wskaźnikami oznacza symetrię względem tych wskaźników, a znak „∼” pod wskaźnikami, antysymetrię względem tych wskaźników. Wszystkie cztery oddziaływania są więc w tej teorii składnikami jednej wielkości geometrycznej. Jednym z tych składników jest pseudotensor Christoffela Γikl określający oddziaływanie grawitacyjne. Pozostałe oddziaływania ukazują się jako symetryczne tensory trzeciego rzędu, zbudowane z symetrycznej i antysymetrycznej części tensora podstawowego oraz torsji. Przedstawiona jest tu jawna, ścisła zależność wszystkich czterech oddziaływań od wielkości określających strukturę geometryczną czasoprzestrzeni. Jest to również teoria jednolita w tym znaczeniu, że opisuje jednakowo zarówno obiekty astronomiczne jak też cząstki elementarne, a nawet cząstki subelementarne, jakimi są kwarki. Różne są tylko typy rozwiązań tych samych równań różniczkowych dla tych, tak bardzo różniących się od siebie obiektów. Jest więc to teoria bardziej ogólna niż teoria wszystkiego w dotychczasowym znaczeniu tej nazwy. Terminem teoria wszystkiego V VI Przedmowa zwykło się określać takie teorie, których celem jest tylko geometryczna unifikacja wszystkich oddziaływań, bez konsekwencji dla struktury materii. Ta teoria, po dopracowaniu kilku szczegółów, ma szansę stać się teorią dosłownie wszystkiego. Jest też istotne, że wychodząc z bardzo ogólnych założeń, otrzymuje się wyrażenia określające wszystkie cztery znane oddziaływania. Gdyby istniały jeszcze jakieś dodatkowe oddziaływania, to przy tak wyrafinowanej technice doświadczalnej byłyby już od dawna znane. Nie ma więc obawy o powtórzenie się sytuacji, gdy wielu fizyków, podejmując próbę geometrycznej unifikacji grawitacji i elektromagnetyzmu, określali swoje teorie jako teorie wszystkiego, a później okazało się, że istnieją jeszcze dwa nieznane im oddziaływania. Konieczność rezygnacji z przestrzeni afinicznej jako modelu czasoprzestrzeni powoduje, że chcąc tworzyć teorię fizyczną, opisaną za pomocą równań różniczkowych, musimy zapewnić różniczkowalność obiektów geometrycznych określających strukturę geometryczną czasoprzestrzeni. Do tego celu wystarczy, aby czasoprzestrzeń była tylko lokalnie afiniczna. Jak następnie zobaczymy, oznacza to, że lokalnie powinna znikać tylko część symetryczna koneksji liniowej. W przedstawionym wyżej wzorze tylko człon grawitacyjny jest koneksją właściwą. Pozostałe składniki są symetrycznymi tensorami trzeciego rzędu. Nie wnoszą one wkładu do nieaficzności czasoprzestrzeni. Ale suma członu grawitacyjnego i dowolnego z tych składników lub sumy tych składników jest również koneksją liniową. Można w ten sposób utworzyć osiem różnych rodzajów symetrycznych koneksji liniowych. Należy więc dopuścić osiem różnych warunków lokalnej afiniczności. Istnieje więc osiem rodzajów czasoprzestrzeni o różnej strukturze geometrycznej, gdyż znikanie odpowiedniej koneksji wiąże się z lokalnym znikaniem odpowiednich oddziaływań. Wyjaśnia to dlaczego istnieją cząstki elementarne, w których pewne oddziaływania nie występują, gdyż lokalnie znika grawitacja oraz oddziaływanie, lub oddziaływania, które razem z członem grawitacyjnym tworzą odpowiednią koneksję. Grawitacja musi lokalnie znikać w każdym przypadku. Przykładowo, tzw. leptony są pozbawione oddziaływań silnych. Dokładniej mówiąc, oddziaływanie silne oraz grawitacyjne jest w nich tak bardzo osłabione, że obecnie dostępnymi metodami nie są wykrywalne. Widać, że oddziaływanie grawitacyjne odgrywa szczególną rolę nie tylko w obiektach kosmologicznych, lecz również w strukturze geometrycznej cząstek elementarnych. Warunek lokalnego znikania odpowiedniej koneksji prowadzi do równań różniczkowych, których całkowalność jest wystarczającym warunkiem lokalnej afiniczności czasoprzestrzeni. Rozwiązaniami tych równań są transformacje do układu współrzędnych, w których lokalnie taka koneksja znika. Powszechnie znane jest tylko jedno, chyba najmniej interesujące rozwiązanie tych równań. Jest to rozwiązanie, które nie ma wpływu na strukturę geometryczną czasoprzestrzeni. Okazuje się, że istnieje mnóstwo rozwiązań, które decydują o jej strukturze. Te nieznane rozwiązania stanowią transformacje osobliwe. Jacobian tych transformacji równa się zeru. W rezultacie, czasoprzestrzeń, w której lokalnie znika część symetryczna koneksji, zachowuje tę własność, gdyż transformacja odwrotna nie istnieje. To dlatego, między innymi, elektron zachowuje swoje własności. Istnienie dużej różnorodności takich rozwiązań powoduje, że należy mówić nie o jednej totalnej czasoprzestrzeni, a o zbiorze czasoprzestrzeni z różnymi strukturami geometrycznymi. Modelem geometrycznym Wszechświata jest wiec zbiór takich czasoprzestrzeni. VII Istnienie rozwiązań zależnych periodycznie od czasu wyczerpuje struktury wszystkich znanych i jeszcze nieznanych cząstek elementarnych oraz subelementarnych, jakimi są kwarki. W tym przypadku, równania będące warunkiem lokalnej afiniczności są prawzorami równań falowych mechaniki kwantowej. Rozwiązania nieperiodyczne w czasie określają struktury obiektów kosmologicznych, będących tworami pierwotnymi. Materia złożona z cząstek elementarnych skupia się wokół centrów tych obiektów i powoduje, że są one dostrzegalne. Znane są jednak obiekty kosmologiczne pozbawione balastu normalnej materii. O takich obiektach mówi się, że są ciemną materią. W tej teorii pojawia się osiem różnych rodzajów koneksji liniowej, co prowadzi do ośmiu różnych układów równań będących warunkiem lokalnej afiniczności. Jeśli uwzględnimy, że dla każdego z tych układów istnieją różne typy rozwiązań, to dochodzimy do wniosku, że zabezpieczenie różniczkowalności czasoprzestrzeni, przy wstępnie wprowadzonej maksymalnie bogatej strukturze geometrycznej, prowadzi do obserwowanej różnorodności obiektów materialnych. Dotyczy to zarówno cząstek elementarnych, jak też tworów kosmologicznych takich jak planety, gwiazdy i galaktyki. Z powyższych uwag wynika, że ta teoria jest adresowana do specjalistów z zakresu teorii czasoprzestrzeni oraz jej związku z teorią cząstek elementarnych i kosmologią. Zdaję sobie sprawę z tego, że są to ludzie, którym często brakuje czasu nawet na własne opracowania. Trudno oczekiwać, aby bez specjalnej zachęty zechcieli śledzić i sprawdzać poprawność moich, nieraz bardzo skomplikowanych rachunków. Dlatego już w rozdziale wstępnym przedstawione są konsekwencje teorii oraz niektóre wyniki tych rachunków. Są one wystarczająco interesujące, aby uznać, że warto aktywnie włączyć się do rozwijania tej teorii. Mam podstawy sądzić, że przyniesie to więcej satysfakcji niż tworzenie opracowań, opartych na znanych już koncepcjach i teoriach, takich jak ogólna teoria względności, mechanika kwantowa, kwantowa teoria pola, model standardowy, teoria superstrun, teoria supersymetrii. Wszystkie te teorie wyjaśniają tylko określony obszar zjawisk, a niektóre z nich są nawet wzajemnie sprzeczne. Ta teoria obejmuje wszystkie zjawiska i dotyczy wszystkich podstawowych obiektów materialnych występujących lub mogących wystąpić w Naturze. Zaproszenie do rozwijania tej teorii jest podyktowane również tym, że mam już 82 lata, więc nie mogę liczyć na to, że sam poradzę sobie z licznymi problemami, jakie pozostały do rozwiązania. Franciszek Łada Kraków, październik 2013 Rozdział 1 Własności pola niesymetrycznego 1.1. Czasoprzestrzenie strukturalne spójne Istnienie ciążenia powszechnego sprawia, że porządków otoczenia nie można modelować czasoprzestrzenią euklidesową, że zarówno na poziomie mikroświata, jak też w skali astronomicznej, linie proste nie występują. Dlatego wektory jako zorientowane odcinki linii prostych lokalizowane są w fikcyjnej czasoprzestrzeni stycznej Minkowskiego. Z tego też powodu z reguły układ współrzędnych będą stanowiły cztery rodziny zorientowanych krzywych. Współrzędne x0 , x1 , x2 , x3 będą więc odcinkami łuków tych krzywych, licząc od ustalonego punktu jako początku układu współrzędnych. Przyjmujemy x0 jako współrzędną czasową. Zakładamy też, że modelem porządków Wszechświata jest czasoprzestrzeń strukturalnie niespójna, ale będąca zbiorem czasoprzestrzeni strukturalnie spójnych. Będziemy rozważać tylko elementy strukturalnie spójne tego zbioru. Dlatego wyrażenie „strukturalnie spójna” będziemy pomijać. Czasoprzestrzenią strukturalnie spójną nazywać będziemy czasoprzestrzeń, w której funkcje określające jej strukturę geometryczną są zapisane w wybranym układzie współrzędnych jednakowo w każdym jej punkcie. W takiej czasoprzestrzeni można też (z założenia) określić globalny układ współrzędnych, stanowiący cztery rodziny globalnie gładkich krzywych zorientowanych. Rozpatrywane czasoprzestrzenie są więc wyjątkowo prostymi rozmaitościami. Dlatego tylko w niewielkim stopniu będziemy korzystać z dorobku geometrii różniczkowej, która musi sprostać potrzebom różnych zastosowań. Niektóre zastosowania wymagają rozpatrywania tak bardzo skomplikowanych rozmaitości, że pojęcie układu współrzędnych ma sens tylko jako lokalna parametryzacja punktów. Jeśli też uwzględnimy teorio-mnogościową formalizację obecnej geometrii różniczkowej, to taka nauka staje się niezwykle skomplikowaną teorią, operującą bardzo bogatym asortymentem pojęć. Na przykład, wykaz symboli geometrii różniczkowej J. Gancarzewicza liczy dwieście trzydzieści pozycji. Dla naszych potrzeb wystarczą tylko dwa obiekty geometryczne, niesymetryczny tensor podstawowy gik oraz niesymetryczna koneksja liniowa Iikl . Pojęciem wektora posługiwać się będziemy tylko jako zorientowanym odcinkiem prostej stycznym do krzywej, zlokalizowanym w stycznej czasoprzestrzeni Minkowskiego i nie mającym wpływu na strukturę geometryczną czasoprzestrzeni. 1.2. Podstawowe definicje i oznaczenia Zakładamy, że w rozpatrywanej czasoprzestrzeni mamy wybrany krzywoliniowy układ współrzędnych xi . Nie interesuje nas pochodzenie takiego sposobu parametry1 2 Rozdział 1. Własności pola niesymetrycznego zowania punktów; gdyż nie ma potrzeby odnoszenia się do afinicznej czasoprzestrzeni więcej niż czterowymiarowa, do której nasza rozmaitość różniczkowa mogłaby być włożona. Taka afiniczna czasoprzestrzeń nie istnieje. Jest tylko wytworem ludzkiego umysłu, a zwłaszcza umysłów matematyków, którzy to pojęcie uogólnili na wszelkie możliwe sposoby. Jeśli istnieją funkcje x̄i = x̄i (x0 , x1 , x2 , x3), (i = 0, 1, 2, 3), takie że jakobian cztery i ∂x̄ transformacji k jest różny od zera, to te cztery funkcje możemy traktować jako ∂x ∂x̄i inny układ współrzędnych. Możemy więc wyznaczyć dx̄i = k dxk , gdzie przyjmu∂x jemy umowę sumacyjną oznaczającą sumowanie od 0 do 3 po powtarzających się wskaźnikach k. Pojęcie wektora kontrawariantnego określimy transformacyjnie jako czteroskładnikową wielkość V i , której składowe transformują się jak różniczki współrzędnych, czyli ∂x̄i (1.1) V̄ i = α V α . ∂x Wprowadzamy też pojęcie wektora kowariantnego Vi , którego składowe transformu∂s ∂s ∂xα ją się jak pochodna skalara i = α i , czyli ∂x ∂x̄ ∂x̄ V̄i = ∂xα Vα . ∂x̄i (1.2) We wzorach (1.1, 1.2) również obowiązuje umowa sumacyjna w przypadku występowania jednakowych literowych wskaźników górnych (kontrawariantnych) i dolnych (kowariantnych), np. 3 X i Ai B ≡ Ai B i . (1.3) i=0 Ogólnie, tensorem p-krotnie kontrawariantnym i q-krotnie kowariantnym nazywać będziemy wielkość transformującą się według wzoru i ...i T j11 ...jpq = ∂x̄ip ∂xl1 ∂x̄i1 ∂xlq k1 ...kp . . . . . . . T ∂xk1 ∂x̄ jq l1 ...lq ∂xkp ∂x̄ j1 (1.4) Zgodnie z tą regułą, wektor kontrawariantny jest tensorem 1-krotnie kontrawariantnym i 0-krotnie kowariantnym, a wektor kowariantny jest tensorem 0-krotnie kontrawariantnym i 1-krotnie kowariantnym, a skalar jest tensorem 0-krotnie kontrawariantnym i 0-krotnie kowariantnym. Definicje wektorów kontrawariantnych i kowariantnych są takie, aby ich iloczyn skalarny był niezmiennikiem, czyli Āi B̄i = Ai Bi . Taki iloczyn nazywa się iloczynem skalarnym wektorów A i B. Oprócz tradycyjnego zapisu pochodnych cząstkowych będzie też stosowany przecinek przed wskaźnikiem, np. ∂V i (1.5) V,ki ≡ k . ∂x 1.3. Tensor podstawowy i tensor metryczny 3 1.3. Tensor podstawowy i tensor metryczny Za pomocą kowariantnej funkcji tensorowej drugiego rzędu gik możemy iloczyn skalarny wektorów A i B zapisać w postaci Ai Bi = gik Ak Bi . (1.6) Tensor gik , określony w całej czasoprzestrzeni, nazywać będziemy kowariantnym tensorem podstawowym. Zauważmy, że wzór (1.6) nie wymaga symetrii tensora gik , dlatego zakładamy, że jest on tensorem niesymetrycznym. Żądamy, aby był macierzą nieosobliwą, czyli że wyznacznik g = det gik , 0. Istnieje więc macierz odwrotna gkr taka, że gik gkr = δri , (1.7) gdzie δri jest tensorem Kroneckera. Wzór (1.6) jest przykładem zastosowania tensora gik do obniżania wskaźników, tzn. do transformacji wektorów kontrawariantnych na kowariantne Ai = gik Ak . (1.8) Istnienie macierzy odwrotnej pozwala na podwyższanie wskaźników, tzn. transformację wektorów kowariantnych na kontrawariantne grk Ak = Ar . (1.9) Tensor podstawowy pozwala określić odległość między punktami (zdarzeniami) w czasoprzestrzeni, gdyż na podstawie wzoru (1.6) dla infinitezymalnie bliskich punktów, otrzymujemy ds2 = gik dxi dxk = γik dxi dxk , (1.10) gdzie 1 gik + gki (1.11) 2 jest częścią symetryczną tensora podstawowego gik . Tensor γik nazywać będziemy tensorem metrycznym, a skalar ds elementem odległości czasoprzestrzennej. W bliskim otoczeniu dowolnie wybranego punktu czasoprzestrzeni, możemy składowe tensora γik traktować jako stałe, a że γik jest macierzą symetryczną, to zawsze może być zdiagonalizowana. Jest to równoważne sprowadzeniu formy (1.10) do postaci kanonicznej w bliskim otoczeniu dowolnego punktu. Aby zachować spójność logiczną tej teorii ze Szczególną i Ogólną Teorią Względności, zakładamy że w każdym punkcie postać kanoniczna wzoru (1.10) pokrywa się z odpowiednim wzorem w czasoprzestrzeni Minkowskiego. Inaczej mówiąc, można skonstruować czasoprzestrzeń Minkowskiego styczną w dowolnie wybranym punkcie rozpatrywanych czasoprzestrzennych modeli. Oznacza to, że zakładamy iż tensor γik ma sygnaturę (+, −, −, −). Dodać jeszcze należy, że wzór (1.10) nie straci na ogólności, jeśli współrzędną czasową określimy jako x0 = ct, gdzie c jest maksymalną prędkością, z jaką można przesłać informację między punktami czasoprzestrzeni. Ze względu na powyższą sygnaturę, wyznacznik γ = det γik będzie ujemny w każdym punkcie. Bez szczegółowej analizy nie możemy tego powiedzieć o wyznaczniku tensora podstawowego g = det gik = det γik + ηik , (1.12) γik = 4 Rozdział 1. Własności pola niesymetrycznego gdzie 1 ηik = gik = gik − gki (1.13) e 2 jest częścią antysymetryczną tensora podstawowego. W celu przeprowadzenia analizy wyznacznika g, posłużymy się kombinatoryczną definicją wyznacznika macierzy g = det gik = εijkl gi0 g j1 gk2 gl3 = εijkl γi0 + ηi0 γ j1 + η j1 γk2 + ηk2 γl3 + ηl3 , (1.14) iklm gdzie ε jest zupełnie antysymetrycznym tensorem Levi Civity. Przy wymnażaniu wyrażeń w nawiasach należy uwzględnić, że εiklm γi0 γ j1 γk2 γl3 = det γik = γ, (1.15) εijklm γi0 γ j1 γk2 ηl3 + γi0 γ j1 ηk2 γl3 + γi0 η j1 γk2 γl3 + ηi0 γ j1 γk2 γl3 = 0, (1.16) εijkl ηi0 η j1 ηk2 γl3 + ηi0 η j1 γk2 ηl3 + ηi0 γ j1 ηk2 ηl3 + γi0 η j1 ηk2 ηl3 = 0. (1.17) W ten sposób otrzymujemy g = γik + F = γ + F 2 = γ + η01 η23 + η02 η31 + η03 η12 + γ00 γ11 η23 η23 + γ00 γ22 η31 η31 + γ00 γ33 η12 η12 + γ11 γ22 η03 η03 + γ11 γ33 η02 η02 + γ22 γ33 η01 η01 + 2 γ00 γ12 η23 η31 + γ00 γ23 η12 η31 + γ00 γ31 η12 η23 + γ11 γ03 η02 η23 + γ22 γ01 η03 η31 + γ33 γ02 η01 η12 + γ01 γ12 η03 η23 + γ01 γ23 η03 η12 + γ02 γ31 η01 η23 + γ02 γ23 η01 η31 + γ03 γ12 η02 η31 + γ03 γ31 η02 η12 + γ12 γ23 η01 η03 + γ12 γ31 η02 η03 + γ23 γ31 η01 η02 − γ01 γ01 η23 η23 − γ02 γ02 η31 η31 − γ03 γ03 η12 η12 − γ12 γ12 η03 η03 − γ23 γ23 η01 η01 − γ31 γ31 η02 η02 − 2 γ01 γ02 η23 η31 + γ01 γ03 η12 η23 + γ01 γ23 η02 η31 + γ01 γ31 η02 η23 + γ02 γ03 η12 η31 + γ02 γ12 η03 η31 + γ02 γ31 η03 η12 + γ03 γ12 η01 η23 + γ03 γ23 η01 η12 + γ11 γ02 η03 η23 + γ11 γ23 η02 η03 + γ22 γ03 η01 η31 + γ22 γ31 η01 η03 + γ33 γ01 η02 η12 + γ33 γ12 η01 η02 . (1.18) 1.4. Pole elektromagnetyczne Dwukwadratowa forma F, składowych γik i ηik , może w pewnych punktach czasoprzestrzeni przyjmować dodatnią wartość, kompensującą ujemną wartość γ, co prowadziłoby do osobliwości tensora gik . Musimy zatem nałożyć na tę formę warunki, które taką możliwość wykluczają. Wykluczenie takiej możliwości zabezpieczają warunki sprowadzające nieosobliwość tensora gik do nieosobliwości tensora γik . Będzie tak, gdy zażądamy, aby było g = γ. Warunki te muszą być niezmiennicze, obowiązujące we wszystkich układach współrzędnych. Wynika stąd, że formę F musimy wyrazić 5 1.4. Pole elektromagnetyczne za pomocą niezmienników. Można to uzyskać, gdy wyrazimy tensor ηik przez tensor ∗Fik dualny do pewnego antysymetrycznego tensora Fik . Dopasowanie wymiarów wymaga też posłużenia się mianowanym współczynnikiem. Przyjmiemy, że 1∗ 1 √ −γεiklm Flm . Fik = (1.19) b 2b Operator Hodge’a we wzorze (1.19) wyraża się więc zgodnie z definicją za pomocą wyznacznika tensora metrycznego, a nie tensora gik . Po tych uwagach możemy wrócić do wzoru (1.18). Zauważmy najpierw, że wzór (1.19) daje nam następujące przyporządkowanie: ηik = 1√ 1√ 1√ −γF23 , −γF31 , −γF12 , η02 = η03 = b b b 1√ 1√ 1√ −γF03 , −γF02 , −γF01 . η12 = η31 = η23 = (1.20) b b b Stosując to przyporządkowanie we wzorze (1.18) możemy ten wzór zapisać jako 2 γ2 1 γ il km ik lm . (1.21) g = γ − γik γlm F F + 2 εiklm F F 2b 4b 2 Wyrażenie S = γik γlm Fik Fkm (1.22) η01 = jest skalarem, a wyrażenie 1 (1.23) P = eiklm Fik Flm 2 jest pseudoskalarem zmieniającym znak przy transformacjach ze zmianą orientacji, natomiast występujące w tym wzorze P2 jest pełnym skalarem. Widać, że sugestywne określenie we wzorze (1.19) ηik przez Fik nie było przypadkowe, gdyż S oraz P2 są znanymi niezmiennikami pola elektromagnetycznego, a tensor tego pola zwyczajowo oznacza się przez Fik . Ubocznym efektem tej analizy jest więc natrafienie na pierwszy ślad naturalnego pojawienia się pola elektromagnetycznego. Oczywiście, jest to tylko pierwszy ślad, gdyż, aby tensor ηik = gik określał pole elektromagnetyczne, to mue Wyprzedzając fakty można potwierdzić, si również spełniać równania Maxwella. że równania Maxwella (uogólnione) okażą się wnioskami z równań pola czasoprzestrzeni niesymetrycznych oraz że spełnia je właśnie tensor gik . Naszym głównym obecnie celem jest wykluczenie osobliwości tensora gik , gdyż ebez tego dalsze rozwijanie teorii nie miałoby sensu. Takie zabezpieczenie gwarantuje przyjęcie dwóch warunków: S = 0 oraz P = 0. Każde nałożenie warunków prowadzi do uproszczenia teorii. Jest to jednak dopuszczalne tylko wówczas, gdy teoria wymaga cechowania. Na razie nie mamy do tego żadnych podstaw. Okazuje się jednak, że równania pola, które wyprowadzimy w następnym rozdziale wymagają cechowania przez spełnienie aż ośmiu dowolnych warunków. Dwa z nich będą wyżej wspomnianymi warunkami. Zgodnie z wcześniej przyjętymi ustaleniami, w bliskim otoczeniu dowolnie wybranego punktu, możemy macierz gik sprowadzić do postaci F01 F02 F03 1 −F01 −1 F12 F13 (1.24) gik = . −F02 −F12 −1 F23 −F03 −F13 −F23 −1 6 Rozdział 1. Własności pola niesymetrycznego Dla uproszczenia przyjęto, że b = 1 oraz usunięto gwiazdkę operatora Hodge’a. Wyznacznik tej macierzy równa się g = −1 − (F21 )2 − (F32 )2 − (F13 )2 + (F01 )2 + (F02 )2 + (F03 )2 + (F01 F32 + F02 F13 + F03 F21 )2 . (1.25) Ten sam wynik otrzymamy ze wzoru (1.18) po zastosowaniu przyporządkowania (1.17) oraz założenia, że γik = µik , gdzie µik jest tensorem Minkowskiego. Stosując odpowiednie przyporządkowanie, możemy wzór (1.25) wyrazić również za pomocą trójwymiarowych wektorów pola elektrycznego E i magnetycznego H (1.26) g = −1 − H2 − E2 + (EH)2 . Jak widać, wystarczy założyć wzajemną ortogonalność pola elektrycznego i magnetycznego oraz H2 = E2 , aby zapewnić nieosobliwość tensora gik w dowolnie wybranym punkcie czasoprzestrzeni. Mamy wówczas g = γ = −1. Z niesymetrii tensora gik wynika konieczność uwzględnienia istnienia czasoprzestrzeni, w których g̃ik = gki . (1.27) Takie czasoprzestrzenie nazywać będziemy transponami. Macierzą odwrotną do transponowanej jest transponowana macierz odwrotna, dlatego gik gkr = gki grk = δri . (1.28) Należy zwracać uwagę na kolejność wskaźników, gdyż na ogół gik grk = gki gkr , δri . (1.29) 1.5. Koneksja W rozpatrywanych czasoprzestrzeniach dopuszczamy dowolne nieosobliwe, nieliniowe transformacje układu współrzędnych. Z tego powodu różniczka wektora dV i nie jest wektorem, gdyż jest różnicą wektorów w dwóch różnych punktach. W różnych punktach składowe wektora (i innych wielkości tensorowych) różnie się transformują, gdyż we wzorach (1.1) i (1.2) współczynniki są funkcjami współrzędnych. Odejmowanie wektorów w bliskich punktach umożliwia wyposażenie czasoprzestrzeni w pole koneksji liniowej Ikli , zwanej również obiektem przeniesienia równoległego. Wzór δV i = −Ikli V k dxl (1.30) pozwala określić wektor V i w infinitezymalnie bliskim punkcie jako V i +δV i . Możemy w ten sposób odejmować od siebie wektory w infinitezymalnie bliskich punktach. Taka różnica (różniczka) DV i = V i + dV i − V i + δV i = dV i + Ikli V k dxl (1.31) jest więc wektorem. Zauważmy, że podobnie jak wzór (1.6) nie wymaga symetrii tensora gik , to we wzorze (1.30) nie jest wymagana symetria koneksji względem 7 1.6. Zwężony tensor krzywizny wskaźników k, l. Taką niesymetryczną koneksję oznaczamy symbolem Ikli , gdyż powszechnie używany symbol Γikl rezerwujemy dla symboli Chistoffela Γikl ! 1 is ∂γsk ∂γsl ∂γkl . + k − = γ 2 ∂xs ∂xl ∂x (1.32) Wzór (1.30) pozwala obliczyć zmianę wektora V i przy przeniesieniu równoległym wzdłuż nieskończenie małego konturu zamkniętego, czyli I i ∆V = − Ikli V k dxl . (1.33) Po prostych obliczeniach znajdujemy 1 ∆V i = − Riklm V k ∆Slm , 2 (1.34) gdzie ∆Slm jest polem powierzchni rozpostartej na tym konturze, a wielkość i i i s s Riklm = Ikl,m − Ikm,l + Ism Ikl − Isli Ikm (1.35) nazywa się tensorem krzywizny. 1.6. Zwężony tensor krzywizny Z tensora Riklm określonego wzorem (1.35) możemy utworzyć jego postać zwężoną Rik za pomocą operacji zwężenia polegającej na zsumowaniu składowych z tymi samymi wskaźnikami, górnym i dolnym. Jest to równoważne zmianie wskaźnika m na i z zastosowaniem konwencji sumacyjnej. W ten sposób otrzymujemy s s Rik = Iik,s − Iis,k + Iikl Ilss − Iisl Ilks . (1.36) Zwężenie tensora Riklm względem wskaźników i, l daje ten sam wynik, tylko z przeciwnym znakiem. Ale zwężenie względem i, k daje antysymetryczny tensor w postaci s s Pik = Isi,k − Isk,i . (1.37) Z tensorów gik oraz Rik możemy utworzyć skalary R = gki Rik lub R̃ = gik Rik . (1.38) 1.7. λ-niezmienniczość Wzory (1.35), (1.36), (1.37) posiadają własność nazwaną przez Einsteina λ-niezmienniczością. Gdy zastąpimy w nich Ikli przez Ĩkli = Ikli + δik λ,l (1.39) 8 Rozdział 1. Własności pola niesymetrycznego gdzie λ jest dowolną funkcją skalarną, to człony z λ redukują się i wzory nie ulegają zmianie. Jest to zrozumiałe, gdyż, jeśli to samo zrobimy we wzorze (1.33), to otrzymamy I I i i k l ˜ = − I V dx − ∆V V k δik λ,l dxl . (1.40) kl Druga z tych całek równa się zeru, mianowicie I I I k i l i i V δk λ,ldx = V dλ = V dλ = 0 (1.41) Wektor V i można było wyciągnąć przed znak całki, gdyż jednoznacznie określony wektor nie zależy od dowolnej funkcji λ. Całka okrężna z różniczki zupełnej w ob˜ i = ∆V i . szarze jednospójnym równa się zeru, więc mamy ∆V Już w następnym rozdziale tensor Rik będzie podstawą do wyprowadzenia równań pola. Wyprowadzone równania będą więc również λ-niezmiennicze. Mogłoby się wydawać, że taka niejednoznaczność jest wadą teorii, bo wymaga cechowania, które ma znamiona dowolności. Do tej dowolności dodamy też dowolność układu współrzędnych, gdyż zasada wariacyjna prowadząca do równań pola, musi wykluczyć wariacje będące transformacją układu współrzędnych niemające wpływu na strukturę geometryczną czasoprzestrzeni. Pozwala to na nakładanie czterech warunków na funkcje pola. Jeśli dodamy do tego cztery warunki na składowe gradientu funkcji λ, to razem możemy nakładać osiem dowolnych warunków na te funkcje. Wydaje się, że najbardziej korzystnymi warunkami, znacznie uproszczającymi teorię, są γik = 1 gik + gki = 0 2 dla i , k, (1.42) S = γik γlm Fil Fkm = 0, (1.43) 1 P = eiklm Fik Flm = 0. (1.44) 2 Dwa ostatnie warunki zabezpieczają nieosobliwość tensora podstawowego gik . Otrzymujemy w ten sposób g = det gik = det γik = γ , 0. (1.45) Ten wzór pozwala na posługiwanie się wyznacznikiem γ, zamiennie z wyznacznikiem g, w operatorze Hodge’a zastosowanym we wzorze (1.19). Warunek (1.42) nie jest niezmienniczy, ale ma bardzo ważne znaczenie, gdyż pozwala znacznie uprościć i tak już bardzo skomplikowane rachunki. Mimo tego uproszczenia, nie będziemy z niego korzystać przy wyprowadzaniu ogólnych wzorów i równań. Koneksja Ikli transformuje się według wzoru ν Īαβ = Ikli ∂2 xi ∂x̄ν ∂x̄ν ∂xk ∂xl + . ∂xi ∂x̄α ∂x̄β ∂x̄α ∂x̄β ∂xi (1.46) To prawo transformacyjne otrzymuje się w przestrzeni afinicznej i uogólnia się na dowolną przestrzeń z koneksją. Koneksja (1.32) również transformuje się w ten sposób. Ze względu na niesymetrię koneksji Ikli , wskazane jest rozróżnianie jej części symetrycznej 1 i (1.47) Ikl + Ilki , Ikli = 2 9 1.8. Pochodna kowariantna która również transformuje się według wzoru (1.46) oraz części antysymetrycznej 1 i Ikli = Ikl − Ilki (1.48) e 2 transformującej się jak tensor 1-krotnie kontrawariantny i 2-krotnie kowariantny ∂x̄ν ∂xk ∂xl ν (1.49) Īαβ = Ikli i α β . ∂x ∂x̄ ∂x̄ e e Wielkości transformujące się według wzoru (1.46) są pseudotensorami transformującymi się jak tensory tylko przy liniowych transformacja współrzędnych. Kreska pod wskaźnikami we wzorze (1.47) oznacza symetrię względem tych wskaźników. Znakiem „∼” pod wskaźnikami oznaczyliśmy antysymetrię względem tych wskaźników. Dla tensora Ikli używać też będziemy rozpowszechnionej nazwy torsja. e 1.8. Pochodna kowariantna W oparciu o wektorową różniczkę (1.31) można utworzyć kowariantną (w sensie współzmienniczości) pochodną wektora kontrawariantnego: V i: l ∂V i = + Ikli V k . l ∂x (1.50) Dla odróżnienia od pochodnej kowariantnej w czasoprzestrzeniach z koneksją Γikl oznaczamy ją dwukropkiem, a nie średnikiem. Można łatwo przekonać się, że pochodna kowariantna określona wzorem (1.50) jest tensorem. Pochodne kowariantne tensorów wyższych rzędów można znaleźć zakładając, że są one takie same jak dla tensorów stanowiących iloczyny proste wektorów oraz że pochodna kowariantna spełnia wzór Leibniza. W ten sposób dla pochodnej kowariantnej kontrawariantnego tensora podstawowego gik otrzymujemy: gik: l = ∂gi k + g jk Iijl + gij Ikjl . ∂xl (1.51) Wymnożenie tego wzoru przez gsi gkt i skorzystanie z (1.28) daje − gkt gik gsi: l = −gkt gik ∂gsi + gsi Itli + gkt Islk , ∂xl (1.52) czyli ∂gst (1.53) + gsi Itli + gkt Islk . ∂xl Po odpowiedniej zamianie wskaźników otrzymujemy wzór na kowariantną pochodną kowariantnego tensora podstawowego gik w postaci − gst : l = − gik : l = ∂gik j j − gij Ikl − g jk Iil . l ∂x (1.54) 10 Rozdział 1. Własności pola niesymetrycznego Teraz możemy znaleźć wzór na pochodną kowariantną wektora kowariantnego Vi: l = gik V k = gik : l V k + gik V k: l . (1.55) :l Korzystając ze wzorów (1.54) i (1.50) znajdujemy Vi: l = ∂Vi j − Iil V j . l ∂x (1.56) Wnioskujemy stąd, że zmiana wektora kowariantnego przy przeniesieniu równoległym równa się j δVi = Iik V j dxk . (1.57) 1.9. Lokalna i wzdłużna afiniczność Do pojęcia koneksji dochodzi się w przestrzeniach afinicznych, przy transformacjach do krzywoliniowych układów współrzędnych. W przestrzeniach afinicznych można więc za pomocą transformacji do pierwotnych współrzędnych kartezjańskich uczynić ją równą zeru w całej przestrzeni. W rozpatrywanych w tej teorii modelach czasoprzestrzennych jest to z założenia niemożliwe. Rozkładając koneksję we wzorze transformacyjnym (1.46) na część symetryczną i antysymetryczną, otrzymujemy ν k l ∂2 xi ∂x̄ν ∂xk ∂xl i ∂x̄ ∂x ∂x + + Ikl i α β . ∂x ∂x̄α ∂x̄β ∂x̄α ∂x̄β ∂xi e ∂x ∂x̄ ∂x̄ ν i ∂x̄ Ikl i (1.58) = e Z porównania części symetrycznych i antysymetrycznych po obu stronach tej równości wynika, że wzór (1.46) jest w istocie sumą dwóch wzorów. Jednym z nich jest wzór (1.49), a drugi ma postać ν Īαβ + ν Īαβ ν Īαβ = Ikli ∂2 xi ∂x̄ν ∂x̄ν ∂xk ∂xl + . ∂xi ∂x̄α ∂x̄β ∂x̄α ∂x̄β ∂xi Ten wzór możemy w prosty sposób przekształcić do postaci ! ν ∂2 x̄ν ∂xk ∂xl ν i ∂x̄ Īαβ = Ikl i − k l . ∂x ∂x ∂x ∂x̄α ∂x̄β (1.59) (1.60) Najcenniejszym osiągnięciem Ogólnej Teorii Względności jest myśl, że scenerią zjawisk Natury nie jest czasoprzestrzeń afiniczna. Jednocześnie metody rachunkowe teorii pola wymagają posługiwania się rachunkiem różniczkowym. W przestrzeniach afinicznych można zawsze przejść do kartezjańskiego układu współrzędnych, w którym koneksja znika, co umożliwia odejmowanie wektorów zaczepionych w różnych punktach, a tym samym tworzenie różniczek wektorów i innych wielkości tensorowych. Aby w czasoprzestrzeniach nieafinicznych również można było tworzyć różniczki wektorów, to wystarczy, by czasoprzestrzeń miała te same własności jak czasoprzestrzeń afiniczna, tylko lokalnie. Oznacza to, że musi istnieć taki układ współrzędnych, aby w dowolnie wybranym, ale ustalonym, punkcie P różniczka wektora 1.10. Zmiana długości wektora przy przeniesieniu równoległym 11 transformowała się jak wektor. Inaczej mówiąc, musimy z własności czasoprzestrzeni afinicznej zachować tylko to, co pozwala operować rachunkiem różniczkowym. Ale ze wzoru (1.60) wynika, że od koneksji Iikl nie musimy wymagać, aby lokalnie miała własności takie, jak koneksja w czasoprzestrzeni afinicznej. Wystarczy, aby te własności miała tylko część symetryczna tej koneksji. Inaczej mówiąc, wystarczy, aby istniał taki układ współrzędnych x̄ν , w którym znika część symetryczna koneksji w dowolnie wybranym, ale ustalonym punkcie P. Ze wzoru (1.60) wynika, że wystarczającym warunkiem lokalnej afiniczności czasoprzestrzeni jest całkowalność równania ∂2 x̄ν ∂x̄ν i I (P) = 0. (1.61) − ∂xk ∂xl ∂xi kl Każde rozwiązanie równań (1.61) wyznacza układ współrzędnych związany z punktem P, w którym znika część symetryczna koneksji. Znana jest i przytaczana w podręcznikach transformacja 1 x̄ν = xν − xνP + Iklν (P) xk − xkP xl − xlP , 2 (1.62) jako rozwiązanie równań (1.61). Istnienie tej transformacji jest tylko dowodem na to, że lokalną afiniczność można zrealizować, ale nie ma ona wpływu na własności strukturalne czasoprzestrzeni. Widać to stąd, że jakobian tej transformacji jest różny od zera. Można więc zawsze za pomocą transformacji odwrotnej wrócić do pierwotnego stanu. W rozdziale trzecim znajdziemy transformacje realizujące lokalną afiniczność będące rozwiązaniami równań (1.61) z jakobianem równym zeru. Konsekwencje takich transformacji są nieodwracalne. Jeśli, na przykład, realizacja lokalnej afiniczności prowadzi do własności, jakie ma elektron, to nie można tych własności zlikwidować za pomocą odwrotnej transformacji, bo taka nie istnieje. Za pomocą nieosobliwej transformacji układu współrzędnych można też spowodować znikanie części symetrycznej koneksji wzdłuż krzywej. Dla odróżnienia od lokalnej afiniczności, będziemy realizację tej afiniczności nazywać wzdłużną afinicznością. Realizacja lokalnej afiniczności wzdłuż dowolnej krzywej jest jednak mało interesująca z punktu widzenia struktury czasoprzestrzeni. Jest to ważne tylko dlatego, że tym samym dotyczy również linii geodezyjnych. Gotowymi równaniami linii geodezyjnych w czasoprzestrzeniach niesymetrycznych nie dysponujemy, bowiem takiego problemu jeszcze nikt nie rozwiązał. Musimy więc wyprowadzić te równania w oparciu o ogólną definicję linii geodezyjnej. Najpierw jednak musimy wyprowadzić wzór na zmianę długości wektora przy przeniesieniu równoległym w czasoprzestrzeniach niesymetrycznych. 1.10. Zmiana długości wektora przy przeniesieniu równoległym Korzystając ze wzoru (1.30) możemy znaleźć zmianę iloczynu skalarnego wektorów przy przeniesieniu równoległym (1.63) δ gik Ai Bk = gik (2) Ai + δAi Bk + δBk − gik (1)Ai Bk , 12 Rozdział 1. Własności pola niesymetrycznego gdzie gik (2) oraz gik (1) są wartościami gik odpowiednio w drugim i w pierwszym punkcie. Z dokładnością do małych pierwszego rzędu, mamy ∂gik Ai Bk dxl − gik Ai Islk Bs dxl − gik Bk Isli As dxl . δ gik Ai Bk = l ∂x Zamieniając odpowiednio wskaźniki, możemy ten wzór zapisać w postaci ! ∂gik s s i k − gis Ikl − gsk Iil Ai Bk dxl = gik : l Ai Bk dxl . δ gik A B = l ∂x (1.64) (1.65) Teraz możemy określić zmianę długości wektora przy jego przeniesieniu równoległym. Na podstawie wzoru (1.65), otrzymujemy (1.66) δ A2 = 2AδA = δ gik Ai Ak = gik : l Ai Ak dxl = γik : l Ai Ak dxl , więc δA = 1 γik : l Ai Ak dxl . 2A (1.67) 1.11. Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych Linią geodezyjną nazywa się krzywą posiadającą taką własność, że wektor Ui = dxi dσ (1.68) (gdzie: xi — współrzędne punktu krzywej; σ — parametr zmieniający się wzdłuż tej krzywej), styczny do niej w punkcie M, przeniesiony równolegle do bliskiego punktu N na tej krzywej, ma ten sam kierunek co wektor styczny do niej w punki cie N. Oznacza to, że różnica tych wektorów również ma ten kierunek, czyli UU , a różnica długości równa się zmianie δU długości wektora przy przeniesieniu równoległym. Zmiana ta może być dodatnia lub ujemna, w zależności od skrętności krzywej. Zgodnie z tą definicją mamy Ui i i i i U + dU − U + δU = dU − δU = ± δU. U i i (1.69) Na podstawie wzoru (1.67) zmianę długości wektora stycznego do krzywej przy jego przeniesieniu równoległym określamy jako δU = 1 1 γik : l Ui Uk dxl = γik : l Ui Uk Ul dσ. 2U 2U (1.70) Podstawiając do równania (1.69) wzory (1.68) i (1.70) oraz δUi = −Ikli Uk dxk dxl dxl dλ = −Ikli dσ, dσ dσ dσ (1.71) 1.11. Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych 13 po podzieleniu przez dσ, otrzymujemy k l dxi d2 xi i dx dx + I = ±ρ , kl dσ2 dσ dσ dσ (1.72) gdzie 1 dxk dxl dxm γ . (1.73) kl: m 2U2 dσ dσ dσ Po lewej stronie równań (1.72) występuje tylko część symetryczna koneksji, gdyż jest dxk dxl . ona symetryzowana przez iloczyn dλ dλ Wybierając parametr τ = τ(σ) spełniający równanie ρ(σ) = d2 τ dτ = ±ρ(σ) , 2 dλ dσ (1.74) można równania (1.72) sprowadzić do postaci k l d2 xi i dx dx + I = 0. kl dτ2 dτ dτ (1.75) Taki parametr nazywa się parametrem afinicznym. Równania (1.72) pokazują, że konsekwentne, zgodne z definicją, wyprowadzenie równań linii geodezyjnych prowadzi do wniosku, że istnieją dwa podstawowe ich rodzaje. Będziemy je nazywać lewoskrętnymi i prawoskrętnymi. Na lewoskrętnych geodezyjnych wektor styczny przy przeniesieniu równoległym ulega wydłużeniu (znak „+” po prawej stronie równań). Na prawoskrętnych geodezyjnych wektor styczny przy przeniesieniu równoległym ulega skróceniu (znak „-” po prawej stronie równań). Jest to niezwykle ważna różnica między tu wyprowadzonymi równaniami linii geodezyjnych i spotykanymi w podręcznikach. Wkrótce przekonamy się, że w tym szczególe tkwi zagadkowa własność oddziaływań słabych, które występują w lewoskrętnych cząstkach elementarnych, a w prawoskrętnych nie występują. Wymóg lokalnej afiniczności jest prawem geometrycznym czasoprzestrzeni i spełniać go muszą wszystkie czasoprzestrzenne modele obiektów obserwowalnych. Istnieją przypadki, gdy warunek wzdłużnej afiniczności nie może być spełniony, a jego realizacja wymaga specjalnych zabiegów. Można się domyśleć, że te przypadki dotyczą czasoprzestrzennych modeli kwarków, gdy kombinacja odpowiednich dwóch lub trzech takich subelementarnych cząstek umożliwia realizację wzdłużnej afiniczności. Rozdział 2 Równania pola niesymetrycznych czasoprzestrzeni 2.1. Zasada wariacyjna Z dotychczasowych rozważań wynika, że strukturę geometryczną czasoprzestrzeni określają tylko dwa obiekty geometryczne: niesymetryczny tensor podstawowy gik oraz niesymetryczna koneksja liniowa Iikl . Własności metryczne czasoprzestrzeni wynikają z tensora podstawowego gik , gdyż tensor metryczny γik jest jego częścią symetryczną. Odrzucamy możliwość nieistnienia związków między Iikl i gik jako całkowicie nieciekawą. Takie funkcyjne związki nazywa się równaniami pola. Najogólniej zapiszemy to jako j = 1, 2, . . . , 80 . (2.1) F j gik , Iikl = 0, Ilość tych związków określa warunek rozwiązywalności względem poszczególnych składowych wielkości gik oraz Iikl , a jest ich łącznie osiemdziesiąt. Możemy zawsze zażądać, aby funkcje F j były formalnymi pochodnymi pewnej wielkości skalarnej Λ(gik , Iikl ) względem tych funkcji. Równania (2.1) mogą więc być zapisane w postaci ∂Λ ∂Λ = 0. (2.2) = 0, ∂gik ∂Iikl Ale z tego wynika, że Λ nie może być funkcją skalarną, gdyż równania (2.2) oznaczałyby wówczas, że ta funkcja od tych wielkości nie zależy. Wielkość Λ jest więc funkcjonałem skalarnym, którego wartość zależy od wyboru na gik oraz Iikl odpowiednich funkcji ze zbioru funkcji konkurencyjnych. Równania (2.2) muszą zachodzić ∂Λ ∂Λ tylko w przypadku, gdy i l są współczynnikami przy pewnych, dowolnych ∂gik ∂Iik wielkościach, odpowiednio δgik oraz δIikl zwanych wariancjami, w równaniu δΛ = ∂Λ ∂Λ δgik + i δIikl = 0. ∂gik ∂Ikl (2.3) W ten sposób doszliśmy do warunku na ekstremum tego funkcjonału. Funkcjonał Λ przyjmuje wartości ekstremalne dla ściśle określonych funkcji gik oraz Iikl . Funkcjonał o takich własnościach możemy skonstruować dla nieskończonej, strukturalnie spójnej czasoprzestrzeni, wyodrębnionej z całego Wszechświata jako zbioru takich strukturalnie spójnych czasoprzestrzeni. W tym miejscu zwróćmy uwagę na fakt, że od rozpatrywanych tu czasoprzestrzeni nie wymagaliśmy jeszcze, aby były one 15 16 Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni lokalnie afiniczne, a to jest warunkiem istnienia tych czasoprzestrzeni. Aby tak było, to muszą one spełniać warunek (1.47). √ W poprzednim rozdziale stwierdziliśmy, że wyrażenie −gdΩ, gdzie dΩ jest elementemR czteroobjętości, jest skalarem. Skalarem jest również całka z gęstości √ skalarnej S −gdΩ. Z tensora gik oraz koneksji Iikl można utworzyć kilka różnych niezmienników, ale tylko jeden taki, który zależy od wszystkich funkcji gik oraz wszystkich funkcji Iikl : Z Z √ √ (2.4) ℜ̃ = ℜ̃ −gdΩ = gik Rik −gdΩ (posłużenie się skalarem R prowadzi do tych samych wyników). W tym wyrażeniu również stosujemy konwencję sumacyjną. Całkowanie po współrzędnych przestrzennych powinno obejmować całą trójwymiarową przestrzeń, gdyż nie ma podstaw do z góry danych, sensownych ograniczeń. Natomiast całkowanie po współrzędnej czasowej musi mieć ograniczenie, bo nieograniczone całkowanie po czasie nie ma sensu. Oznacza to, że całkowaniem obejmujemy całą trójwymiarową przestrzeń ograniczoną hiperpowierzchniami x01 = ct1 oraz x02 = ct2 . Zakładamy, że na tych hiperpowierzchniach wariacje równają się zeru, czyli δgik (t1 ) = δgik (t2 ) = δIikl (t1 ) = δIikl (t2 ) = 0. (2.5) Wariacje δgik oraz δIikl powstają również w wyniku nieosobliwych transformacji współrzędnych, które z założenia nie zmieniają struktury geometrycznej czasoprzestrzeni. Takie nieistotne wariacje możemy wykluczyć przez nałożenie na funkcje pola czterech dowolnych warunków. Zauważmy, że każda nieosobliwa transformacja układu współrzędnych jest tego typu, gdyż zawsze możemy zastosować transformację odwrotną kasującą tak powstałe wariacje. Wariacje pochodzące z transformacji układu współrzędnych, których nie możemy wykluczyć, pochodzą więc tylko od transformacji osobliwych. Istnieją rozwiązania równań falowych będące osobliwymi transformacjami układu współrzędnych. Transformacje osobliwe z natury rzeczy prowadzą do trwałych zmian struktury geometrycznej, gdyż transformacje do nich odwrotne nie istnieją. Takie transformacje są zespolonymi funkcjami czasu. Ściśle trwałe transformacje są wtedy, gdy jest to czysto urojona zależność. Gdy występuje również część rzeczywista, to takie transformacje są względnie trwałe, gdyż takie czasoprzestrzenie mają określony średni czas życia, więc ulegają rozpadowi i dalszym tego rodzaju transformacjom. Łatwo się domyśleć, że takie czasoprzestrzenie określają strukturę geometryczną cząstek elementarnych. Osobliwe transformacje układu współrzędnych, prowadzące do lokalnej afiniczności czasoprzestrzeni, nazywać będziemy kreacjami. Równanie (2.3) jest warunkiem na ekstremum funkcjonału (2.4) i to wystarcza do wyprowadzenia równań pola czasoprzestrzeni niesymetrycznych. W ten sposób możemy sformułować zasadę wariacyjną dla tych czasoprzestrzeni jako: Z √ δℜ̃ = δ gik Rik −gdΩ = 0 (2.6) z warunkami (2.5) na hiperpowierzchniach ograniczających. 17 2.2. Wyprowadzenie równań pola czasoprzestrzeni 2.2. Wyprowadzenie równań pola czasoprzestrzeni Z równania (2.6) otrzymujemy Z h i √ √ √ Rik −gδgik + gik Rik δ −g + −ggik δRik dΩ = 0. (2.7) √ Aby obliczyć δ −g zauważmy, że zgodnie z zasadą rozwijania wyznacznika mamy ∂g = ∆ki , ∂gki (2.8) gdzie ∆ki jest minorem elementu gki macierzy gki , a zgodnie z zasadą tworzenia macierzy odwrotnej oraz składowej gik , wzór (2.8) można zapisać w postaci ∂g = ggik , ∂gki (2.9) dg = ggik dgki = −ggki dgik . (2.10) √ 1√ 1 −ggki δgik . δ −g = − √ δg = − 2 2 −g (2.11) więc Na podstawie tego wzoru otrzymujemy Aby ułatwić zapis dalszych operacji wprowadźmy chwilowo oznaczenie p= √ −g. Równanie (2.7) możemy więc zapisać jako Z Z 1 Rik − gki R̃ pδgik dΩ + gik pδRik dΩ = 0. 2 (2.12) (2.13) Korzystając ze wzoru (1.67), przekształćmy teraz drugą całkę: Z Z h i ik g pδRik dΩ = pgik δIiks ,s − δIiss ,k +Itss δIikt + Iikt δItss − Itks δIist − Iist δItks dΩ. (2.14) Skorzystaliśmy tu z przemienności wariacji i różniczkowania. Zajmijmy się najpierw całką z dwóch pierwszych wyrazów w nawiasie kwadratowym. Otrzymujemy Z i h pgik δIiks ,s − δIiss ,k dΩ Z Z Z Z = pgik δIiks ,s dΩ − pgik δIiss ,k dΩ + pgik ,k δIiss dΩ − pgik ,s δIiks dΩ. (2.15) 18 Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni Pierwsze dwie całki możemy zamienić na całki powierzchniowe po hiperpowierzchniach ograniczających całą trójwymiarową przestrzeń. Wariacje δgik oraz δIkli zgodnie z warunkami (2.5) znikają na tych hiperpowierzchniach. Tak więc, te dwie całki równają się zeru. Otrzymujemy zatem Z h Z i i h s s ik (2.16) pgik ,k δIiss − pgik ,s δIiks dΩ. pg δIik ,s − δIis ,k dΩ = Podstawienie tego wyniku do (2.14) daje Z gik pδRik dΩ = Z h i pgik ,k δIiss − pgik ,s δIiks + pgik Itss δIikt + Iikt δItss − Itks δIist − Iist δItks dΩ = = Z h i = pgik ,k δIiss − pgik ,s δIiks + p gik Itss δIikt + gik Iikt δItss − gik Itks δIist − gik Iist δItks dΩ. (2.17) Teraz należy tak pozmieniać wskaźniki, uzupełniając w koniecznym przypadku tensorem Kroneckera, aby pod znakiem wariacji wszędzie było Iiks . Wyciągając następnie δIiks przed nawias otrzymujemy Z gik pδRik dΩ = Z h i (2.18) pgik ,t δks − pgik ,s +p gik Istt + glt Ilti δks − git Istk − gtk Itsi δIiks dΩ. = Podstawienie tego wzoru do równania (2.13) daje Z 1 Rik − gki R̃ p δgik + 2 o i h ik t lt i k k ik it + pg ,t δs − pg ,s +p g Ist + g Ilt δs − git Istk − gtk Itsi δIiks dΩ = 0. (2.19) Aby to równanie zachodziło dla dowolnych wariacji δgik oraz δIiks , to współczynniki przy nich muszą równać się zeru. Tak dochodzimy do szesnastu równań 1 Rik − gki R̃ = 0, 2 (2.20) które można natychmiast uprościć, gdyż mnożąc je przez gik mamy 1 1 gik Rik − gki gik R̃ = R̃ − δkk R̃ = −R̃ = 0. 2 2 W ten sposób pierwszy układ równań pola ma postać Rik = Iiks ,s −Iiss ,k +Iikt Itss − Iist Itks = 0. (2.21) (2.22) Z przyrównania do zera współczynników przy δIiks otrzymujemy drugi układ równań pola: √ √ √ −ggit ,t δks − −ggik ,s + −g gik Istt + glt Ilti δks − git Istk − gtk Itsi = 0. (2.23) Skorzystaliśmy tu z oznaczenia (2.12). 2.3. Wnioski z równań pola czasoprzestrzeni 19 2.3. Wnioski z równań pola czasoprzestrzeni 2.3.1. Wzór na pochodną kowariantną tensora podstawowego Drugi układ równań pola (2.20) nie ma zbyt przejrzystej postaci i wymaga odpo√ wiedniej obróbki. Najpierw podzielimy to równanie przez −g: 1 √ 1 √ −ggit ,t δks − √ −ggik ,s +gik Istt + glt Ilti δks − git Istk − gtk Itsi = 0. √ −g −g (2.24) Dodajmy teraz do siebie cztery równania o jednakowych wskaźnikach k, s. Jest to równoważne operacji zwężenia względem tych wskaźników. Otrzymujemy interesujący wynik, przypominający podobny z Ogólnej Teorii Względności: 1 √ 2 (2.25) −ggik ,k = −gtk Itki + gik Itkt . √ 3 e −g Dla gik = γik oraz Itki = Γitk wręcz się z tym wzorem pokrywa. Wstawienie tego wzoru do (2.23) daje 2 1 √ − √ −ggik ,s + git Iltl δks + gik Istt − git Istk − gtk Itsi = 0. 3 e −g Wykonując różniczkowanie wyrażenia w nawiasie, mamy 1 √ ik 2 it l k − gik,s − √ −g ,s g + g Ilt δs + gik Istt − git Istk − gtk Itsi = 0. 3 e −g (2.26) (2.27) Wymnożenie tego równania przez tensor gki daje czyli 1 √ 2 − gki gik,s − 4 √ −g ,s + Ilsl + 4Istt − Istt − Itst = 0, 3e −g (2.28) 1 √ 4 − gki gik,s − 4 √ (2.29) −g ,s +2Istt + Istt = 0. 3e −g Należało skorzystać ze wzoru (1.9) oraz z tego, że gki gik = δkk = 4, a po zamianie wskaźników dokonać stosownej redukcji. Ze wzoru (2.10) łatwo otrzymujemy √ ∂gik 1 ∂g 1 ∂ −g 1 √ − gki s = = 2 = 2 −g ,s . (2.30) √ √ ∂x g ∂xs −g ∂xs −g Podstawienie tego wyniku do (2.29) daje ostatecznie 2 5 1 √ −g ,s = Istt + Istt = Istt + Istt . √ 3e 3e −g (2.31) Dla Iikt = Γtik i gik = γik , wzór ten przechodzi w znany z Ogólnej Teorii Względności. Podstawiając (2.31) do równania (2.25), przerzućmy część wyrazów na drugą stronę. Otrzymujemy 2 2 gik,s + git Istk + gtk Itsi = gik Itst + git Iltl δks . (2.32) 3 e 3 e 20 Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni To równanie możemy również zapisać w postaci 2 it l k ik it k tk i l k g,s + g Ist + g Its = g Ils δt + Ilt δs . (2.33) 3 e e Wskazane jest jeszcze przeniesienie drugiego wyrazu po lewej stronie na prawą stronę oraz dodanie do obu stron wyrażenia git Itsk . Otrzymujemy w ten sposób bardzo ciekawy wynik: 1 l k 1 l k it k tk i it k ik ik g : s = g,s + g Its + g Its = 2g Its + Ils δt + Ilt δs . (2.34) 3e e 3e Lewa strona jest pochodną kowariantną tensora gik . Z postaci prawej strony natychmiast wnioskujemy o jej charakterze tensorowym. Widzimy też, że taka pochodna równa się zeru w czasoprzestrzeniach bez torsji. Dla odróżnienia od pochodnej kowariantnej w przestrzeniach Riemana, stosujemy dwukropek przed wskaźnikiem zamiast zwyczajowo przyjętego średnika. Równania (2.33) możemy zapisać w innej postaci. W tym celu wymnóżmy je przez tensor g ji gkm . Korzystając z równości gkm gik,s = −gik gkm ,s oraz ze wzoru (1.13) po prostych przekształceniach i odpowiedniej zamianie wskaźników otrzymujemy 2 s s s s gik Ils + glk Iis . (2.35) gik ,l −gsk Ili − gis Ikl = 3 e e Jeśli drugi wyraz po lewej stronie przeniesiemy na prawą stronę i od obu stron odejmiemy gsk Iils , to równanie (2.35) możemy zapisać w postaci 1 1 gik : l = gik ,l −gsk Iils − gis Ikls = 2gtk Ilit + δti Ilss + δtlIiss . (2.36) 3 3 e e e Lewa strona jest pochodną kowariantną tensora gik . Tu również jest widoczny jej tensorowy charakter i jej znikanie w czasoprzestrzeniach bez torsji. Z drugiego układu równań pola (2.20) otrzymujemy jeszcze jeden niezwykle ciekawy wniosek. Gdy zwęzimy je względem wskaźników i, s to otrzymamy √ ik −gge ,k = 0. (2.37) W ten sposób równania (2.25) automatycznie zapisują się w postaci 2 1 √ −ggik ,k = −gtk Itki + gik Itkt . √ 3 e −g (2.38) 2.3.2. Zmiana długości wektora przy jego przeniesieniu równoległym W rozdziale pierwszym był wyprowadzony wzór na zmianę iloczynu skalarnego wektorów przy ich przeniesieniu równoległym δ gik Ai Bk = gik : l Ai Bk dxl . (2.39) Korzystając z równania (2.35), które jest wnioskiem z drugiego układu równań pola, otrzymujemy 1 ts 1 ts i k l i k t δ(gik A B ) = 2gtk Ili + δi Ils + δl Iis A B dx . (2.40) e 3 e 3 e 21 2.3. Wnioski z równań pola czasoprzestrzeni Widać, że zmiana iloczynu skalarnego wektorów przy ich przeniesieniu równoległym równa się zeru tyko w czasoprzestrzeniach bez torsji. Przy przeniesieniu równoległym wektora ulega więc zmianie jego długość, gdyż na podstawie wzoru (2.40) mamy δV = 1 1 1 1 1 1 δ(V 2 ) = δ(gik V i V k ) = δ(γik V i V k ) = γtk (Ilit + δti Ilss + δtl Iiss )V i V k dxl . 2V 2V 2V V e 3 e 3 e (2.41) Gdy wektor V i jest wektorem stycznym do krzywej Vi = dxi , dσ (2.42) gdzie σ jest parametrem zmieniającym się wzdłuż krzywej, to otrzymamy 1 1 t s 1 t s dxi dxk dxl t δV = γtk Ili + δi Ils + δl Iis dσ. (2.43) V e 3 e 3 e dσ dσ dσ Pierwszy wyraz w nawiasie znika ze względu na antysymetrię względem wskaźników i, l. Mamy więc dxi dxk s dxl 2 γik Ils dσ, (2.44) δV = 3V dσ dσ e dσ ale dxi dxk = V2. (2.45) γik dσ dσ Otrzymujemy więc ostatecznie 2 (2.46) δV = VIlss dxl . 3 e Jeśli krzywa może być sparametryzowana w sposób naturalny oraz s jest jej długością łuku, wówczas dxi Ui = (2.47) ds jest jednostkowym wektorem stycznym do krzywej. Zgodnie z (2.46) mamy 2 δ(u) = Ilss dxl . (2.48) 3e Jednostkowy wektor styczny do krzywej, przeniesiony równolegle do bliskiego punktu na tej krzywej, nie jest więc wektorem jednostkowym. 2.3.3. Rozkład naturalny koneksji liniowej W rozdziale pierwszym doszliśmy do wniosku, że część symetryczna koneksji liniowej Ikli jest potrzebna do formułowania warunków lokalnej afiniczności. Wielkość ta będzie również potrzebna w równaniach linii geodezyjnych. Dlatego wyrażenie tej wielkości przez pozostałe funkcje pola jest szczególnie ważne, a wyprowadzenie takiego wzoru można uznać za najciekawszy wniosek z drugiego układu równań pola. W tym celu zapiszemy tu jeszcze raz równania (2.35): 2 gik ,l −gsk Ilis − gis Ikls = (gik Ilss + glk Iiss ). 3 e e (2.49) 22 Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni Zamieńmy w tych równaniach miejscami wskaźniki i, l: 2 glk ,i −gsk Iils − gls Ikis = (glk Iiss + gik Ilss ). 3 e e (2.50) Zamieniając w równaniach (2.49) miejscami wskaźniki k, l mamy: 2 s gil ,k −gsl Ikis − gis Ilks = (gil Iks + gkl Iiss ). 3 e e (2.51) Dodanie stronami równań (2.50) i (2.51) oraz odjęcie równań (2.49) daje 1 1 s + gkl Iiss ). γls Ikis = (gil ,k +glk ,i −gik ,l ) + gis Ikls + gsk Ilis − (gil Iks 2 3 e e e e (2.52) Przyrównując części symetryczne lewej i prawej strony względem wskaźników i, k otrzymujemy 1 1 s γls Iiks = (γli ,k +γlk ,i −γik ,l ) + gis Ikls + gks Iils − (gil Iks + gkl Iiss ). 2 ee ee 3 e e (2.53) Wskazane jest jeszcze rozłożenie tensora podstawowego w drugim nawiasie na części, symetryczną i antysymetryczną: 1 1 1 s s γls Iiks = (γli ,k +γlk ,i −γik ,l ) + gis Ikls + gks Iils − (gil Iks + gkl Iiss ) − (γil Iks + γkl Iiss ). (2.54) 2 ee ee 3 ee ee 3 e e Wymnożenie tych równań przez tensor γtl odwrotny do γls daje bardzo ciekawy wynik: 1 1 s s + gkl Iiss ) − (δti Iks + δtk Iiss ). Iikt = Γtik + γtl (gis Ikls + gks Iils ) − γtl (gil Iks 3 3 ee ee ee ee e e (2.55) Taki rozkład części symetrycznej koneksji liniowej nazywać będziemy naturalnym rozkładem, dlatego że występuje w nim symbol Christoffela Γtik odpowiedzialny za oddziaływanie grawitacyjne. Można się domyślać, że pozostałe trzy człony wyraźnie różniące się w zapisie, są odpowiedzialne za pozostałe trzy znane oddziaływania. Ujawnienie się czterech oddziaływań może być potwierdzeniem, że rozpatrywane czasoprzestrzenne modele są przede wszystkim modelami cząstek elementarnych, a to dlatego, że według obecnej wiedzy, wszystkie cztery oddziaływania manifestują się w tej dziedzinie. Oczywiście, nie wyklucza to możliwości występowania oddziaływania silnego i słabego również w obiektach astronomicznych, zwłaszcza typu gwiazd neutronowych. Występującego tu pola grawitacyjnego nie wolno zaniedbywać (co nagminnie robią wszystkie dotychczasowe teorie cząstek elementarnych), nie tylko dlatego, że nie wiadomo, czy nie odgrywa to oddziaływanie znaczącej roli na bardzo małych odległościach od centrów tych cząstek, ale przede wszystkim dlatego, że Γtik jest jedynym pseudotensorem we wzorze (2.55). Zaniedbanie tego wyrazu prowadziłoby do afiniczności czasoprzestrzeni, co jest sprzeczne z pierwotnym założeniem. 2.3. Wnioski z równań pola czasoprzestrzeni 23 2.3.4. Równania pola elektromagnetycznego Pełną identyfikacją oddziaływań zajmiemy się w następnym rozdziale, a we wzorze (2.55) warto jeszcze zwrócić uwagę na to, że czterdzieści składowych koneksji Iikt wyraża się przez dwadzieścia cztery składowe antysymetrycznej części koneksji Ikll , e dziesięć funkcji γik oraz sześć funkcji gik . Z osiemdziesięciu funkcji pola pozostało e osiemdziesiąt. Stąd wynika, że czterdziewięc tylko czterdzieści, a równań pola jest ści równań było zależnych. Skorzystaliśmy już z tego faktu, wyprowadzając kilka wzorów oraz bardziej prostych równań i jeszcze będziemy z tego korzystać. Cztery takie zależności otrzymamy z przyrównania części antysymetrycznych lewej i prawej strony wzoru (2.52) względem wskaźników i, k: 1 γls Iiks + γks Ilis + γis Ikls = (gik ,l +gli ,k +gkl ,i ). (2.56) e e e e e 2 e Przyporządkowanie (1.23) sugerowało możliwość potraktowania gik jako tensora pola e elektromagnetycznego. Tu mamy bardzo ważki argument przemawiający za trafnością takiej sugestii, gdyż w czasoprzestrzeni bez torsji lewa strona równań (2.56) znika, a wtedy otrzymujemy dosłownie pierwszą parę równań Maxwella gik ,l +gli ,k +gkl ,i = 0. (2.57) e e e Można to osiągnąć również przez wprowadzenie czteropotencjału Ai spełniającego związek Fik = Ak ,i −Ai ,k . (2.58) Wprowadzenie potencjału wektorowego automatycznie prowadzi do tożsamościowego spełniania się równań (2.57). Prowadzi to do znacznego, nieuzasadnionego uproszczenia równań pola. Dlatego, wbrew powszechnie stosowanemu zastosowaniu tego uproszczenia, nie będziemy tego potencjału wprowadzać, dopóki nie zajdzie tego wyraźna potrzeba. Do pełnej identyfikacji gik jako tensora pola elektromagnetycznego potrzebna jest jeszcze druga para równań eMaxwella. Te brakujące równania, to równania (2.37), które tu jeszcze raz przytoczymy √ ik (2.59) −gge ,k = 0. 2.3.5. Prawa zachowania Wszystkie dotychczasowe wnioski dotyczyły wyłącznie drugiego układu równań pola czasoprzestrzeni niesymetrycznych (2.22). Teraz wyprowadzimy równania będące wnioskiem z obydwu tych układów. Postać tych równań upoważni nas do potraktowania ich jako prawa zachowania dla czasoprzestrzeni niesymetrycznych. Te równania uzyskał również Einstein w swojej Teorii Pola Niesymetrycznego, ale tylko przy pewnych uproszczeniach. Tu wyprowadzimy te równania bez żadnych uproszczeń. Zauważmy najpierw, że pierwszy układ równań pola (2.2) można zapisać w postaci t (Iiks − Iitt δsk ),s = Iits Isk − Iiks Istt . (2.60) 24 Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni Różniczkując to równanie po xl , otrzymujemy t s t (Iiks − Iitt δsk ),ls = Isk Iit ,l +Iits Isk ,l −Istt Iiks ,l −Iiks Istt ,l . (2.61) √ Wymnóżmy teraz to równanie przez −ggik wchodząc z tym wyrażeniem pod znak pochodnej po xs : i √ h√ −ggik Iiks − Iitt δsk ,l ,s − −ggik ,s Iiks − Iitt δsk ,l = √ t s t = −g gik Isk Iit ,l +gik Iits Isk ,l −gik Istt Iiks ,l −gik Iiks Istt ,l . (2.62) Przenosząc drugi wyraz po lewej stronie na prawą stronę, po lewej stronie otrzymamy i h√ (2.63) −ggik Iiks − Iitt δsk ,l ,s . Prawa strona, po wykonaniu różniczkowania po xl w przeniesionym wyrazie, będzie miała postać √ √ t s t ( −ggik ),s Iiks ,l −( −ggik ),k Iitt ,l +gik Isk Iit ,l +gik Iits Isk ,l −gik Istt Iiks ,l −gik Iiks Istt ,l . (2.64) Wykażemy, że to wyrażenie jest tożsame z drugim układem równań pola (2.23) wymnożonym przez Iiks ,l , czyli że jest równe zeru. Dla uniknięcia pomyłek, musimy też zmienić wskaźniki l na j występujące w trzecim nawiasie równania (2.23). W ten sposób otrzymujemy √ √ √ ( −ggit ),t Iikk ,l −( −ggik ),s Iiks ,l + −g(gik Istt Iiks ,l +g jt Iijt Iikk ,l −git Istk Iiks ,l −gtk Itsi Iiks ,l ) = 0. (2.65) ik Zamieniając wskaźniki tak, aby wszędzie występowało g , mamy √ √ √ t s t ( −ggik ),k Iitt ,l −( −ggik ),s Iiks ,l + −g(gik Istt Iiks ,l +gik Iiks Istt ,l −gik Isk Iit ,l −gik Iits Isk ,l ) = 0. (2.66) Wyrażenie po lewej stronie jest równe (tylko z przeciwnym znakiem) wyrażeniu (2.65), które jest jednocześnie równe wyrażeniu (2.64). Mamy zatem h√ i −ggik (Iiks − Iitt δsk ),l ,s = 0. (2.67) Te cztery równania świadczą o tym, że wielkość √ Tls = −ggik (Iiks − Iitt δsk ),l (2.68) zachowuje się, a prawo zachowania tej wielkości ma postać Tls ,s = 0. (2.69) Prawo zachowania (2.67) jest również λ-niezmiennicze, co może świadczyć o tym, że nie został popełniony błąd przy tym dość skomplikowanym wyprowadzaniu. To prawo zachowania uzyskał Einstein w swojej Teorii Pola Niesymetrycznego, ale tylko dla szczególnego rodzaju pól. Przedstawiony powyżej sposób wyprowadzania dotyczy wszystkich pól spełniających równania pola niesymetrycznych czasoprzestrzeni. Einstein interpretuje to jako prawo zachowania pędu i energii. Wydaje się jednak, że jest to zbyt daleko idący wniosek. 2.3. Wnioski z równań pola czasoprzestrzeni 25 2.3.6. Dalsze wnioski z równań pola W równaniach pola występuje zwężona postać części symetrycznej koneksji, czyli Iikk . Korzystając ze wzoru (2.55) możemy tę wielkość wyrazić przez inne funkcje pola. Zwężając wzór (2.55) względem wskaźników t, k, otrzymujemy 1 s 5 (2.70) − Iiss . Iikk = Γkik + γkl gks Iils − gil Iks 3e ee 3 ee Do identyfikacji oddziaływań mogłyby posłużyć równania ruchu, ale w ich określeniu zawarte jest pojęcie „cząstki próbnej”. Takie pojecie nie ma sensu w odniesieniu do cząstek elementarnych, gdyż cząstką próbną mogłaby być tylko inna cząstka elementarna. Taka sytuacja sprowadza się do zagadnienia dwóch ciał, czyli do problemu oddziaływania dwóch różnych, czy też równoważnych czasoprzestrzeni elementarnych. Do identyfikacji oddziaływań posłużymy się więc równaniami linii geodezyjnych, które geometrycznie są uogólnieniem równań linii prostej w przestrzeni afinicznej, a fizycznie są uogólnieniem równań ruchu, bez potrzeby posługiwania się pojęciem „cząstki próbnej”. 2.3.7. Komentarz do równań pola Po operacjach przeprowadzonych na równaniach pola (2.22) oraz (2.23) możemy układ równań pola przestawić w postaci Rik = Iiks ,s −Iiss ,k +Iikt Itss − Iist Itks = 0, 2 1 √ −ggik ,k = −gtk Itki + gik Itkt , √ 3 e −g 1 √ 2 5 √ ( −g),s = Istt + Istt = Istt + Istt , 3e 3e −g 2 gik,s + git Istk + gtk Itsi = git Ilsl δkt + Iltl δks , 3 e e 2 s s s gik ,l −gsk Ili − gis Ikl = gik Ils + glk Iiss , 3 e e √ ik −gge ,k = 0, s s s gik ,l +gli ,k +gkl ,i = 2 γls Iik + γks Ili + γis Ikl , e e e e e e 1 ts 1 tl t s s t tl s s Iik = Γik + γ (gis Ikl + gks Iil ) − γ (gil Iks + gkl Iis ) − (δi Iks + δtk Iiss ), e e ie e 3 e e e he e 3 e √ ik s t s −gg (Iik − Iit δk ),l ,s = 0. (I) (II) (III) (IV) (V) (VI) (VII) (VIII) (IX) Związki te spełniają się w dowolnym układzie współrzędnych i z koneksją określoną z dokładnością do gradientu dowolnej funkcji skalarnej λ, zgodnie ze wzorem (??). Zasada wariacyjna nie wyklucza wariacji będących efektem transformacji układu współrzędnych i dowolnego wyboru czterech składowych gradientu funkcji λ. Te dowolności możemy wykluczyć przez nałożenie ośmiu dowolnych warunków na funkcje 26 Rozdział 2. Równania pola niesymetrycznych czasoprzestrzeni pola. Nie jest istotne, czy te warunki nałożymy na funkcje gik , czy na funkcje Iikl , gdyż są one ze sobą powiązane równaniami pola. W pierwszym rozdziale doszliśmy do wniosku, że jest wskazane przyjęcie dwóch warunków S = γik γlm Fil Fkm = 0, (2.71) 1 (2.72) P = eiklm Fik Flm = 0. 2 Prowadzi to do równości g = γ, co zabezpiecza nieosobliwość macierzy gik . Pozostałe sześć warunków wybierzemy tak, aby tensor metryczny γik był macierzą diagonalną. Oznacza to żądanie, aby gki = −gik dla i , k. (2.73) Tak wycechowana teoria traci niezmiennoczość, ale się ujednoznacznia i w znaczny sposób upraszcza. Z tych uproszczeń będziemy korzystali tylko przy konkretnych rozwiązaniach. Przy wyprowadzaniu ogólnych wzorów i równań nie będziemy z tych uproszczeń korzystać. Rozdział 3 Ogólne własności czasoprzestrzeni niesymetrycznych 3.1. Linie geodezyjne 3.1.1. Równania linii geodezyjnych w czasoprzestrzeniach niesymetrycznych W rozdziale drugim stwierdziliśmy, że w czasoprzestrzeniach z torsją ulega zmianie długość wektora przy jego przeniesieniu równoległym. Korzystając ze znanej definicji linii geodezyjnej musimy ten fakt uwzględnić. Linią geodezyjną nazywa się krzywą posiadającą taką własność, że wektor Ui = dxi dσ (3.1) (gdzie: xi — współrzędne punktu krzywej; σ — parametr zmieniający się wzdłuż tej krzywej), styczny do niej w punkcie M, przeniesiony równolegle do bliskiego punktu N na tej krzywej, ma ten sam kierunek, co wektor styczny do niej w punkcie N. Oznacza to, że wektor styczny jest po takim przeniesieniu nadal styczny, a zmianie ulega tylko jego długość. Ale zmiana długości oznacza jego wydłużenie lub skrócenie. Przy tym przeniesieniu zmienia się więc o ±δU. Zgodnie z tą definicją mamy (Ui + dUi ) − (Ui + δUi ) = dUi − δUi = ± Ui δU. U (3.2) W rozpatrywanych tu czasoprzestrzeniach niesymetrycznych zmianę długości wektora stycznego do krzywej przy przeniesieniu równoległym, określa wzór (2.46) 2 δU = UIlss dxl . 3 e Podstawiając do wzoru (3.2) wzory (3.1) i (3.3) oraz i δU = dx −Ikli Uk l dσ dσ − dxl dσ dσ dσ dx Ikli k (3.3) (3.4) i dzieląc całość przez dσ otrzymujemy równania linii geodezyjnych w postaci k l d2 xi 2 s dxk dxi i dx dx + I = ± Iks . kl dσ2 dσ dσ 3e dσ dσ (3.5) Widać, że istnieją dwa rodzaje linii geodezyjnych. Będziemy je nazywać lewoskrętnymi i prawoskrętnymi. Dla lewoskrętnych krzywych wektor styczny przy przeniesieniu równoległym będzie ulegał wydłużeniu (znak „plus” po prawej stronie równań). 27 28 Rozdział 3. Ogólne własności czasoprzestrzeni niesymetrycznych Dla prawoskrętnych geodezyjnych wektor styczny przy przeniesieniu równoległym będzie ulegał skróceniu (znak „minus” po prawej stronie równań). Po lewej stronie równania (3.5) występuje tylko część symetryczna koneksji, dxk dxl gdyż jest ona symetryzowana przez iloczyn . Dlatego możemy tu podstawić dσ dσ wzór (2.54), który po odpowiedniej zmianie wskaźników ma postać 1 1 s s ) − (δik Ilss + δil Iks Ikli = Γikl + γit (gks Ilts + glt Ikts ) − γit (gkt Ilss + glt Iks ). 3 3 ee ee ee ee e e Podstawiając ten wzór do równań (3.5) otrzymujemy (3.6) k k k l l l 2 it 2 s dxk dxi 2 s dxk dxi d2 xi i dx dx it s dx dx s dx dx + Γ + 2γ g I − γ g I − I = ± Iks . ks lt kt ls kl ks dσ2 dσ dσ 3e dσ dσ e e dσ dσ 3 e e dσ dσ 3 e dσ dσ (3.7) 3.1.2. Cząstki i antycząstki We wzorze (3.6) i w równaniach (3.7) występuje pseudotensor Γlik odpowiedzialny za oddziaływania grawitacyjne oraz trzy różne symetryczne tensory trzeciego rzędu, odpowiedzialne za pozostałe oddziaływania. Jedyną wielkością mogącą zmienić znak na przeciwny wszystkich oddziaływań oprócz grawitacji jest torsja Ikli . Dlatego e zmiana ∗ Iikl →Iikl = Ikil (3.8) powinna być zamianą czasoprzestrzeni na antyczasoprzestrzeń, będącą czasoprzestrzennym modelem cząstki elementarnej. Tensory dwóch oddziaływań zależą od iloczynu tensora gik i torsji. Później stwierdzimy, że ma to konsekwencje w braku e symetrii między cząstkami i ich antycząstkami. Ten brak symetrii wyjaśnia największą tajemnicę Wszechświata, że tzw. antymateria nie występuje na równych prawach z materią. 3.1.3. Oddziaływania elektromagnetyczne i słabe Wielkość skalarną 2 s dxk ρ(σ) = Iks (3.9) 3 e dσ nazywać będziemy ładunkiem słabym. Oprócz oddziaływania grawitacyjnego reprezentowanego przez symbol Γikl , zidentyfikowaliśmy w rozdziale pierwszym oddziaływanie elektromagnetyczne reprezentowane przez tensor gik . Przyjęliśmy dla niego e oznaczenie F̆ik , ale w rozdziale drugim wprowadziliśmy tensor pola elektromagnetycznego za pomocą wzoru (2.67) jako Fik = 1b gik , gdzie tensor gik spełnia uogólnione e linii geodezyjnych e równania Maxwella (2.56) i (2.59). W równaniach (3.7) tensor Fik jest wymnożony przez tensor γit , ale ten tensor nie służy do podwyższania wskaźników, więc te równania po uwzględnieniu (3.9) zapiszemy w postaci k k l l dxi dxi d2 xi dxk i dx dx it s dx dx it + Γkl + 2γ gks Ilt − ργ gkt −ρ = ±ρ , dσ2 dσ dσ dσ dσ e e dσ dσ e dσ (3.10) 29 3.1. Linie geodezyjne gdzie q = bρ. (3.11) Wielkość q nazywać będziemy ładunkiem elektrycznym. Mamy więc podstawy, aby uznać, że tensorem oddziaływania elektromagnetycznego we wzorze (3.6) jest 1 it i s s εkl = − γ gkt Ils + glt Iks . (3.12) 3 ee ee Widać, że równanie (3.10) stanowi dwa układy równań dwóch różnych linii geodezyjnych: k k l l dxk dxi d2 xi i dx dx it s dx dx it + Γ + 2γ g I − qγ F = 2ρ , (3.13) ks lt kt kl dσ2 dσ dσ dσ dσ e e dσ dσ oraz k k l l d2 xi dxk i dx dx it s dx dx it + Γ + 2γ g I − qγ F = 0. (3.14) ks lt kt kl dσ2 dσ dσ dσ e e dσ dσ Obydwa równania dotyczą tej samej czasoprzestrzeni, a różnią się wyrazem określającym najprostsze z oddziaływań. Dotychczasowe teoretyczne opracowania doświadczeń z cząstkami elementarnymi za najprostsze uznają oddziaływania słabe. Wskazują również na ich powinowactwo do oddziaływań elektromagnetycznych. W powyższych równaniach manifestuje się to tym, że istnieje wspólny tensor pola elektrosłabego. Jest nim tensor podstawowy gik . Rzeczywiście, wzór (3.6) możemy zapisać w postaci 1 it s s i i it s s (3.15) Ikl = Γkl + γ gks Ilt + gls Ikt − γ gkt Ils + glt Iks , 3 ee ee e e gdzie suma tensora oddziaływania elektromagnetycznego (3.12) i tensora oddziaływania słabego 1 i s 1 it i s s i s Λkl = − δk Ils + δl Iks = − γ γkt Ils + γlt Iks (3.16) 3 3 e e e e jest zapisana jako 1 it s s i i (3.17) εkl Λkl = − γ gkt Ils + glt Iks . 3 e e Znana jest też własność oddziaływań słabych, że występują tylko w lewoskrętnych cząstkach i prawoskrętnych antycząstkach, zaś prawoskrętne cząstki i lewoskrętne antycząstki są tych oddziaływań pozbawione. Ta zbieżność faktów wystarcza, aby uznać, że ostatni wyraz w równaniu (3.10) określa słabe oddziaływanie. 3.1.4. Oddziaływanie silne We wzorze (?? ) pozostał jeszcze do identyfikacji tensor i it s s Hkl = γ gks Ilt + gls Ikt , (3.18) ee ee a jednocześnie z czterech znanych nam oddziaływań brakuje nam w tym wzorze oddziaływań silnych. Wnioskujemy więc, że tensor Hkli , określony wzorem (3.18) jest odpowiedzialny za oddziaływanie silne. Dodatkowym argumentem na to jest wyraźnie widoczna w równaniach (3.13, 3.14) jego niezależność od ładunków ρ, q. 30 Rozdział 3. Ogólne własności czasoprzestrzeni niesymetrycznych Jest to więc niezależność ładunkowa jako znana własność silnego oddziaływania. Bardzo ważną własnością tensora silnego oddziaływania jest jego niezmienniczość ze względu na jednoczesną zamianę gik na gki oraz Ikli na Ilki . Później stwierdzimy, że konsekwencją tej niezmienniczości jest istnienie dwóch różnych kwarków w każdej generacji, na przykład kwarka u oraz kwarka d. Konsekwencją tej niezmienniczości jest również brak symetrii między materią i tzw. antymaterią. 3.1.5. Lokalna afiniczność względem koneksji będącej sumą Γikl i tensorów pozostałych oddziaływań Dodając do koneksji właściwej Γikl tensory oddziaływań silnych, elektromagnetycznych lub słabych albo wszystkie możliwe sumy tych tensorów otrzymujemy nowe koneksje. W ten sposób otrzymujemy koneksje i it i s s Lkl = Γkl + γ gks Ilt + gls Ikt , (3.19) ee ee 1 s L̇ikl = Γikl + γit gks Ilts + gls Ikts − δik Ilss + δil Iks , (3.20) 3 ee ee e e 1 s L̈ikl = Γikl + γit gks Ilts + gls Ikts − γit gkt Ilss + glt Iks , (3.21) 3 ee ee ee ee 1 it i s s i (3.22) Łkl = Γkl − γ gkt Ils + glt Iks , 3 ee ee 1 i s 1 it i s s i s i (3.23) Ł̇kl = Γkl − γ gkt Ils + glt Iks − δk Ils + δl Iks , 3 3 ee ee e e 1 i s i i i s Ł̈kl = Γkl − δk Ils + δl Iks . (3.24) 3 e e Oczywiście siódmą postacią części symetrycznej koneksji jest jej pełna postać Ikli określona wzorem (3.6), a ósmą — koneksja właściwa, czyli Γikl . Żądanie lokalnej afiniczności względem tych koneksji powoduje lokalne znikanie odpowiednich oddziaływań. 3.2. Równania falowe i funkcje falowe 3.2.1. Równania falowe Stwierdzenie, że czasoprzestrzenne modele realnych obiektów nie są afiniczne, przeznacza w tej teorii szczególną rolę transformacji (1.56). Pozwala ona ustalić warunki, aby czasoprzestrzeń była lokalnie afiniczna, co wystarcza, aby w rozpatrywanej czasoprzestrzeni można było stosować rachunek różniczkowy dla wielkości tensorowych. W rezultacie otrzymujemy równania (1.56) jako wystarczający warunek lokalnej afiniczności ∂x̄ν i ∂2 x̄ν − I (P) = 0. (3.25) ∂xk ∂xl ∂xi kl 31 3.2. Równania falowe i funkcje falowe Każde rozwiązanie tych równań wyznacza układ współrzędnych związany z punktem, w którym znika część symetryczna koneksji Ikli . Znana i przytaczana w podręcznikach jest transformacja 1 ϕ(P) : x̄ν = xν − xνP + Iklν (P)(xk − xkP )(xl − xlP ). 2 Różniczkując te funkcje otrzymujemy ∂x̄ν = δνi + Iikν (P)(xk − xkP ), ∂xi ∂2 x̄ν = Iklν (P). ∂xk ∂xl (3.26) (3.27) Podstawienie tych wyników do równania (3.25) daje Iisν (P)Ikli (P)(xs − xsP ) = 0. (3.28) Transformacja (3.26) realizuje lokalną afiniczność czasoprzestrzeni, ale spełnia równania (3.25) tylko w wybranym punkcie P oraz z odpowiednim przybliżeniem w małym otoczeniu punktu P, gdy wymiary liniowe xk − xkP są wystarczająco małe. Taka interpretacja tej transformacji podawana jest w podręcznikach. Widać, że transformację (3.26) wymyślono dla potrzeb Ogólnej Teorii Względności, aby wytłumaczyć, dlaczego dla swobodnie spadającej wzdłuż geodezyjnej cząstki próbnej, otrzymujemy d2 x̄ν = 0. Pozwala to identyfikować małe otoczenie punktu P ze styczną czasoprzeds2 strzenią Minkowskiego. Cząstka próbna (z założenia) nie zmienia własności pola, w którym się znajduje. Jest to więc realizacja lokalnej afiniczności nie wpływająca na strukturę czasoprzestrzeni. Zauważmy, że transformacja (3.26) jest nieosobliwa, więc za pomocą odwzorowania ϕ(P′ )◦ϕ−1 (P) można przejść do układu współrzędnych związanego z innym punktem P′ . Wszystkie ścisłe rozwiązania szczególne równań (3.25) można ogólnie przedstawić w postaci i α(P) : x̄ν = Kν eβi x , (Kν , βi = const). (3.29) Te transformacje są osobliwe. Każde takie rozwiązanie, gdzie βi wyraża się różnie przez stałe Iikl (P), określa czasoprzestrzeń o innych własnościach. Gdyby takie transformacje były nieosobliwe, to można by było zmieniać własności czasoprzestrzeni za pomocą odwzorowania α′ (P) ◦ α−1 (P). Osobliwość (Jakobian równy zeru) takich transformacji uniemożliwia zmianę własności czasoprzestrzeni w wyniku transformacji układu współrzędnych. Osobliwość tych transformacji jest więc ważną pozytywną własnością. Konsekwencje takich transformacji są nieodwracalne. Jeśli na przykład realizacja lokalnej afiniczności prowadzi do własności, jakie ma elektron, to nie można tych własności zlikwidować za pomocą odwrotnej transformacji, gdyż taka nie istnieje. Z postaci równań (3.25) wynika, że wszystkie współrzędne x̄ν jednakowo zależą od współrzędnych xi . Takie szczególne rozwiązania możemy więc zapisać w postaci x̄ν = Kν Ψ, (3.30) gdzie Kν są dowolnymi stałymi. Dla funkcji Ψ otrzymujemy równania ∂Ψ ∂2 Ψ − i Ykli = 0, k l ∂x ∂x ∂x (3.31) 32 Rozdział 3. Ogólne własności czasoprzestrzeni niesymetrycznych gdzie Ykli = Ikli (P). (3.32) Oznaczenie przez Ykli stałych, będących wartościami koneksji w punkcie P, należy traktować tak, że dotyczy to każdej z ośmiu wyżej wyliczonych koneksji. Wielkość Ykli może więc oznaczać również, na przykład, Γikl (P). Pozwala to uniknąć wprowadzania zbyt wielu oznaczeń. Można mieć nadzieję, że nie doprowadzi to do nieporozumień. Spośród dziesięciu równań (3.31) tylko w czterech następujących ∂2 Ψ ∂Ψ 0 ∂Ψ 1 ∂Ψ 2 ∂Ψ 3 − 0 Y00 − 1 Y00 − 2 Y00 − 3 Y00 = 0, 0 2 ∂(x ) ∂x ∂x ∂x ∂x (3.33) ∂Ψ 1 ∂Ψ 0 ∂Ψ 2 ∂Ψ 3 ∂2 Ψ − 1 Y11 − 0 Y11 − 2 Y11 − 3 Y11 = 0, 1 2 ∂(x ) ∂x ∂x ∂x ∂x (3.34) ∂Ψ 2 ∂Ψ 0 ∂Ψ 1 ∂2 Ψ ∂Ψ 3 − 2 Y22 − 0 Y22 − 1 Y22 = 0, − 3 Y22 2 2 ∂(x ) ∂x ∂x ∂x ∂x (3.35) ∂2 Ψ ∂Ψ 3 ∂Ψ 0 ∂Ψ 1 ∂Ψ 2 − 3 Y33 − 0 Y33 − 1 Y33 =0 − 2 Y33 3 2 ∂(x ) ∂x ∂x ∂x ∂x (3.36) możemy dokonać rozdzielenia zmiennych dla funkcji Ψ w postaci Ψ = T(x0 )R(x1 )Θ(x2 )Φ(x3 ). (3.37) Kombinacja liniowa uzyskanych w ten sposób rozwiązań szczególnych będzie ogólnym rozwiązaniem, ale jak już stwierdziliśmy, każde szczególne rozwiązanie jest lub może być zrealizowane w Naturze. Pozostałe równania, po podstawieniu otrzymanych rozwiązań, będą określać związki między wielkościami Yikl w rozpatrywanej czasoprzestrzeni. Postać równań (3.25) pozwoliła na chwilowe pozbycie się stałych Kν , ale należy pamiętać o zaopatrzeniu w te stałe otrzymanych rozwiązań. Podstawiając (3.37) do równań (3.33–3.36) otrzymujemy 1 dT 0 1 dR 1 1 dΘ 2 1 dΦ 3 1 d2 T − Y00 − Y00 − Y00 − Y = 0, 0 2 0 1 2 T d(x ) T dx R dx Θ dx Φ dx3 00 (3.38) 1 dR 1 1 dT 0 1 dΘ 2 1 dΦ 3 1 d2 R − Y − Y − Y − Y = 0, 11 11 11 R d(x1 )2 R dx1 T dx0 Θ dx2 Φ dx3 11 (3.39) 1 dΘ 2 1 dT 0 1 dR 1 1 d2 Θ 1 dΦ 3 − Y − Y − Y = 0, Y − 22 22 22 Θ d(x2 )2 Θ dx2 T dx0 R dx1 Φ dx3 22 (3.40) 1 d2 Φ 1 dΦ 3 1 dT 0 1 dR 1 1 dΘ 2 − Y33 − Y33 − Y33 − Y = 0. 3 2 3 0 1 Φ d(x ) Φ dx T dx R dx Θ dx2 33 (3.41) 33 3.2. Równania falowe i funkcje falowe 3.2.2. Rozwiązania równań falowych Rozwiązaniem równań (3.38–3.41) w postaci (3.37) mogą być funkcje 0 T = eβ0 x , 1 R = eβ1 x , 2 Θ = eβ2 x , 3 Φ = eβ3 x , (3.42) więc i Ψ = eβi x , i czylix̄ν = Kν eβi x , (3.43) gdzie Kν są dowolnymi stałymi. Podstawienie (3.43) do równań (3.33–3.36) prowadzi do układu równań charakterystycznych 0 1 2 3 β20 − β0 Y00 − β1 Y00 − β2 Y00 − β3 Y00 = 0, (3.44) 0 1 2 3 β21 − β0 Y11 − β1 Y11 − β2 Y11 − β3 Y11 = 0, (3.45) 0 1 2 3 β22 − β0 Y22 − β1 Y22 − β2 Y22 − β3 Y22 = 0, (3.46) 0 1 2 3 β23 − β0 Y33 − β1 Y33 − β2 Y33 − β3 Y33 = 0. (3.47) Tak dochodzimy do sposobu klasyfikowania czasoprzestrzeni według rodzaju i typu. Klasyfikacja czasoprzestrzeni według rodzaju zależeć będzie od tego, jakie oddziaływanie jest w niej dominujące. Dominującymi nazywać będziemy oddziaływania, które nie biorą udziału w realizacji lokalnej afiniczności. Klasyfikacja według typu będzie zależała od typu rozwiązania układu równań algebraicznych (3.44–3.47) względem wielkości βi . Równania (3.44–3.47) stanowią układ jednorodnych równań kwadratowych. Nie ma ogólnego warunku na rozwiązywalność takiego układu równań, jak to ma miejsce dla układu liniowych równań jednorodnych. Nie ma też ogólnej metody na rozwiązywanie takiego układu równań, więc nie można go rozwiązać inaczej niż przez kolejne podstawianie, a to prowadzi już w pierwszym podstawieniu do równań czwartego stopnia. W tym miejscu musimy podać definicję: Dowolna metoda sprowadzająca rozwiązania równania algebraicznego do wykonania ciągu operacji wymiernych i wyciągania z już znanych wielkości tych pierwiastków nazywa się rozwiązaniem przez pierwiastniki. Z teorii Galois wynika niemożliwość rozwiązania przez pierwiastniki w ogólnym przypadku równań stopnia n > 4. W ten sposób stwierdzamy niemożliwość rozwiązania układu równań (3.44–3.47) przez kolejne podstawianie. A że tego układu inaczej rozwiązywać nie można, to dochodzimy do wniosku, że bez specjalnych założeń ten układ równań jest nierozwiązywalny. Rozwiązalność równań (3.25), czyli spełnienie wystarczającego warunku lokalnej afiniczności wymaga więc nałożenia na rozwiązania układu równań (3.44–3.47) takich warunków, aby przez kolejne podstawianie uzyskać wielomian stopnia nie wyższego niż czwarty. W ogólności należy dopuszczać zespolone rozwiązania równań (3.44–3.47), a to oznacza istnienie rozwiązań równań (3.31) dla funkcji Ψ z periodyczną zależnością od czasu. Z tego powodu nazywać będziemy funkcję Ψ funkcją falową, a równania (3.31) równaniami falowymi. Rozwiązania z periodyczną zależnością od czasu są szczególnie interesujące, gdyż takie właśnie rozwiązania występują w dziedzinie cząstek elementarnych i prowadzą do zjawisk kwantowych. Takie rozwiązania cechuje 34 Rozdział 3. Ogólne własności czasoprzestrzeni niesymetrycznych całkowicie nieokreślona wartość współrzędnych x̄ν , a tym samym całkowicie nieokreślona lokalizacja zjawisk. Można tego dokonać tylko z dokładnością do prawdopodobieństwa. Wynika stąd konieczność normowania rozwiązań tak, aby lokalizacja zjawiska w całej przestrzeni miała prawdopodobieństwo równe jedności. Zaczniemy od rozpatrywania tylko periodycznych w czasie rozwiązań, gdyż dysponujemy bardzo bogatym materiałem doświadczalnym w tej dziedzinie, co nam pozwoli konfrontować otrzymane wyniki ze znanymi wynikami doświadczeń i dotychczasowymi ustaleniami teoretycznymi w dziedzinie cząstek elementarnych. Musimy jednak zagospodarować również rozwiązania z nieperiodyczną zależnością od czasu i znaleźć dla nich w Naturze obiekty, których czasoprzestrzenne modele taką zależnością od czasu się legitymują, gdyż każde rozwiązanie tych równań jest, lub może być realizowane w Naturze. Z jednej strony mamy niezagospodarowane czasoprzestrzenie z funkcjami falowymi o nieperiodycznej zależności od czasu, a z drugiej około osiemdziesięciu procent materii Wszechświata jako tzw. ciemną materię. Rozsądnym byłoby powiązanie tych faktów i uznanie, że rozwiązania z rzeczywistą zależnością od czasu opisują czasoprzestrzenie globalne, będące czasoprzestrzennymi modelami czarnych dziur. W tej dziedzinie dysponujemy niezwykle ubogim materiałem doświadczalnym, więc otrzymywane tu tego typu rozwiązania mogą mieć tylko wartość hipotez. Z tego powodu tego typu rozwiązania rozpatrzymy w dalszej kolejności. Obecnie rozpatrywane funkcje Ψ będą więc z reguły wielkościami zespolonymi. Rozwiązania równań (3.25) i mają więc postać (3.35) x̄ν = Kν eβi x , gdzie β0 z założenia jest wielkością zespoloną. Do klasyfikowania czasoprzestrzeni elementarnych pod względem typu funkcji falowej będziemy używać nazw najbardziej znanych leptonów, czyli oddziaływujących elektromagnetycznie. Będą więc funkcje falowe typu elektronowego, typu mionowego, typu taonowego oraz typu tetaonowego i lastonowego. Te dwa ostatnie leptony jeszcze nie są znane, ale w tym rozdziale udowodnimy, że istnieją, więc mogą być doświadczalnie wykryte. Nazwa laston bierze się stąd, że więcej tego typu leptonów już być nie może. Obecnie termin lepton jest zarezerwowany dla cząstek, które nie oddziaływują silnie. Na ogół przyjmuje się też, że leptony mają prostą strukturę w odróżnieniu od hadronów, które silnie oddziaływują i składają się z kwarków. Podział na leptony i hadrony bierze się stąd, że praktycznie dotychczas nie wykryto w leptonach żadnej struktury oraz silnego oddziaływania. Z praktycznych trudności nie można jednak wyciągać tak daleko idących wniosków, zwłaszcza że w tej teorii wykażemy bezpodstawność takiego podziału cząstek elementarnych. i Za pomocą funkcji Ψ = Ψ0 eβi x , sprowadziliśmy rozwiązywanie równań falowych (3.25) do problemu rozwiązywania układu równań algebraicznych (3.44–3.47). Stwierdziliśmy też, że stopień równania otrzymanego przez kolejne podstawianie nie może być wyższy niż czwarty. Aby ograniczyć stopień równań uzyskanych przez koejne podstawianie do stopnia nie wyższego niż czwarty, to należy na wielkości βi nakładać z góry określone wartości nie wyrażające się przez pierwiastki. Przy tym nie możemy dla tych wielkości dopuścić wartości zerowych, gdyż należy odrzucić możliwość transformacji układu współrzędnych pomijającej jakieś współrzędne. Przy rozwiązywaniu równań (3.44–3.47) należy brać pod uwagę, że stałe Ykli są rzeczywiste. Rzeczywisty charakter wielkości Iiki wynika z jej określenia. Dotyczy to również każdej koneksji zdefiniowanej wzorem (1.38), który wymaga, aby wektor przeniesiony równolegle do infinitezymalnie bliskiego punktu nie zmieniał jego rze- 35 3.2. Równania falowe i funkcje falowe czywistych składowych na zespolone. Z tego powodu te z góry określone rozwiązania dla βi będą wiec rzeczywiste. Każde rozwiązanie równań (3.44–3.47), spełniające wymienione wymagania, spełnia wystarczające warunki lokalnej afiniczności, więc jest lub może być realizowane w Naturze. Zaczniemy od nałożenia jednego warunku na stałe βi . Numeracja współrzędnych przestrzennych jest umowna, więc numeracja odpowiadających im stałych βk również jest umowna, a zatem bez straty na ogólności możemy przyjąć, że ten warunek dotyczy stałej β3 . Odrzucając wartość zerową widać, że można z równania (3.47) wyeliminować tę wielkość 3 β3 = Y33 . (3.48) Z równania (3.47), przy tym warunku, otrzymujemy 0 1 2 β0 Y33 + β1 Y33 + β2 Y33 = 0. (3.49) Uwzględnienie tego równania w równaniach (3.44–3.47) pozwala, przez kolejne podstawianie, uzyskać dla stałej β0 równanie czwartego stopnia. Rozwiązanie tego problemu jako dość skomplikowanego zostawimy na później. Bardziej proste rozwiązania otrzymamy nakładając na stałe βi drugi warunek. Żądamy, aby oprócz (3.48) było 1 β1 = Y11 . (3.50) Uwzględnienie tego warunku oraz warunku (3.48) w równaniu (3.45) daje 0 2 3 3 β0 Y11 + β2 Y11 = −Y33 Y11 . (3.51) A z równania (3.49) otrzymujemy 0 2 1 1 β0 Y33 + β2 Y33 = −Y11 Y33 . (3.52) Stałe β0 oraz β2 wyznaczone z tych równań byłyby rzeczywiste, co jest sprzeczne z założeniem, że stała β0 musi być zespolona. Zakładając, że obie te stałe są zespolone, czyli β0 = a0 + b0 i, β2 = a2 + b2 i, (3.53) możemy równania (3.49–3.51) zapisać jako dwa układy równań oraz 0 2 3 3 a0 Y11 + a2 Y11 = −Y33 Y11 (3.54) 0 2 1 1 a0 Y33 + a2 Y33 = −Y11 Y33 (3.55) 2 0 = 0, + b2 Y11 b0 Y11 (3.56) 0 2 b0 Y33 + b2 Y33 = 0. (3.57) Uwzględnienie wzorów (3.52) w równaniach (3.44) i (3.46) prowadzi do równań 3 1 3 2 1 0 = 0, Y00 Y00 − Y33 − a2 Y00 − Y11 a20 − b20 − a0 Y00 (3.58) 3 3 1 1 2 0 = 0, Y22 − Y33 Y22 − Y11 − a2 Y22 a22 − b22 − a0 Y22 (3.59) 36 Rozdział 3. Ogólne własności czasoprzestrzeni niesymetrycznych (3.60) 0 2 2a0 b0 − b0 Y00 − b2 Y00 = 0, (3.61) 0 2 2a2 b2 − b0 Y22 − b2 Y22 = 0. Otrzymaliśmy osiem równań na wyznaczenie czterech wielkości. Prowadzi to do związków między stałymi Yikl . Istnienie takich związków wyznacza odpowiednią symetrię w rozpatrywanej czasoprzestrzeni elementarnej. Każde rozwiązanie równań (3.54–3.61) określa transformację układu współrzędnych zapewniającą lokalną afiniczność czasoprzestrzeni elementarnej, więc jest, lub może być, realizowana w Naturze. 3.2.3. Czasoprzestrzenie odwrotne Wzorem (3.8) wprowadziliśmy pojęcie antyczasoprzestrzeni. Antyczasoprzestrzeń od czasoprzestrzeni różni się więc znakiem ładunku elektrycznego i słabego. Ze wzoru (3.6), czyli 1 1 s s s Ikli = Γikl + γit (gks Ilts + gls Iks ) − (δik Ilss + δil Iks ), (3.62) ) − γit (gkt Ilss + glt Iks 3 3 ee ee ee ee e e widzimy, że czasoprzestrzeń, w której koneksja Ikli jest zamieniona na Ilki i jednocześnie tensor podstawowy gik jest zamieniony na tensor gki , różni się od normalnej czasoprzestrzeni tylko tensorem oddziaływania słabego. Takie czasoprzestrzenie nazywać będziemy czasoprzestrzeniami odwrotnymi. Dla czasoprzestrzeni odwrotnych otrzymamy inne rozwiązania równań falowych niż dla normalnych czasoprzestrzeni. Bierze się to stąd, że w równaniach falowych (3.31) występujące tam stałe różnią się od odpowiednich stałych w czasoprzestrzeniach odwrotnych. Jeśli te stałe w czasoprzestrzeniach odwrotnych oznaczymy przez Zikl , to otrzymamy związki Zikl = Ykli 2 i s i s + δk Ils (P) + δl Iks (P) . 3 e e (3.63) Otrzymujemy stąd s s 1 0 (P), Z111 = Y11 + 43 I1s (P), Z222 Z000 = Y00 + 34 I0s s s 0 0 0 (P), Z002 = Y02 + 23 Ie Z001 = Y01 + 23 Ie 2s (P), Z03 1s 2 e 1 s s 2 2 3 Z101 = Y01 + 32 Ie 0s (P), Z02 = Y02 + 3 I0s (P), Z03 s s (P), Z2 = Y2 + 2 Ie (P), Z3 Z2 = Y2 + 2 Ie 12 12 3 1s e 32 32 3 3s e 13 s 3 s 2 (P), Z333 = Y33 + 34 I3s = Y22 + 34 I2s (P), e e 2 = Y0 + Is (P) 03 3 3s s 3 = Y03 + 32 Ie 0s (P) s s 3 3 (P). = Y13 + 32 Ie (P), Z323 = Y23 + 32 I2s 1s e e (3.64) Rozdział 4 Rozwiązania równań falowych 4.1. Funkcje falowe typu elektronowego Zachodzi sprzeczność między układem równań (3.54–3.55) i układem równań (3.56–3.57), gdyż pierwszy z nich ma nietrywialne rozwiązania, gdy wyznacznik podstawowy jest różny od zera, a drugi z nich ma nietrywialne rozwiązania, gdy ten sam wyznacznik równa się zeru. Musimy rozpatrzyć wszystkie warunki, przy których te dwa układy nie są sprzeczne i dają rozwiązania zgodne z wcześniej ustalonymi wymaganiami. Najprostszym jest przypadek, gdy wyrazy wolne w równaniach (3.54–3.55) znikają. Będzie tak, gdy 3 1 Y11 = Y33 = 0. (4.1) 0 2 a0 Y11 + a2 Y11 = 0, (4.2) 0 2 a0 Y33 + a2 Y33 = 0. (4.3) W ten sposób otrzymujemy Jednoczesne trywialne rozwiązanie tych równań oraz równań (3.56–3.57) traci sens, ale trywialne rozwiązania każdego z tych układów z osobna należy rozpatrzyć. Trywialne rozwiązanie układu (3.56–3.57) daje rzeczywiste rozwiązania dla wszystkich βi . Tego przypadku nie będziemy teraz rozpatrywać, gdyż w czasoprzestrzeniach elementarnych b0 , 0 z założenia. Trywialne rozwiązanie a0 = a2 = 0 równań (4.2–4.3) natychmiast upraszcza równania (3.58–3.61), z których otrzymujemy 1 1 3 3 b20 = −Y11 Y00 − Y33 Y00 , (4.4) 1 1 3 3 Y22 − Y33 Y22 , b22 = −Y11 (4.5) 0 2 b0 Y00 + b2 Y00 = 0, (4.6) 0 2 b0 Y22 + b2 Y22 = 0. (4.7) Związek między stałymi b0 i b2 określa również układ równań (3.56–3.57). Ten układ oraz układ równań (4.6–4.7) muszą być równoważne, dlatego w tej czasoprzestrzeni elementarnej mamy cztery równoważne rozwiązania b2 = −b0 0 Y11 2 Y11 = −b0 0 Y33 2 Y33 37 = −b0 0 Y00 2 Y00 = −b0 0 Y22 2 Y22 . (4.8) 38 Rozdział 4. Rozwiązania równań falowych Z równań (4.4–4.5) otrzymujemy b0 = ± q 3 3 1 1 −(Y11 Y00 + Y33 Y00 ), (4.9) b2 = ± q 3 3 1 1 −(Y11 Y22 + Y33 Y22 ). (4.10) Na podstawie związków (4.8) możemy ostatni wynik zapisać również, między innymi, w postaci 0 q Y11 3 3 1 1 −(Y11 Y00 + Y33 Y00 ). (4.11) b2 = ∓ 2 Y11 W tej czasoprzestrzeni zachodzi też związek 0 2 1 1 3 3 2 2 1 1 3 3 (Y11 ) (Y11 Y00 + Y33 Y00 ) = (Y11 ) (Y11 Y22 + Y33 Y22 ). (4.12) Na podstawie związków (4.8) możemy wypisać również inne tego typu związki między stałymi Yikl . Zgodnie z zapisem (3.53) stałe b0 , b2 są rzeczywiste. Konieczność 1 dostosowania funkcji falowej do miary prawdopodobieństwa wymaga, aby stała Y11 1 3 była ujemna dla dodatniej wartości współrzędnej x . Podobnie stała Y33 ma być ujemna dla dodatniej wartości współrzędnej x3 . Pozostałe wielkości Yikl muszą mieć takie wartości, aby wyrażenia podpierwiastkowe były dodatnie. Na podstawie związków (4.8) możemy określić bezwymiarową wielkość 0 0 0 0 Y11 Y00 Y22 Y33 b2 δe = = = = = . (4.13) 2 2 2 2 b0 Y11 Y33 Y00 Y22 Wprowadzając oznaczenia ωe = |b0 | c = q 3 3 1 1 −(Y11 Y00 + Y33 Y00 ), ke = |b2 | = δe |b0 | = δe ωe 1 2π = δe = δe , c λe λ (4.14) (4.15) gdzie δe jest określone wzorem (4.13) 1 ε1 = −Y11 > 0, (4.16) 3 ε3 = −Y33 > 0, (4.17) możemy funkcję falową dla tego typu czasoprzestrzeni elementarnej zapisać w postaci 2 3 2 Ψe = e−(ε2 x +ε3 x ) e±i(ke x −ωe t) . (4.18) Zostało tu uwzględnione, że funkcje sprzężone również są rozwiązaniami równań falowych. Taka funkcja falowa opisuje falę płaską, biegnącą w dodatnim kierunku linii koordynacyjnej x2 . Moduł tej funkcji maleje wykładniczo z odległością od tej linii. Ze wzoru (4.18) widać, że cząstka elementarna, której czasoprzestrzennym modelem jest opisana tu czasoprzestrzeń elementarna jest cząstką trwałą. Taką cząstką o prostej, leptonowej strukturze, jest przede wszystkim elektron. To dlatego częstość 39 4.1. Funkcje falowe typu elektronowego kołowa i liczba falowa opatrzone są indeksem „e”. Istnieją też inne cząstki elementarne, posiadające funkcję falową tego samego typu co elektron. Taką cząstką jest chociażby neutrino elektronowe, które przyjęto oznaczać symbolem νe . Uogólnimy tę zasadę oznaczania na pozostałe cząstki elementarne posiadające ten sam typ funkcji falowej. Było powiedziane, że numeracja współrzędnych przestrzennych jest przypadkowa, a to dlatego, że rozwiązywaliśmy równania dla dowolnych układów współrzędnych. Stwierdziliśmy jednak, że cząstki elementarne mają wyraźną przestrzenną symetrię centralną. Mamy więc do czynienia z problemem podobnym jak dla pola Schwarzschilda. Tam są wprowadzane współrzędne „nibysferyczne”. Jeśli posłużymy się również takimi współrzędnymi, to już nie jest obojętne dla których βi przyjmiemy te z góry określone wartości. To dlatego ustalone zostały wielkości β3 oraz β1 . Gdybyśmy wybrali β2 zamiast β1 , to wzór (4.18) opisywałby falę płaską, biegnącą w dodatnim kierunku linii koordynacyjnej x1 , która w tym układzie współrzędnych jest współrzędną radialną r. Wynik (4.18) określałby więc falę wybiegającą z początku układu współrzędnych. Taki punkt byłby źródłem fali. Pojęcie źródła jest pojęciem hydrodynamicznym, dla którego nie ma uzasadnienia w teorii czasoprzestrzeni. Dlatego taka możliwość została z góry odrzucona. We współrzędnych „nibysferycznych” linia koordynacyjna x2 jest krzywą równoleżnikową x2 = rϕ sin θ, więc wzór (4.18) określa wirującą falę. Pozwala to wyjaśnić istnienie spinu jako wirującej fali. Prędkość liniową przemieszczania się amplitudy tej fali wzdłuż linii koordynacyjnej x2 otrzymamy z przyrównania fazy do zera. Otrzymujemy w ten sposób x2 ωe =V= . t ke (4.19) Jeśli częstość kołowa obiegu tej fali równa się ω, to w płaszczyźnie równikowej, czyli dla θ = π2 , ta prędkość równa się ωr. Otrzymujemy w ten sposób ωr = ωe . ke (4.20) Na podstawie (4.15) możemy więc napisać λe ω = αe , ωe r (4.21) gdzie αe = δ1e jest bezwymiarową stałą określoną wzorem (4.13) za pomocą stałych określających strukturę geometryczną rozpatrywanej czasoprzestrzeni. Mamy też V = αe c. (4.22) Wszystko wskazuje na to, że αe jest słynną stałą struktury subtelnej elektronu. Nie przypadkowo prędkość tej fali równa się prędkości światła pomnożonej przez tę stałą. Byłaby więc to prędkość równa prędkości elektronu na pierwszej orbicie Bohra w atomie wodoru. Gdy ω = ωe , to ta wielkość określa stosunek promienia do długości fali dzielonej przez 2π, co możnaby interpretować jako stosunek klasycznego promienia elektronu do jego comptonowskiej długości fali. 40 Rozdział 4. Rozwiązania równań falowych Zinterpretowania wymaga wzór (4.14) na liczbę falową, który różni się od znanego wzoru w czasoprzestrzeni euklidesowej tym, że jest wymnożony przez bezwymiarową β1 wielkość δe określoną wzorem (4.13). Mamy również (4.16) δe = , a to oznacza, β0 βk xk że w funkcji falowej e wielkość δe jest stosunkiem czynnika skali współrzędnej przestrzennej x2 , do czynnika skali współrzędnej czasowej x0 . Efekt ten jest równoważny takiemu zakrzywieniu czasoprzestrzeni, że stosunek obwodu okręgu do promienia równa się 2πδe . 4.2. Funkcja falowa typu mionowego i taonowego Musimy wrócić do równań (3.54–3.55), których zerowe rozwiązanie a0 = a1 = 0 prowadzi do pojęcia elektronu jako trwałej cząstki elementarnej oraz innych trwałych cząstek. Dopuszczając niezerowe rozwiązania tych równań, musimy zapewnić znikanie głównego wyznacznika tego układu, co zapewnia niesprzeczność z układem (3.58–3.59). Znikanie tego wyznacznika jest zapewnione, gdy 0 0 1. Y22 = Y33 = 0, 1 1 2. Y22 = Y33 = 0, 0 1 3. Y22 = Y22 = 0, 0 1 4. Y33 = Y33 = 0, 0 1 1 0 = Y33 = 0. 5. Y22 = Y33 = Y22 W przypadku 1. z równań (3.58–3.59) otrzymujemy, że b1 = 0, a wówczas z równania (3.57) wynika, że również b0 = 0. W przypadku 2. natychmiast mamy b0 = 0. Obydwa te przypadki należy więc odrzucić. Rozpatrzymy teraz pozostałe trzy przypadki, dla których b0 , 0 oraz b1 , 0. Dla przypadku 3. z równania (3.59) otrzymujemy Y0 b1 = −b0 33 , (4.23) 1 Y33 a z równania (3.54) mamy 1 2 2 3 3 ) = 0. Y33 Y22 + (Y22 2 Postawienie (4.23) do równań (3.56–3.57) daje (4.24) 0 ! Y33 1 0 1 a0 = Y − Y00 1 , 2 00 Y33 (4.25) ! 0 1 1 Y33 0 a1 = Y 1 − Y11 . 2 11 Y33 (4.26) Podstawiając te wzory do równania (3.52) otrzymujemy s b0 = ± 0 0 ! Y33 1 1 2 (Y33 )2 1 0 2 1 1 1 2 2 3 3 0 1 . Y00 + Y33 Y00 (Y00 ) 1 2 − (Y00 ) + Y00 Y11 − Y11 1 − Y22 4 4 2 2 (Y33 ) Y33 (4.27) 41 4.2. Funkcja falowa typu mionowego i taonowego Na podstawie wzoru (4.23) otrzymujemy również s 0 0 2 0 ! Y33 1 1 (Y33 ) Y33 1 0 2 1 1 1 2 2 3 3 0 1 2 b1 = ∓ 1 (Y00 ) 1 2 − (Y00 ) + Y00 Y11 − Y11 1 − (Y22 Y00 + Y33 Y00 ). 4 2 2 Y33 4 (Y33 ) Y33 (4.28) Podstawienie wzorów (4.25–4.26) do równań (3.53) daje dla tej wielkości wynik 0 1 0 1 Y22 = Y22 = Y33 = Y33 = 0. (4.29) Należy wyraźnie zaznaczyć, że nie są to z góry narzucone, dodatkowe warunki na stałe Yikl , a tylko jeden ze sposobów likwidowania sprzeczności między układami równań. Oznacza to, że wielkości a0 , a1 , b0 , b1 mogą być dowolne ze względu na te dwa układy równań. Te cztery wielkości możemy więc wyznaczyć tylko z równań (3.52), (3.53), (3.56), (3.57), które tu dla wygody przepiszemy 1 2 2 3 3 0 1 Y00 + Y33 Y00 ) = 0, a20 − b20 − a0 Y00 − a1 Y00 − (Y22 2 (4.30) 1 2 2 0 1 3 3 a21 − b21 − a0 Y11 − a1 Y11 − (Y22 Y11 + Y33 Y11 ) = 0, 2 0 1 2a0 b0 − b0 Y00 − b1 Y00 = 0, (4.31) 2a1 b1 − 0 b0 Y11 − 1 b1 Y11 = 0. (4.32) (4.33) Natomiast z równań (3.54–3.55) otrzymujemy 1 2 2 3 3 Y33 Y22 + (Y22 ) = 0, 2 (4.34) 1 3 2 2 2 Y22 Y33 + (Y33 ) = 0. (4.35) 2 Rozwiązywanie układu równań (??) zaczniemy od równań (??). Możemy te równania zapisać w postaci 1 1 0 1 = 0, (4.36) b0 a0 − Y00 − b1 Y00 2 2 1 1 1 0 b0 Y11 − b1 a1 − Y11 = 0. (4.37) 2 2 Otrzymujemy stąd 0 1 Y11 Y00 1 1 , (4.38) a1 − Y11 = 0 2 4 a0 − 12 Y00 0 2 a0 − 12 Y00 b0 . (4.39) b1 = 1 Y00 Równania (??) możemy zapisać w postaci 1 0 a0 − Y00 2 2 − b20 1 1 1 0 1 1 1 2 2 3 3 1 − a1 − Y11 Y00 Y00 + Y33 Y00 − Y00 − Y11 Y00 + Y22 = 0, 2 4 2 (4.40) 42 Rozdział 4. Rozwiązania równań falowych 2 1 0 1 1 1 0 0 2 2 3 3 0 − − a0 − Y00 Y11 − Y00 Y11 + Y22 Y11 + Y33 Y11 = 0. − Y11 2 4 2 (4.41) Wyprowadzając oznaczenia 1 0 w = a0 − Y00 , (4.42) 2 1 0 2 1 1 1 2 2 3 3 Y00 + Y33 Y00 , (4.43) − Y11 Y00 + Y22 d0 = − Y00 4 2 1 1 2 1 0 0 2 2 3 3 d1 = − Y11 (4.44) Y11 + Y33 Y11 − Y00 Y11 + Y22 4 2 i korzystając ze wzorów (4.38–4.39), możemy równania (4.40–4.41) zapisać jako 1 1 a1 − Y11 2 b21 2 w − 0 1 2 (Y11 Y00 ) 16w2 0 1 2 Y11 (Y00 ) (4.45) b20 − − 4w2 2 0 b − Y11 w + d1 = 0. 1 2 0 (Y00 ) 4w + d0 = 0, (4.46) Eliminując z tych równań b20 , otrzymujemy równanie 6 4 w + w d0 − w 2 1 2 (Y00 ) 4 d1 − 0 2 1 4 (Y11 ) (Y00 ) 64 = 0. (4.47) Oczywiście wskazane jest podstawienie (4.48) w2 = u > 0. Otrzymujemy więc równanie trzeciego stopnia u3 + u2 d0 − u 1 2 (Y00 ) 4 d1 − 0 2 1 4 (Y11 ) (Y00 ) 64 = 0. (4.49) Wielkość w jest rzeczywista, więc liczą się tylko dodatnie rozwiązania równania (4.49). Za pomocą podstawienia 1 u = y − d0 3 (4.50) przekształcamy to równanie do postaci zredukowanej y3 + py + q = 0, (4.51) gdzie 1 1 1 2 ) d1 − d20 , (4.52) p = − (Y00 4 3 2 1 0 2 1 4 1 1 2 ) d0 d1 + d30 − (Y11 ) (Y00 ) . (4.53) q = (Y00 12 27 64 Przed przystąpieniem do rozwiązywania równania (4.51) musimy ocenić stałe występujące w określeniach współczynników tego równania, gdyż od tego zależy sposób jego rozwiązywania. Przede wszystkim należy zauważyć, że wielkość 1 2 2 3 3 0 1 Y00 + Y33 Y00 ) b20 = a20 − a0 Y00 − a1 Y00 − (Y22 2 (4.54) 43 4.2. Funkcja falowa typu mionowego i taonowego wyznaczona z równania (??) oraz wielkość 1 2 2 0 1 3 3 b21 = a21 − a0 Y11 − a1 Y11 − (Y22 Y11 + Y33 Y11 ) 2 (4.55) wyznaczona z równania (??) muszą być dodatnio określone w każdym punkcie, czyli dla każdej wartości stałych Yikl . Ograniczając rozważania do dodatnich wartości 2 3 współrzędnych xi stwierdziliśmy już, że stałe Y22 i Y33 muszą być ujemne, więc stałe 3 3 2 2 Y00 , Y00 , Y11 , Y11 muszą być dodatnie. Mamy więc 2 Y00 > 0, 3 Y00 > 0, 2 Y11 > 0, 3 Y11 > 0. (4.56) 0 1 1 0 Jeśli z założenia stałe a0 i a1 muszą być ujemne, to stałe Y00 , Y11 , Y00 , Y11 muszą być dodatnie. Mamy więc 0 Y00 > 0, 1 Y11 > 0, 1 Y00 > 0, 0 Y11 > 0. (4.57) Oczywiście dla ujemnych wartości współrzędnych xi wszystkie te stałe muszą być ujemne. Dla tak dobranych wartości tych stałych, stałe b20 i b21 będą dodatnie, niezależnie od otrzymanych rozwiązań równania (??). Warunki, jakie powyżej nałożyliśmy, ograniczają ilość rozwiązań. Spowodowane jest to tym, że zgodnie z wnioskiem (4.57) wielkość w określona wzorem (??) może być dla dodatnich wartości x0 tylko ujemna, podczas gdy wzór (??) dopuszcza ujemne i dodatnie wartości w niezależnie od znaku współrzędnej x0 . Dlatego pozostawimy wzór (??)bez zmiany, ale będziemy pamiętać, że znak plus rezerwowany jest 0 dla ujemnej wartości współrzędnej x0 . Wtedy oczywiście zmienia się również znak Y11 na ujemny. Otrzymane rozwiązania będą miały postać stabilną, więc cząstki, które te rozwiązania reprezentują, zaliczamy do stabilnych. Przed przystąpieniem do rozwiązywania równania (??) wypiszemy też znane wzory wyrażające związek między współczynnikami tego równania i jego rozwiązaniami y1 + y2 + y3 = 0. (4.58) p = y1 y2 + y2 y3 + y3 y1 , (4.59) q = −y1 y2 y3 , (4.60) Zachodzą też związki y21 + y22 + y23 = −2p, 2 D = (y1 − y2 )(y1 − y3 )(y2 − y3 ) = −4p3 − 27q2 . (4.61) y3 + py = −q. (4.63) (4.62) Można wykazać, że gdy wyróżnik D jest dodatni, to równanie (??) ma wszystkie trzy pierwiastki rzeczywiste. Natomiast, gdy D > 0, to jeden pierwiastek jest rzeczywisty, a dwa pozostałe są zespolone, wzajemnie sprzężone. Równanie (??) rozwiążemy metodą trygonometryczną. W tym celu zapiszemy to równanie w postaci Stosując podstawienie r y=z 4 |p| 3 (4.64) 44 Rozdział 4. Rozwiązania równań falowych otrzymujemy r 3 r 4 4 |p| + zp |p| = −q. z3 3 3 3 q Pomnożenie tego równania przez |p| 4z3 + 3z (4.65) daje 4 |p| 3 p =C= |p| 3q q |p| . (4.66) 4 |p| 3 To równanie możemy w zależności od znaku p zapisać w jednej z dwu możliwych postaci 4z3 + 3z = C, (4.67) 4z3 − 3z = C. (4.68) 4 cos3 α − 3 cos α = cos 3α. (4.69) Równanie (4.67) otrzymujemy w przypadku, gdy p > 0. Ten przypadek nas nie interesuje, gdyż ze wzoru (??) wynika, że p jest ujemne. Równanie (4.68) rozwiążemy w dwóch przypadkach, gdy |C| < 1 oraz gdy C > 1. W pierwszym przypadku otrzymujemy wyróżnik D > 0, a w drugim D < 0. Zajmiemy się najpierw tym pierwszym przypadkiem, o którym już wiemy, że prowadzi do wszystkich trzech pierwiastków rzeczywistych. W tym przypadku stosujemy wzór na cosinus kąta potrójnego Z porównania tego wzoru z równaniem (4.68) wynika, że rozwiązaniem jest (4.70) z = cos α takiego kąta α, dla którego cos 3α = C, czyliα = 1 arc cos C. 3 (4.71) W pełnym zakresie zmienności C kąt α zmienia się więc w zakresie 0 < α < π3 . Ale 2 cos 3α = cos(3α + 2π) = cos 3(α + π) 3 (4.72) 2 cos 3α = cos(3α − 2π) = cos 3(α − π). 3 Mamy więc trzy rozwiązania z1 = cos α (4.73) oraz 2 z2 = cos(α + π), 3 4 2 z3 = cos(α − π) = cos(α + π). 3 3 (4.74) (4.75) (4.76) 45 4.2. Funkcja falowa typu mionowego i taonowego Zgodnie ze wzorem (4.64) mamy więc r r 4 4 2 y1 = |p| cos α, y2 = |p| cos(α+ π), 3 3 3 r y3 = 4 4 |p| cos(α+ π). (4.77) 3 3 Te pierwiastki spełniają równanie (4.58), gdyż zachodzi tożsamość 4 2 cos α + cos(α + π) + cos(α + π) ≡ 0. 3 3 (4.78) Spełnia się też tożsamość 2 4 3 cos2 α + cos2 (α + π) + cos2 (α + π ≡ . 3 3 2 (4.79) Korzystając z ostatniej tożsamości można stwierdzić spełnianie się wzoru (4.61). Oczywiście, po uwzględnieniu, że w tym przypadku |p| = −p. Spełniają się też tożsamości 2 4 sin α + sin(α + π) + sin(α + π) ≡ 0, (4.80) 3 3 3 4 2 (4.81) sin2 α + sin2 (α + π) + sin2 (α + π) ≡ . 3 3 2 Ustaliliśmy, że rozwiązania równania (??) muszą być dodatnie, więc ze wzoru (??) wnioskujemy, że również rozwiązania równania (??) muszą być dodatnie, a nawet większe od wielkości 13 d0 . Musimy więc ustalić zakresy zmienności rozwiązań (4.77), gdyż z równania (4.58) wynika, że mogą być najwyżej dwa dodatnie rozwiązania. Jeśli α zmienia się w pełnym zakresie określonym warunkiem (4.71), to rozwiązanie y1 jest w tym zakresie dodatnie, a y2 jest w tym zakresie ujemne, więc nie może być w ogóle brane pod uwagę. Rozwiązanie y3 jest w tym zakresie i ujemne, i dodatnie. Zakres zmienności α musimy więc dobrać tak, aby y3 było również tylko dodatnie. Możemy tego dokonać za pomocą przesunięcia fazowego wielkości α o wartości 61 π. Na takie przesunięcie pozwala tożsamość (4.78). Rozwiązanie y2 będzie po tym przesunięciu nadal ujemne. Rozwiązania y1 i y3 mają teraz postać r 4 π y1 = |p| cos(α + ), (4.82) 3 6 r r r 4 4 4 π 4 3 y3 = |p| cos(α + + π) = |p| cos(α + π) = |p| sin α. (4.83) 3 6 3 3 2 3 Sprowadziliśmy w ten sposób te rozwiązania do pierwszej ćwiartki zmienności kąta α, co ułatwi dalszą analizę tych rozwiązań. Przede wszystkim musimy zgodnie ze wzorem (??) ograniczyć zakres zmienności α tak, aby dla obydwu tych rozwiązań wielkość u była dodatnia. W ten sposób łatwo znajdujemy, że √ √ 3 d0 3 d0 π arc sin (4.84) p < α < − + arc cos p . 6 6 6 |p| |p| Po tym przesunięciu uwidacznia się zasadnicza różnica między tymi dwoma rozwiązaniami, gdyż y1 jest funkcją parzystą argumentu α+ π6 , a y3 jest funkcją nieparzystą 46 Rozdział 4. Rozwiązania równań falowych argumentu α. Te funkcje przyjmują te same wartości, ale dla różnych wartości α, czyli w różnych punktach czasoprzestrzeni. Parzystość rozwiązania y1 sprawia, że cząstka, którą to rozwiązanie reprezentuje może istnieć również przy ujemnych wartościach argumentu α + π6 , czyli również dla odpowiedniego zakresu ujemnych α, podczas gdy rozwiązanie y3 jest dla ujemnych wartości α niedopuszczalne. Jak następnie stwierdzimy, poza tymi różnicami obie cząstki mają tę samą częstość, czyli te same masy oraz ten sam czas życia. Są więc pod tym względem nierozróżnialne. Konsekwencjami tego niezwykle ciekawego problemu zajmiemy się później, a teraz zajmiemy się dalszymi ustaleniami dla tych cząstek. Możemy już wyznaczyć stałe a0 , b0 , a1 , b1 potrzebne do określenia stałych β0 , β1 , które są potrzebne do określenia funkcji falowych dla tych dwóch rozwiązań, czyli dla tych dwóch czasoprzestrzeni elementarnych. Wielkości wyznaczone za pomocą rozwiązania y3 oznaczymy symbolami a′0 , b′0 , a′1 , b′1 . Ze wzoru (??) oraz wzorów (??) i (4.82–4.83), otrzymujemy sr w1 = − π 1 4 |p| cos(α + ) − d0 . 3 6 3 (4.85) Uwzględnione tu zostało, że w dla dodatnich wartości współrzędnej x0 jest ujemne. Na podstawie wzoru (??) możemy więc wyznaczyć stałą a0 1 0 1 0 a0 = Y00 + w1 = Y00 − 2 2 sr 4 π 1 |p| cos(α + ) − d0 . 3 6 3 (4.86) Z równania (??) możemy też wyznaczyć b20 b20 = w21 − 0 1 2 Y11 (Y00 ) 4w1 r + d0 = 4 π 2 1 |p| cos(α + ) + d0 + r q 3 6 3 4 0 1 2 Y11 (Y00 ) 4 |p| cos(α 3 , + π6 ) − 31 d0 (4.87) więc v u r u u u u u π 2 1 t 4 b0 = ± |p| cos(α + ) + d0 + r q 3 6 3 4 0 1 2 Y11 (Y00 ) 4 |p| cos(α 3 . (4.88) . (4.89) + π6 ) − 13 d0 Na podstawie wzoru (??) i (4.86) otrzymujemy 0 1 Y11 Y00 1 1 1 1 1 = Y11 + − rq a1 = Y11 1 0 2 4 4(a0 − 2 Y00 ) 2 4 3 0 1 Y11 Y00 |p| cos(α + π6 ) − 13 d0 47 4.2. Funkcja falowa typu mionowego i taonowego Stałą b1 możemy wyznaczyć za pomocą wzoru (??) 0 2 a0 − 12 Y00 b1 = b0 = 1 Y00 sr 4 2 π 1 =∓ 1 |p| cos(α + ) − d0 3 6 3 Y00 v u r u u 0 1 2 u u Y11 (Y00 ) u π 2 1 t 4 . |p| cos(α + ) + d0 + r q 3 6 3 4 4 |p| cos(α + π6 ) − 13 d0 3 (4.90) Ten wzór możemy zapisać w postaci s rq q 4 4 0 1 2 |p| cos2 (α + π6 ) + 31 d0 43 |p| cos(α + π6 ) − 29 d20 + 14 Y11 (Y00 ) |p| cos(α + π6 ) − 31 d0 . b1 = ∓ Y21 3 3 00 (4.91) Stałe a′0 , b′0 , a′1 , b′1 potrzebne do wyznaczenia funkcji falowej czasoprzestrzeni eler 4 |p| sin α otrzymamy mentarnej, dla której rozwiązaniem równania (??) jest y3 = 3 π oczywiście z nieprimowanych wielkości przez zmianę funkcji cos α + na funk6 cję sin α we wszystkich powyższych wzorach. W ten sposób otrzymujemy sr 4 1 1 0 − |p| sin α − d0 , (4.92) a′0 = Y00 2 3 3 v u r u u u u Y0 (Y1 )2 u 2 1 t 4 ′ , (4.93) b0 = ± |p| sin α + d0 + r q 11 00 3 3 4 4 |p| sin α − 13 d0 3 a′1 b′1 = ∓ 2 1 Y00 sr 0 1 Y11 Y00 1 1 1 , = Y11 − r q 2 4 4 |p| sin α − 31 d0 3 (4.94) v u r u u 0 1 2 u Y11 (Y00 ) u 1 u 2 1 4 t 4 |p| sin α − d0 |p| sin α + d0 + r q . 3 3 3 3 4 4 |p| sin α − 31 d0 3 (4.95) Ostatni wzór zapiszemy również w postaci: v u sr t r 4 4 4 1 2 1 0 1 2 1 2 |p| sin2 α + d0 |p| sin α − d20 + Y11 (Y00 ) |p| sin α − d0 . b′1 = ∓ 1 3 3 9 4 3 3 Y00 3 (4.96) 48 Rozdział 4. Rozwiązania równań falowych Dokładniejszą analizę otrzymanych tu wyników przeprowadzimy dopiero po wyznaczeniu parametrów funkcji falowej ostatniego już leptonu, gdyż pozostało jeszcze tylko jedno możliwe rozwiązanie równania (??). 4.2.1. Funkcja falowa typu lastonowego To rozwiązanie otrzymamy z równania (4.68) dla przypadku, gdy C > 1. Łatwo można stwierdzić, że wyróżnik D jest wtedy ujemny, więc istnieje tylko jedno rozwiązanie rzeczywiste i dwa sprzężone rozwiązania zespolone, które nas nie interesują. Do rozwiązania tego równania można użyć znanej tożsamości. 4 cosh3 α − 3 cosh α = cosh 3α. (4.97) Z porównania tego wzoru z równaniem (4.68) wynika, że rozwiązaniem tego równania jest z = coshα, (4.98) gdzie 1 arccosh C. (4.99) 3 Na podstawie wzoru (4.64) stwierdzamy więc, że interesującym nas rozwiązaniem równania (??) jest r 4 1 y= |p| cosh arccosh C . (4.100) 3 3 α= Stosując związek między cosinusem hiperbolicznym i logarytmem naturalnym, możemy sprowadzić ten wzór do postaci s s r r 3 1 1 2 1 2 1 3 3 1 1 yλ = − q + q + p + − q− q + p3 (4.101) 2 4 27 2 4 27 zgodnej ze wzorem Cardana dla rzeczywistego pierwiastka równania trzeciego stopnia (??) w przypadku ujemnej wartości wyróżnika D. Indeks λ wprowadzamy dla odróżnienia od innych rozwiązań. Teraz już możemy wyznaczyć wielkości a0 , b0 , a1 , b1 , co pozwoli określić β0 i β1 , a tym samym określić funkcje falowe rozważanego tu przypadku. Dla odróżnienia od poprzednich dwóch rozwiązań, oznaczymy te stałe symbolami a′′0 , b′′0 , a′′1 , b′′1 . Wzory na te stałe otrzymamy (4.86), (4.88), (4.89), (4.2), (4.91), przez r ze wzorów 4 π na yλ określone wzorem (4.101) |p| cos α + prostą zamianę rozwiązania 3 6 r 1 1 0 a′′0 = Y00 − yλ − d0 (4.102) 2 3 v u u 0 1 t 1 Y11 (Y00 )2 2 ′′ , (4.103) b0 = ± yλ + d0 + q 3 4 1 yλ − 3 d0 49 4.2. Funkcja falowa typu mionowego i taonowego 0 1 1 1 1 Y Y00 a′′1 = Y11 , − q 11 2 4 1 yλ − 3 d0 v r u u 0 t 1 2 1 Y11 (Y00 )2 1 2 ′′ . b1 = ∓ 1 yλ − d0 yλ + d0 + q 3 3 4 Y00 1 yλ − 3 d0 Ostatni wzór zapiszemy również w postaci s r 2 2 1 1 1 0 1 2 b′′1 = ∓ 1 (Y00 ) y2λ + d0 yλ − d20 + Y11 yλ − d0 . 3 9 4 3 Y00 (4.104) (4.105) (4.106) Chcąc przypisać trzy osobne rozwiązania odpowiednim cząstkom, musimy te rozwiązania ze sobą porównać. Będziemy kierowali się żądaniem, aby znana już cząstka, czyli taon miała mniejszą częstość fali niż jeszcze nieznane leptony. v u u t 0 1 2 Y (Y ) 2 1 00 11 (4.107) ωτ = |b0 |c = c y1 + d0 − q 3 4 1 y1 − 3 d0 jako częstość kołową fali cząstek typu taonowego, która jest mniejsza od częstości kołowej fali cząstek typu lastonowego v u u 0 1 t 1 Y11 (Y00 )2 2 . ωλ = |B0 |c = c y1 + d0 − q (4.108) 3 4 1 y1 − d0 3 Podobnie jak dla cząstek typu mionowego określamy średni czas życia cząstek typu taonowego r 1 0 1 στ = −a0 c = −c Y00 + y1 − d0 > 0 (4.109) 2 3 oraz średni czas życia cząstek tupu lastonowego r 1 0 1 σλ = −A0 c = −c Y00 − y1 − d0 > 0. 2 3 (4.110) Średni czas życia cząstek typu lambdonowego jest więc krótszy niż cząstek typu taonowego. Wprowadzamy, podobnie jak dla funkcji falowych typu elektronowego i mionowego, oznaczenia kτ = |b1 | = δτ |b0 | = δτ ωτ 2πδτ = c λτ 0 1 1 1 1 Y Y00 τ1 = −a1 = − Y11 > 0, − q 11 2 4 1 y1 − 3 d0 (4.111) (4.112) 50 Rozdział 4. Rozwiązania równań falowych 1 2 , τ2 = − Y22 2 (4.113) 1 3 τ3 = − Y33 , 2 (4.114) gdzie 2 δτ = 1 Y00 r 1 y1 − d0 3 (4.115) jest stałą struktury subtelnej taonu. Stosując powyższe oznaczenia, możemy funkcję falową typu taonowego zapisać w postaci k α −δ t τ Ψτ = eβk x = e−τα x 1 e±i(kτ x −ωτ t) , gdzie α = 1, 2, 3. (4.116) Dla funkcji falowych typu lambdonowego wprowadzamy oznaczenia kλ = |B1 | = δλ |B0 | = δλ ωλ 2πδλ , = c λλ 0 1 1 Y11 Y00 1 1 λ1 = −A1 = − Y11 + q , 2 4 y1 − 31 d0 (4.117) (4.118) 1 2 , λ2 = − Y22 2 (4.119) 1 3 , λ3 = − Y33 2 (4.120) gdzie 2 δλ = 1 Y00 r 1 y1 − d0 3 (4.121) jest stałą struktury subtelnej lambdonu. Stosując powyższe oznaczenia, możemy funkcję falową typu lambdonowego zapisać w postaci k α −σ Ψλ = eβk x = e−λα x λt e±(kλ x −ωλ t) , l (4.122) gdzie α = 1, 2, 3. Widać, że taon i tetaon są cząstkami bliźniaczymi. Różnią się tylko częstością fali funkcji falowej i średnim czasem życia. Można powiedzieć, że tetaon jest po prostu ciężkim taonem. 4.2.2. Lokalna i wzdłużna afiniczność Do pojęcia koneksji dochodzi się w przestrzeniach afinicznych, przy nieliniowych transformacjach układów współrzędnych. W przestrzeniach afinicznych można więc za pomocą transformacji współrzędnych uczynić ją równą zeru w całej przestrzeni. Przyjmując nazwę koneksja lokalnie afiniczna, żądamy, aby lokalnie miała ona takie własności jak koneksja w przestrzeniach afinicznych. Możliwość spełnienia warunku 4.2. Funkcja falowa typu mionowego i taonowego 51 lokalnej afiniczności daje wzór transformacyjny (1.44). Rozkładając tam koneksję afiniczną na część symetryczną i antysymetryczną otrzymujemy k ν l ∂x̄ν ∂xk ∂xl ∂2 xi ∂x̄ν ν i ∂x̄ ∂x ∂x ν + Īαβ + I = Ikli Īαβ + . (4.123) kl i ∂x̄α ∂x̄β ∂xi ∂x̄α ∂x̄β ∂x̄α ∂x̄β ∂xi ∂x e e Z porównania części symetrycznych i antysymetrycznych po obu stronach tej równości wynika, że wzór (1.44) jest w istocie sumą dwóch wzorów. Jednym z nich jest wzór (1.46), a drugi ma postać ∂xk ∂xl ∂2 xi ∂x̄ν + . = ∂x ∂x̄α ∂x̄β ∂x̄α ∂x̄β ∂xi Ten wzór możemy w prosty sposób przekształcić do postaci ! ν ∂2 x̄ν ∂xk ∂xl i ∂x̄ ν Īαβ = Ikl i − k l . ∂x ∂x ∂x ∂x̄α ∂x̄β ν Īαβ ν i ∂x̄ Ikl i (4.124) (4.125) Ze wzoru (1.56) wynika, że można określić warunki, aby czasoprzestrzeń lub wybrana podczasoprzestrzeń była afiniczna. Wymaga to, aby w odpowiednim układzie współrzędnych część symetryczna koneksji równała się zeru w całej czasoprzestrzeni lub w wybranej podczasoprzestrzeni. Dlatego określenie tych warunków wyniknie ze znikania części symetrycznej koneksji. Ze wzoru (1.57) wnioskujemy, że warunkiem wystarczającym znikania części symetrycznej koneksji w tym układzie jest całkowalność równania ∂x̄ν i ∂2 x̄ν I = 0. (4.126) − ∂xk ∂xl ∂xi kl Różniczkując to równanie i podstawiając drugą pochodną wyznaczoną z równa∂3 x̄ν ∂3 x̄ν nia (1.58), możemy na podstawie równości s k l = k s l otrzymać równa∂x ∂x ∂x ∂x ∂x ∂x nie ∂x̄ν i i i t i t − I + I (4.127) I I − I I st kl kt sl = 0. ∂xi lk,s ls,k Wielkość w nawiasie jest tensorem, więc jeśli równa się zeru w jednym układzie współrzędnych, to równa się zeru w każdym układzie współrzędnych. Jeśli więc i i Silks = Ilk,s − Ils,k + Isti Iklt − Ikti Islt = 0, (4.128) to równanie (1.59) spełnia się dla dowolnej transformacji współrzędnych. Tensor Silks jest tensorem krzywizny utworzonym ze składowych symetrycznej części koneksji. Dla odróżnienia od tensora krzywizny Rilks , określonego wzorem (1.43), będziemy go nazywać tensorem ugięcia. Jeśli uwzględnimy założone wcześniej znikanie torsji, to ten warunek sprowadza się do znikania tensora krzywizny. W całej czasoprzestrzeni ten warunek (z założenia) nie może być spełniony. Pozostaje więc rozpatrzenie spełnienia tego warunku w różnych jej podczasoprzestrzeniach. Ale w nieafinicznych czasoprzestrzeniach zapewnienie możliwości różniczkowania daje już sama lokalna afiniczność, czyli w każdym, dowolnie wybranym, ale ustalonym punkcie P jako najprostszej podczasoprzestrzeni. Sprowadza się to do problemu rozwiązania równań (1.58) w postaci ∂x̄ν i ∂2 x̄ν − (4.129) I (P) = 0. ∂xk ∂xl ∂xi kl Rozdział 5 Kwarki. Uwagi ogólne Otrzymane rozwiązania szczególne równań falowych x̄ν = Kν eai x e±i(b1 x −b0 x ) i 2 0 (5.1) są funkcjami zespolonymi. Posługiwanie się współrzędnymi zespolonymi nie jest czymś nowym, gdyż jest stosowana tzw. kompleksyfikacja czasoprzestrzeni. Takie rozwiązanie można by interpretować podobnie jak w mechanice kwantowej jako prawdopodobieństwo, że lokalna afiniczność czasoprzestrzeni elementarnej jest realizowana w punkcie o współrzędnych (x0 , x1 , x2 , x3 ). Oczywiście miarą tego prawdopodobieństwa byłby wówczas kwadrat modułu odpowiednio unormowanych funkcji (5.1). Istnienie rozwiązań zespolonych (5.1) wzbogaca strukturę czasoprzestrzeni i prowadzi do problemu istnienia pochodnej zespolonej, a tym samym również do rozwiązań w postaci funkcji analitycznych. Nie można też pominąć możliwości istnienia rozwiązań dwuokresowych w postaci funkcji Weierstrassa i innych funkcji eliptycznych. Prowadzi to do istnienia cząstek rezonansowych i objaśnienia w ten sposób znanej klasyfikacji Reggego dla tych cząstek. Możemy uniknąć zespolonych rozwiązań równań falowych, przyjmując jako dwa niezależne rozwiązania. i i (5.2) oraz x̄ν = Kν eai x sin b2 x2 − b0 x0 x̄ν = Kν eai x cos b1 x1 − b0 x0 Rozwiązania (transformacje) (5.1) lub (5.2) powinny lokalnie spełniać te warunki, jakie spełniają współrzędne kartezjańskie w czasoprzestrzeni afinicznej w każdym jej punkcie. Jeśli jednak w czasoprzestrzeni afinicznej koneksja znika we współrzędnych kartezjańskich w każdym jej punkcie, to znika również wzdłuż linii geodezyjnych, którymi są linie proste. W rozpatrywanych przez nas czasoprzestrzeniach współrzędne x̄ν mają więc realizować nie tylko znikanie części symetrycznej koneksji w dowolnym, ustalonym punkcie, ale również wzdłuż dowolnej, ale ustalonej linii geodezyjnej. Własność znikania częsci symetrycznej koneksji wzdłuż wybranej krzywej będziemy nazywali wzdłużną afinicznością. W czasoprzestrzeniach typu cząstki powinno to mieć miejsce wzdłuż krzywej typu czasowego. Każda krzywa gładka tego typu, o nieograniczonej długości, może być czasową linią koordynacyjną x0 . Dlatego żądamy, aby we współrzędnych x̄ν znikała część symetryczna koneksji wzdłuż linii geodezyjnej, będącej również linią koordynacyjną x0 . Łatwo widzieć, że w rozpatrywanych czasoprzestrzeniach wzdłużna afiniczność nie jest realizowana, gdyż wszystkie funkcje pola, a więc również składowe części symetrycznej koneksji są wzdłuż tej linii funkcjami uwikłanymi funkcji (5.2), są więc wzdłuż tej linii funkcjami periodycznymi współrzędnej x0 . W ten sposób składowe 53 54 Rozdział 5. Kwarki. Uwagi ogólne części symetrycznej koneksji nie mogą być wielkościami stałymi wzdłuż tej krzywej. W szczególności nie mogą być równymi zeru. Wynika stąd, że współrzędne x̄ν nie w pełni spełniają w czasoprzestrzeni nieafinicznej tę samą rolę co współrzędne kartezjańskie w czasoprzestrzeni afinicznej. Chociaż współrzędne x̄ν nie realizują wzdłużnej afniniczności, to istnieje bardzo prosty sposób na utworzenie czasoprzestrzeni, w której realizowana jest wzdłużna afiniczność. Aby na początku zbytnio problemu nie komplikować, rozważmy rozwiązanie (5.2) dla przypadku, gdy a0 = 0. Dla takiego rozwiązania, wzdłuż linii koordynacyjnej x0 , otrzymujemy x̄ν = Kν cos(b0 x0 ). (5.3) Takie rozwiązanie jest cyklicznie zmienne w czasie, ale jest trwałe. Dopuśćmy również istnienie czasoprzestrzeni, w której lokalną afiniczność realizują współrzędne i ξ̄ν = Kν eci ξ cos(d1 ξ1 − d0 ξ0 ) (5.4) oraz czasoprzestrzeni, w której lokalną afiniczność realizują współrzędne i η̄ν = Kν e gi η cos(h2 η2 − h0 η0 ). (5.5) Liniowe transformacje nie zmieniają postaci równań falowych. Dlatego dokonajmy teraz prostej liniowej transformacji układu współrzędnych ξ0 = b0 0 2π x + , d0 3d0 (5.6) b0 0 4π x + , (5.7) h0 3h0 pozostawiając resztę współrzędnych bez zmian. Niech też te dwie czasoprzestrzenie będą tego samego rodzaju, co pierwsza, tzn. że c0 = g0 = 0. Są to również czasoprzestrzenie cyklicznie zmienne w czasie, ale trwałe. W czasoprzestrzeni będącej sumą tych trzech czasoprzestrzeni, wzdłuż linii koordynacyjnej x0 , otrzymujemy 4 2 0 ν ν ν ν ν 0 0 ȳ = x̄ + ξ̄ + η̄ = K cos b0 x + cos b0 x + π + cos b0 x + π ≡ 0. (5.8) 3 3 η0 = W takiej czasoprzestrzeni wzdłuż wspólnej linii koordynacyjnej x0 funkcje pola są stałe. Stałe są więc również części symeryczne koneksji, które możemy zawsze uznać za równe zeru. Tak więc w takiej czasoprzestrzeni współrzędne realizujące lokalną afiniczność spełniają wzdłuż linii koordynacyjnej x0 tę samą rolę, co współrzędne kartezjańskie w czasoprzestrzeni afinicznej. W takich czasoprzestrzeniach operacja różniczkowania jest dobrze określona. Prawa fizyczne w takich czasoprzestrzeniach mogą być formułowane za pomocą równań różniczkowych. Takie czasoprzestrzenie mogą być obserwowane bezpośrednio w eksperymentach. Poszczególne składowe czasoprzestrzenie nie spełniają tych warunków, więc nie mogą samodzielnie istnieć. Oczywiście, dla drugiego z rozwiązań (5.2) otrzymamy takie same wyniki. Podobnie, wystarczy założyć istnienie czasoprzestrzeni będącej sumą dwóch czasoprzestrzeni, mających wspólną linię koordynacyjną x0 , ale mających wzdłuż tej 55 linii przesunięcie fazowe o π. Niech x̄ν oraz ξ̄ν będą współrzędnymi określonymi wzorami, odpowiednio (5.2) i (5.4) z tym samym założeniem, że a0 = c0 = 0. Dokonując transformacji π b0 (5.9) ξ 0 = x0 + , d0 d0 otrzymujemy h i ȳν = x̄ν + ξ̄ν = Kν cos(b0 x0 ) + cos(b0 x0 + π) ≡ 0. (5.10) Tak samo jak w poprzednim przypadku realizowana jest wzdłużna afiniczność wzdłuż całej linii koordynacyjnej x0 . Oczywiście, podobne wyniki otrzymamy dla drugiego z rozwiązań (5.2). To te składowe czasoprzestrzenie nazwano kiedyś kwarkami. I próżno szukano ich samodzielnego istnienia, bo wszystkie rozwiązania równań (5.1) i (5.2) nie spełniają podstawowego warunku, jakim jest afiniczność wzdłuż wybranej całej krzywej typu czasowego. W ten sposób możemy stwierdzić, że wszystkie cząstki elementarne muszą składać się z kwarków, gdyż tylko taka struktura umożliwia korzystanie z tożsamości trygonometrycznych (5.8) i (5.10). Rozważyliśmy dla uproszczenia tylko rozwiązania ze stałymi a0 = c0 = g0 = 0. W ogólniejszym przypadku można również dobrać odpowiednie transformacje liniowe tak, aby możliwe było korzystanie z tożsamości (5.8) i (5.10). Stałe ai oraz bi występujące w rozwiązaniu (5.2) zależą od składowych części symetrycznej odpowiedniej koneksji, określonej w rozpatrywanym punkcie P. W trzecim rozdziale stwierdziliśmy, że istnieje osiem różnych rodzajów koneksji. Wynika stąd, że istnieje osiem rozwiązań typu (5.2), różniących się rodzajami koneksji. Istnieje więc również osiem rodzajów kwarków. Tylko struktura kwarkowa pozwala realizować wzdłużną afiniczność czasoprzestrzeni elementarnych, więc wszystkie cząstki elementarne muszą mieć strukturę kwarkową. Jeśli fizycy pozwolili sobie na wprowadzenie zmysłowych nazw dla odróżniania kwarków w postaci kolorów i zapachów, to można by dalej bawić się w tego typu nazewnictwo. Jeśli kwarki są kolorowe i pachnące, to mogłyby mieć osiem różnych smaków. Jestem jednak przeciwny wprowadzaniu do fizyki tego typu nazw. Realizacja lokalnej i wzdłużnej afiniczności przez różne rodzaje koneksji jest odpowiedzialna za istnienie cząstek elementarnych pozbawionych określonych oddziaływań. Przykładowo, jeśli realizuje to koneksja 1 it i i s s Łkl = Γkl − γ gkt Ils + glt Iks , (5.11) 3 ee ee to takie cząstki nie oddziaływują silnie. Takie cząstki nazywa się (obecnie) leptonami. Trzeba tu jeszcze raz podkreślić, że takie cząstki nie są całkowicie pozbawione silnego oddziaływania, że jest ono w tych cząstkach tylko na tyle mocno osłabione, że stosowanymi obecnie metodami nie jest wykrywalne. Wymienione wyżej przykłady (5.3–5.5) zastosujemy najpierw do kwarków, w których lokalną afiniczność realizuje koneksja właściwa, czyli Γikl . Takie kwarki nazywać będziemy kwarkami Γ. W cząstkach elementarnych składających się z takich kwarków dominującymi są oddziaływania silne, elektromagnetyczne i słabe. Tylko grawitacja, tak jak w każdym przypadku, jest (z założenia) bardzo osłabiona. To tego (i tylko tego) rodzaju kwarki są obecnie uznane przez fizyków. Pozostałe siedem rodzajów kwarków nie są im znane , ale mają z nimi do czynienia w eksperymentach, 56 Rozdział 5. Kwarki. Uwagi ogólne co miesza szyki wszelkich prób usystematyzowania zbioru cząstek elementarnych i stworzenia jakiejś sensownej teorii tych cząstek. Zauważmy, że zgodnie ze wzorem 1 i s 1 it s s i s i i it s s Ikl = Γkl + γ gks Ilt + gls Ikt − γ gkt Ils + glt Iks − δk Ils + δl Iks , (5.12) 3 3 ee ee ee ee e e cześć symetryczną koneksji antykwarka otrzymujemy z tego wzoru przez podstawienie e Ikli = Ilki , czyli 1 it 1 i s i it s s i s s i s e Ikl = Γkl − γ gks Ilt + gls Ikt + γ gkt Ils + glt Iks + δk Ils + δl Iks . (5.13) 3 3 ee ee ee ee e e i Przy tej samej koneksji Γkl należy też uwzględnić istnienie kwarków odwrotnych, ⌢ to znaczy takich, w których tensor g ik = gki . W takich kwarkach część symetryczną koneksji określa wzór ⌢ 1 it 1 i s it i s s s s i s i Ikl = Γkl − γ gks Ilt + gls Ikt + γ gkt Ils + glt Iks − δk Ils + δl Iks . (5.14) 3 3 ee ee ee ee e e Przy tej samej koneksji Γikl należy też uwzględnić istnienie również antykwarków ⌢ odwrotnych, to znaczy takich, w których e Ikli = Ilki oraz g ik = gki . W takich kwarkach część symetryczną koneksji określa wzór ⌢ 1 i s 1 it s s i s s i it s i e (5.15) Ikl = Γkl + γ gks Ilt + gls Ikt − γ gkt Ils + glt Iks + δk Ils + δl Iks . 3 3 ee ee ee ee e e Koneksja antykwarka odwrotnego różni się od koneksji kwarka tylko znakiem ostatniego członu, czyli tylko znakiem tensora oddziaływań słabych. Istnieją więc kwarki i kwarki odwrotne. Taką parę kwarków nazywać będziemy generacją. Z porównania wzorów (5.13) i (5.14) wynika, że w kwarku odwrotnym tensor oddziaływania silnego oraz tensor oddziaływania elektromagnetycznego mają przeciwny znak niż kwark, natomiast tensor oddziaływania słabego jest tego samego znaku. Kwarki oraz cząstki składające się z kwarków trwałych, w których lokalna afiniczność realizowana jest przez koneksję właściwą Γikl , nazwiemy pierwszą generacją. Kwarki należące do tej generacji nazwiemy kwarkami górnymi (up). Kwarki odwrotne należące do tej generacji nazwiemy kwarkami dolnymi (down). Oznaczymy je odpowiednio, przez „u” oraz „d”. Interesujące jest, że spośród cząstek składających się z kwarków trwałych, tylko protony są cząstkami trwałymi. Neutrony ze średnim czasem życia 0, 917 · 103 sek ulegają rozpadowi na proton, elektron i antyneutrino elektronowe ν̄e . Żadna ze znanych koncepcji teoretycznych nie umie wytłumaczyć, dlaczego cząstka składająca się z kwarków trwałych nie jest trwała. W ramach tej teorii postaramy się teraz tę dziwną sytuację wyjaśnić. Wyżej stwierdziliśmy, że prawdziwie elementarnymi cząstkami są tylko kwarki. Wszystkie cząstki dotychczas nazywane elementarnymi są tworami złożonymi z odpowiednich kwarków. Trzeba więc uwzględniać, że własności cząstek będących sumą odpowiednich kwarków wynikają z własności linii geodezyjnej wiążącej kwarki. Z kolei własności tej linii zależą od własności poszczególnych kwarków wzdłuż tej linii. 57 Poza tą linią, we własnych układach współrzędnych, kwarki zachowują swoje indywidualne własności. To dlatego w protonie stwierdza się istnienie ładunku ujemnego obok dwóch ładunków dodatnich. Równania linii geodezyjnych czasoprzestrzeni, więc również kwarków, określa wzór (3.7) z rozdziału trzeciego. k k k l l l 2 it 2 r dxk dxi 2 r dxk dxi d2 xi i dx dx it s dx dx r dx dx + Γ + 2γ g I − γ g I − I = ± Ikr . ks kt kl lt lr kr ds2 ds ds 3e ds ds e e ds ds 3 e e ds ds 3 e ds ds (5.16) Wprowadzamy naturalny parametr s, gdyż dla kwarków z założenia ds = γik dxi dxk , 0. Te równania możemy zapisać w postaci gdzie k k l l d2 xi 2 it dxk 2 dxi 2 dxi i dx dx it s dx dx + Γ + 2γ g I − γ g q − q = ± q , ks lt kt kl ds2 ds ds 3 ds 3 ds e e ds ds 3 e ds (5.17) dxl (5.18) q = q(s) = Ilrr ds e jest wielkością skalarną, którą nazywać będziemy ładunkiem słabym. Periodyczna zależność współrzędnych x̄ν od współrzędnej x0 powoduje, że kwarkom nie można przypisać stałych wartości ładunków, takich jak + 32 i − 13 . Takie stałe wartości można „przydzielić” kwarkom tylko jako amplitudy ładunków. Jeśli w cząstce trójkwarkowej, zgodnie ze wzorem (5.8) wprowadzimy nazwy: — czerwony, dla kwarka nieprzesuniętego fazowo, — zielony, dla kwarka przesuniętego o 32 π, — niebieski, dla kwarka przesuniętego o 34 π, to widzimy, że takie ustalenie jest tylko chwilowe, że kwarki zmieniają swój kolor w czasie. Fizycy wprowadzili pojęcie koloru, jako dodatkową kwantową wielkość, umożliwiającą rozróżnianie cząstek będących w stanie podstawowym, opisywanym przez symetryczną funkcję falową. Tu widać, że pojęcie koloru nie ma istotnego znaczenia. Z postaci równań (5.14) wynika, że możemy przyjąć takie ustalenie, które zgadza się z doświadczalnym ustaleniem, że tylko lewoskrętne cząstki oraz prawoskrętne antycząstki oddziałują słabo. Musimy w tym miejscu ustalić, co rozumiemy przez pojęcie skrętności cząstki elementarnej. Powszechnie uważa się, że cząstki elementarne posiadają wewnętrzny moment pędu nazywany spinem. Sugeruje to, że spin zależy od masy. Wiemy jednak, że tak nie jest, że przykładowo elektron i mion posiadają taki sam spin równy 21 ~. Do braku konsekwencji fizyka cząstek elementarnych już nas przyzwyczaiła. Tłumaczy się to zazwyczaj niezwykłością tych elementarnych tworów. Prezentowana teoria w takich przypadkach odkrywa jakiś brak wiedzy o tych cząstkach. Również w tym przypadku musimy wprowadzić istotne uściślenie pojęcia skrętności cząstki elementarnej. Pojęcie skrętności przypisuje się krzywym. Nie można mówić o lewej, czy też prawej skrętności całej rozpatrywanej czasoprzestrzeni. Dlatego, gdy zapisujemy równanie linii geodezyjnej kwarka, to musimy ustalić, czy ma to być lewoskrętna, czy też prawoskrętna linia geodezyjna. Następnie wskazana jest przyjęta w rozdziale trzecim zasada, że znak „plus” w równaniach tych linii mają geodezyjne lewoskrętne w czasoprzestrzeniach oraz prawoskrętne w antyczasoprzestrzeniach, natomiast 58 Rozdział 5. Kwarki. Uwagi ogólne znak „minus” mają geodezyjne prawoskrętne w czasoprzestrzeniach oraz lewoskrętne w antyczasoprzestrzeniach. Jeśli więc mówimy, że kwark jest lewoskrętny, to nie mamy na myśli jakiegoś bąka wirującego w lewo, a tylko to, że w równaniach (5.16) lewoskrętnych linii geodezyjnych tego kwarka zapisujemy znak „plus”. Prawoskrętnym kwarkiem nazywać będziemy takie kwarki, których linie geodezyjne mają znak „minus”. Dla antykwarków, czyli takich kwarków, w których koneksją pełną jest e Ikli = Ilki , należy zmienić te znaki na przeciwne. Jest to tylko czysto formalna umowa. Oczywiście, konsekwencją takiej umowy będzie istnienie, bądź nieistnienie, oddziaływania słabego w równaniach linii geodezyjnych kwarków. W układzie złożonym z kwarków będą więc występować zarówno lewoskrętne jak też prawoskrętne linie geodezyjne. Natomiast o skrętności takiego układu i o istnieniu oddziaływania słabego możemy mówić tylko w odniesieniu do linii geodezyjnej wiążącej kwarki. Będzie to zależało od skrętności kwarków wzdłuż tej linii. Dlatego musimy wypisać równania linii geodezyjnych różnych odmian kwarków. W ten sposób z równań (5.17), dla lewoskrętnego kwarka uL otrzymujemy k k l l 2 it dxk 4 dxi d2 xi i dx dx it r dx dx + Γ + 2γ g I − γ g q = q , kr lt kt kl ds2 ds ds 3 ds e e ds ds 3 e ds (5.19) k k l l d2 xi 2 it dxk i dx dx it r dx dx + Γ − 2γ g I + γ g q = 0. kr lt kt kl ds2 ds ds e e ds ds 3 e ds (5.20) k k l l 2 it dxk d2 xi i dx dx it r dx dx + Γ + 2γ g I − γ g q = 0, kr lt kt kl ds2 ds ds e e ds ds 3 e ds (5.21) k k l l 2 it dxk 4 dxi d2 xi i dx dx it r dx dx + Γkl − 2γ gkr Ilt + γ gkt q =− q . ds2 ds ds 3 ds e e ds ds 3 e ds (5.22) a dla lewoskrętnego antykwarka ūL mamy Natomiast dla prawoskrętnego kwarka uP otrzymujemy a dla prawoskrętnego antykwarka ūP mamy Natomiast dla lewoskrętnego kwarka dL otrzymujemy k k l l d2 xi 2 it dxk 4 dxi i dx dx it r dx dx + Γ − 2γ g I + γ g q = q , (5.23) kr kt kl lt ds2 ds ds 3 ds e e ds ds 3 e ds a dla prawoskrętnego kwarka dP oraz lewoskrętnego antykwarka d¯L otrzymujemy k k l l 2 it dxk d2 xi i dx dx it r dx dx + Γ − 2γ g I + γ g q = 0, kr lt kt kl ds2 ds ds e e ds ds 3 e ds (5.24) d2 τ 4 dτ = q(s) , 2 ds 3 ds (5.25) Można dobrać parametr τ spełniający równanie względem którego prawa strona w równaniu (5.18) równa się zeru. Taki parametr nazywa się parametrem afinicznym. Względem tego parametru równania (5.18) zapisują się w postaci k k l l 2 it dxk d2 xi i dx dx it r dx dx + Γkl + 2γ gkr Ilt − γ gkt q = 0, dτ2 dτ dτ e e dτ dτ 3 e dτ (5.26) 59 Całkując równanie (5.26) dla całki pierwszej otrzymujemy R 4 dτ 3 = κe qds , ds (5.27) gdzie κ jest stałą dowolną, czyli drugim parametrem obok parametru naturalnego s. Parametr afiniczny τ jest więc funkcją od dwóch parametrów τ = τ(κ, s). Na podstawie równań (5.18), dla lewoskrętnego kwarka uL , równania linii geodezyjnych we współrzędnych x̄ν oraz względem parametru s mają postać λ λ λ κ κ κ d2 x̄ν 2 ντ 4 ρ dx̄κ dx̄ν ρ dx̄ dx̄ ρ dx̄ dx̄ ν dx̄ dx̄ ντ + Γ̄ + 2 γ̄ − γ̄ = Ī , (5.28) ḡ ḡ Ī Ī κρ κτ κλ λτ ds ds λρ ds ds ds2 ds ds 3 3 κρ ds ds e e e e e a dla prawoskrętnego kwarka uP , na podstawie (5.19), mamy κ λ λ λ κ κ 2 ντ d2 x̄τ ρ dx̄ dx̄ ρ dx̄ dx̄ ν dx̄ dx̄ ντ + Γ̄ − 2 γ̄ − γ̄ = 0. ḡ ḡ Ī Ī κρ κτ κλ λτ λρ ds2 ds ds 3 e e ds ds e e ds ds (5.29) Dla lewoskrętnego antykwarka ūL , na podstawie równania (5.23), mamy κ λ λ λ κ κ d2 x̄ν 2 ντ 4 ρ dx̄κ dx̄ν ρ dx̄ dx̄ ρ dx̄ dx̄ ν dx̄ dx̄ ντ + Γ̄ − 2 γ̄ + γ̄ = − Ī . (5.30) ḡ ḡ Ī Ī κρ κτ κλ λτ λρ ds2 ds ds 3 κρ ds ds e e ds ds e e ds ds 3 e Dodatek A Geneza pojęć przestrzeni i czasu Sukces Ogólnej Teorii Względności w geometryzacji oddziaływania grawitacyjnego zachęcił wielu fizyków do poszukiwań tzw. teorii wszystkiego. Było to w czasach, gdy to oznaczało geometryczną unifikację grawitacji i elektromagnetyzmu, gdyż oddziaływania silne i słabe nie były jeszcze znane. Obecnie również są fizycy, którzy w geometrycznej unifikacji wszystkich oddziaływań widzą szanse na rozwiązanie trudnych problemów w fizyce. Powstaje natychmiast pytanie: dlaczego geometryzacja ma być panaceum na dolegliwości fizyki współczesnej. Prezentowana tu teoria wykazuje, że modele czasoprzestrzenne, a więc geometryczne, wszystkich zjawisk i obiektów Natury, przedstawiają prawdziwy ich obraz. Wytłumaczenie, dlaczego tak się dzieje, wymaga zgłębienia przynajmniej podstaw mechanizmu postrzegania otoczenia przez człowieka. Przyzwyczailiśmy się traktować Wszechświat jako obiektywnie istniejące ciała materialne, umieszczone w obiektywnie istniejącej przestrzeni, niczym rodzynki w cieście. Bierze się to stąd, że w naszych wrażeniach zmysłowych obiekty materialne prezentują się nam w takiej właśnie, przenikliwej i nienamacalnej szacie. Z pojęciem przestrzeni łączy się w jakiś tajemniczy sposób inny — równie tajemniczy i nienamacalny twór — czas. W życiu codziennym, wykonując różne czynności, nie analizujemy istoty pojęć przestrzeni, czasu i materii oraz ich wzajemnego powiązania. Fizyków taka analiza obowiązuje i dlatego powinni szukać odpowiedzi, między innymi, na następujące proste pytanie: dlaczego obiekty materialne mają tę samą własność rozciągłości, co sama przestrzeń? W tym pytaniu kryje się jeden z najbardziej podstawowych problemów poznania. Stąd następne pytanie. Poznania czego i przez kogo? — To człowiek jako obserwator (w najszerszym sensie tego słowa) ma poznać siebie i swoje otoczenie. To człowiek, czy też cała ludzka cywilizacja jako część (drobna część) Wszechświata, stoi przed zadaniem poznania całego Wszechświata. Powstaje natychmiast jeszcze bardziej podstawowe pytanie: czy materia może poznać samą siebie? — gdyż do tego ostatecznie sprowadza się ten problem. Należy najpierw ustalić, co rozumiemy przez poznanie. Jeśli przez poznanie rozumie się poznanie istoty materii, to należy agnostycznie stwierdzić, że materia samej siebie poznać nie może. Jest natomiast możliwe poznanie w sensie odwzorowania porządków całości w pewnej części tej całości. Ten problem rozstrzygnęła już matematyka, a dokładniej — teoria mnogości. Można mianowicie odwzorować cały zbór mocy continuum w jego części o mocy continuum. Nie można więc wykluczyć możliwości poznania (odwzorowania) porządków Wszechświata w jego części, tym bardziej, gdy bogata jest struktura tej części. Nie będzie przesady, jeśli zaryzykuje się twier- 61 62 Dodatek A. Geneza pojęć przestrzeni i czasu dzenie, że struktura sieci neuronalnej ludzkiego mózgu, a zwłaszcza stanów tej sieci, przewyższa bogactwem strukturę całej reszty Wszechświata. Chemia związków węgla w najdoskonalszym znanym nam wydaniu, obleczonym w ludzką skórę, pozwala na więcej niż odwzorowanie porządków otoczenia. To z tego powodu nauka odżegnuje się od parapsychologii i mistycyzmu. Jest to wyrazem obrony przed przewartościowaniem poznawczym, przed nadużywaniem bogactwa struktury naszych mózgów przy odwzorowywaniu porządków otoczenia. Z historii nauki wiemy, że miało to już nieraz miejsce i dlatego niezbędna jest wnikliwa selekcja tego, co jest istotne w poznawaniu otoczenia, od tego, co człowiek chciałby otoczeniu niepotrzebnie przypisać. Człowiek dysponuje takimi pojęciami jak duch, myśl, uczucie, melodia, dźwięk, barwa, które nie występują w otoczeniu, a stanowią tylko funkcję naszej mózgowej materii. Niektóre z tego rodzaju pojęć służą do odwzorowywania porządków otoczenia oraz ustalania naszego z nim związku. Myśl, że przestrzeń i czas mogą również należeć do tej kategorii pojęć wydaje się absurdalna, gdyż te pojęcia są od nas jak gdyby niezależne i bardzo ściśle związane z obiektami otoczenia, a poza tym, czujemy się jakby zanurzeni w tej zewnętrznej przestrzeni. Można powiedzieć, że wręcz widzimy ją na zewnątrz siebie. Ale czy to prawda? Fotony podrażniają siatkówki naszych oczu, a podrażnienia zakończeń nerwowych, po skomplikowanej obróbce i kodowaniu, docierają do mózgu, gdzie odbywa się percepcja wzrokowa. Nie jest to więc proste rzutowanie, a bardzo skomplikowane odwzorowanie porządków otoczenia. W rezultacie otrzymujemy nie zewnętrzne, a wewnętrzne widzenie — „the inner show”, jak to nazywa David Bohm w książce „Relativity”. To wewnętrzne widzenie jest odwzorowaniem porządków otoczenia na kanwie przestrzeni stanów sieci neuronalnej mózgu. Pojęcia przestrzeni i czasu, podobnie jak dźwięk i barwa, są tylko naszymi, ludzkimi tworami, które w Naturze nie występują. Pojęcia przestrzeni i czasu, jakie jawią się w naszej jaźni, nie stanowią zbiorów dobrze uporządkowanych. Dopiero kontakt z otoczeniem i niektóre porządki otoczenia (na przykład zegar) porządkują te zbiory, określając w nich metrykę i kolejność zdarzeń. Podczas snu, czy też w doświadczeniach izolujących człowieka od bodźców otoczenia, porządki w tej naszej czasoprzestrzeni bywają silnie zakłócone, ale doznawanie pojęcia przestrzeni i czasu we śnie, najlepiej świadczy o tym, że są one naszą, a nie otoczenia własnością. Fakt, że to my sami w kontakcie z otoczeniem, modelujemy jego porządki za pomocą naturalnie nam danych pojęć przestrzeni i czasu, umyka naszej uwadze. Wiadomo jednak, że każdy automat cybernetyczny musi być wyposażony w taśmę diagramową, na której zapisuje dane o stanie własnej struktury oraz struktury otoczenia (maszyny Turinga). Bez takiej taśmy automat cybernetyczny nie może działać. Automaty biologiczne też muszą taką taśmę posiadać. Można ją zlokalizować, ale nie można jej namacać, gdyż jest to niematerialna struktura wygenerowana w naszych mózgach na bazie sieci neuronalnej. Pojęcie wymiaru, tzn. trójwymiarowość tej „taśmy”, a dodając czas — jej czterowymiarowość, również nie jest własnością otoczenia i da się również wytłumaczyć na bazie sieci neuronalnej naszego mózgu. Korzystania z tej „taśmy” człowiek uczy się od urodzenia, w aktywny sposób badając jej własności za pomocą wszystkich zmysłów. Oczywiście ludzie pozbawieni od urodzenia pewnych zmysłów, zwłaszcza wzroku, mają zubożone pojęcie przestrzeni. 63 Możemy nawet domyśleć się, w jaki sposób sieć neuronalna generuje czasoprzestrzenną strukturę. Ośrodek decyzyjny w mózgu musi bez przerwy porównywać ze sobą wartości różnych bodźców, aby zadysponować odpowiednie działanie. Do mózgu docierają informacje o bezwzględnych wartościach bodźców, gdyż czujniki zmysłowe nie działają różnicowo. Wyniku takiego porównania dostarczyć więc musi sieć neuronalna, która jest zespołem neuronów oraz synapsów pobudzających i hamujących, odpowiednio ze sobą połączonych. Taki układ może realizować dowolne funkcje logiczne. Musimy znaleźć warunki, jakie powinna spełniać sieć neuronalna, aby za pomocą funkcji logicznych można było dokonywać porównywania dwóch wartości i stwierdzić, która z nich jest większa. Neurony są elementami cyfrowymi, których stopień pobudzenia oraz progi zadziałania mogą być w sposób ciągły modyfikowane. Sieć neuronalna może więc realizować nie tylko dwuznaczeniowe funkcje logiczne oparte na pojęciach „absolutnej prawdy” i „absolutnego fałszu” („ jedynki” i „zera”), ale również funkcje logiki ciągłej, oparte na pojęciach porównawczych: „mniej”, „więcej”, „bliżej”, „dalej”, „wcześniej”, „później”, „ jaśniej”, „ciemniej” itp. W takiej logice operuje się pojęciem stopnia prawdziwości. Wartości zmiennych p, q oraz wartości funkcji logicznych przyjmują dowolne wartości z przedziału (0, 1). W tym również wartość „0” i „1”. Funkcje logiczne można jednakowo zapisać zarówno w logice dwuznaczeniowej, jak też w logice ciągłej tego typu, jeśli określimy alternatywę jako wybór wartości większej, czyli 1 p ∨ q ≡ max(p, q) = (p + q + /p − q/), 2 (A.1) koniunkcję jako wybór wartości mniejszej, czyli 1 p ∧ q ≡ min(p, q) = (p + q − /p − q/) 2 (A.2) p̄ ≡ 1 − p. (A.3) oraz negację jako Są podstawy, aby przypuszczać, że w procesie myślowym sieć neuronalna realizuje logikę dwuznaczeniową, w której jest określone pojęcie „absolutnej prawdy” i „absolutnego fałszu”, a do odwzorowywania porządków otoczenia posługuje się logiką ciągłą, w której te pojęcia nie są określone. Nie jest też określony stopień prawdziwości wielkości p, q. Negację można w tym przypadku określić jako p̄ = −p, a zakres zmienności argumentów oraz funkcji logicznych rozszerzyć do całej osi liczb rzeczywistych (−∞, +∞). (Pojęcie negacji oraz wartości ujemnej generują synapsy hamujące). Negacja w takiej logice nie jest funkcją logiczną. Za pomocą wyżej zdefiniowanych funkcji alternatywy i koniunkcji oraz znanych związków między funkcjami logicznymi, możemy formalnie określić wszystkie pozostałe funkcje logiczne. Pomijając funkcje powtarzające lub negujące swoje argumenty, otrzymujemy w ten sposób 64 Dodatek A. Geneza pojęć przestrzeni i czasu następujące określenia pozostałych funkcji logicznych implikacja implikacja równoważność różnica symetryczna funkcja Sheffera funkcja Pirsa 1 p =⇒ q = p ∨ q̄ = (p − q + |p + q|), 2 1 q =⇒ p = p̄ ∨ q = (q − p + |p + q|), 2 1 p ≈ q = (p ∨ q̄) ∧ (p̄ ∨ q) = (|p + q| − |p − q|), 2 1 p #q = (p ∧ q̄) ∨ (p̄ ∧ q) = − (|p + q| − |p − q|), 2 1 p/q = (p̄ ∨ q̄) = − (p + q − |p − q|), 2 1 p ⇓ q = p̄ ∧ q̄ = − (p + q + |p − q|). 2 (A.4) (A.5) (A.6) (A.7) (A.8) (A.9) W tej interpretacji, różnica symetryczna jest ujemną wartością równoważności, a funkcje Sheffera i Pirsa są ujemnymi wartościami odpowiednio koniunkcji i alternatywy, natomiast druga implikacja powstaje z pierwszej przez zamianę wielkości p i q. Istotnie różnymi są więc tylko cztery funkcje: alternatywa, koniunkcja, równoważność i jedna z implikacji. Jeśli sieć neuronalna ma za zadanie porównywanie wartości, to musi na podstawie wartości wyjściowych porównać wartości wejściowe. Na wyjściach z sieci otrzymuje się wartości funkcji logicznych. Zauważmy więc, że zadając wartości wyżej wymienionych czterech funkcji, możemy wyznaczyć wielkości p i q, a tym samym określić, która z nich jest bardziej prawdziwa. Wprowadzając dla wartości tych funkcji oznaczenia 1 (p − q + |p + q|) = x0 2 1 (p + q + |p − q|) = x1 2 1 (p + q − |p − q|) = x2 2 1 (|p + q| − |p − q|) = x3 2 stopień prawdziwości implikacji (A.10) stopień prawdziwości alternatywy (A.11) stopień prawdziwości koniunkcji (A.12) stopień prawdziwości równoważności (A.13) możemy jednoznacznie wyrazić wielkości p i q przez wartości x0 , x1 , x2 , x3 . Dodając stronami równanie (A.10) do równania (A.12) i odejmując równanie (A.13), otrzymujemy p = x0 + x2 − x3 , (A.14) a odejmując od równania (A.11) równanie (A.10) i dodając równanie (A.13), mamy q = −x0 + x1 + x3 . (A.15) Istotne jest, że maksymalny układ nieprzywiedlnych funkcji logicznych, potrzebny do wyznaczenia wielkości p i q składa się z czterech wyżej wymienionych funkcji. Otrzymane tu wyniki korespondują ze znanym twierdzeniem Posta w algebrze Bool’a dla przypadku, gdy pojęcie „prawdy” i „fałszu” nie jest określone. Twierdzenie to stwierdza, że maksymalny, nieprzywiedlny układ funkcji logicznych, pełny w sensie 65 mocnym (bez określenia pojęcia „prawdy” i „fałszu”), musi składać się z trzech funkcji symetrycznych (np. alternatywy, koniunkcji oraz równoważności) i jednej funkcji niesymetrycznej (np. jednej z implikacji). Zauważmy, że w przedstawionym wyżej systemie logiki ciągłej, mamy akurat takie istotnie różne funkcje. System logiczny oparty na zbiorach wartości tych czterech funkcji potrafi ocenić, która z wartości p, czy q jest większa oraz wyznaczyć wartości pozostałych funkcji. Zasady logiki ciągłej, uwzględniającej twierdzenie Posta, wymagają więc istnienia czterech zbiorów uporządkowanych relacją mniejszości. Zbiory wartości trzech funkcji symetrycznych X1 , X2 , X3 rozpinają symetryczną przestrzeń stanów sieci neuronalnej, natomiast niesymetryczny zbiór X0 ciągu implikacyjnego „ jeśli, to” generuje pojęcie czasu. Każdy nabór (x0 , x1, x2 , x3 ) jest zdarzeniem w czasoprzestrzeni stanów sieci neuronalnej. Funkcje logiczne są więc bazą naszej niematerialnej, trójwymiarowej „taśmy diagramowej” i czasu. Są one również bazą pojęcia wymiaru. W ramach przewartościowania poznawczego możemy wymyślać różne geometrie i czasoprzestrzenie o dowolnej liczbie wymiarów, a następnie próbować, czy taki model odpowiada rzeczywistości, ale jak to napisał Einstein: „Należy wówczas wytłumaczyć, dlaczego kontinuum posiada pozornie tylko cztery wymiary”. Właśnie powyższe rozważania były próbą wytłumaczenia tej „pozornej czterowymiarowości”. Oczywiście jest to tylko próba wytłumaczenia, a nie ścisły dowód, gdyż ten problem powinni rozwiązać specjaliści od sieci neuronalnej, logiki ciągłej i cybernetycy. Wadą teorii sieci neuronalnej (Mc Culloch, Pitts, Kleene) jest to, że przestrzeń i czas traktowane są w nich jako własność otoczenia. Możliwość kreacji tych pojęć w naszych mózgach, nie jest tam uwzględniana. Zauważmy, że logikę, w której pojęcia „prawdy” i „fałszu” są określone, można modelować za pomocą obszarów na płaszczyźnie. Logikę, w której te pojęcia nie są określone, trzeba modelować obszarami w przestrzeni trójwymiarowej z możliwością przemieszczeń w czasie. Można więc powiedzieć, że sieć neuronalna realizuje modelowanie związków funkcyjnych w logice ciągłej, w której nie są określone wartości stopnia prawdziwości zmiennych p, q, ale do tego potrzebne jest wygenerowanie czasoprzestrzennego tworu jako podłoża takiego modelowania. Wynika stąd wniosek, że znane pomysły na czasoprzestrzeń więcej niż czterowymiarową są sprzeczne z twierdzeniem Posta, gdyż dodatkowe funkcje logiczne będą przewidywalne. W odwzorowaniu porządków otoczenia nie otrzymujemy gotowych wyników, że p jest większe od q lub odwrotnie, gdyż to sieć neuronalna, pracująca w systemie logiki ciągłej, tworząc modele w tej czterowymiarowej czasoprzestrzeni, odwzorowuje porządki otoczenia według relacji mniejszości na podstawie naborów (x0 , x1, x2 , x3 ) ze zbiorów wartości wymienionych funkcji logicznych. Przestrzenne modele obiektów otoczenia jako podzbiory trójwymiarowej „taśmy diagramowej” mają więc tę samą własność rozciągłości, co sama przestrzeń. Zgłębiając pojęcie własnej osobowości, można dojść do wniosku, że to nie my mamy mózgi, a odwrotnie, to mózgi mają resztę ciała jako swoje najbliższe otoczenie. Jest to ta część otoczenia, na którą mózg ma bezpośredni wpływ i stan struktury tego otoczenia może w bardzo dużym zakresie kształtować według potrzeb. To przede wszystkim do sterowania mięśniami potrzebne jest wygenerowanie czasoprzestrzennego tworu. Pojęcie dalszego otoczenia jest tylko ubocznym produktem. Jest pewnym poziomem abstrakcji otoczenia najbliższego, czyli własnego ciała. 66 Dodatek A. Geneza pojęć przestrzeni i czasu Do kształtowania struktury najbliższego otoczenia (sterowania), wystarcza pojęcie przestrzeni euklidesowej i czas absolutny, a warunki, w jakich ewoluował człowiek, nie wymuszały wygenerowania bardziej bogatego strukturalnie czasoprzestrzennego tworu. Były to warunki bliskiego otoczenia i małych w porównaniu ze światłem prędkości, które również można modelować przestrzenią euklidesową i czasem absolutnym. Taką więc czasoprzestrzeń generuje w naszych mózgach sieć neuronalna. Jest ona „wkonstruowana” w zmysły i mózg człowieka i to nie otoczenie objawia nam swoją przestrzenno-czasową naturę, a odwrotnie, to my, zapisując odpowiednio zakodowane porządki otoczenia na swoich euklidesowych, trójwymiarowych „taśmach” diagramowych, nadajemy obiektom otoczenia tę przestrzenną postać, podobnie jak oblekamy je w barwy, których one nie mają. Nic też dziwnego, że Euklides wymyślił swoje postulaty właśnie takimi, gdyż taką geometrię miał wkonstruowaną w swój mózg. Nie można również dziwić się, że mając wręcz konstruowane pojęcie euklidesowej przestrzeni i czasu absolutnego, tak trudno było nam zrezygnować z piątego postulatu Euklidesa i pojęcia eteru. Tym większa chwała dla geniuszu Einsteina, którego obie teorie względności można by najkrócej określić jako wniosek, że porządków otoczenia nie można modelować przestrzenią euklidesową i czasem absolutnym. Z prezentowanej tu teorii wynika, że również znane nam zaskakujące własności cząstek elementarnych wynikają z nieeuklidesowego charakteru ich czasoprzestrzennych modeli. Mamy naturalne ograniczenia poznawcze, wynikające z ewolucyjnego ukształtowania, ale bogactwo struktury naszego mózgu pozwala wyjść poza te ograniczenia, a to modelarskie „tworzywo” czasoprzestrzenne jest na tyle podatne, że przy pomocy przyrządów oraz aparatu matematycznego, jest w stanie zamodelować porządki (strukturę) zarówno Wszechświata w całości, jak też i jego najdrobniejszych części — cząstek elementarnych. Gdy chcemy pozostać przy czterowymiarowym, czasoprzestrzennym modelowaniu jako dla nas wyłącznie zrozumiałym, to wnikając w mikrostrukturę materii oraz ogarniając większe obszary naszego otoczenia, których nasze zmysły bezpośrednio nie analizują, musimy wzbogacić to czasoprzestrzenne „tworzywo modelarskie” o dodatkowe własności. Musimy pozwolić mu krzywić się i skręcać. Dlatego rozpatrywane w tej teorii czasoprzestrzenne modele są całkowicie niesymetryczne. Oznacza to, że tensor podstawowy jest w tej teorii wielkością niesymetryczną, a tensor metryczny stanowi jego symetryczną część. Koneksja liniowa również jest wielkością niesymetryczną, co oznacza, że istnieje torsja, czyli skręcenie czasoprzestrzeni. Właśnie takie mają być czasoprzestrzenne modele cząstek elementarnych. Dodatek B Nieliniowa elektrodynamika Borna-Infelda Chociaż w tej teorii z zasady nie robimy żadnych uproszczeń problemów, to wyjątkowo pozwolimy sobie na taką nieprawidłowość. Przyjmiemy założenia strukturalne takie, jakie występują w nieliniowej elektrodynamice Borna-Infelda, czyli metrykę w postaci ds2 = (dx0 )2 − (dx1 )2 − (dx2 )2 − (dx3 )2 (B.1) oraz potencjalność pola elektromagnetycznego przy sferycznej symetrii potencjału skalarnego. Pierwsze założenie pomija wpływ pola grawitacyjnego. Jest to duże uproszczenie, gdyż w bliskim otoczeniu centrum cząstek elementarnych wpływu pola grawitacyjnego nie można pomijać. Wyprowadzając wzory elektrodynamiki Borna-Infelda przy tak grubym uproszczeniu, wykazujemy tym samym, że taka elektrodynamika oraz inne tego typu nieliniowe elektrodynamiki, nie mają sensu, że są sztucznymi tworami, które mają się nijak do rzeczywistości. Drugie z tych założeń oznacza, że równania (??) spełniają się tożsamościowo. Wzór (B.1) możemy interpretować jako wniosek, że tensor podstawowy spełnia warunek dla i , k. gik = −gki (B.2) Mamy więc również gik = gik dla i , k. e Bez straty na ogólności możemy przyjąć, że (B.3) 1 gik = Fik , e b (B.4) gdzie Fik jest tensorem pola elektromagnetycznego, a stała b jest wielkością dopasowującą wymiary. Założyliśmy istnienie potencjału wektorowego Ak , takiego, że (B.5) Fik = Ak,i − Ai,k . Podstawienie wzoru (B.4) do równań (??), przy założeniu (B.5), prowadzi do tożsamości Fik,l + Fli,k + Fkl,i ≡ 0. (B.6) Dokonamy teraz przyporządkowania F01 = E1 , F02 = E2 , F03 = E3 , F12 = −H3, 67 F13 = H2 , F23 = −H1 . (B.7) 68 Dodatek B. Nieliniowa elektrodynamika Borna-Infelda Jeśli składową zerową potencjału wektorowego oznaczymy przez ϕ, a pozostałe skła~ to wzór (B.5) definiuje trójdowe uznamy za składowe trójwymiarowego wektora A, ~iH ~ jako wymiarowe wektory E ~ ~ = 1 ∂A − gradϕ, E c ∂t (B.8) ~ ~ = −rotA. H (B.9) ~ ≡ 0, ‘divH (B.10) Podstawienie wzorów (B.8–B.9) do tożsamości (B.6) daje ~ 1 ∂H . (B.11) c ∂t Działając operatorem rotacji na równanie (B.8) oraz operatorem dywergencji na równanie (B.9), otrzymujemy odpowiednio równanie (B.10) oraz (B.11), wyrażone znakiem równości, a nie tożsamości. Dwa ostatnie równania stanowią pierwszą parę równań Maxwella. Drugą parę równań Maxwella stanowią równania (??), ale wygodniej jest korzystać z równań (??), z których te równania się wywodzą. Aby wykazać, że jest to druga para równań Maxwella, wystarczy wymnożyć wzór (B.4) przez gsi gtk . W ten sposób otrzymujemy ~≡− rotE 1 1 1 ts gik gsi gtk = (gtk gsi gik − gsi gtk gki ) = (gts − gst ) = ge = Fts . 2 2 b e Jeśli ten końcowy wynik podstawimy do równań (??), to otrzymamy √ −gFik = 0. ,k (B.12) (B.13) Z tych równań można już w dość prosty sposób otrzymać dosłownie drugą parę równań Maxwella. Będą więc nam potrzebne składowe kontrawariantne tensora podstawowego, wyrażone przez składowe pola elektrycznego Ei oraz magnetycznego Hi . Najpierw musimy tego dokonać dla kowariantnych składowych tensora podstawowego. Na podstawie metryki (B.1) oraz wzorów (B.3), (B.4) i przyporządkowania (B.7) mamy 1 1 1 E1 E2 E3 1 b b b 1 − b E1 −1 − 1b H3 1b H2 . (B.14) (gik ) = 1 1 −1 − 1b H1 − b E2 b H3 1 − b E3 − 1b H2 1b H1 −1 Wyznacznik tej macierzy równa się g = −1 + 1 2 1 1 ~~ 2 (E1 + E22 + E23 ) − 2 (H12 + H22 + H32 ) + 4 (E H) , 2 b b b (B.15) gdzie ~H ~ = E1 H 1 + E2 H 2 + E3 H 3 . E (B.16) 69 Korzystając ze wzoru gik = (−1)i+k Mik , g (B.17) gdzie Mik jest minorem macierzy transponowanej do macierzy (B.14), znajdujemy kontrawariantne składowe tensora podstawowego 1 1 [−1 − 2 (H12 + H22 + H32 )], g b (B.18) g11 = 1 1 [1 + 2 (H12 − E22 − E23 )], g b (B.19) g22 = 1 1 [1 + 2 (H22 − E21 − E23 )], g b (B.20) g33 = 1 1 [1 + 2 (H32 − E21 − E22 )], g b (B.21) 1 1 1 1 ~ H)], ~ [− E1 + 2 (E3 H2 − E2 H3 ) − 3 H1(E g b b b (B.22) 1 1 1 1 ~ H)], ~ [ E1 + 2 (E3 H2 − E2 H3 ) + 3 H1 (E g b b b (B.23) 1 1 1 1 ~ H)], ~ [− E2 + 2 (E1 H3 − E3 H1 ) − 3 H2(E g b b b (B.24) 1 1 1 1 ~ H)], ~ [ E2 + 2 (E1 H3 − E3 H1 ) + 3 H2 (E g b b b (B.25) 1 1 1 1 ~ H)], ~ [− E3 + 2 (E2 H1 − E1 H2 ) − 3 H3(E g b b b (B.26) 1 1 1 1 ~ H)], ~ [ E3 + 2 (E2 H1 − E1 H2 ) + 3 H3 (E g b b b (B.27) 1 1 1 1 ~ H)], ~ [− H3 + 2 (E1 E2 + H1 H2 ) + 3 E3 (E g b b b (B.28) g21 = 1 1 1 1 ~ H)], ~ [ H3 + 2 (E1 E2 + H1H2 ) − 3 E3 (E g b b b (B.29) g13 = 1 1 1 1 ~ H)], ~ [ H2 + 2 (E1 E3 + H1H3 ) − 3 E2 (E g b b b (B.30) g31 = 1 1 1 1 ~ H)], ~ [− H2 + 2 (E1 E3 + H1 H3 ) + 3 E2 (E g b b b (B.31) g23 = 1 1 1 1 ~ H)], ~ [− H1 + 2 (E2 E3 + H2 H3 ) + 3 E1 (E g b b b (B.32) 1 1 1 1 ~ H)]. ~ [ H1 + 2 (E2 E3 + H2H3 ) − 3 E1 (E g b b b (B.33) g00 = g01 = g10 = g02 = g20 = g03 = g30 = g12 = g32 = 70 Dodatek B. Nieliniowa elektrodynamika Borna-Infelda Trochę żmudnym wyliczeniem można stwierdzić, że elementy macierzy (B.14) oraz przedstawione tu elementy macierzy odwrotnej spełniają równania (B.34) gik gkl = δlk . Do równań (??) będą potrzebne części antysymetryczne składowych tensora gik . Ze wzorów (B.22–B.33) otrzymujemy 1 1 1 01 ~ ~ ge = − E1 − 3 H1 (EH) , (B.35) g b b 1 1 1 ~ ~ − E2 − 3 H2 (EH) , ge = g b b 1 1 1 03 ~ ~ ge = − E3 − 3 H3 (EH) , g b b 1 1 1 12 ~ ~ − H3 + 3 E3 (EH) , ge = g b b 1 1 1 23 ~ ~ ge = − H1 + 3 E1 (EH) , g b b 1 1 1 31 ~ ~ ge = − H2 + 3 E2 (EH) . g b b 02 (B.36) (B.37) (B.38) (B.39) (B.40) Podstawiając wzory (B.35–B.40) do równań (??) otrzymujemy równania ik Se = 0, ,k (B.41) D1 D2 D3 0 −D 0 −B3 B2 1 (Sik ) = . −D2 B3 0 −B1 −D3 −B2 B1 0 (B.42) ik gdzie Se są składowymi tensora ~ oraz B ~ mają postać Trójwymiarowe wektory D ~ = q D 1+ ~= q B 1+ ~+ E 1 ~ ~~ H(EH) b2 1 ~2 (H b2 ~ 2) E − − ~− H 1 ~ ~~ E(EH) b2 1 ~2 (H b2 ~2) − −E , (B.43) . (B.44) 1 ~~ 2 (EH) b4 1 ~~ 2 (EH) b4 Równania (B.41) możemy więc zapisać jako ~ =− rotB ~ 1 ∂D , c ∂t ~ = 0, divD (B.45) 71 które z dokładnością do znaku stanowią drugą parę równań Maxwella dla wekto~ i B. ~ rów D W rozdziale pierwszym zwróciliśmy uwagę na to, że musimy określić warunki √ zapewniające rzeczywisty charakter −g. W tym celu zauważmy, że istnieje grupa transformacji liniowych ρ Λνµ Λλ γνρ = γµλ , (B.46) zachowujących tensor metryczny γik , określony wzorem (B.1), na kwadrat elementu odległości czasoprzestrzennej. Jeśli dodatkowo zażądamy, aby 4-wymiarowe macierze Λνµ spełniały warunek det Λ = ενρµλΛ0ν Λ1ρ Λ2µ Λ3λ = 1 oraz Λ00 > 1, (B.47) ~ i magnetyczne H ~ to będzie to grupa transformacji Lorentza. Pole elektryczne E nie jest niezmiennikiem tych transformacji. Są nimi wyrażenia w nawiasach pod pierwiastkiem. Możemy więc w ramach transformacji Lorentza wybrać taki układ współ√ rzędnych, który zapewnia rzeczywistą wartość −g. Najprostszym jest przypadek, kiedy obydwa niezmienniki są równe zeru. Wtedy pole elektryczne jest prostopadłe do pola magnetycznego, a ich kwadraty są równe. Wtedy również mamy równo~ =E ~ oraz B ~ = H. ~ W tym przypadku równania (B.45), z dokładnością do znaku, ści D stanowią drugą parę równań Maxwella w próżni. Można również rozpatrywać takie układy współrzędnych, w których znika pole elektryczne lub pole magnetyczne. Gdy znika pole elektryczne, to wyrażenie pod pierwiastkiem jest rzeczywiste dla każdej wartości stałej b. Gdy znika pole magnetyczne, to musimy wymagać, aby w każdym punkcie czasoprzestrzeni speł~ 2 < 1. Rozważmy ten ostatni przypadek bardziej dokładnie. niała się nierówność b12 E ~ = 0. W tym przypadku otrzymujemy Zakładamy więc, że H ~ ~ = q E D , 1 ~2 1 − b2 E ~ = 0. B (B.48) ~ = 0. Wobec tego możemy Z równań (B.11) otrzymujemy w tym przypadku, że rotE przyjąć, że ~ = −gradϕ. E (B.49) Równania (B.45) sprowadzają się do postaci ~ ∂D = 0, ∂t ~ = 0. divD (B.50) Korzystając ze wzoru ~ = Ψ divV ~ + VgradΨ, ~ div(Ψ V) (B.51) gdzie Ψ — funkcja skalarna, możemy drugie z równań (B.50) zapisać w postaci 1 ~ = −E ~ · grad q 1 divE . q 1 ~2 1 ~2 1 − b2 E 1 − b2 E (B.52) 72 Dodatek B. Nieliniowa elektrodynamika Borna-Infelda Następnie znajdujemy 3 1 1 ~2 − 2 ~ 2, = 2 1 − 2E grad q gradE 2b b ~2 1 − b12 E 1 (B.53) ale 1 ~ 2 = (E ~ · grad)E ~+E ~ × rotE ~ = (E ~ · grad)E. ~ gradE 2 Korzystając z tych wzorów możemy równanie (B.52) zapisać jako ~= divE ~ E b2 ~2 −E ~ · grad)E]. ~ [(E (B.54) (B.55) Podstawiając (B.49), możemy to równanie zapisać w postaci ∆ϕ = ▽ϕ{[(▽ϕ) · ▽]▽ϕ} . b2 − (▽ϕ)2 (B.56) Tego równania w ogólnym przypadku rozwiązać nie można, ale jest to możliwe dla pola kulistosymetrycznego ϕ = ϕ(r), co również należy do założeń nieliniowej elektrodynamiki Borna-Infelda. We współrzędnych sferycznych mamy wtedy ! dϕ ~r 1 d 2 dϕ ▽ϕ = , ∆ϕ = 2 r . (B.57) dr drr r dr dr Podstawiając te wzory do równania (B.56) otrzymujemy !2 ! (" # ) 2 dϕ 1 d 2 dϕ dϕ~r dϕ~r ~r d dϕ~r b − · r =− , dr r2 dr dr dr r dr r r dr dr r (B.58) czyli !2 ! (" # ) 2 dϕ 1 d 2 dϕ dϕ~r dϕ d dϕ~r b − r =− . dr r2 dr dr dr r dr dr dr r Uwzględnienie, że drd ~rr = 0, daje !2 ! !2 2 dϕ 1 d 2 dϕ dϕ d2 ϕ b − . r =− dr r2 dr dr dr dr2 (B.59) (B.60) Przekształcając lewą stronę otrzymujemy ostatecznie Podstawienie ! !3 dϕ b2 d 2 dϕ r =2 . r dr dr dr (B.61) dϕ u = 2, dr r (B.62) 73 daje 2 dr du = . u3 b2 r5 (B.63) 1 1 1 = 2 4 + 2, 2 u q br (B.64) Całkując to równanie mamy gdzie dla uniknięcia osobliwości przyjmujemy dodatnią stałą całkowania, a oznaczenie jej przez q12 , pozwala na powiązanie jej z tradycyjnym pojęciem ładunku punktowego. Z równania (B.64) otrzymujemy u=±q qr2 q2 b2 + (B.65) . r4 Podstawienie tego wzoru do (B.62) daje dϕ q =±q , dr 4 4 r0 + r gdzie q r20 = , b czyli b = (B.66) q r20 . (B.67) Wzór na natężenie pola elektrycznego przyjmuje więc postać q ~r ~ = −gradϕ = ∓ q E 4 r3 . 1 + rr0 (B.68) Ten wzór jest identyczny z otrzymanym przez Borna i Infelda, co jest ciekawe o tyle, że podstawą ich elektrodynamiki jest wprawdzie interesujące, ale dość spekulatywne określenie gęstości lagrangianu, podczas gdy tu elektrodynamika Borna-Infelda jest konsekwencją równań pola czasoprzestrzeni elementarnych. Istotne jest również, że Born i Infeld do wyprowadzenia wzoru (B.68) posługiwali się pojęciem ładunku punktowego i równaniem Poissona, podczas gdy do przedstawionego tu wyprowadzenia pojęcie ładunku i równanie Poissona nie są potrzebne. Obie strony równania (B.56) są czysto polowe. Możemy prawą stronę tego równania formalnie zapisać jako −4πρ i wówczas otrzymujemy równanie Poissona ∆ϕ = −4πρ, gdzie ρ= 1 ▽ϕ{[(▽ϕ) · ▽]▽ϕ} 4π b2 − (▽ϕ)2 (B.69) (B.70) możemy nazwać gęstością ładunku elektrycznego. Podstawiając tu wzór (B.68), mamy qr40 . (B.71) ρ=∓ 3 2πr(r40 + r4 ) 2 74 Dodatek B. Nieliniowa elektrodynamika Borna-Infelda W tym wzorze wielkość q nie jest ładunkiem elektrycznym w sensie fizycznym, gdyż jest tylko stałą całkowania, wprowadzoną we wzorze (B.64). Ilość ładunku zawartego w kuli o promieniu R, równa się ZR QR = 4π 0 q ρr2 dr = ∓ q 4 . 1 + rR0 Całkowity ładunek w całej trójwymiarowej przestrzeni wynosi więc ∞ q Q= ∓q r 4 = ∓q. 1 + R0 0 Widzimy, że całkowity ładunek równy jest stałej całkowania q. (B.72) (B.73)