V Problem Hilberta

Transkrypt

V Problem Hilberta
V Problem Hilberta
Tadeusz Pytlik
Pod numerem V na liście 23 problemów podanych w 1900 roku na Międzynarodowym Kongresie Matematycznym i opublikowanej w Göttingen Nachrichten tego
samego roku Hilbert umieścił następujące pytanie: Czy w koncepcji Liego ciągłych grup transformacji zbędne jest założenie różniczkowalności funkcji
określającej działanie?
O co tu chodzi?
W uzasadnieniu Hilbert pisał: Jak wam wiadomo, Lie dla opisania geometrii
wprowadził system aksjomatów, które łączyło pojęcie ciągłych grup transformacji i
pokazał na bazie teorii tych grup transformacji, że jest to system wybrany właściwie, by geometrie takie budować. Lie też od razu na samym początku swojej teorii
zakładał, że funkcje definiujące ową grupę są różniczkowalne. Nie należy jednak postawionego przeze mnie problemu odczytywać jako sugestii, że Lie się pomylił, lecz
jako inspirację do sprawdzenia, czy to założenie różniczkowalności jest nieusuwalne
z całego zespołu aksjomatów, czy może przeciwnie, że jest konsekwencją ogólnych
własności grupy i pozostałych aksjomatów geometrii. Moje rozważania na ten temat
i pewne pytania, na które natknąłem się w związku z badaniem aksjomatów arytmetyki, doprowadziły mnie do sformułowania jeszcze ogólniejszego problemu: w jaki
sposób rozszerzyć koncepcję Liego grup transformacji, by była przydatna
do naszych badań bez zakładania różniczkowalności.
Jak wiadomo, Lie określał skończoną (tzn. skończenie wymiarową) ciągłą grupę
transformacji jako system odwzorowań
x0i = fi (x1 , . . . , xn ; a1 , . . . , ar )
i = 1, . . . , n
o takiej własności, że każde dwa odwzorowania tego systemu
x0i = fi (x1 , . . . , xn ; a1 , . . . , ar )
x00i = fi (x01 , . . . , x0n ; b1 , . . . , br )
zastosowane jedno po drugim dają przekształcenie także należące do systemu. Może
więc być przedstawione w postaci
x00i = fi (f1 (x, a), . . . , fn (x, a); b1 , . . . , br ) = fi (x1 , . . . , xn ; c1 , . . . , cr ),
gdzie c1 , . . . , cr są pewnymi funkcjami a1 , . . . , ar i b1 , . . . , br . Własności grupy dają się
wtedy zapisać w postaci układu równań funkcyjnych, a poza spełnianiem tych równań od funkcji f1 , . . . , fn , c1 , . . . , cr nie żądamy już jakichkolwiek dodatkowych własności. Niestety sposób, w jaki Lie rozpisywał te równania funkcyjne, automatycznie
wymuszał zakładanie ciągłości i różniczkowalności funkcji definiujących grupę.
1
Co do ciągłości, gotów jestem się na nią zgodzić. Wydaje się być naturalnym warunkiem – i to bez powoływania się na zastosowania geometryczne i arytmetyczne,
gdzie ciągłość funkcji jest konsekwencją założeń o ciągłości systemu. Z różniczkowalnością funkcji definiujących grupę jest przeciwnie. Umieszczanie tego warunku
pośród pozostałych aksjomatów geometrii jest, moim zdaniem, bardzo sztuczne i
komplikuje tylko sprawę. Powstaje zatem pytanie, czy nie jest możliwe przez pewną
zamianę zmiennych i parametrów na nowe przetransformować tą grupę na inną,
w której funkcje definiujące są już różniczkowalne, albo też czy jest możliwe przez
nałożenie pewnych prostych założeń o transformacjach doprowadzić do otrzymania
grupy, w której metody Liego można już stosować. Taka redukcja dla grup analitycznych jest zawsze możliwa, zgodnie z twierdzeniem zaproponowanym przez Liego, a
po raz pierwszy udowodnionym przez Schura, jeżeli grupa jest tranzytywna, to dla
analityczności wystarczy założyć istnienie pierwszych i pewnych drugich pochodnych
funkcji definiujących działania w grupie.
Moim zdaniem badanie tego problemu może być ciekawe także dla grup nieskończonych (tzn. nieskończenie wymiarowych). Wszystko zaś razem może prowadzić do
powstania teorii tej szerokiej i wcale ciekawej rodziny równań funkcyjnych, które w
przeszłości były badane tylko przy założeniu różniczkowalności odpowiednich funkcji.
Na czym Hilbert opierał swoje przypuszczenia?
Dla ilustracji rozumowania Hilberta przedstawimy dwa proste, lecz ważne przykłady.
Przykład 1. (grupa ruchów płaszczyzny euklidesowej) Jest nią grupa E(2) wszystkich izometrii płaszczyzny zachowujących orientację, a więc grupa generowana przez
obroty i przesunięcia. Każdą transformację ϕ ∈ E(2) można zapisać w postaci
ϕ(x, y) = (x cos θ + y sin θ + a , −x sin θ + y cos θ + b),
gdzie θ, a i b są dowolnymi parametrami rzeczywistymi, przy czym θ wyznaczone
jest z dokładnością do wielokrotności 2π. Składanie transformacji prowadzi do następujących operacji grupowych na zbiorze indeksów
(1)
(2)
(θ1 , a1 , b1 ) · (θ2 , a2 , b2 ) = (θ1 + θ2 , a2 cos θ1 + b2 sin θ1 + a1 ,
− a2 sin θ1 + b2 cos θ1 + b1 )
(θ, a, b)−1 = (−θ , −a cos θ + b sin θ , −a sin θ − b cos θ)
Możemy więc grupę E(2) utożsamić z podgrupą macierzy odwracalnych 3×3 postaci
!
cos θ sin θ a
− sin θ cos θ b .
0
0
1
2
Jeżeli w zbiorze indeksów [0, 2π) × (−∞, ∞) × (−∞, ∞) = R3 /2πZ × {0} × {0}
wprowadzić topologię odziedziczoną z R3 , to operacje grupowe (1) i (2) stają się
funkcjami ciągłymi swoich argumentów. Są, jak widać, nawet funkcjami analitycznymi, co we współczesnym języku oznacza, że E(2) jest grupą Liego.
Przykład 2. (grupa ruchów płaszczyzny hiperbolicznej) Oznaczmy przez H(2)
rodzinę wszystkich nieosobliwych homografii ϕ górnej półpłaszczyzny zespolonej
H = {z ∈ C : Im z > 0}
ϕ(z) =
az + b
,
cz + d
z ∈ H,
a, b, c, d ∈ R.
Ponieważ dwie rodziny parametrów wyznaczają tą samą homografię dokładnie wtedy, gdy są do siebieproporcjonalne, więc homografie możemy indeksować macierzami
−b
rzeczywistymi ac db dla których ad − bc = 1, utożsamiając macierze ac db i −a
−c −d
ze sobą. Złożeniu homografii odpowiada wtedy iloczyn macierzy. Ta grupa macierzy tradycyjnie oznaczana jest symbolem P SL(2,
R). Lepszą parametryzację można
a b
dostać z rozkładu Iwasawy. Każdą macierz c d daje się jednoznacznie przedstawić
w postaci iloczynu
t
a b
cos θ − sin θ
1 ξ
e
0
(3)
c d = sin θ cos θ
0 1 ,
0 e−t
gdzie 0 ¬ θ < π, t, ξ ∈ R. Parametry θ, t, ξ wyrażają się przez a, b, c, d wzorami
(4)
θ = arc cos √
a
,
a 2 + c2
t = ln
p
a 2 + c2 ,
ξ=
ab + cd
.
a2 + c2
Pozwala to, podobnie jak w przykładzie poprzednim, utożsamić grupę H(2) ze zbiorem [0, π) × (−∞, ∞) × (−∞, ∞), a topologię indukować z R3 . Ze wzorów (3) i (4)
widać, że i tym razem operacje grupowe są funkcjami analitycznymi, a H(2) grupą
Liego. Można pokazać, że jeżeli w półpłaszczyźnie H zamiast metryki euklidesowej
wprowadzić metrykę hiperboliczną
z1 − z2 ,
d(z1 , z2 ) = ar tgh z1 , z2 ∈ H,
z1 − z2 to H(2) stanie się grupą wszystkich izometrii przestrzeni (H, d) zachowujących orientację.
O co wobec tego pytał Hilbert?
Aby piąty problem Hilberta przetłumaczyć na zagadnienie bardziej konkretne,
dzisiaj możemy już użyć pojęć, które od kongresu Paryskiego w roku 1900 do naszych
czasów rozwinęły się w teorii grup topologicznych. W języku współczesnym problem
3
ten na ogół przyjmuje postać: Czy każda grupa lokalnie euklidesowa jest już
grupą Liego?
Nim w końcu pytanie to uzyskało pozytywną odpowiedź w roku 1952, zainspirowało wiele prac o grupach topologicznych. Dość wcześnie uzyskano też częściowe
odpowiedzi. Tematykę rozpoczął Brouwer cyklem prac z roku 1910 o grupach transformacji prostej i płaszczyzny. Złotym okresem były jednak lata trzydzieste. Wtedy
to, głównie dzięki pracom E. Cartana i H. Weyla, otrzymano kompletny opis grup
Liego jako obiektów geometrycznych. Uzyskano też wiele informacji o strukturze
globalnej grup Liego i ich związkach z podgrupami grup macierzowych. Okres ten
zamknęły prace von Neumanna i Pontrjagina pozytywnym rozwiązaniem piątego
problemu Hilberta odpowiednio dla grup zwartych i abelowych.
Pełne pozytywne rozwiązanie piątego problemu Hilberta stało się możliwe w
roku 1952 dzięki równoczesnym wynikom Gleasona i Montgomery–Zippina. Dowiedli
oni, że każda skończenie wymiarowa grupa lokalnie zwarta jest uogólnioną grupą
Liego, tzn. że w jej składowej spójnej jedności G0 można tak wybrać dowolnie mały
dzielnik normalny N , że G0 /N stanie się grupą Liego. Prace te były później istotnie
uproszczone i rozszerzone przez Yamabe, a w końcu w roku 1971 Kaplansky w
swojej książce [2] nadał im wszystkim najogólniejszą formę i znalazł najprostsze
dowody. Dlatego podręcznik Kaplansky’ego polecamy każdemu, kto chciałby poznać
szczegóły.
Oto odpowiedź!
Twierdzenie. Dla grupy topologicznej G następujące własności są równoważne:
1. nie ma małych podgrup,
2. jest lokalnie euklidesowa,
3. jest grupą Liego.
Wyjaśnimy pokrótce hasła występujące w sformułowaniu powyższego twierdzenia. Grupa topologiczna to obiekt, który jest jednocześnie grupą i przestrzenią topologiczną Hausdorffa. Żądamy przy tym, aby operacje grupowe były ciągłe, tzn.
by przyporządkowanie (x, y) → xy −1 było funkcją ciągłą z G × G w G. Zwróćmy
uwagę, że dla każdego ustalonego y ∈ G przesunięcie x → xy −1 musi być wtedy
homeomorfizmem G na G. Dla określenia topologii w G wystarczy więc opisać bazę
otoczeń jedności 1, a otoczenia innych punktów otrzymać jako jej przesunięcia. Jeżeli
któreś z otoczeń jedności jest homeomorficzne z podzbiorem otwartym przestrzeni
euklidesowej Rn to powiemy, że grupa jest lokalnie euklidesowa. Grupa Liego to
taka grupa lokalnie euklidesowa, w której homeomorfizm ten wybrać można tak,
by operacje grupowe były rzeczywistymi funkcjami analitycznymi. Zwykle o grupie
topologicznej łatwo jest rozstrzygnąć, czy jest lokalnie euklidesową. Nie ma jednak
żadnej prostej metody sprawdzenia, czy jest grupą Liego. Zbyt wiele jest lokalnych
homeomorfizmów w przestrzeń euklidesową, jeśli te dające analityczność nie od razu
4
są widoczne, to zwykle odkrywa się je przypadkowo. No i wreszcie ostatnie hasło. O
grupie topologicznej G powiemy, ze G nie ma małych podgrup lub, że jest NSS-grupą
(no small subgroups) jeżeli ma takie otoczenie U jedności 1, że {1} jest jedyną podgrupą leżącą w U .
Przykład 3. Ustalmy liczbę pierwszą p i dla liczby całkowitej n połóżmy |n| = p−k
gdy n = pk m, a m jest już liczbą całkowitą niepodzielną przez p. Łatwo sprawdzić,
że
|n1 ± n2 | ¬ max{|n1 |, |n2 |} ¬ |n1 | + |n2 |.
Wynika stąd, że funkcja d(n1 , n2 ) = |n1 − n2 | jest metryką w zbiorze Z wszystkich
liczb całkowitych, a dodawanie i odejmowanie są operacjami ciągłymi. Po uzupełnieniu w metryce d otrzymamy grupę topologiczną, zwaną grupą liczb całkowitych
p-adycznych i tradycyjnie oznaczaną przez Zp . Jest to przestrzeń metryczna zupełna, całkowicie niespójna, nie jest więc grupą lokalnie euklidesową. Nie jest też
NSS-grupą. Rzeczywiście, niech U będzie dowolnym otoczeniem 0 (0 jest tu jednością
grupy). Możemy przy tym założyć, że otoczenie to ma postać U = {n ∈ Z : |n| < ε},
gdzie ε jest pewną liczbą dodatnią. Jeżeli liczbę naturalną k dobrać tak by p−k < ε,
to zbiór pk Z utworzy nietrywialną podgrupą Zp leżącą w U .
Jak dowieść to twierdzenie?
Spośród wszystkich możliwych implikacji w twierdzeniu tylko 3 ⇒ 2 jest oczywista. To, że grupa Liego nie może mieć małych podgrup a więc, że 3 ⇒ 1 wynika
stosunkowo łatwo z ogólnej teorii grup Liego i każdy, kto choć trochę zna tą teorię, może sam tego dowieść. Wszystkie pozostałe implikacje są daleko nieoczywiste.
Streścimy pokrótce, jak zostały dowiedzione.
Dowód implikacji 1 ⇒ 2 jest bardzo żmudny i polega na wymyślnych konstrukcjach podgrup jednoparametrowych. Na samym początku dowodzi się, że każda
NSS-grupa jest metryzowalna. Jest to konsekwencją ogólniejszego twierdzenia mówiącego, że w dowolnym otoczeniu U jedności grupy lokalnie zwartej G istnieje taka
podgrupa normalna N , że grupa ilorazowa G/N jest metryzowalną. Metryzowalność
pozwala w wielu konstrukcjach posłużyć się twierdzeniem Bolzano–Weierstrassa.
Dowodzi się na przykład, że każda NSS-grupa musi zawierać otoczenie jedności, na
którym operacja podnoszenia do kwadratu jest wzajemnie jednoznaczna, tzn. że
x2 = y 2 pociąga x = y. Z tego, przez iterację, można dostać otoczenie jedności,
na którym podnoszenie do wyższych potęg też jest wzajemnie jednoznaczne. Stąd
krok tylko do dowodu, że każda niedyskretna lokalnie zwarta NSS-grupa zawiera nietrywialną grupę jednoparametrową tzn. nietrywialny homomorfizm z grupy R liczb
rzeczywistych w G. To bardzo istotny krok w dowodzie. Rzecz polega jednak na tym,
że grup takich ma być dużo. Należy wskazać takie otoczenie jedności, że przez każdy
jego punkt przechodzi jakaś grupa jednoparametrowa. To kluczowe miejsce dowodu,
zajmuje najwięcej miejsca i czasu. Potem w zbiorze L grup jednoparametrowych
5
wprowadza się strukturę przestrzeni liniowej, kładąc dla X, Y ∈ L:
(X + Y )(t) = lim (X(t/k)Y (t/k))k
k→∞
i dowodzi już łatwo, ze wymiar tej przestrzeni jest skończony. Oznacza to, że każda
lokalnie zwarta NSS-grupa jest lokalnie euklidesowa, a więc że zachodzi implikacja
1 ⇒ 2.
W dowodzie implikacji 1 ⇒ 3 korzysta się z wszystkich wcześniej udowodnionych
faktów. Otóż w zbiorze L można dodatkowo wprowadzić strukturę algebry Liego,
określając komutator [X, Y ] wektorów X, Y ∈ L wzorem
[X, Y ](t) = lim lim (X(1/k)Y (1/m)X(−1/k)Y (−1/m))[tkm] ,
k→∞ m→∞
gdzie [tkm] w wykładniku oznacza część całkowitą liczby tkm. Wystarczy teraz
powołać się na klasyczną teorię opisującą odpowiedniość między grupami Liego i
algebrami Liego, by stwierdzić, że G jest grupą Liego.
Dowód implikacja 2 ⇒ 1 pochodzi od Yamabe i opiera się na następującym
twierdzeniu: jeżeli G jest spójną grupą lokalnie zwartą, a U otoczeniem jedności w G
to istnieje taka podgrupa normalna N ⊂ U , że G/N jest NSS-grupą. Jest wtedy, jak
już wiemy, grupą lokalnie euklidesową. Dowodzi się, że jeżeli G/N ma maksymalny
wymiar spośród wszystkich NSS-grup będących obrazami homomorficznymi G, to
N musi być grupą całkowicie niespójną. Jeżeli G dodatkowo jest lokalnie spójna, to
N może już tylko być grupą dyskretną. Gdy G jest grupą lokalnie euklidesową, to
rozumowanie powyższe można przeprowadzić dla jej składowej spójnej G0 . Stąd już
tylko krok by dowieść, że G0 a stąd że G musi być NSS-grupą.
Gdzie o tym można przeczytać?
[1] I. Kaplansky, Lie algebras and locally compact groups, Chicago University
Press, Chicago, 1971 (tłumaczenie rosyjskie I. Kaplanski$i, Algebry Li i lokal~no kompaktnye gruppy, Mir, Moskva, 1974).
[2] D. Montgomery, L. Zippin, Topological transformation groups, Interscience,
New York, 1955.
[3] C. T. Yang, Hilbert fifth problem and related problems on transformation groups, Mathematical developments arising from Hilbert problems, Proc. Symp.
Pure Math., 28 (1976) str. 142—146.
6

Podobne dokumenty