V Problem Hilberta
Transkrypt
V Problem Hilberta
V Problem Hilberta Tadeusz Pytlik Pod numerem V na liście 23 problemów podanych w 1900 roku na Międzynarodowym Kongresie Matematycznym i opublikowanej w Göttingen Nachrichten tego samego roku Hilbert umieścił następujące pytanie: Czy w koncepcji Liego ciągłych grup transformacji zbędne jest założenie różniczkowalności funkcji określającej działanie? O co tu chodzi? W uzasadnieniu Hilbert pisał: Jak wam wiadomo, Lie dla opisania geometrii wprowadził system aksjomatów, które łączyło pojęcie ciągłych grup transformacji i pokazał na bazie teorii tych grup transformacji, że jest to system wybrany właściwie, by geometrie takie budować. Lie też od razu na samym początku swojej teorii zakładał, że funkcje definiujące ową grupę są różniczkowalne. Nie należy jednak postawionego przeze mnie problemu odczytywać jako sugestii, że Lie się pomylił, lecz jako inspirację do sprawdzenia, czy to założenie różniczkowalności jest nieusuwalne z całego zespołu aksjomatów, czy może przeciwnie, że jest konsekwencją ogólnych własności grupy i pozostałych aksjomatów geometrii. Moje rozważania na ten temat i pewne pytania, na które natknąłem się w związku z badaniem aksjomatów arytmetyki, doprowadziły mnie do sformułowania jeszcze ogólniejszego problemu: w jaki sposób rozszerzyć koncepcję Liego grup transformacji, by była przydatna do naszych badań bez zakładania różniczkowalności. Jak wiadomo, Lie określał skończoną (tzn. skończenie wymiarową) ciągłą grupę transformacji jako system odwzorowań x0i = fi (x1 , . . . , xn ; a1 , . . . , ar ) i = 1, . . . , n o takiej własności, że każde dwa odwzorowania tego systemu x0i = fi (x1 , . . . , xn ; a1 , . . . , ar ) x00i = fi (x01 , . . . , x0n ; b1 , . . . , br ) zastosowane jedno po drugim dają przekształcenie także należące do systemu. Może więc być przedstawione w postaci x00i = fi (f1 (x, a), . . . , fn (x, a); b1 , . . . , br ) = fi (x1 , . . . , xn ; c1 , . . . , cr ), gdzie c1 , . . . , cr są pewnymi funkcjami a1 , . . . , ar i b1 , . . . , br . Własności grupy dają się wtedy zapisać w postaci układu równań funkcyjnych, a poza spełnianiem tych równań od funkcji f1 , . . . , fn , c1 , . . . , cr nie żądamy już jakichkolwiek dodatkowych własności. Niestety sposób, w jaki Lie rozpisywał te równania funkcyjne, automatycznie wymuszał zakładanie ciągłości i różniczkowalności funkcji definiujących grupę. 1 Co do ciągłości, gotów jestem się na nią zgodzić. Wydaje się być naturalnym warunkiem – i to bez powoływania się na zastosowania geometryczne i arytmetyczne, gdzie ciągłość funkcji jest konsekwencją założeń o ciągłości systemu. Z różniczkowalnością funkcji definiujących grupę jest przeciwnie. Umieszczanie tego warunku pośród pozostałych aksjomatów geometrii jest, moim zdaniem, bardzo sztuczne i komplikuje tylko sprawę. Powstaje zatem pytanie, czy nie jest możliwe przez pewną zamianę zmiennych i parametrów na nowe przetransformować tą grupę na inną, w której funkcje definiujące są już różniczkowalne, albo też czy jest możliwe przez nałożenie pewnych prostych założeń o transformacjach doprowadzić do otrzymania grupy, w której metody Liego można już stosować. Taka redukcja dla grup analitycznych jest zawsze możliwa, zgodnie z twierdzeniem zaproponowanym przez Liego, a po raz pierwszy udowodnionym przez Schura, jeżeli grupa jest tranzytywna, to dla analityczności wystarczy założyć istnienie pierwszych i pewnych drugich pochodnych funkcji definiujących działania w grupie. Moim zdaniem badanie tego problemu może być ciekawe także dla grup nieskończonych (tzn. nieskończenie wymiarowych). Wszystko zaś razem może prowadzić do powstania teorii tej szerokiej i wcale ciekawej rodziny równań funkcyjnych, które w przeszłości były badane tylko przy założeniu różniczkowalności odpowiednich funkcji. Na czym Hilbert opierał swoje przypuszczenia? Dla ilustracji rozumowania Hilberta przedstawimy dwa proste, lecz ważne przykłady. Przykład 1. (grupa ruchów płaszczyzny euklidesowej) Jest nią grupa E(2) wszystkich izometrii płaszczyzny zachowujących orientację, a więc grupa generowana przez obroty i przesunięcia. Każdą transformację ϕ ∈ E(2) można zapisać w postaci ϕ(x, y) = (x cos θ + y sin θ + a , −x sin θ + y cos θ + b), gdzie θ, a i b są dowolnymi parametrami rzeczywistymi, przy czym θ wyznaczone jest z dokładnością do wielokrotności 2π. Składanie transformacji prowadzi do następujących operacji grupowych na zbiorze indeksów (1) (2) (θ1 , a1 , b1 ) · (θ2 , a2 , b2 ) = (θ1 + θ2 , a2 cos θ1 + b2 sin θ1 + a1 , − a2 sin θ1 + b2 cos θ1 + b1 ) (θ, a, b)−1 = (−θ , −a cos θ + b sin θ , −a sin θ − b cos θ) Możemy więc grupę E(2) utożsamić z podgrupą macierzy odwracalnych 3×3 postaci ! cos θ sin θ a − sin θ cos θ b . 0 0 1 2 Jeżeli w zbiorze indeksów [0, 2π) × (−∞, ∞) × (−∞, ∞) = R3 /2πZ × {0} × {0} wprowadzić topologię odziedziczoną z R3 , to operacje grupowe (1) i (2) stają się funkcjami ciągłymi swoich argumentów. Są, jak widać, nawet funkcjami analitycznymi, co we współczesnym języku oznacza, że E(2) jest grupą Liego. Przykład 2. (grupa ruchów płaszczyzny hiperbolicznej) Oznaczmy przez H(2) rodzinę wszystkich nieosobliwych homografii ϕ górnej półpłaszczyzny zespolonej H = {z ∈ C : Im z > 0} ϕ(z) = az + b , cz + d z ∈ H, a, b, c, d ∈ R. Ponieważ dwie rodziny parametrów wyznaczają tą samą homografię dokładnie wtedy, gdy są do siebieproporcjonalne, więc homografie możemy indeksować macierzami −b rzeczywistymi ac db dla których ad − bc = 1, utożsamiając macierze ac db i −a −c −d ze sobą. Złożeniu homografii odpowiada wtedy iloczyn macierzy. Ta grupa macierzy tradycyjnie oznaczana jest symbolem P SL(2, R). Lepszą parametryzację można a b dostać z rozkładu Iwasawy. Każdą macierz c d daje się jednoznacznie przedstawić w postaci iloczynu t a b cos θ − sin θ 1 ξ e 0 (3) c d = sin θ cos θ 0 1 , 0 e−t gdzie 0 ¬ θ < π, t, ξ ∈ R. Parametry θ, t, ξ wyrażają się przez a, b, c, d wzorami (4) θ = arc cos √ a , a 2 + c2 t = ln p a 2 + c2 , ξ= ab + cd . a2 + c2 Pozwala to, podobnie jak w przykładzie poprzednim, utożsamić grupę H(2) ze zbiorem [0, π) × (−∞, ∞) × (−∞, ∞), a topologię indukować z R3 . Ze wzorów (3) i (4) widać, że i tym razem operacje grupowe są funkcjami analitycznymi, a H(2) grupą Liego. Można pokazać, że jeżeli w półpłaszczyźnie H zamiast metryki euklidesowej wprowadzić metrykę hiperboliczną z1 − z2 , d(z1 , z2 ) = ar tgh z1 , z2 ∈ H, z1 − z2 to H(2) stanie się grupą wszystkich izometrii przestrzeni (H, d) zachowujących orientację. O co wobec tego pytał Hilbert? Aby piąty problem Hilberta przetłumaczyć na zagadnienie bardziej konkretne, dzisiaj możemy już użyć pojęć, które od kongresu Paryskiego w roku 1900 do naszych czasów rozwinęły się w teorii grup topologicznych. W języku współczesnym problem 3 ten na ogół przyjmuje postać: Czy każda grupa lokalnie euklidesowa jest już grupą Liego? Nim w końcu pytanie to uzyskało pozytywną odpowiedź w roku 1952, zainspirowało wiele prac o grupach topologicznych. Dość wcześnie uzyskano też częściowe odpowiedzi. Tematykę rozpoczął Brouwer cyklem prac z roku 1910 o grupach transformacji prostej i płaszczyzny. Złotym okresem były jednak lata trzydzieste. Wtedy to, głównie dzięki pracom E. Cartana i H. Weyla, otrzymano kompletny opis grup Liego jako obiektów geometrycznych. Uzyskano też wiele informacji o strukturze globalnej grup Liego i ich związkach z podgrupami grup macierzowych. Okres ten zamknęły prace von Neumanna i Pontrjagina pozytywnym rozwiązaniem piątego problemu Hilberta odpowiednio dla grup zwartych i abelowych. Pełne pozytywne rozwiązanie piątego problemu Hilberta stało się możliwe w roku 1952 dzięki równoczesnym wynikom Gleasona i Montgomery–Zippina. Dowiedli oni, że każda skończenie wymiarowa grupa lokalnie zwarta jest uogólnioną grupą Liego, tzn. że w jej składowej spójnej jedności G0 można tak wybrać dowolnie mały dzielnik normalny N , że G0 /N stanie się grupą Liego. Prace te były później istotnie uproszczone i rozszerzone przez Yamabe, a w końcu w roku 1971 Kaplansky w swojej książce [2] nadał im wszystkim najogólniejszą formę i znalazł najprostsze dowody. Dlatego podręcznik Kaplansky’ego polecamy każdemu, kto chciałby poznać szczegóły. Oto odpowiedź! Twierdzenie. Dla grupy topologicznej G następujące własności są równoważne: 1. nie ma małych podgrup, 2. jest lokalnie euklidesowa, 3. jest grupą Liego. Wyjaśnimy pokrótce hasła występujące w sformułowaniu powyższego twierdzenia. Grupa topologiczna to obiekt, który jest jednocześnie grupą i przestrzenią topologiczną Hausdorffa. Żądamy przy tym, aby operacje grupowe były ciągłe, tzn. by przyporządkowanie (x, y) → xy −1 było funkcją ciągłą z G × G w G. Zwróćmy uwagę, że dla każdego ustalonego y ∈ G przesunięcie x → xy −1 musi być wtedy homeomorfizmem G na G. Dla określenia topologii w G wystarczy więc opisać bazę otoczeń jedności 1, a otoczenia innych punktów otrzymać jako jej przesunięcia. Jeżeli któreś z otoczeń jedności jest homeomorficzne z podzbiorem otwartym przestrzeni euklidesowej Rn to powiemy, że grupa jest lokalnie euklidesowa. Grupa Liego to taka grupa lokalnie euklidesowa, w której homeomorfizm ten wybrać można tak, by operacje grupowe były rzeczywistymi funkcjami analitycznymi. Zwykle o grupie topologicznej łatwo jest rozstrzygnąć, czy jest lokalnie euklidesową. Nie ma jednak żadnej prostej metody sprawdzenia, czy jest grupą Liego. Zbyt wiele jest lokalnych homeomorfizmów w przestrzeń euklidesową, jeśli te dające analityczność nie od razu 4 są widoczne, to zwykle odkrywa się je przypadkowo. No i wreszcie ostatnie hasło. O grupie topologicznej G powiemy, ze G nie ma małych podgrup lub, że jest NSS-grupą (no small subgroups) jeżeli ma takie otoczenie U jedności 1, że {1} jest jedyną podgrupą leżącą w U . Przykład 3. Ustalmy liczbę pierwszą p i dla liczby całkowitej n połóżmy |n| = p−k gdy n = pk m, a m jest już liczbą całkowitą niepodzielną przez p. Łatwo sprawdzić, że |n1 ± n2 | ¬ max{|n1 |, |n2 |} ¬ |n1 | + |n2 |. Wynika stąd, że funkcja d(n1 , n2 ) = |n1 − n2 | jest metryką w zbiorze Z wszystkich liczb całkowitych, a dodawanie i odejmowanie są operacjami ciągłymi. Po uzupełnieniu w metryce d otrzymamy grupę topologiczną, zwaną grupą liczb całkowitych p-adycznych i tradycyjnie oznaczaną przez Zp . Jest to przestrzeń metryczna zupełna, całkowicie niespójna, nie jest więc grupą lokalnie euklidesową. Nie jest też NSS-grupą. Rzeczywiście, niech U będzie dowolnym otoczeniem 0 (0 jest tu jednością grupy). Możemy przy tym założyć, że otoczenie to ma postać U = {n ∈ Z : |n| < ε}, gdzie ε jest pewną liczbą dodatnią. Jeżeli liczbę naturalną k dobrać tak by p−k < ε, to zbiór pk Z utworzy nietrywialną podgrupą Zp leżącą w U . Jak dowieść to twierdzenie? Spośród wszystkich możliwych implikacji w twierdzeniu tylko 3 ⇒ 2 jest oczywista. To, że grupa Liego nie może mieć małych podgrup a więc, że 3 ⇒ 1 wynika stosunkowo łatwo z ogólnej teorii grup Liego i każdy, kto choć trochę zna tą teorię, może sam tego dowieść. Wszystkie pozostałe implikacje są daleko nieoczywiste. Streścimy pokrótce, jak zostały dowiedzione. Dowód implikacji 1 ⇒ 2 jest bardzo żmudny i polega na wymyślnych konstrukcjach podgrup jednoparametrowych. Na samym początku dowodzi się, że każda NSS-grupa jest metryzowalna. Jest to konsekwencją ogólniejszego twierdzenia mówiącego, że w dowolnym otoczeniu U jedności grupy lokalnie zwartej G istnieje taka podgrupa normalna N , że grupa ilorazowa G/N jest metryzowalną. Metryzowalność pozwala w wielu konstrukcjach posłużyć się twierdzeniem Bolzano–Weierstrassa. Dowodzi się na przykład, że każda NSS-grupa musi zawierać otoczenie jedności, na którym operacja podnoszenia do kwadratu jest wzajemnie jednoznaczna, tzn. że x2 = y 2 pociąga x = y. Z tego, przez iterację, można dostać otoczenie jedności, na którym podnoszenie do wyższych potęg też jest wzajemnie jednoznaczne. Stąd krok tylko do dowodu, że każda niedyskretna lokalnie zwarta NSS-grupa zawiera nietrywialną grupę jednoparametrową tzn. nietrywialny homomorfizm z grupy R liczb rzeczywistych w G. To bardzo istotny krok w dowodzie. Rzecz polega jednak na tym, że grup takich ma być dużo. Należy wskazać takie otoczenie jedności, że przez każdy jego punkt przechodzi jakaś grupa jednoparametrowa. To kluczowe miejsce dowodu, zajmuje najwięcej miejsca i czasu. Potem w zbiorze L grup jednoparametrowych 5 wprowadza się strukturę przestrzeni liniowej, kładąc dla X, Y ∈ L: (X + Y )(t) = lim (X(t/k)Y (t/k))k k→∞ i dowodzi już łatwo, ze wymiar tej przestrzeni jest skończony. Oznacza to, że każda lokalnie zwarta NSS-grupa jest lokalnie euklidesowa, a więc że zachodzi implikacja 1 ⇒ 2. W dowodzie implikacji 1 ⇒ 3 korzysta się z wszystkich wcześniej udowodnionych faktów. Otóż w zbiorze L można dodatkowo wprowadzić strukturę algebry Liego, określając komutator [X, Y ] wektorów X, Y ∈ L wzorem [X, Y ](t) = lim lim (X(1/k)Y (1/m)X(−1/k)Y (−1/m))[tkm] , k→∞ m→∞ gdzie [tkm] w wykładniku oznacza część całkowitą liczby tkm. Wystarczy teraz powołać się na klasyczną teorię opisującą odpowiedniość między grupami Liego i algebrami Liego, by stwierdzić, że G jest grupą Liego. Dowód implikacja 2 ⇒ 1 pochodzi od Yamabe i opiera się na następującym twierdzeniu: jeżeli G jest spójną grupą lokalnie zwartą, a U otoczeniem jedności w G to istnieje taka podgrupa normalna N ⊂ U , że G/N jest NSS-grupą. Jest wtedy, jak już wiemy, grupą lokalnie euklidesową. Dowodzi się, że jeżeli G/N ma maksymalny wymiar spośród wszystkich NSS-grup będących obrazami homomorficznymi G, to N musi być grupą całkowicie niespójną. Jeżeli G dodatkowo jest lokalnie spójna, to N może już tylko być grupą dyskretną. Gdy G jest grupą lokalnie euklidesową, to rozumowanie powyższe można przeprowadzić dla jej składowej spójnej G0 . Stąd już tylko krok by dowieść, że G0 a stąd że G musi być NSS-grupą. Gdzie o tym można przeczytać? [1] I. Kaplansky, Lie algebras and locally compact groups, Chicago University Press, Chicago, 1971 (tłumaczenie rosyjskie I. Kaplanski$i, Algebry Li i lokal~no kompaktnye gruppy, Mir, Moskva, 1974). [2] D. Montgomery, L. Zippin, Topological transformation groups, Interscience, New York, 1955. [3] C. T. Yang, Hilbert fifth problem and related problems on transformation groups, Mathematical developments arising from Hilbert problems, Proc. Symp. Pure Math., 28 (1976) str. 142—146. 6