Wybrane zagadnienia analizy
Transkrypt
Wybrane zagadnienia analizy
Wojciech Kryszewski Wybrane zagadnienia analizy Wykład monograficzny Wydział Matematyki i Informatyki UMK Toruń 2011 ISBN xxxx c Copyright by Wojciech Kryszewski Skład komputerowy LATEX w wykonaniu autora i Spis treści Spis treści 1 I rozdział 1.1 Miary niezwartości . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Operatory Lipschitza . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Nieliniowa rezolwenta . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Liniowa rezolwenta i widmo . . . . . . . . . . . . . . . . . . . . . 1.5 Operatory γ-Lipschitza . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Teoria Fredholma-Schaudera dla operatorów lipschitzowskich . . 1.7 Operatory liniowe o zwartych lub γ-lipschitzowskich rezolwentach 1.8 Operatory na stożkach . . . . . . . . . . . . . . . . . . . . . . . . 1.9 Zwartość w niektórych przestrzeniach . . . . . . . . . . . . . . . 1.10 Twierdzenie Ekelanda i jego warianty . . . . . . . . . . . . . . . . 1.10.A Funkcja półciągłe i problem minimizacji . . . . . . . . . . 1.10.B Zasada Ekelanda . . . . . . . . . . . . . . . . . . . . . . . 1.10.C Twierdzenia o punkcie stałym . . . . . . . . . . . . . . . . 1.10.D Nieliniowe półgrupy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 10 16 20 26 30 39 43 43 43 43 46 49 51 Rozdział 1 I rozdział 1.1 Miary niezwartości Niech E będzie nieskończenie wymiarową przestrzenią Banacha; dla zbioru A ⊂ E, średnicą zbioru A nazywamy liczbę diam (A) := sup ka − bk ¬ ∞. a,b∈A Ćwiczenie: Udowodnić następujące własności: (i) Jeśli A ⊂ B ⊂ E, to diam (A) ¬ diam (B); (ii) diam (cl A) = diam (A); (iii) diam (λA) = |λ|diam (A) dla λ ∈ R; (iv) jeśli B ⊂ E, to diam (A ± B) ¬ diam (A) + diam (B); (v) diam (conv A) = diam (A); (vi) zbiór A jest ograniczony wtedy i tylko wtedy, gdy diam (A) < ∞. Uwaga: Oczywiście pojęcie średnicy można zdefiniować dla podzbiorów dowolnej przestrzeni metrycznej. Kluczowe jest dobrze znane twierdzenie Hausdorffa. 1.1.1 Twierdzenie: Podzbiór A przestrzeni zupełnej X jest zwarty wtedy i tylko wtedy, gdy jest domknięty i dla dowolnego ε > 0 posiada skończoną ε-sieć. Przypomnijmy, że ε-siecią dla zbioru A ⊂ X, gdzie ε > 0 i (X, d) jest przestrzenią metryczną, nazywamy zbiór S ⊂ X taki, że dla dowolnego x ∈ A istnieje s ∈ S taki, że d(x, s) ¬ ε. Uwaga: Zbiory posiadające dla dowolnego ε > 0 skończoną ε-sieć nazywa się czasem całkowicie ograniczonymi. Ćwiczenie: (i) Udowodnić, ze zbiory całkowicie ograniczone są ograniczone. (ii) Zastanowić się czy w definicji ε-sieci ma znaczenie skąd bierze się zbiór S? Można mianowicie mówić, że zbiór A ma ε-sieć S w zbiorze Y ⊂ X, jeśli S ⊂ Y . Twierdzenie Hausdorffa jest punktem wyjścia do następującej definicji. 1.1.2 Definicja: Niech B(E) oznacza rodzinę ograniczonych podzbiorów przestrzeni E. Definiujemy trzy funkcje α, β, χ : B(E) → R wzorami α(B) := inf{d > 0 | B ma skończone pokrycie zbiorami o średnicy ¬ d}; 2 1. I rozdział β(B) := inf{ε > 0 | B można pokryć skończoną liczbą kul o promieniu ¬ ε}; χ(B) := sup{δ 0 | istnieje ciag (xn ) ⊂ B taki, że kxn − xm k δ, n 6= m}. Funkcję α (odp. β) nazywamy miarą niezwartości Kuratowskiego (odp. Hausdorffa lub miarą Istrǎţescu). Ćwiczenie: (i) Udowodnić, że w definicji miary Hausdorffa jest bez znaczenia czy dopuszczamy kule otwarte czy domknięte. (ii) Pokazać, że β(B) < ε wtedy i tylko wtedy, gdy B ma skończoną ε-sieć. (iii) Ogólniej: dla B ∈ B(E) β(B) = inf{ε > 0 | B posiada skończoną ε − sieć}. 1.1.3 Twierdzenie: Niech γ oznacza α, β lub χ. Wtedy: (1) γ(B) = 0 wtedy i tylko wtedy, gdy B jest zbiorem względnie zwarty. (2) γ jest półnormą, tzn. γ(λB) = |λ|γ(B) oraz γ(B1 + B2 ) ¬ γ(B1 ) + γ(B2 ) dla λ ∈ R, B, B1 , B2 ∈ B(E); (3) dla każdego B ∈ B(E), γ(conv B) = γ(B) = γ(cl B); (4) funkcja γ jest ciągła jednostajnie ciągła względem metryki Hausdorffa, tzn. dla dowolnego ε > 0 istnieje δ > 0 taka, że jeśli B1 , B2 ∈ B(E) i dH (B1 , B2 ) < δ, to |γ(B1 ) − γ(B2 )| < ε; dokładniej |α(B1 ) − α(B2 )| ¬ 2dH (B1 , B2 ); |β(B1 ) − β(B2 )| ¬ dH (B1 , B2 ). (5) α(B(x, r)) = 2r, β(B(x, r)) = r, gdzie x ∈ E i r > 0; dodatkowo χ(B(x, r)) r (nawet można znaleźć ciąg (xn ) taki, że kxn − xm k r przy n 6= m); (6) miara γ jest monotoniczna: jeżeli B1 ⊂ B2 , to γ(B1 ) ¬ γ(B2 ) oraz addytywna: γ(B1 ∪ B2 ) = max{γ(B1 ), γ(B2 )}. Ćwiczenie: Metryką Hausdorffa (a w zasadzie półmetryką) nazywamy funkcję dH : B(E) × B(E) → R zadaną wzorem dH (A, B) := max{sup d(a, B), sup d(b, A)}. a∈A b∈B Udowodnić, że dH jest półmetryką i dH (A, B) = 0 wtedy i tylko wtedy, gdy cl A = cl B. Ponadto rodzina domkniętych i ograniczonych zbiorów w E jest wraz z dH przestrzenią metryczną zupełną. Ćwiczenie: Wykazać, że ∀ B ∈ B(E) β(B) ¬ α(B) ¬ 2β(B) i podać przykład sytuacji, w której nierówności sa ostre. Dowód powyższego twierdzenia nie jest łatwy i należy go przeprowadzić po zdobyciu pewnego doświadczenia. Dla przykładu pokażę, że α(B) = α(conv B) dla B ∈ B(E). Jest jasne, że α(B) ¬ α(conv B) z uwagi na monotoniczność α. Przypuśćmy, że α(B) < d. Pokażemy, że dla dowolnego ε > 0, α(conv B) < d + ε (to wystarczy – dlaczego). S Z definicji B ⊂ m i=1 Bi , gdzie diam (Bi ) < d dla i = 1, ..., m. Zauważmy, że conv B ⊂ [ m X λ=(λ1 ,...,λm )∈∆m i=1 λi conv Bi , 3 1.1. Miary niezwartości gdzie ∆m := {λ = (λ1 , ..., λm ) ∈ Rm | λi 0, m λ = 1} jest tzw. sympleksem standardowym. i=1 P i Rzeczywiście: niech x ∈ conv B; wtedy x = nj=1 µj xj , gdzie xj ∈ B, µj 0 dla wszystkich P j = 1, ..., n oraz nj=1 µj = 1. Dla i = 1 wybieramy te wskaźniki j = 1, ..., n, dla których xj ∈ B1 ; otrzymamy tym sposobem zbiór J1 . Dla i = 2 wybieramy (spośród pozostałych) te wskaźniki j = 1, ..., n, dla których xj ∈ B2 i otrzymamy tym sposobem zbiór J2 . Postępujemy analogicznie dla i = 3, ..., m i otrzymamy rozłączne zbiory J3 , ..., Jm . W efekcie P {1, ..., n} = m [ Ji , i=1 przy czym zbiory Ji , i = 1, ..., m , są rozłączne. Niech λi = X µj , i = 1, ..., m. j∈Ji Oczywiście λ := (λ1 , ..., λm ) ∈ ∆m . Niech, dla i = 1, ..., m oraz j ∈ Ji , δj := P j∈Ji δj = 1, δj 0 oraz X δj xj ∈ conv Bi , i = 1, ..., m. µj λi . Wtedy j∈Ji Zatem n X x= µj x j = m X i=1 j=1 λi X m X δ j xj ∈ λi conv Bi . i=1 j∈Ji Sympleks ∆m jest zbiorem zwartym. Ustalmy ε > 0. Istnieje skończona ε/M -sieć S dla ∆m , gdzie M jest taka liczbą, że wszystkie zbiory Bi , i = 1, ..., m, mieszczą się w kuli B(0, M ). Innymi słowy dla dowolnego λ ∈ ∆m znajdziemy s = s(λ) = (s1 , ..., sm ) ∈ S tak, by ksλ − λk := max |λi − si | ¬ ε/d. i=1,...,m W takim razie jeżeli λ = (λ1 , ..., λm ) ∈ ∆m oraz y ∈ yi ∈ conv Bi oraz m Pm i=1 λi conv Bi , to y = Pm i=1 λi yi , gdzie X X si yi ¬ |λi − si |kyi k < ε. y − i=1 i=1 Pokazaliśmy więc, że dla każdego λ ∈ ∆m , m X λi conv Bi ⊂ i=1 zatem si conv Bi + B(0, ε); s∈S i=1 m [ X conv B ⊂ m [X λi conv Bi ⊂ λ∈∆m i=1 m [X si conv Bi + B(0, ε). s∈S i=1 W taki razie α(conv B) ¬ α m [X s∈S i=1 ! si conv Bi ¬ max s∈S m X si α(conv Bi ) + ε. i=1 Oczywiście α(conv Bi ) ¬ diam (conv Bi ) = diam (Bi ) < d. W takim razie, dla każdego s ∈ S, Pm i=1 si α(conv Bi ) < d oraz α(conv B) < d + ε. 4 1. I rozdział Udowodnimy też punkt (5) twierdzenia. Zacznijmy od β. Jest jasne, że β(B(0, r)) ¬ r. Przypuśćmy, że β(B(0, r)) = q < r. Weźmy ε > 0 tak, by q + ε < r i niech {s1 , ..., sn } ⊂ E będzie (q + ε)-siecią dla B(0, r), tzn. B(0, r) ⊂ n [ (si + (q + ε)B(0, 1)) = i=1 n [ (si + (q + ε)/rB(0, r)). i=1 Zatem q = β(B(0, r)) ¬ q(q + ε)/r, co jest sprzeczne. Dowód dla α jest trudniejszy. Musimy odwołać się do twierdzenie Lusternika-SchnirelmanaBorsuka, które głosi co następuje: Jeśli rodzina A1 , ..., An jest domkniętym pokryciem sfery S n , to przynajmniej jeden ze zbiorów Ai zawiera parę punktów antypodycznych; w szczególności diam (Ai ) 2 = diam (S n ). Dla prostoty załóżmy, że r = 1. Wiemy już, że α(D(0, 1)) ¬ 2β(B(0, 1)) = 2. Przypuśćmy, że α(B(0, 1)) < 2. Oznacza to, że znajdziemy skończoną rodzinę B1 , ..., Bn zbiorów domkniętych, która (w sumie) pokrywa D(0, 1) oraz diam (Bi ) < 2. Weźmy dowolną podprzestrzeń E1 ⊂ E taką, że dim E1 = n + 1 (to możliwe bo z założenia dim E = ∞). Wtedy zbiory Ai := Bi ∩ E1 pokrywają iloczyn D(0, 1) ∩ E1 = Dn+1 , a zatem Ai ∩ S n pokrywają S n . Stąd 2 ¬ diam (Ai ∩ S n ) ¬ diam (Ai ) ¬ diam (Bi ) < 2 dla pewnego i = 1, ..., n: sprzeczność. Uwaga: Bezwzględnie warto udowodnić całe twierdzenie: jest to doskonałe ćwiczenie na sprawność. 1.1.4 Uwaga: Zauważmy, że wartość miary Hausdorffa zależy od zbioru, w którym wybierane są środki kul, tzn.jeżeli C ⊂ E i βC (B) := inf{ε > 0 | B można pokryć skończoną liczbą kul ośrodkach w zbiorze C i o promieniu ¬ ε}; wtedy β(B) ¬ βC (B) dla B ∈ B(E). Ogólniej: dla dowolnego B ∈ B(E), jeśli B ⊂ X ⊂ E, to β(B) ¬ βX (B) ¬ βB (B) ¬ χ(B) ¬ α(B) ¬ 2β(B). Ćwiczenie: Udowodnić te nierówności. Można tez pokazać, że jeśli β(B) < r, to β(B) = βB(M,r) (B). 1.1.5 Fakt: Dla B ∈ B(E), miara niezwartości β(B) < r wtedy i tylko wtedy, gdy istnieje zbiór zwarty Z ⊂ E taki, że dla każdego x ∈ B, d(x, Z) < r, tzn. B ⊂ B(Z, r) := Z + B(0, r). W szczególności zbiór B jest względnie zwarty wtedy i tylko wtedy, gdy dla dowolnego ε > 0 istnieje zbiór zwarty Z taki, że B ⊂ B(Z, ε) Dowód: Jeżeli β(B) < r, to (z definicji kresu dolnego) znajdziemy skończony zbiór S ⊂ E taki, że dla każdego x ∈ B, d(x, S) := inf s∈S d(x, s) < r. Wystarczy wziąć Z := S (S – jako zbiór skończony – jest zwarty). Na odwrót: przypuśćmy, że dany jest zbiór zwarty Z taki, że d(x, Z) < r dla dowolnego x ∈ B. Oznacza to, że B ⊂ Z + B(0, r). W taki razie β(B) ¬ β(Z + B(0, r)) ¬ max{β(Z), β(B(0, r))} = r. Ważna własność miary niezwartości dotyczy uogólnienia tzw. twierdzenie Cantora. 1.1.6 Twierdzenie: Niech {Bn }n∈N będzie zstępującą rodziną zbiorów ograniczonych niepuT stych. Jeśli limn→∞ γ(Bn ) = 0, to ∞ n=1 cl Bn jest niepustym zbiorem zwartym. 5 1.1. Miary niezwartości Dowód: Niech B = ∞ n=1 cl Bn . Wtedy B jest domknięty i γ(B) ¬ γ(Bn ) dla dowolnego n 1. zatem γ(B) = 0, czyli B jest zwarty. Niech Ω = {xn }n∈N , gdzie xn ∈ Bn . Oczywiście, dla dowolnego k 1, γ(Ω) = γ({xn }kn=1 ∪ {xn }n>k ) = γ({xn }n>k ) → 0 T gdy k → ∞. Zatem γ(Ω) = 0. W takim razie (ewentualnie przechodząc do podciągu xn → x w E. Jest jasne, że x ∈ cl Bn dla każdego n. zatem x ∈ B. Ćwiczenie: Uzupełnić szczegóły dowodu. 1.1.7 Lemat: Rozważmy dwa ograniczone zbiory X = {xi }i∈I oraz Y = {yi }i∈I . Wtedy γ(X) − γ(Y ) ¬ γ({xi + yi }i∈I ) ¬ γ(X) + γ(Y ). Dowód: Jest jasne, że {xi + yi }i∈I ⊂ X + Y . Zatem γ({xi + yi }i∈I ) ¬ γ(X) + γ(Y ). Zauważmy teraz, że X = {xi + yi − yi } ⊂ {xi + yi }i∈I − Y = {xi + yi }i∈I + (−Y ). Zatem γ(X) ¬¬ γ({xi + yi }i∈I ) + γ(−Y ), skąd teza bo γ(−Y ) = γ(Y ) (sprawdzić to). 1.1.8 Uwaga: Przy powyższych założeniach, jeśli γ(Y ) = 0, to γ({xi + yi }i∈I ) = γ(X). Kilka przykładów przydatności miar niezwartości. ∞ 2 1.1.9 Przykład: (i) W przestrzeni `2 := {(xn )∞ n=1 |xn | < ∞} z normą kxk := n=1 | xn ∈ C 2 2 n=1 |xn | dla x = (xn ) ∈ ` najbardziej typowym zbiorem zwartym jest tzw. kostka Hilberta, 2 tzn. zbiór Q := {(xn ) ∈ ` | |xn | ¬ 1/n}. Oczywiście Q ⊂ `2 (poprawność definicji). Pokażemy, że Q jest zbiorem zwartym. Jest to P −1 < oczywiście zbiór domknięty (pokazać to). Niech ε > 0. Dobierzmy N ∈ N tak, by ∞ k=N +1 k P P −1 = 0). Niech ε2 (jest to możliwe, bo szereg ( k −2 )k1 jest zbieżny, zatem limN →∞ ∞ k=N +1 k Z := {x ∈ Q | xn = 0 dla n > N }. Zbiór Z (jako de facto) skończony iloczyn kartezjański odcinków) jest zwarty. Pokażemy, że P pP∞ Q ⊂ B(Z, ε) := Z + B(0, ε). Istotnie: niech x = (xn ) ∈ Q. Wtedy x = z + y, gdzie z := (x1 , ..., xN , 0, 0, ...) ∈ Z oraz y := (0, ..., 0, xN +1 , xN +2 , ...). Zauważmy, że kyk2 = ∞ X k=N +1 |xk |2 ¬ ∞ X k −2 < ε2 . k=N +1 Zatem kyk < ε. W tym miejscu zauważmy, że w literaturze funkcjonuje inna definicja kostki Q Hilberta. Mianowicie rozważa się przestrzeń I ∞ = ∞ i=1 I, gdzie I := [0, 1] z topologią Tichonowa (iloczynu kartezjańskiego) (1 ). Wiemy, że przestrzeń ta jest zwarta. Jest ona też metryzowalna, 1 Q Topologią Tichonowa (lub topologią iloczynu kartezjańskiego) w produkcie X := j∈J Xj przestrzeni topologicznych Xj , j ∈ J, nazywamy najsłabszą topologię, przy której wszystkie rzutowania πj : X → Xj , j ∈ J, są ciągłe. Zasadnicze twierdzenie Tichonowa orzeka, że X jest przestrzenią zwartą wtedy i tylko wtedy, gdy przestrzenie Xj , j ∈ J, są zwarte. 6 1. I rozdział tzn. jej topologię można wprowadzić za pomocą metryki: mianowicie, dla x = (xn ), y = (yn ) ∈ I ∞ , kładziemy ∞ X |xn − yn | . d(x, y) := 2n n=1 Łatwo sprawdzić, że d jest istotnie metryką. To ważna przestrzeń, bo jest twierdzenie Urysohna, które mówi, że każdą zwartą przestrzeń metryczną można uważać za domkniętą podprzestrzeń I ∞ ; dokładniej: jeśli X jest zwartą przestrzenią metryczną, to istnieje homeomorfizm h : X → Z, gdzie Z jest domkniętym podzbiorem kostki Hilberta I ∞ . Pokażemy, że istnieje homeomorfizm h : Q → I ∞ , gdzie rozważamy „rzeczywistą” kostkę Q. Otóż połóżmy h(x) = (x1 , 2x2 , ..., nxn , ...), x = (xn )∞ n=1 ∈ Q. Jest jasne, że odwzorowanie h jest poprawnie określoną bijekcją (sprawdzić). Wtedy dla dowolnych x, y ∈ Q, d(h(x), h(y)) = ∞ X n n=1 2n |xn − yn | ¬ ∞ X n2 n=1 !1/2 22n ∞ X !1/2 |xn − yn | = Lkxn − yn k, n=1 gdzie L := ∞ X n2 n=1 !1/2 22n . Ten ostatni szereg jest zbieżny na mocy, np. kryterium d’Alemberta. Ciągłość i bijektywność (wraz ze zwartością Q) dowodzi, że Q jest homeomorfizmem (2 ). Zauważmy jeszcze, że skonstruowany homeomorfizm spełnia warunek Lipschitza. Czy istnieje homeomorfizm h taki, że h−1 jest też odwzorowaniem spełniającym warunek Lipschitza? (ii) Powyższy przykład można uogólnić. Niech H będzie dowolną (ośrodkową) przestrzenią Hilberta z iloczynem skalarnym h·, ·i, w której dany jest zupełny układ ortonormalny (ek ). Zbiór Z ⊂ H jest względnie zwarty wtedy i tylko wtedy, gdy jest on ograniczony i zbieżność szeregu P∞ P Fouriera x = ∞ k=1 fk , k=1 hx, ek iek jest jednostajne ze względu na x ∈ Z, szereg funkcyjny gdzie fk : Z → H, fk (x) := hx, ek iek dla x ∈ Z i k , jest zbieżny jednostajnie do sumy f : Z → H, f (x) = x dla x ∈ Z. Innymi słowy: dla dowolnego ε > 0 istnieje N ∈ N takie, że P kx − nk=1 hx, ek iek k < ε, o ile n N i x ∈ Z. Dla dowodu konieczności zauważmy najpierw, że zbiory (względnie) zwarte są ograniczone. Trzeba więc pokazać, że zachodzi podany warunek jednostajnej zbieżności. Ustalmy ε > 0 i wybierzmy skończoną 2−1 ε-sieć S = {s1 , ...sm } w H dla zbioru Z. Istnieje N ∈ N takie, że X ∞ ε hsi , ek iek < 2, k=n+1 o ile i = 1, ..., m oraz n N . Jeśli teraz x ∈ Z, to istnieje i = 1, ..., m takie, że kx − si k < ε/2 i wtedy dla n N , X n ∞ ∞ X X hx, ek iek = hx, e ie = hx − s , e ie x − i k k + k k k=1 k=n+1 k=n+1 ∞ X hs , e ie i k k ¬ kx − si k + ε/2 < ε. k=n+1 2 Oczywiście to samo jest prawdą dla „zespolonej” kostki Q. 1.1. Miary niezwartości 7 Dla dowodu dostateczności można powtórzyć rozumowanie z poprzedniego przykładu (zrobić to). Wreszcie zauważmy, że warunek jednostajnej zbieżności dla kostki Q jest natychmiast spełniony: przede wszystkim `2 jest przestrzenią Hilberta (z iloczynem skalarnym zadanym wzorem P 2 ∞ hx, yi := ∞ n=1 xn y n dla x, y ∈ ` ) i posiada zupełny układ ortonormalny ek := (δkn )n=1 . Za2 uważmy, że dla x ∈ ` , hx, ek i = xk , k 1. Zatem fk (x) := xk ek . Jeśli x ∈ Q, to kfk (x)k ¬ k −1 . P Zatem jednostajna zbieżność szeregu fk wynika z twierdzenia Weierstrassa. Ćwiczenie: Spróbować udowodnić, za pomocą miar niezwartości twierdzenie Ascoli-Arzeli w następującym brzmieniu: Niech K będzie zwartą przestrzenią. Zbiór F ⊂ C(K, E) przestrzeni funkcji ciągłych K → E z normą kxk∞ := supt∈K kx(t)k dla x ∈ C(K, E) (wraz z tą normą C(K, E) jest przestrzenią Banacha) jest względnie zwarty wtedy i tylko wtedy, gdy dla dowolnego t ∈ K, „włókno” F (t) := {x(t) | x ∈ F } jest zbiorem względnie zwartym oraz rodzina F jest jednakowo ciągła, tzn. dla dowolnego t ∈ K i ε > 0 istnieje δ > 0 taka, że jeśli x ∈ F , s ∈ K oraz d(t, s) < δ, to kx(s) − x(t)k < ε. W zasadzie trzeba udowodnić, że jeśli zbiór F ⊂ C(K, E) jest ograniczony i jednakowo ciągły, to γ(F ) = supt∈K γ(F (t)) (oczywiście „pierwsza” γ jest miarą niezwartości (Hausdorffa lub Kuratowskiego) w C(K, E), zaś „druga” γ jest miarą niezwartości w E). Przypuśćmy teraz, że E jest przestrzenią ośrodkową. Równoważnie: w przestrzeni E istnieje filtracja, tzn. istnieje wstępujący ciąg (En ) skończenie-wymiarowych podprzestrzeni taki, że S cl ∞ n=1 En = E. Ćwiczenie: Jeśli E jest ośrodkowa, to jak zdefiniowana jest filtracja? Na odwrót: dlaczego przestrzeń sfiltrowana jest ośrodkowa? Zauważmy, że jeśli przestrzeń E ma bazę Schaudera, to jest ośrodkowa (ośrodkiem jest zbiór wymiernych kombinacji liniowych wektorów z bazy). Przypomnijmy, że E układ (ek ) jest bazą P Schaudera jeśli dowolny x ∈ E posiada jednoznaczne rozwinięcie w zbieżny szereg x = ∞ k=1 xk ek , gdzie xk ∈ K. Można wtedy zdefiniować funkcjonały liniowe pk : E → K zadane wzorem hx, pk i := xk dla x ∈ E (oczywiście hek , pj i = δkj dla k, j 1). Wtedy pk ∈ E∗ i kpk k < ∞ (dowód jest nieco niebanalny). Można zdefiniować En := span{e1 , ..., en } oraz Pn : E → En wzorem Pn (x) := n X hx, pk iek , x ∈ E. k=1 Oczywiście P jest ciągłym operatorem liniowym oraz X ∞ kx − Pn xk = hx, pk iek → 0, k=n+1 czyli limn→∞ Pn x = x. Z twierdzenia Banacha-Steinhausa (za chwilę przypomnimy to twierdzenie) wynika, że supn∈N kPn k < ∞. 1.1.10 Przykład: Bazę Schaudera posiadają przestrzenie: (a) Każda ośrodkowa przestrzeń Hilberta posiada bazę Schaudera; jest nią dowolny układ zupełny i ortonormalny. (b) c, c0 , `p (przy 1 ¬ p < ∞) (jakie? specjalną uwagę zwrócić na c); (c) Lp ([a, b], R) (układ Haara), C([a, b], R) (układ Schaudera – poczytać o tym); (d) czy przestrzeń `∞ posiada bazę? Możemy teraz uogólnić powyższy przykład: 1.1.11 Twierdzenie: Jeśli E ma bazę Schaudera (ek ), to zbiór Z ⊂ E jest względnie zwarty 8 1. I rozdział wtedy i tylko wtedy, gdy jest ograniczony i lim sup kx − Pn (x)k = 0. n→∞ x∈Z Dowód przebiega niemal analogicznie jak poprzednio (przeprowadzić go). 1.1.12 Twierdzenie: Niech (En ) będzie filtracją w przestrzeni Banacha E. Wtedy, dla dowolnego B ∈ B(E) mamy: β(B) = lim sup d(x, En ) n→∞ x∈B (granica po prawej stronie istnieje – dlaczego?). Jeśli (przeliczalny) zbiór B = {xn }∞ n=1 jest ograniczony, to β(B) = lim lim sup d(xk , Ek ). n→∞ k→∞ Dowód: Niech δ(B) := limn→∞ supx∈B d(x, En ). Zatem dla dowolnego ε > 0 istnieje N ∈ N takie, że |supx∈B d(x, En ) − δ(B)| < ε/2, o ile n N . Niech C := {y ∈ EN | ky − xk = d(x, EN ) dla pewnego x ∈ B}. Zbiór C jest niepusty (jeśli x ∈ B, to istnieje y ∈ EN takie, że kx − yk = d(x, EN – udowodnić) oraz ograniczony. Ma on S zatem skończoną ε/2-sieć {y1 , ..., ym }, tzn. C ⊂ m i=1 B(yi , ε/2). Wówczas B⊂ m [ B(yi , δ(B) + 2ε). i=1 Istotnie: weźmy x ∈ B; zgodnie z tym co było powiedziane, istnieje y ∈ C takie, że kx − yk = d(x, EN ) < δ(B) + ε/2. Z drugiej strony istnieje i = 1, ..., m, że ky − yi k ¬ ε/2. Stąd kx − yi k < δ(B) + ε.. Zatem {y1 , ..., ym } jest skończoną (δ(B) + ε)-siecią dla zbioru B, czyli β(B) ¬ δ(B) + ε. Z uwagi na dowolność ε wnosimy, że β(B) ¬ δ(B). Niech r = β(B); ustalmy ε > 0. Istnieje skończona (r + ε/2)-sieć S = {s1 , ..., sm } dla B. S Ponieważ cl En = E, to dla dowolnego i = 1, ..., m znajdziemy yi ∈ Eni takie, że kyi −si k < ε/2. Niech N = max{n1 , ..., nm }. Wówczas, dla n N , yi ∈ En dla każdego i = 1, ..., m. Zauważmy teraz, że dla każdego x ∈ B istnieje i = 1, ..., m takie, że d(x, En ) ¬ kx − yi k ¬ kx − si k + kyi − si k < r + ε, o ile n N . Tak więc supx∈B d(x, En ) ¬ ε przy n N . Dowodzi to, że δ(B) ¬ r + ε i, wykorzystując dowolność ε > 0, że δ(B) ¬ r. Dowód drugiej równości – polecam Czytelnikowi. Powyższe twierdzenie bywa bardzo użyteczne; 1.1.13 Twierdzenie: Niech E będzie przestrzenią ośrodkową i niech {vi }∞ i=1 będzie całkowo ograniczoną rodziną funkcji (silnie) mierzalnych vi : J → E, gdzie J jest przedziałem, tzn. istnieje c ∈ L1loc (J, R) (3 ) taka, że supi∈N kvi (s)k ¬ c(s) dla p.w. s ∈ J. Wówczas funkcja J 3 s 7→ β({vi (s) | i ∈ N}) jest lokalnie całkowalna oraz, dla dowolnych a, t ∈ J, a ¬ t Z t β a 3 vi (s) ds | i ∈ N ¬ Z t a β({vi (s) | i ∈ N}) ds. Funkcja c jest lokalnie całkowalna, tzn. dla dowolnych a, b ∈ J, c ∈ L1 ([a, b], R). 9 1.1. Miary niezwartości Dowód. Na mocy poprzedniego, dla dowolnego s ∈ J, β({vi (s)}) = lim lim sup d(vi (s), En ). n→∞ i→∞ Oczywiście d(vi (s), En ) = inf y∈En kvi (s)−yk = inf j∈N kvi (s)−yj k gdzie {yj } jest ośrodkiem w En . Zatem funkcja J 3 s 7→ d(vi (s), En ) jest mierzalna; w konsekwencji funkcja J 3 s 7→ β({vi (s)}) jest mierzalna. Funkcja ta jest także całkowalna. Istotnie: dla dowolnego n ∈ N, oraz s ∈ J, lim sup d(vi (s), En ) = inf sup d(vi (s), En ). j∈N ij i→∞ Dla każdego j ∈ N, sup d(vi (s), En ) ¬ sup kvi (s)k ¬ sup kv( s)k ¬ c(s). ij ij ij Zatem z twierdzenia Lebesgue’a, Z t Z t β({vi (s)} ds = a Z t lim lim sup d(vi (s), En ) ds = lim a n→∞ lim sup d(vi (s), En ) ds ¬ a i→∞ Z t c(s) ds. a i→∞ Z drugiej strony Z t β Z t vi (s) ds = lim lim sup d n→∞ a vi (s) ds, En . a i→∞ Zauważmy, ze jeśli w : J → E jest funkcja prostą, to dla dowolnego n ∈ N, Z t w(s) ds, En ¬ d Z t d(w(s), En ) ds a a (sprawdzić – wykorzystując to, że En jest skończenie wymiarową przestrzenią liniową). Zatem dla dowolnej funkcji lokalnie całkowalnej v : J → E, która jest granicą ciągu (wk ) funkcji prostych, na mocy lematu Fatou, mamy Z t d k→∞ a Z t = lim k→∞ a d(wk (s), En ) ds ¬ Z t v(s) ds, En = lim d Z t Z t a a wk (s) ds, En lim sup d(wk (s), En ) ds = k→∞ d(v(s), En ) ds. a Tak więc, znowu na mocy lematy Fatou, Z t β Z t vi (s) ds n→∞ a Z t lim lim sup n→∞ i→∞ d(vi (s), En ) ds ¬ a i→∞ vi (s) ds, En ¬ = lim lim sup d a Z t Z t lim lim sup d(vi (s), En ) ds = a n→∞ β({vi (s)} ds. a i→∞ 1.1.14 Uwaga: Użyliśmy powyżej następującej wersji lematu Fatou: jeśli (fk ) jest ciągiem mierzalnych funkcji fk : J → R oraz fk ¬ c, gdzie c ∈ L1loc (J, R), to dla dowolnych a, t ∈ J, a¬t Z Z t lim sup k→∞ a t fk (s) ds ¬ a lim sup fk (s) ds. k→∞ 10 1. I rozdział Przypomnieć klasyczną wersję lematu i Fatou i udowodnić powyższe stwierdzenie (wystarczy rozważyć funkcje gk := c − fk i zastosować zwykłego Fatou). 1.1.15 Przykład: Obliczymy β w przestrzeniach ciągowych E = `p , 1 ¬ p < ∞ lub c0 . Są one ośrodkowe z filtracją zadaną przez wektory „ jednostkowe”: ek = (δjk )∞ j=1 , tzn. En = span{e1 , ..., en }. Dla dowolnego x ∈ E, d(x, En ) = kx−Pn xk, gdzie Pn (x) = (x1 , x2 , .., xn , 0, 0, ...). Zatem dla B ∈ B(E) β(B) = lim sup kx − Pn xk. n→∞ x∈B Dla dowodu wystarczy zauważyć, że dla dowolnego x ∈ E i n ∈ N, d(x, En ) = kx = Pn xk (udowodnić). Warto też tutaj dostrzec co następuje. 1.1.16 Uwaga: Jeśli E jest (dowolną) przestrzenią Banacha, E jest jej skończenie wymiarową podprzestrzenią, to E jest zbiorem domkniętym (łatwe) i dla każdego x ∈ E istnieje element y ∈ E taki, że kx − yk = d(x, E). Niech x ∈ E. Oczywiście d(x, E) ¬ kxk (bo 0 ∈ E). Niech C := {y ∈ E | ky − xk ¬ kxk + 1}; wtedy C jest zbiorem niepustym 0 ∈ C, ograniczonym i domkniętym – zatem zwartym. Dla n ∈ N, rozważmy yn ∈ E tak, by kx − yn k < d(x, E) + n−1 . Wtedy yn ∈ C, bo d(x, E) + n−1 < kxk + 1 oraz d(x, En ) ¬ kx − yn k, n ∈ N. Zwartość C implikuje, że (ewentualnie przechodząc do podciągu), yn → y. Zatem d(x, En ) ¬ limn→∞ kx − yn k ¬ lim (d(x, E) + n−1 ) = d(x, E). n→∞ Czyli kx − yk = d(x, E). Czy taki y jest dokładnie wyznaczony? 1.2 Operatory Lipschitza Niech E, F będą przestrzeniami Banacha, D ⊂ F. Kładziemy ) ( Lip(D, E) := A : D → E | kAk := sup x,y∈D, x6=y kAx − Ayk <∞ kx − yk Zauważmy, że jeżeli A : D → E, to A ∈ Lip(D, E) wtedy i tylko wtedy, gdy istnieje L 0 takie, że kAx − Ayk ¬ Lkx − yk dla dowolnych x, y ∈ D (∗) i, dodatkowo kAk = inf{L 0 | zachodzi warunek (∗)}. 1.2.1 Fakt: Zbiór Lip(D, E) jest przestrzenią liniową (nad tym samym ciałem, nad którym rozważa się E i F. Ponadto k · k : Lip(D, E) → R jest półnormą, tzn, jeżeli A, B ∈ Lip(D, E) i α jest skalarem, to: (i) kA + Bk ¬ kAk + kBk; (ii) kαAk = |αkAk. Dodatkowo: (iii) kAk = 0 wtedy i tylko wtedy, gdy A jest odwzorowaniem stałym. Dowód jest natychmiastowy. Niech x0 ∈ D będzie wyróżnionym elementem. Dla A ∈ Lip(D, E) zdefiniujmy |||A||| := kA(x0 )k + kAk. 11 1.2. Operatory Lipschitza Łatwo sprawdzić, że ||| · ||| jest normą w Lip(D, E). 1.2.2 Twierdzenie: Lip(D, E) jest przestrzenią Banacha wraz z normą ||| · |||. Dowód: Jeśli A ≡ 0, |||A||| = 0. Jeśli |||A||| = 0, to kAk = 0, zatem A jest odwzorowaniem stałym i, ponadto, A(x0 ) = 0, czyli A jest odwzorowaniem stale równym 0. Pozostałe własności wynikają natychmiast z własności k · k. Załóżmy, że (An )∞ n=1 jest ciągiem Cauchy’ego w Lip(D, E), tzn. dla każdego ε > 0 istnieje N ∈ N takie, że |||An − Am ||| < ε, o ile n, m N . Wynika stąd, że (An x0 ) jest ciągiem Cauchy’ego w E oraz limm,n→∞ kAn − Am k = 0. Niech x ∈ D. Mamy: dla dowolnych m, n ∈ N, k(An − Am )x − (An x0 − Am x0 )k = k(An − Am )(x − x) k ¬ kAn − Am kkx − x − k. Stąd kAn x − Am xk ¬ kAn x0 − Am x0 k + kAn − Am kkx − x − k → 0 gdy n, m → ∞. Zatem ciąg (An x) jest Cauchy’ego dla każdego x ∈ D. Dodatkowo, jeśli B ⊂ D jest zbiorem ograniczonym (tzn. istnieje M 0 takie, że kxk ¬ M dla wszystkich x ∈ B, to dla dowolnego ε > 0 istnieje N ∈ N takie, że kAn x−Am xk < ε, o ile n, m N i x ∈ B. Innymi słowy ciąg (An x) jest jednostajnie Cauchy’ego dla x w każdym domkniętym podzbiorze dziedziny D. Zauważmy dalej, że |kAn k−kAm k| ¬ kAn −Am k → 0, gdy n, m → ∞ (dla dowolnej półnormy tak jest). Zatem również ciąg (kAn k) jest ciągiem Cauchy’ego. Istnieje więc L := limn→∞ kAn k. Połóżmy, dla x ∈ D, Ax := limn→∞ An x (ta granica istnieje, bo E jest przestrzenią Banacha, czyli zupełną). Zdefiniowaliśmy tym sposobem odwzorowanie A : D → E. W szczególności Ax0 = limn→∞ An x0 oraz kAn x0 k = lim kAn x0 k > n→∞ Poza tym, dla dowolnych x, y ∈ D, kAx − Ayk = lim kAn x − An yk ¬ lim kAn kkx − yk = Lkx − yk. n→∞ n→∞ To oznacza, że A ∈ Lip(D, E) i kAk ¬ L. Niech ε > 0. Istnieje N ∈ N takie, że kAn − Am k < ε, o ile n, m N . Weźmy n N oraz dowolne x, y ∈ D. Wówczas k(An −A)x−(An −A)yk = lim k(Am −An )x−(Am −An )yk ¬ lim kAm −An kkx−yk ¬ εkx−yk, m→∞ m→∞ czyli kA − A − nk ¬ ε, o ile n N . To oznacza, że limn→∞ kA − An k = 0; oczywiście również kAk = L. Pokazaliśmy więc, że |||An − A||| = k(An − A)x0 k + kAn − Ak → 0, gdy n → ∞. 1.2.3 Uwaga: Zbieżność ciągu (An ) w przestrzeni Lip(D, E) zachodzi wtedy i tylko wtedy, gdy An → A jednostajnie na ograniczonych podzbiorach dziedziny D. Jak zwykle L(F, E) oznacza przestrzeń ciągłych operatorów liniowych F → E. Jest to, jak wiadomo, przestrzeń Banacha wraz z normą kAk := inf{L 0 | kAxk ¬ Lkxk dla wszystkich x ∈ F}, A ∈ L(F, E) Łatwo pokazać, że kAk = sup x∈F, kxk=1 kAxk = sup x∈F, kxk=1 kAxk = kAxk . x∈F, x6=0 kxk sup 12 1. I rozdział Zauważmy, że L(F, E) ⊂ Lip(F, E); ponadto dla A ∈ L(F, E), kAkL(F,E) = kAkLip(F,E) . Ponadto, kładąc x0 = 0, mamy kAkL(F,E) = |||A|||. 1.2.4 Uwaga: Przestrzeń L(F, E) jest domkniętą podprzestrzenią liniową w przestrzeni Banacha Lip(F, E). Ćwiczenie: Symbolem BC(D, E) oznacza przestrzeń funkcji ciągłych i ograniczonych określonych na D o wartościach w E z normą kuk := supx∈D ku(x)k dla u ∈ BC(D, E). Jeżeli D jest zbiorem ograniczonym, to Lip(D, E) ⊂ BC(D, E) jest podprzestrzenią domkniętą. Zauważyć też, że odwzorowania w Lip(D, E) są jednostajnie ciągłe. 1.2.5 Twierdzenie: (Banacha-Steinhausa) Załóżmy, że zdana jest rodzina {Ai }i∈I ⊂ L(F, E) (przypomnijmy, że F jest przestrzenią Banacha) taka, że dla dowolnego x ∈ F, zbiór {Ai x}i∈I jest ograniczony. Wtedy zbiór norm {kAi k}i∈I jest ograniczony, tzn. istnieje M 0 takie, że kAi k ¬ M dla dowolnego i ∈ I. Oczywiście podany warunek jest również wystarczający. 1.2.6 Uwaga: Teza oznacza, że rodzina {Ai } jest jednakowo jednostajnie ciągła tzn. dla każdego ε > 0 istnieje δ > 0 taka, że jeśli x, y ∈ F i kx − yk < δ, to kAi x − Ai yk < ε dla wszystkich i ∈ I. Ćwiczenie: Przypomnieć twierdzenie Ascoliego-Arzeli i porównać je z twierdzeniem BanachaSteinhausa 1.2.7 Uwaga: Teza tego twierdzenie nie zachodzi dla przestrzeni Lip(F, E): znaleźć kontrprzykład. Twierdzenie Banacha-Steinhausa jest bardzo ważnym faktem analizy funkcjonalnej. Ma szereg konsekwencji. 1.2.8 Wniosek: Niech (An ) będzie ciągiem w L(F, E) takim, że dla każdego x ∈ F istnieje Ax := limn→∞ Ax (innymi słowy zakładamy, że ciąg (An ) jest zbieżny punktowo do pewnego odwzorowania A : F → E). Wtedy A ∈ L(F, E) i kAk ¬ lim inf kAn k. n→∞ Założenie w tym wniosku zachodzi, gdy ciąg norm (kAn k) jest ograniczony i ciąg (An x) jest zbieżny dla pewnego liniowo gęstego podzbioru X ⊂ F. Dowód: Łatwo widać, ze operator A jest liniowy. Dla dowolnego x ∈ F, ciąg (An x)∞ n=1 jest ograniczony; zatem – na mocy twierdzenia Banacha-Steinhausa – istnieje stała M 0 taka, że kAn k ¬ M dla każdego n ∈ N. Stąd lim inf n→∞ kAn k < ∞. Jeśli x ∈ F, to kAxk = lim kAn xk ¬ lim inf kAn kkxk n→∞ n→∞ oraz, z definicji normy w L(F, E), kAk ¬ lim inf kAn k. n→∞ 1.2.9 Wniosek: Podzbiór D przestrzeni Banacha E (zupełność nie jest potrzebna) jest ograniczony wtedy i tylko wtedy, gdy jest słabo ograniczony, tzn. dla dowolnego p ∈ E∗ ograniczony jest zbiór {hx, pi | x ∈ D} ⊂ R(4 ). 4 Przypomnijmy, że jeśli x ∈ E, p ∈ E∗ , to hx, pi := p(x). 1.2. Operatory Lipschitza 13 Dowód: Jeśli D jest ograniczony, tzn. istnieje M 0 takie, że kxk ¬ N dla wszystkich x ∈ D, to dla p ∈ E∗ i dowolnego x ∈ D, |hx, pi| ¬ M kpk. Na odwrót przypuśćmy, że zbiór D jest słabo ograniczony. Zdefiniujmy rodziną odwzorowań {ξx }x∈D wg. wzoru: dla x ∈ D, ξx (p) := hx, pi, p ∈ E∗ . Zauważmy, że dla każdego x ∈ D, ξx ∈ L(E∗ , R). Istotnie jeśli x ∈ D i p ∈ E∗ , to |ξx (p)| = |hx, pi| ¬ kxkkpk; stąd wynika, że norma kξx k = supp∈E∗ , kpk=1 |ξx (p)k = kxk.. Z założenia zbiór {ξx (p)}x∈D jest ograniczony, przestrzeń E∗ (która jest dziedziną wszystkich operatorów ξx , x ∈ D) jest przestrzenią Banacha. Zatem, dzięki twierdzeniu Banacha-Steinhausa, istnieje stała M 0 taka, że dla dowolnego x ∈ D, kxk = kξx k ¬ M. Zbadamy teraz strukturę przestrzeni Lip(E) := Lip(E, E), gdzie – jak wyżej – E jest przestrzenią Banacha. 1.2.10 Lemat: (i) Jeśli A, B ∈ Lip(E), to A ◦ B ∈ Lip(E) i kA ◦ Bk ¬ kAkkBk. (ii) Odwzorowanie identycznościowe I ∈ Lip(E) i kIk = 1. (iii) Jeżeli A ∈ Lip(E) i kAk ¬ 1, to operator I − A jest odwracalny w Lip(E) (tzn. istnieje operator B ∈ Lip(E) taki, że B(I − A) = I oraz (I − A)B = I). Ponadto k(I − A)−1 k ¬ (1 − kAk)−1 . Dowód: Najpierw pokażemy, że I − A jest operatorem injektywnym. Dla dowolnych x, y ∈ E, k(I − A)x − (I − A)yk = kx − y − (Ax − Ay)k kx − yk − kAx − Ayk (1 − kAk)kx − yk. Zatem operator (I − A)−1 jest poprawnie zdefiniowany na zbiorze R(I − A) (jest to zakres I − A, czyli R(I − A) := (I − A)(E)). Ponadto jest ona tam lipschitzowski: dla u, v ∈ R(I − A) , u = (I − A)x i v = (I − A)y dla pewnych x, y ∈ E (tzn. x = (I − A)−1 u i y = (I − A)−1 v) oraz (z powyższej nierówności) kx − yk ¬ (1 − kAk)−1 ku − vk. Obecnie zdefiniujmy indukcyjnie operatory {Bn }n=1|∞ wzorem: B0 = I, Bn := I + ABn−1 , n ∈ N. Jeżeli x ∈ E, to kBn+1 x − Bn xk ¬ kAkn kAxk. Pokażemy to stosując indukcję. Gdy n = 0, to kB1 x − B0 xk = kAxk. Przypuśćmy, że nierówność jest prawdziwa dla n ∈ N. Wtedy kBn+1 x − Bn xk = kABn x − ABn−1 xk ¬ kAkkBn x − Bn−1 xk ¬ kAkkAkn−1 kAxk = kAkn kAxk. 14 1. I rozdział Na tej podstawie można łatwo wywnioskować, że dla dowolnego x ∈ X, ciąg (Bn x) jest ciągiem Cauchy’ego; dokładniej kBm x − Bn xk ¬ m−n−1 X kAkn+k kAxk ¬ kAkn kAxk(1 − kAk)−1 . k=0 Czyli istnieje Bx := limn→∞ Bn x. Innymi słowy poprawnie zdefiniowany jest operator B : E → E. Zauważmy, że dla x ∈ E, Bx = lim (I + ABn−1 )x = x + A( lim Bn−1 x) = x + ABx. n→∞ n→∞ Zatem, dla każdego x ∈ E, (I − A)Bx = Bx − ABx = x. Oznacza to, że B jest prawostronną odwrotnością (I − A). Zatem I − A jest surjekcją (5 ) oraz B = (I − A)−1 : two wynika z jednoznaczności istnienia odwrotności (I − A)−1 . 1.2.11 Uwaga: (i) Zauważmy, że ma miejsce oszacowanie k(I − A)−1 x − Bn xk = lim kBm x − Bn xk ¬ kAkn kAxk(1 − kAk)−1 . m→∞ (ii) Przypuśćmy, że A ∈ L(E) i kAk < 1. Wtedy B0 = I, B1 = I + A, B2 = I + A(I + A) = I + A + A2 , ..., Bn = I + A + A2 + ...An . Zatem (I − A) = lim n→∞ n X k A = k=0 ∞ X An . n=0 Szereg po prawej stronie jest rozważany w przestrzeni L(E); jest on tam bezwzględnie zbieżny: P jeśli q := kAk, to 0 ¬ q < 1 oraz kAn k ¬ kAkn = q n ; wiadomo ze szereg geometryczny q n jest zbieżny, więc – z kryterium porównawczego – mamy wspomnianą zbieżność bezwzględną. 1.2.12 Wniosek: Niech A, B ∈ Lip(E) i załóżmy, że A−1 istnieje w Lip(E). Jeśli kBk < kA−1 k−1 , to operator A − B jest odwracalny w Lip(|E). Dowód: Zauważmy, że A−B = (I −BA−1 )A. Operator I −BA−1 jest odwracalny, bo kBA−1 k ¬ kBkkA−1 k < 1. Zatem operator A−B – jako złożenie operatorów odwracalnych – jest odwracalny. Co więcej k(A − B)−1 k ¬ kA−1 k(1 − kBkkA−1 k)−1 . Wszędzie powyżej zakładaliśmy (milcząco), że E, F są przestrzeniami (Banacha) nad ciałem R. Wszystkie fakty są prawdziwe, gdy są one przestrzeniami liniowymi na C. Zajmiemy się przez chwilę operatorami liniowymi ciągłymi A : `p → `r , gdzie 1 ¬ p, r < ∞. P p P∞ |y |r < ∞. Połóżmy y = Ax, y = (yn ) ∈ `r , x = (xn ) ∈ `p , tzn. ∞ n=1 |xn | , n=1 n Jest jasne, że dla dowolnego i ∈ N, funkcjonał ` 3 x 7→ fi (x) := yi ∈ K jest liniowy i ciągły; zatem istnieje nieskończona macierz [aij ]∞ i,j=1 taka, że dla każdego i 1, yi = ∞ X aij xj , j=1 5 Jeśli X, Y są zbiorami f : X → Y i g : Y → X funkcjami oraz f ◦ g jest identycznością na Y , to g jest injekcją, zaś f surjekcją : sprawdzić. 15 1.2. Operatory Lipschitza q −1 + q −1 = 1 (gdy p = 1, to q = ∞), przy czym, dla dowolnego i ∈ N, (aij )∞ j=1 ∈ ` , gdzie p bowiem z nierówności Höldera 1/q 1/p X ∞ ∞ X X ∞ |aij |q aij xj ¬ |xj |p j=1 j=1 j=1 (jest to również warunek konieczny (6 )). Drugi warunek konieczny: oczywiście, dla dowolnego r j ∈ N, A(ej ) = (aij )∞ i=1 ∈ ` . Zatem, dla każdego j ∈ N, ∞ X |aij |r < ∞. i=1 Zbadamy jakie dodatkowe warunki musi spełniać macierz [aij ], aby operator A był ciągły. P r Przede wszystkim musimy wiedzieć, że (yi ) ∈ `r , czyli, że ∞ i=1 |yi | < ∞. Mamy r r/q r/p ∞ ∞ ∞ ∞ ∞ X X X X X |aij |q |xj |p = aij xj ¬ kykr = |yi |r = |yi |r = i=1 j=1 j=1 i=1 i=1 i=1 j=1 r/q ∞ ∞ X X |aij |q kxkr ; ∞ X X i=1 j=1 przy czym oszacowanie jest poprawne, o ile dodatkowo założymy, że C r := ∞ X ∞ X r/q |aij |q <∞ (!) j=1 i=1 i wówczas kAxk = kyk ¬ Ckxk, czyli A jest operatorem ciągłym i kAk ¬ C. Okazuje się jednak, że można (w celu zapewnienie ciągłości A) założyć mniej. Dla x ∈ `p (lub y ∈ `r ) oraz n 1, niech [x]n := (x1 , x2 , ..., xn , 0, 0, ...) (lub [y]n := (y1 , ..., yn , 0, 0, ...)). Dodatkowo niech Anm : `p → `r będzie dane wzorem Anm (x) := [A([x]n )]m , x ∈ `p oraz An : `p → `r wzorem An (x) = [Ax]n , x ∈ `p . Innymi słowy, dla x = (xj ) ∈ `p , Anm (x) = n X a1j xj , j=1 oraz An (x) = ∞ X j=1 a1j xj , n X a2j xj , ... j=1 ∞ X j=1 a2j xj , ... n X amj xj , 0, 0, ... j=1 ∞ X anj xj , 0, 0, ... . j=1 Wystarczy zauważyć, że (`p )0 = `q , gdzie p−1 + q −1 = 1 (a, gdyPp = 1, to q = ∞), w tym sensie, że jeżeli ∞ f ∈ (`p )0 , to istnieje dokładnie jeden element a ∈ `q taki, że hx, f i = j=1 aj xj . 6 16 1. I rozdział Jest jasne, że bez żadnych założeń o macierzy [aij ] operator Anm , n, m ∈ N, jest ciągły, zaś An , q n 1, jest ciągły wtedy i tylko wtedy, gdy dla dowolnego 1 ¬ i ¬ n, (aij )∞ j=1 ∈ ` . Zauważmy, że dla każdego x ∈ `p , An x → Ax oraz Ann x → Ax przy n → ∞. 1.2.13 Twierdzenie: Operator A zadany poprzez macierz [aij ] jest ciągły wtedy i tylko wtedy, gdy istnieje stała C taka, że dla dowolnego n ∈ N, kAnn k ¬ C. Dowód: jest techniczny i długi – opuścimy go. Okazuje się, że warunek ∞ X ∞ X i=1 r/q |aij |q <∞ j=1 implikuje warunek z twierdzenia, co łatwo sprawdzić szacując normę kAnn k. Lecz jest on dość mocny i za chwilę do niego wrócimy. 1.3 Nieliniowa rezolwenta Zakładamy, że E jest przestrzenią Banacha (rzeczywistą lub zespoloną); ciało oznaczamy K; zatem K = R lub K = C. Operator A : D(A) → E, gdzie D(A) ⊂ E jest dziedziną A, nazywa się domkniętym, gdy jego wykres Gr (A) := {(x, Ax) | x ∈ D(A)} jest zbiorem domkniętym w E × E, tzn. jeśli ciąg elementów (xn , Axn ), gdzie xn ∈ D(A) jest zbieżny do (x, y) ∈ E × E, to (x, y) ∈ Gr (A), czyli x ∈ D(A) oraz y = Ax. Zakresem operatora A nazywamy zbiór R(A) := {Ax | x ∈ D(A)}. Operator A jest odwracalny, gdy istnieje B : R(A) → E taki, że dla dowolnego x ∈ D(A), BAx = x oraz (z tego wynika, że R(B) = D(A)) oraz dla dowolnego y ∈ R(A), ABy = y. 1.3.1 Uwaga: Zauważmy, że A jest odwracalny wtedy i tylko wtedy, gdy A jest injekcją, bo wówczas A jest bijekcją z D(A) na R(A). 1.3.2 Fakt: (i) Jeśli operator A jest ciągły, a D(A) jest zbiorem domkniętym, to A jest domknięty. (ii) Jeśli A jest domknięty i R(A) jest zbiorem względnie zwartym, to jest A jest operatorem ciągłym, a dziedzina D(A) jest zbiorem domkniętym. (iii) Jeśli A jest odwracalny i domknięty, to A−1 jest też domknięty. (iv) Jeżeli A jest domknięty, B jest ciągły o domkniętej dziedzinie D(B) (a więc B jest domknięty) i D(A) ∩ D(B) 6= ∅, to operator A + B jest domknięty. Dowód: (i) Niech (xn , Axn ) będzie ciągiem w wykresie A zbieżnym do (x, y). Wtedy xn → x, czyli x ∈ D(A) i Axn → y oraz Axn → Ax, czyli y = Ax i, oczywiście (x, y) ∈ Gr (A). (ii) Niech (xn ) ⊂ D(A), xn → x ∈ D(A). Pokażemy, że ciąg Axn jest zbieżny do Ax. Niech yn := Axn , n ∈ N. Względna zwartość R(A) implikuje, że ciąg (yn ) zawiera podciąg (ynk )∞ k=1 zbieżny do pewnego y ∈ E. Oczywiście dla dowolnego k ∈ N, (xnk , ynk 0 ∈ Gr (A) i (xnk , ynk ) → (x, y). Czyli (x, y) ∈ Gr (A) i y = Ax. To dowodzi, że także Axn → Ax (starannie sprawdzić). Jeśli xn ∈ D(A) dla n ∈ N oraz xn → x ∈ E, to (yn ), gdzie – jak wyżej – yn := Axn ma podciąg zbieżny do pewnego y ∈ E (bez zmniejszenia ogólności można zakładać, że yn → y). Zatem (xn , yn ) → (x, y). Czyli (x, y) ∈ Gr (A), a więc – w szczególności – x ∈ D(A). (ii) Wystarczy dostrzec, że Gr (A−1 ) = Gr (A)−1 (7 ). 7 Przypomnijmy, że dla relacji (czyli podzbioru) W ⊂ X × Y , gdzie X, Y są dowolnymi zbiorami, W −1 := 1.3. Nieliniowa rezolwenta 17 (iv) Pokażemy, że Gr (A + B) jest zbiorem domkniętym (w E × E). Niech xn ∈ D(A) ∩ D(B) i yn = Axn + Bxn oraz załóżmy, że xn → x, yn → y. Domkniętość D(B) implikuje, że xn → x ∈ D(B), zaś ciągłość, że Bxn → Bx. W taki razie Axn = yn − Bxn → y − Bx. Domkniętość A implikuje, że x ∈ D(A) oraz Ax = y − Bx; zatem x ∈ D(A) ∩ D(B) oraz y = Ax + Bx. 1.3.3 Uwaga i Ćwiczenie: Związki miedzy ciągłością i domkniętością operatora A najlepiej reguluje następujący fakt: Niech X, Y będą przestrzeniami metrycznymi; operator A : X → Y jest ciągły wtedy i tylko wtedy, gdy rzutowanie π : X × Y → X (na pierwszą współrzędną) obcięte do wykresu Gr (A) jest odwzorowaniem właściwym. Przemyśleć to, sprawdzić co oznacza właściwość π|Gr (A) i wywnioskować wspomniane zależności domkniętości i ciągłości. W tym kontekście warto też zapoznać się z twierdzeniem Kuratowskiego o rzucie (literatura: Engelking „Topologia Ogólna”). 1.3.4 Definicja: Niech A : D(A) → E. Definiujemy zbiór rezolwenty ρ(A) := {λ ∈ K | A − λI is injective, R(A − λI) = E oraz (A − λI)−1 ∈ Lip(E)}. Widmem albo spektrum nazywamy zbiór σ(A) := K \ ρ(A). Jeżeli ρ(A) 6= ∅, to rezolwentą nazwiemy odwzorowanie RA : ρ(A) → Lip(E) dane wzorem RA (λ) := (A − λI)−1 ∈ Lip(E), λ ∈ ρ(A). 1.3.5 Uwaga: (i) Dla dowolnego λ ∈ K, operator A − λI określony jest nadal na D(A); zatem jeżeli λ ∈ ρ(A), to R(RA (λ)) = D(A). (ii) Jest jasne, że jeśli λ ∈ ρ(A) wtedy i tylko wtedy, gdy (λI −A) jest injekcją, R(λI −A) = E i (λI − A)−1 ∈ Lip(E). Ponadto RA (λ = (λI − A)−1 ◦ (−I). (iii) Zauważmy, że jeżeli ρ(A) 6= ∅, to RA (λ) jest operatorem ciągłym o domkniętej dziedzinie, a więc jest domknięty. Zatem A − λI = RA (λ)−1 jest też domknięty oraz A = A − λI + λI, jako suma operatora domkniętego i operatora ciągłego określonego na domkniętej dziedzinie (równej E) jest operatorem domkniętym. 1.3.6 Lemat: (Tożsamość rezolwenty) Załóżmy, że A : D(A) → E i λ, µ ∈ ρ(A). Wtedy RA (λ) = RA (µ)(I + (λ − µ)RA (λ)). Dowód: Zauważmy, ze A − µI = (A − λI) + (λ − µ)I = (I − (λ − µ)RA (λ))(A − λI). Zatem składając po obu (prawych) stronach z RA (λ) otrzymamy (A − µI)RA (λ) = I + (λ − µ)RA (λ), zaś składając po obu (lewych) stronach z RA (µ) otrzymamy RA (λ) = RA (µ)(I + (λ − µ)RA (λ)). {(y, x) ∈ Y × X | (x, y) ∈ W } jest relacją odwrotną. 18 1. I rozdział 1.3.7 Twierdzenie: Niech A : D(A) → E i λ0 ∈ ρ(A). Wtedy ρ(A) ⊃ {λ ∈ K | |λ − λ0 | < kRA (λ0 )k−1 }. W szczególności zbiór rezolwenty ρ(A) jest otwarty (w K). Załóżmy, że |λ − λ0 | < kRA (λ0 )k. Wtedy RA (λ) = RA (λ0 )(I − (λ − λ0 )RA (λ0 ))−1 oraz dla dowolnego x ∈ E kRA (λ)x − RA (λ0 )xk ¬ |λ − λ0 |kRA (λ0 )xk(1 − (λ − λ0 )kRA (λ0 )k)−1 . (∗∗) W szczególności funkcja ρ(A) × E 3 (λ, x) 7→ RA (λ)x jest ciągła. Dowód: Przypuśćmy, że |λ − λ0 | < kRA (λ0 )k−1 . Wtedy k(λ − λ0 )RA (λ0 )k < 1. Stąd operator I − (λ − λ0 )RA (λ) jest odwracalny i k(I − (λ − λ0 )RA (λ0 ))−1 k ¬ (1 − |λ − λ0 |kRA (λ0 )k)−1 . (∗) Rozumując jak poprzednio A − λI = (I − (λ − λ0 )RA (λ0 ))(A − λ0 I). Ponieważ oba operatory po prawej stronie są odwracalne (w Lip(E)), to i operator po lewej stronie jest odwracalny w Lip(E), tzn. λ ∈ ρ(A) i RA (λ) = RA (λ0 )(I − (λ − λ0 )RA (λ0 ))−1 . Dalej, założywszy, że |λ − λ0 | < kRA (λ0 )k−1 , weźmy x ∈ E kRA (λ)x − RA (λ0 )xk = kRA (λ0 )(I − (λ − λ0 )RA (λ0 ))−1 x − RA (λ0 )xk ¬ kRA (λ0 )kk(I − (λ − λ0 )RA (λ0 ))−1 x − xk. Z oszacowania z Uwagi 1.2.11 (i) (biorąc n = 0, tzn. B0 = I) k(I − (λ − λ0 )RA (λ0 ))−1 x − xk ¬ kRA (λ0 )xk(1 − |λ − λ0 |kRA (λ0 k)−1 . To kończy dowód nierówności (∗∗). Niech teraz x, y ∈ E; wówczas kRA (λ)x − RA (λ0 )yk ¬ kRA (λ) − RA (λ0 )xk + kRA (λ0 )x − RA (λ0 )yk |λ − λ0 |kRA (λ0 )xk(1 − |λ − λ0 |kRA (λ0 )k)−1 + kRA (λ0 )kkx − yk skąd wynika natychmiast wzmiankowana ciągłość. Zajmiemy się rezolwentą operatorów w Lip(D, E). 1.3.8 Twierdzenie: Niech A ∈ Lip(E) (czyli D(A) = E). Wtedy ρ(A) ⊃ {λ ∈ K | |λ| > kAk} oraz kRA (λ)k ¬ (|λ| − kAk)−1 , λ ∈ K i |λ| > kAk. Dowód: Niech λ ∈ K i |λ| > kAk. Wówczas A − λI = λ(λ−1 A − I). 1.3. Nieliniowa rezolwenta 19 Zauważmy, że kλ−1 Ak = |λ|−1 kAk < 1; zatem λ ∈ ρ(A) i RA (λ) = (A − λI)−1 = (λ(λ−1 − I)−1 = (λ−1 A − I)−1 (λ−1 I) oraz kRA (λ)k = k(λ−1 A − I)−1 (λ−1 I)k ¬ (1 − |λ|−1 kAk)−1 |λ|−1 = (|λ| − kAk)−1 . 1.3.9 Wniosek: Jeżeli A ∈ Lip(E), to σ(A) jest zbiorem domkniętym i ograniczonym, a więc zwartym. Dokładniej σ(A) ⊂ {λ ∈ K | |λ| ¬ kAk}. Nawet więcej: dla dowolnego zbioru zwartego K ⊂ K można znaleźć przestrzeń Banacha E i A ∈ L(E) taki, by σ(A) = K. Istotnie: niech E = `p (K) i zdefiniujmy A : E → E wzorem A(x1 , x2 , ...) = (a1 x1 , a2 , x2 , ...), x = (x1 , x2 , ...) ∈ E, gdzie {ai }∞ i=1 jest zbiorem gęstym w K (przypomnijmy, że przestrzenie metryczne zwarte są ośrodkowe). Jest jasne, że A − ai I nie jest injekcją, więc ai ∈ σ(A) i, stąd, K ⊂ σ(A). Z drugiej strony jeśli λ 6∈ K, to (A − λI)−1 : E → E jest określony wzorem (A − λI)−1 (x1 , x2 , ...) := ((λ − a1 )−1 x1 , (λ − a2 )−1 x2 , ....), (x1 , x2 , ...) ∈ E. Zatem λ ∈ ρ(A) i, wobec tego σ(A) = K. 1.3.10 Twierdzenie: Niech A ∈ Lip(E) i niech σ(A) ⊂ U , gdzie U ⊂ K jest zbiorem otwartym. Istnieje wówczas ε > 0 takie, że jeśli B ∈ Lip(E) i kA − Bk < ε, to σ(B) ⊂ U Uwaga: Ta własność oznacza, że przekształcenie wielowartościowe (o zwartych wartościach) Lip(E) 3 A 7→ σ(A) ⊂ K jest górnie półciągłe. Dowód: Niech D := K \ U . Wtedy zbiór D jest domknięty i jeżeli λ ∈ D, to λ ∈ ρ(A), czyli rezolwenta RA (λ) ∈ Lip(E). Z wniosku 1.2.12 wynika, że jeśli operator C ∈ Lip(E) spełnia kCk < kRA (λ)k−1 , to również A − λI − C jest odwracalny. W szczególności, jeśli B ∈ Lip(E) oraz kA − Bk < kRA (λ)k−1 , to A − λ − (A − B) = B − λI jest odwracalny. Zauważmy, że kRA (λ)k ¬ (|λ − kAk)−1 → 0, gdy |λ| → ∞. Stąd liczba ε = inf kRA (λ)k−1 > 0. λ∈D Widzimy, że jeśli B ∈ Lip(E) oraz kA − Bk < ε, to dla dowolnego λ ∈ D, λ ∈ ρ(B), czyli σ(B) ⊂ U . Niestety widmo nie zależy od operatora w sposób dolnie półciągły. 1.3.11 Fakt: Niech p ∈ C[x] (tzn. p jest wielomianem nad C), p(x) = an xn + an−1 xn−1 + ... + a1 x + a0 , gdzie ab 6= 0, i załóżmy, że E jest zespoloną przestrzenią Banacha. Jeśli A ∈ Lip(E), to p(A) := an An + an−1 An−1 + ... + a1 A + a0 I ∈ Lip(E) praz σ(p(A)) = p(σ(A)), gdzie p(σ(A)) = {p(λ) | λ ∈ σ(A)}. Dowód: Jest jasne, że p(A) ∈ Lip(E). Ustalmy λ ∈ C i niech λ1 , ..., λn ∈ C będą pierwiastkami wielomianu p(x) − λ. Wtedy p(x) − λ = an (x − λ1 )(x − λ2 ) · ... · (x − λn ) oraz p(A) − λI = an (A − λ1 I)(A − λ2 I) ◦ ... ◦ (A − λn I). Odwzorowanie p(A) − λI odwracalne wtedy i tylko wtedy, gdy odwracalny jest każdy czynnik postaci A − λi I, i = 1, ..., n. tzn. wtedy i tylko wtedy, gdy λi ∈ ρ(A). Zatem λ ∈ σ(p(A)) wtedy i tylko wtedy, gdy wielomian istnieje i = 1, ..., n takie, że λi ∈ σ(A); zatem λ = p(λj ) ∈ p(σ(A)). . p(A) − λI jest odwracalny. Jak widać ma to miejsce wtedy i tylko wtedy, gdy 20 1. I rozdział 1.4 Liniowa rezolwenta i widmo Zajmiemy się teraz sytuacją specjalną, tzn. będziemy zajmować się operatorami liniowymi A : D(A) → E. W takiej sytuacji jeśli λ ∈ ρ(A), to RA (λ) ∈ L(E), bo RA (λ) ∈ Lip(E). Zatem RA : ρ(A) → L(E). Mamy następujące wzmocnienie tożsamości rezolwenty. 1.4.1 Twierdzenie: Niech A : D(A) → E będzie operatorem liniowym i λ, µ ∈ ρ(A). Wtedy: (i) RA (λ) = RA (µ)(I + (λ − µ)RA (λ)); (ii) RA (λ) − R(µ) = (λ − µ)RA (λ)RA (µ); (iii) RA (λ)RA (µ) = RA (µ)RA (λ); (iv) ARA (λ) = RA (λ)A na D(A). Dowód: (i) jest to zwykła tożsamość rezolwenty. (ii) Z wykorzystaniem liniowości RA (λ) = RA (µ)(I + (λ − µ)RA (λ)) = RA (µ) − (λ − µ)RA (λ)RA (mu). (iii) Gdy λ = µ to oczywiste. Zatem niech λ 6= µ). Wtedy z (ii) (λ − µ)RA (λ)RA (µ) = RA (λ) − RA (µ) = −(RA (µ) − RA (λ)) = −(µ − λ)RA (µ)RA (λ) = (λ − µ)RA (µ)RA (λ). (iv) Niech x ∈ D(A) i y := RA (λ)x, tzn. Ay − λy = x i ARA (λ)x = x + λRA (λ)x. Z drugiej strony RA (λ)Ax = RA (λ)Ax − λRA (λ)x + λRA (λx) = RA (λ(A − λI)x + λRA (λ)x = x + λRA (λ)x. 1.4.2 Wniosek: Odwzorowanie RA : ρ(A) → L(E) jest ciągłe. Dowód: Ustalmy µ ∈ ρ(A) i niech λ ∈ K oraz |λ − µ| < kRA (µ)k−1 (8 ). Wtedy, operator (I − (λ − µ)RA (µ))−1 istnieje w L(E) oraz k(I − (λ − µ)RA (µ))−1 k ¬ (1 − |λ − µ|kRA (µ)k)−1 , a z tożsamości rezolwenty RA (µ) = RA (λ)(I + (µ − λ)RA (µ)). Czyli RA (λ) = RA (µ)(I − (λ − µ)RA (µ))−1 oraz kRA (λ)k ¬ kRA (µ)k(1 − |λ − µ|kRA (µ)k)−1 . W takim razie kRA (λ)x−RA (µ)xk = |λ−µ|kRA (λ)kkRA (µ)kkxk ¬ |λ−µ|kRA (µ)k2 (1−|λ−µ|kRA (µ)k)−1 kxk. Stąd kRA (λ) − RA (µ)k ¬ |λ − µ|kRA (µ)k2 (1 − |λ − µ|kRA (µ)k)−1 → 0 przy λ → µ. 8 Oczywiście kRA (µ)k > 0. 21 1.4. Liniowa rezolwenta i widmo 1.4.3 Uwaga: Wcześniej (dla operatorów A ∈ Lip(E)) nie potrafiliśmy pokazać; chyba tak jest jeśli dla dowolnego λ ∈ ρ(A), RA (λ)0 = 0. Można pokazać więcej. 1.4.4 Twierdzenie: Niech A : D(A) → E będzie operatorem liniowym i µ ∈ ρ(A). Weźmy δ > 0 takie, że δkRA (µ)k < 1. Jeżeli λ ∈ K oraz |λ − µ| ¬ δ, to λ ∈ ρ(A) oraz RA (λ) = ∞ X (λ − µ)k RA (µ)k+1 k=0 przy czym zbieżność tego szeregu jest bezwzględna i jednostajna w L(E). Stąd również wynika, że funkcja ρ(A) 3 λ 7→ RA (λ) jest ciągła, a nawet klasy C ∞ . Dowód: Ponieważ k(λ − µ)RA (µ)k = |λ − µ|kRA (µ)k ¬ δkRA (µ)k < 1, więc istnieje (I − (λ − µ)RA (µ))−1 oraz (I − (λ − µ)RA (µ))−1 = ∞ X (λ − µ)k RA (µ)k ; k=0 ten szereg jest zbieżny bezwzględnie Z tożsamości rezolwenty RA (µ) = RA (λ)(I + (µ − λ)RA (µ)) = RA (λ)(I − (λ − µ)RA (µ)), czyli RA (λ) = RA (µ)(I − (λ − µ)RA (µ))−1 = RA (µ) ∞ X (λ − µ)k RA (µ)k = k=0 ∞ X (λ − µ)RA (µ)k+1 . k=0 Ostatni szereg też jest zbieżny bezwzględnie, gdyż dla dowolnego k 0, k(λ − µ)k RA (µ)k+1 ¬ |λ − µ|k kRA (µ)kk+1 . Szereg ∞ − µ|k kR (µ)kk+1 jest szeregiem geometrycznym o ilorazie |λ − µ|kRA (µ)k < 1. k=0 |λ P∞ k A Dalej, szereg k=0 δ kRA (µ)kk+1 jest majorantą (w sensie twierdzenia Weierstrassa) dla szeregu P funkcyjnego ∞ k=0 (· − µ)RA (µ) (zmienną jestPλ w kole {λ ∈ K | |λ − µ| ¬ δ}). Zatem RA (·) k+1 ma promień zbieżności δ. jest funkcją ciągłą. Ponadto szereg potęgowy ∞ k=0 (· − µ)RA (µ) Wiadomo, że suma takiego szeregu jest funkcją (zmiennej · = λ) klasy C ∞ (jest to nawet funkcja analityczna zmiennnej λ ∈ K). P Dzięki temu można udowodnić ważne: 1.4.5 Twierdzenie: Jeśli A ∈ L(E) i K = C, to widmo σ(A) 6= ∅. W dowodzie wykorzystujemy twierdzenie Liouville’a (z analizy zespolonej), które głosi, że ograniczona funkcja całkowita jest stała (9 ). Dowód: Przypuśćmy niewprost, że ρ(A) = C. Niech f ∈ L(E)∗ (tzn f jest elementem przestrzeni (topologicznie) sprzężonej do L(E)) i rozważmy funkcję C = ρ(A) 3 λ 7→ Ff (λ) := f (RA (λ)). Niech µ ∈ C i weźmy δ > 0 takie, iż δkRA (µ)k < 1. Wtedy, z poprzedniego twierdzenie, dla λ ∈ C, ! Ff (λ) = f ∞ X (λ − µ)k RA (µ)k+1 k=0 9 = ∞ X ak (λ − µ)k , k=0 Przypomnijmy, że całkowitą nazywamy funkcję f : C → C, która jest holomorficzna na całej płaszczyźnie C. 22 1. I rozdział gdzie ak := f (RA (µ)k+1 ), k 0. Stąd wynika, że Ff – mając w otoczeniu każdego punkcie µ ∈ C rozwinięcie w szereg potęgowy – jest funkcją całkowitą. Jeżeli |λ| > kAk, to kRA (λ)k ¬ (|λ| − kAk)−1 → 0, gdy |λ| → ∞. Zatem funkcja kRA (·)k jest ograniczona, tzn. istnieje M 0 takie, że dla każdego λ ∈ C, kRA (λ)k ¬ M . Wobec tego |Ff (λ)| = |f (RA (λ))| ¬ kf kkRA (λ)k ¬ M kf k oraz |Ff (λ)| → 0 przy |λ| → 0. Pokazaliśmy więc, że funkcja Ff jest ograniczona i całkowita. Z twierdzenie Liouville’a jest ona stała, lecz ponieważ znika w nieskończoności. musi być równa 0. Ponieważ jest to prawdą dla dowolnego f ∈ L(E)∗ , to dla każdego λ ∈ C, RA (λ) = 0: sprzeczność. 1.4.6 Definicja: Promieniem spektralnym operatora liniowego A : D(A) → E (gdzie jak poprzednio E jest przestrzenią Banacha nad ciałem K) nazywamy liczbę r(A) := sup |λ|. λ∈σ(A) 1.4.7 Uwaga: Jeśli σ(A) = ∅, to r(A) = −∞. 1.4.8 Twierdzenie: Niech A ∈ L(E). Wtedy r(A) ¬ lim kAn k1/n = inf{kAm k1/m | m ∈ N} ¬ kAk. n→∞ Dowód: Ostatnia nierówność jest oczywista: dl każdego m ∈ N, kAm k1/m ¬ (kAkm )1/m = kAk. Niech r := inf m∈N kAm k1/m . Przede wszystkim pokazujemy, że lim sup kAn k1/n ¬ r; n→∞ z tego wyniknie, że istnieje limm→∞ kAm k1/m = r. Weźmy dowolne ε > 0 oraz m ∈ N tak, by kAm k1/m < r + ε. Niech n m i qn := n mod (m), tzn. n = pn m + qn , gdzie pn 1 i 0 ¬ qn ¬ m − 1. Wtedy kAn k1/n ¬ kAm kpn /n kAkqn /n < (r + ε)mp/n kAkq/n . Zauważmy, że pn m/n = (n − qn )/n = 1 + qn /n → 1 oraz qn /n → 0, gdy n → ∞. Zatem lim sup kAn kn ¬ r + ε, n→∞ co – z dowolności ε – oznacza, że lim supn→∞ kAn k1/n ¬ r. −k k−1 . Dla dowolnego Niech teraz |λ| > r; wtedy q := r|λ|−1 < 1 i rozważmy szereg ∞ k=1 λ A k 1, kλ−k Ak−1 k = |λ|−1 |λ|−k+1 kAk−1 k = |λ−k |q k−1 . P 1.4. Liniowa rezolwenta i widmo 23 Szereg geometryczny k=1 |λ|−1 q k jest zbieżny; zatem - z kryterium porównawczego – szereg −k k−1 jest bezwzględnie zbieżny. Niech k=0 λ A P P∞ X T := − λ−k Ak−1 ; k=1 Oczywiście T ∈ L(E). Zauważmy, że T (A − λI) = − ∞ X λ−k Ak + k=1 ∞ X λ−k Ak = I. k=0 Analogicznie sprawdzamy, że (A − λI)T = I. Zatem (A − λI)−1 istnieje (w L(E)). Stąd λ ∈ ρ(A). Jeśli więc λ ∈ σ(A), to |λ| ¬ r, co dowodzi, że r(A) ¬ r. 1.4.9 Uwaga: Warto zapamiętać, że dla |λ| > r := limn→∞ kAn k1/n , λ ∈ ρ(A) i RA (λ) = − ∞ X λ−k Ak−1 . k=1 1.4.10 Twierdzenie: Jeżeli E jest przestrzenią zespoloną, to r(A) = lim kAn k1/n . n→∞ Dowód: Już wiemy, że r(A) ¬ r. Należy pokazać, że r ¬ r(A). Już wiemy, że dla dowolnego f ∈ L(E)∗ , funkcja Ff = f (RA (·)) jest holomorficzna w obszarze |λ| > r(A). Wiadomo – wobec tego – że ma ona w tym obszarze jednoznaczne rozwinięcie w szereg P k Laurenta postaci ∞ k=−∞ ak λ . Ponieważ dla |λ| > r, ma ona rozwinięcie postaci Ff (λ) = − ∞ X f (Ak−1 )λ−k , k=1 to rozwinięcie jest również prawdziwe w obszarze |λ| > r(A). W szczególności weźmy ε > 0 P −k k−1 ) jest zbieżny, czyli zbieżny też jest szereg i λ := r(A) + ε; szereg ∞ k=1 (r(A) + ε) f (A P −k k −k k−1 ) = 0. k=1 (r(A) + ε) A i z warunku koniecznego zbieżności, limk→∞ (r(A) + ε) f (A W szczególności ciąg (f ((r(A) + ε)−k Ak−1 ) jest ograniczony, dla dowolnego f ∈ L(E); innymi słowy ciąg ((r(A) + ε)−k Ak )∞ k=1 jest słabo ograniczony. Z twierdzenie Banacha-Steinhausa jest on ograniczony, tzn. istnieje M 0 takie, że (r(A) + ε)−k kAk k ¬ M . W takim razie kAk k ¬ (r(A) + ε)M oraz kAk k1/k ¬ (r(A) + ε)M 1/k . Po przejściu do granicy z k → ∞ otrzymamy r ¬ r(A) + ε, co – z dowolności ε > 0 – oznacza, że r ¬ r(A). 1.4.11 Wniosek: Jeżeli E jest przestrzenią Banacha nad C, to RA (λ) = − ∞ X λ−n An−1 , |λ| > r(A). n=1 1.4.12 Wniosek: Niech E będzie przestrzenią Banacha nad C i A ∈ L(E). Dla dowolnego ε > 0 znajdzie się normę k · kε w E, równoważną z wyjściową normą i taką, że kAkε ¬ r(A) + ε. 24 1. I rozdział Dowód: Ustalmy ε >) i dla x ∈ E połóżmy kxkε := kxk + ∞ X (r(A) + ε)−k kAk xk. k=1 Ten szereg jest zbieżny (wykorzystując kryterium porównawcze); co więcej łatwo sprawdzić, że jest to norma. Dalej zauważmy, że ! kxk ¬ kxkε ¬ kxk( 1 + X −k (r(A) + ε) k kAk . k=1 Zatem normy k · k i k · kε są równoważne. Dalej kAkε := sup kAxkε ¬ (r(A) + ε). kxkε ¬1 Istotnie, dla dowolnego x ∈ E. kAxkε = ∞ X (r(A) + ε)−k kAk+1 xk = (r(A) + ε) k=0 ∞ X (r(A) + ε)−k kAk xk ¬ (r(A) + ε)kxkε . k=1 Teraz zajmiemy się zbiorem K \ ρ(A), gdzie A : D(A) → E jest operatorem liniowym; przypomnijmy, że E jest przestrzenią Banacha nad ciałem K (K = R lub C). Zakładamy, że operator jest domknięty (jeżeli nie jest to ρ(A) = ∅). Zauważmy, że jeśli D(A) = E, to z twierdzenia Banacha o domkniętym wykresie wynika, że T jest operatorem ograniczonym, tj. ciągłym. Na odwrót jeśli operator T jest ciągły i jego dziedzina D(A) jest domknięta (na niej rozważamy normę „odziedziczoną” z E; jest ona wtedy przestrzenią Banacha), to wykres jest domknięty. Zauważmy, że gdy λ ∈ ρ(A), to już tylko bijektywność A−λI gwarantuje ciągłość RA (λ) (to ponownie wynika z twierdzenia o domkniętym wykresie). Załóżmy, że λ ∈ σ(T ). Wówczas możliwe są przypadki: 1. Operator A − λI nie jest injekcją, tzn. jądro N (T − λI) 6= {0}. Wówczas mówi się, że λ jest wartością własną operatora T (piszemy wtedy λ ∈ σp (T ); zbiór σp (T ) nazywa się widmem punktowym), zaś dowolny wektor x 6= 0 taki, że T x = λx jest wektorem własnym. Wtedy też przestrzeń (domkniętą) Vλ := N (T − λI) nazywa się przestrzenią własną odpowiadającą wartości własnej λ. Liczbę ng (λ) := dim Vλ nazywa się goemetryczną krotnością wartości własnej λ. 1.4.13 Uwaga: Przypuśćmy, że λ nie jest wartością własną, obraz R(A − λI) jest gęsty w E i (poprawnie określony na R(A − λI)) operator S := (A − λI)−1 jest ciągły (oczywiście ponownie na R(A − λI) mamy normę z E; wraz z nią R(A − λI) jest przestrzenią unormowaną). Wówczas S ma rozszerzenie Se na całą przestrzeń E wg. wzoru: dla y ∈ E, e = lim Syn , Sy n→∞ gdzie yn ∈ R(T − λ) oraz y = limn→∞ yn . Taki wzór poprawnie definiuje operator Se (tj. definicja nie zależy od wyboru ciągu (yn ) ⊂ E). Niech y ∈ E i yn → y, gdzie yn ∈ E, n 1. Wtedy (Syn , yn ) ∈ Gr (A − λI). Jest jasne (wykorzystując domkniętość Gr (A)), że wykres Gr (A − λ) e y) ∈ Gr (A−λI). Innymi słowy Se (określony na E i ciągły) jest zbiorem domkniętym); zatem (Sy, 1.4. Liniowa rezolwenta i widmo 25 jest odwrotnością A − λI, tzn. λ ∈ ρ(T ). Zatem, gdy λ ∈ σ(T ) nie jest wartością własną to nie może się zdarzyć, że R(A − λI) jest zbiorem gęstym i określony tam operator (T − λI)−1 jest ciągły. 2. Operator A jest injekcją lecz nie jest surjekcją (na E). Jak widzieliśmy (patrz powyższa uwaga) mamy dwie możliwości: (i) R(A − λI) jest zbiorem gęstym, lecz (A − λI)−1 nie jest ciągły. Mówimy wtedy, że λ jest elementem widma ciągłego, które oznaczamy σc (T ); (ii) obraz R(T − λI) nie jest gęsty; wtedy λ jest elementem tzw. widma residualnego σr (T ). Wobec powyższego mamy rozkład σ(T ) = σp (T ) ∪ σc (T ) ∪ σr (T ). 1.4.14 Przykład: Rozważmy operator T : `1 → `1 zadany wzorem 1 T (x1 , x2 , ...) := (x2 , x3 , ...), x = (xi )∞ i=1 ∈ ` . Wówczas operator sprzężony T ∗ : `∞ → `∞ dany jest wzorem ∞ T ∗ (y1 , y2 , ...) = (0, y1 , y2 , ...), y = (yi )∞ i=1 ∈ ` . Można pokazać, że jeśli |λ| > 1, to λ ∈ ρ(T ) i λ ∈ ρ(T ∗ ). zatem jeśli λ ∈ σ(T ), to |λ| ¬ 1. Okazuje się, że w istocie σ(T ) = σ(T ∗ ) = {λ ∈ K | |λ| ¬ 1}. Dokładniej σp (T ) = {λ ∈ K | |λ| < 1}, σc (T ) = {λ ∈ K | |λ| = 1} i σr (T ) = ∅. Natomiast σp (T ∗ ) = ∅, σc (T ∗ ) = ∅ i σr (T ∗ ) = {λ ∈ K mod |λ ¬ 1}. 1.4.15 Fakt: Jeśli układ {λs }s∈S ⊂ σp (A) składa się z różnych wartości własnych, {xs }s∈S jest rodziną odpowiadających im wektorów własnych (tzn. A(xs ) = λs xs , s ∈ S), to układ {xs }s∈S jest liniowo niezależny. Dowód: Niech {xs }s∈H , gdzie H ⊂ S, będzie maksymalnym podukładem liniowo niezależnym (tj. {xs }sin H tworzy bazę podprzestrzeni span{xs | s ∈ S}) i załóżmy, że H ( S. Niech t ∈ S \ H. Wtedy istnieje jednoznacznie wyznaczony układ {αs }s∈H skalarów taki, że xt = X αs xs , s∈H w αs = 0 dla prawie wszystkich s ∈ H. Zatem ! λt X αs xs = λt xt = A(xt ) = s∈H X λs αs xs . s∈H Jeśli λt = 0, to dla każdego s ∈ H, λs 6= 0. Zatem 0 = s∈H λs αs xs , przy czym w tej kombinacji liniowej nie wszystkie współczynniki są równe zero. Przeczy to liniowej niezależności układy {xs }s∈H . Jeśli λt 6= 0, to X λs αs xs . xt = λ s∈S t P Z jednoznaczności reprezentacji xt wynika, że przynajmniej dla jednego wskaźnika s ∈ H, λt = λs : sprzeczność. 26 1. I rozdział 1.5 Operatory γ-Lipschitza Niech F, E będą przestrzeniami Banacha nad ciałem K. Niech γ będzie miarą niezwartości Kuratowskiego (czyli γ = α) lub Hausdorffa (czyli γ = β). Niech D ⊂ F. Symbolem Lipγ (D, E) oznaczamy rodzinę odwzorowań A : D → E które są: (a) ciągłe, (b)przeprowadzają ograniczone podzbiory D na zbiory ograniczone oraz (c) istnieje L 0 takie, że dla dowolnego ograniczonego B ⊂ D, γ(A(B)) ¬ Lγ(B). Jeśli A ∈ Lipγ (D, E), to kAkγ := inf{L 0 | zachodzi własność (c)}. Liczbę tę nazywa się czasem miarą niezwartości operatora A. Zauważmy, że γ(A(B)) kAkγ := sup | B ⊂ D jest ograniczony i γ(B) > 0 . γ(B) Oczywiście, gdy A ∈ Lipγ (D, E) i zbiór B ⊂ D jest ograniczony, to γ(A(B)) ¬ kAkγ γ(B). 1.5.1 Własności: Rodzina Lipγ (D, E) jest przestrzenią liniową nad K. Jeżeli A, B ∈ Lipγ (D, E) i λ ∈ K, to: (i) kλAkγ = |λ|kAkγ ; (ii) kA + Bkγ ¬ kAkγ + kBkγ ; (iii) kAkγ = 0 wtedy i tylko wtedy, gdy A jest operatorem pełnociągłym, tzn. przekształca ograniczone podzbiory zbioru D w zbiory zwarte. W szczególności k·kγ jest półnormą w przestrzeni Lipγ (D, E). Ponadto jeżeli A ∈ Lipγ (D, E), B ∈ Lipγ (G, H), gdzie H jest przestrzenią Banacha, G ⊂ E i R(A) ⊂ G, to B ◦ A ∈ Lipγ (D, H) oraz kBAkγ ¬ kBkγ kAkγ . Dowód: Niech C ⊂ D będzie zbiorem ograniczonym. Wtedy (λA)(C) = λA(C) oraz γ((λA)(C)) = |λ|γ(A(C)) ¬ |λ|kAkγ γ(C). Czyli λA ∈ Lipγ (D, E) oraz kλAkγ ¬ |λ|kAkγ . Gdy λ = 0 to równość jest oczywista. Niech więc λ 6= 0. Wtedy analogicznie kAkγ ¬ |λ|−1 kλAkγ . A więc |λ|kAkγ ¬ kλAkγ . Teraz γ((A + B)(C)) ¬ γ(A(C) + B(C)) (bo (A + B)(C) ⊂ A(C) + B(C) i miara γ jest monotoniczna) oraz γ(A(C) + B(C)) ¬ γ(A(C)) + γ(B(C)) ¬ (kAkγ + kBkγ )γ(B). Stąd wnioskujemy, że A + B ∈ Lipγ (D, E) oraz kA + Bkγ ¬ kAkγ + kBkγ . Jeśli kAkγ = 0, to dla dowolnego ograniczonego zbioru B ⊂ D, γ(A(B)) = 0, tzn. zbiór A(B) jest względnie zwarty. Na odwrót, jeżeli A jest operatorem pełnociągłym, to liczba L = 0 zadośćczyni warunkowi (c) powyższej definicji. Ostatnia własność jest oczywista i pozostawiam ją jako ćwiczenie. 1.5.2 Przykład: Niech A ∈ L(F, E). Wtedy kAkβ = β(A(S(0, 1))) = β(A(D(0, 1))), 27 1.5. Operatory γ-Lipschitza gdzie kula i sfera są w przestrzeni F. Druga z równości jest oczywista (kula domknięta jest uwypukleniem sfery). Niech D := D(0, 1). Oczywiście β(A(D)) ¬ kAkβ β(D) = kAkβ . Udowodnimy nierówność przeciwną. Niech B ∈ B(F), r = β(B) i niech S = {y1 , ..., ym } będzie skończoną (r + ε)-siecią dla B (ε > 0 jest dowolne). Wtedy dla każdego x ∈ A(B), tzn. x = Ay, gdzie x ∈ B mamy [ A(B) ⊂ A(D(yi , r + ε)). Oczywiście β(A(B)) ¬ max β(A(D(yi , r + ε))) = β(A(D(0, r)) = β((r + ε)A(D)) = (r + ε)β(A(D)). i=1,...,m Czyli β(A(B)) ¬ β(A(D))(β(B) + ε). Z dowolności ε wynika, że β(A(B)) ¬ β(A(D))β(B), czyli kAkβ ¬ β(A(D)). 1.5.3 Przykład: Policzymy teraz kAkβ dla operatora liniowego i ciągłego A : `p → `p , 1 < p < ∞, wyznaczonego przez (nieskończoną) macierz [aij ]. Już wiemy, że kAkβ = β(A(S)), gdzie S := {x ∈ `p | kxk = 1}. Z drugiej strony β(A(S)) = lim sup d(y, En ), n→∞ y∈A(S) gdzie En = span{e1 , ..., en } oraz ek = (δjk )∞ j=1 . Innymi słowy (używając wcześniej wprowadzonej notacji) ∞ X β(A(S)) = lim sup kAx − [Ax]n k = lim kA − An k = lim sup n→∞ x∈S n→∞ n→∞ x∈S ∞ X i=n+1 p 1/p |aij xj | . j=1 Z tego wynika wniosek: operator A jest pełnociągły wtedy i tylko wtedy, gdy kA − An k → 0 przy n → ∞. Z nierówności Höldera można szacować: dla dowolnego i n + 1 ∞ X p p/q |aij xj | ¬ j=1 X |aij |q ∞ X j=1 p/q |xj |p = j=1 X |aij |q kxkp . j=1 W takim razie, jeżeli dla pewnego N ∈ N szereg ∞ X ∞ X i=N +1 p/q |aij |q jest zbieżny, to dla wszystkich n N zbieżny jest szereg β(A(S)) ¬ lim sup n→∞ x∈S ∞ X i=n+1 ∞ X j=1 (∗) j=1 P∞ i=n+1 p/q ∞ q . j=1 |aij | P Stąd p/q 1/p p/q 1/p ∞ ∞ X X |aij |q kxk = lim |aij |q . n→∞ i=n+1 j=1 28 1. I rozdział Zauważmy jednak, że zbieżność szeregu (∗) jest równoważna zbieżności szeregu ∞ X ∞ X i=1 p/q |aij |q . (∗∗) j=1 To zaś implikuje, że lim n→∞ ∞ X i=n+1 ∞ X p/q 1/p |aij |q = 0. j=1 A więc założenie o zbieżności szeregu (∗) (lub, równoważnie, szeregu (∗∗)) implikuje, że kAkβ = 0, czyli, że A jest pełnociągły. Porównać to z założeniem (!) pod koniec rozdziału o operatorach Lipschitza. Pokażemy nierówność odwrotną. Zauważmy, że dla dowolnego ej , A(ej ) = (aij )∞ i=1 ∈ A(S), bi kej k = 1. W taki razie β(A(S)) β({A(ej )}∞ j=1 ). 1.5.4 Twierdzenie: Rozważamy ciąg (An )∞ n=1 odwzorowań w Lipγ (D, E). Jeżeli (An ) jest jednostajnie Cauchy’ego na ograniczonych zbiorach i supn kAn kγ < ∞, to An dąży jednostajnie na zbiorach ograniczonych do odwzorowania A ∈ Lipγ (D, E) oraz kAkγ ¬ lim inf n→∞ kAn k. Dowód: Niech B ⊂ D. Z założenia An ⇒ A : B → E (pamiętajmy, że ciąg jest jednostajnie zbieżny wtedy i tylko wtedy, gdy jednostajnie spełnia warunek Cauchy’ego). Zatem mamy zdefiniowaną funkcję A : D → E, Ax := limn→∞ An x, x ∈ D; jest ona (jako granica jednostajnie na zbiorach ograniczonych zbieżnego ciągu funkcji ciągłych) ciągła. Niech B ⊂ D będzie zbiorem ograniczonym. Dla ε = 1 istnieje N ∈ N takie, że kAn x − Axk < 1 o ile x ∈ B oraz n N . Zbiór AN (B) jest ograniczony, tzn. istnieje M 0 takie, że kAN xk ¬ M dla x ∈ B. Zatem, dla x ∈ B, kAxkleq1 + kAN xk ¬ M + 1. Zatem A przeprowadza zbiory ograniczone na zbiory zwarte. Niech L := lim inf n→∞ kAn kγ i ponownie niech zbiór B ⊂ D będzie ograniczony. Mamy udowodnić, że γ(A(B)) ¬ Lγ(B). Weźmy k > L i dowolne δ > 0. Ponieważ L = lim inf kAn kγ = sup inf kAm kγ , n→∞ n∈N mn to dla dowolnego n ∈ N istnieje mn n takie, że kAm kγ < k. Z drugiej strony istnieje n0 ∈ N takie, że kAm x − Ax| < δ dla x ∈ B, o ile m n0 . Zatem, kładąc m := mn0 otrzymamy kAm kγ < k oraz kAm x − Axk < δ dla x ∈ B. Zatem γ(Am (B)) ¬ kAm kγ γ(B) < kγ(B). Teraz przeprowadzimy rozumowanie dla γ = β (miara niezwartości Hausdorffa). Istnieje skończona kγ(B)-sieć S = {s1 , ..., sn } dla zbioru Am (B). Innymi słowy, jeżeli x ∈ B, to istnieje sj , j = 1, ..., n, takie, że kAm (x) − sj k < kγ(B). Jeśli x ∈ B, to kAx − sj k ¬ kAx − Am xk + kAm x − sj k < kγ(B) + δ. Czyli S jest (kγ(B) + δ)-siecią dla A(B). Stąd γ(A(B)) ¬ kγ(B) + δ. Z dowolności δ, γ(A(B)) ¬ kγ(B), zaś – z dowolności k – że γ(A(B)) ¬ Lγ(B). Dowód dla miary Kuratowskiego przebiega podobnie. 1.5. Operatory γ-Lipschitza 29 Ćwiczenie: Udowodnić twierdzenie, gdy γ = α. 1.5.5 Uwaga: A ∈ Lip(D, E) wtedy i tylko wtedy, gdy istnieje stała L 0 taka, że dla dowolnego zbioru ograniczonego B ⊂ D diam (A(B)) ¬ Ldiam (B). (∗) Istotnie: Jeśli spełniony jest ten warunek, to dla B := {x, y}, gdzie x, y ∈ B, diam (B) = kx − yk oraz diam (A(B)) = kAx − Ayk. Zatem warunek wygląda następująco kAx − Ayk ¬ Lkx − yk, x, y ∈ D. Oznacza to, że A ∈ Lip(D, E). Na odwrót: przypuśćmy, że A ∈ Lip(D, E) i weźmy zbiór ograniczony B ⊂ D. dla dowolnych x, y ∈ B, kAx − Ayk ¬ kAkkx − yk ¬ kAkdiam (B). Stąd diam (A(B)) = supx,y∈B kAx − Ayk ¬ kAkdiam (B). Ćwiczenie: Udowodnić, że jeżeli A ∈ Lip(D, E), to kAk = inf{L 0 | zachodzi warunek (∗)}. 1.5.6 Wniosek Jeżeli A ∈ Lip(D, E), to A ∈ Lipγ (D, E) oraz kAkγ ¬ kAk. W szczególności: jeśli A ∈ L(F, E), to A ∈ Lipγ (F, E) i kAkγ ¬ kAk. Dowód: Oczywiście A jest operatorem ciągłym (nawet jednostajnie) i przekształca zbiory ograniczone na zbiory ograniczone. Niech B ⊂ D będzie zbiorem ograniczonym. Pokażemy, że γ(A(B)) ¬ kAkγ(B). Dla przykładu niech γ = α. Przypuśćmy, że k > α(B). Zatem znajS dziemy skończoną liczbę zbiorów B1 , ..., Bn takich, że B ⊂ ni=1 Bi i diam (Bi ) < k. Wtedy Sn A(B) ⊂ i=1 A(Bi ); przy czym, na mocy powyższych oszacowań diam (A(Bi )) ¬ kAkdiam (bi ) < kAkk, i = 1, ..., n. Zatem udało się pokryć zbiór A(B) skończoną liczbą zbiorów A(Bi ), i = 1, ..., n, z których każdy ma średnicę < kAkk. Stąd α(A(B)) ¬ kAkα(B). Dla γ = β dowód jest prostszy. Ćwiczenie: Podać dowód dla γ = β. Oprócz rodziny Lip(D, E) ważną podklasę w Lipγ (D, E) tworzą wspomniane już odwzorowania pełnociągłe, tzn. takie ciągłe odwzorowania A : D → E, że dla dowolnego ograniczonego zbioru B ⊂ D, domknięcie cl A(B) jest zbiorem zwartym. Klasę tę oznaczamy symbolem K(D, E). 1.5.7 Fakt: Klasa K(D, E) jest podprzestrzenią liniową w Lipγ (D, E) i K(D, E) = {A ∈ Lipγ (D, E) | kAkγ = 0}. Jeśli ciąg (An ) operatorów pełnociągłych jest jednostajnie Cauchy’ego na ograniczonych podzbiorach D, to istnieje pełnociągłe odwzorowanie A : D → E takie, że Ax = limn→∞ An x (jednostajnie na zbiorach ograniczonych). Jeżeli zbiór D jest ograniczony, to wyrażenie kAk∞ := sup kAxk, A ∈ K(D, E) x∈D jest normą zupełną w K(D, E). Dowód: Istnienie A dowodzimy jak przed chwilą. Ponieważ kAn kγ = 0 dla dowolnego n ∈ N, to A ∈ Lipγ (D, E) oraz kAkγ ¬ lim inf n→∞ kAn kγ = 0. Czyli A jest operatorem pełnociągłym. 30 1. I rozdział Ćwiczenie: Przeprowadzić dowód pozostałej części twierdzenia. 1.5.8 Przykład: Jeżeli A ∈ Lip(D, E), B ∈ K(D, E), to A + B ∈ Lipγ (D, X) oraz kA + Bkγ ¬ kAk. Wynika to bezpośrednio z powyżej sformułowanych faktów. Jest to klasyczny przykład operatora γ-lipschitzowskiego. 1.6 Teoria Fredholma-Schaudera dla operatorów lipschitzowskich Oprócz wspomnianej miary niezwartości k · kγ rozważymy jeszcze jedną charakterystykę operatorów. Mianowicie dla ciągłego odwzorowania A : D → E przeprowadzającego zbiory ograniczone na zbiory ograniczone połóżmy |A|γ := sup{l 0 | dla dowolnego ograniczonego B ⊂ D, γ(A(B)) lγ(B)} lub, równoważnie γ(A(B)) γ(B)>0 γ(B) |A|γ = inf (ma to oczywiście sens, gdy dim E = ∞, w przeciwnym bowiem razie nie ma zbiorów ograniczonych spełniających γ(B) > 0). Łatwo zobaczyć, że dla dowolnego ograniczonego B ⊂ D, |A|γ γ(B) ¬ γ(A(B)). Jest jasne, że jeśli A ∈ Lipγ (D, E), to |A|γ ¬ kAkγ ; w szczególności, gdy A ∈ L(F, E), to |A|γ ¬ kAkγ ¬ kAk. 1.6.1 Własności: Przypuśćmy, że A, B ∈ Lipγ (E), tzn. F = E i D = E. Wtedy |A|γ |B|γ ¬ kABkγ ¬ kAkγ kBkγ . Jeżeli A, B ∈ Lipγ (D, E), to: (i) |A|γ − kBkγ ¬ |A + B|γ ¬ |A|γ + kBkγ ; (ii) ||A|γ − |B|γ | ¬ kA − Bkγ ; w szczególności jeśli kA − Bkγ = 0, to |A|γ = |B|γ . Dowód: Pierwsza własność jest prostą konsekwencją przyjętych definicji. (i) Weźmy ε > 0. Z definicji istnieje ograniczony zbiór C0 ⊂ D taki, że γ(C0 ) > 0 i γ(A(C0 ))[γ(C0 )]−1 < |A|γ + ε. Jednocześnie γ((A + B)(C0 )) ¬ γ(A(C0 ) + B(C0 )) ¬ γ(A(C0 )) + γ(B(C0 )) ¬ (|A|γ + ε)γ(C0 ) + kBkγ γ(C0 ). Czyli |A + B|γ = inf γ(C)>0 γ((A + B)(C0 )) γ((A + B)(C)) ¬ ¬ |A|γ + ε + kBkγ . γ(C) γ(C0 ) Z dowolności ε wynika teza. (ii) wynika wprost z (i). Odnotujmy jeszcze jedną własność. 1.6.2 Fakt: Jeśli A : D → E jest operatorem ciągłym (przeprowadzającym zbiory ograniczone na ograniczone), D jest domknięty i |A|γ > 0, to A jest odwzorowaniem właściwym, tzn. dla 1.6. Teoria Fredholma-Schaudera dla operatorów lipschitzowskich 31 każdego zwartego K ⊂ E, przekrój przeciwobrazu A−1 (K) z dowolnym zbiorem domkniętym i ograniczonym jest zwarty. Dowód: Niech K ⊂ E będzie zbiorem zwartym i niech B ⊂ D będzie domknięty i ograniczony. Wtedy A(A−1 (K)) ⊂ K oraz |A|γ γ(A−1 (K) ∩ B) ¬ γ(A(A−1 (K) ∩ B)) ¬ γ(K) = 0. Czyli γ(A−1 (K) ∩ B) = 0. Oczywiście zbiór A−1 (K) ∩ B jest domknięty, jest więc zwarty. . 1.6.3 Wniosek: Jeśli A ∈ Lipγ (D, E), gdzie D ⊂ F = E, oraz kAkγ < |λ|, gdzie λ 6= 0, to odwzorowanie λI − A jest właściwe. Dowód: Zgodnie z własnością (ii) |λI − A|γ |λI|γ − kAkγ = |λ| − kAkγ > 0. Teza wynika z powyższego faktu. 1.6.4 Uwaga: Zauważmy, że odwzorowanie A : D → E ciągłe i właściwe (w podanym sensie) przeprowadza ograniczone zbiory domknięte na zbiory domknięte. Rzeczywiście: niech B ⊂ D będzie zbiorem domkniętym i niech yn → y ∈ E, gdzie yn ∈ A(B) dla n ∈ N. Zatem yn = A(xn ), −1 gdzie xn ∈ B, n ∈ N. Zbiór K := {yn }∞ n=1 ∪ {y} jest zwarty. Zatem xn ∈ A (K) ∩ B. Ten ostatni zbiór jest zwarty, więc (ewentualnie przechodząc do podciągu) xn → x ∈ B. Zatem yn = A(xn ) → A(x) = y ∈ A(B). 1.6.5 Uwaga: Jeżeli A ∈ L(F, E), dim N (A) < ∞ i R(A) jest domknięty, to A jest operatorem właściwym w podanym sensie. Ćwiczenie: Spróbować udowodnić to stwierdzenie. 1.6.6 Definicja: Przypuśćmy, że A ∈ L(F, E). Mówimy, że operator A jest semi-Fredholma, gdy N (A) := {x ∈ F | Ax = 0} ma skończony wymiar i R(A) := {Ax | x ∈ F} jest zbiorem domkniętym. Operator A ∈ L(F, E) jest Fredholma, gdy dim N (A) < ∞ oraz dim E/R(A) < ∞. Liczbę i(A) := dim N (A) − dim E/R(A) nazywa się indeksem Fredholma operatora A. 1.6.7 Uwaga: Indeks Fredholma można zdefiniować też w przypadku operatorów semi-Fredholma. Jeżeli bowiem dim E/R(A) = ∞, to i(A) = −∞. 1.6.8 Uwaga: Nazwa „operator Fredholma” wynika ze sławnej alternatywy Fredholma; powiadamy, że operator liniowy A : F → E zadośćczyni alternatywnie Fredholma jeżeli ma miejsce jeden z poniższych alternatywnych warunków: (a) Równanie Ax = y is dobrze postawione, tzn. dla dowolnego y ∈ E ma ono jednoznaczne rozwiązanie; ponadto rozwiązanie zależy w sposób ciągły od y ∈ E; (b) Równanie Ax = y nie ma rozwiązania dla wszystkich y ∈ E oraz, dla tych y, dla których równanie to ma rozwiązanie, rozwiązanie nie jest jednoznaczne. 1.6.9 Przykład: Dla przykładu rozważmy operator T : E → E, gdzie E jest przestrzenią liniową nad ciałem K, dimK E = n. Twierdzenie (Kroneckera-Capelliego): Jądro N (T ) i obraz R(T ) są podprzestrzeniami niezmienniczymi ze względu na T oraz dimK N (T ) + dimK R(T ) = n, dimK R(T ) + dimK Coker(T ) = m, 32 1. I rozdział gdzie Coker(T ) := F/R(T ). Dodatkowo, jeżeli N (T ) ∩ R(T ) = {0}, to N (T ) ⊕ R(T ) = E. Dowód: Jest jasne, że N (T ) oraz R(T ) są niezmiennicze. Niech v1 , ..., vk , k ¬ n, będzie bazą N (T ). Istnieją wektory vk+1 , ..., vn , które uzupełniają układ (v − 1, ..., vk ) do bazy przestrzeni E. Wtedy wektory wi := T (vk+i ), i = 1, ....n − k, rozpinają R(T ). Układ ((w1 , ..., wn−k ) jest liniowo P Pn−k niezależny: jeżeli n−k i=1 αi wi = 0, gdzie αi ∈ K dla i = 1, ..., n − k, to i=1 αi vk+i ∈ N (T ); zatem αi = 0 dla dowolnego i = 1, ..., n − k. 1.6.10 Uwaga: Twierdzenie powyższe można interpretować na różne sposoby. Przede wszystkim dimK R(T ) nazywa się rzędem operatora T ; w języku macierzy rzędem T jest rząd macierzy A = [aij ] stowarzyszonej z operatorem T (względem dowolnie wybranych baz (e1 , ..., en ), (f1 , ..., fn ) w dziedzinie i przeciwdziedzinie). (i) Równanie T x = y, gdzie y ∈ E jest zadanym elementem E ma rozwiązanie wtedy i tylko wtedy, gdy y ∈ R(T ), tzn. wektor y jest liniowo zależny od bazy (w1 , ..., wn−k ) z twierdzenia. To zachodzi wtedy i tylko wtedy, gdy rząd macierzy A jest równy rzędowi tzw. macierzy uzupełnionej B danej przez a11 a12 · · · a1n y1 a21 a22 · · · a2n y2 B := . .. .. .. .. , . . . . .. an1 an2 · · · ann yn gdzie (y1 , ..., yn ) są współrzędnymi wektora y względem bazy (f1 , ..., fn ). (ii) (Alternatywa Fredholma) Albo równanie T x = y ma dla dowolnego y ∈ E dokładnie jedno rozwiązanie, albo równanie T x = 0 ma niezerowe rozwiązania. Jest to jasne: jeśli równanie T x = 0 ma tylko rozwiązanie zerowe, to N (T ) = {0} (czyli T jest injekcją) i wtedy dimK R(T ) = n, tzn. R(T ) = E, czyli z poprzedniego wynika, że dla każdego y ∈ E istnieje dokładnie jedno rozwiązanie. Wracamy do głównego nurtu. 1.6.11 Twierdzenie: Operator A ∈ L(F, E) jest semi-Fredholma wtedy i tylko wtedy, gdy |A|γ > 0. Dowód: Załóżmy, że |A|γ > 0. Wtedy N (A) ∩ D(0, 1) jest zbiorem zwartym (bo N (A) = A−1 ({0})). Zauważmy, ze D(0, 1) ∩ N (A) jest kulą domkniętą jednostkową w N (A). Korzystając z twierdzenie Riesza, które orzeka, że przestrzeń unormowana jest skończenie wymiarowa wtedy i tylko wtedy, gdy jej kula jednostkowa jest zwarta, wnioskujemy, że dim N (A) < ∞. Pokażemy teraz, że R(A) jest zbiorem (podprzestrzenią liniową) domkniętym. Ponieważ dim N (A) < ∞, to istnieje domknięta podprzestrzeń X taka, że F = X ⊕ N (A) (topologiczna suma prosta). Niech (yn ) ⊂ R(A), tzn. yn = Axn , gdzie xn ∈ X dla n ∈ N, i załóżmy, że yn → y. Jeśli ciąg (xn ) jest ograniczony, to już wiemy, że musi zawierać zbieżny podciąg i ciągłość gwarantuje, że y ∈ R(A). Przypuśćmy więc, że (xn ) nie jest ograniczony, tzn. kxn k → ∞ (w szczególności można przyjąć, że xn 6= 0). Niech en := kxn k−1 xn . Oczywiście Aen = kxn k−1 yn → 0. Tak więc γ(A({en })) = 0. Z drugiej strony γ(A({en })) |A|γ γ({en }) czyli (en ) ma podciąg zbieżny. Bez zmniejszenia ogólności można założyć, że en → e ∈ X oraz kek = 1 (bo ken k = 1). Lecz A(e) = 0 czyli e ∈ N (A): sprzeczność bo N (A) ∩ X = {0}. Ćwiczenie: Udowodnić, że jeśli operator jest semi-Fredholma, to |A|γ > 0. 1.6. Teoria Fredholma-Schaudera dla operatorów lipschitzowskich Takim sposobem kończymy dowód. 33 Ćwiczenie: Pokazać, że operatory Fredholma są semi-Fredholma (de facto trzeba tylko pokazać, że jeżeli A jest Fredholma, to R(A) jest zbiorem domkniętym. 1.6.12 Twierdzenie: Jeśli A ∈ L(E) oraz kAkγ < 1, to operator I − A jest Fredholma indeksu 0. Dowód: Wiemy, że |I − A|γ > 0. Zatem I − A jest semi-Fredholma. Wystarczy pokazać, że R(I − A) ma skończony kowymiar równy dim N (I − A). W dalszym rozumowaniu odwołamy się do następującego twierdzenia: 1.6.13 Twierdzenie: Jeśli A ∈ L(F, E) jest operatorem Fredholma. Jeśli B ∈ L(F, E) i ma normę dostatecznie małą, to operator A + B jest Fredholma oraz i(A + B) = i(A), dim N (A + B) ¬ dim N (A). Dokładniej jeśli A jest semi-Fredholma, to A + B jest semi-Fredholma i zachodzą powyższe warunki, o ile B ma dostatecznie małą normę. Dowód jest dość trudny (i w zasadzie czysto algebraiczny). Pominiemy go. Kontynuujemy dowód: Oczywiście I jest operatorem Fredholma oraz i(I) = 0. Rozważmy zbiór Z := {λ ∈ [0, 1] | I − λA jest Fredholma oraz i(I − λA) = 0}. Zbiór ten jest niepusty, bo 0 ∈ Z. Jest on też otwarty. Gdy λ ∈ Z, to zgodnie z pierwszą częścią powyższego twierdzenia znajdziemy małe ε > 0 takie, że jeśli |µ − λ| < ε, to µ ∈ Z. Istotnie. Wiemy, że istnieje δ > 0 taka, że jeśli B ∈ L(E) i kBk < δ, to I −λA+B jest Fredholma o indeksie 0. Weźmy teraz ε > 0 takie, by εkAk < δ. Jeśli µ ∈ K, |µ − λ| < ε, to I − µA = I − λA + B, gdzie B = (λ − µ)A, jest Fredholma o indeksie 0, bo kBk = |λ − µ|kAk < εkAk < delta. Zatem µ ∈ Z. Pokażemy, że Z jest też zbiorem domkniętym. Jeśli λ 6∈ Z, to I − λA nie jest Fredholma lub jest Fredholma, lecz i(I −λA) 6= 0. Jeśli I −λA jest Fredholma, lecz nie ma indeksu równego 0, to analogicznie jak poprzednio pokażemy, że dla µ dostatecznie bliskiego λ, I − µA jest Fredholma o indeksie takim jak indeks I − λS, czyli µ 6∈ Z. Przypuśćmy, że I − λA nie jest Fredholma. Wiemy jednak, że I − λA jest semi-Fredholma (bo kλAkγ < 1), czyli i(I − λA) = −∞. W taki razie, analogicznie jak przed chwilą (ale wykorzystując drugą część twierdzenia) dostrzeżemy, że dla µ dostatecznie bliskich λ, I − µB jest semi-Fredholma i i(I − µA) = −∞; tak więc i w tej sytuacji µ 6∈ Z. Pokazaliśmy więc, że dopełnienie Z (w [0, 1]) jest zbiorem otwartym. Dowodzi, to, że Z jest zbiorem domknięto-otwartym w [0, 1]. Spójność odcinka [0, 1] (i niepustość Z) implikuje, że Z = [0, 1]. Tak więc I − A jest Fredholma o indeksie 0. Ćwiczenie: Przeanalizować jak to jest z tą teorią w sytuacji, gdy zamiast I weźmiemy operator Fredholma T ∈ L(F, E) i będziemy badać zaburzenie T + A z punktu widzenia kAkγ . Jak musi wyglądać relacja kT k (a może |T |γ lub kT kγ ) i kAkγ ? Teraz zajmiemy się bliżej klasą Lipγ (E) := Lipγ (E, E). Podobne znaczenie ma symbol K(E). Wiemy, że Lip(E) ⊂ Lipγ (E) (w szczególności L(E) ⊂ Lim inf γ (E)) oraz kAkγ ¬ kAk, K(E) ⊂ Lipγ (E) i A ∈ Lipγ (E) należy do K(E) wtedy i tylko wtedy, gdy kAkγ = 0. Ponadto, jeśli A, B ∈ Lipγ (E), to AB ∈ Lipγ (E) oraz kABkγ ¬ kAkγ kBkγ . Warto też zauważyć, że jeżeli T : E → E jest odwzorowaniem ciągłym i przekształca zbiory ograniczone w ograniczone, A ∈ K(E), to AT ∈ K(E) (10 ). 10 Oczywiście jeśli T : E → E jest tylko ciągłe, zaś A pełnociągłe, to złożenie T A jest pełnociągłe. 34 1. I rozdział Ma to na przykład następujące „przełożenie”: 1.6.14 Wniosek: Jeżeli A : D(A) → E, istnieje µ ∈ ρ(A) i RA (µ) ∈ K(E), to RA (λ) ∈ K(E) dla dowolnego λ ∈ ρ(A). Dowód: Mamy tożsamość rezolwenty RA (λ) = RA (µ)(I + (λ − µ)RA (λ) ∈ K(E), bo RA (µ) ∈ K(E). Szczególne znaczenie mają operatory liniowe z L(E). Zajmiemy się teraz strukturą spektrum operatorów w L(E). 1.6.15 Lemat: (Riesza o wektorze niemal ortogonalnym) Załóżmy, że X jest domkniętą podprzestrzenią w E i ε ∈ (0, 1). Istnieje wektor z ∈ E, kzk = 1 taki, że kx − zk > ε dla dowolnego x ∈ X. Dowód: Niech x1 ∈ E \ X i d := d(x1 , X) := inf x∈X kx1 − xk. Wtedy d > 0, bo X jest domkniętym zbiorem (gdyby d = 0, to x∈ cl X = X). Z definicji kresu dolnego wynika, że istnieje x0 ∈ X taki, że kx1 − x0 k < dε−1 . Połóżmy z := kx1 − x0 k−1 (x1 − x0 ). Wówczas oczywiście kzk = 1 oraz dla dowolnego x ∈ X kx − zk = kx − x1 kx1 − x0 k−1 + x0 kx1 − x0 k−1 k = kx1 − x0 k−1 kkx1 − x0 kx + x0 − x1 k. Wektor kx1 − x0 kx + x0 ∈ X; zatem kkx1 − x0 kx + x0 − x1 k d. Stąd kx − zk dkx1 − x0 k−1 ε. Ćwiczenie: Wykorzystując ten lemat udowodnić wspomniane twierdzenie Riesza o wymiarze przestrzeni, w której kula jest zwarta (równoważne sformułowanie: Operator identycznościowy I : E → E jest zwarty wtedy i tylko wtedy, gdy dim E < ∞. 1.6.16 Uwaga: Jeśli X jest podprzestrzenią skończenie wymiarową, to można znaleźć z ∈ E taki, że kzk = 1 oraz d(z, X) = 1. 1.6.17 Lemat: Niech A ∈ L(E) i kAkγ < 1. Jeśli A−I jest injekcją, to jest surjekcją i (A−I)−1 ∈ L(E). Dowód: Skoro kAkγ < 1, to A − I jest Fredholma indeksu 0. Zatem jeśli jest to injekcja (czyli N (A − I) = 0) to R(A − I) = E i teza wynika z twierdzenie Banacha o operatorze odwrotnym (patrz też rozumowanie zaraz poniżej, w którym używa się kAkγ < 1 – zobacz znak (!!)). 1.6.18 Uwaga: Dla ciekawości podamy dowód powyższego lematu przy założeniu, że kAkγ < 1/2. Pokażemy najpierw, że istnieje ε > 0 takie, że kAx − xk εkxk (z tego już wynika, że (A − I)−1 , o ile istnieje na E, jest operatorem ciągłym). Przypuśćmy, że tak nie jest. Wtedy, dla dowolnego n ∈ N istnieje yn ∈ E taki, że kAyn − yn k < n−1 kyn k. Oczywiście yn 6= 0; zatem dla xn := kyn k−1 yn mamy kxn k = 1 i kAxn − xn k < n−1 , czyli limn→∞ kAxn − xn k = 0. Zatem γ({Axn − xn }n∈N ) = 0 Z definicji i z lematu 1.1.7 i uwagi 1.1.8 γ({xn }∞ n=1 ) = γ({Axn − (Axn − xn )}n∈N ) = γ({Axn }n∈N ) ¬ kAkγ γ({xn }), Zatem γ({xn }) = 0 bo kAkγ < 1 (!!). W taki razie zbiór {xn } jest względnie zwarty i, bez zmniejszenia ogólności, można założyć, że xn → x ∈ E. Oczywiście wtedy kxk = 1 i x 6= 0, Axn → Ax, ale z drugiej strony Axn − xn → 0, czyli Ax = x: sprzeczne z założeniem, że A − I jest różnowartościowe. 1.6. Teoria Fredholma-Schaudera dla operatorów lipschitzowskich 35 Udowodnione stwierdzenie implikuje też, że A − I przekształca zbiory domknięte na zbiory domknięte. Istotnie jeśli B ⊂ E jest domknięty, (yn ) ⊂ A(B), to yn = Axn − xn , gdzie xn ∈ B, n ∈ N. Przypuśćmy, że (yn ) jest zbieżny – czyli jest ciągiem Cauchy’ego; czyli 0= lim kyn − ym k = m,n→∞ lim kA(xn − xm ) − (xn − xm )k ε lim kxn − xm k, m,n→∞ n,n→∞ co dowodzi, że też ciąg (xn ) jest Cauchy’ego, a więc z zupełności E wynika, że xn → x ∈ B (bo B jest domknięty). Stąd yn = Axn − xn → Ax − x ∈ A(B). Pokażemy teraz, że A − I jest surjekcją (tu będziemy korzystać z tego, że kAkγ < 1/2). Połóżmy X0 := E i Xn = (A − I)(Xn−1 ) dla n 1 (czyli Xn = R((A − I)n ) dla n 0). Otrzymaliśmy ciąg domkniętych podprzestrzeni liniowych (Xn )n∈N . Zauważmy, że Xn ⊂ Xn−1 (to można udowodnić przez indukcję: X1 ⊂ X0 ; jeśli Xn ⊂ Xn−1 , to Xn+1 = (A − I)(Xn ) ⊂ (A − I)(Xn−1 ) = Xn ). Twierdzę, że istnieje n ∈ N takie, że Xn = Xn−1 . Jeśli tak nie jest, to dla dowolnego n ∈ N, Xn ( Xn−1 . Z lematu o wektorze niemal ortogonalnym dla każdego n ∈ N wybierzmy xn−1 ∈ Xn−1 tak, by kxn−1 k = 1 i d(xn−1 , Xn ) ε, gdzie 2kAkγ < ε < 1. Otrzymaliśmy ciąg (xn )∞ n=0 , kxn k = 1 i d(xn , Xm ) ε, o ile m > n. Jeśli m > n 1, to kAxm − Axn k = k((A − I)xm − (A − I)xn + xm ) − xn k ε, bo (A−I)xm −(A−I)xn +xm ∈ Xm+1 +Xn+1 +Xm ⊂ Xn+1 , czyli kAxm −Axn k d(xn , Xn+1 ) ε. Stąd wynika, że α({Axn }) ε oraz β({Axn }) ε/2 (11 ). Ponieważ α({xn }) ¬ 2, to ε ¬ α({Axn }) ¬ kAkα α({xn }) ¬ 2kAkα < ε i sprzeczność. Analogicznie β({xn }) ¬ 1 i ε/2 ¬ β({Axn }) ¬ kAkβ β({xn }) ¬ kAkβ < ε/2 i ponownie sprzeczność. Zatem musi istnieć n ∈ N takie, że Xn = Xn−1 . Twierdzę, że także Xn−1 = Xn−2 . Ponieważ Xn−1 ⊂ Xn−2 , wystarczy pokazać, że Xn−2 ⊂ Xn−1 . Niech x ∈ Xn−2 . Wtedy Ax − x ∈ Xn−1 = Xn = (A − I)(Xn−1 ), czyli istnieje y ∈ Xn−1 takie, że Ax − x = Ay − y. Różnowartościowość A − I implikuje, że x = y ∈ Xn−1 . Kontynuując takie rozumowanie otrzymamy, że E = X0 = X1 = (A − I)(X0 ) = (A − I)(E), czyli istotnie A − I jest surjekcją (nawiasem mówiąc mamy też, że Xk = Xk−1 dla każdego k ∈ N: rzeczywiście przez indukcję Xk = (A − I)(Xk−1 ) = (A − I)(Xk−2 ) = Xk−1 , o ile Xk−1 = Xk−2 ). Niech A ∈ L(E). Jeżeli r 0, to σ r (A) := {λ ∈ σ(A) | |λ| r}. Zatem σ0 (A) = σ(A). 1.6.19 Twierdzenie: Niech A ∈ L(E). Jeśli r > kAkγ , to zbiór σ r (A) jest skończony i składa się tylko z wartości własnych, tzn. σ r (A) ⊂ σp (A). 11 Dla γ = α, to α({Axn }) ε. Gdyby α({Axn }) < ε, to prawie wszystkie wyrazy tego ciągu musiałyby wpadać do pewnego zbioru o średnicy < ε, czyli – w szczególności – dla p.w. n i m > n, kAxn − Axm k < ε: sprzeczność. Gdy γ = β, to β({Axn } ε/2. W przeciwnym razie p.w. wyrazy tego ciągu musiałby leżeć w pewnej kuli o promieniu < ε/2. Zatem dla p.w. n i m > n, kAxn − Axm k < ε: sprzeczność. 36 1. I rozdział Dowód: Niech λ ∈ K oraz |λ| > kAkγ . Wtedy A − λI = λ(λ−1 A − I) oraz kλ−1 Ak = |λ|−1 kAkγ < 1. Zatem operator λ−1 A − I jest Fredholma indeksu 0. Oczywiście (A − λI)−1 istnieje wtedy i tylko wtedy, gdy istnieje (λ−1 A − I)−1 oraz (A − λI) jest injekcją wtedy i tylko wtedy, gdy injekcją jest (λ−1 A − I). Z kolei, z poprzedniego twierdzenie, (λ−1 A − I) jest injekcją wtedy i tylko wtedy, gdy (λ−1 A − I)−1 istnieje. Zatem (wybrany) skalar λ ∈ σ(A) wtedy i tylko wtedy, gdy jest wartością własną. W takim razie, jeśli r > kAkγ , to σ r (A) składa się tylko z wartości własnych. Przypuśćmy nie wprost, że σ r (A) zawiera nieskończenie wiele elementów, czyli w szczególności zawiera przeliczalny zbiór {λi }∞ i=1 różnych wartości własnych, |λj | r. Wybierzmy R tak, by r > R > kAkγ i niech B := R−1 A. Wtedy B ∈ L(E) oraz kBkγ = R−1 kAkγ < 1. Dla i 1, niech xi 6= 0 będzie wektorem własnym odpowiadającym λi . Wiemy już, że układ {xi }∞ i=1 jest liniowo niezależny. Ponadto xi jest wektorem własnym dla B o wartości własnej µi = R−1 λi oraz |µi | > 1. Wybierzmy teraz m ∈ N tak, by kB m kγ ¬ kBkm γ < 1/4. To jest możliwe, bo kBkγ < 1, m jest wartością własna B m o wektorze własnym x , czyli kBkm → 0, gdy m → ∞. Oczywiście µ i γ i i = 1, 2.. Niech X0 := {0} oraz Xk := span{x1 , ..., xk }, k 1. Wtedy Xk ( Xk+1 dla każdego k 0. Z lematu Riesza o wektorze niemal prostopadłym wynika, że dla każdego k 1 istnieje wektor ek ∈ Xk , kek k = 1 taki, że d(ek , Xk−1 ) > 1/2. m Łatwo sprawdzić, że (B m − µm k I)(Xk ) ⊂ Xk−1 dla każdego k 1. W szczególności (B − µm k I)(ek ) ∈ Xk−1 ; a więc jeśli 1 ¬ n < k, to m −m m zk,n := ek − µ−m k B ek + µn B en ∈ Xk−1 . W takim razie m −m kB m (µ−m k ek ) − B (µn en )k = kek − zk,n k > 1/2. −m m m Niech M := {µ−m 1 e1 , µ2 e2 , ...}. Widać, że α(B (M )) 1/2 oraz β(B (M )) 1/4. Z drugiej strony α(M ) ¬ 2, bo M ⊂ D(0, 1) oraz β(M ) ¬ 1. Zatem 1/2 ¬ α(B m (M )) ¬ kB m kα α(M ) ¬ kBkm α α(M ) < 1/2 oraz 1/4 ¬ β(B m (M )) ¬ kBkm β β(M ) < 1/4. W obu przypadkach (γ = α lub γ = β) otrzymujemy sprzeczność. Zakładamy, że kAkγ < 1 1.6.20 Lemat:Niech A ∈ L(E) i niech Nk := N ((A − I)k ), k = 0, 1, 2, .... Wtedy, dla każdego k 0, Nk ⊂ Nk+1 oraz dla dowolnego m 1 i k 1, (Am − I)(Nk ) ⊂ Nk−1 . Dowód: Jeśli x ∈ Nk , k 0, to (A − I)k+1 x = (A − I)((A − I)k x) = (A − I)(0) = 0, czyli x ∈ N ((A − I)k+1 ) = Nk+1 . Jeśli k 1 oraz x ∈ Nk , to (A − I)k−1 ((A − I)x) = (A − I)k x = 0, czyli (A − I)x ∈ Nk−1 . Zatem teza jest słuszna, gdy m = 1. Teraz przypuśćmy, że m > 1. Oczywiście, gdy x ∈ N1 , to Ax = x oraz Am x = Am−1 (Ax) = Am−1 x = Am−2 x = ... = x, czyli (Am − I)x = 0 ∈ N0 . 1.6. Teoria Fredholma-Schaudera dla operatorów lipschitzowskich 37 Przypuśćmy, że (Am −I)(Nk ) ⊂ Nk−1 . Pokażemy, że (Am −I)(Nk+1 ) ⊂ Nk . Niech x ∈ Nk+1 . Wtedy y := (A − I)x ∈ Nk . Zatem (Am − I)x = (Am−1 + Am−2 + ... + A + I)(A − I)x = (Am−1 + Am−2 + ... + A + I)y =: z. Sprawdzimy, że z ∈ Nk . (A − I)k z = (A − I)k (Am−1 + Am−2 + ... + A + I)y = (A − I)k−1 (A − I)(Am−1 + Am−2 + ... + A + I)y = (A − I)k−1 (Am − I)y = 0, bo y ∈ Nk więc (Am − I)y ∈ Nk−1 z założenia indukcyjnego. Zatem z ∈ Nk . 1.6.21 Uwaga: Z powyższego wynika, że Am (Nk ) ⊂ Nk bo, gdy x ∈ Nk , to Am x = Am x−x+x ∈ Nk−1 + Nk ⊂ Nk . 1.6.22 Twierdzenie: Niech A ∈ L(E) i kAkγ < 1. Wówczas N := {x ∈ E | (A − I)k x = 0 dla pewnego k 0} = ∞ [ Nk k=0 jest skończenie wymiarową podprzestrzenią w E, F := ∞ \ R((A − I)j ) j=1 jest domkniętą podprzestrzenią w E i N ⊕ F = E (topologiczna suma prosta). Obcięcie (A − I)|N jest operatorem nilpotentnym N → N , zaś obcięcie (A − I)|F jest bijekcją F → F . Dowód: Wykorzystamy (ściśle algebraiczny) fakt: Złożenie operatorów Fredholma A, B jest operatorem Fredholma oraz i(AB) = i(A) + i(B). Wynika stąd, że (A − I)k jest operatorem Fredholma (bo A − I jest operatorem Fredholma), stąd dim Nk < ∞. Pokazaliśmy już, że Nk ⊂ Nk+1 , k 1, oraz (dla dowolnego m 1) (Am − I)(Nk ) ⊂ Nk−1 , k 1. Przypuśćmy, że dla dowolnego k 0, Nk ( Nk+1 . Wykorzystując (uwagę) lemat Riesza, dla dowolnego k 1 znajdziemy taki zk ∈ Nk , że kzk − xk 1 dla x ∈ Nk−1 . Wybierzmy też m 1 tak, by kAkm γ < 1/2. m Wówczas, dla 1 ¬ n < k, x := (A − I)zk − Am xn ∈ Nk−1 , bo xn ∈ Nn więc Am xn ∈ Nm ⊂ Nk−1 . Czyli 1 ¬ kx − zk k = kAm zk − Am zn k. W takim razie α(Am (M )) 1 oraz β(Am (M )) 1/2, gdzie M := {zk }∞ k=1 . Jednocześnie α(M ) ¬ 2 i β(M ) ¬ 1. Z drugiej strony 1 ¬ α(Am (M )) ¬ kAm kα α(M ) ¬ 2kAkm α <1 oraz 1/2 ¬ β(Am (M )) ¬ kAkm β (M ) < 1/2. Mamy sprzeczność. Zatem dla pewnego k 1, Nk = Nk+1 , a stąd – przez indukcję – otrzymamy, że Nn = Nk dla n > k. Istotnie: wiemy, że Nk+1 = Nk . Przypuśćmy, że dl pewnego n > k, Nn ⊂ Nk (wiadomo, że Nn ⊃ Nk ). Niech x ∈ Nn+1 , tzn. (A − I)n+1 x = 0, czyli (A − I)x ∈ Nn = Nk = Nn−1 a więc (A − I)n−1 (A − I)x = (A − I)n x = 0, tzn. x ∈ Nn = Nk . Tak więc N = Nk i dim N = dim Nk < ∞. Jest jasne, że (A − I)(N ) ⊂ N i (A − I)k (N ) = {0}. Przestrzeń F jest oczywiście domknięta (przecięcie zbiorów domkniętych: (A − I)j jest 38 1. I rozdział operatorem Fredholma, więc R((A − I)j ) jest zbiorem domkniętym). Rodzina R((A − I)j ) jest zstępująca (R((A − I)j ) ⊂ R((A − I)j−1 ) ale, dla j > k mają ten sam kowymiar, czyli R((A − I)j ) = R((A − I)k ) przy j > k. W takim razie F = R((A − I)k ) i dim E/F = dim N (bo (A − I)k jest operatorem Fredholma o indeksie 0). Zauważmy, że A(A − I)j = (A − I)j A (dowód np. przez indukcję), zatem A(F ) ⊂ F . Ponadto łatwo zobaczyć, że (A − I)|F jest surjekcją na F . Rzeczywiście, gdy y ∈ R((A − I)k ) = R((A − I)k+1 ), czyli y = (A − I)k+1 x = (A − I)k (A − I)x ∈ (A − I)(R((A − I)k )). Ponieważ A|F = A ◦ iF , gdzie iF : F → E jest włożeniem, to kA|F kγ ¬ kAkγ kiF kγ < 1, gdyż kiF k = 1. Tak więc (A − I)|F jest surjektywnym operatorem Fredholma. A to oznacza, że (A − I)|F jest bijekcją. To również oznacza, że F ∩ N = {0}. Istotnie, gdy y ∈ Nk ∩ R((A − I)k ), to (A − I)k y = 0, ale (A − I)k jest również bijekcją, czyli y = 0. Z drugiej strony, gdy x ∈ E, to wziąwszy pod uwagę, że R((A − I)k ) = R((A − I)2k ), (A − I)k x = (A − I)2k y dla pewnego y ∈ E. Stąd 0 = (A − I)k x − (A − I)2k y = (A − I)k (x − (A − I)k y), tzn. z := x − (A − I)k y ∈ Nk ; a więc x = z + (A − I)k y. Dowodzi to, że N + F = E; zatem E = N ⊕ F . . Oczywiście podane twierdzenie można odnieść do problemu spektralnego. Mianowicie rozważmy operator A ∈ L(E) i niech r > kAkγ . Niech λ ∈ σ r (A), tzn. |λ| r. Wiemy już, że λ jest jedną, ze skończonej liczby wartości własnych leżących w σ r (A). Wiemy już, że tzw. krotność geometryczna ngeo (λ, A) := dim N (A − λI) < ∞. Niech B := (λ−1 A − I). Wtedy λB = (A − λI) oraz, dla dowolnego j 0, N (B j ) = N ((λ−1 A − I)j ) = N ((A − λI)j ). Z poprzedniego twierdzenia, tzw. przestrzeń pierwiastkowa V (λ, A) = [ N ((A − λI)j ) j0 jest skończenie wymiarowa i jej wymiar nalg (λ, A) = dim V (λ, A) < ∞ nazywa się krotnością algebraiczną. Oczywiście ngeo (λ, A) ¬ nalg (λ, A). 1.6.23 Wniosek: Niech A : E → E będzie operatorem zwartym na przestrzeni Banacha dim E = ∞. Wtedy zachodzą następujące fakty: (i) 0 ∈ σ(A); jeśli λ 6= 0 jest elementem σ(A), to λ jest wartością własną o skończonej krotności algebraicznej. Zero może być lub nie wartością własną. (ii) Widmo σ(A) jest albo zbiorem skończonym albo przeliczalnym o jedynym punkcie skupienia λ = 0. Przykład: (i) Niech T : `2 → `2 dane będzie wzorem T (x)1 = 0, T (x)i = (i − 1)−1 xi−1 dla i 2. Wtedy operator T jest zwarty i σ(T ) = {0} oraz 0 nie jest wartością własną. (ii) Niech T : `2 → `2 dany będzie wzorem T (x)1 = T (x)2 = 0, oraz T (x)i = (i − 1)−1 xi−1 dla i 3. Wtedy σ(T ) = {0} i 0 jest wartością własną (o wektorze własnym (1, 0, 0....)). (iii) Niech λ1 , ..., λn 6= 0. Rozważmy operator T : `2 → `2 dany wzorem T (x)i = λi xi dla i = 1, ..., n oraz T (x)i = 0 dla i > n. Wtedy 0 jest wartością własną i σ(T ) \ {0} = {λ1 , ..., λn }. (iv) Niech przy oznaczeniach z poprzedniego przykładu, T (x)i = λi xi dla i = 1, ..., n oraz T (x)i = (i − 1)−1 xi−1 dla i > n. Wtedy σ(T ) \ {0} = {λ1 , ..., λn } i 0 nie jest wartością własną. Pytanie: Czy jeśli σ(T ) nie jest równe {0} oraz 0 jest wartością własną, to dim N (T ) = ∞? (oczywiście przy założeniu, że dim X = ∞). Nie; rozważmy operator T : `2 → `2 dany wzorem 1.7. Operatory liniowe o zwartych lub γ-lipschitzowskich rezolwentach 39 T (x)1 = 0, T (x)2 = λx2 (λ 6= 0), T (x)i = (i − 1)−1 xi−1 dla i 3. Wtedy 0 jest wartością własną, dim N (T ) = 1 oraz σ(T ) = {0, λ}. 1.7 Operatory liniowe o zwartych lub γ-lipschitzowskich rezolwentach Niech A : D(A) → E, gdzie D(A) jest podprzestrzenią liniową w przestrzeni Banacha E nad ciałem K, będzie operatorem liniowym. Na przestrzeni D(A) określamy tzw. normę wykresową kxkA := kxk + kAxk, x ∈ D(A). Łatwo zobaczyć, że k · kA jest normą oraz (D(A), k · kA ) jest przestrzenią Banacha wtedy i tylko wtedy, gdy A jest operatorem domkniętym (tzn. wykres Gr (A) = {(x, Ax) | x ∈ D(A)} jest domkniętą podprzestrzenią w E × E). Oczywiście odwzorowanie włożenia i : D(A) → E jest ciągłe: dla dowolnego x ∈ D(A), ki(x)k = kxk ¬ kxkA . Zauważmy dodatkowo, że jeśli A : D(A) → E jest domkniętą bijekcją, to norma kxk1 := kAxk, x ∈ D(A), jest równoważna normie k · kA . Wówczas D(A) (wraz z normą k · kA ) jest przestrzenią Banacha, zaś z twierdzenia Banacha o operatorze domkniętym wynika, że A−1 : E → E jest operatorem ciągłym, czyli kA−1 xk ¬ kA−1 kkxkA . Zatem kxk1 ¬ kxkA = kxk + kAxk ¬ kA−1 kkAxk + kAxk = (kA−1 k + 1)kxk1 . Niech A : D(A) → E będzie operatorem liniowym. Przypomnijmy, że zbiór rezolwenty ρ(A) := {λ ∈ K | A jest bijekcją oraz (A − λI) ∈ L(E)}. Jeśli λ ∈ ρ(A), to operator RA (λ) := (A − λI)−1 ∈ L(E) nazywa się rezolwentą (w punkcie λ). Wiemy już, że: • Jeśli ρ(A) 6= ∅, to A jest operatorem domkniętym; • ρ(A) jest zbiorem otwartym; • odwzorowanie RA : ρ(A) → L(E) jest ciągłe; nawet więcej: odwzorowanie to jest analityczne; jeśli µ ∈ ρ(A) i |λ − µ| < kRA (µ)k−1 , to λ ∈ ρ(A) oraz RA (λ) = ∞ X k+1 (λ)k RA (µ). k=0 • dla λ, µ ∈ ρ(A) mają miejsce związki: (a) RA (λ) − RA (µ)(I − (λ − µ)RA (λ)); (b) RA (λ) − RA (µ) = (λ − µ)RA (λ)RA (µ) = (λ − µ)RA (µ)RA (λ); (c) ARA (λ) = RA (λ)A na D(A). Niech A : D(A) → E operator liniowy. Definiujemy widmo σ(A) = K \ ρ(A) i promień spektralny: r(A) = sup |λ|, λ∈σ(A) gdy σ(A) = ∅, to r(A) = −∞. 40 1. I rozdział Wiadomo, że: • Jeśli A ∈ L(E) i K = C, to σ(A) 6= ∅; • Jeśli A ∈ L(E), to r(A) ¬ r := lim kAn k1/n = inf kAn kn ¬ kAk, n→∞ n∈N ponadto gdy |λ| > r, to λ ∈ ρ(A) oraz RA (λ) = − ∞ X λ−k Ak−1 . k=1 • jeżeli A ∈ L(E) iK = C, to r(A) = r; • jeżeli A ∈ L(E) i K = C, to dla dowolnego ε > 0 istnieje w E równoważna norma k · kε taka, że kAkε ¬ r(A) + ε. Przypuśćmy teraz, że E jest przestrzenią Banacha nad R. Niech EC := E × E będzie kompleksyfikacją E. Wówczas EC jest przestrzenią wektorową nad C z działaniami: (x, y) + (u, v) := (x + u, y + v), (a + ib)(x, y) := (ax − by, ay + bx), x, y ∈ E, a + ib ∈ C. W dalszym ciągu piszemy x + iy zamiast (x, y) ∈ EC . Zauważmy, że EC jest przestrzenią nad R i odwzorowanie j = jE : E → EC zadane wzorem j(x) = (x, 0) = x + i0 ∈ EC ; jest to injekcja. Poza tym spanC j(E) = EC . Z tego wynika w szczególności, że jeśli {ei }i∈I jest bazą E, to {j(ei )}i∈I jest bazą w EC oraz dimR E = dimC EC . Powstaje pytanie jak uczynić z EC przestrzeń unormowaną: otóż powiemy, że norma k · k∗ na EC jest naturalna, gdy kj(x)k∗ = kxk dla dowolnego x ∈ E oraz kx + iyk∗ = kx − iyk dla dowolnych x, y ∈ E. Okazuje się, że wszystkie normy naturalne na EC są równoważne; minimalną normą naturalną jest tzw. norma Taylora kx + iykC := q sup p∈E∗ , kpk¬1 hp, xi2 + hp, yi2 , x, y ∈ E. Dokładniej, dla każdej normy naturalnej k · k∗ zachodzi kx + iykC ¬ kx + iyk∗ ¬ 2kx + iykC . Łatwo sprawdzić, że rzeczywiście k · kC jest normą naturalną: dla x ∈ E kj(x)kC = q hp, xi2 = sup p∈E∗ , kpk¬1 |hp, xi| = kxk sup p∈E∗ , kpk¬1 oraz kx − iykC = sup p∈E∗ , kpk¬1 q hp, xi2 + hp, −yi2 = sup p∈E∗ , kpk¬1 q hp, xi2 + hp, yi = kx + iykC . √ Zauważmy jeszcze, że dla x, y ∈ E, max{kxk, kyk} ¬ kx+iykC oraz kx+iyk ¬ 2 max{kxk, kyk}. Z tego wynika, że (EC , k · kC ) jest przestrzenią Banacha: jeżeli (xn + iyn ) jest ciągiem Cauchy’ego, tzn. dla dowolnych n, m ∈ N, max{kxn − xm k, kyn − ym k} ¬ k(xn − xm ) + i(yn − ym )kC → 0 1.7. Operatory liniowe o zwartych lub γ-lipschitzowskich rezolwentach 41 gdy n, m → ∞. Zatem xn → x ∈ E oraz yn → y ∈ E. Zatem √ k(xn − x) + i(yn − y)kC ¬ 2 max{kxn − xk, kyn − yk} → 0 przy n → ∞. 1.7.1 Uwaga: (1) Zauważmy, że dla dowolnego p ∈ E∗ i x, y ∈ E mamy q hp, xi2 + hp, yi2 = sup | cos thp, xi + sin thp, yi| = sup |hp, (cos t)x + (sin t)y|(12 ). t∈[0,2π] t∈[0,2π] Zatem kx + iykC = = sup sup sup sup |hp, (cos t)x + (sin t)y| p∈E∗ , kpk¬1 t∈[0,2π] |hp, (cos t)x + (sin t)y| = sup k(cos t)x + (sin t)yk. t∈[0,2π] p∈E∗ , kpk¬1 t∈[0,2π] Można też łatwo pokazać, że dla z = x + iy ∈ EC , kzkC = sup kRe λzk. λ∈C, |λ|¬1 (2) Jeżeli E = H jest rzeczywistą przestrzenią Hilberta z iloczynem skalrnym h·, ·i, to – jak łatwo sprawdzić – q kx + iykC = kxk2 + kyk2 . Norma ta związana jest z iloczynem skalarnym h·, ·iC zadanym wzorem hx + iy, u + iviC := (hx, ui + hy, vi) + i(hy, ui − hx, vi), x, y, u, v ∈ E. Jak łatwo sprawdzić h·, ·iC jest istotnie zespolonym iloczynem skalarnym. 1.7.2 Stwierdzenie: Niech F będzie zespoloną przestrzenią Banacha. Istnieje wówczas rzeczywista przestrzeń Banacha E taka, że E ⊕ iE = F. Dowód: Niech E będzie rodziną takich podprzestrzeni E ⊂ F, że E ∩ iE = {0}. Rodzina taka jest niepusta, bo np. jeśli z ∈ F, x 6= 0, to E := spanR {z} := {λz | λ ∈ R} ∈ E. Rodzina E jest (częściowo) uporządkowana przez relację zawierania. Jeśli {Ej }j∈J jest łańcuchem w E, to S E := j∈J Ej ∈ E. Rzeczywiście: jeśli z ∈ E ∩ iE, to z, −iz ∈ Ej dla pewnego j ∈ J; czyli z ∈ Ej ∩ iEj i z = 0. Z lematu Kuratowskiego-Zorna w rodzinie E istnieje element maksymalny E. Twierdzę, że E ⊕ iE = F. Istotnie (z definicji rodziny E), E ∩ iE = {0}; ponadto E ⊕ iE ⊂ F. Niech z ∈ F. Przypuśćmy, że z 6∈ E + iE. Niech E0 := E ⊕ spanR {z}. Wtedy E0 ) E oraz E0 ∈ E. Rzeczywiście: przypuśćmy, że z 0 ∈ E0 ∩ iE0 , tzn. z 0 ∈ x + λz, gdzie x ∈ E oraz λ ∈ R. Z drugiej strony z 0 ∈ iE0 , czyli z 0 = iy + iµz dla pewnych y ∈ E oraz µ ∈ R. Stąd λ = iµ, a więc λ = µ = 0, oraz x = iy, a wiec −ix ∈ E oraz x ∈ E ∩ iE, czyli x = 0. Wobec tego mamy sprzeczność z maksymalnością E, To kończy dowód. Z kolei zajmiemy się kompleksyfikacją operatorów. Niech – jak poprzednio – E będzie rzeczywistą przestrzenią Banacha i A : D(A) → E operatorem liniowym. Kładziemy AC : D(AC ) → EC , gdzie D(AC ) := D(A)C , AC (x + iy) := A(x) + iA(y). 12 p Dla dowolnego x = (x1 , x2 ) ∈ R2 , kxk = x21 + x22 = supy∈R2 , kyk=1 |x1 y1 + x2 y2 |. Ponadto ogólna postać 2 y ∈ R z kyk = 1, to y = (cos t, sin t), gdzie t ∈ [0, 2π]. 42 1. I rozdział Łatwo zobaczyć, że AC jest rzeczywiście operatorem liniowym. Zauważmy, że A ∈ L(E) wtedy i tylko wtedy, gdy AC ∈ L(EC ) oraz, wówczas kAC kC = kAk. Istotnie, przypuśćmy, że A ∈ L(E). Jeśli p ∈ E∗ , kpk ¬ 1, to dla x, y ∈ E kAC (x + iy)kC = sup k(cos t)Ax + (sin t)Ayk = sup kA((cos t)x + (sin t)y)k t∈[0,2π] t∈[0,2π] ¬ kAkk(cos t)x + (sin t)yk = kAkkx + iykC . Zatem kAC kC ¬ kAk; zatem AC ∈ L(EC ). Z drugiej strony jeżeli kompleksyfikacja AC ∈ L(EC ), to dla dowolnego x ∈ E, kAxk = kj(Ax)kC = kAx + i0kC = kAC (x + i0)kC ¬ kAC kC kx + i0kC = kAC kC kxk, a więc A ∈ L(E) i kAk ¬ kAC kC . Niech A : D(A) → E będzie operatorem liniowym. Widać natychmiast, że N (AC ) := {z ∈ EC | AC z = 0} = N (A)C oraz R(AC ) := {AC z | z ∈ D(AC )} = R(A)C . W szczególności A jest bijekcją wtedy i tylko wtedy, gdy bijekcją jest AC . Zauważmy jeszcze, że gdy A jest bijekcją, to (A−1 )C = (AC )−1 . Istotnie: dla dowolnego u + iv ∈ EC , (A−1 )C (u + iv) = A−1 u + iA−1 v oraz niech (AC )−1 (u + iv) = x + iy, tzn. u + iv = AC (x + iy) = Ax + iAy czyli u = Ax, v = Ay oraz A−1 u = x oraz A−1 v = y. Tak więc (A−1 )C (u + iv) = (AC )−1 (u + iv). Jest jasne, że IC = IEC (13 ); jeśli B : D(B) → E, to A + B : D(A) ∩ D(B) → E oraz (A+B)C = AC +BC oraz dla każdego λ ∈ R, (λA)C = λAC . W szczególności (A−λI)C = AC −λI dla dowolnego λ ∈ R. Niech A : D(A) → E będzie operatorem liniowym określonym w rzeczywistej przestrzeni Banacha E. Określiliśmy już zbiór rezolwenty ρ(A) ⊂ R i σ(A) := R \ ρ(A). Można też rozważać zespolony zbiór rezolwenty ρC (A) := {λ ∈ C | AC − λI : D(AC ) → EC jest bijekcją i (AC − λI)−1 ∈ L(EC )} oraz widmo zespolone σC (A) = C \ ρC (A). Tak więc ρC (A) = ρ(AC ) oraz σC (A) = σ(AC ). Jednak – ze względów wygody i tradycji – piszemy ρR (A) i σR (A) w miejsce ρ(A) i σ(A) oraz ρ(A) i σ(A) w miejsce ρC (A) i σC (A). Ponadto, dla λ ∈ ρ(A) piszemy RA (λ) := (AC − λI)−1 ∈ L(EC ). Podobnie – biorąc pod uwagę rozkład spektrum na spektrum punktowe, ciągłe i residualne – mamy (przy przyjętej notacji) σ(A) = σp (A) ∪ σc (A) ∪ σr (A). Tak więc: • σp (A) = {λ ∈ C | AC − λI nie jest injekcją}; • σc (A) = {λ ∈ C | N (AC − λI) = {0}, R(AC − λI) ( E jest gęsty}; • σr (A) = σ(A) \ (σp (A) ∪ σc (A)) = {λ ∈ C | N (AC − λI) = {0}, R(AC − λI) nie jest gęsty}. Warto zauważyć, że gdy λ = α+iβ ∈ σp (A), tzn. gdy λ jest zespoloną wartością własną, to istnieje 13 W dalszym identyczność (bez względu na to czy określoną na E, czy też na EC ) oznaczamy symbolem I. 1.8. Operatory na stożkach 43 wektor z = x + iy ∈ EC , tzw. zespolony wektor własny lub uogólniony wektor własny operatora A (a w zasadzie operatora AC ) odpowiadający wartości własnej λ, taki, że AC (z) = λz. A więc (αx − βy) + i(βx + αy) = AC (x + iy) = Ax + iAy, czyli Ax = αx − βy oraz Ay = βx + αy, czyli nie ma mowy o wektorach własnych. Zwróćmy jeszcze uwagę, że jeśli z = x + iy jest uogólnionym wektorem własnym operatora A odpowiadającym wartości własnej λ = α + iβ , to sprzężenie z̄ := x − iy jest uogólnionym wektorem własnym odpowiadającym wartości własnej λ̄ = α − iβ. Rzeczywiście AC (z̄) = AC (x − iy) = Ax − iAy = (αx − βy) − i(βx + αx) = (α − iβ)(x − iy) = λ̄z̄. Tak więc zespolone (uogólnione) wartości własne operatora A „chodzą parami”. Tak czy inaczej, gdy mowa o teorii spektralnej dla operatorów liniowych określonych w rzeczywistej przestrzeni Banacha, to wskazana jest ostrożność jeśli chodzi o terminologię i notację: trzeba się zawsze chwile zastanowić o co chodzi. Opiszemy teraz związki pomiędzy ρ(A), σ(A) oraz ρR (A) i σR (A), odpowiednio. Otóż ρR (A) = ρ(A) ∩ R = {λ ∈ ρ(A) | λ ∈ R}; σR (A) = σ(A) ∩ R. Istotnie: jeśli λ ∈ ρR (A), to λ ∈ R, A − λI jest bijekcją i (A − λI)−1 ∈ L(E). Wobec tego (A − λI)C = AC − λI jest bijekcją; ponadto ((A − λI)−1 )C = ((A − λI)C )−1 = (AC − λI)−1 , czyli (AC − λI)−1 jest kompleksyfikacją operatora ograniczonego A − λI, jest więc operatorem ograniczonym. Dowodzi to, że λ ∈ ρ(A)∩R. Na odwrót jeśli λ ∈ ρ(A)∩R, to – oczywiście – λ ∈ R i AC − λI jest bijekcją; zatem A − λI jest też bijekcją. Ponadto (AC − λI)−1 = ((A − λI)−1 )C ∈ L(EC ), czyli również A − λI ∈ L(E). Stąd λ ∈ ρR (A). Druga równość natychmiastową konsekwencją pierwszej. Podobnie można pokazać, że σp (A) ∩ R składa się z (rzeczywistych) wartości własnych operatora, którym odpowiadają (rzeczywiste, czyli „prawdziwe”) wektory własne operatora A (zbiór takich wartości własnych oznaczamy σp,R (A)). Istotnie: niech λ ∈ σp (A) ∩ R. Zatem istnieje z ∈ N (AC − λI) = N (A − λI)C , z = x + iy 6= 0. Oznacza to, że λz = λx + iλy = AC (x + iy) = Ax + iAy. Stąd λx = Ax oraz λy = Ay. Na odwrót jeśli λ ∈ R jest wartością własną A o wektorze własnym x ∈ E (tzn. λ ∈ σp,R (A), a więc Ax = λx), to λ ∈ σp (A), bowiem AC (x + i0) = Ax + i0 = λx + i0 = λ(x + i0). Rozważania w poprzednim rozdziale dotyczyły przestrzeni Banacha nad K = R lub K = C i operatorów A ∈ L(E) (o dodatkowych własnościach dotyczących kAkγ ) , tzn. zbiory ρ(A) i σ(A) oznaczały zbiór rezolwenty i widmo, odpowiednio, w sensie rozważanego ciała 1.8 Operatory na stożkach 1.9 Zwartość w niektórych przestrzeniach 1.10 1.10.A Twierdzenie Ekelanda i jego warianty Funkcja półciągłe i problem minimizacji Rzecz dotyczy problemów minimizacji funkcji. Przypuśćmy, że zadana jest funkcja f : X → R, gdzie X jest pewnym zbiorem (przestrzenią) oraz zbiór K ⊂ X. Problem minimizacji polega 44 1. I rozdział na odpowiedzi na pytanie czy istnieje x̄ ∈ K taki, że f (x̄) ¬ f (x) dla dowolnego x ∈ K, tzn. rozwiązanie problemu ( (i) x̄ ∈ K; (ii) f (x̄) = inf x∈K f (x). W rozważaniu tego problemu czasem warto wprowadzić tzw. indykatrysę zbioru K, tzn. funkcję ψK : X → R̄ := R ∪ {±∞} daną wzorem ( ψK (x) := 0 gdy x ∈ K; +∞ gdy x 6∈ K. Kładąc fK := f + ψK możemy zapisać problem minimizacji następująco: fK (x̄) = inf fK (x). x∈X Taki zabieg pozwala na rozważanie zagadnienia minimizacji funkcji f : X → R̄ z „pominięciem” zbioru K. Nadwykresem funkcji f : X → R̄ nazywamy zbiór Ep(f ) := {(x, λ) ∈ X × R | f (x) ¬ λ}. Oczywiście nadwykres Ep(f ) 6= ∅ wtedy i tylko wtedy, gdy funkcja f jest właściwa w następującym sensie: jego dziedzina efektywna Dom(f ) := {x ∈ X | f (x) < +∞} 6= ∅. Zawsze będziemy zajmować się funkcjami właściwymi. 1.10.1 Stwierdzenie: Rozważmy rodzinę {fi : X → R̄}i∈I . Wówczas Ep(sup f ) = i∈I \ Ep(fi ). i∈I Zbiorem Lebesgue’a (lub podpoziomicą funkcji f : X → R̄ na poziomie λ ∈ R nazywamy zbiór f λ := {x ∈ X | f (x) ¬ λ}. Oczywiście f λ = {x ∈ X | (x, λ) ∈ Ep(f )}. Niech α := inf x∈X f (x). Wówczas zbiór M rozwiązań problemu minimizacji M := {x ∈ X | f (x) = α} = \ f λ. λ>α Warto zauważyć, że zbiór M dziedziczy wiele własności podpoziomic; np. domkniętość, zwartość, wypukłość itp.). Wynika to z tego, że rodzina {f λ }λ∈R jest wstępująca: jeżeli λ ¬ µ, to f λ ⊂ f µ . 1.10.2 Stwierdzenie: Rozważmy rodzinę {fi : X → R̄}i∈I . Wówczas (sup fi )λ = i∈I \ fiλ . i∈I Przedmiotem naszego zainteresowania będą funkcje półciągłe z dołu. Niech X będzie przestrzenią topologiczną (lub – metryczną). Niech x0 ∈ X. Mówimy, że f jest półciągła z dołu w 1.10. Twierdzenie Ekelanda i jego warianty 45 punkcie x0 jeśli dla dowolnego λ < f (x0 ) istnieje otoczenie V punktu x0 takie, że f (x) > λ dla dowolnego x ∈ V . Funkcję, która jest półciągła w dowolnym punkcie x ∈ X, nazywamy półciągłą. Scharakteryzujemy półciągłość. Przypomnijmy, że jeśli x0 ∈ X jest punktem skupienia, gdy dla dowolnego otoczenia U ∈ N(x0 ) (tzn. dla dowolnego otoczenia punktu x0 ), U zawiera punkty różne od x0 . Definiujemy lim inf f (x) := x→x0 sup inf U ∈N(x0 ) x∈U, x6=x0 f (x). 1.10.3 Stwierdzenie: Funkcja f : X → R̄ jest półciągła z dołu w punkcie skupienia x0 ∈ X wtedy i tylko wtedy, gdy f (x0 ) ¬ lim inf f (x). x→x0 Dowód: Załóżmy, że f jest półciągła z dołu w x0 . Dla dowolnego λ > f (x0 ) istnieje wtedy otoczenie V ∈ N(x0 ) takie, że f (x) > λ dla x ∈ V . Zatem f (x0 ) ¬ inf x∈V, x6=x0 f (x) ¬ sup inf U ∈N(x0 ) x∈U, x6=x0 f (x) = lim inf f (x). x→x0 Z drugiej strony przypuśćmy, że f (x0 ) ¬ lim inf x→x0 f (x) i niech λ < f (x0 ). Z definicji kresu górnego istnieje wtedy takie U ∈ N(x0 ), że inf x∈U, x6=x0 f (x) > λ. Oznacza to, że dla każdego x ∈ U , x 6= x0 , f (x) > λ; a więc i dla każdego x ∈ U , f (x) > λ. . 1.10.4 Stwierdzenie: Niech f : X → R̄. Następujące warunki są równoważne: (i) f jest półciągła z dołu; (ii) dla każdego λ ∈ R, f λ jest zbiorem domkniętym; (iii) nadwykres Ep(f ) jest domknięty. Dowód: (i) ⇒ (ii). Dla każdego λ ∈ R, zbiór {x ∈ X | f (x) > λ} jest otwarty. Czyli f λ = X \ {x ∈ X | f (x) > λ} jest domknięty. (ii) ⇒ (iii). Niech (x, λ) 6∈ Ep(f ). Zatem f (x) > λ. Istnieje ε > 0 takie, że f (x) > λ + ε. Zauważmy, że {y ∈ X | f (y) > λ + ε} × (−∞λ + ε) jest otoczeniem (x, λ) nie mającym punktów wspólnych z Ep(f ). Zatem dopełnienie Ep(f ) jest otwarte. (iii) ⇒ (i). Niech x ∈ X i f (x) > λ, tzn. (x, λ) 6∈ Ep(f ). Domkniętość Ep(f ) oznacza, że istnieje otoczenie U punktu x oraz ε > 0 takie, że U × (λ − ε), λ + ε) ∩ Ep(f ) = ∅. Oczywiście dla y ∈ U , f (y) > λ. 1.10.5 Wniosek: Zbiór K ⊂ X jest domknięty wtedy i tylko wtedy, gdy jego indykatrysa ψK jest półciągła z dołu. 1.10.6 Uwaga: Jeżeli funkcja f : X → R̄ jest półciągła z dołu, to również jej obcięcie f |Dom(f ) jest półciągła z dołu. Odwrotne stwierdzenie nie jest prawdziwe. 1.10.7 Stwierdzenie: Załóżmy, że funkcje f, g, fi : X → R̄, i ∈ I, są półciągłe z dołu. Wtedy funkcje f + g, αf , gdzie α 0, oraz supi∈I fi są półciągłe z dołu. Jeśli Y jest przestrzenią topologiczną, h : Y → X jest odwzorowaniem ciągły, to złożenie f ◦ h : Y → R̄ jest półciągła z dołu. Mówimy, że f : X → R̄ jest półzwarta z dołu jeżeli dla dowolnego λ ∈ R podpoziomica f λ jest zbiorem zwartym. 1.10.8 Twierdzenie: Jeżeli funkcja właściwa f : X → R ∪ {+∞} jest półciągła i półzwarta 46 1. I rozdział z dołu, to jest ograniczona z dołu i zbiór M := {x ∈ X | f (x) = inf y∈X f (y)} jest niepusty i zwarty. Dowód: Niech α := inf x∈X f (x) −∞. Niech λn → α, λn 6= α, będzie ciągiem malejącym. Dla T dowolnego n ∈ N, f λn jest zbiorem zwartym. Zatem zbiór N = n∈N f λn jest niepusty i zwarty. Oczywiście M ⊂ N . Pokażemy, że N ⊂ M . Jeśli x ∈ N , to α ¬ f (x) ¬ λn dla dowolnego n. Zatem f (x) = α. Zatem N = M i α > ∞. 1.10.9 Wniosek: Jeśli X jest przestrzenią zwartą, f : X → R ∪ {+∞} jest właściwa i półciągła z dołu, f jest ograniczona z dołu i problem minimizacji ma rozwiązanie. 1.10.10 Stwierdzenie: Niech g : X × Y → R ∪ {+∞}, gdzie Y jest przestrzenią zwartą, będzie funkcją półciągłą z dołu. Wtedy funkcja f : X → R ∪ {+∞} dana wzorem f (x) = inf g(x, y), x ∈ X, y∈Y jest poprawnie określona i półciągła z dołu. Dowód: Można założyć, ze g jest funkcją właściwą; w przeciwnym razie g(x, y) ≡ +∞ oraz f (x) ≡ +∞ dla dowolnych x ∈ X i y ∈ Y . Z poprzedniego wniosku f jest poprawnie określona (w tym miejscu trzeba zauważyć, że dla dowolnego x ∈ X, funkcja g(x, ·) jest półciągła i właściwa). Niech λ ∈ R i niech f (x0 ) > λ. Zatem, dla każdego y ∈ Y , g(x0 , y) > λ + ε dla pewnego ε > 0 takiego, że f (x0 ) > λ + ε. Wobec tego dla dowolnego y ∈ Y istnieją otoczenia Uy punktu x0 oraz Vy punktu y takie, że g(x, z) > λ + ε, o ile x ∈ Uy i z ∈ Vy . Zwartość Y implikuje, że istnieją T punktu y1 , ..., yn ∈ Y takie, że Y = Vy1 ∪ Vy2 ∪ ... ∪ Vyn . Niech U := ni=1 Uyi . Jeśli y ∈ Y i x ∈ U , to y ∈ Vyj i x ∈ Uyj dla pewnego j = 1, ..., n. Wobec tego g(x, y) > λ + ε. Zatem, dla x ∈ U , f (x) = inf y∈Y g(x, y) λ + ε > λ. 1.10.B Zasada Ekelanda Udowodnimy teraz centralne twierdzenie tego rozdziału. 1.10.11 Twierdzenie: Niech (X, d) będzie zupełną przestrzenią metryczna, f : X → R∪{+∞} właściwą, ograniczoną z dołu funkcją półciągłą z dołu. Jeśli x0 ∈ Dom(f ) i ε > 0. Istnieje wówczas punkt x̄ ∈ X taki, że: (i) f (x̄) + εd(x0 , x̄) ¬ f (x0 ); (ii) dla każdego x 6= x̄, f (x̄) < f (x) + εd(x, x̄). Zanim podam dowód odnotujmy następujący wniosek, w którym pojawia się uprecyzyjnienie tezy. 1.10.12 Wniosek: Przy założeniach twierdzenia, dla dowolnych ε, λ > 0 oraz x0 ∈ X takiego, że f (x0 ) ¬ inf x∈X f (x) + ελ, istnieje x̄ ∈ X takie, że: (j) f (x̄) ¬ f (x0 ); (jj) d(x̄, x0 ) ¬ λ; (jjj) dla dowolnego x ∈ X, f (x̄) ¬ f (x) + εd(x̄, x). Dowód (wniosku): Nierówność (j) wynika bezpośrednio z nierówności (i). Jeśli chodzi o (jj), to −∞ < inf x∈X f (x) ¬ f (x̄) ¬ f (x0 ) ¬ inf x∈X f (x) + ελ. Zatem, z (ii), εd(x̄, x0 ) ¬ f (x0 ) − f (x̄) ¬ ελ. Czyli d(x̄, x0 ) ¬ λ. Ostatnia nierówność wynika z (ii). 1.10.13 Uwaga: Korzystnie jest podać interpretację geometryczną zasady Ekelanda. Niech X = 1.10. Twierdzenie Ekelanda i jego warianty 47 E będzie przestrzenią Banacha i rozważmy zbiór C := {(x, a) ∈ X × R | a ¬ −εkxk}. Jest to stożek o wierzchołku z (0, 0) „skierowany” ku dołowi. Jeśli weźmiemy punkt (x̄, f (x̄)) oraz przesuniemy ten stożek do tego punktu, to otrzymamy C + (x̄, f (x̄)) = {(x, a) ∈ X × R | a − f (x̄) ¬ −εkx − x̄k}. Tak więc nierówność (jjj) (f (x̄) ¬ f (x) + εkx − x̄k dla każdego x ∈ X) oznacza, że f (x) − f (x̄) −εkx − x̄k co, z kolei oznacza, że punkt (x, f (x)) leży nad stożkiem C + (x̄, f (x̄)). Innym słowy wykres funkcji leży nad tym stożkiem. Należy zauważyć, że liczby ε i λ można dobrać dowolnie. na przykład wystartowawszy od √ pewnego η > 0 można wziąć ε = λ = η i wtedy mamy: punkt x0 ∈ Dom(f ) taki, że f (x0 ) ¬ √ √ inf x∈X f (x) + η, x̄ ∈ Dom(f ) taki, że d(x̄, x0 ) ¬ η i f (x̄) ¬ f (x) + ηd(x̄, x) dla każdego x ∈ X. Dowód (twierdzenia): Dla uproszczenia zapisu i bez utraty ogólności można przyjąć, że ε = 1. Zdefiniujmy przekształcenie wielowartosciowe F : X ( X dane wzorem F (x) := {y ∈ X | f (y) + d(y, x) ¬ f (x)}, x ∈ X. Jest ono poprawnie zdefiniowane, tzn. F (x) 6= ∅, bo x ∈ F (x). Ponadto F (x) jest zbiorem domkniętym: gdy yn ∈ F (x) oraz yn → y ∈ X, to f (yn ) + d(yn , x) ¬ f (x); zatem f (y) + d(y, x) ¬ lim inf n→∞ (f (yn ) + d(yn , x)) ¬ f (x). Dodatkowo zauważmy, że dla dowolnego x ∈ X, jeżeli y ∈ F (x), to F (y) ⊂ F (x). Istotnie, gdy f (x) = +∞, to F (x) = X. Przypuśćmy więc, że f (x) < +∞. Skoro y ∈ F (x), to f (y) + d(y, x) ¬ f (x). Niech z ∈ F (y). Wtedy f (z) + d(z, y) ¬ f (y). W takim razie f (z) + d(z, x) ¬ f (z) + d(z, y) + d(y, x) ¬ f (y) + d(y, x) ¬ f (x) i, stąd, z ∈ F (x). Rozważmy funkcję v : Dom(f ) → R daną wzorem v(x) := inf f (y), x ∈ Dom(f ). y∈F (x) Jest jasne, że v jest poprawnie określona oraz dla każdego x ∈ Dom(f ) i y ∈ F (x), v(x)+d(y, x) ¬ f (y) + d(y, x) ¬ f (x), czyli d(x, y) ¬ f (x) − v(x). W takim razie dla każdego x ∈ Dom(f ), diam F (x) = sup d(y, y 0 ) ¬ d(y, x) + d(y 0 , x) ¬ 2(f (x) − v(x)). y,y 0 ∈F (x) Zdefniujemy pewien ciąg (xn )∞ n=0 . Punkt x0 już jest. Przypuśćmy, że punkt xn ∈ Dom(f ), n 0, został zdefiniowany i wybierzmy xn+1 ∈ F (xn ) tak, by f (xn+1 ) ¬ v(xn ) + 2−n ; taki wybór jest możliwy z definicji kresu dolnego. Wtedy xn+1 ∈ Dom(f ). Poza tym F (xn+1 ) ⊂ F (xn ), a więc v(xn ) ¬ v(xn+1 ) (kres po mniejszym zbiorze jest niemniejszy niż kres po zbiorze większym). Z drugiej strony mamy zawsze v(x) ¬ f (x), czyli w szczególności v(xn+1 ¬ f (xn+1 ) ¬ v(xn ) + 2−n ¬ v(xn+1 ) + 2−n . Dowodzi to, że 0 ¬ f (xn+1 ) − v(xn+1 ) ¬ 2−n ; 48 1. I rozdział czyli diam F (xn+1 ) ¬ 2−n . Mamy więc zstepującą rodzinę {F (xn )}∞ n=0 zbiorów domknietych, których średnice dążą do zera. Z twierdzenia Cantora istnieje x̄ ∈ X taki, że {x̄} = ∞ \ F (xn ). n=0 Mamy więc x̄ ∈ F (x0 ) czyli f (x̄) + d(x̄, x0 ) ¬ f (x0 ) (tzn. nierówność (i)). Ponadto dla każdego T n ∈ N, x̄ ∈ F (xn ); stąd F (x̄) ⊂ F (xn ), czyli F (x̄) ⊂ ∞ n=0 F (xn ) = {x̄} i F (x̄) = {x̄}. Oznacza to, że dla x ∈ X, x 6= x̄, x 6∈ F (x̄), czyli f (x) + d(x, x̄) > f (x̄) co jest nierównością (ii). Odnotujmy jeszcze jeden wniosek. Punkt x0 ∈ X taki, że f (x0 ) ¬ inf x∈X f (x) + ε można zawsze znaleźć. A więc: 1.10.14 Wniosek: Jeśli (X, d) jest przestrzenią metryczną zupełną, f : X → R∪{+∞} funkcją właściwą półciągła i ograniczoną z dołu, to dla dowolnego ε > 0 istnieje x̄ ∈ X takie, że f (x̄) ¬ inf x∈X f (x) + ε oraz f (x̄) ¬ f (x) + εd(x̄, x) dla dowolnego x ∈ X. Twierdzenie 1.10.11 wniosek 1.10.12 są istotnie silniejsze niż Wniosek 1.10.14, gdyż podana jest tam lokalizacja punktu x̄. Ma też miejsce lokalna wersja tego faktu. Będziemy najpierw potrzebować pewnej definicji. Niech E będzie przestrzenią Banacha i f : E → R ∪ {+∞} funkcją właściwą. Mówimy, że f jest ε-podparta w punkcie x ∈ E, gdzie ε > 0, jeśli istnieje funkcjonał px ∈ E∗ oraz η > 0 takie, że dla dowolnego y ∈ D(x, η), f (x) − f (y) ¬ hx − y, px i + εkx − yk (lub, równoważnie f (x) + hy − x, px i ¬ f (y) + εkx − yk). 1.10.15 Uwaga: Tę definicję należy kojarzyć z pojęciem różniczkowalności. Przypomnijmy, że funkcja f : E → R jest różniczkowalna w x ∈ E, jeśli istnieje forma px ∈ E∗ taka, że dla dowolnego y ∈ E, f (y) − f (x) = hy − x, px i + ε(y)ky − xk, gdzie ε(y) → 0, gdy y → x. Można wyakzać, ze jeśli funkcje f i −f są ε-podparte w punkcie x dla dowolnego ε > 0, f jest różniczkowalna. 1.10.16 Twierdzenie: Niech E będzie przestrzenią Banacha i niech ϕ : E → R będzie różniczkowalna oraz ϕ(0) > 0 i ϕ(x) ¬ 0 dla kxk 1. Jeśli f : E → R ∪ {+∞} jest dolnie półciągła, to dla każdego ε > 0, zbiór punktów x ∈ E, w których f jest ε-podparta jest gęsty w Dom(f ). Dowód: Wybierzmy x0 ∈ Dom(f ), ε > 0 i dowolne r > 0. Mamy znaleźć punkt x ∈ B(x0 , r), w którym f jest ε-podparta. Ponieważ f jest dolnie półciągła, to można zakładać, że r jest na tyle małe, że f jest ograniczona z dołu na kuli D(x0 , r). Niech 1 ψ(x) := , x ∈ E. max{0, ϕ((x − x0 )/r)} Dalszy dowód... Powiemy, że funkcja f : E → R jest słabo różniczkowalna w punkcie x ∈ E, jeżeli istnieje px ∈ E takie, że dla dowolnego v ∈ E. f (x + tv) − f (x) . t→0 t hv, px i = lim Nietrudno sprawdzić, że jeżeli f jest różniczkowalne (w podanym wyżej sensie), to jest słabo różniczkowalna. Funkcjonał px jest wtedy wyznaczony jednoznacznie i oznacza sie go symbolem f 0 (x) i nazywa słabą pochodną. 1.10.17 Wniosek: Załóżmy, że f : E → R jest półciągła i ograniczona z dołu funkcja słabo 1.10. Twierdzenie Ekelanda i jego warianty 49 różniczkowalna. Jeśli x0 ∈ E, f (x0 ) ¬ inf x∈E f (x), ε > 0, to istnieje x̄ ∈ E taki, że f (x̄) ¬ f (x0 ), kx̄ − x0 k ¬ 1 oraz kf 0 (x̄)k ¬ ε. Dowód: Wybierzmy v ∈ E, kvk = 1. Dla x = x̄ + tv 6= x̄, gdzie t > 0 mamy f (x) − f (x̄) > −tε. Czyli f (x̄ + tv) − f (x̄) hv, f 0 (x̄)i = lim −ε. t t→0+ Analogicznie, dla wektora −v: −hv, f 0 (x̄)i −ε, co oznacza, że −ε ¬ hv, f 0 (x̄)i ¬ ε dla dowolnego v ∈ E z kvk = 1; zatem |hv, f 0 (x̄)i| ¬ ε. W takim razie kf 0 (x̄)k = sup |hv, f 0 (x̄)i| ¬ ε. v∈E, kvk=1 W konsekwencji: 1.10.18 Wniosek: Przy powyższych założeniach, istnieje ciąg (xn ) taki, że f (xn ) → inf x∈E f (x) oraz f 0 (xn ) → 0 w E∗ . Jeśli więc funkcjonał f : E → R jest różniczkowalny w słabym sensie, półciągły i ograniczony z dołu i spełnia warunek Palais-Smale’a: dowolny ciąg (xn ) ⊂ E taki, że (f (xn )) jest ograniczony i f 0 (xn ) → 0, ma punkt skupienia, to istnieje x̄ ∈ E taki, że f (x̄) = inf x∈E f (x) oraz f 0 (x̄) = 0. 1.10.C Twierdzenia o punkcie stałym Sformułujemy w tym miejscu twierdzenie Caristi o punkcie stałym. 1.10.19 Twierdzenie (Caristi): Niech (X, d) będzie przestrzenią metryczną zupełną, e : X → R ∪ {+∞} właściwą dolnie półciągłą funkcją ograniczoną z dołu, zaś F : X → X odwzorowaniem takim, że dla dowolnego x ∈ X d(x, F (x)) ¬ e(x) − e(f (x)). Wtedy F posiada punkt stały. Dowód: Z Wniosku 1.10.14 dla funkcji e oraz ε + 1/2 otrzymamy, że istnieje x̄ ∈ X takie, ze dla dowolnego y ∈ X, e(x̄) ¬ e(y) + 1/2d(x̄, y). W szczególności zachodzi to dla y = f (x̄), tzn. e(x̄) ¬ e(f (x̄)) + 1/2d(f (x̄), x̄). Z drugiej strony d(x̄, f (x̄)) ¬ e(x̄) − e(f (x̄)) ¬ 1/2d(x̄, f (x̄)), co oznacza, że d(x̄, f (x̄)) = 0, tzn. f (x̄) = x̄. 1.10.20 Uwaga: Najlepiej interpretować ten rezultat w kontekście układów dynamicznych. Mianowicie mamy układ xn+1 = f (xn ), x0 ∈ X. Funkcja e jest entropią tego układu oraz e(xn ) e(xn+1 ). Innymi słowy entropia zanika, aż system się ustabilizuje w punkcie równowagi x̄. 50 1. I rozdział Podany rezultat ma odniesienie w teorii punktów stałych dla odwzorowań wielowartościowych (dowód – analogiczny). 1.10.21 Wniosek: Przypuśćmy, że G : X ( X, gdzie X jest zupełną przestrzenią metryczną, jest odwzorowaniem wielowartościowyn, G(x) 6= ∅ dla każdego x ∈ X. Jeżeli e : X → R ∪ {+∞} jest właściwą dolnie półciągłą funkcją ograniczoną z dołu oraz dla dowolnego x ∈ X istnieje y ∈ G(x) takie, że d(x, y) ¬ e(x) − e(y), to G ma punkt stały, tzn. istnieje takie x̄ ∈ X, że x̄ ∈ G(x̄). 1.10.22 Stwierdzenie: Niech X będzie przestrzenią zupełną, G : X ( X odwzorowanie wielowartościowe o domkniętym wykresie Gr (G) := {(x, y) ∈ X × X | y ∈ G(x)}. Jeśli istnieje właściwa funkcja e : X → R ∪ {+∞} ograniczoną z dołu oraz dla dowolnego x ∈ X istnieje y ∈ G(x) takie, że d(x, y) ¬ e(x) − e(y), to G ma punkt stały. Dowód: Ustalmy x0 ∈ Dom(f ) oraz ciąg xn+1 ∈ G(xn ) taki, że d(xn+1 , xn ) ¬ e(xn ) − e(xn+1 ). Jest to możliwe w świetle założenia. Zauważmy, że ciąg (f (xn )) jest nierosnący i ograniczony z dołu, czyli α := limn→∞ f (xn ) istnieje. Z konstrukcji ciągu (xn ) wynika, że d(xn , xm ) ¬ m−1 X d(xk , xk+1 ) ¬ e(xn ) − e(xm ) → 0, k=n gdy n < m → ∞. Dowodzi to, że ciąg (xn ) jest Cauchy’ego i istnieje x̄ = limn→∞ xn . Oczywiście xn+1 ∈ G(xn ), czyli (xn , xn+1 ) ∈ Gr (G) oraz (xn , xn+1 ) → (x̄, x̄) ∈ Gr (G), czyli x̄ ∈ G(x̄). Odnotujmy jeszcze twierdzenie Clarke’a o tzw. kierunkowej kontrakcji. 1.10.23 Twierdzenie: Niech X będzie przestrzenią metryczną zupełną, zaś X domkniętym wypukłym podzbiorem przestrzeni Banacha E. Niech T : X → X będzie odwzorowaniem ciągłym i takim, że dla pewnego k ∈ [0, 1) i dla dowolnego x ∈ X istnieje t ∈ (0, 1] takie, że kT (xt ) − T (x)k ¬ ktkxt − xk, gdzie xt := tT (x) + (1 − t)x. Wtedy T ma punkt stały. Dowód: Niech f (x) := kx − T (x)k oraz 0 < ε < 1 − k. Oczywiście f jest funkcją ciągłą i ograniczoną z dołu. Z wniosku 1.10.14 wynika istnienie x̄ ∈ X takiego, że f (x̄) ¬ f (y) + εky − x̄k dla dowolnego y ∈ X. Niech y := x̄t (gdzie t ∈ (0, 1] dobrano do x̄ jak w założeniach). Mamy więc f (x̄) = kx̄ − T (x̄)k ¬ kx̄t − T (x̄t )k + εkx̄ − x̄t k ¬ kx̄t − T (x̄)k + kT (x̄) − T (x̄t )k + εkx̄ − x̄t k ¬ kx̄t − T (x̄)k + ktkT (x̄) − x̄k + εtkT (x̄) − x̄k = kx̄t − T (x̄)k + t(ε + k)kT (x̄) − x̄k. Z drugiej strony x̄t należy do odcinka [x̄, T (x̄)] i, stąd, kx̄ − T (x̄)k = kx̄ − x̄t k + kx̄t − T (x̄)k = tkT (x̄) − x̄k + kbarxt − T (x̄)k. Wobec tego tkT (x̄) − x̄k ¬ t(k + ε)kT (x̄) − x̄k, co dowodzi, że T (x̄) = x̄, bo t > 0. . Poniżej podamy jeszcze inne zastosowanie zasady Ekelanda: tzw. twierdzenie Daneša o zrzucie. 1.10.24 Twierdzenie: Niech K będzie domkniętym podzbiorem przestrzeni Banacha E, y0 ∈ E oraz d(y0 , K) > r > 0. Załóżmy, że F : K → K będzie funkcją taką, że F (x) ∈ K ∩ 1.10. Twierdzenie Ekelanda i jego warianty 51 conv (x, D(y0 , r)) dla x ∈ K. Wtedy, dla dowolnego x0 ∈ K, funkcja F ma punkt stały w K ∩ conv (x0 , D(y0 , r)). Dowód: Bez zmniejszenia ogólności można założyć, że y0 = 0. Wybierzmy x0 ∈ K; wtedy ρ := kx0 k R := d(0, K). Niech X := K ∩ conv (x0 , D(0, r)). Oczywiście F : X → X. Jeśli y ∈ X, to y ∈ conv (x0 , D(0, r)) a więc kyk ¬ ρ oraz F (y) ∈ conv (y, D(0, r)); zatem istnieje punkt x ∈ D(0, r) taki, że F (y) = (1 − t)y + tx oraz kF (y)k ¬ (1 − t)kyk + tkxk czyli t(kyk − kxk) ¬ kyk − kF (y)k, a więc, skoro y ∈ K, kyk R oraz kyk − kxk R − r, otrzymujemy, że t¬ kyk − kF (y)k . R−r W taki razie ky − F (y)k = tky − xk ¬ t(kyk + kxk) ¬ t(ρ + r) ¬ Kładąc e(y) := ρ+r (kyk − kF (y)k). R−r ρ+r kyk, R−r widzimy, że e jest funkcją ciągłą oraz ky − F (y)k ¬ e(y) − e(F (y)). Z twierdzenia Caristi F ma punkt stały. 1.10.25 Wniosek: (Daneša o zrzucie) Niech K będzie zbiorem domkniętym w przestrzeni Banacha E, y0 ∈ E oraz d(y0 , K) > r > 0. Wtedy, dla dowolnego ρ > d(y0 , K) istnieje punkt z0 ∈ ∂K taki, że ky0 − z0 k ¬ ρ oraz K ∩ conv (z0 , D(y0 , r)) = {z0 }. Dowód: Niech K 0 := K ∩ D(y0 , ρ). Oczywiście K 0 jest zbiorem domkniętym. Dla dowolnego x ∈ K 0 , wybierzmy F (x) ∈ K 0 ∩ conv (x, D(y0 , r)) = K ∩ conv (x, D(y0 , r)) tak aby F (x) 6= x jeśli K ∩conv (x, D(y0 , r)) 6= {x}. Z powyższego twierdzenia F posiada punkt stały z0 . Oczywiście {z0 } = K ∩ conv (z0 , D(y0 , r)) oraz z0 ∈ ∂K. 1.10.D Nieliniowe półgrupy 1.10.26 Twierdzenie (Browdera-Brezisa): Niech (X, ) będzie zbiorem częściowo uporządkowanym, w którym każdy liniowo uporządkowany ciąg ma minorantę, tzn. dla ciągu (xn ) ⊂ X, jeśli xn xn+1 dla dowolnego n ∈ N, to istnieje y ∈ X taki, że xn y dla dowolnego n ∈ N. Niech ϕ : X → R ∪ {+∞} będzie funkcją niemalejąca i ograniczoną z dołu, tzn. jeśli x y, to ϕ(x) ϕ(y) oraz istnieje c ∈ R, ϕ(x) C dla dowolnego x ∈ X. Wówczas istnieje y ∈ X taki, że jeżeli y z, ϕ(y) = ϕ(z). Dowód: Ustalmy dowolny x0 ∈ X. Przypuśćmy, że skonstruowaliśmy już xn , n 0. Jeśli xn ma własność, o której mowa w tezie twierdzenia, to już kończymy dowód. Jeśli nie, to istnieje 52 1. I rozdział xn+1 ∈ X takie, że: 1 ϕ(xn ) − inf ϕ(x) . ∈ Sn := {x ∈ X | xn x}, ϕ(xn+1 ) − inf ϕ(x) ¬ x∈Sn x∈Sn 2 xn+1 Z założenia znajdziemy punkt y będący minorantą dla ciągu (xn ). Ciąg (ϕ(xn )) jest nierosnący i ograniczony z dołu: ϕ(xn ) ϕ(y); ma więc granicę limn→∞ ϕ(xn ) ϕ(y). Skonstruowany y ma własność występującą w tezie. Przypuśćmy, że tak nie jest. Zatem istnieje z ∈ X, y z, lecz ϕ(y) > ϕ(z). Wobec tego z ∈ Sn dla każdego n ∈ N oraz 1 1 1 ϕ(xn+1 ) − ϕ(xn ) ¬ inf ϕ(x) ¬ ϕ(z) 2 2 x∈Sn 2 dla wszystkich n ∈ N. Przechodząc z n → ∞ otrzymamy, że limn→∞ ϕ(xn ) ¬ ϕ(z): sprzeczność. 1.10.27 Wniosek: Niech (X, ) będzie zbiorem częściowo uporządkowanym, zaś ϕ : X → R funkcją niemalejącą taką, że: (a) dla nierosnącego ciągu (xn ) takiego, że (ϕ(xn )) jest ograniczony z dołu istnieje minoranta y ∈ X taka, że ϕ(xn ) → ϕ(y); (b) dla dowolnego x ∈ X i ε > 0 istnieje z ∈ X takie, ze x z oraz ϕ(z) ϕ(x) − ε. Wtedy, dla każdego x ∈ X, zbiór S(x) := {y ∈ X | x y} przechodzi poprzez ϕ na zbiór (−∞, ϕ(x)]. Dowód: Ustalmy x ∈ X i dla a < ϕ(x) rozważmy zbiór Xa := {z ∈ S(x) | ϕ(x) a}. Wówczas każdy liniowo uprządkowany ciąg elelentów zbioru Xa posiada minorantę. Rzeczywiście, jeżeli ciąg (xn ) ⊂ Xa jest nierosnący, wtedy a jest ograniczeniem dolnym dla ciągu (ϕ(xn )), czyli – na mocy założenia (a) istnieje y ∈ X taki, że xn y oraz ϕ(y) = limn→∞ ϕ(xn ) a; zatem y ∈ Xa . Z Twierdzenia poprzedniego istnieje y ∈ Xa takie, że jeśli z ∈ Xa oraz y z, to ϕ(y) = ϕ(z). Jeżeli ϕ(y) > a, to z założenia (b) wynika istnienie z ∈ X takiego, że y z oraz ϕ(z) ∈)ϕ(y), a), czyli z ∈ Xa . Lecz jest to sprzeczne. W taki razie ϕ(y) = a. To kończy dowód. Niech teraz X będzie zupełną przestrzenią metryczną. Niech {S(t)}t0 będzie silnie ciągła półgrupą nieliniowych kontrakcji, tzn. dla dowolnych t, s 0, S(t + s) = S(t) ◦ S(s), S(0) = I, dla dowolnego x ∈ X odworowanie [0, +∞) 3 t 7→ S(t)x jest ciągłe oraz d(S(t)x, S(t)y) ¬ d(x, y) dla dowolnych x, y ∈ X i t 0. Zdefiniujmy (częściowy) porządek w przestrzeni X × [0, +∞) następująco: (x, a) (y, b) ⇐⇒ b a oraz d(S(b − a)x, y) ¬ L(b − a), gdzie L jest dowolną (ustaloną) liczbą nieujemną. Zdefiniowana relacja jest rzeczywiście porządkiem częściowym. Jest na zwrotna i antysymetryczna. Jest też przechodnia: załóżmy, że (x, a) (y, b) (z, c). Wtedy c b a oraz d(S(c − a)x, z) ¬ d(S(c − a)x, S(c − b)y) + d(S(c − b)y, z) = d(S(c − b) ◦ S(b − a)x, S(c − b)y) + d(S(c − b)y, z) ¬ d(S(b − a)x, y) + d(S(c − b)y, z) ¬ L(b − a) + L(c − b) = L(c − a). 1.10. Twierdzenie Ekelanda i jego warianty 53 Dodatkowo zdefiniujmy ϕ : X × [0, +∞) → R wzorem ϕ(x, a) := −a, (x, a) ∈ X × [0, +∞). Jest ona oczywiście niemalejąca. Pokażemy teraz, że spełnione jest założenie (a) z Wniosku 1.10.27. Przypuśćmy, że (xn , an ) jest ciągiem nierosnącym takim, że ϕ(xn , an ) = −an jest ograniczony z dołu. Wtedy (an ) jest ciągiem niemalejącym i ograniczonym z góry; zatem an % a. Dla dowolnych n ¬ m, (xn , an ) (xm , am ) a więc d(S(am − an )xn , xm ) ¬ L(am − an ). W takim razie d(S(a − an )xn , S(a − am )xm ) = d(S(a − am )S(am − an )xn , S(a − am )xm ) ¬ d(S(am − an )xn , xm ) ¬ L(am − an ). Oznacza to, ze ciąg (S(a−an )xn )∞ n=1 jest ciągiem Cauchy’ego i posiada granicę y := limn→∞ S(a− an )xn . Wówczas, dla dowolnego n ∈ N, d(S(a − an )xn , z) = lim d(S(a − an )xn , S(a − am )xm ) ¬ lim L(am − an ) = L(a − an ). m→∞ m→∞ Zatem (xn , an ) (z, a); tak więc (z, a) jest minorantą dl a(xn , an ) oraz ϕ(xn , an ) = −an → −a = ϕ(z, a). Dowodzi to warunku (a). 1.10.28 Twierdzenie: Niech K ⊂ X będzie zbiorem domkniętym i C 0 takie, że dla dowolnego x ∈ F , d(S(t)x, K) lim inf ¬ C. t&0 t Wówczas d(S(t)x, K) ¬ Ct dla wszystkich x ∈ F oraz t 0. Dowód: Zastosujemu Wniosek 1.10.27. W zbiorze K×[0, +∞) wprowadzamy częściowy porządek jak wyżej, gdzie L > C. Wiemy już, że zachodzi warunek (a). Pokażemy warunek (b): ustalmy (x, a) ∈ K × [0, +∞) i ε > 0. Z założenia lim inf t&0 d(S(t)x, K) < L, t czyli istnieje t ∈ (0, ε) takie, że d(S(t)x, K) < Lt. Istnieje więc z ∈ K takie, że d(S(t)x, z) < Lt. Mamy wtedy, że (x, a) (z, a + t) i, oczywiście ϕ(z, a + t) = −a − t > −a − ε = ϕ(x, a) − ε. Wykorzystując Wniosek 1.10.27 dla dowolnego x ∈ K i dla (x, 0) zbiór {(y, a) ∈ K ×[0, +∞) | (x, 0) (y, a)} przechodzi poprzez ϕ na zbiór (−∞, 0]. Tzn. jeżeli t 0, to istnieje (y, a) ∈ K × [0, +∞) taki, że (x, 0) (y, a) oraz ϕ(y, a) = −a = −t, tzn. (x, 0) (y, t), a więc d(S(t)x, y) ¬ Lt. Stąd wynika, że inf d(S(t)x, K) ¬ Lt, y∈K co – z dowolności L > C – implikuje tezę.