Praca magisterska Równania całkowe i teoria Hilberta
Transkrypt
Praca magisterska Równania całkowe i teoria Hilberta
Politechnika Łódzka wydział FTIMS Praca magisterska Równania całkowe i teoria Hilberta-Schmidta Piotr Kowalski Promotor Pracy : dr Jerzy Kalina Kierunek: Matematyka Stosowana Specjalność: Matematyka Finansowa i Ubezpieczeniowa Nr albumu: 133968 Wydział FTIMS Łódź 2010 Streszczenie Praca gromadzi pojęcia i twierdzenia teorii operatorów, z wyszczególnieniem operatorów całkowych oraz omawia podstawy teorii Fredholma równań całkowych i teorię Hilbert’a-Schmidt’a. Dedykacja Pracę dedykuje osobie, która najbardziej na świecie pragnęła ją zobaczyć. Mojemu dziadkowi Julianowi Lesiakowi, zmarłemu 25.06.2010. Człowiekowi, któremu zawdzięczam motywację do studiów, czynnego rozwijania się i dążenia do wyższych celów, świadom tego że bez jego wpływu ta praca by nie powstała. Spis treści 1 Wstęp 2 2 Preliminaria 2.1 Przestrzenie liniowo-topologiczne . . . . . . . . . . . . . . . . . . 2.2 Przestrzenie Banacha, przestrzenie Hilberta . . . . . . . . . . . . 2.3 Przestrzenie C(Ω) oraz L2 (Ω) . . . . . . . . . . . . . . . . . . . . 2.4 Kryterium Ascoliego . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Przestrzeń odwzorowań ograniczonych i przestrzeń do niej sprzężona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 3 5 6 6 3 Operatory 3.1 Operatory liniowe ograniczone . . . . . . . 3.2 Operatory sprzężone . . . . . . . . . . . . 3.3 Operatory zwarte - operatory pełnociągłe 3.4 Teoria spektralna, widmo operatora . . . 3.5 Widmo operatora zwartego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 8 9 12 14 16 4 Operatory całkowe 4.1 Operatory całkowe . . . . . . . . 4.2 Rodzaje operatorów całkowych . 4.3 Jądra słabo osobliwe . . . . . . . 4.4 Klasyfikacja równań całkowych . 4.5 Zwartość operatorów całkowych . 4.6 Operator sprzężony w przestrzeni . . . . . . . . . . . . . . . . . . . . L2 (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 21 23 25 25 28 5 Teoria Fredholma 5.1 Równania całkowe o jądrach 5.2 Alternatywa Fredholma . . 5.3 Twierdzenie Fredholma . . 5.4 Przykłady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hilberta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 31 33 35 36 6 Teoria Hilberta-Schmidta 6.1 Równanie całkowe o jądrze symetrycznym . . . 6.2 Pełny układ ortonormalny elementów własnych 6.3 Twierdzenie Hilberta-Schmidta . . . . . . . . . 6.4 Twierdzenie Mercer’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 38 39 39 42 ograniczonych . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . Rozdział 1 Wstęp W pracy w sposób spójny udało się zaprezentować wybrane aspekty analizy funkcjonalnej, teorii operatorów, topologii, równań różniczkowych i algebry. Zaprezentowany materiał pozwala omówić najważniejsze aspekty teorii Fredholma oraz teorii Hilberta-Schmidta. Przedstawiona teoria pozwala czytelnikowi w sposób pełniejszy niż w [2] czy [1] zrozumieć przedstawione rozumowania. Podana została spójna teoria dotycząca operatorów sprzężonych definiowanych w różnych przestrzeniach. Wśród wielu dowodów z teorii operatorów m.in. uzupełniony został dowód twierdzenia 3.2.3, pozwalając czytelnikowi na zrozumienie w pełni jego treści. Została wprowadzona zmodyfikowana definicja operatora sprzężonego w przestrzeni Hilberta, pozwalająca na pełną zgodność dwóch różnych metod wprowadzania operatora sprzężonego odszukanych w literaturze fachowej [1] [2], która wykazuje pełną zgodność obu podejść. Rozwinięty został dowód twierdzenia 3.5.1 o uzasadnienie rzeczy odebranych jako niejasności. Do dowiedzenia tego twierdzenia został wykorzystany autorski lemat 3.5.2, który stanowi rozszerzenie prostej obserwacji zaobserwowanej w czasie dowodzenia twierdzenia Riesza. W rozdziale 5 rozszerzone, względem twierdzenia podanego przez [3], i udowodnione zostało twierdzenia o rozwiązaniu w postaci szeregu von Neumanna. Praca została uzupełniona o przykłady dokumentujące, niektóre zastosowania teorii operatorów całkowych i teorii Fredholma. W przykładzie 2 zaprezentowany jest alternatywny sposób zapisu metody przedstawionej w [3], wykorzystujący proste fakty z algebry liniowej, który w sposób bardzo ciekawy, szybki i treściwy pozwala wyprowadzać macierz układu równań liniowych dla przekształceń Fredholma. Pokazuje on kolejną ciekawą analogię pomiędzy równaniami całkowymi a układami równań algebraicznych. 2 Rozdział 2 Preliminaria 2.1 Przestrzenie liniowo-topologiczne W niniejszej pracy zakładać będziemy że każda przestrzeń będzie przestrzenią liniowo-topologiczną. Pojęcie to wymaga wyjaśnienia tym bardziej iż stanowi ono podstawę współczesnej analizy funkcjonalnej. Przestrzeń ta stanowi najogólniejszą znaną obecnie strukturę łączącą cechy przestrzeni algebraicznych, takie jak możliwość ’dodawania’ elementów przestrzeni i ’mnożenia przez skalar’, łącząc je z topologicznymi podstawami ciągłości funkcji określanych pomiędzy poszczególnymi przestrzeniami liniowo-topologicznymi, w sposób zachowujący ciągłość działań algebraicznych. Definicja 2.1.1. Przestrzeń liniowo-topologiczna[1] Niech τ będzie topologią na przestrzeni liniowej X. Jeśli spełnione są następujące warunki: 1. Każdy punkt przestrzeni jest zbiorem domkniętym, 2. operacje przestrzeni liniowej są ciągłe względem topologii τ to τ nazywamy topologią liniową, natomiast parę (X, τ ) nazywamy przestrzenią liniowo-topologiczną. Przestrzenie liniowo-topologiczne są tak istotne z punktu widzenia analizy funkcjonalnej gdyż niemal wszystkie rozważane przestrzenie funkcyjne posiadają jej strukturę. Posługiwanie się jednak samymi przestrzeniami liniowotopologicznymi jest wielce niewygodne, dlatego częściej sięga po bogatsze we właściwości jej podklasy. Głównym czynnikiem powodującym wspomniane niedogodności jest konieczność korzystania z obiektów topologii w jej najogólniejszym charakterze. Wiemy jednakże, że znaczna część rozważanych topologii należy do topologii metryzowalnych, i to ta cecha będzie stanowić o kierunku zawężania klasy rozważań w niniejszej pracy. 2.2 Przestrzenie Banacha, przestrzenie Hilberta Krokiem w kierunku metryzowalnych przestrzeni liniowo-topologicznych są przestrzenie unormowane. Główny pojęciem, którym będziemy się posługiwać jest funkcja normy, zwana też po prostu normą. 3 ROZDZIAŁ 2. PRELIMINARIA 4 Definicja 2.2.1. Przestrzeń unormowana[1] Przestrzeń liniową X nazywamy unormowaną jeśli istnieje funkcja k.k, która każdemu x ∈ X przyporządkowuje liczbę rzeczywistą nieujemną, w taki sposób, że: 1. kx + yk ¬ kxk + kyk, x, y ∈ X 2. kαxk = |α|kxk, x ∈ X, α ∈ K, gdzie K jest ciałem skalarów 3. kxk = 0 ⇐⇒ x = 0 Wprowadzenie normy w danej przestrzeni pozwala w łatwy sposób porównywać obiekty danej przestrzeni względem pewnej cechy. Każda przestrzeń unormowana jest metryczna, gdyż wystarczy za metrykę wziąć normę różnicy argumentów. Podobnie znaczna część przestrzeni metrycznych staje się unormowana, gdy wybierając arbitralnie pewien element, w miejsce normy przypisujemy jego odległość od wskazanego elementu. Posiadanie pojęcia normy pozwala nam stosować wielce wygodne definicje ciągowe własności takich jak ciągłość czy zwartość. Definicja 2.2.2. Przestrzeń Banacha[1] Przestrzeń unormowaną zupełną nazywamy przestrzenią Banacha. Przestrzenie Banacha stanowią istotną podklasę przestrzeni unormowanych. Przykładem przestrzeni Banacha jest każda przestrzeń euklidesowa n-wymiarowa s n P x2k . Istotnym dla nas będą również przenoszenia zupełności z normą kxk = k=1 na rozważane przez nas przestrzenie odwzorowań tj. przestrzenie operatorów. Definicja 2.2.3. Przestrzeń unitarna[1] Zespoloną przestrzeń liniową H nazywamy przestrzenią unitarną, jeśli każdej parze wektorów z H możemy przyporządkować liczbę zespoloną oznaczaną (x, y), nazywaną iloczynem skalarnym wektorów x i y, tak, że spełnione są poniższe warunki 1. (y, x) = (x, y) - gdzie kreska górna odpowiada sprzężeniu liczby zespolonej 2. (x + y, z) = (x, z) + (y + z) 3. (αx, y) = α(x, y) 4. (x, x) 0 5. (x, x) = 0 ⇔ x = θ Dla dowolnych ∀x, y, z ∈ H, ∀α ∈ C Przestrzenie unitarne są najważniejszą podklasą spośród przestrzeni unormowanych. Łatwo bowiem zauważyć, że każda przestrzeń unitarna jest unormowana i metryczna. Jest tak gdyż istnienie iloczynu skalarnego implikuje istnienie normy, oraz metryki. Normę definiuje się poprzez iloczyn skalarny w sposób p kxk = (x, x) (2.1) Przestrzenie unitarne mogą byc zupełne lub nie. Te zupełne, zgodnie z poniższą definicją, będziemy nazywać hilbertowskimi. ROZDZIAŁ 2. PRELIMINARIA 5 Definicja 2.2.4. Przestrzeń Hilberta[1] Niech H przestrzeń unitarna. Jeśli jest ona przestrzenią zupełną z normą zdefiniowaną p kxk = (x, x) (2.2) to nazwiemy ją przestrzenią Hilberta. Przestrzenie Hilberta posiadają znaczną ilość własności dotyczących np. geometrii rozważanych w niej obiektów. Wiele fizycznych modeli okazuje się być przestrzeniami Hilberta. Łatwym do zaobserwowania faktem jest, że każda przestrzeń Hilberta jest przestrzenią Banacha. 2.3 Przestrzenie C(Ω) oraz L2 (Ω) Spośród wielu przestrzeni funkcyjnych, najbardziej fundamentalnymi będą przestrzenie funkcji ciągłych na zbiorze zwartym oznaczane przez C(Ω) oraz przestrzeń funkcji całkowalnych z kwadratem L2 (Ω). Całkowanie w niniejszej pracy będziemy rozumieli zawsze jako całkowanie w sensie Lebesgue’a, natomiast wszystkie funkcje będą funkcjami zespolonymi. O zbiorze Ω, który stanowić będzie dziedzinę rozważanych funkcji, zakładamy że jest podzbiorem pewnej nwymiarowej przestrzeni euklidesowej. W większości przypadków zakładamy, że jest on zwartym podzbiorem, chyba że odpowiednie założenia stanowią inaczej. Pierwszą z wspomnianych dwóch przestrzeni jest przestrzeń funkcji ciągłych określonych na zwartym podzbiorze pewnej przestrzeni euklidesowej. Definicja 2.3.1. Przestrzeń C(Ω)[2] Niech Ω będzie zwartym podzbiorem m-wymiarowej przestrzeni euklidesowej. Przestrzenią C(Ω) nazwiemy przestrzeń wszystkich funkcji ciągłych określonych na zbiorze Ω z działaniami dodawania funkcji oraz mnożenia funkcji przez skalar. W przestrzeni tej wprowadza się następującą normę: kuk = sup |u(x)| (2.3) x∈Ω Jest to zatem przestrzeń liniowa unormowana. Skończoność kresu wynika z kryterium Weierstrassa, zaś aksjomaty normy są trywialne w dowodzie, na mocy własności modułu. Ponadto przy tak zdefiniowanej normie, łatwo zauważyć, że zbieżność w przestrzeni C(Ω) odpowiada zbieżności jednostajnej. Przestrzeń ta okazuje się być również zupełną. Zatem jest to funkcyjna przestrzeń Banacha. Przestrzenią ogólniejszą od C(Ω) jest druga z przestrzeni, mianowicie przestrzeń funkcji o całkowalnym w sensie Lebesgue’a kwadracie modułu. Oczywiście wszystkie funkcje ciągłe określone na podzbiorze zwartym są całkowalne w sensie Lebesgue’a. Definicja 2.3.2. Przestrzeń L2 (Ω)[2] Niech dany będzie podzbiór mierzalny Ω przestrzeni m-wymiarowej euklidesowej i niech będzie on miary dodatniej. Przestrzenią L2 (Ω) nazwiemy przestrzeń wszystkich funkcji u mierzalnych w sensie Lebesgue’a określonych na zbiorze Ω takich, że: Z |u(x)|2 dx < ∞ (2.4) Ω ROZDZIAŁ 2. PRELIMINARIA 6 Przyjmujemy umowę, że dwie funkcje uważamy za równe, gdy są równe prawie wszędzie. Wykazuje się, że przestrzeń L2 (Ω) jest liniowa, gdy dołączymy działania dodawania i mnożenia funkcji przez skalar. Przestrzeń L2 (Ω) jest przestrzenią unitarną z operacją iloczynu skalarnego zdefiniowanego w poniższy sposób: Z (2.5) (u, v) = u(x)v(x)dx , u, v ∈ L2 (Ω) Ω Dowodzi się, że przestrzeń L2 (Ω) jest przestrzenią zupełna. Zatem jest to funkcyjna przestrzeń Hilberta. 2.4 Kryterium Ascoliego W niniejszej pracy bardzo często wykorzystywane będzie często pojęcie zwartości. Dowodzenie zwartości określonych zbiorów za pomocą definicji w przestrzeniach, czy to topologicznych, czy metrycznych, jest nie rzadko trudne i uciążliwe. W zależności od różnych przestrzeni w których prowadzone będą rozważania, zostały udowodnione różne kryteria. W przestrzeni C(Ω) takim kryterium jest np. kryterium Ascoliego, które podaje warunek konieczny i dostateczny zwartości domknięcia zbioru w przestrzeni C(Ω). Rozważmy zbiór funkcji Z określonych na zwartym zbiorze Ω. Do wprowadzenia kryterium potrzebne będą dwa pojęcia. Powiemy, że funkcje ze zbioru Z są wspólnie ograniczone, jeżeli istnieje taka liczba rzeczywista µ, że ku(x)k ¬ µ, x ∈ Ω, u ∈ Z (2.6) Z kolei funkcje tego zbioru Z nazwiemy jednakowo ciągłymi jeśli ∀ > 0∃δ > 0∀x1 , x2 ∈ Ω∀u ∈ Z kx1 − x2 k ¬ δ ⇒ ku(x1 ) − u(x2 )k ¬ (2.7) Dysponując tymi dwoma pojęciami możemy podać twierdzenie Ascoliego. Dowód twierdzenia można znaleźć w [2] roz. 26.4. Twierdzenie 2.4.1. Twierdzenie Ascoliego[2] Zbiór funkcji Z ⊂ C(Ω) ma zwarte domknięcie wtedy i tylko wtedy, gdy funkcje zbioru Z są wspólnie ograniczone i jednakowo ciągłe. W literaturze spotyka się określenie zbiorów których domknięcie jest zwarte jako zbiory prezwarte. Będziemy używać zamiennie obu pojęć: zbioru prezwartego i zbioru o zwartym domknięciu. 2.5 Przestrzeń odwzorowań ograniczonych i przestrzeń do niej sprzężona Kluczowym pojęciem rozważanym w tej pracy będzie odwzorowanie ograniczone liniowe, lub jak będziemy równoważnie je określać, operator ograniczony liniowy. Definicja 2.5.1. Odwzorowania ograniczone liniowe[1] Niech X, Y przestrzenie liniowo-topologiczne, oraz niech będzie dane odwzorowanie liniowe A : X → Y . Powiemy, że odwzorowanie A jest ograniczone jeśli obraz dowolnego zbioru ograniczonego jest ograniczony. ROZDZIAŁ 2. PRELIMINARIA 7 Podstawową strukturą w analizie funkcjonalnej jest przestrzeń operatorów ograniczonych liniowych. Jej rozważanie jest tym bardziej kluczowe, gdyż okazuje się że znaczna część własności przestrzeni liniowo-topologicznych bywa przeniesiona do przestrzeni operatorów. Definicja 2.5.2. Przestrzeń B(X,Y)[1] Dla przestrzeni liniowo topologicznych X, Y przez B(X,Y) będziemy rozumieli przestrzeń wszystkich ograniczonych odwzorowań liniowych z X do Y. Ponadto przez B(X) będziemy rozumieli przestrzeń B(X,X). Przestrzeń operatorów B(X, Y ) jest oczywiście przestrzenią liniowo-topologiczną, ze zdefiniowanym w sposób naturalny dodawaniem operatorów oraz mnożeniem przez skalary. Szczególnym przypadkiem przestrzeni operatorów ograniczonych okazuje się być przestrzeń liniowych ograniczonych funkcjonałów przestrzeni X. Funkcjonałem nazywamy operator o wartościach w ciele skalarów. Definicja 2.5.3. Przestrzeń sprzężona[1] Niech X,Y będą unormowanymi przestrzeniami liniowo topologicznymi, oraz niech Y będzie ciałem skalarów. Wtedy przestrzeń B(X,Y) nazywać będziemyprzestrzenią sprzężoną do X i oznaczać przez X ∗ . Łatwo zauważyć, że wobec rozważania jedynie zupełnych ciał skalarów, przestrzeń sprzężona, o ile jest unormowana, okazuje się być zawsze przestrzenią Banacha. W kwestii notacji dodatkową umową będzie, że elementy przestrzeni sprzężonych będzie oznaczali symbolami zawierającymi analogiczny symbol gwiazdki. Element przestrzeni dualnej X ∗ do przestrzeni X będziemy zatem najczęściej oznaczać przez x∗ . Do reprezentowania wartości elementu przestrzeni dualnej na danym elemencie x ∈ X używać będziemy zamiennie dwóch notacji: < x, x∗ > (2.8) x∗ (x) (2.9) lub Rozdział 3 Operatory 3.1 Operatory liniowe ograniczone W niniejszym rozdziale omówione zostaną podstawowe własności odwzorowań ograniczonych liniowych, które będziemy już niemal zawsze nazywać operatorami liniowymi ograniczonymi. Definicja 3.1.1. Operator liniowy ograniczony[2] Niech będą dane przestrzenie unormowane X i Y oraz operator liniowy A określony na podprzestrzeni D(A) ⊂ X o wartościach w przestrzeni Y. Mówimy, że operator A jest ograniczony, jeżeli istnieje taka liczba nieujemna µ, że ∀x∈D(A) : kAxk ¬ µkxk (3.1) Definicja ta oczywiście jest zgodna z przytoczoną w rozdziale poprzednim. Poniższe twierdzenie należy do najbardziej fundamentalnych w teorii analizy funkcjonalnej. Twierdzenie 3.1.2. Warunek konieczny i wystarczający ograniczoności operatora [2] Operator liniowy jest ograniczony wtedy i tylko wtedy, gdy jest ciągły. Dowód tego faktu jest prosty i można go odszukać w pozycji [2] roz. 36.1. Powyższy warunek konieczny i wystarczający ograniczoności operatora pozwala nam rozpoznawać operatory ciągłe. Aby wprowadzić w przestrzeni operatorów strukturę przestrzeni unormowanej musimy zdefiniować pewną ogólną normę dla jej elementów. Definicja 3.1.3. Norma operatora liniowego ograniczonego[2] Normą operatora liniowego ograniczonego A nazywamy liczbę: kAk = sup kAxk (3.2) x∈D(A),kxk=1 Alternatywnym podejściem jest również definiowanie normy poprzez kres dolny wszystkich ograniczeń danego operatora. Obie uzyskane normy są jednak w pełni równoważne. Przestrzeń B(X, Y ) z tak zdefiniowaną normą jest przestrzenią Banacha, o ile przestrzeń Y jest zupełna. 8 ROZDZIAŁ 3. OPERATORY 3.2 9 Operatory sprzężone Z dowolnym operatorem można skojarzyć pewien inny operator, nazywany operatorem sprzężonym. By dowieść jego istnienia musimy jednak uważnie prześledzić zachowanie funkcjonału normy na przestrzeni sprzężonej. Bardzo ważnym faktem z którego będziemy chcieli skorzystać w dowodzeniu istotnych dla nas twierdzeń, jest informacja płynąca z poniższego lematu: Lemat. Niech X będzie przestrzenią unormowaną i niech x0 ∈ X. Wówczas istnieje funkcjonał A ∈ X ∗ taki, że: 1. Ax0 = kx0 k 2. kAxk ¬ kxk, x ∈ X Dowód tego lematu można odszukać w [1] roz. 3.3 Aby wprowadzić operator sprzężony musimy zaobserwować pewne związki dotyczące normy w przestrzeni X z normą jej przestrzeni sprzężonej. Okazuje się, że wprowadzając analogiczną normę w przestrzeni sprzężonej otrzymujemy ważny związek obu norm. Twierdzenie 3.2.1. Norma w przestrzeni sprzężonej[1] Niech X - przestrzeń unormowana, X ∗ przestrzeń sprzężona do niej. Wtedy przyporządkowanie: kx∗ k = sup{| < x, x∗ > | : kxk ¬ 1}, x∗ ∈ X ∗ (3.3) ∗ jest normą w przestrzeni Banacha X . Ponadto zachodzi: kxk = sup{| < x, x∗ > | : kx∗ k ¬ 1}, x ∈ X (3.4) Dowód. Fakt iż jest to norma w przestrzeni Banacha wynika z definicji normy oraz uwagi o zupełności przestrzeni funkcjonałów liniowych ograniczonych. Niech x ∈ X. Wobec powyższego lematu istnieje funkcjonał dokładnie równy normie na elemencie x. Z drugiej strony z ograniczoności operatora x∗ mamy: | < x, x∗ > | ¬ kx∗ kkxk ¬ kxk (3.5) Co dowodzi drugiej części. Ostatnie twierdzenie pozwoli nam podać alternatywny sposób obliczania normy na przestrzeni B(X, Y ). Twierdzenie 3.2.2. Alternatywna postać normy w przestrzeni B(X, Y )[1] Niech X, Y przestrzenie unormowane. Wtedy norma operatora A ∈ B(X, Y ) wyraża się wzorem: kAk = sup{| < Ax, y ∗ > | : kxk ¬ 1, x ∈ X, ky ∗ k ¬ 1, y ∗ ∈ Y ∗ } (3.6) Dowód. Wobec definicji normy dla przestrzeni B(X, Y ) wiemy, że kAk = sup{kAxk : kxk ¬ 1, x ∈ X} (3.7) Korzystając z drugiej części twierdzenia 3.2.1 dla przestrzeni Y, więc m.in. jej podprzestrzeni {Ax, kxk ¬ 1}, mamy kAxk = sup{| < Ax, y ∗ > | : ky ∗ k ¬ 1, y ∗ ∈ Y ∗ } Połączenie (3.7) i (3.8) dowodzi tezę. (3.8) ROZDZIAŁ 3. OPERATORY 10 Dysponując powyższym twierdzeniem o normie jesteśmy w stanie udowodnić istnienie operatora sprzężonego. Twierdzenie 3.2.3. O konstrukcji operatora sprzężonego[1] Niech X, Y będą przestrzeniami unormowanymi. Wtedy każdemu A ∈ B(X,Y) odpowiada dokładnie jeden operator A∗ ∈ B(Y ∗ , X ∗ ) spełniający warunek < Ax, y ∗ >=< x, A∗ y ∗ > (3.9) dla wszystkich x ∈ X i dla wszystkich y ∗ ∈ Y ∗ . Ponadto dowodzi się, że A∗ spełnia równość kA∗ k = kAk (3.10) Uzyskany w twierdzeniu operator nazywany jest sprzężonym do danego Dowód. . Rozważmy operatory y ∗ ∈ Y ∗ oraz operator A ∈ B(X, Y ). Wprowadźmy operator A∗ y ∗ w sposób następujący: A∗ y ∗ = y ∗ ◦ A, y∗ ∈ Y ∗ (3.11) Operator A∗ y ∗ należy do X ∗ jako złożenie operatorów liniowych ciągłych. Stosując zapis dualny: < x, A∗ y ∗ >= A∗ y ∗ (x) = y ∗ (A(x)) =< Ax, y ∗ > (3.12) Zatem operator A∗ , taki że A∗ (y ∗ ) = A∗ y ∗ , spełnia warunek twierdzenia. Operator ten jest jednoznacznie wyznaczony przez operatory A∗ y ∗ oraz y ∗ , nie udowodniliśmy jednak na razie, że A∗ , należy do przestrzeni B(Y ∗ , X ∗ ). Należy wykazać, że jest on liniowy oraz, że jest ograniczony. Zacznijmy od liniowości: Niech y1∗ , y2∗ ∈ Y ∗ , oraz α1 , α2 ∈ K, gdzie K - ciało skalarów. Wtedy: < x, A∗ (α1 y1∗ + α2 y2∗ ) > = < Ax, α1 y1∗ + α2 y2∗ > = < = < = < = < = < = < Ax, α1 y1∗ > + < Ax, α2 y2∗ > α1 Ax, y1∗ > + < α2 Ax, y2∗ > Aα1 x, y1∗ > + < Aα2 x, y2∗ > α1 x, A∗ y1∗ > + < α2 x, A∗ y2∗ > x, α1 A∗ y1∗ > + < x, α2 A∗ y2∗ > x, α1 A∗ y1∗ + α2 A∗ y2∗ > (3.13) (3.14) (3.15) (3.16) (3.17) (3.18) (3.19) co wobec dowolności x ∈ X dowodzi, że: A∗ (α1 y1∗ + α2 y2∗ ) = α1 A∗ y1∗ + α2 A∗ y2∗ (3.20) Zatem wobec dowolności y1∗ , y2∗ ∈ Y ∗ , oraz α1 , α2 ∈ K, jest to operator liniowy. By wykazać ograniczoność posłużmy się normą z twierdzenia 3.2.2. kA∗ k = sup{kA∗ y ∗ k : ky ∗ k ¬ 1} (3.21) = sup{| < x, A∗ y ∗ > | : ky ∗ k ¬ 1, kxk ¬ 1} (3.22) = ∗ ∗ sup{| < Ax, y > | : ky k ¬ 1 , kxk ¬ 1} = kAk (3.23) (3.24) ROZDZIAŁ 3. OPERATORY 11 Stąd operator ten ma skończoną normę zatem jest ograniczony. Przy okazji udowodniona została również druga część twierdzenia. W niektórych pozycjach książkowych operator sprzężony definiowany jest jedynie dla przestrzeni Hilberta. Definicja ta jest często podawana ze względu na swoistą prostotę zapisu i rozumienia tego pojęcia. Przytoczmy ją w tym miejscu i uzasadnijmy jej zgodność z powyższą definicją operatora sprzężonego dla przestrzeni B(X, Y ). Twierdzenie 3.2.4. Operator sprzężony z operatorem liniowym ograniczonym w przestrzeni Hilberta[2] Niech X będzie przestrzenia Hilberta, a A ∈ B(X). Dla każdego elementu y ∈ X istnieje funkcjonał liniowy i ciągły określony za pomocą wzoru: fy (x) := (x, y) (3.25) Istnieje wtedy operator A∗ taki, że: fy (Ax) = (A∗ fy )(x), x, y ∈ X (3.26) Oczywiście uzyskany operator nazywamy sprzężonym do A. Dla wygody przyjmowanie jest więc, że operator sprzężony w takim wypadku należy do przestrzeni B(X) zamiast B(X ∗ ). Jest to prawda na mocy twierdzenia Riesza ([2] roz. 43.1). Twierdzenie bowiem zapewnia nas, że dowolny funkcjonał posiada postać zdefiniowaną jak wyżej. Oznacza to izomorficzność przestrzeni X i X ∗ . Rozpisanie powyższej definicji, przy wykorzystaniu tej izomorficzności pokazuje, że w terminach iloczynu skalarnego odpowiada to równości: (Ax, y) = (x, A∗ y), x, y ∈ X (3.27) Tak zdefiniowany operator posiada wiele ciekawych własności. Np. operator jest równy operatorowi sprzężonemu jego sprzężenia, albo innymi słowy operator jest równy swojemu drugiemu sprzężeniu. W ogólności taka własność nie zachodzi dla dowolnych operatorów. Izomoficzność przestrzeni Hilberta X i X ∗ jest kluczowa przy definicji operatora samosprzężonego. Operatory samosprzężone istnieją jedynie dla odwzorowań typu B(X) tj. ”odwzorowania w siebie”. Definicja 3.2.5. Operator normalny i samosprzężony Niech X - przestrzeń Hilberta. Operator A ∈ B(X) nazwiemy normalnym gdy: AA∗ = A∗ A, (3.28) zaś samosprzężonym nazwiemy go gdy: A∗ = A (3.29) Przykładem operatora samosprzężonego w przestrzeni Hilberta jest identyczność. Oczywiście jeśli A = I to (Ax, y) = (x, Ay) dla dowolnych x, y ∈ Xprzestrzeni Hilberta. Jest to więc najprostszy przykład operatora samosprzężonego. ROZDZIAŁ 3. OPERATORY 3.3 12 Operatory zwarte - operatory pełnociągłe Spośród wielu klas operatów z punktu widzenia wprowadzanej teorii, niezwykle istotne są operatory zwarte, którym poświęcony jest niniejszy rozdział. W literaturze spotyka jest również starsza ich nazwa - operatory pełnociągłe. W tej pracy przyjmujemy umowę, że stosowane jest jedynie pojęcie operatora zwartego. Definicja 3.3.1. Operator zwarty[2] Powiemy że operator A ∈ B(X, Y ) jest zwarty, jeśli obraz dowolnego zbioru ograniczonego w X, jest prezwarty w Y. Przyjrzyjmy się teraz dokładniej własnością operatorów zwartych. Własności operatorów zwartych Następujący fakt pozwala nam umieścić pojęcie operatora zwartego pośród operatorów ograniczonych. Twierdzenie 3.3.2. Ograniczoność operatora zwartego Każdy operator zwarty jest ograniczony. Dowód. Przypuśćmy, że jest przeciwnie, tj. że istnieje operator nieograniczony a zwarty. Z nieograniczoności wynika, że istnieje zbiór ograniczony, będący podzbiorem dziedziny operatora, o nieograniczonym obrazie. Wtedy można wybrać ciąg punktów z obrazu rozbieżny co do modułu do nieskończoności. Taki ciąg punktów nie posiada podciągu zbieżnego. Zatem wskazany obraz nie jest zbiorem prezwartym. Jednakże jest on obrazem zbioru ograniczonego przez operator zwarty. Zatem powinien być prezwarty. Uzyskaliśmy zatem sprzeczność, mylnie przypuszczając, że istnieje nieograniczony operator zwarty. Zatem każdy operator zwarty jest ograniczony. Odwrotna własność jednakże nie zachodzi. Przykładem jest operator identycznościowy, który co prawda przeprowadza zbiory ograniczone na ograniczone, jednakże obraz zbioru ograniczonego ale nie prezwartego, nie jest prezwarty. Zauważmy, że jeśli operator zwarty jest liniowy to zgodnie z twierdzeniem 3.1.2 jest on również ciągły. Operatory zwarte stanowią zatem właściwą podklasę operatorów ograniczonych. Pokażemy teraz najprostsze własności tej podklasy. Niech X,Y będą określonymi przestrzeniami liniowymi. Operator A ∈ B(X, Y ) nazwiemy skończenie wymiarowym jeśli zbiór jego wartości stanowi podprzestrzeń skończenie wymiarową przestrzeni Y. Twierdzenie 3.3.3. O zwartości operatora skończenie wymiarowego[2] Jeżeli X i Y są przestrzeniami unormowanymi, to każdy operator skończenie wymiarowy A ∈ B(X, Y ) jest zwarty. Dowód. Dowód opiera się o twierdzenie o warunków koniecznym i dostatecznym zwartości zbioru w przestrzeniach skończenie-wymiarowych ([2] roz.26.1). Z ograniczoności operatora zwartego wynika, że przeprowadza on zbiory ograniczone w zbiory ograniczone. Twierdzenie zaś mówi, że dla skończenie wymiarowej przestrzeni unormowanej, zbiór jest prezwarty wtedy i tylko wtedy gdy jest ograniczony. Zatem wobec przytoczonego twierdzenia, operator ten przeprowadza zbiory ograniczone w zbiory prezwarte, co świadczy o zwartości operatora i dowodzi tezy. ROZDZIAŁ 3. OPERATORY 13 Powyższe twierdzenie posiada bardzo istotne znaczenie praktyczne, gdyż w praktyce posługujemy się przestrzeniami skończenie wymiarowymi. Twierdzenie rozstrzyga zatem, że możemy swobodnie zakładać, że dowolny taki operator będzie posiadał cechy operatora zwartego. Kolejne twierdzenie pokaże, że działania algebraiczne wprowadzone w przestrzeni operatorów, nie wyprowadzają poza podzbiór operatorów zwartych. Będzie to zatem podprzestrzeń wektorowa przestrzeni operatorów ograniczonych. Twierdzenie 3.3.4. O liniowości przestrzeni operatorów zwartych[2] Niech X,Y będą przestrzeniami unormowanymi. Niech operatory A1 , A2 , A ∈ B(X, Y ) będą operatorami zwartymi oraz niech α będzie dowolnym skalarem z odpowiedniego ciała skalarów. Wtedy operatory A1 + A2 , αA (3.30) także są zwarte. Dowód. Szkic dowodu Rozpocznijmy szkicem dowodu dla sumy operatorów. Załóżmy, że mamy zbiór ograniczony, zatem jego obrazy przez oba operatory są prezwarte. Rozważmy pewien dowolny ciąg elementów dziedziny operatora. Ważnym dla nas jest aby istniał ciąg indeksów, dla których ciąg wartości operatorów na danych dwóch ciągach jest zbieżny w domknięciu obrazu. Taki ciąg indeksów oczywiście istnieje. By to uzasadnić zauważmy, że ciąg wartości pierwszego operatora na wybranym ciągu musi posiadać podciąg zbieżny. Zatem istnieje taki ciąg indeksów dla operatora pierwszego. Z kolei zauważmy, że ciąg wartości drugiego operatora oparty o podciąg złożony z tych właśnie indeksów również musi posiadać podciąg zbieżny. Wybierają spełniający to wymaganie ciąg indeksów otrzymujemy szukany ciąg indeksów, dla którego podciąg wartości operatora pierwszego jest zbieżny (jako podciąg ciągu zbieżnego), jak i dla drugiego operatora. Do prezwartości obrazu sumy operatorów wystarczy przypomnieć, że suma dwóch ciągów zbieżnych jest ciągiem zbieżnym, a element graniczny w sposób oczywisty należy do domknięcia. Dla mnożenia sposób dowodzenia jest oczywisty. Powyższe twierdzenie uzasadnia istnienie w przestrzeni operatorów zwartych struktury algebraicznej. Następnie zbadamy zachowanie ciągów zbieżnych operatorów zwartych. Twierdzenie 3.3.5. O granicy ciągów operatorów zwartych [2] Niech X- przestrzeń unormowana oraz Y- przestrzeń Banacha. Niech {An }n∈N ⊂ B(X, Y ) będzie ciągiem operatorów zwartych, takich że An → A, gdzie zbieżność rozumiemy jako zbieżność wg normy. Wtedy operator A też jest zwarty. Dowód tego twierdzenia można odszukać w [2] roz. 46.4 Ostatnim istotnym dla nas faktem jest przenoszenie własności zwartości operatora na operatory sprzężone. Twierdzenie 3.3.6. O zwartości operatora sprzężonego[1] Niech X i Y będą przestrzeniami Banacha i niech operator A ∈ B(X, Y ) będzie zwarty. Wówczas operator A∗ również jest zwarty. ROZDZIAŁ 3. OPERATORY 14 Dowód. Załóżmy, że A jest operatorem zwartym. Udowodnimy, że jego operator sprzężony jest zwarty. By dowieść zwartości operatora A∗ weźmy dowolny ciąg funkcjonałów przestrzeni Y ∗ z dowolnego zbioru ograniczonego i oznaczmy go jako {yn∗ }n∈N . Wskażemy zbieżny podciąg ciągu {A∗ yn∗ }n∈N . Niech U ⊂ X będzie kulą jednostkową. Wobec zwartości operatora A jej obraz A(U ) jest zbiorem prezwartym. Rozważmy rodzinę funkcjonałów postaci: fn (y) =< y, yn∗ >, y ∈ A(U ) (3.31) Zauważmy, że jest to podrodzina funkcji ciągłych określonych na zwartym podzbiorze. Wykażemy, że jest ona prezwarta z pomocą kryterium Ascoliego. Funkcje te są wspólnie ograniczone gdyż: kfn (y)k ¬ kyn∗ kkyk ¬ sup{kyn∗ k}kAkkxk ¬ kAk sup{kyn∗ k} n ∈ N, y ∈ A(U ) n∈N n∈N (3.32) Są również jednakowo ciągłe gdyż: dla dowolnego > 0 biorąc ky1 − y2 k < δ < kfn (y1 ) − fn (y2 )k ¬ ky1 − y2 k < n∈N (3.33) Zatem z twierdzenia Ascoliego, zbiór funkcji fn jest zwarty. Oznacza to, że w ciągu {fn }n∈N można wybrać podciąg {fkn }n∈N zbieżny. Zauważmy, że kA∗ yk∗i − A∗ ykj k = sup{k < x, A∗ yk∗i − A∗ yk∗j > k : kxk ¬ 1} (3.34) = sup{k < Ax, yk∗i − yk∗j > k : kxk ¬ 1} (3.35) = sup{kfki (Ax) − fkj (Ax)k : kxk ¬ 1} (3.36) dla i, j ∈ N. Wobec zbieżności jednostajnej na A(U ) ciągu {fkn }n∈N , ciąg {A∗ yk∗n }n∈N okazuje się być C-ciągiem. Zupełność przestrzeni X ∗ dowodzi iż operator A∗ jest zwarty. Dowodzi się również implikację odwrotną mówiącą, że jeśli operator sprzężony jest zwarty to operator wyjściowy także musi być zwarty. 3.4 Teoria spektralna, widmo operatora Jedną z najważniejszych cech macierzy jest wartość własna. W niniejszej sekcji postaramy się pokazać jak wartości własne można przenieść do teorii operatorów i o jakich własnościach operatora będzie ona decydować. Definicja 3.4.1. Wartość regularna[2] Niech A ∈ B(X) będzie operatorem liniowym ograniczonym w przestrzeni Banacha X. Liczbę λ nazwiemy wartością regularną jeśli równanie Af − λf = g (3.37) ma dla każdego g dokładnie jedno rozwiązanie. Powyżej zdefiniowaną wartość regularną możemy rozumieć na dwa sposoby. Albo jako uparametrycznienie równania, z poszukiwaniem parametrów dla których pewien operator Aλ := A−λI odwzorowuje przestrzeń w siebie. Mało tego, ROZDZIAŁ 3. OPERATORY 15 istnienie i jednoznaczność rozwiązania wystarcza nam do tego by powiedzieć iż istnieje operator odwrotny do operatora Aλ . Drugie podejście nakazuje patrzeć na zbiór wartości własnych jak na pewną miarę odporności równania na utratę rozwiązania. Opuszczenie zbioru wartości regularnych może spowodować zanik rozwiązań równania lub ich niejednoznaczność. Badanie zachowania operatora w tym dopełnieniu jest dla nas również bardzo istotne. Definicja 3.4.2. Widmo operatora[2] Zbiór wartości λ ∈ K(R lub C) nie będących regularnymi dla operatora A nazwiemy widmem operatora A. Rozważając jednorodność w równaniu (3.37), możemy wprowadzić pojęcie wartości własnej. Definicja 3.4.3. Wartość własna[2] Powiemy że liczba λ jest wartością własną operatora A jeśli równanie Ax − λx = 0 (3.38) posiada niezerowe rozwiązanie. Każde takie rozwiązanie nazywać będzie elementem własnym odpowiadającym wartości własnej. Zbiór wszystkich elementów własnych odpowiadających wartości własnej z dołączonym zerem nazwiemy podprzestrzenią własną wartości własnej. Jest to domknięta podprzestrzeń liniowa przestrzeni X. Łatwo zauważyć, że każda wartość własna danego operatora należy do jego widma. Zauważmy również, że jest to definicja zgodna z definicją wartości własnej dla macierzy. Jeżeli rozważamy operator dany przez macierz, to powyższa definicja stwierdza, że jeśli λ będzie wartością własną to równanie (A − λI)x = 0 (3.39) posiada rozwiązania niezerowe. Układ ten jednakże na pewno ma rozwiązanie w postaci x = 0. W połączeniu z czym fakt, że posiada on inne rozwiązania rozstrzyga, że wyznacznik macierzy A − λI musi być równy zero. Co oznacza, że λ jest wartością własną również według definicji znanej z algebry liniowej. Z perspektywy tej pracy najistotniejszym dla nas jest wykorzystanie twierdzeń spektralnych do dowodzenia faktów z zakresu teorii równań całkowych. Podajmy jeszcze bez dowodu lemat pokazujący wpływ zmian parametru λ w równaniu Af − λf = g (3.40) na posiadanie jednoznacznego rozwiązania. Lemat 3.4.4. O rozwiązaniu w postaci szeregu von Neumanna[2] Niech X będzie przestrzenią Banacha i niech operator A ∈ B(X). Jeżeli kAk |λ| < 1 to równanie A f −f =g (3.41) λ ma dla każdego y ∈ X dokładnie jedno rozwiązanie w postaci sumy szeregu von Neumanna tj.: ∞ X An f =g+ g (3.42) λn n=1 ROZDZIAŁ 3. OPERATORY 16 Obserwacja którą należy tutaj poczynić, jest fakt, że odpowiednio duże co do normy λ zawsze będą wartościami regularnymi. Oznacza to, że najbardziej badane przez nas będą λ bliskie zeru. 3.5 Widmo operatora zwartego W rozdziale 4.5 udowodnione zostanie, że rozważane przez nas operatory całkowe są zwarte. Skupimy się na zagadnieniu widma jedynie dla operatorów tej klasy. Zaprezentowana tu teoria Riesza, stanowi odpowiedź na pytanie o uzasadnienie szerokiej analogii operatorów całkowych i układów równań algebraicznych, które zaobserwował Fredholm. Na poniższe twierdzenie będziemy powoływać się w późniejszych etapach tej pracy. Twierdzenie 3.5.1. Teoria Riesza[2] Niech X będzie przestrzenią Banacha i niech danych będzie operator zwarty A ∈ B(X). Wtedy 1. Każda liczba λ 6= 0 należąca do widma operatora A jest wartością własną. 2. Dla każdej wartości własnej λ 6= 0 odpowiednia podprzestrzeń własna jest skończenie wymiarowa 3. Zbiór wszystkich wartości własnych operatora jest co najwyżej przeliczalny. Jedynym punktem skupienia może być tylko λ = 0. W dowodzie tym skorzystamy z następującego lematu. Lemat 3.5.2. O ilości rozwiązań równania całkowego Niech dana będzie przestrzeń Banacha X oraz operator A ∈ B(X). Jeżeli λ w równaniu Ax − λx = y (3.43) nie jest wartością własną, to równanie to posiada dla dowolnego y ∈ X najwyżej jedno rozwiązanie. Dowód. Możliwe są dwa przypadki. Załóżmy najpierw, że λ jest wartością regularną. Wtedy z definicji teza jest spełniona. Załóżmy zatem, że λ należy do widma operatora. Wtedy dla wybranego y ∈ X równanie może 1. nie mieć rozwiązania 2. mieć jednoznaczne rozwiązanie 3. mieć niejednoznaczne rozwiązanie Niech y ∈ X. Przypuśćmy, że równanie jest w przypadku 3. Zatem istnieją rozwiązania x1 6= x2 i zachodzą następujące równości: Ax1 − λx1 = y, Ax2 − λx2 = y (3.44) Wykonując odejmowanie stronami otrzymujemy: A(x1 − x2 ) − λ(x1 − x2 ) = y − y = 0 (3.45) gdzie x1 − x2 6= 0. Sprzeczność, gdyż oznaczałoby to, że λ jest wartością własną operatora. Zatem i w tym przypadku możliwe jest jedynie by wystąpił brak rozwiązania lub jego jednoznaczność rozwiązania. Wobec dowolności y ∈ X zachodzi teza lematu. ROZDZIAŁ 3. OPERATORY 17 Lemat ten nie został zamieszczony w żadnej z pozycji bibliograficznych. Treść i dowód są autorskie. Udowodnijmy teraz kolejno wszystkie 3 punkty. Dowód. Ad 1 Przypuśćmy, wbrew tezie, że istnieje pewien skalar λ nie będący wartością własną, ale należący do widma. Zatem istnieje pewien element y0 ∈ X dla którego równanie, Ax − λx = y0 (3.46) nie posiada rozwiązań. Element taki istnieje gdyż, na mocy lematu dla równanie może mieć najwyżej jedno rozwiązanie dla y ∈ Y . Gdyby dla każdego y ∈ Y istniało jednoznaczne rozwiązanie, λ nie należałaby do widma. Zatem takie y0 na pewno istnieje. Wprowadźmy oznaczenia: 1. Aλ = A − λI 2. X0 := X 3. Xn := (Aλ )n (X) Tak zdefiniowany ciąg zbiorów Xn jest ciągiem zstępującym i tworzy podprzestrzeń liniową (wobec liniowości operatora Aλ ). Ponadto zachodzi An+1 (X) 6= λ Anλ (X), n ∈ N. Rozważmy ciąg elementów postaci yn = Anλ y0 (3.47) Oczywiście yn ∈ X n , n ∈ N. Wykażemy indukcyjnie, że yn ∈ X n \ X n+1 , n ∈ N. Oczywiście y0 ∈ X0 \ X 1 , gdyż przypuszczając, że y0 ∈ X 1 otrzymujemy, że istnieje takie x0 ∈ X, że y0 = A1λ (x0 ) = Aλ (x0 ) = Ax0 − λx0 (3.48) Co jest sprzecznością z warunkiem (3.46), mówiącym, że takiego rozwiązania nie ma. Niech n ∈ N. Załóżmy, że yn ∈ X n \ X n+1 (3.49) yn+1 ∈ X n+1 \ X n+2 . (3.50) Twierdzimy, że: n+2 Przypuśćmy nie wprost, że yn+1 ∈ X . Zatem istnieje wtedy pewien x0 ∈ X taki, że: An+2 (x0 ) = yn+1 = Aλ (yn ) (3.51) λ Przekształcając powyższe otrzymujemy: Aλ (yn − An+1 (x0 )) = 0 (3.52) Wobec tego, że λ nie jest wartością własną, równanie Aλ z = 0, ma dokładnie jedno rozwiązanie z = 0. Zatem yn = An+1 (x0 ) λ (3.53) ROZDZIAŁ 3. OPERATORY 18 co świadczy o tym, że yn ∈ An+1 (X) i co jest sprzeczne z założeniem indukλ cyjnym. Wobec dowolności n ∈ N na mocy indukcji matematycznej, elementy ciągu yn spełniają warunek yn ∈ X n \ X n+1 , n ∈ N. Chcemy wykazać domkniętość. Wykażmy zatem, że istnieje liczba rzeczywista γ > 0 spełniająca warunek |Aλ x| γ|x|, x∈X (3.54) By tego dowieść przypuśćmy, że taka stała nie istnieje. Rozważmy ciąg {zn }n∈N ⊂ X dla którego: 1 (3.55) |Azn − λzn | < |zn | n Na podstawie naszego przypuszczenia stwierdzamy, że ciąg taki na pewno istnieje. Podstawiając zn := xn · |zn | otrzymujemy: 1 (3.56) n Ciąg Axn należy do obrazu zbioru ograniczonego w X, zatem wobec zwartości operatora A zawiera się on w zbiorze prezwartym. Daje się więc wybrać ciąg indeksów kn taki, że Axkn → x0 (3.57) |Axn − λxn | < Wobec (3.56), zachodzi zbieżność ciagu λxkn → x0 . Wobec twierdzenia o ciągłości normy zauważamy, że |x0 | = |λ| = 6 0. Zauważmy, że ciągi λAxkn = A(λxkn ) są sobie równe wobec liniowości operatora A. Zatem ich granice są sobie również równe. Korzystając z ciągłości operatora A otrzymujemy zatem: λx0 = Ax0 . Wobec faktu, że |x0 | = 6 0 oznaczało by to, że λ była by wartością własną. Sprzeczność. Stąd |Aλ x| γ|x|, x ∈ X (3.58) Zauważmy, że Aλ x ∈ X co oznacza, że: |Aλ (Aλ x)| γ|(Aλ x)| γ 2 |x| (3.59) Korzystając z powyższego indukcyjnie łatwo dowieść, że |Anλ x| γ n |x| (3.60) Udowodnimy teraz domkniętość zbiorów X n . Niech n ∈ N oraz niech zkn , k ∈ N będzie zbieżnym ciągiem w przestrzeni X elementów z X n . Wykażemy, że granica tego ciągu należy do X n . Istnieje taki ciąg xk taki, że Anλ (xk ) = zkn . Wobec 3.60 zachodzi: |zkn − zjn | = |Anα (xk − xj )| γ n |xk − xj |, k, j ∈ N (3.61) Zbieżność ciągu zkn dowodzi, że xk jest C-ciągiem w przestrzeni Banacha X. Zatem istnieje element x0 będący granicą ciągu xk . Wobec ciągłości operatora A: Ax0 = y0 (3.62) Skąd y0 ∈ X n . Co wobec dowolności n ∈ N dowodzi domkniętości zbiorów X n . Zatem każdy ze zbiorów X n ma strukturę podprzestrzeni liniowej z działaniami z przestrzeni X, jest domknięty i zawiera X n+1 w sposób właściwy. Na mocy lematu Riesza [2], będzie istniał ciąg vn elementów o następujących właściwościach: ROZDZIAŁ 3. OPERATORY 19 1. |vn | = 1, n ∈ N, vn ∈ X n 2. |vn − x| 1 2 dla x ∈ X n+1 Rozważmy x = vm − λ1 (Aλ vn − Aλ vm ) gdy m > n. Zauważmy, że wtedy x ∈ X n+1 jako kombinacja liniowa elementów z X n+1 . Stąd, wobec symetrii , moduł różnicy 1 (3.63) |Avn − Avm | = λ|vn − x| λ , n 6= m 2 Ciąg o takiej własności nie może mieć oczywiście podciągu zbieżnego. Ciąg vn jest jednak oczywiście ograniczony skąd oczywiście wynika, że ciąg Avn należy do pewnego prezwartego zbioru. Zatem sprzeczność z przypuszczeniem, że jest niezerowy skalar w widmie nie będący wartością własną. Ad 2 Przypuścmy, że dla pewnego λ przestrzeń własna jest nieskończenie wymiarowa. Wiadomym jest, że każda przestrzeń nieskończenie wymiarowa unormowana posiada zbiory ograniczone ale nie prezwarte. Niech xn będzie ciągiem wybranym z takiego zbioru, niezawierającym podciągu zbieżnego. Zatem ciąg λxn również nie zawiera podciągu zbieżnego. Z drugiej jednak strony ciąg A(xn ) należy do prezwartego obrazu operatora A na zbiorze ograniczonym. Zatem ten ciąg posiada podciąg zbieżny. Jednakże w przestrzeni własnej zachodzi równość Ax = λx, x ∈ Xλ (A) (3.64) Stąd otrzymaliśmy sprzeczność. Zatem każda przestrzeń własna musi być skończenie wymiarowa. Ad 3 Przypuśćmy, że zbiór wartości własnych operatora A posiada różny od zera punkt skupienia. Zatem istnieje ciąg λn różnych wartości własnych o normie powyżej pewnej stałej dodatniej . Niech xn będzie niezerowym elementem własnym dla wartości własnej λn . Zauważmy, że jeśli układ x1 , . . . , xn jest liniowo niezależny to również układ x1 , . . . , xn , xn+1 jest liniowo niezależny. W przeciwnym wypadku xn+1 ma postać: xn+1 = n X ai xi (3.65) i=1 którą wstawiając do : 0 = Axn+1 − λn+1 xn+1 = n X i=1 ai (Axi − λn+1 xi ) = n X ai (λi − λn+1 )xi (3.66) i=1 Co wobec liniowej niezależności x1 , . . . , xn pokazuje, że xn+1 = 0 wbrew założeniu niezerowości. Zatem każdy układ x1 , . . . , xn jest liniowo niezależny dla dowolnego n ∈ N. Oznaczmy przestrzenie rozpięte na układach x1 , . . . , xn przez odpowiednio Xn . Jako podprzestrzenie skończenie wymiarowe przestrzeni Banacha są one domknięte. Oczywiście dla dowolnego n, Xn jest podprzestrzenią właściwą dla Xn+1 , co pozwala nam zastosować ponownie lemat Riesza. Istnieje zatem ciąg vn o własnościach: 1. |vn | = 1, n ∈ N, vn ∈ Xn ROZDZIAŁ 3. OPERATORY 2. |vn − x| 1 2 20 dla x ∈ Xn−1 dla n ∈ N \ {1}. Niech n > m, dla x = λ1n (λn vn − Avn ) + λ1m Avm . Łatwo zauważyć, że λn vn − Avn należy do Xn , jednakże rozpisując postać vn w bazie x1 , . . . , xn zauważamy, że element nie zależy od xn a zatem należy do Xn−1 . Podobnie Avm ∈ Xm ⊂ Xn−1 . Zatem x ∈ Xn−1 . Wobec rezultatu lematu Riesza: 1 vn vm ¬ |vn − x| = |A( ) − A( )| 2 λn λm (3.67) Z dowolności n,m i ich symetrii ciąg A( λvnn ) nie posiada podciągów zbieżnych. Jednakże ciąg { λvnn }n∈N jest ograniczony gdyż: | vn 1 1 |= ¬ λn |λn | (3.68) Zatem sprzeczność z zwartością operatora A. Zatem zbiór wartości własnych ma co najwyżej jeden punkt skupienia będący zerem. Na mocy uwagi po lemacie 3.4.4, wiemy że zbiór widma jest ograniczony przez kulę K(0, kAk). Zatem jeśli 0 nie jest punktem skupienia zbioru wartości własnych to zbiór ten musi być skończony. Jeśli zero jest punktem skupienia, zbiór ten może być co najwyżej przeliczalny. Skorzystamy również z twierdzenia, które zademonstruje nam związek pomiędzy przestrzeniami sprzężonymi a wartościami własnymi. Twierdzenie 3.5.3. O ortogonalności podprzestrzeni własnej i rozwiązania[2] Niech X będzie przestrzenią Hilberta X, a A ∈ B(X) operatorem zwartym i niech λ 6= 0 będzie skalarem. Wtedy 1. λ jest wartością własną operatora A wtedy i tylko wtedy gdy λ jest wartością własną operatora A∗ . Gdy λ jest wartością własną jej przestrzeń własna ma identyczny wymiar z przestrzenią własną λ operatora A∗ . 2. Jeżeli λ jest wartością własną, to równanie Ax − λx = y (3.69) ma rozwiązanie wtedy i tylko wtedy gdy y jest ortogonalny do podprzestrzeni własnej Xλ (A∗ ). Dowód opiera się o Teorię Riesza oraz konstrukcję operatora sprzężonego i przestrzeni własnej, i można go znaleźć w [2] roz. 52.4. Rozdział 4 Operatory całkowe 4.1 Operatory całkowe W dalszej części pracy nasze rozważania ograniczą się do tzw. operatorów całkowych. Operatory te definiujemy następująco: Definicja 4.1.1. Operator całkowy[2] Niech dany będzie podzbiór Ω przestrzeni euklidesowej m-wymiarowej. Niech X,Y przestrzeni unormowane funkcji określonych na Ω oraz niech A będzie funkcją określoną na produkcie Ω × Ω mającą tą własność, że dla każdej funkcji u ∈ X poniższa całka Lebesgue’a jest dobrze określona funkcją z Y. Z v(x) = A(x, y)u(y)dy, x ∈ Ω (4.1) Ω Przyporządkowanie X 3 u → v ∈ Y dla funkcji u,v z równania (4.1), nazwiemy operatorem całkowym A i będziemy zapisywać równanie w postaci: Au = v (4.2) Funkcję A nazywać będziemy jądrem danego operatora całkowego. Stosowany szeroko podobny sposób zapisu dla operatora całkowego i jądra operatora całkowego wynika z silnej zależności pomiędzy operatorem, a jądrem. W większości przypadków nie prowadzi do nieporozumień nawet stosowanie tego samego oznaczenia dla jądra i operatora. Powyższa definicja jest w swej naturze bardzo ogólna, jednakże sformułowanie ”poniższa całka jest dobrze określoną funkcją” pozostawia spory obszar poszukiwań. Dlatego najczęściej rozważa się jedynie przestrzenie gdzie, na mocy odpowiednich twierdzeń ta poprawność jest zapewniona. Bardzo ważną uwagą jest to, że operatory całkowe niezależnie od rozważanych przestrzeni są operatorami liniowymi. 4.2 Rodzaje operatorów całkowych Operatory całkowe i ich klasyfikacja są tak ściśle związane z przypisanymi im jądrami całkowymi, zatem klasyfikację operatorów całkowych należy rozpocząć od klasyfikowania jąder. 21 ROZDZIAŁ 4. OPERATORY CAŁKOWE 22 Definicja 4.2.1. Operator całkowy o ciągłym jądrze w przestrzeni C(Ω)[2] Niech X = Y = C(Ω) oraz A ∈ C(Ω × Ω), przyjmując: Z (Au)(x) = A(x, y)u(y)dy u ∈ C(Ω) (4.3) Ω określamy operator całkowy odwzorowujący przestrzeń C(Ω) w siebie. Tak zdefiniowany operator całkowy jest poprawnie określony. Całka z funkcji ciągłej na zwartym podzbiorze zawsze istnieje i będzie ciągłą funkcją pozostałych parametrów. Udowodnienie ograniczoności tego operatora jest trywialne. Powyższy operator da się uogólnić na szerszą klasę funkcji. Wiemy bowiem, że nie tylko funkcje ciągłe można całkować. Definicja 4.2.2. Operator całkowy o ciągłym jądrze w przestrzeni L2 (Ω)[2] Niech X = Y = L2 (Ω), dla Ω ⊂ Em - zwarty podzbiór m-wymiarowej przestrzeni euklidesowej, oraz A ∈ C(Ω × Ω), to kładąc: Z ∀u ∈ L2 (Ω) (Au)(x) = A(x, y)u(y)dy (4.4) Ω określamy operator całkowy odwzorowujący przestrzeń L2 (Ω) w siebie. Istnienie powyższej całki jest konsekwencją ograniczoności funkcji jądra. Jednostajna ciągłość jądra względem kompletu zmiennych (x,y) przenosi się na ciągłość względem wartości operatora. Zatem zauważamy, że operator ten przyporządkowuje funkcjom klasy L2 (Ω) funkcje ciągłe. Niewątpliwie jest to zatem odwzorowanie w siebie przestrzeni L2 (Ω), której podprzestrzenią są przecież funkcje ciągłe. Jednakże zauważamy, że tak silne założenia o jądrze operatora powoduje zawężenie zbioru wartości operatora do węższej niż rozważana klasa. Stąd osłabiając warunki nałożone na jądro operatora otrzymujemy ogólniejszy operator. Definicja 4.2.3. Operator całkowy z jądrem kwadratowym w przestrzeni L2 (Ω)[2] Gdy X = Y = L2 (Ω) oraz A - funkcją mierzalną określoną na produkcie (Ω×Ω) taką że: ZZ |A(x, y)|2 dxdy < ∞ (4.5) Ω×Ω przyjmując: 2 ∀u ∈ L (Ω) Z A(x, y)u(y)dy (Au)(x) = (4.6) Ω określamy operator całkowy odwzorowujący przestrzeń L2 (Ω) w siebie. Jądro spełniające warunek (4.5) nazywać będziemy kwadratowym. Uzasadnienie przekształcenia w siebie wymaga tym razem szerszego komentarza. Zgodnie z twierdzeniem Fubiniego: ZZ Z Z (4.7) |A(x, y)|2 dxdy = ( |A(x, y)|2 dy)dx Ω×Ω Ω Ω ROZDZIAŁ 4. OPERATORY CAŁKOWE 23 Wykorzystując powyższe oraz nierówność Buniakowskiego otrzymujemy: Z Z Z |(Au)(x)|2 = | A(x, y)u(y)dy|2 ¬ |A(x, y)|2 dy |u(y)|2 dy (4.8) Ω Ω Ω Wobec tego również dla całek tych funkcji zachodzi: Z Z Z Z |(Au)(x)|2 dx ¬ ( |A(x, y)|2 dy)dx |u(y)|2 dy < +∞ Ω Ω Ω (4.9) Ω 2 Zatem funkcja A(u) jest również klasy L (Ω). Ponadto przyglądając się (4.9) zauważmy, że warunek ten zapewnia również ograniczoność tego operatora. Zatem ten operator całkowy jest ograniczonym liniowym operatorem przekształcającym przestrzeń L2 (Ω) w siebie. 4.3 Jądra słabo osobliwe Istnieje jeszcze inna klasa jąder, która również zapewnia przekształcenie przestrzeni L2 (Ω) w siebie. Są to jądra słabo osobliwe. Definicja 4.3.1. Jądro słabo osobliwe[2] Niech dany będzie zbiór mierzalny i ograniczony Ω w przestrzeni euklidesowej m-wymiarowej Em . Powiemy, że jądro jest słabo osobliwe, jeśli daje się je przedstawić w postaci: H(x, y) (4.10) A(x, y) = |x − y|α gdzie 0 < α < m natomiast x, y ∈ Ω, x 6= y, zaś funkcja H jest funkcją mierzalną i ograniczoną. Jądra słabo osobliwe są oczywiście całkowalne. Ponadto dowodzi się, że jeżeli α < 21 m to jest ono jądrem kwadratowym. Jednakże nie wszystkie jądra kwadratowe są słabo osobliwe. Definicja 4.3.2. Operator całkowy z jądrem słabo osobliwym w przestrzeni L2 (Ω)[2] Gdy Ω ⊂ Em jest ograniczonym zbiorem mierzalnym, X = Y = L2 (Ω) oraz A jest słabo osobliwym jądrem to przyjmując: Z 2 ∀u ∈ L (Ω) (Au)(x) = A(x, y)u(y)dy (4.11) Ω określamy operator całkowy odwzorowujący przestrzeń L2 (Ω) w siebie. W uzasadnieniu ograniczoności i działania operatora w przestrzeń L2 (Ω) wykorzystamy następujący lemat, który łatwo można wykazać stosując zmienne biegunowe. Lemat 4.3.3. Jeżeli 0 < α < m to istnieje pewna stała γ > 0, że dla każdych dwóch punktów x, y ∈ Rm i dowolnej liczby r > 0 zachodzi: Z 1 dz ¬ γrm−α (4.12) |y − z|α K(x,r) jeśli |y − x| < r. ROZDZIAŁ 4. OPERATORY CAŁKOWE 24 Możemy zatem przejść do dowiedzenia odpowiedniego działania wskazanego operatora całkowego. Niech dana będzie funkcja u - całkowalna. Wobec lematu wiemy, że Z 1 ¬ γ0 (4.13) |x − y|α dy Ω Gdyż Ω będąc ograniczonym na pewno zawiera się w kuli o środku w x i odpowiednio dużym promieniu. Stąd powyższa całka na pewno jest ograniczona. Korzystając z definicji jądra słabo osobliwego, twierdzenia Fubiniego oraz (4.13) otrzymujemy: Z Z Z |H(x, y)| |H(x, y)||u(y)| dxdy ¬ dx)|u(y)|dy (4.14) ( |x − y|α |x − y|α Ω Ω Ω×Ω Z ¬ sup {|H(x, y)|}γ0 |u(y)|dy < ∞ (4.15) x,y∈Ω Ω Co dowodzi działania w siebie w przestrzeń funkcji całkowalnych. Niech tym razem dana będzie funkcja u całkowalna w kwadracie modułu. Na mocy nierówności Buniakowskiego: Z u(y) 1 2 |(Au)(x)|2 ¬ | H(x, y) (4.16) α α | |x − y| 2 |x − y| 2 Ω Z |u(y)|2 ¬ sup {|H(x, y)|2 }γ0 dy (4.17) |x − y|α x,y∈Ω Ω Zatem całkując powyższe i zamieniając zmienne Z Z Z |(Au)(x)|2 dx ¬ sup {|H(x, y)|2 }γ0 ( x,y∈Ω Ω (4.18) Ω ¬ Z Ω Z 2 sup {|H(x, y)| }γ0 ( |u(y)|2 dy)dx |x − y|α x,y∈Ω Ω ¬ ( sup {|H(x, y)|})2 γ02 x,y∈Ω ZΩ 1 dx)|u(y)|2 dy(4.19) |x − y|α |u(y)|2 dy < ∞ (4.20) Ω Ostatnie oznacza ponadto, że operator jest ograniczony. Definicja 4.3.4. Operator całkowy z jądrem słabo osobliwym w przestrzeni C(Ω)[2] Gdy Ω ⊂ Em jest zbiorem zwartym, X = Y = C(Ω) oraz A jest słabo osobliwym jądrem takim, że funkcja H (z definicji 4.3.1) jest ciągła, to przyjmując: Z ∀u ∈ L2 (Ω) (Au)(x) = A(x, y)u(y)dy (4.21) Ω określamy operator całkowy odwzorowujący przestrzeń C(Ω) w siebie. Fakt iż jest to operator odwzorowujący w siebie jest widoczny wiec pozostawmy to bez dowodu. ROZDZIAŁ 4. OPERATORY CAŁKOWE 4.4 25 Klasyfikacja równań całkowych Pierwotnie około roku 1900 w pracach Volterry i Fredholma rozważane były jedynie całki funkcji określonych na podzbiorach osi rzeczywistej i jąder całkowych określonych na iloczynie kartezjańskim podzbiór osi rzeczywistej. Ze względu na występujące postacie liniowych równań całkowych ograniczono się do dwóch głównych typów tych równań: 1. Równań Volterry - które były rozważane jako pierwsze (a) pierwszego rodzaju Zx A(x, y)f (y)dy = g(x) x ∈ (a, b) (4.22) a (b) drugiego rodzaju Zx f (x) − A(x, y)f (y)dy = g(x) x ∈ (a, b) (4.23) a 2. Równań Fredholma (a) pierwszego rodzaju Zb A(x, y)f (y)dy = g(x) x ∈ (a, b) (4.24) a (b) drugiego rodzaju Zb f (x) − A(x, y)f (y)dy = g(x) x ∈ (a, b) (4.25) a Gdzie funkcje f i g należały do odpowiednich klas przestrzeni funkcyjnych, podobnie jak jądra przekształceń należały do odpowiednich dla nich klas przestrzeni funkcyjnych.[3] Dowodzi się, że każde z równań Volterry daje się sprowadzić do równań Fredholma [3]. Odkrycie tego spowodowało, że rozwój badań nad równaniami całkowymi ukierunkował się na równania Fredholma. Szerzej o własnościach tych równań będzie powiedziane więcej w rozdziale 5. 4.5 Zwartość operatorów całkowych Okazuje się że dla licznych klas jąder równań całkowych, operator całkowy okazuje się być zwartym. Twierdzenie 4.5.1. Zwartość operatora całkowego dla przestrzeni C(Ω)[2] Operator całkowy A ∈ B(C(Ω)) z jądrem A ciągłym jest zwarty. ROZDZIAŁ 4. OPERATORY CAŁKOWE 26 Dowód. Niech A ∈ B(C(Ω)) będzie operatorem całkowym z jądrem A ciągłym. Niech ponadto Z ⊂ C(Ω) będzie zbiorem ograniczonym. Wtedy funkcje u ∈ Z są wspólnie ograniczone przez pewne µ > 0. Wobec ograniczoności operatora całkowego w przestrzeni B(C(Ω)), również funkcje Au są wspólnie ograniczone. Ponadto wobec jednostajnej ciągłości funkcji A dla ∀ > 0∃δ > 0 ∀(x1 , y), (x2 , y) ∈ Ω × Ω, |x1 − x2 | ¬ δ : zachodzi |A(x1 , y) − A(x2 , y)| < µ|Ω| (4.26) Wobec czego Z |Au(x1 ) − Au(x2 )| = | A(x1 , y) − A(x2 , y)u(y)dy| < |Ω|µ = µ|Ω| (4.27) Ω Co świadczy o jednakowej ciągłości funkcji u ∈ Z. Na mocy twierdzenia Ascoliego, zbiór A(Z) jest prezwarty. Z dowolności wyboru Z otrzymujemy zwartość operatora A. Wobec powyższego twierdzenia operatory całkowe określone na przestrzeni Banacha B(C(Ω)) są zwarte. Kolejne twierdzenie dowodzi, że jest tak również dla szerszej klasy funkcji L2 (Ω). Twierdzenie 4.5.2. Zwartość operatora całkowego dla przestrzeni L2 (Ω) [2] Operator całkowy A ∈ B(L2 (Ω)) z jądrem A kwadratowym, jest zwarty. W dowodzie tego istotnego faktu posłużymy się rozwiązaniem przypadku skończenie wymiarowego i z pomocą twierdzenia 3.3.5 wywnioskujemy zwartość ze zwartości ciągu ciągu operatorów doń zbieżnych. Dowód. Rozważmy operator z jądrem zdegenerowanym tzn. takim że: A(x, y) = n X γk ak (x)bk (y) (4.28) k=1 gdzie γk ∈ K elementy ciała skalarów, natomiast ak , bk ∈ L2 (Ω). Wtedy oczywiście operator A dział w przestrzeń skończenie wymiarową. Jako operator skończenie wymiarowy jest on zatem zwarty. Powróćmy zatem do ogólnego jądra kwadratowego. Niech (uk ) będzie ortonormalnym układem zupełnym funkcji z przestrzeni L2 (Ω). Wtedy funkcje postaci un (x)um (y) stanowią ortonormalny układ zupełny w przestrzeni L2 (Ω×Ω). Podprzestrzeń wszystkich kombinacji skończonych liniowych tych funkcji jest gęsta w L2 (Ω×Ω). Wobec tej gęstości dla jądra A istnieje ciąg jąder An zbieżny do A średnio kwadratowo. Zatem i ciąg odpowiednich operatorów An jest zbieżny do operatora A. Jako, że jądra tych operatorów są zdegenerowane, to operatory te są zwarte. Wobec twierdzenia 3.3.5, i operator A jest zwartym. Z interesujących nas przestrzeni pozostały jeszcze przestrzenie oparte o jądra słabo osobliwe. Tu także okazuje się występować zwartość odpowiednich operatorów. ROZDZIAŁ 4. OPERATORY CAŁKOWE 27 Twierdzenie 4.5.3. Zwartość operatora całkowego dla jąder słabo-osobliwych w C(Ω)[2] Operator całkowy A ∈ B(C(Ω)) z jądrem A słabo-osobliwym jest zwarty. Dowód. Szkic dowodu W dowodzie tego faktu, podobnie jak w poprzednim twierdzeniu definiujemy ciąg operatorów zbieżnych do danego, pokazujemy ich zwartość i wnioskujemy zwartość operatora granicznego. Rozważany tu będzie ciąg operatorów o jądrach postaci: ( H(x,y) , |x − y| δn |x−y|α (4.29) An (x, y) = H(x,y) , |x − y| < δn |δn |α Ciąg tych jąder jest zbieżny do jądra operatora A. Jądra te są natomiast funkcjami ciągłymi, co pozwala stwierdzić, że operatory An będą zwarte. Twierdzenie 4.5.4. Zwartość operatora całkowego dla jąder słabo-osobliwych w L2 (Ω) [2] Operator całkowy A ∈ B(L2 (Ω)) z jądrem A słabo-osobliwym jest zwarty. W dowodzie również i tu rozważymy ciąg operatorów zwartych i pokażemy jego zbieżność do danego operatora. Dowód. Rozważmy ciąg liczb rzeczywistych δn zbieżny do 0. Utwórzmy również ciąg funkcji An opisanych wzorem: A(x, y) , |x − y| δn An (x, y) = (4.30) 0 , |x − y| < δn Jądra o takiej postaci są oczywiście ograniczone, zatem należą i do przestrzeni L2 (Ω. × Ω). O operatorach o takich jadrach mówi twierdzenie 4.5.2, zatem skonstruowaliśmy ciąg operatorów zwartych {An }n∈N . Pozostaje dowieść zbieżności ciągu. Zauważmy, że: Z H(x, y) u(y)dy (4.31) ((An − A)u)(x) = − |x − y|α Ωn (x) gdzie zbiór Ωn (x) := Ω ∩ K(x, δn ). Oznaczając µ := sup |H(x, y)| i stosując x,y∈Ω nierówność Buniakowskiego, szacujemy z góry Z 1 1 2 |((An − A)u)(x)|2 ¬ µ2 | α α u(y)dy| ¬ |x − y| 2 |x − y| 2 (4.32) Ωn (x) ¬ µ2 Z 1 dy |x − y|α Ωn (x) ¬ µ2 Z K(x,δn ) Z 1 |u(y)|2 dy (4.33) |x − y|α Ωn (x) 1 dy |x − y|α Z 1 |u(y)|2 dy (4.34) |x − y|α Ω Niech > 0, x ∈ Ω. Na mocy lematu 4.3.3 istnieje taka liczba µ1 , że Z 1 dy ¬ µ1 |x − y|α Ω (4.35) ROZDZIAŁ 4. OPERATORY CAŁKOWE 28 Ponadto istnieje dostatecznie duży indeks k taki, że dla n > k zachodzi Z 1 2 dy ¬ (4.36) α |x − y| µ1 µ2 K(x,δn ) Zatem |(An − A)u|2 ¬ 2 µ1 Z Ω ¬ ¬ Z 1 |u(y)|2 dy dx α |x − y| (4.37) Ω Z Z 2 1 dx |u(y)|2 dy α µ1 |x − y| ZΩ Ω 2 |u(y)|2 dy (4.38) (4.39) Ω dla n > k. Wobec dowolności funkcji u ∈ L2 (Ω), otrzymujemy ostatecznie: |An − A| ¬ , n > k (4.40) Wobec dowolności > 0 dowodzi to zbieżności ciągu operatorów. Wobec twierdzenia 3.3.5 dowodzi to zwartości operatora A. 4.6 Operator sprzężony w przestrzeni Hilberta L2 (Ω) Dla operatorów całkowych istnieje jak najbardziej sens rozważania operatorów sprzężonych. W rozdziale 6 będziemy chcieli skupić się na operatorach całkowych samosprzężonych i dlatego teraz zastanówmy się nad postacią operatora sprzężonego. Nasze rozważania musimy ograniczyć do przestrzeni L2 (Ω) gdyż przestrzeń C(Ω) nie jest przestrzenią Hilberta. Przypomnijmy, że iloczyn skalarny w L2 (Ω) zdefiniowany jest następująco: Z (x, y) = x(t) · y(t)dt, x, y ∈ L2 (Ω) (4.41) Ω Zgodnie z uwagami i spostrzeżeniami z rozdziału 3.2.4 wiemy, że operator sprzężony A∗ istnieje i spełnia warunek: (Ax, y) = (x, A∗ y), x, y ∈ X (4.42) Zastosujmy powyższe do przestrzeni L2 (Ω) gdzie operatory są wyposażone w jądra kwadratowe. Twierdzenie 4.6.1. Operator sprzężony do operatora całkowe w przestrzeni L2 (Ω)[2] Niech X = L2 (Ω). Jest to oczywiście przestrzeń Hilberta. Wtedy operator całkowy postaci: Z Au(x) := A(x, y)u(y)dy (4.43) Ω ROZDZIAŁ 4. OPERATORY CAŁKOWE 29 Posiada operator sprzężony postaci: A∗ u(x) := Z A(y, x)u(y)dy (4.44) Ω Dowód. Wykonajmy sprawdzenie, niech x, y ∈ L2 (Ω) i A ∈ B(L2 (Ω). Z ∗ (x, A y) = x(t)A∗ y(t)dt Ω Z Z A(z, t)y(z)dzdt x(t) = Ω Ω Z Z A(z, t)y(z)dzdt x(t) = Ω Ω Z Z x(t)A(z, t)y(z)dzdt = Ω Ω Z Z y(z) = Ω x(t)A(z, t)dtdz Ω Z y(z)Ax(z)dz = Ω (Ax, y) = Stąd w zasadzie mamy jasno podany warunek na jądro dla operatora samosprzężonego. Dla operatora samosprzężonego zachodzi również wiele interesujących własności. Twierdzenie 4.6.2. O ortogonalności podprzestrzeni własnych[2] Niech X będzie przestrzenią Hilberta. Podprzestrzenie własne odpowiadające różnym wartościom własnym operatora samosprzężonego A ∈ B(X) są ortogonalne. Dowodu powyższej własności dostarcza prosta obserwacja. Niech A ∈ B(X) będzie operatorem samosprzężonym. Niech λ1 , λ2 dwie różne wartości własne, x1 , x2 elementy własne odpowiednio dla pierwszej i drugiej wartości własnej. λ1 (x1 , x2 ) = (λ1 x1 , x2 ) = (Ax1 , x2 ) = (x1 , Ax2 ) = (x1 , λ2 x2 ) = λ2 (x1 , x2 ) (4.45) Stąd: (λ1 − λ2 )(x1 , x2 ) = 0 (4.46) Zatem elementy różnych przestrzeni własnych są ortogonalne do siebie. Rozdział zakończmy definicją pojęcia równoważnego dla wartości własnej operatora. Definicja 4.6.3. Wartość własna jądra operatora całkowego[2] Przez wartość własną jądra będziemy nazywać skalary µ dla których równanie Z u(x) − µ A(x, y)u(y)d(y) = 0 (4.47) Ω ROZDZIAŁ 4. OPERATORY CAŁKOWE 30 ma niezerowe rozwiązanie (nazywane funkcją własną). Zgodnie z tą definicją µ jest wartością własną jądra wtedy i tylko wtedy gdy jest niezerowe oraz jego odwrotność jest wartością własną operatora całkowego. Rozdział 5 Teoria Fredholma W niniejszym rozdziale omówiona zostanie teoria Fredholma równań całkowych. Wygłoszone przez Fredholma teorie z roku 1900 dowodzą, że w równaniach całkowych występują liczne analogie z równaniami algebraicznymi. Jak wykazały to prace Riesza, przyczyną takiego zachowania była zwartość operatorów całkowych w danych przestrzeniach. W niniejszym rozdziale będziemy zajmować niemal jedynie jednym typem równania całkowego, mianowicie równaniem Fredholma drugiego rodzaju. Z f (x) − N (x, y)f (y)dy = g(x), x ∈ Ω (5.1) Ω 5.1 Równania całkowe o jądrach ograniczonych Rozważamy w tej sekcji równanie całkowe o jądrze ograniczonym i ciągłym. Korzystając z zapisu operatorowego możemy je zapisać w wygodnej postaci: f − Nf = g (5.2) W dużej liczbie przypadków udaje się wykazać, że rozwiązanie tego równania ma postać szeregu von Neumanna. Definicja 5.1.1. Szereg von Neumanna[3] Niech N będzie pewnym operatorem liniowym N ∈ B(X) , oraz niech g ∈ X. Wtedy granicę ciągu funkcyjnego fn = g + Ng + N2 g + ... + Nn−1 g n+1 n (5.3) 1 gdzie N = N ◦ N , N = N jest superpozycją operatorów, nazwiemy szeregiem von Neumanna funkcji g. O przykładowym zastosowaniu szeregu von Neumanna mówi twierdzenie. Twierdzenie 5.1.2. Warunek dostateczny rozwiązania w postaci szeregu von Neumanna[3] Niech g funkcja ciągła na zwartym zbiorze Ω i niech N ∈ B(C(Ω)) będzie operatorem całkowym z ciągłym jądrem. Jeżeli spełniona jest nierówność max |N (x, y)| < x,y∈Ω 31 1 |Ω| (5.4) ROZDZIAŁ 5. TEORIA FREDHOLMA 32 to istnieje dokładnie jedno rozwiązanie równania całkowego (5.2), które jest sumą jednostajnie zbieżnego szeregu von Neumanna. Dowód. Rozpocznijmy od uzasadnienia jednostajnej zbieżności szeregu von Neumanna. Zbadajmy zbieżność szeregu norm: kgk + kNgk + kN2 gk + . . . (5.5) Funkcja g jest oczywiście ograniczona z góry jako ciągła na zwartym zbiorze Ω. Z kolei, biorąc |N | := max |N (x, y)| i stosując wzór na moduł całki: x,y∈Ω Z kNgk = | Z N (x, y)g(y)dy| ¬ Ω |N ||g(y)|dy (5.6) Ω R Wprowadźmy oznaczenie G = |g(x)|dx. Wtedy kNgk ¬ |N |G. Zauważmy z Ω kolei, że dla n ∈ N zachodzi właściwość: Z kNn+1 gk = | N (x, y)(Nn g(y))dy| ¬ (5.7) Ω Z ¬ |N | kNn g(y)kdy ¬ . . . ¬ (5.8) Ω ¬ n+1 Z Z Z |N | ... Ω Ω Ω |g(y)|dy dxn . . . dx1 = | {z } (5.9) n razy | {z } n razy = |N |n+1 G Z Z ... Ω Ω 1 dxn . . . dx1 = |N |n+1 G|Ω|n | {z } (5.10) n razy | {z } n razy Stosując kryterium d’Alemberta dla szeregu liczbowego ∞ P an := n=0 ∞ P |N |n+1 G|Ω|n n=0 otrzymujemy: an+1 = lim |N ||Ω| < 1 |Ω| = 1 lim n→+∞ an |Ω| n→+∞ Na mocy kryterium d’Alemberta szereg +∞ P (5.11) an jest zbieżny. Zatem badanych n=0 szereg norm posiada zbieżną majorantę, co wobec kryterium Weierstrassa czyni go jednostajnie zbieżnym. Mając jednostajną zbieżność szeregu łatwo dowodzimy, że: Nf = N(g + Ng + . . .) (5.12) = 2 Ng + N g + . . . (5.13) = f −g (5.14) Co świadczy o tym, że suma szeregu von Neumanna jest rozwiązaniem równania całkowego. Pozostaje dowieść jednoznaczności rozwiązania. ROZDZIAŁ 5. TEORIA FREDHOLMA 33 Przypuśćmy istnienie dwóch funkcji f1 6= f2 będących rozwiązaniem równania f −Nf = g. Przez równość funkcji rozumiemy oczywiście równość w każdym punkcie dziedziny. Rozważmy funkcję h := f1 − f2 6= 0. Ze względu na liniowość operatora całkowego, funkcja h jest rozwiązaniem równania jednorodnego h − Nh = 0 i khk > 0. Zauważmy, jednak że: Z khk = kNhk ¬ |N |khkdx = |N ||Ω|khk (5.15) Ω 1 ¬ |N ||Ω| < 1 (5.16) Zatem otrzymaliśmy sprzeczność, która jest wynikiem przypuszczenia, że jest więcej niż jedna funkcja będąca rozwiązaniem równania. Szereg von Neumanna okazuje się być rozwiązaniem w bardzo wielu przypadkach dla różnych przestrzeni i różnych typów równań różniczkowych. 5.2 Alternatywa Fredholma W teorii Fredholma będziemy zajmować obliczeniami dla równań z jądrami specjalnymi. Jest to specyficzna podklasa funkcji całkowalnych w kwadracie modułu, która okazuje się mieć kluczowe znaczenie. Definicja 5.2.1. Jądra specjalne[3] Niech un , wn będą układami liniowo niezależnych funkcji klasy L2 (Ω). Równania całkowe dla operatorów całkowych o jądrach: N (x, y) = r X ui (x)wi (y) (5.17) k=1 nazywać będziemy równania całkowymi o jądrach specjalnych. Klasa ta jest w swej strukturze podobna do klasy funkcji zdegenerowanych. I okazuje się, że podobnie jak dla funkcji zdegenerowanych zachodzi, że dowolną funkcję o całkowalnym kwadracie modułu daje się przedstawić jako granicę pewnego ciągu jąder specjalnych. To podstawowe twierdzenie w tej teorii nazywać będziemy twierdzeniem o aproksymacji: Twierdzenie 5.2.2. O aproksymacji[3] Jeżeli jądro jest funkcją klasy L2 (Ω) to dla dowolnie małej liczby > 0 istnieje jądro specjalne spełniające warunek: ZZ r X |N (x, y) − uk (x)wk (y)|2 dxdy < (5.18) k=1 Ω×Ω Twierdzenie to zostawimy bez dowodu. Wnioskiem z tego twierdzenia jest podejrzenie posiadania przez jądro postaci sumy szeregu jąder specjalnych. Przyjrzyjmy się postaci równania całkowego gdy jego jądro ma postać jądra specjalnego. Wobec liniowości całki, otrzymujemy postać: Z r X f (x) = g(x) + uk (x) f (y)wk (y)dy, x ∈ Ω (5.19) k=1 Ω ROZDZIAŁ 5. TEORIA FREDHOLMA 34 Co jak łatwo spostrzec jest iloczynem skalarnym w L2 (Ω). Zatem f (x) = g(x) + r X uk (x)(f, wk ) (5.20) k=1 Wykonując mnożenie skalarne obu stron równania przez wektor funkcji w = (w1 , . . . , wr ) otrzymujemy układ r-równań postaci: (f, wi ) = (g, wi ) + r X (uk , wi )(f, wk ) (5.21) k=1 Zatem otrzymaliśmy układ r-równań i r-niewiadomych postaci (f, wi ), a jego rozwiązanie możemy odszukać dysponując algebrą liniową. Oczywiście istnieje jednoznaczne rozwiązanie tego układu jeśli układ ten jest opisany macierzą nieosobliwą. Jeśli macierz tego układu jest osobliwa, wtedy różnica pomiędzy jej stopniem a jej rzędem określa ilość niezerowych rozwiązań w układzie jednorodnym. Jako dodatkową uwagę poświęćmy postaci sprzężonego operatora do operatora o jądrze specjalnym. Okazuje się, że jest ono również specjalne i ma postać N ∗ (x, y) = r X wk (x)uk (y), x, y ∈ Ω (5.22) k=1 Co pozwala sprowadzić je przez analogię do postaci: (h, ui ) = (k, ui ) + r X (wk , ui )(h, uk ) (5.23) k=1 Zatem widać, że zachodzi związek pomiędzy macierzami obu układów. Niech C będzie macierzą układu normalnego, natomiast C ∗ do niego sprzężonego. Zauważmy, że c∗i,j = δi,j − (wj , ui ) = δi,j − (ui , wj ) (5.24) = δj,i − (uj , wi ) = δj,i − (uj , wi ) = cj,i (5.25) gdzie δi,j oznacza deltę Kroneckera. Oznacza to w szczególności zgodność rzędów obu macierzy co pociąga za sobą silne własności opisane w twierdzeniu nazywanym Alternatywą Fredholma. Pod pojęciem alternatywy w tym wypadku rozumieć będziemy badanie właściwości pewnego równania całkowego poprzez badanie własności innego. Tym innym równaniem będzie tzw. równanie całkowe z jądrem sprzężonym do danego wykorzystujące właśnie powyższą własność. Twierdzenie 5.2.3. Alternatywa Fredholma[3] Równania całkowe o jądrze klasy L2 (Ω × Ω) f − Nf = g (5.26) h − N∗ h = k (5.27) oraz Mają ROZDZIAŁ 5. TEORIA FREDHOLMA 35 Jednoznaczne rozwiązania dla dowolnych funkcji g i k, albo odpowiadające im równania jednorodne posiadają niezerowe rozwiązania, i liczba niezależnych liniowo rozwiązań każdego z tych równań jest taka sama W drugim przypadku warunkiem koniecznym i dostatecznym, na to by niejednorodne równanie całkowe miało rozwiązanie jest, żeby funkcja g była ortogonalna do wszystkich rozwiązań jednorodnego równania sprzężonego. Dowód powyższego faktu pominiemy, gdyż udowodnimy twierdzenie ogólniejsze. 5.3 Twierdzenie Fredholma Rozszerzenie alternatywy Fredholma doprowadziło do sformułowania twierdzenia Fredholma, które pełniej opisuje zachowanie rozwiązań. Twierdzenie oprzemy o równanie całkowe Fredholma drugiego rodzaju, ale z uwypukleniem wartości własnej jądra w tzn. równaniu postaci: Z f (x) − λ N (x, y)f (y)dy = g(x), x ∈ Ω (5.28) Ω i równaniu jednorodnym dla powyższego: Z f (x) − λ N (x, y)f (y)dy = 0, x∈Ω (5.29) Ω Twierdzenie 5.3.1. Twierdzenie Fredholma[2] 1. Na to aby równanie (5.28) miało dla każdej funkcji g, rozwiązanie f, potrzeba i wystarcza, aby jedynym rozwiązaniem równania jednorodnego (5.29) była funkcja f = 0 2. Jeżeli równanie (5.29) ma niezerowe rozwiązania, to istnieją również niezerowe rozwiązania jednorodnego równania sprzężonego, natomiast przestrzenie rozwiązań obu równań są przestrzeniami liniowymi o skończonych, i równych sobie, wymiarach algebraicznych. 3. Jeżeli równanie całkowe jednorodne ma niezerowe rozwiązania to warunkiem koniecznym i dostatecznym istnienia rozwiązania dla danej funkcji g jest ortogonalność funkcji g do przestrzeni rozwiązań jednorodnego równania sprzężonego tj. : Z (5.30) ∀h h − Nh = 0 ⇒ g(x)h(x)dx = 0 Ω 4. Zbiór wszystkich wartości własnych jądra równania (5.28) jest co najwyżej przeliczalny. Ustawienie wartości własnych w ciąg nieskończony, o ile jest możliwe, tworzy ciąg rozbieżny do nieskończości. ROZDZIAŁ 5. TEORIA FREDHOLMA 36 Przeprowadzimy dowód powyższego dla najbardziej interesującej nas przestrzeni L2 (Ω). Dowód. Naturalnie µ 6= 0. Zatem wprowadźmy operator całkowy N zbudowany w oparciu o jądro N . Tak zdefiniowany operator jest zwarty. Ad 1. Załóżmy, że dla każdej funkcji istnieje dokładnie jedno rozwiązanie. Wtedy oczywiście w szczególności istnieje dokładnie jedno dla zera. Jako, że równanie jest spełnione przez funkcję f=0, nie ma innego rozwiązania tego równania. Załóżmy z kolei, że równanie jednorodne nie ma niezerowych rozwiązań. Oznacza to brak wartości własnych. Na mocy twierdzenia Teorii Riesza 3.5.1 zatem widmo tego operatora jest puste. Zatem każde λ 6= 0 jest wartością regularną i równanie ma jednoznaczne rozwiązanie dla dowolnego g. Ad 4. Wobec Teorii Riesza 3.5.1 jest to wniosek z 3 części jej tezy. Ad 2. & 4. Wynikają wprost z twierdzenia 3.5.3. 5.4 Przykłady Zastosowanie metody kolejnych przybliżeń W zadaniach gdy spodziewamy się rozwiązania w postaci szeregu von Neumanna, możemy stosować metodę kolejnych przybliżeń. Rozważmy równanie postaci f = g + Kf, f, g ∈ C(R), K ∈ B(C(R)) (5.31) z jądrem K : R × R → R ciągłym. Spodziewając się rozwiązania w postaci szeregu von Neumanna obliczamy kolejne funkcje sum częściowych. Przykład 1. Rozwiążmy równanie całkowe metodą kolejnych przybliżeń: Z1 f (x) = 1 + xt2 f (t)dt (5.32) 0 Obliczmy kilka pierwszych sum szeregu von Neumanna. f0 (x) = 1 (5.33) Z1 f1 (x) = 1+ 1 xt2 dt = 1 + x 3 (5.34) 1 1+4 xt2 (1 + t)dt = 1 + x 3 3·4 (5.35) 0 Z1 f2 (x) = 1+ 0 Z1 f3 (x) = 1+ 0 xt2 (1 + 5 1 + 4 + 42 t)dt = 1 + 12 3 · 42 (5.36) ROZDZIAŁ 5. TEORIA FREDHOLMA 37 Stąd odgadujemy postać ogólną n-tej funkcji sumy częściowej, n ∈ N. 1 1 1 1 fn (x) = 1 + x (1 + + 2 + . . . + n−1 ) 3 4 4 4 (5.37) Zatem suma szeregu o sumach częściowych tej postaci wyraża się wzorem: 1 1 f (x) = 1 + x 1 · 3 1− 1 4 1 4 4 =1+x · =1+x 3 3 9 (5.38) Łatwo sprawdzić, że jest to rozwiązanie równania całkowego. Z1 1+ 1 4 1 4 4 xt2 (1 + t )dt = 1 + x( + · ) = 1 + x 9 3 9 4 9 (5.39) 0 Badanie równania o jądrze specjalnym metodą Fredholma Równania całkowe bardzo często w praktyce mają bardzo prostą postać z jądrem operatora z klasy jąder specjalnych. Pozwala to zastosować analizę Fredholma, która rozstrzyga np. istnienie rozwiązania. Przykład 2. Zbadajmy równanie Fredholma o postaci: Z1 f (x) − (y 3 + xy 2 + x2 y)f (y)dy = g(x), x∈R (5.40) 0 Jądra składa się z sumy 3 iloczynów. Odpowiednie funkcje to u1 (x) = 1 w1 (y) = y 3 (5.41) u2 (x) = x w2 (y) = y 2 (5.42) u3 (x) = x2 w3 (y) = y (5.43) Zatem zapiszmy je w postaci wektorów u = [u1 , u2 , u3 ]T , w = [w1 , w2 , w3 ]T . Wtedy stosując mnożenie macierzowe (i zakładając, że mnożeniem elementów jest iloczyn skalarny z L2 (R) ) otrzymujemy: 1 1 1 (u1 , w1 ) (u1 , w2 ) (u1 , w3 ) 4 3 2 u · wT = (u2 , w1 ) (u2 , w2 ) (u2 , w3 ) = 51 14 13 (5.44) 1 1 1 (u3 , w1 ) (u2 , w2 ) (u3 , w3 ) 6 5 4 Wtedy macierz układu, uzyskanego za pomocą metody Fredholma dla równań całkowych z jądrem specjalnym, wyraża się wzorem 3 − 31 − 12 4 3 − 13 I3 − u · wT = − 51 (5.45) 4 1 1 3 −6 −5 4 Wyznacznik tej macierzy nazywa się wyznacznikiem charakterystycznym. Wyznacznik powyższej macierzy wynosi det I3 − u · wT ≈ −0.2209 6= 0 (5.46) Zatem wobec niezerowości wyznacznika równanie całkowe posiada jednoznaczne rozwiązanie. Rozdział 6 Teoria Hilberta-Schmidta 6.1 Równanie całkowe o jądrze symetrycznym W niniejszym rozdziale zawężamy obszar naszych rozważań do wąskiej klasy równań z jądrami symetrycznymi nad przestrzenią funkcji całkowalnych w kwadracie modułu. Zgodnie z teorią omówioną w rozdziale 4.6 będziemy tu badać operatory o jądrach samosprzężonych. Definicja 6.1.1. Równanie całkowe o jądrze symetrycznym[2] Niech A ∈ B(L2 (Ω)) będzie operatorem całkowym postaci Z (Au)(x) = A(x, y)u(y)dy (6.1) Ω z jądrem A ∈ L2 (Ω × Ω) i symetrycznym tj. A(x, y) = A(y, x), prawie wszędzie na Ω × Ω. Wiemy, że tak zdefiniowany operator jest samosprzężony i zwarty. Określmy jeszcze pewne dodatkowe kryteria na jądro. Definicja 6.1.2. Warunek Hilberta - Schmidta[2] Powiemy, że jądro A spełnia warunek Hilberta-Schmidta jeśli istnieje liczba γ > 0 taka, że Z |A(x, y)|2 dy ¬ γ x∈Ω (6.2) Ω Warunek Hilberta-Schmidta określa zatem podklasę L2 (Ω) funkcji o ograniczonej funkcji całki z kwadratu modułu. Jeszcze silniejszym warunkiem na jądro jest warunek o zbiorze o mierze lokalnie dodatniej. Definicja 6.1.3. Zbiór o mierze lokalnie dodatniej[2] Powiemy, że Ω jest zbiorem zwartym o mierze lokalnie dodatniej gdy |Ω ∩ K(xo , r)| > 0 (6.3) dla każdej kuli K(x0 , r) o środku w x0 ∈ Ω. Powyższy warunek w połączeniu z ciągłością jądra okazuje się być silniejszym od warunku Hilberta-Schmidta. 38 ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA 6.2 39 Pełny układ ortonormalny elementów własnych Ostatnim koniecznym pojęciem jest układ ortonormalny zupełny elementów własnych. Przestrzenią naszych rozważań jest przestrzeń Hilberta X z operatorem samosprzężonym A odwzorowującym X w siebie. Na mocy twierdzenia teorii Riesza 3.5.1 wszystkie wartości własne da się ustawić w ciąg. Wszystkie podprzestrzenie własne operatora są skończenie wymiarowe i każda z nich posiada swoją bazę ortonormalną. Układ stworzony poprzez połączenie baz ortonormalnych wszystkich podprzestrzeni własnych nazywać będziemy pełnym układem ortonormalnym elementów własnych. Łatwo zauważyć, że jest to faktycznie układ ortonormalny, gdyż twierdzenie 4.6.2 potwierdza, że elementy różnych przestrzeni własnych są do siebie ortogonalne. Podajmy bez dowodu lemat i twierdzenie[2], które uzasadnią istotność takiego układu. Lemat 6.2.1. Niech X będzie przestrzenią Hilberta, a (ek ) niech będzie układem zupełnym ortonormalnym elementów własnych pewnego operatora samosprzężonego zwartego A ∈ B(X). Wtedy dla każdego elementu x ∈ X istnieje dokładnie jeden element x0 ∈ X taki, że Ax0 = 0 oraz X x = x0 + (x, ek )ek (6.4) k I twierdzenie, które jest w zasadzie wnioskiem z powyższego. Twierdzenie 6.2.2. Niech X będzie przestrzenią Hilberta, a przez (ek ) niech będzie oznaczony układem zupełnym ortonormalnym elementów własnych pewnego operatora samosprzężonego zwartego A ∈ B(X) oraz niech (λk ) oznacza odpowiadający mu pełny układ ortonormalny wartości własnych. Wtedy dla każdego elementu x ∈ X zachodzi: X Ax = λk (x, ek )ek (6.5) k Dowód wynika bezpośrednio z podziałania na obie stron tezy lematu za pomocą operatora A. Ciekawym zagadnieniem jest pytanie o warunek konieczny i dostateczny na to by układ pełny ortonormalny był skończony. Zależy to oczywiście jedynie od tego czy zbiór wartości własnych jest skończony. Okazuje się, że tak jest jedynie w przypadku gdy jądro operatora jest zdegenerowane. Gdy zdegenerowane nie jest - ciąg wartości własnych jest nieskończony. 6.3 Twierdzenie Hilberta-Schmidta Dysponując powyższymi pojęciami jesteśmy w stanie podać twierdzenie HilbertaSchmidta Twierdzenie 6.3.1. Twierdzenie Hilberta - Schmidta[2] Niech będzie dane jądro symetryczne niezdegenerowane A ∈ L2 (Ω × Ω). Oznaczmy przez (uk ) pełny układ ortonormalny funkcji własnych jądra A, a przez (µk ) ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA ciąg odpowiadających wartości własnych. Niech Z v(x) = A(x, y)u(y)dy, gdzie 40 u ∈ L2 (Ω) Ω Wtedy 1. Funkcja v jest sumą swojego szeregu Fouriera względem układu (uk ) ∞ X v= (v|uk )uk (6.6) k=1 w sensie zbieżności w przestrzeni L2 (Ω). 2. Jeżeli jądro A spełnia warunek Hilberta - Schmidta to szereg (6.6) jest zbieżny bezwzględnie i jednostajnie na Ω i dla prawie każdego x ∈ Ω zachodzi równość ∞ X v(x) = (v|uk )uk (x) (6.7) k=1 3. Jeżeli Ω jest zbiorem zwartym o mierze lokalnie dodatniej, a jądro A ciągłe, to równość (6.7) zachodzi w dowolnym punkcie x ∈ Ω. Dowód. Ad. 1o Wobec twierdzenia 6.2.2 wiemy, że v = Au = ∞ X 1 (u, uk )uk µk (6.8) k=1 i że jest to zbieżność w sensie przestrzeni L2 (Ω). Zauważmy, że: Z (v, uk ) = v(t)uk (t)dt (6.9) Ω Z Z = A(s, t)u(s)uk (t)dsdt (6.10) A(t, s)u(s)uk (t)dtds (6.11) Ω Ω Z Z = Ω Ω Z Z A(t, s)uk (t)dt)ds u(s)( = Ω (6.12) Ω Z u(s)(Auk (s))ds = (6.13) Ω Z 1 uk (s))ds λk (6.14) u(s)(uk (s))ds (6.15) u(s)( = Ω Z = 1 λk = 1 (u, uk ) λk Ω (6.16) ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA 41 Co po podstawieniu kończy dowód 1o . Ad. 2o Załóżmy, że jądro spełnia warunek Hilberta-Schmidta. Z |A(x, y)|2 dy ¬ γ x ∈ Ω (6.17) Ω Korzystając z nierówności Schwarza otrzymujemy: m X m X uk (x) ||(u, uk )| ¬ | λk k=n v v u m u m u X uk (x) u X ¬ t | |(u, uk )|2 |2 t λk |(v|uk )uk (x)| = k=n k=n (6.18) (6.19) k=n dla wszystkich x ∈ Ω, oraz dowolnych wskaźników m n. W części 1o udowodniliśmy własność postaci : (v, uk ) = λ1k (u, uk ). Zauważmy, że jest to równoważne: uk (t) = λk Z A(t, s)uk (s)ds (6.20) Ω Zatem ciąg ukλ(x) jest dla ustalonego x współczynnikiem Fouriera funkcji A(x, .) k przy uk . Wobec nierówności Bessel’a otrzymujemy: Z ∞ X uk (x) 2 | | ¬ |A(s, t)|2 dt ¬ γ, x ∈ Ω λk k=1 (6.21) Ω Łącząc powyższe z (6.19), otrzymujemy: m X v u m √ uX |(v|uk )uk (x)| ¬ γ t |(u, uk )|2 k=n Wobec zbieżności szeregu zbieżność w szeregu ∞ P (6.22) k=n ∞ P |(u, uk )|2 otrzymujemy bezwględną i jednostajną k=1 |(v|uk )uk (x)|. Ponieważ zbiega on średnio kwadratowo k=n do funkcji v, zatem równość w (6.6) zachodzi prawie wszędzie. Ad. 3o Łatwo zauważyć, że funkcje uk są ciągłe. Prawa strona w (6.6) jest funkcją ciągłą swojego argumentu jako suma jednostajnie zbieżnego szeregu funkcji ciągłych. Lewa strona tego równania też jest ciągła, gdyż jądro jest ciągłe. Wobec założenia o mierze lokalnie dodatniej zbioru Ω otrzymujemy, że równość tych funkcji zachodzi dla każdego argumentu. Co kończy dowód twierdzenia. Twierdzenie Hilberta-Schmidta pozwala nam poznać dokładną budowę funkcji g z równania Af = g. Jednakże, znając postać układu pełnego ortogonalnego, również w łatwy sposób będziemy w stanie wyznaczyć rozwiązanie takiego ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA 42 równania. Bowiem ze wzorów na współczynniki Fouriera Z 1 (v, uk ) = u(y)uk (y)dy λk (6.23) Ω Może być łatwiej wyznaczyć rozwiązanie niż z wyjściowego równania. 6.4 Twierdzenie Mercer’a Ostatnim twierdzeniem w tym rozdziale jest twierdzenie Mercera opisujące postać jądra dla równania całkowego symetrycznego niezdegenerowanego. Twierdzenie 6.4.1. Twierdzenie Mercera[2] Niech Ω będzie zbiorem zwartym o mierze dodatniej, a A - jądrem symetrycznym ciągłym i niezdegenerowanym, które posiada wyłącznie dodatnie wartości własne. Niech (uk ) oznacza pełny ortonormalny układ funkcji własnych jądra A oraz (µk ) odpowiadający ciąg wartości własnych to wtedy w każdym punkcie (x, y) ∈ Ω × Ω zachodzi równość A(x, y) = ∞ X uk (x)uk (y) k=1 (6.24) µk przy czym szereg ten jest zbieżny bezwzględnie i jednostajnie. Zanim przystąpimy do dowodu przytoczmy następujące lematy: Lemat 6.4.2. Niech X przestrzeń Hilberta, a przez (ek ) niech będzie oznaczony układem zupełnym ortonormalnym elementów własnych pewnego operatora samosprzężonego zwartego A ∈ B(X) oraz niech (λk ) odpowiadający pełny układ ortonormalny wartości własnych. Wtedy dla każdego elementu x ∈ X zachodzi: X (Ax, x) = λk |(x, ek )|2 (6.25) k Powyższy lemat okazuje się być wnioskiem z lematu 6.2.1 oraz twierdzenia 6.2.2. Lemat 6.4.3. Jeżeli Ω jest zbiorem zwartym o mierze lokalnie dodatniej, uk jest układem pełnym ortonormalnym funkcji własnych jądra symetrycznego ciągłego i niezdegenerowanego A określonego na produkcie Ω × Ω, a λk odpowiadający ciąg wartości własnych jądra to poniższy szereg jest zbieżny jednostajnie Z ∞ X uk (x) 2 | | = |A(x, y)|2 dy, λk k=1 x∈Ω (6.26) Ω Dowód. Dowód twierdzenia Mercer’a[2] Rozważmy jądra postaci An (x, y) = A(x, y) − n X uk (x)uk (y) k=1 λk , n∈N (6.27) ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA 43 Przez A oraz dla dowolnego n ∈ N, przez An rozumieć będziemy operatory całkowe o odpowiednim jądrze. Łatwo sprawdzić, że wtedy: (An u, u) = (Au, u) − n X 1 |(u, uk )|2 , µk n∈N (6.28) k=1 Wobec lematu Z∞ (Au, u) = 1 |(u, uk )|2 λk (6.29) k=1 Czego efektem jest równość: Z∞ (An u, u) = 1 |(u, uk )|2 λk (6.30) k=n+1 Co równoważnie oznacza, że: ZZ An (x, y)u(x)u(y)dxdy 0 (6.31) Ω×Ω Łatwo zauważyć, że An (x, x) 0, x ∈ Ω. Gdyby było inaczej, istniało by otoczenie otwarte na którym jądro było by ujemne. Wtedy biorą za u funkcję charakterystyczną tego obszaru uzyskalibyśmy sprzeczność z powyższym warunkiem. Zatem n X |uk (x)|2 An (x, x) = A(x, x) − 0 (6.32) λk k=1 Wobec nieujemności wyrazów i ograniczenia górnego poprzez µ := sup A(x, x), x∈Ω szereg ten jest zbieżny. Wobec nierówności Schwarza: | m X uk (x)uk (y) 2 | λk ¬ k=n ¬ m m X |uk (x)|2 X |uk (y)|2 ¬ λk λk k=n m X µ k=n (6.33) k=n |uk (x)|2 λk (6.34) Za dla dowolnie ustalonego x ∈ Ω jest to szereg jednostajnie zbieżny ze względu na y ∈ Ω. Suma szeregu jest funkcją ciągłą zmiennej y. Zauważmy, że: Z |A(x, y) − k=1 Ω Z (A(x, y) − = Ω Z = Ω n X uk (x)uk (y) λk n X uk (x)uk (y) k=1 |A(x, y)|2 − λk |2 dy = ) · (A(x, y) − n X uk (x) 2 lemat | | −→ 0 n→+∞ λk k=1 (6.35) n X uk (x)uk (y) k=1 λk )dy =(6.36) (6.37) ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA Stąd otrzymujemy ∞ X |uk (x)|2 k=1 λk 44 = A(x, x) (6.38) Twierdzenie Diniego podaje, że szereg ten jest jednostajnie zbieżny. Zatem ostatecznie korzystając z prostej nierówności: |uk (x)uk (y)| ¬ Otrzymujemy tezę. 1 (|uk (x)|2 + |uk (y)|2 ), 2 x, y ∈ Ω, k ∈ N (6.39) Bibliografia [1] Walter Rudin, Analiza Funkcjonalna, PWN 2002, Warszawa [2] Witold Kołodziej, Wybrane rozdziały analizy matematycznej, PWN 1970, Warszawa [3] Adam Piskorek, Równania całkowe, WNT 1980, Warszawa [4] William Arveson, A Short Course on Spectral Theory, Springer-Verlug 2002, New York [5] Andrzej Alexiewicz, Analiza funkcjonalna, PWN 1969, Warszawa [6] Witold Pogorzelski, Równania całkowe i ich zastosowania Tom I, PWN 1953, Warszawa [7] M.A. Krasnosielski, A.I. Koszelew, S.G. Michlin, Ł.S. Rakowszczik, W.J. Stiecenko, P.P. Zabrejko, Równania całkowe, PWN 1972, Warszawa 45