Praca magisterska Równania całkowe i teoria Hilberta

Transkrypt

Praca magisterska Równania całkowe i teoria Hilberta
Politechnika Łódzka
wydział FTIMS
Praca magisterska
Równania całkowe i teoria
Hilberta-Schmidta
Piotr Kowalski
Promotor Pracy : dr Jerzy Kalina
Kierunek: Matematyka Stosowana
Specjalność: Matematyka Finansowa i Ubezpieczeniowa
Nr albumu: 133968
Wydział FTIMS
Łódź 2010
Streszczenie
Praca gromadzi pojęcia i twierdzenia teorii operatorów, z wyszczególnieniem
operatorów całkowych oraz omawia podstawy teorii Fredholma równań całkowych i teorię Hilbert’a-Schmidt’a.
Dedykacja
Pracę dedykuje osobie, która najbardziej na świecie pragnęła ją zobaczyć. Mojemu
dziadkowi Julianowi Lesiakowi, zmarłemu 25.06.2010. Człowiekowi, któremu
zawdzięczam motywację do studiów, czynnego rozwijania się i dążenia do wyższych
celów, świadom tego że bez jego wpływu ta praca by nie powstała.
Spis treści
1 Wstęp
2
2 Preliminaria
2.1 Przestrzenie liniowo-topologiczne . . . . . . . . . . . . . . . . . .
2.2 Przestrzenie Banacha, przestrzenie Hilberta . . . . . . . . . . . .
2.3 Przestrzenie C(Ω) oraz L2 (Ω) . . . . . . . . . . . . . . . . . . . .
2.4 Kryterium Ascoliego . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Przestrzeń odwzorowań ograniczonych i przestrzeń do niej sprzężona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
3
3
5
6
6
3 Operatory
3.1 Operatory liniowe ograniczone . . . . . . .
3.2 Operatory sprzężone . . . . . . . . . . . .
3.3 Operatory zwarte - operatory pełnociągłe
3.4 Teoria spektralna, widmo operatora . . .
3.5 Widmo operatora zwartego . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
8
9
12
14
16
4 Operatory całkowe
4.1 Operatory całkowe . . . . . . . .
4.2 Rodzaje operatorów całkowych .
4.3 Jądra słabo osobliwe . . . . . . .
4.4 Klasyfikacja równań całkowych .
4.5 Zwartość operatorów całkowych .
4.6 Operator sprzężony w przestrzeni
. . . .
. . . .
. . . .
. . . .
. . . .
L2 (Ω)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
21
21
23
25
25
28
5 Teoria Fredholma
5.1 Równania całkowe o jądrach
5.2 Alternatywa Fredholma . .
5.3 Twierdzenie Fredholma . .
5.4 Przykłady . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Hilberta
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
31
31
33
35
36
6 Teoria Hilberta-Schmidta
6.1 Równanie całkowe o jądrze symetrycznym . . .
6.2 Pełny układ ortonormalny elementów własnych
6.3 Twierdzenie Hilberta-Schmidta . . . . . . . . .
6.4 Twierdzenie Mercer’a . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
38
38
39
39
42
ograniczonych
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
1
.
.
.
.
Rozdział 1
Wstęp
W pracy w sposób spójny udało się zaprezentować wybrane aspekty analizy
funkcjonalnej, teorii operatorów, topologii, równań różniczkowych i algebry. Zaprezentowany materiał pozwala omówić najważniejsze aspekty teorii Fredholma oraz teorii Hilberta-Schmidta. Przedstawiona teoria pozwala czytelnikowi w
sposób pełniejszy niż w [2] czy [1] zrozumieć przedstawione rozumowania. Podana została spójna teoria dotycząca operatorów sprzężonych definiowanych w
różnych przestrzeniach. Wśród wielu dowodów z teorii operatorów m.in. uzupełniony został dowód twierdzenia 3.2.3, pozwalając czytelnikowi na zrozumienie
w pełni jego treści. Została wprowadzona zmodyfikowana definicja operatora
sprzężonego w przestrzeni Hilberta, pozwalająca na pełną zgodność dwóch różnych metod wprowadzania operatora sprzężonego odszukanych w literaturze
fachowej [1] [2], która wykazuje pełną zgodność obu podejść. Rozwinięty został
dowód twierdzenia 3.5.1 o uzasadnienie rzeczy odebranych jako niejasności. Do
dowiedzenia tego twierdzenia został wykorzystany autorski lemat 3.5.2, który
stanowi rozszerzenie prostej obserwacji zaobserwowanej w czasie dowodzenia
twierdzenia Riesza. W rozdziale 5 rozszerzone, względem twierdzenia podanego
przez [3], i udowodnione zostało twierdzenia o rozwiązaniu w postaci szeregu
von Neumanna. Praca została uzupełniona o przykłady dokumentujące, niektóre zastosowania teorii operatorów całkowych i teorii Fredholma. W przykładzie
2 zaprezentowany jest alternatywny sposób zapisu metody przedstawionej w
[3], wykorzystujący proste fakty z algebry liniowej, który w sposób bardzo ciekawy, szybki i treściwy pozwala wyprowadzać macierz układu równań liniowych
dla przekształceń Fredholma. Pokazuje on kolejną ciekawą analogię pomiędzy
równaniami całkowymi a układami równań algebraicznych.
2
Rozdział 2
Preliminaria
2.1
Przestrzenie liniowo-topologiczne
W niniejszej pracy zakładać będziemy że każda przestrzeń będzie przestrzenią
liniowo-topologiczną. Pojęcie to wymaga wyjaśnienia tym bardziej iż stanowi
ono podstawę współczesnej analizy funkcjonalnej. Przestrzeń ta stanowi najogólniejszą znaną obecnie strukturę łączącą cechy przestrzeni algebraicznych,
takie jak możliwość ’dodawania’ elementów przestrzeni i ’mnożenia przez skalar’,
łącząc je z topologicznymi podstawami ciągłości funkcji określanych pomiędzy
poszczególnymi przestrzeniami liniowo-topologicznymi, w sposób zachowujący
ciągłość działań algebraicznych.
Definicja 2.1.1. Przestrzeń liniowo-topologiczna[1]
Niech τ będzie topologią na przestrzeni liniowej X. Jeśli spełnione są następujące
warunki:
1. Każdy punkt przestrzeni jest zbiorem domkniętym,
2. operacje przestrzeni liniowej są ciągłe względem topologii τ
to τ nazywamy topologią liniową, natomiast parę (X, τ ) nazywamy przestrzenią
liniowo-topologiczną.
Przestrzenie liniowo-topologiczne są tak istotne z punktu widzenia analizy funkcjonalnej gdyż niemal wszystkie rozważane przestrzenie funkcyjne posiadają jej strukturę. Posługiwanie się jednak samymi przestrzeniami liniowotopologicznymi jest wielce niewygodne, dlatego częściej sięga po bogatsze we
właściwości jej podklasy. Głównym czynnikiem powodującym wspomniane niedogodności jest konieczność korzystania z obiektów topologii w jej najogólniejszym charakterze. Wiemy jednakże, że znaczna część rozważanych topologii należy do topologii metryzowalnych, i to ta cecha będzie stanowić o kierunku
zawężania klasy rozważań w niniejszej pracy.
2.2
Przestrzenie Banacha, przestrzenie Hilberta
Krokiem w kierunku metryzowalnych przestrzeni liniowo-topologicznych są przestrzenie unormowane. Główny pojęciem, którym będziemy się posługiwać jest
funkcja normy, zwana też po prostu normą.
3
ROZDZIAŁ 2. PRELIMINARIA
4
Definicja 2.2.1. Przestrzeń unormowana[1]
Przestrzeń liniową X nazywamy unormowaną jeśli istnieje funkcja k.k, która
każdemu x ∈ X przyporządkowuje liczbę rzeczywistą nieujemną, w taki sposób,
że:
1. kx + yk ¬ kxk + kyk, x, y ∈ X
2. kαxk = |α|kxk, x ∈ X, α ∈ K, gdzie K jest ciałem skalarów
3. kxk = 0 ⇐⇒ x = 0
Wprowadzenie normy w danej przestrzeni pozwala w łatwy sposób porównywać obiekty danej przestrzeni względem pewnej cechy. Każda przestrzeń unormowana jest metryczna, gdyż wystarczy za metrykę wziąć normę różnicy argumentów. Podobnie znaczna część przestrzeni metrycznych staje się unormowana,
gdy wybierając arbitralnie pewien element, w miejsce normy przypisujemy jego odległość od wskazanego elementu. Posiadanie pojęcia normy pozwala nam
stosować wielce wygodne definicje ciągowe własności takich jak ciągłość czy
zwartość.
Definicja 2.2.2. Przestrzeń Banacha[1]
Przestrzeń unormowaną zupełną nazywamy przestrzenią Banacha.
Przestrzenie Banacha stanowią istotną podklasę przestrzeni unormowanych.
Przykładem przestrzeni
Banacha jest każda przestrzeń euklidesowa n-wymiarowa
s
n
P
x2k . Istotnym dla nas będą również przenoszenia zupełności
z normą kxk =
k=1
na rozważane przez nas przestrzenie odwzorowań tj. przestrzenie operatorów.
Definicja 2.2.3. Przestrzeń unitarna[1]
Zespoloną przestrzeń liniową H nazywamy przestrzenią unitarną, jeśli każdej
parze wektorów z H możemy przyporządkować liczbę zespoloną oznaczaną (x, y),
nazywaną iloczynem skalarnym wektorów x i y, tak, że spełnione są poniższe
warunki
1. (y, x) = (x, y) - gdzie kreska górna odpowiada sprzężeniu liczby zespolonej
2. (x + y, z) = (x, z) + (y + z)
3. (αx, y) = α(x, y)
4. (x, x) ­ 0
5. (x, x) = 0 ⇔ x = θ
Dla dowolnych ∀x, y, z ∈ H, ∀α ∈ C
Przestrzenie unitarne są najważniejszą podklasą spośród przestrzeni unormowanych. Łatwo bowiem zauważyć, że każda przestrzeń unitarna jest unormowana i metryczna. Jest tak gdyż istnienie iloczynu skalarnego implikuje istnienie
normy, oraz metryki. Normę definiuje się poprzez iloczyn skalarny w sposób
p
kxk = (x, x)
(2.1)
Przestrzenie unitarne mogą byc zupełne lub nie. Te zupełne, zgodnie z poniższą
definicją, będziemy nazywać hilbertowskimi.
ROZDZIAŁ 2. PRELIMINARIA
5
Definicja 2.2.4. Przestrzeń Hilberta[1]
Niech H przestrzeń unitarna. Jeśli jest ona przestrzenią zupełną z normą zdefiniowaną
p
kxk = (x, x)
(2.2)
to nazwiemy ją przestrzenią Hilberta.
Przestrzenie Hilberta posiadają znaczną ilość własności dotyczących np. geometrii rozważanych w niej obiektów. Wiele fizycznych modeli okazuje się być
przestrzeniami Hilberta. Łatwym do zaobserwowania faktem jest, że każda przestrzeń Hilberta jest przestrzenią Banacha.
2.3
Przestrzenie C(Ω) oraz L2 (Ω)
Spośród wielu przestrzeni funkcyjnych, najbardziej fundamentalnymi będą przestrzenie funkcji ciągłych na zbiorze zwartym oznaczane przez C(Ω) oraz przestrzeń funkcji całkowalnych z kwadratem L2 (Ω). Całkowanie w niniejszej pracy będziemy rozumieli zawsze jako całkowanie w sensie Lebesgue’a, natomiast
wszystkie funkcje będą funkcjami zespolonymi. O zbiorze Ω, który stanowić
będzie dziedzinę rozważanych funkcji, zakładamy że jest podzbiorem pewnej nwymiarowej przestrzeni euklidesowej. W większości przypadków zakładamy, że
jest on zwartym podzbiorem, chyba że odpowiednie założenia stanowią inaczej.
Pierwszą z wspomnianych dwóch przestrzeni jest przestrzeń funkcji ciągłych
określonych na zwartym podzbiorze pewnej przestrzeni euklidesowej.
Definicja 2.3.1. Przestrzeń C(Ω)[2]
Niech Ω będzie zwartym podzbiorem m-wymiarowej przestrzeni euklidesowej.
Przestrzenią C(Ω) nazwiemy przestrzeń wszystkich funkcji ciągłych określonych
na zbiorze Ω z działaniami dodawania funkcji oraz mnożenia funkcji przez skalar. W przestrzeni tej wprowadza się następującą normę:
kuk = sup |u(x)|
(2.3)
x∈Ω
Jest to zatem przestrzeń liniowa unormowana. Skończoność kresu wynika
z kryterium Weierstrassa, zaś aksjomaty normy są trywialne w dowodzie, na
mocy własności modułu. Ponadto przy tak zdefiniowanej normie, łatwo zauważyć, że zbieżność w przestrzeni C(Ω) odpowiada zbieżności jednostajnej. Przestrzeń ta okazuje się być również zupełną. Zatem jest to funkcyjna przestrzeń
Banacha.
Przestrzenią ogólniejszą od C(Ω) jest druga z przestrzeni, mianowicie przestrzeń funkcji o całkowalnym w sensie Lebesgue’a kwadracie modułu. Oczywiście wszystkie funkcje ciągłe określone na podzbiorze zwartym są całkowalne
w sensie Lebesgue’a.
Definicja 2.3.2. Przestrzeń L2 (Ω)[2]
Niech dany będzie podzbiór mierzalny Ω przestrzeni m-wymiarowej euklidesowej i niech będzie on miary dodatniej. Przestrzenią L2 (Ω) nazwiemy przestrzeń
wszystkich funkcji u mierzalnych w sensie Lebesgue’a określonych na zbiorze Ω
takich, że:
Z
|u(x)|2 dx < ∞
(2.4)
Ω
ROZDZIAŁ 2. PRELIMINARIA
6
Przyjmujemy umowę, że dwie funkcje uważamy za równe, gdy są równe prawie wszędzie. Wykazuje się, że przestrzeń L2 (Ω) jest liniowa, gdy dołączymy
działania dodawania i mnożenia funkcji przez skalar. Przestrzeń L2 (Ω) jest przestrzenią unitarną z operacją iloczynu skalarnego zdefiniowanego w poniższy sposób:
Z
(2.5)
(u, v) = u(x)v(x)dx , u, v ∈ L2 (Ω)
Ω
Dowodzi się, że przestrzeń L2 (Ω) jest przestrzenią zupełna. Zatem jest to
funkcyjna przestrzeń Hilberta.
2.4
Kryterium Ascoliego
W niniejszej pracy bardzo często wykorzystywane będzie często pojęcie zwartości. Dowodzenie zwartości określonych zbiorów za pomocą definicji w przestrzeniach, czy to topologicznych, czy metrycznych, jest nie rzadko trudne i uciążliwe.
W zależności od różnych przestrzeni w których prowadzone będą rozważania, zostały udowodnione różne kryteria. W przestrzeni C(Ω) takim kryterium jest np.
kryterium Ascoliego, które podaje warunek konieczny i dostateczny zwartości
domknięcia zbioru w przestrzeni C(Ω).
Rozważmy zbiór funkcji Z określonych na zwartym zbiorze Ω. Do wprowadzenia kryterium potrzebne będą dwa pojęcia. Powiemy, że funkcje ze zbioru Z
są wspólnie ograniczone, jeżeli istnieje taka liczba rzeczywista µ, że
ku(x)k ¬ µ, x ∈ Ω, u ∈ Z
(2.6)
Z kolei funkcje tego zbioru Z nazwiemy jednakowo ciągłymi jeśli
∀ > 0∃δ > 0∀x1 , x2 ∈ Ω∀u ∈ Z
kx1 − x2 k ¬ δ ⇒ ku(x1 ) − u(x2 )k ¬ (2.7)
Dysponując tymi dwoma pojęciami możemy podać twierdzenie Ascoliego. Dowód twierdzenia można znaleźć w [2] roz. 26.4.
Twierdzenie 2.4.1. Twierdzenie Ascoliego[2]
Zbiór funkcji Z ⊂ C(Ω) ma zwarte domknięcie wtedy i tylko wtedy, gdy funkcje
zbioru Z są wspólnie ograniczone i jednakowo ciągłe.
W literaturze spotyka się określenie zbiorów których domknięcie jest zwarte
jako zbiory prezwarte. Będziemy używać zamiennie obu pojęć: zbioru prezwartego i zbioru o zwartym domknięciu.
2.5
Przestrzeń odwzorowań ograniczonych i przestrzeń do niej sprzężona
Kluczowym pojęciem rozważanym w tej pracy będzie odwzorowanie ograniczone
liniowe, lub jak będziemy równoważnie je określać, operator ograniczony liniowy.
Definicja 2.5.1. Odwzorowania ograniczone liniowe[1]
Niech X, Y przestrzenie liniowo-topologiczne, oraz niech będzie dane odwzorowanie liniowe A : X → Y . Powiemy, że odwzorowanie A jest ograniczone jeśli
obraz dowolnego zbioru ograniczonego jest ograniczony.
ROZDZIAŁ 2. PRELIMINARIA
7
Podstawową strukturą w analizie funkcjonalnej jest przestrzeń operatorów
ograniczonych liniowych. Jej rozważanie jest tym bardziej kluczowe, gdyż okazuje się że znaczna część własności przestrzeni liniowo-topologicznych bywa przeniesiona do przestrzeni operatorów.
Definicja 2.5.2. Przestrzeń B(X,Y)[1]
Dla przestrzeni liniowo topologicznych X, Y przez B(X,Y) będziemy rozumieli
przestrzeń wszystkich ograniczonych odwzorowań liniowych z X do Y. Ponadto
przez B(X) będziemy rozumieli przestrzeń B(X,X).
Przestrzeń operatorów B(X, Y ) jest oczywiście przestrzenią liniowo-topologiczną,
ze zdefiniowanym w sposób naturalny dodawaniem operatorów oraz mnożeniem
przez skalary. Szczególnym przypadkiem przestrzeni operatorów ograniczonych
okazuje się być przestrzeń liniowych ograniczonych funkcjonałów przestrzeni X.
Funkcjonałem nazywamy operator o wartościach w ciele skalarów.
Definicja 2.5.3. Przestrzeń sprzężona[1]
Niech X,Y będą unormowanymi przestrzeniami liniowo topologicznymi, oraz
niech Y będzie ciałem skalarów. Wtedy przestrzeń B(X,Y) nazywać będziemyprzestrzenią sprzężoną do X i oznaczać przez X ∗ .
Łatwo zauważyć, że wobec rozważania jedynie zupełnych ciał skalarów, przestrzeń sprzężona, o ile jest unormowana, okazuje się być zawsze przestrzenią
Banacha. W kwestii notacji dodatkową umową będzie, że elementy przestrzeni sprzężonych będzie oznaczali symbolami zawierającymi analogiczny symbol
gwiazdki. Element przestrzeni dualnej X ∗ do przestrzeni X będziemy zatem
najczęściej oznaczać przez x∗ . Do reprezentowania wartości elementu przestrzeni
dualnej na danym elemencie x ∈ X używać będziemy zamiennie dwóch notacji:
< x, x∗ >
(2.8)
x∗ (x)
(2.9)
lub
Rozdział 3
Operatory
3.1
Operatory liniowe ograniczone
W niniejszym rozdziale omówione zostaną podstawowe własności odwzorowań
ograniczonych liniowych, które będziemy już niemal zawsze nazywać operatorami liniowymi ograniczonymi.
Definicja 3.1.1. Operator liniowy ograniczony[2]
Niech będą dane przestrzenie unormowane X i Y oraz operator liniowy A określony na podprzestrzeni D(A) ⊂ X o wartościach w przestrzeni Y. Mówimy, że
operator A jest ograniczony, jeżeli istnieje taka liczba nieujemna µ, że
∀x∈D(A) : kAxk ¬ µkxk
(3.1)
Definicja ta oczywiście jest zgodna z przytoczoną w rozdziale poprzednim.
Poniższe twierdzenie należy do najbardziej fundamentalnych w teorii analizy
funkcjonalnej.
Twierdzenie 3.1.2. Warunek konieczny i wystarczający ograniczoności operatora [2]
Operator liniowy jest ograniczony wtedy i tylko wtedy, gdy jest ciągły.
Dowód tego faktu jest prosty i można go odszukać w pozycji [2] roz. 36.1.
Powyższy warunek konieczny i wystarczający ograniczoności operatora pozwala nam rozpoznawać operatory ciągłe.
Aby wprowadzić w przestrzeni operatorów strukturę przestrzeni unormowanej musimy zdefiniować pewną ogólną normę dla jej elementów.
Definicja 3.1.3. Norma operatora liniowego ograniczonego[2]
Normą operatora liniowego ograniczonego A nazywamy liczbę:
kAk =
sup
kAxk
(3.2)
x∈D(A),kxk=1
Alternatywnym podejściem jest również definiowanie normy poprzez kres
dolny wszystkich ograniczeń danego operatora. Obie uzyskane normy są jednak w pełni równoważne. Przestrzeń B(X, Y ) z tak zdefiniowaną normą jest
przestrzenią Banacha, o ile przestrzeń Y jest zupełna.
8
ROZDZIAŁ 3. OPERATORY
3.2
9
Operatory sprzężone
Z dowolnym operatorem można skojarzyć pewien inny operator, nazywany operatorem sprzężonym. By dowieść jego istnienia musimy jednak uważnie prześledzić zachowanie funkcjonału normy na przestrzeni sprzężonej.
Bardzo ważnym faktem z którego będziemy chcieli skorzystać w dowodzeniu
istotnych dla nas twierdzeń, jest informacja płynąca z poniższego lematu:
Lemat. Niech X będzie przestrzenią unormowaną i niech x0 ∈ X. Wówczas
istnieje funkcjonał A ∈ X ∗ taki, że:
1. Ax0 = kx0 k
2. kAxk ¬ kxk, x ∈ X
Dowód tego lematu można odszukać w [1] roz. 3.3
Aby wprowadzić operator sprzężony musimy zaobserwować pewne związki
dotyczące normy w przestrzeni X z normą jej przestrzeni sprzężonej. Okazuje
się, że wprowadzając analogiczną normę w przestrzeni sprzężonej otrzymujemy
ważny związek obu norm.
Twierdzenie 3.2.1. Norma w przestrzeni sprzężonej[1]
Niech X - przestrzeń unormowana, X ∗ przestrzeń sprzężona do niej. Wtedy
przyporządkowanie:
kx∗ k = sup{| < x, x∗ > | : kxk ¬ 1}, x∗ ∈ X ∗
(3.3)
∗
jest normą w przestrzeni Banacha X . Ponadto zachodzi:
kxk = sup{| < x, x∗ > | : kx∗ k ¬ 1}, x ∈ X
(3.4)
Dowód. Fakt iż jest to norma w przestrzeni Banacha wynika z definicji normy
oraz uwagi o zupełności przestrzeni funkcjonałów liniowych ograniczonych.
Niech x ∈ X. Wobec powyższego lematu istnieje funkcjonał dokładnie równy
normie na elemencie x. Z drugiej strony z ograniczoności operatora x∗ mamy:
| < x, x∗ > | ¬ kx∗ kkxk ¬ kxk
(3.5)
Co dowodzi drugiej części.
Ostatnie twierdzenie pozwoli nam podać alternatywny sposób obliczania normy na przestrzeni B(X, Y ).
Twierdzenie 3.2.2. Alternatywna postać normy w przestrzeni B(X, Y )[1]
Niech X, Y przestrzenie unormowane. Wtedy norma operatora A ∈ B(X, Y )
wyraża się wzorem:
kAk = sup{| < Ax, y ∗ > | : kxk ¬ 1, x ∈ X, ky ∗ k ¬ 1, y ∗ ∈ Y ∗ }
(3.6)
Dowód. Wobec definicji normy dla przestrzeni B(X, Y ) wiemy, że
kAk = sup{kAxk : kxk ¬ 1, x ∈ X}
(3.7)
Korzystając z drugiej części twierdzenia 3.2.1 dla przestrzeni Y, więc m.in. jej
podprzestrzeni {Ax, kxk ¬ 1}, mamy
kAxk = sup{| < Ax, y ∗ > | : ky ∗ k ¬ 1, y ∗ ∈ Y ∗ }
Połączenie (3.7) i (3.8) dowodzi tezę.
(3.8)
ROZDZIAŁ 3. OPERATORY
10
Dysponując powyższym twierdzeniem o normie jesteśmy w stanie udowodnić
istnienie operatora sprzężonego.
Twierdzenie 3.2.3. O konstrukcji operatora sprzężonego[1]
Niech X, Y będą przestrzeniami unormowanymi. Wtedy każdemu A ∈ B(X,Y)
odpowiada dokładnie jeden operator A∗ ∈ B(Y ∗ , X ∗ ) spełniający warunek
< Ax, y ∗ >=< x, A∗ y ∗ >
(3.9)
dla wszystkich x ∈ X i dla wszystkich y ∗ ∈ Y ∗ . Ponadto dowodzi się, że A∗
spełnia równość
kA∗ k = kAk
(3.10)
Uzyskany w twierdzeniu operator nazywany jest sprzężonym do danego
Dowód. .
Rozważmy operatory y ∗ ∈ Y ∗ oraz operator A ∈ B(X, Y ). Wprowadźmy
operator A∗ y ∗ w sposób następujący:
A∗ y ∗ = y ∗ ◦ A,
y∗ ∈ Y ∗
(3.11)
Operator A∗ y ∗ należy do X ∗ jako złożenie operatorów liniowych ciągłych. Stosując zapis dualny:
< x, A∗ y ∗ >= A∗ y ∗ (x) = y ∗ (A(x)) =< Ax, y ∗ >
(3.12)
Zatem operator A∗ , taki że A∗ (y ∗ ) = A∗ y ∗ , spełnia warunek twierdzenia. Operator ten jest jednoznacznie wyznaczony przez operatory A∗ y ∗ oraz y ∗ , nie
udowodniliśmy jednak na razie, że A∗ , należy do przestrzeni B(Y ∗ , X ∗ ).
Należy wykazać, że jest on liniowy oraz, że jest ograniczony. Zacznijmy od
liniowości:
Niech y1∗ , y2∗ ∈ Y ∗ , oraz α1 , α2 ∈ K, gdzie K - ciało skalarów. Wtedy:
< x, A∗ (α1 y1∗ + α2 y2∗ ) >
= < Ax, α1 y1∗ + α2 y2∗ >
= <
= <
= <
= <
= <
= <
Ax, α1 y1∗ > + < Ax, α2 y2∗ >
α1 Ax, y1∗ > + < α2 Ax, y2∗ >
Aα1 x, y1∗ > + < Aα2 x, y2∗ >
α1 x, A∗ y1∗ > + < α2 x, A∗ y2∗ >
x, α1 A∗ y1∗ > + < x, α2 A∗ y2∗ >
x, α1 A∗ y1∗ + α2 A∗ y2∗ >
(3.13)
(3.14)
(3.15)
(3.16)
(3.17)
(3.18)
(3.19)
co wobec dowolności x ∈ X dowodzi, że:
A∗ (α1 y1∗ + α2 y2∗ ) = α1 A∗ y1∗ + α2 A∗ y2∗
(3.20)
Zatem wobec dowolności y1∗ , y2∗ ∈ Y ∗ , oraz α1 , α2 ∈ K, jest to operator liniowy.
By wykazać ograniczoność posłużmy się normą z twierdzenia 3.2.2.
kA∗ k
=
sup{kA∗ y ∗ k : ky ∗ k ¬ 1}
(3.21)
=
sup{| < x, A∗ y ∗ > | : ky ∗ k ¬ 1, kxk ¬ 1}
(3.22)
=
∗
∗
sup{| < Ax, y > | : ky k ¬ 1 , kxk ¬ 1}
= kAk
(3.23)
(3.24)
ROZDZIAŁ 3. OPERATORY
11
Stąd operator ten ma skończoną normę zatem jest ograniczony. Przy okazji
udowodniona została również druga część twierdzenia.
W niektórych pozycjach książkowych operator sprzężony definiowany jest
jedynie dla przestrzeni Hilberta. Definicja ta jest często podawana ze względu
na swoistą prostotę zapisu i rozumienia tego pojęcia. Przytoczmy ją w tym
miejscu i uzasadnijmy jej zgodność z powyższą definicją operatora sprzężonego
dla przestrzeni B(X, Y ).
Twierdzenie 3.2.4. Operator sprzężony z operatorem liniowym ograniczonym w przestrzeni Hilberta[2]
Niech X będzie przestrzenia Hilberta, a A ∈ B(X). Dla każdego elementu y ∈ X
istnieje funkcjonał liniowy i ciągły określony za pomocą wzoru:
fy (x) := (x, y)
(3.25)
Istnieje wtedy operator A∗ taki, że:
fy (Ax) = (A∗ fy )(x),
x, y ∈ X
(3.26)
Oczywiście uzyskany operator nazywamy sprzężonym do A.
Dla wygody przyjmowanie jest więc, że operator sprzężony w takim wypadku
należy do przestrzeni B(X) zamiast B(X ∗ ). Jest to prawda na mocy twierdzenia
Riesza ([2] roz. 43.1). Twierdzenie bowiem zapewnia nas, że dowolny funkcjonał
posiada postać zdefiniowaną jak wyżej. Oznacza to izomorficzność przestrzeni
X i X ∗ . Rozpisanie powyższej definicji, przy wykorzystaniu tej izomorficzności
pokazuje, że w terminach iloczynu skalarnego odpowiada to równości:
(Ax, y) = (x, A∗ y),
x, y ∈ X
(3.27)
Tak zdefiniowany operator posiada wiele ciekawych własności. Np. operator jest
równy operatorowi sprzężonemu jego sprzężenia, albo innymi słowy operator jest
równy swojemu drugiemu sprzężeniu. W ogólności taka własność nie zachodzi
dla dowolnych operatorów.
Izomoficzność przestrzeni Hilberta X i X ∗ jest kluczowa przy definicji operatora samosprzężonego. Operatory samosprzężone istnieją jedynie dla odwzorowań typu B(X) tj. ”odwzorowania w siebie”.
Definicja 3.2.5. Operator normalny i samosprzężony
Niech X - przestrzeń Hilberta. Operator A ∈ B(X) nazwiemy normalnym gdy:
AA∗ = A∗ A,
(3.28)
zaś samosprzężonym nazwiemy go gdy:
A∗ = A
(3.29)
Przykładem operatora samosprzężonego w przestrzeni Hilberta jest identyczność. Oczywiście jeśli A = I to (Ax, y) = (x, Ay) dla dowolnych x, y ∈ Xprzestrzeni Hilberta. Jest to więc najprostszy przykład operatora samosprzężonego.
ROZDZIAŁ 3. OPERATORY
3.3
12
Operatory zwarte - operatory pełnociągłe
Spośród wielu klas operatów z punktu widzenia wprowadzanej teorii, niezwykle
istotne są operatory zwarte, którym poświęcony jest niniejszy rozdział. W literaturze spotyka jest również starsza ich nazwa - operatory pełnociągłe. W tej
pracy przyjmujemy umowę, że stosowane jest jedynie pojęcie operatora zwartego.
Definicja 3.3.1. Operator zwarty[2]
Powiemy że operator A ∈ B(X, Y ) jest zwarty, jeśli obraz dowolnego zbioru
ograniczonego w X, jest prezwarty w Y.
Przyjrzyjmy się teraz dokładniej własnością operatorów zwartych.
Własności operatorów zwartych
Następujący fakt pozwala nam umieścić pojęcie operatora zwartego pośród operatorów ograniczonych.
Twierdzenie 3.3.2. Ograniczoność operatora zwartego
Każdy operator zwarty jest ograniczony.
Dowód. Przypuśćmy, że jest przeciwnie, tj. że istnieje operator nieograniczony
a zwarty. Z nieograniczoności wynika, że istnieje zbiór ograniczony, będący podzbiorem dziedziny operatora, o nieograniczonym obrazie. Wtedy można wybrać
ciąg punktów z obrazu rozbieżny co do modułu do nieskończoności. Taki ciąg
punktów nie posiada podciągu zbieżnego. Zatem wskazany obraz nie jest zbiorem prezwartym. Jednakże jest on obrazem zbioru ograniczonego przez operator
zwarty. Zatem powinien być prezwarty. Uzyskaliśmy zatem sprzeczność, mylnie
przypuszczając, że istnieje nieograniczony operator zwarty.
Zatem każdy operator zwarty jest ograniczony. Odwrotna własność jednakże
nie zachodzi. Przykładem jest operator identycznościowy, który co prawda przeprowadza zbiory ograniczone na ograniczone, jednakże obraz zbioru ograniczonego ale nie prezwartego, nie jest prezwarty. Zauważmy, że jeśli operator zwarty
jest liniowy to zgodnie z twierdzeniem 3.1.2 jest on również ciągły. Operatory
zwarte stanowią zatem właściwą podklasę operatorów ograniczonych. Pokażemy
teraz najprostsze własności tej podklasy.
Niech X,Y będą określonymi przestrzeniami liniowymi. Operator A ∈ B(X, Y )
nazwiemy skończenie wymiarowym jeśli zbiór jego wartości stanowi podprzestrzeń skończenie wymiarową przestrzeni Y.
Twierdzenie 3.3.3. O zwartości operatora skończenie wymiarowego[2]
Jeżeli X i Y są przestrzeniami unormowanymi, to każdy operator skończenie
wymiarowy A ∈ B(X, Y ) jest zwarty.
Dowód. Dowód opiera się o twierdzenie o warunków koniecznym i dostatecznym zwartości zbioru w przestrzeniach skończenie-wymiarowych ([2] roz.26.1).
Z ograniczoności operatora zwartego wynika, że przeprowadza on zbiory ograniczone w zbiory ograniczone. Twierdzenie zaś mówi, że dla skończenie wymiarowej przestrzeni unormowanej, zbiór jest prezwarty wtedy i tylko wtedy gdy jest
ograniczony. Zatem wobec przytoczonego twierdzenia, operator ten przeprowadza zbiory ograniczone w zbiory prezwarte, co świadczy o zwartości operatora i
dowodzi tezy.
ROZDZIAŁ 3. OPERATORY
13
Powyższe twierdzenie posiada bardzo istotne znaczenie praktyczne, gdyż w
praktyce posługujemy się przestrzeniami skończenie wymiarowymi. Twierdzenie
rozstrzyga zatem, że możemy swobodnie zakładać, że dowolny taki operator
będzie posiadał cechy operatora zwartego.
Kolejne twierdzenie pokaże, że działania algebraiczne wprowadzone w przestrzeni operatorów, nie wyprowadzają poza podzbiór operatorów zwartych. Będzie to zatem podprzestrzeń wektorowa przestrzeni operatorów ograniczonych.
Twierdzenie 3.3.4. O liniowości przestrzeni operatorów zwartych[2]
Niech X,Y będą przestrzeniami unormowanymi. Niech operatory A1 , A2 , A ∈
B(X, Y ) będą operatorami zwartymi oraz niech α będzie dowolnym skalarem z
odpowiedniego ciała skalarów. Wtedy operatory
A1 + A2 , αA
(3.30)
także są zwarte.
Dowód. Szkic dowodu
Rozpocznijmy szkicem dowodu dla sumy operatorów. Załóżmy, że mamy zbiór
ograniczony, zatem jego obrazy przez oba operatory są prezwarte. Rozważmy
pewien dowolny ciąg elementów dziedziny operatora. Ważnym dla nas jest aby
istniał ciąg indeksów, dla których ciąg wartości operatorów na danych dwóch
ciągach jest zbieżny w domknięciu obrazu. Taki ciąg indeksów oczywiście istnieje.
By to uzasadnić zauważmy, że ciąg wartości pierwszego operatora na wybranym ciągu musi posiadać podciąg zbieżny. Zatem istnieje taki ciąg indeksów
dla operatora pierwszego. Z kolei zauważmy, że ciąg wartości drugiego operatora oparty o podciąg złożony z tych właśnie indeksów również musi posiadać
podciąg zbieżny. Wybierają spełniający to wymaganie ciąg indeksów otrzymujemy szukany ciąg indeksów, dla którego podciąg wartości operatora pierwszego
jest zbieżny (jako podciąg ciągu zbieżnego), jak i dla drugiego operatora. Do
prezwartości obrazu sumy operatorów wystarczy przypomnieć, że suma dwóch
ciągów zbieżnych jest ciągiem zbieżnym, a element graniczny w sposób oczywisty należy do domknięcia. Dla mnożenia sposób dowodzenia jest oczywisty.
Powyższe twierdzenie uzasadnia istnienie w przestrzeni operatorów zwartych struktury algebraicznej. Następnie zbadamy zachowanie ciągów zbieżnych
operatorów zwartych.
Twierdzenie 3.3.5. O granicy ciągów operatorów zwartych [2]
Niech X- przestrzeń unormowana oraz Y- przestrzeń Banacha. Niech {An }n∈N ⊂
B(X, Y ) będzie ciągiem operatorów zwartych, takich że An → A, gdzie zbieżność
rozumiemy jako zbieżność wg normy. Wtedy operator A też jest zwarty.
Dowód tego twierdzenia można odszukać w [2] roz. 46.4
Ostatnim istotnym dla nas faktem jest przenoszenie własności zwartości operatora na operatory sprzężone.
Twierdzenie 3.3.6. O zwartości operatora sprzężonego[1]
Niech X i Y będą przestrzeniami Banacha i niech operator A ∈ B(X, Y ) będzie
zwarty. Wówczas operator A∗ również jest zwarty.
ROZDZIAŁ 3. OPERATORY
14
Dowód. Załóżmy, że A jest operatorem zwartym. Udowodnimy, że jego operator
sprzężony jest zwarty. By dowieść zwartości operatora A∗ weźmy dowolny ciąg
funkcjonałów przestrzeni Y ∗ z dowolnego zbioru ograniczonego i oznaczmy go
jako {yn∗ }n∈N . Wskażemy zbieżny podciąg ciągu {A∗ yn∗ }n∈N .
Niech U ⊂ X będzie kulą jednostkową. Wobec zwartości operatora A jej
obraz A(U ) jest zbiorem prezwartym. Rozważmy rodzinę funkcjonałów postaci:
fn (y) =< y, yn∗ >,
y ∈ A(U )
(3.31)
Zauważmy, że jest to podrodzina funkcji ciągłych określonych na zwartym podzbiorze. Wykażemy, że jest ona prezwarta z pomocą kryterium Ascoliego. Funkcje te są wspólnie ograniczone gdyż:
kfn (y)k ¬ kyn∗ kkyk ¬ sup{kyn∗ k}kAkkxk ¬ kAk sup{kyn∗ k} n ∈ N, y ∈ A(U )
n∈N
n∈N
(3.32)
Są również jednakowo ciągłe gdyż: dla dowolnego > 0 biorąc ky1 − y2 k < δ < kfn (y1 ) − fn (y2 )k ¬ ky1 − y2 k < n∈N
(3.33)
Zatem z twierdzenia Ascoliego, zbiór funkcji fn jest zwarty. Oznacza to, że w
ciągu {fn }n∈N można wybrać podciąg {fkn }n∈N zbieżny. Zauważmy, że
kA∗ yk∗i − A∗ ykj k
=
sup{k < x, A∗ yk∗i − A∗ yk∗j > k : kxk ¬ 1} (3.34)
=
sup{k < Ax, yk∗i − yk∗j > k : kxk ¬ 1}
(3.35)
=
sup{kfki (Ax) − fkj (Ax)k : kxk ¬ 1}
(3.36)
dla i, j ∈ N. Wobec zbieżności jednostajnej na A(U ) ciągu {fkn }n∈N , ciąg
{A∗ yk∗n }n∈N okazuje się być C-ciągiem. Zupełność przestrzeni X ∗ dowodzi iż
operator A∗ jest zwarty.
Dowodzi się również implikację odwrotną mówiącą, że jeśli operator sprzężony jest zwarty to operator wyjściowy także musi być zwarty.
3.4
Teoria spektralna, widmo operatora
Jedną z najważniejszych cech macierzy jest wartość własna. W niniejszej sekcji
postaramy się pokazać jak wartości własne można przenieść do teorii operatorów
i o jakich własnościach operatora będzie ona decydować.
Definicja 3.4.1. Wartość regularna[2]
Niech A ∈ B(X) będzie operatorem liniowym ograniczonym w przestrzeni Banacha X. Liczbę λ nazwiemy wartością regularną jeśli równanie
Af − λf = g
(3.37)
ma dla każdego g dokładnie jedno rozwiązanie.
Powyżej zdefiniowaną wartość regularną możemy rozumieć na dwa sposoby.
Albo jako uparametrycznienie równania, z poszukiwaniem parametrów dla których pewien operator Aλ := A−λI odwzorowuje przestrzeń w siebie. Mało tego,
ROZDZIAŁ 3. OPERATORY
15
istnienie i jednoznaczność rozwiązania wystarcza nam do tego by powiedzieć iż
istnieje operator odwrotny do operatora Aλ . Drugie podejście nakazuje patrzeć
na zbiór wartości własnych jak na pewną miarę odporności równania na utratę
rozwiązania. Opuszczenie zbioru wartości regularnych może spowodować zanik
rozwiązań równania lub ich niejednoznaczność. Badanie zachowania operatora
w tym dopełnieniu jest dla nas również bardzo istotne.
Definicja 3.4.2. Widmo operatora[2]
Zbiór wartości λ ∈ K(R lub C) nie będących regularnymi dla operatora A nazwiemy widmem operatora A.
Rozważając jednorodność w równaniu (3.37), możemy wprowadzić pojęcie
wartości własnej.
Definicja 3.4.3. Wartość własna[2]
Powiemy że liczba λ jest wartością własną operatora A jeśli równanie
Ax − λx = 0
(3.38)
posiada niezerowe rozwiązanie.
Każde takie rozwiązanie nazywać będzie elementem własnym odpowiadającym wartości własnej. Zbiór wszystkich elementów własnych odpowiadających
wartości własnej z dołączonym zerem nazwiemy podprzestrzenią własną wartości własnej. Jest to domknięta podprzestrzeń liniowa przestrzeni X. Łatwo
zauważyć, że każda wartość własna danego operatora należy do jego widma.
Zauważmy również, że jest to definicja zgodna z definicją wartości własnej dla
macierzy. Jeżeli rozważamy operator dany przez macierz, to powyższa definicja
stwierdza, że jeśli λ będzie wartością własną to równanie
(A − λI)x = 0
(3.39)
posiada rozwiązania niezerowe. Układ ten jednakże na pewno ma rozwiązanie
w postaci x = 0. W połączeniu z czym fakt, że posiada on inne rozwiązania
rozstrzyga, że wyznacznik macierzy A − λI musi być równy zero. Co oznacza,
że λ jest wartością własną również według definicji znanej z algebry liniowej.
Z perspektywy tej pracy najistotniejszym dla nas jest wykorzystanie twierdzeń spektralnych do dowodzenia faktów z zakresu teorii równań całkowych.
Podajmy jeszcze bez dowodu lemat pokazujący wpływ zmian parametru λ
w równaniu
Af − λf = g
(3.40)
na posiadanie jednoznacznego rozwiązania.
Lemat 3.4.4. O rozwiązaniu w postaci szeregu von Neumanna[2]
Niech X będzie przestrzenią Banacha i niech operator A ∈ B(X). Jeżeli kAk
|λ| < 1
to równanie
A
f −f =g
(3.41)
λ
ma dla każdego y ∈ X dokładnie jedno rozwiązanie w postaci sumy szeregu von
Neumanna tj.:
∞
X
An
f =g+
g
(3.42)
λn
n=1
ROZDZIAŁ 3. OPERATORY
16
Obserwacja którą należy tutaj poczynić, jest fakt, że odpowiednio duże co
do normy λ zawsze będą wartościami regularnymi. Oznacza to, że najbardziej
badane przez nas będą λ bliskie zeru.
3.5
Widmo operatora zwartego
W rozdziale 4.5 udowodnione zostanie, że rozważane przez nas operatory całkowe są zwarte. Skupimy się na zagadnieniu widma jedynie dla operatorów
tej klasy. Zaprezentowana tu teoria Riesza, stanowi odpowiedź na pytanie o
uzasadnienie szerokiej analogii operatorów całkowych i układów równań algebraicznych, które zaobserwował Fredholm. Na poniższe twierdzenie będziemy
powoływać się w późniejszych etapach tej pracy.
Twierdzenie 3.5.1. Teoria Riesza[2]
Niech X będzie przestrzenią Banacha i niech danych będzie operator zwarty A ∈
B(X). Wtedy
1. Każda liczba λ 6= 0 należąca do widma operatora A jest wartością własną.
2. Dla każdej wartości własnej λ 6= 0 odpowiednia podprzestrzeń własna jest
skończenie wymiarowa
3. Zbiór wszystkich wartości własnych operatora jest co najwyżej przeliczalny.
Jedynym punktem skupienia może być tylko λ = 0.
W dowodzie tym skorzystamy z następującego lematu.
Lemat 3.5.2. O ilości rozwiązań równania całkowego
Niech dana będzie przestrzeń Banacha X oraz operator A ∈ B(X). Jeżeli λ w
równaniu
Ax − λx = y
(3.43)
nie jest wartością własną, to równanie to posiada dla dowolnego y ∈ X najwyżej
jedno rozwiązanie.
Dowód. Możliwe są dwa przypadki. Załóżmy najpierw, że λ jest wartością regularną. Wtedy z definicji teza jest spełniona. Załóżmy zatem, że λ należy do
widma operatora. Wtedy dla wybranego y ∈ X równanie może
1. nie mieć rozwiązania
2. mieć jednoznaczne rozwiązanie
3. mieć niejednoznaczne rozwiązanie
Niech y ∈ X. Przypuśćmy, że równanie jest w przypadku 3. Zatem istnieją
rozwiązania x1 6= x2 i zachodzą następujące równości:
Ax1 − λx1 = y,
Ax2 − λx2 = y
(3.44)
Wykonując odejmowanie stronami otrzymujemy:
A(x1 − x2 ) − λ(x1 − x2 ) = y − y = 0
(3.45)
gdzie x1 − x2 6= 0. Sprzeczność, gdyż oznaczałoby to, że λ jest wartością własną
operatora. Zatem i w tym przypadku możliwe jest jedynie by wystąpił brak
rozwiązania lub jego jednoznaczność rozwiązania. Wobec dowolności y ∈ X
zachodzi teza lematu.
ROZDZIAŁ 3. OPERATORY
17
Lemat ten nie został zamieszczony w żadnej z pozycji bibliograficznych. Treść
i dowód są autorskie.
Udowodnijmy teraz kolejno wszystkie 3 punkty.
Dowód. Ad 1
Przypuśćmy, wbrew tezie, że istnieje pewien skalar λ nie będący wartością własną, ale należący do widma. Zatem istnieje pewien element y0 ∈ X dla którego
równanie,
Ax − λx = y0
(3.46)
nie posiada rozwiązań. Element taki istnieje gdyż, na mocy lematu dla równanie
może mieć najwyżej jedno rozwiązanie dla y ∈ Y . Gdyby dla każdego y ∈ Y
istniało jednoznaczne rozwiązanie, λ nie należałaby do widma. Zatem takie y0
na pewno istnieje.
Wprowadźmy oznaczenia:
1. Aλ = A − λI
2. X0 := X
3. Xn := (Aλ )n (X)
Tak zdefiniowany ciąg zbiorów Xn jest ciągiem zstępującym i tworzy podprzestrzeń liniową (wobec liniowości operatora Aλ ). Ponadto zachodzi An+1
(X) 6=
λ
Anλ (X), n ∈ N. Rozważmy ciąg elementów postaci
yn = Anλ y0
(3.47)
Oczywiście yn ∈ X n , n ∈ N. Wykażemy indukcyjnie, że yn ∈ X n \ X n+1 , n ∈ N.
Oczywiście y0 ∈ X0 \ X 1 , gdyż przypuszczając, że y0 ∈ X 1 otrzymujemy, że
istnieje takie x0 ∈ X, że
y0 = A1λ (x0 ) = Aλ (x0 ) = Ax0 − λx0
(3.48)
Co jest sprzecznością z warunkiem (3.46), mówiącym, że takiego rozwiązania
nie ma. Niech n ∈ N. Załóżmy, że
yn ∈ X n \ X n+1
(3.49)
yn+1 ∈ X n+1 \ X n+2 .
(3.50)
Twierdzimy, że:
n+2
Przypuśćmy nie wprost, że yn+1 ∈ X
. Zatem istnieje wtedy pewien x0 ∈ X
taki, że:
An+2
(x0 ) = yn+1 = Aλ (yn )
(3.51)
λ
Przekształcając powyższe otrzymujemy:
Aλ (yn − An+1 (x0 )) = 0
(3.52)
Wobec tego, że λ nie jest wartością własną, równanie Aλ z = 0, ma dokładnie
jedno rozwiązanie z = 0. Zatem
yn = An+1
(x0 )
λ
(3.53)
ROZDZIAŁ 3. OPERATORY
18
co świadczy o tym, że yn ∈ An+1
(X) i co jest sprzeczne z założeniem indukλ
cyjnym. Wobec dowolności n ∈ N na mocy indukcji matematycznej, elementy
ciągu yn spełniają warunek yn ∈ X n \ X n+1 , n ∈ N.
Chcemy wykazać domkniętość. Wykażmy zatem, że istnieje liczba rzeczywista γ > 0 spełniająca warunek
|Aλ x| ­ γ|x|,
x∈X
(3.54)
By tego dowieść przypuśćmy, że taka stała nie istnieje. Rozważmy ciąg {zn }n∈N ⊂
X dla którego:
1
(3.55)
|Azn − λzn | < |zn |
n
Na podstawie naszego przypuszczenia stwierdzamy, że ciąg taki na pewno istnieje. Podstawiając zn := xn · |zn | otrzymujemy:
1
(3.56)
n
Ciąg Axn należy do obrazu zbioru ograniczonego w X, zatem wobec zwartości
operatora A zawiera się on w zbiorze prezwartym. Daje się więc wybrać ciąg
indeksów kn taki, że
Axkn → x0
(3.57)
|Axn − λxn | <
Wobec (3.56), zachodzi zbieżność ciagu λxkn → x0 . Wobec twierdzenia o ciągłości normy zauważamy, że |x0 | = |λ| =
6 0. Zauważmy, że ciągi λAxkn = A(λxkn )
są sobie równe wobec liniowości operatora A. Zatem ich granice są sobie również
równe. Korzystając z ciągłości operatora A otrzymujemy zatem: λx0 = Ax0 .
Wobec faktu, że |x0 | =
6 0 oznaczało by to, że λ była by wartością własną.
Sprzeczność.
Stąd
|Aλ x| ­ γ|x|, x ∈ X
(3.58)
Zauważmy, że Aλ x ∈ X co oznacza, że:
|Aλ (Aλ x)| ­ γ|(Aλ x)| ­ γ 2 |x|
(3.59)
Korzystając z powyższego indukcyjnie łatwo dowieść, że
|Anλ x| ­ γ n |x|
(3.60)
Udowodnimy teraz domkniętość zbiorów X n . Niech n ∈ N oraz niech zkn , k ∈ N
będzie zbieżnym ciągiem w przestrzeni X elementów z X n . Wykażemy, że granica tego ciągu należy do X n . Istnieje taki ciąg xk taki, że Anλ (xk ) = zkn . Wobec
3.60 zachodzi:
|zkn − zjn | = |Anα (xk − xj )| ­ γ n |xk − xj |,
k, j ∈ N
(3.61)
Zbieżność ciągu zkn dowodzi, że xk jest C-ciągiem w przestrzeni Banacha X.
Zatem istnieje element x0 będący granicą ciągu xk . Wobec ciągłości operatora
A:
Ax0 = y0
(3.62)
Skąd y0 ∈ X n . Co wobec dowolności n ∈ N dowodzi domkniętości zbiorów X n .
Zatem każdy ze zbiorów X n ma strukturę podprzestrzeni liniowej z działaniami
z przestrzeni X, jest domknięty i zawiera X n+1 w sposób właściwy. Na mocy
lematu Riesza [2], będzie istniał ciąg vn elementów o następujących właściwościach:
ROZDZIAŁ 3. OPERATORY
19
1. |vn | = 1, n ∈ N, vn ∈ X n
2. |vn − x| ­
1
2
dla x ∈ X n+1
Rozważmy x = vm − λ1 (Aλ vn − Aλ vm ) gdy m > n. Zauważmy, że wtedy x ∈
X n+1 jako kombinacja liniowa elementów z X n+1 . Stąd, wobec symetrii , moduł
różnicy
1
(3.63)
|Avn − Avm | = λ|vn − x| ­ λ , n 6= m
2
Ciąg o takiej własności nie może mieć oczywiście podciągu zbieżnego. Ciąg vn
jest jednak oczywiście ograniczony skąd oczywiście wynika, że ciąg Avn należy
do pewnego prezwartego zbioru. Zatem sprzeczność z przypuszczeniem, że jest
niezerowy skalar w widmie nie będący wartością własną.
Ad 2
Przypuścmy, że dla pewnego λ przestrzeń własna jest nieskończenie wymiarowa.
Wiadomym jest, że każda przestrzeń nieskończenie wymiarowa unormowana posiada zbiory ograniczone ale nie prezwarte. Niech xn będzie ciągiem wybranym
z takiego zbioru, niezawierającym podciągu zbieżnego. Zatem ciąg λxn również nie zawiera podciągu zbieżnego. Z drugiej jednak strony ciąg A(xn ) należy
do prezwartego obrazu operatora A na zbiorze ograniczonym. Zatem ten ciąg
posiada podciąg zbieżny. Jednakże w przestrzeni własnej zachodzi równość
Ax = λx,
x ∈ Xλ (A)
(3.64)
Stąd otrzymaliśmy sprzeczność. Zatem każda przestrzeń własna musi być skończenie wymiarowa.
Ad 3
Przypuśćmy, że zbiór wartości własnych operatora A posiada różny od zera
punkt skupienia. Zatem istnieje ciąg λn różnych wartości własnych o normie
powyżej pewnej stałej dodatniej . Niech xn będzie niezerowym elementem własnym dla wartości własnej λn . Zauważmy, że jeśli układ x1 , . . . , xn jest liniowo
niezależny to również układ x1 , . . . , xn , xn+1 jest liniowo niezależny. W przeciwnym wypadku xn+1 ma postać:
xn+1 =
n
X
ai xi
(3.65)
i=1
którą wstawiając do :
0 = Axn+1 − λn+1 xn+1 =
n
X
i=1
ai (Axi − λn+1 xi ) =
n
X
ai (λi − λn+1 )xi (3.66)
i=1
Co wobec liniowej niezależności x1 , . . . , xn pokazuje, że xn+1 = 0 wbrew założeniu niezerowości. Zatem każdy układ x1 , . . . , xn jest liniowo niezależny dla
dowolnego n ∈ N.
Oznaczmy przestrzenie rozpięte na układach x1 , . . . , xn przez odpowiednio
Xn . Jako podprzestrzenie skończenie wymiarowe przestrzeni Banacha są one
domknięte. Oczywiście dla dowolnego n, Xn jest podprzestrzenią właściwą dla
Xn+1 , co pozwala nam zastosować ponownie lemat Riesza. Istnieje zatem ciąg
vn o własnościach:
1. |vn | = 1, n ∈ N, vn ∈ Xn
ROZDZIAŁ 3. OPERATORY
2. |vn − x| ­
1
2
20
dla x ∈ Xn−1
dla n ∈ N \ {1}.
Niech n > m, dla x = λ1n (λn vn − Avn ) + λ1m Avm . Łatwo zauważyć, że
λn vn − Avn należy do Xn , jednakże rozpisując postać vn w bazie x1 , . . . , xn
zauważamy, że element nie zależy od xn a zatem należy do Xn−1 . Podobnie
Avm ∈ Xm ⊂ Xn−1 . Zatem x ∈ Xn−1 . Wobec rezultatu lematu Riesza:
1
vn
vm
¬ |vn − x| = |A( ) − A(
)|
2
λn
λm
(3.67)
Z dowolności n,m i ich symetrii ciąg A( λvnn ) nie posiada podciągów zbieżnych.
Jednakże ciąg { λvnn }n∈N jest ograniczony gdyż:
|
vn
1
1
|=
¬
λn
|λn |
(3.68)
Zatem sprzeczność z zwartością operatora A. Zatem zbiór wartości własnych ma
co najwyżej jeden punkt skupienia będący zerem. Na mocy uwagi po lemacie
3.4.4, wiemy że zbiór widma jest ograniczony przez kulę K(0, kAk). Zatem jeśli
0 nie jest punktem skupienia zbioru wartości własnych to zbiór ten musi być
skończony. Jeśli zero jest punktem skupienia, zbiór ten może być co najwyżej
przeliczalny.
Skorzystamy również z twierdzenia, które zademonstruje nam związek pomiędzy przestrzeniami sprzężonymi a wartościami własnymi.
Twierdzenie 3.5.3. O ortogonalności podprzestrzeni własnej i rozwiązania[2]
Niech X będzie przestrzenią Hilberta X, a A ∈ B(X) operatorem zwartym i niech
λ 6= 0 będzie skalarem. Wtedy
1. λ jest wartością własną operatora A wtedy i tylko wtedy gdy λ jest wartością własną operatora A∗ . Gdy λ jest wartością własną jej przestrzeń
własna ma identyczny wymiar z przestrzenią własną λ operatora A∗ .
2. Jeżeli λ jest wartością własną, to równanie
Ax − λx = y
(3.69)
ma rozwiązanie wtedy i tylko wtedy gdy y jest ortogonalny do podprzestrzeni
własnej Xλ (A∗ ).
Dowód opiera się o Teorię Riesza oraz konstrukcję operatora sprzężonego i
przestrzeni własnej, i można go znaleźć w [2] roz. 52.4.
Rozdział 4
Operatory całkowe
4.1
Operatory całkowe
W dalszej części pracy nasze rozważania ograniczą się do tzw. operatorów całkowych. Operatory te definiujemy następująco:
Definicja 4.1.1. Operator całkowy[2]
Niech dany będzie podzbiór Ω przestrzeni euklidesowej m-wymiarowej. Niech
X,Y przestrzeni unormowane funkcji określonych na Ω oraz niech A będzie
funkcją określoną na produkcie Ω × Ω mającą tą własność, że dla każdej funkcji
u ∈ X poniższa całka Lebesgue’a jest dobrze określona funkcją z Y.
Z
v(x) = A(x, y)u(y)dy, x ∈ Ω
(4.1)
Ω
Przyporządkowanie X 3 u → v ∈ Y dla funkcji u,v z równania (4.1), nazwiemy
operatorem całkowym A i będziemy zapisywać równanie w postaci:
Au = v
(4.2)
Funkcję A nazywać będziemy jądrem danego operatora całkowego. Stosowany szeroko podobny sposób zapisu dla operatora całkowego i jądra operatora całkowego wynika z silnej zależności pomiędzy operatorem, a jądrem. W
większości przypadków nie prowadzi do nieporozumień nawet stosowanie tego
samego oznaczenia dla jądra i operatora. Powyższa definicja jest w swej naturze
bardzo ogólna, jednakże sformułowanie ”poniższa całka jest dobrze określoną
funkcją” pozostawia spory obszar poszukiwań. Dlatego najczęściej rozważa się
jedynie przestrzenie gdzie, na mocy odpowiednich twierdzeń ta poprawność jest
zapewniona. Bardzo ważną uwagą jest to, że operatory całkowe niezależnie od
rozważanych przestrzeni są operatorami liniowymi.
4.2
Rodzaje operatorów całkowych
Operatory całkowe i ich klasyfikacja są tak ściśle związane z przypisanymi im
jądrami całkowymi, zatem klasyfikację operatorów całkowych należy rozpocząć
od klasyfikowania jąder.
21
ROZDZIAŁ 4. OPERATORY CAŁKOWE
22
Definicja 4.2.1. Operator całkowy o ciągłym jądrze w przestrzeni C(Ω)[2]
Niech X = Y = C(Ω) oraz A ∈ C(Ω × Ω), przyjmując:
Z
(Au)(x) = A(x, y)u(y)dy u ∈ C(Ω)
(4.3)
Ω
określamy operator całkowy odwzorowujący przestrzeń C(Ω) w siebie.
Tak zdefiniowany operator całkowy jest poprawnie określony. Całka z funkcji
ciągłej na zwartym podzbiorze zawsze istnieje i będzie ciągłą funkcją pozostałych parametrów. Udowodnienie ograniczoności tego operatora jest trywialne.
Powyższy operator da się uogólnić na szerszą klasę funkcji. Wiemy bowiem,
że nie tylko funkcje ciągłe można całkować.
Definicja 4.2.2. Operator całkowy o ciągłym jądrze w przestrzeni L2 (Ω)[2]
Niech X = Y = L2 (Ω), dla Ω ⊂ Em - zwarty podzbiór m-wymiarowej przestrzeni
euklidesowej, oraz A ∈ C(Ω × Ω), to kładąc:
Z
∀u ∈ L2 (Ω) (Au)(x) = A(x, y)u(y)dy
(4.4)
Ω
określamy operator całkowy odwzorowujący przestrzeń L2 (Ω) w siebie.
Istnienie powyższej całki jest konsekwencją ograniczoności funkcji jądra. Jednostajna ciągłość jądra względem kompletu zmiennych (x,y) przenosi się na
ciągłość względem wartości operatora. Zatem zauważamy, że operator ten przyporządkowuje funkcjom klasy L2 (Ω) funkcje ciągłe. Niewątpliwie jest to zatem
odwzorowanie w siebie przestrzeni L2 (Ω), której podprzestrzenią są przecież
funkcje ciągłe. Jednakże zauważamy, że tak silne założenia o jądrze operatora
powoduje zawężenie zbioru wartości operatora do węższej niż rozważana klasa.
Stąd osłabiając warunki nałożone na jądro operatora otrzymujemy ogólniejszy
operator.
Definicja 4.2.3. Operator całkowy z jądrem kwadratowym w przestrzeni L2 (Ω)[2]
Gdy X = Y = L2 (Ω) oraz A - funkcją mierzalną określoną na produkcie (Ω×Ω)
taką że:
ZZ
|A(x, y)|2 dxdy < ∞
(4.5)
Ω×Ω
przyjmując:
2
∀u ∈ L (Ω)
Z
A(x, y)u(y)dy
(Au)(x) =
(4.6)
Ω
określamy operator całkowy odwzorowujący przestrzeń L2 (Ω) w siebie.
Jądro spełniające warunek (4.5) nazywać będziemy kwadratowym.
Uzasadnienie przekształcenia w siebie wymaga tym razem szerszego komentarza. Zgodnie z twierdzeniem Fubiniego:
ZZ
Z Z
(4.7)
|A(x, y)|2 dxdy = ( |A(x, y)|2 dy)dx
Ω×Ω
Ω
Ω
ROZDZIAŁ 4. OPERATORY CAŁKOWE
23
Wykorzystując powyższe oraz nierówność Buniakowskiego otrzymujemy:
Z
Z
Z
|(Au)(x)|2 = | A(x, y)u(y)dy|2 ¬ |A(x, y)|2 dy |u(y)|2 dy
(4.8)
Ω
Ω
Ω
Wobec tego również dla całek tych funkcji zachodzi:
Z
Z Z
Z
|(Au)(x)|2 dx ¬ ( |A(x, y)|2 dy)dx |u(y)|2 dy < +∞
Ω
Ω
Ω
(4.9)
Ω
2
Zatem funkcja A(u) jest również klasy L (Ω). Ponadto przyglądając się (4.9) zauważmy, że warunek ten zapewnia również ograniczoność tego operatora. Zatem
ten operator całkowy jest ograniczonym liniowym operatorem przekształcającym przestrzeń L2 (Ω) w siebie.
4.3
Jądra słabo osobliwe
Istnieje jeszcze inna klasa jąder, która również zapewnia przekształcenie przestrzeni L2 (Ω) w siebie. Są to jądra słabo osobliwe.
Definicja 4.3.1. Jądro słabo osobliwe[2]
Niech dany będzie zbiór mierzalny i ograniczony Ω w przestrzeni euklidesowej
m-wymiarowej Em . Powiemy, że jądro jest słabo osobliwe, jeśli daje się je przedstawić w postaci:
H(x, y)
(4.10)
A(x, y) =
|x − y|α
gdzie 0 < α < m natomiast x, y ∈ Ω, x 6= y, zaś funkcja H jest funkcją mierzalną
i ograniczoną.
Jądra słabo osobliwe są oczywiście całkowalne. Ponadto dowodzi się, że jeżeli α < 21 m to jest ono jądrem kwadratowym. Jednakże nie wszystkie jądra
kwadratowe są słabo osobliwe.
Definicja 4.3.2. Operator całkowy z jądrem słabo osobliwym w przestrzeni L2 (Ω)[2]
Gdy Ω ⊂ Em jest ograniczonym zbiorem mierzalnym, X = Y = L2 (Ω) oraz A
jest słabo osobliwym jądrem to przyjmując:
Z
2
∀u ∈ L (Ω) (Au)(x) = A(x, y)u(y)dy
(4.11)
Ω
określamy operator całkowy odwzorowujący przestrzeń L2 (Ω) w siebie.
W uzasadnieniu ograniczoności i działania operatora w przestrzeń L2 (Ω)
wykorzystamy następujący lemat, który łatwo można wykazać stosując zmienne
biegunowe.
Lemat 4.3.3. Jeżeli 0 < α < m to istnieje pewna stała γ > 0, że dla każdych
dwóch punktów x, y ∈ Rm i dowolnej liczby r > 0 zachodzi:
Z
1
dz ¬ γrm−α
(4.12)
|y − z|α
K(x,r)
jeśli |y − x| < r.
ROZDZIAŁ 4. OPERATORY CAŁKOWE
24
Możemy zatem przejść do dowiedzenia odpowiedniego działania wskazanego
operatora całkowego. Niech dana będzie funkcja u - całkowalna. Wobec lematu
wiemy, że
Z
1
¬ γ0
(4.13)
|x − y|α dy
Ω
Gdyż Ω będąc ograniczonym na pewno zawiera się w kuli o środku w x i odpowiednio dużym promieniu. Stąd powyższa całka na pewno jest ograniczona.
Korzystając z definicji jądra słabo osobliwego, twierdzenia Fubiniego oraz (4.13)
otrzymujemy:
Z Z
Z
|H(x, y)|
|H(x, y)||u(y)|
dxdy ¬
dx)|u(y)|dy
(4.14)
(
|x − y|α
|x − y|α
Ω Ω
Ω×Ω
Z
¬ sup {|H(x, y)|}γ0 |u(y)|dy < ∞ (4.15)
x,y∈Ω
Ω
Co dowodzi działania w siebie w przestrzeń funkcji całkowalnych. Niech tym
razem dana będzie funkcja u całkowalna w kwadracie modułu.
Na mocy nierówności Buniakowskiego:
Z
u(y)
1
2
|(Au)(x)|2 ¬ | H(x, y)
(4.16)
α
α |
|x − y| 2 |x − y| 2
Ω
Z
|u(y)|2
¬ sup {|H(x, y)|2 }γ0
dy
(4.17)
|x − y|α
x,y∈Ω
Ω
Zatem całkując powyższe i zamieniając zmienne
Z
Z Z
|(Au)(x)|2 dx ¬ sup {|H(x, y)|2 }γ0 (
x,y∈Ω
Ω
(4.18)
Ω
¬
Z Ω
Z
2
sup {|H(x, y)| }γ0 (
|u(y)|2
dy)dx
|x − y|α
x,y∈Ω
Ω
¬
( sup {|H(x, y)|})2 γ02
x,y∈Ω
ZΩ
1
dx)|u(y)|2 dy(4.19)
|x − y|α
|u(y)|2 dy < ∞
(4.20)
Ω
Ostatnie oznacza ponadto, że operator jest ograniczony.
Definicja 4.3.4. Operator całkowy z jądrem słabo osobliwym w przestrzeni C(Ω)[2]
Gdy Ω ⊂ Em jest zbiorem zwartym, X = Y = C(Ω) oraz A jest słabo osobliwym
jądrem takim, że funkcja H (z definicji 4.3.1) jest ciągła, to przyjmując:
Z
∀u ∈ L2 (Ω) (Au)(x) = A(x, y)u(y)dy
(4.21)
Ω
określamy operator całkowy odwzorowujący przestrzeń C(Ω) w siebie.
Fakt iż jest to operator odwzorowujący w siebie jest widoczny wiec pozostawmy to bez dowodu.
ROZDZIAŁ 4. OPERATORY CAŁKOWE
4.4
25
Klasyfikacja równań całkowych
Pierwotnie około roku 1900 w pracach Volterry i Fredholma rozważane były
jedynie całki funkcji określonych na podzbiorach osi rzeczywistej i jąder całkowych określonych na iloczynie kartezjańskim podzbiór osi rzeczywistej. Ze
względu na występujące postacie liniowych równań całkowych ograniczono się
do dwóch głównych typów tych równań:
1. Równań Volterry - które były rozważane jako pierwsze
(a) pierwszego rodzaju
Zx
A(x, y)f (y)dy = g(x) x ∈ (a, b)
(4.22)
a
(b) drugiego rodzaju
Zx
f (x) −
A(x, y)f (y)dy = g(x) x ∈ (a, b)
(4.23)
a
2. Równań Fredholma
(a) pierwszego rodzaju
Zb
A(x, y)f (y)dy = g(x) x ∈ (a, b)
(4.24)
a
(b) drugiego rodzaju
Zb
f (x) −
A(x, y)f (y)dy = g(x) x ∈ (a, b)
(4.25)
a
Gdzie funkcje f i g należały do odpowiednich klas przestrzeni funkcyjnych, podobnie jak jądra przekształceń należały do odpowiednich dla nich klas przestrzeni funkcyjnych.[3]
Dowodzi się, że każde z równań Volterry daje się sprowadzić do równań
Fredholma [3]. Odkrycie tego spowodowało, że rozwój badań nad równaniami
całkowymi ukierunkował się na równania Fredholma. Szerzej o własnościach
tych równań będzie powiedziane więcej w rozdziale 5.
4.5
Zwartość operatorów całkowych
Okazuje się że dla licznych klas jąder równań całkowych, operator całkowy okazuje się być zwartym.
Twierdzenie 4.5.1. Zwartość operatora całkowego dla przestrzeni C(Ω)[2]
Operator całkowy A ∈ B(C(Ω)) z jądrem A ciągłym jest zwarty.
ROZDZIAŁ 4. OPERATORY CAŁKOWE
26
Dowód. Niech A ∈ B(C(Ω)) będzie operatorem całkowym z jądrem A ciągłym.
Niech ponadto Z ⊂ C(Ω) będzie zbiorem ograniczonym. Wtedy funkcje u ∈ Z
są wspólnie ograniczone przez pewne µ > 0. Wobec ograniczoności operatora
całkowego w przestrzeni B(C(Ω)), również funkcje Au są wspólnie ograniczone.
Ponadto wobec jednostajnej ciągłości funkcji A dla ∀ > 0∃δ > 0
∀(x1 , y), (x2 , y) ∈ Ω × Ω, |x1 − x2 | ¬ δ : zachodzi
|A(x1 , y) − A(x2 , y)| <
µ|Ω|
(4.26)
Wobec czego
Z
|Au(x1 ) − Au(x2 )| = |
A(x1 , y) − A(x2 , y)u(y)dy| < |Ω|µ
=
µ|Ω|
(4.27)
Ω
Co świadczy o jednakowej ciągłości funkcji u ∈ Z. Na mocy twierdzenia Ascoliego, zbiór A(Z) jest prezwarty. Z dowolności wyboru Z otrzymujemy zwartość
operatora A.
Wobec powyższego twierdzenia operatory całkowe określone na przestrzeni
Banacha B(C(Ω)) są zwarte. Kolejne twierdzenie dowodzi, że jest tak również
dla szerszej klasy funkcji L2 (Ω).
Twierdzenie 4.5.2. Zwartość operatora całkowego dla przestrzeni L2 (Ω)
[2]
Operator całkowy A ∈ B(L2 (Ω)) z jądrem A kwadratowym, jest zwarty.
W dowodzie tego istotnego faktu posłużymy się rozwiązaniem przypadku
skończenie wymiarowego i z pomocą twierdzenia 3.3.5 wywnioskujemy zwartość
ze zwartości ciągu ciągu operatorów doń zbieżnych.
Dowód. Rozważmy operator z jądrem zdegenerowanym tzn. takim że:
A(x, y) =
n
X
γk ak (x)bk (y)
(4.28)
k=1
gdzie γk ∈ K elementy ciała skalarów, natomiast ak , bk ∈ L2 (Ω). Wtedy oczywiście operator A dział w przestrzeń skończenie wymiarową. Jako operator skończenie wymiarowy jest on zatem zwarty.
Powróćmy zatem do ogólnego jądra kwadratowego. Niech (uk ) będzie ortonormalnym układem zupełnym funkcji z przestrzeni L2 (Ω). Wtedy funkcje postaci un (x)um (y) stanowią ortonormalny układ zupełny w przestrzeni L2 (Ω×Ω).
Podprzestrzeń wszystkich kombinacji skończonych liniowych tych funkcji jest gęsta w L2 (Ω×Ω). Wobec tej gęstości dla jądra A istnieje ciąg jąder An zbieżny do
A średnio kwadratowo. Zatem i ciąg odpowiednich operatorów An jest zbieżny
do operatora A. Jako, że jądra tych operatorów są zdegenerowane, to operatory
te są zwarte. Wobec twierdzenia 3.3.5, i operator A jest zwartym.
Z interesujących nas przestrzeni pozostały jeszcze przestrzenie oparte o jądra słabo osobliwe. Tu także okazuje się występować zwartość odpowiednich
operatorów.
ROZDZIAŁ 4. OPERATORY CAŁKOWE
27
Twierdzenie 4.5.3. Zwartość operatora całkowego dla jąder słabo-osobliwych
w C(Ω)[2]
Operator całkowy A ∈ B(C(Ω)) z jądrem A słabo-osobliwym jest zwarty.
Dowód. Szkic dowodu
W dowodzie tego faktu, podobnie jak w poprzednim twierdzeniu definiujemy
ciąg operatorów zbieżnych do danego, pokazujemy ich zwartość i wnioskujemy
zwartość operatora granicznego. Rozważany tu będzie ciąg operatorów o jądrach
postaci:
( H(x,y)
, |x − y| ­ δn
|x−y|α
(4.29)
An (x, y) =
H(x,y)
, |x − y| < δn
|δn |α
Ciąg tych jąder jest zbieżny do jądra operatora A. Jądra te są natomiast funkcjami ciągłymi, co pozwala stwierdzić, że operatory An będą zwarte.
Twierdzenie 4.5.4. Zwartość operatora całkowego dla jąder słabo-osobliwych
w L2 (Ω) [2]
Operator całkowy A ∈ B(L2 (Ω)) z jądrem A słabo-osobliwym jest zwarty.
W dowodzie również i tu rozważymy ciąg operatorów zwartych i pokażemy
jego zbieżność do danego operatora.
Dowód. Rozważmy ciąg liczb rzeczywistych δn zbieżny do 0. Utwórzmy również
ciąg funkcji An opisanych wzorem:
A(x, y) , |x − y| ­ δn
An (x, y) =
(4.30)
0
, |x − y| < δn
Jądra o takiej postaci są oczywiście ograniczone, zatem należą i do przestrzeni
L2 (Ω. × Ω). O operatorach o takich jadrach mówi twierdzenie 4.5.2, zatem skonstruowaliśmy ciąg operatorów zwartych {An }n∈N . Pozostaje dowieść zbieżności
ciągu.
Zauważmy, że:
Z
H(x, y)
u(y)dy
(4.31)
((An − A)u)(x) = −
|x − y|α
Ωn (x)
gdzie zbiór Ωn (x) := Ω ∩ K(x, δn ). Oznaczając µ := sup |H(x, y)| i stosując
x,y∈Ω
nierówność Buniakowskiego, szacujemy z góry
Z
1
1
2
|((An − A)u)(x)|2 ¬ µ2 |
α
α u(y)dy| ¬
|x − y| 2 |x − y| 2
(4.32)
Ωn (x)
¬
µ2
Z
1
dy
|x − y|α
Ωn (x)
¬
µ2
Z
K(x,δn )
Z
1
|u(y)|2 dy (4.33)
|x − y|α
Ωn (x)
1
dy
|x − y|α
Z
1
|u(y)|2 dy (4.34)
|x − y|α
Ω
Niech > 0, x ∈ Ω. Na mocy lematu 4.3.3 istnieje taka liczba µ1 , że
Z
1
dy ¬ µ1
|x − y|α
Ω
(4.35)
ROZDZIAŁ 4. OPERATORY CAŁKOWE
28
Ponadto istnieje dostatecznie duży indeks k taki, że dla n > k zachodzi
Z
1
2
dy ¬
(4.36)
α
|x − y|
µ1 µ2
K(x,δn )
Zatem
|(An − A)u|2
¬
2
µ1
Z
Ω
¬
¬
Z
1
|u(y)|2 dy dx
α
|x − y|
(4.37)
Ω
Z Z
2
1
dx |u(y)|2 dy
α
µ1
|x − y|
ZΩ Ω
2 |u(y)|2 dy
(4.38)
(4.39)
Ω
dla n > k. Wobec dowolności funkcji u ∈ L2 (Ω), otrzymujemy ostatecznie:
|An − A| ¬ , n > k
(4.40)
Wobec dowolności > 0 dowodzi to zbieżności ciągu operatorów. Wobec twierdzenia 3.3.5 dowodzi to zwartości operatora A.
4.6
Operator sprzężony w przestrzeni Hilberta
L2 (Ω)
Dla operatorów całkowych istnieje jak najbardziej sens rozważania operatorów
sprzężonych. W rozdziale 6 będziemy chcieli skupić się na operatorach całkowych samosprzężonych i dlatego teraz zastanówmy się nad postacią operatora
sprzężonego. Nasze rozważania musimy ograniczyć do przestrzeni L2 (Ω) gdyż
przestrzeń C(Ω) nie jest przestrzenią Hilberta. Przypomnijmy, że iloczyn skalarny w L2 (Ω) zdefiniowany jest następująco:
Z
(x, y) = x(t) · y(t)dt, x, y ∈ L2 (Ω)
(4.41)
Ω
Zgodnie z uwagami i spostrzeżeniami z rozdziału 3.2.4 wiemy, że operator sprzężony A∗ istnieje i spełnia warunek:
(Ax, y) = (x, A∗ y),
x, y ∈ X
(4.42)
Zastosujmy powyższe do przestrzeni L2 (Ω) gdzie operatory są wyposażone w
jądra kwadratowe.
Twierdzenie 4.6.1. Operator sprzężony do operatora całkowe w przestrzeni L2 (Ω)[2]
Niech X = L2 (Ω). Jest to oczywiście przestrzeń Hilberta. Wtedy operator całkowy postaci:
Z
Au(x) := A(x, y)u(y)dy
(4.43)
Ω
ROZDZIAŁ 4. OPERATORY CAŁKOWE
29
Posiada operator sprzężony postaci:
A∗ u(x) :=
Z
A(y, x)u(y)dy
(4.44)
Ω
Dowód. Wykonajmy sprawdzenie, niech x, y ∈ L2 (Ω) i A ∈ B(L2 (Ω).
Z
∗
(x, A y) =
x(t)A∗ y(t)dt
Ω
Z
Z
A(z, t)y(z)dzdt
x(t)
=
Ω
Ω
Z
Z
A(z, t)y(z)dzdt
x(t)
=
Ω
Ω
Z Z
x(t)A(z, t)y(z)dzdt
=
Ω Ω
Z
Z
y(z)
=
Ω
x(t)A(z, t)dtdz
Ω
Z
y(z)Ax(z)dz
=
Ω
(Ax, y)
=
Stąd w zasadzie mamy jasno podany warunek na jądro dla operatora samosprzężonego. Dla operatora samosprzężonego zachodzi również wiele interesujących własności.
Twierdzenie 4.6.2. O ortogonalności podprzestrzeni własnych[2]
Niech X będzie przestrzenią Hilberta. Podprzestrzenie własne odpowiadające różnym wartościom własnym operatora samosprzężonego A ∈ B(X) są ortogonalne.
Dowodu powyższej własności dostarcza prosta obserwacja. Niech A ∈ B(X)
będzie operatorem samosprzężonym. Niech λ1 , λ2 dwie różne wartości własne,
x1 , x2 elementy własne odpowiednio dla pierwszej i drugiej wartości własnej.
λ1 (x1 , x2 ) = (λ1 x1 , x2 ) = (Ax1 , x2 ) = (x1 , Ax2 ) = (x1 , λ2 x2 ) = λ2 (x1 , x2 )
(4.45)
Stąd:
(λ1 − λ2 )(x1 , x2 ) = 0
(4.46)
Zatem elementy różnych przestrzeni własnych są ortogonalne do siebie.
Rozdział zakończmy definicją pojęcia równoważnego dla wartości własnej
operatora.
Definicja 4.6.3. Wartość własna jądra operatora całkowego[2]
Przez wartość własną jądra będziemy nazywać skalary µ dla których równanie
Z
u(x) − µ A(x, y)u(y)d(y) = 0
(4.47)
Ω
ROZDZIAŁ 4. OPERATORY CAŁKOWE
30
ma niezerowe rozwiązanie (nazywane funkcją własną).
Zgodnie z tą definicją µ jest wartością własną jądra wtedy i tylko wtedy gdy
jest niezerowe oraz jego odwrotność jest wartością własną operatora całkowego.
Rozdział 5
Teoria Fredholma
W niniejszym rozdziale omówiona zostanie teoria Fredholma równań całkowych.
Wygłoszone przez Fredholma teorie z roku 1900 dowodzą, że w równaniach całkowych występują liczne analogie z równaniami algebraicznymi. Jak wykazały
to prace Riesza, przyczyną takiego zachowania była zwartość operatorów całkowych w danych przestrzeniach.
W niniejszym rozdziale będziemy zajmować niemal jedynie jednym typem
równania całkowego, mianowicie równaniem Fredholma drugiego rodzaju.
Z
f (x) − N (x, y)f (y)dy = g(x), x ∈ Ω
(5.1)
Ω
5.1
Równania całkowe o jądrach ograniczonych
Rozważamy w tej sekcji równanie całkowe o jądrze ograniczonym i ciągłym.
Korzystając z zapisu operatorowego możemy je zapisać w wygodnej postaci:
f − Nf = g
(5.2)
W dużej liczbie przypadków udaje się wykazać, że rozwiązanie tego równania
ma postać szeregu von Neumanna.
Definicja 5.1.1. Szereg von Neumanna[3]
Niech N będzie pewnym operatorem liniowym N ∈ B(X) , oraz niech g ∈ X.
Wtedy granicę ciągu funkcyjnego
fn = g + Ng + N2 g + ... + Nn−1 g
n+1
n
(5.3)
1
gdzie N
= N ◦ N , N = N jest superpozycją operatorów, nazwiemy szeregiem von Neumanna funkcji g.
O przykładowym zastosowaniu szeregu von Neumanna mówi twierdzenie.
Twierdzenie 5.1.2. Warunek dostateczny rozwiązania w postaci szeregu von Neumanna[3]
Niech g funkcja ciągła na zwartym zbiorze Ω i niech N ∈ B(C(Ω)) będzie operatorem całkowym z ciągłym jądrem. Jeżeli spełniona jest nierówność
max |N (x, y)| <
x,y∈Ω
31
1
|Ω|
(5.4)
ROZDZIAŁ 5. TEORIA FREDHOLMA
32
to istnieje dokładnie jedno rozwiązanie równania całkowego (5.2), które jest sumą jednostajnie zbieżnego szeregu von Neumanna.
Dowód. Rozpocznijmy od uzasadnienia jednostajnej zbieżności szeregu von Neumanna. Zbadajmy zbieżność szeregu norm:
kgk + kNgk + kN2 gk + . . .
(5.5)
Funkcja g jest oczywiście ograniczona z góry jako ciągła na zwartym zbiorze Ω.
Z kolei, biorąc |N | := max |N (x, y)| i stosując wzór na moduł całki:
x,y∈Ω
Z
kNgk = |
Z
N (x, y)g(y)dy| ¬
Ω
|N ||g(y)|dy
(5.6)
Ω
R
Wprowadźmy oznaczenie G =
|g(x)|dx. Wtedy kNgk ¬ |N |G. Zauważmy z
Ω
kolei, że dla n ∈ N zachodzi właściwość:
Z
kNn+1 gk = | N (x, y)(Nn g(y))dy| ¬
(5.7)
Ω
Z
¬
|N |
kNn g(y)kdy ¬ . . . ¬
(5.8)
Ω
¬
n+1
Z Z
Z
|N |
...
Ω Ω
Ω
|g(y)|dy dxn . . . dx1 =
| {z }
(5.9)
n razy
| {z }
n razy
= |N |n+1 G
Z
Z
...
Ω
Ω
1 dxn . . . dx1 = |N |n+1 G|Ω|n
| {z }
(5.10)
n razy
| {z }
n razy
Stosując kryterium d’Alemberta dla szeregu liczbowego
∞
P
an :=
n=0
∞
P
|N |n+1 G|Ω|n
n=0
otrzymujemy:
an+1 = lim |N ||Ω| < 1 |Ω| = 1
lim n→+∞
an
|Ω|
n→+∞
Na mocy kryterium d’Alemberta szereg
+∞
P
(5.11)
an jest zbieżny. Zatem badanych
n=0
szereg norm posiada zbieżną majorantę, co wobec kryterium Weierstrassa czyni
go jednostajnie zbieżnym.
Mając jednostajną zbieżność szeregu łatwo dowodzimy, że:
Nf
=
N(g + Ng + . . .)
(5.12)
=
2
Ng + N g + . . .
(5.13)
=
f −g
(5.14)
Co świadczy o tym, że suma szeregu von Neumanna jest rozwiązaniem równania
całkowego. Pozostaje dowieść jednoznaczności rozwiązania.
ROZDZIAŁ 5. TEORIA FREDHOLMA
33
Przypuśćmy istnienie dwóch funkcji f1 6= f2 będących rozwiązaniem równania f −Nf = g. Przez równość funkcji rozumiemy oczywiście równość w każdym
punkcie dziedziny. Rozważmy funkcję h := f1 − f2 6= 0. Ze względu na liniowość operatora całkowego, funkcja h jest rozwiązaniem równania jednorodnego
h − Nh = 0 i khk > 0. Zauważmy, jednak że:
Z
khk = kNhk ¬ |N |khkdx = |N ||Ω|khk
(5.15)
Ω
1
¬
|N ||Ω| < 1
(5.16)
Zatem otrzymaliśmy sprzeczność, która jest wynikiem przypuszczenia, że jest
więcej niż jedna funkcja będąca rozwiązaniem równania.
Szereg von Neumanna okazuje się być rozwiązaniem w bardzo wielu przypadkach dla różnych przestrzeni i różnych typów równań różniczkowych.
5.2
Alternatywa Fredholma
W teorii Fredholma będziemy zajmować obliczeniami dla równań z jądrami
specjalnymi. Jest to specyficzna podklasa funkcji całkowalnych w kwadracie
modułu, która okazuje się mieć kluczowe znaczenie.
Definicja 5.2.1. Jądra specjalne[3]
Niech un , wn będą układami liniowo niezależnych funkcji klasy L2 (Ω). Równania całkowe dla operatorów całkowych o jądrach:
N (x, y) =
r
X
ui (x)wi (y)
(5.17)
k=1
nazywać będziemy równania całkowymi o jądrach specjalnych.
Klasa ta jest w swej strukturze podobna do klasy funkcji zdegenerowanych.
I okazuje się, że podobnie jak dla funkcji zdegenerowanych zachodzi, że dowolną
funkcję o całkowalnym kwadracie modułu daje się przedstawić jako granicę pewnego ciągu jąder specjalnych. To podstawowe twierdzenie w tej teorii nazywać
będziemy twierdzeniem o aproksymacji:
Twierdzenie 5.2.2. O aproksymacji[3]
Jeżeli jądro jest funkcją klasy L2 (Ω) to dla dowolnie małej liczby > 0 istnieje
jądro specjalne spełniające warunek:
ZZ
r
X
|N (x, y) −
uk (x)wk (y)|2 dxdy < (5.18)
k=1
Ω×Ω
Twierdzenie to zostawimy bez dowodu. Wnioskiem z tego twierdzenia jest
podejrzenie posiadania przez jądro postaci sumy szeregu jąder specjalnych.
Przyjrzyjmy się postaci równania całkowego gdy jego jądro ma postać jądra
specjalnego. Wobec liniowości całki, otrzymujemy postać:
Z
r
X
f (x) = g(x) +
uk (x) f (y)wk (y)dy, x ∈ Ω
(5.19)
k=1
Ω
ROZDZIAŁ 5. TEORIA FREDHOLMA
34
Co jak łatwo spostrzec jest iloczynem skalarnym w L2 (Ω). Zatem
f (x) = g(x) +
r
X
uk (x)(f, wk )
(5.20)
k=1
Wykonując mnożenie skalarne obu stron równania przez wektor funkcji w =
(w1 , . . . , wr ) otrzymujemy układ r-równań postaci:
(f, wi ) = (g, wi ) +
r
X
(uk , wi )(f, wk )
(5.21)
k=1
Zatem otrzymaliśmy układ r-równań i r-niewiadomych postaci (f, wi ), a jego
rozwiązanie możemy odszukać dysponując algebrą liniową. Oczywiście istnieje
jednoznaczne rozwiązanie tego układu jeśli układ ten jest opisany macierzą nieosobliwą. Jeśli macierz tego układu jest osobliwa, wtedy różnica pomiędzy jej
stopniem a jej rzędem określa ilość niezerowych rozwiązań w układzie jednorodnym.
Jako dodatkową uwagę poświęćmy postaci sprzężonego operatora do operatora o jądrze specjalnym. Okazuje się, że jest ono również specjalne i ma postać
N ∗ (x, y) =
r
X
wk (x)uk (y),
x, y ∈ Ω
(5.22)
k=1
Co pozwala sprowadzić je przez analogię do postaci:
(h, ui ) = (k, ui ) +
r
X
(wk , ui )(h, uk )
(5.23)
k=1
Zatem widać, że zachodzi związek pomiędzy macierzami obu układów. Niech
C będzie macierzą układu normalnego, natomiast C ∗ do niego sprzężonego.
Zauważmy, że
c∗i,j
=
δi,j − (wj , ui ) = δi,j − (ui , wj )
(5.24)
=
δj,i − (uj , wi ) = δj,i − (uj , wi ) = cj,i
(5.25)
gdzie δi,j oznacza deltę Kroneckera. Oznacza to w szczególności zgodność rzędów obu macierzy co pociąga za sobą silne własności opisane w twierdzeniu nazywanym Alternatywą Fredholma. Pod pojęciem alternatywy w tym wypadku
rozumieć będziemy badanie właściwości pewnego równania całkowego poprzez
badanie własności innego. Tym innym równaniem będzie tzw. równanie całkowe
z jądrem sprzężonym do danego wykorzystujące właśnie powyższą własność.
Twierdzenie 5.2.3. Alternatywa Fredholma[3]
Równania całkowe o jądrze klasy L2 (Ω × Ω)
f − Nf = g
(5.26)
h − N∗ h = k
(5.27)
oraz
Mają
ROZDZIAŁ 5. TEORIA FREDHOLMA
35
ˆ Jednoznaczne rozwiązania dla dowolnych funkcji g i k, albo
ˆ odpowiadające im równania jednorodne posiadają niezerowe rozwiązania,
i liczba niezależnych liniowo rozwiązań każdego z tych równań jest taka
sama
W drugim przypadku warunkiem koniecznym i dostatecznym, na to by niejednorodne równanie całkowe miało rozwiązanie jest, żeby funkcja g była ortogonalna
do wszystkich rozwiązań jednorodnego równania sprzężonego.
Dowód powyższego faktu pominiemy, gdyż udowodnimy twierdzenie ogólniejsze.
5.3
Twierdzenie Fredholma
Rozszerzenie alternatywy Fredholma doprowadziło do sformułowania twierdzenia Fredholma, które pełniej opisuje zachowanie rozwiązań. Twierdzenie oprzemy o równanie całkowe Fredholma drugiego rodzaju, ale z uwypukleniem wartości własnej jądra w tzn. równaniu postaci:
Z
f (x) − λ N (x, y)f (y)dy = g(x), x ∈ Ω
(5.28)
Ω
i równaniu jednorodnym dla powyższego:
Z
f (x) − λ N (x, y)f (y)dy = 0,
x∈Ω
(5.29)
Ω
Twierdzenie 5.3.1. Twierdzenie Fredholma[2]
1. Na to aby równanie (5.28) miało dla każdej funkcji g, rozwiązanie f, potrzeba i wystarcza, aby jedynym rozwiązaniem równania jednorodnego (5.29)
była funkcja f = 0
2. Jeżeli równanie (5.29) ma niezerowe rozwiązania, to istnieją również niezerowe rozwiązania jednorodnego równania sprzężonego, natomiast przestrzenie rozwiązań obu równań są przestrzeniami liniowymi o skończonych,
i równych sobie, wymiarach algebraicznych.
3. Jeżeli równanie całkowe jednorodne ma niezerowe rozwiązania to warunkiem koniecznym i dostatecznym istnienia rozwiązania dla danej funkcji g
jest ortogonalność funkcji g do przestrzeni rozwiązań jednorodnego równania sprzężonego tj. :
Z
(5.30)
∀h
h − Nh = 0 ⇒ g(x)h(x)dx = 0
Ω
4. Zbiór wszystkich wartości własnych jądra równania (5.28) jest co najwyżej
przeliczalny. Ustawienie wartości własnych w ciąg nieskończony, o ile jest
możliwe, tworzy ciąg rozbieżny do nieskończości.
ROZDZIAŁ 5. TEORIA FREDHOLMA
36
Przeprowadzimy dowód powyższego dla najbardziej interesującej nas przestrzeni L2 (Ω).
Dowód. Naturalnie µ 6= 0. Zatem wprowadźmy operator całkowy N zbudowany
w oparciu o jądro N . Tak zdefiniowany operator jest zwarty.
Ad 1.
Załóżmy, że dla każdej funkcji istnieje dokładnie jedno rozwiązanie. Wtedy oczywiście w szczególności istnieje dokładnie jedno dla zera. Jako, że równanie jest
spełnione przez funkcję f=0, nie ma innego rozwiązania tego równania. Załóżmy
z kolei, że równanie jednorodne nie ma niezerowych rozwiązań. Oznacza to brak
wartości własnych. Na mocy twierdzenia Teorii Riesza 3.5.1 zatem widmo tego
operatora jest puste. Zatem każde λ 6= 0 jest wartością regularną i równanie ma
jednoznaczne rozwiązanie dla dowolnego g.
Ad 4.
Wobec Teorii Riesza 3.5.1 jest to wniosek z 3 części jej tezy.
Ad 2. & 4.
Wynikają wprost z twierdzenia 3.5.3.
5.4
Przykłady
Zastosowanie metody kolejnych przybliżeń
W zadaniach gdy spodziewamy się rozwiązania w postaci szeregu von Neumanna, możemy stosować metodę kolejnych przybliżeń. Rozważmy równanie postaci
f = g + Kf,
f, g ∈ C(R), K ∈ B(C(R))
(5.31)
z jądrem K : R × R → R ciągłym.
Spodziewając się rozwiązania w postaci szeregu von Neumanna obliczamy
kolejne funkcje sum częściowych.
Przykład 1. Rozwiążmy równanie całkowe metodą kolejnych przybliżeń:
Z1
f (x) = 1 +
xt2 f (t)dt
(5.32)
0
Obliczmy kilka pierwszych sum szeregu von Neumanna.
f0 (x)
=
1
(5.33)
Z1
f1 (x)
=
1+
1
xt2 dt = 1 + x
3
(5.34)
1
1+4
xt2 (1 + t)dt = 1 +
x
3
3·4
(5.35)
0
Z1
f2 (x)
=
1+
0
Z1
f3 (x)
=
1+
0
xt2 (1 +
5
1 + 4 + 42
t)dt = 1 +
12
3 · 42
(5.36)
ROZDZIAŁ 5. TEORIA FREDHOLMA
37
Stąd odgadujemy postać ogólną n-tej funkcji sumy częściowej, n ∈ N.
1
1
1
1
fn (x) = 1 + x (1 + + 2 + . . . + n−1 )
3
4 4
4
(5.37)
Zatem suma szeregu o sumach częściowych tej postaci wyraża się wzorem:
1
1
f (x) = 1 + x 1 ·
3 1−
1
4
1 4
4
=1+x · =1+x
3 3
9
(5.38)
Łatwo sprawdzić, że jest to rozwiązanie równania całkowego.
Z1
1+
1 4 1
4
4
xt2 (1 + t )dt = 1 + x( + · ) = 1 + x
9
3 9 4
9
(5.39)
0
Badanie równania o jądrze specjalnym metodą Fredholma
Równania całkowe bardzo często w praktyce mają bardzo prostą postać z jądrem
operatora z klasy jąder specjalnych. Pozwala to zastosować analizę Fredholma,
która rozstrzyga np. istnienie rozwiązania.
Przykład 2. Zbadajmy równanie Fredholma o postaci:
Z1
f (x) −
(y 3 + xy 2 + x2 y)f (y)dy = g(x),
x∈R
(5.40)
0
Jądra składa się z sumy 3 iloczynów. Odpowiednie funkcje to
u1 (x) = 1
w1 (y) = y 3
(5.41)
u2 (x) = x
w2 (y) = y
2
(5.42)
u3 (x) = x2
w3 (y) = y
(5.43)
Zatem zapiszmy je w postaci wektorów u = [u1 , u2 , u3 ]T , w = [w1 , w2 , w3 ]T .
Wtedy stosując mnożenie macierzowe (i zakładając, że mnożeniem elementów
jest iloczyn skalarny z L2 (R) ) otrzymujemy:

  1 1 1 
(u1 , w1 ) (u1 , w2 ) (u1 , w3 )
4
3
2
u · wT =  (u2 , w1 ) (u2 , w2 ) (u2 , w3 )  =  51 14 13 
(5.44)
1
1
1
(u3 , w1 ) (u2 , w2 ) (u3 , w3 )
6
5
4
Wtedy macierz układu, uzyskanego za pomocą metody Fredholma dla równań
całkowych z jądrem specjalnym, wyraża się wzorem
 3

− 31 − 12
4
3
− 13 
I3 − u · wT =  − 51
(5.45)
4
1
1
3
−6 −5
4
Wyznacznik tej macierzy nazywa się wyznacznikiem charakterystycznym. Wyznacznik powyższej macierzy wynosi
det I3 − u · wT ≈ −0.2209 6= 0
(5.46)
Zatem wobec niezerowości wyznacznika równanie całkowe posiada jednoznaczne
rozwiązanie.
Rozdział 6
Teoria Hilberta-Schmidta
6.1
Równanie całkowe o jądrze symetrycznym
W niniejszym rozdziale zawężamy obszar naszych rozważań do wąskiej klasy
równań z jądrami symetrycznymi nad przestrzenią funkcji całkowalnych w kwadracie modułu. Zgodnie z teorią omówioną w rozdziale 4.6 będziemy tu badać
operatory o jądrach samosprzężonych.
Definicja 6.1.1. Równanie całkowe o jądrze symetrycznym[2]
Niech A ∈ B(L2 (Ω)) będzie operatorem całkowym postaci
Z
(Au)(x) = A(x, y)u(y)dy
(6.1)
Ω
z jądrem A ∈ L2 (Ω × Ω) i symetrycznym tj. A(x, y) = A(y, x), prawie wszędzie
na Ω × Ω.
Wiemy, że tak zdefiniowany operator jest samosprzężony i zwarty. Określmy
jeszcze pewne dodatkowe kryteria na jądro.
Definicja 6.1.2. Warunek Hilberta - Schmidta[2]
Powiemy, że jądro A spełnia warunek Hilberta-Schmidta jeśli istnieje liczba γ >
0 taka, że
Z
|A(x, y)|2 dy ¬ γ
x∈Ω
(6.2)
Ω
Warunek Hilberta-Schmidta określa zatem podklasę L2 (Ω) funkcji o ograniczonej funkcji całki z kwadratu modułu. Jeszcze silniejszym warunkiem na jądro
jest warunek o zbiorze o mierze lokalnie dodatniej.
Definicja 6.1.3. Zbiór o mierze lokalnie dodatniej[2]
Powiemy, że Ω jest zbiorem zwartym o mierze lokalnie dodatniej gdy
|Ω ∩ K(xo , r)| > 0
(6.3)
dla każdej kuli K(x0 , r) o środku w x0 ∈ Ω.
Powyższy warunek w połączeniu z ciągłością jądra okazuje się być silniejszym
od warunku Hilberta-Schmidta.
38
ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA
6.2
39
Pełny układ ortonormalny elementów własnych
Ostatnim koniecznym pojęciem jest układ ortonormalny zupełny elementów
własnych. Przestrzenią naszych rozważań jest przestrzeń Hilberta X z operatorem samosprzężonym A odwzorowującym X w siebie. Na mocy twierdzenia
teorii Riesza 3.5.1 wszystkie wartości własne da się ustawić w ciąg. Wszystkie podprzestrzenie własne operatora są skończenie wymiarowe i każda z nich
posiada swoją bazę ortonormalną. Układ stworzony poprzez połączenie baz ortonormalnych wszystkich podprzestrzeni własnych nazywać będziemy pełnym
układem ortonormalnym elementów własnych. Łatwo zauważyć, że jest to faktycznie układ ortonormalny, gdyż twierdzenie 4.6.2 potwierdza, że elementy różnych przestrzeni własnych są do siebie ortogonalne.
Podajmy bez dowodu lemat i twierdzenie[2], które uzasadnią istotność takiego układu.
Lemat 6.2.1. Niech X będzie przestrzenią Hilberta, a (ek ) niech będzie układem
zupełnym ortonormalnym elementów własnych pewnego operatora samosprzężonego zwartego A ∈ B(X). Wtedy dla każdego elementu x ∈ X istnieje dokładnie
jeden element x0 ∈ X taki, że Ax0 = 0 oraz
X
x = x0 +
(x, ek )ek
(6.4)
k
I twierdzenie, które jest w zasadzie wnioskiem z powyższego.
Twierdzenie 6.2.2. Niech X będzie przestrzenią Hilberta, a przez (ek ) niech
będzie oznaczony układem zupełnym ortonormalnym elementów własnych pewnego operatora samosprzężonego zwartego A ∈ B(X) oraz niech (λk ) oznacza
odpowiadający mu pełny układ ortonormalny wartości własnych. Wtedy dla każdego elementu x ∈ X zachodzi:
X
Ax =
λk (x, ek )ek
(6.5)
k
Dowód wynika bezpośrednio z podziałania na obie stron tezy lematu za
pomocą operatora A.
Ciekawym zagadnieniem jest pytanie o warunek konieczny i dostateczny na
to by układ pełny ortonormalny był skończony. Zależy to oczywiście jedynie od
tego czy zbiór wartości własnych jest skończony. Okazuje się, że tak jest jedynie
w przypadku gdy jądro operatora jest zdegenerowane. Gdy zdegenerowane nie
jest - ciąg wartości własnych jest nieskończony.
6.3
Twierdzenie Hilberta-Schmidta
Dysponując powyższymi pojęciami jesteśmy w stanie podać twierdzenie HilbertaSchmidta
Twierdzenie 6.3.1. Twierdzenie Hilberta - Schmidta[2]
Niech będzie dane jądro symetryczne niezdegenerowane A ∈ L2 (Ω × Ω). Oznaczmy przez (uk ) pełny układ ortonormalny funkcji własnych jądra A, a przez (µk )
ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA
ciąg odpowiadających wartości własnych. Niech
Z
v(x) = A(x, y)u(y)dy,
gdzie
40
u ∈ L2 (Ω)
Ω
Wtedy
1. Funkcja v jest sumą swojego szeregu Fouriera względem układu (uk )
∞
X
v=
(v|uk )uk
(6.6)
k=1
w sensie zbieżności w przestrzeni L2 (Ω).
2. Jeżeli jądro A spełnia warunek Hilberta - Schmidta to szereg (6.6) jest
zbieżny bezwzględnie i jednostajnie na Ω i dla prawie każdego x ∈ Ω zachodzi równość
∞
X
v(x) =
(v|uk )uk (x)
(6.7)
k=1
3. Jeżeli Ω jest zbiorem zwartym o mierze lokalnie dodatniej, a jądro A ciągłe, to równość (6.7) zachodzi w dowolnym punkcie x ∈ Ω.
Dowód. Ad. 1o
Wobec twierdzenia 6.2.2 wiemy, że
v = Au =
∞
X
1
(u, uk )uk
µk
(6.8)
k=1
i że jest to zbieżność w sensie przestrzeni L2 (Ω). Zauważmy, że:
Z
(v, uk ) =
v(t)uk (t)dt
(6.9)
Ω
Z Z
=
A(s, t)u(s)uk (t)dsdt
(6.10)
A(t, s)u(s)uk (t)dtds
(6.11)
Ω Ω
Z Z
=
Ω Ω
Z
Z
A(t, s)uk (t)dt)ds
u(s)(
=
Ω
(6.12)
Ω
Z
u(s)(Auk (s))ds
=
(6.13)
Ω
Z
1
uk (s))ds
λk
(6.14)
u(s)(uk (s))ds
(6.15)
u(s)(
=
Ω
Z
=
1
λk
=
1
(u, uk )
λk
Ω
(6.16)
ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA
41
Co po podstawieniu kończy dowód 1o .
Ad. 2o
Załóżmy, że jądro spełnia warunek Hilberta-Schmidta.
Z
|A(x, y)|2 dy ¬ γ x ∈ Ω
(6.17)
Ω
Korzystając z nierówności Schwarza otrzymujemy:
m
X
m
X
uk (x)
||(u, uk )| ¬
|
λk
k=n
v
v
u m
u m
u X uk (x) u X
¬ t
|
|(u, uk )|2
|2 t
λk
|(v|uk )uk (x)| =
k=n
k=n
(6.18)
(6.19)
k=n
dla wszystkich x ∈ Ω, oraz dowolnych wskaźników m ­ n. W części 1o udowodniliśmy własność postaci : (v, uk ) = λ1k (u, uk ). Zauważmy, że jest to równoważne:
uk (t)
=
λk
Z
A(t, s)uk (s)ds
(6.20)
Ω
Zatem ciąg ukλ(x)
jest dla ustalonego x współczynnikiem Fouriera funkcji A(x, .)
k
przy uk . Wobec nierówności Bessel’a otrzymujemy:
Z
∞
X
uk (x) 2
|
| ¬ |A(s, t)|2 dt ¬ γ, x ∈ Ω
λk
k=1
(6.21)
Ω
Łącząc powyższe z (6.19), otrzymujemy:
m
X
v
u m
√ uX
|(v|uk )uk (x)| ¬ γ t
|(u, uk )|2
k=n
Wobec zbieżności szeregu
zbieżność w szeregu
∞
P
(6.22)
k=n
∞
P
|(u, uk )|2 otrzymujemy bezwględną i jednostajną
k=1
|(v|uk )uk (x)|. Ponieważ zbiega on średnio kwadratowo
k=n
do funkcji v, zatem równość w (6.6) zachodzi prawie wszędzie.
Ad. 3o
Łatwo zauważyć, że funkcje uk są ciągłe. Prawa strona w (6.6) jest funkcją ciągłą
swojego argumentu jako suma jednostajnie zbieżnego szeregu funkcji ciągłych.
Lewa strona tego równania też jest ciągła, gdyż jądro jest ciągłe. Wobec założenia o mierze lokalnie dodatniej zbioru Ω otrzymujemy, że równość tych funkcji
zachodzi dla każdego argumentu. Co kończy dowód twierdzenia.
Twierdzenie Hilberta-Schmidta pozwala nam poznać dokładną budowę funkcji g z równania Af = g. Jednakże, znając postać układu pełnego ortogonalnego, również w łatwy sposób będziemy w stanie wyznaczyć rozwiązanie takiego
ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA
42
równania. Bowiem ze wzorów na współczynniki Fouriera
Z
1
(v, uk ) =
u(y)uk (y)dy
λk
(6.23)
Ω
Może być łatwiej wyznaczyć rozwiązanie niż z wyjściowego równania.
6.4
Twierdzenie Mercer’a
Ostatnim twierdzeniem w tym rozdziale jest twierdzenie Mercera opisujące postać jądra dla równania całkowego symetrycznego niezdegenerowanego.
Twierdzenie 6.4.1. Twierdzenie Mercera[2]
Niech Ω będzie zbiorem zwartym o mierze dodatniej, a A - jądrem symetrycznym ciągłym i niezdegenerowanym, które posiada wyłącznie dodatnie wartości
własne. Niech (uk ) oznacza pełny ortonormalny układ funkcji własnych jądra
A oraz (µk ) odpowiadający ciąg wartości własnych to wtedy w każdym punkcie
(x, y) ∈ Ω × Ω zachodzi równość
A(x, y) =
∞
X
uk (x)uk (y)
k=1
(6.24)
µk
przy czym szereg ten jest zbieżny bezwzględnie i jednostajnie.
Zanim przystąpimy do dowodu przytoczmy następujące lematy:
Lemat 6.4.2. Niech X przestrzeń Hilberta, a przez (ek ) niech będzie oznaczony
układem zupełnym ortonormalnym elementów własnych pewnego operatora samosprzężonego zwartego A ∈ B(X) oraz niech (λk ) odpowiadający pełny układ
ortonormalny wartości własnych. Wtedy dla każdego elementu x ∈ X zachodzi:
X
(Ax, x) =
λk |(x, ek )|2
(6.25)
k
Powyższy lemat okazuje się być wnioskiem z lematu 6.2.1 oraz twierdzenia 6.2.2.
Lemat 6.4.3. Jeżeli Ω jest zbiorem zwartym o mierze lokalnie dodatniej, uk jest
układem pełnym ortonormalnym funkcji własnych jądra symetrycznego ciągłego
i niezdegenerowanego A określonego na produkcie Ω × Ω, a λk odpowiadający
ciąg wartości własnych jądra to poniższy szereg jest zbieżny jednostajnie
Z
∞
X
uk (x) 2
|
| = |A(x, y)|2 dy,
λk
k=1
x∈Ω
(6.26)
Ω
Dowód. Dowód twierdzenia Mercer’a[2]
Rozważmy jądra postaci
An (x, y) = A(x, y) −
n
X
uk (x)uk (y)
k=1
λk
,
n∈N
(6.27)
ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA
43
Przez A oraz dla dowolnego n ∈ N, przez An rozumieć będziemy operatory
całkowe o odpowiednim jądrze. Łatwo sprawdzić, że wtedy:
(An u, u) = (Au, u) −
n
X
1
|(u, uk )|2 ,
µk
n∈N
(6.28)
k=1
Wobec lematu
Z∞
(Au, u) =
1
|(u, uk )|2
λk
(6.29)
k=1
Czego efektem jest równość:
Z∞
(An u, u) =
1
|(u, uk )|2
λk
(6.30)
k=n+1
Co równoważnie oznacza, że:
ZZ
An (x, y)u(x)u(y)dxdy ­ 0
(6.31)
Ω×Ω
Łatwo zauważyć, że An (x, x) ­ 0, x ∈ Ω. Gdyby było inaczej, istniało by otoczenie otwarte na którym jądro było by ujemne. Wtedy biorą za u funkcję charakterystyczną tego obszaru uzyskalibyśmy sprzeczność z powyższym warunkiem.
Zatem
n
X
|uk (x)|2
An (x, x) = A(x, x) −
­0
(6.32)
λk
k=1
Wobec nieujemności wyrazów i ograniczenia górnego poprzez µ := sup A(x, x),
x∈Ω
szereg ten jest zbieżny. Wobec nierówności Schwarza:
|
m
X
uk (x)uk (y) 2
|
λk
¬
k=n
¬
m
m
X
|uk (x)|2 X |uk (y)|2
¬
λk
λk
k=n
m
X
µ
k=n
(6.33)
k=n
|uk (x)|2
λk
(6.34)
Za dla dowolnie ustalonego x ∈ Ω jest to szereg jednostajnie zbieżny ze względu
na y ∈ Ω. Suma szeregu jest funkcją ciągłą zmiennej y. Zauważmy, że:
Z
|A(x, y) −
k=1
Ω
Z
(A(x, y) −
=
Ω
Z
=
Ω
n
X
uk (x)uk (y)
λk
n
X
uk (x)uk (y)
k=1
|A(x, y)|2 −
λk
|2 dy =
) · (A(x, y) −
n
X
uk (x) 2 lemat
|
| −→ 0
n→+∞
λk
k=1
(6.35)
n
X
uk (x)uk (y)
k=1
λk
)dy =(6.36)
(6.37)
ROZDZIAŁ 6. TEORIA HILBERTA-SCHMIDTA
Stąd otrzymujemy
∞
X
|uk (x)|2
k=1
λk
44
= A(x, x)
(6.38)
Twierdzenie Diniego podaje, że szereg ten jest jednostajnie zbieżny. Zatem ostatecznie korzystając z prostej nierówności:
|uk (x)uk (y)| ¬
Otrzymujemy tezę.
1
(|uk (x)|2 + |uk (y)|2 ),
2
x, y ∈ Ω, k ∈ N
(6.39)
Bibliografia
[1] Walter Rudin, Analiza Funkcjonalna, PWN 2002, Warszawa
[2] Witold Kołodziej, Wybrane rozdziały analizy matematycznej, PWN 1970,
Warszawa
[3] Adam Piskorek, Równania całkowe, WNT 1980, Warszawa
[4] William Arveson, A Short Course on Spectral Theory, Springer-Verlug 2002,
New York
[5] Andrzej Alexiewicz, Analiza funkcjonalna, PWN 1969, Warszawa
[6] Witold Pogorzelski, Równania całkowe i ich zastosowania Tom I, PWN 1953,
Warszawa
[7] M.A. Krasnosielski, A.I. Koszelew, S.G. Michlin, Ł.S. Rakowszczik, W.J.
Stiecenko, P.P. Zabrejko, Równania całkowe, PWN 1972, Warszawa
45