Wariacje Funkcji, Ich Własności i Zastosowania

Transkrypt

Wariacje Funkcji, Ich Własności i Zastosowania
Środowiskowe Studia Doktoranckie
z Nauk Matematycznych
Uniwersytet Marii Curie-Skłodowskiej w Lublinie
Józef Banaś
Katedra Matematyki
Politechnika Rzeszowska
Wariacje Funkcji, Ich Własności
i Zastosowania
Lublin 2014
Spis treści
Wstęp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1. Funkcje mierzalne i regularne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2. Wariacja funkcji w sensie Jordana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3. Funkcje o wariacji ograniczonej w sensie Wienera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4. Funkcje o wariacji ograniczonej w sensie Wienera-Younga . . . . . . . . . . . . . . . . . . . . . . 58
5. Wariacja funkcji w sensie Watermana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74
6. Całka Riemanna-Stieltjesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94
Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
Wstęp
Celem przedkładanego skryptu jest przedstawienie podstawowych faktów dotyczących
różnych rodzajów definicji pojęcia wariacji (wahania) funkcji. Główny nacisk zostanie położony na podanie podstawowych faktów dotyczących klasycznej wariacji funkcji. Pojęcie
to zostało wprowadzone do matematyki przez znakomitego francuskiego matematyka C.
Jordana pod koniec XIX wieku. Jordan odkrył też podstawową własność funkcji o wariacji ograniczonej. Własność ta pozwala każdą funkcję o wariacji ograniczonej na zadanym
przedziale [a, b] przedstawić jako różnicę dwóch funkcji rosnących na tym przedziale.
Odkrycie tej własności pozwoliło na znaczne uproszczenie teorii funkcji o wariacji ograniczonej, a przede wszystkim na zbudowanie poręcznej teorii całki Riemanna-Stieltjesa.
To ostatnie pojęcie okazało się niezwykle użyteczne w teorii prawdopodobieństwa oraz w
pewnych działach mechaniki [2,3,5].
W przedkładanym opracowaniu wskażemy również na pewne uogólnienie wspomnianego, klasycznego pojęcia wariacji i funkcji o wariacji ograniczonej. Mianowicie, przedstawimy pojęcie wariacji funkcji w sensie Wienera, w sensie Wienera-Younga i w sensie
Watermana. Oczywiście uogólnienia te nie wyczerpują listy wszystkich, obecnie znanych
uogólnień pojęcia wariacji funkcji. Tym niemniej, przedstawiają one najważniejsze z tych
uogólnień, które mają najwięcej własności, najwięcej zastosowań i których teoria jest
obecnie najbardziej rozwinięta.
Niniejszy skrypt został opracowany głównie na podstawie monografii [1], która całkowicie poświęcona jest przedstawieniu pojęcia wariacji funkcji w różnym ujęciu oraz
omówieniu ich własności i zastosowań. Ponadto, wykorzystane zostały również pozycje
[6,7,8,9]. W pozycjach tych omawia się również pojęcie wariacji funkcji i wskazuje na
różnorakie zastosowania tego pojęcia.
3
1. Funkcje monotoniczne i regularne
Niech D będzie niepustym podzbiorem zbioru liczb rzeczywistych R oraz niech dana
będzie funkcja f : D → R. Dalej, niech dany będzie zbiór A ⊂ D, A 6= ∅.
Definicja 1.1. Mówimy, że funkcja f jest na zbiorze A:
a) rosnąca, jeżeli ∀x1 ,x2 ∈A [x1 < x2 ⇒ f (x1 ) ¬ f (x2 )]; piszemy wtedy, że f
A
b) ściśle rosnąca, jeżeli ∀x1 ,x2 ∈A [x1 < x2 ⇒ f (x1 ) < f (x2 )]; piszemy wtedy: f % A
c) malejąca, jeżeli ∀x1 ,x2 ∈A [x1 < x2 ⇒ f (x1 ) ­ f (x2 )]; piszemy, że f
AAU
A
d) ściśle malejąca, jeżeli ∀x1 ,x2 ∈A [x1 < x2 ⇒ f (x1 ) > f (x2 )]; piszemy wtedy, że
f &A
Funkcję f nazywa się funkcją monotoniczną (ściśle monotoniczną) na zbiorze A, jeżeli
f jest rosnąca na zbiorze A lub malejąca na zbiorze A (ściśle rosnąca lub ściśle malejąca
na zbiorze A).
Oczywiście, każda funkcja ściśle monotoniczna na zbiorze A jest na tym zbiorze monotoniczna.
Zauważmy, że suma dwóch funkcji rosnących (malejących) na zbiorze A jest funkcją
rosnącą (malejącą) na zbiorze A. Ponadto, iloczyn funkcji rosnącej (malejącej) na zbiorze
A przez stałą c ­ 0 jest funkcją rosnącą (malejącą) na zbiorze A. Zauważmy, że jeżeli f
jest rosnąca (malejąca) na zbiorze A oraz c < 0 to cf jest malejąca (rosnąca) na zbiorze
A. Stąd np. wynika, że jeżeli oznaczymy przez SA zbiór wszystkich funkcji rosnących
(malejących) na zbiorze A, to zbiór ten ma własność:
f ∈ SA , − f ∈ SA ⇒ f ≡ 0 na zbiorze A .
Oznacza to, że zbiór SA funckji rosnących (albo malejących) na zbiorze A, będący podzbiorem przestrzeni liniowej RA ∗ , ma strukturę stożka. Niestety, nie jest to podprzestrzeń
przestrzeni RA . Podobnie, zbiór MA funckji monotonicznych na zbiorze A nie ma nawet
struktury stożka!
Później pokażemy, jak tą niedogodną sytuację można obejść (w pewnien sposób).
∗
Jeżeli X, Y są zbiorami niepustymi, to symbolem Y X oznaczamy zbiór wszystkich funkcji f : X → Y .
4
W dalszym ciągu załóżmy, że I jest przedziałem (otwartym, domkniętym, jednostronnie otwartym, ograniczonym lub nieograniczonym). Symbolem I̊ będziemy oznaczać wnętrze przedziału I, np. jeżeli I = (a, b], to I̊ = (a, b) itd.
Mamy następujące, ważne twierdzenie.
Twierdzenie 1.2. Załóżmy, że f jest funkcją monotoniczną na przedziale I(f : I → R).
Wtedy dla dowolnego x ∈ I̊ istnieją granice jednostronne funkcji f w punkcie x (skończone), tzn. istnieją
f (x−) = lim f (y) ,
y→x−
f (x+) = lim f (x) .
y→x+
Ponadto, jeżeli f jest rosnąca na przedziale I, to
f (x−) ¬ f (x) ¬ f (x+) ,
natomiast, jeżeli f jest malejąca na I, to
f (x−) ­ f (x) ­ f (x+) .
Dowód. Dla ustalenia uwagi załóżmy, że f jest rosnąca na przedziale I. Pokażemy, że
f (x−) = sup{f (y) : y < x, y ∈ I}
f (x+) = inf{f (y) : y > x, y ∈ I} .
Załóżmy najpierw, że y ∈ I, y < x. Wtedy z założenia mamy, że
f (y) < f (x)
a to oznacza, że zbiór {f (y) : y ∈ I, y < x} jest ograniczony z góry i jedną z jego
majorant jest f (x). Zatem zbiór ten ma kres górny - oznaczmy ten kres górny przez f∗ (x),
tzn. kładziemy:
f∗ (x) = sup{f (y) : y ∈ I, y < x} .
Ponieważ f (x) jest majorantą zbioru {f (y) : y ∈ I, y < x}, więc mamy
f∗ (x) ¬ f (x) .
Przy okazji otrzymujemy, że f∗ (x) ∈ R.
5
(1.1)
W dalszym ciągu pokażemy, że f (x−) istnieje oraz, że
f (x−) = f∗ (x) .
(1.2)
W tym celu ustalmy dowolnie liczbę ε > 0. Z definicji kresu górnego wynika, że istnieje
liczba w zbiorze {f (y) : y ∈ I, y < x} - tzn. istnieje liczba y < x, y ∈ I taka, że
f∗ (x) − ε < f (y) ¬ f∗ (x) .
(1.3)
Weźmy teraz dowolny ciąg {xn } taki, że {xn } ⊂ I, xn < x dla n = 1, 2, ... oraz xn → x.
Stąd: i z definicji granicy ciągu wynika, że istnieje liczba naturalna n0 taka, że dla n ∈ N,
n ­ n0 , zachodzi, że
y < xn ¬ x .
Stąd i z (1.3) mamy:
f∗ (x) − ε < f (y) ¬ f (xn ) ¬ f∗ (x) ,
(1.4)
przy czym ostatnia nierówność (po prawej stronie) w (1.4) wynika z definicji kresu górnego,
bowiem {xn } ⊂ {y ∈ I : y < x} .
Z nierówności (1.4) otrzymujemy, że
lim f (xn ) = f∗ (x) .
n→∞
Ponieważ tak jest dla dowolnego ciągu {xn } (byle tylko xn < x, xn → x, xn ∈ {y ∈
I : y < x}), więc stąd mamy, że
lim f (x) = f (x−) = f∗ (x) ,
y→x−
co dowodzi (1.2).
Dowód, że f (x+) = f ∗ (x) = inf{f (y) : y ∈ I, y > x} przebiega podobnie. Mamy
również, że
f (x+) ­ f (x) .
Koniec dowodu.
Uwaga 1.3. Jeżeli x jest lewym (prawym) końcem przedziału I, mamy podobne stwierdzenia. Np. gdy przedział I ma postać
I = (a, b) lub I = [a, b) itp. , b ¬ +∞ ,
6
to mamy, że lim f (x) istnieje, oraz
x→a+
f (a+) = lim f (x) ­ f (a)
x→a+
(oczywiście dla funkcji rosnącej).
Twierdzenie 1.4. Rodzina przedziałów otwartych i rozłącznych jest co najwyżej przeliczalna.
Dowód. Wiadomo, że w każdym przedziale otwartym znajduje się przynajmniej jedna
liczba wymierna.
Załóżmy, że (Uλ )λ∈Λ jest rodziną przedziałów otwartych i rozłącznych. Weźmy odwzorowanie f : Λ → Q (Q oznacza zbiór liczb wymiernych) określone w ten sposób, że każdemu
wskaźnikowi λ ∈ Λ przyporządkowujemy dokładnie jedną liczbę wymierną z przedziału
Uλ . Jest to funkcja różnowartościowa, bowiem dla λ1 6= λ2 , λ1 , λ2 ∈ Λ, przedziały Uλ1 i
Uλ2 są rozłączne, więc liczby wymierne f (λ1 ) i f (λ2 ) są różne. Zatem f : Λ → f (Λ) ⊂ Q
jest bijekcją. Ponieważ f (Λ), jako podzbiór zbioru przeliczalnego Q, jest skończony lub
przeliczalny, więc zbiór Λ, a co zatem idzie rodzina {Uλ }λ∈Λ , jest co najwyżej przeliczal
na.
Sformułujemy teraz i udowodnimy kilka lematów o funkcjach monotonicznych.
Lemat 1.5. Niech f : I → R będzie funkcją rosnącą (malejącą) na przedziale I. Niech
x, y, z ∈ I będą takie, że x < z < y (wtedy oczywiście z ∈ I̊). Wtedy zachodzą nierówności
f (x+) ¬ f (z) ¬ f (y−) ,
gdy f
f (x+) ­ f (z) ­ f (y−) ,
gdy f
I
AAU
I.
Dowód. Załóżmy np., że f jest rosnąca na I. Wtedy, z dowodu poprzedniego Twierdzenia
1.2 mamy, że
f (x+) =
inf
u∈(x,+∞)∩I
f (u) ¬ f (z)
(bo z ∈ (x, +∞) ∩ I), oraz
f (z) ¬
sup
f (v)
v∈(−∞,y)∩I
(bo z ∈ (−∞, y) ∩ I). Koniec dowodu.
7
Lemat 1.6. Niech x ∈ I̊ będzie punktem nieciągłości funkcji rosnącej f . Wtedy przedział
(f (x−), f (x+)) jest przedziałem niepustym (i otwartym). Podobnie, gdy x jest punktem
nieciągłości funkcji malejącej f , to przedział (f (x+), f (x−)) jest niepusty.
Dowód. Załóżmy np., że f
I
. Jeżeli x jest punktem nieciągłości funkcji f , to z po-
przednio ustalonych własności mamy, że albo f (x−) ¬ f (x) < f (x+), albo f (x−) <
f (x) ¬ f (x+) albo f (x−) < f (x) < f (x+). W każdym z trzech przypadków mamy, że
f (x−) < f (x+), więc przedział (f (x−), f (x+)) jest niepusty.
Lemat 1.7. Niech x, y ∈ I̊, x < y. Załóżmy, że x, y są punktami nieciągłości funkcji f ,
rosnącej na przedziale I. Wtedy przedziały (f (x−), f (x+)), (f (y−), f (y+)) są niepuste i
rozłączne. Podobne stwierdzenie ma miejsce dla funkcji malejącej.
Dowód. Tak jak poprzednio, dla ustalenia uwagi załóżmy, że f
I
. Wtedy, z Lematu
1.5 mamy, że f (x+) ¬ f (y−), więc przedziały otwarte (f (x−), f (x+)), (f (y−), f (x+))
są rozłączne i niepuste.
Twierdzenie 1.8. Zbiór punktów nieciągłości funkcji f : I → R, która jest monotoniczna
na przedziale I, jest co najwyżej przeliczalny.
Dowód. Oznaczmy przez DI zbiór wszystkich punktów nieciągłości funkcji f na przedziale I. Wtedy I̊ jest oczywiście też przedziałem i mamy, że DI = DI̊ ∪ {a} lub DI = DI̊ ∪ {b}
lub DI = DI̊ ∪ {a, b} lub DI = DI̊ . Wystarczy pokazać, że zbiór DI̊ jest co najwyżej
przeliczalny.
Dla ustalenia uwagi załóżmy, że f
I
. Weźmy odwzorowanie T , które każdemu punk-
towi x ∈ D przyporządkowuje przedział niepusty i otwarty (f (x−), f (x+)). Z Lematu 1.7
wynika, że odwzorowanie T jest injektywne. Zatem T (D) złożone jest z przedziałów otwartych, niepustych i rozłącznych oraz T : D → T (D) jest bijekcją. Na podstwie Twierdzenia
1.4 wiemy, że T (D) jest zbiorem co najwyżej przeliczalnym. Ponieważ T : D → T (D) jest
bijekcją, więc D jest co najwyżej przeliczalny. Koniec dowodu.
W dalszym ciągu wskażemy na pewne istotne uogólnienie zarówno funkcji monotonicznych jak i ciągłych. W tym celu wprowadzimy najpierw pewne oznaczenia.
I tak, zbiór wszystkich funkcji f : [a, b] → R, które są ograniczone na przedziale [a, b],
oznaczać będziemy symbolem B([a, b]). Wiadomo, że ten zbiór tworzy przestrzeń Banacha
8
z normą supremum, tzn. dla f ∈ B([a, b]) przyjmujemy, że
||f ||∞ = sup{|f (x)| : x ∈ [a, b]} .
(1.5)
Ważną w wielu rozważaniach przestrzenią jest przestrzeń C([a, b]) złożona z funkcji
f : [a, b] → R, które są ciągłe na [a, b]. Przestrzeń tę również wyposażamy w normę (1.5).
Oczywiście, ze znanych własności funkcji ciągłych wynika, że normę (1.5) można zastąpić
normą maksimum
||f ||∞ = max{|f (x)| : x ∈ [a, b]} .
(1.6)
Można pokazać, że C([a, b]) jest domknietą podprzestrzenią przestrzeni B([a, b]), a więc
jest przestrzenią Banacha. Przestrzeń ta nazywa się przestrzenią funkcji ciągłych z normą
(metryką) zbieżności jednostajnej, ponieważ zbieżność względem normy (1.6) pokrywa się
ze zbieżnością jednostajną.
Oczywiście na funkcje monotoniczne na przedziale [a, b], tzn. na zbiór M[a,b] , możemy
patrzeć jako na zbiór w przestrzeni B([a, b]).
Jak udowodniliśmy to wyżej, każda funkcja monotoniczna f ∈ B([a, b]) ma w każdym punkcie przedziału [a, b] (skończone) granice jednostronne. Punkt nieciągłości takiej
funkcji jest to tzw. skok.
Na ogół przyjęto mówić, że jeżeli funkcja f ∈ B([a, b]) ma w punkcie x0 granice jednostronne oraz jest w tym punkcie nieciągła, to taka nieciągłość jest nazywana nieciągłością
I-tego rodzaju.
Żeby nasze rozważania ujednolicić, wprowadzimy dalej pewne definicje i oznaczenia.
Definicja 1.9. Funkcję f ∈ B([a, b]) będziemy nazywać funkcją regularną, jeżeli w
każdym punkcie x ∈ [a, b] funkcja f ma granice jednostronne (skończone). Oczywiście w
punkcie x = a ma granicę prawostronną, natomiast w punkcie x = b granicę lewostronną.
Zbiór wszystkich funkcji regularnych na przedziale [a, b] będziemy oznaczać symbolem
R([a, b]). Oczywiście R([a, b]) ⊂ B([a, b]).
Jeżeli f ∈ R([a, b]), to w dowolnie ustalonym punkcie x ∈ [a, b] funkcja f może być
ciągła lub nieciągła. Jeżeli w punkcie x funkcja f jest nieciągła, to w przypadku, gdy
granice jednostronne f (x−) = lim f (y), f (x+) = lim f (y) są różne (f (x−) 6= f (x+)),
y→x−
y→x+
punkt x nazywamy skokiem. Jeżeli f (x−) = f (x+), to liczbę x nazywamy nieciągłością
usuwalną.
9
Dla f ∈ R([a, b]) wprowadzimy następujące oznaczenia:
D(f ) = {x ∈ [a, b] : f jest nieciągła w punkcie x} ,
(1.7)
D0 (f ) = {x ∈ [a, b] : f ma nieciągłość usuwalną w x} ,
(1.8)
D1 (f ) = {x ∈ [a, b] : f ma skok w punkcie x} .
(1.9)
Mamy, że:
D(f ) = D0 (f ) ∪ D1 (f )
dla f ∈ R([a, b]). Jeżeli f jest monotoniczna na [a, b] to
D(f ) = D1 (f ), D0 (f ) = ∅ .
Chociaż wydaje się, że klasa funkcji regularnych jest bardzo odległa od klasy funkcji
monotonicznych, to jednak funkcje regularne zachowują jedną bardzo ważną własność
funkcji monotnicznych. Mamy bowiem następujące twierdzenie.
Twierdzenie 1.10. Zbiór punktów nieciągłości funkcji regularnej f : [a, b] → R jest co
najwyżej przeliczalny.
Dowód. Rozważmy ”uśrednienie” f funkcji f określone wzorem
f (x) =

 1 (f (x−) + f (x+))

2
dla x ∈ D1 (f )
f (x)
dla x pozostałych .
Oczywiście mamy, że D(f ) = D(f ), D0 (f ) = D0 (f ), D1 (f ) = D1 (f ), więc wystarczy
pokazać, że zbiór D(f ) jest co najwyżej przeliczalny.
Załóżmy najpierw, że x0 ∈ D0 (f ) ∩ (a, b). Wtedy f (x0 −) = f (x0 +) 6= f (x0 ). Załóżmy np.,
że f (x0 −) = f (x0 +) < f (x0 ) i połóżmy ε = 21 (f (x0 ) − f (x0 +)) > 0. Dobierzmy liczbę
δ > 0 tak, żeby dla x ∈ (x0 − δ, x0 ) ∪ (x0 , x0 + δ) zachodziła nierówność f (x) < f (x0 ) − ε.
Stąd wynika, że koło w R2 o środku w punkcie (x0 , f (x0 )) i promieniu min{δ, ε} nie zawiera
innych punktów wykresu funkcji f (lub f ) za wyjątkiem środka (x0 , f (x0 )).
Załóżmy dalej, że x0 ∈ D1 (f ) ∩ (a, b). Wtedy f (x0 −) 6= f (x0 +). Niech np. będzie, że
f (x0 −) < f (x0 +). Połóżmy ε = 13 (f (x0 +) − f (x0 −)) > 0 i dobierzmy liczbę δ > 0 taką,
żeby
f (x) < f (x0 −) + ε dla x ∈ (x0 − δ, x0 )
10
oraz
f (x) > f (x0 +) − ε dla x ∈ (x0 , x0 + δ) .
Stąd wynika, że koło o środku w punkcie (x0 , f (x0 )) i promieniu min{ε, δ} nie zawiera
innych punktów wykresu funkcji f poza punktem (x0 , f (x0 )).
Ostatecznie widzimy, że zbiór tych wszystkich punktów wykresu funkcji f , które są
środkami kół wyżej opisanych, składa sie wyłącznie z punktów izolowanych. Z faktów
zawartych w niżej podanych zadaniach (zad. 1 i 2) łatwo wywnioskować, że zbiór ten jest
co najwyżej przeliczalny. Stąd wynika, że zbiór D(f ) jest co najwyżej przeliczalny.
Ważne twierdzenie, charakteryzujące funkcje regularne, udowodnił w 1933 roku Wacław Sierpiński. Przytoczymy to twierdzenie bez dowodu (por. [1]).
Twierdzenie 1.11. Funkcja f należy do zbioru R([a, b]) wtedy i tylko wtedy, gdy można
ją przedstawić w postaci złożenia f = g ◦ τ , gdzie τ : [a, b] → [c, d] jest funkcją ściśle
rosnącą, natomiast g ∈ C([a, b]).
Zauważmy na zakończenie tego rozdziału, że zbiór R([a, b]) ma strukturę przestrzeni
liniowej nad ciałem R.
Pozostawiamy Czytelnika z problemem: Czy R([a, b]) jest domknietą podprzestrzenią przestrzeni B([a, b])? Inaczej: Czy R([a, b]) jest przestrzenią Banacha z normą (1.5)?
Zadania
1. Pokazać, że jeżeli funkcja f : [a, b] → R jest ściśle rosnąca na przedziale [a, b], to
funkcja odwrotna f −1 jest ciągła na zbiorze f ([a, b]).
2. Pokazać, że funkcja f : R → R jest monotoniczna wtedy i tylko wtedy, gdy
f −1 ([α, β]) jest przedziałem dla każdego przedziału [α, β] ⊂ R.
Czy twierdzenie to jest prawdziwe w przypadku, gdy f : [a, b] → R?
3. Niech A będzie podzbiorem przestrzeni metrycznej X z metryką d. Zbiór A nazywać
będziemy zbiorem izolowanym, jeżeli każdy punkt zbioru A jest punktem izolowanym
tego zbioru.
Pokazać, że zbiór wszystkich punktów izolowanych zbioru A jest zbiorem izolowanym.
11
4. Niech X będzie przestrzenią metryczną ośrodkową. Pokazać, że każdy podzbiór A
przestrzeni X, który jest zbiorem izolowanym, jest co najwyżej przeliczalny.
5. Niech (X, d) będzie przestrzenią metryczną. Pokazać, że jeżeli istnieje zbiór A (A ⊂
X), który jest nieprzeliczalny oraz jeżeli istnieje liczba ε > 0 taka, że dla dowolnych
x, y ∈ A, x 6= y zachodzi, że d(x, y) ­ ε, to przestrzeń X nie jest ośrodkowa.
6. Pokazać, że przestrzeń l∞ złożona ze wszystkich ciągów rzeczywistych ograniczonych, z normą supremum, nie jest ośrodkowa.
7. Udowodnić Twierdzenie 1.11 (Sierpińskiego).
8. Niech f : [a, b] → R będzie zadaną funkcją ograniczoną. Rodzinę {In } (skończoną
lub nie) nie zachodzących na siebie podprzedziałów przedziału [a, b] będziemy nazywać f -uporządkowaną, jeżeli |f (In )| ­ |f (In+1 )| dla każdego n = 1, 2, ..., przy czym
symbol |A| (dla A będącego ograniczonym podzbiorem zbioru R) oznacza długość
zbioru A, tzn. |A| = sup A − inf A. Pokazać, że jeżeli f jest funkcją regularną na
przedziale [a, b], to każdy ciąg nie zachodzących na siebie podprzedziałów przedziału
[a, b] można f -uporządkować.
Uwaga. Jeżeli U i V są podzbiorami przestrzeni metrycznej X, to mówimy, że zbiory U ,
V nie zachodzą na siebie, jeżeli Ů ∩V̊= ∅.
12
2. Wariacja funkcji w sensie Jordana
W rozdziale tym omówimy pojęcie wariacji funkcji w sensie klasycznym, które zostało
wprowadzone pod koniec XIX wieku przez znakomitego matematyka francuskiego Camile
Jordana (por. [1]). Warto w tym miejscu wspomnieć, że C. Jordan odkrył fundamentalną
własność funkcji o wariacji ograniczonej na przedziale, mówiącą, że taką funkcję można
przedstawić jako różnicę dwóch funkcji rosnących na tym przedziale.
W celu wprowadzenia pojęcia wariacji (wahania) funkcji załóżmy, że f jest funkcją
rzeczywistą określoną na przedziale [a, b] (tzn. f : [a, b] → R), ograniczoną. Skończony
zbiór P = {t0 , t1 , t2 , ..., tm } złożony z puntów przedziału [a, b] takich, że
a = t0 < t1 < · · · < tm−1 < tm = b
będziemy nazywać podziałem przedziału [a, b]. Występująca w tej definicji liczba m jest
dowolną liczbą naturalną, m ­ 2.
Zbiór wszystkich podziałów przedziału [a, b] oznaczać będziemy przez P([a, b]).
Liczbę określoną równością
µ(P ) = max{tj − tj−1 : j = 1, 2, ..., m}
nazywać będziemy rozmiarem podziału P . Jeżeli
t1 − t0 = t2 − t1 = · · · = tm − tm−1
to podział P nazywamy równoodległym.
Definicja 2.1. Dla zadanej dowolnie funkcji f : [a, b] → R, ograniczonej na [a, b] oraz dla
zadanego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]), liczbę nieujemną Var(f, P ), określoną
wzorem
Var(f, P ) = Var(f, P ; [a, b]) =
m
X
|f (tj ) − f (tj−1 )|
(2.1)
j=1
będziemy nazywać wariacją (w sensie Jordana) funkcji f na przedziale [a, b]
względem podziału P .
Natomiast wielkość (możliwie nieskończoną) Var(f ), określoną równością
Var(f ) = Var(f ; [a, b]) = sup{Var(f, P ; [a, b]) : P ∈ P([a, b])}
będziemy nazywać wariacją całkowitą (Jordana) funkcji f na przedziale [a, b].
13
(2.2)
Zauważmy, że zamiast nazwy wariacja używa się też nazwy wahanie. Ponadto, w
miejsce nazwy wariacja całkowita będziemy używać terminu wariacja.
Definicja 2.2. Jeżeli Var(f ; [a, b]) < ∞, to wtedy mówimy, że f jest funkcją o wariacji
ograniczonej (lub funkcją o ograniczonej wariacji Jordana) na [a, b].
Zbiór wszystkich funkcji o wariacji ograniczonej na przedziale [a, b] oznaczać będziemy
symbolem BV ([a, b]).
Podamy teraz twierdzenie przedstawiające podstawowe własności wariacji funkcji.
Twierdzenie 2.3. Wielkości określone wzorami (2.1) i (2.2) mają następujące własności:
(a) Wariacja (2.2) jest podaddytywna ze względu na funkcje, tzn. dla dowolnych funkcji
f, g : [a, b] → R spełniona jest nierówność
Var(f + g; [a, b]) ¬ Var(f ; [a, b]) + Var(g; [a, b]) .
(b) Wariacja (2.2) jest dodatnio jednorodna ze względu na funkcje, tzn.
Var(λf ; [a, b]) = |λ|Var(f ; [a, b])
dla λ ∈ R.
(c) Dla dowolnych x, y ∈ [a, b] takich, że x < y ma miejsce nierówność
|f (x) − f (y)| ¬ Var(f ; [x, y]) .
(d) Jeżeli f ∈ BV ([a, b]), to f jest ograniczona oraz ma miejsce nierówność
||f ||∞ ¬ |f (a)| + Var(f ; [a, b]) ,
gdzie norma || · ||∞ zadana jest wzorem (1.5).
(e) Każda funkcja monotoniczna f : [a, b] → R należy do zbioru BV ([a, b]) oraz
Var(f ; [a, b]) = |f (b) − f (a)| .
(f ) Wariacja (2.1) jest monotoniczna ze względu na podziały, tzn. jeżeli P, Q ∈ P([a, b])
oraz P ⊂ Q to
Var(f, P ; [a, b]) ¬ Var(f, Q; [a, b]) .
14
(g) Wariacja (2.2) jest addytywna ze względu na przedziały, tzn.
Var(f ; [a, b]) = Var(f ; [a, c]) + Var(f ; [c, b])
dla a < c < b.
Dowód. Ustalmy dowolnie funkcje f, g : [a, b] → R oraz liczbę λ ∈ R. Weźmy podział
P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy otrzymujemy:
Var(f + g, P ) =
m
X
|(f + g)(tj ) − (f + g)(tj−1 )|
j=1
=
m
X
|[f (tj ) − f (tj−1 )] + [g(tj ) − g(tj−1 )]|
j=1
¬
m
X
|f (tj ) − f (tj−1 )| +
j=1
m
X
|g(tj ) − g(tj−1 )|
j=1
= Var(f, P ) + Var(g, P ) ¬ Var(f ) + Var(g) .
Stąd otrzymujemy
Var(f + g) ¬ Var(f ) + Var(g) ,
co dowodzi nierówności z punktu (a).
Dla dowodu (b) napiszmy:
Var(λf, P ) =
m
X
|(λf )(tj ) − (λf )(tj−1 )|
j=1
= |λ|
m
X
|f (tj ) − f (tj−1 )| = |λ|Var(f, P ) .
j=1
Stąd i z własności kresu górnego otrzymujemy równość z punktu (b).
Żeby udowodnić (c) wystarczy wziąć podział {x, y} ∈ P([x, y]).
Wtedy mamy
|f (x) − f (y)| = Var(f, P ; [x, y]) ¬ Var(f ; [x, y])
i otrzymujemy żądaną nierówność.
Dalej, zakładając, że a < x < b i biorąc podział Px = {a, x, b} ∈ P([a, b]), otrzymujemy
|f (x) − f (a)| ¬ |f (b) − f (x)| + |f (x) − f (a)| = Var(f, Px ; [a, b]) .
15
Stąd dostajemy
|f (x)| − |f (a)| ¬ ||f (x)| − |f (a)|| ¬ |f (x) − f (a)| ¬ Var(f ; [a, b])
i dalej mamy
|f (x)| ¬ |f (a)| + Var(f ; [a, b])
(2.3)
dla dowolnego x ∈ (a, b). Powyższa nierówność jest również w sposób trywialny prawdziwa
dla x = a.
Biorąc dalej w nierówności z punktu (c) x = a, y = b, otrzymujemy:
|f (b)| − |f (a)| ¬ ||f (b)| − |f (a)|| ¬ |f (b) − f (a)|
= |f (a) − f (b)| ¬ Var(f ; [a, b])
Stąd
|f (b)| ¬ |f (a)| + Var(f ; [a, b]) .
Łącząc powyższą nierówność z nierównością (2.3) wnioskujemy o prawdziwości nierówności
z (d).
Załóżmy teraz, że f : [a, b] → R jest funkcją monotoniczną na [a, b]. Rozważmy przypadek, gdy f jest rosnąca. Wtedy, dla dowolnie ustalonego podziału P = {t0 , t1 , ..., tm } ∈
P([a, b]) otrzymujemy:
Var(f, P ; [a, b]) =
m
X
|f (tj ) − f (tj−1 )| =
j=1
m
X
[f (tj ) − f (tj−1 )]
j=1
= f (b) − f (a) = |f (b) − f (a)| .
Stąd wnioskujemy, że
Var(f ; [a, b]) = |f (b) − f (a)| .
Dowód w przypadku, gdy f jest malejąca, przebiega podobnie. Dowodzi to punktu (e).
Dla dowodu (f) załóżmy, że P = {t0 , t1 , ...tm } ∈ P([a, b]). Niech Q ∈ P([a, b]) będzie
takim podziałem, że P ⊂ Q. Załóżmy najpierw, że podział Q powstaje z podziału P przez
dołączenie jednego punktu c. Wtedy istnieje i ∈ {1, 2, ..., m} takie, że ti−1 < c < ti . Dalej
mamy:
Var(f, P ) =
m
X
|f (tj ) − f (tj−1 )|
j=1
16
=
i−1
X
|f (tj ) − f (tj−1 )| + |f (ti ) − f (ti−1 )| +
j=1
m
X
|f (tj ) − f (tj−1 )|
j=i+1
¬
i−1
X
|f (tj ) − f (tj−1 )| + |f (ti ) − f (c)| + |f (c) − f (ti−1 )|
j=1
+
m
X
|f (tj ) − f (tj−1 )| = Var(f ; Q) .
j=i+1
Teraz, stosując zasadę indukcji matematycznej łatwo dowodzimy nierówności z punktu
(f) dla dowolnego skończonego podziału Q takiego, że P ⊂ Q.
Dla dowodu (g) weźmy dowolny podział P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]). Jeżeli istnieje takie j ∈ {1, 2, ..., m−1}, że tj = c, to wtedy mamy, że P1 = {t0 , t1 , ..., tj } ∈ P([a, c])
oraz Q1 = {tj , tj+1 , ..., tm } ∈ P([c, b]). Zatem:
m
X
|f (ti ) − f (ti−1 )| =
i=1
j
X
|f (ti ) − f (ti−1 )| +
m
X
|f (ti ) − f (ti−1 )|
i=j+1
i=1
¬ Var(f ; [a, c]) + Var(f ; [c, b])
(2.4)
Jeżeli natomiast tak nie jest, to istnieje j ∈ {0, 1, 2, ..., m − 1} takie, że
tj < c < tj+1 .
Wtedy mamy:
P ∪ {c} = {t0 , t1 , ..., tj−1 , tj , c, tj+1 , ..., tm } ∈ P([a, b]) .
Dalej, dostajemy:
m
X
|f (ti ) − f (ti−1 )| =
i=1
=
j
X
|f (ti ) − f (ti−1 )| +
i=1
j
X
¬
|f (ti ) − f (ti−1 )|
i=j+1
|f (ti ) − f (ti−1 )| + |f (tj+1 − f (tj ))| +
i=1
j
X
m
X
m
X
|f (ti ) − f (ti−1 )|
i=j+2
|f (ti ) − f (ti−1 )| + |f (tj+1 − f (c))| + |f (c) − f (tj )| +
i=1

j
X

i=1
m
X
|f (ti ) − f (ti−1 )|
i=j+2




m
X


i=j+2
|f (ti ) − f (ti−1 )| + |f (c) − f (tj )| + |f (tj+1 ) − f (c)| +
¬ Var(f ; [a, c]) + Var(f ; [c, b]) .
17


|f (ti ) − f (ti−1 )|

(2.5)
Z (2.4) i (2.5) otrzymujemy, że
Var(f ; [a, b]) ¬ Var(f ; [a, c]) + Var(f ; [c, b]) .
(2.6)
Dla dowodu nierówności przeciwnej do nierówności (2.6) ustalmy dowolne ε >
0 i dobierzmy takie podziały P1 = {t0 , t1 , ..., tn−1 , tn } ∈ P([a, c]) oraz Q1 =
{tn , tn+1 , ..., tm−1 , tm } ∈ P([c, b]), że
Var(f ; [a, c]) −
Var(f ; [c, b]) −
n
ε X
¬
|f (ti ) − f (ti−1 )| ,
2 i=1
m
X
ε
¬
|f (ti ) − f (ti−1 )| .
2 i=n+1
Mamy oczywiście, że t0 = a, tn = c, tm = b.
Zauważmy, że wtedy P = P1 ∪ Q1 ∈ P([a, b]) i stąd otrzymujemy:
Var(f ; [a, c]) + Var(f ; [c, b]) − ε ¬
m
X
|f (ti ) − f (ti−1 )|
i=1
= Var(f, P ; [a, b]) .
Z powyższej nierówności dostajemy:
Var(f ; [a, c]) + Var(f ; [c, b]) − ε ¬ Var(f ; [a, b]) .
Ze względu na dowolność ε otrzymujemy stąd nierówność:
Var(f ; [a, c]) + Var(f ; [c, b]) ¬ Var(f ; [a, b]) .
Łacząc teraz (2.6) i (2.7) otrzymujemy tezę twierdzenia.
(2.7)
Wniosek 2.4. Funkcja x → Var(f ; [a, x]) jest rosnąca na przedziale [a, b].
Rzeczywiście, biorąc x, y ∈ [a, b] takie, że x < y i korzystając z Twierdzenia 2.3(g),
mamy
Var(f ; [a, y]) = Var(f ; [a, x]) + Var(f ; [x, y])
­ Var(f ; [a, x]) .
18
Rozważmy teraz zbiór BV ([a, b]) złożony ze wszystkich funkcji o wariacji ograniczonej
na [a, b]. Oczywiście mamy, że
BV ([a, b]) ⊂ R[a,b] .
Zauważmy, że z naszego twierdzenia wynika, że suma dwóch funkcji o wariacji ograniczonej na [a, b] jest funkcją o wariacji ogarniczonej na [a, b] oraz iloczyn funkcji f o wariacji
ograniczonej na [a, b] przez liczbę rzeczywistą jest również funkcją o wariacji ograniczonej
na [a, b]. Stąd wynika, że zbiór BV ([a, b]) z działaniami dodawania funkcji i ich mnożenia
przez liczby rzeczywiste tworzy podprzestrzeń przestrzeni liniowej R[a,b] (z tymi samymi
działaniami), więc ma strukturę przestrzeni liniowej.
Można jednak udowodnić coś więcej, bowiem mamy twierdzenie:
Twierdzenie 2.5. Niech f, g ∈ BV ([a, b]). Wtedy:
(i) f · g ∈ BV ([a, b])
(ii) Jeżeli istnieje stała σ > 0 taka, że ∀x∈[a,b] |g(x)| ­ σ, to
f
g
∈ BV ([a, b]).
Dowód (i). Ustalmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Z punktu (d) poprzedniego twierdzenia wynika, że f, g są funkcjami ograniczonymi na [a, b]. Zatem istnieją
stałe M1 > 0, M2 > 0 takie, że |f (x)| ¬ M1 , |g(x)| ¬ M2 dla x ∈ [a, b].
Mamy dalej:
m
X
|(f g)(ti ) − (f g)(ti−1 )| =
i=1
=
m
X
|f (ti )g(ti ) − f (ti−1 )g(ti−1 )|
i=1
m
X
|f (ti )g(ti ) − f (ti )g(ti−1 ) + f (ti )g(ti−1 ) − f (ti−1 )g(ti−1 )|
i=1
¬
m
X
[|f (ti )||g(ti ) − g(ti−1 )| + |g(ti−1 )||f (ti ) − f (ti−1 )|]
i=1
¬
m
X
|f (ti )||g(ti ) − g(ti−1 )| +
i=1
¬ M1
m
X
|g(ti−1 )||f (ti ) − f (ti−1 )|
i=1
m
X
|g(ti ) − g(ti−1 )| + M2
i=1
m
X
|f (ti ) − f (ti−1 )|
i=1
¬ M1 Var(g; [a, b]) + M2 Var(f, [a, b]) .
19
Stąd
Var(f g; [a, b]) ¬ M1 Var(g; [a, b]) + M2 Var(f ; [a, b]) < ∞ ,
co dowodzi pierwszej części twierdzenia.
Dowód (ii). Zauważmy, że biorąc ten sam podział P mamy:
m X
f (ti )
g(ti )
i=1
¬
m
|f (ti )g(ti−1 ) − g(ti )f (ti−1 )|
f (ti−1 ) X
=
−
g(ti−1 ) i=1
|g(ti )||g(ti−1 )|
m
X
|f (ti )g(ti−1 ) − f (ti−1 )g(ti−1 ) + f (ti−1 )g(ti−1 ) − g(ti )f (ti−1 )|
|g(ti−1 )||g(ti )|
i=1
¬
m
X
"
i=1
¬
|g(ti−1 )||f (ti ) − f (ti−1 )| |f (ti−1 )||g(ti−1 ) − g(ti )|
+
|g(ti−1 )||g(ti )|
|g(ti−1 )||g(ti )|
#
m
|f (ti−1 )|
|f (ti ) − f (ti−1 )| X
+
|g(ti ) − g(ti−1 )|
|g(ti )|
i=1 |g(ti−1 )||g(ti )|
i=1
m
X
¬
m
m
M1 X
1X
|f (ti ) − f (ti−1 )| + 2
|g(ti ) − g(ti−1 )|
σ i=1
σ i=1
1
M1
Var(f ; [a, b]) + 2 Var(g; [a, b]) < ∞ .
σ
σ
Otrzymana nierówność dowodzi (ii).
¬
Zauważmy, że z punktu (i) powyższego twierdzenia wynika, że przestrzeń BV ([a, b])
jest algebrą ze zwykłymi działaniami na funkcjach.
Przejdziemy teraz do przedstawienia zapowiadanego wcześniej fundamentalnego twierdzenia Jordana charakteryzującego funkcje o wariacji ograniczonej przy pomocy funkcji
rosnących. Twierdzenie to nazywa się twierdzeniam o rozkładzie Jordana.
Twierdzenie 2.6. Funkcja f : [a, b] → R ma wariację ograniczoną na przedziale [a, b]
wtedy i tylko wtedy, gdy ta funkcja może być przedstawiona w postaci różnicy dwóch funkcji
rosnących na przedziale [a, b] tzn. istnieją funkcje pf , nf , które są określone i rosnące na
[a, b] i takie, że f (x) = pf (x) − nf (x) dla x ∈ [a, b].
Dowód. Jeżeli funkcja f daje się przedstawić w postaci różnicy dwóch funkcji rosnących
na przedziale [a, b], to z Twierdzenia 2.3 (a), (b) i (e) wynika, że f ∈ BV ([a, b]).
Załóżmy teraz, że f jest funkcją o wariacji ograniczonej na przedziale [a, b].
20
Rozważmy funkcję Vf : [a, b] → R określoną równością
Vf (x) = Var(f ; [a, x]) .
Z Wniosku 2.4 wynika, że funkcja Vf jest rosnąca na przedziale [a, b]. Połóżmy pf = Vf a
następnie zdefiniujmy funkcję nf : [a, b] → R, kładąc
nf (x) = pf (x) − f (x)
dla x ∈ [a, b].
Pokażemy, że funkcja nf jest rosnąca na przedziale [a, b]. W tym celu ustalmy dowolne
x, y ∈ [a, b] takie, że x < y. Wtedy mamy
nf (y) − nf (x) = pf (y) − f (y) − pf (x) + f (x)
= Vf (y) − Vf (x) − f (y) + f (x)
= Var(f ; [a, y]) − Var(f ; [a, x]) − [f (y) − f (x)] .
Stąd i z Twierdzenia 2.3(g) dostajemy:
nf (y) − nf (x) = Var(f ; [x, y]) − [f (y) − f (x)] .
Z powyższej równości oraz z Twierdzenia 2.3(c) otrzymujemy:
nf (y) − nf (x) ­ Var(f ; [x, y]) − |f (y) − f (x)| ­ 0 .
Oznacza to, że funkcja nf jest rosnąca na przedziale [a, b] i tym samym kończy dowód
naszego twierdzenia.
Zauważmy, że z powyższego twierdzenia możemy otrzymać następujący wniosek.
Wniosek 2.7. Przestrzeń BV ([a, b]) jest przestrzenią rozpiętą na zbiorze M[a,b] złożonym
ze wszystkich funkcji monotonicznych na przedziale [a, b].
Twierdzenie Jordana pozwala również wyciągnąć inny, bardzo ważny wniosek. W celu
sformułowania tego wniosku przypomnijmy najpierw, że każda funkcja monotoniczna na
przedziale [a, b] ma tylko nieciągłości I-tego rodzaju (skoki), więc zgodnie z Definicją
1.9 jest funkcją regularną na tym przedziale. Zatem zbiór M[a,b] funkcji monotonicznych
21
na [a, b] jest podzbiorem przestrzeni funkcji regularnych R([a, b]). Stąd i z Wniosku 2.7
otrzymujemy następujące twierdzenie.
Twierdzenie 2.8. Przestrzeń BV ([a, b]) jest podprzestrzenią przestrzeni R([a, b]).
Innymi słowy, każda funkcja o wariacji ograniczonej na przedziale [a, b] jest funkcją
regularną na tym przedziale.
Przypomnijmy, że podane ostatnio twierdzenie Jordana mówiło, że jeżeli f : [a, b] → R
to f ∈ BV ([a, b]) wtedy i tylko wtedy, gdy f może być przedstawione w postaci f (x) =
pf (x) − nf (x), gdzie pf i nf są funkcjami rosnącymi na przedziale [a, b].
Dowód twierdzenia polegał na tym, że określaliśmy funkcję Vf : [a, b] → R przyjmując,
że
Vf (x) = Var(f ; [a, x])
(2.8)
dla dowolnego x ∈ [a, b]. Następnie przyjmowaliśmy, że
pf (x) = Vf (x)
(2.9)
nf (x) = Vf (x) − f (x)
(2.10)
oraz
dla x ∈ [a, b]. O funkcjach pf oraz nf pokazywaliśmy, że są to funkcje rosnące na przedziale
[a, b]. Oczywiście mamy, że
f (x) = pf (x) − nf (x)
dla x ∈ [a, b].
Okazuje się, że rozkład funkcji f o wahaniu ograniczonym na przedziale [a, b] na różnicę
dwóch funkcji rosnących na tym przedziale (tzn. rozkład Jordana) nie jest jednoznaczny.
Co więcej, można ten rozkład zrobić tak, że jest on z pewnego punktu widzenia najlepszy.
Rzeczywiście, załóżmy, że f ∈ BV ([a, b]). Określmy funkcje ϕ, ψ : [a, b] → R przyjmując:
1
ϕ(x) = [Vf (x) + f (x)]
2
1
ψ(x) = [Vf (x) − f (x)] .
2
Wtedy zachodzi twierdzenie.
Twierdzenie 2.9. Funkcje ϕ i ψ są funkcjami rosnącymi na przedziale [a, b] oraz
f (x) = ϕ(x) − ψ(y)
22
(2.11)
(2.12)
dla x ∈ [a, b]. Ponadto, funkcje ϕ i ψ są możliwie najsłabiej rosnące na przedziale [a, b] w
tym sensie, że jeżeli f jest przedstawiona w postaci
f (x) = ϕ(x) − ψ(x)
(2.13)
dla x ∈ [a, b], gdzie ϕ i ψ są rosnące na [a, b], to
ϕ(y) − ϕ(x) ¬ ϕ(y) − ϕ(x) ,
(2.14)
ψ(y) − ψ(x) ¬ ψ(y) − ψ(x)
(2.15)
dla wszystkich x, y ∈ [a, b], x < y.
Oprócz tego, ma miejsce równość
Var(f ; [x, y]) = Var(ϕ; [x, y]) + Var(ψ; [x, y])
dla dowolnych x, y ∈ [a, b], x < y.
Dowód. Ustalmy dowolnie x, y ∈ [a, b], x < y. Korzystając z nierówności udowodnionej
w Twierdzeniu 2.3(c), otrzymujemy
f (x) − f (y) ¬ |f (x) − f (y)| ¬ Var(f ; [x, y]) .
(2.16)
Mamy teraz:
1
1
ϕ(y) − ϕ(x) = [Vf (y) + f (y)] − [Vf (x) + f (x)]
2
2
1
= [Vf (y) − Vf (x) + f (y) − f (x)]
2
1
= [Var(f ; [a, y]) − Var(f ; [a, x]) + f (y) − f (x)]
2
1
= [Var(f ; [a, x] ∪ [x, y]) − Var(f ; [a, x]) + f (y) − f (x)]
2
1
= [Var(f ; [a, x]) + Var(f ; [x, y]) − Var(f ; [a, x]) + f (y) − f (x)]
2
1
= [Var(f ; [x, y]) + f (y) − f (x)] ­ 0 ,
2
przy czym ostatnia nierówność wynika z (2.16).
Podobnie, otrzymujemy teraz z (2.12):
1
1
ψ(y) − ψ(x) = [Vf (y) − f (y)] − [Vf (x) − f (x)]
2
2
23
(2.17)
1
= [Var(f ; [x, y]) − (f (y) − f (x))] ­ 0 ,
2
przy czym ta nierówność również wynika z (2.16).
(2.18)
Nierówności (2.17) i (2.18) dowodzą, że funkcje ϕ, ψ są rosnące na przedziale [x, y].
Oczywiście, jak łatwo sprowadzić bezpośrednim rachunkiem, zachodzi równość f (x) =
ϕ(x) − ψ(x) dla x ∈ [a, b], co dowodzi pierwszej części naszego twierdzenia.
Dla dowodu drugiej części załóżmy, że ma miejsce przedstawienie (2.13), gdzie
ϕ, ψ : [a, b] → R są funkcjami rosnącymi na [a, b]. Dalej, weźmy dowolne x, y ∈ [a, b],
x < y. Wtedy mamy, na podstawie (2.17), (2.13), (2.11) oraz własności wahania funkcji:
1
ϕ(y) − ϕ(x) = [Var(f ; [x, y]) + f (y) − f (x)]
2
=
=
o
1n
Var(f ; [x, y]) + [ϕ(y) − ψ(y)] − [ϕ(x) − ψ(x)]
2
o
1n
Var(ϕ − ψ; [x, y]) + [ϕ(y) − ϕ(x)] − [ψ(y) − ψ(x)]
2
o
1n
Var(ϕ; [x, y]) + Var(ψ; [x, y]) + [ϕ(y) − ϕ(x)] − [ψ(y) − ψ(x)]
2
o
1n
=
[ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)] + [ϕ(y) − ϕ(x)] − [ψ(y) − ψ(x)]
2
= ϕ(y) − ϕ(x) .
¬
Dowodzi to nierówności (2.14).
Dowód nierówności (2.15) prowadzimy podobnie. Mamy, z (2.18), (2.13), (2.12) oraz z
własności wahania funkcji:
ψ(y) − ψ(x) =
=
1
{Var(f ; [x, y]) − (f (y) − f (x))}
2
n
oo
1n
Var(f ; [x, y]) − [ϕ(y) − ψ(y)] − [ϕ(x) − ψ(x)]
2
n
oo
1n
Var(ϕ − ψ; [x, y]) − [ϕ(y) − ϕ(x)] − [ψ(y) − ψ(x)]
2
o
1n
=
Var(ϕ − ψ; [x, y]) − [ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)]
2
=
o
1n
Var(ϕ; [x, y]) + Var(ψ; [x, y]) − [ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)]
2
o
1n
=
[ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)] − [ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)]
2
= ψ(y) − ψ(x) .
¬
24
Zauważmy dalej, że z (2.17) i (2.18) otrzymujemy dla x, y ∈ [a, b] takich, że x < y:
(ϕ(y) − ϕ(x)) + (ψ(y) − ψ(x)) =
=
1
{Var(f ; [x, y]) + [f (y) − f (x)] + Var(f ; [x, y]) − [f (y) − f (x)]}
2
= Var(f ; [x, y]) .
Stąd i z własności wahania, dostajemy ostatecznie
Var(f ; [x, y]) = Var(ϕ; [x, y]) + Var(ψ; [x, y])
i koniec dowodu.
Jako bezpośrednią konsekwencję twierdzenia Jordana otrzymujemy następujący wniosek, który sformułujemy tutaj jako twierdzenie.
Twierdzenie 2.10. Jeżeli f ∈ BV ([a, b]), to f ma co najwyżej przeliczalną ilość punktów
nieciągłości.
Funkcja Vf (x) = Var(f ; [a, x]) używana w dowodach ostatnich twierdzeń, ma wiele
interesujących własności i jest ściśle związana z funkcją f . Prześledzimy to w naszych
dalszych rozważaniach i twierdzeniach.
Rozpoczniemy od następującego prostego twierdzenia, zwanego zasadą majoranty.
Twierdzenie 2.11. Niech f : [a, b] → R. Funkcja f ma wahanie ograniczone na przedziale
[a, b] wtedy i tylko wtedy, gdy istnieje funkcja g : [a, b] → R, która jest rosnąca na przedziale
[a, b] i taka, że
|f (y) − f (x)| ¬ g(y) − g(x)
(2.19)
dla dowolnych x, y ∈ [a, b], x < y.
Dowód. Załóżmy najpierw, że istnieje funkcja g o żądanych własnościach. Wtedy, z
nierówności (2.19), dla dowolnego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) mamy:
Var(f, P ; [a, b]) =
m
X
|f (ti ) − f (ti−1 )| ¬
i=1
m
X
i=1
= g(b) − g(a) .
25
[g(ti ) − g(ti−1 )]
Stąd, wobec dowolności podziału P , otrzymujemy:
Var(f ; [a, b]) ¬ g(b) − g(a) < ∞ .
Na odwrót, jeżeli f ∈ BV ([a, b]) to biorąc funkcję g : [a, b] → R, określoną wzorem
g(x) = Vf (x) = Var(f ; [a, x])
dla x ∈ [a, b] (funkcja ta jest rosnąca na podstawie twierdzenia opisującego własności
wahania), na postawie nierówności (2.16) dostajemy dla x, y ∈ [a, b], x < y:
|f (y) − f (x)| ¬ Var(f ; [x, y]) = Var(f ; [a, y]) − Var(f ; [a, x])
= Vf (y) − Vf (x) = g(y) − g(x) ,
co kończy dowód.
Okazuje się, że między funkcją f ∈ BV ([a, b]) a jej funkcją wahania Vf (x) =
Var(f ; [a, x]) istnieje bardzo ścisła współzależność. Zachodzi bowiem następujące twierdzenie.
Twierdzenie 2.12. Niech f ∈ BV ([a, b]) i niech x0 będzie dowolnie ustalonym punktem
przedziału [a, b]. Funkcja f jest ciągła w punkcie x0 wtedy i tylko wtedy, gdy funkcja Vf
jest ciągła w punkcie x0
Dowód. Załóżmy najpierw, że f jest ciągła w punkcie x0 , przy czym x0 < b. Weźmy
x ∈ (x0 , b) tzn. x0 < x < b. Rozważmy różnicę Vf (x) − Vf (x0 ). Korzystając z definicji
kresu górnego dobierzmy podział P = {t0 , t1 , ..., tm } ∈ P([x0 , b]) taki, że
Var(f ; [x0 , b]) − ε < Var(f, P ; [x0 , b])
lub, równoważnie
Var(f ; [x0 , b]) < Var(f, P ; [x0 , b]) + ε .
(2.20)
Następnie, wykorzystując fakt, że funkcja f jest ciągła w punkcie x0 , dobierzmy δ takie,
że 0 < δ < t1 − x0 oraz |f (x) − f (x0 )| < ε dla 0 < x − x0 < δ. Wtedy, dla takich właśnie
x (tzn. x ∈ (x0 , x0 + δ)) mamy:
Vf (x) − Vf (x0 ) = Var(f ; [a, x]) − Var(f ; [a, x0 ]) = Var(f ; [x0 , x])
26
= Var(f ; [x0 , b]) − Var(f ; [x, b]) < Var(f, P ; [x0 , b]) + ε − Var(f ; [x, b]) .
Ale δ < t1 − x0 , x − x0 < δ ⇒ x − x0 < t1 − x0 ⇒ x < t1 więc x0 < x < t1 . Stąd i z
powyższego oszacowania dostajemy:
Vf (x) − Vf (x0 ) < |f (x) − f (x0 )| + |f (t1 ) − f (x)| +
m
X
|f (tj ) − f (tj−1 )|
j=2
− Var(f ; [x, b]) + ε ¬ |f (x) − f (x0 )| + ε < 2ε ,
ponieważ Var(f ; [x, b]) ­ |f (t1 ) − f (x)| +
m
P
|f (tj ) − f (tj−1 )| .
j=2
Z ostatniej nierówności wynika, że funkcja Vf jest ciągła prawostronnie w punkcie x0 . W
podobny sposób pokazujemy, że Vf jest ciągła z lewej strony w punkcie x0 , co ostatecznie
dowodzi ciągłości funkcji Vf w punkcie x0 (włączając przypadki x0 = a i x0 = b).
Na odwrót, załóżmy, że Vf jest ciągła w punkcie x0 ∈ [a, b]. Wtedy, dla x ­ x0 mamy:
|f (x) − f (x0 )| ¬ Var(f ; [x0 , x]) = Var(f ; [a, x])−
− Var(f ; [a, x0 ]) = Vf (x) − Vf (x0 ) → 0
przy x → x0 +.
Natomiast, dla x ¬ x0 otrzymujemy
|f (x) − f (x0 )| ¬ Var(f ; [x, x0 ]) = Var(f ; [a, x0 ])−
− Var(f ; [a, x]) = Vf (x0 ) − Vf (x) → 0
przy x → x0 −.
W konkluzji dostajemy, że funkcja f jest ciągła w punkcie x0 i koniec dowodu.
Zauważmy teraz, że rozkład Jordana funkcji f ∈ BV ([a, b]) na różnicę dwóch funkcji
rosnących na przedziale [a, b] pozwala nie tylko uzyskać informacje o tym, że funkcja f
ma co najwyżej przeliczalną ilość punktów nieciągłości. Tych konsekwencji jest więcej.
Np. z analizy matematycznej wiadomo, że funkcja monotoniczna na przedziale [a, b] jest
na tym przedziale całkowalna w sensie Riemanna. Stąd i z twierdzenia Jordana wynika
następujące twierdzenie.
Twierdzenie 2.13. Jeżeli f ∈ BV ([a, b]) to f jest całkowalna w sensie Riemanna na
przedziale [a, b].
27
Mimo, że funkcja o wariacji ograniczonej na przedziale ma na tym przedziale co najwyżej przeliczalną ilość punktów nieciągłości, to implikacja odwrotna nie jest prawdziwa.
Mało tego, istnieją funkcje ciągłe, które mają wariację nieograniczoną.
Przykład 2.14. Niech f : [0, 1] → R będzie określona wzorem
f (x) =


x sin x1 dla x ∈ (0, 1]

0
dla x = 0 .
Oczywiście f (0) = 0 oraz lim f (x) = lim x sin x1 = 0, a więc funkcja f jest ciągła w
x→0
x→0
punkcie x = 0. Ciągłość funkcji f na przedziale (0, 1] jest konsekwencją twierdzeń o
ciągłości funkcji złożonej i o ciągłości iloczynu funkcji ciągłych. Zatem f jest ciągła na
przedziale [0, 1]. Pokażemy, że f ∈
/ BV ([0, 1]).
W tym celu weźmy podział P = {t0 , t1 , ..., tm } ∈ P([0, 1]) taki, że
t0 = 0, tk =
2
dla k = 1, 2, ..., m − 1 oraz tm = 1 .
[2m − (2k − 1)]π
I tak, mamy na przykład:
t1 =
2
,
(2m − 1)π
t2 =
2
,
(2m − 3)π
t3 =
2
, ...
(2m − 5)π
2
2
2
=
=
,
{2m − [2(m − 2) − 1]}π
[2m − (2m − 5)]π
5π
2
2
2
tm−1 =
=
=
.
{2m − [2(m − 1) − 1]}π
[2m − (2m − 3)]π
3π
Ustalmy teraz j, 2 ¬ j ¬ m − 1. Wtedy kolejne punkty tj−1 , tj naszego podziału są takie,
... , tm−2 =
że
1
1
[2m − (2j − 1)]π − {2m − [2(j − 1) − 1]}π
−
=
tj
tj−1
2
−2π
(2m − 2j + 1)π − (2m − 2j + 3)π
=
= −π
2
2
więc funkcja x → sin x1 przyjmuje w tych punktach na przemian wartości 1 i −1. Rzeczy=
wiście mamy:
1
π
π
π
sin = sin (2m − 2j + 1)
= sin(2p + 1) = sin
+ pπ
tj
2
2
2
Dalej mamy:
|f (tj ) − f (tj−1 )| =
1
tj sin
tj
− tj−1 sin
28
1 tj−1 = |tj + tj−1 |
.
­ 2tj−1 .
Zatem:
Var(f, P ; [0, 1]) ­
m−1
X
|f (tj ) − f (tj−1 )|
j=2
2
2
2
+
+ ··· +
­ 2(t1 + t2 + ... + tm−2 ) = 2
5π 7π
(2m − 1)π
4 1 1
1
=
+ + ··· +
π 5 7
2m − 1
Z faktu, że szereg harmoniczny jest rozbieżny wynika, że
!
Var(f ; [0, 1]) = ∞ .
Następne twierdzenie, które podamy, mówić będzie o możliwości przechodzenia do
granicy przy zbieżności punktowej ciągu funkcji o wariacji ograniczonej.
Twierdzenie 2.15. Niech (fn ) będzie ciągiem funkcyjnym takim, że fn ∈ BV ([a, b]) dla
każdego n = 1, 2, ... . O ciągu tym zakładamy, że jest punktowo zbieżny do pewnej funkcji
f , tzn. istnieje funkcja f : [a, b] → R taka, że f (x) = n→∞
lim fn (x) dla dowolnego x ∈ [a, b].
Wtedy
Var(f ; [a, b]) ¬ lim inf Var(fn ; [a, b]) .
n→∞
(2.21)
W szczególności, jeżeli (fn ) jest ciągiem funkcji rzeczywistych, określonych na przedziale
[a, b], o wariacjach wspólnie ograniczonych na [a, b], zbieżnym punktowo do pewnej funkcji
f : [a, b] → R, to f ∈ BV ([a, b]).
Dowód. Jeżeli wielkość po prawej stronie nierówności (2.21) jest równa +∞, to oczywiście
nierówność (2.21) jest spełniona. Przypuśćmy więc, że tak nie jest, tzn. istnieje stała L > 0
taka, że
lim
inf Var(fn ; [a, b]) = L .
n→∞
Ustalmy dalej dowolnie liczbę ε > 0.
Wtedy, biorąc pod uwagę definicję granicy dolnej ciągu liczbowego wnioskujemy, że istnieje
podciąg (fkn ) ciągu (fn ) taki, że
Var(fkn ; [a, b]) ¬ L + ε
dla n = 1, 2, ... .
29
Ustalmy teraz dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy dostajemy:
Var(fkn , P ; [a, b]) =
m
X
|fkn (tj ) − fkn (tj−1 )| ¬ L + ε .
j=1
Przechodząc teraz z n → ∞ otrzymujemy stąd
Var(f, P ; [a, b]) =
m
X
|f (tj ) − f (tj−1 )| ¬ L + ε .
j=1
Ponieważ ta nierówność zachodzi dla każdego podziału P ∈ P([a, b]), więc stąd wynika,
że
Var(f ; [a, b]) ¬ L + ε .
Stąd, ze względu na dowolność liczby ε otrzymujemy, że
Var(f ; [a, b]) ¬ L ,
co dowodzi nierówności (2.21).
Druga część twierdzenia jest bezpośrednią konsekwencją pierwszej części.
Jak już wcześniej zauważyliśmy, zbiór BV ([a, b]) tworzy przestrzeń liniową nad ciałem
liczb rzeczywistych R.
Teraz, dla dowolnie zadanej funkcji f ∈ BV ([a, b]) połóżmy:
||f ||BV = |f (a)| + Var(f ; [a, b]) .
(2.22)
Mamy następujące twierdzenie.
Twierdzenie 2.16. Wielkość || · ||BV zadana wzorem (2.22) jest normą w przestrzeni
BV ([a, b]). Norma ta jest zupełna, tzn. przestrzeń BV ([a, b]) z tą normą jest przestrzenią
Banacha.
Dowód. Z definicji wielkości || · ||BV widzimy, że w przestrzeni BV ([a, b]) przyjmuje ona
wartości rzeczywiste nieujemne.
Warunek ||f ||BV = 0 ⇔ f ≡ 0 na [a, b] jest łatwy do sprawdzenia i jest on konsekwencją
faktu, że jeżeli Var(f ; [a, b]) = 0 to funkcja f jest stała na przedziale [a, b].
Warunek ||λf ||BV = |λ|||f ||BV wynika z dodatniej jednorodności wariacji funkcji. Natomiast warunek trójkąta dla || · ||BV jest prostą kosekwencją podaddytywności wariacji ze
względu na funkcje.
30
Zatem wielkość ||·||BV spełnia warunki normy w przestrzeni liniowej BV ([a, b]). Pokażemy
teraz, że ta norma jest zupełna.
W tym celu załóżmy, że (fn ) jest ciągiem funkcyjnym z BV ([a, b]) spełniającym warunek Cauchy’ego względem normy || · ||BV . Oznacza to, że dla ustalonego dowolnie ε > 0
znajdziemy liczbę naturalną n0 taką, że dla m, n ∈ N, m, n ­ n0 mamy, że
||fn − fm ||BV = |fn (a) − fm (a)| + Var(fn − fm ; [a, b]) ¬
ε
.
2
(2.23)
Z powyższej nierówności wynika w szczególności, że
|fn (a) − fm (a)| ¬
ε
2
(2.24)
dla n, m ­ n0 , a to oznacza, że ciąg liczbowy (fn (a)) jest ciągiem Cauchy’ego. Zatem ten
ciąg jest zbieżny do pewnej liczby rzeczywistej, którą oznaczymy przez f (a).
Biorąc teraz m → ∞ w nierówności (2.24) i korzystając z ciągłości bezwzględnej wartości,
otrzymujemy
|fn (a) − f (a)| ¬
ε
2
(2.25)
dla n ∈ N, n ­ n0 .
Dalej, z nierówności (2.23), dla n, m ∈ N, n, m ­ n0 otrzymujemy:
Var(fn − fm ; [a, b]) ¬
ε
.
2
(2.26)
Ustalmy dalej dowolnie x ∈ (a, b]. Wtedy, z (2.26) i z własności wariacji wnioskujemy, że
Var(fn − fm ; [a, x]) ¬
ε
.
2
Zatem, biorąc podział {a, x} przedziału [a, x], z powyższej nierówności otrzymujemy:
|fn (x) − fm (x)| − |fn (a) − fm (a)|
¬ |[fn (x) − fm (x)] − [fn (a) − fm (a)]|
= Var(fn − fm , {a, x}; [a, x])
ε
¬ Var(fn − fm ; [a, x]) ¬ .
2
Stąd otrzymujemy, że
|fn (x) − fm (x)| ¬ |fn (a) − fm (a)| +
31
ε
¬ε
2
(2.27)
dla x ∈ [a, b].
Nierówność (2.27) implikuje, że dla każdego x ∈ [a, b] ciąg liczbowy (fn (x)) jest ciągiem
Cauchy’ego, więc ten ciąg jest zbieżny do liczby, którą oznaczymy przez f (x).
Mamy zatem określoną funkcję f : [a, b] → R taką, że ciąg (fn ) jest punktowo zbieżny do
tej funkcji.
Pokażemy teraz, że ciąg (fn ) jest zbieżny do funkcji f w sensie normy (2.22).
W tym celu odnotujmy najpierw, że ciąg (fn ) jest ograniczony w normie || · ||BV , jako
ciąg Cauchy’ego tzn. istnieje stała M > 0 taka, że
||fn ||BV ¬ M
dla n ∈ N. Stąd w szczególności otrzymujemy, że
Var(fn ; [a, b]) ¬ M
dla wszystkich n ∈ N. Zatem wariacje Var(fn ; [a, b]) są wspólnie ograniczone, co na
podstawie Twierdzenia 2.15 pozwala wywnioskować, że f ∈ BV ([a, b]).
Dalej zauważmy, że z (2.26), po przejściu z m → ∞, na podstawie Twierdzenia 2.15
otrzymujemy
Var(fn − f ; [a, b]) ¬ lim
inf Var(fn − fm ; [a, b]) ¬
m→∞
ε
2
dla n ­ n0 . Stąd i z (2.25) wynika, że
||fn − f ||BV ¬ ε
a to oznacza, że ciąg funkcyjny (fn ) jest zbieżny w przestrzeni BV ([a, b]) do funkcji f i
kończy dowód.
Jak to wcześniej zauważyliśmy omawiając własności funkcji o wariacji ograniczonej,
iloczyn dwóch funkcji o wariacji ograniczonej jest funkcją o wariacji ograniczonej.
Oznacza to, że przestrzeń liniowa (Banacha) BV ([a, b]) z działaniem mnożenia funkcji
ma algebraiczną strukturę algebry Banacha (tzn. określone jest mnożenie jako operacja
wewnętrzna, asocjatywna i mająca dodatkowo jedynkę - funkcja tożsamościowo równa 1
na przedziale [a, b] - oraz operacja ta jest przemienna). Zatem BV ([a, b]) (z operacjami
dodawania funkcji, ich mnożenia przez liczby rzeczywiste oraz z operacją mnożenia) jest
przemienną algebrą z jednością.
Ogólnie przyjmujemy następującą definicję.
32
Definicja 2.17. Niech V będzie algebrą nad ciałem K (K = R lub K = C), która
jest dodatkowo przestrzenią Banacha z normą || · || określoną na V . Algebrę V będziemy
nazywać algebrą Banacha, jeżeli istnieje c > 0 takie, że
||x · y|| ¬ c||x|| · ||y||
(2.28)
dla dowolnych x, y ∈ V .
Jeżeli w nierówności (2.28) można przyjąć c = 1, tzn. jeżeli dla dowolnych x, y ∈ V
zachodzi nierówność:
||xy|| ¬ ||x|| · ||y|| ,
to algebrę V nazywamy znormalizowaną algebrą Banacha.
Udowodnimy teraz następujące twierdzenie.
Twierdzenie 2.18. Algebra BV ([a, b]) z normą określoną wzorem (2.22), tzn. z normą
określoną dla dowolnej funkcji f ∈ BV ([a, b]) wzorem
||f ||BV = |f (a)| + Var(f ; [a, b])
jest algebrą Banacha. Ponadto, dla dowolnych funkcji f, g ∈ BV ([a, b]) ma miejsce nierówność:
Var(f g; [a, b]) ¬ ||f ||∞ Var(g; [a, b]) + ||g||∞ Var(f ; [a, b]) ,
(2.29)
gdzie symbol || · ||∞ oznacza normę w przestrzeni B([a, b]), określoną wzorem:
||f ||∞ = sup{|f (x)| : x ∈ [a, b]} .
Dowód. W dowodzie będziemy korzystać z faktu, że każda funkcja o wariacji ograniczonej
na przedziale [a, b] jest ograniczona na tym przedziale.
Weźmy dalej dowolnie ustalone funkcje f, g ∈ BV ([a, b]). Następnie ustalmy dowolny
podział a = t0 < t1 < t2 < ... < tm = b, tzn. podział P = {t0 , t1 , ..., tm } ∈ P([a, b]).
Wtedy mamy:
Var(f g, P ; [a, b]) =
m
X
|f (tj )g(tj ) − f (tj−1 )g(tj−1 )|
j=1
=
m
X
|f (tj )g(tj ) − f (tj )g(tj−1 ) + f (tj )g(tj−1 ) − f (tj−1 )g(tj−1 )|
j=1
33
¬
m
X
{|f (tj )||g(tj ) − g(tj−1 )| + |g(tj−1 )||f (tj ) − f (tj−1 )|}
j=1
¬
m
X
{||f ||∞ |g(tj ) − g(tj−1 )| + ||g||∞ |f (tj ) − f (tj−1 )|}
j=1
= ||f ||∞
m
X
|g(tj ) − g(tj−1 )| + ||g||∞
j=1
m
X
|f (tj ) − f (tj−1 )|
j=1
= ||f ||∞ Var(g, P ; [a, b]) + ||g||∞ Var(f, P ; [a, b])
¬ ||f ||∞ Var(g; [a, b]) + ||g||∞ Var(f ; [a, b]) .
Stąd otrzymujemy nierówność (2.29), co kończy dowód.
W dalszym ciągu, dla dowolnej funkcji f ∈ BV ([a, b]) połóżmy
||f ||1BV = ||f ||∞ + Var(f ; [a, b]) .
(2.30)
Wtedy, możemy sformułować następujące twierdzenie.
Twierdzenie 2.19. Wielkość || · ||1BV określona wzorem (2.30) jest normą w przestrzeni
BV ([a, b]) równoważną normie || · ||BV .
Dowód. Fakt, że || · ||1BV spełnia warunki normy w przestrzeni BV ([a, b]) dowodzi się
łatwo wykorzystując własności wariacji funkcji wykazane w Twierdzeniu 2.3 oraz to, że
|| · ||∞ jest normą w przestrzeni B([a, b]).
Ustalmy teraz dowolną funkcję f ∈ BV ([a, b]). Wtedy dostajemy
||f ||BV = |f (a)| + Var(f ; [a, b]) ¬ ||f ||∞ + Var(f ; [a, b])
= ||f ||1BV .
(2.31)
Z drugiej strony, korzystając z nierówności udowodnionej w Twierdzeniu 2.3(d), otrzymujemy
||f ||1BV = ||f ||∞ + Var(f ; [a, b])
¬ |f (a)| + Var(f ; [a, b]) + Var(f ; [a, b])
= |f (a)| + 2Var(f ; [a, b]) ¬ 2|f (a)| + 2Var(f ; [a, b])
= 2||f ||BV .
34
(2.32)
Ostatecznie, z (2.31) i (2.32) wnioskujemy, że mają miejsce nierówności
1
||f ||1BV ¬ ||f ||BV ¬ ||f ||1BV .
2
(2.33)
Powyższa nierówność oznacza, że norma || · ||1BV jest równoważna normie || · ||BV i kończy
dowód.
Wniosek 2.20. Przestrzeń BV ([a, b]) z normą || · ||BV tworzy algebrę Banacha taką, że
||f g||BV ¬ 4||f ||BV ||g||BV
(2.34)
dla dowolnych f, g ∈ BV ([a, b]). Ponadto, BV ([a, b]) z normą || · ||1BV tworzy znormalizowaną algebrę Banacha.
Dowód. Zauważmy, że z faktu orzekającego, że BV ([a, b]) jest przestrzenią Banacha z
normą || · ||BV (por. Twierdzenie 2.16) oraz z Twierdzenia 2.19 wynika, że norma || · ||1BV
jest zupełna w przestrzeni BV ([a, b]). Dalej, dla f, g ∈ BV ([a, b]), korzystając z (2.29),
otrzymujemy:
||f g||1BV = ||f g||∞ + Var(f g; [a, b])
¬ ||f ||∞ · ||g||∞ + ||f ||∞ Var(g; [a, b]) + ||g||∞ Var(f ; [a, b])
¬ ||f ||∞ · ||g||∞ + ||f ||∞ Var(g; [a, b]) + ||g||∞ Var(f ; [a, b])
+ Var(f ; [a, b]) · Var(g; [a, b])
= (||f ||∞ + Var(f ; [a, b]))(||g||∞ + Var(g; [a, b]))
= ||f ||1BV · ||g||1BV .
Powyższa nierówność oznacza, że BV ([a, b]) z normą || · ||1BV jest znormalizowaną algebrą
Banacha.
Teraz, wykorzystując wyżej ustalony fakt i (2.33), dla dowolnych f, g ∈ BV ([a, b])
dostajemy:
||f g||BV ¬ ||f g||1BV ¬ ||f ||1BV · ||g||1BV
¬ 2||f ||BV · 2||g||BV = 4||f ||BV ||g||BV ,
co dowodzi nierówności (2.34) i kończy dowód.
Podamy teraz kilka uwag związanych z omawianą wyżej tematyką funkcji o wariacji
ograniczonej.
35
Uwaga 2.21. Zauważmy, że każda funkcja f : [a, b] → R, spełniająca warunek Lipschitza
na przedziale [a, b] (ze stałą L), jest funkcją o wariacji ograniczonej na [a, b] oraz
Var(f ; [a, b]) ¬ L(b − a) .
Pominiemy proste uzasadnienie tego faktu.
Uwaga 2.22. Mówimy, że funkcja f : [a, b] → R spełnia warunek Höldera na przedziale [a, b], jeżeli istnieją stałe L > 0 oraz α ∈ (0, 1] takie, że
|f (x) − f (y)| ¬ L|x − y|α
dla dowolnych x, y ∈ [a, b].
Okazuje się, że funkcja spełniająca na przedziale [a, b] warunek Höldera nie musi mieć
wariacji ograniczonej na [a, b]. Przykład takiej funkcji można skonstruować w następujący
sposób (por. [1]):
Ustalmy liczbę α ∈ (0, 1). Następnie, zdefiniujmy stałą γ i ciąg (tn ) w przedziale [0, 1]
kładąc:
γ=
tn =
∞
X
1
k=1
k 1/α
,
∞
1
1X
1/α
γ k=n k
dla n = 1, 2, ....
Zauważmy, że t1 = 1 oraz, że ciąg (tn ) jest malejący a także, że n→∞
lim tn = 0. Rozważmy
dalej funkcję f : [0, 1] → R, określoną wzorem





0 dla x = 0



liniowa i łącząca kolejne punkty tn , (−1)
n
f (x) = 
(−1)n
n
dla x = tn
n
odpowiednio .
Biorąc teraz podział Pn = {0, tn , tn−1 , ..., t2 , t1 } ∈ P([0, 1]) łatwo zauważyć, że
Var(f, Pn ; [0, 1]) ­ 1 +
1 1
1
+ + ··· + → ∞
2 3
n
a więc f 6∈ BV ([0, 1]).
Teraz, niech 0 < x < y ¬ 1. Dobierzmy m, n ∈ N tak, żeby tn+1 ¬ x ¬ tn oraz
tm+1 ¬ y ¬ tm . Wtedy mamy trzy przypadki.
36
(1) n = m.
W tym przypadku mamy, że
0 < y − x ¬ tn − tn+1 =
1
,
γn1/α
skąd
|f (x) − f (y)| = (y − x)
2γn1/α
|f (tn ) − f (tn+1 )|
¬ (y − x)
tn − tn+1
n
= 2γ|x − y|α · |x − y|1−α · n(1−α)/α
¬ 2γ|x − y|α |tn − tn+1 |1−α · n(1−α)/α
¬ 2γ|x − y|α ·
n(1−α)/α
= 2γ α |x − y|α .
γ 1−α · n(1−α)/α
(2) n = m + 1.
Wtedy tn = tm+1 i stąd dostajemy:
|f (x) − f (y)| ¬ |f (x) − f (tn )| + |f (tm+1 ) − f (y)|
¬ 2γ α (|x − tn |α + |tm+1 − y|α ) ¬ 4γ α |x − y|α
Zauważmy, że w dowodzie powyższej nierówności skorzystaliśmy z oczywistej nierówności
xα + y α ¬ (x + y)α + (x + y)α = 2(x + y)α .
(3) n ­ m + 2.
Wtedy możemy znaleźć punkty s ∈ [tn , tn−1 ], t ∈ [tm+2 , tm+1 ] takie, że f (s) = f (t) =
0. Stąd mamy:
|f (x) − f (y)| ¬ |f (x) − f (s)| + |f (s) − f (t)| + |f (t) − f (y)|
¬ 4γ α (|x − s|α + |t − y|α ) ¬ 8γ α |x − y|α .
Podsumowując widzimy, że w każdym z trzech możliwych rozważanych przypadków funkcja f spełnia warunek Höldera z wykładnikiem α i ze stałą L = 8γ α dla 0 < x < y ¬ 1.
”Dołączenie” sytuacji x = 0 nie przedstawia trudności (ciągłość funkcji f w punkcie
x = 0).
37
Uwaga 2.23. Bardzo ważną podklasę klasy funkcji o wariacji ograniczonej na ustalonym
przedziale [a, b] stanowi klasa tzw. funkcji bezwzględnie ciągłych. Przedstawimy kilka
faktów dotyczących tej właśnie klasy.
Zaczniemy od wprowadzenia pewnych oznaczeń. Mianowicie, symbolem
P
([a, b]) bę-
dziemy oznaczać rodzinę wszystkich skończonych zbiorów S = {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]}
złożoną z parami niezachodzących na siebie podprzedziałów przedziału [a, b]. Podobnie,
symbolem
P
∞ ([a, b])
będziemy oznaczać rodzinę wszystkich nieskończonych i przeliczal-
nych zbiorów S∞ = {[an , bn ] : n ∈ N} złożonych z niezachodzących na siebie podprzedziałów przedziału [a, b].
Definicja 2.24. Funkcję f : [a, b] → R będziemy nazywać bezwzględnie ciągłą,
jeżeli dla każdej liczby ε > 0 istnieje δ > 0 takie, że dla każdego zbioru S =
{[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} ∈
P
([a, b]) takiego, że
n
X
(bi − ai ) ¬ δ
(2.35)
|f (bi ) − f (ai )| ¬ ε .
(2.36)
i=1
spełniona jest nierówność
n
X
i=1
Zauważmy, że równoważnie możemy zażądać, że dla każdego ε > 0 istnieje δ > 0 takie,
że dla każdego nieskończonego zbioru S∞ = {[an , bn ] : n ∈ N} ∈
P
∞ ([a, b])
takiego, że
∞
X
(bi − ai ) ¬ δ
(2.37)
|f (bi ) − f (ai )| ¬ ε .
(2.38)
i=1
mamy, że
∞
X
i=1
Rzeczywiście, zauważmy najpierw, że definicja, w której występuje
P
∞ ([a, b])
implikuje
Definicję 2.24. W tym celu ustalmy dowolnie ε > 0 i dobierzmy δ > 0 zgodnie z (2.37)(2.38). Dalej, weźmy dowolny zbiór
X
S = {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} ∈
([a, b])
taki, że spełniona jest nierówność (2.35). Zastąpmy przedział [an , bn ] zbiorem
S∞ = {[αi , αi+1 ] : i ∈ N, i ­ n} ∈
P
∞ ([an , bn ])
gdzie αn = an , αn+1 = 21 (αn + bn ), αn+2 = 12 (αn+1 + bn ), ... .
38
,
Wtedy
b n − an =
∞
X
(αi+1 − αi ) ,
i=n
a zatem zbiór
{[a1 , b1 ], [a2 , b2 ], ..., [an−1 , bn−1 ], [αn , αn+1 ], [αn+1 , αn+2 ], ...}
tworzy nieskończony ciąg niezachodzących na siebie przedziałów takich, że
n
X
(bi − ai ) =
n−1
X
∞
X
i=1
i=n
i=1
(bi − ai ) +
(αi+1 − αi ) ¬ δ .
Stąd, zgodnie z założeniem, dostajemy
n
X
|f (bi ) − f (ai )| ¬
i=1
n−1
X
|f (bi ) − f (ai )| +
i=1
∞
X
|f (αi+1 ) − f (αi )| ¬ ε .
i=n
Dowodzi to bezwzględnej ciągłości funkcji w sensie Definicji 2.24.
Na odwrót, załóżmy, że funkcja f jest bezwzględnie ciągła w sensie Definicji 2.24.
Ustalmy ε > 0 i dobierzmy δ > 0 zgodnie z tą definicją. Weźmy dowolny nieskończony
ciąg {[ai , bi ] : i ∈ N} ∈
P
∞ ([a, b])
taki, że spełniona jest nierówność (2.37). Wtedy, dla
każdego dowolnie ustalonego n ∈ N mamy, że zbiór {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} ∈
oraz
n
P
P
([a, b])
(bi − ai ) ¬ δ. Wtedy, zgodnie z Definicją 2.24 spełniona jest nierówność (2.36).
i=1
Stąd wynika, że
∞
X
|f (bi ) − f (ai )| ¬ ε ,
i=1
a to oznacza, że funkcja f jest bezwzględnie ciągła na przedziale [a, b] w sensie sformułowanej wyżej definicji równoważnej Definicji 2.24.
Zbiór wszystkich funkcji bezwzględnie ciągłych na przedziale [a, b] będziemy dalej
oznaczać symbolem AC([a, b]).
Zauważmy dalej, że bezwzględna ciągłość implikuje ciągłość (jednostajną) na przedziale [a, b]. Ponadto, prawdziwe jest również następujące twierdzenie.
Twierdzenie 2.25. Każda funkcja bezwzględnie ciągła na przedziale [a, b] jest na tym
przedziale funkcją o wariacji ograniczonej.
Dowód. Niech f będzie funkcją bezwzględnie ciągłą na [a, b]. Wtedy np. do liczby ε = 1
możemy dobrać taką liczbę δ > 0, że nierówność (2.35) implikuje, że
n
X
|f (bi ) − f (ai )| ¬ 1 .
i=1
39
(2.39)
Rozważmy dalej równoodległy podział Pn = {t0 , t1 , ..., tn } przedziału [a, b], gdzie n jest
tak duże, że nδ ­ b − a. Wtedy, zgodnie z doborem δ, na każdym przedziale [ti−1 , ti ]
takim, że ti−1 , ti ∈ Pn , po uwzględnieniu (2.39) mamy
Var(f ; [ti−1 , ti ]) ¬ 1 .
Stąd, biorac pod uwagę addytywność wariacji ze względu na przedziały, otrzymujemy
Var(f ; [a, b]) ¬ n < ∞ ,
co kończy dowód.
Zwróćmy uwagę na to, że z powyższego twierdzenia wynika, że AC([a, b]) ⊂ BV ([a, b]).
Nietrudno również pokazać, że zbiór AC([a, b]) tworzy podprzestrzeń przestrzeni liniowej
BV ([a, b]) a więc ma strukturę przetrzeni liniowej nad ciałem liczb rzeczywistych R.
Przestrzeń AC([a, b]) odgrywa bardzo ważną rolę w teorii funkcji rzeczywistych (w teorii
miary i całki) oraz w analizie funkcjonalnej.
Uwaga 2.26. Zwrócimy teraz uwagę na dość istotne twierdzenie dotyczące funkcji o
wariacji ograniczonej. Twierdzenie to nazywa się twierdzeniem Helly’ego lub zasadą
wyboru Helly’ego. Dotyczy ono zbieżności punktowej podciągów wybieranych z ciągu
funkcji o wariacji ograniczonej.
Twierdzenie 2.27. Niech (fn ) będzie ciągiem funkcyjnym złożonym z funkcji o wariacji
ograniczonej na przedziale [a, b]. Zakładamy, że ciąg ten jest ograniczony względem normy
|| · ||BV zdefiniowanej wzorem (2.22). Wtedy z ciągu (fn ) można wybrać podciąg zbieżny
punktowo na przedziale [a, b] do funkcji f ∈ BV ([a, b]).
Dowód. Korzystając z twierdzenia Jordana (Twierdzenie 2.6) możemy sprowadzić rozważany problem do funkcji monotonicznych w następujący sposób. Połóżmy
gn (x) = Vfn (x) = Var(fn ; [a, x]) ,
hn (x) = gn (x) − fn (x)
dla x ∈ [a, b]. Wiemy, że gn i hn są rosnące i ograniczone oraz fn = gn − hn dla n ∈ N.
Wspólna ograniczoność wariacji funkcji gn oraz hn wynika z Twierdzenia 2.9. Pokażemy,
40
że ciągi (gn ) i (hn ) zawierają podciągi, które są zbieżne punktowo na przedziale [a, b] do
pewnych funkcji rosnących g i h, odpowiednio. Wtedy funkcja f = g − h będzie miała
żądane własności.
Zatem, niech gn : [a, b] → R będzie funkcją rosnącą oraz niech |gn (x)| ¬ c < ∞ dla
n ∈ N oraz x ∈ [a, b].
Załóżmy, że E = {r1 , r2 , ...} jest pewnym przeliczalnym zbiorem gęstym w przedziale
[a, b] takim, że r1 = a oraz r2 = b. Ponieważ |gn (r1 )| ¬ c dla n ∈ N, więc z twierdzenia
Bolzano-Weierstrassa możemy znaleźć podciąg (gn(1) ) ciągu (gn ), który jest zbieżny w
punkcie r1 . Podobnie, ponieważ |gn(1) (r2 )| ¬ c dla n ∈ N, to możemy znaleźć podciąg (gn(2) )
ciągu (gn(1) ), który jest zbieżny w punktach r1 i r2 . Mając skonstruowany ciąg (gn(k−1) ) w
taki właśnie sposób, możemy wybrać podciąg (gn(k) ) ciągu (gn(k−1) ), który jest zbieżny w
(k)
punktach r1 , r2 , ..., rk . Zatem, ciąg przekątniowy (gnk ) określony wzorem gnk (x) = gk (x)
jest zbieżny w każdym punkcie rj ∈ E.
Teraz, określmy funkcję g : [a, b] → R kładąc
g(x) =





jeżeli x = rj ∈ E
lim gnk (x)
k→∞
sup lim gnk (rj ) dla
rj <x k→∞
x pozostałych ,
gdzie supremum bierzemy po wszystkich elementach rj ∈ E takich, że rj < x. Z konstrukcji wynika, że funkcja g jest ograniczona i rosnąca oraz gnk (x) → g(x) punktowo na
zbiorze E, przy k → ∞.
Ponieważ zbiór D punktów nieciągłości funkcji g jest co najwyżej przeliczalny, więc
zbiór D ∪ E jest przeliczalny. Ustalmy x ∈ [a, b] \ (D ∪ E). Dla zadanego ε > 0 możemy
dobrać ri , rj takie, że
ri < x < rj
(2.40)
g(rj ) − g(ri ) < ε ,
(2.41)
oraz
ponieważ funkcja g jest ciągła w punkcie x. Ponadto, korzystając z punktowej zbieżności
ciągu (gnk ) do g na zbiorze E, znajdziemy k0 ∈ N takie, że
|gnk (ri ) − g(ri )| < ε ,
(2.42)
|gnk (rj ) − g(rj )| < ε
(2.43)
41
dla k ­ k0 . Dalej, łącząc (2.40), (2.41), (2.42) i (2.43) otrzymujemy
g(x) − ε < g(ri ) ¬ gnk (ri ) + ε ¬ gnk (x) + ε
¬ gnk (rj ) + ε < g(rj ) + 2ε ¬ g(x) + 2ε ,
(2.44)
ponieważ ri < x < rj i funkcje występujące w (2.44) są rosnące. Pokazuje to, że
gnk (x) → g(x) punktowo na zbiorze [a, b] \ D gdy k → ∞. Jednakże zbiór D jest co
najwyżej przeliczalny i ciąg (gnk ) jest wspólnie ograniczony. Możemy więc użyć jeszcze
raz procedury przekątniowej opisanej wyżej aby znaleźć jeszcze jeden podciąg, który jest
zbieżny punktowo na całym przedziale [a, b]. Funkcja graniczna g otrzymana tą drogą jest,
jak można pokazać, funkcją rosnącą. Koniec dowodu.
Uwaga 2.28. Twierdzenie Jordana (Twierdzenie 2.6) jest twierdzeniem charakteryzującym funkcje o wariacji ograniczonej poprzez różnicę dwóch funkcji rosnących, a więc
twierdzenie to ma charakter liniowy. Przedstawimy teraz inne twierdzenie, zwane twierdzeniem Federera, które charakteryzuje funkcje o wariacji ograniczonej poprzez złożenie funkcji rosnącej i funkcji spełniającej warunek Lipschitza. Jest to więc twierdzenie w
pewnym sensie analogiczne do twierdzenia Sierpińskiego (Twierdzenie 1.11).
Twierdzenie 2.29. Funkcja f należy do przestrzeni BV ([a, b]) wtedy i tylko wtedy, gdy
można ją przedstawić w postaci złożenia f = g ◦ τ , gdzie τ : [a, b] → [c, d] jest rosnąca
oraz funkcja g : [c, d] → R spełnia na przedziale [c, d] warunek Lipschitza ze stałą L = 1.
Dowód. Załóżmy najpierw, że f = g ◦ τ , gdzie g oraz τ mają wspomniane własności.
Weźmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy otrzymujemy
Var(f, P ) =
m
X
|g(τ (tj )) − g(τ (tj−1 ))| ¬
j=1
m
X
|τ (tj ) − τ (tj−1 )|
j=1
= |τ (b) − τ (a)| .
Stąd wynika, że f ∈ BV ([a, b]).
Na odwrót załóżmy, że f ∈ BV ([a, b]). Niech τ = Vf będzie rosnącą funkcją wahania
funkcji f . Wtedy funkcja ta odwzorowuje przedział [a, b] w pewien przedział [c, d], gdzie
c = 0 oraz d = Var(f ; [a, b]). Oczywiście, funkcja τ nie musi być odwzorowaniem na. Jeżeli
teraz określimy funkcję g na zbiorze wartości τ ([a, b]) ⊂ [c, d] przez położenie
g(τ (x)) = f (x)
42
to otrzymamy rozkład f = g ◦ τ zgodnie z konstrukcją.
Mamy
|g(τ (s)) − g(τ (t))| = |f (s) − f (t)| ¬ Var(f ; [s, t])
= |τ (s) − τ (t)|
dla a ¬ s < t ¬ b. Oznacza to, że funkcja g spełnia warunek Lipschitza ze stałą 1 na
zbiorze τ ([a, b]) ⊂ [c, d].
W celu przedłużenia funkcji g ze zbioru τ ([a, b]) na cały przedział [c, d] do funkcji
g spełniającej warunek Lipschitza ze stałą 1 na przedziale [c, d] (a nawet na całej prostej R) użyjemy metody ”uwypuklania”. Mianowicie, dla ustalonego dowolnie λ ∈ [0, 1]
definiujemy funkcją g, kładąc
g(y) =


(1 − λ)g(x−) + λg(x) jeżeli y = (1 − λ)τ (x−) + λτ (x)

(1 − λ)g(x) + λg(x+) jeżeli y = (1 − λ)τ (x) + λτ (x+) .
Można łatwo sprawdzić, że funkcja g spełnia na przedziale [c, d] warunek Lipschitza ze
stałą 1. Koniec dowodu.
Zadania
1. Znaleźć funkcje f, g ∈ BV ([0, 1]) takie, że g(x) > 0 dla x ∈ [0, 1] oraz f /g 6∈
BV ([0, 1]).
2. Pokazać, że jeżeli f ∈ BV ([a, b]) to |f | ∈ BV ([a, b]) oraz Var(|f |; [a, b]) ¬
Var(f ; [a, b]).
3. Znaleźć funkcję f 6∈ BV ([0, 1]) tak, że |f | ∈ BV ([0, 1]).
4. Załóżmy, że f ∈ C([a, b]) i |f | ∈ BV ([a, b]). Pokazać, że f ∈ BV ([a, b]).
5. Niech f ∈ BV ([a, b]). Pokazać, że
Vf (x0 +) − Vf (x0 ) = |f (x0 +) − f (x0 )|
dla każdego x0 ∈ [a, b), oraz
Vf (x0 ) − Vf (x0 −) = |f (x0 ) − f (x0 −)|
dla każdego x0 ∈ (a, b].
43
6. Udowodnić następujące twierdzenie, zwane zasadą lokalizacji: Jeżeli f
6∈
BV ([a, b]), to istnieje punkt x0 ∈ [a, b] taki, że: 1o Jeżeli x0 ∈ (a, b) to f 6∈ BV ([c, d])
dla każdego przedziału [c, d] ⊂ [a, b] takiego, że c < x0 < d. 2o Jeżeli x0 = a to
f 6∈ BV ([a, c]) dla każdego przedziału [a, c] ⊂ [a, b] takiego, że a < c. 3o Jeżeli
x0 = b to f 6∈ BV ([c, b]) dla każdego przedziału [c, b] ⊂ [a, b] takiego, że c < b.
7. Dla ustalonych liczb α, β ∈ R rozważmy funkcję fα,β : [0, 1] → R określoną w
następujący sposób:
fα,β (x) =


xα sin xβ dla 0 < x ¬ 1

0
dla x = 0 .
Pokazać, że dla β > 0 funkcja fα,β należy do BV ([0, 1]) wtedy i tylko wtedy, gdy
α + β ­ 0.
8. Pokazać, że funkcja f : [0, 1] → R określona wzorem f (x) =
ciągła na [0, 1].
44
√
x jest bezwzględnie
3. Funkcje o wariacji ograniczonej w sensie Wienera
C. Jordan wprowadził pojęcie funkcji o wariacji ograniczonej w sensie klasycznym pod
koniec XIX w. W roku 1924 amerykański matematyk N. Wiener wprowadził uogólnienie
tego pojęcia, które teraz przytoczymy.
Definicja 3.1. Niech p ­ 1 będzie ustaloną liczbą rzeczywistą oraz niech dana będzie
funkcja f : [a, b] → R, ograniczona na [a, b].
Dla dowolnie zadanego podziału P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]) zdefiniujmy liczbę nieujemną VarW
p (f, P ) przyjmując
W
VarW
p (f, P ) = Varp (f, P ; [a, b]) =
m
X
|f (tj ) − f (tj−1 )|p .
(3.1)
j=1
Liczbę tę nazywać będziemy wariacją (wahaniem) Wienera funkcji f na przedziale
[a, b] względem podziału P .
Natomiast wielkość
W
W
VarW
p (f ) = Varp (f ; [a, b]) = sup{Varp (f, P ; [a, b]) : P ∈ P([a, b])}
(3.2)
nazywa się (całkowitą) wariacją Wienera funkcji f na przedziale [a, b] .
Jeżeli VarW
p (f ; [a, b]) < ∞ to mówimy, że funkcja f jest funkcją o wahaniu skończonym (ograniczonym) w sensie Wienera.
Zbiór wszystkich funkcji o wahaniu ograniczonym w sensie Wienera oznaczać będziemy
symbolem W BVp ([a, b]).
Odnotujmy najpierw, że ma miejsce następujące twierdzenie podające własności wariacji w sensie Wienera jak również własności funkcji o wahaniu ograniczonym w sensie
Wienera.
W
Twierdzenie 3.2. Wielkości VarW
p (f, P ) oraz Varp (f ) mają następujące własności:
1/p
1/p
(a) Wielkość (VarW
= VarW
jest podaddytywna ze względu na
p (f ; [a, b]))
p (f ; [a, b])
funkcje:
1/p
1/p
1/p
VarW
¬ VarW
+ VarW
,
p (f + g; [a, b])
p (f ; [a, b])
p (g; [a, b])
dla dowolnych funkcji ograniczonych f, g : [a, b] → R.
45
1/p
jest dodatnio jednorodna, tzn.
(b) Wielkość VarW
p (f ; [a, b])
1/p
1/p
= |λ|VarW
VarW
p (f ; [a, b])
p (λf ; [a, b])
dla dowolnego λ ∈ R.
(c) Dla dowolnych t, s ∈ [a, b], s < t, ma miejsce nierówność
1/p
.
|f (s) − f (t)| ¬ VarW
p (f ; [s, t])
(d) Każda funkcja o wahaniu ograniczonym w sensie Wienera na przedziale [a, b] jest
ograniczona, tzn. jeżeli f ∈ W BVp ([a, b]) to f ∈ BV ([a, b]) oraz ma miejsce nierówność:
1/p
.
||f ||∞ ¬ |f (a)| + VarW
p (f ; [a, b])
(e) Zbiór W BVp ([a, b]) jest przestrzenią liniową nad ciałem R natomiast wielkość
|| · ||W BVp określona wzorem
1/p
||f ||W BVp = |f (a)| + VarW
p (f ; [a, b])
jest normą na przestrzeni W BVp ([a, b]). Norma ta jest zupełna.
Dowód. Przeprowadzimy dowody niektórych, wyżej wymienionych podpunktów. W dowodzie (a) będziemy wykorzystywać tzw. nierówność Minkowskiego, która mówi, że
dla dowolnych ciągów skończonych (a1 , a2 , ..., am ), (b1 , b2 , ..., bm ) liczb rzeczywistych, spełniona jest nierówność

m
X

1/p
|aj + bj |p 

¬
m
X
1/p
|aj |p 
j=1
j=1

+
m
X
1/p
|bj |p 
,
(3.3)
j=1
dla dowolnego p ∈ [1, ∞).
Ustalmy dalej dowolny podział P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]). Wtedy dostajemy:

1/p
VarW
=
p (f + g, P ; [a, b])
m
X
1/p
|f (tj ) + g(tj ) − f (tj−1 ) − g(tj−1 )|p 
j=1

=
m
X
1/p
|[f (tj ) − f (tj−1 )] + [g(tj ) − g(tj−1 )]|p 
j=1
46

¬
m
X
1/p
[|f (tj ) − f (tj−1 )| + |g(tj ) − g(tj−1 )|]p 
j=1

¬
m
X
1/p
|f (tj ) − f (tj−1 )|p 

+
j=1
m
X
1/p
|g(tj ) − g(tj−1 )|p 
j=1
1/p
1/p
= VarW
+ VarW
p (f ; P ; [a, b])
p (g, P ; [a, b])
1/p
1/p
¬ VarW
+ VarW
.
p (f ; [a, b])
p (g; [a, b])
Stąd, biorac po lewej stronie powyższej nierówności kres górny ze względu na wszystkie
podziały należące do P([a, b]) otrzymujemy naszą nierówność z (a).
Dowód (b) jest natychmiastowy i go pominiemy.
Dla dowodu (c) ustalmy dowolnie liczby t, s ∈ [a, b] takie, że s < t. Weźmy podział
P = {s, t} ∈ P([s, t]).
Wtedy dostajemy:
W
p
VarW
p (f, P ; [s, t]) = |f (t) − f (s)| ¬ Varp (f ; [s, t]) ,
skąd
1/p
|f (t) − f (s)| ¬ VarW
.
p (f ; [s, t])
Dowodzi to (c).
Dla dowodu (d) weźmy dowolną liczbę x ∈ (a, b) i rozważmy podział Px = {a, x, b}.
Wtedy mamy
p
p
VarW
p (f, Px ; [a, b]) = |f (b) − f (x)| + |f (x) − f (a)|
¬ VarW
p (f ; [a, b]) .
Stąd dostajemy
|f (x) − f (a)|p ¬ VarW
p (f ; [a, b])
więc
1/p
|f (x) − f (a)| ¬ VarW
.
p (f ; [a, b])
(3.4)
|f (x)| − |f (a)| ¬ ||f (x)| − |f (a)|| ¬ |f (x) − f (a)| .
(3.5)
Ale
Z (3.4) i (3.5) otrzymujemy:
1/p
|f (x)| ¬ |f (a)| + VarW
.
p (f ; [a, b])
47
(3.6)
Powyższa nierówność jest również w sposób trywialny spełniona dla x = a.
Następnie, biorąc podział P = {a, b} ∈ P([a, b]), mamy
W
p
VarW
p (f, P ; [a, b]) = |f (b) − f (a)| ¬ Varp (f ; [a, b]) .
Stąd otrzymujemy
1/p
,
|f (b)| − |f (a)| ¬ |f (b) − f (a)| ¬ VarW
p (f ; [a, b])
więc
|f (b)| ¬ |f (a)| + VarW
p (f ; [a, b]) .
Łącząc powyższą nierówność z nierównością (3.6) otrzymujemy nierówność z (d).
Zauważmy w końcu, że z (a) i (b) wynika, że zbiór W BVp ([a, b]) jest przestrzenią
liniową nad ciałem R. Nietrudno również sprawdzić, że wielkość zdefiniowana w punkcie
(e) spełnia warunki normy w przestrzeni liniowej W BVp ([a, b]). Można pokazać, że ta
norma jest zupełna, co tutaj pominiemy.
Okazuje się, że pewne własności wariacji funkcji w sensie klasycznym (Jordana) nie
przenoszą się na analogiczne własności w sensie Wienera. W niżej podanych przykładach
wskażemy na dwie takie własności.
Przykłada 3.3. Rozważmy funkcję f : [0, 2] → R określoną w następujący sposób:
f (x) =





0 dla 0 ¬ x < 1




2 dla 1 < x ¬ 2 .
1 dla x = 1
Następnie weźmy podziały P = {0, 2} i Q = {0, 1, 2} przedziału [0, 2]. Wtedy oczywiście
P ⊂ Q i mamy dla dowolnie ustalonej liczby p, p > 1:
p
VarW
p (f, P ; [0, 2]) = 2 ,
VarW
p (f, Q; [0, 2]) = 2 .
Stąd widoczne jest, że wariacja w sensie Wienera względem podziału nie jest monotoniczna
ze względu na podziały (por. Twierdzenie 2.3(f)).
48
Przykład 3.4. Weźmy znowu pod uwagę funkcję f zdefiniowaną w poprzednim Przykładzie 2.3 oraz rozważmy wariacje Wienera tej funkcji na przedziałach [0, 1], [1, 2] i [0, 2],
dla ustalonego p, p > 1. Proste rachunki dają następujące wyniki:
W
VarW
p (f ; [0, 1]) = Varp (f ; [1, 2]) = 1 ,
p
VarW
p (f ; [0, 2]) = 2 .
Oznacza to, że wariacja w sensie Wienera nie jest addytywna ze względu na przedziały
(por. Twierdzenie 2.3(g)).
Pokażemy później w nieco ogólniejszej sytuacji, że wariacja funkcji w sensie Wienera
jest superaddytywna (nadaddytywna) ze względu na przedziały w tym sensie, że dla
dowolnie ustalonej liczby p > 1 ma miejsce nierówność
W
W
VarW
p (f ; [a, b]) ­ Varp (f ; [a, c]) + Varp (f ; [c, b])
dla a < c < b.
W celu znalezienia zależności w formie inkluzji między przestrzeniami W BVp ([a, b]) i
W BVq ([a, b]) dla np. p < q, przytoczymy kilka faktów pomocniczych dotyczących funkcji
wypukłych.
W tym celu załóżmy, że dana jest funkcja ϕ : [0, ∞) → R. Rozważmy funkcję ψ : (0, ∞) →
R określoną wzorem:
ψ(t) =
ϕ(t)
.
t
Lemat 3.5. Jeżeli ϕ jest wypukła na przedziale [0, ∞) oraz ϕ(0) ¬ 0, to funkcja ψ jest
rosnąca na przedziale (0, ∞).
Dowód. Przypomnijmy, że to, że ϕ jest wypukła na przedziale [0, ∞) oznacza, że dla
dowolnych s, t ∈ [0, ∞) oraz dla dowolnego λ ∈ [0, 1] spełniona jest nierówność:
ϕ(λs + (1 − λ)t) ¬ λϕ(s) + (1 − λ)ϕ(t) .
(3.7)
Weźmy teraz x1 , x2 ∈ (0, ∞) takie, że x1 < x2 . Kładąc w nierówności (3.7) s = x2 , t = 0,
λ = x1 /x2 , otrzymujemy:
ϕ(x1 ) ¬ λϕ(x2 ) + (1 − λ)ϕ(0) ¬ λϕ(x2 ) =
49
x1
ϕ(x2 ) .
x2
Stąd mamy:
ϕ(x1 )
ϕ(x2 )
¬
x1
x2
więc ψ(x1 ) ¬ ψ(x2 ) i koniec dowodu.
Lemat 3.6. Załóżmy, że funkcja ϕ : [0, ∞) → [0, ∞) jest wypukła oraz ϕ(0) = 0. Wtedy
ϕ jest rosnąca oraz superaddytywna na przedziale [0, ∞), tzn.
ϕ(α) + ϕ(β) ¬ ϕ(α + β)
(3.8)
dla α, β ­ 0.
Dowód. Dla dowodu nie wprost przypuśćmy, że ϕ nie jest rosnąca na przedziale [0, ∞),
tzn. istnieją x1 , x2 ∈ [0, ∞), x1 < x2 takie, że ϕ(x1 ) > ϕ(x2 ).
Jeżeli x1 = 0, to wtedy mielibyśmy, że ϕ(x2 ) < 0, co jest sprzeczne z założeniem. Zatem
możemy założyć, że 0 < x1 < x2 . Stąd
1
1
>
x1
x2
i dalej mamy:
ϕ(x1 )
ϕ(x1 )
ϕ(x2 )
­
>
x1
x2
x2
ponieważ z założenia ϕ(x1 ) > ϕ(x2 ).
(3.9)
Jednakże nierówność (3.9) stoi w sprzeczności z Lematem 3.5. Zatem ϕ jest rosnąca na
przedziale [0, ∞).
Ustalmy dalej dowolne α, β ∈ [0, ∞).
Jeżeli α = 0, to wtedy z założenia mamy, że ϕ(0) = 0, więc
ϕ(α) + ϕ(β) = ϕ(0) + ϕ(β) = ϕ(β) = ϕ(0 + β) = ϕ(α + β) .
Przypadek β = 0 rozpatrujemy analogicznie.
Załóżmy więc, że α > 0 i β > 0. Wtedy α < α + β oraz β < α + β. Z udowodnionej
już części twierdzenia mamy:
ϕ(α)
ϕ(α + β)
¬
,
α
α+β
ϕ(β)
ϕ(α + β)
¬
.
β
α+β
Stąd
ϕ(α) ¬
α
ϕ(α + β) ,
α+β
50
β
ϕ(α + β) .
α+β
Dodając te nierówności stronami, otrzymujemy:
ϕ(β) ¬
!
ϕ(α) + ϕ(β) ¬
β
α
+
ϕ(α + β) = ϕ(α + β)
α+β α+β
i koniec dowodu.
Najprostrzym przykładem funkcji, która spełnia założenia Lematów 3.5 i 3.6 jest funkcja ϕ(t) = tp gdzie p jest dowolnie ustaloną liczbą, p ­ 1.
Rzeczywiście, ϕ0 (t) = ptp−1 , ϕ00 (t) = p(p − 1)tp−2 > 0 dla p > 1 (przypadek p = 1 jest
trywialny). Zatem funkcja ta jest wypukła na przedziale [0, ∞) oraz ϕ(0) = 0.
Stąd i z Lematu 3.6 wynika, że dla dowolnych t, s ­ 0 spełniona jest nierówność
tp + sp ¬ (t + s)p
(3.10)
dla dowolnego p ­ 1.
Udowodnimy teraz, zapowiadane wcześniej twierdzenie.
Twierdzenie 3.7. Niech 1 ¬ p ¬ q < ∞. Wtedy ma miejsce nierówność
1/p
1/q
.
¬ VarW
VarW
p (f ; [a, b])
q (f ; [a, b])
(3.11)
Ponadto mamy, że
BV ([a, b]) = W BV1 ([a, b]) ⊂ W BVp ([a, b]) ⊂ W BVq ([a, b]) ⊂ B([a, b]) .
(3.12)
Dowód. Ustalmy dowolny podział P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]). Wtedy, z nierówności
(3.10) dostajemy:
m
X
|f (tj ) − f (tj−1 )|q =
j=1
m
X
(|f (tj ) − f (tj−1 )|p )q/p
j=1

¬
m
X
q/p
|f (tj ) − f (tj−1 )|p 
q/p
¬ VarW
p (f ; [a, b])
j=1
Stąd otrzymujemy nierówność
W
q/p
VarW
q (f ; [a, b]) ¬ Varp (f ; [a, b])
51
która implikuje, że
1/q
1/p
VarW
¬ VarW
,
q (f ; [a, b])
p (f ; [a, b])
a więc otrzymujemy nierowność (3.11).
Inkluzje (3.12) wynikają teraz już łatwo z wyżej udowodnionej nierówności (3.11), przy
czym ostatania inkluzja po prawej stronie (3.12) jest prostą konsekwencją Twierdzenia
3.2(d).
Podamy teraz przykład wskazujący na pewne istotne fakty związane zarówno z samym
pojęciem wariacji funkcji w sensie Wienera jak również z inkluzjami (3.12).
Przykład 3.8. Ustalmy dowolnie liczbę p, 1 ¬ p, i weźmy zbiór A = { n1 : n ∈ N}.
Następnie, określmy funkcję fp : [0, 1] → R w następujący sposób.
fp (x) =

 1

Dalej, weźmy podziały P1
1
n
∈A
np
dla x =
0
dla x pozostałych .
1
{0, m1 , m−1
, ..., 21 , 1}
=
∈
P([0, 1]) oraz P2
=
{0, x1 , x2 , ..., xm , 1} ∈ P([0, 1]), gdzie x1 , x2 , ..., xm są dowolnie ustalonymi liczbami takimi, że 0 < x1 <
1
m
oraz
1
1
< xi <
m − (i − 2)
m − (i − 1)
dla i = 2, ..., m. Następnie, weźmy podział P = P1 ∪ P2 , tzn.
P = {0, x1 ,
1
1
1
, x2 ,
, ..., , xm , 1} .
m
m−1
2
Oczywiście P ∈ P([0, 1]).
Teraz, dla dowolnie ustalonej liczby q, q ­ 1, dostajemy:
VarW
q (fp , P ; [0, 1])
=
m
X
i=1
2·
1
iq/p
=2 1+
1
2q/p
1
+ · · · + q/p
m
.
Zatem, na podstawie dobrze znanych faktów dotyczących szeregu harmonicznego dowolnego rzędu, mamy:
VarW
q (fp ; [0, 1]) = ∞ dla 1 ¬ q ¬ p ,
VarW
q (fp ; [0, 1]) < ∞ dla p < q .
52
Zatem fp 6∈ W BVq ([0, 1]) dla q ¬ p, natomiast fp ∈ W BVq ([0, 1]) dla p < q. W szczególności mamy, że f1 6∈ W BV1 ([0, 1]) ale f1 ∈ W BVp ([0, 1]) dla p > 1.
Powyższy przykład pokazuje, że inkluzje (3.12) są ostre dla 1 < p < q, a z drugiej
strony wskazuje na to, że pojęcie wariacji ograniczonej w sensie Wienera jest uogólnieniem
klasycznego pojęcia wariacji ograniczonej (w sensie Jordana).
Następujące twierdzenie będzie wskazywać na pewien związek między spełnianiem
przez funkcję warunku Höldera a przynależnością tej funkcji do przestrzeni funkcji o wariacji ograniczonej w sensie Wienera.
Twierdzenie 3.9. Niech p ­ 1 będzie dowolnie ustaloną liczbą. Jeżeli funkcja f : [a, b] →
R spełnia na przedziale [a, b] warunek Höldera z wykładnikiem 1/p, to f ∈ W BVp ([a, b]).
Dowód. Załóżmy, że f spełnia warunek Höldera na przedziale [a, b] z wykładnikiem 1/p
tzn., istnieje stała L > 0 taka, że
|f (t) − f (s)| ¬ L|t − s|1/p
dla t, s ∈ [a, b]. Ustalmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy dostajemy
VarW
p (f, P ; [a, b]) =
m
X
|f (tj ) − f (tj−1 )|p
j=1
¬
m
X
1/p p
(L|tj − tj−1 |
) =L
p
j=1
m
X
|tj − tj−1 |
j=1
= Lp (b − a) .
Stąd
p
VarW
p (f ; [a, b]) ¬ L (b − a) < ∞ ,
co kończy dowód.
Zauważmy, że powyższe twierdzenie w szczególnym przypadku orzeka, że funkcja spełniająca na przedziale [a, b] warunek Lipschitza jest funkcją o wariacji ograniczonej (w
klasycznym sensie) na przedziale [a, b] (por. Uwagę 2.21).
W dalszym ciągu podamy twierdzenie charakteryzujące funkcje o wariacji ograniczonej w sensie Wienera. Twierdzenie to będzie stanowić szczególny przypadek twierdzenia
53
Sierpińskiego (Twierdzenie 1.11) a zarazem będzie ”równoległe” do twierdzenia Federera
(Twierdzenie 2.29).
Twierdzenie 3.10. Funkcja f należy do przestrzeni W BVp ([a, b]) wtedy i tylko wtedy,
gdy może być przedstawiona jako złożenie f = g ◦ τ , gdzie τ : [a, b] → [c, d] jest rosnąca na przedziale [a, b] natomist funkcja g spełnia na przedziale [c, d] warunek Höldera z
wykładnikiem 1/p i ze stałą L = 1.
Dowód. Ponieważ dowód tego twierdzenia jest bardzo podobny do dowodu Twierdzenia
2.29 (Federera), podamy tylko jego szkic.
Załóżmy najpierw, że f = g ◦ τ , gdzie g i τ mają własności wymienione w naszym
twierdzeniu. Niech zadany będzie dowolnie ustalony podział P = {t0 , t1 , ..., tm } ∈ P ([a, b]).
Wtedy mamy:
VarW
p (f, P ; [a, b])
=
m
X
|g(τ (tj )) − g(τ (tj−1 ))|p
j=1
¬
m X
|τ (tj ) − τ (tj−1 )|1/p
p
=
j=1
m
X
|τ (tj ) − τ (tj−1 )|
j=1
= |τ (b) − τ (a)| ,
a to oznacza, że f ∈ W BVp ([a, b]).
Na odwrót załóżmy, że f ∈ W BVp ([a, b]). Niech funkcja τ = τ (t) będzie określona na
przedziale [a, b] w następujący sposób
τ (t) = Vf,p (t) = VarW
p (f ; [a, t]) .
Korzystając z własności wariacji w sensie Wienera można pokazać, że funkcja τ jest
rosnąca na przedziale [a, b] oraz c = 0 i d = VarW
p (f ; [a, b]). Następnie, określmy funkcję
g na zbiorze wartości funkcji τ , tzn. na zbiorze τ ([a, b]) ⊂ [c, d], kładąc g(τ (x)) = f (x).
Wtedy oczywiście mamy, że f = g ◦ τ oraz
1/p
|g(τ (s)) − g(τ (t))| = |f (s) − f (t)| ¬ VarW
p (f ; [s, t])
¬ |τ (s) − τ (t)|1/p
dla a ¬ s < t ¬ b. Powyższa nierówność oznacza, że na zbiorze τ ([a, b]) funkcja g spełnia
warunek Höldera z wykładnikiem 1/p i ze stałą 1.
54
Teraz, przy użyciu twierdzenia McShane możemy przedłużyć funkcję g ze zbioru τ ([a, b])
na cały przedział [c, d] otrzymując funkcje g spełniającą na przedziale [c, d] warunek
Höldera z wykładnikiem 1/p i ze stałą L = 1 a ponadto taką, że f = g ◦ τ = g ◦ τ .
Koniec dowodu.
Uwaga 3.11. Przytoczymy teraz, wraz z dowodem, wspomniane wyżej twierdzenie
McShane’a. Twierdzenie to odgrywa poważną rolę w teorii funkcji rzeczywistych [1].
Twierdzenie 3.12. Niech M ⊂ R będzie zadanym zbiorem niepustym oraz niech f :
M → R będzie funkcją spełniającą na zbiorze M warunek Höldera z wykładnikiem α ∈
(0, 1]. Wtedy istnieje funkcja fˆ : R → R spełniająca na zbiorze R warunek Höldera z
wykładnikiem α, która jest przedłużeniem funkcji f .
Dowód. Z założenia, funkcja f spełnia na zbiorze M warunek Höldera z wykładnikiem α
i z pewną stałą L > 0. Oznaczmy symbolem Hα (f ) najlepszą z możliwych stałą L, którą
można zdefiniować następująco:
(
|f (x) − f (y)|
Hα (f ) = sup
: x, y ∈ M, x 6= y
|x − y|α
)
.
Następnie, określmy funkcję fˆ : R → R, kładąc
fˆ(x) = sup{f (z) − Hα (f )|x − z|α : z ∈ M } ,
(3.13)
dla x ∈ R. Fakt, że funkcja fˆ jest poprawnie określona, wynika z niżej podanego ciągu
nierówności
|f (z)| − |f (x)| ¬ |f (z) − f (x)| ¬ Hα (f )|z − x|α = Hα (f )|x − z|α ,
skąd
|f (z)| − Hα (f )|x − z|α ¬ |f (x)| .
Teraz, dla dowolnie ustalonych x, y ∈ R, z określenia (3.13) i z własności kresów funkcji,
otrzymujemy:
|fˆ(x) − fˆ(y)| = sup [f (z) − Hα (f )|x − z|α ]
z∈M
α − sup[f (z) − Hα (f )|y − z| ]
¬ sup {Hα (f )||x − z|α − |y − z|α |} ¬ Hα (f )|x − y|α .
z∈M
55
Powyższa nierówność pokazuje, że funkcja fˆ spełnia na zbiorze R warunek Höldera z
wykładnikiem α oraz ma miejsce nierówność Hα (fˆ) ¬ Hα (f ). Nierówność przeciwna jest
prawdziwa w sposób trywialny, bowiem fˆ jest przedłużeniem funkcji f .
Koniec dowodu.
Uwaga 3.13. Zauważmy, że z Twierdzenia 3.10 oraz z twierdzenia Sierpińskiego (Twierdzenie 1.11) wynika, że każda funkcja o wariacji ograniczonej w sensie Wienera na przedziale [a, b] jest funkcją regularną na [a, b]. Biorąc pod uwagę oznaczenie R([a, b]) wprowadzone dla przestrzeni liniowej funkcji regularnych na przedziale [a, b], fakt ten możemy
zapisać w postaci inkluzji
W BVp ([a, b]) ⊂ R([a, b]) .
Zatem, ciąg inkluzji (3.12) możemy poszerzyć w następujący sposób
BV ([a, b]) = W BV1 ([a, b]) ⊂ W BVp ([a, b])
⊂ W BVq ([a, b]) ⊂ R([a, b]) ⊂ B([a, b])
(3.14)
dla dowolnych p, q takich, że 1 ¬ p ¬ q < ∞.
Zadania
1. Niech f ∈ W BVp ([a, b]). Pokazać, że funkcja x → VarW
p (f ; [a, x]) jest rosnąca na
przedziale [a, b].
2. Niech α, β będą ustalonymi liczbami rzeczywistymi i niech fα,β : [0, 1] → R będzie
funkcją określoną następująco


fα,β (x) = 
xα sin xβ dla 0 < x ¬ 1
dla x = 0 .
0
Pokazać, że dla każdego ustalonego p ­ 1 funkcja fα,β należy do przestrzeni
W BVp ([0, 1]) wtedy i tylko wtedy gdy albo β > 0 i pα + β ­ 0 albo β ¬ 0 i
pα + β > 0.
3. Skonstruować funkcję f ∈ W BVp ([0, 1]), która nie spełnia warunku Höldera z wykładnikiem 1/p.
4. Dla ustalonego przedziału [a, b] oznaczmy symbolem Lip([a, b]) zbiór wszystkich
funkcji f : [a, b] → R, które spełniają warunek Lipschitza na przedziale [a, b].
56
(a) Pokazać, że zbiór Lip([a, b]) ma strukturę przestrzeni liniowej nad ciałem R ze
zwykłymi działaniami dodawania funkcji i ich mnożenia przez liczby rzeczywiste.
(b) Pokazać, że wielkość || · ||Lip określona dla dowolnej funkcji f ∈ Lip([a, b])
wzorem
(
|f (x) − f (y)|
||f ||Lip = |f (a)| + sup
: x, y ∈ [a, b], x 6= y
|x − y|
)
jest normą w przestrzeni Lip([a, b]).
(c) Pokazać, że przestrzeń Lip([a, b]) z normą określoną w punkcie (b) jest przestrzenią Banacha.
5. Ustalmy liczbę α ∈ (0, 1] i symbolem Lipα ([a, b]) oznaczmy zbiór wszystkich funkcji
f : [a, b] → R, które spełniają warunek Höldera z wykładnikiem α na przedziale
[a, b].
(a) Pokazać, że zbiór Lipα ([a, b]) jest przestrzenią liniową nad ciałem R z działaniami dodawania funkcji i ich mnożenia przez liczby rzeczywiste.
(b) Pokazać, że wielkość || · ||Lip określona dla dowolnej funkcji f ∈ Lipα ([a, b])
α
wzorem
(
|f (x) − f (y)|
||f ||Lip = |f (a)| + sup
: x, y ∈ [a, b], x 6= y
α
|x − y|α
)
jest normą w przestrzeni Lipα ([a, b]).
(c) Pokazać, że przestrzeń Lipα ([a, b]) z normą || · ||Lip określoną w punkcie (b)
α
jest przestrzenią Banacha.
57
4. Wariacja funkcji w sensie Wienera-Younga
Rozdział ten poświęcony jest omówieniu kolejnego uogólnienia pojęcia wariacji funkcji.
Jest to uogólnienie pojęcia wariacji funkcji w sensie Wienera, które było dyskutowane w
poprzednim rozdziale. Oznacza to automatycznie, że jest to również uogólnienie pojęcia
wariacji funkcji w klasycznym sensie Jordana, które było przedstawione w Rozdziale 2.
Pojęcie wariacji funkcji w sensie Wienera-Younga zostało wprowadzone w 1937 roku
przez L.C. Younga (por. [1]). W celu przedstawienia tego pojęcia omówimy najpierw
pojęcie tzw. funkcji Younga, które odgrywać będzie podstawową rolę przy definiowaniu
zapowiedzianego pojęcia wariacji.
Definicja 4.1. Funkcję φ : R+ → R+ = [0, ∞) będziemy nazywać funkcją Younga, jeżeli
jest ona ciągła i wypukła na R+ , φ(0) = 0, φ(t) > 0 dla t > 0 oraz φ(t) → ∞ przy t → ∞.
Uwaga 4.2. Zwróćmy uwagę na to, że przyjęte w powyższej definicji założenia mówiące,
że φ(t) → ∞ przy t → ∞, jest prostą konsekwencją pozostałych założeń.
Typowymi przykładami funkcji Younga są funkcje φ(t) = tp dla 1 ¬ p < ∞, φ(t) =
et − 1, φ(t) = t ln(t + 1), φ(t) = (t + 1) ln(t + 1).
Definicja 4.3. Załóżmy, że dana jest funkcja Younga φ : R+ → R+ oraz funkcja
f : [a, b] → R, ograniczona. Dla ustalonego dowolnie podziału P = {t0 , t1 , t2 , ..., tm } ∈
P([a, b]) nieujemną liczbę rzeczywistą zdefiniowaną wzorem
W
VarW
φ (f, P ) = Varφ (f, P ; [a, b]) =
m
X
φ(|f (tj ) − f (tj−1 )|)
(4.1)
j=1
będziemy nazywać wariacją (wahaniem) Wienera-Younga funkcji f na przedziale
[a, b] względem podziału P .
Natomiast wielkość zdefiniowaną następująco
n
o
W
W
VarW
φ (f ) = Varφ (f ; [a, b]) = sup Varφ (f, P ; [a, b]) : P ∈ P([a, b])
(4.2)
będziemy nazywać (całkowitą) wariacją Wienera-Younga funkcji f na przedziale
[a, b].
Jeżeli VarW
φ (f ) < ∞, to mówimy, że f jest funkcją o wariacji Wienera-Younga ograniczonej na przedziale [a, b] (o wariacji ograniczonej w sensie Wienera-Younga na przedziale
58
[a, b]). Zbiór wszystkich funkcji o ograniczonej wariacji Wienera-Younga na przedziale
[a, b] oznaczamy symbolem VφW ([a, b]).
Zauważmy, że dla φ(t) = tp (1 ¬ p < ∞) zbiór VφW ([a, b]) pokrywa się z przestrzenią
W BVp ([a, b]) omówioną w Rozdziale 3.
Okazuje się, że zbiór VφW ([a, b]) nie zawsze jest przestrzenią liniową tzn. nie dla każdej
funkcji Younga φ jest to przestrzeń liniowa.
Przykład 4.4. Weźmy pod uwagę funkcję φ : R+ → R określoną następująco
φ(t) =





dla t = 0
0
e
−1/t
dla 0 < t <



 2t+1
dla t ­
2e2
1
2
1
2
.
Łatwo sprwadzić, że φ jest funkcją Younga w sensie Definicji 4.1. Pokażemy teraz, że
związany z tą funkcją zbiór VφW ([0, 1]) nie jest przestrzenią liniową.
W tym celu rozważmy funkcję f : [0, 1] → R określoną w następujący sposób


f (x) = 
− 2 ln1 n dla x =
1
n
(n = 2, 3, ...)
dla x pozostałych .
0
Dla obliczenia wariacji VφW (f ; [0, 1]) weźmy optymalny podział
Pn = {0, sn , tn , sn−1 , tn−1 , ..., s2 , t2 , s1 }
(n = 1, 2, ...), gdzie sk = 1/k oraz tk ∈ (sk , sk−1 ) i tk jest dowolnie wybrane. Wtedy mamy
VarW
φ (f ; [0, 1])
∞
X
1
φ f
=2
k
k=2
=2
=2
∞
X
e−2 ln k
k=2
∞
X
1
<∞,
2
k=2 k
skąd wynika, że f ∈ VφW ([0, 1]). Z drugiej strony, otrzymujemy
VarW
φ (2f ; [0, 1])
∞
X
1
­2
φ 2f
k
k=2
=2
=2
∞
X
e− ln k
k=2
∞
X
1
=∞,
k=2 k
co implikuje, że 2f 6∈ VφW ([0, 1]). Zatem zbiór VφW ([0, 1]), dla rozważanej tutaj funkcji
Younga, nie jest przestrzenią liniową.
59
Jak później pokażemy, istnieją funkcje Younga φ, dla których zbiór VφW ([a, b]) jest
przestrzenią liniową. Żeby sformułować warunek, charakteryzyjący takie właśnie funkcje
Younga, potrzebne nam będzie pewne pojęcie, które niżej zdefiniujemy.
Definicja 4.5. Będziemy mówić, że funkcja Younga φ : R+ → R+ spełnia warunek δ2
jeżeli istnieją stałe M > 0 i T > 0 takie, że
φ(2t) ¬ M φ(t)
(4.3)
dla 0 ¬ t ¬ T .
Uwaga 4.6. Sformułowany wyżej warunek δ2 jest ”równoległy” do warunku ∆2 występującego w teorii przestrzeni Orlicza [4]. Można powiedzieć, że warunek δ2 jest sformułowany
dla małych wartości t podczas gdy warunek ∆2 funkcjonuje dla dużych wartości zmiennej
t.
Uwaga 4.7. Odnotujmy, że M ­ 1, gdzie M jest stałą występującą w (4.3). Rzeczywiście,
ponieważ φ jest rosnąca, to dla 0 < t ¬ T mamy
φ(t) ¬ φ(2t) ¬ M φ(t) ,
skąd M ­ 1.
Podamy teraz trzy lematy mające charakter techniczny i dotyczące funkcji Younga
spałniających warunek δ2 .
Lemat 4.8. Funkcja Younga φ spełnia warunek δ2 wtedy i tylko wtedy, gdy dla każdego
T 0 > 0 istnieje liczba M (T 0 ) ­ 1 taka, że
φ(2t) ¬ M (T 0 )φ(t)
dla 0 < t ¬ T 0 .
Dowód. Oczywiście, jeżeli funkcja φ spełnia wspomniany w naszym twierdzeniu warunek
to spełnia warunek δ2 .
Na odwrót załóżmy, że funkcja φ spełnia warunek δ2 . Ustalmy dowolnie liczbę T 0 taką,
że T 0 > T /2, gdzie T > 0 jest stałą występującą w sformułowaniu warunku δ2 . Wtedy,
60
korzystając z założenia, dla t = T /2 mamy
φ(T ) ¬ M (T )φ(T /2) ,
skąd dla t ∈ [T /2, T 0 ] otrzymujemy
φ(t) ­
1
φ(T )
φ(t)
φ(T )
φ(t) =
·
·
· φ(2t) .
M (T )φ(T /2)
M (T ) φ(2t) φ(T /2)
(4.4)
Z drugiej strony, biorąc pod uwagę fakt, że φ jest rosnąca, z nierówności T /2 ¬ t ¬ T 0
oraz 2t ¬ 2T 0 , dostajemy
φ(2t)
φ(t)
¬1¬
.
0
φ(2T )
φ(T /2)
Stąd i z (4.4) wnioskujemy, że
φ(t) ­
1
φ(T ) φ(2t)
1
φ(T )
·
·
φ(2t) =
φ(2t) .
0
M (T ) φ(2t) φ(2T )
M (T ) φ(2T 0 )
Połóżmy teraz
M (T 0 ) = M (T )
(4.5)
φ(2T 0 )
.
φ(T )
Biorąc pod uwagę nierówności φ(T ) ¬ φ(2T 0 ) i M (T ) ­ 1 wnioskujemy, że M (T 0 ) ­ 1.
Stąd i z (4.5) widzimy, że ma miejsce teza naszego twierdzenia, co kończy dowód.
Na podstawie Lematu 4.8 każdej funkcji Younga φ spełniającej warunek δ2 (będziemy
wtedy pisać: φ ∈ δ2 ) możemy przyporządkować funkcję M : (0, ∞) → [1, ∞) określoną w
następujący sposób
(
φ(2t)
M (T ) = sup
: 0<t¬T
φ(t)
)
.
Funkcja ta jest poprawnie określona i rosnąca na przedziale (0, ∞).
Lemat 4.9. Niech φ ∈ δ2 . Wtedy
φ(s + t) ¬ M (T )[φ(s) + φ(t)]
dla s, t ∈ (0, T ].
Dowód. Załóżmy np., że s < t. Wtedy mamy
s+t
s+t
φ(s + t) = φ 2
¬ M (T )φ
¬ M (T )φ(t)
2
2
61
¬ M (T )[φ(s) + φ(t)] ,
gdzie wykorzystaliśmy określenie funkcji M = M (t) oraz fakt, że φ jest rosnąca.
Uwaga 4.10. Stosując zasadę indukcji matematycznej można pokazać, że dla dowolnej
liczby naturalnej n i dla dowolnych liczb ti takich, że 0 < ti ¬ T (i = 1, 2, ..., n), ma
miejsce nierówność
φ(t1 + t2 + · · · + tn ) ¬ M n−1 ((n − 1)T )[φ(t1 ) + φ(t2 ) + · · · + φ(tn )] .
Zauważmy dalej, że z Lematu 4.9 otrzymujemy następujący wniosek.
Wniosek 4.11. Niech φ ∈ δ2 i niech f, g : [a, b] → R będą funkcjami ograniczonymi na
przedziale [a, b]. Wtedy ma miejsce nierówność
W
W
VarW
φ (f + g) ¬ M (2K)[Varφ (f ) + Varφ (g)] ,
gdzie K = max{||f ||∞ , ||g||∞ } oraz symbol || · ||∞ oznacza normę supremum w przestrzeni
B([a, b]). Ponadto, dla λ ∈ R mamy
W
m
VarW
φ (λf ) ¬ (m + 1)M (2m||f ||∞ )Varφ (f ) ,
gdzie m = [|λ|] oznacza część całkowitą liczby |λ|. Zatem, jeżeli φ ∈ δ2 to VφW ([a, b]) jest
przestrzenią liniową.
W dalszym ciągu zajmiemy się porównaniem klas funkcji VφW i VψW dla dwóch różnych
funkcji Younga φ i ψ
W tym celu wprowadzimy najpierw pewne określenie.
Definicja 4.12. Niech dane będą dwa ciągi liczbowe (αn ) i (βn ) o wyrazach dodatnich.
Mówimy, że ciąg (βn ) jest podporządkowany ciągowi (αn ), jeżeli zbieżność szeregu
P∞
n=1
αn implikuje zbieżność szeregu
P∞
n=1
βn .
Podany niżej lemat będzie odgrywał istotną rolę w naszych dalszych rozważaniach.
Lemat 4.13. Niech φ i ψ będą dwoma funkcjami Younga. Wtedy, dla każdego nieujemnego
ciągu liczbowego (tn ), ciąg (ψ(tn )) jest podporządkowany ciągowi (φ(tn )) wtedy i tylko
wtedy, gdy istnieją liczby A > 0 i B > 0 takie, że
ψ(t) ¬ Bφ(t)
62
(4.6)
dla 0 < t ¬ A.
Dowód. Oczywiście warunek (4.6) implikuje, że ciąg (ψ(tn )) jest podporządkowny ciągowi
(φ(tn )).
Na odwrót przypuśćmy, że warunek (4.6) nie jest spełniony. Wtedy, dla każdych A > 0 i
B > 0 możemy znaleźć liczbę t ∈ (0, A] taką, że ψ(t) > Bφ(t). W szczególności, weźmy
B = n, n ∈ N, oraz A > 0 takie, że φ(A) =
1
.
n2
Następnie, dobierzmy tn ∈ (0, A] tak, żeby
ψ(tn ) > nφ(tn ). Stąd wnioskujemy, że
∞
X
φ(tn ) ¬
n=1
∞
X
1
<∞.
2
n=1 n
Dalej, oznaczmy przez kn najmniejszą liczbę naturalną taką, że
2
1
¬
k
φ(t
)
¬
.
n
n
n2
n2
Dla m ∈ N dobierzmy n = n(m) ∈ N takie, że
k1 + k2 + · · · + km−1 < n ¬ k1 + k2 + · · · + km .
Wtedy, dla ciągu (tm ) mamy
∞
X
∞
X
φ(tm ) < ∞ ,
ψ(tm ) = ∞ ,
m=1
m=1
co przeczy temu, że ciąg (ψ(tn )) jest podporządkowany ciągowi (φ(tn )).
Koniec dowodu.
Uwaga 4.14. Założenia tej części Lematu 4.13, które dotyczą liczb A i B, mogą być równoważnie sformułowane w następujący sposób: Dla każdego A0 > 0 istnieje stała B(A0 ) > 0
taka, że dla 0 < t ¬ A0 spełniona jest nierówność
ψ(t) ¬ B(A0 )φ(t) .
(4.7)
Dowód tego faktu jest podobny do dowodu Lematu 4.8.
W dalszym ciągu podamy kilka ważnych rezultatów dotyczących klas funckji
VφW ([a, b]).
Twierdzenie 4.15. Niech φ i ψ będą dwiema funkcjami Younga. Wtedy mają miejsce
następujące stwierdzenia.
63
(a) Inkluzja VφW ([a, b]) ⊂ VψW ([a, b]) zachodzi wtedy i tylko wtedy, gdy spełniony jest
warunek (4.6).
(b) Zbiór VφW ([a, b]) jest przestrzenią liniową wtedy i tylko wtedy, gdy φ ∈ δ2 .
Dowód. (a) Załóżmy, że spełniony jest warunek (4.6) a więc i (4.7).
Weźmy funkcję f ∈ VφW ([a, b]). Ponieważ f jest ograniczona możemy wziąć w (4.7) A0 =
2||f ||∞ . Wtedy dostaniemy
ψ(|f (s) − f (t)|) ¬ B(2||f ||∞ )φ(|f (s) − f (t)|) ,
dla dowlonych s, t ∈ [a, b]. Stąd otrzymujemy, że
W
VarW
ψ (f ) ¬ B(2||f ||∞ )Varφ (f ) ,
skąd wynika, że VφW ([a, b]) ⊂ VψW ([a, b]).
Na odwrót przypuśćmy, że (4.6) nie zachodzi tzn. dla każdych A > 0 i B > 0 istnieje
t ∈ (0, A] takie, że ψ(t) > Bφ(t). Wtedy, podobnie jak w dowodzie Lematu 4.13 możemy
znaleźć ciąg (tm ) taki, że
∞
X
∞
X
φ(tm ) < ∞ ,
ψ(tm ) = ∞ .
m=1
m=1
Następnie, ustalmy rosnący ciąg liczbowy (yn ) taki, że yn ∈ (a, b) i określmy funkcję
f : [a, b] → R w następujący sposób:
f (x) =


tm dla x = ym

0
dla x pozostałych .
Twierdzimy, że f ∈ VφW ([a, b]) ale f 6∈ VψW ([a, b]). Rzeczywiście, biorąc dowolny podział
P = {x0 , x1 , x2 , ..., xm } ∈ P([a, b]), otrzymujemy
m
X
j=1
φ(|f (xj ) − f (xj−1 )|) ¬ 2
m
X
φ(tj ) +
j=1
m
X
φ(|tj − tj−1 |) ¬ 4
j=1
∞
X
φ(tj ) .
j=1
W
Stąd VarW
φ (f ) < ∞ a więc f ∈ Vφ ([a, b]).
Z drugiej strony, rozważamy podział P = {x0 , x1 , ..., x2m }, gdzie
1
x2i+1 = yi (i = 0, 1, 2, ..., m − 2) , x2i = (yi−1 + yi ) (i = 1, 2, ..., m − 1) .
2
64
Dla tego podziału, otrzymujemy
VarW
ψ (f, P ) =
2m
X
ψ(|f (xj ) − f (xj−1 )|) ­
j=1
m−2
X
ψ(tj )
j=0
W
i stąd VarW
ψ (f ) = ∞ a zatem f 6∈ Vψ ([a, b]).
(b) Fakt, że VφW ([a, b]) jest przestrzenią liniową w przypadku, gdy φ ∈ δ2 był udowodniony we Wniosku 4.11.
Na odwrót, jeżeli VφW ([a, b]) jest przestrzenią liniową, to wtedy stąd, że f ∈ VφW ([a, b])
wynika, że 2f ∈ VφW ([a, b]). Zatem, kładąc ψ(t) = φ(2t) wnioskujemy, że VφW ([a, b]) ⊂
VψW ([a, b]). Jednakże, na podstawie udowodnionej już części (a) mamy, że
φ(2t) = ψ(t) ¬ Bφ(t)
dla t ∈ (0, A]. Stąd φ ∈ δ2 i koniec dowodu.
Zauważmy, że funkcja Younga φ(t) = tp spełnia warunek δ2 dla 1 ¬ p < ∞. Rzeczywiście, dla tej funkcji zachodzi nierówność (4.3) dla M = 2p i dla dowolnego T > 0. Funkcja
Younga φ(t) = t ln(t + 1) również spełnia warunek δ2 ponieważ na podstawie reguły de
l’Hospitala mamy
lim+
t→0
φ(2t)
4(t + 1)
= lim+
=4.
t→0
φ(t)
2t + 1
Rozważmy teraz funkcję Younga φ(t) = et − 1. Dla tej funkcji mamy
lim+
t→0
φ(2t)
= lim+ 2et = 2 ,
t→0
φ(t)
a więc φ ∈ δ2 .
Weźmy jeszcze pod uwagę funkcję Younga z Przykładu 4.4. Wtedy mamy
lim+
t→0
φ(2t)
e−1/2t
= lim+ −1/t = lim+ e1/2t = ∞ ,
t→0 e
t→0
φ(t)
a więc φ 6∈ δ2 . W świetle Twierdzenia 4.15(b) wyjaśnia to, dlaczego zbiór VφW ([0, 1])
rozpatrywany w Przykładzie 4.4 nie jest przestrzenią liniową.
Zwróćmy teraz uwagę na to, że zbiór VφW ([a, b]) jest zawsze (dla każdej funkcji Younga)
zbiorem symetrycznym, pochłaniającym, zbalansowanym i wypukłym. Stąd, podobnie jak
się to robi w przypadku teorii przestrzeni Orlicza, możemy rozważyć zbiór
B W (φ) = {f ∈ B([a, b]) : VarW
φ (f ; [a, b]) ¬ 1}
65
(4.8)
i związany z tym zbiorem tzw. funkcjonał Minkowskiego
||f ||W BVφ = |f (a)| + inf{λ > 0 : f /λ ∈ B W (φ)} .
(4.9)
Można pokazać, że funkcjonał Minkowskiego określony przez (4.9) jest normą na zbiorze
W BVφ ([a, b]) = spanVφW ([a, b]).
Ponadto, jednostkowa kula domknięta w przestrzeni W BVφ ([a, b]) z normą (4.9) pokrywa
się ze zbiorem B W (φ) określonym w (4.8).
W podanym w dalszym ciągu twierdzeniu zebrane będą pewne własności wariacji
Wienera-Younga (4.1) i (4.2) oraz przestrzeni W BVφ ([a, b]) z normą ||f ||W BVφ .
Twierdzenie 4.16. Wielkości (4.1) i (4.2) mają następujące własności:
(a) Wariacja Wienera-Younga (4.2) jest superaddytywna ze względu na przedziały tzn.
W
W
VarW
φ (f ; [a, b]) ­ Varφ (f ; [a, c]) + Varφ (f ; [c, b])
dla a < c < b.
(b) Jeżeli φ spełnia warunek δ2 , to
W
W
VarW
φ (f ; [a, b]) ¬ M (2||f ||∞ )[Varφ (f ; [a, c]) + Varφ (f ; [c, b])] ,
dla a < c < b, gdzie || · ||∞ oznacza normę supremum w przestrezni B([a, b]) oraz
funkcja M była poprzednio określona:
(
φ(2f )
M (T ) = sup
: 0¬t¬T
φ(t)
)
.
(c) Jeżeli φ spełnia warunek δ2 , to
h
i
W
W
VarW
φ (f + g; [a, b]) ¬ M (2K) Varφ (f ; [a, b]) + Varφ (g; [a, b]) ,
gdzie K = max{||f ||∞ , ||g||∞ }. Oznacza to, że wariacja Wienera-Younga jest częściowo podaddytywna ze względu na funkcje.
(d) Jeżeli φ ∈ δ2 to
W
m
VarW
φ (λf ; [a, b]) ¬ (m + 1)M (2m||f ||∞ )Varφ (f ; [a, b]) ,
gdzie m = [|λ|] (λ ∈ R).
66
(e) Ma miejsce oszacowanie
VarW
φ (f ; [a, b]) ¬ φ(Var(f ; [a, b])) ,
gdzie symbol Var(f ; [a, b]) oznacza wariację w sensie klasycznym funkcji f na przedziale [a, b]. W szczególności, jeżeli f jest monotoniczna na przedziale [a, b], to
VarW
φ (f ; [a, b]) = φ(|f (b) − f (a)|) .
(f ) Przestrzeń W BVφ ([a, b]) jest zupełna ze względu na normę (4.9).
W
Dowód. Dla dowodu (a) możemy założyć, że obie wariacje VarW
φ (f ; [a, c]) i Varφ (f ; [c, b])
są skończone.
Zadajmy dowolne ε > 0 i dobierzmy podziały
{t0 , t1 , ..., tk } ∈ P([a, c]) , {tk , tk+1 , ..., tm } ∈ P([c, b])
takie, że tk = c oraz
VarW
φ (f ; [a, c]) −
VarW
φ (f ; [c, b]) −
k
ε X
¬
φ(|f (tj ) − f (tj−1 )|) ,
2 j=1
m
X
ε
¬
φ(|f (tj ) − f (tj−1 )|) .
2 j=k+1
Stąd otrzymujemy
W
VarW
φ (f ; [a, c]) + Varφ (f ; [c, b]) − ε
¬
m
X
φ(|f (tj ) − f (tj−1 )|) ¬ VarW
φ (f ; [a, b]) .
j=1
Ze względu na dowolność liczby ε dowodzi to punktu (a).
Dla dowodu (b) weźmy dowolny podział {t0 , t1 , ..., tm } ∈ P([a, b]). Załóżmy najpierw,
że pewien punkt tego podziału, powiedzmy tk , pokrywa się z liczbą c. Wtedy dostajemy:
m
X
j=1
φ(|f (tj ) − f (tj−1 )|) ¬
k
X
φ(|f (tj ) − f (tj−1 )|) +
j=1
m
X
j=k+1
W
¬ VarW
φ (f ; [a, c]) + Varφ (f ; [c, b]) .
67
φ(|f (tj ) − f (tj−1 )|)
Teraz, biorąc pod uwagę fakt, że funkcja M spełnia nierówność M (T ) ­ 1 dla wszystkich
T > 0 (Lemat 4.8), dedukujemy następujące oszacowanie
m
X
i
h
W
φ(|f (tj ) − f (tj−1 )|) ¬ M (2||f ||∞ ) VarW
φ (f ; [a, c]) + Varφ (f ; [c, b]) .
(4.10)
j=1
Załóżmy teraz, że liczba c nie pokrywa się z żadnym punktem podziału {t0 , t1 , ..., tm }.
Wtedy istnieje k ∈ {1, 2, ..., m} takie, że tk−1 < c < tk . Wówczas otrzymujemy
m
X
φ(|f (tj ) − f (tj−1 )|) =
j=1
+
m
X
k−1
X
φ(|f (tj ) − f (tj−1 )|) + φ(|f (tk ) − f (tk−1 )|)
j=1
φ(|f (tj ) − f (tj−1 )|) ¬
k−1
X
φ(|f (tj ) − f (tj−1 )|) + φ(|f (tk ) − f (c)| + |f (c) − f (tk−1 )|)
j=1
j=k+1
+
m
X
φ(|f (tj ) − f (tj−1 )|) .
j=k+1
Z powyższego oszacowania i z Lematu 4.8, dostajemy
m
X
φ(|f (tj ) − f (tj−1 )|) ¬
k−1
X
φ(|f (tj ) − f (tj−1 )|)
j=1
j=1
+ M (2||f ||∞ )φ(|f (c) − f (tk−1 )|) + M (2||f ||∞ )φ(|f (tk ) − f (c)|)
+
m
X
φ(|f (tj ) − f (tj−1 )|) .
j=k+1
Stąd
m
X
h
i
W
φ(|f (tj ) − f (tj−1 )|) ¬ M (2||f ||∞ ) VarW
φ (f ; [a, c]) + Varφ (f ; [c, b]) .
(4.11)
j=1
Teraz, łącząc (4.10) i (4.11) otrzymujemy nierówność z punktu (b).
Zauważmy dalej, że nierówności z (c) i (d) zostały udowodnione we Wniosku 4.11.
Dla dowodu (e) ustalmy podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy mamy
m
X
j=1

φ(|f (tj ) − f (tj−1 )|) ¬ φ 
m
X

|f (tj ) − f (tj−1 )| ¬ φ(Var(f ; [a, b])) ,
j=1
ponieważ, na podstawie Lematu 3.6, funkcja φ jest rosnąca oraz superaddytywna. Z powyższej nierówności otrzymujemy oszacowanie
VarW
φ (f ; [a, b]) ¬ φ(Var(f ; [a, b])) .
68
Oczywiście, w przypadku gdy funkcja f jest monotoniczna, mamy, że Var(f ; [a, b]) =
|f (b) − f (a)|, więc
VarW
φ (f ; [a, b]) ¬ φ(|f (b) − f (a)|) .
Z drugiej strony, biorąc specjalny podział P = {a, b}, dostajemy
W
φ(|f (b) − f (a)|) = VarW
φ (f, P ; [a, b]) ¬ Varφ (f ; [a, b]) ,
co ostatecznie dowodzi (e).
Przeprowadzimy teraz dowód (f). W tym celu załóżmy, że (fn ) jest ciągiem Cauchy’ego
w przestrzeni W BVφ ([a, b]) względem normy (4.9). Oznacza to, że dla ustalonego dowolnie
ε > 0 istnieje liczba naturalna n0 taka, że
||fn − fm ||W BVφ ¬ ε
dla m, n ­ n0 . Z określenia normy (4.9) wynika, że
!
|fn (a) − fm (a)| ¬ ε ,
VarW
φ
fn − fm
; [a, b] ¬ 1 ,
ε
(4.12)
dla m, n ­ n0 .
Z pierwszej nierówności w (4.12) wnioskujemy, że ciąg liczbowy (fn (a)) jest zbieżny do
pewnej liczby rzeczywistej, którą oznaczymy przez f (a). Natomiast druga nierówność w
(4.12) implikuje, że dla każdego podziału {t0 , t1 , ..., tk } ∈ P([a, b]) ma miejsce nierówność
k
X
|[fn (tj ) − fm (tj )] − [fn (tj−1 ) − fm (tj−1 )]|
φ
ε
j=1
!
¬1.
(4.13)
Biorąc w szczególności podział {a, x, b} (z ustaloną liczbą x, x ∈ (a, b)), z powyższej
nierówności otrzymujemy
|[fn (x) − fm (x)] − [fn (a) − fm (a)]|
φ
ε
!
¬1,
skąd
|[fn (x) − fm (x)] − [fn (a) − fm (a)]|
¬ φ−1 (1) ,
ε
i dalej
|fn (x) − fm (x)| ¬ |fn (a) − fm (a)| + εφ−1 (1) .
69
Powyższa nierówność jest w trywialny sposób spełniona dla x = a. Można również pokazać, że jest ona spełniona dla x = b. Zatem, na podstawie tejże nierówności i pierwszej
nierówności w (4.12) wnioskujemy, że ma miejsce oszacowanie
|fn (x) − fm (x)| ¬ ε(1 + φ−1 (1))
dla m, n ­ n0 i dla dowolnego x ∈ [a, b].
Z oszacowania tego wynika, że ciąg (fn ) jest na przedziale [a, b] zbieżny jednostajnie do
pewnej funkcji f w przestrzeni B([a, b]).
Teraz, weźmy ponownie pod uwagę nierówność (4.13). Traktując n jako ustalone i
przechodząc z m → ∞, otrzymujemy
k
X
|[fn (tj ) − f (tj )] − [fn (tj−1 ) − f (tj−1 )]|
φ
ε
j=1
!
¬1
skąd wynika, że
!
VarW
φ
fn − f
; [a, b] ¬ 1
ε
dla n ­ n0 . Zatem ||fn − f ||W BVφ ¬ 2ε, a więc fn → f w przestrzeni W BVφ ([a, b]). Koniec
dowodu.
Zwróćmy teraz uwagę na przypadek szczególny funkcji Younga φ(t) = tp dla 1 < p <
∞ oraz na przestrzeń W BVp ([a, b]) rozważaną w poprzednim rozdziale. W Przykładzie 3.4
zapowiedzieliśmy, że wariacja w sensie Wienera (szczególny przypadek wariacji WieneraYounga dla φ(t) = tp ) jest superaddytywna ze względu na przedziały. Oczywiście wynika
to z Twierdzenia 4.16(a) dla φ(t) = tp . Co więcej, z punktów (a) i (b) wspomnianego
twierdzenia otrzymujemy nierówności
W
W
VarW
p (f ; [a, c]) + Varp (f ; [c, b]) ¬ Varp (f ; [a, b])
h
i
W
¬ 2p VarW
p (f ; [a, c]) + Varp (f ; [c, b]) ,
przy czym nierówność po prawej stronie wynika z faktu, że M (T ) = 2p w definicji M =
M (T ) dla φ(t) = tp .
Zajmiemy się teraz ustaleniem zależności pomiędzy przestrzeniami W BVφ i W BVψ
dla dowolnych funkcji Younga φ i ψ. Uogólnimy tym samym Twierdzenie 3.7.
70
Twierdzenie 4.17. Niech φ i ψ będą funkcjami Younga takimi, że funkcja ψ ◦ φ−1 jest
wypukła. Wtedy ma miejsce nierówność
−1
VarW
ψ −1 VarW
φ (f ; [a, b])
ψ (f ; [a, b]) ¬ φ
.
(4.14)
Ponadto
W BVφ ([a, b]) ⊂ W BVψ ([a, b])
(4.15)
dla takich funkcji Younga φ i ψ.
Dowód. Żeby udowodnić nierówność (4.14) możemy przyjąć, że wariacja VarW
φ (f ; [a, b])
jest skończona. Dalej, ustalmy dowolny podział {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy, mając
na uwadze fakt, że funkcje ψ i φ−1 są rosnące (por. Lemat 3.6) oraz fakt, że funkcja ψ ◦φ−1
jest funkcją Younga - więc jest superaddytywna, otrzymujemy:
m
X
VarW
ψ (f, P ; [a, b]) =
ψ(|f (tj ) − f (tj−1 )|)
j=1
=
m
X
(ψ ◦ φ−1 ◦ φ)(|f (tj ) − f (tj−1 )|)
j=1
=
m
X
(ψ ◦ φ−1 )(φ(|f (tj ) − f (tj−1 )|))
j=1

−1
¬ (ψ ◦ φ ) 
m
X

φ(|f (tj ) − f (tj−1 )|)
j=1
W
−1
= (ψ ◦ φ−1 ) VarW
φ (f, P ; [a, b]) ¬ (ψ ◦ φ ) Varφ (f ; [a, b]) .
Biorąc po lewej stronie supremum ze względu na wszystkie podziały, otrzymujemy nierówność
−1
VarW
VarW
ψ (f ; [a, b]) ¬ ψ φ
φ (f ; [a, b])
,
skąd, po obłożeniu obydwu stron funkcją ściśle rosnącą ψ −1 otrzymujemy nierówność
(4.14). Inkluzja (4.15) jest bezpośrednią konsekwencją nierówności (4.14), co kończy do
wód.
Biorąc w nierówności (4.14) φ(t) = t otrzymujemy, że wypukłość funkcji ψ = ψ ◦ φ−1
implikuje następujący wniosek.
71
Wniosek 4.18. Niech ψ będzie funkcją Younga. Wtedy dla każdej funkcji ograniczonej
f : [a, b] → R ma miejsce nierówność
ψ −1 VarW
ψ (f ; [a, b]) ¬ Var(f ; [a, b]) .
Zatem spełniona jest inkluzja
BV ([a, b]) ⊂ W BVψ ([a, b]) .
Zwróćmy uwagę na to, że z ostatniej inkluzji wynika, że każda funkcja o wariacji
ograniczonej w sensie klasycznym ma wariację ograniczoną w sensie Wienera-Younga dla
każdej funkcji Younga φ. Ponadto, biorąc w (4.14) i (4.15) φ(t) = tp , ψ(t) = tq przy
1 ¬ p ¬ q, otrzymujemy Twierdzenie 3.7.
Zadania
1. Niech 1 ¬ p < ∞. Mówimy, że funkcja Younga φ : R+ → R+ spełnia warunek ∞p ,
jeżeli
φ(t)
=∞
tp
(piszemy wtedy, że φ ∈ ∞p ). Pokazać, że funkcja φ(t) = tq spełnia warunek ∞p
lim
t→∞
dla q > p oraz funkcja φ(t) = et − 1 spełnia warunek ∞p dla każdego p ­ 1.
Rozstrzygnąć podobne pytanie odnośnie funkcji Younga φ(t) = t ln(t + 1).
2. Niech 1 ¬ p < ∞ i niech φ : R+ → R+ będzie funkcją Younga. Mówimy, że φ ∈ 0p
(funkcja φ spełnia warunek 0p ) jeżeli
φ(t)
=∞.
t→0 tp
lim
Sprawdzić, czy φ ∈ 0p dla funkcji Younga wymienionych w Zad. 1.
3. Pokazać, że
lim VarW
φ (f /λ; [a, b]) = 0
λ→∞
dla dowolnej funkcji Younga φ i dla każdej funkcji f ∈ W BVφ ([a, b]).
4. Udowodnić, że
[
W BVφ ([a, b]) = R([a, b]) ,
φ
72
gdzie sumowanie rozciąga się po wszystkich funkcjach Younga i gdzie R([a, b]) oznacza przestrzeń funkcji regularnych na przedziale [a, b].
5. Podać przykład funkcji f : [a, b] → R takiej, że ma ona nieograniczoną wariację
Wienera VarW
p (f ; [a, b]) dla każdego p ­ 1 ale dla której istnieje funkcja Younga φ
taka, że f ∈ W BVφ ([a, b]).
73
5. Wariacja funkcji w sensie Watermana
Rozdział ten rozpoczniemy od przypomnienia wcześniej wprowadzonych oznaczeń. Mianowicie, dla zadanego przedziału [a, b] symbolem
P
([a, b]) oznaczamy rodzinę wszystkich
skończonych zbiorów S = {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} złożonych z niezachodzacych na
siebie podprzedziałów przedziału [a, b], podczas gdy symbol
P
∞ ([a, b])
oznacza rodzinę
wszystkich nieskończonych przeliczalnych zbiorów S∞ = {[an , bn ] : n ∈ N} złożonych z
niezachodzących na siebie podprzedziałów przedziału [a, b].
Definicja 5.1. Ciągiem Watermana będziemy nazywać malejący ciąg liczbowy Λ =
(λn ) złożony z liczb dodatnich takich, że λn → 0 przy n → ∞ oraz
∞
X
λn = ∞ .
n=1
Prostym przykładem ciągu Watermana jest tzw. ciąg harmoniczny rzędu α postaci
1
nα
, gdzie 0 < α ¬ 1.
Załóżmy teraz, że zadana jest funkcja f : [a, b] → R, zbiór S∞ = {[an , bn ] : n ∈ N} ∈
P
∞ ([a, b])
oraz ciąg Watermana Λ = (λn ). Liczbę rzeczywistą określoną następująco
VarΛ (f, S∞ ) = VarΛ (f, S∞ ; [a, b]) =
∞
X
λk |f (bk ) − f (ak )|
(5.1)
k=1
będziemy nazywać wariację Watermana funkcji f na przedziale [a, b] względem
S∞ . Natomiast wielkość zdefiniowaną w następujący sposób.
VarΛ (f ) = VarΛ (f ; [a, b]) = sup {VarΛ (f, S∞ ; [a, b]) : S∞ ∈
P
∞ ([a, b])}
,
(5.2)
nazywamy wariacją (całkowitą) Watermana funkcji f na [a, b].
Jeżeli VarΛ (f ; [a, b]) < ∞ to mówimy, że f jest funkcją o ograniczonej wariacji
Watermana (o ograniczonej Λ-wariacji w sensie Watermana) na przedziale [a, b].
Zbiór wszystkich funkcji o ograniczonej Λ-wariacji Watermana na przedziale [a, b] oznaczać
będziemy symbolem ΛBV ([a, b]).
Zauważmy, że jeżeli zrezygnowalibyśmy z żądania λn → 0, to biorąc λn = 1 (n ∈ N)
dostaniemy przestrzeń ΛBV ([a, b]) pokrywającą się z klasyczną przestrzenią BV ([a, b]).
Zauważmy również, że te przestrzenie pokrywają się wtedy i tylko wtedy, gdy ciąg (λn )
jest odseparowany od zera. Wyjaśnia to powód, dla którego żądamy, żeby λn → 0.
74
Udowodnimy teraz pewnien fakt pomocniczy, który będzie używany w dalszym ciągu.
Twierdzenie 5.2. Załóżmy, że f 6∈ ΛBV ([a, b]). Wtedy istnieje punkt x0 ∈ [a, b] taki, że:
1o Jeżeli x0 ∈ (a, b), to f 6∈ ΛBV ([c, d]) dla każdego przedziału [c, d] ⊂ [a, b] takiego, że
x0 ∈ (c, d). 2o Jeżeli x0 = a to f 6∈ ΛBV ([a, d]) dla każdego przedziału [a, d] ⊂ [a, b]. 3o
Jeżeli x0 = b to f 6∈ ΛBV ([c, b]) dla każdego przedziału [c, b] ⊂ [a, b].
Dowód. Dzielimy kolejno przedział [a, b] na dwie połowy. Przypuśćmy, że szereg występujący w (5.1) jest jednostajnie ograniczony przez stałą M > 0 dla przedziałów In = [an , bn ]
znajdujących się w lewej połowie przedziału I = [a, b] lub w prawej połowie tego przedziału. Wtedy mamy, że VarΛ (f ; [a, b]) ¬ 2M , co przeczy naszemu założeniu. Dlatego zbiór
takich szeregów musi być nieograniczony na jednej połowie przedziału I. Kontynuując
to postępowanie znajdziemy zstępujący ciąg przedziałów (In ) zbieżny (w sensie części
wspólnej) do pewnego punktu x0 . Teraz, jeżeli x0 jest punktem wewnętrznym pewnego
podprzedziału J ⊂ I, to In ⊂ J dla n odpowiednio dużego. Stąd wynika teza naszego
twierdzenia w rozważanym przypadku. Jeżeli x0 = a lub x0 = b, rozumujemy podobnie
otrzymując tezę twierdzenia.
Powyższe twierdzenie nosi nazwę zasady lokalizacji.
Przytoczymy teraz twierdzenie zawierające podstawowe własności wariacji Watermana
(5.1) i (5.2).
Twierdzenie 5.3. Wielkości (5.1) i (5.2) mają następujące własności:
(a) Wariacja Watermana (5.1) jest monotoniczna ze względu na zbiory podprzedziałów,
tzn. jeżeli S∞ ⊂ T∞ , to
VarΛ (f, S∞ ) ¬ VarΛ (f, T∞ ) .
(b) Wariacja całkowita w sensie Watermana (5.2) jest podaddytywna ze względu na
przedziały, tzn.
VarΛ (f ; [a, b]) ¬ VarΛ (f ; [a, c]) + VarΛ (f ; [c, b]) .
(c) Wariacja całkowita Watermana (5.2) jest dodatnio jednorodna tzn. ma miejsce równość
VarΛ (µf ; [a, b]) = |µ|VarΛ (f ; [a, b])
75
dla µ ∈ R.
(d) Wariacja całkowita (5.2) jest podaddytywna ze względu na funkcje, tzn.
VarΛ (f + g; [a, b]) ¬ VarΛ (f ; [a, b]) + VarΛ (g; [a, b]) .
Ponadto
|VarΛ (f ; [a, b]) − VarΛ (g; [a, b])| ¬ VarΛ (f − g; [a, b]) .
(e) Jeżeli f jest funkcją o wariacji ograniczonej na przedziale [a, b], to f ∈ ΛBV ([a, b])
dla każdego ciągu Watermana Λ.
(f ) Jeżeli f ∈ ΛBV ([a, b]), to f jest funkcją ograniczoną na [a, b].
Dowód. Własność (a) jest oczywista. Dla dowodu (b) ustalmy dowolny zbiór S∞ =
{[an , bn ] : n ∈ N} ∈
P
∞ ([a, b]).
Następnie określmy dwa zbiory indeksów N1 , N2 ⊂ N w
następujący sposób:
N1 = {k ∈ N : [ak , bk ] ⊂ [a, c]} , N2 = {k ∈ N : [ak , bk ] ⊂ [c, b]} .
Oczywiście zbiory N1 i N2 są rozłączne. Ponadto, istnieje co najwyżej jedna liczba naturalna k0 taka, że c ∈ (ak0 , bk0 ). Wtedy mamy:
∞
X
X
λk |f (bk ) − f (ak )| =
λk |f (bk ) − f (ak )|
k∈N1 ∪N2 ∪{k0 }
k=1
=
X
λk |f (bk ) − f (ak )|
k∈N1
+
X
λk |f (bk ) − f (ak )| + λk0 |f (bko ) − f (ak0 )|
k∈N2
¬

X

+
λk |f (bk ) − f (ak )| + λk0 |f (bk0 ) − f (c)|

k∈N1

X





λk |f (bk ) − f (ak )| + λk0 |f (c) − f (ak0 )|

k∈N2
¬ VarΛ (f ; [a, c]) + VarΛ (f ; [c, b]) .
Stąd otrzymujemy nierówność z (b). Dowód własności (c) jest trywialny i dlatego go
pomijamy.
76
Dla dowodu (d) ustalmy nieskończony zbiór S∞ = {[an , bn ] : n ∈ N} ∈
Wtedy mamy
∞
X
P
∞ ([a, b]).
λn |f (bn ) + g(bn ) − f (an ) + g(an )|
n=1
¬
∞
X
λn |f (bn ) − f (an )| +
n=1
∞
X
λn |g(bn ) − g(an )| .
n=1
Stąd
VarΛ (f + g) ¬ VarΛ (f ) + VarΛ (g) .
W przypadku, gdy f, g ∈ ΛBV ([a, b]), z powyższej nierówności otrzymujemy
VarΛ (f ) = VarΛ [(f − g) + g] ¬ VarΛ (f − g) + VarΛ (g) ,
i stąd
VarΛ (f ) − VarΛ (g) ¬ VarΛ (f − g) .
W podobny sposób, wykorzystując własność (c) dla µ = −1, dostajemy
VarΛ (g) − VarΛ (f ) ¬ VarΛ (f − g) .
Dowodzi to w pełni własności (d).
Dla dowodu (e), znowu ustalmy nieskończony zbiór S∞ = {[an , bn ] :
P
∞ ([a, b]).
n ∈ N} ∈
Ponieważ Λ = (λn ) jest malejący, dostajemy
∞
X
n=1
λn |f (bn ) − f (an )| ¬ λ1
∞
X
|f (bn ) − f (an )| ¬ λ1 Var(f ; [a, b]) .
n=1
Z oszacowania tego wynika własność (e). Dla dowodu (f) załóżmy, że f ∈ ΛBV ([a, b])
ale f nie jest ograniczona na przedziale [a, b]. Wtedy istnieje ciąg (un ) ⊂ [a, b] taki, że
|f (un )| → ∞. Ponieważ (un ) jest ograniczony, to można wybrać podciąg (vn ) ciągu (un )
taki, że vn → x dla pewnego x ∈ [a, b]. Oczywiście wtedy |f (vn )| → ∞ gdy n → ∞.
Następnie, z ciągu (vn ) można wybrać ciąg monotoniczny (wn ), gdzie |f (wn )| → ∞ oraz
wn → x. Dalej, z ciągu (wn ) wybieramy podciąg (zn ) taki, żeby |f (zn+1 )| ­ 1 + |f (zn )|
dla n = 1, 2, ....
Weźmy teraz pod uwagę ciąg przedziałów [z1 , z2 ], [z2 , z3 ], ..., który tworzy zbiór S∞ ∈
P
∞ ([a, b]).
Obliczając wariację Watermana (5.1) ze względu na S∞ , otrzymujemy
VarΛ (f, S∞ ) =
∞
X
λn |f (zn+1 ) − f (zn )|
n=1
77
­
∞
X
λn [|f (zn+1 )| − |f (zn )|] ­
n=1
∞
X
λn = ∞ .
n=1
Ale przeczy to faktowi, że na podstawie przyjętego założenia f ∈ ΛBV ([a, b]) i kończy
dowód.
Zwróćmy teraz uwagę na to, że własności (e) i (f) z powyższego twierdzenia mogą być
zapisane w postaci następujących inkluzji
BV ([a, b]) ⊂
\
[
ΛBV ([a, b]) ,
Λ
ΛBV ([a, b]) ⊂ B([a, b]) ,
(5.3)
Λ
gdzie przecięcie i sumę bierzemy po wszystkich ciągach Watermana Λ. Do zależności (5.3)
wrócimy później.
Twierdzenie 5.4. Następujące trzy warunki są równoważne
(a) Funkcja f należy do ΛBV ([a, b]).
(b) Istnieje stała M > 0 taka, że
VarΛ (f, S∞ ) =
∞
X
λk |f (bk ) − f (ak )| ¬ M
k=1
dla każdego zbioru nieskończonego S∞ = {[ak , ak ] : k ∈ N} ∈
P
∞ ([a, b]).
(c) Istnieje stała N > 0 taka, że
VarΛ (f, S) =
n
X
λi |f (bi ) − f (ai )| ¬ N
i=1
dla każdego zbioru skończonego S = {[a1 , b1 ], ..., [an , bn ]} ∈
P
([a, b]).
Dowód. Równoważność (a) i (b) jest prostą konsekwencją przyjętej definicji.
Fakt, że (c) implikuje (b) wynika z warunku koniecznego i wystarczającego zbieżności
szeregu o wyrazach nieujemnych. Zatem, należy tylko udowodnić, że (b) implikuje (c).
Załóżmy więc, że spełniony jest warunek (b) ale nie jest spełniony warunek (c). Oznacza to, że dla każdej liczby N > 0 istnieje skończony zbiór S = {[a1 , b1 ], ..., [an , bn ]} ∈
P
([a, b]) taki, że
n
X
λi |f (bi ) − f (ai )| > N .
i=1
78
Biorąc N = 2M , gdzie M jest stałą występującą w (b), znajdziemy skończony zbiór
SM = {[a1 , b1 ], ..., [an , bn ]} ∈
P
([a, b]) taki, że
VarΛ (f, SM ) =
n
X
λi |f (bi ) − f (ai )| > 2M .
i=1
Teraz, rozróżnimy dwa możliwe przypadki.
Załóżmy najpierw, że
[a1 , b1 ] ∪ [a2 , b2 ] ∪ ... ∪ [an , bn ] = [a, b] .
∗
Rozważmy nieskończony zbiór S∞
= {[αi , βi ] : i = n, n + 1, n + 2, ...} ∈
P
∞ ([an , bn ]),
gdzie pierwszy przedział jest taki, że
α n = an , β n =
an + b n
.
2
0
= {[a1 , a2 ], ..., [an−1 , bn−1 ]}, otrzymamy
Dołączając do tego zbioru zredukowany zbiór SM
nieskończony zbiór
0
∗
SM
∪ S∞
= {[a1 , b1 ], ..., [an−1 , bn−1 ], [αn , βn ], [αn+1 , βn+1 ], ...} ∈
P
∞ ([a, b])
.
Na podstawie założenia (b), mamy
0
∗
VarΛ (f, SM
∪ S∞
)=
n−1
X
λk |f (bk ) − f (bk−1 )|
k=1
+
∞
X
λk |f (βk ) − f (αk )| ¬ M .
k=n
Stąd, uwzględniając tylko pierwsze n składników w ostatniej sumie, otrzymujemy
n−1
X
λk |f (bk ) − f (ak )| + λn |f ((an + bn )/2) − f (an )| ¬ M .
(5.4)
k=1
∗∗
Podobnie, możemy rozważyć nieskończony zbiór S∞
= {[γi , δi ] : i = n, n + 1, n +
2, ...} ∈
P
∞ ([a, b]),
gdzie pierwszy składnik [γn , δn ] ma końce określone równościami
γn =
an + b n
, δ n = bn .
2
0
Dodając znowu do tego zbioru zredukowany zbiór SM
, otrzymujemy zbiór nieskończony
postaci
0
∗∗
SM
∪ S∞
= {[a1 , b1 ], ..., [an−1 , bn−1 ], [γn , δn ], [γn+1 , δn+1 ], ...} ∈
79
P
∞ ([a, b])
.
Stosując podobne rozumowanie jak wcześniej, otrzymujemy oszacowanie
n−1
X
λk |f (bk ) − f (ak )| + λn |f (bn ) − f ((an + bn )/2)| ¬ M .
(5.5)
k=1
Łącząc oszacowania (5.4) i (5.5) i kładąc cn = (an + bn )/2, dostajemy
n−1
X
2
λk |f (bk ) − f (ak )| + λn |f (bn ) − f (an )|
k=1
¬2
n−1
X
λk |f (bk ) − f (ak )| + λn |f (bn ) − f (cn )| + λn |f (cn ) − f (an )|
k=1
=
n−1
X
λk |f (bk ) − f (ak )| + λn |f (bn ) − f (cn )|
k=1
+
n−1
X
λk |f (bk ) − f (ak )| + λn |f (cn ) − f (an )| ¬ 2M ,
k=1
co jest sprzeczne z naszym doborem SM .
Teraz załóżmy, że mamy ścisłą inkluzję
[a1 , b1 ] ∪ [a2 , b2 ] ∪ ... ∪ [an , bn ] $ [a, b] .
Wybierzmy przedział [α, β] taki, że
α, β ⊂ [a, b] \ ([a1 , b1 ] ∪ [a2 , b2 ] ∪ ... ∪ [an , bn ])
a następnie weźmy ciąg [an+1 , bn+1 ], [an+2 , bn+2 ], ... niezachodzących na siebie przedziałów
takich, że S∞ = {[aj , bj ] : j = n + 1, n + 2, ...} ∈
P
∞ ([α, β]).
SM ∪ S∞ = {[ak , bk ] : k ∈ N} ∈
otrzymujemy
VarΛ (f, SM ∪ S∞ ) =
∞
X
Wtedy dla sumy
P
∞ ([a, b])
λk |f (bk ) − f (ak )|
k=1
=
n
X
λk |f (bk ) − f (ak )| +
k=1
∞
X
λk |f (bk ) − f (ak )| ¬ M .
k=n+1
Stąd wynika, że
VarΛ (f, SM ) =
n
X
λi |f (bi ) − f (ai )| ¬ M ,
i=1
co jest sprzeczne z doborem SM .
80
Zatem w obydwu rozważanych przypadkach dowód jest zakończony.
Z Twierdzenia 5.4 wynika, że całkowita wariacja Watermana (5.2) może być zdefiniowana następująco
VarΛ (f ) = VarΛ (f ; [a, b]) = sup{VarΛ (f, S; [a, b]) : S ∈
X
([a, b])} .
(5.6)
Twierdzenie 5.5. Zbiór ΛBV ([a, b]) jest przestrzenią liniową. Wielkość
||f ||ΛBV = |f (a)| + VarΛ (f ; [a, b])
(5.7)
określona na ΛBV ([a, b]) jest normą oraz ΛBV ([a, b]) z tą normą jest przestrzenią Banacha.
Dowód. Fakt, że zbiór ΛBV ([a, b]) jest przestrzenią liniową jest konsekwencją Twierdzenia 5.3(c) i (d). Sprawdzenie, że wielkość (5.7) jest normą w ΛBV ([a, b]) jest łatwe i opiera
się o wspomniane własności (c) i (d) Twierdzenia 5.3.
Pokażemy, że norma (5.7) jest zupełna. W tym celu załóżmy, że (fn ) jest ciągiem
Cauchy’ego względem normy (5.7). Dla zadanej liczby ε > 0 dobierzmy no ∈ N tak, żeby
|fn (a) − fm (a)| ¬ ε
(5.8)
VarΛ (fn − fm ) ¬ ε
(5.9)
oraz
dla m, n ­ n0 . Z (5.8) wnioskujemy, że ciąg (fn (a)) jest zbieżny do pewnej liczby, którą
oznaczymy przez f (a). Z drugiej strony, z (5.9) wynika, że dla każdego nieskończonego
zbioru S∞ = {[an , bn ] : n ∈ N} ∈
VarΛ (fn − fm , S∞ ) =
P
∞
X
∞ ([a, b])
mamy
λk |fn (bk ) − fm (bk ) − fn (ak ) + fm (ak )| ¬ ε .
k=1
W szczególności, dla każdej liczby x ∈ [a, b], spełniona jest nierówność
λ1 |fn (x) − fm (x)| − λ1 |fn (a) − fm (a)|
¬ λ1 |[fn (x) − fm (x)] − [fn (a) − fm (a)]| ¬ ε .
Łacząc powyższą nierówność z (5.8), otrzymujemy oszacowanie
|fn (x) − fm (x)| ¬ ε
81
1 + λ1
,
λ1
które pokazuje, że ciąg funkcyjny (fn ) jest jednostajnie zbieżny do pewnej funkcji ograniczonej f na przedziale [a, b]. Dalej zauważmy, że z nierówności (5.9) oraz z nierówności
zawartej w punkcie (d) Twierdzenia 5.3 wynika, że
|VarΛ (fn ) − VarΛ (fm )| ¬ VarΛ (fn − fm ) ¬ ε
dla n, m ­ n0 , a zatem ciąg (VarΛ (fn )) ma granicę w R.
Teraz, ustalmy dowolnie skończony zbiór S = {[a1 , b1 ], ..., [ap , bp ]} ∈
P
([a, b]). Z defi-
nicji funkcji f wnioskujemy, że dla n odpowiednio dużych, mamy
p
X
λi |f (bi ) − f (ai )| ¬
i=1
p
X
λi |fn (bi ) − fn (ai )| + ε ¬ VarΛ (fn ) + ε .
i=1
Stąd, przechodząc z n → ∞, otrzymujemy
VarΛ (f ) ¬ lim VarΛ (fn ) ,
n→∞
a więc f ∈ ΛBV ([a, b]).
Odwołując się jeszcze raz do własności Cauchy’ego (5.9) ciągu (fn ), do liczby ε > 0
dobieramy n0 ∈ N takie, że dla każdego nieskończonego zbioru S∞ = {[ak , bk ] : k ∈ N} ∈
P
∞ ([a, b]),
mamy
VarΛ (fn − fm , S∞ ) =
∞
X
λk |fn (bk ) − fm (bk ) − fn (ak ) + fm (ak )| ¬ ε ,
k=1
dla n, m ­ n0 . Przechodząc z m → ∞ i biorąc supremum ze względu na zbiory S∞ ,
dostajemy
VarΛ (fn − f ) ¬ ε .
Z drugiej strony, przechodząc z m → ∞ w (5.8) również otrzymujemy |fn (a) − f (a)| ¬ ε,
co w połączeniu z powyższą nierównością pozwala wywnioskować, że ||fn − f ||ΛBV → 0
przy n → ∞ i kończy dowód.
Jak już wcześniej zapowiadaliśmy, inkluzje (5.3) między przestrzeniami BV ([a, b]),
ΛBV ([a, b]) i R([a, b]) można ”doprecyzować”. Rzeczywiście, w dalszym ciągu pokażemy,
że mają miejsce równości
\
ΛBV ([a, b]) = BV ([a, b]) ,
Λ
[
ΛBV ([a, b]) = R([a, b]) .
(5.10)
Λ
Najpierw jednak koniecznym będzie podanie szeregu lematów o charakterze technicznym.
82
Lemat 5.6. Niech (αn ) będzie ciągiem liczb dodatnich zmierzającym do zera. Wtedy istnieje ciąg Watermana Λ = (λn ) taki, że
∞
X
αn λn < ∞ .
(5.11)
n=1
Dowód. Oznaczmy n0 = 0 i wybierzmy liczbę naturalną n1 tak, żeby αn ¬
1
2
dla n ­ n1 .
Połóżmy λn = 1/n dla n0 < n ¬ n1 . Załóżmy, że wybraliśmy liczby naturalne n1 , n2 , ..., nk
w taki sposób, że n1 < n2 < ... < nk , αn ¬
1
2k
dla n ­ nk oraz λn = 1/(nk − nk−1 ) dla
nk−1 < n ¬ nk . Wtedy wybieramy następną liczbę naturalną nk+1 tak, że nk+1 ­ nk + k,
nk+1 − nk ­ 1/λnk i αn < 1/2k+1 dla n ­ nk+1 . Ponadto przyjmujemy, że
1
nk+1 − nk
λn =
dla nk < n ¬ nk+1 .
Z konstrukcji wynika, że dla nk < n ¬ nk+1 mamy
λn =
1
1
< λnk , λn ¬ .
nk+1 − nk
k
Zatem (λn ) jest ciągiem malejącym i zbieżnym do zera. Ponadto mamy
nk+1
X
λn = 1 .
n=nk +1
co pokazuje, że
∞
X
λn = ∞ .
n=1
Z drugiej strony, mamy
nk+1
nk+1
nk+1
X
X
X
1
1
αn λn ¬
λn = k
k
2
n=nk +1
n=nk +1 2
n=nk +1
λn =
1
2k
co pokazuje, że ma miejsce (5.11) i kończy dowód.
Dla zilustrowania przeprowadzonej w powyższym dowodzie konstrukcji weźmy ciąg
αn =
1
.
n
Wtedy ciąg Watermana Λ = (λn ) skonstruowany w dowodzie Lematu 5.6 ma
postać
Λ=
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
, , , , , , , , , , , , , , , ...
2 2 4 4 4 4 8 8 8 8 8 8 8 8 16
83
.
Ponadto, mamy
∞
X
∞
X
∞
X
1
1
α n λn ¬
2 · 2k =
<∞.
k
2
n=1
k=1
k=1 2
k
Lemat 5.7. Niech (λn ) będzie malejącym ciągiem liczb dodatnich. Jeżeli (δn ) jest ciągiem liczb dodatnich zmierzającym do zera oraz (δ̂n ) oznacza ciąg (δn ) uporządkowany w
kierunku malejącym, to
∞
X
n
X
λ k δk ¬
k=1
λn δ̂k
k=1
dla n = 1, 2, ....
Dowód. Ustalmy n ∈ N i rozważmy zbiór {δ1 , δ2 , ..., δn }. Niech δ10 ­ δ20 ­ ... ­ δn0 oznacza
elementy tego zbioru uporządkowane w kierunku malejącym. Wtedy, z dobrze znanego
lematu kombinatorycznego otrzymujemy
n
X
λk δk ¬
X
λk δk0 .
k=1
k=1
Oczywiście δk0 ¬ δ̂k dla k = 1, 2, ..., n. Stąd otrzymujemy nierówność z tezy lematu.
Twierdzenie 5.8. Niech g : [c, d] → R będzie zadaną funkcją i niech τ : [a, b] → [c, d]
będzie funkcją ciągłą i ściśle rosnącą oraz taką, że τ (a) = c, τ (b) = d. Wtedy g ◦ τ ∈
ΛBV ([a, b]) wtedy i tylko wtedy, gdy g ∈ ΛBV ([c, d]).
Dowód. Załóżmy, że g ∈ ΛBV ([c, d]) i weźmy S∞ = {[an , bn ] : n ∈ N} ∈
P
Z założenia dotyczącego τ mamy, że τ (S∞ ) = {[τ (an ), τ (bn )] : n ∈ N} ∈
P
∞ ([a, b]).
∞ ([c, d]).
Ponieważ g ∈ ΛBV ([c, d]), więc mamy
VarΛ (g ◦ τ, S∞ ; [a, b]) =
∞
X
λn |(g ◦ τ )(bn ) − (g ◦ τ )(an )|
n=1
=
∞
X
λn |g(τ (bn )) − g(τ (an ))| = VarΛ (g, τ (S∞ ); [c, d]) < ∞ ,
n=1
co pokazuje, że g ◦ τ ∈ ΛBV ([a, b]) po przejściu do kresu górnego względem S∞ ∈
P
∞ ([a, b]).
Stosując to samo rozumowanie do funkcji τ −1 : [c, d] → [a, b] dowodzimy
implikacji odwrotnej.
Następne twierdzenie będzie pokazywać, że każda funkcja ciągła f : [a, b] → R należy
do pewnej przestrzeni Watermana ΛBV ([a, b]).
84
Twierdzenie 5.9. Każda funkcja f ∈ C([a, b]) należy do przestrzeni ΛBV ([a, b]) dla
pewnego ciągu Watermana Λ.
Dowód. Niech f ∈ C([a, b]). Dla dowolnej liczby δ > 0 oznaczymy przez ω∞ (f ; δ) moduł
ciągłości funkcji f zdefiniowany następująco:
ω∞ (f ; δ) = ω∞ (f, [a, b]; δ) = sup {|f (x + h) − f (x)| : a ¬ x ¬ b − h} .
(5.12)
0¬h¬δ
Oczywiście moduł ciągłości ω∞ (f ; δ) jest funkcją rosnącą na przedziale [0, b − a] i
ω∞ (f ; δ) → 0 przy δ → 0, ponieważ f jest jednostajnie ciągła na [a, b].
Niech In = [an , bn ] będzie ciągiem niezachodzących na siebie podprzedziałów przedziału [a, b]. Będziemy używać oznaczenia:
|f (In )| = |f (bn ) − f (an )| .
Dla ustalonego m ∈ N połóżmy
(
Em = Ik : ω∞
b−a
f;
m+1
!
< |f (Ik )| ¬ ω∞
b−a
f;
m
!)
.
Zauważmy, że w przypadku gdy |bk − ak | ¬ (b − a)/m, mamy
|f (Ik )| = |f (bk ) − f (ak )| ¬ ω∞ (f ; |bk − ak |) ¬ ω∞
b−a
f;
m
!
,
więc Ik ∈ Em tylko wtedy, gdy bk − ak > (b − a)/(m + 1). Ponieważ przedziały Ik są
niezachodzące i zawarte w [a, b], więc stąd wnioskujemy, że Em może zawierać co najwyżej
m przedziałów.
Ponadto, jeżeli Ip ∈ Er i Iq ∈ Er+s , to wtedy
|f (Iq )| ¬ ω∞
b−a
f;
r+s
!
¬ ω∞
b−a
f;
r+1
!
< |f (Iq )| .
Zatem, krok po kroku, możemy wybrać ciąg (Jn ) przedziałów Jk ∈ Ek takich, że
|f (J1 )| ­ |f (J2 )| ­ · · · ­ |f (Jn )| ­
→0
przy n → ∞.
Pokażemy teraz, że
|f (Jn )| ¬ ω∞
85
b−1
f;
n
!
(5.13)
dla n = 1, 2, .... W tym celu załóżmy, że dla m ∈ N zachodzi
b−a
f;
m
|f (Jm )| > ω∞
!
.
Wtedy
b−a
f;
m
|f (J1 )| ­ |f (J2 )| ­ · · · ­ |f (Jm )| > ω∞
!
.
Stąd wynika, że |Jk | > (b−a)/m dla k = 1, 2, ..., m, co jest niemożliwe, ponieważ wszystkie
przedziały J1 , J2 , ..., Jm są niezachodzące na siebie i zawarte w przedziale [a, b]. Dowodzi
to nierówności (5.13). Dalej, uwzględniając to, że ω∞ (f ; (b − a)/k) → 0 przy k → ∞,
możemy zastosować Lemat 5.6, żeby dla ciągu
αn = ω∞
b−a
f;
n
!
(n = 1, 2, ....)
znaleźć malejący ciąg Λ = (λn ) liczb dodatnich, zmierzający do zera i taki, że
∞
X
λn = ∞ ,
∞
X
λn ω∞
n=1
n=1
b−a
f;
n
!
<∞.
Teraz, stosując Lemat 5.7 do ciągu δn = |f (In )|, otrzymujemy
∞
X
n=1
λn |f (In )| ¬
∞
X
λn |f (Jn )| ¬
∞
X
λn ω∞
n=1
n=1
b−a
f;
n
!
<∞.
Oznacza to jednak, że f ∈ ΛBV ([a, b]) dla Λ = (λn ), co kończy dowód.
Zauważmy, że rezultat zawarty w powyższym twierdzeniu możemy zapisać następująco:
C([a, b]) ⊂
[
BV ([a, b]) ,
(5.14)
Λ
gdzie sumowanie rozciąga się na wszystkie ciągi Watermana.
Udowodnimy teraz anonsowane wcześniej równości (5.10).
Twierdzenie 5.10. Mają miejsce równości (5.10).
Dowód. Zauważmy, że mając na uwadze inkluzje (5.3), dla dowodu pierwszej równości
w (5.10) wystarczy pokazać, że
BV ([a, b]) ⊃
\
Λ
86
ΛBV ([a, b]) .
W tym celu ustalmy dowolny ciąg Watermana Λ = (λn ) i weźmy funkcję f ∈ ΛBV ([a, b]).
Wiemy, że wtedy f jest ograniczona.
Oznaczmy:
m(f ) = inf{f (x) : x ∈ [a, b]} , M (f ) = sup{f (x) : x ∈ [a, b]} .
Oczywiście m(f ), M (f ) są skończone. Połóżmy
F (x) =
f (x) − m(f )
M (f ) − m(f )
(a ¬ x ¬ b) .
Mamy, że 0 ¬ F (x) ¬ 1 dla a ¬ x ¬ b. Oczywiście, tak jak funkcja f , również funkcja F
należy do przestrzeni ΛBV ([a, b]). W związku z tym możemy założyć, że
0 ¬ f (x) ¬ 1 (x ∈ [a, b]) .
Przypuśćmy, że f 6∈ BV ([a, b]). Wtedy, na podstawie zasady lokalizacji (por. Zad. 6,
Rozdz. 2) znajdziemy punkt x ∈ [a, b] taki, że f ma nieograniczoną wariację w każdym
otoczeniu punktu x (zrelatywizowanym do przedziału [a, b]).
Wybierzmy teraz skończony podział P1 przedziału [a, b] taki, że
X
|f (I)| ­ 3 .
(5.15)
I∈P1
Punkt x znajdzie się we wnętrzu pojedynczego przedziału podziału P1 albo jest końcem
dwóch przedziałów z P1 albo też początkiem lub końcem jednego przedziału z P1 . Jeżeli
usuniemy te pojedyncze przedziały lub dwa przedziały z P1 i oznaczymy przez Q1 zbiór
pozostałych przedziałów, to wtedy na podstawie (5.15) mamy
X
|f (I)| ­ 1 .
I∈Q1
Jeżeli podział Q1 zawiera q1 przedziałów, będziemy pisać Q1 = {Ik1 : k = 1, 2, ..., q1 }.
Teraz, zdefiniujmy
λ1 = λ2 = · · · = λq1 = 1 .
Wtedy
q1
X
λk |f (Ik1 )| ­ 1 .
k=1
Kończy to pierwszy krok w naszej definicji.
87
Załóżmy dalej, że skonstruowaliśmy Pn i Qn w taki właśnie sposób. Wtedy, stosując zasadę indukcji matematycznej, postępujemy dalej w następujący sposób: Przede wszystkim
zauważmy, że jeden lub dwa przedziały usunięte z Pn dla utworzenia Qn tworzą otoczenie
Un liczby x. Ponieważ f ma nieograniczoną wariację na Un , wnosimy, że istnieje skończony
podział Pn+1 zbioru Un taki, że
X
|f (I)| ­ 3 .
I∈Pn+1
Odnotujmy następnie, że i tym razem punkt x jest albo punktem wewnętrznym pojedynczego przedziału zawartego w Pn+1 albo punktem końcowym dwóch przedziałów w Pn+1
albo x = a lub x = b dla pewnego przedziału w Pn+1 . Jeżeli teraz odrzucimy z Pn+1
ten pojedynczy przedział lub wspomniane dwa przedziały i oznaczymy przez Qn+1 zbiór
pozostałych przedziałów, to wykorzystując znowu (5.15) otrzymamy, że
X
|f (I)| ­ 1 .
I∈Qn+1
Jeżeli Qn+1 zawiera qn+1 przedziałów, to piszemy, że Qn+1 = {Ikn+1 : k = 1, 2, ..., qn+1 } a
następnie definiujemy
λrn +1 = λrn +2 = · · · = λrn +qn =
1
,
n+1
gdzie rn = q1 + q2 + · · · + qn i q0 = 0. Wtedy mamy
qn+1
X
λrn +k |f (Ikn+1 )| ­
k=1
1
.
n+1
Teraz zauważmy, że wszystkie przedziały z Qn+1 zawarte w Un są parami niezachodzące
na siebie. Stąd wnioskujemy, że
qi
n+1
XX
λri−1 +k |f (Iki )| ­
i=1 k=1
n+1
X
i=1
1
.
i
W ten sposób skonstruowaliśmy liczby rzeczywiste {λk : k = 1, 2, 3, ...} i niezachodzące na siebie podprzedziały {Ikn : k = 1, 2, ..., qn ; n = 1, 2, ...} przedziału [a, b] takie, że
(λk ) jest ciągiem malejącym i zmierzającym do zera oraz
∞
X
k=1
λk = ∞ ,
qi
∞ X
X
λri−1 +k |f (Iki )| = ∞ .
i=1 k=1
88
To jednak oznacza, że Λ = (λk ) jest ciągiem Watermana i f nie należy do odpowiedniej
przestrzeni ΛBV ([a, b]). Jest to sprzeczne z założeniem i kończy dowód pierwszej równości
w (5.10).
Udowodnimy teraz drugą równość. Dokładniej, pokażemy, że każda funkcja f ∈
ΛBV ([a, b]) ma granicę lewostronną w każdym punkcie przedziału (a, b). Dowód dla granicy prawostronnej jest analogiczny.
Niech więc f ∈ ΛBV ([a, b]). Załóżmy, że istnieje punkt x ∈ (a, b) taki, że f nie ma w
x granicy lewostronnej. Oznacza to, że
l = lim inf
f (t) < lim sup f (x) = L .
−
t→x
t→x−
Niech δ = (L − l)/3 i wybierzmy ciągi (pn ) i (Pn ) takie, że P1 < P2 < · · · → x, p1 < p2 <
· · · → x oraz
f (pn ) → l , f (Pn ) → L , f (pn ) ¬ l + δ , f (Pn ) ­ L − δ .
Następnie, wybierzmy podciąg (Qn ) ciągu (Pn ) i podciąg (qn ) ciągu (pn ) tak, że q1 <
Q1 < q2 < Q2 < · · · . Wtedy przedziały [qm , Qm ] i [qn , Qn ] są rozłączne dla m 6= n oraz
spełniają nierówności
|f (Qn ) − f (qn )| ­ f (Qn ) − f (qn ) ­ (L − δ) − (l + δ) ­ 3δ − 2δ = δ .
Stąd wynika, że
∞
X
λn |f (Qn ) − f (qn )| ­ δ
∞
X
λn = ∞ .
n=1
n=1
Pokazuje to, że f 6∈ ΛBV ([a, b]) i przeczy naszemu założeniu.
Pozostało do pokazania, że każda regularna funkcja należy do ΛBV ([a, b]) dla odpowiedniego ciągu Watermana Λ = (λn ). W tym celu, skorzystamy z twierdzenia Sierpińskiego (Twierdzenie 1.11). Zgodnie z tym twierdzeniem istnieją ściśle rosnąca funkcja
τ : [a, b] → [c, d] oraz ciągła funkcja g : [c, d] → R takie, że f = g ◦ τ . Zauważmy, że
funkcja afiniczna zadana wzorem
l(t) =
b−a
(t − c) + a
d−c
jest ściśle rosnącym homeomorfizmem między przedziałami [c, d] i [a, b]. Dlatego złożenie
l ◦ τ : [a, b] → [a, b] jest także ściśle rosnące oraz g ◦ l−1 : [a, b] → R jest funkcją ciągłą. Z
Twierdzenia 5.9 wnioskujemy, że g ◦ l−1 ∈ ΛBV ([a, b]) dla pewnego ciągu Watermana Λ.
89
Z drugiej strony, z Twierdzenia 5.8 wynika, że f = (g ◦ l−1 ) ◦ (l ◦ τ ) należy do przestrzeni
ΛBV ([a, b]). To kończy dowód.
W dalszym ciągu zajmiemy się pokazaniem, że w definicji wariacji całkowitej Watermana możemy ograniczyć się do dość szczególnych zbiorów S∞ ∈
W tym celu oznaczmy symbolem
d
S∞
Pd
∞ ([a, b])
P
∞ ([a, b]).
rodzinę wszystkich nieskończonych zbiorów
= {[an , bn ] : n ∈ R} niezachodzących na siebie podprzedziałów przedziału [a, b] z
dodatkową własnością, że ciąg (δn ) określony równością
δn = |f (bn ) − f (an )| (n = 1, 2, ...)
(5.16)
jest malejący i zbieżny do zera.
Do dowodu tego faktu będziemy potrzebować pewnego lematu pomocniczego dotyczącego
funkcji regularnych.
Lemat 5.11. Niech S∞ = {[an , bn ] :
n ∈ N} ∈
P
∞ ([a, b])
będzie (skończonym lub
nieskończonym) zbiorem przedziałów i niech f ∈ R([a, b]). Wtedy można przedziały [an , bn ]
uporządkować w taki sposób, że |f (bn ) − f (an )| ­ |f (bn+1 ) − f (an+1 )| dla n ∈ N.
Dowód. Ponieważ f jest regularna, to stosując twierdzenie Sierpińskiego (Twierdzenie
1.11) można znaleźć funkcję ściśle rosnącą τ : [a, b] → [c, d] (gdzie c = τ (a), d = τ (b)) i
funkcją ciągłą g : [c, d] → R takie, że f = g◦τ . Rozważmy teraz zbiór przedziałów τ (S∞ ) =
{[τ (an ), τ (bn )] : n ∈ N}, który należy do
P
∞ ([c, d]).
Zauważmy, że ciąg (τ (bn )−τ (an )) jest
zbieżny do zera. Zatem ciąg ten można ustawić w kolejności malejącej, tzn. można znaleźć
ciąg (nk ) liczb nauralnych takich, że ciąg (τ (bnk ) − τ (ank )) jest malejący (i oczywiście
zbieżny do zera).
Teraz, rozważmy ciąg (ηk ) określony równością
ηk = |f (bnk ) − f (ank )| = |g(τ (bnk )) − g(τ (ank ))| .
Z ciągłości funkcji g wynika, że ηk → 0 gdy k → ∞.
Stosując teraz dalsze przenumerowanie, możemy znaleźć ciąg (km ) liczb naturalnych taki,
że (ηkm ) jest malejący. Odpowiadający mu ciąg przedziałów ma własności żądane w tezie
lematu.
Sformułujemy teraz własności wariacji Watermana w terminach zdefiniowanej wcześniej rodziny
Pd
∞ ([a, b]).
90
Twierdzenie 5.12. Niech f ∈ ΛBV ([a, b]). Wtedy
d
d
VarΛ (f ; [a, b]) = sup{VarΛ (f, S∞
; [a, b]) : S∞
∈
Pd
∞ ([a, b])}
.
(5.17)
Dowód. Oznaczmy symbolem VardΛ (f ; [a, b]) wyrażenie po prawej stronie równości (5.17).
Nierówność
VardΛ (f ; [, b]) ¬ VarΛ (f ; [a, b])
wynika stąd, że
Pd
∞ ([a, b])
⊂
P
∞ ([a, b]).
Zatem wystarczy udowodnić nierówność prze-
ciwną do tej wyżej napisanej.
W tym celu ustalmy dowolnie zbiór S∞ = {[an , bn ] : n ∈ N} ∈
P
∞ ([a, b]).
Następnie
rozważmy ciąg (δn ) zdefiniowany równością (5.16). Stosując Lemat 5.11 przedstawimy ciąg
(δn ) w porządku malejącym. W ten sposób, otrzymujemy ciąg (δ̂n ), który na podstawie
Lematu 5.7 spełnia nierówność
n
X
λk |f (bk ) − f (ak )| ¬
k=1
n
X
λk δ̂k
k=1
dla n = 1, 2, .... Stąd wynika, że VarΛ (f ; [a, b]) ¬ VardΛ ([a, b]). Koniec dowodu.
W dalszym ciągu porównamy przestrzenie ΛBV ([a, b]) i M BV ([a, b]) dla różnych ciągów Watermana Λ = (λn ) oraz M = (µn ). Rozpoczniemy od odpowiedniej definicji.
Definicja 5.13. Dla zadanych dwóch rosnących ciągów liczb dodatnich (Ln ) i (Mn ) będziemy pisać, że (Ln ) (Mn ), jeżeli istnieje stała c > 0 taka, że Ln ¬ cMn dla wszystkich
n ∈ N. Jeżeli zarówno (Ln ) (Mn ) jak i (Mn ) (Ln ), to będziemy pisać (Ln ) ∼ (Mn ).
Załóżmy, że Λ = (λn ) i M = (µn ) są dwoma ciągami Watermana. Dla uproszczenia
oznaczeń, jeżeli m, n ∈ N i m ¬ n, to w dalszym ciągu będziemy używać skrótowych
oznaczeń
λ[m, n] =
n
X
λk , µ[m, n] =
k=m
Zauważmy, że np. własność
∞
P
n=1
n
X
µk .
(5.18)
k=m
λn = ∞ ciągu Watermana (λn ) może być zapisana w
postaci λ[1, n] → ∞ przy n → ∞.
Twierdzenie 5.14. Niech Λ = (λn ) i M = (µn ) będą dwoma ciągami Watermana. Wtedy
prawdziwe są następujące stwierdzenia.
91
(a) M BV ([a, b]) ⊂ ΛBV ([a, b]) wtedy i tylko wtedy gdy (λ[1, n]) (µ[1, n]).
(b) M BV ([a, b]) = ΛBV ([a, b]) wtedy i tylko wtedy, gdy (λ[1, n]) ∼ (µ[1, n]).
Dowód. Przypuśćmy, że istnieje stała c > 0 taka, że
λ[1, n] =
n
X
λk ¬ c
k=1
n
X
µk = cµ[1, n]
(5.19)
k=1
dla n = 1, 2, ... .
Ustalmy dowolnie funkcję f ∈ M BV ([a, b]) i nieskończony zbiór S∞ = {[an , bn ] : n ∈
N} ∈
P
∞ ([a, b]).
Połóżmy δn = |f (bn ) − f (an )|. Mając na uwadze Twierdzenie 5.12 może-
my bez straty ogólności założyć, że ciąg (δn ) jest malejący i zmierza do zera. Uwzględniając
tożsamość
n
X
λ k δk =
n−1
X
λ[1, k](δk − δk+1 ) + δn λ[1, n]
k=1
k=1
i korzystając z założeń i (5.19), otrzymujemy
n
X
n−1
X
λk δk ¬ c
k=1
!
µ[1, k](δk − δk+1 ) + δn µ[1, n] = c
k=1
n
X
δk µk .
k=1
Pokazuje to, że f ∈ ΛBV ([a, b]) i kończy dowód pierwszej implikacji w (a).
Dla dowodu drugiej implikacji załóżmy, że (λ[1, n]) 6 (µ[1, n]). Wtedy istnieje ściśle
rosnący podciąg (nk ) ciągu liczb naturalnych takich, że
λ[nk + 1, nk+1 ] ­ 2k µ[nk + 1, nk+1 ] ,
gdzie n0 = 0.
Dla zadanego zbioru S∞ = {[an , bn ] : n ∈ N} ∈
P
∞ ([a, b])
weźmy funkcję f : [a, b] → R
taką, że
δi = |f (bi ) − f (ai )| =
2k µ[n
1
(i = nk + 1, nk + 2, ..., nk+1 ) .
k + 1, nk+1 ]
Zauważmy, że wtedy ciąg (δn ) jest malejący i zmierza do zera przy n → ∞. Ponadto,
mamy
nk+1
X
i=1
δi λ i =
k
X
k
X
λ[nj + 1, nj+1 ]
­
2j−1
δ µ[n + 1, n
2
]
j
j+1
j=0
j=0
= 2k+1 − 1 → ∞ przy k → ∞ ,
92
oraz
nk+1
X
δi µ i =
i=1
k
X
1
¬2.
j
j=0 2
Pokazuje to, że f ∈ M BV ([a, b]) ale f 6∈ ΛBV ([a, b]) i tym samym kończy dowód (a).
Stwierdzenie (b) jest bezpośrednią konsekwencją (a).
Zadania
1. Niech φ : R+ → R+ będzie funkcją Younga oraz niech φ∗ : R → R+ będzie tzw.
sprzężoną funkcją Younga określoną równością φ∗ (t) = sup{st − φ(s) : s ­ 0}.
(a) Pokazać, że ab ¬ φ(a) + φ∗ (b) dla dowolnych a, b ∈ R+ .
(b) Udowodnić, że jeżeli Λ = (λn ) jest ciągiem Watermana takim, że
∞
X
φ∗ (λn ) < ∞
n=1
to W BVφ ([a, b]) ⊂ ΛBV ([a, b]) .
2. Znaleźć warunki nałożone na ciąg Watermana Λ = (λn ) i na funkcję Younga φ takie,
żeby ΛBV ([a, b]) ⊂ W BVφ ([a, b]).
3. Niech Λ = (λn ) będzie ciągiem Watermana. Dla zadanej funkcji f ∈ ΛBV ([a, b])
oznaczmy przez Vf,Λ funkcję określoną na przedziale [a, b] w następujący sposób:
Vf,Λ (x) = VarΛ (f ; [a, x]) .
(a) Pokazać, że Vf,Λ jest funkcją rosnącą na przedziale [a, b].
(b) Pokazać, że jeżli f jest prawostronnie ciągła w punkcie a, to
lim Vf,Λ (x) = 0 .
x→a+
(c) Pokazać, że jeżeli f jest lewostronnie ciągła w punkcie b, to
lim Vf,Λ (x) = VarΛ (f ; [a, b]) .
x→b−
(d) Pokazać, że funkcja Vf,Λ jest ciągła w punkcie x0 ∈ (a, b) wtedy i tylko wtedy,
gdy f jest ciągła w x0 .
93
6. Całka Riemanna-Stieltjesa
Całka Riemanna-Stieltjesa znajduje szerokie zastosowania w teorii prawdopodobieństwa
[3,5]. Jednak podstawowe znaczenie pojęcia całki Riemanna-Stieltjesa polega na tym, że
stwarza ono możliwość bardzo ładnej charakteryzacji przestrzeni sprzężonej do klasycznej
przestrzeni funkcji ciągłych z normą maksimum C([a, b]) [1].
Pojęcie całki Riemanna-Stieltjesa wprowadza się w oparciu o pojęcie funkcji o wariacji
ograniczonej. Warto tutaj zwrócić uwagę na fakt, że teoria całki Riemanna-Stieltjesa może
opierać się bezpośrednio o funkcje o wariacji ograniczonej [6,7] albo też, dzięki twierdzeniu
Jordana o rozkładzie funkcji o wariacji ograniczonej na różnicę dwóch funkcji rosnących,
można wprowadzenie pojęcia całki Riemanna-Stieltjesa nieco uprościć rozpoczynając od
wprowadzenia tej całki względem funkcji rosnącej [1,8].
W prezentacji pojęcia całki Riemanna-Stieltjesa opisywanej w tym rozdziale wybraliśmy właśnie tą drugą drogę tzn. zaczniemy od wprowadzenia pojęcia tej całki względem
funkcji rosnącej.
Załóżmy zatem, że zadana jest funkcja α : [a, b] → R, która jest rosnąca na przedziale
[a, b]. Niech f : [a, b] → R będzie funkcją ograniczoną. Dla zadanego podziału P =
{t0 , t1 , ..., tm } ∈ P([a, b]) rozważmy liczby
mj = inf{f (x) : tj−1 ¬ x ¬ tj } , Mj = sup{f (x) : tj−1 ¬ x ¬ tj }
dla j = 1, 2, ..., m. Liczbę rzeczywistą określoną równością
Lα (f, P ; [a, b]) =
m
X
mj (α(tj ) − α(tj−1 ))
(6.1)
j=1
będziemy nazywać dolną sumą Riemanna-Stieltjesa (dolna RS-suma) funkcji f względem podziału P i funkcji α, podczas gdy liczbę
Uα (f, P ; [a, b]) =
m
X
Mj (α(tj ) − α(tj−1 ))
(6.2)
j=1
będziemy nazywać górną sumą Riemanna-Stieltjesa (górna RS-suma) funkcji f
względem podziału P i funkcji α.
Niżej podane twierdzenie zawiera własność monotoniczności zdefiniowanych sum
względem podziałów.
94
Twierdzenie 6.1. Dla P, Q ∈ P([a, b]) takich, że P ⊂ Q, mają miejsce nierówności:
Lα (f, P ; [a, b]) ¬ Lα (f, Q; [a, b]) ¬ Uα (f, Q; [a, b]) ¬ Uα (f, P ; [a, b]) .
(6.3)
Dowód. Niech dany będzie podział P = {t0 , t1 , ..., tn } ∈ P([a, b]) i niech Q =
{t0 , ..., ti−1 , t∗ , ti , ..., tm } będzie podziałem zawierającym podział P i jeden dodatkowy
punkt t∗ ∈ (ti−1 , ti ). Wtedy mamy
Lα (f, Q; [a, b]) =
i−1
X
mj (α(tj ) − α(tj−1 )) + m∗i−1 (α(t∗ ) − α(ti−1 ))
j=1
+ m∗i (α(ti ) − α(t∗ )) +
m
X
mj (α(tj ) − α(tj−1 )) ,
j=i+1
gdzie
m∗i−1 = inf{f (x) : ti−1 ¬ x ¬ t∗ } ,
m∗i = inf{f (x) : t∗ ¬ x ¬ ti } .
Oczywiście m∗i−1 ­ mi oraz m∗i ­ mi . Stąd otrzymujemy, że
Lα (f, P ; [a, b]) ¬ Lα (f, P ∪ {t∗ }; [a, b]) .
Stosując zasadę indukcji ze względu na liczbę dołączanych punktów, dowodzimy pierwszej nierówności w (6.3). Trzecią nierówność dowodzi się podobnie, podczas gdy druga
nierówność jest trywialna.
Definicja 6.2. Mówimy, że funkcja f ∈ B([a, b]) jest całkowalna w sensie RiemannaStieltjesa (lub RS-całkowalna) względem funkcji rosnącej α na przedziale [a, b], jeżeli
dla każdego ε > 0 istnieje podział P ∈ P([a, b]) taki, że
Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) ¬ ε .
(6.4)
Zbiór wszystkich funkcji RS-całkowalnych względem funkcji rosnącej α na przedziale
[a, b] oznaczać będziemy przez RSα ([a, b]).
Zauważmy, że (zgodnie z definicją) f ∈ RSα ([a, b]) wtedy i tylko wtedy, gdy zachodzi
równość
inf{Uα (f, P ; [a, b]) : P ∈ P([a, b])} = sup{Lα (f, P ; [a, b]) : P ∈ P([a, b])} .
95
(6.5)
Wspólną wartość w (6.5) będziemy oznaczać symbolem
Zb
f (x)dα(x) =
Zb
f dα
a
a
i będziemy nazywać całką Riemanna-Stieltjesa (lub RS-całką) funkcji f względem
funkcji α na przedziale [a, b].
Oczywiście w przypadku α(x) = x, Definicja 6.2 pokrywa się z definicją całki Riemanna.
W tym przypadku będziemy pisać, że f ∈ RS([a, b]) (lub, że f ∈ R([a, b])).
W następnym twierdzeniu zebrane zostały pewne użyteczne własności RS-całki.
Twierdzenie 6.3. Niech α, β : [a, b] → R będą funkcjami rosnącymi na [a, b], λ ∈ R i
niech f, g ∈ RSα ([a, b]). Wtedy mają miejsce następujące własności:
(a) Całka Riemanna-Stieltjesa jest addytywna ze względu na funkcje całkowane, tzn.
f + g ∈ RSα ([a, b]) oraz
Zb
(f + g)dα =
a
Zb
f dα +
a
Zb
gdα .
a
(b) RS-całka jest addytywna ze względu na funkcje, względem których całkujemy, tzn.
jeżeli f ∈ RSα ([a, b]) ∩ RSβ ([a, b]) to f ∈ RSα+β ([a, b]) i zachodzi równość
Zb
f d(α + β) =
a
Zb
f dα +
a
Zb
f dβ .
a
(c) RS-całka jest jednorodna ze względu na całkowane funkcje, tzn.
Zb
(λf )dα = λ
a
Zb
f dα
a
dla λ ∈ R.
(d) RS-całka jest jednorodna ze względu na funkcję względem której całkujemy, tzn.
Zb
f d(λα) = λ
a
Zb
a
dla λ > 0.
96
f dα
(e) RS-całka jest monotoniczna ze względu na funkcje całkowane tzn. jeżeli f (x) ¬ g(x)
na [a, b], to
Zb
f dα ¬
a
Zb
gdα .
a
W szczególności, mają miejsce nierówności
m(f )(α(b) − α(a)) ¬
Zb
f dα ¬ M (f )(α(b) − α(a)) ,
(6.6)
a
gdzie m(f ) = inf{f (x) : a ¬ x ¬ b}, M (f ) = sup{f (x) : a ¬ x ¬ b}.
Dowód. Celem odciążenia oznaczeń będziemy w (6.1) i (6.2) opuszczać przedział [a, b].
(a) Zauważmy, że dla P ∈ P([a, b]) mamy
Lα (f, P ) + Lα (g, P ) ¬ Lα (f + g, P ) ¬ Uα (f + g, P )
¬ Uα (f, P ) + Uα (g, P ) .
(6.7)
Z faktu, że f, g ∈ RSα ([a, b]) wynika, że dla każdego ε > 0 możemy znaleźć podziały
Pf , Pg ∈ P([a, b]) takie, że
Uα (f, Pf ) − Lα (f, Pf ) ¬ ε , Uα (g, Pg ) − Lα (g, Pg ) ¬ ε .
Dodając powyższe nierówności stronami, otrzymujemy
Uα (f, Pf ) + Uα (g, Pg ) − Lα (f, Pf ) − Lα (g, Pg ) ¬ 2ε .
Teraz, biorąc pod uwagę (6.7) i Twierdzenie 6.1, dostajemy
Lα (f, Pf ) + Lα (g, Pg ) ¬ Lα (f + g, Pf ∪ Pg )
¬ Uα (f + g, Pf ∪ Pg ) ¬ Uα (f, Pf ) + Uα (g, Pg ) .
Stąd, oznaczając P = Pf ∪ Pg , wnioskujemy, że
Uα (f + g, P ) − Lα (f + g, P ) ¬ 2ε ,
a to pokazuje, że f + g ∈ RSα ([a, b]). Dla tego samego podziału P , mamy dalej
Uα (f, P ) ¬
Zb
f dα + ε , Uα (g, P ) ¬
a
Zb
a
97
gdα + ε .
Stąd i z (6.7) otrzymujemy
Zb
(f + g)dα ¬ Uα (f + g, P ) ¬
Zb
f dα +
gdα + 2ε ,
a
a
a
Zb
skąd, wobec dowolności liczby ε, mamy
Zb
(f + g)dα ¬
Zb
f dα +
gdα .
a
a
a
Zb
Zastępując f przez −f oraz g przez −g otrzymujemy nierówność odwrotną, co dowodzi
(a).
Stwierdzenie (b) dowodzimy podobnie, bazując na nierównościach
Lα (f, P ) + Lβ (f, P ) ¬ Lα+β (f, P ) ¬ Uα+β (f, P ) ¬ Uα (f, P ) + Uβ (f, P ) ,
dla każdego P ∈ P([a, b]).
Dowód własności (c) wynika z równości
Lα (λf, P ) = λLα (f, P ) , Uα (λf, P ) = λUα (f, P ) ,
podczas gdy stwierdzenie (d) jest konsekwencją równości
Lλα (f, P ) = λLα (f, P ) , Uλα (f, P ) = λUα (f, P ) ,
które mają miejsce dla λ > 0.
Dla dowodu (e) wystarczy zauważyć, że nierówność f (x) ¬ g(x) w oczywisty sposób
implikuje zarówno nierówność Lα (f, P ) ¬ Lα (g, P ) jak i nierówność Uα (f, P ) ¬ Uα (g, P ).
Oczywiście, druga nierówność w (e) jest konsekwencją pierwszej nierówności z tego stwier
dzenia.
Podamy teraz naturalne rozszerzenie Definicji 6.2 dla funkcji o wariacji ograniczonej.
Twierdzenie 6.3(b) sugeruje, w jaki sposób to rozszerzenie należy zrobić. Mianowicie, jeżeli
α ∈ BV ([a, b]), to bierzemy dowolny rozkład Jordana α = β − γ na różnicę dwóch funkcji
rosnących β, γ : [a, b] → R (np. mogą to być funkcje opisane w dowodzie klasycznego
twierdzenia Jordana, tzn. Twierdzenia 2.6).
Wtedy, całkę Riemanna-Stieltjesa funkcji f ∈ RSβ ([a, b]) ∩ RSγ ([a, b]) definiujemy w następujący sposób
Zb
a
f dα =
Zb
f dβ −
a
Zb
a
98
f dγ .
(6.8)
Z Twierdzenia 6.3(b) wynka, że powyższa definicja nie zależy od wyboru funkcji β i γ.
Podamy teraz inną, równoważną definicję pojęcia całki Riemanna-Stieltjesa w której, podobnie jak to ma miejsce dla klasycznej całki Riemanna, używać będziemy tzw.
punktów pośrednich.
Definicja 6.4. Niech α : [a, b] → R będzie funkcją rosnącą na przedziale [a, b] i niech
f ∈ B([a, b]). Dla zadanego dowolnie podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) wybierzmy
dowolnie zbiór Π = {τ1 , τ2 , ..., τm } złożony z punktów takich, że
a = t0 ¬ τ1 ¬ t1 ¬ · · · ¬ tm−1 ¬ τm ¬ tm = b .
Wtedy sumę
Sα (f, P, Π; [a, b]) =
m
X
f (τj )(α(tj ) − α(tj−1 ))
(6.9)
(6.10)
j=1
będziemy nazywać sumą Riemanna-Stieltjesa (lub RS-sumą).
W dalszym ciągu oznaczenie
A = lim Sα (f, P, Π; [a, b]) ,
µ(P )→0
(6.11)
gdzie µ(P ) oznacza rozmiar podziału P , będziemy rozumieć w następujący sposób: dla
dowolnego ε > 0 istnieje δ > 0 takie, że
|Sα (f, P.Π; [a, b]) − A| ¬ ε
(6.12)
dla każdego podziału P takiego, że µ(P ) ¬ δ i dla każdego zbioru punktów pośrednich
spełniających nierówności (6.9).
Twierdzenie 6.5. Jeżeli istnieje granica (6.11), to f ∈ RSα ([a, b]) oraz
lim Sα (f, P, Π; [a, b]) =
µ(P )→0
Zb
f (x)dα(x) .
a
Dowód. Ustalmy dowolnie liczbę ε > 0. Wtedy, z (6.11), znajdziemy δ > 0 takie, że
A − ε ¬ Sα (f, P, Π; [a, b]) ¬ A + ε
(6.13)
dla każdego podziału P takiego, że µ(P ) ¬ δ. Jeżeli punkty pośrednie τj zmieniają się w
przedziałach [tj−1 , tj ] (j = 1, 2, ..., m), to biorąc odpowiednio kres dolny i górny z wielkości
Sα (f, P, Π; [a, b]), na podstawie (6.13) dostaniemy
99
A − ε ¬ Lα (f, P ; [a, b]) ¬ Uα (f, P ; [a, b]) ¬ A + ε .
Zgodnie z Definicją 6.2 oznacza to, że f ∈ RSα ([a, b]) oraz
Zb
f (x)dα(x) = A ,
a
ponieważ liczba A występująca w (6.11) jest określona jednoznacznie.
Zauważmy, że implikacja odwrotna do stwierdzenia zawartego w Twierdzeniu 6.5 jest
również prawdziwa: dla każdej funkcji f ∈ RSα ([a, b]) granica (6.11) istnieje i jest równa
RS-całce z funkcji f względem funkcji α.
Rzeczywiście, stwierdzenie to jest prostą konsekwencją nierówności
Lα (f, P ; [a, b]) ¬ Sα (f, P, Π; [a, b]) ¬ Uα (R, P ; [a, b]) ,
które zachodzą dla każdej funkcji rosnącej α i dla wszystkich zbiorów punktów pośrednich
Π, dla których ma miejsce (6.9).
Teraz, sformułujemy pewne użyteczne kryteria gwarantujące istnienie całki RiemannaStieltjesa. Niżej podane kryterium będzie konsekwencją Twierdzenia 6.5.
Wniosek 6.6. Niech α : [a, b] → R będzie funkcją rosnącą na [a, b]. Funkcja f ∈
RSα ([a, b]) wtedy i tylko wtedy, gdy dla każdego ε > 0 istnieje δ > 0 takie, że dla dowolnych podziałów P1 , P2 ∈ P([a, b]) takich, że µ(Pi ) ¬ δ (i = 1, 2), mamy
|Sα (f, P1 , Π1 ; [a, b]) − Sα (f, P2 , Π2 ; [a, b])| ¬ ε ,
(6.13)
gdzie Π1 i Π2 są dowolnymi zbiorami punktów pośrednich w podziałach P1 i P2 , odpowiednio.
Dowód. Zawarte w powyższym wniosku stwierdzenie jest bezpośrednią konsekwencją
kryterium Cauchy’ego dotyczącego istnienia granicy (6.11).
Z Wniosku 6.6 możemy także wyprowadzić inną, użyteczną własność całki RiemannaStieltjesa.
100
Twierdzenie 6.7. Jeżeli f ∈ RSα ([a, b]) to f ∈ RSα ([a, c]) oraz f ∈ RSα ([c, b]) dla
każdego c ∈ (a, b). Ponadto, ma miejsce równość
Zb
f (x)dα(x) =
a
Zc
f (x)dα(x) +
a
Zb
f (x)dα(x) .
(6.14)
c
Dowód. Dla zadanego ε > 0, na podstawie Wniosku 6.6, możemy znaleźć liczbę δ > 0
taką, że nierówność (6.13) zachodzi dla dowolnych podziałów P1 , P2 ∈ P([a, b]) takich, że
µ(Pi ) ¬ δ (i = 1, 2) i dla dowolnych zbiorów punktów pośrednich Π1 , Π2 dla podziałów
P1 , P2 , odpowiednio.
Weźmy podziały P10 , P20 ∈ P([a, c]) takie, że µ(P10 ) ¬ δ i µ(P20 ) ¬ δ oraz odpowiednie
zbiory Π01 i Π02 punktów pośrednich. Ponadto, wybierzmy dowolny podział P 00 ∈ P([c, b])
taki, że µ(P 00 ) ¬ δ i odpowiedni zbiór Π00 punktów pośrednich. Wtedy podział Pi =
Pi0 ∪ P 00 ∈ P([a, b]) (i = 1, 2) jest taki, że µ(Pi ) ¬ δ (i = 1, 2) i po zastosowaniu powyżej
wspomnianego warunku, otrzymamy
|Sα (f, P10 , Π01 ; [a, c]) − Sα (f, P20 , Π02 ; [a, c])|
¬ |Sα (f, P1 , Π1 ; [a, b]) − Sα (f, P2 , Π2 ; [a, b])| ¬ ε ,
gdzie Πi = Π0i ∪ Π00 (i = 1, 2). Stąd wnosimy, że f ∈ RSα ([a, c]).
Stwierdzenia, że f ∈ RSα ([c, b]) dowodzi się analogicznie przez rozważenie podziałów
P 0 ∈ P([a, c]) i P100 , P200 ∈ P([c, b]).
Pozostaje udowodnić tylko równość (6.14). Jednakże, każda para podziałów P 0 ∈ P([a, c])
i P 00 ∈ P([c, b]) prowadzi do podziału P = P 0 ∪ P 00 ∈ P([a, b]) takiego, że µ(P ) =
max{µ(P1 ), µ(P2 )}. Dla odpowiednich sum Riemanna-Stieltjesa (związanych ze zbiorami
Π0 , Π00 i Π = Π0 ∪ Π00 ) i dla całek Riemanna-Stieltjesa, mamy wtedy
Sα (f, P, Π; [a, b]) = Sα (f, P 0 , Π0 ; [a, c]) + Sα (f, P 00 , Π00 ; [c, b]) .
Stąd, przechodząc do granicy przy µ(P ) → 0, dostajemy
Zb
a
f (x)dα(x) =
Zc
f (x)dα(x) +
a
Zb
f (x)dα(x) ,
c
co kończy dowód.
101
Okazuje się, że Twierdzenia 6.7 nie można odwrócić w tym sensie, że jeżeli f ∈
RSα ([a, c]) i f ∈ RSα ([c, b]) to stąd nie musi wynikać, że f ∈ RSα ([a, b]) dla a < c < b.
Rozpatrzmy bowiem następujący przykład.
Przykład 6.8. Niech f, α [−1, 1] → R będą funkcjami określonymi w następujący sposób:
f (x) =
α(x) =


0 dla x ∈ [−1, 0]

1 dla x ∈ (0, 1] ,


1 dla x ∈ [−1, 0]

0 dla x ∈ (0, 1] .
Oczywiście f ∈ B([−1, 1]) i α ∈ BV ([−1, 1]). Łatwo pokazać, że f ∈ RSα ([−1, 0]) ∩
RSα ([0, 1]) oraz
Z0
−1
f (x)dα(x) =
Z1
f (x)dα(x) = 0 .
0
Zauważmy dalej, że funkcje f i α mają nieciągłość w tym samym punkcie x = 0. Pokażemy
później, że to implikuje, że f 6∈ RSα ([−1, 1]).
Podamy teraz ważne kryterium na istnienie całki Riemanna-Stieltjesa.
Twierdzenie 6.9. Niech f ∈ B([a, b]) i niech α : [a, b] → R będzie funkcją rosnącą na
[a, b]. Wówczas f ∈ RSα ([a, b]) wtedy i tylko wtedy, gdy dla każdego ε > 0 istnieje δ > 0
takie, że nierówność (6.4) zachodzi dla dowolnego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b])
takiego, że µ(P ) ¬ δ.
Dowód. Załóżmy najpierw, że f ∈ RSα ([a, b]). Ustalmy ε > 0 i dobierzmy δ > 0 tak,
że ma miejsce stwierdzenie z Wniosku 6.6 dla tak dobranego δ. Ustalmy podział P =
{t0 , t1 , ..., tm } ∈ P([a, b]) taki, że µ(P ) ¬ δ, jak również dwa zbiory punktów pośrednich
1
2
Π1 = {τ11 , τ21 , ..., τm
} i Π2 = {τ12 , τ22 , ..., τm
} odpowiadające podziałom P1 = P2 = P .
Wtedy, stosując Wniosek 6.6, otrzymujemy
m
m
X
X
1
2
f (τj )(α(tj ) − α(tj−1 )) −
f (τj )(α(tj ) − α(tj−1 ))
j=1
j=1
= |Sα (f, P, Π1 ; [a, b]) − Sα (f, P, Π2 ; [a, b])| ¬
102
ε
.
2
(6.15)
Następnie, do każdego i ∈ {1, 2, ..., m} dobieramy punkty τi1 , τi2 ∈ [ti−1 , ti ] w taki sposób,
żeby
|f (τi2 ) − f (τi1 )| = f (τi2 ) − f (τi1 ) ­ Mi − mi −
ε
,
2m(α(b) − α(a))
gdzie mi , Mi oznaczają odpowiednio kres górny i kres dolny funkcji f na przedziale [ti−1 , ti ] (i = 1, 2, ..., m). Oczywiście bez straty ogólności możemy tutaj założyć, że
α(a) < α(b). Wtedy, z (6.15) dostajemy
Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) =
m
X
(Mi − mi )(α(ti ) − α(ti−1 ))
i=1
¬
m
X
!
f (τi2 )
−
f (τi1 )
i=1
=
m
X
(f (τi2 )
−
ε
(α(ti ) − α(ti−1 ))
+
2m(α(b) − α(a))
f (τi1 ))(α(ti )
i=1
m
εX
α(ti ) − α(ti−1 )
− α(ti−1 )) +
¬ε
2 i=1 m(α(b) − α(a))
W ten sposób sprawdziliśmy, że nierówność (6.4) zachodzi dla każdej funkcji f ∈
RSα ([a, b]).
Implikacja odwrotna jest oczywista.
Podane niżej twierdzenie opisuje dwie ważne klasy funkcji całkowalnych w sensie
Riemanna-Stieltjesa.
Twierdzenie 6.10.
(a) Jeżeli α ∈ BV ([a, b]) to każda funkcja ciągła f : [a, b] → R jest RS-całkowalna
względem funkcji α.
(b) Jeżeli α ∈ BV ([a, b])∩C([a, b]), to każda funkcja f : [a, b] → R o wariacji ograniczonej na przedziale [a, b] jest RS-całkowalna względem funkcji α i ma miejsce równość
z Twierdzenia 6.5.
Dowód. Biorąc pod uwagę wyżej poczynione obserwacje możemy bez straty ogólności
założyć, że α jest rosnąca i nie jest stała.
(a) Funkcja f , jako funkcja ciągła na [a, b], jest jednostajnie ciągła na przedziale [a, b].
Zatem, dla zadanego ε > 0 możemy znaleźć δ > 0 takie, że |x − y| ¬ δ implikuje, że
|f (x) − f (y)| ¬ ε dla x, y ∈ [a, b].
103
Niech P = {t, t1 , ..., tm } ∈ P([a, b]) będzie podziałem takim, że µ(P ) ¬ δ i niech mj , Mj
będą zdefiniowane tak, jak wcześniej. Wtedy mamy:
m
X
Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) =
(Mj − mj )(α(tj ) − α(tj−1 ))
j=1
¬ε
m
X
(α(tj ) − α(tj−1 )) = ε(α(b) − α(a)) ,
j=1
co pokazuje, że f ∈ RSα ([a, b])
(b) Dla każdego m ∈ N rozważmy podział Pm = {t0 , t1 , ..., tm } taki, że
α(tj ) − α(tj−1 ) =
α(b) − α(a)
(j = 1, 2, ..., m)
m
co jest możliwe ze względu na ciągłość funkcji α. Załóżmy, że f jest rosnąca. Wtedy, stąd
że Mj = f (tj ), mj = f (tj−1 ) otrzymujemy
Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) =
m
α(b) − α(a) X
(f (tj ) − f (tj−1 ))
m
j=1
α(b) − α(a)
[f (b) − f (a)] ¬ ε
(6.16)
m
o ile wybierzemy m dostatecznie duże. To pokazuje, że f ∈ RSα ([a, b]). Teraz, stąd że
=
Lα (f, P ; [a, b]) ¬ Sα (f, P, Π; [a, b]) ¬ Uα (f, P ; [a, b])
dla każdego podziału P ∈ P([a, b]), to szacowanie (6.16) pokazuje, że równość z Twierdzenia 6.5 jest także prawdziwa. Dla dowolnej funkcji α użyjemy znowu argumentacji
związanej z rozkładem Jordana.
Pokażemy teraz, że nieciągłość funkcji α w pewnym punkcie może być zrekompensowana poprzez ciągłość w tym punkcie funkcji f .
Dla większej wygody prowadzenia dalszych rozważań wprowadzimy teraz pewne pojęcie
pomocnicze.
Definicja 6.11. Niech M ⊂ R, c ∈ M i niech f będzie funkcją określoną na pewnym
otoczeniu liczby c. Wtedy granicę
osc(f ; c) = lim+ osc(f ; [c − δ, c + δ]) ,
δ→0
104
(6.17)
gdzie osc(f ; A) = sup f (t) − inf f (t), nazywa się lokalną oscylacją funkcji f w punkcie
c.
t∈A
t∈A
Zauważmy, że dla podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]), nierówność (6.4) może być
zapisana w postaci
m
X
osc(f ; [tj−1 , tj ])(α(tj ) − α(tj−1 )) ¬ ε .
(6.18)
j=1
Twierdzenie 6.12. Załóżmy, że f ∈ RSα ([a, b]) dla pewnej funkcji α ∈ BV ([a, b]). Jeżeli
α jest nieciągła w pewnym punkcie c ∈ (a, b), to wtedy f jest ciągła w punkcie c.
Dowód. Przypuśćmy, że zarówno α jak i f są nieciągłe w punkcie c. Oznacza to w
szczególności, że osc(f ; c) > 0, gdzie symbol osc(f ; c) jest zdefiniowany w (6.17). Dla
funkcji α, możemy rozróżnić kilka rodzajów nieciągłości.
Załóżmy najpierw, że α ma nieciągłość pierwszego rodzaju (skok) w punkcie c, co
oznacza, że α(c−) 6= α(c+). Wtedy możemy znaleźć η > 0 takie, że dla każdego δ > 0
istnieją punkty σ ∈ [a, c) i τ ∈ (c, b] takie, że 0 < τ − σ < δ i |α(τ ) − α(σ)| ­ η. Teraz,
ustalmy podział P = {t0 , t1 , ..., tm } ∈ P([a, b]) o tej własności, że µ(P ) < δ oraz ti−1 = σ
i ti = τ dla pewnego i ∈ {1, 2, ..., m}.
Dalej, wybieramy zbiory K = {ξ1 , ξ2 , ..., ξm } i H = {η1 , η2 , ..., ηm } złożone z punktów
przedziału [a, b] takich, że ξj = ηj ∈ [tj−1 , tj ] dla j 6= i oraz ξi , ηi ∈ [ti−1 , ti ] = [σ, τ ].
Dodatkowo możemy żądać, żeby
1
|f (ξi ) − f (ηi )| ­ osc(f ; c) .
2
Wtedy z konstrukcji mamy
|Sα (f, P, K; [a, b]) − Sα (f, P, H; [a, b])| = (α(τ ) − α(σ))|f (ξi ) − f (ηi )|
η
­ osc(f ; c) > 0
2
dla odpowiednich sum Riemanna-Stieltjesa. Ponieważ δ > 0 było wybrane dowolnie, to z
Wniosku 6.6 otrzymujemy, że f 6∈ RSα ([a, b]), co jest sprzeczne z przyjętym założeniem.
Załóżmy teraz, że α ma nieciągłość usuwalną w punkcie c, co oznacza, że α(c−) =
α(c+) 6= α(c). Wtedy możemy powtórzyć powyższe rozumowanie biorąc σ = c lub τ = c.
Następnie otrzymamy taką samą sprzeczność jak poprzednio i to zakończy nasz dowód.
105
Zauważmy dalej, że wyżej przeprowadzone rozumowanie jest symetryczne względem
α i f . Stąd otrzymujemy następującą wersję poprzedniego twierdzenia.
Twierdzenie 6.13. Niech f ∈ RSα ([a, b]) dla pewnego α ∈ BV ([a, b]). Wtedy, w każdym
punkcie przedziału [a, b] przynajmniej jedna z funkcji α i f jest ciągła.
Zauważmy teraz, że z Twierdzenia 6.3(a) i (c) oraz z równości (6.8) wynika, że zbiór
RSα ([a, b]) jest przestrzenią liniową. W dalszym ciągu pokażemy, że RSα ([a, b]) jest także
algebrą oraz wskażemy na inne, użyteczne własności.
Twierdzenie 6.14. Niech α ∈ BV ([a, b]). Wtedy prawdziwe są następujące stwierdzenia.
(a) Jeżeli f ∈ RSα ([a, b]) oraz f ([a, b]) ⊂ [c, d] i h ∈ C([c, d]), to h ◦ f ∈ RSα ([a, b]).
(b) Jeżeli f, g ∈ RSα ([a, b]), to f g ∈ RSα ([a, b]).
(c) Jeżeli f ∈ RSα ([a, b]), to |f | ∈ RSα ([a, b]).
Dowód. (a) Niech zadana będzie liczba ε > 0. Ponieważ h jest jednostajnie ciągła na [c, d],
więc istnieje δ > 0, δ < ε, takie, że |h(u) − h(v)| ¬ ε dla wszystkich u, v ∈ [c, d] takich, że
|u − v| ¬ δ. Na podstwie założenia możemy znaleźć podział P = {t0 , t1 , ..., tm } ∈ P([a, b])
taki, że
Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) ¬ δ 2 .
(6.19)
Korzystając z wcześniej wprowadzonych oznaczeń na mj oraz Mj i oznaczając przez kj i
Kj analogiczne liczby dla h ◦ f , tzn.
kj = inf{h(f (x)) : tj−1 ¬ x ¬ tj } ,
Kj = sup{h(f (x)) : tj−1 ¬ x ¬ tj } ,
możemy podzielić zbiór liczb {1, 2, 3, ..., m} na dwie rozłączne części I oraz J wliczając j
do zbioru I wtedy, jeśli Mj − mj ¬ δ i wliczając j do J, jeżeli Mj − mj > δ.
Jeżeli j ∈ I, to wtedy z doboru δ wynika, że Kj − kj ¬ ε a więc dostaniemy
X
(Kj − kj )(α(tj ) − α(tj−1 )) ¬ ε
j∈I
X
(α(tj ) − α(tj−1 )) ¬ εVar(α; [a, b]) .
j∈I
Z drugiej strony, dla j ∈ J mamy, że Kj − kj ¬ 2||h||C . Stąd i z (6.19) dostajemy
δ
X
j∈J
(α(tj ) − α(tj−1 )) <
X
(Mj − mj )(α(tj ) − α(tj−1 ))
j∈J
106
(6.20)
¬ Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) ¬ δ 2 .
Stąd
X
(Kj − kj )(α(tj ) − α(tj−1 )) ¬ 2||h||C
j∈J
X
(α(tj ) − α(tj−1 ))
j∈J
¬ 2||h||c δ ¬ 2||h||C ε .
(6.21)
Teraz, z (6.20) i (6.21) wnioskujemy, że
Uα (h ◦ f, P ; [a, b]) − Lα (h ◦ f, P ; [a, b]) ¬ [Var(α; [a, b]) + 2||h||C ] ε ,
co oznacza, że h ◦ f ∈ RSα ([a, b]).
(b) Zauważmy, że
1
f g = [(f + g)2 − (f − g)2 ] .
4
2
Jeżeli teraz wybierzemy h(u) = u i skorzystamy z Twierdzenia 6.3(a) i (c), dostaniemy
tezę naszego stwierdzenia.
(c) Stwierdzenie to wynika z (a), jeżeli weźmiemy h(u) = |u|.
Następnie twierdzenie omawia sytuację, gdy całka Riemanna-Stieltjesa może być zredukowana do całki Riemanna.
Twierdzenie 6.15. Niech α ∈ C 1 ([a, b]) i niech f ∈ RS([a, b]). Wtedy f ∈ RSα ([a, b]) i
ma miejsce równość:
Zb
f (x)dα(t) =
a
Zb
f (t)α0 (t)dt ,
(6.22)
a
gdzie całkę po prawej stronie rozumiemy jak zwykłą całkę Riemanna.
Dowód. Zauważmy najpierw, że f α0 ∈ RS([a, b]), co jest bezpośrednią konsekwencją
własności całki Riemanna. Weźmy dalej dowolne ε > 0. Wtedy znajdziemy δ1 > 0 takie,
że
m
X
f (τj )α0 (τj )(tj
j=1
− tj−1 ) −
Zb
a
0
f (x)α (x)dx
¬ε
(6.23)
dla każdego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ1 i dla każdego
naboru punktów pośrednich τj ∈ [tj−1 , tj ]. Podobnie, możemy znaleźć liczbę δ2 > 0 taką,
że
X
m 0
α (τj )(tj
j=1
− tj−1 ) −
Zb
a
107
0
α (x)dx
¬ε
dla każdego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ2 i dla każdego naboru punktów pośrednich τj ∈ [tj−1 , tj ]. Jeżeli σj ∈ [tj−1 , tj ] jest innym punktem
pośrednim (j = 1, 2, ..., m), to wtedy mamy
m
X
|α0 (τj ) − α0 (σj )|(tj − tj−1 ) ¬ 2ε
(6.24)
j=1
o ile µ(P ) ¬ δ2 , ponieważ α0 jest ciągła na [a, b].
W dalszym ciągu, ustalmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]) taki, że µ(P ) ¬
δ = min{δ1 , δ2 }. Korzystając z twierdzenia o wartości średniej, znajdziemy punkty σj ∈
[tj−1 , tj ] takie, że
α(tj ) − α(tj−1 ) = α0 (σj )(tj − tj−1 ) ,
dla j = 1, 2, ..., m.
Stąd mamy
m
X
m
X
f (τj )[α(tj ) − α(tj−1 )] =
j=1
f (τj )α0 (τj )(tj − tj−1 )
j=1
+
m
X
f (τj )[α0 (σj ) − α0 (τj )](tj − tj−1 )
(6.25)
j=1
Jednakże, z (6.23), (6.24) i (6.25) otrzymujemy
X
Zb
m
0
f
(τ
)[α(t
)
−
α(t
)]
−
f
(x)α
(x)dx
j
j
j−1
j=1
¬ (2||f ||∞ + 1)ε .
a
To pokazuje, że
lim
µ(P )→0
m
X
f (τj )[α(tj ) − α(tj−1 )] = lim Sα (f, P ; [a, b])
µ(P )→0
j=1
=
Zb
f (x)α0 (x)dx ,
a
jeżeli skorzystamy z Twierdzenia 6.5. Koniec dowodu.
Udowodnimy teraz twierdzenie uogólniające wyniki zawarte w Twierdzeniu 6.9.
Twierdzenie 6.16. Niech f ∈ B([a, b]) oraz α ∈ BV ([a, b]). Wtedy następujące stwierdzenia są równoważne:
(a) f ∈ RSα ([a, b]).
108
(b) Dla każdego ε > 0 istnieje δ > 0 takie, że dla każdego podziału P = {t0 , t1 , ..., tm } ∈
P([a, b]) takiego, że µ(P ) ¬ δ zachodzi nierówność
m
X
osc(f ; [tj−1 , tj ])|α(tj ) − α(tj−1 )| ¬ ε .
(6.26)
j=1
(c) Dla każdego ε > 0 istnieje δ > 0 takie, że dla każdego podziału P = {t0 , t1 , ..., tm } ∈
P([a, b]) takiego, że µ(P ) ¬ δ spełniona jest nierówność
m
X
osc(f ; [tj−1 , tj ])Var(α; [tj−1 , tj ]) ¬ ε .
(6.27)
j=1
Dowód. Pokażemy najpierw, że z (a) wynika (b). W tym celu załóżmy, że f ∈ RSα ([a, b]).
Ponieważ α ∈ BV ([a, b]), to zgodnie z twierdzeniem Jordana (Twierdzenie 2.6), możemy
funkcję α przedstawić jako różnicę α = β − γ dwóch funkcji β, γ : [a, b] → R, które są
rosnące na przedziale [a, b]. Daje to możliwość skorzystania z definicji całki RiemannaStieltjesa wyrażonej wzorem (6.8). Następnie, dla zadanego ε > 0, zgodnie z Twierdzeniem
6.9, możemy znaleźć δ > 0 takie, że dla dowolnego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b])
takiego, że µ(P ) ¬ δ, mamy:
m
X
osc(f ; [tj−1 , tj ])(β(tj ) − β(tj−1 )) ¬
ε
2
osc(f ; [tj−1 , tj ])(γ(tj ) − γ(tj−1 )) ¬
ε
.
2
j=1
oraz
m
X
j=1
Mając na uwadze powyższe oszacowania, otrzymujemy
m
X
osc(f ; [tj−1 , tj ])|α(tj ) − α(tj−1 )|
j=1
=
m
X
osc(f ; [tj−1 , tj ])|[β(tj ) − γ(tj ) − β(tj−1 ) + γ(tj−1 )]|
j=1
=
m
X
osc(f ; [tj−1 , tj ])|[β(tj ) − β(tj−1 )] − [γ(tj ) − γ(tj−1 )]|
j=1
¬
m
X
osc(f ; [tj−1 , tj ])[|β(tj ) − β(tj−1 )| + |γ(tj ) − γ(tj−1 )|]
j=1
=
m
X
osc(f ; [tj−1 , tj ])(β(tj ) − β(tj−1 ))
j=1
109
+
m
X
osc(f ; [tj−1 , tj ])(γ(tj ) − γ(tj−1 )) ¬ ε .
j=1
Powyższe oszacowanie pokazuje, że spełniony jest warunek (b) i tym samym kończy dowód
pierwszej implikacji.
Pokażemy teraz, że (b) implikuje (c).
W tym celu pokażemy najpierw, że przy założeniu (b) dla każdego punktu x ∈ [a, b]
przynajmniej jedna z funkcji f lub α jest ciągła w punkcie x. Zatem, dla zadanego ε > 0
znajdźmy δ > 0 zgodnie z warunkiem (b). Ustalmy punkt x0 ∈ [a, b] i załóżmy na przykład,
że α jest nieciągła w x0 . Wtedy mamy
lim α(x) 6= α(x0 )
x→x0 +
lub
lim α(x) 6= lim α(x) .
x→x0 −
x→x0 +
Dalej, weźmy liczbę h > 0 taką, że h < min{δ, b − x0 } i rozważmy dowolny podział
P = {t0 , t1 , ..., tm } ∈ P([a, b]) taki, że µ(P ) ¬ δ. Dodajmy do podziału P dwa punkty
xh i x0 + h, gdzie xh = x0 lub xh = x0 − h i oznaczmy przez P 0 rozszerzony podział
P ∪ {xh , x0 + h}. Oczywiście mamy, że µ(P 0 ) ¬ δ a także, na mocy (6.26), otrzymujemy
|f (x0 + h) − f (x0 )||α(x0 + h) − α(xh )| ¬ ε .
Stąd, przy h → 0 dostajemy, że f (x0 +h) → f (x0 ), co oznacza, że f jest prawostronnie
ciągła w punkcie x0 . Podobnie możemy pokazać lewostronną ciągłość funkcji f w punkcie
x0 , co pozwala nam wywnioskować, że f jest ciągła w x0 .
Powtarzając powyższe rozumowanie przy założeniu, że funkcja f jest nieciągła w pewnym punkcie x0 , możemy udowodnić, że funkcja α jest ciągła w punkcie x0 .
Dalej, ustalmy ε > 0. Wybierzmy δ > 0 zgodnie z warunkiem (b) do liczby ε/3. Niech
M = osc(f ; [a, b]) i niech P = {z0 , z1 , ..., zk } ∈ P([a, b]) będzie podziałem takim, że
Var(α; [a, b]) −
k
X
ε
¬
|α(zj ) − α(zj−1 )| .
3M
j=1
(6.28)
Oczywiście, jeżeli weźmiemy dowolny podział P 0 taki, że P ⊂ P 0 , wtedy nierówność (6.28)
zachodzi także dla P 0 . Tak, jak to pokazaliśmy wcześniej, warunek (b) implikuje, że w
każdym punkcie przedziału [a, b], przynajmniej z funkcji α lub f jest ciągła. Wykorzystując
własności funkcji wahania ustalone w Rozdziale 2 wnioskujemy stąd, że przynajmniej
110
jedna z funkcji Vα lub f , jest ciągła w każdym punkcie przedziału [a, b]. Ponieważ te
funkcje są ograniczone, możemy znaleźć δ1 > 0 takie, że
osc(f ; [x0 , x])Var(α; [x0 , x]) ¬
ε
3M
(6.29)
o ile |x − x0 | ¬ δ1 i x0 < zj < x dla j = 1, 2, ..., k.
Następnie, niech P1 = {x0 , x1 , ..., xn } ∈ P([a, b]) będzie takim podziałem, że µ(P1 ) ¬
δ = min{δ1 , δ}. Oczywiście, nierówność (6.29) zachodzi dla podziału P1 . Rozszerzając
podział P1 przez włączenie tych punktów zj , które są różne od punktów podziału P1 ,
otrzymujemy nowy podział P20 = {x00 , x01 , ..., x0p } taki, że
Var(α; [a, b]) −
p
X
ε
¬
|α(x0j ) − α(x0j−1 )| .
3M
j=1
Stąd otrzymujemy
p
X
[Var(α; [x0j−1 , xj ]) − |α(x0j ) − α(xj−1 )|] ¬
j=1
Stąd wynika, że
S0 =
p
X
ε
.
3M
osc(f ; [x0j−1 , x0j ])Var(α; [x0j−1 , xj ])
j=1
¬
p
X
osc(f ; [x0j−1 , x0j ]){Var(α; [x0j−1 , x0j ]) − |α(x0j ) − α(x0j−1 )|}
j=1
+
p
X
2
osc(f ; [x0j−1 , x0j ])|α(x0j ) − α(x0j−1 )| ¬ ε .
3
j=1
W końcu zauważmy, że możemy napisać
S=
n
X
osc(f ; [xj−1 , xj ])Var(α; [xj−1 , xj ]) = S 0 + S 00 ,
j=1
gdzie S 00 oznacza sumę tych wszystkich składników, dla których istnieje k takie, że xj−1 <
zk < xj , natomiast S 0 oznacza pozostałą część sumy S, będącą sumą częściową sumy S0 .
Oczywiście mamy, że S 0 ¬ S0 ¬ 2ε/3. Dalej, z (6.29) wiemy, że S 00 ¬ ε/3, a więc S ¬ ε.
Pozostało do pokazania, że (c) implikuje (a). Dla realizacji tego celu przedstawmy
znowu funkcję α w postaci α = β − γ, gdzie
1
1
β(x) = [Vα (x) + α(x)] , γ(x) = [Vα (x) − α(x)]
2
2
111
(por. Twierdzenie 2.9), gdzie Vα oznacza funkcję variacji funkcji α. Oczywiście mamy
Var(α; [x, y]) = Var(β; [x, y]) + Var(γ, [x, y])
(6.30)
dla dowolnego przedziału [x, y] ⊂ [a, b]. Ustalmy ε > 0 i wybierzmy δ > 0 zgodnie z warunkiem (c). Wtedy, biorąc pod uwagę (6.27), dla dowolnego podziału P = {t0 , t1 , ..., tm } ∈
P([a, b]) takiego, że µ(P ) ¬ δ, otrzymujemy
m
X
osc(f ; [tj−1 , tj ])Var(α; [tj−1 , tj ]) ¬ ε .
j=1
Z (6.30), otrzymamy wtedy nierówność
m
X
osc(f ; [tj−1 , tj ]){Var(β; [tj−1 , tj ]) + Var(γ; [tj−1 , tj ])} ¬ ε ,
j=1
i stąd mamy, że
m
X
osc(f ; [tj−1 , tj ])(β(tj ) − β(tj−1 ))
j=1
=
m
X
osc(f ; [tj−1 , tj ])Var(β; [tj−1 , tj ]) ¬ ε
j=1
oraz
m
X
osc(f ; [tj−1 , tj ])(γ(tj ) − γ(tj−1 ))
j=1
=
m
X
osc(f ; [tj−1 , tj ])Var(γ; [tj−1 , tj ]) ¬ ε .
j=1
Z powyższych oszacowań oraz z Twierdzenia 6.9 wnioskujemy, że zarówno f ∈ RSβ ([a, b])
jak i f ∈ RSγ ([a, b]), a zatem, zgodnie z definicją RS-całki względem funkcji o wariacji
ograniczonej to implikuje, że f ∈ RSα ([a, b]). Koniec dowodu.
Twierdzenie 6.16 ma bardzo użyteczne konsekwencje związane z całkowalnością w
sensie Riemanna-Stieltjesa funkcji f względem funkcji α oraz względem jej funkcji wariacji
Vα .
Wniosek 6.17. Niech f ∈ B([a, b]) i niech α ∈ BV ([a, b]). Przy tych założeniach f ∈
RSα ([a, b]) wtedy i tylko wtedy, gdy f ∈ RSVα ([a, b]), gdzie Vα oznacza funkcję wahania
funkcji α.
112
Dowód. Ponieważ funkcja Vα (x) = Var(α; [a, x]) jest rosnąca na przedziale [a, b], więc
ma wariację ograniczoną na [a, b]. Załóżmy dalej, że f ∈ RSα ([a, b]). Wtedy, zgodnie z
Twierdzeniem 6.16, spełnione są nierówności (6.26) i (6.27). Z drugiej strony, ze względu
na równość
Var(α; [tj−1 , tj ]) = Vα (tj ) − Vα (tj−1 ) ,
po zastosowaniu Twierdzenia 6.16(b) otrzymujemy, że f ∈ RSVα ([a, b]). Ponieważ powyższe rozumowanie jest symetryczne względem funkcji α i Vα , otrzymujemy stąd tezę
twierdzenia.
Podamy teraz twierdzenie o pewnej nierówności dla całki Riemanna-Stieltjesa, która
ma ważne zastosowania w teorii równań całkowych.
Twierdzenie 6.18. Jeżeli α ∈ BV ([a, b]) i f ∈ RSα ([a, b]), to ma miejsce nierówność
b
Z
f (x)dα(x)
¬
a
Zb
|f (x)|dVα (x) .
(6.31)
a
Dowód. Z Wniosku 6.17 dedukujemy, że f ∈ RSVα ([a, b]), a więc całka występująca po
prawej stronie (6.31) jest poprawnie zdefiniowana.
Dalej, weźmy dowolny podział {t0 , t1 , ..., tm } ∈ P([a, b]) i wybierzmy zbiór punktów pośrednich Π = {τ1 , τ2 , ..., τm } dla tego podziału. Wtedy mamy
X
m
f
(τ
)(α(t
)
−
α(t
))
j
j
j−1 j=1
¬
m
X
j=1
|f (τj )|Var(α; tj−1 , tj ) =
¬
m
X
|f (τj )||α(tj ) − α(tj−1 )|
j=1
m
X
|f (τj )|(Vα (tj ) − Vα (tj−1 )) ,
j=1
gdzie wykorzystaliśmy wcześniej podane własności wariacji funkcji. Ponieważ powyższa
nierówność jest spełniona dla dowolnego podziału P ∈ P([a, b]) i dla dowolnego zbioru
punktów pośrednich Π, więc wykorzystując Twierdzenie 6.5, ciągłość funkcji u → |u| i
Twierdzenie 6.14(c), wnioskujemy o prawdziwość nierówności (6.31).
W następnym twierdzeniu zebrane są pewne stwierdzenia będące w zasadzie wnioskami
z Twierdzenia 6.18.
Twierdzenie 6.19. Całka Riemanna-Stieltjesa ma następujące własności:
113
(a) Dla α ∈ BV ([a, b]) oraz f ∈ RSα ([a, b]) spełniona jest nierówność
b
Z
f (x)dα(x)
¬ ||f ||∞ Var(α; [a, b]) .
a
(b) Jeżeli fn ∈ RSα ([a, b]) dla n = 1, 2, ... oraz f ∈ RSα ([a, b]) a ponadto jeżeli ||fn −
f ||∞ → 0 przy n → ∞, wtedy
lim
Zb
n→∞
fn (x)dα(x) =
Zb
f (x)dα(x)
a
a
dla α ∈ BV ([a, b]).
(c) Jeżeli (αn ) jest ciągiem złożonym z funkcji αn : [a, b] → R o wariacji ograniczonej
oraz α ∈ BV ([a, b]) a także Var(αn − α; [a, b]) → 0 przy n → ∞, to wtedy
lim
Zb
f (x)dαn (x) =
n→∞
Zb
a
f (x)dα(x)
a
dla wszystkich funkcji f ∈ RSαn ([a, b]) i f ∈ RSα ([a, b]).
Dowód.
(a) Na podstawie Twierdzenia 6.18 oraz Twierdzenia 6.3(e) otrzymujemy
b
Z
f (x)dα(x)
¬
a
= ||f ||∞
Zb
Zb
|f (x)|dVα (x) ¬
a
Zb
||f ||∞ dVα (x)
a
dVα (x) = ||f ||∞ Var(α; [a, b]) .
a
Dowodzi to punktu (a).
(b) Korzystając znowu z Twierdzenia 6.18 i Twierdzenia 6.3(e), dostajemy:
b
Z
Zb
fn (x)dα(x) − f (x)dα(x)
a
a
¬
Zb
|fn (x) − f (x)|dVα (x)
a
¬ ||fn − f ||∞ Var(α; [a, b]) ,
co dowodzi punktu (b).
114
(c) Stosując Twierdzenie 6.18 z α zamienionym na αn − α, otrzymujemy
b
Z
Zb
f (x)dαn (x) − f (x)dα(x)
=
a
a
¬
Zb
b
Z
f (x)d(αn (x) − α(x))
a
|f (x)|dVαn −α (x) ¬ ||f ||∞ Var(αn − α; [a, b]) .
a
Stąd wynika stwierdzenie z punktu (c).
Zadania
1. Wyznaczyć całkę
ZΠ
(x − 1)dα(x) ,
0
gdzie α(x) = cos x · sgnx.
2. Znaleźć przykład funkcji f ∈ B([a, b]) oraz α ∈ BV ([a, b]) takich, że f 2 ∈ RSα ([a, b])
i |f | ∈ RSα ([a, b]) ale f 6∈ RSα ([a, b]).
3. Pokazać, że
Z3
xdα(x) =
0
3
,
2
gdzie α(x) = x − [x].
4. Niech f oznacza funkcję Dirichleta określoną na przedziale [0, 1] i niech α ∈
BV ([0, 1]). Pokazać, że f ∈ RSα ([0, 1]) wtedy i tylko wtedy, gdy α jest stała.
5. Niech f, g ∈ ([a, b]) i niech α ∈ BV ([a, b]). Określmy funkcję β : [a, b] → R przyjmując
β(x) =
Zx
f (t)dα(t) .
a
Pokazać, że
Zb
g(t)dβ(t) =
Zb
a
a
115
f (t)g(t)dα(t) .
6. Niech α ∈ BV ([a, b]) ∩ C([a, b]) i niech f : [a, b] → R będzie funkcją rosnącą na
przedziale [a, b]. Pokazać, że istnieje ξ ∈ [a, b] takie, że
Zb
f (x)dα(x) = f (a)(α(ξ) − α(a)) + f (b)(α(b) − α(ξ)) .
a
7. Niech f ∈ C 1 ([a, b]) i niech g ∈ C([a, b]). Udowodnić, że istnieje c ∈ (a, b) takie, że
Zb
f (x)g(x)dx = f (a)
Zc
g(x)dx + f (b)
g(x)dx .
c
a
a
Zb
8. Niech f, α : [a, b] → R będą ciągłe i dodatkowo, niech α będzie ściśle rosnąca na
[a, b]. Określmy funkcję F : [a, b] → R przyjmując
F (x) =
Zx
f (t)dα(t) .
a
Wtedy możemy zdefiniować tzw. α-pochodną funkcji F w następujący sposób
dF
F (x + h) − F (x)
(x) = lim
.
h→0 α(x + h) − α(x)
dα
Pokazać, że
dF
(x) = f (x)
dα
dla każdego x ∈ [a, b].
9. Niech f ∈ BV ([a, b]) ∩ C([a, b]). Udowodnić, że
Zb
f (x)df (x) =
a
f 2 (b) − f 2 (a)
.
2
10. Znaleźć funkcje α ∈ BV ([a, b]) i f ∈ RSα ([a, b]) takie, że
b
Z
f (x)dα(x)
>
a
116
Zb
a
|f (x)|dα(x) .
Bibliografia
1. J. Appell, J. Banaś, N. Merentes: Bounded Variation and Around, De Gruyter Series
in Nonlinear Analysis 17, Walter de Gruyter, Berlin/Boston 2014.
2. G.M. Fichtenholz: Rachunek Różniczkowy i Całkowy, Wydawnictwo Naukowe PWN,
Warszawa 2007.
3. J. Jakubowski, R. Sztencel: Wstęp do Teorii Prawdopodobieństwa, Wyd. SCRiPT,
Warszawa 2004.
4. M.A. Krasnosel’skii, Y.B. Rutickii: Convex Functions and Orlicz Spaces, Noordhoff,
Groningen 1961.
5. M. Loeve: Probability Theory, Van Nostrand Reinhold, New York 1963.
6. S. Łojasiewicz: Wstęp do Teorii Funkcji Rzeczywistych, PWN, Warszawa 1973.
7. I.P. Natanson: Theory of Functions of a Real Variable, Ungar, New York 1960.
8. W. Rudin: Podstawy Analizy Matematycznej, PWN, Warszawa 1982.
9. R. Sikorski, Funkcje Rzeczywiste, PWN, Warszawa 1958.
117

Podobne dokumenty