Wariacje Funkcji, Ich Własności i Zastosowania
Transkrypt
Wariacje Funkcji, Ich Własności i Zastosowania
Środowiskowe Studia Doktoranckie z Nauk Matematycznych Uniwersytet Marii Curie-Skłodowskiej w Lublinie Józef Banaś Katedra Matematyki Politechnika Rzeszowska Wariacje Funkcji, Ich Własności i Zastosowania Lublin 2014 Spis treści Wstęp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1. Funkcje mierzalne i regularne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2. Wariacja funkcji w sensie Jordana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3. Funkcje o wariacji ograniczonej w sensie Wienera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4. Funkcje o wariacji ograniczonej w sensie Wienera-Younga . . . . . . . . . . . . . . . . . . . . . . 58 5. Wariacja funkcji w sensie Watermana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74 6. Całka Riemanna-Stieltjesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .94 Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Wstęp Celem przedkładanego skryptu jest przedstawienie podstawowych faktów dotyczących różnych rodzajów definicji pojęcia wariacji (wahania) funkcji. Główny nacisk zostanie położony na podanie podstawowych faktów dotyczących klasycznej wariacji funkcji. Pojęcie to zostało wprowadzone do matematyki przez znakomitego francuskiego matematyka C. Jordana pod koniec XIX wieku. Jordan odkrył też podstawową własność funkcji o wariacji ograniczonej. Własność ta pozwala każdą funkcję o wariacji ograniczonej na zadanym przedziale [a, b] przedstawić jako różnicę dwóch funkcji rosnących na tym przedziale. Odkrycie tej własności pozwoliło na znaczne uproszczenie teorii funkcji o wariacji ograniczonej, a przede wszystkim na zbudowanie poręcznej teorii całki Riemanna-Stieltjesa. To ostatnie pojęcie okazało się niezwykle użyteczne w teorii prawdopodobieństwa oraz w pewnych działach mechaniki [2,3,5]. W przedkładanym opracowaniu wskażemy również na pewne uogólnienie wspomnianego, klasycznego pojęcia wariacji i funkcji o wariacji ograniczonej. Mianowicie, przedstawimy pojęcie wariacji funkcji w sensie Wienera, w sensie Wienera-Younga i w sensie Watermana. Oczywiście uogólnienia te nie wyczerpują listy wszystkich, obecnie znanych uogólnień pojęcia wariacji funkcji. Tym niemniej, przedstawiają one najważniejsze z tych uogólnień, które mają najwięcej własności, najwięcej zastosowań i których teoria jest obecnie najbardziej rozwinięta. Niniejszy skrypt został opracowany głównie na podstawie monografii [1], która całkowicie poświęcona jest przedstawieniu pojęcia wariacji funkcji w różnym ujęciu oraz omówieniu ich własności i zastosowań. Ponadto, wykorzystane zostały również pozycje [6,7,8,9]. W pozycjach tych omawia się również pojęcie wariacji funkcji i wskazuje na różnorakie zastosowania tego pojęcia. 3 1. Funkcje monotoniczne i regularne Niech D będzie niepustym podzbiorem zbioru liczb rzeczywistych R oraz niech dana będzie funkcja f : D → R. Dalej, niech dany będzie zbiór A ⊂ D, A 6= ∅. Definicja 1.1. Mówimy, że funkcja f jest na zbiorze A: a) rosnąca, jeżeli ∀x1 ,x2 ∈A [x1 < x2 ⇒ f (x1 ) ¬ f (x2 )]; piszemy wtedy, że f A b) ściśle rosnąca, jeżeli ∀x1 ,x2 ∈A [x1 < x2 ⇒ f (x1 ) < f (x2 )]; piszemy wtedy: f % A c) malejąca, jeżeli ∀x1 ,x2 ∈A [x1 < x2 ⇒ f (x1 ) f (x2 )]; piszemy, że f AAU A d) ściśle malejąca, jeżeli ∀x1 ,x2 ∈A [x1 < x2 ⇒ f (x1 ) > f (x2 )]; piszemy wtedy, że f &A Funkcję f nazywa się funkcją monotoniczną (ściśle monotoniczną) na zbiorze A, jeżeli f jest rosnąca na zbiorze A lub malejąca na zbiorze A (ściśle rosnąca lub ściśle malejąca na zbiorze A). Oczywiście, każda funkcja ściśle monotoniczna na zbiorze A jest na tym zbiorze monotoniczna. Zauważmy, że suma dwóch funkcji rosnących (malejących) na zbiorze A jest funkcją rosnącą (malejącą) na zbiorze A. Ponadto, iloczyn funkcji rosnącej (malejącej) na zbiorze A przez stałą c 0 jest funkcją rosnącą (malejącą) na zbiorze A. Zauważmy, że jeżeli f jest rosnąca (malejąca) na zbiorze A oraz c < 0 to cf jest malejąca (rosnąca) na zbiorze A. Stąd np. wynika, że jeżeli oznaczymy przez SA zbiór wszystkich funkcji rosnących (malejących) na zbiorze A, to zbiór ten ma własność: f ∈ SA , − f ∈ SA ⇒ f ≡ 0 na zbiorze A . Oznacza to, że zbiór SA funckji rosnących (albo malejących) na zbiorze A, będący podzbiorem przestrzeni liniowej RA ∗ , ma strukturę stożka. Niestety, nie jest to podprzestrzeń przestrzeni RA . Podobnie, zbiór MA funckji monotonicznych na zbiorze A nie ma nawet struktury stożka! Później pokażemy, jak tą niedogodną sytuację można obejść (w pewnien sposób). ∗ Jeżeli X, Y są zbiorami niepustymi, to symbolem Y X oznaczamy zbiór wszystkich funkcji f : X → Y . 4 W dalszym ciągu załóżmy, że I jest przedziałem (otwartym, domkniętym, jednostronnie otwartym, ograniczonym lub nieograniczonym). Symbolem I̊ będziemy oznaczać wnętrze przedziału I, np. jeżeli I = (a, b], to I̊ = (a, b) itd. Mamy następujące, ważne twierdzenie. Twierdzenie 1.2. Załóżmy, że f jest funkcją monotoniczną na przedziale I(f : I → R). Wtedy dla dowolnego x ∈ I̊ istnieją granice jednostronne funkcji f w punkcie x (skończone), tzn. istnieją f (x−) = lim f (y) , y→x− f (x+) = lim f (x) . y→x+ Ponadto, jeżeli f jest rosnąca na przedziale I, to f (x−) ¬ f (x) ¬ f (x+) , natomiast, jeżeli f jest malejąca na I, to f (x−) f (x) f (x+) . Dowód. Dla ustalenia uwagi załóżmy, że f jest rosnąca na przedziale I. Pokażemy, że f (x−) = sup{f (y) : y < x, y ∈ I} f (x+) = inf{f (y) : y > x, y ∈ I} . Załóżmy najpierw, że y ∈ I, y < x. Wtedy z założenia mamy, że f (y) < f (x) a to oznacza, że zbiór {f (y) : y ∈ I, y < x} jest ograniczony z góry i jedną z jego majorant jest f (x). Zatem zbiór ten ma kres górny - oznaczmy ten kres górny przez f∗ (x), tzn. kładziemy: f∗ (x) = sup{f (y) : y ∈ I, y < x} . Ponieważ f (x) jest majorantą zbioru {f (y) : y ∈ I, y < x}, więc mamy f∗ (x) ¬ f (x) . Przy okazji otrzymujemy, że f∗ (x) ∈ R. 5 (1.1) W dalszym ciągu pokażemy, że f (x−) istnieje oraz, że f (x−) = f∗ (x) . (1.2) W tym celu ustalmy dowolnie liczbę ε > 0. Z definicji kresu górnego wynika, że istnieje liczba w zbiorze {f (y) : y ∈ I, y < x} - tzn. istnieje liczba y < x, y ∈ I taka, że f∗ (x) − ε < f (y) ¬ f∗ (x) . (1.3) Weźmy teraz dowolny ciąg {xn } taki, że {xn } ⊂ I, xn < x dla n = 1, 2, ... oraz xn → x. Stąd: i z definicji granicy ciągu wynika, że istnieje liczba naturalna n0 taka, że dla n ∈ N, n n0 , zachodzi, że y < xn ¬ x . Stąd i z (1.3) mamy: f∗ (x) − ε < f (y) ¬ f (xn ) ¬ f∗ (x) , (1.4) przy czym ostatnia nierówność (po prawej stronie) w (1.4) wynika z definicji kresu górnego, bowiem {xn } ⊂ {y ∈ I : y < x} . Z nierówności (1.4) otrzymujemy, że lim f (xn ) = f∗ (x) . n→∞ Ponieważ tak jest dla dowolnego ciągu {xn } (byle tylko xn < x, xn → x, xn ∈ {y ∈ I : y < x}), więc stąd mamy, że lim f (x) = f (x−) = f∗ (x) , y→x− co dowodzi (1.2). Dowód, że f (x+) = f ∗ (x) = inf{f (y) : y ∈ I, y > x} przebiega podobnie. Mamy również, że f (x+) f (x) . Koniec dowodu. Uwaga 1.3. Jeżeli x jest lewym (prawym) końcem przedziału I, mamy podobne stwierdzenia. Np. gdy przedział I ma postać I = (a, b) lub I = [a, b) itp. , b ¬ +∞ , 6 to mamy, że lim f (x) istnieje, oraz x→a+ f (a+) = lim f (x) f (a) x→a+ (oczywiście dla funkcji rosnącej). Twierdzenie 1.4. Rodzina przedziałów otwartych i rozłącznych jest co najwyżej przeliczalna. Dowód. Wiadomo, że w każdym przedziale otwartym znajduje się przynajmniej jedna liczba wymierna. Załóżmy, że (Uλ )λ∈Λ jest rodziną przedziałów otwartych i rozłącznych. Weźmy odwzorowanie f : Λ → Q (Q oznacza zbiór liczb wymiernych) określone w ten sposób, że każdemu wskaźnikowi λ ∈ Λ przyporządkowujemy dokładnie jedną liczbę wymierną z przedziału Uλ . Jest to funkcja różnowartościowa, bowiem dla λ1 6= λ2 , λ1 , λ2 ∈ Λ, przedziały Uλ1 i Uλ2 są rozłączne, więc liczby wymierne f (λ1 ) i f (λ2 ) są różne. Zatem f : Λ → f (Λ) ⊂ Q jest bijekcją. Ponieważ f (Λ), jako podzbiór zbioru przeliczalnego Q, jest skończony lub przeliczalny, więc zbiór Λ, a co zatem idzie rodzina {Uλ }λ∈Λ , jest co najwyżej przeliczal na. Sformułujemy teraz i udowodnimy kilka lematów o funkcjach monotonicznych. Lemat 1.5. Niech f : I → R będzie funkcją rosnącą (malejącą) na przedziale I. Niech x, y, z ∈ I będą takie, że x < z < y (wtedy oczywiście z ∈ I̊). Wtedy zachodzą nierówności f (x+) ¬ f (z) ¬ f (y−) , gdy f f (x+) f (z) f (y−) , gdy f I AAU I. Dowód. Załóżmy np., że f jest rosnąca na I. Wtedy, z dowodu poprzedniego Twierdzenia 1.2 mamy, że f (x+) = inf u∈(x,+∞)∩I f (u) ¬ f (z) (bo z ∈ (x, +∞) ∩ I), oraz f (z) ¬ sup f (v) v∈(−∞,y)∩I (bo z ∈ (−∞, y) ∩ I). Koniec dowodu. 7 Lemat 1.6. Niech x ∈ I̊ będzie punktem nieciągłości funkcji rosnącej f . Wtedy przedział (f (x−), f (x+)) jest przedziałem niepustym (i otwartym). Podobnie, gdy x jest punktem nieciągłości funkcji malejącej f , to przedział (f (x+), f (x−)) jest niepusty. Dowód. Załóżmy np., że f I . Jeżeli x jest punktem nieciągłości funkcji f , to z po- przednio ustalonych własności mamy, że albo f (x−) ¬ f (x) < f (x+), albo f (x−) < f (x) ¬ f (x+) albo f (x−) < f (x) < f (x+). W każdym z trzech przypadków mamy, że f (x−) < f (x+), więc przedział (f (x−), f (x+)) jest niepusty. Lemat 1.7. Niech x, y ∈ I̊, x < y. Załóżmy, że x, y są punktami nieciągłości funkcji f , rosnącej na przedziale I. Wtedy przedziały (f (x−), f (x+)), (f (y−), f (y+)) są niepuste i rozłączne. Podobne stwierdzenie ma miejsce dla funkcji malejącej. Dowód. Tak jak poprzednio, dla ustalenia uwagi załóżmy, że f I . Wtedy, z Lematu 1.5 mamy, że f (x+) ¬ f (y−), więc przedziały otwarte (f (x−), f (x+)), (f (y−), f (x+)) są rozłączne i niepuste. Twierdzenie 1.8. Zbiór punktów nieciągłości funkcji f : I → R, która jest monotoniczna na przedziale I, jest co najwyżej przeliczalny. Dowód. Oznaczmy przez DI zbiór wszystkich punktów nieciągłości funkcji f na przedziale I. Wtedy I̊ jest oczywiście też przedziałem i mamy, że DI = DI̊ ∪ {a} lub DI = DI̊ ∪ {b} lub DI = DI̊ ∪ {a, b} lub DI = DI̊ . Wystarczy pokazać, że zbiór DI̊ jest co najwyżej przeliczalny. Dla ustalenia uwagi załóżmy, że f I . Weźmy odwzorowanie T , które każdemu punk- towi x ∈ D przyporządkowuje przedział niepusty i otwarty (f (x−), f (x+)). Z Lematu 1.7 wynika, że odwzorowanie T jest injektywne. Zatem T (D) złożone jest z przedziałów otwartych, niepustych i rozłącznych oraz T : D → T (D) jest bijekcją. Na podstwie Twierdzenia 1.4 wiemy, że T (D) jest zbiorem co najwyżej przeliczalnym. Ponieważ T : D → T (D) jest bijekcją, więc D jest co najwyżej przeliczalny. Koniec dowodu. W dalszym ciągu wskażemy na pewne istotne uogólnienie zarówno funkcji monotonicznych jak i ciągłych. W tym celu wprowadzimy najpierw pewne oznaczenia. I tak, zbiór wszystkich funkcji f : [a, b] → R, które są ograniczone na przedziale [a, b], oznaczać będziemy symbolem B([a, b]). Wiadomo, że ten zbiór tworzy przestrzeń Banacha 8 z normą supremum, tzn. dla f ∈ B([a, b]) przyjmujemy, że ||f ||∞ = sup{|f (x)| : x ∈ [a, b]} . (1.5) Ważną w wielu rozważaniach przestrzenią jest przestrzeń C([a, b]) złożona z funkcji f : [a, b] → R, które są ciągłe na [a, b]. Przestrzeń tę również wyposażamy w normę (1.5). Oczywiście, ze znanych własności funkcji ciągłych wynika, że normę (1.5) można zastąpić normą maksimum ||f ||∞ = max{|f (x)| : x ∈ [a, b]} . (1.6) Można pokazać, że C([a, b]) jest domknietą podprzestrzenią przestrzeni B([a, b]), a więc jest przestrzenią Banacha. Przestrzeń ta nazywa się przestrzenią funkcji ciągłych z normą (metryką) zbieżności jednostajnej, ponieważ zbieżność względem normy (1.6) pokrywa się ze zbieżnością jednostajną. Oczywiście na funkcje monotoniczne na przedziale [a, b], tzn. na zbiór M[a,b] , możemy patrzeć jako na zbiór w przestrzeni B([a, b]). Jak udowodniliśmy to wyżej, każda funkcja monotoniczna f ∈ B([a, b]) ma w każdym punkcie przedziału [a, b] (skończone) granice jednostronne. Punkt nieciągłości takiej funkcji jest to tzw. skok. Na ogół przyjęto mówić, że jeżeli funkcja f ∈ B([a, b]) ma w punkcie x0 granice jednostronne oraz jest w tym punkcie nieciągła, to taka nieciągłość jest nazywana nieciągłością I-tego rodzaju. Żeby nasze rozważania ujednolicić, wprowadzimy dalej pewne definicje i oznaczenia. Definicja 1.9. Funkcję f ∈ B([a, b]) będziemy nazywać funkcją regularną, jeżeli w każdym punkcie x ∈ [a, b] funkcja f ma granice jednostronne (skończone). Oczywiście w punkcie x = a ma granicę prawostronną, natomiast w punkcie x = b granicę lewostronną. Zbiór wszystkich funkcji regularnych na przedziale [a, b] będziemy oznaczać symbolem R([a, b]). Oczywiście R([a, b]) ⊂ B([a, b]). Jeżeli f ∈ R([a, b]), to w dowolnie ustalonym punkcie x ∈ [a, b] funkcja f może być ciągła lub nieciągła. Jeżeli w punkcie x funkcja f jest nieciągła, to w przypadku, gdy granice jednostronne f (x−) = lim f (y), f (x+) = lim f (y) są różne (f (x−) 6= f (x+)), y→x− y→x+ punkt x nazywamy skokiem. Jeżeli f (x−) = f (x+), to liczbę x nazywamy nieciągłością usuwalną. 9 Dla f ∈ R([a, b]) wprowadzimy następujące oznaczenia: D(f ) = {x ∈ [a, b] : f jest nieciągła w punkcie x} , (1.7) D0 (f ) = {x ∈ [a, b] : f ma nieciągłość usuwalną w x} , (1.8) D1 (f ) = {x ∈ [a, b] : f ma skok w punkcie x} . (1.9) Mamy, że: D(f ) = D0 (f ) ∪ D1 (f ) dla f ∈ R([a, b]). Jeżeli f jest monotoniczna na [a, b] to D(f ) = D1 (f ), D0 (f ) = ∅ . Chociaż wydaje się, że klasa funkcji regularnych jest bardzo odległa od klasy funkcji monotonicznych, to jednak funkcje regularne zachowują jedną bardzo ważną własność funkcji monotnicznych. Mamy bowiem następujące twierdzenie. Twierdzenie 1.10. Zbiór punktów nieciągłości funkcji regularnej f : [a, b] → R jest co najwyżej przeliczalny. Dowód. Rozważmy ”uśrednienie” f funkcji f określone wzorem f (x) = 1 (f (x−) + f (x+)) 2 dla x ∈ D1 (f ) f (x) dla x pozostałych . Oczywiście mamy, że D(f ) = D(f ), D0 (f ) = D0 (f ), D1 (f ) = D1 (f ), więc wystarczy pokazać, że zbiór D(f ) jest co najwyżej przeliczalny. Załóżmy najpierw, że x0 ∈ D0 (f ) ∩ (a, b). Wtedy f (x0 −) = f (x0 +) 6= f (x0 ). Załóżmy np., że f (x0 −) = f (x0 +) < f (x0 ) i połóżmy ε = 21 (f (x0 ) − f (x0 +)) > 0. Dobierzmy liczbę δ > 0 tak, żeby dla x ∈ (x0 − δ, x0 ) ∪ (x0 , x0 + δ) zachodziła nierówność f (x) < f (x0 ) − ε. Stąd wynika, że koło w R2 o środku w punkcie (x0 , f (x0 )) i promieniu min{δ, ε} nie zawiera innych punktów wykresu funkcji f (lub f ) za wyjątkiem środka (x0 , f (x0 )). Załóżmy dalej, że x0 ∈ D1 (f ) ∩ (a, b). Wtedy f (x0 −) 6= f (x0 +). Niech np. będzie, że f (x0 −) < f (x0 +). Połóżmy ε = 13 (f (x0 +) − f (x0 −)) > 0 i dobierzmy liczbę δ > 0 taką, żeby f (x) < f (x0 −) + ε dla x ∈ (x0 − δ, x0 ) 10 oraz f (x) > f (x0 +) − ε dla x ∈ (x0 , x0 + δ) . Stąd wynika, że koło o środku w punkcie (x0 , f (x0 )) i promieniu min{ε, δ} nie zawiera innych punktów wykresu funkcji f poza punktem (x0 , f (x0 )). Ostatecznie widzimy, że zbiór tych wszystkich punktów wykresu funkcji f , które są środkami kół wyżej opisanych, składa sie wyłącznie z punktów izolowanych. Z faktów zawartych w niżej podanych zadaniach (zad. 1 i 2) łatwo wywnioskować, że zbiór ten jest co najwyżej przeliczalny. Stąd wynika, że zbiór D(f ) jest co najwyżej przeliczalny. Ważne twierdzenie, charakteryzujące funkcje regularne, udowodnił w 1933 roku Wacław Sierpiński. Przytoczymy to twierdzenie bez dowodu (por. [1]). Twierdzenie 1.11. Funkcja f należy do zbioru R([a, b]) wtedy i tylko wtedy, gdy można ją przedstawić w postaci złożenia f = g ◦ τ , gdzie τ : [a, b] → [c, d] jest funkcją ściśle rosnącą, natomiast g ∈ C([a, b]). Zauważmy na zakończenie tego rozdziału, że zbiór R([a, b]) ma strukturę przestrzeni liniowej nad ciałem R. Pozostawiamy Czytelnika z problemem: Czy R([a, b]) jest domknietą podprzestrzenią przestrzeni B([a, b])? Inaczej: Czy R([a, b]) jest przestrzenią Banacha z normą (1.5)? Zadania 1. Pokazać, że jeżeli funkcja f : [a, b] → R jest ściśle rosnąca na przedziale [a, b], to funkcja odwrotna f −1 jest ciągła na zbiorze f ([a, b]). 2. Pokazać, że funkcja f : R → R jest monotoniczna wtedy i tylko wtedy, gdy f −1 ([α, β]) jest przedziałem dla każdego przedziału [α, β] ⊂ R. Czy twierdzenie to jest prawdziwe w przypadku, gdy f : [a, b] → R? 3. Niech A będzie podzbiorem przestrzeni metrycznej X z metryką d. Zbiór A nazywać będziemy zbiorem izolowanym, jeżeli każdy punkt zbioru A jest punktem izolowanym tego zbioru. Pokazać, że zbiór wszystkich punktów izolowanych zbioru A jest zbiorem izolowanym. 11 4. Niech X będzie przestrzenią metryczną ośrodkową. Pokazać, że każdy podzbiór A przestrzeni X, który jest zbiorem izolowanym, jest co najwyżej przeliczalny. 5. Niech (X, d) będzie przestrzenią metryczną. Pokazać, że jeżeli istnieje zbiór A (A ⊂ X), który jest nieprzeliczalny oraz jeżeli istnieje liczba ε > 0 taka, że dla dowolnych x, y ∈ A, x 6= y zachodzi, że d(x, y) ε, to przestrzeń X nie jest ośrodkowa. 6. Pokazać, że przestrzeń l∞ złożona ze wszystkich ciągów rzeczywistych ograniczonych, z normą supremum, nie jest ośrodkowa. 7. Udowodnić Twierdzenie 1.11 (Sierpińskiego). 8. Niech f : [a, b] → R będzie zadaną funkcją ograniczoną. Rodzinę {In } (skończoną lub nie) nie zachodzących na siebie podprzedziałów przedziału [a, b] będziemy nazywać f -uporządkowaną, jeżeli |f (In )| |f (In+1 )| dla każdego n = 1, 2, ..., przy czym symbol |A| (dla A będącego ograniczonym podzbiorem zbioru R) oznacza długość zbioru A, tzn. |A| = sup A − inf A. Pokazać, że jeżeli f jest funkcją regularną na przedziale [a, b], to każdy ciąg nie zachodzących na siebie podprzedziałów przedziału [a, b] można f -uporządkować. Uwaga. Jeżeli U i V są podzbiorami przestrzeni metrycznej X, to mówimy, że zbiory U , V nie zachodzą na siebie, jeżeli Ů ∩V̊= ∅. 12 2. Wariacja funkcji w sensie Jordana W rozdziale tym omówimy pojęcie wariacji funkcji w sensie klasycznym, które zostało wprowadzone pod koniec XIX wieku przez znakomitego matematyka francuskiego Camile Jordana (por. [1]). Warto w tym miejscu wspomnieć, że C. Jordan odkrył fundamentalną własność funkcji o wariacji ograniczonej na przedziale, mówiącą, że taką funkcję można przedstawić jako różnicę dwóch funkcji rosnących na tym przedziale. W celu wprowadzenia pojęcia wariacji (wahania) funkcji załóżmy, że f jest funkcją rzeczywistą określoną na przedziale [a, b] (tzn. f : [a, b] → R), ograniczoną. Skończony zbiór P = {t0 , t1 , t2 , ..., tm } złożony z puntów przedziału [a, b] takich, że a = t0 < t1 < · · · < tm−1 < tm = b będziemy nazywać podziałem przedziału [a, b]. Występująca w tej definicji liczba m jest dowolną liczbą naturalną, m 2. Zbiór wszystkich podziałów przedziału [a, b] oznaczać będziemy przez P([a, b]). Liczbę określoną równością µ(P ) = max{tj − tj−1 : j = 1, 2, ..., m} nazywać będziemy rozmiarem podziału P . Jeżeli t1 − t0 = t2 − t1 = · · · = tm − tm−1 to podział P nazywamy równoodległym. Definicja 2.1. Dla zadanej dowolnie funkcji f : [a, b] → R, ograniczonej na [a, b] oraz dla zadanego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]), liczbę nieujemną Var(f, P ), określoną wzorem Var(f, P ) = Var(f, P ; [a, b]) = m X |f (tj ) − f (tj−1 )| (2.1) j=1 będziemy nazywać wariacją (w sensie Jordana) funkcji f na przedziale [a, b] względem podziału P . Natomiast wielkość (możliwie nieskończoną) Var(f ), określoną równością Var(f ) = Var(f ; [a, b]) = sup{Var(f, P ; [a, b]) : P ∈ P([a, b])} będziemy nazywać wariacją całkowitą (Jordana) funkcji f na przedziale [a, b]. 13 (2.2) Zauważmy, że zamiast nazwy wariacja używa się też nazwy wahanie. Ponadto, w miejsce nazwy wariacja całkowita będziemy używać terminu wariacja. Definicja 2.2. Jeżeli Var(f ; [a, b]) < ∞, to wtedy mówimy, że f jest funkcją o wariacji ograniczonej (lub funkcją o ograniczonej wariacji Jordana) na [a, b]. Zbiór wszystkich funkcji o wariacji ograniczonej na przedziale [a, b] oznaczać będziemy symbolem BV ([a, b]). Podamy teraz twierdzenie przedstawiające podstawowe własności wariacji funkcji. Twierdzenie 2.3. Wielkości określone wzorami (2.1) i (2.2) mają następujące własności: (a) Wariacja (2.2) jest podaddytywna ze względu na funkcje, tzn. dla dowolnych funkcji f, g : [a, b] → R spełniona jest nierówność Var(f + g; [a, b]) ¬ Var(f ; [a, b]) + Var(g; [a, b]) . (b) Wariacja (2.2) jest dodatnio jednorodna ze względu na funkcje, tzn. Var(λf ; [a, b]) = |λ|Var(f ; [a, b]) dla λ ∈ R. (c) Dla dowolnych x, y ∈ [a, b] takich, że x < y ma miejsce nierówność |f (x) − f (y)| ¬ Var(f ; [x, y]) . (d) Jeżeli f ∈ BV ([a, b]), to f jest ograniczona oraz ma miejsce nierówność ||f ||∞ ¬ |f (a)| + Var(f ; [a, b]) , gdzie norma || · ||∞ zadana jest wzorem (1.5). (e) Każda funkcja monotoniczna f : [a, b] → R należy do zbioru BV ([a, b]) oraz Var(f ; [a, b]) = |f (b) − f (a)| . (f ) Wariacja (2.1) jest monotoniczna ze względu na podziały, tzn. jeżeli P, Q ∈ P([a, b]) oraz P ⊂ Q to Var(f, P ; [a, b]) ¬ Var(f, Q; [a, b]) . 14 (g) Wariacja (2.2) jest addytywna ze względu na przedziały, tzn. Var(f ; [a, b]) = Var(f ; [a, c]) + Var(f ; [c, b]) dla a < c < b. Dowód. Ustalmy dowolnie funkcje f, g : [a, b] → R oraz liczbę λ ∈ R. Weźmy podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy otrzymujemy: Var(f + g, P ) = m X |(f + g)(tj ) − (f + g)(tj−1 )| j=1 = m X |[f (tj ) − f (tj−1 )] + [g(tj ) − g(tj−1 )]| j=1 ¬ m X |f (tj ) − f (tj−1 )| + j=1 m X |g(tj ) − g(tj−1 )| j=1 = Var(f, P ) + Var(g, P ) ¬ Var(f ) + Var(g) . Stąd otrzymujemy Var(f + g) ¬ Var(f ) + Var(g) , co dowodzi nierówności z punktu (a). Dla dowodu (b) napiszmy: Var(λf, P ) = m X |(λf )(tj ) − (λf )(tj−1 )| j=1 = |λ| m X |f (tj ) − f (tj−1 )| = |λ|Var(f, P ) . j=1 Stąd i z własności kresu górnego otrzymujemy równość z punktu (b). Żeby udowodnić (c) wystarczy wziąć podział {x, y} ∈ P([x, y]). Wtedy mamy |f (x) − f (y)| = Var(f, P ; [x, y]) ¬ Var(f ; [x, y]) i otrzymujemy żądaną nierówność. Dalej, zakładając, że a < x < b i biorąc podział Px = {a, x, b} ∈ P([a, b]), otrzymujemy |f (x) − f (a)| ¬ |f (b) − f (x)| + |f (x) − f (a)| = Var(f, Px ; [a, b]) . 15 Stąd dostajemy |f (x)| − |f (a)| ¬ ||f (x)| − |f (a)|| ¬ |f (x) − f (a)| ¬ Var(f ; [a, b]) i dalej mamy |f (x)| ¬ |f (a)| + Var(f ; [a, b]) (2.3) dla dowolnego x ∈ (a, b). Powyższa nierówność jest również w sposób trywialny prawdziwa dla x = a. Biorąc dalej w nierówności z punktu (c) x = a, y = b, otrzymujemy: |f (b)| − |f (a)| ¬ ||f (b)| − |f (a)|| ¬ |f (b) − f (a)| = |f (a) − f (b)| ¬ Var(f ; [a, b]) Stąd |f (b)| ¬ |f (a)| + Var(f ; [a, b]) . Łącząc powyższą nierówność z nierównością (2.3) wnioskujemy o prawdziwości nierówności z (d). Załóżmy teraz, że f : [a, b] → R jest funkcją monotoniczną na [a, b]. Rozważmy przypadek, gdy f jest rosnąca. Wtedy, dla dowolnie ustalonego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) otrzymujemy: Var(f, P ; [a, b]) = m X |f (tj ) − f (tj−1 )| = j=1 m X [f (tj ) − f (tj−1 )] j=1 = f (b) − f (a) = |f (b) − f (a)| . Stąd wnioskujemy, że Var(f ; [a, b]) = |f (b) − f (a)| . Dowód w przypadku, gdy f jest malejąca, przebiega podobnie. Dowodzi to punktu (e). Dla dowodu (f) załóżmy, że P = {t0 , t1 , ...tm } ∈ P([a, b]). Niech Q ∈ P([a, b]) będzie takim podziałem, że P ⊂ Q. Załóżmy najpierw, że podział Q powstaje z podziału P przez dołączenie jednego punktu c. Wtedy istnieje i ∈ {1, 2, ..., m} takie, że ti−1 < c < ti . Dalej mamy: Var(f, P ) = m X |f (tj ) − f (tj−1 )| j=1 16 = i−1 X |f (tj ) − f (tj−1 )| + |f (ti ) − f (ti−1 )| + j=1 m X |f (tj ) − f (tj−1 )| j=i+1 ¬ i−1 X |f (tj ) − f (tj−1 )| + |f (ti ) − f (c)| + |f (c) − f (ti−1 )| j=1 + m X |f (tj ) − f (tj−1 )| = Var(f ; Q) . j=i+1 Teraz, stosując zasadę indukcji matematycznej łatwo dowodzimy nierówności z punktu (f) dla dowolnego skończonego podziału Q takiego, że P ⊂ Q. Dla dowodu (g) weźmy dowolny podział P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]). Jeżeli istnieje takie j ∈ {1, 2, ..., m−1}, że tj = c, to wtedy mamy, że P1 = {t0 , t1 , ..., tj } ∈ P([a, c]) oraz Q1 = {tj , tj+1 , ..., tm } ∈ P([c, b]). Zatem: m X |f (ti ) − f (ti−1 )| = i=1 j X |f (ti ) − f (ti−1 )| + m X |f (ti ) − f (ti−1 )| i=j+1 i=1 ¬ Var(f ; [a, c]) + Var(f ; [c, b]) (2.4) Jeżeli natomiast tak nie jest, to istnieje j ∈ {0, 1, 2, ..., m − 1} takie, że tj < c < tj+1 . Wtedy mamy: P ∪ {c} = {t0 , t1 , ..., tj−1 , tj , c, tj+1 , ..., tm } ∈ P([a, b]) . Dalej, dostajemy: m X |f (ti ) − f (ti−1 )| = i=1 = j X |f (ti ) − f (ti−1 )| + i=1 j X ¬ |f (ti ) − f (ti−1 )| i=j+1 |f (ti ) − f (ti−1 )| + |f (tj+1 − f (tj ))| + i=1 j X m X m X |f (ti ) − f (ti−1 )| i=j+2 |f (ti ) − f (ti−1 )| + |f (tj+1 − f (c))| + |f (c) − f (tj )| + i=1 j X i=1 m X |f (ti ) − f (ti−1 )| i=j+2 m X i=j+2 |f (ti ) − f (ti−1 )| + |f (c) − f (tj )| + |f (tj+1 ) − f (c)| + ¬ Var(f ; [a, c]) + Var(f ; [c, b]) . 17 |f (ti ) − f (ti−1 )| (2.5) Z (2.4) i (2.5) otrzymujemy, że Var(f ; [a, b]) ¬ Var(f ; [a, c]) + Var(f ; [c, b]) . (2.6) Dla dowodu nierówności przeciwnej do nierówności (2.6) ustalmy dowolne ε > 0 i dobierzmy takie podziały P1 = {t0 , t1 , ..., tn−1 , tn } ∈ P([a, c]) oraz Q1 = {tn , tn+1 , ..., tm−1 , tm } ∈ P([c, b]), że Var(f ; [a, c]) − Var(f ; [c, b]) − n ε X ¬ |f (ti ) − f (ti−1 )| , 2 i=1 m X ε ¬ |f (ti ) − f (ti−1 )| . 2 i=n+1 Mamy oczywiście, że t0 = a, tn = c, tm = b. Zauważmy, że wtedy P = P1 ∪ Q1 ∈ P([a, b]) i stąd otrzymujemy: Var(f ; [a, c]) + Var(f ; [c, b]) − ε ¬ m X |f (ti ) − f (ti−1 )| i=1 = Var(f, P ; [a, b]) . Z powyższej nierówności dostajemy: Var(f ; [a, c]) + Var(f ; [c, b]) − ε ¬ Var(f ; [a, b]) . Ze względu na dowolność ε otrzymujemy stąd nierówność: Var(f ; [a, c]) + Var(f ; [c, b]) ¬ Var(f ; [a, b]) . Łacząc teraz (2.6) i (2.7) otrzymujemy tezę twierdzenia. (2.7) Wniosek 2.4. Funkcja x → Var(f ; [a, x]) jest rosnąca na przedziale [a, b]. Rzeczywiście, biorąc x, y ∈ [a, b] takie, że x < y i korzystając z Twierdzenia 2.3(g), mamy Var(f ; [a, y]) = Var(f ; [a, x]) + Var(f ; [x, y]) Var(f ; [a, x]) . 18 Rozważmy teraz zbiór BV ([a, b]) złożony ze wszystkich funkcji o wariacji ograniczonej na [a, b]. Oczywiście mamy, że BV ([a, b]) ⊂ R[a,b] . Zauważmy, że z naszego twierdzenia wynika, że suma dwóch funkcji o wariacji ograniczonej na [a, b] jest funkcją o wariacji ogarniczonej na [a, b] oraz iloczyn funkcji f o wariacji ograniczonej na [a, b] przez liczbę rzeczywistą jest również funkcją o wariacji ograniczonej na [a, b]. Stąd wynika, że zbiór BV ([a, b]) z działaniami dodawania funkcji i ich mnożenia przez liczby rzeczywiste tworzy podprzestrzeń przestrzeni liniowej R[a,b] (z tymi samymi działaniami), więc ma strukturę przestrzeni liniowej. Można jednak udowodnić coś więcej, bowiem mamy twierdzenie: Twierdzenie 2.5. Niech f, g ∈ BV ([a, b]). Wtedy: (i) f · g ∈ BV ([a, b]) (ii) Jeżeli istnieje stała σ > 0 taka, że ∀x∈[a,b] |g(x)| σ, to f g ∈ BV ([a, b]). Dowód (i). Ustalmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Z punktu (d) poprzedniego twierdzenia wynika, że f, g są funkcjami ograniczonymi na [a, b]. Zatem istnieją stałe M1 > 0, M2 > 0 takie, że |f (x)| ¬ M1 , |g(x)| ¬ M2 dla x ∈ [a, b]. Mamy dalej: m X |(f g)(ti ) − (f g)(ti−1 )| = i=1 = m X |f (ti )g(ti ) − f (ti−1 )g(ti−1 )| i=1 m X |f (ti )g(ti ) − f (ti )g(ti−1 ) + f (ti )g(ti−1 ) − f (ti−1 )g(ti−1 )| i=1 ¬ m X [|f (ti )||g(ti ) − g(ti−1 )| + |g(ti−1 )||f (ti ) − f (ti−1 )|] i=1 ¬ m X |f (ti )||g(ti ) − g(ti−1 )| + i=1 ¬ M1 m X |g(ti−1 )||f (ti ) − f (ti−1 )| i=1 m X |g(ti ) − g(ti−1 )| + M2 i=1 m X |f (ti ) − f (ti−1 )| i=1 ¬ M1 Var(g; [a, b]) + M2 Var(f, [a, b]) . 19 Stąd Var(f g; [a, b]) ¬ M1 Var(g; [a, b]) + M2 Var(f ; [a, b]) < ∞ , co dowodzi pierwszej części twierdzenia. Dowód (ii). Zauważmy, że biorąc ten sam podział P mamy: m X f (ti ) g(ti ) i=1 ¬ m |f (ti )g(ti−1 ) − g(ti )f (ti−1 )| f (ti−1 ) X = − g(ti−1 ) i=1 |g(ti )||g(ti−1 )| m X |f (ti )g(ti−1 ) − f (ti−1 )g(ti−1 ) + f (ti−1 )g(ti−1 ) − g(ti )f (ti−1 )| |g(ti−1 )||g(ti )| i=1 ¬ m X " i=1 ¬ |g(ti−1 )||f (ti ) − f (ti−1 )| |f (ti−1 )||g(ti−1 ) − g(ti )| + |g(ti−1 )||g(ti )| |g(ti−1 )||g(ti )| # m |f (ti−1 )| |f (ti ) − f (ti−1 )| X + |g(ti ) − g(ti−1 )| |g(ti )| i=1 |g(ti−1 )||g(ti )| i=1 m X ¬ m m M1 X 1X |f (ti ) − f (ti−1 )| + 2 |g(ti ) − g(ti−1 )| σ i=1 σ i=1 1 M1 Var(f ; [a, b]) + 2 Var(g; [a, b]) < ∞ . σ σ Otrzymana nierówność dowodzi (ii). ¬ Zauważmy, że z punktu (i) powyższego twierdzenia wynika, że przestrzeń BV ([a, b]) jest algebrą ze zwykłymi działaniami na funkcjach. Przejdziemy teraz do przedstawienia zapowiadanego wcześniej fundamentalnego twierdzenia Jordana charakteryzującego funkcje o wariacji ograniczonej przy pomocy funkcji rosnących. Twierdzenie to nazywa się twierdzeniam o rozkładzie Jordana. Twierdzenie 2.6. Funkcja f : [a, b] → R ma wariację ograniczoną na przedziale [a, b] wtedy i tylko wtedy, gdy ta funkcja może być przedstawiona w postaci różnicy dwóch funkcji rosnących na przedziale [a, b] tzn. istnieją funkcje pf , nf , które są określone i rosnące na [a, b] i takie, że f (x) = pf (x) − nf (x) dla x ∈ [a, b]. Dowód. Jeżeli funkcja f daje się przedstawić w postaci różnicy dwóch funkcji rosnących na przedziale [a, b], to z Twierdzenia 2.3 (a), (b) i (e) wynika, że f ∈ BV ([a, b]). Załóżmy teraz, że f jest funkcją o wariacji ograniczonej na przedziale [a, b]. 20 Rozważmy funkcję Vf : [a, b] → R określoną równością Vf (x) = Var(f ; [a, x]) . Z Wniosku 2.4 wynika, że funkcja Vf jest rosnąca na przedziale [a, b]. Połóżmy pf = Vf a następnie zdefiniujmy funkcję nf : [a, b] → R, kładąc nf (x) = pf (x) − f (x) dla x ∈ [a, b]. Pokażemy, że funkcja nf jest rosnąca na przedziale [a, b]. W tym celu ustalmy dowolne x, y ∈ [a, b] takie, że x < y. Wtedy mamy nf (y) − nf (x) = pf (y) − f (y) − pf (x) + f (x) = Vf (y) − Vf (x) − f (y) + f (x) = Var(f ; [a, y]) − Var(f ; [a, x]) − [f (y) − f (x)] . Stąd i z Twierdzenia 2.3(g) dostajemy: nf (y) − nf (x) = Var(f ; [x, y]) − [f (y) − f (x)] . Z powyższej równości oraz z Twierdzenia 2.3(c) otrzymujemy: nf (y) − nf (x) Var(f ; [x, y]) − |f (y) − f (x)| 0 . Oznacza to, że funkcja nf jest rosnąca na przedziale [a, b] i tym samym kończy dowód naszego twierdzenia. Zauważmy, że z powyższego twierdzenia możemy otrzymać następujący wniosek. Wniosek 2.7. Przestrzeń BV ([a, b]) jest przestrzenią rozpiętą na zbiorze M[a,b] złożonym ze wszystkich funkcji monotonicznych na przedziale [a, b]. Twierdzenie Jordana pozwala również wyciągnąć inny, bardzo ważny wniosek. W celu sformułowania tego wniosku przypomnijmy najpierw, że każda funkcja monotoniczna na przedziale [a, b] ma tylko nieciągłości I-tego rodzaju (skoki), więc zgodnie z Definicją 1.9 jest funkcją regularną na tym przedziale. Zatem zbiór M[a,b] funkcji monotonicznych 21 na [a, b] jest podzbiorem przestrzeni funkcji regularnych R([a, b]). Stąd i z Wniosku 2.7 otrzymujemy następujące twierdzenie. Twierdzenie 2.8. Przestrzeń BV ([a, b]) jest podprzestrzenią przestrzeni R([a, b]). Innymi słowy, każda funkcja o wariacji ograniczonej na przedziale [a, b] jest funkcją regularną na tym przedziale. Przypomnijmy, że podane ostatnio twierdzenie Jordana mówiło, że jeżeli f : [a, b] → R to f ∈ BV ([a, b]) wtedy i tylko wtedy, gdy f może być przedstawione w postaci f (x) = pf (x) − nf (x), gdzie pf i nf są funkcjami rosnącymi na przedziale [a, b]. Dowód twierdzenia polegał na tym, że określaliśmy funkcję Vf : [a, b] → R przyjmując, że Vf (x) = Var(f ; [a, x]) (2.8) dla dowolnego x ∈ [a, b]. Następnie przyjmowaliśmy, że pf (x) = Vf (x) (2.9) nf (x) = Vf (x) − f (x) (2.10) oraz dla x ∈ [a, b]. O funkcjach pf oraz nf pokazywaliśmy, że są to funkcje rosnące na przedziale [a, b]. Oczywiście mamy, że f (x) = pf (x) − nf (x) dla x ∈ [a, b]. Okazuje się, że rozkład funkcji f o wahaniu ograniczonym na przedziale [a, b] na różnicę dwóch funkcji rosnących na tym przedziale (tzn. rozkład Jordana) nie jest jednoznaczny. Co więcej, można ten rozkład zrobić tak, że jest on z pewnego punktu widzenia najlepszy. Rzeczywiście, załóżmy, że f ∈ BV ([a, b]). Określmy funkcje ϕ, ψ : [a, b] → R przyjmując: 1 ϕ(x) = [Vf (x) + f (x)] 2 1 ψ(x) = [Vf (x) − f (x)] . 2 Wtedy zachodzi twierdzenie. Twierdzenie 2.9. Funkcje ϕ i ψ są funkcjami rosnącymi na przedziale [a, b] oraz f (x) = ϕ(x) − ψ(y) 22 (2.11) (2.12) dla x ∈ [a, b]. Ponadto, funkcje ϕ i ψ są możliwie najsłabiej rosnące na przedziale [a, b] w tym sensie, że jeżeli f jest przedstawiona w postaci f (x) = ϕ(x) − ψ(x) (2.13) dla x ∈ [a, b], gdzie ϕ i ψ są rosnące na [a, b], to ϕ(y) − ϕ(x) ¬ ϕ(y) − ϕ(x) , (2.14) ψ(y) − ψ(x) ¬ ψ(y) − ψ(x) (2.15) dla wszystkich x, y ∈ [a, b], x < y. Oprócz tego, ma miejsce równość Var(f ; [x, y]) = Var(ϕ; [x, y]) + Var(ψ; [x, y]) dla dowolnych x, y ∈ [a, b], x < y. Dowód. Ustalmy dowolnie x, y ∈ [a, b], x < y. Korzystając z nierówności udowodnionej w Twierdzeniu 2.3(c), otrzymujemy f (x) − f (y) ¬ |f (x) − f (y)| ¬ Var(f ; [x, y]) . (2.16) Mamy teraz: 1 1 ϕ(y) − ϕ(x) = [Vf (y) + f (y)] − [Vf (x) + f (x)] 2 2 1 = [Vf (y) − Vf (x) + f (y) − f (x)] 2 1 = [Var(f ; [a, y]) − Var(f ; [a, x]) + f (y) − f (x)] 2 1 = [Var(f ; [a, x] ∪ [x, y]) − Var(f ; [a, x]) + f (y) − f (x)] 2 1 = [Var(f ; [a, x]) + Var(f ; [x, y]) − Var(f ; [a, x]) + f (y) − f (x)] 2 1 = [Var(f ; [x, y]) + f (y) − f (x)] 0 , 2 przy czym ostatnia nierówność wynika z (2.16). Podobnie, otrzymujemy teraz z (2.12): 1 1 ψ(y) − ψ(x) = [Vf (y) − f (y)] − [Vf (x) − f (x)] 2 2 23 (2.17) 1 = [Var(f ; [x, y]) − (f (y) − f (x))] 0 , 2 przy czym ta nierówność również wynika z (2.16). (2.18) Nierówności (2.17) i (2.18) dowodzą, że funkcje ϕ, ψ są rosnące na przedziale [x, y]. Oczywiście, jak łatwo sprowadzić bezpośrednim rachunkiem, zachodzi równość f (x) = ϕ(x) − ψ(x) dla x ∈ [a, b], co dowodzi pierwszej części naszego twierdzenia. Dla dowodu drugiej części załóżmy, że ma miejsce przedstawienie (2.13), gdzie ϕ, ψ : [a, b] → R są funkcjami rosnącymi na [a, b]. Dalej, weźmy dowolne x, y ∈ [a, b], x < y. Wtedy mamy, na podstawie (2.17), (2.13), (2.11) oraz własności wahania funkcji: 1 ϕ(y) − ϕ(x) = [Var(f ; [x, y]) + f (y) − f (x)] 2 = = o 1n Var(f ; [x, y]) + [ϕ(y) − ψ(y)] − [ϕ(x) − ψ(x)] 2 o 1n Var(ϕ − ψ; [x, y]) + [ϕ(y) − ϕ(x)] − [ψ(y) − ψ(x)] 2 o 1n Var(ϕ; [x, y]) + Var(ψ; [x, y]) + [ϕ(y) − ϕ(x)] − [ψ(y) − ψ(x)] 2 o 1n = [ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)] + [ϕ(y) − ϕ(x)] − [ψ(y) − ψ(x)] 2 = ϕ(y) − ϕ(x) . ¬ Dowodzi to nierówności (2.14). Dowód nierówności (2.15) prowadzimy podobnie. Mamy, z (2.18), (2.13), (2.12) oraz z własności wahania funkcji: ψ(y) − ψ(x) = = 1 {Var(f ; [x, y]) − (f (y) − f (x))} 2 n oo 1n Var(f ; [x, y]) − [ϕ(y) − ψ(y)] − [ϕ(x) − ψ(x)] 2 n oo 1n Var(ϕ − ψ; [x, y]) − [ϕ(y) − ϕ(x)] − [ψ(y) − ψ(x)] 2 o 1n = Var(ϕ − ψ; [x, y]) − [ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)] 2 = o 1n Var(ϕ; [x, y]) + Var(ψ; [x, y]) − [ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)] 2 o 1n = [ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)] − [ϕ(y) − ϕ(x)] + [ψ(y) − ψ(x)] 2 = ψ(y) − ψ(x) . ¬ 24 Zauważmy dalej, że z (2.17) i (2.18) otrzymujemy dla x, y ∈ [a, b] takich, że x < y: (ϕ(y) − ϕ(x)) + (ψ(y) − ψ(x)) = = 1 {Var(f ; [x, y]) + [f (y) − f (x)] + Var(f ; [x, y]) − [f (y) − f (x)]} 2 = Var(f ; [x, y]) . Stąd i z własności wahania, dostajemy ostatecznie Var(f ; [x, y]) = Var(ϕ; [x, y]) + Var(ψ; [x, y]) i koniec dowodu. Jako bezpośrednią konsekwencję twierdzenia Jordana otrzymujemy następujący wniosek, który sformułujemy tutaj jako twierdzenie. Twierdzenie 2.10. Jeżeli f ∈ BV ([a, b]), to f ma co najwyżej przeliczalną ilość punktów nieciągłości. Funkcja Vf (x) = Var(f ; [a, x]) używana w dowodach ostatnich twierdzeń, ma wiele interesujących własności i jest ściśle związana z funkcją f . Prześledzimy to w naszych dalszych rozważaniach i twierdzeniach. Rozpoczniemy od następującego prostego twierdzenia, zwanego zasadą majoranty. Twierdzenie 2.11. Niech f : [a, b] → R. Funkcja f ma wahanie ograniczone na przedziale [a, b] wtedy i tylko wtedy, gdy istnieje funkcja g : [a, b] → R, która jest rosnąca na przedziale [a, b] i taka, że |f (y) − f (x)| ¬ g(y) − g(x) (2.19) dla dowolnych x, y ∈ [a, b], x < y. Dowód. Załóżmy najpierw, że istnieje funkcja g o żądanych własnościach. Wtedy, z nierówności (2.19), dla dowolnego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) mamy: Var(f, P ; [a, b]) = m X |f (ti ) − f (ti−1 )| ¬ i=1 m X i=1 = g(b) − g(a) . 25 [g(ti ) − g(ti−1 )] Stąd, wobec dowolności podziału P , otrzymujemy: Var(f ; [a, b]) ¬ g(b) − g(a) < ∞ . Na odwrót, jeżeli f ∈ BV ([a, b]) to biorąc funkcję g : [a, b] → R, określoną wzorem g(x) = Vf (x) = Var(f ; [a, x]) dla x ∈ [a, b] (funkcja ta jest rosnąca na podstawie twierdzenia opisującego własności wahania), na postawie nierówności (2.16) dostajemy dla x, y ∈ [a, b], x < y: |f (y) − f (x)| ¬ Var(f ; [x, y]) = Var(f ; [a, y]) − Var(f ; [a, x]) = Vf (y) − Vf (x) = g(y) − g(x) , co kończy dowód. Okazuje się, że między funkcją f ∈ BV ([a, b]) a jej funkcją wahania Vf (x) = Var(f ; [a, x]) istnieje bardzo ścisła współzależność. Zachodzi bowiem następujące twierdzenie. Twierdzenie 2.12. Niech f ∈ BV ([a, b]) i niech x0 będzie dowolnie ustalonym punktem przedziału [a, b]. Funkcja f jest ciągła w punkcie x0 wtedy i tylko wtedy, gdy funkcja Vf jest ciągła w punkcie x0 Dowód. Załóżmy najpierw, że f jest ciągła w punkcie x0 , przy czym x0 < b. Weźmy x ∈ (x0 , b) tzn. x0 < x < b. Rozważmy różnicę Vf (x) − Vf (x0 ). Korzystając z definicji kresu górnego dobierzmy podział P = {t0 , t1 , ..., tm } ∈ P([x0 , b]) taki, że Var(f ; [x0 , b]) − ε < Var(f, P ; [x0 , b]) lub, równoważnie Var(f ; [x0 , b]) < Var(f, P ; [x0 , b]) + ε . (2.20) Następnie, wykorzystując fakt, że funkcja f jest ciągła w punkcie x0 , dobierzmy δ takie, że 0 < δ < t1 − x0 oraz |f (x) − f (x0 )| < ε dla 0 < x − x0 < δ. Wtedy, dla takich właśnie x (tzn. x ∈ (x0 , x0 + δ)) mamy: Vf (x) − Vf (x0 ) = Var(f ; [a, x]) − Var(f ; [a, x0 ]) = Var(f ; [x0 , x]) 26 = Var(f ; [x0 , b]) − Var(f ; [x, b]) < Var(f, P ; [x0 , b]) + ε − Var(f ; [x, b]) . Ale δ < t1 − x0 , x − x0 < δ ⇒ x − x0 < t1 − x0 ⇒ x < t1 więc x0 < x < t1 . Stąd i z powyższego oszacowania dostajemy: Vf (x) − Vf (x0 ) < |f (x) − f (x0 )| + |f (t1 ) − f (x)| + m X |f (tj ) − f (tj−1 )| j=2 − Var(f ; [x, b]) + ε ¬ |f (x) − f (x0 )| + ε < 2ε , ponieważ Var(f ; [x, b]) |f (t1 ) − f (x)| + m P |f (tj ) − f (tj−1 )| . j=2 Z ostatniej nierówności wynika, że funkcja Vf jest ciągła prawostronnie w punkcie x0 . W podobny sposób pokazujemy, że Vf jest ciągła z lewej strony w punkcie x0 , co ostatecznie dowodzi ciągłości funkcji Vf w punkcie x0 (włączając przypadki x0 = a i x0 = b). Na odwrót, załóżmy, że Vf jest ciągła w punkcie x0 ∈ [a, b]. Wtedy, dla x x0 mamy: |f (x) − f (x0 )| ¬ Var(f ; [x0 , x]) = Var(f ; [a, x])− − Var(f ; [a, x0 ]) = Vf (x) − Vf (x0 ) → 0 przy x → x0 +. Natomiast, dla x ¬ x0 otrzymujemy |f (x) − f (x0 )| ¬ Var(f ; [x, x0 ]) = Var(f ; [a, x0 ])− − Var(f ; [a, x]) = Vf (x0 ) − Vf (x) → 0 przy x → x0 −. W konkluzji dostajemy, że funkcja f jest ciągła w punkcie x0 i koniec dowodu. Zauważmy teraz, że rozkład Jordana funkcji f ∈ BV ([a, b]) na różnicę dwóch funkcji rosnących na przedziale [a, b] pozwala nie tylko uzyskać informacje o tym, że funkcja f ma co najwyżej przeliczalną ilość punktów nieciągłości. Tych konsekwencji jest więcej. Np. z analizy matematycznej wiadomo, że funkcja monotoniczna na przedziale [a, b] jest na tym przedziale całkowalna w sensie Riemanna. Stąd i z twierdzenia Jordana wynika następujące twierdzenie. Twierdzenie 2.13. Jeżeli f ∈ BV ([a, b]) to f jest całkowalna w sensie Riemanna na przedziale [a, b]. 27 Mimo, że funkcja o wariacji ograniczonej na przedziale ma na tym przedziale co najwyżej przeliczalną ilość punktów nieciągłości, to implikacja odwrotna nie jest prawdziwa. Mało tego, istnieją funkcje ciągłe, które mają wariację nieograniczoną. Przykład 2.14. Niech f : [0, 1] → R będzie określona wzorem f (x) = x sin x1 dla x ∈ (0, 1] 0 dla x = 0 . Oczywiście f (0) = 0 oraz lim f (x) = lim x sin x1 = 0, a więc funkcja f jest ciągła w x→0 x→0 punkcie x = 0. Ciągłość funkcji f na przedziale (0, 1] jest konsekwencją twierdzeń o ciągłości funkcji złożonej i o ciągłości iloczynu funkcji ciągłych. Zatem f jest ciągła na przedziale [0, 1]. Pokażemy, że f ∈ / BV ([0, 1]). W tym celu weźmy podział P = {t0 , t1 , ..., tm } ∈ P([0, 1]) taki, że t0 = 0, tk = 2 dla k = 1, 2, ..., m − 1 oraz tm = 1 . [2m − (2k − 1)]π I tak, mamy na przykład: t1 = 2 , (2m − 1)π t2 = 2 , (2m − 3)π t3 = 2 , ... (2m − 5)π 2 2 2 = = , {2m − [2(m − 2) − 1]}π [2m − (2m − 5)]π 5π 2 2 2 tm−1 = = = . {2m − [2(m − 1) − 1]}π [2m − (2m − 3)]π 3π Ustalmy teraz j, 2 ¬ j ¬ m − 1. Wtedy kolejne punkty tj−1 , tj naszego podziału są takie, ... , tm−2 = że 1 1 [2m − (2j − 1)]π − {2m − [2(j − 1) − 1]}π − = tj tj−1 2 −2π (2m − 2j + 1)π − (2m − 2j + 3)π = = −π 2 2 więc funkcja x → sin x1 przyjmuje w tych punktach na przemian wartości 1 i −1. Rzeczy= wiście mamy: 1 π π π sin = sin (2m − 2j + 1) = sin(2p + 1) = sin + pπ tj 2 2 2 Dalej mamy: |f (tj ) − f (tj−1 )| = 1 tj sin tj − tj−1 sin 28 1 tj−1 = |tj + tj−1 | . 2tj−1 . Zatem: Var(f, P ; [0, 1]) m−1 X |f (tj ) − f (tj−1 )| j=2 2 2 2 + + ··· + 2(t1 + t2 + ... + tm−2 ) = 2 5π 7π (2m − 1)π 4 1 1 1 = + + ··· + π 5 7 2m − 1 Z faktu, że szereg harmoniczny jest rozbieżny wynika, że ! Var(f ; [0, 1]) = ∞ . Następne twierdzenie, które podamy, mówić będzie o możliwości przechodzenia do granicy przy zbieżności punktowej ciągu funkcji o wariacji ograniczonej. Twierdzenie 2.15. Niech (fn ) będzie ciągiem funkcyjnym takim, że fn ∈ BV ([a, b]) dla każdego n = 1, 2, ... . O ciągu tym zakładamy, że jest punktowo zbieżny do pewnej funkcji f , tzn. istnieje funkcja f : [a, b] → R taka, że f (x) = n→∞ lim fn (x) dla dowolnego x ∈ [a, b]. Wtedy Var(f ; [a, b]) ¬ lim inf Var(fn ; [a, b]) . n→∞ (2.21) W szczególności, jeżeli (fn ) jest ciągiem funkcji rzeczywistych, określonych na przedziale [a, b], o wariacjach wspólnie ograniczonych na [a, b], zbieżnym punktowo do pewnej funkcji f : [a, b] → R, to f ∈ BV ([a, b]). Dowód. Jeżeli wielkość po prawej stronie nierówności (2.21) jest równa +∞, to oczywiście nierówność (2.21) jest spełniona. Przypuśćmy więc, że tak nie jest, tzn. istnieje stała L > 0 taka, że lim inf Var(fn ; [a, b]) = L . n→∞ Ustalmy dalej dowolnie liczbę ε > 0. Wtedy, biorąc pod uwagę definicję granicy dolnej ciągu liczbowego wnioskujemy, że istnieje podciąg (fkn ) ciągu (fn ) taki, że Var(fkn ; [a, b]) ¬ L + ε dla n = 1, 2, ... . 29 Ustalmy teraz dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy dostajemy: Var(fkn , P ; [a, b]) = m X |fkn (tj ) − fkn (tj−1 )| ¬ L + ε . j=1 Przechodząc teraz z n → ∞ otrzymujemy stąd Var(f, P ; [a, b]) = m X |f (tj ) − f (tj−1 )| ¬ L + ε . j=1 Ponieważ ta nierówność zachodzi dla każdego podziału P ∈ P([a, b]), więc stąd wynika, że Var(f ; [a, b]) ¬ L + ε . Stąd, ze względu na dowolność liczby ε otrzymujemy, że Var(f ; [a, b]) ¬ L , co dowodzi nierówności (2.21). Druga część twierdzenia jest bezpośrednią konsekwencją pierwszej części. Jak już wcześniej zauważyliśmy, zbiór BV ([a, b]) tworzy przestrzeń liniową nad ciałem liczb rzeczywistych R. Teraz, dla dowolnie zadanej funkcji f ∈ BV ([a, b]) połóżmy: ||f ||BV = |f (a)| + Var(f ; [a, b]) . (2.22) Mamy następujące twierdzenie. Twierdzenie 2.16. Wielkość || · ||BV zadana wzorem (2.22) jest normą w przestrzeni BV ([a, b]). Norma ta jest zupełna, tzn. przestrzeń BV ([a, b]) z tą normą jest przestrzenią Banacha. Dowód. Z definicji wielkości || · ||BV widzimy, że w przestrzeni BV ([a, b]) przyjmuje ona wartości rzeczywiste nieujemne. Warunek ||f ||BV = 0 ⇔ f ≡ 0 na [a, b] jest łatwy do sprawdzenia i jest on konsekwencją faktu, że jeżeli Var(f ; [a, b]) = 0 to funkcja f jest stała na przedziale [a, b]. Warunek ||λf ||BV = |λ|||f ||BV wynika z dodatniej jednorodności wariacji funkcji. Natomiast warunek trójkąta dla || · ||BV jest prostą kosekwencją podaddytywności wariacji ze względu na funkcje. 30 Zatem wielkość ||·||BV spełnia warunki normy w przestrzeni liniowej BV ([a, b]). Pokażemy teraz, że ta norma jest zupełna. W tym celu załóżmy, że (fn ) jest ciągiem funkcyjnym z BV ([a, b]) spełniającym warunek Cauchy’ego względem normy || · ||BV . Oznacza to, że dla ustalonego dowolnie ε > 0 znajdziemy liczbę naturalną n0 taką, że dla m, n ∈ N, m, n n0 mamy, że ||fn − fm ||BV = |fn (a) − fm (a)| + Var(fn − fm ; [a, b]) ¬ ε . 2 (2.23) Z powyższej nierówności wynika w szczególności, że |fn (a) − fm (a)| ¬ ε 2 (2.24) dla n, m n0 , a to oznacza, że ciąg liczbowy (fn (a)) jest ciągiem Cauchy’ego. Zatem ten ciąg jest zbieżny do pewnej liczby rzeczywistej, którą oznaczymy przez f (a). Biorąc teraz m → ∞ w nierówności (2.24) i korzystając z ciągłości bezwzględnej wartości, otrzymujemy |fn (a) − f (a)| ¬ ε 2 (2.25) dla n ∈ N, n n0 . Dalej, z nierówności (2.23), dla n, m ∈ N, n, m n0 otrzymujemy: Var(fn − fm ; [a, b]) ¬ ε . 2 (2.26) Ustalmy dalej dowolnie x ∈ (a, b]. Wtedy, z (2.26) i z własności wariacji wnioskujemy, że Var(fn − fm ; [a, x]) ¬ ε . 2 Zatem, biorąc podział {a, x} przedziału [a, x], z powyższej nierówności otrzymujemy: |fn (x) − fm (x)| − |fn (a) − fm (a)| ¬ |[fn (x) − fm (x)] − [fn (a) − fm (a)]| = Var(fn − fm , {a, x}; [a, x]) ε ¬ Var(fn − fm ; [a, x]) ¬ . 2 Stąd otrzymujemy, że |fn (x) − fm (x)| ¬ |fn (a) − fm (a)| + 31 ε ¬ε 2 (2.27) dla x ∈ [a, b]. Nierówność (2.27) implikuje, że dla każdego x ∈ [a, b] ciąg liczbowy (fn (x)) jest ciągiem Cauchy’ego, więc ten ciąg jest zbieżny do liczby, którą oznaczymy przez f (x). Mamy zatem określoną funkcję f : [a, b] → R taką, że ciąg (fn ) jest punktowo zbieżny do tej funkcji. Pokażemy teraz, że ciąg (fn ) jest zbieżny do funkcji f w sensie normy (2.22). W tym celu odnotujmy najpierw, że ciąg (fn ) jest ograniczony w normie || · ||BV , jako ciąg Cauchy’ego tzn. istnieje stała M > 0 taka, że ||fn ||BV ¬ M dla n ∈ N. Stąd w szczególności otrzymujemy, że Var(fn ; [a, b]) ¬ M dla wszystkich n ∈ N. Zatem wariacje Var(fn ; [a, b]) są wspólnie ograniczone, co na podstawie Twierdzenia 2.15 pozwala wywnioskować, że f ∈ BV ([a, b]). Dalej zauważmy, że z (2.26), po przejściu z m → ∞, na podstawie Twierdzenia 2.15 otrzymujemy Var(fn − f ; [a, b]) ¬ lim inf Var(fn − fm ; [a, b]) ¬ m→∞ ε 2 dla n n0 . Stąd i z (2.25) wynika, że ||fn − f ||BV ¬ ε a to oznacza, że ciąg funkcyjny (fn ) jest zbieżny w przestrzeni BV ([a, b]) do funkcji f i kończy dowód. Jak to wcześniej zauważyliśmy omawiając własności funkcji o wariacji ograniczonej, iloczyn dwóch funkcji o wariacji ograniczonej jest funkcją o wariacji ograniczonej. Oznacza to, że przestrzeń liniowa (Banacha) BV ([a, b]) z działaniem mnożenia funkcji ma algebraiczną strukturę algebry Banacha (tzn. określone jest mnożenie jako operacja wewnętrzna, asocjatywna i mająca dodatkowo jedynkę - funkcja tożsamościowo równa 1 na przedziale [a, b] - oraz operacja ta jest przemienna). Zatem BV ([a, b]) (z operacjami dodawania funkcji, ich mnożenia przez liczby rzeczywiste oraz z operacją mnożenia) jest przemienną algebrą z jednością. Ogólnie przyjmujemy następującą definicję. 32 Definicja 2.17. Niech V będzie algebrą nad ciałem K (K = R lub K = C), która jest dodatkowo przestrzenią Banacha z normą || · || określoną na V . Algebrę V będziemy nazywać algebrą Banacha, jeżeli istnieje c > 0 takie, że ||x · y|| ¬ c||x|| · ||y|| (2.28) dla dowolnych x, y ∈ V . Jeżeli w nierówności (2.28) można przyjąć c = 1, tzn. jeżeli dla dowolnych x, y ∈ V zachodzi nierówność: ||xy|| ¬ ||x|| · ||y|| , to algebrę V nazywamy znormalizowaną algebrą Banacha. Udowodnimy teraz następujące twierdzenie. Twierdzenie 2.18. Algebra BV ([a, b]) z normą określoną wzorem (2.22), tzn. z normą określoną dla dowolnej funkcji f ∈ BV ([a, b]) wzorem ||f ||BV = |f (a)| + Var(f ; [a, b]) jest algebrą Banacha. Ponadto, dla dowolnych funkcji f, g ∈ BV ([a, b]) ma miejsce nierówność: Var(f g; [a, b]) ¬ ||f ||∞ Var(g; [a, b]) + ||g||∞ Var(f ; [a, b]) , (2.29) gdzie symbol || · ||∞ oznacza normę w przestrzeni B([a, b]), określoną wzorem: ||f ||∞ = sup{|f (x)| : x ∈ [a, b]} . Dowód. W dowodzie będziemy korzystać z faktu, że każda funkcja o wariacji ograniczonej na przedziale [a, b] jest ograniczona na tym przedziale. Weźmy dalej dowolnie ustalone funkcje f, g ∈ BV ([a, b]). Następnie ustalmy dowolny podział a = t0 < t1 < t2 < ... < tm = b, tzn. podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy mamy: Var(f g, P ; [a, b]) = m X |f (tj )g(tj ) − f (tj−1 )g(tj−1 )| j=1 = m X |f (tj )g(tj ) − f (tj )g(tj−1 ) + f (tj )g(tj−1 ) − f (tj−1 )g(tj−1 )| j=1 33 ¬ m X {|f (tj )||g(tj ) − g(tj−1 )| + |g(tj−1 )||f (tj ) − f (tj−1 )|} j=1 ¬ m X {||f ||∞ |g(tj ) − g(tj−1 )| + ||g||∞ |f (tj ) − f (tj−1 )|} j=1 = ||f ||∞ m X |g(tj ) − g(tj−1 )| + ||g||∞ j=1 m X |f (tj ) − f (tj−1 )| j=1 = ||f ||∞ Var(g, P ; [a, b]) + ||g||∞ Var(f, P ; [a, b]) ¬ ||f ||∞ Var(g; [a, b]) + ||g||∞ Var(f ; [a, b]) . Stąd otrzymujemy nierówność (2.29), co kończy dowód. W dalszym ciągu, dla dowolnej funkcji f ∈ BV ([a, b]) połóżmy ||f ||1BV = ||f ||∞ + Var(f ; [a, b]) . (2.30) Wtedy, możemy sformułować następujące twierdzenie. Twierdzenie 2.19. Wielkość || · ||1BV określona wzorem (2.30) jest normą w przestrzeni BV ([a, b]) równoważną normie || · ||BV . Dowód. Fakt, że || · ||1BV spełnia warunki normy w przestrzeni BV ([a, b]) dowodzi się łatwo wykorzystując własności wariacji funkcji wykazane w Twierdzeniu 2.3 oraz to, że || · ||∞ jest normą w przestrzeni B([a, b]). Ustalmy teraz dowolną funkcję f ∈ BV ([a, b]). Wtedy dostajemy ||f ||BV = |f (a)| + Var(f ; [a, b]) ¬ ||f ||∞ + Var(f ; [a, b]) = ||f ||1BV . (2.31) Z drugiej strony, korzystając z nierówności udowodnionej w Twierdzeniu 2.3(d), otrzymujemy ||f ||1BV = ||f ||∞ + Var(f ; [a, b]) ¬ |f (a)| + Var(f ; [a, b]) + Var(f ; [a, b]) = |f (a)| + 2Var(f ; [a, b]) ¬ 2|f (a)| + 2Var(f ; [a, b]) = 2||f ||BV . 34 (2.32) Ostatecznie, z (2.31) i (2.32) wnioskujemy, że mają miejsce nierówności 1 ||f ||1BV ¬ ||f ||BV ¬ ||f ||1BV . 2 (2.33) Powyższa nierówność oznacza, że norma || · ||1BV jest równoważna normie || · ||BV i kończy dowód. Wniosek 2.20. Przestrzeń BV ([a, b]) z normą || · ||BV tworzy algebrę Banacha taką, że ||f g||BV ¬ 4||f ||BV ||g||BV (2.34) dla dowolnych f, g ∈ BV ([a, b]). Ponadto, BV ([a, b]) z normą || · ||1BV tworzy znormalizowaną algebrę Banacha. Dowód. Zauważmy, że z faktu orzekającego, że BV ([a, b]) jest przestrzenią Banacha z normą || · ||BV (por. Twierdzenie 2.16) oraz z Twierdzenia 2.19 wynika, że norma || · ||1BV jest zupełna w przestrzeni BV ([a, b]). Dalej, dla f, g ∈ BV ([a, b]), korzystając z (2.29), otrzymujemy: ||f g||1BV = ||f g||∞ + Var(f g; [a, b]) ¬ ||f ||∞ · ||g||∞ + ||f ||∞ Var(g; [a, b]) + ||g||∞ Var(f ; [a, b]) ¬ ||f ||∞ · ||g||∞ + ||f ||∞ Var(g; [a, b]) + ||g||∞ Var(f ; [a, b]) + Var(f ; [a, b]) · Var(g; [a, b]) = (||f ||∞ + Var(f ; [a, b]))(||g||∞ + Var(g; [a, b])) = ||f ||1BV · ||g||1BV . Powyższa nierówność oznacza, że BV ([a, b]) z normą || · ||1BV jest znormalizowaną algebrą Banacha. Teraz, wykorzystując wyżej ustalony fakt i (2.33), dla dowolnych f, g ∈ BV ([a, b]) dostajemy: ||f g||BV ¬ ||f g||1BV ¬ ||f ||1BV · ||g||1BV ¬ 2||f ||BV · 2||g||BV = 4||f ||BV ||g||BV , co dowodzi nierówności (2.34) i kończy dowód. Podamy teraz kilka uwag związanych z omawianą wyżej tematyką funkcji o wariacji ograniczonej. 35 Uwaga 2.21. Zauważmy, że każda funkcja f : [a, b] → R, spełniająca warunek Lipschitza na przedziale [a, b] (ze stałą L), jest funkcją o wariacji ograniczonej na [a, b] oraz Var(f ; [a, b]) ¬ L(b − a) . Pominiemy proste uzasadnienie tego faktu. Uwaga 2.22. Mówimy, że funkcja f : [a, b] → R spełnia warunek Höldera na przedziale [a, b], jeżeli istnieją stałe L > 0 oraz α ∈ (0, 1] takie, że |f (x) − f (y)| ¬ L|x − y|α dla dowolnych x, y ∈ [a, b]. Okazuje się, że funkcja spełniająca na przedziale [a, b] warunek Höldera nie musi mieć wariacji ograniczonej na [a, b]. Przykład takiej funkcji można skonstruować w następujący sposób (por. [1]): Ustalmy liczbę α ∈ (0, 1). Następnie, zdefiniujmy stałą γ i ciąg (tn ) w przedziale [0, 1] kładąc: γ= tn = ∞ X 1 k=1 k 1/α , ∞ 1 1X 1/α γ k=n k dla n = 1, 2, .... Zauważmy, że t1 = 1 oraz, że ciąg (tn ) jest malejący a także, że n→∞ lim tn = 0. Rozważmy dalej funkcję f : [0, 1] → R, określoną wzorem 0 dla x = 0 liniowa i łącząca kolejne punkty tn , (−1) n f (x) = (−1)n n dla x = tn n odpowiednio . Biorąc teraz podział Pn = {0, tn , tn−1 , ..., t2 , t1 } ∈ P([0, 1]) łatwo zauważyć, że Var(f, Pn ; [0, 1]) 1 + 1 1 1 + + ··· + → ∞ 2 3 n a więc f 6∈ BV ([0, 1]). Teraz, niech 0 < x < y ¬ 1. Dobierzmy m, n ∈ N tak, żeby tn+1 ¬ x ¬ tn oraz tm+1 ¬ y ¬ tm . Wtedy mamy trzy przypadki. 36 (1) n = m. W tym przypadku mamy, że 0 < y − x ¬ tn − tn+1 = 1 , γn1/α skąd |f (x) − f (y)| = (y − x) 2γn1/α |f (tn ) − f (tn+1 )| ¬ (y − x) tn − tn+1 n = 2γ|x − y|α · |x − y|1−α · n(1−α)/α ¬ 2γ|x − y|α |tn − tn+1 |1−α · n(1−α)/α ¬ 2γ|x − y|α · n(1−α)/α = 2γ α |x − y|α . γ 1−α · n(1−α)/α (2) n = m + 1. Wtedy tn = tm+1 i stąd dostajemy: |f (x) − f (y)| ¬ |f (x) − f (tn )| + |f (tm+1 ) − f (y)| ¬ 2γ α (|x − tn |α + |tm+1 − y|α ) ¬ 4γ α |x − y|α Zauważmy, że w dowodzie powyższej nierówności skorzystaliśmy z oczywistej nierówności xα + y α ¬ (x + y)α + (x + y)α = 2(x + y)α . (3) n m + 2. Wtedy możemy znaleźć punkty s ∈ [tn , tn−1 ], t ∈ [tm+2 , tm+1 ] takie, że f (s) = f (t) = 0. Stąd mamy: |f (x) − f (y)| ¬ |f (x) − f (s)| + |f (s) − f (t)| + |f (t) − f (y)| ¬ 4γ α (|x − s|α + |t − y|α ) ¬ 8γ α |x − y|α . Podsumowując widzimy, że w każdym z trzech możliwych rozważanych przypadków funkcja f spełnia warunek Höldera z wykładnikiem α i ze stałą L = 8γ α dla 0 < x < y ¬ 1. ”Dołączenie” sytuacji x = 0 nie przedstawia trudności (ciągłość funkcji f w punkcie x = 0). 37 Uwaga 2.23. Bardzo ważną podklasę klasy funkcji o wariacji ograniczonej na ustalonym przedziale [a, b] stanowi klasa tzw. funkcji bezwzględnie ciągłych. Przedstawimy kilka faktów dotyczących tej właśnie klasy. Zaczniemy od wprowadzenia pewnych oznaczeń. Mianowicie, symbolem P ([a, b]) bę- dziemy oznaczać rodzinę wszystkich skończonych zbiorów S = {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} złożoną z parami niezachodzących na siebie podprzedziałów przedziału [a, b]. Podobnie, symbolem P ∞ ([a, b]) będziemy oznaczać rodzinę wszystkich nieskończonych i przeliczal- nych zbiorów S∞ = {[an , bn ] : n ∈ N} złożonych z niezachodzących na siebie podprzedziałów przedziału [a, b]. Definicja 2.24. Funkcję f : [a, b] → R będziemy nazywać bezwzględnie ciągłą, jeżeli dla każdej liczby ε > 0 istnieje δ > 0 takie, że dla każdego zbioru S = {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} ∈ P ([a, b]) takiego, że n X (bi − ai ) ¬ δ (2.35) |f (bi ) − f (ai )| ¬ ε . (2.36) i=1 spełniona jest nierówność n X i=1 Zauważmy, że równoważnie możemy zażądać, że dla każdego ε > 0 istnieje δ > 0 takie, że dla każdego nieskończonego zbioru S∞ = {[an , bn ] : n ∈ N} ∈ P ∞ ([a, b]) takiego, że ∞ X (bi − ai ) ¬ δ (2.37) |f (bi ) − f (ai )| ¬ ε . (2.38) i=1 mamy, że ∞ X i=1 Rzeczywiście, zauważmy najpierw, że definicja, w której występuje P ∞ ([a, b]) implikuje Definicję 2.24. W tym celu ustalmy dowolnie ε > 0 i dobierzmy δ > 0 zgodnie z (2.37)(2.38). Dalej, weźmy dowolny zbiór X S = {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} ∈ ([a, b]) taki, że spełniona jest nierówność (2.35). Zastąpmy przedział [an , bn ] zbiorem S∞ = {[αi , αi+1 ] : i ∈ N, i n} ∈ P ∞ ([an , bn ]) gdzie αn = an , αn+1 = 21 (αn + bn ), αn+2 = 12 (αn+1 + bn ), ... . 38 , Wtedy b n − an = ∞ X (αi+1 − αi ) , i=n a zatem zbiór {[a1 , b1 ], [a2 , b2 ], ..., [an−1 , bn−1 ], [αn , αn+1 ], [αn+1 , αn+2 ], ...} tworzy nieskończony ciąg niezachodzących na siebie przedziałów takich, że n X (bi − ai ) = n−1 X ∞ X i=1 i=n i=1 (bi − ai ) + (αi+1 − αi ) ¬ δ . Stąd, zgodnie z założeniem, dostajemy n X |f (bi ) − f (ai )| ¬ i=1 n−1 X |f (bi ) − f (ai )| + i=1 ∞ X |f (αi+1 ) − f (αi )| ¬ ε . i=n Dowodzi to bezwzględnej ciągłości funkcji w sensie Definicji 2.24. Na odwrót, załóżmy, że funkcja f jest bezwzględnie ciągła w sensie Definicji 2.24. Ustalmy ε > 0 i dobierzmy δ > 0 zgodnie z tą definicją. Weźmy dowolny nieskończony ciąg {[ai , bi ] : i ∈ N} ∈ P ∞ ([a, b]) taki, że spełniona jest nierówność (2.37). Wtedy, dla każdego dowolnie ustalonego n ∈ N mamy, że zbiór {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} ∈ oraz n P P ([a, b]) (bi − ai ) ¬ δ. Wtedy, zgodnie z Definicją 2.24 spełniona jest nierówność (2.36). i=1 Stąd wynika, że ∞ X |f (bi ) − f (ai )| ¬ ε , i=1 a to oznacza, że funkcja f jest bezwzględnie ciągła na przedziale [a, b] w sensie sformułowanej wyżej definicji równoważnej Definicji 2.24. Zbiór wszystkich funkcji bezwzględnie ciągłych na przedziale [a, b] będziemy dalej oznaczać symbolem AC([a, b]). Zauważmy dalej, że bezwzględna ciągłość implikuje ciągłość (jednostajną) na przedziale [a, b]. Ponadto, prawdziwe jest również następujące twierdzenie. Twierdzenie 2.25. Każda funkcja bezwzględnie ciągła na przedziale [a, b] jest na tym przedziale funkcją o wariacji ograniczonej. Dowód. Niech f będzie funkcją bezwzględnie ciągłą na [a, b]. Wtedy np. do liczby ε = 1 możemy dobrać taką liczbę δ > 0, że nierówność (2.35) implikuje, że n X |f (bi ) − f (ai )| ¬ 1 . i=1 39 (2.39) Rozważmy dalej równoodległy podział Pn = {t0 , t1 , ..., tn } przedziału [a, b], gdzie n jest tak duże, że nδ b − a. Wtedy, zgodnie z doborem δ, na każdym przedziale [ti−1 , ti ] takim, że ti−1 , ti ∈ Pn , po uwzględnieniu (2.39) mamy Var(f ; [ti−1 , ti ]) ¬ 1 . Stąd, biorac pod uwagę addytywność wariacji ze względu na przedziały, otrzymujemy Var(f ; [a, b]) ¬ n < ∞ , co kończy dowód. Zwróćmy uwagę na to, że z powyższego twierdzenia wynika, że AC([a, b]) ⊂ BV ([a, b]). Nietrudno również pokazać, że zbiór AC([a, b]) tworzy podprzestrzeń przestrzeni liniowej BV ([a, b]) a więc ma strukturę przetrzeni liniowej nad ciałem liczb rzeczywistych R. Przestrzeń AC([a, b]) odgrywa bardzo ważną rolę w teorii funkcji rzeczywistych (w teorii miary i całki) oraz w analizie funkcjonalnej. Uwaga 2.26. Zwrócimy teraz uwagę na dość istotne twierdzenie dotyczące funkcji o wariacji ograniczonej. Twierdzenie to nazywa się twierdzeniem Helly’ego lub zasadą wyboru Helly’ego. Dotyczy ono zbieżności punktowej podciągów wybieranych z ciągu funkcji o wariacji ograniczonej. Twierdzenie 2.27. Niech (fn ) będzie ciągiem funkcyjnym złożonym z funkcji o wariacji ograniczonej na przedziale [a, b]. Zakładamy, że ciąg ten jest ograniczony względem normy || · ||BV zdefiniowanej wzorem (2.22). Wtedy z ciągu (fn ) można wybrać podciąg zbieżny punktowo na przedziale [a, b] do funkcji f ∈ BV ([a, b]). Dowód. Korzystając z twierdzenia Jordana (Twierdzenie 2.6) możemy sprowadzić rozważany problem do funkcji monotonicznych w następujący sposób. Połóżmy gn (x) = Vfn (x) = Var(fn ; [a, x]) , hn (x) = gn (x) − fn (x) dla x ∈ [a, b]. Wiemy, że gn i hn są rosnące i ograniczone oraz fn = gn − hn dla n ∈ N. Wspólna ograniczoność wariacji funkcji gn oraz hn wynika z Twierdzenia 2.9. Pokażemy, 40 że ciągi (gn ) i (hn ) zawierają podciągi, które są zbieżne punktowo na przedziale [a, b] do pewnych funkcji rosnących g i h, odpowiednio. Wtedy funkcja f = g − h będzie miała żądane własności. Zatem, niech gn : [a, b] → R będzie funkcją rosnącą oraz niech |gn (x)| ¬ c < ∞ dla n ∈ N oraz x ∈ [a, b]. Załóżmy, że E = {r1 , r2 , ...} jest pewnym przeliczalnym zbiorem gęstym w przedziale [a, b] takim, że r1 = a oraz r2 = b. Ponieważ |gn (r1 )| ¬ c dla n ∈ N, więc z twierdzenia Bolzano-Weierstrassa możemy znaleźć podciąg (gn(1) ) ciągu (gn ), który jest zbieżny w punkcie r1 . Podobnie, ponieważ |gn(1) (r2 )| ¬ c dla n ∈ N, to możemy znaleźć podciąg (gn(2) ) ciągu (gn(1) ), który jest zbieżny w punktach r1 i r2 . Mając skonstruowany ciąg (gn(k−1) ) w taki właśnie sposób, możemy wybrać podciąg (gn(k) ) ciągu (gn(k−1) ), który jest zbieżny w (k) punktach r1 , r2 , ..., rk . Zatem, ciąg przekątniowy (gnk ) określony wzorem gnk (x) = gk (x) jest zbieżny w każdym punkcie rj ∈ E. Teraz, określmy funkcję g : [a, b] → R kładąc g(x) = jeżeli x = rj ∈ E lim gnk (x) k→∞ sup lim gnk (rj ) dla rj <x k→∞ x pozostałych , gdzie supremum bierzemy po wszystkich elementach rj ∈ E takich, że rj < x. Z konstrukcji wynika, że funkcja g jest ograniczona i rosnąca oraz gnk (x) → g(x) punktowo na zbiorze E, przy k → ∞. Ponieważ zbiór D punktów nieciągłości funkcji g jest co najwyżej przeliczalny, więc zbiór D ∪ E jest przeliczalny. Ustalmy x ∈ [a, b] \ (D ∪ E). Dla zadanego ε > 0 możemy dobrać ri , rj takie, że ri < x < rj (2.40) g(rj ) − g(ri ) < ε , (2.41) oraz ponieważ funkcja g jest ciągła w punkcie x. Ponadto, korzystając z punktowej zbieżności ciągu (gnk ) do g na zbiorze E, znajdziemy k0 ∈ N takie, że |gnk (ri ) − g(ri )| < ε , (2.42) |gnk (rj ) − g(rj )| < ε (2.43) 41 dla k k0 . Dalej, łącząc (2.40), (2.41), (2.42) i (2.43) otrzymujemy g(x) − ε < g(ri ) ¬ gnk (ri ) + ε ¬ gnk (x) + ε ¬ gnk (rj ) + ε < g(rj ) + 2ε ¬ g(x) + 2ε , (2.44) ponieważ ri < x < rj i funkcje występujące w (2.44) są rosnące. Pokazuje to, że gnk (x) → g(x) punktowo na zbiorze [a, b] \ D gdy k → ∞. Jednakże zbiór D jest co najwyżej przeliczalny i ciąg (gnk ) jest wspólnie ograniczony. Możemy więc użyć jeszcze raz procedury przekątniowej opisanej wyżej aby znaleźć jeszcze jeden podciąg, który jest zbieżny punktowo na całym przedziale [a, b]. Funkcja graniczna g otrzymana tą drogą jest, jak można pokazać, funkcją rosnącą. Koniec dowodu. Uwaga 2.28. Twierdzenie Jordana (Twierdzenie 2.6) jest twierdzeniem charakteryzującym funkcje o wariacji ograniczonej poprzez różnicę dwóch funkcji rosnących, a więc twierdzenie to ma charakter liniowy. Przedstawimy teraz inne twierdzenie, zwane twierdzeniem Federera, które charakteryzuje funkcje o wariacji ograniczonej poprzez złożenie funkcji rosnącej i funkcji spełniającej warunek Lipschitza. Jest to więc twierdzenie w pewnym sensie analogiczne do twierdzenia Sierpińskiego (Twierdzenie 1.11). Twierdzenie 2.29. Funkcja f należy do przestrzeni BV ([a, b]) wtedy i tylko wtedy, gdy można ją przedstawić w postaci złożenia f = g ◦ τ , gdzie τ : [a, b] → [c, d] jest rosnąca oraz funkcja g : [c, d] → R spełnia na przedziale [c, d] warunek Lipschitza ze stałą L = 1. Dowód. Załóżmy najpierw, że f = g ◦ τ , gdzie g oraz τ mają wspomniane własności. Weźmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy otrzymujemy Var(f, P ) = m X |g(τ (tj )) − g(τ (tj−1 ))| ¬ j=1 m X |τ (tj ) − τ (tj−1 )| j=1 = |τ (b) − τ (a)| . Stąd wynika, że f ∈ BV ([a, b]). Na odwrót załóżmy, że f ∈ BV ([a, b]). Niech τ = Vf będzie rosnącą funkcją wahania funkcji f . Wtedy funkcja ta odwzorowuje przedział [a, b] w pewien przedział [c, d], gdzie c = 0 oraz d = Var(f ; [a, b]). Oczywiście, funkcja τ nie musi być odwzorowaniem na. Jeżeli teraz określimy funkcję g na zbiorze wartości τ ([a, b]) ⊂ [c, d] przez położenie g(τ (x)) = f (x) 42 to otrzymamy rozkład f = g ◦ τ zgodnie z konstrukcją. Mamy |g(τ (s)) − g(τ (t))| = |f (s) − f (t)| ¬ Var(f ; [s, t]) = |τ (s) − τ (t)| dla a ¬ s < t ¬ b. Oznacza to, że funkcja g spełnia warunek Lipschitza ze stałą 1 na zbiorze τ ([a, b]) ⊂ [c, d]. W celu przedłużenia funkcji g ze zbioru τ ([a, b]) na cały przedział [c, d] do funkcji g spełniającej warunek Lipschitza ze stałą 1 na przedziale [c, d] (a nawet na całej prostej R) użyjemy metody ”uwypuklania”. Mianowicie, dla ustalonego dowolnie λ ∈ [0, 1] definiujemy funkcją g, kładąc g(y) = (1 − λ)g(x−) + λg(x) jeżeli y = (1 − λ)τ (x−) + λτ (x) (1 − λ)g(x) + λg(x+) jeżeli y = (1 − λ)τ (x) + λτ (x+) . Można łatwo sprawdzić, że funkcja g spełnia na przedziale [c, d] warunek Lipschitza ze stałą 1. Koniec dowodu. Zadania 1. Znaleźć funkcje f, g ∈ BV ([0, 1]) takie, że g(x) > 0 dla x ∈ [0, 1] oraz f /g 6∈ BV ([0, 1]). 2. Pokazać, że jeżeli f ∈ BV ([a, b]) to |f | ∈ BV ([a, b]) oraz Var(|f |; [a, b]) ¬ Var(f ; [a, b]). 3. Znaleźć funkcję f 6∈ BV ([0, 1]) tak, że |f | ∈ BV ([0, 1]). 4. Załóżmy, że f ∈ C([a, b]) i |f | ∈ BV ([a, b]). Pokazać, że f ∈ BV ([a, b]). 5. Niech f ∈ BV ([a, b]). Pokazać, że Vf (x0 +) − Vf (x0 ) = |f (x0 +) − f (x0 )| dla każdego x0 ∈ [a, b), oraz Vf (x0 ) − Vf (x0 −) = |f (x0 ) − f (x0 −)| dla każdego x0 ∈ (a, b]. 43 6. Udowodnić następujące twierdzenie, zwane zasadą lokalizacji: Jeżeli f 6∈ BV ([a, b]), to istnieje punkt x0 ∈ [a, b] taki, że: 1o Jeżeli x0 ∈ (a, b) to f 6∈ BV ([c, d]) dla każdego przedziału [c, d] ⊂ [a, b] takiego, że c < x0 < d. 2o Jeżeli x0 = a to f 6∈ BV ([a, c]) dla każdego przedziału [a, c] ⊂ [a, b] takiego, że a < c. 3o Jeżeli x0 = b to f 6∈ BV ([c, b]) dla każdego przedziału [c, b] ⊂ [a, b] takiego, że c < b. 7. Dla ustalonych liczb α, β ∈ R rozważmy funkcję fα,β : [0, 1] → R określoną w następujący sposób: fα,β (x) = xα sin xβ dla 0 < x ¬ 1 0 dla x = 0 . Pokazać, że dla β > 0 funkcja fα,β należy do BV ([0, 1]) wtedy i tylko wtedy, gdy α + β 0. 8. Pokazać, że funkcja f : [0, 1] → R określona wzorem f (x) = ciągła na [0, 1]. 44 √ x jest bezwzględnie 3. Funkcje o wariacji ograniczonej w sensie Wienera C. Jordan wprowadził pojęcie funkcji o wariacji ograniczonej w sensie klasycznym pod koniec XIX w. W roku 1924 amerykański matematyk N. Wiener wprowadził uogólnienie tego pojęcia, które teraz przytoczymy. Definicja 3.1. Niech p 1 będzie ustaloną liczbą rzeczywistą oraz niech dana będzie funkcja f : [a, b] → R, ograniczona na [a, b]. Dla dowolnie zadanego podziału P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]) zdefiniujmy liczbę nieujemną VarW p (f, P ) przyjmując W VarW p (f, P ) = Varp (f, P ; [a, b]) = m X |f (tj ) − f (tj−1 )|p . (3.1) j=1 Liczbę tę nazywać będziemy wariacją (wahaniem) Wienera funkcji f na przedziale [a, b] względem podziału P . Natomiast wielkość W W VarW p (f ) = Varp (f ; [a, b]) = sup{Varp (f, P ; [a, b]) : P ∈ P([a, b])} (3.2) nazywa się (całkowitą) wariacją Wienera funkcji f na przedziale [a, b] . Jeżeli VarW p (f ; [a, b]) < ∞ to mówimy, że funkcja f jest funkcją o wahaniu skończonym (ograniczonym) w sensie Wienera. Zbiór wszystkich funkcji o wahaniu ograniczonym w sensie Wienera oznaczać będziemy symbolem W BVp ([a, b]). Odnotujmy najpierw, że ma miejsce następujące twierdzenie podające własności wariacji w sensie Wienera jak również własności funkcji o wahaniu ograniczonym w sensie Wienera. W Twierdzenie 3.2. Wielkości VarW p (f, P ) oraz Varp (f ) mają następujące własności: 1/p 1/p (a) Wielkość (VarW = VarW jest podaddytywna ze względu na p (f ; [a, b])) p (f ; [a, b]) funkcje: 1/p 1/p 1/p VarW ¬ VarW + VarW , p (f + g; [a, b]) p (f ; [a, b]) p (g; [a, b]) dla dowolnych funkcji ograniczonych f, g : [a, b] → R. 45 1/p jest dodatnio jednorodna, tzn. (b) Wielkość VarW p (f ; [a, b]) 1/p 1/p = |λ|VarW VarW p (f ; [a, b]) p (λf ; [a, b]) dla dowolnego λ ∈ R. (c) Dla dowolnych t, s ∈ [a, b], s < t, ma miejsce nierówność 1/p . |f (s) − f (t)| ¬ VarW p (f ; [s, t]) (d) Każda funkcja o wahaniu ograniczonym w sensie Wienera na przedziale [a, b] jest ograniczona, tzn. jeżeli f ∈ W BVp ([a, b]) to f ∈ BV ([a, b]) oraz ma miejsce nierówność: 1/p . ||f ||∞ ¬ |f (a)| + VarW p (f ; [a, b]) (e) Zbiór W BVp ([a, b]) jest przestrzenią liniową nad ciałem R natomiast wielkość || · ||W BVp określona wzorem 1/p ||f ||W BVp = |f (a)| + VarW p (f ; [a, b]) jest normą na przestrzeni W BVp ([a, b]). Norma ta jest zupełna. Dowód. Przeprowadzimy dowody niektórych, wyżej wymienionych podpunktów. W dowodzie (a) będziemy wykorzystywać tzw. nierówność Minkowskiego, która mówi, że dla dowolnych ciągów skończonych (a1 , a2 , ..., am ), (b1 , b2 , ..., bm ) liczb rzeczywistych, spełniona jest nierówność m X 1/p |aj + bj |p ¬ m X 1/p |aj |p j=1 j=1 + m X 1/p |bj |p , (3.3) j=1 dla dowolnego p ∈ [1, ∞). Ustalmy dalej dowolny podział P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]). Wtedy dostajemy: 1/p VarW = p (f + g, P ; [a, b]) m X 1/p |f (tj ) + g(tj ) − f (tj−1 ) − g(tj−1 )|p j=1 = m X 1/p |[f (tj ) − f (tj−1 )] + [g(tj ) − g(tj−1 )]|p j=1 46 ¬ m X 1/p [|f (tj ) − f (tj−1 )| + |g(tj ) − g(tj−1 )|]p j=1 ¬ m X 1/p |f (tj ) − f (tj−1 )|p + j=1 m X 1/p |g(tj ) − g(tj−1 )|p j=1 1/p 1/p = VarW + VarW p (f ; P ; [a, b]) p (g, P ; [a, b]) 1/p 1/p ¬ VarW + VarW . p (f ; [a, b]) p (g; [a, b]) Stąd, biorac po lewej stronie powyższej nierówności kres górny ze względu na wszystkie podziały należące do P([a, b]) otrzymujemy naszą nierówność z (a). Dowód (b) jest natychmiastowy i go pominiemy. Dla dowodu (c) ustalmy dowolnie liczby t, s ∈ [a, b] takie, że s < t. Weźmy podział P = {s, t} ∈ P([s, t]). Wtedy dostajemy: W p VarW p (f, P ; [s, t]) = |f (t) − f (s)| ¬ Varp (f ; [s, t]) , skąd 1/p |f (t) − f (s)| ¬ VarW . p (f ; [s, t]) Dowodzi to (c). Dla dowodu (d) weźmy dowolną liczbę x ∈ (a, b) i rozważmy podział Px = {a, x, b}. Wtedy mamy p p VarW p (f, Px ; [a, b]) = |f (b) − f (x)| + |f (x) − f (a)| ¬ VarW p (f ; [a, b]) . Stąd dostajemy |f (x) − f (a)|p ¬ VarW p (f ; [a, b]) więc 1/p |f (x) − f (a)| ¬ VarW . p (f ; [a, b]) (3.4) |f (x)| − |f (a)| ¬ ||f (x)| − |f (a)|| ¬ |f (x) − f (a)| . (3.5) Ale Z (3.4) i (3.5) otrzymujemy: 1/p |f (x)| ¬ |f (a)| + VarW . p (f ; [a, b]) 47 (3.6) Powyższa nierówność jest również w sposób trywialny spełniona dla x = a. Następnie, biorąc podział P = {a, b} ∈ P([a, b]), mamy W p VarW p (f, P ; [a, b]) = |f (b) − f (a)| ¬ Varp (f ; [a, b]) . Stąd otrzymujemy 1/p , |f (b)| − |f (a)| ¬ |f (b) − f (a)| ¬ VarW p (f ; [a, b]) więc |f (b)| ¬ |f (a)| + VarW p (f ; [a, b]) . Łącząc powyższą nierówność z nierównością (3.6) otrzymujemy nierówność z (d). Zauważmy w końcu, że z (a) i (b) wynika, że zbiór W BVp ([a, b]) jest przestrzenią liniową nad ciałem R. Nietrudno również sprawdzić, że wielkość zdefiniowana w punkcie (e) spełnia warunki normy w przestrzeni liniowej W BVp ([a, b]). Można pokazać, że ta norma jest zupełna, co tutaj pominiemy. Okazuje się, że pewne własności wariacji funkcji w sensie klasycznym (Jordana) nie przenoszą się na analogiczne własności w sensie Wienera. W niżej podanych przykładach wskażemy na dwie takie własności. Przykłada 3.3. Rozważmy funkcję f : [0, 2] → R określoną w następujący sposób: f (x) = 0 dla 0 ¬ x < 1 2 dla 1 < x ¬ 2 . 1 dla x = 1 Następnie weźmy podziały P = {0, 2} i Q = {0, 1, 2} przedziału [0, 2]. Wtedy oczywiście P ⊂ Q i mamy dla dowolnie ustalonej liczby p, p > 1: p VarW p (f, P ; [0, 2]) = 2 , VarW p (f, Q; [0, 2]) = 2 . Stąd widoczne jest, że wariacja w sensie Wienera względem podziału nie jest monotoniczna ze względu na podziały (por. Twierdzenie 2.3(f)). 48 Przykład 3.4. Weźmy znowu pod uwagę funkcję f zdefiniowaną w poprzednim Przykładzie 2.3 oraz rozważmy wariacje Wienera tej funkcji na przedziałach [0, 1], [1, 2] i [0, 2], dla ustalonego p, p > 1. Proste rachunki dają następujące wyniki: W VarW p (f ; [0, 1]) = Varp (f ; [1, 2]) = 1 , p VarW p (f ; [0, 2]) = 2 . Oznacza to, że wariacja w sensie Wienera nie jest addytywna ze względu na przedziały (por. Twierdzenie 2.3(g)). Pokażemy później w nieco ogólniejszej sytuacji, że wariacja funkcji w sensie Wienera jest superaddytywna (nadaddytywna) ze względu na przedziały w tym sensie, że dla dowolnie ustalonej liczby p > 1 ma miejsce nierówność W W VarW p (f ; [a, b]) Varp (f ; [a, c]) + Varp (f ; [c, b]) dla a < c < b. W celu znalezienia zależności w formie inkluzji między przestrzeniami W BVp ([a, b]) i W BVq ([a, b]) dla np. p < q, przytoczymy kilka faktów pomocniczych dotyczących funkcji wypukłych. W tym celu załóżmy, że dana jest funkcja ϕ : [0, ∞) → R. Rozważmy funkcję ψ : (0, ∞) → R określoną wzorem: ψ(t) = ϕ(t) . t Lemat 3.5. Jeżeli ϕ jest wypukła na przedziale [0, ∞) oraz ϕ(0) ¬ 0, to funkcja ψ jest rosnąca na przedziale (0, ∞). Dowód. Przypomnijmy, że to, że ϕ jest wypukła na przedziale [0, ∞) oznacza, że dla dowolnych s, t ∈ [0, ∞) oraz dla dowolnego λ ∈ [0, 1] spełniona jest nierówność: ϕ(λs + (1 − λ)t) ¬ λϕ(s) + (1 − λ)ϕ(t) . (3.7) Weźmy teraz x1 , x2 ∈ (0, ∞) takie, że x1 < x2 . Kładąc w nierówności (3.7) s = x2 , t = 0, λ = x1 /x2 , otrzymujemy: ϕ(x1 ) ¬ λϕ(x2 ) + (1 − λ)ϕ(0) ¬ λϕ(x2 ) = 49 x1 ϕ(x2 ) . x2 Stąd mamy: ϕ(x1 ) ϕ(x2 ) ¬ x1 x2 więc ψ(x1 ) ¬ ψ(x2 ) i koniec dowodu. Lemat 3.6. Załóżmy, że funkcja ϕ : [0, ∞) → [0, ∞) jest wypukła oraz ϕ(0) = 0. Wtedy ϕ jest rosnąca oraz superaddytywna na przedziale [0, ∞), tzn. ϕ(α) + ϕ(β) ¬ ϕ(α + β) (3.8) dla α, β 0. Dowód. Dla dowodu nie wprost przypuśćmy, że ϕ nie jest rosnąca na przedziale [0, ∞), tzn. istnieją x1 , x2 ∈ [0, ∞), x1 < x2 takie, że ϕ(x1 ) > ϕ(x2 ). Jeżeli x1 = 0, to wtedy mielibyśmy, że ϕ(x2 ) < 0, co jest sprzeczne z założeniem. Zatem możemy założyć, że 0 < x1 < x2 . Stąd 1 1 > x1 x2 i dalej mamy: ϕ(x1 ) ϕ(x1 ) ϕ(x2 ) > x1 x2 x2 ponieważ z założenia ϕ(x1 ) > ϕ(x2 ). (3.9) Jednakże nierówność (3.9) stoi w sprzeczności z Lematem 3.5. Zatem ϕ jest rosnąca na przedziale [0, ∞). Ustalmy dalej dowolne α, β ∈ [0, ∞). Jeżeli α = 0, to wtedy z założenia mamy, że ϕ(0) = 0, więc ϕ(α) + ϕ(β) = ϕ(0) + ϕ(β) = ϕ(β) = ϕ(0 + β) = ϕ(α + β) . Przypadek β = 0 rozpatrujemy analogicznie. Załóżmy więc, że α > 0 i β > 0. Wtedy α < α + β oraz β < α + β. Z udowodnionej już części twierdzenia mamy: ϕ(α) ϕ(α + β) ¬ , α α+β ϕ(β) ϕ(α + β) ¬ . β α+β Stąd ϕ(α) ¬ α ϕ(α + β) , α+β 50 β ϕ(α + β) . α+β Dodając te nierówności stronami, otrzymujemy: ϕ(β) ¬ ! ϕ(α) + ϕ(β) ¬ β α + ϕ(α + β) = ϕ(α + β) α+β α+β i koniec dowodu. Najprostrzym przykładem funkcji, która spełnia założenia Lematów 3.5 i 3.6 jest funkcja ϕ(t) = tp gdzie p jest dowolnie ustaloną liczbą, p 1. Rzeczywiście, ϕ0 (t) = ptp−1 , ϕ00 (t) = p(p − 1)tp−2 > 0 dla p > 1 (przypadek p = 1 jest trywialny). Zatem funkcja ta jest wypukła na przedziale [0, ∞) oraz ϕ(0) = 0. Stąd i z Lematu 3.6 wynika, że dla dowolnych t, s 0 spełniona jest nierówność tp + sp ¬ (t + s)p (3.10) dla dowolnego p 1. Udowodnimy teraz, zapowiadane wcześniej twierdzenie. Twierdzenie 3.7. Niech 1 ¬ p ¬ q < ∞. Wtedy ma miejsce nierówność 1/p 1/q . ¬ VarW VarW p (f ; [a, b]) q (f ; [a, b]) (3.11) Ponadto mamy, że BV ([a, b]) = W BV1 ([a, b]) ⊂ W BVp ([a, b]) ⊂ W BVq ([a, b]) ⊂ B([a, b]) . (3.12) Dowód. Ustalmy dowolny podział P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]). Wtedy, z nierówności (3.10) dostajemy: m X |f (tj ) − f (tj−1 )|q = j=1 m X (|f (tj ) − f (tj−1 )|p )q/p j=1 ¬ m X q/p |f (tj ) − f (tj−1 )|p q/p ¬ VarW p (f ; [a, b]) j=1 Stąd otrzymujemy nierówność W q/p VarW q (f ; [a, b]) ¬ Varp (f ; [a, b]) 51 która implikuje, że 1/q 1/p VarW ¬ VarW , q (f ; [a, b]) p (f ; [a, b]) a więc otrzymujemy nierowność (3.11). Inkluzje (3.12) wynikają teraz już łatwo z wyżej udowodnionej nierówności (3.11), przy czym ostatania inkluzja po prawej stronie (3.12) jest prostą konsekwencją Twierdzenia 3.2(d). Podamy teraz przykład wskazujący na pewne istotne fakty związane zarówno z samym pojęciem wariacji funkcji w sensie Wienera jak również z inkluzjami (3.12). Przykład 3.8. Ustalmy dowolnie liczbę p, 1 ¬ p, i weźmy zbiór A = { n1 : n ∈ N}. Następnie, określmy funkcję fp : [0, 1] → R w następujący sposób. fp (x) = 1 Dalej, weźmy podziały P1 1 n ∈A np dla x = 0 dla x pozostałych . 1 {0, m1 , m−1 , ..., 21 , 1} = ∈ P([0, 1]) oraz P2 = {0, x1 , x2 , ..., xm , 1} ∈ P([0, 1]), gdzie x1 , x2 , ..., xm są dowolnie ustalonymi liczbami takimi, że 0 < x1 < 1 m oraz 1 1 < xi < m − (i − 2) m − (i − 1) dla i = 2, ..., m. Następnie, weźmy podział P = P1 ∪ P2 , tzn. P = {0, x1 , 1 1 1 , x2 , , ..., , xm , 1} . m m−1 2 Oczywiście P ∈ P([0, 1]). Teraz, dla dowolnie ustalonej liczby q, q 1, dostajemy: VarW q (fp , P ; [0, 1]) = m X i=1 2· 1 iq/p =2 1+ 1 2q/p 1 + · · · + q/p m . Zatem, na podstawie dobrze znanych faktów dotyczących szeregu harmonicznego dowolnego rzędu, mamy: VarW q (fp ; [0, 1]) = ∞ dla 1 ¬ q ¬ p , VarW q (fp ; [0, 1]) < ∞ dla p < q . 52 Zatem fp 6∈ W BVq ([0, 1]) dla q ¬ p, natomiast fp ∈ W BVq ([0, 1]) dla p < q. W szczególności mamy, że f1 6∈ W BV1 ([0, 1]) ale f1 ∈ W BVp ([0, 1]) dla p > 1. Powyższy przykład pokazuje, że inkluzje (3.12) są ostre dla 1 < p < q, a z drugiej strony wskazuje na to, że pojęcie wariacji ograniczonej w sensie Wienera jest uogólnieniem klasycznego pojęcia wariacji ograniczonej (w sensie Jordana). Następujące twierdzenie będzie wskazywać na pewien związek między spełnianiem przez funkcję warunku Höldera a przynależnością tej funkcji do przestrzeni funkcji o wariacji ograniczonej w sensie Wienera. Twierdzenie 3.9. Niech p 1 będzie dowolnie ustaloną liczbą. Jeżeli funkcja f : [a, b] → R spełnia na przedziale [a, b] warunek Höldera z wykładnikiem 1/p, to f ∈ W BVp ([a, b]). Dowód. Załóżmy, że f spełnia warunek Höldera na przedziale [a, b] z wykładnikiem 1/p tzn., istnieje stała L > 0 taka, że |f (t) − f (s)| ¬ L|t − s|1/p dla t, s ∈ [a, b]. Ustalmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy dostajemy VarW p (f, P ; [a, b]) = m X |f (tj ) − f (tj−1 )|p j=1 ¬ m X 1/p p (L|tj − tj−1 | ) =L p j=1 m X |tj − tj−1 | j=1 = Lp (b − a) . Stąd p VarW p (f ; [a, b]) ¬ L (b − a) < ∞ , co kończy dowód. Zauważmy, że powyższe twierdzenie w szczególnym przypadku orzeka, że funkcja spełniająca na przedziale [a, b] warunek Lipschitza jest funkcją o wariacji ograniczonej (w klasycznym sensie) na przedziale [a, b] (por. Uwagę 2.21). W dalszym ciągu podamy twierdzenie charakteryzujące funkcje o wariacji ograniczonej w sensie Wienera. Twierdzenie to będzie stanowić szczególny przypadek twierdzenia 53 Sierpińskiego (Twierdzenie 1.11) a zarazem będzie ”równoległe” do twierdzenia Federera (Twierdzenie 2.29). Twierdzenie 3.10. Funkcja f należy do przestrzeni W BVp ([a, b]) wtedy i tylko wtedy, gdy może być przedstawiona jako złożenie f = g ◦ τ , gdzie τ : [a, b] → [c, d] jest rosnąca na przedziale [a, b] natomist funkcja g spełnia na przedziale [c, d] warunek Höldera z wykładnikiem 1/p i ze stałą L = 1. Dowód. Ponieważ dowód tego twierdzenia jest bardzo podobny do dowodu Twierdzenia 2.29 (Federera), podamy tylko jego szkic. Załóżmy najpierw, że f = g ◦ τ , gdzie g i τ mają własności wymienione w naszym twierdzeniu. Niech zadany będzie dowolnie ustalony podział P = {t0 , t1 , ..., tm } ∈ P ([a, b]). Wtedy mamy: VarW p (f, P ; [a, b]) = m X |g(τ (tj )) − g(τ (tj−1 ))|p j=1 ¬ m X |τ (tj ) − τ (tj−1 )|1/p p = j=1 m X |τ (tj ) − τ (tj−1 )| j=1 = |τ (b) − τ (a)| , a to oznacza, że f ∈ W BVp ([a, b]). Na odwrót załóżmy, że f ∈ W BVp ([a, b]). Niech funkcja τ = τ (t) będzie określona na przedziale [a, b] w następujący sposób τ (t) = Vf,p (t) = VarW p (f ; [a, t]) . Korzystając z własności wariacji w sensie Wienera można pokazać, że funkcja τ jest rosnąca na przedziale [a, b] oraz c = 0 i d = VarW p (f ; [a, b]). Następnie, określmy funkcję g na zbiorze wartości funkcji τ , tzn. na zbiorze τ ([a, b]) ⊂ [c, d], kładąc g(τ (x)) = f (x). Wtedy oczywiście mamy, że f = g ◦ τ oraz 1/p |g(τ (s)) − g(τ (t))| = |f (s) − f (t)| ¬ VarW p (f ; [s, t]) ¬ |τ (s) − τ (t)|1/p dla a ¬ s < t ¬ b. Powyższa nierówność oznacza, że na zbiorze τ ([a, b]) funkcja g spełnia warunek Höldera z wykładnikiem 1/p i ze stałą 1. 54 Teraz, przy użyciu twierdzenia McShane możemy przedłużyć funkcję g ze zbioru τ ([a, b]) na cały przedział [c, d] otrzymując funkcje g spełniającą na przedziale [c, d] warunek Höldera z wykładnikiem 1/p i ze stałą L = 1 a ponadto taką, że f = g ◦ τ = g ◦ τ . Koniec dowodu. Uwaga 3.11. Przytoczymy teraz, wraz z dowodem, wspomniane wyżej twierdzenie McShane’a. Twierdzenie to odgrywa poważną rolę w teorii funkcji rzeczywistych [1]. Twierdzenie 3.12. Niech M ⊂ R będzie zadanym zbiorem niepustym oraz niech f : M → R będzie funkcją spełniającą na zbiorze M warunek Höldera z wykładnikiem α ∈ (0, 1]. Wtedy istnieje funkcja fˆ : R → R spełniająca na zbiorze R warunek Höldera z wykładnikiem α, która jest przedłużeniem funkcji f . Dowód. Z założenia, funkcja f spełnia na zbiorze M warunek Höldera z wykładnikiem α i z pewną stałą L > 0. Oznaczmy symbolem Hα (f ) najlepszą z możliwych stałą L, którą można zdefiniować następująco: ( |f (x) − f (y)| Hα (f ) = sup : x, y ∈ M, x 6= y |x − y|α ) . Następnie, określmy funkcję fˆ : R → R, kładąc fˆ(x) = sup{f (z) − Hα (f )|x − z|α : z ∈ M } , (3.13) dla x ∈ R. Fakt, że funkcja fˆ jest poprawnie określona, wynika z niżej podanego ciągu nierówności |f (z)| − |f (x)| ¬ |f (z) − f (x)| ¬ Hα (f )|z − x|α = Hα (f )|x − z|α , skąd |f (z)| − Hα (f )|x − z|α ¬ |f (x)| . Teraz, dla dowolnie ustalonych x, y ∈ R, z określenia (3.13) i z własności kresów funkcji, otrzymujemy: |fˆ(x) − fˆ(y)| = sup [f (z) − Hα (f )|x − z|α ] z∈M α − sup[f (z) − Hα (f )|y − z| ] ¬ sup {Hα (f )||x − z|α − |y − z|α |} ¬ Hα (f )|x − y|α . z∈M 55 Powyższa nierówność pokazuje, że funkcja fˆ spełnia na zbiorze R warunek Höldera z wykładnikiem α oraz ma miejsce nierówność Hα (fˆ) ¬ Hα (f ). Nierówność przeciwna jest prawdziwa w sposób trywialny, bowiem fˆ jest przedłużeniem funkcji f . Koniec dowodu. Uwaga 3.13. Zauważmy, że z Twierdzenia 3.10 oraz z twierdzenia Sierpińskiego (Twierdzenie 1.11) wynika, że każda funkcja o wariacji ograniczonej w sensie Wienera na przedziale [a, b] jest funkcją regularną na [a, b]. Biorąc pod uwagę oznaczenie R([a, b]) wprowadzone dla przestrzeni liniowej funkcji regularnych na przedziale [a, b], fakt ten możemy zapisać w postaci inkluzji W BVp ([a, b]) ⊂ R([a, b]) . Zatem, ciąg inkluzji (3.12) możemy poszerzyć w następujący sposób BV ([a, b]) = W BV1 ([a, b]) ⊂ W BVp ([a, b]) ⊂ W BVq ([a, b]) ⊂ R([a, b]) ⊂ B([a, b]) (3.14) dla dowolnych p, q takich, że 1 ¬ p ¬ q < ∞. Zadania 1. Niech f ∈ W BVp ([a, b]). Pokazać, że funkcja x → VarW p (f ; [a, x]) jest rosnąca na przedziale [a, b]. 2. Niech α, β będą ustalonymi liczbami rzeczywistymi i niech fα,β : [0, 1] → R będzie funkcją określoną następująco fα,β (x) = xα sin xβ dla 0 < x ¬ 1 dla x = 0 . 0 Pokazać, że dla każdego ustalonego p 1 funkcja fα,β należy do przestrzeni W BVp ([0, 1]) wtedy i tylko wtedy gdy albo β > 0 i pα + β 0 albo β ¬ 0 i pα + β > 0. 3. Skonstruować funkcję f ∈ W BVp ([0, 1]), która nie spełnia warunku Höldera z wykładnikiem 1/p. 4. Dla ustalonego przedziału [a, b] oznaczmy symbolem Lip([a, b]) zbiór wszystkich funkcji f : [a, b] → R, które spełniają warunek Lipschitza na przedziale [a, b]. 56 (a) Pokazać, że zbiór Lip([a, b]) ma strukturę przestrzeni liniowej nad ciałem R ze zwykłymi działaniami dodawania funkcji i ich mnożenia przez liczby rzeczywiste. (b) Pokazać, że wielkość || · ||Lip określona dla dowolnej funkcji f ∈ Lip([a, b]) wzorem ( |f (x) − f (y)| ||f ||Lip = |f (a)| + sup : x, y ∈ [a, b], x 6= y |x − y| ) jest normą w przestrzeni Lip([a, b]). (c) Pokazać, że przestrzeń Lip([a, b]) z normą określoną w punkcie (b) jest przestrzenią Banacha. 5. Ustalmy liczbę α ∈ (0, 1] i symbolem Lipα ([a, b]) oznaczmy zbiór wszystkich funkcji f : [a, b] → R, które spełniają warunek Höldera z wykładnikiem α na przedziale [a, b]. (a) Pokazać, że zbiór Lipα ([a, b]) jest przestrzenią liniową nad ciałem R z działaniami dodawania funkcji i ich mnożenia przez liczby rzeczywiste. (b) Pokazać, że wielkość || · ||Lip określona dla dowolnej funkcji f ∈ Lipα ([a, b]) α wzorem ( |f (x) − f (y)| ||f ||Lip = |f (a)| + sup : x, y ∈ [a, b], x 6= y α |x − y|α ) jest normą w przestrzeni Lipα ([a, b]). (c) Pokazać, że przestrzeń Lipα ([a, b]) z normą || · ||Lip określoną w punkcie (b) α jest przestrzenią Banacha. 57 4. Wariacja funkcji w sensie Wienera-Younga Rozdział ten poświęcony jest omówieniu kolejnego uogólnienia pojęcia wariacji funkcji. Jest to uogólnienie pojęcia wariacji funkcji w sensie Wienera, które było dyskutowane w poprzednim rozdziale. Oznacza to automatycznie, że jest to również uogólnienie pojęcia wariacji funkcji w klasycznym sensie Jordana, które było przedstawione w Rozdziale 2. Pojęcie wariacji funkcji w sensie Wienera-Younga zostało wprowadzone w 1937 roku przez L.C. Younga (por. [1]). W celu przedstawienia tego pojęcia omówimy najpierw pojęcie tzw. funkcji Younga, które odgrywać będzie podstawową rolę przy definiowaniu zapowiedzianego pojęcia wariacji. Definicja 4.1. Funkcję φ : R+ → R+ = [0, ∞) będziemy nazywać funkcją Younga, jeżeli jest ona ciągła i wypukła na R+ , φ(0) = 0, φ(t) > 0 dla t > 0 oraz φ(t) → ∞ przy t → ∞. Uwaga 4.2. Zwróćmy uwagę na to, że przyjęte w powyższej definicji założenia mówiące, że φ(t) → ∞ przy t → ∞, jest prostą konsekwencją pozostałych założeń. Typowymi przykładami funkcji Younga są funkcje φ(t) = tp dla 1 ¬ p < ∞, φ(t) = et − 1, φ(t) = t ln(t + 1), φ(t) = (t + 1) ln(t + 1). Definicja 4.3. Załóżmy, że dana jest funkcja Younga φ : R+ → R+ oraz funkcja f : [a, b] → R, ograniczona. Dla ustalonego dowolnie podziału P = {t0 , t1 , t2 , ..., tm } ∈ P([a, b]) nieujemną liczbę rzeczywistą zdefiniowaną wzorem W VarW φ (f, P ) = Varφ (f, P ; [a, b]) = m X φ(|f (tj ) − f (tj−1 )|) (4.1) j=1 będziemy nazywać wariacją (wahaniem) Wienera-Younga funkcji f na przedziale [a, b] względem podziału P . Natomiast wielkość zdefiniowaną następująco n o W W VarW φ (f ) = Varφ (f ; [a, b]) = sup Varφ (f, P ; [a, b]) : P ∈ P([a, b]) (4.2) będziemy nazywać (całkowitą) wariacją Wienera-Younga funkcji f na przedziale [a, b]. Jeżeli VarW φ (f ) < ∞, to mówimy, że f jest funkcją o wariacji Wienera-Younga ograniczonej na przedziale [a, b] (o wariacji ograniczonej w sensie Wienera-Younga na przedziale 58 [a, b]). Zbiór wszystkich funkcji o ograniczonej wariacji Wienera-Younga na przedziale [a, b] oznaczamy symbolem VφW ([a, b]). Zauważmy, że dla φ(t) = tp (1 ¬ p < ∞) zbiór VφW ([a, b]) pokrywa się z przestrzenią W BVp ([a, b]) omówioną w Rozdziale 3. Okazuje się, że zbiór VφW ([a, b]) nie zawsze jest przestrzenią liniową tzn. nie dla każdej funkcji Younga φ jest to przestrzeń liniowa. Przykład 4.4. Weźmy pod uwagę funkcję φ : R+ → R określoną następująco φ(t) = dla t = 0 0 e −1/t dla 0 < t < 2t+1 dla t 2e2 1 2 1 2 . Łatwo sprwadzić, że φ jest funkcją Younga w sensie Definicji 4.1. Pokażemy teraz, że związany z tą funkcją zbiór VφW ([0, 1]) nie jest przestrzenią liniową. W tym celu rozważmy funkcję f : [0, 1] → R określoną w następujący sposób f (x) = − 2 ln1 n dla x = 1 n (n = 2, 3, ...) dla x pozostałych . 0 Dla obliczenia wariacji VφW (f ; [0, 1]) weźmy optymalny podział Pn = {0, sn , tn , sn−1 , tn−1 , ..., s2 , t2 , s1 } (n = 1, 2, ...), gdzie sk = 1/k oraz tk ∈ (sk , sk−1 ) i tk jest dowolnie wybrane. Wtedy mamy VarW φ (f ; [0, 1]) ∞ X 1 φ f =2 k k=2 =2 =2 ∞ X e−2 ln k k=2 ∞ X 1 <∞, 2 k=2 k skąd wynika, że f ∈ VφW ([0, 1]). Z drugiej strony, otrzymujemy VarW φ (2f ; [0, 1]) ∞ X 1 2 φ 2f k k=2 =2 =2 ∞ X e− ln k k=2 ∞ X 1 =∞, k=2 k co implikuje, że 2f 6∈ VφW ([0, 1]). Zatem zbiór VφW ([0, 1]), dla rozważanej tutaj funkcji Younga, nie jest przestrzenią liniową. 59 Jak później pokażemy, istnieją funkcje Younga φ, dla których zbiór VφW ([a, b]) jest przestrzenią liniową. Żeby sformułować warunek, charakteryzyjący takie właśnie funkcje Younga, potrzebne nam będzie pewne pojęcie, które niżej zdefiniujemy. Definicja 4.5. Będziemy mówić, że funkcja Younga φ : R+ → R+ spełnia warunek δ2 jeżeli istnieją stałe M > 0 i T > 0 takie, że φ(2t) ¬ M φ(t) (4.3) dla 0 ¬ t ¬ T . Uwaga 4.6. Sformułowany wyżej warunek δ2 jest ”równoległy” do warunku ∆2 występującego w teorii przestrzeni Orlicza [4]. Można powiedzieć, że warunek δ2 jest sformułowany dla małych wartości t podczas gdy warunek ∆2 funkcjonuje dla dużych wartości zmiennej t. Uwaga 4.7. Odnotujmy, że M 1, gdzie M jest stałą występującą w (4.3). Rzeczywiście, ponieważ φ jest rosnąca, to dla 0 < t ¬ T mamy φ(t) ¬ φ(2t) ¬ M φ(t) , skąd M 1. Podamy teraz trzy lematy mające charakter techniczny i dotyczące funkcji Younga spałniających warunek δ2 . Lemat 4.8. Funkcja Younga φ spełnia warunek δ2 wtedy i tylko wtedy, gdy dla każdego T 0 > 0 istnieje liczba M (T 0 ) 1 taka, że φ(2t) ¬ M (T 0 )φ(t) dla 0 < t ¬ T 0 . Dowód. Oczywiście, jeżeli funkcja φ spełnia wspomniany w naszym twierdzeniu warunek to spełnia warunek δ2 . Na odwrót załóżmy, że funkcja φ spełnia warunek δ2 . Ustalmy dowolnie liczbę T 0 taką, że T 0 > T /2, gdzie T > 0 jest stałą występującą w sformułowaniu warunku δ2 . Wtedy, 60 korzystając z założenia, dla t = T /2 mamy φ(T ) ¬ M (T )φ(T /2) , skąd dla t ∈ [T /2, T 0 ] otrzymujemy φ(t) 1 φ(T ) φ(t) φ(T ) φ(t) = · · · φ(2t) . M (T )φ(T /2) M (T ) φ(2t) φ(T /2) (4.4) Z drugiej strony, biorąc pod uwagę fakt, że φ jest rosnąca, z nierówności T /2 ¬ t ¬ T 0 oraz 2t ¬ 2T 0 , dostajemy φ(2t) φ(t) ¬1¬ . 0 φ(2T ) φ(T /2) Stąd i z (4.4) wnioskujemy, że φ(t) 1 φ(T ) φ(2t) 1 φ(T ) · · φ(2t) = φ(2t) . 0 M (T ) φ(2t) φ(2T ) M (T ) φ(2T 0 ) Połóżmy teraz M (T 0 ) = M (T ) (4.5) φ(2T 0 ) . φ(T ) Biorąc pod uwagę nierówności φ(T ) ¬ φ(2T 0 ) i M (T ) 1 wnioskujemy, że M (T 0 ) 1. Stąd i z (4.5) widzimy, że ma miejsce teza naszego twierdzenia, co kończy dowód. Na podstawie Lematu 4.8 każdej funkcji Younga φ spełniającej warunek δ2 (będziemy wtedy pisać: φ ∈ δ2 ) możemy przyporządkować funkcję M : (0, ∞) → [1, ∞) określoną w następujący sposób ( φ(2t) M (T ) = sup : 0<t¬T φ(t) ) . Funkcja ta jest poprawnie określona i rosnąca na przedziale (0, ∞). Lemat 4.9. Niech φ ∈ δ2 . Wtedy φ(s + t) ¬ M (T )[φ(s) + φ(t)] dla s, t ∈ (0, T ]. Dowód. Załóżmy np., że s < t. Wtedy mamy s+t s+t φ(s + t) = φ 2 ¬ M (T )φ ¬ M (T )φ(t) 2 2 61 ¬ M (T )[φ(s) + φ(t)] , gdzie wykorzystaliśmy określenie funkcji M = M (t) oraz fakt, że φ jest rosnąca. Uwaga 4.10. Stosując zasadę indukcji matematycznej można pokazać, że dla dowolnej liczby naturalnej n i dla dowolnych liczb ti takich, że 0 < ti ¬ T (i = 1, 2, ..., n), ma miejsce nierówność φ(t1 + t2 + · · · + tn ) ¬ M n−1 ((n − 1)T )[φ(t1 ) + φ(t2 ) + · · · + φ(tn )] . Zauważmy dalej, że z Lematu 4.9 otrzymujemy następujący wniosek. Wniosek 4.11. Niech φ ∈ δ2 i niech f, g : [a, b] → R będą funkcjami ograniczonymi na przedziale [a, b]. Wtedy ma miejsce nierówność W W VarW φ (f + g) ¬ M (2K)[Varφ (f ) + Varφ (g)] , gdzie K = max{||f ||∞ , ||g||∞ } oraz symbol || · ||∞ oznacza normę supremum w przestrzeni B([a, b]). Ponadto, dla λ ∈ R mamy W m VarW φ (λf ) ¬ (m + 1)M (2m||f ||∞ )Varφ (f ) , gdzie m = [|λ|] oznacza część całkowitą liczby |λ|. Zatem, jeżeli φ ∈ δ2 to VφW ([a, b]) jest przestrzenią liniową. W dalszym ciągu zajmiemy się porównaniem klas funkcji VφW i VψW dla dwóch różnych funkcji Younga φ i ψ W tym celu wprowadzimy najpierw pewne określenie. Definicja 4.12. Niech dane będą dwa ciągi liczbowe (αn ) i (βn ) o wyrazach dodatnich. Mówimy, że ciąg (βn ) jest podporządkowany ciągowi (αn ), jeżeli zbieżność szeregu P∞ n=1 αn implikuje zbieżność szeregu P∞ n=1 βn . Podany niżej lemat będzie odgrywał istotną rolę w naszych dalszych rozważaniach. Lemat 4.13. Niech φ i ψ będą dwoma funkcjami Younga. Wtedy, dla każdego nieujemnego ciągu liczbowego (tn ), ciąg (ψ(tn )) jest podporządkowany ciągowi (φ(tn )) wtedy i tylko wtedy, gdy istnieją liczby A > 0 i B > 0 takie, że ψ(t) ¬ Bφ(t) 62 (4.6) dla 0 < t ¬ A. Dowód. Oczywiście warunek (4.6) implikuje, że ciąg (ψ(tn )) jest podporządkowny ciągowi (φ(tn )). Na odwrót przypuśćmy, że warunek (4.6) nie jest spełniony. Wtedy, dla każdych A > 0 i B > 0 możemy znaleźć liczbę t ∈ (0, A] taką, że ψ(t) > Bφ(t). W szczególności, weźmy B = n, n ∈ N, oraz A > 0 takie, że φ(A) = 1 . n2 Następnie, dobierzmy tn ∈ (0, A] tak, żeby ψ(tn ) > nφ(tn ). Stąd wnioskujemy, że ∞ X φ(tn ) ¬ n=1 ∞ X 1 <∞. 2 n=1 n Dalej, oznaczmy przez kn najmniejszą liczbę naturalną taką, że 2 1 ¬ k φ(t ) ¬ . n n n2 n2 Dla m ∈ N dobierzmy n = n(m) ∈ N takie, że k1 + k2 + · · · + km−1 < n ¬ k1 + k2 + · · · + km . Wtedy, dla ciągu (tm ) mamy ∞ X ∞ X φ(tm ) < ∞ , ψ(tm ) = ∞ , m=1 m=1 co przeczy temu, że ciąg (ψ(tn )) jest podporządkowany ciągowi (φ(tn )). Koniec dowodu. Uwaga 4.14. Założenia tej części Lematu 4.13, które dotyczą liczb A i B, mogą być równoważnie sformułowane w następujący sposób: Dla każdego A0 > 0 istnieje stała B(A0 ) > 0 taka, że dla 0 < t ¬ A0 spełniona jest nierówność ψ(t) ¬ B(A0 )φ(t) . (4.7) Dowód tego faktu jest podobny do dowodu Lematu 4.8. W dalszym ciągu podamy kilka ważnych rezultatów dotyczących klas funckji VφW ([a, b]). Twierdzenie 4.15. Niech φ i ψ będą dwiema funkcjami Younga. Wtedy mają miejsce następujące stwierdzenia. 63 (a) Inkluzja VφW ([a, b]) ⊂ VψW ([a, b]) zachodzi wtedy i tylko wtedy, gdy spełniony jest warunek (4.6). (b) Zbiór VφW ([a, b]) jest przestrzenią liniową wtedy i tylko wtedy, gdy φ ∈ δ2 . Dowód. (a) Załóżmy, że spełniony jest warunek (4.6) a więc i (4.7). Weźmy funkcję f ∈ VφW ([a, b]). Ponieważ f jest ograniczona możemy wziąć w (4.7) A0 = 2||f ||∞ . Wtedy dostaniemy ψ(|f (s) − f (t)|) ¬ B(2||f ||∞ )φ(|f (s) − f (t)|) , dla dowlonych s, t ∈ [a, b]. Stąd otrzymujemy, że W VarW ψ (f ) ¬ B(2||f ||∞ )Varφ (f ) , skąd wynika, że VφW ([a, b]) ⊂ VψW ([a, b]). Na odwrót przypuśćmy, że (4.6) nie zachodzi tzn. dla każdych A > 0 i B > 0 istnieje t ∈ (0, A] takie, że ψ(t) > Bφ(t). Wtedy, podobnie jak w dowodzie Lematu 4.13 możemy znaleźć ciąg (tm ) taki, że ∞ X ∞ X φ(tm ) < ∞ , ψ(tm ) = ∞ . m=1 m=1 Następnie, ustalmy rosnący ciąg liczbowy (yn ) taki, że yn ∈ (a, b) i określmy funkcję f : [a, b] → R w następujący sposób: f (x) = tm dla x = ym 0 dla x pozostałych . Twierdzimy, że f ∈ VφW ([a, b]) ale f 6∈ VψW ([a, b]). Rzeczywiście, biorąc dowolny podział P = {x0 , x1 , x2 , ..., xm } ∈ P([a, b]), otrzymujemy m X j=1 φ(|f (xj ) − f (xj−1 )|) ¬ 2 m X φ(tj ) + j=1 m X φ(|tj − tj−1 |) ¬ 4 j=1 ∞ X φ(tj ) . j=1 W Stąd VarW φ (f ) < ∞ a więc f ∈ Vφ ([a, b]). Z drugiej strony, rozważamy podział P = {x0 , x1 , ..., x2m }, gdzie 1 x2i+1 = yi (i = 0, 1, 2, ..., m − 2) , x2i = (yi−1 + yi ) (i = 1, 2, ..., m − 1) . 2 64 Dla tego podziału, otrzymujemy VarW ψ (f, P ) = 2m X ψ(|f (xj ) − f (xj−1 )|) j=1 m−2 X ψ(tj ) j=0 W i stąd VarW ψ (f ) = ∞ a zatem f 6∈ Vψ ([a, b]). (b) Fakt, że VφW ([a, b]) jest przestrzenią liniową w przypadku, gdy φ ∈ δ2 był udowodniony we Wniosku 4.11. Na odwrót, jeżeli VφW ([a, b]) jest przestrzenią liniową, to wtedy stąd, że f ∈ VφW ([a, b]) wynika, że 2f ∈ VφW ([a, b]). Zatem, kładąc ψ(t) = φ(2t) wnioskujemy, że VφW ([a, b]) ⊂ VψW ([a, b]). Jednakże, na podstawie udowodnionej już części (a) mamy, że φ(2t) = ψ(t) ¬ Bφ(t) dla t ∈ (0, A]. Stąd φ ∈ δ2 i koniec dowodu. Zauważmy, że funkcja Younga φ(t) = tp spełnia warunek δ2 dla 1 ¬ p < ∞. Rzeczywiście, dla tej funkcji zachodzi nierówność (4.3) dla M = 2p i dla dowolnego T > 0. Funkcja Younga φ(t) = t ln(t + 1) również spełnia warunek δ2 ponieważ na podstawie reguły de l’Hospitala mamy lim+ t→0 φ(2t) 4(t + 1) = lim+ =4. t→0 φ(t) 2t + 1 Rozważmy teraz funkcję Younga φ(t) = et − 1. Dla tej funkcji mamy lim+ t→0 φ(2t) = lim+ 2et = 2 , t→0 φ(t) a więc φ ∈ δ2 . Weźmy jeszcze pod uwagę funkcję Younga z Przykładu 4.4. Wtedy mamy lim+ t→0 φ(2t) e−1/2t = lim+ −1/t = lim+ e1/2t = ∞ , t→0 e t→0 φ(t) a więc φ 6∈ δ2 . W świetle Twierdzenia 4.15(b) wyjaśnia to, dlaczego zbiór VφW ([0, 1]) rozpatrywany w Przykładzie 4.4 nie jest przestrzenią liniową. Zwróćmy teraz uwagę na to, że zbiór VφW ([a, b]) jest zawsze (dla każdej funkcji Younga) zbiorem symetrycznym, pochłaniającym, zbalansowanym i wypukłym. Stąd, podobnie jak się to robi w przypadku teorii przestrzeni Orlicza, możemy rozważyć zbiór B W (φ) = {f ∈ B([a, b]) : VarW φ (f ; [a, b]) ¬ 1} 65 (4.8) i związany z tym zbiorem tzw. funkcjonał Minkowskiego ||f ||W BVφ = |f (a)| + inf{λ > 0 : f /λ ∈ B W (φ)} . (4.9) Można pokazać, że funkcjonał Minkowskiego określony przez (4.9) jest normą na zbiorze W BVφ ([a, b]) = spanVφW ([a, b]). Ponadto, jednostkowa kula domknięta w przestrzeni W BVφ ([a, b]) z normą (4.9) pokrywa się ze zbiorem B W (φ) określonym w (4.8). W podanym w dalszym ciągu twierdzeniu zebrane będą pewne własności wariacji Wienera-Younga (4.1) i (4.2) oraz przestrzeni W BVφ ([a, b]) z normą ||f ||W BVφ . Twierdzenie 4.16. Wielkości (4.1) i (4.2) mają następujące własności: (a) Wariacja Wienera-Younga (4.2) jest superaddytywna ze względu na przedziały tzn. W W VarW φ (f ; [a, b]) Varφ (f ; [a, c]) + Varφ (f ; [c, b]) dla a < c < b. (b) Jeżeli φ spełnia warunek δ2 , to W W VarW φ (f ; [a, b]) ¬ M (2||f ||∞ )[Varφ (f ; [a, c]) + Varφ (f ; [c, b])] , dla a < c < b, gdzie || · ||∞ oznacza normę supremum w przestrezni B([a, b]) oraz funkcja M była poprzednio określona: ( φ(2f ) M (T ) = sup : 0¬t¬T φ(t) ) . (c) Jeżeli φ spełnia warunek δ2 , to h i W W VarW φ (f + g; [a, b]) ¬ M (2K) Varφ (f ; [a, b]) + Varφ (g; [a, b]) , gdzie K = max{||f ||∞ , ||g||∞ }. Oznacza to, że wariacja Wienera-Younga jest częściowo podaddytywna ze względu na funkcje. (d) Jeżeli φ ∈ δ2 to W m VarW φ (λf ; [a, b]) ¬ (m + 1)M (2m||f ||∞ )Varφ (f ; [a, b]) , gdzie m = [|λ|] (λ ∈ R). 66 (e) Ma miejsce oszacowanie VarW φ (f ; [a, b]) ¬ φ(Var(f ; [a, b])) , gdzie symbol Var(f ; [a, b]) oznacza wariację w sensie klasycznym funkcji f na przedziale [a, b]. W szczególności, jeżeli f jest monotoniczna na przedziale [a, b], to VarW φ (f ; [a, b]) = φ(|f (b) − f (a)|) . (f ) Przestrzeń W BVφ ([a, b]) jest zupełna ze względu na normę (4.9). W Dowód. Dla dowodu (a) możemy założyć, że obie wariacje VarW φ (f ; [a, c]) i Varφ (f ; [c, b]) są skończone. Zadajmy dowolne ε > 0 i dobierzmy podziały {t0 , t1 , ..., tk } ∈ P([a, c]) , {tk , tk+1 , ..., tm } ∈ P([c, b]) takie, że tk = c oraz VarW φ (f ; [a, c]) − VarW φ (f ; [c, b]) − k ε X ¬ φ(|f (tj ) − f (tj−1 )|) , 2 j=1 m X ε ¬ φ(|f (tj ) − f (tj−1 )|) . 2 j=k+1 Stąd otrzymujemy W VarW φ (f ; [a, c]) + Varφ (f ; [c, b]) − ε ¬ m X φ(|f (tj ) − f (tj−1 )|) ¬ VarW φ (f ; [a, b]) . j=1 Ze względu na dowolność liczby ε dowodzi to punktu (a). Dla dowodu (b) weźmy dowolny podział {t0 , t1 , ..., tm } ∈ P([a, b]). Załóżmy najpierw, że pewien punkt tego podziału, powiedzmy tk , pokrywa się z liczbą c. Wtedy dostajemy: m X j=1 φ(|f (tj ) − f (tj−1 )|) ¬ k X φ(|f (tj ) − f (tj−1 )|) + j=1 m X j=k+1 W ¬ VarW φ (f ; [a, c]) + Varφ (f ; [c, b]) . 67 φ(|f (tj ) − f (tj−1 )|) Teraz, biorąc pod uwagę fakt, że funkcja M spełnia nierówność M (T ) 1 dla wszystkich T > 0 (Lemat 4.8), dedukujemy następujące oszacowanie m X i h W φ(|f (tj ) − f (tj−1 )|) ¬ M (2||f ||∞ ) VarW φ (f ; [a, c]) + Varφ (f ; [c, b]) . (4.10) j=1 Załóżmy teraz, że liczba c nie pokrywa się z żadnym punktem podziału {t0 , t1 , ..., tm }. Wtedy istnieje k ∈ {1, 2, ..., m} takie, że tk−1 < c < tk . Wówczas otrzymujemy m X φ(|f (tj ) − f (tj−1 )|) = j=1 + m X k−1 X φ(|f (tj ) − f (tj−1 )|) + φ(|f (tk ) − f (tk−1 )|) j=1 φ(|f (tj ) − f (tj−1 )|) ¬ k−1 X φ(|f (tj ) − f (tj−1 )|) + φ(|f (tk ) − f (c)| + |f (c) − f (tk−1 )|) j=1 j=k+1 + m X φ(|f (tj ) − f (tj−1 )|) . j=k+1 Z powyższego oszacowania i z Lematu 4.8, dostajemy m X φ(|f (tj ) − f (tj−1 )|) ¬ k−1 X φ(|f (tj ) − f (tj−1 )|) j=1 j=1 + M (2||f ||∞ )φ(|f (c) − f (tk−1 )|) + M (2||f ||∞ )φ(|f (tk ) − f (c)|) + m X φ(|f (tj ) − f (tj−1 )|) . j=k+1 Stąd m X h i W φ(|f (tj ) − f (tj−1 )|) ¬ M (2||f ||∞ ) VarW φ (f ; [a, c]) + Varφ (f ; [c, b]) . (4.11) j=1 Teraz, łącząc (4.10) i (4.11) otrzymujemy nierówność z punktu (b). Zauważmy dalej, że nierówności z (c) i (d) zostały udowodnione we Wniosku 4.11. Dla dowodu (e) ustalmy podział P = {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy mamy m X j=1 φ(|f (tj ) − f (tj−1 )|) ¬ φ m X |f (tj ) − f (tj−1 )| ¬ φ(Var(f ; [a, b])) , j=1 ponieważ, na podstawie Lematu 3.6, funkcja φ jest rosnąca oraz superaddytywna. Z powyższej nierówności otrzymujemy oszacowanie VarW φ (f ; [a, b]) ¬ φ(Var(f ; [a, b])) . 68 Oczywiście, w przypadku gdy funkcja f jest monotoniczna, mamy, że Var(f ; [a, b]) = |f (b) − f (a)|, więc VarW φ (f ; [a, b]) ¬ φ(|f (b) − f (a)|) . Z drugiej strony, biorąc specjalny podział P = {a, b}, dostajemy W φ(|f (b) − f (a)|) = VarW φ (f, P ; [a, b]) ¬ Varφ (f ; [a, b]) , co ostatecznie dowodzi (e). Przeprowadzimy teraz dowód (f). W tym celu załóżmy, że (fn ) jest ciągiem Cauchy’ego w przestrzeni W BVφ ([a, b]) względem normy (4.9). Oznacza to, że dla ustalonego dowolnie ε > 0 istnieje liczba naturalna n0 taka, że ||fn − fm ||W BVφ ¬ ε dla m, n n0 . Z określenia normy (4.9) wynika, że ! |fn (a) − fm (a)| ¬ ε , VarW φ fn − fm ; [a, b] ¬ 1 , ε (4.12) dla m, n n0 . Z pierwszej nierówności w (4.12) wnioskujemy, że ciąg liczbowy (fn (a)) jest zbieżny do pewnej liczby rzeczywistej, którą oznaczymy przez f (a). Natomiast druga nierówność w (4.12) implikuje, że dla każdego podziału {t0 , t1 , ..., tk } ∈ P([a, b]) ma miejsce nierówność k X |[fn (tj ) − fm (tj )] − [fn (tj−1 ) − fm (tj−1 )]| φ ε j=1 ! ¬1. (4.13) Biorąc w szczególności podział {a, x, b} (z ustaloną liczbą x, x ∈ (a, b)), z powyższej nierówności otrzymujemy |[fn (x) − fm (x)] − [fn (a) − fm (a)]| φ ε ! ¬1, skąd |[fn (x) − fm (x)] − [fn (a) − fm (a)]| ¬ φ−1 (1) , ε i dalej |fn (x) − fm (x)| ¬ |fn (a) − fm (a)| + εφ−1 (1) . 69 Powyższa nierówność jest w trywialny sposób spełniona dla x = a. Można również pokazać, że jest ona spełniona dla x = b. Zatem, na podstawie tejże nierówności i pierwszej nierówności w (4.12) wnioskujemy, że ma miejsce oszacowanie |fn (x) − fm (x)| ¬ ε(1 + φ−1 (1)) dla m, n n0 i dla dowolnego x ∈ [a, b]. Z oszacowania tego wynika, że ciąg (fn ) jest na przedziale [a, b] zbieżny jednostajnie do pewnej funkcji f w przestrzeni B([a, b]). Teraz, weźmy ponownie pod uwagę nierówność (4.13). Traktując n jako ustalone i przechodząc z m → ∞, otrzymujemy k X |[fn (tj ) − f (tj )] − [fn (tj−1 ) − f (tj−1 )]| φ ε j=1 ! ¬1 skąd wynika, że ! VarW φ fn − f ; [a, b] ¬ 1 ε dla n n0 . Zatem ||fn − f ||W BVφ ¬ 2ε, a więc fn → f w przestrzeni W BVφ ([a, b]). Koniec dowodu. Zwróćmy teraz uwagę na przypadek szczególny funkcji Younga φ(t) = tp dla 1 < p < ∞ oraz na przestrzeń W BVp ([a, b]) rozważaną w poprzednim rozdziale. W Przykładzie 3.4 zapowiedzieliśmy, że wariacja w sensie Wienera (szczególny przypadek wariacji WieneraYounga dla φ(t) = tp ) jest superaddytywna ze względu na przedziały. Oczywiście wynika to z Twierdzenia 4.16(a) dla φ(t) = tp . Co więcej, z punktów (a) i (b) wspomnianego twierdzenia otrzymujemy nierówności W W VarW p (f ; [a, c]) + Varp (f ; [c, b]) ¬ Varp (f ; [a, b]) h i W ¬ 2p VarW p (f ; [a, c]) + Varp (f ; [c, b]) , przy czym nierówność po prawej stronie wynika z faktu, że M (T ) = 2p w definicji M = M (T ) dla φ(t) = tp . Zajmiemy się teraz ustaleniem zależności pomiędzy przestrzeniami W BVφ i W BVψ dla dowolnych funkcji Younga φ i ψ. Uogólnimy tym samym Twierdzenie 3.7. 70 Twierdzenie 4.17. Niech φ i ψ będą funkcjami Younga takimi, że funkcja ψ ◦ φ−1 jest wypukła. Wtedy ma miejsce nierówność −1 VarW ψ −1 VarW φ (f ; [a, b]) ψ (f ; [a, b]) ¬ φ . (4.14) Ponadto W BVφ ([a, b]) ⊂ W BVψ ([a, b]) (4.15) dla takich funkcji Younga φ i ψ. Dowód. Żeby udowodnić nierówność (4.14) możemy przyjąć, że wariacja VarW φ (f ; [a, b]) jest skończona. Dalej, ustalmy dowolny podział {t0 , t1 , ..., tm } ∈ P([a, b]). Wtedy, mając na uwadze fakt, że funkcje ψ i φ−1 są rosnące (por. Lemat 3.6) oraz fakt, że funkcja ψ ◦φ−1 jest funkcją Younga - więc jest superaddytywna, otrzymujemy: m X VarW ψ (f, P ; [a, b]) = ψ(|f (tj ) − f (tj−1 )|) j=1 = m X (ψ ◦ φ−1 ◦ φ)(|f (tj ) − f (tj−1 )|) j=1 = m X (ψ ◦ φ−1 )(φ(|f (tj ) − f (tj−1 )|)) j=1 −1 ¬ (ψ ◦ φ ) m X φ(|f (tj ) − f (tj−1 )|) j=1 W −1 = (ψ ◦ φ−1 ) VarW φ (f, P ; [a, b]) ¬ (ψ ◦ φ ) Varφ (f ; [a, b]) . Biorąc po lewej stronie supremum ze względu na wszystkie podziały, otrzymujemy nierówność −1 VarW VarW ψ (f ; [a, b]) ¬ ψ φ φ (f ; [a, b]) , skąd, po obłożeniu obydwu stron funkcją ściśle rosnącą ψ −1 otrzymujemy nierówność (4.14). Inkluzja (4.15) jest bezpośrednią konsekwencją nierówności (4.14), co kończy do wód. Biorąc w nierówności (4.14) φ(t) = t otrzymujemy, że wypukłość funkcji ψ = ψ ◦ φ−1 implikuje następujący wniosek. 71 Wniosek 4.18. Niech ψ będzie funkcją Younga. Wtedy dla każdej funkcji ograniczonej f : [a, b] → R ma miejsce nierówność ψ −1 VarW ψ (f ; [a, b]) ¬ Var(f ; [a, b]) . Zatem spełniona jest inkluzja BV ([a, b]) ⊂ W BVψ ([a, b]) . Zwróćmy uwagę na to, że z ostatniej inkluzji wynika, że każda funkcja o wariacji ograniczonej w sensie klasycznym ma wariację ograniczoną w sensie Wienera-Younga dla każdej funkcji Younga φ. Ponadto, biorąc w (4.14) i (4.15) φ(t) = tp , ψ(t) = tq przy 1 ¬ p ¬ q, otrzymujemy Twierdzenie 3.7. Zadania 1. Niech 1 ¬ p < ∞. Mówimy, że funkcja Younga φ : R+ → R+ spełnia warunek ∞p , jeżeli φ(t) =∞ tp (piszemy wtedy, że φ ∈ ∞p ). Pokazać, że funkcja φ(t) = tq spełnia warunek ∞p lim t→∞ dla q > p oraz funkcja φ(t) = et − 1 spełnia warunek ∞p dla każdego p 1. Rozstrzygnąć podobne pytanie odnośnie funkcji Younga φ(t) = t ln(t + 1). 2. Niech 1 ¬ p < ∞ i niech φ : R+ → R+ będzie funkcją Younga. Mówimy, że φ ∈ 0p (funkcja φ spełnia warunek 0p ) jeżeli φ(t) =∞. t→0 tp lim Sprawdzić, czy φ ∈ 0p dla funkcji Younga wymienionych w Zad. 1. 3. Pokazać, że lim VarW φ (f /λ; [a, b]) = 0 λ→∞ dla dowolnej funkcji Younga φ i dla każdej funkcji f ∈ W BVφ ([a, b]). 4. Udowodnić, że [ W BVφ ([a, b]) = R([a, b]) , φ 72 gdzie sumowanie rozciąga się po wszystkich funkcjach Younga i gdzie R([a, b]) oznacza przestrzeń funkcji regularnych na przedziale [a, b]. 5. Podać przykład funkcji f : [a, b] → R takiej, że ma ona nieograniczoną wariację Wienera VarW p (f ; [a, b]) dla każdego p 1 ale dla której istnieje funkcja Younga φ taka, że f ∈ W BVφ ([a, b]). 73 5. Wariacja funkcji w sensie Watermana Rozdział ten rozpoczniemy od przypomnienia wcześniej wprowadzonych oznaczeń. Mianowicie, dla zadanego przedziału [a, b] symbolem P ([a, b]) oznaczamy rodzinę wszystkich skończonych zbiorów S = {[a1 , b1 ], [a2 , b2 ], ..., [an , bn ]} złożonych z niezachodzacych na siebie podprzedziałów przedziału [a, b], podczas gdy symbol P ∞ ([a, b]) oznacza rodzinę wszystkich nieskończonych przeliczalnych zbiorów S∞ = {[an , bn ] : n ∈ N} złożonych z niezachodzących na siebie podprzedziałów przedziału [a, b]. Definicja 5.1. Ciągiem Watermana będziemy nazywać malejący ciąg liczbowy Λ = (λn ) złożony z liczb dodatnich takich, że λn → 0 przy n → ∞ oraz ∞ X λn = ∞ . n=1 Prostym przykładem ciągu Watermana jest tzw. ciąg harmoniczny rzędu α postaci 1 nα , gdzie 0 < α ¬ 1. Załóżmy teraz, że zadana jest funkcja f : [a, b] → R, zbiór S∞ = {[an , bn ] : n ∈ N} ∈ P ∞ ([a, b]) oraz ciąg Watermana Λ = (λn ). Liczbę rzeczywistą określoną następująco VarΛ (f, S∞ ) = VarΛ (f, S∞ ; [a, b]) = ∞ X λk |f (bk ) − f (ak )| (5.1) k=1 będziemy nazywać wariację Watermana funkcji f na przedziale [a, b] względem S∞ . Natomiast wielkość zdefiniowaną w następujący sposób. VarΛ (f ) = VarΛ (f ; [a, b]) = sup {VarΛ (f, S∞ ; [a, b]) : S∞ ∈ P ∞ ([a, b])} , (5.2) nazywamy wariacją (całkowitą) Watermana funkcji f na [a, b]. Jeżeli VarΛ (f ; [a, b]) < ∞ to mówimy, że f jest funkcją o ograniczonej wariacji Watermana (o ograniczonej Λ-wariacji w sensie Watermana) na przedziale [a, b]. Zbiór wszystkich funkcji o ograniczonej Λ-wariacji Watermana na przedziale [a, b] oznaczać będziemy symbolem ΛBV ([a, b]). Zauważmy, że jeżeli zrezygnowalibyśmy z żądania λn → 0, to biorąc λn = 1 (n ∈ N) dostaniemy przestrzeń ΛBV ([a, b]) pokrywającą się z klasyczną przestrzenią BV ([a, b]). Zauważmy również, że te przestrzenie pokrywają się wtedy i tylko wtedy, gdy ciąg (λn ) jest odseparowany od zera. Wyjaśnia to powód, dla którego żądamy, żeby λn → 0. 74 Udowodnimy teraz pewnien fakt pomocniczy, który będzie używany w dalszym ciągu. Twierdzenie 5.2. Załóżmy, że f 6∈ ΛBV ([a, b]). Wtedy istnieje punkt x0 ∈ [a, b] taki, że: 1o Jeżeli x0 ∈ (a, b), to f 6∈ ΛBV ([c, d]) dla każdego przedziału [c, d] ⊂ [a, b] takiego, że x0 ∈ (c, d). 2o Jeżeli x0 = a to f 6∈ ΛBV ([a, d]) dla każdego przedziału [a, d] ⊂ [a, b]. 3o Jeżeli x0 = b to f 6∈ ΛBV ([c, b]) dla każdego przedziału [c, b] ⊂ [a, b]. Dowód. Dzielimy kolejno przedział [a, b] na dwie połowy. Przypuśćmy, że szereg występujący w (5.1) jest jednostajnie ograniczony przez stałą M > 0 dla przedziałów In = [an , bn ] znajdujących się w lewej połowie przedziału I = [a, b] lub w prawej połowie tego przedziału. Wtedy mamy, że VarΛ (f ; [a, b]) ¬ 2M , co przeczy naszemu założeniu. Dlatego zbiór takich szeregów musi być nieograniczony na jednej połowie przedziału I. Kontynuując to postępowanie znajdziemy zstępujący ciąg przedziałów (In ) zbieżny (w sensie części wspólnej) do pewnego punktu x0 . Teraz, jeżeli x0 jest punktem wewnętrznym pewnego podprzedziału J ⊂ I, to In ⊂ J dla n odpowiednio dużego. Stąd wynika teza naszego twierdzenia w rozważanym przypadku. Jeżeli x0 = a lub x0 = b, rozumujemy podobnie otrzymując tezę twierdzenia. Powyższe twierdzenie nosi nazwę zasady lokalizacji. Przytoczymy teraz twierdzenie zawierające podstawowe własności wariacji Watermana (5.1) i (5.2). Twierdzenie 5.3. Wielkości (5.1) i (5.2) mają następujące własności: (a) Wariacja Watermana (5.1) jest monotoniczna ze względu na zbiory podprzedziałów, tzn. jeżeli S∞ ⊂ T∞ , to VarΛ (f, S∞ ) ¬ VarΛ (f, T∞ ) . (b) Wariacja całkowita w sensie Watermana (5.2) jest podaddytywna ze względu na przedziały, tzn. VarΛ (f ; [a, b]) ¬ VarΛ (f ; [a, c]) + VarΛ (f ; [c, b]) . (c) Wariacja całkowita Watermana (5.2) jest dodatnio jednorodna tzn. ma miejsce równość VarΛ (µf ; [a, b]) = |µ|VarΛ (f ; [a, b]) 75 dla µ ∈ R. (d) Wariacja całkowita (5.2) jest podaddytywna ze względu na funkcje, tzn. VarΛ (f + g; [a, b]) ¬ VarΛ (f ; [a, b]) + VarΛ (g; [a, b]) . Ponadto |VarΛ (f ; [a, b]) − VarΛ (g; [a, b])| ¬ VarΛ (f − g; [a, b]) . (e) Jeżeli f jest funkcją o wariacji ograniczonej na przedziale [a, b], to f ∈ ΛBV ([a, b]) dla każdego ciągu Watermana Λ. (f ) Jeżeli f ∈ ΛBV ([a, b]), to f jest funkcją ograniczoną na [a, b]. Dowód. Własność (a) jest oczywista. Dla dowodu (b) ustalmy dowolny zbiór S∞ = {[an , bn ] : n ∈ N} ∈ P ∞ ([a, b]). Następnie określmy dwa zbiory indeksów N1 , N2 ⊂ N w następujący sposób: N1 = {k ∈ N : [ak , bk ] ⊂ [a, c]} , N2 = {k ∈ N : [ak , bk ] ⊂ [c, b]} . Oczywiście zbiory N1 i N2 są rozłączne. Ponadto, istnieje co najwyżej jedna liczba naturalna k0 taka, że c ∈ (ak0 , bk0 ). Wtedy mamy: ∞ X X λk |f (bk ) − f (ak )| = λk |f (bk ) − f (ak )| k∈N1 ∪N2 ∪{k0 } k=1 = X λk |f (bk ) − f (ak )| k∈N1 + X λk |f (bk ) − f (ak )| + λk0 |f (bko ) − f (ak0 )| k∈N2 ¬ X + λk |f (bk ) − f (ak )| + λk0 |f (bk0 ) − f (c)| k∈N1 X λk |f (bk ) − f (ak )| + λk0 |f (c) − f (ak0 )| k∈N2 ¬ VarΛ (f ; [a, c]) + VarΛ (f ; [c, b]) . Stąd otrzymujemy nierówność z (b). Dowód własności (c) jest trywialny i dlatego go pomijamy. 76 Dla dowodu (d) ustalmy nieskończony zbiór S∞ = {[an , bn ] : n ∈ N} ∈ Wtedy mamy ∞ X P ∞ ([a, b]). λn |f (bn ) + g(bn ) − f (an ) + g(an )| n=1 ¬ ∞ X λn |f (bn ) − f (an )| + n=1 ∞ X λn |g(bn ) − g(an )| . n=1 Stąd VarΛ (f + g) ¬ VarΛ (f ) + VarΛ (g) . W przypadku, gdy f, g ∈ ΛBV ([a, b]), z powyższej nierówności otrzymujemy VarΛ (f ) = VarΛ [(f − g) + g] ¬ VarΛ (f − g) + VarΛ (g) , i stąd VarΛ (f ) − VarΛ (g) ¬ VarΛ (f − g) . W podobny sposób, wykorzystując własność (c) dla µ = −1, dostajemy VarΛ (g) − VarΛ (f ) ¬ VarΛ (f − g) . Dowodzi to w pełni własności (d). Dla dowodu (e), znowu ustalmy nieskończony zbiór S∞ = {[an , bn ] : P ∞ ([a, b]). n ∈ N} ∈ Ponieważ Λ = (λn ) jest malejący, dostajemy ∞ X n=1 λn |f (bn ) − f (an )| ¬ λ1 ∞ X |f (bn ) − f (an )| ¬ λ1 Var(f ; [a, b]) . n=1 Z oszacowania tego wynika własność (e). Dla dowodu (f) załóżmy, że f ∈ ΛBV ([a, b]) ale f nie jest ograniczona na przedziale [a, b]. Wtedy istnieje ciąg (un ) ⊂ [a, b] taki, że |f (un )| → ∞. Ponieważ (un ) jest ograniczony, to można wybrać podciąg (vn ) ciągu (un ) taki, że vn → x dla pewnego x ∈ [a, b]. Oczywiście wtedy |f (vn )| → ∞ gdy n → ∞. Następnie, z ciągu (vn ) można wybrać ciąg monotoniczny (wn ), gdzie |f (wn )| → ∞ oraz wn → x. Dalej, z ciągu (wn ) wybieramy podciąg (zn ) taki, żeby |f (zn+1 )| 1 + |f (zn )| dla n = 1, 2, .... Weźmy teraz pod uwagę ciąg przedziałów [z1 , z2 ], [z2 , z3 ], ..., który tworzy zbiór S∞ ∈ P ∞ ([a, b]). Obliczając wariację Watermana (5.1) ze względu na S∞ , otrzymujemy VarΛ (f, S∞ ) = ∞ X λn |f (zn+1 ) − f (zn )| n=1 77 ∞ X λn [|f (zn+1 )| − |f (zn )|] n=1 ∞ X λn = ∞ . n=1 Ale przeczy to faktowi, że na podstawie przyjętego założenia f ∈ ΛBV ([a, b]) i kończy dowód. Zwróćmy teraz uwagę na to, że własności (e) i (f) z powyższego twierdzenia mogą być zapisane w postaci następujących inkluzji BV ([a, b]) ⊂ \ [ ΛBV ([a, b]) , Λ ΛBV ([a, b]) ⊂ B([a, b]) , (5.3) Λ gdzie przecięcie i sumę bierzemy po wszystkich ciągach Watermana Λ. Do zależności (5.3) wrócimy później. Twierdzenie 5.4. Następujące trzy warunki są równoważne (a) Funkcja f należy do ΛBV ([a, b]). (b) Istnieje stała M > 0 taka, że VarΛ (f, S∞ ) = ∞ X λk |f (bk ) − f (ak )| ¬ M k=1 dla każdego zbioru nieskończonego S∞ = {[ak , ak ] : k ∈ N} ∈ P ∞ ([a, b]). (c) Istnieje stała N > 0 taka, że VarΛ (f, S) = n X λi |f (bi ) − f (ai )| ¬ N i=1 dla każdego zbioru skończonego S = {[a1 , b1 ], ..., [an , bn ]} ∈ P ([a, b]). Dowód. Równoważność (a) i (b) jest prostą konsekwencją przyjętej definicji. Fakt, że (c) implikuje (b) wynika z warunku koniecznego i wystarczającego zbieżności szeregu o wyrazach nieujemnych. Zatem, należy tylko udowodnić, że (b) implikuje (c). Załóżmy więc, że spełniony jest warunek (b) ale nie jest spełniony warunek (c). Oznacza to, że dla każdej liczby N > 0 istnieje skończony zbiór S = {[a1 , b1 ], ..., [an , bn ]} ∈ P ([a, b]) taki, że n X λi |f (bi ) − f (ai )| > N . i=1 78 Biorąc N = 2M , gdzie M jest stałą występującą w (b), znajdziemy skończony zbiór SM = {[a1 , b1 ], ..., [an , bn ]} ∈ P ([a, b]) taki, że VarΛ (f, SM ) = n X λi |f (bi ) − f (ai )| > 2M . i=1 Teraz, rozróżnimy dwa możliwe przypadki. Załóżmy najpierw, że [a1 , b1 ] ∪ [a2 , b2 ] ∪ ... ∪ [an , bn ] = [a, b] . ∗ Rozważmy nieskończony zbiór S∞ = {[αi , βi ] : i = n, n + 1, n + 2, ...} ∈ P ∞ ([an , bn ]), gdzie pierwszy przedział jest taki, że α n = an , β n = an + b n . 2 0 = {[a1 , a2 ], ..., [an−1 , bn−1 ]}, otrzymamy Dołączając do tego zbioru zredukowany zbiór SM nieskończony zbiór 0 ∗ SM ∪ S∞ = {[a1 , b1 ], ..., [an−1 , bn−1 ], [αn , βn ], [αn+1 , βn+1 ], ...} ∈ P ∞ ([a, b]) . Na podstawie założenia (b), mamy 0 ∗ VarΛ (f, SM ∪ S∞ )= n−1 X λk |f (bk ) − f (bk−1 )| k=1 + ∞ X λk |f (βk ) − f (αk )| ¬ M . k=n Stąd, uwzględniając tylko pierwsze n składników w ostatniej sumie, otrzymujemy n−1 X λk |f (bk ) − f (ak )| + λn |f ((an + bn )/2) − f (an )| ¬ M . (5.4) k=1 ∗∗ Podobnie, możemy rozważyć nieskończony zbiór S∞ = {[γi , δi ] : i = n, n + 1, n + 2, ...} ∈ P ∞ ([a, b]), gdzie pierwszy składnik [γn , δn ] ma końce określone równościami γn = an + b n , δ n = bn . 2 0 Dodając znowu do tego zbioru zredukowany zbiór SM , otrzymujemy zbiór nieskończony postaci 0 ∗∗ SM ∪ S∞ = {[a1 , b1 ], ..., [an−1 , bn−1 ], [γn , δn ], [γn+1 , δn+1 ], ...} ∈ 79 P ∞ ([a, b]) . Stosując podobne rozumowanie jak wcześniej, otrzymujemy oszacowanie n−1 X λk |f (bk ) − f (ak )| + λn |f (bn ) − f ((an + bn )/2)| ¬ M . (5.5) k=1 Łącząc oszacowania (5.4) i (5.5) i kładąc cn = (an + bn )/2, dostajemy n−1 X 2 λk |f (bk ) − f (ak )| + λn |f (bn ) − f (an )| k=1 ¬2 n−1 X λk |f (bk ) − f (ak )| + λn |f (bn ) − f (cn )| + λn |f (cn ) − f (an )| k=1 = n−1 X λk |f (bk ) − f (ak )| + λn |f (bn ) − f (cn )| k=1 + n−1 X λk |f (bk ) − f (ak )| + λn |f (cn ) − f (an )| ¬ 2M , k=1 co jest sprzeczne z naszym doborem SM . Teraz załóżmy, że mamy ścisłą inkluzję [a1 , b1 ] ∪ [a2 , b2 ] ∪ ... ∪ [an , bn ] $ [a, b] . Wybierzmy przedział [α, β] taki, że α, β ⊂ [a, b] \ ([a1 , b1 ] ∪ [a2 , b2 ] ∪ ... ∪ [an , bn ]) a następnie weźmy ciąg [an+1 , bn+1 ], [an+2 , bn+2 ], ... niezachodzących na siebie przedziałów takich, że S∞ = {[aj , bj ] : j = n + 1, n + 2, ...} ∈ P ∞ ([α, β]). SM ∪ S∞ = {[ak , bk ] : k ∈ N} ∈ otrzymujemy VarΛ (f, SM ∪ S∞ ) = ∞ X Wtedy dla sumy P ∞ ([a, b]) λk |f (bk ) − f (ak )| k=1 = n X λk |f (bk ) − f (ak )| + k=1 ∞ X λk |f (bk ) − f (ak )| ¬ M . k=n+1 Stąd wynika, że VarΛ (f, SM ) = n X λi |f (bi ) − f (ai )| ¬ M , i=1 co jest sprzeczne z doborem SM . 80 Zatem w obydwu rozważanych przypadkach dowód jest zakończony. Z Twierdzenia 5.4 wynika, że całkowita wariacja Watermana (5.2) może być zdefiniowana następująco VarΛ (f ) = VarΛ (f ; [a, b]) = sup{VarΛ (f, S; [a, b]) : S ∈ X ([a, b])} . (5.6) Twierdzenie 5.5. Zbiór ΛBV ([a, b]) jest przestrzenią liniową. Wielkość ||f ||ΛBV = |f (a)| + VarΛ (f ; [a, b]) (5.7) określona na ΛBV ([a, b]) jest normą oraz ΛBV ([a, b]) z tą normą jest przestrzenią Banacha. Dowód. Fakt, że zbiór ΛBV ([a, b]) jest przestrzenią liniową jest konsekwencją Twierdzenia 5.3(c) i (d). Sprawdzenie, że wielkość (5.7) jest normą w ΛBV ([a, b]) jest łatwe i opiera się o wspomniane własności (c) i (d) Twierdzenia 5.3. Pokażemy, że norma (5.7) jest zupełna. W tym celu załóżmy, że (fn ) jest ciągiem Cauchy’ego względem normy (5.7). Dla zadanej liczby ε > 0 dobierzmy no ∈ N tak, żeby |fn (a) − fm (a)| ¬ ε (5.8) VarΛ (fn − fm ) ¬ ε (5.9) oraz dla m, n n0 . Z (5.8) wnioskujemy, że ciąg (fn (a)) jest zbieżny do pewnej liczby, którą oznaczymy przez f (a). Z drugiej strony, z (5.9) wynika, że dla każdego nieskończonego zbioru S∞ = {[an , bn ] : n ∈ N} ∈ VarΛ (fn − fm , S∞ ) = P ∞ X ∞ ([a, b]) mamy λk |fn (bk ) − fm (bk ) − fn (ak ) + fm (ak )| ¬ ε . k=1 W szczególności, dla każdej liczby x ∈ [a, b], spełniona jest nierówność λ1 |fn (x) − fm (x)| − λ1 |fn (a) − fm (a)| ¬ λ1 |[fn (x) − fm (x)] − [fn (a) − fm (a)]| ¬ ε . Łacząc powyższą nierówność z (5.8), otrzymujemy oszacowanie |fn (x) − fm (x)| ¬ ε 81 1 + λ1 , λ1 które pokazuje, że ciąg funkcyjny (fn ) jest jednostajnie zbieżny do pewnej funkcji ograniczonej f na przedziale [a, b]. Dalej zauważmy, że z nierówności (5.9) oraz z nierówności zawartej w punkcie (d) Twierdzenia 5.3 wynika, że |VarΛ (fn ) − VarΛ (fm )| ¬ VarΛ (fn − fm ) ¬ ε dla n, m n0 , a zatem ciąg (VarΛ (fn )) ma granicę w R. Teraz, ustalmy dowolnie skończony zbiór S = {[a1 , b1 ], ..., [ap , bp ]} ∈ P ([a, b]). Z defi- nicji funkcji f wnioskujemy, że dla n odpowiednio dużych, mamy p X λi |f (bi ) − f (ai )| ¬ i=1 p X λi |fn (bi ) − fn (ai )| + ε ¬ VarΛ (fn ) + ε . i=1 Stąd, przechodząc z n → ∞, otrzymujemy VarΛ (f ) ¬ lim VarΛ (fn ) , n→∞ a więc f ∈ ΛBV ([a, b]). Odwołując się jeszcze raz do własności Cauchy’ego (5.9) ciągu (fn ), do liczby ε > 0 dobieramy n0 ∈ N takie, że dla każdego nieskończonego zbioru S∞ = {[ak , bk ] : k ∈ N} ∈ P ∞ ([a, b]), mamy VarΛ (fn − fm , S∞ ) = ∞ X λk |fn (bk ) − fm (bk ) − fn (ak ) + fm (ak )| ¬ ε , k=1 dla n, m n0 . Przechodząc z m → ∞ i biorąc supremum ze względu na zbiory S∞ , dostajemy VarΛ (fn − f ) ¬ ε . Z drugiej strony, przechodząc z m → ∞ w (5.8) również otrzymujemy |fn (a) − f (a)| ¬ ε, co w połączeniu z powyższą nierównością pozwala wywnioskować, że ||fn − f ||ΛBV → 0 przy n → ∞ i kończy dowód. Jak już wcześniej zapowiadaliśmy, inkluzje (5.3) między przestrzeniami BV ([a, b]), ΛBV ([a, b]) i R([a, b]) można ”doprecyzować”. Rzeczywiście, w dalszym ciągu pokażemy, że mają miejsce równości \ ΛBV ([a, b]) = BV ([a, b]) , Λ [ ΛBV ([a, b]) = R([a, b]) . (5.10) Λ Najpierw jednak koniecznym będzie podanie szeregu lematów o charakterze technicznym. 82 Lemat 5.6. Niech (αn ) będzie ciągiem liczb dodatnich zmierzającym do zera. Wtedy istnieje ciąg Watermana Λ = (λn ) taki, że ∞ X αn λn < ∞ . (5.11) n=1 Dowód. Oznaczmy n0 = 0 i wybierzmy liczbę naturalną n1 tak, żeby αn ¬ 1 2 dla n n1 . Połóżmy λn = 1/n dla n0 < n ¬ n1 . Załóżmy, że wybraliśmy liczby naturalne n1 , n2 , ..., nk w taki sposób, że n1 < n2 < ... < nk , αn ¬ 1 2k dla n nk oraz λn = 1/(nk − nk−1 ) dla nk−1 < n ¬ nk . Wtedy wybieramy następną liczbę naturalną nk+1 tak, że nk+1 nk + k, nk+1 − nk 1/λnk i αn < 1/2k+1 dla n nk+1 . Ponadto przyjmujemy, że 1 nk+1 − nk λn = dla nk < n ¬ nk+1 . Z konstrukcji wynika, że dla nk < n ¬ nk+1 mamy λn = 1 1 < λnk , λn ¬ . nk+1 − nk k Zatem (λn ) jest ciągiem malejącym i zbieżnym do zera. Ponadto mamy nk+1 X λn = 1 . n=nk +1 co pokazuje, że ∞ X λn = ∞ . n=1 Z drugiej strony, mamy nk+1 nk+1 nk+1 X X X 1 1 αn λn ¬ λn = k k 2 n=nk +1 n=nk +1 2 n=nk +1 λn = 1 2k co pokazuje, że ma miejsce (5.11) i kończy dowód. Dla zilustrowania przeprowadzonej w powyższym dowodzie konstrukcji weźmy ciąg αn = 1 . n Wtedy ciąg Watermana Λ = (λn ) skonstruowany w dowodzie Lematu 5.6 ma postać Λ= 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 , , , , , , , , , , , , , , , ... 2 2 4 4 4 4 8 8 8 8 8 8 8 8 16 83 . Ponadto, mamy ∞ X ∞ X ∞ X 1 1 α n λn ¬ 2 · 2k = <∞. k 2 n=1 k=1 k=1 2 k Lemat 5.7. Niech (λn ) będzie malejącym ciągiem liczb dodatnich. Jeżeli (δn ) jest ciągiem liczb dodatnich zmierzającym do zera oraz (δ̂n ) oznacza ciąg (δn ) uporządkowany w kierunku malejącym, to ∞ X n X λ k δk ¬ k=1 λn δ̂k k=1 dla n = 1, 2, .... Dowód. Ustalmy n ∈ N i rozważmy zbiór {δ1 , δ2 , ..., δn }. Niech δ10 δ20 ... δn0 oznacza elementy tego zbioru uporządkowane w kierunku malejącym. Wtedy, z dobrze znanego lematu kombinatorycznego otrzymujemy n X λk δk ¬ X λk δk0 . k=1 k=1 Oczywiście δk0 ¬ δ̂k dla k = 1, 2, ..., n. Stąd otrzymujemy nierówność z tezy lematu. Twierdzenie 5.8. Niech g : [c, d] → R będzie zadaną funkcją i niech τ : [a, b] → [c, d] będzie funkcją ciągłą i ściśle rosnącą oraz taką, że τ (a) = c, τ (b) = d. Wtedy g ◦ τ ∈ ΛBV ([a, b]) wtedy i tylko wtedy, gdy g ∈ ΛBV ([c, d]). Dowód. Załóżmy, że g ∈ ΛBV ([c, d]) i weźmy S∞ = {[an , bn ] : n ∈ N} ∈ P Z założenia dotyczącego τ mamy, że τ (S∞ ) = {[τ (an ), τ (bn )] : n ∈ N} ∈ P ∞ ([a, b]). ∞ ([c, d]). Ponieważ g ∈ ΛBV ([c, d]), więc mamy VarΛ (g ◦ τ, S∞ ; [a, b]) = ∞ X λn |(g ◦ τ )(bn ) − (g ◦ τ )(an )| n=1 = ∞ X λn |g(τ (bn )) − g(τ (an ))| = VarΛ (g, τ (S∞ ); [c, d]) < ∞ , n=1 co pokazuje, że g ◦ τ ∈ ΛBV ([a, b]) po przejściu do kresu górnego względem S∞ ∈ P ∞ ([a, b]). Stosując to samo rozumowanie do funkcji τ −1 : [c, d] → [a, b] dowodzimy implikacji odwrotnej. Następne twierdzenie będzie pokazywać, że każda funkcja ciągła f : [a, b] → R należy do pewnej przestrzeni Watermana ΛBV ([a, b]). 84 Twierdzenie 5.9. Każda funkcja f ∈ C([a, b]) należy do przestrzeni ΛBV ([a, b]) dla pewnego ciągu Watermana Λ. Dowód. Niech f ∈ C([a, b]). Dla dowolnej liczby δ > 0 oznaczymy przez ω∞ (f ; δ) moduł ciągłości funkcji f zdefiniowany następująco: ω∞ (f ; δ) = ω∞ (f, [a, b]; δ) = sup {|f (x + h) − f (x)| : a ¬ x ¬ b − h} . (5.12) 0¬h¬δ Oczywiście moduł ciągłości ω∞ (f ; δ) jest funkcją rosnącą na przedziale [0, b − a] i ω∞ (f ; δ) → 0 przy δ → 0, ponieważ f jest jednostajnie ciągła na [a, b]. Niech In = [an , bn ] będzie ciągiem niezachodzących na siebie podprzedziałów przedziału [a, b]. Będziemy używać oznaczenia: |f (In )| = |f (bn ) − f (an )| . Dla ustalonego m ∈ N połóżmy ( Em = Ik : ω∞ b−a f; m+1 ! < |f (Ik )| ¬ ω∞ b−a f; m !) . Zauważmy, że w przypadku gdy |bk − ak | ¬ (b − a)/m, mamy |f (Ik )| = |f (bk ) − f (ak )| ¬ ω∞ (f ; |bk − ak |) ¬ ω∞ b−a f; m ! , więc Ik ∈ Em tylko wtedy, gdy bk − ak > (b − a)/(m + 1). Ponieważ przedziały Ik są niezachodzące i zawarte w [a, b], więc stąd wnioskujemy, że Em może zawierać co najwyżej m przedziałów. Ponadto, jeżeli Ip ∈ Er i Iq ∈ Er+s , to wtedy |f (Iq )| ¬ ω∞ b−a f; r+s ! ¬ ω∞ b−a f; r+1 ! < |f (Iq )| . Zatem, krok po kroku, możemy wybrać ciąg (Jn ) przedziałów Jk ∈ Ek takich, że |f (J1 )| |f (J2 )| · · · |f (Jn )| →0 przy n → ∞. Pokażemy teraz, że |f (Jn )| ¬ ω∞ 85 b−1 f; n ! (5.13) dla n = 1, 2, .... W tym celu załóżmy, że dla m ∈ N zachodzi b−a f; m |f (Jm )| > ω∞ ! . Wtedy b−a f; m |f (J1 )| |f (J2 )| · · · |f (Jm )| > ω∞ ! . Stąd wynika, że |Jk | > (b−a)/m dla k = 1, 2, ..., m, co jest niemożliwe, ponieważ wszystkie przedziały J1 , J2 , ..., Jm są niezachodzące na siebie i zawarte w przedziale [a, b]. Dowodzi to nierówności (5.13). Dalej, uwzględniając to, że ω∞ (f ; (b − a)/k) → 0 przy k → ∞, możemy zastosować Lemat 5.6, żeby dla ciągu αn = ω∞ b−a f; n ! (n = 1, 2, ....) znaleźć malejący ciąg Λ = (λn ) liczb dodatnich, zmierzający do zera i taki, że ∞ X λn = ∞ , ∞ X λn ω∞ n=1 n=1 b−a f; n ! <∞. Teraz, stosując Lemat 5.7 do ciągu δn = |f (In )|, otrzymujemy ∞ X n=1 λn |f (In )| ¬ ∞ X λn |f (Jn )| ¬ ∞ X λn ω∞ n=1 n=1 b−a f; n ! <∞. Oznacza to jednak, że f ∈ ΛBV ([a, b]) dla Λ = (λn ), co kończy dowód. Zauważmy, że rezultat zawarty w powyższym twierdzeniu możemy zapisać następująco: C([a, b]) ⊂ [ BV ([a, b]) , (5.14) Λ gdzie sumowanie rozciąga się na wszystkie ciągi Watermana. Udowodnimy teraz anonsowane wcześniej równości (5.10). Twierdzenie 5.10. Mają miejsce równości (5.10). Dowód. Zauważmy, że mając na uwadze inkluzje (5.3), dla dowodu pierwszej równości w (5.10) wystarczy pokazać, że BV ([a, b]) ⊃ \ Λ 86 ΛBV ([a, b]) . W tym celu ustalmy dowolny ciąg Watermana Λ = (λn ) i weźmy funkcję f ∈ ΛBV ([a, b]). Wiemy, że wtedy f jest ograniczona. Oznaczmy: m(f ) = inf{f (x) : x ∈ [a, b]} , M (f ) = sup{f (x) : x ∈ [a, b]} . Oczywiście m(f ), M (f ) są skończone. Połóżmy F (x) = f (x) − m(f ) M (f ) − m(f ) (a ¬ x ¬ b) . Mamy, że 0 ¬ F (x) ¬ 1 dla a ¬ x ¬ b. Oczywiście, tak jak funkcja f , również funkcja F należy do przestrzeni ΛBV ([a, b]). W związku z tym możemy założyć, że 0 ¬ f (x) ¬ 1 (x ∈ [a, b]) . Przypuśćmy, że f 6∈ BV ([a, b]). Wtedy, na podstawie zasady lokalizacji (por. Zad. 6, Rozdz. 2) znajdziemy punkt x ∈ [a, b] taki, że f ma nieograniczoną wariację w każdym otoczeniu punktu x (zrelatywizowanym do przedziału [a, b]). Wybierzmy teraz skończony podział P1 przedziału [a, b] taki, że X |f (I)| 3 . (5.15) I∈P1 Punkt x znajdzie się we wnętrzu pojedynczego przedziału podziału P1 albo jest końcem dwóch przedziałów z P1 albo też początkiem lub końcem jednego przedziału z P1 . Jeżeli usuniemy te pojedyncze przedziały lub dwa przedziały z P1 i oznaczymy przez Q1 zbiór pozostałych przedziałów, to wtedy na podstawie (5.15) mamy X |f (I)| 1 . I∈Q1 Jeżeli podział Q1 zawiera q1 przedziałów, będziemy pisać Q1 = {Ik1 : k = 1, 2, ..., q1 }. Teraz, zdefiniujmy λ1 = λ2 = · · · = λq1 = 1 . Wtedy q1 X λk |f (Ik1 )| 1 . k=1 Kończy to pierwszy krok w naszej definicji. 87 Załóżmy dalej, że skonstruowaliśmy Pn i Qn w taki właśnie sposób. Wtedy, stosując zasadę indukcji matematycznej, postępujemy dalej w następujący sposób: Przede wszystkim zauważmy, że jeden lub dwa przedziały usunięte z Pn dla utworzenia Qn tworzą otoczenie Un liczby x. Ponieważ f ma nieograniczoną wariację na Un , wnosimy, że istnieje skończony podział Pn+1 zbioru Un taki, że X |f (I)| 3 . I∈Pn+1 Odnotujmy następnie, że i tym razem punkt x jest albo punktem wewnętrznym pojedynczego przedziału zawartego w Pn+1 albo punktem końcowym dwóch przedziałów w Pn+1 albo x = a lub x = b dla pewnego przedziału w Pn+1 . Jeżeli teraz odrzucimy z Pn+1 ten pojedynczy przedział lub wspomniane dwa przedziały i oznaczymy przez Qn+1 zbiór pozostałych przedziałów, to wykorzystując znowu (5.15) otrzymamy, że X |f (I)| 1 . I∈Qn+1 Jeżeli Qn+1 zawiera qn+1 przedziałów, to piszemy, że Qn+1 = {Ikn+1 : k = 1, 2, ..., qn+1 } a następnie definiujemy λrn +1 = λrn +2 = · · · = λrn +qn = 1 , n+1 gdzie rn = q1 + q2 + · · · + qn i q0 = 0. Wtedy mamy qn+1 X λrn +k |f (Ikn+1 )| k=1 1 . n+1 Teraz zauważmy, że wszystkie przedziały z Qn+1 zawarte w Un są parami niezachodzące na siebie. Stąd wnioskujemy, że qi n+1 XX λri−1 +k |f (Iki )| i=1 k=1 n+1 X i=1 1 . i W ten sposób skonstruowaliśmy liczby rzeczywiste {λk : k = 1, 2, 3, ...} i niezachodzące na siebie podprzedziały {Ikn : k = 1, 2, ..., qn ; n = 1, 2, ...} przedziału [a, b] takie, że (λk ) jest ciągiem malejącym i zmierzającym do zera oraz ∞ X k=1 λk = ∞ , qi ∞ X X λri−1 +k |f (Iki )| = ∞ . i=1 k=1 88 To jednak oznacza, że Λ = (λk ) jest ciągiem Watermana i f nie należy do odpowiedniej przestrzeni ΛBV ([a, b]). Jest to sprzeczne z założeniem i kończy dowód pierwszej równości w (5.10). Udowodnimy teraz drugą równość. Dokładniej, pokażemy, że każda funkcja f ∈ ΛBV ([a, b]) ma granicę lewostronną w każdym punkcie przedziału (a, b). Dowód dla granicy prawostronnej jest analogiczny. Niech więc f ∈ ΛBV ([a, b]). Załóżmy, że istnieje punkt x ∈ (a, b) taki, że f nie ma w x granicy lewostronnej. Oznacza to, że l = lim inf f (t) < lim sup f (x) = L . − t→x t→x− Niech δ = (L − l)/3 i wybierzmy ciągi (pn ) i (Pn ) takie, że P1 < P2 < · · · → x, p1 < p2 < · · · → x oraz f (pn ) → l , f (Pn ) → L , f (pn ) ¬ l + δ , f (Pn ) L − δ . Następnie, wybierzmy podciąg (Qn ) ciągu (Pn ) i podciąg (qn ) ciągu (pn ) tak, że q1 < Q1 < q2 < Q2 < · · · . Wtedy przedziały [qm , Qm ] i [qn , Qn ] są rozłączne dla m 6= n oraz spełniają nierówności |f (Qn ) − f (qn )| f (Qn ) − f (qn ) (L − δ) − (l + δ) 3δ − 2δ = δ . Stąd wynika, że ∞ X λn |f (Qn ) − f (qn )| δ ∞ X λn = ∞ . n=1 n=1 Pokazuje to, że f 6∈ ΛBV ([a, b]) i przeczy naszemu założeniu. Pozostało do pokazania, że każda regularna funkcja należy do ΛBV ([a, b]) dla odpowiedniego ciągu Watermana Λ = (λn ). W tym celu, skorzystamy z twierdzenia Sierpińskiego (Twierdzenie 1.11). Zgodnie z tym twierdzeniem istnieją ściśle rosnąca funkcja τ : [a, b] → [c, d] oraz ciągła funkcja g : [c, d] → R takie, że f = g ◦ τ . Zauważmy, że funkcja afiniczna zadana wzorem l(t) = b−a (t − c) + a d−c jest ściśle rosnącym homeomorfizmem między przedziałami [c, d] i [a, b]. Dlatego złożenie l ◦ τ : [a, b] → [a, b] jest także ściśle rosnące oraz g ◦ l−1 : [a, b] → R jest funkcją ciągłą. Z Twierdzenia 5.9 wnioskujemy, że g ◦ l−1 ∈ ΛBV ([a, b]) dla pewnego ciągu Watermana Λ. 89 Z drugiej strony, z Twierdzenia 5.8 wynika, że f = (g ◦ l−1 ) ◦ (l ◦ τ ) należy do przestrzeni ΛBV ([a, b]). To kończy dowód. W dalszym ciągu zajmiemy się pokazaniem, że w definicji wariacji całkowitej Watermana możemy ograniczyć się do dość szczególnych zbiorów S∞ ∈ W tym celu oznaczmy symbolem d S∞ Pd ∞ ([a, b]) P ∞ ([a, b]). rodzinę wszystkich nieskończonych zbiorów = {[an , bn ] : n ∈ R} niezachodzących na siebie podprzedziałów przedziału [a, b] z dodatkową własnością, że ciąg (δn ) określony równością δn = |f (bn ) − f (an )| (n = 1, 2, ...) (5.16) jest malejący i zbieżny do zera. Do dowodu tego faktu będziemy potrzebować pewnego lematu pomocniczego dotyczącego funkcji regularnych. Lemat 5.11. Niech S∞ = {[an , bn ] : n ∈ N} ∈ P ∞ ([a, b]) będzie (skończonym lub nieskończonym) zbiorem przedziałów i niech f ∈ R([a, b]). Wtedy można przedziały [an , bn ] uporządkować w taki sposób, że |f (bn ) − f (an )| |f (bn+1 ) − f (an+1 )| dla n ∈ N. Dowód. Ponieważ f jest regularna, to stosując twierdzenie Sierpińskiego (Twierdzenie 1.11) można znaleźć funkcję ściśle rosnącą τ : [a, b] → [c, d] (gdzie c = τ (a), d = τ (b)) i funkcją ciągłą g : [c, d] → R takie, że f = g◦τ . Rozważmy teraz zbiór przedziałów τ (S∞ ) = {[τ (an ), τ (bn )] : n ∈ N}, który należy do P ∞ ([c, d]). Zauważmy, że ciąg (τ (bn )−τ (an )) jest zbieżny do zera. Zatem ciąg ten można ustawić w kolejności malejącej, tzn. można znaleźć ciąg (nk ) liczb nauralnych takich, że ciąg (τ (bnk ) − τ (ank )) jest malejący (i oczywiście zbieżny do zera). Teraz, rozważmy ciąg (ηk ) określony równością ηk = |f (bnk ) − f (ank )| = |g(τ (bnk )) − g(τ (ank ))| . Z ciągłości funkcji g wynika, że ηk → 0 gdy k → ∞. Stosując teraz dalsze przenumerowanie, możemy znaleźć ciąg (km ) liczb naturalnych taki, że (ηkm ) jest malejący. Odpowiadający mu ciąg przedziałów ma własności żądane w tezie lematu. Sformułujemy teraz własności wariacji Watermana w terminach zdefiniowanej wcześniej rodziny Pd ∞ ([a, b]). 90 Twierdzenie 5.12. Niech f ∈ ΛBV ([a, b]). Wtedy d d VarΛ (f ; [a, b]) = sup{VarΛ (f, S∞ ; [a, b]) : S∞ ∈ Pd ∞ ([a, b])} . (5.17) Dowód. Oznaczmy symbolem VardΛ (f ; [a, b]) wyrażenie po prawej stronie równości (5.17). Nierówność VardΛ (f ; [, b]) ¬ VarΛ (f ; [a, b]) wynika stąd, że Pd ∞ ([a, b]) ⊂ P ∞ ([a, b]). Zatem wystarczy udowodnić nierówność prze- ciwną do tej wyżej napisanej. W tym celu ustalmy dowolnie zbiór S∞ = {[an , bn ] : n ∈ N} ∈ P ∞ ([a, b]). Następnie rozważmy ciąg (δn ) zdefiniowany równością (5.16). Stosując Lemat 5.11 przedstawimy ciąg (δn ) w porządku malejącym. W ten sposób, otrzymujemy ciąg (δ̂n ), który na podstawie Lematu 5.7 spełnia nierówność n X λk |f (bk ) − f (ak )| ¬ k=1 n X λk δ̂k k=1 dla n = 1, 2, .... Stąd wynika, że VarΛ (f ; [a, b]) ¬ VardΛ ([a, b]). Koniec dowodu. W dalszym ciągu porównamy przestrzenie ΛBV ([a, b]) i M BV ([a, b]) dla różnych ciągów Watermana Λ = (λn ) oraz M = (µn ). Rozpoczniemy od odpowiedniej definicji. Definicja 5.13. Dla zadanych dwóch rosnących ciągów liczb dodatnich (Ln ) i (Mn ) będziemy pisać, że (Ln ) (Mn ), jeżeli istnieje stała c > 0 taka, że Ln ¬ cMn dla wszystkich n ∈ N. Jeżeli zarówno (Ln ) (Mn ) jak i (Mn ) (Ln ), to będziemy pisać (Ln ) ∼ (Mn ). Załóżmy, że Λ = (λn ) i M = (µn ) są dwoma ciągami Watermana. Dla uproszczenia oznaczeń, jeżeli m, n ∈ N i m ¬ n, to w dalszym ciągu będziemy używać skrótowych oznaczeń λ[m, n] = n X λk , µ[m, n] = k=m Zauważmy, że np. własność ∞ P n=1 n X µk . (5.18) k=m λn = ∞ ciągu Watermana (λn ) może być zapisana w postaci λ[1, n] → ∞ przy n → ∞. Twierdzenie 5.14. Niech Λ = (λn ) i M = (µn ) będą dwoma ciągami Watermana. Wtedy prawdziwe są następujące stwierdzenia. 91 (a) M BV ([a, b]) ⊂ ΛBV ([a, b]) wtedy i tylko wtedy gdy (λ[1, n]) (µ[1, n]). (b) M BV ([a, b]) = ΛBV ([a, b]) wtedy i tylko wtedy, gdy (λ[1, n]) ∼ (µ[1, n]). Dowód. Przypuśćmy, że istnieje stała c > 0 taka, że λ[1, n] = n X λk ¬ c k=1 n X µk = cµ[1, n] (5.19) k=1 dla n = 1, 2, ... . Ustalmy dowolnie funkcję f ∈ M BV ([a, b]) i nieskończony zbiór S∞ = {[an , bn ] : n ∈ N} ∈ P ∞ ([a, b]). Połóżmy δn = |f (bn ) − f (an )|. Mając na uwadze Twierdzenie 5.12 może- my bez straty ogólności założyć, że ciąg (δn ) jest malejący i zmierza do zera. Uwzględniając tożsamość n X λ k δk = n−1 X λ[1, k](δk − δk+1 ) + δn λ[1, n] k=1 k=1 i korzystając z założeń i (5.19), otrzymujemy n X n−1 X λk δk ¬ c k=1 ! µ[1, k](δk − δk+1 ) + δn µ[1, n] = c k=1 n X δk µk . k=1 Pokazuje to, że f ∈ ΛBV ([a, b]) i kończy dowód pierwszej implikacji w (a). Dla dowodu drugiej implikacji załóżmy, że (λ[1, n]) 6 (µ[1, n]). Wtedy istnieje ściśle rosnący podciąg (nk ) ciągu liczb naturalnych takich, że λ[nk + 1, nk+1 ] 2k µ[nk + 1, nk+1 ] , gdzie n0 = 0. Dla zadanego zbioru S∞ = {[an , bn ] : n ∈ N} ∈ P ∞ ([a, b]) weźmy funkcję f : [a, b] → R taką, że δi = |f (bi ) − f (ai )| = 2k µ[n 1 (i = nk + 1, nk + 2, ..., nk+1 ) . k + 1, nk+1 ] Zauważmy, że wtedy ciąg (δn ) jest malejący i zmierza do zera przy n → ∞. Ponadto, mamy nk+1 X i=1 δi λ i = k X k X λ[nj + 1, nj+1 ] 2j−1 δ µ[n + 1, n 2 ] j j+1 j=0 j=0 = 2k+1 − 1 → ∞ przy k → ∞ , 92 oraz nk+1 X δi µ i = i=1 k X 1 ¬2. j j=0 2 Pokazuje to, że f ∈ M BV ([a, b]) ale f 6∈ ΛBV ([a, b]) i tym samym kończy dowód (a). Stwierdzenie (b) jest bezpośrednią konsekwencją (a). Zadania 1. Niech φ : R+ → R+ będzie funkcją Younga oraz niech φ∗ : R → R+ będzie tzw. sprzężoną funkcją Younga określoną równością φ∗ (t) = sup{st − φ(s) : s 0}. (a) Pokazać, że ab ¬ φ(a) + φ∗ (b) dla dowolnych a, b ∈ R+ . (b) Udowodnić, że jeżeli Λ = (λn ) jest ciągiem Watermana takim, że ∞ X φ∗ (λn ) < ∞ n=1 to W BVφ ([a, b]) ⊂ ΛBV ([a, b]) . 2. Znaleźć warunki nałożone na ciąg Watermana Λ = (λn ) i na funkcję Younga φ takie, żeby ΛBV ([a, b]) ⊂ W BVφ ([a, b]). 3. Niech Λ = (λn ) będzie ciągiem Watermana. Dla zadanej funkcji f ∈ ΛBV ([a, b]) oznaczmy przez Vf,Λ funkcję określoną na przedziale [a, b] w następujący sposób: Vf,Λ (x) = VarΛ (f ; [a, x]) . (a) Pokazać, że Vf,Λ jest funkcją rosnącą na przedziale [a, b]. (b) Pokazać, że jeżli f jest prawostronnie ciągła w punkcie a, to lim Vf,Λ (x) = 0 . x→a+ (c) Pokazać, że jeżeli f jest lewostronnie ciągła w punkcie b, to lim Vf,Λ (x) = VarΛ (f ; [a, b]) . x→b− (d) Pokazać, że funkcja Vf,Λ jest ciągła w punkcie x0 ∈ (a, b) wtedy i tylko wtedy, gdy f jest ciągła w x0 . 93 6. Całka Riemanna-Stieltjesa Całka Riemanna-Stieltjesa znajduje szerokie zastosowania w teorii prawdopodobieństwa [3,5]. Jednak podstawowe znaczenie pojęcia całki Riemanna-Stieltjesa polega na tym, że stwarza ono możliwość bardzo ładnej charakteryzacji przestrzeni sprzężonej do klasycznej przestrzeni funkcji ciągłych z normą maksimum C([a, b]) [1]. Pojęcie całki Riemanna-Stieltjesa wprowadza się w oparciu o pojęcie funkcji o wariacji ograniczonej. Warto tutaj zwrócić uwagę na fakt, że teoria całki Riemanna-Stieltjesa może opierać się bezpośrednio o funkcje o wariacji ograniczonej [6,7] albo też, dzięki twierdzeniu Jordana o rozkładzie funkcji o wariacji ograniczonej na różnicę dwóch funkcji rosnących, można wprowadzenie pojęcia całki Riemanna-Stieltjesa nieco uprościć rozpoczynając od wprowadzenia tej całki względem funkcji rosnącej [1,8]. W prezentacji pojęcia całki Riemanna-Stieltjesa opisywanej w tym rozdziale wybraliśmy właśnie tą drugą drogę tzn. zaczniemy od wprowadzenia pojęcia tej całki względem funkcji rosnącej. Załóżmy zatem, że zadana jest funkcja α : [a, b] → R, która jest rosnąca na przedziale [a, b]. Niech f : [a, b] → R będzie funkcją ograniczoną. Dla zadanego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) rozważmy liczby mj = inf{f (x) : tj−1 ¬ x ¬ tj } , Mj = sup{f (x) : tj−1 ¬ x ¬ tj } dla j = 1, 2, ..., m. Liczbę rzeczywistą określoną równością Lα (f, P ; [a, b]) = m X mj (α(tj ) − α(tj−1 )) (6.1) j=1 będziemy nazywać dolną sumą Riemanna-Stieltjesa (dolna RS-suma) funkcji f względem podziału P i funkcji α, podczas gdy liczbę Uα (f, P ; [a, b]) = m X Mj (α(tj ) − α(tj−1 )) (6.2) j=1 będziemy nazywać górną sumą Riemanna-Stieltjesa (górna RS-suma) funkcji f względem podziału P i funkcji α. Niżej podane twierdzenie zawiera własność monotoniczności zdefiniowanych sum względem podziałów. 94 Twierdzenie 6.1. Dla P, Q ∈ P([a, b]) takich, że P ⊂ Q, mają miejsce nierówności: Lα (f, P ; [a, b]) ¬ Lα (f, Q; [a, b]) ¬ Uα (f, Q; [a, b]) ¬ Uα (f, P ; [a, b]) . (6.3) Dowód. Niech dany będzie podział P = {t0 , t1 , ..., tn } ∈ P([a, b]) i niech Q = {t0 , ..., ti−1 , t∗ , ti , ..., tm } będzie podziałem zawierającym podział P i jeden dodatkowy punkt t∗ ∈ (ti−1 , ti ). Wtedy mamy Lα (f, Q; [a, b]) = i−1 X mj (α(tj ) − α(tj−1 )) + m∗i−1 (α(t∗ ) − α(ti−1 )) j=1 + m∗i (α(ti ) − α(t∗ )) + m X mj (α(tj ) − α(tj−1 )) , j=i+1 gdzie m∗i−1 = inf{f (x) : ti−1 ¬ x ¬ t∗ } , m∗i = inf{f (x) : t∗ ¬ x ¬ ti } . Oczywiście m∗i−1 mi oraz m∗i mi . Stąd otrzymujemy, że Lα (f, P ; [a, b]) ¬ Lα (f, P ∪ {t∗ }; [a, b]) . Stosując zasadę indukcji ze względu na liczbę dołączanych punktów, dowodzimy pierwszej nierówności w (6.3). Trzecią nierówność dowodzi się podobnie, podczas gdy druga nierówność jest trywialna. Definicja 6.2. Mówimy, że funkcja f ∈ B([a, b]) jest całkowalna w sensie RiemannaStieltjesa (lub RS-całkowalna) względem funkcji rosnącej α na przedziale [a, b], jeżeli dla każdego ε > 0 istnieje podział P ∈ P([a, b]) taki, że Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) ¬ ε . (6.4) Zbiór wszystkich funkcji RS-całkowalnych względem funkcji rosnącej α na przedziale [a, b] oznaczać będziemy przez RSα ([a, b]). Zauważmy, że (zgodnie z definicją) f ∈ RSα ([a, b]) wtedy i tylko wtedy, gdy zachodzi równość inf{Uα (f, P ; [a, b]) : P ∈ P([a, b])} = sup{Lα (f, P ; [a, b]) : P ∈ P([a, b])} . 95 (6.5) Wspólną wartość w (6.5) będziemy oznaczać symbolem Zb f (x)dα(x) = Zb f dα a a i będziemy nazywać całką Riemanna-Stieltjesa (lub RS-całką) funkcji f względem funkcji α na przedziale [a, b]. Oczywiście w przypadku α(x) = x, Definicja 6.2 pokrywa się z definicją całki Riemanna. W tym przypadku będziemy pisać, że f ∈ RS([a, b]) (lub, że f ∈ R([a, b])). W następnym twierdzeniu zebrane zostały pewne użyteczne własności RS-całki. Twierdzenie 6.3. Niech α, β : [a, b] → R będą funkcjami rosnącymi na [a, b], λ ∈ R i niech f, g ∈ RSα ([a, b]). Wtedy mają miejsce następujące własności: (a) Całka Riemanna-Stieltjesa jest addytywna ze względu na funkcje całkowane, tzn. f + g ∈ RSα ([a, b]) oraz Zb (f + g)dα = a Zb f dα + a Zb gdα . a (b) RS-całka jest addytywna ze względu na funkcje, względem których całkujemy, tzn. jeżeli f ∈ RSα ([a, b]) ∩ RSβ ([a, b]) to f ∈ RSα+β ([a, b]) i zachodzi równość Zb f d(α + β) = a Zb f dα + a Zb f dβ . a (c) RS-całka jest jednorodna ze względu na całkowane funkcje, tzn. Zb (λf )dα = λ a Zb f dα a dla λ ∈ R. (d) RS-całka jest jednorodna ze względu na funkcję względem której całkujemy, tzn. Zb f d(λα) = λ a Zb a dla λ > 0. 96 f dα (e) RS-całka jest monotoniczna ze względu na funkcje całkowane tzn. jeżeli f (x) ¬ g(x) na [a, b], to Zb f dα ¬ a Zb gdα . a W szczególności, mają miejsce nierówności m(f )(α(b) − α(a)) ¬ Zb f dα ¬ M (f )(α(b) − α(a)) , (6.6) a gdzie m(f ) = inf{f (x) : a ¬ x ¬ b}, M (f ) = sup{f (x) : a ¬ x ¬ b}. Dowód. Celem odciążenia oznaczeń będziemy w (6.1) i (6.2) opuszczać przedział [a, b]. (a) Zauważmy, że dla P ∈ P([a, b]) mamy Lα (f, P ) + Lα (g, P ) ¬ Lα (f + g, P ) ¬ Uα (f + g, P ) ¬ Uα (f, P ) + Uα (g, P ) . (6.7) Z faktu, że f, g ∈ RSα ([a, b]) wynika, że dla każdego ε > 0 możemy znaleźć podziały Pf , Pg ∈ P([a, b]) takie, że Uα (f, Pf ) − Lα (f, Pf ) ¬ ε , Uα (g, Pg ) − Lα (g, Pg ) ¬ ε . Dodając powyższe nierówności stronami, otrzymujemy Uα (f, Pf ) + Uα (g, Pg ) − Lα (f, Pf ) − Lα (g, Pg ) ¬ 2ε . Teraz, biorąc pod uwagę (6.7) i Twierdzenie 6.1, dostajemy Lα (f, Pf ) + Lα (g, Pg ) ¬ Lα (f + g, Pf ∪ Pg ) ¬ Uα (f + g, Pf ∪ Pg ) ¬ Uα (f, Pf ) + Uα (g, Pg ) . Stąd, oznaczając P = Pf ∪ Pg , wnioskujemy, że Uα (f + g, P ) − Lα (f + g, P ) ¬ 2ε , a to pokazuje, że f + g ∈ RSα ([a, b]). Dla tego samego podziału P , mamy dalej Uα (f, P ) ¬ Zb f dα + ε , Uα (g, P ) ¬ a Zb a 97 gdα + ε . Stąd i z (6.7) otrzymujemy Zb (f + g)dα ¬ Uα (f + g, P ) ¬ Zb f dα + gdα + 2ε , a a a Zb skąd, wobec dowolności liczby ε, mamy Zb (f + g)dα ¬ Zb f dα + gdα . a a a Zb Zastępując f przez −f oraz g przez −g otrzymujemy nierówność odwrotną, co dowodzi (a). Stwierdzenie (b) dowodzimy podobnie, bazując na nierównościach Lα (f, P ) + Lβ (f, P ) ¬ Lα+β (f, P ) ¬ Uα+β (f, P ) ¬ Uα (f, P ) + Uβ (f, P ) , dla każdego P ∈ P([a, b]). Dowód własności (c) wynika z równości Lα (λf, P ) = λLα (f, P ) , Uα (λf, P ) = λUα (f, P ) , podczas gdy stwierdzenie (d) jest konsekwencją równości Lλα (f, P ) = λLα (f, P ) , Uλα (f, P ) = λUα (f, P ) , które mają miejsce dla λ > 0. Dla dowodu (e) wystarczy zauważyć, że nierówność f (x) ¬ g(x) w oczywisty sposób implikuje zarówno nierówność Lα (f, P ) ¬ Lα (g, P ) jak i nierówność Uα (f, P ) ¬ Uα (g, P ). Oczywiście, druga nierówność w (e) jest konsekwencją pierwszej nierówności z tego stwier dzenia. Podamy teraz naturalne rozszerzenie Definicji 6.2 dla funkcji o wariacji ograniczonej. Twierdzenie 6.3(b) sugeruje, w jaki sposób to rozszerzenie należy zrobić. Mianowicie, jeżeli α ∈ BV ([a, b]), to bierzemy dowolny rozkład Jordana α = β − γ na różnicę dwóch funkcji rosnących β, γ : [a, b] → R (np. mogą to być funkcje opisane w dowodzie klasycznego twierdzenia Jordana, tzn. Twierdzenia 2.6). Wtedy, całkę Riemanna-Stieltjesa funkcji f ∈ RSβ ([a, b]) ∩ RSγ ([a, b]) definiujemy w następujący sposób Zb a f dα = Zb f dβ − a Zb a 98 f dγ . (6.8) Z Twierdzenia 6.3(b) wynka, że powyższa definicja nie zależy od wyboru funkcji β i γ. Podamy teraz inną, równoważną definicję pojęcia całki Riemanna-Stieltjesa w której, podobnie jak to ma miejsce dla klasycznej całki Riemanna, używać będziemy tzw. punktów pośrednich. Definicja 6.4. Niech α : [a, b] → R będzie funkcją rosnącą na przedziale [a, b] i niech f ∈ B([a, b]). Dla zadanego dowolnie podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) wybierzmy dowolnie zbiór Π = {τ1 , τ2 , ..., τm } złożony z punktów takich, że a = t0 ¬ τ1 ¬ t1 ¬ · · · ¬ tm−1 ¬ τm ¬ tm = b . Wtedy sumę Sα (f, P, Π; [a, b]) = m X f (τj )(α(tj ) − α(tj−1 )) (6.9) (6.10) j=1 będziemy nazywać sumą Riemanna-Stieltjesa (lub RS-sumą). W dalszym ciągu oznaczenie A = lim Sα (f, P, Π; [a, b]) , µ(P )→0 (6.11) gdzie µ(P ) oznacza rozmiar podziału P , będziemy rozumieć w następujący sposób: dla dowolnego ε > 0 istnieje δ > 0 takie, że |Sα (f, P.Π; [a, b]) − A| ¬ ε (6.12) dla każdego podziału P takiego, że µ(P ) ¬ δ i dla każdego zbioru punktów pośrednich spełniających nierówności (6.9). Twierdzenie 6.5. Jeżeli istnieje granica (6.11), to f ∈ RSα ([a, b]) oraz lim Sα (f, P, Π; [a, b]) = µ(P )→0 Zb f (x)dα(x) . a Dowód. Ustalmy dowolnie liczbę ε > 0. Wtedy, z (6.11), znajdziemy δ > 0 takie, że A − ε ¬ Sα (f, P, Π; [a, b]) ¬ A + ε (6.13) dla każdego podziału P takiego, że µ(P ) ¬ δ. Jeżeli punkty pośrednie τj zmieniają się w przedziałach [tj−1 , tj ] (j = 1, 2, ..., m), to biorąc odpowiednio kres dolny i górny z wielkości Sα (f, P, Π; [a, b]), na podstawie (6.13) dostaniemy 99 A − ε ¬ Lα (f, P ; [a, b]) ¬ Uα (f, P ; [a, b]) ¬ A + ε . Zgodnie z Definicją 6.2 oznacza to, że f ∈ RSα ([a, b]) oraz Zb f (x)dα(x) = A , a ponieważ liczba A występująca w (6.11) jest określona jednoznacznie. Zauważmy, że implikacja odwrotna do stwierdzenia zawartego w Twierdzeniu 6.5 jest również prawdziwa: dla każdej funkcji f ∈ RSα ([a, b]) granica (6.11) istnieje i jest równa RS-całce z funkcji f względem funkcji α. Rzeczywiście, stwierdzenie to jest prostą konsekwencją nierówności Lα (f, P ; [a, b]) ¬ Sα (f, P, Π; [a, b]) ¬ Uα (R, P ; [a, b]) , które zachodzą dla każdej funkcji rosnącej α i dla wszystkich zbiorów punktów pośrednich Π, dla których ma miejsce (6.9). Teraz, sformułujemy pewne użyteczne kryteria gwarantujące istnienie całki RiemannaStieltjesa. Niżej podane kryterium będzie konsekwencją Twierdzenia 6.5. Wniosek 6.6. Niech α : [a, b] → R będzie funkcją rosnącą na [a, b]. Funkcja f ∈ RSα ([a, b]) wtedy i tylko wtedy, gdy dla każdego ε > 0 istnieje δ > 0 takie, że dla dowolnych podziałów P1 , P2 ∈ P([a, b]) takich, że µ(Pi ) ¬ δ (i = 1, 2), mamy |Sα (f, P1 , Π1 ; [a, b]) − Sα (f, P2 , Π2 ; [a, b])| ¬ ε , (6.13) gdzie Π1 i Π2 są dowolnymi zbiorami punktów pośrednich w podziałach P1 i P2 , odpowiednio. Dowód. Zawarte w powyższym wniosku stwierdzenie jest bezpośrednią konsekwencją kryterium Cauchy’ego dotyczącego istnienia granicy (6.11). Z Wniosku 6.6 możemy także wyprowadzić inną, użyteczną własność całki RiemannaStieltjesa. 100 Twierdzenie 6.7. Jeżeli f ∈ RSα ([a, b]) to f ∈ RSα ([a, c]) oraz f ∈ RSα ([c, b]) dla każdego c ∈ (a, b). Ponadto, ma miejsce równość Zb f (x)dα(x) = a Zc f (x)dα(x) + a Zb f (x)dα(x) . (6.14) c Dowód. Dla zadanego ε > 0, na podstawie Wniosku 6.6, możemy znaleźć liczbę δ > 0 taką, że nierówność (6.13) zachodzi dla dowolnych podziałów P1 , P2 ∈ P([a, b]) takich, że µ(Pi ) ¬ δ (i = 1, 2) i dla dowolnych zbiorów punktów pośrednich Π1 , Π2 dla podziałów P1 , P2 , odpowiednio. Weźmy podziały P10 , P20 ∈ P([a, c]) takie, że µ(P10 ) ¬ δ i µ(P20 ) ¬ δ oraz odpowiednie zbiory Π01 i Π02 punktów pośrednich. Ponadto, wybierzmy dowolny podział P 00 ∈ P([c, b]) taki, że µ(P 00 ) ¬ δ i odpowiedni zbiór Π00 punktów pośrednich. Wtedy podział Pi = Pi0 ∪ P 00 ∈ P([a, b]) (i = 1, 2) jest taki, że µ(Pi ) ¬ δ (i = 1, 2) i po zastosowaniu powyżej wspomnianego warunku, otrzymamy |Sα (f, P10 , Π01 ; [a, c]) − Sα (f, P20 , Π02 ; [a, c])| ¬ |Sα (f, P1 , Π1 ; [a, b]) − Sα (f, P2 , Π2 ; [a, b])| ¬ ε , gdzie Πi = Π0i ∪ Π00 (i = 1, 2). Stąd wnosimy, że f ∈ RSα ([a, c]). Stwierdzenia, że f ∈ RSα ([c, b]) dowodzi się analogicznie przez rozważenie podziałów P 0 ∈ P([a, c]) i P100 , P200 ∈ P([c, b]). Pozostaje udowodnić tylko równość (6.14). Jednakże, każda para podziałów P 0 ∈ P([a, c]) i P 00 ∈ P([c, b]) prowadzi do podziału P = P 0 ∪ P 00 ∈ P([a, b]) takiego, że µ(P ) = max{µ(P1 ), µ(P2 )}. Dla odpowiednich sum Riemanna-Stieltjesa (związanych ze zbiorami Π0 , Π00 i Π = Π0 ∪ Π00 ) i dla całek Riemanna-Stieltjesa, mamy wtedy Sα (f, P, Π; [a, b]) = Sα (f, P 0 , Π0 ; [a, c]) + Sα (f, P 00 , Π00 ; [c, b]) . Stąd, przechodząc do granicy przy µ(P ) → 0, dostajemy Zb a f (x)dα(x) = Zc f (x)dα(x) + a Zb f (x)dα(x) , c co kończy dowód. 101 Okazuje się, że Twierdzenia 6.7 nie można odwrócić w tym sensie, że jeżeli f ∈ RSα ([a, c]) i f ∈ RSα ([c, b]) to stąd nie musi wynikać, że f ∈ RSα ([a, b]) dla a < c < b. Rozpatrzmy bowiem następujący przykład. Przykład 6.8. Niech f, α [−1, 1] → R będą funkcjami określonymi w następujący sposób: f (x) = α(x) = 0 dla x ∈ [−1, 0] 1 dla x ∈ (0, 1] , 1 dla x ∈ [−1, 0] 0 dla x ∈ (0, 1] . Oczywiście f ∈ B([−1, 1]) i α ∈ BV ([−1, 1]). Łatwo pokazać, że f ∈ RSα ([−1, 0]) ∩ RSα ([0, 1]) oraz Z0 −1 f (x)dα(x) = Z1 f (x)dα(x) = 0 . 0 Zauważmy dalej, że funkcje f i α mają nieciągłość w tym samym punkcie x = 0. Pokażemy później, że to implikuje, że f 6∈ RSα ([−1, 1]). Podamy teraz ważne kryterium na istnienie całki Riemanna-Stieltjesa. Twierdzenie 6.9. Niech f ∈ B([a, b]) i niech α : [a, b] → R będzie funkcją rosnącą na [a, b]. Wówczas f ∈ RSα ([a, b]) wtedy i tylko wtedy, gdy dla każdego ε > 0 istnieje δ > 0 takie, że nierówność (6.4) zachodzi dla dowolnego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ. Dowód. Załóżmy najpierw, że f ∈ RSα ([a, b]). Ustalmy ε > 0 i dobierzmy δ > 0 tak, że ma miejsce stwierdzenie z Wniosku 6.6 dla tak dobranego δ. Ustalmy podział P = {t0 , t1 , ..., tm } ∈ P([a, b]) taki, że µ(P ) ¬ δ, jak również dwa zbiory punktów pośrednich 1 2 Π1 = {τ11 , τ21 , ..., τm } i Π2 = {τ12 , τ22 , ..., τm } odpowiadające podziałom P1 = P2 = P . Wtedy, stosując Wniosek 6.6, otrzymujemy m m X X 1 2 f (τj )(α(tj ) − α(tj−1 )) − f (τj )(α(tj ) − α(tj−1 )) j=1 j=1 = |Sα (f, P, Π1 ; [a, b]) − Sα (f, P, Π2 ; [a, b])| ¬ 102 ε . 2 (6.15) Następnie, do każdego i ∈ {1, 2, ..., m} dobieramy punkty τi1 , τi2 ∈ [ti−1 , ti ] w taki sposób, żeby |f (τi2 ) − f (τi1 )| = f (τi2 ) − f (τi1 ) Mi − mi − ε , 2m(α(b) − α(a)) gdzie mi , Mi oznaczają odpowiednio kres górny i kres dolny funkcji f na przedziale [ti−1 , ti ] (i = 1, 2, ..., m). Oczywiście bez straty ogólności możemy tutaj założyć, że α(a) < α(b). Wtedy, z (6.15) dostajemy Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) = m X (Mi − mi )(α(ti ) − α(ti−1 )) i=1 ¬ m X ! f (τi2 ) − f (τi1 ) i=1 = m X (f (τi2 ) − ε (α(ti ) − α(ti−1 )) + 2m(α(b) − α(a)) f (τi1 ))(α(ti ) i=1 m εX α(ti ) − α(ti−1 ) − α(ti−1 )) + ¬ε 2 i=1 m(α(b) − α(a)) W ten sposób sprawdziliśmy, że nierówność (6.4) zachodzi dla każdej funkcji f ∈ RSα ([a, b]). Implikacja odwrotna jest oczywista. Podane niżej twierdzenie opisuje dwie ważne klasy funkcji całkowalnych w sensie Riemanna-Stieltjesa. Twierdzenie 6.10. (a) Jeżeli α ∈ BV ([a, b]) to każda funkcja ciągła f : [a, b] → R jest RS-całkowalna względem funkcji α. (b) Jeżeli α ∈ BV ([a, b])∩C([a, b]), to każda funkcja f : [a, b] → R o wariacji ograniczonej na przedziale [a, b] jest RS-całkowalna względem funkcji α i ma miejsce równość z Twierdzenia 6.5. Dowód. Biorąc pod uwagę wyżej poczynione obserwacje możemy bez straty ogólności założyć, że α jest rosnąca i nie jest stała. (a) Funkcja f , jako funkcja ciągła na [a, b], jest jednostajnie ciągła na przedziale [a, b]. Zatem, dla zadanego ε > 0 możemy znaleźć δ > 0 takie, że |x − y| ¬ δ implikuje, że |f (x) − f (y)| ¬ ε dla x, y ∈ [a, b]. 103 Niech P = {t, t1 , ..., tm } ∈ P([a, b]) będzie podziałem takim, że µ(P ) ¬ δ i niech mj , Mj będą zdefiniowane tak, jak wcześniej. Wtedy mamy: m X Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) = (Mj − mj )(α(tj ) − α(tj−1 )) j=1 ¬ε m X (α(tj ) − α(tj−1 )) = ε(α(b) − α(a)) , j=1 co pokazuje, że f ∈ RSα ([a, b]) (b) Dla każdego m ∈ N rozważmy podział Pm = {t0 , t1 , ..., tm } taki, że α(tj ) − α(tj−1 ) = α(b) − α(a) (j = 1, 2, ..., m) m co jest możliwe ze względu na ciągłość funkcji α. Załóżmy, że f jest rosnąca. Wtedy, stąd że Mj = f (tj ), mj = f (tj−1 ) otrzymujemy Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) = m α(b) − α(a) X (f (tj ) − f (tj−1 )) m j=1 α(b) − α(a) [f (b) − f (a)] ¬ ε (6.16) m o ile wybierzemy m dostatecznie duże. To pokazuje, że f ∈ RSα ([a, b]). Teraz, stąd że = Lα (f, P ; [a, b]) ¬ Sα (f, P, Π; [a, b]) ¬ Uα (f, P ; [a, b]) dla każdego podziału P ∈ P([a, b]), to szacowanie (6.16) pokazuje, że równość z Twierdzenia 6.5 jest także prawdziwa. Dla dowolnej funkcji α użyjemy znowu argumentacji związanej z rozkładem Jordana. Pokażemy teraz, że nieciągłość funkcji α w pewnym punkcie może być zrekompensowana poprzez ciągłość w tym punkcie funkcji f . Dla większej wygody prowadzenia dalszych rozważań wprowadzimy teraz pewne pojęcie pomocnicze. Definicja 6.11. Niech M ⊂ R, c ∈ M i niech f będzie funkcją określoną na pewnym otoczeniu liczby c. Wtedy granicę osc(f ; c) = lim+ osc(f ; [c − δ, c + δ]) , δ→0 104 (6.17) gdzie osc(f ; A) = sup f (t) − inf f (t), nazywa się lokalną oscylacją funkcji f w punkcie c. t∈A t∈A Zauważmy, że dla podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]), nierówność (6.4) może być zapisana w postaci m X osc(f ; [tj−1 , tj ])(α(tj ) − α(tj−1 )) ¬ ε . (6.18) j=1 Twierdzenie 6.12. Załóżmy, że f ∈ RSα ([a, b]) dla pewnej funkcji α ∈ BV ([a, b]). Jeżeli α jest nieciągła w pewnym punkcie c ∈ (a, b), to wtedy f jest ciągła w punkcie c. Dowód. Przypuśćmy, że zarówno α jak i f są nieciągłe w punkcie c. Oznacza to w szczególności, że osc(f ; c) > 0, gdzie symbol osc(f ; c) jest zdefiniowany w (6.17). Dla funkcji α, możemy rozróżnić kilka rodzajów nieciągłości. Załóżmy najpierw, że α ma nieciągłość pierwszego rodzaju (skok) w punkcie c, co oznacza, że α(c−) 6= α(c+). Wtedy możemy znaleźć η > 0 takie, że dla każdego δ > 0 istnieją punkty σ ∈ [a, c) i τ ∈ (c, b] takie, że 0 < τ − σ < δ i |α(τ ) − α(σ)| η. Teraz, ustalmy podział P = {t0 , t1 , ..., tm } ∈ P([a, b]) o tej własności, że µ(P ) < δ oraz ti−1 = σ i ti = τ dla pewnego i ∈ {1, 2, ..., m}. Dalej, wybieramy zbiory K = {ξ1 , ξ2 , ..., ξm } i H = {η1 , η2 , ..., ηm } złożone z punktów przedziału [a, b] takich, że ξj = ηj ∈ [tj−1 , tj ] dla j 6= i oraz ξi , ηi ∈ [ti−1 , ti ] = [σ, τ ]. Dodatkowo możemy żądać, żeby 1 |f (ξi ) − f (ηi )| osc(f ; c) . 2 Wtedy z konstrukcji mamy |Sα (f, P, K; [a, b]) − Sα (f, P, H; [a, b])| = (α(τ ) − α(σ))|f (ξi ) − f (ηi )| η osc(f ; c) > 0 2 dla odpowiednich sum Riemanna-Stieltjesa. Ponieważ δ > 0 było wybrane dowolnie, to z Wniosku 6.6 otrzymujemy, że f 6∈ RSα ([a, b]), co jest sprzeczne z przyjętym założeniem. Załóżmy teraz, że α ma nieciągłość usuwalną w punkcie c, co oznacza, że α(c−) = α(c+) 6= α(c). Wtedy możemy powtórzyć powyższe rozumowanie biorąc σ = c lub τ = c. Następnie otrzymamy taką samą sprzeczność jak poprzednio i to zakończy nasz dowód. 105 Zauważmy dalej, że wyżej przeprowadzone rozumowanie jest symetryczne względem α i f . Stąd otrzymujemy następującą wersję poprzedniego twierdzenia. Twierdzenie 6.13. Niech f ∈ RSα ([a, b]) dla pewnego α ∈ BV ([a, b]). Wtedy, w każdym punkcie przedziału [a, b] przynajmniej jedna z funkcji α i f jest ciągła. Zauważmy teraz, że z Twierdzenia 6.3(a) i (c) oraz z równości (6.8) wynika, że zbiór RSα ([a, b]) jest przestrzenią liniową. W dalszym ciągu pokażemy, że RSα ([a, b]) jest także algebrą oraz wskażemy na inne, użyteczne własności. Twierdzenie 6.14. Niech α ∈ BV ([a, b]). Wtedy prawdziwe są następujące stwierdzenia. (a) Jeżeli f ∈ RSα ([a, b]) oraz f ([a, b]) ⊂ [c, d] i h ∈ C([c, d]), to h ◦ f ∈ RSα ([a, b]). (b) Jeżeli f, g ∈ RSα ([a, b]), to f g ∈ RSα ([a, b]). (c) Jeżeli f ∈ RSα ([a, b]), to |f | ∈ RSα ([a, b]). Dowód. (a) Niech zadana będzie liczba ε > 0. Ponieważ h jest jednostajnie ciągła na [c, d], więc istnieje δ > 0, δ < ε, takie, że |h(u) − h(v)| ¬ ε dla wszystkich u, v ∈ [c, d] takich, że |u − v| ¬ δ. Na podstwie założenia możemy znaleźć podział P = {t0 , t1 , ..., tm } ∈ P([a, b]) taki, że Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) ¬ δ 2 . (6.19) Korzystając z wcześniej wprowadzonych oznaczeń na mj oraz Mj i oznaczając przez kj i Kj analogiczne liczby dla h ◦ f , tzn. kj = inf{h(f (x)) : tj−1 ¬ x ¬ tj } , Kj = sup{h(f (x)) : tj−1 ¬ x ¬ tj } , możemy podzielić zbiór liczb {1, 2, 3, ..., m} na dwie rozłączne części I oraz J wliczając j do zbioru I wtedy, jeśli Mj − mj ¬ δ i wliczając j do J, jeżeli Mj − mj > δ. Jeżeli j ∈ I, to wtedy z doboru δ wynika, że Kj − kj ¬ ε a więc dostaniemy X (Kj − kj )(α(tj ) − α(tj−1 )) ¬ ε j∈I X (α(tj ) − α(tj−1 )) ¬ εVar(α; [a, b]) . j∈I Z drugiej strony, dla j ∈ J mamy, że Kj − kj ¬ 2||h||C . Stąd i z (6.19) dostajemy δ X j∈J (α(tj ) − α(tj−1 )) < X (Mj − mj )(α(tj ) − α(tj−1 )) j∈J 106 (6.20) ¬ Uα (f, P ; [a, b]) − Lα (f, P ; [a, b]) ¬ δ 2 . Stąd X (Kj − kj )(α(tj ) − α(tj−1 )) ¬ 2||h||C j∈J X (α(tj ) − α(tj−1 )) j∈J ¬ 2||h||c δ ¬ 2||h||C ε . (6.21) Teraz, z (6.20) i (6.21) wnioskujemy, że Uα (h ◦ f, P ; [a, b]) − Lα (h ◦ f, P ; [a, b]) ¬ [Var(α; [a, b]) + 2||h||C ] ε , co oznacza, że h ◦ f ∈ RSα ([a, b]). (b) Zauważmy, że 1 f g = [(f + g)2 − (f − g)2 ] . 4 2 Jeżeli teraz wybierzemy h(u) = u i skorzystamy z Twierdzenia 6.3(a) i (c), dostaniemy tezę naszego stwierdzenia. (c) Stwierdzenie to wynika z (a), jeżeli weźmiemy h(u) = |u|. Następnie twierdzenie omawia sytuację, gdy całka Riemanna-Stieltjesa może być zredukowana do całki Riemanna. Twierdzenie 6.15. Niech α ∈ C 1 ([a, b]) i niech f ∈ RS([a, b]). Wtedy f ∈ RSα ([a, b]) i ma miejsce równość: Zb f (x)dα(t) = a Zb f (t)α0 (t)dt , (6.22) a gdzie całkę po prawej stronie rozumiemy jak zwykłą całkę Riemanna. Dowód. Zauważmy najpierw, że f α0 ∈ RS([a, b]), co jest bezpośrednią konsekwencją własności całki Riemanna. Weźmy dalej dowolne ε > 0. Wtedy znajdziemy δ1 > 0 takie, że m X f (τj )α0 (τj )(tj j=1 − tj−1 ) − Zb a 0 f (x)α (x)dx ¬ε (6.23) dla każdego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ1 i dla każdego naboru punktów pośrednich τj ∈ [tj−1 , tj ]. Podobnie, możemy znaleźć liczbę δ2 > 0 taką, że X m 0 α (τj )(tj j=1 − tj−1 ) − Zb a 107 0 α (x)dx ¬ε dla każdego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ2 i dla każdego naboru punktów pośrednich τj ∈ [tj−1 , tj ]. Jeżeli σj ∈ [tj−1 , tj ] jest innym punktem pośrednim (j = 1, 2, ..., m), to wtedy mamy m X |α0 (τj ) − α0 (σj )|(tj − tj−1 ) ¬ 2ε (6.24) j=1 o ile µ(P ) ¬ δ2 , ponieważ α0 jest ciągła na [a, b]. W dalszym ciągu, ustalmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]) taki, że µ(P ) ¬ δ = min{δ1 , δ2 }. Korzystając z twierdzenia o wartości średniej, znajdziemy punkty σj ∈ [tj−1 , tj ] takie, że α(tj ) − α(tj−1 ) = α0 (σj )(tj − tj−1 ) , dla j = 1, 2, ..., m. Stąd mamy m X m X f (τj )[α(tj ) − α(tj−1 )] = j=1 f (τj )α0 (τj )(tj − tj−1 ) j=1 + m X f (τj )[α0 (σj ) − α0 (τj )](tj − tj−1 ) (6.25) j=1 Jednakże, z (6.23), (6.24) i (6.25) otrzymujemy X Zb m 0 f (τ )[α(t ) − α(t )] − f (x)α (x)dx j j j−1 j=1 ¬ (2||f ||∞ + 1)ε . a To pokazuje, że lim µ(P )→0 m X f (τj )[α(tj ) − α(tj−1 )] = lim Sα (f, P ; [a, b]) µ(P )→0 j=1 = Zb f (x)α0 (x)dx , a jeżeli skorzystamy z Twierdzenia 6.5. Koniec dowodu. Udowodnimy teraz twierdzenie uogólniające wyniki zawarte w Twierdzeniu 6.9. Twierdzenie 6.16. Niech f ∈ B([a, b]) oraz α ∈ BV ([a, b]). Wtedy następujące stwierdzenia są równoważne: (a) f ∈ RSα ([a, b]). 108 (b) Dla każdego ε > 0 istnieje δ > 0 takie, że dla każdego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ zachodzi nierówność m X osc(f ; [tj−1 , tj ])|α(tj ) − α(tj−1 )| ¬ ε . (6.26) j=1 (c) Dla każdego ε > 0 istnieje δ > 0 takie, że dla każdego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ spełniona jest nierówność m X osc(f ; [tj−1 , tj ])Var(α; [tj−1 , tj ]) ¬ ε . (6.27) j=1 Dowód. Pokażemy najpierw, że z (a) wynika (b). W tym celu załóżmy, że f ∈ RSα ([a, b]). Ponieważ α ∈ BV ([a, b]), to zgodnie z twierdzeniem Jordana (Twierdzenie 2.6), możemy funkcję α przedstawić jako różnicę α = β − γ dwóch funkcji β, γ : [a, b] → R, które są rosnące na przedziale [a, b]. Daje to możliwość skorzystania z definicji całki RiemannaStieltjesa wyrażonej wzorem (6.8). Następnie, dla zadanego ε > 0, zgodnie z Twierdzeniem 6.9, możemy znaleźć δ > 0 takie, że dla dowolnego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ, mamy: m X osc(f ; [tj−1 , tj ])(β(tj ) − β(tj−1 )) ¬ ε 2 osc(f ; [tj−1 , tj ])(γ(tj ) − γ(tj−1 )) ¬ ε . 2 j=1 oraz m X j=1 Mając na uwadze powyższe oszacowania, otrzymujemy m X osc(f ; [tj−1 , tj ])|α(tj ) − α(tj−1 )| j=1 = m X osc(f ; [tj−1 , tj ])|[β(tj ) − γ(tj ) − β(tj−1 ) + γ(tj−1 )]| j=1 = m X osc(f ; [tj−1 , tj ])|[β(tj ) − β(tj−1 )] − [γ(tj ) − γ(tj−1 )]| j=1 ¬ m X osc(f ; [tj−1 , tj ])[|β(tj ) − β(tj−1 )| + |γ(tj ) − γ(tj−1 )|] j=1 = m X osc(f ; [tj−1 , tj ])(β(tj ) − β(tj−1 )) j=1 109 + m X osc(f ; [tj−1 , tj ])(γ(tj ) − γ(tj−1 )) ¬ ε . j=1 Powyższe oszacowanie pokazuje, że spełniony jest warunek (b) i tym samym kończy dowód pierwszej implikacji. Pokażemy teraz, że (b) implikuje (c). W tym celu pokażemy najpierw, że przy założeniu (b) dla każdego punktu x ∈ [a, b] przynajmniej jedna z funkcji f lub α jest ciągła w punkcie x. Zatem, dla zadanego ε > 0 znajdźmy δ > 0 zgodnie z warunkiem (b). Ustalmy punkt x0 ∈ [a, b] i załóżmy na przykład, że α jest nieciągła w x0 . Wtedy mamy lim α(x) 6= α(x0 ) x→x0 + lub lim α(x) 6= lim α(x) . x→x0 − x→x0 + Dalej, weźmy liczbę h > 0 taką, że h < min{δ, b − x0 } i rozważmy dowolny podział P = {t0 , t1 , ..., tm } ∈ P([a, b]) taki, że µ(P ) ¬ δ. Dodajmy do podziału P dwa punkty xh i x0 + h, gdzie xh = x0 lub xh = x0 − h i oznaczmy przez P 0 rozszerzony podział P ∪ {xh , x0 + h}. Oczywiście mamy, że µ(P 0 ) ¬ δ a także, na mocy (6.26), otrzymujemy |f (x0 + h) − f (x0 )||α(x0 + h) − α(xh )| ¬ ε . Stąd, przy h → 0 dostajemy, że f (x0 +h) → f (x0 ), co oznacza, że f jest prawostronnie ciągła w punkcie x0 . Podobnie możemy pokazać lewostronną ciągłość funkcji f w punkcie x0 , co pozwala nam wywnioskować, że f jest ciągła w x0 . Powtarzając powyższe rozumowanie przy założeniu, że funkcja f jest nieciągła w pewnym punkcie x0 , możemy udowodnić, że funkcja α jest ciągła w punkcie x0 . Dalej, ustalmy ε > 0. Wybierzmy δ > 0 zgodnie z warunkiem (b) do liczby ε/3. Niech M = osc(f ; [a, b]) i niech P = {z0 , z1 , ..., zk } ∈ P([a, b]) będzie podziałem takim, że Var(α; [a, b]) − k X ε ¬ |α(zj ) − α(zj−1 )| . 3M j=1 (6.28) Oczywiście, jeżeli weźmiemy dowolny podział P 0 taki, że P ⊂ P 0 , wtedy nierówność (6.28) zachodzi także dla P 0 . Tak, jak to pokazaliśmy wcześniej, warunek (b) implikuje, że w każdym punkcie przedziału [a, b], przynajmniej z funkcji α lub f jest ciągła. Wykorzystując własności funkcji wahania ustalone w Rozdziale 2 wnioskujemy stąd, że przynajmniej 110 jedna z funkcji Vα lub f , jest ciągła w każdym punkcie przedziału [a, b]. Ponieważ te funkcje są ograniczone, możemy znaleźć δ1 > 0 takie, że osc(f ; [x0 , x])Var(α; [x0 , x]) ¬ ε 3M (6.29) o ile |x − x0 | ¬ δ1 i x0 < zj < x dla j = 1, 2, ..., k. Następnie, niech P1 = {x0 , x1 , ..., xn } ∈ P([a, b]) będzie takim podziałem, że µ(P1 ) ¬ δ = min{δ1 , δ}. Oczywiście, nierówność (6.29) zachodzi dla podziału P1 . Rozszerzając podział P1 przez włączenie tych punktów zj , które są różne od punktów podziału P1 , otrzymujemy nowy podział P20 = {x00 , x01 , ..., x0p } taki, że Var(α; [a, b]) − p X ε ¬ |α(x0j ) − α(x0j−1 )| . 3M j=1 Stąd otrzymujemy p X [Var(α; [x0j−1 , xj ]) − |α(x0j ) − α(xj−1 )|] ¬ j=1 Stąd wynika, że S0 = p X ε . 3M osc(f ; [x0j−1 , x0j ])Var(α; [x0j−1 , xj ]) j=1 ¬ p X osc(f ; [x0j−1 , x0j ]){Var(α; [x0j−1 , x0j ]) − |α(x0j ) − α(x0j−1 )|} j=1 + p X 2 osc(f ; [x0j−1 , x0j ])|α(x0j ) − α(x0j−1 )| ¬ ε . 3 j=1 W końcu zauważmy, że możemy napisać S= n X osc(f ; [xj−1 , xj ])Var(α; [xj−1 , xj ]) = S 0 + S 00 , j=1 gdzie S 00 oznacza sumę tych wszystkich składników, dla których istnieje k takie, że xj−1 < zk < xj , natomiast S 0 oznacza pozostałą część sumy S, będącą sumą częściową sumy S0 . Oczywiście mamy, że S 0 ¬ S0 ¬ 2ε/3. Dalej, z (6.29) wiemy, że S 00 ¬ ε/3, a więc S ¬ ε. Pozostało do pokazania, że (c) implikuje (a). Dla realizacji tego celu przedstawmy znowu funkcję α w postaci α = β − γ, gdzie 1 1 β(x) = [Vα (x) + α(x)] , γ(x) = [Vα (x) − α(x)] 2 2 111 (por. Twierdzenie 2.9), gdzie Vα oznacza funkcję variacji funkcji α. Oczywiście mamy Var(α; [x, y]) = Var(β; [x, y]) + Var(γ, [x, y]) (6.30) dla dowolnego przedziału [x, y] ⊂ [a, b]. Ustalmy ε > 0 i wybierzmy δ > 0 zgodnie z warunkiem (c). Wtedy, biorąc pod uwagę (6.27), dla dowolnego podziału P = {t0 , t1 , ..., tm } ∈ P([a, b]) takiego, że µ(P ) ¬ δ, otrzymujemy m X osc(f ; [tj−1 , tj ])Var(α; [tj−1 , tj ]) ¬ ε . j=1 Z (6.30), otrzymamy wtedy nierówność m X osc(f ; [tj−1 , tj ]){Var(β; [tj−1 , tj ]) + Var(γ; [tj−1 , tj ])} ¬ ε , j=1 i stąd mamy, że m X osc(f ; [tj−1 , tj ])(β(tj ) − β(tj−1 )) j=1 = m X osc(f ; [tj−1 , tj ])Var(β; [tj−1 , tj ]) ¬ ε j=1 oraz m X osc(f ; [tj−1 , tj ])(γ(tj ) − γ(tj−1 )) j=1 = m X osc(f ; [tj−1 , tj ])Var(γ; [tj−1 , tj ]) ¬ ε . j=1 Z powyższych oszacowań oraz z Twierdzenia 6.9 wnioskujemy, że zarówno f ∈ RSβ ([a, b]) jak i f ∈ RSγ ([a, b]), a zatem, zgodnie z definicją RS-całki względem funkcji o wariacji ograniczonej to implikuje, że f ∈ RSα ([a, b]). Koniec dowodu. Twierdzenie 6.16 ma bardzo użyteczne konsekwencje związane z całkowalnością w sensie Riemanna-Stieltjesa funkcji f względem funkcji α oraz względem jej funkcji wariacji Vα . Wniosek 6.17. Niech f ∈ B([a, b]) i niech α ∈ BV ([a, b]). Przy tych założeniach f ∈ RSα ([a, b]) wtedy i tylko wtedy, gdy f ∈ RSVα ([a, b]), gdzie Vα oznacza funkcję wahania funkcji α. 112 Dowód. Ponieważ funkcja Vα (x) = Var(α; [a, x]) jest rosnąca na przedziale [a, b], więc ma wariację ograniczoną na [a, b]. Załóżmy dalej, że f ∈ RSα ([a, b]). Wtedy, zgodnie z Twierdzeniem 6.16, spełnione są nierówności (6.26) i (6.27). Z drugiej strony, ze względu na równość Var(α; [tj−1 , tj ]) = Vα (tj ) − Vα (tj−1 ) , po zastosowaniu Twierdzenia 6.16(b) otrzymujemy, że f ∈ RSVα ([a, b]). Ponieważ powyższe rozumowanie jest symetryczne względem funkcji α i Vα , otrzymujemy stąd tezę twierdzenia. Podamy teraz twierdzenie o pewnej nierówności dla całki Riemanna-Stieltjesa, która ma ważne zastosowania w teorii równań całkowych. Twierdzenie 6.18. Jeżeli α ∈ BV ([a, b]) i f ∈ RSα ([a, b]), to ma miejsce nierówność b Z f (x)dα(x) ¬ a Zb |f (x)|dVα (x) . (6.31) a Dowód. Z Wniosku 6.17 dedukujemy, że f ∈ RSVα ([a, b]), a więc całka występująca po prawej stronie (6.31) jest poprawnie zdefiniowana. Dalej, weźmy dowolny podział {t0 , t1 , ..., tm } ∈ P([a, b]) i wybierzmy zbiór punktów pośrednich Π = {τ1 , τ2 , ..., τm } dla tego podziału. Wtedy mamy X m f (τ )(α(t ) − α(t )) j j j−1 j=1 ¬ m X j=1 |f (τj )|Var(α; tj−1 , tj ) = ¬ m X |f (τj )||α(tj ) − α(tj−1 )| j=1 m X |f (τj )|(Vα (tj ) − Vα (tj−1 )) , j=1 gdzie wykorzystaliśmy wcześniej podane własności wariacji funkcji. Ponieważ powyższa nierówność jest spełniona dla dowolnego podziału P ∈ P([a, b]) i dla dowolnego zbioru punktów pośrednich Π, więc wykorzystując Twierdzenie 6.5, ciągłość funkcji u → |u| i Twierdzenie 6.14(c), wnioskujemy o prawdziwość nierówności (6.31). W następnym twierdzeniu zebrane są pewne stwierdzenia będące w zasadzie wnioskami z Twierdzenia 6.18. Twierdzenie 6.19. Całka Riemanna-Stieltjesa ma następujące własności: 113 (a) Dla α ∈ BV ([a, b]) oraz f ∈ RSα ([a, b]) spełniona jest nierówność b Z f (x)dα(x) ¬ ||f ||∞ Var(α; [a, b]) . a (b) Jeżeli fn ∈ RSα ([a, b]) dla n = 1, 2, ... oraz f ∈ RSα ([a, b]) a ponadto jeżeli ||fn − f ||∞ → 0 przy n → ∞, wtedy lim Zb n→∞ fn (x)dα(x) = Zb f (x)dα(x) a a dla α ∈ BV ([a, b]). (c) Jeżeli (αn ) jest ciągiem złożonym z funkcji αn : [a, b] → R o wariacji ograniczonej oraz α ∈ BV ([a, b]) a także Var(αn − α; [a, b]) → 0 przy n → ∞, to wtedy lim Zb f (x)dαn (x) = n→∞ Zb a f (x)dα(x) a dla wszystkich funkcji f ∈ RSαn ([a, b]) i f ∈ RSα ([a, b]). Dowód. (a) Na podstawie Twierdzenia 6.18 oraz Twierdzenia 6.3(e) otrzymujemy b Z f (x)dα(x) ¬ a = ||f ||∞ Zb Zb |f (x)|dVα (x) ¬ a Zb ||f ||∞ dVα (x) a dVα (x) = ||f ||∞ Var(α; [a, b]) . a Dowodzi to punktu (a). (b) Korzystając znowu z Twierdzenia 6.18 i Twierdzenia 6.3(e), dostajemy: b Z Zb fn (x)dα(x) − f (x)dα(x) a a ¬ Zb |fn (x) − f (x)|dVα (x) a ¬ ||fn − f ||∞ Var(α; [a, b]) , co dowodzi punktu (b). 114 (c) Stosując Twierdzenie 6.18 z α zamienionym na αn − α, otrzymujemy b Z Zb f (x)dαn (x) − f (x)dα(x) = a a ¬ Zb b Z f (x)d(αn (x) − α(x)) a |f (x)|dVαn −α (x) ¬ ||f ||∞ Var(αn − α; [a, b]) . a Stąd wynika stwierdzenie z punktu (c). Zadania 1. Wyznaczyć całkę ZΠ (x − 1)dα(x) , 0 gdzie α(x) = cos x · sgnx. 2. Znaleźć przykład funkcji f ∈ B([a, b]) oraz α ∈ BV ([a, b]) takich, że f 2 ∈ RSα ([a, b]) i |f | ∈ RSα ([a, b]) ale f 6∈ RSα ([a, b]). 3. Pokazać, że Z3 xdα(x) = 0 3 , 2 gdzie α(x) = x − [x]. 4. Niech f oznacza funkcję Dirichleta określoną na przedziale [0, 1] i niech α ∈ BV ([0, 1]). Pokazać, że f ∈ RSα ([0, 1]) wtedy i tylko wtedy, gdy α jest stała. 5. Niech f, g ∈ ([a, b]) i niech α ∈ BV ([a, b]). Określmy funkcję β : [a, b] → R przyjmując β(x) = Zx f (t)dα(t) . a Pokazać, że Zb g(t)dβ(t) = Zb a a 115 f (t)g(t)dα(t) . 6. Niech α ∈ BV ([a, b]) ∩ C([a, b]) i niech f : [a, b] → R będzie funkcją rosnącą na przedziale [a, b]. Pokazać, że istnieje ξ ∈ [a, b] takie, że Zb f (x)dα(x) = f (a)(α(ξ) − α(a)) + f (b)(α(b) − α(ξ)) . a 7. Niech f ∈ C 1 ([a, b]) i niech g ∈ C([a, b]). Udowodnić, że istnieje c ∈ (a, b) takie, że Zb f (x)g(x)dx = f (a) Zc g(x)dx + f (b) g(x)dx . c a a Zb 8. Niech f, α : [a, b] → R będą ciągłe i dodatkowo, niech α będzie ściśle rosnąca na [a, b]. Określmy funkcję F : [a, b] → R przyjmując F (x) = Zx f (t)dα(t) . a Wtedy możemy zdefiniować tzw. α-pochodną funkcji F w następujący sposób dF F (x + h) − F (x) (x) = lim . h→0 α(x + h) − α(x) dα Pokazać, że dF (x) = f (x) dα dla każdego x ∈ [a, b]. 9. Niech f ∈ BV ([a, b]) ∩ C([a, b]). Udowodnić, że Zb f (x)df (x) = a f 2 (b) − f 2 (a) . 2 10. Znaleźć funkcje α ∈ BV ([a, b]) i f ∈ RSα ([a, b]) takie, że b Z f (x)dα(x) > a 116 Zb a |f (x)|dα(x) . Bibliografia 1. J. Appell, J. Banaś, N. Merentes: Bounded Variation and Around, De Gruyter Series in Nonlinear Analysis 17, Walter de Gruyter, Berlin/Boston 2014. 2. G.M. Fichtenholz: Rachunek Różniczkowy i Całkowy, Wydawnictwo Naukowe PWN, Warszawa 2007. 3. J. Jakubowski, R. Sztencel: Wstęp do Teorii Prawdopodobieństwa, Wyd. SCRiPT, Warszawa 2004. 4. M.A. Krasnosel’skii, Y.B. Rutickii: Convex Functions and Orlicz Spaces, Noordhoff, Groningen 1961. 5. M. Loeve: Probability Theory, Van Nostrand Reinhold, New York 1963. 6. S. Łojasiewicz: Wstęp do Teorii Funkcji Rzeczywistych, PWN, Warszawa 1973. 7. I.P. Natanson: Theory of Functions of a Real Variable, Ungar, New York 1960. 8. W. Rudin: Podstawy Analizy Matematycznej, PWN, Warszawa 1982. 9. R. Sikorski, Funkcje Rzeczywiste, PWN, Warszawa 1958. 117