1 Oznaczenia i uwagi 2 Funkcjonały wypukłe i subróżniczka
Transkrypt
1 Oznaczenia i uwagi 2 Funkcjonały wypukłe i subróżniczka
1 Oznaczenia i uwagi Przez cały czas X będzie oznaczać przestrzeń Banacha. • R = R ∪ {+∞, −∞} 2 Funkcjonały wypukłe i subróżniczka Definicja 2.1. Funkcjonał f : X → R nazywamy wypukłym na zbiorze K ⊆ X jeżeli dla wszystkich x, y ∈ K i 0 < λ < 1 zachodzi nierówność f (λx + (1 − λ)y) ¬ λf (x) + (1 − λ)f (y) (1) Przykład 2.1. Funkcja indykatorowa. Niech K ⊆ X będzie zbiorem wypukłym. Wówczas funkcjonał 0 gdy x ∈ K IK (x) = +∞ w p.p. jest wypukły. Definicja 2.2. Epiwykresem funkcjonału nazywamy zbiór epi(f ) = {(x, λ) ∈ X × R|f (x) ¬ λ} Stwierdzenie 2.1. Funkcjonał jest wypukły wtedy i tylko wtedy gdy jego epiwykres jest podzbiorem wypukłym x × R. Definicja 2.3. Dziedziną właściwą funkcjonału wypukłego nazwiemy zbiór D(f ) = {x ∈ X|f (x) < +∞}. Mówimy, że funkcjonał wypukły jest właściwy jeżeli jego dziedzina właściwa jest niepusta. Pomysł prowadzący do definicji subróżniczki. Jeżeli funkcja wypukła f jest różniczkowalna, to styczna jest jednocześnie prostą podpierającą, tzn. f (y) − f (x) f 0 (x)(y − x) ∀y. W związku z tym naturalnie jest przyjąć następującą definicję. Definicja 2.4. Funkcjonał liniowy x0 ∈ X 0 nazywamy subgradientem funkcjonału f : X → R w punkcie x0 ∈ D(f ) jeżeli dla wszystkich x ∈ X zachodzi nierówność f (x) − f (x0 ) hx0 , x − x0 i. (2) Zbiór subgradientów funkcjonału f w punkcie x0 nazwiemy subróżniczką f i oznaczamy ∂f (x0 ). 1 Uwaga 2.1. Możemy patrzeć na subrożniczkę jako na funkcję ∂f : X → 2X 0 Mówimy, że funkcja f jest subróżniczkowalna w punkcie x0 jeżeli zbiór ∂f (x0 ) jest niepusty. W dowodach będziemy wielokrotnie korzystali z geometrycznej wersji tw. Hahna-Banacha Twierdzenie 2.1. Niech A i B będą niepustymi, rozłącznymi zbiorami wypukłymi w przestrzeni Banacha X. (a) Jeśli A jest otwarty, to istnieją x0 ∈ X 0 i γ ∈ R takie, że hx0 , xi < γhx0 , yi dla każdego x ∈ A i y ∈ B (b) Jeśli A jest zwarty, a B domknięty, to istnieją x0 ∈ X 0 i γ1 , γ2 ∈ R takie, że hx0 , xi < γ1 < γ2 < hx0 , yi dla wszystkich x ∈ A i y ∈ B. Twierdzenie 2.2. Jeżeli funkcjonał f : X → R jest wypukły, właściwy i ciągły w x0 , to zbiór ∂f (x0 ) jest wypukły, domknięty, ograniczony i niepusty. Dowód. 1) Wypukłość Weźmy x01 , x02 ∈ ∂f (x0 ). Z definicji mamy hλx01 + (1 − λ)x02 , x − x0 h = λhx01 , x − x0 i + (1 − λ)hx02 , x − x0 i ¬ λ(f (x) − f (x0 )) + (1 − λ)(f (x) − f (x0 )) = f (x) − f (x0 ) 2) Domkniętość Załóżmy przeciwnie i weźmy x0 ∈ ∂f (x0 ) \ ∂f (x0 ). Możemy wybrać wektor y t. że f (y) − f (x0 ) < hx0 , y − x0 i Z ciągłości x0 → hx0 , y − x0 > istnieje otoczenie F funkcjonału x0 t. że nierówność jest spełniona na całym F . Jednocześnie F ∩ ∂f (x0 ) z wyboru x0 jest niepusty, więc otrzymujemy sprzeczność. 3) Ograniczoność Z ciągłości f istnieje δ > 0 taka, że kx0 − yk ¬ δ ⇒ |f (x0 ) − f (y)| ¬ 1. Dla x0 ∈ ∂f (x0 ) i kyk = 1 1 f (x0 + δy) − f (x0 ) x0 (δy) = δx0 (y) 2 Bierzemy supremum po y i otrzymujemy kx0 k ¬ 1 . δ 4) Niepustość Z ciągłości f w x0 zbiór epi(f ) ma niepuste wnętrze. Stosujemy pierwszy podpunkt twierdzenia Hahna-Banacha dla zbiorów Intepif i (x0 , f (x0 )) dostając x0 ∈ X 0 i a0 ∈ R t. że: ∀(x,a)∈epif , hx0 , xi + a0 a hx0 , x0 i + a0 f (x0 ) Jeśli a0 = 0 to hx0 , x − x0 i 0 ∀x ∈ D(f ), 0 ale x0 ∈ D(f ) więc x ≡ 0, możemy przyjąć a0 = 1. Po uporządkowaniu a − f (x0 ) h−x0 , x − x0 i W szczególności możemy położyć a = f (x0 ) i dostajemy warunek na subgradient. 3 Pochodna Gateaux Definicja 3.1. Mówimy, że funkcjonał f : X → R ma jednostronną pochodną Gâteaux w x0 jeśli istnieje f˜0 (x0 , h) ∈ R t. że lim µ→0+ f (x0 + µh) − f (x0 ) = f˜0 (x0 , h) ∀h∈X µ Jeśli f˜0 (x0 , h) = −f˜0 (x0 , −h) to funkcja jest różniczkowalna w sensie Gâteaux. Stwierdzenie 3.1. Jeżeli f : X → R jest wypukły to f jest jednostronnie Gróżniczkowalny we wszystkich punktach x t. że f (x) 6= ±∞. Dowód. Niech 0 < µ ¬ ν. f (x0 + µh) = ¬ µ (x0 + νh) + 1 − x0 ν ν µ µ f (x0 + νh) + 1 − f (x0 ), ν ν f µ skąd f (x0 + µh) − f (x0 ) f (x0 + νh) − f (x0 ) ¬ µ ν Iloraz różnicowy dla ustalonego h jest niemalejący, więc granica istnieje, co więcej f (x + µh) − f (x) f˜0 (x, h) = inf µ µi0 3 Ćwiczenie. f (x) − f (x0 ) f˜0 (x0 , x − x0 ), ∀x∈X f˜0 (x0 , x − x0 ) −f˜0 (x0 − (x − x0 )), ∀x∈X Pokażemy zależność między subróżniczkami a pochodną Gâteaux. Stwierdzenie 3.2. Niech f będzie wypukły i f (x0 ) 6= ±∞. Jeśli x0 ∈ ∂f (x0 ) to f˜0 (x0 , h) hx0 , hi, ∀h∈X (3) Dowód. Połóżmy x = x0 + λh. f (x0 + λh) − f (x0 ) λhx0 , hi |· 1 , λ λ→0 f˜0 (x0 , h) hx0 , hi Twierdzenie 3.1. Jeśli f : X → R wypukły i ciągły w otoczeniu x0 , to f˜0 (x0 , h) = max{hx0 , hi : x0 ∈ ∂f (x0 )} Dowód. Zauważmy, że punkt (x0 + λh, f (x0 ) + λf˜0 (x0 , h) nie leży we wnętrzu epif . Rzeczywiście ? f (x0 + λh) f (x0 ) + λf˜0 (x0 , h) f (x0 + λh) − f (x0 ) ? ˜0 f (x0 , h), λ a ta ostatnia nierówność jest prawdziwa. Skoro tak, to dla λ0 0 możemy rozdzielić punkt (x˜0 , ã) = (x0 + λ0 h, f (x0 ) + λ0 f˜0 (x0 , h)) i wnętrze epif , tj. bierzemy niezerowy x0 ∈ X 0 \ {0} taki, że hx0 , xi + a0 a hx0 , x˜0 i + a0 ã, ∀(x, a) ∈ epif Jeśli λ0 = 0 to z dowodu niepustości subróżniczki otrzymujemy −x0 /a0 ∈ ∂f (x0 ). Niech λ0 i0. ∀(x, a) ∈ epif hx0 , x˜0 − xi + a0 (ã − a) ¬ 0. Kładąc a = f (x0 ) i skoro a0 > 0 h−x0 /a0 , hi f˜0 (x0 , h), co w połączeniu z poprzednim stwierdzeniem daje oczekiwany rezultat. Wnioski 4 Weźmy X = R i oznaczmy 0 f+ (x) = 0 f− (x) = f˜0 (x, 1) −f˜(x, −1) Teraz z porzedniego twierdzenia 0 f− (x) ¬ x0 ¬ f 0 + (x) (4) Jednocześnie, skoro subróżniczka jest zbiorem wypukłym i domkniętym to dostajemy następującą charakteryzację 0 0 ∂f (x) = {x0 ∈ R : f− (x) ¬ x0 ¬ f+ (x)} 4 Własności rachunkowe subróżniczek Obserwacja 4.1. Dla λi0 ∂(λf )(x) = λ∂f (x) Twierdzenie 4.1. Jeśli f1 i f2 wypukłe i istnieje x0 ∈ D(f1 ) ∩ D(f2 ) w którym f1 jest ciągła to ∂f1 + ∂f2 = ∂(f1 + f2 ) Dowód. Trywialnie sprawdza się, że ∂(f1 )(x) + ∂(f2 )(x) ⊆ ∂(f1 + f2 ). Niech x0 = x01 + x02 , dla x0i ∈ ∂fi (f1 + f2 )(z) = f1 (z) + f2 (z) +hx02 , z − xi = f1 (x) + f2 (x) + hx01 , z − xi (f1 + f2 )(x) + hx0 , z − xi, ∀z∈X Niech x0 ∈ ∂(f1 + f2 )(x) ∀y∈X f1 (y) − f1 (x) − x0 (y − x) f2 (x) − f2 (y), więc zbiory E = {(y, t) ∈ X × R : f1 (y) − f1 (x) − x0 (y − x) ¬ t} F = {(y, t) ∈ X × R : f2 (x) − f2 (y) t} mogą mieć punkty wspólne jedynie na brzegach. E jest wypukły z niepustym wnętrzem (bo epi funkcji ciągłej w pewnym punkcie). F tylko wypukły. Rozdzielamy E i F . Hiperpłaszczyzna nie może być pionowa, bo inaczej rozdzielałby też D(f1 ) i D(f2 ). Dla pewnego x02 i pewnej c ∈ R mamy ∀y∈X f1 (y) − f1 (x) − hx0 , y − xi −hx02 , yi + c f2 (x) − f2 (y) Kładąc y = x ⇒ c = x02 (x) dostaniemy x0 − x02 ≡ x01 ∈ ∂f1 (x), x0 = x01 + x02 5 x02 ∈ ∂f2 (x) Twierdzenie 4.2. f : Y → (−∞, +∞] f wyp. i półciągły z dołu ∃y0 = lx0 t. że f < ∞ i ciągły. Wtedy ∂(f ◦ l)(x) = l0 ∂f (lx), 6 ∀x ∈ X