1 Oznaczenia i uwagi 2 Funkcjonały wypukłe i subróżniczka

Transkrypt

1 Oznaczenia i uwagi 2 Funkcjonały wypukłe i subróżniczka
1
Oznaczenia i uwagi
Przez cały czas X będzie oznaczać przestrzeń Banacha.
• R = R ∪ {+∞, −∞}
2
Funkcjonały wypukłe i subróżniczka
Definicja 2.1. Funkcjonał f : X → R nazywamy wypukłym na zbiorze K ⊆ X
jeżeli dla wszystkich x, y ∈ K i 0 < λ < 1 zachodzi nierówność
f (λx + (1 − λ)y) ¬ λf (x) + (1 − λ)f (y)
(1)
Przykład 2.1. Funkcja indykatorowa. Niech K ⊆ X będzie zbiorem wypukłym. Wówczas funkcjonał
0
gdy x ∈ K
IK (x) =
+∞ w p.p.
jest wypukły.
Definicja 2.2. Epiwykresem funkcjonału nazywamy zbiór
epi(f ) = {(x, λ) ∈ X × R|f (x) ¬ λ}
Stwierdzenie 2.1. Funkcjonał jest wypukły wtedy i tylko wtedy gdy jego
epiwykres jest podzbiorem wypukłym x × R.
Definicja 2.3. Dziedziną właściwą funkcjonału wypukłego nazwiemy zbiór
D(f ) = {x ∈ X|f (x) < +∞}.
Mówimy, że funkcjonał wypukły jest właściwy jeżeli jego dziedzina właściwa jest
niepusta.
Pomysł prowadzący do definicji subróżniczki. Jeżeli funkcja wypukła f jest
różniczkowalna, to styczna jest jednocześnie prostą podpierającą, tzn.
f (y) − f (x) ­ f 0 (x)(y − x) ∀y.
W związku z tym naturalnie jest przyjąć następującą definicję.
Definicja 2.4. Funkcjonał liniowy x0 ∈ X 0 nazywamy subgradientem funkcjonału f : X → R w punkcie x0 ∈ D(f ) jeżeli dla wszystkich x ∈ X zachodzi
nierówność
f (x) − f (x0 ) ­ hx0 , x − x0 i.
(2)
Zbiór subgradientów funkcjonału f w punkcie x0 nazwiemy subróżniczką f i
oznaczamy ∂f (x0 ).
1
Uwaga 2.1. Możemy patrzeć na subrożniczkę jako na funkcję
∂f : X → 2X
0
Mówimy, że funkcja f jest subróżniczkowalna w punkcie x0 jeżeli zbiór
∂f (x0 ) jest niepusty.
W dowodach będziemy wielokrotnie korzystali z geometrycznej wersji tw.
Hahna-Banacha
Twierdzenie 2.1. Niech A i B będą niepustymi, rozłącznymi zbiorami wypukłymi w przestrzeni Banacha X.
(a) Jeśli A jest otwarty, to istnieją x0 ∈ X 0 i γ ∈ R takie, że
hx0 , xi < γhx0 , yi
dla każdego x ∈ A i y ∈ B
(b) Jeśli A jest zwarty, a B domknięty, to istnieją x0 ∈ X 0 i γ1 , γ2 ∈ R takie, że
hx0 , xi < γ1 < γ2 < hx0 , yi
dla wszystkich x ∈ A i y ∈ B.
Twierdzenie 2.2. Jeżeli funkcjonał f : X → R jest wypukły, właściwy i ciągły
w x0 , to zbiór ∂f (x0 ) jest wypukły, domknięty, ograniczony i niepusty.
Dowód. 1) Wypukłość
Weźmy x01 , x02 ∈ ∂f (x0 ). Z definicji mamy
hλx01 + (1 − λ)x02 , x − x0 h = λhx01 , x − x0 i + (1 − λ)hx02 , x − x0 i
¬ λ(f (x) − f (x0 )) + (1 − λ)(f (x) − f (x0 ))
= f (x) − f (x0 )
2) Domkniętość
Załóżmy przeciwnie i weźmy x0 ∈ ∂f (x0 ) \ ∂f (x0 ). Możemy wybrać wektor
y t. że
f (y) − f (x0 ) < hx0 , y − x0 i
Z ciągłości x0 → hx0 , y − x0 > istnieje otoczenie F funkcjonału x0 t. że
nierówność jest spełniona na całym F . Jednocześnie F ∩ ∂f (x0 ) z wyboru x0
jest niepusty, więc otrzymujemy sprzeczność.
3) Ograniczoność
Z ciągłości f istnieje δ > 0 taka, że
kx0 − yk ¬ δ ⇒ |f (x0 ) − f (y)| ¬ 1.
Dla x0 ∈ ∂f (x0 ) i kyk = 1
1 ­ f (x0 + δy) − f (x0 ) ­ x0 (δy) = δx0 (y)
2
Bierzemy supremum po y i otrzymujemy
kx0 k ¬
1
.
δ
4) Niepustość
Z ciągłości f w x0 zbiór epi(f ) ma niepuste wnętrze. Stosujemy pierwszy
podpunkt twierdzenia Hahna-Banacha dla zbiorów Intepif i (x0 , f (x0 )) dostając x0 ∈ X 0 i a0 ∈ R t. że:
∀(x,a)∈epif ,
hx0 , xi + a0 a ­ hx0 , x0 i + a0 f (x0 )
Jeśli a0 = 0 to
hx0 , x − x0 i ­ 0
∀x ∈ D(f ),
0
ale x0 ∈ D(f ) więc x ≡ 0, możemy przyjąć a0 = 1. Po uporządkowaniu
a − f (x0 ) ­ h−x0 , x − x0 i
W szczególności możemy położyć a = f (x0 ) i dostajemy warunek na subgradient.
3
Pochodna Gateaux
Definicja 3.1. Mówimy, że funkcjonał f : X → R ma jednostronną pochodną
Gâteaux w x0 jeśli istnieje f˜0 (x0 , h) ∈ R t. że
lim
µ→0+
f (x0 + µh) − f (x0 )
= f˜0 (x0 , h) ∀h∈X
µ
Jeśli f˜0 (x0 , h) = −f˜0 (x0 , −h) to funkcja jest różniczkowalna w sensie Gâteaux.
Stwierdzenie 3.1. Jeżeli f : X → R jest wypukły to f jest jednostronnie Gróżniczkowalny we wszystkich punktach x t. że f (x) 6= ±∞.
Dowód. Niech 0 < µ ¬ ν.
f (x0 + µh)
=
¬
µ (x0 + νh) + 1 −
x0
ν
ν
µ
µ
f (x0 + νh) + 1 −
f (x0 ),
ν
ν
f
µ
skąd
f (x0 + µh) − f (x0 )
f (x0 + νh) − f (x0 )
¬
µ
ν
Iloraz różnicowy dla ustalonego h jest niemalejący, więc granica istnieje, co
więcej
f (x + µh) − f (x)
f˜0 (x, h) = inf
µ
µi0
3
Ćwiczenie.
f (x) − f (x0 ) ­ f˜0 (x0 , x − x0 ), ∀x∈X
f˜0 (x0 , x − x0 ) ­ −f˜0 (x0 − (x − x0 )), ∀x∈X
Pokażemy zależność między subróżniczkami a pochodną Gâteaux.
Stwierdzenie 3.2. Niech f będzie wypukły i f (x0 ) 6= ±∞. Jeśli x0 ∈ ∂f (x0 )
to
f˜0 (x0 , h) ­ hx0 , hi, ∀h∈X
(3)
Dowód. Połóżmy x = x0 + λh.
f (x0 + λh) − f (x0 ) ­
λhx0 , hi
|·
1
,
λ
λ→0
f˜0 (x0 , h) ­ hx0 , hi
Twierdzenie 3.1. Jeśli f : X → R wypukły i ciągły w otoczeniu x0 , to
f˜0 (x0 , h) = max{hx0 , hi : x0 ∈ ∂f (x0 )}
Dowód. Zauważmy, że punkt (x0 + λh, f (x0 ) + λf˜0 (x0 , h) nie leży we wnętrzu
epif . Rzeczywiście
?
f (x0 + λh) ­ f (x0 ) + λf˜0 (x0 , h)
f (x0 + λh) − f (x0 ) ? ˜0
­ f (x0 , h),
λ
a ta ostatnia nierówność jest prawdziwa. Skoro tak, to dla λ0 ­ 0 możemy
rozdzielić punkt (x˜0 , ã) = (x0 + λ0 h, f (x0 ) + λ0 f˜0 (x0 , h)) i wnętrze epif , tj.
bierzemy niezerowy x0 ∈ X 0 \ {0} taki, że
hx0 , xi + a0 a ­ hx0 , x˜0 i + a0 ã,
∀(x, a) ∈ epif
Jeśli λ0 = 0 to z dowodu niepustości subróżniczki otrzymujemy −x0 /a0 ∈
∂f (x0 ). Niech λ0 i0.
∀(x, a) ∈ epif
hx0 , x˜0 − xi + a0 (ã − a) ¬ 0.
Kładąc a = f (x0 ) i skoro a0 > 0
h−x0 /a0 , hi ­ f˜0 (x0 , h),
co w połączeniu z poprzednim stwierdzeniem daje oczekiwany rezultat.
Wnioski
4
Weźmy X = R i oznaczmy
0
f+
(x)
=
0
f−
(x)
=
f˜0 (x, 1)
−f˜(x, −1)
Teraz z porzedniego twierdzenia
0
f−
(x) ¬ x0 ¬ f 0 + (x)
(4)
Jednocześnie, skoro subróżniczka jest zbiorem wypukłym i domkniętym to dostajemy następującą charakteryzację
0
0
∂f (x) = {x0 ∈ R : f−
(x) ¬ x0 ¬ f+
(x)}
4
Własności rachunkowe subróżniczek
Obserwacja 4.1. Dla λi0
∂(λf )(x) = λ∂f (x)
Twierdzenie 4.1. Jeśli f1 i f2 wypukłe i istnieje x0 ∈ D(f1 ) ∩ D(f2 ) w którym
f1 jest ciągła to
∂f1 + ∂f2 = ∂(f1 + f2 )
Dowód. Trywialnie sprawdza się, że ∂(f1 )(x) + ∂(f2 )(x) ⊆ ∂(f1 + f2 ). Niech
x0 = x01 + x02 , dla x0i ∈ ∂fi
(f1 + f2 )(z) = f1 (z) + f2 (z) ­
+hx02 , z − xi =
f1 (x) + f2 (x) + hx01 , z − xi
(f1 + f2 )(x) + hx0 , z − xi,
∀z∈X
Niech x0 ∈ ∂(f1 + f2 )(x)
∀y∈X
f1 (y) − f1 (x) − x0 (y − x) ­ f2 (x) − f2 (y),
więc zbiory
E
= {(y, t) ∈ X × R : f1 (y) − f1 (x) − x0 (y − x) ¬ t}
F
= {(y, t) ∈ X × R : f2 (x) − f2 (y) ­ t}
mogą mieć punkty wspólne jedynie na brzegach.
E jest wypukły z niepustym wnętrzem (bo epi funkcji ciągłej w pewnym
punkcie). F tylko wypukły. Rozdzielamy E i F . Hiperpłaszczyzna nie może być
pionowa, bo inaczej rozdzielałby też D(f1 ) i D(f2 ). Dla pewnego x02 i pewnej
c ∈ R mamy
∀y∈X
f1 (y) − f1 (x) − hx0 , y − xi ­ −hx02 , yi + c ­ f2 (x) − f2 (y)
Kładąc y = x ⇒ c = x02 (x) dostaniemy
x0 − x02 ≡ x01 ∈ ∂f1 (x),
x0 = x01 + x02
5
x02 ∈ ∂f2 (x)
Twierdzenie 4.2. f : Y → (−∞, +∞] f wyp. i półciągły z dołu ∃y0 = lx0 t. że
f < ∞ i ciągły. Wtedy
∂(f ◦ l)(x) = l0 ∂f (lx),
6
∀x ∈ X

Podobne dokumenty