Optymalizacja nieliniowa II. Wi˛ezy w postaci nierówno´sci

Transkrypt

Optymalizacja nieliniowa II. Wi˛ezy w postaci nierówno´sci
Wykłady XIII–XIV
(14.01–21.01.2015)
Optymalizacja nieliniowa II.
Wiezy
˛ w postaci
nierówności,
twierdzenie Kuhna–Tuckera
Twierdzenie Kuhna–Tuckera:
Rozważymy teraz zagadnienie programowania (44) z warunkami zadanymi przez funkcje
f : U → Rm , h : U → Rk klasy C 1 w postaci układu równań i nierówności:
g(x) → max , przy warunkach f (x) ≥ 0,
Tym razem budujemy funkcje˛ Lagrange’a z parametrami ν
h(x) = 0.
(65)
∈ R, λ ∈ Rm i µ ∈ Rk w postaci
L(x, ν, λ, µ) = νg(x) + λ · f (x) + µ · h(x)
= νg(x) +
m
X
λj fj (x) +
j=1
k
X
µj hj (x).
(66)
j=1
Twierdzenie 29 (Twierdzenie Kuhna–Tuckera (warunek konieczny))
˛ a˛ funkcjami klasy C 1
⊂ Rn i niech g : U → R, f : U → Rm , h : U → Rk bed
na U . Jeśli x∗ = (ξ 1 , . . . , ξ n ) jest punktem lokalnego maksimum funkcji g zwiazanego
˛
Niech U
przez warunki
f (x) ≥ 0,
h(x) = 0
(67)
≥ 0, wektor λ ∈ Rm o nieujemnych współrz˛ednych i wektor µ ∈ Rk ,
takie że (ν0 , λ, µ) 6= 0 oraz
to istnieja:
˛ liczba ν0
ν0 grad g(x∗ ) + λ · f ′ (x∗ ) + µ · h′ (x∗ ) = 0;
(68)
λ · f (x∗ ) = 0.
(69)
Współrz˛edne wektorów λ,
µ, o których mowa powyżej i liczba ν0 , nazywaja˛ sie˛ mnożnikami
(Lagrange’a) rozważanego problemu.
Nieco niewygodny przypadek, gdy możliwa jest równość ν0
= 0, można wykluczyć z rozważań
przyjmujac
˛ dodatkowe założenie o charakterze geometrycznym — liniowa˛ niezależność
wektorów gradientów funkcji wiezów.
˛
Nie bedziemy
˛
sie˛ w to zagadnienie zagłebiać.
˛
Uwaga 5 Przyjete
˛ tutaj sformułowanie Twierdzenia 29 oparte jest na ksiażce
˛
[2], gdzie jednakże
to twierdzenie nazwane jest Twierdzeniem Fritza Johna. Warunki (dostateczne) zapewniajace,
˛
że
wystepuj
˛ acy
˛ w równaniu (78) mnożnik ν0 jest dodatni, maja˛ charakter geometryczny i sa˛
nazywane kwalifikacjami ograniczeń (wiezów).
˛
Sformułowanie tych warunków można znaleźć
także w podreczniku
˛
Chianga [3, Rozdz. 21.3].
Wzory (68) i (69) kryja,
˛ jak to cz˛esto bywa, bogata˛ treść pod bardzo skondensowanym zapisem.
W szczególności warunek (69)
λ · f (x0 ) = λ1 f1 (x0 ) + . . . + λm fm (x0 ) = 0.
w połaczeniu
˛
z warunkiem nieujemności współczynników Lagrange’a λi okazuje sie˛
równoważny układowi warunków
λ1 f1 (x0 ) = 0,
...,
λm fm (x0 ) = 0.
(70)
W literaturze warunki te nazywane sa˛ warunkami uzupełniajacymi,
˛
gdyż wynika z nich, że jeśli
λi > 0, to punkt krytyczny x∗ bed
˛ acy
˛ rozwiazaniem
˛
(68–69) leży na poziomicy funkcji fi , tj.
spełnia fi (x∗ ) = 0. .
Sformułujemy Twierdzenie K.–T. dla przypadku m
= k = 2 z uwzglednieniem
˛
warunku
kwalifikacji wiezów.
˛
Wniosek 2 (Szczególny przypadek Tw. Kuhna–Tuckera)
⊂ Rn i niech g : U → R, f1 : U → R, f2 : U → R, h1 : U → R,
h2 : U → R bed
˛ a˛ funkcjami klasy C 1 na U . Jeśli x∗ = (ξ 1 , . . . , ξ n ) jest punktem
lokalnego maksimum funkcji g zwiazanego
˛
przez warunki
Niech U
f1 (x) ≥ 0, f2 (x) ≥ 0,
h1 (x) = h2 (x) = 0
i wiezy
˛ (71) spełniaja˛ warunek kwalifikacji, to istnieja˛ nieujemne mnożniki λ1 ,
liczby µ1 ,
(71)
λ2 ≥ 0 oraz
µ2 ∈ R, takie że (λ1 , λ2 , µ1 , µ2 ) 6= 0 oraz
∂g
∂f1
∂f2
∂h1
∂h2
+ λ1
+ λ2
+ µ1
+ µ2
(x∗ ) = 0;
∂x1
∂x1
∂x1
∂x1
∂x1
∂g
∂f1
∂f2
∂h1
∂h2
+ λ1
+ λ2
+ µ1
+ µ2
(x∗ ) = 0;
∂x2
∂x2
∂x2
∂x2
∂x2
(72)
(73)
λ1 f1 (x∗ ) = 0,
(74)
λ2 f2 (x∗ ) = 0,
(75)
Dla wygody czytelnika sformułujemy jeszcze ten wniosek dla przypadku przeciwnie skierowanych
nierówności wiezów.
˛
Mamy wówczas, przy zachowaniu założeń dotyczacych
˛
gładkości funkcji
g, fi , hi nastepuj
˛ acy
˛ rezultat.
Wniosek 3 Jeśli x∗
= (ξ 1 , . . . , ξ n ) jest punktem lokalnego maksimum funkcji g
zwiazanego
˛
z warunkami
f1 (x) ≤ 0, f2 (x) ≤ 0,
h1 (x) = h2 (x) = 0
i wiezy
˛ (77) spełniaja˛ warunek kwalifikacji„ to istnieja˛ nieujemne mnożniki λ1 ,
liczby µ1 ,
(77)
λ2 ≥ 0 oraz
µ2 ∈ R, takie że (λ1 , λ2 , µ1 , µ2 ) 6= 0 oraz
∂g
∂f1
∂f2
∂h1
∂h2
(x∗ ) = 0;
− λ1
− λ2
+ µ1
+ µ2
∂x1
∂x1
∂x1
∂x1
∂x1
∂g
∂f1
∂f2
∂h1
∂h2
− λ1
− λ2
+ µ1
+ µ2
(x∗ ) = 0;
∂x2
∂x2
∂x2
∂x2
∂x2
(78)
(79)
λ1 f1 (x∗ ) = 0,
(80)
λ2 f2 (x∗ ) = 0,
(81)
przy czym
f1 (x∗ ≤ 0, f1 (x∗ ) ≤ 0,
h1 (x∗ ) = h2 (x∗ ) = 0.
(82)
Oczywiście, warunki (76), odpow. (82), wyrażaja˛ to, że x∗ należy do zbioru punktów
dopuszczalnych wyznaczonych przez warunki wiezów
˛
(71), odpow . (77)
Definicja 19 (Wiezy
˛ aktywne) Mówimy, że warunek wiezów
˛
fj (x)
punkcie x∗ , jeśli fj (x∗ )
≥ 0 jest aktywny w
= 0, a jeśli fj (x∗ ) > 0, to określamy go jako nieaktywny. W drodze
umowy o wiezach
˛
w formie równości mówimy, że sa˛ aktywne.
W świetle tej definicji warunki (70) oznaczaja,
˛ że współrz˛edne λj wektora λ odpowiadajace
˛
nieaktywnym warunkom wiezów
˛
sa˛ równe zeru.
Przykład 14 (Przykład z teorii obwodów elektrycznych)
Rozważamy dwa oporniki o wielkości oporu R
źródłem dajacym
˛
napiecie
˛
20V .
≥ 0 i R1 = 10Ω szeregowo połaczone
˛
ze
≥ 0, takiego że pochłaniana przez niego moc jest maksymalna.
b) Wyznaczyć wartość oporu R ≥ 0, takiego że moc dostarczana na drugi opór jest
a) Wyznaczyć wartość oporu R
maksymalna.
Rozwiazanie:
˛
a) Problem przedstawiamy jako
i2 R → max ,
gdzie nateżenie
˛
i jest dane wzorem i
=
przy warunku
R ≥ 0,
20
.
10 + R
Funkcja Lagrange’a ma postać
H(R, λ) = i2 R + λ R =
400R
+ λ R.
(10 + R)2
Warunki (68-69) daja˛
400(10 − R)
+λ=0
(10 + R)3
λ≥0
λR = 0
R ≥ 0.
λ > 0 jest niemożliwe (dlaczego?), zatem musi być λ = 0 i stad
˛ R = 10.
b) Funkcja Lagrange’a tego problemu ma postać
2
H(R, λ) = i 10 + λ R =
20 2
10 + λ R.
10 + R
Jak poprzednio dochodzimy do warunków K.–T. w postaci
−
Tym razem λ
8000
+ λ = 0,
(10 + R)3
λ ≥ 0,
R ≥ 0,
6= 0 (dlaczego?), a zatem musi być R = 0.
λ R = 0..
Przykład 15 (Wyznaczenie optymalnego koszyka towarów) Zadanie polega na wyznaczeniu
maksimum funkcji użyteczności konsumenta
u(x1 , x2 ) = (x1 − 1)(x2 − 3)−2 ,
przy ograniczeniach
p1 x1 + p2 x2 ≤ I,
gdzie x1 ,
x1 ≥ 1,
2 ≥ x2 ≥ 0,
x2 — ilości dóbr do kupienia, p1 , p2 — ceny tych dóbr, I — budżet.
Aby zapisać warunki ograniczajace w postaci f (x1 ,
x2 ) ≥ 0 przyjmiemy
f (x1 , x2 ) = (I − p1 x1 − p2 x2 , x1 − 1, x2 , 2 − x2 ).
Jako funkcje˛ Lagrange’a weźmiemy wiec
˛
H(x1 , x2 , λ, α, β, δ) = (x1 − 1)(x2 − 3)−2 +
λ(I − p1 x1 − p2 x2 ) + α(x1 − 1) + βx2 + δ(2 − x2 ).
co daje jako warunki (78) i (79) równania
∂H(x1 , x2 , λ, α, β, δ)
= (x2 − 3)−2 − λ p1 + α = 0;
∂x1
∂H(x1 , x2 , λ, α, β, δ)
= −2(x1 − 1)(x2 − 3)−3 − λ p2 + β − δ = 0;
∂x2
a z warunku (69) wyprowadzamy w tym przypadku 4 równania
λ(I − p1 x1 − p2 x2 ) = 0;
α(x1 − 1) = 0;
β x2 = 0;
δ(2 − x2 ) = 0.
Szczegółowe wyznaczenie rozwiaza
˛ ń w tym przykładzie jest dość uciażliwe,
˛
choć nietrudne —
wymaga analizy różnych przypadków zwiazanych
˛
z warunkami (69). Pozostawiamy to jako
ćwiczenie.
Zadania: Zastosowania twierdzenia Kuhna–Tuckera
1. Obliczyć odległość miedzy
˛
krzywymi y 2
= 4x, y 2 = 2(x − 3).
q)2 ), gdzie
p jest punktem jednej, a q drugiej paraboli. Jeśli oznaczyć p = (x, y), a q = (u, v), to
równania wiezów
˛
maja˛ postać h1 (x, y, u, v) = y 2 − 4x = 0 i
h2 (x, y, u, v) = v 2 − 2(u − 3) = 0.
√
Odległość parabol wynosi dmin = 5 i jest osiagana
˛
na parze punktów p = (4, −4) i
p = (5, −2) i drugiej, położonej symetrycznie wzgledem
˛
osi Ox. Sytuacje˛ przedstawia
Wsk. Kwadrat odległości miedzy
˛
tymi parabolami wyznaczamy jako min(d(p,
rysunek
10
5
0
-5
-10
0
2
2. Wyznaczyć punkty krytyczne problemu
4
6
8
10
6x1 + 2x1 x2 − 2(x21 + x22 ) → max
z warunkami x1
+ 2x2 − 2 ≤ 0 oraz −x1 + x22 − 1 ≤ 0.
3. Ułożyć i rozwiazać
˛
równania Kuhna–Tuckera dla problemu wyznaczenia maksimum funkcji
g(x1 , x2 ) = 8x1 + 9x2 przy warunkach x21 + x22 ≤ 1 i 2 − (x1 + 1)(x2 + 1) ≥ 0.
4. Ułożyć i rozwiazać
˛
równania Kuhna–Tuckera dla nastepuj
˛ acego
˛
problemu:
Wyznaczyć maksimum funkcji g(x1 ,
x2 ) = x1 · x2 przy warunku 16 − x21 − x22 ≥ 0.
5. Rozwiazuj
˛ ac
˛ równania Kuhna–Tuckera wyznaczyć maksimum funkcji
g(x1 , x2 ) = 4x21 − 3x1 · x2 na domknietym
˛
kole jednostkowym w płaszczyźnie
(x1 , x2 ).