Optymalizacja nieliniowa II. Wi˛ezy w postaci nierówno´sci
Transkrypt
Optymalizacja nieliniowa II. Wi˛ezy w postaci nierówno´sci
Wykłady XIII–XIV (14.01–21.01.2015) Optymalizacja nieliniowa II. Wiezy ˛ w postaci nierówności, twierdzenie Kuhna–Tuckera Twierdzenie Kuhna–Tuckera: Rozważymy teraz zagadnienie programowania (44) z warunkami zadanymi przez funkcje f : U → Rm , h : U → Rk klasy C 1 w postaci układu równań i nierówności: g(x) → max , przy warunkach f (x) ≥ 0, Tym razem budujemy funkcje˛ Lagrange’a z parametrami ν h(x) = 0. (65) ∈ R, λ ∈ Rm i µ ∈ Rk w postaci L(x, ν, λ, µ) = νg(x) + λ · f (x) + µ · h(x) = νg(x) + m X λj fj (x) + j=1 k X µj hj (x). (66) j=1 Twierdzenie 29 (Twierdzenie Kuhna–Tuckera (warunek konieczny)) ˛ a˛ funkcjami klasy C 1 ⊂ Rn i niech g : U → R, f : U → Rm , h : U → Rk bed na U . Jeśli x∗ = (ξ 1 , . . . , ξ n ) jest punktem lokalnego maksimum funkcji g zwiazanego ˛ Niech U przez warunki f (x) ≥ 0, h(x) = 0 (67) ≥ 0, wektor λ ∈ Rm o nieujemnych współrz˛ednych i wektor µ ∈ Rk , takie że (ν0 , λ, µ) 6= 0 oraz to istnieja: ˛ liczba ν0 ν0 grad g(x∗ ) + λ · f ′ (x∗ ) + µ · h′ (x∗ ) = 0; (68) λ · f (x∗ ) = 0. (69) Współrz˛edne wektorów λ, µ, o których mowa powyżej i liczba ν0 , nazywaja˛ sie˛ mnożnikami (Lagrange’a) rozważanego problemu. Nieco niewygodny przypadek, gdy możliwa jest równość ν0 = 0, można wykluczyć z rozważań przyjmujac ˛ dodatkowe założenie o charakterze geometrycznym — liniowa˛ niezależność wektorów gradientów funkcji wiezów. ˛ Nie bedziemy ˛ sie˛ w to zagadnienie zagłebiać. ˛ Uwaga 5 Przyjete ˛ tutaj sformułowanie Twierdzenia 29 oparte jest na ksiażce ˛ [2], gdzie jednakże to twierdzenie nazwane jest Twierdzeniem Fritza Johna. Warunki (dostateczne) zapewniajace, ˛ że wystepuj ˛ acy ˛ w równaniu (78) mnożnik ν0 jest dodatni, maja˛ charakter geometryczny i sa˛ nazywane kwalifikacjami ograniczeń (wiezów). ˛ Sformułowanie tych warunków można znaleźć także w podreczniku ˛ Chianga [3, Rozdz. 21.3]. Wzory (68) i (69) kryja, ˛ jak to cz˛esto bywa, bogata˛ treść pod bardzo skondensowanym zapisem. W szczególności warunek (69) λ · f (x0 ) = λ1 f1 (x0 ) + . . . + λm fm (x0 ) = 0. w połaczeniu ˛ z warunkiem nieujemności współczynników Lagrange’a λi okazuje sie˛ równoważny układowi warunków λ1 f1 (x0 ) = 0, ..., λm fm (x0 ) = 0. (70) W literaturze warunki te nazywane sa˛ warunkami uzupełniajacymi, ˛ gdyż wynika z nich, że jeśli λi > 0, to punkt krytyczny x∗ bed ˛ acy ˛ rozwiazaniem ˛ (68–69) leży na poziomicy funkcji fi , tj. spełnia fi (x∗ ) = 0. . Sformułujemy Twierdzenie K.–T. dla przypadku m = k = 2 z uwzglednieniem ˛ warunku kwalifikacji wiezów. ˛ Wniosek 2 (Szczególny przypadek Tw. Kuhna–Tuckera) ⊂ Rn i niech g : U → R, f1 : U → R, f2 : U → R, h1 : U → R, h2 : U → R bed ˛ a˛ funkcjami klasy C 1 na U . Jeśli x∗ = (ξ 1 , . . . , ξ n ) jest punktem lokalnego maksimum funkcji g zwiazanego ˛ przez warunki Niech U f1 (x) ≥ 0, f2 (x) ≥ 0, h1 (x) = h2 (x) = 0 i wiezy ˛ (71) spełniaja˛ warunek kwalifikacji, to istnieja˛ nieujemne mnożniki λ1 , liczby µ1 , (71) λ2 ≥ 0 oraz µ2 ∈ R, takie że (λ1 , λ2 , µ1 , µ2 ) 6= 0 oraz ∂g ∂f1 ∂f2 ∂h1 ∂h2 + λ1 + λ2 + µ1 + µ2 (x∗ ) = 0; ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂g ∂f1 ∂f2 ∂h1 ∂h2 + λ1 + λ2 + µ1 + µ2 (x∗ ) = 0; ∂x2 ∂x2 ∂x2 ∂x2 ∂x2 (72) (73) λ1 f1 (x∗ ) = 0, (74) λ2 f2 (x∗ ) = 0, (75) Dla wygody czytelnika sformułujemy jeszcze ten wniosek dla przypadku przeciwnie skierowanych nierówności wiezów. ˛ Mamy wówczas, przy zachowaniu założeń dotyczacych ˛ gładkości funkcji g, fi , hi nastepuj ˛ acy ˛ rezultat. Wniosek 3 Jeśli x∗ = (ξ 1 , . . . , ξ n ) jest punktem lokalnego maksimum funkcji g zwiazanego ˛ z warunkami f1 (x) ≤ 0, f2 (x) ≤ 0, h1 (x) = h2 (x) = 0 i wiezy ˛ (77) spełniaja˛ warunek kwalifikacji„ to istnieja˛ nieujemne mnożniki λ1 , liczby µ1 , (77) λ2 ≥ 0 oraz µ2 ∈ R, takie że (λ1 , λ2 , µ1 , µ2 ) 6= 0 oraz ∂g ∂f1 ∂f2 ∂h1 ∂h2 (x∗ ) = 0; − λ1 − λ2 + µ1 + µ2 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂g ∂f1 ∂f2 ∂h1 ∂h2 − λ1 − λ2 + µ1 + µ2 (x∗ ) = 0; ∂x2 ∂x2 ∂x2 ∂x2 ∂x2 (78) (79) λ1 f1 (x∗ ) = 0, (80) λ2 f2 (x∗ ) = 0, (81) przy czym f1 (x∗ ≤ 0, f1 (x∗ ) ≤ 0, h1 (x∗ ) = h2 (x∗ ) = 0. (82) Oczywiście, warunki (76), odpow. (82), wyrażaja˛ to, że x∗ należy do zbioru punktów dopuszczalnych wyznaczonych przez warunki wiezów ˛ (71), odpow . (77) Definicja 19 (Wiezy ˛ aktywne) Mówimy, że warunek wiezów ˛ fj (x) punkcie x∗ , jeśli fj (x∗ ) ≥ 0 jest aktywny w = 0, a jeśli fj (x∗ ) > 0, to określamy go jako nieaktywny. W drodze umowy o wiezach ˛ w formie równości mówimy, że sa˛ aktywne. W świetle tej definicji warunki (70) oznaczaja, ˛ że współrz˛edne λj wektora λ odpowiadajace ˛ nieaktywnym warunkom wiezów ˛ sa˛ równe zeru. Przykład 14 (Przykład z teorii obwodów elektrycznych) Rozważamy dwa oporniki o wielkości oporu R źródłem dajacym ˛ napiecie ˛ 20V . ≥ 0 i R1 = 10Ω szeregowo połaczone ˛ ze ≥ 0, takiego że pochłaniana przez niego moc jest maksymalna. b) Wyznaczyć wartość oporu R ≥ 0, takiego że moc dostarczana na drugi opór jest a) Wyznaczyć wartość oporu R maksymalna. Rozwiazanie: ˛ a) Problem przedstawiamy jako i2 R → max , gdzie nateżenie ˛ i jest dane wzorem i = przy warunku R ≥ 0, 20 . 10 + R Funkcja Lagrange’a ma postać H(R, λ) = i2 R + λ R = 400R + λ R. (10 + R)2 Warunki (68-69) daja˛ 400(10 − R) +λ=0 (10 + R)3 λ≥0 λR = 0 R ≥ 0. λ > 0 jest niemożliwe (dlaczego?), zatem musi być λ = 0 i stad ˛ R = 10. b) Funkcja Lagrange’a tego problemu ma postać 2 H(R, λ) = i 10 + λ R = 20 2 10 + λ R. 10 + R Jak poprzednio dochodzimy do warunków K.–T. w postaci − Tym razem λ 8000 + λ = 0, (10 + R)3 λ ≥ 0, R ≥ 0, 6= 0 (dlaczego?), a zatem musi być R = 0. λ R = 0.. Przykład 15 (Wyznaczenie optymalnego koszyka towarów) Zadanie polega na wyznaczeniu maksimum funkcji użyteczności konsumenta u(x1 , x2 ) = (x1 − 1)(x2 − 3)−2 , przy ograniczeniach p1 x1 + p2 x2 ≤ I, gdzie x1 , x1 ≥ 1, 2 ≥ x2 ≥ 0, x2 — ilości dóbr do kupienia, p1 , p2 — ceny tych dóbr, I — budżet. Aby zapisać warunki ograniczajace w postaci f (x1 , x2 ) ≥ 0 przyjmiemy f (x1 , x2 ) = (I − p1 x1 − p2 x2 , x1 − 1, x2 , 2 − x2 ). Jako funkcje˛ Lagrange’a weźmiemy wiec ˛ H(x1 , x2 , λ, α, β, δ) = (x1 − 1)(x2 − 3)−2 + λ(I − p1 x1 − p2 x2 ) + α(x1 − 1) + βx2 + δ(2 − x2 ). co daje jako warunki (78) i (79) równania ∂H(x1 , x2 , λ, α, β, δ) = (x2 − 3)−2 − λ p1 + α = 0; ∂x1 ∂H(x1 , x2 , λ, α, β, δ) = −2(x1 − 1)(x2 − 3)−3 − λ p2 + β − δ = 0; ∂x2 a z warunku (69) wyprowadzamy w tym przypadku 4 równania λ(I − p1 x1 − p2 x2 ) = 0; α(x1 − 1) = 0; β x2 = 0; δ(2 − x2 ) = 0. Szczegółowe wyznaczenie rozwiaza ˛ ń w tym przykładzie jest dość uciażliwe, ˛ choć nietrudne — wymaga analizy różnych przypadków zwiazanych ˛ z warunkami (69). Pozostawiamy to jako ćwiczenie. Zadania: Zastosowania twierdzenia Kuhna–Tuckera 1. Obliczyć odległość miedzy ˛ krzywymi y 2 = 4x, y 2 = 2(x − 3). q)2 ), gdzie p jest punktem jednej, a q drugiej paraboli. Jeśli oznaczyć p = (x, y), a q = (u, v), to równania wiezów ˛ maja˛ postać h1 (x, y, u, v) = y 2 − 4x = 0 i h2 (x, y, u, v) = v 2 − 2(u − 3) = 0. √ Odległość parabol wynosi dmin = 5 i jest osiagana ˛ na parze punktów p = (4, −4) i p = (5, −2) i drugiej, położonej symetrycznie wzgledem ˛ osi Ox. Sytuacje˛ przedstawia Wsk. Kwadrat odległości miedzy ˛ tymi parabolami wyznaczamy jako min(d(p, rysunek 10 5 0 -5 -10 0 2 2. Wyznaczyć punkty krytyczne problemu 4 6 8 10 6x1 + 2x1 x2 − 2(x21 + x22 ) → max z warunkami x1 + 2x2 − 2 ≤ 0 oraz −x1 + x22 − 1 ≤ 0. 3. Ułożyć i rozwiazać ˛ równania Kuhna–Tuckera dla problemu wyznaczenia maksimum funkcji g(x1 , x2 ) = 8x1 + 9x2 przy warunkach x21 + x22 ≤ 1 i 2 − (x1 + 1)(x2 + 1) ≥ 0. 4. Ułożyć i rozwiazać ˛ równania Kuhna–Tuckera dla nastepuj ˛ acego ˛ problemu: Wyznaczyć maksimum funkcji g(x1 , x2 ) = x1 · x2 przy warunku 16 − x21 − x22 ≥ 0. 5. Rozwiazuj ˛ ac ˛ równania Kuhna–Tuckera wyznaczyć maksimum funkcji g(x1 , x2 ) = 4x21 − 3x1 · x2 na domknietym ˛ kole jednostkowym w płaszczyźnie (x1 , x2 ).