Odcinek 7 HXH
Transkrypt
Odcinek 7 HXH
WYKŁAD nr 4 1. Zadanie programowania nieliniowego (ZPN) 1.1 Ekstrema funkcji jednej zmiennej o ciągłych pochodnych Przypuśćmy ze punkt xˆ ∈ R jest punktem stacjonarnym funkcji f (x ) , gdzie punktem stacjonarnym nazywamy punkt x̂ dla którego (∇f )xˆ = 0 . punkt stacjonarny jest miejscem ekstremum jeżeli : ⎛ d 2 f ( x) ⎞ ⎛ df ( x) ⎞ ⎟ > 0 , i wówczas występuje minimum lokalne silne , ⎟ = 0 , ⎜⎜ ⎜ 2 ⎟ ⎝ dx ⎠ xˆ ⎝ dx ⎠ xˆ A./ ⎛ d 2 f ( x) ⎞ ⎛ df ( x) ⎞ ⎟ < 0 , i wówczas występuje maksimum lokalne silne, ⎟ = 0 , ⎜⎜ ⎜ 2 ⎟ ⎝ dx ⎠ xˆ ⎝ dx ⎠ xˆ B./ punkt stacjonarny nie jest miejscem ekstremum lecz miejscem przegięcia funkcji jeżeli : ⎛ d 2 f ( x) ⎞ ⎛ d 3 f ( x) ⎞ ⎛ df ( x) ⎞ ⎟ =0 , ⎜ ⎟ ⎟ = 0 , ⎜⎜ ⎜ 2 ⎟ ⎜ dx 3 ⎟ >, < 0 ⎝ dx ⎠ xˆ ⎝ dx ⎠ xˆ ⎝ ⎠ xˆ ⎛ d 2 f (x) ⎞ ⎛ df (x) ⎞ ⎟ >0 ⎜ ⎟ = 0 , ⎜⎜ 2 ⎟ ⎝ dx ⎠xˆ ⎝ dx ⎠xˆ ⎛ d3 f (x) ⎞ ⎛ d 2 f (x) ⎞ ⎛ df (x) ⎞ ⎟ ⎟ =0 , ⎜ ⎜ ⎟ = 0 , ⎜⎜ 2 ⎟ ⎜ dx3 ⎟ > 0 ⎝ dx ⎠xˆ ⎠xˆ ⎝ ⎝ dx ⎠xˆ f (x) maksimum punkt przegiecia punkt przegiecia minimum x ⎛ d 2 f (x) ⎞ ⎛ df (x) ⎞ ⎟ <0 ⎜ ⎟ = 0 , ⎜⎜ 2 ⎟ ⎝ dx ⎠xˆ ⎝ dx ⎠xˆ Rys.1 ⎛ d3 f (x) ⎞ ⎛ d 2 f (x) ⎞ ⎛ df (x) ⎞ ⎟ ⎟ =0 , ⎜ ⎜ ⎟ = 0 , ⎜⎜ 2 ⎟ ⎜ dx3 ⎟ < 0 ⎝ dx ⎠xˆ ⎠xˆ ⎝ ⎝ dx ⎠xˆ Ekstrema i punkty przegięcia funkcji Uogólnienie: Jeżeli funkcja f (x ) ma w otoczeniu x̂ pochodne do rzędu K ⎛ d i f ( x) ⎞ ⎛ d K f ( x) ⎞ ⎟ ⎟ ⎜ = = − dla i K oraz 0 1 ,.., 1 włącznie a nadto : ⎜⎜ i ⎟ ⎜ dx K ⎟ ≠ 0 dx ⎠ xˆ ⎝ ⎠ xˆ ⎝ to jeżeli K jest liczbą parzystą , A./ funkcja f (x ) ma w punkcie x̂ minimum lokalne silne gdy B./ ⎛ d K f ( x) ⎞ ⎟ ⎜ ⎜ dx K ⎟ > 0 ⎠ xˆ ⎝ funkcja f (x ) ma w punkcie x̂ maksimum lokalne silne gdy ⎛ d f ( x) ⎞ ⎟ ⎜ ⎜ dx K ⎟ < 0 ⎠ xˆ ⎝ Jeżeli K jest nieparzyste , to ekstremum funkcji f (x ) w punkcie stacjonarnym x̂ nie istnieje . K Znając punkty stacjonarne funkcji dla znalezienia jej minimum leżącego wewnątrz zbioru Η , wystarczy zbadać wartości , jakie funkcja przyjmie w punktach stacjonarnych. Możliwość wnioskowania o tym że punkt stacjonarny jest punktem w którym funkcja osiąga ekstremum wiąże się z wypukłością funkcji f (x ) oraz wypukłością zbioru Η . Zbiór punktów dopuszczalnych Η w obrębie którego możemy poszukiwać punktu w którym funkcja f (x ) osiąga ekstremum , jest na ogół wyznaczony przez zespół warunków ograniczających , określonych przy pomocy pewnych funkcji ograniczających : a./ warunki ograniczające równościowe , b./ warunki ograniczające nierównościowe. punkt x musi spełniać warunki równościowe , które mają postać I równań : ( ( g i ( x) = g i , i = 1,.., I g i − stałe (1) Warunek będziemy oznaczać (2) W = = wi= , i = 1,.., I co oznacza że punkt x ma należeć do zbioru punktów spełniających (1). Zbiór ten oznaczamy Η i= ( hiperpowierzchnie ) .Spełnienie warunku x ∈ Η i= jest Ad.a { } równoważne spełnieniu warunku wi= . Równoczesne spełnienie zespołu dwóch równań ( ( g1 ( x ) = g1 ; g 2 ( x ) = g 2 x leży zarówno na hiperpowierzchni Η1= oznacza że punkt jak i na hiperpowierzchni Η 2= a więc należy do zbioru Η = = Η1= ∩ Η 2= będącego iloczynem zbiorów Η1= i Η 2= . W przypadku gdy obie funkcje ( ( g1 ( x) = g1 ; g 2 ( x) = g 2 są liniowe , hiperpowierzchnie Η1= , Η 2= są płaszczyznami . W grę wchodzą trzy możliwości : 1. płaszczyzny Η1= , Η 2= są równoległe 2. płaszczyzny Η1= , Η 2= pokrywają się 3. płaszczyzny Η1= , Η 2= przecinają się Ograniczenia w przypadku 1. ,2. nazywamy zdegenerowanymi . Przypadek 3. jest niezdegenerowany , zbór Η = = Η1= ∩ Η 2= jest linia przecięcia płaszczyzn Η1= , Η 2= . Oznaczymy ogólnie przez Η = zbiór punktów spełniających zespół warunków W = = wi= , i = 1,.., I . Zbór ten jest iloczynem zbiorów Η i= , zatem: { } Η = = ∩ Η i= I (3) i =1 Znajdowanie rozwiązania zadania optymalizacji ZO : x : f ( x) x∈Η = (4) sprowadza się do badania funkcji f (x ) w punktach leżących w zbiorze Η = . Ad.b warunki ograniczające nierównościowe mają postać zespołu nierówności : ( h j ( x) ≤ h j , j = 1,.., J ( h 'j ( x) ≥ h j' , j ' = 1,.., J Nierówność taką oznaczamy symbolem ≤ W = { w ≤j , j = 1,.., J } w ≤j a ich zespół przez (5) Przy założeniu że funkcja f (x ) jest funkcją ciągłą , hiperpowierzchnia Η i= ( określona równaniem h j ( x) = h j rozdziela przestrzeń R N na dwa zbiory . Zbiór ( leżący po jednej stronie powierzchni charakteryzuje się tym że h j ( x) ≥ h j , po ( drugiej zaś stronie tym że h j ( x) ≤ h j ( h j ( x) > h j ( h j ( x) = h j ( h j ( x) ≤ h j Rys. 2 Przestrzeń R N rozdzielona na dwa zbiory Zbiór punktów Η ≤ spełniających warunki nierównościowe jest więc iloczynem zbiorów Η ≤j , j = 1,.., J Η ≤ = ∩ Η i≤ I i =1 (6) Η 1= Η 3= Η1≤ Η 2= Η 2≥ Η ≤ = ∩ Η i≤ 3 i =1 Η 3≤ Rys.3 Zbiór Η ≤ = ∩ Η i≤ I i =1 Podobnie jak w przypadku warunków równościowych może powstać sytuacja że I iloczyn ∩ Η i≤ jest zbiorem pustym co oznacza że warunki ograniczające są i =1 sprzeczne . Poszukiwanie miejsca ekstremalnego znacznie się upraszcza jeżeli zbiór ≤ Η jest zbiorem wypukłym. Zbiór A nazywamy zbiorem wypukłym jeżeli dla x ′ ∈ A oraz x′′ ∈ A wynika że punkt (7) x ′′′ = (1 − α ) ⋅ x ′ + α ⋅ x ′′ dla 0 ≤ α ≤ 1 należy też do zbioru A Definicja: Tak więc zbiór jest wypukły , jeżeli z faktu iż dwa punkty x ′ ∈ A i x′′ ∈ A wynika ,że cały odcinek łączący te punkty należy też do tego zbioru . x′ x′ x ′′ x ′′ x′ Η1 Rys.4 Η2 Przykłady zbiorów wypukłych x ′′ x′ x′ Η1 x′′ Η1 x′′ x′ Η2 Rys 5 Przykłady zbiorów które nie są wypukłe Uwaga: Iloczyn zbiorów wypukłych jest także zbiorem wypukłym 1./ x′′ Z pojęciem wypukłości zbioru wiąże się pojecie wypukłości funkcji Mówimy że ciągła funkcja h( x) , x ∈ R N jest wypukła w dół w przestrzeni R N jeżeli dla dowolnych dwóch punktów x ′ ∈ R N , x ′′ ∈ R N oraz każdego α ∈< 0,1 > zachodzi : h[(1 − α ) ⋅ x ′ + α ⋅ x ′′] ≤ (1 − α ) ⋅ h( x ′) + α ⋅ h( x ′′) (8) natomiast jeżeli : h[(1 − α ) ⋅ x ′ + α ⋅ x ′′] ≥ (1 − α ) ⋅ h( x ′) + α ⋅ h( x ′′) (9) to funkcja h( x ) , x ∈ R N jest wypukła w górę w przestrzeni R N 2./ W przypadku gdy warunek (8) zachodzi tylko dla dowolnych punktów x′ ∈ Η , x′′ ∈ Η , przy czym Η jest zbiorem wypukłym w przestrzeni R N to funkcję h (x ) nazywamy wypukła w dół w zbiorze wypukłym Η , w przypadku warunku (9) funkcję h (x ) nazywamy wypukła w górę w zbiorze wypukłym Η , C./ Warunki zapewniające istnienie ekstremum globalnego Sytuacja upraszcza się jeżeli funkcja f (x ) określona w zbiorze R wszystkich liczb rzeczywistych jest wypukła w górę lub w dół. Jeżeli funkcja f (x ) jest wypukła w dół , to może mieć tylko jedno minimum będące jej minimum globalnym . Jeżeli funkcja f (x ) jest wypukła w górę , to może mieć tylko jedno maksimum będące jej maksimum globalnym . Funkcja f (x ) określona w zbiorze R jest : wypukła w dół gdy dla wszystkich x ∈ R , d 2 f ( x) dx 2 ≥ 0 wypukła w górę gdy dla wszystkich x ∈ R D./ , d 2 f ( x) dx 2 ≤ 0 Ekstrema lokalne niewłaściwe (spłaszczone ) Jeżeli dla wszystkich xˆ ∈ Ηˆ jest (df ( x) dx ) xˆ = 0 oraz w pewnym przedziale Η takim ,że Η ⊃ Ηˆ , druga pochodna d 2 f ( x) dx 2 jest ( a.) b.) 2. ciągła , to funkcja f (x ) na w przedziale Η̂ : maksimum lokalne niewłaściwe (spłaszczone) 2 2 d f ( x) dx xˆ ≤ 0 , x ∈ H minimum lokalne niewłaściwe (spłaszczone), 2 2 d f ( x) dx xˆ ≥ 0 , x ∈ H ( ) ( ) , gdy gdy ) Ekstrema funkcji dwu zmiennych o ciągłych pochodnych A./ Hesjan i jego własności Hesjanem funkcji f ( x1 , x 2 ) w punkcie X ≡ (x1, x 2 ) nazywamy : (∇ f ) 2 x ⎛ ∂2 f ⎞ ⎜ ⎟ ⎜ ∂x 2 ⎟ 1 ⎠x ⎝ = ⎛ ∂2 f ⎞ ⎜ ⎟ ⎜ ∂x ∂x ⎟ ⎝ 1 2 ⎠x ⎛ ∂2 f ⎞ ⎜ ⎟ ⎜ ∂x ∂x ⎟ ⎝ 1 2 ⎠x ⎛ ∂2 f ⎞ ⎜ ⎟ ⎜ ∂x 2 ⎟ ⎝ 2 ⎠x (10) Z twierdzenia Schwarca o równości pochodnych cząstkowych mieszanych wynika że hesjan jest macierzą symetryczną . T Jeżeli utworzymy wektor u = [u1 u 2 ] to funkcję A(u1 , u 2 ) = a11 ⋅ u12 + 2 ⋅ a12 u1u 2 + a 22 ⋅ u 22 ⎛ ∂2 f gdzie : aij ≡ ⎜ ⎜ ∂xi ∂x j ⎝ (11) ⎞ ⎟ i = 1,2 , j = 1,2 możemy zapisać jako : ⎟ ⎠ xˆ ( A(u1 , u 2 ) = u T ⋅ ∇ 2 f ) xˆ ⋅u (12) co oznacza że funkcja A(u1 , u 2 ) jest formą kwadratową względem wektora u o ( macierzy symetrycznej ∇ 2 f ). xˆ B./ C./ Istnienie i postać ekstremum funkcji f ( x1 , x2 ) w punkcie stacjonarnym x̂ zależy od charakteru formy kwadratowej A(u1 , u 2 ) a ściślej od jej określoności lub półokreśloności . Jeżeli dla wszystkich wektorów u ≠ 0 zachodzi nierówność : 1./ A(u1 , u 2 ) = u T ⋅ ∇ 2 f xˆ ⋅ u > 0 to (macierz ∇ 2 f ( ) ( ) ( ) kwadratowa A(u1 ,u 2 ) jest dodatnio określona , 2./ D./ A(u1 , u 2 ) = u T ⋅ ∇ 2 f xˆ ⋅ u < 0 to (macierz ( 2 u ⋅∇ f ) xˆ ⋅ u = 0 to (macierz (∇ f ) 2 A(u1 ,u 2 ) jest dodatnio półokreślona , 2./ ( A(u1 , u 2 ) = u T ⋅ ∇ 2 f ( uT ⋅ ∇2 f ) xˆ ) xˆ forma (∇ f ) ) forma 2 xˆ xˆ ) forma kwadratowa ⋅ u ≤ 0 i istnieje taki wektor u ≠ 0 że ⋅ u = 0 to (macierz (∇ f ) 2 xˆ ) forma kwadratowa ) ( ) Możemy zawsze dokonać takiego obrotu układu o współrzędnych [u1 u 2 ] że w nowym układzie o współrzędnych [u1′ u 2′ ] formę kwadratową A(u1 ,u 2 ) możemy zapisać w postaci : A(u1 ,u 2 ) = A′(u1′ ,u 2′ ) = ξ1 ⋅ u1′ 2 + ξ 2 ⋅ u ′22 w której : ξ1 , ξ 2 G./ ) xˆ A(u1 ,u 2 ) jest ujemnie półokreślona W szczególności , jeżeli forma kwadratowa A(u1 ,u 2 ) jest dodatnio lub ujemnie półokreślona zaś dla wszystkich wektorów u ≠ 0 zachodzi równość u T ⋅ ∇ 2 f xˆ ⋅ u = 0 , to o formie kwadratowej A(u1 ,u 2 ) mówimy że jest tożsamościowo równa zero . W takim przypadku hesjan ∇ 2 f xˆ jest macierzą zerową . ( F./ ) kwadratowa A(u1 ,u 2 ) jest ujemnie określona , Jeżeli dla wszystkich wektorów u ≠ 0 zachodzi nierówność: 1./ A(u1 , u 2 ) = u T ⋅ ∇ 2 f xˆ ⋅ u ≥ 0 i istnieje taki wektor u ≠ 0 że T E./ ( ( (13) są wartościami własnymi macierzy ∇ 2 f Wielomianem charakterystycznym macierzy nazywamy wielomian o postaci: ϕ(ξ) = det ∇ 2 f − ξ ⋅ 12 kwadratowej Równaniem nazywamy : kwadratowej [( ) charakterystycznym ϕ(ξ) = 0 ] macierzy ) xˆ (∇ f ) 2 xˆ (14) (∇ f ) (15) 2 xˆ ( Wartościami własnymi ξ1 , ξ 2 macierzy ∇ 2 f ) xˆ są pierwiastki równania charakterystycznego (3.15) , zbiór wartości własnych ( macierzy ∇ 2 f ) xˆ { ξ1 , ξ2 } , nazywamy widmem tej macierzy. Przykład 3.1 1./ funkcja dwóch zmiennych f ( x1 , x 2 ) = x12 − 2 x1 ⋅ x 2 + 2 x 22 2./ hesjan funkcji ⎛ ∂2 f ⎞ ⎛ ∂2 f ⎞ ⎟ ⎜ ⎜ ⎟ ⎜ ∂x ∂x ⎟ ⎜ ∂x 2 ⎟ 2 −2 1 2 ⎠x ⎝ 1 ⎠x ⎝ 2 = ∇ f x = 2 2 ⎛∂ f ⎞ −2 4 ⎛ ∂ f ⎞ ⎟ ⎜ ⎜ ⎟ ⎜ ∂x ∂x ⎟ ⎜ ∂x 2 ⎟ ⎝ 1 2 ⎠x ⎝ 2 ⎠x 3./ wielomian charakterystyczny hesjanu ⎡ 2 −2 1 0⎤ ϕ(ξ) = det ∇ 2 f − ξ ⋅ 12 = det ⎢ −ξ⋅ ⎥ 0 1⎦ ⎣− 2 4 4./ równanie charakterystyczne hesjanu ϕ(ξ) = 0 ϕ(ξ) = (2 − ξ ) ⋅ (4 − ξ ) − ( −2) ⋅ ( −2) = 0 ( ) [( 5./ 6./ H./ ) ] ϕ(ξ) = ξ 2 − 6ξ + 4 = 0 wartości własne hesjanu (pierwiastki równania ξ1 = 3 + 5 , ξ 2 = 3 − 5 charakterystycznego ) widmo hesjanu (zbiór pierwiastków charakterystycznych ) 3+ 5 , 3− 5 { } Ogólnie możliwa jest jedna z następujących sytuacji a./ obie wartości własne są dodatnie , b./ obie wartości własne są ujemne , c./ wartości własne mają przeciwne znaki , d./ jedna w wartości własnych jest równa zero ad.a f ( x1 , x2 ) fˆ ( xˆ1 , xˆ 2 ) xˆ 2 = x 2 0 xˆ 1 = x1 Rys.6 xˆ = [xˆ1 , xˆ 2 ] Paraboloida eliptyczna wypukła w dół Jeżeli obie wartości własne hesjanu są dodatnie wówczas zachodzi przypadek C.1 A(u1 , u 2 ) = u T ⋅ ∇ 2 f xˆ ⋅ u > 0 , ( (∇ f ) ) (macierz xˆ ) forma kwadratowa A(u1 , u 2 ) jest dodatnio określona. Obrazem graficznym funkcji f ( x1 , x2 ) jest w tym przypadku paraboloida eliptyczna wypukła w dół . 2 ad.b Jeżeli obie wartości własne hesjanu są ujemne wówczas zachodzi przypadek C.2 A(u1 , u 2 ) = u T ⋅ ∇ 2 f xˆ ⋅ u < 0 , ( (∇ f ) ) 2 (macierz xˆ ) forma kwadratowa A(u1 , u 2 ) jest ujemnie określona Obrazem graficznym funkcji f ( x1 , x2 ) jest w tym przypadku paraboloida eliptyczna wypukła w górę . f ( x1 , x 2 ) fˆ ( xˆ1 , xˆ 2 ) xˆ 2 = x 2 0 xˆ 1 = x 1 Rys.7. ad.c xˆ = [xˆ1 , xˆ 2 ] Paraboloida eliptyczna wypukła w górę w przypadku gdy wartości własne są różnych znaków , forma kwadratowa przyjmuje zarówno wartości dodatnie jak i ujemne . Forma kwadratowa jest zatem nieokreślona a także nieokreślony jest hesjan ∇ 2 f xˆ . Obrazem graficznym funkcji f ( x1 , x2 ) jest w tym przypadku paraboloida hiperboliczna jak na rysunku poniżej. ( ) f ( x1 , x 2 ) x2 0 x1 Rys.8 Hesjan nieokreślony Punkt siodłowy [x1 , x2 ] ad.a 1.) Jeżeli jedna z wartości własnych jest równa zero a druga jest dodatnia to zachodzi przypadek D.1 , [ ] [ fˆ (xˆ1 , xˆ 2 ) , xˆ1 ∈ x11 , x12 , xˆ 2 ∈ x12 , x23 A ] f ( x1 , x 2 ) x12 0 x22 x11 x12 Rys. 9 Minimum niewłaściwe (spłaszczone) funkcji ( ) ( f ( x1 , x 2 ) ) A(u1 , u 2 ) = u T ⋅ ∇ 2 f xˆ ⋅ u ≥ 0 (macierz ∇ 2 f xˆ ) forma kwadratowa A(u1 , u 2 ) jest dodatnio półokreślona .Dodatnia półokreśloność wskazywać może na istnienie minimum niewłaściwego (spłaszczonego) funkcji f ( x1 , x2 ) . Aproksymacja lokalna funkcji f ( x1 , x2 ) walcem hiperbolicznym leżącym i wypukłym w dół wykazuje istnienie minimum niewłaściwego (spłaszczonego) . W przypadku A. w zbiorze Η̂ istnieje minimum niewłaściwe( rys. 9) W przypadku B w zbiorze Η̂ minimum niewłaściwe nie istnieje ( rys. 10). 2.) Jeżeli jedna z wartości własnych jest równa zero a druga jest ujemna to zachodzi przypadek D.2 ( ) ( ) A(u1 , u 2 ) = u T ⋅ ∇ 2 f xˆ ⋅ u ≤ 0 (macierz ∇ 2 f xˆ ) forma kwadratowa A(u1 , u 2 ) jest ujemnie półokreślona. Ujemna półokreśloność wskazywać może na istnienie maksimum niewłaściwego funkcji f ( x1 , x2 ) . B f ( x1 , x 2 ) x 21 Rys.10. x12 0 x11 x22 Minimum niewłaściwe (spłaszczone) nie istnieje Aproksymacja lokalna funkcji f ( x1 , x2 ) walcem hiperbolicznym leżącym i wypukłym w górę wykazuje istnienie maksimum niewłaściwego. W przypadku A. w zbiorze Η̂ istnieje maksimum niewłaściwe ( rys.11) W przypadku B. w zbiorze Η̂ nie istnieje maksimum niewłaściwe (rys.12) A f ( x1 , x 2 ) x 21 Rys.11. [ x11 ] [ fˆ (xˆ1 , xˆ 2 ) , xˆ1 ∈ x11 , x12 , xˆ 2 ∈ x12 , x23 x 21 0 x 22 Η̂ Maksimum niewłaściwe funkcji f ( x1 , x2 ) ] f ( x1 , x 2 ) B x 21 x11 x12 0 x22 Rys.12. Maksimum niewłaściwe nie istnieje I./ Warunki dostateczne istnienia ekstremum ( Istnienie i postać ekstremum Hesjan ∇ 2 f Minimum Istnieje w lokalne silne punkcie stacjonarnym x̂ Maksimum lokalne silne Może istnieć w otoczeniu punktu stacjonarnego x̂ dodatnio określony ujemnie określony Minimum dodatnio lokalne półokreślony niewłaściwe Maksimum ujemnie Lokalne półokreślony niewłaściwe ) xˆ Powierzchnia Wartości określona własne hesjanu przez funkcję ξ1 , ξ 2 A(u1 , u 2 ) paraboloida ξ1 > 0 eliptyczna ξ2 > 0 wypukła w dół ξ1 < 0 ξ2 < 0 ξ1 = 0 , ξ 2 ≥ 0 ξ1 ≥ 0 , ξ 2 = 0 ξ1 = 0 , ξ 2 ≤ 0 ξ1 ≤ 0 , ξ 2 = 0 paraboloida eliptyczna wypukła w górę walec paraboliczny wypukły w dół walec paraboliczny wypukły w górę nieokreślony Nie istnieje ekstremum ξ1 > 0 , ξ 2 < 0 ξ1 < 0 , ξ 2 > 0 paraboloida hiperboliczna Dla ustalenia typu formy A(u1 , u 2 ) nie zachodzi konieczność rozwiązywania równania charakterystycznego gdyż nie musimy znać dokładnie wartości własnych ξ1 , ξ 2 lecz tylko ich znaki. Można wykazać że jeżeli : 2 ⎛ ∂2 f ⎞ ⎛ ∂2 f ⎞ ⎛ ∂2 f ⎞ ⎛ ∂2 f ⎞ 2 ⎜ ⎟ ⎟ >0 a11a22 − a12 = ⎜ 2 ⎟ ⋅ ⎜ 2 ⎟ − ⎜⎜ I.1.) a11 = ⎜ 2 ⎟ > 0 oraz ⎜ ∂x ⎟ ⎜ ∂x ⎟ ∂x ∂x ⎟ ∂ x 1 2 ⎠ ⎝ 1 ⎠ ⎝ 2 ⎠ ⎝ ⎝ 1 ⎠ xˆ to forma kwadratowa A(u1 , u 2 ) jest dodatnio określona , ⎛ ∂2 f ⎞ ⎛ ∂2 f ⎞ ⎛ ∂2 f 2 = ⎜⎜ 2 ⎟⎟ ⋅ ⎜⎜ 2 I.2.) a11 = ⎜⎜ 2 ⎟⎟ < 0 oraz a11a22 − a12 ⎝ ∂x1 ⎠ xˆ ⎝ ∂x1 ⎠ ⎝ ∂x2 to forma kwadratowa A(u1 , u 2 ) jest ujemnie określona . 2 ⎞ ⎛ ∂2 f ⎞ ⎟−⎜ ⎟ ⎟ ⎜ ∂x ∂x ⎟ > 0 ⎠ ⎝ 1 2⎠ Warunek dostateczny istnienia ekstremum funkcji dwóch zmiennych Jeżeli funkcja f ( x1 , x2 ) ma ciągłe pochodne do rzędu drugiego włącznie w otoczeniu punktu stacjonarnego x̂ to w tym punkcie funkcja osiąga minimum silne gdy są spełnione warunki I.1. maksimum silne gdy są spełnione warunki I.2. Uwaga: Dotychczas mówiliśmy tylko o ekstremach lokalnych . Analogicznie jak w przypadkach funkcji jednej zmiennej sytuacja znacznie się upraszcza gdy dana funkcja jest wypukła w dół bądź wypukła w górę .Jeżeli tylko występuje odpowiednie ekstremum to jest ono jednocześnie ekstremum globalnym . Można wykazać że funkcja f ( x1 , x2 ) określona w przestrzeni R 2 jest funkcją ( ) a.) wypukłą w dół jeżeli dla wszystkich x ∈ R 2 hesjan ∇ 2 f xˆ jest dodatnio półokreślony , b.) wypukłą w górę jeżeli dla wszystkich x ∈ R 2 hesjan ∇ 2 f xˆ jest ujemnie półokreślony , c.) silnie wypukłą w dół jeżeli dla wszystkich x ∈ R 2 hesjan ∇ 2 f xˆ jest dodatnio określony , d.) silnie wypukłą w górę jeżeli dla wszystkich x ∈ R 2 hesjan ∇ 2 f xˆ jest ujemnie określony ( ) ( ) ( ) J./ Warunki dostateczne istnienia ekstremum niewłaściwego Jeżeli wszystkie punkty stacjonarne x̂ funkcji f ( x1 , x2 ) tworzą zbiór spójny Ĥ oraz w pewnym zbiorze H takim , że H ⊃ Hˆ wszystkie pochodne rzędu 1 1 drugiego funkcji f ( x1 , x2 ) są ciągłe to funkcja ta ma w zbiorze Ĥ : -minimum niewłaściwe lokalne , gdy hesjan jest dodatnio półokreślony dla x ∈ H1 , -maksimum niewłaściwe lokalne , gdy hesjan jest ujemnie półokreślony dla x ∈ H1 . Definicja : 3.3 Przez zbiór spójny rozumiemy taki zbiór punktów , że każde dwa dowolnie wybrane punkty z tego zbioru możemy połączyć taka krzywą ciągłą której wszystkie punkty należą do danego zbioru. Ekstrema funkcji cząstkowych wielu zmiennych o ciągłych pochodnych Postać hesjanu dla funkcji wielu zmiennych ⎡ ⎛ ∂2 f ⎞ ⎛ ∂2 f ⎞ ⎤ ⎛ ∂2 f ⎞ ⎟ ⎟ ⎜ ⎜ • • ⎢ ⎜⎜ 2 ⎟⎟ ⎜ ∂x ∂x ⎟ ⎥ ⎜ ∂x ∂x ⎟ x ∂ ⎢ ⎝ 1 ⎠ xˆ ⎝ 1 n ⎠ xˆ ⎥ ⎝ 1 2 ⎠ xˆ ⎥ (16) • • • • • ∇ 2 f xˆ = ⎢ 2 ⎢⎛ ∂ 2 f ⎞ ⎛ ∂ 2 f ⎞ ⎛∂ f ⎞ ⎥ ⎢⎜ ⎟ ⎜ ⎟ • • ⎜ 2 ⎟ ⎥ ⎜ ∂x ⎟ ⎥ ⎢⎜⎝ ∂x n ∂x1 ⎟⎠ xˆ ⎜⎝ ∂x n ∂x 2 ⎟⎠ xˆ ⎝ n ⎠ xˆ ⎦ ⎣ B./ Warunki dostateczne istnienia ekstremum funkcji f ( x1 x2 ) , x ∈ R N w jej punkcie stacjonarnym x̂ A./ ( ) ( 2 Istnienie i postać ekstremum Hesjan ∇ f Minimum Istnieje w Lokalne punkcie silne stacjonarnym dodatnio określony ) xˆ Wartości Powierzchnia własne hesjanu określona przez ξ1 , ξ 2 ,...., ξ n funkcję A paraboloida ξ1 > 0 eliptyczna ξ 2 > 0, ...., wypukła w dół ξn > 0 x̂ Maksimum Lokalne silne Minimum Może istnieć lokalne w otoczeniu niewłaściwe punktu stacjonarnego x̂ Maksimum Lokalne niewłaściwe ujemnie określony dodatnio półokreślony ujemnie półokreślony nieokreślony Nie istnieje ekstremum ξ1 < 0 paraboloida eliptyczna ξ 2 < 0,..., wypukła w ξn > 0 górę Jedna spośród walec paraboliczny wartości wypukły w dół własnych ξ1 ,...., ξ n = 0 a pozostałe są nieujemne Jedna spośród walec paraboliczny wartości wypukły w własnych górę ξ1 ,...., ξ n = 0 a pozostałe są niedodatnie co najmniej paraboloida jedna jest hiperboliczna dodatnia i co najmniej jedna ujemna Podobnie jak w przypadku N = 2 , aby stwierdzić rodzaj określoności bądź półokreśloności hesjanu , nie istnieje konieczność rozwiązywania równania charakterystycznego . Mianowicie przy badaniu określoności hesjanu (∇ 2 f )xˆ można skorzystać ze wzoru Sylwestra o określoności form kwadratowych. Aby z tego wzoru skorzystać , oznaczamy poszczególne podwyznaczniki hesjanu w następujący sposób : ⎛ ∂2 f ⎞ ⎟ ∆ 1 ( xˆ ) = ⎜⎜ ⎟ ⎝ ∂x1 ⎠ xˆ ⎡ ⎛ ∂2 f ⎞ ⎢ ⎜⎜ 2 ⎟⎟ ⎢ ∂x ∆ 2 ( xˆ ) = ⎢ ⎝ 2 1 ⎠ xˆ ⎞ ⎛ ⎢⎜ ∂ f ⎟ ⎜ ⎢⎝ ∂x1∂x 2 ⎟⎠ xˆ ⎣ • • • ⎛ ∂2 f ⎞ ⎤ ⎜ ⎟ ⎜ ∂x ∂x ⎟ ⎥ ⎝ 1 2 ⎠ xˆ ⎥ ⎛ ∂2 f ⎞ ⎥ ⎜ ⎟ ⎥ ⎜ ∂x 2 ⎟ ⎥ ⎝ 2 ⎠ xˆ ⎦ (17) ⎡ ⎛ ∂2 f ⎞ ⎢ ⎜⎜ 2 ⎟⎟ ⎢ ⎝ ∂x1 ⎠ xˆ • ∆ n ( xˆ ) = ⎢ ⎢⎛ ∂ 2 f ⎞ ⎢⎜ ⎟ ⎢⎜⎝ ∂x n ∂x1 ⎟⎠ xˆ ⎣ ⎛ ∂2 f ⎞ ⎟ ⎜ ⎜ ∂x ∂x ⎟ ⎝ 1 2 ⎠ xˆ • ⎛ ∂2 f ⎞ ⎜ ⎟ ⎜ ∂x ∂x ⎟ ⎝ n 2 ⎠ xˆ ⎛ ∂2 f ⎞ ⎤ ⎟ ⎥ • • ⎜⎜ ⎟ ⎝ ∂x1∂x n ⎠ xˆ ⎥ ⎥ • • • ⎛ ∂2 f ⎞ ⎥ • • ⎜⎜ 2 ⎟⎟ ⎥ ⎝ ∂x n ⎠ xˆ ⎥⎦ Wykorzystując podwyznaczniki ∆1 ( xˆ ) , ∆ 2 ( xˆ ) , .... , ∆ n ( xˆ ) na podstawie twierdzenia Sylwestra można sformułować warunki dostateczne istnienia ekstremum funkcji N zmiennych : Funkcja f ( x) , N zmiennych mająca ciągłe pochodne cząstkowe do rzędu drugiego włącznie w otoczeniu punktu stacjonarnego x̂ : 1.) ma w punkcie x̂ minimum lokalne silne , gdy ∆ n ( xˆ ) > 0 dla n = 1,.., N tj. gdy hesjan w punkcie x̂ jest dodatnio określony , 2.) ma w punkcie x̂ maksimum lokalne silne , gdy (−1) n ⋅ ∆ n ( xˆ ) > 0 dla n = 1,.., N tj. gdy hesjan w punkcie x̂ jest ujemnie określony, nie można rozstrzygnąć czy istnieje ekstremum w punkcie x̂ gdy : 3.) 3.1) ∆ n ( xˆ ) ≥ 0 dla n = 1,.., N − 1 , ∆ N ( xˆ ) = 0 (−1) n ⋅ ∆ n ( xˆ ) ≥ 0 dla n = 1,.., N − 1 3.2) , ∆ N ( xˆ ) = 0 4.) tj. gdy hesjan w punkcie x̂ jest dodatnio lub ujemnie półokreślony , nie ma w punkcie x̂ ekstremum gdy nie są spełnione warunki 3.1 lub 3.2 tj. gdy hesjan w punkcie x̂ nie jest określony . 3.4 Warunki optymalności programowania nieliniowego Niech będzie dane zadanie programowania nieliniowego (ZPN) o postaci : f ( x ) = min f ( x ) x∈ X 0 ⎧ x : g i ( x ) ≤ 0 , i = 1,.., u ⎫ X0 = ⎨ ⎬ ⎩ g i ( x ) = 0 , i = u + 1,.., m ⎭ gdzie : f : x = R n → R1 n gi : R → R f , gi 1 (17) jest funkcją kryterialną zadania są funkcjami przedstawiającymi ograniczenia są funkcjami różniczkowalnymi . Warunki Kuhna –Tuckera Dla zadania optymalizacji (17) sformułowanego powyżej warunki Kuhna-Tuckera przedstawiają się następująco : xˆ ∈ X 0 , czyli jest punktem dopuszczalnym , jeżeli 1.) istnieją λˆ i ≥ 0 , i = 1,.., u istnieją λˆ , i = 1 + u ,.., m ( mnożniki Lagrange’a) oraz o nieoznaczonym znaku takie , że : i 2.) ∇f ( xˆ ) + m ∑ λˆ ∇g ( xˆ ) i = 0 i oraz (18) i =1 λˆ i g i ( xˆ ) = 0, i = 1,.., u (19) 3.) Inna postać warunków Kuhna-Tuckera : Dla zadania programowania nieliniowego (1) utwórzmy funkcję Lagrange’a w postaci : L( x, λ) = f ( x ) + m ∑ λ g ( x) i i (20) i =1 Korzystając z (20) warunki konieczne można zapisać w postaci : ∇ x L( xˆ , λˆ) = 0 ∇ L( xˆ , λˆ) ≤ 0 λ λˆ , ∇ λ L( xˆ , λˆ) = 0 ∇x ∇λ λˆ ≥ 0 oznacza gradient funkcji Lagrange’a względem wektora x , oznacza gradient funkcji Lagrange’a względem wektora λ (21) (22) (23) (24) Jeżeli w zbiorze ograniczeń wyróżniono w sposób jawny ograniczenia na zmienne decyzyjne x ≥ 0 wówczas warunki Kuhna-Tuckera przyjmą postać : ∇ x L( xˆ , λˆ) ≥ 0 xˆ , ∇ L( xˆ , λˆ) = 0 (25) xˆ ≥ 0 ∇ λ L( xˆ , λˆ) ≤ 0 λˆ , ∇ λ L( xˆ , λˆ) = 0 (27) (28) x λˆ ≥ 0 gdzie funkcja Lagrange’a jest zdefiniowana jak poprzednio . (26) (29) (30)