7 Forma liniowa i kwadratowa

Transkrypt

7 Forma liniowa i kwadratowa
WYKŁAD 7
FORMY LINIOWA I KWADRATOWA
DEFINICJA. Formą liniową L(x) nazywamy wyrażenie
(7.1)
gdzie a, x są wektorami N-wymiarowymi
DEFINICJA. Formą kwadratową Q(x) nazywamy wyrażenie
(7.2)
w którym macierz kwadratowa [H] o rozmiarze N⨉N, nazywana macierzą Hesse’go lub
krótko
Hesjanem,
jest
macierzą
drugich
pochodnych
liczoną
względem
i,j-tych
współrzędnych wektora x
(7.3)
Jeżeli forma kwadratowa Q(x) jest większa od zera dla dowolnego x, to mówimy, że macierz
[H] jest dodatnio określona.
Funkcja kwadratowa wielu zmiennych fQ(x) jest sumą formy liniowej L(x) oraz formy
kwadratowej Q(x)
(7.4)
Funkcję tę można przedstawić w postaci
(7.5)
gdzie wektor b jest gradientem funkcji fQ w punkcie x0
(7.6)
Wzór (7.6) jest nazywany rozwinięciem Taylora funkcji N zmiennych w otoczeniu punktu x0
z dokładnością do wyrazów zawierających drugie pochodne. W elementarnym przypadku
funkcji jednej zmiennej wyrażenie to redukuje się oczywiście do postaci
(7.7)
1
Funkcja kwadratowa fQ(x) jest dobrym przybliżeniem dowolnej funkcji f(x) w otoczeniu
ekstremum x0, co pokazano na rys.7.1. dla funkcji jednej zmiennej.
f
fQ(x)
f (x)
x
x0
Fig.7.1. Aproksymacja dowolnej funkcji za pomocą paraboli
Dla funkcji ciągłych i dwukrotnie różniczkowalnych warunkiem koniecznym wystąpienia
ekstremum w punkcie x0 jest zerowanie gradientu tej funkcji w tym punkcie. Nie jest to
wystarczające – aby badana funkcja posiadała minimum (maksimum) jej hesjan musi być
dodatnio (ujemnie) określony. Dla ilustracji rozpatrzmy dwie funkcje dwóch zmiennych:
Wyznaczając hesjany tych funkcji uzyskuje się
Widać, że gradienty obydwu funkcji osiągają zerową wartość w punkcie x=(0,0), natomiast
forma kwadratowa 〈x,[Hf]x〉 przyjmuje zarówno wartości dodatnie jak i ujemnie:
W drugim przypadku dla dowolnego (x1, x2) forma 〈x,[Hg]x〉 jest dodatnia (za wyjątkiem
punktu (0,0), w którym musi być równa zeru). Oznacza to, że w tym punkcie występuje
minimum. Pierwszy przypadek, kiedy w punkcie zerowania się gradientu dla kierunku
0x1 mamy minimum, a dla kierunku 0x2 maksimum, jest określany mianem punktu
siodłowego. Wykresy obydwu funkcji pokazano poniżej.
2
f
x2
x2
x1
a.
g
x2
x1
Rys.7.4. Wpływ postaci hesjanu na kształt funkcji, dla której gradient w punkcie x0 jest równy zeru
a. funkcja posiada punkt siodłowy, hesjan nie jest określony,
b. funkcja posiada minimum, hesjan jest dodatnio określony.
3
Występowanie minimum przy jednoczesnym spełnieniu warunku dodatniej określoności
hesjanu [H] i zerowania się gradientu funkcji b(x0) wynika również wprost ze wzoru (7.5).
Mamy bowiem w takim przypadku
(7.8)
dla dowolnego x.
Ważną własnością funkcji kwadratowej wielu zmiennych jest możliwość wyznaczenia
punktu minimum x0 na podstawie znajomości gradientu funkcji w dowolnym, innym jej
punkcie x. Gradient fQ(x) jest równy
(7.9)
a ponadto wiemy, że w nieznanym punkcie x0 występuje minimum
(7.10)
Odejmując stronami (7.9)(7.10) otrzymuje się
(7.11)
Otrzymaliśmy układ równań liniowych z N niewiadomymi - przyrostów (x-x0), który można
bądź rozwiązać wybraną metodą algebry liniowej, bądź obliczyć macierz odwrotną [H]-1.
Otrzymuje się w wyniku prostą zależność
(7.12)
Zależność ta oznacza, że kierunek d=[H]-1
fQ(x) poprowadzony w punkcie x przechodzi
przez minimum.
x
-[H]-1 fQ(x)
fQ(x)
x0
x2
x1
Rys.7.5. Znajdowanie minimum funkcji kwadratowej dwóch zmiennych.
4