Analiza matematyczna 2, cze sc szósta Wypada raz jeszcze wrócic

Transkrypt

Analiza matematyczna 2, cze sc szósta Wypada raz jeszcze wrócic
Analiza matematyczna 2, cze֒ść szósta
Wypada raz jeszcze wrócić do ekstremów warunkowych. W przypadku ekstremów funkcji rozpatrywanych na zbiorach otwartych podaliśmy warunek wystarczaja֒cy na to, aby funkcja miala w
pewnym punkcie ekstremum lokalne. Zrobimy teraz to samo w przypadku funkcji rozpatrywanej na
zbiorze zdefiniowanym za pomoca֒ równań, określonej na wie֒kszym zbiorze otwartym, czyli podamy
warunek wystarczaja֒cy na to, by funkcja miala w pewnym punkcie lokalne ekstremum zwia֒zane
(warunkowe).
Twierdzenie o lokalnych ekstremach warunkowych, warunek dostateczny
Niech F : G −→ IRl be֒dzie odwzorowaniem klasy C 2 ze zbioru G otwartego w IRk+l zaś f : G −→ IR
– funkcja֒ klasy C 2 . Zalóżmy, że 0 ∈ IRl jest wartościa֒ regularna֒ odwzorowania F , tzn. że jeżeli
F (x) = 0 , to DF (x): IRk+l −→ IRl jest epimorfizmem. Niech p ∈ M = F −1 (0) be֒dzie takim
P
punktem, że istnieja֒ liczby λ1 , λ2 , . . . , λl takie, że grad f (p) = j λj grad Fj (p) . Niech L be֒dzie
P
funkcja֒ Lagrange’a, tzn. L(x) = f (x) − j λj Fj (x) . W tej sytuacji DL(p) = 0 i
a. jeżeli D2 L(p)v2 > 0 dla każdego wektora v ∈ Tp M ( D2 L(p) jest dodatnio określona na
przestrzeni stycznej w punkcie p do zbioru M ), to funkcja f|M ma lokalne minimum wlaściwe
w punkcie p ;
b. jeżeli D2 L(p)v2 < 0 dla każdego wektora v ∈ Tp M ( D2 L(p) jest ujemnie określona na
przestrzeni stycznej w punkcie p do zbioru M ), to funkcja f|M ma lokalne maksimum wlaściwe
w punkcie p ;
c. jeżeli D2 L(p)v2 > 0 > D2 L(p)w2 dla pewnych wektorów v, w ∈ Tp M , to funkcja f|M nie
ma lokalnego ekstremum w punkcie p .
Dowód.
Zauważmy, że L|M = f|M . Wobec tego możemy zajmować sie֒ w dalszym cia֒gu
funkcja֒ L . Z twierdzenia o funkcji uwiklanej wynika, że istnieje k –wymiarowe otoczenie U punktu
0 ∈ IRk i k + l –wymiarowe otoczenie V punktu p ∈ IRk+l i homeomorfizm ϕ zbioru U na
zbiór V ∩ M takie, że dla każdego x ∈ U różniczka Dϕ(x) jest monomorfizmem (wlożeniem) oraz
ϕ(0) = p . Zachodzi równość D(L ◦ ϕ) = DL ◦ ϕ · Dϕ i wobec tego
2
D2 (L ◦ ϕ)(x)v2 = D2 L(ϕ(x)) Dϕ(x)v + DL(ϕ(x)) D2 ϕ(x)v2 .
Dla x = 0 mamy wie֒c
D2 (L ◦ ϕ)(0)v2 = D2 L(ϕ(0)) Dϕ(0)v
2
+ DL(ϕ(0)) D2 ϕ(0)v2 =
2
2
= D2 L(p) Dϕ(0)v + DL(p) D2 ϕ(0)v2 = D2 L(p) Dϕ(0)v ,
bo L zdefiniowaliśmy tak, by DL(p) = 0. Teza wynika teraz od razu z twierdzenia o lokalnych
ekstremach zastosowanego do funkcji L ◦ ϕ określonej na zbiorze U otwartym w IRk .
Uwaga.
W twierdzeniu o lokalnych ekstremach warunkowych trzeba koniecznie rozpatrywać funkcje֒ La
grange’a L zamiast funkcji f , chociaż te dwie funkcje pokrywaja֒ sie֒ na zbiorze M. Niech F xy =
81
−x +
x
2
− 2y
2
tem w punkcie
T0 M = ker DF
, f
0
x
y
= x − y 2 . Mamy F
0
0
= 0 , grad F
0
0
=
jest spelniony warunek Lagrange’a dla funkcji
0
2
0
= xy : x = 0 . Mamy wie֒c D2 f 00 y0 =
0
−1
0
, grad f
0
0
=
1
0
, za-
f na zbiorze M = F −1 (0) .
−2y 2 , co sugeruje, że funkcja
4t2
f|M ma w punkcie 0 lokalne maksimum. To jednak nie jest prawda. Niech ϕ(t) = t+t
2 . Mamy
2
wie֒c, F (ϕ(t)) = −4t2 + 2t2 − 2t − 2t2 = 0 i Dϕ(0) = 01 , zatem ϕ parametryzuje pewne
2
otoczenie punktu 0 w M. Mamy również f (ϕ(t)) = 4t2 − t + t2 = 3t2 − 2t3 − t4 . Jasne jest
wie֒c, że funkcja f ◦ ϕ ma w punkcie 0 lokalne minimum wlaściwe, wie֒c również funkcja f|M ma
w punkcie 0 lokalne minimum wlaściwe. Przyczyna֒ tego pozornego paradoksu jest to, że wektory
postaci D2 ϕ(0)v2 nie musi nie musza֒ być styczne do M w punkcie p, wie֒c ich obrazy przy Df (0)
nie musza֒ być zerowe. W przypadku funkcji Lagrange’a ta kwestia nie wyste֒puje, bo jej różniczka
w punkcie p jest przeksztalceniem zerowym, funkcja Lagrange’a jest tak wlaśnie dobrana!
Zadanko.
Znaleźć lokalne ekstrema oraz oba kresy funkcji x2 + y 2 + z 2 na zbiorze zdefinio-
wanym równaniem x4 +
1 4
16 y
+
1 4
81 z
(H.Cartan).
Twierdzenie o niemal jednostajnej zbieżności
Zalóżmy, że zbiór G jest otwarty i spójny. Niech (fn ) be֒dzie cia֒giem funkcji klasy C 1 określonych
na G. Zalóżmy, że cia֒g (Dfn ) jest zbieżny jednostajnie na każdym zbiorze zwartym C ⊂ G do
pewnej funkcji g oraz że istnieje punkt p ∈ G taki, że cia֒g (fn (p)) jest zbieżny. Wtedy cia֒g
(fn ) jest zbieżny jednostajnie na każdym zbiorze zwartym do pewnej funkcji f ∈ C 1 (G) i zachodzi
równość Df = g.
Dowód. (szkic)
Jeśli C jest zbiorem zwartym wypuklym, to dowód tego twierdzenia jest powtórzeniem dowodu
podanego w zeszlym roku w przypadku funkcji jednej zmiennej określonych na przedziale z jedna֒
drobna֒ różnica֒: teraz twierdzenie o wartości średniej to nierówność, wie֒c trzeba dokonać kosmetycznych zmian w oszacowaniach, by pasowaly do wielowymiarowej wersji twierdzenia o wartości
średniej. Naste֒pnie należy skorzystać z tego, że każde dwa punkty zbioru otwartego i spójnego
można pola֒czyć lamana֒ w nim zawarta֒, taka֒ lamana֒ można pokryć skończona֒ liczba֒ kul otwartych,
których domknie֒cia sa֒ zawarte w zbiorze G , ponumerować je tak, by pierwsza zawierala punkt p ,
druga – przecinala pierwsza֒, trzecia – druga֒ itd. Naste֒pnie z tego, że twierdzenie jest prawdziwe
w przypadku zbioru zwartego wypuklego wywnioskować teze֒ dla dowolnej lamanej zawartej w G
zaczynaja֒cej sie֒ w punkcie p , a sta֒d już bez trudności da sie֒ uzyskać teze֒ twierdzenia.
Jest jasne, że jeśli zalożymy, że funkcje f1 , f2 , . . . sa֒ klasy C m oraz cia֒g (Dm fn ) jest jednostajnie zbieżny na każdym zbiorze zwartym zawartym w zbiorze G oraz że dla j = 0, 1, . . . , m − 1
cia֒g (Dj fn )(p) jest zbieżny w pewnym punkcie p ∈ G , to okaże sie֒, że cia֒g (fn ) jest jednostajnie
zbieżny na każdym zbiorze zwartym zawartym w G oraz że funkcja graniczna f jest klasy C m
i lim Dj fn = Dj f przy czym zbieżność jest jednostajna na zwartych podzbiorach zbioru G .
n→∞
82
Przypomnijmy, że na analizie I wykazaliśmy, ze funkcja α zdefiniowana wzorami α(t) = 0
dla t ≤ 0 i α(t) = e−1/t dla t > 0 jest funkcja֒ klasy C ∞ na calej prostej. Wynika sta֒d, że
funkcja β zdefiniowana wzorem α(1 − kxk2 ) jest klasy C ∞ na calej przestrzeni przy czym na kuli
otwartej B(0, 1) przyjmuje wartości dodatnie a poza kula֒ otwarta֒ B(0, 1) jest równa 0 . Zalóżmy,
że C ⊆ IRk jest zbiorem domknie֒tym. Niech G = IRk \ C . Zbiór G jest otwarty, wie֒c jest suma֒ kul
otwartych. Z tej rodziny kul można wybrać rodzine֒ przeliczalna֒ {B(pn , rn )} , której suma równa
P
n
jest G . Definiujemy funkcje֒ f (x) = n εn β x−p
, przy czym liczby dodatnie ε1 , ε2 , . . . sa֒ tak
rn
male, że εn supkDj (x)k ≤ 2−n dla j = 0, 1, . . . , n . Oczywiście oznacza to nalożenie na każda֒ z liczb
j,x
ε1 , ε2 , . . . skończenie wielu warunków, zatem można je tak dobrać, że postulowane nierówności be֒da֒
P
x−pn
j
zachodzić w calej przestrzeni. Oznacza to, że szeregi
sa֒ zbieżne jednostajnie w
n εn D β
rn
calej przestrzeni IRk dla j = 0, 1, 2, . . . . Wobec tego funkcja f jest klasy C ∞ . Jest ona dodatnia
poza zbiorem domknie֒tym C , a na zbiorze C jest tożsamościowo równa 0. Wykazaliśmy wie֒c
Twierdzenie o najpaskudniejszej poziomicy
Dla każdego zbioru domknie֒tego C istnieje funkcja f klasy C ∞ taka, że C = f −1 (0) .
Dodajmy, że wielu matematyków usiluje opisać poziomice „typowych” funkcji klasy C ∞ . Wiele
przypadków już opisano, ale jest wysoce prawdopodobne, że badania te jeszcze przez wiele lat be֒da֒
dostarczać rozrywki matematykom. Tematyka jest ważna również dzie֒ki temu, że osia֒gnie֒te wyniki
zazwyczaj znajduja֒ zastosowanie również poza matematyka֒.
Komentarze o lokalnych ekstremach warunkowych. ♣
Ten temat interesuje z różnych przyczyn ekonomistów. Omówimy teraz twierdzenie, które pojawia
sie֒ w ksia֒żce „Foundation of Economics Analysis”,1947, P.A.Samuelsona (nagroda Nobla z ekonomii, 1970) z ble֒dem poprawionym w 1952 w pracy G.Debreu (nagroda Nobla z ekonomii, 1983).
Twierdzenie nie jest specjalnie trudne, a informacje historyczne sluża֒ jedynie podkreśleniu jego wagi
w ekonomii, na której autor tego tekstu zna sie֒ tak jak wszyscy w RP (z wyja֒tkiem ekonomistów z
prawdziwego zdarzenia). Ten fragment tekstu oparty jest na pracy G.Debreu.
Zaczniemy od krótkiego przypomnienia najbardziej podstawowych wlasności form kwadratowych. Niech A = (ai,j ) be֒dzie macierza֒ symetryczna֒ wymiaru k , tzn. ai,j = aj,i . Wtedy funkcja
Q zdefiniowana wzorem Q(x) = Ax · x nazywana jest forma֒ kwadratowa֒. Niech x = Dy dla
pewnej macierzy nieosobliwej D ( D jest macierza֒ izomorfizmu). Wtedy Q(Dy) = ADy · Dy =
= DT ADy · yQ̃(y) też jest forma֒ kwadratowa֒, ale zmiennej y . Formy Q i Q̃ sa֒ równoważne – to
definicja.
W dalszym cia֒gu macierz A jest symetryczna. Funkcja Q na sferze jednostkowej osia֒ga swe
kresy. Niech m = inf |x|=1 Q(x) . Istnieje punkt p taki, że m = Q(p) i kpk = 1 . Na mocy twierdzenia
Lagrange’a o ekstremach warunkowych istnieje liczba λ taka, że grad Q(x) = λ grad (kxk2 ) = 2λx .
♣
Tego nie be֒dzie na wykladzie, ale studenci jednoczesnych studiów matematyczno–ekonomicznych powinni to przejrzeć,
moge֒ chcieć z nimi o tym pogadać.
83
Dzie֒ki symetrii macierzy A mamy też grad Q(x) = 2Ax . Wobec tego Ap = λp . Sta֒d wynika,
że m = Q(p) = Ap · p = λ . Wykazaliśmy wie֒c, że macierz A ma co najmniej jedna֒ wartość
wlasna֒ rzeczywista֒ oraz że najmniejsza wartość formy kwadratowej Q przyjmowana w punktach
sfery jednostkowej o środku w punkcie 0 jest jej wartościa֒ wlasna֒.
Zalóżmy teraz, że λ1 jest wartościa֒ wlasna֒ macierzy A a v1 jest odpowiadaja֒cym jej wektorem
wlasnym, tzn. Av1 = λ1 v1 , v1 6= 0 . Jeśli w jest wektorem prostopadlym do wektora v1 , to
zachodza֒ równości Aw · v1 = w · Av1 = w · (λ1 v1 ) = λ1 w · v1 = 0 , zatem również wektor
Aw jest prostopadly do wektora v1 . Niech V oznacza zbiór wszystkich wektorów prostopadlych
do wektora v1 . V jest podprzestrzenia֒ liniowa֒ wymiaru k − 1 , niezmiennicza֒ ze wzgle֒du na A :
w ∈ V ⇒ Aw ∈ V . Rozumuja֒c dokladnie tak jak w przypadku calej przestrzeni przekonujemy sie֒,
że przeksztalcenie liniowe A|V ma rzeczywista֒ wartość wlasna֒ λ2 , odpowiadaja֒cy jej wektor wlasny
v2 ∈ V jest oczywiście prostopadly do wektora v1 .
Teraz można zastosować to samo rozumowanie do zbioru zlożonego ze wszystkich wektorów
prostopadlych do obu wektorów v1 , v2 . Otrzymamy trzeci wektor wlasny prostopadly do v1 i do
v2 . Prowadzi do do bazy zlożonej z wzajemnie prostopadlych wektorów wlasnych. Wykazaliśmy
wie֒c, że wartości wlasne macierzy symetrycznej sa֒ rzeczywiste i że istnieje baza zlożona z wzajemnie
prostopadlych wektorów wlasnych, w szczególności macierz symetryczna jest diagonalizowalna. Niech
V+ , V0 i V− oznaczaja֒ podprzestrzenie liniowe niezmiennicze odpowiadaja֒ce wartościom dodatnim
wlasnym macierzy A , – zerowej wartości wlasnej macierzy A i wartościom ujemnym. Na V+ \ {0}
forma Q przyjmuje wartości dodatnie, na V0 jest tożsamościowo równa 0 , na V− \ {0} – wartości
ujemne.
W szczególności: macierz symetryczna A jest dodatnio określona wtedy i tylko wtedy, gdy jej
wszystkie jej wartości wlasne sa֒ dodatnie.
Zaste֒puja֒c forme֒ Q wyznaczona֒ przez macierz A równoważna֒ forma֒ Q̃ wyznaczona֒ przez
macierz DT AD , D – macierz o wyznaczniku 6= 0 , stwierdzamy, że wymiary analogicznie zdefiniowanych podprzestrzeni Ṽ+ , Ṽ0 i Ṽ− sa֒ takie same jak w przypadku macierzy A , chociaż wartości
wlasne moga֒ być inne – wynika to sta֒d, że V+ jest maksymalna֒ podprzestrzenia֒ liniowa֒, na której
forma Q jest dodatnio określona, V− – maksymalna֒ podprzestrzenia֒ liniowa֒ na której forma Q jest
ujemnie określona, zaś V0 – maksymalna֒ podprzestrzenia֒ liniowa֒, na której forma Q jest zerowa.
Zaste֒puja֒c macierz A macierza֒ DT AD mamy odpowiedni rozklad na podprzestrzenie D−1 V+ ,
D−1 V− i D−1 V0 , które moga֒ nie być niezmiennicze dla przeksztalcenia liniowego zdefiniowanego za
pomoca֒ macierzy DT AD . Oznacza to, że rozklad IRk na sume֒ prosta֒ podprzestrzeni Ṽ+ , Ṽ0 i Ṽ−
określonych jako podprzestrzenie, na których forma kwadratowa jest dodatnio określona, zerowa,
ujemnie określona nie jest jednoznaczny (konkretne przyklady ci studenci, którzy nie zdaja֒ sobie
sprawy z tego powinni wymyśleć sami – to bardzo proste).
Niech B = (bi,j ) be֒dzie macierza֒ kwadratowa֒ wymiaru k . Niech Br oznacza dla r = 1, 2, . . . , k
84
macierz wymiaru r znajduja֒ca֒ sie֒ w lewym górnym rogu macierzy B , np. B2 =
b1,1
b2,1
b1,2
,
b2,2
|B| oznacza wyznacznik macierzy kwadratowej B , |B0 | = 1 . Przez yr oznaczamy funkcje֒ liniowa֒
zmiennych xr , xr+1 , . . . , xk postaci xr + dr+1 xr+1 + · · · + dk xk .
Twierdzenie o postaci kanonicznej niektórych form kwadratowych
Niech A = (ai,j ) be֒dzie macierza֒ symetryczna֒ wymiaru k , tzn. ai,j = aj,i . W tej sytuacji wzór
Ax · x =
k
X
cr yr2 , cr 6= 0 zachodzi wtedy i tylko wtedy, gdy |Ar | =
6 0 dla r = 1, 2, . . . , k . Mamy
r=1
wtedy cr =
|Ar |
|Ar−1 |
Dowód.
.*
Jeśli forme֒ kwadratowa֒ Q(x) := Ax·x można zapisać w postaci
k
X
cr yr2 , cr 6= 0 , to
r=1
oczywiście a1,1 6= 0 , bo c1 6= 0 a zmienna x1 wyste֒puje tylko w y1 . Jeśli |A1 | = a1,1 6= 0 , to możemy
2
P
a
a
a
napisać Q(x) = ai,j xi xj = a1,1 x1 + a1,2
x2 + a1,3
x3 +· · ·+ a1,k
xk +Q2 (x2 , x3 , . . . , xk ) , gdzie przez
1,1
1,1
1,1
Q2 (x) oznaczyliśmy odpowiednia֒ forme֒ kwadratowa֒ zmiennych x2 , x3 , . . . , xk . Spróbujmy prze-
ksztalcić nasza forme֒ raz jeszcze, by zapisać ja֒ w postaci c1 y12 +c2 y22 +Q3 (x3 , . . . , xk ) . Zróżniczkujmy
P
stronami równość Q(x) =
ai,j xi xj = c1 y12 + c2 y22 + Q3 (x3 , . . . , xk ) wzgle֒dem x1 i wzgle֒dem
x2 . Otrzymujemy równości
1 ∂Q
2 ∂x1 (x)
=
Pk
∂y1
j=1 a1,j xj = c1 y1 ∂x1 oraz
1 ∂Q
2 ∂x2 (x)
=
k
X
a2,j xj =
j=1
∂y2
∂y1
+ c2 y2 ∂x
. Z wzoru y2 = x2 + d3 x3 + · · · + dk xk wynika, że
c1 y1 ∂x
2
2
∂y2
∂x2
= 1 . Niech y1 = 0 i x3 =
x4 = . . . = xk = 0 . Otrzymujemy wie֒c równania a1,1 x1 + a1,2 x2 = 0 i a2,1 x1 + a2,2 x2 = c2 x2 . Opisana równaniami y1 = 0 i x3 = x4 = . . . = xk = 0 podprzestrzeń ma oczywiście wymiar 1 . Wobec
tego uklad równań a1,1 x1 +a1,2 x2 = 0, a2,1 x1 +(a2,2 −c2 )x2 = ma niezerowe rozwia֒zanie, zatem jego
a1,1
a1,2 a1,1 a1,2 a1,1 0 −
= |A2 | − c2 |A1 | .
wyznacznik jest równy 0 , czyli 0 = =
a2,1 a2,2 − c2 a2,1 a2,2 a2,1 c2 Sta֒d wynika, że c2 =
|A2 |
|A1 |
, zatem przy zalożeniu, że |A1 | =
6 0 stwierdzamy, że c2 = 0 ⇔ |A2 | = 0 .
P
2
2
Kolej na c3 . Chcemy, by Q(x) = ai,j xi xj = c1 y1 + c2 y2 + c3 y32 + Q4 (x4 , x5 , . . . , xk ) . Różniczkuja֒c
te֒ równość stronami wzgle֒dem x1 , x2 , x3 otrzymujemy równości
X
1 ∂Q
∂y1
=
a1,j xj = c1 y1
2 ∂x1
∂x
1
j
X
1 ∂Q
∂y1
∂y2
=
a2,j xj = c1 y1
+ c2 y 2
2 ∂x2
∂x
∂x
2
2
j
X
1 ∂Q
∂y1
∂y2
∂y3
=
a3,j xj = c1 y1
+ c2 y 2
+ c3 y 3
2 ∂x3
∂x3
∂x3
∂x3
j
* To nie jest ogólne twierdzenie o postaci kanonicznej, bo przeksztalcenie, za pomoca֒ którego sprowadzamy forme֒ kwadratowa֒ do postaci kanonicznej, ma szczególna֒ postać, jasne jest też, że mowa jest jedynie o formach kwadratowych
niezdegenerowanych
85
Przyjmijmy teraz y1 = y2 = 0 , x4 = x5 = . . . = xk = 0 . Te równania definiuja֒ jednowymiarowa֒
podprzestrzeń liniowa֒ w IRk , zatem poniższy uklad równań (wiemy, że
∂y1
∂x3
=
∂y2
∂x3
= 0,
∂y3
∂x3
= 1)
a1,1 x1 + a1,2 x2 + a1,3 x3 = 0
a2,1 x1 + a2,2 x2 + a2,3 x3 = 0
a3,1 x1 + a3,2 x2 + a3,3 x3 = c3 x3
ma niezerowe rozwia֒zanie. Wobec tego jego wyznacznik równy jest 0 , czyli
a1,1
0 = a2,1
a3,1
a1,2
a2,2
a3,2
a1,3 a1,1
a2,3 = a2,1
a3,3 − c3 a3,1
a1,3 a1,1
a2,3 − a2,1
a3,3 a3,1
a1,2
a2,2
a3,2
a1,2
a2,2
a3,2
0 0 = |A3 | − c3 |A2 | .
c3 Podobnie jak poprzednio jest oczywiste, że c3 = 0 ⇔ |A3 | = 0 . Te֒ procedure֒ można kontynuować.
Dowód zostal zakończony.
Z twierdzenia tego wynika twierdzenie Sylvestera: macierz A jest dodatnio określona wtedy
i tylko wtedy, gdy wszystkie wyznaczniki |Ar | sa֒ dodatnie. Jasne jest też, że jest ujemnie określona
wtedy i tylko wtedy, gdy c1 , c2 , . . . , ck < 0 , czyli gdy |A1 | < 0 , |A2 | > 0 , |A3 | < 0 , |A4 | > 0 , . . .
Zbliżamy sie֒ do glównej cze֒ści tej opowieści. A jest w dalszym cia֒gu macierza֒ symetryczna֒,
ale od tej pory wymiaru k + l . Zakladamy też, że B jest macierza֒ o l wierszach i k + l kolumnach. Zajmować sie֒ be֒dziemy dodatnia֒ określonościa֒ formy kwadratowej Q , Q(x) = Ax · x ale
na podprzestrzeni M zdefiniowanej równaniem Bx = 0 , czyli ukladem l równań liniowych z k
niewiadomymi. Chodzi o to, by warunek typu Sylvestera wyrazić w terminach macierzy A i B .
Lemat 1.
Forma kwadratowa Q jest dodatnio określona na podprzestrzeni M wtedy i tylko wtedy, gdy istnieje
liczba λ taka, że dla każdego x 6= 0 zachodzi Q(x) + λBx · Bx > 0 .
Dowód.
Warunek jest oczywiście wystarczaja֒cy, bo jeśli x ∈ M , to 0 < Q(x) + λBx · Bx =
Q(x) . Wykażemy, że jest również konieczny. Zalóżmy wie֒c, że Q(x) > 0 dla każdego x takiego, że
Bx = 0 . Q jest funkcja֒ cia֒gla֒, wie֒c istnieje otoczenie U zbioru {x ∈ IRk+l :
kxk = 1, Bx = 0}
takie, że jeśli x ∈ U , to Q(x) > 0 . Funkcja cia֒gla określona zbiorze zwartym osia֒ga swe kresy, wie֒c
istnieje x0 takie, że kx0 k = 1 i Ax · x ≥ Ax0 · x0 dla każdego x , dla którego kxk = 1 . Z tego
samego powodu istnieje x1 takie, że kx1 k = 1 i Bx · Bx ≥ Bx1 · Bx1 > 0 dla każdego x ∈
/ U,
dla którego kxk = 1 . Teraz pozostaje wybrać λ > 0 tak duże, by λBx1 · Bx1 + Ax0 · x0 > 0 , co
oczywiście jest możliwe. Z określenia λ wynika od razu, że Q(x) + λBx · Bx > 0 : w U tak jest, bo
pierwszy skladnik jest dodatni, a drugi – nieujemny, poza U drugi skladnik majoryzuje pierwszy.
Wniosek
Forma Q jest dodatnio określona na podprzestrzeni M , wtedy i tylko wtedy, gdy istnieje liczba λ∗
taka, ze dla każdej liczby λ ≥ λ∗ o dla każdego x 6= 0 zachodzi nierówność Q(x) + λBx · Bx > 0 .
86
Lemat 2.
|A + λB T B| jest wielomianem zmiennej λ . którego wspólczynnik przy najwyższej pote֒dze zmiennej
T l
lA B (tzn. przy λ ) równy jest (−1) . (W tym miejscu 0l to macierz kwadratowa wymiaru l .)
B 0l Dowód.
Z oczywistej równości
A
B
λB T
−Il
Ik+l
B
0
Il
A + λB T B
=
0
λB T
−Il
wynika, że
A
B
λB T = (−1)l A + λB T B .
−Il
A
Trzeba wie֒c obliczyć wspólczynnik przy λl w wielomianie B
λB T . Ten wspólczynnik to wartość
−Il l –tej pochodnej tej funkcji podzielona przez l! . Pochodna֒ wyznacznika liczyć możemy np. zaste֒puja֒c
jedna֒ z k+2l kolumn kolumna֒ zlożona֒ z pochodnych funkcji wyste֒puja֒cych w tej kolumnie i sumuja֒c
tych k + 2l skladników, w rzeczywistości l skladników, bo w k + l kolumnach λ nie wyste֒puje.
Różniczkuja֒c po raz drugi otrzymamy z każdego z l skladników l − 1 skladników, bo teraz λ
wyste֒puje tylko w l − 1 kolumnach. W rezultacie po l różniczkowaniach otrzymamy l! skladników,
A BT . Dowód zostal zakończony.
każdy z nich równy B 0 Twierdzenie o dodatniej określoności formy kwadratowej na podprzestrzeni
Jeśli A jest macierza֒ symetryczna֒ wymiaru k + l , B macierza֒ o k + l kolumnach i l wierszach, | Bl | =
6 0 , to Ax · x > 0 dla każdego x takiego, że Bx = 0 wtedy i tylko wtedy, gdy
(Bl,r )T l Ar
(−1) > 0 dla l + 1 ≤ r ≤ k + l . ( Bl,r := (bi,j ) , gdzie 1 ≤ i ≤ l , 1 ≤ j ≤ r )
Bl,r
0 Dowód.
Wykażemy najpierw, że z dodatniej określoności na podprzestrzeni M zlożonej z
punktów x , dla których Bx = 0 wynika, że k wyznaczników to liczby dodatnie. Rozważmy dowolne
punkty x ∈ IRk+l , y ∈ IRl takie, że Ax+B T y = 0 i jednocześnie Bx = 0 . Wtedy zachodzi równość
0 = Ax·x+B T y·x = Ax·x+y·Bx = Ax·x . Wynika sta֒d, że x = 0 , zatem B T y = 0 , co w świetle
tego, że |Bl | =
6 0 , oznacza, że y = 0 . Wobec tego jedynym rozwia֒zaniem ukladu Ax + B T y = 0 ,
A BT 6= 0 . W taki sam sposób
Bx = 0 jest rozwia֒zanie zerowe, a sta֒d wnioskujemy, że B 0 Ar (Bl,r )T 6= 0 – rozpatrujemy po
wykazujemy, że dla r = l + 1, l + 2, . . . , l + k − 1 zachodzi Bl,r
0 prostu wektory x takie, że 0 = xr+1 = xr+2 = . . . = xk+l .
Z wniosku z lematu 1 wynika, że dla dostatecznie dużych liczb λ macierz A + λ · B T B jest
dodatnio określona. Z twierdzenia Sylvestera wynika, że dla r = 1, 2, . . . , k + l wyznaczniki macierzy
87
A + λB T B
r
= Ar + λ(Bl,r )T Bl,r musza֒ być dodatnie. Dla r = 1, 2, . . . , l macierz (Bl,r )T Bl,r jest
macierza֒ Grama ukladu r liniowo niezależnych wektorów: pierwszych r kolumn macierzy B . Dla
r = l + 1, l + 2, . . . , l + k wyznacznik Ar + λ · (Bl,r )T Bl,r jest dodatni dla dostatecznie dużych liczb
λ , a ponieważ jest to wielomian stopnia r − l , wie֒c wspólczynnik przy λr−l jest dodatni. Sta֒d i
(Bl,r )T l Ar
z lematu 2 wynika wie֒c, że (−1) > 0 . Zakończyliśmy dowód pierwszej implikacji.
Bl,r
0 Teraz zalożymy, że wyznaczniki maja֒ odpowiednie znaki i wykażemy, że forma zdefiniowana
macierza֒ A jest dodatnio określona na podprzestrzeni zdefiniowanej równaniem Bx = 0. Wystarczy
wykazać, że dla dostatecznie dużych λ macierz A + λB T B jest dodatnio określona. Wystarczy, na
mocy twierdzenia Sylvestera i lematu 1, wykazać, ze dla dostatecznie dużych liczb λ wyznaczniki
A + λB T B sa dodatnie dla r = 1, 2, . . . , k + l . Jest tak dla r = 1, 2, . . . , l , bo wtedy macierz
֒
r
B T B r jest dodatnio określona, wie֒c jej wyznacznik jest dodatni (macierz Grama ukladu r liniowo
niezależnych wektorów), zatem dla dostatecznie dużych λ > 0 wyznacznik macierzy A + λB T B r
też jest dodatni (wyznacznik jest funkcja֒ cia֒gla֒ macierzy). Dla r > l jest to po prostu zalożenie.
Dowód zostal zakończony.
88