Analiza matematyczna 2, cze sc szósta Wypada raz jeszcze wrócic

Transkrypt

Analiza matematyczna 2, cze֒ść szósta
Wypada raz jeszcze wrócić do ekstremów warunkowych. W przypadku ekstremów funkcji rozpatrywanych na zbiorach otwartych podaliśmy warunek wystarczaja֒cy na to, aby funkcja miala w
pewnym punkcie ekstremum lokalne. Zrobimy teraz to samo w przypadku funkcji rozpatrywanej na
zbiorze zdefiniowanym za pomoca֒ równań, określonej na wie֒kszym zbiorze otwartym, czyli podamy
warunek wystarczaja֒cy na to, by funkcja miala w pewnym punkcie lokalne ekstremum zwia֒zane
(warunkowe).
Twierdzenie o lokalnych ekstremach warunkowych, warunek dostateczny
Niech F : G −→ IRl be֒dzie odwzorowaniem klasy C 2 ze zbioru G otwartego w IRk+l zaś f : G −→ IR
– funkcja֒ klasy C 2 . Zalóżmy, że 0 ∈ IRl jest wartościa֒ regularna֒ odwzorowania F , tzn. że jeżeli
F (x) = 0 , to DF (x): IRk+l −→ IRl jest epimorfizmem. Niech p ∈ M = F −1 (0) be֒dzie takim
P
punktem, że istnieja֒ liczby λ1 , λ2 , . . . , λl takie, że grad f (p) = j λj grad Fj (p) . Niech L be֒dzie
P
funkcja֒ Lagrange’a, tzn. L(x) = f (x) − j λj Fj (x) . W tej sytuacji DL(p) = 0 i
a. jeżeli D2 L(p)v2 > 0 dla każdego wektora v ∈ Tp M ( D2 L(p) jest dodatnio określona na
przestrzeni stycznej w punkcie p do zbioru M ), to funkcja f|M ma lokalne minimum wlaściwe
w punkcie p ;
b. jeżeli D2 L(p)v2 < 0 dla każdego wektora v ∈ Tp M ( D2 L(p) jest ujemnie określona na
przestrzeni stycznej w punkcie p do zbioru M ), to funkcja f|M ma lokalne maksimum wlaściwe
w punkcie p ;
c. jeżeli D2 L(p)v2 > 0 > D2 L(p)w2 dla pewnych wektorów v, w ∈ Tp M , to funkcja f|M nie
ma lokalnego ekstremum w punkcie p .
Dowód.
Zauważmy, że L|M = f|M . Wobec tego możemy zajmować sie֒ w dalszym cia֒gu
funkcja֒ L . Z twierdzenia o funkcji uwiklanej wynika, że istnieje k –wymiarowe otoczenie U punktu
0 ∈ IRk i k + l –wymiarowe otoczenie V punktu p ∈ IRk+l i homeomorfizm ϕ zbioru U na
zbiór V ∩ M takie, że dla każdego x ∈ U różniczka Dϕ(x) jest monomorfizmem (wlożeniem) oraz
ϕ(0) = p . Zachodzi równość D(L ◦ ϕ) = DL ◦ ϕ · Dϕ i wobec tego
2
D2 (L ◦ ϕ)(x)v2 = D2 L(ϕ(x)) Dϕ(x)v + DL(ϕ(x)) D2 ϕ(x)v2 .
Dla x = 0 mamy wie֒c
D2 (L ◦ ϕ)(0)v2 = D2 L(ϕ(0)) Dϕ(0)v
2
+ DL(ϕ(0)) D2 ϕ(0)v2 =
2
2
= D2 L(p) Dϕ(0)v + DL(p) D2 ϕ(0)v2 = D2 L(p) Dϕ(0)v ,
bo L zdefiniowaliśmy tak, by DL(p) = 0. Teza wynika teraz od razu z twierdzenia o lokalnych
ekstremach zastosowanego do funkcji L ◦ ϕ określonej na zbiorze U otwartym w IRk .
Uwaga.
W twierdzeniu o lokalnych ekstremach warunkowych trzeba koniecznie rozpatrywać funkcje֒ La
grange’a L zamiast funkcji f , chociaż te dwie funkcje pokrywaja֒ sie֒ na zbiorze M. Niech F xy =
81
−x +
x
2
− 2y
2
tem w punkcie
T0 M = ker DF
, f
0
x
y
= x − y 2 . Mamy F
0
0
= 0 , grad F
0
0
=
jest spelniony warunek Lagrange’a dla funkcji
0
2
0
= xy : x = 0 . Mamy wie֒c D2 f 00 y0 =
0
−1
0
, grad f
0
0
=
1
0
, za-
f na zbiorze M = F −1 (0) .
−2y 2 , co sugeruje, że funkcja
4t2
f|M ma w punkcie 0 lokalne maksimum. To jednak nie jest prawda. Niech ϕ(t) = t+t
2 . Mamy
2
wie֒c, F (ϕ(t)) = −4t2 + 2t2 − 2t − 2t2 = 0 i Dϕ(0) = 01 , zatem ϕ parametryzuje pewne
2
otoczenie punktu 0 w M. Mamy również f (ϕ(t)) = 4t2 − t + t2 = 3t2 − 2t3 − t4 . Jasne jest
wie֒c, że funkcja f ◦ ϕ ma w punkcie 0 lokalne minimum wlaściwe, wie֒c również funkcja f|M ma
w punkcie 0 lokalne minimum wlaściwe. Przyczyna֒ tego pozornego paradoksu jest to, że wektory
postaci D2 ϕ(0)v2 nie musi nie musza֒ być styczne do M w punkcie p, wie֒c ich obrazy przy Df (0)
nie musza֒ być zerowe. W przypadku funkcji Lagrange’a ta kwestia nie wyste֒puje, bo jej różniczka
w punkcie p jest przeksztalceniem zerowym, funkcja Lagrange’a jest tak wlaśnie dobrana!
Zadanko.
Znaleźć lokalne ekstrema oraz oba kresy funkcji x2 + y 2 + z 2 na zbiorze zdefinio-
wanym równaniem x4 +
1 4
16 y
+
1 4
81 z
(H.Cartan).
Twierdzenie o niemal jednostajnej zbieżności
Zalóżmy, że zbiór G jest otwarty i spójny. Niech (fn ) be֒dzie cia֒giem funkcji klasy C 1 określonych
na G. Zalóżmy, że cia֒g (Dfn ) jest zbieżny jednostajnie na każdym zbiorze zwartym C ⊂ G do
pewnej funkcji g oraz że istnieje punkt p ∈ G taki, że cia֒g (fn (p)) jest zbieżny. Wtedy cia֒g
(fn ) jest zbieżny jednostajnie na każdym zbiorze zwartym do pewnej funkcji f ∈ C 1 (G) i zachodzi
równość Df = g.
Dowód. (szkic)
Jeśli C jest zbiorem zwartym wypuklym, to dowód tego twierdzenia jest powtórzeniem dowodu
podanego w zeszlym roku w przypadku funkcji jednej zmiennej określonych na przedziale z jedna֒
drobna֒ różnica֒: teraz twierdzenie o wartości średniej to nierówność, wie֒c trzeba dokonać kosmetycznych zmian w oszacowaniach, by pasowaly do wielowymiarowej wersji twierdzenia o wartości
średniej. Naste֒pnie należy skorzystać z tego, że każde dwa punkty zbioru otwartego i spójnego
można pola֒czyć lamana֒ w nim zawarta֒, taka֒ lamana֒ można pokryć skończona֒ liczba֒ kul otwartych,
których domknie֒cia sa֒ zawarte w zbiorze G , ponumerować je tak, by pierwsza zawierala punkt p ,
druga – przecinala pierwsza֒, trzecia – druga֒ itd. Naste֒pnie z tego, że twierdzenie jest prawdziwe
w przypadku zbioru zwartego wypuklego wywnioskować teze֒ dla dowolnej lamanej zawartej w G
zaczynaja֒cej sie֒ w punkcie p , a sta֒d już bez trudności da sie֒ uzyskać teze֒ twierdzenia.
Jest jasne, że jeśli zalożymy, że funkcje f1 , f2 , . . . sa֒ klasy C m oraz cia֒g (Dm fn ) jest jednostajnie zbieżny na każdym zbiorze zwartym zawartym w zbiorze G oraz że dla j = 0, 1, . . . , m − 1
cia֒g (Dj fn )(p) jest zbieżny w pewnym punkcie p ∈ G , to okaże sie֒, że cia֒g (fn ) jest jednostajnie
zbieżny na każdym zbiorze zwartym zawartym w G oraz że funkcja graniczna f jest klasy C m
i lim Dj fn = Dj f przy czym zbieżność jest jednostajna na zwartych podzbiorach zbioru G .
n→∞
82
Przypomnijmy, że na analizie I wykazaliśmy, ze funkcja α zdefiniowana wzorami α(t) = 0
dla t ≤ 0 i α(t) = e−1/t dla t > 0 jest funkcja֒ klasy C ∞ na calej prostej. Wynika sta֒d, że
funkcja β zdefiniowana wzorem α(1 − kxk2 ) jest klasy C ∞ na calej przestrzeni przy czym na kuli
otwartej B(0, 1) przyjmuje wartości dodatnie a poza kula֒ otwarta֒ B(0, 1) jest równa 0 . Zalóżmy,
że C ⊆ IRk jest zbiorem domknie֒tym. Niech G = IRk \ C . Zbiór G jest otwarty, wie֒c jest suma֒ kul
otwartych. Z tej rodziny kul można wybrać rodzine֒ przeliczalna֒ {B(pn , rn )} , której suma równa
P
n
jest G . Definiujemy funkcje֒ f (x) = n εn β x−p
, przy czym liczby dodatnie ε1 , ε2 , . . . sa֒ tak
rn
male, że εn supkDj (x)k ≤ 2−n dla j = 0, 1, . . . , n . Oczywiście oznacza to nalożenie na każda֒ z liczb
j,x
ε1 , ε2 , . . . skończenie wielu warunków, zatem można je tak dobrać, że postulowane nierówności be֒da֒
P
x−pn
j
zachodzić w calej przestrzeni. Oznacza to, że szeregi
sa֒ zbieżne jednostajnie w
n εn D β
rn
calej przestrzeni IRk dla j = 0, 1, 2, . . . . Wobec tego funkcja f jest klasy C ∞ . Jest ona dodatnia
poza zbiorem domknie֒tym C , a na zbiorze C jest tożsamościowo równa 0. Wykazaliśmy wie֒c
Twierdzenie o najpaskudniejszej poziomicy
Dla każdego zbioru domknie֒tego C istnieje funkcja f klasy C ∞ taka, że C = f −1 (0) .
Dodajmy, że wielu matematyków usiluje opisać poziomice „typowych” funkcji klasy C ∞ . Wiele
przypadków już opisano, ale jest wysoce prawdopodobne, że badania te jeszcze przez wiele lat be֒da֒
dostarczać rozrywki matematykom. Tematyka jest ważna również dzie֒ki temu, że osia֒gnie֒te wyniki
zazwyczaj znajduja֒ zastosowanie również poza matematyka֒.
Komentarze o lokalnych ekstremach warunkowych. ♣
Ten temat interesuje z różnych przyczyn ekonomistów. Omówimy teraz twierdzenie, które pojawia
sie֒ w ksia֒żce „Foundation of Economics Analysis”,1947, P.A.Samuelsona (nagroda Nobla z ekonomii, 1970) z ble֒dem poprawionym w 1952 w pracy G.Debreu (nagroda Nobla z ekonomii, 1983).
Twierdzenie nie jest specjalnie trudne, a informacje historyczne sluża֒ jedynie podkreśleniu jego wagi
w ekonomii, na której autor tego tekstu zna sie֒ tak jak wszyscy w RP (z wyja֒tkiem ekonomistów z
prawdziwego zdarzenia). Ten fragment tekstu oparty jest na pracy G.Debreu.
Zaczniemy od krótkiego przypomnienia najbardziej podstawowych wlasności form kwadratowych. Niech A = (ai,j ) be֒dzie macierza֒ symetryczna֒ wymiaru k , tzn. ai,j = aj,i . Wtedy funkcja
Q zdefiniowana wzorem Q(x) = Ax · x nazywana jest forma֒ kwadratowa֒. Niech x = Dy dla
pewnej macierzy nieosobliwej D ( D jest macierza֒ izomorfizmu). Wtedy Q(Dy) = ADy · Dy =
= DT ADy · yQ̃(y) też jest forma֒ kwadratowa֒, ale zmiennej y . Formy Q i Q̃ sa֒ równoważne – to
definicja.
W dalszym cia֒gu macierz A jest symetryczna. Funkcja Q na sferze jednostkowej osia֒ga swe
kresy. Niech m = inf |x|=1 Q(x) . Istnieje punkt p taki, że m = Q(p) i kpk = 1 . Na mocy twierdzenia
Lagrange’a o ekstremach warunkowych istnieje liczba λ taka, że grad Q(x) = λ grad (kxk2 ) = 2λx .
♣
Tego nie be֒dzie na wykladzie, ale studenci jednoczesnych studiów matematyczno–ekonomicznych powinni to przejrzeć,
moge֒ chcieć z nimi o tym pogadać.
83
Dzie֒ki symetrii macierzy A mamy też grad Q(x) = 2Ax . Wobec tego Ap = λp . Sta֒d wynika,
że m = Q(p) = Ap · p = λ . Wykazaliśmy wie֒c, że macierz A ma co najmniej jedna֒ wartość
wlasna֒ rzeczywista֒ oraz że najmniejsza wartość formy kwadratowej Q przyjmowana w punktach
sfery jednostkowej o środku w punkcie 0 jest jej wartościa֒ wlasna֒.
Zalóżmy teraz, że λ1 jest wartościa֒ wlasna֒ macierzy A a v1 jest odpowiadaja֒cym jej wektorem
wlasnym, tzn. Av1 = λ1 v1 , v1 6= 0 . Jeśli w jest wektorem prostopadlym do wektora v1 , to
zachodza֒ równości Aw · v1 = w · Av1 = w · (λ1 v1 ) = λ1 w · v1 = 0 , zatem również wektor
Aw jest prostopadly do wektora v1 . Niech V oznacza zbiór wszystkich wektorów prostopadlych
do wektora v1 . V jest podprzestrzenia֒ liniowa֒ wymiaru k − 1 , niezmiennicza֒ ze wzgle֒du na A :
w ∈ V ⇒ Aw ∈ V . Rozumuja֒c dokladnie tak jak w przypadku calej przestrzeni przekonujemy sie֒,
że przeksztalcenie liniowe A|V ma rzeczywista֒ wartość wlasna֒ λ2 , odpowiadaja֒cy jej wektor wlasny
v2 ∈ V jest oczywiście prostopadly do wektora v1 .
Teraz można zastosować to samo rozumowanie do zbioru zlożonego ze wszystkich wektorów
prostopadlych do obu wektorów v1 , v2 . Otrzymamy trzeci wektor wlasny prostopadly do v1 i do
v2 . Prowadzi do do bazy zlożonej z wzajemnie prostopadlych wektorów wlasnych. Wykazaliśmy
wie֒c, że wartości wlasne macierzy symetrycznej sa֒ rzeczywiste i że istnieje baza zlożona z wzajemnie
prostopadlych wektorów wlasnych, w szczególności macierz symetryczna jest diagonalizowalna. Niech
V+ , V0 i V− oznaczaja֒ podprzestrzenie liniowe niezmiennicze odpowiadaja֒ce wartościom dodatnim
wlasnym macierzy A , – zerowej wartości wlasnej macierzy A i wartościom ujemnym. Na V+ \ {0}
forma Q przyjmuje wartości dodatnie, na V0 jest tożsamościowo równa 0 , na V− \ {0} – wartości
ujemne.
W szczególności: macierz symetryczna A jest dodatnio określona wtedy i tylko wtedy, gdy jej
wszystkie jej wartości wlasne sa֒ dodatnie.
Zaste֒puja֒c forme֒ Q wyznaczona֒ przez macierz A równoważna֒ forma֒ Q̃ wyznaczona֒ przez
macierz DT AD , D – macierz o wyznaczniku 6= 0 , stwierdzamy, że wymiary analogicznie zdefiniowanych podprzestrzeni Ṽ+ , Ṽ0 i Ṽ− sa֒ takie same jak w przypadku macierzy A , chociaż wartości
wlasne moga֒ być inne – wynika to sta֒d, że V+ jest maksymalna֒ podprzestrzenia֒ liniowa֒, na której
forma Q jest dodatnio określona, V− – maksymalna֒ podprzestrzenia֒ liniowa֒ na której forma Q jest
ujemnie określona, zaś V0 – maksymalna֒ podprzestrzenia֒ liniowa֒, na której forma Q jest zerowa.
Zaste֒puja֒c macierz A macierza֒ DT AD mamy odpowiedni rozklad na podprzestrzenie D−1 V+ ,
D−1 V− i D−1 V0 , które moga֒ nie być niezmiennicze dla przeksztalcenia liniowego zdefiniowanego za
pomoca֒ macierzy DT AD . Oznacza to, że rozklad IRk na sume֒ prosta֒ podprzestrzeni Ṽ+ , Ṽ0 i Ṽ−
określonych jako podprzestrzenie, na których forma kwadratowa jest dodatnio określona, zerowa,
ujemnie określona nie jest jednoznaczny (konkretne przyklady ci studenci, którzy nie zdaja֒ sobie
sprawy z tego powinni wymyśleć sami – to bardzo proste).
Niech B = (bi,j ) be֒dzie macierza֒ kwadratowa֒ wymiaru k . Niech Br oznacza dla r = 1, 2, . . . , k
84
macierz wymiaru r znajduja֒ca֒ sie֒ w lewym górnym rogu macierzy B , np. B2 =
b1,1
b2,1
b1,2
,
b2,2
|B| oznacza wyznacznik macierzy kwadratowej B , |B0 | = 1 . Przez yr oznaczamy funkcje֒ liniowa֒
zmiennych xr , xr+1 , . . . , xk postaci xr + dr+1 xr+1 + · · · + dk xk .
Twierdzenie o postaci kanonicznej niektórych form kwadratowych
Niech A = (ai,j ) be֒dzie macierza֒ symetryczna֒ wymiaru k , tzn. ai,j = aj,i . W tej sytuacji wzór
Ax · x =
k
X
cr yr2 , cr 6= 0 zachodzi wtedy i tylko wtedy, gdy |Ar | =
6 0 dla r = 1, 2, . . . , k . Mamy
r=1
wtedy cr =
|Ar |
|Ar−1 |
Dowód.
.*
Jeśli forme֒ kwadratowa֒ Q(x) := Ax·x można zapisać w postaci
k
X
cr yr2 , cr 6= 0 , to
r=1
oczywiście a1,1 6= 0 , bo c1 6= 0 a zmienna x1 wyste֒puje tylko w y1 . Jeśli |A1 | = a1,1 6= 0 , to możemy
2
P
a
a
a
napisać Q(x) = ai,j xi xj = a1,1 x1 + a1,2
x2 + a1,3
x3 +· · ·+ a1,k
xk +Q2 (x2 , x3 , . . . , xk ) , gdzie przez
1,1
1,1
1,1
Q2 (x) oznaczyliśmy odpowiednia֒ forme֒ kwadratowa֒ zmiennych x2 , x3 , . . . , xk . Spróbujmy prze-
ksztalcić nasza forme֒ raz jeszcze, by zapisać ja֒ w postaci c1 y12 +c2 y22 +Q3 (x3 , . . . , xk ) . Zróżniczkujmy
P
stronami równość Q(x) =
ai,j xi xj = c1 y12 + c2 y22 + Q3 (x3 , . . . , xk ) wzgle֒dem x1 i wzgle֒dem
x2 . Otrzymujemy równości
1 ∂Q
2 ∂x1 (x)
=
Pk
∂y1
j=1 a1,j xj = c1 y1 ∂x1 oraz
1 ∂Q
2 ∂x2 (x)
=
k
X
a2,j xj =
j=1
∂y2
∂y1
+ c2 y2 ∂x
. Z wzoru y2 = x2 + d3 x3 + · · · + dk xk wynika, że
c1 y1 ∂x
2
2
∂y2
∂x2
= 1 . Niech y1 = 0 i x3 =
x4 = . . . = xk = 0 . Otrzymujemy wie֒c równania a1,1 x1 + a1,2 x2 = 0 i a2,1 x1 + a2,2 x2 = c2 x2 . Opisana równaniami y1 = 0 i x3 = x4 = . . . = xk = 0 podprzestrzeń ma oczywiście wymiar 1 . Wobec
tego uklad równań a1,1 x1 +a1,2 x2 = 0, a2,1 x1 +(a2,2 −c2 )x2 = ma niezerowe rozwia֒zanie, zatem jego
a1,1
a1,2 a1,1 a1,2 a1,1 0 −
= |A2 | − c2 |A1 | .
wyznacznik jest równy 0 , czyli 0 = =
a2,1 a2,2 − c2 a2,1 a2,2 a2,1 c2 Sta֒d wynika, że c2 =
|A2 |
|A1 |
, zatem przy zalożeniu, że |A1 | =
6 0 stwierdzamy, że c2 = 0 ⇔ |A2 | = 0 .
P
2
2
Kolej na c3 . Chcemy, by Q(x) = ai,j xi xj = c1 y1 + c2 y2 + c3 y32 + Q4 (x4 , x5 , . . . , xk ) . Różniczkuja֒c
te֒ równość stronami wzgle֒dem x1 , x2 , x3 otrzymujemy równości
X
1 ∂Q
∂y1
=
a1,j xj = c1 y1
2 ∂x1
∂x
1
j
X
1 ∂Q
∂y1
∂y2
=
a2,j xj = c1 y1
+ c2 y 2
2 ∂x2
∂x
∂x
2
2
j
X
1 ∂Q
∂y1
∂y2
∂y3
=
a3,j xj = c1 y1
+ c2 y 2
+ c3 y 3
2 ∂x3
∂x3
∂x3
∂x3
j
* To nie jest ogólne twierdzenie o postaci kanonicznej, bo przeksztalcenie, za pomoca֒ którego sprowadzamy forme֒ kwadratowa֒ do postaci kanonicznej, ma szczególna֒ postać, jasne jest też, że mowa jest jedynie o formach kwadratowych
niezdegenerowanych
85
Przyjmijmy teraz y1 = y2 = 0 , x4 = x5 = . . . = xk = 0 . Te równania definiuja֒ jednowymiarowa֒
podprzestrzeń liniowa֒ w IRk , zatem poniższy uklad równań (wiemy, że
∂y1
∂x3
=
∂y2
∂x3
= 0,
∂y3
∂x3
= 1)
a1,1 x1 + a1,2 x2 + a1,3 x3 = 0
a2,1 x1 + a2,2 x2 + a2,3 x3 = 0
a3,1 x1 + a3,2 x2 + a3,3 x3 = c3 x3
ma niezerowe rozwia֒zanie. Wobec tego jego wyznacznik równy jest 0 , czyli
a1,1
0 = a2,1
a3,1
a1,2
a2,2
a3,2
a1,3 a1,1
a2,3 = a2,1
a3,3 − c3 a3,1
a1,3 a1,1
a2,3 − a2,1
a3,3 a3,1
a1,2
a2,2
a3,2
a1,2
a2,2
a3,2
0 0 = |A3 | − c3 |A2 | .
c3 Podobnie jak poprzednio jest oczywiste, że c3 = 0 ⇔ |A3 | = 0 . Te֒ procedure֒ można kontynuować.
Dowód zostal zakończony.
Z twierdzenia tego wynika twierdzenie Sylvestera: macierz A jest dodatnio określona wtedy
i tylko wtedy, gdy wszystkie wyznaczniki |Ar | sa֒ dodatnie. Jasne jest też, że jest ujemnie określona
wtedy i tylko wtedy, gdy c1 , c2 , . . . , ck < 0 , czyli gdy |A1 | < 0 , |A2 | > 0 , |A3 | < 0 , |A4 | > 0 , . . .
Zbliżamy sie֒ do glównej cze֒ści tej opowieści. A jest w dalszym cia֒gu macierza֒ symetryczna֒,
ale od tej pory wymiaru k + l . Zakladamy też, że B jest macierza֒ o l wierszach i k + l kolumnach. Zajmować sie֒ be֒dziemy dodatnia֒ określonościa֒ formy kwadratowej Q , Q(x) = Ax · x ale
na podprzestrzeni M zdefiniowanej równaniem Bx = 0 , czyli ukladem l równań liniowych z k
niewiadomymi. Chodzi o to, by warunek typu Sylvestera wyrazić w terminach macierzy A i B .
Lemat 1.
Forma kwadratowa Q jest dodatnio określona na podprzestrzeni M wtedy i tylko wtedy, gdy istnieje
liczba λ taka, że dla każdego x 6= 0 zachodzi Q(x) + λBx · Bx > 0 .
Dowód.
Warunek jest oczywiście wystarczaja֒cy, bo jeśli x ∈ M , to 0 < Q(x) + λBx · Bx =
Q(x) . Wykażemy, że jest również konieczny. Zalóżmy wie֒c, że Q(x) > 0 dla każdego x takiego, że
Bx = 0 . Q jest funkcja֒ cia֒gla֒, wie֒c istnieje otoczenie U zbioru {x ∈ IRk+l :
kxk = 1, Bx = 0}
takie, że jeśli x ∈ U , to Q(x) > 0 . Funkcja cia֒gla określona zbiorze zwartym osia֒ga swe kresy, wie֒c
istnieje x0 takie, że kx0 k = 1 i Ax · x ≥ Ax0 · x0 dla każdego x , dla którego kxk = 1 . Z tego
samego powodu istnieje x1 takie, że kx1 k = 1 i Bx · Bx ≥ Bx1 · Bx1 > 0 dla każdego x ∈
/ U,
dla którego kxk = 1 . Teraz pozostaje wybrać λ > 0 tak duże, by λBx1 · Bx1 + Ax0 · x0 > 0 , co
oczywiście jest możliwe. Z określenia λ wynika od razu, że Q(x) + λBx · Bx > 0 : w U tak jest, bo
pierwszy skladnik jest dodatni, a drugi – nieujemny, poza U drugi skladnik majoryzuje pierwszy.
Wniosek
Forma Q jest dodatnio określona na podprzestrzeni M , wtedy i tylko wtedy, gdy istnieje liczba λ∗
taka, ze dla każdej liczby λ ≥ λ∗ o dla każdego x 6= 0 zachodzi nierówność Q(x) + λBx · Bx > 0 .
86
Lemat 2.
|A + λB T B| jest wielomianem zmiennej λ . którego wspólczynnik przy najwyższej pote֒dze zmiennej
T l
lA B (tzn. przy λ ) równy jest (−1) . (W tym miejscu 0l to macierz kwadratowa wymiaru l .)
B 0l Dowód.
Z oczywistej równości
A
B
λB T
−Il
Ik+l
B
0
Il
A + λB T B
=
0
λB T
−Il
wynika, że
A
B
λB T = (−1)l A + λB T B .
−Il
A
Trzeba wie֒c obliczyć wspólczynnik przy λl w wielomianie B
λB T . Ten wspólczynnik to wartość
−Il l –tej pochodnej tej funkcji podzielona przez l! . Pochodna֒ wyznacznika liczyć możemy np. zaste֒puja֒c
jedna֒ z k+2l kolumn kolumna֒ zlożona֒ z pochodnych funkcji wyste֒puja֒cych w tej kolumnie i sumuja֒c
tych k + 2l skladników, w rzeczywistości l skladników, bo w k + l kolumnach λ nie wyste֒puje.
Różniczkuja֒c po raz drugi otrzymamy z każdego z l skladników l − 1 skladników, bo teraz λ
wyste֒puje tylko w l − 1 kolumnach. W rezultacie po l różniczkowaniach otrzymamy l! skladników,
A BT . Dowód zostal zakończony.
każdy z nich równy B 0 Twierdzenie o dodatniej określoności formy kwadratowej na podprzestrzeni
Jeśli A jest macierza֒ symetryczna֒ wymiaru k + l , B macierza֒ o k + l kolumnach i l wierszach, | Bl | =
6 0 , to Ax · x > 0 dla każdego x takiego, że Bx = 0 wtedy i tylko wtedy, gdy
(Bl,r )T l Ar
(−1) > 0 dla l + 1 ≤ r ≤ k + l . ( Bl,r := (bi,j ) , gdzie 1 ≤ i ≤ l , 1 ≤ j ≤ r )
Bl,r
0 Dowód.
Wykażemy najpierw, że z dodatniej określoności na podprzestrzeni M zlożonej z
punktów x , dla których Bx = 0 wynika, że k wyznaczników to liczby dodatnie. Rozważmy dowolne
punkty x ∈ IRk+l , y ∈ IRl takie, że Ax+B T y = 0 i jednocześnie Bx = 0 . Wtedy zachodzi równość
0 = Ax·x+B T y·x = Ax·x+y·Bx = Ax·x . Wynika sta֒d, że x = 0 , zatem B T y = 0 , co w świetle
tego, że |Bl | =
6 0 , oznacza, że y = 0 . Wobec tego jedynym rozwia֒zaniem ukladu Ax + B T y = 0 ,
A BT 6= 0 . W taki sam sposób
Bx = 0 jest rozwia֒zanie zerowe, a sta֒d wnioskujemy, że B 0 Ar (Bl,r )T 6= 0 – rozpatrujemy po
wykazujemy, że dla r = l + 1, l + 2, . . . , l + k − 1 zachodzi Bl,r
0 prostu wektory x takie, że 0 = xr+1 = xr+2 = . . . = xk+l .
Z wniosku z lematu 1 wynika, że dla dostatecznie dużych liczb λ macierz A + λ · B T B jest
dodatnio określona. Z twierdzenia Sylvestera wynika, że dla r = 1, 2, . . . , k + l wyznaczniki macierzy
87
A + λB T B
r
= Ar + λ(Bl,r )T Bl,r musza֒ być dodatnie. Dla r = 1, 2, . . . , l macierz (Bl,r )T Bl,r jest
macierza֒ Grama ukladu r liniowo niezależnych wektorów: pierwszych r kolumn macierzy B . Dla
r = l + 1, l + 2, . . . , l + k wyznacznik Ar + λ · (Bl,r )T Bl,r jest dodatni dla dostatecznie dużych liczb
λ , a ponieważ jest to wielomian stopnia r − l , wie֒c wspólczynnik przy λr−l jest dodatni. Sta֒d i
(Bl,r )T l Ar
z lematu 2 wynika wie֒c, że (−1) > 0 . Zakończyliśmy dowód pierwszej implikacji.
Bl,r
0 Teraz zalożymy, że wyznaczniki maja֒ odpowiednie znaki i wykażemy, że forma zdefiniowana
macierza֒ A jest dodatnio określona na podprzestrzeni zdefiniowanej równaniem Bx = 0. Wystarczy
wykazać, że dla dostatecznie dużych λ macierz A + λB T B jest dodatnio określona. Wystarczy, na
mocy twierdzenia Sylvestera i lematu 1, wykazać, ze dla dostatecznie dużych liczb λ wyznaczniki
A + λB T B sa dodatnie dla r = 1, 2, . . . , k + l . Jest tak dla r = 1, 2, . . . , l , bo wtedy macierz
֒
r
B T B r jest dodatnio określona, wie֒c jej wyznacznik jest dodatni (macierz Grama ukladu r liniowo
niezależnych wektorów), zatem dla dostatecznie dużych λ > 0 wyznacznik macierzy A + λB T B r
też jest dodatni (wyznacznik jest funkcja֒ cia֒gla֒ macierzy). Dla r > l jest to po prostu zalożenie.
Dowód zostal zakończony.
88

Analiza matematyczna 2, cze sc szósta Wypada raz jeszcze wrócic

Transkrypt

Podobne dokumenty

1 + z2, y

Tomasz Downarowicz Instytut Matematyki i Informatyki Politechnika

Funkcje seria 0 0.1 Wielomian ca lkowitoliczbowy ax2 + bx + c daje

HADA GMINY OLAWA

Egzamin poprawkowy z algebry liniowej II 2008

Zadanie 11.1. Wiemy, ˙ze stopy zwrotu 3 akcji s a opisywane przez

Podstawy teorii decyzji

Kodowanie i kompresja 1 Kompresja stratna

Ekstrema lokalne funkcji wielu zmiennych