Analiza matematyczna 2, cze sc szósta Wypada raz jeszcze wrócic
Transkrypt
Analiza matematyczna 2, cze sc szósta Wypada raz jeszcze wrócic
Analiza matematyczna 2, cze֒ść szósta Wypada raz jeszcze wrócić do ekstremów warunkowych. W przypadku ekstremów funkcji rozpatrywanych na zbiorach otwartych podaliśmy warunek wystarczaja֒cy na to, aby funkcja miala w pewnym punkcie ekstremum lokalne. Zrobimy teraz to samo w przypadku funkcji rozpatrywanej na zbiorze zdefiniowanym za pomoca֒ równań, określonej na wie֒kszym zbiorze otwartym, czyli podamy warunek wystarczaja֒cy na to, by funkcja miala w pewnym punkcie lokalne ekstremum zwia֒zane (warunkowe). Twierdzenie o lokalnych ekstremach warunkowych, warunek dostateczny Niech F : G −→ IRl be֒dzie odwzorowaniem klasy C 2 ze zbioru G otwartego w IRk+l zaś f : G −→ IR – funkcja֒ klasy C 2 . Zalóżmy, że 0 ∈ IRl jest wartościa֒ regularna֒ odwzorowania F , tzn. że jeżeli F (x) = 0 , to DF (x): IRk+l −→ IRl jest epimorfizmem. Niech p ∈ M = F −1 (0) be֒dzie takim P punktem, że istnieja֒ liczby λ1 , λ2 , . . . , λl takie, że grad f (p) = j λj grad Fj (p) . Niech L be֒dzie P funkcja֒ Lagrange’a, tzn. L(x) = f (x) − j λj Fj (x) . W tej sytuacji DL(p) = 0 i a. jeżeli D2 L(p)v2 > 0 dla każdego wektora v ∈ Tp M ( D2 L(p) jest dodatnio określona na przestrzeni stycznej w punkcie p do zbioru M ), to funkcja f|M ma lokalne minimum wlaściwe w punkcie p ; b. jeżeli D2 L(p)v2 < 0 dla każdego wektora v ∈ Tp M ( D2 L(p) jest ujemnie określona na przestrzeni stycznej w punkcie p do zbioru M ), to funkcja f|M ma lokalne maksimum wlaściwe w punkcie p ; c. jeżeli D2 L(p)v2 > 0 > D2 L(p)w2 dla pewnych wektorów v, w ∈ Tp M , to funkcja f|M nie ma lokalnego ekstremum w punkcie p . Dowód. Zauważmy, że L|M = f|M . Wobec tego możemy zajmować sie֒ w dalszym cia֒gu funkcja֒ L . Z twierdzenia o funkcji uwiklanej wynika, że istnieje k –wymiarowe otoczenie U punktu 0 ∈ IRk i k + l –wymiarowe otoczenie V punktu p ∈ IRk+l i homeomorfizm ϕ zbioru U na zbiór V ∩ M takie, że dla każdego x ∈ U różniczka Dϕ(x) jest monomorfizmem (wlożeniem) oraz ϕ(0) = p . Zachodzi równość D(L ◦ ϕ) = DL ◦ ϕ · Dϕ i wobec tego 2 D2 (L ◦ ϕ)(x)v2 = D2 L(ϕ(x)) Dϕ(x)v + DL(ϕ(x)) D2 ϕ(x)v2 . Dla x = 0 mamy wie֒c D2 (L ◦ ϕ)(0)v2 = D2 L(ϕ(0)) Dϕ(0)v 2 + DL(ϕ(0)) D2 ϕ(0)v2 = 2 2 = D2 L(p) Dϕ(0)v + DL(p) D2 ϕ(0)v2 = D2 L(p) Dϕ(0)v , bo L zdefiniowaliśmy tak, by DL(p) = 0. Teza wynika teraz od razu z twierdzenia o lokalnych ekstremach zastosowanego do funkcji L ◦ ϕ określonej na zbiorze U otwartym w IRk . Uwaga. W twierdzeniu o lokalnych ekstremach warunkowych trzeba koniecznie rozpatrywać funkcje֒ La grange’a L zamiast funkcji f , chociaż te dwie funkcje pokrywaja֒ sie֒ na zbiorze M. Niech F xy = 81 −x + x 2 − 2y 2 tem w punkcie T0 M = ker DF , f 0 x y = x − y 2 . Mamy F 0 0 = 0 , grad F 0 0 = jest spelniony warunek Lagrange’a dla funkcji 0 2 0 = xy : x = 0 . Mamy wie֒c D2 f 00 y0 = 0 −1 0 , grad f 0 0 = 1 0 , za- f na zbiorze M = F −1 (0) . −2y 2 , co sugeruje, że funkcja 4t2 f|M ma w punkcie 0 lokalne maksimum. To jednak nie jest prawda. Niech ϕ(t) = t+t 2 . Mamy 2 wie֒c, F (ϕ(t)) = −4t2 + 2t2 − 2t − 2t2 = 0 i Dϕ(0) = 01 , zatem ϕ parametryzuje pewne 2 otoczenie punktu 0 w M. Mamy również f (ϕ(t)) = 4t2 − t + t2 = 3t2 − 2t3 − t4 . Jasne jest wie֒c, że funkcja f ◦ ϕ ma w punkcie 0 lokalne minimum wlaściwe, wie֒c również funkcja f|M ma w punkcie 0 lokalne minimum wlaściwe. Przyczyna֒ tego pozornego paradoksu jest to, że wektory postaci D2 ϕ(0)v2 nie musi nie musza֒ być styczne do M w punkcie p, wie֒c ich obrazy przy Df (0) nie musza֒ być zerowe. W przypadku funkcji Lagrange’a ta kwestia nie wyste֒puje, bo jej różniczka w punkcie p jest przeksztalceniem zerowym, funkcja Lagrange’a jest tak wlaśnie dobrana! Zadanko. Znaleźć lokalne ekstrema oraz oba kresy funkcji x2 + y 2 + z 2 na zbiorze zdefinio- wanym równaniem x4 + 1 4 16 y + 1 4 81 z (H.Cartan). Twierdzenie o niemal jednostajnej zbieżności Zalóżmy, że zbiór G jest otwarty i spójny. Niech (fn ) be֒dzie cia֒giem funkcji klasy C 1 określonych na G. Zalóżmy, że cia֒g (Dfn ) jest zbieżny jednostajnie na każdym zbiorze zwartym C ⊂ G do pewnej funkcji g oraz że istnieje punkt p ∈ G taki, że cia֒g (fn (p)) jest zbieżny. Wtedy cia֒g (fn ) jest zbieżny jednostajnie na każdym zbiorze zwartym do pewnej funkcji f ∈ C 1 (G) i zachodzi równość Df = g. Dowód. (szkic) Jeśli C jest zbiorem zwartym wypuklym, to dowód tego twierdzenia jest powtórzeniem dowodu podanego w zeszlym roku w przypadku funkcji jednej zmiennej określonych na przedziale z jedna֒ drobna֒ różnica֒: teraz twierdzenie o wartości średniej to nierówność, wie֒c trzeba dokonać kosmetycznych zmian w oszacowaniach, by pasowaly do wielowymiarowej wersji twierdzenia o wartości średniej. Naste֒pnie należy skorzystać z tego, że każde dwa punkty zbioru otwartego i spójnego można pola֒czyć lamana֒ w nim zawarta֒, taka֒ lamana֒ można pokryć skończona֒ liczba֒ kul otwartych, których domknie֒cia sa֒ zawarte w zbiorze G , ponumerować je tak, by pierwsza zawierala punkt p , druga – przecinala pierwsza֒, trzecia – druga֒ itd. Naste֒pnie z tego, że twierdzenie jest prawdziwe w przypadku zbioru zwartego wypuklego wywnioskować teze֒ dla dowolnej lamanej zawartej w G zaczynaja֒cej sie֒ w punkcie p , a sta֒d już bez trudności da sie֒ uzyskać teze֒ twierdzenia. Jest jasne, że jeśli zalożymy, że funkcje f1 , f2 , . . . sa֒ klasy C m oraz cia֒g (Dm fn ) jest jednostajnie zbieżny na każdym zbiorze zwartym zawartym w zbiorze G oraz że dla j = 0, 1, . . . , m − 1 cia֒g (Dj fn )(p) jest zbieżny w pewnym punkcie p ∈ G , to okaże sie֒, że cia֒g (fn ) jest jednostajnie zbieżny na każdym zbiorze zwartym zawartym w G oraz że funkcja graniczna f jest klasy C m i lim Dj fn = Dj f przy czym zbieżność jest jednostajna na zwartych podzbiorach zbioru G . n→∞ 82 Przypomnijmy, że na analizie I wykazaliśmy, ze funkcja α zdefiniowana wzorami α(t) = 0 dla t ≤ 0 i α(t) = e−1/t dla t > 0 jest funkcja֒ klasy C ∞ na calej prostej. Wynika sta֒d, że funkcja β zdefiniowana wzorem α(1 − kxk2 ) jest klasy C ∞ na calej przestrzeni przy czym na kuli otwartej B(0, 1) przyjmuje wartości dodatnie a poza kula֒ otwarta֒ B(0, 1) jest równa 0 . Zalóżmy, że C ⊆ IRk jest zbiorem domknie֒tym. Niech G = IRk \ C . Zbiór G jest otwarty, wie֒c jest suma֒ kul otwartych. Z tej rodziny kul można wybrać rodzine֒ przeliczalna֒ {B(pn , rn )} , której suma równa P n jest G . Definiujemy funkcje֒ f (x) = n εn β x−p , przy czym liczby dodatnie ε1 , ε2 , . . . sa֒ tak rn male, że εn supkDj (x)k ≤ 2−n dla j = 0, 1, . . . , n . Oczywiście oznacza to nalożenie na każda֒ z liczb j,x ε1 , ε2 , . . . skończenie wielu warunków, zatem można je tak dobrać, że postulowane nierówności be֒da֒ P x−pn j zachodzić w calej przestrzeni. Oznacza to, że szeregi sa֒ zbieżne jednostajnie w n εn D β rn calej przestrzeni IRk dla j = 0, 1, 2, . . . . Wobec tego funkcja f jest klasy C ∞ . Jest ona dodatnia poza zbiorem domknie֒tym C , a na zbiorze C jest tożsamościowo równa 0. Wykazaliśmy wie֒c Twierdzenie o najpaskudniejszej poziomicy Dla każdego zbioru domknie֒tego C istnieje funkcja f klasy C ∞ taka, że C = f −1 (0) . Dodajmy, że wielu matematyków usiluje opisać poziomice „typowych” funkcji klasy C ∞ . Wiele przypadków już opisano, ale jest wysoce prawdopodobne, że badania te jeszcze przez wiele lat be֒da֒ dostarczać rozrywki matematykom. Tematyka jest ważna również dzie֒ki temu, że osia֒gnie֒te wyniki zazwyczaj znajduja֒ zastosowanie również poza matematyka֒. Komentarze o lokalnych ekstremach warunkowych. ♣ Ten temat interesuje z różnych przyczyn ekonomistów. Omówimy teraz twierdzenie, które pojawia sie֒ w ksia֒żce „Foundation of Economics Analysis”,1947, P.A.Samuelsona (nagroda Nobla z ekonomii, 1970) z ble֒dem poprawionym w 1952 w pracy G.Debreu (nagroda Nobla z ekonomii, 1983). Twierdzenie nie jest specjalnie trudne, a informacje historyczne sluża֒ jedynie podkreśleniu jego wagi w ekonomii, na której autor tego tekstu zna sie֒ tak jak wszyscy w RP (z wyja֒tkiem ekonomistów z prawdziwego zdarzenia). Ten fragment tekstu oparty jest na pracy G.Debreu. Zaczniemy od krótkiego przypomnienia najbardziej podstawowych wlasności form kwadratowych. Niech A = (ai,j ) be֒dzie macierza֒ symetryczna֒ wymiaru k , tzn. ai,j = aj,i . Wtedy funkcja Q zdefiniowana wzorem Q(x) = Ax · x nazywana jest forma֒ kwadratowa֒. Niech x = Dy dla pewnej macierzy nieosobliwej D ( D jest macierza֒ izomorfizmu). Wtedy Q(Dy) = ADy · Dy = = DT ADy · yQ̃(y) też jest forma֒ kwadratowa֒, ale zmiennej y . Formy Q i Q̃ sa֒ równoważne – to definicja. W dalszym cia֒gu macierz A jest symetryczna. Funkcja Q na sferze jednostkowej osia֒ga swe kresy. Niech m = inf |x|=1 Q(x) . Istnieje punkt p taki, że m = Q(p) i kpk = 1 . Na mocy twierdzenia Lagrange’a o ekstremach warunkowych istnieje liczba λ taka, że grad Q(x) = λ grad (kxk2 ) = 2λx . ♣ Tego nie be֒dzie na wykladzie, ale studenci jednoczesnych studiów matematyczno–ekonomicznych powinni to przejrzeć, moge֒ chcieć z nimi o tym pogadać. 83 Dzie֒ki symetrii macierzy A mamy też grad Q(x) = 2Ax . Wobec tego Ap = λp . Sta֒d wynika, że m = Q(p) = Ap · p = λ . Wykazaliśmy wie֒c, że macierz A ma co najmniej jedna֒ wartość wlasna֒ rzeczywista֒ oraz że najmniejsza wartość formy kwadratowej Q przyjmowana w punktach sfery jednostkowej o środku w punkcie 0 jest jej wartościa֒ wlasna֒. Zalóżmy teraz, że λ1 jest wartościa֒ wlasna֒ macierzy A a v1 jest odpowiadaja֒cym jej wektorem wlasnym, tzn. Av1 = λ1 v1 , v1 6= 0 . Jeśli w jest wektorem prostopadlym do wektora v1 , to zachodza֒ równości Aw · v1 = w · Av1 = w · (λ1 v1 ) = λ1 w · v1 = 0 , zatem również wektor Aw jest prostopadly do wektora v1 . Niech V oznacza zbiór wszystkich wektorów prostopadlych do wektora v1 . V jest podprzestrzenia֒ liniowa֒ wymiaru k − 1 , niezmiennicza֒ ze wzgle֒du na A : w ∈ V ⇒ Aw ∈ V . Rozumuja֒c dokladnie tak jak w przypadku calej przestrzeni przekonujemy sie֒, że przeksztalcenie liniowe A|V ma rzeczywista֒ wartość wlasna֒ λ2 , odpowiadaja֒cy jej wektor wlasny v2 ∈ V jest oczywiście prostopadly do wektora v1 . Teraz można zastosować to samo rozumowanie do zbioru zlożonego ze wszystkich wektorów prostopadlych do obu wektorów v1 , v2 . Otrzymamy trzeci wektor wlasny prostopadly do v1 i do v2 . Prowadzi do do bazy zlożonej z wzajemnie prostopadlych wektorów wlasnych. Wykazaliśmy wie֒c, że wartości wlasne macierzy symetrycznej sa֒ rzeczywiste i że istnieje baza zlożona z wzajemnie prostopadlych wektorów wlasnych, w szczególności macierz symetryczna jest diagonalizowalna. Niech V+ , V0 i V− oznaczaja֒ podprzestrzenie liniowe niezmiennicze odpowiadaja֒ce wartościom dodatnim wlasnym macierzy A , – zerowej wartości wlasnej macierzy A i wartościom ujemnym. Na V+ \ {0} forma Q przyjmuje wartości dodatnie, na V0 jest tożsamościowo równa 0 , na V− \ {0} – wartości ujemne. W szczególności: macierz symetryczna A jest dodatnio określona wtedy i tylko wtedy, gdy jej wszystkie jej wartości wlasne sa֒ dodatnie. Zaste֒puja֒c forme֒ Q wyznaczona֒ przez macierz A równoważna֒ forma֒ Q̃ wyznaczona֒ przez macierz DT AD , D – macierz o wyznaczniku 6= 0 , stwierdzamy, że wymiary analogicznie zdefiniowanych podprzestrzeni Ṽ+ , Ṽ0 i Ṽ− sa֒ takie same jak w przypadku macierzy A , chociaż wartości wlasne moga֒ być inne – wynika to sta֒d, że V+ jest maksymalna֒ podprzestrzenia֒ liniowa֒, na której forma Q jest dodatnio określona, V− – maksymalna֒ podprzestrzenia֒ liniowa֒ na której forma Q jest ujemnie określona, zaś V0 – maksymalna֒ podprzestrzenia֒ liniowa֒, na której forma Q jest zerowa. Zaste֒puja֒c macierz A macierza֒ DT AD mamy odpowiedni rozklad na podprzestrzenie D−1 V+ , D−1 V− i D−1 V0 , które moga֒ nie być niezmiennicze dla przeksztalcenia liniowego zdefiniowanego za pomoca֒ macierzy DT AD . Oznacza to, że rozklad IRk na sume֒ prosta֒ podprzestrzeni Ṽ+ , Ṽ0 i Ṽ− określonych jako podprzestrzenie, na których forma kwadratowa jest dodatnio określona, zerowa, ujemnie określona nie jest jednoznaczny (konkretne przyklady ci studenci, którzy nie zdaja֒ sobie sprawy z tego powinni wymyśleć sami – to bardzo proste). Niech B = (bi,j ) be֒dzie macierza֒ kwadratowa֒ wymiaru k . Niech Br oznacza dla r = 1, 2, . . . , k 84 macierz wymiaru r znajduja֒ca֒ sie֒ w lewym górnym rogu macierzy B , np. B2 = b1,1 b2,1 b1,2 , b2,2 |B| oznacza wyznacznik macierzy kwadratowej B , |B0 | = 1 . Przez yr oznaczamy funkcje֒ liniowa֒ zmiennych xr , xr+1 , . . . , xk postaci xr + dr+1 xr+1 + · · · + dk xk . Twierdzenie o postaci kanonicznej niektórych form kwadratowych Niech A = (ai,j ) be֒dzie macierza֒ symetryczna֒ wymiaru k , tzn. ai,j = aj,i . W tej sytuacji wzór Ax · x = k X cr yr2 , cr 6= 0 zachodzi wtedy i tylko wtedy, gdy |Ar | = 6 0 dla r = 1, 2, . . . , k . Mamy r=1 wtedy cr = |Ar | |Ar−1 | Dowód. .* Jeśli forme֒ kwadratowa֒ Q(x) := Ax·x można zapisać w postaci k X cr yr2 , cr 6= 0 , to r=1 oczywiście a1,1 6= 0 , bo c1 6= 0 a zmienna x1 wyste֒puje tylko w y1 . Jeśli |A1 | = a1,1 6= 0 , to możemy 2 P a a a napisać Q(x) = ai,j xi xj = a1,1 x1 + a1,2 x2 + a1,3 x3 +· · ·+ a1,k xk +Q2 (x2 , x3 , . . . , xk ) , gdzie przez 1,1 1,1 1,1 Q2 (x) oznaczyliśmy odpowiednia֒ forme֒ kwadratowa֒ zmiennych x2 , x3 , . . . , xk . Spróbujmy prze- ksztalcić nasza forme֒ raz jeszcze, by zapisać ja֒ w postaci c1 y12 +c2 y22 +Q3 (x3 , . . . , xk ) . Zróżniczkujmy P stronami równość Q(x) = ai,j xi xj = c1 y12 + c2 y22 + Q3 (x3 , . . . , xk ) wzgle֒dem x1 i wzgle֒dem x2 . Otrzymujemy równości 1 ∂Q 2 ∂x1 (x) = Pk ∂y1 j=1 a1,j xj = c1 y1 ∂x1 oraz 1 ∂Q 2 ∂x2 (x) = k X a2,j xj = j=1 ∂y2 ∂y1 + c2 y2 ∂x . Z wzoru y2 = x2 + d3 x3 + · · · + dk xk wynika, że c1 y1 ∂x 2 2 ∂y2 ∂x2 = 1 . Niech y1 = 0 i x3 = x4 = . . . = xk = 0 . Otrzymujemy wie֒c równania a1,1 x1 + a1,2 x2 = 0 i a2,1 x1 + a2,2 x2 = c2 x2 . Opisana równaniami y1 = 0 i x3 = x4 = . . . = xk = 0 podprzestrzeń ma oczywiście wymiar 1 . Wobec tego uklad równań a1,1 x1 +a1,2 x2 = 0, a2,1 x1 +(a2,2 −c2 )x2 = ma niezerowe rozwia֒zanie, zatem jego a1,1 a1,2 a1,1 a1,2 a1,1 0 − = |A2 | − c2 |A1 | . wyznacznik jest równy 0 , czyli 0 = = a2,1 a2,2 − c2 a2,1 a2,2 a2,1 c2 Sta֒d wynika, że c2 = |A2 | |A1 | , zatem przy zalożeniu, że |A1 | = 6 0 stwierdzamy, że c2 = 0 ⇔ |A2 | = 0 . P 2 2 Kolej na c3 . Chcemy, by Q(x) = ai,j xi xj = c1 y1 + c2 y2 + c3 y32 + Q4 (x4 , x5 , . . . , xk ) . Różniczkuja֒c te֒ równość stronami wzgle֒dem x1 , x2 , x3 otrzymujemy równości X 1 ∂Q ∂y1 = a1,j xj = c1 y1 2 ∂x1 ∂x 1 j X 1 ∂Q ∂y1 ∂y2 = a2,j xj = c1 y1 + c2 y 2 2 ∂x2 ∂x ∂x 2 2 j X 1 ∂Q ∂y1 ∂y2 ∂y3 = a3,j xj = c1 y1 + c2 y 2 + c3 y 3 2 ∂x3 ∂x3 ∂x3 ∂x3 j * To nie jest ogólne twierdzenie o postaci kanonicznej, bo przeksztalcenie, za pomoca֒ którego sprowadzamy forme֒ kwadratowa֒ do postaci kanonicznej, ma szczególna֒ postać, jasne jest też, że mowa jest jedynie o formach kwadratowych niezdegenerowanych 85 Przyjmijmy teraz y1 = y2 = 0 , x4 = x5 = . . . = xk = 0 . Te równania definiuja֒ jednowymiarowa֒ podprzestrzeń liniowa֒ w IRk , zatem poniższy uklad równań (wiemy, że ∂y1 ∂x3 = ∂y2 ∂x3 = 0, ∂y3 ∂x3 = 1) a1,1 x1 + a1,2 x2 + a1,3 x3 = 0 a2,1 x1 + a2,2 x2 + a2,3 x3 = 0 a3,1 x1 + a3,2 x2 + a3,3 x3 = c3 x3 ma niezerowe rozwia֒zanie. Wobec tego jego wyznacznik równy jest 0 , czyli a1,1 0 = a2,1 a3,1 a1,2 a2,2 a3,2 a1,3 a1,1 a2,3 = a2,1 a3,3 − c3 a3,1 a1,3 a1,1 a2,3 − a2,1 a3,3 a3,1 a1,2 a2,2 a3,2 a1,2 a2,2 a3,2 0 0 = |A3 | − c3 |A2 | . c3 Podobnie jak poprzednio jest oczywiste, że c3 = 0 ⇔ |A3 | = 0 . Te֒ procedure֒ można kontynuować. Dowód zostal zakończony. Z twierdzenia tego wynika twierdzenie Sylvestera: macierz A jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie wyznaczniki |Ar | sa֒ dodatnie. Jasne jest też, że jest ujemnie określona wtedy i tylko wtedy, gdy c1 , c2 , . . . , ck < 0 , czyli gdy |A1 | < 0 , |A2 | > 0 , |A3 | < 0 , |A4 | > 0 , . . . Zbliżamy sie֒ do glównej cze֒ści tej opowieści. A jest w dalszym cia֒gu macierza֒ symetryczna֒, ale od tej pory wymiaru k + l . Zakladamy też, że B jest macierza֒ o l wierszach i k + l kolumnach. Zajmować sie֒ be֒dziemy dodatnia֒ określonościa֒ formy kwadratowej Q , Q(x) = Ax · x ale na podprzestrzeni M zdefiniowanej równaniem Bx = 0 , czyli ukladem l równań liniowych z k niewiadomymi. Chodzi o to, by warunek typu Sylvestera wyrazić w terminach macierzy A i B . Lemat 1. Forma kwadratowa Q jest dodatnio określona na podprzestrzeni M wtedy i tylko wtedy, gdy istnieje liczba λ taka, że dla każdego x 6= 0 zachodzi Q(x) + λBx · Bx > 0 . Dowód. Warunek jest oczywiście wystarczaja֒cy, bo jeśli x ∈ M , to 0 < Q(x) + λBx · Bx = Q(x) . Wykażemy, że jest również konieczny. Zalóżmy wie֒c, że Q(x) > 0 dla każdego x takiego, że Bx = 0 . Q jest funkcja֒ cia֒gla֒, wie֒c istnieje otoczenie U zbioru {x ∈ IRk+l : kxk = 1, Bx = 0} takie, że jeśli x ∈ U , to Q(x) > 0 . Funkcja cia֒gla określona zbiorze zwartym osia֒ga swe kresy, wie֒c istnieje x0 takie, że kx0 k = 1 i Ax · x ≥ Ax0 · x0 dla każdego x , dla którego kxk = 1 . Z tego samego powodu istnieje x1 takie, że kx1 k = 1 i Bx · Bx ≥ Bx1 · Bx1 > 0 dla każdego x ∈ / U, dla którego kxk = 1 . Teraz pozostaje wybrać λ > 0 tak duże, by λBx1 · Bx1 + Ax0 · x0 > 0 , co oczywiście jest możliwe. Z określenia λ wynika od razu, że Q(x) + λBx · Bx > 0 : w U tak jest, bo pierwszy skladnik jest dodatni, a drugi – nieujemny, poza U drugi skladnik majoryzuje pierwszy. Wniosek Forma Q jest dodatnio określona na podprzestrzeni M , wtedy i tylko wtedy, gdy istnieje liczba λ∗ taka, ze dla każdej liczby λ ≥ λ∗ o dla każdego x 6= 0 zachodzi nierówność Q(x) + λBx · Bx > 0 . 86 Lemat 2. |A + λB T B| jest wielomianem zmiennej λ . którego wspólczynnik przy najwyższej pote֒dze zmiennej T l lA B (tzn. przy λ ) równy jest (−1) . (W tym miejscu 0l to macierz kwadratowa wymiaru l .) B 0l Dowód. Z oczywistej równości A B λB T −Il Ik+l B 0 Il A + λB T B = 0 λB T −Il wynika, że A B λB T = (−1)l A + λB T B . −Il A Trzeba wie֒c obliczyć wspólczynnik przy λl w wielomianie B λB T . Ten wspólczynnik to wartość −Il l –tej pochodnej tej funkcji podzielona przez l! . Pochodna֒ wyznacznika liczyć możemy np. zaste֒puja֒c jedna֒ z k+2l kolumn kolumna֒ zlożona֒ z pochodnych funkcji wyste֒puja֒cych w tej kolumnie i sumuja֒c tych k + 2l skladników, w rzeczywistości l skladników, bo w k + l kolumnach λ nie wyste֒puje. Różniczkuja֒c po raz drugi otrzymamy z każdego z l skladników l − 1 skladników, bo teraz λ wyste֒puje tylko w l − 1 kolumnach. W rezultacie po l różniczkowaniach otrzymamy l! skladników, A BT . Dowód zostal zakończony. każdy z nich równy B 0 Twierdzenie o dodatniej określoności formy kwadratowej na podprzestrzeni Jeśli A jest macierza֒ symetryczna֒ wymiaru k + l , B macierza֒ o k + l kolumnach i l wierszach, | Bl | = 6 0 , to Ax · x > 0 dla każdego x takiego, że Bx = 0 wtedy i tylko wtedy, gdy (Bl,r )T l Ar (−1) > 0 dla l + 1 ≤ r ≤ k + l . ( Bl,r := (bi,j ) , gdzie 1 ≤ i ≤ l , 1 ≤ j ≤ r ) Bl,r 0 Dowód. Wykażemy najpierw, że z dodatniej określoności na podprzestrzeni M zlożonej z punktów x , dla których Bx = 0 wynika, że k wyznaczników to liczby dodatnie. Rozważmy dowolne punkty x ∈ IRk+l , y ∈ IRl takie, że Ax+B T y = 0 i jednocześnie Bx = 0 . Wtedy zachodzi równość 0 = Ax·x+B T y·x = Ax·x+y·Bx = Ax·x . Wynika sta֒d, że x = 0 , zatem B T y = 0 , co w świetle tego, że |Bl | = 6 0 , oznacza, że y = 0 . Wobec tego jedynym rozwia֒zaniem ukladu Ax + B T y = 0 , A BT 6= 0 . W taki sam sposób Bx = 0 jest rozwia֒zanie zerowe, a sta֒d wnioskujemy, że B 0 Ar (Bl,r )T 6= 0 – rozpatrujemy po wykazujemy, że dla r = l + 1, l + 2, . . . , l + k − 1 zachodzi Bl,r 0 prostu wektory x takie, że 0 = xr+1 = xr+2 = . . . = xk+l . Z wniosku z lematu 1 wynika, że dla dostatecznie dużych liczb λ macierz A + λ · B T B jest dodatnio określona. Z twierdzenia Sylvestera wynika, że dla r = 1, 2, . . . , k + l wyznaczniki macierzy 87 A + λB T B r = Ar + λ(Bl,r )T Bl,r musza֒ być dodatnie. Dla r = 1, 2, . . . , l macierz (Bl,r )T Bl,r jest macierza֒ Grama ukladu r liniowo niezależnych wektorów: pierwszych r kolumn macierzy B . Dla r = l + 1, l + 2, . . . , l + k wyznacznik Ar + λ · (Bl,r )T Bl,r jest dodatni dla dostatecznie dużych liczb λ , a ponieważ jest to wielomian stopnia r − l , wie֒c wspólczynnik przy λr−l jest dodatni. Sta֒d i (Bl,r )T l Ar z lematu 2 wynika wie֒c, że (−1) > 0 . Zakończyliśmy dowód pierwszej implikacji. Bl,r 0 Teraz zalożymy, że wyznaczniki maja֒ odpowiednie znaki i wykażemy, że forma zdefiniowana macierza֒ A jest dodatnio określona na podprzestrzeni zdefiniowanej równaniem Bx = 0. Wystarczy wykazać, że dla dostatecznie dużych λ macierz A + λB T B jest dodatnio określona. Wystarczy, na mocy twierdzenia Sylvestera i lematu 1, wykazać, ze dla dostatecznie dużych liczb λ wyznaczniki A + λB T B sa dodatnie dla r = 1, 2, . . . , k + l . Jest tak dla r = 1, 2, . . . , l , bo wtedy macierz ֒ r B T B r jest dodatnio określona, wie֒c jej wyznacznik jest dodatni (macierz Grama ukladu r liniowo niezależnych wektorów), zatem dla dostatecznie dużych λ > 0 wyznacznik macierzy A + λB T B r też jest dodatni (wyznacznik jest funkcja֒ cia֒gla֒ macierzy). Dla r > l jest to po prostu zalożenie. Dowód zostal zakończony. 88