Jordan F1

Transkrypt

Jordan F1
Algebra liniowa z geometrią 2
Maciej Czarnecki
23 maja 2013
Spis treści
5 Geometria płaszczyzny zespolonej
6 Macierze
6.1 Działania na macierzach .
6.2 Wyznacznik . . . . . . . .
6.3 Rząd macierzy . . . . . .
6.4 Układy równań liniowych
2
.
.
.
.
3
3
4
7
8
7 Przestrzenie i przekształcenia afiniczne
7.1 Przestrzeń afiniczna . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Podprzestrzenie afiniczne . . . . . . . . . . . . . . . . . . . . . .
7.3 Przekształcenia afiniczne . . . . . . . . . . . . . . . . . . . . . . .
8
8
9
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8 Geometria iloczynu skalarnego
10
8.1 Norma, kąt i odległość . . . . . . . . . . . . . . . . . . . . . . . . 10
8.2 Wyznacznik Grama i objętość . . . . . . . . . . . . . . . . . . . . 11
8.3 Orientacja i iloczyn wektorowy . . . . . . . . . . . . . . . . . . . 14
9 Formy dwuliniowe i kwadratowe
17
9.1 Postać kanoniczna . . . . . . . . . . . . . . . . . . . . . . . . . . 17
9.2 Formy rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . 20
10 Endomorfizmy przestrzeni skończonego wymiaru
23
10.1 Wektory i wartości własne . . . . . . . . . . . . . . . . . . . . . . 23
10.2 Diagonalizacja i postać Jordana . . . . . . . . . . . . . . . . . . . 25
11 Grupy przekształceń i geometrie nieeuklidesowe
28
11.1 Grupy i działania grup na przestrzeniach . . . . . . . . . . . . . . 28
11.2 Izometrie przestrzeni euklidesowej . . . . . . . . . . . . . . . . . 30
1
5
Geometria płaszczyzny zespolonej
Definicja 5.0.1. Ciałem nazywamy zbiór F składający się z co najmniej dwóch
elementów wraz z funkcjami + : F × F → F oraz · : F × F → F takimi, że (F, +)
jest grupą abelową, 0 — elementem neutralnym działania +, (F \ {0}, ·) jest
grupą abelową oraz a · (b + c) = (a · b) + (a · c) dla dowolnych a, b, c ∈ F.
Innymi słowy, w zbiorze F określone są funkcje + i · przypisujące dwóm
elementom ze zbioru F jeden element ze zbioru F spełniające warunki:
(F1)
∀a,b∈F a + b ∈ F
(F2)
∀a,b∈F a · b ∈ F
(F3)
∀a,b,c∈F (a + b) + c = a + (b + c)
(F4)
∃0∈F ∀a∈F a + 0 = 0 + a = a
(F5)
∀a∈F ∃−a∈F a + (−a) = (−a) + a = 0
(F6)
∀a,b∈F a + b = b + a
(F7)
∀a,b∈F\{0} a · b ∈ F \ {0}
(F8)
∀a,b,c∈F (a · b) · c = a · (b · c)
(F9)
∃1∈F\{0} ∀a∈F a · 1 = 1 · a = a
(F10)
∀a∈F\{0} ∃a−1 ∈F\{0} a · a−1 = a−1 · a = 1
(F11)
∀a,b∈F a · b = b · a
(F12)
∀a,b,c∈F a · (b + c) = (a · b) + (a · c)
Przykład 5.0.2. Ciałami są R oraz Q ze zwykłymi działaniami dodawania i
mnożenia.
Stwierdzenie 5.0.3. stw. 4.1
Definicja 5.0.4. def. 4.2
Uwaga 5.0.5. po def. 4.2
Definicja 5.0.6. def. 4.3, 4.4
Wniosek 5.0.7. C jest przestrzenią liniową wymiaru 2 nad ciałem R. Jej bazą
jest np. układ (1, i).
Definicja 5.0.8. Wielomianem o współczynnikach zespolonych nazywamy nieskończony cią liczb zespolonych a0 , a1 , . . ., w którym tylko skończona liczba wyrazów jest różna od 0. Zbiór wszystkich wielomianów o współczynnikach zespolonych oznaczamy przez C[z]. Dodawanie i mnożenie wielomianów zespolonych
określa się tak sama analogicznie do wielomianów rzeczywistych.
Jeżeli n = min{j ; aj 6= 0}, to n nazywamy stopniem wielomianu f =
(aj )j∈N∪{0} , a wielomian zapisujemy w postaci f (z) = a0 + a1 z + . . . + an z n .
Liczba zespolona c jest pierwiastkiem wielomianu f , gdy f (c) = 0.
Twierdzenie 5.0.9. (zasadnicze twierdzenie algebry) Każdy wielomian stopnia
dodatniego o współczynnikach zespolonych ma pierwiastek zespolony.
Wniosek 5.0.10. Kazdy wielomian o współczynnikach zespolonych rozkłada
się na czynniki liniowe, tzn. dla wielomianu f (z) = a0 +a1 z +. . .+an z n o współczynnikach zespolonych, przy czym an 6= 0, n ­ 1, istnieją liczby z1 , . . . , zk ∈ C
oraz l1 , . . . , lk ∈ N spełniające warunek l1 + . . . + lk = n i takie, że
f (z) = an (z − z1 )l1 · . . . · (z − zk )lk .
2
Definicja 5.0.11. def. 4.4
Definicja 5.0.12. def. 4.6
Stwierdzenie 5.0.13. stw. 4.7
Stwierdzenie 5.0.14. stw. 4.5 (1),(5),(6),(7)
Stwierdzenie 5.0.15. stw. 4.8
Definicja 5.0.16. def. 4.9
Twierdzenie 5.0.17. tw. 4.10
Wniosek 5.0.18. wn. 4.11
Definicja 5.0.19. Określmy dla ϕ ∈ R
eiϕ = cos ϕ + i sin ϕ.
Stwierdzenie 5.0.20. (wzór Eulera)
eiπ + 1 = 0.
Przykład 5.0.21. Notacja zespolona pozwala na łatwy zapis przekształceń
geometrycznych płaszczyzny:
1. z 7→ z jest symetrią osiową względem osi rzeczywistej,
2. z 7→ eiϕ z, gdzie ϕ ∈ R, jest obrotem o kąt ϕ dookoła 0,
3. z 7→ z + b, gdzie b ∈ C jest translacją o wektor b,
4. z 7→ kz, gdzie k ∈ R, k 6= 0, jest jednokładnością o środku 0 i skali k.
Stwierdzenie 5.0.22.
1. Funkcja liniowa C 3 z 7→ az + b ∈ C, gdzie a, b ∈
C, a 6= 0, jest złożeniem obrotu, jednokładności i translacji.
2. Funkcja antyliniowa C 3 z 7→ az + b ∈ C, gdzie a, b ∈ C, a 6= 0, jest
złożeniem symetrii osiowej, obrotu, jednokładności i translacji.
6
Macierze
6.1
Działania na macierzach
Definicja 6.1.1. def. 11.1
uwaga 1 po def. 11.1
Definicja 6.1.2. def. 11.3
Definicja 6.1.3. def. 11.4
uwaga 2 po def 11.4
Stwierdzenie 6.1.4. 11.9
Definicja 6.1.5. def. 11.12
3
Wniosek 6.1.6. wn. 11.14
Definicja 6.1.7. def. 11.17
Stwierdzenie 6.1.8. stw. 11.18
Wniosek 6.1.9. wn. 11.19
Definicja 6.1.10. def. 11.20
Stwierdzenie 6.1.11. stw. 11.21
Wniosek 6.1.12. wn. 11.22
6.2
Wyznacznik
Niech dla n ∈ N Sn oznacza zbiór wszystkich permutacji (tzn. bijekcji) zbioru
n–elementowego {1, . . . , n}.
Definicja 6.2.1. def. 12.1
Definicja 6.2.2. def. 12.2
Przykład 6.2.3. przykł. 12.3
Stwierdzenie 6.2.4. stw. 12.4
Stwierdzenie 6.2.5. stw. 12.5
Stwierdzenie 6.2.6. stw. 12.6
Twierdzenie 6.2.7. F (Laplace’a) Niech A = [aij ] ∈ Mnn (F ), zaś dla i, j =
1, . . . , n symbol Aij oznacza macierz (n−1)×(n−1) powstałą z macierzy A przez
skreślenie w niej i−tego wiersza oraz j−tej kolumny. Wówczas dla dowolnego
i = 1, . . . , n zachodzi równość
det A =
n
X
(−1)i+j aij det Aij .
j=1
Określając dla k = 1, . . . , n funkcje tk : {1, . . . , n} \ {k} → {1, . . . , n − 1}
wzorami
l
gdy l < k
tk (l) =
l − 1 gdy l > k
h
i
.
możemy precyzyjnie określić macierz Aij jako at−1 (p),t−1 (q)
i
j
1¬p,q¬n−1
Do dowodu twierdzenia Laplace’a potrzebujemy dwóch lematów
Lemat 6.2.8. Jeżeli σ ∈ Sn jest taką permutacją, że σ(i) = j dla pewnych
i, j ∈ {1, . . . , n}, to liczba inwersji w ciągu liczb σ
b = (σ(1), . . . , σ(i − 1), σ(i +
1), . . . , σ(n)) ma tę samą parzystość co liczba #inv σ − (i + j).
Dowód: Jeżeli wśród pierwszych i − 1 wyrazów ciągu σ
b jest dokładnie m ­ 0
liczb większych niż j, to jest wśród nich i − 1 − m liczb mniejszych niż j. Zatem
wśród liczb σ(i + 1), . . . , σ(n) liczb mniejszych niż j jest dokładnie j − 1 − (i −
1 − m) = j − i + m.
Tym samym w permutacji σ liczba j tworzy j − i + 2m = i + j + 2(m − i)
inwersji, więc liczba inwersji w ciągu σ
b różni się od liczby #inv σ o liczbę i + j
oraz pewną liczbę parzystą.
4
Lemat 6.2.9. Dla ustalonych i, j = 1, . . . , n funkcja Cij przypisująca dowolnej
permutacji σ ze zbioru Zij = {σ ∈ Sn ; σ(i) = j} funkcję
tj ◦ σ|{1,...,n}\{i} ◦ t−1
i
jest bijekcją zbioru Zij na zbiór Sn−1 .
Dowód: Z definicji funkcji ti , tj i zbioru Zij wynika, że złożenie jest dobrze
określone, a funkcja Cij (σ), działająca ze zbioru {1, . . . , n − 1} w ten sam zbiór,
jest bijekcją jako złożenie trzech bijekcji. Zatem Cij (σ) ∈ Sn−1 .
Aby wykazać różnowartościowość Cij weźmy takie σ, τ ∈ Zij , że Cij (σ) =
Cij (τ ). Wówczas składając obie strony lewostronnie z t−1
i prawostronnie z ti
j
otrzymujemy równość permutacji σ i τ na zbiorze {1, . . . , n} \ {i}. To zaś wraz
z warunkiem σ(i) = j = τ (i) daje σ = τ .
Aby wykazać surjektywność Cij weźmy dowolną permutację η ∈ Sn−1 i
połóżmy
−1
tj ◦ η ◦ ti (m) dla m ∈ {1, . . . , n} \ {i}
ηij (m) =
j
dla m = i
Funkcja ηij ∈ Sn , bo jako złożenie bijekcji jest bijekcją;
−1z jej definicji wynika
także ηij ∈ Zij . Wreszcie Cij (ηij ) = tj ◦ t−1
= η.
j ◦ η ◦ ti ◦ ti
Dowód twierdzenia Laplace’a (12.7): Ustalmy i ∈ {1, . . . , n}. Z lematu 12.8
wynika, że dla dowolnego j ∈ {1, . . . , n} i dowolnej permutacji σ ∈ Zij spełniony
jest warunek
(−1)i+j sgn (Cij (σ)) = sgn σ.
Stąd, z definicji wyznacznika i lematu 12.9 otrzymujemy
X
det A =
sgn σ a1σ(1) · . . . · anσ(n)
=
σ∈Sn
n
X
aij
j=1
=
n
X
X
σ∈Zij
(−1)i+j aij
j=1
=
n
X
n
X
(−1)i+j aij
n
X
j=1
=
n
X
X
(−1)i+j aij
X
akσ(k)
k=1,k6=i
sgn η
n
Y
ak,(C −1 (η))(k)
ij
X
k=1,k6=i
sgn η
n−1
Y
at−1 (p),(t−1 ◦η◦ti ))(t−1 (p))
i
X
j
i
p=1
η∈Sn−1
(−1)i+j aij
n
Y
sgn (Cij (σ))
η∈Sn−1
j=1
=
akσ(k)
k=1,k6=i
σ∈Zij
j=1
=
n
Y
sgn σ
sgn η
n−1
Y
at−1 (p),t−1 (η(p))
i
j
p=1
η∈Sn−1
(−1)i+j aij det Aij
j=1
5
Wniosek 6.2.10. wn. 12.10
Definicja 6.2.11. defin. 12.11
Wniosek 6.2.12. wn. 12.12
Stwierdzenie 6.2.13. Dla A ∈ Mnn (F ) oraz k, l = 1, . . . , n, k 6= l spełniony
jest warunek
det (skl (A)) = − det A.
Dowód: Dla ustalenia uwagi przyjmijmy k < l i niech skl (A) = B = [bij ] ∈
Mnn (F ). Wówczas dla dowolnego j = 1, . . . , n mamy
bij = aij dla i ∈
/ {k, l},
bkj = alj ,
blj = akj .
Jeżeli l = k + 1, to stosując rozwinięcie Laplace’a det B względem (k +
1)−szego wiersza otrzymujemy
det B =
n
X
(−1)k+1+j det Bk+1,j =
j=1
=−
n
X
(−1)k+1+j det Ak,j
j=1
n
X
(−1)k+j det Akj = − det A,
j=1
gdzie ostatnia równość wynika z rozwinięcia Laplace’a det A względem k−tego
wiersza.
Zatem zamiana dwóch sąsiednich wierszy zmienia znak wyznacznika. Z drugiej strony zamiana wiersza k−tego z l−tym wymaga (k − l) zamian sąsiednich,
aby przeprowadzić wiersz l−ty na miejsce k-te, oraz (k − l − 1) zamian sąsiednich, aby przeprowadzić stary wiersz k−ty (znajdujący się teraz na miejscu
(k + 1)−szym) na miejsce l−te. Stąd
det(skl (A)) = (−1)2(k−l)−1 det A = − det A.
Wniosek 6.2.14. wn. 12.14
Wniosek 6.2.15. wn. 12.15
Stwierdzenie 6.2.16. Jeżeli A ∈ Mnn oraz B ∈ Mmm , to
1.
det
A
X
θ
B
= det A det B
dla dowolnej macierzy X ∈ Mmn .
2.
det
Y
B
A
θ
= (−1)mn det A det B
dla dowolnej macierzy Y ∈ Mnm .
6
Dowód: Macierz D = [dij ] ∈
A θ
ma wyrazy
X B

aij
dla



bi−n,j−n dla
dij =
0
dla



xi−n,j
dla
Mm+n,m+n dana w postaci blokowej D =
1 ¬ i, j ¬ n
n + 1 ¬ i, j ¬ m + n
1 ¬ i ¬ n, n + 1 ¬ j ¬ m + n
n + 1 ¬ i ¬ m + n, 1 ¬ j ¬ n
1. Indukcja względem n. Dla n = 1 wzór wynika z rozwinięcia Laplace’a
względem pierwszego wiersza.
Załóżmy, że wzór jest prawdziwy dla pewnego stopnia k ∈ N macierzy A.
Przypuśćmy teraz, że A ∈ Mk+1,k+1 i rozwińmy wyznacznik macierzy D
względem pierwszego wiersza i skorzystajmy z założenia indukcyjnego
det D =
k+1+m
X
(−1)
1+j
d1j det D1j =
j=1
=
k+1
X
1+j
(−1)
a1j det
j=1
A1j
Xj
θ
B
k+1
X
(−1)1+j a1j det A1j det B = det A det B
j=1
(Xj oznacza tu macierz X, w której skreślono j−tą kolumnę).
Y A
2. Wystarczy przestawić w macierzy
pierwszych n wierszy z zaB θ
chowaniem kolejności na koniec (potrzeba na to po m zamian na każdy
wiersz), skorzystać z pierwszej części stwierdzenia i ze stw. 12.13.
Twierdzenie 6.2.17. tw. 12.17
Wniosek 6.2.18. wn. 12.18
Stwierdzenie 6.2.19. stw. 12.19
6.3
Rząd macierzy
Stwierdzenie 6.3.1. stw. 12.20
Definicja 6.3.2. def. 12.21
Wniosek 6.3.3. wn. 12.22
Stwierdzenie 6.3.4. stw. 12.23
Wniosek 6.3.5. wn. 12.24
Stwierdzenie 6.3.6.
F
stw. 12.15
7
6.4
Układy równań liniowych
Definicja 6.4.1. def. 13.1
Definicja 6.4.2. def. 13.2
Definicja 6.4.3. def. 13.3
Przykład 6.4.4. przykł. 13.4
Definicja 6.4.5. def. 13.5
Stwierdzenie 6.4.6. stw. 13.6
Stwierdzenie 6.4.7. stw. 13.7
Definicja 6.4.8. def. 13.8
Twierdzenie 6.4.9. tw. 13.9
Twierdzenie 6.4.10. tw. 13.11
Uwaga 6.4.11. uwaga 2 po tw. 13.11
Stwierdzenie 6.4.12. stw. 13.12
Definicja 6.4.13. def. 13.13
Wniosek 6.4.14. wn. 13.14
Stwierdzenie 6.4.15. stw. 13.15
Twierdzenie 6.4.16.
F
tw. 13.16
Wniosek 6.4.17. wn. 13.17
7
7.1
Przestrzenie i przekształcenia afiniczne
Przestrzeń afiniczna
Definicja 7.1.1. def. 14.1
Stwierdzenie 7.1.2. stw. 14.2
Przykład 7.1.3. przykł. 14.3
Definicja 7.1.4. def. 14.4
Stwierdzenie 7.1.5. stw. 14.5
Definicja 7.1.6. def. 14.6
Przykład 7.1.7. przykł. 14.7
Definicja 7.1.8. def. 14.9
Stwierdzenie 7.1.9. stw. 14.10
Przykład 7.1.10. przykł. 14.12
8
Definicja 7.1.11. def. 14.14
Przykład 7.1.12. przykł. 14.15
Załóżmy teraz, że przestrzeń afiniczna (E, V, →) jest rzeczywista tzn, że V
jest przestrzenia liniową nad ciałem R.
Definicja 7.1.13. def. 16.1
Stwierdzenie 7.1.14. stw. 16.2
Definicja 7.1.15. def. 16.3
Przykład 7.1.16. przykł. 16.4
Twierdzenie 7.1.17. tw. 16.5
Definicja 7.1.18. def. 16.9
Definicja 7.1.19. def. 16.10
Definicja 7.1.20. def. 16.11
Przykład 7.1.21. przykł. 16.12
7.2
Podprzestrzenie afiniczne
Definicja 7.2.1. def. 15.1
Stwierdzenie 7.2.2. stw. 15.2
Stwierdzenie 7.2.3. stw. 15.3
Definicja 7.2.4. def. 15.4
Definicja 7.2.5. def. 15.5
Przykład 7.2.6. przykł. 15.6
Stwierdzenie 7.2.7. stw. 15.7
Definicja 7.2.8. def. 15.9
Stwierdzenie 7.2.9. stw. 15.10
Stwierdzenie 7.2.10. stw. 15.11
7.3
Przekształcenia afiniczne
Załóżmy, że V, V 0 są przestrzeniami liniowymi nad tym samym ciałem F , zaś
(E, V, →) oraz (E 0 , V 0 , →0 ) — przestrzeniami afinicznymi
Definicja 7.3.1. def. 17.1
Przykład 7.3.2. przykł. 17.2
Stwierdzenie 7.3.3. stw. 17.3
Stwierdzenie 7.3.4. stw. 17.4
9
Wniosek 7.3.5. wn. 17.5
Wniosek 7.3.6. wn. 17.6
Definicja 7.3.7. def. 17.7
Stwierdzenie 7.3.8. stw. 17.8
Stwierdzenie 7.3.9. stw. 17.9
Definicja 7.3.10. def. 17.10
Twierdzenie 7.3.11. def. 17.11
8
8.1
Geometria iloczynu skalarnego
Norma, kąt i odległość
Załóżmy, że V jest przestrzenią liniową z iloczynem skalarnym h., .i.
Definicja 8.1.1. def. 19.1
Przykład 8.1.2. przykł. 19.2
Twierdzenie 8.1.3. tw. 19.3
Stwierdzenie 8.1.4. stw. 19.4
Stwierdzenie 8.1.5. stw. 19.5
Stwierdzenie 8.1.6. stw. 19.6
Definicja 8.1.7. def. 19.7
Stwierdzenie 8.1.8. stw. 19.9
Wniosek 8.1.9. wn. 19.10
Wniosek 8.1.10. wn. 19.11
Definicja 8.1.11. Przestrzenią euklidesową nazywamy przestrzeń afiniczną,
której przestrzeń liniową jest skończonego wymiaru i określony w niej jest iloczyn skalarnym.
W przestrzeni euklidesowej E odległością (lub metryką) nazywamy funkcję
−
przypisującą dwóm punktom p, q ∈ E liczbę rzeczywistą |pq| = k→
pqk.
Stwierdzenie 8.1.12. stw. 19.13
Przykład 8.1.13. przykł. 19.14
Stwierdzenie 8.1.14. stw. 19.15
Definicja 8.1.15. def. 19.16
10
8.2
Wyznacznik Grama i objętość
Definicja 8.2.1. Dla danych wektorów v1 , . . . , vk z przestrzeni liniowej V z
iloczynem skalarnym h., .i macierz
G(v1 , . . . , vk ) = [hvi , vj i]1¬i,j¬k
nazywamy macierzą Grama wektorów v1 , . . . , vk , zaś jej
det G(v1 , . . . , vk ) — wyznacznikiem Grama tychże wektorów.
Przykład 8.2.2.
wyznacznik
1. det G(v1 ) = kv1 k2
2. det G(v1 , v2 ) = kv1 k2 kv2 k2 − hv1 , v2 i2 = kv1 k2 kv2 k2 (1 − cos2 ^(v1 , v2 )) =
2
(kv1 k kv2 k sin ^(v1 , v2 ))
Stwierdzenie 8.2.3. W przestrzeni Rn ze standardowym iloczynem skalarny
dla v1 , . . . , vn ∈ Rn zachodzi związek
2
v1



det G(v1 , . . . , vn ) = det  ... 
vn


Dowód;
Stwierdzenie 8.2.4. W przestrzeni liniowej V z iloczynem skalarnym h., .i dla
v1 , . . . , vk spełnione są warunki:
1. det G(v1 , . . . , vk ) ­ 0,
2. det G(v1 , . . . , vk ) = 0 wtedy i tylko wtedy, gdy układ (v1 , . . . , vk ) jest
liniowo zależny.
Dowód:
Stwierdzenie 8.2.5. W przestrzeni liniowej V z iloczynem skalarnym h., .i dla
v1 , . . . , vk spełnione są warunki:
1.
∀σ∈Sk det G(vσ(1) , . . . , vσ(k) ) = det G(v1 , . . . , vk )
2.
∀a∈R det G(av1 , v2 , . . . , vk ) = a2 det G(v1 , . . . , vk )
3.

∀a2 ,...,ak ∈R det G v1 +
k
X

aj vj , v2 , . . . , vk  = det G(v1 , . . . , vk )
j=2
Dowód:
11
Stwierdzenie 8.2.6. W przestrzeni liniowej V z iloczynem skalarnym h., .i dla
v1 , . . . , vk spełnione są warunki:
1. det G(v1 , . . . , vk ) ¬ kv1 k2 · . . . · kvk k2 ,
2. przy założeniu v1 , . . . , vk 6= θ równość det G(v1 , . . . , vk ) = kv1 k2 ·. . .·kvk k2
zachodzi wtedy i tylko wtedy, gdy układ (v1 , . . . , vk ) jest ortogonalny.
Dowód:
Definicja 8.2.6 41 def. 18.11
Stwierdzenie 8.2.6 12 Dla dowolnej podprzestrzeni afinicznej H przestrzeni euklidesowej E i dowolnego punktu p ∈ E jego rzut ortogonalny πH (p) jest jedynym punktem przestrzeni E odległym od H o d(p, H).
Stwierdzenie 8.2.6 34 stw. 18.12
Stwierdzenie 8.2.7. Jeżeli (p; v1 , . . . , vk ) jest układem współrzędnych w podprzestrzeni afinicznej H przestrzeni euklidesowej E, to odległość punktu q ∈ E
od podprzestrzeni H wyraża się wzorem
s
−
det G (v1 , . . . , vk , →
pq)
d(q, H) =
det G(v1 , . . . , vk )
Dowód:
Definicja 8.2.8. Ścianą l–wymiarową sympleksu k–wymiarowego conv (p0 , . . . , pk ),
gdzie 0 ¬ l ¬ k, nazywamy każdy sympleks postaci conv (pi0 , . . . , pil ), gdzie
(i0 , . . . , il ) jest podciągiem ciągu (0, . . . , k).
Definicja 8.2.9. Kompleksem symplicjalnym w przestrzeni afinicznej E nazywamy taki skończony układ sympleksów (S1 , . . . , Sm ) z tej przestrzeni, że dla
dowolnych i, j = 1, . . . , m zbiór Si ∩ Sj jest pusty lub jest wspólną ścianą sympleksów Si oraz Sj .
Pozdbiór przestrzeni E, który dla pewnego k ∈ N ∪ {0} można przedstawić
jako sumę sympleksów pewnego kompleksu symplicjalnego zawierającego tylko
sympleksy k–wymiarowe, nazywamy k–wymiarowym wielościanem.
Podział wielościanu na sumę sympleksów pewnego kompleksu symplicjalnego
nazywamy triangulacją.
Wielościan dwuwymiarowy zawarty w płaszczyźnie nazywamy wielokątem.
Przykład 8.2.10.
nem.
1. Każdy zbiór skończony jest 0–wymiarowym wielościa-
2. Sumę sympleksów kompleksu zawierającego tylko sympleksy co najwyżej
jednowymiarowe nazywamy grafem skończonym.
Twierdzenie 8.2.11. Dla dowolnego k ∈ N pryzma k–wymiarowa jest k–
wymiarowym wielościanem.
Pewna triangulacja pryzmy Q(conv (p0 , . . . , pk−1 ), v) składa się z k sympleksów, z których każdy rozpięty jest na k wektorach postaci
−
ε −
p−→
p + ... + ε
p−p−−→ + εv,
1 0 1
k−1 0 k−1
gdzie ε1 , . . . , εk−1 , ε ∈ {−1, 0.1}.
12
Dowód: Moszyńska, Święcicka, Geometria z algebrą liniową.
Twierdzenie 8.2.12. Dla dowolnego k ∈ N równoległościan k–wymiarowy jest
k–wymiarowym wielościanem.
Pewna triangulacja równoległościanu P(p0 ; v1 , . . . , vk ) składa się z k! sympleksów, z których każdy rozpięty jest na k wektorach postaci
ε 1 v1 + . . . + ε k vk ,
gdzie ε1 , . . . , εk ∈ {−1, 0.1}.
Dowód: Moszyńska, Święcicka, Geometria z algebrą liniową.
Definicja 8.2.13. Niech k ∈ N. Objętością k–wymiarową (lub miarą k–wymiarową)
układu punktów (p0 , . . . , pk ) z przestrzeni afinicznej E z iloczynem skalarnym
h., .i nazywamy liczbę
q
1
→
−−→
det G (−
p−
vol (p0 , . . . , pk ) =
0 p1 , . . . , p0 pk ).
k!
Jeżeli wielościan k–wymiarowy P ma triangulację postaci
(i)
(i)
∆i = conv p0 , . . . , pk
1¬i¬m
i sympleksy tej triangulacji są parami różne, to k–wymiarową objętością wielościanu P nazywamy liczbę
volk (P) =
m
X
(i)
(i)
volk p0 , . . . , pk .
i=1
Zamiast vol2 piszemy czasem P , zamiast vol3 — V , a vol1 jest zwykłą odległością punktów |. .|.
Można udowodnić, że definicja objętości wielościanu nie zależy od wyboru
jego triangulacji.
Niech odtąd E będzie przestrzenią afiniczną o przestrzeni nośnej V , w której
określony jest iloczyn skalarny h., .i.
Stwierdzenie 8.2.14. Dla dowolnego k ­ 2 i dowolnego układu punktów
(p0 , . . . , pk ) z przestrzeni E zachodzi równość
volk (p0 , . . . , pk ) =
1
d(pk , H) · volk−1 (p0 , . . . , pk−1 ),
k
gdzie H = af (p0 , . . . , pk−1 ).
Dowód:
Przykład 8.2.15.
1. Pole trójkąta:
P (∆ABC) = vol2 (A, B, C) =
1
1
vol1 (A, B) · d(C, AB) = |AB|hC
2
2
13
2. Objętość czworościanu:
V (conv (A, B, C, D)) =vol3 (A, B, C, D) =
1
vol2 (A, B, C) · d(D, ABC)
3
1
= P (∆ABC)hD
3
Stwierdzenie 8.2.16. (objętość sympleksu, pryzmy i równoległościanu) Niech
(p0 , . . . , pk ) będzie układem punktów z przestrzeni E w położeniu ogólnym,
→
vi = −
p−
0 pi dla i = 1, . . . , k oraz v ∈ V \ lin (v1 , . . . , vk−1 ). Wówczas
p
1
det G(v1 , . . . , vk ),
1. volk (conv (p0 , . . . , pk )) = k!
p
1
2. volk (Q(conv (p0 , . . . , pk−1 ), v)) = (k−1)!
det G(v1 , . . . , vk−1 , v),
p
3. volk (P(p0 ; v1 , . . . , vk )) = det G(v1 , . . . , vk ).
Dowód:
8.3
Orientacja i iloczyn wektorowy
Niech V będzie rzeczywistą przestrzenią liniową skończonego wymiaru.
Stwierdzenie 8.3.1. W zbiorze B wszystkich baz przestrzeni V określamy
relację ∼ jako posiadanie macierzy przejścia o dodatnim wyznaczniku
(inaczej
B ∼ C ⇐⇒ det MCB > 0) .
Wówczas
1. ∼ jest relacją równoważności w zbiorze B,
2. ∼ ma dwie klasy abstrakcji.
Dowód:
1. Zwrotność relacji ∼ wynika z faktu, że macierzą przejścia od bazy do tej
samej bazy jest macierz jednostkowa o wyznaczniku 1 > 0.
Aby wykazać symetrię załóżmy, że B ∼ C, co oznacza, że det MCB > 0.
Wówczas z twierdzenia Cauchy’ego otrzymujemy, że
−1
det MBC = det (MCB )
=
1
> 0,
det MCB
czyli C ∼ B.
Przechodniość wynika z wniosku 11.16 i twierdzenia Cauchy’ego; jeżeli
B ∼ C i C ∼ D, to
det MDB = det (MDC · MCB ) = det MDC det MCB > 0,
skąd B ∼ D.
14
2. Niech B = (v1 , . . . , vn−1 , vn ) ∈ B. Wówczas bazą przestrzeni V jest także
D = (v1 , . . . , vn−1 , −vn ).
Niech C ∈ B. Macierz przejścia od bazy do bazy jest nieosobliwa, więc
det MCB > 0 albo det MCB < 0. W pierwszym przypadku C ∼ B. Rozważając przypadek drugi zauważmy najpierw, że licząc wyznacznik macierzy
diagonalnej dostajemy
1 0 ... 0
0 0 1 ... 0
0 . = −1.
det MDB = . . . . . .
0 0 ... 1
0 0 0 . . . 0 −1 Zatem ponowne zastosowanie twierdzenia Cauchy’ego pociąga za sobą
det MCD = det (MCB · MBD ) = det MCB det MBD = − det MCB > 0,
czyli C ∼ D.
Tym samym B, D ∈ B wyznaczają jedyne dwie klasy abstrakcji relacji ∼.
Definicja 8.3.2. W rzeczywistej przestrzeni liniowej V skończonego wymiaru
każdą z klas abstrakcji relacji wiążacej bazy o macierzy przejścia, która ma
dodatni wyznacznik, nazywamy orientacją przestrzeni V .
Mówimy, że dwie bazy należące do tej samej orientacji są zgodnie zorientowane, a bazy należące do różnych orientacji — przeciwnie zorientowane.
Przestrzeń z wybraną orientacją nazywamy przestrzenią zorientowaną, a
bazę należącą do wybranej orientacji w tej przestrzeni — bazą dodatnio zorientowaną.
Stwierdzenie 8.3.3. Niech (v1 , . . . , vn ) będzie bazą przestrzeni liniowej V .
Wtedy
1. ∀a∈R (v1 , . . . , vn ) ∼ (v1 , . . . , avn ) ⇐⇒ a > 0,
2. ∀σ∈Sn (v1 , . . . , vn ) ∼ (vσ(1) , . . . , vσ(n) ) ⇐⇒ sgn σ = 1.
Dowód: Wystarczy zastosować odpowiednie operacje elementarne do macierzy jednostkowej, która jest macierzą przejścia od danej bazy do niej samej.
Niech odtąd V oznacza zorientowaną przestrzeń euklidesową liniową.
Stwierdzenie 8.3.4. Niech dany będzie liniowo niezależny układ wektorów
(v1 , . . . , vn−1 ) w n–wymiarowej zorientowanej przestrzeni euklidesowej liniowej
V . Istnieje dokładnie jeden wektor v ∈ V taki, że
(VP2)
v ⊥ lin (v1 , . . . , vn−1 )
p
kvk = det G(v1 , . . . , vn−1 )
(VP3)
baza (v1 , . . . , vn−1 , v) jest dodatnio zorientowana
(VP1)
15
Dowód: Uzupełnijmy liniowo niezależny układ wektorów (v1 , . . . , vn−1 ) wektorem u do bazy przestrzeni V . Oznaczmy przez w rzut ortogonalny wektora w
na podprzestrzeń lin (v1 , . . . , vn−1 ). Wówczas w 6= θ oraz w ⊥ lin (v1 , . . . , vn−1 ).
Połóżmy
p
det G(v1 , . . . , vn−1 )
v=
w.
kwk
p
Mamy niezmiennie w ⊥ lin (v1 , . . . , vn−1 ) oraz kvk =
det G(v1 , . . . , vn−1 ),
czyli wektor v spełnia warunki (VP1) i (VP2).
Jeżeli baza (v1 , . . . , vn−1 , v) jest dodatnio zorientowana, to wektor v spełnia
rónież warunek (VP3). W przeciwnym wypadku warunek ten spełnia wektor −v
(stw. 21.4(2)) czyniąc cały czas zadość pozostałym warunkom.
Przypuśćmy, że wektor v 0 spełnia warunki (VP1)–(VP3). Wówczas na mocy
(VP1) wraz z wektorem v należy do jednowymiarowej podprzestrzeni
⊥
(lin (v1 , . . . , vn−1 )) (bo układ (v1 , . . . , vn−1 ) jest liniowo niezależny, a dim V =
n). Istnieje więc liczba a taka, że v 0 = av. Warunek (VP2) implikuje |a| = 1,
jednak zgodnie ze stw. 21.4(2) a = −1 powodowałoby zaprzeczenie warunku
(VP3). Stąd v 0 = v.
Definicja 8.3.5. Niech v1 , . . . , vn−1 będą wektorami n–wymiarowej zorientowanej przestrzeni euklidesowej liniowej V . Wektor v ∈ V określony jako:
• θ, gdy układ (v1 , . . . , vn−1 ) jest liniowo zależny,
• jedyny wektor spełniający warunki (VP1)–(VP3), gdy układ (v1 , . . . , vn−1 )
jest liniowo niezależny,
nazywamy iloczynem wektorowym wektorów v1 , . . . , vn−1 i zapisujemy v1 × . . . ×
vn−1 .
Stwierdzenie 8.3.6. Iloczyn wektorowy w zorientowanej n–wymiarowej przestrzeni euklidesowej liniowej V jest
1. skośnie symetryczny, tzn. dla dowolnych v1 , . . . , vn−1 ∈ V oraz permutacji
σ ∈ Sn−1 spełniony jest warunek
vσ(1) × . . . × vσ(n−1) = sgn σ v1 × . . . × vn−1
2. (n − 1)–liniowy, tzn. dla dowolnych k = 1, . . . , n − 1, v1 , . . . , vn−1 , vk0 ∈ V
oraz a, a0 ∈ R spełniony jest warunek
v1 × . . . × vk−1 × (avk + a0 vk0 ) × vk+1 × . . . × vn−1
= a v1 × . . . × vk−1 × vk × vk+1 × . . . × vn−1
+ a0 v1 × . . . × vk−1 × vk0 × vk+1 × . . . × vn−1
Dowód: Fakty te wynikają z definicji iloczynu skalarnego — uzyskujemy
wtedy warunek (VP1), stw. 20.6 — (VP2) i stw. 21.4 — (VP3).
Wniosek 8.3.7. W przestrzeni liniowej Rn ze standardowym iloczynem skalarnym i orientacją daną przez bazę kanoniczną iloczyn wektorowy wyraża się
wzorem
v1 × . . . × vn−1 = (−1)1+n det A1 , . . . , (−1)n+n det An ,
16
gdzie macierz A ∈ Mn−1,n ma jako kolejne wiersze współrzędne wektorów
v1 , . . . , vn−1 , a dla każdego j = 1, . . . , n macierz Aj powstaje z A przez skreślenie
j–tej kolumny.
Dowód: Oznaczmy przez aj = (−1)j+n det Aj , j = 1, . . . , n i niech w =
(a1 , . . . , an ).
Jeżeli wektory v1 , . . . , vn−1 są liniowo zależne, to r A < n − 1, więc każdy z
minorów stopnia n − 1 macierzy A (a takimi są det Aj , j = 1, . . . , n) jest równy
0, skąd
v1 × . . . × vn−1 = θ = w.
Załóżmy teraz, że v1 , . . . , vn−1 są liniowo niezależne. Wówczas r A = n − 1
i w 6= θ. Pokażemy, że wektor w spełnia (VP1)–(VP3), czyli jest iloczynem
wektorowym danych wektorów.
Zauważmy, że rozwinięcie Laplace’a wzgledem ostatniego wiersza daje dla
dowolnego u = (u1 , . . . , un ) ∈ Rn równość


v1
n
n
 .. 
X
X


hw, ui =
aj uj =
(−1)n+j uj det Aj = det  . 
(1)

vn−1 
j=1
j=1
u
Zatem hw, vl i = 0, l = 1, . . . , n − 1, do wówczas wyznacznik w (1) ma taki
sam wiersz l–ty i n–ty. Zatem w spełnia warunek (VP1).
Biorąc w (1) u = w dostajemy


v1
 .. 


(2)
kwk2 = det  .  ,
 vn−1 
w
skąd natychmiast wynika (VP3).
Ponadto uwzględniając wzór (2), stwierdzenie 20.3 i (VP1) uzyskujemy


v1
..
.




kwk4 = det 

 vn−1
w
2


 = det G(v1 , . . . , vn−1 , w) = det G(v1 , . . . , vn−1 )kwk2 ,

co wraz z niezerowością wektora w pozwala na wywnioskowanie warunku (VP2).
9
9.1
Formy dwuliniowe i kwadratowe
Postać kanoniczna
Załóżmy, że V jest skończenie wymiarową przestrzenią liniową nad ciałem F
charakterystyki różnej od 2.
17
Definicja 9.1.1. Funkcjonałem dwuliniowym (lub formą dwuliniową) na przestrzeni liniowej V nad ciałem F nazywamy funkcję f : V × V → F spełniającą
warunki
(BF1)
∀u,v,w∈V ∀a,b∈F f (au + bv, w) = af (u, w) + bf (v, w)
(BF2)
∀u,v,w∈V ∀a,b∈F f (u, av + bw) = af (u, v) + bf (u, w)
Zbiór wszystkich funkcjonałów dwuliniowych na przestrzeni V oznaczamy
przez L(V 2 ; F).
Stwierdzenie 9.1.2. Każdy funkcjonał dwuliniowy jest jednoznacznie określony przez swoje wartości na bazie przestrzeni.
Dokładniej, jeżeli (e1 , . . . , en ) jest bazą przestrzeni liniowej V , to dla
x=
n
X
ci e i , y =
n
X
i=1
dj ej ∈ V
j=1
mamy
n
X
f (x, y) =
aij ci dj ,
i,j=1
gdzie aij = f (ei , ej ) dla i, j = 1, . . . , n.
Dowód: wynika bezpośrednio z definicji.
Stwierdzenie 9.1.3. Jeżeli (e1 , . . . , en ) jest bazą przestrzeni liniowej VF , zaś
A = [aij ] ∈ Mnn (F), to istnieje dokładnie jeden funkcjonał dwuliniowy f na V
taki, że f (ei , ej ) = aij .
Definicja 9.1.4. Załóżmy, że E = (e1 , . . . , en ) jest bazą przestrzeni liniowej VF
i niech f będzie funkcjonałem dwuliniowym na V . Macierz
ME (f ) = [f (ei , ej )]1¬i,j¬n
nazywamy macierzą funkcjonału dwuliniowego f w bazie E.
Stwierdzenie 9.1.5. Jeżeli A jest macierzą funkcjonału dwuliniowego f ∈
L(V 2 ; F) w bazie E , a C jest macierzą przejścia od bazy E do bazy B, to
MB (f ) = C T AC.
Dowód: Niech E = (e1 , . . . , en ) oraz B = (v1 , . . . , vn ) będą bazami przestrzeni V , f ∈ L(V 2 ; F ). Niech ME (f ) = A = [aij ] zaś C = [cij ] niech będzie
macierza przejścia od bazy E do bazy B. Wówczas f (ei , ej ) = aij , skąd
!
!
n
n
n X
n
n
n
X
X
X
X
X
∗
f (vi , vj ) = f
cki ek ,
clj el =
cki clj akl =
cik akl clj ,
k=1
l=1
k=1 l=1
gdzie [c∗ik ] = C T . Zatem [f (vi , vj )] = C T AC.
l=1
k=1
Definicja 9.1.6. Mówimy, że funkcjonał dwuliniowy f ∈ L(V 2 ; F) jest symetryczny, gdy
∀u,v∈V F (v, u) = f (u, v).
18
Stwierdzenie 9.1.7.
1. Jeżeli funkcjonał liniowy jest symetryczny, to jego
macierz w dowolnej bazie jest symetryczna.
2. Jeżeli w pewnej bazie funkcjonał dwuliniowy ma macierz symetryczną, to
ten funkcjonał jest symetryczny.
Dowód:
1. oczywiste.
2. wynika ze stw. 23.5 i własności transpozycji (stw. 11.8). Jeżeli macierz
A = ME (f ) jest symetryczna, czyli AT = A, to dla dowolnej macierzy
przejścia C od bazy E do innej bazy przestrzeni V mamy
C T AC
T
= C T AT C = C T AC,
a więc symetryczność macierzy funkcjonału dwuliniowego f w nowej bazie.
Definicja 9.1.8. Niech f ∈ L(V 2 ; F ). Funkcję F : V → F daną wzorem
F (x) = f (x, x)
dla x ∈ V
nazywamy formą kwadratową generowaną przez funkcjonał dwuliniowy f .
Stwierdzenie 9.1.9. Dla dowolnej formy kwadratowej F na przestrzeni VF
istnieje dokładnie jeden funkcjonał dwuliniowy symetryczny na V generujacy
formę F .
Dowód: Załóżmy, że F jest formą kwadratową na V generowaną przez pewien funkcjonał dwuliniowy g ∈ L(V 2 ; F). Kładąc
f (x, y) =
1
(F (x + y) − F (x) − F (y))
2
można łatwo zauważyć, że f (x, y) = g(x, y), czyli f jest funkcjonałem dwuliniowym generującym formę kwadratową F .
Jeżeli f jest symetryczny, to jest poszukiwanym funkcjonałem. Jeżeli f nie
jest symetryczny, to funkcja f1 : V × V → F dana wzorem
f1 (x, y) =
1
(f (x, y) + f (y, x))
2
jest funkcjonałem dwuliniowym symetrycznym oraz f1 (x, x) = f (x, x) = F (x)
dla x ∈ V .
Przypuścmy, że k jest dwuliniowym funkcjonałem symetrycznym takim, że
k(x, x) = F (x) dla x ∈ V . Wówczas
f1 (x, y) =
1
(F (x + y) − F (x) − F (y)) = k(x, y)
2
dla x, y ∈ V,
czyli k = f1 .
Iloczyn skalarny jest funkcjonałem dwuliniowym symetrycznym (i dodatkowo dodatnio określonym). Jego formą kwadratową jest kwadrat normy.
19
Definicja 9.1.10. Macierzą formy kwadratowej w pewnej bazie nazywamy macierz generującego ją funkcjonału dwuliniowego symetrycznego w tej bazie.
Mówimy, że forma kwadratowa F jest w postaci kanonicznej w bazie E,
gdy macierz formy F w bazie E jest diagonalna. Taką bazę nazywamy bazą
kanoniczną formy F .
Jeżeli E = (e1 , . . . , en ) jest bazą kanoniczną formy F , to istnieją λ1 , . . . , λn ∈
F takie, że
n
n
X
X
F (x) =
λi x2i
dla x =
xi ei .
i=1
i=1
Twierdzenie 9.1.11. F (Lagrange’a) Dla dowolnej formy kwadratowej F określonej na skończenie wymiarowej przestrzeni liniowej V nad ciałem F charakterystyki różnej od 2 istnieje taka baza przestrzeni V , w której forma F ma postać
kanoniczną.
Dowód: Gleichgewicht, Algebra.
Przykład 9.1.12.
Twierdzenie 9.1.13. F (Jacobiego) Jeżeli forma kwadratowa F określona na
skończenie wymiarowej przestrzeni liniowej V nad ciałem F charakterystyki różnej od 2 ma w pewnej bazie macierz A = [aij ]1¬i,j¬n taką, że
∆k = det[aij ]1¬i,j¬k 6= 0
dla k = 1, . . . , n,
to istnieje baza E = (e1 , . . . , en ) przestrzeni V , w której forma F ma postać
kanoniczną
n
n
X
X
∆k−1 2
xk
dla x =
xk ek .
F (x) =
∆k
k=1
k=1
przy dodatkowej umowie ∆0 = 1.
Dowód: Jefimow, Rozendorn, Algebra liniowa wraz z geometrią wielowymiarową.
9.2
Formy rzeczywiste
Definicja 9.2.1. Forma kwadratowa F jest w postaci normalnej, gdy jest w
postaci kanonicznej i wszystkie jej współczynniki należą do zbioru {−1, 0, 1}.
Stwierdzenie 9.2.2. Każdą formę kwadratową określoną na rzeczywistej przestrzeni liniowej skończonego wymiaru można przedstawić w postaci normalnej.
Dowód: Niech F będzie formą kwadratową na rzeczywistej przestrzeni liniwej V wymiaru n. Z twierdzenia Lagrange’a (23.11) wynika, że istnieje baza
(e1 , . . . , en ), w której forma F ma postać kanoniczną
F (x) =
n
X
i=1
20
λi x2i .
Niech I = {i ; λi = 0} oraz dla i = 1, . . . , n
(
ei
dla i ∈ I
0
ei =
√1 ei dla i ∈ {1, . . . , n} \ I
|λi |
Wówczas baza (e01 , . . . , e0n ) jest nadal bazą kanoniczną dla formy F oraz dla
i ∈ {1, . . . , n} \ I
1
= ±1.
F (e0i ) = λi
|λi |
Twierdzenie 9.2.3. (Sylvestera o bezwładności) Niech F będzie formą kwadratową określoną na rzeczywistej przestrzeni liniowej V skończonego wymiaru.
Jeżeli E i B są dwiema bazami kanonicznymi formy F , to forma F ma w
bazie E i w bazie B tę samą liczbę współczynników dodatnich.
Dowód: Ze stwierdzenia 23.14 i jego dowodu wynika, że formę kwadratową na
rzeczywistej przestrzeni wymiaru n można sprowadzić z postaci kanonicznej do
postaci normalnej nie zmieniając liczby współczynników dodatnich, ujemnych
ani zerowych.
Niech forma F ma w bazie E = (e1 , . . . , en ) postać normalną
F (x) = x21 + . . . + x2p − x2p+1 − . . . − x2p+q
dla x =
n
X
xi ei ,
i=1
czyli
λi =


1 dla i = 1, . . . , p
−1 dla i = p + 1, . . . , p + q

0 dla i = p + q + 1, . . . , n
i analogicznie forma F ma w bazie B = (v1 , . . . , vn ) postać normalną
2
2
F (y) = y12 + . . . + ys2 − ys+1
− . . . − ys+t
dla y =
n
X
y i vi .
i=1
Przypuśćmy, że p > s. Wówczas podprzestrzenie V 0 = lin (e1 , . . . , ep ) oraz
V = lin (vs+1 , . . . , vn ) mają wymiary odpowiednio p oraz n−s > n−p, których
suma wynosi p+n−s > n = dim V . Zatem istnieje niezerowy wektor w ∈ V 0 ∩V 00
(stw. 8.17). Można go więc zapisać w postaci
00
x1 e1 + . . . + xp ep = w = ys+1 vs+1 + . . . + yn sn
przy czym jeden ze współczynników xi jest niezerowy.
Zatem stosując do wektora w obie postacie normalne otrzymujemy
2
0 < x21 + . . . + x2p = F (w) = −ys+1
− . . . − yn2 ¬ 0.
Otrzymana sprzeczość dowodzi, że p ¬ s. Analogicznie pokazujemy, że s ¬ p,
czyli ostatecznie p = s.
Wniosek 9.2.4. Formą kwadratową na rzeczywistej przestrzeni liniowej skończonego wymiaru ma w dowolnej postaci kanonicznej tę samą liczbę współczynników ujemnych.
21
Definicja 9.2.5. Mówimy, że forma kwadratowa F określoną na rzeczywistej
przestrzeni liniowej V wymiaru n ma sygnaturę (r, −s), gdzie r + s ¬ n, gdy
w pewnej swojej bazie kanonicznej ma dokładnie r współczynników dodatnich
i dokładnie s współczynników ujemnych.
Definicja 9.2.6. Mówimy, że forma kwadratowa F określona na rzeczywistej
przestrzeni liniowej V jest dodatnio (odpowiednio ujemnie) określona, gdy
∀x∈V \{θ} F (x) > 0
odpowiednio
∀x∈V \{θ} F (x) > 0 .
Stwierdzenie 9.2.7. Forma kwadratowa F określoną na rzeczywistej przestrzeni liniowej V wymiaru n jest dodatnio (odpowiednio ujemnie) określona
wtedy i tylko wtedy, gdy w pewnej bazie przestrzeni V forma F ma macierz
A = [aij ]1¬i,j¬n spełniającą warunki:
∆k = det[aij ]1¬i,j¬k > 0
dla k = 1, . . . , n
(odpowiednio
(−1)k ∆k = (−1)k det[aij ]1¬i,j¬k > 0
dla k = 1, . . . , n
Dowód: Przeprowadzimy rozumowanie dla formy ujemnie określonej. Załóżmy, że forma kwadratowa F jest określona na przestrzeni V wymiaru n.
⇒) Jeżeli F jest ujemnie określona, to na mocy twierdzenia Lagrange’a
(23.11) istnieje baza E = (e1 , . . . , en ), w której forma F ma postać kanoniczną
F (x) = λ1 x21 + . . . + λn x2n
Po podstawieniu wektorów bazy E otrzymujemy, że λi < 0 dla i = 1, . . . , n.
Minory główne diagonalnej macierzy formy F w bazie E są równe
∆k = λ 1 · . . . · λ k ,
k = 1, . . . , n
co wraz z ujemnością wszystkich λi daje
(−1)k ∆k = (−1)2k |λ1 | · . . . · |λk | > 0.
⇐) Załóżmy, że minory główne ∆k są w pewnej bazie B na przemian ujemne
i dodatnie. Spełnione są więc założenia twierdzenia Jacobiego (23.12), więc istnieje baza E, w której forma kwadratowa F ma postać kanoniczną
F (x) =
n
X
∆k−1
k=1
Wszystkie współczynniki λk =
mamy F (v) < 0.
∆k−1
∆k
=
∆k
x2k .
(−1)k−1 |∆k−1 |
(−1)k |∆k |
są ujemne, więc dla v 6= θ
Uwaga 9.2.8. Iloczyn skalarny można określić w przestrzeni liniowej skończonego wymiaru nad dowolnym ciałem żądając, aby był to funkcjonał dwuliniowy,
symetryczny i niezdegenerowany, to znaczy np. żeby jego macierz była nieosobliwa.
Innym sposobem sposobem uogólnienia iloczynu skalarnego na przestrzenie
zespolone jest określenie iloczynu hermitowskiego: liniowego ze względu na pierwszą zmienną, z częściową symetrią daną przez warunek g(v, u) = g(u, v) i dodatnią określonością analogiczną do tej w przestrzeni rzeczywistej (bo g(v, v) =
g(v, v) ∈ R).
22
10
Endomorfizmy przestrzeni skończonego wymiaru
10.1
Wektory i wartości własne
Załóżmy, że V jest skończenie wymiarową przestrzenią liniową nad ciałem F ,
zaś ϕ — endomorfizmem przestrzeni V , tzn. przekształceniem liniowym V → V .
Definicja 10.1.1. Podprzestrzeń liniową U przestrzeni liniowej V nazywamy
podprzestrzenią niezmienniczą endomorfizmu ϕ (lub krótko podprzestrzenią ϕ–
niezmienniczą), gdy ϕ(U ) ⊂ U .
Przykład 10.1.2.
1. Podprzestrzeń trywialna {θ} jest niezmiennicza względem dowolnego endomorfizmu.
2. Dla dowolnego endomorfizmu ϕ : V → V przestrzeń V jest ϕ–niezmiennicza.
3. Każda podprzestrzeń liniowa U przestrzeni liniowej V jest idV –niezmiennicza
oraz Θ–niezmiennicza.
Definicja 10.1.3. Jeżeli wektor v ∈ V \{θ} oraz skalar λ ∈ F spełniają warunek
(E)
ϕ(v) = λv,
to λ nazywamy wartością własną endomorfizmu ϕ, a v — wektorem własnym
tego endomorfizmu.
Dla danej wartości własnej λ endomorfizmu ϕ zbiór
Eλ = {v ∈ V : ϕ(v) = λv}
nazywamy podprzestrzenią własną dla wartości własnej λ.
Przykład 10.1.4.
1. Dla ϕ = idV podprzestrzeń własna E1 = V .
2. Dla ϕ = −idV podprzestrzeń własna E−1 = V .
3. Jeżeli λ1 , λ2 są różnymi wartościami własnymi endomorfizmu ϕ, to
Eλ1 ∩ Eλ2 = {θ}.
Stwierdzenie 10.1.5. Niech B będzie bazą pzestrzeni liniowej V , a A macierzą
endomorfizmu ϕ w tej bazie (czyli A = MBB (ϕ)).
Wówczas λ jest wartością własną endomorfizmu ϕ wtedy i tylko wtedy, gdy
det(A − λI) = 0.
Dowód: ⇒) Załóżmy, że λ jest wartością własną endomorizmu ϕ. Istnieje
wówczas niezerowy wektor v ∈ V taki, że ϕ(v) = λv. Współrzędne wektora v w
bazie B tworzą niezerowy wektor CB (v) ∈ F n .
Stąd oraz z własności macierzy przekształcenia liniowego i współrzędnych
wektora w bazie (wn. 11.8) wynika, że
λI CB (v) = λCB (v) = CB (λv) = CB (ϕ(v)) = MBB (ϕ)CB (v) = ACB (v).
Zatem układ równań (A − λI)X = θ ma niezerowe rozwiązanie, co w połączeniu
z tw. Cramera (13.9) daje det(A − λI) = 0.
23
⇐) Załóżmy, że det(A − λI) = 0 dla pewnego λ ∈ F . Wówczas jednorodny układ równań (A − λI)X = θ ma na mocy tw. Cramera niezerowe
rozwiązanie (bo ma więcej niż jedno rozwiązanie). Niech będzie nim wektor
w = (a1 , . . . , an ) ∈ F n \ {θ}.
Połóżmy v = a1 v1 + . . . + an vn , gdzie (v1 , . . . , vn ) = B. Wówczas CB (v) = w
i analogicznie jak w części ”wtedy” otrzymujemy, że CB (ϕ(v)) = CB (λv), czyli
ϕ(v) = λv.
Stwierdzenie 10.1.6. Niech B i C będą bazami przestrzeni liniowej V , A macierzą endomorfizmu ϕ : V → V w bazie B, zaś D — macierzą ϕ w bazie C.
Wówczas dla dowolnego x ∈ F prawdziwa jest równość
det(A − xI) = det(D − xI).
Dowód: Niech E będzie macierzą przejścia od bazy B o bazy C. Wówczas
E jest macierzą nieosobliwą i D = EAE −1 , skąd na mocy własności działań na
macierzach (stw. 11.9) oraz twierdzenia Cauchy’ego (12.17) otrzymujemy
det(D − xI) = det(EAE −1 − xI) = det(EAE −1 − EE −1 xI)
= det EAE −1 − E xI E −1 = det E(A − xI)E −1
= det E det(A − xI) det E −1 = det(A − xI).
Definicja 10.1.7. Niech A będzie macierzą endomorfizmu ϕ : V → V w pewnej
bazie przestrzeni liniowej V .
Wielomian x 7→ det(A − xI) nazywamy wielomianem charakterystycznym
endomorfizmu ϕ.
Uwaga 10.1.8. Stosując rozwninięcie Laplace’a dla det(A − xI) można pokazać indukcyjnie, że wyznacznik ten jest wielomianem stopnia n = dim V o
współczynniku przy xn równym (−1)n .
Stwierdzenie 24.6 gwarantuje niezależność wielomianu charterystycznego endomorfizmu od wyboru bazy przestrzeni.
Przykład 10.1.9.
1. Wielomianem charakterystycznym tożsamości na przestrzeni n–wymiarowej jest (1 − x)n .
2. Wielomianem charakterystycznym przekształcenia zerowego na przestrzeni
n–wymiarowej jest (−1)n xn .
3. Wielomianem charakterystycznym
obrotu w R2 o kąt α, czyli przekształ
cos α − sin α
cenia danego macierzą
, jest x2 − 2x cos α + 1.
sin α
cos α
Stwierdzenie 10.1.10. Endomorfizm ϕ przestrzeni n–wymiarowej posiada n
liniowo niezależnych wektorów własnych wtedy i tylko wtedy, gdy macierz endomorfizmu ϕ w pewnej bazie jest diagonalna.
Dowód: Niech dim V = n i niech ϕ będzie endomorfizmem przestrzeni liniowej V .
Jeżeli B = (v1 , . . . , vn ) jest liniowo niezależnym układem wektorów własnych
endomorfizmu ϕ, przy czym wartość własna wektora vi wynosi λi , i = 1, . . . n,
to macierz MBB (ϕ) = [λi δij ] jest diagonalna.
24
Na odwrót, jeżeli B = (v1 , . . . , vn ) jest bazą, w której macierz A = [aij ] =
MBB (ϕ) jest diagonalna, to dla dowolnego j = 1, . . . , n mamy
ϕ(vj ) =
n
X
aij vi = ajj vj ,
i=1
czyli każdy z wektorów bazy B jest wektorem własnym endomorfizmu ϕ.
Stwierdzenie 10.1.11. Każdy endomorfizm zespolonej przestrzeni liniowej dodatniego wymiaru posiada jednowymiarową podprzestrzeń niezmienniczą (inaczej: posiada wektor własny).
Dowód: Wielomian charakterystyczny endomorfizmu ϕ przestrzeni liniowej
VC wymiaru n ∈ N ma stopień n > 0 i zespolone współczynniki. Z zasadniczego twierzenia algebry (tw. 4.12) wynika, że istnieje pierwiastek λ ∈ C tego
wielomianu.
Stwierdzenie 24.5 gwarantuje istnienie wektora własnego v endomorfizmu
ϕ o wartości własnej λ. Z jednorodności ϕ wynika, że przestrzeń lin (v) jest
ϕ–niezmiennicza.
Stwierdzenie 10.1.12. Każdy endomorfizm rzeczywistej przestrzeni liniowej
dodatniego wymiaru posiada jednowymiarową lub dwuwymiarową podprzestrzeń
niezmienniczą
Dowód:
Wniosek 10.1.13. Każdy endomorfizm rzeczywistej przestrzeni liniowej skończonego nieparzystego wymiaru posiada wektor własny.
Przykład 10.1.14.
1. W przestrzeni R2 obrót o kąt α 6= kπ nie ma wektora własnego, bo wielomian charakterystyczny x2 − 2x cos α + 1 nie ma
pierwiastków rzeczywistych.
cos α − sin α
2. Endomorfizm przestrzeni C2 dany macierzą
(taką samą
sin α
cos α
ja obrót o α w R2 ) ma wartości własne cos α±i sin α, którym odpowiadają
wektory własne (1, ∓i).
10.2
Diagonalizacja i postać Jordana
Stwierdzenie 10.2.1. Jeżeli λ1 , . . . , λk ∈ F są parami różnymi wartościami
własnymi endomorfizmu ϕ przestrzeni V , zaś v1 , . . . , vk ∈ V — odpowiadającymi im wektorami własnymi, to układ (v1 , . . . , vk ) jest liniowo niezależny.
Dowód:
Wniosek 10.2.2. Jeżeli endomorfizm ϕ n–wymiarowej przestrzeni liniowej posiada n różnych wartości własnych, to w pewnej bazie tej przestrzeni ma macierz
diagonalną.
Dowód:
25
1 0
Przykład 10.2.3. Macierz A =
ma wielomian charakterystyczny
1 1
2
(1 − x) , więc jej jedyną wartością własną jest 1. Jednak warunek Av = v spełniają tylko wektory postaci (a, 0), z których nie można utworzyć bazy przestrzeni
R2 (ani C2 ).
Definicja 10.2.4. Załóżmy, że endomorfizm ϕ n–wymiarowej przestrzeni liniowej V ma wartość własną λ ∈ F o krotności m ¬ n. Niech A będzie macierzą
endomorfizmu ϕ w pewnej bazie B. Określmy dla każdego j = 0, 1, . . . podprzestrzeń liniową
Vjλ = {v ∈ V ; (A − λI)j · CB (v) = θ}
oraz liczbę całkowitą
λ
pj+1 = dim Vj+1
− dim Vjλ .
Istnieje wówczas j0 takie, że pi0 > 0 oraz pj = 0 dla j > j0 .
Podprzestrzeń Vmλ nazywamy podprzestrzenią pierwiastkową endomorfizmu
ϕ odpowiadającą wartości własnej λ, a ciąg (p1 , . . . , pj0 ) — rozkładem charakterystycznym krotności m wartości własnej λ.
Stwierdzenie 10.2.5. Niech ϕ będzie endomorfizmem n–wymiarowej zespolonej przestrzeni liniowej V . Niech λ1 , . . . , λr ∈ C będą wszystkimi różnymi
wartościami własnymi endomorfizmu ϕ o krotnościach odpowiednio m1 , . . . , mr
(zatem m1 + . . . + mr = n). Wtedy
V = Vmλ11 ⊕ . . . ⊕ Vmλrr
(czyli przestrzeń V jest sumą prostą swoich przestrzeni pierwiastkowych).
Definicja 10.2.6. Klatką Jordana stopnia

λ 0 0 ...
 1 λ 0 ...

 0 1 λ ...
Jk (λ) = 
 . . . ...

 0 0 0 ...
0 0 0 ...
k ∈ N nazywamy macierz

0 0
0 0 

0 0 
 ∈ Mkk (F )
. . 

λ 0 
1 λ
Macierzą Jordana nazywamy macierz, która wzdłuż głównej przekątnej ma
umieszczone klatki Jordana, a poza tym klatkami — same zera.
Twierdzenie 10.2.7. (Jordana) F Dowolny endomorfizm skończenie wymiarowej zespolonej przestrzeni liniowej ma w pewnej bazie macierz Jordana. Rozkład
na klatki Jordana jest jednoznaczny z dokładnością do ich kolejności.
Dokładniej, jeżeli λ ∈ C jest wartością własną o krotności m endomorfizmu
ϕ : V → V , (p1 , . . . , pj0 ) jest rozkładem charakterystycznym tej krotności, to
macierz endomorfizmu ϕ|Vmλ ma w pewnej bazie postać Jordana, przy czym dla
k = 1, . . . , j0 macierz ta zawiera dokładnie pk − pk+1 klatek Jk (λ).
Dowód: J. Komorowski, Od liczb zespolonych do tensorów, spinorów, algebr
Liego i kwadryk.
Definicja 10.2.8. Śladem macierzy kwadratowej A = [aij ] ∈ Mnn (F ) nazywamy skalar
n
X
tr A =
aii
i=1
26
Stwierdzenie 10.2.9. Jeżeli D i E są macierzami endomorfizmu ϕ odpowiednio w bazach D i E, to
det D = det E,
tr D = tr E
Dowód: Ze stw. 3.5.6 wynika, że E = CDC −1 , gdzie C = MDE .
Z tw. Cauchy’ego mamy zatem
−1
det E = det C · det D · (det C)
= det D.
Zauważmy teraz, że ślad iloczynu dwóch macierzy nie zależy od kolejności
czynników. Istotnie, jeżeli A = [aij ], B = [bkl ] ∈ Mnn , to
tr (AB) =
n X
n
X
i=1 j=1
aij bji =
n X
n
X
bkl alk = tr (BA).
k=1 l=1
Zatem
tr E = tr CDC −1 = tr DC −1 C = tr D.
Wniosek 10.2.10. Wyznacznik macierzy endomorfizmu przestrzeni zespolonej
jest iloczynem wszystkich wartości własnych tego endomorfizmu licząc z krotnościami, a ślad macierzy endomorfizmu — sumą wszystkich wartości własnych
tego endomorfizmu licząc z krotnościami
Przykład 10.2.11. Rozważmy endomorfizm

1 1 0 0
 0 1 0 2

 0 0 1 0
A=
 0 0 0 1

 0 0 0 0
0 0 0 0
przestrzeni C6 dany macierzą

0 0
0 0 

0 1 

0 0 

1 0 
0 1
która, jak łatwo widać ma sześciokrotną wartość
cierzy A − I są równe: (A − I)0 = I,



0
0 1 0 0 0 0
 0 0 0 2 0 0 
 0



 0
 0 0 0 0 0 1 
2


A−I = 
 0 0 0 0 0 0  , (A−I) =  0



 0
 0 0 0 0 0 0 
0
0 0 0 0 0 0
własną 1. Kolejne potęgi ma0
0
0
0
0
0
0
0
0
0
0
0
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0




 , (A−I)3 = θ.



Tym samym j0 = 3, a rozkładem charakterystycznym krotności 6 dla wartości
własnej 1 jest (3, 2, 1). Oznacza to, że macierz Jordana endomorfizmu ϕ zawiera
po jednej klatce J1 (1), J2 (1), J3 (1), jest więc równa


1 0 0 0 0 0
 0 1 0 0 0 0 


 0 1 1 0 0 0 


 0 0 0 1 0 0 


 0 0 0 1 1 0 
0 0 0 0 1 1
27
Definicja 10.2.12. Uogólnioną klatką

A 0 0
 I A 0

 0 I A
J2k (α, β) = 
 . . .

 0 0 0
0 0 0
Jordana nazywamy macierz

... 0 0
... 0 0 

... 0 0 
 ∈ M2k,2k (R)
... . . 

... A 0 
... I A
gdzie α, β ∈ R oraz
A=
α
−β
β
α
,
I=
1
0
0
1
Wniosek 10.2.13. (uogólniony rozkład Jordana w przestrzeni rzeczywistej)
Jeżeli ϕ jest endomorfizmem skończenie wymiarowej rzeczywistej przestrzeni
liniowej V , to istnieje baza tej przestrzeni, w której endomorfizm ϕ ma macierz będącą w uogólnionej postaci Jordana. Oznacza to , że wzdłuż przekątnej
umieszczone są klatki Jordana lub uogólnione klatki Jordana, a poza nimi w
macierzy są same zera.
11
11.1
Grupy przekształceń i geometrie nieeuklidesowe
Grupy i działania grup na przestrzeniach
Definicja 11.1.1. Grupą nazywamy parę uporządkowaną (G, ·), gdzie G jest
zbiorem niepustym oraz · : G × G → G, spełniającą warunki:
(G1)
∀a,b,c∈G (a · b) · c = a · (b · c)
(G2)
∃e∈G ∀a∈G a · e = e · a = a
(G3)
∀a∈G ∃a−1 ∈G a · a−1 = a−1 · a = e
Definicja 11.1.2. Podgrupą grupy (G, ·) nazywamy niepusty podzbiór H ⊂ G
spełniający warunek
(SG)
Przykład 11.1.3.
∀a,b∈H a · b−1 ∈ H
1. (Rn , +) jest grupą, a Zn jest jej podgrupą.
2. (GL(n, F), ·) jest grupą, a SL(n, F) = {A ∈ Mnn (F) ; det A = 1} jest jej
podgrupą.
Definicja 11.1.4. Niech (G, ·) i (H, ∗) będą grupami, a ϕ funkcją działającą z
G w H. Mówimy, że ϕ jest homomorfizmem (grup), jeżeli spełnia warunek
(H)
∀a,b∈G ϕ(a · b) = ϕ(a) ∗ ϕ(b)
Izomorfizmem (grup) nazywamy homomorfizm, który jest jednocześnie bijekcją.
Mówimy, że grupy (G, ·) i (H, ∗) są izomorficzne i piszemy (G, ·) ∼
= (H, ∗), gdy
istnieje izomorfizm grupy (G, ·) na grupę (H, ∗).
28
Przykład 11.1.5.
1. Tożsamość idG jest izomorfizmem grupy (G, ·).
2. Funkcja G 3 a 7→ eH ∈ H jest homomorfizmem grupy (G, ·) w grupę
(H, ∗).
3. Grupy (R, +) i (R+ , ·) są izomorficzne poprzez dowolną funcję wykładniczą
x 7→ ax , gdzie a > 0 i a 6= 1.
4. Bijekcje ustalonego niepustego zbioru X stanowią grupę z działaniem składania funkcji.
5. Izomorfizmy liniowe ustalonej przestrzeni liniowej na siebie tworzą grupę
z działaniem składania.
Definicja 11.1.6. Mówimy, że grupa (G, ·) działa na zbiorze X i piszemy G y
X, gdy istnieje homomorfizm grupy G w grupę bijekcji zbioru X. Innymi słowy,
jeżeli każdemu elementowi g ∈ G przypisujemy bijekcję ψ(g) : X → X, to
spełniony jest warunek
∀g,g0 ∈G ∀x∈X ψ(g · g 0 )(x) = ψ(g) (ψ(g 0 )(x))
Zamiast ψ(g)(x) piszemy często po prostu gx.
Możemy mówić o działaniu grupy G na zbiorze X poprzez homeomorfzimy,
izometrie, dyfeomorfizmy, przekształcenia liniowe itd., o ile w zbiorze X określona jest odpowiednio struktura topologiczna, metryczna, różniczkowa, liniowa
itd., a elmentom grupy G przypisane są odpowiednio homeomorfzimy, izometrie,
dyfeomorfizmy, przekształcenia liniowe itd.
Przykład 11.1.7.
1. Grupa GL(n, F) działa na przestrzeni Fn w taki sposób, że macierzy nieosobliwej A odpowiada izomorfizm, dla którego A jest
macierzą w bazie kanonicznej tzn. ψ(A)(x) = Ax.
2. Grupa (V, +) działa na przestrzeni afinicznej (E, V, →) za pomocą translacji, tzn. ψ(v) = Tv .
3. Grupa S 1 = {z ∈ C ; |z| = 1} (z działaniem mnożenia liczb zespolonych)
działa na płaszczyźnie zespolonej C za pomocą obrotów, tzn. ψ(z) jest dla
z ∈ S 1 obrotem dookoła 0 o kąt arg z.
Definicja 11.1.8. Załóżmy, że grupa G działa na zbiorze X. Orbitą punktu
x ∈ X nazywamy zbiór
Gx = {gx ; g ∈ G} ⊂ X.
Stabilizatorem punktu x ∈ X nazywamy zbiór
Stab (x) = {g ∈ G ; gx = x} ⊂ G.
Definicja 11.1.9. Mówimy, że działanie grupy G na zbiorze X jest
1. przechodnie, gdy dla każdych x, x0 ∈ X istnieje takie g ∈ G, że gx = x0 .
2. wolne, jeżeli z faktu, że dla pewnego x ∈ X zachodzi gx = x wynika, że
g = e.
29
3. efektywne (lub wierne), gdy homomorfizm ψ jest różnowartościowy.
Przykład 11.1.10.
1. Przy działaniu S 1 na C: G0 = {0} oraz Gz = {w ∈
C ; |w| = |z|} dla z =
6 0, zaś Stab (0) = S 1 oraz Stab (z) = {1} dla z 6= 0.
Działanie to nie jest więc ani przechodnie, ani wolne, ale jest wierne.
2. działanie (V, +) na przestrzeni afinicznej (E, V, →) jest wolne, przechodnie
i efektywne.
Definicja 11.1.11. Niech homomorfizm ψ określa jak grupa (H, ∗) działa na
grupę (G, ·). Zbiór G × H z działaniem określonym wzorem
(g, h)(g 0 , h0 ) = (g · (ψ(h)(g 0 )), h ∗ h0 )
dla (g, h), (g 0 , h0 ) ∈ G × H
nazywamy iloczynem półprostym grup G oraz H i oznaczamy przez G o H.
11.2
Izometrie przestrzeni euklidesowej
Definicja 11.2.1. Niech V , W będą przestrzeniami liniowymi z iloczynem skalarnym, zaś ϕ : V → W przekształceniem liniowym. Odwzorowanie ϕ nazywamy
przekształceniem ortogonalnym, gdy zachowuje iloczyn skalarny, to znaczy gdy
(OM)
∀v1 ,v2 ∈V hϕ(v1 ), ϕ(v2 )i = hv1 , v2 i
(po lewej stronie równości stosujemy iloczyn skalarny w przestrzeni W , a po
prawej — w przestrzeni V ).
Stwierdzenie 11.2.2. Przekształcenia ortogonalne ustalonej przestrzeni euklidesowej liniowej w siebie, z działaniem składania, stanowią grupę.
Dowód: Niech (V, h., .i) będzie przestrzenią euklidesową liniową.
Zauważmy, że każde przekształcenie ortogonalne ϕ : V → V jest różnowartościowe. Na mocy stw. 9.13 wystarczy pokazać, że jadro przekształcenia ϕ jest
trywialne. Z faktu ϕ(v) = θ wynika na mocy definicji przekształcenia ortogonalnego, że hϕ(v), ϕ(v)i = 0 = hv, vi, co wraz z (IP3) daje v = θ.
Różnowartościowość przekształcenia ortogonalnego V → V zgodnie ze stw.
9.15 gwarantuje, że przekształcenie to jest izomorfizmem.
Wystarczy zatem pokazać, że przekształcenia ortogonalne przestrzeni V stanowią podgrupę jej izomorfizmów.
Biorąc przekształcenia ortogonalne ϕ oraz ψ przestrzeni V w nią samą otrzymujemy z definicji dla v1 , v2 ∈ V :
hψ ◦ ϕ(v1 ), ψ ◦ ϕ(v2 )i = hϕ(v1 ), ϕ(v2 )i = hv1 , v2 i,
co wraz ze stw. 9.6(2) daje ortogonalność przekształcenia ψ ◦ ϕ.
Ponadto ze stw. 9.6(3) wynika, że ϕ−1 jest izomorfizmem, a definicja przekształcenia ortogonalnego pociąga za sobą dla v1 , v2 ∈ V równość
hϕ−1 (v1 ), ϕ−1 (v2 )i = hϕ ◦ ϕ−1 (v1 ), ϕ ◦ ϕ−1 (v2 )i = hv1 , v2 i,
co oznacza ortogonalność przekształcenia ϕ−1 .
Przykład 11.2.3.
1. Tożsamość jest przekształceniem ortogonalnym dowolnej przestrzeni z iloczynem skalarnym na siebie.
30
2. Symetria środkowa v 7→ −v jest przekształceniem ortogonalnym dowolnej
przestrzeni z iloczynem skalarnym na siebie.
3. Sprzężenie z 7→ z jest przekształceniem ortogonalnym przestrzeni CR ze
standardowym iloczynem skalarnym na siebie.
Definicja 11.2.4. Macierz A ∈ Mnn (R) nazywamy macierzą ortogonalną stopnia n, gdy AAT = I.
Zbiór wszystkich macierzy ortogonalnych stopnia n oznaczamy przez O(n), a
pozbiór zawierający te spośród nich, które mają wyznacznik 1 — przez SO(n).
Stwierdzenie 11.2.5. Zbiór O(n) z działaniem mnożenia macierzowego stanowi grupę, której podgrupą jest SO(n).
Dowód: Z definicji, tw. Cauchy’ego (12.17) i ze stw. 12.4 wynika, że macierz
ortogonalna ma wyznacznik równy ±1.
Wystarczy więc pokazać, że O(n) jest podgrupą ogólnej grupy liniowej GL(n, R).
Dla A, B ∈ O(n) spełniony jest warunek AAT = I = BB T , co wraz ze
własnościami transpozycji (stw. 11.18(3)) daje
(AB)(AB)T = (AB) B T AT = A BB T AT = AAT = I,
czyli ortogonalność macierzy AB.
Dla dowodu ortogonalności macierzy A−1 , gdzie A ∈ O(n), wystarczy zauważyć, że A−1 = AT i AT A = A−1 A = AA−1 = AAT = I, skąd natychmiast
(stw. 11.8(4)) wynika, że
A−1 A−1
T
= AT AT
T
= AT A = I.
SO(n) jest podgrupą O(n) na mocy tw. Cauchy’ego.
a b
Przykład 11.2.6. Macierz A =
jest ortogonalna wtedy i tylko wtedy,
c d
gdy spełnione są warunki
 2
 a + b2 = 1
ac + bd = 0
 2
c + d2 = 1
Z pierwszego i trzeciego z nich otrzymujemy istnienie takich α oraz β, że
a = cos α, b = − sin α, c = sin β, d = cos β,
a wówczas z drugiego sin(β − α) = 0. Wystarczy rozważyć przypadki β = α lub
β = π + α i obliczyć wyznaczniki, aby zauważyć, że
cos α − sin α
SO(2) =
; α ∈ [0, 2π)
sin α
cos α
oraz
O(2) = SO(2) ∪
cos α
− sin α
− sin α
− cos α
; α ∈ [0, 2π)
Stwierdzenie 11.2.7. A jest macierzą przekształcenia ortogonalnego przestrzeni Rn ze standardowym iloczynem skalarnym w siebie (w bazie kanonicznej)
wtedy i tylko wtedy, gdy A ∈ O(n).
31
Dowód: W przestrzeni Rn standardowy iloczyn skalarny jest dany wzorem
hv, wi = v T w
(wektory v, w ∈ Rn traktujemy jako macierze n×1). Zatem jeżeli A jest macierzą
przekształcenia liniowego ϕ : Rn → Rn w bazie kanonicznej, to dla v, w ∈ Rn
hϕ(v), ϕ(w)i = hAv, Awi = v T AT Aw.
⇒) Jeżeli A jest macierzą przekształcenia ortogonalnego ϕ : Rn → Rn w
bazie kanonicznej, to v T w = v T AT Aw dla dowolnych v, w ∈ Rn . Biorąc za v i
w wektory bazy kanonicznej, odpowiednio ei i ej otrzymujemy, że wyraz (i, j)
macierzy AT A jest równy δij , i, j = 1, . . . , n. Zatem AT A = I, czyli A ∈ O(n).
⇐) Jeżeli A ∈ O(n), to przekształcenie liniowe ϕ : v 7→ Av ma w bazie
kanonicznej macierz A oraz zachowuje iloczyn skalarny, bo AT A = I.
Definicja 11.2.8. Izometrią przestrzeni euklidesowej E nazywamy funkcję przekształcającą E na E i zachowującą odległość, to znaczy spełniającą warunek
(I)
∀x,y∈E |f (x)f (y)| = |xy|.
Zbiór wszystkich izometrii przestrzeni E oznaczamy przez Isom (E).
Stwierdzenie 11.2.9. Izometrie dowolnej przestrzeni euklidesowej z działaniem składania tworzą grupę.
Dowód: Każda izometria jest przekształceniem różnowartościowym, bo z
własności normy (N1) wynika równoważność
−−−−−−→
→ = θ ⇔ x = y.
f (x) = f (y) ⇔ f (x)f (y) = θ ⇔ |f (x)f (y)| = 0 ⇔ |xy| = 0 ⇔ −
xy
Zatem każda izometria f : E → E jako przekształcenie ńa”jest bijekcją i tym
samym posiada przekształcenie odwrotne f −1 . Wystarczy więc pokazać, że dla
f, g ∈ Isom E spełnione są warunki f ◦g ∈ Isom E oraz f −1 ∈ Isom E, co wynika
z definicji:
|f ◦ g(x), f ◦ g(y)| = |g(x), g(y)| = |xy|
−1
f (x), f −1 (y) = f ◦ f −1 (x), f ◦ f −1 (y) = |xy|.
1. Translacja Tv : x 7→ x + v jest izometrią. Istotnie,
−−−−−−−−→
→ = |xy|.
|Tv (x) Tv (y)| = x + v, y + v = k−
xyk
Przykład 11.2.10.
2. W przestrzeni En przekształcenie dane wzorem
−
→
x 7→ A · θx + b
(lub krótko Ax + b), gdzie A ∈ O(n), b ∈ Rn , jest izometrią, bo jego przekształceniem liniowym jest przekształcenie ortogonalne (czyli zachowujące
także normę) o macierzy A (por. stw. 22.7).
32
Definicja 11.2.11. Niech H będzie podprzestrzenią afiniczną przestrzeni euklidesowej E. Funkcję sH : E → E daną wzorem
−−−−−→
sH (x) = x + 2 xπH (x)
dla x ∈ E
(πH oznacza rzut ortogonalny na podprzestrzeń H) nazywamy symetrią względem podprzestrzeni H.
Przykład 11.2.12.
1. Symetria środkowa sp = s{p} dla dowolnego p ∈ E
jest dana wzorem
→=p+−
→
sp (x) = x + 2 −
xp
xp,
bo rzutowanie πp odbywa się na jedyny punkt p.
2. Jeżeli H jest hiperpłaszczyzną w E, p ∈ H, a v jest jednostkowym wektorem normalnym do H (innymi słowy H = p + v ⊥ ), to symetria hiperpłaszczyznowa względem H wyraża się wzorem
→ viv,
sH (x) = x − 2h−
px,
→ viv jest składową wektora −
→ równoległą do wektora v rozpinagdyż h−
px,
px
⊥
jącego przestrzeń S(H) , więc
→ =p+−
→ − h−
→ viv = x − h−
→ viv.
πH (x) = p + projS(H) (−
px)
px
px,
px,
3. W przestrzeni E2 prosta jest hiperpłaszczyzną.
Jeżeli prosta L nie jest równoległa do drugiej osi, to ma równanie postaci
y = mx + n, można więc przyjąć w poprzednim przykładzie p = (0, n)
1
(m, −1), skąd
oraz v = √1+m
2
sL ((x, y)) =
(1 − m2 )x + 2my − 2mn 2mx − (1 − m2 )y + 2n
,
1 + m2
1 + m2
.
Jeżeli zaś prosta L jest równoległa do drugiej osi, to ma równanie postaci
x = c. Wówczas p = (c, 0), v = (1, 0), skąd
sL ((x, y)) = (2c − x, y).
Stwierdzenie 11.2.13. Niech H będzie podprzestrzenią afiniczną przestrzeni
euklidesowej E. Symetria sH względem podprzestrzeni H ma następujące własności:
1. sH jest inwolucją, tzn. sH ◦ sH = idE ;
2. sH jest izometrią;
3. podprzestrzeń H jest zbiorem wszystkich punktów stałych prekształcenia
sH , tzn. sH (x) = x wtedy i tylko wtedy, gdy x ∈ H.
Dowód: Oznaczmy przez s symetrię względem podprzestrzeni H, a przez π
— rzut ortogonalny na tę podprzestrzeń.
33
−−−→
1. Dla x ∈ E z uwagi na xπ(x) ⊥ H mamy
−−−−−−−
−−
−−
−→
−−
−−
−−
−
−→
−−−
−−−−−−
−−−→
−−−→
→
s ◦ s(x) = s x + 2 xπ(x) = x + 2 xπ(x) + 2 x + 2 xπ(x) π x + 2 xπ(x)
−−−−−−−
−−
−−
−→
−−
−−−→
−−−→
−−−→
−−−→
= x + 2 xπ(x) + 2 x + 2 xπ(x) π(x) = x + 2 xπ(x) − 2 xπ(x) = x.
2. Z definicji symetrii dla x, y ∈ E otrzymujemy
−−−−−→ −−−−−→ −−−−−−→ −−−−−→
s(x)s(y) = s(x)π(x) + π(x)π(y) + π(y)s(y)
−−−−−−−
−−
−−
−→
−−
−−
−−
−
−→
−−−→ −−−−−−→ −−−−−
−−−−−−
→
= x + 2 xπ(x) π(x) + π(x)π(y) + π(y) x + 2 xπ(x)
−−−→ −−−→ −−−−−−→
= − xπ(x) + yπ(y) + π(x)π(y)
i ostatni wektor, jako należący do S(H), jest ortogonalny do sumy dwóch
pozostałych (bo każdy z nich należy do S(H)⊥ ). Stąd i z twierdzenia
Pitagorasa otrzymujemy
−−−−−→2 −−−→ −−−→2 −−−−−−→2
|s(x)s(y)|2 = s(x)s(y) = xπ(x) + yπ(y) + π(x)π(y)
−−−→ −−−→ −−−−−−→2
→ 2 = |xy|,
= xπ(x) + yπ(y) + π(x)π(y) = k−
xyk
co wraz z wzajemną jednoznacznością s (wynika z inwolutywności) daje
izometryczność tego przekształcenia.
3. Dla x ∈ E mamy
−−−→
s(x) = x ⇔ 2 xπ(x) = θ ⇔ x = π(x) ⇔ x ∈ H.
Twierdzenie 11.2.14. (Mazura–Ulama)
desowej jest przekształceniem afinicznym.
F
Każda izometria przestrzeni eukli-
Dowód: Niech E będzie przestrzenią euklidesową, f ∈ Isom(E) i niech p ∈ E,
q = f (p). Wówczas dla x ∈ E
−−−→
→ .
f (p) + qf (x) = f (x) = f (p + −
px)
−−→
→ =−
Przyjmując ϕ (−
px)
qf (x) widzimy, że na mocy stwierdzenia 17.4 afiniczność
przekształcenia f wynika z liniowości przekształcenia ϕ.
Pokażemy najpierw, że ϕ jest przekształceniem jednorodnym. Niech a ∈ R
→
→ otrzymujemy −
→ Tym samym punkty
i x ∈ E. Kładąc x0 = x + a −
px
px0 = a −
px.
0
p, x, x są współliniowe, więc jeden z nich należy do odcinka o końcach w pozostałych punktach. Możliwe są więc przypadki:
I. x0 ∈ px
II. x ∈ px0
III. p ∈ xx0
−−−−→
Rozważmy przypadek I. Gdy p = x, to p = x0 = x, czyli qf (x0 ) = θ =
−−−→
a qf (x).
34
Jeżeli p 6= x, to z lematu o odcinku (stw. 19.15) wynika, że
|px0 | + |x0 x| = |px|,
a ponieważ izometria f zachowuje odległości, także
|f (p)f (x0 )| + |f (x0 )f (x)| = |f (p)f (x)|.
Stosując ponownie lemat o odcinku wnioskujemy, że f (x0 ) ∈ qf (x). Zatem ist−−−−→
−−−→
nieje b ∈ [0, 1] takie, że qf (x0 ) = bqf (x), co wraz z powyższymi warunkami na
odległość daje
−−−→
−→ −−−−→
→ ,
→ =
pxk
a k−
pxk
px0 = qf (x0 ) = b qf (x) = b k−
→ = a ϕ (−
→ co kończy
skąd na mocy p 6= x otrzymujemy a = b, czyli ϕ (−
a−px)
px),
dowód jednorodności w przypadku I. Przypadki II i III rozważamy analogicznie.
Aby wykazać addytywność przekształcenia ϕ zauważmy najpierw, że izometria na mocy lematu o odcinku zachowuje środek odcinka, tzn. dla x, y ∈ E
1
1
1
1
f
x + y = f (x) + f (y).
2
2
2
2
To z kolei wraz z udowodnioną właśnie jednorodnościa pociąga za sobą ciąg
równości
−−−
−−−−−−−→
−−−−−−−−−−−−→
→ + 1−
→ = 2 qf 1 x + 1 y = 2 q, 1 f (x) + 1 f (y)
→+−
→ = 2ϕ 1 −
px
py
ϕ (−
px
py)
2
2
2
2
2
2
−
−
−
→
−
−
−
→
1
1
→ + ϕ (−
→
=2
qf (x) + qf (x) = ϕ (−
px)
py)
2
2
Ostatecznie ϕ spełnia (LM1) i (LM2), jest więc przekształceniem liniowym,
a izometria f — przekształceniem afinicznym.
∼ Rn o O(n),
Wniosek 11.2.15. Isom(En ) =
czyli grupa izometrii przestrzeni En (z działaniem składania) jest izomorficzna
z iloczynem półprostym grup (Rn , +) oraz (O(n), ·).
Dowód: szkic Bridson, Haefliger, Metric Spaces of Nonpositive Curvature Uwaga 11.2.16. Klasyfikacja izometrii przestrzeni En stanowi, że wszystkie
izometrie tej przestrzeni są postaci opisanej w przykładzie 11.2.10(2).
Uwaga 11.2.17. Podobnie można pokazać, że przekształcenie liniowe związane
z izometrią jest ortogonalne, a dla dowolnej przestrzeni euklidesowej E mamy
Isom(E) ∼
= V o O(V ), gdzie V = S(E), zaś O(V ) jest grupą przekształceń
ortogonalnych przestrzeni V w siebie.
Twierdzenie 11.2.18. Każda izometria n–wymiarowej przestrzeni euklidesowej jest złożeniem symetrii hiperpłaszczyznowych w liczbie nie przekraczającej
n + 1.
35

Podobne dokumenty