Algebra

Transkrypt

Algebra
Algebra
Spis treści
Wykład 1
Wstęp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Relacja równości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
4
6
Wykład 2
Pierścień . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Liczby całkowite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Relacja nierówności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
6
7
8
Wykład 3
Relacja podzielności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Liczby pierwsze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Największy wspólny dzielnik . . . . . . . . . . . . . . . . . . . . . . . . . .
8
8
9
9
Wykład 4
Ciało . . . . . . . . . .
Relacja równoważności
Konstrukcja ułamków .
Pierścień Zn . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
12
13
14
Wykład 5
15
Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Liczby zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Izometrie płaszczyzny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Wykład 6
19
Wielomiany . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Wykład 7
21
Pierwiastki wymierne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Podzielność wielomianów . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Pierwiastki rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Wykład 8
24
Zasadnicze twierdzenie algebry . . . . . . . . . . . . . . . . . . . . . . . . 24
Równania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1
Wykład 9
26
Równanie 3 stopnia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Równanie 4 stopnia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Wielomiany symetryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Wykład 10
31
Grupy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Wykład 11
34
Podgrupy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Wykład 12
37
Permutacje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Wykład 13
40
Dzielnik normalny i grupa ilorazowa . . . . . . . . . . . . . . . . . . . . . 40
Jądro homomorfizmu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Wykład 14
Przestrzeń liniowa
43
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Wykład 15
46
Przekształcenia liniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Wykład 16
49
Dodawanie macierzy i mnożenie macierzy przez skalar . . . . . . . . . . . . 49
Mnożenie macierzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Zmiana bazy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Wykład 17
52
Równania liniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Wykład 18
55
Jak znaleźć rząd macierzy? . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Równania i wyznaczniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Wykład 19
58
Definicja i własności wyznacznika . . . . . . . . . . . . . . . . . . . . . . . 58
Wykład 20
61
Niezmienniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Rozwinięcie Laplace’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Dwa twierdzenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Wykład 21
65
Wektory i wartości własne . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2
Wykład 22
68
Formy kwadratowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Diagonalizacja Lagrange’a . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
Wykład 23
72
Grupa obrotów i grupa Lorentza . . . . . . . . . . . . . . . . . . . . . . . . 72
Wykład 24
Przekształcenia hermitowskie i unitarne
3
76
. . . . . . . . . . . . . . . . . . . 76
Wstęp
1. Liczby naturalne N = {0, 1, 2, 3, ...}.
Niektórzy przyjmują N = {1, 2, 3, ...}.
Liczby naturalne można dodawać i mnożyć. Nie można od mniejszej liczby
odejmować większej.
2. Liczby całkowite Z = {..., −2, −1, 0, 1, 2, ...},
Własności dodawania i mnożenia:
• (a + b) + c = a + (b + c)
• a+b=b+a
• a+0=a
N⊂Z
(łączność dodawania)
(przemienność dodawania)
(0 jest elementem neutralnym względem dodawania)
• Dla każdego a znajdziemy b takie, że a + b = 0
przeciwną do a)
• a(bc) = (ab)c
• ab = ba
• a1 = a
(b nazywamy liczbą
(łączność mnożenia)
(przemienność mnożenia)
(1 jest elementem neutralnym względem mnożenia)
• a(b + c) = ab + ac
(rozdzielność)
3. Zbiór z dwoma działaniami spełniającymi powyżej wypisane własności nazywamy pierścieniem (przemiennym z 1).
4. Liczby wymierne czyli ułamki Q. Własności dodawania i mnożenia:
• (a + b) + c = a + (b + c)
• a+b=b+a
• a+0=a
• Dla każdego a znajdziemy b takie, że a + b = 0
• a(bc) = (ab)c
• ab = ba
• a1 = a
• dla każdego a 6= 0 znajdziemy b takie, że ab = 1 (b nazywamy liczbą
odwrotną do liczby a)
• a(b + c) = ab + ac
5. Zbiór z dwoma działaniami spełniającymi powyżej wypisane własności nazywamy ciałem. Zakłada się, że 1 6= 0.
6. Inne przykłady ciał: liczby rzeczywiste R, liczby zespolone C (liczby postaci
a + bi, gdzie i2 = −1). Z ⊂ Q ⊂ R ⊂ C.
7. Jeszcze jeden przykład pierścienia. Wielomiany o współczynnikach rzeczywistych. Wyrażenia postaci
a0 + a1 x + a2 x2 + · · · + an xn , a0 , a1 , ..., an ∈ R.
4
8. Wektory w R3 . Dodawanie wektorów i mnożenie wektora przez liczbę:
(x, y, z) + (x0 , y 0 , z 0 ) = (x + x0 , y + y 0 , z + z 0 ), α(x, y, z) = (αx, αy, αz).
Wektorów tworzą przestrzeń wektorową (liniową).
9. Własności działań (u, v, w ∈ R3 , α, β ∈ R)
• (u + v) + w = u + (v + w)
• u+v=v+u
• u + 0 = u (w naszym przykładzie 0 = (0, 0, 0))
• Dla każdego wektora u znajdziemy wektor v taki, że u + v = 0
• 1u = u
• α(βu) = (αβ)u
• α(u + v) = αu + αv
• (α + β)u = αu + βu
10. (x, y, z) = x(1, 0, 0) + y(0, 1, 0) + z(0, 0, 1)
Każdy wektor (x, y, z) możemy w dokładnie jeden sposób przedstawić jako sumę wektorów (1, 0, 0), (0, 1, 0), (0, 0, 1) pomnożonych przez pewne liczby. Zbiór
takich wektorów nazywamy bazą.
11. Funkcja f : podzbiór X × Y taki, że
• dla każdego x ∈ X istnieje y ∈ Y takie, że (x, y) ∈ f ,
• jeśli (x, y) ∈ f i (x, z) ∈ f , to z = y.
12. Zamiast pisać (x, y) ∈ f piszemy y = f (x) (na wykładzie zamiast formalnych
definicji były odpowiednie rysunki).
13. Mówimy, że f jest funkcją różnowartościową, jeśli z równości
f (a) = f (b) wynika równość a = b.
14. Mówimy, że f przekształca X na Y , jeśli dla każdego y ∈ Y znajdziemy x ∈ X
takie, że f (x) = y.
15. Funkcja różnowartościowa przekształcająca X na Y jest odwracalna.
16. Grupa przekształceń. Niech S3 oznacza zbiór wszystkich funkcji
przekształcających {1, 2, 3} na {1, 2, 3}. Takich funkcji jest 6.
Własności S3
• f ∈ S3 ⇒ f jest odwracalna i f −1 ∈ S3
• f, g ∈ S3 ⇒ f ◦ g ∈ S3
17. Składanie funkcji jest łączne. f ◦ g(x) = f (g(x)),
((f ◦ g) ◦ h)(x) = (f ◦ g)(h(x)) = f (g(h(x)),
(f ◦ (g ◦ h))(x) = f ((g ◦ h)(x)) = f (g(h(x)).
Dlatego (f ◦ g) ◦ h = f ◦ (g ◦ h).
5
18. Abstrakcyjna definicja. Grupą nazywamy zbiór G z jednym działaniem posiadającym następujące własności
• (f g)h = f (gh)
• Istnieje element e taki, że ef = f e = f
• Dla każdego f znajdziemy g takie, że f g = gf = e
Relacja równości
Własności:
• a=a
• a=b⇒b=a
• a=bib=c⇒a=c
• Jeśli f jest funkcją i a = b, to f (a) = f (b).
• Jeśli ψ jest formą zdaniową (zdaniem z parametrami)
i a = b, to ψ(a) ⇔ ψ(b)
Z wymienionych własności wynika m.in., że jeśli a = b, to a + c = b + c.
Pierścień
Pierścieniem przemiennym z jednością nazywamy zbiór z dwoma działaniami posiadającymi następujące własności
• (a + b) + c = a + (b + c)
• a+b=b+a
• Istnieje element 0 taki, że a + 0 = a
• Dla każdego a istnieje b takie, że a + b = 0
• a(bc) = (ab)c
• ab = ba
• Istnieje element 1 taki, że a1 = a
• a(b + c) = ab + ac
Z powyższych własności wynikają następujące własności
• Element 0 jest jedyny.
Dowód. Załóżmy, że 0, 0’ są elementami neutralnymi względem dodawania.
Wtedy 0=0+0’=0’+0=0’.
6
• Element 1 jest jedyny.
Dowód. Załóżmy, że 1, 1’ są elementami neutralnymi względem mnożenia.
Wtedy 1=11’=1’1=1’.
• Element przeciwny jest jedyny. Element przeciwny do a oznaczamy przez −a.
Dowód. Załóżmy, że a + b = 0 i a + c = 0. Wtedy
a = a + 0 = a + (a + c) = a + (b + c) = (a + b) + c = 0 + c = c + 0 = c.
• −(a + b) = (−a) + (−b)
Dowód. Obie strony są przeciwne do a + b.
• 0a = 0
Dowód. 0a = a0 = a(0 + 0) = a0 + a0. Dlatego
0 = a0 + (−a0) = (a0 + a0) + (−a0) = a0 + (a0 + (−a0)) = a0 + 0 = a0.
• a − b oznacza a + (−b).
• −(−a) = a
Dowód. a + (−a) = 0 i (−(−a)) + (−a) = 0. Dlatego −(−a) = a.
• a(b − c) = ab − ac
• a(−b) = −ab
Liczby całkowite
Liczby całkowite Z tworzą pierścień. Liczby całkowite posiadają jeszcze dwie ważne
własności.
• Jeśli a 6= 0 i b 6= 0, to ab 6= 0
(mówimy, że w pierścieniu nie ma dzielników zera)
• Niech N = {0, 1, 1 + 1, 1 + 1 + 1, . . .}.
N 6= Z. Ale jeśli n ∈ Z, to n ∈ N lub −n ∈ N.
Zasada indukcji
Zasada indukcji 1. Niech T0 , T1 , T2 , . . . będzie ciągiem zdań.
Jeśli T0 oraz Tn ⇒ Tn+1 dla n = 0, 1, 2, . . .,
to Tn dla n = 0, 1, 2, . . ..
Zasada indukcji 2.
Jeśli T0 , oraz T0 , T1 , . . . , Tn ⇒ Tn+1
to Tn dla n = 0, 1, 2, . . ..
dla n = 0, 1, 2, . . .,
Dla przykładu udowodnimy przez indukcję wzór
0 · 1 + 1 · 2 + 2 · 3 + · · · + n(n + 1) = n(n + 1)(n + 2)/3.
7
Dowód. Dla n = 0 mamy 0 · 1 = 0 i 0 · 1 · 2/3 = 0.
Załóżmy, że
0 · 1 + 1 · 2 + 2 · 3 + · · · + n(n + 1) = n(n + 1)(n + 2)/3.
Wtedy
0 · 1 + 1 · 2 + 2 · 3 + · · · + n(n + 1) + (n + 1)(n + 2) =
= n(n + 1)(n + 2)/3 + (n + 1)(n + 2) =
= (n + 1)(n + 2)(n/3 + 1) = (n + 1)(n + 2)(n + 3)/3.
Dlatego dla każdego n
0 · 1 + 1 · 2 + 2 · 3 + · · · + n(n + 1) = n(n + 1)(n + 2)/3.
Zasada minimum. W każdym niepustym podzbiorze N znajdziemy
element najmniejszy.
Relacja nierówności
Liczby (Z, Q, R) można podzielić na trzy rozłączne podzbiory:
{0}, liczby dodatnie i liczby ujemne (przeciwne do dodatnich).
• Suma liczb dodatnich jest dodatnia.
• Iloczyn liczb dodatnich jest dodatni.
• a < b oznacza, że liczba b − a jest dodatnia.
• a ¬ b oznacza, że a < b lub a = b.
Wnioski
• Zachodzi dokładnie jedna z relacji:
a < b, a = b, b < a.
• a < b i b < c ⇒ a < c.
• a < b ⇒ a + c < b + c.
• a < b i 0 < c ⇒ ac < bc.
Relacja podzielności
W tej części mówimy tylko o liczbach całkowitych.
Definicja. Mówimy, że a dzieli b, jeśli istnieje k takie, że b = ka.
Piszemy a|b. Możemy też powiedzieć, że a jest dzielnikiem liczby b lub jeszcze inaczej,
że b jest wielokrotnością a.
Spostrzeżenia:
8
• a|b i b 6= 0 ⇒ |a| ¬ |b|
• a|b i b|a ⇒ a = ±b
• a|b i b|c ⇒ a|c.
Dowód. Jeśli a|b i b|c, to znajdziemy liczby całkowite k i l takie,
że b = ka i c = lb. Wynika stąd, że c = lb = lka, co oznacza, że a|c.
• a|b i a|c ⇒ a|(b + c) i a|(a − c).
Liczby pierwsze
Definicja. Dodatnią liczbę całkowitą p nazywamy liczbą pierwszą, jeśli p ma dokładnie dwa dodatnie dzielniki całkowite (tzn. 1 i p).
1 nie jest liczbą pierwszą bo ma tylko 1 dodatni dzielnik całkowity: 1.
2 jest liczbą pierwszą bo ma dokładnie 2 dodatnie dzielniki całkowite: 1,2.
6 ma aż 4 dodatnie dzielniki całkowite: 1,2,3,6.
Lemat. Każda liczba całkowita większa od 1 ma dzielnik pierwszy.
Dowód przez indukcję. Liczba 2 ma dzielnik pierwszy równy 2. Załóżmy, że lemat jest
prawdziwy dla liczb k = 2, 3, 4, ..., n−1. Pokażemy, że twierdzenie jest prawdziwe dla
n. Jeśli n jest liczbą pierwszą, to n ma dzielnik pierwszy równy n. Jeśli natomiast
n nie jest liczbą pierwszą, to n ma dodatni dzielnik k, przy czym 1 < k < n.
Z założenia indukcyjnego wiemy, że k ma dzielnik pierwszy. Jest to równocześnie
dzielnik pierwszy liczby n.
Twierdzenie. Liczb pierwszych jest nieskończenie wiele.
Dowód. Załóżmy, że mamy skończoną liczbę liczb pierwszych: p1 , p2 , ..., pn . Rozważamy liczbę
q = p1 p2 · · · pn + 1.
Zgodnie z Lematem liczba q ma dzielnik pierwszy. Może nim być tylko jedna z wymienionych liczb pierwszych. Jeśli jednak pi |q (i = 1, 2, ..., n),
to pi |1 i mamy sprzeczność. Oznacza to, że liczby p1 , p2 , ..., pn nie mogą być wszystkimi liczbami pierwszymi.
Twierdzenie. Rozkład na czynniki. Każdą liczbę całkowitą większą od 1
możemy zapisać w postaci iloczynu liczb pierwszych.
Każde dwa przedstawienia różnią się co najwyżej kolejnością czynników.
(pierwsza część twierdzenia jest prosta do wykazania przez indukcję, druga część
jest trudniejsza)
Największy wspólny dzielnik
Liczbę d nazywamy wspólnym dzielnikiem a, b jeśli d|a i d|b. Zbiór wspólnych dzielników jest niepusty (zawiera 1). Jeśli co najmniej jedna z liczb a, b jest różna od
0, np. a 6= 0, to |d| ¬ |a| i zbiór wspólnych dzielników a, b jest ograniczony. Największy element w zbiorze wspólnych dzielników nazywamy największym wspólnym
dzielnikiem i oznaczamy N W D(a, b).
9
Przykłady. N W D(12, 15) = 3, N W D(30, 72) = 6.
Twierdzenie (Dzielenie z resztą). Dla każdych dwóch dodatnich liczb całkowitych znajdziemy liczby całkowite k, r takie, że
a = kb + r,
0 ¬ r < b.
Liczby k i r są określone jednoznacznie. Liczbę r nazywamy resztą z dzielenia a
przez b.
Dowód. Rozważamy zbiór nieujemnych liczb całkowitych postaci
a − kb, gdzie k jest liczbą całkowitą. Zbiór ten jest niepusty, zawiera bowiem liczbę
a. Niech r będzie najmniejszym elementem w rozważanym zbiorze. Z definicji r ­ 0.
Poza tym r < b. W przeciwnym wypadku mielibyśmy a − (k + 1)b = r − b ­ 0 i r − b
należałoby do rozważanego zbioru wbrew założeniu, że r jest najmniejszą liczbą w
rozważanym zbiorze.
Jednoznaczność. Załóżmy, że kb + r = k 0 b + r0 , 0 ¬ r0 < b. Wtedy
(k − k 0 )b = r0 − r. Gdyby r 6= r0 np. r < r0 , mielibyśmy k > k 0 i r0 ­ r + (k − k 0 )b ­ b
wbrew założeniu, że r0 < b.
Uwaga. a, b nie muszą być dodatnie. Ważne jest, aby b 6= 0.
Stwierdzenie. Jeśli a = kb + r (b 6= 0), to N W D(a, b) = N W D(b, r).
Dowód. Jeśli a = kb + r, to wspólny dzielnik a i b (w szczególności N W D(a, b)) dzieli r. Jest więc wspólnym dzielnikiem b i r. Wynika stąd nierówność N W D(a, b) ¬
N W D(b, r). Podobnie N W D(b, r) ¬ N W D(a, b). Dlatego N W D(a, b) = N W D(b, r).
Algorytm Euklidesa do obliczania N W D(a, b).
Załóżmy, że 0 < b < a. Niech r0 = a, r1 = b. Wykonujemy kolejne dzielenia z resztą
r0 = k1 r1 + r2
r1 = k2 r2 + r3
r2 = k3 r3 + r4
······
Ciąg reszt r0 , r1 , r2 , . . . jest malejący. Dlatego dla pewnego i ri > 0 i ri+1 = 0.
Zgodnie ze stwierdzeniem
N W D(r0 , r1 ) = N W D(r1 , r2 ) = N W D(r2 , r3 ) = · · · = N W D(ri , 0) = ri .
Ostatnia niezerowa reszta jest największym wspólnym dzielnikiem a i b.
Twierdzenie. Dla dowolnych liczb całkowitych a, b, z których
co najmniej jedna jest różna od zera, znajdziemy liczby całkowite x, y takie, że
ax + by = N W D(a, b).
Dowód. Kolejne reszty w algorytmie Euklidesa mają postać
rj = xj a + yj b.
r0 = 1a + 0b,
Jeśli
r1 = 0a + 1b.
rj−1 = xj−1 a + yj−1 b
10
i
rj = xj a + yj b,
rj+1 = rj−1 − kj rj = (xj−1 − kj xj )a + (yj−1 − kj yj )b.
to
W szczególności ostatnia niezerowa reszta ma postać ax + by.
Dowód pokazuje jak znaleźć rozwiązanie równania ax + by = N W D(a, b).
Przykład. N W D(44, 13) i rozwiązanie równania 44x + 13y = 1.
44 = 3 · 13 + 5
13 = 2 · 5 + 3
5=1·3+2
3=1·2+1
2=2·1+0
5 = 41 − 3 · 13
3 = 13 − 2 · 5 = 13 − 2(44 − 3 · 13) = 7 · 13 − 2 · 44
2 = 5 − 3 = (44 − 3 · 13) − (7 · 13 − 2 · 44) =
= 3 · 44 − 10 · 13
1 = (7 · 13 − 2 · 44) − (3 · 44 − 10 · 13) = 17 · 13 − 5 · 44
Wniosek. Załóżmy, że a 6= 0 lub b 6= 0. Równanie ax + by = d ma rozwiązanie
wtedy i tylko wtedy, gdy N W D(a, b)|d.
Stwierdzenie. Ogólne rozwiązanie wyraża się wzorami
y = y0 − la/N W D(a, b),
x = x0 + lb/N W D(a, b),
gdzie para x0 , y0 jest szczególnym rozwiązaniem, a l dowolną liczbą całkowitą.
Z Twierdzenia możemy wywnioskować łatwo kilka ważnych faktów.
Twierdzenie. d|a i d|b ⇒ d|N W D(a, b).
Twierdzenie. a|bc i N W D(a, b) = 1 ⇒ a|c.
Dowód. ax + by = 1 dla pewnych x, y. Stąd acx + bcy = c i dlatego a|c. Z twierdzenia wynika jednoznaczność rozkładu na czynniki pierwsze.
Definicja. Liczby a, b takie, że N W D(a, b) = 1, nazywamy liczbami względnie
pierwszymi.
Twierdzenie. N W D(a, b) = 1 i N W D(a, c) = 1 ⇒ N W D(a, bc) = 1.
Dowód. ax1 + by1 = 1, ax2 + cy2 = 1 dla pewnych x1 , y1 , x2 , y2 .
Mnożąc stronami powyższe równania otrzymujemy ax + bcy = 1
(x = ax1 x2 + by1 x2 + cx1 y2 , y = y1 y2 ). Oznacza to, że N W D(a, bc) = 1.
Niekonstruktywny dowód istnienia rozwiązań równania
ax + by = N W D(a, b), a, b > 0.
Niech A będzie zbiorem wszystkich dodatnich liczb całkowitych postaci ax + by,
gdzie x, y są liczbami całkowitymi. a = a1 + b0 ∈ A i b = a0 + b1 ∈ A. Niech D =
ax0 + by0 będzie najmniejszą liczbą w zbiorze A. D jest dzielnikiem każdej liczby ze
zbioru A. Mamy bowiem ax+by = kD+r, 0 ¬ r < D. Stąd r = a(x−kx0 )+b(y−ky0 )
i w przypadku r > 0 mamy sprzeczność z założeniem, że D jest najmniejszą liczbą
w A.
W szczególności D|a i D|b. Stąd D ¬ N W D(a, b). Z drugiej strony każdy wspólny dzielnik a, b dzieli każdy element ze zbioru A, w szczególności N W D(a, b)|D i
N W D(a, b) ¬ D. Stąd równość D = N W D(a, b).
Ciało
Ciałem nazywamy zbiór (zawierający co najmniej 2 elementy) z dwoma działaniami
posiadającymi następujące własności
11
• (a + b) + c = a + (b + c)
• a+b=b+a
• Istnieje element 0 taki, że a + 0 = a
• Dla każdego a znajdziemy b takie, że a + b = 0
• a(bc) = (ab)c
• ab = ba
• Istnieje element 1 taki, że a1 = a
• Dla każdego a 6= 0 znajdziemy b takie, że ab = 1
• a(b + c) = ab + ac
Ciało jest pierścieniem. Własności pierścienia przenoszą się na ciało.
Dodatkowe własności związane są z istnieniem elementu odwrotnego.
• ab = 1 i ac = 1 ⇒ b = c.
• a 6= 0 i b 6= 0 ⇒ ab 6= 0.
• a−1 oznacza element odwrotny do a 6= 0.
(a−1 )−1 = a, (ab)−1 = a−1 b−1
• a/b oznacza ab−1 .
Relacja równoważności
Iloczynem kartezjańskim zbiorów A i B nazywamy zbiór wszystkich par (a, b) takich,
że a ∈ A i b ∈ B. Iloczyn kartezjański oznaczamy przez A × B.
Relacją określoną na zbiorze A nazywamy dowolny podzbiór A × A.
Zamiast mówić, że para (x, y) należy do relacji, mówimy, że a jest w relacji z b.
Niech aRb oznacza, że a jest w relacji z b.
Definicja. Relację R nazywamy relacją równoważności jeśli R posiada następujące własności:
• aRa (zwrotność)
• aRb ⇒ bRa (symetryczność)
• aRb i bRc ⇒ aRc (przechodniość)
Relacja równości jest relacją równoważności. Relacje: słabej nierówności (¬),
podzielności, zawierania zbiorów są zwrotne i przechodnie. Nie są symetryczne.
Relacją równoważności jest relacja przystawania modulo ustalona liczba:
a ≡ b (mod n) ⇔ n|a − b,
12
a, b ∈ Z
Definicja. Klasą równoważności (klasą abstrakcji) elementu a nazywamy zbiór
takich elementów x, że xRa. Klasę równoważności elementu a oznaczymy przez [a].
Twierdzenie. Relacja równoważności R określona na zbiorze A rozbija zbiór A
na rozłączne klasy równoważności.
Dowód. Każdy element a ∈ A należy do pewnej klasy równoważności, a ∈ [a] bo
aRa.
Pokażemy, że jeśli [a] ∩ [b] 6= ∅, to [a] = [b]. Załóżmy, że x ∈ [a] i c ∈ [a] ∩ [b].
Stąd xRa i cRa (a więc również aRc). Dlatego xRc, a ponieważ cRb, więc xRb czyli
x ∈ [b]. Podobnie pokazujemy, że każdy element klasy [b] należy do klasy [a]. Dlatego
[a] = [b].
Konstrukcja ułamków
Pokażemy jak wychodząc z pierścienia liczb całkowitych skonstruować pierścień liczb
wymiernych. W konstrukcji ważne jest, że w pierścieniu liczb całkowitych nie ma
dzielników zera (iloczyn elementów niezerowych jest niezerowy). Konstrukcja jest
ogólna. Wychodząc z pierścienia wielomianów dostajemy ciało funkcji wymiernych.
W zbiorze A = Z × (Z − {0}) określamy relację R: (l, m)R(l0 , m0 ) ⇔ lm0 = l0 m.
Relacja R jest relacją równoważności.
• (l, m)R(l, m). Mamy bowiem lm = lm.
• (l, m)R(l0 , m0 ) ⇒ lm0 = l0 m ⇒ l0 m = lm0 ⇒ (l0 , m0 )R(l, m)
• (l, m)R(l0 , m0 ) i (l0 , m0 )R(l00 , m00 ) ⇒ lm0 = l0 m i l0 m00 = l00 m0
⇒ lm0 m00 = l0 mm00 = l00 m0 m ⇒ (lm00 − l00 m)m0 ,
m0 6= 0 ⇒ lm00 = l00 m ⇒ (l, m) = (l00 , m00 )
W zbiorze klas relacji R określamy działania: dodawanie i mnożenie.
[l1 , m1 ] + [l2 , m2 ] = [l1 m2 + l2 m1 , m1 m2 ],
[l1 , m1 ][l2 , m2 ] = [l1 l2 , m1 m2 ]
Uwaga. Ponieważ m1 6= 0 i m2 6= 0, więc m1 m2 6= 0.
Pokażemy, że zbiór klas równoważności z tak zdefiniowanymi działaniami jest
ciałem.
Zaczniemy od pokazania, że definicje są poprawne, tzn. wyniki dodawania i mnożenia nie zależą od wyboru reprezentantów klas.
Załóżmy, że (l1 , m1 )R(l10 , m01 ) i (12 , m2 )R(l20 , m02 ), tzn. l1 m01 = l10 m1
i l2 m02 = l20 m2 . Wtedy
(l1 m2 + l2 m1 )m01 m02 = (l1 m01 )(m2 m02 ) + (l2 m02 )(m01 m2 ) =
= (l10 m1 )(m2 m02 ) + (l20 m2 )(m01 m2 ) = (l10 m02 + l20 m01 )m1 m2 ,
(l1 l2 )(m01 m02 ) = (l1 m01 )(l2 m02 ) = (l10 m1 )(l20 m2 ) = (l10 l20 )(m1 m2 ),
(l1 m2 + l2 m1 , m1 m2 )R(l10 m02 + l20 m01 , m01 m02 )
13
i
(l1 l2 , m1 m2 )R(l10 l20 , m01 m02 ).
Wiedząc, że definicje są poprawne możemy zając się aksjomatami ciała.
Dla przykładu wykażemy łączność dodawania.
([l1 , m1 ] + [l2 , m2 ]) + [l3 , m3 ] = [l1 m2 + l2 m1 , m1 m2 ][l3 , m3 ] =
= [l1 m2 m3 + m1 l2 m3 + m1 m2 l3 , m1 m2 m3 ].
Elementy neutralne: 0 = [0, 1] i 1 = [1, 1].
Zamiast [l, m] piszemy l/m.
l1
l2
l1 m2 + l2 m1
+
=
,
m1 m2
m1 m2
l1
l2
l1 l2
·
=
.
m1 m2
m1 m2
Przekształcenie Z → Q, n → n/1 jest różnowartościowe i zachowuje działania
(n/1) + (m/1) = (n + m)/1, (n/1)(m/1) = (nm)/1.
Uwaga. Podobnie możemy zbudować Z wychodząc z N. W tym celu w zbiorze
N × N określamy relację: (m, n)R(n0 m0 ) ⇔ m + n0 = m0 + n oraz działania: [m, n] +
[k, l] = [m + k, n + l], [m, n][k, l] = [mk + nl, ml + nk].
Pierścień Zn
Niech n będzie dodatnią liczbą całkowitą, a (a)n niech oznacza resztę z dzielenia a
przez n (niektórzy stosują oznaczenie a mod n).
Zn = {0, 1, 2, ..., n − 1}.
Działania. Jeśli a, b ∈ Zn , to
a ⊕ b = (a + b)n ,
a b = (ab)n .
Twierdzenie. Zn jest pierścieniem.
Dowód. Zaczniemy od kilku faktów.
u≡v
(t)n ≡ t
(mod n) ⇔ n|u − v ⇔ n|(u)n − (v)n ⇔ (u)n ≡ (v)n
(mod n) ⇒ s + (t)n ≡ s + t (mod n)
⇒ (s + (t)n )n = (s + t)n ,
i
(mod n).
s(t)n ≡ st (mod n)
(s(t)n )n = (st)n .
Teraz możemy sprawdzić własności pierścienia (a, b, c ∈ Zn ).
• (a ⊕ b) ⊕ c = ((a + b)n + c)n = (a + b + c)n = (a + (b + c)n )n = a ⊕ (b ⊕ c)
• (a ⊕ b) = (a + b)n = (b + a)n = b ⊕ a
• a ⊕ 0 = (a + 0)n = (a)n = a
• 0 ⊕ 0 = (0 + 0)n = (0)n = 0
a ⊕ (n − a) = (a + n − a)n = (n)n = 0,
a 6= 0
• (a b) c = ((ab)n )c)n = (abc)n = (a(bc)n )n = a (b c)
14
• (a b) = (ab)n = (ba)n = b a
• a 1 = (a1)n = (a)n = a
• a (b ⊕ c) = (a(b + c)n )n = (a(b + c)n )n = (a(b + c))n =
= (ab + ac)n = ((ab)n + (ac)n )n = a b ⊕ a c
Tabelki działań.
0
1
Z2
⊕
0
1
0
0
1
1
1
0
Z3
⊕
0
1
2
0
0
1
2
1
1
2
0
2
2
0
1
Z4
⊕
0
1
2
3
0
0
1
2
3
1
1
2
3
0
2
2
2
0
1
0
0
0
1
0
1
0
1
2
0
0
0
0
1
0
1
2
2
0
2
1
0
1
2
3
0
0
0
0
0
1
0
1
2
3
3
3
0
1
2
2
0
2
0
2
3
0
3
2
1
Twierdzenie. Pierścień Zn jest ciałem wtedy i tylko wtedy, gdy n jest liczbą
pierwszą.
Dowód. Jeśli n = ab, gdzie 0 < a, b < n, to a, b ∈ Zn , a, b 6= 0 i a b = 0. Dlatego
Zn nie jest ciałem.
Załóżmy teraz, że n jest liczbą pierwszą, a ∈ Zn , a 6= 0. Znajdziemy takie liczby
całkowite x, y, że ax + ny = 1. Jeśli b = (x)n , to b ∈ Zn i a b = (ab)n = (a(x)n )n =
(ax)n = 1.
Definicja. Jeśli 1 + 1 + ... + 1 = 0 (suma n jedynek) to mówimy, że ciało ma
charakterystykę n. Jeśli takiego n nie ma, mówimy, że ciało ma charakterystykę 0.
Q ma charakterystykę 0. Zp ma charakterystykę p.
Definicja. Niech K będzie ciałem, a L co najmniej 2-elementowym podzbiorem
K. L nazywamy podciałem K (lub K rozszerzeniem L), jeśli
• a, b ∈ L ⇒ a + b, ab ∈ L,
• a ∈ L ⇒ −a ∈ L.
• a ∈ L i a 6= 0 ⇒ a−1 L.
Uwaga. Zbiór L z działaniami przeniesionymi z ciała K jest ciałem.
Liczby rzeczywiste
Ułamki można uporządkować: a/b > 0 ⇔ a > 0 i b > 0 lub a < 0 i b < 0.
15
Ciało liczb rzeczywistych R jest rozszerzeniem ciała liczb wymiernych Q. Liczby
rzeczywiste można uporządkować (podzielić na 3 rozłączne podzbiory: {0}, liczby
dodatnie i ujemne (przeciwne do dodatnich); suma i iloczyn liczb dodatnich jest
dodatni).
Nowa własność: każdy niepusty i ograniczony z góry podzbiór R posiada kres
górny (najmniejsze górne ograniczenie).
Z własności tej wynika, że funkcja ciągła określona na odcinku przyjmuje wartości pośrednie (twierdzenie Bolzano). W szczególności istnieją pierwiastki dowolnego
stopnia z liczb nieujemnych.
Liczby rzeczywiste można skonstruować wychodząc z liczb wymiernych (przekroje Dedekinda lub ciągi Cauchy’ego).
Liczby zespolone
Liczby zespolone uzyskujemy rozszerzając liczby rzeczywiste o symbol i taki, że
i2 = −1.
Konstrukcja liczb zespolonych. Niech C będzie zbiorem wszystkich par liczb
rzeczywistych. W zbiorze C definiujemy dwa działania:
• (a, b) + (c, d) = (a + c, b + d)
• (a, b)(c, d) = (ac − bd, ad + bc)
Twierdzenie. Zbiór C jest ciałem.
Dowód. Należy sprawdzić wszystkie własności ciała. Jedynym trudniejszym miejscem jest wskazanie liczby odwrotnej.
Liczbą odwrotną do liczby (a, b) 6= (0, 0) jest liczba
−b
a
, 2
2
2
a + b a + b2
!
Liczby postaci (a, 0) utożsamiamy z liczbami rzeczywistymi:
(a, 0) + (b, 0) = (a + b, 0),
(a, 0)(b, 0) = (ab, 0).
Literą i oznaczamy liczbę (0, 1). Możemy teraz napisać w tradycyjny sposób
(a, b) = (a, 0) + (b, 0)(0, 1) = a + bi.
(a + bi) + (c + di) = (a + c) + (b + d)i,
(a + bi)(c + di) = (ac − bd) + (ac + bd)i,
a
b
1
− 2
i.
= 2
2
a + bi
a +b
a + b2
Definicja. a nazywamy częścią rzeczywistą liczby zespolonej a + bi,
a b częścią urojoną. Piszemy a = <(a + bi), b = =(a + bi).
√
Definicja. Modułem liczby zespolonej nazywamy liczbę |a + bi| = a2 + b2 .
Definicja. z = a − bi nazywamy liczbą sprzężoną do liczby z = a + bi.
Stwierdzenie.
16
• z + w = z + w,
• zw = zw,
z − w = z − w,
z/w = z/w
(w 6= 0),
• zz = |z|2 ,
• |z| = 0 ⇔ z = 0,
• <z = (z + z)/2,
=z = (z − z)/(2i),
|<z|, |=z| ¬ |z|,
• |zw| = |z||w|.
Dowód. |zw|2 = (zw)zw = (zw)(zw) = (zz)(ww) = |z|2 |w|2 .
Dlatego |zw| = |z||w|.
• |z/w| = |z|/|w|,
w 6= 0
• |z + w| ¬ |z| + |w|.
Dowód. |z + w|2 = (z + w)(z + w) = |z|2 + |w|2 + zw + wz.
Ale (zw + wz)/2 = <(zw) ¬ |zw| = |z||w|.
Dlatego |z + w|2 ¬ |z|2 + |w|2 + 2|z||w| = (|z| + |w|)2 i |z + w| ¬ |z| + |w|.
• |z − w| jest odległością punktu z od punktu w.
1. |z − w| ­ 0,
|z − w| = 0 ⇔ z = w
2. |z − w| = |w − z|
3. |z − w| ¬ |z − u| + |u − w|
Uwaga. Liczb zespolonych nie można uporządkować tak jak Z,Q,R.
Postać trygonometryczna liczby zespolonej
i obroty
z = a + bi = r(cos θ + i sin θ),
r = |z|
Niech z = cos φ + i sin φ. Przekształcenie w → zw jest izometrią. Mamy bowiem
|zw − zu| = |z||w − u| = |w − u|.
Jeśli z = 1, przekształcenie jest identycznością, w przeciwnym wypadku przekształcenie posiada dokładnie jeden punkt stały 0.
Mnożenie przez z = cos φ + i sin φ jest więc obrotem, jak ławo zauważyć o kąt φ.
Złożenie dwóch obrotów o kąty φ i ψ jest obrotem o kąt φ + ψ. Stąd
(cos φ + i sin φ)(cos ψ + i sin ψ) = cos(φ + ψ) + i sin(φ + ψ).
Porównując części rzeczywiste i urojone po obu stronach równania otrzymujemy
wzory trygonometryczne
cos(φ + ψ) = cos φ cos ψ − sin φ sin ψ,
sin(φ + ψ) = sin φ cos ψ + cos φ sin ψ.
17
Składając n obrotów o kąt θ otrzymujemy obrót o kąt nθ.
(cos θ + i sin θ)n = cos nθ + i sin nθ.
Wynika stąd, że rozwiązaniami równania
zn = 1
są liczby leżące w wierzchołkach n-kąta foremnego
z = cos 2kπ/n + i sin 2kπ/n,
k = 0, 1, ..., n − 1.
Rozwiązaniami nieco ogólniejszego równania
z n = r(cos ψ + i sin ψ)
są liczby
z=
=
√
n
r [cos(2kπ + ψ)/n + i sin(2kπ + ψ)/n] =
√
n
r(cos ψ/n + i sin ψ/n)(cos 2kπ/n + i sin 2kπ/n),
k = 0, 1, ..., n − 1.
Izometrie płaszczyzny
Definicja. Przekształcenie płaszczyzny w płaszczyznę zachowujące odległość nazywamy izometrią płaszczyzny.
Twierdzenie.
1. Identyczność jest izometrią. Złożenie dwóch izometrii jest izometrią. Izometrie
są odwracalne (wniosek z punktu 9). Przekształcenie odwrotne do izometrii
jest izometrią. Zatem izometrie tworzą grupę przekształceń.
2. Symetria osiowa jest izometrią. Punkty leżące na osi są punktami stałymi
symetrii osiowej. Przekształceniem odwrotnym do symetrii
osiowej jest ta sama symetria.
3. Złożenie dwóch symetrii osiowych o osiach równoległych jest przesunięciem.
Jeśli osie są różne, to przesunięcie nie ma punktów stałych.
4. Złożenie dwóch symetrii osiowych o przecinających się osiach jest obrotem.
5. Złożenie 3 symetrii osiowych jest symetrią osiową lub symetrią osiową z poślizgiem (złożeniem symetrii osiowej i przesunięcia wzdłuż osi).
6. Izometria posiadająca 3 niewspółliniowe punkty stałe jest identycznością.
7. Izometria zachowująca dwa różne punkty jest identycznością lub symetrią osiową względem prostej przechodzącej przez te punkty.
8. Izometria zachowująca punkt jest identycznością, symetrią osiową
lub obrotem.
18
9. Każda izometria płaszczyzny jest złożeniem co najwyżej 3 symetrii
osiowych.
Dowód pkt.6. Niech f będzie rozważaną izometrią. Załóżmy że
f (A) = A, f (B) = B, f (C) = C, ale f (X) 6= X. Niech l będzie symetralną odcinka
Xf (X).
|A − X| = |f (A) − f (X)| = |A − f (X)|, |B − X| = |B − f (B)|,
|C − X| = |C − f (C)|. Dlatego A, B, C ∈ l i mamy sprzeczność.
Dowód pkt.9. Jeśli f nie jest identycznością, to f (X) 6= X dla pewnego X. Niech
l będzie symetralną odcinka Xf (X), a S1 symetrią osiową względem l. S1 ◦f (X) = X
i dlatego S1 ◦ f = id, S1 ◦ f = S2 lub S1 ◦ f = S2 ◦ S3 czyli f = S1 , f = S1 ◦ S2 lub
f = S1 ◦ S2 ◦ S3 .
Wielomiany
O wielomianach często wygodniej jest myśleć jak o wyrażeniach, w których x jest
pewnym symbolem niż jak o funkcjach.
Definicja. Wielomianem nazywamy nieskończony ciąg f = (f0 , f1 , f2 , ...) o elementach należących do pewnego pierścienia przemiennego z jednością taki, że tylko
skończona liczba wyrazów jest niezerowa.
Dodawanie i mnożenie wielomianów.
Niech f = (f0 , f1 , f2 , ...), g = (g1 , g2 , g3 , ...).
Wielomian h = (h0 , h1 , h2 , ...) jest sumą wielomianów f, g (h = f + g), jeśli
hi = fi + gi dla i = 0, 1, 2, ....
Wielomian h = (h0 , h1 , h2 , ...) jest iloczynem wielomianów f, g (h = f g), jeśli
hi = f0 gi + f1 gi−1 + f2 gi−2 + ... + f0 gi , dla i = 1, 2, 3, ....
Uwaga. Definicje działań są poprawne. Suma i iloczyn wielomianów są wielomianami (tzn. otrzymane ciągi mają tylko skończoną liczbę niezerowych wyrazów).
Twierdzenie. Wielomiany z dodawaniem i mnożeniem tworzą pierścień przemienny z jednością.
Dowód polega na sprawdzeniu wszystkich własności pierścienia. Zapewne najtrudniejsze jest sprawdzenie łączności mnożenia. W tym miejscu odnotujemy tylko,
że jeśli w = (f g)h lub w = f (gh) i w = (w0 , w1 , w2 , ...), to
wm =
X
fi gj hk .
0¬i,j,k, i+j+k=m
Definicja. Wielomianem zerowym nazywamy wielomian 0 = (0, 0, 0, ....).
Definicja Niech f = (f0 , f1 , f2 , ...) będzie wielomianem niezerowym. Liczbę n
nazywamy stopniem wielomianu f jeśli fn 6= 0 i fi = 0 dla i > n. Stopień wielomianu zerowego określamy jako −∞, n + (−∞) = −∞, (−∞) + (−∞) = −∞,
max(n, −∞) = n. Stopień f będziemy oznaczać st f .
Twierdzenie. Niech f, g będą wielomianami. Mamy
st (f + g) ¬ max(st f, st g),
st (f g) ¬ st f + st g.
19
Jeśli pierścień, z którego brane są współczynniki wielomianów nie ma dzielników zera
(tak jest w przypadku Z lub w przypadku dowolnego ciała), to iloczyn niezerowych
wielomianów jest niezerowy i st (f g) = st f + st g.
Wielomiany postaci (a, 0, 0, 0, ...) nazywamy wielomianami stałymi. Przekształcenie a → (a, 0, 0, 0, ...) jest różnowartościowe i zachowuje działania. Od tej pory
wielomiany stałe będziemy utożsamiać z elementami pierścienia.
Jeśli symbolem x oznaczymy wielomian (0, 1, 0, 0, 0, ...), to otrzymamy tradycyjną notację
(a0 , a1 , a2 , a3 , ..., an , 0, 0, ) = a0 + a1 x + a2 x2 + · · · + an xn .
Traktowanie x jako symbolu, a wielomianów jako napisów umożliwia rozpatrywanie wielomianów o współczynnikach np. z pierścienia Zn .
Jeśli a0 , a1 , a2 , ... ∈ K (K oznacza ustalony pierścień), to będziemy pisać
a0 + a1 x + a2 x2 + ... + an xn ∈ K[x]. Mamy więc (m ¬ n)
(f0 + f1 x + f2 x2 + ... + fn xn ) + (g0 + g1 x + g2 x2 + · · · + gm xm ) =
= (f0 + g0 ) + (f1 + g1 )x + (f2 + g2 )x2 + · · · + (fn + gn )xn .
(f0 + f1 x + f2 x2 + · · · + fn xn )(g0 + g1 x + g2 x2 + · · · + gm xm ) =
= f0 g0 + (f0 g1 + f1 g0 )x + (f0 g2 + f1 g1 + f2 g0 )x2 + · · · + fn gm xn+m .
Definicja. Wartością wielomianu f = f0 + f1 x + · · · + fn xn ∈ K[x] w punkcie
a ∈ K nazywamy element f (a) = f0 + f1 a + · · · + fn an ∈ K.
Definicja. Element a taki, że f (a) = 0 nazywamy pierwiastkiem f .
Twierdzenie (Bézout). Jeśli f ∈ K[x], f 6= 0 i f (a) = 0 dla a ∈ K,
to f = (x − a)h dla pewnego h ∈ K[x].
Dowód.
f (x) − f (a) = (f0 + f1 x + f2 x2 + · · · + fn xn ) − (f0 + f1 a + f2 a2 + · · · + fn an ) =
= f1 · (x − a) + f2 · (x2 − a2 ) + f3 · (x3 − a3 ) + · · · + fn · (xn − an ) =
= (x − a)[f1 + f2 · (x + a) + f3 · (x2 + xa + a2 ) + · · · + fn · (xn−1 + xn−2 a + · · · + an−1 )] =
= (x − a)(h0 + h1 x + · · · + hn−1 xn−1 ).
Współczynniki h spełniają relacje (schemat Hornera)
hn−1 = fn ,
hn−2 = ahn−1 + fn−1 ,
hn−3 = ahn−2 + fn−2 , ... h0 = ah1 + f1 .
Na koniec f (a) = ah0 + f0 .
Przykład.
f (x) = 3x4 + 2x3 + 5x2 + x + 7 = (x − 2)(h0 + h1 x + h2 x2 + h3 x3 ) + f (2).
h3 = 3,
h2 = 2 · 3 + 2 = 8,
h0 = 2 · 21 + 1 = 43,
h1 = 2 · 8 + 5 = 21,
f (2) = 2 · 43 + 7 = 93.
20
Twierdzenie. Jeśli f ∈ K[x], f 6= 0, f (a1 ) = f (a2 ) = ... = f (an ) = 0, a
elementy a1 , a2 , ..., an ∈ K są różne, to f = (x − a1 )(x − a2 )...(x − an )h dla pewnego
h ∈ K[x].
Dowód przez indukcję. Stosujemy dopiero co udowodnione twierdzenie.
Wniosek. Jeśli f ∈ K[x], f 6= 0, f (a1 ) = f (a2 ) = ... = f (an ) = 0, a elementy
a1 , a2 , ..., an ∈ K są różne, to stopień f wynosi co najmniej n. Odwrotnie, wielomian
f stopnia n nie może mieć więcej niż n różnych pierwiastków.
Definicja. a ∈ K nazywamy pierwiastkiem k-krotnym wielomianu f ∈ K[x],
jeśli istnieje h ∈ K[x] taki, że f = (x − a)k h i h(a) 6= 0.
Twierdzenie. Jeśli a1 , a2 , ..., am ∈ K są odpowiednio k1 , k2 , ..., km krotnymi różnymi pierwiastkami f , to f = (x−a1 )k1 (x−a2 )k2 ...(x−am )km h dla pewnego h ∈ K[x].
Wniosek. Jeśli a1 , a2 , ..., am ∈ K są odpowiednio k1 , k2 , ..., km krotnymi różnymi
pierwiastkami f ∈ K[x] i f 6= 0, to stopień f wynosi co najmniej k1 + k2 + · · · + km .
Definicja. Niech f ∈ K[x]. Funkcję a → f (a) nazywamy funkcją wielomianową.
W przypadku ciał skończonych każda funkcja jest funkcją wielomianową.
Twierdzenie. Jeśli a → f (a) jest funkcją wielomianową, a zbiór argumentów
jest nieskończony, to wielomian f jest określony jednoznacznie.
Dowód. Załóżmy, że f i h są wielomianami i f (a) = h(a) dla każdego a. Niech
n będzie większym ze stopni f, h. Wielomian f − h ma więcej niż n różnych pierwiastków, nie może być więc wielomianem niezerowym. Musi więc zachodzić równość
f = h.
Pierwiastki wymierne
Twierdzenie. Jeśli f = f0 +f1 x+· · ·+fn xn ∈ Z[x], p, q ∈ Z, q 6= 0, N W D(p, q) = 1
i f (p/q) = 0, to p|f0 , a q|fn .
Dowód.
0 = q n f (p/q) = f0 q n + f1 pq n−1 + · · · + fn−1 pn−1 q + fn pn .
Widzimy, że p|f0 q n , ale NWD(p,q)=1 i dlatego p|f0 . Podobnie q|fn .
Przykład.
f = x3 − 3x2 + 2x − 6.
Możemy próbować q = 1, p = ±1, ±2, ±3, ±6. Faktycznie f (3) = 0.
f (x) = f (x) − f (3) = (x3 − 33 ) − 3(x2 − 32 ) + 2(x − 3) =
= (x − 3)[(x2 + 3x + 32 ) − 3(x + 3) + 2] = (x − 3)(x2 + 2).
Podzielność wielomianów
Rozważamy wielomiany o współczynnikach z pewnego ciała P .
Definicja. Mówimy, że wielomian f ∈ P [x] dzieli wielomian g ∈ P [x] jeśli
istnieje wielomian h ∈ P [x] taki, że g = f h. Piszemy f |g.
Każdy wielomian dzieli się przez wielomian stały różny od zerowego.
21
Twierdzenie. Wielomiany, podobnie jak liczby całkowite, można dzielić z resztą.
Jeśli f, g ∈ P [x], g 6= 0, to istnieją wielomiany h, r ∈ P [x] takie, że
f = hg + r,
st r < st g.
Wielomiany h, r są określone jednoznacznie.
Dowód przez indukcję. Niech g = gm xm + · · · + g1 x + g0 , gm 6= 0.
Jeśli st f = k < st g, to przyjmujemy h = 0 i r = f .
Załóżmy teraz, że twierdzenie jest prawdziwe dla każdego k < n (m ¬ n)
i st f = n, f = fn xn + · · · + f1 + f0 .
Wtedy st (f − (fn /gm )xn−m g) < n i z założenia indukcyjnego wynika, że
f − (fn /gm )xn−m g = hg + r, dla pewnych h, r ∈ P [x], st r < m.
Stąd f = ((fn /gm )xn−m + h)g + r i twierdzenie jest prawdziwe dla n.
Jednoznaczność. Jeśli f = hg + r = h0 g + r0 , to (h − h0 )g = r0 − r
i st (r0 − r) < m. W przypadku h 6= h0 , st (h − h0 )g ­ m i mamy sprzeczność.
Dlatego h0 = h i r0 = r.
Dowód pokazuje jak dzielić wielomiany z resztą. Przykład.
f = x4 + 8x3 + 18x2 + 16x + 9,
g = x2 + 3x + 2,
f − x2 g = 5x3 + 16x2 + 16x + 9,
(5x3 + 16x2 + 16x + 9) − 5xg = x2 + 6x + 9,
(x2 + 6x + 9) − g = 3x = 7,
h = x2 + 5x + 1,
r = 3x + 7.
Definicja. Największym wspólnym dzielnikiem wielomianów f, g, z których co
najmniej jeden jest niezerowy, nazywamy wielomian d taki, że
• d|f i d|g,
• dla każdego h ∈ P [x] ( h|f i h|g ⇒ h|d ).
Uwaga. Taką samą definicję można przyjąć w przypadku liczb całkowitych. Pojawia
się jednak pewna niejednoznaczność. W przypadku liczb całkowitych: jeśli d spełnia
oba warunki, to −d też spełnia oba warunki. W przypadku wielomianów: jeśli d spełnia oba warunki, to cd też spełnia oba warunki (c ∈ P, c 6= 0). Niejednoznaczności
można się pozbyć zakładając w przypadku liczb całkowitych, że NWD jest liczbą
dodatnią, a w przypadku wielomianów, że NWD jest wielomianem unormowanym
(mającym współczynnik 1 przy najwyższej potędze x).
Udowodnimy teraz istnienie NWD dwóch wielomianów.
Algorytm Euklidesa. r0 = f, r1 = g.
r0 = k1 r1 + r2 ,
r1 = k2 r2 + r3 ,
······
rl−2 = kl−1 rl−1 + rl ,
22
rl−1 = kl rl + 0.
st r1 > st r2 > st r3 > · · ·. Dlatego dla pewnego l rl 6= 0 i rl+1 = 0.
d = rl |rl−1 ⇒ d|rl−2 ⇒ · · · ⇒ d|r1 = g ⇒ d|r0 = f.
h|f = r0 , h|g = r1 ⇒ h|r2 ⇒ h|r3 · · · ⇒ h|rl = d.
Dlatego d jest największym wspólnym dzielnikiem wielomianów f, g.
Algorytm Euklidesa pozwala znaleźć dwa wielomiany α, β ∈ P [x] takie, że
αf + βg = d.
Powyższe równanie rozwiązujemy dokładnie tak samo, jak w przypadku liczb całkowitych, mamy też dokładnie takie same wnioski.
Iloczyn wielomianów niezerowych jest niezerowy (rozważamy wielomiany o współczynnikach z pewnego ciała P ). Dlatego wychodząc z pierścienia wielomianów możemy skonstruować ciało ułamków (ciało funkcji wymiernych).
Twierdzenie. Niech
f = f1a1 f2a2 · · · fkak ,
f1 , . . . , fk , w ∈ P [x],
N W D(fi , fj ) = 1 (i 6= j).
Wtedy
ak
k X
X
wij
w
= w0 +
j ,
f
i=1 j=1 fi
w0 , wij ∈ P [x],
st wij < st fi .
W przypadku, gdy wielomiany f1 , . . . , fk są nierozkładalne, mówimy o rozkładzie na
ułamki proste.
ak−1
Dowód. Niech g = f1a1 f2a2 · · · fk−1
. Wtedy N W D(fkak , g) = 1
ak
i αfk + βg = 1 dla pewnych α, β ∈ P [x]. Stąd
w
w(αfkak + βg)
wα wβ
+ ak .
=
=
ak
ak
gfk
gfk
g
fk
Wykorzystując wielokrotnie ten pomysł, otrzymujemy
w1
w
w2
wk
= a1 + a2 + · · · + ak ,
f
f1
f2
fk
Na koniec wi = u0 + u1 fi + u2 fi2 + · · · + um fim , st u0 , u1 , ..., um < st fi . Wystarczy
aby
wi = k1 fi + u0 , k1 = k2 fi + u1 , u2 = k3 fi + u2 , ... km = um .
Wtedy
wi
u0
u1
u2
ua−1
= a + a−1 + a−2 + · · · +
+ ua + · · · + um fim−a .
a
fi
fi
fi
fi
fi
W przypadku ciała C wielomiany nierozkładalne mają stopień 0 lub 1, a w przypadku ciała R wielomiany nierozkładalne mają stopień 0, 1 lub 2.
Przykład.
1
1
1
= −
.
x(x + 1)
x x+1
23
Zastosowanie.
Metoda.
1
1
1
1
+
+ ··· +
=1− .
1·2 2·3
(n − 1)n
n
x2 + 3x + 2
A Bx + C
= + 2
.
2
x(x + 1)
x
x +1
Stąd
x2 + 3x + 2 = A(x2 + 1) + (Bx + C)x,
A = 2, B = −1, C = 3.
Pierwiastki rzeczywiste
Twierdzenie. Każdy wielomian o współczynnikach rzeczywistych stopnia nieparzystego posiada pierwiastek rzeczywisty.
Dowód. Rozważamy wielomian f (t) = an tn + · · · + a1 t + a0 , an > 0. Zakładamy,
że n jest liczbą nieparzystą.
Jeśli t > 1 i t > (|a0 | + |a1 | + · · · + |an−1 |)/an , to
f (t) ­ an tn − (|a0 | + |a1 |t + · · · + |an−1 |tn−1 ) ­
­ an tn − (|a0 | + |a1 | + · · · + |an−1 |)tn−1 > 0.
Jeśli natomiast t < −1 i t < −(|a0 | + |a1 | + · · · + |an−1 |)/an , to
f (t) ¬ an tn + (|a0 | + |a1 ||t| + · · · + |an−1 ||t|n−1 ) ¬
¬ an tn + (|a0 | + |a1 | + · · · + |an−1 |)tn−1 < 0.
(pamiętamy, że n jest liczbą nieparzystą!)
Ponieważ funkcja t → f (t) jest ciągła, więc z twierdzenia Bolzano wynika, że dla
pewnego t f (t) = 0.
Zasadnicze twierdzenie algebry
Twierdzenie. Każdy wielomian o współczynnikach zespolonych stopnia większego
od zera posiada pierwiastek zespolony.
Dowód. Niech
f (z) = a0 + a1 z + · · · + an z n ,
n > 0,
an ∈ C,
an 6= 0.
Pokażemy, że istnieje punkt w taki, że dla każdego z |f (w)| ¬ |f (z)| .
Następnie pokażemy, że założenie |f (w)| > 0 prowadzi do sprzeczności.
|f (z)| = |a0 + a1 z + · · · + an z n | ­ |an ||z|n − |a0 | − |a1 ||z| − · · · − |an−1 ||z|n−1 ­
­ |an ||z|n − ( |a0 | + |a1 | + · · · + |an−1 | )|z|n−1 ,
dla |z| ­ 1.
Niech r = max (1, (2|a0 | + |a1 | + · · · + |an−1 |)/|an | ). Wtedy dla |z| ­ r
|f (z)| ­ |an ||z| − (|a0 | + |a1 | + · · · + |an−1 |)|z|n−1 ­ |a0 ||z|n−1 ­ |a0 | = |f (0)|.
Teraz potrzebujemy kilku faktów z analizy matematycznej.
24
• Koło domknięte jest zbiorem ograniczonym i domkniętym
(w naszym przypadku koło K o środku 0 i promieniu r).
• Domknięty i ograniczony podzbiór Rn jest zwarty
(C utożsamiamy z R2 ).
• Funkcja z → |f (z)| jest ciągła.
• Funkcja ciągła o wartościach rzeczywistych określona na zbiorze zwartym osiąga swoje kresy.
Wniosek. Istnieje punkt w ∈ K taki, że dla z ∈ K |f (w)| ¬ |f (z)|.
Jeśli |z| ­ r, to |f (z)| ­ |f (0)| ­ |f (w)|. Stąd dla każdego z |f (z)| ­ |f (w)|.
Pokażemy teraz, że |f (w)| = 0 czyli f (z) = 0. Załóżmy, że |f (w)| > 0. Niech
f (w + z) = b0 + bk z k + bk+1 z k+1 + · · · + bn z n ,
b0 , bk 6= 0.
Wtedy dla |z| ¬ 1 mamy
|f (w + z)| ¬ |b0 + bk z k | + |bk+1 ||z|k+1 + · · · + |bn ||z|n | ¬
¬ |b0 + bk z k | + (|bk+1 | + · · · + |bn |)|z|k+1 .
Niech −b0 /bk = |b0 /bk |(cos θ + i sin θ). Wtedy dla 0 < r < 1 mamy
|f (w + r(cos θ/k + i sin θ/k))| ¬
¬ |b0 | 1 − |bk /b0 |rk + (|bk+1 | + · · · + |bn |)rk+1 .
Dlatego dla odpowiednio małego r > 0 prawa strona nierówności jest mniejsza od
|b0 | = |f (w)| i mamy sprzeczność: |f (w + r(cos θ/k + i sin θ/k))| < |f (w)|.
Wniosek. Wielomian f o współczynnikach zespolonych stopnia n można zapisać
w postaci
f (x) = a(x − z1 )(x − z2 ) · · · (x − zn ).
Dowód indukcyjny. Jeśli f jest wielomianem stałym, to wniosek jest oczywisty.
Załóżmy, że wniosek jest prawdziwy dla n i st f = n + 1. Wtedy dla pewnego
zn+1 f (zn+1 ) = 0 i z twierdzenia Bézout wynika, że
f (x) = (x − zn−1 )h(x),
st h = n.
Z założenia indukcyjnego h ma postać
h(x) = a(x − z1 )(x − z2 ) · · · (x − zn ).
Dlatego f ma postać
f (x) = a(x − z1 )(x − z2 ) · · · (x − zn )(x − zn+1 ).
Uwaga. Jeśli z jest pierwiastkiem wielomianu f o współczynnikach rzeczywistych, to z też jest pierwiastkiem wielomianu f .
25
Dowód.
f (z) = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = f (z).
Dlatego jeśli f (z) = 0, to f (z) = f (z) = 0.
Wniosek. Wielomian f o współczynnikach rzeczywistych można zapisać w postaci
2
],
f (x) = a(x − x1 )(x − x2 ) · · · (x − xk )[(x − p1 )2 + q12 ][(x − p2 )2 + q22 ] · · · [(x − pm )2 + qm
gdzie a, x1 , . . . , xk , p1 , . . . , pm , q1 , . . . , qm ∈ R.
Dowód indukcyjny podobny do dowodu poprzedniego wniosku.
Zauważmy tylko, że jeśli p + iq (q 6= 0) jest pierwiastkiem niezerowego wielomianu f o współczynnikach rzeczywistych, to wielomian f dzieli się przez wielomian
kwadratowy
(x − p − iq)(x − p + iq) = (x − p)2 + q 2 .
Postać kanoniczna. W wielu przypadkach wielomian f = ax2 + bx + c współczynnikach rzeczywistych wygodnie jest zapisać w postaci

b
f = ax2 + bx + c = a  x +
2a
!2

b2 − 4ac 
−
= a(x − p)2 + r.
(2a)2
Jeśli b2 − 4ac ­ 0, to wielomian f ma pierwiastki rzeczywiste
√
−b ± b2 − 4ac
x1,2 =
.
2a
Równania
Rozważamy równanie
a0 + a1 x + a2 x2 + an−1 xn−1 + an xn = 0,
an 6= 0.
Dzieląc równanie przez an otrzymujemy równanie
(a0 /an ) + (a1 /an )x + · · · + a2 x2 + (an−1 /an )xn−1 + xn = 0,
an 6= 0.
Możemy więc nie zmniejszając ogólności rozważań ograniczyć się do równań postaci
a0 + a1 x + a2 x2 + an−1 xn−1 + xn = 0.
Zapisując x w postaci x = y − an−1 /n otrzymujemy równanie postaci
b0 + b1 y + · · · + bn2 y n−2 + y n = 0.
W szczególności dla n = 2 i n = 3 mamy
x = y − a1 /2,
x = y − a2 /3,
x2 + a1 x + a0 = y 2 + (a0 − a21 /2),
x3 + a2 x2 + a1 x + a0 = y 3 + (a1 − a22 /3)y + (a0 + 2a32 /27).
26
Równanie 3 stopnia
Rozważamy równanie
x3 + ax + b = 0.
Szukamy rozwiązań w postaci sumy x = u + v.
(u + v)3 + a(u + v) + b = u3 + v 3 + (u + v)(3uv + a) + b.
Widzimy, że wystarczy aby
3
u
+ v3 + b = 0
3uv + a = 0
u3 , v 3 są pierwiastkami równania kwadratowego
0 = (t − u3 )(t − v 3 ) = t2 + bt − a3 /27.
u, v należy tak dobrać, aby uv = −a/3.
Uwaga. Możemy też wyjść z tożsamości
x3 − u3 − v 3 − 3uvx = (x − u − v)(x − ξu − ξ 2 v)(x − ξ 2 u − ξv),
√
ξ = −1/2 + i 3/2.
Przykład.
x3 − 3x − 18 = 0.
x = u + v,
u3 + v 3 = 18,
uv = 1,
√
t2 − 18t + 1 = 0, t = 9 ± 80,
q
q
√
√
3
3
x1 = 9 + 80 + 9 − 80,
q
q
√
√
3
3
x2 = ξ 9 + 80 + ξ 2 9 − 80,
q
q
√
√
3
2 3
x3 = ξ 9 + 80 + ξ 9 − 80,
Nasze równanie ma 1 pierwiastek rzeczywisty x1 i dwa zespolone x2 , x3 .
Zauważmy, że
x3 − 3x − 18 = (x − 3)(x2 + 3x + 6).
√
Dlatego x1 = 3, x2 , x3 = (−3 ± i 15)/2 (prostsza postać).
Równanie 4 stopnia
Rozważamy równanie
x4 + ax2 + bx + c = 0.
Aby rozwiązać równanie wystarczy lewą stronę równania zapisać w postaci iloczynu
2 wielomianów kwadratowych
(x2 + px +
q−r 2
q+r
q 2 − r2
)(x − px +
) = x4 + (q − p2 )x + pr +
.
2
2
4
27
Pozostaje znaleźć p, q, r.


q
− a = p2
q 2 − 4c = r2


pr = b
(q − a)(q 2 − 4c) = b2 .
Problem sprowadza się do rozwiązania równania 3 stopnia z niewiadomą p.
Uwaga. Przypadki, kiedy b = 0 lub c = 0 są prostsze.
Przykład.
x4 + 3x2 + 6x + 10 = 0,
(q − 3)(q 2 − 40) = 36,
np. q = 7,
p = 2,
x4 + 3x2 + 6x + 10 = (x2 + 2x + 2)(x2 − 2x + 5),
r = 3,
x = −1 ± i, 1 ± 2i.
Równania symetryczne
Przykład ilustrujący zasadę.
x4 + ax3 + bx2 + ax + 1 = 0.
Dzielimy obie strony równania przez x2 .
(x2 +
1
1
)
+
a(x
+
) + b.
x2
x
Wprowadzamy nową zmienną y = x + 1/x. Równanie zamienia się w równanie
y 2 + ay + b − 2 = 0.
W przypadku równań nieparzystego stopnia wydzielamy czynnik (x + 1). Drugi
czynnik jest symetryczny.
x5 + ax4 + bx3 + bx2 + ax + 1 = (x + 1)[x4 + (a − 1)x3 + (b − a + 1)x2 + (a − 1)x + 1]
Przykład z listy zadań (z 5 = 1).
z 4 + z 3 + z 2 + z + 1 = 0,
w = z + 1/z,
w2 + w − 1,
w = (1 ±
√
5)/2.
Dlatego
cos 2π/5 = cos 8π/5 = (1 +
√
cos 4π/5 = cos 6π/5 = (1 −
5)/4,
28
√
5)/4,
Wielomiany symetryczne
W tej części rozpatrujemy wielomiany wielu zmiennych. Na zmienne nadal możemy
patrzyć jak na pewne symbole.
Definicja. Jednomianem nazywamy wyrażenie axk11 xk22 · · · xknn .
Stopniem jednomianu jest suma k1 +k2 +· · ·+kn . Stopniem wielomianu n zmiennych
jest największy ze stopni jednomianów występujących w zapisie wielomianu.
Rozważmy wielomian n + 1 zmiennych
(t − x1 )(t − x2 ) · · · (t − xn ) = tn − σ1 tn−1 + σ2 tn−2 + · · · + (−)n σn .
Powyższa równość definiuje zbiór wielomianów n zmiennych
σk = σk (x1 , x2 , . . . , xn ) =
X
xi 1 xi 2 · · · xi k ,
k = 1, 2, . . . , n.
1¬i1 <i2 <...<ik ¬n
Np. dla n = 3 mamy
(t − x)(t − y)(t − z) = t3 − (x + y + z)t2 + (xy + xz + yz)t − xyz = t3 − σ1 t2 + σ2 t − σ3 .
Wzory Vieta. Jeśli x1 , x2 , . . . , xn są pierwiastkami wielomianu (m-krotne pierwiastki wypisane są m-krotnie)
f = tn + an−1 tn−1 + · · · + a0 ,
to
an−k = (−)k σk (x1 , x2 , . . . , xn ),
Definicja. Wielomian f
k = 1, 2, . . . , n.
n zmiennych nazywa się wielomianem symetrycznym, jeśli
f (xi1 , xi2 , . . . , xin ) = f (x1 , x2 , . . . , xn )
dla dowolnej permutacji (i1 , i2 , . . . , ik ) liczb (1, 2, . . . , n).
Stwierdzenie. Wielomiany σk są symetryczne.
Twierdzenie. Jeśli f jest wielomianem symetrycznym n zmiennych, to
f (x1 , x2 , . . . , xk ) = Q(σ1 , σ2 , . . . , σn ),
gdzie Q jest pewnym wielomianem n zmiennych o współczynnikach z tego samego
pierścienia (ciała), z którego pochodzą współczynniki wielomianu f .
Dowód. Indukcja ze względu na liczbę zmiennych n oraz ze względu na stopień
wielomianu.
Jeśli n = 1, to σ1 (x1 ) = x i f (x1 ) = f (σ1 ).
Dla wielomianów zerowych i wielomianów stopnia 0 nie ma czego dowodzić.
Od teraz indeks górny przy σ będzie oznaczać liczbę zmiennych. Zachodzą relacje
σkn+1 (x1 , x2 , . . . , xn , 0) = σkn (x1 , x2 , . . . , xn ),
σkn = 0 dla k > n.
Załóżmy, że twierdzenie jest prawdziwe dla n oraz dla n + 1, ale tylko dla wielomianów stopnia mniejszego od k. Pokażemy, że twierdzenie jest prawdziwe dla
29
wielomianów n + 1 zmiennych stopnia k. Niech f będzie takim wielomianem. Wielomian f (x1 , x2 , . . . , xn , 0) jest wielomianem symetrycznym n zmiennych. Z założenia
indukcyjnego wynika, że istnieje wielomian Q1 taki, że
f (x1 , x2 , . . . , xn , 0) = Q1 (σ1n , σ2n , . . . , σnn ).
Wielomian
h(x1 , . . . , xn+1 ) = f (x1 , x2 , . . . , xn+1 ) − Q1 (σ1n+1 , σ2n+1 , . . . , σnn+1 )
jest wielomianem symetrycznym n + 1 zmiennych. h(x1 , x2 , . . . , xn , 0) = 0. Z twierdzenia Bezout wynika, że h(x1 , x2 , . . . , xn+1 ) = xn+1 w(x1 , x2 , . . . , xn ). Ze względu
na symetrię tak samo jest dla pozostałych zmiennych. Dlatego
n+1
h(x1 , x2 , . . . , xn+1 ) = x1 x2 · · · xn+1 g(x1 , x2 , . . . , xn+1 ) = σn+1
g(x1 , x2 , . . . , xn+1 ).
Wielomian g jest jest wielomianem symetrycznym n + 1 zmiennych stopnia mniejszego od k. Z założenia indukcyjnego istnieje wielomian Q2 taki, że
n
n+1
g(x1 , x2 , . . . , xn+1 ) = Q2 (σn+1
, . . . , σn+1
)
Mamy więc oczekiwany wynik
n+1
n+1
f (x1 , . . . , xn+1 ) = Q1 (σ1n+1 , . . . , σnn+1 ) + σn+1
Q2 (σ1n , . . . , σn+1
).
Można pokazać, że wielomian Q jest określony jednoznacznie.
Przykład.
f (x, y, z) = x2 y 2 + x2 z 2 + y 2 z 2 ,
f (x, y, 0) = x2 y 2 = (σ22 )2 ,
f (x, y, z) − (σ23 )2 = x2 y 2 + x2 z 2 + y 2 z 2 − (xy + xz + yz)2 = −2xyz(x + y + z),
f (x, z, z) = (σ23 )2 − 2σ33 σ13 = (xy + xz + yz)2 − 2xyz(x + y + z).
Zdefiniujmy drugi zbiór wielomianów symetrycznych.
τk = τk (x1 , x2 , . . . , xk ) = xk1 + xk2 + · · · + xkn ,
k = 1, 2, 3, . . .
Przeprowadźmy pewien rachunek (górny indeks przy σ i τ oznacza liczbę zmiennych).
f (t) = tn − σ1n tn−1 + σ2n tn−2 + · · · + (−)n σnn ,
0=
n
X
f (xj ) = 0,
j = 1, 2, . . . , n.
n
n
f (xi ) = τnn − σ1n τn−1
+ σ2n τn−2
+ · · · + n(−)n σnn .
i=1
Niech
m
m
+ · · · + n(−)n σnm .
+ σ2m τn−2
Pm (x1 , x2 , . . . , xm ) = τnm − σ1m τn−1
Pm (x1 , x2 , . . . , xm ) = Pn (x1 , x2 , . . . , xm , 0, . . . , 0) = 0 dla m < n.
Pokażemy, że dla m ­ n Pm = 0. Dowód indukcyjny. Wiemy już, że Pn = 0.
Załóżmy, że Pm = 0 (m ­ n).
Pm+1 (x1 , x2 , . . . , xm , 0) = Pm (x1 , x2 , . . . , xm ) = 0.
30
Dlatego
Pm+1 (x1 , x2 , . . . , xm+1 ) = x1 x2 · · · xm+1 h(x1 , x2 , . . . , xm+1 ).
Ale wielomian Pm+1 ma stopień n < m + 1. Dlatego h = 0 i Pm+1 = 0.
Zatem dla dowolnej liczby zmiennych zachodzą wzory (górne indeksy pomijamy)
Wzory Newtona.
0 = τn − σ1 τn−1 + σ2 τn−2 + · · · + n(−)n σn ,
σ 1 = τ1 ,
2σ2 = τ1 σ1 − τ2 ,
n = 1, 2, 3, . . .
3σ2 = τ1 σ2 − τ2 σ1 + τ3 ,
···
Grupy
Definicja. Grupą nazywamy zbiór z działaniem posiadającym 3 własności
• a(bc) = (ab)c
• Istnieje element e taki, że ae = ea = a
• Dla każdego a istnieje b takie, że ab = ba = e
Jeśli ab = ba, to grupę nazywamy grupą abelową lub przemienną.
Przykłady grup.
• Pierścień, w szczególności ciało, z jednym działaniem – dodawaniem
(np. Z, Q, R, C, Zn z dodawaniem).
• Zbiór elementów niezerowych ciała z jednym działaniem – mnożeniem
(np. Q∗ = Q \ {0}, R∗ = R \ {0}, C∗ = C \ {0} z mnożeniem).
• Zbiór elementów odwracalnych pierścienia z jednym działaniem – mnożeniem
∗
= {1, 2, 4, 5, 8, 10, 11, 13, 16, 17, 19, 20} z mnożeniem)
(np. Z21
• Zbiór dodatnich liczb wymiernych (rzeczywistych) z mnożeniem.
• Zbiór liczb zespolonych o module 1.
• Zbiór pierwiastków n-tego stopnia z jedności z mnożeniem.
Cn = {z ∈ C : z n = 1}.
(wszystkie wymienione grupy są abelowe)
Uwaga. W definicji grupy wystarczy przyjąć, że istnieje prawostronny element
neutralny i prawostronny element odwrotny.
• a(bc) = (ab)c
• Istnieje element e taki, że ae = a
• Dla każdego a istnieje b takie, że ab = e
31
Dowód. Załóżmy, że ab = e. Pokażmy, że ba = e. Niech c będzie elementem odwrotnym do b, tzn.bc = e. Mamy
ba = (ba)e = (ba)(bc) = (b(ab))c = (be)c = bc = e.
Pokażemy teraz, że ea = a. Niech b będzie elementem odwrotnym do a, tzn. ab =
e = ba. Mamy
a = a(ba) = (ab)a = ea.
Wnioski.
• Element neutralny jest jedyny.
Dowód. Jeśli e i e0 są elementami neutralnymi, to e0 = ee0 = e.
• Element odwrotny do danego elementu jest jedyny.
Element odwrotny do a oznaczmy przez a−1 .
Dowód. Jeśli ab = e i ac = e, to b = be = b(ac) = (ba)c = ec = c.
• (ab)−1 = b−1 a−1 .
Dowód. Elementy (ab)−1 i b−1 a−1 są odwrotne do ab.
Oznaczenia. Zwykle działania oznaczamy kropką (często pomijaną) lub plusem.
W przypadku grup nieprzemiennych używamy kropki.
Niech n będzie dodatnią liczbą całkowitą. W zapisie z kropką an oznacza iloczyn
n czynników równych a, a0 = e, a−n = (a−1 )n .
W zapisie z plusem, na oznacza sumę n składników równych a, 0a = 0
(0 po prawej stronie oznacza element neutralny w grupie), (−n)a = −(na).
Przykłady.
• G1 = {0, 1, 2, 3} z dodawaniem modulo 4.
• G1 = {1, i, −1, −i} z mnożeniem.
G1
0
Tabelki działań. 1
2
3
0
0
1
2
3
1
1
2
3
0
2
2
3
0
1
3
3
0
1
2
G2
1
i
-1
-i
1 i -1 -i
1 i -1 -i
i -1 -i 1
-1 -i 1 i
-i 1 i -1
Jeśli w pierwszej tabeli w miejsce 0, 1, 2, 3 wpiszemy 1, i, −1, −i,
to otrzymamy drugą tabelę. Opisane przekształcenie możemy zapisać wzorem φ(x) =
ix . Przekształcenie φ jest odwracalne i φ(x + y) = φ(x)φ(y) (plus oznacza dodawanie
modulo 4).
Definicja. Przekształcenie φ grupy G1 w grupę G2 spełniające warunek
φ(xy) = φ(x)φ(y)
nazywamy homomorfizmem (po lewej stronie mamy działanie w grupie G1 , po prawej
stronie działanie w grupie G2 ).
Odwracalny homomorfizm nazywamy izomorfizmem. Mówimy wtedy, że grupy
G1 i G2 są izomorficzne.
Grupy z przykładu są izomorficzne.
32
Grupa przekształceń
Definicja. Niech X będzie zbiorem, a G pewnym zbiorem funkcji odwracalnych
(bijekcji) przekształcających X na X.
G nazywamy grupą przekształceń, jeśli
• identyczność ∈ G.
• f ∈ G ⇒ f −1 ∈ G.
• f, g ∈ G ⇒ f g ∈ G.
Stwierdzenie Grupa przekształceń jest grupą (działaniem jest składanie przekształceń).
Przykłady
1. Grupa izometrii płaszczyzny.
2. Grupa obrotów płaszczyzny względem ustalonego punktu.
3. Grupa przesunięć.
4. Grupa izometrii danej figury.
Twierdzenie (Cayley). Każda grupa jest izomorficzna z pewną grupą przekształceń.
Dowód. Niech G będzie grupą i g ∈ G. Definiujemy przekształcenie φg zbioru G
w zbiór G:
φg (a) = ga, a ∈ G
Oznaczmy symbolem G̃ zbiór wszystkich przekształceń tej postaci.
Pokażemy, że zbiór G̃ jest grupą przekształceń izomorficzną z G.
• φe (a) = ea = a i widzimy, że element neutralny należy do G̃.
• Złożenie dwóch przekształceń z G̃ należy do G̃.
Mamy bowiem φg fh (a) = φg (ha) = g(ha) = (gh)a = φgh (a)
czyli φg φh = φgh .
• Dla każdego elementu z G̃ znajdziemy w G̃ element odwrotny.
Mamy bowiem φg φg−1 = φgg−1 = φe =identyczność.
Zatem G̃ jest grupą przekształceń.
• Przekształcenie g → φg z definicji przekształca G na G̃.
Pokażemy, że przekształcenie to jest różnowartościowe.
Jeśli φg = φh , to g = φg (e) = φh (e) = h.
• Przekształcenie jest homomorfizmem: φgh = φg φh .
33
Definicja. Grupę G nazywamy grupą cykliczną, jeśli istnieje element
a ∈ G taki, że każdy element G da się przedstawić jako pewna potęga
elementu a. Element a nazywamy generatorem grupy G.
Grupa Z z dodawaniem jest cykliczna.
Grupa Zn z dodawaniem jest cykliczna.
Grupa G2 z przykładu jest cykliczna, G2 = {i0 = 1, i, i2 = −1, i3 = −i}.
Definicja. Grupą permutacji (grupą symetryczną) nazywamy grupę wszystkich
przekształceń odwracalnych (bijekcji) zbioru {1, 2, 3, ..., n} na zbiór {1, 2, 3, ..., n}.
Grupę permutacji oznaczamy symbolem Sn .
Grupa Sn liczy n! elementów.
Element σ ∈ Sn można zapisać w postaci
σ=
1
σ1
2
σ2
... n
.
.... σn
W szczególności
1 2 3
1 2 3
1 2 3
S3 = {
,
,
,
1 2 3
2 1 3
3 2 1
1 2 3
1 2 3
1 2 3
,
,
}.
1 3 2
2 3 1
3 1 2
Grupa S3 nie jest przemienna. Mamy bowiem
1 2 3
2 1 3
1 2 3
3 2 1
1 2 3
3 2 1
1 2 3
2 1 3
1 2 3
3 1 2
1 2 3
2 3 1
=
=
Uwaga. Kolumny w nawiasie nie muszą być uporządkowane.
σ
−1
=
σ1
1
σ2
2
.... σn
,
... n
1 2 3
2 3 1
−1
=
2 3 1
1 2 3
=
1 2 3
.
3 1 2
Definicja Iloczynem prostym grup G, H nazywamy zbiór G × H z działaniem
(g1 , h1 )(g2 , h2 ) = (g1 g2 , h1 h2 ).
Podgrupy
Definicja. Niech G będzie grupą. Podzbiór H zbioru G nazywamy podgrupą grupy
G, jeśli
• e∈H
• g ∈ H ⇒ g −1 ∈ H
34
• g, h ∈ H ∈ H ⇒ gh ∈ H
Spostrzeżenie. Podgrupa jest grupą. Każda grupa G posiada co najmniej dwie
podgrupy G i {e}.
Grupa S3 ma jedną podgrupę 6-elementową, jedną podgrupę 3-elementową, trzy
podgrupy 2-elementowe i jedną podgrupę jednoelementową.
Definicja. Liczbę elementów grupy nazywamy rzędem grupy. Rząd grupy G
będziemy oznaczać przez rz G.
Będziemy zmierzać do pokazania, że rząd podgrupy dzieli rząd grupy.
Definicja. Niech H będzie podgrupą grupy G. Warstwą lewostronną elementu
g ∈ G nazywamy zbiór aH = {ah : h ∈ H}.
Przykład. Zbiór 3Z = {..., −6, −3, 0, 3, 6, ...} jest podgrupą grupy addytywnej
liczb całkowitych (tzn. zbioru liczb całkowitych z dodawaniem). Warstwami są zbiory:
3Z,
1 + 3Z = {..., −5, −2, 1, 4, 7, ...},
2 + 3Z = {..., −4, −1, 2, 5, 8, ...}.
Zbiory te są rozłączne i dają w sumie zbiór Z.
Twierdzenie (Lagrange). Jeśli rząd grupy jest skończony, to rząd podgrupy
dzieli rząd grupy.
Dowód. Niech H będzie podgrupą grupy G. Zdefiniujmy relację. Powiemy, że a
jest w relacji z b, jeśli a−1 b ∈ H. Tak zdefiniowana relacją jest relacją równoważności.
• a−1 a = e ∈ H.
• a−1 b ∈ H ⇒ b−1 a = (a−1 b)−1 ∈ H.
• a−1 b ∈ H i b−1 c ∈ H ⇒ a−1 c = (a−1 b)(b−1 c) ∈ H.
Klasami równoważności są warstwy. Dokładniej, klasą abstrakcji elementu a jest
warstwa aH.
x−1 a ∈ H ⇔ a−1 x ∈ H ⇔ a−1 x = h dla pewnego h ∈ H ⇔ x = ah ∈ aH.
Wiemy, że relacja równoważności dzieli zbiór na rozłączne klasy abstrakcji.
Przekształcenie aH → bH określone wzorem x → ba−1 x jest odwracalne. Dlatego dowolne dwie warstwy są równoliczne. W szczególności każda warstwa jest
równoliczna z warstwą eH = H.
Ponieważ G jest sumą rozłącznych warstw, powiedzmy k warstw, więc
k rz H = rz G.
Uwaga. Relacja przystawania modulo n jest właśnie tego rodzaju relacją.
a ≡ b (mod n) ⇔ b − a ∈ nZ.
35
Podgrupy cykliczne
Niech G będzie grupą skończoną i a ∈ G. Wtedy zbiór {a, a2 , a3 , ...} jest skończony.
Dlatego dla pewnych i < j ai = aj tzn. aj−i = e.
Definicja. Najmniejszą nieujemną liczbę całkowitą n taką, że an = e nazywamy
rzędem elementu a (jeśli taka liczba nie istnieje mówimy, że rząd elementu jest
nieskończony).
Widzimy, że w grupie skończonej każdy element ma rząd skończony. Jeśli rząd
a ∈ G wynosi n, to H = {e, a, a2 , ..., an−1 } jest n-elementową podgrupą grupy G.
Element a nazywamy generatorem grupy H. Mówimy też, że element a generuje
grupę H.
Wiemy, że rząd podgrupy dzieli rząd grupy. Jeśli r = rz G, to r = kn
i ar = ank = (ak )n = en = e. Mamy więc twierdzenie.
Twierdzenie. Jeśli rząd grupy G równy jest r i a ∈ G, to ar = e.
Uwaga. Grupa której rząd jest liczbą pierwszą jest grupą cykliczną.
Dowód. Dowolny element różny od elementu neutralnego generuje całą grupę.
Niech p będzie liczbą pierwszą. Zp∗ = {1, 2, ..., p − 1} jest multiplikatywną grupą
ciała Zp . Zatem ap−1 = 1 dla a ∈ Zp∗ . Wynika stąd
Twierdzenie (Fermat). Jeśli liczba pierwsza p nie dzieli liczby
całkowitej a, to
p|ap−1 − 1.
Dowód. Przekształcenie ψ(a) = a mod n (reszta z dzielenia a przez n) jest homomorfizmem pierścienia Z w pierścień Zn .
ψ(a + b) = ψ(a)ψ(b),
ψ(ab) = ψ(a)ψ(b).
U nas n = p. Jeśli p nie dzieli a to ψ(a) 6= 0. Mamy więc równość
ψ(ap−1 ) = ψ(a)p−1 = 1
czyli
p|ap−1 − 1.
Przykłady. 13|512 − 1, 23|2522 − 1.
Pewne uogólnienie. Oznaczmy rząd multiplikatywnej grupy Zn∗ przez φ(n) (funkcja Eulera).
a ∈ Zn∗ ⇔ równanie ax + kn = 1 ma rozwiązanie ⇔ N W D(a, n) = 1
(jako element odwrotny do a bierzemy resztę z dzielenia x przez n).
Przykład.
Z15 = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14}.
∗
= {1, 2, 4, 7, 8, 11, 13, 14},
Z15
φ(15) = 8,
15|78 − 1.
Mamy więc uogólnienie (małego) twierdzenia Fermata
Twierdzenie (Euler). Jeśli n jest nieujemną liczbą całkowitą
i N W D(a, n) = 1, to
n|aφ(n) − 1.
36
Dowód taki sam jak dowód twierdzenia Fermata.
Rozważmy teraz wielomian f = xp−1 − 1 ∈ Zp [x]. Wiemy, że jeśli
a ∈ Zp i a 6= 0, to ap = 1. Dlatego każdy niezerowy element ciała Zp
jest pierwiastkiem wielomianu f . Mamy więc
xp−1 − 1 = (x − 1)(x − 2) · · · (x − p + 1).
Podstawiając x = 0 otrzymujemy
−1 = (−1)(−2) · · · (−p + 1) = (p − 1)(p − 2) · · · 2 · 1
tzn. p|(p − 1)! + 1
(przypomnijmy, elementem przeciwnym do a w Zn jest liczba n − a).
Załóżmy, że d|p i d > 0 oraz p|(p − 1)! + 1. Jeśli d < p, to d|(p − 1)!. Wtedy d|1.
Zatem jedynym dodatnim dzielnikiem p mniejszym od p jest liczba 1. Oznacza to,
że p jest liczbą pierwszą.
Mamy więc
Twierdzenie (Wilson). Liczba całkowita p większa od 1 jest liczbą pierwszą
wtedy i tylko wtedy, gdy p|(p − 1)! + 1.
Permutacje
Przypomnienie.
Definicja. Grupą permutacji nazywamy zbiór bijekcji zbioru {1, 2, ..., n} na zbiór
{1, 2, ..., n}. Grupę permutacji oznaczamy symbolem Sn .
Notacja 2-wierszowa. Jeśli σ ∈ Sn , to piszemy
1
σ1
2
σ2
3 ...
... σn
σ1
1
σ2
2
... σn
3 ...
1 2 3 4
,
2 3 4 1
σ=
n
.
Permutacja odwrotna
σ=
n
.
Przykład. σ, µ ∈ S4 .
σ=
Złożenie.
µσ =
1 2 3 4
,
1 4 2 3
Odwrotność.
σ
−1
µ=
=
1 2 3 4
.
2 1 4 3
σµ =
2 3 4 1
1 2 3 4
37
=
1 2 3 4
.
3 2 1 4
1 2 3 4
.
4 1 2 3
Cykle
Definicja. Niech i1 , i2 , ..., ik ∈ {1, 2, ..., n} będą różnymi liczbami. Cyklem (o długości k) nazywamy permutację σ ∈ Sn taką, że
σ i1 = i 2 ,
σi1 = i2 , ..., σik = i1 ,
σj = j dla j 6= i1 , i2 , ..., ik .
Piszemy σ = (i1 , i2 , ..., ik ). Dany cykl możemy zapisać na k sposobów zaczynając od
dowolnego il , l = 1, 2, ..., k.
Przykład.
1 2 3 4 5
σ=
.
3 5 4 1 2
σ1 = 3, σ3 = 4, σ4 = 1,
σ2 = 5, σ5 = 2,
σ = (1, 2, 4)(2, 5) = (2, 5)(1, 2, 4).
Definicja. Jeśli zbiory {i1 , i2 , ..., ik }, {j1 , j2 , ..., jl } są rozłączne,
to mówimy, że cykle (i1 , i2 , ..., ik ),(j1 , j2 , ..., jk ) są rozłączne
Złożenie rozłącznych cykli nie zależy od kolejności składania.
Twierdzenie. Każdą permutację można przedstawić jako złożenie rozłącznych
cykli.
Dowód. Niech σ ∈ Sn . Bierzemy dowolny element i1 taki, że σ(i1 ) 6= i1 . Znajdujemy kolejne obrazy: i2 = σ(i1 ), i3 = σ(i2 ), .... Ponieważ obrazy należą do zbioru
skończonego (n-elementowego), więc dla pewnych j, k takich, że j < k σ(ik ) = ij .
Ponieważ σ jest przekształceniem różnowartościowym, więc ij = i1 . Inaczej mielibyśmy σ(ik ) = ij = σ(ij−1 ). Permutacja σ jest złożeniem cyklu (i1 , i2 , ..., ik ) i
permutacji takiej, że µ(il ) = il dla l = i1 , i2 , ..., ik . Następnie powtarzamy rozumowanie wychodząc z dowolnego elementu różnego od i1 , i2 , ..., ik . Po pewnej liczbie
kroków otrzymujemy żądany rozkład.
Definicja. Cykl o długości 2 nazywamy transpozycja.
Obserwacja.
(1, 2, 3) = (1, 2)(2, 3),
(1, 2, 3, 4) = (1, 2)(2, 3)(3, 4)
i ogólnie
(i1 , i2 , ..., ik ) = (i1 , i2 )(i2 , i3 )...(ik−1 , ik ).
Wniosek. Cykl o długości k można zapisać jako złożenie k − 1 transpozycji.
Wynika stąd
Twierdzenie. Każdą permutację można przedstawić jako złożenie pewnej liczby
transpozycji.
Można inaczej. Przykład.
1 2 3 4 5
2 5 3 1 4
= (4, 5)(1, 4)
1 2 3 4 5
= (4, 5)
2 4 3 1 5
1 2 3 4 5
2 1 3 4 5
=
= (4, 5)(1, 4)(1, 2).
Obserwacja.
(1, 3) = (1, 2)(2, 3)(1, 2),
38
(1, 4) = (1, 2)(2, 3)(3, 4)(2, 3)(3, 4)
i ogólnie dla i < j
(i, j) = (i, i + 1)(i + 1, i + 2) · · · (j − 1, j) · · · (i + 1, i + 2)(i, i + 1).
Wniosek.; Każdą permutację można zapisać jako złożenie transpozycji postaci
τi = (i, i+1), gdzie i = 1, 2, ..., n−1. Inaczej mówiąc permutacje τ1 , τ2 , ..., τn generują
grupę Sn .
Zachodzą relacje
τi2 = id,
|i − j| > 1
τi τj = τj τi ,
τi τi+1 τi = τi+1 τi τi+1 .
Inwersje
Definicja. Niech σ ∈ Sn . Mówimy, że para (σi , σj ) tworzy inwersję, jeśli σi > σj dla
i < j.
Przykład.
1 2 3 4 5
σ=
.
2 5 3 1 4
Pary (2, 1), (5, 3), (5, 4), (3, 1) tworzą inwersje.
Liczba inwersji w permutacji identycznościowej wynosi
0.
1
2
3
... n
Największa liczba inwersji występuje w permutacji
n n − 1 n − 2 ... 1
i wynosi n(n − 1)/2.
Twierdzenie. Liczby inwersji w permutacjach σ i σ(i, i + 1) różnią się o 1.
Dowód.
1 2 ... i i + 1 ... n
σ=
.
σ1 σ2 ... σi σi+1 ... σn
µ = σ(i, i + 1) =
1
σ1
2
σ2
...
i
... σi+1
µj = σj dla j 6= i, i + 1,
i + 1 ... n
.
σi
... σn
µi = σi+1 ,
µi+1 = σi .
Zbiory par {(σj , σk ) : 1 ¬ j < k ¬ n} i {(µj , µk ) : 1 ¬ j < k ¬ n} różnią
się jednym elementem. W drugim zbiorze zamiast pary (σi , σi+1 ) występuje para
(σi+1 , σi ). Dlatego w przypadku kiedy σi < σi+1 , liczba inwersji w permutacji µ jest
o jeden większa od liczby inwersji w permutacji σ, a w przypadku kiedy σi > σi+1 o
jeden mniejsza.
39
Znak permutacji
Definicja. Znak permutacji σ definiujemy wzorem
znak(σ) = (−1) liczba inwersji w permutacji σ .
Twierdzenie. Znak permutacji jest homomorfizmem grupy Sn w grupę liczb
{1, −1} z mnożeniem.
znak(σµ) = znak(σ)znak(µ).
Dowód. Wiemy już, że znak(σ(i, i + 1)) = −znak(σ). Dlatego
znak(τi1 τi2 · · · τik ) = −znak(τi1 τi2 · · · τik−1 ) = · · · = (−1)k znak(id) = (−1)k .
Jeśli σ = τi1 τi2 · · · τik , µ = τj1 τj2 · · · τjm , to σµ = τi1 τi2 · · · τik τj1 τj2 · · · τjm i znak(σ) =
(−1)k , znak(µ) = (−1)m , znak(σµ) = (−1)k+m . Stąd równość znak(σµ)znak(σ)znak(µ).
Znak zwykle oznacza się skrótem sgn.
Wnioski. Znak transpozycji równy jest -1. Znak cyklu od długości k wynosi (−1)k−1 . Daną permutację można na różne sposoby przedstawić jako złożenie
transpozycji. Jeśli w jednym przedstawieniu występuje parzysta (nieparzysta) liczba
transpozycji, to w każdym innym przedstawieniu też wystąpi parzysta (nieparzysta)
liczba transpozycji.
Permutacje, których znak równy jest 1 nazywamy permutacjami parzystymi.
Uwaga. Permutacje parzyste tworzą podgrupę. Identyczność jest permutacją
parzystą. Złożenie dwu permutacji parzystych jest permutacją parzystą. Odwrotność
permutacji parzystej jest permutacją parzystą.
znak(σ −1 )znak(σ) = znak(σ −1 σ) = znak(id) = 1 ⇒ znak(σ −1 ) = znak(σ).
Definicja. Podgrupę grupy Sn złożoną z permutacji parzystych nazywamy grupą
alternującą i oznaczamy symbolem An .
Dla n > 1 grupa An liczy n!/2 elementów. Wystarczy zauważyć, że przekształcenie σ → (1, 2)σ jest odwracalne i przekształca permutacje parzyste na permutacje
nieparzyste. Zatem permutacji parzystych jest tyle samo co nieparzystych.
Dzielnik normalny i grupa ilorazowa
Warstwa lewostronna: aH = {ah : h ∈ H}.
Warstwa prawostronna: Ha = {ha : h ∈ H}.
Definicja. Niech H będzie podgrupą grupy G. Podgrupę H nazywamy podgrupą
normalną (dzielnikiem normalnym) grupy G, jeśli dla każdego
a ∈ G zachodzi równość aH = Ha (tzn. warstwa lewostronna elementu a pokrywa
się z warstwą prawostronną elementu a).
Uwaga. Podgrupę normalną można zdefiniować równoważnie, żądając aby dla
każdego a ∈ G i każdego h ∈ H aha−1 ∈ H.
40
Dowód. II definicja ⇒ I definicja.
x ∈ aH ⇒ x = ah dla pewnego h ∈ H ⇒ x = (aha−1 )a ∈ Ha.
Tzn. aH ⊂ Ha. Podobnie Ha ⊂ aH. Dlatego aH = Ha.
I definicja ⇒ II definicja. Niech h ∈ H. ah ∈ aH = Ha. Tzn. ah = wa dla
pewnego w ∈ H. Ale z równości ah = wa wynika, że aha−1 = w ∈ H.
Uwaga. Każda podgrupa grupy przemiennej jest podgrupą normalną.
Twierdzenie. Jeśli H jest dzielnikiem normalnym grupy G, to zbiór warstw
(G/H) z działaniem
(aH)(bH) = (ab)H
jest grupą (zwaną grupą ilorazową).
Dowód. Zaczniemy od pokazania, że definicja działania jest poprawna. Załóżmy,
że aH = cH i bH = dH. Wtedy a−1 c ∈ H i b−1 d ∈ H, a stąd (ab)−1 cd = b−1 a−1 cd =
b−1 d[d−1 (a−1 c)d] ∈ H i dlatego abH = cdH.
Teraz pokazanie, że zbiór warstw jest grupą jest proste.
• (aH)((bH)(cH)) = (aH)(bcH) = (a(bc))H = ((ab)c)H = (abH)(cH) =
((aH)(bH))(cH).
• (eH)(aH) = eaH = aH,
eH = H.
• (a−1 H)(aH) = a−1 aH = eH.
Przykład. Niech G = S4 i H = {id, (1, 2)(3, 4), (1, 3)(2, 4), (1, 4)(2, 3)}. H jest
podgrupą normalną G.
(1, 2)H = {(1, 2), (3, 4), (1, 3, 2, 4), (1, 4, 2, 3)} = H(1, 2), itd.
Nietrudno sprawdzić, że H jest podgrupą grupy G. Pozostaje do sprawdzenia, że
jeśli a ∈ G i h ∈ H, to aha−1 ∈ H.
Zauważmy, że
aha−1 =
1
a1
2
a2
... n
... an
a1
ah1
=
1
h1
2
h1
a2
ah2
... n
... hn
... an
... ahn
a1
1
a2
2
... an
... n
=
.
W szczególności a(b1 , b2 , ..., bk )a−1 = (ab1 , ab2 , ..., abk ). Zatem jeśli h rozkłada się na
rozłączne cykle o długościach k1 , k1 , ..., kl , to aha−1 też rozkłada się na rozłączne
cykle o długościach k1 , k1 , ..., kl .
H skład się z identyczności i wszystkich permutacji będących złożeniem 2 rozłącznych transpozycji. Dlatego jeśli h ∈ H, to aha−1 ∈ H.
Jądro homomorfizmu
Definicja. Niech G, H będą grupami. Jądrem homomorfizmu φ : G → H nazywamy
przeciwobraz elementu neutralnego czyli zbiór
ker φ = {g ∈ G : φ(g) = e}.
41
Uzupełnienie. Dwie własności homomorfizmu.
φ(g) = φ(eg) = φ(e)φ(g),
φ(g −1 )φ(g) = φ(g −1 g) = φ(e).
Dlatego
φ(e) = e,
φ(g −1 ) = φ(g)−1 .
Twierdzenie. Jądro homomorfizmu φ : G → H jest dzielnikiem normalnym
grupy G.
Dowód.
• φ(e) = e ⇒ e ∈ ker φ.
• a ∈ ker φ ⇒ φ(a−1 ) = φ(a)−1 = e−1 = e ⇒ a−1 ∈ ker φ.
• a, b ∈ ker φ ⇒ φ(ab) = φ(a)φ(b) = ee = e ⇒ ab ∈ ker φ.
• h ∈ ker φ ⇒ φ(ghg −1 ) = φ(g)φ(h)φ(g −1 ) = φ(g)eφ(g)−1 = e
⇒ ghg −1 ∈ ker φ.
Uwaga. Niech φ będzie homomorfizmem grupy G w grupę H. Obraz φ(G) jest
podgrupą grupy H.
• e = φ(e) ∈ φ(G).
• φ(a)−1 = φ(a−1 ) ∈ φ(G).
• φ(a)φ(b) = φ(ab) ∈ φ(G).
Przykład. Funkcja znak jest homomorfizmem Sn w grupę {1, −1}. Jądrem tego
homomorfizmu jest grupa An . Zatem An jest dzielnikiem normalnym Sn . Wynika
to również z ogólniejszego faktu: jeśli H jest podgrupą G i rząd G jest dwa razy
większy od rzędu H, to H jest dzielnikiem normalnym G.
Przykład. Niech n 6= 0 i φ(a) = a mod n (reszta z dzielenia a przez n). Przekształcenie φ jest homomorfizmem grupy addytywnej Z na grupę addytywną Zn .
Jądremhomomorfizmuu φ jest nZ.
Przekształcenie a → a + nZ jest homomorfizmem grupy Z w grupę ilorazową
Z/nZ.
Grupa ilorazowa Z/nZ jest izomorficzna z Zn . Izomorfizm zadany jest wzorem
a + nZ → φ(a) = a mod n.
Jest to szczególny przypadek ogólniejszego twierdzenia.
Twierdzenie. Niech G i H będą grupami, a φ homomorfizmem G w H. Homomorfizm
φ : G → φ(G)
jest złożeniem homomorfizmu
G → G/ ker φ,
a → a ker φ
z izomorfizmem
G/ ker φ → φ(G),
42
a ker φ → φ(a).
Uwaga. Ogólniej, niech f : X → Y . Powiemy, że a jest w relacji z b, jeśli
f (a) = f (b). Zdefiniowana relacja jest relacją równoważności.
Przekształcenie f jest złożeniem 2 przekształceń
X → zbiór klas,
zbiór klas → f (X),
x → klasa elementu x,
klasa elementu x → f (x) (przekszt. różnowartościowe).
Przestrzeń liniowa
Od tego miejsca K będzie oznaczało ciało R lub C. Duża część definicji i twierdzeń
będzie prawdziwa w przypadku dowolnego ciała.
Definicja. Niech V będzie niepustym zbiorem, którego elementy można dodawać
do siebie i mnożyć przez elementy ciała K. Elementy zbioru V będziemy nazywać
wektorami, a elementy ciała K skalarami.
Zbiór V nazywamy przestrzenią liniową (wektorową) nad ciałem K, jeśli wspomniane działania posiadają następujące własności
(u, v, w ∈ V, α, β ∈ K)
• (u + v) + w = u + (v + w)
• u+v =v+u
• Istnieje wektor 0 taki, że u + 0 = u
• Dla każdego u istnieje v takie, że u + v = 0
• (αβ)u = α(βu)
• 1u = u (1 ∈ K)
• (α + β)u = αu + βu
• α(u + v) = αu + αv
Wnioski. V z dodawaniem jest grupą abelową. Dlatego element 0 jest jedyny,
element przeciwny do danego jest jedyny, −(−u) = u.
0u = 0,
(−α)u = −(αu) = α(−u).
α0 = 0,
Dowód. αu = (0 + α)u = 0u + αu. Dlatego 0u = 0. αu = α(u + 0) = αu + α0. Stąd
α0 = 0. 0 = 0u = (α + (−α))u = αu + (−α)u. Stąd (−α)u = −(αu). 0 = α0 =
α(u + (−u)) = αu + α(−u). Stąd α(−u) = −(αu).
Podstawowy przykład: K n .
x1
x 
 2


 .  ∈ K n,


 . 
xn


x1
y1
x1 + y 1
x  y 
x +y 
2 
 2  2
 2

 



 . + . =
.
,

 



 .   . 


.
xn
yn
xn + y n





43

x1
αx1
x 
 αx 
2
 2





α
.
 =  . .




 . 
 . 
xn
αxn




Definicja. Niepusty podzbiór W przestrzeni V nazywamy podprzestrzenią przestrzeni V , jeśli
• u, v ∈ W ⇒ u + v ∈ W .
• u ∈ W, α ∈ K ⇒ αu ∈ W .
Uwaga. Część wspólna dwóch podprzestrzeni jest podprzestrzenią.
Definicja. Niech a1 , a2 , ..., ak ∈ K. Kombinacją liniową wektorów
v1 , v2 , ..., vk ∈ V nazywamy sumę
a1 v1 + a2 v2 + · · · + an vn ∈ V.
Elementy a1 , a2 , ..., an nazywamy współczynnikami tej kombinacji liniowej.
Definicja. Mówimy, że skończony zbiór wektorów {v1 , v2 , ..., vn } jest liniowo niezależny, jeśli jedyną kombinacją liniową równą 0 jest kombinacja z zerowymi współczynnikami.
a1 v1 + a2 v2 + · · · + an vn = 0
⇒
a1 = a2 = · · · = an = 0.
Zbiór wektorów jest liniowo niezależny, jeśli dowolny skończony podzbiór jest
liniowo niezależny.
Wektory, które nie są liniowo niezależne nazywamy wektorami liniowo zależnymi.
Uwagi. Zbiór wektorów zawierający wektor zerowy jest liniowo zależny. Zbiór
wektorów jest liniowo zależny ⇔ jakiś wektor ze zbioru można wyrazić jako kombinację liniową pozostałych wektorów.
Definicja. Mówimy, że zbiór wektorów B rozpina przestrzeń V , jeśli dowolny
wektor z przestrzeni V jest kombinacją liniową wektorów ze zbioru B.
Definicja. Liniowo niezależny zbiór wektorów rozpinających przestrzeń V nazywamy bazą przestrzeni V .
Przykład. Rozpatrujemy R3 . Wektory
 
1
 
e1 =  0  ,
0
 
 
0
 
e2 =  1  ,
0
0
e3 =
 
0
1
tworzą bazę zwaną bazą standardową.
Inny przykład bazy
 
1
 
f1 =  0  ,
0
 
1
 
f2 =  1  ,
0
 
1
f3 =
1
Wektory
       
1
1
0
1
       
1,0,1,1
0
1
1
rozpinają przestrzeń, ale są liniowo zależne.
44
 
1
1
Lemat. Jeśli k > n, to układ równań
+ a12 x2 + · · · + a1k xk = 0
a21 x1 + a22 x2 + · · · + a2k xk = 0


······
an1 x1 + an2 x2 + · · · + ank xk = 0

a11 x1



ma niezerowe rozwiązanie.
Dowód indukcyjny. Jeśli n = 1, to twierdzenie jest oczywiste.
Załóżmy, że twierdzenie jest prawdziwe dla n − 1. Rozpatrujemy układ n równań
z k niewiadomymi. Jeśli a1k = a2k = · · · = ank = 0, to możemy wybrać rozwiązanie
x1 = x2 = · · · = xk−1 = 0 i xk = 1.
Załóżmy teraz, że dla pewnego i aik 6= 0. Wtedy
xi = −
1
(ai1 x1 + ai2 x2 + · · · + ai,k−1 ).
aik
Podstawiając xi do pozostałych równań otrzymujemy układ n − 1 równań z k − 1
niewiadomymi, który z założenia indukcyjnego ma niezerowe rozwiązanie.
Twierdzenie. Jeśli wektory u1 , u2 , . . . , uk są kombinacjami liniowymi
wektorów v1 , v2 , . . . , vn i k > n, to są liniowo zależne.
Dowód. Z założenia
= a11 v1 + a21 v2 + · · · + an1 vn
u2 = a12 v1 + a22 v2 + · · · + an2 vn

······


u1 = a1k v1 + a2k v2 + · · · + ank vn
u
1



Stąd
x1 u1 + x2 u2 + · · · + xk uk =
= (a11 x1 + a12 x2 + · · · + a1k xk )v1 +
+(a21 x1 + a22 x2 + · · · + a2k xk )v2 +
·········
+(an1 x1 + an2 x2 + · · · + ank xk )vn
Z lematu wynika, że dla pewnych x1 , x2 , . . . , xk (nie wszystkich równych 0) prawa
strona powyższego równania jest równa 0. Dlatego wektory u1 , u2 , ...uk są liniowo
zależne.
Wynika stąd ważne twierdzenie.
Twierdzenie. Jeśli pewna baza przestrzeni V ma n elementów, to każda inna
baza przestrzeni V ma n elementów.
Liczbę n nazywamy wymiarem przestrzeni V i piszemy n = dim V .
Dowód. Niech v1 , v2 , ..., vn i u1 , u2 , ..., uk będą dwiema bazami przestrzeni V . Ponieważ wektory u1 , u2 , ..., uk są liniowo niezależne i dają się wyrazić jako kombinacje
45
liniowe wektorów v1 , v2 , ..., vn , więc k ¬ n. Zamieniając rolami rozpatrywane zbiory
wektorów otrzymujemy drugą nierówność: n ¬ k. Stąd k = n.
Twierdzenie. Niech dim V = n i k ¬ n. Liniowo niezależny zbiór wektorów
v1 , v1 , ..., vk można rozszerzyć do bazy V .
Dowód. Jeśli k = n, to wektory v1 , v1 , ..., vk tworzą bazę V . Jeśli k < n, to
istnieje wektor vk+1 ∈ V , który nie jest kombinacją liniową wektorów v1 , v1 , ..., vk .
Rozpatrujemy teraz liniowo niezależny zbiór wektorów v1 , v1 , ..., vk , vk+1 . Powtarzając rozumowanie n − k razy otrzymamy bazę V .
Uwaga. Niech v1 , v2 , . . . , vn będzie bazą przestrzeni liniowej V . Przedstawienie
wektora w postaci kombinacji liniowej elementów bazowych jest jedyne. Załóżmy, że
mamy dwa przedstawienia
v = a1 v1 + a2 v2 + · · · + an vn = b1 v1 + b2 v2 + · · · + bn vn .
Wtedy
(a1 − b1 )v1 + (a2 − b2 )v2 + · · · + (an − bn )vn = 0.
Z liniowej niezależności wektorów bazowych wynika, że
b 1 = a1 ,
b2 = a2 , . . .
, b n = an .
Liczby a1 , a2 , . . . , an nazywamy współrzędnymi wektora v w bazie v1 , v2 , . . . , vn .
Jeszcze jeden przykład przestrzeni liniowej: zbiór funkcji f : X → K. Działania:
(f + g)(x) = f (x) + g(x),
(αf )(x) = αf (x).
Jeśli X = {1, 2, 3, . . . , n}, to mamy K n .
W zbiorze funkcji możemy określić mnożenie:
(f g)(x) = f (x)g(x).
Funkcje z dodawaniem, mnożeniem przez skalar i zdefiniowanym powyżej mnożeniem tworzą algebrę funkcji.
Definicja. Algebrą nazywamy przestrzeń liniową z dodatkowym
działaniem (mnożeniem wektorów), które parze wektorów przypisuje wektor i ma
następujące własności
• u(vw) = (uv)w.
• u(v + w) = uv + uw,
(v + w)u = vu + wu.
• (αv)w = α(vw) = v(αw).
Kolejny przykład przestrzeni liniowej. Jeśli ciało L jest rozszerzeniem ciała K,
to L można traktować jako przestrzeń liniową nad K (a nawet jako algebrę).
Ciało C jest 2-wymiarową przestrzenią liniową nad R.
Ciało R jest nieskończenie wymiarową przestrzenią liniową nad Q.
46
Przekształcenia liniowe
Definicja. Niech V i W będą przestrzeniami liniowymi nad ciałem K. Przekształcenie f : V → W nazywamy przekształceniem liniowym, jeśli
f (v + u) = f (v) + f (u); f (αv) = αf (v),
v, w ∈ V, α ∈ K.
1. Jeśli f jest przekształceniem liniowym, to nawiasy na ogół pomijamy i piszemy
f v zamiast f (v).
2. Przekształcenie liniowe nazywamy też homomorfizmem przestrzeni
liniowych.
Odwracalne przekształcenie liniowe nazywamy izomorfizmem,
a o przestrzeniach V, W mówimy, że są izomorficzne.
Jeśli W = V , to homomorfizm nazywamy endomorfizmem, a izomorfizm
automorfizmem.
3. Przekształcenia liniowe f, g : V → W można do siebie dodawać i mnożyć przez
skalary.
(f + g)v = f v + gv,
(αf )v = α(f v),
v ∈ V, α ∈ K.
Suma przekształceń liniowych i przekształcenie liniowe pomnożone przez skalar nadal są przekształceniami liniowymi. Przekształcenia liniowe z tak określonymi działaniami tworzą przestrzeń liniową nad ciałem K.
4. Jeśli W = K, to przekształcenie liniowe nazywamy formą liniową. Przestrzeń
form liniowych określonych na V nazywamy przestrzenią dualną i oznaczamy
symbolem V ∗ .
5. Jeśli f : U → W i g : V → U są przekształceniami liniowymi, to złożenie
f g : V → W też jest przekształceniem liniowym.
6. Przekształcenia liniowe V → V można dowolnie składać. Przestrzeń takich
przekształceń wraz ze składaniem tworzy algebrę.
7. Jeśli f jest izomorfizmem przestrzeni liniowych, to przekształcenie odwrotne
jest też jest izomorfizmem przestrzeni liniowych. Identyczność jest przekształceniem liniowym. Zbiór wszystkich odwracalnych przekształceń liniowych V
na V tworzy grupę oznaczaną symbolem GL(V ).
8. Jeśli v1 , v2 , . . . , vn jest bazą przestrzeni liniowej V , to przekształcenie
a1
a 
 2


v = a1 v1 + a2 v2 + · · · + an vn →  . 


 . 
an

jest izomorfizmem przestrzeni V na przestrzeń K n .
47

9. Definicja. Niech f będzie przekształceniem liniowym przestrzeni liniowej V
w przestrzeń liniową W . Jądrem homomorfizmu f nazywamy zbiór wektorów
z przestrzeni V , których obraz równy jest zero. Jądro oznaczmy symbolem
ker f .
10. Jądro homomorfizmu jest podprzestrzenią.
Obraz homomorfizmu jest podprzestrzenią.
Twierdzenie. Jeśli f jest przekształceniem liniowym n-wymiarowej przestrzeni
liniowej V w przestrzeń liniową W , to
dim V = dim ker f + dim f (V ).
Dowód. Niech v1 , v2 , . . . , vk będzie bazę ker f . Zbiór v1 , v2 , . . . , vk rozszerzamy do
bazy V dodając wektory w1 , w2 , . . . , wl , k +l = n. Wektory f w1 , f w2 , . . . , f wl tworzą
bazę obrazu. Weźmy dowolny v ∈ V .
v = a1 v1 + a2 v2 · · · + ak vk + b1 w1 + b2 w2 + · · · + bl wl ,
f v = b1 f w1 + b2 f w2 + · · · + bl f wl .
Widzimy, że wektory f w1 , f w2 , . . . , f wl rozpinają obraz. Jeśli
b1 f w1 + b2 f w2 + · · · + bl f wl = 0,
to
f (b1 w1 + b2 w2 + · · · + bl wl ) = 0.
Stąd
b1 w1 + b2 w2 + · · · + bl wl ∈ ker f,
b1 w1 + b2 w2 + · · · + bl wl = a1 v1 + a2 v2 · · · + ak vk
Ale wtedy a1 = a2 = · · · = ak = b1 = b2 = · · · = bl = 0, co oznacza, że wektory
f w1 , f w2 , . . . , f wl są liniowo niezależne.
Wniosek. dim f (V ) ¬ dim V .
Twierdzenie. Przestrzenie liniowe V i W są izomorficzne wtedy i tylko wtedy,
gdy
dim V = dim W.
Dowód. Jeśli f : V → W jest izomorfizmem, to W = f (V ) i dim W ¬ dim V .
Ponieważ f −1 też jest izomorfizmem, więc dim V ¬ dim W . Stąd dim V = dim W .
Odwrotnie. Jeśli v1 , v2 , . . . , vn jest bazą V , a w1 , w2 , . . . , wn bazą W , to f zdefiniowane wzorami
f v1 = w1 , f v2 = w2 , . . . , f vn = wn
jest izomorfizmem przestrzeni V na przestrzeń W .
48
Macierz przekształcenia liniowego
Rozważamy skończenie wymiarowe przestrzenie liniowe V, W . Niech v1 , v2 , . . . , vn
będzie bazą V , a w1 , w2 , . . . , wm bazą W .
Jeśli f : V → W jest przekształceniem liniowym, to
f (a1 v1 + a2 v2 + . . . + an vn ) = a1 f v1 + a2 f v2 + . . . + an f vn .
Aby znaleźć f v wystarczy znać wartości f v1 , f v2 , . . . , f vn .
Mamy
f v1 = F11 w1 + F21 w2 + · · · + Fm1 wm ,
f v2 = F12 w1 + F22 w2 + · · · + Fm2 wm ,
·········
f vn = F1n w1 + F2n w2 + · · · + Fmn wm .
Zatem, aby określić przekształcenie liniowe, wystarczy podać n × m elementów
ciała K.


F11 F12 · F1n
F
F22 · F2n 
 21



 .
.
.
. 
Fm1 Fm2 . Fmn
Tak zapisany zbiór nazywamy macierzą przekształcenia f . Macierz przekształcenia
liniowego zależy od wyboru baz.
Ostatecznie
f (a1 v1 + a2 v2 + · · · + an vn ) =
= (F11 a1 + F12 a2 + . . . + F1n an )w1 +
+(F21 a1 + F22 a2 + . . . + F2n an )w2 +
+······+
+(Fm1 a1 + Fm2 a2 + . . . + Fmn an )wm .
Definicja. Mnożenie macierzy przez wektor z K n definiujemy wzorem
F11
F
 21

 .
Fm1

F12
F22
.
Fm2
· F1n
a1
b1




· F2n   a2   b2 


=

.
.  .   . 
. Fmn
an
bm




gdzie
bi = Fi1 a1 + Fi2 a2 + · · · + Fin an ,
i = 1, 2, 3, . . . m.
Zamiast rozważać przekształcenie f : V → W możemy rozważać przekształcenie
F : K n → K m , gdzie F jest macierzą przekształcenia f .
Przykład
A B
x
Ax + By
=
C D
y
Cx + Dy
49
Dodawanie macierzy i mnożenie macierzy przez skalar
Przekształcenia liniowe f, g : V → W można dodawać do siebie i mnożyć przez
skalary. Działania na macierzach definiujemy tak, aby sumie przekształceń odpowiadała suma macierzy, a iloczynowi przekształcenia przez skalar, iloczyn macierzy
przez skalar.
Definicje.
F11
F
 21

 .
Fm1
F12
F22
.
Fm2

G11
· F1n


· F2n   G21
+
.
.   .
Gm1
. Fmn
F11 + G11
 F +G

21
=  21

.
Fm1 + Gm1

F11
F
 21
α
 .
Fm1
F12
F22
.
Fm2

G12
G22
.
Gm2


F12 + G12
F22 + G22
.
Fm2 + Gm2


· F1n + G1n
· F2n + G2n 



.
.
. Fmn + Gmn

· F1n
αF11
 αF
· F2n 


21
=
.
.   .
. Fmn
αFm1

· G1n
· G2n 

=
.
. 
. Gmn
αF12
αF22
.
αFm2
· αF1n
· αF2n 


.
. 
. αFmn

Uwaga. Macierze ustalonego rozmiaru tworzą przestrzeń liniową nad ciałem K.
Wymiar tej przestrzeni równy jest nm. Prawdziwe są wzory
(F + G)v = F v + Gv,
(αF )v = α(F v),
gdzie F, G oznaczają macierze m × n, a v jest wektorem z K n
Przykład.






1 3
2 4
3 7

 



+
6
8
=
11
15  ,
5
7

 


9 11
10 12
19 23




1 3
3 9




3  5 7  =  15 21  .
9 11
27 33
Mnożenie macierzy
Niech v1 , v2 , . . . , vn będzie bazą V , w1 , w2 , . . . , wm bazą W , a u1 , u2 , . . . , ul bazą U .
Jeśli G, F są macierzami przekształceń liniowych
g : V → W, f : W → U , to
f gvk = f
m
X
j=1
Gjk wj =
m
X
j=1
Gjk f wj =
m
X
j=1
Gjk
l
X
Fij ui =
i=1
l X
m
X
(
i=1 j=1
Widzimy, że macierzą złożenia jest macierz H o wyrazach
Hik = Fi1 G1k + Fi2 G2k + · · · + Fim Gmk .
50
Fij Gjk )ui .
Wynik podpowiada jak zdefiniować iloczyn macierzy, aby złożeniu przekształceń
odpowiadał iloczyn macierzy.
Definicja. Iloczynem macierzy F i G jest macierz H o wyrazach
Hik = Fi1 G1k + Fi2 G2k + · · · + Fim Gmk .
Ważne jest aby liczba kolumn macierzy F była równa liczbie wierszy
macierzy G.
1. Mnożenie macierzy przez wektor może być traktowane jako mnożenie macierzy
przez macierz złożoną z jednej kolumny.
2. Zachodzi równość F (Gv) = (F G)v, gdzie v ∈ K n .
3. Mnożenie macierzy jest łączne: F (GH) = F (GH).
4. Zbiór wszystkich macierzy kwadratowych rozmiaru n×n tworzy algebrę zwaną
algebrą macierzy.
5. Definicja. Macierz kwadratową
1
0


I=
0

·
0

0
1
0
·
0
0
0
1
·
0
···
···
···
···
···
0
0


0

·
1

nazywamy macierzą jednostkową. Macierz jednostkowa jest elementem neutralnym ze względu na mnożenie macierzy.
6. Definicja. Niech A będzie macierzą kwadratową n × n. Macierz kwadratową
B n × n taką, że AB = I nazywamy macierzą odwrotną do macierzy A.
7. Macierz odwrotna może nie istnieć. Jeśli jednak istnieje, to jest jedyna. Poza
tym mamy wtedy BA = I. Wystarczy popatrzyć na macierz jak na przekształcenie liniowe K n w K n . Złożenie AB jest identycznością. Wymiar obrazu wynosi n. Zatem wymiary AK n i BK n też wynoszą n i B jest przekształceniem
odwracalnym. Istnieje macierz C rozmiaru n × n taka że BC = I. Mamy
BA = (BA)I = (BA)(BC) = B(AB)C = BIC = BC = I.
8. Często wygodnie jest używać delty Kroneckera
δji =
1 jeśli j = i
0 jeśli j 6= i
Możemy napisać Iij = δij .
9. Zbiór macierzy odwracalnych z mnożeniem tworzy grupę oznaczaną symbolem
GL(n, K).
10. Przykład.
A B
C D
a b
c d
=
51
Aa + Bc Ab + Bd
.
Ca + Dc Cb + Dd
Zmiana bazy
Załóżmy, że w przestrzeni V wybrano dwie bazy v1 , v2 , . . . , vn oraz v10 , v20 , . . . , vn0 .
Wektory pierwszej bazy można wyrazić jako kombinacje liniowe wektorów drugiej
bazy i odwrotnie.
n
X
vj =
Aij vi0 ,
vj0 =
i=1
n
X
j = 1, 2, . . . , n.
Bij vi ,
i=1
Elementy Aij oraz elementy Bij tworzą dwie macierze kwadratowe. Zachodzą równości
n
n
n
n
n
vk =
X
Ajk vj0 =
j=1
Stąd
X
Ajk (
j=1
n
X
X
Bij vi ) =
i=1
X X
(
Bij Ajk )vi .
i=1 j=1
Bij Ajk = δik ,
tzn. BA = I.
j=1
Podobnie BA = I, czyli B = A−1 .
Macierze A, B nazywamy macierzami zmiany bazy.
Jeśli
n
n
v=
X
x0i vi0 =
v=
X
n
X
xj (
xj vj ,
j=1
i=1
to
X
Aij vi0 ) =
n
n X
X
(
Aij xj )vi0 .
i=1 j=1
i=1
Stąd
x0i =
n
X
Aij xj .
j=1
lub inaczej
 0 
x1
 x0 
 2


 · 
x1
x 


= A 2 .
 · 
x0n
xn
Rozważmy teraz przekształcenie liniowe f : V → W . Niech F będzie macierzą
przekształcenia f w bazach v1 , v2 , . . . , vn , w1 , w2 , . . . wn , a F 0 macierzą przekształcenia f w bazach v10 , v20 , . . . , vn0 , w10 , w20 , . . . wn ’.
Jeśli
n
m
vj =
X
Aij vi0 ,


wj =
X
i=1
to
f vk =
m
X
Fjk wj =
j=1
f vk = f
n
X
j=1
Ajk vj0
m
X
i=1
m
X
Fjk (
j=1
=
n
X
Cij wi0 ,
Cij wi0 ) =
i=1
Ajk f vj0
j=1
=
n
X
j=1
0
m X
m
X
Cij Fjk )wi0 ,
(
i=1 j=1
m
X
Ajk (
Fij0 wi0 )
=
i=1
n X
m
X
(
Fij0 Ajk )vj0 .
i=1 j=1
0
Porównanie prowadzi do równości F A = CF lub inaczej F = CF A−1 . W szczególności, jeśli W = V i wi = vi dla i = 1, 2, . . . , n, to C = A oraz F 0 = AF A−1 .
52
Równania liniowe
Definicja. Jednorodnym układem równań liniowych nazywamy układ równań
+ a12 x2 + · · · + a1n xn = 0
a21 x1 + a22 x2 + · · · + a2n xn = 0


·········
am1 x1 + am2 x2 + · · · + amn xn = 0

a11 x1



Natomiast niejednorodnym układem równań liniowych nazywamy układ równań postaci

a11 x1 + a12 x2 + · · · + a1n xn = b1




a21 x1 + a22 x2 + · · · + a2n xn = b2

·········



am1 x1 + am2 x2 + · · · + amn xn = bm
Na układ równań liniowych możemy patrzeć jak jedno równanie
a11
a
 21

 ·
am1

a12
a22
·
am2
x1
b1
· a1n




· a2n   x2   b2 

=
,

·
·  ·   · 
xn
bm
· amn




lub jeszcze krócej Ax = b. Rozwiązania równania Ax = 0, tworzą podprzestrzeń
(jądro homomorfizmu x → Ax). Bazę tej podprzestrzeni nazywamy fundamentalnym
układem rozwiązań.
Jeśli mamy jakieś rozwiązanie x0 równania Ax = b, to każde inne rozwiązanie
możemy uzyskać dodając do x0 dowolne rozwiązanie równania Ax = 0.
Układ równań liniowych możemy zapisać jeszcze inaczej
x1 A1 + x2 A2 + ... + xn An = b,
gdzie
a1i
a 


Ai =  2i  , i = 1, 2, 3, . . . , n.
 · 
ami
Widzimy, że układ równań ma rozwiązanie, jeśli wektor b należy do przestrzeni rozpiętej przez wektory A1 , A2 , . . . An . Jeśli dodatkowo wektory A1 , A2 , . . . An są liniowo
niezależne, to rozwiązanie jest jedyne.
Definicja. Macierzą układu równań nazywamy macierz


a11
a
 21

 ·
am1

a12
a22
·
am2
· a1n
· a2n 


·
· 
· amn

Rozszerzoną macierzą układu równań nazywamy macierz
a11
a
 21

 ·
am1

a12
a22
·
am2
· a1n
· a2n
·
·
· amn
53
b1
b2 


· 
bm

Definicja. Rzędem kolumnowym (wierszowym) macierzy nazywamy wymiar
przestrzeni rozpiętej przez kolumny (wiersze) macierzy.
Pokażemy później, że rząd kolumnowy równy jest rzędowi wierszowemu.
Możemy nasze obserwacje sformułować w postaci twierdzenia.
Twierdzenie. (Kronecker-Capelli) Układ równań liniowych ma rozwiązanie
wtedy i tylko wtedy, gdy rząd macierzy układu równań równy jest rzędowi macierzy
rozszerzonej.
Twierdzenie. Rząd kolumnowy równy jest rzędowi wierszowemu.
Dowód. Rozważamy macierz
a11
a
 21

 ·
am1

a12
a22
·
am2
· a1n
· a2n 


·
· 
· amn

Załóżmy, że pierwszych w wierszy tworzy bazę przestrzeni rozpiętej przez wiersze
macierzy (być może po przenumerowaniu wierszy). Rozpatrujemy zmniejszoną macierz


a11 a12 · a1n
a

 21 a22 · a2n 


 ·
·
·
· 
aw1 aw2 · awn
Załóżmy, że pierwszych k kolumn zmniejszonej macierzy tworzy bazę przestrzeni
rozpiętej przez kolumny zmniejszonej macierzy (być może po przenumerowaniu kolumn). Oczywiście k ¬ w.
Pokażemy, że pierwszych k kolumn dużej macierzy tworzy bazę przestrzeni rozpiętej przez kolumny dużej macierzy. Liniowo niezależne kolumny po przedłużeniu
nadal są liniowo niezależne. Pozostaje pokazać, że rozpinają przestrzeń.
j-tą kolumnę zmniejszonej macierzy można zapisać w postaci








a1j
a11
a12
a1k








.
.
.
=
µ
+
µ
+
·
·
·
+
µ




1
2
k  . .
awj
aw1
aw2
awk
Jawnie
alj = µ1 al1 + µ2 al2 + · · · + µk alk ,
l = 1, 2, . . . w.
r-ty wiersz jest kombinacją liniową pierwszych w wierszy o współczynnikach
β1 , β2 , . . . , βw . Mnożąc powyższe równości przez β1 , β2 , . . . , βw i dodając do siebie
otrzymujemy równość
arj = µ1 ar1 + µ2 ar2 + · · · + µk ark .
Dlatego








a1j
a11
a12
a1k








 .  = µ1  .  + µ2  .  + · · · + µk  .  .
amj
am1
am2
amk
54
Zamieniając rolami rzędy i kolumny otrzymujemy nierówność w ¬ k. Stąd w = k.
Uwaga. Rząd macierzy jest wymiarem AK n (wymiarem obrazu). Wymiar przestrzeni rozwiązań układu jednorodnego (wymiar jądra) wynosi więc n minus rząd
macierzy A.
Uwaga. Jeśli do wybranego równania dodamy inne równanie pomnożone przez
dowolną liczbę, otrzymamy nowy układ równań. Nowy układ równań będzie miał
ten sam zbiór rozwiązań co wyjściowy układ równań (operacja jest odwracalna).
Zobaczymy na przykładzie, jak wielokrotne wykonywanie opisanej operacji (operacji elementarnej) pozwala znaleźć rozwiązanie układu równań.
Przykład.


 x + 5y + 7z − 3t = 9
x + 6y + 12z − 4t = 13


2x + 6y − 5z + 2t = 11
Od drugiego równania odejmujemy pierwsze równanie.



+ 5y + 7z − 3t = 9
y + 5z − t = 4


2x + 6y − 5z + 2t = 11
x
Od trzeciego równania odejmujemy pierwsze równanie pomnożone przez 2.



x + 5y + 7z − 3t = 9
y + 5z − t = 4


− 4y − 19z + 8t = −7
Do czwartego równania dodajemy równanie drugie pomnożone przez 4.



x + 5y + 7z − 3t = 9
y + 5z − t = 4


z + 4t = 9
Teraz jest już prosto. t może być dowolne. Kolejno znajdujemy z, y, x.

t dowolne



 z = 9 − 4t
= 4 + t − 5z = −41 + 21t
x = 9 + 3t − 7z − 5y = 151 − 74t

y



W szczególności dla t = 2 otrzymujemy z = 1, y = 1, x = 3.
Rozwiązanie możemy zapisać w postaci
x
151
−74
y
 −41 
 21 
 




 =
 + t

z
 9 
 −4 
t
0
1






Twierdzenie. Stosując operacje elementarne układ równań liniowych można
sprowadzić do takiej postaci, że w i-tym równaniu (i > 1) nie występują zmienne
x1 , x2 , . . . xi−1 (być może po przenumerowaniu zmiennych).
Dowód indukcyjny.
55
Jak znaleźć rząd macierzy?
Uwaga.
• Jeśli do wybranej kolumny (wiersza) dodamy inną kolumnę (wiersz)
pomnożoną przez dowolny skalar, to rząd macierzy nie ulegnie zmianie.
Wystarczy spojrzeć na równość (v1 , · · · , vn ∈ V, α1 , · · · , αn , β ∈ K)
α1 v1 + α2 v2 + · · · + αn vn = α1 (v1 + βv2 ) + (α2 − βα1 )v2 + · · · + αn vn .
• Zmieniając kolejność wierszy i kolumn, nie zmieniamy rzędu macierzy.
• Możemy też mnożyć wiersze i kolumny przez niezerowe skalary.
Przykład (macierz układu równań z przykładu). Odejmujemy wiersze.




1 5 7 −3
1 5 7 −3




rząd  1 6 12 −4  = rząd  0 1 5 −1  =
2 6 −5 2
2 6 −5 2




1 5 7 −3
1 5
7
−3




rząd  0 1
5
−1  = rząd  0 1 5 −1  =
0 0 1 4
0 −4 −19 8


1 0 0 0

= rząd  0 1 0 0 

0 0 1 0
W ostatnim kroku odejmujemy kolumny. Rząd macierzy równy jest 3.
Spostrzeżenie. Wykonując opisane wyżej operacje, można dowolną macierz
sprowadzić do takiej postaci, że w miejscach 11, 22,..., rr stoją jedynki, a w pozostałych miejscach stoją zera (r jest rzędem macierzy).
Równania i wyznaczniki
Rozwiążemy układ równań
a11 x1 + a12 x2 = b1
a21 x1 + a22 x2 = b2
Mnożymy pierwsze równanie przez a22 , a drugie przez a12 i odejmujemy od siebie
(a11 a22 − a21 a12 )x1 = b1 a22 − b2 a12 .
Teraz mnożymy pierwsze równanie przez a21 a drugie przez a11 i odejmujemy od
siebie
(a11 a22 − a21 a12 )x2 = b2 a11 − b1 a21
Jeśli a11 a22 − a21 a12 6= 0, to rozwiązania wyrażają się wzorami (zwanymi wzorami
Cramera)
x1 = (b1 a22 − b2 a12 )/(a11 a22 − a21 a12 ),
56
x2 = (b2 a11 − b1 a21 )/(a11 a22 − a21 a12 ).
Wyrażenie a11 a22 − a21 a12 nazywamy wyznacznikiem macierzy. Piszemy
det
a11
a21
a12
a22
= a11 a22 − a21 a12 .
Rozpatrzmy układ równań 2 × 3
a11 x1 + a12 x2 + a13 x3 = 0
a21 x1 + a22 x2 + a23 x3 = 0
Postępując podobnie jak w przypadku układu 2 × 2 uzyskujemy jedno z rozwiązań
a
x1 = det 12
a22
a13
,
a23
a
x2 = − det 11
a12
a13
,
a23
a
x3 = det 11
a21
a12
.
a22
Zajmiemy się obecnie układem 3 równań z 3 niewiadomymi.
+ a12 x2 + a13 x3 = b1
a x + a22 x2 + a23 x3 = b2
 21 1
a31 x1 + a32 x2 + a33 x3 = b3

 a11 x1
Spróbujmy wyeliminować x2 i x3 . W tym celu znajdziemy czynniki y1 , y2 takie, że
a12 y1 + a22 y2 + a32 y3 = 0
a13 y1 + a23 y2 + a33 y3 = 0
Wiemy już jak y1 , y2 , y3 wyrazić przez wyznaczniki
a
y1 = det 22
a23
a32
,
a33
a
y2 = − det 12
a13
a32
,
a33
a
y3 = det 12
a13
a22
.
a23
Mnożąc pierwsze równanie przez y1 , drugie przez y2 , a trzecie przez y3 i dodając
stronami otrzymujemy
(a11 y1 + a21 y2 + a31 y3 )x1 = b1 y1 + b2 y2 + b3 y3 .
Stąd wynika wzór na x1 . Podobnie znajdujemy x2 i x3 .
Wyrażenie przed x1 nazywamy wyznacznikiem z macierzy 3 × 3

a11

det  a21
a31
a12
a22
a32

a13

a23  =
a33
a22 a32
a
a32
a
a22
− a21 det 12
+ a31 det 12
=
a23 a33
a13 a33
a13 a23
= a11 a22 a33 − a11 a23 a32 − a21 a12 a33 + a21 a13 a32 + a31 a12 a23 − a31 a13 a22 .
= a11 det
Takie przedstawienie wyznacznika nazywa się rozwinięciem Laplace’a.
Podstawowe własności wyznacznika.
βa11
det
βa21
a12
a22
a
= β det 11
a21
57
a12
,
a22
a + b11
det 11
a21 + b21
a12
a22
a
= det 11
a21
a12
a22
b
+ det 11
b21
a12
,
a22
a
a11
1 0
det 11
= 0, det
= 1.
a21 a21
0 1
Można powiedzieć krótko: wyznacznik jest antysymetryczną wieloliniową funkcją
kolumn.
Uwagi o symetrii. Niech A, B oznaczają kolumny. Mamy
0 = det(A + B, A + B) = det(A, A + B) + det(B, A + B) =
= det(A, A) + det(A, B) + det(B, A) + det(B, B) = det(A, B) + det(B, A).
Stąd
det(B, A) = − det(A, B).
Odwrotnie, jeśli dla dowolnych A, B det(B, A) = − det(A, B), to podstawiając
B = A, otrzymujemy 2 det(A, A) = 0. Jeśli charakterystyka ciała nie jest równa 2,
to możemy podzielić przez 2.
Uwaga. Podstawowe własności wyznacznika w pełni określają wyznacznik
a b
det
c d
a+0 b
= det
0+c d
a 0
+ det
0 d
1 0
+ ad det
0 1
a b
= det
0 0
1 1
= ab det
0 0
a b
= det
0 d
0 b
+ det
c 0
0 0
+ det
c d
0 1
+ bc det
1 0
1 0
= (ad − bc) det
0 1
a
det 11
a21
0 b
+ det
c d
=
=
0 0
+ cd det
1 1
= ad − bc.
Dodatkowa własność
a12
a22
a
= det 11
a12
a21
.
a22
Definicja i własności wyznacznika
Definicja. Wyznacznik macierzy n × n określony jest wzorem
a11
a
21
det 

 ·
an1

a12
a22
·
an2
· a1n
X
· a2n 

=
znak(σ)aσ1 1 aσ2 2 · · · aσn n .
·
·  σ∈Sn
· ann

Przykład.

a11

det  a21
a31
a12
a22
a32
58

a13
a23 
=
a33
=
= a11 a22 a33 + a21 a32 a13 + a31 a12 a23 − a11 a32 a23 − a31 a22 a13 − a21 a12 a33 .
Definicja. Macierz
a11
a
12

B=
 ·
a1n

a21
a22
·
a2n
· am1
· am2 


·
· 
· amn

nazywamy macierzą transponowaną do macierzy
a11
a

A =  21
 ·
am1

a12
a22
·
am2
· a1n
· a2n 

.
·
· 
· amn

Piszemy B = At .
Twierdzenie. det(At ) = det(A).
Dowód. Jeśli µ jest permutacją odwrotną do permutacji σ,
to znak(µ) = znak(σ) oraz aσ1 1 aσ2 2 · · · aσn n = a1µ1 a2µ2 · · · anµn .
Dlatego
X
znak(σ)aσ1 1 aσ2 2 · · · aσn n =
det(A) =
σ∈Sn
=
znak(µ)a1µ1 a2µ2 · · · anµn = det(At ).
X
µ∈Sn
Twierdzenie. Niech A1 , A2 , . . . , An będą kolumnami macierzy A. Zachodzą
relacje
1. det(A1 , . . . , Aj +Bj , . . . , An ) = det(A1 , . . . , Aj , . . . , An )+det(A1 , . . . , Bj , . . . , An ).
2. det(A1 , . . . , βAj , . . . , An ) = β det(A1 , . . . , Aj , . . . , An ),
β ∈ K.
3. Jeśli Ai = Aj dla pewnych dwóch różnych indeksów i, j, to det(A) = 0.
4. det(I) = 1.
Krótko: Wyznacznik jest wieloliniową antysymetryczną funkcją kolumn.
Dowód.
1.
X
znak(σ)aσ1 1 · · · (aσj j + bσj j ) · · · aσn n =
σ∈Sn
X
=
znak(σ)aσ1 1 · · · aσj j · · · aσn n +
σ∈Sn
+
X
znak(σ)aσ1 1 · · · bσj j · · · aσn n .
σ∈Sn
59
2.
X
znak(σ)aσ1 1 · · · βaσj j · · · aσn n =
σ∈Sn
X
=β
znak(σ)aσ1 1 · · · aσj j · · · aσn n .
σ∈Sn
S
3. Składniki dzielimy na dwa rozłączne zbiory Sn = An An (i, j) (An oznacza
zbiór permutacji parzystych). Ponieważ aσi i = aσi j i aσj j = aσj i , więc składnik odpowiadający permutacji σ redukuje się ze składnikiem odpowiadającym
σ(i, j). W ten sposób wszystkie składniki znoszą się.
4. Mamy tylko jeden niezerowy składnik odpowiadający permutacji tożsamościowej.
Twierdzenie. Jeśli funkcja f : A → f (A) spełnia własności (1-3),
to f (A) = det(A)f (I).
Jeśli dodatkowo funkcja f spełnia warunek (4), to f (A) = det(A).
Dowód. Załóżmy, że funkcja A → f (A) posiada własności (1-3). Niech e1 , e2 , . . . , en
będą wektorami bazy standardowej.
X
f (A) = f (
ai 1 1 e i 1 ,
i1
XX
i1
···
X
i2
X
ai2 2 ei2 , . . .
i2
X
ai n n e i n ) =
in
ai1 1 ai2 2 · · · ain n f (ei1 , ei2 , . . . , ein )
in
Jeśli ij = ik dla pewnych j, k, to f (ei1 , ei2 , . . . , ein ) = 0. W sumie pozostaną tylko
składniki dla których i1 , i2 , . . . , in jest pewną permutacją liczb 1, 2, . . . , n. Oznaczmy
tą permutację literą σ. Wtedy
f (eσ1 , eσ1 , . . . , eσ1 ) = znak(σ)f (e1 , e2 , . . . , en ),
Mamy zatem
f (A) =
X
aσ1 1 aσ2 2 · · · aσn n f (eσ1 , eσ1 , . . . , eσ1 ) =
σ∈Sn
= f (I)
X
aσ1 1 aσ2 2 · · · aσn n znak(σ) = f (I) det(A).
σ∈Sn
Uwaga.
• Jeśli zamienimy miejscami dwie kolumny (wiersze), to wyznacznik zmieni znak
na przeciwny.
• Jeśli do pewnej kolumny (wiersza) dodamy inną kolumnę (wiersz) pomnożony
przez dowolny skalar, to wyznacznik nie zmieni się.
• Jeśli w macierzy poniżej przekątnej mamy same zera, to wyznacznik jest iloczynem wyrazów leżących na przekątnej.
60
Dowód punktu drugiego.
det(A1 + βA2 , A2 , A3 . . .) = det(A1 , A2 , A3 , . . .) + β det(A2 , A2 , A3 , . . .).
Drugi składnik po prawej stronie równy jest 0.
Przykład.






1 3 5
1 3 2
1 3 0





det  2 4 7  = det  2 4 3  = det  2 4 −1 
=
3 2 8
3 2 6
3 2 0






1 3 0
1 3
0
1 0
0






= det  0 0 −1  = det  0 0 −1  = det  0 0 −1  =
3 2 0
0 −7 0
0 −7 0
= −1(−7)(−1) = −7
Twierdzenie. det(AB) = det(A) det(B).
Dowód. Funkcja f określona wzorem
f (A1 , A2 , . . . , An ) = f (A) = det(BA) = det(BA1 , BA2 , . . . , BAn )
posiada własności (1-3) i dlatego
f (A) = f (I) det(A) = det(BI) det(A) = det(B) det(A).
Twierdzenie. Kolumny macierzy A są liniowo niezależne ⇔ det(A) 6= 0.
Dowód. Jeśli kolumny macierzy A są liniowo niezależne, to pewna kolumna jest
kombinacją liniową pozostałych kolumn. Wyznacznik nie zmieni się, jeśli od tej kolumny odejmiemy dowolną kombinację liniową pozostałych kolumn. W szczególności
możemy tak odjąć, aby otrzymać zero. Wyznacznik takiej macierzy wynosi zero.
Odwrotnie. Jeśli kolumny macierzy A o rozmiarach n × n są liniowo niezależne,
to rozpinają przestrzeń K n . Dlatego istnieje macierz B taka, że
ek =
n
X
bik Ai
i=1
czyli AB = I. Ale wtedy det(A) det(B) = det(AB) = 1 i det(A) 6= 0.
Przy okazji pokazaliśmy, że A−1 istnieje ⇔ det(A) 6= 0.
Niezmienniki
Niech G będzie macierzą odwracalną n × n, a A dowolną macierzą n × n. Zachodzą
równości
det GAG−1 = det A, rząd GAG−1 = rząd A.
Inną wielkością posiadającą taką własność jest ślad macierzy.
61
Definicja. Ślad macierzy n × n określony jest wzorem


· a1n
·
· 
 = a11 + a22 + · · · + ann .
· ann
a11
tr 
 ·
an1
Własności śladu.
• tr(A + B) = trA + trB.
• trβA = βtrA,
β ∈ K.
• trAB = trBA.
Dowód ostatniej własności.
trAB =
n X
n
X
n X
n
X
aij bji =
i=1 j=1
bji aij = trBA.
j=1 i=1
Jeśli G jest macierzą odwracalną, to
trGAG−1 = trG−1 GA = trA.
Własności te pozwalają zdefiniować wyznacznik i ślad przekształcenia liniowego
f : V → V . Ustalamy dowolną bazę przestrzeni V i przyjmujemy, że det(f ) = det(F )
oraz trf = trF . gdzie F jest macierzą przekształcenia f . Wynik nie zależy od wyboru
bazy, ponieważ w innej bazie f ma macierz BF B −1 .
Definicja. Wielomianem charakterystycznym macierzy A nazywamy wielomian
f (x) = det(A − xI).
Niech f (x) = f0 + f1 x + · · · + fn−1 xn−1 + (−x)n . Widzimy, że f0 = det(A),
a fn−1 = (−)n−1 trA.
Łatwo sprawdzić, że wielomiany charakterystyczne macierzy A i GAG−1 są równe. Wynika stąd, że współczynniki f0 , f1 , . . . , fn−1 nie zmienią się, jeśli macierz A
zastąpić macierzą GAG−1 .
Rozwinięcie Laplace’a
Definicja. Niech A będzie macierzą n × n. Dopełnieniem algebraicznym elementu
aij nazywamy wyznacznik macierzy powstałej z macierzy A przez wykreślenie i-tego
wiersza i j-tej kolumny pomnożony przez (−1)i+j . Dopełnienie będziemy oznaczać
symbolem Aij .
Twierdzenie.
det(A) =
n
X
j=1
akj Akj =
n
X
aik Aik ,
i=1
62
k = 1, 2, . . . , n.
Dowód. Udowodnimy pierwszą równość dla k = 1. Ogólne twierdzenie wynika z
tego, że wyznacznik jest antysymetryczną funkcją kolumn oraz z tego, że wyznacznik
macierzy transponowanej równy jest wyznacznikowi oryginalnej macierzy.
Niech
n
X
f (A) =
aj1 Ai1 .
i=1
Wystarczy pokazać, że funkcja f posiada podstawowe własności definiujące wyznacznik (1-4).
Jedynym trudniejszym punktem jest pokazanie, że jeśli dwie kolumny są równe,
to wartość funkcji wynosi zero. Załóżmy więc, że Al = Am (l < m). Pozostaną
wtedy dwa składniki al1 Al1 i am1 Am1 , przy czym al1 = am1 . Przed wyznacznikami
określającymi Al1 i Am1 stoją znaki (−1)1+l i (−1)1+m . Macierze określające Al1 , Am1
różnią się położeniem kolumny Al = Am (pozbawionej pierwszego elementu). W
pierwszej macierzy kolumna ta pojawia się na miejscu m − 1,a w drugiej na miejscu
l. Jest więc przesunięta o m−l−1 miejsc w lewo. Wyznaczniki definiujące dopełnienia
różnią się znakiem (−1)m−l−1 . Dopełnienia mają więc różne znaki i redukują się.
Uwaga. Rozwinięcie Laplace’a można przyjąć jako rekurencyjną definicję wyznacznika.
Wniosek. Zachodzą równości
n
X
aik Ajk =
n
X
aki Akj = det(A)δij .
i=1
i=1
Dowód. Jeśli i 6= j, to pierwsza suma jest wyznacznikiem macierzy, której i-ty
wiersz równy jest j-temu, a druga suma wyznacznikiem macierzy której i-ta kolumna
równa jest j-tej. Wyznaczniki takich macierzy równe są zero.
Wniosek. Jeśli det(A) 6= 0, to macierz B o wyrazach bij = Aji /det(A) jest
macierzą odwrotną do macierzy A. (Aij nadal oznacza dopełnienie algebraiczne elementu aij ).
Przykład.
a11
a21
a12
a22
−1
=
1
a11 a22 − a12 a21
a22
−a21
−a12
.
a11
Wzory Cramera. Jeśli det A 6= 0, to rozwiązania układu równań
n
X
aij xj = bi ,
i = 1, 2, . . . , n,
j=1
wyrażają się wzorami
det(A(k) )
xk =
,
det(A)
k = 1, 2, . . . , n,
gdzie A(k) oznacza macierz A z i-tą kolumną zamienioną na kolumnę b.
63
Dowód. Załóżmy, że x1 , x2 , . . . , xn spełniają rozważany układ równań. Wtedy
det(A(k) ) =
n
X
bi Aik =
i=1
n X
n
X
(
aij Aik )xj =
j=1 i=1
n X
n
X
(
aij xj )Aik =
i=1 j=1
n
X
δjk det(A)xj = xk det(A).
j=1
Dwa twierdzenia
Twierdzenie. Niech f będzie funkcją określoną na zbiorze macierzy kwadratowych
n × n o wyrazach z ciała K i wartościach z w ciele K. Jeśli
f (A + B) = f (A) + f (B),
f (βA) = βf (A),
f (AB) = f (BA),
to istnieje c ∈ K takie, że
f (A) = c tr(A).
Dowód. Dwie pierwsze własności f pozwalają napisać
f (A) =
n X
n
X
pji aij = tr(P A).
i=1 j=1
Trzecia własność daje równość
tr(P AB) = tr(P BA).
Stąd
0 = tr(P AB) − tr(P BA) = tr(P AB) − tr(AP B) = tr(P A − AP )B.
Niech E st będą macierzami o wyrazach δis δjt . Niech M będzie dowolną macierzą.
Zachodzi równość
n n
tr(M E st ) =
XX
mji δis δjt = mts .
i=1 j=1
Podstawiając pod B macierze E st otrzymujemy równość
P A = AP.
Podstawiając pod A macierze E st otrzymujemy
pis δjt = δis ptj .
Stąd pij = 0 i pii = pjj dla i 6= j, czyli P = cI dla pewnego c ∈ K. Przy okazji
dowiedzieliśmy się, że macierz, która komutuje z dowolną inną macierzą jest proporcjonalna do macierzy jednostkowej.
64
Niech A będzie macierzą kwadratową n×n. Przestrzeń macierzy n×n ma wymiar
n2 . Dlatego macierze
2
I, A, A2 , . . . , An
są liniowo zależne.
Okazuje się, że I, A, A2 , . . . , An są liniowo zależne.
Twierdzenie. (Hamilton, Cayley) Niech A będzie macierzą kwadratową n × n,
f (x) = det(A − xI) = f0 + f1 x + f2 x2 + · · · + fn xn .
Wtedy
f (A) = f0 I + f1 A + f2 A2 + · · · + fn An = 0.
Przykład.
f (x) =
1 3
4 2
2
1−x
3
4
2−x
−3
1 3
4 2
− 10
= x2 − 3x − 10,
1 0
0 1
=
0 0
.
0 0
Dowód twierdzenia. Niech M D będzie macierzą, której ij-ty element jest dopełnieniem ij-tego elementu macierzy M . Wiemy, że zachodzi równość
M (M D )t = det(M )I.
Niech M = A − xI. Elementy macierzy M D są wielomianami stopnia niewiększego
niż n. Dlatego
(M D )t = B0 + xB1 + x2 B2 + · · · + xn−1 Bn−1 .
Mamy więc równość
(A − xI)(B0 + xB1 + x2 B2 + · · · + xn−1 Bn−1 ) = f (x)I.
Porównując wyrazy przy tych samych potęgach x otrzymujemy równości
AB0 = f0 I, AB1 − B0 = f1 I, AB2 − B1 = f2 I, · · · , −Bn−1 = fn I.
Mnożąc pierwsze równanie przez I, drugie przez A, trzecie przez A2 ,...,
a następnie dodając stronami otrzymujemy z lewej strony 0, a z prawej f (A).
Wektory i wartości własne
Rozpatrujemy przekształcenia liniowe pewnej przestrzeni liniowej w tą samą przestrzeń.
Definicja. Niezerowy wektor v nazywamy wektorem własnym przekształcenia liniowego F , jeśli F v = λv dla pewnego skalara λ.
Przykład:
2 1
2 3
1
2
65
1
.
2
=4
Twierdzenie. Wektory własne należące do różnych wartości własnych są liniowo
niezależne.
Dowód nie wprost. Niech v1 , v2 , . . . , vk będą wektorami własnymi przekształcenia
F należącymi do różnych wartości własnych λ1 , λ2 , . . . , λk .
Załóżmy, że wektory v1 , v2 , . . . , vk są liniowo zależne.
Niech a1 v1 +a2 v2 +· · ·+al vl = 0 będzie najkrótszą kombinacją liniową o niezerowych
współczynnikach równą zero.
Jeśli a1 v1 + a2 v2 + · · · + al vl = 0, to
0 = F (a1 v1 + a2 v2 + · · · + al vl ) = λ1 a1 v1 + λ2 a2 v2 + · · · + λl al vl .
Odejmując od powyższej równości sumę
λ1 (a1 v1 + a2 v2 + · · · + al vl ) = 0
dostajemy
(λ2 − λ1 )a2 v2 + (λ3 − λ1 )a3 v3 + · · · + (λl − λ1 )al vl = 0.
W ten sposób otrzymujemy krótszą kombinację liniową o niezerowych współczynnikach równą zero i mamy sprzeczność.
Uwaga. Przekształcenie liniowe może nie mieć wektorów własnych. Jednak w przestrzeniach skończonego wymiaru nad ciałem algebraicznie domkniętym (np. nad ciałem liczb zespolonych), przekształcenie liniowe zawsze ma co najmniej jeden wektor
własny.
Niech F będzie macierzą n × n. Równanie F v = λv możemy przepisać w postaci
(F − λI)v = 0. Jeśli v 6= 0, to kolumny macierzy F − λI są liniowo zależne, co
oznacza że det(F − λI) = 0. Wyrażenie
f (λ) = det(F − λI) jest wielomianem stopnia n zwanym wielomianem charakterystycznym macierzy F .
Zatem, aby znaleźć wektory i wartości własne macierzy F szukamy pierwiastków
wielomianu charakterystycznego, a następnie rozwiązujemy układ równań liniowych.
Przykład:
1−λ
3
f (λ) = det
= λ2 − 3λ − 10.
4
3−λ
Pierwiastkami są liczby -2, 5. Pozostaje rozwiązać równania
1 3
4 2
x
y
= −2
x
,
y
1 3
4 2
x
y
=5
x
.
y
Rozwiązaniami są wektory
1
,
−1
3
.
4
Wektory te tworzą bazę (zgodnie z twierdzeniem, będzie tak zawsze, jeśli wielomian
charakterystyczny ma n różnych pierwiastków). Macierz przekształcenia w znalezionej bazie jest diagonalna i zachodzi relacja
1 3
−1 4
−1 1 3
4 2
1 3
−1 4
66
=
−2 0
.
0 5
Może się zdarzyć, że przekształcenie nie ma wektorów własnych. Obrót o 90 stopni
nie ma wektorów własnych w przestrzeni R2 .
Jeśli wielomian charakterystyczny ma pierwiastki wielokrotne, to wektory własne
mogą nie tworzyć bazy. Przykładem jest macierz
0 1
.
0 0
Wartości własne są równe zero, ale przekształcenie jest niezerowe.
W przypadku przestrzeni nieskończonego wymiaru jest jeszcze gorzej. Nawet w
przypadku ciała algebraicznie domkniętego może nie być wektorów własnych. Np.
przekształcenie liniowe z przestrzeni wielomianów w przestrzeń wielomianów, które
mnoży wielomian zmiennej x przez x nie ma wektorów własnych.
W dalszej części rozważamy tylko przestrzenie liniowe nad ciałem liczb zespolonych, choć wiele faktów ma miejsce w ogólniejszej sytuacji.
Twierdzenie. Macierz M można zdiagonalizować ⇔ macierz M jest pierwiastkiem
pewnego wielomianu nie mającego pierwiastków wielokrotnych.
Dowód. Jeśli macierz M można zdiagonalizować, to M = BDB −1 , gdzie D jest
macierzą diagonalną z liczbami λ1 , λ2 , . . . , λn na przekątnej.
Niech f (x) = (x−λ1 )(x−λ2 ) · · · (x−λk ). Wtedy f (M ) = Bf (D)B −1 = B0B −1 = 0.
Dowód implikacji odwrotnej jest trudniejszy. Dowód przeprowdzimy dla k = 3.
Uogólnienie jest oczywiste.
Załóżmy więc, że f (M ) = 0 dla f (x) = (x − λ1 )(x − λ2 )(x − λ3 ), gdzie λ1 , λ2 , λ3
są trzema różnymi liczbami.
Możemy znaleźć trzy liczby c1 , c2 , c3 takie, że
c1 (x − λ2 )(x − λ3 ) + c2 (x − λ1 )(x − λ3 ) + c3 (x − λ1 )(x − λ2 ) = 1.
Wystarczy podstawić x = λ1 , λ2 , λ3 i okaże się c1 = 1/(λ1 − λ2 )(λ1 − λ3 ), itd. Po
takim podstawiemiu wyrażenie stanie się wielomianem stopnia nie większego niż 2
przyjmującym w 3 różnych punktach wartość 1, czyli wielomianem stałym.
Niech
P1 = c1 (M − λ2 I)(M − λ3 I),
P2 = c2 (M − λ1 I)(M − λ3 I),
P3 = c3 (M − λ1 I)(M − λ2 I).
Wtedy
P1 + P2 + P3 = I, Pi Pj = 0, i 6= j, Pi2 = I.
Przestrzenie Vi = Pi V są niezmiennicze, tzn. M Vi ⊆ Vi . Mamy bowiem równość
M Pi = λi Pi . W każdej z podprzestrzeni Vi działanie M polega na mnożeniu przez
λi . Możemy w każdej podprzestrzeni wybrać jak jakąś bazę. Suma tak wybranych
baz będzie bazą przestrzeni V . Będzie to baza, w której przekształcenie M ma postać
diagonalną. Należy tylko pokazać, że wektory wybrane z różnych podprzestrzeni Vi
są liniowo niezależne.
Weźmy zatem w1 ∈ V1 , w2 ∈ V2 , w3 ∈ V3 . Jeśli w1 + w2 + w3 = 0, to 0 =
Pi (w1 + w2 + w3 ) = w1 .
67
Uwaga. Wiemy, że macierz jest pierwiastkiem wielomianu chrakterystycznego.
Dla dowolnego wielomianu f różnego od stałej, możemy rozpatrywać wielomian
f /nwd(f, f 0 ), gdzie prim oznacza pochodną. Tak utworzony wielomian ma te same
pierwiastki co f , ale nie ma pierwiastków wielokrotnych. Wystarczy więc sprawdzić,
czy M jest pierwiastkiem tak utworzonego wielomianu.
Formy kwadratowe
Definicja. Formą liniową nazywamy przekształcenie liniowe f : V → K.
Jeśli v1 , v2 , . . . , vn jest bazą V i f vi = ai ∈ K dla i = 1, 2, . . . , n, to
f (x1 v1 + x2 v2 + · · · + xn vn ) = a1 x1 + a2 x2 + · · · + an xn .
Definicja. Symetryczną formą dwuliniową nazywamy przekształcenie B : V ×
V → K takie, że
• B(v, w) = B(w, v),
• B(v + u, w) = B(v, w) + B(u, w),
B(w, v + u) = B(w, v) + B(w, u)
• B(βv, w) = βB(v, w) = B(v, βw).
Jeśli v = x1 v1 + x2 v2 + · · · + xn vn , a w = y1 v1 + y2 v2 + · · · + yn yn , to
B(v, w) =
n
n X
X
B(vi , vj )xi yj ,
i=1 j=1
przy czym aij = B(vi , vj ) = B(vj , vi ) = aji .
Mamy więc
B(v, w) =
n X
n
X
aij xi yj .
i=1 j=1
Od tego miejsca K = R. Niech Q(v) = B(v, v). Zachodzą równości
Q(βv) = β 2 Q(v),
1
B(v, u) = (Q(v + u) − Q(v) − Q(u)).
2
Definicja. Przekształcenie Q : V → R nazywamy formą kwadratową, jeśli
Q(βv) = β 2 Q(v),
a przekształcenie B określone wzorem
1
B(v, u) = (Q(v + u) − Q(v) − Q(u))
2
jest dwuliniową formą symetryczną.
68
Możemy napisać
Q(v) = B(v, v) =
n X
n
X
aij xi yj .
i=1 j=1
Symetryczną macierz A o wyrazach aij nazywamy macierzą formy kwadratowej Q
w bazie v1 , v2 , . . . , vn .
Jeśli




y1
x1
y 
x 
 2
2
,

, v = 
u=
 · 
 · 
yn
xn
to
B(u, v) = ut Av,
Q(u) = ut Au.
Przykład.
Q
x1
x2
= ax21 + 2bx1 x2 + cx22 =
a b
x2 )
b c
= ( x1
x1
.
x2
Diagonalizacja Lagrange’a
Przykład.
x21 + 4x1 x2 + 3x22 = (x1 + 2x2 )2 − x22 = y12 − y22 ,
y1 = x1 + 2x2
y 2 = x2
1 −2
0 1
t 1 2
2 3
x1 = y1 − 2y2
x2 = y2
1 −2
0 1
=
1 0
.
0 −1
Drugi przykład.
x1 x2 =
1 1
1 −1
x1 + x2
2
2
−
x1 − x2
2
y1 = (x1 + x2 )/2
y2 = (x1 − x2 )/2
t 0 1/2
1/2 0
2
= y12 − y22 .
x1 = y 1 + y 2
x2 = y1 − y2
1 1
1 −1
=
1 0
.
0 −1
Uwaga. Jeśli G jest macierzą odwracalną, to macierze Gt AG i A mają taki sam rząd.
Definicja. Rząd formy kwadratowej = rząd macierzy formy kwadratowej.
Twierdzenie. Diagonalizacja formy kwadratowej.
Niech
n n
Q(x1 , x2 , . . . , xn ) =
XX
i=1 j=1
69
aij xi xj ,
aij = aji .
Istnieje macierz odwracalna B o wyrazach bij taka, że po podstawieniu
xi =
n
X
bik yk ,
k=1
otrzymujemy
Q(x1 , x2 , . . . , xn ) =
n
X
di yi2 .
i=1
Inaczej
B t AB = D,
gdzie D jest macierzą diagonalną.
Dowód indukcyjny ze względu na n. Dla n = 1 nie ma czego dowodzić. Załóżmy,
że twierdzenie jest prawdziwe dla n − 1. Jeśli aii 6= 0 dla pewnego i np. dla i = n, to
Q = ann (xn + a1n /ann x1 + · · · + an−1,n /ann xn−1 )2 + Q1 .
Q1 na mocy założenia indukcyjnego możemy zdiagonalizować. Mamy więc
2
Q = ann yn2 + d1 y12 + · · · + dn−1 yn−1
,
gdzie
yn = xn + a1n /an x1 + · · · + an−1,n /ann xn−1 .
Jeśli natomiast dla każdego i aii = 0, ale dla pewnych i, j aij 6= 0, to postępując jak
w drugim przykładzie sprowadzamy problem do pierwszego przypadku.
zi = (xi + xj )/2,
zj = (xi − xj )/2,
xi xj = zi2 − zj2 .
Przypadek Q = 0 jest oczywisty.
Przykład.
Q = x1 x2 + x2 x3 + x3 x1 = (x1 + x2 )2 /4 − (x1 − x2 )2 /4 + (x1 + x2 )x3 =
= (x1 + x2 + 2x3 )2 /4 − (x1 − x2 )2 /4 − x23 = y12 − y − 22 − y32 ,


 y1
= x1 /2 + x2 /2 + x3
y
2 = x1 /2 − x2 /2


y 3 = x3
Twierdzenie Sylwestera o bezwładności.
Każdą formę kwadratową nad R możemy zapisać w postaci
Q = x21 + x22 + · · · + x2p − x2p+1 − xp+2 x2p+2 + · · · − x2p+q ,
przy czym p + q jest rzędem formy, a liczby p, q nie zależą od przestawienia.
Definicja. Parę liczb (p, q) nazywamy sygnaturą formy kwadratowej.
70
Dowód. Jedynym trudniejszym miejscem, jest pokazanie, że jeśli po podstawieniu
xi =
n
X
bik yk
k=1
2
2
2
− yr+2
+ · · · − yr+s
,
Q = y12 + y22 + · · · + yr2 − yr+1
to r = p i t = q. Oczywiście r + s = p + q. Załóżmy, że p < r oraz ys+1 = ys+2 =
· · · = ys+t = 0.
Układ równań p równań x1 = x2 = · · · = xp = 0 z r niewiadomymi y1 , y2 , . . . , yr
ma niezerowe rozwiązanie (więcej niewiadomych niż równań). Takie rozwiązanie prowadzi do sprzeczności
Q = y12 + y22 + · · · + yr2 > 0 ­ −x2p+1 − x2p+2 − · · · − x2p+q = Q.
Dlatego p = r.
Definicja. Mówimy, że forma kwadratowa Q jest dodatnio określona, jeśli dla
każdego niezerowego wektora v Q(v) > 0.
Sygnatura dodatnio określonej formy równa jest (n, 0).
Twierdzenie. Niech A będzie macierzą formy kwadratowej Q.
Forma kwadratowa Q jest dodatnio określona, wtedy i tylko wtedy, gdy
a11
a
 21
det 
 ·
ak1

a12
a22
·
ak2
· · · a1k
· · · a2k 

 > 0 dla k = 1, 2, 3, . . . , n.
···
· 
· · · akk

Dowód. Jeśli forma Q jest dodatnio określona, to Gt AG = I dla pewnej macierzy
G. Wtedy 1 = det Gt AG = (det G)2 det A i det A > 0.
Rozpatrując formy kwadratowe
(x1 , x2 , . . . , xk ) → Q(x1 , x2 , . . . , xk , 0, 0, . . . , 0)
widzimy, że wszystkie wypisane w twierdzeniu wyznaczniki są dodatnie.
Implikację odwrotną udowodnimy indukcyjnie. Twierdzenie jest oczywiste dla
n = 1. Załóżmy, że twierdzenie jest prawdziwe dla n − 1 oraz, że wszystkie wyznaczniki z twierdzenia są dodatnie.
Z założenia indukcyjnego forma kwadratowa
(x1 , . . . , xn−1 ) → Q(x1 , . . . , xn−1 , 0)
jest dodatnio określona. Po diagonalizacji
2
Q(x1 , . . . , xn−1 , 0) = y12 + · · · + yn−1
.
Zatem
2
+ 2b1 y1 xn + . . . + 2bn−1 yn−1 xn + cx2n =
Q(x1 , . . . , xn ) = y12 + · · · + yn−1
71
= (y1 − b1 x1 )2 + ... + (yn−1 − bn−1 xn−1 )2 + (c − b21 − b22 − ... − b2n−1 )x2n .
Wyznacznik formy kwadratowej Q wyraża się wzorem
1
0

det 
 ·
b1

0
1
·
b2
· · · b1
· · · b2 

 = c − b21 − b22 − ... − b2n−1 .
··· · 
··· c

Z założenia wyznacznik ten jest dodatni i dlatego forma kwadratowa Q jest dodatnio
określona.
Grupa obrotów i grupa Lorentza
Niech Q będzie formą kwadratową, a B odpowiadającą symetryczną formą dwuliniową.
Q(v) = v t Av, B(u, w) = ut Aw, At = A.
Odwracalne przekształcenia liniowe zachowujące formę kwadratową (a więc również
odpowiadającą jej formę dwuliniową tworzą grupę.
Q(Rv) = Q(v),
B(Ru, Rw) = ut Rt ARw = B(u, w) = ut Aw.
Podstawiając za u, w wektory bazy standardowej e1 , e2 , . . . , en widzimy, że
Rt AR = A.
Jeśli Q = x21 + x22 + · · · + x2n , to A = I i Rt R = I. Grupę przekształceń zachowującą
Q nazywamy grupą obrotów i oznaczamy symbolem O(n, R).
Ponieważ det I = det Rt R = (det R)2 , więc det R = ±1. Obroty o wyznaczniku
1 tworzą podgrupę nazywaną grupą obrotów właściwych i oznaczaną symbolem
SO(n, R).
Przypomnę, że grupę wszystkich odwracalnych macierzy n × n o wyrazach rzeczywistych oznaczamy symbolem GL(n, R), a jej podgrupę złożoną z macierzy o
wyznaczniku 1 oznaczamy symbolem SL(n, R).
Elementy grupy SO(2, R) możemy zapisać w postaci
R(θ) =
cos θ
sin θ
− sin θ
cos θ
Elementy grupy SO(3, R) możemy zapisać w postaci
R3 (α)R1 (β)R3 (γ),
gdzie

cos θ

R1 (θ) =  sin θ
0
− sin θ
cos θ
0


0
0
,
1
1
0

R3 (θ) =  0 cos θ
0 sin θ
72

0
− sin θ 
.
cos θ
Kąty α, β, γ nazywa się kątami Eulera. Inny sposób opisu polega na podaniu osi i
kąta obrotu.
Jeśli Q = x20 − x21 − x22 − x23 , to odpowiednia grupa nazywa się grupą Lorentza.
Jeśli ograniczymy się do formy Q = x20 − x21 , to elementy grupy będziemy mogli
zapisać w postaci
cosh θ sinh θ
R(θ) =
sinh θ cosh θ
Iloczyn skalarny
Iloczyn skalarny w Rn definiujemy wzorem
x · y = x1 y1 + x2 y2 + · · · + xn yn .
W szczególności w R3 mamy
x · y = x1 y1 + x2 y2 + x3 y3 .
Kwadrat długości wektora w R3 wyraża się wzorem
x2 = x · x = x21 + x22 + x33 .
Zachodzi równość
(x − y)2 = x2 + y 2 − 2x · y.
Twierdzenia cosinusów mówi, że
(x − y)2 = x2 + y 2 − 2|x||y| cos α,
gdzie |x|, |y| oznaczają długości wektorów x, y, a α jest kątem miedzy wektorami.
Porównując dwa ostatnie wzory dostajemy
x · y = |x||y| cos α.
W przestrzeni Cn trzeba nieco zmienić definicję iloczynu skalarnego, tak aby
kwadrat niezerowego wektora był niezerowy. Przyjmujemy więc definicję
x · y = x1 y 1 + x2 y 2 + · · · + xn y n .
Od tego miejsca iloczyn skalarny wektorów x, y będziemy oznaczać symbolem
hx|yi.
Podstawowe własności iloczynu skalarnego przyjmujemy jako ogólną definicję
iloczynu skalarnego.
Definicja. Niech V będzie przestrzenią liniową nad ciałem C (lub R). Iloczynem
skalarnym nazywamy przekształcenie V × V → C (lub R) posiadające następujące
własności
• hy|xi = hx|yi,
• hαx|yi = αhx|yi,
73
• hx + y|zi = hx|zi + hy|zi,
• hx|xi ∈ R i hx|xi ­ 0.
• Jeśli hx|xi = 0, to x = 0.
Przestrzeń liniową nad ciałem R (C) z określonym iloczynem skalarnym nazywamy
przestrzenią euklidesową (przestrzenią unitarną).
Iloczyn skalarny pozwala na zdefiniowanie normy wektora.
Definicja. Normą wektora nazywamy przekształcenie V → R o następujących
własnościach
• ||x|| ­ 0,
• ||αx|| = |α| ||x||,
• ||x + y|| ¬ ||x|| + ||y|| (nierówność trójkąta),
• jeśli ||x|| = 0, to x = 0.
W przestrzeniach euklidesowych (unitarnych) normę definiujemy wzorem
||x|| =
q
hx|xi.
Można pokazać, że tak zdefiniowana norma posiada wszystkie wymagane własności. Jedynym trudniejszym punktem jest dowód nierówności trójkąta. Do dowodu
potrzebna nam będzie nierówność Schwarza.
Twierdzenie. |hx|yi| ¬ ||x|| ||y||.
Dowód. Jeśli y = 0, to mamy równość. Przyjmijmy więc, że y 6= 0. Zachodzi
nierówność
0 ¬ ||x − αy|| = ||x||2 + αhx|yi + αhy|xi + αα||y||2 .
Podstawiając α = hx|yi/||y|| otrzymujemy po prawej stronie nierówności
||x||2 − hy|xihx|yi/||y||2 .
Teraz możemy wykazać nierówność trójkąta
||x + y||2 = ||x||2 + ||y||2 + hx|yi + hy|xi ¬ ||x||2 + ||y||2 + 2|hx|yi|
¬ ||x||2 + ||y||2 + 2||x|| ||y|| = (||x|| + ||y||)2 .
Tożsamości polaryzacyjne. Jeśli norma zdefiniowana jest wzorem ||x|| =
hx|xi, to iloczyn skalarny możemy wyrazić przez normy odpowiednio dobranych
wektorów
q
3
X
1
hx|yi = (||x + y|| + i||x + iy|| − ||x − y|| − i||x − iy||) =
ik ||x + ik y||.
4
k=0
74
W przypadku przestrzeni nad ciałem R wzór jest prostszy
1
hx|yi = (||x + y|| − ||x − y||).
2
Mamy poza tym tożsamość równoległoboku
||x + y||2 + ||x − y||2 = 2(||x||2 + ||y||2 ).
Normy w Cn nie związane z iloczynem skalarnym:
||x||∞ = max |xk |,
1¬k¬n
X
||x||1 =
|xk |.
1¬k¬n
Norma pozwala nam wprowadzić odległość wzorem
d(x, y) = ||x − y||.
Można sprawdzić, że d : V × V → R spełnia podstawowe własności odległości
• d(x, y) ­ 0,
• d(x, y) = d(y, x),
• d(x, y) ¬ d(x, z) + d(z, y),
• d(x, y) = 0 ⇔ x = y.
Ortonormalne zbiory wektorów
Definicja. Mówimy, że zbiór wektorów {u1 , u2 , u3 , . . .} jest ortonormalny, jeśli hui |uj i =
δij .
Wektory tworzące zbiór ortonormalny są liniowo niezależne.
Jeśli w = a1 u1 + a2 u2 + · · · + an un = 0, to ai = hw|ui i = 0.
Jeśli x = x1 u1 + x2 u2 + . . . + xn un i y = y1 u1 + y2 u2 + · · · + yn un ,
to hx|yi = x1 y1 + x2 y2 + · · · + xn yn .
Twierdzenie. Jeśli wektory v1 , v2 , v3 . . . , z przestrzeni unitarnej
(euklidesowej) są liniowo niezależne, to znajdziemy ortonormalne wektory u1 , u2 , u3 , · · · ,
takie, że dla i = 1, 2, 3, . . . ui jest kombinacją liniową wektorów v1 , v2 , . . . , vi .
Dowód. Wektory ortonormalne możemy wyrazić wzorami
w1 = v1 , u1 = w1 /||w1 ||,
w2 = v2 − hv2 |u1 iu1 , u2 = w2 /||w2 ||,
w3 = v3 − hv3 |u1 iu1 − hv3 |u2 iu2 , u3 = w3 /||w3 ||,
.........
Twierdzenie. Jeśli zbiór {u1 , u2 , . . . , un } jest ortonormalny, to
• ||x − hx|u1 iu1 − hx|u2 iu2 − · · · − hx|un iun || ¬ ||x − a1 u1 − a2 u2 − · · · − an un ||,
75
• ||x||2 ­ |hx|u1 i|2 + |hx|u2 i|2 + · · · + |hx|un i|2 (nierówność Bessela).
Bazę złożoną z wektorów ortonormalnych nazwiemy bazą ortonormalną.
Twierdzenie. Jeśli u1 , u2 , . . . , un jest bazą ortonormalną, to
• Jeśli hx|ui i = 0 dla i = 1, 2, . . . , n, to x = 0.
• x = hx|u1 iu1 + hx|u2 iu2 + · · · + hx|un iun .
• ||x||2 = |hx|u1 i|2 + |hx|u2 i|2 + · · · + |hx|un i|2 ,
• hx|yi = hx|u1 i hu1 |yi + hx|u2 i hu2 |yi + · · · + hx|un ihun |yi.
Dowód pierwszej nierówności.
||x − a1 u1 − a2 u2 − · · · − an un ||2 −
−||x − hx|u1 iu1 − hx|u2 iu2 − · · · − hx|un iun ||2 =
= |hx|u1 i − a1 |2 + |hx|u2 i − a2 |2 + · · · + |hx|un i − an |2 .
Przekształcenia hermitowskie i unitarne
Rozważamy przestrzeń unitarną (przestrzeń nad ciałem liczb zespolonych z iloczynem skalarnym).
Załóżmy, że v1 , v2 , . . . , vn tworzą bazę ortonormalną przestrzeni V , a A przekształceniem liniowym V w V . Jeśli
Avi =
n
X
Aji vj ,
i=1
to
Aij = hvi |Avj i.
Definicja. B nazywamy przekształceniem sprzężonym do przekształcenia liniowego A : V → V , jeśli
hAx|yi = hx|Byi.
W przestrzeniach skończonego wymiaru przekształcenie sprzężone zawsze istnieje. Wystarczy zauważyć, że macierz przekształcenia sprzężonego do A spełnia relacje
t
Bij = Aji , piszemy B = A = A† .
Twierdzenie. Przekształcenie sprzężone, jeśli istnieje, to jest jedyne. Przekształcenie sprzężone jest przekształceniem liniowym.
Dowód. Jeśli hAx|yi = hx|Byi = hx|Cyi, to hx|By − Cyi = 0. Podstawiając
x = By − Cy, otrzymujemy hBy − Cy|By − Cyi = 0, a stąd By = Cy czyli B = C.
Przekształcenie sprzężone do A będziemy oznaczać symbolem A† .
Liniowość i kolejne twierdzenie dowodzimy podobnie.
Twierdzenie. Własności sprzężenia
76
• (βA)† = βA† ,
• (A + B)† = A† + B † ,
• (AB)† = B † A† ,
• A†† = A.
Definicja. Przekształcenie liniowe A : V → V nazywamy przekształceniem
hermitowskim, jeśli A† = A.
Macierz przekształcenia hermitowskiego spełnia relację Aij = Aji . Taką macierz
nazywamy macierzą hermitowską.
Twierdzenie. Wartości własne przekształcenia hermitowskiego są rzeczywiste.
Dowód. Jeśli A† = A i Ax = λx, x 6= 0, to hAx|xi = hλx|xi = λ||x||2 . Z drugiej
strony hAx|xi = hx|Axi = hx|λxi = λ||x||2 . Stąd λ = λ i λ ∈ R.
Twierdzenie. Wektory własne przekształcenia hermitowskiego należące do różnych wartości własnych są do siebie prostopadłe.
Dowód. Jeśli A† = A, Ax = λx, Ay = µy, to hAx|yi = λhx|yi. Z drugiej strony
hAx|yi = hx|Ayi = µhx|yi (wiemy już, że µ ∈ R). Stąd dla λ 6= µ hx|yi = 0.
Definicja. Przekształceniem unitarnym nazywamy odwracalne przekształcenie
liniowe zachowujące normę wektora.
Warunek ||U x|| = ||x|| jest równoważny z warunkiem hU x|U yi = hx|yi.
W przestrzeni skończonego wymiaru nie trzeba dodatkowo zakładać odwracalnosci.
Macierz przekształcenia unitarnego spełnia warunek U † U = I i nazywa się macierzą unitarną.
Macierze unitarne rozmiaru n tworzą grupę zwaną grupą unitarną oznaczaną
symbolem U (n).
1 = det U † U = det U † det U = det U det U . Dlatego | det U | = 1. Podgrupę
złożoną z macierzy unitarnych o wyznaczniku 1 oznaczamy symbolem SU (n).
Twierdzenie. Wartości własne przekształcenia unitarnego są liczbami zespolonymi o module 1.
Dowód. Jeśli U x = λx, x 6= 0, to ||X|| = ||U x|| = |λ| ||x|| i |λ| = 1.
Twierdzenie. Wektory własne przekształcenia unitarnego należące do różnych
wartości własnych są prostopadłe do siebie.
Dowód. Załóżmy, że U x = λx i U y = µy. Mamy hx|yi = hU x|U yi = λµhx|yi =
λµ−1 hx|yi. Stąd dla λ 6= µ hx|yi = 0.
77
Twierdzenie spektralne. Rozpatrujemy przekształcenie hermitowskie (lub unitarne) określone na przestrzeni skończonego wymiaru. Istnieje baza ortonormalna
przestrzeni złożona z wektorów własnych rozpatrywanego przekształcenia.
Dowód indukcyjny względem wymiaru przestrzeni. Dla n = 1 nie ma czego
dowodzić.
Niech A : V → V . A† = A (dla przekształcenia unitarnego dowód jest podobny).
Załóżmy, że twierdzenie jest prawdziwe dla n − 1. Pokażemy, że jest prawdziwe
dla n. Istnieje co najmniej jeden wektor własny λ (wielomian charakterystyczny ma
co najmniej jeden pierwiastek zespolony). Mamy Ax = λx. Niech W będzie zbiorem
wektorów prostopadłych do x. W jest podprzestrzenią V . Wymiar W równy jest
n − 1.
Jeśli y ∈ W , to Ay ∈ W . Mamy bowiem
hAy|xi = hy|Axi = hx|λyi = λhy|xi = 0.
Z założenia indukcyjnego istnieje baza ortonormalna złożona z wektorów własnych
przekształcenia A : W → W . Bazę tą uzupełniamy wektorem x, o którym możemy
założyć, że jest unormowany do 1).
Podobne rozważania można przeprowadzić w przypadku przestrzeni Euklidesowej. Przekształcenia hermitowskie nazywamy wtedy przekształceniami symetrycznymi, a przekształcenia unitarne przekształceniami ortogonalnymi lub po prostu obrotami. Właściwie wystarczy wyciągnąć pewne wnioski z wymienionych twierdzeń.
Wiele ciekawych faktów można znaleźć w książce Byrona i Fullera (Matematyka w
fizyce klasycznej i kwantowe). Można tam znaleźć wiele pominiętych tu szczegółów.
Jerzy Cisło, 2007
78