Algebra
Transkrypt
Algebra
Algebra Spis treści Wykład 1 Wstęp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relacja równości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 4 6 Wykład 2 Pierścień . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Liczby całkowite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relacja nierówności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 6 7 8 Wykład 3 Relacja podzielności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Liczby pierwsze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Największy wspólny dzielnik . . . . . . . . . . . . . . . . . . . . . . . . . . 8 8 9 9 Wykład 4 Ciało . . . . . . . . . . Relacja równoważności Konstrukcja ułamków . Pierścień Zn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 12 13 14 Wykład 5 15 Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 Liczby zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Izometrie płaszczyzny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Wykład 6 19 Wielomiany . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Wykład 7 21 Pierwiastki wymierne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Podzielność wielomianów . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Pierwiastki rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Wykład 8 24 Zasadnicze twierdzenie algebry . . . . . . . . . . . . . . . . . . . . . . . . 24 Równania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1 Wykład 9 26 Równanie 3 stopnia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Równanie 4 stopnia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Wielomiany symetryczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Wykład 10 31 Grupy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 Wykład 11 34 Podgrupy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Wykład 12 37 Permutacje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Wykład 13 40 Dzielnik normalny i grupa ilorazowa . . . . . . . . . . . . . . . . . . . . . 40 Jądro homomorfizmu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 Wykład 14 Przestrzeń liniowa 43 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Wykład 15 46 Przekształcenia liniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Wykład 16 49 Dodawanie macierzy i mnożenie macierzy przez skalar . . . . . . . . . . . . 49 Mnożenie macierzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Zmiana bazy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Wykład 17 52 Równania liniowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Wykład 18 55 Jak znaleźć rząd macierzy? . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Równania i wyznaczniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Wykład 19 58 Definicja i własności wyznacznika . . . . . . . . . . . . . . . . . . . . . . . 58 Wykład 20 61 Niezmienniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 Rozwinięcie Laplace’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Dwa twierdzenia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Wykład 21 65 Wektory i wartości własne . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 2 Wykład 22 68 Formy kwadratowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Diagonalizacja Lagrange’a . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 Wykład 23 72 Grupa obrotów i grupa Lorentza . . . . . . . . . . . . . . . . . . . . . . . . 72 Wykład 24 Przekształcenia hermitowskie i unitarne 3 76 . . . . . . . . . . . . . . . . . . . 76 Wstęp 1. Liczby naturalne N = {0, 1, 2, 3, ...}. Niektórzy przyjmują N = {1, 2, 3, ...}. Liczby naturalne można dodawać i mnożyć. Nie można od mniejszej liczby odejmować większej. 2. Liczby całkowite Z = {..., −2, −1, 0, 1, 2, ...}, Własności dodawania i mnożenia: • (a + b) + c = a + (b + c) • a+b=b+a • a+0=a N⊂Z (łączność dodawania) (przemienność dodawania) (0 jest elementem neutralnym względem dodawania) • Dla każdego a znajdziemy b takie, że a + b = 0 przeciwną do a) • a(bc) = (ab)c • ab = ba • a1 = a (b nazywamy liczbą (łączność mnożenia) (przemienność mnożenia) (1 jest elementem neutralnym względem mnożenia) • a(b + c) = ab + ac (rozdzielność) 3. Zbiór z dwoma działaniami spełniającymi powyżej wypisane własności nazywamy pierścieniem (przemiennym z 1). 4. Liczby wymierne czyli ułamki Q. Własności dodawania i mnożenia: • (a + b) + c = a + (b + c) • a+b=b+a • a+0=a • Dla każdego a znajdziemy b takie, że a + b = 0 • a(bc) = (ab)c • ab = ba • a1 = a • dla każdego a 6= 0 znajdziemy b takie, że ab = 1 (b nazywamy liczbą odwrotną do liczby a) • a(b + c) = ab + ac 5. Zbiór z dwoma działaniami spełniającymi powyżej wypisane własności nazywamy ciałem. Zakłada się, że 1 6= 0. 6. Inne przykłady ciał: liczby rzeczywiste R, liczby zespolone C (liczby postaci a + bi, gdzie i2 = −1). Z ⊂ Q ⊂ R ⊂ C. 7. Jeszcze jeden przykład pierścienia. Wielomiany o współczynnikach rzeczywistych. Wyrażenia postaci a0 + a1 x + a2 x2 + · · · + an xn , a0 , a1 , ..., an ∈ R. 4 8. Wektory w R3 . Dodawanie wektorów i mnożenie wektora przez liczbę: (x, y, z) + (x0 , y 0 , z 0 ) = (x + x0 , y + y 0 , z + z 0 ), α(x, y, z) = (αx, αy, αz). Wektorów tworzą przestrzeń wektorową (liniową). 9. Własności działań (u, v, w ∈ R3 , α, β ∈ R) • (u + v) + w = u + (v + w) • u+v=v+u • u + 0 = u (w naszym przykładzie 0 = (0, 0, 0)) • Dla każdego wektora u znajdziemy wektor v taki, że u + v = 0 • 1u = u • α(βu) = (αβ)u • α(u + v) = αu + αv • (α + β)u = αu + βu 10. (x, y, z) = x(1, 0, 0) + y(0, 1, 0) + z(0, 0, 1) Każdy wektor (x, y, z) możemy w dokładnie jeden sposób przedstawić jako sumę wektorów (1, 0, 0), (0, 1, 0), (0, 0, 1) pomnożonych przez pewne liczby. Zbiór takich wektorów nazywamy bazą. 11. Funkcja f : podzbiór X × Y taki, że • dla każdego x ∈ X istnieje y ∈ Y takie, że (x, y) ∈ f , • jeśli (x, y) ∈ f i (x, z) ∈ f , to z = y. 12. Zamiast pisać (x, y) ∈ f piszemy y = f (x) (na wykładzie zamiast formalnych definicji były odpowiednie rysunki). 13. Mówimy, że f jest funkcją różnowartościową, jeśli z równości f (a) = f (b) wynika równość a = b. 14. Mówimy, że f przekształca X na Y , jeśli dla każdego y ∈ Y znajdziemy x ∈ X takie, że f (x) = y. 15. Funkcja różnowartościowa przekształcająca X na Y jest odwracalna. 16. Grupa przekształceń. Niech S3 oznacza zbiór wszystkich funkcji przekształcających {1, 2, 3} na {1, 2, 3}. Takich funkcji jest 6. Własności S3 • f ∈ S3 ⇒ f jest odwracalna i f −1 ∈ S3 • f, g ∈ S3 ⇒ f ◦ g ∈ S3 17. Składanie funkcji jest łączne. f ◦ g(x) = f (g(x)), ((f ◦ g) ◦ h)(x) = (f ◦ g)(h(x)) = f (g(h(x)), (f ◦ (g ◦ h))(x) = f ((g ◦ h)(x)) = f (g(h(x)). Dlatego (f ◦ g) ◦ h = f ◦ (g ◦ h). 5 18. Abstrakcyjna definicja. Grupą nazywamy zbiór G z jednym działaniem posiadającym następujące własności • (f g)h = f (gh) • Istnieje element e taki, że ef = f e = f • Dla każdego f znajdziemy g takie, że f g = gf = e Relacja równości Własności: • a=a • a=b⇒b=a • a=bib=c⇒a=c • Jeśli f jest funkcją i a = b, to f (a) = f (b). • Jeśli ψ jest formą zdaniową (zdaniem z parametrami) i a = b, to ψ(a) ⇔ ψ(b) Z wymienionych własności wynika m.in., że jeśli a = b, to a + c = b + c. Pierścień Pierścieniem przemiennym z jednością nazywamy zbiór z dwoma działaniami posiadającymi następujące własności • (a + b) + c = a + (b + c) • a+b=b+a • Istnieje element 0 taki, że a + 0 = a • Dla każdego a istnieje b takie, że a + b = 0 • a(bc) = (ab)c • ab = ba • Istnieje element 1 taki, że a1 = a • a(b + c) = ab + ac Z powyższych własności wynikają następujące własności • Element 0 jest jedyny. Dowód. Załóżmy, że 0, 0’ są elementami neutralnymi względem dodawania. Wtedy 0=0+0’=0’+0=0’. 6 • Element 1 jest jedyny. Dowód. Załóżmy, że 1, 1’ są elementami neutralnymi względem mnożenia. Wtedy 1=11’=1’1=1’. • Element przeciwny jest jedyny. Element przeciwny do a oznaczamy przez −a. Dowód. Załóżmy, że a + b = 0 i a + c = 0. Wtedy a = a + 0 = a + (a + c) = a + (b + c) = (a + b) + c = 0 + c = c + 0 = c. • −(a + b) = (−a) + (−b) Dowód. Obie strony są przeciwne do a + b. • 0a = 0 Dowód. 0a = a0 = a(0 + 0) = a0 + a0. Dlatego 0 = a0 + (−a0) = (a0 + a0) + (−a0) = a0 + (a0 + (−a0)) = a0 + 0 = a0. • a − b oznacza a + (−b). • −(−a) = a Dowód. a + (−a) = 0 i (−(−a)) + (−a) = 0. Dlatego −(−a) = a. • a(b − c) = ab − ac • a(−b) = −ab Liczby całkowite Liczby całkowite Z tworzą pierścień. Liczby całkowite posiadają jeszcze dwie ważne własności. • Jeśli a 6= 0 i b 6= 0, to ab 6= 0 (mówimy, że w pierścieniu nie ma dzielników zera) • Niech N = {0, 1, 1 + 1, 1 + 1 + 1, . . .}. N 6= Z. Ale jeśli n ∈ Z, to n ∈ N lub −n ∈ N. Zasada indukcji Zasada indukcji 1. Niech T0 , T1 , T2 , . . . będzie ciągiem zdań. Jeśli T0 oraz Tn ⇒ Tn+1 dla n = 0, 1, 2, . . ., to Tn dla n = 0, 1, 2, . . .. Zasada indukcji 2. Jeśli T0 , oraz T0 , T1 , . . . , Tn ⇒ Tn+1 to Tn dla n = 0, 1, 2, . . .. dla n = 0, 1, 2, . . ., Dla przykładu udowodnimy przez indukcję wzór 0 · 1 + 1 · 2 + 2 · 3 + · · · + n(n + 1) = n(n + 1)(n + 2)/3. 7 Dowód. Dla n = 0 mamy 0 · 1 = 0 i 0 · 1 · 2/3 = 0. Załóżmy, że 0 · 1 + 1 · 2 + 2 · 3 + · · · + n(n + 1) = n(n + 1)(n + 2)/3. Wtedy 0 · 1 + 1 · 2 + 2 · 3 + · · · + n(n + 1) + (n + 1)(n + 2) = = n(n + 1)(n + 2)/3 + (n + 1)(n + 2) = = (n + 1)(n + 2)(n/3 + 1) = (n + 1)(n + 2)(n + 3)/3. Dlatego dla każdego n 0 · 1 + 1 · 2 + 2 · 3 + · · · + n(n + 1) = n(n + 1)(n + 2)/3. Zasada minimum. W każdym niepustym podzbiorze N znajdziemy element najmniejszy. Relacja nierówności Liczby (Z, Q, R) można podzielić na trzy rozłączne podzbiory: {0}, liczby dodatnie i liczby ujemne (przeciwne do dodatnich). • Suma liczb dodatnich jest dodatnia. • Iloczyn liczb dodatnich jest dodatni. • a < b oznacza, że liczba b − a jest dodatnia. • a ¬ b oznacza, że a < b lub a = b. Wnioski • Zachodzi dokładnie jedna z relacji: a < b, a = b, b < a. • a < b i b < c ⇒ a < c. • a < b ⇒ a + c < b + c. • a < b i 0 < c ⇒ ac < bc. Relacja podzielności W tej części mówimy tylko o liczbach całkowitych. Definicja. Mówimy, że a dzieli b, jeśli istnieje k takie, że b = ka. Piszemy a|b. Możemy też powiedzieć, że a jest dzielnikiem liczby b lub jeszcze inaczej, że b jest wielokrotnością a. Spostrzeżenia: 8 • a|b i b 6= 0 ⇒ |a| ¬ |b| • a|b i b|a ⇒ a = ±b • a|b i b|c ⇒ a|c. Dowód. Jeśli a|b i b|c, to znajdziemy liczby całkowite k i l takie, że b = ka i c = lb. Wynika stąd, że c = lb = lka, co oznacza, że a|c. • a|b i a|c ⇒ a|(b + c) i a|(a − c). Liczby pierwsze Definicja. Dodatnią liczbę całkowitą p nazywamy liczbą pierwszą, jeśli p ma dokładnie dwa dodatnie dzielniki całkowite (tzn. 1 i p). 1 nie jest liczbą pierwszą bo ma tylko 1 dodatni dzielnik całkowity: 1. 2 jest liczbą pierwszą bo ma dokładnie 2 dodatnie dzielniki całkowite: 1,2. 6 ma aż 4 dodatnie dzielniki całkowite: 1,2,3,6. Lemat. Każda liczba całkowita większa od 1 ma dzielnik pierwszy. Dowód przez indukcję. Liczba 2 ma dzielnik pierwszy równy 2. Załóżmy, że lemat jest prawdziwy dla liczb k = 2, 3, 4, ..., n−1. Pokażemy, że twierdzenie jest prawdziwe dla n. Jeśli n jest liczbą pierwszą, to n ma dzielnik pierwszy równy n. Jeśli natomiast n nie jest liczbą pierwszą, to n ma dodatni dzielnik k, przy czym 1 < k < n. Z założenia indukcyjnego wiemy, że k ma dzielnik pierwszy. Jest to równocześnie dzielnik pierwszy liczby n. Twierdzenie. Liczb pierwszych jest nieskończenie wiele. Dowód. Załóżmy, że mamy skończoną liczbę liczb pierwszych: p1 , p2 , ..., pn . Rozważamy liczbę q = p1 p2 · · · pn + 1. Zgodnie z Lematem liczba q ma dzielnik pierwszy. Może nim być tylko jedna z wymienionych liczb pierwszych. Jeśli jednak pi |q (i = 1, 2, ..., n), to pi |1 i mamy sprzeczność. Oznacza to, że liczby p1 , p2 , ..., pn nie mogą być wszystkimi liczbami pierwszymi. Twierdzenie. Rozkład na czynniki. Każdą liczbę całkowitą większą od 1 możemy zapisać w postaci iloczynu liczb pierwszych. Każde dwa przedstawienia różnią się co najwyżej kolejnością czynników. (pierwsza część twierdzenia jest prosta do wykazania przez indukcję, druga część jest trudniejsza) Największy wspólny dzielnik Liczbę d nazywamy wspólnym dzielnikiem a, b jeśli d|a i d|b. Zbiór wspólnych dzielników jest niepusty (zawiera 1). Jeśli co najmniej jedna z liczb a, b jest różna od 0, np. a 6= 0, to |d| ¬ |a| i zbiór wspólnych dzielników a, b jest ograniczony. Największy element w zbiorze wspólnych dzielników nazywamy największym wspólnym dzielnikiem i oznaczamy N W D(a, b). 9 Przykłady. N W D(12, 15) = 3, N W D(30, 72) = 6. Twierdzenie (Dzielenie z resztą). Dla każdych dwóch dodatnich liczb całkowitych znajdziemy liczby całkowite k, r takie, że a = kb + r, 0 ¬ r < b. Liczby k i r są określone jednoznacznie. Liczbę r nazywamy resztą z dzielenia a przez b. Dowód. Rozważamy zbiór nieujemnych liczb całkowitych postaci a − kb, gdzie k jest liczbą całkowitą. Zbiór ten jest niepusty, zawiera bowiem liczbę a. Niech r będzie najmniejszym elementem w rozważanym zbiorze. Z definicji r 0. Poza tym r < b. W przeciwnym wypadku mielibyśmy a − (k + 1)b = r − b 0 i r − b należałoby do rozważanego zbioru wbrew założeniu, że r jest najmniejszą liczbą w rozważanym zbiorze. Jednoznaczność. Załóżmy, że kb + r = k 0 b + r0 , 0 ¬ r0 < b. Wtedy (k − k 0 )b = r0 − r. Gdyby r 6= r0 np. r < r0 , mielibyśmy k > k 0 i r0 r + (k − k 0 )b b wbrew założeniu, że r0 < b. Uwaga. a, b nie muszą być dodatnie. Ważne jest, aby b 6= 0. Stwierdzenie. Jeśli a = kb + r (b 6= 0), to N W D(a, b) = N W D(b, r). Dowód. Jeśli a = kb + r, to wspólny dzielnik a i b (w szczególności N W D(a, b)) dzieli r. Jest więc wspólnym dzielnikiem b i r. Wynika stąd nierówność N W D(a, b) ¬ N W D(b, r). Podobnie N W D(b, r) ¬ N W D(a, b). Dlatego N W D(a, b) = N W D(b, r). Algorytm Euklidesa do obliczania N W D(a, b). Załóżmy, że 0 < b < a. Niech r0 = a, r1 = b. Wykonujemy kolejne dzielenia z resztą r0 = k1 r1 + r2 r1 = k2 r2 + r3 r2 = k3 r3 + r4 ······ Ciąg reszt r0 , r1 , r2 , . . . jest malejący. Dlatego dla pewnego i ri > 0 i ri+1 = 0. Zgodnie ze stwierdzeniem N W D(r0 , r1 ) = N W D(r1 , r2 ) = N W D(r2 , r3 ) = · · · = N W D(ri , 0) = ri . Ostatnia niezerowa reszta jest największym wspólnym dzielnikiem a i b. Twierdzenie. Dla dowolnych liczb całkowitych a, b, z których co najmniej jedna jest różna od zera, znajdziemy liczby całkowite x, y takie, że ax + by = N W D(a, b). Dowód. Kolejne reszty w algorytmie Euklidesa mają postać rj = xj a + yj b. r0 = 1a + 0b, Jeśli r1 = 0a + 1b. rj−1 = xj−1 a + yj−1 b 10 i rj = xj a + yj b, rj+1 = rj−1 − kj rj = (xj−1 − kj xj )a + (yj−1 − kj yj )b. to W szczególności ostatnia niezerowa reszta ma postać ax + by. Dowód pokazuje jak znaleźć rozwiązanie równania ax + by = N W D(a, b). Przykład. N W D(44, 13) i rozwiązanie równania 44x + 13y = 1. 44 = 3 · 13 + 5 13 = 2 · 5 + 3 5=1·3+2 3=1·2+1 2=2·1+0 5 = 41 − 3 · 13 3 = 13 − 2 · 5 = 13 − 2(44 − 3 · 13) = 7 · 13 − 2 · 44 2 = 5 − 3 = (44 − 3 · 13) − (7 · 13 − 2 · 44) = = 3 · 44 − 10 · 13 1 = (7 · 13 − 2 · 44) − (3 · 44 − 10 · 13) = 17 · 13 − 5 · 44 Wniosek. Załóżmy, że a 6= 0 lub b 6= 0. Równanie ax + by = d ma rozwiązanie wtedy i tylko wtedy, gdy N W D(a, b)|d. Stwierdzenie. Ogólne rozwiązanie wyraża się wzorami y = y0 − la/N W D(a, b), x = x0 + lb/N W D(a, b), gdzie para x0 , y0 jest szczególnym rozwiązaniem, a l dowolną liczbą całkowitą. Z Twierdzenia możemy wywnioskować łatwo kilka ważnych faktów. Twierdzenie. d|a i d|b ⇒ d|N W D(a, b). Twierdzenie. a|bc i N W D(a, b) = 1 ⇒ a|c. Dowód. ax + by = 1 dla pewnych x, y. Stąd acx + bcy = c i dlatego a|c. Z twierdzenia wynika jednoznaczność rozkładu na czynniki pierwsze. Definicja. Liczby a, b takie, że N W D(a, b) = 1, nazywamy liczbami względnie pierwszymi. Twierdzenie. N W D(a, b) = 1 i N W D(a, c) = 1 ⇒ N W D(a, bc) = 1. Dowód. ax1 + by1 = 1, ax2 + cy2 = 1 dla pewnych x1 , y1 , x2 , y2 . Mnożąc stronami powyższe równania otrzymujemy ax + bcy = 1 (x = ax1 x2 + by1 x2 + cx1 y2 , y = y1 y2 ). Oznacza to, że N W D(a, bc) = 1. Niekonstruktywny dowód istnienia rozwiązań równania ax + by = N W D(a, b), a, b > 0. Niech A będzie zbiorem wszystkich dodatnich liczb całkowitych postaci ax + by, gdzie x, y są liczbami całkowitymi. a = a1 + b0 ∈ A i b = a0 + b1 ∈ A. Niech D = ax0 + by0 będzie najmniejszą liczbą w zbiorze A. D jest dzielnikiem każdej liczby ze zbioru A. Mamy bowiem ax+by = kD+r, 0 ¬ r < D. Stąd r = a(x−kx0 )+b(y−ky0 ) i w przypadku r > 0 mamy sprzeczność z założeniem, że D jest najmniejszą liczbą w A. W szczególności D|a i D|b. Stąd D ¬ N W D(a, b). Z drugiej strony każdy wspólny dzielnik a, b dzieli każdy element ze zbioru A, w szczególności N W D(a, b)|D i N W D(a, b) ¬ D. Stąd równość D = N W D(a, b). Ciało Ciałem nazywamy zbiór (zawierający co najmniej 2 elementy) z dwoma działaniami posiadającymi następujące własności 11 • (a + b) + c = a + (b + c) • a+b=b+a • Istnieje element 0 taki, że a + 0 = a • Dla każdego a znajdziemy b takie, że a + b = 0 • a(bc) = (ab)c • ab = ba • Istnieje element 1 taki, że a1 = a • Dla każdego a 6= 0 znajdziemy b takie, że ab = 1 • a(b + c) = ab + ac Ciało jest pierścieniem. Własności pierścienia przenoszą się na ciało. Dodatkowe własności związane są z istnieniem elementu odwrotnego. • ab = 1 i ac = 1 ⇒ b = c. • a 6= 0 i b 6= 0 ⇒ ab 6= 0. • a−1 oznacza element odwrotny do a 6= 0. (a−1 )−1 = a, (ab)−1 = a−1 b−1 • a/b oznacza ab−1 . Relacja równoważności Iloczynem kartezjańskim zbiorów A i B nazywamy zbiór wszystkich par (a, b) takich, że a ∈ A i b ∈ B. Iloczyn kartezjański oznaczamy przez A × B. Relacją określoną na zbiorze A nazywamy dowolny podzbiór A × A. Zamiast mówić, że para (x, y) należy do relacji, mówimy, że a jest w relacji z b. Niech aRb oznacza, że a jest w relacji z b. Definicja. Relację R nazywamy relacją równoważności jeśli R posiada następujące własności: • aRa (zwrotność) • aRb ⇒ bRa (symetryczność) • aRb i bRc ⇒ aRc (przechodniość) Relacja równości jest relacją równoważności. Relacje: słabej nierówności (¬), podzielności, zawierania zbiorów są zwrotne i przechodnie. Nie są symetryczne. Relacją równoważności jest relacja przystawania modulo ustalona liczba: a ≡ b (mod n) ⇔ n|a − b, 12 a, b ∈ Z Definicja. Klasą równoważności (klasą abstrakcji) elementu a nazywamy zbiór takich elementów x, że xRa. Klasę równoważności elementu a oznaczymy przez [a]. Twierdzenie. Relacja równoważności R określona na zbiorze A rozbija zbiór A na rozłączne klasy równoważności. Dowód. Każdy element a ∈ A należy do pewnej klasy równoważności, a ∈ [a] bo aRa. Pokażemy, że jeśli [a] ∩ [b] 6= ∅, to [a] = [b]. Załóżmy, że x ∈ [a] i c ∈ [a] ∩ [b]. Stąd xRa i cRa (a więc również aRc). Dlatego xRc, a ponieważ cRb, więc xRb czyli x ∈ [b]. Podobnie pokazujemy, że każdy element klasy [b] należy do klasy [a]. Dlatego [a] = [b]. Konstrukcja ułamków Pokażemy jak wychodząc z pierścienia liczb całkowitych skonstruować pierścień liczb wymiernych. W konstrukcji ważne jest, że w pierścieniu liczb całkowitych nie ma dzielników zera (iloczyn elementów niezerowych jest niezerowy). Konstrukcja jest ogólna. Wychodząc z pierścienia wielomianów dostajemy ciało funkcji wymiernych. W zbiorze A = Z × (Z − {0}) określamy relację R: (l, m)R(l0 , m0 ) ⇔ lm0 = l0 m. Relacja R jest relacją równoważności. • (l, m)R(l, m). Mamy bowiem lm = lm. • (l, m)R(l0 , m0 ) ⇒ lm0 = l0 m ⇒ l0 m = lm0 ⇒ (l0 , m0 )R(l, m) • (l, m)R(l0 , m0 ) i (l0 , m0 )R(l00 , m00 ) ⇒ lm0 = l0 m i l0 m00 = l00 m0 ⇒ lm0 m00 = l0 mm00 = l00 m0 m ⇒ (lm00 − l00 m)m0 , m0 6= 0 ⇒ lm00 = l00 m ⇒ (l, m) = (l00 , m00 ) W zbiorze klas relacji R określamy działania: dodawanie i mnożenie. [l1 , m1 ] + [l2 , m2 ] = [l1 m2 + l2 m1 , m1 m2 ], [l1 , m1 ][l2 , m2 ] = [l1 l2 , m1 m2 ] Uwaga. Ponieważ m1 6= 0 i m2 6= 0, więc m1 m2 6= 0. Pokażemy, że zbiór klas równoważności z tak zdefiniowanymi działaniami jest ciałem. Zaczniemy od pokazania, że definicje są poprawne, tzn. wyniki dodawania i mnożenia nie zależą od wyboru reprezentantów klas. Załóżmy, że (l1 , m1 )R(l10 , m01 ) i (12 , m2 )R(l20 , m02 ), tzn. l1 m01 = l10 m1 i l2 m02 = l20 m2 . Wtedy (l1 m2 + l2 m1 )m01 m02 = (l1 m01 )(m2 m02 ) + (l2 m02 )(m01 m2 ) = = (l10 m1 )(m2 m02 ) + (l20 m2 )(m01 m2 ) = (l10 m02 + l20 m01 )m1 m2 , (l1 l2 )(m01 m02 ) = (l1 m01 )(l2 m02 ) = (l10 m1 )(l20 m2 ) = (l10 l20 )(m1 m2 ), (l1 m2 + l2 m1 , m1 m2 )R(l10 m02 + l20 m01 , m01 m02 ) 13 i (l1 l2 , m1 m2 )R(l10 l20 , m01 m02 ). Wiedząc, że definicje są poprawne możemy zając się aksjomatami ciała. Dla przykładu wykażemy łączność dodawania. ([l1 , m1 ] + [l2 , m2 ]) + [l3 , m3 ] = [l1 m2 + l2 m1 , m1 m2 ][l3 , m3 ] = = [l1 m2 m3 + m1 l2 m3 + m1 m2 l3 , m1 m2 m3 ]. Elementy neutralne: 0 = [0, 1] i 1 = [1, 1]. Zamiast [l, m] piszemy l/m. l1 l2 l1 m2 + l2 m1 + = , m1 m2 m1 m2 l1 l2 l1 l2 · = . m1 m2 m1 m2 Przekształcenie Z → Q, n → n/1 jest różnowartościowe i zachowuje działania (n/1) + (m/1) = (n + m)/1, (n/1)(m/1) = (nm)/1. Uwaga. Podobnie możemy zbudować Z wychodząc z N. W tym celu w zbiorze N × N określamy relację: (m, n)R(n0 m0 ) ⇔ m + n0 = m0 + n oraz działania: [m, n] + [k, l] = [m + k, n + l], [m, n][k, l] = [mk + nl, ml + nk]. Pierścień Zn Niech n będzie dodatnią liczbą całkowitą, a (a)n niech oznacza resztę z dzielenia a przez n (niektórzy stosują oznaczenie a mod n). Zn = {0, 1, 2, ..., n − 1}. Działania. Jeśli a, b ∈ Zn , to a ⊕ b = (a + b)n , a b = (ab)n . Twierdzenie. Zn jest pierścieniem. Dowód. Zaczniemy od kilku faktów. u≡v (t)n ≡ t (mod n) ⇔ n|u − v ⇔ n|(u)n − (v)n ⇔ (u)n ≡ (v)n (mod n) ⇒ s + (t)n ≡ s + t (mod n) ⇒ (s + (t)n )n = (s + t)n , i (mod n). s(t)n ≡ st (mod n) (s(t)n )n = (st)n . Teraz możemy sprawdzić własności pierścienia (a, b, c ∈ Zn ). • (a ⊕ b) ⊕ c = ((a + b)n + c)n = (a + b + c)n = (a + (b + c)n )n = a ⊕ (b ⊕ c) • (a ⊕ b) = (a + b)n = (b + a)n = b ⊕ a • a ⊕ 0 = (a + 0)n = (a)n = a • 0 ⊕ 0 = (0 + 0)n = (0)n = 0 a ⊕ (n − a) = (a + n − a)n = (n)n = 0, a 6= 0 • (a b) c = ((ab)n )c)n = (abc)n = (a(bc)n )n = a (b c) 14 • (a b) = (ab)n = (ba)n = b a • a 1 = (a1)n = (a)n = a • a (b ⊕ c) = (a(b + c)n )n = (a(b + c)n )n = (a(b + c))n = = (ab + ac)n = ((ab)n + (ac)n )n = a b ⊕ a c Tabelki działań. 0 1 Z2 ⊕ 0 1 0 0 1 1 1 0 Z3 ⊕ 0 1 2 0 0 1 2 1 1 2 0 2 2 0 1 Z4 ⊕ 0 1 2 3 0 0 1 2 3 1 1 2 3 0 2 2 2 0 1 0 0 0 1 0 1 0 1 2 0 0 0 0 1 0 1 2 2 0 2 1 0 1 2 3 0 0 0 0 0 1 0 1 2 3 3 3 0 1 2 2 0 2 0 2 3 0 3 2 1 Twierdzenie. Pierścień Zn jest ciałem wtedy i tylko wtedy, gdy n jest liczbą pierwszą. Dowód. Jeśli n = ab, gdzie 0 < a, b < n, to a, b ∈ Zn , a, b 6= 0 i a b = 0. Dlatego Zn nie jest ciałem. Załóżmy teraz, że n jest liczbą pierwszą, a ∈ Zn , a 6= 0. Znajdziemy takie liczby całkowite x, y, że ax + ny = 1. Jeśli b = (x)n , to b ∈ Zn i a b = (ab)n = (a(x)n )n = (ax)n = 1. Definicja. Jeśli 1 + 1 + ... + 1 = 0 (suma n jedynek) to mówimy, że ciało ma charakterystykę n. Jeśli takiego n nie ma, mówimy, że ciało ma charakterystykę 0. Q ma charakterystykę 0. Zp ma charakterystykę p. Definicja. Niech K będzie ciałem, a L co najmniej 2-elementowym podzbiorem K. L nazywamy podciałem K (lub K rozszerzeniem L), jeśli • a, b ∈ L ⇒ a + b, ab ∈ L, • a ∈ L ⇒ −a ∈ L. • a ∈ L i a 6= 0 ⇒ a−1 L. Uwaga. Zbiór L z działaniami przeniesionymi z ciała K jest ciałem. Liczby rzeczywiste Ułamki można uporządkować: a/b > 0 ⇔ a > 0 i b > 0 lub a < 0 i b < 0. 15 Ciało liczb rzeczywistych R jest rozszerzeniem ciała liczb wymiernych Q. Liczby rzeczywiste można uporządkować (podzielić na 3 rozłączne podzbiory: {0}, liczby dodatnie i ujemne (przeciwne do dodatnich); suma i iloczyn liczb dodatnich jest dodatni). Nowa własność: każdy niepusty i ograniczony z góry podzbiór R posiada kres górny (najmniejsze górne ograniczenie). Z własności tej wynika, że funkcja ciągła określona na odcinku przyjmuje wartości pośrednie (twierdzenie Bolzano). W szczególności istnieją pierwiastki dowolnego stopnia z liczb nieujemnych. Liczby rzeczywiste można skonstruować wychodząc z liczb wymiernych (przekroje Dedekinda lub ciągi Cauchy’ego). Liczby zespolone Liczby zespolone uzyskujemy rozszerzając liczby rzeczywiste o symbol i taki, że i2 = −1. Konstrukcja liczb zespolonych. Niech C będzie zbiorem wszystkich par liczb rzeczywistych. W zbiorze C definiujemy dwa działania: • (a, b) + (c, d) = (a + c, b + d) • (a, b)(c, d) = (ac − bd, ad + bc) Twierdzenie. Zbiór C jest ciałem. Dowód. Należy sprawdzić wszystkie własności ciała. Jedynym trudniejszym miejscem jest wskazanie liczby odwrotnej. Liczbą odwrotną do liczby (a, b) 6= (0, 0) jest liczba −b a , 2 2 2 a + b a + b2 ! Liczby postaci (a, 0) utożsamiamy z liczbami rzeczywistymi: (a, 0) + (b, 0) = (a + b, 0), (a, 0)(b, 0) = (ab, 0). Literą i oznaczamy liczbę (0, 1). Możemy teraz napisać w tradycyjny sposób (a, b) = (a, 0) + (b, 0)(0, 1) = a + bi. (a + bi) + (c + di) = (a + c) + (b + d)i, (a + bi)(c + di) = (ac − bd) + (ac + bd)i, a b 1 − 2 i. = 2 2 a + bi a +b a + b2 Definicja. a nazywamy częścią rzeczywistą liczby zespolonej a + bi, a b częścią urojoną. Piszemy a = <(a + bi), b = =(a + bi). √ Definicja. Modułem liczby zespolonej nazywamy liczbę |a + bi| = a2 + b2 . Definicja. z = a − bi nazywamy liczbą sprzężoną do liczby z = a + bi. Stwierdzenie. 16 • z + w = z + w, • zw = zw, z − w = z − w, z/w = z/w (w 6= 0), • zz = |z|2 , • |z| = 0 ⇔ z = 0, • <z = (z + z)/2, =z = (z − z)/(2i), |<z|, |=z| ¬ |z|, • |zw| = |z||w|. Dowód. |zw|2 = (zw)zw = (zw)(zw) = (zz)(ww) = |z|2 |w|2 . Dlatego |zw| = |z||w|. • |z/w| = |z|/|w|, w 6= 0 • |z + w| ¬ |z| + |w|. Dowód. |z + w|2 = (z + w)(z + w) = |z|2 + |w|2 + zw + wz. Ale (zw + wz)/2 = <(zw) ¬ |zw| = |z||w|. Dlatego |z + w|2 ¬ |z|2 + |w|2 + 2|z||w| = (|z| + |w|)2 i |z + w| ¬ |z| + |w|. • |z − w| jest odległością punktu z od punktu w. 1. |z − w| 0, |z − w| = 0 ⇔ z = w 2. |z − w| = |w − z| 3. |z − w| ¬ |z − u| + |u − w| Uwaga. Liczb zespolonych nie można uporządkować tak jak Z,Q,R. Postać trygonometryczna liczby zespolonej i obroty z = a + bi = r(cos θ + i sin θ), r = |z| Niech z = cos φ + i sin φ. Przekształcenie w → zw jest izometrią. Mamy bowiem |zw − zu| = |z||w − u| = |w − u|. Jeśli z = 1, przekształcenie jest identycznością, w przeciwnym wypadku przekształcenie posiada dokładnie jeden punkt stały 0. Mnożenie przez z = cos φ + i sin φ jest więc obrotem, jak ławo zauważyć o kąt φ. Złożenie dwóch obrotów o kąty φ i ψ jest obrotem o kąt φ + ψ. Stąd (cos φ + i sin φ)(cos ψ + i sin ψ) = cos(φ + ψ) + i sin(φ + ψ). Porównując części rzeczywiste i urojone po obu stronach równania otrzymujemy wzory trygonometryczne cos(φ + ψ) = cos φ cos ψ − sin φ sin ψ, sin(φ + ψ) = sin φ cos ψ + cos φ sin ψ. 17 Składając n obrotów o kąt θ otrzymujemy obrót o kąt nθ. (cos θ + i sin θ)n = cos nθ + i sin nθ. Wynika stąd, że rozwiązaniami równania zn = 1 są liczby leżące w wierzchołkach n-kąta foremnego z = cos 2kπ/n + i sin 2kπ/n, k = 0, 1, ..., n − 1. Rozwiązaniami nieco ogólniejszego równania z n = r(cos ψ + i sin ψ) są liczby z= = √ n r [cos(2kπ + ψ)/n + i sin(2kπ + ψ)/n] = √ n r(cos ψ/n + i sin ψ/n)(cos 2kπ/n + i sin 2kπ/n), k = 0, 1, ..., n − 1. Izometrie płaszczyzny Definicja. Przekształcenie płaszczyzny w płaszczyznę zachowujące odległość nazywamy izometrią płaszczyzny. Twierdzenie. 1. Identyczność jest izometrią. Złożenie dwóch izometrii jest izometrią. Izometrie są odwracalne (wniosek z punktu 9). Przekształcenie odwrotne do izometrii jest izometrią. Zatem izometrie tworzą grupę przekształceń. 2. Symetria osiowa jest izometrią. Punkty leżące na osi są punktami stałymi symetrii osiowej. Przekształceniem odwrotnym do symetrii osiowej jest ta sama symetria. 3. Złożenie dwóch symetrii osiowych o osiach równoległych jest przesunięciem. Jeśli osie są różne, to przesunięcie nie ma punktów stałych. 4. Złożenie dwóch symetrii osiowych o przecinających się osiach jest obrotem. 5. Złożenie 3 symetrii osiowych jest symetrią osiową lub symetrią osiową z poślizgiem (złożeniem symetrii osiowej i przesunięcia wzdłuż osi). 6. Izometria posiadająca 3 niewspółliniowe punkty stałe jest identycznością. 7. Izometria zachowująca dwa różne punkty jest identycznością lub symetrią osiową względem prostej przechodzącej przez te punkty. 8. Izometria zachowująca punkt jest identycznością, symetrią osiową lub obrotem. 18 9. Każda izometria płaszczyzny jest złożeniem co najwyżej 3 symetrii osiowych. Dowód pkt.6. Niech f będzie rozważaną izometrią. Załóżmy że f (A) = A, f (B) = B, f (C) = C, ale f (X) 6= X. Niech l będzie symetralną odcinka Xf (X). |A − X| = |f (A) − f (X)| = |A − f (X)|, |B − X| = |B − f (B)|, |C − X| = |C − f (C)|. Dlatego A, B, C ∈ l i mamy sprzeczność. Dowód pkt.9. Jeśli f nie jest identycznością, to f (X) 6= X dla pewnego X. Niech l będzie symetralną odcinka Xf (X), a S1 symetrią osiową względem l. S1 ◦f (X) = X i dlatego S1 ◦ f = id, S1 ◦ f = S2 lub S1 ◦ f = S2 ◦ S3 czyli f = S1 , f = S1 ◦ S2 lub f = S1 ◦ S2 ◦ S3 . Wielomiany O wielomianach często wygodniej jest myśleć jak o wyrażeniach, w których x jest pewnym symbolem niż jak o funkcjach. Definicja. Wielomianem nazywamy nieskończony ciąg f = (f0 , f1 , f2 , ...) o elementach należących do pewnego pierścienia przemiennego z jednością taki, że tylko skończona liczba wyrazów jest niezerowa. Dodawanie i mnożenie wielomianów. Niech f = (f0 , f1 , f2 , ...), g = (g1 , g2 , g3 , ...). Wielomian h = (h0 , h1 , h2 , ...) jest sumą wielomianów f, g (h = f + g), jeśli hi = fi + gi dla i = 0, 1, 2, .... Wielomian h = (h0 , h1 , h2 , ...) jest iloczynem wielomianów f, g (h = f g), jeśli hi = f0 gi + f1 gi−1 + f2 gi−2 + ... + f0 gi , dla i = 1, 2, 3, .... Uwaga. Definicje działań są poprawne. Suma i iloczyn wielomianów są wielomianami (tzn. otrzymane ciągi mają tylko skończoną liczbę niezerowych wyrazów). Twierdzenie. Wielomiany z dodawaniem i mnożeniem tworzą pierścień przemienny z jednością. Dowód polega na sprawdzeniu wszystkich własności pierścienia. Zapewne najtrudniejsze jest sprawdzenie łączności mnożenia. W tym miejscu odnotujemy tylko, że jeśli w = (f g)h lub w = f (gh) i w = (w0 , w1 , w2 , ...), to wm = X fi gj hk . 0¬i,j,k, i+j+k=m Definicja. Wielomianem zerowym nazywamy wielomian 0 = (0, 0, 0, ....). Definicja Niech f = (f0 , f1 , f2 , ...) będzie wielomianem niezerowym. Liczbę n nazywamy stopniem wielomianu f jeśli fn 6= 0 i fi = 0 dla i > n. Stopień wielomianu zerowego określamy jako −∞, n + (−∞) = −∞, (−∞) + (−∞) = −∞, max(n, −∞) = n. Stopień f będziemy oznaczać st f . Twierdzenie. Niech f, g będą wielomianami. Mamy st (f + g) ¬ max(st f, st g), st (f g) ¬ st f + st g. 19 Jeśli pierścień, z którego brane są współczynniki wielomianów nie ma dzielników zera (tak jest w przypadku Z lub w przypadku dowolnego ciała), to iloczyn niezerowych wielomianów jest niezerowy i st (f g) = st f + st g. Wielomiany postaci (a, 0, 0, 0, ...) nazywamy wielomianami stałymi. Przekształcenie a → (a, 0, 0, 0, ...) jest różnowartościowe i zachowuje działania. Od tej pory wielomiany stałe będziemy utożsamiać z elementami pierścienia. Jeśli symbolem x oznaczymy wielomian (0, 1, 0, 0, 0, ...), to otrzymamy tradycyjną notację (a0 , a1 , a2 , a3 , ..., an , 0, 0, ) = a0 + a1 x + a2 x2 + · · · + an xn . Traktowanie x jako symbolu, a wielomianów jako napisów umożliwia rozpatrywanie wielomianów o współczynnikach np. z pierścienia Zn . Jeśli a0 , a1 , a2 , ... ∈ K (K oznacza ustalony pierścień), to będziemy pisać a0 + a1 x + a2 x2 + ... + an xn ∈ K[x]. Mamy więc (m ¬ n) (f0 + f1 x + f2 x2 + ... + fn xn ) + (g0 + g1 x + g2 x2 + · · · + gm xm ) = = (f0 + g0 ) + (f1 + g1 )x + (f2 + g2 )x2 + · · · + (fn + gn )xn . (f0 + f1 x + f2 x2 + · · · + fn xn )(g0 + g1 x + g2 x2 + · · · + gm xm ) = = f0 g0 + (f0 g1 + f1 g0 )x + (f0 g2 + f1 g1 + f2 g0 )x2 + · · · + fn gm xn+m . Definicja. Wartością wielomianu f = f0 + f1 x + · · · + fn xn ∈ K[x] w punkcie a ∈ K nazywamy element f (a) = f0 + f1 a + · · · + fn an ∈ K. Definicja. Element a taki, że f (a) = 0 nazywamy pierwiastkiem f . Twierdzenie (Bézout). Jeśli f ∈ K[x], f 6= 0 i f (a) = 0 dla a ∈ K, to f = (x − a)h dla pewnego h ∈ K[x]. Dowód. f (x) − f (a) = (f0 + f1 x + f2 x2 + · · · + fn xn ) − (f0 + f1 a + f2 a2 + · · · + fn an ) = = f1 · (x − a) + f2 · (x2 − a2 ) + f3 · (x3 − a3 ) + · · · + fn · (xn − an ) = = (x − a)[f1 + f2 · (x + a) + f3 · (x2 + xa + a2 ) + · · · + fn · (xn−1 + xn−2 a + · · · + an−1 )] = = (x − a)(h0 + h1 x + · · · + hn−1 xn−1 ). Współczynniki h spełniają relacje (schemat Hornera) hn−1 = fn , hn−2 = ahn−1 + fn−1 , hn−3 = ahn−2 + fn−2 , ... h0 = ah1 + f1 . Na koniec f (a) = ah0 + f0 . Przykład. f (x) = 3x4 + 2x3 + 5x2 + x + 7 = (x − 2)(h0 + h1 x + h2 x2 + h3 x3 ) + f (2). h3 = 3, h2 = 2 · 3 + 2 = 8, h0 = 2 · 21 + 1 = 43, h1 = 2 · 8 + 5 = 21, f (2) = 2 · 43 + 7 = 93. 20 Twierdzenie. Jeśli f ∈ K[x], f 6= 0, f (a1 ) = f (a2 ) = ... = f (an ) = 0, a elementy a1 , a2 , ..., an ∈ K są różne, to f = (x − a1 )(x − a2 )...(x − an )h dla pewnego h ∈ K[x]. Dowód przez indukcję. Stosujemy dopiero co udowodnione twierdzenie. Wniosek. Jeśli f ∈ K[x], f 6= 0, f (a1 ) = f (a2 ) = ... = f (an ) = 0, a elementy a1 , a2 , ..., an ∈ K są różne, to stopień f wynosi co najmniej n. Odwrotnie, wielomian f stopnia n nie może mieć więcej niż n różnych pierwiastków. Definicja. a ∈ K nazywamy pierwiastkiem k-krotnym wielomianu f ∈ K[x], jeśli istnieje h ∈ K[x] taki, że f = (x − a)k h i h(a) 6= 0. Twierdzenie. Jeśli a1 , a2 , ..., am ∈ K są odpowiednio k1 , k2 , ..., km krotnymi różnymi pierwiastkami f , to f = (x−a1 )k1 (x−a2 )k2 ...(x−am )km h dla pewnego h ∈ K[x]. Wniosek. Jeśli a1 , a2 , ..., am ∈ K są odpowiednio k1 , k2 , ..., km krotnymi różnymi pierwiastkami f ∈ K[x] i f 6= 0, to stopień f wynosi co najmniej k1 + k2 + · · · + km . Definicja. Niech f ∈ K[x]. Funkcję a → f (a) nazywamy funkcją wielomianową. W przypadku ciał skończonych każda funkcja jest funkcją wielomianową. Twierdzenie. Jeśli a → f (a) jest funkcją wielomianową, a zbiór argumentów jest nieskończony, to wielomian f jest określony jednoznacznie. Dowód. Załóżmy, że f i h są wielomianami i f (a) = h(a) dla każdego a. Niech n będzie większym ze stopni f, h. Wielomian f − h ma więcej niż n różnych pierwiastków, nie może być więc wielomianem niezerowym. Musi więc zachodzić równość f = h. Pierwiastki wymierne Twierdzenie. Jeśli f = f0 +f1 x+· · ·+fn xn ∈ Z[x], p, q ∈ Z, q 6= 0, N W D(p, q) = 1 i f (p/q) = 0, to p|f0 , a q|fn . Dowód. 0 = q n f (p/q) = f0 q n + f1 pq n−1 + · · · + fn−1 pn−1 q + fn pn . Widzimy, że p|f0 q n , ale NWD(p,q)=1 i dlatego p|f0 . Podobnie q|fn . Przykład. f = x3 − 3x2 + 2x − 6. Możemy próbować q = 1, p = ±1, ±2, ±3, ±6. Faktycznie f (3) = 0. f (x) = f (x) − f (3) = (x3 − 33 ) − 3(x2 − 32 ) + 2(x − 3) = = (x − 3)[(x2 + 3x + 32 ) − 3(x + 3) + 2] = (x − 3)(x2 + 2). Podzielność wielomianów Rozważamy wielomiany o współczynnikach z pewnego ciała P . Definicja. Mówimy, że wielomian f ∈ P [x] dzieli wielomian g ∈ P [x] jeśli istnieje wielomian h ∈ P [x] taki, że g = f h. Piszemy f |g. Każdy wielomian dzieli się przez wielomian stały różny od zerowego. 21 Twierdzenie. Wielomiany, podobnie jak liczby całkowite, można dzielić z resztą. Jeśli f, g ∈ P [x], g 6= 0, to istnieją wielomiany h, r ∈ P [x] takie, że f = hg + r, st r < st g. Wielomiany h, r są określone jednoznacznie. Dowód przez indukcję. Niech g = gm xm + · · · + g1 x + g0 , gm 6= 0. Jeśli st f = k < st g, to przyjmujemy h = 0 i r = f . Załóżmy teraz, że twierdzenie jest prawdziwe dla każdego k < n (m ¬ n) i st f = n, f = fn xn + · · · + f1 + f0 . Wtedy st (f − (fn /gm )xn−m g) < n i z założenia indukcyjnego wynika, że f − (fn /gm )xn−m g = hg + r, dla pewnych h, r ∈ P [x], st r < m. Stąd f = ((fn /gm )xn−m + h)g + r i twierdzenie jest prawdziwe dla n. Jednoznaczność. Jeśli f = hg + r = h0 g + r0 , to (h − h0 )g = r0 − r i st (r0 − r) < m. W przypadku h 6= h0 , st (h − h0 )g m i mamy sprzeczność. Dlatego h0 = h i r0 = r. Dowód pokazuje jak dzielić wielomiany z resztą. Przykład. f = x4 + 8x3 + 18x2 + 16x + 9, g = x2 + 3x + 2, f − x2 g = 5x3 + 16x2 + 16x + 9, (5x3 + 16x2 + 16x + 9) − 5xg = x2 + 6x + 9, (x2 + 6x + 9) − g = 3x = 7, h = x2 + 5x + 1, r = 3x + 7. Definicja. Największym wspólnym dzielnikiem wielomianów f, g, z których co najmniej jeden jest niezerowy, nazywamy wielomian d taki, że • d|f i d|g, • dla każdego h ∈ P [x] ( h|f i h|g ⇒ h|d ). Uwaga. Taką samą definicję można przyjąć w przypadku liczb całkowitych. Pojawia się jednak pewna niejednoznaczność. W przypadku liczb całkowitych: jeśli d spełnia oba warunki, to −d też spełnia oba warunki. W przypadku wielomianów: jeśli d spełnia oba warunki, to cd też spełnia oba warunki (c ∈ P, c 6= 0). Niejednoznaczności można się pozbyć zakładając w przypadku liczb całkowitych, że NWD jest liczbą dodatnią, a w przypadku wielomianów, że NWD jest wielomianem unormowanym (mającym współczynnik 1 przy najwyższej potędze x). Udowodnimy teraz istnienie NWD dwóch wielomianów. Algorytm Euklidesa. r0 = f, r1 = g. r0 = k1 r1 + r2 , r1 = k2 r2 + r3 , ······ rl−2 = kl−1 rl−1 + rl , 22 rl−1 = kl rl + 0. st r1 > st r2 > st r3 > · · ·. Dlatego dla pewnego l rl 6= 0 i rl+1 = 0. d = rl |rl−1 ⇒ d|rl−2 ⇒ · · · ⇒ d|r1 = g ⇒ d|r0 = f. h|f = r0 , h|g = r1 ⇒ h|r2 ⇒ h|r3 · · · ⇒ h|rl = d. Dlatego d jest największym wspólnym dzielnikiem wielomianów f, g. Algorytm Euklidesa pozwala znaleźć dwa wielomiany α, β ∈ P [x] takie, że αf + βg = d. Powyższe równanie rozwiązujemy dokładnie tak samo, jak w przypadku liczb całkowitych, mamy też dokładnie takie same wnioski. Iloczyn wielomianów niezerowych jest niezerowy (rozważamy wielomiany o współczynnikach z pewnego ciała P ). Dlatego wychodząc z pierścienia wielomianów możemy skonstruować ciało ułamków (ciało funkcji wymiernych). Twierdzenie. Niech f = f1a1 f2a2 · · · fkak , f1 , . . . , fk , w ∈ P [x], N W D(fi , fj ) = 1 (i 6= j). Wtedy ak k X X wij w = w0 + j , f i=1 j=1 fi w0 , wij ∈ P [x], st wij < st fi . W przypadku, gdy wielomiany f1 , . . . , fk są nierozkładalne, mówimy o rozkładzie na ułamki proste. ak−1 Dowód. Niech g = f1a1 f2a2 · · · fk−1 . Wtedy N W D(fkak , g) = 1 ak i αfk + βg = 1 dla pewnych α, β ∈ P [x]. Stąd w w(αfkak + βg) wα wβ + ak . = = ak ak gfk gfk g fk Wykorzystując wielokrotnie ten pomysł, otrzymujemy w1 w w2 wk = a1 + a2 + · · · + ak , f f1 f2 fk Na koniec wi = u0 + u1 fi + u2 fi2 + · · · + um fim , st u0 , u1 , ..., um < st fi . Wystarczy aby wi = k1 fi + u0 , k1 = k2 fi + u1 , u2 = k3 fi + u2 , ... km = um . Wtedy wi u0 u1 u2 ua−1 = a + a−1 + a−2 + · · · + + ua + · · · + um fim−a . a fi fi fi fi fi W przypadku ciała C wielomiany nierozkładalne mają stopień 0 lub 1, a w przypadku ciała R wielomiany nierozkładalne mają stopień 0, 1 lub 2. Przykład. 1 1 1 = − . x(x + 1) x x+1 23 Zastosowanie. Metoda. 1 1 1 1 + + ··· + =1− . 1·2 2·3 (n − 1)n n x2 + 3x + 2 A Bx + C = + 2 . 2 x(x + 1) x x +1 Stąd x2 + 3x + 2 = A(x2 + 1) + (Bx + C)x, A = 2, B = −1, C = 3. Pierwiastki rzeczywiste Twierdzenie. Każdy wielomian o współczynnikach rzeczywistych stopnia nieparzystego posiada pierwiastek rzeczywisty. Dowód. Rozważamy wielomian f (t) = an tn + · · · + a1 t + a0 , an > 0. Zakładamy, że n jest liczbą nieparzystą. Jeśli t > 1 i t > (|a0 | + |a1 | + · · · + |an−1 |)/an , to f (t) an tn − (|a0 | + |a1 |t + · · · + |an−1 |tn−1 ) an tn − (|a0 | + |a1 | + · · · + |an−1 |)tn−1 > 0. Jeśli natomiast t < −1 i t < −(|a0 | + |a1 | + · · · + |an−1 |)/an , to f (t) ¬ an tn + (|a0 | + |a1 ||t| + · · · + |an−1 ||t|n−1 ) ¬ ¬ an tn + (|a0 | + |a1 | + · · · + |an−1 |)tn−1 < 0. (pamiętamy, że n jest liczbą nieparzystą!) Ponieważ funkcja t → f (t) jest ciągła, więc z twierdzenia Bolzano wynika, że dla pewnego t f (t) = 0. Zasadnicze twierdzenie algebry Twierdzenie. Każdy wielomian o współczynnikach zespolonych stopnia większego od zera posiada pierwiastek zespolony. Dowód. Niech f (z) = a0 + a1 z + · · · + an z n , n > 0, an ∈ C, an 6= 0. Pokażemy, że istnieje punkt w taki, że dla każdego z |f (w)| ¬ |f (z)| . Następnie pokażemy, że założenie |f (w)| > 0 prowadzi do sprzeczności. |f (z)| = |a0 + a1 z + · · · + an z n | |an ||z|n − |a0 | − |a1 ||z| − · · · − |an−1 ||z|n−1 |an ||z|n − ( |a0 | + |a1 | + · · · + |an−1 | )|z|n−1 , dla |z| 1. Niech r = max (1, (2|a0 | + |a1 | + · · · + |an−1 |)/|an | ). Wtedy dla |z| r |f (z)| |an ||z| − (|a0 | + |a1 | + · · · + |an−1 |)|z|n−1 |a0 ||z|n−1 |a0 | = |f (0)|. Teraz potrzebujemy kilku faktów z analizy matematycznej. 24 • Koło domknięte jest zbiorem ograniczonym i domkniętym (w naszym przypadku koło K o środku 0 i promieniu r). • Domknięty i ograniczony podzbiór Rn jest zwarty (C utożsamiamy z R2 ). • Funkcja z → |f (z)| jest ciągła. • Funkcja ciągła o wartościach rzeczywistych określona na zbiorze zwartym osiąga swoje kresy. Wniosek. Istnieje punkt w ∈ K taki, że dla z ∈ K |f (w)| ¬ |f (z)|. Jeśli |z| r, to |f (z)| |f (0)| |f (w)|. Stąd dla każdego z |f (z)| |f (w)|. Pokażemy teraz, że |f (w)| = 0 czyli f (z) = 0. Załóżmy, że |f (w)| > 0. Niech f (w + z) = b0 + bk z k + bk+1 z k+1 + · · · + bn z n , b0 , bk 6= 0. Wtedy dla |z| ¬ 1 mamy |f (w + z)| ¬ |b0 + bk z k | + |bk+1 ||z|k+1 + · · · + |bn ||z|n | ¬ ¬ |b0 + bk z k | + (|bk+1 | + · · · + |bn |)|z|k+1 . Niech −b0 /bk = |b0 /bk |(cos θ + i sin θ). Wtedy dla 0 < r < 1 mamy |f (w + r(cos θ/k + i sin θ/k))| ¬ ¬ |b0 | 1 − |bk /b0 |rk + (|bk+1 | + · · · + |bn |)rk+1 . Dlatego dla odpowiednio małego r > 0 prawa strona nierówności jest mniejsza od |b0 | = |f (w)| i mamy sprzeczność: |f (w + r(cos θ/k + i sin θ/k))| < |f (w)|. Wniosek. Wielomian f o współczynnikach zespolonych stopnia n można zapisać w postaci f (x) = a(x − z1 )(x − z2 ) · · · (x − zn ). Dowód indukcyjny. Jeśli f jest wielomianem stałym, to wniosek jest oczywisty. Załóżmy, że wniosek jest prawdziwy dla n i st f = n + 1. Wtedy dla pewnego zn+1 f (zn+1 ) = 0 i z twierdzenia Bézout wynika, że f (x) = (x − zn−1 )h(x), st h = n. Z założenia indukcyjnego h ma postać h(x) = a(x − z1 )(x − z2 ) · · · (x − zn ). Dlatego f ma postać f (x) = a(x − z1 )(x − z2 ) · · · (x − zn )(x − zn+1 ). Uwaga. Jeśli z jest pierwiastkiem wielomianu f o współczynnikach rzeczywistych, to z też jest pierwiastkiem wielomianu f . 25 Dowód. f (z) = a0 + a1 z + · · · + an z n = a0 + a1 z + · · · + an z n = f (z). Dlatego jeśli f (z) = 0, to f (z) = f (z) = 0. Wniosek. Wielomian f o współczynnikach rzeczywistych można zapisać w postaci 2 ], f (x) = a(x − x1 )(x − x2 ) · · · (x − xk )[(x − p1 )2 + q12 ][(x − p2 )2 + q22 ] · · · [(x − pm )2 + qm gdzie a, x1 , . . . , xk , p1 , . . . , pm , q1 , . . . , qm ∈ R. Dowód indukcyjny podobny do dowodu poprzedniego wniosku. Zauważmy tylko, że jeśli p + iq (q 6= 0) jest pierwiastkiem niezerowego wielomianu f o współczynnikach rzeczywistych, to wielomian f dzieli się przez wielomian kwadratowy (x − p − iq)(x − p + iq) = (x − p)2 + q 2 . Postać kanoniczna. W wielu przypadkach wielomian f = ax2 + bx + c współczynnikach rzeczywistych wygodnie jest zapisać w postaci b f = ax2 + bx + c = a x + 2a !2 b2 − 4ac − = a(x − p)2 + r. (2a)2 Jeśli b2 − 4ac 0, to wielomian f ma pierwiastki rzeczywiste √ −b ± b2 − 4ac x1,2 = . 2a Równania Rozważamy równanie a0 + a1 x + a2 x2 + an−1 xn−1 + an xn = 0, an 6= 0. Dzieląc równanie przez an otrzymujemy równanie (a0 /an ) + (a1 /an )x + · · · + a2 x2 + (an−1 /an )xn−1 + xn = 0, an 6= 0. Możemy więc nie zmniejszając ogólności rozważań ograniczyć się do równań postaci a0 + a1 x + a2 x2 + an−1 xn−1 + xn = 0. Zapisując x w postaci x = y − an−1 /n otrzymujemy równanie postaci b0 + b1 y + · · · + bn2 y n−2 + y n = 0. W szczególności dla n = 2 i n = 3 mamy x = y − a1 /2, x = y − a2 /3, x2 + a1 x + a0 = y 2 + (a0 − a21 /2), x3 + a2 x2 + a1 x + a0 = y 3 + (a1 − a22 /3)y + (a0 + 2a32 /27). 26 Równanie 3 stopnia Rozważamy równanie x3 + ax + b = 0. Szukamy rozwiązań w postaci sumy x = u + v. (u + v)3 + a(u + v) + b = u3 + v 3 + (u + v)(3uv + a) + b. Widzimy, że wystarczy aby 3 u + v3 + b = 0 3uv + a = 0 u3 , v 3 są pierwiastkami równania kwadratowego 0 = (t − u3 )(t − v 3 ) = t2 + bt − a3 /27. u, v należy tak dobrać, aby uv = −a/3. Uwaga. Możemy też wyjść z tożsamości x3 − u3 − v 3 − 3uvx = (x − u − v)(x − ξu − ξ 2 v)(x − ξ 2 u − ξv), √ ξ = −1/2 + i 3/2. Przykład. x3 − 3x − 18 = 0. x = u + v, u3 + v 3 = 18, uv = 1, √ t2 − 18t + 1 = 0, t = 9 ± 80, q q √ √ 3 3 x1 = 9 + 80 + 9 − 80, q q √ √ 3 3 x2 = ξ 9 + 80 + ξ 2 9 − 80, q q √ √ 3 2 3 x3 = ξ 9 + 80 + ξ 9 − 80, Nasze równanie ma 1 pierwiastek rzeczywisty x1 i dwa zespolone x2 , x3 . Zauważmy, że x3 − 3x − 18 = (x − 3)(x2 + 3x + 6). √ Dlatego x1 = 3, x2 , x3 = (−3 ± i 15)/2 (prostsza postać). Równanie 4 stopnia Rozważamy równanie x4 + ax2 + bx + c = 0. Aby rozwiązać równanie wystarczy lewą stronę równania zapisać w postaci iloczynu 2 wielomianów kwadratowych (x2 + px + q−r 2 q+r q 2 − r2 )(x − px + ) = x4 + (q − p2 )x + pr + . 2 2 4 27 Pozostaje znaleźć p, q, r. q − a = p2 q 2 − 4c = r2 pr = b (q − a)(q 2 − 4c) = b2 . Problem sprowadza się do rozwiązania równania 3 stopnia z niewiadomą p. Uwaga. Przypadki, kiedy b = 0 lub c = 0 są prostsze. Przykład. x4 + 3x2 + 6x + 10 = 0, (q − 3)(q 2 − 40) = 36, np. q = 7, p = 2, x4 + 3x2 + 6x + 10 = (x2 + 2x + 2)(x2 − 2x + 5), r = 3, x = −1 ± i, 1 ± 2i. Równania symetryczne Przykład ilustrujący zasadę. x4 + ax3 + bx2 + ax + 1 = 0. Dzielimy obie strony równania przez x2 . (x2 + 1 1 ) + a(x + ) + b. x2 x Wprowadzamy nową zmienną y = x + 1/x. Równanie zamienia się w równanie y 2 + ay + b − 2 = 0. W przypadku równań nieparzystego stopnia wydzielamy czynnik (x + 1). Drugi czynnik jest symetryczny. x5 + ax4 + bx3 + bx2 + ax + 1 = (x + 1)[x4 + (a − 1)x3 + (b − a + 1)x2 + (a − 1)x + 1] Przykład z listy zadań (z 5 = 1). z 4 + z 3 + z 2 + z + 1 = 0, w = z + 1/z, w2 + w − 1, w = (1 ± √ 5)/2. Dlatego cos 2π/5 = cos 8π/5 = (1 + √ cos 4π/5 = cos 6π/5 = (1 − 5)/4, 28 √ 5)/4, Wielomiany symetryczne W tej części rozpatrujemy wielomiany wielu zmiennych. Na zmienne nadal możemy patrzyć jak na pewne symbole. Definicja. Jednomianem nazywamy wyrażenie axk11 xk22 · · · xknn . Stopniem jednomianu jest suma k1 +k2 +· · ·+kn . Stopniem wielomianu n zmiennych jest największy ze stopni jednomianów występujących w zapisie wielomianu. Rozważmy wielomian n + 1 zmiennych (t − x1 )(t − x2 ) · · · (t − xn ) = tn − σ1 tn−1 + σ2 tn−2 + · · · + (−)n σn . Powyższa równość definiuje zbiór wielomianów n zmiennych σk = σk (x1 , x2 , . . . , xn ) = X xi 1 xi 2 · · · xi k , k = 1, 2, . . . , n. 1¬i1 <i2 <...<ik ¬n Np. dla n = 3 mamy (t − x)(t − y)(t − z) = t3 − (x + y + z)t2 + (xy + xz + yz)t − xyz = t3 − σ1 t2 + σ2 t − σ3 . Wzory Vieta. Jeśli x1 , x2 , . . . , xn są pierwiastkami wielomianu (m-krotne pierwiastki wypisane są m-krotnie) f = tn + an−1 tn−1 + · · · + a0 , to an−k = (−)k σk (x1 , x2 , . . . , xn ), Definicja. Wielomian f k = 1, 2, . . . , n. n zmiennych nazywa się wielomianem symetrycznym, jeśli f (xi1 , xi2 , . . . , xin ) = f (x1 , x2 , . . . , xn ) dla dowolnej permutacji (i1 , i2 , . . . , ik ) liczb (1, 2, . . . , n). Stwierdzenie. Wielomiany σk są symetryczne. Twierdzenie. Jeśli f jest wielomianem symetrycznym n zmiennych, to f (x1 , x2 , . . . , xk ) = Q(σ1 , σ2 , . . . , σn ), gdzie Q jest pewnym wielomianem n zmiennych o współczynnikach z tego samego pierścienia (ciała), z którego pochodzą współczynniki wielomianu f . Dowód. Indukcja ze względu na liczbę zmiennych n oraz ze względu na stopień wielomianu. Jeśli n = 1, to σ1 (x1 ) = x i f (x1 ) = f (σ1 ). Dla wielomianów zerowych i wielomianów stopnia 0 nie ma czego dowodzić. Od teraz indeks górny przy σ będzie oznaczać liczbę zmiennych. Zachodzą relacje σkn+1 (x1 , x2 , . . . , xn , 0) = σkn (x1 , x2 , . . . , xn ), σkn = 0 dla k > n. Załóżmy, że twierdzenie jest prawdziwe dla n oraz dla n + 1, ale tylko dla wielomianów stopnia mniejszego od k. Pokażemy, że twierdzenie jest prawdziwe dla 29 wielomianów n + 1 zmiennych stopnia k. Niech f będzie takim wielomianem. Wielomian f (x1 , x2 , . . . , xn , 0) jest wielomianem symetrycznym n zmiennych. Z założenia indukcyjnego wynika, że istnieje wielomian Q1 taki, że f (x1 , x2 , . . . , xn , 0) = Q1 (σ1n , σ2n , . . . , σnn ). Wielomian h(x1 , . . . , xn+1 ) = f (x1 , x2 , . . . , xn+1 ) − Q1 (σ1n+1 , σ2n+1 , . . . , σnn+1 ) jest wielomianem symetrycznym n + 1 zmiennych. h(x1 , x2 , . . . , xn , 0) = 0. Z twierdzenia Bezout wynika, że h(x1 , x2 , . . . , xn+1 ) = xn+1 w(x1 , x2 , . . . , xn ). Ze względu na symetrię tak samo jest dla pozostałych zmiennych. Dlatego n+1 h(x1 , x2 , . . . , xn+1 ) = x1 x2 · · · xn+1 g(x1 , x2 , . . . , xn+1 ) = σn+1 g(x1 , x2 , . . . , xn+1 ). Wielomian g jest jest wielomianem symetrycznym n + 1 zmiennych stopnia mniejszego od k. Z założenia indukcyjnego istnieje wielomian Q2 taki, że n n+1 g(x1 , x2 , . . . , xn+1 ) = Q2 (σn+1 , . . . , σn+1 ) Mamy więc oczekiwany wynik n+1 n+1 f (x1 , . . . , xn+1 ) = Q1 (σ1n+1 , . . . , σnn+1 ) + σn+1 Q2 (σ1n , . . . , σn+1 ). Można pokazać, że wielomian Q jest określony jednoznacznie. Przykład. f (x, y, z) = x2 y 2 + x2 z 2 + y 2 z 2 , f (x, y, 0) = x2 y 2 = (σ22 )2 , f (x, y, z) − (σ23 )2 = x2 y 2 + x2 z 2 + y 2 z 2 − (xy + xz + yz)2 = −2xyz(x + y + z), f (x, z, z) = (σ23 )2 − 2σ33 σ13 = (xy + xz + yz)2 − 2xyz(x + y + z). Zdefiniujmy drugi zbiór wielomianów symetrycznych. τk = τk (x1 , x2 , . . . , xk ) = xk1 + xk2 + · · · + xkn , k = 1, 2, 3, . . . Przeprowadźmy pewien rachunek (górny indeks przy σ i τ oznacza liczbę zmiennych). f (t) = tn − σ1n tn−1 + σ2n tn−2 + · · · + (−)n σnn , 0= n X f (xj ) = 0, j = 1, 2, . . . , n. n n f (xi ) = τnn − σ1n τn−1 + σ2n τn−2 + · · · + n(−)n σnn . i=1 Niech m m + · · · + n(−)n σnm . + σ2m τn−2 Pm (x1 , x2 , . . . , xm ) = τnm − σ1m τn−1 Pm (x1 , x2 , . . . , xm ) = Pn (x1 , x2 , . . . , xm , 0, . . . , 0) = 0 dla m < n. Pokażemy, że dla m n Pm = 0. Dowód indukcyjny. Wiemy już, że Pn = 0. Załóżmy, że Pm = 0 (m n). Pm+1 (x1 , x2 , . . . , xm , 0) = Pm (x1 , x2 , . . . , xm ) = 0. 30 Dlatego Pm+1 (x1 , x2 , . . . , xm+1 ) = x1 x2 · · · xm+1 h(x1 , x2 , . . . , xm+1 ). Ale wielomian Pm+1 ma stopień n < m + 1. Dlatego h = 0 i Pm+1 = 0. Zatem dla dowolnej liczby zmiennych zachodzą wzory (górne indeksy pomijamy) Wzory Newtona. 0 = τn − σ1 τn−1 + σ2 τn−2 + · · · + n(−)n σn , σ 1 = τ1 , 2σ2 = τ1 σ1 − τ2 , n = 1, 2, 3, . . . 3σ2 = τ1 σ2 − τ2 σ1 + τ3 , ··· Grupy Definicja. Grupą nazywamy zbiór z działaniem posiadającym 3 własności • a(bc) = (ab)c • Istnieje element e taki, że ae = ea = a • Dla każdego a istnieje b takie, że ab = ba = e Jeśli ab = ba, to grupę nazywamy grupą abelową lub przemienną. Przykłady grup. • Pierścień, w szczególności ciało, z jednym działaniem – dodawaniem (np. Z, Q, R, C, Zn z dodawaniem). • Zbiór elementów niezerowych ciała z jednym działaniem – mnożeniem (np. Q∗ = Q \ {0}, R∗ = R \ {0}, C∗ = C \ {0} z mnożeniem). • Zbiór elementów odwracalnych pierścienia z jednym działaniem – mnożeniem ∗ = {1, 2, 4, 5, 8, 10, 11, 13, 16, 17, 19, 20} z mnożeniem) (np. Z21 • Zbiór dodatnich liczb wymiernych (rzeczywistych) z mnożeniem. • Zbiór liczb zespolonych o module 1. • Zbiór pierwiastków n-tego stopnia z jedności z mnożeniem. Cn = {z ∈ C : z n = 1}. (wszystkie wymienione grupy są abelowe) Uwaga. W definicji grupy wystarczy przyjąć, że istnieje prawostronny element neutralny i prawostronny element odwrotny. • a(bc) = (ab)c • Istnieje element e taki, że ae = a • Dla każdego a istnieje b takie, że ab = e 31 Dowód. Załóżmy, że ab = e. Pokażmy, że ba = e. Niech c będzie elementem odwrotnym do b, tzn.bc = e. Mamy ba = (ba)e = (ba)(bc) = (b(ab))c = (be)c = bc = e. Pokażemy teraz, że ea = a. Niech b będzie elementem odwrotnym do a, tzn. ab = e = ba. Mamy a = a(ba) = (ab)a = ea. Wnioski. • Element neutralny jest jedyny. Dowód. Jeśli e i e0 są elementami neutralnymi, to e0 = ee0 = e. • Element odwrotny do danego elementu jest jedyny. Element odwrotny do a oznaczmy przez a−1 . Dowód. Jeśli ab = e i ac = e, to b = be = b(ac) = (ba)c = ec = c. • (ab)−1 = b−1 a−1 . Dowód. Elementy (ab)−1 i b−1 a−1 są odwrotne do ab. Oznaczenia. Zwykle działania oznaczamy kropką (często pomijaną) lub plusem. W przypadku grup nieprzemiennych używamy kropki. Niech n będzie dodatnią liczbą całkowitą. W zapisie z kropką an oznacza iloczyn n czynników równych a, a0 = e, a−n = (a−1 )n . W zapisie z plusem, na oznacza sumę n składników równych a, 0a = 0 (0 po prawej stronie oznacza element neutralny w grupie), (−n)a = −(na). Przykłady. • G1 = {0, 1, 2, 3} z dodawaniem modulo 4. • G1 = {1, i, −1, −i} z mnożeniem. G1 0 Tabelki działań. 1 2 3 0 0 1 2 3 1 1 2 3 0 2 2 3 0 1 3 3 0 1 2 G2 1 i -1 -i 1 i -1 -i 1 i -1 -i i -1 -i 1 -1 -i 1 i -i 1 i -1 Jeśli w pierwszej tabeli w miejsce 0, 1, 2, 3 wpiszemy 1, i, −1, −i, to otrzymamy drugą tabelę. Opisane przekształcenie możemy zapisać wzorem φ(x) = ix . Przekształcenie φ jest odwracalne i φ(x + y) = φ(x)φ(y) (plus oznacza dodawanie modulo 4). Definicja. Przekształcenie φ grupy G1 w grupę G2 spełniające warunek φ(xy) = φ(x)φ(y) nazywamy homomorfizmem (po lewej stronie mamy działanie w grupie G1 , po prawej stronie działanie w grupie G2 ). Odwracalny homomorfizm nazywamy izomorfizmem. Mówimy wtedy, że grupy G1 i G2 są izomorficzne. Grupy z przykładu są izomorficzne. 32 Grupa przekształceń Definicja. Niech X będzie zbiorem, a G pewnym zbiorem funkcji odwracalnych (bijekcji) przekształcających X na X. G nazywamy grupą przekształceń, jeśli • identyczność ∈ G. • f ∈ G ⇒ f −1 ∈ G. • f, g ∈ G ⇒ f g ∈ G. Stwierdzenie Grupa przekształceń jest grupą (działaniem jest składanie przekształceń). Przykłady 1. Grupa izometrii płaszczyzny. 2. Grupa obrotów płaszczyzny względem ustalonego punktu. 3. Grupa przesunięć. 4. Grupa izometrii danej figury. Twierdzenie (Cayley). Każda grupa jest izomorficzna z pewną grupą przekształceń. Dowód. Niech G będzie grupą i g ∈ G. Definiujemy przekształcenie φg zbioru G w zbiór G: φg (a) = ga, a ∈ G Oznaczmy symbolem G̃ zbiór wszystkich przekształceń tej postaci. Pokażemy, że zbiór G̃ jest grupą przekształceń izomorficzną z G. • φe (a) = ea = a i widzimy, że element neutralny należy do G̃. • Złożenie dwóch przekształceń z G̃ należy do G̃. Mamy bowiem φg fh (a) = φg (ha) = g(ha) = (gh)a = φgh (a) czyli φg φh = φgh . • Dla każdego elementu z G̃ znajdziemy w G̃ element odwrotny. Mamy bowiem φg φg−1 = φgg−1 = φe =identyczność. Zatem G̃ jest grupą przekształceń. • Przekształcenie g → φg z definicji przekształca G na G̃. Pokażemy, że przekształcenie to jest różnowartościowe. Jeśli φg = φh , to g = φg (e) = φh (e) = h. • Przekształcenie jest homomorfizmem: φgh = φg φh . 33 Definicja. Grupę G nazywamy grupą cykliczną, jeśli istnieje element a ∈ G taki, że każdy element G da się przedstawić jako pewna potęga elementu a. Element a nazywamy generatorem grupy G. Grupa Z z dodawaniem jest cykliczna. Grupa Zn z dodawaniem jest cykliczna. Grupa G2 z przykładu jest cykliczna, G2 = {i0 = 1, i, i2 = −1, i3 = −i}. Definicja. Grupą permutacji (grupą symetryczną) nazywamy grupę wszystkich przekształceń odwracalnych (bijekcji) zbioru {1, 2, 3, ..., n} na zbiór {1, 2, 3, ..., n}. Grupę permutacji oznaczamy symbolem Sn . Grupa Sn liczy n! elementów. Element σ ∈ Sn można zapisać w postaci σ= 1 σ1 2 σ2 ... n . .... σn W szczególności 1 2 3 1 2 3 1 2 3 S3 = { , , , 1 2 3 2 1 3 3 2 1 1 2 3 1 2 3 1 2 3 , , }. 1 3 2 2 3 1 3 1 2 Grupa S3 nie jest przemienna. Mamy bowiem 1 2 3 2 1 3 1 2 3 3 2 1 1 2 3 3 2 1 1 2 3 2 1 3 1 2 3 3 1 2 1 2 3 2 3 1 = = Uwaga. Kolumny w nawiasie nie muszą być uporządkowane. σ −1 = σ1 1 σ2 2 .... σn , ... n 1 2 3 2 3 1 −1 = 2 3 1 1 2 3 = 1 2 3 . 3 1 2 Definicja Iloczynem prostym grup G, H nazywamy zbiór G × H z działaniem (g1 , h1 )(g2 , h2 ) = (g1 g2 , h1 h2 ). Podgrupy Definicja. Niech G będzie grupą. Podzbiór H zbioru G nazywamy podgrupą grupy G, jeśli • e∈H • g ∈ H ⇒ g −1 ∈ H 34 • g, h ∈ H ∈ H ⇒ gh ∈ H Spostrzeżenie. Podgrupa jest grupą. Każda grupa G posiada co najmniej dwie podgrupy G i {e}. Grupa S3 ma jedną podgrupę 6-elementową, jedną podgrupę 3-elementową, trzy podgrupy 2-elementowe i jedną podgrupę jednoelementową. Definicja. Liczbę elementów grupy nazywamy rzędem grupy. Rząd grupy G będziemy oznaczać przez rz G. Będziemy zmierzać do pokazania, że rząd podgrupy dzieli rząd grupy. Definicja. Niech H będzie podgrupą grupy G. Warstwą lewostronną elementu g ∈ G nazywamy zbiór aH = {ah : h ∈ H}. Przykład. Zbiór 3Z = {..., −6, −3, 0, 3, 6, ...} jest podgrupą grupy addytywnej liczb całkowitych (tzn. zbioru liczb całkowitych z dodawaniem). Warstwami są zbiory: 3Z, 1 + 3Z = {..., −5, −2, 1, 4, 7, ...}, 2 + 3Z = {..., −4, −1, 2, 5, 8, ...}. Zbiory te są rozłączne i dają w sumie zbiór Z. Twierdzenie (Lagrange). Jeśli rząd grupy jest skończony, to rząd podgrupy dzieli rząd grupy. Dowód. Niech H będzie podgrupą grupy G. Zdefiniujmy relację. Powiemy, że a jest w relacji z b, jeśli a−1 b ∈ H. Tak zdefiniowana relacją jest relacją równoważności. • a−1 a = e ∈ H. • a−1 b ∈ H ⇒ b−1 a = (a−1 b)−1 ∈ H. • a−1 b ∈ H i b−1 c ∈ H ⇒ a−1 c = (a−1 b)(b−1 c) ∈ H. Klasami równoważności są warstwy. Dokładniej, klasą abstrakcji elementu a jest warstwa aH. x−1 a ∈ H ⇔ a−1 x ∈ H ⇔ a−1 x = h dla pewnego h ∈ H ⇔ x = ah ∈ aH. Wiemy, że relacja równoważności dzieli zbiór na rozłączne klasy abstrakcji. Przekształcenie aH → bH określone wzorem x → ba−1 x jest odwracalne. Dlatego dowolne dwie warstwy są równoliczne. W szczególności każda warstwa jest równoliczna z warstwą eH = H. Ponieważ G jest sumą rozłącznych warstw, powiedzmy k warstw, więc k rz H = rz G. Uwaga. Relacja przystawania modulo n jest właśnie tego rodzaju relacją. a ≡ b (mod n) ⇔ b − a ∈ nZ. 35 Podgrupy cykliczne Niech G będzie grupą skończoną i a ∈ G. Wtedy zbiór {a, a2 , a3 , ...} jest skończony. Dlatego dla pewnych i < j ai = aj tzn. aj−i = e. Definicja. Najmniejszą nieujemną liczbę całkowitą n taką, że an = e nazywamy rzędem elementu a (jeśli taka liczba nie istnieje mówimy, że rząd elementu jest nieskończony). Widzimy, że w grupie skończonej każdy element ma rząd skończony. Jeśli rząd a ∈ G wynosi n, to H = {e, a, a2 , ..., an−1 } jest n-elementową podgrupą grupy G. Element a nazywamy generatorem grupy H. Mówimy też, że element a generuje grupę H. Wiemy, że rząd podgrupy dzieli rząd grupy. Jeśli r = rz G, to r = kn i ar = ank = (ak )n = en = e. Mamy więc twierdzenie. Twierdzenie. Jeśli rząd grupy G równy jest r i a ∈ G, to ar = e. Uwaga. Grupa której rząd jest liczbą pierwszą jest grupą cykliczną. Dowód. Dowolny element różny od elementu neutralnego generuje całą grupę. Niech p będzie liczbą pierwszą. Zp∗ = {1, 2, ..., p − 1} jest multiplikatywną grupą ciała Zp . Zatem ap−1 = 1 dla a ∈ Zp∗ . Wynika stąd Twierdzenie (Fermat). Jeśli liczba pierwsza p nie dzieli liczby całkowitej a, to p|ap−1 − 1. Dowód. Przekształcenie ψ(a) = a mod n (reszta z dzielenia a przez n) jest homomorfizmem pierścienia Z w pierścień Zn . ψ(a + b) = ψ(a)ψ(b), ψ(ab) = ψ(a)ψ(b). U nas n = p. Jeśli p nie dzieli a to ψ(a) 6= 0. Mamy więc równość ψ(ap−1 ) = ψ(a)p−1 = 1 czyli p|ap−1 − 1. Przykłady. 13|512 − 1, 23|2522 − 1. Pewne uogólnienie. Oznaczmy rząd multiplikatywnej grupy Zn∗ przez φ(n) (funkcja Eulera). a ∈ Zn∗ ⇔ równanie ax + kn = 1 ma rozwiązanie ⇔ N W D(a, n) = 1 (jako element odwrotny do a bierzemy resztę z dzielenia x przez n). Przykład. Z15 = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14}. ∗ = {1, 2, 4, 7, 8, 11, 13, 14}, Z15 φ(15) = 8, 15|78 − 1. Mamy więc uogólnienie (małego) twierdzenia Fermata Twierdzenie (Euler). Jeśli n jest nieujemną liczbą całkowitą i N W D(a, n) = 1, to n|aφ(n) − 1. 36 Dowód taki sam jak dowód twierdzenia Fermata. Rozważmy teraz wielomian f = xp−1 − 1 ∈ Zp [x]. Wiemy, że jeśli a ∈ Zp i a 6= 0, to ap = 1. Dlatego każdy niezerowy element ciała Zp jest pierwiastkiem wielomianu f . Mamy więc xp−1 − 1 = (x − 1)(x − 2) · · · (x − p + 1). Podstawiając x = 0 otrzymujemy −1 = (−1)(−2) · · · (−p + 1) = (p − 1)(p − 2) · · · 2 · 1 tzn. p|(p − 1)! + 1 (przypomnijmy, elementem przeciwnym do a w Zn jest liczba n − a). Załóżmy, że d|p i d > 0 oraz p|(p − 1)! + 1. Jeśli d < p, to d|(p − 1)!. Wtedy d|1. Zatem jedynym dodatnim dzielnikiem p mniejszym od p jest liczba 1. Oznacza to, że p jest liczbą pierwszą. Mamy więc Twierdzenie (Wilson). Liczba całkowita p większa od 1 jest liczbą pierwszą wtedy i tylko wtedy, gdy p|(p − 1)! + 1. Permutacje Przypomnienie. Definicja. Grupą permutacji nazywamy zbiór bijekcji zbioru {1, 2, ..., n} na zbiór {1, 2, ..., n}. Grupę permutacji oznaczamy symbolem Sn . Notacja 2-wierszowa. Jeśli σ ∈ Sn , to piszemy 1 σ1 2 σ2 3 ... ... σn σ1 1 σ2 2 ... σn 3 ... 1 2 3 4 , 2 3 4 1 σ= n . Permutacja odwrotna σ= n . Przykład. σ, µ ∈ S4 . σ= Złożenie. µσ = 1 2 3 4 , 1 4 2 3 Odwrotność. σ −1 µ= = 1 2 3 4 . 2 1 4 3 σµ = 2 3 4 1 1 2 3 4 37 = 1 2 3 4 . 3 2 1 4 1 2 3 4 . 4 1 2 3 Cykle Definicja. Niech i1 , i2 , ..., ik ∈ {1, 2, ..., n} będą różnymi liczbami. Cyklem (o długości k) nazywamy permutację σ ∈ Sn taką, że σ i1 = i 2 , σi1 = i2 , ..., σik = i1 , σj = j dla j 6= i1 , i2 , ..., ik . Piszemy σ = (i1 , i2 , ..., ik ). Dany cykl możemy zapisać na k sposobów zaczynając od dowolnego il , l = 1, 2, ..., k. Przykład. 1 2 3 4 5 σ= . 3 5 4 1 2 σ1 = 3, σ3 = 4, σ4 = 1, σ2 = 5, σ5 = 2, σ = (1, 2, 4)(2, 5) = (2, 5)(1, 2, 4). Definicja. Jeśli zbiory {i1 , i2 , ..., ik }, {j1 , j2 , ..., jl } są rozłączne, to mówimy, że cykle (i1 , i2 , ..., ik ),(j1 , j2 , ..., jk ) są rozłączne Złożenie rozłącznych cykli nie zależy od kolejności składania. Twierdzenie. Każdą permutację można przedstawić jako złożenie rozłącznych cykli. Dowód. Niech σ ∈ Sn . Bierzemy dowolny element i1 taki, że σ(i1 ) 6= i1 . Znajdujemy kolejne obrazy: i2 = σ(i1 ), i3 = σ(i2 ), .... Ponieważ obrazy należą do zbioru skończonego (n-elementowego), więc dla pewnych j, k takich, że j < k σ(ik ) = ij . Ponieważ σ jest przekształceniem różnowartościowym, więc ij = i1 . Inaczej mielibyśmy σ(ik ) = ij = σ(ij−1 ). Permutacja σ jest złożeniem cyklu (i1 , i2 , ..., ik ) i permutacji takiej, że µ(il ) = il dla l = i1 , i2 , ..., ik . Następnie powtarzamy rozumowanie wychodząc z dowolnego elementu różnego od i1 , i2 , ..., ik . Po pewnej liczbie kroków otrzymujemy żądany rozkład. Definicja. Cykl o długości 2 nazywamy transpozycja. Obserwacja. (1, 2, 3) = (1, 2)(2, 3), (1, 2, 3, 4) = (1, 2)(2, 3)(3, 4) i ogólnie (i1 , i2 , ..., ik ) = (i1 , i2 )(i2 , i3 )...(ik−1 , ik ). Wniosek. Cykl o długości k można zapisać jako złożenie k − 1 transpozycji. Wynika stąd Twierdzenie. Każdą permutację można przedstawić jako złożenie pewnej liczby transpozycji. Można inaczej. Przykład. 1 2 3 4 5 2 5 3 1 4 = (4, 5)(1, 4) 1 2 3 4 5 = (4, 5) 2 4 3 1 5 1 2 3 4 5 2 1 3 4 5 = = (4, 5)(1, 4)(1, 2). Obserwacja. (1, 3) = (1, 2)(2, 3)(1, 2), 38 (1, 4) = (1, 2)(2, 3)(3, 4)(2, 3)(3, 4) i ogólnie dla i < j (i, j) = (i, i + 1)(i + 1, i + 2) · · · (j − 1, j) · · · (i + 1, i + 2)(i, i + 1). Wniosek.; Każdą permutację można zapisać jako złożenie transpozycji postaci τi = (i, i+1), gdzie i = 1, 2, ..., n−1. Inaczej mówiąc permutacje τ1 , τ2 , ..., τn generują grupę Sn . Zachodzą relacje τi2 = id, |i − j| > 1 τi τj = τj τi , τi τi+1 τi = τi+1 τi τi+1 . Inwersje Definicja. Niech σ ∈ Sn . Mówimy, że para (σi , σj ) tworzy inwersję, jeśli σi > σj dla i < j. Przykład. 1 2 3 4 5 σ= . 2 5 3 1 4 Pary (2, 1), (5, 3), (5, 4), (3, 1) tworzą inwersje. Liczba inwersji w permutacji identycznościowej wynosi 0. 1 2 3 ... n Największa liczba inwersji występuje w permutacji n n − 1 n − 2 ... 1 i wynosi n(n − 1)/2. Twierdzenie. Liczby inwersji w permutacjach σ i σ(i, i + 1) różnią się o 1. Dowód. 1 2 ... i i + 1 ... n σ= . σ1 σ2 ... σi σi+1 ... σn µ = σ(i, i + 1) = 1 σ1 2 σ2 ... i ... σi+1 µj = σj dla j 6= i, i + 1, i + 1 ... n . σi ... σn µi = σi+1 , µi+1 = σi . Zbiory par {(σj , σk ) : 1 ¬ j < k ¬ n} i {(µj , µk ) : 1 ¬ j < k ¬ n} różnią się jednym elementem. W drugim zbiorze zamiast pary (σi , σi+1 ) występuje para (σi+1 , σi ). Dlatego w przypadku kiedy σi < σi+1 , liczba inwersji w permutacji µ jest o jeden większa od liczby inwersji w permutacji σ, a w przypadku kiedy σi > σi+1 o jeden mniejsza. 39 Znak permutacji Definicja. Znak permutacji σ definiujemy wzorem znak(σ) = (−1) liczba inwersji w permutacji σ . Twierdzenie. Znak permutacji jest homomorfizmem grupy Sn w grupę liczb {1, −1} z mnożeniem. znak(σµ) = znak(σ)znak(µ). Dowód. Wiemy już, że znak(σ(i, i + 1)) = −znak(σ). Dlatego znak(τi1 τi2 · · · τik ) = −znak(τi1 τi2 · · · τik−1 ) = · · · = (−1)k znak(id) = (−1)k . Jeśli σ = τi1 τi2 · · · τik , µ = τj1 τj2 · · · τjm , to σµ = τi1 τi2 · · · τik τj1 τj2 · · · τjm i znak(σ) = (−1)k , znak(µ) = (−1)m , znak(σµ) = (−1)k+m . Stąd równość znak(σµ)znak(σ)znak(µ). Znak zwykle oznacza się skrótem sgn. Wnioski. Znak transpozycji równy jest -1. Znak cyklu od długości k wynosi (−1)k−1 . Daną permutację można na różne sposoby przedstawić jako złożenie transpozycji. Jeśli w jednym przedstawieniu występuje parzysta (nieparzysta) liczba transpozycji, to w każdym innym przedstawieniu też wystąpi parzysta (nieparzysta) liczba transpozycji. Permutacje, których znak równy jest 1 nazywamy permutacjami parzystymi. Uwaga. Permutacje parzyste tworzą podgrupę. Identyczność jest permutacją parzystą. Złożenie dwu permutacji parzystych jest permutacją parzystą. Odwrotność permutacji parzystej jest permutacją parzystą. znak(σ −1 )znak(σ) = znak(σ −1 σ) = znak(id) = 1 ⇒ znak(σ −1 ) = znak(σ). Definicja. Podgrupę grupy Sn złożoną z permutacji parzystych nazywamy grupą alternującą i oznaczamy symbolem An . Dla n > 1 grupa An liczy n!/2 elementów. Wystarczy zauważyć, że przekształcenie σ → (1, 2)σ jest odwracalne i przekształca permutacje parzyste na permutacje nieparzyste. Zatem permutacji parzystych jest tyle samo co nieparzystych. Dzielnik normalny i grupa ilorazowa Warstwa lewostronna: aH = {ah : h ∈ H}. Warstwa prawostronna: Ha = {ha : h ∈ H}. Definicja. Niech H będzie podgrupą grupy G. Podgrupę H nazywamy podgrupą normalną (dzielnikiem normalnym) grupy G, jeśli dla każdego a ∈ G zachodzi równość aH = Ha (tzn. warstwa lewostronna elementu a pokrywa się z warstwą prawostronną elementu a). Uwaga. Podgrupę normalną można zdefiniować równoważnie, żądając aby dla każdego a ∈ G i każdego h ∈ H aha−1 ∈ H. 40 Dowód. II definicja ⇒ I definicja. x ∈ aH ⇒ x = ah dla pewnego h ∈ H ⇒ x = (aha−1 )a ∈ Ha. Tzn. aH ⊂ Ha. Podobnie Ha ⊂ aH. Dlatego aH = Ha. I definicja ⇒ II definicja. Niech h ∈ H. ah ∈ aH = Ha. Tzn. ah = wa dla pewnego w ∈ H. Ale z równości ah = wa wynika, że aha−1 = w ∈ H. Uwaga. Każda podgrupa grupy przemiennej jest podgrupą normalną. Twierdzenie. Jeśli H jest dzielnikiem normalnym grupy G, to zbiór warstw (G/H) z działaniem (aH)(bH) = (ab)H jest grupą (zwaną grupą ilorazową). Dowód. Zaczniemy od pokazania, że definicja działania jest poprawna. Załóżmy, że aH = cH i bH = dH. Wtedy a−1 c ∈ H i b−1 d ∈ H, a stąd (ab)−1 cd = b−1 a−1 cd = b−1 d[d−1 (a−1 c)d] ∈ H i dlatego abH = cdH. Teraz pokazanie, że zbiór warstw jest grupą jest proste. • (aH)((bH)(cH)) = (aH)(bcH) = (a(bc))H = ((ab)c)H = (abH)(cH) = ((aH)(bH))(cH). • (eH)(aH) = eaH = aH, eH = H. • (a−1 H)(aH) = a−1 aH = eH. Przykład. Niech G = S4 i H = {id, (1, 2)(3, 4), (1, 3)(2, 4), (1, 4)(2, 3)}. H jest podgrupą normalną G. (1, 2)H = {(1, 2), (3, 4), (1, 3, 2, 4), (1, 4, 2, 3)} = H(1, 2), itd. Nietrudno sprawdzić, że H jest podgrupą grupy G. Pozostaje do sprawdzenia, że jeśli a ∈ G i h ∈ H, to aha−1 ∈ H. Zauważmy, że aha−1 = 1 a1 2 a2 ... n ... an a1 ah1 = 1 h1 2 h1 a2 ah2 ... n ... hn ... an ... ahn a1 1 a2 2 ... an ... n = . W szczególności a(b1 , b2 , ..., bk )a−1 = (ab1 , ab2 , ..., abk ). Zatem jeśli h rozkłada się na rozłączne cykle o długościach k1 , k1 , ..., kl , to aha−1 też rozkłada się na rozłączne cykle o długościach k1 , k1 , ..., kl . H skład się z identyczności i wszystkich permutacji będących złożeniem 2 rozłącznych transpozycji. Dlatego jeśli h ∈ H, to aha−1 ∈ H. Jądro homomorfizmu Definicja. Niech G, H będą grupami. Jądrem homomorfizmu φ : G → H nazywamy przeciwobraz elementu neutralnego czyli zbiór ker φ = {g ∈ G : φ(g) = e}. 41 Uzupełnienie. Dwie własności homomorfizmu. φ(g) = φ(eg) = φ(e)φ(g), φ(g −1 )φ(g) = φ(g −1 g) = φ(e). Dlatego φ(e) = e, φ(g −1 ) = φ(g)−1 . Twierdzenie. Jądro homomorfizmu φ : G → H jest dzielnikiem normalnym grupy G. Dowód. • φ(e) = e ⇒ e ∈ ker φ. • a ∈ ker φ ⇒ φ(a−1 ) = φ(a)−1 = e−1 = e ⇒ a−1 ∈ ker φ. • a, b ∈ ker φ ⇒ φ(ab) = φ(a)φ(b) = ee = e ⇒ ab ∈ ker φ. • h ∈ ker φ ⇒ φ(ghg −1 ) = φ(g)φ(h)φ(g −1 ) = φ(g)eφ(g)−1 = e ⇒ ghg −1 ∈ ker φ. Uwaga. Niech φ będzie homomorfizmem grupy G w grupę H. Obraz φ(G) jest podgrupą grupy H. • e = φ(e) ∈ φ(G). • φ(a)−1 = φ(a−1 ) ∈ φ(G). • φ(a)φ(b) = φ(ab) ∈ φ(G). Przykład. Funkcja znak jest homomorfizmem Sn w grupę {1, −1}. Jądrem tego homomorfizmu jest grupa An . Zatem An jest dzielnikiem normalnym Sn . Wynika to również z ogólniejszego faktu: jeśli H jest podgrupą G i rząd G jest dwa razy większy od rzędu H, to H jest dzielnikiem normalnym G. Przykład. Niech n 6= 0 i φ(a) = a mod n (reszta z dzielenia a przez n). Przekształcenie φ jest homomorfizmem grupy addytywnej Z na grupę addytywną Zn . Jądremhomomorfizmuu φ jest nZ. Przekształcenie a → a + nZ jest homomorfizmem grupy Z w grupę ilorazową Z/nZ. Grupa ilorazowa Z/nZ jest izomorficzna z Zn . Izomorfizm zadany jest wzorem a + nZ → φ(a) = a mod n. Jest to szczególny przypadek ogólniejszego twierdzenia. Twierdzenie. Niech G i H będą grupami, a φ homomorfizmem G w H. Homomorfizm φ : G → φ(G) jest złożeniem homomorfizmu G → G/ ker φ, a → a ker φ z izomorfizmem G/ ker φ → φ(G), 42 a ker φ → φ(a). Uwaga. Ogólniej, niech f : X → Y . Powiemy, że a jest w relacji z b, jeśli f (a) = f (b). Zdefiniowana relacja jest relacją równoważności. Przekształcenie f jest złożeniem 2 przekształceń X → zbiór klas, zbiór klas → f (X), x → klasa elementu x, klasa elementu x → f (x) (przekszt. różnowartościowe). Przestrzeń liniowa Od tego miejsca K będzie oznaczało ciało R lub C. Duża część definicji i twierdzeń będzie prawdziwa w przypadku dowolnego ciała. Definicja. Niech V będzie niepustym zbiorem, którego elementy można dodawać do siebie i mnożyć przez elementy ciała K. Elementy zbioru V będziemy nazywać wektorami, a elementy ciała K skalarami. Zbiór V nazywamy przestrzenią liniową (wektorową) nad ciałem K, jeśli wspomniane działania posiadają następujące własności (u, v, w ∈ V, α, β ∈ K) • (u + v) + w = u + (v + w) • u+v =v+u • Istnieje wektor 0 taki, że u + 0 = u • Dla każdego u istnieje v takie, że u + v = 0 • (αβ)u = α(βu) • 1u = u (1 ∈ K) • (α + β)u = αu + βu • α(u + v) = αu + αv Wnioski. V z dodawaniem jest grupą abelową. Dlatego element 0 jest jedyny, element przeciwny do danego jest jedyny, −(−u) = u. 0u = 0, (−α)u = −(αu) = α(−u). α0 = 0, Dowód. αu = (0 + α)u = 0u + αu. Dlatego 0u = 0. αu = α(u + 0) = αu + α0. Stąd α0 = 0. 0 = 0u = (α + (−α))u = αu + (−α)u. Stąd (−α)u = −(αu). 0 = α0 = α(u + (−u)) = αu + α(−u). Stąd α(−u) = −(αu). Podstawowy przykład: K n . x1 x 2 . ∈ K n, . xn x1 y1 x1 + y 1 x y x +y 2 2 2 2 . + . = . , . . . xn yn xn + y n 43 x1 αx1 x αx 2 2 α . = . . . . xn αxn Definicja. Niepusty podzbiór W przestrzeni V nazywamy podprzestrzenią przestrzeni V , jeśli • u, v ∈ W ⇒ u + v ∈ W . • u ∈ W, α ∈ K ⇒ αu ∈ W . Uwaga. Część wspólna dwóch podprzestrzeni jest podprzestrzenią. Definicja. Niech a1 , a2 , ..., ak ∈ K. Kombinacją liniową wektorów v1 , v2 , ..., vk ∈ V nazywamy sumę a1 v1 + a2 v2 + · · · + an vn ∈ V. Elementy a1 , a2 , ..., an nazywamy współczynnikami tej kombinacji liniowej. Definicja. Mówimy, że skończony zbiór wektorów {v1 , v2 , ..., vn } jest liniowo niezależny, jeśli jedyną kombinacją liniową równą 0 jest kombinacja z zerowymi współczynnikami. a1 v1 + a2 v2 + · · · + an vn = 0 ⇒ a1 = a2 = · · · = an = 0. Zbiór wektorów jest liniowo niezależny, jeśli dowolny skończony podzbiór jest liniowo niezależny. Wektory, które nie są liniowo niezależne nazywamy wektorami liniowo zależnymi. Uwagi. Zbiór wektorów zawierający wektor zerowy jest liniowo zależny. Zbiór wektorów jest liniowo zależny ⇔ jakiś wektor ze zbioru można wyrazić jako kombinację liniową pozostałych wektorów. Definicja. Mówimy, że zbiór wektorów B rozpina przestrzeń V , jeśli dowolny wektor z przestrzeni V jest kombinacją liniową wektorów ze zbioru B. Definicja. Liniowo niezależny zbiór wektorów rozpinających przestrzeń V nazywamy bazą przestrzeni V . Przykład. Rozpatrujemy R3 . Wektory 1 e1 = 0 , 0 0 e2 = 1 , 0 0 e3 = 0 1 tworzą bazę zwaną bazą standardową. Inny przykład bazy 1 f1 = 0 , 0 1 f2 = 1 , 0 1 f3 = 1 Wektory 1 1 0 1 1,0,1,1 0 1 1 rozpinają przestrzeń, ale są liniowo zależne. 44 1 1 Lemat. Jeśli k > n, to układ równań + a12 x2 + · · · + a1k xk = 0 a21 x1 + a22 x2 + · · · + a2k xk = 0 ······ an1 x1 + an2 x2 + · · · + ank xk = 0 a11 x1 ma niezerowe rozwiązanie. Dowód indukcyjny. Jeśli n = 1, to twierdzenie jest oczywiste. Załóżmy, że twierdzenie jest prawdziwe dla n − 1. Rozpatrujemy układ n równań z k niewiadomymi. Jeśli a1k = a2k = · · · = ank = 0, to możemy wybrać rozwiązanie x1 = x2 = · · · = xk−1 = 0 i xk = 1. Załóżmy teraz, że dla pewnego i aik 6= 0. Wtedy xi = − 1 (ai1 x1 + ai2 x2 + · · · + ai,k−1 ). aik Podstawiając xi do pozostałych równań otrzymujemy układ n − 1 równań z k − 1 niewiadomymi, który z założenia indukcyjnego ma niezerowe rozwiązanie. Twierdzenie. Jeśli wektory u1 , u2 , . . . , uk są kombinacjami liniowymi wektorów v1 , v2 , . . . , vn i k > n, to są liniowo zależne. Dowód. Z założenia = a11 v1 + a21 v2 + · · · + an1 vn u2 = a12 v1 + a22 v2 + · · · + an2 vn ······ u1 = a1k v1 + a2k v2 + · · · + ank vn u 1 Stąd x1 u1 + x2 u2 + · · · + xk uk = = (a11 x1 + a12 x2 + · · · + a1k xk )v1 + +(a21 x1 + a22 x2 + · · · + a2k xk )v2 + ········· +(an1 x1 + an2 x2 + · · · + ank xk )vn Z lematu wynika, że dla pewnych x1 , x2 , . . . , xk (nie wszystkich równych 0) prawa strona powyższego równania jest równa 0. Dlatego wektory u1 , u2 , ...uk są liniowo zależne. Wynika stąd ważne twierdzenie. Twierdzenie. Jeśli pewna baza przestrzeni V ma n elementów, to każda inna baza przestrzeni V ma n elementów. Liczbę n nazywamy wymiarem przestrzeni V i piszemy n = dim V . Dowód. Niech v1 , v2 , ..., vn i u1 , u2 , ..., uk będą dwiema bazami przestrzeni V . Ponieważ wektory u1 , u2 , ..., uk są liniowo niezależne i dają się wyrazić jako kombinacje 45 liniowe wektorów v1 , v2 , ..., vn , więc k ¬ n. Zamieniając rolami rozpatrywane zbiory wektorów otrzymujemy drugą nierówność: n ¬ k. Stąd k = n. Twierdzenie. Niech dim V = n i k ¬ n. Liniowo niezależny zbiór wektorów v1 , v1 , ..., vk można rozszerzyć do bazy V . Dowód. Jeśli k = n, to wektory v1 , v1 , ..., vk tworzą bazę V . Jeśli k < n, to istnieje wektor vk+1 ∈ V , który nie jest kombinacją liniową wektorów v1 , v1 , ..., vk . Rozpatrujemy teraz liniowo niezależny zbiór wektorów v1 , v1 , ..., vk , vk+1 . Powtarzając rozumowanie n − k razy otrzymamy bazę V . Uwaga. Niech v1 , v2 , . . . , vn będzie bazą przestrzeni liniowej V . Przedstawienie wektora w postaci kombinacji liniowej elementów bazowych jest jedyne. Załóżmy, że mamy dwa przedstawienia v = a1 v1 + a2 v2 + · · · + an vn = b1 v1 + b2 v2 + · · · + bn vn . Wtedy (a1 − b1 )v1 + (a2 − b2 )v2 + · · · + (an − bn )vn = 0. Z liniowej niezależności wektorów bazowych wynika, że b 1 = a1 , b2 = a2 , . . . , b n = an . Liczby a1 , a2 , . . . , an nazywamy współrzędnymi wektora v w bazie v1 , v2 , . . . , vn . Jeszcze jeden przykład przestrzeni liniowej: zbiór funkcji f : X → K. Działania: (f + g)(x) = f (x) + g(x), (αf )(x) = αf (x). Jeśli X = {1, 2, 3, . . . , n}, to mamy K n . W zbiorze funkcji możemy określić mnożenie: (f g)(x) = f (x)g(x). Funkcje z dodawaniem, mnożeniem przez skalar i zdefiniowanym powyżej mnożeniem tworzą algebrę funkcji. Definicja. Algebrą nazywamy przestrzeń liniową z dodatkowym działaniem (mnożeniem wektorów), które parze wektorów przypisuje wektor i ma następujące własności • u(vw) = (uv)w. • u(v + w) = uv + uw, (v + w)u = vu + wu. • (αv)w = α(vw) = v(αw). Kolejny przykład przestrzeni liniowej. Jeśli ciało L jest rozszerzeniem ciała K, to L można traktować jako przestrzeń liniową nad K (a nawet jako algebrę). Ciało C jest 2-wymiarową przestrzenią liniową nad R. Ciało R jest nieskończenie wymiarową przestrzenią liniową nad Q. 46 Przekształcenia liniowe Definicja. Niech V i W będą przestrzeniami liniowymi nad ciałem K. Przekształcenie f : V → W nazywamy przekształceniem liniowym, jeśli f (v + u) = f (v) + f (u); f (αv) = αf (v), v, w ∈ V, α ∈ K. 1. Jeśli f jest przekształceniem liniowym, to nawiasy na ogół pomijamy i piszemy f v zamiast f (v). 2. Przekształcenie liniowe nazywamy też homomorfizmem przestrzeni liniowych. Odwracalne przekształcenie liniowe nazywamy izomorfizmem, a o przestrzeniach V, W mówimy, że są izomorficzne. Jeśli W = V , to homomorfizm nazywamy endomorfizmem, a izomorfizm automorfizmem. 3. Przekształcenia liniowe f, g : V → W można do siebie dodawać i mnożyć przez skalary. (f + g)v = f v + gv, (αf )v = α(f v), v ∈ V, α ∈ K. Suma przekształceń liniowych i przekształcenie liniowe pomnożone przez skalar nadal są przekształceniami liniowymi. Przekształcenia liniowe z tak określonymi działaniami tworzą przestrzeń liniową nad ciałem K. 4. Jeśli W = K, to przekształcenie liniowe nazywamy formą liniową. Przestrzeń form liniowych określonych na V nazywamy przestrzenią dualną i oznaczamy symbolem V ∗ . 5. Jeśli f : U → W i g : V → U są przekształceniami liniowymi, to złożenie f g : V → W też jest przekształceniem liniowym. 6. Przekształcenia liniowe V → V można dowolnie składać. Przestrzeń takich przekształceń wraz ze składaniem tworzy algebrę. 7. Jeśli f jest izomorfizmem przestrzeni liniowych, to przekształcenie odwrotne jest też jest izomorfizmem przestrzeni liniowych. Identyczność jest przekształceniem liniowym. Zbiór wszystkich odwracalnych przekształceń liniowych V na V tworzy grupę oznaczaną symbolem GL(V ). 8. Jeśli v1 , v2 , . . . , vn jest bazą przestrzeni liniowej V , to przekształcenie a1 a 2 v = a1 v1 + a2 v2 + · · · + an vn → . . an jest izomorfizmem przestrzeni V na przestrzeń K n . 47 9. Definicja. Niech f będzie przekształceniem liniowym przestrzeni liniowej V w przestrzeń liniową W . Jądrem homomorfizmu f nazywamy zbiór wektorów z przestrzeni V , których obraz równy jest zero. Jądro oznaczmy symbolem ker f . 10. Jądro homomorfizmu jest podprzestrzenią. Obraz homomorfizmu jest podprzestrzenią. Twierdzenie. Jeśli f jest przekształceniem liniowym n-wymiarowej przestrzeni liniowej V w przestrzeń liniową W , to dim V = dim ker f + dim f (V ). Dowód. Niech v1 , v2 , . . . , vk będzie bazę ker f . Zbiór v1 , v2 , . . . , vk rozszerzamy do bazy V dodając wektory w1 , w2 , . . . , wl , k +l = n. Wektory f w1 , f w2 , . . . , f wl tworzą bazę obrazu. Weźmy dowolny v ∈ V . v = a1 v1 + a2 v2 · · · + ak vk + b1 w1 + b2 w2 + · · · + bl wl , f v = b1 f w1 + b2 f w2 + · · · + bl f wl . Widzimy, że wektory f w1 , f w2 , . . . , f wl rozpinają obraz. Jeśli b1 f w1 + b2 f w2 + · · · + bl f wl = 0, to f (b1 w1 + b2 w2 + · · · + bl wl ) = 0. Stąd b1 w1 + b2 w2 + · · · + bl wl ∈ ker f, b1 w1 + b2 w2 + · · · + bl wl = a1 v1 + a2 v2 · · · + ak vk Ale wtedy a1 = a2 = · · · = ak = b1 = b2 = · · · = bl = 0, co oznacza, że wektory f w1 , f w2 , . . . , f wl są liniowo niezależne. Wniosek. dim f (V ) ¬ dim V . Twierdzenie. Przestrzenie liniowe V i W są izomorficzne wtedy i tylko wtedy, gdy dim V = dim W. Dowód. Jeśli f : V → W jest izomorfizmem, to W = f (V ) i dim W ¬ dim V . Ponieważ f −1 też jest izomorfizmem, więc dim V ¬ dim W . Stąd dim V = dim W . Odwrotnie. Jeśli v1 , v2 , . . . , vn jest bazą V , a w1 , w2 , . . . , wn bazą W , to f zdefiniowane wzorami f v1 = w1 , f v2 = w2 , . . . , f vn = wn jest izomorfizmem przestrzeni V na przestrzeń W . 48 Macierz przekształcenia liniowego Rozważamy skończenie wymiarowe przestrzenie liniowe V, W . Niech v1 , v2 , . . . , vn będzie bazą V , a w1 , w2 , . . . , wm bazą W . Jeśli f : V → W jest przekształceniem liniowym, to f (a1 v1 + a2 v2 + . . . + an vn ) = a1 f v1 + a2 f v2 + . . . + an f vn . Aby znaleźć f v wystarczy znać wartości f v1 , f v2 , . . . , f vn . Mamy f v1 = F11 w1 + F21 w2 + · · · + Fm1 wm , f v2 = F12 w1 + F22 w2 + · · · + Fm2 wm , ········· f vn = F1n w1 + F2n w2 + · · · + Fmn wm . Zatem, aby określić przekształcenie liniowe, wystarczy podać n × m elementów ciała K. F11 F12 · F1n F F22 · F2n 21 . . . . Fm1 Fm2 . Fmn Tak zapisany zbiór nazywamy macierzą przekształcenia f . Macierz przekształcenia liniowego zależy od wyboru baz. Ostatecznie f (a1 v1 + a2 v2 + · · · + an vn ) = = (F11 a1 + F12 a2 + . . . + F1n an )w1 + +(F21 a1 + F22 a2 + . . . + F2n an )w2 + +······+ +(Fm1 a1 + Fm2 a2 + . . . + Fmn an )wm . Definicja. Mnożenie macierzy przez wektor z K n definiujemy wzorem F11 F 21 . Fm1 F12 F22 . Fm2 · F1n a1 b1 · F2n a2 b2 = . . . . . Fmn an bm gdzie bi = Fi1 a1 + Fi2 a2 + · · · + Fin an , i = 1, 2, 3, . . . m. Zamiast rozważać przekształcenie f : V → W możemy rozważać przekształcenie F : K n → K m , gdzie F jest macierzą przekształcenia f . Przykład A B x Ax + By = C D y Cx + Dy 49 Dodawanie macierzy i mnożenie macierzy przez skalar Przekształcenia liniowe f, g : V → W można dodawać do siebie i mnożyć przez skalary. Działania na macierzach definiujemy tak, aby sumie przekształceń odpowiadała suma macierzy, a iloczynowi przekształcenia przez skalar, iloczyn macierzy przez skalar. Definicje. F11 F 21 . Fm1 F12 F22 . Fm2 G11 · F1n · F2n G21 + . . . Gm1 . Fmn F11 + G11 F +G 21 = 21 . Fm1 + Gm1 F11 F 21 α . Fm1 F12 F22 . Fm2 G12 G22 . Gm2 F12 + G12 F22 + G22 . Fm2 + Gm2 · F1n + G1n · F2n + G2n . . . Fmn + Gmn · F1n αF11 αF · F2n 21 = . . . . Fmn αFm1 · G1n · G2n = . . . Gmn αF12 αF22 . αFm2 · αF1n · αF2n . . . αFmn Uwaga. Macierze ustalonego rozmiaru tworzą przestrzeń liniową nad ciałem K. Wymiar tej przestrzeni równy jest nm. Prawdziwe są wzory (F + G)v = F v + Gv, (αF )v = α(F v), gdzie F, G oznaczają macierze m × n, a v jest wektorem z K n Przykład. 1 3 2 4 3 7 + 6 8 = 11 15 , 5 7 9 11 10 12 19 23 1 3 3 9 3 5 7 = 15 21 . 9 11 27 33 Mnożenie macierzy Niech v1 , v2 , . . . , vn będzie bazą V , w1 , w2 , . . . , wm bazą W , a u1 , u2 , . . . , ul bazą U . Jeśli G, F są macierzami przekształceń liniowych g : V → W, f : W → U , to f gvk = f m X j=1 Gjk wj = m X j=1 Gjk f wj = m X j=1 Gjk l X Fij ui = i=1 l X m X ( i=1 j=1 Widzimy, że macierzą złożenia jest macierz H o wyrazach Hik = Fi1 G1k + Fi2 G2k + · · · + Fim Gmk . 50 Fij Gjk )ui . Wynik podpowiada jak zdefiniować iloczyn macierzy, aby złożeniu przekształceń odpowiadał iloczyn macierzy. Definicja. Iloczynem macierzy F i G jest macierz H o wyrazach Hik = Fi1 G1k + Fi2 G2k + · · · + Fim Gmk . Ważne jest aby liczba kolumn macierzy F była równa liczbie wierszy macierzy G. 1. Mnożenie macierzy przez wektor może być traktowane jako mnożenie macierzy przez macierz złożoną z jednej kolumny. 2. Zachodzi równość F (Gv) = (F G)v, gdzie v ∈ K n . 3. Mnożenie macierzy jest łączne: F (GH) = F (GH). 4. Zbiór wszystkich macierzy kwadratowych rozmiaru n×n tworzy algebrę zwaną algebrą macierzy. 5. Definicja. Macierz kwadratową 1 0 I= 0 · 0 0 1 0 · 0 0 0 1 · 0 ··· ··· ··· ··· ··· 0 0 0 · 1 nazywamy macierzą jednostkową. Macierz jednostkowa jest elementem neutralnym ze względu na mnożenie macierzy. 6. Definicja. Niech A będzie macierzą kwadratową n × n. Macierz kwadratową B n × n taką, że AB = I nazywamy macierzą odwrotną do macierzy A. 7. Macierz odwrotna może nie istnieć. Jeśli jednak istnieje, to jest jedyna. Poza tym mamy wtedy BA = I. Wystarczy popatrzyć na macierz jak na przekształcenie liniowe K n w K n . Złożenie AB jest identycznością. Wymiar obrazu wynosi n. Zatem wymiary AK n i BK n też wynoszą n i B jest przekształceniem odwracalnym. Istnieje macierz C rozmiaru n × n taka że BC = I. Mamy BA = (BA)I = (BA)(BC) = B(AB)C = BIC = BC = I. 8. Często wygodnie jest używać delty Kroneckera δji = 1 jeśli j = i 0 jeśli j 6= i Możemy napisać Iij = δij . 9. Zbiór macierzy odwracalnych z mnożeniem tworzy grupę oznaczaną symbolem GL(n, K). 10. Przykład. A B C D a b c d = 51 Aa + Bc Ab + Bd . Ca + Dc Cb + Dd Zmiana bazy Załóżmy, że w przestrzeni V wybrano dwie bazy v1 , v2 , . . . , vn oraz v10 , v20 , . . . , vn0 . Wektory pierwszej bazy można wyrazić jako kombinacje liniowe wektorów drugiej bazy i odwrotnie. n X vj = Aij vi0 , vj0 = i=1 n X j = 1, 2, . . . , n. Bij vi , i=1 Elementy Aij oraz elementy Bij tworzą dwie macierze kwadratowe. Zachodzą równości n n n n n vk = X Ajk vj0 = j=1 Stąd X Ajk ( j=1 n X X Bij vi ) = i=1 X X ( Bij Ajk )vi . i=1 j=1 Bij Ajk = δik , tzn. BA = I. j=1 Podobnie BA = I, czyli B = A−1 . Macierze A, B nazywamy macierzami zmiany bazy. Jeśli n n v= X x0i vi0 = v= X n X xj ( xj vj , j=1 i=1 to X Aij vi0 ) = n n X X ( Aij xj )vi0 . i=1 j=1 i=1 Stąd x0i = n X Aij xj . j=1 lub inaczej 0 x1 x0 2 · x1 x = A 2 . · x0n xn Rozważmy teraz przekształcenie liniowe f : V → W . Niech F będzie macierzą przekształcenia f w bazach v1 , v2 , . . . , vn , w1 , w2 , . . . wn , a F 0 macierzą przekształcenia f w bazach v10 , v20 , . . . , vn0 , w10 , w20 , . . . wn ’. Jeśli n m vj = X Aij vi0 , wj = X i=1 to f vk = m X Fjk wj = j=1 f vk = f n X j=1 Ajk vj0 m X i=1 m X Fjk ( j=1 = n X Cij wi0 , Cij wi0 ) = i=1 Ajk f vj0 j=1 = n X j=1 0 m X m X Cij Fjk )wi0 , ( i=1 j=1 m X Ajk ( Fij0 wi0 ) = i=1 n X m X ( Fij0 Ajk )vj0 . i=1 j=1 0 Porównanie prowadzi do równości F A = CF lub inaczej F = CF A−1 . W szczególności, jeśli W = V i wi = vi dla i = 1, 2, . . . , n, to C = A oraz F 0 = AF A−1 . 52 Równania liniowe Definicja. Jednorodnym układem równań liniowych nazywamy układ równań + a12 x2 + · · · + a1n xn = 0 a21 x1 + a22 x2 + · · · + a2n xn = 0 ········· am1 x1 + am2 x2 + · · · + amn xn = 0 a11 x1 Natomiast niejednorodnym układem równań liniowych nazywamy układ równań postaci a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 ········· am1 x1 + am2 x2 + · · · + amn xn = bm Na układ równań liniowych możemy patrzeć jak jedno równanie a11 a 21 · am1 a12 a22 · am2 x1 b1 · a1n · a2n x2 b2 = , · · · · xn bm · amn lub jeszcze krócej Ax = b. Rozwiązania równania Ax = 0, tworzą podprzestrzeń (jądro homomorfizmu x → Ax). Bazę tej podprzestrzeni nazywamy fundamentalnym układem rozwiązań. Jeśli mamy jakieś rozwiązanie x0 równania Ax = b, to każde inne rozwiązanie możemy uzyskać dodając do x0 dowolne rozwiązanie równania Ax = 0. Układ równań liniowych możemy zapisać jeszcze inaczej x1 A1 + x2 A2 + ... + xn An = b, gdzie a1i a Ai = 2i , i = 1, 2, 3, . . . , n. · ami Widzimy, że układ równań ma rozwiązanie, jeśli wektor b należy do przestrzeni rozpiętej przez wektory A1 , A2 , . . . An . Jeśli dodatkowo wektory A1 , A2 , . . . An są liniowo niezależne, to rozwiązanie jest jedyne. Definicja. Macierzą układu równań nazywamy macierz a11 a 21 · am1 a12 a22 · am2 · a1n · a2n · · · amn Rozszerzoną macierzą układu równań nazywamy macierz a11 a 21 · am1 a12 a22 · am2 · a1n · a2n · · · amn 53 b1 b2 · bm Definicja. Rzędem kolumnowym (wierszowym) macierzy nazywamy wymiar przestrzeni rozpiętej przez kolumny (wiersze) macierzy. Pokażemy później, że rząd kolumnowy równy jest rzędowi wierszowemu. Możemy nasze obserwacje sformułować w postaci twierdzenia. Twierdzenie. (Kronecker-Capelli) Układ równań liniowych ma rozwiązanie wtedy i tylko wtedy, gdy rząd macierzy układu równań równy jest rzędowi macierzy rozszerzonej. Twierdzenie. Rząd kolumnowy równy jest rzędowi wierszowemu. Dowód. Rozważamy macierz a11 a 21 · am1 a12 a22 · am2 · a1n · a2n · · · amn Załóżmy, że pierwszych w wierszy tworzy bazę przestrzeni rozpiętej przez wiersze macierzy (być może po przenumerowaniu wierszy). Rozpatrujemy zmniejszoną macierz a11 a12 · a1n a 21 a22 · a2n · · · · aw1 aw2 · awn Załóżmy, że pierwszych k kolumn zmniejszonej macierzy tworzy bazę przestrzeni rozpiętej przez kolumny zmniejszonej macierzy (być może po przenumerowaniu kolumn). Oczywiście k ¬ w. Pokażemy, że pierwszych k kolumn dużej macierzy tworzy bazę przestrzeni rozpiętej przez kolumny dużej macierzy. Liniowo niezależne kolumny po przedłużeniu nadal są liniowo niezależne. Pozostaje pokazać, że rozpinają przestrzeń. j-tą kolumnę zmniejszonej macierzy można zapisać w postaci a1j a11 a12 a1k . . . = µ + µ + · · · + µ 1 2 k . . awj aw1 aw2 awk Jawnie alj = µ1 al1 + µ2 al2 + · · · + µk alk , l = 1, 2, . . . w. r-ty wiersz jest kombinacją liniową pierwszych w wierszy o współczynnikach β1 , β2 , . . . , βw . Mnożąc powyższe równości przez β1 , β2 , . . . , βw i dodając do siebie otrzymujemy równość arj = µ1 ar1 + µ2 ar2 + · · · + µk ark . Dlatego a1j a11 a12 a1k . = µ1 . + µ2 . + · · · + µk . . amj am1 am2 amk 54 Zamieniając rolami rzędy i kolumny otrzymujemy nierówność w ¬ k. Stąd w = k. Uwaga. Rząd macierzy jest wymiarem AK n (wymiarem obrazu). Wymiar przestrzeni rozwiązań układu jednorodnego (wymiar jądra) wynosi więc n minus rząd macierzy A. Uwaga. Jeśli do wybranego równania dodamy inne równanie pomnożone przez dowolną liczbę, otrzymamy nowy układ równań. Nowy układ równań będzie miał ten sam zbiór rozwiązań co wyjściowy układ równań (operacja jest odwracalna). Zobaczymy na przykładzie, jak wielokrotne wykonywanie opisanej operacji (operacji elementarnej) pozwala znaleźć rozwiązanie układu równań. Przykład. x + 5y + 7z − 3t = 9 x + 6y + 12z − 4t = 13 2x + 6y − 5z + 2t = 11 Od drugiego równania odejmujemy pierwsze równanie. + 5y + 7z − 3t = 9 y + 5z − t = 4 2x + 6y − 5z + 2t = 11 x Od trzeciego równania odejmujemy pierwsze równanie pomnożone przez 2. x + 5y + 7z − 3t = 9 y + 5z − t = 4 − 4y − 19z + 8t = −7 Do czwartego równania dodajemy równanie drugie pomnożone przez 4. x + 5y + 7z − 3t = 9 y + 5z − t = 4 z + 4t = 9 Teraz jest już prosto. t może być dowolne. Kolejno znajdujemy z, y, x. t dowolne z = 9 − 4t = 4 + t − 5z = −41 + 21t x = 9 + 3t − 7z − 5y = 151 − 74t y W szczególności dla t = 2 otrzymujemy z = 1, y = 1, x = 3. Rozwiązanie możemy zapisać w postaci x 151 −74 y −41 21 = + t z 9 −4 t 0 1 Twierdzenie. Stosując operacje elementarne układ równań liniowych można sprowadzić do takiej postaci, że w i-tym równaniu (i > 1) nie występują zmienne x1 , x2 , . . . xi−1 (być może po przenumerowaniu zmiennych). Dowód indukcyjny. 55 Jak znaleźć rząd macierzy? Uwaga. • Jeśli do wybranej kolumny (wiersza) dodamy inną kolumnę (wiersz) pomnożoną przez dowolny skalar, to rząd macierzy nie ulegnie zmianie. Wystarczy spojrzeć na równość (v1 , · · · , vn ∈ V, α1 , · · · , αn , β ∈ K) α1 v1 + α2 v2 + · · · + αn vn = α1 (v1 + βv2 ) + (α2 − βα1 )v2 + · · · + αn vn . • Zmieniając kolejność wierszy i kolumn, nie zmieniamy rzędu macierzy. • Możemy też mnożyć wiersze i kolumny przez niezerowe skalary. Przykład (macierz układu równań z przykładu). Odejmujemy wiersze. 1 5 7 −3 1 5 7 −3 rząd 1 6 12 −4 = rząd 0 1 5 −1 = 2 6 −5 2 2 6 −5 2 1 5 7 −3 1 5 7 −3 rząd 0 1 5 −1 = rząd 0 1 5 −1 = 0 0 1 4 0 −4 −19 8 1 0 0 0 = rząd 0 1 0 0 0 0 1 0 W ostatnim kroku odejmujemy kolumny. Rząd macierzy równy jest 3. Spostrzeżenie. Wykonując opisane wyżej operacje, można dowolną macierz sprowadzić do takiej postaci, że w miejscach 11, 22,..., rr stoją jedynki, a w pozostałych miejscach stoją zera (r jest rzędem macierzy). Równania i wyznaczniki Rozwiążemy układ równań a11 x1 + a12 x2 = b1 a21 x1 + a22 x2 = b2 Mnożymy pierwsze równanie przez a22 , a drugie przez a12 i odejmujemy od siebie (a11 a22 − a21 a12 )x1 = b1 a22 − b2 a12 . Teraz mnożymy pierwsze równanie przez a21 a drugie przez a11 i odejmujemy od siebie (a11 a22 − a21 a12 )x2 = b2 a11 − b1 a21 Jeśli a11 a22 − a21 a12 6= 0, to rozwiązania wyrażają się wzorami (zwanymi wzorami Cramera) x1 = (b1 a22 − b2 a12 )/(a11 a22 − a21 a12 ), 56 x2 = (b2 a11 − b1 a21 )/(a11 a22 − a21 a12 ). Wyrażenie a11 a22 − a21 a12 nazywamy wyznacznikiem macierzy. Piszemy det a11 a21 a12 a22 = a11 a22 − a21 a12 . Rozpatrzmy układ równań 2 × 3 a11 x1 + a12 x2 + a13 x3 = 0 a21 x1 + a22 x2 + a23 x3 = 0 Postępując podobnie jak w przypadku układu 2 × 2 uzyskujemy jedno z rozwiązań a x1 = det 12 a22 a13 , a23 a x2 = − det 11 a12 a13 , a23 a x3 = det 11 a21 a12 . a22 Zajmiemy się obecnie układem 3 równań z 3 niewiadomymi. + a12 x2 + a13 x3 = b1 a x + a22 x2 + a23 x3 = b2 21 1 a31 x1 + a32 x2 + a33 x3 = b3 a11 x1 Spróbujmy wyeliminować x2 i x3 . W tym celu znajdziemy czynniki y1 , y2 takie, że a12 y1 + a22 y2 + a32 y3 = 0 a13 y1 + a23 y2 + a33 y3 = 0 Wiemy już jak y1 , y2 , y3 wyrazić przez wyznaczniki a y1 = det 22 a23 a32 , a33 a y2 = − det 12 a13 a32 , a33 a y3 = det 12 a13 a22 . a23 Mnożąc pierwsze równanie przez y1 , drugie przez y2 , a trzecie przez y3 i dodając stronami otrzymujemy (a11 y1 + a21 y2 + a31 y3 )x1 = b1 y1 + b2 y2 + b3 y3 . Stąd wynika wzór na x1 . Podobnie znajdujemy x2 i x3 . Wyrażenie przed x1 nazywamy wyznacznikiem z macierzy 3 × 3 a11 det a21 a31 a12 a22 a32 a13 a23 = a33 a22 a32 a a32 a a22 − a21 det 12 + a31 det 12 = a23 a33 a13 a33 a13 a23 = a11 a22 a33 − a11 a23 a32 − a21 a12 a33 + a21 a13 a32 + a31 a12 a23 − a31 a13 a22 . = a11 det Takie przedstawienie wyznacznika nazywa się rozwinięciem Laplace’a. Podstawowe własności wyznacznika. βa11 det βa21 a12 a22 a = β det 11 a21 57 a12 , a22 a + b11 det 11 a21 + b21 a12 a22 a = det 11 a21 a12 a22 b + det 11 b21 a12 , a22 a a11 1 0 det 11 = 0, det = 1. a21 a21 0 1 Można powiedzieć krótko: wyznacznik jest antysymetryczną wieloliniową funkcją kolumn. Uwagi o symetrii. Niech A, B oznaczają kolumny. Mamy 0 = det(A + B, A + B) = det(A, A + B) + det(B, A + B) = = det(A, A) + det(A, B) + det(B, A) + det(B, B) = det(A, B) + det(B, A). Stąd det(B, A) = − det(A, B). Odwrotnie, jeśli dla dowolnych A, B det(B, A) = − det(A, B), to podstawiając B = A, otrzymujemy 2 det(A, A) = 0. Jeśli charakterystyka ciała nie jest równa 2, to możemy podzielić przez 2. Uwaga. Podstawowe własności wyznacznika w pełni określają wyznacznik a b det c d a+0 b = det 0+c d a 0 + det 0 d 1 0 + ad det 0 1 a b = det 0 0 1 1 = ab det 0 0 a b = det 0 d 0 b + det c 0 0 0 + det c d 0 1 + bc det 1 0 1 0 = (ad − bc) det 0 1 a det 11 a21 0 b + det c d = = 0 0 + cd det 1 1 = ad − bc. Dodatkowa własność a12 a22 a = det 11 a12 a21 . a22 Definicja i własności wyznacznika Definicja. Wyznacznik macierzy n × n określony jest wzorem a11 a 21 det · an1 a12 a22 · an2 · a1n X · a2n = znak(σ)aσ1 1 aσ2 2 · · · aσn n . · · σ∈Sn · ann Przykład. a11 det a21 a31 a12 a22 a32 58 a13 a23 = a33 = = a11 a22 a33 + a21 a32 a13 + a31 a12 a23 − a11 a32 a23 − a31 a22 a13 − a21 a12 a33 . Definicja. Macierz a11 a 12 B= · a1n a21 a22 · a2n · am1 · am2 · · · amn nazywamy macierzą transponowaną do macierzy a11 a A = 21 · am1 a12 a22 · am2 · a1n · a2n . · · · amn Piszemy B = At . Twierdzenie. det(At ) = det(A). Dowód. Jeśli µ jest permutacją odwrotną do permutacji σ, to znak(µ) = znak(σ) oraz aσ1 1 aσ2 2 · · · aσn n = a1µ1 a2µ2 · · · anµn . Dlatego X znak(σ)aσ1 1 aσ2 2 · · · aσn n = det(A) = σ∈Sn = znak(µ)a1µ1 a2µ2 · · · anµn = det(At ). X µ∈Sn Twierdzenie. Niech A1 , A2 , . . . , An będą kolumnami macierzy A. Zachodzą relacje 1. det(A1 , . . . , Aj +Bj , . . . , An ) = det(A1 , . . . , Aj , . . . , An )+det(A1 , . . . , Bj , . . . , An ). 2. det(A1 , . . . , βAj , . . . , An ) = β det(A1 , . . . , Aj , . . . , An ), β ∈ K. 3. Jeśli Ai = Aj dla pewnych dwóch różnych indeksów i, j, to det(A) = 0. 4. det(I) = 1. Krótko: Wyznacznik jest wieloliniową antysymetryczną funkcją kolumn. Dowód. 1. X znak(σ)aσ1 1 · · · (aσj j + bσj j ) · · · aσn n = σ∈Sn X = znak(σ)aσ1 1 · · · aσj j · · · aσn n + σ∈Sn + X znak(σ)aσ1 1 · · · bσj j · · · aσn n . σ∈Sn 59 2. X znak(σ)aσ1 1 · · · βaσj j · · · aσn n = σ∈Sn X =β znak(σ)aσ1 1 · · · aσj j · · · aσn n . σ∈Sn S 3. Składniki dzielimy na dwa rozłączne zbiory Sn = An An (i, j) (An oznacza zbiór permutacji parzystych). Ponieważ aσi i = aσi j i aσj j = aσj i , więc składnik odpowiadający permutacji σ redukuje się ze składnikiem odpowiadającym σ(i, j). W ten sposób wszystkie składniki znoszą się. 4. Mamy tylko jeden niezerowy składnik odpowiadający permutacji tożsamościowej. Twierdzenie. Jeśli funkcja f : A → f (A) spełnia własności (1-3), to f (A) = det(A)f (I). Jeśli dodatkowo funkcja f spełnia warunek (4), to f (A) = det(A). Dowód. Załóżmy, że funkcja A → f (A) posiada własności (1-3). Niech e1 , e2 , . . . , en będą wektorami bazy standardowej. X f (A) = f ( ai 1 1 e i 1 , i1 XX i1 ··· X i2 X ai2 2 ei2 , . . . i2 X ai n n e i n ) = in ai1 1 ai2 2 · · · ain n f (ei1 , ei2 , . . . , ein ) in Jeśli ij = ik dla pewnych j, k, to f (ei1 , ei2 , . . . , ein ) = 0. W sumie pozostaną tylko składniki dla których i1 , i2 , . . . , in jest pewną permutacją liczb 1, 2, . . . , n. Oznaczmy tą permutację literą σ. Wtedy f (eσ1 , eσ1 , . . . , eσ1 ) = znak(σ)f (e1 , e2 , . . . , en ), Mamy zatem f (A) = X aσ1 1 aσ2 2 · · · aσn n f (eσ1 , eσ1 , . . . , eσ1 ) = σ∈Sn = f (I) X aσ1 1 aσ2 2 · · · aσn n znak(σ) = f (I) det(A). σ∈Sn Uwaga. • Jeśli zamienimy miejscami dwie kolumny (wiersze), to wyznacznik zmieni znak na przeciwny. • Jeśli do pewnej kolumny (wiersza) dodamy inną kolumnę (wiersz) pomnożony przez dowolny skalar, to wyznacznik nie zmieni się. • Jeśli w macierzy poniżej przekątnej mamy same zera, to wyznacznik jest iloczynem wyrazów leżących na przekątnej. 60 Dowód punktu drugiego. det(A1 + βA2 , A2 , A3 . . .) = det(A1 , A2 , A3 , . . .) + β det(A2 , A2 , A3 , . . .). Drugi składnik po prawej stronie równy jest 0. Przykład. 1 3 5 1 3 2 1 3 0 det 2 4 7 = det 2 4 3 = det 2 4 −1 = 3 2 8 3 2 6 3 2 0 1 3 0 1 3 0 1 0 0 = det 0 0 −1 = det 0 0 −1 = det 0 0 −1 = 3 2 0 0 −7 0 0 −7 0 = −1(−7)(−1) = −7 Twierdzenie. det(AB) = det(A) det(B). Dowód. Funkcja f określona wzorem f (A1 , A2 , . . . , An ) = f (A) = det(BA) = det(BA1 , BA2 , . . . , BAn ) posiada własności (1-3) i dlatego f (A) = f (I) det(A) = det(BI) det(A) = det(B) det(A). Twierdzenie. Kolumny macierzy A są liniowo niezależne ⇔ det(A) 6= 0. Dowód. Jeśli kolumny macierzy A są liniowo niezależne, to pewna kolumna jest kombinacją liniową pozostałych kolumn. Wyznacznik nie zmieni się, jeśli od tej kolumny odejmiemy dowolną kombinację liniową pozostałych kolumn. W szczególności możemy tak odjąć, aby otrzymać zero. Wyznacznik takiej macierzy wynosi zero. Odwrotnie. Jeśli kolumny macierzy A o rozmiarach n × n są liniowo niezależne, to rozpinają przestrzeń K n . Dlatego istnieje macierz B taka, że ek = n X bik Ai i=1 czyli AB = I. Ale wtedy det(A) det(B) = det(AB) = 1 i det(A) 6= 0. Przy okazji pokazaliśmy, że A−1 istnieje ⇔ det(A) 6= 0. Niezmienniki Niech G będzie macierzą odwracalną n × n, a A dowolną macierzą n × n. Zachodzą równości det GAG−1 = det A, rząd GAG−1 = rząd A. Inną wielkością posiadającą taką własność jest ślad macierzy. 61 Definicja. Ślad macierzy n × n określony jest wzorem · a1n · · = a11 + a22 + · · · + ann . · ann a11 tr · an1 Własności śladu. • tr(A + B) = trA + trB. • trβA = βtrA, β ∈ K. • trAB = trBA. Dowód ostatniej własności. trAB = n X n X n X n X aij bji = i=1 j=1 bji aij = trBA. j=1 i=1 Jeśli G jest macierzą odwracalną, to trGAG−1 = trG−1 GA = trA. Własności te pozwalają zdefiniować wyznacznik i ślad przekształcenia liniowego f : V → V . Ustalamy dowolną bazę przestrzeni V i przyjmujemy, że det(f ) = det(F ) oraz trf = trF . gdzie F jest macierzą przekształcenia f . Wynik nie zależy od wyboru bazy, ponieważ w innej bazie f ma macierz BF B −1 . Definicja. Wielomianem charakterystycznym macierzy A nazywamy wielomian f (x) = det(A − xI). Niech f (x) = f0 + f1 x + · · · + fn−1 xn−1 + (−x)n . Widzimy, że f0 = det(A), a fn−1 = (−)n−1 trA. Łatwo sprawdzić, że wielomiany charakterystyczne macierzy A i GAG−1 są równe. Wynika stąd, że współczynniki f0 , f1 , . . . , fn−1 nie zmienią się, jeśli macierz A zastąpić macierzą GAG−1 . Rozwinięcie Laplace’a Definicja. Niech A będzie macierzą n × n. Dopełnieniem algebraicznym elementu aij nazywamy wyznacznik macierzy powstałej z macierzy A przez wykreślenie i-tego wiersza i j-tej kolumny pomnożony przez (−1)i+j . Dopełnienie będziemy oznaczać symbolem Aij . Twierdzenie. det(A) = n X j=1 akj Akj = n X aik Aik , i=1 62 k = 1, 2, . . . , n. Dowód. Udowodnimy pierwszą równość dla k = 1. Ogólne twierdzenie wynika z tego, że wyznacznik jest antysymetryczną funkcją kolumn oraz z tego, że wyznacznik macierzy transponowanej równy jest wyznacznikowi oryginalnej macierzy. Niech n X f (A) = aj1 Ai1 . i=1 Wystarczy pokazać, że funkcja f posiada podstawowe własności definiujące wyznacznik (1-4). Jedynym trudniejszym punktem jest pokazanie, że jeśli dwie kolumny są równe, to wartość funkcji wynosi zero. Załóżmy więc, że Al = Am (l < m). Pozostaną wtedy dwa składniki al1 Al1 i am1 Am1 , przy czym al1 = am1 . Przed wyznacznikami określającymi Al1 i Am1 stoją znaki (−1)1+l i (−1)1+m . Macierze określające Al1 , Am1 różnią się położeniem kolumny Al = Am (pozbawionej pierwszego elementu). W pierwszej macierzy kolumna ta pojawia się na miejscu m − 1,a w drugiej na miejscu l. Jest więc przesunięta o m−l−1 miejsc w lewo. Wyznaczniki definiujące dopełnienia różnią się znakiem (−1)m−l−1 . Dopełnienia mają więc różne znaki i redukują się. Uwaga. Rozwinięcie Laplace’a można przyjąć jako rekurencyjną definicję wyznacznika. Wniosek. Zachodzą równości n X aik Ajk = n X aki Akj = det(A)δij . i=1 i=1 Dowód. Jeśli i 6= j, to pierwsza suma jest wyznacznikiem macierzy, której i-ty wiersz równy jest j-temu, a druga suma wyznacznikiem macierzy której i-ta kolumna równa jest j-tej. Wyznaczniki takich macierzy równe są zero. Wniosek. Jeśli det(A) 6= 0, to macierz B o wyrazach bij = Aji /det(A) jest macierzą odwrotną do macierzy A. (Aij nadal oznacza dopełnienie algebraiczne elementu aij ). Przykład. a11 a21 a12 a22 −1 = 1 a11 a22 − a12 a21 a22 −a21 −a12 . a11 Wzory Cramera. Jeśli det A 6= 0, to rozwiązania układu równań n X aij xj = bi , i = 1, 2, . . . , n, j=1 wyrażają się wzorami det(A(k) ) xk = , det(A) k = 1, 2, . . . , n, gdzie A(k) oznacza macierz A z i-tą kolumną zamienioną na kolumnę b. 63 Dowód. Załóżmy, że x1 , x2 , . . . , xn spełniają rozważany układ równań. Wtedy det(A(k) ) = n X bi Aik = i=1 n X n X ( aij Aik )xj = j=1 i=1 n X n X ( aij xj )Aik = i=1 j=1 n X δjk det(A)xj = xk det(A). j=1 Dwa twierdzenia Twierdzenie. Niech f będzie funkcją określoną na zbiorze macierzy kwadratowych n × n o wyrazach z ciała K i wartościach z w ciele K. Jeśli f (A + B) = f (A) + f (B), f (βA) = βf (A), f (AB) = f (BA), to istnieje c ∈ K takie, że f (A) = c tr(A). Dowód. Dwie pierwsze własności f pozwalają napisać f (A) = n X n X pji aij = tr(P A). i=1 j=1 Trzecia własność daje równość tr(P AB) = tr(P BA). Stąd 0 = tr(P AB) − tr(P BA) = tr(P AB) − tr(AP B) = tr(P A − AP )B. Niech E st będą macierzami o wyrazach δis δjt . Niech M będzie dowolną macierzą. Zachodzi równość n n tr(M E st ) = XX mji δis δjt = mts . i=1 j=1 Podstawiając pod B macierze E st otrzymujemy równość P A = AP. Podstawiając pod A macierze E st otrzymujemy pis δjt = δis ptj . Stąd pij = 0 i pii = pjj dla i 6= j, czyli P = cI dla pewnego c ∈ K. Przy okazji dowiedzieliśmy się, że macierz, która komutuje z dowolną inną macierzą jest proporcjonalna do macierzy jednostkowej. 64 Niech A będzie macierzą kwadratową n×n. Przestrzeń macierzy n×n ma wymiar n2 . Dlatego macierze 2 I, A, A2 , . . . , An są liniowo zależne. Okazuje się, że I, A, A2 , . . . , An są liniowo zależne. Twierdzenie. (Hamilton, Cayley) Niech A będzie macierzą kwadratową n × n, f (x) = det(A − xI) = f0 + f1 x + f2 x2 + · · · + fn xn . Wtedy f (A) = f0 I + f1 A + f2 A2 + · · · + fn An = 0. Przykład. f (x) = 1 3 4 2 2 1−x 3 4 2−x −3 1 3 4 2 − 10 = x2 − 3x − 10, 1 0 0 1 = 0 0 . 0 0 Dowód twierdzenia. Niech M D będzie macierzą, której ij-ty element jest dopełnieniem ij-tego elementu macierzy M . Wiemy, że zachodzi równość M (M D )t = det(M )I. Niech M = A − xI. Elementy macierzy M D są wielomianami stopnia niewiększego niż n. Dlatego (M D )t = B0 + xB1 + x2 B2 + · · · + xn−1 Bn−1 . Mamy więc równość (A − xI)(B0 + xB1 + x2 B2 + · · · + xn−1 Bn−1 ) = f (x)I. Porównując wyrazy przy tych samych potęgach x otrzymujemy równości AB0 = f0 I, AB1 − B0 = f1 I, AB2 − B1 = f2 I, · · · , −Bn−1 = fn I. Mnożąc pierwsze równanie przez I, drugie przez A, trzecie przez A2 ,..., a następnie dodając stronami otrzymujemy z lewej strony 0, a z prawej f (A). Wektory i wartości własne Rozpatrujemy przekształcenia liniowe pewnej przestrzeni liniowej w tą samą przestrzeń. Definicja. Niezerowy wektor v nazywamy wektorem własnym przekształcenia liniowego F , jeśli F v = λv dla pewnego skalara λ. Przykład: 2 1 2 3 1 2 65 1 . 2 =4 Twierdzenie. Wektory własne należące do różnych wartości własnych są liniowo niezależne. Dowód nie wprost. Niech v1 , v2 , . . . , vk będą wektorami własnymi przekształcenia F należącymi do różnych wartości własnych λ1 , λ2 , . . . , λk . Załóżmy, że wektory v1 , v2 , . . . , vk są liniowo zależne. Niech a1 v1 +a2 v2 +· · ·+al vl = 0 będzie najkrótszą kombinacją liniową o niezerowych współczynnikach równą zero. Jeśli a1 v1 + a2 v2 + · · · + al vl = 0, to 0 = F (a1 v1 + a2 v2 + · · · + al vl ) = λ1 a1 v1 + λ2 a2 v2 + · · · + λl al vl . Odejmując od powyższej równości sumę λ1 (a1 v1 + a2 v2 + · · · + al vl ) = 0 dostajemy (λ2 − λ1 )a2 v2 + (λ3 − λ1 )a3 v3 + · · · + (λl − λ1 )al vl = 0. W ten sposób otrzymujemy krótszą kombinację liniową o niezerowych współczynnikach równą zero i mamy sprzeczność. Uwaga. Przekształcenie liniowe może nie mieć wektorów własnych. Jednak w przestrzeniach skończonego wymiaru nad ciałem algebraicznie domkniętym (np. nad ciałem liczb zespolonych), przekształcenie liniowe zawsze ma co najmniej jeden wektor własny. Niech F będzie macierzą n × n. Równanie F v = λv możemy przepisać w postaci (F − λI)v = 0. Jeśli v 6= 0, to kolumny macierzy F − λI są liniowo zależne, co oznacza że det(F − λI) = 0. Wyrażenie f (λ) = det(F − λI) jest wielomianem stopnia n zwanym wielomianem charakterystycznym macierzy F . Zatem, aby znaleźć wektory i wartości własne macierzy F szukamy pierwiastków wielomianu charakterystycznego, a następnie rozwiązujemy układ równań liniowych. Przykład: 1−λ 3 f (λ) = det = λ2 − 3λ − 10. 4 3−λ Pierwiastkami są liczby -2, 5. Pozostaje rozwiązać równania 1 3 4 2 x y = −2 x , y 1 3 4 2 x y =5 x . y Rozwiązaniami są wektory 1 , −1 3 . 4 Wektory te tworzą bazę (zgodnie z twierdzeniem, będzie tak zawsze, jeśli wielomian charakterystyczny ma n różnych pierwiastków). Macierz przekształcenia w znalezionej bazie jest diagonalna i zachodzi relacja 1 3 −1 4 −1 1 3 4 2 1 3 −1 4 66 = −2 0 . 0 5 Może się zdarzyć, że przekształcenie nie ma wektorów własnych. Obrót o 90 stopni nie ma wektorów własnych w przestrzeni R2 . Jeśli wielomian charakterystyczny ma pierwiastki wielokrotne, to wektory własne mogą nie tworzyć bazy. Przykładem jest macierz 0 1 . 0 0 Wartości własne są równe zero, ale przekształcenie jest niezerowe. W przypadku przestrzeni nieskończonego wymiaru jest jeszcze gorzej. Nawet w przypadku ciała algebraicznie domkniętego może nie być wektorów własnych. Np. przekształcenie liniowe z przestrzeni wielomianów w przestrzeń wielomianów, które mnoży wielomian zmiennej x przez x nie ma wektorów własnych. W dalszej części rozważamy tylko przestrzenie liniowe nad ciałem liczb zespolonych, choć wiele faktów ma miejsce w ogólniejszej sytuacji. Twierdzenie. Macierz M można zdiagonalizować ⇔ macierz M jest pierwiastkiem pewnego wielomianu nie mającego pierwiastków wielokrotnych. Dowód. Jeśli macierz M można zdiagonalizować, to M = BDB −1 , gdzie D jest macierzą diagonalną z liczbami λ1 , λ2 , . . . , λn na przekątnej. Niech f (x) = (x−λ1 )(x−λ2 ) · · · (x−λk ). Wtedy f (M ) = Bf (D)B −1 = B0B −1 = 0. Dowód implikacji odwrotnej jest trudniejszy. Dowód przeprowdzimy dla k = 3. Uogólnienie jest oczywiste. Załóżmy więc, że f (M ) = 0 dla f (x) = (x − λ1 )(x − λ2 )(x − λ3 ), gdzie λ1 , λ2 , λ3 są trzema różnymi liczbami. Możemy znaleźć trzy liczby c1 , c2 , c3 takie, że c1 (x − λ2 )(x − λ3 ) + c2 (x − λ1 )(x − λ3 ) + c3 (x − λ1 )(x − λ2 ) = 1. Wystarczy podstawić x = λ1 , λ2 , λ3 i okaże się c1 = 1/(λ1 − λ2 )(λ1 − λ3 ), itd. Po takim podstawiemiu wyrażenie stanie się wielomianem stopnia nie większego niż 2 przyjmującym w 3 różnych punktach wartość 1, czyli wielomianem stałym. Niech P1 = c1 (M − λ2 I)(M − λ3 I), P2 = c2 (M − λ1 I)(M − λ3 I), P3 = c3 (M − λ1 I)(M − λ2 I). Wtedy P1 + P2 + P3 = I, Pi Pj = 0, i 6= j, Pi2 = I. Przestrzenie Vi = Pi V są niezmiennicze, tzn. M Vi ⊆ Vi . Mamy bowiem równość M Pi = λi Pi . W każdej z podprzestrzeni Vi działanie M polega na mnożeniu przez λi . Możemy w każdej podprzestrzeni wybrać jak jakąś bazę. Suma tak wybranych baz będzie bazą przestrzeni V . Będzie to baza, w której przekształcenie M ma postać diagonalną. Należy tylko pokazać, że wektory wybrane z różnych podprzestrzeni Vi są liniowo niezależne. Weźmy zatem w1 ∈ V1 , w2 ∈ V2 , w3 ∈ V3 . Jeśli w1 + w2 + w3 = 0, to 0 = Pi (w1 + w2 + w3 ) = w1 . 67 Uwaga. Wiemy, że macierz jest pierwiastkiem wielomianu chrakterystycznego. Dla dowolnego wielomianu f różnego od stałej, możemy rozpatrywać wielomian f /nwd(f, f 0 ), gdzie prim oznacza pochodną. Tak utworzony wielomian ma te same pierwiastki co f , ale nie ma pierwiastków wielokrotnych. Wystarczy więc sprawdzić, czy M jest pierwiastkiem tak utworzonego wielomianu. Formy kwadratowe Definicja. Formą liniową nazywamy przekształcenie liniowe f : V → K. Jeśli v1 , v2 , . . . , vn jest bazą V i f vi = ai ∈ K dla i = 1, 2, . . . , n, to f (x1 v1 + x2 v2 + · · · + xn vn ) = a1 x1 + a2 x2 + · · · + an xn . Definicja. Symetryczną formą dwuliniową nazywamy przekształcenie B : V × V → K takie, że • B(v, w) = B(w, v), • B(v + u, w) = B(v, w) + B(u, w), B(w, v + u) = B(w, v) + B(w, u) • B(βv, w) = βB(v, w) = B(v, βw). Jeśli v = x1 v1 + x2 v2 + · · · + xn vn , a w = y1 v1 + y2 v2 + · · · + yn yn , to B(v, w) = n n X X B(vi , vj )xi yj , i=1 j=1 przy czym aij = B(vi , vj ) = B(vj , vi ) = aji . Mamy więc B(v, w) = n X n X aij xi yj . i=1 j=1 Od tego miejsca K = R. Niech Q(v) = B(v, v). Zachodzą równości Q(βv) = β 2 Q(v), 1 B(v, u) = (Q(v + u) − Q(v) − Q(u)). 2 Definicja. Przekształcenie Q : V → R nazywamy formą kwadratową, jeśli Q(βv) = β 2 Q(v), a przekształcenie B określone wzorem 1 B(v, u) = (Q(v + u) − Q(v) − Q(u)) 2 jest dwuliniową formą symetryczną. 68 Możemy napisać Q(v) = B(v, v) = n X n X aij xi yj . i=1 j=1 Symetryczną macierz A o wyrazach aij nazywamy macierzą formy kwadratowej Q w bazie v1 , v2 , . . . , vn . Jeśli y1 x1 y x 2 2 , , v = u= · · yn xn to B(u, v) = ut Av, Q(u) = ut Au. Przykład. Q x1 x2 = ax21 + 2bx1 x2 + cx22 = a b x2 ) b c = ( x1 x1 . x2 Diagonalizacja Lagrange’a Przykład. x21 + 4x1 x2 + 3x22 = (x1 + 2x2 )2 − x22 = y12 − y22 , y1 = x1 + 2x2 y 2 = x2 1 −2 0 1 t 1 2 2 3 x1 = y1 − 2y2 x2 = y2 1 −2 0 1 = 1 0 . 0 −1 Drugi przykład. x1 x2 = 1 1 1 −1 x1 + x2 2 2 − x1 − x2 2 y1 = (x1 + x2 )/2 y2 = (x1 − x2 )/2 t 0 1/2 1/2 0 2 = y12 − y22 . x1 = y 1 + y 2 x2 = y1 − y2 1 1 1 −1 = 1 0 . 0 −1 Uwaga. Jeśli G jest macierzą odwracalną, to macierze Gt AG i A mają taki sam rząd. Definicja. Rząd formy kwadratowej = rząd macierzy formy kwadratowej. Twierdzenie. Diagonalizacja formy kwadratowej. Niech n n Q(x1 , x2 , . . . , xn ) = XX i=1 j=1 69 aij xi xj , aij = aji . Istnieje macierz odwracalna B o wyrazach bij taka, że po podstawieniu xi = n X bik yk , k=1 otrzymujemy Q(x1 , x2 , . . . , xn ) = n X di yi2 . i=1 Inaczej B t AB = D, gdzie D jest macierzą diagonalną. Dowód indukcyjny ze względu na n. Dla n = 1 nie ma czego dowodzić. Załóżmy, że twierdzenie jest prawdziwe dla n − 1. Jeśli aii 6= 0 dla pewnego i np. dla i = n, to Q = ann (xn + a1n /ann x1 + · · · + an−1,n /ann xn−1 )2 + Q1 . Q1 na mocy założenia indukcyjnego możemy zdiagonalizować. Mamy więc 2 Q = ann yn2 + d1 y12 + · · · + dn−1 yn−1 , gdzie yn = xn + a1n /an x1 + · · · + an−1,n /ann xn−1 . Jeśli natomiast dla każdego i aii = 0, ale dla pewnych i, j aij 6= 0, to postępując jak w drugim przykładzie sprowadzamy problem do pierwszego przypadku. zi = (xi + xj )/2, zj = (xi − xj )/2, xi xj = zi2 − zj2 . Przypadek Q = 0 jest oczywisty. Przykład. Q = x1 x2 + x2 x3 + x3 x1 = (x1 + x2 )2 /4 − (x1 − x2 )2 /4 + (x1 + x2 )x3 = = (x1 + x2 + 2x3 )2 /4 − (x1 − x2 )2 /4 − x23 = y12 − y − 22 − y32 , y1 = x1 /2 + x2 /2 + x3 y 2 = x1 /2 − x2 /2 y 3 = x3 Twierdzenie Sylwestera o bezwładności. Każdą formę kwadratową nad R możemy zapisać w postaci Q = x21 + x22 + · · · + x2p − x2p+1 − xp+2 x2p+2 + · · · − x2p+q , przy czym p + q jest rzędem formy, a liczby p, q nie zależą od przestawienia. Definicja. Parę liczb (p, q) nazywamy sygnaturą formy kwadratowej. 70 Dowód. Jedynym trudniejszym miejscem, jest pokazanie, że jeśli po podstawieniu xi = n X bik yk k=1 2 2 2 − yr+2 + · · · − yr+s , Q = y12 + y22 + · · · + yr2 − yr+1 to r = p i t = q. Oczywiście r + s = p + q. Załóżmy, że p < r oraz ys+1 = ys+2 = · · · = ys+t = 0. Układ równań p równań x1 = x2 = · · · = xp = 0 z r niewiadomymi y1 , y2 , . . . , yr ma niezerowe rozwiązanie (więcej niewiadomych niż równań). Takie rozwiązanie prowadzi do sprzeczności Q = y12 + y22 + · · · + yr2 > 0 −x2p+1 − x2p+2 − · · · − x2p+q = Q. Dlatego p = r. Definicja. Mówimy, że forma kwadratowa Q jest dodatnio określona, jeśli dla każdego niezerowego wektora v Q(v) > 0. Sygnatura dodatnio określonej formy równa jest (n, 0). Twierdzenie. Niech A będzie macierzą formy kwadratowej Q. Forma kwadratowa Q jest dodatnio określona, wtedy i tylko wtedy, gdy a11 a 21 det · ak1 a12 a22 · ak2 · · · a1k · · · a2k > 0 dla k = 1, 2, 3, . . . , n. ··· · · · · akk Dowód. Jeśli forma Q jest dodatnio określona, to Gt AG = I dla pewnej macierzy G. Wtedy 1 = det Gt AG = (det G)2 det A i det A > 0. Rozpatrując formy kwadratowe (x1 , x2 , . . . , xk ) → Q(x1 , x2 , . . . , xk , 0, 0, . . . , 0) widzimy, że wszystkie wypisane w twierdzeniu wyznaczniki są dodatnie. Implikację odwrotną udowodnimy indukcyjnie. Twierdzenie jest oczywiste dla n = 1. Załóżmy, że twierdzenie jest prawdziwe dla n − 1 oraz, że wszystkie wyznaczniki z twierdzenia są dodatnie. Z założenia indukcyjnego forma kwadratowa (x1 , . . . , xn−1 ) → Q(x1 , . . . , xn−1 , 0) jest dodatnio określona. Po diagonalizacji 2 Q(x1 , . . . , xn−1 , 0) = y12 + · · · + yn−1 . Zatem 2 + 2b1 y1 xn + . . . + 2bn−1 yn−1 xn + cx2n = Q(x1 , . . . , xn ) = y12 + · · · + yn−1 71 = (y1 − b1 x1 )2 + ... + (yn−1 − bn−1 xn−1 )2 + (c − b21 − b22 − ... − b2n−1 )x2n . Wyznacznik formy kwadratowej Q wyraża się wzorem 1 0 det · b1 0 1 · b2 · · · b1 · · · b2 = c − b21 − b22 − ... − b2n−1 . ··· · ··· c Z założenia wyznacznik ten jest dodatni i dlatego forma kwadratowa Q jest dodatnio określona. Grupa obrotów i grupa Lorentza Niech Q będzie formą kwadratową, a B odpowiadającą symetryczną formą dwuliniową. Q(v) = v t Av, B(u, w) = ut Aw, At = A. Odwracalne przekształcenia liniowe zachowujące formę kwadratową (a więc również odpowiadającą jej formę dwuliniową tworzą grupę. Q(Rv) = Q(v), B(Ru, Rw) = ut Rt ARw = B(u, w) = ut Aw. Podstawiając za u, w wektory bazy standardowej e1 , e2 , . . . , en widzimy, że Rt AR = A. Jeśli Q = x21 + x22 + · · · + x2n , to A = I i Rt R = I. Grupę przekształceń zachowującą Q nazywamy grupą obrotów i oznaczamy symbolem O(n, R). Ponieważ det I = det Rt R = (det R)2 , więc det R = ±1. Obroty o wyznaczniku 1 tworzą podgrupę nazywaną grupą obrotów właściwych i oznaczaną symbolem SO(n, R). Przypomnę, że grupę wszystkich odwracalnych macierzy n × n o wyrazach rzeczywistych oznaczamy symbolem GL(n, R), a jej podgrupę złożoną z macierzy o wyznaczniku 1 oznaczamy symbolem SL(n, R). Elementy grupy SO(2, R) możemy zapisać w postaci R(θ) = cos θ sin θ − sin θ cos θ Elementy grupy SO(3, R) możemy zapisać w postaci R3 (α)R1 (β)R3 (γ), gdzie cos θ R1 (θ) = sin θ 0 − sin θ cos θ 0 0 0 , 1 1 0 R3 (θ) = 0 cos θ 0 sin θ 72 0 − sin θ . cos θ Kąty α, β, γ nazywa się kątami Eulera. Inny sposób opisu polega na podaniu osi i kąta obrotu. Jeśli Q = x20 − x21 − x22 − x23 , to odpowiednia grupa nazywa się grupą Lorentza. Jeśli ograniczymy się do formy Q = x20 − x21 , to elementy grupy będziemy mogli zapisać w postaci cosh θ sinh θ R(θ) = sinh θ cosh θ Iloczyn skalarny Iloczyn skalarny w Rn definiujemy wzorem x · y = x1 y1 + x2 y2 + · · · + xn yn . W szczególności w R3 mamy x · y = x1 y1 + x2 y2 + x3 y3 . Kwadrat długości wektora w R3 wyraża się wzorem x2 = x · x = x21 + x22 + x33 . Zachodzi równość (x − y)2 = x2 + y 2 − 2x · y. Twierdzenia cosinusów mówi, że (x − y)2 = x2 + y 2 − 2|x||y| cos α, gdzie |x|, |y| oznaczają długości wektorów x, y, a α jest kątem miedzy wektorami. Porównując dwa ostatnie wzory dostajemy x · y = |x||y| cos α. W przestrzeni Cn trzeba nieco zmienić definicję iloczynu skalarnego, tak aby kwadrat niezerowego wektora był niezerowy. Przyjmujemy więc definicję x · y = x1 y 1 + x2 y 2 + · · · + xn y n . Od tego miejsca iloczyn skalarny wektorów x, y będziemy oznaczać symbolem hx|yi. Podstawowe własności iloczynu skalarnego przyjmujemy jako ogólną definicję iloczynu skalarnego. Definicja. Niech V będzie przestrzenią liniową nad ciałem C (lub R). Iloczynem skalarnym nazywamy przekształcenie V × V → C (lub R) posiadające następujące własności • hy|xi = hx|yi, • hαx|yi = αhx|yi, 73 • hx + y|zi = hx|zi + hy|zi, • hx|xi ∈ R i hx|xi 0. • Jeśli hx|xi = 0, to x = 0. Przestrzeń liniową nad ciałem R (C) z określonym iloczynem skalarnym nazywamy przestrzenią euklidesową (przestrzenią unitarną). Iloczyn skalarny pozwala na zdefiniowanie normy wektora. Definicja. Normą wektora nazywamy przekształcenie V → R o następujących własnościach • ||x|| 0, • ||αx|| = |α| ||x||, • ||x + y|| ¬ ||x|| + ||y|| (nierówność trójkąta), • jeśli ||x|| = 0, to x = 0. W przestrzeniach euklidesowych (unitarnych) normę definiujemy wzorem ||x|| = q hx|xi. Można pokazać, że tak zdefiniowana norma posiada wszystkie wymagane własności. Jedynym trudniejszym punktem jest dowód nierówności trójkąta. Do dowodu potrzebna nam będzie nierówność Schwarza. Twierdzenie. |hx|yi| ¬ ||x|| ||y||. Dowód. Jeśli y = 0, to mamy równość. Przyjmijmy więc, że y 6= 0. Zachodzi nierówność 0 ¬ ||x − αy|| = ||x||2 + αhx|yi + αhy|xi + αα||y||2 . Podstawiając α = hx|yi/||y|| otrzymujemy po prawej stronie nierówności ||x||2 − hy|xihx|yi/||y||2 . Teraz możemy wykazać nierówność trójkąta ||x + y||2 = ||x||2 + ||y||2 + hx|yi + hy|xi ¬ ||x||2 + ||y||2 + 2|hx|yi| ¬ ||x||2 + ||y||2 + 2||x|| ||y|| = (||x|| + ||y||)2 . Tożsamości polaryzacyjne. Jeśli norma zdefiniowana jest wzorem ||x|| = hx|xi, to iloczyn skalarny możemy wyrazić przez normy odpowiednio dobranych wektorów q 3 X 1 hx|yi = (||x + y|| + i||x + iy|| − ||x − y|| − i||x − iy||) = ik ||x + ik y||. 4 k=0 74 W przypadku przestrzeni nad ciałem R wzór jest prostszy 1 hx|yi = (||x + y|| − ||x − y||). 2 Mamy poza tym tożsamość równoległoboku ||x + y||2 + ||x − y||2 = 2(||x||2 + ||y||2 ). Normy w Cn nie związane z iloczynem skalarnym: ||x||∞ = max |xk |, 1¬k¬n X ||x||1 = |xk |. 1¬k¬n Norma pozwala nam wprowadzić odległość wzorem d(x, y) = ||x − y||. Można sprawdzić, że d : V × V → R spełnia podstawowe własności odległości • d(x, y) 0, • d(x, y) = d(y, x), • d(x, y) ¬ d(x, z) + d(z, y), • d(x, y) = 0 ⇔ x = y. Ortonormalne zbiory wektorów Definicja. Mówimy, że zbiór wektorów {u1 , u2 , u3 , . . .} jest ortonormalny, jeśli hui |uj i = δij . Wektory tworzące zbiór ortonormalny są liniowo niezależne. Jeśli w = a1 u1 + a2 u2 + · · · + an un = 0, to ai = hw|ui i = 0. Jeśli x = x1 u1 + x2 u2 + . . . + xn un i y = y1 u1 + y2 u2 + · · · + yn un , to hx|yi = x1 y1 + x2 y2 + · · · + xn yn . Twierdzenie. Jeśli wektory v1 , v2 , v3 . . . , z przestrzeni unitarnej (euklidesowej) są liniowo niezależne, to znajdziemy ortonormalne wektory u1 , u2 , u3 , · · · , takie, że dla i = 1, 2, 3, . . . ui jest kombinacją liniową wektorów v1 , v2 , . . . , vi . Dowód. Wektory ortonormalne możemy wyrazić wzorami w1 = v1 , u1 = w1 /||w1 ||, w2 = v2 − hv2 |u1 iu1 , u2 = w2 /||w2 ||, w3 = v3 − hv3 |u1 iu1 − hv3 |u2 iu2 , u3 = w3 /||w3 ||, ......... Twierdzenie. Jeśli zbiór {u1 , u2 , . . . , un } jest ortonormalny, to • ||x − hx|u1 iu1 − hx|u2 iu2 − · · · − hx|un iun || ¬ ||x − a1 u1 − a2 u2 − · · · − an un ||, 75 • ||x||2 |hx|u1 i|2 + |hx|u2 i|2 + · · · + |hx|un i|2 (nierówność Bessela). Bazę złożoną z wektorów ortonormalnych nazwiemy bazą ortonormalną. Twierdzenie. Jeśli u1 , u2 , . . . , un jest bazą ortonormalną, to • Jeśli hx|ui i = 0 dla i = 1, 2, . . . , n, to x = 0. • x = hx|u1 iu1 + hx|u2 iu2 + · · · + hx|un iun . • ||x||2 = |hx|u1 i|2 + |hx|u2 i|2 + · · · + |hx|un i|2 , • hx|yi = hx|u1 i hu1 |yi + hx|u2 i hu2 |yi + · · · + hx|un ihun |yi. Dowód pierwszej nierówności. ||x − a1 u1 − a2 u2 − · · · − an un ||2 − −||x − hx|u1 iu1 − hx|u2 iu2 − · · · − hx|un iun ||2 = = |hx|u1 i − a1 |2 + |hx|u2 i − a2 |2 + · · · + |hx|un i − an |2 . Przekształcenia hermitowskie i unitarne Rozważamy przestrzeń unitarną (przestrzeń nad ciałem liczb zespolonych z iloczynem skalarnym). Załóżmy, że v1 , v2 , . . . , vn tworzą bazę ortonormalną przestrzeni V , a A przekształceniem liniowym V w V . Jeśli Avi = n X Aji vj , i=1 to Aij = hvi |Avj i. Definicja. B nazywamy przekształceniem sprzężonym do przekształcenia liniowego A : V → V , jeśli hAx|yi = hx|Byi. W przestrzeniach skończonego wymiaru przekształcenie sprzężone zawsze istnieje. Wystarczy zauważyć, że macierz przekształcenia sprzężonego do A spełnia relacje t Bij = Aji , piszemy B = A = A† . Twierdzenie. Przekształcenie sprzężone, jeśli istnieje, to jest jedyne. Przekształcenie sprzężone jest przekształceniem liniowym. Dowód. Jeśli hAx|yi = hx|Byi = hx|Cyi, to hx|By − Cyi = 0. Podstawiając x = By − Cy, otrzymujemy hBy − Cy|By − Cyi = 0, a stąd By = Cy czyli B = C. Przekształcenie sprzężone do A będziemy oznaczać symbolem A† . Liniowość i kolejne twierdzenie dowodzimy podobnie. Twierdzenie. Własności sprzężenia 76 • (βA)† = βA† , • (A + B)† = A† + B † , • (AB)† = B † A† , • A†† = A. Definicja. Przekształcenie liniowe A : V → V nazywamy przekształceniem hermitowskim, jeśli A† = A. Macierz przekształcenia hermitowskiego spełnia relację Aij = Aji . Taką macierz nazywamy macierzą hermitowską. Twierdzenie. Wartości własne przekształcenia hermitowskiego są rzeczywiste. Dowód. Jeśli A† = A i Ax = λx, x 6= 0, to hAx|xi = hλx|xi = λ||x||2 . Z drugiej strony hAx|xi = hx|Axi = hx|λxi = λ||x||2 . Stąd λ = λ i λ ∈ R. Twierdzenie. Wektory własne przekształcenia hermitowskiego należące do różnych wartości własnych są do siebie prostopadłe. Dowód. Jeśli A† = A, Ax = λx, Ay = µy, to hAx|yi = λhx|yi. Z drugiej strony hAx|yi = hx|Ayi = µhx|yi (wiemy już, że µ ∈ R). Stąd dla λ 6= µ hx|yi = 0. Definicja. Przekształceniem unitarnym nazywamy odwracalne przekształcenie liniowe zachowujące normę wektora. Warunek ||U x|| = ||x|| jest równoważny z warunkiem hU x|U yi = hx|yi. W przestrzeni skończonego wymiaru nie trzeba dodatkowo zakładać odwracalnosci. Macierz przekształcenia unitarnego spełnia warunek U † U = I i nazywa się macierzą unitarną. Macierze unitarne rozmiaru n tworzą grupę zwaną grupą unitarną oznaczaną symbolem U (n). 1 = det U † U = det U † det U = det U det U . Dlatego | det U | = 1. Podgrupę złożoną z macierzy unitarnych o wyznaczniku 1 oznaczamy symbolem SU (n). Twierdzenie. Wartości własne przekształcenia unitarnego są liczbami zespolonymi o module 1. Dowód. Jeśli U x = λx, x 6= 0, to ||X|| = ||U x|| = |λ| ||x|| i |λ| = 1. Twierdzenie. Wektory własne przekształcenia unitarnego należące do różnych wartości własnych są prostopadłe do siebie. Dowód. Załóżmy, że U x = λx i U y = µy. Mamy hx|yi = hU x|U yi = λµhx|yi = λµ−1 hx|yi. Stąd dla λ 6= µ hx|yi = 0. 77 Twierdzenie spektralne. Rozpatrujemy przekształcenie hermitowskie (lub unitarne) określone na przestrzeni skończonego wymiaru. Istnieje baza ortonormalna przestrzeni złożona z wektorów własnych rozpatrywanego przekształcenia. Dowód indukcyjny względem wymiaru przestrzeni. Dla n = 1 nie ma czego dowodzić. Niech A : V → V . A† = A (dla przekształcenia unitarnego dowód jest podobny). Załóżmy, że twierdzenie jest prawdziwe dla n − 1. Pokażemy, że jest prawdziwe dla n. Istnieje co najmniej jeden wektor własny λ (wielomian charakterystyczny ma co najmniej jeden pierwiastek zespolony). Mamy Ax = λx. Niech W będzie zbiorem wektorów prostopadłych do x. W jest podprzestrzenią V . Wymiar W równy jest n − 1. Jeśli y ∈ W , to Ay ∈ W . Mamy bowiem hAy|xi = hy|Axi = hx|λyi = λhy|xi = 0. Z założenia indukcyjnego istnieje baza ortonormalna złożona z wektorów własnych przekształcenia A : W → W . Bazę tą uzupełniamy wektorem x, o którym możemy założyć, że jest unormowany do 1). Podobne rozważania można przeprowadzić w przypadku przestrzeni Euklidesowej. Przekształcenia hermitowskie nazywamy wtedy przekształceniami symetrycznymi, a przekształcenia unitarne przekształceniami ortogonalnymi lub po prostu obrotami. Właściwie wystarczy wyciągnąć pewne wnioski z wymienionych twierdzeń. Wiele ciekawych faktów można znaleźć w książce Byrona i Fullera (Matematyka w fizyce klasycznej i kwantowe). Można tam znaleźć wiele pominiętych tu szczegółów. Jerzy Cisło, 2007 78