Dla dowolnego wielomianu P rozważmy jego odchylenie od zera na
Transkrypt
Dla dowolnego wielomianu P rozważmy jego odchylenie od zera na
Dla dowolnego wielomianu P rozważmy jego odchylenie od zera na przedziale I, tzn. liczbę max{|P (x)| : x ∈ I}. Z uwagi na postać prawej strony w równości (9.3) ważnym zagadnieniem staje się dla dowolnie ustalonego n ∈ N minimalizacja wartości (9.7) w zależności od doboru punktów węzłowych xl ∈ I, l ∈ Z0,n, przy dowolnie ustalonym przedziale domkniętym i ograniczonym I. W szczególności dla I := [−1; 1] powstaje problem: spośród wielomianów unormowanych stopnia n ∈ N wyznaczyć wielomian Pn mający najmniejsze odchylenie od zera na przedziale [−1; 1]. Pełne rozwiązanie tego problemu daje twierdzenie Czebyszewa, w którego dowodzie skorzystamy z następującego lematu. Lemat 10.14. Jeśli Q jest wielomianem i dla pewnego z ∈ R (10.15) Q(z) = Q0(z) = 0 , to istnieje wielomian R o tej własności, że (10.16) Q(x) = (x − z)2R(x) , x ∈ R, Dowód. Ponieważ Q(z) = 0 , więc z twierdzenia Bézout’a wynika, że (10.17) Q(x) = (x − z)P (x) , x ∈ R, dla pewnego wielomianu P . Różniczkując stronami równość (10.17) otrzymujemy Q0(x) = P (x) + (x − z)P 0(x) . Stąd i z (10.15) mamy 0 = Q0(z) = P (z) + 0P 0(z) , a więc P (z) = 0 . Stosując ponownie twierdzenie Bézout’a stwierdzamy istnienie wielomianu R o tej własności, że P (x) = (x − z)R(x) , x ∈ R. To łącznie z (10.17) daje (10.16), co kończy dowód. Twierdzenie 10.18 (P. L. Czebyszew). Dla dowolnego n ∈ N ze wszystkich wielomianów unormowanych stopnia n najmniejsze odchylenie od zera w przedziale [−1; 1] ma wielomian 1 (10.19) Ten(x) = n−1 Tn(x) , −1 ¬ x ¬ 1 2 1 i jest on wyznaczony jednoznacznie. Dowód. Załóżmy, że Pn jest wielomianem unormowanym stopnia n spełniającym nierówność 1 (10.20) max |Pn(x)| ¬ n−1 . −1¬x¬1 2 Z (10.20) i (10.3) wynika, że (10.21) max |Pn(x)| ¬ −1¬x¬1 1 2n−1 = max |Ten(x)| . −1¬x¬1 Niech Qn := Pn − Ten . Z lematu 10.2 wynika, że 1 (10.22) Ten(xm) = n−1 (−1)m , m = 0, 1, 2, . . . , n , 2 gdzie m π , m = 0, 1, 2, . . . , n . xm := cos n Rozpatrzmy następujące przypadki. Przypadek I. Załóżmy, że m ∈ Z1,n−1 i (10.23) Qn(xm) = 0 . Z (10.21) i (10.22) wynika, że na przedziale [−1; 1] funkcje Pn i Ten osiągają w punkcie xm maksimum, gdy m jest liczbą parzystą, bądź minimum, gdy m jest liczbą nieparzystą. W każdym z tych przypadków Pn0 (xm) = Ten0 (xm) = 0 , a więc (10.24) Q0n(xm) = Pn0 (xm) − Ten0 (xm) = 0 . Z (10.23), (10.24) i z lematu 10.14 wynika, że xm jest co najmniej podwójnym miejscem zerowym wielomianu Qn, tzn. (10.25) Qn(x) = (x − xm)2Rn−2(x) , 2 x∈R dla pewnego wielomianu Rn−2 stopnia nie większego niż n − 2. Przypadek II. Załóżmy, że m ∈ Z1,n i Qn(xm) 6= 0 i Qn(xm−1) 6= 0 . (10.26) Jeśli m jest liczbą parzystą, to na mocy (10.21) i (10.22) otrzymujemy Pn(xm) ¬ 1 2n−1 a to wobec (10.26) daje 1 = Ten(xm) i Pn(xm−1) − n−1 = Ten(xm−1) , 2 Qn(xm) = Pn(xm) − Ten(xm) < 0 (10.27) oraz (10.28) Qn(xm−1) = Pn(xm−1) − Ten(xm−1) > 0 . Jeśli m jest liczbą nieparzystą, to na mocy (10.21) i (10.22) mamy Pn(xm) − 1 2n−1 = Ten(xm) i Pn(xm−1) ¬ 1 2n−1 = Ten(xm−1) , a to wobec (10.26) oznacza, że (10.29) Qn(xm) = Pn(xm) − Ten(xm) > 0 oraz (10.30) Qn(xm−1) = Pn(xm−1) − Ten(xm−1) < 0 . Z nierówności (10.27),(10.28) i (10.29),(10.30) wynika, że wielomian Qn przyjmuje punktach xm i xm−1 wartości przeciwnych znaków, a więc z zasady Darboux wielomian Qn jako funkcja ciągła ma miejsce zerowe w przedziale otwartym (xm; xm−1) , czyli (10.31) Qn(zm) = 0 dla pewnego zm ∈ (xm; xm−1) . Stosując twierdzenie Bézout’a, otrzymujemy z (10.31) rozkład (10.32) Qn(x) = (x − zm)Rn−1(x) , 3 x∈R, dla pewnego wielomianu Rn−1 stopnia nie większego niż n − 1. Przypadek III. Załóżmy na koniec, że m = 0 lub m = n oraz (10.33) Qn(xm) = 0 . Stąd stosując twierdzenie Bézout’a otrzymujemy rozkład (10.32) z zm := xm. Powyższe trzy przypadki implikują na podstawie rozkładów (10.25) i (10.32) istnienie ciągu zm ∈ [xm; xm−1] , m = 1, 2, . . . , n o tej własności, że (10.34) Qn(x) = R(x) n Y (x − zm) , m=1 dla pewnego wielomianu R. Ponieważ Pn i Ten są wielomianami unormowanymi stopnia n, więc różnica Qn jest wielomianem stopnia nie większego niż n − 1 . Gdyby R był wielomianem niezerowym, to równość (10.34) oznaczałaby, że wielomian Qn ma stopień nie mniejszy niż n, a to oznacza sprzeczność. Zatem R(x) = 0, x ∈ R, co wobec równości (10.34) implikuje Qn(x) = 0, x ∈ R i w konsekwencji Pn = Ten. Wykazaliśmy zatem, że nierówność (10.20) implikuje równość Pn = Ten. Stosując prawo kontrapozycji, widzimy, że dla dowolnego wielomianu unormowanego P stopnia n różnego od Ten zachodzi nierówność 1 (10.35) max |P (x)| > n−1 . −1¬x¬1 2 Ponieważ 1 max |Ten(x)| = n−1 , −1¬x¬1 2 więc z (10.35) wnioskujemy, że Ten jest jedynym wielomianem unormowanym stopnia n mającym na przedziale [−1; 1] najmniejsze odchylenie od zera, co kończy dowód. 4 Rozdział 11 Optymalne rozmieszczenie węzłów interpolacyjnych W tym rozdziale oszacujemy błąd interpolacji wielomianowej, czyli odchylenie wielomianu interpolacyjnego od interpolowanej funkcji. Podstawowe znaczenie ma tutaj następujący wniosek z twierdzenia 9.1. Twierdzenie 11.1. Niech n ∈ N i a, b ∈ R spełniają warunek a < b. Załóżmy, że f jest funkcją (n + 1)-krotnie różniczkowalną w sposób ciągły na przedziale I := [a; b] i P jest wielomianem stopnia deg(P ) ¬ n spełniającym warunek (9.2) dla punktów węzłowych (2k + 1)π a + b b−a · cos + , 2 2n + 2 2 Wówczas dla każdego x ∈ I, (11.2) (11.3) xk := k ∈ Z0,n . (b − a)n+1 sup |f (n+1)(t)| . |f (x) − P (x)| ¬ 2n+1 2 (n + 1)! t∈I Dowód. Ustalmy dowolnie n, a, b ∈ R, f i P spełniające założenia twierdzenia. Ponieważ b − a > 0, więc funkcja 1 1 (11.4) [−1; 1] 3 t → L(t) := (b − a)t + (a + b) . 2 2 jest rosnąca, L([−1; 1]) = I i (11.5) L−1(x) = 2x − a − b ∈ [−1; 1] , b−a 5 x∈I . Złożenie f ◦ L jest funkcją (n + 1)-krotnie różniczkowalną w sposób ciągły na przedziale [−1; 1] i P ◦ L jest wielomianem stopnia deg(P ◦ L) ¬ n spełniającym wobec (11.2) warunek P ◦ L(L−1(xk )) = P (xk ) = f (xk ) = f ◦ L(L−1(xk )) , k ∈ Z0,n . Ponadto z (11.4) i (11.5) mamy (2k + 1)π , k ∈ Z0,n . 2n + 2 Z lematu 10.2, twierdzenia 10.10 i jednoznaczności rozkładu wielomianu na czynniki liniowe wynika, że n Y Tn+1(x) = 2n (x − L−1(xl )) , x ∈ R . L−1(xk ) = cos l=0 Stąd na mocy twierdzenia 10.18 i (10.3) wynika, że n Y 1 1 max |x − L−1(xl )| = n max |Tn+1(x)| = n . 2 x∈[−1;1] 2 x∈[−1;1] l=0 Stosując więc wniosek 9.5 w odniesieniu do funkcji f ◦ L i P ◦ L w miejsce funkcji f i P , odpowiednio, otrzymujemy oszacowanie 1 (11.6) max |f ◦ L(t) − P ◦ L(t)| ¬ n sup |(f ◦ L)(n+1)(t)| . 2 (n + 1)! t∈[−1;1] t∈[−1;1] Ponieważ (f ◦ L)(n+1)(t) = b−a 2 n+1 f (n+1)(L(t)) , t ∈ [−1; 1] oraz max |f (t) − P (t)| = max |f ◦ L(t) − P ◦ L(t)| t∈I t∈[−1;1] sup |f (n+1)(t)| = sup |f (n+1)(L(t))| , t∈I t∈[−1;1] więc z nierówności (11.6) otrzymujemy oszacowanie (11.3), co kończy dowód twierdzenia. 6 Uwaga 11.7. Z twierdzenia 10.18 wynika, że węzły interpolacji wielomianowej xk , k ∈ Z0,n, określone wzorem (11.2) minimalizują prawą stronę w nierówności (9.6) i minimum jest osiągnięte tylko dla takiego doboru węzłów. 7 Rozdział 12 Wzór Taylora W przypadku funkcji regularnej można wykorzystać klasyczny wzór Taylora w celu jej aproksymacji wielomianami. Daje on prostą metodę lokalnego przybliżania funkcji wielomianami w otoczeniach punktu rozwinięcia. W tym rozdziale przedstawimy dowody wzoru Taylora z różnymi postaciami reszt. Zacznijmy od najprostszej ale ważnej ze względów teoretycznych postaci wzoru Taylora z resztą w postaci Peano. Twierdzenie 12.1. Niech I ⊂ R będzie przedziałem i niech x0 ∈ I będzie jego punktem wewnętrznym. Jeśli n ∈ N i f : I → R jest funkcją n − 1-krotnie różniczkowalną w pewnym otoczeniu punktu x0 i ma pochodną n-tego rzędu w x0, to Rn(x − x0) =0, (12.2) lim x→x0 (x − x0 )n−1 gdzie (12.3) 1 Rn(x − x0) := f (x) − n−1 (k) X f (x0) k! k=0 (x − x0)k , x∈I . Dowód. Ustalmy dowolnie n ∈ N. Dla n = 1, Rn(x − x0) = R1(x − x0) = f (x) − f (x0) → 0 gdy x → x0 , (x − x0)n−1 gdyż f jest funkcją ciągłą w punkcie x0 jako funkcja różniczkowalna w tym punkcie. Zatem równość (12.2) zachodzi dla n = 1. Możemy więc założyć, że n 2. 1 Tu i w dalszym ciągu przyjmujemy f (0) := f dla dowolnej funkcji f 8 Różniczkując funkcję Rn łatwo stwierdzamy, że dla każdego m ∈ Z0,n−1, (12.4) Rn(m)(x − x0) := f (m) n−1 X f (k)(x0) (x − x0)k−m , (x) − (k − m)! x∈I . k=m Definiując funkcje I 3 x 7→ u(x) := Rn(x − x0) i I 3 x 7→ v(x) := (x − x0)n−1 widzimy zatem, że u(m)(x0) = 0 = v (m)(x0) dla każdego m ∈ Z0,n−2. Ponadto z (12.4) mamy u(n−1)(x) 1 = (f (n−1)(x) − f (n−1)(x0)) → 0 gdy x → x0 . (n−1) v (x) (n − 1)! Z reguły de l’Hospitala wynika zatem, że u(n−2)(x) u(n−1)(x) lim = lim (n−1) =0. x→x0 v (n−2) (x) x→x0 v (x) Stosując ponownie regułę de l’Hospitala dostajemy u(n−2)(x) u(n−3)(x) = lim (n−2) =0, lim x→x0 v x→x0 v (n−3) (x) (x) gdy n 3. Powtarzając ten proces dochodzimy w końcu do równości u(0)(x) u(1)(x) lim = lim (1) =0, x→x0 v (0) (x) x→x0 v (x) z której wynika równość (12.2). Do zastosowań numerycznych równość (12.2) jest nieprzydatna, gdyż nie potrafimy na jej podstawie oszacować reszty Rn(x − x0) w zależności od x. Precyzyjniejszy opis reszty Rn(x − x0) można podać wzmacniając założenie regularności funkcji f . Najczęściej rozważa się w takim przypadku wzór Taylora z resztą w postaci Lagrange’a. Przyjmijmy dla uproszczenia notacji, że dla dowolnych p, q ∈ R, I[p; q] := [min({p, q}); max({p, q})] oraz I(p; q) := (min({p, q}); max({p, q})). Twierdzenie 12.5. Niech I ⊂ R będzie przedziałem i niech x0 ∈ I będzie jego punktem wewnętrznym. Jeśli n ∈ N i f : I → R jest funkcją n-krotnie 9 różniczkowalną w sposób ciągły na I, to dla dowolnego x ∈ I \ {x0}, f (n)(x̃) (12.6) Rn(x − x0) = (x − x0)n n! dla pewnego x̃ ∈ I(x0; x). Dowód. Załóżmy, że I, f, n, x0 i x 6= x0 są dowolnie ustalonymi obiektami spełniającymi założenia twierdzenia. Istnieje wówczas dokładnie jedno M ∈ R spełniające równość (12.7) Rn(x − x0) = M (x − x0)n Z założenia i z (12.3) wynika, że funkcja (12.8) I 3 t 7→ g(t) := Rn(t − x0) − M (t − x0)n jest n − krotnie różniczkowalna na przedziale I. Z (12.7) mamy g(x0) = g(x) = 0. Stosując twierdzenie Rolle’a wnioskujemy, że g (1)(x1) = 0 dla pewnego x1 ∈ I(x0; x). Ponieważ g (1)(x0) = 0 gdy n 2, więc stosując ponownie twierdzenie Rolle’a wnioskujemy, że g (2)(x2) = 0 dla pewnego x2 ∈ I(x0; x1), o ile n 2. Kontynuując to rozumowanie stwierdzamy w końcu, że g (n)(xn) = 0 dla pewnego xn ∈ I(x0; xn−1). Z drugiej strony różniczkując n − krotnie funkcję g w punkcie xn dostajemy g (n)(xn) = f (n)(xn) − n!M . f (n)(xn) Zatem xn ∈ I(x0; xn−1) ⊂ I(x0; x) i M = . To wobec (12.7) implikuje n! równość (12.6) z podstawieniem x̃ := xn, co kończy dowód. Przykad 12.9. Zastosujemy teraz wzór Taylora z resztą w postaci Lagrange’a w celu aproksymacji funkcji R 3 t 7→ f (t) := sin t. Obliczając pierwsze cztery 10 pochodne funkcji f otrzymujemy dla dowolnego x ∈ R, f (0)(x) = sin x , f (1)(x) = cos x , f (2)(x) = − sin x , f (3)(x) = − cos x , f (4)(x) = sin x . Stąd f (2n)(0) = 0 oraz f (2n+1)(0) = (−1)n , n ∈ Z0 . Stosując twierdzenie 12.5 dla x0 := 0 widzimy, że dla dowolnych x ∈ R i n ∈ N, (12.10) 2n−1 x3 x5 n−1 x sin x = x − + − · · · + (−1) + R2n+1(x) 3! 5! (2n − 1)! gdzie sin x̃ x2n+1 (2n + 1)! dla pewnego x̃ ∈ I[0; x]. W ten sposób uzyskujemy oszacowanie błędu aproksymacji R2n+1(x) = (−1)n (12.11) |x|2n+1 , |R2n+1(x)| ¬ (2n + 1)! x ∈ R, n ∈ N . W szczególności dla n := 3 dostajemy oszacowanie 3 5 7 sin x − x − x + x ¬ |x| < 0, 2 · 10−10 , 3! 5! 5040 x ∈ [−0, 1; 0, 1] . Z (12.11) wynika, że lim R2n+1(x) = 0 , n→∞ x∈R. To łącznie z (12.10) daje znane rozwinięcie funkcji sin w szereg potęgowy ∞ 2n−1 X n−1 x sin x = (−1) , (2n − 1)! n=1 11 x∈R.