Dla dowolnego wielomianu P rozważmy jego odchylenie od zera na

Transkrypt

Dla dowolnego wielomianu P rozważmy jego odchylenie od zera na
Dla dowolnego wielomianu P rozważmy jego odchylenie od zera na przedziale
I, tzn. liczbę max{|P (x)| : x ∈ I}. Z uwagi na postać prawej strony w równości
(9.3) ważnym zagadnieniem staje się dla dowolnie ustalonego n ∈ N minimalizacja
wartości (9.7) w zależności od doboru punktów węzłowych xl ∈ I, l ∈ Z0,n, przy
dowolnie ustalonym przedziale domkniętym i ograniczonym I. W szczególności dla
I := [−1; 1] powstaje problem: spośród wielomianów unormowanych stopnia n ∈
N wyznaczyć wielomian Pn mający najmniejsze odchylenie od zera na przedziale
[−1; 1]. Pełne rozwiązanie tego problemu daje twierdzenie Czebyszewa, w którego
dowodzie skorzystamy z następującego lematu.
Lemat 10.14. Jeśli Q jest wielomianem i dla pewnego z ∈ R
(10.15)
Q(z) = Q0(z) = 0 ,
to istnieje wielomian R o tej własności, że
(10.16)
Q(x) = (x − z)2R(x) ,
x ∈ R,
Dowód. Ponieważ Q(z) = 0 , więc z twierdzenia Bézout’a wynika, że
(10.17)
Q(x) = (x − z)P (x) ,
x ∈ R,
dla pewnego wielomianu P . Różniczkując stronami równość (10.17) otrzymujemy
Q0(x) = P (x) + (x − z)P 0(x) .
Stąd i z (10.15) mamy
0 = Q0(z) = P (z) + 0P 0(z) ,
a więc P (z) = 0 . Stosując ponownie twierdzenie Bézout’a stwierdzamy istnienie
wielomianu R o tej własności, że
P (x) = (x − z)R(x) ,
x ∈ R.
To łącznie z (10.17) daje (10.16), co kończy dowód.
Twierdzenie 10.18 (P. L. Czebyszew). Dla dowolnego n ∈ N ze wszystkich
wielomianów unormowanych stopnia n najmniejsze odchylenie od zera w przedziale [−1; 1] ma wielomian
1
(10.19)
Ten(x) = n−1 Tn(x) , −1 ¬ x ¬ 1
2
1
i jest on wyznaczony jednoznacznie.
Dowód. Załóżmy, że Pn jest wielomianem unormowanym stopnia n spełniającym
nierówność
1
(10.20)
max |Pn(x)| ¬ n−1 .
−1¬x¬1
2
Z (10.20) i (10.3) wynika, że
(10.21)
max |Pn(x)| ¬
−1¬x¬1
1
2n−1
= max |Ten(x)| .
−1¬x¬1
Niech Qn := Pn − Ten . Z lematu 10.2 wynika, że
1
(10.22)
Ten(xm) = n−1 (−1)m , m = 0, 1, 2, . . . , n ,
2
gdzie
m π , m = 0, 1, 2, . . . , n .
xm := cos
n
Rozpatrzmy następujące przypadki.
Przypadek I. Załóżmy, że m ∈ Z1,n−1 i
(10.23)
Qn(xm) = 0 .
Z (10.21) i (10.22) wynika, że na przedziale [−1; 1] funkcje Pn i Ten osiągają w punkcie xm maksimum, gdy m jest liczbą parzystą, bądź minimum, gdy m jest liczbą
nieparzystą. W każdym z tych przypadków
Pn0 (xm) = Ten0 (xm) = 0 ,
a więc
(10.24)
Q0n(xm) = Pn0 (xm) − Ten0 (xm) = 0 .
Z (10.23), (10.24) i z lematu 10.14 wynika, że xm jest co najmniej podwójnym
miejscem zerowym wielomianu Qn, tzn.
(10.25)
Qn(x) = (x − xm)2Rn−2(x) ,
2
x∈R
dla pewnego wielomianu Rn−2 stopnia nie większego niż n − 2.
Przypadek II. Załóżmy, że m ∈ Z1,n i
Qn(xm) 6= 0 i Qn(xm−1) 6= 0 .
(10.26)
Jeśli m jest liczbą parzystą, to na mocy (10.21) i (10.22) otrzymujemy
Pn(xm) ¬
1
2n−1
a to wobec (10.26) daje
1
= Ten(xm) i Pn(xm−1) ­ − n−1 = Ten(xm−1) ,
2
Qn(xm) = Pn(xm) − Ten(xm) < 0
(10.27)
oraz
(10.28)
Qn(xm−1) = Pn(xm−1) − Ten(xm−1) > 0 .
Jeśli m jest liczbą nieparzystą, to na mocy (10.21) i (10.22) mamy
Pn(xm) ­ −
1
2n−1
= Ten(xm) i Pn(xm−1) ¬
1
2n−1
= Ten(xm−1) ,
a to wobec (10.26) oznacza, że
(10.29)
Qn(xm) = Pn(xm) − Ten(xm) > 0
oraz
(10.30)
Qn(xm−1) = Pn(xm−1) − Ten(xm−1) < 0 .
Z nierówności (10.27),(10.28) i (10.29),(10.30) wynika, że wielomian Qn przyjmuje
punktach xm i xm−1 wartości przeciwnych znaków, a więc z zasady Darboux wielomian Qn jako funkcja ciągła ma miejsce zerowe w przedziale otwartym (xm; xm−1)
, czyli
(10.31)
Qn(zm) = 0 dla pewnego zm ∈ (xm; xm−1) .
Stosując twierdzenie Bézout’a, otrzymujemy z (10.31) rozkład
(10.32)
Qn(x) = (x − zm)Rn−1(x) ,
3
x∈R,
dla pewnego wielomianu Rn−1 stopnia nie większego niż n − 1.
Przypadek III. Załóżmy na koniec, że m = 0 lub m = n oraz
(10.33)
Qn(xm) = 0 .
Stąd stosując twierdzenie Bézout’a otrzymujemy rozkład (10.32) z zm := xm.
Powyższe trzy przypadki implikują na podstawie rozkładów (10.25) i (10.32)
istnienie ciągu zm ∈ [xm; xm−1] , m = 1, 2, . . . , n o tej własności, że
(10.34)
Qn(x) = R(x)
n
Y
(x − zm) ,
m=1
dla pewnego wielomianu R. Ponieważ Pn i Ten są wielomianami unormowanymi stopnia n, więc różnica Qn jest wielomianem stopnia nie większego niż n − 1 . Gdyby
R był wielomianem niezerowym, to równość (10.34) oznaczałaby, że wielomian Qn
ma stopień nie mniejszy niż n, a to oznacza sprzeczność. Zatem R(x) = 0, x ∈ R,
co wobec równości (10.34) implikuje Qn(x) = 0, x ∈ R i w konsekwencji Pn = Ten.
Wykazaliśmy zatem, że nierówność (10.20) implikuje równość Pn = Ten. Stosując prawo kontrapozycji, widzimy, że dla dowolnego wielomianu unormowanego P
stopnia n różnego od Ten zachodzi nierówność
1
(10.35)
max |P (x)| > n−1 .
−1¬x¬1
2
Ponieważ
1
max |Ten(x)| = n−1 ,
−1¬x¬1
2
więc z (10.35) wnioskujemy, że Ten jest jedynym wielomianem unormowanym stopnia
n mającym na przedziale [−1; 1] najmniejsze odchylenie od zera, co kończy dowód.
4
Rozdział 11
Optymalne rozmieszczenie węzłów
interpolacyjnych
W tym rozdziale oszacujemy błąd interpolacji wielomianowej, czyli odchylenie wielomianu interpolacyjnego od interpolowanej funkcji. Podstawowe znaczenie ma tutaj
następujący wniosek z twierdzenia 9.1.
Twierdzenie 11.1. Niech n ∈ N i a, b ∈ R spełniają warunek a < b. Załóżmy,
że f jest funkcją (n + 1)-krotnie różniczkowalną w sposób ciągły na przedziale
I := [a; b] i P jest wielomianem stopnia deg(P ) ¬ n spełniającym warunek
(9.2) dla punktów węzłowych
(2k + 1)π a + b
b−a
· cos
+
,
2
2n + 2
2
Wówczas dla każdego x ∈ I,
(11.2)
(11.3)
xk :=
k ∈ Z0,n .
(b − a)n+1
sup |f (n+1)(t)| .
|f (x) − P (x)| ¬ 2n+1
2
(n + 1)! t∈I
Dowód. Ustalmy dowolnie n, a, b ∈ R, f i P spełniające założenia twierdzenia.
Ponieważ b − a > 0, więc funkcja
1
1
(11.4)
[−1; 1] 3 t → L(t) := (b − a)t + (a + b) .
2
2
jest rosnąca, L([−1; 1]) = I i
(11.5)
L−1(x) =
2x − a − b
∈ [−1; 1] ,
b−a
5
x∈I .
Złożenie f ◦ L jest funkcją (n + 1)-krotnie różniczkowalną w sposób ciągły na
przedziale [−1; 1] i P ◦ L jest wielomianem stopnia deg(P ◦ L) ¬ n spełniającym
wobec (11.2) warunek
P ◦ L(L−1(xk )) = P (xk ) = f (xk ) = f ◦ L(L−1(xk )) ,
k ∈ Z0,n .
Ponadto z (11.4) i (11.5) mamy
(2k + 1)π
, k ∈ Z0,n .
2n + 2
Z lematu 10.2, twierdzenia 10.10 i jednoznaczności rozkładu wielomianu na czynniki
liniowe wynika, że
n
Y
Tn+1(x) = 2n (x − L−1(xl )) , x ∈ R .
L−1(xk ) = cos
l=0
Stąd na mocy twierdzenia 10.18 i (10.3) wynika, że
n
Y
1
1
max
|x − L−1(xl )| = n max |Tn+1(x)| = n .
2 x∈[−1;1]
2
x∈[−1;1]
l=0
Stosując więc wniosek 9.5 w odniesieniu do funkcji f ◦ L i P ◦ L w miejsce funkcji
f i P , odpowiednio, otrzymujemy oszacowanie
1
(11.6)
max |f ◦ L(t) − P ◦ L(t)| ¬ n
sup |(f ◦ L)(n+1)(t)| .
2 (n + 1)! t∈[−1;1]
t∈[−1;1]
Ponieważ
(f ◦ L)(n+1)(t) =
b−a
2
n+1
f (n+1)(L(t)) ,
t ∈ [−1; 1]
oraz
max |f (t) − P (t)| = max |f ◦ L(t) − P ◦ L(t)|
t∈I
t∈[−1;1]
sup |f (n+1)(t)| = sup |f (n+1)(L(t))| ,
t∈I
t∈[−1;1]
więc z nierówności (11.6) otrzymujemy oszacowanie (11.3), co kończy dowód twierdzenia.
6
Uwaga 11.7. Z twierdzenia 10.18 wynika, że węzły interpolacji wielomianowej xk ,
k ∈ Z0,n, określone wzorem (11.2) minimalizują prawą stronę w nierówności (9.6)
i minimum jest osiągnięte tylko dla takiego doboru węzłów.
7
Rozdział 12
Wzór Taylora
W przypadku funkcji regularnej można wykorzystać klasyczny wzór Taylora w celu
jej aproksymacji wielomianami. Daje on prostą metodę lokalnego przybliżania funkcji wielomianami w otoczeniach punktu rozwinięcia. W tym rozdziale przedstawimy
dowody wzoru Taylora z różnymi postaciami reszt. Zacznijmy od najprostszej ale
ważnej ze względów teoretycznych postaci wzoru Taylora z resztą w postaci Peano.
Twierdzenie 12.1. Niech I ⊂ R będzie przedziałem i niech x0 ∈ I będzie jego
punktem wewnętrznym. Jeśli n ∈ N i f : I → R jest funkcją n − 1-krotnie
różniczkowalną w pewnym otoczeniu punktu x0 i ma pochodną n-tego rzędu w
x0, to
Rn(x − x0)
=0,
(12.2)
lim
x→x0 (x − x0 )n−1
gdzie
(12.3)
1
Rn(x − x0) := f (x) −
n−1 (k)
X
f (x0)
k!
k=0
(x − x0)k ,
x∈I .
Dowód. Ustalmy dowolnie n ∈ N. Dla n = 1,
Rn(x − x0)
= R1(x − x0) = f (x) − f (x0) → 0 gdy x → x0 ,
(x − x0)n−1
gdyż f jest funkcją ciągłą w punkcie x0 jako funkcja różniczkowalna w tym punkcie. Zatem równość (12.2) zachodzi dla n = 1. Możemy więc założyć, że n ­ 2.
1 Tu
i w dalszym ciągu przyjmujemy f (0) := f dla dowolnej funkcji f
8
Różniczkując funkcję Rn łatwo stwierdzamy, że dla każdego m ∈ Z0,n−1,
(12.4)
Rn(m)(x
− x0) := f
(m)
n−1
X
f (k)(x0)
(x − x0)k−m ,
(x) −
(k − m)!
x∈I .
k=m
Definiując funkcje I 3 x 7→ u(x) := Rn(x − x0) i I 3 x 7→ v(x) := (x − x0)n−1
widzimy zatem, że u(m)(x0) = 0 = v (m)(x0) dla każdego m ∈ Z0,n−2. Ponadto z
(12.4) mamy
u(n−1)(x)
1
=
(f (n−1)(x) − f (n−1)(x0)) → 0 gdy x → x0 .
(n−1)
v
(x) (n − 1)!
Z reguły de l’Hospitala wynika zatem, że
u(n−2)(x)
u(n−1)(x)
lim
= lim (n−1)
=0.
x→x0 v (n−2) (x)
x→x0 v
(x)
Stosując ponownie regułę de l’Hospitala dostajemy
u(n−2)(x)
u(n−3)(x)
= lim (n−2)
=0,
lim
x→x0 v
x→x0 v (n−3) (x)
(x)
gdy n ­ 3. Powtarzając ten proces dochodzimy w końcu do równości
u(0)(x)
u(1)(x)
lim
= lim (1)
=0,
x→x0 v (0) (x)
x→x0 v (x)
z której wynika równość (12.2).
Do zastosowań numerycznych równość (12.2) jest nieprzydatna, gdyż nie potrafimy na jej podstawie oszacować reszty Rn(x − x0) w zależności od x. Precyzyjniejszy opis reszty Rn(x − x0) można podać wzmacniając założenie regularności
funkcji f . Najczęściej rozważa się w takim przypadku wzór Taylora z resztą w postaci Lagrange’a. Przyjmijmy dla uproszczenia notacji, że dla dowolnych p, q ∈ R,
I[p; q] := [min({p, q}); max({p, q})] oraz I(p; q) := (min({p, q}); max({p, q})).
Twierdzenie 12.5. Niech I ⊂ R będzie przedziałem i niech x0 ∈ I będzie
jego punktem wewnętrznym. Jeśli n ∈ N i f : I → R jest funkcją n-krotnie
9
różniczkowalną w sposób ciągły na I, to dla dowolnego x ∈ I \ {x0},
f (n)(x̃)
(12.6)
Rn(x − x0) =
(x − x0)n
n!
dla pewnego x̃ ∈ I(x0; x).
Dowód. Załóżmy, że I, f, n, x0 i x 6= x0 są dowolnie ustalonymi obiektami spełniającymi założenia twierdzenia. Istnieje wówczas dokładnie jedno M ∈ R spełniające
równość
(12.7)
Rn(x − x0) = M (x − x0)n
Z założenia i z (12.3) wynika, że funkcja
(12.8)
I 3 t 7→ g(t) := Rn(t − x0) − M (t − x0)n
jest n − krotnie różniczkowalna na przedziale I. Z (12.7) mamy g(x0) = g(x) =
0. Stosując twierdzenie Rolle’a wnioskujemy, że g (1)(x1) = 0 dla pewnego x1 ∈
I(x0; x). Ponieważ g (1)(x0) = 0 gdy n ­ 2, więc stosując ponownie twierdzenie
Rolle’a wnioskujemy, że g (2)(x2) = 0 dla pewnego x2 ∈ I(x0; x1), o ile n ­ 2.
Kontynuując to rozumowanie stwierdzamy w końcu, że g (n)(xn) = 0 dla pewnego
xn ∈ I(x0; xn−1). Z drugiej strony różniczkując n − krotnie funkcję g w punkcie
xn dostajemy
g (n)(xn) = f (n)(xn) − n!M .
f (n)(xn)
Zatem xn ∈ I(x0; xn−1) ⊂ I(x0; x) i M =
. To wobec (12.7) implikuje
n!
równość (12.6) z podstawieniem x̃ := xn, co kończy dowód.
Przykad 12.9. Zastosujemy teraz wzór Taylora z resztą w postaci Lagrange’a
w celu aproksymacji funkcji R 3 t 7→ f (t) := sin t. Obliczając pierwsze cztery
10
pochodne funkcji f otrzymujemy dla dowolnego x ∈ R,
f (0)(x) = sin x ,
f (1)(x) = cos x ,
f (2)(x) = − sin x ,
f (3)(x) = − cos x ,
f (4)(x) = sin x .
Stąd
f (2n)(0) = 0 oraz f (2n+1)(0) = (−1)n ,
n ∈ Z0 .
Stosując twierdzenie 12.5 dla x0 := 0 widzimy, że dla dowolnych x ∈ R i n ∈ N,
(12.10)
2n−1
x3 x5
n−1 x
sin x = x −
+
− · · · + (−1)
+ R2n+1(x)
3!
5!
(2n − 1)!
gdzie
sin x̃
x2n+1
(2n + 1)!
dla pewnego x̃ ∈ I[0; x]. W ten sposób uzyskujemy oszacowanie błędu aproksymacji
R2n+1(x) = (−1)n
(12.11)
|x|2n+1
,
|R2n+1(x)| ¬
(2n + 1)!
x ∈ R, n ∈ N .
W szczególności dla n := 3 dostajemy oszacowanie
3
5 7
sin x − x − x + x ¬ |x| < 0, 2 · 10−10 ,
3!
5! 5040
x ∈ [−0, 1; 0, 1] .
Z (12.11) wynika, że
lim R2n+1(x) = 0 ,
n→∞
x∈R.
To łącznie z (12.10) daje znane rozwinięcie funkcji sin w szereg potęgowy
∞
2n−1
X
n−1 x
sin x =
(−1)
,
(2n
−
1)!
n=1
11
x∈R.