streszczenie rozprawy doktorsk-71

Transkrypt

streszczenie rozprawy doktorsk-71
INSTYTUT BADAŃ SYSTEMOWYCH
POLSKIEJ AKADEMII NAUK
mgr Przemysław Rutka
Studia Doktoranckie IBS PAN - „Techniki informacyjne - teoria i zastosowania”
Streszczenie rozprawy doktorskiej pt.
Efektywne algorytmy dla klasycznych ortogonalnych
transformacji
Promotor: dr hab. Ryszard Smarzewski, prof. KUL
Spis treści
1
Wprowadzenie
1.1 Cel pracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Tezy pracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Struktura pracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
3
4
4
2
Preliminaria matematyczne
2.1 Klasyczna waga i klasyczne wielomiany ortogonalne . . . . . . . . . . . . . . . . . .
2.2 Klasy klasycznych wielomianów ortogonalnych . . . . . . . . . . . . . . . . . . . . .
2.3 Własności klasycznych wielomianów ortogonalnych . . . . . . . . . . . . . . . . . .
5
5
6
7
3
Znaczenie wielomianów ortogonalnych w problemach typu izoperymetrycznego
3.1 Rozwiazanie
˛
problemu typu izoperymetrycznego w klasie krzywych Béziera . . . .
3.2 Zastosowanie wielomianów ortogonalnych do rozwiazania
˛
problemu typu izoperymetrycznego w klasie krzywych wielomianowych . . . . . . . . . . . . . . . . . . . .
3.3 Uogólnienie problemu typu izoperymetrycznego w klasie krzywych Béziera z wykorzystaniem wagi Jacobiego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Perspektywy badawcze problemu typu izoperymetrycznego i jego zastosowań . . . .
8
. 10
. 13
. 18
. 21
4
Ortogonalność a równowaga elektrostatyczna ładunków
22
4.1 Problem równowagi elektrostatycznej ładunków . . . . . . . . . . . . . . . . . . . . . 22
4.2 Jednolite i kompletne rozwiazanie
˛
problemu równowagi elektrostatycznej . . . . . . . 23
5
Efektywna, stabilna i najbardziej ekonomiczna interpolacja typu Hermite’a
5.1 Problem interpolacyjny Fejéra . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Problem interpolacyjny Egerváryego i Turána . . . . . . . . . . . . . . . .
5.3 Algorytm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4 Zwiazek
˛
z efektywna,˛ ortogonalna˛ interpolacja˛ Lagrange’a . . . . . . . . .
5.5 Zastosowanie w optymalnym planowaniu eksperymentu . . . . . . . . . .
6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
28
28
31
31
33
35
Własności aproksymacyjne ortogonalnych transformacji wielomianowych
36
6.1 Jednowymiarowe oszacowania typu Chernoffa . . . . . . . . . . . . . . . . . . . . . . 37
6.2 Wielowymiarowe oszacowania typu Chernoffa . . . . . . . . . . . . . . . . . . . . . . 39
2
1
1.1
Wprowadzenie
Cel pracy
Efektywne algorytmy transformacji wielomianowych sa˛ jednym z ważniejszych zagadnień rozważanych w naukach informatycznych [1, 39, 33]. Pozwalaja˛ one na wydajne przekształcanie wielomianu
stopnia n − 1 danego w bazie {Fk (x)}nk=1 do jego reprezentacji w bazie {Gk (x)}nk=1 . Najsłynniejszym tego typu algorytmem jest algorytm FFT szybkiego obliczania dyskretnej transformacji Fouriera
i transformacji do niej odwrotnej [12, 52]. Realizuje on przechodzenie pomi˛edzy reprezentacja˛ wielomianu w bazie fundamentalnych wielomianów Lagrange’a z w˛ezłami b˛edacymi
˛
pierwiastkami z jedności stopnia n = 2s , a jego rozwini˛eciem wzgl˛edem bazy pot˛egowej. Tworzacy
˛ t˛e ostatnia˛ baz˛e układ
n−1
jednomianów xj j=0 ma pewna˛ ważna˛ właściwość [51], a mianowicie jest ortogonalny na okr˛egu
jednostkowym, wzgl˛edem iloczynu skalarnego postaci
Z π
f eit g (eit )dt.
(f, g) =
−π
Innym numerycznie ważnym przykładem jest zastosowanie transformacji wielomianowej, korzystaja˛
cej z bazy wielomianów ortogonalnych do efektywnego znajdowania najlepszej wielomianowej aproksymacji funkcji f (x) określonej na przedziale (a, b) [43]. Polega ono mniej wi˛ecej na przybliżaniu standardowego obci˛ecia rozwini˛ecia Fouriera funkcji f (x) wzgl˛edem wielomianów ortogonalnych, które dzi˛eki odpowiedniej transformacji z w˛ezłami b˛edacymi
˛
zerami wielomianu ortogonalnego
można obliczać bez kosztownego całkowania. Widać wi˛ec jak istotna˛ rol˛e odgrywaja˛ w informatyce
ortogonalne transformacje wielomianowe pomi˛edzy baza˛ tworzona˛ przez fundamentalne wielomiany
interpolacyjne Lagrange’a, a baza˛ wielomianów ortogonalnych.
Rozprawa poświ˛econa jest szczególnej tematyce klasycznych ortogonalnych transformacji wielomianowych, ograniczonej do transformacji zwiazanych
˛
z baza˛ wielomianów ortogonalnych wzgl˛edem
funkcji wagowej spełniajacej
˛ równanie różniczkowe Pearsona. Samo zagadnienie badane było już od
ponad 120 lat, a mimo to ciagle
˛ przynosi nowe, cz˛esto zaskakujace
˛ rezultaty. Do tej pory znalazło
szerokie spektrum zastosowań, chociażby w kombinatoryce, procesach stochastycznych, tomografii
promieniami Roentgena, mechanice kwantowej i fizyce jadrowej
˛
[11]. W obecnej dobie pr˛eżnie rozwijajacych
˛
si˛e technik informacyjnych i komputerowych nadal znajduje nowe zastosowania, na przykład w przetwarzaniu obrazów, przetwarzaniu sygnałów czy kompresji danych [13, 29, 64]. Co wi˛ecej
oprócz licznych nowatorskich zastosowań ortogonalne własności różnych transformacji okazuja˛ si˛e
być niezmiernie przydatne do zwi˛ekszania wydajności algorytmów.
Celem rozprawy jest zaproponowanie dla kilku wybranych problemów takich właśnie nowych
i efektywnych algorytmów powiazanych
˛
z klasycznymi ortogonalnymi transformacjami. Ściślej mówiac,
˛ w pracy wśród problemów, których wydajne algorytmiczne rozwiazanie
˛
korzysta z klasycznych
wag i klasycznych wielomianów ortogonalnych, rozważane sa:
˛ problem typu izoperymetrycznego,
problem równowagi elektrostatycznej ładunków, problem efektywnej, stabilnej i najbardziej ekonomicznej interpolacji oraz problem oszacowań aproksymacyjnych a priori typu Chernoffa. Należy w
szczególności podkreślić, że oprócz samych algorytmów nowościa˛ jest uwzgl˛ednienie w rozważaniach dotyczacych
˛
omawianych problemów, na równi z najbardziej znanymi nieskończonymi ciaga˛
mi wielomianów ortogonalnych Hermite’a, Laguerre’a i Jacobiego [77], także tych mniej znanych
i mniej zbadanych skończonych ciagów
˛
uogólnionych wielomianów ortogonalnych Bessla, wielomianów Jacobiego na (0, +∞) oraz wielomianów pseudo-Jacobiego [40, 47].
3
1.2
Tezy pracy
Przeprowadzone badania w zakresie efektywnej algorytmizacji dla klasycznych ortogonalnych transformacji pozwoliły na sformułowanie nast˛epujacych
˛
tez rozprawy:
1. Wykorzystujac
˛ własności klasycznych wielomianów ortogonalnych, możliwe jest efektywne
(rz˛edu O (n)) algorytmiczne rozwiazanie
˛
problemu typu izoperymetrycznego w klasie zamkni˛etych krzywych wielomianowych stopnia n [57].
2. Istnieja˛ jednolite dla wszystkich sześciu klas klasycznych wielomianów ortogonalnych rozwia˛
zania problemu równowagi elektrostatycznej ładunków [60, 58] oraz problemu efektywnej, stabilnej i najbardziej ekonomicznej interpolacji typu Hermite’a [61], których finalnym wynikiem
sa˛ odpowiednie efektywne algorytmy numeryczne.
3. Współczynniki przy najwyższej pot˛edze klasycznych wielomianów ortonormalnych wszystkich klas odgrywaja˛ kluczowa˛ rol˛e przy dwustronnych oszacowaniach typu Chernoffa bł˛edu
aproksymacji średniokwadratowej, zarówno w przypadku jednowymiarowym [65], jak i wielowymiarowym [62].
1.3
Struktura pracy
Rozprawa wraz z wprowadzeniem podzielona została na 6 rozdziałów, z których 4 poświ˛econe sa˛
bezpośrednio szczegółowemu omówieniu każdego z poruszanych problemów.
Rozdział 2 prezentuje preliminaria matematyczne dotyczace
˛ klasycznych funkcji wagowych i zwia˛
zanych z nimi klasycznych wielomianów ortogonalnych. Stanowia˛ one trzon definicyjny i oznaczeniowy wszystkich prowadzonych w pracy rozważań.
W Rozdziale 3 zaproponowane zostały, w oparciu o publikacje [57, 59, 66], rozwiazania
˛
nieważonego i ważonego problemu typu izoperymetrycznego w klasie płaskich zamkni˛etych krzywych
wielomianowych stopnia n > 2 oraz skonstruowane zostały na ich podstawie numeryczne algorytmy, których efektywność poddano nast˛epnie analizie i eksperymentom. Jeśli chodzi o sam problem,
to polega on na znajdowaniu wśród wszystkich zamkni˛etych krzywych wielomianowych o zadanej
długości (ważonej lub nieważonej) tej krzywej, która otacza obszar o najwi˛ekszym polu (ważonym
lub nieważonym). Choć zagadnienie to ma charakter optymalizacji nieliniowej, to udało si˛e je bez
zmniejszania ogólności zredukować do problemu natury kwadratowej. W zwiazku
˛
z tym konstrukcja
rozwiazania,
˛
a co za tym idzie również algorytmów, mogła zostać oparta na liczeniu wartości własnej
i wektora własnego pewnego regularnego p˛eku form kwadratowych (uogólnionego problemu własnego) z macierzami wymiaru 2n − 2. Dwa z trzech zaprezentowanych algorytmów daja˛ rozwiazanie
˛
w
najbardziej stabilnej i wygodnej geometrycznie klasie krzywych Béziera. Co wi˛ecej drugi pracuje w
nieco szerszym kontekście, w którym pola i długość krzywej ważone sa˛ klasycznymi wagami Jacobiego przeskalowanymi do przedziału (0, 1). Jednak najważniejszy z punktu widzenia tez rozprawy jest
trzeci z algorytmów. Wykorzystuje on bowiem do reprezentacji krzywych, badanych w kontekście nieważonego problemu typu izoperymetrycznego, w miejsce wielomianów Bernsteina baz˛e ortogonalna˛
oparta˛ na klasycznych wielomianach ortogonalnych
Jacobiego, uzyskujac
˛ w ten sposób popraw˛e rz˛edu
3
złożoności obliczeniowej algorytmu z O n do O (n). Na koniec rozdziału podane zostały możliwe
kierunki dalszych badań zwiazanych
˛
z algorytmizacja˛ problemu typu izoperymetrycznego w klasie
krzywych wielomianowych i jego technicznymi zastosowaniami.
Kolejne dwa rozdziały służa˛ udowodnieniu drugiej tezy rozprawy. W szczególności Rozdział 4 poświ˛econy został zaprezentowaniu uzyskanego w pracy [60] kompletnego i ujednoliconego dla wszyst4
kich klas klasycznych funkcji wagowych rozwiazania
˛
problemu równowagi elektrostatycznej układu
ładunków. Problem ten, najogólniej rzecz ujmujac,
˛ dotyczy układu n ładunków elektrostatycznych poruszajacych
˛
si˛e swobodnie w przedziale (a, b) w obecności zewn˛etrznego potencjału determinowanego
obecnościa˛ klasycznej wagi. Sprowadza si˛e on natomiast do znalezienia punktów, w których rozpatrywany układ ładunków osiaga
˛ stabilna˛ równowag˛e elektrostatyczna˛ oraz do obliczenia całkowitej
energii elektrostatycznej takiego zrównoważonego układu. Poza szczegółami rozwiazania
˛
problemu
skonstruowany również został realizujacy
˛ je numeryczny algorytm, którego idea pochodzi z publikacji
[58].
Kontynuujac
˛ niejako rozważania z poprzedniego rozdziału, w Rozdziale 5 przedstawione zostały
kompletne i jednolite rozwiazania
˛
ważnych problemów interpolacyjnych Fejéra [20] oraz Egerváryego
i Turána [15, 16], znanych do tej pory dla klasycznych wielomianów ortogonalnych Hermite’a, Laguerre’a i Jacobiego. W szczególności podane zostało za publikacja˛ [61] rozwiazanie
˛
problemu Fejéra
kończace
˛ wyznaczanie operatora interpolacyjnego typu Hermite’a z ważona˛ funkcja˛ typu Lebesgue’a
o minimalnej normie jednostajnej równej 1 dla wszystkich klasycznych wielomianów ortogonalnych.
Na bazie przedstawionych rozwiazań
˛
zaproponowany również został algorytm numeryczny wykorzystujacy
˛ barycentryczne podejście do wydajnego obliczania efektywnego, stabilnego i najbardziej
ekonomicznego operatora interpolacyjnego typu Hermite’a. Oprócz tego wskazano zwiazek
˛
tego operatora z efektywna˛ interpolacja˛ typu Lagrange’a, poparty także odpowiednim barycentrycznym algorytmem. Na koniec wskazana została ważna statystyczna interpretacja problemu Fejéra w znajdujacej
˛
wiele technicznych zastosowań, chociażby w sterowaniu jakościa˛ produkcji, dziedzinie optymalnego
planowania eksperymentu.
W Rozdziale 6 przytoczone zostały obustronne oszacowania ważonego bł˛edu wielomianowej aproksymacji, b˛edace
˛ uogólnieniem wywodzacych
˛
si˛e z rachunku prawdopodobieństwa i pochodzacych
˛
od
Chernoffa [8] nierówności, pozwalajacych
˛
z grubsza mówiac
˛ estymować wariancj˛e z góry i z dołu za
pomoca˛ wartości oczekiwanych. Rozważania prowadzone sa˛ w oparciu o publikacje [65] i [62], w których sformułowano i w jednolity sposób uzasadniono nierówności typu Chernoffa dla wszystkich klasycznych funkcji wagowych, odpowiednio w przypadku jednowymiarowym oraz wielowymiarowym.
Jest interesujace,
˛ że kluczowa˛ rol˛e w tych oszacowaniach odgrywaja˛ liczby bezpośrednio zależace
˛ od
wiodacych
˛
współczynników klasycznych wielomianów ortonormalnych zwiazanych
˛
w tymi wagami.
W celu ułatwienia algorytmicznego korzystania z oszacowań typu Chernoffa podane również zostały
jawne wzory pozwalajace
˛ numerycznie obliczać wartości tych kluczowych liczb.
2
2.1
Preliminaria matematyczne
Klasyczna waga i klasyczne wielomiany ortogonalne
Niech w (x) b˛edzie dodatnia˛ funkcja˛ wagowa˛ określona˛ na skończonym lub nieskończonym przedziale
(a, b). Funkcja wagowa jest klasyczna, gdy spełnia równanie różniczkowe Pearsona postaci
d
[A (x) w (x)] = B (x) w (x) ,
dx
a < x < b,
(2.1)
z warunkami brzegowymi
lim A (x) w (x) = lim A (x) w (x) = 0,
x↓a
x↑b
gdzie wielomiany rzeczywiste
A (x) = a2 x2 + a1 x + a0
5
i B (x) = b1 x + b0
(2.2)
sa˛ takie, że A (x) > 0 na (a, b) i b1 6= 0.
Niech również wielomiany
qn (x) =
n
X
γk xk ,
γk = γn,k ,
n = 0, 1, . . . ,
(2.3)
k=0
stopnia n b˛eda˛ ortogonalne wzgl˛edem iloczynu skalarnego
Z b
f (x) g (x) w (x) dx
(f, g)w =
a
p
w przestrzeni Hilberta L2w (a, b) z norma˛ kf kw = (f, f )w . Oznacza to, że
0,
gdy j 6= k,
(qj , qk )w =
2
kqj kw ,
gdy j = k.
Jeżeli w tej sytuacji istnieje skończone lub nieskończone nw takie, że wielomiany ortogonalne qn (x),
0 ≤ n ≤ nw , sa˛ rozwiazaniami
˛
nast˛epujacego
˛
równania różniczkowego Sturma-Liouville’a
d
d
A (x) w (x) q (x) = λn w (x) q (x) , a < x < b,
(2.4)
dx
dx
ze współczynnikiem λn równym
λn = n [(n − 1) a2 + b1 ] ,
to wtedy ciag
˛ qn (x), 0 ≤ n ≤ nw , jest nazywany klasycznym [10, 51, 73]. Na odwrót, liniowo
˛
równania (2.4) sa˛ ortogonalne wzgl˛edem klasycznej
niezależne wielomianowe L2w (a, b)-rozwiazania
wagi w (x) [5, 46].
2.2
Klasy klasycznych wielomianów ortogonalnych
Zgodnie z powyższymi założeniami istnieje, z dokładnościa˛ do liniowej zmiany zmiennej, dokładnie sześć klas klasycznych wielomianów ortogonalnych [40, 47] dla odpowiednio dobranych funkcji
wagowych w (x) oraz wielomianów A (x) i B (x) wymienionych w Tabelach 2.1 i 2.2. Ściśle mówiac
˛ istnieja˛ trzy nieskończone ciagi
˛ qn (x), n = 0, 1, . . ., klasycznych wielomianów ortogonalnych,
którymi sa˛
(i) wielomiany Hermite’a Hn (x) ortogonalne na przedziale (−∞, +∞),
(α)
(ii) wielomiany Laguerre’a Ln (x), α > −1, ortogonalne na (0, +∞),
(α,β)
(iii) wielomiany Jacobiego Pn
(x), α > −1, β > −1, ortogonalne na (−1, 1)
oraz trzy skończone ciagi
˛ qn (x), n = 0, 1, . . . , nw , nast˛epujacych
˛
klasycznych wielomianów ortogonalnych:
(α,β)
(iv) uogólnionych wielomianów Bessla Bn
(x), α < −1, α ∈
/ {−2, −3, . . .}, β > 0, ortogonalnych na przedziale (0, +∞), gdzie nw = b 1−α
c
oraz
bzc
oznacza
cech˛e liczby rzeczywistej z,
2
6
(α,β)
(v) wielomianów Jacobiego Mn
b α−1
2 c,
(x), β > −1, ortogonalnych na przedziale (0, +∞), gdzie nw =
(α,β,A,B,C,D)
(vi) wielomianów pseudo-Jacobiego Jn
(x) ortogonalnych na przedziale (−∞, +∞), gdzie
nw = bα − 21 c oraz rzeczywiste parametry A, B, C, D sa˛ takie, że AD − BC > 0 i A2 + C 2 > 0.
Klasyczny wielomian qn (x)
Klasyczna waga w (x)
Hermite’a - Hn (x)
e−x
(α)
xα e−x
Laguerre’a - Ln (x)
(α,β)
Jacobiego - Pn
α
(1 − x) (1 + x)
(x)
(α,β)
Uogólniony wielomian Bessla - Bn
(α,β)
Jacobiego na (0, +∞) - Mn
β
β
xα−2 e− x
(x)
xβ
(1+x)α+β
(x)
(α,β,A,B,C,D)
Pseudo-Jacobiego - Jn
2
h
(x)
(Ax+B)2 +(Cx+D)2
A2 +C 2
i−α
eβ arc tg
(A2 +C2 )x+AB+CD
AD−BC
Tabela 2.1. Funkcje wagowe zwiazane
˛
z klasycznymi wielomianami ortogonalnymi.
Klasyczny wielomian qn (x)
Wielomian A (x)
Wielomian B (x)
Hn (x)
1
−2x
x
−x + α + 1
(α)
Ln (x)
(α,β)
(x)
−x2 + 1
− (α + β + 2) x + β − α
(α,β)
(x)
x2
αx + β
(α,β)
(x)
x2 + x
(2 − α) x + β + 1
Pn
Bn
Mn
(α,β,A,B,C,D)
Jn
(x)
2
2
B +D
x2 +2 AB+CD
A2 +C 2 x+ A2 +C 2
2 (1−α)x+ β(AD−BC)+2(1−α)(AB+CD)
A2 +C 2
Tabela 2.2. Wielomiany A (x) i B (x) zwiazane
˛
z klasycznymi wielomianami ortogonalnymi.
2.3
Własności klasycznych wielomianów ortogonalnych
Wszystkie wymienione klasyczne wielomiany ortogonalne qn (x) moga˛ być wyrażone za pomoca˛ nast˛epujacego
˛
wzoru typu Rodriguesa
qn (x) =
κn dn
[w (x) An (x)] ,
w (x) dxn
7
0 ≤ n ≤ nw ,
gdzie κn 6= 0 sa˛ dowolnymi stałymi [40].
Ponadto każdy ciag
˛ klasycznych wielomianów ortogonalnych qn (x), 0 ≤ n ≤ nw , spełnia pewna˛
trójczłonowa˛ zależność rekurencyjna.˛ W szczególności w przypadku monicznym, tzn. gdy w postaci
kanonicznej (2.3) wielomianu qn (x) współczynnik γn = 1, ta trójczłonowa zależność rekurencyjna
jest nast˛epujaca
˛
q0 (x) = 1,
q1 (x) = x − c0 ,
(2.5)
qn+1 (x) = (x − cn ) qn (x) − dn qn−1 (x) ,
n = 1, 2, . . . .
Wiadomo [47], że współczynniki cn i dn we wzorze rekurencyjnym (2.5) sa˛ równe
cn = −
2na1 rn−1 − b0 (2a2 − b1 )
,
r2n−2 r2n
n = 0, 1, . . . ,
(2.6)
dn
2
sn−1 (rn−1 a1 − a2 b0 ) − a0 r2n−2
= nrn−2
,
2
r2n−1
r2n−3 r2n−2
n = 1, 2, . . . ,
przy oznaczeniu
rk = ka2 + b1
i sk = ka1 + b0 .
Należy w tym miejscu zaznaczyć, iż wzory dla c0 i d1 dane w (2.6) sa˛ również prawdziwe dla wag
Jacobiego z parametrami α + β = 0 oraz α + β = −1, o ile przyjmie si˛e, że 0/0 = 1.
Kolejnym faktem jest to, iż pochodne Dk qn (x), n = k, k + 1, . . ., klasycznych wielomianów
ortogonalnych qn (x) także tworza˛ skończone lub nieskończone ciagi
˛ klasycznych wielomianów ortogonalnych [24, 41, 42, 51]. Ściślej mówiac
˛ pochodne te sa˛ ortogonalne wzgl˛edem iloczynu skalarnego
(·, ·)wk , z funkcja˛ wagowa˛
wk (x) = Ak (x) w (x) , a < x < b.
Spełniaja˛ one dodatkowo nast˛epujace
˛ równanie różniczkowe Sturma-Liouville’a
d
d
A (x) wk (x) q (x) = λn,k wk (x) q (x) , a < x < b,
dx
dx
(2.7)
ze współczynnikami
λn,k = (n − k) [(n + k − 1) a2 + b1 ] .
W tym przypadku waga wk (x) jest rozwiazaniem
˛
równania różniczkowego Pearsona postaci
d
[A (x) wk (x)] = B (x) + kA0 (x) wk (x) , a < x < b,
(2.8)
dx
gdzie współczynnik b1 + 2ka2 przy x wielomianu w nawiasie kwadratowym po prawej stronie, powinien być różny od 0 dla k = 0, 1, . . . , n − 1. Ten warunek jest spełniony, o ile dla klasycznej wagi
w (x) istnieja˛ klasyczne wielomiany ortogonalne stopnia n ≤ nw .
3
Znaczenie wielomianów ortogonalnych w problemach typu izoperymetrycznego
Jednym z najstarszych problemów geometrycznych jest problem izoperymetryczny. Polega on na znalezieniu wśród wszystkich zamkni˛etych krzywych płaskich o zadanej długości euklidesowej tej krzywej, która otacza obszar o najwi˛ekszym polu. Od czasów starożytnych wiadomo, że rozwiazaniem
˛
8
tak postawionego problemu jest okrag.
˛ Jednakże po nałożeniu pewnych ograniczeń dotyczacych
˛
zbioru dopuszczalnych krzywych i/lub metryki, rozwiazaniem
˛
może okazać si˛e inna krzywa, która może,
ale nie musi, dobrze aproksymować okrag.
˛ Przykłady takiego ograniczonego podejścia zaprezentowane zostały w pracach [53, 57, 59, 66], gdzie w kontekście problemu izoperymetrycznego rozważane sa˛ m. in. klasy krzywych Béziera i ogólnie krzywych wielomianowych oraz krzywych PH (ang.
Pythagorean-Hodograph), a także pewne ważone pola i długości.
W rozprawie szczegółowo przedstawione zostały rezultaty majace
˛ swoje źródło w publikacjach
[57, 59, 66]. W szczególności sa˛ to numeryczne algorytmy rozwiazuj
˛ ace
˛ problem typu izoperymetrycznego w klasie Cn wszystkich zamkni˛etych, nie posiadajacych
˛
samoprzeci˛eć, dodatnio zorientowanych krzywych wielomianowych ξ : [0, 1] → R2 stopnia n > 2 postaci
ξ (t) = (ξ1 (t) , ξ2 (t)) =
n
X
uk pk (t) ,
(3.1)
k=0
gdzie uk = (xk , yk ) ∈ R2 , ξ (0) = ξ (1), zaś pk (t) sa˛ liniowo niezależnymi wielomianami stopnia co
najwyżej n. Problem sprowadza si˛e do obliczenia wartości ekstremalnej
δ (Cn ) = sup
ξ∈Cn
P (ξ)
L (ξ)
(3.2)
oraz wyznaczenia ekstremalnej krzywej ξ, dla której to supremum jest osiagni˛
˛ ete, przy założeniu że
2
L (ξ) = l dla pewnego ustalonego l > 0. Tutaj
Z 1
ξ10 (t) ξ2 (t) dt
(3.3)
P (ξ) =
0
oznacza pole otoczone zamkni˛eta,˛ dodatnio zorientowana˛ krzywa˛ ξ, zaś
Z 1h
2
2 i
L (ξ) =
ξ10 (t) + ξ20 (t)
dt
0
jej uliniowiona˛ długość. Należy podkreślić, iż zastosowanie uliniowionej długości L (ξ) zamiast zwykłej długości krzywej
Z 1q
b
L (ξ) =
(ξ10 (t))2 + (ξ20 (t))2 dt
0
okazuje si˛e niezwykle istotne z punktu widzenia złożoności obliczeniowej algorytmu rozwiazuj
˛ acego
˛
problem izoperymetryczny. Na szcz˛eście nie wpływa to praktycznie na rozwiazanie,
˛
bowiem krzywa
ekstremalna ξ 0 b˛edaca
˛ rozwiazaniem
˛
problemu (3.2) oraz krzywa ekstremalna ξl∗ b˛edaca
˛ rozwiaza˛
niem ograniczonego problemu izoperymetrycznego
δl∗ (Cn ) = sup P (ξ) ,
l > 0,
(3.4)
ξ∈Cn,l
b (ξ) równa˛ l, różnia˛ si˛e
gdzie Cn,l jest podzbiorem wszystkich krzywych ξ ∈ Cn majacych
˛
długość L
jedynie skala.˛
może budzić kwestia samoprzeci˛eć, które w przypadku krzywych wielomianowych
Watpliwości
˛
sa˛ zjawiskiem dość powszechnym, a sam problem badania ich liczby jest skomplikowany. Z drugiej
jednak strony, co zostało zauważone w [53], kwestia samoprzeci˛eć nie jest w kontekście problemu typu
izoperymetrycznego sprawa˛ znaczac
˛ a.˛ Jest bowiem oczywiste, iż samoprzeci˛ecia krzywej ξ powoduja˛
zmiany znaku całkowanej funkcji ξ10 (t) ξ2 (t) nie wpływajac
˛ tym samym na maksymalizacj˛e pola
P (ξ).
9
3.1
Rozwiazanie
˛
problemu typu izoperymetrycznego w klasie krzywych Béziera
Chcac
˛ badać problem typu izoperymetrycznego w klasie płaskich krzywych wielomianowych nie sposób pominać
˛ krzywych Béziera [66]. Krzywe te bowiem stanowia˛ obecnie niezwykle popularne i przydatne narz˛edzie wspomaganego komputerowo projektowania geometrycznego (CAGD - ang. Computer Aided Geometric Design) [17, 28], co niewatpliwie
˛
zawdzi˛eczaja˛ swojej numerycznej stabilności
oraz wygodnej geometrycznej reprezentacji.
Z matematycznego punktu widzenia krzywe Béziera stopnia n tworza˛ klas˛e krzywych wielomianowych (3.1), w których baz˛e stanowia˛ wielomiany Bernsteina stopnia n postaci
n k
n
pk (t) = Bk (t) =
t (1 − t)n−k , 0 ≤ t ≤ 1, k = 0, 1, . . . , n.
k
Bez zmniejszania ogólności, w kontekście problemu typu izoperymetrycznego rozważane moga˛ być
jedynie te krzywe Béziera (3.1) stopnia n, których końcowe punkty kontrolne spełniaja˛ warunek
u0 = un = (0, 0) .
Zatem podzbiór wszystkich zamkni˛etych krzywych Béziera stopnia n postaci
ξ (t) =
n−1
X
uk Bkn (t) ,
0 ≤ t ≤ 1,
k=1
uk = (xk , yk ) ∈ R2 ,
(3.5)
oznaczony b˛edzie symbolem Cn0 .
Rozwiazanie
˛
problemu typu izoperymetrycznego w tej klasie krzywych Béziera wymaga w pierwszej kolejności obliczenia pola P (ξ) obszaru otoczonego krzywa˛ Béziera ξ oraz obliczenia jej uliniowionej długości L (ξ). W zwiazku
˛
z tym okazuje si˛e, że przyjmujac
˛
x = (x1 , . . . , xn−1 )T ∈ Rn−1
oraz
y = (y1 , . . . , yn−1 )T ∈ Rn−1 ,
prawdziwe sa˛ nast˛epujace
˛ dwa lematy.
Lemat 3.1 Pole obszaru otoczonego zamkni˛eta,˛ dodatnio zorientowana˛ krzywa˛ Béziera ξ ∈ Cn0 jest
równe
n
P (ξ) = 2n−1 xT Ay,
(3.6)
2 n
gdzie A = [aj,k ]0<j,k<n jest macierza˛ antysymetryczna˛ z elementami aj,j = 0, ak,j = −aj,k oraz
j + k − 1 2n − 1 − j − k
k−j
aj,k =
(3.7)
j (n − k)
k
n−1−k
dla j < k, j, k = 1, . . . , n − 1.
Lemat 3.2 Dla każdej zamkni˛etej krzywej Béziera ξ ∈ Cn0 zachodzi równość
L(ξ) =
n(n − 1) T
T
x
Bx
+
y
By
,
2n−1
(3.8)
n
gdzie B = [bj,k ]0<j,k<n jest symetryczna˛ dodatnio określona˛ macierza˛ z elementami równymi
2(n − 1)jk − n(j 2 + k 2 − j − k) j + k − 2 2n − 2 − j − k
bj,k =
jk(n − j)(n − k)
j−1
n−1−j
dla wszystkich j, k = 1, . . . , n − 1.
10
(3.9)
Prezentuja˛ one jawne wzory pozwalajace
˛ obliczać pole P (ξ) oraz uliniowiona˛ długość L (ξ). Znajac
˛ je można przystapić
˛ do sformułowania rozwiazania
˛
problemu typu izoperymetrycznego (3.2) w
klasie krzywych Béziera. W tym celu należy zauważyć, że nast˛epujaca
˛ funkcja Lagrange’a problemu
typu izoperymetrycznego
n
P (ξ) − λL(ξ) =
2
xT Ay − λ
2n−1
n
n(n − 1) T
x Bx + y T By ,
2n−1
n
T
x = (x1 , . . . , xn−1 ) , y = (y1 , . . . , yn−1 )T ,
jest identyczna z p˛ekiem form kwadratowych [22] (zwanym również uogólnionym problemem własnym) postaci
x
T
T
z Cz − λz Dz, z =
= (x1 , . . . , xn−1 , y1 , . . . , yn−1 )T ,
y
w którym symetryczne macierze C i D podzielone sa˛ na bloki w nast˛epujacy
˛ sposób
"
#
"
#
0 A
n
n(n − 1) B 0
C = 2n−1
, D = 2n−1
,
0 B
AT 0
4 n
n
(3.10)
gdzie elementy bloków A = −AT oraz B zdefiniowane sa˛ odpowiednio wzorami (3.7) i (3.9).
Skoro macierz B jest dodatnio określona, to należy wnioskować, że macierz D ma taka˛ sama˛
właściwość. Dlatego wspomniany p˛ek form kwadratowych jest regularny. A zatem z [22, Rozdział
10.6] wynika, że równanie charakterystyczne
det(C − λD) = 0
ma 2n − 2 rzeczywistych pierwiastków
λ1 ≤ λ2 ≤ . . . ≤ λ2n−2
zwanych wartościami własnymi p˛eku, którym odpowiadaja˛ wektory własne
zk = (z1,k , z2,k , . . . , z2n−2,k )T
spełniajace
˛ układ
Czk = λk Dzk ,
k = 1, 2, . . . , 2n − 2.
Powyższe wyniki pozwalaja,˛ w oparciu o teori˛e form kwadratowych [22, Rozdział 10.7] lub teori˛e
mnożników Lagrange’a, na sformułowanie ekstremalnych własności wartości własnych. W ten sposób
podać można nast˛epujace
˛ twierdzenie, które daje rozwiazanie
˛
problemu typu izoperymetrycznego w
klasie Cn0 krzywych Béziera.
Twierdzenie 3.1 Niech λ2n−2 oznacza najwi˛ekszy pierwiastek równania charakterystycznego
det(C − λD) = 0
z macierzami C i D zdefiniowanymi tak samo jak w (3.10). Zachodzi wtedy równość
R1
λ2n−2 =
ξ10 (t)ξ2 (t)dt
0
max
0 R1
ξ=(ξ1 ,ξ2 )∈Cn
[(ξ10 (t))2
0
11
.
+
(ξ20 (t))2 ] dt
Ponadto maksimum to jest osiagni˛
˛ ete, jeżeli wektor z = x y
Béziera
n−1
X
ξ(t) =
(xk , yk )Bkn (t)
T
∈ R2n−2 współczynników krzywej
k=1
jest wektorem własnym odpowiadajacym
˛
wartości własnej λ2n−2 .
Twierdzenie to z kolei pozwala bezpośrednio sformułować numeryczny algorytm rozwiazuj
˛ acy
˛
problem typu izoperymetrycznego w klasie krzywych Béziera. Można go nieco uprościć, wykorzystujac
˛ tożsamości (3.10) w połaczeniu
˛
z nast˛epujacym
˛
wzorem Schura [22, Strona 46]
#
"
E F
= det EH − EGE −1 F , det H 6= 0,
det
G H
uzyskujac
˛ ostatecznie nast˛epujacy
˛ Algorytm 3.1.
Algorytm 3.1. Problem typu izoperymetrycznego w klasie Cn0 krzywych Béziera stopnia n > 2 z ustalona˛ uliniowiona˛
długościa˛ l > 0.
Wejście: Liczba całkowita n > 2 oraz dodatnia liczba rzeczywista l.
Wyjście: Punkty kontrolne (xk , yk ), k = 1, 2, . . . , n − 1, ekstremalnej krzywej Béziera ξ otaczajacej
˛ obszar o najwi˛ekszym polu P (ξ).
1. Oblicz macierz B −1 A.
2. Ustal zespolona˛ wartość własna˛ µ = 4iλ2n−2 (n − 1) macierzy B −1 A, majac
˛ a˛ najwi˛eksza˛ cz˛eść urojona.˛
x
3. Oblicz wektor
= (x1 , . . . , xn−1 , y1 , . . . , yn−1 )T spełniajacy
˛ zależności
yi
h
−1
2
B −1 A + |µ|2 I y = 0 i x = B|µ| A y, y 6= 0, gdzie I jest macierza˛ jednostkowa.˛
4. Zwróć pole P (ξ) = l2 λ2n−2 oraz punkty kontrolne krzywej ξ równe
(xk , yk ) =
l
s
n(n−1)
2n−1
n
(
)
(xT Bx+yT By)
(xk , yk ) ,
k = 1, 2, . . . , n − 1.
Można zauważyć, że złożonośćobliczeniowa Algorytmu 3.1, bez uwzgl˛edniania kosztu obliczania
macierzy A i B, jest rz˛edu O n3 . Zależy ona bowiem przede wszystkim od kosztu znajdowania
najwi˛ekszej wartości własnej macierzy stopnia n − 1 oraz znajdowania odpowiadajacego
˛
jej wektora
własnego. Jest to rzecz jasna dobrze znane zagadnienie analizy numerycznej [23, 72]. Interesujacym
˛
natomiast wydaje si˛e fakt, iż koszt tego algorytmu może być nieco mniejszy, gdy uwzgl˛edni si˛e w nim
dodatkowo nast˛epujac
˛ a˛ symetri˛e
xk = xn−k
oraz
yk = −yn−k ,
k = 1, . . . , n − 1.
(3.11)
Wyniki numerycznej realizacji Algorytmu 3.1 pokazuja,˛ iż krzywe Béziera, b˛edace
˛ rozwiazaniem
˛
problemu typu izoperymetrycznego (3.2), sa˛ wraz ze wzrostem stopnia n coraz lepszymi aproksymacjami okr˛egu. Widać to wyraźnie na Rysunku 3.1 prezentujacym
˛
wykresy otrzymanych numerycznie
symetrycznych ekstremalnych krzywych Béziera kolejnych stopni od 3 do 8, których uliniowiona długość wynosi 2π. Potwierdzaja˛ to również komputerowe obliczenia maksymalnych pól obszarów otoczonych ekstremalnymi krzywymi Béziera, które sa˛ równe 2.9399 i 2.5483 w przypadku gdy n = 3,
oraz 3.1415669 i 3.1415401 w przypadku gdy n = 7, o ile użyta została odpowiednio nieuliniowiona i
uliniowiona długość. Wartości te jak widać sa˛ bliskie maksymalnemu polu π ≈ 3.1415927 odpowiedniego okr˛egu b˛edacego
˛
rozwiazaniem
˛
problemu izoperymetrycznego bez ograniczeń.
12
1.0
0.5
0.0
n=3
−0.5
n=4
n=5
n=6
−1.0
n=7
n=8
0.0
0.5
1.0
1.5
2.0
Rysunek 3.1. Krzywe Béziera stopnia n = 3, 4, 5, 6, 7, 8 o uliniowionej długości l = 2π, otaczajace
˛ obszary o najwi˛ekszym
polu.
3.2
Zastosowanie wielomianów ortogonalnych do rozwiazania
˛
problemu typu izoperymetrycznego w klasie krzywych wielomianowych
Przedstawione w poprzedniej sekcji rezultaty okazuja˛ si˛e nie wyczerpywać w pełni zagadnienia algorytmizacji problemu typu izoperymetrycznego (3.2). Interesujacym
˛
i zaskakujaco
˛ ważnym okazuje si˛e
uwzgl˛ednienie w tym zakresie kontekstu klasycznych ortogonalnych transformacji. Punktem wyjścia
bowiem do dalszych rozważań jest wtedy obserwacja [66], iż rozwiazanie
˛
problemu typu izoperymetrycznego w klasie zamkni˛etych krzywych Béziera stopnia n nie zależy w sposób istotny od wyboru
bazy w przestrzeni Pn wszystkich wielomianów stopnia nie wi˛ekszego niż n. W zwiazku
˛
z tym powinno być możliwe znalezienie takiej bazy w przestrzeni Pn , dla której rozwiazanie
˛
problemu typu
izoperymetrycznego byłoby najprostszym z możliwych. Jak si˛e okazuje jest to faktycznie możliwe,
gdy za baz˛e przyjmie si˛e pewne klasyczne wielomiany ortogonalne [57]. Co wi˛ecej uzyskana w ten
sposób nowa metoda rozwiazywania
˛
problemu typu izoperymetrycznego pozwala na sformułowanie
algorytmu o złożoności rz˛edu O (n), czyli znacznie bardziej wydajnego niż ten zaproponowany dla
krzywych Béziera.
Niech zatem ξ : [0, 1] → R2 b˛edzie zamkni˛eta,˛ dodatnio zorientowana˛ krzywa˛ wielomianowa˛
stopnia n postaci
n−1
X
ξ (t) = (ξ1 (t) , ξ2 (t)) =
uk pk (t) , 0 ≤ t ≤ 1,
(3.12)
k=1
R2 ,
gdzie uk = (xk , yk ) ∈
zaś pk (t) sa˛ liniowo niezależnymi wielomianami stopnia co najwyżej n.
Warto tutaj zaznaczyć, iż podobnie jak to miało miejsce w przypadku krzywych Béziera, zmniejszenie
o 2 stopni swobody rozpatrywanych krzywych nie wpływa na rozwiazanie
˛
rozważanego problemu
typu izoperymetrycznego. Co wi˛ecej określone później warunki brzegowe nakładane na wielomiany
pk (t) zagwarantuja˛ zamkni˛ecie końców krzywej ξ w jednym punkcie.
13
Wobec tak zdefiniowanej krzywej ξ pole P (ξ) otoczonego przez nia˛ obszaru można wyrazić wzorem
Z
1
ξ10 (t) ξ2 (t) dt = xT Ay,
P (ξ) =
0
gdzie A = [aj,k ]0<j,k<n jest macierza˛ kwadratowa˛ z elementami
Z
1
aj,k =
p0j (t) pk (t) dt,
(3.13)
0
zaś x = (x1 , . . . , xn−1 )T , y = (y1 , . . . , yn−1 )T sa˛ wektorami w Rn−1 . Uliniowiona˛ długość L (ξ)
krzywej ξ można natomiast zapisać w postaci
Z 1h
2
2 i
L (ξ) =
ξ10 (t) + ξ20 (t)
dt = xT Bx + y T By,
0
gdzie B = [bj,k ]0<j,k<n jest macierza˛ kwadratowa˛ z elementami
Z
1
bj,k =
p0j (t) p0k (t) dt.
0
W tej sytuacji prawdopodobnie maksymalne uproszczenie algorytmu rozwiazuj
˛ acego
˛
problem typu
izoperymetrycznego da si˛e uzyskać, żadaj
˛ ac
˛ by macierz B była jednostkowa, zaś macierz A trójdiagonalna. Innymi słowy oznacza to, że wielomiany p1 (t) , . . . , pn−1 (t) powinny być wybrane w taki
sposób, żeby ich pochodne p0k (t), k = 1, . . . , n − 1, były wielomianami stopnia k ortonormalnymi
wzgl˛edem iloczynu skalarnego w przestrzeni Hilberta L2w (0, 1), w ≡ 1, oraz żeby spełniały one warunki brzegowe postaci pk (0) = pk (1) = 0. Najlepiej do tego celu nadaje si˛e szczególny przypadek
klasycznych wielomianów Jacobiego, a mianowicie przeskalowane do przedziału [0, 1] wielomiany
Legendre’a
2k k
(0,0)
Pk
(2t − 1) =
t + . . . + (−1)k , 0 ≤ t ≤ 1,
k
ortogonalne wzgl˛edem wagi w (t) = 1. Wiadomo [18], że spełniaja˛ one nast˛epujace
˛ warunki ortogonalności
1
Z 1
gdy j = k,
(0,0)
(0,0)
2k+1 ,
Pj
(2t − 1) Pk
(2t − 1) dt =
0,
gdy j 6= k,
0
i daja˛ si˛e wyrazić wzorem Rodriguesa postaci
(0,0)
Pk
(2t − 1) =
i
1 dk h k
k
t
(t
−
1)
.
k! dtk
Stad
˛ jest jasne, że wielomiany pk (t), k = 1, . . . , n − 1, majace
˛ spełniać warunki brzegowe
pk (0) = pk (1) = 0
i których pochodne maja˛ być ortonormalne, a wi˛ec równe
p0k (t) =
√
(0,0)
2k + 1Pk
14
(2t − 1) ,
(3.14)
musza˛ mieć postać
pk (t) =
√
2k + 1
(1,1)
t (t − 1) Pk−1 (2t − 1) ,
k
k = 1, . . . , n − 1.
(3.15)
Nietrudno również zauważyć, że wielomiany te faktycznie gwarantuja˛ to, iż zwiazana
˛
z uliniowiona˛ długościa˛ krzywej ξ macierz B jest jednostkowa, zaś zwiazana
˛
z polem obszaru otoczonego ta˛
krzywa˛ macierz A = [aj,k ]0<j,k<n jest antysymetryczna i trójdiagonalna z elementami aj,j = 0,
j = 1, . . . , n − 1, oraz
p
(2j − 1) (2j + 1)
aj,j−1 = −aj−1,j =
, j = 2, 3, . . . , n − 1.
2 (2j − 1) (2j + 1)
Znajac
˛ macierze A i B, zwiazane
˛
z nowym ortogonalnym podejściem do problemu typu izoperymetrycznego, można w celu skonstruowania jego ulepszonego rozwiazania
˛
post˛epować dalej analogicznie jak w przypadku krzywych Béziera [66]. Można mianowicie sprowadzić poszukiwanie rozwiazania
˛
do znajdowania najwi˛ekszej wartości własnej λ2n−2 i odpowiadajacego
˛
jej wektora własnego
z2n−2 nast˛epujacego
˛
regularnego p˛eku form kwadratowych
z T Cz − λz T Dz,
z=
x y
T
= (x1 , . . . , xn−1 , y1 , . . . , yn−1 )T ,
gdzie C i D sa˛ symetrycznymi macierzami blokowymi postaci
1
0 A
I 0
C=
, D=
0 I
2 −A 0
z blokiem I oznaczajacym
˛
macierz jednostkowa˛ stopnia n−1. W zwiazku
˛
z tym wiadomo, że szukana
wartość własna λ2n−2 jest najwi˛ekszym zerem wielomianu charakterystycznego
m2n−2 (λ) = det (C − λD)
stopnia 2n − 2, który po zastosowaniu wzoru Schura [22] daje si˛e zredukować do postaci
A2
(1)
(2)
2
m2n−2 (λ) = det λ I +
= det Mn−1 det Mn−1 ,
4
gdzie
(1)
Mn−1 =
A
− iλI
2
(2)
oraz Mn−1 =
A
+ iλI
2
√
(1)
(2)
z jednostka˛ urojona˛ i = −1. Zważywszy na to, iż macierze Mn−1 i Mn−1 sa˛ trójdiagonalne, ich wyznaczniki wyrazić można pewna˛ zależnościa˛ rekurencyjna.˛ Wobec tego w celu uzyskania wydajnego
sposobu obliczania najwi˛ekszego rozwiazania
˛
λ2n−2 równania
m2n−2 (λ) = 0,
należy wykorzystać fakt, iż wielomian charakterystyczny m2n−2 (λ) może być zapisany w postaci
m2n−2 (λ) = m̄2n−1 (λ) ,
15
(3.16)
gdzie m̄n−1 (λ) jest wielomianem stopnia n − 1 spełniajacym
˛
nast˛epujace
˛ zależności rekurencyjne
m̄0 (λ) = 1,
m̄1 (λ) = λ,
m̄n−1 (λ) = λm̄n−2 (λ) −
1
m̄n−3 (λ) ,
16 (2n − 3) (2n − 1)
(3.17)
n = 3, 4, . . . .
W tej sytuacji, biorac
˛ dodatkowo pod uwag˛e to, iż m̄n−1 (λ) jest dla parzystych n funkcja˛ nieparzysta,˛ a dla nieparzystych n funkcja˛ parzysta,˛ staje si˛e jasne, że najwi˛eksze zero λ∗n−1 wielomianu
m̄n−1 (λ) jest jednocześnie szukanym rozwiazaniem
˛
λ2n−2 problemu (3.2). Wprowadzona˛ zależność
(3.16) można łatwo uzasadnić przy pomocy indukcji matematycznej.
W ten sposób skonstruowana została pierwsza cz˛eść szybkiego algorytmu rozwiazuj
˛ acego
˛
problem
typu izoperymetrycznego, w której szukanie najwi˛ekszej wartości własnej λ2n−2 uogólnionego problemu własnego zastapiono
˛
szukaniem najwi˛ekszego zera λ∗n−1 wielomianu ortogonalnego m̄n−1 (λ)
stopnia n − 1 zdefiniowanego rekurencyjnymi wzorami (3.17). Do określenia pozostał jeszcze sposób
znajdowania punktów kontrolnych uk = (xk , yk ), k = 1, . . . , n − 1, opisujacych
˛
ekstremalna˛ krzywa˛ ξ postaci (3.12) b˛edac
˛ a˛ rozwiazaniem
˛
problemu typu izoperymetrycznego (3.2). Jak już jednak
wcześniej zostało wspomniane, punkty te sa˛ współrz˛ednymi wektora własnego
z2n−2 =
x y
T
= (x1 , . . . , xn−1 , y1 , . . . , yn−1 )T
spełniajacego
˛
równanie
Cz2n−2 = λ2n−2 Dz2n−2 .
Stad
˛ już natomiast łatwo wynika, że musza˛ one spełniać także nast˛epujacy
˛ układ równań
h
A2 + 4 λ∗n−1
2 i
I y = 0,
x=
A
y,
2λ∗n−1
y 6= 0.
Reasumujac
˛ przeprowadzone rozważania, sformułować można nast˛epujacy
˛ Algorytm 3.2, który
wydajnie numerycznie rozwiazuje
˛
problem typu izoperymetrycznego w klasie zamkni˛etych krzywych
wielomianowych stopnia n.
Algorytm 3.2. Problem typu izoperymetrycznego w klasie zamkni˛etych krzywych wielomianowych stopnia n > 2 z
ustalona˛ uliniowiona˛ długościa˛ l > 0.
Wejście: Liczba całkowita n > 2 oraz dodatnia liczba rzeczywista l.
Wyjście: Punkty kontrolne (xk , yk ), k = 1, 2, . . . , n − 1, ekstremalnej krzywej wielomianowej ξ otaczajacej
˛ obszar
o najwi˛ekszym polu P (ξ).
1. Korzystajac
˛ z (3.17) oblicz najwi˛eksze zero λ∗n−1 wielomianu m̄n−1 (λ).
x
2. Oblicz wektor
= (x1 , . . . , xn−1 , y1 , . . . , yn−1 )T spełniajacy
˛ zależności
y
2
2 ∗
A
A + 4 (λn−1 ) I y = 0 i x = 2λ∗ y, y 6= 0.
n−1
l2 λ∗n−1
3. Zwróć pole P (ξ) =
oraz punkty kontrolne krzywej ξ równe
(xk , yk ) = √ T l T (xk , yk ) , k = 1, 2, . . . , n − 1.
x x+y y
Analiz˛e złożoności obliczeniowej Algorytmu 3.2 warto zaczać
˛ od jego pierwszego etapu, to znaczy od numerycznego obliczania najwi˛ekszego zera λ∗n−1 wielomianu m̄n−1 (λ). W tym celu łatwo
16
zauważyć, że koszt obliczania dowolnej wartości m̄n−1 (λ), zdefiniowanej wzorem (3.17), jest równy
O (n). Co wi˛ecej zależności rekurencyjne (3.17) świadcza˛ o tym, że wielomiany
m̄1 (λ) , m̄2 (λ) , . . . , m̄n−1 (λ)
tworza˛ układ monicznych wielomianów ortogonalnych [10, 40, 51]. Oznacza to, że ich najwi˛eksze
zera λ∗1 , λ∗2 , . . . , λ∗n−1 spełniaja˛ nierówności
λ∗1 < λ∗2 < . . . < λ∗n−1 .
√
1
Z drugiej strony jednak wiadomo, że λ∗1 = 0, λ∗2 = 6015 orazλ∗n ↑ 4π
. Stad
˛ jest jasne, że wartości λ∗k ,
√
1
. Dlatego w celu obliczenia λ∗n−1 wykok = 3, 4, . . ., winny być poszukiwane w przedziale 6015 , 4π
rzystać można chociażby dobrze znany algorytm bisekcji [56, 72]. Wiadomo, że koszt tego algorytmu
jest proporcjonalny do kosztu pojedynczego obliczenia wartości wielomianu m̄n−1 (λ). Współczynnik
√
1
tej proporcjonalności zależy jedynie od dokładności obliczeń. Ponieważ długość przedziału 6015 , 4π
−1
jest mniejsza niż 2−6 , to wynika stad,
˛ że współczynnik ten jest równy log2 26 · prec , przy żadanej
˛
dokładności szukanego zera równej prec < 2−6 .
Alternatywnym, nie mniej przydatnym sposobem obliczania najwi˛ekszego zera λ∗n−1 wielomianu
m̄n−1 (λ) jest algorytm oparty na metodzie Newtona [72]. W tym przypadku dzi˛eki temu, że wielo1
mian m̄n−1 (λ) jest na przedziale λ∗n−1 , 4π
funkcja˛ wypukła˛ i rosnac
˛ a,˛ to przybliżenia uzyskiwane
1
w kolejnych iteracjach poczawszy
˛
od 4π sa,˛ i to bez żadnych dodatkowych założeń, zbieżne do λ∗n−1 .
Koszt takiego algorytmu jest również rz˛edu O (n). Jest on bowiem proporcjonalny do kosztu obliczan−1 (λ)
nia wartości ilorazu m̄
, przy czym współczynnik tej proporcjonalności zależy jedynie od ilości
m̄0n−1 (λ)
iteracji. Jasne też jest, że wobec kwadratowej zbieżności metody Newtona liczba iteracji, które trzeba
wykonać w celu osiagni˛
˛ ecia satysfakcjonujacego
˛
poziomu dokładności obliczeń, nie jest zbyt duża.
Kolejnym krokiem Algorytmu 3.2 jest obliczanie niezerowego wektora y = (y1 , . . . , yn−1 )T spełniajacego
˛
nieoznaczony układ równań Hy = 0 z macierza˛
2
H = [hj,k ]0<j,k<n = A2 + 4 λ∗n−1 I.
Warto zauważyć, że wszystkie niezerowe elementy tej symetrycznej macierzy H zlokalizowane sa˛
wyłacznie
˛
na trzech przekatnych.
˛
W celu otrzymania jednego z niezerowych rozwiazań
˛
tego systemu równań można przyjać,
˛ że y1 = 0 i y2 = 1, a nast˛epnie obliczyć pozostałe współrz˛edne
ȳ = (y3 , . . . , yn−1 )T rozwiazuj
˛ ac
˛ oznaczony układ postaci
H0 ȳ = v,
(3.18)
gdzie H0 jest macierza˛ kwadratowa˛ stopnia n−3 powstała˛ z macierzy H poprzez odrzucenie pierwszego i drugiego wiersza oraz pierwszej i drugiej kolumny, zaś v = (0, −a3,2 a4,3 , 0, . . . , 0)T . Nietrudno
zauważyć, że H0 jest również symetryczna˛ macierza˛ z dokładnie trzema niezerowymi przekatnymi.
˛
W zwiazku
˛
z tym do wydajnego, rz˛edu O (n), rozwiazania
˛
układu (3.18) może być zastosowana np.
metoda rozkładu LR.
Z Algorytmu 3.2 wynika nast˛epnie, że po uzyskaniu wektora y 6= 0 należy zastosować przekształcenie
A
x= ∗ y
2λn−1
w celu obliczenia wektora x. Ze wzgl˛edu jednak na to, iż A jest macierza˛ trójdiagonalna˛ oczywiste
jest, że powyższa transformacja może być wykonana również przy pomocy jedynie O (n) operacji
17
elementarnych. Ostatnim krokiem badanego algorytmu jest skalowanie otrzymanych punktów kontrolnych uk = (xk , yk ), k = 1, . . . , n − 1, w celu uzyskania finalnej krzywej, majacej
˛ żadan
˛ a˛ uliniowiona˛
l
T
T
długość l. Ponieważ kluczowymi operacjami sa˛ tutaj x x + y y, √ T
x oraz √ T l T y, wi˛ec
T
x x+y y
x x+y y
łatwo zauważyć, że koszt tego kroku jest także rz˛edu O (n). Wobec powyższego widać, że łaczny
˛
koszt
Algorytmu 3.2 wynosi O (n).
Zgodnie z obserwacja˛ braku istotnego wpływu zmiany bazy na rozwiazanie
˛
problemu typu izoperymetrycznego w klasie krzywych wielomianowych, wyniki numeryczne uzyskane za pomoca˛ Algorytmu 3.2, to znaczy w szczególności ekstremalne krzywe, sa˛ praktycznie identyczne jak te otrzymane
w klasie krzywych Béziera.
3.3
Uogólnienie problemu typu izoperymetrycznego w klasie krzywych Béziera z wykorzystaniem wagi Jacobiego
Problem typu izoperymetrycznego w klasie zamkni˛etych krzywych Béziera [66] można rozważać w
innym, nieco szerszym kontekście, również zwiazanym
˛
w pewnym sensie z klasycznymi transformacjami ortogonalnymi. W odróżnieniu jednak od podejścia zaprezentowanego w Sekcji 3.2, gdzie do
reprezentacji krzywych w miejsce wielomianów Bernsteina użyto baz˛e wielomianów ortogonalnych,
można z kolei brać pod uwag˛e ważone pole otoczone krzywa˛ Béziera oraz jej ważona˛ uliniowiona˛
długość [59]. Przy tym należy wykorzystać ważony iloczyn skalarny
Z 1
f (t) g (t) (1 − t)α tβ dt
(f, g)α,β = 2α+β
0
w przestrzeni Hilberta L2α,β (0, 1), α > −1, β > −1, wszystkich rzeczywistych mierzalnych w sensie
Lebesgue’a funkcji takich, że
kf k2α,β = (f, f )α,β < ∞.
Zastosowana w tym wypadku waga jest przeskalowana˛ do przedziału (0, 1) klasyczna˛ funkcja˛ wagowa˛
Jacobiego postaci
wα,β (t) = 2α+β (1 − t)α tβ , α, β > −1.
W tej sytuacji ważony problem typu izoperymetrycznego w klasie Cn0 wszystkich zamkni˛etych
dodatnio zorientowanych krzywych Béziera stopnia n postaci (3.5), sprowadza si˛e do znalezienia
wartości ekstremalnej
Pα,β (ξ)
α,β
δγ,η
Cn0 = sup
, α, β, γ, η > −1
(3.19)
0 Lγ,η (ξ)
ξ∈Cn
oraz wyznaczenia ekstremalnej krzywej Béziera ξ, dla której to supremum jest osiagni˛
˛ ete, przy zało2
żeniu, że Lγ,η (ξ) = l dla pewnego ustalonego l > 0. Rozwiazanie
˛
tego problemu, podobnie jak to
miało miejsce w przypadku nieważonym, należy zaczać
˛ od znalezienia form odpowiadajacych
˛
ważonemu polu
Pα,β (ξ) = ξ10 , ξ2 α,β
oraz ważonej uliniowionej długości
Lγ,η (ξ) = ξ10 , ξ10
γ,η
+ ξ20 , ξ20
γ,η
.
W tym celu sformułować można nast˛epujace
˛ dwa lematy, przyjmujac
˛ uprzednio oznaczenia x =
(x1 , . . . , xn−1 )T ∈ Rn−1 oraz y = (y1 , . . . , yn−1 )T ∈ Rn−1 .
18
Lemat 3.3 Ważone pole obszaru otoczonego krzywa˛ Béziera ξ ∈ Cn0 jest równe
Pα,β (ξ) =
n! n 2α+β
Γ (n + α + β) (2n + α + β)
xT Ay,
2n+α+β−1
n
gdzie A = [ak,j ]0<k,j<n jest macierza˛ antysymetryczna˛ z elementami aj,j = 0, aj,k = −ak,j oraz
ak,j
dla k < j,
(j − k) Γ (j + β) Γ (n − j + α + 1) j + k + β − 1 2n − j − k + α − 1
=
(n − k) j! (n − j)!
k
n−k−1
k, j = 1, . . . , n − 1.
Lemat 3.4 Dla każdej krzywej Béziera ξ ∈ Cn0 zachodzi równość
Lγ,η (ξ) =
n! 2γ+η
xT Bx + y T By ,
2n+γ+η−1
Γ (n + γ + η)
n
gdzie B = [bj,k ]0<j,k<n jest symetryczna˛ i dodatnio określona˛ macierza˛ z elementami równymi
bj,k
j + k + η − 2 2n − j − k + γ − 2 Γ (k + η) Γ (n − k + γ)
=
j−1
n−j−1
k! (n − k)!j (n − j)
2
2
2
· 2jk(n − 1) − n(n − 1)(j + k − j − k)
+jk(γ + η)2 − 3jk(γ + η) − n(j − k)2 (γ + η)
−n(j + k)(γη − 2η + η 2 ) + n2 (η 2 − η)
dla wszystkich j, k = 1, . . . , n − 1.
Biorac
˛ pod uwag˛e powyższe lematy, przystapić
˛ można do sformułowania rozwiazania
˛
problemu
ekstremalnego (3.19). W tym celu wystarczy zauważyć, że zwiazana
˛
z tym problemem funkcja Lagrange’a jest postaci
Pα,β (ξ) − λLγ,η (ξ) =
n! n 2α+β
Γ (n + α + β) (2n + α + β)
−λ
xT Ay
2n+α+β−1
n
n! 2γ+η
xT Bx + y T By .
2n+γ+η−1
Γ (n + γ + η)
n
Wobec tego jest ona identyczna z p˛ekiem form kwadratowych [22]
x
T
T
z Cz − λz Dz, z =
= (x1 , ..., xn−1 , y1 , ..., yn−1 )T ,
y
gdzie C i D sa˛ nast˛epujacymi
˛
symetrycznymi macierzami blokowymi
"
0
n! n 2α+β−1
C =
2n+α+β−1
Γ (n + α + β) (2n + α + β)
AT
n
"
#
B 0
n! 2γ+η
D =
.
0
B
Γ (n + γ + η) 2n+γ+η−1
n
19
A
#
,
0
(3.20)
Bloki A = −AT oraz B sa˛ zdefiniowane w Lematach odpowiednio 3.3 i 3.4. Skoro zatem macierz
B jest dodatnio określona, to rozwiazanie
˛
ważonego problemu izoperymetrycznego (3.19) w klasie
krzywych Béziera, można podać w formie nast˛epujacego
˛
twierdzenia, podobnego jak w przypadku
nieważonym opisanym w Sekcji 3.1.
Twierdzenie 3.2 Niech λ2n−2 oznacza najwi˛ekszy pierwiastek problemu własnego D−1 Cz = λz z
macierzami C, D określonymi tak jak w (3.20). Wtedy zachodzi równość
λ2n−2 = sup
0
ξ∈Cn
Pα,β (ξ)
.
Lγ,η (ξ)
T
Ponadto, supremum to jest osiagni˛
˛ ete jeśli wektor z = x y
∈ R2n−2 współczynników krzywej
Béziera
n−1
X
ξ (t) =
(xk , yk ) Bkn (t)
k=1
jest wektorem własnym odpowiadajacym
˛
wartości własnej λ2n−2 .
Twierdzenie to sugeruje w sposób bezpośredni numeryczny algorytm rozwiazuj
˛ acy
˛ ważony problem typu izoperymetrycznego (3.19). Wprowadzajac
˛ analogiczne uproszczenia jak w przypadku nieważonym wraz z dodatkowymi oznaczeniami
r = −
s =
2γ+η
,
Γ (n + γ + η) 2n+γ+η−1
n
(3.21)
n 2α+β−1
Γ (n + α + β) (2n + α + β)
2n+α+β−1
n
,
można podać jego pełna˛ treść w postaci nast˛epujacego
˛
Algorytmu 3.3.
Algorytm 3.3. Ważony wagami Jacobiego wα,β (t) i wγ,η (t) problem typu izoperymetrycznego w
klasie Cn0 zamkni˛etych krzywych Béziera stopnia n > 2 z ustalona˛ ważona˛ uliniowiona˛ długościa˛
l > 0.
Wejście: Liczba całkowita n > 2, liczby rzeczywiste α, β, γ, η wi˛eksze od −1 oraz dodatnia liczba
rzeczywista l.
Wyjście: Punkty kontrolne (xk , yk ), k = 1, 2, . . . , n−1, ekstremalnej krzywej Béziera ξ o ważonej
uliniowionej długości l, która otacza obszar o najwi˛ekszym ważonym polu Pα,β (ξ).
1. Oblicz macierz B −1 A.
2. Ustal zespolona˛ wartość własna˛ µ = rs iλ2n−2 macierzy B −1 A majac
˛ a˛ najwi˛eksza˛ cz˛eść urojona,˛
korzystajac
˛ przy tym ze wzorów (3.21).
x
= (x1 , . . . , xn−1 , y1 , . . . , yn−1 )T spełniajacy
˛ zależności
3. Oblicz wektor
y
h
i
−1
2
B −1 A + |µ|2 I y = 0 i x = B|µ| A y, y 6= 0.
4. Zwróć pole Pα,β (ξ) = l2 λ2n−2 oraz punkty kontrolne krzywej ξ równe
(xk , yk ) =
l
s
n!2γ+η
2n+γ+η−1
Γ(n+γ+η)
n
(
)
(xT Bx+yT By)
(xk , yk ) ,
20
k = 1, 2, . . . , n − 1.
Łatwo zauważyć, że złożoność obliczeniowa tego algorytmu jest taka sama jak w przypadku nieważonym opisanym Algorytmem 3.1. Zależy ona bowiem głównie od operacji dominujacych,
˛
którymi
−1
sa˛ obliczenia najwi˛ekszej wartości
własnej macierzy B A i odpowiadajacego
˛
jej wektora własnego.
Jej rzad
˛ wynosi zatem O n3 . W przeciwieństwie jednak do przypadku nieważonego, wynikowe krzywe ekstremalne moga˛ za sprawa˛ wag Jacobiego nie być symetryczne. Wobec tego generalnie nie daje
si˛e znaleźć symetrii analogicznej do (3.11), która dodatkowo upraszczałaby znajdowanie krzywych
ekstremalnych.
3.4
Perspektywy badawcze problemu typu izoperymetrycznego i jego zastosowań
Kwestia zaprezentowanego problemu typu izoperymetrycznego, mimo gruntownego przebadania aż
trzech różnych podejść, wydaje si˛e nie być zamkni˛eta. Wr˛ecz przeciwnie nawet, otwarte w ten sposób
zostało pole do dalszych, zarówno teoretycznych jak i praktycznych badań. Świadczy o tym chociażby
praca Monterde i Ongaya [53], b˛edaca
˛ twórczym rozszerzeniem przedstawionych w [66, 57] rozważań
dotyczacych
˛
problemu typu izoperymetrycznego. W pracy tej w szczególności, w kontekście problemu typu izoperymetrycznego, w miejsce klasy krzywych wielomianowych badana jest jej podklasa
tworzona przez krzywe PH (ang. Pythagorean-Hodograph). Nie sposób nie wspomnieć, że krzywe te,
majace
˛ swój poczatek
˛ w 1990 roku, zdaja˛ si˛e urastać powoli do miana jednego z ważniejszych narz˛edzi
wspomaganego komputerowo geometrycznego projektowania (CAGD - ang. computer aided geometric design) [19]. Stoi za tym niewatpliwie
˛
ich podstawowa własność, czyli to, że ich parametryczna
pr˛edkość, to znaczy pochodna ich długości s (t) postaci
q
s0 (t) = (ξ10 (t))2 + (ξ20 (t))2
jest funkcja˛ wielomianowa.˛ Dzi˛eki temu w przypadku krzywych PH możliwe jest dokładne obliczanie
ich długości, energii zagi˛eć oraz krzywych do nich równoległych bez konieczności odwoływania si˛e do
aproksymacji. W zwiazku
˛
z tym sa˛ one wyjatkowo
˛
przydatne w rozwiazywaniu
˛
problemów w czasie
rzeczywistym, takich chociażby jak sterowanie ruchem czy przestrzenne planowanie trajektorii ruchu.
To jednak nie wszystko jeśli chodzi o perspektywy badawcze zwiazane
˛
z problemem typu izoperymetrycznego. Całkiem możliwe wydaje si˛e również praktyczne zastosowanie przedstawionych algorytmów w komputerowo wspomaganym geometrycznym projektowaniu (CAGD) [17]. W szczególności należałoby zbadać różne aspekty ich przydatności do redukcji stopnia krzywej Béziera [14, 17]. Jest
to znany i niezwykle ważny problem optymalizacyjny wyst˛epujacy
˛ w CAGD, który przydaje si˛e chociażby wtedy, gdy różne systemy projektowania geometrycznego musza˛ wymienić mi˛edzy soba˛ dane
modelowanych krzywych lub powierzchni. Poza tym pozwala on uprościć geometryczne lub graficzne
algorytmy zwiazane
˛
z obliczeniami przeci˛eć lub renderowaniem rastrowych obrazów wymodelowanej
geometrii. Obszar ten wydaje si˛e szczególnie obiecujacy
˛ i interesujacy,
˛ gdyż podobnie jak w problemie izoperymetrycznym, istniejace
˛ metody redukcji stopnia krzywej Béziera istotnie wykorzystuja˛
klasyczne wielomiany ortogonalne Jacobiego oraz transformacje ortogonalne [38, 48]. Oprócz tego,
wobec faktu iż zaprezentowane algorytmy daja˛ optymalne w pewnym sensie wielomianowe aproksymacje okr˛egu, wydaje si˛e logiczne, że powinny one dać si˛e również wykorzystać w problemie rekonstrukcji okr˛egu lub łuku okr˛egu w oparciu o być może zakłócone dane pomiarowe. Problem ten
ostatnio, głównie w odniesieniu do danych pochodzacych
˛
z przetwarzania cyfrowych obrazów oraz
w uj˛eciu algorytmicznym i statystycznym, zaprezentowany został w monografii [9]. Co najważniejsze, wynika stamtad,
˛ że badane od lat 50-tych XX wieku zagadnienie dopasowywania okr˛egu lub
łuku okr˛egu do danych obserwowanych w dwuwymiarowych obrazach znalazło liczne zastosowania
21
w najprzeróżniejszych dziedzinach. W szczególności, w medycynie przy szacowaniu na podstawie fotografii średnicy t˛eczówki ludzkiego oka, przy projektowaniu łuku z˛ebowego w oparciu o zdj˛ecie rentgenowskie lub przy mierzeniu rozmiarów płodu na obrazach ultrasonograficznych. W archeologii przy
badaniu okragłych
˛
kształtów na starożytnych greckich stadionach lub przy ustalaniu rozmiarów starożytnych glinianych naczyń analizujac
˛ fragmenty skorup znalezionych w wykopaliskach. Ponadto w
przemyśle przy sprawdzaniu, w ramach kontroli jakości, promieni i środków wyprodukowanych cz˛eści mechanicznych lub w robotyce przy wykrywaniu przez mobilne roboty znajdujacych
˛
si˛e w pobliżu
okragłych
˛
obiektów, w oparciu o wskazania lasera używanego przez nie do nawigacji. Czy wreszcie w
fizyce jadrowej
˛
do pomiaru promieni trajektorii czastek
˛
elementarnych powstałych w akceleratorach
i zderzaczach czastek.
˛
To nadal nie wszystko, gdyż prawdziwy rozkwit zainteresowania tym zagadnieniem nastapił
˛ w latach 90-tych XX wieku. W zwiazku
˛
z gwałtownym rozwojem technologii informatycznych okazało si˛e bowiem, że dopasowywanie prostych kształtów (w tym również okr˛egów) do
cyfrowych obrazów stało si˛e jednym z podstawowych zadań w rozpoznawaniu wzorców (ang. pattern
recognition) oraz w komputerowym widzeniu (ang. computer vision). Jak widać zatem, powiazanie
˛
efektywnych algorytmów rozwiazuj
˛ acych
˛
problem typu izoperymetrycznego z zagadnieniem dopasowywania okr˛egu lub łuku do być może zakłóconych danych pomiarowych, może niewatpliwie
˛
również
otworzyć tym algorytmom pole do licznych technicznych zastosowań.
4
4.1
Ortogonalność a równowaga elektrostatyczna ładunków
Problem równowagi elektrostatycznej ładunków
Pod koniec XIX wieku T. J. Stieltjes [69, 70, 71] zaproponował jedna˛ z najciekawszych i najładniejszych w historii interpretacji, która łaczy
˛
klasyczne wielomiany ortogonalne z elektrostatyka.˛ Odkrył
on mianowicie, iż zera wielomianu ortogonalnego Jacobiego wskazuja˛ miejsca, w których pewien
układ punktowych ładunków elektrostatycznych osiaga
˛ stan stablinej równowagi elektrostatycznej.
Ściślej mówiac
˛ chodzi o układ elektrostatyczny, w którym w przedziale (−1, 1) porusza si˛e swobodnie n dodatnich jednostkowych ładunków elektrostatycznych w obecności dodatkowego zewn˛etrznego
potencjału generowanego przez dwa dodatnie ładunki. Te dwa zewn˛etrzne ładunki maja˛ masy równe
(β + 1) /2 oraz (α + 1) /2 i sa˛ ustalone odpowiednio w punktach −1 i 1. Co wi˛ecej wszystkie ładunki, zarówno swobodne jak i stałe, odpychaja˛ si˛e zgodnie z prawem potencjału logarytmicznego, co
oznacza, że siła wzajemnego oddziaływania każdej pary tych ładunków jest odwrotnie proporcjonalna
˛ ac
˛ stan stabilnej
do ich odległości. W tej sytuacji okazało si˛e, że swobodne ładunki spoczna,˛ osiagaj
równowagi elektrostatycznej, dokładnie w zerach −1 < x1 < . . . < xn < 1 wielomianu Jacobiego
(α,β)
Pn
(x) stopnia n.
Problem równowagi elektrostatycznej układu ładunków był później jeszcze wielokrotnie badany
przez licznych autorów. Został on na przykład rozwiazany
˛
także dla swobodnych ładunków poruszajacych
˛
si˛e na prostej i półprostej w obecności zewn˛etrznego potencjału generowanego stałymi ładunkami gwarantowanymi obecnościa˛ klasycznych wag Hermite’a i Laguerre’a [63, 77]. Znalezione
ponadto zostały formuły pozwalajace
˛ obliczać wartość energii całkowitej układu ładunków w punkcie ich stabilnej równowagi elektrostatycznej, bez jawnej znajomości zer klasycznych wielomianów
ortogonalnych Jacobiego, Hermite’a i Laguerre’a [34, 63]. Dalsze twórcze rozwini˛ecie problemu równowagi elektrostatycznej zostało przedstawione w monografii [34], gdzie cytuje si˛e szereg publikacji
zwiazanych
˛
z ta˛ tematyka˛ (zobacz także [30, 50, 78]).
W kontekście motywacji rozważania w rozprawie problemu równowagi elektrostatycznej warto
nadmienić, iż wspomniany model elektrostatyczny powiazany
˛
z klasycznymi wielomianami ortogo22
nalnymi znalazł zastosowanie w innym ważnym dziale fizyki, a mianowicie w mechanice zarówno klasycznej jak i kwantowej. Najlepszym tego przykładem sa˛ prace Calogero [7], Sutherlanda [74, 75] oraz
Mosera [54], które otworzyły pole do dalszych, realizowanych również obecnie, badań nad właściwościami wieloczasteczkowych
˛
kwantowo i klasyczno mechanicznych systemów nazywanych układami
Calogero-Sutherlanda-Mosera (CSM) [79].
4.2
Jednolite i kompletne rozwiazanie
˛
problemu równowagi elektrostatycznej
W niniejszej sekcji przedstawione zostało oryginalne, kompletne i jednolite rozwiazanie
˛
problemu
równowagi elektrostatycznej, w oparciu o publikacj˛e [60] powstała˛ jako próba uzupełnienia dotychczasowych rezultatów zwiazanych
˛
z tym problemem. W szczególności rozwiazanie
˛
to uwzgl˛ednia
układy ładunków poruszajacych
˛
si˛e swobodnie na przedziale (0, +∞) lub (−∞, +∞) w obecności zewn˛etrznego potencjału generowanego klasycznymi wagami, zwiazanymi
˛
ze skończonymi cia˛
gami wielomianów ortogonalnych, tzn. uogólnionych wielomianów Bessla, wielomianów Jacobiego
na (0, +∞) oraz wielomianów pseudo-Jacobiego. Należy również podkreślić, że pokrywa si˛e ono ze
znalezionymi wcześniej przez Stieltjesa [69, 70, 71], Schoenberga [63] oraz Szegő [77] rozwiazania˛
mi problemu równowagi elektrostatycznej w szczególnych przypadkach klasycznych wag Jacobiego,
Hermite’a i Laguerre’a. Trzeba oczywiście wspomnieć, iż ważne osiagni˛
˛ ecia w kierunku ujednolicenia
rozwiazania
˛
problemu równowagi elektrostatycznej ładunków podj˛ete zostały w monografiach Karlina i Studdena [34] oraz Ismaila [30]. Niemniej jednak zaprezentowane w [60] całościowe podejście
do problemu, obejmujace
˛ wszystkie klasyczne wagi, zaowocowało nie tylko nowymi, elementarnymi
i stosunkowo krótkimi dowodami, ale także kompletnym rozwiazaniem
˛
problemu równowagi elektrostatycznej.
W celu skonstruowania tego jednolitego i kompletnego rozwiazania
˛
problemu równowagi elektrostatycznej ładunków, należy najpierw zauważyć, że wymaga ono znalezienia punktów x1 < . . . < xn ,
w których funkcja
Tw1 (z1 , . . . , zn ) =
n
Y
j=1
w1 (zj )
Y
1≤j<k≤n
(zj − zk )2 ,
a < z1 < . . . < zn < b,
gdzie w1 (x) = A (x) w (x), osiaga
˛ swoje maksimum globalne oraz wymaga podania jawnego wzoru
na t˛e wartość maksymalna.˛ Wiadomo bowiem [30, 34, 77], że układ n swobodnych ładunków elektrostatycznych, poruszajacych
˛
si˛e w obecności zewn˛etrznego potencjału generowanego dodatkowymi
stałymi ładunkami gwarantowanymi obecnościa˛ klasycznej wagi w1 (x), osiaga
˛ stabilna˛ równowag˛e
wtedy, gdy jego całkowita energia elektrostatyczna przyjmuje wartość minimalna˛ równa˛
−1
Ew1 (x1 , . . . , xn ) = ln Tw12 (x1 , . . . , xn ) .
∂T
(x ,...,x )
w1
n
1
W zwiazku
˛
z tym, wykorzystujac
˛ m. in. klasyczny fakt [77], iż pochodne czastkowe
˛
,
∂zi
i = 1, . . . , n, zeruja˛ si˛e w tych samych punktach x1 , . . . , xn co rozwiazania
˛
równania różniczkowego
Sturma-Liouville’a (2.4), można udowodnić nast˛epujace
˛ twierdzenie stanowiace
˛ właśnie to jednolite
i kompletne rozwiazanie
˛
problemu równowagi elektrostatycznej ładunków. W szczególności opisuje
ono w sposób jednoznaczny położenie stanu stabilnej równowagi elektrostatycznej układu ładunków
oraz daje wartości ekstremalne Tw1 (x1 , . . . , xn ) zwiazane
˛
z całkowita˛ energia˛ elektrostatyczna˛ takiego zrównoważonego układu, dla poszczególnych klasycznych wag.
23
Twierdzenie 4.1 Niech w (x) b˛edzie klasyczna˛ funkcja˛ wagowa˛ określona˛ na przedziale (a, b) oraz
niech w1 (x) = A (x) w (x). Wtedy problem równowagi elektrostatycznej
max
a<z1 <...<zn <b
0 < n ≤ nw ,
Tw1 (z1 , . . . , zn ) = Tw1 (x1 , . . . , xn ) ,
ma jednoznaczne rozwiazanie
˛
x1 < . . . < xn w (a, b). Ponadto, punkty x1 , . . . , xn sa˛ zerami klasycznego wielomianu qn (x) ortogonalnego wzgl˛edem wagi w (x), a wartości ekstremalne
Tn = Tw1 (x1 , . . . , xn )
(4.1)
dla poszczególnych klasycznych wag sa˛ dane wzorami
(i) Waga Hermite’a:
Tn = (2e)−n(n−1)/2
n
Y
kk ,
n = 1, 2, . . . ,
k=1
(ii) Waga Laguerre’a:
Tn = e
−n(n+α)
n
Y
k k (k + α)k+α ,
n = 1, 2, . . . ,
k=1
(iii) Waga Jacobiego:
Tn = 2n(n+α+β+1)
n
Y
k k (k + α)k+α (k + β)k+β
k=1
(n + k + α + β)n+k+α+β
,
n = 1, 2, . . . ,
(iv) Uogólniona waga Bessla:
Tn = (−1)n(n+2α−1)/2 (βe)n(n+α−1)
n
Y
kk
k=1
(n + k + α − 2)n+k+α−2
,
gdzie
1−α
,
n ≤ nw =
2
(v) Waga Jacobiego na (0, +∞):
Tn = (−1)n(1−α)
n
Y
k k (k + β)k+β (k − α − β)k
(n + k − α)n+k−α (α + β − n + k − 1)α+β
k=1
,
gdzie
α−1
n ≤ nw =
,
2
(vi) Waga pseudo-Jacobiego:
Tn = (−1)n(n+3)/2
h
ik−α
β
n(n+1−2α) Y
n e−β arc tg 2(k−α) k k 4 (k − α)2 + β 2
AD − BC
A2 + C 2
k=1
gdzie
1
n ≤ nw = α −
.
2
24
(n + k − 2α)n+k−2α
,
Warto zauważyć, że korzystajac
˛ z Twierdzenia 4.1 można także łatwo znaleźć, poprzez odpowiednia˛ zmian˛e zmiennej, rozwiazanie
˛
problemu równowagi elektrostatycznej, zwiazanego
˛
z dowolna˛ klasyczna˛ funkcja˛ wagowa˛ inna˛ niż wagi rozważane w twierdzeniu. Sam dowód natomiast wykorzystuje
klasyczna˛ bezpośrednia˛ metod˛e pochodzaca
˛ od Stieltjesa, która˛ rozwini˛eto podczas rozwiazywania
˛
problemu równowagi elektrostatycznej w monografii Szegő [77]. Ponadto, wymaga on znalezienia
wartości ekstremalnych Tn , które co najciekawsze dla każdego konkretnego przypadku klasycznej
wagi daja˛ si˛e przedstawić w postaci nie zależacej
˛ jawnie od zer x1 , . . . , xn [34, 60, 63].
Takie podejście jest rzeczywiście jednolite i kompletne, gdyż dostarcza jeden wspólny sposób
rozwiazywania
˛
problemu równowagi elektrostatycznej ładunków dla wszystkich sześciu klas klasycznych funkcji wagowych. Nietrudno też sprawdzić, że w szczególnym przypadku wag zwiazanych
˛
z
nieskończonymi ciagami
˛
klasycznych wielomianów ortogonalnych Hermite’a, Laguerre’a i Jacobiego
otrzymane wyniki zgadzaja˛ si˛e z rozwiazaniami
˛
znalezionymi wcześniej w pracach [63, 69, 70, 71, 77].
Na bazie przedstawionego rezultatu sformułować można efektywny numeryczny algorytm rozwiazuj
˛ acy
˛ problem równowagi elektrostatycznej układu n dodatnich jednostkowych ładunków elektrostatycznych, poruszajacych
˛
si˛e swobodnie na skończonym lub nieskończonym przedziale (a, b) w
obecności zewn˛etrznego potencjału generowanego nieruchomymi ładunkami gwarantowanymi obecnościa˛ dowolnej klasycznej wagi, który został zaanonsowany w pracy [58]. Ściślej mówiac
˛ algorytm
ten znajduje przybliżone położenia x1 , . . . , xn ładunków elektrostatycznych b˛edacych
˛
w stanie stabilnej równowagi oraz oblicza wartość Ew1 (x1 , . . . , xn ) całkowitej energii elektrostatycznej tego układu
ładunków. Jego konstrukcja opiera si˛e na tym, że zrównoważone położenie danego układu n ładunków elektrostatycznych znajduje si˛e w zerach odpowiedniego klasycznego wielomianu ortogonalnego
qn (x). W pierwszej kolejności zatem obliczane sa˛ przybliżone wartości zer tego klasycznego wielomianu ortogonalnego. Realizowane jest to za pomoca˛ dobrze znanej zmodyfikowanej bisekcji [23, 72],
działajacej
˛ w oparciu o badanie liczby zmian znaku σ (x) w ciagu
˛ Sturma postaci
q0 (x) = 1, −q1 (x) , q2 (x) , . . . , (−1)n qn (x) .
(4.2)
Należy jednakhzwrócić
i uwag˛e na to, że bisekcja ta musi rozpoczynać si˛e od dowolnego ograniczoneb
go przedziału b
a, b zawierajacego
˛
wszystkie zera wielomianu qn (x). Do wyznaczania końców tego
przedziału prezentowany algorytm wykorzystuje Twierdzenie Gerszgorina [72], które z grubsza rzecz
ujmujac
˛ pozwala ustalać wartości b
a i bb w oparciu jedynie o współczynniki cj oraz dj , wyst˛epujace
˛ w
trójczłonowej rekurencyjnej reprezentacji (2.5) wielomianu qn (x).
Jeśli zaś chodzi o obliczanie przez algorytm wartości En = Ew1 (x1 , . . . , xn ) całkowitej energii
elektrostatycznej układu n dodatnich jednostkowych ładunków elektrostatycznych b˛edacych
˛
w stanie
stabilnej równowagi, to wykorzystuje on w tym celu wzory zebrane w Tabeli 4.1. Nietrudno zauważyć, że wynikaja˛ one bezpośrednio ze wzorów podanych w podpunktach (i) − (vi) Twierdzenia 4.1.
Jednak dzi˛eki pozbyciu si˛e mnożeń i pot˛egowań algorytm nie musi wykonywać arytmetyki na bardzo
małych lub bardzo dużych liczbach. Sytuacja taka nie byłaby pożadana,
˛
bowiem użycie chociażby
wbudowanych typów zmiennoprzecinkowych j˛ezyka C++ prowadziłoby do niestabilności algorytmu,
nawet przy stosunkowo małych wartościach n.
25
−1/2
Waga klasyczna w (x)
Wartość całkowitej energii elektrostatycznej En = ln Tn
P
1+ln 2
n (n − 1) − 12 n
k=1 k ln k
4
Pn
n(n+α)
1
− 2 k=1 [k ln k + (k + α) ln (k + α)]
2
P
− ln22 n (n + α + β + 1) − 21 n
k=1 [k ln k + (k + α) ln (k + α)
Hermite’a
Laguerre’a
Jacobiego
Uogólniona waga Bessla
Jacobiego na (0, +∞)
+ (k + β) ln (k + β) − (n + k + α + β) ln (n + k + α + β)]
P
β
− 1+ln
n (n + α − 1) − 12 n
k=1 [k ln k − (n + k + α − 2) ln (2 − n − k − α)]
2
P
− 12 n
k=1 [k ln k + (k + β) ln (k + β) + k ln (α + β − k)
− (n + k − α) ln (α − n − k) − (α + β) ln (α + β − n + k − 1)]
n
P
β
− 12 ln AD−BC
n (n + 1 − 2α) + 12 n
k=1 β arc tg 2(k−α) − k ln k
A2 +C 2
− (k − α) ln 4 (k − α)2 + β 2 + (n + k − 2α) ln (2α − n − k)
Pseudo-Jacobiego
−1/2
Tabela 4.1. Wartości En = ln Tn
całkowitych energii elektrostatycznych układów n dodatnich jednostkowych ładunków elektrostatycznych b˛edacych
˛
w stanie stabilnej równowagi, powiazanych
˛
z poszczególnymi klasycznymi
wagami.
Pełne sformułowanie opisanego algorytmu rozwiazuj
˛ acego
˛
problem równowagi układu ładunków
elektrostatycznych jest przedstawione w postaci Algorytmu 4.1.
Algorytm 4.1. Problem równowagi elektrostatycznej układu n dodatnich jednostkowych ładunków elektrostatycznych, poruszajacych
˛
si˛e swobodnie na przedziale (a, b) w obecności zewn˛etrznego potencjału generowanego klasyczna˛ waga˛ w (x) i odpychajacych
˛
si˛e zgodnie z prawem potencjału logarytmicznego.
Wejście: Liczby rzeczywiste a2 , a1 , a0 , b1 , b0 definiujace
˛ klasyczna˛ wag˛e w (x), liczba całkowita n > 0 określajaca
˛
liczb˛e ładunków swobodnych oraz liczba rzeczywista prec określajaca
˛ dokładność obliczeń.
Wyjście: Punkty x1 , x2 , . . . , xn b˛edace
˛ przybliżonym, z dokładnościa˛ prec, położeniem ładunków swobodnych pozostajacych
˛
w stanie równowagi elektrostatycznej oraz wartość En całkowitej energii elektrostatycznej tego układu
ładunków.
1. Dla każdego k = 1, 2, . . . , n wykonuj:
1.1. Oblicz korzystajac
˛ z formuł (2.6) liczby
b
a ib
b takie, że o
np
p
b
b = −b
a = max
dj + |cj | + dj+1 ,
0≤j≤n−1
d0 = dn = 0.
1.2. Dopóki b
b−b
a > prec wykonuj:
b /2.
1.2.1. xk = b
a +b
1.2.2. Jeżeli σ (xk ) < k, to
1.2.2.1. b
a = xk ,
w przeciwnym wypadku
1.2.2.2. b
b = xk .
b /2.
1.3. xk = b
a +b
2. Zwróć punkty x1 , x2 , . . . , xn .
3. Wykorzystujac
˛ odpowiednia˛ formuł˛e z Tabeli 4.1, oblicz i zwróć wartość En .
Warto jeszcze poddać krótkiej analizie złożoność obliczeniowa˛ Algorytmu 4.1. Łatwo mianowicie
zauważyć, że jego koszt jest proporcjonalny do n2 , przy czym współczynnik tej proporcjonalności
zależy jedynie od żadanej
˛
dokładności obliczeń prec. Na koszt ten wpływa najbardziej konieczność
26
powtarzania bisekcji, której złożoność obliczeniowa jak wiadomo jest rz˛edu O (n), dla każdego z n zer
monicznego wielomianu ortogonalnego qn (x). Wszystkie
h i pozostałe elementy algorytmu, w szczególności znajdowanie skończonych granic przedziału b
a, bb zawierajacego
˛
wszystkie szukane zera oraz
obliczanie liczby zmian znaku σ (x) w ciagu
˛ Sturma (4.2), można już zrealizować kosztem O (n)
operacji elementarnych.
Na koniec przytoczone zostały na Rysunku 4.1 wyniki eksperymentów numerycznych przeprowadzonych dla Algorytmu 4.1 w przypadku wagi pseudo-Jacobiego. Prezentuje on położenia układów
złożonych z n = 1, 2, . . . , 30 ładunków elektrostatycznych b˛edacych
˛
w stanie stabilnej równowagi
elektrostatycznej. Dodatkowo po prawej stronie każdego układu ładunków podana jest wartość En
jego całkowitej energii elektrostatycznej.
n
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
6
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
−0.776556
t
t
t
t
t
t
t t t t t t t t t t t t
t
t
t
t
t t t t t t t t t t t t t
t
t
t
t t t t t t t t t t t t t t
t
t
t
t t t t t t t t t t t t t t t
t
t
t
t
t t t t t t t t t t t t t t t t
t
t
t
t t t t t t t t t t t t t t t t t
t
t
t
t t t t t t t t t t t t t t t t t t
t
t
t
t
t t t t t t t t t t t t t t t t t t t
t
t
t
t t t t t t t t t t t t t t t t t t t t
t
t
t
t
t t t t t t t t t t t t t t t t t t t t t
t
t
t
t
t
t
t
t
t
t
t
t
t t t t t t t t t t
t
t
t
t t t t t t t t t t t
t t t t t t t t t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t t t t t t t
t
t
t
t
t
t
t
t
t t t t t
t
t
t
t
t
t
t
t
t
t
t
t
t t t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
t
650.317
613.858
578.091
543.044
508.746
475.226
442.515
410.642
379.638
349.536
320.369
292.169
264.972
238.814
213.731
189.763
166.95
145.334
124.96
105.875
88.1294
71.7778
56.8785
43.4954
31.6995
21.5705
13.2003
6.6974
2.19602
−0.126209
-
0
0.961637
x
Rysunek 4.1. Położenia stabilnej równowagi elektrostatycznej, wraz z odpowiadajacymi
˛
wartościami En całkowitej energii elektrostatycznej, układów n = 1, . . . , 30 ładunków elektrostatycznych poruszajacych
˛
si˛e na przedziale (−∞, +∞) w obecności zewn˛etrznego potencjału generowanego waga˛ pseudo-Jacobiego z parametrami
α = 100, β = 10, A = D = 1 i B = C = 0.
27
5
Efektywna, stabilna i najbardziej ekonomiczna interpolacja typu Hermite’a
W niniejszej sekcji zaprezentowane zostały dwa ciekawe problemy interpolacyjne, których rozwiaza˛
nia majac
˛ ścisły zwiazek
˛
z klasycznymi funkcjami wagowymi oraz zerami klasycznych wielomianów
ortogonalnych, pozostaja˛ w duchu rozważanych w rozprawie klasycznych transformacji ortogonalnych. Zwiazek
˛
ten co ciekawe analogiczny jest do tego, jaki funkcjonuje w ramach przedstawionego
w Sekcji 4 problemu równowagi elektrostatycznej ładunków. Same zaś problemy, z których pierwszy pochodzi od Fejéra [20], a drugi od Egerváryego i Turána [15, 16], dotycza˛ z grubsza mówiac
˛
poszukiwania efektywnego, stabilnego i najbardziej ekonomicznego operatora interpolacyjnego typu
Hermite’a. Warto dodać, że przedstawione rezultaty teoretyczne pochodza˛ w głównej mierze z pracy
[61], gdzie sformułowane zostały kompletne i jednolite dla wszystkich sześciu klas klasycznych funkcji wagowych, rozwiazania
˛
problemów interpolacyjnych Fejéra oraz Egerváryego i Turána, b˛edace
˛ w
szczególności nowościa˛ w przypadku uogólnionej wagi Bessla, wagi Jacobiego na (0, +∞) oraz wagi
pseudo-Jacobiego.
5.1
Problem interpolacyjny Fejéra
Pierwszy ze wspomnianych problemów, sformułowany przez Fejéra [20], dotyczy poszukiwania efektywnej interpolacji wykorzystujacej
˛
operator interpolacyjny typu Hermite’a w punktach
x1 , . . . , xn takich, że xj 6= xk dla j 6= k. Precyzyjniej rzecz ujmujac
˛ chodzi o operator interpolacyjny Hn , spełniajacy
˛ dla dowolnej funkcji ciagłej
˛
f (x) określonej na przedziale (a, b) nast˛epujace
˛
warunki interpolacyjne
(Hn f ) (xk ) = f (xk ) ,
(Hn f )0 (xk ) = 0,
i majacy
˛ postać
(Hn f ) (x) = w1 (x)
n
X
k=1
f (xk )
k = 1, . . . , n,
lk2 (x)
,
w1 (xk )
(5.1)
(5.2)
gdzie w1 (x) = A (x) w (x), zaś lk (x) sa˛ wielomianami fundamentalnymi Lagrange’a stopnia n − 1
takimi, że
lk (xj ) = δkj , j = 1, . . . , n,
(5.3)
z δkj oznaczajacym
˛
delt˛e Kroneckera.
Problem Fejéra sprowadza si˛e do poszukiwania punktów x1 , . . . , xn , zwanych w˛ezłami interpolacji operatora Hn , dla których ważona norma
Λw1 (x1 , . . . , xn ) = sup w1 (x) λw1 (x; x1 , . . . , xn ) ,
a < x1 < . . . < xn < b,
(5.4)
a<x<b
ważonej funkcji typu Lebesgue’a
n
X
lk2 (x)
λw1 (x) = λw1 (x; x1 , . . . , xn ) =
w1 (xk )
(5.5)
k=1
operatora interpolacyjnego Hn , osiaga
˛ najmniejsza˛ możliwa˛ wartość równa˛ 1. Jak wiadomo, dobrane w taki sposób w˛ezły interpolacji gwarantuja˛ najwi˛eksza˛ efektywność operatora Hn , polegajac
˛ a˛
28
na jego dobrych własnościach aproksymacyjnych, porównywalnych z takimi własnościami operatora najlepszej średniokwadratowej aproksymacji funkcji f (x) [34, 43]. To właśnie Fejér [20] jako
pierwszy odkrył, że w szczególnym przypadku klasycznej wagi w (x) = 1 określonej na przedziale (a, b) = (−1, 1), wspomniana interpolacja jest w powyższym sensie efektywna tylko wtedy, gdy
jej w˛ezły x1 , . . . , xn sa˛ zerami klasycznego wielomianu ortogonalnego Legendre’a stopnia n, to zna(0,0)
czy wielomianu Pn (x). Analogiczne konfiguracje optymalnych w˛ezłów interpolacji dla trzech klasycznych wag Hermite’a, Laguerre’a i Jacobiego odkryte później zostały przez innych autorów, którzy
udowodnili, że tworza˛ je zera odpowiadajacych
˛
tym wagom klasycznych ortogonalnych wielomianów
(α)
(α,β)
Hn (x), Ln (x) oraz Pn
(x). W szczególności Karlin i Studden w monografii [34] rozwiazali
˛
problem interpolacyjny Fejéra dla tych trzech klasycznych wag wykorzystujac
˛ w tym celu Twierdzenie von Neumanna o minimaksie. Inne bardziej elementarne dowody tych samych wyników zostały
podane przez Balázs [2] oraz Laua i Studdena [44, 45], wraz w nowymi rezultatami dla pewnych nieklasycznych wag. Na uwag˛e zasługuje również fakt, iż kilka twórczych rozwini˛eć problemu Fejéra
było badanych m. in. przez Lubinskiego [49], Szabó [76] oraz Horváth [26, 27].
W duchu tych wyników, udało si˛e w pracy [61] sformułować ujednolicony sposób rozwiazywania
˛
problemu interpolacyjnego Fejéra, uwzgl˛edniajacy
˛ wszystkie klasyczne wagi w (x), to znaczy nie tylko te generujace
˛ nieskończone, ale również i te generujace
˛ skończone ciagi
˛ klasycznych wielomianów
ortogonalnych. W szczególności t˛e ujednolicona˛ metod˛e przedstawić można w postaci nast˛epujacego
˛
twierdzenia.
Twierdzenie 5.1 Niech qn (x) b˛edzie klasycznym wielomianem, ortogonalnym wzgl˛edem klasycznej
funkcji wagowej w (x) na przedziale (a, b). Wówczas dla pewnych x1 < . . . < xn należacych
˛
do
przedziału (a, b) zachodzi równość
inf
a<z1 <...<zn <b
Λw1 (z1 , . . . , zn ) = Λw1 (x1 , . . . , xn ) = 1,
0 < n < nw ,
wtedy i tylko wtedy, gdy x1 < . . . < xn sa˛ zerami wielomianu qn (x) na przedziale (a, b).
Idea dowodu Twierdzenia 5.1 jest całkiem prosta. Chodzi o to, żeby z jednej strony pokazać, że
jeśli w punktach x1 , . . . , xn ważona norma Λw1 (x1 , . . . , xn ) wynosi 1, to punkty te sa˛ zerami wielomianów spełniajacych
˛
równanie różniczkowe Sturma-Liouville’a (2.4). Z drugiej zaś strony należy
dowieść, że gdy x1 < . . . < xn sa˛ zerami klasycznego wielomianu ortogonalnego qn (x), to funkcja λw1 (x) jest wielomianem interpolacyjnym Hermite’a funkcji w11(x) w w˛ezłach x1 < . . . < xn ,
spełniajacym
˛
warunki interpolacji
0 1
1
0
, k = 1, . . . , n,
λw1 (xk ) =
, λw1 (xk ) =
w1 (xk )
w1 (x) x=xk
oraz takim, że
λw1 (x) ≤
1
.
w1 (x)
Uzasadnienie tej ostatniej istotnej dla dowodu nierówności wymaga, żeby dla dowolnej klasycznej
funkcji wagowej w (x) prawdziwa była inna nast˛epujaca
˛ nierówność
1
w1 (x)
(2n)
> 0,
a < x < b,
29
0 < n < nw .
(5.6)
Wobec rozważań z pracy Joó [32], pierwsze uzasadnienie nierówności (5.6) w szczególnym przypadku
funkcji wagowych Laguerre’a oraz Jacobiego pochodzi od R. Askey’a i wykorzystuje gł˛ebokie twierdzenia o położeniu zer wielomianów Laguerre’a i Jacobiego [77]. Inne zwiazane
˛
z ta˛ kwestia˛ dowody
zaproponowane zostały przez Balázs [2] i Bogméra [6] również w przypadku wielomianów Jacobiego
i Laguerre’a. W szczególności idea dowodu zaproponowanego przez Balázs opiera si˛e na pewnych
odpowiednich jawnych wzorach całkowych dla funkcji 1/w1 (x), które sa˛ łatwe do różniczkowania.
Niestety wydaje si˛e, że powyższe pomysły nie moga˛ być zastosowane w pozostałych przypadkach klasycznych wag zwiazanych
˛
z wielomianami (iv), (v) i (vi) podanymi w Sekcji 2. Z drugiej
jednak strony w pracy [61] znaleziony został elementarny, ujednolicony, nowy sposób dowodzenia
nierówności (5.6) dla wszystkich klasycznych wag (i)–(vi), generujacych
˛
nietrywialne ciagi
˛ klasycznych wielomianów ortogonalnych. Ta metoda opiera si˛e na nast˛epujacych
˛
trzech lematach, z których
pierwszy wykorzystuje klasyczne wagi wk (x) = Ak (x) w (x) określone w Punkcie 2.3.
Lemat 5.1 Niech w (x) b˛edzie klasyczna˛ waga˛ określona˛ na przedziale (a, b) i niech sn (x) b˛edzie
zdefiniowane przez
(n)
1
(−1)n
=
sn (x) .
(5.7)
w1 (x)
wn+1 (x)
Wtedy sn (x) jest wielomianem stopnia n postaci
!
n
k
X
Y
n
sn (x) = cn +
cn−k
[b1 + (n − i) a2 ] xk
k
(5.8)
i=1
k=1
ze współczynnikami cn spełniajacymi
˛
zależności rekurencyjne
c0 = 1,
c1 = b0 ,
cn = − (n − 1) [b1 + (n − 2) a2 ] a0 cn−2 + [b0 + (n − 1) a1 ] cn−1 ,
Ponadto wielomian sn (x) spełnia nast˛epujacy
˛ wzór rekurencyjny
sn (x) = −s0n−1 (x) A (x) + sn−1 (x) B (x) + (n − 1) A0 (x) ,
n ≥ 2.
n = 1, 2, . . . .
(5.9)
(5.10)
Lemat 5.2 Pochodna wielomianu sn (x) określonego w Lemacie 5.1 spełnia nast˛epujacy
˛ wzór rekurencyjny
s0n (x) = n [b1 + (n − 1) a2 ] sn−1 (x) .
Lemat 5.3 Wielomiany s2n (x), 0 ≤ n < nw , pojawiajace
˛ si˛e w Lemacie 5.1 sa˛ wypukłe i dodatnie
na (a, b).
Dzi˛eki Lematom 5.1 oraz 5.3 staje si˛e jasne, że nierówność (5.6) jest prawdziwa dla dowolnej klasycznej wagi w (x), co pozwala skończyć uzasadnienie Twierdzenia 5.1, dostarczajacego
˛
ujednolicone
rozwiazanie
˛
problemu interpolacyjnego Fejéra.
30
5.2
Problem interpolacyjny Egerváryego i Turána
Drugi z zaprezentowanych problemów interpolacyjnych, pochodzacy
˛ od Egerváryego i Turána [15,
16], dotyczy poszukiwania tzw. w1 -stabilnego i najbardziej ekonomicznego operatora interpolacyjnego typu Hermite’a zwiazanego
˛
z dowolna˛ klasyczna˛ waga.˛ Punktem wyjścia do rozważań zwiaza˛
nych z tym problemem jest obserwacja, iż użyte do definicji operatora Hn wielomiany fundamentalne Lagrange’a lk (x) sa˛ jedynymi wielomianami stopnia n − 1 spełniajacymi
˛
warunki interpolacyjne (5.3). Z drugiej strony bowiem bez założenia, iż wielomiany te musza˛ być stopnia n − 1,
same warunki interpolacyjne (5.3) nie gwarantuja˛ ich jednoznaczności. Naturalnym zatem wydaje
si˛e pytanie
o stabilność i ekonomiczność wszelkich układów wielomianów b
lk (x) dowolnego stopnia
b
deg lk (x) ≥ n − 1 spełniajacych
˛
warunki interpolacyjne (5.3). Problem interpolacyjny Egerváryego i Turána [15, 16, 31, 32, 34] dotyczy właśnie tego zagadnienia. Przy tym układ interpolacyjny
b
lk (x), k = 1, . . . , n, jest nazywany w1 -stabilnym, gdy dla wszystkich nieujemnych rzeczywistych
liczb y1 , . . . , yn zachodza˛ nierówności
0 ≤ w1 (x)
n
X
k=1
yk
b
lk (x)
≤ max yk ,
w1 (xk ) 1≤k≤n
a < x < b,
oraz dodatkowo najbardziej ekonomicznym, gdy suma
n
X
deg b
lk (x)
k=1
stopni wielomianów b
lk (x) jest najmniejsza.
Pierwsze rozwiazanie
˛
tego problemu, w szczególnym przypadku wag Legendre’a oraz Hermite’a
przedstawili w swoich pracach [15, 16] właśnie Egerváry i Turán. Ich rezultaty pokazały, że rozwia˛
zaniem sa˛ kwadraty fundamentalnych wielomianów interpolacyjnych Lagrange’a zdefiniowanych w
zerach klasycznych wielomianów ortogonalnych odpowiadajacych
˛
tym wagom. Analogiczne rezultaty dla klasycznych wag Laguerre’a i Jacobiego uzyskali później również inni autorzy [3, 31, 32]. Pełne
ujednolicone rozwiazanie
˛
obejmujace
˛ wszystkie sześć klas klasycznych funkcji wagowych udało si˛e
sformułować dopiero w pracy [61], gdzie wykorzystano w tym celu wyniki kompletnego rozwiazania
˛
problemu interpolacyjnego Fejéra. To nowe rozwiazanie,
˛
uwzgl˛edniajace
˛ w szczególności uogólniona˛
wag˛e Bessla, wag˛e Jacobiego na (0, +∞) oraz wag˛e pseudo-Jacobiego, ujać
˛ można w postaci nast˛epujacego
˛
twierdzenia.
Twierdzenie 5.2 Niech qn (x) b˛edzie monicznym klasycznym wielomianem, ortogonalnym wzgl˛edem
klasycznej funkcji wagowej w (x) na przedziale (a, b). Wtedy układ interpolacyjny b
lk (x), k = 1, . . . , n,
jest w1 -stabilny i najbardziej ekonomiczny wtedy i tylko wtedy, gdy
2
q
(x)
n
b
lk (x) =
, k = 1, . . . , n, 0 < n < nw ,
(x − xk ) qn0 (xk )
gdzie x1 , . . . , xn ∈ (a, b) sa˛ zerami wielomianu qn (x).
5.3
Algorytm
Zaprezentowane jednolite i kompletne rozwiazania
˛
rozważanych problemów interpolacyjnych bezpośrednio sugeruja˛ numeryczny algorytm ewaluacji efektywnego, stabilnego i najbardziej ekonomicznego operatora interpolacyjnego typu Hermite’a. Wymaga on w pierwszej kolejności obliczenia zer
31
x1 , . . . , xn w przedziale (a, b) klasycznego monicznego wielomianu qn (x) ortogonalnego wzgl˛edem
wagi w (x). W tym celu najprościej jest zaadaptować bazujacy
˛ na zmodyfikowanej bisekcji dla ciagów
˛
Sturma Algorytm 4.1, wykorzystujac
˛ jego dwa pierwsze kroki.
Po znalezieniu zer wielomianu ortogonalnego qn (x) stopnia n można rozpoczać
˛ właściwa˛ ewaluacj˛e efektywnego, stabilnego i najbardziej ekonomicznego operatora interpolacyjnego Hermite’a Hn
określonego wzorem (5.2). W tym celu warto wykorzystać barycentryczne podejście do interpolacji
zaprezentowane w [4, 25] dla przypadku interpolacji Lagrange’a. Zapisujac
˛ w szczególności operator
Hn w tzw. pierwszej postaci wzoru barycentrycznej interpolacji
n
X
ω
bk
(Hn f ) (x) = w1 (x) qn2 (x)
f (xk )
2,
(x
−
x
)
k
k=1
gdzie wagi barycentryczne ω
bk maja˛ postać
ω
bk =
1
,
[qn0 (xk )]2 w1 (xk )
łatwo zauważyć, że można wyodr˛ebnić w konstruowanym algorytmie dwie ważne cz˛eści. W jednej
z nich obliczane sa˛ osobno wagi barycentryczne ω
bk , w drugiej zaś wykonywana jest, korzystajaca
˛
jedynie z tych wag, ewaluacja operatora Hn . Korzyścia˛ takiego podejścia jest to, że obliczenia wag
barycentrycznych, niezależacych
˛
od x, nie musza˛ być wykonywane przy każdym znajdowaniu wartości (Hn f ) (x), a jedynie wtedy gdy zmianie ulegnie konfiguracja w˛ezłów interpolacji x1 , . . . , xn .
Poszczególne kroki obu wspomnianych cz˛eści zapisać można w postaci nast˛epujacych
˛
dwóch algorytmów.
Algorytm 5.1. Wagi barycentryczne zwiazane
˛
z operatorem interpolacyjnym typu Hermite’a Hn spełniajacym
˛
warunki interpolacyjne (5.1).
Wejście: Liczba całkowita n > 0, liczby rzeczywiste a2 , a1 , a0 , b1 , b0 definiujace
˛ klasyczna˛ wag˛e w (x), liczby rzeczywiste x1 , . . . , xn b˛edace
˛ zerami klasycznego wielomianu qn (x) ortogonalnego wzgl˛edem klasycznej wagi w (x).
Wyjście: Liczby rzeczywiste ω
b1 , . . . , ω
bn b˛edace
˛ wagami barycentrycznymi zwiazanymi
˛
z operatorem Hn .
1. ω
b1 = 1.
2. Dla j = 2, 3, . . . , n wykonuj:
2.1. ω
bj = 1.
2.2. Dla k = 1, 2, . . . , j − 1 wykonuj:
2.2.1. ω
bk = (xk − xj ) ω
bk .
2.2.2. ω
bj = (xj − xk ) ω
bj .
2
−1
3. Zwróć wagi barycentryczne równe ω
bk = ω
bk w1 (xk )
,
32
k = 1, 2, . . . , n.
Algorytm 5.2. Obliczanie wartości (Hn f ) (x) efektywnego, stabilnego i najbardziej ekonomicznego operatora interpolacyjnego typu Hermite’a spełniajacego
˛
warunki interpolacyjne (5.1).
Wejście: Liczba rzeczywista x ∈ (a, b), liczba całkowita n > 0, liczby rzeczywiste a2 , a1 , a0 , b1 , b0 definiujace
˛
klasyczna˛ wag˛e w (x), liczby rzeczywiste x1 , . . . , xn b˛edace
˛ zerami klasycznego wielomianu qn (x) ortogonalnego
wzgl˛edem klasycznej wagi w (x), liczby rzeczywiste f (x1 ) , . . . , f (xn ) stanowiace
˛ wartości interpolowanej funkcji
f , liczby rzeczywiste ω
b1 , . . . , ω
bn b˛edace
˛ wagami barycentrycznymi zwiazanymi
˛
z operatorem Hn .
Wyjście: Liczba rzeczywista Hn f stanowiaca
˛ wartość (Hn f ) (x) optymalnego operatora interpolacyjnego typu Hermite’a w punkcie x.
1. Hn f = 0, qn = 1.
2. Dla k = 1, 2, . . . , n wykonuj:
2.1. Hn f = Hn f + f (xk ) ω
bk / (x − xk )2 .
2.2. qn = qn · (x − xk )2 .
3. Hn f = qn w1 (x) Hn f .
4. Zwróć wartość Hn f .
Krótka analiza złożoności obliczeniowej przytoczonych algorytmów potwierdza słuszność zastosowania barycentrycznego podejścia do interpolacji operatorem typu Hermite’aHn . Widać bowiem,
że złożoność Algorytmu 5.1 obliczajacego
˛
wagi barycentryczne wynosi O n2 , natomiast Algorytmu 5.2 znajdujacego
˛
wartość (Hn f ) (x) jest rz˛edu O (n). Zatem najbardziej kosztowna cz˛eść całej ewaluacji może być wykonywana sporadycznie jedynie przy okazji zmiany w˛ezłów interpolacji
x1 , . . . , xn . Druga szybka cz˛eść z kolei może być wielokrotnie powtarzana, gdy zmieniaja˛ si˛e tylko
wartości x ∈ (a, b). W analizie tej oczywiście nie uwzgl˛ednia si˛e kosztu znajdowania wartości w1 (x)
oraz w1 (xk ) i f (xk ) dla k = 1, . . . , n.
5.4
Zwiazek
˛
z efektywna,˛ ortogonalna˛ interpolacja˛ Lagrange’a
Dla zwi˛ekszenia zupełności rozważań dotyczacych
˛
zagadnienia efektywnych interpolacji, w niniejszej
sekcji została pokrótce zaprezentowana efektywna ortogonalna interpolacja typu Lagrange’a, która
jest ściśle powiazana
˛
z efektywna,˛ stabilna˛ i najbardziej ekonomiczna˛ interpolacja˛ typu Hermite’a.
Dokładniej rzecz ujmujac
˛ chodzi o interpolacj˛e w parami różnych w˛ezłach x1 , . . . , xn z przedziału (a, b) realizowana˛ za pomoca˛ liniowego operatora Ln zdefiniowanego przez warunki interpolacji
postaci
(Ln f ) (xk ) = f (xk ) , k = 1, . . . , n,
(5.11)
i danego wzorem
(Ln f ) (x) =
n
X
p
lk (x)
w1 (x)
f (xk ) p
,
w1 (xk )
k=1
gdzie lk (x) sa˛ wielomianami fundamentalnymi Lagrange’a oraz f (x) jest funkcja˛ ciagł
˛ a˛ i ograniczona˛
na domkni˛eciu przedziału (a, b). Na mocy nierówności Buniakowskiego-Schwarza wartości operatora
(Ln f ) (x) tej interpolacji można oszacować w nast˛epujacy
˛ sposób
2
|(Ln f ) (x)|
≤
n
X
k=1
n
X
lk2 (x)
f (xk ) w1 (x)
≤ nkf k2∞ Λw1 (x1 , . . . , xn ) ,
w1 (xk )
2
k=1
33
gdzie kf k∞ oznacza norm˛e jednostajna˛ funkcji f na (a, b). To oszacowanie jest oczywiście najlepsze,
niezależnie od wyboru x i f (x) wtedy, gdy funkcja
Λw1 (x1 , . . . , xn ) = sup w1 (x) λw1 (x; x1 , . . . , xn )
a<x<b
osiaga
˛ w punktach x1 , . . . , xn minimum równe 1. Jak zostało wykazane w Twierdzeniu 5.1 jest to
równoważne temu, że w˛ezły interpolacji x1 , . . . , xn sa˛ zerami klasycznego wielomianu qn (x) ortogonalnego wzgl˛edem wagi w (x). Innymi słowy operator interpolacyjny Ln ma w tym przypadku norm˛e
√
nie wi˛eksza˛ od n. Dla porównania, w przypadku liniowego dodatnio określonego operatora Hn , z
oczywistych nierówności
n
2 (x) X
l
|(Hn f ) (x)| = w1 (x)
f (xk ) k
≤ kf k∞ Λw1 (x1 , . . . , xn )
w1 (xk ) k=1
i z Twierdzenia 5.1 wynika, że ma on norm˛e równa˛ 1.
Numeryczna˛ algorytmizacj˛e efektywnego obliczania wartości (Ln f ) (x) tego operatora typu Lagrange’a zrealizować można barycentrycznie bardzo podobnie jak to zrobione zostało w pracy [4].
Sama˛ ewaluacj˛e oczywiście poprzedzić trzeba wykonaniem algorytmu obliczajacego
˛
zera x1 , . . . , xn
klasycznego monicznego wielomianu qn (x) ortogonalnego wzgl˛edem wagi w (x). Co wi˛ecej w odróżnieniu od interpolacji typu Hermite’a przy tej ewaluacji wykorzystać można tzw. druga˛ postać wzoru
barycentrycznego
Pn
ωk
p
k=1 f (xk ) x−xk
(Ln f ) (x) = w1 (x) Pn p
ωk
w1 (xk ) x−x
k=1
k
z wagami barycentrycznymi równymi
1
p
.
ωk =
0
qn (xk ) w1 (xk )
Konstrukcja algorytmu obliczania wartości (Ln f ) (x) w oparciu o powyższe formuły jest sprawa˛ oczywista.˛ Niemniej jednak warto przytoczyć ten algorytm, szczególnie dlatego, że kluczowym z punktu
widzenia wydajności jest odpowiednie podzielenie go na dwie cz˛eści. Zostało to uczynione w postaci
Algorytmów 5.3 oraz 5.4.
Algorytm 5.3. Wagi barycentryczne zwiazane
˛
z operatorem interpolacyjnym typu Lagrange’a Ln spełniajacym
˛
warunki
interpolacyjne (5.11).
Wejście: Liczba całkowita n > 0, liczby rzeczywiste a2 , a1 , a0 , b1 , b0 definiujace
˛ klasyczna˛ wag˛e w (x), liczby rzeczywiste x1 , . . . , xn b˛edace
˛ zerami klasycznego wielomianu qn (x) ortogonalnego wzgl˛edem klasycznej wagi w (x).
Wyjście: Liczby rzeczywiste ω1 , . . . , ωn b˛edace
˛ wagami barycentrycznymi zwiazanymi
˛
z operatorem Ln .
1. ω1 = 1.
2. Dla j = 2, 3, . . . , n wykonuj:
2.1. ωj = 1.
2.2. Dla k = 1, 2, . . . , j − 1 wykonuj:
2.2.1. ωk = (xk − xj ) ωk .
2.2.2. ωj = (xj − xk ) ωj .
h p
i−1
3. Zwróć wagi barycentryczne równe ωk = ωk w1 (xk )
,
34
k = 1, 2, . . . , n.
Algorytm 5.4. Obliczanie wartości (Ln f ) (x) efektywnego operatora interpolacyjnego typu Lagrange’a spełniajacego
˛
warunki interpolacyjne (5.11).
Wejście: Liczba rzeczywista x ∈ (a, b), liczba całkowita n > 0, liczby rzeczywiste a2 , a1 , a0 , b1 , b0 definiujace
˛ klasyczna˛ wag˛e w (x), liczby rzeczywiste x1 , . . . , xn b˛edace
˛ zerami klasycznego wielomianu qn (x) ortogonalnego wzgl˛edem
klasycznej wagi w (x), liczby rzeczywiste f (x1 ) , . . . , f (xn ) stanowiace
˛ wartości interpolowanej funkcji f , liczby rzeczywiste ω1 , . . . , ωn b˛edace
˛ wagami barycentrycznymi zwiazanymi
˛
z operatorem Ln .
Wyjście: Liczba rzeczywista Ln f stanowiaca
˛ wartość (Ln f ) (x) optymalnego operatora interpolacyjnego typu Lagrange’a
w punkcie x.
1. l = 0, m = 0.
2. Dla k = 1, 2, . . . , n wykonuj:
2.1. l = l + f (xk ) ωk / (x − xk ).
p
2.2. m = m + w1 (xk ) ωk / (x − xk ).
p
3. Zwróć wartość Ln f = w1 (x) l/m.
W kontekście złożoności obliczeniowej sytuacja jak widać jest taka sama jak przy obliczaniu
wartości (Hn f ) (x) operatora interpolacyjnego typu Hermite’a. To znaczy cz˛eść odpowiedzialna za
znalezienie wag barycentrycznych ωk , k = 1, . . . , n, wymaga O n2 operacji elementarnych, zaś bazujaca
˛ na jej wynikach ewaluacja (Ln f ) (x) kosztuje tylko O (n) działań. Wobec tego najwydajniej
jest poprzedzać Algorytm 5.4 Algorytmem 5.3 jedynie wtedy, gdy zmianie ulega konfiguracja w˛ezłów
interpolacji x1 , . . . , xn . W pozostałych przypadkach, gdy zmienia si˛e tylko x ∈ (a, b), wystarczy używać samego szybkiego
Algorytmu 5.4. Powyższa analizap
nie uwzgl˛ednia rzecz jasna kosztu obliczania
p
wartości f (xk ), w1 (xk ), k = 1, . . . , n, oraz wartości w1 (x).
5.5
Zastosowanie w optymalnym planowaniu eksperymentu
Zaprezentowane rozważania dotyczace
˛ problemu efektywnej, stabilnej i najbardziej ekonomicznej interpolacji typu Hermite’a posiadaja˛ jeszcze jedna˛ ciekawa˛ interpretacj˛e statystyczna˛ opisana˛ w [34],
która jest zwiazana
˛
z dziedzina˛ optymalnego planowania eksperymentów [21, 35, 36, 55]. Krótko
mówiac
˛ dziedzina ta zajmuje si˛e zagadnieniem doświadczalnego badania, za pomoca˛ obserwacji i pomiaru, zachowania różnych zjawisk (obiektów) w celu sformułowania na tej podstawie wniosków o
ich właściwościach. Innymi słowy chodzi o wykonanie eksperymentu, w którym obserwowane jest zachowanie badanego obiektu w reakcji na różne ustawienia czynników wejściowych, w celu stworzenia
modelu opisujacego
˛
zachowanie tego obiektu w różnych dowolnych warunkach.
Najbardziej istotna z punktu widzenia rozważanego w tym rozdziale kontekstu jest sytuacja, gdy
zakłada si˛e, że obiekt badań w reakcji na czynnik wejściowy x ∈ (a, b) daje odpowiedź y (x) opisana˛
nast˛epujac
˛ a˛ funkcja˛ regresji
n
X
y (x) =
θk fk (x) + ε (x) ,
(5.12)
k=1
p
gdzie funkcje fk (x), k = 1, . . . , n, sa˛ znane i maja˛ postać fk (x) = xk−1 w1 (x), współczynniki
θ1 , . . . , θn sa˛ nieznanymi parametrami, zaś ε (x) jest zmienna˛ losowa˛ opisujac
˛ a˛ przypadkowe zakłócenia powstajace
˛ w trakcie badania obiektu. Przyjmuje si˛e, że wartości oczekiwane zwiazane
˛
z ta˛ ostatnia˛
zmienna˛ losowa˛ spełniaja˛ nast˛epujace
˛ warunki
1, x = x
b,
E [ε (x)] = 0 oraz E [ε (x) ε (b
x)] =
0, x 6= x
b.
35
W tej sytuacji eksperyment sprowadza si˛e do wykonania serii N doświadczeń, polegajacych
˛
na pozyskaniu N par (x, y (x)) czynników wejściowych i odpowiedzi na nie badanego obiektu, w celu oszacowania nieznanych parametrów θ = (θ1 , . . . , θn ) funkcji regresji (5.12). Po zgromadzeniu danych
doświadczalnych samo szacowanie tych parametrów standardowo wykonuje si˛e za pomoc
a˛ metody
b
najmniejszych kwadratów, która jak wiadomo daje liniowy nieobcia˛żony estymator θ = θb1 , . . . , θbn .
W ten sposób uzyskuje si˛e pełny opis zachowania badanego zjawiska (obiektu).
Najważniejszy jednak jest wcześniejszy plan takiego eksperymentu, który sprowadza si˛e do wyboru skończonej liczby czynników wejściowych x1 , . . . , xr , które maja˛ być brane do eksperymentu.
Wybór ten obejmuje określenia miary probabilistycznej ξ definiujacej
˛ prawdopodobieństwa pk wysta˛
pienia czynników xk , które ma na celu ustalenie liczb nk badań każdego z tych czynników. W szczególnym przypadku może to być dyskretna miara ξ0 przypisujaca
˛ każdemu z czynników wejściowych
jednakowe prawdopodobieństwo 1r . Oznacza to, że każdy z tych czynników ma być w ramach doświadczenia zbadany dokładnie nk = Nr razy.
Przy planowaniu eksperymentu chodzi także o to, żeby wybór czynników wejściowych był w jakimś sensie optymalny, chociażby po to żeby ułatwić obliczenia i zminimalizować koszty badań. Jest
b wi˛ec powinny być one tak dobrajasne, że czynniki wejściowe wpływaja˛ na otrzymywany estymator θ,
ne, żeby estymator ten był jak najlepszy. W tym celu przydatna okazuje si˛e macierz informacji planu
M (ξ), której pewne funkcjonały poddawane maksymalizacji/minimalizacji pozwalaja˛ uzyskać optymalny plan eksperymentu. W szczególnym
P przypadku miary probabilistycznej ξ0 elementy macierzy
informacji M (ξ0 ) sa˛ postaci mj,k = 1r rs=1 fj (xs ) fk (xs ), j, k = 1, . . . , n.
W teorii optymalnego planowania eksperymentów wyróżnia si˛e kilka kryteriów optymalności planu. Bodaj najbardziej podstawowym jest kryterium D-optymalności miary probabilistycznej maksymalizujacej
˛ wyznacznik det M (ξ) macierzy informacji planu. Kryterium to jest o tyle ważne, że ma
b
bezpośredni zwiazek
˛
z minimalizacja˛ wyznacznika det M −1 (ξ) macierzy kowariancji estymatora θ.
To z kolei gwarantuje, że θb jest najlepszym liniowym nieobcia˛żonym estymatorem dla θ. Innym kryterium jest G-optymalność realizowana przez miar˛e minimalizujac
˛ a˛ maksymalna˛ po x ∈ (a, b) wab Ten rodzaj optymalności jest na mocy
riancj˛e najlepszego liniowego nieobcia˛żonego estymatora θ.
Twierdzenia Kiefera-Wolfowitza [37] równoważny podstawowemu kryterium D-optymalności. Jednak co najbardziej istotne, kryterium to można w przypadku planu zwiazanego
˛
z miara˛ ξ0 zapisać w
postaci
min max w1 (x) λw1 (x) .
ξ0 a<x<b
Co jak widać redukuje postawiony problem do już omówionego problemu interpolacyjnego Fejéra.
W konsekwencji rozwiazanie
˛
problemu Fejéra wyznacza czynniki wejściowe dla eksperymentu Doptymalnego.
6
Własności aproksymacyjne ortogonalnych transformacji wielomianowych
Klasyczne wielomiany ortogonalne znajduja˛ ciekawe zastosowanie przy dwustronnych oszacowaniach
typu Chernoffa bł˛edu aproksymacji średniokwadratowej, to znaczy przy oszacowaniach minimalnej
L2w -odległości
Ew,k (f ) = inf kf − pkw , f ∈ L2,k
(6.1)
w (a, b) ,
p∈Pk−1
36
gładkiej funkcji f od k-wymiarowej przestrzeni Pk−1 wszystkich wielomianów stopnia mniejszego
od k wzgl˛edem ważonej normy średniokwadratowej k · kw w przestrzeni L2w (a, b), gdzie L2,k
w (a, b)
2
k−1
oznacza przestrzeń wszystkich takich funkcji f ∈ Lw (a, b), których pochodna D f jest absolutnie
ciagła
˛ oraz pochodna Dk f należy do L2w (a, b). Te dwustronne oszacowania sa˛ rozwini˛eciem znanych
z teorii prawdopodobieństwa nierówności postaci
2
2
EG0 (X) ≤ V ar [G (X)] ≤ E G0 (X) ,
(6.2)
gdzie X jest zmienna˛ losowa˛ o rozkładzie normalnym ze średnia˛ 0 i wariancja˛ 1, zaś funkcja G jest
absolutnie ciagła
˛ i G (X) ma skończona˛ wariancj˛e. Ponadto obie nierówności staja˛ si˛e równościami
wtedy i tylko wtedy, gdy G (X) jest funkcja˛ liniowa˛ zmiennej X. Jako pierwszy nierówność znajdujac
˛ a˛ si˛e po prawej stronie (6.2) sformułował i uzasadnił Chernoff w swej pracy [8]. Wykorzystał on w
tym celu klasyczne wielomiany ortogonalne Hermite’a, a także zastosował później otrzymana˛ nierówność do rozwiazania
˛
problemu izoperymetrycznego traktowanego jako klasyczny problem rachunku
wariacyjnego. Nierównościami (6.2) zajmował si˛e w swych pracach również Stepanov [67, 68], który
rozszerzył je na pochodne wyższych rz˛edów, stosujac
˛ jednocześnie zamiast wariancji oraz wartości
oczekiwanej odpowiednio odległość Ew,k (f ) oraz iloczyn skalarny (f, g)w z klasyczna˛ waga˛ Hermite’a oraz Jacobiego. Uogólnienie tego ostatniego podejścia na wszystkie klasy klasycznych funkcji
wagowych, w szczególności te nie rozważane przez Stepanova, sformułowane zostało w pracy [65].
Ponieważ zaprezentowane tam nierówności pozwalaja˛ także uzyskać a priori informacje o bł˛edach interpolacji Lagrange’a oraz Hermite’a, wi˛ec zwiazane
˛
z nimi szczegóły zostały dokładnie omówione
w nast˛epnym paragrafie. Dla zupełności rozważań dotyczacych
˛
nierówności typu Chernoffa, przedstawione sa˛ również rezultaty pochodzace
˛ z pracy [62] o nierównościach typu Chernoffa w przypadku
wielowymiarowym, który wydaje si˛e być bardzo interesujacym
˛
kierunkiem przyszłych badań.
6.1
Jednowymiarowe oszacowania typu Chernoffa
Niech klasyczne wagi wk (x) określone na przedziale (a, b) b˛eda˛ znormalizowane w nast˛epujacy
˛ sposób
Z b
Ak (x) w (x)
wk (x) =
, δk =
Ak (x) w (x) dx,
(6.3)
δk
a
przy tym oczywiście w (x) = w0 (x). Ponadto niech qbk (x) b˛eda˛ klasycznymi wielomianami ortonormalnymi
k
qk (x) X
qbk (x) =
=
γ
bj xj .
kqk kw
j=0
Jest interesujace,
˛ że jednowymiarowe oszacowania typu Chernoffa dla wszystkich klas ważonych
funkcjonałów odległości Ew,k (f ) danych wzorem (6.1), wzgl˛edem dowolnej klasycznej wagi w (x),
można sformułować wykorzystujac
˛ jedynie liczby Dk qbk = k!b
γk zwiazane
˛
ze współczynnikiem przy
k
najwyższej pot˛edze x wielomianu qbk (x). Istotnie, oszacowania te wyrazić można nast˛epujacym
˛
twierdzeniem.
Twierdzenie 6.1 Niech w (x) = w0 (x) b˛edzie znormalizowana˛ klasyczna˛ funkcja˛ wagowa˛ zdefiniowana˛ równaniem różniczkowym Pearsona. Wtedy nierówności
Z
1 b k 1 k D
f
(x)
w
(x)
dx
≤
E
(f
)
≤
D
f
(6.4)
, 0 ≤ k < nw ,
k
w,k
|Dk qbk | a
|Dk qbk |
wk
37
zachodza˛ dla każdego f ∈ L2,k
wk (a, b) w przypadku, gdy nw = +∞ lub dla każdego f ∈ Pnw −1
w przypadku, gdy nw < +∞. Dodatkowo obie te nierówności staja˛ si˛e równościami dla każdego
wielomianu f stopnia ≤ k.
W zastosowaniach powyższego twierdzenia konieczne jest obliczanie wartości stałych δk zdefinio
−1
˛ ze wzorów
wanych w (6.3). Dlatego wygodnie jest w tym celu obliczać stała˛ Dk qbk korzystajac
przytoczonych w nast˛epujacych
˛
dwóch uwagach.
−1
Uwaga 6.1 Stała Dk qbk wyst˛epujaca
˛ w nierównościach typu Chernoffa może być obliczona za
pomoca˛ wzoru
v
u
1
δk
u
, 0 < k < nw .
=
k−1
|Dk qbk | u
t Q
[− (k + j − 1) a2 − b1 ]
k!
j=0
Ponadto jest ona równa 1 w przypadku, gdy k = 0.
Uwaga 6.2 W celu obliczenia stałej wyst˛epujacej
˛ w nierównościach typu Chernoffa można również
zastosować nast˛epujac
˛ a˛ formuł˛e
kqk kw
1
=
.
k
|D qbk |
|Dk qk |
Ciekawa˛ wydaje si˛e perspektywa zastosowania Twierdzenia 6.1 do badania a priori możliwości
aproksymacyjnych nie tylko wielomianowych aproksymacji, ale również wielomianowych interpolacji, w szczególności tych omówionych w Sekcji 5. Przy zwiazanych
˛
z tym obliczeniach numerycznych,
−1
wobec oszacowań (6.4), szczególnie ważna˛ rol˛e b˛eda˛ odgrywać stałe Dk qbk . W celu łatwego ich
użycia w algorytmach podać można ich dokładne wartości dla poszczególnych przypadków klasycznych funkcji wagowych, wykorzystujac
˛ przy tym Uwag˛e 6.1 lub 6.2. Wartości te zostały zebrane w
Tabeli 6.1.
−1
Współczynnik Dk qbk q√
Waga klasyczna w (x)
π
k!2k
Hermite’a
q
Laguerre’a
q
Jacobiego
2α+β+2k+1 Γ(α+k+1)Γ(β+k+1)
k!(α+β+k+1)k Γ(α+β+2k+2)
Uogólniona waga Bessla
q
Jacobiego na (0, +∞)
q
r
Pseudo-Jacobiego
Γ(α+k+1)
k!
(A2 +C 2 )α−k
β α+2k−1 Γ(1−α−2k)
k!(2−α−2k)k
Γ(α−2k−1)Γ(β+k+1)
k!(α−2k)k Γ(α+β−k)
R π/2
−π/2
(A cos t−C sin t)2α−2k−2 eβt dt
k!(2α−2k)k (AD−BC)2α−2k−1
−1
Tabela 6.1. Wartości współczynników Dk qbk wyst˛epujacych
˛
w jednowymiarowych oszacowaniach typu Chernoffa
(6.4) dla poszczególnych klasycznych wag.
38
6.2
Wielowymiarowe oszacowania typu Chernoffa
Zaprezentowane powyżej oszacowania typu Chernoffa daja˛ si˛e uogólnić na przypadek wielowymiarowy. Niemniej jednak samo sformułowanie wielowymiarowych nierówności analogicznych do (6.4)
wymaga wcześniejszego wprowadzenia kilku niezb˛ednych oznaczeń i definicji.
Niech zatem Sd,k b˛edzie zbiorem wszystkich uporzadkowanych
˛
d-wymiarowych wektorów α =
(α1 , . . . , αd ) nieujemnych liczb całkowitych αj takich, że |α| < k, gdzie k jest dodatnia˛ liczba˛ całkowita˛ oraz
|α| = α1 + . . . + αd .
Wtedy przestrzeń Pdk−1 wszystkich wielomianów
p (x) =
X
xα = xα1 1 · . . . · xαd d ,
cα xα ,
α∈Sd,k
ze współczynnikami rzeczywistymi cα = cα1 ...αd ∈ R nazywana jest przestrzenia˛ wielomianów o całkowitym stopniu mniejszym niż k zmiennej x = (x1 , . . . , xd ) ∈ Rd . Wymiar tej przestrzeni jest
równy
d + k − 1
d
.
dim Pk−1 =
d
Przyjać
˛ również należy, że Pdk = Pdk (Ω), k = 0, 1, . . ., jest podprzestrzenia˛ rzeczywistej przestrzeni Hilberta
!
∞
[
L2w (Ω) = cl
Pdk (Ω)
k=0
z iloczynem skalarnym
Z
(f, g)w =
f (x) g (x) w (x) dx
Ω
i norma˛
kf kw =
q
(f, f )w ,
gdzie Ω jest iloczynem kartezjańskim d kopii skończonego lub nieskończonego przedziału (a, b),
a symbol dx oznacza d-wymiarowa˛ miar˛e Lebesgue’a na Ω ⊂ Rd . Ponadto zakłada si˛e, że funkcja
wagowa
w (x) = w1 (x1 ) · . . . · wd (xd ) , x = (x1 , . . . , xd ) ∈ Ω,
ma dodatnie składniki wj (xj ) na (a, b), które znormalizowane sa˛ warunkiem
Z
b
wj (xj ) dxj = 1,
a
1 ≤ j ≤ d,
a zatem w (x) spełnia warunek
Z
w (x) dx = 1.
Ω
Wspomniana funkcja wagowa w (x), x ∈ Ω, nazywana jest klasyczna˛ jeśli jej składniki wj (xj ),
xj ∈ (a, b), sa˛ klasyczne tzn. spełniaja˛ równanie różniczkowe Pearsona
d
[Aj (xj ) wj (xj )] = Bj (xj ) wj (xj )
dxj
39
z warunkami brzegowymi
lim Aj (xj ) wj (xj ) = lim Aj (xj ) wj (xj ) = 0,
xj ↓a
xj ↑b
gdzie wielomiany
Aj (xj ) = aj,0 + aj,1 xj + aj,2 x2j
Bj (xj ) = bj,0 + bj,1 xj
oraz
sa˛ takie, że Aj (xj ) > 0 na (a, b) i bj,1 6= 0. Przypominajac,
˛ że klasyczne wielomiany qbn (xj ), 0 ≤
n < nwj , sa˛ ortonormalne wzgl˛edem iloczynu skalarnego
Z
(f, g)wj =
b
f (xj ) g (xj ) wj (xj ) dxj ,
a
jest jasne na mocy definicji funkcji wagowej w (x), x ∈ Ω, że d-wymiarowe wielomiany
qbα (x) = qbα1 (x1 ) · . . . · qbαd (xd ) ,
0 ≤ |α| < nw ,
sa˛ ortonormalne wzgl˛edem iloczynu skalarnego (·, ·)w , gdzie nw jest najmniejszym dolnym ograniczeniem wszystkich nw1 , . . . , nwd . Wielomiany te również nazywane sa˛ klasycznymi. Co wi˛ecej
wielomiany te zapisać można w postaci
X
qbα (x) = cα xα +
cβ xβ , cα 6= 0, k = |α| .
β∈Sd,k
W niniejszym paragrafie przedstawione zostały wyniki pochodzace
˛ z pracy [62], w której jednowymiarowe nierówności zaprezentowane w poprzedniej sekcji zostały wykorzystane do sformułowania wielowymiarowych oszacowań typu Chernoffa bł˛edu aproksymacji średniokwadratowej postaci
Ew,k (f ) = inf kf − pkw ,
p∈Pdk−1
f ∈ L2,k
w (Ω) ,
gdzie w (x) jest klasyczna˛ funkcja˛ wagowa˛ zmiennej d-wymiarowej x, k < nw , zaś L2,k
w (Ω) oznacza
˛
przestrzeń wszystkich funkcji f w L2w (Ω), których wszystkie pochodne czastkowe
∂ α1
∂ αd
α
(D f ) (x) =
...
f (x) , x ∈ Ω,
∂x1
∂xd
sa˛ dla |α| < k absolutnie ciagłymi
˛
funkcjami każdej z osobna zmiennej xj oraz takimi, że pochodna
α
czastkowa
˛
(D f ) (x) dla |α| = k należy do przestrzeni L2w (Ω). W tym celu wykorzystywany b˛edzie
fakt, że klasyczne wielomiany ortonormalne qbα (x), α ∈ Sd,k , tworza˛ baz˛e ortonormalna˛ w przestrzeni
Pdk−1 (Ω) wszystkich wielomianów o całkowitym stopniu mniejszym niż k < nw .
Podobnie jak w przypadku jednowymiarowym istotna˛ rol˛e w wielowymiarowych oszacowaniach
typu Chernoffa odgrywa wiodacy
˛ współczynnik przy xα klasycznego wielomianu ortonormalnego
qbα (x) oznaczony przez cα = cα (b
qα ). Współczynnik ten można wyrazić przez
cα =
d
Y
1
(Dα qbα ) (x) =
cαj ,
α!
j=1
40
α! = α1 ! · . . . · αd !,
(6.5)
gdzie cαj = cαj qbαj jest współczynnikiem przy najwyższej pot˛edze odpowiedniego jednowymiarowego klasycznego wielomianu qbαj (xj ) stopnia αj ortonormalnego wzgl˛edem wagi wj (xj ). Wprowadzajac
˛ dodatkowo oznaczenia
wα (x) =
α
d
Y
Aj j (xj ) wj (xj )
gj,αj
j=1
,
gdzie α = (α1 , . . . , αd ) jest wielowskaźnikiem oraz
Z
gj,αj =
a
b
α
Aj j (xj ) wj (xj ) dxj
można te d-wymiarowe oszacowania podać w formie nast˛epujacego
˛
twierdzenia.
Twierdzenie 6.2 Niech w b˛edzie znormalizowana˛ klasyczna˛ funkcja˛ wagowa˛ określona˛ na Ω. Zachodza˛ wtedy nierówności
X
|α|=k
R
!
(Dα f ) (x) wα (x) dx 2
X kDα f kw 2
2
α
Ω
(f ) ≤
≤ Ew,k
,
α!cα
α!cα
0 < k < nw ,
(6.6)
|α|=k
d
dla każdego f ∈ L2,k
w (Ω) w przypadku, gdy nw = +∞ lub dla każdego f ∈ Pnw −1 w przypadku,
gdy nw < +∞. Dodatkowo obie te nierówności staja˛ si˛e równościami dla każdego wielomianu f
o całkowitym stopniu mniejszym lub równym k.
W zastosowaniach podanego Twierdzenia 6.2 konieczne jest obliczanie stałych (α!cα )−2 . W tym
celu zaleca si˛e używać nast˛epujacej
˛ uwagi, która wobec wzoru (6.5) wynika bezpośrednio z Uwagi
6.1.
Uwaga 6.3 Stałe (α!cα )−2 wyst˛epujace
˛ w wielowymiarowych nierównościach typu Chernoffa
(6.6) moga˛ być obliczane ze wzoru
d
gj,αj
1
1 Y
,
Qαj −1
2 = α!
(α!cα )
j=1
l=0 [− (αj + l − 1) aj,2 − bj,1 ]
0 < |α| < nw .
Numeryczne obliczanie tych stałych, podobnie jak w przypadku jednowymiarowym, może być
dodatkowo uproszczone dzi˛eki bezpośrednim
formułom, które daje si˛e uzyskać dla konkretnych przyQd
padków klasycznych wag wα (x) = j=1 wj (xj ). Najbardziej istotne z nich, otrzymane dla wag
wj (xj ) należacych
˛
do tej samej klasy, zebrane zostały w Tabeli 6.2. Ciekawostka˛ jest to, że na tej
samej zasadzie sformułować można także wzory dla wszelkich kombinacji różnych rodzajów klasycznych wag. Łacz
˛ ac
˛ w ten sposób w jednym wzorze na przykład funkcje wagowe Laguerre’a z
uogólnionymi wagami Bessla albo wagi Hermite’a z funkcjami wagowymi pseudo-Jacobiego.
41
Wagi klasyczne wj (xj )
Wielomiany qbαj (xj )
Hermite’a
Hαj (xj )
Laguerre’a
Lαjj (xj )
Współczynnik (α!cα )
√
Jacobiego
Uogólnione wagi Bessla
(
(γ ,δj )
(γ ,δj )
Bαjj
2d(γj +δj +1)+2k
α!
1
α!
(xj )
Jacobiego na (0, +∞)
Pseudo-Jacobiego
(γ ,δ ,A ,B ,C ,D )
Jαjj j j j j j
Qd
1
α!
(xj )
(γ ,δ )
Mαjj j
d
π)
α!2k
(γ )
Pα j j
−2
1
α!
(xj )
(xj )
1
α!
Qd
j=1
j=1
Γ (γj + αj + 1)
Qd
Γ(γl +αl +1)Γ(δl +αl +1)
l=1 Γ(γl +δl +2αl +2)(γl +δl +αl +1)α
l
Qd
γ +2αj −1
δj j
Γ(1−γj −2αj )
j=1
(2−γj −2αj )α
j
Γ(γj −2αj −1)Γ(δj +αj +1)
j=1 Γ(γj +δj −αj )(γj −2αj )α
Qd
j
(A2j +Cj2 )
γj −αj
R π/2
(Aj cos t−Cj sin t)2γj −2αj −2 eδj t dt
−π/2
(2γj −2αj )α (Aj Dj −Bj Cj )2γj −2αj −1
j
Tabela 6.2. Wartości współczynników (α!cα )−2 wyst˛epujacych
˛
w d-wymiarowych oszacowaniach typu Chernoffa (6.6) dla
poszczególnych klas klasycznych wag powiazanych
˛
z klasycznymi wielomianami ortogonalnymi.
Literatura
[1] A HO A. V., H OPCROFT J. E., U LLMAN J. D. Projektowanie i Analiza Algorytmów. Wydawnictwo Helion, 2003. Tytuł oryginału: The Design and Analysis of Computer Algorithms.
[2] BALÁZS C. On an extremal problem connected with the fundamental polynomials of interpolation. Acta Mathematica Academiae Scientiarum Hungaricae 34 (1979), 307–315.
[3] BALÁZS J. Megjegyzések a stabil interpolációról. Matematikai Lapok 11 (1960), 280–293.
[4] B ERRUT J.-P., T REFETHEN L. N. Barycentric Lagrange interpolation. SIAM Review 46 (2004),
501–517.
[5] B OCHNER S. Über Sturm-Liouvillesche Polynomsysteme. Mathematische Zeitschrift 29 (1929),
730–736.
[6] B OGMÉR A. A simple proof for an inequality. Acta Mathematica Hungarica 44 (1984), 351–353.
[7] C ALOGERO F. Solution of the one-dimensional N-body problem with quadratic and/or inversely
quadratic pair potentials. Journal of Mathematical Physics 12 (1971), 419–436.
[8] C HERNOFF H. A note on an inequality involving the normal distribution. Annals of Probability
9 (1981), 533–535.
[9] C HERNOV N. Circular and Linear Regression, Fitting Circles and Lines by Least Squares. CRC
Press Taylor & Francis Group, New York, 2011.
[10] C HIHARA T. S. An Introduction to Orthogonal Polynomials, Tom 13 Mathematics and its Applications. Gordon and Breach, New York, 1978.
[11] C HIHARA T. S. 45 years of orthogonal polynomials: a view from the wings. Journal of Computational and Applied Mathematics 133 (2001), 13–21.
42
[12] C OOLEY J. W., T UKEY J. W. An algorithm for the machine calculation of complex Fourier
series. Mathematics of Computation 19 (1965), 297–301.
[13] DASGUPTA S., PAPADIMITRIOU C., VAZIRANI U. Algorytmy. Wydawnictwo Naukowe PWN,
Warszawa, 2010. Tytuł oryginału: Algorithms.
[14] E CK M. Degree reduction of Bézier curves. Computer Aided Geometric Design 10 (1993),
237–251.
[15] E GERVÁRY E., T URÁN P. Notes on interpolation. V (On the stability of interpolation). Acta
Mathematica Academiae Scientiarum Hungaricae 9 (1958), 259–267.
[16] E GERVÁRY E., T URÁN P. Notes on interpolation. VI (On the stability of the interpolation on an
infinite interval). Acta Mathematica Academiae Scientiarum Hungaricae 10 (1959), 55–62.
[17] FARIN G. Curves and Surfaces for Computer-Aided Geometric Design: A Practical Guide,
Wydanie 4. Academic Press, San Diego, 1997.
[18] FAROUKI R. T. Legendre-Bernstein basis transformations. Journal of Computational and Applied Mathematics 119 (2000), 145–160.
[19] FAROUKI R. T. Pythagorean-Hodograph Curves: Algebra and Geometry Inseparable. Springer,
Berlin, 2008.
[20] F EJÉR L. Bestimmung derjenigen Abszissen eines Intervalles, für welche die Quadratsumme der
Grundfunktionen der Lagrangeschen Interpolation im Intervalle ein Möglichst kleines Maximum
Besitzt. Annali della Scuola Normale Superiore di Pisa, Classe di Scienze 2e série 1 (1932),
263–276.
[21] F ISHER R. A. The Design of Experiments. Oliver and Boyd Ltd., London, 1935.
[22] G ANTMACHER F. R. The Theory of Matrices. Chelsea Publishing Company, New York, 1959.
[23] G OLUB G. H., VAN L OAN C. F. Matrix Computations. Johns Hopkins University Press, 1983.
[24] H AHN W. Über die Jacobischen Polynome und zwei verwandte Polynomklassen. Mathematische
Zeitschrift 39 (1935), 634–638.
[25] H IGHAM N. J. The numerical stability of barycentric Lagrange interpolation. IMA Journal of
Numerical Analysis 24 (2004), 547–556.
[26] H ORVÁTH Á. P. % (w)-normal point systems. Acta Mathematica Hungarica 85 (1999), 9–27.
[27] H ORVÁTH Á. P. Weighted Hermite-Fejér interpolation on the real line: L∞ case. Acta Mathematica Hungarica 115 (2007), 101–131.
[28] H OSCHEK J., L ESSER D. Fundamentals of Computer Aided Geometric Design. A. K. Peters,
Wellesley, 1993.
[29] H SU H.-S., T SAI W.-H. Moment-preserving edge detection and its application to image data
compression. Optical Engineering 32 (1993), 1596–1608.
43
[30] I SMAIL M. E. H. Classical and Quantum Orthogonal Polynomials in One Variable, Tom 98
Encyclopedia of Mathematics and its Applications. Cambridge University Press, 2005.
[31] J OÓ I. Stable interpolation on an infinite interval. Acta Mathematica Academiae Scientiarum
Hungaricae 25 (1974), 147–157.
[32] J OÓ I. An interpolation-theoretical characterization of the classical orthogonal polynomials. Acta
Mathematica Academiae Scientiarum Hungaricae 26 (1975), 163–169.
[33] K APUSTA J. Algorytmy transformacji wielomianowych i ich zastosowania. Rozprawa doktorska,
Instytut Badań Systemowych Polskiej Akademii Nauk, 2010.
[34] K ARLIN S., S TUDDEN W. J. Tchebycheff Systems: With Applications in Analysis and Statistics.
Interscience Publishers, New York, 1966.
[35] K IEFER J. Optimum experimental designs. Journal of the Royal Statistical Society. Series B
(Methodological) 21 (1959), 272–319.
[36] K IEFER J., W OLFOWITZ J. Optimum designs in regression problems. The Annals of Mathematical Statistics 30 (1959), 271–294.
[37] K IEFER J., W OLFOWITZ J. The equivalence of two extremum problems. Canadian Journal of
Mathematics 12 (1960), 363–366.
[38] K IM H. J., A HN Y. J. Good degree reduction of Bézier curves using Jacobi polynomials. Computers and Mathematics with Applications 40 (2000), 1205–1215.
[39] K NUTH D. E. Sztuka Programowania, Algorytmy Seminumeryczne. Wydawnictwo NaukowoTechniczne, 2002. Tytuł oryginału: The Art of Computer Programming, Seminumerical Algorithms.
[40] KOEKOEK R., L ESKY P. A., S WARTTOUW R. F. Hypergeometric Orthogonal Polynomials and
Their q-Analogues. Springer Monographs in Mathematics. Springer-Verlag, Berlin, 2010.
[41] K RALL H. L. On derivatives of orthogonal polynomials. Bulletin of the American Mathematical
Society 42 (1936), 423–428.
[42] K RALL H. L. On higher derivatives of orthogonal polynomials. Bulletin of the American Mathematical Society 42 (1936), 867–870.
[43] L ANCZOS C. Applied Analysis. Prentice Hall, Inc., Englewood Cliffs, N. J., 1964.
[44] L AU T.-S., S TUDDEN W. J. On an extremal problem of Fejér. Tech. Rep. 84-83, Department of
Statistics, Purdue University, 1984.
[45] L AU T.-S., S TUDDEN W. J. On an extremal problem of Fejér. Journal of Approximation Theory
53 (1988), 184–194.
[46] L ESKY P. Die Charakterisierung der klassischen orthogonalen Polynome durch SturmLiouvillesche Differentialgleichungen. Archive for Rational Mechanics and Analysis 10 (1962),
341–351.
44
[47] L ESKY P. A. Eine Charakterisierung der klassichen kontinuierlichen-, diskreten- und q-Orthogonalpolynome. Shaker Verlag, Aachen, 2005.
[48] L U L., WANG G. Application of Chebyshev II - Bernstein basis transformations to degree
reduction of Bézier curves. Journal of Computational and Applied Mathematics 221 (2008),
52–65.
[49] L UBINSKY D. S. Hermite and Hermite-Fejér interpolation and associated product integration
rules on the real line: The L∞ theory. Journal of Approximation Theory 70 (1992), 284–334.
[50] M ARCELLÁN F., M ARTÍNEZ -F INKELSHTEIN A., M ARTÍNEZ -G ONZÁLEZ P. Electrostatic models for zeros of polynomials: Old, new, and some open problems. Journal of Computational and
Applied Mathematics 207 (2007), 258–272.
[51] M ASTROIANNI G., M ILOVANOVI Ć G. V. Interpolation Processes, Basic Theory and Applications. Springer-Verlag, Berlin, 2008.
[52] M ATEER T. Fast Fourier transform algorithms with applications. Rozprawa doktorska, The
Graduate School of Clemson University, 2008.
[53] M ONTERDE J., O NGAY F. An isoperimetric type problem for primitive Pythagorean hodograph
curves. Computer Aided Geometric Design 29 (2012), 626–647.
[54] M OSER J. Three integrable Hamiltonian systems connected with isospectral deformations. Advances in Mathematics 16 (1975), 197–220.
[55] P UKELSHEIM F. Optimal Design of Experiments, Tom 50 Classics in Applied Mathematics.
SIAM, 2006.
[56] R ALSTON A. Wst˛ep do Analizy Numerycznej. Państwowe Wydawnictwo Naukowe, Warszawa,
1971. Tytuł oryginału: A First Course in Numerical Analysis.
[57] RUTKA P. An efficient orthogonal algorithmization of isoperimetric type problem in the class
of closed polynomial curves. Techniki informacyjne - teoria i zastosowania, J. Hołubiec (Red.),
Tom 1 (13). Instytut Badań Systemowych Polskiej Akademii Nauk, 2011, str. 134–146.
[58] RUTKA P. Algorytmizacja problemu równowagi elektrostatycznej. Techniki informacyjne - teoria i zastosowania, A. Myśliński (Red.), Tom 2 (14). Instytut Badań Systemowych Polskiej Akademii Nauk, 2012, str. 71–83.
[59] RUTKA P., S MARZEWSKI R. A weighted extremal problem for the Bézier curves of degree n
with Jacobi densities. Annales UMCS Informatica AI VIII 2 (2008), 15–26.
[60] RUTKA P., S MARZEWSKI R. Complete solution of the electrostatic equilibrium problem for
classical weights. Applied Mathematics and Computation 218 (2012), 6027–6037.
[61] RUTKA P., S MARZEWSKI R. Extremal interpolatory problem of Fejér type for all classical
weight functions. Electronic Transactions on Numerical Analysis 39 (2012), 46–59.
[62] RUTKA P., S MARZEWSKI R. Multivariate inequalities of Chernoff type for classical orthogonal
polynomials. Journal of Mathematical Analysis and Applications 388 (2012), 78–85.
45
[63] S CHOENBERG I. J. On the maxima of certain Hankel determinants and the zeros of the classical
orthogonal polynomials. Indagationes Mathematicae 62 (1959), 282–290.
[64] S EE K. W., L OKE K. S., L EE P. A., L OE K. F. Image reconstruction using various discrete
orthogonal polynomials in comparision with DCT. Applied Mathematics and Computation 193
(2007), 346–359.
[65] S MARZEWSKI R., RUTKA P. Inequalities of Chernoff type for finite and infinite sequences
of classical orthogonal polynomials. Proceedings of the American Mathematical Society 138
(2010), 1305–1315.
[66] S MARZEWSKI R., RUTKA P. An isoperimetric type problem for Bézier curves of degree n.
Computer Aided Geometric Design 27 (2010), 313–321.
[67] S TEPANOV V. D. An extremal property of Chebyshev polynomials. Proceedings of the Steklov
Institute of Mathematics 248 (2005), 230–242.
[68] S TEPANOV V. D. An extremal property of Jacobi polynomials in two-sided Chernoff-type inequalities for higher order derivatives. Proceedings of the American Mathematical Society 136
(2008), 1589–1597.
[69] S TIELTJES T. J. Sur les polynômes de Jacobi. Comptes Rendus hebdomadaires des séances de
l’Académie des Sciences 100 (1885), 620–622.
[70] S TIELTJES T. J. Sur quelques théorèmes d’Algèbre. Comptes Rendus hebdomadaires des séances de l’Académie des Sciences 100 (1885), 439–440.
[71] S TIELTJES T. J. Sur les racines de l’equation Xn = 0. Acta Mathematica 9 (1887), 385–400.
[72] S TOER J., B ULIRSCH R. Wst˛ep do Analizy Numerycznej. Państwowe Wydawnictwo Naukowe,
Warszawa, 1987. Tytuł oryginału: Introduction to Numerical Analysis.
[73] S UETIN P. K. Classical Orthogonal Polynomials. Nauka, Moscow, 1979.
[74] S UTHERLAND B. Exact results for a quantum many-body problem in one-dimension. Physical
Review A 4 (1971), 2019–2021.
[75] S UTHERLAND B. Exact results for a quantum many-body problem in one-dimension. II. Physical Review A 5 (1972), 1372–1376.
[76] S ZABÓ V. E. S. Weighted interpolation: The L∞ theory. I. Acta Mathematica Hungarica 83
(1999), 131–159.
[77] S ZEG Ő G. Orthogonal Polynomials, Wydanie 4, Tom XXIII American Mathematical Society
Colloquium Publications. American Mathematical Society, Providence RI, 1975.
[78] VALENT G., VAN A SSCHE W. The impact of Stieltjes’ work on continued fractions and orthogonal polynomials: additional material. Journal of Computational and Applied Mathematics 65
(1995), 419–447.
[79] VAN D IEJEN J. F., V INET L. (Red.). Calogero-Moser-Sutherland Models. CRM Series in
Mathematical Physics. Springer, New York, 2000.
46