Historyczny rozwój pojęcia krzywej na tle rozwoju pojęć teorii

Transkrypt

Historyczny rozwój pojęcia krzywej na tle rozwoju pojęć teorii
Historyczny rozwój pojęcia krzywej na tle
rozwoju pojęć teorii mnogości i topologii.
Krzywe Peany.
Przemysław Osik
Krzywa to jedno z podstawowych pojęć geomerii, którego próby zdefiniowania sięgają starożytności. Rozwój tego pojęcia uzależniony byl przede
wszystkim od nowo odkrywanych ’narzędzi’ matematycznych, których pojawienie się niemal natychmiast implikowało modyfikację wówczas obowiązującej definicji krzywej. Dopiero stosunkwo niedawno, bo w latach dwudziestych
minionego stulecia, udało się sformułować najbardziej ogólne określenie linii,
pozwalające zbadać ostatecznie istotę tego pojęcia. Zawdzięczamy ją wybitnemu matematykowi rosyjskiemu P. S. Urysohnowi (1898- 1924). Warto
jednak zaznaczyć, że jego dokonanie jest jedynie wynikiem krytycznego i głębokiego opanowania ogromnego dorobku naukowego, nagromadzonego przez
ludzkość w ciągu całego poprzedniego okresu czasu.
Jako pierwszy próby określenie pojęcia krzywej podjął się grecki matematyk
i fizyk Euklides (365-300 p.n.e.). W swoim dziele zatytułowanym ’Stoicheia
geometrias’, znanym obecmie pod nazwą ’Elementy’, podał dwa różne epitety
tego pojęcia. Mianowicie określił linię jako dlugość bez szerokości (określenie
nr 2) oraz jako ograniczenie powierzchni (określenia nr 6). Jak łatwo zauważyć, tak skonstruowane określenia nie mogły być w żaden sposób przydatne
do matematycznego bagania istoty omawianego pojęcia , gdyż wyrażone były za pomocą innych terminów, które z kolei same wymagały wcześniejszego
zdefiniowania. Jednakże nie ma się czemu dziwić - przy ówczesnym stanie
rozwoju nauki i charakterze stawianych przez nią wymagań, Eulides nie był
w stanie uporać się z określeniem pojęcia linii w bardziej ogólnej postaci
i ograniczając się do wyżej przytoczonych sformułowań, skupił swoją uwagę na dwóch najprostrzych i najczęściej używanych wówczas liniach, tj. na
prostej i okręgu koła. Nie świadczy to oczywiście o skąpym stanie wiedzy
1
starożytnych, gdyż jeszcze na długo przed Euklidesem znano tak skomplikowaną krzywą jak np. kwadratrysę Dinostratosa (krzywą płaską, powstającą
jako miejsce przecięcia się prostych, z których jedna obraca się ze stałą prędkością kątową, a druga przesuwa się ze stałą prędkością liniową).
Niecałe sto lat później pracy nad liniami krzywymi poświęcił się kolejny wybitny matematyk grecki Apolloniusz [Apollonios] z Pergi (262-200 p.n.e.) jeden z największych geometrów starożytności, uważany jednocześnie za prekursora geometrii analitycznej. W swoich pracach skupił się przede wszystkim na badaniu i szczegółowym opracowaniu odkrytych przez siebie krzywych stożkowych - elipsy, hiperboli i paroboli. I to właśnie jemu zawdzięczmy
uogólnienie i rozwinięcie teorii przecięć stożkowych. Odkrycia swojego dokonał przecinając powierzchnię stożkową obrotową płaszczyznami nie przechodzącymi przez jej wierzchołek i, w zależności od położenia płaszczyzny tnącej,
otrzymał elipsę (w szczególności okrąg), hiperbolę lub parabolę. Niestety w
jego dorobku naukowym próżno dopatrywać się konkretnie sformułowanego
ogólnego określenia pojęcia krzywej.
Burzliwy rozwój handlu i przemysłu w epoce ’akumulacji pierwotnej’ sprzyjał szybkiemu rozwojowi techniki, co wywołało nie spotykany dotąd rozwój
przyrodoznawstwa, a w szczególności mechaniki. Rozwój ten wymagał zupełnie nowego ’narzędzia’ matematycznego, nieodzownego dla mechaniki przy
dokładnym formułowaniu jej praw. Decydujący krok, postawiony w tym kierunku, należał do Rene Descartes’a [Kartezjusza] (1596-1650), wybitnego filozofa i matematyka francuskiego. Wprowadzony przez niego układ współrzędnych, jak również metoda współrzędnych punktu, pozwoliły po raz pierwszy
na określenie pojęcia linii w bardzo ogólnej (jak na owe czasy) postaci. Definicja krzywej, podana przez Kartezjusza, była następującej treści: ’Linią
wyznaczoną przez równanie F(x,y)=0, gdzie F(x,y) jest wielomianem dwóch
zmiennych x i y, nazywa się zbiór punktów, których współrzędne spełniają
to równanie’. Fenomen tej definicji polegał przede wszystkim na tym, że
swoim zasięgiem obejmowała ona wszystki tak zwane krzywe algebraiczne,
czyli linie, których równanie dało się przedstawić w postaci F(x,y)=0, gdzie
F(x,y) reprezentowało wielomian dwóch zmiennych x i y. Jednakże już wtedy znane były krzywe, których bądz wcale nie dało się wyrazić równaniem
postaci F (x, y) = 0, gdzie funkcja F (x, y) byłaby kombinacją skończonej ilości funkcji elementarnych, bądz jeśliby nawet takie takie przedstawienie było
możliwe, w żaden sposób nie ułatwiało ono badania tej krzywej. Za przykład
takiej linii mogą posłużyć krzywe będące torami poruszającego się punktu,
a w szczególności dobrze znana Kartezjuszowi spirala Archimedesa (krzywa
2
zakreślona przez punkt poruszający się ruchem jednostajnym po, również
poruszającym się ze stałą prędkością kątową dookoła nieruchomego punktu,
promieniu). Pomimo tego, że równanie spirali Archimedesa we współrzędnych√kartezjańskich jest postaci:
tg( a1 x2 + y 2 ) − xy = 0
jednakże postać ta nie służy w żaden sposób pomocą w przypadku badania
tej krzywej, gdyż każdej wartości argumentu x odpowiada nieskończenie wiele wartości y i na odwrót.
Odkrycie Kartezjusza miało decydujące znaczenia dla całej matematyki, ponieważ, po pierwsze, pozwoliło badać przedmioty geometryczne metodami
algebry i analizy, a po drugie, pozwoliło zastosować terminologię i metody
geomtryczne w algebrze i w analizie.
Okreśenie linii jako toru poruszającego się punktu oraz sposób przedstawiania tych krzywych za pomocą równań parametrycznych stały się podstawą
nowego uogólnienia określenia pojęcia linii. Mianowicie linią zaczęto nazywać
zbiór punktów płaszczyzny, których współrzędne x i y można było przedstawić jako funkcje
x = ϕ(t), y = ψ(t)
pewnej trzeciej wielkości t, uważanej zwykle za czas, ale mogącej mieć również inny charakter, np. kąta, długości łuku itd. Jednocześnie na funkcje ϕ i ψ
zaczęto nakładać pewne ograniczenia, które stawały się tym bardziej ogólne,
im bardziej ogólne stawało się pojęcie funkcji. W ten oto sposób w drugiej
połowie XIX wieku Camille Jordan (1838-1922), jeden z najwybitniejszych
matematyków francuskich, podał następujące ogólne określenie linii:
’Linią nazywa się zbiór punktów płaszczyzny, których współrzędne są funkcjami ciągłymi parametru t
x = ϕ(t), y = ψ(t)
określonymi w przedziale 0¬t¬1’.
Jednakże wkrótce okazało się, że ’jordanowskie’ określenie linii było aż nadto
ogólne. W 1890 roku, wybitny włoski matematyk i logik, Giuseppe Peano
(1858-1932), uważany za jednego z prekursorów teorii mnogości, wykazał, że
istnieje możliwość doboru takich funkcje ϕ i ψ, określonych i jednocześnie
ciąłych na przedziale <0, 1>, aby zbiór punktów, których współrzędne spełniają równania
x = ϕ(t), y = ψ(t) dla 0 ¬ t ¬ 1
wypełnił cały kwadrat, z jego punktami wewnętrznymi i brzegowymi włącznie. Odkrycie to wywołało spore zamieszanie wśród matematyków i skłoniło
ich do zrewidowania intuicji leżących u podstaw pojęcia krzywej. Nie można
3
było bowiem w żadnym razie przyjąć, że pełny kwadrat jest krzywą.
W celu lepszego zrozuminia sposobu konstrukcji krzywej Peany przeanalizujmy najpierw przykład ciągłego odwzorowania odcinka na kwadrat.
Niech dane będą: dowolny odcinek T oraz dowolny kwadrat Q. Podzielmy
odcinek T na cztery równe części i oznaczmy odcinki częściowe literami:
T11 , T21 , T31 , T41 zgodnie z kolejnościa ich występowania na odcinku T od lewego do prawego końca. Podobnie podzielmy kwadrat Q na cztery równe
kwadraty i oznaczmy je przez: Q11 , Q12 , Q13 , Q14 .
Odcinki T11 , T21 , T31 , T41 i odpowiadające im kwadraty Q11 , Q12 , Q13 , Q14 będziemy
nazywali odcinkami i kwadratami rzędu pierwszego. Dalej podzielmy każdy z
odcinków T11 , T21 , T31 , T41 znowu na cztery równe części i oznaczmy odcinki częściowe otrzymane z podziełu odcinka T11 kolejno przez T12 , T22 , T32 , T42 . Odcinki
powstałe z podziału odcinka T21 oznaczmy kolejno przez T52 , T62 , T72 , T82 ; odcin2
2
2
ki otrzymane z podziału odcinka T31 - przez T92 , T10
, T11
, T12
; wreszcie odcinki
1
2
2
2
2
2
powstałe z odcinka T4 - przez T13 , T14 , T15 , T16 . Szesnaście odcinków T12 , ..., T16
otrzymanych w wyniku drugiego podziału odcinka T będziemy nazywali odcinkami rzędu drugiego. Podzielmy następnie każdy z czterech kwadratów
Q11 , Q12 , Q13 , Q14 na cztery rowne kwadraty. Otrzymamy szesnaście kwadratów
rzędu drugiego. Kwadraty powstałe z podziału kwadratu Q11 oznaczmy przez
Q21 , Q22 , Q23 , Q24 ; rozbicie kwadratu Q12 oznaczmy przez Q25 , Q26 , Q27 , Q28 ; kwadraty powstałe z podziału kwadratu Q13 - przez Q29 , Q210 , Q211 , Q212 ; wreszcie
kwadraty powstałe z rozbicia kwadratu Q14 - przez Q213 , Q214 , Q215 , Q216 . Przy
tym oznaczenia muszą być dobrane tak, aby kwadraty, których dolne wskaźniki różnią się o 1, miały zawsze co najmiej jeden punkt wspólny. Ponieważ
cztery kwadraty rzędu drugiego, powstałe z podziału jednego kwadratu rzędu
pierwszego, mają zawsze punkt wspólny, mianowicie środek tego kwadratu,
więc przy doborze oznaczeń zważamy tylko na to, aby miały punkt wspólny
takie dwa kwadraty jak Q24 i Q25 , Q28 i Q29 , Q212 i Q213 , tj. ostatni i pierwszy
kwadrat rzędu drugiego, otrzymane z podziału dwu sąsiednich kwdratów rzędu pierwszego.
Podzielmy teraz każdy z odcinków rzędu drugiego na cztery równe odcinki.
Otrzymamy w ten sposób 64 odcinki rzędu trzeciego oznaczmy kolejno (od
3
. Podobnie podzielmy każdy z kwadratów
lewej do prawej) przez T13 , T23 , ..., T64
rzędu drugiego na cztery równe kwadraty. Otrzymamy wówczas 64 kwadraty
rzędu trzeciego. Kwadraty te oznaczmy przez Q31 , Q32 , ..., Q364 w ten sposób,
aby Q31 , Q32 , Q33 , Q34 oznaczały kwadraty otrzymane z podziału kwadratu Q21 ;
aby Q35 , Q36 , Q37 , Q38 oznaczał kwadraty powstałe z podziału kwadratu Q22 itd.
Przy oznaczeniu kwadratów musimy również zważać na to, aby każde dwa
4
kolejne kwadraty rzędu trzeciego (których dolne wskaźniki róznią się o 1)
miały co najmniej jeden punkt wspólny. Ponieważ jednak każde otrzymane
kwadraty rzędu trzeciego, powstałe z podziału tego samego kwadratu rzędu
drugiego, mają zawsze punkt wspólny (mianowicie środek tego kwadratu),
należy więc zważać tylko na to, aby każdy kwadrat rzędu trzeciego, będącym ostatnim kwadratem otrzymanym z podziału pewnego kwadratu rzędu
drugiego, miał punkt wspólny z pierwszym kwadratem rzędu trzeciego, otrzymanym z podziału następnego kwadratu rzędu drugiego.
Opisany proces podziału odcinków i kwadratów możemy kontynuować nieograniczenie. Przy tym, wraz ze wzrostem rzedu podziału, zarówno długości
odcinków, jak i boków kwadratów, będą dążył do zera, ponieważ dla podziału rzędu n długości odcinków będą równe ( 14 )n , a długości boków kwadratów
będą równe ( 12 )n (przyjmując, że długość wyjściowego odcinka T oraz boku
kwadratu Q były równe 1). Przyporządkujmy teraz każdemu odcinkowi Tkn
rzędu n kwadrat Qnk tego samego rzędu, mający ten sam numer k, co dany
odcinek. Otrzymamy wtedy, dla każdego rzędu n odpowiedniośc wzajemnie
jednoznaczną między odcinkami, a kwadratami tego samego rzędu. Odpowiedniość ta pozwoli na zbudowanie ciągłego odwzorowania odcinka T na
kwadrat Q.
Niech t0 będzie dowolnym punktem odcinka T . Punkt ten należy do co najmniej jednego (i nie więcej niż do dwu) z odcinków rzędu pierwszego, co
najmniej do jednego odcinka rzędu drugiego, co najmniej do jednego odcinka
rzędu trzeciego itd. Weźmy kwadraty odpowiadające odcinkom zawierającym punkt t0 . Otrzymamy wówczas nieskończony ciąg kwadratów. Ponieważ
każdy kwadrat rzędu n jest zawarty w jakimś kwadracie rzędu poprzedniego
i ponieważ przy wzroście n długość boku kwadratu rzędu n dąży do zera,
więc wszystkie te kwadraty będą miały dokładnie jeden punkt wspólny m0 ,
który przyporządkujemy punktowi t0 . Wykazaliśmy zatem, że każdemu punktowi odcinka T odpowiada jeden punkt kwadratu Q. Należy teraz dowieść, że przy tej
odpowiedności, każdy punkt kwadratu Q odpowiada co najmniej jednemu
punktowi odcinka T . Niech zatem m0 będzie dowolnym punktem kwadratu
Q. Punkt ten należy co najmiej do jednego kwadratu Q1i rzędu pierwszego, co
najmniej do jednego kwadratu Q2k rzędu drugiego zawartego w kwadracie Q1i ,
co najmniej do jednego kwadratu Q3l rzędu trzeciego, zawartego w kwadracie
Q2k itd. Rozpatrzmy odcinki Ti1 , Tk2 , Tl3 itd. odpowiadające tym kwadratom.
Każdy z tych odcinków zawiera się w poprzednim, przy czym długości odcinków, wraz ze wzrostem rzędu podziału, dązą do zera. Zatem wszystkie
5
te odcinki mają tylko jeden punkt wspólny t0 . Temu punktowi t0 ocinka T
odpowiada właśnie punkt m0 kwadratu Q.
Pozostaje do wykazania ciągłóść odwzorowania odcinka T na kwadrat Q. Zatem niech t0 będzie dowolnym punktem odcinka. Wtedy (dla dowolnego n)
każdy punkt t tego odcinka, dostatecznie bliski punktowi t0 , będzie leżał wraz
z nim albo na tym samym odcinku rzędu n, albo na sąsiednim odcinku tego
samego rzędu. Wówczas punkty m0 i m kwadratu Q, odpowiadające punktom t0 i t odcinka T , będą należały albo do tego samego, albo do sąsiednich
kwadratów rzędu n. Dlatego też, jeśli weźmiemy punkt t leżący dostatecznie
blisko punktu t0 , to odpowiadające im punkty m będą znajdowały się dostatecznie blisko punktu m0 , co świadczy o ciągłości niniejszego odwzorowania.
A oto podana przez Peano konstrukcja odwzorowania ciągłego
f : I → I2
odcinka I na kwadrat I 2 :
Podzielmy kwadrat I 2 na 9 przystających kwadratów o boku długości 13 i
przekształćmy odcinek I na I 2 , odwzorowując liniowo każdy z 9 kolejnych
przystających odcinków długości 19 na przekątną kolejnego kwadratu. Otrzmamy funkcję ciągłą
f1 : I → I 2 ,
która odwzorowuje odcinek I na sumę odpowiednich przekątnych wszystkich
9 mniejszych kwadratów. Z każdym z tych 9 kwadratów możemy wykonać
to samo, co poprzednio z kwadratem I 2 . Dzielimy go mianowicie na 9 przystających kwadratów o boku długości 19 ; odpowiadający mu odcinek na I
1
dzielimy na 9 przystających odcinków długości 81
i w podobny sposób przekształcamy odcinek na przekątne kwadratów. Zmieniamy więć funkcję f1 na
każdym z 9 odcinków, zastępując ją funkcją, która odwzorowuje ów odcinek
w ten sam odpowiadający mu kwadrat, ale ma przebieg nieliniowy, podobny
do przebiegu całej funkcji f1 na I. Powstaje tą drogą funkcja ciągła
f2 : I → I 2 ,
odwzorowująca odcinek I na sumę odpowiednich przekątnych wszystkich 81
kwadratów o boku długości 19 .
Proces ten możemy kontynuować. W n-tym kroku dzieli się każdy z 9n−1 kwa1
na 9 przystających kwadratów o boku długości
dratów o boku długości 3n−1
1
;
odpowiadające
mu
odcinki
na I dzieli się na 9 przystających odcinków
3n
1
długości 9n i przekształca te odcinki na przekątne kwadratów za pomocą
funkcji, będącej zmniejszoną kopią funkcji f1 . Zmienia się więć funkcja fn−1
na każdym z 9n−1 odcinków, zastępując ją funkcją, która odwzorowuję ów
odcinek w ten sam odpowiadający mu kwadrat, ale ma przebieg nieliniowy,
6
podobny do przebiegu całej funkcji f1 na I. Tak powstaje funkcja
fn : I → I 2 ,
której wartość dla każdego argumentu t ∈ I jest punktem tego samego kwa1
dratu o boku długości 3n−1
, w jakim znajdował się punkt fn−1 (t).
Stąd wynika, że
√
2
%[fn−1 (t), fn (t)] ¬ 3n−1
dla każdego t ∈ I. Zatem ciąg nieskończony punktów
f1 (t), f2 (t), ..., fn (t), ...
spełnia warunek Couchy’ego, a ponieważ kwadrat I 2 jest przestrzenią zupełną, więc ciąg ten jest zbieżny (jednostajnie) do jakiegoś punktu kwadratu I 2 .
Za wartość funkcji Peany f w punkcie t przyjmujemy właśnie punkt
f (t) = limn→∞ fn (t).
Zdefiniowana w ten sposób funkcja jest oczywiście ciągła. Ponieważ kolejne
obrazy obcinka I przez funkcję fn , stanowiące coraz lepsze przybliżenia funkcji Peany f , są coraz gęstrze w kwadracie I 2 , zatem obraz odcinka I przez
funkcję graniczną f jest całym kwadratem I 2 .
Historia matematyki na swoich kartach zanotowała również definicję krzywej
opartej na pojęciu łuku i krzywej zamkniętej zwyczajnej. Było to określenie
następującej treści:
’Krzywa to dowolny zbiór punktów dający się rozłożyć na skończoną liczbę
łuków,z których żadne dwa nie mają innych punktów wspólnych oprócz końców’. Określenie to, chociaż obejmujące stosunkowo szeroką klasę krzywych,
nie było na tyle ogólne, aby ’uporać się’ choćby z krzywą o równaniu
y = sin 2π
dla x ∈ (0, 1]
x
z dołączonym do niej odcinkiem osi rzędnych x = 0.
Pod koniec XIX wieku niemiecki matematyk Georg Cantor (1845-1918) podał bardzo ogólne określenie krzywej płaskiej oparte na stworzonym przez
siebie pojęciu teoriomnogościowym. Mianowicie nazwał on krzywą płaską takie ’contiuum punktów płaszczyzny, że dowolnie blisko każdego jego punktu
znajduje się punkt płaszczyzny nie należący do tego continuum’. Niestety nie
każdą zdefiniowaną w ten sposób krzywą dało się zapisać za pomocą równań
parmetrycznych.
W latach dwudziestych XX wieku P.S.Uryshon sformułował obowiązującą do
dzisiaj ogólną definicję krzywej.
’Krywa, wegług Urysohna, to continuum o wymiarze 1, tj. takie continuum,
że każdy jego punkt ma dowolnie małe otoczenie, którego ograniczenie nie
zawiera żadnego continum złłożonego z więcej niż jednego punktu’.
Jest to istotne uogólnienie wcześniejszych definicji, dające się przenieść na
7
każdą przestrzeń metryczną.
Przemysław Osik
Wydział Matematyczno-Przyrodniczy
Katolicki Uniwersytet Lubelski
ul. Konstantynów 1H
20-950 Lublin
8