pod thesea
Transkrypt
pod thesea
ISSN 1733-8670 ZESZYTY NAUKOWE NR 6(78) AKADEMII MORSKIEJ W SZCZECINIE I N Ż Y N I E R I A R U C H U M O R S K I E G O 2 00 5 Magdalena Kozak Modelowanie powierzchni dna morskiego z wykorzystaniem sieci RBF Słowa kluczowe: numeryczny model terenu, sieci RBF. Numeryczny model rzeźby terenu (NMT) ma coraz większe zastosowanie zarówno przy modelowaniu powierzchni lądowych, jak i dna morskiego oraz innych akwenów. Znajduje on również zastosowanie w nawigacji do oceny bezpieczeństwa żeglugi statku, w komputerowych programach symulacji ruchu statku, czy w nawigacji porównawczej do tworzenia mapy wzorców dna. W artykule przedstawiono badania służące zmniejszeniu liczby potrzebnych danych do wizualizacji powierzchni dna morskiego z wykorzystaniem sieci neuronowych RBF. Modelling of the Sea Bottom Using RBF Networks Keywords: Digital Terrain Model, RBF networks. The Digital Terrain Model (DTM) has been used more and more often in modelling the land or the bottom of the sea and other water systems. It has been adopted in navigation to estimate the safety, in computer vessel traffic simulating programms and in comparative navigation to create the patterns of the bottom of the sea. This article presents the research in reducing the amount of data that is necessary for the visualisation of the bottom of the sea with the use of RBF networks. Magdalena Kozak Wstęp Numeryczny model rzeźby terenu (Digital Terrain Model) ma coraz szersze zastosowanie zarówno do modelowania powierzchni lądowych, jak i dna morskiego oraz innych akwenów. Znajduje on zastosowanie w nawigacji do oceny bezpieczeństwa żeglugi statku, w komputerowych programach symulacji ruchu statku, czy w nawigacji porównawczej do tworzenia mapy wzorców dna. Wraz z coraz większym zainteresowaniem rosną również wymagania stawiane numerycznemu modelowi rzeźby terenu. Bardzo ważna jest jakość danych (aktualność, dokładność, wiarygodność), jak i możliwość analiz w czasie rzeczywistym. Dlatego też dąży się do ograniczenia danych potrzebnych do modelowania powierzchni terenu, przy jednoczesnym zachowaniu maksymalnej dokładności. Tradycyjne metody budowy numerycznego modelu rzeźby terenu opierają się najczęściej na siatce punktów węzłowych, w których następuje interpolacja za pomocą wybranego algorytmu interpolacyjnego. Problemem, z jakim mamy do czynienia stosując numeryczne metody, jest rozmiar siatek punktów węzłowych, który uniemożliwia wykorzystanie takiego modelu w czasie rzeczywistym oraz czasochłonność (w przypadku metod globalnych). Poszukując rozwiązania powyższych problemów do budowy numerycznego modelu rzeźby terenu zaczęto stosować sztuczne sieci neuronowe. Badania nad wykorzystaniem sieci neuronowych do modelowania powierzchni dna morskiego przedstawiono w publikacjach [1, 2, 3]. Badano zastosowanie perceptronu wielowarstwowego (MLP), sieci uogólnionej regresji (GRNN) i sieci o radialnych funkcjach bazowych (RBF). Sieci te były analizowane i optymalizowane pod kątem jak najdokładniejszego rozwiązania. W pracy [4] zaproponowano podział rozpatrywanej powierzchni na pokrywające się częściowo subdomeny, z wykorzystaniem sieci samoorganizujących się (SOM) i trenowanie sieci aproksymujących oddzielnie dla każdej z subdomen. Model ten dedykowany został rozległym powierzchniom dna morskiego. Stosując do wizualizacji powierzchni dna morskiego lub innych akwenów sieci RBF, należy poddać je procesowi trenowania. Proces ten możemy podzielić na dwa etapy. W pierwszym ustalana jest liczba neuronów w warstwie ukrytej, rodzaj funkcji radialnej, parametry kształtu funkcji radialnych oraz rozmieszczenie centrów, w drugim natomiast poszukiwane są wagi połączeń pomiędzy neuronami. Ważnym problemem w procesie trenowania sieci RBF jest odpowiednia liczba neuronów radialnych. Jeżeli liczba ta będzie zbyt duża, wówczas sieć nadmiernie dopasuje się do szumów oraz błędów w danych, w wyniku czego będzie miała słabe zdolności uogólniania. Jeśli natomiast liczba ta będzie zbyt mała, wówczas możemy nigdy nie osiągnąć satysfakcjonującego błędu. W praktyce dąży się do tworzenia jak najmniejszych sieci, ponieważ szybko się one uczą a także zajmują mniejszą część przestrzeni dyskowej. W artykule przedstawiono przyrostowy proces dobierania liczby neuronów radialnych w zależności od założonego błędu. Centra dobierane są sekwencyjnie, co zapewnia dobre 236 Modelowanie powierzchni dna morskiego z wykorzystaniem … zdolności uogólniania sieci oraz zmniejszenie liczby potrzebnych danych do modelowania powierzchni dna morskiego. Badania przeprowadzono dla wygenerowanych powierzchni testowych. 1. Sieci neuronowe o radialnych funkcjach bazowych (RBF) Sieci neuronowe o radialnych funkcjach bazowych składają się z warstwy wejściowej, jednej warstwy ukrytej z neuronami radialnymi i warstwy wyjściowej (rys. 1). Rola neuronów radialnych polega na odwzorowaniu radialnym przestrzeni wokół jednego punktu zadanego lub grupy takich punktów zwanych klasterem. Sieć typu radialnego z jednym wyjściem realizuje funkcję: M x ck y F ( x ) wk sk k 1 (1.1) gdzie: x ck k s , k = 1,2,...M jest funkcją radialną, wk odpowiednio dobrane wagi, ck centra funkcji radialnych, sk parametr kształtu. Rys. 1. Schemat sieci RBF Sieci RBF znajdują zastosowanie w wielu dziedzinach, ze względu na swoje właściwości [5]: są one uniwersalnym aproksymatorem; ich prosta struktura pozwala na wykorzystanie liniowych algorytmów optymalizacyjnych; 237 Magdalena Kozak optymalnym rozwiązaniem jest pojedyncze, globalne minimum; w sieci RBF jest zazwyczaj mniej połączeń niż w przypadku perceptrona (MLP), dzięki czemu trenowanie sieci trwa krócej. Proces trenowania sieci RBF możemy podzielić na dwa etapy: 1) w pierwszym etapie należy określić liczbę funkcji bazowych M, rodzaj funkcji radialnej (np. Gaussa, Hardy’ego, wielomianową, itd.), ich parametry kształtu sk oraz zlokalizować centra funkcji radialnych ck. Odpowiedni dobór różnych parametrów kształtu dla różnych funkcji może poprawić działanie sieci, jednak wystarczy jednakowa wartość tego parametru dla wszystkich funkcji, aby sieć RBF była uniwersalnym aproksymatorem [6], a to znacznie ułatwia proces uczenia. Istnieją różne algorytmy rozmieszczenia centrów (k-uśrednień, gazu neuronowego, Kohonena), ciekawe podejście przedstawiono w publikacji [7], gdzie zaprezentowano algorytm OLS. W metodzie tej centra wybierane są pojedynczo, aż do momentu uzyskania właściwej sieci, a każde z nich maksymalizuje dodatnią energię związaną z pożądanym wyjściem, rozwinięciem tej metody jest algorytm ROLS [8]; 2) w drugim etapie trenowania sieci, mając pary wejście – wyjście {xi,yi}, i = 1,2,...P szukamy M (M < P) wag wk, które minimalizują błąd: P e( w ) [ yi yi* ( xi )] 2 (1.2) i 1 gdzie: yi – oczekiwana wartość wyjścia, yi* – wartość otrzymana na wyjściu sieci. Wagi, które minimalizują błąd (2.2) możemy uzyskać dzięki metodzie dekompozycji SVD, pseudoinwersji, procedurze ortogonalnej zaprezentowanej w pracy [5], czy procedurze ortogonalnej Grama-Schmidta [9]. Wykorzystując sieci RBF do modelowania powierzchni dna morskiego oraz innego akwenu należy taką sieć wytrenować. Ważną decyzją, jaką podejmujemy w trakcie trenowania sieci jest liczba neuronów radialnych. Z praktycznego punktu widzenia pożądane jest projektowanie małych sieci, ponieważ szybciej się one uczą i zajmują mniej miejsca na przestrzeni dyskowej. Jeżeli liczba neuronów radialnych będzie zbyt duża, wówczas sieć dopasuje się do różnego rodzaju szumów lub nieregularności występujących w danych uczących, w rezultacie czego nie będzie ona posiadała zdolności uogólniania. Małe sieci lepiej generalizują, jednak gdy zastosujemy zbyt małą liczbę neuronów radialnych nigdy nie uzyskamy satysfakcjonującego błędu. 238 Modelowanie powierzchni dna morskiego z wykorzystaniem … Rozwiązaniem problemu doboru liczby neuronów radialnych jest zastosowanie odpowiedniej sieci, która zapewni nam wymaganą dokładność modelowanej powierzchni, przy jak najmniejszej liczbie neuronów. Chcąc uzyskać taką sieć, musimy potraktować problem doboru liczby neuronów radialnych w sposób przyrostowy, rozpocząć proces uczenia od minimalnej liczby neuronów i dodając kolejne neurony kontrolować błąd, jaki uzyskamy na wyjściu sieci. Przyrostową aproksymację funkcji za pomocą sieci neuronowych przedstawiono w pracy [10]. Zaproponowana metoda pozwala na dynamiczne dobieranie liczby neuronów radialnych w trakcie procesu aproksymacji. W każdej iteracji wyznaczane są parametry tylko dla jednego neuronu radialnego. Inne podejście przedstawiono w artykule [5], w którym opisano procedurę obliczania wag prostszą i stabilniejszą od ortogonalizacji Grama-Schmidta. Pozwala ona na sekwencyjny przyrost centrów sieci aż do momentu uzyskania satysfakcjonującego błędu. Algorytm ten ze względu na ortogonalizację nie wymaga powtórnego przeliczania wag. W artykule zbadano przyrostową metodę uczenia sieci RBF pod kątem minimalizacji danych potrzebnych do wizualizacji powierzchni dna morskiego. Badania przeprowadzono dla trzech powierzchni testowych z nieregularnym rozkładem punktów pomiarowych: powierzchnia 1, powierzchnia 2, powierzchnia 3. powierzchnia 1 powierzchnia 2 powierzchnia 3 Rys. 2. Powierzchnie testowe Procedura rozpoczyna się od minimalnej liczby neuronów radialnych (pięć), centra wybierane są w sposób losowy z ciągu uczącego, następnie rozmieszczane są z pomocą wybranego algorytmu (k-uśrednień, Kohonena, gazu neuronowego). Po rozmieszczeniu centrów obliczane są wagi połączeń pomiędzy neuronami za pomocą ortogonalizacji Grama-Schmidta. Proces ten powtarzany jest sekwencyjnie aż do momentu uzyskania satysfakcjonującego błędu. Przebadana metoda umożliwia dynamiczny dobór centrów w zależności od założonego błędu. Z badań wynika, że liczba centrów potrzebnych do uzyskania danego błędu uzależniona jest również od badanej powierzchni. W przypadku powierzchni nr 1 wystarczy mniejsza liczba neuronów w celu uzyskania założonego błędu, niż w przypadku pozostałych powierzchni. Z tego względu dynamiczne dobieranie liczby centrów jest tym bardziej zalecane. Dzięki aproksymacji przyrostowej uzyskamy w rezultacie sieć o wystarczającej liczbie neuronów 239 Magdalena Kozak radialnych z dobrymi możliwościami uogólniania. Dodatkowo sieć taka będzie mniejszych rozmiarów, co zaoszczędzi nam miejsce przestrzeni dyskowej i ograniczy liczbę danych wykorzystywanych w procesie wizualizacji. 0,90 0,80 0,70 Błąd 0,60 0,50 0,40 0,30 0,20 0,10 0,00 1 6 11 16 21 26 Liczba neuronów Powierzchnia 1 Powierzchnia 2 Powierzchnia 3 Rys. 3. Badania pod kątem liczby neuronów radialnych Podsumowanie W artykule przedstawiono zastosowanie sieci RBF do celów modelowania powierzchni dna morskiego. Zbadano dynamiczny proces doboru liczby neuronów radialnych w zależności od zadanego błędu. Badania przeprowadzono na powierzchniach testowych. Uzyskane w wyniku badań sieci RBF charakteryzują się dobrymi zdolnościami uogólniania, pozwalają na zmniejszenie liczby potrzebnych danych do modelowania powierzchni i późniejszej wizualizacji. Literatura 1. 2. 3. 240 Balicki J., Kitowski Z., Stateczny A., Artificial Neural Networks for Modelling of Spatial Shape of Sea Bottom. IV Conference of Neural Networks and Their Applications, Zakopane 1999. Łubczonek J., Stateczny A., Concept of neural model of the sea bottom surface. 6th International Conference Neural Networks and Soft Computing, Zakopane 2002. Stateczny A., Praczyk T., Neuronowa metoda modelowania kształtu dna morskiego. X Konferencja Naukowo-Techniczna Systemy Informacji Przestrzennej, Warszawa 2000. Modelowanie powierzchni dna morskiego z wykorzystaniem … 4. Stateczny A., The neural method of sea bottom shape modelling for spatial maritime information system. WIT Press Southampton, Boston 2000. 5. Strumiłło P., Kamiński W., Orthogonalisation Procedure for Training Radial Basis Functions Neural Networks. Technical Sciences, Polish Academy of Science, Warszawa 2001. 6. Chen, S., Wu Y., Luk, B. L., Combined genetic algorithm optimization and regularized orthogonal least squares learning for radial basis function networks. IEEE Transactions on Neural Networks 10(5),pp. 1239-1243, 1999. 7. Chen S., Cowan C. F. N., Grant, P. M., Orthogonal least squares learning algorithm for radial basis function networks. IEEE Transactions on Neural Networks 2(2), pp. 302-309, 1991. 8. Chen S., Chng E.S., Alkadhimi K., Regularized orthogonal least squares algorithm for constructing radial basis function networks. International Journal of Control 64(5), pp. 829-837, 1996. 9. Ossowski S., Sieci neuronowe w ujęciu algorytmicznym. Wydawnictwo Naukowo- Techniczne, Warszawa 1996. 10. Beliczyński B., Przyrostowa aproksymacja funkcji za pomocą sieci neuronowych. Politechnika Warszawska, Elektryka, Warszawa 2000. Recenzenci dr hab. inż. kpt. ż.w. Adam Weintrit, prof. AM w Gdyni prof. dr hab. inż. Andrzej Stateczny Adres Autorki mgr inż. Magdalena Kozak Politechnika Szczecińska Wydział Informatyki ul. Żołnierska 49 71-210 Szczecin [email protected] 241