FULL TEXT - Antropomotoryka
Transkrypt
FULL TEXT - Antropomotoryka
NR 37 AN T RO P O M O T O R Y K A 2007 ANALIZA MODELU BUDOWY RUCHÓW MOSAIC ANALYSIS OF THE MOSAIC MODEL OF HUMAN MOVEMENT CONSTRUCTION Wacław Petryński* * dr, Katedra Turystyki, Górnośląska Wyższa Szkoła Handlowa, Katowice, ul. Harcerzy Września 3 Słowa kluczowe: sterowanie ruchami, uczenie się ruchów, model prosty, model odwrotny, model MOSAIC Key words: motor control, motor learning, forward model, inverse model, MOSAIC model STRESZCZENIE • SUMMARY There have been presented some doubts associated with theories of motor control and learning by Wolpert, Kawato and Haruno (MOSAIC model). The most important ones arise from the fact that the authors of the MOSAIC model have described the relations between the functions and variables, but not between real situations. Such an approach would have been justified if the mathematical description would represent true real situations. Unfortunately, there is no basis to accept such an assumption; on the contrary, each model (including MOSAIC) involves some simplifications, which make impossible a true projection of the phenomena and processes being modelled into the sphere of mathematical formalism. So, there has been suggested another grouping of the variables to make the whole model more understandable. The modified pattern includes three feedback loops, not existing in the original MOSAIC model. Particular loops can be matched against three basic patterns of sensorimotor reactions: reflex, skill, and voluntary response. In this context the notion of “central pattern generator” has been presented and the inconsistencies in its description pointed out. There has been also presented a general pattern of data processing during motor control and proved its consistence with both the original MOSAIC model and its modified version as suggested in the paper. - - - - - W pracy zebrano wątpliwości, jakie wzbudza model MOSAIC. Przedstawiono zastrzeżenia opisane już w literaturze naukowej oraz wynikające z własnych analiz. Najważniejsze zastrzeżenie wynika z faktu, że autorzy modelu MOSAIC badają raczej zależności między funkcjami i zmiennymi, a nie między zjawiskami rzeczywistymi. Takie ujęcie byłoby uzasadnione w sytuacji, gdyby opis matematyczny dokładnie odzwierciedlał sytuacje rzeczywiste. Nie tylko nie mamy jednak dostatecznych podstaw do przyjęcia takiego założenia, ale przeciwnie – trzeba uwzględnić, że model (a MOSAIC jest takim właśnie odwzorowaniem) jest zawsze pewnym uproszczeniem, nie może więc dokładnie odwzorowywać przedstawianych zjawisk i procesów. Niemniej zaproponowano nieco inne pogrupowanie zmiennych wejściowych i wyjściowych, co uczyniłoby model bardziej przejrzystym. W zmodyfikowanym wzorcu umieszczono również trzy pętle sprzężenia zwrotnego, których nie ma w oryginalnym modelu MOSAIC, a które wiążą dane wyjściowe z wejściowymi oraz przedstawiają ich przekształcenia. Poszczególne pętle można kojarzyć z trzema podstawowymi wzorcami odpowiedzi czuciowo-ruchowych: odruchem, nawykiem i odpowiedzią dowolną. W tym kontekście omówiono również opisywane w literaturze anglosaskiej pojęcie „ośrodkowego generatora wzorców” wskazując na niespójności w jego opisie. Przedstawiono też ogólny schemat przetwarzania informacji w trakcie sterowania ruchami i uczenia się ich oraz wykazano, że jest spójny z zarówno z modelem MOSAIC, jak i jego zmodyfikowaną wersją przedstawioną w niniejszej pracy. – 143 – Wacław Petryński Wstęp - - - - - Teorie Michaela I. Jordana i Davida E. Rumelharta oraz Daniela M. Wolperta i Mitsuo Kawato, uzupełnione później przez Masahiko Haruno [1, 2, 3] wydają się obecnie najbardziej dojrzałymi wzorcami typu cybernetycznego. Niemniej ich bliższa analiza nasuwa następujące wątpliwości, które sformułował Chris Miall [4]. 1. W jakim zakresie wystarczy jedynie dostosowanie już istniejącego modułu, a kiedy zmiany w warunkach zewnętrznych są tak wielkie, by konieczne było stworzenie nowego modułu? 2. W jaki sposób ośrodkowy układ nerwowy przypisuje moduł do danej sytuacji? Czy do każdej sytuacji tworzone są nowe moduły, czy też już istniejące są wykorzystywane do rozwiązania bieżącego zadania ruchowego? W istocie jest to pytanie o liczbę modułów, jakie mogą być przechowywane w pamięci. 3. W jakim zakresie można łączyć moduły? Jeżeli istnieje model ramienia i model jakiegoś przedmiotu, to w jaki sposób można połączyć te modele, by odwzorować proces podnoszenia tego przedmiotu ramieniem? Matematycznie łatwiej łączyć modele proste niż odwrotne, ale obie te operacje trzeba wykonać, by stworzyć schemat działania. 4. Model MOSAIC nie uwzględnia opóźnień wynikających z pracy poszczególnych jego składników oraz pętli sprzężenia zwrotnego, co jest zjawiskiem bardzo ważnym w ustrojach biologicznych. W modelu wewnętrzne przewidywania, wytwarzane przez modele proste, są porównywane z reaferencją z wyprzedzeniem jednego kroku obliczeniowego, jednakże w sytuacji rzeczywistej opóźnienie fizjologiczne może stanowić źródło błędu. Ustroje żywe potrafią się przystosować do takiej sytuacji; nie wiadomo, czy istnieje taka możliwość w przypadku modelu MOSAIC. Te pytania i zastrzeżenia pozostają na razie bez odpowiedzi, ale można odnieść się do pytania 2. W tym przypadku odpowiedź wydaje się dość oczywista: wykorzystywanie już istniejących modułów do rozwiązywania nowych zadań stanowi istotę procesu przenoszenia (transferu), a zarazem obniża liczbę przechowywanych w pamięci i wykorzystywanych modułów niezbędnych do skutecznego działania w danym środowisku. Pytanie to zawiera też pewien ważny skrót myślowy. Według powszechnie wykorzystywanego wzorca budowy pamięci, krótkotrwała pamięć czuciowa (STSS) oraz pamięć długotrwała (LTM) mają teoretycznie nieograniczoną pojemność [5]. Natomiast kluczowe dla przetwarzania informacji: pamięć krótkotrwała (STM) oraz pamięć operacyjna (WM) mają ograniczoną pojemność; pierwsza może równocześnie pomieścić 7±2 porcje informacji (chunks) [6], druga – około 10 [7]. W pytaniu Chrisa Mialla chodzi zatem w istocie nie o to, ile modułów może przechować pamięć długotrwała – bo tam teoretycznie ograniczeń nie ma – ale ile modułów może być równocześnie aktywnych w pamięci operacyjnej w trakcie sterowania czynnością ruchową. Ponadto można wymienić jeszcze inne zastrzeżenia. 1. Analizując model MOSAIC trudno się oprzeć wrażeniu, że jego twórcy dali się ponieść inżynierskiemu sposobowi myślenia. Poszczególnym zjawiskom przypisali symbole matematyczne, poszczególnym procesom – funkcje, po czym zaczęli badać zachowanie się owych symboli i funkcji w przestrzeni formalizmu matematycznego, a nie – zjawiska i procesy w świecie rzeczywistym. Takie postępowanie byłoby w pełni uzasadnione przy założeniu, że formalizm matematyczny dokładnie odwzorowuje to, co dzieje się w świecie rzeczywistym. Niestety, nie mamy podstaw by bez zastrzeżeń przyjąć takie założenie. W rezultacie ów formalizm zaczął niejako żyć własnym życiem i mnożyć byty, niektóre – jak się wydaje – bynajmniej niekonieczne. Gąszcz oznaczeń uczynił więc model nieprzejrzystym i trudno zrozumiałym, co znacznie obniżyło jego praktyczną przydatność w nauce. Należałoby zatem zastosować proponowaną przez Nikołaja Bernsztejna (a wcześniej przez Williama Ockhama) procedurę obniżenia liczby stopni swobody, czyli usunięcia „bytów niekoniecznych”. 2. W modelu MOSAIC wejście informacji do poszczególnych modułów następuje poprzez model prosty, model odwrotny lub przewidywacz odpowiedzialności. Niekonsekwencją jest wejście między modelem prostym a modelem wiarogodności. Niejasna jest struktura funkcjonalna i czasowa umożliwiająca taki proces. Nie ulega wątpliwości, że jakiekolwiek informacje docierające do którejkolwiek części modułu muszą zostać postrzeżone, czyli odebrane i rozpoznane. Proces postrzegania ma zatem miejsce w modelu prostym, modelu odwrotnym i przewidywaczu odpowiedzialności. Z opisu wynika, że działanie całego modułu odbywa się w kolejnych cyklach postrzeganie-działanie. – 144 – Analiza modelu budowy ruchów MOSAIC - - - - - Czy zatem w trakcie takiego pojedynczego cyklu możliwe jest wprowadzanie informacji inną drogą? W jaki sposób informacja ta byłaby postrzegana? Jaka miałaby być struktura czasowa związanych z tym procesów? Według modelu MOSAIC do modułu musiałyby być wprowadzane w trakcie jego działania informacje, które powstają dopiero po zakończeniu tego działania. 3. Z wykresu nie wynika, skąd się biorą dane wejściowe określone mianem „kopia eferentna”, „sygnał środowiskowy” i „stan pożądany”. 4. Wydaje się, że model MOSAIC zawiera pewien poważny skrót myślowy. Gdyby daną wejściową do modelu prostego miałaby być faktycznie kopia eferentna, to musiałby to być niezwykle rozbudowany układ przetwarzania informacji, co byłoby sprzeczne z podstawowym założeniem modelu, czyli zbudowaniem prostego opisu sterowania ruchami i uczenia się ich [2]. Sama kopia eferentna nie jest bowiem przydatna do oceny skutków, jakie działanie własne ustroju sterującego ruchem wywiera na układ odbieranych bodźców. Taką użyteczną informację stanowi dopiero reaferencja. W takim układzie cząstkowy z definicji model prosty musiałby na podstawie kopii eferentnej (cząstkowej? całkowitej?) wytworzyć najpierw odpowiednią reaferencję (cząstkową? całkowitą?) i dopiero później dokonać jej przetworzenia. 5. Ważną podstawą budowy modelu MOSAIC jest jego modułowość. Jednakże autorzy stosują tę zasadę niekonsekwentnie, odnosząc ją jedynie do budowy modelu, nie zaś do jego działania (uwaga ta wiąże się z zastrzeżeniem wymienionym w punkcie 2). W tym drugim przypadku modułowość oznacza w istocie cykliczność, a jak trafnie zauważył Arturo Hot: „Czas jest wynalazkiem człowieka, wynikłym z potrzeby lepszej orientacji w zdarzeniach. Natura oferuje nam bowiem jedynie rytmy. Okresowe powroty Słońca i Księżyca, bicie własnego serca – oba te zjawiska pozwalają nam postrzegać i przeżywać postęp tzw. czasu” [8, s. 181]. Model prosty i odwrotny według Jordana i Rumelharta Celowe jest więc podjęcie próby uproszczenia modelu, aby stał się bardziej przystępny i dzięki temu mógł skuteczniej przyczynić się do rozwoju nauki. Już Jordan i Rumelhart wyróżnili trzy rodzaje stanów: środowiska (x), odczuć (u) i podniet ruchowych (y). Podzielili je na bieżące, nie mające żadnego dodatkowego oznaczenia (x, u, y), przewidywane (oczekiwane), oznaczone daszkiem (x̂, û, ŷ) oraz pożądane (idealne), oznaczone gwiazdką (x*, u*, y*). Należy zauważyć, że idealny stan pożądany nie jest czynnikiem różniącym się jakościowo od stanu przewidywanego, lecz jedynie szczególnym, skrajnym przypadkiem stanu oczekiwanego. Można by uznać, że stan bieżący określa poziom wyjściowy ustalonej wielkości, stan przewidywany – poziom, na jakim wykonujący postrzega swoje możliwości, zaś stan pożądany – idealny wzorzec tejże wielkości. W przypadku konkretnej czynności bieżącym czynnikiem „napędzającym” proces doskonalenia jest sygnał błędu, odpowiadający różnicy między stanem bieżącym a przewidywanym. Kiedy osiągnie się zgodność tych dwóch stanów, wówczas stan przewidywany przesuwa się dalej w kierunku stanu idealnego pożądanego. Niemniej idealny stan pożądany nie pełni żadnej bieżącej funkcji sterującej procesem uczenia się, gdyż, co należy jeszcze raz podkreślić, „potencjał doskonalenia” danej czynności określa różnica między stanem bieżącym a stanem przewidywanym, czyli oczekiwanym w danej chwili jako skutek właśnie wykonywanej czynności. Kiedy stan bieżący, przewidywany i pożądany pokryją się, osiąga się rutynę, czyli sytuację, w której kolejne powtórzenia danej czynności nie powodują jej doskonalenia. Znika różnica między stanem bieżącym a stanem pożądanym, określana zwykle jako błąd, będący w istocie impulsem „napędzającym” wszelkie przemiany. W takiej sytuacji ustaje wszelki rozwój, a wraz z nim postęp. Takie postrzeganie omawianego modelu pozwala też inaczej spojrzeć na potęgowe prawo powtarzania [5, 9]. Można założyć, że o szybkości przyswajania jakiejś umiejętności decyduje nie liczba powtórzeń, lecz rozbieżność między stanem bieżącym a stanem przewidywanym, czyli błąd wykonania. Haruno, Wolpert i Kawato piszą: Odpowiedzialności są wykorzystywane do określania wag danych wyjściowych z modeli odwrotnych w celu obliczenia ostatecznej podniety ruchowej ut i sterowania uczeniem się zarówno modelu prostego, jak i odwrotnego, przy czym proporcjonalnie większą odpowiedzialność mają te modele, które odbierają większy sygnał błędu (podkreślenie moje – WP) [3]. Początkowo, w trakcie pierwszych prób wykonania określonej czynności, ów błąd ma znaczną wartość, stanowi więc silny czynnik „napędzający” doskonalenie czynności. W miarę nabywania wprawy błąd staje się coraz mniejszy, proporcjonalnie maleje więc jego wpływ na szybkość doskonalenia czynności. Wreszcie, kiedy stan bieżący, – 145 – Wacław Petryński przewidywany i oczekiwany pokryją się, zostaje osiągnięta rutyna, czyli sytuacja, w której kolejne powtórzenia danej czynności nie powodują jej doskonalenia. Podsumowując, z analiz procesu doskonalenia czynności można usunąć stan pożądany (idealny), gdyż nie stanowi on czynnika bezpośrednio wpływającego na proces doskonalenia czynności, a ponadto jakościowo jest w istocie tożsamy ze stanem przewidywanym. Jordan i Rumelhart wprowadzili trzy zmienne: stan środowiska x, odczucia y i działania (podniety ruchowe) u. Analizując postrzeganie rzeczywistości przez człowieka należy zauważyć, że może on ją postrzegać jedynie za pośrednictwem zmysłów. Określonemu stanowi środowiska x i można więc przypisać odpowiadający mu układ odczuć y i. Z modeli teoretycznych sterowania ruchem przez człowieka, czyli procesów przebiegających w świadomości tego człowieka, nie zaś w obiektywnej rzeczywistości, można więc usunąć zmienną „stan środowiska” i zastąpić ją układem odczuć zmysłowych. W takiej sytuacji liczba analizowanych wielkości maleje do dwóch: odczuć y i i działań ui. Podsumowując, liczbę dziewięciu zmiennych wykorzystywanych w modelu Jordana i Rumelharta (x, u, y; x̂, û, ŷ; x*, u*, y*) w modelu MOSAIC można z powodzeniem obniżyć do czterech (y, u; ŷ, û). - - - - - Uwagi o modelu MOSAIC Wzorzec opracowany przez Haruno, Wolperta i Kawato (por. ryc.7 w artykule „Model budowy ruchów MOSAIC”) zawiera kilka istotnych uproszczeń. Przypomnijmy, że – zgodnie z definicją Jordana i Rumelharta – model prosty przekształca stan bieżący środowiska i uprzednie działanie (ściślej – reaferencję) w układ odczuć przewidywanych. Natomiast na omawianym schemacie zaznaczone jest jedynie uprzednie działanie (w postaci kopii eferentnej podniety ruchowej, powodującej wytworzenie reaferencji). Model odwrotny ma przekształcać stan bieżący środowiska i stan przewidywany w działanie, czyli określoną podnietę ruchową, ale na schemacie modelu MOSAIC zaznaczony jest jedynie stan przewidywany. Ze schematu nie wynika też, skąd się biorą wielkości oznaczone blokami po prawej stronie ryciny: stan przewidywany, sygnał środowiskowy oraz kopia eferentna podniety ruchowej (a tym bardziej – reaferencji). Wątpliwości budzi też usytuowanie bloku „model wiarogodności”. Przede wszystkim wszelkie dane wejściowe do modułu są wprowadzane przez „układy postrzeżeniowo-przekształcające” – model prosty, model odwrotny i przewidywacz odpowiedzialności. Jedynie informacja określona jako „stan następny” wchodzi do modułu bezpośrednio; nie wiadomo, jakie informacje i jakim kodem opisane wprowadza do modułu i jak oddziałuje na jego pracę. Z samego wykresu wynikałoby bowiem, że tą drogą wnika do modułu... „przedmiot sterowania”! Model MOSAIC nie wyjaśnia też pewnego bardzo ważnego problemu: W jakim kodzie są opisane informacje tworzone przez system, przekazywane do niego i odbierane przezeń? Informacja docierająca do modelu prostego, odwrotnego i przewidywacza odpowiedzialności musi być bowiem wyrażona w takim kodzie, który jest zrozumiały dla tych bloków. Modyfikacja modelu MOSAIC Proponowany poniżej wzorzec (ryc. 1.) usuwa wymienione niedociągnięcia. Przede wszystkim zakłada rozszerzenie zasady modularności również na czas, a nie jedynie na funkcję. Oznacza to, że cykl działania modułu uznalibyśmy za niepodzielną jednostkę działania, tzn. od chwili wprowadzenia danych do momentu przekazania do systemu przetworzonych informacji i działań nie można byłoby wpływać z zewnątrz na pracę modułu; pojedynczy cykl pracy modułu przypomina więc sekwencję sensomotoryczną opisaną przez Dietricha Ungerera [10] oraz rozmaitość niekontrolowaną (uncontrolled manifold, UCM) według Johna P. Scholza i Gregora Schönera [11] Skądinąd takie ujęcie wykluczałoby możliwość wprowadzania danych do modułu inną drogą niż przez model prosty, model odwrotny i przewidywacz odpowiedzialności, gdyż w trakcie pracy modułu nie byłyby podejmowane żadne decyzje o przebiegu czynności, lecz jedynie realizowany określony fragment programu czy wzorca ruchów. Kolejne cykle byłyby połączone pętlami sprzężeń zwrotnych. Składnikami proponowanego modelu są trzy grupy zmiennych: 1) dane wejściowe, oznaczone symbolem y, 2) dane wyjściowe, oznaczone symbolem x, 3) kolejne cykle przekształceń, oznaczone indeksami: t – 1 – odnoszący się do cyklu minionego, t – odnoszący się do cyklu bieżącego oraz t + 1 – odnoszący się do cyklu przyszłego. Dane wejściowe – to reaferencja y t-1, bieżące doznania zmysłowe określające aktualny stan środowiska y t oraz przewidywane doznania zmysłowe – 146 – – 147 – - przewidywane doznania zmysłowe yt+1 źródło: pamięć pojęciowa bieŜące podniety czuciowe yt źródło: narządy zmysłów reaferencja yt-1 źródło: pamięć czuciowa - przekształcenie xwt → yt-1 długotrwała pamięć czuciowa przekształcenie xpt → yt+1 długotrwała pamięć pojęciowa przewidywane 2 model prosty odczucia przewidywane 1 model prosty odczucia przewidywane regulacja stopnia modelprzewidywacz prosty odczucia oddziaływania odpowiedzialności regulacja stopnia przewidywacz oddziaływania odpowiedzialności regulacja stopnia przewidywacz planowana podnieta oddziaływania odpowiedzialności model odwrotny ruchowa planowana podnieta model odwrotny ruchowa planowana podnieta model odwrotny ruchowa przekształcenie xst → yt narządy zmysłów n normalizator Σ ostateczna podnieta ruchowa system sterowany skutki działania pamięci operacyjnej (WM). Ryc. 1. Schemat modułowego sterowania ruchami wg modyfikacji PETRYŃSKIEGO; obszar ograniczony grubą linią przerywaną odpowiada wprowadzanie informacji do sysytemu; dane typu y - tworzenie wyników przez sysytem; dane typu x Ryc. 1. Schemat modułowego sterowania ruchami wg modyfikacji Petryńskiego; obszar ograniczony grubą linią przerywaną odpowiada pamięci operacyjnej (WM) - kopia eferentna xwt stan środowiaka xst postrzeganie pojęciowe xpt - Analiza modelu budowy ruchów MOSAIC – 148 – - Predicted sensory sensations yt+1 Source: verbal memory Current motor commands yt Source: sensory receptors Reafference yt-1 Source: sensory memory - Inverse model model odwrotny Forward model przewidywacz odpowiedzialności przewidywacz odpowiedzialności Responsibility predictor model odwrotny model prosty model prosty Transformation xst → yt Sensory receptors Transformation xpt → yt+1 Long-term verbal memory przewidywane 2 odczucia przewidywane 1 odczucia Predicted regulacja stopnia sensations oddziaływania regulacja stopnia oddziaływania Responsibility planowana podnieta regulation ruchowa planowana podnieta ruchowa Planned motor command Transformation xwt → yt-1 Long-term sensory memory n Normalization Σ Final motor command Controlled system Action results memory. Fig. 1. The pattern of a modular movement control modified by PETRYŃSKI. The region bordered by thick broken line represents the working Information input to a system Data of y-type - Creation of results by a sysytem Data of x-type Fig. 1. The pattern of a modular movement control modified by Petryński. The region bordered by thick broken line represents the working memory - Efference copy xwt Environment state xst Verbal perception xpt - Wacław Petryński Analiza modelu budowy ruchów MOSAIC - - - - - y t+1. Dane wyjściowe – to kopia eferentna x wt, układ bodźców określający stan środowiska x st oraz postrzeganie pojęciowe x pt; wszystkie one odnoszą się do stanu bieżącego, oznaczone są więc indeksem „t”. Poszczególne pary danych wyjściowych oraz danych wejściowych połączone są pętlami sprzężeń zwrotnych: 1) kopia eferentna x wt, po przekształceniu w długotrwałej pamięci czuciowej w reaferencję y t-1 – z wejściem do modelu prostego i przewidywacza odpowiedzialności, tę pętlę można powiązać ze schematem, będącym wzorcem nawyku czuciowo-ruchowego, 2) stan bieżący środowiska x st, po przekształceniu w narządach zmysłów w bieżące podniety czuciowe y t – z wejściem do modelu prostego i modelu odwrotnego; tę pętlę można powiązać ze stereotypem, będącym podstawą odruchu, 3) postrzeganie pojęciowe x pt, po przekształceniu w długotrwałej pamięci pojęciowej w przewidywane doznania zmysłowe y t+1 – z wejściem do modelu odwrotnego i przewidywacza odpowiedzialności; tę pętlę można powiązać z uogólnionym programem ruchowym, będącym podstawą dowolnej odpowiedzi czuciowo-ruchowej. Na szczególną uwagę zasługuje węzeł oznaczony symbolem Σ. Docierają do niego informacje dwojakiego rodzaju: podnieta ruchowa, pochodząca z modelu odwrotnego, a także spodziewany układ odczuć, pochodzący z normalizatora. Pojawia się tu problem „przetłumaczenia”, czyli swoistego sprowadzenia obu tych rodzajów informacji do wspólnego mianownika. W języku potocznym problem ten określa się jako „czucie w rękach”, czyli zdolność dostosowania siły działania lub charakterystyki ruchu do bieżących potrzeb, by spowodować oczekiwane zmiany w środowisku. Nie jest to więc jedynie prosty sumator, ale twór o złożonej budowie. Na schemacie bardzo wyraźnie uwidoczniono, że danymi wejściowymi są: • do modelu prostego – pochodząca z długotrwałej pamięci czuciowej LTMs reaferencja y t-1 oraz pochodzące od narządów zmysłów odwzorowanie bieżącego stanu środowiska y t, natomiast wytworem tego modelu jest spodziewane odczucie; • do modelu odwrotnego – pochodzący z długotrwałej pamięci pojęciowej LTMv spodziewany układ odczuć y t+1 oraz pochodzące od narządów zmysłów odwzorowanie bieżącego stanu środowiska y t, produktem zaś jest podnieta ruchowa; • do przewidywacza odpowiedzialności – pochodząca z długotrwałej pamięci czuciowej LTMs reaferencja y t-1 oraz pochodzący z długotrwałej pamięci pojęciowej LTMv spodziewany układ odczuć y t+1, po ich przetworzeniu blok ten reguluje natężenie sygnału przekazywanego do normalizatora. Przekodowania i przetwarzania informacji w modelu MOSAIC Należy zauważyć, że w modelu MOSAIC wykorzystywane są informacje dwóch rodzajów: czuciowe oraz pojęciowe. Wyraźnie pokazane jest to na rycinie 1, gdzie w poszczególnych pętlach sprzężeń zwrotnych znajdują się człony przekształcające informacje wyrażone w jednym kodzie na inny kod. Są to: • narządy zmysłów, przekształcające fizyczne bodźce środowiskowe w podniety czuciowe, • pamięć czuciowa (LTMs), przechowująca i przetwarzająca podniety czuciowe i syntezy czuciowe, • pamięć pojęciowa (LTMv), przechowująca i przetwarzająca podniety czuciowe, syntezy czuciowe oraz słowa, czyli abstrakcyjne odwzorowania rzeczywistości. W takim ujęciu układ modułów wybranych do wykonania bieżącego zadania ruchowego można utożsamić z pamięcią operacyjną WM, tworzącą podniety ruchowe na podstawie abstrakcyjnych wyobrażeń ruchu (programu ruchów) oraz spodziewanego układu odczuć zmysłowych (wzorca ruchów). Idąc tym tropem rozumowania należałoby domniemywać, że pamięć operacyjna może równocześnie przetwarzać 7–10 modułów [7]. Można by sobie zatem wyobrazić, że pamięć operacyjna „wypożycza” niezbędne do wykonania danej czynności moduły z pamięci długotrwałej (czuciowej i pojęciowej), wykorzystuje je w celu wykonania określonej czynności, a następnie „zwraca” do odpowiedniej „przechowalni” – długotrwałej pamięci czuciowej LTMs lub pojęciowej LTMv. By uczynić model spójnym, niezbędne jest wykorzystanie tej samej procedury umysłowej, jaką wykorzystał w swoim modelu N.A. Bernsztejn [13], mianowicie zastosowanie zasady hierarchiczności. Układ przetwarzania informacji, zgodny zarówno z ogólnym schematem pamięci opracowanym przez Richarda C. Atkinsona i Richarda M. Shiffrina, jak i z hierarchicznym wzorcem budowy – 149 – – 150 – narządy ruchu wytwarzanie sił i ruchów narządy zmysłów tworzenie podniet czuciowych pod wpływem bodźców środowisko tworzenie skutków działania sił i ruchów; wytwarzanie bodźców układ ruchu pobudzanie mięśni krótkotrwała pamięć czuciowa STSS filtrowanie podniet czuciowych łuk odruchowy nadawanie, odpowiedź (sprzęŜenie bezpośrednie) M1 lub M2 pamięć operacyjna WM przetwarzanie wzorców ruchu w podniety ruchowe przekodowanie słownoczuciowe, nadawanie, odpowiedź dowolna (M3) przetwarzanie informacji nadawanie, czuciowej; odpowiedź przekształcenia konkretne wyzwalana modele proste i modele odwrotne długotrwała pamięć czuciowa LTMs przechowywanie informacji czuciowej odbiór odbiór przetwarzanie informacji symbolicznej; przekształcenia formalne automatyzacja pamięć krótkotrwała STM łączenie podniet czuciowych w syntezy czuciowe odbiór, przekodowanie czuciowo-słowne modele proste i modele odwrotne długotrwała pamięć pojęciowa LTMv przechowywanie informacji symbolicznej; przekształcenia semiotyczne - mentalizacja - procesy pobudzane umysłowo kropkowanymi) [Petryński, 2006]. czuciowo-ruchowej z uwzględnieniem procesów uczenia się (oznaczone liniami Symbolic information processing; Formal transformations Movement organs Production of forces and movements Movement system Muscles activation Sending; M1 or M2 response Sending; Triggered response Working memory WM Transformation of movement patterns into motor commands Verbal-sensory transcoding; Sending; Voluntary response (M3) Sensory-driven processes Fig. 2. Data processing in human during performing a sensorimotor activity. Dotted lines denote the learning proceses [14] denote the learning proceses [Petryński, 2006]. Fig. 2. Data processing in human during performing a sensorimotor activity. Dotted lines Environment Production of results of forces and movements; Production of stimuli Sensory receptors Sensory inputs production (stimuli transformation) Short-term sensory memory STSS Sensory inputs „filtering” Reflex arch (direct coupling) Sensory information processing; Concrete transformations Forward models and inverse models Long-term sensory memory LTMs Retention of sensory information Receiving Receiving Short-term memory STM joining sensory inputs into sensory syntheses Receiving: sensory-verbal transcoding Forward models and inverse models Long-term verbal memory LTMv Retention of symbolic information; Semiotic transformations Automation procesy pobudzane czuciowo Ryc. 2. Przetwarzanie informacji przez człowieka w trakcie wykonywania czynności - Mentally-driven processes Ryc. 2. Przetwarzanie informacji przez człowieka w trakcie wykonywania czynności czuciowo-ruchowej z uwzględnieniem procesów uczenia się (oznaczone liniami kropkowanymi) [14] - Mentalization - Wacław Petryński Analiza modelu budowy ruchów MOSAIC autorstwa N.A. Bernsztejna [12, 13] został przedstawiony na rycinie 2 [14]. W takim ujęciu informacji przetwarzanej na poszczególnych piętrach pamięci – STM, LTMs, LTMv – powinny w pamięci WM odpowiadać inne rodzaje modułów wykorzystywanych do wykonania określonego ruchu według modelu MOSAIC. Najprostszy ze schematów, zredukowany do układu przekładającego bezpośrednio pojedynczą podnietę czuciową na podnietę ruchową bez udziału świadomości, odpowiada łukowi odruchowemu. W module takim nie ma w istocie żadnego przetwarzania, jest tylko jednoznaczne przyporządkowanie. Dlatego na rycinie 2 informacja wychodząca z tego modułu (podnieta ruchowa) omija blok „pamięć operacyjna” (WM) i jest kierowana bezpośrednio do narządów wykonawczych (mięśni). Moduł taki jest niemal całkowicie odporny na wszelkie zakłócenia, a więc również na uczenie się. Bardziej złożony, pozbawiony jednak możliwości korzystania z pamięci pojęciowej, jest moduł, który można przypisać długotrwałej pamięci czuciowej (LTMs). Może on przetwarzać złożone ciągi informacji opisanych kodem czuciowym, określone przez Bernsztejna mianem syntez czuciowych. W literaturze układ ten określanym mianem „ośrodkowego generatora wzorców ruchów” (central pattern generator). Schmidt i Lee opisują go następująco (ryc. 3) [15]: wyŜsze piętra ośrodkowego układu nerwowego oscylator (2) zginacze oscylator (1) prostowniki podnieta czuciowa Ryc. 3. Model rdzeniowego generatora chodu ukazującego podnietę czuciową przekazywaną do oscylatorów (1) od źródeł podniet czuciowych z wyższych pięter ośrodkowego układu nerwowego oraz od poruszających się kończyn (2)podnietę [15, s. 171] Ryc. 3. – Model rdzeniowego generatora chodu ukazującego czuciową przekazywaną do oscylatorów (1) od źródeł podniet czuciowych - z wyŜszych pięter ośrodkowego układu nerwowego oraz od poruszających się kończyn (2) [Schmidt, Lee, 2005, s. 171] Higher centers of the CNS Oscillator (2) Oscillator (1) Extensors - Flexors - - Sensory input - Fig. 3. Spinal generator model for gait, showing input to oscillators from sensory sources, from higher centers, from other oscillators and from moving limbs [15, p. 171]model for gait, showing input to oscilators from sensory sources, Fig. 3. Spinal generator - from higher centers, from other oscillators and from moving limbs [Schmidt, Lee, 2005, p. 171] – 151 – Wacław Petryński - - - - - Blok pośrodku ryciny odpowiada ośrodkowemu generatorowi wzorców (central pattern generator), który może być włączony lub wyłączony przez ośrodki ponadrdzeniowe (supraspinal centers). W niektórych przypadkach ów sygnał z wyższych pięter ośrodkowego układu nerwowego jest zaledwie pojedynczym impulsem uruchamiającym generator, przy czym nie jest potrzebna żadna inna czynność ośrodków z wyższych pięter, by podtrzymać działanie oscylatora. W innych przypadkach wydaje się, że niezbędne jest stałe podawanie sygnału (niekoniecznie rytmicznego), a ruch trwa jedynie dopóty, dopóki ów sygnał jest podawany. Generator może jednak zostać uruchomiony również przez podnietę czuciową. Kiedy działa, czynności zginaczy i prostowników są regulowane, a informacja zwrotna od czynnej kończyny może służyć do modyfikacji następnych podniet ruchowych. Na rycinie 3 odwzorowują to strzałki zwrócone w dwie strony łączące prostowniki i zginacze oraz rdzeniowy generator wzorców ruchu (spinal generator). Wreszcie, muszą zapewne istnieć liczne rdzeniowe generatory wzorców, prawdopodobnie jeden dla każdej z czterech kończyn, w cyklu kroczenia kota. Działalność poszczególnych wzorców (oscylatorów) musi być powiązana (skoordynowana) za pomocą interneuronów. Dlatego na rycinie pokazane jest połączenie z innym oscylatorem, by przedstawić ten rodzaj sterowania. [15, s. 170‑171] Należy zauważyć, że w opisie omawianej ryciny Schmidt i Lee używają zamiennie nazwy „rdzeniowy generator wzorców” i „oscylator”, zaś w opisie – nazwy „ośrodkowy generator wzorców” i „rdzeniowy generator wzorców”. W opisie rysunku wymieniają cztery rodzaje impulsów wejściowych do rdzeniowego generatora wzorców (z narządów zmysłów, ośrodków wyższych, innych oscylatorów i poruszających się kończyn), a na rysunku uwidocznione są wyraźnie jedynie trzy takie źródła (narządy zmysłów, ośrodki wyższe i inne oscylatory), zaś informacje od poruszającej się kończyny przedstawione są w postaci strzałek od zginaczy i prostowników. Ponadto w tak zdefiniowanym wzorcu sterowania ruchami nazwa „ośrodkowy generator wzorców” wydaje się nietrafna. Z przytoczonego opisu wynika wyraźnie, że Schmidt i Lee zakładają istnienie dwóch rodzajów mechanizmów sterowania ruchami: rdzeniowego generatora wzorców (spinal generator) i nadrdzeniowego generatora wzorców (supraspinal centers). System współpracujących ze sobą rdzeniowych generatorów wzorców nazywają ośrodkowym generatorem wzorców (central pattern generator). Nazwa ta nie wydaje się trafna, gdyż określenie „ośrodkowy” budzi skojarzenia z ośrodkowym układem nerwowym, obejmującym wszak również ośrodki ponadrdzeniowe, zwłaszcza korę mózgową. Dlatego ten układ sterujący należałoby określić mianem nie „central pattern generator” („ośrodkowy generator wzorców”), lecz „subcor- tical pattern generator” („podkorowy generator wzorców”). Doświadczenia stanowiące podstawę sformułowania hipotezy o podkorowym generatorze wzorców ruchów przeprowadzili już w 1988 r. Fedora F. Severin, Mark L. Shik i Grigori N. Orlovski, a w 1975 roku Sten Grillner opisał odpowiednie mechanizmy sterowania ruchami cyklicznymi z niższych pięter ośrodkowego układu nerwowego [15]. Natomiast model MOSAIC powstał wprawdzie w 1998 roku [2], ale ośrodkowy generator wzorców Grillnera jest w istocie tożsamy z odpowiednim zespołem modułów Wolperta i Kawato. Warto zauważyć, że z badań wykorzystujących zobrazowanie w użyciem magnetycznego rezonansu jądrowego (Nuclear Magnetic Resonance Imaging – NMRI) wynika, że ośrodkiem sterowania modelami odwrotnymi – czyli bezpośrednimi „producentem” określonych podniet ruchowych – jest najprawdopodobniej móżdżek [16]. Znamiennym składnikiem wzorca przedstawionego na rycinie 3 jest sygnał uruchamiający oscylator (1) z wyższych pięter ośrodkowego układu nerwowego. Owym wyższym piętrem może być długotrwała pamięć czuciowa LTMs, przechowująca wzorce ruchów opisane kodem czuciowym lub długotrwała pamięć pojęciowa LTMv, przechowująca odwzorowania ciągów ruchów w postaci programów ruchowych (motor programmes) lub uogólnionych programów ruchowych (generalized motor programmes, GMP) [15]. Zakończenie i wnioski Zgodnie z zasadami modelu MOSAIC, w trakcie wykonywania jakiejkolwiek czynności moduły podlegają trwałym zmianom, czyli uczeniu się. Wybór odpowiedniego modułu możemy porównać do wypożyczenia go albo z długotrwałej pamięci czuciowej LTMs, albo z długotrwałej pamięci pojęciowej LTMv. Wolpert i Kawato wymieniają trzy zalety modułowego ujęcia procesu uczenia się ruchów. Po pierwsze – ich zdaniem świat ma budowę modularną. Drugą cechę opisują następująco: Zastosowanie systemu modułowego umożliwia poszczególnym modułom uczestniczenie w uczeniu się ruchów bez wpływania zachowań ruchowych wyuczonych już wcześniej w innych modułach. Taka modularność może więc obniżyć czasowe przesłuchy, zarówno przyspieszając w ten sposób uczenie się ruchów, jak i utrwalając wcześniej wyuczone zachowania. [2] Trzecią zaletą ujęcia modularnego jest możliwość dokonania z niewielu modułów bardzo wielu – 152 – Analiza modelu budowy ruchów MOSAIC oddziaływanie + - - Ryc. 4. Zasada uczenia się w sieciach neuronowych określana mianem „zwycięzca bierze wszystko”; wykres w kształcie „meksykańskiego kapelusza” [17] Ryc. 4. Zasada uczenia się w sieciach neuronowych określana mianem „zwycięzca bierze wszystko”; wykres w kształcie „meksykańskiego kapelusza” [Kozłowski, Neuman, 2007] Influence + - - Fig. 4. The rule „Winner-Takes-All” in neural networks; „Mexican hat” diagram [17] - - - - - Fig. 4. The rule „Winner-takes-all” in neural networks („Mexican hat” diagram). [Kozłowski, kombinacji, które Neuman, mogą zostać zastosowane w licz2007] nych sytuacjach. Proces wyboru odpowiednich dla danej czynności modułów można porównać do „wypożyczenia” ich z długotrwałej pamięci czuciowej lub długotrwałej pamięci pojęciowej do pamięci operacyjnej. W pamięci operacyjnej następują procesy opisane przez Wolperta i Kawato, między innymi „uczenie się” modułów. Po wykorzystaniu określony moduł – zmieniony wskutek uczenia się – wraca na swoje pierwotne miejsce. Graficznym odwzorowaniem takiego modelu jest schemat przedstawiony na rycinie 2 (linie kropkowane). W przeciwieństwie do Wolperta i Kawato należy jednak przyjąć, że po powrocie z pamięci operacyjnej do długotrwałej pamięci czuciowej lub dłu- gotrwałej pamięci pojęciowej nieco przekształcony (nauczony) moduł może oddziaływać na moduły sąsiednie. Zasadę nieoddziaływania uczeni zaczerpnęli zapewne z teorii sieci neuronowych, gdzie obowiązuje reguła hamowania obocznego, określana niekiedy jako zasada WTA (winner takes all; ryc. 4). Teoria sieci neuronowych stanowi bowiem podstawę zarówno teorii Jordana i Rumelharta, jak i Wolperta, Kawato i Haruno. Jeżeli jednak model MOSAIC ma być wzorcem sterowania ruchami i uczenia się ich, to zasada WTA nie dałaby się pogodzić z procesem przenoszenia (transfer). Przytoczmy prosty przykład. Do pracy mogę pojechać albo przez ulicę Dobrego Urobku, albo przez ulicę Panewnicką. W danym przypadku mogę wybrać tylko jedną trasę, „zwycięz- – 153 – Wacław Petryński cą, który bierze wszystko” może być zatem albo ulica Dobrego Urobku, albo ulica Panewnicka. W sterowaniu ruchami jednoznaczny wybór działania jest więc niezbędny. Jednakże w uczeniu się ruchów zestaw odpowiednich modułów musi tworzyć system. Niezbędne jest wobec tego założenie, że zmiany w jednym z jego składników muszą spowodować zmiany dostosowawcze w innych, aby zachować spoistość systemu. Jeżeli zatem taki „świeżo nauczony” moduł nie zmienia zawartości „swoich sąsiadów” (modelu prostego, modelu odwrotnego i przewidywacza odpowiedzialności), to musi przynajmniej czynić je bardziej podatnymi na zmiany zgodne ze zmianami we właśnie „nauczonym” module. Jeżeli procesy owego oddziaływania zachodzą w pamięci czuciowej LTMs, można je utożsamiać z przenoszeniem niskim (low-road transfer), jeśli w pamięci pojęciowej LTMv – z przenoszeniem wysokim (high-road transfer) [18]. Należy podkreślić, że niezależnie od tego, czy sterowanie ruchami (tutaj: cyklicznymi ruchami lokomocyjnymi) następuje z poziomów podkorowych, czy z poziomu korowego, bezpośrednim „wytwórcą” podniet ruchowych jest osadzony w pamięci operacyjnej WM podkorowy generator wzorców, który może albo działać samoistnie albo być uruchamiany z wyższych pięter ośrodkowego układu nerwowego. Hiroshi Imamizu, Tomoe Kuroda, Satoru Miyauchi, Toshimori Yoshioka i Mitsuo Kawato piszą, że „najnowsze modele obliczeniowe, jak MOdular Selection And Identification Controller (MOSAIC) zakładają, że liczne modele odwrotne tkwią w móżdżku” [16]. Przedstawiony wzorzec, a także oryginalny model MOSAIC, opisują przetwarzanie informacji na torze zstępującym (eferentnym), czyli drogę od planowania do wykonania danej czynności ruchowej. Można go więc postrzegać jako część ogólnego systemu przetwarzania informacji w ustroju człowieka podczas wykonywania czynności czuciowo-ruchowych. W takim ujęciu należałoby go uznać za cybernetyczny opis działania pamięci operacyjnej. Z powyższych analiz wynika wniosek, że fizjologiczne opisy łuku odruchowego, podkorowego generatora wzorców oraz przechowywanego i przetwarzanego w korze mózgowej uogólnionego programu ruchowego są zgodne z hipotezą o modułowym sterowaniu ruchami oraz modelem MOSAIC. PIŚMIENNICTWO • LITERATURE - - - - - [1] Jordan MI, Rumelhart DE: Forward models: Supervised learning with a distal teacher. Cognitive Science, 1992; 16: 307–354. [2] Wolpert DM, Kawato M: Multiple paired forward and inverse models for motor control. Neural Networks, 1998; 11: 1317–1329. [3] Haruno M, Wolpert DM, Kawato M: MOSAIC model for sensorimotor learning and control. Neural Computation, 2001; 13: 2201–2220. [4] Miall C: Modular motor learning. TRENDS in Cognitive Sciences, 2001; vol. 6, no. 1: 1–3. [5] Anderson JR: Uczenie się i pamięć. Integracja zagadnień. War szawa, Wydawnict wa Szkol ne i Pedagogiczne, 1998. [6] Miller GA: The magical number seven, plus or minus two: Some limits on our capacity for processing information. Journal of Experimental Psychology, 1956; 56: 485–491. [7] Smith EE, Jonides J: Neuroimaging analyses of human working memory. Proceedings of the National Academy of Sciences of the United States of America, 1998; 95: 12061–12068, [8] Hotz A: Qualitatives Bewegungslernen. Bern, Verlag Schweizerischer Verband für Sport in der Schule (SVSS), 1997. [9] Kurcz I: Pamięć, uczenie się, język. Warszawa, Wydawnictwo Naukowe PWN, 1995. [10] Ungerer D: Zur Theorie des sensomotorischen Lernens, Hofmann, Schorndorf, 1971. [11] Scholz JP, Schöner G: The uncontrolled manifold concept: identifying control variables for a functional task. Exp. Brain Research, 1999; 126: 289–306. [12] Atkinson R, Shiffrin R: Human memory: A proposed system and its control processes; (w:) Spence K, Spence J (eds): The psychology of learning and motivation: Advances in research and theory. Vol. 2, New York, Academic Press 1968. [13] Bernsztejn NA: O łowkosti i jejo razwitii. Moskwa, Fizkultura i Sport, 1991. [14] Petryński W: Pamięć i sterowanie ruchami przez człowieka. Antropomotoryka, 2006; 34: 109–120. [15] Schmidt RA, Lee TD: Motor Control and Learning. A Behavioral Ephasis, ed. 4. Human Kinetics, 2005. [16] Imamizu H, Kuroda T, Miyauchi S, Yoshioka T, Kawato M: Modular organization of internal models of tools in the human cerebellum. PNAS 2003; vol. 100, no. 9: 14615466, [17] Kozłowski J, Neuman Ł: Wspomaganie wyszukiwania dokumentów mapami samoorganizującymi. www.zsi.pwr. wroc.pl/zsi/missi2002/pdf/s507, 2007. [18] Salomon G, Perkins DN: Rocky roads to transfer: Rethinking mechanisms of a neglected phenomenon. Educational Psychologist, 1989; 24(2): 113–142. – 154 –