FULL TEXT - Antropomotoryka

Transkrypt

FULL TEXT - Antropomotoryka
NR 37
AN ­T RO ­P O ­M O T­ O ­R Y ­K A
2007
ANALIZA MODELU BUDOWY RUCHÓW MOSAIC
ANALYSIS OF THE MOSAIC MODEL OF HUMAN
MOVEMENT CONSTRUCTION
Wacław Petryński*
* dr, Katedra Turystyki, Górnośląska Wyższa Szkoła Handlowa, Katowice, ul. Harcerzy Września 3
Słowa kluczowe: sterowanie ruchami, uczenie się ruchów, model prosty, model odwrotny,
model MOSAIC
Key words: motor control, motor learning, forward model, inverse model, MOSAIC
model
STRESZCZENIE • SUMMARY There have been presented some doubts associated with theories of motor control and learning by Wolpert,
Kawato and Haruno (MOSAIC model). The most important ones arise from the fact that the authors of the MOSAIC model have described the relations between the functions and variables, but not between real situations.
Such an approach would have been justified if the mathematical description would represent true real situations.
Unfortunately, there is no basis to accept such an assumption; on the contrary, each model (including MOSAIC)
involves some simplifications, which make impossible a true projection of the phenomena and processes being
modelled into the sphere of mathematical formalism. So, there has been suggested another grouping of the variables to make the whole model more understandable. The modified pattern includes three feedback loops, not
existing in the original MOSAIC model. Particular loops can be matched against three basic patterns of sensorimotor reactions: reflex, skill, and voluntary response. In this context the notion of “central pattern generator” has
been presented and the inconsistencies in its description pointed out. There has been also presented a general
pattern of data processing during motor control and proved its consistence with both the original MOSAIC model
and its modified version as suggested in the paper.
-
-
-
-
-
W pracy zebrano wątpliwości, jakie wzbudza model MOSAIC. Przedstawiono zastrzeżenia opisane już w literaturze naukowej oraz wynikające z własnych analiz. Najważniejsze zastrzeżenie wynika z faktu, że autorzy modelu
MOSAIC badają raczej zależności między funkcjami i zmiennymi, a nie między zjawiskami rzeczywistymi. Takie
ujęcie byłoby uzasadnione w sytuacji, gdyby opis matematyczny dokładnie odzwierciedlał sytuacje rzeczywiste. Nie tylko nie mamy jednak dostatecznych podstaw do przyjęcia takiego założenia, ale przeciwnie – trzeba
uwzględnić, że model (a MOSAIC jest takim właśnie odwzorowaniem) jest zawsze pewnym uproszczeniem,
nie może więc dokładnie odwzorowywać przedstawianych zjawisk i procesów. Niemniej zaproponowano nieco
inne pogrupowanie zmiennych wejściowych i wyjściowych, co uczyniłoby model bardziej przejrzystym. W zmodyfikowanym wzorcu umieszczono również trzy pętle sprzężenia zwrotnego, których nie ma w oryginalnym
modelu MOSAIC, a które wiążą dane wyjściowe z wejściowymi oraz przedstawiają ich przekształcenia. Poszczególne pętle można kojarzyć z trzema podstawowymi wzorcami odpowiedzi czuciowo-ruchowych: odruchem,
nawykiem i odpowiedzią dowolną. W tym kontekście omówiono również opisywane w literaturze anglosaskiej
pojęcie „ośrodkowego generatora wzorców” wskazując na niespójności w jego opisie. Przedstawiono też ogólny
schemat przetwarzania informacji w trakcie sterowania ruchami i uczenia się ich oraz wykazano, że jest spójny
z zarówno z modelem MOSAIC, jak i jego zmodyfikowaną wersją przedstawioną w niniejszej pracy.
– 143 –
Wacław Petryński
Wstęp
-
-
-
-
-
Teorie Michaela I. Jordana i Davida E. Rumelharta
oraz Daniela M. Wolperta i Mitsuo Kawato, uzupełnione później przez Masahiko Haruno [1, 2, 3]
wydają się obecnie najbardziej dojrzałymi wzorcami typu cybernetycznego. Niemniej ich bliższa
analiza nasuwa następujące wątpliwości, które
sformułował Chris Miall [4].
1. W jakim zakresie wystarczy jedynie dostosowanie już istniejącego modułu, a kiedy zmiany
w warunkach zewnętrznych są tak wielkie, by
konieczne było stworzenie nowego modułu?
2. W jaki sposób ośrodkowy układ nerwowy przypisuje moduł do danej sytuacji? Czy do każdej
sytuacji tworzone są nowe moduły, czy też już
istniejące są wykorzystywane do rozwiązania
bieżącego zadania ruchowego? W istocie jest
to pytanie o liczbę modułów, jakie mogą być
przechowywane w pamięci.
3. W jakim zakresie można łączyć moduły? Jeżeli
istnieje model ramienia i model jakiegoś przedmiotu, to w jaki sposób można połączyć te modele, by odwzorować proces podnoszenia tego
przedmiotu ramieniem? Matematycznie łatwiej
łączyć modele proste niż odwrotne, ale obie te
operacje trzeba wykonać, by stworzyć schemat
działania.
4. Model MOSAIC nie uwzględnia opóźnień wynikających z pracy poszczególnych jego składników oraz pętli sprzężenia zwrotnego, co
jest zjawiskiem bardzo ważnym w ustrojach
biologicznych. W modelu wewnętrzne przewidywania, wytwarzane przez modele proste,
są porównywane z reaferencją z wyprzedzeniem jednego kroku obliczeniowego, jednakże
w sytuacji rzeczywistej opóźnienie fizjologiczne może stanowić źródło błędu. Ustroje żywe
potrafią się przystosować do takiej sytuacji; nie
wiadomo, czy istnieje taka możliwość w przypadku modelu MOSAIC.
Te pytania i zastrzeżenia pozostają na razie
bez odpowiedzi, ale można odnieść się do pytania 2. W tym przypadku odpowiedź wydaje się
dość oczywista: wykorzystywanie już istniejących modułów do rozwiązywania nowych zadań
stanowi istotę procesu przenoszenia (transferu),
a zarazem obniża liczbę przechowywanych w pamięci i wykorzystywanych modułów niezbędnych
do skutecznego działania w danym środowisku.
Pytanie to zawiera też pewien ważny skrót myślowy. Według powszechnie wykorzystywanego
wzorca budowy pamięci, krótkotrwała pamięć
czuciowa (STSS) oraz pamięć długotrwała (LTM)
mają teoretycznie nieograniczoną pojemność [5].
Natomiast kluczowe dla przetwarzania informacji:
pamięć krótkotrwała (STM) oraz pamięć operacyjna (WM) mają ograniczoną pojemność; pierwsza
może równocześnie pomieścić 7±2 porcje informacji (chunks) [6], druga – około 10 [7]. W pytaniu
Chrisa Mialla chodzi zatem w istocie nie o to, ile
modułów może przechować pamięć długotrwała – bo tam teoretycznie ograniczeń nie ma – ale
ile modułów może być równocześnie aktywnych
w pamięci operacyjnej w trakcie sterowania czynnością ruchową.
Ponadto można wymienić jeszcze inne zastrzeżenia.
1. Analizując model MOSAIC trudno się oprzeć
wrażeniu, że jego twórcy dali się ponieść inżynierskiemu sposobowi myślenia. Poszczególnym zjawiskom przypisali symbole matematyczne, poszczególnym procesom – funkcje,
po czym zaczęli badać zachowanie się owych
symboli i funkcji w przestrzeni formalizmu
matematycznego, a nie – zjawiska i procesy
w świecie rzeczywistym. Takie postępowanie
byłoby w pełni uzasadnione przy założeniu, że
formalizm matematyczny dokładnie odwzorowuje to, co dzieje się w świecie rzeczywistym.
Niestety, nie mamy podstaw by bez zastrzeżeń
przyjąć takie założenie. W rezultacie ów formalizm zaczął niejako żyć własnym życiem i mnożyć byty, niektóre – jak się wydaje – bynajmniej
niekonieczne. Gąszcz oznaczeń uczynił więc
model nieprzejrzystym i trudno zrozumiałym,
co znacznie obniżyło jego praktyczną przydatność w nauce. Należałoby zatem zastosować proponowaną przez Nikołaja Bernsztejna
(a wcześniej przez Williama Ockhama) procedurę obniżenia liczby stopni swobody, czyli
usunięcia „bytów niekoniecznych”.
2. W modelu MOSAIC wejście informacji do
poszczególnych modułów następuje poprzez
model prosty, model odwrotny lub przewidywacz odpowiedzialności. Niekonsekwencją jest
wejście między modelem prostym a modelem
wiarogodności. Niejasna jest struktura funkcjonalna i czasowa umożliwiająca taki proces. Nie
ulega wątpliwości, że jakiekolwiek informacje
docierające do którejkolwiek części modułu
muszą zostać postrzeżone, czyli odebrane i rozpoznane. Proces postrzegania ma zatem miejsce w modelu prostym, modelu odwrotnym
i przewidywaczu odpowiedzialności. Z opisu
wynika, że działanie całego modułu odbywa
się w kolejnych cyklach postrzeganie-działanie.
– 144 –
Analiza modelu budowy ruchów MOSAIC
-
-
-
-
-
Czy zatem w trakcie takiego pojedynczego cyklu możliwe jest wprowadzanie informacji inną
drogą? W jaki sposób informacja ta byłaby postrzegana? Jaka miałaby być struktura czasowa
związanych z tym procesów? Według modelu
MOSAIC do modułu musiałyby być wprowadzane w trakcie jego działania informacje,
które powstają dopiero po zakończeniu tego
działania.
3. Z wykresu nie wynika, skąd się biorą dane wejściowe określone mianem „kopia eferentna”,
„sygnał środowiskowy” i „stan pożądany”.
4. Wydaje się, że model MOSAIC zawiera pewien
poważny skrót myślowy. Gdyby daną wejściową
do modelu prostego miałaby być faktycznie kopia eferentna, to musiałby to być niezwykle rozbudowany układ przetwarzania informacji, co
byłoby sprzeczne z podstawowym założeniem
modelu, czyli zbudowaniem prostego opisu
sterowania ruchami i uczenia się ich [2]. Sama
kopia eferentna nie jest bowiem przydatna do
oceny skutków, jakie działanie własne ustroju
sterującego ruchem wywiera na układ odbieranych bodźców. Taką użyteczną informację
stanowi dopiero reaferencja. W takim układzie
cząstkowy z definicji model prosty musiałby na
podstawie kopii eferentnej (cząstkowej? całkowitej?) wytworzyć najpierw odpowiednią
reaferencję (cząstkową? całkowitą?) i dopiero
później dokonać jej przetworzenia.
5. Ważną podstawą budowy modelu MOSAIC jest
jego modułowość. Jednakże autorzy stosują tę
zasadę niekonsekwentnie, odnosząc ją jedynie
do budowy modelu, nie zaś do jego działania
(uwaga ta wiąże się z zastrzeżeniem wymienionym w punkcie 2). W tym drugim przypadku
modułowość oznacza w istocie cykliczność,
a jak trafnie zauważył Arturo Hot: „Czas jest
wynalazkiem człowieka, wynikłym z potrzeby
lepszej orientacji w zdarzeniach. Natura oferuje nam bowiem jedynie rytmy. Okresowe powroty Słońca i Księżyca, bicie własnego serca
– oba te zjawiska pozwalają nam postrzegać
i przeżywać postęp tzw. czasu” [8, s. 181].
Model prosty i odwrotny według Jordana
i Rumelharta
Celowe jest więc podjęcie próby uproszczenia modelu, aby stał się bardziej przystępny i dzięki temu
mógł skuteczniej przyczynić się do rozwoju nauki.
Już Jordan i Rumelhart wyróżnili trzy rodzaje
stanów: środowiska (x), odczuć (u) i podniet ruchowych (y). Podzielili je na bieżące, nie mające
żadnego dodatkowego oznaczenia (x, u, y), przewidywane (oczekiwane), oznaczone daszkiem (x̂,
û, ŷ) oraz pożądane (idealne), oznaczone gwiazdką
(x*, u*, y*). Należy zauważyć, że idealny stan pożądany nie jest czynnikiem różniącym się jakościowo
od stanu przewidywanego, lecz jedynie szczególnym, skrajnym przypadkiem stanu oczekiwanego.
Można by uznać, że stan bieżący określa poziom
wyjściowy ustalonej wielkości, stan przewidywany
– poziom, na jakim wykonujący postrzega swoje
możliwości, zaś stan pożądany – idealny wzorzec
tejże wielkości. W przypadku konkretnej czynności bieżącym czynnikiem „napędzającym” proces
doskonalenia jest sygnał błędu, odpowiadający
różnicy między stanem bieżącym a przewidywanym. Kiedy osiągnie się zgodność tych dwóch
stanów, wówczas stan przewidywany przesuwa
się dalej w kierunku stanu idealnego pożądanego.
Niemniej idealny stan pożądany nie pełni żadnej
bieżącej funkcji sterującej procesem uczenia się,
gdyż, co należy jeszcze raz podkreślić, „potencjał
doskonalenia” danej czynności określa różnica
między stanem bieżącym a stanem przewidywanym, czyli oczekiwanym w danej chwili jako skutek właśnie wykonywanej czynności. Kiedy stan
bieżący, przewidywany i pożądany pokryją się,
osiąga się rutynę, czyli sytuację, w której kolejne
powtórzenia danej czynności nie powodują jej
doskonalenia. Znika różnica między stanem bieżącym a stanem pożądanym, określana zwykle jako
błąd, będący w istocie impulsem „napędzającym”
wszelkie przemiany. W takiej sytuacji ustaje wszelki rozwój, a wraz z nim postęp.
Takie postrzeganie omawianego modelu pozwala też inaczej spojrzeć na potęgowe prawo
powtarzania [5, 9]. Można założyć, że o szybkości
przyswajania jakiejś umiejętności decyduje nie
liczba powtórzeń, lecz rozbieżność między stanem
bieżącym a stanem przewidywanym, czyli błąd
wykonania. Haruno, Wolpert i Kawato piszą:
Odpowiedzialności są wykorzystywane do określania wag danych wyjściowych z modeli odwrotnych w celu obliczenia ostatecznej podniety ruchowej
ut i sterowania uczeniem się zarówno modelu prostego,
jak i odwrotnego, przy czym proporcjonalnie większą
odpowiedzialność mają te modele, które odbierają
większy sygnał błędu (podkreślenie moje – WP) [3].
Początkowo, w trakcie pierwszych prób wykonania określonej czynności, ów błąd ma znaczną
wartość, stanowi więc silny czynnik „napędzający” doskonalenie czynności. W miarę nabywania
wprawy błąd staje się coraz mniejszy, proporcjonalnie maleje więc jego wpływ na szybkość doskonalenia czynności. Wreszcie, kiedy stan bieżący,
– 145 –
Wacław Petryński
przewidywany i oczekiwany pokryją się, zostaje
osiągnięta rutyna, czyli sytuacja, w której kolejne
powtórzenia danej czynności nie powodują jej
doskonalenia. Podsumowując, z analiz procesu
doskonalenia czynności można usunąć stan pożądany (idealny), gdyż nie stanowi on czynnika bezpośrednio wpływającego na proces doskonalenia
czynności, a ponadto jakościowo jest w istocie tożsamy ze stanem przewidywanym.
Jordan i Rumelhart wprowadzili trzy zmienne:
stan środowiska x, odczucia y i działania (podniety
ruchowe) u. Analizując postrzeganie rzeczywistości przez człowieka należy zauważyć, że może on
ją postrzegać jedynie za pośrednictwem zmysłów.
Określonemu stanowi środowiska x i można więc
przypisać odpowiadający mu układ odczuć y i.
Z modeli teoretycznych sterowania ruchem przez
człowieka, czyli procesów przebiegających w świadomości tego człowieka, nie zaś w obiektywnej
rzeczywistości, można więc usunąć zmienną „stan
środowiska” i zastąpić ją układem odczuć zmysłowych. W takiej sytuacji liczba analizowanych wielkości maleje do dwóch: odczuć y i i działań ui.
Podsumowując, liczbę dziewięciu zmiennych
wykorzystywanych w modelu Jordana i Rumelharta (x, u, y; x̂, û, ŷ; x*, u*, y*) w modelu MOSAIC
można z powodzeniem obniżyć do czterech (y, u;
ŷ, û).
-
-
-
-
-
Uwagi o modelu MOSAIC
Wzorzec opracowany przez Haruno, Wolperta
i Kawato (por. ryc.7 w artykule „Model budowy
ruchów MOSAIC”) zawiera kilka istotnych uproszczeń. Przypomnijmy, że – zgodnie z definicją
Jordana i Rumelharta – model prosty przekształca stan bieżący środowiska i uprzednie działanie
(ściślej – reaferencję) w układ odczuć przewidywanych. Natomiast na omawianym schemacie zaznaczone jest jedynie uprzednie działanie (w postaci kopii eferentnej podniety ruchowej, powodującej wytworzenie reaferencji). Model odwrotny
ma przekształcać stan bieżący środowiska i stan
przewidywany w działanie, czyli określoną podnietę ruchową, ale na schemacie modelu MOSAIC
zaznaczony jest jedynie stan przewidywany. Ze
schematu nie wynika też, skąd się biorą wielkości
oznaczone blokami po prawej stronie ryciny: stan
przewidywany, sygnał środowiskowy oraz kopia
eferentna podniety ruchowej (a tym bardziej – reaferencji).
Wątpliwości budzi też usytuowanie bloku
„model wiarogodności”. Przede wszystkim wszelkie dane wejściowe do modułu są wprowadzane
przez „układy postrzeżeniowo-przekształcające”
– model prosty, model odwrotny i przewidywacz
odpowiedzialności. Jedynie informacja określona
jako „stan następny” wchodzi do modułu bezpośrednio; nie wiadomo, jakie informacje i jakim kodem opisane wprowadza do modułu i jak oddziałuje na jego pracę. Z samego wykresu wynikałoby
bowiem, że tą drogą wnika do modułu... „przedmiot sterowania”!
Model MOSAIC nie wyjaśnia też pewnego bardzo ważnego problemu: W jakim kodzie są opisane
informacje tworzone przez system, przekazywane
do niego i odbierane przezeń? Informacja docierająca do modelu prostego, odwrotnego i przewidywacza odpowiedzialności musi być bowiem wyrażona w takim kodzie, który jest zrozumiały dla tych
bloków.
Modyfikacja modelu MOSAIC
Proponowany poniżej wzorzec (ryc. 1.) usuwa
wymienione niedociągnięcia. Przede wszystkim
zakłada rozszerzenie zasady modularności również na czas, a nie jedynie na funkcję. Oznacza to,
że cykl działania modułu uznalibyśmy za niepodzielną jednostkę działania, tzn. od chwili wprowadzenia danych do momentu przekazania do
systemu przetworzonych informacji i działań nie
można byłoby wpływać z zewnątrz na pracę modułu; pojedynczy cykl pracy modułu przypomina
więc sekwencję sensomotoryczną opisaną przez
Dietricha Ungerera [10] oraz rozmaitość niekontrolowaną (uncontrolled manifold, UCM) według
Johna P. Scholza i Gregora Schönera [11] Skądinąd
takie ujęcie wykluczałoby możliwość wprowadzania danych do modułu inną drogą niż przez model
prosty, model odwrotny i przewidywacz odpowiedzialności, gdyż w trakcie pracy modułu nie byłyby
podejmowane żadne decyzje o przebiegu czynności, lecz jedynie realizowany określony fragment
programu czy wzorca ruchów. Kolejne cykle byłyby połączone pętlami sprzężeń zwrotnych.
Składnikami proponowanego modelu są trzy
grupy zmiennych:
1) dane wejściowe, oznaczone symbolem y,
2) dane wyjściowe, oznaczone symbolem x,
3) kolejne cykle przekształceń, oznaczone indeksami: t – 1 – odnoszący się do cyklu minionego,
t – odnoszący się do cyklu bieżącego oraz t + 1
– odnoszący się do cyklu przyszłego.
Dane wejściowe – to reaferencja y t-1, bieżące
doznania zmysłowe określające aktualny stan środowiska y t oraz przewidywane doznania zmysłowe
– 146 –
– 147 –
-
przewidywane doznania
zmysłowe yt+1
źródło: pamięć pojęciowa
bieŜące podniety
czuciowe yt
źródło: narządy zmysłów
reaferencja yt-1
źródło: pamięć czuciowa
-
przekształcenie
xwt → yt-1
długotrwała pamięć
czuciowa
przekształcenie
xpt → yt+1
długotrwała pamięć
pojęciowa
przewidywane
2
model prosty
odczucia
przewidywane
1
model prosty
odczucia
przewidywane
regulacja stopnia
modelprzewidywacz
prosty
odczucia
oddziaływania
odpowiedzialności
regulacja stopnia
przewidywacz
oddziaływania
odpowiedzialności
regulacja stopnia
przewidywacz
planowana podnieta
oddziaływania
odpowiedzialności
model odwrotny
ruchowa
planowana podnieta
model odwrotny
ruchowa
planowana podnieta
model odwrotny
ruchowa
przekształcenie
xst → yt
narządy zmysłów
n
normalizator
Σ
ostateczna
podnieta
ruchowa
system
sterowany
skutki działania
pamięci operacyjnej (WM).
Ryc. 1. Schemat modułowego sterowania ruchami wg modyfikacji PETRYŃSKIEGO; obszar ograniczony grubą linią przerywaną odpowiada
wprowadzanie informacji do sysytemu;
dane typu y
-
tworzenie wyników przez sysytem;
dane typu x
Ryc. 1. Schemat modułowego sterowania ruchami wg modyfikacji Petryńskiego; obszar ograniczony grubą linią przerywaną odpowiada pamięci operacyjnej (WM)
-
kopia eferentna
xwt
stan środowiaka
xst
postrzeganie
pojęciowe xpt
-
Analiza modelu budowy ruchów MOSAIC
– 148 –
-
Predicted sensory
sensations yt+1
Source: verbal memory
Current motor commands
yt
Source: sensory receptors
Reafference
yt-1
Source: sensory memory
-
Inverse model
model odwrotny
Forward
model
przewidywacz
odpowiedzialności
przewidywacz
odpowiedzialności
Responsibility
predictor
model odwrotny
model prosty
model prosty
Transformation
xst → yt
Sensory receptors
Transformation
xpt → yt+1
Long-term verbal
memory
przewidywane
2
odczucia
przewidywane
1
odczucia
Predicted
regulacja stopnia
sensations
oddziaływania
regulacja stopnia
oddziaływania
Responsibility
planowana podnieta
regulation
ruchowa
planowana podnieta
ruchowa
Planned motor
command
Transformation
xwt → yt-1
Long-term sensory
memory
n
Normalization
Σ
Final
motor
command
Controlled
system
Action results
memory.
Fig. 1. The pattern of a modular movement control modified by PETRYŃSKI. The region bordered by thick broken line represents the working
Information input to a system
Data of y-type
-
Creation of results by a sysytem
Data of x-type
Fig. 1. The pattern of a modular movement control modified by Petryński. The region bordered by thick broken line represents the working memory
-
Efference copy
xwt
Environment state
xst
Verbal
perception xpt
-
Wacław Petryński
Analiza modelu budowy ruchów MOSAIC
-
-
-
-
-
y t+1. Dane wyjściowe – to kopia eferentna x wt, układ
bodźców określający stan środowiska x st oraz postrzeganie pojęciowe x pt; wszystkie one odnoszą
się do stanu bieżącego, oznaczone są więc indeksem „t”.
Poszczególne pary danych wyjściowych oraz
danych wejściowych połączone są pętlami sprzężeń zwrotnych:
1) kopia eferentna x wt, po przekształceniu w długotrwałej pamięci czuciowej w reaferencję
y t-1 – z wejściem do modelu prostego i przewidywacza odpowiedzialności, tę pętlę można
powiązać ze schematem, będącym wzorcem
nawyku czuciowo-ruchowego,
2) stan bieżący środowiska x st, po przekształceniu
w narządach zmysłów w bieżące podniety czuciowe y t – z wejściem do modelu prostego i modelu odwrotnego; tę pętlę można powiązać ze
stereotypem, będącym podstawą odruchu,
3) postrzeganie pojęciowe x pt, po przekształceniu
w długotrwałej pamięci pojęciowej w przewidywane doznania zmysłowe y t+1 – z wejściem
do modelu odwrotnego i przewidywacza odpowiedzialności; tę pętlę można powiązać
z uogólnionym programem ruchowym, będącym podstawą dowolnej odpowiedzi czuciowo-ruchowej.
Na szczególną uwagę zasługuje węzeł oznaczony symbolem Σ. Docierają do niego informacje
dwojakiego rodzaju: podnieta ruchowa, pochodząca z modelu odwrotnego, a także spodziewany układ odczuć, pochodzący z normalizatora.
Pojawia się tu problem „przetłumaczenia”, czyli
swoistego sprowadzenia obu tych rodzajów informacji do wspólnego mianownika. W języku potocznym problem ten określa się jako „czucie w rękach”, czyli zdolność dostosowania siły działania
lub charakterystyki ruchu do bieżących potrzeb,
by spowodować oczekiwane zmiany w środowisku. Nie jest to więc jedynie prosty sumator, ale
twór o złożonej budowie.
Na schemacie bardzo wyraźnie uwidoczniono,
że danymi wejściowymi są:
• do modelu prostego – pochodząca z długotrwałej pamięci czuciowej LTMs reaferencja
y t-1 oraz pochodzące od narządów zmysłów
odwzorowanie bieżącego stanu środowiska y t,
natomiast wytworem tego modelu jest spodziewane odczucie;
• do modelu odwrotnego – pochodzący z długotrwałej pamięci pojęciowej LTMv spodziewany
układ odczuć y t+1 oraz pochodzące od narządów zmysłów odwzorowanie bieżącego stanu
środowiska y t, produktem zaś jest podnieta ruchowa;
• do przewidywacza odpowiedzialności – pochodząca z długotrwałej pamięci czuciowej LTMs
reaferencja y t-1 oraz pochodzący z długotrwałej
pamięci pojęciowej LTMv spodziewany układ
odczuć y t+1, po ich przetworzeniu blok ten reguluje natężenie sygnału przekazywanego do
normalizatora.
Przekodowania i przetwarzania informacji
w modelu MOSAIC
Należy zauważyć, że w modelu MOSAIC wykorzystywane są informacje dwóch rodzajów: czuciowe
oraz pojęciowe. Wyraźnie pokazane jest to na rycinie 1, gdzie w poszczególnych pętlach sprzężeń
zwrotnych znajdują się człony przekształcające informacje wyrażone w jednym kodzie na inny kod.
Są to:
• narządy zmysłów, przekształcające fizyczne
bodźce środowiskowe w podniety czuciowe,
• pamięć czuciowa (LTMs), przechowująca
i przetwarzająca podniety czuciowe i syntezy
czuciowe,
• pamięć pojęciowa (LTMv), przechowująca
i przetwarzająca podniety czuciowe, syntezy
czuciowe oraz słowa, czyli abstrakcyjne odwzorowania rzeczywistości.
W takim ujęciu układ modułów wybranych do
wykonania bieżącego zadania ruchowego można
utożsamić z pamięcią operacyjną WM, tworzącą
podniety ruchowe na podstawie abstrakcyjnych
wyobrażeń ruchu (programu ruchów) oraz spodziewanego układu odczuć zmysłowych (wzorca
ruchów). Idąc tym tropem rozumowania należałoby domniemywać, że pamięć operacyjna może
równocześnie przetwarzać 7–10 modułów [7].
Można by sobie zatem wyobrazić, że pamięć operacyjna „wypożycza” niezbędne do wykonania danej czynności moduły z pamięci długotrwałej (czuciowej i pojęciowej), wykorzystuje je w celu wykonania określonej czynności, a następnie „zwraca”
do odpowiedniej „przechowalni” – długotrwałej
pamięci czuciowej LTMs lub pojęciowej LTMv.
By uczynić model spójnym, niezbędne jest wykorzystanie tej samej procedury umysłowej, jaką
wykorzystał w swoim modelu N.A. Bernsztejn [13],
mianowicie zastosowanie zasady hierarchiczności. Układ przetwarzania informacji, zgodny zarówno z ogólnym schematem pamięci opracowanym przez Richarda C. Atkinsona i Richarda M.
Shiffrina, jak i z hierarchicznym wzorcem budowy
– 149 –
– 150 –
narządy ruchu
wytwarzanie sił i ruchów
narządy zmysłów
tworzenie podniet czuciowych
pod wpływem bodźców
środowisko
tworzenie skutków działania sił i ruchów; wytwarzanie bodźców
układ ruchu
pobudzanie mięśni
krótkotrwała pamięć czuciowa
STSS
filtrowanie podniet czuciowych
łuk odruchowy
nadawanie, odpowiedź
(sprzęŜenie bezpośrednie)
M1 lub M2
pamięć
operacyjna
WM
przetwarzanie
wzorców ruchu
w podniety
ruchowe
przekodowanie słownoczuciowe, nadawanie,
odpowiedź dowolna (M3)
przetwarzanie informacji nadawanie,
czuciowej;
odpowiedź
przekształcenia konkretne wyzwalana
modele proste i modele odwrotne
długotrwała pamięć czuciowa LTMs
przechowywanie informacji czuciowej
odbiór
odbiór
przetwarzanie informacji
symbolicznej;
przekształcenia formalne
automatyzacja
pamięć
krótkotrwała
STM
łączenie podniet
czuciowych w
syntezy
czuciowe
odbiór, przekodowanie
czuciowo-słowne
modele proste i modele odwrotne
długotrwała pamięć pojęciowa LTMv
przechowywanie informacji symbolicznej; przekształcenia semiotyczne
-
mentalizacja
-
procesy pobudzane umysłowo
kropkowanymi) [Petryński, 2006].
czuciowo-ruchowej z uwzględnieniem procesów uczenia się (oznaczone liniami
Symbolic information processing;
Formal transformations
Movement organs
Production of forces and
movements
Movement system
Muscles activation
Sending;
M1 or M2 response
Sending;
Triggered
response
Working
memory
WM
Transformation
of movement
patterns into
motor
commands
Verbal-sensory
transcoding; Sending;
Voluntary response (M3)
Sensory-driven processes
Fig. 2. Data processing in human during performing a sensorimotor activity. Dotted lines denote
the learning proceses [14]
denote the learning proceses [Petryński, 2006].
Fig. 2. Data processing in human during performing a sensorimotor activity. Dotted lines
Environment
Production of results of forces and movements; Production of stimuli
Sensory receptors
Sensory inputs production
(stimuli transformation)
Short-term sensory memory
STSS
Sensory inputs „filtering”
Reflex arch
(direct coupling)
Sensory information
processing;
Concrete transformations
Forward models and inverse models
Long-term sensory memory LTMs
Retention of sensory information
Receiving
Receiving
Short-term
memory
STM
joining sensory
inputs into
sensory
syntheses
Receiving: sensory-verbal
transcoding
Forward models and inverse models
Long-term verbal memory LTMv
Retention of symbolic information; Semiotic transformations
Automation
procesy pobudzane czuciowo
Ryc. 2. Przetwarzanie informacji przez człowieka w trakcie wykonywania czynności
-
Mentally-driven processes
Ryc. 2. Przetwarzanie informacji przez człowieka w trakcie wykonywania czynności czuciowo-ruchowej z uwzględnieniem procesów uczenia się (oznaczone liniami kropkowanymi) [14]
-
Mentalization
-
Wacław Petryński
Analiza modelu budowy ruchów MOSAIC
autorstwa N.A. Bernsztejna [12, 13] został przedstawiony na rycinie 2 [14].
W takim ujęciu informacji przetwarzanej na
poszczególnych piętrach pamięci – STM, LTMs,
LTMv – powinny w pamięci WM odpowiadać inne
rodzaje modułów wykorzystywanych do wykonania określonego ruchu według modelu MOSAIC.
Najprostszy ze schematów, zredukowany do
układu przekładającego bezpośrednio pojedynczą podnietę czuciową na podnietę ruchową bez
udziału świadomości, odpowiada łukowi odruchowemu. W module takim nie ma w istocie żadnego przetwarzania, jest tylko jednoznaczne przyporządkowanie. Dlatego na rycinie 2 informacja
wychodząca z tego modułu (podnieta ruchowa)
omija blok „pamięć operacyjna” (WM) i jest kierowana bezpośrednio do narządów wykonawczych
(mięśni). Moduł taki jest niemal całkowicie odporny na wszelkie zakłócenia, a więc również na
uczenie się.
Bardziej złożony, pozbawiony jednak możliwości korzystania z pamięci pojęciowej, jest moduł, który można przypisać długotrwałej pamięci
czuciowej (LTMs). Może on przetwarzać złożone
ciągi informacji opisanych kodem czuciowym,
określone przez Bernsztejna mianem syntez czuciowych. W literaturze układ ten określanym mianem „ośrodkowego generatora wzorców ruchów”
(central pattern generator). Schmidt i Lee opisują
go następująco (ryc. 3) [15]:
wyŜsze piętra ośrodkowego
układu nerwowego
oscylator (2)
zginacze
oscylator (1)
prostowniki
podnieta czuciowa
Ryc. 3. Model rdzeniowego generatora chodu ukazującego podnietę czuciową przekazywaną do oscylatorów (1) od źródeł podniet
czuciowych
z wyższych pięter
ośrodkowego układu
nerwowego oraz
od poruszających
się kończyn (2)podnietę
[15, s. 171]
Ryc.
3. – Model
rdzeniowego
generatora
chodu
ukazującego
czuciową
przekazywaną do oscylatorów (1) od źródeł podniet czuciowych - z wyŜszych pięter
ośrodkowego układu nerwowego oraz od poruszających się kończyn (2) [Schmidt, Lee,
2005, s. 171]
Higher centers
of the CNS
Oscillator (2)
Oscillator (1)
Extensors
-
Flexors
-
-
Sensory input
-
Fig. 3. Spinal generator model for gait, showing input to oscillators from sensory sources, from higher centers, from other oscillators
and from
moving limbs
[15, p. 171]model for gait, showing input to oscilators from sensory sources,
Fig.
3. Spinal
generator
-
from higher centers, from other oscillators and from moving limbs [Schmidt, Lee, 2005, p.
171]
– 151 –
Wacław Petryński
-
-
-
-
-
Blok pośrodku ryciny odpowiada ośrodkowemu
generatorowi wzorców (central pattern generator), który może być włączony lub wyłączony przez ośrodki
ponadrdzeniowe (supraspinal centers). W niektórych
przypadkach ów sygnał z wyższych pięter ośrodkowego układu nerwowego jest zaledwie pojedynczym impulsem uruchamiającym generator, przy czym nie jest
potrzebna żadna inna czynność ośrodków z wyższych
pięter, by podtrzymać działanie oscylatora. W innych
przypadkach wydaje się, że niezbędne jest stałe podawanie sygnału (niekoniecznie rytmicznego), a ruch
trwa jedynie dopóty, dopóki ów sygnał jest podawany.
Generator może jednak zostać uruchomiony również przez podnietę czuciową. Kiedy działa, czynności
zginaczy i prostowników są regulowane, a informacja
zwrotna od czynnej kończyny może służyć do modyfikacji następnych podniet ruchowych. Na rycinie 3 odwzorowują to strzałki zwrócone w dwie strony łączące
prostowniki i zginacze oraz rdzeniowy generator wzorców ruchu (spinal generator). Wreszcie, muszą zapewne
istnieć liczne rdzeniowe generatory wzorców, prawdopodobnie jeden dla każdej z czterech kończyn, w cyklu
kroczenia kota. Działalność poszczególnych wzorców
(oscylatorów) musi być powiązana (skoordynowana) za
pomocą interneuronów. Dlatego na rycinie pokazane
jest połączenie z innym oscylatorem, by przedstawić
ten rodzaj sterowania. [15, s. 170‑171]
Należy zauważyć, że w opisie omawianej ryciny Schmidt i Lee używają zamiennie nazwy
„rdzeniowy generator wzorców” i „oscylator”, zaś
w opisie – nazwy „ośrodkowy generator wzorców” i „rdzeniowy generator wzorców”. W opisie
rysunku wymieniają cztery rodzaje impulsów wejściowych do rdzeniowego generatora wzorców
(z narządów zmysłów, ośrodków wyższych, innych
oscylatorów i poruszających się kończyn), a na
rysunku uwidocznione są wyraźnie jedynie trzy
takie źródła (narządy zmysłów, ośrodki wyższe
i inne oscylatory), zaś informacje od poruszającej
się kończyny przedstawione są w postaci strzałek
od zginaczy i prostowników. Ponadto w tak zdefiniowanym wzorcu sterowania ruchami nazwa
„ośrodkowy generator wzorców” wydaje się nietrafna. Z przytoczonego opisu wynika wyraźnie, że
Schmidt i Lee zakładają istnienie dwóch rodzajów
mechanizmów sterowania ruchami: rdzeniowego generatora wzorców (spinal generator) i nadrdzeniowego generatora wzorców (supraspinal
centers). System współpracujących ze sobą rdzeniowych generatorów wzorców nazywają ośrodkowym generatorem wzorców (central pattern
generator). Nazwa ta nie wydaje się trafna, gdyż
określenie „ośrodkowy” budzi skojarzenia z ośrodkowym układem nerwowym, obejmującym wszak
również ośrodki ponadrdzeniowe, zwłaszcza korę
mózgową. Dlatego ten układ sterujący należałoby
określić mianem nie „central pattern generator”
(„ośrodkowy generator wzorców”), lecz „subcor-
tical pattern generator” („podkorowy generator
wzorców”).
Doświadczenia stanowiące podstawę sformułowania hipotezy o podkorowym generatorze wzorców ruchów przeprowadzili już w 1988 r. Fedora
F. Severin, Mark L. Shik i Grigori N. Orlovski,
a w 1975 roku Sten Grillner opisał odpowiednie
mechanizmy sterowania ruchami cyklicznymi
z niższych pięter ośrodkowego układu nerwowego
[15]. Natomiast model MOSAIC powstał wprawdzie w 1998 roku [2], ale ośrodkowy generator
wzorców Grillnera jest w istocie tożsamy z odpowiednim zespołem modułów Wolperta i Kawato.
Warto zauważyć, że z badań wykorzystujących zobrazowanie w użyciem magnetycznego rezonansu
jądrowego (Nuclear Magnetic Resonance Imaging
– NMRI) wynika, że ośrodkiem sterowania modelami odwrotnymi – czyli bezpośrednimi „producentem” określonych podniet ruchowych – jest
najprawdopodobniej móżdżek [16].
Znamiennym składnikiem wzorca przedstawionego na rycinie 3 jest sygnał uruchamiający oscylator (1) z wyższych pięter ośrodkowego układu
nerwowego. Owym wyższym piętrem może być
długotrwała pamięć czuciowa LTMs, przechowująca wzorce ruchów opisane kodem czuciowym
lub długotrwała pamięć pojęciowa LTMv, przechowująca odwzorowania ciągów ruchów w postaci
programów ruchowych (motor programmes) lub
uogólnionych programów ruchowych (generalized
motor programmes, GMP) [15].
Zakończenie i wnioski
Zgodnie z zasadami modelu MOSAIC, w trakcie
wykonywania jakiejkolwiek czynności moduły
podlegają trwałym zmianom, czyli uczeniu się.
Wybór odpowiedniego modułu możemy porównać do wypożyczenia go albo z długotrwałej pamięci czuciowej LTMs, albo z długotrwałej pamięci pojęciowej LTMv. Wolpert i Kawato wymieniają
trzy zalety modułowego ujęcia procesu uczenia się
ruchów. Po pierwsze – ich zdaniem świat ma budowę modularną. Drugą cechę opisują następująco:
Zastosowanie systemu modułowego umożliwia poszczególnym modułom uczestniczenie w uczeniu się
ruchów bez wpływania zachowań ruchowych wyuczonych już wcześniej w innych modułach. Taka modularność może więc obniżyć czasowe przesłuchy, zarówno
przyspieszając w ten sposób uczenie się ruchów, jak
i utrwalając wcześniej wyuczone zachowania. [2]
Trzecią zaletą ujęcia modularnego jest możliwość dokonania z niewielu modułów bardzo wielu
– 152 –
Analiza modelu budowy ruchów MOSAIC
oddziaływanie
+
-
-
Ryc. 4. Zasada uczenia się w sieciach neuronowych określana mianem „zwycięzca bierze wszystko”; wykres w kształcie „meksykańskiego
kapelusza” [17]
Ryc. 4. Zasada uczenia się w sieciach neuronowych określana mianem „zwycięzca bierze
wszystko”; wykres w kształcie „meksykańskiego kapelusza” [Kozłowski, Neuman,
2007]
Influence
+
-
-
Fig. 4. The rule „Winner-Takes-All” in neural networks; „Mexican hat” diagram [17]
-
-
-
-
-
Fig. 4. The rule „Winner-takes-all” in neural networks („Mexican hat” diagram). [Kozłowski,
kombinacji, które Neuman,
mogą zostać
zastosowane w licz2007]
nych sytuacjach.
Proces wyboru odpowiednich dla danej czynności modułów można porównać do „wypożyczenia” ich z długotrwałej pamięci czuciowej lub długotrwałej pamięci pojęciowej do pamięci operacyjnej. W pamięci operacyjnej następują procesy
opisane przez Wolperta i Kawato, między innymi
„uczenie się” modułów. Po wykorzystaniu określony moduł – zmieniony wskutek uczenia się – wraca
na swoje pierwotne miejsce. Graficznym odwzorowaniem takiego modelu jest schemat przedstawiony na rycinie 2 (linie kropkowane).
W przeciwieństwie do Wolperta i Kawato należy jednak przyjąć, że po powrocie z pamięci operacyjnej do długotrwałej pamięci czuciowej lub dłu-
gotrwałej pamięci pojęciowej nieco przekształcony
(nauczony) moduł może oddziaływać na moduły
sąsiednie. Zasadę nieoddziaływania uczeni zaczerpnęli zapewne z teorii sieci neuronowych, gdzie obowiązuje reguła hamowania obocznego, określana
niekiedy jako zasada WTA (winner takes all; ryc. 4).
Teoria sieci neuronowych stanowi bowiem
podstawę zarówno teorii Jordana i Rumelharta,
jak i Wolperta, Kawato i Haruno. Jeżeli jednak model MOSAIC ma być wzorcem sterowania ruchami
i uczenia się ich, to zasada WTA nie dałaby się pogodzić z procesem przenoszenia (transfer).
Przytoczmy prosty przykład. Do pracy mogę
pojechać albo przez ulicę Dobrego Urobku,
albo przez ulicę Panewnicką. W danym przypadku mogę wybrać tylko jedną trasę, „zwycięz-
– 153 –
Wacław Petryński
cą, który bierze wszystko” może być zatem albo
ulica Dobrego Urobku, albo ulica Panewnicka.
W sterowaniu ruchami jednoznaczny wybór działania jest więc niezbędny. Jednakże w uczeniu się
ruchów zestaw odpowiednich modułów musi tworzyć system. Niezbędne jest wobec tego założenie, że zmiany w jednym z jego składników muszą
spowodować zmiany dostosowawcze w innych,
aby zachować spoistość systemu. Jeżeli zatem taki
„świeżo nauczony” moduł nie zmienia zawartości
„swoich sąsiadów” (modelu prostego, modelu odwrotnego i przewidywacza odpowiedzialności), to
musi przynajmniej czynić je bardziej podatnymi na
zmiany zgodne ze zmianami we właśnie „nauczonym” module. Jeżeli procesy owego oddziaływania zachodzą w pamięci czuciowej LTMs, można
je utożsamiać z przenoszeniem niskim (low-road
transfer), jeśli w pamięci pojęciowej LTMv – z przenoszeniem wysokim (high-road transfer) [18].
Należy podkreślić, że niezależnie od tego, czy
sterowanie ruchami (tutaj: cyklicznymi ruchami
lokomocyjnymi) następuje z poziomów podkorowych, czy z poziomu korowego, bezpośrednim
„wytwórcą” podniet ruchowych jest osadzony
w pamięci operacyjnej WM podkorowy generator
wzorców, który może albo działać samoistnie albo
być uruchamiany z wyższych pięter ośrodkowego układu nerwowego. Hiroshi Imamizu, Tomoe
Kuroda, Satoru Miyauchi, Toshimori Yoshioka
i Mitsuo Kawato piszą, że „najnowsze modele obliczeniowe, jak MOdular Selection And Identification
Controller (MOSAIC) zakładają, że liczne modele odwrotne tkwią w móżdżku” [16].
Przedstawiony wzorzec, a także oryginalny model MOSAIC, opisują przetwarzanie informacji na
torze zstępującym (eferentnym), czyli drogę od planowania do wykonania danej czynności ruchowej.
Można go więc postrzegać jako część ogólnego systemu przetwarzania informacji w ustroju człowieka
podczas wykonywania czynności czuciowo-ruchowych. W takim ujęciu należałoby go uznać za cybernetyczny opis działania pamięci operacyjnej.
Z powyższych analiz wynika wniosek, że fizjologiczne opisy łuku odruchowego, podkorowego generatora wzorców oraz przechowywanego i przetwarzanego w korze mózgowej uogólnionego programu ruchowego są zgodne z hipotezą o modułowym sterowaniu ruchami oraz modelem MOSAIC.
PIŚMIENNICTWO • LITERATURE -
-
-
-
-
[1]
Jordan MI, Rumelhart DE: Forward models: Supervised
learning with a distal teacher. Cognitive Science, 1992;
16: 307–354.
[2] Wolpert DM, Kawato M: Multiple paired forward and inverse models for motor control. Neural Networks, 1998;
11: 1317–1329.
[3] Haruno M, Wolpert DM, Kawato M: MOSAIC model for
sensorimotor learning and control. Neural Computation,
2001; 13: 2201–2220.
[4] Miall C: Modular motor learning. TRENDS in Cognitive
Sciences, 2001; vol. 6, no. 1: 1–3.
[5] Anderson JR: Uczenie się i pamięć. Integracja zagadnień. War szawa, Wydawnict wa Szkol ne i Pedagogiczne,
1998.
[6] Miller GA: The magical number seven, plus or minus
two: Some limits on our capacity for processing information. Journal of Experimental Psychology, 1956; 56:
485–491.
[7] Smith EE, Jonides J: Neuroimaging analyses of human
working memory. Proceedings of the National Academy
of Sciences of the United States of America, 1998; 95:
12061–12068,
[8] Hotz A: Qualitatives Bewegungslernen. Bern, Verlag
Schweizerischer Verband für Sport in der Schule (SVSS),
1997.
[9] Kurcz I: Pamięć, uczenie się, język. Warszawa, Wydawnictwo Naukowe PWN, 1995.
[10] Ungerer D: Zur Theorie des sensomotorischen Lernens,
Hofmann, Schorndorf, 1971.
[11] Scholz JP, Schöner G: The uncontrolled manifold concept:
identifying control variables for a functional task. Exp.
Brain Research, 1999; 126: 289–306.
[12] Atkinson R, Shiffrin R: Human memory: A proposed system and its control processes; (w:) Spence K, Spence J
(eds): The psychology of learning and motivation: Advances in research and theory. Vol. 2, New York, Academic
Press 1968.
[13] Bernsztejn NA: O łowkosti i jejo razwitii. Moskwa, Fizkultura i Sport, 1991.
[14] Petryński W: Pamięć i sterowanie ruchami przez człowieka. Antropomotoryka, 2006; 34: 109–120.
[15] Schmidt RA, Lee TD: Motor Control and Learning.
A Behavioral Ephasis, ed. 4. Human Kinetics, 2005.
[16] Imamizu H, Kuroda T, Miyauchi S, Yoshioka T, Kawato
M: Modular organization of internal models of tools in the
human cerebellum. PNAS 2003; vol. 100, no. 9: 14615466,
[17] Kozłowski J, Neuman Ł: Wspomaganie wyszukiwania
dokumentów mapami samoorganizującymi. www.zsi.pwr.
wroc.pl/zsi/missi2002/pdf/s507, 2007.
[18] Salomon G, Perkins DN: Rocky roads to transfer: Rethinking mechanisms of a neglected phenomenon. Educational
Psychologist, 1989; 24(2): 113–142.
– 154 –

Podobne dokumenty