Art 00 - Antropomotoryka

Transkrypt

Art 00 - Antropomotoryka
NR 26
Uczenie się ruchów
ANTROPOMOTORYK A
2003
UCZENIE SIÊ RUCHÓW 1
MOTOR LEARNING
Ernst-Joachim Hossner*, Stefan Künzell**
* dr, Instytut für Wissenschaft Universität Gissen. 353994 Gissen, Kugelberg 62, Niemcy
** dr, Instytut fûr Wissenschaft, Universität Gissen. 353994 Gissen, Kugelberg 62
Słowa kluczowe: antycypacyjne sterowanie zachowaniem się, warunkowanie, swoiste
przewidywanie, programy ruchowe, teorie programowania, teorie regulacji, spoistość
czuciowa, problem niedookreślenia.
Key words: Anticipation behaviour steering, conditioning, specific anticipation, movement programmes, programming theories, regulation theories, sensory consistency,
problem of underdefinition.
STRESZCZENIE • SUMMARY
The term „movement learning” denotes depending on experience, relatively stable changes of competence
to achieving specific goals in specific situations by means of specific actions. Taking this notion as a criterion, it
is possible to divide classic learning theories into two groups. In the classical conditioning or programming
theories, special accent is laid onto stimulus ® response (S-R) relation. On the other hand, in the operational
conditioning or regulation theories, special accent is laid onto response ® effect (R-E) relation. Contemporary
learning theories are rooted in emergent model of movement steering, where the R element results of a given
situation and expected outcome of behaviour (anticipation steering of behaviour, movement programmes). S(R)E
approach seems to be especially convincing not only from the evolution-functional point of view; its legitimacy
results from formalization by means of connectionistic models. For underdefinition, which emerged in the frames
of net modeling, it was presented the proposal of solution resulting of sensory structure formation.
-
-
Terminem uczenie się ruchów określa się zależne od doświadczenia i względnie trwałe zmiany kompetencji
do osiągania w określonych sytuacjach, przez określone zachowanie, określonych celów. Traktując to pojęcie
jako kryterium można podzielić klasyczne teorie uczenia się według szczególnego nacisku albo na zależność
bodziec-reakcja (S_R – stimulus-response; warunkowanie klasyczne, teorie programowania), albo na zależność odpowiedź-skutek (R-E – response-effect; warunkowanie operacyjne, teorie regulacji). Współczesne teorie uczenia się pochodzą z modelu spontanicznego (emergentnego) sterowania ruchami, w którym składnik R
wynika z danej sytuacji i oczekiwanego skutku zachowania (antycypacyjne sterowanie zachowaniem, programy ruchów). Ujęcia S(R)E wydają się szczególnie przekonujące nie tylko z punktu widzenia ewolucyjno-czynnościowego, ale ich zasadność wynika również w formalizacji za pomocą modeli konekcjonistycznych. Dla niedookreślenia, które pojawiło się w ramach modelowania sieciowego, przedstawiono propozycję rozwiązania wynikającego z ukształtowania się struktury czuciowej.
-
– 55 –
-
Przekładu z niemieckiego oryginału pt. „Motorisches Lehrnen” dokonał Wacław Petryński, AWF Katowice , ul. Mikołowska 72a
-
1
Ernst-Joachim Hossner, Stefan Künzell
1. Definicje
-
-
-
-
-
Sytuacje sportowe cechują się w znacznej mierze
tym, że pożądane w danej sytuacji wzorce zachowania nie od razu można urzeczywistnić. Zanim
opanuje się technikę sportową, niezbędna jest raczej dłuższa lub krótsza faza ćwiczeń. Owa faza ćwiczeń zmierza ku zmianie mechanizmów sterowania
ruchami, warunkujących wykonanie ruchu, więc
mówi się w tym przypadku o uczeniu się ruchów
ruchów.
W niniejszym artykule jest mowa o takich właśnie
procesach uczenia się ruchów.
Według definicji, uczenie się ruchów – to uwarunkowana doświadczeniem, stosunkowo trwała
zmiana kompetencji do osiągania określonych celów w określonych sytuacjach przez określone zachowanie (ruchowe). Z takiej definicji pojęcia uczenia się ruchów wynikają następujące wnioski:
1. Przejściowe zmiany w zachowaniu – np. takie,
które można odnieść do odbioru bodźców zewnętrznych – nie odpowiadają definicji uczenia
się. Na pytanie, czy dane zachowanie dotyczy
jedynie aktualnej czynności, czy też prowadzi do
trwałego uczenia się, można odpowiedzieć dopiero po przerwie (okresie retencji).
2. Pojęcie „zmiana” należy rozumieć obojętnie, co
oznacza, że za przejaw procesu uczenia się należy uważać również względnie trwałe obniżenie
umiejętności.
3. Powyższe definicje oznaczają, że uczenie się jest
zależne od doświadczenia. Wykluczają zatem
zmiany, które można przypisać procesom dojrzewania lub wzrostu, lub też dostosowaniom fizjologicznym, będących skutkami bodźców treningowych.
4. Kiedy jest mowa o zmianie kompetencji zakłada
się, że możliwości zachowania, które tworzą owe
kompetencje, nie muszą zostać bezwzględnie
wykorzystane, ale mimo to można je uważać za
skutki procesu uczenia się.
5. Określenie „ruchowy” oznacza, że omawiany
skutek uczenia się odnosi się do wewnętrznych
procesów kierowania ruchami. Ponieważ procesy te wiążą się z sytuacjami, zachowaniami i skutkami oznacza to, że również zmienione kompetencje czuciowe postrzegania sytuacji i skutków
zachowania się mają wpływ na kierowanie ruchami. Pojęcie „uczenie się ruchów” oznacza
właściwie uczenie się czuciowo-ruchowe lub –
jeśli przeciwnie rozłożymy akcenty – uczenie się
ruchowo-czuciowe.
6. Kiedy w nauce o sporcie jest mowa o uczeniu
się ruchów, rozumie się pod tym pojęciem z re-
guły zmianę swoistego zachowania, czyli zmia2
nę tak zwanej umiejętnośc
umiejętności (Fertigkeit). Natomiast zmianę ogólnych przesłanek czynności ruchowych, czyli zdolności (Fähigkeit), wiąże się
raczej z pojęciem treningu.
Jak wygląda rozgraniczenie uczenia się ruchów
od uwarunkowanych uczeniem się zmian zachowania będących skutkami procesów poznawczych,
motywacyjnych i uczuciowych? Rozgraniczenie takie jest trudniejsze niż się może wydawać na pierwszy rzut oka, gdyż, co oczywiste, każdy objaw ruchowy – również taki, który można odnieść do wyższych procesów nerwowych – zachodzi wraz z aktem ruchowym. Czynność człowieka można zatem
modelować jako współdziałanie procesów zachodzących na różnych płaszczyznach hierarchii planowania i sterowania, przy czym określony akt ruchowy obserwuje się na najniższej płaszczyźnie w hierarchii; opis modelowania teoretycznego można
znaleźć u Nitscha [1], natomiast opis modelowania
samej czynności – u Hackera [2]. Za ważną cechę
takiego wielopłaszczyznowego modelu Bernsztein
[3] uważa zmianę głównego poziomu sterowania.
Pozostając w zgodzie z koncepcjami modeli sterowania ruchami opisanymi w rozdziałach o psychologii i neurologii, pragniemy jednak szczególnie
uwypuklić zrozumienie wyobrażeń w uczeniu się
ruchów, nie kwestionując przy tym bezspornych
wpływów wyższych procesów nerwowych. Głównym tematem rozważań powinny więc być takie
aspekty względnie trwałych zmian zachowania, które
dotyczą ruchowego urzeczywistnienia już ustalonego zamiaru. Po krótkim przeglądzie w pkt. 2 obecnego stanu naukowych badań uczenia się ruchów,
w pkt. 3 objaśniamy rolę uczenia się ruchowego dla
ustroju, aby wywieść stąd konsekwencje dla tworzenia modeli. W pkt. 4 zostanie przedstawiony formalny opis takich modeli. Przedstawiono też oryginalną
próbą rozwiązania wykrytego przy tej okazji problemu niedookreślenia. Powyższe rozważania zaprezentowono ponownie w pkt. 5, ale w postaci bardzo
przystępnego przykładu.
2. Uczenie się ruchów jako przedmiot naukowych badań ruchu
Z punktu widzenia nauki o ruchach człowieka problem uczenia się ruchów obejmuje zarówno badanie wpływu różnych zmiennych czynników oddziałujących na przebieg uczenia się ruchów, jak i teo2
W nawiasach podano zgodnie z oryginałem określenia
w języku niemieckim.
– 56 –
Uczenie się ruchów
retyczne opracowanie uzyskanych danych doświadczalnych. Jeśli idzie o pierwsze z wymienionych zagadnień, istnieje wiele danych pochodzących z badań psychologicznych, dotyczących podstaw analizowanych procesów, oraz sportowych, dotyczących
zastosowań praktycznych zdobytej wiedzy (por.
Wiemeyer).
W drugim z wymienionych obszarów badań
mamy do czynienia z następującymi dwoma podstawowymi problemami:
1. Teoretyczna strukturalizacja czasowa procesu
długotrwałego uczenia się. Najbardziej znany jest
tu podział według aspektów zbornościowych
zgodnie z zaproponowaną przez Meinela i Schnabla [4] koncepcją kolejnych faz. Zakłada ona trójetapowy proces, obejmujący kolejno (1) nabywanie zborności zgrubnej, (2) nabywanie zborności dokładnej i (3) nabywanie zborności dokładnej ustalonej, a także łatwość korzystania
z nich w zmiennych warunkach otoczenia.
W praktyce sportowej istnieje też podział na
uczenie się od nowa i doskonalenie umiejętności ruchowych, z „automatyzacją” jako ważnym
aspektem tego doskonalenia.
2. Opracowywanie teorii uczenia się, wyjaśniających obserwowane zmiany zachowania. Co się
dzieje, gdy ludzie uczą się umiejętności ruchowych lub doskonalą je? Właśnie to pytanie stanowi główny temat rozważań w tym artykule.
Na początku niniejszej pracy uczenie się ruchów
określono jako zależne od doświadczenia i względnie trwałe zmiany kompetencji do osiągania określonych skutków w określonych sytuacjach przez
określone zachowanie. W takiej definicji zestawia
się działania ruchowe (ang. response, R) z jednej strony z uwarunkowaniami sytuacyjnymi (ang. stimulus,
S), z drugiej zaś – z wynikającymi z owych działań
zmianami sytuacji (ang. effect, E).
Jak pokazano w tabeli 1, składniki te można wykorzystać jako kryteria podziału teorii uczenia się.
Pierwsze kryterium porządkujące wynika z pytania,
czy w danej teorii szczególnie wiele uwagi poświęca się związkowi bodziec-reakcja (SR), czy bodziecodpowiedź (RE). Czy zatem do jakiegokolwiek aktu
ruchowego dochodzi przede wszystkim dlatego, że
powoduje to dana sytuacja (S Þ R), czy też z chęci
osiągnięcia określonego skutku (R Þ E)? Drugie z
wymienionych kryteriów zawiera podstawowe pytanie: czy teoria zakłada istnienie wewnętrznego
mechanizmu sterującego, czy też nie? Podstawą
panującego w I połowie XX wieku behawioryzmu
było przeświadczenie, że takie założenia opierają się
jedynie przypuszczeniach i dlatego nie są dozwolone z naukowego punktu widzenia. Zamiast tego rozważano jedynie obserwowalne z zewnątrz powiązania, a ewentualne aspekty poznawcze przesuwano do bliżej nie określonej „czarnej skrzynki”. Druga połowa XX wieku przyjęła dokładnie przeciwne
założenie: że zachowania ludzi można zrozumieć
jedynie wtedy, gdy tworzone teorie będą uwzględniały również wewnętrzne procesy sterowania ruchami w sferze poznawczej. Pytanie, czy nawet najdrobniejsze szczegóły ruchu powinny być sterowane ośrodkowo, czy też raczej przebiegają samorzutnie w zależności od warunków zewnętrznych – czyli
bez konieczności sterowania ośrodkowego – pozwoliło na podział poznawczych teorii uczenia się na
teorie o charakterze recept (teorie planowania, prescriptive theories) oraz mówiące o samorzutnym pojawianiu się danego zachowania w toku nieustannego rozwoju (teorie spontaniczności, emergent theories). Istota tego rozróżnienia zostanie dokładniej
omówiona poniżej.
Tabela 1. Wybrane teorie uczenia się uporządkowane według najważniejszej zależności tłumaczącej zachowanie oraz według przyjętego mechanizmu sterującego.
Table 1. Selected learning theories according to most important relation explaining the behaviour and specific steering mechanism
Mechanizm steruj¹cy
Steering mechanism
bodziec – odpowiedŸ (S Þ R)
stimulus Þ response (S Þ R)
odpowiedŸ – skutek (R Þ E)
response Þ effect (R Þ E)
„czarna skrzynka”
„black box”
warunkowanie klasyczne
(np. Paw³ow)
classical conditioning
(e.g. Pavlov)
warunkowanie operacyjne
(np. Thorndike)
operational conditioning
(e.g. Thorndike)
teorie planowania prescriptive
theorie
uczenie siê wed³ug programów (np. Schmidt)
programming learning
(e.g. Schmidt)
uczenie siê wed³ug cykli regulacyjnych
(np. Adams) closed-loop theory of motor
learning (e.g. Adams)
-
Najwa¿niejsza zale¿noœæ
Most important relation
teorie spontanicznoœci
emergent theories
uczenie siê S(R)E (np. Munzert, Hoffmann)
learning S(R)E (e.g. Munzert, Hoffmann)
– 57 –
-
-
-
-
-
Ernst-Joachim Hossner, Stefan Künzell
W obrębie behawioryzmu można zasadniczo
wyróżnić dwa mechanizmy uczenia się. W przypadku warunkowania klasycznego
klasycznego, w istniejącym już
związku bodziec-odpowiedź bodziec bezwarunkowy zostaje zastąpiony bodźcem obojętnym, przy
czym ten drugi podawany jest z wystarczającą regularnością w czasowym sąsiedztwie pierwszego. Typowym przykładem tego rodzaju uczenia się jest pies
Pawłowa [5], u którego ślinotok (odpowiedź, odruch
bezwarunkowy) po okresie równoczesnego podawania jedzenia (bodziec bezwarunkowy) i rozlegania się dźwięku (bodziec warunkowy) pojawia się
również wówczas, gdy zabrzmi jedynie dźwięk (odpowiedź, odruch warunkowy). Według teorii warunkowania klasycznego określone zachowanie jest
wyzwalane według reguł bodziec-odpowiedź, natomiast w przypadku warunkowania operacyjnego
podstawowymi powiązaniami są związki odpowiedźskutek. W przypadku tego mechanizmu samorzutnie pojawiające się zachowanie zostaje wzmocnione nagrodą. W wyniku zaspokojonej w ten sposób
potrzeby, zgodnie z „prawem skutku” (Law of Effect;
Thorndike, [6]) zostaje utrwalone odpowiednie powiązanie odpowiedzi i skutku (R-E), a więc rośnie
prawdopodobieństwo powtórzenia się tego zachowania. W przypadku warunkowania operacyjnego
najważniejszą rolę odgrywają zatem kary i nagrody
(wzmocnienia ujemne i dodatnie).
W przeciwieństwie do założeń behawiorystycznych, teorie poznawcze uczenia się opierają się
na założeniu, że ważne są nie tylko składniki S-R-E
obserwowane w zachowaniu „z zewnątrz”, lecz również odwzorowania wewnętrzne owych składników.
Uznanie za najważniejsze, warunkujące dane zachowanie, powiązania S-R oznacza, że rozpoznany wewnętrznie bodziec, któremu nadaje się określone
znaczenie, uruchamia mechanizm wewnętrzny,
wywołujący podstawowy wzorzec zachowania. Niezbędna do tego struktura sterująca przybiera postać
programu, utworzenie owej struktury określa się
więc jako uczenie się programowe
programowe. Klasycznym
przykładem tego kierunku myślenia jest teoria schematu Schmidta [7]. Należy jednak podkreślić jej
ważne ograniczenie: model ten można określić mianem „teorii uczenia się programowego” jedynie przy
założeniu, że wzorce, które należy przyswoić, można postrzegać jako składniki niezbędne dla realizacji programu ruchowego; samo przyswojenie takiego programu nie jest jednak tematem teorii. „Uogólnione” programy ruchowe powinny, według
Schmidta, sterować całą klasą ruchów, np. tenisowym forhendem ze wszystkimi jego odmianami.
Niezmiennymi cechami programu są dynamiczne i
czasowe zależności między podnietami ruchowy-
mi dla poszczególnych mięśni. Jak szybko i z jaką
siłą bezwzględną wykona się uderzenie, określa
przypisany do programu schemat odtwarzania, w
którym „zmagazynowane są” regularne powiązania
dotychczasowych zmiennych sterujących (parametrów) programu, dotychczasowych warunków początkowych i dotychczasowych skutków ruchu. Takie „zmagazynowanie” powinno mieć charakter
schematu, również oderwanego od pojedynczych
doświadczeń. Jednym z ważnych wniosków wynikających z teorii schematu Schmidta jest więc to, że
jeśli idzie o parametryzację programu, zmienne
warunki wykonania czynności w porównaniu z warunkami stałymi oddziałują korzystnie na jakość skutków uczenia się.
Teoria schematu Schmidta jest przykładem uzasadnienia zachowania się człowieka, podkreślającego zależność S-R, gdyż według tego modelu bezpośredni bodziec ruchowy zawsze daje się wytłumaczyć uruchomieniem i parametryzacją (przypisywaniem konkretnych wartości poszczególnym
parametrom – przyp. tłum.) programu ruchowego.
Kontrola, czy wskutek tego rzeczywiście wystąpi
pożądany skutek, odgrywa u Schmidta jedynie drugorzędną rolę w ramach poprawy błędu lub oceny
ruchu, nie wyzwalając bezpośrednio określonego
zachowania. Dokładnie przeciwnie wygląda sprawa
w przypadku teorii regulacji Adamsa [8], w którym
głównym czynnikiem kontrolnym jest tzw. ślad postrzeżeniowy (perceptual trace). Powinna się w nim
zawierać całość informacji zwrotnych wynikających
z wykonania ruchu, natomiast niezależny od niego
ślad pamięciowy, będący pierwotnym programem
ruchowym, służy jedynie do zapoczątkowania ruchu.
Bezpośrednie sterowanie ruchem powinno jednak
zawsze opierać się na porównaniu odbieranej informacji zwrotnej o wartości bieżącej (Istwert) z
wartością pożądaną (Sollwert), które w toku procesu uczenia się wynika z coraz mocniejszego śladu
postrzeżeniowego. Czynności są więc – w odróżnieniu od modelu Schmidta – nie tyle wyzwalane, co
wykonywane dopóty, dopóki według analizy wewnętrznej nie osiągnie się dostatecznej zgodność
wartości pożądanej i wartości bieżącej. Ponieważ
bezpośrednimi wielkościami kontrolnymi są oczekiwane skutki czuciowe, czyli skutki ruchu, więc teoria regulacji Adamsa stanowi dobry przykład wytłumaczenia zachowania ruchowego typu R-E, a zarazem przykład spojrzenia na proces uczenia się jako
na proces regulacji cyklicznej
cyklicznej.
Choć teoria schematu Schmidta i teoria regulacji Adamsa różnią się co do oceny ważności związku bodziec-reakcja i bodziec-odpowiedź, to jednak
wykazują wyraźne podobieństwo w tym, że zakła-
– 58 –
Uczenie się ruchów
-
-
-
-
-
dają, iż nawet najdrobniejsze szczegóły ruchu sterowane są ośrodkowo – bądź za pomocą programu,
bądź regulacji wartość bieżąca–wartość pożądana.
Wnikając głęboko w istotę tego zagadnienia można
stwierdzić, że pod tym względem od początku lat
dziewięćdziesiątych XX wieku w teoriach planowania („vorschreibende” Theorien, präskriptive Theorien)
nic poważnego się nie wydarzyło.
Przeciwne podejście, określone mianem spontaniczności (Emergenz), ma do odnotowania jeszcze mniejsze sukcesy. Podstawowe założenie tego
opisu brzmi, że zachowanie wynika z warunków
brzegowych, bez konieczności istnienia jakiegokolwiek ośrodkowego mechanizmu sterującego. Model pośredni między planowaniem a spontanicznością mógłby wynikać z założenia, że niezmienniki są
określane przez schemat, natomiast parametryzacja
– przez warunki brzegowe, wynikające np. z różnych
aspektów środowiska i z tego powodu nie dających
się ustalić poznawczo. Jak wykazuje Munzert [9] w
swojej koncepcji schematu ruchowego; zgodnie z
jego założeniami ośrodkowe sterowanie może się
ograniczać do topologicznych cech przebiegu ruchu. Takie właściwości jakościowe dobrze zgadzają
się z opisanymi przez Bernsteina [10], np. pożądaną
kolistością czy określoną liczbą punktów skrzyżowania torów ruchów. Ilościowe, metryczne szczegóły
ruchu – np. promienie, kąty lub odległości – powinny natomiast wynikać z więzów (Gibson, 1982), czyli z cech otoczenia bezpośrednio ograniczających
liczbę stopnie swobody tak bardzo, że wynika z tego
jednoznaczny tor ruchu (por. również Nitsch, Mun3
zert, [11]) .
W takim ujęciu spontaniczności nie należy więc
utożsamiać z wyobrażeniem, że ruch przebiega „sam
z siebie”. W szczególności należy więc założyć, że
odpowiedzi czuciowo-ruchowe (składniki R) dochodzą do skutku w zależności od uwarunkowań
sytuacyjnych i celów, do których się dąży. W odróżnieniu od modeli planowania przyjmuje się jednak
założenie, że w danej sytuacji nakierowany na osiągnięcie pewnego skutku zamiar wystarcza, by spowodować odpowiednie zachowanie. Składowa R
tkwi zatem niejako w uwarunkowanych wolicjonal3
Na pierwszy rzut oka wydaje się, że użyte przez Gibsona
określenie affordances należałoby utożsamić z terminem constraints, czyli ze znanymi z mechaniki więzami. Dokładniejsza
analiza znaczenia angielskich słów afford i affrodences prowadzi jednak do wniosku, że więzy są czynnikiem ograniczającym możliwości ruchu przez istniejące stopnie swobody, natomiast affordances – czynnikiem umożliwiającym lub wręcz
wymuszającym ruch wewnątrz istniejącego w danej chwili
układu stopni swobody. Wprawdzie w tłumaczeniu używam
słowa więzy, ale sprawa polskiego odpowiednika słowa affordances czy Affordanzen pozostaje otwarta (przyp. tłum.)
nie powiązaniach S-E, nie ma więc większego sensu zaliczanie tego rodzaju ujęć do ściśle rozgraniczonych wyjaśnień zachowań typów SR czy RE.
Najważniejsze wydaje się tu założenie, że procesy
uczenia się ruchów są w istocie nakierowane na
budowanie trójdzielnych związków S(R)E (por. [12]).
Hipotetyczny mechanizm uczenia się S(R)E można
znaleźć w modelu antycypacyjnego sterowania
zachowaniem Hoffmanna [13, 14]. Zakłada się w
nim, że po pomyślnym zakończeniu jakiegoś aktu
ruchowego zawsze zostaje przeprowadzone porównanie skutków rzeczywistych z przewidywanymi. W
procesie pierwotnego uczenia się powiązania R-E
zostają w przypadku potwierdzonych przewidywań
wzmocnione, a przy niepotwierdzonych – osłabione (R prowadzi do E lub R nie prowadzi do E). Wtórne uczenie się sprowadza się do tego, że powiązania R-E ulegają różnicowaniu w zależności od powstałej sytuacji (w pewnych warunkach S prowadzi
R do E, względnie w pewnych warunkach S nie prowadzi R do E). Bardzo podobną propozycję można
znaleźć w dwustopniowym modelu uczenia się Elsnera i Hommela [15], którzy również wychodzą z
modelu kształcenia stopniowego, tworzącego najpierw powiązania R-E, a następnie S(RE). W obu
przypadkach skutkiem procesu uczenia się są struktury koordynujące, które umożliwiają wzrost pewności przewidywań, w jakich warunkach, jakie zachowanie prowadzi do jakich skutków. Ponieważ
przy takim ujęciu zakłada się reprezentację wewnętrzną postrzegania sytuacji i przewidywania skutków, więc proponowany mechanizm uczenia się
można zaliczyć do modeli poznawczych. Mechanizm
ten jest jednak o tyle spontaniczny, że owe odwzorowania wystarczają, by umożliwić określone zachowanie bez konieczności ośrodkowego przechowywania szczegółów ruchu.
3. Uczenia się ruchów – aspekt czynnościowy
Po co się w ogóle uczymy? O co właściwie chodzi w
uczeniu się ruchów? Kiedy stawia się podstawowe
pytania tego rodzaju, wkracza się w obszar tematyczny analizy czynnościowej tego zakresu tematów (por. [16]). Wynikającą z niej perspektywę można łatwo objaśnić na podstawie naszkicowanych w
poprzednich rozdziałach teorii uczenia się. Przy dokładniejszym rozważeniu obu teorii planowania (preskryptywnych) okazuje się, że nie ma tu odpowiedzi
na pytanie „po co?”. Zamiast tego otrzymuje się
obrazowe przenośnie
przenośnie: uczenie się ruchów odpowiada nabywaniu programów ruchowych, względnie
magazynowaniu cykli regulacyjnych. Natomiast w
modelu antycypacyjnego sterowania zachowaniem
– 59 –
-
-
-
-
-
Ernst-Joachim Hossner, Stefan Künzell
Hoffmann proponuje rozsądny mechanizm uczesię. Powinny z niego wynikać struktury sterująnia się
ce, umożliwiające osiąganie coraz większej pewności w przewidywaniach, w jakich warunkach, jakie
zachowanie prowadzi do jakich skutków. Jest oczywiste, że taka pewność w zachowaniu umożliwia
przeżycie. Procesy uczenia się pełnią więc ważną
funkcję ewolucyjną. Trudno natomiast odpowiedzieć na pytanie, jaki jest głębszy sens rozszerzania
się zakresu sterowania programowego czy regulacyjnego.
Jeżeli jeszcze dokładniej przyjrzymy się zjawisku
uczenia się (ruchów), to stanie się jasne, że w ewolucji można rozróżnić dwa równoległe mechanizmy
narastającego dopasowywania się do istniejących
warunków otoczenia. Pierwszy mechanizm dotyczy
filogenezy
rozwoju gatunkowego (filogenezy
filogenezy) i działa przez
procesy różnicowania i doboru. Organizmy lepiej
dopasowane do otoczenia mają więcej szans na
przekazanie swych genów potomności. Drugi mechanizm steruje rozwojem pojedynczego osobnika
ontogenezą
(ontogenezą
ontogenezą). Można go określić mianem przeciwstawnego w tym sensie, że zdolne do uczenia się
organizmy nie są lub przynajmniej nie są całkowicie wyposażone w pełne „oprogramowanie”, które
sprawdziło się w poprzednich pokoleniach, ale raczej są zdolne jedynie do dopasowywania swojego
sposobu zachowania do krótkotrwałych zmian w
środowisku. W przypadku zdolności do uczenia się
chodzi więc o medal o dwóch stronach. Ukształtowane gatunkowo funkcje, które wskutek swej wielkiej ważności są od urodzenia „sztywno zaprogramowane”, mają zaletę skuteczności od samego początku i z reguły nieskomplikowany układ nerwów
realizujących te funkcje, ale zarazem tę wadę, że
zapewniają niewielką zdolność do dopasowywania
się do zmiennych warunków otoczenia. Z drugiej
strony ceną osobniczych procesów uczenia się jest
początkowa bezbronność organizmu, gdyż wymagają one zazwyczaj stosunkowo złożonej struktury
nerwowej. Mają za to zwiększoną możliwość dopasowywania się w okresie życia, a u człowieka ponadto niezwykłą zdolność dopasowywania środowiska do jego własnych potrzeb.
Druga linia rozwoju gatunku ludzkiego obejmuje doskonalenie organizacji „wyposażenia” biologicznego. Pod pojęciem „organizacja” rozumiemy
tu połączenie mnóstwa komórek składających się na
jeden ustrój, w którym poszczególne narządy wypełniają określone zadania. Porównanie „wyposażenia” człowieka i niższych istot, jak – w skrajnym
przypadku – jednokomórkowca, ujawnia ważną
przewagę człowieka w odniesieniu zarówno do
możliwości odwzorowywania wycinków otoczenia,
jak i oddziaływania na środowisko za pomocą układu ruchowego, które ponadto u człowieka są z reguły nakierowane na osiąganie celów i mierzalnych
skutków. Warunkujący tę przewagę wysoki stopień
organizacji wymaga wewnętrznych mechanizmów
zbornościowych i sterujących (w nazewnictwie psychologicznym „odwzorowań” lub „reprezentacji”),
które z punktu widzenia neurobiologii są powiązane przede wszystkim z procesami w ośrodkowym
układzie nerwowym. Takie minimalne wyposażenie
obejmuje po pierwsze kanały kontaktu ze środowiskiem – a zatem „przetworniki” czuciowe (Transduktoren) i wykonawcze narządy ruchowe (Effektoren),
które zapewniają przekształcenie informacji z otoczenia do postaci odpowiedniej dla ośrodkowego
układu nerwowego, by mogły w nim powstać podniety ruchowe, po wtóre – nadrzędne układy wewnętrzne, odpowiedzialne za określenie celów i ocenę osiągniętych skutków i w których wytwarzają się
podrzędne czuciowo-ruchowe struktury sterujące.
Zgodnie ze sformułowanym w pierwszej części
ścisłym określeniem pojęcia „ruchowy”, dalsze wywody ograniczą się do analizy podrzędnych sterujących struktur czuciowo-ruchowych. W niniejszym
artykule ograniczenie to może się początkowo wydać dziwne, gdyż niezwykłość procesów uczenia się
u ludzi w sposób oczywisty odnosi się do właściwości warstw nadrzędnych. Na przykładzie sportu: jedynie ludzie potrafią ocenić osiągnięty wynik – na
przykład czas biegu na 100 metrów – w kontekście
jego wartości w toku długotrwałego treningu. Również jedynie ludzie w ogóle stawiają sobie takie
sztuczne cele, jakie są typowe w sporcie – produkt
ewolucji kulturalnej, nie zaś naturalnej. Czy w takim
kontekście warto w ogóle rozważać uczenie się ruchów w powiązaniu z ewolucją? Owszem – gdy
uwzględni się fakt, iż szczególne osiągnięcia, obserwowane we wczesnym okresie rozwoju człowieka,
nie mogą być skutkiem jakościowych zmian w sterujących strukturach czuciowo-ruchowych. Innymi
słowy: Nie ma żadnego powodu, by przyjąć, że sterowanie czuciowo-ruchowe człowiek „odkrywa” od
nowa. Może być raczej tak, że cechy sterowania czuciowo-ruchowego stanowią warunki brzegowe dla
rozwoju kulturowego. Na przykładzie sportu: ukształtować mogą się tylko takie dyscypliny sportu, które
można opanować na podstawie istniejącego „wyposażenia”, przyrodniczo-ewolucyjnego, a z drugiej
strony istnieje pewne „wyposażenie”, filogenetyczne, które owo opanowanie umożliwia. Jeśli idzie o
podrzędne procesy sterowania czuciowo-ruchowego – i tylko dla tych podrzędnych procesów – w
dalszych rozważaniach będziemy wychodzić z założenia, że nie istnieją żadne zasadnicze różnice mię-
– 60 –
Uczenie się ruchów
dzy ludźmi i np. innymi ssakami. Konieczne jest jednak uwzględnienie również tego, że nadrzędne wyznaczanie celów i ocena skutków wyglądają zupełnie inaczej u ludzi niż u przedstawicieli innych gatunków. Rozważane będzie jedynie to, jak owe cele
i oceny oddziałują na utworzenie czuciowo-ruchowych warstw sterujących, nie zaś same procesy wyznaczania celów i oceny skutków.
-
-
-
-
-
4. Uczenie się ruchów – ujęcie formalne
W pkt. 2 wyjaśniliśmy, że nowoczesne teorie uczenia się wychodzą z założenia, iż czynności ruchowe
wyłaniają się spontanicznie z bieżącej sytuacji w środowisku, wskutek czego osiąga się pożądany skutek
(por. tab. 1). Właściwości spontaniczne powstają
wskutek oddziaływania licznych składników układu
dynamicznego, przy czym poszczególne składniki ani
nie mają tej cechy, ani też nie są włączane do układu :z zewnątrz”. Ich powstanie pozostawałoby więc
tajemnicze, gdyby nie dało się ich opisać w sposób
formalny lub przedstawić w postaci symulacji. W tym
celu opracowano kilka modeli uczenia się ruchów,
w których właściwości układów dynamicznych
przedstawiono w postaci sformalizowanych równań
matematycznych [17]. Przy użyciu symulacji wykazano też, że ułożone układy równań są rozwiązywalne i że właściwości spontaniczne rzeczywiście z nich
wynikają [18].
W dalszych rozważaniach chodzi o kontynuowanie w pewien sposób zapoczątkowanej w poprzednich podrozdziałach analizy czynnościowych aspektów sterowania ruchami. Ustalono wówczas, że w
przypadku uczenia się S(R)E opisano przekonujący
mechanizm uczenia się z perspektywy rozwojowoczynnościowej. Po rozważeniu pytania „Po co?”,
całkowita analiza funkcjonowania obejmuje również
wykazanie, iż mechanizmy, które można uznać za
przekonujące, faktycznie działają. W niniejszym pkt.
wyjaśnimy, jak uczenie się ruchów może pojawić
się jako proces spontaniczny. Ponieważ niezbędne
formalizacje zawsze będą odnosiły się do układów
dynamicznych, mowa będzie nie o „organizmach”
czy o „przedmiotach analizy”, ale będziemy używać
obojętnego pojęcia „ustrój”. Omawiane w tekście
formalizacje zostaną dokładniej przedstawione w
ramkach-dygresjach. Ci spośród Czytelniczek i Czytelników, którzy nie przepadają za wzorami i schematami, mogą je pominąć i przejść do dalszego tekstu.
Zachowanie ustroju dynamicznego zależy zarówno od jego stanu, jak i oddziałujących nań sił. Sterowanie ruchami oznacza więc, że nasz ustrój czuciowo-ruchowy celowo oddziałuje na układ otoczenia.
Patrząc przez pryzmat teorii sterowania, ów ustrój
czuciowo-ruchowy można zatem określić mianem
członu sterującego, zaś otoczenie, które ma być „sterowane” – mianem przestrzeni działania. Do tego
celu nasz ustrój wykorzystuje siły wywierane wskutek ruchów (czyli, w nazewnictwie psychologicznym,
odpowiedzi). Otoczenie oddziałuje na ów ustrój również przez siły (w nazewnictwie psychologicznym –
bodźce). Problem uczenia się ma zatem dwa oblicza. Po pierwsze – stan otoczenia jest nieznany, ale
musi zostać odtworzony w naszym umyśle (postrzeżony) na podstawie działających sił. Po wtóre – nie
wiadomo, jakie skutki w wyniku jakich odpowiedzi i
w jakich warunkach zostaną spowodowane.
Do pierwszego problemu powrócimy później.
Drugi – sterowanie nieznanym ustrojem dynamicznym – jest przedmiotem wytężonych badań. Potężnym narzędziem rozwiązania jest strategia sterowania za pomocą modelu wewnętrznego (internal
model control) [19]. W tym celu buduje się wewnętrzny model sterowanego układu, który służy do przewidywania, jakie działania członu sterującego będą
oddziaływały na jakie zadania w przestrzeni działania. Można też dzięki niemu wewnętrznie przewidzieć błąd zanim wydarzy się on w rzeczywistości.
W opisywanym przypadku nasz ustrój musi się nauczyć modelu otoczenia, aby z jego pomocą móc
przewidywać, jakie jego odpowiedzi, przy jakich
postrzeżonych warunkach otoczenia, jakie będą
miały skutki. Model ten nazwany jest w teorii steromodelem prostym
wania „modelem
prostym” (Vorwärtsmodell, direct
model). Można zauważyć, że zawiera nie tylko błąd
przewidywany, ale informację zwrotną o różnicy
między skutkami faktycznymi a przewidywanymi.
Jordan [17] zdołał wykazać, że dla problemu uczenia się ruchów poprzez ruchy, którymi nie mogą sterować informacje zwrotne, zawodzą strategie rozwiązań nie zawierające wewnętrznego modelu prostego.
Celem uczenia się ruchów nie jest jednak poprawne przewidywanie zachowania się otoczenia,
ale zmienianie go odpowiednio do własnych potrzeb. Pożądany stan otoczenia powinien zostać osiągnięty dzięki odpowiedzi środowiska. Trzeba zatem
odpowiednio nauczyć człon sterujący. Ponieważ jednak dynamika otoczenia nie jest znana, przy danym
błędzie zachowania nie wiadomo, co mianowicie
należy zmienić w ruchu, by zmniejszyć ów błąd. Przy
uczeniu się sterowanym z zewnątrz (distal überwachte Lernen, distal controlled learning) [18] problem ten jest dokładnie rozwiązywany za pomocą
modelu prostego, w którym na podstawie zmian
podniet ruchowych (Efferenzen) ocenia się zmiany
w otoczeniu. Błąd zachowania, tzn. różnica między
– 61 –
-
-
-
-
-
Ernst-Joachim Hossner, Stefan Künzell
pożądanym i rzeczywiście uzyskanym stanem otoczenia, za pośrednictwem modelu prostego zostaje
przekształcony w błąd podniet ruchowych, czyli różnicę między podnietami ruchowymi pozwalającymi osiągnąć cel a podnietami faktycznymi. Nie chodzi przy tym bezwzględnie o to, aby właściwie przewidzieć zmiany ilościowe. Nierzadko do tego, by
umożliwić uczenie się, wystarczy jedynie kierunek
zmian. Modelu prostego nie trzeba się więc wyuczyć
doskonale, ale jedynie w przybliżeniu. Jeżeli człon
sterujący jest wyuczony, odpowiada modelowi odwrotnemu (inverse Modell, inverse model). Gdybyśmy chcieli opisać oba modele językiem nauki o sporcie, wówczas model odwrotny byłby bliski modelowi sterowania ruchami, natomiast model prosty
należałoby powiązać z wyobrażeniem lub wyczuciem ruchu [20].
Należy zauważyć, że istnieje wiele właściwych
odpowiedzi, aby dysponując obrazem postrzeganego stanu otoczenia osiągnąć pożądany stan tego
otoczenia. Mieści się w tym problem stopni swobody (Problem der Freiheitsgrade, degrees of freedom problem), sformułowany po raz pierwszy
przez Bernszteina [1] i zwany „problemem Bernsztejna”. Pojawia się on jednak tylko wówczas, gdy
chodzi o to, by z mnóstwa możliwych rozwiązań
ustalić jedno, ściśle określone. W przypadku rozważanego tu ujęcia spontanicznego, jedno z możliwych rozwiązań wynika w sposób oczywisty z
dynamiki ustroju. Niedookreślenie jest więc pewnym ułatwieniem. W dalszych krokach uczenia się
można wskutek uwzględnienia dodatkowych warunków brzegowych znaleźć rozwiązanie optymalne. Jest to tym trudniejsze, im mniej istnieje stopni swobody.
Jak więc wygląda – powracając do pierwszego z
wymienionych problemów uczenia się – zagadnienie wewnętrznej konstrukcji stanu otoczenia na podstawie oddziałujących na ustrój bodźców? W dotychczasowych rozważaniach przyjęliśmy milczące założenie, że ten problem już został rozwiązany, gdyż
postrzeganie „rzeczywistego” stanu otoczenia jest
zawsze bez błędu, czyli pomijamy ewentualne błędy postrzegania. W przedstawionym w podrozdziale 2 modelu Hoffmanna, opisującym przewidywanie zachowania się, wychodzi się z dokładnie odwrotnego założenia: że błąd zachowania wynika nie
z błędnego ruchu, lecz z niedostatecznie różnicującego postrzegania. Wynika stąd, że w mechanizmie
opisanym przez Hoffmanna niezgodność skutku
przewidywanego i rzeczywistego powoduje zmianę
postrzegania otoczenia, natomiast u Jordana i Rumelharta w takiej samej sytuacji musi ulec dostosowaniu składowa ruchu.
Ponownie pojawia się tu problem niedookreślenia [22, 23], gdyż powstaje pytanie, jak ustrój ma
rozpoznać, czy błąd zachowania jest spowodowany
błędem postrzegania (rozpoznania), błędem przewidywania (planowania), czy też błędem ruchu (wykonania)? Problem ten był dotychczas w literaturze
traktowany po macoszemu, nie przedstawiano też
propozycji jego rozwiązań. Zdaniem autorów, obiecujący sposób jego rozwiązania mógłby polegać na
tym, że ustrój odkrywa nieustannie pojawiające się,
swoiste dla danych cech, zgodności bodziec-sytuacja. W pierwszym przybliżeniu można do tego wykorzystać zgodność między bodźcami „nieczuciowymi”, wewnątrzpochodnymi (interozeptiv), a bodźcami zewnątrzpochodnymi (exterozeptiv). Wnioski formułuje się przy tym jedynie na podstawie bodźców
„nieczuciowych”. Von Holst i Mittelstaedt [24] zajmowali się zagadnieniem zmian na siatkówce oka
powodowanych przez odbierane bodźce. Okazało
się, że są one różnie interpretowane w zależności
od tego, czy porusza się otoczenie, czy oczy. Uczeni
doszli do wniosku, że zmiany obrazu na siatkówce
wynikające z ruchu oczu można przewidywać na
podstawie podniet ruchowych przesyłanych do mięśni oka. Może się to dokonać przez przetworzenie
zestawu podniet ruchowych (Efferenzkopie, efferent
copy), bez wykorzystywania czuciowych informacji
zwrotnych. Przetwarzanie zestawów podniet ruchowych zwane jest „nieczuciową informacją zwrotną”
[24]; wynika stąd pozornie paradoksalne pojęcie
„bodźca nie-czuciowego” (nicht-sensorischer Stimulus, no-sensory stimulus).
Nasza propozycja rozwiązania problemu niedookreślenia polega na tym, że np. dla swoistości każdego zmysłu (Sinnesmodalität) należy wyuczyć się
swoistych modeli prostych. Łącznie rozmaite modele
proste odwzorowują przewidywanie pożądanych
skutków zachowania. Duża rozbieżność między tworzącymi tę całość modelami prostymi swoistymi dla
różnych zmysłów (np. między zmysłem równowagi
a zmysłem wzroku podczas żeglowaniu na statku po
wzburzonym morzu [26] może prowadzić do złego
samopoczucia. Później jednak służy do uczenia się
nowych warunków wyjściowych – co zostało potwierdzone również w doświadczeniach z okularami pryzmatycznymi – w których manipuluje się postrzeganiem wzrokowym (por. artykuł [27]). Główne i – według niniejszych rozważań – możliwe do
przyjęcia założenie polega na tym, że najwyższy priorytet należałoby przyznać spoistości postrzegania
(Konsistenz der Wahrnehmung). Jeżeli zatem pojawiają się różnice w zestawieniu ze świadectwem
pochodzącym od modelu prostego nieczuciowego,
od wewnątrzpochodnego i od zewnątrzpochodne-
– 62 –
-
-
-
-
-
Uczenie się ruchów
go, wynika stąd, iż należy zróżnicować postrzeganie. Ten mechanizm odpowiada propozycji Hoffmanna. Jeżeli natomiast różnice nie pojawiają się,
czyli przewidywania skutków różnymi zmysłami dostatecznie dobrze zgadzają się, przechodzimy do
problemu, czy spodziewany skutek rzeczywiście nastąpił. Jeżeli tak, dochodzi do wzmocnienia triady
S(R)E; jeżeli nie – należy zmienić składnik R. Ten
mechanizm odpowiada propozycji Jordana i Rumelharta. W mniejszym stopniu wywodzi się w tym przypadku z założenia, że chodzi o wyraźną decyzję odnośnie do wybranego dopasowania. Należy raczej
skłonić się ku poglądowi, że wzmocnienia i poprawki
zależą od stopnia zgodności swoistych dla różnych
zmysłów przewidywań i rzeczywistych skutków.
Taka sama zasada wzajemnego wyrównywania
i wynikającego z niego rozdziału poprawek między
różne mechanizmy kontrolne może służyć do wytłumaczenia zdolności uczenia się ruchów również
w późniejszych stadiach uczenia się, w których nie
chodzi o wyuczenie się początkowych kategorii postrzegania i ruchu (por. również [28]). Jest to zadanie mechanizmu dochodzenia do zgodności pożądanego, przewidywanego i rzeczywiście osiągniętego stanu otoczenia. Jeżeli skutki rzeczywisty i przewidywany są zgodne, ale oba nie odpowiadają skutkowi
pożądanemu, należy dopasować model odwrotny
(por. pkt 5, przykład 1), który w równym stopniu oddziałuje na skutek rzeczywisty i przewidywany. W
przypadku zgodności skutku przewidywanego i pożądanego, które jednak nie odpowiadają skutkowi
rzeczywistemu, należy zmienić postrzeganie (por. pkt
5, przykład 2). Jeżeli wreszcie zgodne są skutki rzeczywiste i pożądane, ale nieprzewidywany, to trzeba
dopasować model prosty (por. pkt 5, przykład 3).
Po wyposażeniu w oba opisane dodatkowe
mechanizmy (według Hoffmanna oraz według Jordana i Rummelharta – przyp. tłum.) muszą się udać
skuteczne symulacje, w których rezygnuje się zarówno z wychodzenia z już zróżnicowanego postrzegania, jak i z założenia, że składnik R nie wymaga żadnego dopasowania zależnego od uczenia się. Ostatecznie otrzymuje się w ten sposób teoretyczny model procesu uczenia się, który wprawdzie w
hierarchii sterowania ruchami ogranicza się do „głębokich” mechanizmów sterowania (pkt 1), tu jednak jest przypisany do nowoczesnych teorii uczenia
się S(R)E z założeniem spontanicznego sterowania
ruchami (pkt 2). Okazuje się on wiarygodny zarówno z czynnościowego (pkt 3), jak i formalnego (podrozdział 4) punktu widzenia. Jak to będzie wyglądać, gdy w pkt 5 zechcemy przyjrzeć się podstawowej myśli tego modelu uczenia się na przykładzie
ustroju przykładowego?
5. Zamiast podsumowania: Dzieje uczenia się
ustroju przykładowego
Załóżmy, że umieszczamy w świecie rzeczywistym
ustrój przykładowy, któremu – by procsey ucznia się
ruchów móc obserwować w „czystej” postaci – nie
dajemy żadnych wskazówek na drogę. Musi on więc
uczyć się od samego początku. Podobnie jak wszyscy przedstawiciele gatunku ustrojów przykładowych, jest on zdolny do ruchu. Jest także wyposażony w zmysły, dające mu wiedzę o stanie jego ciała
oraz jego otoczenia. Dokładniej trzeba powiedzieć,
że zmysły jedynie mogą mu tę wiedzę dawać, gdyż
na początku istnienia nasz ustrój przykładowy otrzymuje tylko pozbawiony znaczenia, niemożliwy przezeń do zinterpretowania ciąg bodźców – i dlatego
nie dzieje się tu nic innego, jak tylko niekontrolowane miotanie się. Kiedy się temu przyjrzeć jeszcze
dokładniej: ciąg postrzeżeń nie jest dla ustroju całkowicie pozbawiony znaczenia, gdyż niektóre bodźce z wnętrza ciała dają mu bezpośrednio uczucie,
że coś nie jest w porządku. Później można powiedzieć, że odczuwa głód lub pragnienie, że jest mu
za ciepło lub za zimno lub że pragnie być pogłaskany. W danej chwili nic nie „wie” o tych znaczeniach
i zamiast tego postrzeżenie ogranicza się do „bardziej-lub-mniej-dobrze”. Pod pewnym względem ów
przykładowy ustrój jest jednak wyposażony w zamiary – nawet jeśli są one grubo ciosane, przyjmujące
na przykład postać: więcej bardziej dobrego i mniej
mniej dobrego. Ustrój nie wie, że podczas całego
jego dalszego życia w tym pierwotnym stanie nie
zajdą żadne gruntowne zmiany. Ale to chyba dobrze.
Załóżmy, że typowe dla ustroju przykładowego
otoczenie wymaga, aby w późniejszym okresie istnienia sam się o siebie troszczył. Do przeżycia ważne są dwie rzeczy: początkowo pozbawiony znaczenia ciąg postrzeżeń musi ulec zróżnicowaniu, a miotanie się musi zostać opanowane. Jak może się to
udać? Podstawowa strategia – której ustrój, naturalnie, nie może „przemyśleć” i która wcześniej musi w
nim zostać na stałe „zaprogramowana” – może polegać na tym, że poszukuje się zależności. Takie zależności mogą pojawiać się miedzy różnymi układami zmysłów, między układami ruchowymi i czuciowymi oraz między ruchowością/czuciowością a systemem ocen, który ustala, czy rzeczywiście wszystko
zmierza w kierunku „bardziej dobrze” lub „mniej
dobrze”. Odpowiadałoby to np. następującym obserwacjom: kiedy przed moimi oczami poruszają się
czerwono-żółte kule, słyszę grzechot; obserwacje te
w jakiś sposób się łączą. Mocne wierzganie nogami
i ból stóp również. Coś wspólnego ze sobą ma rów-
– 63 –
-
-
-
-
-
Ernst-Joachim Hossner, Stefan Künzell
nież krzyk i karmienie, a kiedy pojawia się inny ustrój
przykładowy, znacznie większy ode mnie, jestem
głaskany. Co należy jeszcze raz podkreślić: nie są to,
naturalnie, zdania, którymi myśli o tych zdarzeniach
ustrój przykładowy, ponieważ nie wie nic ani o kulach, ani o barwach, nie ma też pojęcia, co to znaczy powiedzieć „ja”. Niemniej zgodności nie są przez
to mniej przydatne ustrojowi do budowy pierwszych
struktur (sterujących – przyp. tłum.) Aby struktury
te zyskały znaczenie, musi chodzić o coś więcej niż
same tylko zależności. Ustrój przykładowy musi się
nauczyć, w jakich warunkach jakie zachowanie prowadzi do jakich skutków.
Załóżmy, że nasz ustrój przykładowy rośnie w
laboratorium biologa zajmującego się zachowaniem
organizmów żywych. W laboratorium tym naciśnięcie niebieskiego przycisku umieszczonego na prawo od ustroju uruchamia mechanizm podający mu
smaczną i pożywną pigułkę. O mechanizmie tym
ustrój nie wie absolutnie nic. Objaśnienie jego działania nie jest mu do niczego przydatne, gdyż w tym
czasie ustrój przykładowy żyje jeszcze w nurcie postrzeżeń zupełnie pozbawionych znaczenia. Zauważa jedynie, że w danej chwili sprawy biegną w kierunku „mniej dobrze”, ponieważ jest głodny i czyni
wszystko, co w jego mocy, aby usunąć tę dolegliwość: dziko się miota. W trakcie tego przypadkowo
trafia na przycisk, otrzymuje pożywną pigułkę, je do
syta i czuje się „bardziej dobrze”. Po pewnym czasie
znowu głodnieje, miota się, naciska znowu przycisk,
otrzymuje porcję jedzenia i czuje się znowu bardziejdobrze. Wyraźnie opłaca się ustrojowi przykładowemu zapamiętanie tego toku zdarzeń. W szczególności powinien zapamiętać następujące szczegóły: kiedy jestem głodny, muszę osiągnąć stan, w którym
odnajdę i ujrzę moją rękę na przycisku po prawej
stronie ode mnie, gdyż wówczas otrzymam pożywną
pigułkę, którą się nasycę. Zdanie to nie musi zostać
tak sformułowane przez ustrój przykładowy: wraz z
przyrostem doświadczenia będzie jednak z pewnością tak działać, jak gdyby zdanie owo było przyswojone. Jeżeli tak jest, oznacza to, że ustrój się czegoś
nauczył.
Załóżmy, że nasz biolog tak umieszcza nasz ustrój
przykładowy, by niebieski przycisk znalazł się nie po
prawej stronie, lecz po lewej od niego. Co zatem
powinien uczynić ustrój, kiedy następny raz zgłodnieje? Będzie, oczywiście, znowu sięgał w prawo,
ponieważ nauczył się, że taki ruch zostaje nagrodzony pożywną pigułką. Pod tym względem ustrój przykładowy nie różni się od kierowcy samochodu, który w swoim nowym aucie włącza światło tak samo,
jak w starym – i stale uruchamia w ten sposób wycieraczki! Tym razem jednak pożywnej pigułki nie
ma. Ustrój jest zdezorientowany, gdyż ręka czuje się
tak samo, jak dotychczas, kiedy otrzymywał pożywną
pigułkę. W jakiś sposób osiągnięty stan jest jednak
inny. Brakuje wyczucia przycisku pod ręką i nie widać, jak ręka leży na przycisku. Jeżeli ustrojowi przykładowemu przyjdzie na myśl, że również warunki
początkowe są inne, znajdzie się na dobrej drodze;
to, czego się bowiem dotychczas nauczył, wydaje
się „działać” jedynie pod warunkiem, ze „niebieski”
widzi po prawej. W przypadku „niebieski po lewej”
układ znowu musi się miotać dopóty, dopóki przypadkiem nie naciśnie przycisku i nie otrzyma pożywnej pigułki. Kiedy jednak zdoła tego dokonać – a
biolog jest na tyle złośliwy, że będzie stale zmieniał
położenie naszego ustroju względem przycisku –
wówczas ustrój przykładowy osiągnie coraz większą
kompetencję, by swoją rękę w zależności od warunków celowo kierować ku przyciskowi. Zyskuje wówczas coś na kształt czuciowo-ruchowej koncepcji
kierunku. Jednakże całkowicie brakuje mu jeszcze
koncepcji okrągłego lub kanciastego, niebieskiego
lub zielonego, przycisku lub guzika itp. Niemniej nasz
ustrój przykładowy znajduje się na najlepszej drodze, by zróżnicować swój osobisty obraz świata.
A ponieważ wzrasta w laboratorium biologa zajmującego się zachowaniem, należy oczekiwać, że ów
uczony przygotował dla naszego ustroju przykładowego jeszcze mnóstwo doświadczeń różnego rodzaju.
Załóżmy, że nasz ustrój przykładowy pewnym
nakładem sił dość sporo się nauczył. Teraz będzie
się uczył jeździć na nartach. Nie jest to łatwe, gdyż
zbocza narciarskie wyglądają zazwyczaj inaczej niż
laboratoria biologów. Wprawdzie nasz ustrój ma już
pewne pojęcia o tym, jak się poruszać w górę i w
dół, ale nie wie, jak zachować równowagę na oślizłych powierzchniach ośnieżonych. Dlatego – nieco ironicznie – pierwsze próby narciarzy na śniegu
przypominają nieco miotanie się w laboratorium. Po
pewnym okresie gromadzenia doświadczeń ruchowych metodą prób i błędów oraz wspierania metodycznymi poradami instruktora narciarstwa, nasz
ustrój będzie w stanie zjechać prosto po przyczepnym śniegu w dół łagodnego zbocza. Do tego jednak, by został dobrym narciarzem, droga jest jeszcze daleka.
Załóżmy więc, że nasz ustrój przykładowy nie
tylko „jakoś” bez pomocy chce dostać się do podnóża zbocza, ale ponadto tworzy wyobrażenie o tym,
jak powinno się to odbyć, np. poprzez jazdę slalomem o ostrych skrętach. Nie wie jednak, jak będzie
to odczuwał (wyrażając to formalnie: nie ma odpowiedniego modelu prostego.) W przeciwieństwie do
okresu swego życia w laboratorium biologa, nie jest
– 64 –
Uczenie się ruchów
w tym przypadku skazany jedynie na metodę prób i
błędów. Może omawiać ze swoją instruktorką narciarstwa, w którym kierunku powinien próbować,
aby osiągnąć pożądane skutki zachowania. Owe
pożądane skutki zachowania (powinny pojawić się
jako Ereal) doprowadzają do przewidywania skutków
zachowania (pojawiają się jako Eant) i do postrzegania rzeczywistych skutków zachowania (pojawiają
się jako Ereal) – czego ustrój potrzebował już w warunkach laboratoryjnych. Przed ustrojem stają więc
następujące trzy zadania uczenia się, które prowadzą
do różnych dostosowań.
Zadanie dydaktyczne 1
1: Nasz ustrój stale zsuwa
się przy jeździe w skos zbocza poprzecznie do kantów nart. Może to sam wyczuć, dostrzec i usłyszeć.
Rzeczywiste skutki nie odpowiadają zatem ani pożądanym, ani przewidywanym. Na podstawie swego doświadczenia ruchowego nasz ustrój wie jednak, co należy zrobić: kolana trzeba nachylić bardziej w kierunku zbocza. Przy następnym zjeździe
ustrój poprawia więc odśrodkowe podniety ruchowe do mięśni tak, że udaje mu się pojechać w skos
zbocza bez ześlizgiwania się.
Zadanie dydaktyczne 2
2: Instruktorka narciarstwa (pod względem złośliwości podobna do biologa zajmującego się zachowaniem) prowadzi nasz
ustrój na inny stok, na którym znajdują się miejsca
oblodzone. Wprawdzie ustrój jedzie tak, jak dotychczas, ale wkrótce upada na nos – jeśli założymy, że
ma nos. Znowu rzeczywiste skutki nie odpowiadają
pożądanym, po części przewidywanym, gdyż ruch
sam w sobie był odczuwany zgodnie z oczekiwaniami, ale skutek ruchu był zupełnie inny. Dla ustroju
oznacza to teraz, że musi zróżnicować postrzeganie
pod względem przyczepności podłoża i próbować
dostosować do tego ruchy.
Zadanie dydaktyczne 3
3: O tym, co wynika z ruchu narciarza w danych warunkach, ustrój uczy się
ustawicznie, przy każdym wykonaniu ruchu i również wówczas, gdy nie powinien pojawić się skutek
rzeczywisty. Być może ustrój sam zostanie instruktorem narciarstwa i może wówczas przy pokazach
bocznego zsuwania się sięgnąć do doświadczeń z
zadania 1. Być może będzie jednak pracował jako
ustrój pokazowy i wówczas z zadania 2 wie, jak wykonywać widowiskowe upadki na oblodzonym stoku. Ruch może jednak nagle i niespodziewanie dać
pożądany skutek: – to jest treścią zadania 3. By to
unaocznić załóżmy, że nasz ustrój chce ostatecznie
jechać slalomem. Wie, jak to wygląda, próbował już
wiele razy, ale zawsze ponosił klęskę. Również przy
następnej próbie oczekuje, że wyjedzie nartami poza
tor slalomowy. Jednakże dzięki nierówności podłoża ustawia się – niezależnie od swej woli – we właściwej pozycji początkowej i nieoczekiwanie jego
narty jadą po śniegu niczym po szynach. – Eureka!
– cieszy się. – To jest to, czego od dawna pragnąłem!
W tym przykładzie rzeczywisty skutek nie odpowiada oczekiwanemu, ale zgadza się z pożądanym.
To, czego się ustrój nauczył, to poczucie ruchu związane z wirażem; będzie się starał odtworzyć owo
poczucie również następnym razem.
Załóżmy, że po licznych próbach uczenia się nie
tylko w laboratorium, ale również na stoku, wszystko idzie jak najlepiej. Przy postrzeganych warunkach
początkowych oczekiwane skutki pojawiają się na
pewno i nie ma już żadnych niespodzianek przy zestawieniu skutków spodziewanych i pożądanych.
„Potrafię jeździć na nartach!” – cieszy się nasz ustrój
przykładowy i każe się sfilmować na wideo przez
zaprzyjaźniony ustrój, jak śmiga po zboczu. Kiedy
pierwszy raz widzi się na filmie, jest jednak przerażony, gdyż odkrywa, że siedzi na tyłach nart i wygląda to głupio.
- O tym nie pomyślałem! – martwi się ustrój przykładowy. – Tak dobrze to odczuwałem! A tak mocno siedzę na tyłach nart! Muszę jeszcze wiele, wiele
się nauczyć!
Chcielibyśmy nasz ustrój troszkę pocieszyć, gdyż
wbrew popularnemu przysłowiu, czego się mały
ustrojek przykładowy nie nauczył, tego duży ustrój
przykładowy może się jeszcze nauczyć.
PIŚMIENNICTWO • LITERATURE
-
-
[1]
[2]
-
-
-
[3]
Nitsch JR & Munzert J: Handlungstheoretische Aspekte des Techniktrainings. Ansätze zu einem integrativen Modell. In J.R. Nitsch, A. Neumaier, H. de Marées
& J. Mester (Hrsg.), Techniktraining. Beiträge zu einem
interdisziplinären Ansatz (S. 109-172). Schorndorf:
Hofmann, 1997
Hacker W:. Allgemeine Arbeits- und Ingenieurpsychologie. Berlin: Volk und Wissen, 1973
Bernstein NA: Die Entwicklung der Bewegungsfertigkeiten. Leipzig: IAT Eigenverlag, 1998
[4]
[5]
[6]
[7]
– 65 –
Meinel K & Schnabel G: Bewegungslehre – Sportmotorik (9. stark überarbeitete Aufl.). Berlin: Sportverlag, 1998
Thorndike EL: Human Learning. New York: Century,
1931
Pawlow IP: Gesammelte Werke. Band 3. Berlin: Akademie, 1953
Schmidt RA: A schema theory of discrete motor
skill learning. Psychological Review, 1975; 82: 229261
Ernst-Joachim Hossner, Stefan Künzell
[19] Narendra KS : Adaptive Control: Neural Network Applications. In M.A. Arbib (Ed.), The Handbook of Brain
Theory and Neural Networks (pp. 69-73). Cambridge,
Mass.: MIT Press, 1995
[20] Künzell S: Computermodelle aus dem Blickwinkel der
handlungstheoretischen Psychologie. In D. Hackfort,
J. Munzert & R. Seiler (Hrsg.), Handeln im Sport als
handlungspsychologisches Modell (S. 115-130). Heidelberg: Asanger, 2000a
[21] Bernstein NA: The Coordination and Regulation of
Movements. Oxford: Pergamon Press, 1967
[22] Hossner E-J: Bewegende Ereignisse – ein Versuch
über die menschliche Motorik. Unveröffentlichte Habilitationsschrift, Universität Heidelberg, 2002
[23] Künzell S: Die Bedeutung der Efferenzkopie für das
motorische Lernen. Unveröffentlichte Dissertation,
Universität Gießen, 2002.
[24] Holst E von & Mittelstaedt H: Das Reafferenzprinzip.
Naturwissenschaften, 1950; 37: 464-476.
[25] Desmurget M & Grafton S: Forward modeling allows
feedback control for reaching movements. Trends in
Cognitive Sciences, 2000; 4: 423-431.
[26] Stadler M: Psychologie an Bord (5., überarb. und erw.
Aufl.). Bielefeld: Klasing, 1999
[27] Heuer H: Bewegungslernen. Stuttgart: Kohlhammer,
1983
[28] Künzell S: Learning the Basics. In AISB (Ed.), Time for
AI and Society. Proceedings for the AISB’00 Symposium on How to Design a Functioning Mind (pp. 151152). Birmingham: University of Birmingham, 2000b
[29] Gibson JJ: Wahrnehmung und Umwelt. München:
Urban & Schwarzenberg, 1982
[30] Volpert W: Das Modell der hierarchisch-sequentiellen Handlungsorganisation. In W. Hacker, W. Volpert
& M. von Cranach (Hrsg.), Kognitive und motivationale Aspekte der Handlung (S. 38-58). Bern: Hüber, 1983
-
-
-
-
-
[8] Adams JA: A closed-loop theory of motor learning.
Journal of Motor Behavior, 1971; 3: 111-150.
[9] Munzert J: Flexibilität des Handelns. Köln, 1989, bps.
[10] Bernstein NA: The Problem of the Interrelation of Coordination and Localization. In H.T.A. Whiting (Ed.),
Human Motor Actions. Bernstein Reassessed (pp. 77119). Amsterdam: North-Holland, 1984
[11] Nitsch JR & Munzert J: Handlungstheoretische Aspekte des Techniktrainings. Ansätze zu einem integrativen Modell. In J.R. Nitsch, A. Neumaier, H. de Marées
& J. Mester (Hrsg.), Techniktraining. Beiträge zu einem
interdisziplinären Ansatz (S. 109-172). Schorndorf:
Hofmann, 1997
[12] Klix F: Die Natur des Verstandes. Göttingen: Hogrefe, 1992
[13] Hoffmann J: Vorhersage und Erkenntnis. Göttingen:
Hogrefe, 1993
[14] Hoffmann J: Das ideomotorische Prinzip, Closed Loops und Schemata. In J.R. Nitsch & H. Allmer (Hrsg.),
Denken – Sprechen – Bewegen (S. 69-75). Köln, 2001,
bps.
[15] Elsner B & Hommel B: Effect anticipation and action
control. Journal of Experimental Psychology: Human
Perception and Performance, 2001, 27: 229-240
[16] Neumann O: Theorien der Aufmerksamkeit: Von
Metaphern zu Mechanismen. Psychologische Rundschau, 1992, 43: 83-101
[17] Jordan MI: Komputationale Aspekte der Bewegungssteuerung und des motorischen Lernens. In H. Heuer
& S. Keele (Hrsg.), Enzyklopädie der Psychologie. Themenbereich C, Theorie und Forschung. Serie II, Kognition. Band 3, Psychomotorik. (S. 87-146). Göttingen: Hogrefe, 1994
[18] Jordan MI & Rumelhart DE: Forward models: Supervised learning with a distal teacher. Cognitive Science, 1992, 16, 307-354.
– 66 –
Uczenie się ruchów
Dodatek:
Appendix:
Formalizacja matematyczna
i kontrolno-teoretyczna
Mathematical
and control-theoretical formalization
otoczenie
Se
t+Ät
model
odwrotny
E
model
prosty
+
hw(S)
Enviroment
–
Sat+Ät
–
+
Se
Schemat przedstawia metodę uczenia się kierowanego z zewnątrz (według Jordana, 1994, s. 134)
zgodnie z notacją teorii kontrolnej. Ustrój uczący się
otoczony jest liniami przerywanymi. Będące podstawą symulacji równania modelu prostego (1) i
odwrotnego (2) są następujące:
t+Ät
[1] hw [Sa
[1] hw [Sa
Sat+Ät
–
+
(t)] = fm{hw[S(t), m[E(t-ct)]}
t+Ät
[2] m[E(t-ct)] = gm {hw [Se
(t)], hw[S(t)]}
(t)], hw[S(t)]}
gdzie:
hw – funkcja postrzegania,
fm – umysłowe odwzorowanie otoczenia,
gm – umysłowe odwzorowanie ruchu,
E – podniety ruchowe,
m – przekształcenia podniet ruchowych przez mięśnie w ruch,
Sa – bodziec oczekiwany,
Se – bodziec pożądany,
S – bodziec rzeczywisty,
t – czas.
where:
hw – perception function,
fm – mental representation of the environment,
gm – mental representation of the movement,
E – efferences,
m – transformation of efferences into movement
by muscles,
Sa – expected stimulus,
Se – desirable stimulus,
S – actual stimulus,
t – time.
Daną wyjściową z modelu prostego jest przewidywany w chwili t bodziec hw [Sat+Ät(t)] postrzegany
w chwili czasu t+Ät. Parametrami modelu prostego
są: bieżący stan otoczenia zadany postrzeganym w
chwili t bodźcem S oraz utworzonymi w modelu odwrotnym, po pewnym nieznanym czasie przetwarzania ct, pozostającymi do dyspozycji podnietami
ruchowymi E.
Danymi wyjściowymi modelu odwrotnego są powodujące ruch podniety ruchowe (Efferenzen). Parametrami wejściowymi są: postrzegany bieżący stan
otoczenia hw[S(t)] oraz pożądany na chwilę t+Ät
t+Ät
postrzegany stan środowiska hw [Se (t)].
The outcome of the forward model is stimulus
hw [Sat+Ät(t)], anticipated at the moment t, which will
be perceived at the moment t+Ät. Forward model
parameters are: actual environment state, represented by stimulus S, perceived at the moment t, as well
as disposable efferences E, created in the inverse
model after unknown transformation period ct.
The outcome of inverse model are efferences
evoking the movement. The incoming parameters
are: perceived actual state of environment hw[S(t)]
and desirable at the moment t+Ät, perceived state
t+Ät
of the environment hw [Se (t)].
-
Forward
model
In the scheme there is shown the distal learning
method (Jordan, 1994, p. 134), presented according
to control theory notation. The learning system has
been enclosed by dashed lines. The following equations form the basis of the forward model (1) and
the inverse one (2):
-
-
[2] m[E(t-ct)] = gm {hw [S
E
–
t+Ät
(t)] = fm{hw[S(t), m[E(t-ct)]}
t+Ät
e
Inverse
model
t+Ät
+
hw(S)
– 67 –