Art 00 - Antropomotoryka
Transkrypt
Art 00 - Antropomotoryka
NR 26 Uczenie się ruchów ANTROPOMOTORYK A 2003 UCZENIE SIÊ RUCHÓW 1 MOTOR LEARNING Ernst-Joachim Hossner*, Stefan Künzell** * dr, Instytut für Wissenschaft Universität Gissen. 353994 Gissen, Kugelberg 62, Niemcy ** dr, Instytut fûr Wissenschaft, Universität Gissen. 353994 Gissen, Kugelberg 62 Słowa kluczowe: antycypacyjne sterowanie zachowaniem się, warunkowanie, swoiste przewidywanie, programy ruchowe, teorie programowania, teorie regulacji, spoistość czuciowa, problem niedookreślenia. Key words: Anticipation behaviour steering, conditioning, specific anticipation, movement programmes, programming theories, regulation theories, sensory consistency, problem of underdefinition. STRESZCZENIE • SUMMARY The term „movement learning” denotes depending on experience, relatively stable changes of competence to achieving specific goals in specific situations by means of specific actions. Taking this notion as a criterion, it is possible to divide classic learning theories into two groups. In the classical conditioning or programming theories, special accent is laid onto stimulus ® response (S-R) relation. On the other hand, in the operational conditioning or regulation theories, special accent is laid onto response ® effect (R-E) relation. Contemporary learning theories are rooted in emergent model of movement steering, where the R element results of a given situation and expected outcome of behaviour (anticipation steering of behaviour, movement programmes). S(R)E approach seems to be especially convincing not only from the evolution-functional point of view; its legitimacy results from formalization by means of connectionistic models. For underdefinition, which emerged in the frames of net modeling, it was presented the proposal of solution resulting of sensory structure formation. - - Terminem uczenie się ruchów określa się zależne od doświadczenia i względnie trwałe zmiany kompetencji do osiągania w określonych sytuacjach, przez określone zachowanie, określonych celów. Traktując to pojęcie jako kryterium można podzielić klasyczne teorie uczenia się według szczególnego nacisku albo na zależność bodziec-reakcja (S_R – stimulus-response; warunkowanie klasyczne, teorie programowania), albo na zależność odpowiedź-skutek (R-E – response-effect; warunkowanie operacyjne, teorie regulacji). Współczesne teorie uczenia się pochodzą z modelu spontanicznego (emergentnego) sterowania ruchami, w którym składnik R wynika z danej sytuacji i oczekiwanego skutku zachowania (antycypacyjne sterowanie zachowaniem, programy ruchów). Ujęcia S(R)E wydają się szczególnie przekonujące nie tylko z punktu widzenia ewolucyjno-czynnościowego, ale ich zasadność wynika również w formalizacji za pomocą modeli konekcjonistycznych. Dla niedookreślenia, które pojawiło się w ramach modelowania sieciowego, przedstawiono propozycję rozwiązania wynikającego z ukształtowania się struktury czuciowej. - – 55 – - Przekładu z niemieckiego oryginału pt. „Motorisches Lehrnen” dokonał Wacław Petryński, AWF Katowice , ul. Mikołowska 72a - 1 Ernst-Joachim Hossner, Stefan Künzell 1. Definicje - - - - - Sytuacje sportowe cechują się w znacznej mierze tym, że pożądane w danej sytuacji wzorce zachowania nie od razu można urzeczywistnić. Zanim opanuje się technikę sportową, niezbędna jest raczej dłuższa lub krótsza faza ćwiczeń. Owa faza ćwiczeń zmierza ku zmianie mechanizmów sterowania ruchami, warunkujących wykonanie ruchu, więc mówi się w tym przypadku o uczeniu się ruchów ruchów. W niniejszym artykule jest mowa o takich właśnie procesach uczenia się ruchów. Według definicji, uczenie się ruchów – to uwarunkowana doświadczeniem, stosunkowo trwała zmiana kompetencji do osiągania określonych celów w określonych sytuacjach przez określone zachowanie (ruchowe). Z takiej definicji pojęcia uczenia się ruchów wynikają następujące wnioski: 1. Przejściowe zmiany w zachowaniu – np. takie, które można odnieść do odbioru bodźców zewnętrznych – nie odpowiadają definicji uczenia się. Na pytanie, czy dane zachowanie dotyczy jedynie aktualnej czynności, czy też prowadzi do trwałego uczenia się, można odpowiedzieć dopiero po przerwie (okresie retencji). 2. Pojęcie „zmiana” należy rozumieć obojętnie, co oznacza, że za przejaw procesu uczenia się należy uważać również względnie trwałe obniżenie umiejętności. 3. Powyższe definicje oznaczają, że uczenie się jest zależne od doświadczenia. Wykluczają zatem zmiany, które można przypisać procesom dojrzewania lub wzrostu, lub też dostosowaniom fizjologicznym, będących skutkami bodźców treningowych. 4. Kiedy jest mowa o zmianie kompetencji zakłada się, że możliwości zachowania, które tworzą owe kompetencje, nie muszą zostać bezwzględnie wykorzystane, ale mimo to można je uważać za skutki procesu uczenia się. 5. Określenie „ruchowy” oznacza, że omawiany skutek uczenia się odnosi się do wewnętrznych procesów kierowania ruchami. Ponieważ procesy te wiążą się z sytuacjami, zachowaniami i skutkami oznacza to, że również zmienione kompetencje czuciowe postrzegania sytuacji i skutków zachowania się mają wpływ na kierowanie ruchami. Pojęcie „uczenie się ruchów” oznacza właściwie uczenie się czuciowo-ruchowe lub – jeśli przeciwnie rozłożymy akcenty – uczenie się ruchowo-czuciowe. 6. Kiedy w nauce o sporcie jest mowa o uczeniu się ruchów, rozumie się pod tym pojęciem z re- guły zmianę swoistego zachowania, czyli zmia2 nę tak zwanej umiejętnośc umiejętności (Fertigkeit). Natomiast zmianę ogólnych przesłanek czynności ruchowych, czyli zdolności (Fähigkeit), wiąże się raczej z pojęciem treningu. Jak wygląda rozgraniczenie uczenia się ruchów od uwarunkowanych uczeniem się zmian zachowania będących skutkami procesów poznawczych, motywacyjnych i uczuciowych? Rozgraniczenie takie jest trudniejsze niż się może wydawać na pierwszy rzut oka, gdyż, co oczywiste, każdy objaw ruchowy – również taki, który można odnieść do wyższych procesów nerwowych – zachodzi wraz z aktem ruchowym. Czynność człowieka można zatem modelować jako współdziałanie procesów zachodzących na różnych płaszczyznach hierarchii planowania i sterowania, przy czym określony akt ruchowy obserwuje się na najniższej płaszczyźnie w hierarchii; opis modelowania teoretycznego można znaleźć u Nitscha [1], natomiast opis modelowania samej czynności – u Hackera [2]. Za ważną cechę takiego wielopłaszczyznowego modelu Bernsztein [3] uważa zmianę głównego poziomu sterowania. Pozostając w zgodzie z koncepcjami modeli sterowania ruchami opisanymi w rozdziałach o psychologii i neurologii, pragniemy jednak szczególnie uwypuklić zrozumienie wyobrażeń w uczeniu się ruchów, nie kwestionując przy tym bezspornych wpływów wyższych procesów nerwowych. Głównym tematem rozważań powinny więc być takie aspekty względnie trwałych zmian zachowania, które dotyczą ruchowego urzeczywistnienia już ustalonego zamiaru. Po krótkim przeglądzie w pkt. 2 obecnego stanu naukowych badań uczenia się ruchów, w pkt. 3 objaśniamy rolę uczenia się ruchowego dla ustroju, aby wywieść stąd konsekwencje dla tworzenia modeli. W pkt. 4 zostanie przedstawiony formalny opis takich modeli. Przedstawiono też oryginalną próbą rozwiązania wykrytego przy tej okazji problemu niedookreślenia. Powyższe rozważania zaprezentowono ponownie w pkt. 5, ale w postaci bardzo przystępnego przykładu. 2. Uczenie się ruchów jako przedmiot naukowych badań ruchu Z punktu widzenia nauki o ruchach człowieka problem uczenia się ruchów obejmuje zarówno badanie wpływu różnych zmiennych czynników oddziałujących na przebieg uczenia się ruchów, jak i teo2 W nawiasach podano zgodnie z oryginałem określenia w języku niemieckim. – 56 – Uczenie się ruchów retyczne opracowanie uzyskanych danych doświadczalnych. Jeśli idzie o pierwsze z wymienionych zagadnień, istnieje wiele danych pochodzących z badań psychologicznych, dotyczących podstaw analizowanych procesów, oraz sportowych, dotyczących zastosowań praktycznych zdobytej wiedzy (por. Wiemeyer). W drugim z wymienionych obszarów badań mamy do czynienia z następującymi dwoma podstawowymi problemami: 1. Teoretyczna strukturalizacja czasowa procesu długotrwałego uczenia się. Najbardziej znany jest tu podział według aspektów zbornościowych zgodnie z zaproponowaną przez Meinela i Schnabla [4] koncepcją kolejnych faz. Zakłada ona trójetapowy proces, obejmujący kolejno (1) nabywanie zborności zgrubnej, (2) nabywanie zborności dokładnej i (3) nabywanie zborności dokładnej ustalonej, a także łatwość korzystania z nich w zmiennych warunkach otoczenia. W praktyce sportowej istnieje też podział na uczenie się od nowa i doskonalenie umiejętności ruchowych, z „automatyzacją” jako ważnym aspektem tego doskonalenia. 2. Opracowywanie teorii uczenia się, wyjaśniających obserwowane zmiany zachowania. Co się dzieje, gdy ludzie uczą się umiejętności ruchowych lub doskonalą je? Właśnie to pytanie stanowi główny temat rozważań w tym artykule. Na początku niniejszej pracy uczenie się ruchów określono jako zależne od doświadczenia i względnie trwałe zmiany kompetencji do osiągania określonych skutków w określonych sytuacjach przez określone zachowanie. W takiej definicji zestawia się działania ruchowe (ang. response, R) z jednej strony z uwarunkowaniami sytuacyjnymi (ang. stimulus, S), z drugiej zaś – z wynikającymi z owych działań zmianami sytuacji (ang. effect, E). Jak pokazano w tabeli 1, składniki te można wykorzystać jako kryteria podziału teorii uczenia się. Pierwsze kryterium porządkujące wynika z pytania, czy w danej teorii szczególnie wiele uwagi poświęca się związkowi bodziec-reakcja (SR), czy bodziecodpowiedź (RE). Czy zatem do jakiegokolwiek aktu ruchowego dochodzi przede wszystkim dlatego, że powoduje to dana sytuacja (S Þ R), czy też z chęci osiągnięcia określonego skutku (R Þ E)? Drugie z wymienionych kryteriów zawiera podstawowe pytanie: czy teoria zakłada istnienie wewnętrznego mechanizmu sterującego, czy też nie? Podstawą panującego w I połowie XX wieku behawioryzmu było przeświadczenie, że takie założenia opierają się jedynie przypuszczeniach i dlatego nie są dozwolone z naukowego punktu widzenia. Zamiast tego rozważano jedynie obserwowalne z zewnątrz powiązania, a ewentualne aspekty poznawcze przesuwano do bliżej nie określonej „czarnej skrzynki”. Druga połowa XX wieku przyjęła dokładnie przeciwne założenie: że zachowania ludzi można zrozumieć jedynie wtedy, gdy tworzone teorie będą uwzględniały również wewnętrzne procesy sterowania ruchami w sferze poznawczej. Pytanie, czy nawet najdrobniejsze szczegóły ruchu powinny być sterowane ośrodkowo, czy też raczej przebiegają samorzutnie w zależności od warunków zewnętrznych – czyli bez konieczności sterowania ośrodkowego – pozwoliło na podział poznawczych teorii uczenia się na teorie o charakterze recept (teorie planowania, prescriptive theories) oraz mówiące o samorzutnym pojawianiu się danego zachowania w toku nieustannego rozwoju (teorie spontaniczności, emergent theories). Istota tego rozróżnienia zostanie dokładniej omówiona poniżej. Tabela 1. Wybrane teorie uczenia się uporządkowane według najważniejszej zależności tłumaczącej zachowanie oraz według przyjętego mechanizmu sterującego. Table 1. Selected learning theories according to most important relation explaining the behaviour and specific steering mechanism Mechanizm steruj¹cy Steering mechanism bodziec odpowied (S Þ R) stimulus Þ response (S Þ R) odpowied skutek (R Þ E) response Þ effect (R Þ E) czarna skrzynka black box warunkowanie klasyczne (np. Paw³ow) classical conditioning (e.g. Pavlov) warunkowanie operacyjne (np. Thorndike) operational conditioning (e.g. Thorndike) teorie planowania prescriptive theorie uczenie siê wed³ug programów (np. Schmidt) programming learning (e.g. Schmidt) uczenie siê wed³ug cykli regulacyjnych (np. Adams) closed-loop theory of motor learning (e.g. Adams) - Najwa¿niejsza zale¿noæ Most important relation teorie spontanicznoci emergent theories uczenie siê S(R)E (np. Munzert, Hoffmann) learning S(R)E (e.g. Munzert, Hoffmann) – 57 – - - - - - Ernst-Joachim Hossner, Stefan Künzell W obrębie behawioryzmu można zasadniczo wyróżnić dwa mechanizmy uczenia się. W przypadku warunkowania klasycznego klasycznego, w istniejącym już związku bodziec-odpowiedź bodziec bezwarunkowy zostaje zastąpiony bodźcem obojętnym, przy czym ten drugi podawany jest z wystarczającą regularnością w czasowym sąsiedztwie pierwszego. Typowym przykładem tego rodzaju uczenia się jest pies Pawłowa [5], u którego ślinotok (odpowiedź, odruch bezwarunkowy) po okresie równoczesnego podawania jedzenia (bodziec bezwarunkowy) i rozlegania się dźwięku (bodziec warunkowy) pojawia się również wówczas, gdy zabrzmi jedynie dźwięk (odpowiedź, odruch warunkowy). Według teorii warunkowania klasycznego określone zachowanie jest wyzwalane według reguł bodziec-odpowiedź, natomiast w przypadku warunkowania operacyjnego podstawowymi powiązaniami są związki odpowiedźskutek. W przypadku tego mechanizmu samorzutnie pojawiające się zachowanie zostaje wzmocnione nagrodą. W wyniku zaspokojonej w ten sposób potrzeby, zgodnie z „prawem skutku” (Law of Effect; Thorndike, [6]) zostaje utrwalone odpowiednie powiązanie odpowiedzi i skutku (R-E), a więc rośnie prawdopodobieństwo powtórzenia się tego zachowania. W przypadku warunkowania operacyjnego najważniejszą rolę odgrywają zatem kary i nagrody (wzmocnienia ujemne i dodatnie). W przeciwieństwie do założeń behawiorystycznych, teorie poznawcze uczenia się opierają się na założeniu, że ważne są nie tylko składniki S-R-E obserwowane w zachowaniu „z zewnątrz”, lecz również odwzorowania wewnętrzne owych składników. Uznanie za najważniejsze, warunkujące dane zachowanie, powiązania S-R oznacza, że rozpoznany wewnętrznie bodziec, któremu nadaje się określone znaczenie, uruchamia mechanizm wewnętrzny, wywołujący podstawowy wzorzec zachowania. Niezbędna do tego struktura sterująca przybiera postać programu, utworzenie owej struktury określa się więc jako uczenie się programowe programowe. Klasycznym przykładem tego kierunku myślenia jest teoria schematu Schmidta [7]. Należy jednak podkreślić jej ważne ograniczenie: model ten można określić mianem „teorii uczenia się programowego” jedynie przy założeniu, że wzorce, które należy przyswoić, można postrzegać jako składniki niezbędne dla realizacji programu ruchowego; samo przyswojenie takiego programu nie jest jednak tematem teorii. „Uogólnione” programy ruchowe powinny, według Schmidta, sterować całą klasą ruchów, np. tenisowym forhendem ze wszystkimi jego odmianami. Niezmiennymi cechami programu są dynamiczne i czasowe zależności między podnietami ruchowy- mi dla poszczególnych mięśni. Jak szybko i z jaką siłą bezwzględną wykona się uderzenie, określa przypisany do programu schemat odtwarzania, w którym „zmagazynowane są” regularne powiązania dotychczasowych zmiennych sterujących (parametrów) programu, dotychczasowych warunków początkowych i dotychczasowych skutków ruchu. Takie „zmagazynowanie” powinno mieć charakter schematu, również oderwanego od pojedynczych doświadczeń. Jednym z ważnych wniosków wynikających z teorii schematu Schmidta jest więc to, że jeśli idzie o parametryzację programu, zmienne warunki wykonania czynności w porównaniu z warunkami stałymi oddziałują korzystnie na jakość skutków uczenia się. Teoria schematu Schmidta jest przykładem uzasadnienia zachowania się człowieka, podkreślającego zależność S-R, gdyż według tego modelu bezpośredni bodziec ruchowy zawsze daje się wytłumaczyć uruchomieniem i parametryzacją (przypisywaniem konkretnych wartości poszczególnym parametrom – przyp. tłum.) programu ruchowego. Kontrola, czy wskutek tego rzeczywiście wystąpi pożądany skutek, odgrywa u Schmidta jedynie drugorzędną rolę w ramach poprawy błędu lub oceny ruchu, nie wyzwalając bezpośrednio określonego zachowania. Dokładnie przeciwnie wygląda sprawa w przypadku teorii regulacji Adamsa [8], w którym głównym czynnikiem kontrolnym jest tzw. ślad postrzeżeniowy (perceptual trace). Powinna się w nim zawierać całość informacji zwrotnych wynikających z wykonania ruchu, natomiast niezależny od niego ślad pamięciowy, będący pierwotnym programem ruchowym, służy jedynie do zapoczątkowania ruchu. Bezpośrednie sterowanie ruchem powinno jednak zawsze opierać się na porównaniu odbieranej informacji zwrotnej o wartości bieżącej (Istwert) z wartością pożądaną (Sollwert), które w toku procesu uczenia się wynika z coraz mocniejszego śladu postrzeżeniowego. Czynności są więc – w odróżnieniu od modelu Schmidta – nie tyle wyzwalane, co wykonywane dopóty, dopóki według analizy wewnętrznej nie osiągnie się dostatecznej zgodność wartości pożądanej i wartości bieżącej. Ponieważ bezpośrednimi wielkościami kontrolnymi są oczekiwane skutki czuciowe, czyli skutki ruchu, więc teoria regulacji Adamsa stanowi dobry przykład wytłumaczenia zachowania ruchowego typu R-E, a zarazem przykład spojrzenia na proces uczenia się jako na proces regulacji cyklicznej cyklicznej. Choć teoria schematu Schmidta i teoria regulacji Adamsa różnią się co do oceny ważności związku bodziec-reakcja i bodziec-odpowiedź, to jednak wykazują wyraźne podobieństwo w tym, że zakła- – 58 – Uczenie się ruchów - - - - - dają, iż nawet najdrobniejsze szczegóły ruchu sterowane są ośrodkowo – bądź za pomocą programu, bądź regulacji wartość bieżąca–wartość pożądana. Wnikając głęboko w istotę tego zagadnienia można stwierdzić, że pod tym względem od początku lat dziewięćdziesiątych XX wieku w teoriach planowania („vorschreibende” Theorien, präskriptive Theorien) nic poważnego się nie wydarzyło. Przeciwne podejście, określone mianem spontaniczności (Emergenz), ma do odnotowania jeszcze mniejsze sukcesy. Podstawowe założenie tego opisu brzmi, że zachowanie wynika z warunków brzegowych, bez konieczności istnienia jakiegokolwiek ośrodkowego mechanizmu sterującego. Model pośredni między planowaniem a spontanicznością mógłby wynikać z założenia, że niezmienniki są określane przez schemat, natomiast parametryzacja – przez warunki brzegowe, wynikające np. z różnych aspektów środowiska i z tego powodu nie dających się ustalić poznawczo. Jak wykazuje Munzert [9] w swojej koncepcji schematu ruchowego; zgodnie z jego założeniami ośrodkowe sterowanie może się ograniczać do topologicznych cech przebiegu ruchu. Takie właściwości jakościowe dobrze zgadzają się z opisanymi przez Bernsteina [10], np. pożądaną kolistością czy określoną liczbą punktów skrzyżowania torów ruchów. Ilościowe, metryczne szczegóły ruchu – np. promienie, kąty lub odległości – powinny natomiast wynikać z więzów (Gibson, 1982), czyli z cech otoczenia bezpośrednio ograniczających liczbę stopnie swobody tak bardzo, że wynika z tego jednoznaczny tor ruchu (por. również Nitsch, Mun3 zert, [11]) . W takim ujęciu spontaniczności nie należy więc utożsamiać z wyobrażeniem, że ruch przebiega „sam z siebie”. W szczególności należy więc założyć, że odpowiedzi czuciowo-ruchowe (składniki R) dochodzą do skutku w zależności od uwarunkowań sytuacyjnych i celów, do których się dąży. W odróżnieniu od modeli planowania przyjmuje się jednak założenie, że w danej sytuacji nakierowany na osiągnięcie pewnego skutku zamiar wystarcza, by spowodować odpowiednie zachowanie. Składowa R tkwi zatem niejako w uwarunkowanych wolicjonal3 Na pierwszy rzut oka wydaje się, że użyte przez Gibsona określenie affordances należałoby utożsamić z terminem constraints, czyli ze znanymi z mechaniki więzami. Dokładniejsza analiza znaczenia angielskich słów afford i affrodences prowadzi jednak do wniosku, że więzy są czynnikiem ograniczającym możliwości ruchu przez istniejące stopnie swobody, natomiast affordances – czynnikiem umożliwiającym lub wręcz wymuszającym ruch wewnątrz istniejącego w danej chwili układu stopni swobody. Wprawdzie w tłumaczeniu używam słowa więzy, ale sprawa polskiego odpowiednika słowa affordances czy Affordanzen pozostaje otwarta (przyp. tłum.) nie powiązaniach S-E, nie ma więc większego sensu zaliczanie tego rodzaju ujęć do ściśle rozgraniczonych wyjaśnień zachowań typów SR czy RE. Najważniejsze wydaje się tu założenie, że procesy uczenia się ruchów są w istocie nakierowane na budowanie trójdzielnych związków S(R)E (por. [12]). Hipotetyczny mechanizm uczenia się S(R)E można znaleźć w modelu antycypacyjnego sterowania zachowaniem Hoffmanna [13, 14]. Zakłada się w nim, że po pomyślnym zakończeniu jakiegoś aktu ruchowego zawsze zostaje przeprowadzone porównanie skutków rzeczywistych z przewidywanymi. W procesie pierwotnego uczenia się powiązania R-E zostają w przypadku potwierdzonych przewidywań wzmocnione, a przy niepotwierdzonych – osłabione (R prowadzi do E lub R nie prowadzi do E). Wtórne uczenie się sprowadza się do tego, że powiązania R-E ulegają różnicowaniu w zależności od powstałej sytuacji (w pewnych warunkach S prowadzi R do E, względnie w pewnych warunkach S nie prowadzi R do E). Bardzo podobną propozycję można znaleźć w dwustopniowym modelu uczenia się Elsnera i Hommela [15], którzy również wychodzą z modelu kształcenia stopniowego, tworzącego najpierw powiązania R-E, a następnie S(RE). W obu przypadkach skutkiem procesu uczenia się są struktury koordynujące, które umożliwiają wzrost pewności przewidywań, w jakich warunkach, jakie zachowanie prowadzi do jakich skutków. Ponieważ przy takim ujęciu zakłada się reprezentację wewnętrzną postrzegania sytuacji i przewidywania skutków, więc proponowany mechanizm uczenia się można zaliczyć do modeli poznawczych. Mechanizm ten jest jednak o tyle spontaniczny, że owe odwzorowania wystarczają, by umożliwić określone zachowanie bez konieczności ośrodkowego przechowywania szczegółów ruchu. 3. Uczenia się ruchów – aspekt czynnościowy Po co się w ogóle uczymy? O co właściwie chodzi w uczeniu się ruchów? Kiedy stawia się podstawowe pytania tego rodzaju, wkracza się w obszar tematyczny analizy czynnościowej tego zakresu tematów (por. [16]). Wynikającą z niej perspektywę można łatwo objaśnić na podstawie naszkicowanych w poprzednich rozdziałach teorii uczenia się. Przy dokładniejszym rozważeniu obu teorii planowania (preskryptywnych) okazuje się, że nie ma tu odpowiedzi na pytanie „po co?”. Zamiast tego otrzymuje się obrazowe przenośnie przenośnie: uczenie się ruchów odpowiada nabywaniu programów ruchowych, względnie magazynowaniu cykli regulacyjnych. Natomiast w modelu antycypacyjnego sterowania zachowaniem – 59 – - - - - - Ernst-Joachim Hossner, Stefan Künzell Hoffmann proponuje rozsądny mechanizm uczesię. Powinny z niego wynikać struktury sterująnia się ce, umożliwiające osiąganie coraz większej pewności w przewidywaniach, w jakich warunkach, jakie zachowanie prowadzi do jakich skutków. Jest oczywiste, że taka pewność w zachowaniu umożliwia przeżycie. Procesy uczenia się pełnią więc ważną funkcję ewolucyjną. Trudno natomiast odpowiedzieć na pytanie, jaki jest głębszy sens rozszerzania się zakresu sterowania programowego czy regulacyjnego. Jeżeli jeszcze dokładniej przyjrzymy się zjawisku uczenia się (ruchów), to stanie się jasne, że w ewolucji można rozróżnić dwa równoległe mechanizmy narastającego dopasowywania się do istniejących warunków otoczenia. Pierwszy mechanizm dotyczy filogenezy rozwoju gatunkowego (filogenezy filogenezy) i działa przez procesy różnicowania i doboru. Organizmy lepiej dopasowane do otoczenia mają więcej szans na przekazanie swych genów potomności. Drugi mechanizm steruje rozwojem pojedynczego osobnika ontogenezą (ontogenezą ontogenezą). Można go określić mianem przeciwstawnego w tym sensie, że zdolne do uczenia się organizmy nie są lub przynajmniej nie są całkowicie wyposażone w pełne „oprogramowanie”, które sprawdziło się w poprzednich pokoleniach, ale raczej są zdolne jedynie do dopasowywania swojego sposobu zachowania do krótkotrwałych zmian w środowisku. W przypadku zdolności do uczenia się chodzi więc o medal o dwóch stronach. Ukształtowane gatunkowo funkcje, które wskutek swej wielkiej ważności są od urodzenia „sztywno zaprogramowane”, mają zaletę skuteczności od samego początku i z reguły nieskomplikowany układ nerwów realizujących te funkcje, ale zarazem tę wadę, że zapewniają niewielką zdolność do dopasowywania się do zmiennych warunków otoczenia. Z drugiej strony ceną osobniczych procesów uczenia się jest początkowa bezbronność organizmu, gdyż wymagają one zazwyczaj stosunkowo złożonej struktury nerwowej. Mają za to zwiększoną możliwość dopasowywania się w okresie życia, a u człowieka ponadto niezwykłą zdolność dopasowywania środowiska do jego własnych potrzeb. Druga linia rozwoju gatunku ludzkiego obejmuje doskonalenie organizacji „wyposażenia” biologicznego. Pod pojęciem „organizacja” rozumiemy tu połączenie mnóstwa komórek składających się na jeden ustrój, w którym poszczególne narządy wypełniają określone zadania. Porównanie „wyposażenia” człowieka i niższych istot, jak – w skrajnym przypadku – jednokomórkowca, ujawnia ważną przewagę człowieka w odniesieniu zarówno do możliwości odwzorowywania wycinków otoczenia, jak i oddziaływania na środowisko za pomocą układu ruchowego, które ponadto u człowieka są z reguły nakierowane na osiąganie celów i mierzalnych skutków. Warunkujący tę przewagę wysoki stopień organizacji wymaga wewnętrznych mechanizmów zbornościowych i sterujących (w nazewnictwie psychologicznym „odwzorowań” lub „reprezentacji”), które z punktu widzenia neurobiologii są powiązane przede wszystkim z procesami w ośrodkowym układzie nerwowym. Takie minimalne wyposażenie obejmuje po pierwsze kanały kontaktu ze środowiskiem – a zatem „przetworniki” czuciowe (Transduktoren) i wykonawcze narządy ruchowe (Effektoren), które zapewniają przekształcenie informacji z otoczenia do postaci odpowiedniej dla ośrodkowego układu nerwowego, by mogły w nim powstać podniety ruchowe, po wtóre – nadrzędne układy wewnętrzne, odpowiedzialne za określenie celów i ocenę osiągniętych skutków i w których wytwarzają się podrzędne czuciowo-ruchowe struktury sterujące. Zgodnie ze sformułowanym w pierwszej części ścisłym określeniem pojęcia „ruchowy”, dalsze wywody ograniczą się do analizy podrzędnych sterujących struktur czuciowo-ruchowych. W niniejszym artykule ograniczenie to może się początkowo wydać dziwne, gdyż niezwykłość procesów uczenia się u ludzi w sposób oczywisty odnosi się do właściwości warstw nadrzędnych. Na przykładzie sportu: jedynie ludzie potrafią ocenić osiągnięty wynik – na przykład czas biegu na 100 metrów – w kontekście jego wartości w toku długotrwałego treningu. Również jedynie ludzie w ogóle stawiają sobie takie sztuczne cele, jakie są typowe w sporcie – produkt ewolucji kulturalnej, nie zaś naturalnej. Czy w takim kontekście warto w ogóle rozważać uczenie się ruchów w powiązaniu z ewolucją? Owszem – gdy uwzględni się fakt, iż szczególne osiągnięcia, obserwowane we wczesnym okresie rozwoju człowieka, nie mogą być skutkiem jakościowych zmian w sterujących strukturach czuciowo-ruchowych. Innymi słowy: Nie ma żadnego powodu, by przyjąć, że sterowanie czuciowo-ruchowe człowiek „odkrywa” od nowa. Może być raczej tak, że cechy sterowania czuciowo-ruchowego stanowią warunki brzegowe dla rozwoju kulturowego. Na przykładzie sportu: ukształtować mogą się tylko takie dyscypliny sportu, które można opanować na podstawie istniejącego „wyposażenia”, przyrodniczo-ewolucyjnego, a z drugiej strony istnieje pewne „wyposażenie”, filogenetyczne, które owo opanowanie umożliwia. Jeśli idzie o podrzędne procesy sterowania czuciowo-ruchowego – i tylko dla tych podrzędnych procesów – w dalszych rozważaniach będziemy wychodzić z założenia, że nie istnieją żadne zasadnicze różnice mię- – 60 – Uczenie się ruchów dzy ludźmi i np. innymi ssakami. Konieczne jest jednak uwzględnienie również tego, że nadrzędne wyznaczanie celów i ocena skutków wyglądają zupełnie inaczej u ludzi niż u przedstawicieli innych gatunków. Rozważane będzie jedynie to, jak owe cele i oceny oddziałują na utworzenie czuciowo-ruchowych warstw sterujących, nie zaś same procesy wyznaczania celów i oceny skutków. - - - - - 4. Uczenie się ruchów – ujęcie formalne W pkt. 2 wyjaśniliśmy, że nowoczesne teorie uczenia się wychodzą z założenia, iż czynności ruchowe wyłaniają się spontanicznie z bieżącej sytuacji w środowisku, wskutek czego osiąga się pożądany skutek (por. tab. 1). Właściwości spontaniczne powstają wskutek oddziaływania licznych składników układu dynamicznego, przy czym poszczególne składniki ani nie mają tej cechy, ani też nie są włączane do układu :z zewnątrz”. Ich powstanie pozostawałoby więc tajemnicze, gdyby nie dało się ich opisać w sposób formalny lub przedstawić w postaci symulacji. W tym celu opracowano kilka modeli uczenia się ruchów, w których właściwości układów dynamicznych przedstawiono w postaci sformalizowanych równań matematycznych [17]. Przy użyciu symulacji wykazano też, że ułożone układy równań są rozwiązywalne i że właściwości spontaniczne rzeczywiście z nich wynikają [18]. W dalszych rozważaniach chodzi o kontynuowanie w pewien sposób zapoczątkowanej w poprzednich podrozdziałach analizy czynnościowych aspektów sterowania ruchami. Ustalono wówczas, że w przypadku uczenia się S(R)E opisano przekonujący mechanizm uczenia się z perspektywy rozwojowoczynnościowej. Po rozważeniu pytania „Po co?”, całkowita analiza funkcjonowania obejmuje również wykazanie, iż mechanizmy, które można uznać za przekonujące, faktycznie działają. W niniejszym pkt. wyjaśnimy, jak uczenie się ruchów może pojawić się jako proces spontaniczny. Ponieważ niezbędne formalizacje zawsze będą odnosiły się do układów dynamicznych, mowa będzie nie o „organizmach” czy o „przedmiotach analizy”, ale będziemy używać obojętnego pojęcia „ustrój”. Omawiane w tekście formalizacje zostaną dokładniej przedstawione w ramkach-dygresjach. Ci spośród Czytelniczek i Czytelników, którzy nie przepadają za wzorami i schematami, mogą je pominąć i przejść do dalszego tekstu. Zachowanie ustroju dynamicznego zależy zarówno od jego stanu, jak i oddziałujących nań sił. Sterowanie ruchami oznacza więc, że nasz ustrój czuciowo-ruchowy celowo oddziałuje na układ otoczenia. Patrząc przez pryzmat teorii sterowania, ów ustrój czuciowo-ruchowy można zatem określić mianem członu sterującego, zaś otoczenie, które ma być „sterowane” – mianem przestrzeni działania. Do tego celu nasz ustrój wykorzystuje siły wywierane wskutek ruchów (czyli, w nazewnictwie psychologicznym, odpowiedzi). Otoczenie oddziałuje na ów ustrój również przez siły (w nazewnictwie psychologicznym – bodźce). Problem uczenia się ma zatem dwa oblicza. Po pierwsze – stan otoczenia jest nieznany, ale musi zostać odtworzony w naszym umyśle (postrzeżony) na podstawie działających sił. Po wtóre – nie wiadomo, jakie skutki w wyniku jakich odpowiedzi i w jakich warunkach zostaną spowodowane. Do pierwszego problemu powrócimy później. Drugi – sterowanie nieznanym ustrojem dynamicznym – jest przedmiotem wytężonych badań. Potężnym narzędziem rozwiązania jest strategia sterowania za pomocą modelu wewnętrznego (internal model control) [19]. W tym celu buduje się wewnętrzny model sterowanego układu, który służy do przewidywania, jakie działania członu sterującego będą oddziaływały na jakie zadania w przestrzeni działania. Można też dzięki niemu wewnętrznie przewidzieć błąd zanim wydarzy się on w rzeczywistości. W opisywanym przypadku nasz ustrój musi się nauczyć modelu otoczenia, aby z jego pomocą móc przewidywać, jakie jego odpowiedzi, przy jakich postrzeżonych warunkach otoczenia, jakie będą miały skutki. Model ten nazwany jest w teorii steromodelem prostym wania „modelem prostym” (Vorwärtsmodell, direct model). Można zauważyć, że zawiera nie tylko błąd przewidywany, ale informację zwrotną o różnicy między skutkami faktycznymi a przewidywanymi. Jordan [17] zdołał wykazać, że dla problemu uczenia się ruchów poprzez ruchy, którymi nie mogą sterować informacje zwrotne, zawodzą strategie rozwiązań nie zawierające wewnętrznego modelu prostego. Celem uczenia się ruchów nie jest jednak poprawne przewidywanie zachowania się otoczenia, ale zmienianie go odpowiednio do własnych potrzeb. Pożądany stan otoczenia powinien zostać osiągnięty dzięki odpowiedzi środowiska. Trzeba zatem odpowiednio nauczyć człon sterujący. Ponieważ jednak dynamika otoczenia nie jest znana, przy danym błędzie zachowania nie wiadomo, co mianowicie należy zmienić w ruchu, by zmniejszyć ów błąd. Przy uczeniu się sterowanym z zewnątrz (distal überwachte Lernen, distal controlled learning) [18] problem ten jest dokładnie rozwiązywany za pomocą modelu prostego, w którym na podstawie zmian podniet ruchowych (Efferenzen) ocenia się zmiany w otoczeniu. Błąd zachowania, tzn. różnica między – 61 – - - - - - Ernst-Joachim Hossner, Stefan Künzell pożądanym i rzeczywiście uzyskanym stanem otoczenia, za pośrednictwem modelu prostego zostaje przekształcony w błąd podniet ruchowych, czyli różnicę między podnietami ruchowymi pozwalającymi osiągnąć cel a podnietami faktycznymi. Nie chodzi przy tym bezwzględnie o to, aby właściwie przewidzieć zmiany ilościowe. Nierzadko do tego, by umożliwić uczenie się, wystarczy jedynie kierunek zmian. Modelu prostego nie trzeba się więc wyuczyć doskonale, ale jedynie w przybliżeniu. Jeżeli człon sterujący jest wyuczony, odpowiada modelowi odwrotnemu (inverse Modell, inverse model). Gdybyśmy chcieli opisać oba modele językiem nauki o sporcie, wówczas model odwrotny byłby bliski modelowi sterowania ruchami, natomiast model prosty należałoby powiązać z wyobrażeniem lub wyczuciem ruchu [20]. Należy zauważyć, że istnieje wiele właściwych odpowiedzi, aby dysponując obrazem postrzeganego stanu otoczenia osiągnąć pożądany stan tego otoczenia. Mieści się w tym problem stopni swobody (Problem der Freiheitsgrade, degrees of freedom problem), sformułowany po raz pierwszy przez Bernszteina [1] i zwany „problemem Bernsztejna”. Pojawia się on jednak tylko wówczas, gdy chodzi o to, by z mnóstwa możliwych rozwiązań ustalić jedno, ściśle określone. W przypadku rozważanego tu ujęcia spontanicznego, jedno z możliwych rozwiązań wynika w sposób oczywisty z dynamiki ustroju. Niedookreślenie jest więc pewnym ułatwieniem. W dalszych krokach uczenia się można wskutek uwzględnienia dodatkowych warunków brzegowych znaleźć rozwiązanie optymalne. Jest to tym trudniejsze, im mniej istnieje stopni swobody. Jak więc wygląda – powracając do pierwszego z wymienionych problemów uczenia się – zagadnienie wewnętrznej konstrukcji stanu otoczenia na podstawie oddziałujących na ustrój bodźców? W dotychczasowych rozważaniach przyjęliśmy milczące założenie, że ten problem już został rozwiązany, gdyż postrzeganie „rzeczywistego” stanu otoczenia jest zawsze bez błędu, czyli pomijamy ewentualne błędy postrzegania. W przedstawionym w podrozdziale 2 modelu Hoffmanna, opisującym przewidywanie zachowania się, wychodzi się z dokładnie odwrotnego założenia: że błąd zachowania wynika nie z błędnego ruchu, lecz z niedostatecznie różnicującego postrzegania. Wynika stąd, że w mechanizmie opisanym przez Hoffmanna niezgodność skutku przewidywanego i rzeczywistego powoduje zmianę postrzegania otoczenia, natomiast u Jordana i Rumelharta w takiej samej sytuacji musi ulec dostosowaniu składowa ruchu. Ponownie pojawia się tu problem niedookreślenia [22, 23], gdyż powstaje pytanie, jak ustrój ma rozpoznać, czy błąd zachowania jest spowodowany błędem postrzegania (rozpoznania), błędem przewidywania (planowania), czy też błędem ruchu (wykonania)? Problem ten był dotychczas w literaturze traktowany po macoszemu, nie przedstawiano też propozycji jego rozwiązań. Zdaniem autorów, obiecujący sposób jego rozwiązania mógłby polegać na tym, że ustrój odkrywa nieustannie pojawiające się, swoiste dla danych cech, zgodności bodziec-sytuacja. W pierwszym przybliżeniu można do tego wykorzystać zgodność między bodźcami „nieczuciowymi”, wewnątrzpochodnymi (interozeptiv), a bodźcami zewnątrzpochodnymi (exterozeptiv). Wnioski formułuje się przy tym jedynie na podstawie bodźców „nieczuciowych”. Von Holst i Mittelstaedt [24] zajmowali się zagadnieniem zmian na siatkówce oka powodowanych przez odbierane bodźce. Okazało się, że są one różnie interpretowane w zależności od tego, czy porusza się otoczenie, czy oczy. Uczeni doszli do wniosku, że zmiany obrazu na siatkówce wynikające z ruchu oczu można przewidywać na podstawie podniet ruchowych przesyłanych do mięśni oka. Może się to dokonać przez przetworzenie zestawu podniet ruchowych (Efferenzkopie, efferent copy), bez wykorzystywania czuciowych informacji zwrotnych. Przetwarzanie zestawów podniet ruchowych zwane jest „nieczuciową informacją zwrotną” [24]; wynika stąd pozornie paradoksalne pojęcie „bodźca nie-czuciowego” (nicht-sensorischer Stimulus, no-sensory stimulus). Nasza propozycja rozwiązania problemu niedookreślenia polega na tym, że np. dla swoistości każdego zmysłu (Sinnesmodalität) należy wyuczyć się swoistych modeli prostych. Łącznie rozmaite modele proste odwzorowują przewidywanie pożądanych skutków zachowania. Duża rozbieżność między tworzącymi tę całość modelami prostymi swoistymi dla różnych zmysłów (np. między zmysłem równowagi a zmysłem wzroku podczas żeglowaniu na statku po wzburzonym morzu [26] może prowadzić do złego samopoczucia. Później jednak służy do uczenia się nowych warunków wyjściowych – co zostało potwierdzone również w doświadczeniach z okularami pryzmatycznymi – w których manipuluje się postrzeganiem wzrokowym (por. artykuł [27]). Główne i – według niniejszych rozważań – możliwe do przyjęcia założenie polega na tym, że najwyższy priorytet należałoby przyznać spoistości postrzegania (Konsistenz der Wahrnehmung). Jeżeli zatem pojawiają się różnice w zestawieniu ze świadectwem pochodzącym od modelu prostego nieczuciowego, od wewnątrzpochodnego i od zewnątrzpochodne- – 62 – - - - - - Uczenie się ruchów go, wynika stąd, iż należy zróżnicować postrzeganie. Ten mechanizm odpowiada propozycji Hoffmanna. Jeżeli natomiast różnice nie pojawiają się, czyli przewidywania skutków różnymi zmysłami dostatecznie dobrze zgadzają się, przechodzimy do problemu, czy spodziewany skutek rzeczywiście nastąpił. Jeżeli tak, dochodzi do wzmocnienia triady S(R)E; jeżeli nie – należy zmienić składnik R. Ten mechanizm odpowiada propozycji Jordana i Rumelharta. W mniejszym stopniu wywodzi się w tym przypadku z założenia, że chodzi o wyraźną decyzję odnośnie do wybranego dopasowania. Należy raczej skłonić się ku poglądowi, że wzmocnienia i poprawki zależą od stopnia zgodności swoistych dla różnych zmysłów przewidywań i rzeczywistych skutków. Taka sama zasada wzajemnego wyrównywania i wynikającego z niego rozdziału poprawek między różne mechanizmy kontrolne może służyć do wytłumaczenia zdolności uczenia się ruchów również w późniejszych stadiach uczenia się, w których nie chodzi o wyuczenie się początkowych kategorii postrzegania i ruchu (por. również [28]). Jest to zadanie mechanizmu dochodzenia do zgodności pożądanego, przewidywanego i rzeczywiście osiągniętego stanu otoczenia. Jeżeli skutki rzeczywisty i przewidywany są zgodne, ale oba nie odpowiadają skutkowi pożądanemu, należy dopasować model odwrotny (por. pkt 5, przykład 1), który w równym stopniu oddziałuje na skutek rzeczywisty i przewidywany. W przypadku zgodności skutku przewidywanego i pożądanego, które jednak nie odpowiadają skutkowi rzeczywistemu, należy zmienić postrzeganie (por. pkt 5, przykład 2). Jeżeli wreszcie zgodne są skutki rzeczywiste i pożądane, ale nieprzewidywany, to trzeba dopasować model prosty (por. pkt 5, przykład 3). Po wyposażeniu w oba opisane dodatkowe mechanizmy (według Hoffmanna oraz według Jordana i Rummelharta – przyp. tłum.) muszą się udać skuteczne symulacje, w których rezygnuje się zarówno z wychodzenia z już zróżnicowanego postrzegania, jak i z założenia, że składnik R nie wymaga żadnego dopasowania zależnego od uczenia się. Ostatecznie otrzymuje się w ten sposób teoretyczny model procesu uczenia się, który wprawdzie w hierarchii sterowania ruchami ogranicza się do „głębokich” mechanizmów sterowania (pkt 1), tu jednak jest przypisany do nowoczesnych teorii uczenia się S(R)E z założeniem spontanicznego sterowania ruchami (pkt 2). Okazuje się on wiarygodny zarówno z czynnościowego (pkt 3), jak i formalnego (podrozdział 4) punktu widzenia. Jak to będzie wyglądać, gdy w pkt 5 zechcemy przyjrzeć się podstawowej myśli tego modelu uczenia się na przykładzie ustroju przykładowego? 5. Zamiast podsumowania: Dzieje uczenia się ustroju przykładowego Załóżmy, że umieszczamy w świecie rzeczywistym ustrój przykładowy, któremu – by procsey ucznia się ruchów móc obserwować w „czystej” postaci – nie dajemy żadnych wskazówek na drogę. Musi on więc uczyć się od samego początku. Podobnie jak wszyscy przedstawiciele gatunku ustrojów przykładowych, jest on zdolny do ruchu. Jest także wyposażony w zmysły, dające mu wiedzę o stanie jego ciała oraz jego otoczenia. Dokładniej trzeba powiedzieć, że zmysły jedynie mogą mu tę wiedzę dawać, gdyż na początku istnienia nasz ustrój przykładowy otrzymuje tylko pozbawiony znaczenia, niemożliwy przezeń do zinterpretowania ciąg bodźców – i dlatego nie dzieje się tu nic innego, jak tylko niekontrolowane miotanie się. Kiedy się temu przyjrzeć jeszcze dokładniej: ciąg postrzeżeń nie jest dla ustroju całkowicie pozbawiony znaczenia, gdyż niektóre bodźce z wnętrza ciała dają mu bezpośrednio uczucie, że coś nie jest w porządku. Później można powiedzieć, że odczuwa głód lub pragnienie, że jest mu za ciepło lub za zimno lub że pragnie być pogłaskany. W danej chwili nic nie „wie” o tych znaczeniach i zamiast tego postrzeżenie ogranicza się do „bardziej-lub-mniej-dobrze”. Pod pewnym względem ów przykładowy ustrój jest jednak wyposażony w zamiary – nawet jeśli są one grubo ciosane, przyjmujące na przykład postać: więcej bardziej dobrego i mniej mniej dobrego. Ustrój nie wie, że podczas całego jego dalszego życia w tym pierwotnym stanie nie zajdą żadne gruntowne zmiany. Ale to chyba dobrze. Załóżmy, że typowe dla ustroju przykładowego otoczenie wymaga, aby w późniejszym okresie istnienia sam się o siebie troszczył. Do przeżycia ważne są dwie rzeczy: początkowo pozbawiony znaczenia ciąg postrzeżeń musi ulec zróżnicowaniu, a miotanie się musi zostać opanowane. Jak może się to udać? Podstawowa strategia – której ustrój, naturalnie, nie może „przemyśleć” i która wcześniej musi w nim zostać na stałe „zaprogramowana” – może polegać na tym, że poszukuje się zależności. Takie zależności mogą pojawiać się miedzy różnymi układami zmysłów, między układami ruchowymi i czuciowymi oraz między ruchowością/czuciowością a systemem ocen, który ustala, czy rzeczywiście wszystko zmierza w kierunku „bardziej dobrze” lub „mniej dobrze”. Odpowiadałoby to np. następującym obserwacjom: kiedy przed moimi oczami poruszają się czerwono-żółte kule, słyszę grzechot; obserwacje te w jakiś sposób się łączą. Mocne wierzganie nogami i ból stóp również. Coś wspólnego ze sobą ma rów- – 63 – - - - - - Ernst-Joachim Hossner, Stefan Künzell nież krzyk i karmienie, a kiedy pojawia się inny ustrój przykładowy, znacznie większy ode mnie, jestem głaskany. Co należy jeszcze raz podkreślić: nie są to, naturalnie, zdania, którymi myśli o tych zdarzeniach ustrój przykładowy, ponieważ nie wie nic ani o kulach, ani o barwach, nie ma też pojęcia, co to znaczy powiedzieć „ja”. Niemniej zgodności nie są przez to mniej przydatne ustrojowi do budowy pierwszych struktur (sterujących – przyp. tłum.) Aby struktury te zyskały znaczenie, musi chodzić o coś więcej niż same tylko zależności. Ustrój przykładowy musi się nauczyć, w jakich warunkach jakie zachowanie prowadzi do jakich skutków. Załóżmy, że nasz ustrój przykładowy rośnie w laboratorium biologa zajmującego się zachowaniem organizmów żywych. W laboratorium tym naciśnięcie niebieskiego przycisku umieszczonego na prawo od ustroju uruchamia mechanizm podający mu smaczną i pożywną pigułkę. O mechanizmie tym ustrój nie wie absolutnie nic. Objaśnienie jego działania nie jest mu do niczego przydatne, gdyż w tym czasie ustrój przykładowy żyje jeszcze w nurcie postrzeżeń zupełnie pozbawionych znaczenia. Zauważa jedynie, że w danej chwili sprawy biegną w kierunku „mniej dobrze”, ponieważ jest głodny i czyni wszystko, co w jego mocy, aby usunąć tę dolegliwość: dziko się miota. W trakcie tego przypadkowo trafia na przycisk, otrzymuje pożywną pigułkę, je do syta i czuje się „bardziej dobrze”. Po pewnym czasie znowu głodnieje, miota się, naciska znowu przycisk, otrzymuje porcję jedzenia i czuje się znowu bardziejdobrze. Wyraźnie opłaca się ustrojowi przykładowemu zapamiętanie tego toku zdarzeń. W szczególności powinien zapamiętać następujące szczegóły: kiedy jestem głodny, muszę osiągnąć stan, w którym odnajdę i ujrzę moją rękę na przycisku po prawej stronie ode mnie, gdyż wówczas otrzymam pożywną pigułkę, którą się nasycę. Zdanie to nie musi zostać tak sformułowane przez ustrój przykładowy: wraz z przyrostem doświadczenia będzie jednak z pewnością tak działać, jak gdyby zdanie owo było przyswojone. Jeżeli tak jest, oznacza to, że ustrój się czegoś nauczył. Załóżmy, że nasz biolog tak umieszcza nasz ustrój przykładowy, by niebieski przycisk znalazł się nie po prawej stronie, lecz po lewej od niego. Co zatem powinien uczynić ustrój, kiedy następny raz zgłodnieje? Będzie, oczywiście, znowu sięgał w prawo, ponieważ nauczył się, że taki ruch zostaje nagrodzony pożywną pigułką. Pod tym względem ustrój przykładowy nie różni się od kierowcy samochodu, który w swoim nowym aucie włącza światło tak samo, jak w starym – i stale uruchamia w ten sposób wycieraczki! Tym razem jednak pożywnej pigułki nie ma. Ustrój jest zdezorientowany, gdyż ręka czuje się tak samo, jak dotychczas, kiedy otrzymywał pożywną pigułkę. W jakiś sposób osiągnięty stan jest jednak inny. Brakuje wyczucia przycisku pod ręką i nie widać, jak ręka leży na przycisku. Jeżeli ustrojowi przykładowemu przyjdzie na myśl, że również warunki początkowe są inne, znajdzie się na dobrej drodze; to, czego się bowiem dotychczas nauczył, wydaje się „działać” jedynie pod warunkiem, ze „niebieski” widzi po prawej. W przypadku „niebieski po lewej” układ znowu musi się miotać dopóty, dopóki przypadkiem nie naciśnie przycisku i nie otrzyma pożywnej pigułki. Kiedy jednak zdoła tego dokonać – a biolog jest na tyle złośliwy, że będzie stale zmieniał położenie naszego ustroju względem przycisku – wówczas ustrój przykładowy osiągnie coraz większą kompetencję, by swoją rękę w zależności od warunków celowo kierować ku przyciskowi. Zyskuje wówczas coś na kształt czuciowo-ruchowej koncepcji kierunku. Jednakże całkowicie brakuje mu jeszcze koncepcji okrągłego lub kanciastego, niebieskiego lub zielonego, przycisku lub guzika itp. Niemniej nasz ustrój przykładowy znajduje się na najlepszej drodze, by zróżnicować swój osobisty obraz świata. A ponieważ wzrasta w laboratorium biologa zajmującego się zachowaniem, należy oczekiwać, że ów uczony przygotował dla naszego ustroju przykładowego jeszcze mnóstwo doświadczeń różnego rodzaju. Załóżmy, że nasz ustrój przykładowy pewnym nakładem sił dość sporo się nauczył. Teraz będzie się uczył jeździć na nartach. Nie jest to łatwe, gdyż zbocza narciarskie wyglądają zazwyczaj inaczej niż laboratoria biologów. Wprawdzie nasz ustrój ma już pewne pojęcia o tym, jak się poruszać w górę i w dół, ale nie wie, jak zachować równowagę na oślizłych powierzchniach ośnieżonych. Dlatego – nieco ironicznie – pierwsze próby narciarzy na śniegu przypominają nieco miotanie się w laboratorium. Po pewnym okresie gromadzenia doświadczeń ruchowych metodą prób i błędów oraz wspierania metodycznymi poradami instruktora narciarstwa, nasz ustrój będzie w stanie zjechać prosto po przyczepnym śniegu w dół łagodnego zbocza. Do tego jednak, by został dobrym narciarzem, droga jest jeszcze daleka. Załóżmy więc, że nasz ustrój przykładowy nie tylko „jakoś” bez pomocy chce dostać się do podnóża zbocza, ale ponadto tworzy wyobrażenie o tym, jak powinno się to odbyć, np. poprzez jazdę slalomem o ostrych skrętach. Nie wie jednak, jak będzie to odczuwał (wyrażając to formalnie: nie ma odpowiedniego modelu prostego.) W przeciwieństwie do okresu swego życia w laboratorium biologa, nie jest – 64 – Uczenie się ruchów w tym przypadku skazany jedynie na metodę prób i błędów. Może omawiać ze swoją instruktorką narciarstwa, w którym kierunku powinien próbować, aby osiągnąć pożądane skutki zachowania. Owe pożądane skutki zachowania (powinny pojawić się jako Ereal) doprowadzają do przewidywania skutków zachowania (pojawiają się jako Eant) i do postrzegania rzeczywistych skutków zachowania (pojawiają się jako Ereal) – czego ustrój potrzebował już w warunkach laboratoryjnych. Przed ustrojem stają więc następujące trzy zadania uczenia się, które prowadzą do różnych dostosowań. Zadanie dydaktyczne 1 1: Nasz ustrój stale zsuwa się przy jeździe w skos zbocza poprzecznie do kantów nart. Może to sam wyczuć, dostrzec i usłyszeć. Rzeczywiste skutki nie odpowiadają zatem ani pożądanym, ani przewidywanym. Na podstawie swego doświadczenia ruchowego nasz ustrój wie jednak, co należy zrobić: kolana trzeba nachylić bardziej w kierunku zbocza. Przy następnym zjeździe ustrój poprawia więc odśrodkowe podniety ruchowe do mięśni tak, że udaje mu się pojechać w skos zbocza bez ześlizgiwania się. Zadanie dydaktyczne 2 2: Instruktorka narciarstwa (pod względem złośliwości podobna do biologa zajmującego się zachowaniem) prowadzi nasz ustrój na inny stok, na którym znajdują się miejsca oblodzone. Wprawdzie ustrój jedzie tak, jak dotychczas, ale wkrótce upada na nos – jeśli założymy, że ma nos. Znowu rzeczywiste skutki nie odpowiadają pożądanym, po części przewidywanym, gdyż ruch sam w sobie był odczuwany zgodnie z oczekiwaniami, ale skutek ruchu był zupełnie inny. Dla ustroju oznacza to teraz, że musi zróżnicować postrzeganie pod względem przyczepności podłoża i próbować dostosować do tego ruchy. Zadanie dydaktyczne 3 3: O tym, co wynika z ruchu narciarza w danych warunkach, ustrój uczy się ustawicznie, przy każdym wykonaniu ruchu i również wówczas, gdy nie powinien pojawić się skutek rzeczywisty. Być może ustrój sam zostanie instruktorem narciarstwa i może wówczas przy pokazach bocznego zsuwania się sięgnąć do doświadczeń z zadania 1. Być może będzie jednak pracował jako ustrój pokazowy i wówczas z zadania 2 wie, jak wykonywać widowiskowe upadki na oblodzonym stoku. Ruch może jednak nagle i niespodziewanie dać pożądany skutek: – to jest treścią zadania 3. By to unaocznić załóżmy, że nasz ustrój chce ostatecznie jechać slalomem. Wie, jak to wygląda, próbował już wiele razy, ale zawsze ponosił klęskę. Również przy następnej próbie oczekuje, że wyjedzie nartami poza tor slalomowy. Jednakże dzięki nierówności podłoża ustawia się – niezależnie od swej woli – we właściwej pozycji początkowej i nieoczekiwanie jego narty jadą po śniegu niczym po szynach. – Eureka! – cieszy się. – To jest to, czego od dawna pragnąłem! W tym przykładzie rzeczywisty skutek nie odpowiada oczekiwanemu, ale zgadza się z pożądanym. To, czego się ustrój nauczył, to poczucie ruchu związane z wirażem; będzie się starał odtworzyć owo poczucie również następnym razem. Załóżmy, że po licznych próbach uczenia się nie tylko w laboratorium, ale również na stoku, wszystko idzie jak najlepiej. Przy postrzeganych warunkach początkowych oczekiwane skutki pojawiają się na pewno i nie ma już żadnych niespodzianek przy zestawieniu skutków spodziewanych i pożądanych. „Potrafię jeździć na nartach!” – cieszy się nasz ustrój przykładowy i każe się sfilmować na wideo przez zaprzyjaźniony ustrój, jak śmiga po zboczu. Kiedy pierwszy raz widzi się na filmie, jest jednak przerażony, gdyż odkrywa, że siedzi na tyłach nart i wygląda to głupio. - O tym nie pomyślałem! – martwi się ustrój przykładowy. – Tak dobrze to odczuwałem! A tak mocno siedzę na tyłach nart! Muszę jeszcze wiele, wiele się nauczyć! Chcielibyśmy nasz ustrój troszkę pocieszyć, gdyż wbrew popularnemu przysłowiu, czego się mały ustrojek przykładowy nie nauczył, tego duży ustrój przykładowy może się jeszcze nauczyć. PIŚMIENNICTWO • LITERATURE - - [1] [2] - - - [3] Nitsch JR & Munzert J: Handlungstheoretische Aspekte des Techniktrainings. Ansätze zu einem integrativen Modell. In J.R. Nitsch, A. Neumaier, H. de Marées & J. Mester (Hrsg.), Techniktraining. Beiträge zu einem interdisziplinären Ansatz (S. 109-172). Schorndorf: Hofmann, 1997 Hacker W:. Allgemeine Arbeits- und Ingenieurpsychologie. Berlin: Volk und Wissen, 1973 Bernstein NA: Die Entwicklung der Bewegungsfertigkeiten. Leipzig: IAT Eigenverlag, 1998 [4] [5] [6] [7] – 65 – Meinel K & Schnabel G: Bewegungslehre – Sportmotorik (9. stark überarbeitete Aufl.). Berlin: Sportverlag, 1998 Thorndike EL: Human Learning. New York: Century, 1931 Pawlow IP: Gesammelte Werke. Band 3. Berlin: Akademie, 1953 Schmidt RA: A schema theory of discrete motor skill learning. Psychological Review, 1975; 82: 229261 Ernst-Joachim Hossner, Stefan Künzell [19] Narendra KS : Adaptive Control: Neural Network Applications. In M.A. Arbib (Ed.), The Handbook of Brain Theory and Neural Networks (pp. 69-73). Cambridge, Mass.: MIT Press, 1995 [20] Künzell S: Computermodelle aus dem Blickwinkel der handlungstheoretischen Psychologie. In D. Hackfort, J. Munzert & R. Seiler (Hrsg.), Handeln im Sport als handlungspsychologisches Modell (S. 115-130). Heidelberg: Asanger, 2000a [21] Bernstein NA: The Coordination and Regulation of Movements. Oxford: Pergamon Press, 1967 [22] Hossner E-J: Bewegende Ereignisse – ein Versuch über die menschliche Motorik. Unveröffentlichte Habilitationsschrift, Universität Heidelberg, 2002 [23] Künzell S: Die Bedeutung der Efferenzkopie für das motorische Lernen. Unveröffentlichte Dissertation, Universität Gießen, 2002. [24] Holst E von & Mittelstaedt H: Das Reafferenzprinzip. Naturwissenschaften, 1950; 37: 464-476. [25] Desmurget M & Grafton S: Forward modeling allows feedback control for reaching movements. Trends in Cognitive Sciences, 2000; 4: 423-431. [26] Stadler M: Psychologie an Bord (5., überarb. und erw. Aufl.). Bielefeld: Klasing, 1999 [27] Heuer H: Bewegungslernen. Stuttgart: Kohlhammer, 1983 [28] Künzell S: Learning the Basics. In AISB (Ed.), Time for AI and Society. Proceedings for the AISB’00 Symposium on How to Design a Functioning Mind (pp. 151152). Birmingham: University of Birmingham, 2000b [29] Gibson JJ: Wahrnehmung und Umwelt. München: Urban & Schwarzenberg, 1982 [30] Volpert W: Das Modell der hierarchisch-sequentiellen Handlungsorganisation. In W. Hacker, W. Volpert & M. von Cranach (Hrsg.), Kognitive und motivationale Aspekte der Handlung (S. 38-58). Bern: Hüber, 1983 - - - - - [8] Adams JA: A closed-loop theory of motor learning. Journal of Motor Behavior, 1971; 3: 111-150. [9] Munzert J: Flexibilität des Handelns. Köln, 1989, bps. [10] Bernstein NA: The Problem of the Interrelation of Coordination and Localization. In H.T.A. Whiting (Ed.), Human Motor Actions. Bernstein Reassessed (pp. 77119). Amsterdam: North-Holland, 1984 [11] Nitsch JR & Munzert J: Handlungstheoretische Aspekte des Techniktrainings. Ansätze zu einem integrativen Modell. In J.R. Nitsch, A. Neumaier, H. de Marées & J. Mester (Hrsg.), Techniktraining. Beiträge zu einem interdisziplinären Ansatz (S. 109-172). Schorndorf: Hofmann, 1997 [12] Klix F: Die Natur des Verstandes. Göttingen: Hogrefe, 1992 [13] Hoffmann J: Vorhersage und Erkenntnis. Göttingen: Hogrefe, 1993 [14] Hoffmann J: Das ideomotorische Prinzip, Closed Loops und Schemata. In J.R. Nitsch & H. Allmer (Hrsg.), Denken – Sprechen – Bewegen (S. 69-75). Köln, 2001, bps. [15] Elsner B & Hommel B: Effect anticipation and action control. Journal of Experimental Psychology: Human Perception and Performance, 2001, 27: 229-240 [16] Neumann O: Theorien der Aufmerksamkeit: Von Metaphern zu Mechanismen. Psychologische Rundschau, 1992, 43: 83-101 [17] Jordan MI: Komputationale Aspekte der Bewegungssteuerung und des motorischen Lernens. In H. Heuer & S. Keele (Hrsg.), Enzyklopädie der Psychologie. Themenbereich C, Theorie und Forschung. Serie II, Kognition. Band 3, Psychomotorik. (S. 87-146). Göttingen: Hogrefe, 1994 [18] Jordan MI & Rumelhart DE: Forward models: Supervised learning with a distal teacher. Cognitive Science, 1992, 16, 307-354. – 66 – Uczenie się ruchów Dodatek: Appendix: Formalizacja matematyczna i kontrolno-teoretyczna Mathematical and control-theoretical formalization otoczenie Se t+Ät model odwrotny E model prosty + hw(S) Enviroment – Sat+Ät – + Se Schemat przedstawia metodę uczenia się kierowanego z zewnątrz (według Jordana, 1994, s. 134) zgodnie z notacją teorii kontrolnej. Ustrój uczący się otoczony jest liniami przerywanymi. Będące podstawą symulacji równania modelu prostego (1) i odwrotnego (2) są następujące: t+Ät [1] hw [Sa [1] hw [Sa Sat+Ät – + (t)] = fm{hw[S(t), m[E(t-ct)]} t+Ät [2] m[E(t-ct)] = gm {hw [Se (t)], hw[S(t)]} (t)], hw[S(t)]} gdzie: hw – funkcja postrzegania, fm – umysłowe odwzorowanie otoczenia, gm – umysłowe odwzorowanie ruchu, E – podniety ruchowe, m – przekształcenia podniet ruchowych przez mięśnie w ruch, Sa – bodziec oczekiwany, Se – bodziec pożądany, S – bodziec rzeczywisty, t – czas. where: hw – perception function, fm – mental representation of the environment, gm – mental representation of the movement, E – efferences, m – transformation of efferences into movement by muscles, Sa – expected stimulus, Se – desirable stimulus, S – actual stimulus, t – time. Daną wyjściową z modelu prostego jest przewidywany w chwili t bodziec hw [Sat+Ät(t)] postrzegany w chwili czasu t+Ät. Parametrami modelu prostego są: bieżący stan otoczenia zadany postrzeganym w chwili t bodźcem S oraz utworzonymi w modelu odwrotnym, po pewnym nieznanym czasie przetwarzania ct, pozostającymi do dyspozycji podnietami ruchowymi E. Danymi wyjściowymi modelu odwrotnego są powodujące ruch podniety ruchowe (Efferenzen). Parametrami wejściowymi są: postrzegany bieżący stan otoczenia hw[S(t)] oraz pożądany na chwilę t+Ät t+Ät postrzegany stan środowiska hw [Se (t)]. The outcome of the forward model is stimulus hw [Sat+Ät(t)], anticipated at the moment t, which will be perceived at the moment t+Ät. Forward model parameters are: actual environment state, represented by stimulus S, perceived at the moment t, as well as disposable efferences E, created in the inverse model after unknown transformation period ct. The outcome of inverse model are efferences evoking the movement. The incoming parameters are: perceived actual state of environment hw[S(t)] and desirable at the moment t+Ät, perceived state t+Ät of the environment hw [Se (t)]. - Forward model In the scheme there is shown the distal learning method (Jordan, 1994, p. 134), presented according to control theory notation. The learning system has been enclosed by dashed lines. The following equations form the basis of the forward model (1) and the inverse one (2): - - [2] m[E(t-ct)] = gm {hw [S E – t+Ät (t)] = fm{hw[S(t), m[E(t-ct)]} t+Ät e Inverse model t+Ät + hw(S) – 67 –