Jerzego Żyżyńskiego - Instytut Organizacji i Zarządzania

Transkrypt

Jerzego Żyżyńskiego - Instytut Organizacji i Zarządzania
Prace Naukowe Instytutu Organizacji
i Zarządzania Politechniki Wrocławskiej
Wyd. Oficyna Wydawnicza Politechniki
Wrocławskiej, Wrocław 2003; pp 279-291
Jerzy ŻYŻYŃSKI*
PROCES UCZENIA SIĘ JAKO PODSTAWA MECHANIZMU
ROZWOJU SYSTEMU
Systemy uczące się stanowią obszar dynamicznego rozwoju w okresie ostatnich lat dzięki rozwojowi teorii sztucznej inteligencji, a w jej ramach między innymi dzięki osiągnięciom zastosowań
teorii sieci neuronowych. Autor omawia pojęcie systemu uczącego się, jego podstawowe definicje,
i przedstawia podstawowe metody i techniki realizacji procesu uczenia się opracowane przez teorię
systemów uczących się. Wskazuje, że podstawowe znaczenie dla procesu uczenia się ma mechanizm
i metodologiczna podstawa tworzenia obrazu otoczenia, w jakim działa dany system. Przedstawia
schemat procesu uczenia się, w którym realizowane jest rozpoznawanie otoczenia i ewentualne korygowanie jego obrazu. System realizujący proces uczenia się w ramach danej teorii autor nazywa prostym systemem uczącym się (PSU). Autor wprowadza podział systemów uczących się na dwie kategorie: PSU jest kategorią niższą, podstawową. Wyższym etapem rozwoju systemu jest przejście do
poziomu inteligentnych systemów uczących się (ISU) – jest to druga kategoria systemów uczących
się.
Teoria systemów uczących się stanowi pełen obiecujących perspektyw kierunek
rozwoju teorii systemów, gdy po okresie pewnego zastoju na przełomie lat siedemdziesiątych i osiemdziesiątych, otrzymała nowy bodziec dzięki postępom technologii
komputerowych i osiągnięciom teorii sztucznej inteligencji.
Podstawowe jej pojęcie - uczenie się - jest rozumiane jako po pierwsze, proces poprawy jakości działania systemu według pewnego kryterium na podstawie doświadczeń z przeszłości; po drugie, jako doskonalenie metody rozwiązywania zadań pewnej
klasy na podstawie informacji uzyskanych na podstawie wcześniejszych prób rozwiązania innych zadań tej klasy; po trzecie, jako zdobywanie wiedzy lub umiejętności,
reprezentowanie jej wewnątrz systemu i stosowanie jej w wykonywaniu zadania.1
__________
*
Uniwersytet Warszawki, Wydział Zarządzania; [email protected]
Por. P. Cichosz, Systemy uczące się. WNT Warszawa 2000; strona internetowa <Pawel Cichosz –
strona przedmiotu „Uczenie się maszyn” – notatki do wykładów>.
1
280
Jerzy Żyżyński
Pierwsze dwie definicje wiążą się z procesem działania systemu w sensie ogólnym
i procesem rozwiązywania zadań - co jest pewną węższą kategorią działania. Obie
określają zatem pewną dynamikę systemu, ukierunkowaną na realizację pewnych
celów.
Trzecia definicja jest bliższa potocznemu rozumieniu uczenia się – jako gromadzenia wiedzy. Przez wiedzę rozumie się zasób wiadomości, czyli zbiór pewnych
reprezentacji bytów, których wiadomości dotyczą (bytów odniesienia) – na przykład
faktów z określonej dziedziny (wiedza geograficzna, biologiczna), opisów praw przyrody i praw rządzących innymi dziedzinami (wiedza o prawach fizyki, prawach ekonomii, twierdzeniach matematyki), metod działania (wiedza o zarządzaniu, wiedza
inżynierska, know-how) itp.1 Pozyskiwanie wiedzy prowadzi do powiększania zasobu
wiedzy, jednego z podstawowych czynników rozwoju gospodarczego. Ten sposób
rozumienia procesu uczenia się jednak odrzucimy, gdyż nie wiąże się z dynamiką i
przekształceniami strukturalnymi systemów.2
Uczenie się powiążemy zatem z procesem działania systemu, w którym jego elementy realizują pewien cel – wykonania pewnego zadania, znalezienia rozwiązania,
rozpoznania obrazu, działania zgodnie z pewnymi kryteriami itp.
Poniższe przykłady uczenia się3 odpowiadają tym definicjom:
• uczenie się (coraz lepszej) gry w warcaby,
• uczenie się rozpoznawania chorób na podstawie symptomów,
• uczenie się klasyfikowania tekstów do grup tematycznych na podstawie przykładów,
• uczenie się aproksymowania nieznanej funkcji na podstawie próbek,
• uczenie się kierowania samochodem na podstawie obserwacji i naśladowania
instruktora,
• uczenie się odnajdywania drogi w nieznanym środowisku,
• uczenie się zależności funkcyjnych pomiędzy danymi obserwacyjnymi.
Badania nad podstawowymi matematycznymi regułami rządzącymi procesem
uczenia się mają na celu przede wszystkim sformułowanie teoretycznych podstaw dla
opracowania algorytmów pozwalających na realizację programu rozwoju tak zwanej
sztucznej inteligencji (artficial intelligence). Doprowadziły one do opracowania wielu
softwerowych technik funkcjonowania systemów uczących się dla wielu zastosowań
__________
1
Nie zgodzę się zatem z Cichoszem, że „wiedzy na ogół nie definiuje się lub definiuje się ją tylko w
kontekście wybranej, specyficznej metody lub grupy metod uczenia się. Mówi się raczej o reprezentacji
wiedzy.”
2
Dla teorii systemów mało uzyteczne są definicje systemów uczących się mające swe źródło w psychologii (por. Witold T. Bielecki, Przedsiębiorczość w wirtualnym środowisku.Aspekt dydaktyczny. Wydawnictwa naukowe Wydziału Zarządzania UW, 1999).
3
Tamże.
Proces uczenia się jako podstawa mechanizmu rozwoju systemu
281
w przemyśle, wojsku, badaniach kosmicznych i innych dziedzinach nauki, rozrywce
(grach komputerowych) itd.
Aktualnie teoria uczenia się wyróżnia kilka typów procesów uczenia się1, z których
najważniejsze to:
Uczenie indukcyjne, gdzie system dokonuje generalizacji podanych przykładów
(przejście od szczegółów do uogólnienia), analizuje atrybuty (cechy opisujące) środowisko (przedmiot działania), by na bazie podanych przykładów odkrywać zależności, podobieństwa między atrybutami konkretnych realizacji. Odkrywanie tych
zależności jest konstruowaniem hipotez, czyli pewnych przybliżeń tzw. pojęcia docelowego. Na ich podstawie system dokonuje syntezy stanowiącej „nauczony” obraz
pojęcia docelowego, związanego z wykonywanym zadaniem.
Dla efektywnej realizacji procesu uczenia się istotne znaczenie ma postać zbioru
atrybutów. Gdy atrybuty mają charakter ciągły, dokonuje się ich dyskretyzacji, tak
aby pojęcie docelowe mogło być reprezentowane dokładnie i zarazem oszczędnie, a w
rezultacie by możliwe było efektywne nauczenie się go za pomocą stosowanego algorytmu uczenia się. Dokonana w ten sposób modyfikacja atrybutów może pozwolić na
lepsze dostosowanie ich z jednej strony do charakteru pojęcia docelowego (które
może być lepiej przybliżane za pomocą konstruowanych hipotez) i z drugiej strony do
algorytmu uczącego się (który lepiej funkcjonuje w dyskretnej przestrzeni hipotez,
łatwiej może nauczyć się pojęcia).
Sprowadzenie atrybutów do postaci dyskretnej umożliwia tak zwaną konstruktywną indukcję, która opiera się na stosowaniu dwóch następujących przekształceń:
• usuwanie zbędnych (nieistotnych) atrybutów,
• tworzenie nowych atrybutów, zależnych funkcjonalnie od istniejących dotychczas
atrybutów.
Hipotezy, generowane przez algorytm uczący się, reprezentowane są jako zbiory
pewnych reguł określają tak zwane wzorce – warunki nakładane na wartości atrybutów na różnych poziomach. Jednym z istotnych elementów konstruktywnej indukcji
jest ocena jakości różnych wzorców.
Grupowanie pojęciowe (conceptual clustering) jest formą uczenia się na podstawie przykładów bez nadzoru nauczyciela (trenera), którego zasadniczym celem jest
dokonanie efektywnej (według zadanej miary efektywności) klasyfikacji chaotycznego zbioru danych o rzeczywistości. Uczący się system otrzymuje zbiór trenujący
zawierający przykłady bez określenia ich kategorii. Nie istnieje zatem żadne pojęcie
docelowe lub w każdym razie system nie ma o nim żadnych informacji. Właściwe
kategorie pozwalające dokonać oceny przykładów musi zaproponować samodzielnie,
w oparciu o pewną wbudowaną lub definiowaną przez użytkownika systemu miarę
jakości grupowania.
__________
1
Tamże.
282
Jerzy Żyżyński
Zadanie grupowania pojęciowego obejmuje dwa powiązane ze sobą podzadania:
podzielenie prezentowanych systemowi przykładów na kategorie – pojęcia;
scharakteryzowanie każdej z wyróżnionych kategorii - wygenerowanie opisów
odpowiednich pojęć, które mogą być użyte do klasyfikowania nowych przykładów.
Drugie z tych podzadań mogłoby być w istocie potraktowane jako uczenie się opisów pojęć na podstawie przykładów, po uprzednim podzieleniu przykładów na kategorie. Algorytmy uczenia się realizują wszak oba zadania łącznie. Traktowanie poszczególnych grup przykładów jako pojęć i wymaganie wygenerowania pewnej ich
reprezentacji (przy czym uwzględniane mogą być różne preferencje użytkownika
systemu) różni grupowanie pojęciowe od zwykłego grupowania (klasteryzacji), które
ogranicza się do pierwszego z powyższych zadań.
Metody grupowania pojęciowego mają zastosowanie do znajdowania regularności
w zbiorach danych i odkrywania podobieństw pomiędzy podanymi systemowi przykładami. Odkrycie takich regularności pozwala na odpowiednie klasyfikowanie nowych przykładów. Grupowanie pojęciowe może być też wykorzystywane jako faza
wstępnego przetwarzania przykładów dla innych metod uczenia się. W tym przypadku
utożsamienie według określonej reguły przykładów pewnej grupy umożliwia podział
całego zbioru przykładów na podgrupy przykładów podobnych do siebie lub wybór
przykładów najbardziej reprezentatywnych dla poszczególnych grup, a przez to redukcję rozmiaru zbioru trenującego i zmniejszenie złożoności problemu.
Chociaż metody grupowania pojęciowego są metodami uczenia się bez nadzoru
(nauczyciela), to można je wykorzystywać również do uczenia się z nadzorem.
Uczenie się na podstawie wyjaśnień, gdzie system uczący się na podstawie tzw.
wiedzy wrodzonej analizuje związki między podanymi przykładami trenującymi a
pojęciem docelowym. Wiedza wrodzona stanowi w pewnym sensie teorię dziedziny,
w której obiekt działa, a więc jest określoną kategorią odwzorowania rzeczywistości,
zaś sam proces uczenia się ma charakter analityczny, jest zatem podejściem przeciwnym do uczenia indukcyjnego. Gdy system otrzymuje od nauczyciela (trenera) przykłady trenujące pojęcia docelowego, to na podstawie wiedzy wrodzonej wyjaśnia
stopień podobieństwa między podanymi przykładami a pojęciem docelowym i dokonuje generalizacji (uogólnienia). Dzięki temu wyjaśnia - czy, w jakim zakresie, dlaczego - podany przykład należy do pojęcia docelowego. Po to, by to było możliwe,
wiedza wrodzona musi więc obejmować definicję tego docelowego pojęcia, zaś uczenie się na podstawie wyjaśnień jest w istocie procesem kompilacji posiadanej i pozyskanej wiedzy, ukierunkowanym przykładami trenującymi. Posiadana wiedza zostaje
więc zmodyfikowana, rozszerzona do postaci dającej się efektywnie wykorzystać w
rozwiązywaniu pewnych problemów.
Uczenie się na podstawie wyjaśnień ma charakter dedukcyjny. Hipoteza, którą
tworzy uczeń, jest bowiem logiczną konsekwencją wbudowanej w system teorii dzie-
•
•
Proces uczenia się jako podstawa mechanizmu rozwoju systemu
283
dziny i zadanych przykładów trenujących, ma miejsce tzw. generalizacja na podstawie
wyjaśnień (explanation-based generalization, EBG).
Ważne jest, że uczenie się na podstawie wyjaśnień nie wymaga dużej liczby przykładów trenujących (w przeciwieństwie do metod indukcyjnych). Do wygenerowania
satysfakcjonującej hipotezy może nawet wystarczyć jeden przykład.
Uczenie się na podstawie zapytań jest metodą uczenia się przez zadawanie pytań ze zbioru zapytań kategorii o przynależność i równoważność - na które odpowiada
nieomylny nauczyciel. Zadaniem systemu jest wyprodukowanie możliwie najmniejszego automatu skończonego1 dokładnie równoważnego docelowemu, tj. akceptującego dokładnie taki sam zbiór napisów (ciągów symboli wejściowych zadanych automatowi, na podstawie których modyfikuje on swój stan).
Mechanizm uczenia polega na tym, że dla zadanego ciągu symboli wejściowych
system otrzymuje odpowiedź na pytanie, czy jest on akceptowany przez pewien skonstruowany przez siebie automat-hipotezę. W przypadku odpowiedzi negatywnej nauczyciel dostarcza mu kontrprzykład - ciąg symboli (napis), który jest rozpoznawany
przez automat docelowy, ale nie przez automat-hipotezę ucznia lub odwrotnie. System
wnioskuje zatem, czy zadany napis jest równoważny automatowi docelowemu.
Opracowano też techniki łączące indukcyjne uczenie się z analitycznym. Metody
uczenia indukcyjnego (sieci neuronowe, drzewo decyzyjne) wymagają wielu przykładów, by na ich podstawie dokonać pewnego uogólnienia. Metody analityczne wykorzystują wiedzę aprioryczną i wnioskowanie dedukcyjne do powiększania informacji
dostarczanej przez przykłady uczące. O ile zatem czyste indukcyjne uczenie się formułuje ogólne hipotezy poprzez znalezienie empirycznych regularności w przykładach, a czyste analityczne uczenie się stosuje aprioryczną wiedzę do otrzymania ogólnych hipotez dedukcyjnie, to połączenie obu podejść daje nastepujące korzyści: lepsza poprawność (accuracy) uogólniania kiedy dostępna jest wiedza aprioryczna oraz
szukanie zależności w obserwowanych danych uczących do wypracowania szybkiej
wiedzy apriorycznej.
Uczeniem się systemu jest zatem każda autonomiczna zmiana w systemie zachodząca na podstawie doświadczeń, która prowadzi do poprawy jakości jego działania, a
systemami uczącymi się są systemy posiadające zdolność poprawiania jakości swojego działania poprzez zdobywanie nowych doświadczeń.2 Doświadczenia te są przekształcane w odpowiednią reprezentację wiedzy w wewnętrznej strukturze systemów
uczących się i następnie, dzięki samodzielnemu wnioskowaniu tych systemów, wyko__________
1
Automat skończony jest to piątka: {X, A, δ, x0, F}, gdzie X – jest zbiorem stanów automatu; A alfebetem , czyli zbiorem symboli wyjściowych; δ – funkcją przejść realizowana przez automat; x0 stanem początkowym; F – zbiorem stanów końcowych automatu.
2
H. Kwaśnicka: Krótki wstęp na podstawie książki P. Cichosz, Systemy uczące się. WNT Warszawa
2000. <www.ci.pwr.wroc.pl/~kwasnick/>
284
Jerzy Żyżyński
rzystywane podczas kolejnych interakcji ze środowiskiem. W ten sposób cel systemu
jest coraz lepiej osiągany.
Systemy uczące się są więc szczególną kategorią systemów ewoluujących, zmieniających swoją strukturę ze względu na pewien cel określony ze względu w stosunku
do otoczenia systemu. O ile tradycyjnie system definiowany był jako para uporządkowana {E, R}, gdzie E – jest zbiorem elementów systemu, R – zbiorem relacji między nimi, to w tym przypadku trzeba ująć go szerzej jako trójkę {E, A, R}, gdzie dodatkowo wyróżnia się zbiór własności lub atrybutów elementów systemu.1 Nie można
jednak ujmować systemu samodzielnie, w oderwaniu od otoczenia, w stosunku do
którego podejmuje on proces uczenia się. To otoczenie wraz ze swymi atrybutami jest
źródłem przykładów i do niego odnosi się konkretny kształt tzw. pojęcia docelowego.
Atrybuty otoczenia
obserwowane przez system
OTOCZENIE
i generowane
przykłady
SYSTEM
Relacje między elementami
Relacje między elementami
zmodyfikowane w procesie uczenia
Informacje o wartościach atrybutów otoczenia
Rys. 1. System a jego otoczenie w procesie uczenia się.
Opracowanie własne
Związki między systemem a jego otoczeniem i proces uczenia się można przedstawić jak na rys.1. System otrzymuje od otoczenia informacje o wartościach atrybutów w obserwowanych przykładowych realizacjach jego stanu (oznaczonych elip__________
1
Czesław Cempel, Materiały wykładowe dla Wydziału Budowy Maszyn i Zarządzania Politechniki
Poznańskiej, < http://neur.am.put.poznan.pl/is/>
Proces uczenia się jako podstawa mechanizmu rozwoju systemu
285
sami) i na podstawie tych informacji modyfikuje swą strukturę. Różne metody uczenia się określają sposób podejścia systemu do analizy atrybutów otoczenia, mechanizm zmiany struktury samego systemu oraz to, jakich aspektów systemu zmiany te
dotyczą – ogólnie można powiedzieć, że polegają na modyfikacji określonych atrybutów samych elementów systemu. Kryterium jest zadany przez konstruktora (który
w określonych metodach uczenia może być nauczycielem - trenerem systemu) cel
systemu, zwany też pojęciem docelowym.
Rozważmy teraz, w jaki sposób proces uczenia się określa rozwój systemu w szerszym sensie tego słowa. W przypadku systemu aktywnie działającego w otoczeniu
modyfikowany jest algorytm działania: system obserwuje otoczenie rejestrując wartości jego atrybutów i na tej podstawie dokonuje zmian w parametrach decydujących o
sposobie realizacji algorytmu. Rodzi się jednak pytanie: co jest źródłem algorytmu,
czyli mówiąc ogólniej - mechanizmu działania systemu w otoczeniu - i co jest
źródłem jego wiedzy o otoczeniu, atrybutach i parametrach je opisujących? Zarówno
algorytm, metoda uczenia się jak i wiedza o otoczeniu, jego obraz (odwzorowanie), są
nadawane przez konstruktora systemu uczącego się. Nawet w ramach indukcji konstruktywnej system może modyfikować obraz otoczenia jedynie przez redukcję zbioru
atrybutów opisujących otoczenie, a więc w pewnym sensie upraszczać ten obraz, lub
przez tworzenie atrybutów funkcjonalnie związanych z atrybutami już istniejącymi –
może to być zatem co najwyżej tworzenie odwzorowania otoczenia alternatywnego,
ale uzyskanego poprzez transformację do obrazu jakościowo równoważnego obrazowi
już posiadanemu.
Strukturę procesu uczenia się możemy zatem przedstawić jak na rys. 2.
System uczy się więc modyfikując algorytm swego działania i w zakresie istniejących możliwości – sposób rejestracji obrazu otoczenia. Można więc przypuszczać, że
w miarę procesu uczenia się efektywność rządzącego nim algorytmu musi się wyczerpywać. Krzywa efektywności procesu uczenia będzie więc wklęsła, jak na rys. 3.
Bez względu na jakość (skuteczność) algorytmu uczenia się, barierą poprawy
efektywności realizacji celu przez system będzie zatem zawsze mechanizm rejestracji
obrazu otoczenia.
Ta logika przebiegu procesu uczenia się i kształtowania się jego efektywności ma
miejsce w wielu aplikacjach systemów uczących się, na przykład w sieciach neuronowych, ale ma też charakter ogólny. Dotyczy ludzi, organizacji, procesów modelowania systemów, a nawet systemów naukowych i teorii naukowych.
Każdy z tych systemów ma bowiem pewną teorię otoczenia (rzeczywistości w której żyje, działa, którą bada) i algorytm czy zbiór algorytmów, które mówią, jak w stosunku do tego otoczenia należy działać (postępować, badać, modelować). Uczenie się
polega na doskonaleniu sposobu wykorzystywania posiadanych algorytmów - zmianach atrybutów (parametrów) definiujących te algorytmy – lub w pewnym zakresie
tworzeniu nowych algorytmów. W ograniczonym zakresie w ramach posiadanej teorii
można modyfikować obraz otoczenia, korygując definiujące ten obraz atrybuty –
286
Jerzy Żyżyński
usuwając część lub dodając nowe, funkcyjnie zależne od istniejących – czyli w ramach wyznaczonych przez teorię.
Rejestracja obrazu otoczenia
Oddziaływanie na otoczenie
za pomoca algorytmu
działania
Czy cel został osiągniety?
Tak
Nie
Koniec
Zastosowanie metody
uczenia się do zmiany
algorytmu działania
Powrót do rejestracji obrazu
Czy nastąpiła poprawa
realizacji celu?
Tak
Nie
Powrót do
rejestracji obrazu
Modyfikacja sposobu
rejestracji obrazu
Powrót do
rejestracji obrazu
Rys. 2. Schemat blokowy procesu uczenia się z modyfikacją obrazu otoczenia
Opracowanie własne
System uczący się wykorzystujący jedną, daną apriorycznie teorię otoczenia nazwiemy prostym systemem uczącym się (PSU). Proces uczenia się systemu prostego
ma więc pewien kres, przy którym efektywność wykorzystania posiadanej teorii wyczerpuje się. Można zatem zapytać, czy jest możliwe przekroczenie tej bariery?
Struktura procesu uczenia się wskazuje, że jest to możliwe tylko w wyniku zmiany
teorii postrzegania otoczenia przez system. Zmiana teorii jest natomiast możliwa tylko
wtedy, gdy założymy, że otoczenie systemu samo jest systemem o strukturze nie w
pełni reprezentowanej przez aktualnie wykorzystywaną teorię, co oznacza to, że teoria
musi być niezupełna w stosunku do rzeczywistości.
Można wobec tego powiedzieć, że system uczący się nie w pełni postrzega otoczenie w ramach teorii, którą dysponuje. Sławne twierdzenie Gödla mówi, że każda teoria aksjomatyczna oparta na arytmetyce liczb naturalnych musi być niezupełna w sensie udowadnialności jej twierdzeń – to znaczy są w niej twierdzenia, których nie-
Proces uczenia się jako podstawa mechanizmu rozwoju systemu
287
Efektywność realizacji celu
sprzeczności (bądź sprzeczności) nie można wykazać w ramach tej samej teorii, a
zatem, że ich dowody muszą być poszukiwane w ramach jakiejś teorii wyższego
rzędu.1 Tę regułę rozszerza się na wiele innych teorii dotyczących systemów działających w rzeczywistości, na całą naukę, której teorie są różnymi modelami rzeczywistości, odzwierciedlają różne jej aspekty, jak i na wiele innych dziedzin – na przykład
zarządzanie, które też posługuje się różnymi modelami zarządzanych dziedzin. Z
pewnością można odnieść ją do sfery modeli matematycznych stosowanych do modelowania różnych systemów – gospodarczych w szczególności. Modele te, ujmowane w formie pewnych programów komputerowych, są wszak zawsze oparte na
jakiejś arytmetyce, muszą więc stanowić system niezupełny. Dotyczy to oczywiście
także modeli wykorzystywanych przez komputerowe systemy uczące się, w tym modeli opartych na sieciach neuronowych.
czas
Rys. 3. Krzywa efektywności procesu uczenia się (krzywa uczenia się)
System uczący się zmieniający teorię otoczenia nazwę inteligentnym systemem
uczącym się (ISU) lub systemem rozwijającym się. W tym znaczeniu rozwój jest
zatem swego rodzaju wyższym etapem uczenia się. Relacje między systemem
__________
1
Przypomnijmy, że najbardziej znanym, klasycznym przykładem jest rozwój teorii geometrii.
Twierdzenie geometrii Euklidesa o istnieniu tylko jednej prostej równoległej do danej prostej
przechodzącej przez punkt leżący poza tą prostą nie dawało się udowodnić w ramach aksjomatyki
geometrii euklidesowej. Dopiero rozszerzenie pojęcia przestrzeni w ramach geometrii nieeuklidesowej,
dokonane przez Łobaczewskiego, Gaussa i Riemanna pozwoliło problem prostej przechodzącej przez
punkt leżący poza dana prosta postawić we właściwym świetle. Wnikało to właśnie z nowego ujęcia
rzeczywistości geometrycznej w ramach teorii geometrii nieeuklidesowej.
288
Jerzy Żyżyński
rozwijającym się a otoczeniem ilustruje diagram na rysunku 4. System na bazie teorii
(modelu) 1 opisującej otoczenie wykorzystuje dostosowany do tej teorii algorytm
działania w stosunku do otoczenia, oznaczony numerem 1. Gdy wyczerpią się
możliwości poprawienia efektywności działania w ramach tej teorii, system buduje
nową teorię (2), która daje mu inny, szerszy obraz otoczenia (choć niekoniecznie
uwzględniający wszystkie aspekty poprzedniej teorii). Konsekwencją nowej teorii jest
nowy algorytm działania, udoskonalany w toku procesu uczenia się. Proces ten jest
kontynuowany w ramach procesu rozwoju.
RZECZYWISTOŚĆ OTOCZENIA
Teoria 1
Teoria 2
Teoria 3
Algorytm 1
Algorytm 2
Algorytm 3
SYSTEM ROZWIJAJĄCY SIĘ
- informacje o otoczeniu
Rys. 4. System rozwijający się a otoczenie
Opracowanie własne
Schemat blokowy przedstawiony na rys. 2. jest zatem realizowany wieloetapowo
przy wykorzystywaniu różnych obrazów otoczenia, dostarczanych przez kolejne
teorie (modele) otoczenia. W rezultacie takiego procesu krzywa uczenia się systemu
rozwijającego się będzie miała kształt narastającej fali, jak przedstawia to rys. 5.
Krzywa ujmuje kolejne etapy uczenia się w ramach kolejnych teorii, dostępnych na
tych etapach. Krzywa poszczególnych etapów, którą można nazwać krzywą życia
teorii, składa się z co najmniej dwóch faz:
F1 - faza dynamicznego doskonalenia systemu w ramach tej teorii
F2 - faza spadku efektywności procesu uczenia się.
W pierwszej fazie system intensywnie doskonali algorytm oddziaływania na otoczenie, wykorzystując korzyści jakie daje pozyskanie nowej wiedzy o otoczeniu
Proces uczenia się jako podstawa mechanizmu rozwoju systemu
289
dzięki nowej teorii. Gdy wyczerpią się nowo wykorzystywane atrybuty, efektywność,
procesu spada. System może poprawić wyniki jedynie przez znalezienie nowej teorii
wyjaśniającej otoczenie.
W pewnych sytuacjach krzywa życia teorii zawiera jeszcze jedna fazę:
F0 – faza opracowywania i/lub wdrażania nowego algorytmu działania na bazie
nowej teorii.
W tej fazie system uczy się samej teorii i ewentualnie stopniowo tworzy nowy,
wynikający z nowej teorii algorytm działania, zapoznaje się z nim, dlatego efektywność uczenia się rośnie stopniowo, co ilustruje krzywa opisująca wynik wprowadzenia teorii 3 (por. rys. 5).
F1
Wprowadzenie teorii 1
F2
F1
F2
teoria 2
F0
F1
F2
teoria 3
Rys. 5. Krzywa uczenia się systemu rozwijającego się (ISU)
Opracowanie własne
Umiejętność zmiany sposobu widzenia otoczenia jest jedną z najważniejszych
cech inteligencji. Gdybyśmy zaproponowane tu rozróżnienie systemów uczących się
odnieśli to organizmów żywych, to systemami zwykłymi, nie realizującymi jeszcze
procesu uczenia się, są najprostsze organizmy żywe, na przykład owady; zwierzęta
wyżej zorganizowane, ssaki i prawdopodobnie niektóre gady są prostymi systemami
uczącymi się, gdyż potrafią zmieniać program (algorytm) działania na podstawie obserwacji otoczenia, dostosowują się do niego adaptacyjnie, ale obraz otoczenia jest
jedynie wynikiem biernego odbioru sygnałów za pomocą zmysłów; „teoria” rzeczywistości jest jedynie narzuconym przez instynkt i parametry narządów zmysłów odwzorowaniem środowiska.
Inteligentnym systemem uczącym się jest – a w każdym razie ma szansę być – dopiero człowiek, gdyż w swym umyśle buduje teorię otoczenia, w którym działa i jest
w stanie tę teorię. Teoria rzeczywistości u człowieka jest czymś więcej niż odwzoro-
290
Jerzy Żyżyński
waniem za pomocą zmysłów: jest wytworzonym przez świadomość modelem lub
zbiorem modeli – właśnie o charakterze symulacyjnym. Powiadamy bowiem, że rozumiemy rzeczywistość, jeśli zbudujemy jakieś wewnętrzne modele symulacyjne
rzeczywistości. Nasze zrozumienie otoczenia zawodzi, gdy okazuje się, że modele nie
odzwierciedlają jakichś aspektów rzeczywistości. Próbujemy wtedy budować nowe
modele. Posługujemy się przy tym różnymi metodami budowy takich modeli – od
świadomie realizowanej metody naukowej po żmudny trening prowadzący do wytworzenia w umyśle modeli analogowych rzeczywistości (gdy na przykład tenisista wielokrotnie odbijając piłkę tenisową uczy się tak uderzać rakietą, by piłka leciała w
zamierzonym kierunku). Znaczny udział w tworzeniu modeli biorą procesy realizowane na różnych poziomach podświadomości.
Zrozumienie struktury procesu uczenia się systemów inteligentnych pozwala odnieść jego zasady do innych systemów, które człowiek wykorzystuje lub w których
działa. Tak więc określmy:
• Inteligentna symulacja systemów – symulacja, w której podstawą budowy modelu
jest zmieniający się obraz środowiska i teoria samego modelowanego systemu.
• Inteligentna organizacja – organizacja, która zmienia teorię opisującą otoczenie,
w którym działa, potrafi weryfikować modele środowiska i stosownie do tych
modeli opracowywać nowe algorytmy działania i ewentualnie zmieniać swą
strukturę.
• Inteligentna polityka – polityka, która koryguje model środowiska, rozpoznaje
wciąż nowe aspekty rzeczywistości mające wpływ na realizowane cele, koryguje
cele stosownie do zmieniającego się obrazu społeczeństwa, jak i teorie będące
podstawą opracowania celów i narzędzi (na przykład teorie ekonomiczne).
Tak rozumiane pojęcie systemu inteligentnego, rozwijającego się strukturalnie,
można odnieść do wielu systemów: systemu nauczania, systemu naukowego czy
szkoły naukowej, a nawet całej cywilizacji. Jest znamienne, że choć człowiek sam jest
systemem uczącym się, to stworzone przez niego systemy i organizacje nazbyt często
zdolności uczenia się bynajmniej nie posiadają. Tę umiejętność bardziej można powiązać z kulturą stanowiącą podstawę mentalności organizacyjnej niż samymi strukturami organizacji: często przejmowanie najlepszych wzorców organizacyjnych nie
prowadzi do sukcesu właśnie na skutek mentalności zaangażowanych w organizacji
ludzi.
Kwestie uwarunkowań rozwoju systemów powinny być więc przedmiotem intensywniejszych badań. Choć prowadzi się badania organizacji uczących się, to brakowało precyzyjniejszego rozróżnienia między różnymi poziomami systemów uczących
się1. Wprowadzenie podziału na systemy uczące się proste i inteligentne może po__________
1
Por.: Otto Brodtrick, The Learning Organization (www.oagbvg.gc.ca/domino/reports.nsf); Douglas
Guthrie, Transforming an Existing Organization into a Learning Organization; Group Decision Support
Proces uczenia się jako podstawa mechanizmu rozwoju systemu
291
zwolić podjąć próby rozpoznania warunków, czynników organizacyjnych, kulturowych, instytucjonalnych i innych, które realnie decydują o tym, że dany system staje
się systemem inteligentnym.
LITERATURA
BIELECKI, W. T. 1999. Przedsiębiorczość w wirtualnym środowisku.Aspekt dydaktyczny. Wydawnictwa naukowe Wydziału Zarządzania UW, Warszawa.
BRODTRICK, O. The Learning Organization (www.oag–bvg.gc.ca/domino/reports.nsf)
CEMPEL, C. Materiały wykładowe dla Wydziału Budowy Maszyn i Zarządzania Politechniki
Poznańskiej, ( http://neur.am.put.poznan.pl/is/)
CICHOSZ, P. 2000. Systemy uczące się. WNT, Warszawa; strona internetowa (Pawel Cichosz –
strona przedmiotu „Uczenie się maszyn” – notatki do wykładów).
GUTHRIE, D. 1996. Transforming an Existing Organization into a Learning Organization;
Group Decision Support Systems, Inc 1996 (http://www.gdss.com/wp/transform.htm).
KWAŚNICKA, H. Krótki wstęp na podstawie książki P. Cichosza, Systemy uczące się. WNT
Warszawa 2000. (www.ci.pwr.wroc.pl/~kwasnick/)
Systems, Inc 1996 (http://www.gdss.com/wp/transform.htm).