1 Przedmiot pracy - Instytut Badań Systemowych PAN

Transkrypt

1 Przedmiot pracy - Instytut Badań Systemowych PAN
Prof. dr hab. inż. Sławomir T. Wierzchoń
Instytut Podstaw Informatyki PAN
ul. Brzegi 55, 80-045 Gdańsk
Warszawa, 21 kwietnia 2011 r.
Recenzja rozprawy doktorskiej
mgr Victora B. Taylora
p.t.
HeBIS: A Biologically Inspired Data Classification System
Przedmiotem recenzji jest rozprawa doktorska mgr Victora B. Taylora
o podanym wyżej tytule, która została przygotowana w Instytucie Badań
Systemowych PAN pod kierunkiem naukowym prof. dr hab. inż. Janusza
Kacprzyka.
Recenzję przygotowano na zlecenie Zastępcy Dyrektora IBS PAN, Pana doc. dr hab. Sławomira Zadrożnego, przesłane niżej podpisanemu listem
datowanym 29 października 2010 r.
1
Przedmiot pracy
Autor koncentruje się na ciekawym problemie dotyczącym tworzenia systemu
klasyfikującego z wykorzystaniem mechanizmów tzw. ewolucji rozwoju (ang.
evolution of development, w skrócie evo-devo). Istotą tej nowej doktryny1
będącej syntezą biologii ewolucyjnej i biologii rozwoju, jest próba ustalenia
w jaki sposób modyfikacje genotypowe przekładają się na zróżnicowanie fenotypowe, a przede wszystkim jak owe mutacje genów przekładają się na
ewolucję fenotypową2 . I w jaki sposób ewoluuje sam proces rozwojowy.
O ile tradycyjnie zajmowano się aspektami dziedziczenia, a więc poszukiwano odpowiedzi na pytanie jak geny przechodzą z jednego pokolenia na
następne, to badacze z kręgu evo-devo badają jak geny programują budowę
1
Pierwszy ważny zbiór publikacji z tego zakresu ukazał się w Proc. Natl. Acad. Sci, vol.
97, no. 9, 2000
2
Przypomnijmy, że przez genotyp rozumiemy zespół genów danego osobnika, natomiast
oddziaływanie między genotypem a środowiskiem daje fenotyp. W algorytmach genetycznych np. genotyp utożsamiany jest z obiektem poddawanym operacjom selekcji, krzyżowania i mutacji, natomiast w celu określenia jego jakości należy przekształcić go fenotypu
reprezentującego potencjalne rozwiązanie. W najprostszym przypadku genotypem jest tu
łańcuch binarny, a fenotypem – w zależności od kontekstu – odpowiadająca mu liczba
rzeczywista, albo wektor o składowych rzeczywistych.
1
nowego organizmu. Uznaje się bowiem, że to właśnie faza rozwoju embrionalnego kształtuje historię życia na Ziemi. Odpowiedzi na to pytanie dostarcza obserwacja mówiąca, że w każdym organizmie istnieje system regulujący
działanie genów. Za włączania i wyłączania genów odpowiedzialne są białka
(określane terminem „małe RNA”) sterujące sieciami genów. To tłumaczy
fakt, że nieznaczna, na poziomie genotypowym, różnica między człowiekiem
a np. muszką owocówką przekształca się na ogromną różnicę na poziomie
fenotypowym. Mechanizmy sterujące włączaniem/wyłączaniem genów oraz
sekwencją w jakiej owe przełączenia sa dokonywane określa się terminem
sieci regulacji genetycznej (ang. genetic regulatory network, w skrócie GRN ).
Powyższe przesłanki zostały wykorzystane przez Autora do zaprojektowania samo-organizującego się systemu HeBIS – Heterogeneous Biologically
Inspired System, przeznaczonego do zadań klasyfikacji binarnej. Stanowi go
kompozycja różnorodnych jednostek, określanych w pracy jako komórki. Każda taka jednostka zawiera w sobie sztuczny genom wraz z zestawem przełączników umożliwiających włączanie/wyłączanie konkretnych genów. Przełączniki sterowane są procesami dyfuzji sztucznych protein (białek) wędrujących
w kracie, w węzłach której rezydują komórki.
Rolą GRN jest sterowanie wzrostem struktury klasyfikującej jak też zachowaniem (własnościami) konkretnych komórek.
W implementacji omawianej w pracy założono, że każda komórka stanowi odrębną samo-organizującą się sieć Kohonena, natomiast rolą systemu
HeBIS jest nauczenie się rozpoznawania chmur na zdjęciach satelitarnych.
Wybór takiego właśnie zastosowania wynika zapewne z faktu, że mgr V.
Taylor pracował przez pewien okres w Lincoln Lab na MIT, a więc w jednym
z najbardziej znanych laboratoriów badawczych na świecie.
2
Układ i zawartość pracy
Recenzowana praca liczy 245 stron, składa się z sześciu rozdziałów, spisów
treści, rysunków i tabel, listy skrótów używanych w tekście, a także dodatku
i spisu literatury.
Rozdział pierwszy to krótkie wprowadzenie, w którym Autor omawia także układ pracy.
Rozdział drugi to blisko 30-stronicowy przegląd literatury dotyczącej zagadnień uczenia maszynowego, obliczeń ewolucyjnych oraz biologicznych i
obliczeniowych aspektów ewolucji rozwoju. Za najciekawszy uważam podrozdział 2.3, w którym Autor dokonuje przeglądu piśmiennictwa dotyczącego różnorodnych aspektów ewolucji rozwoju. Znajdujemy tu uwagi o powstawaniu, przełączających białek (protein), niezwykle ważnej teorii Stuarta
Kaufmanna i jego losowych sieciach booleowskich wykorzystywanych do modelowania sieci regulacji genów, czy sztucznych systemach immunologicznych
i ich zastosowaniu w zadaniach klasyfikacji (algorytm CLONALG).
Rozdział trzeci poświęcony jest systemowi HeBIS. Omawia sie tu strukturę
genotypową pojedynczej komórki, sposób komunikacji międzykomórkowej, a
2
przede wszystkim algorytm uczenia. Tak naprawdę jest to jedyny algorytm
opisany w miarę precyzyjnie w pracy.
W liczącym ponad 120 stron rozdziale czwartym opisano wyniki różnorodnych eksperymentów (przeprowadzono ich 16). Wyniki tych eksperymentów
podsumowano w 4-stronicowym rozdziale 5, a w rozdziale 6 przedstawiono
kierunki przyszłych badań.
3
Uwagi
Chociaż każdy rozdział poprzedzony jest krótkim wstępem, a zakończony
podsumowaniem, sama rozprawa jest raczej trudna w odbiorze. Autor
wprowadza „bez ostrzeżenia” wiele niekonwencjonalnych pojęć. Wymieńmy
chociażby „artificial chemistry”, czy „artificial immune systems”. Są to
niewątpliwie ważne nurty w inteligencji obliczeniowej czy sztucznym życiu,
ale przypuszczam, że należało czytelnikowi wyjaśnić celowość ich użycia.
Część takich pojęć pojawia sie w rozdziale 2 i dalej nie jest wykorzystana.
jednak np. termin „random Boolean networks” odgrywa istotną rolę w
modelowaniu sieci regulacji genetycznej. Na marginesie, polecam Autorowi
bardzo dobrą pracę przeglądową
Th. Schlitt, A. Brazma. Current approaches to gene regulatory network
modelling. BMC Bioinformatics 2007, 8(Suppl 6):S9 doi:10.1186/1471-21058-S6-S9
gdzie omawia się różnorodne modele takich sieci.
To co mnie zaskakuje, to brak szczegółów dotyczących implementacji zaproponowanego rozwiązania. Z pracy nie dowiemy się w jakim języku zaprogramowano system HeBIS, nie wiemy też nic o złożoności (czasowej i pamięciowej) autorskiego rozwiązania. Szereg bardzo szczegółowych i wcześniej
nieobjaśnionych informacji zamieszczono w dodatku. Nie jestem pewien jak
np. należy interpretować rys. 121 ze s. 234, ani jak interpretować rysunki
124-125 ze s. 236. Nie bardzo też wiadomo w jaki sposób otrzymano te rysunki.
Z uwag technicznych wymieniłbym brak indeksu ułatwiającego poruszanie sie po pracy. Ponadto uważam za nietrafne uszeregowanie w tak dużej
pracy pozycji bibliograficznych wg kolejności ich cytowania.
Poniżej zamieszczam kilka specyficznych uwag:
• Nie bardzo rozumiem dlaczego Autor wprowadza rozróżnienie między
sztucznymi sieciami neuronowymi a samoorganizujacymi sie sieciami
Kohonena, skoro te ostatnie także dyskutowane są zazwyczaj w kontekście sieci neuronowych. Podstawowa różnica dotyczy faktu, że o ile
„klasyczne” sieci neuronowe przeznaczone są do zadań uczenia nadzorowanego, to sieci Kohonena – do zadań uczenia nienadzorowanego.
Pewne uzasadnienie podano wprawdzie w pierwszym akapicie punktu
3
2.3.1 (s. 31).
• s. 37 PSO to nie wariant EC. Wprawdzie Autor odwołuje się do numeru
specjalnego IEEE Trans. on Evo. Comput., poz. [90] w spisie publikacji,
ale wystarczyło zajrzeć np. do wikipedii, gdzie znajdujemy następujące
i trafne objaśnienie
(...) PSO is originally attributed to Kennedy, Eberhart
and Shi [1][2] and was first intended for simulating social behaviour[3], as a stylized representation of the movement of
organisms in a bird flock or fish school. The algorithm was
simplified and it was observed to be performing optimization. The book by Kennedy and Eberhart [4] describes many philosophical aspects of PSO and swarm intelligence. An
extensive survey of PSO applications is made by Poli [5],[6].
(cytowane za: http://en.wikipedia.org/wiki/Particle_
swarm_optimization)
•
•
•
•
•
•
4
Brakuje uzasadnienia, dlaczego spośród różnorodnych metaheurystyk
wybrano akurat PSO. Ponadto, w pracy pominięto analizę wpływu
wartości parametrów na skuteczność algorytmu. Do podstawowych parametrów zaliczamy: rozmiar roju, wielkość i typ sąsiedztwa oraz tzw.
współczynniki przyspieszania (acceleration coefficients). Ten ostatni
problem badali m.in. Clerc i Kennedy3 Efektywność algorytmu PSO zależy istotnie od doboru parametrów.
Dlaczego jako miarę powinowactwa (11) przyjęto kosinus kąta między
dwoma wektorami?
Dlaczego w definicji laplasjanu (16) ze s. 60 przyjęto h = 2, a nie h = 1?
W moim egzemplarzu pracy brakuje sekcji Acknowledgements
Literówka przy komentarzu do równania (8) na s. 37: powinno być Pi
zamiast P i.
Na s. 53 wspominając o dyskretnym czasie Autor pisze t ∈ [0, ∞]. Skoro
czas jest dyskretny powinno stosować sie notację t ∈ {0, 1, . . . , }. Identyczna uwaga odnosi się do użytego na s. 54 zapisu x ∈ [0, MAX − 1],
który należałoby zastąpić przez x ∈ {0, . . . , MAX − 1}
Niekompletne dane w pozycjach [38], [101]
Konkluzja
Biorąc pod uwagę dobór tematu, cel i zakres pracy oraz uzyskane wyniki
stwierdzam, że:
• Praca zawiera oryginalne i bardzo nowatorskie elementy nowości naukowej będące własnym dorobkiem Autora. W szczególności zaproponował
On bardzo ciekawe i niestandardowe zastosowanie teorii biologicznych
3
Por. M. Clerc, J. Kennedy. The particle swarm explosion, stability and convergence
in multidimensional complex space. IEEE Trans. Evo. Comput., 6(1):58-73, 2002.
4
do tworzenia systemów decyzyjnych droga ewolucji ich komponentów.
Podejście takie mogłoby być wykorzystywane w autonomicznych systemach przeznaczonych do rozwiązywania różnego rodzaju problemów.
• Temat rozprawy, zastosowane metody oraz uzyskane wyniki odpowiadają randze rozpraw doktorskich.
W związku z powyższym stwierdzam, że opiniowana rozprawa, mimo pewnych wymienionych wcześniej usterek, spełnia wymagania obowiązujących
przepisów ustawy o stopniu naukowym doktora i wnoszę o dopuszczenie jej
Autora do publicznej obrony.
Proponuję także wyróżnić Autora za rozwój nowatorskich metod klasyfikacji danych.
5