recenzja 2 - Wydział Informatyki

Transkrypt

recenzja 2 - Wydział Informatyki
Prof. dr hab. inż. Franciszek Seredyński
Uniwersytet Kardynała Stefana Wyszyńskiego w Warszawie
Wydział Matematyczno – Przyrodniczy
Szkoła Nauk Ścisłych
ul. Wóycickiego 1/3, 01-938 Warszawa
Warszawa, 29.01.2013
RECENZJA
rozprawy doktorskiej mgr inż. Szymona Wąsika pt.
„Bioinformatyczne modele i algorytmy infekcji wirusowych”
1. Problematyka naukowa oraz przedmiot rozprawy
si gni cia naukowe i technologiczne ostatnich lat umożliwiły bardziej precyzyjne, globalne
przyjrzenie si różnorodnym procesom biologicznym. bserwowany w ostatnich latach wci ż
rosn cy napływ danych biologicznych, kształtuj cych si problemów zwi zanych z poprawn ich
analiz oraz interpretacj zainspirował powstanie nowej dziedziny nauki jak jest biologia
obliczeniowa, cz ściej znana jako bioinformatyka. Jest to dziedzina powstała na styku trzech
dziedzin jakimi s biologia, matematyka oraz informatyka. Bioinformatyka wykorzystuje narz dzia
informatyczne do opracowywania modeli matematycznych procesów biologicznych i efektywnych
metod ich rozwi zywania. Jednym z lepszych dowodów jej znaczenia jest gwałtowny rozwój w
ostatnich dwudziestu latach biologii systemowej, b d cej dziedzin biologii, która stara si opisać
procesy biologiczne z punktu widzenia globalnego i która swoje powstanie zawdzi cza właśnie
głównie szybkiemu rozwojowi informatyki i bioinformatyki.
Recenzowana rozprawa doktorska, dotycz ca analizy modeli infekcji wirusowych, wpisuje si
właśnie w zakres tematyczny bioinformatyki oraz biologii systemowej. Jednym z głównych
problemów bioinformatycznych zwi zanych z analiz procesów zachodz cych w organizmach żywych jest poł czenie precyzyjnej wiedzy, która dost pna jest na temat procesów elementarnych w
opis tłumacz cy przebieg procesów złożonych. Mimo że dość precyzyjnie poznane s mechanizmy,
które wykorzystywane s na najniższym poziomie komórkowym i tkankowym, cz sto nie jest to
wiedza wystarczaj ca do wytłumaczenia procesów globalnych zachodz cych w organizmie.
Zaproponowane w niniejszej pracy podejścia i metody bioinformatyczne umożliwi analizowanie
procesu globalnego, którym jest infekcja organizmu przez wirusa w oparciu o wiedz na temat interakcji zachodz cych na poziomie komórkowym.
Zagadnienia podj te w rozprawie dotycz metod i algorytmów wykorzystywanych w procesie
modelowanie infekcji wirusowych. Autor bardzo kompleksowo zanalizował proces modelowania i
wszystkie składaj ce si na niego etapy. W pracy znajduje si szczegółowe omówienie procesu opisu modelu i jego definiowania za pomoc narz dzi informatycznych, od którego musi rozpocz ć si
każda komputerowa analiza proponowanego podejścia. Na zakończenie tego etapu powstaje informatyczna reprezentacja modelu, która może być nast pnie użyta do jego analizy. Etap analizy został uwzgl dniony w pracy poprzez przedstawienie kolejnych jego kroków, od doboru wartości parametrów i symulowania modelu, przez analiz otrzymanych wyników, po metody weryfikacji i
korekty modelu wejściowego. Autor nie zatrzymał si jedynie na procesie analizy trwaj cej w organizmie infekcji wirusowej, ale również przedstawił metody przydatne przy opracowywaniu terapii maj cej uleczyć zainfekowane osoby. Dla każdego z powyższych etapów procesu modelowania
infekcji wirusowej autor szczegółowo zanalizował aktualnie stosowane metody i algorytmy oraz
zaproponował ich optymalizacje.
1
Rozważane w rozprawie zagadnienia s aktualne oraz w istotny sposób wpisuj si w obszar
informatyki. Rozprawa może zatem być przedstawiona jako monografia doktorska w dziedzinie
informatyki w specjalności bioinformatyka.
2. Analiza treści rozprawy oraz uzyskanych wyników
Głównymi celami rozprawy doktorskiej mgr. inż. Szymona W sika s kompleksowa analiza
procesu modelowania infekcji wirusowych za pomoc metod i algorytmów bioinformatycznych
oraz zaproponowanie metod, które mog ten proces usprawnić. Na cel ten składa si przegl d i analiza aktualnie stosowanych metod, opracowanie nowego sposobu zapisu modeli infekcji wirusowych oraz ich dalszego analizowania oraz zaproponowanie metod analizy infekcji i sposobów terapii na podstawie danych z dużej populacji ludzkiej. Cele te zostały zrealizowane i szczegółowo
opisane w ośmiu rozdziałach rozprawy. Rozprawa posiada również dwa dodatki.
Praca zawiera 145 ponumerowanych stron w tym 13 stron pozycji bibliograficznych, każda licz ca kilkanaście pozycji. Dodatkowo, w pracy zawarto 12 stron spisów oraz 6 stron edytorskich
poprzedzaj cych spis treści. Struktura rozprawy jest przejrzysta i przemyślana, dobrze oddaj ca
kolejne etapy realizacji przyj tych celów pracy.
Praca rozpoczyna si sześciostronicowym streszczeniem w j zyku angielskim, które w precyzyjny sposób przedstawia główne osi gni cia pracy. Jest ono wystarczaj co długie, aby w zrozumiały dla czytelnika sposób przedstawić główne tezy oraz otrzymane wyniki oraz posiada odnośniki do opublikowanych przez autora prac w j zyku angielskim, w których można znaleźć obszerniejsze omówienie prezentowanych treści.
W Rozdziale 1 przedstawiono wprowadzenie do poruszanej w rozprawie tematyki, motywy
podj cia prezentowanej tematyki badawczej, struktur pracy oraz jej cel i zakres.
W Rozdziale 2 zostały zawarte podstawy biologiczne, na które składaj si podstawowe
poj cia z zakresu genetyki i wirusologii niezb dne do zrozumienia rozprawy oraz omówienie biologii systemowej, która jest dziedzin biologii, w ramach której prowadzona była wi kszość prac
bioinformatycznych.
Rozdział 3 zawiera definicje oraz poj cia z zakresu podstaw informatycznych i matematycznych wykorzystywanych w pracy.
Rozdział został poświ cony przegl dowi oraz klasyfikacji metod bioinformatycznych aktualnie stosowanych w procesie modelowania infekcji wirusowych. Rozdział ten podzielony jest na
dwie cz ści. W pierwszej autor szczegółowo przedstawia metody komputerowej reprezentacji modeli i dla najbardziej charakterystycznych z nich prezentuje zaimplementowane przez siebie opisy.
W drugiej cz ści autor przedstawia istniej ce oprogramowanie do analizy modeli.
W Rozdziale 5 zawarty jest opis autorskiego podejścia do opisu modeli infekcji wirusowych.
Rozdział ten przedstawia definicj opracowanego przez autora j zyka ModeLang wraz z jego parserem oraz przykładowymi zastosowaniami.
W Rozdziale 6 opisany został sposób analizowania infekcji wirusowej w ciele ludzkim za pomoc symulacji wieloagentowej. Autor opisuje sposób implementacji zaprojektowanego przez niego symulatora wraz z zaprojektowan przez niego interesuj c metod doboru parametrów wyko-
2
rzystuj c algorytm genetyczny. Rozdział kończy si omówieniem wyników eksperymentu obliczeniowego.
Rozdział 7 przedstawia porównanie różnych sposobów obliczania efektywności terapii osób
zainfekowanych wirusem, w tym algorytmu opracowanego przez autora. Ciekawym elementem
omawianych metod jest to, że zostały opracowane na podstawie danych o różnorodności genetycznej wirusów w pojedynczych organizmach, co wcześniej było w literaturze niespotykane.
statni z rozdziałów, Rozdział 8, został poświ cony przedstawieniu wniosków końcowych
podsumowuj cych prac .
W pierwszym dodatku do pracy, Dodatku A, przedstawione zostały skrypty zaimplementowane
w trakcie prac nad przedstawionymi w pracy metodami. S to implementacje algorytmów, których
wyniki znajduj si w pracy oraz przykładowe pliki wejściowe i wyjściowe otrzymane w trakcie
eksperymentów obliczeniowych, których zawartość była zbyt długa, aby w pełni prezentować j we
właściwej cz ści pracy. Drugi z dodatków, Dodatek B, zawiera tabele z danymi wykorzystanymi w
pracy.
Sposób w jaki została napisana rozprawa nie budzi wi kszych zastrzeżeń. Autor we właściwy
sposób stosował metody badawcze, a dobór przytoczonej literatury wydaje si być trafny i
uzasadniony. Spisy, rysunki oraz tabele zwi kszaj czytelność pracy i ułatwiaj orientacj w niej.
3. Najistotniejsze osiągnięcia przedstawione w rozprawie
Do najistotniejszych osi gni ć rozprawy zaliczyć należy:
• Dokładn analiz aktualnie stosowanych metod opisu modeli infekcji wirusowych, zawieraj c implementacj przykładowych infekcji wirusami HCV i HIV za pomoc najważniejszych z
rozpatrywanych metod, wykonan w celu dokładnego zrozumienia wad i zalet każdego z podejść. Analiza ta doprowadziła mi dzy innymi do wykrycia potencjalnych problemów w powszechnie używanych modelach oraz ich korekty.
• Zdefiniowanie składni j zyka ModeLang służ cego do formalnego opisu modeli infekcji wirusowych, który jest zdecydowanie bardziej zrozumiały dla biologów niż inne stosowane aktualnie podejścia. Dzi ki temu współpraca pomi dzy informatykami i biologami może przebiegać
dużo efektywniej.
• Implementacja parsera j zyka ModeLang oraz jego testy w eksperymencie obliczeniowym
dowodz ce jego poprawności i przydatności.
• Zaprojektowanie oraz implementacja środowiska symuluj cego infekcje wirusowe przy
użyciu modelowania opartego na agentach. Ważnym osi gni ciem jest również zaproponowanie
i weryfikacja metody wyznaczania wartości parametrów modelu, który to problem pozostawał w
rozpatrywanym zastosowaniu nierozwi zany.
• Weryfikacja przydatności zaprojektowanego środowiska symulacyjnego w rzeczywistych
zastosowaniach bioinformatycznych.
• Zaproponowanie nowej metody statystycznej opieraj cej si na różnorodności genetycznej
wirusa, która może być użyta w celu prognozowania efektywności terapii osób zainfekowanych.
3
4. Uwagi merytoryczne
W trakcie czytania rozprawy doktorskiej mgr. inż. Szymona W sika nasuwaj si pewne uwagi
o charakterze dyskusyjnym. S to:
• Niewystarczaj co dokładne testy j zyka ModeLang, szczególnie w środowisku biologów
zajmuj cych si modelowaniem infekcji wirusowych.
• Zbyt mało szczegółowy opis implementacji symulacji wieloagentowej przedstawiony w
sekcji 6.1.2.
• Brak szczegółowej analizy doboru parametrów oraz operatorów w algorytmie genetycznym
używanym do wyznaczania wartości parametrów w sekcji 6.2.
• Mała liczba danych testowych zawartych w tablicy B.2 wykorzystywanych do weryfikacji
zaproponowanych metod definiowania efektywności terapii.
5. Uwagi redakcyjne
Praca napisana jest precyzyjnym j zykiem i starannie zredagowana, mimo, że autor nie ustrzegł
si drobnych niedoci gni ć redakcyjnych, jak np.:
• Strona vi, tytuły rozdziałów niepotrzebnie rozbite s na dwa wiersze.
• Strona 29, linia 10, jest „nasywana”, powinno być „nazywana”.
• Strona 38 i dalej, nagłówek rozdziału , 5 i 6 jest niepoprawnie wyrównany.
• Strona 66, linia 4, jest „skyptu”, powinno być „skryptu”.
• Strona 137, linia 19, jest “COMPUTER ALGEBRA IN SCIENTIFIC COMPUTING”,
powinno być “Computer Algebra in Scientific Computing”.
• Strona 144, linia 16, jest „hcv”, powinno być „HCV”.
• Strona 144, linia 22, jest „hcv”, powinno być „HCV”.
6. Podsumowanie
Powyżej przedstawione uwagi merytoryczne oraz redakcyjne nie maj istotnego wpływu na
jakość i wag przedstawionych rozwi zań i w żadnym stopniu nie obniżaj wartości pracy.
Przedstawione przez autora badane aspekty zostały uj te wystarczaj co szczegółowo i dokładnie.
Reasumuj c można stwierdzić, że główne wyniki rozprawy potwierdzaj osi gni cie z
powodzeniem założonego w rozprawie celu. Rang uzyskanych wyników podkreśla fakt
opublikowania cz ści z nich w czasopismach filadelfijskich: BMC Bioinformatics czy też Computational and Mathematical Methods in Medicine oraz nagrody za prezentacj modelu wieloagentowego otrzymane przez autora na dwóch konferencjach.
Praca pokazuje szeroki obszar zainteresowań autora i obszern wiedz z dziedziny
analizowanych problemów. Rozprawa zawiera oryginalne i wartościowe wyniki, które stanowi
istotny wkład w dziedzin nauki jak jest bioinformatyka.
4
Podsumowuj c, stwierdzam, że przedstawiona do oceny rozprawa doktorska mgr. inż. Szymona W sika pt.: „ Bioinformatyczne modele i algorytmy infekcji wirusowych” spełnia w stopniu
bardzo dobrym wymagania stawiane rozprawom doktorskim przez obowi zuj c ustaw o stopniach i tytule naukowym. W konsekwencji tego może ona stać si przedmiotem publicznej obrony.
Wnosz zatem o dopuszczenie mgr. inż. Szymona W sika do dalszych etapów przewodu doktorskiego. Maj c na wzgl dzie oryginalność uzyskanych w rozprawie wyników oraz rang czasopism, w których opublikowano te wyniki wnioskuj o wyróżnienie rozprawy.
5

Podobne dokumenty