Recenzja pracy doktorskiej mgr inż. Bartłomieja Kraszewskiego
Transkrypt
Recenzja pracy doktorskiej mgr inż. Bartłomieja Kraszewskiego
Kraków, 15 lutego 2016 r. Profesor dr hab. inż. Krystian Pyka Wydział Geodezji Górniczej i Inżynierii Środowiska AGH w Krakowie Recenzja pracy doktorskiej mgr inż. Bartłomieja Kraszewskiego „Metodyka parametryzacji procesu segmentacji zbioru punktów naziemnego skaningu laserowego dla modelowania wnętrz obiektów” Recenzja została przygotowana dla Rady Wydziału Inżynierii Lądowej i Geodezji Wojskowej Akademii Technicznej im. Jarosława Dąbrowskiego, na podstawie pisma Dziekana Wydziału prof. dr hab. inż. Ireneusza Winnickiego z 15grudnia 2015 r. Formalna ocena zawartości pracy doktorskiej Recenzowana praca stanowi zwartą publikację, razem ze spisem literatury, spisem rysunków i tabel oraz załącznikami dokumentującymi wyniki zajmuje 148 stron, w tym tekst podstawowy ma 103 strony. Praca jest bogato ilustrowana, bibliografia ujmuje 90 pozycji. Rozprawa została podzielona na 4 rozdziały. Struktura jest przejrzysta, dobrze dostosowana do tematu. Rozdział 1 jest krótkim wprowadzeniem do problematyki pracy. Przedstawia cel pracy oraz hipotezy badawcze. W rozdziale 2 przedstawiona jest technika naziemnego skaningu laserowego oraz przegląd literatury powiązanej tematycznie z rozprawą. Rozdział 3 można określić jako kluczowy, opisuje autorską koncepcję segmentacji, materiał badaczy, wyniki oraz ich krytyczną analizę. Rozprawę kończy krótkie podsumowania jako rozdział 4. Charakterystyka i znaczenie rozwiązywanego problemu badawczego Skaning laserowy wprowadził do geodezji oraz pokrewnych dyscyplin zupełnie nową jakość. Wykazuje podobieństwo do bezlustrowego pomiaru tachimetrycznego oraz jednocześnie do fotogrametrii. Z tachimetrią wiąże go pomiar odległości wzdłuż określonego przestrzennie kierunku, z fotogrametrią rejestracja „wszystkiego” co mieści się w kadrze. Sam pomiar terenowy jest szybki, zwłaszcza w odniesieniu do liczby zarejestrowanych punktów. Problem pojawia się przy interpretacji chmury punktów, która jest niezmiernie gęsta a pomimo tego rzadko kiedy zawiera najważniejsze dla pomiaru punkty. Zatem zasadnicze zadanie pomiarowe, którego celem w geodezji zawsze jest model wybranych obiektów, nie jest rozwiązywany -1- w terenie ale na etapie prac kameralnych, które zajmują wielokrotnie więcej czasu niż sama rejestracja. Jest co prawda jeden wyjątek, polegający na uznaniu chmury punktów za quasi model rzeczywistości i potraktowaniu chmury jako produktu końcowego. Ale jest to alternatywa dla wąskiego grona odbiorców, tych którzy zamierzają samodzielnie interpretować i mierzyć obiekty. Znacznie częściej odbiorcy oczekują takiego modelu rzeczywistości, który jest jej abstrakcją zbudowaną według znanych reguł. Z moich obserwacji wynika, że geodeci (w tym fotogrametrzy) którzy zamienili swój dotychczasowy warsztat na skaning laserowy są zaskoczeni, jak wiele jest pracy, i to trudnej, aby z chmury wydobyć to co najistotniejsze. W jakimś sensie ta obserwacja potwierdzona jest w rozprawie mgr inż. Kraszewskiego, z tym, że Doktorant przystąpił do badań będąc dobrze zaznajomiony z blaskami i cieniami skaningu. Pomiar wnętrz obiektów kubaturowych jest wykonywany dla potrzeb ich inwentaryzacji, o charakterze architektoniczno-budowlanym lub zogniskowanej na wyposażeniu technicznym albo na dokumentowaniu stanu po zdarzeniach objętych działaniami prokuratorskimi. I do tych celów stosuje się skaning na skale produkcyjną. Ale znam tylko jeden przypadek, kiedy opracowanie skaningu jest rozwiązane aplikacyjnie z wysokim poziomem automatyzacji. Jest to inwentaryzacja wyposażenia technicznego hal przemysłowych, złożonego z powtarzalnych elementów, z reguły o znanym modelu geometrycznym. Natomiast zdecydowana większość przypadków inwentaryzacji wnętrz na podstawie chmury laserowej jest rozwiązywana manualnie z małym udziałem automatyzacji. Poza klasycznym odczytaniem celu pracy jako wysoce zautomatyzowany pomiar widzę też przydatność proponowanego rozwiązania w zagadnieniach związanych ze sztuczną inteligencją. Jest zapotrzebowanie na rozpoznawanie kanałów komunikacyjnych dla robotów a wiedza o obiektach kształtujących bezpieczne przejścia zwiększa zakres dopuszczalnych zachowań robota. Wskazując na znaczenie problemu dla zastosowań niegeodezyjnych nie pomniejszam jego roli w klasycznych zadaniach pomiarowych, czyli w geodezji. Rozwiązywanie problemów na styku dyscyplin jest największym wyzwaniem dzisiejszych czasów. Nie mam wątpliwości, że podjęty w rozprawie problem badawczy ma istotne znaczenie, zarówno poznawcze jak i utylitarne. Ocena metody badawczej, sposobu przeprowadzenia badań i uzyskanych wyników Jak zaznaczyłem w ocenie formalnej, rozprawa jest skonstruowana poprawnie. Zaczyna się od rzetelnego przeglądu literatury, dobrze oddającego rozwiązywany problem badawczy. Doktorant opisał stosowane metody segmentacji, najwięcej miejsca poświęcił algorytmowi RANSAC, który potem stanowił odniesienie dla autorskiego rozwiązania przedstawionego w rozprawie. Przegląd literatury jasno wskazał, że brak jest podejść kompleksowych do segmentacji, czyli wykorzystujących maksimum dostępnych atrybutów jakimi dysponuje chmura laserowa. Doktorant wyciągnął z tego słuszny ale jednocześnie odważny wniosek, że wykorzystanie atrybutów geometrycznych razem z intensywnością odbitego impulsu i przypisaną mu barwą zwiększy możliwość zautomatyzowania przetworzenia chmury na dane obiektowe. -2- Widać, że Doktorant przystępując do badań znał specyfikę skaningu ale też miał doświadczenia fotogrametryczne. To pomogło mu podejść bardzo racjonalnie do problemu automatyzacji przetworzenia chmury na model. Wybrał bowiem stosunkowo proste pomieszczenia, a o ich prostocie świadczy fakt, że można było je wymodelować w oparciu o kilkadziesiąt zaledwie punktów, tyle, że wybranych manualnie. Ale tylko w takich warunkach Doktorant mógł rzetelnie sprawdzić przydatność rozwiązania które zaproponował w dysertacji. Słusznie też jako standard modelu pomieszczenia wewnętrznego wybrał tzw. CityGML. Ten standard narzucił listę subobiektów tworzących klasę „pokój”, czyli podłoga, sufit, ściana, otwory drzwiowe i okienne, instalacje i wyposażenie. Zaproponowana przez Doktoranta koncepcja zasadza się na wielo-atrybutowej segmentacji o charakterze etapowym. (Być może poprawniej byłoby nazywać efekty zaproponowanej metody jako klasyfikacja a nie segmentacja. Do spraw terminologicznych powracam w dalszej części recenzji). Autor wybrał wszystkie dane jakie mogą być dowiązane do punktu laserowego, czyli położenie przestrzenne (ściślej pochodny do geometrii wektor normalny), intensywność impulsu laserowego, barwa. Nie znam tak kompleksowego podejścia jakie zaprezentował w pracy mgr inż Kraszewski. Badania zapewne nie dawałyby szans na dojście do jednoznacznych wniosków gdyby ich przedmiotem nie były stosunkowe proste wnętrza. Ale i w tych warunkach analiza informatywności poszczególnych atrybutów (lub ich funkcji) była niezmierna złożona, kosztowała Doktoranta dużo wysiłku i cierpliwości. Dla obiektów elementarnych tworzących klasę „pokój” wg CityGML Doktorant stosował inne algorytmy, różniące się głównie segmentacją. W pierwszej kolejności wydzielał podklasy sufit i podłoga. Niewątpliwie rdzeniem algorytmów jest segmentacja metodami RANSAC i rosnących regionów, ale celem nie jest tylko wydzielenie płaszczyzn lecz wskazanie czym są te płaszczyzny. Jest to zatem klasyfikacja. W kolejnych etapach klasyfikowane są ściany, następnie otwory okienne a na końcu instalacje i umeblowanie. Na każdym z tych etapów stosowana jest inna segmentacja, dobrana odpowiednio do wydzielanych obiektów elementarnych. Zatem całościowo patrząc, metoda autorska polega na „segmentacji adaptacyjnej”, co jest bardzo oryginalnym rozwiązaniem. Autor nie tylko zaproponował to rozwiązanie ale je oprogramował co pozwoliło potem przetestować wiele wariantów segmentacji. Testował zarówno pojedyncze atrybuty jak i ich kombinacje oraz różne promienie wyszukiwania sąsiadów i wartości progowe decydujące o wydzielaniu segmentów. Tak powstał pokaźny zestaw wyników, poddany krytycznej analizie. Podstawą analizy wyników były wskaźniki poprawności i błędu segmentacji. To dobra para wskaźników, które muszą być interpretowane łącznie. Doktorant opracował zbiór referencyjny na drodze interpretacji i wektoryzacji manualnej. Analiza była prowadzona osobno dla wydzielanych obiektów elementarnych. Wyniki analizy zostały przedstawione szczegółowo na diagramach i każdorazowo są opatrzone komentarzem autorskim. Zastosowane wskaźniki dobrze reprezentują jakość wyników, może przydałaby się jeszcze prezentacja miejsc w których jakość była najlepsza i najgorsza. Po analizie segmentacji na pojedynczych atrybutach Doktorant wyciągnął wnioski i zastosował je do segmentacji wielo-atrybutowej. Wyniki wymagały wnikliwej interpretacji w odniesieniu do elementarnych obiektów. Pozornie zaskakujący jest wniosek, że najlepszych rezultatów nie daje segmentacja z wykorzystaniem -3- kompletu atrybutów. Optymalne wyniki dawała, w większości przypadków, para atrybutów złożona z wektora normalnego i intensywności. Barwa pomagała wtedy, gdy obiekt elementarny był pod tym względem jednolity. W przypadku sub-obiektów wyposażenie i instalacje segmentacja opierała się na 2 atrybutach, gdyż wektor normalny nie był informatywny z punktu widzenia klasyfikacji. To kolejny dowód na adaptacyjność metody. Zastosowaną w rozprawie metodę badawczą uznaję za właściwą i kompletną. Według dobrze przemyślanej koncepcji mgr inż Kraszewski skonstruował algorytm oraz jego prototyp informatyczny, który co prawda nie jest szczegółowo przedstawiany w pracy ale stanowi jej istotne wsparcie narzędziowe. Uwagi polemiczne, pytania Mam kilka uwag koncentrujących się na poprawności terminologicznej. W temacie rozprawy jest słowo segmentacja. Co to jest segmentacja? Na str. 23 Autor pisze: „Segmentacja polega na wydzieleniu … segmentów jednorodnych pod względem pewnych wybranych właściwości”. Na tej samej stronie przytacza definicję klasyfikacji: „klasyfikacja polega na określeniu semantycznego znaczenia analizowanego elementu zbioru danych przestrzennych”. Natomiast na str. 34 pisze: „Proces segmentacji polega na wydzieleniu … regionów opisujących konkretne obiekty”. Następnie, na str. 44 znajdują się zdania: „algorytmy segmentacji nie umożliwiają w sposób kompleksowy pogrupować zbioru danych na konkretne obiekty. Stosowane metody koncentrują się na na ekstrakcji prostych obiektów geometrycznych (np. płaszczyzn)”. Faktem jest, że pomiędzy segmentacją a klasyfikacją istnieje często subtelna różnica. Najczęściej segmentacja jest etapem przetwarzania którego celem jest klasyfikacja a kolejnym z reguły modelowanie. W rozprawie te terminy przenikają się, co jest, przyznaję, trudne do uniknięcia. Tym niemniej zabrakło wyjaśnienia, jak Autor rozróżnia segmentacje, klasyfikacje i modelowanie w odniesieniu do zaproponowanej „metody segmentacji”. Czy autorski algorytm tylko segmentuje, czy wykonuje także klasyfikację? Pewne niekonsekwencje dostrzegam też w używaniu terminu parametry segmentacji. Dotyczy to nazywania wektora normalnego, intensywności i barwy zarówno atrybutami jak i parametrami. Chętnie zapoznam się ze stanowiskiem Doktoranta w tej sprawie w trakcie publicznej obrony. Dyskusję terminologiczną można też rozwinąć odnośnie relacji terminów barwa-kolor (kolorystyka). Kilka razy Autor mówi o barwie ale częściej o kolorystyce, nie są to terminy zamienne aczkolwiek w języku potocznym tak się je stosuje. W tym wypadku uwaga ma charakter czysto akademicki, tym niemniej warto w pracy naukowej dążyc do konsekwentnego używania termonów. Ważniejszy jest inny problem a dotyczący jakości atrybutu barwa jakim opatrujemy punkty laserowe. Należy zwrócić uwagę, że barwna chmura punktów powstaje przez przecięcie wiązki laserowej z wiązką optyczną co w praktyce powoduje, że barwa jest interpolowana. Gdy aparat fotograficzny jest zintegrowany ze skanerem jakość interpolacji jest na pewno wyższa niż przy wykorzystaniu aparatu zewnętrznego. Ale zawsze atrybut RGB, inaczej niż intensywność, jest obarczony błędem przypisania promienia optycznego zdeterminowanego rozdzielczością matrycy do kierunku impulsu laserowego. Być może jednak, to rozmycie barwy nie jest znaczące dla realizowanej w pracy segmentacji. -4- Generalnie prace analityczne oceniam wysoko, Autor jest precyzyjny, pokazuje plusy i minusy zaproponowanej metody. Uważam, że zamieszczona na str. 93-95 synteza wyników ujmująca wszystkie przeprowadzone próby dla połączonych obiektów oraz dla każdego z osobna mogłaby by być przedstawiona w formie graficznej zamiast tabelarycznej. Odbiór wyników byłby łatwiejszy. Podsumowanie Uznaję poruszony w dysertacji problem badawczy za bardzo aktualny i ważny z punktu widzenia dyscypliny geodezja i kartografia. Doktorant zmierzył się w rozprawie z odważnie postawioną tezą o możliwości automatyzacji procesu segmentacji danych ze skaningu pod kątem klasyfikacji wynikającej z modelu CityGML. Badania potwierdziły taką możliwość ale wskazały jednocześnie na konieczność pokonania kilku przeszkód. Wysoko cenię krytyczną dyskusję wyników, w której Autor podejmuje różne aspekty opracowanej metody. W pracy jest wszystko czego oczekuje się od dysertacji. Interesująca teza, kompletny proces jej dowodzenia i krytyczna analiza wyników. Praca jest napisana poprawnym językiem, posiada staranną edycję, zawiera kilka usterek edycyjnych i gramatycznych, ale o drugorzędnym znaczeniu. Doktorant udowodnił w rozprawie, że posiada gruntowną wiedzę z zakresu fotogrametrii i skaningu i , co bardzo ważne, potrafi dobrze ją wykorzystać w planowaniu i realizacji badań naukowych. Praca nie powstałaby bez umiejętności informatycznych, co zaczyna być coraz częstszym warunkiem przeprowadzenia oryginalnych badań naukowych. Konkluzja Stwierdzam, że rozprawa doktorska mgr inż. Bartłomieja Kraszewskiego spełnia warunki określone w art. 13 ustawy z dnia 14 marca 2003 r. z późniejszymi zmianami o stopniach naukowych i tytule naukowym oraz o stopniach i tytule w zakresie sztuki. Rekomenduję Radzie Wydziału Inżynierii Lądowej i Geodezji Wojskowej Akademii Technicznej im. Jarosława Dąbrowskiego dopuszczenie mgr inż. Bartłomieja Kraszewskiego do publicznej obrony przedłożonej rozprawy doktorskiej. -5-