CPO-Segmentacja
Transkrypt
CPO-Segmentacja
SEGMENTACJA Celem segmentacji jest takie przetworzenie danych zawartych w obrazie, aby uzyskać taki jego podział, który pomoże w rozpoznaniu obiektów w nim zawartych i interpretacji. Ogólnie rzecz ujmując obraz jest pewnym rozkładem intensywności reprezentującym kilka obiektów bądź klas obiektów (obrazy wielo-odcieniowe), a w przypadku obrazów binarnych zestawem kilku rozdzielnych jednolitych elementów i tła. Segmentacja służy, do uproszczenia opisu obrazu poprzez zmniejszenie nadmiarowej informacji, grupowanie pikseli o zbliżonych intensywnościach lub łączenie pikseli opisujących poszczególne elementy. Formalnie w wyniku procesu segmentacji następuje podzielenie pikseli obrazu na kilka rozdzielnych klas. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-1 Kryteria klasyfikacji pikseli • Klasyfikacja pikseli może być przeprowadzona ze względu na jedno z wielu kryteriów, z czego do najważniejszych należą: - klasyfikacja przestrzenna (kryterium: lokalizacja piksela), - klasyfikacja czasowa ( kryteruin zmiana intensywności w czasie/ruch obiektów), - klasyfikacja spektralna (kryterium: barwa/ zawartość RGB piksela), - klasyfikacja statystyczna (kryterium parametr statystyczny rozkładu jasności w otoczeniu piksela; segmentacja tekstur). Cyfrowe przetwarzanie ..... – M.Kujawińska 1-2 Segmentacja, a rozpoznanie obiektów Segmentacja obrazu pomaga wydzielić w obrazie obiekty, którym w wyniku analizy obiektów (pomiar- wyznaczenie współczynników kształtu/ liczenie transformat/ liczenie współczynników momentowych i in.) zostaną nadane im cechy, zgodnie z którymi następuje przypisanie obiektów do odpowiednich klas. Podstawowe grupy segmentacji: - segmentację obszarową (od najprostszego progowania obrazu skończywszy na segmentacji statystycznej tekstur), - segmentację krawędziową . Cyfrowe przetwarzanie ..... – M.Kujawińska 1-3 Segmentacja obszarowa Procedury segmentacji obszarowej klasyfikują piksele obrazu do oczekiwanej przez użytkownika liczby obszarów/ klastrów. Do wyszukania pożądanych progów odcięcia wykorzystuje się: podejście statystyczne lub analizę histogramu. Segmentacja przez progowanie: Obiekty znajdujące się na obrazie o pozornie tej samej barwie, w rzeczywistości opisane są przez pewien zbiór intensywności tworzący charakterystyczne piki na histogramie. Celem segmentacji przez progowanie jest zdefiniowanie granicznych wartości intensywności, które pozwolą oddzielić składowe elementy obrazu (tu:obraz dwumodalny) Cyfrowe przetwarzanie ..... – M.Kujawińska 1-4 Metoda analizy dyskryminacyjnej (M. Otsu) Metoda ta pozwala wyznaczyć próg odcięcia T korzystając z podziału pikseli obrazu na dwie klasy: obiekt i tło. W takim układzie histogram traktuje się jako zazębiające się dwa rozkłady normalne odpowiadające tłu i obiektowi. Dla progu T ustalane jest położenie w zależności od wartości średnich μ 1 μ 2 i odchyleń standardowych rozkładów prawdopodobieństw tła i obiektu. Próg odcięcia przypada w miejscu max. wartości wariancji międzyklasowej Rozwiązanie dla histogramów bimodalnych o różnych szerokościach pików Cyfrowe przetwarzanie ..... – M.Kujawińska 1-5 Metody intensywnościowe - iteracyjne Metody intensywnościowe do analizy wykorzystują jedynie histogram obrazu oraz informację o liczbie klas, do których piksele obrazu powinny zostać zakwalifikowane. Progi mogą być wyznaczane przez użytkownika lub automatycznie poprzez analizę histogram obrazu i wyszukanie doliny pomiędzy sąsiednimi pikami. Szybka analiza, ale możliwa zła klasyfikacja przy lokalnych minimach. Rozwiązanie – METODA ITERACYJNA Szacuje się w nim początkowe położenie progu T. Dla zadanej lokalizacji obliczane są średnie intensywności tła i obiektu T tło i T obiekt, a na ich podstawie wyznacza się tymczasowy próg oraz T tło i T obiekt będące wartościami wejściowymi do kolejnej iteracji. Proces trwa do momentu ustabilizowania się położenia progu. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-6 Metoda wieloboku Niedogodnością tego rozwiązania jest fakt dołączenia pikseli obrazu nieprzynależących do danej klasy. Ostrzejsze kryterium klasyfikacji można uzyskać poprzez modyfikację poprzedniego rozwiązania. Konstruowany jest wielobok, którego wierzchołki są opisane przez najwyższy punkt rozpatrywanego piku, minimalną intensywność występującą w histogramie oraz, miejsce, dla którego odległość od poprowadzonej prostej A-B jest największa. Kryterium przypisania pikseli do danej klasy jest wówczas najostrzejsze. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-7 Podejście statystyczne Spełnienie przez obraz jednego z dwóch możliwych założeń: - istnienia w obrazie określonej liczby klas i określeniu stopnia przynależności poszczególnych pikseli obrazu do jednej z nich - założeniu nieznanej (nieograniczonej) liczby klas ustalanej w trakcie procesu segmentacji, który polega na łączeniu pikseli o podobnych, szeroko rozumianych właściwościach. Klasyfikacja pikseli obrazów do poszczególnych klas może odbywać się: -na drodze statystycznej, - na podstawie analizy położenia pikseli (na płaszczyźnie lub w rozumieniu intensywnościowym) wokół wartości średnich (w literaturze funkcjonuje to jako algorytm K-Means). Obie metody zakładają istnienie zbioru k zawierającego m klas K={K 1,.,K m}. Proces klasyfikacji pikseli odbywa się iteracyjnie, aż do momentu ustabilizowania założonych parametrów. W przypadku rozwiązania statystycznego parametrem tym jest wyznacznik prawdopodobieństwa przynależności piksela bieżącego do klasy K i, natomiast dla algorytmu K-Means minimalizacja globalnego parametru rozmieszczenia pikseli/intensywności wokół wartości średnich. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-8 Metoda statystyczna- znana liczba klas W podejściu statystycznym wstępnego rozdysponowania pikseli do założonych klas, dokonuje się na podstawie oszacowanych granic przedziałów. Stopień przynależności pikseli t k, i do klas jest modyfikowany w kolejnych iteracjach na podstawie zależności: funkcja zgodności uwzględniająca stopnie przynależności do poszczególnych klas sąsiednich pikseli. Klasyfikacja piksela q do wybranej klasy opiera się na wyznaczeniu probabilistycznej funkcji przyporządkowującej opisanej równaniem Bayes’a: r- numer iteracji Cyfrowe przetwarzanie ..... – M.Kujawińska 1-9 Przykład – metoda statystyczna Poniżej zaprezentowano obraz komórki krwi z wyróżnionymi tłem, cytoplazmą i jądrem. Gęstości prawdopodobieństw poszczególnych klas zostały wyznaczone na podstawie histogramu obrazu wejściowego . Klasyfikowanie pikseli do podanych kategorii odbywa się na podstawie wyżej wymienionej procedury. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-10 Algorytm K- Means Algorytm K-Means polega na iteracyjnym grupowaniu pikseli wokół obliczonych wartości średnich. 1. po powierzchni rozrzucane są punkty wejściowe stanowiące zalążki klastrów - środki ciężkości. 2. Piksele przypisywane są do określonego klastra na podstawie kryterium minimalnej odległości rozpatrywanego punktu od zalążka obszaru. 3. Pogrupowane piksele stanowią zbiory pozwalające wyznaczyć położenie środka ciężkości klastra. 4. Procedura ta jest powtarzana iteracyjnie do momentu ustabilizowania globalnego stopnia przynależności na minimalnym poziomie. Procedura segmentacji obrazów o niezdefiniowanej z góry liczbie elementów wymaga wstępnego wyboru punktów bazowych, wokół których następuje rozrost obszarów. Konieczne jest w tym przypadku określenie kryteriów przynależności pikseli do danego klastra. Powszechnie stosowane jest kryterium intensywnościowe, określające stopień jednolitości obszaru: Cyfrowe przetwarzanie ..... – M.Kujawińska 1-11 Segmentacja – nieznana liczba klas Segmentacja przy nieznanej liczbie klas wymaga wstępnego wyboru pkt. bazowych, wokół których następuje rozrost obszarów. Konieczne jest określenie kryteriów przynależności pikseli do danego klastra. Powszechnie stosowane jest kryterium intensywnościowe, określające stopień jednolitości obszaru. Jeżeli rozpatrywany piksel obrazu nie spełnia wymagań wówczas jest uważany za zalążek nowego obszaru i stanowi punkt wyjścia do dalszej klasyfikacji. Ścieżka analizowania sąsiedztwa piksela jest zależna od założonego na wstępie stopnia spójnośc. Wynik segmentacji obrazu realizowany za pomocą 4-ro spójności i 8-mio spójności może być różny. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-12 Segmentacja – nieznana liczba klas Często segmentację z wykorzystaniem 4- i 8- spójności przeprowadza się dwuetapowo: - segmentacja wstępna z wykorzystaniem 4-ro spójności, - segmentacja końcowa z wykorzystaniem 8-mio spójności. Wynik może zależeć od punktu początkowego przeprowadzanej segmentacji Cyfrowe przetwarzanie ..... – M.Kujawińska 1-13 Segmentacja z nieznaną liczbą klas: Algorytm fagocytowy Rodzina algorytmów hierarchicznych tzn. składających się z kilku faz przetwarzania. Ostatnim, alternatywnym krokiem w tej metodzie, jest łączenie obszarów o zbliżonych właściwościach intensywnościowych, tak by finalny efekt segmentacji spełniał oczekiwania użytkownika. Łączenie obszarów - algorytm fagocytowy. Uwzględnia on stopień podobieństwa rozpatrywanych obszarów pod kątem liczby sąsiadujących pikseli, pomiędzy którymi różnica jasności nie przekracza progu T: P1,P2 – pola rozpatrywanych obszarów LT - długość części granicy pomiędzy obszarami, na której różnica intensywności nie przekracza założonego progu T Cyfrowe przetwarzanie ..... – M.Kujawińska 1-14 Transformacja „Watershed” Do tej kategorii można zaliczyć też transformację " Watersheed". Wymaga ona umieszczenia na obrazie znaczników w sposób automatyczny lub narzucony przez użytkownika. Znaczniki te odpowiadają lokalnym minimalnym intensywnościom. Nie każdy obraz wejściowy daje się w ten sposób przeanalizować. Kluczową sprawą jest wstępne przetwarzanie tworzące w obszarach jednolitych lokalne minima przechodzące w narastające zbocza w pobliżu krawędzi. Do tego celu stosuje się filtry krawędziowe lub wyznacza mapę gradientu morfologicznego. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-15 Watershed Segmentację można obrazowo opisać jako zalewanie wodą zbiornika. Dno zbiornika wyznaczane jest przez obrys przekroju gradientu morfologicznego. Poziom wody podnosząc się zalewa wszystkie sektory aż do momentu połączenia się sąsiednich zbiorników. W takim miejscu stawiana jest zapora i dla danego miejsca algorytm zatrzymuje się. Efektem przetwarzania są punkty rozłożone wzdłuż wierzchołków odpowiadającym granicom pomiędzy sąsiednimi sektorami. Wyznaczanie segmentów może opierać się na analizie jednego z sektorów i monitorowaniu punktów "przelewania" z sąsiednimi obszarami. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-16 Segmentacja konturowa Możliwe jest także tworzenie filtrów wykrywających krawędzie z wykorzystaniem podstawowej wiedzy ze statystyki matematycznej. Maski mogą posiadać rozmiary zależne od wymagań stawianych przez użytkownika. Niezależnie od wymiaru tablicy w otoczeniu piksela, dla zadanej liczby pikseli obliczana jest wartość średnia oraz odchylenie standardowe : gdzie: σ - odchylenie standardowe μ - wartość średnia n - liczba poziomów intensywności p n(n) - prawdopodobieństwo występowania intensywności n Cyfrowe przetwarzanie ..... – M.Kujawińska 1-17 Metoda korelacyjna Segmentacja obszarów należących do krawędzi może również być wspomagana przez techniki korelacyjne związane z dopasowywaniem pewnego wzorca. W tym przypadku zakłada się istnienie pewnego kształtu krawędzi np. łuk, linia prosta o sprecyzowanej jasności. Oba obrazy - wzorzec i obraz oryginalny są splatane i wyznaczana jest korelacja w każdym punkcie. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-18 TEKSTURY Klasyczne podejście do segmentacji obrazów opisane w poprzednich rozdziałach nie zdaje egzaminu, jeśli odniesie się do obrazów złożonych struktur intensywnościowych. Niejednolite obszary, składające się z powtarzalnego przestrzennie zestawu intensywności są nazywane teksturami . Cyfrowe przetwarzanie ..... – M.Kujawińska 1-19 Tekstury Istnieje kilka podstawowych metod służących do analizy tekstur: - statystyczne - dopasowanie wzorca - wykorzystujące współczynniki momentowe Analiza pól tekstur wymaga uwzględnienia nie tylko intensywności w każdym z pikseli obrazu, ale także w ich sąsiedztwie. Rozmiar uwzględnianego w trakcie przetwarzania otoczenia piksela jest zależny od częstotliwości zmian w obrębie tekstury, a jego orientacja od przestrzennego charakteru tekstury. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-20 Tekstury – metody statystyczne 1. Wykorzystanie statystyki pierwszego rzędu. W tym przypadku brana jest pod uwagę wartość wariancji oraz średniej intensywności w otoczeniu piksela . Wygodnie jest stosować to rozwiązanie w przypadku rozpoznawania tekstur o drobnej ziarnistości na tle jednolitych powierzchni. 2. Wykorzystanie statystki drugiego rzędu. W tym celu, dla zadanej wielkości pod-obrazu, konstruuje się tak zwaną "macierz współ-pojawień": Cyfrowe przetwarzanie ..... – M.Kujawińska 1-21 Tekstury Współczynniki macierzy informują ile razy w sąsiedztwie, określonym przez odległość d i kąt t, występują punkty o intensywnościach i,j. Powstała w ten sposób macierz tworzy dwuwymiarowy rozkład prawdopodobieństwa. Na podstawie macierzy wyznaczane mogą być jej wielkości charakterystyczne. Noszą one nazwę współczynników Haralick'a. Poniżej zaprezentowano wybrane parametry "macierzy współ-pojawień": energia macierzy bezwładność macierzy Cyfrowe przetwarzanie ..... – M.Kujawińska 1-22 lokalna jednorodność macierzy Tekstury – operatory bazowe Znając strukturę tekstury można zbudować tzw. operatory bazowe, definiujące wyidealizowaną jej formę i rozkład intensywności. Maska jest przykładana do analizowanego obrazu, a następnie sprawdza się stopień korelacji. Obszary nie spełniające kryterium przynależności, definiowanego przez stopień korelacji, nie są kwalifikowane do danego obszaru. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-23 Rozpoznanie obrazu W większości komputerowych systemów wizyjnych segmentacja jest ostatnim etapem przetwarzania obrazów (obiektów w obrazie). Kolejne operacje są związane procesem analizy obrazu lub/i z identyfikacją treści obserwowanych obrazów. W wyniku segmentacji otrzymuje się obszary lub kontury odpowiadające występującym w obrazie obiektom. Następnie zakłada się, że w analizowanych obrazach znajdują się jedynie obiekty określonych rodzajów i próbuje się klasyfikować/rozpoznawać wydzielone segmenty. Rozpoznanie polega na przypisaniu każdego segmentu do określonej klasy, tzn. uznaje się, że dany segment wyobraża obiekt należący do tej klasy. W celu umożliwienia sklasyfikowania każdego elementu zwykle dopuszcza się też klasę "obiekty niezdefiniowane", gdyż pewne segmenty w wyniku np. nieprawidłowego wydzielenia lub należenia do tła mogą nie reprezentować żadnego obiektu. Zazwyczaj do identyfikacji obrazów stosuje się metody wykorzystujące pojęcie przestrzeni cech. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-24 Przestrzen cech Przestrzenią cech nazywana jest pewna n-wymiarowa przestrzeń, w którą odwzorowane są rozważane obiekty, które opisane są przez pewien zbiór n-cech X = {x1,...,xn}. Cechami mogą być najróżniejsze własności, ale wartość ich dla każdego obiektu musi być pojedynczą liczbą (rzeczywistą lub całkowitą). Jeżeli 'obiektem' będzie np. próbka krwi to cechami mogą być: liczba leukocytów, erytrocytów, poziom hemoglobiny, itd. W przypadku dwuwymiarowych obiektów geometrycznych obserwowanych przez system wizyjny, cechami mogą być: powierzchnia, obwód, liczba otworów, lub stosunek tych wielkości itd. W teorii nie prowadzi się rozważań nad naturą obiektów i cech, ale zakłada się, że cechy są tak wybrane, by obiekt mógł zostać sklasyfikowany na podstawie jego wartości cech. Dla danego obiektu q można określić zbiór jego wartości cech zwany wektorem cech: Cyfrowe przetwarzanie ..... – M.Kujawińska 1-25 Wektor cech Wektor cech jest rezultatem odwzorowania obiektu w n-wymiarową przestrzeń cech (każdy wymiar tej przestrzeni jest, zatem związany z jedną cechą). Niech w rozważanym problemie występuje m klas obiektów K 1,...K m. Ponieważ identyfikacja obiektu jest realizowana na podstawie jego wektora cech, więc w przestrzeni cech powinno istnieć m tzw. obszarów decyzyjnych O 1,...,O m przypisanych poszczególnym klasom i tak dobranych, żeby na podstawie przynależności wektora x(q) do obszaru Oi można było wnioskować o przynależności obiektu p do klasy Ki. przykład: Rozważane są dwie cechy: x 1-"wysokość obiektu", x 2-"szerokość obiektu', oraz dwie klasy obiektów: K 1-obiekty stojące, wysokość K 2-obiekty leżące. Obiekt uznany jest za "stojący", gdy jego wysokość jest większa od szerokości szerokość Cyfrowe przetwarzanie ..... – M.Kujawińska 1-26 Obszary decyzyjne Często zdarza się, że ten sam wektor cech opisuje obiekty z różnych klas, wtedy przynależność do danej klasy ocenia się na podstawie prawdopodobieństwa przynależności obiektu do reprezentowanego przez dany wektor cech do klasy K j i klasyfikuje się obiekt do tej klasy, dla której to prawdopodobieństwo jest największe. W efekcie oznacza to zdefiniowanie w przestrzeni cech obszarów decyzyjnych. W celu właściwej identyfikacji obiektów i odpowiedniego zakwalifikowania ich do określonych właściwych dla danego zadania technicznego klas najważniejszym problemem staje się dobór odpowiedniej przestrzeni cech. Przede wszystkim zależy wybrać cechy najistotniejsze dla sklasyfikowania obiektów. Do tego jednak potrzebna jest znajomość różnych rodzajów cech i ich właściwości. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-27 Cechy obiektów • Barwa, • cechy statystyczne otoczeń (tekstury), • cechy topologiczne - analiza wklęsłości, spójności figur, • cechy geometryczne - współczynniki kształtu - momenty geometryczne, • cechy wynikające ze zmian w czasie Cyfrowe przetwarzanie ..... – M.Kujawińska 1-28 Wektor cech obrazów barwnych Obrazy barwne gwarantują możliwość opisu cech obiektów na podstawie barwnej klasyfikacji pikseli. Obrazy szaroodcieniowe operują pojęciem jasności i w trakcie konwersji obrazów RGB do postaci 8-mio bitowej pewne zestawy barw, mimo zupełnie odmiennego charakteru, są reprezentowane przez tę samą wartość np. punkt o intensywności zielonej barwy 150, w obrazie szaroodcieniowym będzie identyczny, co punkt niebieski z tą samej wartości. Dysponując sześcianem barw RGB można stworzyć trójwymiarowy model obrazu wejściowego. Model ten odniesiony do dowolnego obrazu barwnego pozwala określić położenie w przestrzeni RGB poszczególnych jego elementów i wybrać optymalny próg odcięcia dla trzech składowych, czerwonej, zielone i niebieskiej. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-29 Cechy topologiczne Cechy topologiczne (spójność, wklęsłość, wypukłość) szczególnie użyteczne w przypadku analizy obrazów biomedycznych, gdyż występujące tam obiekty wykazują znaczne zróżnicowanie kształtów i/lub spójności, a właśnie za pomocą pojęć topologicznych można opisać właściwości wspólne dla całej klasy obiektów. Na przykład liczba jąder komórkowych to typowa cecha topologiczna (liczba Eulera). Może ona być wykryta poprzez określenie liczby otworów w obszarach komórki. Analizę przeprowadza się po binaryzacji obrazu z odpowiednim progiem odcięcia. Cechy topologiczne są niezależne od położenia obiektu względem układu współrzędnych, co może być ich zaletą, ale dotyczą zbyt ogólnych własności obiektów i dlatego są mało praktyczne do celów przemysłowych. Jedną z cech topologicznych jest liczba Eulera - E , którą określają odpowiednie wzory inne dla obrazów po segmentacji obszarowej i segmentacji konturowej. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-30 Cechy topologiczne – liczba Eulera po segmentacji obszarowej E=C-H gdzie: C - liczba spójnych składników obiektu H - liczba otworów po segmentacji obszarowej E=V-S+F gdzie: V - liczba wierzchołków H - liczba krawędzi F - liczba wypełnionych ścian E =1-2 = -1 E = 5-7+1 = -1 E =3-5 =-2 E = 7-7+1 = 1 E =2-1 = 1 Cyfrowe przetwarzanie ..... – M.Kujawińska 1-31 Cechy geometryczne Cechy geometryczne dotyczą głównie opisu figur obrazów binarnych. Mogą być one wyrażone przez: - współczynniki kształtu, - współczynniki momentowe. Cechy geometryczne mogą być wyznaczane zarówno w płaszczyźnie samego obrazu, jak i jego reprezentacji widmowej (w płaszczyźnie częstości przestrzennych. W tym drugim przypadku mówimy o cechach zwanych deskryptorami fourierowskimi. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-32 Współczynniki kształtu Współczynniki kształtu Wyróżnia się następujące parametry służące do opisu geometrii obiektów: a) pole powierzchni, którego pomiar sprowadza się do zliczenia pikseli należących do interesującego nas obszaru. Cecha ta jest czuła na błędy wynikłe z niewłaściwej binaryzacji, jednak z drugiej strony jest nieczuła na przesunięcie i obrót obiektu w polu widzenia. b) obwód, czyli długość brzegu obiektu. Pomiar tej cechy jest dość trudny z uwagi na konieczność przybliżania ciągłej linii dyskretną kombinacją punktów obrazu. W praktyce wykorzystuje się następujące sposoby pomiaru obwodu gdzie: L - obwód obiektu, S - pole powierzchni obiektu Cyfrowe przetwarzanie ..... – M.Kujawińska 1-33 Współczynniki kształtu c) zwartość (popularny współczynnik opisu kształtu niezależny od liniowych transformacji-skali, rotacji ) opisywana jest wzorem: gdzie: L - obwód obiektu, S - pole pow. obiektu c) centryczność jest to stosunek długości maksymalnej cięciwy A obiektu do maksymalnej długości cięciwy B prostopadłej do A (Rys.5.23): Centryczność można także obliczyć za pomocą momentów w następujący sposób: gdzie: S - pole powierzchni obiektu, μ20, μ02, μ11 - momenty geometryczne Cyfrowe przetwarzanie ..... – M.Kujawińska 1-34 Współczynniki kształtu d) smukłość, jest stosunkiem długości boków prostokąta granicznego opisanego na obiekcie, tzn. takiego którego pole jest minimalne. Zatem smukłość wykorzystując parametry a,b możemy wyrazić wzorem: Kryterium tego nie stosuje się do obiektów o kształtach zbliżonych do okręgu Wtedy smukłość liczymy jako stosunek pola powierzchni obiektu do kwadratu jego szerokości d: e) prostokątność, jako stosunek pola powierzchni obiektu (S) do pola powierzchni prostokąta opisanego na tym obiekcie, którego pole jest minimalne. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-35 Współczynniki kształtu f) długość rzutów, gdy figura jest wypukła wystarczy jeden rzut, gdy jest wklęsła-tworzymy kilka rzutów cząstkowych składających się na rzut rozwinięty. g) średnice Fereta - wymiary obiektu wyrażające jego rozpiętość w poziomie i w pionie (współrzędne skrajnych punktów cząstki) Cyfrowe przetwarzanie ..... – M.Kujawińska 1-36 Współczynniki kształtu h) kierunek, jest to kierunek dłuższego z boków minimalnego prostokąta granicznego. Jeżeli momenty bezwładności pierwszego i drugiego rzędu są znane to kierunek można wyrazić wzorem: Wyliczanie kierunku ma sens jedynie dla obiektów smukłych. Smukłość i prostokątność są niezależne od transformacji liniowych: przesunięcia, obrotu i skalowania. Kierunek zaś jest zależny jedynie od obrotu. i) inne współczynniki kształtu: Współczynniki cyrkularności gdzie: L - obwód obiektu, S - pole powierzchni obiektu Współczynnik Malinowskiej Cyfrowe przetwarzanie ..... – M.Kujawińska 1-37 Współczynniki kształtu Obliczenia powyższych współczynników trwają stosunkowo krótko, ale odznaczają się niezbyt dokładną klasyfikacją. Gdy szybkość działania nie jest najważniejsza, a istotna jest dokładność opisu obiektów za pośrednictwem ich cech stosuje się następujące współczynniki: współczynnik Blaira-Blissa współczynnik Danielssona współczynnik Haralick'a współczynnik M 2 Cyfrowe przetwarzanie ..... – M.Kujawińska 1-38 Współczynniki kształtu, a momentowe Dla każdej klasy obiektów oczekiwanych w obrazie należy drogą doświadczalną sprawdzić czy przyjęte współczynniki kształtu w wystarczający sposób różnicują analizowane obiekty. Problemy ze współczynnikami kształtu: - czułe na duże zmiany skali, - czułe na dyskretyzację, - bardzo czułe na zniekształcenia związane z konfiguracją układu detekcji (perspektywa), - zróżnicowana czułość na zmiany proporcji figur. Własności figur mogą być także opisane zależnościami momentowymi. Momenty obliczane według zależności: gdzie: f(x,y) - intensywność w pikselu (x,y), A - analizowany obszar, p,q = 0,...,n Cyfrowe przetwarzanie ..... – M.Kujawińska 1-39 Współczynniki momentowe W procesie charakteryzowania figur przydatne są zwłaszcza momenty pierwszego i drugiego rzędu. Momenty pierwszego rzędu określają położenie środka ciężkości a momenty drugiego rzędu (p=0,q=2 lub p=2,q=0) są miarą bezwładności danego obiektu. W przypadku rozważań geometrycznych można jeszcze wprowadzić pojęcie momentu konturowego wyznaczanego wzdłuż kontura L: Momenty centralne: μpq, C pq tworzą cechy niezmiennicze względem przesunięcia. Za pomocą: μ pq, C pq oraz μ 00, c 00 można skonstruować cechy niezależne względem: przesunięcia, obrotu i zmiany skali: Cyfrowe przetwarzanie ..... – M.Kujawińska 1-40 Współczynniki momentowe Niezmienniki momentowe są cechami o fundamentalnym znaczeniu przy rozpoznawaniu obiektów płaskich, bo umożliwiają rozpoznanie obiektów przy ich różnej lokalizacji w polu widzenia (w tym ruchome obiekty) oraz przy różnych powiększeniach układu (także ruchy kamer w górę i w dół). Istnieją także wyrażenia momentowe używające momentów obszarowych, które są niezmiennicze względem dowolnego nieosobliwego przekształcenia liniowego, dzięki czemu kamera może być dowolnie umieszczona względem obserwowanych obiektów płaskich. Metody momentowe (momenty konturowe) mogą też znaleźć zastosowanie do identyfikacji obiektów nie w pełni widocznych. Istota takiej identyfikacji polega na badaniu zmian, jakim ulegają momenty konturowe w miarę stopniowego przesłaniania obiektu. Przy wyborze cech uwzględnić należy zarówno rozdzielające własności poszczególnych cech, jak też ich obliczeniową złożoność (ilość obliczeń niezbędnych do wyznaczenia ich wartości) oraz inne praktyczne uwarunkowania. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-41 System rozpoznawania obrazów Opisane metody klasyfikacji obiektów znajdują praktyczne zastosowanie w systemach widzenia maszynowego. Systemy te są obecne w wielu gałęziach szeroko pojętego przemysłu od branży spożywczej po zbrojeniową oraz w różnorodnych zastosowaniach multimedialnych (tworzenie filmów animowanych, śledzenie obiektów i ich zamiana na inne.). Wykorzystanie urządzeń optycznych wraz z odpowiednim oprogramowaniem rozpoznawania obrazu w znacznym stopniu usprawnia proces kontroli końcowej czy pozwala na bieżąco kontrolować stan zestawianych na taśmie produkcyjnej urządzeń. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-42 Operacje rozpoznania obrazu System rozpoznawania obrazu można zaprojektować w formie ustalonego szablonu decyzyjnego lub jako system uczący się na podstawie uaktualnianych opisów cech. Faza uczenia polega na optymalizowaniu zestawu sklasyfikowanych wektorów cech i na ich podstawie modyfikacji postaci funkcji rozdzielającej. Poza etapem uczenia działanie algorytmów identyfikacji obrazów przebiega analogicznie. Składają się na niego trzy podstawowe operacje: 1. Przypisanie obiektom q wektorów cech w przestrzeni n-wymiarowej 2. Obliczenie wartości funkcji przynależności . Jest ona miarą stopnia dopasowania obiektu opisanego wektorem do klasy i. W przypadku niejednoznacznej klasyfikacji obiektu, analizuje się prawdopodobieństwo przynależności do danej klasy: gdzie: - rozkład gęstości prawdopodobieństwa dla wektora cech w obrębie klasy K i - prawdopodobieństwo pojawienia się obiektów z klasy K i Cyfrowe przetwarzanie ..... – M.Kujawińska 1-43 Operacje rozpoznania obrazu 3. Proces podejmowania decyzji, czyli przyporządkowywanie obiektu q opisanego wektorem cech do klasy i, dla której wartość funkcji przynależności jest maksymalna. W przypadku przestrzeni charakteryzowanej przez dwie klasy obiektów, podjęcie decyzji o zakwalifikowaniu do jednej z nich odbywa się na zasadzie określenia stopnia przynależności,czyli prawdopodobieństwa, z jakim dany obiekt należy do jednej z klas K 1 lub K 2. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-44 Przykład Do zilustrowania powyższego schematu postępowania może posłużyć problem rozpoznawania i kwalifikowania płytek okrągłych i eliptycznych. Po etapie binaryzacji i segmentacji, w obrazie pozostały elementy, których intensywność spełnia założone kryteria Następnie dla wszystkich obiektów obrazu wyznaczana jest przestrzeń cech (tu: jednowymiarowa). W odniesieniu do analizowanego problemu, sposób ten pozwoli odrzucić obiekty, których kształt nie odpowiada założonych kryteriów (zostaną odrzucone wszystkie obiekty "kanciaste"). Po wstępnym rozpoznaniu następuje etap klasyfikacji właściwej. Pozostałe w obrazie elementy są analizowane pod kątem relacji dwóch osi symetrii. W przypadku kół lub figur im bliskich, stosunek dwóch prostopadłych średnic jest bliski jedności. Natomiast figury eliptyczne mają iloraz znacznie wyższy. Na rysunku zaprezentowano (kolorem czerwonym - obiekty "okrągłe", czarnym "eliptyczne") efekt rozpoznania na zasadzie rozkładu prawdopodobieństw z środkowego. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-45 Analiza semantyczna (zrozumienie) Analiza semantyczna może być wykonywana (na pewnym poziomie) poprzez operacje realizowane z wykorzystaniem sieci neuronowych, logiki rozmytej i algorytmów genetycznych. Próby realizacji systemów, które dawałyby możliwość właściwej interpretacji sceny i podejmowania na tej podstawie skomplikowanych decyzji są równocześnie próbami zakodowania w algorytmy procesów myślenia i kojarzenia, jakie zachodzą w naszym mózgu. Obecnie wiele ośrodków naukowych pracuje nad tymi metodami, również pod kątem ich aplikacji w systemach sztucznej inteligencji i wirtualnej rzeczywistości. Cyfrowe przetwarzanie ..... – M.Kujawińska 1-46