CPO-Segmentacja

Transkrypt

CPO-Segmentacja
SEGMENTACJA
Celem segmentacji jest takie przetworzenie danych zawartych w obrazie, aby
uzyskać taki jego podział, który pomoże w rozpoznaniu obiektów w nim
zawartych i interpretacji.
Ogólnie rzecz ujmując obraz jest pewnym rozkładem intensywności
reprezentującym kilka obiektów bądź klas obiektów (obrazy wielo-odcieniowe),
a w przypadku obrazów binarnych zestawem kilku rozdzielnych jednolitych
elementów i tła.
Segmentacja służy, do uproszczenia opisu obrazu poprzez zmniejszenie
nadmiarowej informacji, grupowanie pikseli o zbliżonych intensywnościach lub
łączenie pikseli opisujących poszczególne elementy.
Formalnie w wyniku procesu segmentacji następuje podzielenie pikseli obrazu
na kilka rozdzielnych klas.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-1
Kryteria klasyfikacji pikseli
• Klasyfikacja pikseli może być przeprowadzona ze
względu na jedno z wielu kryteriów, z czego do
najważniejszych należą:
- klasyfikacja przestrzenna (kryterium: lokalizacja piksela),
- klasyfikacja czasowa ( kryteruin zmiana intensywności w
czasie/ruch obiektów),
- klasyfikacja spektralna (kryterium: barwa/ zawartość RGB
piksela),
- klasyfikacja statystyczna (kryterium parametr statystyczny
rozkładu jasności w otoczeniu piksela; segmentacja
tekstur).
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-2
Segmentacja, a rozpoznanie obiektów
Segmentacja obrazu pomaga wydzielić w obrazie obiekty, którym w wyniku
analizy obiektów (pomiar- wyznaczenie współczynników kształtu/ liczenie
transformat/ liczenie współczynników momentowych i in.) zostaną nadane
im cechy, zgodnie z którymi następuje przypisanie obiektów do
odpowiednich klas.
Podstawowe grupy segmentacji:
- segmentację obszarową (od najprostszego progowania obrazu
skończywszy na segmentacji statystycznej tekstur),
- segmentację krawędziową .
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-3
Segmentacja obszarowa
Procedury segmentacji obszarowej klasyfikują piksele obrazu do oczekiwanej
przez użytkownika liczby obszarów/ klastrów.
Do wyszukania pożądanych progów odcięcia wykorzystuje się:
podejście statystyczne lub analizę histogramu.
Segmentacja przez progowanie:
Obiekty znajdujące się na obrazie o pozornie tej samej barwie, w
rzeczywistości opisane są przez pewien zbiór intensywności tworzący
charakterystyczne piki na histogramie.
Celem segmentacji przez
progowanie jest zdefiniowanie
granicznych wartości
intensywności, które pozwolą
oddzielić składowe elementy
obrazu (tu:obraz dwumodalny)
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-4
Metoda analizy dyskryminacyjnej (M. Otsu)
Metoda ta pozwala wyznaczyć próg odcięcia T korzystając z podziału pikseli
obrazu na dwie klasy: obiekt i tło. W takim układzie histogram traktuje się jako
zazębiające się dwa rozkłady normalne odpowiadające tłu i obiektowi.
Dla progu T ustalane jest położenie w zależności od wartości średnich μ 1 μ 2 i
odchyleń standardowych rozkładów prawdopodobieństw tła i obiektu.
Próg odcięcia przypada w miejscu max. wartości wariancji międzyklasowej
Rozwiązanie dla histogramów bimodalnych o
różnych szerokościach pików
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-5
Metody intensywnościowe - iteracyjne
Metody intensywnościowe do analizy wykorzystują jedynie histogram obrazu
oraz informację o liczbie klas, do których piksele obrazu powinny zostać
zakwalifikowane.
Progi mogą być wyznaczane przez użytkownika lub automatycznie poprzez
analizę histogram obrazu i wyszukanie doliny pomiędzy sąsiednimi pikami.
Szybka analiza, ale możliwa zła klasyfikacja przy lokalnych minimach.
Rozwiązanie – METODA ITERACYJNA
Szacuje się w nim początkowe położenie progu T. Dla zadanej lokalizacji
obliczane są średnie intensywności tła i obiektu T tło i T obiekt, a na ich
podstawie wyznacza się tymczasowy próg oraz T tło i T obiekt będące
wartościami wejściowymi do kolejnej iteracji.
Proces trwa do momentu
ustabilizowania się położenia
progu.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-6
Metoda wieloboku
Niedogodnością tego rozwiązania jest fakt dołączenia pikseli obrazu nieprzynależących do danej klasy.
Ostrzejsze kryterium klasyfikacji można uzyskać poprzez modyfikację
poprzedniego rozwiązania. Konstruowany jest wielobok, którego wierzchołki
są opisane przez najwyższy punkt rozpatrywanego piku, minimalną
intensywność występującą w histogramie oraz, miejsce, dla którego odległość
od poprowadzonej prostej A-B jest największa.
Kryterium przypisania pikseli do danej
klasy jest wówczas najostrzejsze.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-7
Podejście statystyczne
Spełnienie przez obraz jednego z dwóch możliwych założeń:
- istnienia w obrazie określonej liczby klas i określeniu stopnia
przynależności poszczególnych pikseli obrazu do jednej z nich
- założeniu nieznanej (nieograniczonej) liczby klas ustalanej w trakcie
procesu segmentacji, który polega na łączeniu pikseli o podobnych,
szeroko rozumianych właściwościach.
Klasyfikacja pikseli obrazów do poszczególnych klas może odbywać się:
-na drodze statystycznej,
- na podstawie analizy położenia pikseli (na płaszczyźnie lub w rozumieniu
intensywnościowym) wokół wartości średnich (w literaturze funkcjonuje to
jako algorytm K-Means).
Obie metody zakładają istnienie zbioru k zawierającego m klas K={K 1,.,K
m}. Proces klasyfikacji pikseli odbywa się iteracyjnie, aż do momentu
ustabilizowania założonych parametrów.
W przypadku rozwiązania statystycznego parametrem tym jest wyznacznik
prawdopodobieństwa przynależności piksela bieżącego do klasy K i,
natomiast dla algorytmu K-Means minimalizacja globalnego parametru
rozmieszczenia pikseli/intensywności wokół wartości średnich.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-8
Metoda statystyczna- znana liczba klas
W podejściu statystycznym wstępnego rozdysponowania pikseli do
założonych klas, dokonuje się na podstawie oszacowanych granic
przedziałów. Stopień przynależności pikseli t k, i do klas jest modyfikowany w
kolejnych iteracjach na podstawie zależności:
funkcja zgodności uwzględniająca stopnie przynależności do
poszczególnych klas sąsiednich pikseli.
Klasyfikacja piksela q do wybranej klasy opiera się na wyznaczeniu
probabilistycznej funkcji przyporządkowującej opisanej równaniem Bayes’a:
r- numer iteracji
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-9
Przykład – metoda statystyczna
Poniżej zaprezentowano obraz komórki krwi z wyróżnionymi tłem,
cytoplazmą i jądrem. Gęstości prawdopodobieństw poszczególnych klas
zostały wyznaczone na podstawie histogramu obrazu wejściowego .
Klasyfikowanie pikseli do podanych kategorii odbywa się na podstawie
wyżej wymienionej procedury.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-10
Algorytm K- Means
Algorytm K-Means polega na iteracyjnym grupowaniu pikseli wokół
obliczonych wartości średnich.
1. po powierzchni rozrzucane są punkty wejściowe stanowiące zalążki
klastrów - środki ciężkości.
2. Piksele przypisywane są do określonego klastra na podstawie kryterium
minimalnej odległości rozpatrywanego punktu od zalążka obszaru.
3. Pogrupowane piksele stanowią zbiory pozwalające wyznaczyć położenie
środka ciężkości klastra.
4. Procedura ta jest powtarzana iteracyjnie do momentu ustabilizowania
globalnego stopnia przynależności na minimalnym poziomie.
Procedura segmentacji obrazów o niezdefiniowanej z góry liczbie elementów
wymaga wstępnego wyboru punktów bazowych, wokół których następuje
rozrost obszarów. Konieczne jest w tym przypadku określenie kryteriów
przynależności pikseli do danego klastra. Powszechnie stosowane jest
kryterium intensywnościowe, określające stopień jednolitości obszaru:
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-11
Segmentacja – nieznana liczba klas
Segmentacja przy nieznanej liczbie klas wymaga wstępnego wyboru pkt.
bazowych, wokół których następuje rozrost obszarów.
Konieczne jest określenie kryteriów przynależności pikseli do danego
klastra.
Powszechnie stosowane jest kryterium intensywnościowe, określające
stopień jednolitości obszaru.
Jeżeli rozpatrywany piksel obrazu nie spełnia wymagań wówczas jest
uważany za zalążek nowego obszaru i stanowi punkt wyjścia do dalszej
klasyfikacji. Ścieżka analizowania sąsiedztwa piksela jest zależna od
założonego na wstępie stopnia spójnośc. Wynik segmentacji obrazu
realizowany za pomocą 4-ro spójności i 8-mio spójności może być różny.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-12
Segmentacja – nieznana liczba klas
Często segmentację z wykorzystaniem 4- i 8- spójności przeprowadza się
dwuetapowo:
- segmentacja wstępna z wykorzystaniem 4-ro spójności,
- segmentacja końcowa z wykorzystaniem 8-mio spójności.
Wynik może zależeć od punktu
początkowego przeprowadzanej segmentacji
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-13
Segmentacja z nieznaną liczbą klas: Algorytm
fagocytowy
Rodzina algorytmów hierarchicznych tzn. składających się z kilku faz
przetwarzania.
Ostatnim, alternatywnym krokiem w tej metodzie, jest łączenie obszarów
o zbliżonych właściwościach intensywnościowych, tak by finalny efekt
segmentacji spełniał oczekiwania użytkownika.
Łączenie obszarów - algorytm fagocytowy. Uwzględnia on stopień
podobieństwa rozpatrywanych obszarów pod kątem liczby sąsiadujących
pikseli, pomiędzy którymi różnica jasności nie przekracza progu T:
P1,P2 – pola rozpatrywanych obszarów
LT - długość części granicy pomiędzy obszarami, na której różnica
intensywności nie przekracza założonego progu T
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-14
Transformacja „Watershed”
Do tej kategorii można zaliczyć też transformację " Watersheed". Wymaga
ona umieszczenia na obrazie znaczników w sposób automatyczny lub
narzucony przez użytkownika. Znaczniki te odpowiadają lokalnym
minimalnym intensywnościom. Nie każdy obraz wejściowy daje się w ten
sposób przeanalizować. Kluczową sprawą jest wstępne przetwarzanie
tworzące w obszarach jednolitych lokalne minima przechodzące w
narastające zbocza w pobliżu krawędzi.
Do tego celu stosuje się filtry krawędziowe lub wyznacza mapę gradientu
morfologicznego.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-15
Watershed
Segmentację można obrazowo opisać jako zalewanie wodą zbiornika.
Dno zbiornika wyznaczane jest przez obrys przekroju gradientu
morfologicznego. Poziom wody podnosząc się zalewa wszystkie sektory aż
do momentu połączenia się sąsiednich zbiorników. W takim miejscu stawiana
jest zapora i dla danego miejsca algorytm zatrzymuje się. Efektem
przetwarzania są punkty rozłożone wzdłuż wierzchołków odpowiadającym
granicom pomiędzy sąsiednimi sektorami. Wyznaczanie segmentów może
opierać się na analizie jednego z sektorów i monitorowaniu punktów
"przelewania" z sąsiednimi obszarami.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-16
Segmentacja konturowa
Możliwe jest także tworzenie filtrów wykrywających krawędzie z
wykorzystaniem podstawowej wiedzy ze statystyki matematycznej. Maski
mogą posiadać rozmiary zależne od wymagań stawianych przez
użytkownika. Niezależnie od wymiaru tablicy w otoczeniu piksela, dla
zadanej liczby pikseli obliczana jest wartość średnia oraz odchylenie
standardowe :
gdzie:
σ - odchylenie standardowe
μ - wartość średnia
n - liczba poziomów intensywności
p n(n) - prawdopodobieństwo występowania intensywności n
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-17
Metoda korelacyjna
Segmentacja obszarów należących do krawędzi może również być
wspomagana przez techniki korelacyjne związane z dopasowywaniem
pewnego wzorca.
W tym przypadku zakłada się istnienie pewnego kształtu krawędzi np. łuk,
linia prosta o sprecyzowanej jasności. Oba obrazy - wzorzec i obraz
oryginalny są splatane i wyznaczana jest korelacja w każdym punkcie.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-18
TEKSTURY
Klasyczne podejście do segmentacji
obrazów opisane w poprzednich
rozdziałach nie zdaje egzaminu, jeśli
odniesie się do obrazów złożonych
struktur intensywnościowych.
Niejednolite obszary,
składające się z
powtarzalnego przestrzennie
zestawu intensywności są
nazywane teksturami .
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-19
Tekstury
Istnieje kilka podstawowych metod służących do analizy
tekstur:
- statystyczne
- dopasowanie wzorca
- wykorzystujące współczynniki momentowe
Analiza pól tekstur wymaga uwzględnienia nie tylko
intensywności w każdym z pikseli obrazu, ale także w ich
sąsiedztwie.
Rozmiar uwzględnianego w trakcie przetwarzania otoczenia
piksela jest zależny od częstotliwości zmian w obrębie tekstury,
a jego orientacja od przestrzennego charakteru tekstury.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-20
Tekstury – metody statystyczne
1. Wykorzystanie statystyki pierwszego rzędu.
W tym przypadku brana jest pod uwagę wartość wariancji oraz średniej
intensywności w otoczeniu piksela .
Wygodnie jest stosować to rozwiązanie w przypadku rozpoznawania
tekstur o drobnej ziarnistości na tle jednolitych powierzchni.
2. Wykorzystanie statystki drugiego rzędu.
W tym celu, dla zadanej wielkości pod-obrazu, konstruuje się tak zwaną
"macierz współ-pojawień":
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-21
Tekstury
Współczynniki macierzy informują ile razy w sąsiedztwie, określonym przez
odległość d i kąt t, występują punkty o intensywnościach i,j. Powstała w ten
sposób macierz tworzy dwuwymiarowy rozkład prawdopodobieństwa.
Na podstawie macierzy wyznaczane mogą być jej wielkości
charakterystyczne. Noszą one nazwę współczynników Haralick'a. Poniżej
zaprezentowano wybrane parametry "macierzy współ-pojawień":
energia macierzy
bezwładność macierzy
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-22
lokalna jednorodność
macierzy
Tekstury – operatory bazowe
Znając strukturę tekstury można zbudować tzw. operatory bazowe,
definiujące wyidealizowaną jej formę i rozkład intensywności.
Maska jest przykładana do analizowanego obrazu, a następnie sprawdza
się stopień korelacji.
Obszary nie spełniające kryterium przynależności, definiowanego przez
stopień korelacji, nie są kwalifikowane do danego obszaru.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-23
Rozpoznanie obrazu
W większości komputerowych systemów wizyjnych segmentacja jest
ostatnim etapem przetwarzania obrazów (obiektów w obrazie).
Kolejne operacje są związane procesem analizy obrazu lub/i z identyfikacją
treści obserwowanych obrazów.
W wyniku segmentacji otrzymuje się obszary lub kontury odpowiadające
występującym w obrazie obiektom. Następnie zakłada się, że w
analizowanych obrazach znajdują się jedynie obiekty określonych rodzajów i
próbuje się klasyfikować/rozpoznawać wydzielone segmenty. Rozpoznanie
polega na przypisaniu każdego segmentu do określonej klasy, tzn. uznaje
się, że dany segment wyobraża obiekt należący do tej klasy. W celu
umożliwienia sklasyfikowania każdego elementu zwykle dopuszcza się też
klasę "obiekty niezdefiniowane", gdyż pewne segmenty w wyniku np.
nieprawidłowego wydzielenia lub należenia do tła mogą nie reprezentować
żadnego obiektu. Zazwyczaj do identyfikacji obrazów stosuje się metody
wykorzystujące pojęcie przestrzeni cech.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-24
Przestrzen cech
Przestrzenią cech nazywana jest pewna n-wymiarowa przestrzeń, w którą
odwzorowane są rozważane obiekty, które opisane są przez pewien zbiór
n-cech X = {x1,...,xn}.
Cechami mogą być najróżniejsze własności, ale wartość ich dla każdego
obiektu musi być pojedynczą liczbą (rzeczywistą lub całkowitą).
Jeżeli 'obiektem' będzie np. próbka krwi to cechami mogą być: liczba
leukocytów, erytrocytów, poziom hemoglobiny, itd. W przypadku
dwuwymiarowych obiektów geometrycznych obserwowanych przez system
wizyjny, cechami mogą być: powierzchnia, obwód, liczba otworów, lub
stosunek tych wielkości itd.
W teorii nie prowadzi się rozważań nad naturą obiektów i cech, ale zakłada
się, że cechy są tak wybrane, by obiekt mógł zostać sklasyfikowany na
podstawie jego wartości cech. Dla danego obiektu q można określić zbiór
jego wartości cech zwany wektorem cech:
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-25
Wektor cech
Wektor cech jest rezultatem odwzorowania obiektu w n-wymiarową
przestrzeń cech (każdy wymiar tej przestrzeni jest, zatem związany z jedną
cechą).
Niech w rozważanym problemie występuje m klas obiektów K 1,...K m.
Ponieważ identyfikacja obiektu jest realizowana na podstawie jego wektora
cech, więc w przestrzeni cech powinno istnieć m tzw. obszarów decyzyjnych
O 1,...,O m przypisanych poszczególnym klasom i tak dobranych, żeby na
podstawie przynależności wektora x(q) do obszaru Oi można było
wnioskować o przynależności obiektu p do klasy Ki.
przykład:
Rozważane są dwie cechy: x 1-"wysokość obiektu", x 2-"szerokość obiektu',
oraz dwie klasy obiektów: K 1-obiekty stojące,
wysokość
K 2-obiekty leżące. Obiekt uznany jest za
"stojący", gdy jego wysokość jest większa
od szerokości
szerokość
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-26
Obszary decyzyjne
Często zdarza się, że ten sam wektor cech opisuje obiekty z różnych klas,
wtedy przynależność do danej klasy ocenia się na podstawie
prawdopodobieństwa przynależności obiektu do reprezentowanego przez
dany wektor cech do klasy K j i klasyfikuje się obiekt do tej klasy, dla
której to prawdopodobieństwo jest największe.
W efekcie oznacza to zdefiniowanie w przestrzeni cech obszarów
decyzyjnych. W celu właściwej identyfikacji obiektów i odpowiedniego
zakwalifikowania ich do określonych właściwych dla danego zadania
technicznego klas najważniejszym problemem staje się dobór
odpowiedniej przestrzeni cech.
Przede wszystkim zależy wybrać cechy najistotniejsze dla sklasyfikowania
obiektów. Do tego jednak potrzebna jest znajomość różnych rodzajów
cech i ich właściwości.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-27
Cechy obiektów
• Barwa,
• cechy statystyczne otoczeń (tekstury),
• cechy topologiczne - analiza
wklęsłości, spójności figur,
• cechy geometryczne
- współczynniki kształtu
- momenty geometryczne,
• cechy wynikające ze zmian w czasie
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-28
Wektor cech obrazów barwnych
Obrazy barwne gwarantują możliwość opisu cech obiektów na podstawie
barwnej klasyfikacji pikseli.
Obrazy szaroodcieniowe operują pojęciem jasności i w trakcie konwersji
obrazów RGB do postaci 8-mio bitowej pewne zestawy barw, mimo
zupełnie odmiennego charakteru, są reprezentowane przez tę samą
wartość np. punkt o intensywności zielonej barwy 150, w obrazie
szaroodcieniowym będzie identyczny, co punkt niebieski z tą samej
wartości. Dysponując sześcianem barw RGB można stworzyć
trójwymiarowy model obrazu wejściowego.
Model ten odniesiony do dowolnego
obrazu barwnego pozwala określić
położenie w przestrzeni RGB
poszczególnych jego elementów i
wybrać optymalny próg odcięcia dla
trzech składowych, czerwonej, zielone
i niebieskiej.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-29
Cechy topologiczne
Cechy topologiczne (spójność, wklęsłość, wypukłość) szczególnie
użyteczne w przypadku analizy obrazów biomedycznych, gdyż występujące
tam obiekty wykazują znaczne zróżnicowanie kształtów i/lub spójności, a
właśnie za pomocą pojęć topologicznych można opisać właściwości
wspólne dla całej klasy obiektów.
Na przykład liczba jąder komórkowych to typowa cecha topologiczna (liczba
Eulera). Może ona być wykryta poprzez określenie liczby otworów w
obszarach komórki. Analizę przeprowadza się po binaryzacji obrazu z
odpowiednim progiem odcięcia.
Cechy topologiczne są niezależne od położenia obiektu względem układu
współrzędnych, co może być ich zaletą, ale dotyczą zbyt ogólnych
własności obiektów i dlatego są mało praktyczne do celów przemysłowych.
Jedną z cech topologicznych jest liczba Eulera - E , którą określają
odpowiednie wzory inne dla obrazów po segmentacji obszarowej i
segmentacji konturowej.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-30
Cechy topologiczne – liczba Eulera
po segmentacji obszarowej
E=C-H
gdzie:
C - liczba spójnych składników obiektu
H - liczba otworów
po segmentacji obszarowej
E=V-S+F
gdzie:
V - liczba wierzchołków
H - liczba krawędzi
F - liczba wypełnionych ścian
E =1-2 = -1
E = 5-7+1 = -1
E =3-5 =-2
E = 7-7+1 = 1
E =2-1 = 1
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-31
Cechy geometryczne
Cechy geometryczne dotyczą głównie opisu figur
obrazów binarnych. Mogą być one wyrażone przez:
- współczynniki kształtu,
- współczynniki momentowe.
Cechy geometryczne mogą być wyznaczane
zarówno w płaszczyźnie samego obrazu, jak i jego
reprezentacji widmowej (w płaszczyźnie częstości
przestrzennych.
W tym drugim przypadku mówimy o cechach
zwanych deskryptorami fourierowskimi.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-32
Współczynniki kształtu
Współczynniki kształtu
Wyróżnia się następujące parametry służące do opisu
geometrii obiektów:
a) pole powierzchni, którego pomiar sprowadza się do
zliczenia pikseli należących do interesującego nas obszaru.
Cecha ta jest czuła na błędy wynikłe z niewłaściwej
binaryzacji, jednak z drugiej strony jest nieczuła na
przesunięcie i obrót obiektu w polu widzenia.
b) obwód, czyli długość brzegu obiektu. Pomiar tej cechy
jest dość trudny z uwagi na konieczność przybliżania ciągłej
linii dyskretną kombinacją punktów obrazu. W praktyce
wykorzystuje się następujące sposoby pomiaru obwodu
gdzie: L - obwód obiektu, S - pole powierzchni obiektu
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-33
Współczynniki kształtu
c) zwartość (popularny współczynnik opisu kształtu niezależny od
liniowych transformacji-skali, rotacji ) opisywana
jest wzorem:
gdzie: L - obwód obiektu, S - pole pow. obiektu
c) centryczność jest to stosunek długości maksymalnej cięciwy A
obiektu do maksymalnej długości cięciwy B prostopadłej do A (Rys.5.23):
Centryczność można także obliczyć za pomocą momentów w następujący
sposób:
gdzie: S - pole powierzchni obiektu, μ20, μ02, μ11 - momenty geometryczne
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-34
Współczynniki kształtu
d) smukłość, jest stosunkiem długości boków prostokąta granicznego
opisanego na obiekcie, tzn. takiego którego pole jest minimalne. Zatem
smukłość wykorzystując parametry a,b możemy wyrazić wzorem:
Kryterium tego nie stosuje się do obiektów o kształtach zbliżonych do okręgu
Wtedy smukłość liczymy jako stosunek pola powierzchni obiektu do
kwadratu jego szerokości d:
e) prostokątność, jako stosunek pola powierzchni obiektu (S) do pola
powierzchni prostokąta opisanego na tym obiekcie, którego pole jest
minimalne.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-35
Współczynniki kształtu
f) długość rzutów, gdy figura jest wypukła wystarczy jeden rzut, gdy jest
wklęsła-tworzymy kilka rzutów cząstkowych składających się na rzut
rozwinięty.
g) średnice Fereta - wymiary obiektu
wyrażające jego rozpiętość w poziomie i w
pionie (współrzędne skrajnych punktów
cząstki)
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-36
Współczynniki kształtu
h) kierunek, jest to kierunek dłuższego z boków minimalnego prostokąta
granicznego. Jeżeli momenty bezwładności pierwszego i drugiego rzędu
są znane to kierunek można wyrazić wzorem: Wyliczanie kierunku ma
sens jedynie dla obiektów smukłych.
Smukłość i prostokątność są niezależne od transformacji liniowych:
przesunięcia, obrotu i skalowania. Kierunek zaś jest zależny jedynie
od obrotu.
i) inne współczynniki kształtu:
Współczynniki cyrkularności
gdzie: L - obwód obiektu, S - pole powierzchni obiektu
Współczynnik Malinowskiej
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-37
Współczynniki kształtu
Obliczenia powyższych współczynników trwają stosunkowo krótko, ale
odznaczają się niezbyt dokładną klasyfikacją. Gdy szybkość działania nie
jest najważniejsza, a istotna jest dokładność opisu obiektów za
pośrednictwem ich cech stosuje się następujące współczynniki:
współczynnik Blaira-Blissa
współczynnik Danielssona
współczynnik Haralick'a
współczynnik M 2
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-38
Współczynniki kształtu, a momentowe
Dla każdej klasy obiektów oczekiwanych w obrazie należy drogą
doświadczalną sprawdzić czy przyjęte współczynniki kształtu w
wystarczający sposób różnicują analizowane obiekty. Problemy ze
współczynnikami kształtu:
- czułe na duże zmiany skali,
- czułe na dyskretyzację,
- bardzo czułe na zniekształcenia związane z konfiguracją układu detekcji
(perspektywa),
- zróżnicowana czułość na zmiany proporcji figur.
Własności figur mogą być także opisane zależnościami
momentowymi. Momenty obliczane według zależności:
gdzie: f(x,y) - intensywność w pikselu (x,y), A - analizowany obszar,
p,q = 0,...,n
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-39
Współczynniki momentowe
W procesie charakteryzowania figur przydatne są zwłaszcza momenty
pierwszego i drugiego rzędu. Momenty pierwszego rzędu określają
położenie środka ciężkości a momenty drugiego rzędu (p=0,q=2 lub
p=2,q=0) są miarą bezwładności danego obiektu.
W przypadku rozważań geometrycznych można jeszcze wprowadzić pojęcie
momentu konturowego wyznaczanego wzdłuż kontura L:
Momenty centralne: μpq, C pq tworzą cechy niezmiennicze względem
przesunięcia. Za pomocą: μ pq, C pq oraz μ 00, c 00 można
skonstruować cechy niezależne względem: przesunięcia, obrotu i
zmiany skali:
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-40
Współczynniki momentowe
Niezmienniki momentowe są cechami o fundamentalnym znaczeniu przy
rozpoznawaniu obiektów płaskich, bo umożliwiają rozpoznanie obiektów
przy ich różnej lokalizacji w polu widzenia (w tym ruchome obiekty) oraz
przy różnych powiększeniach układu (także ruchy kamer w górę i w dół).
Istnieją także wyrażenia momentowe używające momentów obszarowych,
które są niezmiennicze względem dowolnego nieosobliwego
przekształcenia liniowego, dzięki czemu kamera może być dowolnie
umieszczona względem obserwowanych obiektów płaskich.
Metody momentowe (momenty konturowe) mogą też znaleźć zastosowanie
do identyfikacji obiektów nie w pełni widocznych. Istota takiej identyfikacji
polega na badaniu zmian, jakim ulegają momenty konturowe w miarę
stopniowego przesłaniania obiektu.
Przy wyborze cech uwzględnić należy zarówno rozdzielające własności
poszczególnych cech, jak też ich obliczeniową złożoność (ilość obliczeń
niezbędnych do wyznaczenia ich wartości) oraz inne praktyczne
uwarunkowania.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-41
System rozpoznawania obrazów
Opisane metody klasyfikacji obiektów znajdują praktyczne zastosowanie w
systemach widzenia maszynowego. Systemy te są obecne w wielu
gałęziach szeroko pojętego przemysłu od branży spożywczej po
zbrojeniową oraz w różnorodnych zastosowaniach multimedialnych
(tworzenie filmów animowanych, śledzenie obiektów i ich zamiana na
inne.). Wykorzystanie urządzeń optycznych wraz z odpowiednim
oprogramowaniem rozpoznawania obrazu w znacznym stopniu usprawnia
proces kontroli końcowej czy pozwala na bieżąco kontrolować stan
zestawianych na taśmie produkcyjnej urządzeń.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-42
Operacje rozpoznania obrazu
System rozpoznawania obrazu można zaprojektować w formie ustalonego
szablonu decyzyjnego lub jako system uczący się na podstawie
uaktualnianych opisów cech. Faza uczenia polega na optymalizowaniu
zestawu sklasyfikowanych wektorów cech i na ich podstawie modyfikacji
postaci funkcji rozdzielającej. Poza etapem uczenia działanie algorytmów
identyfikacji obrazów przebiega analogicznie. Składają się na niego trzy
podstawowe operacje:
1. Przypisanie obiektom q wektorów cech w przestrzeni n-wymiarowej
2. Obliczenie wartości funkcji przynależności
. Jest ona miarą stopnia
dopasowania obiektu opisanego wektorem do klasy i. W przypadku
niejednoznacznej klasyfikacji obiektu, analizuje się prawdopodobieństwo
przynależności do danej klasy:
gdzie:
- rozkład gęstości prawdopodobieństwa dla wektora cech
w obrębie klasy K i
- prawdopodobieństwo pojawienia się obiektów z klasy K i
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-43
Operacje rozpoznania obrazu
3. Proces
podejmowania decyzji, czyli przyporządkowywanie
obiektu q opisanego wektorem cech do klasy i, dla której
wartość funkcji przynależności jest maksymalna. W
przypadku przestrzeni charakteryzowanej przez dwie klasy
obiektów, podjęcie decyzji o zakwalifikowaniu do jednej z
nich odbywa się na zasadzie określenia stopnia
przynależności,czyli prawdopodobieństwa, z jakim dany
obiekt należy do jednej z klas K 1 lub K 2.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-44
Przykład
Do zilustrowania powyższego schematu postępowania może posłużyć
problem rozpoznawania i kwalifikowania płytek okrągłych i eliptycznych. Po
etapie binaryzacji i segmentacji, w obrazie pozostały elementy, których
intensywność spełnia założone kryteria Następnie dla wszystkich obiektów
obrazu wyznaczana jest przestrzeń cech (tu: jednowymiarowa). W
odniesieniu do analizowanego problemu, sposób ten pozwoli odrzucić obiekty,
których kształt nie odpowiada założonych kryteriów (zostaną odrzucone wszystkie
obiekty "kanciaste"). Po wstępnym rozpoznaniu następuje etap klasyfikacji
właściwej. Pozostałe w obrazie elementy są analizowane pod kątem relacji dwóch
osi symetrii. W przypadku kół lub figur im bliskich, stosunek dwóch prostopadłych
średnic jest bliski jedności. Natomiast figury eliptyczne mają iloraz znacznie wyższy.
Na rysunku zaprezentowano (kolorem czerwonym - obiekty "okrągłe", czarnym
"eliptyczne") efekt rozpoznania na zasadzie rozkładu prawdopodobieństw z
środkowego.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-45
Analiza semantyczna (zrozumienie)
Analiza semantyczna może być wykonywana (na pewnym poziomie)
poprzez operacje realizowane z wykorzystaniem sieci neuronowych, logiki
rozmytej i algorytmów genetycznych.
Próby realizacji systemów, które dawałyby możliwość właściwej
interpretacji sceny i podejmowania na tej podstawie skomplikowanych
decyzji są równocześnie próbami zakodowania w algorytmy procesów
myślenia i kojarzenia, jakie zachodzą w naszym mózgu. Obecnie wiele
ośrodków naukowych pracuje nad tymi metodami, również pod kątem ich
aplikacji w systemach sztucznej inteligencji i wirtualnej rzeczywistości.
Cyfrowe przetwarzanie ..... – M.Kujawińska
1-46

Podobne dokumenty