POBR - Kolos 1 1. Wszystkie kroki rozpoznawania obrazów

Transkrypt

POBR - Kolos 1 1. Wszystkie kroki rozpoznawania obrazów
POBR - Kolos 1
1. Wszystkie kroki rozpoznawania obrazów (chyba od akwizycji do rozpoznania)
a) Akwizycja (A/C) - uzyskanie cyfrowej postaci obrazu na podstawie rzeczywistej sceny.
Artefakty powstałe na tym etapie mogą mieć decydujący wpływ na powodzenie dalszej
analizy i rozpoznania obrazu, dlatego należy poświęcić znaczną uwagę doborowi sprzętu
i jego parametrów.
b) Poprawa jakości i kompensacja zakłóceń. (jeśli chcemy użyć w tej fazie metod
częstotliwościowych, musimy obliczyć transformatę - najczęściej Fouriera - na obrazie
przed przejściem do tej fazy, a po jej zakończeniu obliczyć transformatę odwrotną.) Na
wyjściu tej fazy otrzymujemy obraz wysokiej jakości.
c) Segmentacja i wydzielenie cech.
• segmentacja - podział obrazu na obiekty i tło
• określenie wartości interesujących nas cech poszczególnych obiektów
Na wyjściu tej fazy otrzymujemy opis obiektów.
d) Rozpoznanie. Na podstawie opisów cech obiektów podejmujemy decyzję.
2. Różnice i podobieństwa RGB i HSV
a) Podobieństwa: złożone z 3 składowych
b) Różnice:
• RGB - sześcian; HSV - pojedynczy odwrócony stożek w układzie cylindrycznym
• RGB - nieintuicyjny dla człowieka; HSV - intuicyjny
• RGB - składowe: czerwony, zielony, niebieski; HSV - odcień, nasycenie, jasność
(hue, saturation, value)
• RGB - wartości składowych określane liczbowo (np. 8bitów na składową);
HSV:
• odcień określany w stopniach (0..360) odchylenia od R (najczęściej)
• nasycenie określane w skali 0..1 (biel..barwa czysta)
• jasność określana w skali 0..1 (czarny..biały)
• RGB - ma odzwierciedlenie w realizacji technicznej sprzętu. HSV - nie ma.
• RGB - luminancja zawarta we wszystkich składowych, HSV tylko w V
3. Różnice i podobieństwa sRGB i AdobeRGB
a) podobieństwa:
• są to standardy przestrzeni kolorów
• składowe to 3 podstawowe kolory: czerwony, zielony, niebieski
• RGB => nieintuicyjne dla człowieka
• ustandaryzowane pod kątem urządzeń cyfrowych takich jak monitor
b) różnice:
• sRGB odwzorowuje 35% wszystkich znanych barw, AdobeRGB 50% - największa
różnica w przypadku zieleni
4. Balans bieli - aspekty teoretyczne i praktyczne
Zagadnienie balansu bieli opiera się na wyznaczeniu bieli odniesienia - punktu w przestrzeni
barw uznanego za kolor biały. Właściwe wyznaczenie bieli odniesienia jest istotne z punktu
widzenia urządzeń służących do akwizycji, przetwarzania lub wyświetlania obrazu - w
zależności od tego jaką biel wybierzemy jako biel odniesienia, zmienią się odcienie barw
(np. podczas przekształcania zawartości matrycy aparatu cyfrowego w wartości
poszczególnych pikseli dla zadanej przestrzeni barw). Wartość bieli odniesienia możemy
określić liczbowo - jako temperaturę przy której ciało doskonale czarne miałoby zadaną
barwę (typowe wartości: 6500K, 4800K).
W praktyce (w aparatach cyfrowych) możemy określać balans bieli:
a) automatycznie - aparat wybiera najjaśniejszy punkt obrazu i uznaje go za biel
b) podając wartość w kelwinach
c) przy pomocy ikonek na aparacie (oświetlenie sztuczne, dzienne itp)
d) ręcznie - fotografujemy kartę z obszarami: białym, czarnym i pośrednim (szarym).
5. Różnice i podobieństwa matryc z filtrem Bayera i Foveon
a) Foveon:
• jedna matryca z 3 warstwami
• działa na zasadzie różnicy w penetracji elementów krzemowych na rożna głębokość
przez rożne barwy światła
• gorsze działanie przy słabym świetle
• wysoki koszt
• na każdy punkt matrycy przypadają receptory wszystkich trzech barw
b) Bayer:
• matryca podzielona na czwórki receptorów - 2G, 1R, 1B. Wartości brakujących
pikseli są interpolowane.
• źle odwzorowuje krawędzie
• propagacja szumów
• niski koszt - obecnie 95% aparatów na rynku
6. Wymień prawa Grassmanna i krótko opisz ich konsekwencje dla przetwarzania
obrazów cyfrowych.
a) dowolne światło może być opisane za pomocą trzech zmiennych niezależnych, np.
udziału barw podstawowych
b) ciągła zmiana barwy jednego ze składników mieszaniny złożonej z dwóch świateł,
powoduje ciągłą zmianę barwy mieszaniny
c) barwa mieszaniny świateł ( przy określonych wartościach strumieni składników ) zależy
tylko od barw jej składników, a nie zależy od ich składu widmowego
Konsekwencje:
d) metameryzm: tę samą barwę można opisywać za pomocą różnych mieszanin kolorów
e) barwa przedmiotu może się zmieniać w zależności od oświetlenia (problem podczas
akwizycji oraz druku)
7. Wymień i opisz podstawowe rozwiązania stosowane do akwizycji barwnych obrazów
cyfrowych.
a) kamera CCD: możliwość uzyskiwania dynamicznego obrazu, duża prędkość
przetwarzania, tania, niewielkie wymiary i masa, ale niska rozdzielczość
b) cyfrowy aparat fotograficzny: wysoka rozdzielczość
c) skaner: bardzo wysoka rozdzielczość, możliwość wprowadzania przygotowanych
wcześniej obrazów, długi czas przetwarzania
d) ręczne tworzenie obrazu przy pomocy programu graficznego: wysoka pracochłonność,
uproszczenie modelowanego świata
8. Wyjaśnij co to jest wybieranie międzyliniowe (interlace), jakie są jego konsekwencje
przy akwizycji obrazów cyfrowych oraz podstawowe sposoby korekcji.
Przeplot: zjawisko polegające na wyświetleniu/przesyłaniu do odbiornika tv naprzemiennie
parzystych i nieparzystych linii obrazu. Konsekwencją zastosowania przeplotu w obrazie
pochodzącym z transmisji TV / kamery są problemy z użyciem algorytmów rozpoznawania
obrazu. Zdarza się też, że kamera oznaczona jako pracująca w trybie interlace oraz
progressive wytwarza sztucznie obraz progressive poprzez interpolacje co również ma
negatywny wpływ na wyniki zastosowania algorytmów rozpoznawania.
Korekcja:
a) algorytmy wykonujące deinterlace - do wyświetlania obrazów z przeplotem na
urządzeniach nie obsługujących przeplotu - taki obraz nie nadaje się do analizy
b) obiekty przesuwające się idealnie w poziomie - wyznaczenie brakujących klatek
(metoda czysto teoretyczna)
c) wyrzucenie co drugiego wiersza i kolumny - zmniejszenie rozdzielczości obrazu
9. Opisz i wyjaśnij związek, jaki zachodzi pomiędzy algorytmami redukcji szumów i
wyostrzania obrazów cyfrowych.
Krawędzie i szum to wysokoczęstotliwościowe składowe widma częstotliwościowego
obrazu. Aby zredukować szum stosujemy filtr dolnoprzepustowy co psuje nam krawędzie i
odwrotnie filtr górnoprzepustowy wyostrza krawędzie ale również zwiększa szum =>
zależność antagonistyczna.
10.
Opisz na czym polega i do czego stosowana jest operacja wyrównywania
histogramu. W jakich sytuacjach wyrównywanie histogramu może spowodować
pogorszenie jakości obrazu?
Wyrównywanie histogramu polega na takiej zmianie wartości punktów obrazu aby w
równych przedziałach histogramu ilość punktów obrazu była w przybliżeniu taka sama.
Operacja ta pozwala na uwypuklenie mało kontrastowych szczegółów w obrazie.
i
nj
Wzór: g i =∑
gdzie gi to nowa wartość jasności i, nj to liczba pikseli o takiej jasności,
j=0 N
a N to liczba wszystkich pikseli w obrazie.
Pogorszenie jakości obrazu może wystąpić, kiedy zastosujemy tę metodę do obrazu, w
którym dominuje jeden kolor, względem prawie całkowitego braku innego ( np cały zielony
las ) (??)
11.Opisz na czym polega i do czego stosowana jest operacja rozciągania histogramu. W
jakich sytuacjach wyrównywanie histogramu może spowodować pogorszenie jakości
obrazu?
Rozciąganie histogramu wykonywane jest wtedy, gdy wartości jasności obrazu nie obejmują
pełnego zakresu możliwych wartości. W przypadku reprezentacji ośmiobitowej, rozciąganie
obrazu ma zastosowanie w sytuacji, gdy wszystkie wartości na obrazie mieszczą się w
przedziale mniejszym niż 0 ÷255.
Aby dokonać operacji rozciągania histogramu wyznacza się minimalną oraz maksymalną
wartość jaką przyjmuje obraz. Kolejną czynnością jest wyznaczenie nowych wartości
obrazu zgodnie z zależnością:
12.
Na czym polega efekt mory przy akwizycji obrazów? Podaj kroki algorytmu do
jego usuwania.
Niepożądany efekt, pojawiający się w postaci regularnych punktów lub wzorów, będący
skutkiem interferencji z rastrem drukarski przy skanowaniu dokumentów drukowanych
Redukcja mory:
a) filtr dolnoprzepustowy - rozmycie mory, jednak rozmyje to też krawędzie, więc
wymagane jest zastosowane potem filtru górnoprzepustowego w celu wyostrzenia
krawędzi
b) raster ma orientację ukośną, więc przy akwizycji morę można zredukować „domowym”
sposobem poprzez obrót skanowanego dokumentu
13.
14.
Elementy w systemie rozpoznawania obrazów. - wypisać i opisać.
a) segmentacja - podział pikseli na należące i nie należące do obiektu (obiektów). Na tym
etapie wykonywana jest indeksacja, czyli określanie do którego obiektu należy każdy
piksel.
b) identyfikacja i analiza cech - określenie wartości pewnych określonych cech dla każdego
obiektu (np. wydłużenie obiektu, ilość wierzchołków, powierzchnia)
c) identyfikacja - na podstawie uzyskanego w poprzednim kroku opisu obiektów
przyrównanie ich do poszukiwanych wzorców i decyzja
Podobieństwa i różnice CIE RGB i CIE XYZ
CIE RGB jest przestrzenią wszystkich barw postrzeganych przez człowieka, uzyskaną na
drodze eksperymentu przez CIE. Jej wadą są ujemne wartości współrzędnych. CIE XYZ
uzyskano, opisując trójkąt na obwiedni przestrzeni barw CIE RGB a następnie wykonując
na nim przekształcenie do pierwszej ćwiartki układu współrzędnych.
CIE RGB:
• opisuje barwy jako mieszaniny trzech barw istniejących w rzeczywistości
(postrzeganych przez człowieka)
• występują ujemne wartości współrzędnych
CIE XYZ:
• opisuje barwy jako mieszaniny trzech nieistniejących barw (niepostrzeganych przez
człowieka)
• wartości współrzędnych są wyłącznie dodatnie
Zarówno CIE RGB jak i CIE XYZ opisują wszystkie barwy postrzegane przez człowieka.