POBR - Kolos 1 1. Wszystkie kroki rozpoznawania obrazów
Transkrypt
POBR - Kolos 1 1. Wszystkie kroki rozpoznawania obrazów
POBR - Kolos 1 1. Wszystkie kroki rozpoznawania obrazów (chyba od akwizycji do rozpoznania) a) Akwizycja (A/C) - uzyskanie cyfrowej postaci obrazu na podstawie rzeczywistej sceny. Artefakty powstałe na tym etapie mogą mieć decydujący wpływ na powodzenie dalszej analizy i rozpoznania obrazu, dlatego należy poświęcić znaczną uwagę doborowi sprzętu i jego parametrów. b) Poprawa jakości i kompensacja zakłóceń. (jeśli chcemy użyć w tej fazie metod częstotliwościowych, musimy obliczyć transformatę - najczęściej Fouriera - na obrazie przed przejściem do tej fazy, a po jej zakończeniu obliczyć transformatę odwrotną.) Na wyjściu tej fazy otrzymujemy obraz wysokiej jakości. c) Segmentacja i wydzielenie cech. • segmentacja - podział obrazu na obiekty i tło • określenie wartości interesujących nas cech poszczególnych obiektów Na wyjściu tej fazy otrzymujemy opis obiektów. d) Rozpoznanie. Na podstawie opisów cech obiektów podejmujemy decyzję. 2. Różnice i podobieństwa RGB i HSV a) Podobieństwa: złożone z 3 składowych b) Różnice: • RGB - sześcian; HSV - pojedynczy odwrócony stożek w układzie cylindrycznym • RGB - nieintuicyjny dla człowieka; HSV - intuicyjny • RGB - składowe: czerwony, zielony, niebieski; HSV - odcień, nasycenie, jasność (hue, saturation, value) • RGB - wartości składowych określane liczbowo (np. 8bitów na składową); HSV: • odcień określany w stopniach (0..360) odchylenia od R (najczęściej) • nasycenie określane w skali 0..1 (biel..barwa czysta) • jasność określana w skali 0..1 (czarny..biały) • RGB - ma odzwierciedlenie w realizacji technicznej sprzętu. HSV - nie ma. • RGB - luminancja zawarta we wszystkich składowych, HSV tylko w V 3. Różnice i podobieństwa sRGB i AdobeRGB a) podobieństwa: • są to standardy przestrzeni kolorów • składowe to 3 podstawowe kolory: czerwony, zielony, niebieski • RGB => nieintuicyjne dla człowieka • ustandaryzowane pod kątem urządzeń cyfrowych takich jak monitor b) różnice: • sRGB odwzorowuje 35% wszystkich znanych barw, AdobeRGB 50% - największa różnica w przypadku zieleni 4. Balans bieli - aspekty teoretyczne i praktyczne Zagadnienie balansu bieli opiera się na wyznaczeniu bieli odniesienia - punktu w przestrzeni barw uznanego za kolor biały. Właściwe wyznaczenie bieli odniesienia jest istotne z punktu widzenia urządzeń służących do akwizycji, przetwarzania lub wyświetlania obrazu - w zależności od tego jaką biel wybierzemy jako biel odniesienia, zmienią się odcienie barw (np. podczas przekształcania zawartości matrycy aparatu cyfrowego w wartości poszczególnych pikseli dla zadanej przestrzeni barw). Wartość bieli odniesienia możemy określić liczbowo - jako temperaturę przy której ciało doskonale czarne miałoby zadaną barwę (typowe wartości: 6500K, 4800K). W praktyce (w aparatach cyfrowych) możemy określać balans bieli: a) automatycznie - aparat wybiera najjaśniejszy punkt obrazu i uznaje go za biel b) podając wartość w kelwinach c) przy pomocy ikonek na aparacie (oświetlenie sztuczne, dzienne itp) d) ręcznie - fotografujemy kartę z obszarami: białym, czarnym i pośrednim (szarym). 5. Różnice i podobieństwa matryc z filtrem Bayera i Foveon a) Foveon: • jedna matryca z 3 warstwami • działa na zasadzie różnicy w penetracji elementów krzemowych na rożna głębokość przez rożne barwy światła • gorsze działanie przy słabym świetle • wysoki koszt • na każdy punkt matrycy przypadają receptory wszystkich trzech barw b) Bayer: • matryca podzielona na czwórki receptorów - 2G, 1R, 1B. Wartości brakujących pikseli są interpolowane. • źle odwzorowuje krawędzie • propagacja szumów • niski koszt - obecnie 95% aparatów na rynku 6. Wymień prawa Grassmanna i krótko opisz ich konsekwencje dla przetwarzania obrazów cyfrowych. a) dowolne światło może być opisane za pomocą trzech zmiennych niezależnych, np. udziału barw podstawowych b) ciągła zmiana barwy jednego ze składników mieszaniny złożonej z dwóch świateł, powoduje ciągłą zmianę barwy mieszaniny c) barwa mieszaniny świateł ( przy określonych wartościach strumieni składników ) zależy tylko od barw jej składników, a nie zależy od ich składu widmowego Konsekwencje: d) metameryzm: tę samą barwę można opisywać za pomocą różnych mieszanin kolorów e) barwa przedmiotu może się zmieniać w zależności od oświetlenia (problem podczas akwizycji oraz druku) 7. Wymień i opisz podstawowe rozwiązania stosowane do akwizycji barwnych obrazów cyfrowych. a) kamera CCD: możliwość uzyskiwania dynamicznego obrazu, duża prędkość przetwarzania, tania, niewielkie wymiary i masa, ale niska rozdzielczość b) cyfrowy aparat fotograficzny: wysoka rozdzielczość c) skaner: bardzo wysoka rozdzielczość, możliwość wprowadzania przygotowanych wcześniej obrazów, długi czas przetwarzania d) ręczne tworzenie obrazu przy pomocy programu graficznego: wysoka pracochłonność, uproszczenie modelowanego świata 8. Wyjaśnij co to jest wybieranie międzyliniowe (interlace), jakie są jego konsekwencje przy akwizycji obrazów cyfrowych oraz podstawowe sposoby korekcji. Przeplot: zjawisko polegające na wyświetleniu/przesyłaniu do odbiornika tv naprzemiennie parzystych i nieparzystych linii obrazu. Konsekwencją zastosowania przeplotu w obrazie pochodzącym z transmisji TV / kamery są problemy z użyciem algorytmów rozpoznawania obrazu. Zdarza się też, że kamera oznaczona jako pracująca w trybie interlace oraz progressive wytwarza sztucznie obraz progressive poprzez interpolacje co również ma negatywny wpływ na wyniki zastosowania algorytmów rozpoznawania. Korekcja: a) algorytmy wykonujące deinterlace - do wyświetlania obrazów z przeplotem na urządzeniach nie obsługujących przeplotu - taki obraz nie nadaje się do analizy b) obiekty przesuwające się idealnie w poziomie - wyznaczenie brakujących klatek (metoda czysto teoretyczna) c) wyrzucenie co drugiego wiersza i kolumny - zmniejszenie rozdzielczości obrazu 9. Opisz i wyjaśnij związek, jaki zachodzi pomiędzy algorytmami redukcji szumów i wyostrzania obrazów cyfrowych. Krawędzie i szum to wysokoczęstotliwościowe składowe widma częstotliwościowego obrazu. Aby zredukować szum stosujemy filtr dolnoprzepustowy co psuje nam krawędzie i odwrotnie filtr górnoprzepustowy wyostrza krawędzie ale również zwiększa szum => zależność antagonistyczna. 10. Opisz na czym polega i do czego stosowana jest operacja wyrównywania histogramu. W jakich sytuacjach wyrównywanie histogramu może spowodować pogorszenie jakości obrazu? Wyrównywanie histogramu polega na takiej zmianie wartości punktów obrazu aby w równych przedziałach histogramu ilość punktów obrazu była w przybliżeniu taka sama. Operacja ta pozwala na uwypuklenie mało kontrastowych szczegółów w obrazie. i nj Wzór: g i =∑ gdzie gi to nowa wartość jasności i, nj to liczba pikseli o takiej jasności, j=0 N a N to liczba wszystkich pikseli w obrazie. Pogorszenie jakości obrazu może wystąpić, kiedy zastosujemy tę metodę do obrazu, w którym dominuje jeden kolor, względem prawie całkowitego braku innego ( np cały zielony las ) (??) 11.Opisz na czym polega i do czego stosowana jest operacja rozciągania histogramu. W jakich sytuacjach wyrównywanie histogramu może spowodować pogorszenie jakości obrazu? Rozciąganie histogramu wykonywane jest wtedy, gdy wartości jasności obrazu nie obejmują pełnego zakresu możliwych wartości. W przypadku reprezentacji ośmiobitowej, rozciąganie obrazu ma zastosowanie w sytuacji, gdy wszystkie wartości na obrazie mieszczą się w przedziale mniejszym niż 0 ÷255. Aby dokonać operacji rozciągania histogramu wyznacza się minimalną oraz maksymalną wartość jaką przyjmuje obraz. Kolejną czynnością jest wyznaczenie nowych wartości obrazu zgodnie z zależnością: 12. Na czym polega efekt mory przy akwizycji obrazów? Podaj kroki algorytmu do jego usuwania. Niepożądany efekt, pojawiający się w postaci regularnych punktów lub wzorów, będący skutkiem interferencji z rastrem drukarski przy skanowaniu dokumentów drukowanych Redukcja mory: a) filtr dolnoprzepustowy - rozmycie mory, jednak rozmyje to też krawędzie, więc wymagane jest zastosowane potem filtru górnoprzepustowego w celu wyostrzenia krawędzi b) raster ma orientację ukośną, więc przy akwizycji morę można zredukować „domowym” sposobem poprzez obrót skanowanego dokumentu 13. 14. Elementy w systemie rozpoznawania obrazów. - wypisać i opisać. a) segmentacja - podział pikseli na należące i nie należące do obiektu (obiektów). Na tym etapie wykonywana jest indeksacja, czyli określanie do którego obiektu należy każdy piksel. b) identyfikacja i analiza cech - określenie wartości pewnych określonych cech dla każdego obiektu (np. wydłużenie obiektu, ilość wierzchołków, powierzchnia) c) identyfikacja - na podstawie uzyskanego w poprzednim kroku opisu obiektów przyrównanie ich do poszukiwanych wzorców i decyzja Podobieństwa i różnice CIE RGB i CIE XYZ CIE RGB jest przestrzenią wszystkich barw postrzeganych przez człowieka, uzyskaną na drodze eksperymentu przez CIE. Jej wadą są ujemne wartości współrzędnych. CIE XYZ uzyskano, opisując trójkąt na obwiedni przestrzeni barw CIE RGB a następnie wykonując na nim przekształcenie do pierwszej ćwiartki układu współrzędnych. CIE RGB: • opisuje barwy jako mieszaniny trzech barw istniejących w rzeczywistości (postrzeganych przez człowieka) • występują ujemne wartości współrzędnych CIE XYZ: • opisuje barwy jako mieszaniny trzech nieistniejących barw (niepostrzeganych przez człowieka) • wartości współrzędnych są wyłącznie dodatnie Zarówno CIE RGB jak i CIE XYZ opisują wszystkie barwy postrzegane przez człowieka.