POBR Kolos 2 + kilka pyt. z egzaminu 1. Podstawowe
Transkrypt
POBR Kolos 2 + kilka pyt. z egzaminu 1. Podstawowe
POBR Kolos 2 + kilka pyt. z egzaminu 1. Podstawowe metody akwizycji obrazów. Akwizycja obrazów cyfrowych: ● kiedyś - lampa analizująca: przetwornik optoelektroniczny zapewniający dyskretyzację dziedziny w jednym wymiarze na linie obrazu TV, które muszą zostać dale spróbkowane, a próbki podane kwantyzacji za pomocą przetworników AC. ● układy CCD/CMOS, automatyczna dyskretyzacja dziedziny, kwantyzacja za pomocą przetworników AC; w praktyce problem może stanowić rzeczywista rozdzielczość przetwornika. ● skaner: bardzo wysoka rozdzielczość, możliwość wprowadzania przygotowanych wcześniej obrazów, długi czas przetwarzania (to w sumie też przetwornik CCD/CMOS!) ● manualne tworzenie obrazu przy pomocy programu graficznego: wysoka pracochłonność, uproszczenie modelowanego świata Problemy przy akwizycji obrazów cyfrowych: ● rzeczywista rozdzielczość przetwornika, ● specyficzna akwizycja obrazów barwnych, ● przeplot stosowany w wyświetlanym obrazie telewizyjnym (interlace), ● stosowanie filtrów Bayera. 2. Operatory używane do wyostrzania obrazów w cyfrowym przetwarzaniu obrazów. Do wyostrzania używa się operatora lokalnego gradientu (I pochodna), bądź laplasjanu (II pochodna). Częściej stosowany jest algorytm z laplasjanem. Do wyostrzania można również użyć operatora filtracji górnoprzepustowej, bądź algorytmu UnSharp Mask (USM) ( to obraz oryginalny, a , gdzie to obraz rozmyty filtracją dolnoprzepustową). Tu można dodać obrazek jak to ujemny laplasjan na krawędzi ją wzmacnia ;-) 3. Wyjaśnij podobieństwa i różnice pomiędzy transformatą Fouriera, dyskretną transformatą Fouriera, szybką transformatą Fouriera. ● DFT i FFT są dyskretną wersją ciągłej transformaty Fouriera ● FFT działa w czasie n log n , DFT działa w czasie n^2 ● ● ● DFT i FFT mają własność rozdzielności - dwuwymiarową transformatę można policzyć za pomocą dwóch jednowymiarowych. FFT działa na obrazie, którego rozmiary są potęgą 2 - DFT działa na każdym obrazie FFT jest zoptymalizowaną wersją DFT (z ograniczeniem dot. wielkości obrazka). 4. Opisz i wyjaśnij sposób obliczenia transformaty falkowej dla obrazów cyfrowych. Notatki z wykładu: ● (Wavelet transform) Stosowana np. w formacie JPG2000 (.jp2). ● Kodowanie subpasmowe z hierarchicznym podziałem widma. ● Nie ma wzoru dającego dyskretną transformatę falkową. Przybliża się trasformaty falkowe do funkcji dyskretnych. Kodowanie subpasmowe: Stosuje się 1-wymiarowe filtry konwolucyjne oraz decymatory: ● H0 - Filtr dolnoprzepustowy na wyjściu otrzymujemy uśrednionąwygładzoną informację o sygnale wejściowym, ● H1 - Filtr górno przepustowy na wyjściu otrzymujemy szczegóły sygnału wejściowego. ● decymator wyrzuca co drugi element w kolumnie, bądź wierszu (w zależności od etapu). Mamy obraz NxN. Poddajemy go ww filtrom oraz operacjom decymacji w ten sposób otrzymujemy odpowiednio blok: a) Gałąź H0 + decymator = uśredniony/wygładzony obraz N/2 x N b) Gałąź H1 + decymator = krawędzie pionowe z obrazu o rozmiarze N/2 x N Hierarchiczny podział widma: Każdą gałąź poddajemy znów w ten sam sposób rozbijając na coraz mniejsze obrazy. Przykładowo obrazy otrzymane na wyjściu filtracji dwóch bloków, będą wyglądały następująco: ● 2x H0 da nam ten sam obraz wejściowy, ale o rozmiarze N/2 x N/2 ● H0H1 da nam poziome krawędzie obrazu N/2 x N/2 ● H1H0 da nam pionowe krawedzie obrazu N/2 x N/2 ● 2x H1 da nam szczegóły na przecięciu krawędzi pionowych i poziomych obrazu N/2 x N/2 Obrazy zapisuje się w postaci obrazka N X N mającego wydzielone części wg stopinia podziału widma. Dla przykładowych 2 bloków otrzymamy 4 ćwiartki: H0H0 H1H0 H0H1 H1H1 Jeśli damy 4 bloki, to proszę sobie wyobrazić, że H0H0 traktujemy jako obraz wejściowy i tam znów będą 4 ćwiartki. Z tych informacji jesteśmy w stanie odtworzyć (skomponować obraz pierwotny). 5. Kodowanie entropijne i jego zastosowanie w cyfrowym przetwarzaniu obrazów. Rodzaje: A. optymalne kodowanie binarne - algorytm Huffmana B. kodowanie arytmetyczne: model abstrakcyjny i całkowitoliczbowy C. kodowanie słownikowe LZ77, LZ78, LZW Entropia jest to ilość informacji zawarta w źródle danych. Entropia jest podstawą niektórych algorytmów kompresji. Algorytmy entropijne są to algorytmy bazujące na entropi np. algorytm Huffmana bazuje na entropi w celu wyznaczenia słownika. Efektywność kodu określa przeciętną ilość bitów na kodowane słowo lub piksel. Efektywność kodu przydaje się do weryfikacji algorytmów, z jej pomocą można zweryfikować czy dane kodowanie jest optymalne. Entropia określa wartość średnią ilości informacji niezbędnej do zakodowania(zapoamiętania). Entropia stanowi dolne ograniczenie efektywniści kodu możliwej dla danego kodowania zbioru wartości 6. Co ma wspólnego splot funkcji z transformatą Fourier'a, i co w praktyce z tego wynika. Mając transformatę funkcji splotu można wykonać splot w zamiast operacji: 1. 2. Gdzie F jest widmem filtra. 3. Przydatne przy filtrowaniu w przypadku dużych operatorów lokalnych, gdy bardziej opłaca się policzyć transformatę, wymnożyć i wykonać transformatę odwrotną niż robić splot z operatorem lokalnym. 7. Znieksztalcenia radiometryczne i jak je naprawiać. Zniekształcenia radiometryczne mogą być spowodowane nierównomiernością oświetlenia i błędami konwersji oświetlenia. Zniekształcenia radiometryczne można podzielić na sumacyjne oraz iloczynowe i są one związane ze sposobem oddziaływania czynnika wywołującego zakłócenie na obraz. Przy zniekształceniach sumacyjnych wartości jasności pikseli macierzy obrazu zostają zwiększone o wartość czynnika fałszującego. Przyczyną zniekształceń sumacyjnych jest prąd ciemny. Przy zniekształceniach iloczynowych wartość jasności pikseli macierzy obrazu zależy od iloczynu wartości jasności obrazu i lokalnej wartości parametru fałszującego, którego nierównomierna wartość na całej powierzchni obrazu jest przyczyną zniekształcenia, np. nierównomierna czułość przetwornika optoelektrycznego. Do korekcji takich zniekształceń wyznacza się macierz współczynników korekcyjnych, które w korekcji sumacyjnej odejmuje się od obrazu jasności, a przy korekcji iloczynowej otrzymany obraz jasności mnoży się przez macierz współczynników korekcyjnych, tak, aby wyrównać poziomy jasności w stosunku do całego obrazu. 8. Opisz metode kompresji JPEG. - Konwersja na YUV - Obliczenie DCT dla każdej barwy oddzielnie w kwadratowych blokach - Kwantyzacja współczynników DCT - Zakodowanie uzyskanych współczynników algorytmem RLE Tu było jeszcze takie śmieszne ułożenie współczynników DCT, żeby było łatwiej kompresować. DCT - Discrete Cosine Transform 9. Wymień i opisz podstawowe kroki typowo wykonywane w algorytmach rozpoznawania obrazu (przy założeniu, że na wejściu mamy obraz wysokiej jakości). 1. segmentacja: podział pikseli na piksele tła i należące do obiektu 2. analiza cech ( indeksacja obiektów ): przypisanie do wszystkich pikseli identyfikatorów, wskazujących do którego obiektu piksel należy. Dzięki indeksacji możliwe są wszystkie inne pomiary na indywidualnych obiektach 3. identyfikacja: rozpoznawanie obiektów porównując je do szukanego wzorca 10. Wyjaśnij od strony teoretycznej i praktycznej na czym polega operacja ustawiania balansu bieli oraz jakie są jej konsekwencje przy akwizycji obrazów. Proces kompensacji barw obrazu zarejestrowanego przez matrycę dla temperatury barwowej oświetlenia, jakie towarzyszyło wykonaniu fotografii. Automatyczny balans bieli oznacza, iż aparat sam ustawi barwy. Znajduje on najjaśniejszy punkt na zdjęciu, i zakłada, iż powinien mieć on kolor biały. Do niego porównuje wszystkie elementy kadru, ponieważ nie wie on jak wygląda kolor biały, ale wie jak wygląda kolor czerwony i niebieski, względem koloru białego. Gdy najjaśniejszy punkt zdjęcia nie jest biały, automatyka nie pomoże. W takim układzie musimy ręcznie pokazać jak wygląda kolor biały i aparat względem tego koloru będzie reprodukował resztę barw. Im lepszy biały kolor pokażemy, tym wierniejsze barwy na zdjęciu. W praktyce wykorzystuje się np. kartkę białego papieru jako wzorzec bieli, co daje pozytywny efekt bez względu na światło zastane. W efekcie urządzenie przyjmując za źródło biel kartki dostosuje pozostałą paletę barw do zastanego wzorca, korygując inne barwy. 11. Opisz i wyjaśnij działania podstawowych algorytmów redukcji szumu stosowanych w ramach cyfrowych metod poprawy jakości obrazów. Do wygładzania obrazów stosuje się filtry konwolucyjne, które dzielą się na filtry rankingowe i filtry arytmetyczne. Filtr rankingowy sortuje wszystkie piksele z danego otoczenia i wybiera, w zależności od metody, jeden piksel. Do wygładzania obrazów często stosuje się filtr medianowy, który z posortowanych pikseli danego otoczenia wybiera piksel środkowy. 12. Podaj i opisz metody segmentacji ● Segmentacja przez progowanie - Wybieranie tych pikseli których wartość jest większa niż wartość progowa. Stosuje się też progowanie na podstawie histogramu gdzie wartość progową ustala się w minimum histogramu. ● Segmentacja krawędziowa - Wyodrębnienie krawędzi z obrazu a następnie znalezienie obiektów ograniczanych przez te krawędzie. ● Segmentacja metodą rozrostu obszarów - Wybiera się piksel a następnie sprawdza się czy jego sąsiedztwo spełnia warunek jednorodności (kryterium rozrostu), jeśli tak to odpowiednie piksele dołącza się do obszaru. Potem iteracyjnie sprawdza się sąsiedztwo coraz większych obszarów. ● Segmentacja metodą “dziel i łącz” - “wpisanie” obrazka w drzewo, gdzie w każdym liściu jest jednorodny obszar. Najczęściej dzieli się obraz na ćwiartki i sprawdza ich jednorodność z pomocą wcześniej wybranego kryterium. Każdą niejednorodną ćwiartkę ponownie dzielimy na 4, tworząc kolejny poziom drzewa. Krok powtarzamy aż do uzyskania drzewa, gdzie wszystkie liście są jednorodne. Następnie korzystając z sąsiedztwa (na obrazku) liści łączymy je w większe, jednorodne obszary. ● Segmentacja metodą klasyfikacji punktów - uogólnienie metody progowania na większą liczbę parametrów. 13. Opisz na czym polega i do czego stosowana jest operacja wyrównywania histogramu. W jakich sytuacjach wyrównywanie histogramu może spowodować pogorszenie jakości obrazu? Wyrównywanie histogramu polega na takiej zmianie wartości punktów obrazu aby w równych przedziałach histogramu ilość punktów obrazu była w przybliżeniu taka sama. Operacja ta pozwala na uwypuklenie mało kontrastowych szczegółów w obrazie. Pogorszyć możemy obraz, w którym dominują jakieś składowe. Z własnego doświadczenia wiem, że często kiedy prześwietlam/niedoświetlam zdjęcia, taka operacja się przydaje. Prześwietlony obraz ma więcej jasnych wartości (więcej z prawej na histogramie), niedoświetlony obraz ma więcej ciemnych wartości ( więcej z prawej na histogramie). Wyrównanie histogramu balansuje nam jasność obrazka/zdjęcia tak, że wygląda to lepiej. Jednak jest jeden warunek: Gdy na zdjęciu dominują nam jakieś kolory np. mając takie zdjęcie błękitnego nieba, po wyrównaniu histogramu, nasz błękit staje się nieco podkolorowany i przez to jest nienaturalny. Zapytałem o to prof. Rokitę na wykładzie. Podpowiedział, że przed wyrównaniem takiego histogramu, należy wykonać przejście z RGB na HSV, dzięki czemu otrzymamy możliwość wyrównania po jasności. 14. Wymień i opisz podstawowe zastosowania transformat. Transformatę Fouriera stosujemy do filtracji (dolno-, górnoprzepustowej, Laplace’a itd.), do przyśpieszenia operacji splotu. Transformata falkowa umożliwia progresywny zapis obrazu. Transformaty przydają się do kompresji danych. 15. (egzamin) Wyjaśnij na czym polega i jakie daje efekty zastosowanie wyrażeń różnicowych przy kompresji obrazu. Wyrażenie różnicowe polega na przedstawieniu obrazu za pomocą różnic pomiędzy pikselami. Powoduje znaczne zwiększenie skupienia wartości pojawiających się w obrazie a co za tym idzie lepszą skuteczność kompresji w algorytmach entropijnych. 16. Jak obliczyć dwuwymiarową FFT za pomocą algorytmu jednowymiarowej FFT FFT jest rozdzielna dzięki temu można policzyć jednowymiarową FFT z wierszy, a następnie z kolumn obrazka widm jednowymiarowych, który otrzymaliśmy. 17. Opisz na czym polega i do czego stosowana jest operacja rozciągania histogramu. W jakich sytuacjach rozciągnięcie histogramu może spowodować pogorszenie jakości obrazu? Rozciąganie histogramu wykonywane jest wtedy, gdy wartości jasności obrazu nie obejmują pełnego zakresu możliwych wartości. W przypadku reprezentacji ośmiobitowej, rozciąganie obrazu ma zastosowanie w sytuacji, gdy wszystkie wartości na obrazie mieszczą się w przedziale mniejszym niż 0 ÷255. Aby dokonać operacji rozciągania histogramu wyznacza się minimalną oraz maksymalną wartość jaką przyjmuje obraz. Kolejną czynnością jest wyznaczenie nowych wartości obrazu zgodnie z zależnością: 18. Transformata Walsha-Hadamarda (WHT) Działa na prostej zasadzie, czytaj najprostsza transformata. Najpierw wymyślił ją nie kto inny jak Pan Walsh. Potem Pan Hadamard uprościł ją, poprzez zmianę indeksu i tak powstała transformata tych dwóch Panów. Działanie opiera się na takim oto spostrzeżeniu: Żółtym kolorem oznaczono najniższą możliwą do uzyskania częstotliwość, czerwonym najwyższą (na 8miu bitach). Wartości funkcji-próbek zostają wymnożone wiersz, po wierszu przez wartości odpowiadających elementów tablicy wartości jądra transformaty, a następnie zsumowane. Tablica wartości jądra transformaty (Warunek dla N=2^n, gdzie n to liczba indeksów): N=8, n=3 0 1 2 3 4 5 6 7 0 + + + + + + + + 1 + + + + - - - - 2 + + - - + + - - 3 + + - - - - + + 4 + - + - + - + - 5 + - + - - + - + 6 + - - + + - - + 7 + - - + - + + - Spostrzezenie polega na tym ze taka tabela zawiera wszystkie mozliwe do uzyskania na 8miu bitach czestotliwosci sygnału impulsu Dirac’a.