Obraz przestrzenny - Aktualności KEiT PAN
Transkrypt
Obraz przestrzenny - Aktualności KEiT PAN
Komitet Elektroniki i Telekomunikacji PAN Osiągnięcie naukowe o duŜym znaczeniu praktycznym: Technologia kompresji obrazu ruchomego trójwymiarowego W roku 2011 grupa MPEG (oficjalnie ISO/IEC SC29/WG11) działająca w ramach Międzynarodowej Organizacji Normalizacyjnej ISO ogłosiła zaproszenie do składania propozycji nowej technologii kompresji ruchomych obrazów trójwymiarowych. Celem konkursu było wyłonienie technologii, która byłaby podstawą opracowania nowej międzynarodowej normy efektywnej kompresji sekwencji wizyjnych trójwymiarowych. NaleŜy podkreślić, Ŝe przez obraz trójwymiarowy rozumie się tutaj nie popularne obrazy stereoskopowe, ale bogatszą informację wizyjną, z której otrzymuje się wiele obrazów pozwalających na przykład na wytwarzanie wraŜenia przesuwania się wzajemnego planów obrazu przestrzennego podczas przemieszczania się widza przed ekranem. Jednym z potencjalnych obszarów zastosowań nowej technologii będzie kompresja obrazów dostarczanych do monitorów autostereoskopowych, które wyświetlają równocześnie kilkadziesiąt widoków sceny. UmoŜliwia to jednoczesne oglądanie obrazów stereoskopowych przez wielu widzów, którzy w tym celu nie muszą uŜywać Ŝadnych specjalnych okularów. Testy technologii kompresji musiały być poprzedzone przygotowaniem specjalnych obrazów ruchomych uzyskanych przez wiele zsynchronizowanych kamer. Wykorzystuje się obrazy dostarczone przez kilka ośrodków, jednak 25% oficjalnego zbioru testowego pochodzi z Politechniki Poznańskiej. Takie testowe obrazy ruchome jak Poznan_Hall (wnętrze budynku Wydziału Elektroniki i Telekomunikacji) lub Poznan_Street (widok z tego budynku na ulicę) są juŜ znane na całym świecie. Te i inne obrazy testowe uzyskano za pomocą specjalnego systemu wielokamerowego skonstruowanego w Katedrze Telekomunikacji Multimedialnej i Mikroelektroniki Politechniki Poznańskiej. Testy dotyczyły kompresji wspomnianych obrazów wraz z towarzyszącymi im mapami głębi. Dlatego wcześniej badano róŜne techniki generacji map głębi. Ostatecznie dla potrzeb grupy MPEG opracowano technikę wyznaczania map głębi, w której wykorzystuje się między innymi oryginalne narzędzia opracowane na Politechnice Poznańskiej. Wspólne modelowe oprogramowanie DERS (Depth Estimation Reference Software) wraz modułami przygotowanymi na Politechnice Poznańskiej jest utrzymywane przez Uniwersytet w Nagoji w Japonii. W odpowiedzi na zaproszenie grupy MPEG wpłynęły 23 propozycje w dwóch kategoriach. W pierwszej kategorii kaŜda technologia musiała gwarantować moŜliwość zdekodowania pary stereoskopowej widoków przez klasyczny dekoder stereoskopowy MPEG-4 AVC, jakiego uŜywa się między innymi w najnowszych odtwarzaczach BluRay. PoniewaŜ w wyniku postępu naukowego technologia MPEG-4 nie jest juŜ najbardziej efektywną, takie załoŜenie stanowiło istotne ograniczenie. Dlatego część ośrodków przygotowała propozycje bardziej rozwojowych technologii, które dla kompresji pojedynczego widoku wykorzystują znajdującą się w końcowej fazie optymalizacji technologię HEVC (High Efficiency Video Coding). W tej kategorii oprócz Politechniki Poznańskiej wystartowały centra badawcze firm Samsung, Sony, LG i Ericsson, a takŜe Politechnika (RWTH) w Akwizgranie, instytut badawczy ETRI z Korei współpracujący z Uniwersytetem Kwangwoon oraz Instytut Fraunhofera - Instytut Telekomunikacji H. Hertza z Berlina, który swoje propozycje przygotował częściowo w kooperacji z firmą Disney Research. Przygotowanie propozycji wymagało wykonania wielkiej pracy (opracowanie technologii wykorzystującej wyniki dotychczasowych naszych badań, przygotowanie oprogramowania liczącego wiele dziesiątków tysięcy linii kodu, opracowanie materiału testowego liczącego wiele gigabajtów danych i przesłanie całego materiału do koordynatora testów). KaŜdy opracowany kodek był badany przez 2 wylosowane laboratoria. Przypisanie propozycji do laboratoriów testujących było całkowicie utajnione. Łącznie w testowaniu wszystkich propozycji w róŜnych miejscach świata brało udział ponad 600 osób. Podczas spotkania grupy MPEG w Genewie w końcu listopada 2011r. ujawniono wyniki testów i uznano, Ŝe najlepszymi propozycjami w drugiej kategorii były propozycje opracowane przez Instytut Fraunhofera - Instytut Telekomunikacji H. Hertza z Berlina (3 warianty) oraz przez Politechnikę Poznańską. Wyniki wszystkich pomiarów wskazywały, Ŝe pozostałe zaproponowane technologie są wyraźnie mniej efektywne. Osiągnięcie zespołu z Politechniki Poznańskiej kierowanego przez prof. Marka Domańskiego zostało uzyskane w ramach trwających juŜ 6 lat badań dotyczących techniki obrazu przestrzennego. Dzięki technologii opracowanej w Katedrze Telekomunikacji Multimedialnej i Mikroelektroniki Politechniki Poznańskiej przesyłanie nawet 3 widoków będących obrazami ruchomymi wysokiej jakości (formatu HD) i skojarzonych z nimi 3 map głębi będzie moŜliwe z prędkością bitową zaledwie około 6 Mb/s. Dla porównania, obecnie przesyłanie jednego tylko obrazu ruchomego HDTV w standardzie MPEG-4 AVC wymaga prędkości bitowej rzędu 8 Mb/s. Takie rozwiązanie jest bardzo cenne dla dalszego rozwoju telewizji trójwymiarowej wykorzystującej monitory autostereoskopowe oraz interaktywnej telewizji, w której widz będzie mógł samodzielnie wybierać punkt i kierunek widzenia. Podstawą dalszych prac dotyczących technologii kompresji obrazów trójwymiarowych ma być oprogramowanie Instytutu Fraunhofera z wbudowanymi narzędziami Politechniki Poznańskiej. Prace badawcze mają teraz być prowadzone we współpracy ośrodków badawczych i uniwersytetów z całego świata. W tej współpracy Politechnice Poznańskiej przypisano istotne role dotyczące na przykład koordynacji wspólnych eksperymentów. Celem badań jest opracowanie ostatecznej wersji technologii kompresji, która stanie się podstawą nowej międzynarodowej normy MPEG-H.