full text - Instytut Radioelektroniki

Transkrypt

full text - Instytut Radioelektroniki
Metody kompresji obrazów: uwarunkowania dalszego rozwoju
Tomorrow’s image compression today
Artur Przelaskowski
Instytut Radioelektroniki, Politechnika Warszawska, Warszawa
Streszczenie: W pracy zwrócono uwag na kilka istotnych problemów zwi zanych z
doskonaleniem metod kompresji obrazów. Krótka charakterystyka współczesnych
uwarunkowa pozwala lepiej zrozumie ograniczenia i perspektyw rozwoju wobec
rosn cych oczekiwa
‘ery informacji’. Aby zobrazowa
niektóre z ogranicze
przeprowadzono testy wybranych koderów bezstratnych i stratnych. Zwrócono uwag na
konieczno praktycznego wykorzystania semantycznej teorii informacji, szczególnie w
kontek cie kompresji z selekcj informacji. Podkre lono znaczenie uniwersalnych,
bezstratnych koderów danych oraz hierarchicznego uporz dkowania informacji w
elastycznych koderach z progresj informacji. Prowadzi to do weryfikacji obowi zuj cych
paradygmatów kompresji, szczególnie w zakresie modelowania ródeł informacji.
Sugerowane kierunki działa wydaj si by u yteczne.
ę
ą
ę
ń
ć
ą
ń
ć
ń
ę
ś
ć
ś
ą
ś
ą
ą
ą
ą
ź
ę
ń
ą
ć
Ŝ
Summary: Analysis and suggestions of image compression improvements were presented.
Characteristics of modern conditions of development showed limitations and perspective of
development in the following areas: utilization of semantic information theory, selection of
useful information by interactive user oriented algorithms, application of universal lossless
archivers for image compression, flexibility of ordered hierarchical representation of
information in multiscale image coders. Selected lossless and lossy coders were verified
experimentally and new compression paradigms were concluded.
Słowa kluczowe: kompresja obrazów, kompresja stratna i bezstratna, teoria informacji, JPEG
Keywords: image compression, lossy and lossless compression, information theory, JPEG
1. Wprowadzenie
Kompresj mo na sprowadzi do odwracalnego lub nieodwracalnego procesu redukcji
długo ci reprezentacji danych. W opracowaniu nowoczesnych narz dzi kompresji danych,
szczególnie obrazów, du ego znaczenia nabiera szersze rozumienie poj cia kompresji jako
wyznaczania efektywnej reprezentacji przesyłanej lub gromadzonej informacji. Wiarygodne
definicje informacji, modele ródeł informacji oraz sposoby obliczania ilo ci informacji i
optymalizacji kodów staj si tutaj zagadnieniem kluczowym. Celem pracy było szersze
spojrzenie na zagadnienie kompresji obrazów, które pozwoli lepiej zrozumie istniej ce
ograniczenia, a tak e oceni realne szanse doskonalenia istniej cych koderów obrazów.
ę
Ŝ
ć
ę
ś
ę
Ŝ
ź
ś
ę
ą
ń
Ŝ
ć
ą
ą
1.2. Krótka charakterystyka współczesnych uwarunkowa
ń
Jeste my wiadkami ‘ery informacji’ o technologicznych podstawach, któr charakteryzuje
intensywny rozwój społecze stwa informacyjnego, przekształcaj cego si stopniowo w
społecze stwo szeroko dost pnej (tzw. wolnej) wiedzy. Wobec rosn cej roli Internetu mo na
mówi równie o zjawisku tworzenia si społecze stwa sieciowego (prace Castellsa [1]).
Coraz wi ksze znaczenie rozwoju technologicznego, zdominowanego przez zagadnienie
ś
ś
ą
ę
ń
ą
ę
ń
ą
ę
ć
Ŝ
ę
ń
Ŝ
efektywnej wymiany informacji oraz wiata nauk przyrodniczych i cisłych wida chocia by
w propozycjach tzw. trzeciej kultury [2].
Szybki dost p do istotnych informacji, efektywne jej przetworzenie oraz wyszukiwanie
wiarygodnych ródeł wiedzy staje si decyduj cym o sukcesie składnikiem nowoczesnej
działalno ci edukacyjnej, biznesowo-gospodarczej, organizacyjnej, społecznej. Wobec
nadmiaru pseudoinformacji (tysi ce reklam, setki bezu ytecznych zach t zapychaj cych
skrzynki pocztowe i kanały telewizyjne) coraz bardziej po dane staj si narz dzia
inteligentnie porz dkuj ce przestrze informacyjn .
Sposobem na ycie współczesnego człowieka b d cego w ci głym po piechu staje si
oszcz dzanie (wr cz wydzieranie) ka dej wolnej chwili [3]. B. Pascal (1623-1662) pisz c list
do przyjaciela wspomniał, e 'nie ma czasu, aby napisa krócej'. Pisał wi c jak leci,
przepraszał, e zabrakło mu czasu, by zaoszcz dzi czas adresata. Poszanowanie czasu
przekłada si na wzrost ilo ci informacji dost pnej (przekazywanej) w jednostce czasu w
warunkach, jakimi dysponuje konkretny odbiorca (okre lone ramy czasowe, sprz towe,
finansowe). Oszcz dno czasu odbiorcy informacji zapewnia przede wszystkim odpowiednia
jako informacji, tj. selekcja danych, które s istotne dla u ytkownika, oraz efektywna jej
reprezentacja (minimalizacja długo ci zapisu danych i czasu ich przekazywania, wła ciwa
struktura informacji).
Technologiczne doskonalenie systemów rozpowszechniania informacji wymaga wi c
stosowania efektywnych metod kompresji danych, w tym koderów obrazów. Obecnie
niebagateln rol odgrywa przekazywanie informacji za pomoc obrazu - przykładem niech
b dzie chocia by dominacja obrazkowych systemów operacyjnych typu Windows. Kompresja
obrazów pozwala szybciej zobaczy obraz o lepszej jako ci, wi cej informacji umie ci w
dan informacj , porówna obszerne zasoby
danej obj to ci no nika, szybciej wyszuka
informacji obrazowej etc. W koderach obrazów wykorzystuje si obok elementów teorii
informacji tak e zaawansowane metody numeryczne, teori sygnałów, analiz funkcjonaln ,
psychowizualne modele percepcji czy inn wiedz o człowieku i jego relacji do wiata
(zale nie od zastosowa ).
Doskonalenie metod akwizycji obrazów, poprawa zdolno ci rozdzielczej systemów
obrazowania, redukcja szumu i zwi kszanie dynamiki sygnału u ytecznego wymusza
operowanie coraz wi kszymi zbiorami danych obrazowych. Szybko rosn ca liczba obrazów
cyfrowych przenosz cych informacj w coraz wi kszej gamie zastosowa , takich jak
fotografia cyfrowa, kamery cyfrowe na u ytek domowy, obrazy satelitarne wykorzystywane
w meteorologii, kartografii czy urbanistyce, systemy obrazowania biomedycznego itd.,
wymaga u ycia efektywnych metod gromadzenia, indeksowania, przegl dania i wymiany tej
informacji. W opinii wielu odbiorców i nadawców informacji obrazowej wzrost efektywno ci
i u yteczno ci opracowywanych narz dzi kompresji obrazów jest zbyt wolny wobec
wymaga współczesnych zastosowa . Przykładem mo e by rozwijany obecnie standard
da nowoczesnego u ytkownika okupiono zbytni
JPEG2000, w którym spełnienie
zło ono ci obliczeniow algorytmów i trudno ciami w praktycznej realizacji zało e
standardu.
ś
ś
ć
Ŝ
ę
ę
ź
ą
ś
ę
ą
Ŝ
ą
ę
Ŝ
ą
ą
ń
ą
ę
ą
ą
ę
ę
Ŝ
ę
ą
ą
ś
ę
Ŝ
ą
ę
Ŝ
ć
ę
Ŝ
ć
ę
ę
ś
ę
ś
ę
ś
ś
ć
ć
ą
Ŝ
ś
ś
ę
ę
ą
ą
ę
Ŝ
ę
ć
ś
ś
ę
ć
ę
ś
ś
ć
Ŝ
ą
ą
ć
ę
ę
ę
Ŝ
ą
ę
ą
Ŝ
ś
ń
ś
ę
Ŝ
ę
ą
ę
ę
ą
ń
Ŝ
Ŝ
ą
ś
ę
Ŝ
ś
ć
ń
Ŝ
Ŝ
ś
ą
Ŝ
ą
ć
ń
ą
Ŝ
ą
ś
Ŝ
ń
1.2. Ograniczenia
Głównym ograniczeniem efektywno ci metod kompresji s zbyt uproszczone modele ródeł
informacji wskutek dalece niedoskonałego modelowania rzeczywisto ci (zało enia
stacjonarno ci, gaussowskiej statystyki ródeł). Wzgl dno ‘optymalnych’ dzi rozwi za
wynika tak e ze sposobu definiowania informacji bez odniesienia do warstwy semantycznej.
Cz sto nie sposób przeło y posiadanej wiedzy a priori, dotycz cej analizowanego procesu,
na parametry modelu statystycznego. Nie ma jednoznacznych definicji nadmiarowo ci, która
ś
ą
ź
ś
Ŝ
ę
ś
ź
ś
ć
ś
ą
Ŝ
ę
Ŝ
ć
ą
ś
ń
mo e wyst powa tak na poziomie pojedynczych danych, jak te obiektowym i
semantycznym. Opisuj c informacj trudno jest stwierdzi , jak zmiana parametrów modelu
obiektu decyduje o utracie przez niego ‘to samo ci’ wpływaj cej na ilo przesyłanej
informacji. Wymaga to definicji poj cia informacji na wy szym poziomie abstrakcji, a jest to
przecie poziom u ytkowy typowego odbiorcy.
Interesuj ca staje si posta reprezentacji danych optymalnej nie w kontek cie przyj tych
zało e , ale wobec bogatej rzeczywisto ci form, jakie przyjmuje informacja we
współczesnym wiecie. Rozwa my prosty przykład. W telewizyjnym teleturnieju uczestnicy
zabawy odkrywaj kolejno fragmenty obrazu próbuj c mo liwie szybko rozpozna jego tre .
Niekiedy potrzeba bardzo niewiele odsłoni tych elementów, by zidentyfikowa znany obraz.
Cyfrowy obraz Mona Lisa skompresowany według standardu JPEG z zachowaniem wysokiej
jako ci rekonstrukcji to 150 kilobajtów danych. Je li zaczniemy stopniowo odsłania ten
obraz rekonstruuj c progresywnie kolejne bity skompresowanej reprezentacji, to ju po
dekompresji 1000 bajtów wi kszo specjalistów potrafi rozpozna ten obraz. Do rozpoznania
obrazu Abrahama Lincolna w podobnym te cie przeprowadzonym przez L. Harmona
wystarczyło 756 bitów [4].
Problemem jest wł czenie wiedzy o wiecie dost pnej a priori w poszukiwanie
optymalnej reprezentacji informacji obrazowej. Zniekształcona, cyfrowa rekonstrukcja Mona
Lisy według JPEG jest tylko przybli eniem, aproksymacj oryginału. O poziomie stratno ci
(nieodwracalno ci) metody kompresji decyduje poziom aproksymacji danych ródłowych
wymagany przez odbiorc . Niekiedy informacj mo e stanowi jedynie adres internetowy
(wska nik odpowiedniego obiektu) lub te tekst „Obraz Mona Lisa” powoduj c reakcj
odbiorcy adekwatn do upodoba , posiadanej wiedzy i dost pnych rodków (np. wizyt w
muzeum Louvre, obejrzenie wysokiej jako ci reprodukcji posiadanej w domu czy te ksi ki
o dziełach sztuki etc). W innym przypadku odbiorca wymaga reprodukcji najwy szej jako ci,
co daje kompresja bezstratna cyfrowej postaci obrazu o najwy szej jako ci. Wyst puje tutaj
du e podobie stwo z zagadnieniem indeksowania.
ę
Ŝ
ć
Ŝ
ę
ą
ć
Ŝ
ś
ą
ś
ć
ę
Ŝ
Ŝ
Ŝ
ę
ę
ą
Ŝ
ć
ś
ń
ś
ś
Ŝ
ą
ą
Ŝ
ć
ś
ć
ę
ć
ś
ś
ć
ą
Ŝ
ę
ś
ć
ć
ś
ę
ą
ś
Ŝ
ą
ś
ś
ź
ę
ę
Ŝ
ć
ę
ź
Ŝ
ą
ę
ą
ę
ń
ś
ś
Ŝ
ą
Ŝ
Ŝ
ś
ę
Ŝ
Ŝ
ś
ń
1.3. Mo liwo ci udoskonale
Ŝ
ś
ń
Mo liwe jest bardziej ogólne podej cie do zagadnie informacji, kompresji, granic
efektywno ci kodowania, indeksowania. Informacja definiowana jest wtedy jako w du ym
stopniu odwołanie do ogólnej wiedzy odbiorcy, poj cie nadmiarowo ci konstruowane jest nie
danych w obr bie przekazywanego zbioru
jako przewidywalna statystyczna zale no
(strumienia), ale w znacznie szerszej skali – jako nawi zanie do zasobów wiedzy i rodków
dost pnych odbiorcy, do realnej semantyki danych. Takie podej cie pozwala opracowa
doskonalsze narz dzia kompresji, czego przykładem s próby optymalizacji kompresji
obrazów w ramach standardu JPEG2000.
Zasadnicz cech współczesnych metod kompresji jest elastyczno , zdolno doboru
ilo ci, jako ci i postaci informacji wynikowej (wyj ciowej) w zale no ci od definiowanych
potrzeb odbiorcy. Opracowanie skutecznego algorytmu kodowania wymaga zwykle
optymalizacji wielokryterialnej, wykorzystania mechanizmów adaptacji do lokalnych cech
sygnału (zbioru danych), a czasami nawet interakcji zmieniaj cych procedur kompresji w
czasie rzeczywistym.
Dokładniej te zagadnienia omówiono w kolejnych punktach zwracaj c uwag na
semantyczn teori informacji (p.2), dwojak rol metod kompresji obrazów (p.3) oraz
ledz c nowe paradygmaty kompresji (p.4).
Ŝ
ś
ń
ś
Ŝ
ę
ś
ę
Ŝ
ś
ć
ą
ś
ę
ś
ć
ę
ą
ą
ś
ą
ś
ś
ś
Ŝ
ć
ś
ć
ś
ę
ą
ę
ą
ę
ą
ś
ą
ę
ą
2. Poj cie informacji
ę
Statystyczna teoria informacji jest znacznie cz ciej wykorzystywana w metodach kompresji,
jednak w nowoczesnych rozwi zaniach coraz wi ksz rol odgrywa podstawowy, czyli
semantyczny aspekt informacji.
ę
ś
ą
ę
ą
ę
2.1. Teoria statystyczna
Prace C. Shannona sprzed ponad 50 lat [5] okre liły matematyczne podstawy statystycznej
teorii informacji formalizuj c poj cia:
− bezstratnej kompresji danych ze ródeł informacji modelowanych procesem losowym o
dyskretnym zbiorze warto ci (w tym entropia, modele ródeł, twierdzenia o kodowaniu
ródeł);
− stratnej kompresji danych ze ródeł informacji modelowanych procesem losowym o
ci głym zbiorze warto ci (w tym rednia informacja wzajemna, funkcja zniekształce
ródeł informacji R(D)).
ś
ą
ę
ź
ś
ź
ź
ź
ą
ś
ś
ń
ź
Zaproponowany przez Shannona opis informacji znalazł powszechne zastosowanie w ró nych
dziedzinach nauki, m.in. w biologii, medycynie, filozofii. Wyst puje w nim stochastyczne
rozumienie informacji jako „poziomu niepewno ci” odbiorcy zwi zanej z przekazywanymi
danymi. W ród transmitowanych danych (symboli ródła informacji) tylko te stanowi
informacje, które s nieokre lone (odbiorca nie ma pewno ci, jak dan otrzyma). Po
otrzymaniu ci gu takich symboli ‘poziom niepewno ci’ odbiorcy maleje o warto równ
ilo ci przekazanej informacji.
Informacja wyst puje w kontek cie transmisji (przekazywania) zbioru (strumienia)
danych w schemacie: nadawca ( ródło informacji), kanał transmisyjny (medium słu ce
przekazaniu sygnału, czyli no nika informacji) wyposa ony w nadajnik (przygotowuj cy
sygnał przenosz cy wiadomo do transmisji) i odbiornik (rekonstruuj cy wiadomo z
sygnału), oraz odbiorca (interpretator, u ytkownik informacji).
Trudno podwa y ogromne znaczeniem teorii Shannona w rozwoju współczesnej nauki.
Jednak warto zwróci uwag na ograniczenia tej teorii, szczególnie w zakresie
uproszczonych, nierealistycznych zało e statystycznych oraz poprzez pomini cie semantyki
w definiowaniu ródeł informacji. Ograniczenia te staj si istotne w zastosowaniach do
kompresji obrazów.
W statystycznej teorii informacji dominuje składniowy (syntaktyczny) aspekt informacji.
Nie prowadzi si rozwa a dotycz cych prawdziwo ci czy u yteczno ci tego, co jest
przesyłane. Informacja rozumiana jest wtedy jako zakodowany ci g symboli ródła informacji
nad ustalonym alfabetem z przypisan warto ci semantyczn (znaczeniem) u nadawcy z
zało enia zgodn z warto ci semantyczn u odbiorcy (zobacz rys. 1a)). Reprezentacja R
przesyłanych danych powstaje zwykle z kryterium minimalizacji entropii ródła przesyłanej
informacji HS.
Ŝ
ę
ś
ą
ś
ź
ą
ą
ś
ś
ą
ą
ą
ś
ś
ć
ą
ś
ę
ś
ź
Ŝ
ś
ą
ś
ą
Ŝ
ą
ć
ą
ś
ć
Ŝ
Ŝ
ć
ć
ę
Ŝ
ń
ę
ź
ą
ę
Ŝ
ń
ą
ę
ś
Ŝ
ś
ą
ą
Ŝ
ą
ś
ą
ś
ą
ź
ą
ą
ź
[Rys. 1]
2.2. Teoria semantyczna
W niektórych przypadkach semantyka obrazów odgrywa na tyle znacz c rol w interpretacji
(u ytkowaniu, odczytaniu zawartej informacji) przekazywanych danych, e powinna stanowi
wa ny element w procesie optymalizacji algorytmów kompresji jako ‘uzupełnienie’
ą
Ŝ
ą
Ŝ
Ŝ
ę
ć
statystycznej teorii informacji. Wa nym obszarem zastosowa jest tutaj obrazowanie
medyczne.
Dwa zasadnicze cele teorii Shannona to: a) obliczanie ilo ci informacji dostarczanej przez
ródła mo liwie wiernie opisuj ce przesyłane dane (inaczej wyznaczanie teoretycznych
warto ci granicznych wydajno ci koderów tych ródeł), b) opracowanie efektywnych kodów
dla zdefiniowanych ródeł informacji. Oba te elementy wymagaj ustalenia znacze
pojedynczej danej, kontekstu jej wyst pienia, charakteru reprezentowanej informacji.
Nale y tutaj odwoła si do podstaw ogólnej teorii informacji, w której wyst puje poj cie
semantycznej teorii informacji. Pocz tki tej teorii stanowi prace Bar-Hillela i Carnapa [6]
równie z lat 50 zeszłego wieku, a istot jest okre lanie dodatkowo znaczenia poszczególnych
symboli alfabetu ródła informacji. Wykorzystanie ontologicznych i aksjologicznych
aspektów rozumienia informacji jest trudne do przeło enia na formalny i algorytmiczny opis
kodowania ródeł informacji, jednak wykorzystanie elementów tych teorii wydaje si
konieczne w takich zastosowaniach jak np. rekonstrukcja i indeksowanie tre ci obrazów
medycznych w sposób wiarygodny diagnostycznie. Przy przesyłaniu informacji mo e wtedy
odwoływa si jedynie do ró nicy semantycznej danych ródłowych u nadawcy i odbiorcy
(rys. 1b).
Algorytmiczne wykorzystanie zasad semantycznej teorii informacji mo e by nieco
łatwiejsze poprzez skorzystanie z tych metod matematycznych, które ułatwi semantyczn
selekcj informacji w koderach obrazów. Chodzi tu o wykorzystanie analizy funkcjonalnej,
które pozwala w wi kszym uwolni si od nierealistycznych zało e statystycznych
dobieraj c bazy przekształce przybli aj cych efektywnie lokalne, chwilowe wła ciwo ci
sygnału. Ułatwia to tak e dostosowanie metody kompresji do semantyki ródła informacji
poprzez wi ksze uporz dkowanie informacji (zhierarchizowanie jej opisu) i dokładniejszy jej
opis (czasowo-cz stotliwo ciow charakterystyk ) w nowej dziedzinie przekształcenia.
W latach 50 zeszłego stulecia powstała ‘moskiewska szkoła teorii informacji’ z jej
najznakomitszym przedstawicielem A.N. Kołmogorowem. Obok probabilistycznych
sposobów modelowania ródeł informacji wykorzystano tam tak e teori przybli ania
(aproksymacji) ródeł z wykorzystaniem metod analizy funkcjonalnej. Stochastyczny proces
opisuj cy ródło informacji zast piony jest przez klas funkcji (sygnałów) f okre lonych w
dziedzinie T. Dowolna funkcja jest aproksymowana i dyskretyzowana przez koder za pomoc
sieci aproksymacji. Sie aproksymacji według koncepcji Kołmogorowa [7] jest zbiorem
funkcji mo liwie zupełnym i małolicznym (kontrolowanym przez inne poj cie entropii),
aproksymuj cym istotne cechy sygnałów (funkcji) kodowanych. Kryteria doboru i
optymalizacji postaci sieci formułowane jako minimalizacja bł du przybli enia definiuj
proces kodowania z dopuszczeniem strat.
Na poziomie ogólno ci proponowanym przez teori Kołmogorowa bardzo niewiele mo na
powiedzie o strukturze optymalnej sieci aproksymacji kształtowanej przez optymalny koder.
Chocia alternatywna teoria opisu informacji nie prowadzi to dokładnych oszacowa relacji
zło ono ci modelu ródła do ilo ci reprezentowanej informacji, to jest istotna ze wzgl du na
sugesti funkcjonalnego modelowania ródeł. Chodzi o wyznaczenie efektywnych baz
przekształce obrazów w celu lepszego opisu informacji.
Wykorzystanie do wiadcze
semantycznej teorii informacji, dodatkowo coraz
doskonalszej wiedzy medycznej na temat zasad percepcji psychowizualnej danych
obrazowych i obiektywizacji metod ich interpretacji pozwala konstruowa doskonalsze
sposoby selekcji i porz dkowania przesyłanej informacji na podstawie optymalizowanych
metod opisu danych (du a rola analizy funkcjonalnej, przede wszystkim analizy
harmonicznej, czyli analizy funkcji z wykorzystaniem transformacji o bazie wielu skal
dobieranej w przestrzeni czas-cz stotliwo ).
Ŝ
ń
ś
ź
Ŝ
ą
ś
ś
ź
ź
ą
ń
ą
Ŝ
ć
ę
ę
ą
ę
ą
Ŝ
ą
ś
ź
Ŝ
ź
ę
ś
Ŝ
ć
ę
Ŝ
ź
Ŝ
ć
ą
ą
ę
ę
ć
ą
ń
ę
Ŝ
Ŝ
ś
Ŝ
ę
ń
ą
ś
ź
ą
ę
ś
ą
ę
ź
Ŝ
ę
Ŝ
ź
ą
ź
ą
ę
ś
ą
ć
Ŝ
ę
ą
ę
ś
Ŝ
ą
ę
Ŝ
ć
Ŝ
Ŝ
ń
ś
ź
ś
ę
ę
ź
ń
ś
ń
ć
ą
Ŝ
ę
ś
ć
3. Dwojaka rola kompresji
Kompresja na u ytek archiwizacji wymaga niekiedy znacz co ró nego podej cia od
zastosowa dopuszczaj cych selekcj informacji poprzez jej odpowiednie uporz dkowanie
czy kwantyzacj danych (nazwijmy je selektywnymi). W tradycyjnym podziale odpowiada to
kompresji bezstratnej z wiernym zapisem danych (dokładno do pojedynczego bitu) oraz
stratnej, gdzie tracona jest mo liwo dokładnej rekonstrukcji wszystkich danych ródłowych,
jednak niekoniecznie nast puje utrata informacji. W tym drugim znaczeniu, kiedy nie sposób
do ko ca okre li dopuszczalnych poziomów strat, relacji dane-informacja u yteczna dla
odbiorcy, obiektywnych kryteriów i u ytecznych zakresów warto ci parametrów, algorytmy
kompresji maj wiele cech wspólnych z metodami indeksowania.
Ŝ
ą
ń
ą
Ŝ
ś
ę
ą
ę
ś
Ŝ
ś
ć
ć
ź
ę
ń
ś
ć
Ŝ
Ŝ
ś
ą
3.1. Odwracalna kompresja danych
Bitowo bezstratna kompresja obrazów to obecnie przede wszystkim tworzenie mo liwie
oszcz dnej ich reprezentacji z wykorzystaniem zasad statystycznej teorii informacji do celów
archiwizacji. Przez ostatnie 10 lat, od czasu opracowania efektywnych koderów CALIC i
według standardu JPEG-LS, nie nast pił aden przełom, jako ciowy post p w dziedzinie
odwracalnej kompresji obrazów.Wspomniane kodery odwracalne na etapie modelowania
ródeł informacji wykorzystuj 2W (dwuwymiarow ) charakterystyk danych w postaci
efektywnych modeli predykcji.
Obserwuje si natomiast tendencj modelowania ródeł informacji na ni szym poziomie
bez po rednich modeli s siednich warto ci pikseli ródłowych. Uproszczenia prowadza do
zamiany: zamiast obiektów piksele, zamiast pikseli – rozkłady map bitowych. Stosuje si
modelowanie lokalnych kontekstów wybranych przestrzeni bitowych niekoniecznie
skorelowanych z obrazow interpretacj danych, szacowanie zale no ci danych traktowanych
bardziej elementarnie (z uproszczonym alfabetem ródła), a co za tym idzie bardziej
uniwersalnie.
W koderach odwracalnych kluczow rol odgrywaj metody modelowania kontekstu przy
kodowaniu binarnym (zwykle arytmetycznym). W PPM (ang. prediction with partial string
matching) [8] przy modelowaniu prawdopodobie stw warunkowych adaptacyjnego kodera
arytmetycznego wykorzystywane s
konteksty ró nych rozmiarów. Alfabet linii
prawdopodobie stw okre lonego kontekstu rozszerzany jest dynamicznie, tj. niezerowy
podprzedział okre lonego symbolu a k pojawia si w linii prawdopodobie stw dopiero
wówczas, gdy symbol a k wyst pi w sekwencji wej ciowej poprzedzony tym kontekstem.
Ponadto w ka dej linii zarezerwowany jest podprzedział symbolu 'PRZEŁ CZ', który słu y
do sygnalizacji zmiany rozmiaru kontekstu (dobierany jest mo liwie najdłu szy kontekst
zaczynaj c od kontekstu masymalnego rz du m). Poszczególne odmiany metody PPM,
dostosowane do danych tekstowych, obrazowych, innych, ró ni si sposobem okre lania linii
prawdopodobie stw i kontekstów (rozmiarem, kształtem, uproszczeniem statystyki w danym
kontek cie).
W przypadku, gdy efektywne opisanie jednym kontekstem zło onych lokalnych
zale no ci danych ródłowych nie jest mo liwe, stosowane jest niekiedy wa enie kilku
modeli prawdopodobie stw bazuj cych na ró nych kontekstach. Je li rozkład PSC1 okre lono
Ŝ
ę
ą
ź
Ŝ
ś
ą
ą
ę
ę
ś
ę
ę
ź
ą
ś
Ŝ
ź
ę
ą
ą
Ŝ
ś
ź
ą
ę
ą
ń
ą
ń
Ŝ
ś
ś
ę
ą
ń
ś
Ą
Ŝ
Ŝ
Ŝ
ą
Ŝ
ę
Ŝ
ą
ę
ś
ń
ś
Ŝ
Ŝ
ś
ź
Ŝ
ń
ą
Ŝ
Ŝ
ś
ś
na podstawie kontekstu C1, a PSC2 na podstawie C2, wówczas do kodowania mo na
(
)
Ŝ
wykorzysta wa ony rozkład prawdopodobie stw P + P / 2 . Metoda wa enia rozkładów
prawdopodobie stw z wykorzystaniem struktury drzewa CTW (ang. context-tree weighting)
[9] pozwala wykorzysta wszystkie mo liwe konteksty i modele kontekstu ograniczone
ć
Ŝ
ń
ń
ć
Ŝ
C1
S
C2
S
Ŝ
rozmiarem m. CTW bazuje na binarnym alfabecie ródła informacji bez wzgl du na rodzaj
kodowanych danych (obraz, d wi k, tekst itp.). Wymaga to wst pnej konwersji ci gu symboli
nad alfabetem AS w ci g bitowy (tj. na wst pnej serializacji, jak w standardzie JBIG i
testowanej metodzie BKO), kodowany z wykorzystaniem binarnej struktury drzewa
okre laj cej konteksty i prawdopodobie stwa modeli ródła z pami ci i bez do sterowania
kodowaniem arytmetycznym.
Do okre lenia prawdopodobie stw ci gu symboli wykorzystuje si
tzw.
prawdopodobie stwo blokowe całego bloku bitów, obliczane na podstawie cz sto ci
dotychczasowych (w modelu przyczynowym) wyst pie zer i jedynek zakładaj c model bez
pami ci. Zale no ci pomi dzy danymi uwzgl dnione zostały w tzw. prawdopodobie stwach
wa onych obliczanych w w złach tworzonego drzewa binarnego.
Inaczej wyznaczane jest te prawdopodobie stwo symboli, tj. według wyra enia:
n1 + 12
Pe ( s = a1 ) =
, gdzie alfabet ródła AS = {a1 , a 2 } , n1,n2 - liczba wyst pie
n1 + n 2 + 1
odpowiednio a1 i a2 w kodowanym dotychczas ci gu ródłowym. Pe ( s = a 2 ) definiowane jest
analogicznie.
ź
ź
ę
ą
ś
ę
ę
ą
ę
ą
ń
ś
ź
ń
ę
ą
ą
ę
ń
ę
ą
ę
Ŝ
ś
ę
ń
ą
ę
Ŝ
ś
ń
ę
Ŝ
ń
Ŝ
ź
ą
ą
ń
ź
Coraz wi ksz rol w praktycznych zastosowaniach odgrywaj uniwersalne narz dzia do
archiwizacji danych (tzw. archiwizery) wykorzystuj ce podobne metody statystycznego
modelowania ródeł informacji z doborem parametrów zale nie od typu danych. Wykazuj
one du efektywno kompresji skutecznie konkuruj c z rozwi zaniami dedykowanymi np.
kompresji obrazów. Dowodem tego s wyniki licznych eksperymentów (zobacz np. [10]), a
tak e przedstawione poni ej rezultaty przeprowadzonych testów własnych (rys. 2).
ę
ą
ę
ą
ę
ą
ź
Ŝ
Ŝ
ą
ś
ć
ą
ą
ą
ą
Ŝ
Ŝ
[Rys. 2]
Uniwersalny archiwizer WinRK (wykorzystuj cy odmian metody PPM do modelowania
kontekstu) pozwolił w kilku przypadkach na wyra ne zmniejszenie długo ci zakodowanych
danych obrazowych ( rednio o blisko 6%) w stosunku do najefektywniejszego kodera
obrazów CALIC. W stosunku do standardów JPEG-LS i JPEG2000 poprawa efektywno ci
si gn ła odpowiednio 10% i 11%. Nowa wersja WinRK (niestety na obecnym etapie
realizacji nieco zbyt zło ona obliczeniowo) z algorytmem modelowania PWCM pozwala
skróci skompresowane dane obrazowe o dodatkowe kilka procent.
Dwa uniwersalne kodery map bitowych: według standardu JBIG oraz wykorzystuj cy
nieco bardziej dopasowan do danych obrazowych metod serializacji BKO pozwoliły
równie uzyska wysok efektywno kompresji obrazów testowych, przy czym rednia
bitowa dla BKO jest na poziomie redniej kodera CALIC.
ą
ę
ź
ś
ś
ś
ę
ę
Ŝ
ć
ą
ą
Ŝ
ć
ę
ą
ś
ć
ś
ś
Okazuje si , e modele informacji obrazowej wy szego poziomu (obiektowe, predykcyjne,
transformacji liniowych) nie usprawniaj procesu redukcji nadmiarowo ci wej ciowej
reprezentacji danych, s za mało elastyczne w dopasowaniu modeli ródeł do lokalnych
(chwilowych) cech sygnału. S one za szczególnie istotne przy porz dkowaniu, tworzeniu
hierarchii informacji uwzgl dniaj c niekiedy przesłanki semantyczne w kompresji
selektywnej.
ę
Ŝ
Ŝ
ą
ś
ą
ś
ź
ą
ę
ś
ą
ą
3.2. Kompresja selektywna
W kompresji selektywnej poszukiwana jest efektywna reprezentacja semantycznie
definiowanej informacji wyra onej wst pnie danymi w postaci ródłowej, za indeksowanie
Ŝ
ę
ź
ś
to tworzenie indeksu (indeksów) obiektów (kolekcji obiektów) danego typu, czyli spisu
(zestawu) tych obiektów ze wzgl du na okre lone ich wła ciwo ci (cechy, czyli warto ci
ustalonego argumentu indeksu – zobacz [16]) maj ce znaczenie dla u ytkownika. Przy
wyborze argumentu indeksu (tj. okre lonych wła ciwo ci indeksowanych obiektów) istotna
jest rozró nialno obiektów, a wi c wydobycie wyj tkowej tre ci ka dego z obiektów z
ogólnego, mało znacz cego tła. Kluczow rol odgrywa tu dotarcie do realnej informacji
zwi zanej z ka dym obiektem (w naszym przypadku obrazem), tj. istoty przekazywanej
tre ci. Semantyczne okre lenie informacji odgrywa tutaj decyduj c rol .
W indeksie wyst puj identyfikatory obiektów wskazuj ce (po rednio lub bezpo rednio)
ich fizyczn lokalizacj . Korzystaj ce z indeksów wyszukiwarki dostarczaj na danie
odbiorcy obiekty o okre lonych cechach si gaj c niekiedy do ich skompresowanej
reprezentacji, dekoduj c i prezentuj c np. obraz.
Nowe standardy kompresji, np. JPEG2000 przewiduj efektywne ł czenie kompresji z
indeksowaniem, wyznaczanie cech w dziedzinie przekształconych w kompresji danych, co
cz sto daje lepsz selektywno wyszukiwania pozwalaj c porównywa optymalizowane
reprezentacje informacji z uwzgl dnieniem ich znaczenia.
Praca nad standardem kompresji obrazów JPEG2000 jest przykładem szerszego
spojrzenia na zagadnienia kompresji selektywnej w ostatnich latach, bogatszego o
uwzgl dnienie wymaga odbiorcy i subiektywnego znaczenia przesyłanych mu danych.
Mo liwa jest ingerencja w procedury przetwarzania danych oraz organizacji strumienia
wyj ciowego, a przez to wykorzystanie wiedzy wynikłej z do wiadczenia u ytkownika,
tradycji, kultury itd. Opracowano zagadnienia interakcyjnej transmisji, rekonstrukcji obrazów
z ingerencj odbiorcy w jako i ilo otrzymywanych danych, które staj si realn
informacj weryfikowan przez odbiorc (jego cele). Wprowadzono elementy zabezpieczania
danych, ochrony własno ci intelektualnych, ukrywania informacji przed postronnymi
odbiorcami. W ostatnich miesi cach trwaj intensywne prace nad indeksowaniem obrazów w
ramach nowego standardu JPSearch, tworzonego przez członków komitetów JPEG i MPEG
jako zintegrowane uzupełnienie standardów JPEG.
Realizacja takich zało e nie jest prosta i na obecnym etapie, niedoskonała.
Przeprowadzili my szereg testów porównawczych kodera JPEG2000 z realizacj starszego
standardu JPEG. Ocena uzyskanych rezultatów nie jest jednoznaczna – zobacz przykład z rys.
3.
ę
ś
ś
ś
ś
ą
ś
Ŝ
ś
ć
ś
ę
ą
ą
ą
Ŝ
ś
ą
ś
Ŝ
ę
Ŝ
ś
ś
ę
ą
ą
ą
ą
ę
ą
ę
ś
ś
ą
ą
ś
ę
ą
ą
ą
ą
ę
Ŝ
ą
ą
ś
ą
ć
ą
ć
ę
ę
ń
Ŝ
ś
ś
ą
ś
ą
ć
ś
ą
Ŝ
ć
ą
ę
ą
ę
ś
ą
Ŝ
ą
ń
ś
ą
[Rys. 3]
O ile w przypadku obrazu testowego Lenna wyra nie lepsza jako rekonstrukcji kompensuje
kilkukrotnie wi ksz zło ono obliczeniow kodera JPEG2000, to jednak w przypadku
obrazu Frog trudno wskaza lepsz wersj w ocenie subiektywnej. Główn zalet JPEG2000
nie jest wi c jego efektywno , ale wi ksza mo liwo dostosowania do semantycznej
warstwy przekazywanej informacji.
Zastosowania medyczne wymagaj jeszcze szerszego spojrzenia na zagadnienie
kompresji. Nie bez przyczyny nie ma dot d powszechnej zgody rodowisk lekarskich na
stosowanie kompresji stratnej w obrazowaniu medycznym. Obawy budzi wiarygodno
diagnostyczna rekonstruowanych obrazów oraz sposób ustalenia optymalnych parametrów
procesu kompresji. Nie przekonuje wiele prac dowodz cych nawet poprawy jako ci obrazów
po kompresji [17,18], nie ma jasnych reguł prawnych [19]. Sformułowanie obiektywnych
kryteriów optymalizacji algorytmu kompresji tych obrazów jest nadal spraw otwart , cho
jest przedmiotem licznych bada od wielu lat.
ź
ę
ą
Ŝ
ś
ć
ć
ą
ę
ś
ś
ć
ą
ę
ć
ą
ę
Ŝ
ś
ą
ć
ą
ą
ś
ś
ą
ś
ą
ń
ć
ą
ć
4. Nowe paradygmaty kompresji
Ci gle powracaj pytania o natur informacji, skuteczny jej opis ilo ciowy i jako ciowy,
metody ekstrakcji, klasyfikacji, indeksowania informacji zmieniaj cej swój charakter, zasi g,
no nik, znaczenie. Zmianie ulegaj paradygmaty, czyli wzorce, standardy stosowanych z
sukcesem rozwi za . Standardy opracowywane przez kilka lat, w przeci gu kilku nast pnych
trac swoj aktualno , u yteczno (np. standard kompresji obrazów JPEG, coraz mniej
u yteczny w wielu zastosowaniach).
Uzupełnieniem przedstawionych rozwa a
s zebrane na podstawie licznych
eksperymentów (w tym własnych) w zakresie kompresji danych (w tym obrazowych)
stwierdzenia i wskazówki sugeruj ce kierunek doskonalenia obowi zuj cych dzi
paradygmatów kompresji
ą
ą
ę
ś
ś
ą
ś
ę
ą
ą
ą
ń
ą
ą
ś
ć
Ŝ
ś
ę
ć
Ŝ
Ŝ
ń
ą
ą
ą
ą
ś
4.1. Uniwersalny archiwizer
W przypadku odwracalnej kompresji danych istotne okazuj si nast puj ce spostrze enia:
• wiat ‘uj ty’ w formie rejestracji okre lonego stanu rzeczywisto ci w danej chwili nie
ma charakteru gaussowskiego; znaczy to, e:
o dekorelacja danych nie oznacza ich statystycznej niezale no ci, a model ródła bez
pami ci staje si mało skuteczny; wynika st d, e wykorzystanie modeli z pami ci
w algorytmach kwantyzacji i binarnego kodowania znacz co zwi ksza efektywno
opisu ródeł informacji;
• obrazy zazwyczaj nie maj charakteru stacjonarnego, ani nawet ergodycznego wi c:
o wa n rol odgrywa adaptacyjno algorytmów modelowani ródeł, stosowanie
metod segmentacji i lokalnej klasyfikacji, zarówno w skali globalnej (na poziomie
obrazów) jak i lokalnej (na poziomie fragmentów obrazów);
o wymagane s wiarygodne sposoby szacowania prawdopodobie stw symboli na
podstawie niewielkiej statystyki danych, skuteczne metody upraszczania,
kwantyzacji, wyboru kontekstów;
o inne ni statystyczne metody opisu ródeł informacji okazuj si nieskuteczne
(predykcyjne, transformacyjnego kodowania, obiektowe).
ą
ś
ę
ę
ę
ą
ś
Ŝ
ś
Ŝ
Ŝ
ę
ę
ą
ś
ź
Ŝ
ę
ą
ę
ą
ś
ć
ź
ą
Ŝ
ą
ę
ę
ś
ć
ź
ą
ń
Ŝ
ź
ą
ę
Najlepszym rozwi zaniem do celów archiwizacji wydaje si uniwersalny koder danych z
mo liwo ci doboru modelu ródła zale nie od charakteru danych.
ą
Ŝ
ś
ę
ą
ź
Ŝ
4.2. Elastyczny koder wielu skal
Selektywna kompresja informacji rz dzi si innymi prawami. Warto zauwa y , e:
ą
•
ę
Ŝ
ć
Ŝ
modelowane obrazy zachowuj cech samopodobie stwa w zmieniaj cej si skali (po
rozci gni ciu obrazu do wi kszej dziedziny i przeskalowaniu zachowane zostaj
wła ciwo ci statystyczne oryginału), a wi c:
o kluczow rol odgrywaj przekształcenia (transformacje) danych ze skalowaniem
rozdzielczo ci, zachowuj ce informacj o poło eniu i tre ci cz stotliwo ciowej
współczynników poszczególnych skal;
o szczególnie wa nym elementem wynikaj cym z rozkładu zale no ci danych w
przestrzeni ze skalowaniem rozdzielczo ci jest kodowanie pozycji współczynników
transformaty i ich znacze (wzgl dem ustalonej warto ci progowej).
ą
ą
ś
ę
ę
ń
ą
ę
ę
ą
ś
ę
ą
ę
ą
ś
ą
ę
Ŝ
Ŝ
ś
ą
ę
Ŝ
ś
ś
ś
ń
ę
ś
Efektywny koder obrazów powinien zapewni nast puj ce cechy reprezentowanej informacji:
ć
ę
ą
•
hierarchiczno koreluj c z semantycznym znaczeniem kolejnych przybli e ródła
informacji (progresja tre ci) zapewniaj ca progresj optymaln w sensie R(D) (tj. od
maksymalnego przyrostu informacji na bit transmitowanych danych do minimalnego);
selektywno rozkładu informacji w poszczególnych obszarach wielu skal dziedziny z
mo liwo ci rekonstrukcji informacji zarówno w pełnej, niezakłóconej wersji (nawet w
sensie odwracalnej kompresji danych), jak te odpowiednio wybranej, przybli onej (w
mo liwie szerokim zakresie) na poziomie pojedynczych pikseli, obiektowym lub
semantycznym;elastyczno
pozwalaj c na realizacj porz dku kodowania i
dekodowania informacji zale nie od wymaga u ytkownika (interaktywno procesu
kompresji/dekompresji).
ś
ć
ą
ą
Ŝ
ś
•
ś
Ŝ
ś
ą
ę
ń
ź
ą
ć
ą
Ŝ
Ŝ
Ŝ
ś
ć
ą
ą
ę
Ŝ
ń
ą
Ŝ
ś
ć
Trwaj poszukiwania optymalnych przekształce obrazów w wielu skalach. Klasyczne
falkowe przekształcenie obrazów zakłada separowane j dro transformacji (sekwencja
przekształce 1W po wierszach i kolumnach), co nie pozwala dobrze opisa obiektów w
obrazach (wyst puje uwypuklenie informacji w kierunku pionowym i poziomym kosztem
innych kierunków). Aproksymacja nieliniowa gładkiej krzywej jest cz sto lepsza w
przypadku wykorzystania transformacji wielorozdzielczych z j drem 2W (curvelets), filtrów
kierunkowych (contourlets), przekształce geometrycznych po podziale obrazu na bloki o
ró nej wielko ci, co daje lokalny opis informacji w ró nej skali (beamlets, wedgelets,
bandlets i inne). Zastosowanie oszcz dniejszej, bardziej upakowanej i uporz dkowanej
reprezentacji danych w dziedzinie tych przekształce pozwala równie zwi kszy
selektywno rozwi za uwzgl dniaj cych znaczenie rozkładów symboli na poszczególnych
poziomach tak uzyskanej hierarchii informacji obrazowej. Wykorzystywane s tutaj podstawy
teoretyczne kształtowania baz – atomów czas-cz stotliwo
dostarczane przez analiz
harmoniczn i funkcjonaln . Uzyskane ju rezultaty poprawy efektywno ci w stosunku do
JPEG2000 s obiecuj ce [20] i sugeruj kierunek doskonalenia metod kompresji sygnałów w
ramach planowanego (przez komitet JPEG) na 2010 rok nowego standardu kompresji – AIC
(ang. advanced image coding).
ą
ń
ą
ń
ć
ę
ę
ą
ń
Ŝ
ś
Ŝ
ę
ą
ń
ś
ć
ą
ń
ę
Ŝ
ę
ć
ą
ą
ę
ą
ą
ą
ś
ć
ę
Ŝ
ą
ś
ą
5. Podsumowanie
Trudno sobie wyobrazi rozwój nowoczesnej telekomunikacji, telemedycyny, e-biznesu,
obieg ró nego typu dokumentów w Internecie, doskonalenie nowoczesnych technologii
sieciowych typu grid, skuteczne wyszukiwarki czy globalne bazy danych bez
optymalizowanych algorytmów kompresji, oszcz dnych formatów, u ytecznych standardów z
wieloaspektow
charakterystyk
strumieni danych przesyłanych i gromadzonych,
sprz towych realizacji kodeków etc.
Kompresja danych jako efektywna i uniwersalna koncepcja reprezentowania informacji
poparta efektywnymi realizacjami, przedmiot działalno ci naukowej i sztuki in ynierskiej jest
obiektem zainteresowa w wielu obszarach zastosowa współczesnych technologii
teleinformatycznych. Rozumiana jako poszukiwanie, tworzenie i badanie oszcz dnej, a
zarazem funkcjonalnej reprezentacji danych zwi zanych z informacj tak e w sensie
znaczeniowym pozwala przyspieszy i wzbogaci przekaz wiadomo ci, zwi kszy
niezawodno wymiany informacji pomi dzy nadawc i odbiorc , lepiej archiwizowa
posiadane zasoby.
W przypadku obrazów szczególnie istotny okazuje si aspekt semantyczny,
interpretacyjny, domagaj cy si uwzgl dnienia charakterystyki (profilu) odbiorcy w procesie
wyznaczania u ytecznej reprezentacji informacji. Praca nad metodami kompresji danych
obrazowych w zakresie okre lania znacze przesyłanych pakietów danych zyskuje przez to
ć
Ŝ
ę
ą
Ŝ
ą
ę
ś
Ŝ
ń
ń
ę
ą
ć
ś
ą
ć
ć
ę
ą
ą
ę
ą
ę
ę
Ŝ
ś
ń
Ŝ
ś
ę
ć
ć
wymiar bardziej humanistyczny i słu ebny wobec wielu oczekiwa , zamierze i ogranicze
współczesnego człowieka.
Zwrócono uwag na wiele otwartych kwestii przede wszystkim w zakresie rozumienia
poj cia informacji, sposobów selekcji informacji zale nie od subiektywnych wymaga
odbiorcy, charakterystyki percepcyjnych zdolno ci odbiorcy, integracji z rozwi zaniami
stosowanymi w indeksowaniu i innych metodach przetwarzania informacji. Nieustaj ce,
zintensyfikowane w ostatnich latach prace nad multimedialnymi standardami komitetów
JPEG i MPEG stanowi dowód du ego zaanga owania badaczy oraz rosn cych potrzeb i
niesłabn cego zainteresowania rynku. Aby im sprosta konieczna jest silniejsza integracja
zarówno w obr bie ró nych dyscyplin i specjalno ci technicznych, jak i obszarów wiedzy
zwi zanych z zastosowaniem technik informacyjnych.
Poniewa dzi coraz cenniejszy staje si czas i selekcja realnej informacji, a ka dy dzie
przynosi nowe technologie gromadzenia i przekazu informacji, poszukiwanie optymalnych
metod reprezentowania informacji staje si pal c potrzeb chwili. Sugerowane kierunki
bada wydaj si by u yteczne.
Ŝ
ń
ń
ń
ę
ę
Ŝ
ń
ś
ą
ą
ą
Ŝ
Ŝ
ą
ą
ć
ę
Ŝ
ś
ą
Ŝ
ś
ę
Ŝ
ę
ń
ą
ę
ć
ą
ą
ń
ą
Ŝ
Referencje:
[1] Manuel Castells on the Network Society: http://www.tidec.org/geovisions/Castells.html
[2] Brockman J.: The Third Culture: Beyond the Scientific Revolution. Simon & Schuster, 1995.
[3] Eriksen T.H.: Tyrania chwili. PIW, 2003.
[4] Donoho D.L., Vetterli M., DeVore R.A., Daubechies I.: Data compression and harmonic analysis.
Invited paper, IEEE Trans. Inform. Theory, Special Issue, Inform. Theory: 1948-1998
Commemorative Issue, nr 44(6), str. 2435-2476, Oct. 1998.
[5] Shannon C.E.: A Mathematical theory of communications. Bell System Technical Journal, nr 27,
str. 379-423 i 623-656, 1948.
[6] Bar-Hillel Y., Carnap R.: Semantic information. British Journal for the Philosophy of Science, nr
4, str. 47-157, 1953.
[7] Kolmogorov A.N, Tikhomiriv V.M: -entropy and -capacity. Uspekhi Mat. Nauk, nr 14, str. 3-86
(tłum. ang. Amer. Math. Soc. Transl., Ser 2 Vol 17, str 277-364, 1959.
[8] Moffat A.: Implementing the PPM data compression scheme'. IEEE Trans Comm COM-38, nr 11,
str 1917-1921, 1990.
[9] Willems F.M., Shtarkov Y.M., Tjalkens T.J.: The context-tree weighting method: basic properties.
IEEE Trans. Information Theory, IT-41, str 653-664, 1995.
[10] Lossless data compression software benchmarks/comparisons:
http://www.maximumcompression.com/
[11] SPMG/ JPEG-LS V.2.2 codec, ftp://spmg.ece.ubc.ca/pub/jpeg-ls/ver-2.2/, Signal Processing &
Multimedia Group at the University of British Columbia, USA.
[12] http://www.cl.cam.ac.uk/~mgk25/jbigkit/
[13] X. Wu, CALIC codec, ftp://ftp.csd.uwo.ca/pub/from_wu/v.arith/
[14] Przelaskowski A.: Binarny koder obrazów ze skal szaro ci. Prace Naukowe Instytutu
Telekomunikacji i Akustyki Politechniki Wrocławskiej, nr 85, seria: Konferencje, nr 29, X
Sympozjum Nowo ci w Technice Audio i Wideo, str. 243-252, Wrocław, 2004.
[15] http://www.msoftware.co.nz/downloads_page.php
[16] W. Skarbek: Podstawy multimediów. Podr cznik elektroniczny dla studiów zaocznych OKNO,
Politechnika Warszawska, 2004.
[17] Chang S.G., Yu B., Vetterli M.: Adaptive wavelet thresholding for image denoising and
compression. IEEE Trans Image Proces. nr 9, str1532-1546, 2000.
[18] Sarty G.E., Atkins M.S., Pierson R.A.: Sharper MRI of ovarian and uterine masses via waveletbased compression. 20th Annual Canadian Western Society for Reproductive Biology Workshop,
1998.
[19] Brownrigg P., Bak P.R.G.: What is the legal risk in using irreversible compression on diagnostic
images in medical management? - a legal assessment and review of the regulatory framework in the
USA and Canada. SCAR 2005 Annual Meeting, Orlando, USA.
ε
ε
ą
ś
ę
ś
[20] Wakin M., Romberg J., Choi H., Baraniuk R.: Wavelet-domain approximation and compression
of piecewise smooth images. To appear in IEEE Tran Image Proc, 2005.
Ś
w
i
a
t
w
r
z
e
c
z
i
s
t
y
y
ΣO
ΣN
R( min( H S ) )
N
Ś
w
i
a
w
r
ΣN
N
ę
ś
ą
Ŝ
ę
ń
ś
e
c
z
y
t
i
s
t
y
ΣO
R( Σ N (W ) − Σ O (W ), min( H S ) )
Rys. 1. Zró nicowanie poj cia przesyłanej
minimalizowanej entropii przesyłanej od
zgodnych warto ciach semantycznych
semantyczn ; b) reprezentacja informacji
jedynie ró nic znacze u nadawcy i
przesyłanej wiadomo ci W.
Ŝ
z
O
O
informacji: a) reprezentacja danych R ródła S o
nadawcy N do odbiorcy O przy z zało enia
Σ N (W ) ≅ Σ O (W ) , gdzie Σ ⋅ (⋅) jest funkcj
o minimalizowanej entropii ródła opisuj cego
odbiorcy Σ N (W ) − Σ O (W ) w odniesieniu do
ź
Ŝ
ą
ź
ą
7,000
6,000
ś
rednia bitowa
5,000
4,000
3,000
2,000
1,000
JPEG-LS
JP2000
JBIG
CALIC
BKO
WinRK
ae
ria
l2
ba
rb
1
ba
rb
2
bo
at
ca
fe
el
ai
ne
fro
g
go
l
go d
ld
hi
ll
le
m na
an
dr
ill
m
m
ou at
nt
pe ai n
pp
er
s
w
at
e
w
om r
an
ze
ld
a
fin
g
s e er
ism
ic
tx
tu
r1
tx
t
w ur2
as
hs
a
sm t
pt
e
ta
rg
et
b
cm ike
pn
d1
ho
te
lib l
ra
r
te y
st
8g
0,000
obrazy testowe
ś
Rys. 2. Porównanie efektywno ci bezstratnych koderów obrazów. Wykorzystano 29 obrazów
testowych w 8 bitowej skali szaro ci (z prac standaryzacyjnych komitetu JPEG), o nazwach
jak na rysunku. Warto ci rednich bitowych zbioru wszystkich obrazów testowych dla
poszczególnych koderów wynosz odpowiednio: 4,55 bnp (JPEG_LS [11]), 4,60 bnp
(JPEG2000 VM8.6), 4,75 bnp (JBIG [12]), 4,35 bnp (CALIC [13]), 4,36 (BKO [14]) oraz 4,1
bnp (WinRK v. 2.1.6 [15]). Skrót bnp oznacza ‘bitów na piksel’.
ś
ś
ś
ą
JPEG2000
JPEG
a)
b)
ś
Rys. 3. Porównanie efektywno ci selektywnej kompresji obrazów według standardów JPEG i
JPEG2000: a) obraz testowy Lenna odtworzony po kompresji w stopniu 50:1 (JPEG daje
warto PSNR równ 28,18 dB, a dla JPEG2000 PSNR=30,5 dB); b) obraz testowy Frog
zrekonstruowany po kompresji w stopniu 30:1 (JPEG daje PSNR=24,8 dB, a JPEG2000 –
PSNR=25,46 dB). W ocenie subiektywnej trudno wskaza wersj Frog o lepszej jako ci.
ś
ć
ą
ś
ć
ę