porządkowanie informacji diagnostycznej w kompresowanych

Transkrypt

porządkowanie informacji diagnostycznej w kompresowanych
PORZĄDKOWANIE INFORMACJI DIAGNOSTYCZNEJ
W KOMPRESOWANYCH OBRAZACH MEDYCZNYCH:
PROGRESJA WIARYGODNOŚCI
Artur Przelaskowski, Rafał Jóźwiak, Tomasz KrzyŜewski, Anna Wróblewska
Instytut Radioelektroniki Politechniki Warszawskiej,
ul. Nowowiejska 15/19, 00-665 Warszawa, [email protected]
Streszczenie: Przedstawiono koncepcję progresji wiarygodności diagnostycznej obrazów
medycznych realizowanej za pomocą kodera JPEG2000 ze zmodyfikowanym algorytmem
PCRD. Błąd średniokwadratowy jako miarę zniekształceń zastąpiono numeryczną miarą
wiarygodności diagnostycznej uzyskując większy przyrost treści istotnej diagnostycznie przy
rekonstrukcji początkowych pakietów strumienia kodowego. Realizację tej koncepcji
weryfikowano na badaniach mammograficznych z udziałem radiologa.
1. WPROWADZENIE
Zagadnienie kompresji danych w ogólnym przypadku sprowadza się do wyznaczenia nowej,
efektywnej reprezentacji danych poprzez usuwanie róŜnego typu nadmiarowości opisu,
redukcję zaleŜności w hierarchicznej strukturze danych, ustalenie uŜytecznej postaci
informacji oraz jej upakowanie (koncentracja) w niewielkim obszarze przestrzeni opisu,
określenie reguły selekcji informacji oraz tworzenia oszczędnej, binarnej formy opisu etc.
Współcześnie stajemy się częścią globalnego społeczeństwa informacyjnego, dynamicznie
rozwijającego się w trwającej obecnie „erze informacji” [1]. Wyzwala ona nowe moŜliwości,
ale niesie równieŜ ze sobą zagroŜenia i trudności. Obserwujemy nieustanną, szybką wymianę
duŜej liczby potoków danych, które wręcz bombardują nas kaŜdego dnia wywołując
zmęczenie nadmiarem przekazu oraz trudność percepcji tego, co jest najbardziej istotne.
Systemy telekomunikacyjne, rozległe sieci, e-biznes, e-urząd, elektroniczna wymiana
dokumentów, rozwój Internetu, telemedycyna – tak dynamiczny rozwój nowoczesnych
technologii okupiony jest znacznym wzrostem oczekiwań wobec nowoczesnych metod
kompresji. Poszukiwane stają się rozwiązania, w których kompresja nabiera szerszego,
bardziej uniwersalnego znaczenia, rozumianego jako proces tworzenia selektywnej,
upakowanej, wygodnej w odbiorze i manipulacji reprezentacji informacji przesyłanej,
gromadzonej czy przeglądanej.
Uwzględniając wysokie wymogi współczesnych systemów obrazowania, ich
róŜnorodność, mnogość stosowanych rozwiązań, współczesny koder obrazu powinien
wyróŜniać się takimi cechami jak progresywność strumienia kodowego (stopniowe
przekazywanie informacji w schemacie od ogółu do szczegółu, z malejącym przyrostem
informacji), osadzalność (hierarchiczna struktura danych wykorzystana w procesie nakładania
kolejnych warstw reprezentacji kodowej), skalowalność (wersje o róŜnej rozdzielczości i
jakości), działanie na wybranym obszarze zainteresowania (ROI), moŜliwość uzyskania
kompresji stratnej (tj. z selekcją informacji)-do-bezstratnej itd. Koncepcję paradygmatu
współczesnego kodera obrazów przedstawiono schematycznie na Rys1.
Rys. 1. Koncepcja paradygmatu współczesnego kodera obrazów.
W ostatnich 3 dekadach nastąpił gwałtowny rozwój systemów obrazowania medycznego oraz
nowoczesnych urządzeń akwizycji, przetwarzania i archiwizacji obrazów medycznych.
Systemy RIS (radiologiczne systemy informacyjne) i PACS (systemy archiwizacji i transmisji
obrazów) włączone w szpitalne systemy informatyczne (HIS), a takŜe systemy
teleradiologiczne, referencyjne bazy badań obrazowych tworzone przez wiele ośrodków to
główne, choć nie jedyne obszary zastosowań współczesnych technologii kompresji obrazowej
informacji medycznej. Tak wysokie tempo rozwoju pociąga za sobą gwałtowny wzrost ilości
wykorzystywanej informacji obrazowej [2]. Łatwo dostrzec towarzyszące temu wyzwania:
konieczność sprawnej archiwizacji z minimalizacją kosztów składowania obrazów, krótkim
czasem dostępu i moŜliwością szybkiego przeszukiwania, potrzeba selektywnej transmisji
strumienia danych obrazowych w czasie rzeczywistym, opisu treści diagnostycznej z
określeniem regionów zainteresowań (ROI). To właśnie w tym kontekście zagadnienie
kompresji medycznych danych obrazowych nabiera szczególnego, bardziej uniwersalnego
znaczenia. Nie jest to tylko problem zmniejszenia rozmiaru gromadzonych zbiorów danych,
ale przede wszystkim sztuka tworzenia nowej, uporządkowanej hierarchicznie i treściowo
(semantycznie), uŜytecznej dla elastycznie definiowanego odbiorcy reprezentacji
rejestrowanych, a następnie interpretowanych informacji.
Obrazowa informacja medyczna powinna być tak reprezentowana, aby przy znaczącej
objętości danych (np. 4 obrazowe badanie mammograficzne to blisko 160 megabajtów
danych) następowało selektywne, progresywne uporządkowanie treści diagnostycznych od
cech najbardziej istotnych, gwarantujących moŜliwie duŜy przyrost diagnostycznie uŜytecznej
informacji na bit tworzonej reprezentacji, poprzez inne cechy mające znaczenie w
interpretacji obrazów danej modalności, aŜ po właściwości obrazów, które są nieistotne w
diagnozie. Prowadzi to do koncepcji progresji wiarygodności diagnostycznej realizowanej w
algorytmach kompresji danych obrazowych, która stanowi główny cel naszych badań.
1.1. Progresja wiarygodności
Progresja wiarygodności diagnostycznej polega więc na takim uporządkowaniu danych
obrazowych, by kolejne bajty tworzonej reprezentacji powodowały monotoniczne malejący
przyrost (przyrost ten powinien być szczególnie duŜy w pierwszych pakietach reprezentacji
kodowej) wartości diagnostycznej rekonstruowanego obrazu. Progresywna rekonstrukcja
pozwala uzyskać w pierwszej kolejności moŜliwie bogatą, całościową informację
diagnostyczną zawartą w obrazie oraz ogólny zarys struktur i podstawową charakterystykę
obrazu. Kontynuacja procesu rekonstrukcji daje stopniowe uszczegółowienie prezentowanych
treści. Gwałtowny przyrost jakości diagnostycznej obrazu w pierwszej fazie rekonstrukcji
oraz wyeksponowanie (ekstrakcja) szczególnie istotnych diagnostycznie cech pozwoli np.
przyspieszyć, a niekiedy wręcz umoŜliwi telediagnostykę czy telekonsultacje radiologiczne w
czasie rzeczywistym.
Szczególnie przydatnym schematem kompresji obrazów, umoŜliwiającym realizację
progresji wiarygodności diagnostycznej, jest koder z elastycznym algorytmem porządkowania
informacji w hierarchicznej dziedzinie falkowej wielu rozdzielczości i warstw. Rozwiązanie
takie zostało zaproponowane w ramach standardu JPEG2000 dopuszczonego jako narzędzie
kompresji w ramach zbioru standardów zarządzania informacją obrazową w medycynie
DICOM (ang. digital imaging and communications in medicine).
Praca niniejsza dotyczy zagadnienia efektywnej kompresji obrazów medycznych z
wykorzystaniem wielorozdzielczych metod przekształcania i porządkowania danych według
standardu JPEG2000. Badania koncentrowały się przede wszystkim na modyfikacji
optymalizacji R-D (stopnia zniekształceń źródeł informacji, ang. rate distortion theory)
stosowanej w standardzie JPEG2000, czyli na zaproponowaniu innej miary zniekształceń D w
metodzie PCRD (ang. post compression rate distortion) zaczerpniętej z algorytmu kompresji
EBCOT (ang. Embedded Block Coding with Optimized Truncation) [3]. Celem jest uzyskanie
progresji wiarygodności diagnostycznej w ramach własnej implementacji kodera obrazów
JPEG2000 do wspomnianych zastosowań medycznej informatyki obrazowej.
1.2. Standard JPEG2000
Standard ten dotyczy metod efektywnej kompresji obrazów w róŜnorako definiowanych
okolicznościach. Bazując na nowym paradygmacie kompresji wykorzystano wielorozdzielczą
dekompozycję obrazów do utworzenia hierarchii kodowanej informacji, upakowania istotnej
treści obrazowej w określonych fragmentach przestrzeni obrazu, progresji reprezentacji
danych, porządkowania według przyjętej teorii R-D oraz optymalnej selekcji treści przy
określonym stopniu kompresji [4]. Pozwala to na elastyczne dopasowanie procesu
kompresji/dekompresji zarówno do charakteru danych źródłowych, jak teŜ do oczekiwań
odbiorcy kodowanej informacji. Obok podstawowego schematu kompresji (część I) zawarto
szereg wskazówek i sugestii zwiększenia jego efektywności (część II). MoŜliwa jest takŜe
kompresja czasowej sekwencji obrazów (część III) lub zbioru przestrzennych warstw
obrazowych (część X). Aspekt ochrony danych (część VIII) uzupełniony jest moŜliwością
przystosowania kodowanego strumienia do zastosowań teletransmisji (część IX i XI) oraz
zintegrowanych środowisk multimedialnych (część XII).
Niemal nieograniczone pole manewru dookreślenia procedury kompresji i
rekonstrukcji obrazu zakłada w klasycznym podejściu wykorzystanie metody PCRD jako
koniecznego fundamentu procesu porządkowania informacji, który zapewni wysoką
efektywność w kaŜdej aplikacji. Zastosowana teoria zniekształceń źródeł informacji zakłada
w referencyjnych implementacjach błąd średniokwadratowy (MSE) jako miarę zniekształceń
źródeł. Proponowaną realizacją koncepcji progresji wiarygodności jest wprowadzenie innej
miary zniekształceń, która znacznie lepiej niŜ błąd średniokwadratowy koreluje z
wiarygodnością diagnostyczna kompresowanych obrazów.
2. METODA
Podjęto próbę realizacji progresji wiarygodności obrazów medycznych w procesie kompresji i
rekonstrukcji poprzez modyfikację metody PCRD wykorzystywanej w JPEG2000.
Zaimplementowano inne niŜ MSE miary zniekształceń testując moŜliwość poprawy wartości
diagnostycznej obrazów rekonstruowanych z pierwszych pakietów strumienia JPEG2000.
2.1. Teoria zniekształceń źródeł informacji
W przypadku kompresji stratnej istotną rolę odgrywa wzajemna zaleŜność pomiędzy
uzyskiwaną średnią bitową a poziomem zniekształceń wnoszonym na skutek redukcji
informacji nadmiarowej (przedmiot teorii R-D). Pozwala ona wyznaczyć graniczną wartość
stopnia kompresji, który moŜliwy jest do uzyskania przy określonym poziomie zniekształceń.
Jednym ze sposobów definiowania zaleŜności pomiędzy długością reprezentacji kodowej a
poziomem zniekształcenia źródła informacji jest funkcja stopnia zniekształceń D(R) (ang.
rate distortion function). Miara zniekształcenia D powinna określić, na ile uŜyteczną
aproksymacją oryginału jest rekonstrukcja (według ustalonej reguły) reprezentacji kodowej
określonej długości. Im mniejszy poziom zniekształceń, tym lepszy poziom aproksymacji.
Przykłady funkcji stopnia zniekształceń pokazano na Rys. 2. Funkcja D(R) jest nieujemna,
monotonicznie malejąca, wypukła i określa zbiór optymalnych rozwiązań przy poszukiwaniu
najmniejszej moŜliwej średniej bitowej dla określonego poziomu zniekształceń
(optymalizacja z ograniczeniem) lub teŜ minimalnego poziomu zniekształceń dla załoŜonej
średniej bitowej.
Rys. 2. Przykłady optymalizacji kodera poprzez minimalizację zniekształceń przy określonej długości
skompresowanych danych (średnia bitowa R). Miara zniekształceń D powinna odzwierciedlać
uŜyteczność rekonstruowanej informacji (zgodnie z kryteriami stosowanymi przez odbiorcę).
2.2.Progresja jakości
Zarówno w procesie transmisji danych, jak i w przypadku kompresji, istotną rolę odgrywa
moŜliwość przekazywania informacji w formie progresywnej, czyli mówiąc inaczej według
ustalonego porządku - od postaci zgrubnej do szczegółowej. Progresja jakości umoŜliwia
bardzo szybką identyfikację ogólnej treści informacji poprzez optymalny, maksymalnie duŜy
przyrost jakości rekonstrukcji w początkowej fazie kodowania. Kryterium jakości stanowi w
tym przypadku wykorzystana miara zniekształceń informacji w procesie kompresji stratnej (z
selekcją informacji). Jakościowe uporządkowanie informacji przedstawiono na Rys. 3.
Rys. 3. Progresja jakości mammogramu (ROI) z widocznymi mikrozwapnieniami za pomocą kodera
JPEG2000. Stopniowe uszczegóławianie obrazu następuje wraz przyrostem średniej bitowej poprzez
sukcesywną rekonstrukcję obrazu na podstawie skompresowanej reprezentacji o długości:
a) 0,01 bpp; b) 0,02 bpp; c) 0,1 bpp; d) 0,5 bpp.
Widać wyraźnie, Ŝe juŜ w pierwszej fazie rekonstrukcji, przy małej średniej bitowej 0,01 bpp
(bita na piksel), uwidaczniają się jedynie pierwsze zarysy istotnych diagnostycznie
szczegółów – największych mikrozwapnień ze skupiska w centralnej części fragmentu
obrazu. Przy średniej bitowej 0,02 bpp widoczna jest juŜ znacząca część skupiska, choć
mikrozwapnienia są rozmyte i niewyraźne. W kolejnych etapach rekonstrukcji wraz ze
wzrostem średniej bitowej i napływem informacji szczegółowej mikrozwapnienia te są
stopniowo wyostrzane, uzyskując zadawalającą jakość na poziomie średniej 0,5 bpp.
Progresja jakości polega tutaj na optymalizacji informacji w osadzanym strumieniu
danych w sensie R-D, gdzie na kaŜdym kolejnym etapie osadzania poszukuje się najlepszej
jakości rekonstrukcji istotnych cech obrazu (zobacz Rys. 4). Ogólnie obowiązuje zasada, iŜ
porządek kodowania poszczególnych elementów, na jakie dzieli się kodowany strumień
(podbloki określone punktami odcięcia), wynika ze wstępnie oszacowanej efektywności
kodowania kaŜdego z nich: od symboli o największym nachyleniu D(R) do symboli o
nachyleniu najmniejszym [4].
Rys. 4. Optymalizacja R-D kodera: a) elementy przeznaczone do zakodowania (koszt kodowania
reprezentowany jest przez wielkość nachylenia krzywej R-D); b) optymalna kolejność kodowania
dająca kolejno największy przyrost informacji na transmitowaną daną;
c) efekt optymalnej kolejności kodowania przedstawiony na płaszczyźnie R-D.
W procesie stratnej kompresji kaŜdy z podbloków cechuje się określonym wpływem na
poziom zniekształceń oraz długością powodującą przyrost wielkości strumienia kodowego.
Wzajemna relacja pomiędzy tymi wielkościami określa nachylenie krzywej R-D, która
determinuje koszt kodowania (symboliczne nachylenie krzywych na Rys. 4). Kodowane są
kolejne elementy, począwszy od największego nachylenia krzywej R-D do nachylenia
najmniejszego. Wskazana kolejność pozwala juŜ przy transmisji niewielkiej liczby bitów
strumienia kodowego uzyskać gwałtowny przyrost informacji w sensie jakościowym,
określony przez wykorzystaną w procesie optymalizacji miarę zniekształceń D. Praktyczna
realizacja idei tworzenia osadzonego strumienia kodowego, optymalnego w sensie R-D przy
jednoczesnej kontroli jego długości, sprowadza się do stworzenia inteligentnego,
wielopoziomowego sposobu konstrukcji tego strumienia. Konieczne jest bowiem ustalenie
kosztu moŜliwie efektywnego kodowania poszczególnych, moŜliwie drobnych porcji
informacji w skali całego obrazu, a następnie określenie porządku kodowania tych porcji
zgodnie z teorią optymalizacji R-D.
Według PCRD, po zakodowaniu całego zbioru współczynników falkowych i
uzyskaniu strumienia kodowego wyznaczane są optymalne krzywe R-D dla wszystkich
bloków kodowych. Powstaje dwupoziomowa struktura procesu kompresji: wstępne,
osadzające kodowanie danych bloku kodowego w sposób niezaleŜny oraz finalne ustalenie
rzeczywistego wkładu bloku (poszczególnych podbloków w poszczególnych warstwach
jakości) do kolejnych poziomów jakości, w ustalanym porządku formowania wyjściowego
strumienia kodowego. Podbloki o największym nachyleniu krzywej znajdą się w pierwszych
pakietach zapisu warstw najbardziej znaczących map bitowych wartości współczynników
falkowych.
2.3. Progresja wiarygodności
Klasa obrazów medycznych stanowi jedną z bardziej wymagających klas obrazów. Wysokie
wymagania odnoszą się w szczególności do zachowania wierności rekonstrukcji przy
zachowaniu istotnych diagnostycznie szczegółów obrazu. NaleŜy pamiętać, Ŝe niekiedy
istotnymi okazują są bardzo niewielkie lub słabo widoczne elementy, które są wyznacznikiem
obecności patologii. Warunkiem koniecznym, a zarazem nadrzędnym, staje się zatem
zapewnienie wiarygodności diagnostycznej rekonstruowanego obrazu w określonych
zastosowaniem warunkach przepustowości, dostępności, istniejących ograniczeń wartości
średniej bitowej itp.
Progresja jakości zakłada maksymalnie duŜy przyrost jakości rekonstrukcji, określonej
ustaloną miarą zniekształceń, juŜ przy odczycie i przetworzeniu początkowej, niewielkiej
części strumienia kodowego. Chcąc związać proces rekonstrukcji z wiarygodnością
diagnostyczną przetwarzanych obrazów konieczne jest zastąpienie naturalnie rozumianej
jakości poŜądaną przez nas wiarygodnością, określaną często poprzez cechy mające bardzo
niewiele wspólnego z klasycznymi kanonami jakości obrazu. Istota koncepcji progresji
wiarygodności sprowadza się zatem do poszukiwania najbardziej wiarygodnej, obliczeniowej
miary diagnostycznej, która w sposób optymalny zapewniałaby selekcję i uwydatnianie
informacji diagnostycznej. Miara ta powinna być wykorzystana w procesie optymalizacji R-D
strumienia kodowego, co pozwoliłoby na uporządkowanie informacji obrazowej zgodnie z
ich znaczeniem w procesie interpretacji diagnostycznej. Schematycznie ideę progresji
wiarygodności pokazano na Rys. 5, analogicznym do klasycznej optymalizacji według R-D z
Rys. 4.
Rys. 5. Optymalizacja R-D kodera dla dwóch miar zniekształcenia: MSE (kolor czerwony, linia ciągła)
oraz MWD (kolor zielony, linia przerywana); a) elementy przeznaczone do zakodowania (koszt
kodowania reprezentowany jest przez wielkość nachylenia krzywej R-D); b) optymalna kolejność
kodowania dająca największy przyrost informacji na transmitowaną daną; c) efekt optymalnej
kolejności kodowania z przedstawiony na płaszczyźnie R-D
W realizacji progresji jakości według JPEG2000 do określenia wielkości zniekształceń
wykorzystano MSE, który okazuje się niewystarczający w odniesieniu do skomplikowanej
semantyki obrazów medycznych. Poszukiwano więc innej, lepszej miary zniekształceń jako
odpowiadającej w większym stopniu rzeczywistej wartości diagnostycznej kompresowanych i
rekonstruowanych obrazów. Zastosowanie innej miary D w procesie optymalizacji R-D
strumienia kodowego skutkuje innym kosztem kodowania poszczególnych fragmentów, co
pokazano na Rys. 5. Proces optymalizacji R-D spowoduje wtedy zmianę kolejności
kodowania bloków (patrz Rys. 5b) optymalizując strumień kodowy według malejącej
wartości diagnostycznej. Jeśli wykorzystana przez nas numeryczna miara wiarygodności
diagnostycznej (MWD) będzie dobrze korelować z istotną informacją diagnostyczną, to
uzyskamy progresywną rekonstrukcję wiarygodności diagnostycznej z maksymalnym
przyrostem eksponowanej treści diagnostycznej w początkowych pakietach strumienia (przy
niewielkich wartościach średniej bitowej). Otrzymamy bardziej reprezentatywną
diagnostycznie postać zdekompresowanych obrazów.
2.4. Miara wiarygodności
Postanowiono wykorzystać własne doświadczenia z numerycznymi miarami wiarygodności
diagnostycznej mammogramów [5] jako przykładowego zastosowania kompresji JPEG2000 z
progresją wiarygodności. Efektywnej MWD naleŜy szukać w kategorii metod wektorowych
ze skalarnym ekwiwalentem, uwzględniającym róŜnorodność zniekształceń powstających w
procesie kompresji stratnej. NaleŜało rozwiązać dwa zasadnicze problemy: implementacji
nowych miar zniekształceń w referencyjnym oprogramowaniu tego standardu,
uwzględniających takŜe cechy lokalne obrazów o istotnym znaczeniu diagnostycznym, oraz
dobór samej miary diagnostycznej, która dałaby duŜą wiarygodność numerycznej oceny treści
istotnej w interpretacji i opisie badań.
3. REALIZACJA KONCEPJI I EKSPERYMENTY
Do implementacji poszukiwanych miar diagnostycznych wykorzystano bibliotekę Jasper [67] w wersji 1.701.0, będącą referencyjną implementacją standardu JPEG2000 [8] opisaną w
części V [9]. UŜyto obrazów mammograficznych w formacie PGX z 12 bitową głębią.
W początkowej części prac postanowiono zamienić wykorzystywaną standardowo w PCRD
miarę MSE na inną prostą miarę obliczeniową, by ocenić moŜliwości implementacji nowej
miary zniekształceń na bazie Jasper oraz obserwować wpływ tej miary na porządkowanie
informacji w strumieniu kodowym. Do eksperymentu wykorzystano miarę średniej róŜnicy
AD (ang. average difference), zdefiniowaną zaleŜnością:
AD =
1
MN
∑
~
f (m, n) − f (m, n)
(1)
m,n
~
gdzie f (m, n) oraz f (m, n) to wartości pikseli odpowiednio obrazu źródłowego i
rekonstruowanego w (m, n) , a M i N określają rozmiary obrazu.
Kompresji (z róŜnym współczynnikiem kompresji z zakresu od 2 do 1000) poddano
szereg obrazów mammograficznych z referencyjnej bazy DDSM (Digital Database for
Screening Mammography, http://marathon.csee.usf.edu/Mammography/Database.html) oraz
własnych. Otrzymane rezultaty porównano z obrazem oryginalnym wykorzystując szczytowy
stosunek sygnału do szumu PSNR (ang. peak signal to noise ratio) jako miarę jakości
kompresji (tj. jakości obrazów rekonstruowanych przy danym stopniu kompresji), ze względu
na popularność PSNR w pracach dotyczących kompresji stratnej. PoniewaŜ
4095 2
PSNR = 10 log
odzwierciedla w sposób jednoznaczny błąd średniokwadratowy,
MSE
wiadomo, Ŝe PCDR optymalizowane według MSE daje największe wartości PSNR
rekonstrukcji obrazu – warto jednak zwrócić uwagę, jak w sensie tej globalnej miary jakości
róŜni się strumień kodowy, tworzony za pomocą PCRD sterowanej inną miarą zniekształceń.
Wyniki eksperymentu dla dwóch reprezentatywnych mammogramów: mammo1 oraz
mammo2 przedstawiono w Tab. 1. Otrzymane rezultaty wskazują, Ŝe wykorzystanie AD jako
miary zniekształceń D daje zbliŜone rezultaty jakości kompresji (PSNR), jak w przypadku
standardowego błędu średniokwadratowego. Maksymalna róŜnica sięga 3 dB przy małych
stopniach kompresji (w zasadzie przy wizualnej bezstratności procesu kompresji), zaś przy
silniejszej kompresji najwyŜej 0,5 dB. Jednak według subiektywnej oceny rekonstruowanych
obrazów jakość jest gorsza dla miary AD – daje się zauwaŜyć silniejszy efekt rozmycia
struktur, które mają istotne znaczenie diagnostyczne. Szczegóły istotne w interpretacji
mammogramów (mikrozwapnienia, zarys guzów oraz struktury piersi) uległy większej
degradacji, a więc wartość diagnostyczna obrazów uległa zmniejszeniu (zobacz Rys. 6).
Tab. 1 Wyniki oceny efektywności kompresji przy dwóch róŜnych miarach zniekształceń (MSE oraz
AD) wykorzystanych w algorytmie PCRD.
mammo1
PSNR[dB]
MSE
AD
68,63
68,40
58,16
55,19
54,40
53,39
50,06
49,41
48,00
47,41
46,09
45,67
43,94
43,37
41,55
41,00
CR[:1]
2
10
20
50
100
200
500
1000
a)
b)
mammo2
PSNR[dB]
MSE
AD
70,36
70,21
55,76
53,94
51,45
50,39
47,81
47,23
45,99
45,64
44,66
44,28
43,14
42,63
41,53
41,02
c)
Rys. 6. Porównanie efektywności kompresji z wykorzystywaniem róŜnych miar zniekształceń w PCRD:
a) źródłowy fragment mammo2; b) obraz po kompresji 1000:1 z wykorzystaniem klasycznej PCRDMSE; c) obraz po kompresji 1000:1 z wykorzystaniem PCRD-AD.
Na podstawie obserwacji moŜna stwierdzić, Ŝe miara AD gorzej sprawdza się w realizacji
koncepcji progresji wiarygodności, a porządek ustawiania podbloków według malejącej
wartości przyrostu MSE, średnio na bit reprezentacji kodowej, lepiej eksponuje treść
diagnostyczną obrazów mammograficznych. Wstępna część badań pozwoliła potwierdzić
istotną rolę miary zniekształceń wykorzystywanej w realizacji progresji jakości strumienia
kodowego według PCRD. Dała takŜe szereg wskazówek implementacyjnych, które
potwierdziły moŜliwość modyfikacji algorytmu PCRD zmieniającej miarę zniekształceń D.
Niebyt pomyślne rezultaty, które uzyskano dla miary AD, a takŜe doświadczenia
własne sugerują wykorzystanie wektorowej miary wiarygodności z liniową kombinacją kilku
miar opisujących zniekształcenia lokalne i globalne o zróŜnicowanym charakterze. Skuteczne
opisanie diagnostycznej wiarygodności rekonstrukcji winno uwzględnić zarówno jakość
odtworzenia drobnych, ale istotnych diagnostycznie cech (np. percepcję skupisk
mikrozwapnień), jak i ocenę globalnych właściwości obrazu (czułość kontrastu, tekstura
utkania sutka, zarysy duŜych struktur). MWD powinna łączyć ocenę klarowności interpretacji
zmian w obrazie (pozostającą w sferze subiektywnych ocen psychowizualnych), wskaźniki
obiektywne obliczeniowo, które silnie korelują z wykrywalnością zmian, jak i ogólne cechy
ludzkiego systemu widzenia (HVS) i postrzegania. Jednocześnie MWD winna być podatna na
implementację w standardowej PCRD.
Sugestia jest więc następująca. Rozpięta w przestrzeni kilku cech skalarnych MWD z
redukcją wymiaru do skalarnego ekwiwalentu wiarygodności determinuje poziom
zniekształceń wykorzystywany w optymalizacji PCRD, co powinno zapewnić większą
korelację realizowanej progresji ze stopniową rekonstrukcją w pierwszej kolejności
najbardziej istotnych diagnostycznie treści obrazowych uzupełnianych informacją dodatkową.
MoŜna więc w tym przypadku mówić o progresji wiarygodności.
Opracowanie numerycznej MWD jest zadaniem bardzo trudnym, bo wymaga
obiektywizacji opisu medycznej diagnozy, ustandaryzowania stosowanych kryteriów oceny,
jak teŜ opracowania sprzęgu pomiędzy definiowanymi innym językiem cechami
diagnostycznymi a cechami obliczeniowymi (inŜynierskimi). Uzyskanie we wcześniejszych
badaniach wysokiego poziomu korelacji pomiędzy implementacją numerycznej miary
wiarygodności a subiektywną interpretacją badań mammograficznych przez specjalistówradiologów na duŜej grupie obrazów testowych [5] pozwoliło jednak zaproponować
rozwiązanie, które na tym etapie badań moŜe potwierdzić słuszność badanej koncepcji
progresji wiarygodności realizowanej w ramach standardu JPEG2000. Wybrano uproszczoną
wersję obliczeniowej miary wiarygodności z [5], łatwą do implementacji w Jasper (bez
znaczących nakładów obliczeniowych).
Badano postać MWD opisaną skalarnym ekwiwalentem postaci:
4
MWD = ∑ α iVi
(2)
i =1
gdzie poszczególne Vi zdefiniowano następująco:
V1 = MSE =
~
1
MN
∑ [ f (m, n) − f (m, n)]
2
(3)
m,n
~
V2 = MD = max f (m, n) − f (m, n)
m,n
(4)
gdzie MD – maksymalna róŜnica (ang. maximum difference),
~
f (m, n) − f (m, n)
(5)
~
10
[ f (m, n) − f (m, n)]2
V4 = 10 ⋅ χ =
∑
MN m , n
f (m, n)
(6)
V3 = AD =
2
1
MN
∑
m,n
gdzie χ 2 – miara chi – kwadrat (ang. chi-square measure).
Wartości współczynników α i powinny być ustalone z uŜyciem wzorca
diagnostycznego, zapewniając maksymalny poziom korelacji wskazań numerycznych
(skalarnego ekwiwalentu) z ocenami radiologów. Wymaga to przeprowadzenia testów z
udziałem kilku radiologów, najlepiej z róŜnych ośrodków, na reprezentatywnym zbiorze
obrazów, najlepiej w warunkach klinicznych. Takie eksperymenty planowane są po
optymalizacji metod implementacji koncepcji progresji wiarygodności, jako finalna
weryfikacja kodera JPEG2000 uŜytecznego w archiwizacji i transmisji medycznych badań
obrazowych. We wstępnych eksperymentach wartości wszystkich α i ustawiono na 1.
Przykładowe rezultaty kompresji obrazów mammo1 oraz mammo2 pokazano na Rys. 7 i 8.
Rys. 7. Efekty kompresji mammo1: a) obraz oryginalny; b) po kompresji 1000:1 według
PCDR-MSE; c) obraz oryginalny z zaznaczonymi szczegółami istotnymi diagnostycznie; d) po
kompresji 1000:1 według PCRD-MWD.
Rys. 8. Efekty kompresji mammo2: a) obraz oryginalny; b) po kompresji 1000:1 według PCDR-MSE;
c) obraz oryginalny z zaznaczonymi szczegółami istotnymi diagnostycznie; d) po kompresji 1000:1
według PCRD-MWD.
Zaobserwowano szczególnie korzystny efekt poprawy wartości diagnostycznej obrazów przy
duŜych stopniach kompresji (po rekonstrukcji pierwszych pakietów skompresowanej
reprezentacji). W obrazach rekonstruowanych przy stopniu kompresji 1000:1 porządkowanie
treści diagnostycznej według zaproponowanej PCRD-MWD lepiej eksponuje informacje
istotne w diagnozie. W przypadku obrazu mammo1 (Rys. 7a) obszar guza (zaznaczony duŜym
owalnym kształtem – Rys. 7c) jest lepiej rozróŜnialny dla MWD niŜ MSE. Obecność
mikrozwapnień jest niewidoczna w obu przypadkach (zbyt duŜa wartość stopnia kompresji –
ta treść zostanie dodana na kolejnym etapie rekonstrukcji). Dla obrazu mammo2 (Rys. 8a)
skupisko mikrozwapnień (zaznaczone okręgiem w centralnej części obrazu – Rys. 8c) oraz
fragmenty włókien (zaznaczone podłuŜną elipsą w prawej części fragmentu obrazu) są
równieŜ lepiej uwidocznione dla PCRD-MWD. Omówione powyŜej przykładowe obrazy
poddano subiektywnej ocenie specjalisty – radiologa z Zakładu Diagnostyki Obrazowej
Szpitala Wolskiego w Warszawie, która potwierdził wyraźnie lepszą wartość diagnostyczną
obrazów rekonstruowanych w początkowej fazie procesu dekodowania strumienia kodowego
z wykorzystaniem algorytmu PCRD-MWD, w porównaniu ze standardową implementacją
JPEG2000 wykorzystującą PCRD-MSE.
4. KONKLUZJE
Przedmiot prowadzonych badań obejmuje optymalizację kompresji obrazów z selekcją
informacji poprzez wykorzystanie charakterystyki semantycznej (analizę treści)
przetwarzanych obrazów. Tematyka ta wpisuje się w kilka bardzo aktualnych nurtów badań
prowadzonych w wielu ośrodkach na świecie: technologii semantycznych (z analizą treści),
poprawy charakterystyki obserwatora-odbiorcy informacji, obiektywizacji opisu treści
diagnostycznych w ramach intensywnie rozwijanej medycyny opartej na faktach, wreszcie
doskonalenia standardu JPEG2000.
Zaproponowano zupełnie nowe podejście do semantycznej optymalizacji strumienia
JPEG2000. Znane dotąd metody dotyczą przede wszystkim modyfikacji rozkładu wartości
współczynników falkowych poprzez wprowadzanie odpowiednich wag, uwzględniających
percepcyjne (ewentualnie semantyczne) zdolności obserwatora (jak chociaŜby w ostatnio
publikowanej pracy [10]). Przedstawione tutaj rozwiązanie dotyczy modyfikacji stosowanej
dotąd teorii kodowania z progresją, optymalizowaną według teorii R-D, poprzez zastosowanie
nowej miary zniekształceń, lepiej opisującej treść obrazu, uwzględniającej znacznie bardziej
zaawansowaną charakterystykę odbiorcy. PoniewaŜ wybrane zastosowanie dotyczy kompresji
obrazów medycznych, ta charakterystyka jest szczególnie istotna i jednocześnie trudna.
Wykorzystując doświadczenia zespołu w przetwarzaniu, analizie i rozumieniu
obrazów mammograficznych, a takŜe wcześniejsze badania nad konstruowaniem miary
jakości diagnostycznej mammogramów, zaproponowano koncepcję progresji wiarygodności
obrazów medycznych z przykładową realizacją do zastosowań mammografii cyfrowej.
Szczególnie cenne wydaje się wykorzystanie opracowanej metody kompresji w systemach
teleradiologii (http://telemedycyna.evernet.com.pl/system/).
Przedstawiony sposób porządkowania treści diagnostycznej w ramach rozwiązań
standardu JPEG2000 stanowi praktyczną implementację koncepcji ekstrakcji
najistotniejszych treści diagnostycznych, które umieszczone na początku strumienia
kodowego przyspieszają analizę obrazów, umoŜliwiają indeksowanie po zawartości i
wyszukiwanie treści diagnostycznych, usprawniają działanie systemów wspomagania
diagnostyki CAD i obiektywizują gromadzoną informację obrazową.
Progresja wiarygodności powoduje monotonicznie malejący przyrost wartości
diagnostycznej rekonstruowanego obrazu, co sprowadza się do uzyskania w pierwszej
kolejności moŜliwie obfitej treści o największym znaczeniu dla uŜytkownika, stopniowo
uszczegóławianej w kolejnych etapach rekonstrukcji. Otrzymane wstępne wyniki
eksperymentów potwierdzają słuszność zaprezentowanych koncepcji. Kolejne badania będą
dotyczyć optymalizacji miary wiarygodności diagnostycznej i sposobów jej implementacji w
koderach JPEG2000. Jak wspomniano, planowane są testy weryfikacyjne z detekcją patologii
w warunkach klinicznych oraz w ramach telekonsultacji, które potwierdzą przydatność
opracowanych narzędzi kompresji na znaczącej liczbie badań mammograficznych, z
moŜliwością rozszerzenia koncepcji progresji wiarygodności na obrazy innych modalności.
LITERATURA
[1] Przelaskowski A., „Metody kompresji obrazów: uwarunkowania dalszego rozwoju”,
Przegląd telekomunikacyjny, 10:374-381, 2005
[2] Przelaskowski A., „Kompresja danych: podstawy, metody bezstratne, kodery obrazów”,
Wydawnictwo BTC, 2005
[3] Taubman D., „High performance scalable image compression with EBCOT”, IEEE Trans
Image Proc 9(7):1158-1170, 2000
[4] Przelaskowski A., „Falkowe metody kompresji danych obrazowych”, Oficyna
Wydawnicza PW, 2002
[5] Przelaskowski A., „Vector quality measure of lossy compressed medical image”, Comp
Biol Med, 34(3):193-207, 2004
[6] Adams M.D., „JasPer software reference manual (Version 1.700.0)” ISO/IEC. JTC 1/SC
29/WG 1 N 2415, Feb. 2003
[7] Adams M.D., Kossenini F., “JasPer: a software-based JPEG-2000 codec implementation”,
Proc IEEE ICIP, Vancouver, BC, Canada, 2:53-56, 2001.
[8] ISO/IEC 15444-1, "Information technology – JPEG 2000 image coding system – Part 1:
Core coding system," ISO/IEC JTC 1/SC 29/WG1, Jan. 2001
[9] ISO/IEC 15444-5, "Information technology – JPEG 2000 image coding system – Part 5:
Reference software," ISO/IEC JTC 1/SC 29/WG1, Dec. 2001
[10] Liu Z., Karam L.J., Watson A.B, „JPEG2000 encoding with perceptual distortion
control”, IEEE Trans Image Proc 15(7):1763-78, 2006