porządkowanie informacji diagnostycznej w kompresowanych
Transkrypt
porządkowanie informacji diagnostycznej w kompresowanych
PORZĄDKOWANIE INFORMACJI DIAGNOSTYCZNEJ W KOMPRESOWANYCH OBRAZACH MEDYCZNYCH: PROGRESJA WIARYGODNOŚCI Artur Przelaskowski, Rafał Jóźwiak, Tomasz KrzyŜewski, Anna Wróblewska Instytut Radioelektroniki Politechniki Warszawskiej, ul. Nowowiejska 15/19, 00-665 Warszawa, [email protected] Streszczenie: Przedstawiono koncepcję progresji wiarygodności diagnostycznej obrazów medycznych realizowanej za pomocą kodera JPEG2000 ze zmodyfikowanym algorytmem PCRD. Błąd średniokwadratowy jako miarę zniekształceń zastąpiono numeryczną miarą wiarygodności diagnostycznej uzyskując większy przyrost treści istotnej diagnostycznie przy rekonstrukcji początkowych pakietów strumienia kodowego. Realizację tej koncepcji weryfikowano na badaniach mammograficznych z udziałem radiologa. 1. WPROWADZENIE Zagadnienie kompresji danych w ogólnym przypadku sprowadza się do wyznaczenia nowej, efektywnej reprezentacji danych poprzez usuwanie róŜnego typu nadmiarowości opisu, redukcję zaleŜności w hierarchicznej strukturze danych, ustalenie uŜytecznej postaci informacji oraz jej upakowanie (koncentracja) w niewielkim obszarze przestrzeni opisu, określenie reguły selekcji informacji oraz tworzenia oszczędnej, binarnej formy opisu etc. Współcześnie stajemy się częścią globalnego społeczeństwa informacyjnego, dynamicznie rozwijającego się w trwającej obecnie „erze informacji” [1]. Wyzwala ona nowe moŜliwości, ale niesie równieŜ ze sobą zagroŜenia i trudności. Obserwujemy nieustanną, szybką wymianę duŜej liczby potoków danych, które wręcz bombardują nas kaŜdego dnia wywołując zmęczenie nadmiarem przekazu oraz trudność percepcji tego, co jest najbardziej istotne. Systemy telekomunikacyjne, rozległe sieci, e-biznes, e-urząd, elektroniczna wymiana dokumentów, rozwój Internetu, telemedycyna – tak dynamiczny rozwój nowoczesnych technologii okupiony jest znacznym wzrostem oczekiwań wobec nowoczesnych metod kompresji. Poszukiwane stają się rozwiązania, w których kompresja nabiera szerszego, bardziej uniwersalnego znaczenia, rozumianego jako proces tworzenia selektywnej, upakowanej, wygodnej w odbiorze i manipulacji reprezentacji informacji przesyłanej, gromadzonej czy przeglądanej. Uwzględniając wysokie wymogi współczesnych systemów obrazowania, ich róŜnorodność, mnogość stosowanych rozwiązań, współczesny koder obrazu powinien wyróŜniać się takimi cechami jak progresywność strumienia kodowego (stopniowe przekazywanie informacji w schemacie od ogółu do szczegółu, z malejącym przyrostem informacji), osadzalność (hierarchiczna struktura danych wykorzystana w procesie nakładania kolejnych warstw reprezentacji kodowej), skalowalność (wersje o róŜnej rozdzielczości i jakości), działanie na wybranym obszarze zainteresowania (ROI), moŜliwość uzyskania kompresji stratnej (tj. z selekcją informacji)-do-bezstratnej itd. Koncepcję paradygmatu współczesnego kodera obrazów przedstawiono schematycznie na Rys1. Rys. 1. Koncepcja paradygmatu współczesnego kodera obrazów. W ostatnich 3 dekadach nastąpił gwałtowny rozwój systemów obrazowania medycznego oraz nowoczesnych urządzeń akwizycji, przetwarzania i archiwizacji obrazów medycznych. Systemy RIS (radiologiczne systemy informacyjne) i PACS (systemy archiwizacji i transmisji obrazów) włączone w szpitalne systemy informatyczne (HIS), a takŜe systemy teleradiologiczne, referencyjne bazy badań obrazowych tworzone przez wiele ośrodków to główne, choć nie jedyne obszary zastosowań współczesnych technologii kompresji obrazowej informacji medycznej. Tak wysokie tempo rozwoju pociąga za sobą gwałtowny wzrost ilości wykorzystywanej informacji obrazowej [2]. Łatwo dostrzec towarzyszące temu wyzwania: konieczność sprawnej archiwizacji z minimalizacją kosztów składowania obrazów, krótkim czasem dostępu i moŜliwością szybkiego przeszukiwania, potrzeba selektywnej transmisji strumienia danych obrazowych w czasie rzeczywistym, opisu treści diagnostycznej z określeniem regionów zainteresowań (ROI). To właśnie w tym kontekście zagadnienie kompresji medycznych danych obrazowych nabiera szczególnego, bardziej uniwersalnego znaczenia. Nie jest to tylko problem zmniejszenia rozmiaru gromadzonych zbiorów danych, ale przede wszystkim sztuka tworzenia nowej, uporządkowanej hierarchicznie i treściowo (semantycznie), uŜytecznej dla elastycznie definiowanego odbiorcy reprezentacji rejestrowanych, a następnie interpretowanych informacji. Obrazowa informacja medyczna powinna być tak reprezentowana, aby przy znaczącej objętości danych (np. 4 obrazowe badanie mammograficzne to blisko 160 megabajtów danych) następowało selektywne, progresywne uporządkowanie treści diagnostycznych od cech najbardziej istotnych, gwarantujących moŜliwie duŜy przyrost diagnostycznie uŜytecznej informacji na bit tworzonej reprezentacji, poprzez inne cechy mające znaczenie w interpretacji obrazów danej modalności, aŜ po właściwości obrazów, które są nieistotne w diagnozie. Prowadzi to do koncepcji progresji wiarygodności diagnostycznej realizowanej w algorytmach kompresji danych obrazowych, która stanowi główny cel naszych badań. 1.1. Progresja wiarygodności Progresja wiarygodności diagnostycznej polega więc na takim uporządkowaniu danych obrazowych, by kolejne bajty tworzonej reprezentacji powodowały monotoniczne malejący przyrost (przyrost ten powinien być szczególnie duŜy w pierwszych pakietach reprezentacji kodowej) wartości diagnostycznej rekonstruowanego obrazu. Progresywna rekonstrukcja pozwala uzyskać w pierwszej kolejności moŜliwie bogatą, całościową informację diagnostyczną zawartą w obrazie oraz ogólny zarys struktur i podstawową charakterystykę obrazu. Kontynuacja procesu rekonstrukcji daje stopniowe uszczegółowienie prezentowanych treści. Gwałtowny przyrost jakości diagnostycznej obrazu w pierwszej fazie rekonstrukcji oraz wyeksponowanie (ekstrakcja) szczególnie istotnych diagnostycznie cech pozwoli np. przyspieszyć, a niekiedy wręcz umoŜliwi telediagnostykę czy telekonsultacje radiologiczne w czasie rzeczywistym. Szczególnie przydatnym schematem kompresji obrazów, umoŜliwiającym realizację progresji wiarygodności diagnostycznej, jest koder z elastycznym algorytmem porządkowania informacji w hierarchicznej dziedzinie falkowej wielu rozdzielczości i warstw. Rozwiązanie takie zostało zaproponowane w ramach standardu JPEG2000 dopuszczonego jako narzędzie kompresji w ramach zbioru standardów zarządzania informacją obrazową w medycynie DICOM (ang. digital imaging and communications in medicine). Praca niniejsza dotyczy zagadnienia efektywnej kompresji obrazów medycznych z wykorzystaniem wielorozdzielczych metod przekształcania i porządkowania danych według standardu JPEG2000. Badania koncentrowały się przede wszystkim na modyfikacji optymalizacji R-D (stopnia zniekształceń źródeł informacji, ang. rate distortion theory) stosowanej w standardzie JPEG2000, czyli na zaproponowaniu innej miary zniekształceń D w metodzie PCRD (ang. post compression rate distortion) zaczerpniętej z algorytmu kompresji EBCOT (ang. Embedded Block Coding with Optimized Truncation) [3]. Celem jest uzyskanie progresji wiarygodności diagnostycznej w ramach własnej implementacji kodera obrazów JPEG2000 do wspomnianych zastosowań medycznej informatyki obrazowej. 1.2. Standard JPEG2000 Standard ten dotyczy metod efektywnej kompresji obrazów w róŜnorako definiowanych okolicznościach. Bazując na nowym paradygmacie kompresji wykorzystano wielorozdzielczą dekompozycję obrazów do utworzenia hierarchii kodowanej informacji, upakowania istotnej treści obrazowej w określonych fragmentach przestrzeni obrazu, progresji reprezentacji danych, porządkowania według przyjętej teorii R-D oraz optymalnej selekcji treści przy określonym stopniu kompresji [4]. Pozwala to na elastyczne dopasowanie procesu kompresji/dekompresji zarówno do charakteru danych źródłowych, jak teŜ do oczekiwań odbiorcy kodowanej informacji. Obok podstawowego schematu kompresji (część I) zawarto szereg wskazówek i sugestii zwiększenia jego efektywności (część II). MoŜliwa jest takŜe kompresja czasowej sekwencji obrazów (część III) lub zbioru przestrzennych warstw obrazowych (część X). Aspekt ochrony danych (część VIII) uzupełniony jest moŜliwością przystosowania kodowanego strumienia do zastosowań teletransmisji (część IX i XI) oraz zintegrowanych środowisk multimedialnych (część XII). Niemal nieograniczone pole manewru dookreślenia procedury kompresji i rekonstrukcji obrazu zakłada w klasycznym podejściu wykorzystanie metody PCRD jako koniecznego fundamentu procesu porządkowania informacji, który zapewni wysoką efektywność w kaŜdej aplikacji. Zastosowana teoria zniekształceń źródeł informacji zakłada w referencyjnych implementacjach błąd średniokwadratowy (MSE) jako miarę zniekształceń źródeł. Proponowaną realizacją koncepcji progresji wiarygodności jest wprowadzenie innej miary zniekształceń, która znacznie lepiej niŜ błąd średniokwadratowy koreluje z wiarygodnością diagnostyczna kompresowanych obrazów. 2. METODA Podjęto próbę realizacji progresji wiarygodności obrazów medycznych w procesie kompresji i rekonstrukcji poprzez modyfikację metody PCRD wykorzystywanej w JPEG2000. Zaimplementowano inne niŜ MSE miary zniekształceń testując moŜliwość poprawy wartości diagnostycznej obrazów rekonstruowanych z pierwszych pakietów strumienia JPEG2000. 2.1. Teoria zniekształceń źródeł informacji W przypadku kompresji stratnej istotną rolę odgrywa wzajemna zaleŜność pomiędzy uzyskiwaną średnią bitową a poziomem zniekształceń wnoszonym na skutek redukcji informacji nadmiarowej (przedmiot teorii R-D). Pozwala ona wyznaczyć graniczną wartość stopnia kompresji, który moŜliwy jest do uzyskania przy określonym poziomie zniekształceń. Jednym ze sposobów definiowania zaleŜności pomiędzy długością reprezentacji kodowej a poziomem zniekształcenia źródła informacji jest funkcja stopnia zniekształceń D(R) (ang. rate distortion function). Miara zniekształcenia D powinna określić, na ile uŜyteczną aproksymacją oryginału jest rekonstrukcja (według ustalonej reguły) reprezentacji kodowej określonej długości. Im mniejszy poziom zniekształceń, tym lepszy poziom aproksymacji. Przykłady funkcji stopnia zniekształceń pokazano na Rys. 2. Funkcja D(R) jest nieujemna, monotonicznie malejąca, wypukła i określa zbiór optymalnych rozwiązań przy poszukiwaniu najmniejszej moŜliwej średniej bitowej dla określonego poziomu zniekształceń (optymalizacja z ograniczeniem) lub teŜ minimalnego poziomu zniekształceń dla załoŜonej średniej bitowej. Rys. 2. Przykłady optymalizacji kodera poprzez minimalizację zniekształceń przy określonej długości skompresowanych danych (średnia bitowa R). Miara zniekształceń D powinna odzwierciedlać uŜyteczność rekonstruowanej informacji (zgodnie z kryteriami stosowanymi przez odbiorcę). 2.2.Progresja jakości Zarówno w procesie transmisji danych, jak i w przypadku kompresji, istotną rolę odgrywa moŜliwość przekazywania informacji w formie progresywnej, czyli mówiąc inaczej według ustalonego porządku - od postaci zgrubnej do szczegółowej. Progresja jakości umoŜliwia bardzo szybką identyfikację ogólnej treści informacji poprzez optymalny, maksymalnie duŜy przyrost jakości rekonstrukcji w początkowej fazie kodowania. Kryterium jakości stanowi w tym przypadku wykorzystana miara zniekształceń informacji w procesie kompresji stratnej (z selekcją informacji). Jakościowe uporządkowanie informacji przedstawiono na Rys. 3. Rys. 3. Progresja jakości mammogramu (ROI) z widocznymi mikrozwapnieniami za pomocą kodera JPEG2000. Stopniowe uszczegóławianie obrazu następuje wraz przyrostem średniej bitowej poprzez sukcesywną rekonstrukcję obrazu na podstawie skompresowanej reprezentacji o długości: a) 0,01 bpp; b) 0,02 bpp; c) 0,1 bpp; d) 0,5 bpp. Widać wyraźnie, Ŝe juŜ w pierwszej fazie rekonstrukcji, przy małej średniej bitowej 0,01 bpp (bita na piksel), uwidaczniają się jedynie pierwsze zarysy istotnych diagnostycznie szczegółów – największych mikrozwapnień ze skupiska w centralnej części fragmentu obrazu. Przy średniej bitowej 0,02 bpp widoczna jest juŜ znacząca część skupiska, choć mikrozwapnienia są rozmyte i niewyraźne. W kolejnych etapach rekonstrukcji wraz ze wzrostem średniej bitowej i napływem informacji szczegółowej mikrozwapnienia te są stopniowo wyostrzane, uzyskując zadawalającą jakość na poziomie średniej 0,5 bpp. Progresja jakości polega tutaj na optymalizacji informacji w osadzanym strumieniu danych w sensie R-D, gdzie na kaŜdym kolejnym etapie osadzania poszukuje się najlepszej jakości rekonstrukcji istotnych cech obrazu (zobacz Rys. 4). Ogólnie obowiązuje zasada, iŜ porządek kodowania poszczególnych elementów, na jakie dzieli się kodowany strumień (podbloki określone punktami odcięcia), wynika ze wstępnie oszacowanej efektywności kodowania kaŜdego z nich: od symboli o największym nachyleniu D(R) do symboli o nachyleniu najmniejszym [4]. Rys. 4. Optymalizacja R-D kodera: a) elementy przeznaczone do zakodowania (koszt kodowania reprezentowany jest przez wielkość nachylenia krzywej R-D); b) optymalna kolejność kodowania dająca kolejno największy przyrost informacji na transmitowaną daną; c) efekt optymalnej kolejności kodowania przedstawiony na płaszczyźnie R-D. W procesie stratnej kompresji kaŜdy z podbloków cechuje się określonym wpływem na poziom zniekształceń oraz długością powodującą przyrost wielkości strumienia kodowego. Wzajemna relacja pomiędzy tymi wielkościami określa nachylenie krzywej R-D, która determinuje koszt kodowania (symboliczne nachylenie krzywych na Rys. 4). Kodowane są kolejne elementy, począwszy od największego nachylenia krzywej R-D do nachylenia najmniejszego. Wskazana kolejność pozwala juŜ przy transmisji niewielkiej liczby bitów strumienia kodowego uzyskać gwałtowny przyrost informacji w sensie jakościowym, określony przez wykorzystaną w procesie optymalizacji miarę zniekształceń D. Praktyczna realizacja idei tworzenia osadzonego strumienia kodowego, optymalnego w sensie R-D przy jednoczesnej kontroli jego długości, sprowadza się do stworzenia inteligentnego, wielopoziomowego sposobu konstrukcji tego strumienia. Konieczne jest bowiem ustalenie kosztu moŜliwie efektywnego kodowania poszczególnych, moŜliwie drobnych porcji informacji w skali całego obrazu, a następnie określenie porządku kodowania tych porcji zgodnie z teorią optymalizacji R-D. Według PCRD, po zakodowaniu całego zbioru współczynników falkowych i uzyskaniu strumienia kodowego wyznaczane są optymalne krzywe R-D dla wszystkich bloków kodowych. Powstaje dwupoziomowa struktura procesu kompresji: wstępne, osadzające kodowanie danych bloku kodowego w sposób niezaleŜny oraz finalne ustalenie rzeczywistego wkładu bloku (poszczególnych podbloków w poszczególnych warstwach jakości) do kolejnych poziomów jakości, w ustalanym porządku formowania wyjściowego strumienia kodowego. Podbloki o największym nachyleniu krzywej znajdą się w pierwszych pakietach zapisu warstw najbardziej znaczących map bitowych wartości współczynników falkowych. 2.3. Progresja wiarygodności Klasa obrazów medycznych stanowi jedną z bardziej wymagających klas obrazów. Wysokie wymagania odnoszą się w szczególności do zachowania wierności rekonstrukcji przy zachowaniu istotnych diagnostycznie szczegółów obrazu. NaleŜy pamiętać, Ŝe niekiedy istotnymi okazują są bardzo niewielkie lub słabo widoczne elementy, które są wyznacznikiem obecności patologii. Warunkiem koniecznym, a zarazem nadrzędnym, staje się zatem zapewnienie wiarygodności diagnostycznej rekonstruowanego obrazu w określonych zastosowaniem warunkach przepustowości, dostępności, istniejących ograniczeń wartości średniej bitowej itp. Progresja jakości zakłada maksymalnie duŜy przyrost jakości rekonstrukcji, określonej ustaloną miarą zniekształceń, juŜ przy odczycie i przetworzeniu początkowej, niewielkiej części strumienia kodowego. Chcąc związać proces rekonstrukcji z wiarygodnością diagnostyczną przetwarzanych obrazów konieczne jest zastąpienie naturalnie rozumianej jakości poŜądaną przez nas wiarygodnością, określaną często poprzez cechy mające bardzo niewiele wspólnego z klasycznymi kanonami jakości obrazu. Istota koncepcji progresji wiarygodności sprowadza się zatem do poszukiwania najbardziej wiarygodnej, obliczeniowej miary diagnostycznej, która w sposób optymalny zapewniałaby selekcję i uwydatnianie informacji diagnostycznej. Miara ta powinna być wykorzystana w procesie optymalizacji R-D strumienia kodowego, co pozwoliłoby na uporządkowanie informacji obrazowej zgodnie z ich znaczeniem w procesie interpretacji diagnostycznej. Schematycznie ideę progresji wiarygodności pokazano na Rys. 5, analogicznym do klasycznej optymalizacji według R-D z Rys. 4. Rys. 5. Optymalizacja R-D kodera dla dwóch miar zniekształcenia: MSE (kolor czerwony, linia ciągła) oraz MWD (kolor zielony, linia przerywana); a) elementy przeznaczone do zakodowania (koszt kodowania reprezentowany jest przez wielkość nachylenia krzywej R-D); b) optymalna kolejność kodowania dająca największy przyrost informacji na transmitowaną daną; c) efekt optymalnej kolejności kodowania z przedstawiony na płaszczyźnie R-D W realizacji progresji jakości według JPEG2000 do określenia wielkości zniekształceń wykorzystano MSE, który okazuje się niewystarczający w odniesieniu do skomplikowanej semantyki obrazów medycznych. Poszukiwano więc innej, lepszej miary zniekształceń jako odpowiadającej w większym stopniu rzeczywistej wartości diagnostycznej kompresowanych i rekonstruowanych obrazów. Zastosowanie innej miary D w procesie optymalizacji R-D strumienia kodowego skutkuje innym kosztem kodowania poszczególnych fragmentów, co pokazano na Rys. 5. Proces optymalizacji R-D spowoduje wtedy zmianę kolejności kodowania bloków (patrz Rys. 5b) optymalizując strumień kodowy według malejącej wartości diagnostycznej. Jeśli wykorzystana przez nas numeryczna miara wiarygodności diagnostycznej (MWD) będzie dobrze korelować z istotną informacją diagnostyczną, to uzyskamy progresywną rekonstrukcję wiarygodności diagnostycznej z maksymalnym przyrostem eksponowanej treści diagnostycznej w początkowych pakietach strumienia (przy niewielkich wartościach średniej bitowej). Otrzymamy bardziej reprezentatywną diagnostycznie postać zdekompresowanych obrazów. 2.4. Miara wiarygodności Postanowiono wykorzystać własne doświadczenia z numerycznymi miarami wiarygodności diagnostycznej mammogramów [5] jako przykładowego zastosowania kompresji JPEG2000 z progresją wiarygodności. Efektywnej MWD naleŜy szukać w kategorii metod wektorowych ze skalarnym ekwiwalentem, uwzględniającym róŜnorodność zniekształceń powstających w procesie kompresji stratnej. NaleŜało rozwiązać dwa zasadnicze problemy: implementacji nowych miar zniekształceń w referencyjnym oprogramowaniu tego standardu, uwzględniających takŜe cechy lokalne obrazów o istotnym znaczeniu diagnostycznym, oraz dobór samej miary diagnostycznej, która dałaby duŜą wiarygodność numerycznej oceny treści istotnej w interpretacji i opisie badań. 3. REALIZACJA KONCEPJI I EKSPERYMENTY Do implementacji poszukiwanych miar diagnostycznych wykorzystano bibliotekę Jasper [67] w wersji 1.701.0, będącą referencyjną implementacją standardu JPEG2000 [8] opisaną w części V [9]. UŜyto obrazów mammograficznych w formacie PGX z 12 bitową głębią. W początkowej części prac postanowiono zamienić wykorzystywaną standardowo w PCRD miarę MSE na inną prostą miarę obliczeniową, by ocenić moŜliwości implementacji nowej miary zniekształceń na bazie Jasper oraz obserwować wpływ tej miary na porządkowanie informacji w strumieniu kodowym. Do eksperymentu wykorzystano miarę średniej róŜnicy AD (ang. average difference), zdefiniowaną zaleŜnością: AD = 1 MN ∑ ~ f (m, n) − f (m, n) (1) m,n ~ gdzie f (m, n) oraz f (m, n) to wartości pikseli odpowiednio obrazu źródłowego i rekonstruowanego w (m, n) , a M i N określają rozmiary obrazu. Kompresji (z róŜnym współczynnikiem kompresji z zakresu od 2 do 1000) poddano szereg obrazów mammograficznych z referencyjnej bazy DDSM (Digital Database for Screening Mammography, http://marathon.csee.usf.edu/Mammography/Database.html) oraz własnych. Otrzymane rezultaty porównano z obrazem oryginalnym wykorzystując szczytowy stosunek sygnału do szumu PSNR (ang. peak signal to noise ratio) jako miarę jakości kompresji (tj. jakości obrazów rekonstruowanych przy danym stopniu kompresji), ze względu na popularność PSNR w pracach dotyczących kompresji stratnej. PoniewaŜ 4095 2 PSNR = 10 log odzwierciedla w sposób jednoznaczny błąd średniokwadratowy, MSE wiadomo, Ŝe PCDR optymalizowane według MSE daje największe wartości PSNR rekonstrukcji obrazu – warto jednak zwrócić uwagę, jak w sensie tej globalnej miary jakości róŜni się strumień kodowy, tworzony za pomocą PCRD sterowanej inną miarą zniekształceń. Wyniki eksperymentu dla dwóch reprezentatywnych mammogramów: mammo1 oraz mammo2 przedstawiono w Tab. 1. Otrzymane rezultaty wskazują, Ŝe wykorzystanie AD jako miary zniekształceń D daje zbliŜone rezultaty jakości kompresji (PSNR), jak w przypadku standardowego błędu średniokwadratowego. Maksymalna róŜnica sięga 3 dB przy małych stopniach kompresji (w zasadzie przy wizualnej bezstratności procesu kompresji), zaś przy silniejszej kompresji najwyŜej 0,5 dB. Jednak według subiektywnej oceny rekonstruowanych obrazów jakość jest gorsza dla miary AD – daje się zauwaŜyć silniejszy efekt rozmycia struktur, które mają istotne znaczenie diagnostyczne. Szczegóły istotne w interpretacji mammogramów (mikrozwapnienia, zarys guzów oraz struktury piersi) uległy większej degradacji, a więc wartość diagnostyczna obrazów uległa zmniejszeniu (zobacz Rys. 6). Tab. 1 Wyniki oceny efektywności kompresji przy dwóch róŜnych miarach zniekształceń (MSE oraz AD) wykorzystanych w algorytmie PCRD. mammo1 PSNR[dB] MSE AD 68,63 68,40 58,16 55,19 54,40 53,39 50,06 49,41 48,00 47,41 46,09 45,67 43,94 43,37 41,55 41,00 CR[:1] 2 10 20 50 100 200 500 1000 a) b) mammo2 PSNR[dB] MSE AD 70,36 70,21 55,76 53,94 51,45 50,39 47,81 47,23 45,99 45,64 44,66 44,28 43,14 42,63 41,53 41,02 c) Rys. 6. Porównanie efektywności kompresji z wykorzystywaniem róŜnych miar zniekształceń w PCRD: a) źródłowy fragment mammo2; b) obraz po kompresji 1000:1 z wykorzystaniem klasycznej PCRDMSE; c) obraz po kompresji 1000:1 z wykorzystaniem PCRD-AD. Na podstawie obserwacji moŜna stwierdzić, Ŝe miara AD gorzej sprawdza się w realizacji koncepcji progresji wiarygodności, a porządek ustawiania podbloków według malejącej wartości przyrostu MSE, średnio na bit reprezentacji kodowej, lepiej eksponuje treść diagnostyczną obrazów mammograficznych. Wstępna część badań pozwoliła potwierdzić istotną rolę miary zniekształceń wykorzystywanej w realizacji progresji jakości strumienia kodowego według PCRD. Dała takŜe szereg wskazówek implementacyjnych, które potwierdziły moŜliwość modyfikacji algorytmu PCRD zmieniającej miarę zniekształceń D. Niebyt pomyślne rezultaty, które uzyskano dla miary AD, a takŜe doświadczenia własne sugerują wykorzystanie wektorowej miary wiarygodności z liniową kombinacją kilku miar opisujących zniekształcenia lokalne i globalne o zróŜnicowanym charakterze. Skuteczne opisanie diagnostycznej wiarygodności rekonstrukcji winno uwzględnić zarówno jakość odtworzenia drobnych, ale istotnych diagnostycznie cech (np. percepcję skupisk mikrozwapnień), jak i ocenę globalnych właściwości obrazu (czułość kontrastu, tekstura utkania sutka, zarysy duŜych struktur). MWD powinna łączyć ocenę klarowności interpretacji zmian w obrazie (pozostającą w sferze subiektywnych ocen psychowizualnych), wskaźniki obiektywne obliczeniowo, które silnie korelują z wykrywalnością zmian, jak i ogólne cechy ludzkiego systemu widzenia (HVS) i postrzegania. Jednocześnie MWD winna być podatna na implementację w standardowej PCRD. Sugestia jest więc następująca. Rozpięta w przestrzeni kilku cech skalarnych MWD z redukcją wymiaru do skalarnego ekwiwalentu wiarygodności determinuje poziom zniekształceń wykorzystywany w optymalizacji PCRD, co powinno zapewnić większą korelację realizowanej progresji ze stopniową rekonstrukcją w pierwszej kolejności najbardziej istotnych diagnostycznie treści obrazowych uzupełnianych informacją dodatkową. MoŜna więc w tym przypadku mówić o progresji wiarygodności. Opracowanie numerycznej MWD jest zadaniem bardzo trudnym, bo wymaga obiektywizacji opisu medycznej diagnozy, ustandaryzowania stosowanych kryteriów oceny, jak teŜ opracowania sprzęgu pomiędzy definiowanymi innym językiem cechami diagnostycznymi a cechami obliczeniowymi (inŜynierskimi). Uzyskanie we wcześniejszych badaniach wysokiego poziomu korelacji pomiędzy implementacją numerycznej miary wiarygodności a subiektywną interpretacją badań mammograficznych przez specjalistówradiologów na duŜej grupie obrazów testowych [5] pozwoliło jednak zaproponować rozwiązanie, które na tym etapie badań moŜe potwierdzić słuszność badanej koncepcji progresji wiarygodności realizowanej w ramach standardu JPEG2000. Wybrano uproszczoną wersję obliczeniowej miary wiarygodności z [5], łatwą do implementacji w Jasper (bez znaczących nakładów obliczeniowych). Badano postać MWD opisaną skalarnym ekwiwalentem postaci: 4 MWD = ∑ α iVi (2) i =1 gdzie poszczególne Vi zdefiniowano następująco: V1 = MSE = ~ 1 MN ∑ [ f (m, n) − f (m, n)] 2 (3) m,n ~ V2 = MD = max f (m, n) − f (m, n) m,n (4) gdzie MD – maksymalna róŜnica (ang. maximum difference), ~ f (m, n) − f (m, n) (5) ~ 10 [ f (m, n) − f (m, n)]2 V4 = 10 ⋅ χ = ∑ MN m , n f (m, n) (6) V3 = AD = 2 1 MN ∑ m,n gdzie χ 2 – miara chi – kwadrat (ang. chi-square measure). Wartości współczynników α i powinny być ustalone z uŜyciem wzorca diagnostycznego, zapewniając maksymalny poziom korelacji wskazań numerycznych (skalarnego ekwiwalentu) z ocenami radiologów. Wymaga to przeprowadzenia testów z udziałem kilku radiologów, najlepiej z róŜnych ośrodków, na reprezentatywnym zbiorze obrazów, najlepiej w warunkach klinicznych. Takie eksperymenty planowane są po optymalizacji metod implementacji koncepcji progresji wiarygodności, jako finalna weryfikacja kodera JPEG2000 uŜytecznego w archiwizacji i transmisji medycznych badań obrazowych. We wstępnych eksperymentach wartości wszystkich α i ustawiono na 1. Przykładowe rezultaty kompresji obrazów mammo1 oraz mammo2 pokazano na Rys. 7 i 8. Rys. 7. Efekty kompresji mammo1: a) obraz oryginalny; b) po kompresji 1000:1 według PCDR-MSE; c) obraz oryginalny z zaznaczonymi szczegółami istotnymi diagnostycznie; d) po kompresji 1000:1 według PCRD-MWD. Rys. 8. Efekty kompresji mammo2: a) obraz oryginalny; b) po kompresji 1000:1 według PCDR-MSE; c) obraz oryginalny z zaznaczonymi szczegółami istotnymi diagnostycznie; d) po kompresji 1000:1 według PCRD-MWD. Zaobserwowano szczególnie korzystny efekt poprawy wartości diagnostycznej obrazów przy duŜych stopniach kompresji (po rekonstrukcji pierwszych pakietów skompresowanej reprezentacji). W obrazach rekonstruowanych przy stopniu kompresji 1000:1 porządkowanie treści diagnostycznej według zaproponowanej PCRD-MWD lepiej eksponuje informacje istotne w diagnozie. W przypadku obrazu mammo1 (Rys. 7a) obszar guza (zaznaczony duŜym owalnym kształtem – Rys. 7c) jest lepiej rozróŜnialny dla MWD niŜ MSE. Obecność mikrozwapnień jest niewidoczna w obu przypadkach (zbyt duŜa wartość stopnia kompresji – ta treść zostanie dodana na kolejnym etapie rekonstrukcji). Dla obrazu mammo2 (Rys. 8a) skupisko mikrozwapnień (zaznaczone okręgiem w centralnej części obrazu – Rys. 8c) oraz fragmenty włókien (zaznaczone podłuŜną elipsą w prawej części fragmentu obrazu) są równieŜ lepiej uwidocznione dla PCRD-MWD. Omówione powyŜej przykładowe obrazy poddano subiektywnej ocenie specjalisty – radiologa z Zakładu Diagnostyki Obrazowej Szpitala Wolskiego w Warszawie, która potwierdził wyraźnie lepszą wartość diagnostyczną obrazów rekonstruowanych w początkowej fazie procesu dekodowania strumienia kodowego z wykorzystaniem algorytmu PCRD-MWD, w porównaniu ze standardową implementacją JPEG2000 wykorzystującą PCRD-MSE. 4. KONKLUZJE Przedmiot prowadzonych badań obejmuje optymalizację kompresji obrazów z selekcją informacji poprzez wykorzystanie charakterystyki semantycznej (analizę treści) przetwarzanych obrazów. Tematyka ta wpisuje się w kilka bardzo aktualnych nurtów badań prowadzonych w wielu ośrodkach na świecie: technologii semantycznych (z analizą treści), poprawy charakterystyki obserwatora-odbiorcy informacji, obiektywizacji opisu treści diagnostycznych w ramach intensywnie rozwijanej medycyny opartej na faktach, wreszcie doskonalenia standardu JPEG2000. Zaproponowano zupełnie nowe podejście do semantycznej optymalizacji strumienia JPEG2000. Znane dotąd metody dotyczą przede wszystkim modyfikacji rozkładu wartości współczynników falkowych poprzez wprowadzanie odpowiednich wag, uwzględniających percepcyjne (ewentualnie semantyczne) zdolności obserwatora (jak chociaŜby w ostatnio publikowanej pracy [10]). Przedstawione tutaj rozwiązanie dotyczy modyfikacji stosowanej dotąd teorii kodowania z progresją, optymalizowaną według teorii R-D, poprzez zastosowanie nowej miary zniekształceń, lepiej opisującej treść obrazu, uwzględniającej znacznie bardziej zaawansowaną charakterystykę odbiorcy. PoniewaŜ wybrane zastosowanie dotyczy kompresji obrazów medycznych, ta charakterystyka jest szczególnie istotna i jednocześnie trudna. Wykorzystując doświadczenia zespołu w przetwarzaniu, analizie i rozumieniu obrazów mammograficznych, a takŜe wcześniejsze badania nad konstruowaniem miary jakości diagnostycznej mammogramów, zaproponowano koncepcję progresji wiarygodności obrazów medycznych z przykładową realizacją do zastosowań mammografii cyfrowej. Szczególnie cenne wydaje się wykorzystanie opracowanej metody kompresji w systemach teleradiologii (http://telemedycyna.evernet.com.pl/system/). Przedstawiony sposób porządkowania treści diagnostycznej w ramach rozwiązań standardu JPEG2000 stanowi praktyczną implementację koncepcji ekstrakcji najistotniejszych treści diagnostycznych, które umieszczone na początku strumienia kodowego przyspieszają analizę obrazów, umoŜliwiają indeksowanie po zawartości i wyszukiwanie treści diagnostycznych, usprawniają działanie systemów wspomagania diagnostyki CAD i obiektywizują gromadzoną informację obrazową. Progresja wiarygodności powoduje monotonicznie malejący przyrost wartości diagnostycznej rekonstruowanego obrazu, co sprowadza się do uzyskania w pierwszej kolejności moŜliwie obfitej treści o największym znaczeniu dla uŜytkownika, stopniowo uszczegóławianej w kolejnych etapach rekonstrukcji. Otrzymane wstępne wyniki eksperymentów potwierdzają słuszność zaprezentowanych koncepcji. Kolejne badania będą dotyczyć optymalizacji miary wiarygodności diagnostycznej i sposobów jej implementacji w koderach JPEG2000. Jak wspomniano, planowane są testy weryfikacyjne z detekcją patologii w warunkach klinicznych oraz w ramach telekonsultacji, które potwierdzą przydatność opracowanych narzędzi kompresji na znaczącej liczbie badań mammograficznych, z moŜliwością rozszerzenia koncepcji progresji wiarygodności na obrazy innych modalności. LITERATURA [1] Przelaskowski A., „Metody kompresji obrazów: uwarunkowania dalszego rozwoju”, Przegląd telekomunikacyjny, 10:374-381, 2005 [2] Przelaskowski A., „Kompresja danych: podstawy, metody bezstratne, kodery obrazów”, Wydawnictwo BTC, 2005 [3] Taubman D., „High performance scalable image compression with EBCOT”, IEEE Trans Image Proc 9(7):1158-1170, 2000 [4] Przelaskowski A., „Falkowe metody kompresji danych obrazowych”, Oficyna Wydawnicza PW, 2002 [5] Przelaskowski A., „Vector quality measure of lossy compressed medical image”, Comp Biol Med, 34(3):193-207, 2004 [6] Adams M.D., „JasPer software reference manual (Version 1.700.0)” ISO/IEC. JTC 1/SC 29/WG 1 N 2415, Feb. 2003 [7] Adams M.D., Kossenini F., “JasPer: a software-based JPEG-2000 codec implementation”, Proc IEEE ICIP, Vancouver, BC, Canada, 2:53-56, 2001. [8] ISO/IEC 15444-1, "Information technology – JPEG 2000 image coding system – Part 1: Core coding system," ISO/IEC JTC 1/SC 29/WG1, Jan. 2001 [9] ISO/IEC 15444-5, "Information technology – JPEG 2000 image coding system – Part 5: Reference software," ISO/IEC JTC 1/SC 29/WG1, Dec. 2001 [10] Liu Z., Karam L.J., Watson A.B, „JPEG2000 encoding with perceptual distortion control”, IEEE Trans Image Proc 15(7):1763-78, 2006