Metoda klasteryzacji i segmentacji mikrozwapnień w celu redukcji
Transkrypt
Metoda klasteryzacji i segmentacji mikrozwapnień w celu redukcji
XIV KBIB’05 – Systemy informatyczne i telemedyczne Metoda klasteryzacji i segmentacji mikrozwapnień w celu redukcji wskazań fałszywych przy komputerowym wspomaganiu mammografii Anna Wróblewska, Artur Przelaskowski, Paweł Bargieł, Piotr Boniński Zakład Elektroniki Jądrowej i Medycznej, Instytut Radiolelektroniki, Politechnika Warszawska Ul. Nowowiejska 15/19; 00-665 Warszawa [email protected] Streszczenie: Celem pracy była optymalizacja metody detekcji i analizy mikrozwapnień w mammografii. Zaproponowano metodę lokalizacji, klasteryzacji i segmentacji nadmiarowego zbioru obiektów zainteresowania - potencjalnych mikrozwapnień.* Summary: The goal of our research was designing and realization of a whole system for detection and analysis of microcalcification clusters in mammography. The presented method focuses on localization, clustering and segmentation of initially detected redundant set of bright objects (potential microcalcifications). The efficacy of the method was verified in experiments. 1. Wstęp Podstawową metodą w zakresie wczesnego wykrywania raka piersi u kobiet powyŜej 40 lat jest mammografia rentgenowska. Interpretacja zdjęcia radiologicznego jest jednak proces trudnym, często niejednoznacznym. Błędy w diagnostyce mogą dotyczyć przeoczenia zmiany widocznej (zwyrodnienia czasem są bardzo małe lub ukryte w zdrowej tkance) lub niewłaściwej oceny wykrytej patologii (m.in. rozróŜnienia pomiędzy zmianami złośliwymi i łagodnymi). Tak teŜ około 10-30% raków nie zostaje wykrytych podczas rutynowego skriningu, a 30 – 40% wskazań jest niewłaściwych. Konsultacje kilku lekarzy dotyczące tego samego przypadku zwiększają efektywność mammografii o około 15% [1], ale jednocześnie zmniejszają wydajność ich pracy. Skuteczną pomocą jest często wykorzystanie metod komputerowego wspomagania diagnozy (‘computer-aided diagnosis’ – CAD), czyli włączenie technologii komputerowej w proces interpretacji badań mammograficznych. Celem jest zwiększenie dokładności diagnostycznej poprzez poprawę warunków detekcji i właściwej oceny zwyrodnień przez radiologa. CAD pozwala w większym stopniu zobiektywizować interpretację zdjęć mammograficznych (zmniejszyć róŜnice w diagnozach wydawanych przez róŜnych radiologów lub teŜ przez jednego, ale w róŜnym czasie) oraz zmniejszyć nakłady pracy lekarzy. Ostateczną decyzję podejmuje zawsze lekarz, a wskazania CAD mają jedynie charakter sugestii. Zakres wspomagania obejmuje poprawę jakości diagnostycznej obrazów, warunków prezentacji informacji diagnostycznej słuŜących lepszej percepcji zmian (zwiększenie lokalnego kontrastu, wykrycie krawędzi, podkreślenie cechy wybranych zmian patologicznych, usunięcie szumów) oraz detekcji (metody modelowania i rozpoznawania wzorców) i klasyfikacji (oszacowania złośliwości) podejrzanych zmian w tkance. * Praca naukowa finansowana ze środków budŜetowych na naukę w latach 2005-2006 jako projekt badawczy 3T11E 014 28 1 XIV KBIB’05 – Systemy informatyczne i telemedyczne Istotną rolę w ocenie zmian patologicznych w mammografii odgrywa detekcja mikrozwapnień. Na zdjęciach rentgenowskich mikrozwapnienia wyglądają jak drobne jasne plamki o średnicach od 0.05 do 3 mm (średnio 0.3 mm) i są jednym z waŜniejszych objawów umoŜliwiającym wczesne wykrycie raka sutka. W 30-50% wcześnie wykrytych w mammografii raków widoczne są klastry mikrozwapnień, a w 60-80% raków piersi schorzenie ujawnia się jako mikrozwapnienia podczas badania histologicznego [2]. Złośliwe mikrozwapnienia zwykle występują w skupiskach (klastrach). Mają niejednorodny kształt, teksturę, rozmiary oraz rozłoŜenie w skupiskach. Łagodne są większe, o jednolitej teksturze i kształcie [3]. Do najbardziej efektywnych systemów CAD stosowanych w mammografii do detekcji i analizy mikrozwapnień naleŜy zaliczyć ImageChecker firmy R2 Technology [4] oraz SecondLook firmy iCAD [5]. Czułość tych systemów w zakresie detekcji mikrozwapnień osiąga poziom 98%, a liczba fałszywych wskazań na obraz waha się od 0.5 do 1. Celem szczegółowym opracowanego narzędzia wspomagania detekcji jest wskazanie regionów zawierających klastry mikrozwapnień. Wykorzystano elementy analizy wielorozdzielczej obrazów, metody grupowania i morfologii matematycznej zwracając szczególną uwagę na jakość wykrywanych klasterów. Prezentowana metoda została zweryfikowana w testach klinicznych korzystając ze zdiagnozowanych baz danych (DDSM dostępnej w Internecie [6] oraz zestawu zdjęć mammograficznych zawierających interesujące przypadki zmian wybranych przez radiologów z Zakładu Diagnostyki Obrazowej Szpitala Wolskiego i Centrum Onkologii w Warszawie). 2. Klasteryzacja i segmentacja mikrozwapnień w MammoViewer 2.1. Schemat przetwarzania informacji Ogólny schemat metody detekcji potencjalnych mikrozwapnień znajduje się na rysunku 1. Danymi wejściowymi jest obraz mammograficzny z odpowiednio dobranymi parametrami akwizycji (wysoka rozdzielczość obrazu itp.). W celu oszczędności czasu przetwarzania, dokonuje się segmentacji granicy tkanki piersiowej odrzucając zaszumione tło obrazu (wykorzystano algorytm z bazy DDSM [6]). Wstępne przetwarzanie moŜe słuŜyć do: usunięcia lub redukcji szumu i artefaktów (małe – o powierzchni kilku pikseli - obiekty, np. rysa, pyłek, który osiadł na zdjęciu rentgenowskim podczas skanowania itp.), usunięcia informacji diagnostycznie nieistotnej (struktur zdrowej tkanki), uwypuklenia cech istotnych dla diagnozy (charakterystycznych dla mikrozwapnień), wzmocnienia lokalnego kontrastu, selekcji regionu zainteresowania (ROI), w którym występowanie raka jest bardziej prawdopodobne. Następnie lokalizowane są jasne plamki (w przybliŜeniu okrągłe) potencjalne mikrozwapnienia. Detekcja klastrów to odrzucenie odizolowanych wskazań oraz grupowanie pojedynczych obiektów w większe skupiska wg ustalonej definicji grupy, np. 3 lub 5 obiektów na obszarze o wymiarach 1x1 cm2. Segmentacja mikrozwapnień to odseparowanie ich z tła (zdrowej tkanki). Wynikiem jest rekonstrukcja kształtu pojedynczych obiektów – potencjalnych mikrozwapnień oraz całych klastrów. Kolejną przewidywaną fazą jest ekstrakcja róŜnorodnych cech charakteryzujących pojedyncze mikrozwapnienia oraz ich skupiska. Potencjalne mikrozwapnienia mogą być klasyfikowane na trzy grupy: łagodne, złośliwe i normalne (fałszywie pozytywne). Klasyfikacja moŜe takŜe słuŜyć jako ostateczna weryfikacja detekcji, np. podział na dwie grupy: prawdziwie pozytywne i fałszywie pozytywne [2]. 2 XIV KBIB’05 – Systemy informatyczne i telemedyczne Cyfrowy obraz mammograficzny Segmentacja granicy piersi Wstępne przetwarzanie Lokalizacja Klasteryzacja Segmentacja Wynik wspomagania Rys.1. Schemat metody detekcji potencjalnych mikrozwapnień. W MammoViewer analizujemy i testujemy algorytmy dotyczące poszczególnych faz detekcji i klasyfikacji mikrozwapnień (rys. 1.), sposoby połączenia rezultatów poszczególnych bloków funkcjonalnych oraz szukamy metod uproszczenia i przyspieszenia ogólnego schematu. 2.2. Metoda detekcji mikrozwapnień Zaproponowana technika jest kombinacją a) falkowych metod poprawy percepcji mikrozwapnień, b) filtracji przy uŜyciu filtrów LoG w róŜnych skalach w celu lokalizacji jasnych plamek – potencjalnych mikrozwapnień, c) algorytmu grupowania sygnałów DBSCAN (Density Based Spatial Clustering of Applications with Noise) oraz d) metod morfologicznych i rozrostu regionu do rekonstrukcji kształtów. Naszym załoŜeniem była wstępna detekcja nadmiarowego zbioru kandydatów, redukowanego w znacznym stopniu w procesie klasteryzacji i rekonstrukcji kształtu. Zaproponowana metoda oparta jest na następujących etapach: 1) Wstępne przetwarzanie - techniki falkowe: a) wygładzanie obrazu: podpasma niskoczęstotliwościowe transformaty bez decymacji; w celu usunięcia wysokoczęstotliwościowych informacji – drobnych artefaktów, załamań krawędzi, granulacji tekstury b) uwypuklanie mikrozwapnień: adaptacyjne progowanie współczynników transformaty heksagonalnej na wielu poziomach dekompozycji [7]; 2) Lokalizacja pojedynczych obiektów – jasnych plamek (większych artefaktów, przecięć włókien oraz mikrozwapnień): skalowalne filtry LoG (‘Laplacian-ofGaussian’) (podobnie jak w [8]). 3) Grupowanie w klastry oparte na przestrzennym rozmieszczeniu i gęstości obiektów (DBSCAN) [9]; 4) Segmentacja mikrozwapnień w klastrach przy uŜyciu operatorów morfologicznych z adaptacyjnym progowaniem lokalnym; 5) Wygładzanie kształtów mikrozwapnień technikami rozrostu regionów; 6) Opis kształtu klastrów – otoczki wypukłej zlokalizowanych grup. 3 XIV KBIB’05 – Systemy informatyczne i telemedyczne 2.3. Klasteryzacja oparta na algorytmie DBSCAN. Proste (standardowe) algorytmy klasteryzacji polegaja na przesuwaniu po obrazie okno o wymiarach 1x1 cm w poszukiwaniu 3 lub 5 obiektów znajdujących się wewnątrz okna [10]. W algorytmie DBSCAN (Density Based Spatial Clustering of Applications with Noise) definicja klastra zostaje nieco zmieniona. Tutaj są to grupy obiektów połączonych z zadaną gęstością. Do definicji potrzebna są dwa parametry: - Eps – promień sąsiedztwa punktu określonego wg przyjętej metryki (tutaj euklidesowa), - MinPts – minimalna liczba punktów w klastrze oraz w sąsiedztwie punktów leŜących wewnątrz klastra (Sąsiedztwo punktów brzegowych klastra moŜe być mniej liczne.) W implementacji przyjęto Eps=0.5 cm i MinPts=3 z moŜliwością zmiany w celu poszukiwania bardziej gęstych klastrów. Definicja klastra oparta jest na obiektach wzajemnie osiągalnych lub połączonych z pewną zadaną gęstością (o parametrach Eps i MinPts). Punkt bezpośrednio osiągalny z zadaną gęstością z innego punktu to taki, który znajduje się w Eps-sąsiedztwie tego punktu, w którym w sumie znajduje się co najmniej MinPts takich punktów. Punkt osiągalny z zadaną gęstością z innego punktu, to punkt, dla którego istnieje ścieŜka punktów bezpośrednio osiągalnych z punktu startowego do końcowego. KaŜde dwa obiekty naleŜące do klastra są połączone wzajemnie z zadaną gęstością (łączność) oraz wszystkie punkty osiągalne (z zadaną gęstością) z punktów leŜących wewnątrz klastra takŜe naleŜą do klastra (maksymalność). Dla punktu naleŜącego do klastra najpierw rozwijany jest cały klaster. Później algorytm przechodzi do analizy kolejnych punktów nie naleŜących do Ŝadnego klastra. Dokładny opis algorytmu moŜna znaleźć w [9]. Rys.2. Standardowe algorytmy zaliczają do jednego klastra wszystkie czarne obiekty. DBSCAN wykrywa jako klaster zgrupowanie równomiernie rozrzuconych obiektów, nie dołączając artefaktów. Algorytm DBSCAN okazał się szybszy i bardziej efektywny niŜ standardowa klasteryzacja. Jego złoŜoność obliczeniowa to ok. k * złoŜoność znalezienia Eps-sąsiedztwa dla analizowanego punktu (w najgorszym przypadku jest to O(k)), gdzie k jest liczbą kandydatów – obiektów do grupowania. Jest to znacznie lepsza złoŜoność niŜ innych algorytmów O(n × m) , gdzie n i m to wymiary obrazu. Zwykle k 2 << n × m , poniewaŜ nawet przy niskim progu detekcji rząd wielkości k osiąga około 500, a wielkość macierzy obrazu to około 6000 x 4 XIV KBIB’05 – Systemy informatyczne i telemedyczne 4000 pikseli. W standardowych algorytmach czasem kwant przesunięcia okna jest większy – ok. 0.5 cm (złoŜoność jest niŜsza niŜ O(n × m) ). Jednak wtedy wyniki są mniej dokładne – nie są rozpatrywane wszystkie konfiguracje punktów i niektóre klastry mogą zostać pominięte, w przeciwieństwie do DBSCAN. Inną zaletą algorytmu DBSCAN jest znajdowanie klastrów posiadających mniej więcej równomierne rozłoŜenie obiektów. Algorytm ten jest mniej czuły na łączenie klastrów (tzn. nieprawidłowej redukcji fałszywych wskazań – głównego problemu standardowej klasteryzacji). Artefakty nieco oddalone od centrum klastra nie są dołączane do klastra. W ten sposób kształty klastrów są dokładniejsze i bardziej odpowienie do dalszej analizy cech kształtu i tesktury wykrytych grup – przydatnej w dalszej weryfikacji detekcji (rys. 2.). 3. Wyniki Testy zostały przeprowadzone na 20 obrazach mammograficznych (ucyfrowionych z rozdzielczością 43,5 oraz 45,5 mikronów z 12-bitową głębią koloru). W zbiorze testowym było duŜo ostrych i bardzo jasnych artefaktów. Te, które zostały wykryte podczas detekcji, zostały policzone jako fałszywie pozytywne klastry. Podczas testów wybrano regiony zainteresowania zawierające rozległe obszary tkanki piersiowej budzące szczególne podejrzenie raka. Próg na etapie lokalizacji pojedynczych obiektów był modyfikowany ręcznie (ustalenie największej wartości, która jest korzystna ze względu na relację wskazań prawdziwych do fałszywych). Czułość detekcji wyniosła około 83% ze średnią liczbą 2 fałszywie pozytywnych klastrów na obraz. Detekcja nie wykrywa szczególnie delikatnych mikrozwapnień znajdujących się na tle mocno zarysowanych struktur, np. bardzo wyraźnych włókien. WaŜnym ulepszeniem algorytmu jest opracowanie automatycznej metody regulacji wartości progu w fazie lokalizacji, zaleŜnej od średniego poziomu jasności (gęstości tkanki) i struktury tekstury (kompozycji tkanki) w sąsiedztwie lokalizowanego obiektu. Przykładowe wyniki detekcji i rekonstrukcji kształtów pokazane są na rysunkach 3 i 4. (a) (b) (c) (d) Rys.3. Wykryty klaster: (a) Oryginalny region wskazany przez radiologa (biały kontur). (b) Uwydatnione mikrozwapnienia. (c) Kształty wykrytych mikrozwapnień (czarne kontury). (d) Kształt klastra. 4. Konkluzje Zaproponowana metoda łączy kilka technik przetwarzania obrazów w celu uzyskania maksymalnej wydajności – wysokiej czułości detekcji oraz wstępnej minimalizacji najbardziej oczywistych wskazań fałszywych. Opisany algorytm przesuwa akcent z etapu dokładnej detekcji pojedynczych mikrozwapnień (jest to powszechnie stosowane rozwiązanie), ku analizie całych skupisk. Naszym załoŜeniem była wstępna detekcja nadmiarowego zbioru kandydatów, redukowanego w znacznym stopniu w procesie klasteryzacji. W kolejnym kroku niektóre obiekty ze zdegradowanym kształtem zostają odrzucone przez segmentację. Ponadto segmentacja oraz wygładzanie kształtu słuŜy do jak 5 XIV KBIB’05 – Systemy informatyczne i telemedyczne najwierniejszego opisu obiektów w celu poprawy skuteczności kolejnych etapów algorytmu redukcji fałszywych wskazań poprzez analizę statystyczną tekstury i cech kształtu pojedynczych obiektów i całych klastrów – nad którymi obecnie pracujemy. (a) (b) (c) (d) Rys. 4. Wskazanie fałszywie pozytywne: (a) Oryginalny region – artefakty znajdujące się w pobliŜu wyraźnego włókna. (b) Wzmocniony obraz. (c) Kształty wykrytych obiektów (czarne kontury). (d) Kształt fałszywie pozytywnego klastra (wzdłuŜ włókna). Rezultaty uzyskane dla badań mammograficznych z róŜnych baz i ośrodków są zbliŜone, co sugeruje uniwersalność opracowanej metody. Na dalszym etapie weryfikacji przewidujemy implementację narzędzia MammoViewer w systemach klinicznych (w ramach zawiązanej współpracy ze Szpitalem Wolskim i Centrum Onkologii) oraz eksperymenty przy współudziale radiologów. Bibliografia [1] Y. Jiang: Classification of Breast Lesions from Mammograms. W: Handbook of Medical Imaging, Academic Press, 341-357, 2000 [2] H.D. Cheng, X. Cai, X. Chen, L. Hu, X. Lou: Computer-aided detection and classification of microcalcifications in mammograms: a survey, Pattern Recognition 36: 2967-2991, 2003 [3] Mammografia w diagnostyce raka sutka. Red. J. Dziukowa, Warszawa, Bel Corp, 1998 [4] http://www.r2tech.com [5] http://www.icadmed.com [6] http://marathon.csee.usf.edu/Mammography/Database.html [7] P. Bargieł, A. Przelaskowski, A. Wróblewska: Wavelet methods in improving the detection of lesions in memmograms. International Conference on Computer Vision and Graphics, Poland, Warszawa, 2004 [8] T. Netsch, H.O. Peitgen: Scale-space signatures for the detection of clustered microcalcifications in digital mammograms, IEEE Trans. Medical Imag. 18(9), 774-786, 1999 [9] M. Ester, H.P. Kriegel, J. Sander, X. Xu: A density-based algorithm for discovering clusters in large spatial databases with noise, Proc. 2nd International Conference on Knowledge Discovery and Data Mining, 1996 [10] M.J. Lado, P.G. Tahoces, A.J. Mendez, M. Souto, J.J. Vidal: A wavelet-based algorithm for detecting clustered microcalcifications in digital mammograms, Med. Phys. 26, 1294-1305, 1999 6