Metoda klasteryzacji i segmentacji mikrozwapnień w celu redukcji

Transkrypt

Metoda klasteryzacji i segmentacji mikrozwapnień w celu redukcji
XIV KBIB’05 – Systemy informatyczne i telemedyczne
Metoda klasteryzacji i segmentacji mikrozwapnień w celu
redukcji wskazań fałszywych przy komputerowym
wspomaganiu mammografii
Anna Wróblewska, Artur Przelaskowski, Paweł Bargieł, Piotr Boniński
Zakład Elektroniki Jądrowej i Medycznej, Instytut Radiolelektroniki,
Politechnika Warszawska
Ul. Nowowiejska 15/19; 00-665 Warszawa
[email protected]
Streszczenie:
Celem pracy była optymalizacja metody detekcji i analizy mikrozwapnień w mammografii. Zaproponowano
metodę lokalizacji, klasteryzacji i segmentacji nadmiarowego zbioru obiektów zainteresowania - potencjalnych
mikrozwapnień.*
Summary:
The goal of our research was designing and realization of a whole system for detection and analysis of
microcalcification clusters in mammography. The presented method focuses on localization, clustering and
segmentation of initially detected redundant set of bright objects (potential microcalcifications). The efficacy of
the method was verified in experiments.
1. Wstęp
Podstawową metodą w zakresie wczesnego wykrywania raka piersi u kobiet powyŜej 40 lat
jest mammografia rentgenowska. Interpretacja zdjęcia radiologicznego jest jednak proces
trudnym, często niejednoznacznym. Błędy w diagnostyce mogą dotyczyć przeoczenia zmiany
widocznej (zwyrodnienia czasem są bardzo małe lub ukryte w zdrowej tkance) lub
niewłaściwej oceny wykrytej patologii (m.in. rozróŜnienia pomiędzy zmianami złośliwymi i
łagodnymi). Tak teŜ około 10-30% raków nie zostaje wykrytych podczas rutynowego
skriningu, a 30 – 40% wskazań jest niewłaściwych. Konsultacje kilku lekarzy dotyczące tego
samego przypadku zwiększają efektywność mammografii o około 15% [1], ale jednocześnie
zmniejszają wydajność ich pracy.
Skuteczną pomocą jest często wykorzystanie metod komputerowego wspomagania diagnozy
(‘computer-aided diagnosis’ – CAD), czyli włączenie technologii komputerowej w proces
interpretacji badań mammograficznych. Celem jest zwiększenie dokładności diagnostycznej
poprzez poprawę warunków detekcji i właściwej oceny zwyrodnień przez radiologa. CAD
pozwala w większym stopniu zobiektywizować interpretację zdjęć mammograficznych
(zmniejszyć róŜnice w diagnozach wydawanych przez róŜnych radiologów lub teŜ przez
jednego, ale w róŜnym czasie) oraz zmniejszyć nakłady pracy lekarzy. Ostateczną decyzję
podejmuje zawsze lekarz, a wskazania CAD mają jedynie charakter sugestii.
Zakres wspomagania obejmuje poprawę jakości diagnostycznej obrazów, warunków
prezentacji informacji diagnostycznej słuŜących lepszej percepcji zmian (zwiększenie
lokalnego kontrastu, wykrycie krawędzi, podkreślenie cechy wybranych zmian
patologicznych, usunięcie szumów) oraz detekcji (metody modelowania i rozpoznawania
wzorców) i klasyfikacji (oszacowania złośliwości) podejrzanych zmian w tkance.
*
Praca naukowa finansowana ze środków budŜetowych na naukę w latach 2005-2006 jako projekt badawczy
3T11E 014 28
1
XIV KBIB’05 – Systemy informatyczne i telemedyczne
Istotną rolę w ocenie zmian patologicznych w mammografii odgrywa detekcja
mikrozwapnień. Na zdjęciach rentgenowskich mikrozwapnienia wyglądają jak drobne jasne
plamki o średnicach od 0.05 do 3 mm (średnio 0.3 mm) i są jednym z waŜniejszych objawów
umoŜliwiającym wczesne wykrycie raka sutka. W 30-50% wcześnie wykrytych w
mammografii raków widoczne są klastry mikrozwapnień, a w 60-80% raków piersi
schorzenie ujawnia się jako mikrozwapnienia podczas badania histologicznego [2]. Złośliwe
mikrozwapnienia zwykle występują w skupiskach (klastrach). Mają niejednorodny kształt,
teksturę, rozmiary oraz rozłoŜenie w skupiskach. Łagodne są większe, o jednolitej teksturze i
kształcie [3].
Do najbardziej efektywnych systemów CAD stosowanych w mammografii do detekcji i
analizy mikrozwapnień naleŜy zaliczyć ImageChecker firmy R2 Technology [4] oraz
SecondLook firmy iCAD [5]. Czułość tych systemów w zakresie detekcji mikrozwapnień
osiąga poziom 98%, a liczba fałszywych wskazań na obraz waha się od 0.5 do 1.
Celem szczegółowym opracowanego narzędzia wspomagania detekcji jest wskazanie
regionów zawierających klastry mikrozwapnień. Wykorzystano elementy analizy
wielorozdzielczej obrazów, metody grupowania i morfologii matematycznej zwracając
szczególną uwagę na jakość wykrywanych klasterów. Prezentowana metoda została
zweryfikowana w testach klinicznych korzystając ze zdiagnozowanych baz danych (DDSM
dostępnej w Internecie [6] oraz zestawu zdjęć mammograficznych zawierających interesujące
przypadki zmian wybranych przez radiologów z Zakładu Diagnostyki Obrazowej Szpitala
Wolskiego i Centrum Onkologii w Warszawie).
2. Klasteryzacja i segmentacja mikrozwapnień w MammoViewer
2.1. Schemat przetwarzania informacji
Ogólny schemat metody detekcji potencjalnych mikrozwapnień znajduje się na rysunku 1.
Danymi wejściowymi jest obraz mammograficzny z odpowiednio dobranymi parametrami
akwizycji (wysoka rozdzielczość obrazu itp.). W celu oszczędności czasu przetwarzania,
dokonuje się segmentacji granicy tkanki piersiowej odrzucając zaszumione tło obrazu
(wykorzystano algorytm z bazy DDSM [6]). Wstępne przetwarzanie moŜe słuŜyć do:
usunięcia lub redukcji szumu i artefaktów (małe – o powierzchni kilku pikseli - obiekty, np.
rysa, pyłek, który osiadł na zdjęciu rentgenowskim podczas skanowania itp.), usunięcia
informacji diagnostycznie nieistotnej (struktur zdrowej tkanki), uwypuklenia cech istotnych
dla diagnozy (charakterystycznych dla mikrozwapnień), wzmocnienia lokalnego kontrastu,
selekcji regionu zainteresowania (ROI), w którym występowanie raka jest bardziej
prawdopodobne. Następnie lokalizowane są jasne plamki (w przybliŜeniu okrągłe) potencjalne mikrozwapnienia. Detekcja klastrów to odrzucenie odizolowanych wskazań oraz
grupowanie pojedynczych obiektów w większe skupiska wg ustalonej definicji grupy, np. 3
lub 5 obiektów na obszarze o wymiarach 1x1 cm2. Segmentacja mikrozwapnień to
odseparowanie ich z tła (zdrowej tkanki). Wynikiem jest rekonstrukcja kształtu pojedynczych
obiektów – potencjalnych mikrozwapnień oraz całych klastrów. Kolejną przewidywaną fazą
jest ekstrakcja róŜnorodnych cech charakteryzujących pojedyncze mikrozwapnienia oraz ich
skupiska. Potencjalne mikrozwapnienia mogą być klasyfikowane na trzy grupy: łagodne,
złośliwe i normalne (fałszywie pozytywne). Klasyfikacja moŜe takŜe słuŜyć jako ostateczna
weryfikacja detekcji, np. podział na dwie grupy: prawdziwie pozytywne i fałszywie
pozytywne [2].
2
XIV KBIB’05 – Systemy informatyczne i telemedyczne
Cyfrowy obraz mammograficzny
Segmentacja granicy piersi
Wstępne przetwarzanie
Lokalizacja
Klasteryzacja
Segmentacja
Wynik wspomagania
Rys.1. Schemat metody detekcji potencjalnych mikrozwapnień.
W MammoViewer analizujemy i testujemy algorytmy dotyczące poszczególnych faz detekcji i
klasyfikacji mikrozwapnień (rys. 1.), sposoby połączenia rezultatów poszczególnych bloków
funkcjonalnych oraz szukamy metod uproszczenia i przyspieszenia ogólnego schematu.
2.2. Metoda detekcji mikrozwapnień
Zaproponowana technika jest kombinacją a) falkowych metod poprawy percepcji
mikrozwapnień, b) filtracji przy uŜyciu filtrów LoG w róŜnych skalach w celu lokalizacji
jasnych plamek – potencjalnych mikrozwapnień, c) algorytmu grupowania sygnałów
DBSCAN (Density Based Spatial Clustering of Applications with Noise) oraz d) metod
morfologicznych i rozrostu regionu do rekonstrukcji kształtów. Naszym załoŜeniem była
wstępna detekcja nadmiarowego zbioru kandydatów, redukowanego w znacznym stopniu w
procesie klasteryzacji i rekonstrukcji kształtu.
Zaproponowana metoda oparta jest na następujących etapach:
1) Wstępne przetwarzanie - techniki falkowe:
a) wygładzanie obrazu: podpasma niskoczęstotliwościowe transformaty bez
decymacji; w celu usunięcia wysokoczęstotliwościowych informacji –
drobnych artefaktów, załamań krawędzi, granulacji tekstury
b) uwypuklanie mikrozwapnień: adaptacyjne progowanie współczynników
transformaty heksagonalnej na wielu poziomach dekompozycji [7];
2) Lokalizacja pojedynczych obiektów – jasnych plamek (większych artefaktów,
przecięć włókien oraz mikrozwapnień): skalowalne filtry LoG (‘Laplacian-ofGaussian’) (podobnie jak w [8]).
3) Grupowanie w klastry oparte na przestrzennym rozmieszczeniu i gęstości obiektów
(DBSCAN) [9];
4) Segmentacja mikrozwapnień w klastrach przy uŜyciu operatorów morfologicznych z
adaptacyjnym progowaniem lokalnym;
5) Wygładzanie kształtów mikrozwapnień technikami rozrostu regionów;
6) Opis kształtu klastrów – otoczki wypukłej zlokalizowanych grup.
3
XIV KBIB’05 – Systemy informatyczne i telemedyczne
2.3. Klasteryzacja oparta na algorytmie DBSCAN.
Proste (standardowe) algorytmy klasteryzacji polegaja na przesuwaniu po obrazie okno o
wymiarach 1x1 cm w poszukiwaniu 3 lub 5 obiektów znajdujących się wewnątrz okna [10].
W algorytmie DBSCAN (Density Based Spatial Clustering of Applications with Noise)
definicja klastra zostaje nieco zmieniona. Tutaj są to grupy obiektów połączonych z zadaną
gęstością.
Do definicji potrzebna są dwa parametry:
- Eps – promień sąsiedztwa punktu określonego wg przyjętej metryki (tutaj euklidesowa),
- MinPts – minimalna liczba punktów w klastrze oraz w sąsiedztwie punktów leŜących
wewnątrz klastra (Sąsiedztwo punktów brzegowych klastra moŜe być mniej liczne.)
W implementacji przyjęto Eps=0.5 cm i MinPts=3 z moŜliwością zmiany w celu
poszukiwania bardziej gęstych klastrów.
Definicja klastra oparta jest na obiektach wzajemnie osiągalnych lub połączonych z pewną
zadaną gęstością (o parametrach Eps i MinPts). Punkt bezpośrednio osiągalny z zadaną
gęstością z innego punktu to taki, który znajduje się w Eps-sąsiedztwie tego punktu, w którym
w sumie znajduje się co najmniej MinPts takich punktów. Punkt osiągalny z zadaną gęstością
z innego punktu, to punkt, dla którego istnieje ścieŜka punktów bezpośrednio osiągalnych z
punktu startowego do końcowego.
KaŜde dwa obiekty naleŜące do klastra są połączone wzajemnie z zadaną gęstością (łączność)
oraz wszystkie punkty osiągalne (z zadaną gęstością) z punktów leŜących wewnątrz klastra
takŜe naleŜą do klastra (maksymalność). Dla punktu naleŜącego do klastra najpierw rozwijany
jest cały klaster. Później algorytm przechodzi do analizy kolejnych punktów nie naleŜących
do Ŝadnego klastra. Dokładny opis algorytmu moŜna znaleźć w [9].
Rys.2. Standardowe algorytmy zaliczają do jednego klastra wszystkie czarne
obiekty. DBSCAN wykrywa jako klaster zgrupowanie równomiernie
rozrzuconych obiektów, nie dołączając artefaktów.
Algorytm DBSCAN okazał się szybszy i bardziej efektywny niŜ standardowa klasteryzacja.
Jego złoŜoność obliczeniowa to ok. k * złoŜoność znalezienia Eps-sąsiedztwa dla
analizowanego punktu (w najgorszym przypadku jest to O(k)), gdzie k jest liczbą kandydatów
– obiektów do grupowania. Jest to znacznie lepsza złoŜoność niŜ innych algorytmów
O(n × m) , gdzie n i m to wymiary obrazu. Zwykle k 2 << n × m , poniewaŜ nawet przy niskim
progu detekcji rząd wielkości k osiąga około 500, a wielkość macierzy obrazu to około 6000 x
4
XIV KBIB’05 – Systemy informatyczne i telemedyczne
4000 pikseli. W standardowych algorytmach czasem kwant przesunięcia okna jest większy –
ok. 0.5 cm (złoŜoność jest niŜsza niŜ O(n × m) ). Jednak wtedy wyniki są mniej dokładne –
nie są rozpatrywane wszystkie konfiguracje punktów i niektóre klastry mogą zostać
pominięte, w przeciwieństwie do DBSCAN.
Inną zaletą algorytmu DBSCAN jest znajdowanie klastrów posiadających mniej więcej
równomierne rozłoŜenie obiektów. Algorytm ten jest mniej czuły na łączenie klastrów (tzn.
nieprawidłowej redukcji fałszywych wskazań – głównego problemu standardowej
klasteryzacji). Artefakty nieco oddalone od centrum klastra nie są dołączane do klastra. W ten
sposób kształty klastrów są dokładniejsze i bardziej odpowienie do dalszej analizy cech
kształtu i tesktury wykrytych grup – przydatnej w dalszej weryfikacji detekcji (rys. 2.).
3. Wyniki
Testy zostały przeprowadzone na 20 obrazach mammograficznych (ucyfrowionych z
rozdzielczością 43,5 oraz 45,5 mikronów z 12-bitową głębią koloru). W zbiorze testowym
było duŜo ostrych i bardzo jasnych artefaktów. Te, które zostały wykryte podczas detekcji,
zostały policzone jako fałszywie pozytywne klastry.
Podczas testów wybrano regiony zainteresowania zawierające rozległe obszary tkanki
piersiowej budzące szczególne podejrzenie raka. Próg na etapie lokalizacji pojedynczych
obiektów był modyfikowany ręcznie (ustalenie największej wartości, która jest korzystna ze
względu na relację wskazań prawdziwych do fałszywych). Czułość detekcji wyniosła około
83% ze średnią liczbą 2 fałszywie pozytywnych klastrów na obraz. Detekcja nie wykrywa
szczególnie delikatnych mikrozwapnień znajdujących się na tle mocno zarysowanych
struktur, np. bardzo wyraźnych włókien.
WaŜnym ulepszeniem algorytmu jest opracowanie automatycznej metody regulacji wartości
progu w fazie lokalizacji, zaleŜnej od średniego poziomu jasności (gęstości tkanki) i struktury
tekstury (kompozycji tkanki) w sąsiedztwie lokalizowanego obiektu. Przykładowe wyniki
detekcji i rekonstrukcji kształtów pokazane są na rysunkach 3 i 4.
(a)
(b)
(c)
(d)
Rys.3. Wykryty klaster: (a) Oryginalny region wskazany przez radiologa (biały kontur). (b) Uwydatnione
mikrozwapnienia. (c) Kształty wykrytych mikrozwapnień (czarne kontury). (d) Kształt klastra.
4. Konkluzje
Zaproponowana metoda łączy kilka technik przetwarzania obrazów w celu uzyskania
maksymalnej wydajności – wysokiej czułości detekcji oraz wstępnej minimalizacji
najbardziej oczywistych wskazań fałszywych. Opisany algorytm przesuwa akcent z etapu
dokładnej detekcji pojedynczych mikrozwapnień (jest to powszechnie stosowane
rozwiązanie), ku analizie całych skupisk. Naszym załoŜeniem była wstępna detekcja
nadmiarowego zbioru kandydatów, redukowanego w znacznym stopniu w procesie
klasteryzacji. W kolejnym kroku niektóre obiekty ze zdegradowanym kształtem zostają
odrzucone przez segmentację. Ponadto segmentacja oraz wygładzanie kształtu słuŜy do jak
5
XIV KBIB’05 – Systemy informatyczne i telemedyczne
najwierniejszego opisu obiektów w celu poprawy skuteczności kolejnych etapów algorytmu redukcji fałszywych wskazań poprzez analizę statystyczną tekstury i cech kształtu
pojedynczych obiektów i całych klastrów – nad którymi obecnie pracujemy.
(a)
(b)
(c)
(d)
Rys. 4. Wskazanie fałszywie pozytywne: (a) Oryginalny region – artefakty znajdujące się w pobliŜu
wyraźnego włókna. (b) Wzmocniony obraz. (c) Kształty wykrytych obiektów (czarne kontury). (d) Kształt
fałszywie pozytywnego klastra (wzdłuŜ włókna).
Rezultaty uzyskane dla badań mammograficznych z róŜnych baz i ośrodków są zbliŜone, co
sugeruje uniwersalność opracowanej metody.
Na dalszym etapie weryfikacji przewidujemy implementację narzędzia MammoViewer w
systemach klinicznych (w ramach zawiązanej współpracy ze Szpitalem Wolskim i Centrum
Onkologii) oraz eksperymenty przy współudziale radiologów.
Bibliografia
[1]
Y. Jiang: Classification of Breast Lesions from Mammograms. W: Handbook of Medical
Imaging, Academic Press, 341-357, 2000
[2]
H.D. Cheng, X. Cai, X. Chen, L. Hu, X. Lou: Computer-aided detection and classification of
microcalcifications in mammograms: a survey, Pattern Recognition 36: 2967-2991, 2003
[3]
Mammografia w diagnostyce raka sutka. Red. J. Dziukowa, Warszawa, Bel Corp, 1998
[4]
http://www.r2tech.com
[5]
http://www.icadmed.com
[6]
http://marathon.csee.usf.edu/Mammography/Database.html
[7]
P. Bargieł, A. Przelaskowski, A. Wróblewska: Wavelet methods in improving the detection of
lesions in memmograms. International Conference on Computer Vision and Graphics, Poland,
Warszawa, 2004
[8]
T. Netsch, H.O. Peitgen: Scale-space signatures for the detection of clustered
microcalcifications in digital mammograms, IEEE Trans. Medical Imag. 18(9), 774-786, 1999
[9]
M. Ester, H.P. Kriegel, J. Sander, X. Xu: A density-based algorithm for discovering clusters in
large spatial databases with noise, Proc. 2nd International Conference on Knowledge
Discovery and Data Mining, 1996
[10]
M.J. Lado, P.G. Tahoces, A.J. Mendez, M. Souto, J.J. Vidal: A wavelet-based algorithm for
detecting clustered microcalcifications in digital mammograms, Med. Phys. 26, 1294-1305,
1999
6