Wzorzec formatowania artykułów SIIB`2004

Transkrypt

Wzorzec formatowania artykułów SIIB`2004
ZESTAW TESTOWY DLA PROBLEMU DIAGNOZOWANIA RAKA PIERSI
PRZY UŻYCIU CIENKOIGŁOWEJ BIOPSJI
ANDRZEJ MARCINIAK*, ROMAN MONCZAK**, MARIUSZ KOŁODZIŃSKI**,
PRZEMYSŁAW PRĘTKI*, ANDRZEJ OBUCHOWICZ*
*
Instytut Sterowania i Systemów Informatycznych, Uniwersytet Zielonogórski, Zielona Góra,
{a.marciniak;a.obuchowicz;p.pretki}@issi.uz.zgora.pl.pl
**
Zakład Patomorfologii SPZOZ Szpitala Wojewódzkiego, Zielona Góra
Streszczenie. Niniejsze opracowanie prezentuje system porównawczy (ang. benchmark) dla zagadnienia
diagnozowania raka piersi metodą biopsji aspiracyjnej
cienkoigłowej. System jest zaprojektowany tak, aby
możliwe było porównywanie skuteczności algorytmów
komputerowego rozpoznawania występujących zmian
chorobowych dla przypadków łagodnych i złośliwych.
Jakość obrazu mikroskopowego komórek guza jest
weryfikowana przez cytopatologa, a następnie obraz
rejestrowany jest w bazie przykładów. Właściwa klasyfikacja przypadków złośliwych potwierdzana jest histopatologicznie, a łagodnych co najmniej roczną obserwacją. Ze zweryfikowanych obrazów dwuwymiarowych
ekstrahowane są cechy, których jakość określana jest za
pomocą kryteriów selekcji cech.
1. WSTĘP
Rak piersi jest najczęściej występującym nowotoworem (wyłączając raka skóry), u kobiet zarówno w Stanach Zjednoczonych, Europie jak i Australii [1]. Wśród
kobiet, które przeżyły 70 lat ok. 12% miała, ma lub
będzie miała raka sutka. Rak piersi powoduje też wysoką śmiertelność - rzędu 50% chorych.
Rokowania w raku piersi są, w pierwszej kolejności, zależne od zaawansowania procesu nowotworowego zanim podjęte zostanie odpowiednie leczenie, a więc
są one względnie bezpośrednio funkcją czasu. Jeśli
poprawna diagnoza może być ustalona dostatecznie
wcześnie, wówczas rokowanie jest lepsze, jako że w
większości przypadków guz jest wówczas ograniczony
do piersi zanim rozprzestrzeni się drogą chłonną poprzez węzły chłonne, lub drogą krwionośną do innych
narządów. Jest to tym istotniejsze, że niektóre z objawów łagodnych schorzeń gruczołów sutkowych mogą
być podobne do objawów raka piersi i odwrotnie. Pacjentka uspokojona diagnozą mówiącą, że zmiany są
łagodne, może nie zdawać sobie sprawy, że powstały
inne - tym razem złośliwe. Rak piersi należy do chorób
podstępnych, a guz o średnicy 5mm może dawać odległe przerzuty, choć ok.95% guzów o średnicy do 1cm
ograniczonych jest do gruczołu piersiowego.
Zatem oczywistym jest fakt, iż piersi winny być regularnie i wnikliwie badane. Nowoczesna medycyna nie
dostarczyła lekarzom, jak dotychczas, stuprocentowo
pewnych, możliwie tanich a zarazem nieinwazyjnych
narzędzi diagnostycznych do obrazowania patologii
sutków. Choć wycięcie podejrzanej zmiany podczas
operacji chirurgicznej i jej histopatologiczna ocena
pozwala na blisko 100% pewność rozpoznania, to postępowanie takie nie spełnia warunków łatwości wykonania, powszechnej i szybkiej dostępności, jak i niskich
kosztów. Ponadto chirurgiczna biopsja gruczołu sutkowego, będąc w istocie zabiegiem operacyjnym, obarczona jest możliwością wystąpienia niekorzystnych
skutków ubocznych, a nawet powikłań, jak każda inna
interwencja chirurgiczna.
Powyższe uwarunkowania powodują że w praktyce
dość istotną rolę pełni tzw. test potrójny, który polega
na zestawieniu wyników trzech rodzajów badań o różnym stopniu czułości i pozwala na prawie 100% pewność rozpoznania. Składa się on z:
• badania palpacyjnego,
• badania obrazowego przy użyciu ultrasonografii lub mammografii,
• biopsji cienkoigłowej.
Biopsja aspiracyjna cienkoigłowa (ang. Fine Needle
Aspirate Biopsy - FNAB) to zabieg pobrania komórek
bezpośrednio z głębi guza do oceny mikroskopowej.
Pod kontrolą mammograficzną lub ultrasonograficzną
guzek nakłuwany jest igłą o średnicy poniżej 1mm połączonej ze strzykawką zasysającą komórki z guza.
Biopsja cienkoigłowa bez użycia aspiracji (FNB) polega
na wielokrotnym przemieszczaniu w obrębie guza igły,
do której pod wpływem sił włosowatych dostają się
złuszczone komórki w płynie tkankowym.
W przypadku, gdy zmiana wypełniona jest płynem i
okaże się torbielą, po opróżnieniu stanie się ona niewy-
czuwalna i niewidoczna w obrazie radiologicznym.
Jeżeli zaś jest to zmiana lita, pobrane komórki rozprowadzane są na szkiełku mikroskopowym, odpowiednio
barwione i poddawane badaniu mikroskopowemu w
celu stwierdzenia obecności komórek nowotworowych.
Badanie FNB należy do grupy badań inwazyjnych,
obarczonych znikomym ryzykiem powikłań, jest jednocześnie najbardziej miarodajnym, gdyż pozwala określić, czy zmiana którą badamy, ma charakter łagodny,
czy też złośliwy. FNB obdarczona jest bowiem najwyższą czułością ze wszystkich badań wchodzących w
skład testu potrójnego.
Pewnym mankamentem metody FNB są wymagania
dotyczące głębokiej wiedzy i doświadczenia cytopatologa, który najpierw ocenia jakość materiału diagnostycznego, a następnie decyduje o jego zaklasyfikowaniu. Choć przyjęto pewne ogólne kryteria rozpoznania
zarówno zmiany łagodnej, jak i złośliwej, to są one
mimo wszystko dość nieścisłe i wyniki rozpoznania
zależą silnie od czynnika ludzkiego (występuje element
uznaniowości). Wynika to z faktu, że umysł odbiorcy
zniekształca obiektywne znaczenie treści przekazu,
gdyż jest ono interpretowane i „filtrowane” przez jego
indywidualne doświadczenia [2]. Zatem przykładowe
kryteria sformułowane przez ekspertów w dziedzinie
cytopatologii dla rozpoznania zmiany łagodnej takie
jak: „stosunkowo mała liczba komórek”, „jądra komórkowe niemal jednakowej wielkości o równomiernie
rozłożonej chromatynie”, czy „tło rozmazu czyste”
mogą być w różny sposób interpretowane na obrazach
tej samej klasy w zależności od doświadczenia patologa.
Na jego ocenę mogą mieć wpływ różnice w przygotowywaniu materiału diagnostycznego (szczególnie barwienia materiału), czy nawet klasa sprzętu optycznego.
Stąd można wywnioskować zasadność wprowadzenia
komputerowych analizatorów obrazu jako obiektywnych i zautomatyzowanych narzędzi dla ocen ilościowych zjawisk morfologicznych, w tym tradycyjnych
wskaźników charakteryzujących zmiany chorobowe.
Dodatkową korzyścią może być możliwość kreowania
złożonych ciągów działań z wykorzystaniem metod
morfologii matematycznej, co może poszerzyć liczbę
wskaźników [3]. Dzięki temu możliwe jest łączne
uwzględnienie właściwości geometrycznych, topologicznych, densytometrycznych i kolorymetrycznych
ocenianych struktur komórek guza.
2. ZBIORY DANYCH
Komputerowy system analizy wymaga odpowiedniego zbioru zweryfikowanych przykładów dla potrzeb
projektowania, strojenia parametrów oraz testowania
systemu. Mimo, że w światowej literaturze naukowej
można znaleźć wiele przykładów systemów rozpoznawania odmiany guza piersi u kobiet, to często trudno
jest dokonać obiektywnej oceny skuteczności opisywanych algorytmów. Bierze się to z tego, że wielu autorów
stosuje własne zbiory danych, otrzymywane w wyniku
przeprowadzenia własnych eksperymentów. Miarodajna
analiza komparatywna wyników uzyskiwanych przez
różne zespoły badawcze jest w takim przypadku niemożliwa, gdyż zbiory obrazów mogą różnić się liczeb-
nością, rozkładem klas, sposobem przygotowania materiału diagnostycznego, arbitralnym doborem „łatwych”
przypadków itp. Wprawdzie dość dużą popularnością
dla testowania algorytmów klasyfikacyjnych cieszy się
zestaw danych Wisconsin Breast Cancer Database,
udostępniony przez Repository of University of Wisconsin Hospitals z USA, ale z punktu widzenia projektowania całych systemów rozpoznawania raka piersi jest
on raczej mało przydatny. WDBC zawiera dwa zbiory
danych klinicznych dla przebadanych pacjentek. Oba
zawierają wektory atrybutów charakteryzujących cechy
pojedynczych komórek z obrazów mikroskopowych,
choć różnią się liczbą przypadków oraz ekstrahowanymi
cechami. Pierwszym zestaw atrybutów zawiera wartości statystyk dla ilościowych cech komórek, takich jak
np. obszar, promień, czy wymiar fraktalny. Drugi z
kolei zawiera wykonywane przez autorów oceny (w
skali 1-10) pewnych jakościowych i ilościowych cech;
np. grubość grupy komórek, jednolitość kształtu komórki, jednolitość rozmiaru komórki itp. Oba zbiory danych
są udostępnione na stronie University of California
Irvine Machine Learning Repository. Obrazy wykorzystane do wygenerowania obu zbiorów wraz z dwiema
wersjami programu Xcyt [4] (automatyczne i ręczne
wyodrębnianie jąder komórkowych) są zamieszczone na
stronie jego autorów (http:// dollar.biz.uiowa.edu/
~street/ xcyt/ images/).
Mimo że obrazy z bazy WDBC pozwalają na wyodrębnienie pojedynczych obiektów i profili na obrazie (w
postaci jąder komórkowych), to ich jakość nie pozwala
na wykrycie złożonych struktur w obrazie bądź relacji
występujących między elementami obrazu. Niewidoczne, lub ledwo widoczne są takie struktury jak cytoplazma czy nici chromatyny, a erytrocyty (stanowiące
ważny element oceny jakości materiału) są trudne do
odróżnienia ze względu na zastosowany barwnik, jak i
parametry sprzętu. (kamera JVC TK-1070U zamontowana na mikroskopie Olympus + karta frame grabber).
Porównanie jakości obrazów z bazy WDBC oraz proponowanej przez autorów bazy obrazów przedstawiono
na rys. 1. W tabeli 1 przedstawiono zestawienie charakterystyk porównywanych baz danych.
Tab.1. Porównanie charakterystyk zbiorów danych
Liczba przypadków
(łagodne - złośliwe)
Liczba obrazów
Format plików
Rozdzielczość
Liczba kolorów
Powiększenie (obiektyw x okular)
Barwienie
WDBC
569 (212-357)
Zielona Góra
50 (25-25)
569
GIF
512x480
256
63 x 2,5
500 (po 10 na
przypadek)
BMP
704x578
16 M
10/160 x 2,5
H+E
H+E
Analizowany obecnie zbiór obrazów pochodzi ze archiwów, jednego ze współautorów. Biopsje wykonano
pacjentkom
Poradni
Onkologicznej
NZOZ
ONKOMED, w większości igłą 0.5mm bez użycia aspiracji. Po wykonaniu rozmazów w możliwie najkrótszym
czasie, nie przekraczającym 3 sekund, utrwalono preparaty przy użyciu utrwalacza w aerozolu [cellfix firmy
Shandon]. Tak wykonane preparaty były następnie
barwione w automatycznym urządzeniu barwiącym
rutynową metodą hematoksyliną i eozyną (H+E) i nakryte szkiełkiem nakrywkowym przy użyciu balsamu
kanadyjskiego.
Obraz mikroskopowy rejestrowany był przy użyciu
mikroskopu AXIOPHOT firmy Zeiss, kamery CCD
IRIS firmy Sony na komputerze klasy PC.
Użyto następujących powiększeń 100x – jeden obraz, i 400x- dziewięć obrazów każdego przypadku,
fotografując pola tak, aby zawierały, co najmniej dziesięć komórek nadających się do analizy morfometrycznej, uzyskano w ten sposób w każdej analizowanej
próbie conajmniej 100 komórek.
3. EKSTRAKCJA CECH
Rys.1. Porównanie jakości obrazów z bazy WDBC (dwa
górne) oraz z bazy autorów (dwa dolne).
Każdy obiekt świata rzeczywistego można scharakteryzować za pomocą nieskończonej liczby atrybutów,
lecz tylko niewielka część z nich ma znacznie dla rozpatrywanego problemu klasyfikacyjnego i dlatego zwykle
proces doboru cech ma charakter arbitralny i odbywa się
przy udziale doświadczonego eksperta. W naszych
badaniach przy doborze cech wykorzystaliśmy bogate
doświadczenie cytopatologów znajdujących się w naszym zespole oraz wyniki doświadczeń innych badaczy. Stąd, głównie w celu porównania jakości zebranego materiału diagnostyczego z materiałem w bazie
WDBC, ekstrahowane są takie same cechy jak w przypadku wspomnianego programu Xcyt [5]. Poszczególne
cechy charakteryzują pojedyncze obiekty w postaci
wyizolowanych obrazów jąder komórkowych dla których obliczane są:
1) rozmiar (średnia wartość promienia liczonego
ze środka jądra komórki do każdego punktu
konturu),
2) długość konturu,
3) pole powierzchni,
4) zwartość (długość konturu2/pole powierzchni3)
5) wariancja promienia,
6) wklęsłość (zliczanie liczby cięciw między nie
przylegającymi punktami konturu, które przekraczają kontur),
7) tekstura (wariancja luminancji)
8) jednolitość rozmiaru (średnia wartość różnicy
między rozmiarem każdego jądra i wartością
średnią – miara różnorodności rozmiaru)
9) jednolitość zwartości (mierzona jak wyżej)
10) wartość maksymalna rozmiaru (uśredniona dla
trzech największych jąder)
11) największa zwartość (liczona jak wyżej).
Powyższe cechy są w większości wskaźnikami ilościowymi i na podstawie przeprowadzonych doświadczeń można stwierdzić, że dość dobrze dyskryminują
przypadki zmian łagodnych i złośliwych. Z doświad-
czeń klinicznych wynika bowiem np. że w przypadku
zmiany łagodnej jądra komórkowe nie wykazują większych różnic wielkości i są zwykle mniejsze. Dla wyznaczonych cech można również zauważyć, że w przypadku zmiany łagodnej wartości średnie dla wymienionych cech są mniejsze niż dla zmiany złośliwej [4].
Powyższy zestaw cech nie gwarantuje jednakże bezbłędnej klasyfikacji. Wyniki uzyskane na zbiorze testowym oscylują w granicach 85% dla metod dyskryminanty liniowej i ponad 90% dla metod odległościowych
(opartych na nieparametrycznych estymatorach funkcji
gęstości prawdopodobieństwa). Wynikać to może zarówno z powodu występujących anomalii w danych,
niewłaściwie dobranych przykładów – niedoskonałości
materiału diagnostycznego, jak i niedostatecznej liczby
cech. Innym problemem są błędy w obrazie wynikające
z zastosowanych technik przetwarzania obrazu cyfrowego, a w szczególności automatycznej segmentacji
obrazu w celu wyizolowania pojedynczych obrazów
jąder komórkowych. W projektowanej aplikacji automatycznego pozyskiwania cech przewiduje się wykorzystanie szerokiej gamy algorytmów segmentacji, takich
jak algorytmy detekcji krawędzi, algorytmy progowania
2D, maskowania czy segmentacji przez rozrost.
Stąd, w celu zapewnienia jeszcze lepszej skuteczności rozpoznawania przewidziane jest rozszerzenie wektora cech o dodatkowe wskaźniki mniej wrażliwe na
wymienione czynniki. Szczególnie przydatne wydają się
parametry morfometryczne w postaci współczynników
kształtu (np. cyrkularności, Haralicka, Malinowskiej),
momentów geometrycznych, pomiary z użyciem siatek
testowych (sieczne, cięciwy itp.) czy też sumaryczne
wielkości dotyczące określonej klasy obiektów w zdefiniowanym polu pomiarowym (parametry zbiorcze).
Zestaw testowy danych powinien zawierać również
kryteria porównawcze służące do oceny jakości ekstrahowanych zestawów cech. W naszym systemie do oceny jakości przestrzeni cech (w celu selekcji cech) wykorzystujemy następujące miary:
1) wymiar fraktalny,
2) miary inercji klas,
3) miary dyspersji i nakładania się klas,
4) kryteria oparte na elementach teorii informacji
(miary entropii, wzajemnej informacji, itp.).
4. PODSUMOWANIE
Zaprezentowany zestaw danych testowych jest naszym zdaniem interesującą propozycją nie tylko dla
badaczy zajmujących się problematyką komputerowej
analizy obrazów biomedycznych, ale również specjalistów z zakresu szeroko rozumianej dziedziny rozpoznawania obrazów.
W chwili obecnej w bazie danych znajduje się 500
obrazów, które są dostępne na stronie internetowej Instytutu Sterowania i Systemów Informatycznych Uniwersytetu Zielonogórskiego. Zakładamy, że baza zostanie powiększona w najbliższym czasie do ok. 3000
obrazów, tak aby zapewnić jak największą różnorodność przypadków klinicznych.
Oprócz zarejestrowanych obrazów mikroskopowych
na wspomnianej stronie znajduje się również aplikacja
ImageCyt uruchamiana zarówno z poziomu przeglądarki internetowej (aplet napisany w języku Java) lub w
środowisku uruchomieniowym Javy (aplikacja działająca w dowolnym systemie operacyjnym wyposażonym w
takie środowisko). ImageCyt służy do automatycznego
przetwarzania obrazów i generowania cech. Istnieje
możliwość zwiększenia funkcjonalności programu poprzez dołączanie tzw. wtyczek (ang. plugins). Interfejs
do obsługi wtyczek jest prosty w obsłudze i pozwala na
dołączanie nowych algorytmów przetwarzania, analizy
czy klasyfikacji obrazów. Sprzyja to porównywaniu
wyników uzyskanych przy zastosowaniu wielu algorytmów:
- pozyskiwania cech z obrazu,
- selekcji cech,
- redukcji wymiarowości metodami ekstrakcji
cech,
- eksploracji wiedzy (ang. data mining),
- klasyfikacji.
Szczególnie ciekawym problemem wydaje się zastosowanie metod eksploracji wiedzy do automatycznego
generowania kryteriów rozpoznawania zmian chorobowych. Przypuszczenie to wynika z naszej wysokiej
oceny jakości wykonanych zdjęć, które pozwalają nie
tylko na analizę morfometryczną samych jąder komórkowych, ale również na wyszczególnienie na obrazach
innych elementów jak erytrocyty, komórki histiocytarne, cytoplazma itd. Analiza zależności występujących
między tymi elementami może służyć do wykrycia
pewnych prawidłowości występujących w przypadkach
zmian łagodnych bądź złośliwych, które nie są jeszcze
znane w cytopatologii a które zmniejszałyby ryzyko
popełnienia błędnej diagnozy.
Oprócz zastosowań komparatywnych, proponowany
zestaw testowy może być wykorzystywany jako pomoc
dydaktyczna w procesie kształcenia studentów medycyny.
LITERATURA
[1]
[2]
[3]
Underwood J.C.E.: Introduction to Biopsy Interpretation
and Surgical Pathology, 2 ed., Springer-Verlag, London
1987.
Zieliński K.W., Strzelecki M.: Komputerowa analiza
obrazu biomedycznego. Wstęp do morfometrii i patologii ilościowej, PWN, Warszawa, 2002.
Thiran J.P., Macq B.: Morphological Feature Extraction
for the Classification of Digital Images of Cancerous
Tissues, IEEE Transactions on Biomedical Engineering,
43(10):1011-1020, 1996.
[4] Wolberg W.H., Street W.N., Mangasarian O.L.:
Breast cytology diagnosis via digital image analysis, Analytical and Quantitative Cytology and Histology, 15(6):396-404, 1993.
[5]
Street W. N.: Xcyt: A system for remote cytological
diagnosis and prognosis of breast cancer, w Jain L.C.,
(editor), Soft Computing Techniques in Breast Cancer
Prognosis and Diagnosis, 297-322, World Scientific
Publishing, Singapore, 2000.

Podobne dokumenty