Wzorzec formatowania artykułów SIIB`2004
Transkrypt
Wzorzec formatowania artykułów SIIB`2004
ZESTAW TESTOWY DLA PROBLEMU DIAGNOZOWANIA RAKA PIERSI PRZY UŻYCIU CIENKOIGŁOWEJ BIOPSJI ANDRZEJ MARCINIAK*, ROMAN MONCZAK**, MARIUSZ KOŁODZIŃSKI**, PRZEMYSŁAW PRĘTKI*, ANDRZEJ OBUCHOWICZ* * Instytut Sterowania i Systemów Informatycznych, Uniwersytet Zielonogórski, Zielona Góra, {a.marciniak;a.obuchowicz;p.pretki}@issi.uz.zgora.pl.pl ** Zakład Patomorfologii SPZOZ Szpitala Wojewódzkiego, Zielona Góra Streszczenie. Niniejsze opracowanie prezentuje system porównawczy (ang. benchmark) dla zagadnienia diagnozowania raka piersi metodą biopsji aspiracyjnej cienkoigłowej. System jest zaprojektowany tak, aby możliwe było porównywanie skuteczności algorytmów komputerowego rozpoznawania występujących zmian chorobowych dla przypadków łagodnych i złośliwych. Jakość obrazu mikroskopowego komórek guza jest weryfikowana przez cytopatologa, a następnie obraz rejestrowany jest w bazie przykładów. Właściwa klasyfikacja przypadków złośliwych potwierdzana jest histopatologicznie, a łagodnych co najmniej roczną obserwacją. Ze zweryfikowanych obrazów dwuwymiarowych ekstrahowane są cechy, których jakość określana jest za pomocą kryteriów selekcji cech. 1. WSTĘP Rak piersi jest najczęściej występującym nowotoworem (wyłączając raka skóry), u kobiet zarówno w Stanach Zjednoczonych, Europie jak i Australii [1]. Wśród kobiet, które przeżyły 70 lat ok. 12% miała, ma lub będzie miała raka sutka. Rak piersi powoduje też wysoką śmiertelność - rzędu 50% chorych. Rokowania w raku piersi są, w pierwszej kolejności, zależne od zaawansowania procesu nowotworowego zanim podjęte zostanie odpowiednie leczenie, a więc są one względnie bezpośrednio funkcją czasu. Jeśli poprawna diagnoza może być ustalona dostatecznie wcześnie, wówczas rokowanie jest lepsze, jako że w większości przypadków guz jest wówczas ograniczony do piersi zanim rozprzestrzeni się drogą chłonną poprzez węzły chłonne, lub drogą krwionośną do innych narządów. Jest to tym istotniejsze, że niektóre z objawów łagodnych schorzeń gruczołów sutkowych mogą być podobne do objawów raka piersi i odwrotnie. Pacjentka uspokojona diagnozą mówiącą, że zmiany są łagodne, może nie zdawać sobie sprawy, że powstały inne - tym razem złośliwe. Rak piersi należy do chorób podstępnych, a guz o średnicy 5mm może dawać odległe przerzuty, choć ok.95% guzów o średnicy do 1cm ograniczonych jest do gruczołu piersiowego. Zatem oczywistym jest fakt, iż piersi winny być regularnie i wnikliwie badane. Nowoczesna medycyna nie dostarczyła lekarzom, jak dotychczas, stuprocentowo pewnych, możliwie tanich a zarazem nieinwazyjnych narzędzi diagnostycznych do obrazowania patologii sutków. Choć wycięcie podejrzanej zmiany podczas operacji chirurgicznej i jej histopatologiczna ocena pozwala na blisko 100% pewność rozpoznania, to postępowanie takie nie spełnia warunków łatwości wykonania, powszechnej i szybkiej dostępności, jak i niskich kosztów. Ponadto chirurgiczna biopsja gruczołu sutkowego, będąc w istocie zabiegiem operacyjnym, obarczona jest możliwością wystąpienia niekorzystnych skutków ubocznych, a nawet powikłań, jak każda inna interwencja chirurgiczna. Powyższe uwarunkowania powodują że w praktyce dość istotną rolę pełni tzw. test potrójny, który polega na zestawieniu wyników trzech rodzajów badań o różnym stopniu czułości i pozwala na prawie 100% pewność rozpoznania. Składa się on z: • badania palpacyjnego, • badania obrazowego przy użyciu ultrasonografii lub mammografii, • biopsji cienkoigłowej. Biopsja aspiracyjna cienkoigłowa (ang. Fine Needle Aspirate Biopsy - FNAB) to zabieg pobrania komórek bezpośrednio z głębi guza do oceny mikroskopowej. Pod kontrolą mammograficzną lub ultrasonograficzną guzek nakłuwany jest igłą o średnicy poniżej 1mm połączonej ze strzykawką zasysającą komórki z guza. Biopsja cienkoigłowa bez użycia aspiracji (FNB) polega na wielokrotnym przemieszczaniu w obrębie guza igły, do której pod wpływem sił włosowatych dostają się złuszczone komórki w płynie tkankowym. W przypadku, gdy zmiana wypełniona jest płynem i okaże się torbielą, po opróżnieniu stanie się ona niewy- czuwalna i niewidoczna w obrazie radiologicznym. Jeżeli zaś jest to zmiana lita, pobrane komórki rozprowadzane są na szkiełku mikroskopowym, odpowiednio barwione i poddawane badaniu mikroskopowemu w celu stwierdzenia obecności komórek nowotworowych. Badanie FNB należy do grupy badań inwazyjnych, obarczonych znikomym ryzykiem powikłań, jest jednocześnie najbardziej miarodajnym, gdyż pozwala określić, czy zmiana którą badamy, ma charakter łagodny, czy też złośliwy. FNB obdarczona jest bowiem najwyższą czułością ze wszystkich badań wchodzących w skład testu potrójnego. Pewnym mankamentem metody FNB są wymagania dotyczące głębokiej wiedzy i doświadczenia cytopatologa, który najpierw ocenia jakość materiału diagnostycznego, a następnie decyduje o jego zaklasyfikowaniu. Choć przyjęto pewne ogólne kryteria rozpoznania zarówno zmiany łagodnej, jak i złośliwej, to są one mimo wszystko dość nieścisłe i wyniki rozpoznania zależą silnie od czynnika ludzkiego (występuje element uznaniowości). Wynika to z faktu, że umysł odbiorcy zniekształca obiektywne znaczenie treści przekazu, gdyż jest ono interpretowane i „filtrowane” przez jego indywidualne doświadczenia [2]. Zatem przykładowe kryteria sformułowane przez ekspertów w dziedzinie cytopatologii dla rozpoznania zmiany łagodnej takie jak: „stosunkowo mała liczba komórek”, „jądra komórkowe niemal jednakowej wielkości o równomiernie rozłożonej chromatynie”, czy „tło rozmazu czyste” mogą być w różny sposób interpretowane na obrazach tej samej klasy w zależności od doświadczenia patologa. Na jego ocenę mogą mieć wpływ różnice w przygotowywaniu materiału diagnostycznego (szczególnie barwienia materiału), czy nawet klasa sprzętu optycznego. Stąd można wywnioskować zasadność wprowadzenia komputerowych analizatorów obrazu jako obiektywnych i zautomatyzowanych narzędzi dla ocen ilościowych zjawisk morfologicznych, w tym tradycyjnych wskaźników charakteryzujących zmiany chorobowe. Dodatkową korzyścią może być możliwość kreowania złożonych ciągów działań z wykorzystaniem metod morfologii matematycznej, co może poszerzyć liczbę wskaźników [3]. Dzięki temu możliwe jest łączne uwzględnienie właściwości geometrycznych, topologicznych, densytometrycznych i kolorymetrycznych ocenianych struktur komórek guza. 2. ZBIORY DANYCH Komputerowy system analizy wymaga odpowiedniego zbioru zweryfikowanych przykładów dla potrzeb projektowania, strojenia parametrów oraz testowania systemu. Mimo, że w światowej literaturze naukowej można znaleźć wiele przykładów systemów rozpoznawania odmiany guza piersi u kobiet, to często trudno jest dokonać obiektywnej oceny skuteczności opisywanych algorytmów. Bierze się to z tego, że wielu autorów stosuje własne zbiory danych, otrzymywane w wyniku przeprowadzenia własnych eksperymentów. Miarodajna analiza komparatywna wyników uzyskiwanych przez różne zespoły badawcze jest w takim przypadku niemożliwa, gdyż zbiory obrazów mogą różnić się liczeb- nością, rozkładem klas, sposobem przygotowania materiału diagnostycznego, arbitralnym doborem „łatwych” przypadków itp. Wprawdzie dość dużą popularnością dla testowania algorytmów klasyfikacyjnych cieszy się zestaw danych Wisconsin Breast Cancer Database, udostępniony przez Repository of University of Wisconsin Hospitals z USA, ale z punktu widzenia projektowania całych systemów rozpoznawania raka piersi jest on raczej mało przydatny. WDBC zawiera dwa zbiory danych klinicznych dla przebadanych pacjentek. Oba zawierają wektory atrybutów charakteryzujących cechy pojedynczych komórek z obrazów mikroskopowych, choć różnią się liczbą przypadków oraz ekstrahowanymi cechami. Pierwszym zestaw atrybutów zawiera wartości statystyk dla ilościowych cech komórek, takich jak np. obszar, promień, czy wymiar fraktalny. Drugi z kolei zawiera wykonywane przez autorów oceny (w skali 1-10) pewnych jakościowych i ilościowych cech; np. grubość grupy komórek, jednolitość kształtu komórki, jednolitość rozmiaru komórki itp. Oba zbiory danych są udostępnione na stronie University of California Irvine Machine Learning Repository. Obrazy wykorzystane do wygenerowania obu zbiorów wraz z dwiema wersjami programu Xcyt [4] (automatyczne i ręczne wyodrębnianie jąder komórkowych) są zamieszczone na stronie jego autorów (http:// dollar.biz.uiowa.edu/ ~street/ xcyt/ images/). Mimo że obrazy z bazy WDBC pozwalają na wyodrębnienie pojedynczych obiektów i profili na obrazie (w postaci jąder komórkowych), to ich jakość nie pozwala na wykrycie złożonych struktur w obrazie bądź relacji występujących między elementami obrazu. Niewidoczne, lub ledwo widoczne są takie struktury jak cytoplazma czy nici chromatyny, a erytrocyty (stanowiące ważny element oceny jakości materiału) są trudne do odróżnienia ze względu na zastosowany barwnik, jak i parametry sprzętu. (kamera JVC TK-1070U zamontowana na mikroskopie Olympus + karta frame grabber). Porównanie jakości obrazów z bazy WDBC oraz proponowanej przez autorów bazy obrazów przedstawiono na rys. 1. W tabeli 1 przedstawiono zestawienie charakterystyk porównywanych baz danych. Tab.1. Porównanie charakterystyk zbiorów danych Liczba przypadków (łagodne - złośliwe) Liczba obrazów Format plików Rozdzielczość Liczba kolorów Powiększenie (obiektyw x okular) Barwienie WDBC 569 (212-357) Zielona Góra 50 (25-25) 569 GIF 512x480 256 63 x 2,5 500 (po 10 na przypadek) BMP 704x578 16 M 10/160 x 2,5 H+E H+E Analizowany obecnie zbiór obrazów pochodzi ze archiwów, jednego ze współautorów. Biopsje wykonano pacjentkom Poradni Onkologicznej NZOZ ONKOMED, w większości igłą 0.5mm bez użycia aspiracji. Po wykonaniu rozmazów w możliwie najkrótszym czasie, nie przekraczającym 3 sekund, utrwalono preparaty przy użyciu utrwalacza w aerozolu [cellfix firmy Shandon]. Tak wykonane preparaty były następnie barwione w automatycznym urządzeniu barwiącym rutynową metodą hematoksyliną i eozyną (H+E) i nakryte szkiełkiem nakrywkowym przy użyciu balsamu kanadyjskiego. Obraz mikroskopowy rejestrowany był przy użyciu mikroskopu AXIOPHOT firmy Zeiss, kamery CCD IRIS firmy Sony na komputerze klasy PC. Użyto następujących powiększeń 100x – jeden obraz, i 400x- dziewięć obrazów każdego przypadku, fotografując pola tak, aby zawierały, co najmniej dziesięć komórek nadających się do analizy morfometrycznej, uzyskano w ten sposób w każdej analizowanej próbie conajmniej 100 komórek. 3. EKSTRAKCJA CECH Rys.1. Porównanie jakości obrazów z bazy WDBC (dwa górne) oraz z bazy autorów (dwa dolne). Każdy obiekt świata rzeczywistego można scharakteryzować za pomocą nieskończonej liczby atrybutów, lecz tylko niewielka część z nich ma znacznie dla rozpatrywanego problemu klasyfikacyjnego i dlatego zwykle proces doboru cech ma charakter arbitralny i odbywa się przy udziale doświadczonego eksperta. W naszych badaniach przy doborze cech wykorzystaliśmy bogate doświadczenie cytopatologów znajdujących się w naszym zespole oraz wyniki doświadczeń innych badaczy. Stąd, głównie w celu porównania jakości zebranego materiału diagnostyczego z materiałem w bazie WDBC, ekstrahowane są takie same cechy jak w przypadku wspomnianego programu Xcyt [5]. Poszczególne cechy charakteryzują pojedyncze obiekty w postaci wyizolowanych obrazów jąder komórkowych dla których obliczane są: 1) rozmiar (średnia wartość promienia liczonego ze środka jądra komórki do każdego punktu konturu), 2) długość konturu, 3) pole powierzchni, 4) zwartość (długość konturu2/pole powierzchni3) 5) wariancja promienia, 6) wklęsłość (zliczanie liczby cięciw między nie przylegającymi punktami konturu, które przekraczają kontur), 7) tekstura (wariancja luminancji) 8) jednolitość rozmiaru (średnia wartość różnicy między rozmiarem każdego jądra i wartością średnią – miara różnorodności rozmiaru) 9) jednolitość zwartości (mierzona jak wyżej) 10) wartość maksymalna rozmiaru (uśredniona dla trzech największych jąder) 11) największa zwartość (liczona jak wyżej). Powyższe cechy są w większości wskaźnikami ilościowymi i na podstawie przeprowadzonych doświadczeń można stwierdzić, że dość dobrze dyskryminują przypadki zmian łagodnych i złośliwych. Z doświad- czeń klinicznych wynika bowiem np. że w przypadku zmiany łagodnej jądra komórkowe nie wykazują większych różnic wielkości i są zwykle mniejsze. Dla wyznaczonych cech można również zauważyć, że w przypadku zmiany łagodnej wartości średnie dla wymienionych cech są mniejsze niż dla zmiany złośliwej [4]. Powyższy zestaw cech nie gwarantuje jednakże bezbłędnej klasyfikacji. Wyniki uzyskane na zbiorze testowym oscylują w granicach 85% dla metod dyskryminanty liniowej i ponad 90% dla metod odległościowych (opartych na nieparametrycznych estymatorach funkcji gęstości prawdopodobieństwa). Wynikać to może zarówno z powodu występujących anomalii w danych, niewłaściwie dobranych przykładów – niedoskonałości materiału diagnostycznego, jak i niedostatecznej liczby cech. Innym problemem są błędy w obrazie wynikające z zastosowanych technik przetwarzania obrazu cyfrowego, a w szczególności automatycznej segmentacji obrazu w celu wyizolowania pojedynczych obrazów jąder komórkowych. W projektowanej aplikacji automatycznego pozyskiwania cech przewiduje się wykorzystanie szerokiej gamy algorytmów segmentacji, takich jak algorytmy detekcji krawędzi, algorytmy progowania 2D, maskowania czy segmentacji przez rozrost. Stąd, w celu zapewnienia jeszcze lepszej skuteczności rozpoznawania przewidziane jest rozszerzenie wektora cech o dodatkowe wskaźniki mniej wrażliwe na wymienione czynniki. Szczególnie przydatne wydają się parametry morfometryczne w postaci współczynników kształtu (np. cyrkularności, Haralicka, Malinowskiej), momentów geometrycznych, pomiary z użyciem siatek testowych (sieczne, cięciwy itp.) czy też sumaryczne wielkości dotyczące określonej klasy obiektów w zdefiniowanym polu pomiarowym (parametry zbiorcze). Zestaw testowy danych powinien zawierać również kryteria porównawcze służące do oceny jakości ekstrahowanych zestawów cech. W naszym systemie do oceny jakości przestrzeni cech (w celu selekcji cech) wykorzystujemy następujące miary: 1) wymiar fraktalny, 2) miary inercji klas, 3) miary dyspersji i nakładania się klas, 4) kryteria oparte na elementach teorii informacji (miary entropii, wzajemnej informacji, itp.). 4. PODSUMOWANIE Zaprezentowany zestaw danych testowych jest naszym zdaniem interesującą propozycją nie tylko dla badaczy zajmujących się problematyką komputerowej analizy obrazów biomedycznych, ale również specjalistów z zakresu szeroko rozumianej dziedziny rozpoznawania obrazów. W chwili obecnej w bazie danych znajduje się 500 obrazów, które są dostępne na stronie internetowej Instytutu Sterowania i Systemów Informatycznych Uniwersytetu Zielonogórskiego. Zakładamy, że baza zostanie powiększona w najbliższym czasie do ok. 3000 obrazów, tak aby zapewnić jak największą różnorodność przypadków klinicznych. Oprócz zarejestrowanych obrazów mikroskopowych na wspomnianej stronie znajduje się również aplikacja ImageCyt uruchamiana zarówno z poziomu przeglądarki internetowej (aplet napisany w języku Java) lub w środowisku uruchomieniowym Javy (aplikacja działająca w dowolnym systemie operacyjnym wyposażonym w takie środowisko). ImageCyt służy do automatycznego przetwarzania obrazów i generowania cech. Istnieje możliwość zwiększenia funkcjonalności programu poprzez dołączanie tzw. wtyczek (ang. plugins). Interfejs do obsługi wtyczek jest prosty w obsłudze i pozwala na dołączanie nowych algorytmów przetwarzania, analizy czy klasyfikacji obrazów. Sprzyja to porównywaniu wyników uzyskanych przy zastosowaniu wielu algorytmów: - pozyskiwania cech z obrazu, - selekcji cech, - redukcji wymiarowości metodami ekstrakcji cech, - eksploracji wiedzy (ang. data mining), - klasyfikacji. Szczególnie ciekawym problemem wydaje się zastosowanie metod eksploracji wiedzy do automatycznego generowania kryteriów rozpoznawania zmian chorobowych. Przypuszczenie to wynika z naszej wysokiej oceny jakości wykonanych zdjęć, które pozwalają nie tylko na analizę morfometryczną samych jąder komórkowych, ale również na wyszczególnienie na obrazach innych elementów jak erytrocyty, komórki histiocytarne, cytoplazma itd. Analiza zależności występujących między tymi elementami może służyć do wykrycia pewnych prawidłowości występujących w przypadkach zmian łagodnych bądź złośliwych, które nie są jeszcze znane w cytopatologii a które zmniejszałyby ryzyko popełnienia błędnej diagnozy. Oprócz zastosowań komparatywnych, proponowany zestaw testowy może być wykorzystywany jako pomoc dydaktyczna w procesie kształcenia studentów medycyny. LITERATURA [1] [2] [3] Underwood J.C.E.: Introduction to Biopsy Interpretation and Surgical Pathology, 2 ed., Springer-Verlag, London 1987. Zieliński K.W., Strzelecki M.: Komputerowa analiza obrazu biomedycznego. Wstęp do morfometrii i patologii ilościowej, PWN, Warszawa, 2002. Thiran J.P., Macq B.: Morphological Feature Extraction for the Classification of Digital Images of Cancerous Tissues, IEEE Transactions on Biomedical Engineering, 43(10):1011-1020, 1996. [4] Wolberg W.H., Street W.N., Mangasarian O.L.: Breast cytology diagnosis via digital image analysis, Analytical and Quantitative Cytology and Histology, 15(6):396-404, 1993. [5] Street W. N.: Xcyt: A system for remote cytological diagnosis and prognosis of breast cancer, w Jain L.C., (editor), Soft Computing Techniques in Breast Cancer Prognosis and Diagnosis, 297-322, World Scientific Publishing, Singapore, 2000.