Zintegrowany system wspomagania diagnostyki mammograficznej
Transkrypt
Zintegrowany system wspomagania diagnostyki mammograficznej
Zintegrowany system wspomagania diagnostyki mammograficznej A. Przelaskowski1, T.Podsiadły-Marczykowska2, P.Boniński1, A.Wróblewska1 1 Instytut Radioelektroniki PW, Nowowiejska 15/19, Warszawa, 2Instytut Biocybernetyki i Inżynierii Biomedycznej PAN, ul. Trojdena 4, 02-109 Warszawa [email protected] Streszczenie: W pracy przedstawiono koncepcję zintegrowanej stacji diagnostycznej do interpretacji badań mammograficznych. Główne elementy wspierające pracę specjalisty do narzędzie CAD - komputerowego wspomagania diagnozy, interfejs do oceny badań bazujący na ontologii mammografii oraz teleinformatyczny system z indeksowaniem po zawartości i wyszukiwaniem referencyjnych badań w celach porównawczych. Skoncentrowano się na formalnym opisie dziedziny wiedzy użytecznej w diagnostyce mammografii oraz charakterystyce systemu teleinformatycznego integrującego usługi dostępne w stacji diagnostycznej. Słowa kluczowe: wspomagania diagnostyki mammografii, ontologia mammografii, indeksowanie zawartością obrazów Wprowadzenie Konieczność komputerowego wspomagania wynika z faktu, że diagnostyka mammograficzna uchodzi w radiologii za najtrudniejszą, a liczba popełnianych błędów w badaniach przesiewowych sięga nawet kilkudziesięciu procent. Pierwsze narzędzia CAD zaakceptowane przez amerykański urząd standaryzacyjny FDA (food and drug administration) dotyczyły mammografii (1998 rok), coraz powszechniej są one stosowane w praktyce klinicznej (szacuje się, że obecnie około 30% badań przesiewowych w USA wykonywanych jest ze wsparciem CAD1). Różne koncepcje poprawy efektywności interpretacji badań koncentrują się przede wszystkim na zagadnieniu obiektywizacji badań, dokonywanej poprzez: zmniejszenie niejednoznaczności pojęciowej w dziedzinie mammografii uzyskane poprzez systematyzację i formalizację struktury wiedzy tej dziedziny w modelu ontologicznym, automatyczne podpowiedzi, dokonywane na podstawie numerycznej analizy i rozumienia treści diagnostycznej obrazów (systemy CAD), wykorzystanie ontologicznego modelu dziedziny w komputerowych narzędziach wspomagania interpretacji badań (CAD, indeksowanie badań po zawartości, inteligentne przeglądanie badań itp.), zwiększające ich użyteczność diagnostyczną, ujednolicenie procedur diagnostycznych uwzględniających komputerowe narzędzia wspomagania interpretacji, propozycje protokołów badań, edytorów opisu, generatorów raportów, weryfikatorów opisu, procedur stosowania wspierających narzędzi itp. W niniejszej pracy przedstawiono próbę integracji działań w kierunku obiektywizacji procesu diagnostycznego celem zwiększenia skuteczności interpretacji badań w zakresie mammografii. Proponowana koncepcja zintegrowanej stacji diagnostycznej (ZSD) obejmuje system wspomagania CAD (ang. computer-aided diagnosis) do mammografii rentgenowskiej - MammoViewer, ontologię mammografii z interfejsem diagnostycznym oraz implementację systemu indeksowania i wyszukiwania obrazów po zawartości iShark ze wspomaganiem telekonsultacji, który służy do realizacji pomysłu referencyjnej bazy wzorców diagnostycznych. Integracja tych rozwiązań w inteligentnej stacji diagnostycznej jest rozszerzeniem typowych rozwiązań stosowanych w systemach informacyjnych RIS/PACS. Powstało w ten sposób środowisko teleinformatyczne z zaawansowanymi narzędziami rozpoznawania i rozumienia obrazów, którego celem jest dostarczenie możliwie kompletnej informacji diagnostycznej na etapie interpretacji badań i formułowania ocen. Obok przejrzystego interfejsu ważne jest tutaj zestawienie informacji pochodzącej z różnych źródeł i formułowanie syntetycznych wskazań zwiększających skuteczność diagnozy. Integracja wspomnianych narzędzi i systemów dokonywana jest na poziomie oprogramowania, formatów danych, metod wizualizacji, współdzielenia zasobów, a przede wszystkim formy zintegrowanego, przyjaznego i elastycznego interfejsu dającego dostęp do różnego typu usług, dopasowanego do różnorodnych wymagań radiologów. Badanie prowadzone są przy stałej współpracy z radiologami z kilku ośrodków. Tworzone jest 1 http://www.rt-image.com/Examine__Mammography_The_Case_for_CAD_Examining_the_technology_and_its_implicati/ content=9504J05C4856869640769A72448080441 stanowisko diagnostyczne z szerokim dostępem do zasobów wewnętrznych (symulowany ośrodek medyczny, baza danych obrazowych, rekordów pacjenta) oraz zewnętrznych (referencyjne bazy danych, telekonsultacje, odbiorcy usług, tele-edukacja, itp.). W pracy tej obok samej koncepcji ZSD opisano metody doskonalenia diagnostyki mammograficznej (mmg) z wykorzystaniem ontologii oraz technologii indeksowania i wyszukiwania obrazów. Zmienność interpretacji w mammografii przesiewowej i diagnostycznej – fakty i hipotetyczne mechanizmy powstawania Zależna od obserwatora zmienność oceny diagnostycznej jest faktem znanym w wielu obszarach medycyny [1]. Nawet ocena histopatologiczna – „ostateczna prawda” o charakterze zmiany nie stanowi tu wyjątku [2]. W literaturze medycznej systematycznie od prawie 20 lat pojawiają się kolejne doniesienia świadczące o istnieniu znacznej zmienności interpretacji dla mammografii przesiewowej [3-6]. Niestety oceniany materiał jest trudno porównywalny, a stosowane miary zmienności interpretacji mammogramów niejednolite (Tab.1). Poważnym problemem jest brak w w/w pracach hipotez wyjaśniających mechanizmy powstawania zjawiska zmienności diagnostycznej. [3] 1994 [4] 1996 Ilość radiologów 10 108 Ilość mammogramów 150 79 [5] 1998 [6] 2002 2 24 2616 8734 Praca Miara oceny Zmienności Statystyka kappa Analiza ROC, Ocena procentowa Statystyka kappa Ocena procentowa Tab.1 Ocena zmienności interpretacji w mammografii przesiewowej od 1994 -2002 - niejednolity (ilość radiologów i ilość mammogramów) materiał oraz brak porównywalnych kryteriów oceny zmienności diagnozy w mammografii. Do niedawna zmienność interpretacji była badana tylko dla mammografii przesiewowej. Praca z 2004 roku [7] potwierdza istnienie zmienności interpretacji mammogramów również dla mammografii diagnostycznej. Autorzy stawiają hipotezę, że jednym z możliwych powodów zmienności interpretacji mammogramów jest niejednolitość szeroko pojętych umiejętności diagnostycznych radiologów – odpowiadająca zaobserwowanemu szerokiemu zakresowi pól pod krzywymi ROC, mierzącymi efektywność poszczególnych obserwatorów. Praca z 2007 roku [8] potwierdziła istnienie szerokiego zakresu zmienności interpretacji w mammografii diagnostycznej, który nie może być wyjaśniony szczególnymi cechami pacjentek, których badania oceniano. Badanie oparto na obszernym materiale: 123 radiologów pracujących w 72 instytucjach medycznych, materiał do analizy statystycznej stanowiło 36 000 mammogramów diagnostycznych. Dla całości badanej próby mediana czułości ( TP ,TP – przyp. prawdziwie pozytywne, FP- przyp. fałszywie pozytywne) wynosi 79%, ale TP FN FP ) TN FP wynosi 4,3%, a zakres zmienności: od 0 do 16%. Ważny wniosek autorów [8] dotyczy afiliacji radiologów wyróżniających się wysoką czułością w ocenie mammogramów. Okazuje się, że najtrafniej interpretują badania mmg radiolodzy z centrów akademickich, przy jednoczesnym niewielkim wzroście ilości przypadków ocenionych fałszywie pozytywnie (Tab.2) niepokojący jest bardzo szeroki zakres zmienności wynoszący od 27% do 100%. Specyficzność ( Centra akademickie Centra nie-akademickie Czułość (mediana) 88% 76% Czułość 95% [CI] 77-95% 72-79% Specyficzność (mediana) 7,8% 4,2% Specyficzność 95% [CI] 4,8-12,7% 3,8- 4,7% Tab. 2 Porównanie czułości oceny mammogramów przez radiologów pracujących w naukowych instytucjach medycznych i instytucjach „poza akademickich”. Ten ostatni wniosek autorów [8] jest zbieżny z hipotezą postawioną w pracy [7], mówiącą o niejednolitym poziomie umiejętności diagnostycznych radiologów. W ogromnym uproszczeniu, na umiejętności diagnostyczne specjalisty od mammografii składają się: wiedza medyczna dotycząca dziedziny obrazowania (typy zmian, ich cechy, możliwe wartości cech, ich znaczenie diagnostyczne itd.), umiejętność detekcji zmiany i oceny jej cech w mammogramie oraz doświadczenie. Każdy z w/w typów ‘umiejętności diagnostycznych’ wymaga innych narzędzi i formalizmów. Tworzone formalne opisy wiedzy służą wyrównywaniu umiejętności diagnostycznych radiologów związanych z wiedzą medyczną. Koncepcja integracji metod wspomagania W centrach radiografii cyfrowej zasadniczym miejscem opisu, interpretacji badań obrazowych jest stacja diagnostyczna. Elementami warunkującymi skuteczną pracę radiologa są tutaj przede wszystkim moduł radiologicznego systemu informacyjnego RIS (dostęp do danych pacjenta – tzw. rekordu pacjenta - i innych danych gromadzonych w szpitalnym systemie informacyjnym HIS), komunikacja z systemem PACS (archiwizacji i zarządzania przepływem informacji obrazowej) gwarantująca dostęp to aktualnych badań obrazowych oraz przeglądarka obrazów z zaimplementowanymi często narzędziami ułatwiającymi analizę obrazów, wstępne ich przetwarzanie, poprawę warunków obserwacji, porównania i zestawiania kilku badań itp. Dodatkowo stacja może by wyposażona w moduł do komunikacji telemedycznej w celu dodatkowej telekonsultacji ze specjalistą zewnętrznym. Warunkiem koniecznym efektywnej pracy radiologa jest możliwie pełna integracja tych systemów i narzędzi, np. uruchamianie przeglądarki bezpośrednio z modułu RIS, synchronizacja opisów badań w RIS i tekstów zapisanych w pliku dicom z badaniem obrazowym, pełna integracja informacji znajdujących się w obu bazach: PACS i RIS (każda zmiana dotycząca badania obrazowego dokonana w jednej bazie musi być zauważona w drugiej) – szerzej można o tym przeczytać w [9]. Dodatkowe wsparcie procesu interpretacji badań metodami komputerowego wspomagania diagnostyki wykorzystuje bazę RIS/PACS/przeglądarka badań uzupełniając ją o zaawansowane metody obróbki obrazów, dodatkowe rozwiązania teleinformatyczne oraz interfejsy użytkownika usprawniające protokół badań. Celem jest ułatwienie pracy radiologa, redukcja wpływu niekorzystnych czynników subiektywnych (zmęczenie, brak koncentracji, zróżnicowanie wiedzy i doświadczenia itp.), obiektywizacja procesu formułowania decyzji diagnostycznych, wreszcie wydobycie informacji ukrytej, której percepcja w typowych warunkach prezentacji jest niemożliwa bądź bardzo ograniczona oraz pomocnicze wnioskowanie, agregujące w sposób kompleksowy dostępną informację z możliwie szerokiego zestawu źródeł. Zaproponowano następujące, wzajemnie powiązane elementy zintegrowanego wspomagania komputerowego diagnostyki, realizowanego na stacji diagnostycznej centrum radiologii cyfrowej w zastosowaniu do diagnostyki mammograficznej: 1) narzędzie komputerowego wspomagania diagnozy CAD – MammoViewer [10], z automatyczną detekcją skupisk mikrozwapnień, guzów i zaburzeń architektury, z poprawą percepcji zmian i zestawem dodatkowych metod przetwarzania wstępnego i poprawy warunków wizualizacji badań, dającym możliwość dostosowania warunków prezentacji informacji obrazowej do specyfiki pacjenta oraz technicznych warunków badania; przykładowo, uzyskiwana obecnie czułość automatycznej detekcji skupisk mikrozwapnień (testy na grupie ponad 150 mammogramów) sięga średnio 86%, przy czym dla najtrudniejszej grupy najsubtelniejszych zmian (1 w skali 1-5) wynosi 67%, zaś dla łatwiejszych przypadków (4-5 w skali subtelności) sięga 100%; średnia liczba wskazań fałszywie pozytywnych wynosi 1,46 (0 dla łatwiejszych badań z dominacją tkanki tłuszczowej); MammoViewer bazuje na algorytmach przetwarzania, analizy, rozpoznawania i rozumienia mammogramów, ale dodatkowo do poprawy jego efektywności wykorzystuje się sformalizowaną, obiektywizowaną wiedzę medyczną przede wszystkim w zakresie charakterystyki semantyki obrazów, opisu właściwości zmian interpretowanych w badaniach; tzw. rezonans poznawczy, tj. dopasowanie numerycznych charakterystyk cech obiektów do opisu semantycznego, dokonane w możliwie znormalizowanej przestrzeni daje uniwersalne wskaźniki patologii, redukując liczbę wskazań fałszywych; numeryczne deskryptory cech patologii sprawdzone w CAD mogą być z kolei wykorzystane do bardziej formalnych opisów ontologicznych oraz przy indeksowaniu zawartością mammogramów; 2) narzędzie wspomagania interpretacji mammogramów – MammoEdit, bazujące na ontologii mammografii, formalizujące nie tylko zestaw stosowanych pojęć, właściwości zmian, metod interpretacji, opisów, warunków badań, itp., także czynników mających choćby niewielki wpływ na przebieg i efekt badania, ale również stosujące numeryczne deskryptory, będące domknięciem obiektywnego opisu zmian w hierarchii uporządkowanej wiedzy; dokładniejszą charakterystykę MammoEdit przedstawiono poniżej; 3) wyszukiwarka badań referencyjnych bazująca na systemie indeksowania zawartością mammogramów, z usługami dostępu do gromadzonych w szerokiej skali badań, zweryfikowanych klinicznie, opisanych, pomocnych przy interpretacji badań trudnych; kluczowym zagadnieniem jest tutaj skuteczna realizacja funkcji podobieństwa treści diagnostycznej badań, realizowana na podstawie numerycznych deskryptorów zmian, patologii, gęstości utkania, morfologii wyróżnianych obiektów, czy ogólnych właściwości diagnostycznych; krótką charakterystykę teleinformatycznego systemu IShark realizującego koncepcję referencyjnej bazy danych, wykorzystującą algorytmy rozumienia obrazów z CAD oraz charakterystykę semantyki na podstawie ontologii mammografii przedstawiono poniżej; 4) zintegrowany interfejs użytkownika, który obok wygodnej przeglądarki badań pozwala na przejrzyste wykorzystanie interfejsu opisu badań MammoEdit, z poziomu którego zależnie od rozpoznawanych zmian wołane są wspomagające metody CAD oraz w razie potrzeby kierowane są zapytania do referencyjnej bazy danych; MammoViewer pozwala na wygodne przeglądanie badań, pozwala także współpracować w trybie telekonsultacji ze specjalistami zewnętrznymi. Narzędzie wspomagania interpretacji mammogramów - edytor MammoEdit Jeśli hipoteza autorów [7] jest prawdziwa, to korzystanie w czasie interpretacji mammogramów z narzędzi/narzędzia wyrównującego lub przynajmniej częściowo zmniejszającego niejednolity zakres wiedzy medycznej poszczególnych radiologów powinno zaowocować zwiększeniem i wyrównaniem ich efektywności diagnostycznej. Stworzono i poddano wstępnym testom (na niewielkiej próbie zarówno mammogramów jak i obserwatorów radiologów) narzędzie wspomagania interpretacji mammogramów – edytor MammoEdit. Podstawą dla projektu takiego narzędzia powinna być reprezentacja wiedzy z danej dziedziny – w tym przypadku mammografii. Modele reprezentujące wiedzę dziedzinową to modele ontologiczne. Efektem budowy ontologii jest systematyzacja i objaśnienie struktury wiedzy oraz zmniejszenie niejednoznaczność pojęciowej w reprezentowanej dziedzinie [11]. Pierwszym z dwóch podstawowych celów ontologii mammografii [12] jest stworzenie jasnej hierarchii pojęć opisujących istotne w tej dziedzinie zagadnienia, wyczerpujących definicji zmian, ich atrybutów i znaczenia diagnostycznego. Cel drugi to użycie ontologii jako częściowej specyfikacji projektu edytora wspomagającego interpretacje mammogramów. Zdefiniowane w ontologii mammografii klasy (odpowiadające pojęciom z mammografii) określają część właściwości dla odpowiadających im obiektów w interfejsie (rys.1). Założono, ze wprowadzanie opisu zmian w mammogramie przy użyciu reprezentacji graficznej powinno dać w efekcie przyspieszenie i usystematyzowanie pracy lekarza (opis badania jest generowany automatycznie). Pojęciom z dziedziny mammografii reprezentowanym w interfejsie przyporządkowano symbole graficzne – ikony. Cechy interfejsu istotne dla zmniejszenia błędów interpretacji radiologa to: standardowy, wyczerpujący zestaw istotnych diagnostycznie atrybutów zmiany oraz sygnalizacja w trakcie pracy (wyświetlanie na czerwono) cech wskazujących na jej podejrzany charakter. Ostateczna ocena diagnostyczna zmiany należy do lekarza. Rys 1. Wprowadzanie opisu zmiany. Cechom zmiany zarówno wizualnym jak i niewizualnym odpowiadają klawisze z odpowiednim symbolem graficznym. Opis zmiany polega na „wciśnięciu” klawisza z wybraną cechą. Jeśli wybrana wartość cechy wskazuje na złośliwy charakter zmiany, ikona reprezentująca cechę jest wyświetlana w kolorze czerwonym. Teleinformatyczne narzędzie wyszukiwania treści diagnostycznej Struktura informacyjna staje się coraz bardziej znaczącym elementem współczesnego ośrodka medycznego. Jej rolę można podsumować w jednym zdaniu: dostarczyć personelowi medycznemu właściwą informację we właściwym miejscu i czasie. Podzbiorem tej klasy zastosowań są systemy typu PACS (ang. Picture Achieving and Communication System). Ich głównym przeznaczeniem jest efektywne gromadzenie i udostępnianie informacji obrazowej. Aż do ostatnich lat główny wysiłek badaczy był skierowany na spełnienie warunku wydajnych mechanizmów przechowywania i przesyłania danych, takich jak sieci gigabitowe, zaawansowane mechanizmy kompresji czy rozwój wydajnych nośników danych. Dopiero w ostatnim czasie większy nacisk został położony na problem jakości dostarczanej informacji, gdzie przez jakość informacji należy rozumieć zarówno samą zawartość informacyjną, jak i formę jej dostarczenia [13]. Nowoczesne standardy obrazowania i komunikacji dla danych medycznych, takie jak DICOM, zawierają ustandaryzowaną formę opisu tekstowego dotyczącego wykonywanych badań, stanu zdrowia i danych osobowych pacjenta, wybranego narządu oraz parametrów technicznych wykorzystanych urządzeń. Tym niemniej alfanumeryczne deskryptory tego typu nie są wystarczające do opisania ogromnej różnorodności lokalnych właściwości obrazów medycznych. Dochodzi do tego pewien odsetek danych błędnie opisanych, co razem sprawia, że wyszukiwanie oparte jedynie na deskryptorach tekstowych (alfanumerycznych) nie jest wystarczające do efektywnego wyszukiwania badań. W związku z tym podejmowane są próby wykorzystania systemów typu CBIR (ang. Content-Based Image Retrieval) i ich integracji z systemami typu PACS [13]. W systemach tych zbiory danych obrazowych charakteryzowane są na podstawie lokalnych i globalnych właściwości obrazów, które najlepiej korelują z semantyką zawartej w nich informacji, a podobieństwo obrazów określa numeryczna miara bliskości zawartej treści, np. diagnostycznej. W zastosowaniach obrazowania medycznego tworzone są tzw. referencyjne bazy danych, gdzie klinicznie zweryfikowana informacja obrazowa jest efektywnie przeglądana w celu doboru przypadków diagnostycznie bliskich zapytaniu (najczęściej jest to trudne w interpretacji badanie obrazowe). Teleinformatyczny system IShark zrealizowano w przedstawionej poniżej architekturze trójwarstwowej, w naturalny sposób integrującej się z rozwiązaniami typu PACS. W proponowane rozwiązanie włączono mechanizm typu CBIR, dający alternatywną formę wyszukiwania danych oraz mechanizmy efektywnej transmisji danych, oparte o zaimplementowany kodek JPEG2000. Został też zaproponowany mechanizm rozproszonego wyszukiwania badań, umożliwiający przeszukiwanie wielu baz danych jednocześnie, z poziomu jednego interfejsu użytkownika. Schemat architektury systemu zaprezentowany jest na rys. 2. Rys. 2 Schemat systemu IShark Głównymi elementami zrealizowanego systemu są: środowisko bazodanowe wraz z interfejsem użytkownika, moduł wyszukiwania obrazów po zawartości, interaktywny kodek standardu JPEG 2000, usługa sieciowa (ang. webservice) zapewniająca wyszukiwanie rozproszone. Proponowane rozwiązanie zostało opracowane z myślą o integracji z istniejącymi elementami szpitalnego systemu informacyjnego. Cała logika systemu została zrealizowana w formie usługi sieciowej (ang. Web service), co ułatwia taką integrację. Obrazy mammograficzne indeksowano ze względu na następujące cechy je charakteryzujące: gęstość utkania gruczołu, właściwości klastrów mikrozwapnień, właściwości guzów. Algorytm estymacji gęstości utkania gruczołu piersowego w obrazie opiera się na analizie tekstur. Szczegółowy opis proponowanej metody znaleźć można w [14]. Metoda wykrywania klastrów mikrozwapnień oparta jest na pracach [15]. Algorytm detekcji potencjalnych guzów opiera się na nieliniowej korekcji histogramu oraz segmentacji metodą rozrostu obszaru. Jego szczegółowy opis znaleźć można w [16]. Metody detekcji i estymacji stanowią podstawę do utworzenia deskryptora badania mammograficznego. Obejmuje on następujące właściwości badania: lokalizacja zmiany patologicznej, rozmiar, wysycenie, kształt, nieregularność krawędzi, równomierność rozłożenia mikrozwapnień wewnątrz klastra (dotyczy klastrów mikrozwapnień). Gęstość utkania charakteryzowana jest poprzez wartość w skali BI-RADS. Eksperymenty Weryfikacja narzędzia wspomagania interpretacji mammogramów W celu przetestowania hipotezy, że interpretacja mammogramu z użyciem narzędzia reprezentującego wiedzę medyczną podnosi efektywność diagnostyczną radiologa przeprowadzono eksperyment polegający na dwukrotnej (dwa etapy testu) interpretacji tego samego zbioru mammogramów. W obu etapach testu ocena mammogramów odbywała się w zacienionym pomieszczeniu, na monitorze medycznym, radiolog do oceny wizualnej zmian używał przeglądarki medycznej – programu MammoViewer [17], do opisu diagnozy radiologicznej zmiany używano skali BI-RADS. Różnica pomiędzy dwoma etapami polegała na użyciu w drugim etapie opartego na ontologii mammografii narzędzia interpretacji mammogramów – edytora MammoEdit. Miarą działania edytora jest porównanie efektywność radiologów i zmienności diagnozy w pierwszym i drugim etapie testów. Minimalny czas pomiędzy interpretacją tego samego badania wynosił minimum 2 miesiące. W teście wzięło udział trzech radiologów o zdecydowanie różnym poziomie kompetencji zawodowych (ekspert, specjalista i stażysta). Wiedzieli oni, że badana próba zawiera zarówno mammografie negatywne jak i badania z patologiami (w losowym porządku), ale nie byli poinformowani w jakiej proporcji występują one w badanej próbie. Mammogramy pochodziły z internetowej bazy danych DDSM [18] zawierającej 2620 przypadków, przeznaczonej do badań naukowych oraz testowania i porównywania skuteczności działania algorytmów CAD. Testowa próba mammogramów składała się z 49 przypadków (17 mammografii negatywnych i 32 ze zmianami patologicznymi), 20 skupisk mikrozwpanień i 12 guzów. Opis przypadku w bazie DDSM zawiera: typ utkania, typ zmiany, jej skrócony opis, diagnozę radiologiczną, (w skali BI-RADS) lokalizację oraz stopień trudności detekcji zmiany (w skali subtelności 1-5). Trudność detekcji zmiany jest wypadkową wielu czynników. Najważniejsze z nich to: gęstość i typ utkania w otoczeniu zmiany oraz konfiguracja wartości jej cech (wielkość, lokalizacja, wysycenie, dystrybucja dla mikrozwapnień itp.). Dlatego stopień trudności detekcji uznano za dobrą ocenę stopnia trudności interpretacji zmiany. Średni stopień trudności interpretacji dla zmian w próbie wynosił 2,65, 2,35 dla mikrozwapnień i 3,08 dla guzów. Należy więc uznać, że większość zmian w próbie testowej stanowiły patologie trudne w interpretacji. Do oceny wyników testu zastosowano analizę ROC – powszechnie uznaną metodę szacowania trafności działania systemu diagnostycznego, różnicę efektywności radiologów w różnych etapach testu szacowano na podstawie wartości statystyki kappa. Do analizy statystycznej istotności różnicy pomiędzy wskaźnikami analizy ROC (pola pod krzywymi ROC) użyto algorytmu Dorman’a-Berbaum’a-Metz’a (oprogramowania DBM MRMC [19]). Pakiet ten wykorzystuje metodę analizy wariancji ANOVA do porównywania kilku populacji umożliwiając obliczanie statystycznie istotnej różnicy w sytuacji, kiedy wydajność narzędzia diagnostycznego zależy zarówno od populacji obserwatorów jak i od populacji przypadków. DBM MRMC przeprowadza analizę statystyczną dla opcji: dobrani przypadkowi obserwatorzy i losowo dobrane przypadki, losowo dobrane przypadki, losowo dobrani obserwatorzy. Wybrano test z ustalonymi obserwatorami i losowo dobranymi przypadkami, ponieważ radiolodzy zostali dobrani celowo według doświadczenia zawodowego. Stwierdzono istotną statystycznie różnicę pól pod krzywą ROC dla sumarycznej efektywności radiologów w pierwszym i drugim etapie testu (AUC=pole pow. pod krzywą ROC - w pierwszym etapie testu AUCI = 0,497, w drugim - AUCII= 0,662, poziom istotności p=0,014), co świadczy o istotnym statystycznie wzroście efektywności diagnostycznej dla grupy obserwatorów. Wyniki przedstawiono w tab. 3, a na rys. 3 sumaryczne krzywe ROC dla grupy trzech radiologów ilustrujące wzrost efektywności diagnostycznej przy użyciu edytora MammoEdit do wspomagania interpretacji mammogramów. Obserwatorzy AUC I etap II etap 3 radiologów 0,497 Wzrost AUC II etap 0,662 16,5% Czułość I etap II etap 26,0% 56,3% Tab. 3. Wzrost wskaźników liczbowych: pola pod krzywą ROC i czułości opisujących efektywność diagnostyczną grupy trzech radiologów interpretujących mammogramy używając edytora MamoEdit 1,2 1 0,8 TPF 0,6 0,4 sta+spe+eks- I etap 0,2 sta+spe+eks - II etap 0 -0,2 -0,2 0 0,2 0,4 0,6 0,8 1 1,2 FPF Rys 3. Różnica między efektywnością diagnostyczną dla grupy trzech radiologów w I i II etapie testu; AUCI = 0,497, AUCII= 0,662, poziom istotności p=0,014. Różnice wartości pól pod krzywymi ROC w I i II etapie testu liczone dla pojedynczych radiologów również okazały się istotne statystycznie. Największy wzrost efektywności diagnostycznej zaobserwowano u radiologa specjalisty (wzrost AUC o 15,8%), nieco mniejszy u radiologa stażysty (wzrost AUC o 14,1%). Najmniejszy wzrost efektywności dotyczy eksperta (wzrost AUC o 10,2%), ale należy pamiętać, że w pierwszym etapie testu jego efektywność znacznie przewyższała efektywność pozostałych lekarzy. Szczegółowe wyniki przedstawiono w tabeli 4. radiolog AUC I etap II etap sta 0,396 0,537 14,1% Czułość I etap II etap 15 % 37,5% spe eks 0,486 0,611 0,734 0,713 15,8% 10,2% 20,6% 46,9% Wzrost AUC II etap 68,8% 62,5% Tab. 4. Wpływ edytora MammoEdit na efektywność diagnostyczną pojedynczych radiologów (test dla trzech radiologów) - zauważalny jest wzrost efektywności diagnostycznej poszczególnych radiologów w drugim etapie testu, proporcjonalnie do wzrostu pola pod krzywą ROC. Ważnym problemem obniżającym wartość diagnozy w mammografii jest jej zmienność. Efektem wspomagania interpretacji mammogramów przy użyciu edytora MammoEdit jest jednoczesny wzrost spójności i efektywności diagnozy. W drugim etapie wzrosła spójność diagnozy pomiędzy parami lekarzy stażysta-specjalista, specjalistaekspert i stażysta-ekspert. Szczegółowe wyniki zamieszczono w tab 5. radiolog sta-spe spe-eks sta-eks Wart. statystyki Kappa ( ważonej) I etap II etap 0,196 0,482 0,238 0,294 0,052 0,476 Tab. 5. Wzrost spójności/zgodności diagnozy w drugim etapie testów (test dla trzech radiologów); miarą wzrostu spójności diagnozy jest wzrost wartości statystyki kappa dla wszystkich par radiologów w drugim etapie testu. Z wyników eksperymentów wynikają następujące wnioski: istotny statystycznie wzrost efektywności diagnostycznej wszystkich radiologów biorących udział w teście; najmniejsza różnica – ekspert, największa– specjalista, najmniejszą różnicę efektywności między dwoma etapami testu zaobserwowano u radiologa stażysty; wzrost spójności diagnozy wśród wszystkich par radiologów interpretujących mammogramy przy użyciu edytora MammoEdit; największy wzrost zgodności dotyczy pary stażysta – ekspert; MammoEdit może być cennym narzędziem edukacyjnym dla radiologów. Ocena efektywności indeksowania mammogramów Efektywność indeksowania silnie zależy od przyjętego kryterium, określającego czy zwrócone badanie jest zgodne z zapytaniem, czy nie. Proponowane scenariusze testów, określające to kryterium, są następujące: I. zapytanie z guzkiem – interesuje nas, ile w odpowiedzi będzie badań z przynajmniej jednym guzkiem; II. zapytanie z guzkiem złośliwym – badania zawierające przynajmniej jeden guzek złośliwy; III. zapytanie z dwoma guzkami – badania zawierające przynajmniej dwa guzki; IV. zapytanie z guzkiem spikularnym – badania zawierające przynajmniej jeden guzek spikularny; V. zapytanie z klastrem mikrozwapnień – badan z przynajmniej jednym klastrem mikrozwapnień; VI. zapytanie ze złośliwym klastrem mikrozwapnień - badania z przynajmniej jednym złośliwym klastrem mikrozwapnień; VII. zapytanie z potencjalną zmianą patologiczną w piersi o rzadkim utkaniu (BIRADS I lub II) – badania zawierające guzek lub klaster mikrozwapnień w piersi o rzadkim utkaniu; VIII. Zapytanie z potencjalna zmiana patologiczna w piersi o gęstym utkaniu (BIRADS III lub IV) – badania zawierające guzek lub klaster mikrozwapnień w piersi o gęstym utkaniu. Wykresy efektywności indeksowania w proponowanych scenariuszach przedstawia rys. 4. Rys. 4. Wykresy efektywności indeksowania – precyzja w funkcji przywołania - w wybranych scenariuszach. Szczegółowe wyniki są dostępne w [14], można jednak powiedzieć, że osiągnięte rezultaty pozwalają na uznanie proponowanych metod za użyteczne w indeksowaniu mammogramów. Wartość uzyskanych rezultatów jest tym większa, że zostały one uzyskane w systemie IShark, stanowiącym prototypowy system referencyjnej bazy medycznych danych obrazowych. 4. Konkluzje Przedstawiono koncepcję ZSD zwracając szczególną uwagę na sformalizowaną bazę wiedzy mammograficznej i bezpośrednie jej wykorzystanie oraz teleinformatyczne środowisko warunkujące efektywną pracę poprzez dostęp i automatyczną selekcję najbardziej użytecznej informacji. Uwzględnienie w protokole badań interfejsu sugerującego kompletność i systematyzację ocen oraz możliwość dostępu do badań referencyjnych wyszukiwanych za pomocą zapytania przez przykład daje nowe możliwości diagnostyczne. Uzyskana w eksperymentach skuteczność wspomagania świadczy o przydatności tych rozwiązań. Dalszym etapem prowadzonych badań jest integracja ze stacją narzędzia do analizy i wizualizacji badań USG sutka - SonoLab, która zapewni bardziej kompleksowe wsparcie diagnostyki i badań przesiewowych mammografii. Literatura [1] Elmore J, Feinstein A. A bibliography of publications on observer variability. J Clin Epidemiol 1992;45:567– 80. [2] Schnitt SJ, Connolly JL, Tavassoli FA, Fechner RE, Kempson RL, Gelman R, et al. Interobserver reproducibility in the diagnosis of ductal proliferative breast lesions using standardized criteria. Am J Surg Pathol 1992;16: 1133–43. [3] Elmore J, Wells C, Lee C, Howard D, Feinstein A. Variability in radiologists’ interpretations of mammograms. N Engl J Med 1994;331:1493–9. [4] Beam CA, Layde PM, Sullivan DC. Variability in the interpretation of screening mammograms by US radiologists. Arch Intern Med 1996;156: 209–13. [5] Kerlikowske K, Grady D, Barclay J, Frankel SD, Ominsky SH, Sickles EA, et al. Variability and accuracy in mammographic interpretation using the American College of Radiology Breast Imaging Reporting and Data System. J Natl Cancer Inst 1998;90:1801–9. [6] Elmore JG, Miglioretti DL, Reisch LM, Barton MB,Kreuter W, Cindy L. Christiansen CL, Suzanne W. Fletcher SW, Screening Mammograms by Community Radiologists: Variability in False-Positive Rates, Journal of the National Cancer Institute, Vol. 94, No. 18, 2002 [7] Wagner RF, Beam CA, Beiden SV, Reader Variability in Mammography and Its Implications for Expected Utility over the Population of Readers and Cases, Medical Decision Making, Vol. 24, No. 6, 561-572 (2004) [8] Miglioretti DL, Smith-Bindman R, Abraham L, Brenner RJ, Carney PA, et al. Radiologist Characteristics Associated With Interpretive Performance of Diagnostic Mammography. J Natl Cancer Inst 2007; 99:1854-1863 [9] Piętka E., Zintegrowany system informacyjny w pracy szpitala, PWN, 2004. [10] Wróblewska A., Metody wspomagania detekcji zmian patologicznych w mammografii, rozprawa doktorska, Politechnika Warszawska, 2008. [11] Chandrasekaran, B., Josephson, J.R., Benjamins V.R.: What Are Ontologies, and Why We Need Them ?, 1999 IEEE Inteligent Systems pp 20-26 [12] Podsiadły-Marczykowska T., Guzik A., Ontologia mammografii, struktura modelu, definicje i instancje pojęć, Bio-Algorithms and Med.-Systems , vol 1, no. 1, 2005 pp 247- 252 [13] Boniński P., Przelaskowski A., Durasiewicz K., Wróblewska A., Bargieł P., Automatyczne indeksowanie obrazów w zastosowaniach medycznych, Materiały XIV Krajowej Konferencji Naukowej: Biocybernetyka i Inżynieria Biomedyczna, tom 1:411-416, Częstochowa, 2005 [14] Boniński P., Metody indeksowania obrazów medycznych na potrzeby radiologii cyfrowej, rozprawa doktorska, Politechnika Warszawska, 2007. [15] Wróblewska A., Przelaskowski A., Bargieł P., Boniński P. Two stage detection and clustering of microcalcifications in mammograms, Biomedizinische Technik, Medical Physics, 50 (supp 1): 56-57, Proc. ICMP2005, Nuremberg, Germany, 2005. [16] Boniński P, Przelaskowski A., Wróblewska A., Metoda detekcji guzków w obrazach mammograficznych wykorzystująca transformacje Rayleigha, Sympozjum Inżynieria Biomedyczna i Telemedycyna IBiTel w Warszawie - materiały, Prace Naukowe Politechniki Warszawskiej - Elektronika, 157:, Oficyna Wydawnicza PW, 2007. [17] Wróblewska A., Przelaskowski A., Bargieł P., Boniński P., „MammoViewer – CAD application based on effective multiscale image analysis”, Polish Journal of Medical Physics & Engineering, vol. 11, no 1, 17-28, 2005 [18] DDSM(http://marathon.csee.usf.edu/Mammography/Database.html) [19] oprogramowanie wykonujące analizę ROC http://wwwradiology.uchicago.edu/krl/KRL OC/software index6.htm. Integrated system for assistance of mammography diagnosis Abstract: The concept of integrated reading workstation for screening and diagnosis of digital mammography was presented. Computer-aided diagnosis (CAD) tools were interfaced to comprehensive image viewer, optimized according to ontology-based knowledge with user-friendly interface for examination protocol objectivity. Moreover, tele-information system IShark was designed for content-based image indexing and retrieval. Formal description with protocol interface and IShark indexing efficiency were characterized in details. Keywords: assisted diagnosis of mammography, mammography ontology, content-based image indexing Tab.1. Interpretation variability assessment for screening mammography (1994-2002) – non-uniform study material considering unequal mammograms and radiologist quantities and incompatible verification criterions of mammographic diagnosis variability. Tab.2. Comparison of mammogram interpretation sensitivity for radiologists working in academic medical centers and those at non-academic health centers/institutions. Tab.3 Increase in indexes: area under ROC curve and sensitivity describing diagnostic performance for a group of three radiologists interpreting mammograms using MammoEdit. Tab. 4 Influence of MammoEdit editor on diagnostic performance of single radiologist (test with three radiologists) – visible increase in radiologist’s diagnostic performance in second test stage, proportional to increased area under ROC curve. Tab.5 Increase in diagnostic agreement (test for three radiologists); diagnostic agreement is assessed using kappa statistics. Kappa statistics value was increased in second test stage for all pair of radiologists. Fig.1 Mammographic lesion description. Lesion features, visual and non-visual as well have a graphical primitive – an icon assigned. Describing a lesion is a simple action of clicking icons representing its attributes. Lesion features suggesting malignancy are displayed in red Fig. 2 Diagram of IShark Fig.3 The difference in diagnostic performance for a group of three radiologists in I and II stage of the test; AUCI = 0.497, AUCII= 0.662, significance level p=0.014. Fig. 4. Efficiency of mammogram indexing: precision vs. recall tests according to I-VIII scenarios. dr hab. inż. Artur Przelaskowski e-mail: [email protected] Instytut Radioelektroniki Politechniki Warszawskiej Zakład Elektroniki Jądrowej i Medycznej ul. Nowowiejska 15/19 00-665 Warszawa pokój 11, tel. (22) 234-73-32 mgr inż. T.Podsiadły-Marczykowska e-mail: [email protected] Instytut Biocybernetyki i Inżynierii Biomedycznej PAN, ul. Trojdena 4 02-109 Warszawa mgr inż. Piotr Boniński e-mail: [email protected] Instytut Radioelektroniki Politechniki Warszawskiej Zakład Elektroniki Jądrowej i Medycznej ul. Nowowiejska 15/19 00-665 Warszawa pokój 11, tel. (22) 234-73-32 mgr inż. Anna Wróblewska e-mail: [email protected] Instytut Radioelektroniki Politechniki Warszawskiej Zakład Elektroniki Jądrowej i Medycznej ul. Nowowiejska 15/19 00-665 Warszawa pokój 11, tel. (22) 234-73-32