Zintegrowany system wspomagania diagnostyki mammograficznej

Transkrypt

Zintegrowany system wspomagania diagnostyki mammograficznej
Zintegrowany system wspomagania diagnostyki mammograficznej
A. Przelaskowski1, T.Podsiadły-Marczykowska2, P.Boniński1, A.Wróblewska1
1
Instytut Radioelektroniki PW, Nowowiejska 15/19, Warszawa, 2Instytut Biocybernetyki i Inżynierii
Biomedycznej PAN, ul. Trojdena 4, 02-109 Warszawa
[email protected]
Streszczenie: W pracy przedstawiono koncepcję zintegrowanej stacji diagnostycznej do interpretacji badań
mammograficznych. Główne elementy wspierające pracę specjalisty do narzędzie CAD - komputerowego
wspomagania diagnozy, interfejs do oceny badań bazujący na ontologii mammografii oraz teleinformatyczny
system z indeksowaniem po zawartości i wyszukiwaniem referencyjnych badań w celach porównawczych.
Skoncentrowano się na formalnym opisie dziedziny wiedzy użytecznej w diagnostyce mammografii oraz
charakterystyce systemu teleinformatycznego integrującego usługi dostępne w stacji diagnostycznej.
Słowa kluczowe: wspomagania diagnostyki mammografii, ontologia mammografii, indeksowanie zawartością
obrazów
Wprowadzenie
Konieczność komputerowego wspomagania wynika z faktu, że diagnostyka mammograficzna uchodzi w
radiologii za najtrudniejszą, a liczba popełnianych błędów w badaniach przesiewowych sięga nawet
kilkudziesięciu procent. Pierwsze narzędzia CAD zaakceptowane przez amerykański urząd standaryzacyjny
FDA (food and drug administration) dotyczyły mammografii (1998 rok), coraz powszechniej są one stosowane
w praktyce klinicznej (szacuje się, że obecnie około 30% badań przesiewowych w USA wykonywanych jest ze
wsparciem CAD1). Różne koncepcje poprawy efektywności interpretacji badań koncentrują się przede
wszystkim na zagadnieniu obiektywizacji badań, dokonywanej poprzez:
zmniejszenie niejednoznaczności pojęciowej w dziedzinie mammografii uzyskane poprzez systematyzację i
formalizację struktury wiedzy tej dziedziny w modelu ontologicznym,
automatyczne podpowiedzi, dokonywane na podstawie numerycznej analizy i rozumienia treści
diagnostycznej obrazów (systemy CAD),
wykorzystanie ontologicznego modelu dziedziny w komputerowych narzędziach wspomagania interpretacji
badań (CAD, indeksowanie badań po zawartości, inteligentne przeglądanie badań itp.), zwiększające ich
użyteczność diagnostyczną,
ujednolicenie procedur diagnostycznych uwzględniających komputerowe narzędzia wspomagania
interpretacji, propozycje protokołów badań, edytorów opisu, generatorów raportów, weryfikatorów opisu,
procedur stosowania wspierających narzędzi itp.
W niniejszej pracy przedstawiono próbę integracji działań w kierunku obiektywizacji procesu diagnostycznego
celem zwiększenia skuteczności interpretacji badań w zakresie mammografii. Proponowana koncepcja
zintegrowanej stacji diagnostycznej (ZSD) obejmuje system wspomagania CAD (ang. computer-aided
diagnosis) do mammografii rentgenowskiej - MammoViewer, ontologię mammografii z interfejsem
diagnostycznym oraz implementację systemu indeksowania i wyszukiwania obrazów po zawartości iShark ze
wspomaganiem telekonsultacji, który służy do realizacji pomysłu referencyjnej bazy wzorców diagnostycznych.
Integracja tych rozwiązań w inteligentnej stacji diagnostycznej jest rozszerzeniem typowych rozwiązań
stosowanych w systemach informacyjnych RIS/PACS. Powstało w ten sposób środowisko teleinformatyczne z
zaawansowanymi narzędziami rozpoznawania i rozumienia obrazów, którego celem jest dostarczenie możliwie
kompletnej informacji diagnostycznej na etapie interpretacji badań i formułowania ocen. Obok przejrzystego
interfejsu ważne jest tutaj zestawienie informacji pochodzącej z różnych źródeł i formułowanie syntetycznych
wskazań zwiększających skuteczność diagnozy.
Integracja wspomnianych narzędzi i systemów dokonywana jest na poziomie oprogramowania, formatów
danych, metod wizualizacji, współdzielenia zasobów, a przede wszystkim formy zintegrowanego, przyjaznego i
elastycznego interfejsu dającego dostęp do różnego typu usług, dopasowanego do różnorodnych wymagań
radiologów. Badanie prowadzone są przy stałej współpracy z radiologami z kilku ośrodków. Tworzone jest
1
http://www.rt-image.com/Examine__Mammography_The_Case_for_CAD_Examining_the_technology_and_its_implicati/
content=9504J05C4856869640769A72448080441
stanowisko diagnostyczne z szerokim dostępem do zasobów wewnętrznych (symulowany ośrodek medyczny,
baza danych obrazowych, rekordów pacjenta) oraz zewnętrznych (referencyjne bazy danych, telekonsultacje,
odbiorcy usług, tele-edukacja, itp.). W pracy tej obok samej koncepcji ZSD opisano metody doskonalenia
diagnostyki mammograficznej (mmg) z wykorzystaniem ontologii oraz technologii indeksowania i
wyszukiwania obrazów.
Zmienność interpretacji w mammografii przesiewowej i diagnostycznej – fakty i hipotetyczne
mechanizmy powstawania
Zależna od obserwatora zmienność oceny diagnostycznej jest faktem znanym w wielu obszarach medycyny [1].
Nawet ocena histopatologiczna – „ostateczna prawda” o charakterze zmiany nie stanowi tu wyjątku [2]. W
literaturze medycznej systematycznie od prawie 20 lat pojawiają się kolejne doniesienia świadczące o istnieniu
znacznej zmienności interpretacji dla mammografii przesiewowej [3-6]. Niestety oceniany materiał jest trudno
porównywalny, a stosowane miary zmienności interpretacji mammogramów niejednolite (Tab.1). Poważnym
problemem jest brak w w/w pracach hipotez wyjaśniających mechanizmy powstawania zjawiska zmienności
diagnostycznej.
[3] 1994
[4] 1996
Ilość
radiologów
10
108
Ilość
mammogramów
150
79
[5] 1998
[6] 2002
2
24
2616
8734
Praca
Miara oceny
Zmienności
Statystyka kappa
Analiza ROC,
Ocena procentowa
Statystyka kappa
Ocena procentowa
Tab.1 Ocena zmienności interpretacji w mammografii przesiewowej od 1994 -2002 - niejednolity (ilość
radiologów i ilość mammogramów) materiał oraz brak porównywalnych kryteriów oceny zmienności diagnozy
w mammografii.
Do niedawna zmienność interpretacji była badana tylko dla mammografii przesiewowej. Praca z 2004 roku [7]
potwierdza istnienie zmienności interpretacji mammogramów również dla mammografii diagnostycznej.
Autorzy stawiają hipotezę, że jednym z możliwych powodów zmienności interpretacji mammogramów jest
niejednolitość szeroko pojętych umiejętności diagnostycznych radiologów – odpowiadająca zaobserwowanemu
szerokiemu zakresowi pól pod krzywymi ROC, mierzącymi efektywność poszczególnych obserwatorów.
Praca z 2007 roku [8] potwierdziła istnienie szerokiego zakresu zmienności interpretacji w mammografii
diagnostycznej, który nie może być wyjaśniony szczególnymi cechami pacjentek, których badania oceniano.
Badanie oparto na obszernym materiale: 123 radiologów pracujących w 72 instytucjach medycznych, materiał
do analizy statystycznej stanowiło 36 000 mammogramów diagnostycznych. Dla całości badanej próby mediana
czułości ( TP ,TP – przyp. prawdziwie pozytywne, FP- przyp. fałszywie pozytywne) wynosi 79%, ale
TP
FN
FP )
TN FP
wynosi 4,3%, a zakres zmienności: od 0 do 16%. Ważny wniosek autorów [8] dotyczy afiliacji radiologów
wyróżniających się wysoką czułością w ocenie mammogramów. Okazuje się, że najtrafniej interpretują badania
mmg radiolodzy z centrów akademickich, przy jednoczesnym niewielkim wzroście ilości przypadków
ocenionych fałszywie pozytywnie (Tab.2)
niepokojący jest bardzo szeroki zakres zmienności wynoszący od 27% do 100%. Specyficzność (
Centra akademickie
Centra nie-akademickie
Czułość
(mediana)
88%
76%
Czułość
95% [CI]
77-95%
72-79%
Specyficzność
(mediana)
7,8%
4,2%
Specyficzność
95% [CI]
4,8-12,7%
3,8- 4,7%
Tab. 2 Porównanie czułości oceny mammogramów przez radiologów pracujących w naukowych instytucjach
medycznych i instytucjach „poza akademickich”.
Ten ostatni wniosek autorów [8] jest zbieżny z hipotezą postawioną w pracy [7], mówiącą o niejednolitym
poziomie umiejętności diagnostycznych radiologów. W ogromnym uproszczeniu, na umiejętności diagnostyczne
specjalisty od mammografii składają się: wiedza medyczna dotycząca dziedziny obrazowania (typy zmian, ich
cechy, możliwe wartości cech, ich znaczenie diagnostyczne itd.), umiejętność detekcji zmiany i oceny jej cech w
mammogramie oraz doświadczenie. Każdy z w/w typów ‘umiejętności diagnostycznych’ wymaga innych
narzędzi i formalizmów. Tworzone formalne opisy wiedzy służą wyrównywaniu umiejętności diagnostycznych
radiologów związanych z wiedzą medyczną.
Koncepcja integracji metod wspomagania
W centrach radiografii cyfrowej zasadniczym miejscem opisu, interpretacji badań obrazowych jest stacja
diagnostyczna. Elementami warunkującymi skuteczną pracę radiologa są tutaj przede wszystkim moduł
radiologicznego systemu informacyjnego RIS (dostęp do danych pacjenta – tzw. rekordu pacjenta - i innych
danych gromadzonych w szpitalnym systemie informacyjnym HIS), komunikacja z systemem PACS
(archiwizacji i zarządzania przepływem informacji obrazowej) gwarantująca dostęp to aktualnych badań
obrazowych oraz przeglądarka obrazów z zaimplementowanymi często narzędziami ułatwiającymi analizę
obrazów, wstępne ich przetwarzanie, poprawę warunków obserwacji, porównania i zestawiania kilku badań itp.
Dodatkowo stacja może by wyposażona w moduł do komunikacji telemedycznej w celu dodatkowej
telekonsultacji ze specjalistą zewnętrznym. Warunkiem koniecznym efektywnej pracy radiologa jest możliwie
pełna integracja tych systemów i narzędzi, np. uruchamianie przeglądarki bezpośrednio z modułu RIS,
synchronizacja opisów badań w RIS i tekstów zapisanych w pliku dicom z badaniem obrazowym, pełna
integracja informacji znajdujących się w obu bazach: PACS i RIS (każda zmiana dotycząca badania obrazowego
dokonana w jednej bazie musi być zauważona w drugiej) – szerzej można o tym przeczytać w [9].
Dodatkowe wsparcie procesu interpretacji badań metodami komputerowego wspomagania diagnostyki
wykorzystuje bazę RIS/PACS/przeglądarka badań uzupełniając ją o zaawansowane metody obróbki obrazów,
dodatkowe rozwiązania teleinformatyczne oraz interfejsy użytkownika usprawniające protokół badań. Celem jest
ułatwienie pracy radiologa, redukcja wpływu niekorzystnych czynników subiektywnych (zmęczenie, brak
koncentracji, zróżnicowanie wiedzy i doświadczenia itp.), obiektywizacja procesu formułowania decyzji
diagnostycznych, wreszcie wydobycie informacji ukrytej, której percepcja w typowych warunkach prezentacji
jest niemożliwa bądź bardzo ograniczona oraz pomocnicze wnioskowanie, agregujące w sposób kompleksowy
dostępną informację z możliwie szerokiego zestawu źródeł.
Zaproponowano następujące, wzajemnie powiązane elementy zintegrowanego wspomagania komputerowego
diagnostyki, realizowanego na stacji diagnostycznej centrum radiologii cyfrowej w zastosowaniu do diagnostyki
mammograficznej:
1) narzędzie komputerowego wspomagania diagnozy CAD – MammoViewer [10], z automatyczną
detekcją skupisk mikrozwapnień, guzów i zaburzeń architektury, z poprawą percepcji zmian i zestawem
dodatkowych metod przetwarzania wstępnego i poprawy warunków wizualizacji badań, dającym
możliwość dostosowania warunków prezentacji informacji obrazowej do specyfiki pacjenta oraz
technicznych warunków badania; przykładowo, uzyskiwana obecnie czułość automatycznej detekcji
skupisk mikrozwapnień (testy na grupie ponad 150 mammogramów) sięga średnio 86%, przy czym dla
najtrudniejszej grupy najsubtelniejszych zmian (1 w skali 1-5) wynosi 67%, zaś dla łatwiejszych
przypadków (4-5 w skali subtelności) sięga 100%; średnia liczba wskazań fałszywie pozytywnych
wynosi 1,46 (0 dla łatwiejszych badań z dominacją tkanki tłuszczowej);
MammoViewer bazuje na algorytmach przetwarzania, analizy, rozpoznawania i rozumienia
mammogramów, ale dodatkowo do poprawy jego efektywności wykorzystuje się sformalizowaną,
obiektywizowaną wiedzę medyczną przede wszystkim w zakresie charakterystyki semantyki obrazów,
opisu właściwości zmian interpretowanych w badaniach; tzw. rezonans poznawczy, tj. dopasowanie
numerycznych charakterystyk cech obiektów do opisu semantycznego, dokonane w możliwie
znormalizowanej przestrzeni daje uniwersalne wskaźniki patologii, redukując liczbę wskazań
fałszywych; numeryczne deskryptory cech patologii sprawdzone w CAD mogą być z kolei
wykorzystane do bardziej formalnych opisów ontologicznych oraz przy indeksowaniu zawartością
mammogramów;
2) narzędzie wspomagania interpretacji mammogramów – MammoEdit, bazujące na ontologii
mammografii, formalizujące nie tylko zestaw stosowanych pojęć, właściwości zmian, metod
interpretacji, opisów, warunków badań, itp., także czynników mających choćby niewielki wpływ na
przebieg i efekt badania, ale również stosujące numeryczne deskryptory, będące domknięciem
obiektywnego opisu zmian w hierarchii uporządkowanej wiedzy; dokładniejszą charakterystykę
MammoEdit przedstawiono poniżej;
3) wyszukiwarka badań referencyjnych bazująca na systemie indeksowania zawartością mammogramów,
z usługami dostępu do gromadzonych w szerokiej skali badań, zweryfikowanych klinicznie, opisanych,
pomocnych przy interpretacji badań trudnych; kluczowym zagadnieniem jest tutaj skuteczna realizacja
funkcji podobieństwa treści diagnostycznej badań, realizowana na podstawie numerycznych
deskryptorów zmian, patologii, gęstości utkania, morfologii wyróżnianych obiektów, czy ogólnych
właściwości diagnostycznych; krótką charakterystykę teleinformatycznego systemu IShark
realizującego koncepcję referencyjnej bazy danych, wykorzystującą algorytmy rozumienia obrazów z
CAD oraz charakterystykę semantyki na podstawie ontologii mammografii przedstawiono poniżej;
4) zintegrowany interfejs użytkownika, który obok wygodnej przeglądarki badań pozwala na przejrzyste
wykorzystanie interfejsu opisu badań MammoEdit, z poziomu którego zależnie od rozpoznawanych
zmian wołane są wspomagające metody CAD oraz w razie potrzeby kierowane są zapytania do
referencyjnej bazy danych; MammoViewer pozwala na wygodne przeglądanie badań, pozwala także
współpracować w trybie telekonsultacji ze specjalistami zewnętrznymi.
Narzędzie wspomagania interpretacji mammogramów - edytor MammoEdit
Jeśli hipoteza autorów [7] jest prawdziwa, to korzystanie w czasie interpretacji mammogramów z
narzędzi/narzędzia wyrównującego lub przynajmniej częściowo zmniejszającego niejednolity zakres wiedzy
medycznej poszczególnych radiologów powinno zaowocować zwiększeniem i wyrównaniem ich efektywności
diagnostycznej. Stworzono i poddano wstępnym testom (na niewielkiej próbie zarówno mammogramów jak i
obserwatorów radiologów) narzędzie wspomagania interpretacji mammogramów – edytor MammoEdit.
Podstawą dla projektu takiego narzędzia powinna być reprezentacja wiedzy z danej dziedziny – w tym
przypadku mammografii. Modele reprezentujące wiedzę dziedzinową to modele ontologiczne. Efektem budowy
ontologii jest systematyzacja i objaśnienie struktury wiedzy oraz zmniejszenie niejednoznaczność pojęciowej w
reprezentowanej dziedzinie [11].
Pierwszym z dwóch podstawowych celów ontologii mammografii [12] jest stworzenie jasnej hierarchii pojęć
opisujących istotne w tej dziedzinie zagadnienia, wyczerpujących definicji zmian, ich atrybutów i znaczenia
diagnostycznego. Cel drugi to użycie ontologii jako częściowej specyfikacji projektu edytora wspomagającego
interpretacje mammogramów. Zdefiniowane w ontologii mammografii klasy (odpowiadające pojęciom z
mammografii) określają część właściwości dla odpowiadających im obiektów w interfejsie (rys.1). Założono, ze
wprowadzanie opisu zmian w mammogramie przy użyciu reprezentacji graficznej powinno dać w efekcie
przyspieszenie i usystematyzowanie pracy lekarza (opis badania jest generowany automatycznie). Pojęciom z
dziedziny mammografii reprezentowanym w interfejsie przyporządkowano symbole graficzne – ikony. Cechy
interfejsu istotne dla zmniejszenia błędów interpretacji radiologa to: standardowy, wyczerpujący zestaw
istotnych diagnostycznie atrybutów zmiany oraz sygnalizacja w trakcie pracy (wyświetlanie na czerwono) cech
wskazujących na jej podejrzany charakter. Ostateczna ocena diagnostyczna zmiany należy do lekarza.
Rys 1. Wprowadzanie opisu zmiany. Cechom zmiany zarówno wizualnym jak i niewizualnym odpowiadają
klawisze z odpowiednim symbolem graficznym. Opis zmiany polega na „wciśnięciu” klawisza z wybraną cechą.
Jeśli wybrana wartość cechy wskazuje na złośliwy charakter zmiany, ikona reprezentująca cechę jest
wyświetlana w kolorze czerwonym.
Teleinformatyczne narzędzie wyszukiwania treści diagnostycznej
Struktura informacyjna staje się coraz bardziej znaczącym elementem współczesnego ośrodka medycznego. Jej
rolę można podsumować w jednym zdaniu: dostarczyć personelowi medycznemu właściwą informację we
właściwym miejscu i czasie. Podzbiorem tej klasy zastosowań są systemy typu PACS (ang. Picture Achieving
and Communication System). Ich głównym przeznaczeniem jest efektywne gromadzenie i udostępnianie
informacji obrazowej. Aż do ostatnich lat główny wysiłek badaczy był skierowany na spełnienie warunku
wydajnych mechanizmów przechowywania i przesyłania danych, takich jak sieci gigabitowe, zaawansowane
mechanizmy kompresji czy rozwój wydajnych nośników danych. Dopiero w ostatnim czasie większy nacisk
został położony na problem jakości dostarczanej informacji, gdzie przez jakość informacji należy rozumieć
zarówno samą zawartość informacyjną, jak i formę jej dostarczenia [13].
Nowoczesne standardy obrazowania i komunikacji dla danych medycznych, takie jak DICOM, zawierają
ustandaryzowaną formę opisu tekstowego dotyczącego wykonywanych badań, stanu zdrowia i danych
osobowych pacjenta, wybranego narządu oraz parametrów technicznych wykorzystanych urządzeń. Tym
niemniej alfanumeryczne deskryptory tego typu nie są wystarczające do opisania ogromnej różnorodności
lokalnych właściwości obrazów medycznych. Dochodzi do tego pewien odsetek danych błędnie opisanych, co
razem sprawia, że wyszukiwanie oparte jedynie na deskryptorach tekstowych (alfanumerycznych) nie jest
wystarczające do efektywnego wyszukiwania badań. W związku z tym podejmowane są próby wykorzystania
systemów typu CBIR (ang. Content-Based Image Retrieval) i ich integracji z systemami typu PACS [13]. W
systemach tych zbiory danych obrazowych charakteryzowane są na podstawie lokalnych i globalnych
właściwości obrazów, które najlepiej korelują z semantyką zawartej w nich informacji, a podobieństwo obrazów
określa numeryczna miara bliskości zawartej treści, np. diagnostycznej. W zastosowaniach obrazowania
medycznego tworzone są tzw. referencyjne bazy danych, gdzie klinicznie zweryfikowana informacja obrazowa
jest efektywnie przeglądana w celu doboru przypadków diagnostycznie bliskich zapytaniu (najczęściej jest to
trudne w interpretacji badanie obrazowe).
Teleinformatyczny system IShark zrealizowano w przedstawionej poniżej architekturze trójwarstwowej, w
naturalny sposób integrującej się z rozwiązaniami typu PACS. W proponowane rozwiązanie włączono
mechanizm typu CBIR, dający alternatywną formę wyszukiwania danych oraz mechanizmy efektywnej
transmisji danych, oparte o zaimplementowany kodek JPEG2000. Został też zaproponowany mechanizm
rozproszonego wyszukiwania badań, umożliwiający przeszukiwanie wielu baz danych jednocześnie, z poziomu
jednego interfejsu użytkownika. Schemat architektury systemu zaprezentowany jest na rys. 2.
Rys. 2 Schemat systemu IShark
Głównymi elementami zrealizowanego systemu są:
środowisko bazodanowe wraz z interfejsem użytkownika,
moduł wyszukiwania obrazów po zawartości,
interaktywny kodek standardu JPEG 2000,
usługa sieciowa (ang. webservice) zapewniająca wyszukiwanie rozproszone.
Proponowane rozwiązanie zostało opracowane z myślą o integracji z istniejącymi elementami szpitalnego
systemu informacyjnego. Cała logika systemu została zrealizowana w formie usługi sieciowej (ang. Web
service), co ułatwia taką integrację.
Obrazy mammograficzne indeksowano ze względu na następujące cechy je charakteryzujące:
gęstość utkania gruczołu,
właściwości klastrów mikrozwapnień,
właściwości guzów.
Algorytm estymacji gęstości utkania gruczołu piersowego w obrazie opiera się na analizie tekstur. Szczegółowy
opis proponowanej metody znaleźć można w [14]. Metoda wykrywania klastrów mikrozwapnień oparta jest na
pracach [15]. Algorytm detekcji potencjalnych guzów opiera się na nieliniowej korekcji histogramu oraz
segmentacji metodą rozrostu obszaru. Jego szczegółowy opis znaleźć można w [16]. Metody detekcji i estymacji
stanowią podstawę do utworzenia deskryptora badania mammograficznego. Obejmuje on następujące
właściwości badania: lokalizacja zmiany patologicznej, rozmiar, wysycenie, kształt, nieregularność krawędzi,
równomierność rozłożenia mikrozwapnień wewnątrz klastra (dotyczy klastrów mikrozwapnień). Gęstość utkania
charakteryzowana jest poprzez wartość w skali BI-RADS.
Eksperymenty
Weryfikacja narzędzia wspomagania interpretacji mammogramów
W celu przetestowania hipotezy, że interpretacja mammogramu z użyciem narzędzia reprezentującego wiedzę
medyczną podnosi efektywność diagnostyczną radiologa przeprowadzono eksperyment polegający na
dwukrotnej (dwa etapy testu) interpretacji tego samego zbioru mammogramów. W obu etapach testu ocena
mammogramów odbywała się w zacienionym pomieszczeniu, na monitorze medycznym, radiolog do oceny
wizualnej zmian używał przeglądarki medycznej – programu MammoViewer [17], do opisu diagnozy
radiologicznej zmiany używano skali BI-RADS. Różnica pomiędzy dwoma etapami polegała na użyciu w
drugim etapie opartego na ontologii mammografii narzędzia interpretacji mammogramów – edytora
MammoEdit. Miarą działania edytora jest porównanie efektywność radiologów i zmienności diagnozy w
pierwszym i drugim etapie testów. Minimalny czas pomiędzy interpretacją tego samego badania wynosił
minimum 2 miesiące.
W teście wzięło udział trzech radiologów o zdecydowanie różnym poziomie kompetencji zawodowych (ekspert,
specjalista i stażysta). Wiedzieli oni, że badana próba zawiera zarówno mammografie negatywne jak i badania z
patologiami (w losowym porządku), ale nie byli poinformowani w jakiej proporcji występują one w badanej
próbie. Mammogramy pochodziły z internetowej bazy danych DDSM [18] zawierającej 2620 przypadków,
przeznaczonej do badań naukowych oraz testowania i porównywania skuteczności działania algorytmów CAD.
Testowa próba mammogramów składała się z 49 przypadków (17 mammografii negatywnych i 32 ze zmianami
patologicznymi), 20 skupisk mikrozwpanień i 12 guzów. Opis przypadku w bazie DDSM zawiera: typ utkania,
typ zmiany, jej skrócony opis, diagnozę radiologiczną, (w skali BI-RADS) lokalizację oraz stopień trudności
detekcji zmiany (w skali subtelności 1-5). Trudność detekcji zmiany jest wypadkową wielu czynników.
Najważniejsze z nich to: gęstość i typ utkania w otoczeniu zmiany oraz konfiguracja wartości jej cech (wielkość,
lokalizacja, wysycenie, dystrybucja dla mikrozwapnień itp.). Dlatego stopień trudności detekcji uznano za dobrą
ocenę stopnia trudności interpretacji zmiany. Średni stopień trudności interpretacji dla zmian w próbie wynosił
2,65, 2,35 dla mikrozwapnień i 3,08 dla guzów. Należy więc uznać, że większość zmian w próbie testowej
stanowiły patologie trudne w interpretacji. Do oceny wyników testu zastosowano analizę ROC – powszechnie
uznaną metodę szacowania trafności działania systemu diagnostycznego, różnicę efektywności radiologów w
różnych etapach testu szacowano na podstawie wartości statystyki kappa.
Do analizy statystycznej istotności różnicy pomiędzy wskaźnikami analizy ROC (pola pod krzywymi ROC)
użyto algorytmu Dorman’a-Berbaum’a-Metz’a (oprogramowania DBM MRMC [19]). Pakiet ten wykorzystuje
metodę analizy wariancji ANOVA do porównywania kilku populacji umożliwiając obliczanie statystycznie
istotnej różnicy w sytuacji, kiedy wydajność narzędzia diagnostycznego zależy zarówno od populacji
obserwatorów jak i od populacji przypadków. DBM MRMC przeprowadza analizę statystyczną dla opcji:
dobrani przypadkowi obserwatorzy i losowo dobrane przypadki, losowo dobrane przypadki, losowo dobrani
obserwatorzy. Wybrano test z ustalonymi obserwatorami i losowo dobranymi przypadkami, ponieważ
radiolodzy zostali dobrani celowo według doświadczenia zawodowego. Stwierdzono istotną statystycznie
różnicę pól pod krzywą ROC dla sumarycznej efektywności radiologów w pierwszym i drugim etapie testu
(AUC=pole pow. pod krzywą ROC - w pierwszym etapie testu AUCI = 0,497, w drugim - AUCII= 0,662, poziom
istotności p=0,014), co świadczy o istotnym statystycznie wzroście efektywności diagnostycznej dla grupy
obserwatorów. Wyniki przedstawiono w tab. 3, a na rys. 3 sumaryczne krzywe ROC dla grupy trzech
radiologów ilustrujące wzrost efektywności diagnostycznej przy użyciu edytora MammoEdit do wspomagania
interpretacji mammogramów.
Obserwatorzy
AUC
I etap
II etap
3 radiologów
0,497
Wzrost AUC
II etap
0,662
16,5%
Czułość
I etap
II etap
26,0%
56,3%
Tab. 3. Wzrost wskaźników liczbowych: pola pod krzywą ROC i czułości opisujących efektywność
diagnostyczną grupy trzech radiologów interpretujących mammogramy używając edytora MamoEdit
1,2
1
0,8
TPF
0,6
0,4
sta+spe+eks- I etap
0,2
sta+spe+eks - II etap
0
-0,2 -0,2 0
0,2
0,4
0,6
0,8
1
1,2
FPF
Rys 3. Różnica między efektywnością diagnostyczną dla grupy trzech radiologów w I i II etapie testu;
AUCI = 0,497, AUCII= 0,662, poziom istotności p=0,014.
Różnice wartości pól pod krzywymi ROC w I i II etapie testu liczone dla pojedynczych radiologów również
okazały się istotne statystycznie. Największy wzrost efektywności diagnostycznej zaobserwowano u radiologa
specjalisty (wzrost AUC o 15,8%), nieco mniejszy u radiologa stażysty (wzrost AUC o 14,1%). Najmniejszy
wzrost efektywności dotyczy eksperta (wzrost AUC o 10,2%), ale należy pamiętać, że w pierwszym etapie testu
jego efektywność znacznie przewyższała efektywność pozostałych lekarzy. Szczegółowe wyniki przedstawiono
w tabeli 4.
radiolog
AUC
I etap
II etap
sta
0,396
0,537
14,1%
Czułość
I etap
II etap
15 %
37,5%
spe
eks
0,486
0,611
0,734
0,713
15,8%
10,2%
20,6%
46,9%
Wzrost AUC
II etap
68,8%
62,5%
Tab. 4. Wpływ edytora MammoEdit na efektywność diagnostyczną pojedynczych radiologów (test dla trzech
radiologów) - zauważalny jest wzrost efektywności diagnostycznej poszczególnych radiologów w drugim etapie
testu, proporcjonalnie do wzrostu pola pod krzywą ROC.
Ważnym problemem obniżającym wartość diagnozy w mammografii jest jej zmienność. Efektem wspomagania
interpretacji mammogramów przy użyciu edytora MammoEdit jest jednoczesny wzrost spójności i efektywności
diagnozy. W drugim etapie wzrosła spójność diagnozy pomiędzy parami lekarzy stażysta-specjalista, specjalistaekspert i stażysta-ekspert. Szczegółowe wyniki zamieszczono w tab 5.
radiolog
sta-spe
spe-eks
sta-eks
Wart. statystyki Kappa
( ważonej)
I etap
II etap
0,196
0,482
0,238
0,294
0,052
0,476
Tab. 5. Wzrost spójności/zgodności diagnozy w drugim etapie testów (test dla trzech radiologów); miarą wzrostu
spójności diagnozy jest wzrost wartości statystyki kappa dla wszystkich par radiologów w drugim etapie testu.
Z wyników eksperymentów wynikają następujące wnioski:
istotny statystycznie wzrost efektywności diagnostycznej wszystkich radiologów biorących udział w
teście; najmniejsza różnica – ekspert, największa– specjalista, najmniejszą różnicę efektywności
między dwoma etapami testu zaobserwowano u radiologa stażysty;
wzrost spójności diagnozy wśród wszystkich par radiologów interpretujących mammogramy przy
użyciu edytora MammoEdit; największy wzrost zgodności dotyczy pary stażysta – ekspert;
MammoEdit może być cennym narzędziem edukacyjnym dla radiologów.
Ocena efektywności indeksowania mammogramów
Efektywność indeksowania silnie zależy od przyjętego kryterium, określającego czy zwrócone badanie jest
zgodne z zapytaniem, czy nie. Proponowane scenariusze testów, określające to kryterium, są następujące:
I. zapytanie z guzkiem – interesuje nas, ile w odpowiedzi będzie badań z przynajmniej jednym guzkiem;
II. zapytanie z guzkiem złośliwym – badania zawierające przynajmniej jeden guzek złośliwy;
III. zapytanie z dwoma guzkami – badania zawierające przynajmniej dwa guzki;
IV. zapytanie z guzkiem spikularnym – badania zawierające przynajmniej jeden guzek spikularny;
V. zapytanie z klastrem mikrozwapnień – badan z przynajmniej jednym klastrem mikrozwapnień;
VI. zapytanie ze złośliwym klastrem mikrozwapnień - badania z przynajmniej jednym złośliwym klastrem
mikrozwapnień;
VII. zapytanie z potencjalną zmianą patologiczną w piersi o rzadkim utkaniu (BIRADS I lub II) – badania
zawierające guzek lub klaster mikrozwapnień w piersi o rzadkim utkaniu;
VIII. Zapytanie z potencjalna zmiana patologiczna w piersi o gęstym utkaniu (BIRADS III lub IV) – badania
zawierające guzek lub klaster mikrozwapnień w piersi o gęstym utkaniu.
Wykresy efektywności indeksowania w proponowanych scenariuszach przedstawia rys. 4.
Rys. 4. Wykresy efektywności indeksowania – precyzja w funkcji przywołania - w wybranych scenariuszach.
Szczegółowe wyniki są dostępne w [14], można jednak powiedzieć, że osiągnięte rezultaty pozwalają na uznanie
proponowanych metod za użyteczne w indeksowaniu mammogramów. Wartość uzyskanych rezultatów jest tym
większa, że zostały one uzyskane w systemie IShark, stanowiącym prototypowy system referencyjnej bazy
medycznych danych obrazowych.
4. Konkluzje
Przedstawiono koncepcję ZSD zwracając szczególną uwagę na sformalizowaną bazę wiedzy mammograficznej i
bezpośrednie jej wykorzystanie oraz teleinformatyczne środowisko warunkujące efektywną pracę poprzez
dostęp i automatyczną selekcję najbardziej użytecznej informacji. Uwzględnienie w protokole badań interfejsu
sugerującego kompletność i systematyzację ocen oraz możliwość dostępu do badań referencyjnych
wyszukiwanych za pomocą zapytania przez przykład daje nowe możliwości diagnostyczne. Uzyskana w
eksperymentach skuteczność wspomagania świadczy o przydatności tych rozwiązań. Dalszym etapem
prowadzonych badań jest integracja ze stacją narzędzia do analizy i wizualizacji badań USG sutka - SonoLab,
która zapewni bardziej kompleksowe wsparcie diagnostyki i badań przesiewowych mammografii.
Literatura
[1] Elmore J, Feinstein A. A bibliography of publications on observer variability. J Clin Epidemiol 1992;45:567–
80.
[2] Schnitt SJ, Connolly JL, Tavassoli FA, Fechner RE, Kempson RL, Gelman R, et al. Interobserver
reproducibility in the diagnosis of ductal proliferative breast lesions using standardized criteria. Am J Surg
Pathol 1992;16: 1133–43.
[3] Elmore J, Wells C, Lee C, Howard D, Feinstein A. Variability in radiologists’ interpretations of
mammograms. N Engl J Med 1994;331:1493–9.
[4] Beam CA, Layde PM, Sullivan DC. Variability in the interpretation of screening mammograms by US
radiologists. Arch Intern Med 1996;156: 209–13.
[5] Kerlikowske K, Grady D, Barclay J, Frankel SD, Ominsky SH, Sickles EA, et al. Variability and accuracy in
mammographic interpretation using the American College of Radiology Breast Imaging Reporting and Data
System. J Natl Cancer Inst 1998;90:1801–9.
[6] Elmore JG, Miglioretti DL, Reisch LM, Barton MB,Kreuter W, Cindy L. Christiansen CL, Suzanne W.
Fletcher SW, Screening Mammograms by Community Radiologists: Variability in False-Positive Rates, Journal
of the National Cancer Institute, Vol. 94, No. 18, 2002
[7] Wagner RF, Beam CA, Beiden SV, Reader Variability in Mammography and Its Implications for Expected
Utility over the Population of Readers and Cases, Medical Decision Making, Vol. 24, No. 6, 561-572 (2004)
[8] Miglioretti DL, Smith-Bindman R, Abraham L, Brenner RJ, Carney PA, et al. Radiologist Characteristics
Associated With Interpretive Performance of Diagnostic Mammography. J Natl Cancer Inst 2007; 99:1854-1863
[9] Piętka E., Zintegrowany system informacyjny w pracy szpitala, PWN, 2004.
[10] Wróblewska A., Metody wspomagania detekcji zmian patologicznych w mammografii, rozprawa doktorska,
Politechnika Warszawska, 2008.
[11] Chandrasekaran, B., Josephson, J.R., Benjamins V.R.: What Are Ontologies, and Why We Need Them ?,
1999 IEEE Inteligent Systems pp 20-26
[12] Podsiadły-Marczykowska T., Guzik A., Ontologia mammografii, struktura modelu, definicje i instancje
pojęć, Bio-Algorithms and Med.-Systems , vol 1, no. 1, 2005 pp 247- 252
[13] Boniński P., Przelaskowski A., Durasiewicz K., Wróblewska A., Bargieł P., Automatyczne indeksowanie
obrazów w zastosowaniach medycznych, Materiały XIV Krajowej Konferencji Naukowej: Biocybernetyka
i Inżynieria Biomedyczna, tom 1:411-416, Częstochowa, 2005
[14] Boniński P., Metody indeksowania obrazów medycznych na potrzeby radiologii cyfrowej, rozprawa
doktorska, Politechnika Warszawska, 2007.
[15] Wróblewska A., Przelaskowski A., Bargieł P., Boniński P. Two stage detection and clustering of
microcalcifications in mammograms, Biomedizinische Technik, Medical Physics, 50 (supp 1): 56-57, Proc.
ICMP2005, Nuremberg, Germany, 2005.
[16] Boniński P, Przelaskowski A., Wróblewska A., Metoda detekcji guzków w obrazach mammograficznych
wykorzystująca transformacje Rayleigha, Sympozjum Inżynieria Biomedyczna i Telemedycyna IBiTel w
Warszawie - materiały, Prace Naukowe Politechniki Warszawskiej - Elektronika, 157:, Oficyna Wydawnicza
PW, 2007.
[17] Wróblewska A., Przelaskowski A., Bargieł P., Boniński P., „MammoViewer – CAD application based on
effective multiscale image analysis”, Polish Journal of Medical Physics & Engineering, vol. 11, no 1, 17-28,
2005
[18] DDSM(http://marathon.csee.usf.edu/Mammography/Database.html)
[19] oprogramowanie wykonujące analizę ROC http://wwwradiology.uchicago.edu/krl/KRL OC/software
index6.htm.
Integrated system for assistance of mammography diagnosis
Abstract: The concept of integrated reading workstation for screening and diagnosis of digital mammography
was presented. Computer-aided diagnosis (CAD) tools were interfaced to comprehensive image viewer,
optimized according to ontology-based knowledge with user-friendly interface for examination protocol
objectivity. Moreover, tele-information system IShark was designed for content-based image indexing and
retrieval. Formal description with protocol interface and IShark indexing efficiency were characterized in details.
Keywords: assisted diagnosis of mammography, mammography ontology, content-based image indexing
Tab.1. Interpretation variability assessment for screening mammography (1994-2002) – non-uniform study
material considering unequal mammograms and radiologist quantities and incompatible verification criterions of
mammographic diagnosis variability.
Tab.2. Comparison of mammogram interpretation sensitivity for radiologists working in academic medical
centers and those at non-academic health centers/institutions.
Tab.3 Increase in indexes: area under ROC curve and sensitivity describing diagnostic performance for a group
of three radiologists interpreting mammograms using MammoEdit.
Tab. 4 Influence of MammoEdit editor on diagnostic performance of single radiologist (test with three
radiologists) – visible increase in radiologist’s diagnostic performance in second test stage, proportional to
increased area under ROC curve.
Tab.5 Increase in diagnostic agreement (test for three radiologists); diagnostic agreement is assessed using kappa
statistics. Kappa statistics value was increased in second test stage for all pair of radiologists.
Fig.1 Mammographic lesion description. Lesion features, visual and non-visual as well have a graphical
primitive – an icon assigned. Describing a lesion is a simple action of clicking icons representing its attributes.
Lesion features suggesting malignancy are displayed in red
Fig. 2 Diagram of IShark
Fig.3 The difference in diagnostic performance for a group of three radiologists in I and II stage of the test;
AUCI = 0.497, AUCII= 0.662, significance level p=0.014.
Fig. 4. Efficiency of mammogram indexing: precision vs. recall tests according to I-VIII scenarios.
dr hab. inż. Artur Przelaskowski
e-mail: [email protected]
Instytut Radioelektroniki Politechniki Warszawskiej
Zakład Elektroniki Jądrowej i Medycznej
ul. Nowowiejska 15/19
00-665 Warszawa
pokój 11, tel. (22) 234-73-32
mgr inż. T.Podsiadły-Marczykowska
e-mail: [email protected]
Instytut Biocybernetyki i Inżynierii Biomedycznej PAN,
ul. Trojdena 4
02-109 Warszawa
mgr inż. Piotr Boniński
e-mail: [email protected]
Instytut Radioelektroniki Politechniki Warszawskiej
Zakład Elektroniki Jądrowej i Medycznej
ul. Nowowiejska 15/19
00-665 Warszawa
pokój 11, tel. (22) 234-73-32
mgr inż. Anna Wróblewska
e-mail: [email protected]
Instytut Radioelektroniki Politechniki Warszawskiej
Zakład Elektroniki Jądrowej i Medycznej
ul. Nowowiejska 15/19
00-665 Warszawa
pokój 11, tel. (22) 234-73-32

Podobne dokumenty