System ekspertowy do wspomagania diagnozy - IME
Transkrypt
System ekspertowy do wspomagania diagnozy - IME
Pomiary Automatyka Robotyka 7-8/2004 System ekspertowy do wspomagania diagnozy łagodnego przerostu prostaty Jarosław Makal Andrzej Nazarkiewicz Agnieszka Oniśko Piotr Orzechowski* W artykule zaprezentowano ideę budowy systemu ekspertowego do diagnozy BPH. System ekspertowy powstał w oparciu o badania zalecane przez lekarzy urologów. System ekspertowy został zbudowany w oparciu o sieci bayesowskie. System ekspertowy ma pomagać lekarzowi w kwalifikowaniu pacjenta na zabieg operacyjny. Expert system for support of diagnosis of benign prostate hyperplasia. hyperplasia. In this paper an idea of expert system for support of diagnosis of BPH is presented. The support system is build on bayes net. The results of investigations to building a model system were recommended by the urologists. The expert system described in this paper has to help doctor to make decision for operating patient. Wstęp Wobec szybko rozwijającej się techniki medycznej, wspomaganie decyzji w medycynie staje się coraz bardziej istotne, gdyż coraz trudniej jest skutecznie analizować ogromną ilość danych i wyników różnych badań określających stan pacjenta. Systemy ekspertowe oparte na technice komputerowej mogą być pomocne dla lekarza, gdyż potrafią wykorzystywać pokaźne zbiory danych aktualnych i archiwalnych oraz pokazują odchylenia od wartości prawidłowych. Łagodny przerost gruczołu prostaty (BPH – Benign Prostate Hyperplasia) należy do grupy najczęstszych schorzeń urologicznych u dojrzałych mężczyzn. Pojawia się u co drugiego mężczyzny w wieku 50-69 lat, u 70 % mężczyzn w wieku 70-79 lat oraz u ok. 90 % męskiej populacji powyżej 80 roku życia. W ostatnim dziesięcioleciu możliwości leczenia BPH znacznie się zwiększyły: od nowych syntetycznych środków farmakologicznych po coraz doskonalsze leczenie operacyjne. Jednakże w dalszym ciągu wykonuje się rocznie ok. miliona zabiegów operacyjnych z powodu BPH, w tym około 20 % z nich nie powoduje satysfakcjonującej poprawy. Dlatego tak ważna jest prawidłowa diagnostyka i w konsekwencji lepsza kwalifikacja do zabiegu. Nierzadko bowiem przyczyną niepowodzeń jest fakt występowania dolegliwości ze strony dolnych dróg moczowych niebędących następstwem BPH. Pełne badanie urodynamiczne, które pozwala na uzyskanie wiedzy o właściwej przyczynie, jest badaniem inwazyjnym (dyskomfort pacjenta + możliwość infekcji) i zarazem kosztownym. Realizowany przez autorów projekt ma na celu opracowanie systemu ekspertowego wspomagającego diagnozowanie BPH korzystającego z danych pozyskiwanych przez lekarza podczas rutynowych badań pacjentów zgłaszających się z dolegliwościami w obrębie dolnych dróg moczowych. Dotychczasowa współpraca zespołu (autorzy artykułu) zaowocowała m.in. powstaniem bazy danych (ciągle aktualizowanej), bazy wiedzy i prototypem ekspertowego systemu wspomagania diagnozowania BPH. Aspekt metrologiczny Mierzenie jest (w dużym uproszczeniu) operacją porównania wielkości mierzonej z wzorcem. W medycynie mamy do czynienia z tzw. rozpoznawaniem wzorca, gdy zespół objawów występujących u pacjenta odpowiada ustalonemu opisowi konkretnej choroby. Odległość tego opisu od uzyskanego zespołu objawów może być miarą niepewności diagnozy [1]. Tzw. wnioskowanie w przód systemu ekspertowego jest odpowiednikiem porównania z wzorcem. Z drugiej strony mierzenie zawiera też procedurę redukcji danych, gdyż niewielka ilość wartości parametrów jest ostatecznie otrzymywana z wielkiej liczby surowych danych. Z tym stwierdzeniem doskonale koresponduje działanie systemu ekspertowego opartego na bazie danych oraz wiedzy spoza doświadczenia i wypracowującego jedną lub kilka wartości istotnych parametrów. * Dr inż. Jarosław Makal – Politechnika Białostocka, Wydział Elektryczny; lek. spec. Andrzej Nazarkiewicz – Szpital Wojewódzki im. J. Śniadeckiego w Białymstoku, Oddział Urologii; dr inż. Agnieszka Oniśko – Politechnika Białostocka, Wydział Informatyki; mgr inż. Piotr Orzechowski – Politechnika Białostocka, Wydział Elektryczny 193 14_s193_196_Makal.indd 193 2004-08-11 14:15:04 Pomiary Automatyka Robotyka 7-8/2004 Sieci bayesowskie Sieci bayesowskie [2], nazywane również probabilistycznymi modelami graficznymi, sieciami przekonań lub sieciami przyczynowo-skutkowymi, stały się na przełomie ostatniej dekady popularnym narzędziem do reprezentacji wiedzy w warunkach niepewności [3]. Sieć bayesowska jest acyklicznym grafem skierowanym i składa się z części jakościowej, którą stanowi zbiór zmiennych – węzłów grafu wraz z probabilistycznymi zależnościami pomiędzy nimi oraz części ilościowej, reprezentującej łączny rozkład prawdopodobieństwa dla tych zmiennych. Z punktu widzenia inżynierii wiedzy, sieć bayesowska może odzwierciedlać strukturę przyczynowo-skutkową, która pozwala na pełniejsze zrozumienie modelowanego problemu zarówno przez ekspertów jak i użytkowników systemu. Głównym zadaniem przy budowaniu sieci bayesowskiej jest określenie jej struktury oraz parametryzacja. Podstawowym elementem struktury jest węzeł z tzw. poprzednikiem i następnikiem (ang. parent and child). Na rys. 1 przedstawiono fragment sieci zawierający jeden węzeł. Rys. 1. Przykładowy węzeł sieci z poprzednikiem i następnikiem Kompletna tabela reprezentująca rozkład prawdopodobieństwa warunkowego dla zmiennej binarnej z n-binarnymi poprzednikami w sieci bayesowskiej wymaga 2n niezależnych parametrów. W przypadku znacznych wartości n, określenie 2n parametrów przez eksperta może okazać się trudne, a czasami nawet niemożliwe. Tabela 1 opisuje zależności pomiędzy trzema pokazanymi elementami sieci, które są wyrażone za pomocą rozkładów prawdopodobieństw. Tabela. 1. Rozkłady prawdopodobieństwa dla węzłów z rys. 1 Parametry węzła: Wiek pacjenta Wiek 50-69 lat 0,3 Wiek 70-79 lat 0,55 Wiek powyżej 0,15 80 lat Parametry węzła: BPH Wiek Wiek Wiek powy50-69 lat 70-79 lat żej 80 lat Tak 0,25 0,6 0,8 Nie 0,75 0,4 0,2 Parametry węzła: Test IPSS Poprzednik BPH Stan Tak Nie Mniej niż 7 pkt. 0,05 0,994 8-19 pkt. 0,2 0,001 Ponad 19 pkt. 0,75 0,005 Niewątpliwą zaletą sieci bayesowskich jest to, że pozwalają one na łączenie wiedzy eksperta z danymi. Jeżeli odpowiednia liczba danych jest dostępna, sieci te, czyli zarówno ich struktura, jak i parametry, mogą być nauczone z danych [4]. Jednak w przypadku zbiorów danych z niewielką liczbą rekordów, jakość tych modeli jest niska. Charakterystyka danych Do budowy modelu wykorzystano wyniki badań należących do grupy tzw. badań zalecanych przez lekarzy urologów (należy je przeprowadzić u każdego pacjenta zgłaszającego się z dolegliwościami w obrębie dolnych dróg moczowych). Należą do nich: a) wywiad chorobowy, podczas którego pacjent informuje lekarza o charakterze dolegliwości (np. problemy z oddawaniem moczu), o aktualnych chorobach, np. nadciśnieniu, miażdżycy, kamicy nerkowej, kamicy pęcherza, schorzeniach neurologicznych, cukrzycy, o przebytych operacjach lub urazach itp. Lekarz zapisuje te informacje jako 0 (nie występuje) lub jako 1 (np. pacjent ma stwierdzoną cukrzycę). b) punktowa skala objawów (IPSS – International Prostate Symptom Score) oraz ocena jakości życia (QL – Quality of Life). Pacjent odpowiada na 7 pytań, których odpowiedzi są oceniane w skali od 0 do 5 punktów. Przyjmuje się następującą klasyfikację: 0-7 punktów – łagodne objawy, 8-19 punktów – umiarkowane objawy, 20-35 punktów – ciężkie objawy. Test QL zawiera jedno pytanie o jakość życia pacjenta i siedem możliwych odpowiedzi: od „świetnie” do „bardzo źle”. Informacje uzyskane w ten sposób (a i b) mają bardzo subiektywny charakter. Zależą od pacjenta, który mówi lekarzowi to, co jest dla niego ważne, o swoich odczuciach i to co pamięta z historii chorób w przeszłości. c) badanie palpacyjne gruczołu krokowego (DRE – Digital Rectal Examination) pozwala doświadczonemu lekarzowi stwierdzić, czy gruczoł ten jest powiększony i czy jego konsystencja jest prawidłowa. Wyróżniono tutaj trzy możliwości: gruczoł normalny, lekko powiększony i zdecydowanie powiększony. d) wielkość gruczołu krokowego badana za pomocą USG powinna potwierdzać wynik badania DRE. Informacje z pkt. c i d są ze sobą skorelowane, dotyczą tego samego sygnału biologicznego, ale pozyskiwanego dwiema różnymi metodami. e) badanie USG, którego celem jest też wykrycie ewentualnego guza pęcherza oraz stwierdzenie zalegania moczu po mikcji. Nowoczesne aparaty USG pozwalają dosyć precyzyjnie określić ilość zalegającego moczu (w ml). 194 14_s193_196_Makal.indd 194 2004-08-11 14:15:19 Pomiary Automatyka Robotyka 7-8/2004 f) badanie ogólne moczu wykluczające (lub potwierdzające) stan zapalny dróg moczowych. Badanie antygenu PSA przeprowadza się, jeśli gruczoł ma wyczuwalną twardą konsystencję. Jest to ważny test wykluczający występowanie raka stercza. Pod kątem istnienia wad rozwojowych badana jest też cewka moczowa. g) badanie przepływu cewkowego moczu, czyli tzw. uroflowmetria, dostarcza informacji ilościowych o całkowitym czasie mikcji, jej opóźnieniu, o maksymalnym przepływie oraz objętości wydalonego moczu. Dokładny opis wymienionych cech wraz z przypisanymi im wartościami zamieszczono w [5]. Elementy składowe systemu System zbudowano na podstawie modelu sieci bayesowskiej. Wiedzę dla tych modeli pozyskuje się z baz danych archiwalnych i aktualizowanych, od eksperta i z literatury. Do wyrażenia wiedzy niepewnej wykorzystuje się prawdopodobieństwo, np. „u pacjenta z BPH zaleganie moczu po mikcji występuje z prawdopodobieństwem 0,7”. Pierwsza wstępna wersja modelu sieci bayesowskiej została zbudowana na podstawie wiedzy eksperta w dziedzinie urologii (drugi autor tego artykułu). Wyróżnił on 24 najważniejsze zmienne, które zostały uwzględnione w modelu. Struktura sieci składa się z 26 węzłów (dwa z nich są węzłami celu) i 46 krawędzi. Dla każdego węzła został wyznaczony rozkład prawdopodobieństwa. Dla węzłów niemających poprzedników (rodziców) został określony rozkład prawdopodobieństwa a priori, a dla węzłów z poprzednikami – rozkład prawdopodobieństwa warunkowego. Parametry numeryczne zostały pozyskane od eksperta. Dla 12 węzłów ich rozkłady prawdopodobieństw warunkowych zostały przybliżone rozkładami Noisy-MAX [6, 7]. Wyniki przeprowadzonych eksperymentów Przeprowadzono eksperymenty związane z testowaniem jakości diagnostycznej modelu. Zbiór danych testujących składał się z 56 rekordów reprezentujących dane chorobowe pacjentów z BPH, badanych pod kątem ewentualnego zabiegu operacyjnego. Korzystanie z systemu polega na wprowadzeniu aktualnych wyników badań i obserwacji pacjenta oraz przeprowadzeniu wnioskowania w modelu sieci bayesowskiej, w wyniku którego otrzymuje się liczbę z przedziału (0;1) określającą prawdopodobieństwo, z jakim u danego pacjenta występuje BPH. Diagnoza kolejnego pacjenta była wyznaczana poprzez wprowadzenie do modelu wartości zaobserwowanych cech, tzn. zbioru 24 danych odpowiadających wynikom badań przedmiotowych i podmiotowych. Po wprowadzeniu do modelu sieci bayesowskiej danych o 56 przypadkach chorobowych, zaobserwowano rozkład prawdopodobieństwa a’ posteriori dla węzła reprezentującego jednostkę chorobową BPH (rys. 3). Rys. 3. Prawdopodobieństwo wystąpienia BPH Przez jakość diagnostyczną rozumie się stosunek liczby pacjentów, którzy zostali poprawnie zdiagnozowani przez model, do wszystkich przypadków chorobowych w zbiorze danych. Inaczej mówiąc, dla każdego pacjenta było wyznaczane prawdopodobieństwo występowania BPH. Jakość diagnostyczna modelu wyniosła 0,8. Dla 44 przypadków system podał poprawną diagnozę (wysokie prawdopodobieństwo występowania BPH – wartości większe od 0,5). Z kolei dwanaście przypadków chorobowych zostało niepoprawnie zdiagnozowanych, tzn. system podał małe prawdopodobieństwo wystąpienia BPH – wartości poniRys. 2. Fragment sieci z węzłem celu (BPH) i węzłami obserwacyjnymi żej 0,2. 195 14_s193_196_Makal.indd 195 2004-08-11 14:15:19 Pomiary Automatyka Robotyka 7-8/2004 Dokładność danych Na tym etapie tworzenia systemu ekspertowego nie zajmowano się jeszcze dokładnością danych pozyskiwanych w trakcie badań przedmiotowych i podmiotowych pacjentów. Wszystkie te dane są wartościami sygnałów biologicznych: jakościowych i ilościowych. Podział ten nie jest niezmienny. Z upływem czasu – w miarę doskonalenia technik pomiarowych – sygnały biologiczne należące do grupy jakościowych mogą być kwalifikowane do grupy sygnałów ilościowych, a zatem spełniających kryterium mierzalności w sensie metrologicznym. Np. informacje przekazywane lekarzowi przez pacjenta w trakcie wywiadu lekarskiego mogą być klasyfikowane wg pewnej skali za pomocą np. punktowanych odpowiednio pytań testowych i tym samym, z informacji jakościowych przekształcają się w ilościowe (np. wspomniany test IPSS). Zastosowany do budowy systemu model probabilistyczny umożliwia łatwe wnioskowanie przy różnych wartościach zaobserwowanych cech, co pozwala na wyznaczenie tzw. współczynników wrażliwości (zmiana wartości prawdopodobieństwa wystąpienia BPH wywołana przez pojedynczą zmianę wartości cechy). Dokładność systemu ekspertowego Parametrem informującym o dokładności systemu ekspertowego jest jego jakość diagnostyczna ( JD). W opisywanym modelu jest ona równa JD = 0,8. Można więc określić jego niepewność jako NP = (1 – JD) · 100 % = 20 % Niewielka stosunkowo liczba rekordów oraz wstępne uproszczenia w zastosowanym modelu spowodowały, że otrzymana wartość niepewności jest dosyć duża. Jest to szczególnie ważne w medycynie, gdzie badaniu i diagnozie poddawany jest pacjent. Wnioski Opisany system ekspertowy ma pomagać lekarzowi w kwalifikowaniu pacjenta do zabiegu operacyjnego. Już pierwsza wersja trafnie diagnozuje 80 % badanych pacjentów. Dalsze prace nad modyfikacją struktury systemu i wartościami parametrów w węzłach powinny doprowadzić do znacznego polepszenia wyniku. Przy dużej liczbie zweryfikowanych danych (ponad 200) można uczyć parametry numeryczne modelu z tych danych. Jest to właściwość modeli zbudowanych na sieci bayesowskiej. Model sieci bayesowskiej pozwala również na określenie wartości diagnostycznej obserwowanych poszczególnych cech. Kolejną zaletą takiego systemu diagnostycznego jest określenie diagnozy nawet przy braku niektórych cech, np. gdy nie przeprowadzono badania PSA lub testu QL. Można też sprawdzić, o ile zmieni się prawdopodobieństwo wystąpienia choroby (BPH), jeżeli zostanie przeprowadzone dodatkowe badanie, np. powtórzony pomiar przepływu lub test IPSS. Wspomniane cechy systemu oraz potencjalne zastosowanie w badaniach epidemiologicznych powodują, że realizowany projekt wzbudza duże zainteresowanie w środowisku lekarzy urologów. Podziękowania Do budowy i testowania modelu sieci bayesowskiej autorzy wykorzystują biblioteki klas C++: SMILE☺ i program GeNIe, służące do tworzenia i wnioskowania w graficznych modelach probabilistycznych. Narzędzia te powstały w Laboratorium Systemów Decyzyjnych (Decision Systems Laboratory) Uniwersytetu w Pittsburgu i są dostępne na stronie http://www.sis. pitt.edu/~genie. Autorzy dziękują również ordynatorowi Oddziału Urologii Szpitala Wojewódzkiego im. J. Śniadeckiego w Białymstoku, dr. n. med. Robertowi Kozłowskiemu za cenne uwagi i konsultacje. Praca powstała w ramach projektu nr W/WI/1/02 oraz projektu pt. „Medyczny system pomiarowy wspomagający diagnozowanie BPH”. Bibliografia [1] Makal J.: Medical Diagnosis as the Result of Multiparameter Indirect Measurement, 4th International Conference on Measurement (by IMEKO TC-7 & TC-13), June 15-19, 2003 Smolenice Castle, Slovakia; (p. 260-263). [2] Pearl J.: Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan Kaufmann Publishers, Inc., San Mateo 1988, CA. [3] Henrion M., Breese J.S. i Horwitz E.J.: Decision analysis and expert systems. AI Magazine 1991, 12 (4); 64-91. [4] Spirtes P., Glymour C., Scheines R.: Causation, Prediction, and Search. Springer Verlag 1993, New York. [5] Orzechowski P., Makal J.: Akwizycja danych medycznych występujących w diagnostyce łagodnego przerostu prostaty (BPH), VI Szkoła-Konferencja Metrologia Wspomagana Komputerowo, 28-31 maja 2003; (s. 275-280). [6] Diez F. J.: Parameter adjustment in Bayes networks. The generalized Noisy-OR gate, Proceedings of the Ninth Annual Conference on Uncertainty in Artificial Intelligence (UAI-93), 99-105, Washington 1993, D.C. [7] Henrion M.: Some practical issues in constructing belief networks. W L.N. Kanal, T.S. Levitt, and J.F. Lemmer editors, Uncertainty in Artificial Intelligence 3, 161-173. Elsevier Science Publishers B.V., North Holland 1989. 196 14_s193_196_Makal.indd 196 2004-08-11 14:15:19