System ekspertowy do wspomagania diagnozy - IME

Transkrypt

System ekspertowy do wspomagania diagnozy - IME
Pomiary Automatyka Robotyka 7-8/2004
System ekspertowy do wspomagania
diagnozy łagodnego przerostu prostaty
Jarosław Makal
Andrzej Nazarkiewicz
Agnieszka Oniśko
Piotr Orzechowski*
W artykule zaprezentowano ideę budowy systemu ekspertowego do diagnozy BPH.
System ekspertowy powstał w oparciu o badania zalecane przez lekarzy urologów.
System ekspertowy został zbudowany w oparciu o sieci bayesowskie. System ekspertowy ma pomagać lekarzowi w kwalifikowaniu pacjenta na zabieg operacyjny.
Expert system for support of diagnosis of benign prostate hyperplasia.
hyperplasia. In this paper
an idea of expert system for support of diagnosis of BPH is presented. The support
system is build on bayes net. The results of investigations to building a model system
were recommended by the urologists. The expert system described in this paper has
to help doctor to make decision for operating patient.
Wstęp
Wobec szybko rozwijającej się techniki medycznej,
wspomaganie decyzji w medycynie staje się coraz bardziej istotne, gdyż coraz trudniej jest skutecznie analizować ogromną ilość danych i wyników różnych badań
określających stan pacjenta. Systemy ekspertowe oparte
na technice komputerowej mogą być pomocne dla lekarza, gdyż potrafią wykorzystywać pokaźne zbiory
danych aktualnych i archiwalnych oraz pokazują odchylenia od wartości prawidłowych.
Łagodny przerost gruczołu prostaty (BPH – Benign
Prostate Hyperplasia) należy do grupy najczęstszych
schorzeń urologicznych u dojrzałych mężczyzn. Pojawia się u co drugiego mężczyzny w wieku 50-69 lat,
u 70 % mężczyzn w wieku 70-79 lat oraz u ok. 90 %
męskiej populacji powyżej 80 roku życia. W ostatnim
dziesięcioleciu możliwości leczenia BPH znacznie się
zwiększyły: od nowych syntetycznych środków farmakologicznych po coraz doskonalsze leczenie operacyjne. Jednakże w dalszym ciągu wykonuje się rocznie ok. miliona zabiegów operacyjnych z powodu BPH,
w tym około 20 % z nich nie powoduje satysfakcjonującej poprawy. Dlatego tak ważna jest prawidłowa diagnostyka i w konsekwencji lepsza kwalifikacja do zabiegu. Nierzadko bowiem przyczyną niepowodzeń jest
fakt występowania dolegliwości ze strony dolnych dróg
moczowych niebędących następstwem BPH. Pełne badanie urodynamiczne, które pozwala na uzyskanie wiedzy o właściwej przyczynie, jest badaniem inwazyjnym
(dyskomfort pacjenta + możliwość infekcji) i zarazem
kosztownym. Realizowany przez autorów projekt ma
na celu opracowanie systemu ekspertowego wspomagającego diagnozowanie BPH korzystającego z danych
pozyskiwanych przez lekarza podczas rutynowych
badań pacjentów zgłaszających się z dolegliwościami
w obrębie dolnych dróg moczowych. Dotychczasowa
współpraca zespołu (autorzy artykułu) zaowocowała
m.in. powstaniem bazy danych (ciągle aktualizowanej), bazy wiedzy i prototypem ekspertowego systemu
wspomagania diagnozowania BPH.
Aspekt metrologiczny
Mierzenie jest (w dużym uproszczeniu) operacją porównania wielkości mierzonej z wzorcem. W medycynie mamy do czynienia z tzw. rozpoznawaniem wzorca,
gdy zespół objawów występujących u pacjenta odpowiada ustalonemu opisowi konkretnej choroby. Odległość tego opisu od uzyskanego zespołu objawów może
być miarą niepewności diagnozy [1]. Tzw. wnioskowanie w przód systemu ekspertowego jest odpowiednikiem porównania z wzorcem.
Z drugiej strony mierzenie zawiera też procedurę
redukcji danych, gdyż niewielka ilość wartości parametrów jest ostatecznie otrzymywana z wielkiej liczby
surowych danych. Z tym stwierdzeniem doskonale
koresponduje działanie systemu ekspertowego opartego na bazie danych oraz wiedzy spoza doświadczenia i wypracowującego jedną lub kilka wartości istotnych parametrów.
* Dr inż. Jarosław Makal – Politechnika Białostocka, Wydział Elektryczny;
lek. spec. Andrzej Nazarkiewicz – Szpital Wojewódzki im. J. Śniadeckiego w Białymstoku, Oddział Urologii;
dr inż. Agnieszka Oniśko – Politechnika Białostocka, Wydział Informatyki;
mgr inż. Piotr Orzechowski – Politechnika Białostocka, Wydział Elektryczny
193
14_s193_196_Makal.indd 193
2004-08-11 14:15:04
Pomiary Automatyka Robotyka 7-8/2004
Sieci bayesowskie
Sieci bayesowskie [2], nazywane również probabilistycznymi modelami graficznymi, sieciami przekonań lub sieciami przyczynowo-skutkowymi, stały się
na przełomie ostatniej dekady popularnym narzędziem
do reprezentacji wiedzy w warunkach niepewności [3].
Sieć bayesowska jest acyklicznym grafem skierowanym
i składa się z części jakościowej, którą stanowi zbiór
zmiennych – węzłów grafu wraz z probabilistycznymi
zależnościami pomiędzy nimi oraz części ilościowej,
reprezentującej łączny rozkład prawdopodobieństwa
dla tych zmiennych. Z punktu widzenia inżynierii wiedzy, sieć bayesowska może odzwierciedlać strukturę
przyczynowo-skutkową, która pozwala na pełniejsze
zrozumienie modelowanego problemu zarówno przez
ekspertów jak i użytkowników systemu.
Głównym zadaniem przy budowaniu sieci bayesowskiej jest określenie jej struktury oraz parametryzacja.
Podstawowym elementem struktury jest węzeł z tzw.
poprzednikiem i następnikiem (ang. parent and child).
Na rys. 1 przedstawiono fragment sieci zawierający
jeden węzeł.
Rys. 1. Przykładowy węzeł sieci z poprzednikiem i następnikiem
Kompletna tabela reprezentująca rozkład prawdopodobieństwa warunkowego dla zmiennej binarnej z n-binarnymi poprzednikami w sieci bayesowskiej wymaga
2n niezależnych parametrów. W przypadku znacznych
wartości n, określenie 2n parametrów przez eksperta
może okazać się trudne, a czasami nawet niemożliwe.
Tabela 1 opisuje zależności pomiędzy trzema pokazanymi elementami sieci, które są wyrażone za pomocą
rozkładów prawdopodobieństw.
Tabela. 1. Rozkłady prawdopodobieństwa dla węzłów z rys. 1
Parametry węzła: Wiek pacjenta
Wiek 50-69 lat
0,3
Wiek 70-79 lat
0,55
Wiek powyżej
0,15
80 lat
Parametry węzła: BPH
Wiek
Wiek
Wiek powy50-69 lat 70-79 lat
żej 80 lat
Tak
0,25
0,6
0,8
Nie
0,75
0,4
0,2
Parametry węzła: Test IPSS
Poprzednik
BPH
Stan
Tak
Nie
Mniej niż 7 pkt.
0,05
0,994
8-19 pkt.
0,2
0,001
Ponad 19 pkt.
0,75
0,005
Niewątpliwą zaletą sieci bayesowskich jest to, że
pozwalają one na łączenie wiedzy eksperta z danymi.
Jeżeli odpowiednia liczba danych jest dostępna, sieci
te, czyli zarówno ich struktura, jak i parametry, mogą
być nauczone z danych [4]. Jednak w przypadku zbiorów danych z niewielką liczbą rekordów, jakość tych
modeli jest niska.
Charakterystyka danych
Do budowy modelu wykorzystano wyniki badań należących do grupy tzw. badań zalecanych przez lekarzy urologów (należy je przeprowadzić u każdego pacjenta zgłaszającego się z dolegliwościami w obrębie
dolnych dróg moczowych). Należą do nich:
a) wywiad chorobowy, podczas którego pacjent informuje lekarza o charakterze dolegliwości (np. problemy z oddawaniem moczu), o aktualnych chorobach, np. nadciśnieniu, miażdżycy, kamicy nerkowej,
kamicy pęcherza, schorzeniach neurologicznych, cukrzycy, o przebytych operacjach lub urazach itp. Lekarz zapisuje te informacje jako 0 (nie występuje) lub
jako 1 (np. pacjent ma stwierdzoną cukrzycę).
b) punktowa skala objawów (IPSS – International
Prostate Symptom Score) oraz ocena jakości życia
(QL – Quality of Life). Pacjent odpowiada na 7 pytań,
których odpowiedzi są oceniane w skali od 0 do 5
punktów. Przyjmuje się następującą klasyfikację:
0-7 punktów – łagodne objawy, 8-19 punktów –
umiarkowane objawy, 20-35 punktów – ciężkie objawy. Test QL zawiera jedno pytanie o jakość życia
pacjenta i siedem możliwych odpowiedzi: od „świetnie” do „bardzo źle”.
Informacje uzyskane w ten sposób (a i b) mają bardzo subiektywny charakter. Zależą od pacjenta, który
mówi lekarzowi to, co jest dla niego ważne, o swoich
odczuciach i to co pamięta z historii chorób w przeszłości.
c) badanie palpacyjne gruczołu krokowego (DRE –
Digital Rectal Examination) pozwala doświadczonemu lekarzowi stwierdzić, czy gruczoł ten jest powiększony i czy jego konsystencja jest prawidłowa.
Wyróżniono tutaj trzy możliwości: gruczoł normalny,
lekko powiększony i zdecydowanie powiększony.
d) wielkość gruczołu krokowego badana za pomocą
USG powinna potwierdzać wynik badania DRE.
Informacje z pkt. c i d są ze sobą skorelowane,
dotyczą tego samego sygnału biologicznego, ale pozyskiwanego dwiema różnymi metodami.
e) badanie USG, którego celem jest też wykrycie ewentualnego guza pęcherza oraz stwierdzenie zalegania
moczu po mikcji. Nowoczesne aparaty USG pozwalają dosyć precyzyjnie określić ilość zalegającego
moczu (w ml).
194
14_s193_196_Makal.indd 194
2004-08-11 14:15:19
Pomiary Automatyka Robotyka 7-8/2004
f) badanie ogólne moczu wykluczające (lub potwierdzające) stan zapalny dróg moczowych. Badanie antygenu PSA przeprowadza się, jeśli gruczoł ma wyczuwalną twardą konsystencję. Jest to ważny test
wykluczający występowanie raka stercza. Pod kątem
istnienia wad rozwojowych badana jest też cewka
moczowa.
g) badanie przepływu cewkowego moczu, czyli tzw.
uroflowmetria, dostarcza informacji ilościowych
o całkowitym czasie mikcji, jej opóźnieniu, o maksymalnym przepływie oraz objętości wydalonego
moczu.
Dokładny opis wymienionych cech wraz z przypisanymi im wartościami zamieszczono w [5].
Elementy składowe systemu
System zbudowano na podstawie modelu sieci bayesowskiej. Wiedzę dla tych modeli pozyskuje się z baz
danych archiwalnych i aktualizowanych, od eksperta
i z literatury. Do wyrażenia wiedzy niepewnej wykorzystuje się prawdopodobieństwo, np. „u pacjenta z BPH
zaleganie moczu po mikcji występuje z prawdopodobieństwem 0,7”.
Pierwsza wstępna wersja modelu sieci bayesowskiej
została zbudowana na podstawie wiedzy eksperta w dziedzinie urologii (drugi autor tego artykułu). Wyróżnił
on 24 najważniejsze zmienne, które zostały uwzględnione w modelu. Struktura sieci składa się z 26 węzłów
(dwa z nich są węzłami celu) i 46 krawędzi.
Dla każdego węzła został wyznaczony rozkład prawdopodobieństwa. Dla węzłów niemających poprzedników
(rodziców) został określony rozkład prawdopodobieństwa a priori, a dla węzłów z poprzednikami – rozkład
prawdopodobieństwa warunkowego. Parametry numeryczne zostały pozyskane od eksperta. Dla 12 węzłów
ich rozkłady prawdopodobieństw warunkowych zostały przybliżone rozkładami Noisy-MAX [6, 7].
Wyniki przeprowadzonych
eksperymentów
Przeprowadzono eksperymenty związane z testowaniem jakości diagnostycznej modelu. Zbiór danych
testujących składał się z 56 rekordów reprezentujących dane chorobowe pacjentów z BPH, badanych pod
kątem ewentualnego zabiegu operacyjnego. Korzystanie z systemu polega na wprowadzeniu aktualnych wyników badań i obserwacji pacjenta oraz przeprowadzeniu wnioskowania w modelu sieci bayesowskiej,
w wyniku którego otrzymuje się liczbę z przedziału
(0;1) określającą prawdopodobieństwo, z jakim u danego pacjenta występuje BPH.
Diagnoza kolejnego pacjenta była wyznaczana poprzez wprowadzenie do modelu wartości zaobserwowanych cech, tzn. zbioru 24 danych odpowiadających
wynikom badań przedmiotowych i podmiotowych.
Po wprowadzeniu do modelu sieci bayesowskiej danych o 56 przypadkach chorobowych, zaobserwowano
rozkład prawdopodobieństwa a’ posteriori dla węzła
reprezentującego jednostkę chorobową BPH (rys. 3).
Rys. 3. Prawdopodobieństwo wystąpienia BPH
Przez jakość diagnostyczną rozumie się stosunek
liczby pacjentów, którzy zostali poprawnie zdiagnozowani przez model, do wszystkich przypadków chorobowych w zbiorze danych.
Inaczej mówiąc, dla każdego pacjenta było wyznaczane prawdopodobieństwo
występowania BPH. Jakość
diagnostyczna modelu wyniosła 0,8. Dla 44 przypadków
system podał poprawną diagnozę (wysokie prawdopodobieństwo występowania BPH
– wartości większe od 0,5).
Z kolei dwanaście przypadków chorobowych zostało
niepoprawnie zdiagnozowanych, tzn. system podał małe
prawdopodobieństwo wystąpienia BPH – wartości poniRys. 2. Fragment sieci z węzłem celu (BPH) i węzłami obserwacyjnymi
żej 0,2.
195
14_s193_196_Makal.indd 195
2004-08-11 14:15:19
Pomiary Automatyka Robotyka 7-8/2004
Dokładność danych
Na tym etapie tworzenia systemu ekspertowego nie
zajmowano się jeszcze dokładnością danych pozyskiwanych w trakcie badań przedmiotowych i podmiotowych pacjentów. Wszystkie te dane są wartościami
sygnałów biologicznych: jakościowych i ilościowych.
Podział ten nie jest niezmienny. Z upływem czasu –
w miarę doskonalenia technik pomiarowych – sygnały
biologiczne należące do grupy jakościowych mogą być
kwalifikowane do grupy sygnałów ilościowych, a zatem spełniających kryterium mierzalności w sensie
metrologicznym. Np. informacje przekazywane lekarzowi przez pacjenta w trakcie wywiadu lekarskiego
mogą być klasyfikowane wg pewnej skali za pomocą
np. punktowanych odpowiednio pytań testowych i tym
samym, z informacji jakościowych przekształcają się
w ilościowe (np. wspomniany test IPSS). Zastosowany
do budowy systemu model probabilistyczny umożliwia
łatwe wnioskowanie przy różnych wartościach zaobserwowanych cech, co pozwala na wyznaczenie tzw.
współczynników wrażliwości (zmiana wartości prawdopodobieństwa wystąpienia BPH wywołana przez pojedynczą zmianę wartości cechy).
Dokładność systemu ekspertowego
Parametrem informującym o dokładności systemu
ekspertowego jest jego jakość diagnostyczna ( JD).
W opisywanym modelu jest ona równa JD = 0,8. Można
więc określić jego niepewność jako
NP = (1 – JD) · 100 % = 20 %
Niewielka stosunkowo liczba rekordów oraz wstępne
uproszczenia w zastosowanym modelu spowodowały,
że otrzymana wartość niepewności jest dosyć duża.
Jest to szczególnie ważne w medycynie, gdzie badaniu
i diagnozie poddawany jest pacjent.
Wnioski
Opisany system ekspertowy ma pomagać lekarzowi
w kwalifikowaniu pacjenta do zabiegu operacyjnego.
Już pierwsza wersja trafnie diagnozuje 80 % badanych
pacjentów. Dalsze prace nad modyfikacją struktury systemu i wartościami parametrów w węzłach powinny
doprowadzić do znacznego polepszenia wyniku. Przy
dużej liczbie zweryfikowanych danych (ponad 200)
można uczyć parametry numeryczne modelu z tych
danych. Jest to właściwość modeli zbudowanych na
sieci bayesowskiej. Model sieci bayesowskiej pozwala
również na określenie wartości diagnostycznej obserwowanych poszczególnych cech. Kolejną zaletą takiego systemu diagnostycznego jest określenie diagnozy nawet przy braku niektórych cech, np. gdy nie
przeprowadzono badania PSA lub testu QL. Można też
sprawdzić, o ile zmieni się prawdopodobieństwo wystąpienia choroby (BPH), jeżeli zostanie przeprowadzone dodatkowe badanie, np. powtórzony pomiar
przepływu lub test IPSS.
Wspomniane cechy systemu oraz potencjalne zastosowanie w badaniach epidemiologicznych powodują,
że realizowany projekt wzbudza duże zainteresowanie
w środowisku lekarzy urologów.
Podziękowania
Do budowy i testowania modelu sieci bayesowskiej
autorzy wykorzystują biblioteki klas C++: SMILE☺
i program GeNIe, służące do tworzenia i wnioskowania w graficznych modelach probabilistycznych. Narzędzia te powstały w Laboratorium Systemów Decyzyjnych (Decision Systems Laboratory) Uniwersytetu
w Pittsburgu i są dostępne na stronie http://www.sis.
pitt.edu/~genie.
Autorzy dziękują również ordynatorowi Oddziału
Urologii Szpitala Wojewódzkiego im. J. Śniadeckiego
w Białymstoku, dr. n. med. Robertowi Kozłowskiemu
za cenne uwagi i konsultacje.
Praca powstała w ramach projektu nr W/WI/1/02
oraz projektu pt. „Medyczny system pomiarowy wspomagający diagnozowanie BPH”.
Bibliografia
[1] Makal J.: Medical Diagnosis as the Result of Multiparameter Indirect Measurement, 4th International Conference on Measurement (by IMEKO TC-7 & TC-13),
June 15-19, 2003 Smolenice Castle, Slovakia; (p. 260-263).
[2] Pearl J.: Probabilistic Reasoning in Intelligent Systems:
Networks of Plausible Inference. Morgan Kaufmann
Publishers, Inc., San Mateo 1988, CA.
[3] Henrion M., Breese J.S. i Horwitz E.J.: Decision analysis and expert systems. AI Magazine 1991, 12 (4);
64-91.
[4] Spirtes P., Glymour C., Scheines R.: Causation, Prediction, and Search. Springer Verlag 1993, New York.
[5] Orzechowski P., Makal J.: Akwizycja danych medycznych występujących w diagnostyce łagodnego przerostu prostaty (BPH), VI Szkoła-Konferencja Metrologia Wspomagana Komputerowo, 28-31 maja 2003;
(s. 275-280).
[6] Diez F. J.: Parameter adjustment in Bayes networks.
The generalized Noisy-OR gate, Proceedings of the
Ninth Annual Conference on Uncertainty in Artificial Intelligence (UAI-93), 99-105, Washington 1993,
D.C.
[7] Henrion M.: Some practical issues in constructing belief networks. W L.N. Kanal, T.S. Levitt, and J.F. Lemmer editors, Uncertainty in Artificial Intelligence 3,
161-173. Elsevier Science Publishers B.V., North Holland 1989.
196
14_s193_196_Makal.indd 196
2004-08-11 14:15:19