zastosowanie wybranych metod klasyfikacji w systemie
Transkrypt
zastosowanie wybranych metod klasyfikacji w systemie
MODELOWANIE INśYNIERSKIE 34, s. 17-22, Gliwice 2007 ISSN 1896-771X ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE WSPOMAGANIA DECYZJI OPARTYM NA MODELU DYNAMIKI CHODU MARCIN DERLATKA, JOLANTA PAUK1 Katedra Automatyki i Robotyki, Politechnika Białostocka e-mail:[email protected], [email protected] Streszczenie. W pracy zastosowano: rozmyty model Dempstera-Shafera, sztuczne sieci neuronowe i drzewa decyzyjne do przeprowadzenia klasyfikacji danych otrzymanych w wyniku identyfikacji modelu dynamiki chodu człowieka metodą regresji. Uzyskane wyniki są bardzo dobre. Na szczególną uwagę zasługują drzewa decyzyjne, które podejmowały decyzje na podstawie czterech parametrów. 1. WPROWADZENIE Chód człowieka jest zjawiskiem bardzo złoŜonym. Pełny ilościowy opis tego zjawiska obejmuje wielkości: • kinematyczne, • dynamiczne, • antropomorficzne, • elektromiograficzne, • inne. Pomiar tych danych jest niezbędny do przeprowadzenia oceny analizy chodu człowieka. Analiza chodu jest bardzo waŜna m. in. w: • określeniu rodzaju i stopnia patologii, • wyborze właściwej metody usprawniania aparatu ruchu pacjenta (operacja, rehabilitacja itd.). Pewne cechy zjawiska (takie jak: korelacje pomiędzy niektórymi wielkościami, nieliniowość) sprawiają, Ŝe dokłada analiza chodu człowieka jest zadaniem czasochłonnym, złoŜonym i wymagającym zaangaŜowania eksperta posiadającego wiedzę zarówno inŜynierską, jak i medyczną. Ten ostatni wymóg moŜna wyeliminować, stosując odpowiedni system do wspomagania podejmowania decyzji w biomechanice chodu człowieka. Głównymi cechami systemu do wspomagania decyzji powinny być: • wysoka jakość - dokładność w podejmowaniu decyzji porównywana do decyzji podejmowanych przez „eksperta”; 1 Laureat konkursu "Stypendia krajowe dla młodych uczonych" z Fundacji na Rzecz Nauki Polskiej w 2007 r. 18 M. DERLATKA, J. PAUK • łatwa moŜliwość rozbudowy sytemu. Jakość działania omawianego systemu zaleŜy głównie od dwóch czynników: wyboru właściwych parametrów opisujących chód człowieka i przyjętej metody przetwarzania parametrów diagnostycznych w rodzaj patologii lub w wybraną metodę usprawniania chodu (klasyfikacja). Celem niniejszej pracy jest analiza jakości podejmowanych decyzji przez system wspomagania decyzji oparty na współczynnikach modelu dynamiki chodu człowieka w zaleŜności od przyjętej metody klasyfikacji. 2. MATERIAŁ I METODA Parametry diagnostyczne zostały uzyskane w wyniku zastosowania identyfikacji modelu dynamiki chodu człowieka metodą regresji [4]. Do identyfikacji modelu wykorzystano przebiegi chwilowe mocy rozwijane przez zespoły mięśniowe wokół głównych stawów kończyny dolnej podczas chodu. Współczynniki modelu chodu człowieka określono dla dwóch głównych faz cyklu chodu: fazy podporowej i wymachu. Moce zostały znormalizowane do cięŜaru ciała człowieka. Wykorzystanie przebiegów chwilowy mocy jest podyktowane tym, Ŝe ta wielkość jest kombinacją danych kinematycznych i dynamicznych. Y n = U n ⋅ a, (1) dla n = 1, 2, …, N U n = [Yn−1 a = [a1 Yn −2 ... Yn −k ], (2) a2 ... ak ]T (3) gdzie: N - liczba pomiarów; Yn - moce rozwijane przez zespoły mięśniowe obsługujące staw biodrowy, kolanowy i skokowo-goleniowy w n-tej chwili czasowej; a - macierz kolumnowa poszukiwanych współczynników; Un – macierz wierszowa wielkości wejściowych (moce rozwijane przez poszczególne zespoły mięśniowe obsługujące staw biodrowy, kolanowy i skokowo – goleniowy w k-poprzednich chwilach czasowych). ε a=? Λ Y a=? Y a) b) Rys. 1. Identyfikacja modelu: a) proces rzeczywisty; b) model Badania laboratoryjne zostały przeprowadzone przy uŜyciu systemów optoelektronicznych Ellite 3D i Morion Analysis System odpowiednio w Centrum BioinŜynierii w Mediolanie we Włoszech i Glenrose Rehabilitation Hospital w Edmonton w Kanadzie. Dane przedstawiają chód normalny i wybranych patologii w płaszczyźnie strzałkowej po względnie płaskiej ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE… 19 i utwardzonej powierzchni, w warunkach laboratoryjnych. Wśród wybranych patologii narządu ruchu były: • poraŜenie mózgowe (CP) – kurczowe poraŜenie obustronne; • rozszczep kręgosłupa (SB) – przepuklina oponowo-rdzeniowa. W sumie w badaniach wzięło udział około 40 osób. W obu ośrodkach w badaniach przyjęto protokół S.A.F.L.O. Tabela 1. Materiał badawczy Grupa Liczba osób Norma 10 PoraŜenie mózgowe 15 Rozszczep kręgosłupa 15 W wyniku identyfikacji modelu chodu człowieka metodą regresji otrzymano 18 parametrów diagnostycznych. Parametry te były wielkościami wejściowymi do zbudowanych klasyfikatorów. Klasyfikację przeprowadzono przy uŜyciu: rozmytego klasyfikatora Dempstera-Shafera, sztucznych sieci neuronowych, drzew klasyfikacji. Dane zostały podzielone na tzw. ciąg uczący i ciąg testujący. Jakość działania oceniano przyjmując decyzje podjęte przez personel Centrum BioinŜynierii w Mediolanie i Glenrose Rehabilitation Hospital jako wzorcowe. 3. WYNIKI Do klasyfikacji za pomocą sztucznych sieci neuronowych wybrano sieć jednokierunkową o architekturze 21-6-3. PoniewaŜ wszystkie wartości wejściowe były liczbami niewielkimi tego samego rzędu, nie wykonywano wstępnego przetwarzania danych. Klasy zakodowano na podstawie kodu „1 z n” w następujący sposób: • 1 0 0 - norma; • 0 1 0 - rozszczep kręgosłupa; • 0 0 1 - poraŜenie mózgowe. Uczenie przeprowadzono za pomocą algorytmu RPROP [3, 5]. Uzyskaną sieć wynikową przedstawiono na rys. 2. W trakcie treningu sieć wykazywała pewną tendencję do przeuczania się, co przy tak duŜym rozmiarze wektora wag w porówaniu do liczności zbioru uczącego jest dość oczywiste. NaleŜy podkreślić, iŜ zastosowanie jakiejkolwiek metody redukcji przestrzeni wejściowej moŜe przynieść tylko poprawę zdolności uogólniania rozwaŜanej sieci neuronowej. Zastosowanie rozmytego modelu Dempstera-Shafera do klasyfikacji jest znaną metodą ułatwiającą wnioskowania diagnostycznego w dziedzinie inŜynierii biomedycznej. W niniejszej pracy do wygenerowania reguł rozmytych uŜyto kwadratowej funkcji przynaleŜności w następującej postaci [1] 2 ( X − xi ) y =1− (xi − xi+1) gdzie: y X xi - funkcja przeliczająca, zmienna decyzyjna, i-te ognisko, , (4) 20 M. DERLATKA, J. PAUK xi+1 ognisko i+1. oraz operatora dopasowania - iloczynu w postaci Max (0 , x ⋅ y ), (5) gdzie: x - nowa reguła, y – reguła, na której działa operator dopasowania. Rys. 2. Sieć neuronowa jednokierunkowa z wartościami wag uzyskanymi po uczeniu Maksimum operatora dopasowania zostało określone w następujący sposób: a) Testowano wartość operatora dopasowania, w granicach <0;1>, w ognisku dodawanej reguły. JeŜeli została przekroczona wartość progowa (na podstawie analizy wartość progowa równa jest 0,75) dla danego atrybutu, wówczas zwiększano liczbę trafnie dobranych reguł (dodanie reguły do relacji wymagało 50%+1 atrybutów przekraczających zadaną wartość progową). W przeciwnym razie wykonywano punkt b). b) Metodą złotego podziału szukano maksimum wartości operatora dopasowania działającego na testowanych regułach. Metoda ta umoŜliwiła szybkie uzyskanie poŜądanej zbieŜności. Okazała się najbardziej adekwatna w procesie budowy systemu. Występujące reguły w tabeli 2 naleŜy rozumieć w ten sposób, Ŝe dla konkretnego typu chodu wartość współczynnika musi mieścić się w podanym obszarze. Liczba otrzymanych, za pomocą rozmytego modelu Demstera-Shafera, reguł jest zbyt wielka, aby pokusić się o jakąkolwiek próbę analizy. Zasadniczą cechą drzew decyzyjnych jest podział w sposób rekurencyjny przestrzeni cech, tak aby w kaŜdym kroku zmaksymalizować funkcję jakości podziału klas na dwie grupy. Funkcja ta obliczana jest oczywiście na podstawie danych pochodzących ze zbioru uczącego. W niniejszej pracy zastosowano algorytm CART [2]. Uzyskane w procesie uczenia drzewo pokazano na rys. 3 (JeŜeli warunek występujący w węźle drzewa jest spełniony, to poruszamy się lewą gałęzią, w innym przypadku prawą). PoniewaŜ otrzymane drzewo ma tylko 3 poziomy, nie zastosowano Ŝadnej z metod przycinania. ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE… 21 Tabela 2. Zestawy reguł umoŜliwiających klasyfikację osób do róŜnych przypadków Zakres wartości współczynnika Staw Przedział Współczyn identyfikacji nik faza podporowa biodrowy faza wymachu faza podporowa kolanowy faza wymachu faza podporowa skokowogoleniowy faza wymachu norma PoraŜenie mózgowe Rozszczep kręgosłupa a1 1,395 ÷ 2,534 1,497 ÷ 2,513 1,699 ÷ 2,470 a2 -2,319 ÷ -0,185 -1,345 ÷ -0,605 -2,177 ÷ -0,825 a3 0,017 ÷ 0,389 0,168 ÷ 0,588 0,074 ÷ 0,698 a1 1,071 ÷ 2,053 1,464 ÷ 2,440 1,509 ÷ 1,977 a2 -0,313 ÷ 1,495 -1,193 ÷ -0,505 -1,322 ÷ -0,987 a3 0,090 ÷ 0,270 0,178 ÷ 0,524 0,195 ÷ 0,376 a1 1,489 ÷ 2,578 1,275 ÷ 2,455 1,473 ÷ 2,129 a2 -2,299 ÷ -0,703 -1,218 ÷ -0,584 -1,671 ÷- 0,558 a3 0,241 ÷ 0,687 0,106 ÷ 0,444 0,114 ÷ 0,586 a1 1,387 ÷ 2,281 1,140 ÷ 2,436 1,566 ÷ 2,252 a2 -1,761 ÷ -0,613 -1,284 ÷ -0,434 -1,954 ÷ -0,784 a3 0,087 ÷ 0,493 0,200 ÷ 0,616 0,174 ÷ 0,671 a1 1,229 ÷ 2,289 1,663 ÷ 2,331 1,384 ÷ 2,312 a2 -1,808 ÷ -0,528 -2,429 ÷ 0,424 -2,043 ÷ -0,508 a3 0,182 ÷ 0,470 0,158 ÷ 0,584 0,101 ÷ 0,497 a1 0,639 ÷ 1,364 0,736 ÷ 1,945 0,839 ÷ 1,451 a2 -0,372 ÷ 0,052 -0,949 ÷ -0,173 -0,721 ÷ -0,149 a3 -0,054 ÷ 0,177 0,021 ÷ 0,067 -0,166 ÷ 0,255 Rys. Drzewo decyzyjne wraz z uzyskanymi po uczeniu regułami decyzyjnymi 22 M. DERLATKA, J. PAUK Wynikowe drzewo klasyfikacyjne zaskakuje małą liczba reguł potrzebnych do przeprowadzenia klasyfikacji. Okazuje się, Ŝe wystarczy wziąć pod uwagę tylko 4 z 18 parametrów. MoŜna zaobserwować, Ŝe wymagane są dane dotyczące wszystkich trzech głównych stawów kończyny dolnej oraz Ŝe faza wymachu w ocenie lokomocji jest równie istotna jak faza podporowa. Biorąc pod uwagę dodatkowo wyniki klasyfikacji (tabela 3), naleŜy stwierdzić, Ŝe w podanym zadaniu najlepiej sprawdzały się właśnie drzewa decyzyjne. Tabela 3. Procent poprawnych klasyfikacji w zaleŜności od zastosowanej metody (zbiór testujący) Sieci Drzewo decyzyjne Dempster-Shafer neuronowe 100 80 90 Norma 93 93 100 PoraŜenie mózgowe 90 100 100 Rozszczep kręgosłupa 3. PODSUMOWANIE Dla wszystkich klasyfikatorów osiągnięto bardzo duŜy stopień poprawnych klasyfikacji. Świadczy to o właściwym wyborze danych wejściowych, które faktycznie niosą istotną informację diagnostyczną. Nie wszystkie parametry wejściowe są potrzebne do właściwej klasyfikacji. Istnieje przypuszczenie, Ŝe po poszerzeniu zbioru danych o kolejne przypadki patologiczne będą wymagane takŜe inne parametry, pochodzące z identyfikacji modelu dynamiki chodu. LITERATURA 1. Bianaghi E., Madella P.: Inductive and deductive reasonic techniques for fuzzy Dempster Shafer classifiers. 7th IFSA World Congress, Prague, 1997, s. 197-302. 2. Hand D. et al.: Eksploracja danych. Warszawa : WNT, 2005. 3. Jaworek K., Derlatka M.: Ocena chodu człowieka za pomocą sztucznych sieci neuronowych. W: Biocybernetyka i InŜynieria Biomedyczna 2000. Tom 5: Biomechanika i InŜynieria Rehabilitacyjna. (red. R. Będziński i in.). Warszawa : Akad. Oficyna Wyd. EXIT, 2005, s. 371-388; 4. Pauk J.: Identyfikacja dynamiki lokomocji dwunoŜnej człowieka. Rozprawa doktorska. IBiB PAN. Warszawa 2005. 5. śurada J., Barski M., Jędruch W.: Sztuczne sieci neuronowe. Warszawa : Wyd. Nauk PWN, 1996. APPLYING CLASSIFICATORS FOR SUPPORT DECISION MAKING SYSTEM BASED ON DYNAMIC MODEL OF HUMAN GAIT Summary. The Dempster-Shafer’s fuzzy model, artificial neural networks and decision trees for classification data obtained from identification model of human gait by means of regression has been used. The results are very good. The decision ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE… tree should be analyzed with special attention because they made correct decision based on only four parameters. 23