zastosowanie wybranych metod klasyfikacji w systemie

Transkrypt

zastosowanie wybranych metod klasyfikacji w systemie
MODELOWANIE INśYNIERSKIE
34, s. 17-22, Gliwice 2007
ISSN 1896-771X
ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI
W SYSTEMIE WSPOMAGANIA DECYZJI OPARTYM
NA MODELU DYNAMIKI CHODU
MARCIN DERLATKA, JOLANTA PAUK1
Katedra Automatyki i Robotyki, Politechnika Białostocka
e-mail:[email protected], [email protected]
Streszczenie. W pracy zastosowano: rozmyty model Dempstera-Shafera,
sztuczne sieci neuronowe i drzewa decyzyjne do przeprowadzenia klasyfikacji
danych otrzymanych w wyniku identyfikacji modelu dynamiki chodu człowieka
metodą regresji. Uzyskane wyniki są bardzo dobre. Na szczególną uwagę
zasługują drzewa decyzyjne, które podejmowały decyzje na podstawie czterech
parametrów.
1. WPROWADZENIE
Chód człowieka jest zjawiskiem bardzo złoŜonym. Pełny ilościowy opis tego zjawiska
obejmuje wielkości:
• kinematyczne,
• dynamiczne,
• antropomorficzne,
• elektromiograficzne,
• inne.
Pomiar tych danych jest niezbędny do przeprowadzenia oceny analizy chodu człowieka.
Analiza chodu jest bardzo waŜna m. in. w:
• określeniu rodzaju i stopnia patologii,
• wyborze właściwej metody usprawniania aparatu ruchu pacjenta (operacja,
rehabilitacja itd.).
Pewne cechy zjawiska (takie jak: korelacje pomiędzy niektórymi wielkościami,
nieliniowość) sprawiają, Ŝe dokłada analiza chodu człowieka jest zadaniem czasochłonnym,
złoŜonym i wymagającym zaangaŜowania eksperta posiadającego wiedzę zarówno
inŜynierską, jak i medyczną. Ten ostatni wymóg moŜna wyeliminować, stosując odpowiedni
system do wspomagania podejmowania decyzji w biomechanice chodu człowieka.
Głównymi cechami systemu do wspomagania decyzji powinny być:
• wysoka jakość - dokładność w podejmowaniu decyzji porównywana do decyzji
podejmowanych przez „eksperta”;
1
Laureat konkursu "Stypendia krajowe dla młodych uczonych" z Fundacji na Rzecz Nauki Polskiej w 2007 r.
18
M. DERLATKA, J. PAUK
• łatwa moŜliwość rozbudowy sytemu.
Jakość działania omawianego systemu zaleŜy głównie od dwóch czynników: wyboru
właściwych parametrów opisujących chód człowieka i przyjętej metody przetwarzania
parametrów diagnostycznych w rodzaj patologii lub w wybraną metodę usprawniania chodu
(klasyfikacja).
Celem niniejszej pracy jest analiza jakości podejmowanych decyzji przez system
wspomagania decyzji oparty na współczynnikach modelu dynamiki chodu człowieka
w zaleŜności od przyjętej metody klasyfikacji.
2. MATERIAŁ I METODA
Parametry diagnostyczne zostały uzyskane w wyniku zastosowania identyfikacji modelu
dynamiki chodu człowieka metodą regresji [4]. Do identyfikacji modelu wykorzystano
przebiegi chwilowe mocy rozwijane przez zespoły mięśniowe wokół głównych stawów
kończyny dolnej podczas chodu. Współczynniki modelu chodu człowieka określono dla
dwóch głównych faz cyklu chodu: fazy podporowej i wymachu. Moce zostały
znormalizowane do cięŜaru ciała człowieka. Wykorzystanie przebiegów chwilowy mocy jest
podyktowane tym, Ŝe ta wielkość jest kombinacją danych kinematycznych i dynamicznych.
Y n = U n ⋅ a,
(1)
dla n = 1, 2, …, N
U n = [Yn−1
a = [a1
Yn −2
... Yn −k ],
(2)
a2 ... ak ]T
(3)
gdzie:
N - liczba pomiarów;
Yn - moce rozwijane przez zespoły mięśniowe obsługujące staw biodrowy, kolanowy
i skokowo-goleniowy w n-tej chwili czasowej;
a - macierz kolumnowa poszukiwanych współczynników;
Un – macierz wierszowa wielkości wejściowych (moce rozwijane przez poszczególne
zespoły mięśniowe obsługujące staw biodrowy, kolanowy i skokowo – goleniowy w
k-poprzednich chwilach czasowych).
ε
a=?
Λ
Y
a=?
Y
a)
b)
Rys. 1. Identyfikacja modelu: a) proces rzeczywisty; b) model
Badania laboratoryjne zostały przeprowadzone przy uŜyciu systemów optoelektronicznych
Ellite 3D i Morion Analysis System odpowiednio w Centrum BioinŜynierii w Mediolanie we
Włoszech i Glenrose Rehabilitation Hospital w Edmonton w Kanadzie. Dane przedstawiają
chód normalny i wybranych patologii w płaszczyźnie strzałkowej po względnie płaskiej
ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE…
19
i utwardzonej powierzchni, w warunkach laboratoryjnych. Wśród wybranych patologii
narządu ruchu były:
• poraŜenie mózgowe (CP) – kurczowe poraŜenie obustronne;
• rozszczep kręgosłupa (SB) – przepuklina oponowo-rdzeniowa.
W sumie w badaniach wzięło udział około 40 osób. W obu ośrodkach w badaniach przyjęto
protokół S.A.F.L.O.
Tabela 1. Materiał badawczy
Grupa
Liczba osób
Norma
10
PoraŜenie mózgowe
15
Rozszczep kręgosłupa
15
W wyniku identyfikacji modelu chodu człowieka metodą regresji otrzymano 18 parametrów
diagnostycznych. Parametry te były wielkościami wejściowymi do zbudowanych
klasyfikatorów. Klasyfikację przeprowadzono przy uŜyciu: rozmytego klasyfikatora
Dempstera-Shafera, sztucznych sieci neuronowych, drzew klasyfikacji.
Dane zostały podzielone na tzw. ciąg uczący i ciąg testujący. Jakość działania
oceniano przyjmując decyzje podjęte przez personel Centrum BioinŜynierii w Mediolanie i
Glenrose Rehabilitation Hospital jako wzorcowe.
3. WYNIKI
Do klasyfikacji za pomocą sztucznych sieci neuronowych wybrano sieć jednokierunkową
o architekturze 21-6-3. PoniewaŜ wszystkie wartości wejściowe były liczbami niewielkimi
tego samego rzędu, nie wykonywano wstępnego przetwarzania danych. Klasy zakodowano na
podstawie kodu „1 z n” w następujący sposób:
• 1 0 0 - norma;
• 0 1 0 - rozszczep kręgosłupa;
• 0 0 1 - poraŜenie mózgowe.
Uczenie przeprowadzono za pomocą algorytmu RPROP [3, 5]. Uzyskaną sieć wynikową
przedstawiono na rys. 2. W trakcie treningu sieć wykazywała pewną tendencję do przeuczania
się, co przy tak duŜym rozmiarze wektora wag w porówaniu do liczności zbioru uczącego jest
dość oczywiste. NaleŜy podkreślić, iŜ zastosowanie jakiejkolwiek metody redukcji przestrzeni
wejściowej moŜe przynieść tylko poprawę zdolności uogólniania rozwaŜanej sieci
neuronowej.
Zastosowanie rozmytego modelu Dempstera-Shafera do klasyfikacji jest znaną metodą
ułatwiającą wnioskowania diagnostycznego w dziedzinie inŜynierii biomedycznej. W
niniejszej pracy do wygenerowania reguł rozmytych uŜyto kwadratowej funkcji
przynaleŜności w następującej postaci [1]
2
(
X − xi )
y =1−
(xi − xi+1)
gdzie:
y
X
xi
-
funkcja przeliczająca,
zmienna decyzyjna,
i-te ognisko,
,
(4)
20
M. DERLATKA, J. PAUK
xi+1
ognisko i+1.
oraz operatora dopasowania - iloczynu w postaci
Max (0 , x ⋅ y ),
(5)
gdzie:
x - nowa reguła,
y – reguła, na której działa operator dopasowania.
Rys. 2. Sieć neuronowa jednokierunkowa z wartościami wag uzyskanymi po uczeniu
Maksimum operatora dopasowania zostało określone w następujący sposób:
a) Testowano wartość operatora dopasowania, w granicach <0;1>, w ognisku dodawanej
reguły. JeŜeli została przekroczona wartość progowa (na podstawie analizy wartość
progowa równa jest 0,75) dla danego atrybutu, wówczas zwiększano liczbę trafnie
dobranych reguł (dodanie reguły do relacji wymagało 50%+1 atrybutów przekraczających
zadaną wartość progową). W przeciwnym razie wykonywano punkt b).
b) Metodą złotego podziału szukano maksimum wartości operatora dopasowania działającego
na testowanych regułach. Metoda ta umoŜliwiła szybkie uzyskanie poŜądanej zbieŜności.
Okazała się najbardziej adekwatna w procesie budowy systemu.
Występujące reguły w tabeli 2 naleŜy rozumieć w ten sposób, Ŝe dla konkretnego typu chodu
wartość współczynnika musi mieścić się w podanym obszarze. Liczba otrzymanych, za
pomocą rozmytego modelu Demstera-Shafera, reguł jest zbyt wielka, aby pokusić się
o jakąkolwiek próbę analizy.
Zasadniczą cechą drzew decyzyjnych jest podział w sposób rekurencyjny przestrzeni cech,
tak aby w kaŜdym kroku zmaksymalizować funkcję jakości podziału klas na dwie grupy.
Funkcja ta obliczana jest oczywiście na podstawie danych pochodzących ze zbioru uczącego.
W niniejszej pracy zastosowano algorytm CART [2]. Uzyskane w procesie uczenia drzewo
pokazano na rys. 3 (JeŜeli warunek występujący w węźle drzewa jest spełniony, to poruszamy
się lewą gałęzią, w innym przypadku prawą). PoniewaŜ otrzymane drzewo ma tylko 3
poziomy, nie zastosowano Ŝadnej z metod przycinania.
ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE…
21
Tabela 2. Zestawy reguł umoŜliwiających klasyfikację osób do róŜnych przypadków
Zakres wartości współczynnika
Staw
Przedział
Współczyn
identyfikacji
nik
faza
podporowa
biodrowy
faza wymachu
faza
podporowa
kolanowy
faza wymachu
faza
podporowa
skokowogoleniowy
faza wymachu
norma
PoraŜenie
mózgowe
Rozszczep
kręgosłupa
a1
1,395 ÷ 2,534
1,497 ÷ 2,513
1,699 ÷ 2,470
a2
-2,319 ÷ -0,185
-1,345 ÷ -0,605
-2,177 ÷ -0,825
a3
0,017 ÷ 0,389
0,168 ÷ 0,588
0,074 ÷ 0,698
a1
1,071 ÷ 2,053
1,464 ÷ 2,440
1,509 ÷ 1,977
a2
-0,313 ÷ 1,495
-1,193 ÷ -0,505
-1,322 ÷ -0,987
a3
0,090 ÷ 0,270
0,178 ÷ 0,524
0,195 ÷ 0,376
a1
1,489 ÷ 2,578
1,275 ÷ 2,455
1,473 ÷ 2,129
a2
-2,299 ÷ -0,703
-1,218 ÷ -0,584
-1,671 ÷- 0,558
a3
0,241 ÷ 0,687
0,106 ÷ 0,444
0,114 ÷ 0,586
a1
1,387 ÷ 2,281
1,140 ÷ 2,436
1,566 ÷ 2,252
a2
-1,761 ÷ -0,613
-1,284 ÷ -0,434
-1,954 ÷ -0,784
a3
0,087 ÷ 0,493
0,200 ÷ 0,616
0,174 ÷ 0,671
a1
1,229 ÷ 2,289
1,663 ÷ 2,331
1,384 ÷ 2,312
a2
-1,808 ÷ -0,528
-2,429 ÷ 0,424
-2,043 ÷ -0,508
a3
0,182 ÷ 0,470
0,158 ÷ 0,584
0,101 ÷ 0,497
a1
0,639 ÷ 1,364
0,736 ÷ 1,945
0,839 ÷ 1,451
a2
-0,372 ÷ 0,052
-0,949 ÷ -0,173
-0,721 ÷ -0,149
a3
-0,054 ÷ 0,177
0,021 ÷ 0,067
-0,166 ÷ 0,255
Rys. Drzewo decyzyjne wraz z uzyskanymi po uczeniu regułami decyzyjnymi
22
M. DERLATKA, J. PAUK
Wynikowe drzewo klasyfikacyjne zaskakuje małą liczba reguł potrzebnych do
przeprowadzenia klasyfikacji. Okazuje się, Ŝe wystarczy wziąć pod uwagę tylko 4 z 18
parametrów. MoŜna zaobserwować, Ŝe wymagane są dane dotyczące wszystkich trzech
głównych stawów kończyny dolnej oraz Ŝe faza wymachu w ocenie lokomocji jest równie
istotna jak faza podporowa. Biorąc pod uwagę dodatkowo wyniki klasyfikacji (tabela 3),
naleŜy stwierdzić, Ŝe w podanym zadaniu najlepiej sprawdzały się właśnie drzewa decyzyjne.
Tabela 3. Procent poprawnych klasyfikacji w zaleŜności od zastosowanej metody
(zbiór testujący)
Sieci
Drzewo decyzyjne
Dempster-Shafer
neuronowe
100
80
90
Norma
93
93
100
PoraŜenie mózgowe
90
100
100
Rozszczep kręgosłupa
3. PODSUMOWANIE
Dla wszystkich klasyfikatorów osiągnięto bardzo duŜy stopień poprawnych klasyfikacji.
Świadczy to o właściwym wyborze danych wejściowych, które faktycznie niosą istotną
informację diagnostyczną. Nie wszystkie parametry wejściowe są potrzebne do właściwej
klasyfikacji. Istnieje przypuszczenie, Ŝe po poszerzeniu zbioru danych o kolejne przypadki
patologiczne będą wymagane takŜe inne parametry, pochodzące z identyfikacji modelu
dynamiki chodu.
LITERATURA
1. Bianaghi E., Madella P.: Inductive and deductive reasonic techniques for fuzzy Dempster
Shafer classifiers. 7th IFSA World Congress, Prague, 1997, s. 197-302.
2. Hand D. et al.: Eksploracja danych. Warszawa : WNT, 2005.
3. Jaworek K., Derlatka M.: Ocena chodu człowieka za pomocą sztucznych sieci
neuronowych. W: Biocybernetyka i InŜynieria Biomedyczna 2000. Tom 5: Biomechanika
i InŜynieria Rehabilitacyjna. (red. R. Będziński i in.). Warszawa : Akad. Oficyna Wyd.
EXIT, 2005, s. 371-388;
4. Pauk J.: Identyfikacja dynamiki lokomocji dwunoŜnej człowieka. Rozprawa doktorska.
IBiB PAN. Warszawa 2005.
5. śurada J., Barski M., Jędruch W.: Sztuczne sieci neuronowe. Warszawa : Wyd. Nauk
PWN, 1996.
APPLYING CLASSIFICATORS FOR SUPPORT DECISION MAKING
SYSTEM BASED ON DYNAMIC MODEL OF HUMAN GAIT
Summary. The Dempster-Shafer’s fuzzy model, artificial neural networks and
decision trees for classification data obtained from identification model of human
gait by means of regression has been used. The results are very good. The decision
ZASTOSOWANIE WYBRANYCH METOD KLASYFIKACJI W SYSTEMIE…
tree should be analyzed with special attention because they made correct decision
based on only four parameters.
23

Podobne dokumenty