andrzej banachowicz - Akademia Morska w Gdyni

Transkrypt

andrzej banachowicz - Akademia Morska w Gdyni
nr 22
PRACE WYDZIAŁU NAWIGACYJNEGO
AKADEMII MORSKIEJ W GDYNI
2008
TOMASZ NEUMANN
Akademia Morska w Gdyni
Katedra Nawigacji
WYKORZYSTANIE MECHANIZMÓW FUZJI DANYCH
W TRANSPORCIE MORSKIM
W artykule przedstawiono problematykę fuzji danych pochodzących z różnych urządzeń
nawigacyjnych wykorzystywanych w transporcie morskim. Obecnie nawigator statku lub operator
stacji VTS ma możliwość obserwowania okolic swojego położenia na kilku różnych urządzeniach
nawigacyjnych. W niniejszym artykule zaproponowano połączenie tych systemów wymiany danych
za pomocą techniki fuzji danych. Połączenie tych systemów w jeden może być pomocne przy
podejmowaniu decyzji na statku i przez operatora stacji przybrzeżnej.
WSTĘP
Wraz z postępem technologicznym coraz więcej urządzeń służących do
elektronicznej rejestracji pozycji własnej oraz najbliższego otoczenia zostało
zaimplementowanych na statkach. Celem prowadzonych badań jest odpowiedź
na pytanie, czy w transporcie morskim mechanizmy fuzji danych można
wykorzystać przy scalaniu danych pochodzących z różnych źródeł?
Wśród wielu zagadnień, jakimi zajmuje się współczesna informatyka,
można wyróżnić dział określany Inteligencją Obliczeniową (Computational
Inteligence – CI). Dział ten, którego rozkwit obserwuje się w ostatnich
dziesięcioleciach, obejmuje bardzo wiele dziedzin. Obserwacje biologicznego
funkcjonowania układu nerwowego zaowocowały powstaniem sieci neuronowych. Z kolei badania Darwina nad ewolucją zapoczątkowały powstanie
algorytmów ewolucyjnych. Badania nad psychologią człowieka przyczyniły się
do powstania teorii logicznych. To stąd w informatyce pojawiały się takie
pojęcia, jak niepewność czy też nieprecyzyjne określenie informacji (logika
rozmyta).
Nowo tworzone systemy informatyczne swoim działaniem coraz bardziej
przypominają zachowanie człowieka. Przygotowane są one do pobierania
i gromadzenia informacji o otaczającym je świecie oraz do wyciągania na tej
71
podstawie z zebranej wiedzy odpowiednich wniosków. Jedną z metod takiej
eksploracji wiedzy jest fuzja danych.
Obecnie na mostek statku napływają dane na temat otoczenia z różnych
systemów śledzenia. Przykładem może być rejestracja ech w radarze ARPA
oraz dane z systemu automatycznej identyfikacji AIS. Niewątpliwie znaczącym
krokiem w kierunku podwyższenia bezpieczeństwa nawigacji było wprowadzenie na pokład statku odbiorników AIS jako dodatkowego dla radaru źródła
danych nawigacyjnych. Niekorzystnym faktem stało się zwielokrotnienie
urządzeń absorbujących pracę oficera wachtowego. Zamysłem autora jest
opracowanie koncepcji sposobu uporządkowania danych napływających
z różnych urządzeń nawigacyjnych oraz ich odpowiednie przetworzenie.
Przedstawione zagadnienie jest typowym problemem wielosensorowej fuzji
danych.
1. FUZJA DANYCH
Fuzja danych swoim zasięgiem obejmuje wszelkie metody scalania oraz
przetwarzania danych o obiekcie lub zjawisku, pochodzących z wielu źródeł
wiedzy. Zasadniczym celem stosowania fuzji danych jest zmniejszenie
niepewności końcowego wyniku pomiaru, zwiększenie efektywności klasyfikacji oraz poprawienie jakości identyfikacji. Zatem fuzja danych przychodzi
z pomocą tam, gdzie duża liczba danych pochodząca ze zróżnicowanych źródeł
może być połączona w jedną, spójną i dokładną całość.
Wśród wielu różnych mechanizmów występujących w procesie fuzji
danych można wyróżnić kilka podstawowych. Schemat blokowy wskazujący
poszczególne etapy przedstawiony został na rysunku 1.
Przed każdym z przedstawionych etapów fuzji danych można postawić
określone cele i zadania (tab. 1). W każdym z kolejnych etapów wykorzystuje
się wyniki etapów poprzednich. Od zadań elementarnych, takich jak wymiana
danych (etap 1), poprzez klasyfikację obiektów (etap 2), ocenę aktualnej
i prognozowanej sytuacji (etap 3), oczekiwanym wynikiem zastosowania
mechanizmów fuzji danych w transporcie morskim może być odpowiedź na
pytanie, która z możliwych tras przejścia będzie najlepsza w aspekcie
bezpieczeństwa, czasu przejścia itp. (etap 4).
Faktem jest, że nie ma teorii uniwersalnej, gwarantującej najlepsze wyniki
modelowania dla wszystkich rodzajów danych. Zatem występuje wiele teorii,
które lepiej lub gorzej aplikują sie do danego rodzaju przetwarzanej wiedzy.
72
ETAP 0
OBRÓBKA
WSTĘPNA
SYGNAŁU
ANALIZA
WSTĘPNA
Ź
R
Ó
D
Ł
O
ETAP 1
KLASYFIKACJA
OBIEKTU
ETAP 2
OCENA
SYTUACJI
ETAP 3
DECYZJA
WYNIKI
SYSTEM BAZ DANYCH
ETAP 4
PRZETWARZANIE
ETAP 5
NADZÓR
I
OBSERWACJA
BAZA
DANYCH
BAZA DANYCH
PROCESU FUZJI
Rys 1. Schemat blokowy procesu fuzji danych [1]
Tabela 1
Zasadnicze etapy fuzji, ich cele oraz wykorzystywane techniki
Etapy fuzji
danych
Metody i zadania
Etap pierwszy
Wymiana danych, estymacja pozycji
Filtry Kalmana
Klasyfikacja obiektu
Metody bayesowskie,
Matematyczna teoria ewidencji
Etap drugi
Etap trzeci
Etap czwarty
Techniki
Ocena sytuacji
Logika rozmyta, modelowanie
Sztuczna inteligencja, optymalizacja,
najlepsza trasa przejścia, sterowanie ruchem
Wielokryterialne podejmowanie
decyzji
W dalszej części artykułu skupiono się głównie na jednej z metod
przetwarzania informacji niepełnej, a więc na matematycznej teorii ewidencji
określanej również teorią Dempstera−Shafera [3], która w przedstawionym
schemacie, w procesie identyfikacji obiektu umiejscowiona jest na etapie
drugim.
2. TEORIA DEMPSTERA−SHAFERA
Rachunek prawdopodobieństwa bazuje na aksjomatycznej definicji miary
prawdopodobieństwa zdefiniowanej na przestrzeni rozważanych zdarzeń.
P(O) = 0
(1)
P(A) ∈ [0,1] VA ∈ 2Θ
(2)
P(A  B) = P(A) + P(B) − P(A  B)
(3)
73
Klasyczna teoria prawdopodobieństwa nie pozwala na rozróżnienie
niepewności (wyrażanej prawdopodobieństwem) i wiedzy niepełnej (brak
wiedzy na dany temat). Teoria Dempstera−Shafera (D-S) pozwala uzupełnić tę
lukę. Znana jest ona również pod pojęciem matematycznej teorii ewidencji
i może być traktowana jako rozszerzenie teorii rachunku prawdopodobieństwa.
Podstawowym pojęciem teorii D-S jest zbiór wszystkich hipotez,
nazywany ramą rozróżniającą i oznaczany przez Θ. Każdy podzbiór tego zbioru
ma przypisane prawdopodobieństwo zajścia hipotez tego podzbioru. Ten
rozkład prawdopodobieństwa , wyrażany wzorem
m: 2Θ → [0,1]
(4)
jest takim przekształceniem, że dla każdego zbioru X ∈ 2Θ mamy
m(X) ≥ 0,
(5)
m(O) = 0,
(6)
ΣX∈2Θ m(X) = 1.
(7)
Funkcję m nazywamy podstawowym przyporządkowaniem prawdopodobieństwa dla Θ.
Teoria D-S wprowadza funkcję, która łączy wiadomości zawarte w dwóch
podstawowych przyporządkowaniach prawdopodobieństwa. Proces ten można
interpretować jako aktualizację wiedzy. W rezultacie otrzymuje się nowe
podzbiory możliwych hipotez z nowymi wartościami funkcji gęstości prawdopodobieństwa. Proces ten może być kontynuowany tak długo, jak długo
napływają nowe przesłanki. Funkcja ta nazwana jest regułą kombinacji
Dempstera.
2.1. Reguła kombinacji Dempstera
Jeżeli przyjmie się, że Θ jest ramą rozróżniającą, a m1 i m2 funkcjami
przyporządkowania prawdopodobieństwa na Θ, wtedy m1 ⊕ m2 będzie wyrażone funkcją:
(8)
m1 ⊕ m2 : 2Θ → [0,1]
przy czym
(9)
m1 ⊕ m2 (O) = 0,
m1 ⊕ m2 (X) =
∑
1− ∑
Y  Z=φ
m1 (Y) ⋅ m 2 (Y)
m1 (Y) ⋅ m 2 (Y)
Y  Z=φ
.
(10)
Jest to zasadniczy element teorii Dempstera−Shafera i można go
interpretować jako aktualizację wiedzy. W rezultacie uzyskuje się nowe
74
podzbiory możliwych hipotez z nowymi wartościami funkcji gęstości
prawdopodobieństwa. Proces ten może być kontynuowany tak długo, jak długo
napływają nowe przesłanki.
Dla zbioru hipotez należy określić dwie funkcje: funkcję przekonania
(belief function) i funkcję domniemania (plausibility function).
2.2. Funkcja przekonania
Jeżeli Θ będzie ramą rozróżniającą, m podstawowym przyporządkowaniem prawdopodobieństwa dla Θ, wtedy funkcją przekonania związaną
z m będzie funkcja
Bel : 2Θ → [0,1]
(11)
Bel(X) = ΣY⊆x m(Y)
(12)
przy czym
dla każdego X ⊆ Θ.
Funkcja przekonania pozwala oszacować wiarygodność poszlak na
rzecz X.
2.2. Funkcja domniemania (wiarygodności)
Jeżeli przyjmie się, że Θ jest ramą rozróżniającą, m podstawowym
przyporządkowaniem prawdopodobieństwa dla Θ, wtedy funkcją wiarygodności odpowiadającą m będzie funkcja
przy czym
Pl : 2Θ → [0,1]
(13)
Pl(X) = ∑ Y  X ≠ φ m(Y)
(14)
dla każdego X ⊆ Θ.
Funkcja domniemania określa stopień wiarygodności poszlak przemawiających przeciw hipotezie X.
Więcej informacji na temat teorii D-S można znaleźć w [3].
3. PROBLEMATYKA MORSKA
Teoria Dempstera−Shafera może znaleźć zastosowanie w problematyce
morskiej. Trwają badania nad systemami śledzącymi w oparciu o poruszaną
tematykę [3]. Przyjęto, że pewien rejon morski jest obserwowany przez trzy
75
radarowe stacje brzegowe (m1, m2, m3). Z informacji jakie posiadają te stacje
wynika, że w danym rejonie można spodziewać się pojawienia jednego z trzech
obiektów (A, B, C). W momencie pojawienia się obiektu na radarach
wszystkich trzech stacji brzegowych, pierwsza z nich, po analizie wielkości
echa, sklasyfikowała obiekt z następującym prawdopodobieństwem:
m1(A) = 0,5
m1(B) = 0,3
Wyniki drugiej stacji są następujące:
m2(A) = 0,1
m2(B) = 0,4
m2(C) = 0,1
a trzeciej:
m3(C) = 0,8
W analizowanym przykładzie stacje określiły prawdopodobieństwo
poprawnej identyfikacji poszczególnych obiektów. Zatem w tym przypadku
rama rozróżniająca wynosi Θ = {A, B, C}. W dalszej części przedstawiono
przykład rozszerzający tę metodę również dla określonych prawdopodobieństw
dla zbioru statków.
Pierwszym etapem obliczeń jest połączenie danych z dwóch pierwszych
stacji brzegowych. Wartości przedstawione w tabeli 2 zawierają iloczyn
wartości prawdopodobieństwa wszystkich możliwych zdarzeń. W tabeli tej
zaznaczono te elementy, które powstały z połączenia przesłanek niezawierających części wspólnych (pola zaciemnione).
Tabela 2
Wyniki częściowe – złączenie danych ze stacji m1 i m2
Ekspert2
Ekspert 1
m2(A)
m2(B)
m2(C)
m2(S)
0,1
0,4
0,1
0,4
m1(A)
0,5
0,05
0,2
0,05
0,2
m1(B)
0,3
0,03
0,12
0,03
0,12
m1(Θ)
0,2
0,02
0,08
0,02
0,08
Zgodnie z mianownikiem wzoru (10), obliczono współczynnik normalizujący:
1 − (0,2 + 0,05 + 0,03 + 0,03) = 1 − 0,31 = 0,69
(15)
76
W wyniku złączenia otrzymano ostatecznie nowe wartości dla
poszczególnych przesłanek (tab. 3). Kolumna trzecia zawiera nowe wartości
(uwzględniające wiedzę pochodzącą ze stacji pierwszej i drugiej) prawdopodobieństwa poprawnej klasyfikacji obiektu, otrzymane za pomocą reguły
kombinacji Dempstera (10).
Tabela 3
Wyniki częściowe – złączenie danych ze stacji m1 i m2 z normalizacją danych
Ekspert12
Obliczenia
Wynik kombinacji Dempstera
m12(A)
0,05+0,2+0,02=0,27
0,39
m12(B)
0,12+0,12+0,8=0,32
0,46
m12(C)
0,02
0,03
m12(Θ)
0,08
0,12
Σ=1
W analogiczny sposób dokonano obliczeń uwzględniających informacje z
trzeciej stacji. Wyniki pośrednie obliczeń zawarte zostały w tabeli 4, zaś tabela
5 zawiera wyniki końcowe. Obliczono wartości funkcji przekonania (9) oraz
domniemania (11) dla możliwych zdarzeń.
Tabela 4
Wyniki częściowe – złączenie danych ze stacji m12 i m3
Ekspert3
Ekspert12
m3(C)
m3(S)
0,8
0,2
m12(A)
0,39
0,312
0,078
m12(B)
0,46
0,368
0,092
m12(C)
0,03
0,024
0,006
m12(Θ)
0,12
0,096
0,024
Zgodnie z mianownikiem wzoru (10), obliczono współczynnik normalizujący:
1 − (0,312 + 0,368) = 1 − 0,68 = 0,32
(16)
Tabela 5
Wyniki końcowe. Wartości przekonania oraz domniemania
Ekspert123
Obliczenia
Wynik kombinacji Dempstera
Bel
Pl
m123(A)
0,078
0,244
0,244
0,318
m123(B)
0,092
0,288
0,288
0,362
m123(C)
0,024+0,006+0,096=0,126
0,394
0,394
0,468
m123(Θ)
0,024
0,075
77
Na podstawie obliczonych wartości funkcji przekonania i domniemania
można określić na ile pewna jest analizowana sytuacja. Funkcja Bel (belief)
uwzględnia powody wiary w dane zdarzenie, natomiast funkcja Pl (plausibility)
wskazuje w jakim stopniu można wierzyć, że dane zdarzenie zajdzie, gdyby na
jego korzyść przemawiały wszystkie nieznane w danej chwili fakty.
Dla zdarzeń jak w opisanym przykładzie, w którym wszystkie zdarzenia
opisane są jako zdarzenia elementarne, wartości Bel i Pl określają dolną i górną
granicę stopnia przekonania prawdziwości danej hipotezy. W przypadku coraz
większej liczby przesłanek na dany temat, różnica pomiędzy Pl i Bel będzie się
zmniejszać.
4. APLIKACJA KOMPUTEROWA
W ramach przeprowadzonych badań opracowano zespół algorytmów
realizujących regułę kombinacji Dempstera. Widok ekranu pokazany jest na
rysunku 2. Aplikacja umożliwia określenie dowolnej n-elementowej ramy
różniącej oraz określenie m różnych ewidencji. Dla wybranej ewidencji oraz
wybranego elementu ramy różniącej należy przypisać spodziewaną wartość
prawdopodobieństwa. Na rysunku 2 przedstawiono rozwiązanie analizowanego
przykładu.
Prezentowana aplikacja komputerowa przedstawia jedynie podstawowe
funkcje teorii D-S. Będą one wykorzystywane w dalszych pracach autora nad
wykorzystaniem mechanizmów fuzji danych w szerokim zastosowaniu w
transporcie morskim.
Rys. 2. Widok ekranu aplikacji komputerowej realizującej regułę kombinacji Dempstera
78
5. PODSUMOWANIE
Jednym z dobrze zbadanych teoretycznie modeli zajmujących się
eksploracją oraz scalaniem wiedzy z różnych źródeł jest teoria Dempstera–
–Schafera, zwana również matematyczną teorią ewidencji lub teorią przekonania. Starano się pokazać, że teoria D-S mo że być również stosowana przy
wiedzy niepełnej. Teoria D-S jest w stanie objąć statystykę zbiorów losowych i
może służyć jako narzędzie do prezentacji niekompletnej wiedzy statystycznej.
W przedstawionym artykule pokazano, że teoria D-S może mieć zastosowanie
także w procesie identyfikacji obiektów w warunkach morskich.
LITERATURA
1. Hall D., McMullen S., Mathematical techniques in multisensor data fusion, Artech
House, 2004.
2. Hoogendoorn R.A., Neven W.H.L., ARTAS: Multisensor tracking in an ATC environment,
Sensor and Propagation Panel Symposium, Lisbon 1997.
3. Kłopotek M.A., Metody identyfikacji i interpretacje struktur rozkładów przekonań
w teorii Dempstera-Shafera, Rozprawa habilitacyjna, Instytut Podstaw Informatyki
Polskiej Akademii Nauk, Warszawa 1998.
4. Neumann T., Multisensor Data Fusion in the Decision Process on the Bridge of the
Vessel, 7th International Navigational Symposium TransNav, Gdynia 2007.
5. Neumann T., Fuzja danych w procesie identyfikacji obiektów morskich, XI Konferencja
Transcomp 2007, Zakopane 2007.
6. Sentz K., Ferson S., Combination of Evidence in Dempster-Shafer Theory, Sandia
National Laboratories SAND, 2002.
MULTISENSOR DATA FUSION IN THE DECISION PROCESS IN SEA
TRANSPORTATION
(Summary)
Nowadays navigator or VTS operator can observe surroundings of the vessel on screens of some
different systems of exchanging data. Proposal of the author is connecting data obtained from
mentioned systems by means of data fusion technique. Joining few systems in one will be helpful at
making decision on the vessel or VTS station.
79