Pasywne systemy lokacyjne
Transkrypt
Pasywne systemy lokacyjne
Politechnika Warszawska Wydział Elektroniki i Technik Informacyjnych Instytut Systemów Elektronicznych Praca dyplomowa inżynierska Pasywny system akustycznej lokalizacji obiektów. wykonanie: Maciej Smolarczyk opiekun pracy: dr inż. Krzysztof Kulpa Warszawa Luty 2000 r. 1 Dziękuję panu doktorowi Krzysztofowi Kulpie – za to, że pomógł nadać mojej pracy ostateczny kształt i charakter. Pracę dedykuję moim rodzicom. 2 SPIS TREŚCI: 1. WSTĘP. ....................................................................................................7 2. ZAŁOŻENIA REALIZACJI ORAZ WSTĘPNY OPIS UKŁADU. ..9 3. METODA AMPLITUDOWA. .............................................................11 3.1. OPIS METODY........................................................................................11 3.2. OGRANICZENIA STOSOWALNOŚCI METODY. ..........................................13 4. METODA OPÓŹNIEŃ CZASOWYCH. ............................................17 4.1. OPIS METODY........................................................................................17 4.2. ANALIZA MATEMATYCZNA. ..................................................................19 4.3. LOKALIZACJA PASMOWA. .....................................................................21 4.4. LOKALIZACJA HIPERBOLICZNA. ............................................................23 5. MODELE SYGNAŁÓW, PROBLEMY Z DETEKCJĄ, ECHO I JEGO USUWANIE. ....................................................................................30 5.1. MODEL SYGNAŁU..................................................................................30 5.2. WIELODROGOWOŚĆ I ECHA...................................................................38 5.3. PROBLEMY LOKALIZACJI.......................................................................43 5.4. CZĘSTOTLIWOŚĆ PRÓBKOWANIA. .........................................................43 5.5. OBSZAR OBSERWACJI............................................................................45 5.6. ROZMYCIE PRĄŻKÓW KORELACYJNYCH................................................47 5.7. DETEKCJA WIELU OBIEKTÓW. ...............................................................48 6. OPIS DOŚWIADCZEŃ Z DWOMA MIKROFONAMI, RZECZYWISTA REALIZACJA. .............................................................51 6.1. ZAŁOŻENIA POMIAROWE, SCHEMAT UKŁADU. ......................................51 6.2. WARUNKI POMIAROWE. ........................................................................52 6.3. POMIARY – REALIZACJA, PROBLEMY . ..................................................53 7. PODSUMOWANIE...............................................................................59 BIBLIOGRAFIA:........................................................................................60 3 SPIS RYSUNKÓW: Rysunek 1: Przykładowy system lokalizacyjny złożony z trzech stacji bazowych. .................................................................................. 8 Rysunek 2: Graficzna interpretacja MA z wykorzystaniem stycznej. ......... 11 Rysunek 3: Wykres błędów lokalizacji w zależności od próby dla losowo wybranego położenia obiektu przy wykorzystaniu MA. .......... 13 Rysunek 4: Wykres błędów lokalizacji w zależności od próby dla losowo wybranego położenia obiektu przy wykorzystaniu MA z uwzględnieniem algorytmu Neskrema. ....................................... 13 Rysunek 5: Charakterystyka mikrofonu wszechkierunkowego. .................. Rysunek 6: Korelacja wzajemna dla zerowej różnicy opóźnień (punkt odniesienia). .............................................................................. 17 Rysunek 7: Korelacja wzajemna dla różnica czasów dojścia do dwu stacji 17 bazowych. .................................................................................. Rysunek 8: Układ detekcji opóźnienia D korzystający z funkcji korelacji wzajemnej. ................................................................................. 19 Rysunek poglądowy przedstawiający metodę pasmową. ......... 20 Rysunek 9: Rysunek 10: Hiperbola wszystkich możliwych lokalizacji obiektu dla dwu stacji bazowych. ........................................................................ 14 23 Rysunek 11: Punkt położenia wyznaczony przez przecięcie się hiperbol (trzy stacje bazowe). .................................................................. 23 Rysunek 12: Błędy estymacji położenia obiektu (MP). ................................. 27 Rysunek 13: Błędy estymacji położenia w zależności od odległości (MP). .. 28 Rysunek 14: Błędy estymacji położenia obiektu (MH). ................................ 28 Rysunek 15: Autokorelacja szumu białego. ................................................... 31 Rysunek 16: Autokorelacja szumu wąskopasmowego. ................................. 32 Rysunek 17: Autokorelacja złożonego sygnału harmonicznego. .................. 32 Rysunek 18: Korelacja wzajemna sygnału harmonicznego. Różnica w czasie dojścia do SB – 36 ms. ................................................... 34 Rysunek 19: Układ generacji szumu wąskopasmowego. ............................... 34 Rysunek 20: Szum wąskopasmowy – przebieg. ............................................ 36 Rysunek 21: Sygnał rzeczywisty – przebieg. ................................................. 36 4 Rysunek 22: Szum wąskopasmowy – autokorelacja. ..................................... 36 Rysunek 23: Sygnał rzeczywisty – autokorelacja. ......................................... 36 Rysunek 24: Szum wąskopasmowy – korelacja wzajemna . ......................... 36 Rysunek 25: Sygnał rzeczywisty – korelacja wzajemna. ............................... 36 Rysunek 26: Cepstrum sygnału bez echa. ...................................................... 38 Rysunek 27: Cepstrum sygnału z echem. ....................................................... 38 Rysunek 28: Schemat układu usuwającego echo z sygnału przy użyciu cepstrum i filtracji medianowej. ................................................ 40 Rysunek 29: Korelacja wzajemna sygnałów z echem przed filtracją medianową. ............................................................................... 40 Rysunek 30: Filtracja medianowa fragmentu sygnału. .................................. 41 Rysunek 31: Filtracja medianowa całego sygnału. ........................................ 41 Rysunek 32: Widmo sygnału rzeczywistego. ................................................ 43 Rysunek 33: Mechanizm kojarzenia prążków. ............................................... 48 Rysunek 34: Mechanizm wybierania n – grupy. ............................................ 49 Rysunek 35: Schemat układu pomiarowego. ................................................. 51 Rysunek 36: Funkcja korelacji wzajemnej z zawartością harmonicznych. ... 53 Rysunek 37: Widmo sygnału z harmonicznymi. ............................................ 53 Rysunek 38: Charakterystyka filtru usuwającego zakłócenia sieciowe. ........ 54 Rysunek 39: Sygnał rzeczywisty po filtracji. ................................................. 55 Rysunek 40: Funkcja korelacji wzajemnej po filtracji. .................................. 55 Rysunek 41: Wykres zmian kąta w funkcji czasu. ......................................... 57 Rysunek 42: Rozmycie prążków wynikające z ruchu pojazdu. ..................... 57 5 WYKAZ SKRÓTÓW I OZNACZEŃ: - DTF – dyskretna transformata Fouriera, - ODTF – odwrotna dyskretna transformata Fouriera, - LO – lokalizacja obiektów, - SB – stacja bazowa, - MA – metoda amplitudowa, - MOC – metoda opóźnień czasowych, - FST – filtr szumów tła, - ST – szumy tła, - MP – metoda pasmowa, - MH – metoda hiperboliczna, - K – przesunięcie o ilość próbek, - D – opóźnienie, - L – blok próbek, - N – liczba próbek, - Rsb – promień strefy bliskiej. Wszystkie symulacje oraz wykresy wykonywane były w środowisku MATLAB 5.3; do przeprowadzenia doświadczeń w rzeczywistych warunkach i ich prezentacji użyto programów Cool ’95 oraz MATALAB 5.3. 6 1. Wstęp. W dzisiejszych czasach istnieje ogromne zapotrzebowanie na układy pozwalające określić położenie obiektów. Systemy takie znajdują się w kręgu zainteresowań wojska, zakładów przemysłowych a także ratownictwa i osób prywatnych. Na świecie istnieje już wiele systemów pozwalających na określenie położenia obiektu (LORAN czy DECCA). Niesamowitą popularność zdobył w ostatnich latach system GPS. Wszystkie te systemy pozwalają użytkownikowi systemu na określenie swojej pozycji geograficznej. Co jednak zrobić jeśli to my chcemy zlokalizować dany obiekt ? Lokalizacji Obiektów (LO) można dokonać przy wykorzystaniu systemów aktywnych bądź pasywnych. Systemy aktywne dają bardzo wiele możliwości jeśli chodzi o detekcję obiektów, można swobodnie kształtować impulsy sondujące, kierować je w żądanym kierunku, wybierać obszar przeszukiwania. Wadą systemu aktywnego jest to, że namierzany może przy pomocy prostego urządzenia stwierdzić fakt namierzania. W przypadku systemu pasywnego stwierdzenie tego nie jest możliwe. Niestety, w takim układzie nie możemy formować wiązki detekcyjnej, nie posiadamy żadnej wiedzy na temat sygnałów, które mogą dotrzeć do detektora. Stawia to konstruktorów takich systemów w kłopotliwej sytuacji i wymaga zaangażowania odpowiednich sił i środków (zarówno teoretycznych jak i technicznych). Pasywne systemy akustycznej lokalizacji mogą znaleźć wiele zastosowań tak wojskowych jak i cywilnych. Jest kilka możliwych dróg rozwoju takich systemów. W przypadku wojska są to zazwyczaj pasywne sonary do wykrywania okrętów podwodnych lub systemy zabezpieczeń obiektów wojskowych (ogrodzenie mogłoby być strzeżone przez taki system sprzężony z kamerami i karabinami). Dla celów cywilnych mogą być wykorzystywane do monitorowania terenów przemysłowych (np. składów materiałów) lub strzeżenia prywatnych posiadłości (monitoring – kamery, kierowany strumień światła). W oparciu o rozmieszczone szeroko stacje bazowe wzdłuż wybrzeża realizowany jest system określania stanu 7 morza. Korzysta on z różnic czasów dojścia szumu fal do poszczególnych mikrofonów i na podstawie macierzy korelacji wzajemnej wyznacza zafalowanie w poszczególnych sektorach. Daje to możliwość przewidywania zmian stanu morza, zwiększenia efektywności akcji ratowniczych a także poprawy bezpieczeństwa ludzi pracujących na morzu (rybacy, żegluga pasażerska, straż przybrzeżna). Oddzielną grupą są systemy pasywne określające położenie obiektu na podstawie sygnałów elektronicznych (telefon komórkowy, nadajnik radiowy, satelitarny, jakiś dowolny inny sygnał radiowy). Wykorzystywane przez prywatnych użytkowników mogą być stosowane np. w samochodach do określania pozycji i współpracy z mapą elektroniczną. Policja może używać takich systemów do lokalizacji np. skradzionych samochodów, zorganizowanych grup przestępczych. W specjalistycznych zastosowaniach można przy wykorzystaniu pasywnego systemu lokalizacji korygować wskazania GPS w celu zwiększenia jego dokładności. Celem tejże pracy jest pokazanie, że istnieje możliwość wykrywania i określania pozycji obiektów na podstawie docierających do systemu dźwięków w paśmie akustycznym, opracowanie metod detekcji oraz ocena ich skuteczności. Praca składa się z dwóch części. W pierwszej przedstawione zostaną teoretyczne rozważania na temat możliwości realizacji takich układów: algorytmy, metody – ich wady i zalety. W drugiej efekt doświadczeń przeprowadzonych w rzeczywistych warunkach na prostym układzie testowym pozwalających praktycznie sprawdzić działanie takiego systemu detekcji. 8 2. Założenia realizacji oraz wstępny opis układu. W przeciwieństwie do systemu aktywnego przypadku pasywnego systemu lokalizacyjnego należy zastosować zupełnie nową koncepcję wykrywania. Nie posiadając aktywnego narzędzia do przestrzennego przeszukiwania obszaru obserwacji nie możemy stosować pojedynczej stacji lokalizacyjnej (jak np. w radarach). Rozwiązaniem może być zastosowanie kilku Stacji Bazowych. O ich rozmieszczeniu decydują zastosowanie i lokalizacja systemu. W mojej pracy chciałbym przybliżyć możliwość realizacji systemu pasywnej, akustycznej lokalizacji obiektów w takim właśnie systemie złożonym z kilku stacji bazowych. Przykładowy system przedstawiony jest na rys. 1: R1 S1 S2 R2 Obiekt S3 R3 Rys. 1.Przykładowy system lokalizacyjny złożony z trzech stacji bazowych, gdzie: − S1–S3 – stacje bazowe, − R1–R3 – odległość obiektu od poszczególnych stacji bazowych. W przypadku takiego rozmieszczenia stacji bazowych dysponujemy już dwoma parametrami: 9 − rozkładem amplitud sygnału w poszczególnych stacjach bazowych − różnicą czasów dojścia sygnałów do poszczególnych stacjach bazowych. Dodatkowym założeniem projektowym jest takie rozmieszczenie SB aby obszar detekcji znajdował się w strefie bliskiej wyznaczonej przez rozmiar szyku antenowego stworzonego przez SB (jako strefę bliską można przyjąć obszar o promieniu Rsb = 10 * Omax ,gdzie Omax to maksymalna odległość między skrajnymi mikrofonami). Jest to istotne ze względu na łatwość określania dokładnego położenia obiektu. Detektorami w takim układzie mogą być odpowiednio dobrane mikrofony wszechkierunkowe. 10 3. Metoda amplitudowa. 3.1. Opis metody Metoda amplitudowa (MA) jest pierwszym, intuicyjnie narzucającym się rozwiązaniem technicznym zagadnienia LO. Amplitudy odebranego sygnału zależą od odległości od źródła (obiektu). Jak wiadomo amplituda maleje z kwadratem odległości: A≈ 1 r2 W związku z tym jej wartości będą różne w poszczególnych mikrofonach (SB). Metoda amplitudowa opiera się na wyznaczeniu współczynnika kierunkowego stycznej (de facto wartości pochodnej w punkcie) przy znajomości wartości A(r) funkcji amplitudy (rys. 2.). Wartość pochodnej można wyznaczyć ze wzoru: f ' ( R1, 2 ) = f ( R1 ) − f ( R2 ) , ∆R1, 2 R1 , R2 – odległości od poszczególnych SB. ∆R1, 2 – różnica odległości. stąd już w prosty sposób określamy położenie obiektu: f ' ( R1, 2 ) = ( A ' A ) = −2 3 , 2 R1, 2 R1, 2 11 y=A/R^2 styczna – wyznacza f’(R) Rys. 2. Graficzna interpretacja metody amplitudowej z wykorzystaniem stycznej, gdzie: A - y= – zależność wartości amplitudy od odległości, R i2 - a = f ' (R i ) – współczynnik kierunkowy stycznej w punkcie. więc: R1, 2 = 3 − 2A , f ' ( R1, 2 ) a ponieważ wartość ta jest niezależna od amplitudy początkowej, jedynie od stosunku amplitud, można znając wartości kolejnych Ri , wyznaczyć poszczególne odległości do obiektu i określić położenie. Ponieważ wykorzystywana jest w tej metodzie różnica odległości to do określenia położenia punktu odniesienia wybierany jest punkt będący środkowym odcinka łączącego miejsca położenia poszczególnych stacji bazowych. Przyjmując położenia mikrofonów we 12 współrzędnych symetryczny względem początku układu współrzędnych możemy określać poszczególne odległości względem niego. 3.2. Ograniczenia stosowalności metody. Metoda ta (jak widać bardzo prosta) ma jednak wiele istotnych wad dyskwalifikujących ją praktycznym zastosowaniu. Na jej niedoskonałość mają wpływ: 1. Nierównomierności i nieidealność charakterystyk poszczególnych mikrofonów. 2. Fluktuacje amplitudy wynikające z wielodrogowości przychodzącego sygnału (sumowanie się lub odejmowanie amplitud). 3. Wyjątkowe trudności w obserwacji wielu obiektów. 4. Kierunkowość źródeł. 5. Mała odporność układu na szumy. Ad.1. Jeśli chcemy korzystać z rozkładu amplitud w poszczególnych mikrofonach musimy wziąć pod uwagę różnice między charakterystykami poszczególnych mikrofonów. Stosując bardzo dobre mikrofony mamy gwarancję stałości charakterystyki w interesującym nas paśmie1 (rys. 5). Różnicę między poszczególnymi mikrofonami możemy korygować w torze pomiarowym, aczkolwiek należy pamiętać, że dokładność pomiarów akustycznych2 waha się między 0.5dB a 1.5dB. Na rysunku 3 przedstawiony został wykres błędów wyznaczenia odległości w funkcji ilości przypadkowych położeń obiektu (strefa obserwacji 100m). Jak łatwo zauważyć są to duże wartości (rzędu 1.5 ÷ 2.5m dla 1.5dB). Rozwiązaniem tego problemu wydaje się zastosowanie algorytmu dającego możliwość usuwania zakłóceń impulsowych (takim jest algorytm Nyströma): 1 2 Szczegółowy opis – katalogi mikrofonów firmy Bruel & Kjaer. Patrz [4], [5]. 13 Rys. 3. Wykres błędów lokalizacji w zależności od próby dla losowo wybranego położenia obiektu przy wykorzystaniu MA. Rys. 4. Wykres błędów lokalizacji w zależności od 14 próby dla losowo wybranego położenia obiektu przy wykorzystaniu MA z uwzględnieniem algorytmu Nyströma. Rys. 5. Przykładowa charakterystyka mikrofonu wszechkierunkowego (w zastosowaniach specjalnych producent gwarantuje stałość charakterystyki do 200 kHz – do zastosowań w tym układzie wystarcza mikrofon B&K 4135; zapewnia stałość w amplitudzie do 5 kHz i różnice między poszczególnymi egzemplarzami do 0.6 dB). f ' ( x) = f ( x + ∆x ) − f ( x − ∆x ) , 2 ∆x który ogranicza wpływ na pochodną zakłóceń impulsowych. Należy więc brać pod uwagę najbardziej różniące się amplitudy w celu maksymalizacji ∆x . Przy zastosowaniu algorytmu Nyströma błędy maleją około trzech razy. Na rys. 4 widać ich wyraźne zmniejszenie w porównaniu z poprzednią sytuacją, błędy oscylują na poziomie do 0.25m (dla nierównomierności ok. 1.5dB). Niestety może to nie wystarczyć do poprawnej lokalizacji w przypadku słabych sygnałów. 15 Ad.2. W przypadku sygnałów akustycznych musimy się liczyć z wielodrogowością (echa od przeszkód, innych obiektów) a co za tym idzie z możliwością chwilowego sumowania bądź odejmowania się amplitud w punkcie odbioru. Część błędów wynikających z wielodrogowości może zostać wyeliminowana przy zastosowaniu algorytm Nyströma. Jednakże w przypadku silnego echa możemy otrzymać fałszywy rozkład amplitud, w konsekwencji błędną lokalizację. Ad.3. Wykrycie kilku obiektów, przy zastosowaniu metody amplitudowej, jest mało realne. Amplitudy sygnałów od poszczególnych obiektów sumują się w każdej ze stacji bazowych. Nie ma możliwości ich wyselekcjonowania – nie można więc określić ani ilości ani pozycji źródła sygnału. Ad.4. Ogromnym problemem jest również kierunkowość źródeł. W sytuacji, gdy dźwięk rozchodzi się w kierunku dalszego mikrofonu amplituda odebranego sygnału będzie w nim większa niż w mikrofonie bliższym. Otrzymamy błędny rozkład amplitud (nie zgodny z naszymi oczekiwaniami – im bliżej źródła tym sygnał silniejszy). W efekcie błędnie określimy położenie i odległość obiektu. Ad.5. Szumy otoczenia mogą, w przypadku słabych sygnałów, fałszować rozkład amplitud, wywoływać dodatkowe fluktuacje. Ograniczoną stosowalność mieć będzie również MA dla strefy dalekiej. Odległości między mikrofonami w porównaniu z odległością od źródła sygnału są niewielkie, niewielkie są więc różnice w rozkładach amplitud. Biorąc pod uwagę czynniki wymienione w punktach 1 ÷ 5 można się spodziewać dość dużych błędów lokalizacji, problemów z poprawną detekcją. Należy jeszcze pamiętać, że MA może okazać się nie przydatna przy obiektach emitujących sygnały impulsowe. 16 4. Metoda opóźnień czasowych. 4.1. Opis metody. Odmienną od Metody Amplitudowej jest Metoda Opóźnień Czasowych. W zależności od położenia obiektu sygnał emitowany dotrze do rozmieszczonych SB w różnym czasie. Na podstawie opóźnień sygnału (różnica w czasach dojścia niesie w sobie informację na temat przebytej drogi) można wyznaczyć różnice odległości między poszczególnymi SB: Ri , j = υ a ⋅ ∆t i , j , dla dźwięku υ a =340m/s. a co za tym idzie – położenie obiektu. W celu ich wyznaczenia można skorzystać z funkcji korelacji wzajemnej, będącej splotem dwóch sygnałów z różnych SB: K 1, 2 (t ) = x1 (t ) ∗ x 2 (t − τ ) Sposób określania przesunięcia czasowego na podstawie pików korelacyjnych pokazany jest na rysunkach 6 i 7. Estymator funkcji korelacji wyznacza się za pomocą DTF (dyskretnej transformaty Fouriera) obliczając widmo realizacji a następnie liczy się ODTF (odwrotną dyskretną transformatę Fouriera) kwadratu widma amplitudowego | X (e jΘk ) |2 unormowanego względem N. Obciążenie estymatora i jego wariancja zależą od N – próbek i można je zmniejszyć wydłużając ten ciąg. Ustalenie dokładności estymacji zależy od wymagań projektanta układu. W przypadku 17 sygnałów nieokresowych funkcję korelacji wzajemnej wyznacza się wykorzystując uzupełnianie widma ciągiem zer. Do estymacji M pierwszych Rys. 6. Korelacja wzajemna (autokorelacja) dla zerowej różnicy opóźnień (punkt odniesienia). różnica czasów Rys. 7. Korelacja wzajemna dla różnica czasów 18 dojścia do dwu stacji bazowych. próbek funkcji wystarczy uzupełnić ciąg N próbek widma sygnału M-1 zerami (zniekształcenia interferencyjne wynikną wynikające z wyznaczenia splotu cyklicznego wynikną wtedy dopiero dla m ≥ M). Następnie obliczamy L – punktową (L=N+M–1) ODTF. Problemem staje się wyznaczenie funkcji korelacji wzajemnej ciągów o dużych N (rzędu kilkunastu tysięcy). W takiej sytuacji wyznacza się liczbę K – splotów cząstkowych i sumuje3. 4.2. Analiza matematyczna. Teoretyczne modele sygnałów w poszczególnych SB można zdefiniować (dla M=4, gdzie M – ilość SB): x1 (t ) = A1 s (t − τ 1 ) + n1 (t ) + no1 (t ) , x 2 (t ) = A2 s (t − τ 2 ) + n 2 (t ) + no 2 (t ) , x 3 (t ) = A3 s (t − τ 3 ) + n3 (t ) + no 3 (t ) , x 4 (t ) = A4 s (t − τ 4 ) + n 4 (t ) + no 4 (t ) . gdzie: A1 ÷ A4 − amplitudy sygnałów w poszczególnych SB, s (t ) − detekowany sygnał, τ 1 ÷ τ 4 − opóźnienia w poszczególnych SB, n1 (t ) ÷ n 4 (t ) − szumy w poszczególnych torach pomiarowych, no1 (t ) ÷ no 4 (t ) − szumy otoczenia. Korelację wzajemną będziemy więc liczyć jako splot x1 (t ) z sygnałami z pozostałych SB oraz sploty K i , j (t ) pozostałych sygnałów między sobą. Uzyskamy więc zestaw M – splotów niosących wiadomość o różnicach w czasach dojść do poszczególnych SB. 19 Ponieważ szumy n1 ÷ n 4 nie są ze sobą skorelowane (ich źródłem są tory pomiarowe) nie wpływają one na rozkład funkcji korelacji wzajemnej. Niestety nie da się wyeliminować wpływu szumów otoczenia no1 (t ) ÷ no 4 (t ) ze względu na ich powiązanie z sygnałem. Aby określić wysokość odcięcia piku korelacyjnego, czyli taką poniżej której nie będzie on wykrywany (zginie w szumie otoczenia), należy przed rozpoczęciem działania układu wyznaczyć poziom szumów tła (np. przez określenie wartości maksymalnej piku funkcji autokorelacji szumu – korelacja jest przecież zależnością energetyczną). Przykładowy układ do detekcji opóźnienia D korzystający z funkcji korelacji wzajemnej przedstawiony jest na rys. 8, gdzie: - FST jest to Filtr Szumów Tła. W przypadku pasywnych układów detekcji nie możemy określić sygnału jaki dotrze do stacji bazowych. Mamy natomiast możliwość zbadania, w przypadku braku sygnału od obiektów, wszystkich sygnałów otoczenia – czyli szumów tła. Na podstawie takich rejestracji można stworzyć filtr dopasowany do ST a na jego podstawie filtr odwrotny. FST daje więc możliwość usuwania zbędnych dźwięków, co zwiększa prawdopodobieństwo detekcji. - ()^2 – operacja podnoszenia do kwadratu. - Peak Detector – detektor piku korelacyjnego. X1(t) X1(n) FST * X1(t-d) ()^2 Peak Detector D FST X2(n) 3 Patrz [1], [2], [3]. 20 Rys. 8. Układ detekcji opóźnienia D korzystający z funkcji korelacji wzajemnej 4.3. Lokalizacja pasmowa. Posiadając już dane na temat różnic czasów przyjścia sygnału do SB możemy podjąć próbę określenia położenia naszego obiektu. Istnieją dwie z wielu metod lokalizacyjnych. Pierwsza została nazwana Metodą Pasmową. Nazwa pochodzi od charakterystycznych „pasów” tworzonych przez proste z namiaru na obiekt. Wyobrażenie o MP daje poglądowy rysunek nr 9: SB1 obiekt B p1 C A D p2 SB2 p3 p4 SB3 Rys. 9. Rysunek poglądowy przedstawiający metodę pasmową. 21 Umieśćmy SB w układzie współrzędnych a na liniach je łączących rozmieśćmy po dwa punkty zaczepienia ( p1 ÷ p 4 ). Możemy teraz poprowadzić z tych punktów proste o współczynniku kierunkowym „a” zależnym od różnicy czasu dojścia sygnału do SB. Dla każdej pary mikrofonów (SB) będziemy mogli określić pas, w którym obiekt się znajduje. Korzystając z kilku par SB możemy określić obszar prawdopodobieństwa występowania obiektu a jego dokładną pozycję ustalić już iteracyjnie. Jako punkt startowy przyjmuje się pozycję wyznaczoną poprzez rozwiązanie układu równań prostych przechodzących przez punkty przecięcia się linii pasów (punkty A, B, C, D). Największe prawdopodobieństwo znalezienia obiektu przypada na obszar czworokąta ABCD. Metoda ta może okazać się nieefektywną w przypadku gdy obiekt znajduje się w otoczeniu przedłużenia prostej łączącej poszczególne stacje bazowe. Wtedy to proste wychodzące z punktów p1, p2 oraz p3 i p4 są nachylone względem siebie pod bardzo małymi kątami. Punkty A, B, C i D znajdują się w dużych odległościach od siebie. Zwiększa się prawdopodobieństwo wystąpienia punktu startowego do wyznaczenia położenia obiektu poza czworokątem ABCD. Rośnie ilość kroków iteracji, a niewielki błąd detekcji piku korelacyjnego przekłada się na znaczną niedokładność wyznaczenia pasów lokalizacyjnych, tym samym punktu startowego. Rosną więc błędy estymacji położenia obiektu i nakłady obliczeniowe. Efekt ten zacznie się również pojawiać wraz z „wychodzeniem” obiektu ze strefy bliskiej (patrz rysunki 12 i 13 na końcu rozdziału). Wtedy to niezależnie od konfiguracji i rozmieszczenia mikrofonów pasma staną się do siebie równoległe. Korzystając z prostych przekształceń trygonometrycznych, będziemy mogli określić jedynie kąt ϕ linii, na której znajduje się obiekt (linii namiaru). Przy zastosowaniu MP należy więc liczyć się z potrzebą zastosowania większej ilości mikrofonów (SB) niż by to wynikało z analizy teoretycznej. Układ taki musi posiadać symetrię (np. rozmieszczenie SB na osiach układu współrzędnych w równych odległościach o jego początku). Jest to niezbędne aby istniała możliwość eliminowania błędów powstałych w położeniach „krytycznych” dla metody pasmowej. 22 4.4. Lokalizacja hiperboliczna. Spójrzmy na zagadnienie różnic czasów dojścia od innej strony i powróćmy do sytuacji gdy posiadamy jedynie dwa mikrofony (dwie stacje bazowe). Znana różnica dróg, wynikająca z różnicy czasów przyjścia sygnału do mikrofonów (stacji bazowych), wyznaczy nam hiperbolę . Wyznacza ona zbiór możliwych położeń obiektu – jeśli obiekt znajduje się na krzywej to odległość OSB1 – OSB2 zawsze różni się o stałą wartość (OSB1–OSB2=const.). Sytuację taką przedstawia rys. 10. Mając do dyspozycji trzy stacje bazowe możemy już dokładnie określić położenie naszego obiektu – rys. 11. Przy trzech SB mamy do dyspozycji różnice czasów (dróg) SB1 – SB2, SB3 – SB2, SB1 – SB3. Stąd otrzymujemy trzy hiperbole. Punkt przecięcia się wszystkich trzech wyznacza jednoznacznie miejsce lokalizacji (Metoda Hiperboliczna). W celu określenia położenia obiektu we współrzędnych kartezjańskich należy dokonać kilku prostych przekształceń matematycznych. Oznaczmy więc jako ( X i , Yi ) współrzędne i-tej stacji bazowej; (x, y) współrzędne obiektu; Ri odległość obiekt – stacja bazowa; Ri , j różnicę dróg Ri − R j pomiędzy i-tą a j-tą stacjami bazowymi. Ri = ( X i − x) 2 + (Yi − x) 2 Ri = X 2 i + Y i 2 − 2 X i x − 2Y i y + x 2 + y 2 (1) (2) Ponieważ danymi są dla nas opóźnienia czasowe (różnice dróg), to: Ri , j = υ ⋅ ∆t = Ri − R j = ( X i − x) 2 + (Yi − x) 2 − ( X j − x) 2 + (Y j − x) 2 (3) 23 O SB2 SB1 Rys. 10. Hiperbola wszystkich możliwych lokalizacji obiektu dla dwu stacji bazowych. SB3 Fałszywe położenia Obiekt SB1 SB2 Rys. 11. Dokładny punkt położenia wyznaczony przez przecięcie się hiperbol (trzy stacje bazowe). 24 Przenosząc i podnosząc stronami do kwadratu mam: Ri2 = ( Ri , j − R j ) 2 (4) Ri2, j + 2 Ri , j R j + R 2j = X i2 + Yi 2 − 2 X i x − 2Yi y + x 2 + y 2 (5) A stąd otrzymuję równanie: Załóżmy, że: − wiemy, do której stacji bazowej sygnał dotrze w pierwszej kolejności (określenie tego nie stanowi problemu – o tym w dalszych rozdziałach), − nasze stacje bazowe umieścimy w trzech punktach dobranych tak, aby ułatwić przekształcenia. Korzystając z pierwszego założenia możemy wyrażenie (5) przekształcić do postaci: Ri2, j + 2 Ri , j R j = X i2 + Yi 2 − 2 X i , j x − 2Yi , j y + x 2 + y 2 (6) Umieśćmy teraz nasze stacje bazowe w punktach o współrzędnych: − SB1=(0,0), − SB2=( X 2 ,0 ), − SB3= ( X 3 , Y3 ). Dzięki temu nasze wyrażenie ulegną uproszczeniu: Ri = ( X i − x) 2 + (Yi − x) 2 = x 2 + y 2 25 X i ,1 = X i − X 1 = X i , Yi ,1 = Yi − Y1 = Yi . Korzystając z powyższych zależności i podstawiając je do wzoru (6) otrzymamy: 2 R2,1 R1 = R22,1 − X 22 + 2 X 2,1 x (7) 2 R3,1 R1 = R32,1 − ( X 32 + Y32 ) + 2 X 3,1 x + 2Y3,1 y (8) Dokonując przekształceń możemy sprowadzić problem rozwiązania tychże równań do wyznaczenia miejsc zerowych funkcji liniowej i kwadratowej: y = a ∗ x + b, oraz: c ∗ x2 + d ∗ x + e = 0 . gdzie: a = [ R3,1 − ( X 2 / R2,1 ) − X 3 ] / Y3 , b = { X 32 + Y32 − R32,1 + R3,1 ∗ R2,1 [1 − ( X 2 / R2,1 ) 2 ]} / 2Y3 , c = −{[1 − ( X 2 / R 2,1 ) 2 ] + a 2 } , d = X 2 ∗ {[1 − ( X 2 / R2,1 ) 2 ]} − 2a ∗ b , e = ( R22,1 / 4) ∗ {[1 − ( X 2 / R2,1 ) 2 ]}2 − b 2 . Rozwiązując równanie kwadratowe otrzymujemy dwie wartości x. Otrzymamy więc dwa punkty położenia obiektu. Pomocną w rozwiązaniu tego problemu jest informacja o kolejności przyjść sygnału do mikrofonów (SB). 26 Powyższe zależności zostały opracowane i sprawdzone podczas badań nad rozwojem układów lokalizacji w systemach CDMA [6], [8]. Istnieje również inny sposób na wyznaczenie matematyczne miejsca położenia obiektu (przypadek dla trzech stacji bazowych), tzw. algorytm Chana [7]: X 2,1 Y2,1 x y = − X 3,1 Y3,1 −1 2 R 2,1 1 R2,1 − K 2 + K 1 R × + 1 , 2 R32,1 − K 3 + K 1 R3,1 (9) gdzie: K 1 = X 12 + Y12 , K 2 = X 22 + Y22 , , K 3 = X 32 + Y32 . uwzględniając położenie naszych SB otrzymujemy: K 1 = 0, K 2 = X 22 , K 3 = X 32 + Y32 . Wstawiając równanie (9) do (1) uzyskujemy równanie kwadratowe. Jego pierwiastki wstawione powtórnie do (9) dadzą nam ostateczne rozwiązanie. Okazuje się jednak, że nie musimy się przejmować tym, iż uzyskujemy dwie wartości x. Na podstawie badań przeprowadzonych na uniwersytecie w Virgini połączenie metod Fanga i Chana [7] daje nam zawsze jedno rozwiązanie ujemne równania kwadratowego. Ponieważ odległość nie może być ujemna stąd też rozwiązanie dodatnie jest jedynym poprawnym. Ciekawym wnioskiem z przeprowadzonych doświadczeń jest to, iż w przypadku obu metod przy takich samych wartościach zaburzenia danych błędy estymacji położenia śledzonego obiektu były takie same. 27 Wartość Ri możemy próbować wyznaczać także innymi metodami (np. korzystając z metody amplitudowej porównując wartości prążków korelacyjnych. Dokładność wyznaczenia Ri wpływa na poprawność estymacji położenia. Poniżej zostały przedstawione wyniki symulacji – wykresy błędów estymacji położenia w poszczególnych metodach (pasmowej i hiperbolicznej): błędy dla położeń „krytycznych” – 3 SB błędy dla położeń „krytycznych” – 3 SB Rys. 12. Błąd estymacji położenia obiektu (MP) dla kolejnych, losowych położeń. 28 Wykres błędów estymacji położenia dla metody amplitudowej w zależności od odległości. 6 Błąd estymacji położenia 4 2 0 -2 -4 -6 0 40 80 120 160 200 240 Odległość 280 320 360 400 Rys. 13. Wykres błędów estymacji położenia w zależności od odległości – widoczne ustalenie się błędów po przekroczeniu linii strefy bliskiej – ok. 200 m. Wykres błędów lokalizacji w metodzie hiperbolicznej dla losowo wybranego położenia obiektu. 0.16 0.12 0.08 Błąd lokalizacji 0.04 0 -0.04 -0.08 -0.12 -0.16 0 10 20 30 40 50 60 Kolejne położenie 70 80 90 100 Rys. 14. Wykres błędów estymacji położenia (MH) dla kolejnych, losowych, położeń obiektu. 29 5. Modele sygnałów, problemy z detekcją, echo i jego usuwanie. Aby można było prowadzić jakiekolwiek badania algorytmów oraz określić możliwość realizacji zagadnienia lokalizacji pasywnej w paśmie akustycznym trzeba było zaproponować model sygnału jaki będzie odbierany w mikrofonie. Podstawowym problemem detekcji jest minimalizacja wpływu zakłóceń zarówno zewnętrznych jak i wewnętrznych. W grupie zagrożeń znajdują się przecież szum torów pomiarowych, szum tła, wielodrogowość sygnału (czyli echa od elementów stałych, innych obiektów), obszar obserwacji, częstotliwość próbkowania. Istotny problem to obiekty poruszające się (należało określić parametry tolerowane przez układ). 5.1. Model sygnału. Z wymienionych w poprzednim rozdziale metod najbardziej efektywną jest metoda korelacyjna. Należało więc zbadać zachowywanie funkcji korelacji wzajemnej poszczególnych sygnałów. Badanie sygnałów polegało na generacji ciągu M próbek sygnału. Następnie tworzone były dwa sygnały o długości N<M próbek. Drugi z nich był przesuwany względem pierwszego o K próbek. Oczekiwanym efektem był pik korelacji wzajemnej przesunięty względem piku autokorelacyjnego o K próbek. Funkcja korelacji wzajemnej poszukiwanego modelu sygnału powinna więc posiadać wyraźne maksimum dla różnych K – przesunięć i wartości zbliżone do zera dla pozostałych momentów czasowych (załóżmy dla wszystkich sygnałów, że mamy do czynienia z sygnałami stacjonarnymi w szerszym sensie): - szum biały – w celu przykładowego opisu szumu białego rozważmy proces Bernouliego. Z założenia proces jest stacjonarny, występowanie wartości +1 i –1 jest niezależne od chwili czasowej i tak samo 30 mx = 2 p − 1 , prawdopodobne. Wartość przeciętna wynosi wartość średniokwadratowa E[ x 2 ] = 1 a wariancja σ x2 = 4 p(1 − p ) . Stąd ciąg autokorelacji ma postać: E[ xn2 ] = 1 Φ(m) = E[ xn ] ⋅ E[ xn+m ] = mx2 m = 0, m ≠ 0. dla p = 0.5 otrzymujemy mx=0 oraz Φ ( m) = δ (m ) czyli dla danego przesunięcia deltę Dirac’a i 0 dla pozostałych chwil czasowych4. - szum pasmowy – dla szumu pasmowego (częściowa zależność między poszczególnymi próbkami) efekt analizy będzie podobny – dla danego K wystąpi δ (m) , dla pozostałych chwil czasowych wartości mx będą spełniać zależności: mx ≠ 0 i mx<< δ (m) (poziom mx będzie zależny od pasma szumu). - sygnał harmoniczny – dla sygnału cosinusoidalnego funkcja korelacji przyjmuje postać: N −1 Φ (m ) = ∑ cos(n ) cos(n − m) n =0 W porównaniu z szumem pasmowym gorzej spełnia wstępne założenia (poza przesunięciem K jej wartości nie są dużo mniejsze od maksimum Φ (m) ). Na podstawie prostych przekształceń można określić podstawowe właściwości funkcji korelacji5: - Φ ( m) ≤ 0 , - wraz ze wzrostem różnicy czasowej dwa ciągi próbek stają się coraz mniej skorelowane ze sobą (maleje wartość Φ (m) ). 31 Na rysunkach 15 ÷ 17 przedstawione zostały funkcje autokorelacji szumu białego, wąskopasmowego i złożonego sygnału harmonicznego. Porównując przebiegi poszczególnych funkcji autokorelacji można stwierdzić ich zgodność ze wstępną analizą matematyczną. W przypadku szumów białego i wąskopasmowego wyznaczenie K – przesunięcia nie powinno sprawiać problemów. W przypadku sygnału harmonicznego jednoznaczne określenie K może być trudne. Pamiętać należy, iż o przydatności modelu sygnału do eksperymentów decyduje przede wszystkim łatwość wyznaczenia różnicy w czasie dojścia sygnału do poszczególnych SB (wyraźne maksimum funkcji korelacji zależne od K). Autokorelacja szumu białego. 330 270 210 150 90 30 -30 0 256 512 768 1024 1280 1536 1792 2048 Rys. 15. Autokorelacja szumu białego. 4,5 Patrz [1] 32 Autokorelacja szumu wąskopasmowego. 50 30 10 -10 -30 -50 0 256 512 768 1024 1280 1536 1792 2048 Rys. 16. Autokorelacja szumu pasmowego. 1.6 x 10 4 Autokorelacja sygnału harmonicznego. 1.2 0.8 0.4 0 -0.4 -0.8 -1.2 0 256 512 768 1024 1280 1536 1792 2048 Rys. 17. Autokorelacja złożonego sygnału harmonicznego. 33 Pierwszy badaniu został poddany model złożonego sygnału harmonicznego. Dla potrzeb doświadczeń utworzony został on z kilku sinusoid o losowo dobranych częstotliwościach. Niestety, okazało się, że w funkcji korelacji wzajemnej takiego sygnału wyróżnienie poszczególnych pików od opóźnionego sygnału może być kłopotliwe (maksimum korelacji nie zawsze było związane z K). Na zmianę właściwości korelacyjnych przebiegu nie miały wpływu częstotliwości poszczególnych składowych jak i ich amplitudy. Przykładowa funkcja korelacji wzajemnej sygnału harmonicznego pokazana jest na rys. 18. Jak łatwo zauważyć w tym przebiegu trudno o jednoznaczne określenie wartości przesunięcia K. Po pierwsze wartość Φ (m) nie osiąga dla danego przesunięcia maksimum. Po drugie dla danego K wiele z pików ma podobną wartość i każdy z nich mógłby zostać zinterpretowany przez układ detekcji jako wyznaczający opóźnienie. Korzystanie z tego modelu może więc prowadzić do wielu błędów w estymacji położenia obiektu. Z powyższej analizy wynika, że należy skorzystać z innego modelu niż złożonego sygnału harmonicznego. Ze względu na swoje właściwości nie będzie on uwzględniany w dalszych rozważaniach. Jednakże znajomość przebiegu funkcji korelacji wzajemnej sygnału harmonicznego okaże się przydatna przy interpretacji doświadczeń w rzeczywistym układzie pomiarowym (rozdz. 6). W rzeczywistości wiele obiektów emituje dźwięki składające się z pojedynczych tonów, są to zazwyczaj złożone dźwięki o szerszym paśmie. Z tego względu jak i na podstawie wyników wstępnej analizy matematycznej jako następny model sygnału został zbadany szum wąskopasmowy. Dla potrzeb doświadczeń szum taki był tworzony w sposób pokazany na rys. 19. Już przy pierwszych próbach okazało się, że przebiegi funkcji korelacji zgodne są z wynikami analizy teoretycznej – takie rezultaty są zadowalające. Aby sprawdzić czy wyniki symulacji komputerowej mają swoje odzwierciedlenie w rzeczywistości przeprowadzone zostały eksperymentalne nagrania na dyktafonie (jeden mikrofon – efekt przesunięcia uzyskiwany był tak jak w przypadku szumu wąskopasmowego przez przesunięcie o K – próbek). 34 Rys. 18. Korelacja wzajemna sygnału harmonicznego. Różnica w czasie dojścia do SB wynosi 36 ms. Generator szumu białego BPF Szum wąskopasmowy Rys. 19. Układ generacji szumu wąskopasmowego. 35 Wyniki doświadczeń przeprowadzonych na próbkach zarejestrowanego sygnału były bardzo zbliżone do tych rzeczywistego z szumem wąskopasmowym. Źródłem dźwięków były autobusy miejskie, samochody osobowe a nawet kroki idącego człowieka. W żadnym z tych przypadków uzyskane przebiegi funkcji korelacji nie odbiegały znacząco od przebiegów tej funkcji dla szumu wąskopasmowego. W każdym z nich łatwo było wyróżnić piki i określić przesunięcie Przykładowe funkcje autokorelacji i korelacji wzajemnej szumu wąskopasmowego oraz sygnału rzeczywistego zostały przedstawione na poniższych rysunkach (rysunki nr 20 ÷ 25). 36 Przebieg szumu wąskopasmowego. 3 0.3 1 Amplituda Amplituda 2 0 -1 0.1 -0.1 -0.3 -2 -3 0 0.03 0.06 0.09 0.12 Czas t=[s] Autokorelacja. 0.15 0.18 -0.5 0.03 0.06 0.09 0.12 0.15 Czas t=[s]. Autokorelacja 0.18 45 Amplituda. 1000 Amplituda. 0 60 1600 400 -200 -800 30 15 0 -1400 -15 -2000 -0.18 -0.12 -0.06 0 0.06 0.12 0.18 Czas t=[s] Korelacja wzajemna - przesunięcie ok. 63 ms. 1600 -30 -0.18 -0.12 -0.06 0 0.06 0.12 0.18 Czas t=[s]. Korelacja wzajemna - przesunięcie ok. 63 ms. 60 1200 45 800 400 Amplituda Amplituda. Przebieg sygnału rzeczywistego. 0.5 0 -400 -800 30 15 0 -15 -1200 -1600 -0.18 -0.12 -0.06 0 0.06 Czas t=[s]. 0.12 0.18 -30 -0.18 -0.12 -0.06 0 0.06 0.12 Czas t=[s]. 0.18 Rysunki nr 20 ÷ 25 (wierszami): - Rys. 20, 21 – przebiegi sygnałów, Rys. 22, 23 – autokorelacje sygnałów, Rys. 24, 25 – korelacje wzajemne sygnałów. lewa kolumna – szum wąskopasmowy, prawa – sygnał rzeczywisty. 37 5.2. Wielodrogowość i echa. Problemem przy detekcji obiektów jest wielodrogowość sygnału. Nie ma praktycznie możliwości abyśmy nasz system detekcji mogli ustawić w miejscu gdzie nie występują żadne przeszkody terenowe, budynki. Zakładając nawet możliwość pracy w obszarze pozbawionym przeszkód terenowych to sygnał może odbić się od innych obiektów. Wszystkie przeszkody terenowe, obiekty powodują powstanie echa. Jest to zjawisko niepożądane. Docierające echo może rozmyć prążek korelacyjny czyli obraz obiektu (może wystąpić duży błąd lokalizacji). Może też zostać zinterpretowane jako osobny obiekt. Jest więc echo zjawiskiem niepożądanym i w miarę możliwości należałoby je usunąć. Echo jest to wierna kopia sygnału powtórzona przesunięta w czasie. W celu jego eliminacji należy zastosować narzędzia pozwalające na porównanie przesuniętych sygnałów. Taką możliwość daje cepstrum sygnału. Jest ono definiowane jako: c(n) = IFFT{log{FFT [X (n)]}}, Dokonując operacji logarytmowania widma sygnału zmieniamy mnożenie w sumę. Przechodzimy z dziedziny częstotliwości w dziedzinę czasu. Na początku cepstrum zgromadzona jest energia sygnału właściwego, echo uwidocznia się w dalszych momentach czasowych. Jest ono reprezentowane przez pojedyncze prążki przesunięte na osi czasu, wyodrębnione z głównego sygnału. Przykładowe cepstra sygnałów bez echa i z echem przedstawione są na rysunkach 26 i 27. Mechanizm usuwania echa w dziedzinie cepstrum polega na eliminacji prążków echa z sygnału. Jak wiadomo w widmie prążki odzwierciedlają energię poszczególnych składowych. Usuwając prążki echa usuwamy jego energię. Po powrocie z dziedziny cepstrum w dziedzinę częstotliwości otrzymujemy sygnał oczyszczony z echa. W dziedzinie cepstrum echo można usunąć np. przez: 38 energia sygnału piki echa Rysunki 26 i 27 (wierszami): - Rys. 26. – cepstrum sygnału bez echa, Rys. 27. – cepstrum sygnału z echem. 39 − wyszukanie pików echa i zerowanie, − przepuszczenie zlogarytmowanego widma przez filtr medianowy. Obie metody są skuteczne. Pierwsza wymaga czasu potrzebnego na znalezienie prążków echa i ich usunięcie. Ponadto niezbędnym jest określenie poziomu odcięcia, tj. takiego, powyżej którego prążki są identyfikowane jako echo i eliminowane. Problemem może być usuwanie słabych ech z sygnału. Druga metoda opiera się na innym mechanizmie. Filtracja medianowa w dziedzinie cepstrum niewątpliwie doprowadzi do deformacji widma sygnału. Ponieważ kształt sygnału nie jest dla nas aż tak istotny (ważna jest tylko poprawna funkcja korelacji wzajemnej) możemy pozwolić sobie na zniekształcenia pozwalające zachować jego własności korelacyjne. Działanie cyfrowego filtru medianowego polega na uporządkowaniu próbek wartościami od najmniejszej do największej a następnie wybranie środkowej. Dzięki takiej filtracji jesteśmy w stanie usuwać zakłócenia harmoniczne (co w tym przypadku nie jest istotne) a także (co najważniejsze) zakłócenia impulsowe czyli w naszym przypadku echo. Skonstruowany filtr medianowy uzupełnia ciąg próbek X(n) cepstrum po obu stronach zerami (ich liczba zależy od rozmiarów okna filtru) a następnie wybiera nieparzystą liczbę J – pierwszych próbek (gdzie J – rozmiar okna filtru). Po wybraniu mediany okno przesuwa się dalej wzdłuż sygnału. Na etapie doświadczeń okazało się, że nie można przepuszczać całego cepstrum sygnału przez taki filtr gdyż prowadzi to do znacznej degradacji sygnału i zaniku jego własności korelacyjnych. Wystarczy jednak aby filtrować tę część zlogarytmowanego widma zawierającą echo aby właściwości korelacyjne sygnału zostały zachowane a echo usunięte. Doświadczalnie dobrane optimum ilości próbek wynosi 70% „środka” cepstrum, np. dla ciągu X(n)=1024 próbki filtrować należy tylko część sygnału zawartą między próbkami 150 a 874. Na poniższych rysunkach przedstawione zostały mechanizm usuwania echa przy użyciu filtracji medianowej, oraz przykładowe realizacje sygnałów z echem przed i po usunięciu echa (rys. 28 ÷ 31). 40 X(n) FFT Log Filtracja medianowa FFT ex IFFT Cepstrum IFFT Rys. 28. Schemat układu usuwającego echo z sygnału przy użyciu cepstrum i filtracji medianowej. pik sygnału pik echa Rys. 29. Korelacja wzajemna sygnałów z echem przed filtracją medianową. 41 pik sygnału pik echa Rysunki 30, 31: - - Rys. 30 – sygnał z echem usuniętym przy pomocy filtracji medianowej fragmentu sygnału – widoczne zmniejszenie prążka echa (wchodzi w poziom szumów); stosunek prążka sygnału do prążka echa powiększył się (z ok. 1.5 do 2.33). Rys. 31 – filtracja medianowa całego sygnału – widoczna deformacja sygnału nie pozwalająca określić opóźnienia. 42 5.3. Problemy lokalizacji. Aby ocenić przydatność układu należy w przybliżeniu podać takie parametry jak obszar obserwacji, rodzaj obiektów które system jest w stanie lokalizować, maksymalną prędkość poruszania się obiektów, ilość możliwych jednoczesnych wykryć. Wszystkie parametry te parametry determinuje jedna wielkość – prędkość rozchodzenia się fali akustycznej. Wynosi ona υ = 340 m / s . 5.4. Częstotliwość próbkowania. Dostosowując się do typowych wartości używanych w telekomunikacji, nagraniach akustycznych mamy do wyboru kilka typowych częstotliwości próbkowania: 8 kHz, 11.025 kHz, 22.1 kHz, 44.1 kHz, 48 kHz. Większość dźwięków w otaczającym nas świecie zawiera się w częstotliwościach do 5 ÷ 6 kHz . Aby spełnić warunek Nyquista należy więc brać pod uwagę f p = 11025 Hz , f p = 22100 Hz lub f p = 44100 Hz . Wybór ten jest bardzo istotny. Zwiększając częstotliwość próbkowania możemy analizować dźwięki z większego przedziału częstotliwości. Jednak dla zachowania odpowiedniej rozdzielczości widmowej częstotliwości należy jednocześnie zwiększać ciąg próbek pobieranych do analizy. To pociąga za sobą konieczność korzystania z większych buforów (pamięci), wzrasta nakład obliczeniowy na wyznaczenie funkcji korelacji wzajemnej a co za tym idzie czas potrzebny na dokonanie niezbędnych obliczeń. W efekcie wydłuża się czas wyznaczenia położenia obiektu. Ponieważ analiza widmowa sygnałów poruszających się obiektów pokazuje (rys. 32), że 90% energii sygnału zawiera się w przedziale 0 ÷ 5 kHz , to wystarczającą częstotliwością próbkowania będzie f p = 11025 Hz . Dana częstotliwość przy ciągu próbek N=1024 da nam rozdzielczość częstotliwościową równą: 43 Rys. 32. Widmo sygnału rzeczywistego. ∆f = fp N = 10.76 Hz , oraz rozdzielczość odległościową wynoszącą: ∆R = 1 1 ∗υ = ∗ 340 m / s = 0.0308 m = 3.08 cm , 11025 Hz fp (10) co wydaje się wartością zadowalającą. Za daną częstotliwością próbkowania przemawia jeszcze jeden argument. Dla większości mikrofonów charakterystyki przenoszenia są płaskie właśnie w przedziale do 5 ÷ 6 kHz (patrz rys. 5 str. 14). 44 Powyżej tych częstotliwości charakterystyki zaczynają odbiegać od linii prostych, zwiększają się również różnice w charakterystykach amplitudowych pomiędzy poszczególnymi mikrofonami (co może niekorzystnie wpływać na właściwości pomiarowe układu). 5.5. Obszar obserwacji. Obszar obserwacji zależy od rozmiarów szyku antenowego. Aby była możliwa dokładna lokalizacja (wg założeń tego układu) obiekty powinny znajdować się w strefie bliskiej. Jej promień jest w przybliżeniu określany jako: Rsb = 10∗ Oi , j , (11) gdzie Oi , j – oznacza odległość między najbardziej od siebie odsuniętymi mikrofonami. Mogłoby się wydawać, że w takim razie wystarczy odpowiednio daleko rozstawić mikrofony aby regulować rozmiar strefy bliskiej. Jest to stwierdzenie nie do końca prawdziwe. Należy bowiem pamiętać o skończonej prędkości dźwięku i skończonym czasie obserwacji. Weźmy np. ustalone już wcześniej częstotliwość próbkowania f p = 11025 Hz oraz długość ciągu próbek N=1024. Określmy dla tych parametrów strefę obserwacji (strefę bliską). Na początek jednak wyznaczmy Oi , j czyli maksymalny rozstaw mikrofonów: Omax = 1 1 ∗ N ∗υ = ∗ 1024 ∗ 340 m / s = 31.579 m , 11025 Hz fp (12) 45 uwzględniając, że efektywność minimalna splotu wynosi η = 25% to nasze Omax ostatecznie wynosi: Omax eff = Omax ∗ η = 31.579 ∗ .75 = 23.684 . (13) − efektywność minimalna splotu – wartość procentowa ilości próbek niezbędnych do tego aby można było wyróżnić pik korelacji wzajemnej. Innymi słowy w tym przypadku sygnały muszą w splocie zachodzić na siebie przynajmniej w 25% aby można było jednoznacznie określić K – przesunięcie. Biorąc pod uwagę powyższe wyliczenia (13) nasze R sb będzie wynosić: Rsb = 10 ∗ Omax eff = 10 ∗ 23.684 ≅ 236 m . (14) Okazuje się jednak, że przy tak postawionych warunkach układ może nie działać poprawnie. Nie będzie bowiem możliwości usunięcia echa. Aby istniała możliwość usunięcia echa musi ono być zawarte w sygnale oryginalnym. W przeciwnym razie da ono fałszywy obraz i wykryty zostanie nieistniejący w rzeczywistości obiekt. Przy takim założeniu nasza strefa obserwacji uległa by zawężeniu. Rozwiązaniem tego problemu może być cykliczna korelacja wzajemna. Polega ona na gromadzeniu L – bloków próbek w banku pamięci. Następnie sygnał z bloku L=1 jest splatany z sygnałami zarejestrowanymi w poszczególnych blokacyh. W każdym splocie mogłaby nastąpić detekcja piku oraz eliminacja echa danego sygnału. Po zakończeniu tychże operacji blok próbek o L=L byłby usuwany a na jego miejsce wczytywany nowy (forma bufora cyklicznego). Daje to nie tylko możliwość usuwania echa bez ograniczeń odległościowych ale pozwala jednocześnie na zwiększenie rozstawu mikrofonów i powiększenie strefy dalekiej z pominięciem zależności (12) i (13). 46 5.6. Rozmycie prążków korelacyjnych. Prążki korelacyjne wyznaczają nam przesunięcie K. Dzięki temu możemy zlokalizować obiekt, określić jego położenie. Co jednak się stanie gdy obiekt zacznie się poruszać? Przy częstotliwości próbkowania f p = 11025 Hz i długości ciągu próbek N=1024 czas obserwacji wynosi: to = 1 ∗ 1024 ≈ 93 ms . 11025 Hz W tym czasie dźwięk przebywa ponad 30 m. Rozdzielczość odległościowa dla układu z tak dobranymi parametrami wynosi ok. 3 cm. Samochód poruszający się z prędkością ν = 60 km / h przebywa w tym czasie 1.5 m. Nastąpi więc rozmycie prążków wynikające z ruchu obiektu. Będzie ono zależne od kierunku ruchu obiektu względem układu pomiarowego. Wraz ze wzrostem prędkości obiektu będzie rosło rozmycie jego obrazu. Może dojść do sytuacji gdy samochód o długości 4 m przy prędkości 90 km/h (dystans przebyty w czasie 93 ms wyniesie już 2.5 m) zostanie przedstawiony jako obiekt o długości 6.5 m. Tutaj możliwe są takie rozwiązania jak np.: − zwiększenie częstotliwości próbkowania (skrócenie czasu obserwacji) co związane jest, przy stałej długości ciągu N – próbek, ze zmniejszeniem rozdzielczości częstotliwościowej. − zmniejszenie ilości pobieranych próbek przy zachowaniu danej częstotliwości próbkowania (łączy się to jednak ze zmniejszeniem smukłości prążków). Ostateczne rozwiązania można jednak zaproponować dopiero przygotowując system do pracy i określając wstępnie właściwości detekowanych obiektów. 47 5.7. Detekcja wielu obiektów. Istotnym zagadnieniem jest lokalizacja wielu obiektów. Każde źródło dźwięku znajdujące się w obszarze detekcji powinno posiadać swój obraz w postaci prążka korelacyjnego. Aby wyznaczyć położenie poszczególnych obiektów można skojarzyć prążki każdy z każdym. Otrzymamy skończoną liczbę możliwych kombinacji położeń równą I = n k , gdzie k – ilość mikrofonów, n – ilość prążków. Zakładając, że nasz układ składa się trzech mikrofonów ilość kombinacji będzie wynosić I = n 3 . Dla układu składającego się z czterech mikrofonów, wybierając kolejno po trzy z czterech SB, otrzymujemy cztery trójki kombinacyjne położeń. Ponieważ każde poszczególne wyznaczanie położenia obarczone jest błędem to spośród wszystkich lokalizacji (czterech trójek) powinniśmy otrzymać n – grup bliskich siebie czterech położeń. Można je wyodrębnić wyznaczając minimalny błąd pomiędzy poszczególnymi I – lokalizacjami. Znając ilość prążków (równą ilości obiektów) wybieramy n – grupę l – lokalizacji o najmniejszym błędzie. Estymację położenia otrzymujemy np. poprzez wyznaczenie wartości środkowej poszczególnych współrzędnych wszystkich punktów z danej n – grupy. W przypadku gdy źródło dźwięku nie jest punktowe otrzymamy grupy prążków jako obraz jednego obiektu. Ilość obiektów można oszacować na podstawie ilości grup prążków. Przy dużej ilości źródeł dźwięku o możliwości ich wyszczególnienia decydować będzie rozdzielczość zależna od częstotliwości próbkowania i długości ciągu N – próbek. Na rysunku 33 przedstawiony został mechanizm kojarzenia prążków oraz sposób eliminacji fałszywych detekcji. Dla przejrzystości przedstawiona jest sytuacja dla dwóch mikrofonów i trzech obiektów. Na rys. 34 przedstawiony został mechanizm wybierania n – grup (cztery mikrofony, trzy obiekty). 48 Korelacja - pierwszy mikrofon. 900 600 300 0 -300 -600 -900 -0.091 -0.061 -0.031 kojarzenie poszczególnych prążków ze sobą -0.001 Czas [t]=s. 0.029 0.059 0.089 0.029 0.059 0.089 Korelacja - drugi mikrofon. 900 600 300 0 -300 -600 -900 -0.091 -0.061 -0.031 -0.001 Czas [t]=s Rys. 33. Mechanizm kojarzenia ze sobą poszczególnych pików. 49 Mechanizm wybierania n - grupy. 40 30 20 SB2 Odległość [m] 10 0 SB1 SB3 -10 SB4 poszczególne n - grupy -20 -30 -40 -20 -10 0 10 20 Odległość [m] 30 40 50 60 Rys. 34. Mechanizm wybierania n – grupy (dla przejrzystości rysunku dane, detekowane piki, zostały losowo zaburzone). Oznaczenia: - ’*’ – dokładne położenie obiektu, - ’o’ – położenie wyznaczone z pojedynczej trójki, - ’x’ – błędne lokalizacje. - SB1 – SB4 – poszczególne stacje bazowe. 50 6. Opis doświadczeń z dwoma mikrofonami, rzeczywista realizacja. 6.1. Założenia pomiarowe, schemat układu. Aby praktycznie sprawdzić możliwość lokalizacji obiektu z wykorzystaniem mikrofonów należało przeprowadzić kilka doświadczeń. Ogólnie dostępne są systemy stereofoniczne. Można więc skorzystać z popularnego sprzętu audio i dokonać jednoczesnego nagrania na dwa kanały. Oczywiście przy dwóch mikrofonach można określić na podstawie opóźnień jedynie kąt pod którym znajduje się obiekt względem normalnej wystawionej w środku odcinka łączącego oba punkty rejestracji. Celem jest jednak udowodnienie iż możliwe jest w praktyce określenie opóźnienia przy pomocy funkcji korelacji dla sygnałów akustycznych. Doświadczenia zostały przeprowadzone dla dwóch różnych zestawów pomiarowych: − dwa mikrofony AKG D66SE, magnetofon Technics XC12 oraz mikser MX 12. − dwa mikrofony Shure 608N, magnetofon Technics NX800. Schematy układu pomiarowego przedstawiony został na rysunku 35. W drugim zestawie pomiarowym magnetofon wyposażony był w stereofoniczne wejście mikrofonowe. W związku z tym został pominięty mikser. Dzięki temu można było zmniejszyć szum w torze pomiarowym i porównać ze sobą wyniki obu doświadczeń. Mikrofony zostały ustawione w odległości ok. 12 m od siebie. Sygnał nagrywany był na kasetę. Następnie po zakończeniu nagrań sygnał przetwarzany był z analogowej na postać cyfrową w komputerze (komputer spełniał rolę filtru antyaliasingowego – program Cool ‘95 – oraz układów próbkującego, analizy i przetwarzania sygnałów). 51 Mikser Magnetofon Komputer Rys. 35. Schemat układu pomiarowego. 6.2. Warunki pomiarowe. Nagrania dokonywane były w dwóch różnych warunkach pomiarowych: − w okolicy oddalonej od zgiełku wielkomiejskiego i rzadko uczęszczanej (małe szumy tła). − w odległości ok. 100 m od trasy Łazienkowskiej ok. godz. 16.00 (duże szumy tła). Dla potrzeb analizy zostały przyjęte następujące parametry: − częstotliwość próbkowania f p = 11025 Hz – jej dobór został podyktowany przedziałem częstotliwości, w których zawiera się dźwięk silników samochodowych (szersze uzasadnienie w rozdziale opisującym model sygnału), − długość ciągu próbek N=1024 – ze względu na czas obserwacji: dłuższy ciąg to zbyt długi czas obserwacji; krótszy to zbyt mała selektywność prążków korelacji wzajemnej i zawężenie strefy bliskiej (szczegóły w rozdziale jw.). Przedmiotem badań (źródłem dźwięków) były poruszające się samochody osobowe. 52 6.3. Pomiary – realizacja, problemy . Już na samym początku analizy dźwięków okazało się, że układ z mikserem wnosi dużo szumu do toru pomiarowego, co przy niewielkich czułościach mikrofonów powodowało znaczne zmniejszenie stosunku sygnał – szum. Nagrania dokonane w pierwszym zestawieniu okazały się więc mało przydatne. Natomiast drugi zestaw pomiarowy (bez miksera) umożliwił uzyskanie rejestracji pozwalających na poprawną analizę. Pierwszym problemem okazały się same obiekty. Większość ludzi jeździ już niestety (niestety z punktu widzenia osoby przeprowadzającej pomiary) dobrymi zachodnimi samochodami, które poruszając się z niewielką prędkością emitują sygnał o tak niewielkim natężeniu, że jego rejestracja i obróbka są kłopotliwe (należy przypomnieć, że doświadczenia przeprowadzane były nie na specjalistycznym lecz na lepszej klasy sprzęcie domowego użytku). Najlepsze nagrania to rejestracje przejeżdżających starych Polonezów czy „Malucha” z urwanym tłumikiem. Drugi problem wyniknął już przy analizie komputerowej nagranych sygnałów. Funkcja korelacji wzajemnej okazała się zupełnie nieczytelna, nieprzydatna. Nie przypominała ani tej zamodelowanej szumem wąskopasmowym ani tej z testu nagrania z dyktafonu. Przypominała raczej funkcję zmodulowaną sygnałem sinusoidalnym o niskiej częstotliwości (rys. 36). Jasną i szybką odpowiedź przyniosła analiza widmowa. Niezależnie od nagrania największe prążki znajdowały się zawsze na najniższych częstotliwościach (patrz rys. 37). Po powiększeniu widma i dokonaniu prostych obliczeń okazało się iż są to prążki na częstotliwościach 50, 100, 150, 200 i 400 Hz czyli przydźwięk z sieci zasilającej. Efekt taki nie występował w nagraniu z dyktafonu gdyż był on zasilany bateryjnie. Należało więc zastosować filtr usuwający zakłócenia sieci z badanego sygnału. Ponieważ mamy do czynienia z obróbką blokową a nie ciągłą można było to osiągnąć poprzez zerowanie wybranych próbek w bloku. Numery te łatwo wyznaczyć znając częstotliwość próbkowania, długość ciągu próbek. Wartości te wyznaczają rozdzielczość analizy widmowej: 53 zbędny szum Rysunki 36 i 37: - funkcja korelacji wzajemnej z zawartością harmonicznych. - widmo sygnału z harmonicznymi (strzałkami zaznaczono poszczególne składowe). 54 ∆f = fp N = 11025 Hz = 10.76 Hz . 1024 stąd zerowane powinny być próbki o numerach: 4, 5, 9, 10, 14, 17, 38 oraz 1008, 987, 1011, 1015, 1016, 1020 i 1021 . Pozwoli to na usunięcie częstotliwości zakłócających z sieci bez stosowania filtrów cyfrowych wysokiego rzędu o bardzo stromych zboczach. Dodatkowo dla polepszenia stosunku S/N sygnał filtrowany był filtrem dolnoprzepustowym. Następnie usuwane było echo przy pomocy filtracji medianowej. Dopiero po zabiegach filtracyjnych funkcja korelacji wzajemnej sygnałów z dwóch kanałów przyjęła oczekiwany kształt (rysunki 38, 39 i 40). Rys. 38. Charakterystyka filtru usuwającego zakłócenia sieciowe. 55 pik przesunięcia Rys. 39 i 40: - sygnał rzeczywisty po filtracjach (porównaj z widmem sygnału nagranego na dyktafon – rys. 32, s. 43). - funkcja korelacji wzajemnej po filtracjach. 56 Przesuwając okno próbkowania blok po bloku wzdłuż sygnału udało się uzyskać wykres zmian kąta w funkcji czasu (rys. 41). Nie jest to oczywiście funkcja liniowa. Wynika to wprost z ruchu pojazdu. W czasie, gdy znajdował się daleko zmiany w opóźnieniach między mikrofonami były niewielkie. Na odcinku między mikrofonami kąt zmieniał się bardzo szybko a prążki korelacyjne były dużo bardziej rozmyte. Wraz ze zwiększaniem się odległości pojazdu od mikrofonów szybkość zmian kąta w czasie malała. W większości doświadczeń samochody nie poruszały się z prędkością większą od 30 km/h i nie miało to znaczącego wpływu na rozmycie funkcji korelacji wzajemnej. W jednym nagraniu prędkość pojazdu wynosiła ok. 50 km/h. Przy tej prędkości dało się już zauważyć wzrost liczby prążków wyznaczających jeden pojazd (rys. 42). Należy zwrócić uwagę, że rozmycie będzie największe w momencie przejazdu samochodu pomiędzy mikrofonami. Dla tego momentu czasowego również zmiany kąta jak i błąd kąta są największe (patrz rys. 41). 57 Wykres zmian kąta w funkcji czasu 80 60 40 Kąt 20 0 -20 -40 -60 -80 0 5 10 15 20 25 30 Kolejne przesunięcia 35 40 45 50 Rys. 41. Wykres zmian kąta wyznaczanego w kolejnych chwilach czasowych (kąta między normalną wystawioną na linii łączącej dwa mikrofony a prostą namiaru). strefa rozmycia prążków Rys. 42. Rozmycie prążków korelacyjnych dla dużej prędkości pojazdu lokalizowanego. 58 7. Podsumowanie. Na podstawie przeprowadzonych analiz i doświadczeń można stwierdzić, że wykonanie akustycznego, pasywnego systemu lokalizacji obiektów jest możliwe. Z przedstawionych w części teoretycznej opisów i dowodów wynika, że do estymacji położenia obiektu najbardziej uniwersalną i skuteczną jest metoda hiperboliczna wykorzystująca funkcję korelacji wzajemnej do wyznaczenia różnic czasów dojścia sygnału do poszczególnych Stacji Bazowych. Pozostałe – metoda amplitudowa i pasmowa posiadają istotne wady uniemożliwiające ich szerokie zastosowanie, mogą występować jako pomocnicze. Przeprowadzone doświadczenia praktyczne dają wyobrażenie o skali trudności estymacji położenia obiektu przy wykorzystaniu układu pasywnego oraz problemach związanych z jego realizacją, np. konieczność wszechkierunkowych, problem stosowania separacji specjalistycznych zakłóceń mikrofonów harmonicznych (min. sieciowych – 50 Hz). Przy spełnieniu wszystkich wymagań każda z opisanych metod może znaleźć zastosowanie w praktyce w zależności implementacji układu, zastosowań. 59 Bibliografia: [1] Oppenheim Alan V., Schafer Ronald W., „Cyfrowe przetwarzanie sygnałów”, Wydawnictwo Komunikacji i Łączności, Warszawa 1979. [2] „Cyfrowe przetwarzanie sygnałów – preskrypt laboratoryjny”, praca zbiorowa pod kierunkiem prof. Wojtkiewicza, Wydawnictwo Politechniki Warszawskiej, Warszawa 1995. [3] Brodziewicz Wincenty, Jaszczak Kazimierz, „Cyfrowe przetwarzanie sygnałów: wybrane zagadnienia”, Wydawnictwo Naukowo – Techniczne, Warszawa 1987. [4] Żyszkowski Zbigniew, „Podstawy Elektroakustyki”, Wydawnictwo Naukowo – Techniczne, Warszawa 1984. [5] Żyszkowski Zbigniew, „Miernictwo Akustyczne”, Wydawnictwo Naukowo – Techniczne, Warszawa 1987. [6] Berrtrand T. Fang, „Simple Solution for hyperbolic and Related Position Fixes”, 748–753, IEEE Transactions On Aerospace And Electronic Systems Vol. 26, No. 5, September 1990. [7] Muhammad Aatique, „Evaluation Of TDOA Techniques For Position Location In CDMA Systems”, Blacksburg, Virginia, September 1997. (http://www.scholar.lib.vt.edu/theses/available/etd-82597-03345) [8] E. Hepsaydir and W. Yates, „Performance Analysis Of Positioning Using Existing CDMA Networks”, IEEE Position Location And Navigation Systems, pp. 190–192, 1994. 60