podstawy morskiej nawigacji inercyjnej
Transkrypt
podstawy morskiej nawigacji inercyjnej
AKADEMIA MORSKA W SZCZECINIE Maciej Gucma Jakub Montewka PODSTAWY MORSKIEJ NAWIGACJI INERCYJNEJ q, M Szczecin 2006 0 AKADEMIA MORSKA W SZCZECINIE Maciej Gucma Jakub Montewka PODSTAWY MORSKIEJ NAWIGACJI INERCYJNEJ Szczecin 2006 1 Autorzy: Jakub Montewka: część I Maciej Gucma: część II REDAKCJA NACZELNA Redaktor naczelny prof. dr hab. inż. Bernard Wiśniewski Komitet Naukowy prof. dr hab. inż. Bernard Wiśniewski dr hab. inż. Zbigniew Matuszak, prof. AM Komitet Wydawnictw Dydaktycznych dr inż. kpt. ż.w. Jerzy Hajduk, prof. AM dr hab. inż. Ruta Leśmian-Kordas, prof. AM dr hab. inż. Jerzy Listewnik, prof. AM RECENZENT dr hab. inż. Cezary Specht, prof. AMW REDAKTOR MERYTORYCZNY dr inż. kpt. ż.w. Jerzy Hajduk, prof. AM © Copyright by Akademia Morska, Szczecin 2006 ISBN–10 83-89901-20-X ISBN–13 978-83-89901-20-0 2 Spis treści Wstęp ……………………………………………………………………….… 5 Część I Nawigacja inercyjna Spis najważniejszych symboli wykorzystanych w części I ……….………… Wprowadzenie ……………………………………………………………..… 1. Układy odniesienia w nawigacji inercyjnej ……………………….……… 1.1. Układ inercyjny ………………………………………….…...……… 1.2. Układ geograficzny …………………………………….……...…..… 1.3. Układ geocentryczny …………………………………….……..…… 1.4. Układ geodezyjny …………………………………….…..……….… 1.5. Układ związany z obiektem ………………………………...……..… 2. Transformacja wektora położenia do wybranego układu odniesienia ……. 3. Klasyfikacja układów nawigacji inercyjnej ………………………………. 3.1. Układy kardanowe …………………………………….…………..… 3.2. Układy bezkardanowe …………………………………….…..…...… 4. Systemy nawigacji inercyjnej INS – Inertial Navigation Systems ……….. 4.1. Wyznaczanie przemieszczenia obiektu w systemach nawigacji inercyjnej ………………………………………….…………………. 4.2. Określanie pozycji w systemach nawigacji inercyjnej ………………. 4.3. Ustawianie położenia początkowego ………………………………… 5. Zalety i wady układów nawigacji inercyjnej ……………………………… 9 11 13 14 15 15 15 16 16 22 22 26 27 28 30 34 36 Część II Budowa i dokładność sensorów inercyjnych Spis najważniejszych symboli wykorzystanych w części II ………………… Wprowadzenie …………………………………….………………..……… 6. Budowa żyroskopów ……………………………………………………… 6.1. Żyroskopy mechaniczne i MEMS …………………………………… 6.2. Żyroskopy piezoelektryczne (ceramiczne) ………………………….. 39 41 41 42 45 3 6.3. Żyroskopy FOG …………………………………….………………... 6.4. Żyroskopy RLG …………………………………….……………….. 7. Budowa akcelerometrów …………………………………….…………… 8. Dokładność sensorów inercyjnych …………………………………….…. 8.1. Dokładność żyroskopów ………………………..…….….…………. 8.2. Dokładność akcelerometrów …………………………….……….….. 9. Dokładność systemu INS ………………………………….……………… 9.1. Procesy stochastyczne w modelowaniu błędów INS ……………….. 9.2. Gaussowski biały szum ……………………………………………… 9.3. Losowy bias …………………………………….……………………. 9.4. Random Walk …………………………………….………………….. 9.5. Procesy Markowa …………………………………….……………… 9.6. Możliwe kombinacje procesów losowych w systemach inercyjnych .. 9.7. Analiza Fourierowska i falkowa w zastosowaniach nawigacji inercyjnej …………………………………….……………………… 10. Filtracja Kalmana …………………………………….………………….. 47 52 55 60 60 63 63 64 66 68 69 70 71 72 75 Literatura …………………………………….………………………………. 79 Spis rysunków …………………………………….…………………………. 81 4 Wstęp W nawigacji morskiej zachodzi konieczność estymacji wektora stanu, na elementy którego składają się między innymi przyspieszenie liniowe oraz prędkość kątowa badanego obiektu. Wartości te można mierzyć w sposób bezpośredni, używając wyspecjalizowanych urządzeń, takich jak akcelerometry i żyroskopy, które zwyczajowo należą do grupy urządzeń nawigacji inercyjnej. Dziedzina ta w zastosowaniach morskich, domyślnie zarezerwowana dla celów militarnych, zdobywa coraz większą popularność na gruncie użytkowników cywilnych. Przyczyną tego stanu rzeczy jest zarówno konieczność wspomagania działania systemów pozycjonowania, jak i znaczny wzrost prędkości obliczeniowej komputerów oraz opracowanie nowych, znacznie tańszych technologii wytwarzania czujników inercyjnych. Oddana do rąk czytelnika książka swoim zakresem obejmuje takie współczesne zagadnienia nawigacji inercyjnej jak: – opis teoretyczny układów odniesień mających zastosowanie w nawigacji inercyjnej, – klasyfikacja układów nawigacji inercyjnej, – ogólne zasady transformacji informacji pochodzącej z układów inercyjnych, – zasady działania i budowa żyrokompasów nawigacyjnych, – funkcjonowanie i konstrukcja akcelerometrów, – opis czynników wpływających na dokładność pracy układów inercyjnych. Zagadnienia poruszane w niniejszej publikacji stanowią jedynie wstęp do konstrukcji i funkcjonowania układów inercyjnych w zastosowaniach cywilnych. Jednym z czynników mających wpływ na powstanie tego opracowania jest brak aktualnej literatury tematu w języku polskim, pomimo tak burzliwego w ostatnich latach rozwoju opisywanej dziedziny. Nowo budowane statki wyposażane są w różnego typu układy nawigacji inercyjnej, stąd przekonanie autorów, iż w niedalekiej przyszłości znajomość funkcjonowania takich układów i systemów stanie się wymogiem. Dodatkowym elementem, jaki znalazł swoje miejsce w książce, są przykładowe ceny modułów nawigacji inercyjnej. Pomimo wyjątkowo szybkiej dezaktualizacji tego typu informacji, wydaje się, iż dla celów porównawczych umieszczenie jej jest uzasadnione. Książka zawiera zagadnienia teorii i praktyki nawigacji technicznej, a przeznaczona jest w szczególności dla: 5 – pracowników naukowych, zajmujących się problematyką nawigacji technicznej; – studentów uczelni morskich ze specjalności: nawigacja morska, połowy morskie, inżynieria ruchu morskiego, hydrografia morska; – osób zawodowo zajmujących się implementacją systemów elektronicznych na jednostkach pływających. Autorzy mają nadzieję, że użytkownik odnajdzie w publikacji poszukiwane informacje, a dobór literatury pozwoli na bezpośrednie odniesienie do źródeł. Wyrażamy jednocześnie przekonanie, że wszelkie niedoskonałości, braki oraz niespójności tego opracowania zostaną wykryte przez czytelnika, a wiedzą tą podzieli się z autorami, do czego zachęcamy. Dziękujemy Panu Profesorowi Cezaremu Spechtowi za wnikliwą recenzję i bezcenne uwagi merytoryczne, bez których powstanie tego opracowania byłoby niemożliwe. Pragniemy podziękować wszystkim, którzy w sposób bezpośredni przyczynili się do powstania tej publikacji, a w szczególności: dr Januszowi Chrzanowskiemu za wstępną recenzję, dr hab. inż. Lucjanowi Gucmie za rady merytoryczne i leksykalne, dr inż. Pawłowi Zalewskiemu za skierowanie naszej uwagi na problemy nawigacji inercyjnej, naukowcom z Wydziału Inżynierii Geomatycznej Uniwersytetu w Calgary za pomoc w zdobyciu materiałów. Autorzy Maciej Gucma Jakub Montewka ([email protected]) ([email protected]) Dedykujemy tę książkę naszym Ojcom. 6 Część I Nawigacja inercyjna 7 8 Spis najważniejszych symboli wykorzystanych w części I r Cbi cos(θxR) μx, μ y, μ z μ ωmn λ r a r F m ax, ay, az Vx, Vy, Vz x(t), y(t), z(t) dt vx, vy, vz i Δt − wektor położenia w układzie geocentrycznym; − macierz cosinusów kierunkowych (DCM), transformująca wektor położenia z układu b związanego z obiektem (indeks górny) do układu i inercyjnego (indeks dolny); − cosinus kierunkowy kąta pomiędzy osią x układu i a osią R układu b; − składowe wektora obrotu μ; − wartość kąta obrotu układu; − wektor trójelementowy prędkości kątowej obiektu w układzie geograficznym względem układu inercyjnego; − długość względem południka niebieskiego; − przyspieszenie ciała; − siła oddziałująca na ciało o masie m; − masa ciała; − przyspieszenia składowe obiektu względem osi: x, y, z; − składowe prędkości liniowej obiektu względem osi: x, y, z; − przebyta droga obiektu względem osi: x, y, z; − przedział czasu, w którym następuje rejestracja wartości przyspieszeń (granice całkowania); − składowe wektora prędkości względem osi: x, y, z; − 1, 2, 3,…, n; − przedział czasu określający częstotliwość próbkowania – Δt = ti – t0. 9 10 Wprowadzenie Podstawowym zadaniem nawigacji jest wyznaczenie pozycji geograficznej obiektu przemieszczającego się w przestrzeni trójwymiarowej (3D – ang. three dimensional), w celu bezpiecznego doprowadzenia go do punktu docelowego, z założoną dokładnością i we właściwym czasie. Zadanie to rozwiązywane jest metodami autonomicznymi przy zastosowaniu różnego rodzaju pokładowych urządzeń oraz systemów pomiarowych. Pierwszymi wykorzystywanymi do tego celu urządzeniami były kompasy magnetyczne, logi, sekstanty oraz żyrokompasy. Urządzenia te umożliwiają wyznaczenie pozycji obiektu na podstawie pomiaru natężenia pola magnetycznego Ziemi, ciśnienia przepływu wody, położenia ciał niebieskich, czy stałych charakterystycznych obiektów na lądzie. W zależności od stosowanych urządzeń, nawigację można podzielić na następujące działy: − nawigacja astronomiczna, astronawigacja – jest to nawigacja oparta na obserwacji ciał niebieskich, przy dokładnej znajomości bieżącego czasu; − nawigacja terrestryczna – jest to nawigacja morska oparta na obserwacji znaków nawigacyjnych i innych charakterystycznych obiektów znajdujących się na wybrzeżu, możliwa na odległościach do około 20 mil morskich; − nawigacja zliczeniowa – jest to przybliżone określenie pozycji statku wodnego lub powietrznego na podstawie znajomości jego ostatniej zmierzonej pozycji oraz kierunku (kursu) i szybkości ruchu; − nawigacja pilotowa – jest to lokalna nawigacja wodna z uwzględnieniem znaków nawigacyjnych znajdujących się na danym akwenie i terenach okalających go, stosowana w otoczeniu portów, na prowadzących do nich torach wodnych oraz w innych oznakowanych miejscach trudnych nawigacyjnie (cieśniny, rafy, mielizny, zatopione wraki itp.); − nawigacja radiowa, radionawigacja – jest to nawigacja oparta o sygnały radiowe wysyłane przez specjalne nadajniki; − nawigacja satelitarna, np.: GPS – jest to nawigacja na podstawie sygnałów radiowych wysyłanych przez sztuczne satelity Ziemi; − nawigacja meteorologiczna, meteonawigacja – jest to nawigacja prowadzona dowolnymi metodami, a polegająca na prowadzeniu statku szlakiem najkorzystniejszych warunków meteorologicznych; − nawigacja bezwładnościowa – inercyjna. We współczesnych systemach nawigacji satelitarnej (GNSS – z ang. Global Navigational Satellite System) rolę punktów odniesienia pełnią satelity, których położenie na orbicie w dowolnej chwili czasu uniwersalnego (UTC – ang. 11 Universal Time Coordinated) względem Ziemi jest znane oraz systematycznie monitorowane. Wszystkie systemy nawigacyjne i związane z nimi instrumenty pomiarowe umożliwiają wyznaczenie pozycji obserwowanej. W nawigacji, oprócz pozycji obserwowanej, wykorzystuje się również pojęcie pozycji zliczonej i nawigacji zliczeniowej. Nawigacją zliczeniową nazywane są metody wyznaczania pozycji obiektu w danej chwili na podstawie ostatniej pozycji obserwowanej (pozycji o znanych współrzędnych), przebytej drogi obliczanej według wskazań przyrządów pokładowych oraz znanego kąta drogi. W żegludze morskiej nawigację zliczeniową stosowano od dawna, gdy niemożliwe było wyznaczenie pozycji obserwowanej. Zadaniem układów nawigacji zliczeniowej jest wyznaczenie przemieszczenia obiektu w nawigacyjnym układzie współrzędnych. Z reguły układem tym jest układ współrzędnych geograficznych. Przykładem układów nawigacji zliczeniowej są układy nawigacji inercyjnej, w których proces zliczenia prowadzony jest z wykorzystaniem czujników pomiarowych w postaci przyspieszeniomierzy oraz żyroskopów. Przyspieszeniomierze wyznaczają wartości przyspieszeń liniowych, natomiast żyroskopy służą do wyznaczania prędkości kątowych. Przyspieszeniomierze wyznaczają wartości przyspieszeń względnych, gdyż samodzielnie nie są w stanie uwzględnić oddziaływania sił pola grawitacyjnego Ziemi. Przyspieszeniomierz zamontowany na obiekcie umieszczonym na orbicie geostacjonarnej poruszałby się razem z Ziemią, jednak wyliczone wartości przyspieszenia oraz prędkości obiektu byłyby równe zeru. Chcąc wyznaczyć przyspieszenia rzeczywiste, wielkości otrzymane z pomiaru muszą zostać skorygowane w bloku obliczeniowym układu nawigacyjnego o wartość przyspieszenia ziemskiego. Żyroskopy natomiast, w zależności od zastosowanych rozwiązań sprzętowych, wyznaczają wartości prędkości kątowych lub kąty obrotu względem danej osi. Droga, jaką przebył obiekt, może być wyznaczona na podstawie całkowania prędkości liniowej lub dwukrotnego całkowania przyspieszenia obiektu względem czasu. Kąt orientacji przestrzennej (kurs) wyznaczany jest poprzez jednokrotne całkowanie prędkości kątowych obiektu względem czasu. Metody określania pozycji za pomocą urządzeń zawierających elementy pomiarowe, wykorzystujące zasady dynamiki Newtona, czyli przyspieszeniomierzy i żyroskopów, stanowią istotę nawigacji inercyjnej (bezwładnościowej). W chwili obecnej najczęściej spotykanymi w praktyce układami nawigacji zliczeniowej są układy nawigacji inercyjnej [19], wchodzące w skład systemów nawigacji inercyjnej. Podstawowymi blokami, wchodzącymi w skład systemów nawigacji inercyjnej (INS – ang. Inertial Navigation Systems) są: 12 − blok pomiarowy (IMU – ang. Inertial Measurement Unit), składający się z czujników: przyspieszeniomierzy (dwa lub więcej – z reguły trzy czujniki) oraz żyroskopów (trzech lub więcej, z reguły stosowane są trzy), zamontowanych na wspólnej platformie; − blok obliczeniowy, składający się z komputerów nawigacyjnych, których zadaniem jest modelowanie pola grawitacyjnego Ziemi, całkowanie sygnałów wyjściowych z IMU oraz wyznaczanie i kontrolowanie pozycji obiektu. Istnieje wiele modeli układów nawigacji inercyjnej, charakteryzujących się różnym stopniem skomplikowania, przyjętymi rozwiązaniami konstrukcyjnymi czy dokładnością, a co za tym idzie również i ceną. Jednak wszystkie te układy można podzielić na dwie podstawowe kategorie: − układy kardanowe (ang. gimbaled), − układy bezkardanowe (ang. strap-down). W rozdziale tym przedstawiona zostanie ogólna zasada działania oraz budowa układów inercyjnych. Przedstawione będą także podstawowe reguły matematyczne związane z wyznaczaniem położenia oraz parametrów ruchu obiektu za pomocą układów nawigacji inercyjnej. 1. Układy odniesienia w nawigacji inercyjnej W nawigacji inercyjnej obiekt traktowany jest jako punkt materialny poruszający się w nawigacyjnym układzie współrzędnych. Aby możliwe było wyznaczenie parametrów ruchu tego obiektu, jego położenia oraz ułożenia w przestrzeni wyrażonego we współrzędnych nawigacyjnych, niezbędne jest wyznaczenie układów odniesienia. Układem odniesienia nazywany jest punkt lub układ punktów w przestrzeni, względem którego określa się położenie lub zmianę położenia (ruch) wybranego ciała. Wybrany punkt często wskazuje się poprzez wskazanie ciała, z którym związany jest układ współrzędnych. Wybór układu odniesienia jest warunkiem opisu ruchu lub spoczynku. Układ odniesienia można wybrać dowolnie, tak, by wygodnie opisać ruch. Z układem odniesienia związuje się zazwyczaj układ współrzędnych, z którym bywa czasami mylony [28]. Układem odniesienia w nawigacji inercyjnej jest trójwymiarowa przestrzeń wyznaczana przez układ trzech płaszczyzn. Wyróżnia się pięć zasadniczych układów odniesienia (ang. reference frames), z których cztery związane są z przestrzenią, a jeden z obiektem. Każdy z nich składa się z trzech płaszczyzn wzajemnie prostopadłych, prawoskrętnych, reprezentowanych przez trzy osie: x, y, z. Różnice pomiędzy układami odnoszą się do: 13 − przyjmowanego modelu kształtu Ziemi (kula lub elipsoida), − typu układu (kartezjański lub biegunowy), − miejsca, w którym znajduje się środek układu (środek Ziemi lub lokalnie). W obliczeniach nawigacyjnych, w zależności od zastosowanego systemu nawigacji inercyjnej (analityczny, półanalityczny, bezkardanowy), przyjmowane są różne układy odniesienia dobierane w taki sposób, aby w konkretnych zastosowaniach zapewnić najbardziej wygodny i właściwy opis obserwowanych parametrów. Na rysunku 1 przedstawiono wykorzystane w nawigacji układy odniesienia oraz ich wzajemne relacje. Każdy z układów reprezentowany jest przez trzy odpowiednio oznakowane osie. Rys. 1. Układ płaszczyzn odniesienia: inercyjny (x, y, z); geograficzny (xe, ye, ze); geocentryczny (xc, yc, zc); geodezyjny (N, E, D) Źródło: [6]. 1.1. Układ inercyjny Układ inercyjny opisywany jest przez trzy osie, oznaczone odpowiednio: x, y, z i oznaczany wielką literą I, od angielskiego Inertial frame. Układ ten jest podstawowym układem odniesienia z początkiem w środku Ziemi. Sam układ pozostaje nieruchomy względem przestrzeni, co oznacza, że w stosunku do gwiazd nie wykonuje ruchu obrotowego. Osie x, y leżą w płaszczyźnie równika, natomiast oś z pokrywa się z osią obrotu Ziemi. 14 1.2. Układ geograficzny Układ geograficzny opisywany jest przez trzy osie, oznaczone odpowiednio: xe, ye, ze i oznaczany wielką literą E, od angielskiego Earth frame. W układzie tym Ziemia ma kształt kuli, więc odległość obiektu znajdującego się na jej powierzchni od środka Ziemi jest stała. Osie główne układu leżą na kierunkach: północnym, wschodnim oraz wzdłuż wektora prostopadłego do powierzchni Ziemi. Układ geograficzny jest układem biegunowym, którego naturalnym środkiem jest środek Ziemi. Współrzędne obiektu wyznaczane są poprzez: − długość geograficzną − λg, − szerokość geograficzną − ϕg, − wysokość nad powierzchnią odniesienia − hg. 1.3. Układ geocentryczny Układ geocentryczny opisywany jest przez trzy osie, oznaczone odpowiednio: xc, yc, zc i oznaczany wielką literą C. Według nomenklatury anglojęzycznej określany jest mianem geocentric frame. Układ ten aproksymuje kształt Ziemi elipsoidą obrotową. Jest to układ biegunowy z początkiem w środku ciężkości Ziemi. Oś z skierowana jest wzdłuż linii łączącej obiekt ze środkiem Ziemi, oś y skierowana jest na wschód, natomiast oś x leży w płaszczyźnie południka lokalnego. Położenie obiektu określane jest przez współrzędne geocentryczne: − długość geocentryczną − λgc, − szerokość geocentryczną − ϕgc, − wektor odległości od środka Ziemi − Rgc. Ze względu na przyjęty model odwzorowania powierzchni Ziemi, odległość punktu od środka Ziemi zależy od pozycji tego punktu na elipsoidzie. 1.4. Układ geodezyjny Układ geodezyjny opisywany jest przez trzy osie, oznaczone odpowiednio: N, E, D i oznaczany wielką literą N. Według nomenklatury anglojęzycznej określany jest mianem geografic frame. Podobnie jak w przypadku układu geocentrycznego, układ geodezyjny aproksymuje kształt Ziemi elipsoidą obrotową i również jest to układ biegunowy. Układy geodezyjny i geocentryczny różnią się natomiast położeniem środka układu, gdyż środek układu geodezyjnego znajduje się na przecięciu płaszczyzny równikowej z linią prostopadłą do elipsoidy w punkcie pomiarowym. 15 Parametry określające pozycję w tym układzie to: − długość geodezyjna − λc, − szerokość geodezyjna − ϕc, − wektor odległości od środka układu − Rc. 1.5. Układ związany z obiektem Układ związany z obiektem opisywany jest przez trzy osie, oznaczone odpowiednio: R, P, Y i oznaczany wielką literą B. Według nomenklatury anglojęzycznej układ określany jest mianem Body frame. W skład tego układu wchodzą trzy płaszczyzny reprezentowane przez trzy osie obrotu obiektu: kołysanie − R (ang.: roll), kiwanie − P (ang.: pitch), myszkowanie − Y (ang.: yaw) (rys. 2). Początek układu znajduje się w środku ciężkości obiektu, układ jest kartezjański, prawoskrętny. W porównaniu z wcześniej przedstawionymi układami, ten jest odrębny, gdyż nie odnosi się do Ziemi. Trzy płaszczyzny układu związane z obiektem pozwalają jedynie na wyznaczenie położenia oraz ułożenia obiektu względem jego położenia początkowego. Wyznaczenie pozycji geograficznej w tym układzie nie jest możliwe. P R Y Rys. 2. Układ odniesienia związany z obiektem [R, P, Y] (body frame) Źródło: opracowanie własne. 2. Transformacja wektora położenia do wybranego układu odniesienia Wektor położenia obiektu w przestrzeni trójwymiarowej jest wektorem trójelementowym, a położenie punktu opisywane jest przez trzy współrzędne 16 (x, y, z). Jednak nie każdy wektor położenia umożliwia wyznaczenie pozycji geograficznej obiektu. Wektor położenia wyznaczony we współrzędnych lokalnych nie będzie zawierał informacji o pozycji geograficznej obiektu. Chcąc uzyskać taką informację należy przeprowadzić transformację wektora położenia do odpowiedniego układu odniesienia. Transformacja w układach nawigacji inercyjnej dokonywana jest w sposób ciągły przez komputer pokładowy. Algorytmy obliczeniowe oparte są przede wszystkim na rachunku macierzowym. Orientacja przestrzenna obiektu opisywana jest przez co najmniej trzy niezależne parametry. Najbardziej obrazowym opisem są kąty względnego obrotu rozpatrywanych układów współrzędnych. Jednym ze sposobów opisu orientacji obiektu w przestrzeni jest macierz C ib cosinusów kierunkowych kątów obrotu wersorów * układu współrzędnych związanego z obiektem, do układu współrzędnych nawigacyjnych. W podrozdziałach przedstawione zostaną podstawy teoretyczne związane z problemem transformacji wektora położenia oraz przyjęte oznaczenia i nomenklatura dotycząca tego zagadnienia [6, 12]. Wektor Wektory opisujące położenia obiektu, jego prędkość liniową, kątową lub inne stany obiektu, oznaczane są pogrubioną, małą literą: r – wektor położenia w układzie geocentrycznym. Macierz kolumnowa Wektor związany z danym układem odniesienia i opisywany przez współrzędne (x, y, z), można zapisać jako macierz jednokolumnową (column matrix – CM). Indeks górny macierzy (i) wskazuje na typ układu odniesienia. W tym wypadku jest to układ inercyjny: * Wersor, inaczej wektor jednostkowy – wersorem dla wektora a jest wektor a° o tym samym kierunku i zwrocie, jednak długości 1. Wersory o kierunkach i zwrotach zgodnych z osiami prostokątnego układu współrzędnych OX, OY, OZ oznacza się tradycyjnie symbolami i, j, k. 17 ⎡ rx ⎤ r = ⎢⎢ ry ⎥⎥ = {rx , ry , rz } ⎢⎣ rz ⎥⎦ i (1.1) W przypadku zapisu macierzowego wektora położenia, indeks górny, informujący o typie układu jest pomijany. Poszczególne parametry wektora posiadają natomiast indeksy dolne, nomenklaturowo związane z danym układem. W wypadku inercyjnego układu odniesienia są to indeksy x, y, z. Inny typ zapisu (współrzędne wektora ujęte w klamrę) informuje, iż wektor odnosi się do układu inercyjnego. Transformacja współrzędnych Wektor położenia obiektu w danym układzie współrzędnych, zapisany w formie macierzy kolumnowej może być transformowany do innego układu dzięki zastosowaniu macierzy cosinusów kierunkowych (direction cosine matrix – DCM). W poniższym przykładzie dokonywana jest transformacja bezpośrednia – z układu związanego z obiektem, reprezentowanego przez indeks b do układu inercyjnego – indeks i: r i = Cib r b (1.2) gdzie: C bi − macierz cosinusów kierunkowych (DCM), transformująca wektor położenia z układu b związanego z obiektem (indeks górny) do układu i inercyjnego (indeks dolny). W celu wyznaczenia pozycji geograficznej można także dokonywać transformacji wielokrotnej, przechodząc pomiędzy kilkoma układami. W przykładzie transformowany jest wektor rb do wektora ri, przechodząc kolejno z układu związanego z obiektem do układu horyzontalnego (Cnb), a następnie z układu horyzontalnego do układu inercyjnego (Cin): r i = CinCbn r b (1.3) W przypadku transformacji macierzowych istotna jest kolejność wykonywania działań, gdyż iloczyn macierzowy nie jest przemienny W niektórych przypadkach zapis w odwrotnej kolejności może spowodować, iż działania będą niewykonalne: 18 CinCbn r b ≠ CbnCin r b (1.4) Macierz cosinusów kierunkowych definiowana jest jako tablica składająca się z dziewięciu wielkości, związanych ze sobą dodatkowymi zależnościami [19]: C =C b i RPY xyz ⎡cos(θ xR ) cos(θ xP ) cos(θ xY ) ⎤ = ⎢⎢cos(θ yR ) cos(θ yP ) cos(θ yY )⎥⎥ ⎢⎣ cos(θ zR ) cos(θ zP ) cos(θ zY ) ⎥⎦ (1.5) gdzie: C bi − macierz cosinusów kierunkowych (DCM), cos(θ xR ) − cosinus kierunkowy kąta pomiędzy osią x układu i a osią R układu b. W przypadku, gdy dwa rozpatrywane układy są wzajemnie prostopadłe, zachodzi zależność: ( ) C ib = C bi T (1.6) Podstawową wadą opisu orientacji przestrzennej za pomocą macierzy cosinusów kierunkowych jest duża liczba parametrów i dodatkowych związków między nimi, co opóźnia obliczenia prowadzone w czasie rzeczywistym. Zyskującym ostatnio na popularności sposobem opisu transformacji współrzędnych w układach nawigacyjnych, umożliwiającym szybkie przeliczanie wektora stanu, jest rachunek oparty na kwaternionach, które traktowane są jako wielkości opisujące obrót układu o kąt μ. Wartości kwaternionu znajdują się zawsze w przedziale [–1, 1], co znacznie ułatwia i przyspiesza obliczenia numeryczne. Ze względu na liniowość równań, brak funkcji trygonometrycznych i stosunkowo niewielką liczbę parametrów, zastosowanie ich w algorytmach obliczeniowych otwiera nowe możliwości rozwojowe urządzeń nawigacji inercyjnej. Kwaterniony są wielkościami definiowanymi przez cztery parametry: q1, q2, q3, q4, gdzie składowe: q1, q2, q3 opisują położenie chwilowej osi obrotu układu, natomiast parametr q4 określa wartość kąta obrotu. Składowe kwaternionu są do siebie wzajemnie prostopadłe, czyli spełniają warunek ortogonalności: 19 q12 + q 22 + q32 + q 42 = 1 (1.7) Poniższe wzory prezentują podstawowe zależności między wielkością kwaterionu a położeniem układu: μx μ sin( ) 2 μ μy μ q2 = sin( ) 2 μ μ μ q3 = z sin( ) 2 μ μ q4 = cos( ) 2 q1 = (1.8) μ ⎤ ⎡ μx ⎢ μ sin( 2 ) ⎥ ⎢ ⎥ ⎡ q1 ⎤ ⎢ μ y μ ⎥ ⎢ q ⎥ ⎢ sin( ) ⎥ μ 2 ⎥ 2 qq = ⎢ ⎥ = ⎢ ⎢ q3 ⎥ ⎢ μz μ ⎥ ⎢ ⎥ ⎢ sin( ) ⎥ 2 ⎥ ⎣ q4 ⎦ ⎢ μ ⎢ μ ⎥ ⎢ cos( ) ⎥ ⎣ 2 ⎦ (1.9) μ = μx2 + μ y2 + μz2 (1.10) gdzie: μx, μy, μz − składowe wektora obrotu μ, − wartość kąta obrotu układu. μ Prędkość kątowa Prędkość kątowa jednego układu względem innego wyrażana jest w formie macierzy kolumnowej. Indeks dolny macierzy informuje o kierunku obrotu układu: ωbib = {ωR , ωP , ωY } 20 (1.11) Powyższy zapis informuje o obrocie układu związanego z obiektem (b) względem układu inercyjnego (i) wyrażonego we współrzędnych układu b. Dzięki przedstawieniu prędkości kątowych w formie wektorowej, transformacja tych wielkości pomiędzy układami odniesienia dokonywana jest analogicznie jak w przypadku wektora położenia. ωib = ωin + ωnb (1.12) Zmiana kierunku obrotu układu skutkuje zmianą znaku wektora lub zmianą kolejności indeksów tego wektora: −ωib = ωbi (1.13) Transformacja wektora prędkości kątowej Transformacja wektora prędkości kątowej pomiędzy układami współrzędnych dokonywana jest w sposób analogiczny jak w przypadku wektora położenia. W celu uproszczenia obliczeń niezbędne jest ujęcie wektora ω w formie macierzy symetrycznej. Macierz taka opisywana jest symbolem Ω , gdzie oznaczenia indeksów pozostają bez zmian: ωibb ⇒ Ωibb ⎡ ωR ⎤ ⎡ 0 ⎢ω ⎥ ⇒ ⎢ ω ⎢ P⎥ ⎢ Y ⎣⎢ ωY ⎦⎥ ⎢⎣ −ωP −ωY 0 ωR (1.14) ωP ⎤ ⎥ −ωR ⎥ 0 ⎥⎦ (1.15) Poniższa zależność przedstawia transformację wektora prędkości kątowych obiektu wyrażonego w formie macierzy s y m e t r y c z n e j , przedstawionego w układzie odniesienia związanym z obiektem ( Ω bib ) do układu inercyjnego ( Ω iib ): Ω iib = C ib Ω bib C bi (1.16) Wielkości mierzone oraz wyliczane W celu uniknięcia pomyłek związanych z nomenklaturą, należy rozróżnić parametry bezpośrednio mierzone przez urządzenie oraz wielkości podawane jako wynik końcowy. Wartości mierzone bezpośrednio przez czujniki, takie jak 21 trójelementowy wektor prędkości kątowych, względem układu związanego z obiektem, podawane jako sygnał wyjścia z trójosiowego żyrokompasu, % ibb : oznaczane są znakiem (~) np.: ω ω% ibb = {ω% R , ω% P , ω% Y } (1.17) Wielkości wyliczane przez urządzenie, na podstawie parametrów zmierzonych bezpośrednio przez czujniki oraz po uwzględnieniu problemów geometrycznych związanych z transformacją, oznaczane są symbolem (^) np.: ωˆ inn : { } & & & ωˆ inn = λˆ cos Lˆ , − Lˆ , −λˆ sin Lˆ (1.18) gdzie: − wektor trójelementowy prędkości kątowej obiektu w układzie geograficznym, względem układu inercyjnego, − długość względem południka niebieskiego, ωˆ inn λ λ& = dλ − pierwsza pochodna parametru λ względem czasu, dt L − długość geograficzna, dL L& = dt − pierwsza pochodna parametru L względem czasu. 3. Klasyfikacja układów nawigacji inercyjnej Systemy układów nawigacji inercyjnej można podzielić na dwie grupy według następującej systematyki [6, 19]: 1. Układy kardanowe: a) układy geometryczne, b) układy analityczne – system INS stabilizowany przestrzennie (ang. SSINS – Space Stabilized INS), c) układy półanalityczne – system INS stabilizowany lokalnie (ang. LLINS – Local Level INS), 2. Układy bezkardanowe – system INS związany na stałe z układem (ang. SINS – Strapdown INS). 3.1. Układy kardanowe Układy kardanowe składają się z dwóch podstawowych elementów: 22 − zewnętrznej ramki zbudowanej z trzech lub czterech pierścieni wzajemnie prostopadłych tworzących tzw. zawieszenie kardanowe; − platformy czujników umieszczonej wewnątrz ramki, na której zamontowane są trzy przyspieszeniomierze oraz trzy żyroskopy. Charakterystyka zawieszenia kardanowego umożliwia utrzymanie platformy w stałym położeniu względem wybranego układu współrzędnych, bez względu na wychylenia obiektu we wszystkich trzech płaszczyznach. W układach kardanowych platforma zmienia położenie względem płaszczyzn obiektu, gdy ten wykonuje manewr. W grupie układów kardanowych można wydzielić dwie podgrupy: − − układy stabilizowane przestrzennie, gdzie platforma zachowuje stałe położenie względem przestrzeni; układy stabilizowane lokalnie, gdzie platforma czujników utrzymywana jest w zadanej płaszczyźnie lokalnej na podstawie informacji o kątach obrotu obiektu względem przestrzeni otrzymywanych z żyros-kopów. Układy te posiadają dodatkowo pętle sprzężenia zwrotnego z serwomechanizmem, który powoduje odchylenie platformy względem zawieszenia kardanowego oraz przestrzeni o kąt obrotu zarejes-trowany przez żyroskopy, jednocześnie utrzymując platformę w płaszczyźnie lokalnej. Układy kardanowe były pierwszymi układami nawigacji inercyjnej, powstały i rozwijały się w okresie, gdy przetwarzanie sygnałów z czujnika w czasie rzeczywistym, ze względu na niewielkie możliwości obliczeniowe ówczesnych maszyn cyfrowych, nie było jeszcze możliwe. Na rysunku 3 schematycznie przedstawiono kardanowy układ nawigacji inercyjnej. Rys. 3. Kardanowy układ nawigacji inercyjnej Źródło: [6]. 23 Układy geometryczne Elementami składowymi układów geometrycznych są dwie platformy, które w czasie ruchu obiektu zmieniają położenie zarówno względem siebie, jak i względem obiektu. Na jednej z platform umieszczone są żyroskopy, na drugiej przyspieszeniomierze. Płaszczyzna żyroskopów orientowana jest względem układu równikowego (inercyjnego, przestrzennego), natomiast płaszczyzna akcelerometrów – względem lokalnego układu horyzontalnego. W układach geometrycznych, wpływ obrotu Ziemi oraz obiektu na płaszczyznę żyrokompasów i akcelerometrów jest kompensowany, dzięki czemu kąty, jakie tworzą ze sobą obie te płaszczyzny, odwzorowują szerokość oraz długość geograficzną pozycji, w której znajduje się obiekt. W układach analitycznych oraz półanalitycznych występuje tylko jedna platforma, na której umieszczone są żyroskopy oraz przyspieszeniomierze. Platforma ta zmienia swoją orientację przestrzenną względem obiektu. Układy różnią się ustawieniem platformy względem przestrzeni. Układy analityczne – układy INS stabilizowane przestrzennie Osie czujników zamontowanych w układach stabilizowanych przestrzennie pozostają przez cały czas pracy zgodne z osiami układu inercyjnego. Oznacza to, że układ (platforma z czujnikami) utrzymuje stałe położenie względem przestrzeni, niezależnie od położenia i ułożenia obiektu. Każde odchylenie obiektu od osi układu inercyjnego, wyznaczone przez czujniki, kompensowane jest poprzez odpowiednie odchylenie platformy, tak aby osie główne układu wciąż pozostawały zgodne z osiami układu przestrzennego. Zasadę działania, na której opierają się układy analityczne, przedstawiono schematycznie na rys. 4. W punkcie startowym A, układ horyzontalny (D, E) oraz układ przestrzenny (Zi, Xi) są ze sobą zbieżne, co oznacza, że ich osie pokrywają się. W trakcie przemieszczania się obiektu do punktu B, układ lokalny wykonuje obrót względem układu przestrzennego. Zmierzona przez żyroskopy zmiana położenia obiektu względem układu przestrzennego powoduje obrót platformy o wartość kąta zarejestrowaną przez żyroskopy. W ten sposób położenie układu względem przestrzeni pozostaje niezmienne. Całkowanie przyspieszeń odbywa się w odniesieniu do układu przestrzennego, a otrzymane w ten sposób dane przeliczane są następnie do lokalnego układu odniesienia. Istotną wadą systemów inercyjnych stabilizowanych przestrzennie jest fakt, iż czujniki przyspieszeń oraz żyrokompasy poddawane są działaniu zmiennego pola grawitacyjnego. 24 Zi Xi D Zi Δβ E A Zi dS Xi D Xi B E Δβ Rys. 4. System INS stabilizowany przestrzennie Źródło: [27]. Układy półanalityczne − układy INS stabilizowane lokalnie Półanalityczne układy nawigacji inercyjnej charakteryzują się tym, że platforma, na której znajdują się żyroskopy i przyspieszeniomierze utrzymywana jest w płaszczyźnie horyzontu lokalnego [19]. Oznacza to, że względem układu przestrzennego platforma pozostaje w ciągłym ruchu. Na rysunku 5 przedstawiono schematycznie zasadę działania układów stabilizowanych lokalnie. Oś skrętu żyroskopu oraz oś czułości przyspieszeniomierza leżą w płaszczyźnie rysunku. Żyroskop zachowuje stałe położenie w przestrzeni, natomiast platforma z przyspieszeniomierzami, utrzymując stałe położenie względem układu lokalnego, zostaje odchylona od położenia poziomego o kąt β. Zaburzenie takie jest równoważne przemieszczeniu układu o odległość S wzdłuż powierzchni Ziemi. Całkowanie przyspieszeń oraz obliczenia nawigacyjne realizowane są w odniesieniu do układu lokalnego. Zaletą systemów inercyjnych stabilizowanych lokalnie jest względna prostota obliczeń, nie wymagająca transformacji współrzędnych z układu przestrzennego do układu lokalnego. Wadą natomiast są błędy systemów, występujące na dużych szerokościach geograficznych, szczególnie w rejonach podbiegunowych. 25 Zi Xi D Zi a Δβ E A dS Xi D a B E Δβ Rys. 5. System INS stabilizowany lokalnie Źródło: opracowanie własne. 3.2. Układy bezkardanowe Układy bezkardanowe nawigacji inercyjnej składają się z bloku czujników, czyli trzech przyspieszeniomierzy i trzech żyroskopów, zamocowanych nieruchomo względem obiektu oraz pokładowych komputerów nawigacyjnych [12]. Układy te, w porównaniu z układami kardanowymi, charakteryzują się prostszą budową, gdyż nie zawierają żadnych elementów ruchomych, konieczne jest natomiast stosowanie większych mocy obliczeniowych, aby z odpowiednią szybkością uzyskiwać na bieżąco pełne informacje nawigacyjne. Dodatkową funkcję pełnią komputery nawigacyjne, modelujące przestrzeń trójwymiarową oraz rozwiązujące równania dotyczące ruchu platformy we wszystkich sześciu stopniach swobody, w celu transformowania położenia obiektu do układu geograficznego. W układach kardanowych transformacja dokonywana była częściowo mechanicznie dzięki zastosowaniu zawieszenia kardanowego. W układach strap-down realizowane jest to poprzez modelowanie matematyczne, większe muszą być także zakresy pomiarowe zastosowanych czujników. Jednak wraz z rozwojem technik komputerowych oraz zwiększaniem możliwości obliczeniowych maszyn cyfrowych, układy bezkardanowe stopniowo zastępują układy kardanowe. Na rysunku 6 przedstawiono schemat pojedynczego układu bezkardanowego składającego się z bloku trzech akcelerometrów i trzech żyroskopów. Osie czujników zorientowane są zgodnie z osiami położenia obiektu, na którym układ jest zainstalowany. Pomiary przyspieszeń oraz 26 kierunku dokonywane są względem układu związanego z obiektem, natomiast parametry ruchu obiektu oraz jego położenie wyliczane są na bieżąco w komputerze pokładowym, poprzez transformację parametrów do układu geograficznego. Rys. 6. Bezkardanowy układ nawigacji inercyjnej typu strap-down Źródło: [12]. W układzie można wyróżnić dwa podstawowe tory: − tor prędkości kątowych mierzonych przez żyroskopy, − tor przyspieszeń mierzonych przez przyspieszeniomierze. W chwili obecnej systemy oparte na układach kardanowych ustępują miejsca systemom, w których zainstalowano układy typu strap down. Wskazywanymi w literaturze [12, 19] zaletami tych ostatnich są: − − − − prostota budowy, brak ruchomych elementów mechanicznych, mały pobór mocy, większa odporność na przeciążenia w porównaniu z układami kardanowymi, − natychmiastowa gotowość do pracy. Wadą ich jest skomplikowany sposób oraz intensywność obliczeń numerycznych wykonywanych w czasie rzeczywistym, wymagające dużych mocy obliczeniowych. Jednak dzięki dynamicznemu rozwojowi technologii komputerowych oraz miniaturyzacji, wymagania sprzętowe nie są już przeszkodą w rozwoju tego rodzaju systemów. 4. Systemy nawigacji inercyjnej INS – Inertial Navigation Systems Metody określania pozycji za pomocą urządzeń zawierających elementy pomiarowe, wykorzystujące zasady dynamiki Newtona, czyli 27 przyspieszeniomierzy i żyroskopów, stanowią istotę nawigacji inercyjnej, zwanej także nawigacją bezwładnościową. Działanie systemów inercyjnych opiera się na drugiej zasadzie dynamiki Newtona, według której przyspieszenie ciała jest wprost proporcjonalne do oddziałującej na to ciało siły, a odwrotnie proporcjonalne do masy tego ciała [6, 17, 21]: r r F a= m (1.19) gdzie: r a − przyspieszenie ciała, r F − siła oddziałująca na ciało o masie m, m − masa ciała. W systemach nawigacji inercyjnej realizowany jest pomiar przyspieszeń oraz kątów obrotu w trzech płaszczyznach (x, y, z). Pomiar przyspieszeń dokonywany jest za pomocą urządzeń zwanych przyspieszeniomierzami (akcelerometrami), natomiast pomiaru kątów obrotu dokonują żyroskopy, zamontowane na pokładzie obiektu (statku, samolotu, samochodu). Na podstawie analizy danych pochodzących z pomiaru wartości sił oraz prędkości kątowych poruszającego się obiektu, system realizuje proces zliczenia, prowadzący do uzyskania pozycji geograficznej we współrzędnych geograficznych (ϕ, λ, h). 4.1. Wyznaczanie przemieszczenia obiektu w systemach nawigacji inercyjnej Pomiar przyspieszeń liniowych oraz kątowych obiektu dokonywany jest zazwyczaj w lokalnym układzie odniesienia, natomiast wyznaczenie pozycji obiektu wymaga transformacji składowych przemieszczenia do układu nawigacyjnego, pozwalającej wyznaczyć pozycję geograficzną. Położenie obiektu, względem układu nawigacyjnego nazywane jest orientacją przestrzenną obiektu. Na podstawie pomiaru przyspieszenia obiektu obliczane jest jego przemieszczenie, natomiast kąty orientacji przestrzennej wyznaczane po jednokrotnym scałkowaniu prędkości kątowych, pozwalają na wyznaczenie kursu obiektu. Znajomość początkowej pozycji obserwowanej pozwala natomiast na bardzo dokładne wyznaczenie pozycji zliczonej obiektu w chwili t na podstawie obliczonych wartości przemieszczenia i kąta [6, 17, 21]. 28 Na rysunku 7 przedstawiono schematycznie zasadę wyznaczania parametrów wektora przemieszczenia obiektu w układzie trzech współrzędnych (x, y, z). a) b) Rys. 7. Zasada wyznaczania wektora przemieszczenia obiektu na podstawie całkowania składowych wektora przyspieszenia: a) wypadkowy wektor przyspieszenia obiektu, b) schemat bloków całkujących przyspieszenia Źródło: [19]. Na rysunku 7 a) literą a oznaczono wypadkowy wektor przyspieszenia obiektu. Wektor ten wyliczany jest na podstawie wskazań trzech akcelerometrów, których osie umieszczone są ortogonalnie, czyli wzajemnie prostopadle. Przyspieszeniomierze rejestrują wartości przyspieszeń składowych (ax, ay, az) względem osi układu lokalnego (x, y, z). W punkcie b) przedstawiono zasadę wyznaczania prędkości obiektu oraz przebytej przez obiekt drogi poprzez całkowanie przyspieszeń składowych. Matematyczne zasady wyznaczania parametrów ruchu obiektu przedstawiają wzory 1.20 – 1.22 [6, 17]: 29 t ∫ V X (t ) = a X (t ) dt 0 t (1.20) ∫ x(t ) = V X (t )dt 0 t ∫ VY (t ) = aY (t )dt 0 t (1.21) ∫ y (t ) = VY (t )dt 0 t ∫ VZ (t ) = a Z (t )dt 0 t (1.22) ∫ z (t ) = VZ (t ) dt 0 gdzie: ax, ay, az − przyspieszenia składowe obiektu odpowiednio względem osi: x, y, z; − składowe prędkości liniowej obiektu odpowiednio Vx, Vy, Vz względem osi: x, y, z; x(t), y(t), z(t) − przebyta droga obiektu odpowiednio względem osi: x, y, z; − przedział czasu, w którym następuje rejestracja wartości dt przyspieszeń (granice całkowania). 4.2. Określanie pozycji w systemach nawigacji inercyjnej Na podstawie wskazań instrumentów pokładowych, wchodzących w skład układu nawigacji inercyjnej, otrzymywane są następujące parametry [18, 21]: − − − − − kierunek północny, wskazywany przez żyrokompas; wskazania wektorowego miernika prędkości kątowych; wskazania wektorowego miernika przyspieszeń; kierunek pionowy, wskazywany przez siłę grawitacyjną; wskazania zegara pokładowego. Na podstawie wymienionych parametrów, całkując zarejestrowane przyspieszenia, tworzony jest zbiór dyskretnych wartości składowych wektora prędkości w chwili ti: 30 v x (t i ) = v x (t 0 + iΔt ) v y (t i ) = v y (t 0 + iΔt ) (1.23) v z (t i ) = v z (t 0 + iΔt ) gdzie: v x , v y , v z − składowe wektora prędkości względem osi: x, y, z; i − 1, 2, 3,…, n; − moment wyznaczenia ostatniej pozycji obserwowanej; t0 ti Δt − moment wyznaczenia pozycji zliczonej; − przedział czasu określający częstotliwość próbkowania – Δt = t i − t 0 . Na podstawie przedstawionych powyżej dyskretnych wartości poszczególnych składowych wektora prędkości, drogą interpolacji wyznaczane są funkcje v x (t ), v y (t ), v z (t ) , ciągłe w przedziale czasowym t 0 ≤ t ≤ t i = t 0 + nΔt . Znając wartości funkcji oraz współrzędne pozycji obserwowanej, traktowane jako współrzędne początkowe (x0 , y0 , z 0 ) , można wyznaczyć współrzędne pierwszej pozycji zliczonej ( x1 , y1 , z1 ) , które są równe: t1 ∫ x1 = x0 + v x (t )dt t0 t1 ∫ y1 = y 0 + v y (t )dt (1.24) t0 t1 ∫ z1 = z 0 + v z (t )dt t0 gdzie: t1 = t0 + nΔt. Na rysunku 8 przedstawiono schemat blokowy układu kardanowego nawigacji inercyjnej. Schemat ogólnie opisuje zasadę wyznaczania pozycji obiektu w tego typu układach. Gdzie: 31 1. Czujniki pomiarowe jest to zestaw trzech przyspieszeniomierzy oraz trzech żyroskopów umieszczonych w zawieszeniu kardanowym. Dane wyjściowe z tego bloku to przyspieszenia wzdłuż trzech osi wybranego układu odniesienia. 2. Blok czujników jest bezpośrednio sprzężony z serwomechanizmem zawieszenia kardanowego, utrzymującym platformę czujników w stałym położeniu. Informacje o kątach obrotu zarejestrowanych przez żyrokompasy przekazywane są do silników korygujących, które sterują odchyleniami platformy o wartość kąta uzyskaną z żyrokompasów. Serwomechanizm zawieszenia kardanowego Czujniki pomiarowe Kompensacja błędów żyroskopów Kompensacja błędów przyspieszen iomierzy Model pola grawitacyjnego Ziemi Prędkość początkowa x’(t0) x”1 x”2 x”3 ∫ t t0 Pozycja początkowa x’(t0) x’1 x’2 x’3 ∫ t t0 x1(t) → ϕ x2(t) → λ x3(t) → h Rys. 8. Schemat blokowy układu wyznaczania pozycji w kardanowym układzie nawigacji inercyjnej Źródło: [12]. 3. Blok kompensacji błędów żyroskopów odpowiada za korektę sygnałów pochodzących z bloku czujników pomiarowych. Sygnały z żyroskopów korygowane są pod kątem wpływu ruchu obrotowego Ziemi, zmian położenia obiektu na wartości rejestrowane przez żyroskopy oraz typowych błędów żyrokompasów. 4. Blok kompensacji błędów przyspieszeniomierzy realizuje kompensacja błędów czujników oraz uwzględnienie wpływu pola grawitacyjnego Ziemi i przyspieszenia Coriollisa na wskazania czujników. 5. Model pola grawitacyjnego Ziemi to blok, który w sposób dynamiczny wyznacza wartości pola grawitacyjnego Ziemi w danej pozycji obiektu. Informacja o wartości pola jest na bieżąco przesyłana do bloku kompensacji błędów przyspieszeniomierzy. 6. W węzłach sumacyjnych następuje wyznaczanie wartości przyspieszeń skorygowanych, odnoszących się do geograficznego układu odniesienia. 32 7. Pierwszy blok całkujący przyspieszenia wylicza całki oznaczone z wartości przyspieszeń składowych względem czasu, dając w rezultacie prędkości składowe obiektu wzdłuż trzech osi układu. Podanie prędkości początkowej pozwala na wyliczenie prędkości bieżącej obiektu. 8. Drugi blok całkujący oblicza przebytą drogę na podstawie całkowania prędkości składowych względem czasu. Podanie pozycji początkowej pozwala na wyznaczenie przez układ pozycji bieżącej obiektu we współrzędnych geograficznych. Rysunek 9 przedstawia schemat blokowy układu wyznaczania pozycji dla bezkardanowego układu nawigacji inercyjnej. Najistotniejsze różnice pomiędzy blokami wyznaczania pozycji układów kardanowych a typu strap-down, wynikają z zamocowania czujników w stosunku do obiektu. W układach bezkardanowych czujniki są nieruchome względem obiektu, komputer natomiast rozwiązuje równania matematyczne opisujące ruch obiektu we wszystkich sześciu stopniach swobody, zastępując w tym zadaniu zawieszenie kardanowe. przyspieszenie względem układu związanego z obiektem przyspieszenie względem układu inercyjnego Kompensacja błędów akcelerometrów Transformacja przyspieszeń Kompensacja błędów żyroskopów Transformacja układów odniesienia Prędkość zmiany położenia obiektu Przyspieszenie całkowite Prędkości Pozycja Model pola grawitacyjnego Ziemi Położenie obiektu Rys. 9. Schemat blokowy układu wyznaczania pozycji w bezkardanowym układzie nawigacji inercyjnej Źródło: [12]. 1. Kompensacja błędów akcelerometrów to blok, który oprócz wymienionych już wcześniej błędów, dodatkowo uwzględnia błędy generowane wskutek dużych przeciążeń, jakim w układach strap-down poddawane są akcelerometry. Jednym ze źródeł błędów jest siła związana z przyspieszeniem poprzecznym względem osi czułości, oddziałująca na akcelerometry, zależna od szybkości zmiany położenia obiektu. W układach kardanowych, dzięki zastosowaniu zawieszenia kardanowego, akcelerometry były izolowane od tego rodzaju zakłóceń. 33 2. Transformacja przyspieszeń oraz transformacja układów odniesienia to bloki, które pełnią rolę analogiczną do roli bloku serwomechanizmu w układach kardanowych. W blokach tych następuje transformacja wektorów przyspieszeń oraz układów odniesienia z poziomu obiektu do wybranego poziomu lokalnego. Podobnie jak układy kardanowe, układy typu strap-down wymagają procedury inicjalizacji, czyli podania parametrów początkowych: prędkości oraz pozycji. Na przedstawionym schemacie bloki całkowania przyspieszeń domyślnie uwzględniają te procedury. 4.3. Ustawianie położenia początkowego Aby układ nawigacji zliczeniowej mógł rozpocząć pracę, wymagane jest podanie początkowych wartości parametrów nawigacyjnych. Układy nawigacji inercyjnej są pod tym względem układami specyficznymi, gdyż czujniki zamontowane są na obiekcie nie poruszającym się względem Ziemi, a na skutek jej obrotu dobowego poddawane są zmiennym warunkom pracy, przez co, pozostając nieruchome, zwracają pewną wartość przyspieszenia [6, 12, 19]. Dokładność, z jaką zostają wprowadzone parametry początkowe oraz uwzględnienie wpływu wspomnianych zmiennych warunków pracy układu, rzutuje znacząco na późniejsze wskazania całego układu. Wymagane parametry początkowe układu to: − pozycja początkowa, − prędkość początkowa, − położenie początkowe. Wartości pozycji obiektu podawane są na podstawie informacji z zewnętrznych źródeł pozycjonowania, np.: z systemów GNSS. Wartość prędkości ustawiana jest jako zerowa w momencie, gdy obiekt nie porusza się. Ustawianie położenia układu nazywane jest poziomowaniem układu. Procedura wprowadzania parametrów początkowych w układach nawigacji inercyjnej nazywana jest wstępną orientacją układu nawigacyjnego [19]. Z punktu widzenia metodologicznego, procedura ta jest taka sama zarówno dla układów kardanowych, jak i bezkardanowych. Różnica pojawia się natomiast w rozwiązaniach technicznych. W przypadku układów kardanowych, podczas orientacji wstępnej następuje odpowiednie ustawienie platformy czujników, w układach bezkardanowych położenie startowe oraz wszystkie parametry potrzebne do zliczania pozycji wyliczane są przez komputer nawigacyjny. Przed przystąpieniem do orientacji dokonywana jest kalibracja czujników pomiarowych oraz uwzględniany jest wpływ m.in.: ruchu obiektu, temperatury oraz pola magnetycznego na wskazania przyspieszeniomierzy oraz żyroskopów. W trakcie przeprowadzania procedury orientacji wstępnej należy: 34 − wykonać żyrokompasowanie układu, czyli określić kierunek północy rzeczywistej, a następnie zorientować platformę układu nawigacyjnego względem tego kierunku; − wypoziomować układ, czyli ustawić platformę w płaszczyźnie równikowej lub horyzontu lokalnego (układy kardanowe), wyznaczyć położenie osi przyspieszeniomierzy względem horyzontalnego układu współrzędnych (układy bezkardanowe). Orientacja wstępna układu kardanowego polega na ustawieniu platformy czujników w położeniu zgodnym z płaszczyzną nawigacyjnego układu współrzędnych. Dla układu geograficznego będzie to płaszczyzna horyzontu lokalnego, zorientowana w kierunku północnym. Wartości wektorów przyspieszenia ziemskiego oraz prędkości kątowej obrotu Ziemi, dla tak zorientowanego układu powinny wynosić: g = [ 0, 0, g ] ω0 = [ Ω z cos ϕ , 0, −Ω z sin ϕ ] (1.25) gdzie: składowa x − skierowana jest w stronę północy rzeczywistej, wektorów g i ω składowa y − skierowana jest wzdłuż równoleżnika lokalnego, wektorów g i ω składowa z − skierowana jest zgodnie z kierunkiem i zwrotem przyspieszenia ziemskiego. wektorów g i ω Niedokładność ustawienia platformy czujników wynika z odchylenia platformy od położenia nominalnego. Spowodowany tym błąd wskazań czujników może być skompensowany poprzez wprowadzenie macierzy obrotu P. Wskazania przyspieszeniomierzy oraz żyroskopów będą określone następującymi równaniami: a = Pg ω = Pω0 (1.26) gdzie: P − macierz obrotu wynikająca z niedokładności ustawienia platformy. 35 Powyższe równania ilustrują fakt, iż podczas orientacji wstępnej układu czujniki przyspieszenia ziemskiego oraz prędkości kątowej obrotu Ziemi doprowadzone zostają do zadanego położenia w przestrzeni. W układach bezkardanowych realizowane jest to poprzez wyliczenie, a następnie uwzględnienie w czasie pracy układu macierzy poprawek P. W układach kardanowych odchylenie, powodujące błąd wskazań czujników, korygowane jest mechanicznie poprzez odpowiednie ustawienie platformy w przestrzeni. W tym przypadku wyznaczenie macierzy poprawek nie jest konieczne [12, 19]. 5. Zalety i wady układów nawigacji inercyjnej Jako zalety układów nawigacji inercyjnej można wymienić: − całkowitą autonomiczność, czujniki pomiarowe znajdują się na obiekcie; − brak promieniowania żadnej formy energii na zewnątrz, układ nie jest wrażliwy na zakłócenia zewnętrzne; − wskazania parametrów ruchu obiektu oraz pozycji podawane są w sposób ciągły, niezależnie od miejsca położenia obiektu (m.in. w tunelach czy pod wodą); − w celu wypracowania przez układ pozycji oraz parametrów ruchu obiektu nie jest wymagana informacja ze stacji naziemnych, a obszar działania systemów nawigacji inercyjnej jest praktycznie nieograniczony; − jakość informacji nawigacyjnej jest niezależna od manewrów obiektu ruchomego; − układ nawigacji inercyjnej dostarcza informacji o pozycji, prędkości, azymucie oraz pionie, układy inercyjne są najdokładniejszymi układami określającymi azymut oraz pion ziemski na obiekcie ruchomym. Wadami układów nawigacji inercyjnej są: − spadek dokładności wyznaczenia pozycji oraz prędkości wraz z upływem czasu, nie ma tu znaczenia czy obiekt porusza się, czy nie; − układy inercyjne wymagają czasochłonnej wstępnej kalibracji polegającej na ustawieniu kierunku oraz pionu; − utrudnione jest poziomowanie układu inercyjnego na obiekcie ruchomym oraz dla szerokości geograficznych powyżej 75º [19]. 36 Część II Budowa i dokładność sensorów inercyjnych 37 38 Spis najważniejszych symboli wykorzystanych w części II t0 k − czas obiegu wiązki światła w kierunku zgodnym z kierunkiem obrotu układu; − prędkość kątowa; − prędkość światła; − promień toru; − różnica czasów obiegu obu wiązek; − powierzchnia ograniczona układem interferometru; − zmierzone przesunięcie fazy dla obu wiązek światła; − długość drogi optycznej (światłowodu); − średnica światłowodu; − długość fali; − częstotliwość rezonansowa; − prędkość fali; − odległość pomiędzy prążkami interferencyjnymi; − odchylenie kąta łamiącego w pryzmacie; − siła oddziałująca na układ; − masa pomiarowa; − wektor przyspieszenia względnego; − wektor przyspieszenia bezwzględnego; − wektor przyspieszenia grawitacyjnego Ziemi; − przyłożona siła; − siła tłumienia; − siła oddziaływania sprężyny; d 2x − przyspieszenie, czyli: ; dt 2 dx ; − prędkość, czyli dt − stała sprężyny; ωn − częstotliwość rezonansowa, czyli ξ − współczynnik tłumienia, czyli Ω c R Δt A Δφ L D λ fn ϑ np Θp F m a w g Fa Fd Fs &x& x& Sm b bg a k ; n 1 k ; c 2 m m ; − czułość mechaniczna układu, czyli k − bias; − wektor reprezentujący bias zależny od przyspieszenia ziemskiego; − składowa przyspieszenia ziemskiego; 39 sf − − − − błąd współczynnika skali; prędkość kątowa; błąd związany z szumem; funkcja ACF biasu b; E t R bb (τ ) − − − − − − − operator matematyczny wartości oczekiwanej; czas próbkowania; odstęp czasowy pomiędzy kolejnymi próbkami; odchylenie standardowe biasu; średnia wartość biasu; błąd średni kwadratowy biasu; funkcja autokorelacji biasu b; σb − odchylenie standardowe pomiarów; β1 2 − ciąg czasu korelacji dany jako: τ c1 ( τ = τ c1 przy Rbb1 (τ ) = σ b ); ω η Rbb (τ ) τ σb μb υb RW KF FT WT 40 1 e − − − − Random Walk; filtr Kalmana; transformata Fouriera; transformata falki. Wprowadzenie Sensory inercyjne mają zastosowanie w układach, w których obrotowe i liniowe zmiany położenia mierzone są bez odniesienia do zewnętrznych współrzędnych. Pomiar tych wartości odbywa się przy użyciu żyroskopów i akcelerometrów (przyspieszeniomierzy). Systemy inercyjne wykorzystywane są głównie w nawigacji lotniczej i morskiej oraz w innych zastosowaniach nawigacyjnych. W ostatnich latach, rosnące zainteresowanie systemami inercyjnymi spowodowało pojawienie się wielu nowych układów, zarówno wyspecjalizowanych jak i ogólnego przeznaczenia. Na rysunku 10 a) przedstawiono osie układu inercyjnego, zaś na rysunku 10 b) schemat budowy systemu INS po rozwinięciu na płaszczyznę. System taki w wersji podstawowej składa się z trzech żyroskopów, trzech akcelerometrów i trzech układów kontrolnych. a) b) Rys. 10. System inercyjny: a) schematyczne przedstawienie osi czułości w INS b) schemat po rozwinięciu na płaszczyznę Źródło: opracowanie własne. 6. Budowa żyroskopów Żyroskopy (żyra) mierzą prędkość obrotową w jednej (lub więcej) płaszczyźnie. Prędkość obrotowa najczęściej jest wyrażana w stopniach na sekundę (°/s) lub stopniach na godzinę (°/h). W układach inercyjnych stosuje się 41 trzy żyroskopy umieszczone ortogonalnie względem siebie, co daje trzy stopnie swobody. Urządzenia te można podzielić na trzy podstawowe grupy: − układy z wibrującym elementem VSG (ang. Vibratory Structures Gyroscopes), − układy optyczne, − inne. Do grupy żyr VSG należą żyroskopy mechaniczne, MEMS i ceramiczne. Podstawowy składnik tych żyr to element liniowo wibrujący ze znaną częstotliwością. W przypadku wystąpienia obrotu prostopadłego do wibrującego elementu, generowana jest siła Coriolisa, która przy obrocie zmienia częstotliwość rezonansową. Ta zmiana jest traktowana jako różnica kątowa. Żyroskopy MEMS wypierają z rynku żyroskopy mechaniczne. Technologia MEMS wykorzystuje najnowsze osiągnięcia mechatroniki oraz nanotechnologii w dziedzinie miniaturowych urządzeń elektronicznych. Żyra optyczne to przede wszystkim żyroskopy światłowodowe (FOG – ang. Fiber Optic Gyro) i laserowe z komorą wyładowczą (RLG – ang. Ring Laser Gyro). Istnieją także inne, bardziej specjalistyczne rozwiązania żyroskopów optycznych. Żyra optyczne nie są podatne na zakłócenia spowodowane przyspieszeniami i nie występują w nich zjawiska precesji, czy blokowania. 6.1. Żyroskopy mechaniczne i MEMS Pierwszy żyroskop został zbudowany przez Niemca G.C. Bohnenbergera w 1810 r. W 1852 roku L. Foucault wykazał, że żyroskop może wykrywać ruch obrotowy Ziemi. Żyroskop z definicji to wirująca z dużą prędkością obrotową masa, umieszczona w swobodnym zawieszeniu (zawieszenie kardana). Zasada działania żyroskopu mechanicznego jest szczegółowo przedstawiona m. in. w Podstawach układów nawigacyjnych [19] i w Global Positioning Systems, Inertial Navigation, and Integration [12] i nie będzie omawiana w niniejszej publikacji. Obecnie żyroskopy mechaniczne mogą być wykorzystywane w wielu dziedzinach nauki i techniki. Ich dokładność zależy od przewidywanego zastosowania i co za tym idzie – ceny. Przykładowo żyrokompas dwużyroskopowy, wykorzystywany w nawigacji na statkach morskich, kosztuje ok. 10 000 $ i wskazuje północ z dokładnością ok. 1°. Żyroskop użyty w zastosowaniach militarnych podający prędkość kątową z dokładnością do 0,1°/s i maksymalnej prędkości zmian kąta rzędu 500°/s, może kosztować nawet 100 000 $. Urządzenie takie wymaga specjalistycznych instalacji (elektrycznej i chłodzącej). Natomiast rozwiązanie amatorskie, przeznaczone do modeli 42 latających (produkcji Futaba) o niskiej dokładności, kosztuje ok. 150 $ i jest niewiele większe od pudełka zapałek. Do żyroskopów mechanicznych można także zaliczyć żyroskopy MEMS (ang. Microelectromechanical systems – systemy mikroelektromechaniczne). Zjawiskiem, które wykorzystywane jest do wyznaczania prędkości obrotowej w żyroskopach MEMS jest siła Coriolisa. Siła ta związana jest z przyspieszeniem, jakie musi zostać przyłożone do ciała, aby mogło utrzymać się na obracającej się powierzchni. Żyroskopy wykonane w technologii MEMS, ze względów technologicznych, wykorzystują następujące rozwiązania [5]: − układy z wibrującym strojonym elementem – kamertonem (ang. vibrating tuning fork gyro); − układy z wirującą masą (ang. vibrating-wheel gyro); − układy z rezonującą obręczą (ang. resonant wheel gyro, hemispherical resonant gyro); − układy z wahadłem Focaulta (ang. Foucault pendulum gyro). Układy z wibrującym strojonym elementem – kamertonem posiadają parę odpowiednio ukształtowanych elementów o określonej masie. Każda z dwóch części takiego elementu oscyluje z jednakowymi amplitudami, ale w przeciwnych kierunkach. Podczas obrotu takiego układu siła Coriolisa wprowadza prostopadłe wibracje na ramię kamertonu. Te wibracje można zmierzyć różnymi metodami. W większości rozwiązań takich pojedynczych układów jest wiele i są one ułożone w grupy kamertonów często zwane grzebieniami (ang. comb). Sensory wykrywające ruch kamertonu to przeważnie sensory piezoelektryczne, piezorezystywne lub pojemnościowe. Przykład struktury takiego układu wyprodukowanego w Draper Lab zaprezentowano na rysunku 11 w powiększeniu 2,500 x pod mikroskopem elektronowym. Rys. 11. Struktura żyroskopu typu wibrujący strojony element – kamerton 43 w powiększeniu pod mikroskopem elektronowym Źródło: Draper Lab za [5]. Jedną z odmian żyroskopu z wibrującym strojonym elementem – kamertonem jest żyroskop firmy BEI typu GyroChip. Składa się on z podwójnego elementu, którego jedna strona służy do wykrywania ruchu obrotowego, druga natomiast wprowadza oscylacje. Zęby części wibrującej są zasilane przez obwód oscylatora pracującego z określoną amplitudą. Zęby kamertonu, poruszając się wokół własnych osi, powodują, że wibrująca część staje się czuła na zmiany prędkości obrotowej w osi prostopadłej do zębów. Oś ta definiowana jest jako oś czułości żyroskopu. Zęby kamertonu powodują generowanie momentu obrotowego, powstającego w wyniku działania siły Coriolisa. Powstający moment powoduje wzdłużne ruchy elementów wykrywających ruch obrotowy. Ruchy te wzbudzają pole elektryczne, które następnie dostarczane jest do wzmacniacza i konwertera. Powstały impuls elektryczny jest proporcjonalny do prędkości obrotowej dzięki obróbce w demodulatorze. Żyroskop ten przedstawiono na rysunku 12. Rys. 12. Schemat układu żyroskopu BEI GyroChip Źródło: opracowanie własne na podstawie [30]. Układy z wirującą masą działają podobnie jak klasyczne żyra mechaniczne. Siła Coriolisa wpływa na wirującą masę, co może być wykryte przez np. czujniki pojemnościowe. Wskazania żyra podczas spoczynku oscylują wokół jednej wartości napięcia i w momencie obrotu układu napięcie to zwiększa się bądź zmniejsza, w zależności od kierunku obrotu. Wahadło Focaulta to hipotetyczna masa m wprawiona w ruch z prędkością postępową V i prędkością kątową Ω. Na wahadło działa siła Coriolisa Fc. Schematycznie przedstawiono to na rysunku 13. 44 Rys. 13. Powstawianie siły Coriolisa podczas ruchu wahadła Focaulta Źródło: opracowanie własne. Cały układ, składający się z czujnika (żyra), układów zasilających, przetworników analogowo-cyfrowych, czujników temperatury, jest zamknięty w pojedynczej obudowie typu SMT (ang. Surface Mount Technology). Przykładowo, dla układu ADXR firmy Analog Devices obudowa typu BGA ma wymiary 7 x 7 x 3 mm. 6.2. Żyroskopy piezoelektryczne (ceramiczne) Odmianą żyroskopów mechanicznych są żyroskopy piezoelektryczne, które podobnie jak żyra mechaniczne wykorzystują siłę Coriolisa do wyliczenia prędkości obrotowej. W typowym układzie trzy piezoelektryczne przetworniki są zamontowane na bokach stożkowatego pryzmatu – taki układ produkuje firma Murata (stosuje się także pręty ceramiczne – konstrukcja opatentowana przez firmę Nec-Tokin). Budowę pręta piezoelektrycznego przedstawiono na rysunku 14. W momencie, gdy jeden z przetworników jest pobudzany na częstotliwości rezonansowej, wibracje są przekazywane na pozostałe dwa przetworniki z równą intensywnością. W chwili, gdy pryzmat obraca się wokół jego wzdłużnej osi, wynikowa siła Coriolisa będzie wpływała na wartość wibracji dwóch pomiarowych przetworników. W efekcie powstanie różnica napięcia przyłożonego do przetworników. Różnica ta jest liniowo zależna od prędkości obrotowej układu. Przykładem takiego żyra jest Murata Gyrostar ENV-05H wykorzystywana m.in. w małych robotach i układach stabilizacji obrazu. Dokładność tego układu jest bardzo niska, błąd deklarowany przez producenta wynosi 9°/s, natomiast SF równa się 22.2 mV/°/s. Kolejne fazy wygięcia pręta ceramicznego względem położenia neutralnego (0) przedstawiono na rysunku 15. Oscylacje te odbywają się z dużą częstotliwością potrzebną do wywołania siły Coriolisa. Schemat sensora z prętem ceramicznym wraz z rozmieszczeniem elektrod pomiarowych i wzbudzającej zaprezentowano na rysunku 16. 45 Rys. 14. Pręt ceramiczny wykorzystywany w żyroskopach ceramicznych Źródło: opracowanie własne na podstawie [33]. Rys. 15. Fazy wibracji pręta ceramicznego w żyroskopie ceramicznym Źródło: opracowanie własne na podstawie [33]. Rys. 16. Schemat budowy sensora z wibrującym prętem Źródło: opracowanie własne na podstawie [33]. 46 6.3. Żyroskopy FOG Zasada działania żyr optycznych FOG i RLG opiera się na zjawisku Sagnacka odkrytym w 1911 r. polegającym na tym, że fale świetlne podążając w płaskim kanale w przeciwnych kierunkach, posiadają rożne czasy transmisji podczas obrotu sensora (rys. 17 b). Gdy sensor jest nieruchomy, czasy są jednakowe (rys 17 a). Pomiar prędkości kątowej odbywa się na zasadzie pomiaru interferencji promienia; układ elementów optoelektronicznych liczy prążki interferencyjne [5]. a) b) Rys. 2.1. Zjawisko Sagnacka w żyroskopie optycznym: Rys. 17. Zjawisko Sagnacka w żyroskopie optycznym: a) dla nieruchomego sensora Ω = 0, b) dla sensora w ruchu Ω > 0 Źródło: opracowanie własne na podstawie [5]. W przypadku obrotu układu uzyskujemy [19]: L1 = ct0 = 2πR + ΩRt0 gdzie: L1 t0 Ω c R − − − − − (2.1) droga obiegu w kierunku zgodnym z kierunkiem obrotu układu, czas obiegu w kierunku zgodnym z kierunkiem obrotu układu, prędkość kątowa, prędkość światła, promień toru. 47 Zatem: t0 = 2πR , c − ΩR natomiast dla L2: L2 = ct1 = 2πR − ΩRt1 (2.2) gdzie: L2 − droga obiegu w kierunku przeciwnym do kierunku obrotu układu, t1 − czas obiegu w kierunku przeciwnym do kierunku obrotu układu. Zatem: t1 = 2πR , c + ΩR czas obiegu obu wiązek: Δt = t0 − t1 = 2πR 2πR 4πR 2 Ω − = c − ΩR c + ΩR c2 (2.3) gdzie: Δt − różnica czasów obiegu obu wiązek. Droga natomiast wynosi: ΔL = c(t0 − t1 ) = 4πR 2 Ω = KΩ c2 (2.4) gdzie: K − stała charakteryzująca czułość konkretnego rozwiązania, związana z parametrami geometrycznymi żyroskopu. Żyroskopy typu FOG można podzielić na: − żyroskopy z otwartą pętlą światłowodu (ang. open loop interferometric FOG), − żyroskopy z zamkniętą pętlą światłowodu (ang. closed loop interferometric FOG), − żyroskopy rezonujące (ang. resonant FOG). 48 Podstawowy schemat dowolnego żyroskopu FOG przedstawiono na rysunku 18. Różnice w konstrukcji i właściwościach poszczególnych typów żyroskopów opisano poniżej. detektor Rys. 18. Uproszczony schemat żyroskopu FOG Źródło: opracowanie własne na podstawie [5]. Żyroskopy z otwartą pętlą światłowodu (oznaczone: IFOG), jako źródło światła wykorzystują diody elektroluminescencyjne dużej jasności (SLED – ang. Super Electro Luminenscent Diode). Diody powinny być jak najwyższej jakości, żeby nie wprowadzać do obwodu zbędnych szumów. Zjawisko to dodatkowo może być eliminowane specjalną konstrukcją detektora (interferometru). Przesunięcie fazy Sagnacka dla IFOG określane jest za pomocą wzoru [5]: Δφ = 2πLD λc (2.5) gdzie: Δφ − zmierzone przesunięcie fazy dla obu wiązek światła, L − długość drogi optycznej (światłowodu), D − średnica światłowodu, λ − długość fali, c − prędkość światła. Wynika z tego, że zwiększenie stabilności IFOG (a więc ustabilizowanie współczynnika scale factor) zależy od zmienności D, L i λ. Zwiększenie 49 czułości może się odbyć przez zwiększenie długości światłowodu (L). Długość pojedynczej pętli w istniejących rozwiązaniach wynosi do kilku kilometrów. Schemat żyroskopu IFOG przedstawiono na rysunku 19. Rys. 19. Schemat żyroskopu typu IFOG Źródło: [5]. Żyroskopy typu IFOG są pod względem technologicznym prostymi rozwiązaniami, posiadającymi korzystny stosunek ceny do jakości. Ich głównymi ograniczeniami są: mały zakres dynamiczny (nie nadają się do zastosowań w szybko zmieniających się środowiskach), długa droga optyczna podatna jest na odkształcenia, wpływając tym samym na dokładność. Żyroskopy z zamkniętą pętlą światłowodu posiadają dodatkowo sprzężenie zwrotne wprowadzone do elementu zmieniającego fazę. Takie sprzężnie wpływa korzystnie na dokładność żyroskopu, ale znacznie zwiększa ilość koniecznych obliczeń. Żyroskopy rezonujące FOG zostały wprowadzone jako rozwinięcie żyroskopów RLG. Wnęka rezonansowa została zastąpiona pętlą światłowodu, zakończoną złączem, przez które wysyłana jest w obu kierunkach zmodulowana fala świetlna, generowana przez diodę laserową. Gdy częstotliwość tej fali przekroczy wartość, w której obwód pętli pokrywa się z całkowitą liczbą długości fali dla tej częstotliwości, fala jest sprzęgana do pętli. Gdy cały układ się nie obraca, maksymalne sprzężnie dla fali poruszającej się w obu kierunkach objawia się jako ostry wierzchołek w wartości częstotliwości rezonansowej. Podczas obrotu fale podążające w przeciwnych kierunkach posiadają różne częstotliwości, co po demodulacji pozwala na dokładne określenie ich częstotliwości rezonansowych [1]. Rozwiązaniem żyra IFOG typu low-cost (co należy rozumieć jako korzystny stosunek ceny do możliwości) jest produkt DSP 3000 firmy KVH. DSP 3000 jest jednoosiowym żyrem interferometrycznym, posiadającym cyfrowe i analogowe wyjście. Jego wymiary to: 30 x 30 x 80 mm, masa: 300 g, 50 pobór prądu: 3W@5VDC. Dokładność takiego rozwiązania wynosi: bias 6°/h i błąd RW (szum) na poziomie 4°/h/√Hz, co pozwala na zastosowanie go w mniej wymagających aplikacjach jak np.: roboty kołowe, zdalnie sterowne pojazdy podwodne ROV (ang. remote operated vehicle), czy zintegrowane systemy GPS/INS. Wstępne próby z tym układem w Akademii Morskiej w Szczecinie potwierdzają jego przydatność do krótkookresowego pozycjonowania GPS/INS. DSP 3000 przedstawiono na rys. 20. Koszt takiego rozwiązania to ok. 3 900 USD. Rys. 20. Żyro DSP 3000 firmy KVH Źródło: [32]. Rozwiązaniem wysokiej dokładności jest produkt iNAV-FMS firmy iMAR, zawierający trzy jednoosiowe żyroskopy FOG i trzy akcelerometry. Dokładność żyroskopów wynosi 1°/h (bias) i 0,3°/h/√Hz (RW). Wymiary całego systemu to 265 x 145 x 132 mm, masa – 5500 g. Koszt całego urządzenia to ok. 65 000 euro. Urządzenie przedstawiono na rysunku 21. 51 Rys. 21. System iNAV-FMS firmy iMAR Źródło: [31]. 6.4. Żyroskopy RLG Żyroskopy laserowe RLG (schemat przedstawiony na rys. 22) są budowane jako konstrukcje z integralnym laserem gazowym, co przedstawiono na rys. 21. Wnętrze kanału światłowodowego jest wypełnione helem (albo mieszaniną helu i neonu). W żyroskopach RLG wykorzystuje się interferometry czynne (źródło światła obraca się wraz z całym układem). Aby żyroskop laserowy pracował efektywnie, konieczne jest uzyskanie fali o odpowiedniej, stałej długości, o stałym kierunku polaryzacji i stałym natężeniu. W RLG światło wytwarzane jest we wnęce rezonansowej, gdzie tworzy się fala stojąca, której częstotliwość spełnia warunki rezonansu [5]. Dostrojenie tej częstotliwości odbywa się przez zmianę długości wnęki. Wzbudzenie drgań jest najbardziej efektywne, gdy droga, którą przebywa światło stanowi całkowitą liczbę połowy długości fali: 2 L = nλn gdzie: L n λn 52 − długość drogi optycznej, − liczba naturalna, − długość fali. (2.6) Rys. 22. Schemat żyroskopu laserowego Źródło: opracowanie własne na podstawie [5]. Częstotliwości rezonansowe wynoszą: fn = gdzie: fn c c λn = nc 2L (2.7) − częstotliwość rezonansowa, − prędkość światła. Istotnym zagadnieniem staje się utrzymanie monochromatyczności wiązki, a realizuje się to poprzez zastosowanie selektywnych zwierciadeł. Pomiar realizowany jest następująco: wiązka L2 kierowana jest bezpośrednio na układ czujników, natomiast wiązka L1 dociera tam pośrednio przez pryzmat. Sytuację tę przedstawiono na rysunku 23. W punkcie skupienia tworzą się prążki interferencyjne w odległości [25]: d= gdzie: d λ εp (2.8) − odległość pomiędzy prążkami interferencyjnymi, 53 εp − rozbieżność kątowa wiązek wychodzących z pryzmatu. Rys. 23. Schemat detektora żyroskopu RLG Źródło: opracowanie własne na podstawie [23]. Parametr εp definiujemy jako [23]: ε p = 2n p Θ p (2.9) gdzie: np − odległość pomiędzy prążkami interferencyjnymi, Θp − odchylenie kąta łamiącego w pryzmacie. Podczas obrotu żyroskopu wokół osi prostopadłej do płaszczyzny drogi promieni świetlnych, prążki poruszają się z prędkością proporcjonalną do częstotliwości w miejscu interferencji. Kierunek ruchu prążków jest zgodny z kierunkiem obrotu, natomiast różnica częstotliwości, wynikająca z różnicy dróg optycznych na skutek obrotu żyroskopu wynosi [19]: f a − fb = zatem: gdzie: K 54 nc nc ΔLnc 4πR2Ω − =− 2 = = KΩ λL 2 ( L + ΔL) 2 ( L − ΔL) 2L Δf = K Ω, − współczynnik określający czułość pomiarową żyroskopu. (2.10) Przy czym: K= 4πR 2 λL (2.11) Układ czujników obrazu interferencyjnego zlicza prążki i określa kierunek i prędkość obrotu. Liczba zliczonych prążków wynosi [19]: t t t 4A N = ∫ Δfdt = Ωdt = K ∫ Ωdt λ L ∫0 0 0 (2.12) Liczba ta zależy zatem od długości fali, powierzchni drogi optycznej A oraz długości drogi optycznej i decyduje o rozdzielczości żyroskopu. Na dokładność pracy żyroskopu RLG wpływa szereg czynników m.in. długość fali świetlnej, temperatura, ciśnienie i wilgotność. Wpływ ma także stopień zjonizowania gazu wypełniającego żyroskop. Dodatkowo należy uwzględnić konstrukcję luster czy fluktuacje prądu wyładowania w kanale optycznym [5]. Jednym ze źródeł zakłóceń pracy żyroskopów RLG są termiczne i wibracyjne zmiany geometrii układu optycznego [5]. Do ich kompensacji wykorzystuje się układ detektorów pionowania zwierciadeł. Detektory sterują miniaturowym krokowym silnikiem piezoelektrycznym, regulującym położenie jednego ze zwierciadeł. Geometrycznie najkorzystniejszy układ stanowi trójkąt równoboczny posiadający największy stosunek powierzchni do obwodu. Dobór długości rezonansowej polega na takim ustawieniu luster, aby prążki przy prędkości kątowej równej zeru nie występowały. Żyroskopy RLG przeważenie są wyposażone w jedną katodę i dwie anody. Wpływa to na osłabienie efektu Fizeau – polegającego na występowaniu różnicy częstotliwości, nawet przy nieruchomym sensorze. W żyrach RLG występuje niekorzystne zjawisko zacinania się (ang. lockin), objawiające się brakiem wskazań przy małych prędkościach kątowych. Układ mimo tego, że jest zdolny do zmierzenia małej różnicy długości fali odpowiadającej niewielkiemu obrotowi, nie wykrywa zmiany kąta, gdyż prążki są zbyt szerokie dla detektora. Likwidacja zjawiska polega na obracaniu żyroskopu z dużą, znaną częstotliwością (ok. 100 Hz) o niewielki kąt, co sztucznie zwiększa prędkość kątową. Wartość zmiany kąta jest następnie odejmowana od wyniku. Do wytwarzania tych oscylacji stosuje się silniki piezoelektryczne. 55 7. Budowa akcelerometrów Akcelerometr (przyspieszeniomierz) stosowany jest do pomiaru przyspieszeń liniowych. Akcelerometr wykorzystuje drugą zasadę dynamiki Newtona. Są to zwykle konstrukcje mechaniczne, mierzące przesunięcie danej masy względem na stałe zamocowanej obudowy, a wartości pomiaru są wyrażane w jednostkach przyspieszenia ziemskiego g (1g = 9,81 m/sec2) lub mg [20]. Przykład akcelerometru zobrazowano na rys. 24. W chwili obecnej akcelerometry najczęściej wykonane są w technologii MEMS. Rys. 24. Schemat budowy akcelerometru Źródło: [12]. Najprostszym rozwiązaniem konstrukcyjnym akcelerometru jest zastosowanie wahadła o jednym stopniu swobody. Siła bezwładności powoduje odchylenie wahadła od pionu. Kąt odchylenia zależy od stosunku siły bezwładności do siły ciężkości i można przyjąć, że przy małych wychyleniach jest do niego proporcjonalny. Dodatkowo stosuje się układy tłumiące, zapobiegające nadmiernym wychyleniom. Przy wyznaczaniu wartości przyspieszenia należy uwzględnić siły bezwładności, ciężkości i tłumienia. Akcelerometry liniowe (w tym MEMS) wykorzystują odkształcenie sprężystego układu belkowego w celu przeciwdziałania sile bezwładności. Pomiar przemieszczenia najczęściej odbywa się poprzez pomiar zmiany pojemności elektrycznej kondensatora (ΔC), w wyniku wzajemnego przesunięcia się jego płyt o Δx, wywołanego przyspieszeniem w kierunku x. Takie rozwiązanie znacznie zmniejsza wielkość przyrządu. W przeciwieństwie do akcelerometrów wahadłowych, pozwala to na zwiększenie zakresu pomiarowego, a także brak czułości poza osią pomiarową. Typowy akcelerometr MEMS składa się z kilkudziesięciu warstw takich czujników. Układ pojemnościowego akcelerometru MEMS zobrazowano na rys. 25. 56 Rys. 25. Schemat akcelerometru belkowego Źródło: [12]. Czujniki przesunięcia masy pomiarowej to zwykle czujniki pojemnościowe, piezo-rezystywne, czy bardziej precyzyjne czujniki optyczne. Czujniki pojemnościowe są wystarczająco dokładne dla większości zastosowań. Optyczny czujnik przesunięcia liczy znaczniki na elemencie ruchomym (podobnie jak w mechanicznych myszkach komputerowych). Jego zaletą jest bezpośrednie wejście sygnału do układów cyfrowych. Większa dokładność wynika z braku obwodów analogowych, z natury dość wrażliwych na zakłócenia. Nowoczesne akcelerometry MEMS są chemicznie trawione w płytce krzemowej i stanowią integralną całość z czujnikami przesunięcia. Wielkość takiego układu nie przekracza wymiarów typowego układu scalonego SMD. Rysunki 26 i 27 przedstawiają 300-krotne powiększenie układu pomiarowego akcelerometru MEMS serii ADXL firmy Analog Devices. 57 Rys. 26. Powiększenie struktury akcelerometru MEMS Źródło: [31]. W nawigacji stosuje się zestawy trzech akcelerometrów o osiach czułości ustawionych prostopadle względem siebie, co daje trzy stopnie swobody. Istotne jest dokładne ustawienie kątowe układu pomiarowego. Wyznaczanie wartości przyspieszenia odbywa się na zasadzie pomiaru siły, zgodnie ze wzorem: F=m⋅a gdzie: a F m 58 − wektor przyspieszenia względnego, − siła działająca na układ, − masa pomiarowa. (2.13) Rys. 27. Widok pojedynczej grupy grzebieni akcelerometru Źródło: [31]. Przyspieszeniomierz mierzy składową przyspieszenia całkowitego, na które wpływ ma także przyspieszenie grawitacyjne. W celu uzyskania jedynie wartości przyspieszenia układu pomiarowego wynikającego z ruchu, w odczycie należy uwzględnić: a=w–g gdzie: w g (2.14) − wektor przyspieszenia bezwzględnego, − wektor przyspieszenia grawitacyjnego Ziemi. Zakładając, że masa pomiarowa umieszczona jest na sprężynie, a jej ruchy są kompensowane przez tłumik: Fa - Fd - Fs = mx&& (2.15) gdzie: Fa − przyłożona siła, Fd − siła tłumienia, Fs − siła oddziaływania sprężyny, &x& − przyspieszenie, czyli: d 2x . dt 2 59 Zatem: Fa = mx&& + wt x& + kx (2.16) gdzie: wt − współczynnik tłumienia; dx ; x& − prędkość, czyli dt k − stała sprężyny. Podstawiając: Fa = ma = mx&& + wt x& + kx , czyli: a = && x+ wt k x& + x . m m Przyjmując warunki początkowe x0 = 0 i x&0 = 0 , otrzymujemy funkcję przeniesienia Gm(s): x (s) ω n2 Gm ( s ) = = Sm 2 && x (s) s + 2ξω n s + ω n2 (2.17) gdzie: k n ωn = 1 2 ξ= c Sm = m k − częstotliwość rezonansowa, k − współczynnik tłumienia, m − czułość mechaniczna układu. Odpowiedź systemu będzie związana ze współczynnikiem tłumienia ξ. W przypadku zbyt niskiego współczynnika dojdzie do oscylacji, natomiast zbyt duża wartość może spowodować spowolnienie reakcji układu. 60 8. Dokładność sensorów inercyjnych Dokładność wskazań systemu inercyjnego ma znaczący wpływu na jego działanie, a w przypadku, gdy wymagana jest długotrwała praca z dużą precyzją, w dynamicznym środowisku, bez możliwości korekty wskazań (np. poprzez integrację z systemem GPS), koniecznym staje się zastosowanie specjalistycznych – a co za tym idzie – bardzo drogich układów. Jeżeli istnieją możliwości w miarę częstej korekty wskazań, a przeznaczenie układu nie zakłada dynamicznych zmian położenia, to możliwe staje się zastosowanie tańszych, ale mniej dokładnych czujników. Na rysunku przedstawiono elipsy błędów pozycji w przypadku utraty sygnału GPS na statku z zainstalowanym systemem INS/GPS. Rys. 28. Wpływ utraty sygnału GPS na dokładność pozycji w systemie INS/GPS Źródło: opracowanie własne. W następnych paragrafach przedstawiono podstawy oceny dokładności sensorów inercyjnych, omawiając ich główne parametry oraz podstawy modelowania błędów występujących w sensorach inercyjnych. Znajomość funkcji modelowania błędów jest niezbędna do oceny dokładności pracy systemu INS [17]. 8.1. Dokładność żyroskopów Główne parametry opisujące dokładność żyroskopów to [12, 21]: − bias (z ang. błąd systematyczny – błąd poprawności wskazań), − błąd współczynnika skali (ang. scale factor error), 61 − nieliniowość wskazań (ang. linearity error), − niedokładność kalibracji, − szum. Bias z definicji to błąd wskazań na wyjściu, niezależny od wejścia sensora, zwykle wyrażany w stopniach na godzinę (°/h), który wskazuje jak szybko będzie narastał błąd wskazań w układzie żyroskopu. Bias jest definiowany jako stała wartość, w przypadku żyroskopów jednak jest stały w krótkim czasie, ale można go modelować procesem Markowa. Może być zmierzony podczas pomiarów statycznych. Jeżeli system INS pracuje jako autonomiczny, to bias wyraża wzrost błędu pomiaru kąta w czasie. W przypadku, gdy INS jest podłączony do sensora prędkości (np. logu), to przechył wzdłużny i poprzeczny jest skompensowany, a błąd wpływa głównie na wskazania kursu. W przypadku, gdy dodatkowo podłączony jest moduł GPS, wskazania kursu również są kompensowane. Bias żyra jest głównym czynnikiem wpływającym na dokładność i przydatność systemu INS, typowa wartość w systemie dobrej klasy to 0,002-0,01°/h. Przebieg wartości zmierzonej obarczonej biasem przedstawiono na rys. 29 a). Rys. 29. Zobrazowanie błędów w sensorach inercyjnych: a) biasu, b) scale factor, c) linearity error Źródło: opracowanie własne. Należy tutaj podkreślić, iż w literaturze przedmiotu dominują dwa podstawowe ujęcia opisujące bias. Jedno z nich mówi o traktowaniu biasu jako składowej trzech czynników, w tym [12]: − deterministycznego, − losowego, − związanego z wpływem temperatury. Inne ujęcie stanowi, aby parametry związane z szumem traktować oddzielnie. W tym podejściu również istnieje pojęcie biasu liniowego (ang. bias) oraz biasu losowego (ang. random bias) [21]. Ze względu na większą czytelność zostanie zaprezentowane drugie podejście. 62 Błąd współczynnika skali to liniowa odchyłka od wartości rzeczywistej, najczęściej wyrażana jako FS (ang. full scale), czyli stosunek aktualnej wartości do zakresu, wyrażany w % lub ppm (ang. parts per million – części na milion) 100 ppm = 0,01%. Błąd ten występuje w przypadku wykonywania obrotu. Przykładowo, przy błędzie 300 ppm, całkowity błąd spowodowany tym czynnikiem, po pełnym obrocie waha się w granicach 0,1°. Przeciętna wartość dla żyr optycznych to < 10 ppm (czyli 1arcsec (0,0003°) przy obrocie o 30°). Przebieg wartości zmierzonej, obarczonej SF, przedstawiono na rys. 2.20 b). Nieliniowość zwana jest także błędem liniowości LE (ang. linearity error). Jest to odkształcenie na wyjściu w zależności od wartości. Wyrażana jest w takich samych jednostkach jak SF i często łączona z nim w jeden parametr. Przebieg wartości zmierzonej obarczonej biasem przedstawiono na rys. 2.20 c). Niedokładność kalibracji jest parametrem związanym z nieprostopadłym ustawieniem żyroskopów względem siebie. Np.: niedokładność kalibracji żyroskopu wg osi Y, rzędu 1 mrad, prowadzi do błędu wskazań przechyłu 0,036° po jednym obrocie wg tej osi. Najczęściej wyrażany w mrad. Szum wpływa na odczyt w sposób bezpośredni – im większy szum, tym większy stopień jego uwzględnienia w odczycie. Szum jest ważnym parametrem, bowiem po integracji (GPS/INS) wpływa na zachowania niedeterministyczne pomiaru – parametr RW (ang. Random Walk). Innym parametrem związanym z szumem jest bias losowy (ang. random bias), który często bywa łączony z RW. Zwykle wyrażany w °2/h lub °/h2Hz. Przeliczenie pomiędzy nimi odbywa się przez przemnożenie wartości czasu w sekundach przez 60. Błąd RW, wynoszący 0,003°2/h wskazuje, że niepewność pomiaru kąta na poziomie 1σ, spowodowany błędem RW, wynosi 0,001° po 6 minutach lub 0,0004° po 1 minucie. Parametr RW jest istotny zwłaszcza w przypadku żyr stosowanych w układach do wskazywania północy (żyrokompasy). Uogólnione równanie błędu żyroskopu przedstawia się następująco (wzdłuż osi x): ⎛ ax ⎞ (2.18) δω X = b + bg ⎜⎜ a y ⎟⎟ + s f ω x + m yω y + mzω z + η ⎜a ⎟ ⎝ z⎠ gdzie: b bg a sf ω m η − − − − − − − bias, wektor reprezentujący bias zależny od przyspieszenia ziemskiego, składowa przyspieszenia ziemskiego, błąd współczynnika skali, prędkość kątowa, przesunięcie umieszczenia sensora, błąd związany z szumem. 63 8.2. Dokładność akcelerometrów Akcelerometry podają wartość przyspieszenia odniesioną względem przyspieszenia ziemskiego wynoszącego 1g = 9,81 m/s2, w zakresie podanym przez producenta. Podobnie, jak w przypadku żyroskopów, parametry opisujące dokładność akcelerometrów to [12]: − − − − bias, błąd współczynnika skali, niedokładność kalibracji, szum. Bias wskazuje jak szybko będzie narastał błąd wskazań w układzie akcelerometru. Sama definicja biasu jest taka jak w przypadku żyr, a wartości są podawane najczęściej w μg. Typowa wartość biasu w systemie dobrej klasy to 1-5 μg (np.: iMAR iNAV-FJI-001-N), natomiast w systemie ogólnego przeznaczenia to ok. 10 mg (np.: CrossBow IMU400CC). Błąd współczynnika skali to liniowa odchyłka od wartości rzeczywistej przyspieszenia. Podobnie jak w żyroskopach wyrażana jest jako: FS (jednostki % lub ppm) lub jako μg/g2. Przeciętna wartość dla akcelerometrów dobrej klasy to ok. 20 μg/g2, czyli ok. 60 ppm (iNAV-FJI-001-N) i ok. 1% dla CrossBow. Niedokładność kalibracji jest parametrem związanym z nieprostopadłym ustawieniem akcelerometrów względem siebie. Szum oraz związany z nim parametr RW, zwykle wyrażany w mg2/h lub μg/√Hz, w systemie iNAV-FJI001-N wynosi przykładowo 8 μg/√Hz. Uogólnione równanie błędów dla akcelerometru można przedstawić następująco: δ f x = b + s f a x + m y a y + mz a z + η (2.19) 9. Dokładność systemu INS Ze względu na brak jednolitych standardów budowy systemów INS, a także często niejednoznaczne nazewnictwo, nie jest możliwe uwzględnienie wszystkich czynników wpływających na systemy INS. Przedstawiony zostanie przybliżony model błędów w systemach INS, a w szczególności systemów SINS. W przypadku platform stabilizowanych koniecznym staje się uwzględnienie metod stabilizacji i jej dokładności. Wszystkie przedstawione poniżej błędy są zależne od temperatury, do której powinny być skompensowane. Należy podkreślić, iż wpływu temperatury nigdy nie da się pominąć, dlatego wszelkie rachunki muszą go uwzględniać. 64 Odczyty z sensorów inercyjnych są także podatne na wewnątrz układowe naprężenia mechaniczne, związane z metodami konstrukcji systemów INS. Innym typem błędów są błędy związane z kwantowaniem. Na wyjściu układu pojawiają się niewielkie różnice wartości, a w przypadku zastosowania techniki cyfrowej nie mamy dostępnej nieskończonej precyzji konwersji analog/cyfra. W efekcie powstaje szum proporcjonalny do stopnia kwantowania. Modelowanie matematyczne układów SINS realizowane jest zwykle poprzez rozwiązanie równań różniczkowych pierwszego rzędu, które zawierają zarówno deterministyczne, jak i losowe błędy. Błędy te należy określić, a następnie otrzymane wartości na wyjściu systemu skorygować. W przypadku układów GPS/INS wchodzą w rachunek błędów dodatkowe błędy związane z integracją GPS/INS oraz przekłamaniami powstałymi przy interpolacji. Jako główne rodzaje błędów można wyszczególnić: − błędy inicjalizacji − związane z określeniem wstępnych parametrów pracy systemu; − błędy wyrównania – związane z wyrównaniem względem układu odniesienia; − błędy modelu grawitacji – związane z przyjętym modelem grawitacyjnym. 9.1. Procesy stochastyczne w modelowaniu błędów INS Błędy deterministyczne (bias i SF) modeluje się poprzez linearyzację równań różniczkowych. Błędy deterministyczne są określane, a następnie odejmowane od danych wyjściowych. Określenie modelu błędów stochastycznych (losowych) służy następnie do uogólnienia całkowitej odchyłki wskazań INS-u, co w rezultacie umożliwi wprowadzenie oszacowanej wartości do filtru Kalmana. Przedstawione w tym rozdziale metody modelowania błędów dotyczą głównie błędów stochastycznych, a w szczególności procesów będących pochodnymi procesów Markowa: białego szumu, losowego biasu (b), Random Walk (RW). Szczegółowe przedstawienie tych procesów czytelnik odnajdzie w literaturze [2, 7, 10, 11]. Polskimi, polecanymi pozycjami są: [9, 20]. Procesy stochastyczne, użyte do modelowania błędów, mogą być traktowane jako stacjonarne, czyli ich wielkości statystyczne są niezmienne w czasie (dla uproszczenia). Rozważając proces stacjonarny uznaje się, że może on być opisany całkowicie przez funkcję autokorelacji (ACF). Jest to związane z faktem, iż ACF dla danych losowych opisuje generalną zależność wartości w danym czasie do danych w innym momencie czasu. Dla stacjonarnych procesów losowych ACF procesu b(t) jest zdefiniowana jako wynik b(t)b(t+τ), czyli [23]: 65 ⎡ ∞ ⎤ Rbb ( τ ) =E ⎡⎣b ( t ) b ( t+τ ) ⎤⎦ = ⎢ ∑ b ( k ) b ( k+m ) ⎥ ⎣ k=-∞ ⎦ gdzie: Rbb (τ ) − − E − t − τ (2.20) funkcja ACF biasu b, operator matematyczny wartości oczekiwanej, czas próbkowania, odstęp czasowy pomiędzy kolejnymi próbkami. Rozważając sygnał dyskretyzowany w czasie, zamiast funkcji ACF można użyć sekwencji autokorelacji (ACS). W funkcji ACS czas t zastępujemy sekwencją k-tą, a odstęp τ – odstępem pomiędzy próbkami m, w efekcie otrzymujemy [23]: ⎡ ∞ ⎤ Rbb ( m ) = E ⎣⎡b ( k ) b ( k+m ) ⎦⎤ = ⎢ ∑ b ( k ) b ( k+m ) ⎥ ⎣ k =−∞ ⎦ (2.21) Wartości R bb (m) upraszczają funkcję autokorelacji pod warunkiem zapewnienia nieskończonej liczby danych. W praktyce dysponujemy skończoną populacją próbek (o liczbie N). R bb (m) zamieniane jest wtedy na Rbb(m). Dla czasowej serii pomiarów b(k), k = 1,2,3,…n ACS jest dana równaniem [20, 25]: Rbb ( m ) = E ⎡⎣b ( k ) b ( k+m ) ⎤⎦ = 1 N-m ∑ b ( k ) b ( k+m ) N-m k=-∞ (2.22) Wartość w punkcie m = 0 wynosi: 1 Rbb ( 0 ) = E ⎡⎣b 2 ( k ) ⎤⎦ = N N ∑ b ( k )=σ +μ =υ 2 2 b 2 b 2 b (2.23) k=1 gdzie: σb − odchylenie standardowe biasu, μb − średnia wartość biasu, υb − błąd średni kwadratowy biasu. Aby wyliczyć funkcję ACS biasu dla sensora SINS, koniecznym jest wyliczenie najpierw wartości błędów. W tym celu wykonuje się serię statycznych pomiarów długookresowych zakładając, że μb będzie wynosiło zero. Wtedy wartość Rbb(0) będzie wariancją biasu σ2b. Transformata Fouriera (ciągła 66 lub dyskretna) funkcji (ACF lub ACS) nazywa się widmową gęstością mocy (PSD) Sbb. Dla ciągłego sygnału przyjmuje postać [23]: Sbb ( ω ) = ∞ ∫ R (τ )e bb -jωt dτ −∞ (2.24) Sbb ( e jω ) = ∞ ∑ R (m) e m =−∞ -jωm bb Innymi słowy PSD opisuje, jak moc (w naszym przypadku wariancja) szeregu czasowego pomiarów jest rozłożona w funkcji częstotliwości. ACF i ACS są dane jako odwrócone transformaty Fouriera funkcji PSD, czyli [23]: ∞ 1 Rbb ( τ ) = Sbb ( ω ) e jωτ dω ∫ 2π −∞ (2.25) Rbb ( m ) = π 1 Sbb ( e jω ) e jωm dω ∫ 2π −π 9.2. Gaussowski biały szum Do modelowania wielu losowych sygnałów używa się procesu gaussowskiego z czasem ciągłym o zerowej wartości oczekiwanej, niezależnych wartościach i dodatniej stałej gęstości widmowej. Przymiotnik „biały” w nazwie bierze się z jednakowych udziałów energii, wnoszonych przez wszystkie składowe harmoniczne do jego całkowitej energii, co sprawia, że przypomina on białe światło [26]. W przypadku procesu stacjonarnego, szum ma wartość zero PSD Sbb = Sbb(0). ACF i ACS dla takiego procesu wynoszą odpowiednio: Rbb ( τ ) = ∞ Sbb ( 0 ) ∞ jωτ 1 jωτ S ω e dω = e dω = Sbb ( 0 ) δ ( τ ) bb ( ) 2π -∫∞ 2π -∫∞ (2.26) Rbb ( m ) = S ( 0 ) jωm 1 Sbb ( e jω ) e jωm dω = bb e dω = Sbb ( 0 ) δ ( m ) ∫ 2π - π 2π -∫π π π 67 gdzie: δ (y) − dystrybucja delta (dystrybucja delta-Diraca dla pomiaru ciągłego δ (τ) i jednostkowa funkcja impulsowa δ (m) dla danych dyskretyzowanych). ⎧ 0 dla τ ≠ 0 δ (τ ) = ⎨ ; ⎩∞ dla τ = 0 ε ∫ δ (τ )dτ = 1 dla dowolnego ε > 0 (2.27) −ε Wracając do równania (2.25) i (2.26) oraz wstawiając dystrybucję delta otrzymujemy: Rbb ( 0 ) = E ⎡⎣b 2 ( k ) ⎤⎦ = σ b2 = Sbb ( 0 ) δ ( 0 ) ⇔ Rbb ( m ) = σ b2 δ ( m ) (2.28) Zatem ACF (lub ACS) białego szumu wykazuje brak korelacji dla wszystkich wartości elementów poza elementem równym zeru, uwzględniając oczywiście funkcję delta. Proces taki jest nazywany czystym procesem losowym (ang. pure random proces). ACF i ACS dla białego szumu przedstawiono na rysunku 30. Rbb = Sbb(0)δ (0) -τ Sbb = Sbb(0) = const. τ -ω ω Rys. 30. Funkcje ACF i ACS dla białego szumu Źródło: opracowanie własne. Uwzględniając funkcję delta można stwierdzić, że wariancja procesu białego szumu jest nieskończona. Taki proces jest oczywiście jedynie koncepcją teoretyczną (nie jest realizowalny fizycznie). Pomimo tego omawiany szum może być w pewnym sensie użyteczny dla przybliżenia niektórych procesów fizycznych. Co więcej, biały szum może służyć do generowania innych procesów losowych poprzez zastosowanie układów filtracyjnych. Biały szum nie zawsze odzwierciedla prawidłowo przebieg rzeczywistego procesu, dlatego często zastępuje się go procesem Ornsteina-Uhlenbecka [10]. W rzeczywistości wyliczona wartość ACS błędów sensora SINS (po usunięciu deterministycznego biasu) nie odzwierciedla dyskretnego białego 68 szumu procesu. Składowe losowe błędów systemu mogą być modelowane poprzez przepuszczenie szumu w t o średniej μb = 0 poprzez odpowiedni filtr kształtujący (liniowy system dynamiczny), żeby uzyskać na wyjściu skorelowany czasowo szum. Ta operacja zmieni korelację charakterystyk wejścia sensora, aby dopasować właściwą składową błędu sensora. Wartości parametrów filtracji są optymalnie dobierane poprzez minimalizację różnic pomiędzy wyjściem filtru a właściwą sekwencją szumu na wyjściu z sensora inercyjnego w rozumieniu metody najmniejszych kwadratów. Na rysunku 31 przedstawiono przykładowy filtr formujący. w(t) b(t) Rys. 31. Filtr formujący stosowany w modelowaniu szumu Źródło: opracowanie własne. 9.3. Losowy bias Losowy bias to nieprzewidywalna wielkość losowa ze stałą wartością oczekiwaną. Przy założeniu db , błąd wywołany biasem jest b&(t ) = dt zdefiniowany przez równanie: b& ( t ) = 0 (2.29) Dyskretna postać tego równania: bk +1 = bk . Prawdziwe zatem jest: Rbb =E ⎡⎣bk2 ⎤⎦ =Rbb ( 0 ) = const. (2.30) 69 Zatem bias jest specjalnym przypadkiem filtracji przy założeniu losowych warunków początkowych [26]. 9.4. Random Walk Proces Random Walk (RW) należy do grupy procesów Wienera, posiadających własności Markowa i jest szczególnym przypadkiem procesu dyfuzji. Proces RW może być opisany jako suma procesów białego szumu. Analizując proces RW, różnica (bk+1 – bk) jest losową sekwencją wk czyli: bk+1 = bk + wk b& ( t ) = w ( t ) . Zatem dla licznej próby statystycznej: k bk+1 = ∑ wi (2.31) i=1 Z równania 2.31 wynika, że RW jest procesem generowanym poprzez integrację (całkowanie) nieskorelowanych sekwencji. Nazwa Random Walk (z ang. Losowy Chód) wzięła się z analogii do człowieka stawiającego kroki o jednakowej długości, ale w rożnych kierunkach. Wartość średnia μb procesu RW jest dana zależnością [25]: ⎡ k ⎤ k μb = E [bk+1 ] = E ⎢ ∑ wi ⎥ = ∑ E [ wi ] = μw= 0 ⎣ i=1 ⎦ i=1 (2.32) Wariancja σ2b dla nieskorelowanych sekwencji wi może być wyliczona: 2 k ⎡ k ⎤ σ = E ⎡⎣b ⎤⎦ - μ = E ⎡⎣b ⎤⎦ = E ⎢ ∑ wi ⎥ = ∑ E ⎡⎣ wi2 ⎤⎦ = kσ w2 i=1 ⎣ i=1 ⎦ 2 b 2 k+1 2 b 2 k+1 (2.33) Proces RW nie jest zatem procesem stacjonarnym (jego wariancja zmienia się w zależności od liczby sampli) i co za tym idzie, ACS nie definiuje nam tego procesu. Należy jednak pamiętać, że różnica (bk+1 – bk) jest stacjonarna [8]. Proces RW może być uważany za stacjonarny dla małych przedziałów czasu, co ma duże znaczenie praktyczne. 70 9.5. Procesy Markowa Niektóre źródła szumów są skorelowane w czasie, ich bieżąca wartość zależy od wartości poprzednich. Do modelowania tego typu zachowań stosuje się losowe procesy Markowa (GM). Procesy GM są stacjonarnymi procesami, posiadającymi wykładniczą funkcję autokorelacji i są one wyjątkowo użyteczne dla inżynierów ze względu na możliwość opisu wielu przypadkowych procesów na odpowiednim poziomie aproksymacji [9]. Większość systemów inercyjnych może być opisana funkcją autokorelacji procesu GM pierwszego rzędu [27]: Rbb1 ( τ ) = σ b2 e-β1 τ gdzie: (2.34) Rbb ( τ ) − funkcja autokorelacji biasu b, − odchylenie standardowe pomiarów, σb ⎛ − ciąg czasu korelacji dany jako: τc1 ⎜ τ = τc1 β1 ⎝ przy 1 ⎞ Rbb1 ( τ ) = σb2 ⎟ . e ⎠ Funkcję autokorelacji tego typu przedstawiono na rys. 32. Filtr kształtujący jest układem zamkniętym pierwszego rzędu, co widać na rys. 33. Jak pokazano na rysunku 32, korelacja pomiędzy danymi z procesu pierwszego rzędu spada wraz ze wzrostem odstępu czasowego pomiędzy próbkami danych. Jest to spadek do 0 w ∞. Procesy pierwszego rzędu GM są często stosowane do opisu błędów w systemach inercyjnych ze względu na prostotę aparatu matematycznego i w miarę dobre przybliżenia rzeczywistości. σ b2 e − β τ 1 σ b2 1 2 σb e -τ − 1 β1 = −τ c1 1 β1 τ = τ c1 Rys. 32. Funkcja autokorelacji pierwszego rzędu Źródło: [27]. 71 Używając modelu GM pierwszego rzędu można opisać bias jako równanie różniczkowe [27]: b& ( t ) = - β1b ( t ) + 2 β1σ b2 w ( t ) (2.35) b(0) w(t) ∫ b(t) β1 Rys. 33. Układ filtrujący pierwszego rzędu Źródło: [27]. 9.6. Możliwe kombinacje procesów losowych w systemach inercyjnych Procesy losowe i błędy z nimi związane mogą być przedstawione jako kombinacja dwóch lub więcej procesów. Przykładowo, losowy bias i RW mogą być przedstawione jako jeden proces losowy wyrażony za pomocą zmiennej. Kombinacje tych procesów dobiera się na podstawie specyfikacji badań, jakie mają być przeprowadzone w przypadku konkretnego systemu inercyjnego. Należy podkreślić, iż obróbka danych przedstawionymi metodami wymaga wcześniejszego ich przygotowania. Dane pochodzące z systemów inercyjnych charakteryzują się wysokim poziomem szumów pomiarowych. Stosuje się różne metody usuwania tych zakłóceń m.in. analizę Fouriera i funkcje falki. Do modelowania zjawisk rządzących prawami systemów inercyjnych wykorzystuje się równania różniczkowe losowe. Niestety, w przypadku dynamicznych procesów losowych typowe metody rozwiązywania zwykłych równań różniczkowych zwykle zawodzą. Wprowadza się stochastyczne równania różniczkowe, jednak rozwiązania tego typu układów często są jedynie przybliżone (np.: proces Wienera nie jest różniczkowalny w całej swojej dziedzinie, co więcej nie jest nawet średniokwadratowo różniczkowalny). Stosuje się wtedy teorię dystrybucji (powstaje gaussowski biały szum) lub zamianę na równanie całkowe (najczęściej są to całki Ito lub Stratonowicza) [9]. 72 Modelowanie błędów systemu inercyjnego jest dość skomplikowanym zadaniem ze względu na losowy charakter tych błędów. Obecnie wprowadza się techniki pozwalające na szybką analizę błędów (np.: funkcje autoregresji), jednak formalizm matematyczny tych rozwiązań znacznie wykracza poza ramy tego opracowania. 9.7. Analiza Fourierowska i falkowa w zastosowaniach nawigacji inercyjnej Analiza falkowa, w przeciwieństwie do analizy Fourierowskiej, używa funkcji aproksymujących, które są zlokalizowane zarówno w dziedzinie czasu, jak i częstotliwości. Właśnie z tego powodu falki są bardzo przydatne do aproksymowania funkcji (obróbki sygnałów) z ostrymi pikami oraz nieciągłościami [4]. Falki są matematycznymi funkcjami, które dzielą dane wejściowe na składniki różnej częstotliwości, a potem analizują każdy element z dokładnością odpowiadającą skali próbki. Daje to bardzo dobre możliwości poznania natury sygnału. Klasyczne podejście do analizy częstotliwości przewiduje stosowanie wzorów Fouriera. Wykazano, że każda funkcja może być przedstawiona jako szereg funkcji okresowych: ∞ a0 + ∑ ( ak cos ( kx ) + bk sin ( kx ) ) (2.36) k =1 Współczynniki a0, ak, bk wyznaczane są w następujący sposób: 1 2π a0 = ak = bk = 1 π 1 π 2π ∫ f ( x) dx 0 2π ∫ f ( x ) cos ( kx ) dx (2.37) 0 2π ∫ f ( x ) sin ( kx ) dx 0 73 Transformaty Fouriera (FT – ang. Fourier Transforms) Pod ogólnym pojęciem transformat Fouriera rozumie się funkcje do analizowania częstotliwości sygnału w pewnym przedziale czasu. Transformata ogólnie polega na zmianie funkcji z zależności od czasu na funkcję zależną od częstotliwości. Taki sygnał może być analizowany ze względu na swoją częstotliwość, gdyż współczynniki Fouriera reprezentują wkład każdej funkcji sinus i cosinus do poszczególnych częstotliwości [11]. Ważona (okienkowa) transformata Fouriera (WFT – ang. Windowed Fourier Transforms) może być zastosowana w przypadku, gdy analizowana funkcja nie jest okresowa, a złożenie funkcji okresowych nie odwzoruje jej dokładnie. Możemy jednak tak rozłożyć sygnał, aby jego poszczególne części były funkcjami okresowymi. WFT daje informacje jednocześnie o dziedzinie czasu i częstotliwości. WFT sygnał wejściowy dzieli na przedziały, a każdy z nich jest oddzielnie analizowany ze względu na częstotliwość. Jeżeli sygnał posiada ostre przejścia, to podział jest tak dopasowany, aby w miejscu tego przejścia znalazł się koniec przedziału. Procedura przywiązuje większą wagę do punktów ze środka przedziału, a nie z okolic końców. Dyskretna transformata Fouriera (DFT – ang. Discrete Fourier Transforms) szacuje transformatę Fouriera na podstawie skończonej ilości punktów, które odwzorowują zachowanie się całej funkcji. Zastosowanie komputerów oraz obliczeń w czasie rzeczywistym wymaga stosowania przekształceń numerycznych. Wykorzystuje się tu algorytm podany przez J. Tuckeya i J. Cooleya, obliczający DFT, oparty na symetrii funkcji harmonicznych, nazwany szybką transformatą Fouriera (FFT – ang. Fast Fourier Transforms). Aproksymacja funkcji seriami pojedynczych pomiarów wymaga zastosowania w obliczeniach macierzy rzędu n (ilość użytych punktów). Mnożenie macierzy n × n wymaga wykonania operacji n2, co przy dużej ilości pomiarów punktowych, np.: w przypadku sygnałów pochodzących z czujników inercyjnych, staje się problematyczne ze względu na skończoną moc obliczeniową komputera. Jeżeli punkty rozłożone są w jednolity sposób, wtedy macierz n × n może zostać podzielona na kilka macierzy rzadkich, a ilość wykonywanych operacji arytmetycznych wynosi wtedy n logn. Analiza falki (ang. wavelet) w odróżnieniu od analizy fourierowskiej nie wyraża badanych funkcji poprzez wielomiany, ale poprzez funkcje, które są tworzone ze stałej funkcji zwanej falką bazową, poddawanej wielokrotnym przekształceniom [4]. Funkcje te można odnosić zarówno do czasu, jak i do częstotliwości, dopuszczając związki pomiędzy funkcją reprezentowaną a jej współczynnikami. Dzięki temu uzyskano większą stabilność numeryczną w procesie odtwarzania badanej funkcji. Z praktycznego punktu widzenia, celem analizy falki jest znalezienie funkcji bazowych i sposobów ich uzyskania z użyciem metod numerycznych. 74 Dowiedziono, że każda funkcja dająca się aproksymować szybką transformatą Fouriera, może zostać przedstawiona za pomocą falek, zawierając przy tym więcej informacji przestrzennej jak i częstotliwościowej niż FFT [11]. Analiza falek jest z tego względu doskonałym narzędziem w analizie przebiegów niestacjonarnych, np.: białego szumu. Przyjmując założenie, że funkcja f(x) jest określona w całej dziedzinie liczb rzeczywistych, można przedstawić funkcję jako sumę: f = ∑ ak Fk (2.38) k przyjmując za ak pewne współczynniki liczbowe, zaś Fk traktując jako rodzinę prostych funkcji. Istotne jest także, aby już skończona suma przybliżała w miarę dobrze funkcję wyjściową. Funkcja wejściowa f(x) może być zapisem kołysań statku, wykresem EKG, czy zapisem dźwięku. Rozwiązanie tego problemu sprowadza się do: − wyznaczenia współczynnika ak; − wyznaczenia skończonej sumy, poziomie. przybliżającej Dodatkowo koniecznym staje się wprowadzenie ortonormalnego funkcji F(k), spełniającego warunek: ⎧0, gdy k ≠ l ∫ F ( x )F ( x ) dx = ⎨⎩1, gdy k = l k l na odpowiednim pojęcia układu (2.39) Falką nazywamy taką funkcję Φ, której układ funkcji Φj,k zdefiniowany jako: Φ j ,k ( x ) = 2 j 2 Φ ( 2 j x − k ) (2.40) gdzie: k, j, l – należą do układu liczb całkowitych, jest układem ortonormalnym i zupełnym. Funkcje te dążą do zera dla argumentu dążącego do nieskończoności, a ich suma ważona umożliwia przedstawienie z dowolną dokładnością dowolnej funkcji ciągłej (podobnie jak funkcje cosinus (transformata Fouriera) o różnych okresach umożliwiają przedstawienie każdej funkcji okresowej). 75 Jako najprostszą falkę przyjmuje się falkę Haara, skonstruowaną ok. 1890 r., zdefiniowaną jako [4]: 1 ⎧ 0≤ x< ⎪ 1 dla 2 ⎪ ⎪ ⎪ h j ,k ( x ) = ⎨ 1 ≤ x <1 ⎪ −1 dla 2 ⎪ ⎪ ⎪⎩ 0 w przypadkach w pozostałych pozostalych przypadkach (2.41) Z definicji wynika, że funkcja hj,k (x) jest zerem poza odcinkiem [2-jk, 2 (k + 1)], czyli współczynnik aj,k przyjmie taką wartość jak funkcja na tym odcinku. Zarówno funkcja aj,k, hj,k, jak i jej skończona suma w przypadku falki Haara jest nieciągła. Falki, które powstały w latach 80 i 90 ubiegłego stulecia były już ciągłe i miały pochodne. Dziedzina ta jednak wciąż dynamicznie się rozwija ze względu na duże możliwości praktycznego zastosowania. Podobnie jak w przypadku analizy Fourierowskiej, skonstruowano dyskretną transformatę falki (DWT – ang. Discrete Wavelet Transform) oraz szybką transformatę falki (FWT – ang. Fast Wavelet Transform). Macierz DWT nie jest w ogólności macierzą rzadką. Dzieli się ją w celu uzyskania kilku macierzy rzadkich, wykorzystując do tego celu własności samopodobieństwa. Algorytm taki wymaga wykonania n operacji do przekształcenia n wymiarowego wektora. Jego nazwa pochodzi od nazwisk twórców: DWT Mallata i Daubechies [4]. Transformaty falkowe są także składnikiem bardziej uniwersalnych pakietów falkowych (ang. wavelet packets), czyli kombinacji kilku funkcji falki. Tworzą one bazę zachowującą parametry ortogonalności i właściwości lokalizacji bazowej funkcji falkowej. Rekurencyjny algorytm wylicza odpowiednie współczynniki w liniowej kombinacji. Każdy wyliczony współczynnik pakietu falkowego zapamiętuje jako jedną z gałęzi swojego drzewa analitycznego [4]. Analiza falki, jak i transformaty Fouriera, zostały zaimplementowane m.in. w pakiecie inżynierskim MATLAB. Praktyczne zastosowanie tego pakietu jest ogromne, a jego przedstawienie wychodzi poza ramy tej publikacji. Omówiony zostanie jednak w kolejnej publikacji dotyczącej zastosowań inercyjnych. -j 10. Filtracja Kalmana 76 Filtracja Kalmana jest podstawową techniką analizy danych pochodzących z czujników inercyjnych. Sam problem został opisany przez Węgra, Rudolfa Kalmana, który w 1960 r. opisał rekurencyjne rozwiązanie problemu dyskretnej filtracji liniowej [14]. Zakładając dany poziom błędu, rozwiązanie sprowadzało się do oszacowania chwilowego wektora stanu układu dynamicznego. Zakłócenia w układzie są traktowane jako biały szum. Ponieważ filtr Kalmana ma wiele zastosowań praktycznych, stał się on przedmiotem szeroko zakrojonych badań, a od momentu pierwszej publikacji wprowadzono do podstawowego algorytmu wiele zmian. Bazując na samym założeniu filtracji Kalmana powstało wiele pokrewnych narzędzi do analizy dynamicznych danych. Estymacja procesu W ujęciu ogólnym, filtracja Kalmana sprowadza się do estymacji stanu x ∈ ℜn, jako zdyskretyzowanego czasowego procesu przybliżonego przez równanie [18]: xk = Axk −1 + Buk + wk −1 (2.42) z pomiarem z ∈ ℜn opisanym: zk = Hxk + vk (2.43) gdzie: xk − wartość dyskretna wektora stanu, A − macierz systemowa (przejścia), B − macierz wyjściowa. Zmienne losowe vk i wk reprezentują odpowiednio szum pomiarowy i szum procesu. Zmienne te są niezależne, czysto losowe oraz posiadają normalny rozkład prawdopodobieństwa o wartości oczekiwanej zero i odchyleniu standardowym R i Q: p(v) ~ N (0, R) p(w) ~ N (0, Q) W implementacjach praktycznych, macierz reprezentująca kowariancję szumu pomiarowego R oraz macierz reprezentująca kowariancję szumu procesu Q, mogą ulegać zmianie przy zmianie kroku czasowego, jakkolwiek dla uproszczenia można założyć, że są stałe. 77 Macierz A o wymiarach n × n wiąże stan układu z poprzedniego kroku k – 1 z krokiem k. Macierz ta może ulegać zmianie przy zmianie kroku czasowego, jakkolwiek dla uproszczenia można założyć, że jest stała. Macierz B o wymiarach n × l wiąże parametr u ∈ ℜ wejścia stanu. Macierz H o wymiarach m × n, to macierz, wiążąca stan z pomiarem zk. Definiując xˆk− ∈ℜn jako estymatę stanu a priori w chwili k (wiedzę o procesie przed tym momentem), natomiast xˆk ∈ ℜn jako estymatę a posteriori stanu w chwili k (informacja na podstawie pomiaru zk), estymaty błędu a priori i a posterpriori możemy zapisać jako: e −k ≡ kk − xˆk− (2.44) ek ≡ xk − xˆk Odpowiadające im macierze kowariancji są następujące: Pk− = E ⎡⎣e −k e −k T ⎤⎦ (2.45) Pk = E ⎡⎣e e ⎤⎦ T k k Wyznaczamy równanie, które pozwoli nam na wyliczenie estymaty a posteriori xˆk jako liniowej kombinacji estymaty a priori xˆk− i ważonej różnicy pomiędzy pomiarem zk a przewidywaną wartością pomiaru Hxˆ x− : xˆk = xˆk− + K ( zk − Hxˆk− ) Różnica (z k (2.46) − Hxˆk− ) nazywana jest pozostałością w pomiarze (ang. residual, innovation). Macierz K o wymiarach n × m odpowiada za parametr zwany wzmocnieniem lub czynnikiem mieszania (ang. gain, blending factor), który odpowiada za zmniejszenie k. Zasada rekurencji dla filtru Kalmana polega na tym, że w danej chwili k, dokonywany jest pomiar stanu, na podstawie którego oraz estymaty a priori w chwili k – 1 wyznaczana jest estymata a posteriori. Służy ona następnie do predykcji estymaty stanu w następnym, k + 1 momencie. A zatem równania 78 opisujące filtr Kalmana dzielą się na dwie kategorie: równania aktualizujące w chwili k oraz równania predykcyjne dla chwili k + 1 [9]. W przypadku, gdy proces nie jest opisany liniowymi równaniami różniczkowymi jednym z lepiej sprawdzających się zastosowań jest rozszerzony filtr Kalmana (EKF – ang. Extended Kalman Filter). Filtr ten linearyzuje równania, używając wartości średnich i kowariancji procesu [9]. 79 Literatura 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 80 Allen L., Eberly J.H., Optical resonance and two level atoms. John Willey and Sons, New York 1975. Arnold L., Stochastic Differential Equations: Theory and Applications. Wiley 1974. Bernstein et al., A micromachined comb-drive tuning fork rate gyroscope. Proc IEEE Micro Electro Mechanical Systems Workshop (MEMS 93), Fort Lauderdale 1993. Białasiewicz J.T., Falki i aproksymacje. WNT, Warszawa 2004. Borenstein J., Everett H.R., Feng L. Where am I? Sensors and Methods for Mobile Robot Positioning. University of Michigan 1996. Britting K. R., Inertial navigation systems analysis. Wiley-Interscience, New York 1971. Chung K.L., Elementary Probability Theory with Stochastic Processes. Springer, 1975. Evans L. C., An Introduction to Stochastic Differential Equations. Department of Mathematics, UC Berkeley 1996. Gajek L., Kałuszka M., Wnioskowanie statystyczne. WNT, Warszawa 1996. Gibson J., Koo B., Filtering of Colored Noise for Speech Enhancement and Coding. IEEE Transactions on Signal Processing, vol. 39, No. 8, 1991. Gray R. M., Davisson L. D., An Introduction To Statistical Signal Processing. McGraw Hill 1999. Grewall M. S., Weill L. R., Andrews A. P., Global Positioning Systems, Inertial Navigation, and Integration. John Wiley&Sons, 2001. Hsu Hwei P., Schaum's Outline of Theory and Problems of Probability, Random Variables, and Random Processes. McGraw Hill 1997. Kalman R., A New Approach to Linear Filtering and Prediction Problems. Transactions of the ASME, Journal of Basing Engineering, vol. 82, 1960. Kayton N., Fried W.R., Elektroniczne układy nawigacji lotniczej. WKŁ, Warszawa 1976. Maluf N., Williams K., An Introduction to Microelectromechanical Systems Engineering. Second Edition, Artech House, Boston 2004. Markey W., Hovorka J., The mechanics of inertial positioning and heading indication. Methuen & co Ltd, London 1961. Moghaddamjoo A., Kirlin L., Robust Kalman Filtering with Unknown Inputs. IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 37, No. 8, 1989. Narkiewicz J., Podstawy układów nawigacyjnych. WKŁ, Warszawa 1999. Nowak R., Statystyka dla fizyków. PWN, Warszawa 2003. 21. Omerbashich M., Integrated INS/GPS navigation from a popular perspective. Journal of Air Transportation, Vol .7, University of New Brunswick 2002. 22. Putty M.W., A micromachined vibrating ring gyroscope. Rozprawa doktorska, University of Michigan 1995. 23. Sameh, N., Improving the Inertial Navigation System (INS) Error Model for INS and INS/DGPS Applications. Rozprawa doktorska, UCGE Reports Number 20183, Department of Geomatics Engineering, University of Calgary 2003. 24. Sobczyk K., Stochastyczne równania różniczkowe. WNT, Warszawa 1996. 25. Titterton D. H., Weston J. L., Strapdown Inertial Navigation Technology. Peter Peregrinus Ltd, 1997. 26. Vaseghi S., Advanced Signal Processing and Digital Noise Reduction. Wiley & Teubner, New York 1997. 27. Zhang X., Integration of GPS with a medium accuracy IMU for meter – level positioning, University of Calgary, Department of geomatics engineering, Calgary 2003. 28. Serwis internetowy: www.wikipedia.org.pl 29. Witryna internetowa Analog Devices: www.analog.com 30. Witryna internetowa BEI: www.bei.com 31. Witryna internetowa iMAR: www.imar.com 32. Witryna internetowa KVH: www.kvh.com 33. Witryna internetowa NEC-Tokin: www.nec-tokin.com 81 Spis rysunków 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 82 Układ płaszczyzn odniesienia: inercyjny − (x, y, z); geograficzny − (xe, ye, ze); geocentryczny − (xc, yc, zc); geodezyjny − (N, E, D) …….. Układ odniesienia związany z obiektem [R, P, Y] (body frame) ……. Kardanowy układ nawigacji inercyjnej ……………………………… System INS stabilizowany przestrzennie …………………………… System INS stabilizowany lokalnie …………………………………. Bezkardanowy układ nawigacji inercyjnej typu strap-down ….……. Zasada wyznaczania wektora przemieszczenia obiektu na podstawie całkowania składowych wektora przyspieszenia …………………… Schemat blokowy układu wyznaczania pozycji w kardanowym układzie nawigacji inercyjnej ……………………………………….. Schemat blokowy układu wyznaczania pozycji w bezkardanowym układzie nawigacji inercyjnej ……………………………………….. System inercyjny …………………………………………………….. Struktura żyroskopu typu wibrujący strojony element – kamerton w powiększeniu pod mikroskopem elektronowym ………………….. Schemat układu żyroskopu BEI GyroChip ………………………….. Powstawianie siły Coriolisa podczas ruchu wahadła Focaulta ……… Pręt ceramiczny wykorzystywany w żyroskopach ceramicznych …... Fazy wibracji pręta ceramicznego w żyroskopie ceramicznym …….. Schemat budowy sensora z wibrującym prętem …………………….. Zjawisko Sagnacka w żyroskopie optycznym ………………………. Uproszczony schemat żyroskopu FOG ……………………………… Schemat żyroskopu typu IFOG ……………….…………………….. Żyro DSP 3000 firmy KVH …………………………………………. System iNAV-FMS firmy iMAR ……………………………………. Schemat żyroskopu laserowego ……………………………………... Schemat detektora żyroskopu RLG …………………………………. Schemat budowy akcelerometru …………………………………….. Schemat akcelerometru belkowego ………………………………….. Powiększenie struktury akcelerometru MEMS ……………………… Widok pojedynczej grupy grzebieni akcelerometru ………………… Wpływ utraty sygnału GPS na dokładność pozycji w systemie INS/GPS ……………………………………………………………... Zobrazowanie błędów w sensorach inercyjnych …………….……… Funkcje ACF i ACS dla białego szumu ……………………………… Filtr formujący stosowany w modelowaniu szumu …………………. Funkcja autokorelacji pierwszego rzędu …………………………….. Układ filtrujący pierwszego rzędu …………………………………... 14 16 23 25 26 27 29 32 33 41 43 44 45 46 46 46 47 49 50 51 51 52 53 55 56 57 57 60 61 67 68 70 71 Redaktor Paulina Mądrawska Redakcja techniczna Elwira Goryczko Szczecin 2006. Typografia i skład – Dział Wydawnictw Akademii Morskiej. Wyd. I. Nakład 150 egz. Format B5. Ark. wyd. 5,3. Ark. druk. 5,0. 83 ISBN–10 83-89901-20-X ISBN–13 978-83-89901-20-0 84 85 M. Gucma J. Montewka Podstawy morskiej nawigacji inercyjnej