ZAJĘCIA VI Estymator LS - własności i implementacje
Transkrypt
ZAJĘCIA VI Estymator LS - własności i implementacje
Komputerowa identyfikacja obiektów ZAJĘCIA VI Estymator LS - własności i implementacje • Dokładność wyników identyfikacji (jakość estymatora) • Dokładność estymatora LS • Iteracyjne obliczenia estymat LS • Obliczenia dla obiektów o zmiennych parametrach Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów DOKŁADNOŚĆ ESTYMATORA – OBCIĄŻENIE I ROZRZUT (WARIANCJA) W pojedynczych przypadkach oszacowania parametru θ za pomocą estymatora θ̂ są obarczone błędem przypadkowym δ, czyli: θ̂ = θ + δ Parametry losowe błędu δ określają jakość estymatora. Estymator nazywamy nieobciążonym jeśli wartość oczekiwana oszacowań jest równa θ, tzn.: E ⎡⎣θˆ ⎤⎦ = E [θ + δ ] = θ + E [δ ] = θ Jeżeli E ⎡⎣θˆ ⎤⎦ ≠ θ , to mamy do czynienia z estymatorem obciążonym, a wielkość b = E [δ ] = E ⎡⎣θˆ ⎤⎦ − θ jest nazywana obciążeniem estymatora. Estymator nieobciążony nazywamy efektywnym, jeśli posiada on najmniejszą macierz kowariancji estymat parametrów ze wszystkich estymatorów nieobciążonych tej samej wielkości operujących na tych samych danych. Ćwiczenie: Obciążenie i wariancja estymatora. Który z estymatorów (sądząc ze zbioru estymat ‘ο’ parametru o wartości ‘•’) jest obciążony lub nieobciążony, ma większą lub mniejszą wariancję? 1 Katedra Metrologii AGH 2 3 Kraków 2006 Komputerowa identyfikacja obiektów OPIS DOKŁADNOŚCI WIELOWYMIAROWEGO WYNIKU ESTYMACJI (WEKTORA PARAMETRÓW) Pomiar wielowymiarowy, kiedy wynikiem pomiaru jest zestaw wartości kilku wielkości mierzonych jednocześnie, wymaga rozszerzenia opisu błędów i miar tych błędów. Jeśli przedstawimy wynik pomiaru w postaci wektora wartości poszczególnych wielkości mierzonych, to opis błędu będzie miał postać macierzową uwzględniającą wektor błędów systematycznych b oraz rozrzut poszczególnych elementów wektora wyników i współzależność losową elementów wektora wyniku opisane macierzą kowariancji Σ. b = E [δ ] Σ = E ⎡( δ − b )( δ − b ) ⎤ ⎣ ⎦ Odpowiednikiem przedziału rozrzutu wartości jest w przypadku wielowymiarowym ograniczony przez pewną δ = θˆ − θ hiperpowierzchnię obszar, którego punkty spełniają nierówność: T (δ − b) T Σ −1 ( δ − b ) < 1 W przypadku dwuwymiarowym hiperpowierzchnią ograniczającą jest elipsa, której wymiary i położenie są określone przez wektor błędu systematycznego b i macierz kowariancyjną Σ wyników pomiaru. ^ θ θ^ 2 2 σ1 _ _ (θ 1,θ 2) σ2 ⎯ √λ 1 ⎯ b1 b2 √ λ 2 θ2 ^ (θ 1,θ 2) θ1 θ1 Przykładowa elipsa rozrzutu przy dokładnej wartości wektora parametrów ( θ ,θ ) , wartości oczekiwanej ( θ ,θ ) i pewnej macierzy kowariancji. 1 2 Katedra Metrologii AGH 1 2 θ^ 1 Przykładowy obszar rozrzutu dla wyników pomiarów (elipsa) i zbiór wyników pomiarów (punkty). Kraków 2006 Komputerowa identyfikacja obiektów WŁASNOŚCI ESTYMATORA NAJMNIEJSZEJ SUMY KWADRATÓW Policzmy obciążenie i macierz kowariancyjną estymatora LS dla modelu pomiarów Y = Uθ + ε , gdzie ε jest zakłóceniem pomiarowym niezależnym w każdym pomiarze, o zerowej wartości oczekiwanej i stałej wariancji σ 2 we wszystkich pomiarach. ( E ⎡θˆ ⎤ = E ⎡ UT U ⎣ ⎦ ⎣⎢ ) −1 ( UT Y ⎤ = UT U ⎦⎥ ) −1 ( UT E [Uθ + ε ] = UT U ) −1 UT Uθ = θ Obciążenie jest więc równe zeru, a sam estymator LS (w założonych warunkach) jest nieobciążony. Zauważmy z powyższych obliczeń, co będzie przydatne w następnym wyprowadzeniu, że odchyłka δ estymaty ( może być wyrażona w funkcji zakłóceń ε, tj. δ = θˆ − θ = UT U ) −1 UT ε . Kowariancja estymat wynosi: ( )( (( ) T ⎡ ⎡ ⎤ cov ⎡⎣θˆ ⎤⎦ = E ⎢ θˆ − E ⎡⎣θˆ ⎤⎦ θˆ − E ⎡⎣θˆ ⎤⎦ ⎥ = E ⎢ UT U ⎣ ⎦ ⎣ ) −1 UT ε ) (( UT U ) −1 ) T ⎤ UT ε ⎥ = E ⎡ UT U ⎢⎣ ⎦ ( ) −1 ( UT εεT U UT U ) −1 ⎤, ⎥⎦ ale ponieważ zakładamy identyczny i niezależny rozkład zakłóceń o zerowej wartości oczekiwanej i wariancji σ2 w poszczególnych pomiarach: ⎡σ 2 ⎢ E ⎣⎡εεT ⎦⎤ = cov [ε ] = ⎢ ⎢0 ⎣ 0⎤ ⎥ 2 ⎥ = Iσ (macierz NxN) σ 2 ⎥⎦ to macierz kowariancyjna estymatora LS (w załóżonych warunkach) ma wartość: ( cov ⎡⎣θˆ ⎤⎦ = σ 2 UT U Katedra Metrologii AGH ) −1 ( UT IU UT U ) −1 ( = σ 2 UT U ) −1 (uwaga: niezależna od Y !) Kraków 2006 Komputerowa identyfikacja obiektów PODSUMOWANIE WŁASNOŚCI ESTYMATORA LS Estymator najmniejszej sumy kwadratów LS : - jest estymatorem nieobciążonym ( - ma macierz kowariancji estymat cov ⎡⎣θˆ ⎤⎦ = σ 2 UT U ) −1 , wtedy, gdy zakłócenia ε pomiarów Y są wzajemnie niezależne, o zerowej wartości oczekiwanej i o tej samej wariancji i rozkładzie (ang. independent identically distributed, i.i.d.). Przykład: Rejestrujemy miernikiem cyfrowym napięcie nierównowagi mostka tensometrycznego w zakresie od 0 do 10[mV] z precyzją 1% wartości zakresowej. Wielkościami zadawanymi są siła i odchyłka temperatury o wartościach: F [kN]: 1 2 3 4 5 ∆T [K]: 0.5 2 5 1 1.2 Jaką precyzję będą miały estymaty parametrów modelu liniowego ur = k F F + kT ∆T + u0 + ε ? Konstruujemy macierz U, szacujemy wariancję zakłóceń pomiaru jako σ2=(3*0.01*10[mV])2=9e-8[mV2], liczymy Σ. >> F=[1 2 3 4 >> dT=[0.5 2 5 1 >> U=[F, dT, ones(size(F))]; >> S=1e-8*inv(U'*U) S= 1.0e-007 * 0.0100 -0.0003 -0.0294 -0.0003 0.0078 -0.0142 -0.0294 -0.0142 0.1358 5 ]'; 1.2]'; Czy to dużo, czy mało ? Zależy od wartości parametrów. Te z kolei wpływają na wartości wyjścia. Lepszy pomiar wyjścia – lepsze estymaty. Czy z wyliczonej macierzy wynika że estymaty będą skorelowane ? Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów ZASADA ORTOGONALNOŚCI Estymacja LS spełnia zasadę ortogonalności reszt względem wyjścia modelu: ( eYˆ = Y − Yˆ ) T Yˆ = 0 bo ( ) ( T Y − Uθˆ Uθˆ = YT Uθˆ − θˆ T UT Uθˆ = YT Uθˆ − YT U UT U ) −1 UT Uθˆ = YT Uθˆ − YT Uθˆ = 0 Zauważmy, że ta zależność nie ma charakteru statystycznego. Zawsze wektor reszt będzie prostopadły (ortogonalny) do przestrzeni rozpinanej przez wektory macierzy wejść ( Uθˆ to liniowa kombinacja tych wektorów z mnożnikami równymi estymatom parametrów). Dla przykładu rozważmy trzy pomiary obiektu dwuwejściowego i interpretację geometryczną układu Y, Yˆ = Uθˆ , e = Y − Yˆ . Y ⎡u1(1) u1( 2) ⎤ ⎡ y1 ⎤ ⎢ (1) ⎥ ( 2) U = ⎢u2 u2 ⎥ , Y = ⎢⎢ y 2 ⎥⎥ ⎢ (1) ( 2) ⎥ ⎢⎣ y 3 ⎥⎦ u u ⎢⎣ 3 3 ⎥ ⎦ e u ( 2) u(1) Ŷ Wektor odchyłek jest prostopadły do płaszczyzny rozpinanej przez wektory poszczególnych wejść, na której leży wektor wyjścia modelu. Suma geometryczna wektora wyjścia modelu i wektora odchyłek daje wektor zmierzonego wyjścia. Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów IMPLEMENTACJE ESTYMATORA LS Rozwiązanie układu normalnego (to już było) ( Obliczenia estymatora LS wg wzoru θˆ = UT U ) −1 UT Y nie są stosowane w praktyce. Rozwiązanie nadokreślonego sprzecznego układu równań, jakim jest Uθˆ = Y możliwe jest w sensie najmniejszej sumy kwadratów algorytmem dekompozycji QR. Wyniki są identyczne jak w przypadku wzoru zamkniętego, a dodatkowo bardziej odporne na niedokładną reprezentację liczb w komputerze. Samego algorytmu rozwiązania nie będziemy omawiać, bo to wykracza poza zakres przedmiotu. W Matlabie układ normalny jest rozwiązywany przez dzielenie lewostronne, tj.: θˆ = U \ Y co jest zalecanym sposobem rozwiązywania zadania estymacji LS na pełnych macierzach. Wersja iteracyjna Rozwiązywanie układu normalnego jest kłopotliwe w systemach komputerowych z małym rozmiarem pamięci (jak np. systemy sterowania oparte na kontrolerach). Przeszkodą jest tutaj rozmiar macierzy pomiarów U i Y. W celu obejścia tej trudności opracowano algorytm obliczeń estymatora LS z aktualizacją estymat przy każdym nowym pomiarze wielkości wejściowych i wyjściowej. Dodatkową jego zaletą jest łatwa modyfikacja w celu identyfikacji obiektów o zmiennych parametrach, co zobaczymy w dalszej części. Niestety algorytm iteracyjny ma gorszą dokładność obliczeń numerycznych. Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów WYPROWADZENIE ESTYMATORA LS W POSTACI ITERACYJNEJ W wyprowadzeniu iteracyjnej postaci estymatora będziemy używać następujących oznaczeń: Model pomiarów: Y = Uθ + ε Wektor wejść w chwili i: 1 n ui = ⎡ui( ) … ui( ) ⎤ ⎣ ⎦ Wyjście w chwili i: y i = y ( i ) (obarczone zakłóceniami) Klasyczny estymator LS: ( θˆ = UT U ) −1 UT Y Macierze wejść i wyjść w chwilach od 1 do i: ⎡u1(1) u1( 2) … u1( n ) ⎤ ⎡ u ⎤ ⎢ (1) ⎥ ⎢ 1⎥ ( 2) (n ) u2 … u2 ⎥ ⎢u2 ⎥ ⎢u Ui = ⎢ 2 ⎥ = ⎢ ⎥, ⎢ ⎥ ⎢ ⎥ ⎢u (1) u ( 2) … u ( n ) ⎥ ⎣ ui ⎦ ⎣ i i i ⎦ ⎡ y1 ⎤ ⎢y ⎥ Yi = ⎢ 2 ⎥ ⎢ ⎥ ⎢ ⎥ ⎣ yi ⎦ Macierz wejść w chwilach od 1 do i+1: ⎡u1(1) ⎢ (1) ⎢ u2 ⎢ Ui +1 = ⎢ ⎢u (1) ⎢ i ⎢⎣ui(+11) u1( 2) u2( ) 2 ui( 2) ui(+1) 2 n … u1( ) ⎤ ⎥ (n) … u2 ⎥ ⎥ = ⎡ Ui ⎤ ⎥ ⎢u ⎥ ( n ) ⎥ ⎣ i +1 ⎦ … ui ⎥ (n) ⎥ … ui +1 ⎦ θ̂ - estymata wektora parametrów θ n – ilość wejść (estymowanych parametrów) Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów WYPROWADZENIE ESTYMATORA LS W POSTACI ITERACYJNEJ C.D. Definiujemy podstawową macierz estymatora LS jako : Pi −1 = Ui T Ui i wyliczamy postać tej macierzy przy rozszerzeniu macierzy wejść o następny pomiar: Pi +1−1 = Ui +1T Ui +1 = Pi −1 + ui +1T ui +1 Ze względu na obliczenia estymatora interesuje nas odwrotność macierzy Ui +1T Ui +1 . Korzystając ze wzoru rachunku macierzowego: −1 −1 ⎡⎣ A + BT B ⎤⎦ = A −1 − A −1BT ⎡⎣1 + BA −1BT ⎤⎦ BA −1 gdzie w naszym przypadku: A = Pi −1 , B = ui +1 otrzymujemy: −1 T T ⎡ ⎤ Pi +1 = Pi − Pu i i +1 ⎣1 + ui +1Pu i i +1 ⎦ ui +1Pi ( ) T Pi +1 = Pi − ηi +1Pu i i +1 ui +1Pi * gdzie wyrażenie T ⎤ ηi +1 = ⎡⎣1 + ui +1Pu i i +1 ⎦ −1 jest skalarem. ( Równanie estymatora LS θˆ = UT U ) −1 UT Y dla i oraz i+1 próbek możemy zapisać w postaci: T θˆ i = PU i i Yi θˆ i +1 = Pi +1Ui +1T Yi +1 = Pi +1 ⎡⎣Ui T Yi + ui +1T y i +1 ⎤⎦ Katedra Metrologii AGH ( **) Kraków 2006 Komputerowa identyfikacja obiektów WYPROWADZENIE ESTYMATORA LS W POSTACI ITERACYJNEJ C.D. Podstawiając równanie (*) do równania (**) otrzymujemy: T T T T ⎡ T ⎤ θˆ i +1 = PU i i Yi + Pu i i +1 y i +1 − ηi +1Pu i i +1 ui +1Pi ⎣Ui Yi + ui +1 y i +1 ⎦ T Uwzględniając zależność θˆ i = PU i i Yi powyższą postać estymatora możemy zapisać w postaci: θˆ i +1 = θˆ i + Pi +1ui +1T ⎡⎣ y i +1 − ui +1θˆ i ⎤⎦ Po wykorzystaniu nowych obserwacji ui +1 i y i +1 nowa estymata parametrów równa się estymacie poprzedniej zaktualizowanej o człon poprawkowy. Wyrażenie ⎡⎣ y i +1 − ui +1θˆ i ⎤⎦ jest błędem predykcji nowej obserwacji sygnału wyjściowego na podstawie ostatniej estymaty parametrów. Nie ma tu potrzeby odwracania macierzy i do wyznaczenia nowej oceny korzystamy tylko ze „starej wiedzy” zawartej w macierzy Pi i z nowych obserwacji. Algorytm obliczeń iteracyjnej wersji estymatora LS w kolejnym kroku na podstawie wartości P i θ̂ z poprzedniego kroku i nowego pomiaru ( u , y ) ma ostatecznie postać: η = ⎡⎣1 + uPuT ⎤⎦ −1 (skalar) P = P − ηPuT uP (macierz nxn) θˆ = θˆ + PuT ⎡⎣ y − uθˆ ⎤⎦ (wektor nx1) Początkowa wartość macierzy P może być diagonalna o dużych wartościach na przekątnej lub może być wyliczona z n początkowych pomiarów. Początkowa wartość wektora θ̂ estymat parametrów może być zerowa. Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów ALGORYTMY OBLICZENIOWE ESTYMATORA LS DLA OBIEKTÓW O ZMIENNYCH PARAMETRACH LS z przesuwanym oknem Jeśli parametry identyfikowanego obiektu są zmienne z czasem to rozsądne wydaje się stosowanie klasycznego ( algorytmu LS θˆ = UT U ) −1 UT Y do kolejnych porcji N pomiarów. Czyni się więc założenie, że w czasie pomiaru N próbek parametry nie zmieniają się w sposób istotny. Na takiej zasadzie działa algorytm z przesuwanym oknem, który wydaje się na tyle prosty, że jego zapis pozostawiamy jako zadanie a przedstawimy tylko schemat działania. wejścia i wyjście bufor N próbek pozycja 1 pozycja 2 pozycja 3 Algorytm LS ( θˆ = UT U ) −1 UT Y estymaty parametrów nr 1 estymaty parametrów nr 2 estymaty parametrów nr 3 Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów Algorytm iteracyjny LS z wykładniczym zapominaniem Jak wspomniano wcześniej, dla obiektów o zmiennych z czasem parametrach (np. rezystancja uzwojeń silnika pod wpływem temperatury) można stosować iteracyjny estymator LS o zmodyfikowanej postaci. Modyfikacja ma na celu powolne „zapominanie” przeszłych pomiarów na korzyść pomiarów najnowszych. Osiąga się to przez mnożenie przeszłych pomiarów przez współczynnik wagowy o malejącej wartości. Zmodyfikowane kryterium najmniejszej sumy kwadratów ma wtedy postać: N T J = ∑ ⎡ Y − Uθˆ ⎤ W ⎡ Y − Uθˆ ⎤ ⎣ ⎦ ⎣ ⎦ i =1 ⎡λ N −1 ⎢ λ N −2 ⎢ gdzie macierz wag W ma postać: W = ⎢ ⎢ ⎣ 0 0⎤ ⎥ ⎥ ⎥ ⎥ λ0 ⎦ gdzie rosnąca potęga współczynnika 0<λ<1 maleje do zera, co daje opisany wyżej efekt ważenia. Sprowadzenie wynikowego estymatora do postaci iteracyjnej daje algorytm obliczeniowy, tzw. LS z wykładniczym zapominaniem: η = ⎡⎣ λ + uPuT ⎤⎦ P= −1 1 ⎡⎣P − ηPuT uP ⎤⎦ λ θˆ = θˆ + PuT ⎡⎣ y − uθˆ ⎤⎦ (skalar) (macierz nxn) (wektor nx1) Zauważmy, jakie zmiany niesie ten algorytm w porównaniu ze zwykłym algorytmem iteracyjnym. Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów ZADANIA Zadanie 1 Dla rejestracji wejść i wyjścia zawartych w pliku (dane6-1.mat, rozdany na zajęciach) przyjmij model liniowy i oblicz wg zależności teoretycznej macierz kowariancji estymat parametrów przy estymacji z pierwszych 40 pomiarów. Wariancję zakłóceń oszacuj z reszt dopasowania. Oszacuj metodą statystyczną macierz kowariancji estymat parametrów z wyników estymacji z kolejnych porcji 40 pomiarów. Porównaj zawartość obydwu macierzy kowariancyjnych. Zadanie 2 Dla rejestracji wejść i wyjścia zawartych w pliku (dane6-2.mat) przyjmij model liniowy i zastosuj wersję estymatora LS z iteracyjnym zapominaniem. Przedstaw na rysunku wartości estymat parametrów w funkcji numeru iteracji. Przetestuj różne wartości współczynnika zapominania. Zadanie 3 Dopasuj algorytm z poprzedniego zadania do estymacji on-line parametrów modelu y = au + b dzielnika rezystancyjnego o zmiennym stosunku podziału. Kolejne pomiary będą pochodzić z funkcji [u,y]=pomiar() odwołującej się do karty PCL818 mierzącej napięcie wejściowe u i wyjściowe y dzielnika. W trakcie estymacji prezentuj na wykresie trajektorię zmian wartości estymat z numerem iteracji. Przetestuj swoją implementację na dostarczonych danych. Katedra Metrologii AGH Kraków 2006 Komputerowa identyfikacja obiektów LITERATURA Sydenham P.H., Podręcznik Metrologii, WKiŁ Warszawa 1988 (rozdział 8 pt. Estymacja parametru) de Larminat P., Thomas Y., Automatyka – układy liniowe, tom 2 Identyfikacja, WNT Warszawa 1983 Mańczak K., Nahorski Z., Komputerowa identyfikacja obiektów dynamicznych, PWN, Warszawa 1983 Bubnicki Z., Identyfikacja obiektów sterowania, PWN, Warszawa 1974 Eykhoff P., Identyfikacja w układach dynamicznych, PWN, Warszawa1980 Zimmer A., Identyfikacja obiektów i sygnałów, Politechnika Krakowska 1998 Katedra Metrologii AGH Kraków 2006