ZAJĘCIA VII Zastosowanie estymatora LS do identyfikacji

Transkrypt

ZAJĘCIA VII Zastosowanie estymatora LS do identyfikacji
Komputerowa identyfikacja obiektów
ZAJĘCIA VII
Zastosowanie estymatora LS
do identyfikacji obiektów dynamicznych
• Równanie różniczkowe a metoda LS
• Czas dyskretny a czas ciągły
• Obciążenie estymatora LS w przypadku dynamicznym
• Estymacja parametrów modelu dyskretnego
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
WPROWADZENIE
W dotychczasowych zadaniach posługiwaliśmy się modelami statycznymi, dobrze opisującymi takie obiekty, w
których procesy przejściowe trwają na tyle krótko, że mogą być pominięte w danym zastosowaniu. Wyjście i wejścia
takiego modelu są powiązane zależnością algebraiczną. W rzeczywistych obiektach zawsze istnieją zasobniki
energii, które powodują zależność wyjścia obiektu nie tylko od bieżących wartości jego wejść, ale również od
poprzednich wartości wejść, które wpłynęły na bieżący stan tych zasobników. Modele uwzględniające zmiany
energii wewnątrz obiektu są nazywane modelami dynamicznymi. Dla wyjścia modelu dynamicznego istotne są więc
zarówno bieżące wartości wejść jak i ich przeszłe wartości.
Celem identyfikacji parametrycznej obiektu dynamicznego jest określenie struktury modelu dynamicznego, której
rząd odpowiada obiektowi i wyznaczenie estymat parametrów opisujących własności dynamiczne (jak np. szybkość
ładowania czy pojemność zasobników energii) i własności statyczne obiektu. W dalszej części będzie analizowana
identyfikacja obiektów dynamicznych jednowejściowych i jednowyjściowych. Podstawową postacią modelu będzie
równanie różniczkowe i odpowiadające mu równanie różnicowe.
Przykład:
Modelem obiektu dynamicznego inercyjnego jest transmitancja ze stałą czasową. Magazynowanie energii
wewnątrz inercji prowadzi do zależności bieżącego wyjścia od historii wejścia (model całkowy splotu).
Wprowadzając zależność bieżącego wyjścia od historii wyjścia (trendu zawartego w pochodnej) uzyskujemy
bardziej zwarty opis transmitacyjny.
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
MODEL DYNAMICZNY A RÓWNANIE LINIOWE
Jednym z modeli obiektu dynamicznego z czasem ciągłym jest równanie różniczkowe:
y ( t ) + α1
dy ( t )
dt
+ … + αn
d n y (t )
dt n
= β 0u ( t ) + β 1
du (t )
dt
+ … + βm
d mu ( t )
dt m
Stosując podstawienie zmiennych za kolejne pochodne wejścia i wyjścia:
y (t ) = −α1y ( ) ( t ) − … − α n y (
1
n)
(t ) + β0u (t ) + β1u (1) (t ) + … + β mu (m ) (t )
można zauważyć jego podobieństwo do równania algebraicznego modelu statycznego. W notacji modelu LS (tj.
Y = Uθ ) macierz U zawierałyby próbki poszczególnych zmiennych (czyli oryginalnych pochodnych), a wektor θ
współczynniki równania różniczkowego.
(1)
(n )
⎡ − y1 … − y 1
⎢ (1)
(n )
⎢−y2 … −y2
U=⎢
⎢
⎢ − y N(1) … − y N( n )
⎣
(0)
u1
(m ) ⎤
… u1
⎥
m
0
u2( ) … u2( ) ⎥
⎥,
⎥
(0)
(m ) ⎥
uN … u N ⎦
⎡ α1 ⎤
⎢ ⎥
⎢ ⎥
⎡ y1 ⎤
⎢α ⎥
Y = ⎢ ⎥, θ = ⎢ n ⎥
⎢ ⎥
⎢ β0 ⎥
⎢⎣ y N ⎥⎦
⎢ ⎥
⎢ ⎥
⎣ βm ⎦
Widoczna jest jakościowa zmiana modelu: w macierzy wejść pojawiają się wartości pochodnych wyjścia, które nie
są znane dokładnie. Ma to swoje konsekwencje w niekorzystnych własnościach estymatora, co zostanie pokazane
później.
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
MODEL Z CZASEM CIĄGŁYM A MODEL Z CZASEM DYSKRETNYM
Metoda różniczkowania sygnałów była powszechna w czasach komputerów hybrydowych, w których dokonywano
analogowego różniczkowania sygnałów. We współczesnych komputerowych systemach identyfikacji klasycznym
estymatorem LS nie wykonuje się operacji numerycznych na sygnałach w celu uzyskania przybliżonych
pochodnych sygnałów. Proces identyfikacji modelu ciągłego polega na transformacji modelu ciągłego do postaci
dyskretnej, identyfikacji modelu dyskretnego i przejścia powrotnego do modelu ciągłego, z przeliczeniem wartości
współczynników zidentyfikowanego modelu dyskretnego na współczynniki modelu ciągłego.
Metodą transformacji modelu przy niskich rzędach może być aproksymacja pochodnych sygnału przybliżeniami
różnicowymi przy odstępie próbek (okresie próbkowania) ∆t , np. dla pierwszej pochodnej :
dt
≈
f ( t0 + ∆t ) − f (t0 )
t = t0
∆t
Jaki błąd popełniamy przy takim przybliżeniu ? Możemy
go przedstawić w dziedzinie częstotliwości. Porównamy
transmitancje modeli różniczkowania ciągłego G ( s ) = s i
dyskretnego
przybliżonego
ilorazem
różnicowym
G ( z ) = fs ( z − 1) .
bode(tf([1 0],[ 1]), 'r', tf([1 -1],[ 1], 1), 'b')
Phase (deg) Magnitude (dB)
df ( t )
20
Bode Diagram
0
-20
180
135
90
-1
10
0
10
1
10
Frequency (rad/sec)
Zauważmy, że błąd rośnie dla dużych częstotliwości.
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
Przykład: Przybliżenie pochodnej ilorazem różnicowym
Przeprowadźmy transformację modelu inercyjnego pierwszego rzędu o postaci: y (t ) + T
y (t ) + T
y (t + ∆t ) − y ( t )
∆t
dy (t )
dt
= Ku (t ) .
= Ku ( t )
y (t + ∆t ) = y (t )(1 − τ ) + Kτ u ( t )
gdzie zastosowano podstawienie τ = ∆t T
Stosując podstawienia a = 1 − τ , b = Kτ i operując numerami próbek odległych o ∆t otrzymujemy model, który może
być identyfikowany estymatorem LS:
y i +1 = ay i + bui
lub w zapisie transmitancji operatora z: G ( z ) =
y (z)
u (z)
=
b
z−a
Na podstawie N próbek wejścia i wyjścia tworzymy macierze
u1 ⎤
⎡ y2 ⎤
⎡ y1
⎢y ⎥
⎢ y
u2 ⎥
3
2
⎥ , θ = ⎡a ⎤
y = ⎢ ⎥, U = ⎢
⎢b ⎥
⎢ ⎥
⎢
⎥
⎣ ⎦
⎢ ⎥
⎢
⎥
⎣yN ⎦
⎣ y N −1 uN −1 ⎦
i wykonujemy obliczenia estymatora LS ( θˆ = U \ y ). Po wyliczeniu
wartości współczynników a i b przeliczamy je na współczynniki K i T
modelu ciągłego wg zależności odwrotnych: T = ∆t (1 − a ) , K = T b ∆t .
Katedra Metrologii AGH
Sprawdźmy czy to działa:
>> dt=0.1;
>> t=0:dt:50*dt;
>> u=ones(size(t));
>> y=step(5,[2 1],t);
>> U=[y(1:end-1), u(1:end-1)'];
>> Y=y(2:end);
>> p=U\Y
p=
0.9512
0.2439
>> T=dt/(1-p(1))
T = 2.0504
>> K=T*p(2)/dt
K = 5.0000
Kraków 2006
Komputerowa identyfikacja obiektów
METODY KONWERSJI DZIEDZINY MODELU
Tego rodzaju obliczenia dla modeli wyższego rzędu są uciążliwe. Istnieją sformalizowane metody transformacji dla
modeli w postaci równań stanu lub transmitancji wykonujące przekształcenie modelu przy szczególnych
założeniach o postaci wejścia (np. ekstrapolacja zerowego rzędu pomiędzy próbkami) czy przy przybliżeniu relacji
między operatorami czasu ciągłego s i dyskretnego z (np. transformata biliniowa). Najstarszą i najprostszą do
zrozumienia metodą jest transformacja przy założeniu stałowartościowego wejścia pomiędzy momentami
próbkowania. Jeśli to założenie jest spełnione to obydwa modele są równoważne. Jeśli jednak wejście zmienia się
nie w sposób skokowy to model dyskretny jest opisem przybliżonym. Analiza metody jest opisana w każdej książce
do automatyki lub identyfikacji systemów (np. podręcznik Sydenhama) a ponieważ wymaga wiedzy z dziedziny
układów równań różniczkowych, to zostanie tu pominięta. Wynikiem tej analizy jest zależność między macierzami
równań stanu modelu ciągłego i modelu dyskretnego. Matlab oferuje możliwość przeliczania współczynników
modelu równań stanu i transmitancyjnego funkcją c2dm dla przejścia z postaci ciągłej na dyskretną i d2cm dla
przejścia w drugą stronę dla różnych rodzajów aproksymacji.
W identyfikacji modelu ciągłego początkowe przejście od modelu ciągłego do dyskretnego potrzebne nam jest tylko
do wyznaczenia rzędu odpowiedniego modelu dyskretnego. Przyjmując rząd modelu dyskretnego równy rzędowi
modelu ciągłego, możemy ten krok pominąć. Przyjmowanie takiej samej postaci sparametryzowanego modelu
dyskretnego jak ciągłego (po podstawieniu za operator s operatora z) nie zawsze jest poprawne, o czym nas
przekona następny przykład. Działa natomiast wyrównywanie w górę rzędów licznika i mianownika.
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
Przykład: Metoda transformacji biliniowej (Tustina)
Korzystamy z aproksymacji:
z = e j Ω = e j 2π f
fs
= e s∆t ≈
2 z −1
1 + s ∆t 2
s≈
∆t z + 1
1 − s ∆t 2
Np. dla rozważanej wcześniej inercji o modelu operatorowym G ( s ) =
Kτ
( z + 1)
Kτ ( z + 1)
τ + 1)
(
K
G (z) =
=
=
2T z − 1
τ − 1⎞
⎛
τ
τ
z
1
1
+
+
−
(
)
(
)
+1
z
−
⎜
∆t z + 1
τ + 1⎟⎠
⎝
K
dostajemy (podstawienie τ = ∆t 2T ):
sT + 1
Dla K=5, T=2, ∆t =1:
G (z) =
z +1
z − 0.6
Oczywiście możemy do konwersji (z identycznym wynikiem) wykorzystać funkcje Matlaba:
c2d(tf([5],[2 1]),1,'tustin')
Wynikiem przekształceń modelu w postaci równania różniczkowego jest równanie różnicowe z nowymi
współczynnikami ai, bi
y i + a1y i −1 + … + ai − n y i − n = b0ui + b1ui −1 + … + bmui − m
które można przedstawić w postaci transmitancji dyskretnej (dwie równoważne postaci):
y (z)
b0 + b1z −1 + … + bm z − m
=
G (z) =
1 + a1z −1 + … + an z − n
u (z )
Katedra Metrologii AGH
b0 z n + b1z n −1 + … + bm z n − m
G (z) =
z n + a1z n −1 + … + an
Kraków 2006
Komputerowa identyfikacja obiektów
OBLICZENIA LS DLA USTALONEGO MODELU DYSKRETNEGO
Stosując metodę LS do tego modelu (relacji pomiędzy próbkami ) operujemy macierzami:
⎡ − y n −1 … − y1
⎢ −y
… −y2
n
U=⎢
⎢
⎢
⎣ − y N −1 … − y N − n
un
u n +1
uN
un − m ⎤
… u n − m +1 ⎥
⎥,
⎥
⎥
… uN − m ⎦
…
⎡ a1 ⎤
⎢ ⎥
⎢ ⎥
⎢a ⎥
θ = ⎢ n ⎥,
⎢ b0 ⎥
⎢ ⎥
⎢ ⎥
⎣bm ⎦
⎡ yn ⎤
⎢y ⎥
Y = ⎢ n +1 ⎥
⎢
⎥
⎢
⎥
⎣ yN ⎦
Chociaż w macierzy U występują próbki wejścia i wyjścia, to dla ujednolicenia nazewnictwa modeli liniowych
nazywa się ją macierzą wejść uogólnionych.
Po wyznaczeniu rozwiązania θˆ = U \ Y pozostaje wrócić do postaci ciągłej modelu (jeśli taka nas interesuje), co
można zrobić korzystając z funkcji konwersji d2c().
Uwaga:
Ostatecznie uzyskany model ciągły może różnić się rzędami licznika i mianownika od początkowo założonego
modelu. Co wtedy zrobić ?
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
CZY ESTYMATOR LS UTRZYMAŁ SWOJE WŁASNOŚCI ? (I DLACZEGO NIE)
Analiza obciążenia estymatora LS dla modelu opisanego równaniem Y = Uθ + ε , przeprowadzona na poprzednich
zajęciach zakładała niezależność losową wejść obiektu i zakłóceń wielkości wyjściowej. Jak widać z postaci
powyższej macierzy, ten warunek w przypadku modelu dyskretnego obiektu dynamicznego nie jest już spełniony,
ponieważ pomiary zakłóconego wyjścia znajdują się w macierzy wejścia. Macierz ta jest więc zależna losowo od
zakłóceń. Wartość oczekiwana estymatora LS będzie w tym przypadku równa:
(
E ⎡θˆ ⎤ = E ⎡ U T U
⎣ ⎦
⎢⎣
)
−1
(
U TY ⎤ = U T U
⎥⎦
)
−1
(
U T E [Uθ + ε ] = θ + E ⎡ U T U
⎢⎣
)
−1
UT ε ⎤ ≠ θ
⎥⎦
Prosty przykład na tablicy: zakłócenia obserwacji sygnału wejściowego przy wyznaczaniu średniej
W ogólnym przypadku jest to więc estymator obciążony, co można łatwo sprawdzić dla podanego wcześniej
przykładu obiektu inercyjnego pierwszego rzędu. Musimy tu jednak rozdzielić błąd systematyczny estymat
pochodzący od dyskretyzacji (jak to było we wcześniejszym przykładzie) od błędu systematycznego pochodzącego
od obecności zakłóceń w macierzy wejść uogólnionych.
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
MODELOWANIE I IDENTYFIKACJA BEPOŚREDNIO W DZIEDZINIE DYSKRETNEJ
W dotychczasowych wywodach wychodziliśmy od modelu z czasem ciągłym, którego parametry miały dla nas
znaczenie fizykalne. Dzięki znajomości ich wartości mogliśmy przewidzieć zachowanie się identyfikowanego
obiektu i odnieść je do równań fizycznych (dla czasu ciągłego) opisujących to zachowanie. Takie podejście jest
stosowane często tylko z powodu nawyków operowania w czasie ciągłym.
Nie ma żadnych przeszkód żeby zacząć budowanie modelu od razu w dziedzinie dyskretnej, opisując relacje
pomiędzy próbkami sygnałów wejściowych i wyjściowych. Tak zbudowany model można następnie zidentyfikować i
używać np. do analizy zachowania w dziedzinie czasu lub częstotliwości.
Możemy przy tym używać modeli liniowych typu FIR lub IIR, które w zapisie relacji między próbkami i transmitancji
operatora z mają postać:
FIR:
y i = b0ui + b1ui −1 + … + bmui − m
G (z) =
y (z)
u (z)
= b0 + b1z −1 + … + bm z − m
IIR:
y i + a1y i −1 + … + ai − n y i − n = b0ui + b1ui −1 + … + bmui − m
Katedra Metrologii AGH
y (z)
b0 + b1z −1 + … + bm z − m
=
G (z) =
u (z )
1 + a1z −1 + … + an z − n
Kraków 2006
Komputerowa identyfikacja obiektów
Przykład: Identyfikacja parametryczna karty dźwiękowej komputera PC
Na zajęciach poświęconych metodom nieparametrycznym używaliśmy metody korelacyjnej z pseudolosowym
sygnałem pobudzającym. Wykorzystamy teraz tamte rejestracje sygnałów do identyfikacji parametrycznej z
modelem FIR, czyli modelem zależności bieżących próbek wyjścia od bieżących i poprzednich próbek wejścia. Na
ćwiczeniach rozszerzymy problem do identyfikacji IIR, czyli poszukiwania zależności wyjścia dodatkowo od
poprzednich próbek wyjścia.
load sndb_prbs;
M=30; % dlugosc licznika
L=length(u);
% Metoda parametryczna model FIR o dlugosci M
0
10
U=[];
for i=1:M
U=[U, u(i:L-M+i)];
end
-1
10
Y=y(M:L);
b=U\Y;
Hls=freqz(b(1:M),[1], L/2);
% Metoda nieparametryczna dla porównania
-2
10
ry=xcorr(y,u,L);
ry=ry(end/2:end/2+L-1);
%plot(ry)
H=fft(ry)/(L/4);
ids=1:L/2;
-3
10
0
10
5
10
Freqs=(ids-1)*fs/L;
% Porównanie estymat
loglog(Freqs, abs(H(ids)),'r.', Freqs, abs(Hls), 'b-')
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
ZADANIA
Zadanie 1
Na podstawie danych z pliku (rozdany na zajęciach dane7-1.mat) przeprowadź identyfikację obiektu z modelem
dyskretnym drugiego rzędu i po identyfikacji z użyciem funkcji d2cm przejdź do postaci modelu ciągłego. Zweryfikuj
model przez sprawdzenie dopasowania wyjścia modelu do pomiarów.
Zadanie 2
Przeprowadź identyfikację parametryczną karty dźwiękowej na podstawie rejestracji dostępnych w pliku i po
przyjęciu modelu IIR. Najłatwiej będzie to wykonać przez modyfikację programu identyfikacji z modelem FIR.
Zweryfikuj
wyniki
przez
porównanie
moduły
transmitancji
IIR
z
nieparametryczną
charakterystyką
częstotliwościową.
Zadanie 3
Na podstawie odpowiedzi skokowej obiektu inercyjnego RC zarejestrowanej na zajęciach (lub dostępnej w pliku)
przeprowadź identyfikację obiektu. Zweryfikuj model przez sprawdzenie dopasowania wyjścia modelu do pomiarów
i przez porównanie wartości estymat parametrów z wartościami nominalnymi elementów R i C.
Katedra Metrologii AGH
Kraków 2006
Komputerowa identyfikacja obiektów
LITERATURA
Mańczak K., Nahorski Z., Komputerowa identyfikacja obiektów dynamicznych, PWN, Warszawa 1983
Bubnicki Z., Identyfikacja obiektów sterowania, PWN, Warszawa 1974
Eykhoff P., Identyfikacja w układach dynamicznych, PWN, Warszawa1980
Katedra Metrologii AGH
Kraków 2006