Modelowanie liniowych układów sterowania

Transkrypt

Modelowanie liniowych układów sterowania
Modelowanie liniowych ukladów sterowania
Wyznaczanie rozwia̧zań liniowych
stacjonarnych równań stanu
z czasem cia̧glym
Przyklad: Uklad sterowania tarcza̧ obrotowa̧
tarcza obrotowa
I
@
@
I(t)
θ(t), Ω(t)
6
6
U (t)
silnik rewersyjny
-
przekladnia
Modeluja̧c uklad w zapisie standardowym teorii sterowania określamy
• zmienne ukladu sterowania tarcza̧ obrotowa̧
.
.
x1 (t) = θ(t), x2 (t) = Ω(t) - zmienne stanu obiektu,
.
u(t) = I(t) - zmienna steruja̧ca obiektu w ukladzie otwartym,
.
u(t) = U (t) - zmienna steruja̧ca obiektu w ukladzie zamkniȩtym,
.
.
y1 (t) = U1 (t), y2 (t) = U2 (t) - zmienne wyjściowe obiektu,
• równania stanu obiektu
ẋ1 (t) = x2 (t), x1 (t0 ) = x10 , t ∈ [t0 , t1 ],
ẋ2 (t) = b u(t), x2 (t0 ) = x20 , t ∈ [t0 , t1 ],
• równania wyjścia obiektu
y1 (t) = c1 x1 (t), t ∈ [t0 , t1 ],
y2 (t) = c2 x2 (t), t ∈ [t0 , t1 ],
oraz
• równanie sprzȩżenia zwrotnego
u(t) = −y1 (t) − y2 (t), t ∈ [t0 , t1 ].
Przytoczony model ukladu sterowania tarcza̧ obrotowa̧ jest modelem
liniowym. W tym przypadku użyteczny jest wektorowo-macierzowy zapis
1
modelu umożliwiaja̧cy zastosowanie ogólnych metod badania liniowych
ukladów sterowania. Charakterystycznymi grupami zmiennych sa̧ w tym
przypadku dwuwymiarowy stan i dwuwymiarowe wyjście obiektu zapisywane w postaci wektorów kolumnowych
!
!
x1 (t)
y1 (t)
x(t) =
, y(t) =
x2 (t)
y2 (t)
oraz skalarne sterowanie obiektu u(t).
Równania ukladu sterowania zapisujemy w postaci wetorowo-macierzowej
ẋ(t) = Ax(t) + Bu(t), y(t) = Cx(t), u(t) = Ky(t),
gdzie
A=
0 1
0 0
!
jest macierza̧ stanu,
!
0
b
B=
jest macierza̧ sterowania (zredukowana̧ do wektora kolumnowego dla rozpatrywanego przykladu),
!
c1 0
C=
0 c2
jest macierza̧ wyjścia, zaś
K = −1 −1
jest macierza̧ sprzȩżenia zwrotnego (zredukowana̧ do wektora wierszowego dla rozpatrywanego przykladu).
Rozważaja̧c zadanie sterowania docelowego w ukladzie otwartym poslugujemy siȩ równaniem stanu ukladu otwartego z zadanym stanem pocza̧tkowym i końcowym
ẋ(t) = Ax(t) + Bu(t), t ∈ [t0 , t1 ].
x(t0 ) = x0 , x(t1 ) = x1 .
Rozważaja̧c zadanie regulacji stanu nominalnego x̄ = 0 w ukladzie
zamkniȩtym poslugujemy siȩ równaniem stanu ukladu zamkniȩtego z
zadanym odchyleniem pocza̧tkowym od stanu nominalnego
ẋ(t) = Ãx(t), x(t0 ) = x0 , x(t1 ) = 0, t ∈ [t0 , t1 ],
2
gdzie à = A + BKC jest macierza̧ stanu ukladu zamkniȩtego.
Przyklad: Uklad sterowania mechanicznym oscylatorem
amortyzator
sprȩżynowy
sila
stabilizuja̧ca
Maszyna
@
M
@
@
ściana podstawowa
Polożenie `(t) maszyny M stabilizowane jest w punkcie `¯ = 0 (polożenie
neutralne) za pomoca̧ sily stabilizuja̧cej F (t) i amortyzatora sprȩżynowego
o wspólczynniku sprȩżystości a. Podstawowe równanie ruchu maszyny
M odzwierciedla redukcjȩ jej przyspieszenia przez amortyzator proporcjonalnie do jej odchylenia od polożenia neutralnego i proporcjonalnie do
sily F (t):
¨ = −a`(t) − F (t), `(t0 ) = `0 , t ∈ [t0 , t1 ].
`(t)
˙ 0 ) = `˙0 .
`(t0 ) = `0 , `(t
Równanie ruchu swobodnego maszyny (F (t) = 0) przybiera postać
¨ = −a`(t), t ∈ [t0 , t1 ],
`(t)
˙ 0 ) = `˙0 .
`(t0 ) = `0 , `(t
Rozwia̧zanie równania ruchu swobodnego maszyny
(jako liniowego stacjonarnego równania różniczkowego) może być uzyskane metoda̧ podstawienia Eulera
`(t) = est .
Prowadzi to do równania est (s2 + a) = 0. Ponieważ est 6= 0, wiȩc musi
być spelnione równanie charakterystyczne s2 = −a, którego pierwiastki
√
. √
sa̧ urojone s1,2 = ± a. Oznaczaja̧c ω = a (czȩstotliwość wlasna
oscylatora) możemy zapisać rozwia̧zanie równania ruchu swobodnego jak
nastȩpuje
`(t) = C1 cos ωt + C2 sin ωt, t ∈ [t0 , t1 ],
gdzie stale C1 i C2 sa̧ określone przez warunki poczatkowe. Tak wiȩc
ruch swobodny maszyny M ma charakter oscylacyjny. Obiekt sterowania
3
można określić mianem oscylatora mechanicznego. Jeśli uklad jest wyposażony oprócz amortyzatora sprȩżynowego także w tlumik, to równanie
ruchu maszyny przybierze postać
¨ = −a1 `(t) − a2 `(t)
˙ − F (t),
`(t)
˙ 0 ) = `˙0 , t ∈ [t0 , t1 ],
`(t0 ) = `0 , `(t
gdzie a1 jest wspólczynnikiem sprȩżystości amortyzatora, zaś a2 - wspólczynnikiem tlumienia tlumika.
amortyzator
sprȩżynowy
@
Obiekt sterowania sila
stabilizuja̧ca
M
@
@
ściana podstawowa
tlumik
Modeluja̧c uklad w zapisie standardowym teorii sterowania określamy
• zmienne stanu mechanicznego oscylatora jako jego polożenie i prȩdkość
.
. ˙
x1 (t) = `(t), x2 (t) = `(t),
zmienna̧ steruja̧ca̧ oscylatora jako silȩ stabilizuja̧ca̧
.
u(t) = F (t),
zmienne wyjściowe jako napiȩcia przetworników polożenia i prȩdkości
oscylatora
.
.
y1 (t) = U1 (t), y2 (t) = U2 (t),
• równania stanu obiektu dla przypadku oscylatora liniowego ze sterowaniem w postaci sily stabilizuja̧cej
ẋ1 (t) = x2 (t), t ∈ [t0 , t1 ],
ẋ2 (t) = −a1 x1 (t) − a2 (t)x2 (t) + b u(t), t ∈ [t0 , t1 ],
x1 (t0 ) = x10 , x2 (t0 ) = x20 ,
• równania wyjścia obiektu
y1 (t) = c1 x1 (t), y2 (t) = c2 x2 (t), t ∈ [t0 , t1 ],
4
• równanie sprzȩżenia zwrotnego
u(t) = −k1 y1 (t) − k2 y2 (t), t ∈ [t0 , t1 ],
gdzie k1 i k2 sa̧ wspólczynnikami przetwarzania sygnalów napiȩciowych
na silȩ stabilizuja̧ca̧.
Wprowadzamy oznaczenia wektorowo-macierzowe dla zmiennych procesowych obiektu
!
x1 (t)
x(t) =
− stan, u(t) − sterowanie,
x2 (t)
!
y1 (t)
y(t) =
− wyjście,
y2 (t)
oraz równań ukladu
ẋ(t) = Ax(t) + Bu(t), y(t) = Cx(t), u(t) = Ky(t),
t ∈ [t0 , t1 ],
gdzie
A=
0
1
−a1 −a2
!
jest macierza̧ stanu,
!
0
b
B=
jest macierza̧ sterowania (zredukowana̧ do wektora kolumnowego dla rozpatrywanego przykladu),
!
c1 0
C=
0 c2
jest macierza̧ wyjścia, zaś
K = −k1 −k2
jest macierza̧ sprzȩżenia zwrotnego (zredukowana̧ do wektora wierszowego dla rozpatrywanego przykladu).
Rozważaja̧c zadanie sprowadzania oscylatora do polożenia nominalnego w ukladzie otwartym poslugujemy siȩ równaniem stanu
ukladu otwartego z zadanym stanem pocza̧tkowym i końcowym
ẋ(t) = Ax(t) + Bu(t), t ∈ [t0 , t1 ],
5
x(t0 ) = x0 , x(t1 ) = 0.
Rozważaja̧c zadanie regulacji stanu nominalnego x̄ = 0 w ukladzie
zamkniȩtym poslugujemy siȩ równaniem stanu ukladu zamkniȩtego z
zadanym odchyleniem pocza̧tkowym od stanu nominalnego
ẋ(t) = Ãx(t), t ∈ [t0 , t1 ], x(t0 ) = x0 , x(t1 ) = 0,
gdzie à = A + BKC jest macierza̧ stanu ukladu zamkniȩtego.
W sformulowaniu optymalizacyjnym rozważamy zadania minimalnoczasowego lub minimalnoenergetycznego sprowadzania oscylatora do
polożenia nominalnego.
Rozwia̧zanie równania stanu obiektu sterowania
opisywanego skalarnym równaniem różniczkowym
ẋ(t) = ax(t) + bu(t), t ∈ [0, t̄ ], x(0) = x0
przybiera postać
at
Z
x(t) = e x0 +
t
ea(t−τ ) bu(τ )dτ,
0
gdzie funkcja eksponencjalna eat jest określona za pomoca̧ szeregu potȩgowego
1
1
1
eat = 1 + at + a2 t2 + a3 t3 + ... + ak tk + ... (∗)
2
6
k!
Rozwia̧zanie wektorowo-macierzowego równania stanu określone jest
przez macierzowa̧ funkcjȩ wykladnicza̧ (eksponentȩ macierzowa̧) zdefiniowana̧ za pomoca̧ szeregu macierzowego
1
A2 t2 A3 t3
.
+
+ ... + Ak tk + ...
eAt = I + At +
2!
3!
k!
Definicja ta jest naturalnym uogólnieniem skalarnej funkcji wykladniczej
(eksponenty skalarnej) zdefiniowanej za pomoca̧ skalarnego szeregu potȩgowego
(*).
Inaczej mówia̧c eksponenta macierzowa jest suma̧ szeregu macierzowego
∞
X
(At)κ
At
e =
.
κ!
κ=0
Prztoczymy podstawowe wlasności eksponenty macierzowej:
• przemienność macierzy eAt i macierzy A
eAt A = (I + At +
A2 t2 A3 t3
+
+ ...)A
2!
3!
6
A3 t2 A4 t3
+
+ ...
2!
3!
A2 t2 A3 t3
+
+ ...) = AeAt .
= A(I + At +
2!
3!
At
−1
• przemienność macierzy e i A
= A + A2 t +
(AeAt = eAt A) ⇒ (eAt = A−1 eAt A)
⇒ (eAt A−1 = A−1 eAt ).
• różniczkowanie eksponenty macierzowej określone jest przez różniczkowanie
szeregu macierzowego wyraz po wyrazie
d At
d
A2 t2 A3 t3
e = (I + At +
+
+ ...) =
dt
dt
2!
3!
A+
A2 t2
2A2 t 3A3 t2
+
+ ... = A(I + At +
+ ...)
2!
3!
2!
= AeAt = eAt A .
• calkowanie eksponenty macierzowej określone jest przez calkowanie
szeregu macierzowego wyraz po wyrazie
Z
t
Aτ
Z
e dτ =
0
It +
t
(I + Aτ +
0
A2 τ 2 A3 τ 3
+
+ ...)dτ =
2!
3!
At2 A2 t3 A3 t4
At2 A2 t3
+
+
+ ... = A−1 A(It +
+
+ ...)
2!
3!
4!
2!
3!
A2 t2 A3 t3 A4 t4
+
+
+ ...)
= A−1 (At +
2!
3!
4!
= A−1 (eAt − I) = (eAt − I)A−1
.
Wzór ten obowia̧zuje jeśli macierz A jest nieosobliwa tj. det(A) 6= 0.
Calkȩ osobliwej macierzy oblicza siȩ calkuja̧c wszystkie elementy macierzy
Z t
Z t
aij (τ ) i,j=1,...,n dτ =
aij (τ )dτ
.
0
0
i,j=1,...,n
Jeśli chwila pocza̧tkowa przedzialu sterowania jest niezerowa t0 6= 0,
to dla analizy procesu sterowania użyteczna jest eksponenta macierzowa
z przesuniȩtym argumentem czasowym t − t0
A2 (t − t0 )2 A3 (t − t0 )3
.
+
eA(t−t0 ) = I + A(t − t0 ) +
2!
3!
7
1 k
A (t − t0 )k + ...
k!
Podstawienie t − t0 w miejsce t we wzorze na różniczkowanie eksponenty macierzowej daje w wyniku wzór
+... +
d A(t−t0 )
e
= AeA(t−t0 ) = eA(t−t0 ) A,
dt
a wielokrotne różniczkowanie szeregu macierzowego pozwala uzyskać wzory
dla t0 = 0
dk At
e = Ak eAt = eAt Ak ,
dtk
i dla t0 6= 0
dk A(t−t0 )
e
= Ak eA(t−t0 ) = eA(t−t0 ) Ak .
dtk
Rozwia̧zywanie jednorodnego liniowego stacjonarnego równania stanu
ẋ(t) = Ax(t), x(t0 ) = x0 , t ∈ [t0 , +∞).
Rozwia̧zanie przewidywane jest w postaci
x(t) = eA(t−t0 ) x0 .
Weryfikacja przewidywanego rozwia̧zania
d A(t−t0 )
e
x(t0 ) = AeA(t−t0 ) x0 ⇒ (ẋ(t) = Ax(t)).
dt
Weryfikacja warunku pocza̧tkowego
x(t0 ) = eA(t−t0 x0 = eA0 x0 = Ix0 = x0 .
Rozwia̧zywanie niejednorodnego liniowego stacjonarnego równania stanu
ẋ(t) = Ax(t) + Bu(t), x(t0 ) = x0 , t ∈ [t0 , +∞).
Rozwia̧zanie przewidywane jest w postaci
Z t
A(t−t0 )
x(t) = e
x0 +
eA((t−τ ) Bu(τ )dτ.
t0
Weryfikacja przewidywanego rozwia̧zania
Z t
d A(t−t0 )
e
x(t0 ) +
eA(t−τ ) Bu(τ )dτ
dt
0
8
Z
d A(t−t0 )
d At t −Aτ
e
Bu(τ )dτ
= e
x(t0 ) +
e
dt
dt
0
Z t
= AeA(t−t0 ) x0 + AeAt
eA(−τ ) Bu(τ )dτ + eAt e−At Bu(t)
0
A(t−t0 )
=A e
At
t
Z
eA(−τ ) Bu(τ )dτ + Bu(t)
x0 + e
0
⇒ (ẋ(t) = Ax(t) + Bu(t)).
• Wyznaczanie eksponenty macierzowej za pomoca̧ metod rachunku
operatorowego - porównanie rozwia̧zań w dziedzinie czasowej i operatorowej.
Zastosowanie przeksztalcenia Laplace’a
Z ∞
.
x(t)e−st dt
X(s) =
0
do jednorodnego równania stanu
ẋ(t) = Ax(t), x(0) = x0 ⇒ sX(s) − x0 = AX(s)
prowadzi do zależności
(sI − A)X(s) = x0 ⇒ X(s) = (sI − A)−1 x0 .
Porównuja̧c rozwia̧zania jednorodnego równania stanu w dziedzinie czasowej i operatorowej
x(t) = eAt x0 , X(s) = (sI − A)−1 x0 ,
wnioskujemy, że zachodzi równość
eAt = L−1 {(sI − A)−1 }.
Przykladowo dla macierzy
A=
!
0
1
−2 −2
uzyskuje siȩ
sI − A =
!
s −1
,
2 s+2
9
(sI − A)−1
1
= 2
s + 2s + 2
1
(s+1)2 +1
s
(s+1)2 +1
s+2
(s+1)2 +1
−2
(s+1)2 +1
=
−t
eAt =
!
s+2 1
−2 s
!
,
−t
!
e (cos t + sin t)
e sin t
,
−t
−t
−2e sin t
e (cos t − sin t)
gdzie wziȩto pod uwagȩ zależności
L{e−αt sinωt} =
ω
,
(s + α)2 + ω 2
L{e−αt cosωt} =
s+α
.
(s + α)2 + ω 2
Korzystaja̧c z eksponenty macierzowej można latwo wyznaczyć odpowiedzi liniowego stacjonarnego ukladu sterowania na podstawowe przebiegi sterowania (t0 = 0):
• odpowiedź impulsowa tj. odpowiedź na sterowanie u(t) = ūδ(t),
gdzie ū ∈ Rm jest wektorem stalym (bierzemy pod uwagȩ wlasność filtruja̧ca̧ δ-funkcji)
Z t
im
At
x (t) = e (x0 +
e−Aτ B ūδ(τ )dτ )
0
= eAt (x0 + e−A0 B ū) = eAt (x0 + B ū).
• odpowiedź skokowa tj. odpowiedź na sterowania u(t) = ū1(t)
(stosujemy wzór na calkowanie eksponenty macierzowej)
Z t
sk
At
x (t) = e (x0 +
e−Aτ B ūdτ )
0
Z
At
t
= e (x0 +
e−Aτ dτ B ū)
0
= eAt (x0 + (−A)−1 (e−At − I)B ū) = eAt x0 + A−1 (eAt − I)B ū.
• odpowiedź liniowa tj. odpowiedź na sterowanie u(t) = ūt (stosujemy wzór na calkowanie przez czȩści i wzór na calkowanie eksponenty
macierzowej)
Z
t
li
e−Aτ B ūτ dτ )
At
x (t) = e (x0 +
0
10
Z
t
d −Aτ
e
B ūτ dτ )
0 dτ
Z t
At
−1 −At
e−Aτ B ū)
= e (x0 − A (e B ūt −
−1
At
= e (x0 + (−A)
0
At
−1
= e (x0 − A (e
−At
−1
B ūt − (−A) (e−At − I)B ū)
= eAt x0 + (A−2 (eAt − I) − A−1 t)B ū.
Jeśli dla rozważanego przykladu zalożyć
!
0
x0 =
, b = 1, ū = 1,
1
to uzyskuje siȩ
!
−t
−t
e
(cos
t
+
sin
t)
e
sin
t
eAt =
,
−2e−t sin t
e−t (cos t − sin t)
!
!
−1
−0.5
0.5
0.5
A−1 =
, A−2 =
,
1
0
−1 −0.5
!
−t
2e
xim (t) =
,
2e−t (cos t − sin t)
!
−0.5(cos
t
+
sin
t)
+
0.5
xsk (t) =
,
e−t sint
!
−t
e
(cos
t
+
sin
t)
−
0.5t
xli (t) =
.
0.5e−t (cos t − 1.5sin t) − 0.5
11
Korzystaja̧c z zapisu wektorowo-macierzowego można określić algorytm sterowania docelowego dla ukladów liniowych stacjonarnych:
Twierdzenie: Sterowanie
u(t) = −B T eA
T (t −t )
0
1
R−1 x0 (?)
przeprowadza uklad liniowy stacjonarny
ẋ(t) = Ax(t) + Bu(t)
ze stanu pocza̧tkowego x(t0 ) = x0 do stanu końcowego x(t1 ) = x1 w
czasie t1 − t0 , jeżeli macierz R określona jak nastȩpuje
Z t1
T
.
R=
eA(t0 −t) BB T eA (t0 −t) dt
t0
jest nieosobliwa.
Dowód: Powinna być spelniona zależność
Z t1
A(t1 −t0 )
x(t1 ) = 0 = e
x0 +
eA(t1 −t) Bu(t)dt | · e−A(t1 −t0 )
t0
Sta̧d
Z
t1
0 = x0 +
eA(t0 −t) Bu(t)dt
t0
czyli
Z
t1
x0 = −
eA(t0 −t) Bu(t)dt.
t0
Podstawiaja̧c sterowanie (?) do ostatniej zależności uzyskuje siȩ
Z t1
T
x0 =
eA(t0 −t) BB T eA (t0 −t) R−1 x0 dt,
t0
co oznacza, że x0 = RR−1 x0 .
Niech dla przykladu sterowania tarcza̧ obrotowa̧ t0 = 0, t1 = 1 oraz
!
!
1
0
x0 =
, x1 =
.
1
0
Uzyskujemy wiȩc
12
!
0 1
, sI − A =
0 0
A=
1
= 2
s
(sI − A)−1
Z
1
R=
0
!
s 1
=
0 s
!
s −1
,
0 s
!
1/s 1/s2
,
0
1/s
!
1
t
eAt =
,
0 1
! !
!
1 0
1 −t
0 dt
0 1
0 1
1
−t 1
Sta̧d
!
!
1/3 −1/2
12
6
R=
, R−1 =
.
−1/2
1
6 4
!
! !
1 0
12 6
1
u(t) = − 0 1
.
−t 1
6 4
1
Tak wiȩc sterowanie docelowe ma postać u(t) = 18t−10, a trajektoria
stanu procesu docelowego jest określona jak nastȩpuje
! !
1 t
1
x(t) =
0 1
1
1 t
+
0 1
!Z
0
t
1 −τ
0 1
!
!
0 18τ − 10 dτ.
1
czyli
x(t) =
1 + t − 5t2 + 3t3
1 − 10t + 9t2
13
!
=
t=1
!
0
.
0
Wyznaczanie rozwia̧zań liniowych
niestacjonarnych równań stanu
z czasem cia̧glym
Wektorowo-macierzowe równanie stanu liniowego
niestacjonarnego ukladu sterowania ma postać
ẋ(t) = A(t)x(t) + B(t)u(t), t ∈ [t0 , ∞), x(t0 ) = x0 .
Dla równania jednorodnego
ẋ(t) = A(t)x(t), t ∈ [t0 , ∞), x(t0 ) = x0
definiujemy macierz fundamentalna̧ (macierz podstawowa̧) ukladu Φ(t, t0 )
jako macierz stanowia̧ca̧ rozwia̧zanie macierzowego równania różniczkowego
Φ̇(t, t0 ) = A(t)Φ(t, t0 ), t ∈ [t0 , ∞), Φ(t0 , t0 ) = I.
Rozwia̧zanie jednorodnego równania stanu przewidujemy w postaci
x(t) = Φ(t, t0 )x(t0 ).
Weryfikacja rozwia̧zania jednorodnego równania stanu
d
(Φ(t, t0 )x(t0 )) = A(t)Φ(t, t0 )x(t0 )
dt
⇒ Φ̇(t, t0 )x(t0 ) = A(t)Φ(t, t0 )x(t0 )
⇒ ẋ(t) = A(t)x(t))
Weryfikacja warunku pocza̧tkowego
Φ(t0 , t0 )x(t0 ) = Ix(t0 ) = x(t0 ).
Rozwia̧zanie niejednorodnego równania stanu przewidujemy w postaci
t
Z
x(t) = Φ(t, t0 )x0 +
Φ(t, τ )B(τ )u(τ )dτ.
0
Weryfikacja rozwia̧zania niejednorodnego równania stanu
d
Φ(t, t0 )x0 +
dt
Z
t
Φ(t, τ )B(τ )u(τ )dτ
0
14
Z t
d
d
= Φ(t, t0 )x0 +
Φ(t, τ )B(τ )u(τ )dτ
dt
0 dt
Z
d t
+
Φ(t, τ )B(τ )u(τ )dτ
dt 0
Z t
= A(t) Φ(t, t0 )x0 +
Φ(t, τ )B(τ )u(τ )dτ
0
+B(t)u(t) ⇒ ẋ(t) = A(t)x(t) + B(t)u(t).
• Zastosowanie macierzy fundamentalnej do wyznaczania rozwia̧zań
okresowych równań stanu.
Rozwia̧zywanie nieliniowych równań metoda̧ Newtona
Dane jest nieliniowe równanie skalarne f (x) = 0. Dokonujemy linearyzacji równania w punkcie pocza̧tkowym x0
f (x) ∼ f (x0 ) + f 0 (x0 )(x − x0 )
⇒ x − x0 = −(f 0 (x0 ))−1 f (x0 ).
Obliczamy nowe przybliżenie rozwia̧zania
x1 = x0 − (f 0 (x0 ))−1 f (x0 ).
Dokonujemy linearyzacji równania w punkcie kolejnym x1
f (x1 ) + f 0 (x1 )(x − x1 )
⇒ x − x1 = −(f 0 (x1 ))−1 f (x1 ).
Obliczamy nowe przybliżenie rozwia̧zania
x2 = x1 − (f 0 (x1 ))−1 f (x1 )...
Wynika sta̧d iteracyjna metoda Newtona
xκ+1 = xκ − (f 0 (xκ ))−1 f (xκ ), κ = 0, 1, 2, ... .
Dla równań z argumentem wektorowym x ∈ Rn pochodna f 0 (xκ )
oznacza macierz Jacobiego, tj.
f 0 (xκ ) = (
∂fi
(xκ ))i,j=1,...,n .
∂xj
15
Aby wyznaczyć τ -okresowe rozwia̧zanie nieliniowego równania stanu
wyróżniamy w charakterze argumentu równania stanu jego stan pocza̧tkowy
i poszukujemy takiego stanu pocza̧tkowego, który zapewni τ -okresowy
przebieg zmiennych stanu. Równanie zapisujemy w postaci x(0)−x(τ, x(0), u) =
0. Rolȩ pochodnej f 0 (xκ ) pelni w tym przypadku macierz
∂xi (τ ) ,
∂xj (0) i,j=1,...n
f 0 (xκ ) = I − Φ(τ, 0) = I −
zaś metoda Newtona przyjmuje postać
−1 x(0)κ+1 = x(0)κ − (I − Φ(τ, 0)(x(0)κ )
x(0)κ − x(τ, x(0)κ , u) .
Wyznaczanie rozwia̧zań liniowych
stacjonarnych równań stanu
z czasem dyskretnym.
• Dyskretyzacja cia̧glych ukladów sterowania:
Niech T oznacza przedzial dyskretyzacji czasu i niech sterowanie bȩdzie
stale w przedziale [kT, (k + 1)T). Ze wzoru na rozwia̧zanie liniowego stacjonarnego ukladu sterowania wynika, że
x((k + 1)T) = eA((k+1)T−kT) x(kT)
Z
(k+1)T
+
eA((k+1)T−t) Bu(kT)dt.
kT
Zamiana zmiennych calkowania
T − t = t̃,
t = kT ⇒ t̃ = T,
t = (k + 1)T ⇒ t̃ = 0,
dt = −dt̃
pozwala zapisać zależność
Z
AT
0
eAt̃ Bu(kT)dt̃
x((k + 1)T) = e x(kT) −
T
czyli
Z
AT
x((k + 1)T) = e x(kT) +
0
16
T
eAt̃ dt̃Bu(kT)
= eAT x(kT) + A−1 (eAT − I)Bu(kT).
Podstawiaja̧c k w miejsce kT uzyskuje siȩ nastȩpuja̧cy opis ukladu dyskretnego
x(k + 1) = Ax(k) + Bu(k),
gdzie
A = eAT , B = A−1 (eAT − I)B.
Dla przykladu z macierzami stanu i sterowania
!
!
0
1
0
A=
, B=
−2 −2
1
uzyskuje siȩ
At
e
=
!
e−t (cos t + sin t)
e−t sin t
,
−2e−t sin t
e−t (cos t − sin t)
!
−1
−0.5
A−1 =
,
1
0
oraz
!
−T
−T
e
(cos
T
+
sin
T)
e
sin
T
A = eAT =
,
−2e−T sin T
e−T (cos T − sin T)
!
−T
0.5(1
−
e
(cos
T
+
sin
T)
B = A−1 (eAT − I)B =
.
e−T sin T
Metoda wzorów rekurencyjnych rozwia̧zywania liniowych stacjonarnych równań stanu z czasem dyskretnym
Do stacjonarnego dyskretnego równania stanu
x(k + 1) = Ax(k) + Bu(k), k = k0 , k0 + 1, k0 + 2, ...
x(k0 ) = x0
można zastosować metodȩ wzorów rekurencyjnych
x(k0 + 1) = Ax(k0 ) + Bu(k0 ),
x(k0 + 2) = Ax(k0 + 1) + Bu(k0 + 1)
17
= A2 x(k0 ) + ABu(k0 ) + Bu(k0 + 1),
x(k0 + 3) = Ax(k0 + 2) + Bu(k0 + 2)
= A3 x(k0 ) + A2 Bu(k0 ) + ABu(k1 ) + Bu(k2 ),
a wiȩc
k−k0
x(k) = A
x(k0 ) +
k−1
X
Ak−1−j Bu(j), k > k0 .
j=k0
Jeśli k0 = 0, to rozwia̧zanie przybiera postać
x(k) = Ak x(0) +
k−1
X
Ak−1−j Bu(j), k > 0.
j=0
Rolȩ macierzy fundamentalnej stacjonarnego dyskretnego równania
stanu pelni macierz Ak , która̧ można wyznaczyć stosuja̧c transformacjȩ
Z{x(k)} =
∞
X
x(k)z −k
k=0
do jednorodnego dyskretnego równania stanu
(x(k + 1) = Ax(k), k0 = 0, x(0) = x0 )
⇒ (zX(z) − zx0 = AX(z)).
Sta̧d
X(z) = (zI − A)−1 zx0 .
Porównanie rozwia̧zań w dziedzinie czasowej i operatorowej daje w wyniku
Ak = Z −1 {(zI − A)−1 z}.
Niech dyskretne równanie stanu bȩdzie postaci
!
!
0
1
0
x(k + 1) =
x(k) +
u(k),
−4 −5
1
x(0) =
!
1
, k0 = 0.
0
W tym przypadku
zI − A =
z −1
4 z+5
18
!
oraz
z
(zI − A)−1 z = 2
z + 5z + 4
!
z+5 1
,
−4 z
a wiȩc
Ak =
!
(−1)k 4/3 − (−4)k /3
(−1)k /3 − (−4)k /3
.
−(−1)k 4/3 + (−4)k 4/3 −(−1)k /3 + (−4)k 4/3
Rozwia̧zanie jednorodnego dyskretnego równania stanu ma zatem postać
!
(−1)k 4/3 − (−4)k /3
x(k) =
,
−(−1)k 4/3 + (−4)k 4/3
a rozwia̧zanie niejednorodnego równania dla u(k) = 1 ma postać
!
(−1)k 4/3 − (−4)k /3
x(k) =
−(−1)k 4/3 + (−4)k 4/3
!
k−1
X
(−1)k−j−1 /3 − (−4)k−j−1 /3
+
.
k−j−1
k−j−1
−(−1)
/3
+
(−4)
4/3
j=0
Wyznaczanie rozwia̧zań liniowych
niestacjonarnych równań stanu z czasem dyskretnym
Stosuja̧c do niestacjonarnego dyskretnego równania stanu
x(k + 1) = A(k)x(k) + B(k)u(k), k = k0 , k0 + 1, k0 + 2, ...
x(k0 ) = x0
metodȩ wzorów rekurencyjnych
x(k0 + 1) = A(k0 )x(k0 ) + B(k0 )u(k0 ),
x(k0 + 2) = A(k0 + 1)x(k0 + 1) + B(k0 + 1)u(k0 + 1) =
A(k0 + 1)A(k0 )x(k0 ) + A(k0 + 1)B(k0 )u(k0 )
+B(k0 + 1)u(k0 + 1)
uzyskujemy wzór ogólny
x(k) = Φ(k, k0 )x(k0 ) +
k−1
X
Φ(k, 1 + j)B(j)u(j), k > k0 ,
j=k0
gdzie Φ(k, k0 ) = A(k−1)A(k−2)...A(k0 ), k > k0 . Tak wiȩc rolȩ macierzy
fundamentalnej pelni w tym przypadku iloczyn macierzy A(k) dla k =
k0 , k0 + 1, k0 + 2, ..., k − 1.
19
Stabilność liniowych ukladów sterowania
z czasem cia̧glym
W teorii stabilności ukladów sterowania badamy wrażliwość trajektorii stanu na zaburzenia stanu pocza̧tkowego. Interesuje nas czy odchylenie rozwia̧zania równania zaburzonego od rozwia̧zania równania pierwotnego bȩdzie zanikać z uplywem czasu (w tym przypadku uklad sterowania określamy jako stabilny asymptotycznie), czy też odchylenie to
bȩdzie pozostawać w pewnym otoczeniu rozwia̧zania równania pierwotnego (w tym przypadku uklad sterowania określamy jako stabilny lecz
nieasymptotycznie), lub też czy odchylenie to bȩdzie nieograniczenie narastać z uplywem czasu (w tym przypadku uklad sterowania określamy
jako niestabilny). Badanie stabilności może dotyczyć wyróżnionej trajektorii stanu o poża̧danym przebiegu np. trajektorii stalej określaja̧cej tzw.
punkt równowagi ukladu. Dla ukladów liniowych obowia̧zuje nastȩpuja̧ca
Definicja: Punkt przestrzeni stanu xr , dla którego Axr = 0 dla
wszystkich chwil t ≥ 0, nazywamy punktem równowagi liniowego autonomicznego ukladu sterowania opisywanego równaniem
ẋ(t) = Ax(t), t ≥ 0, x(0) = x0 .
Jeżeli detA 6= 0, to liniowy uklad sterowania ma dokladnie jeden
punkt równowagi w pocza̧tku ukladu wspólrzȩdnych tj. zerowy punkt
równowagi.
Niech x(t) bȩdzie dowolna̧ (niezerowa̧) wyróżniona̧ trajektoria̧ stanu
liniowego ukladu sterowania zwia̧zana̧ z wyróżnionym stanem pocza̧tkowym
x0 i z wyróżnionym sterowaniem u(t). Ten wyróżniony rodzaj ruchu
ukladu sterowania spelnia równanie stanu
ẋ(t) = Ax(t) + Bu(t), x(t0 ) = x0 , t ∈ [t0 , +∞).
Analizȩ warunków stabilności ukladów sterowania można sprowadzić
do badania stabilności zerowego punktu równowagi zredukowanego ukladu sterowania określonego za pomoca̧ przeksztalcenia
(x̃(t) = x(t) − x(t)) ⇒ (x(t) = x̃(t) + x(t)).
Równanie stanu wzglȩdem nowych wspólrzȩdnych stanu przybierze
postać
˙ + ẋ(t) = A(x̃(t) + x(t)) + Bu(t),
x̃(t)
20
czyli
˙
x̃(t)
= Ax̃(t).
Rozwia̧zanie zerowe x̃(t) = 0 ostatniego równania jest równoważne z
wyróżnionym rozwia̧zaniem x(t) równania pierwotnego. Rozwia̧zanie to
jest punktem równowagi ukladu przeksztalconego, gdyż
˙
Ax̃(t) = 0 ⇒ x̃(t)
= 0.
Tak wiȩc badanie stabilności dowolnej wyróżnionej trajektorii stanu
liniowego stacjonarnego ukladu sterowania można sprowadzić do badania
zerowego punktu równowagi zredukowanego ukladu sterowania z ta̧ sama̧
macierza̧ stanu A.
Definicja: Punkt równowagi xr = 0 zredukowanego ukladu sterowania nazywa siȩ punktem stabilnym, jeżeli dla każdej liczby dodatniej
można dobrać taka̧ liczbȩ dodatnia̧ η = η(), że trajektoria rozpoczynaja̧ca siȩ w punkcie x0 , leża̧cym wewna̧trz kuli o promieniu η, pozostanie
wewna̧trz kuli o promieniu dla dowolnej chwili t > 0.
Definicja: Punkt równowagi xr = 0 zredukowanego ukladu sterowania nazywa siȩ punktem asymptotycznie stabilnym, jeżeli punkt ten jest
stabilny i ponadto limt→∞ x(t) = 0.
Analizuja̧c stabilność liniowego stacjonarnego ukladu sterowania bierzemy pod uwagȩ skladowa̧ swobodna̧ rozwia̧zania pochodza̧ca̧ od zaburzenia stanu pocza̧tkowego
ẋ(t) = Ax(t), x(0) = xr + δx0 , t ∈ [0, ∞)
⇒ x(t) = eAt δx0 , t ∈ [0, ∞).
Badanie stabilności asymptotycznej liniowych stacjonarnych ukladów
sterowania sprowadza siȩ do warunku zanikania skladowej rozwia̧zania
pochodza̧cej od zaburzenia stanu pocza̧tkowego tj. do warunku
lim eAt δx0 = 0
t→∞
Rozważana skladowa przybiera postać
eAt δx0 = L−1 {(sI − A)−1 }δx0
= L−1 {(
n
X
∆ij (s)δxj0 /∆(s))i=1,...,n } =
j=1
21
L−1 {(X1 (s, δx0 ), ...Xi (s, δx0 ), ..., Xn (s, δx0 ))T } (?)
gdzie ∆ij (s) jest wielomianem zmiennej zespolonej s stopnia <= n jako
element macierzy dola̧czonej (sI − A)D , a ∆(s) = det(sI − A) jest wielomianem zmiennej zespolonej s stopnia n. Do badania wyrażenia (?)
można zastosować metodȩ rozkladu na ulamki proste. W tym celu wyznaczamy wartości wlasne s1 , s2 , ..., sn macierzy stanu A tj. pierwiastki równania det(sI − A) = 0.
W zależności od charakteru tych wartości wlasnych uzyskujemy skladowe rozwia̧zania o różnej postaci.
• 1. Wartości wlasne s1 , s2 , ..., sn macierzy A sa̧ jednokrotne rzeczywiste - w tym przypadku
Xi (s, δx0 ) =
cin (δx0 )
ci1 (δx0 ) ci2 (δx0 )
+
+ ... +
,
s − s1
s − s2
s − sn
gdzie cij (δx0 ) sa̧ stalymi zależnymi od zaburzenia warunku pocza̧tkowego.
W dziedzinie czasowej uzyskujemy
xi (t, δx0 ) = ci1 (δx0 )es1 t + ci2 (δx0 )es2 t + ... + cin (δx0 )esn t .
• 2. Wśród wartości wlasnych s1 , s2 , ..., sn macierzy stanu A jest
r-krotna wartość wlasna rzeczywista - w tym przypadku
Xi (s, δx0 ) =
ci1 (δx0 )
ci2 (δx0 )
cir (δx0 )
cin (δx0 )
+
+ ... +
+ ... +
.
2
r
s − s1
(s − s2 )
(s − sr )
s − sn
W dziedzinie czasowej uzyskujemy
xi (t, δx0 ) = ci1 (δx0 )es1 t +ci2 (δx0 )tes2 t +...+cir (δx0 )tr−1 esr t +...+cin (δx0 )esn t .
• 3. Wśród wartości wlasnych s1 , s2 , ..., sn macierzy stanu A jest
para wartości zespolonych sprzȩżonych s1,2 = σ ± ω - w tym przypadku
Xi (s, δx0 ) =
ci2 (δx0 )
cin (δx0 )
ci1 (δx0 )
+
+ ... +
.
s − (σ + ω) s − (σ − ω)
s − sn
W dziedzinie czasowej uzyskujemy
xi (t, δx0 ) = c̃i1 (δx0 )eσt cos ωt + c̃i2 (δx0 )eσt sin ωt + ... + cin (δx0 )esn t .
• 4. Wśród wartości wlasnych s1 , s2 , ..., sn macierzy stanu A jest
para r-krotnych wartości zespolonych sprzȩżonych s1,2 = σ ± ω - w tym
przypadku
ci1 (δx0 )
ci2 (δx0 )
+
Xi (s, δx0 ) =
s − (σ + ω) s − (σ − ω)
22
+... +
ci1 (δx0 )
ci2 (δx0 )
cin (δx0 )
.
+
+ ... +
r
r
(s − (σ + ω))
(s − (σ − ω))
s − sn
W dziedzinie czasowej uzyskujemy
xi (t, δx0 ) = c̃i1 (δx0 )eσt cos ωt + c̃i2 (δx0 )eσt sin ωt
+... + c̃i,2r−1 (δx0 )tr−1 eσt cos ωt + c̃i2r (δx0 )tr−1 eσt sin ωt
+... + cin (δx0 )esn t .
Biora̧c pod uwagȩ zależność
lim tp eσt = 0, p = 1, 2, ...; σ < 0,
t→∞
wnioskujemy, że we wszystkich czterech przypadkach skladowe swobodne
rozwia̧zania równania stanu pochodza̧ce od zaburzenia warunku pocza̧tkowego zanikaja̧ wraz z uplywem czasu t → ∞.
Oznacza to, że warunkiem koniecznym i wystarczaja̧cym stabilności
liniowych stacjonarnych ukladów sterowania jest polożenie wszystkich
wartości wlasnych s1 , s2 , ..., sn macierzy stanu A w lewej pólplaszczyźnie
zmiennej zespolonej tj. spelnienie warunku Re(si ) < 0, i = 1, ..., n.
6
s
u
u
u
-
u
23
• Definicja stabilności eksponencjalnej: Punkt równowagi x = 0
zredukowanego ukladu sterowania nazywa siȩ punktem stabilnym eksponencjalnie, jeżeli istnieja̧ dwie liczby η > 0 i λ < 0 takie, że
||x(t)|| ≤ η||x(0)||eλt .
Dla stabilnego liniowego ukladu sterowania o pojedynczych wartościach
wlasnych si , i = 1, ..., n uzyskuje siȩ
λ = max Re(si )
i=1,...,n
tj. szybkość stabilności określona jest w tym przypadku przez maksymalna̧ czȩść rzeczywista̧ wartości wlasnych macierzy stanu. Jeśli natomiast uklad posiada wielokrotne wartości wlasne, to zachodzi oszacowanie
λ = max Re(si ) + ,
i=1,...,n
gdzie jest dowolnie mala̧ liczba̧ dodatnia̧ - tak wiȩc również w tym przypadu wykladnik szybkości stabilności jest w przybliżeniu równy maksymalnej czȩści rzeczywistej wartości wlasnych macierzy stanu.
6
s
u
λ
u
u
-
u
24
W przypadku zamkniȩtego ukladu sterowania
ẋ(t) = Ãx(t), Ã = A + BKC
badanie stabilności asymptotycznej sprowadza siȩ do weryfikacji polożenia
wartości wlasnych macierzy stanu à zamkniȩtego ukladu sterowania.
Ponieważ wartości wlasne macierzy A (lub Ã) sa̧ pierwiastkami równania
algebraicznego stopnia n, wiȩc zbadać ich polożenie na plaszczyźnie s
można stosuja̧c kryterium Hurwitza. W tym celu
• (a) porza̧dkujemy równanie wartości wlasnych do postaci
∆(s) = an sn + an−1 sn−1 + ... + a1 s + a0 = 0,
• (b) sprawdzamy, czy wszystkie wspólczynniki ai sa̧ różne od zera i
maja̧ ten sam znak,
• (c) sprawdzamy, czy wszystkie minory glówne ∆i macierzy Hurwitza
H sa̧ dodatnie, gdzie

a1
a
 3
H=
a5
...
a0 0 0
a2 a1 a0
a4 a3 a2
... ... ...

...
...


...
...
n×n
Inna postać macierzy Hurwitza


an−1 an
0
0
0 0...
a

 n−3 an−2 an−1 an 0 0...

H=

an−5 an−4 an−3 an−2 0 0...

...
...
...
... ... ... ... n×n
• Przyklad:
Macierz stanu zredukowanego ukladu sterowania z czasem cia̧glym
ma postać


−1 α
0


A =  β −1 α  ,
0
β −1
25
przy czym α i β sa̧ parametrami ukladu. Aby zbadać dla jakich parametrów uklad sterowania jest asymptotycznie stabilny zapisujemy równanie
wartości wlasnych macierzy stanu


s + 1 −α
0


det(sI − A) = det  β
s + 1 −α  = 0.
0
−β s + 1
Określamy nastȩpnie wielomian charakterystyczny ukladu w postaci
standardowej
∆(s) = s3 + 3s2 + (3 − 2αβ)s + 1 − 2αβ = 0 ⇒ 1 − 2αβ > 0,
co oznacza, że a3 = 1, a2 = 3, a1 = 3 − 2αβ i a0 = 1 − 2αβ.
Zapisujemy macierz Hurwitza


2 − 2αβ 1 − 2αβ
0


A= 1
3
3 − 2αβ 
0
0
1
Kryterium stabilności Hurwitza implikuje warunki
• a1 = 3 − 2αβ > 0 i a0 = 1 − 2αβ > 0 (dodatniość wspólczynników
wielomianu charakterystycznego ukladu),
• ∆1 = 3 − 2αβ > 0, i ∆2 = 8 − 4αβ > 0 ⇒ αβ < 0.5 (dodatniość
minorów glównych macierzy Hurwitza).
Tak wiȩc obszar stabilności parametrycznej ukladu sterowania jest
określony przez nierówność
αβ < 0.5.
26
Stabilność liniowych stacjonarnych
ukladów sterowania z czasem dyskretnym
Badanie stabilności asymptotycznej liniowych stacjonarnych ukladów
sterowania z czasem dyskretnym sprowadza siȩ do warunku zanikania
skladowej rozwia̧zania pochodza̧cej od zaburzenia stanu pocza̧tkowego
tj. do warunku
lim Ak δx0 = 0
k→∞
Rozważana skladowa przybiera postać
Ak δx0 = Z −1 {(zI − A)−1 z}δx0
=Z
−1
n
X
{(
∆ij (z)zδxj0 /∆(z))i=1,...,n } =
j=1
Z −1 {(X1 (z, δx0 ), ...Xi (z, δx0 ), ..., Xn (z, δx0 ))T } (?)
gdzie ∆ij (z) jest wielomianem zmiennej zespolonej s stopnia <= n jako
element macierzy dola̧czonej (zI − A)D , a ∆(z) = det(zI − A) jest wielomianem zmiennej zespolonej z stopnia n. Do badania wyrażenia (?)
można zastosować metodȩ rozkladu na ulamki proste. W tym celu wyznaczamy wartości wlasne z1 , z2 , ..., zn macierzy stanu A ukladu dyskretnego tj. pierwiastki równania det(zI − A) = 0.
W zależności od charakteru tych wartości wlasnych uzyskujemy skladowe
rozwia̧zania o różnej postaci.
• 1. Wartości wlasne z1 , z2 , ..., zn macierzy A sa̧ jednokrotne rzeczywiste - wtedy
Xi (z, δx0 ) =
ci1 (δx0 )z ci2 (δx0 )z
cin (δx0 )z
+
+ ... +
,
z − z1
z − z2
z − zn
gdzie cij (δx0 sa̧ stalymi zależnymi od zaburzenia warunku pocza̧tkowego.
W dziedzinie czasowej uzyskujemy
xi (k, δx0 ) = ci1 (δx0 )z1k + ci2 (δx0 )z2k + ... + cin (δx0 )znk .
• 2. Wśród wartości wlasnych z1 , z2 , ..., zn macierzy stanu A jest
r-krotna wartość wlasna rzeczywista - wtedy
Xi (z, δx0 ) =
ci1 (δx0 )z ci2 (δx0 )z
cir (δx0 )z
cin (δx0 )z
+
+ ... +
+ ... +
.
2
r
z − z1
(z − z2 )
(z − zr )
z − zn
27
W dziedzinie czasowej uzyskujemy
xi (k, δx0 ) = ci1 (δx0 )z1k +ci2 (δx0 )kz1k +...+cir (δx0 )k r−1 z1k +...+cin (δx0 )znk .
• 3. Wśród wartości wlasnych z1 , z2 , ..., zn macierzy stanu A jest
para wartości zespolonych sprzȩżonych z1,2 = σe±ω - wtedy
Xi (z, δx0 ) =
ci1 (δx0 )z
ci2 (δx0 )
cin (δx0 )z
.
+
+ ... +
ω
−ω
z − σe
s − σe
z − zn
W dziedzinie czasowej uzyskujemy
xi (k, δx0 ) = c̃i1 (δx0 )σ k cos ωk + c̃i2 (δx0 )σ k sin ωk + ... + cin (δx0 )znk .
• 4. Wśród wartości wlasnych z1 , z2 , ..., zn macierzy stanu A jest
para r-krotnych wartości zespolonych sprzȩżonych z1,2 = σe±ω - wtedy
Xi (z, δx0 ) =
+
ci1 (δx0 )
ci2 (δx0 )
+
+ ...
z − σeω z − σe−ω
ci1 (δx0 )
ci2 (δx0 )
cin (δx0 )
+
+ ... +
.
ω
r
−ω
r
(z − σe )
(z − σe )
z − zn
W dziedzinie czasowej uzyskujemy
xi (k, δx0 ) = c̃i1 (δx0 )σ k cos ωk + c̃i2 (δx0 )σ k sin ωk + ...
+c̃i,2r−1 (δx0 )k r−1 σ k cos ωk + c̃i2r (δx0 )k r−1 σ k sin ωk + ... + cin (δx0 )znk .
28
Biora̧c pod uwagȩ zależność
lim k p z k = 0, p = 1, 2, ...; |z| < 1,
k→∞
wnioskujemy, że warunkiem koniecznym i wystarczaja̧cym stabilności
liniowych stacjonarnych ukladów sterowania z czasem dyskretnym jest
polożenie wszystkich wartości wlasnych z1 , z2 , ..., zn macierzy stanu A
ukladu dyskretnego wewna̧trz okȩgu jednostkowego plaszczyzny zmiennej
zespolonej z tj. spelnienie warunku |zi | < 1, i = 1, ..., n.
6
z
'$
u 1
u
u
u
&%
-
Lemat: Transformacja z = (s + 1)/(s − 1), s 6= 1 przeprowadza kolo
jednostkowe plaszczyzny z w lewa̧ pólplaszczyznȩ zmiennej zespolonej s.
Dowód: Oznaczmy s = a +  b . Z zależności
|z| = |(a +  b + 1)/(a +  b − 1)| < 1
wynika, że
(a + 1)2 + b2 < (a − 1)2 + b2
⇒ (2a < −2a) ⇒ (4a < 0) ⇒ (a = Re(s) < 0).
29
Tak wiȩc podstawiaja̧c z = (s + 1)/(s − 1) do równania det(zI − A) =
0 sprowadzamy badanie stabilności dyskretnych ukladów sterowania do
kryterium Hurwitza.
Przyklad: Macierz stanu zredukowanego ukladu sterowania z czasem
dyskretnym ma postać
A=
!
−α −1
,
β 2 −α
przy czym α i β sa̧ parametrami ukladu. Aby zbadać dla jakich parametrów uklad sterowania z czasem dyskretnym jest asymptotycznie
stabilny zapisujemy równanie wartości wlasnych macierzy stanu
z+α
1
det(zI − A) = det
2
−β
z+α
!
= 0.
Określamy nastȩpnie wielomian charakterystyczny ukladu w postaci
standardowej
∆(z) = z 2 + 2αz + α2 + β 2 = 0.
Dokonujemy podstawienia z = (s + 1)/(s − 1) uzyskuja̧c
s+1
s+1 2
) + 2α
+ α2 + β 2 = 0/ · (s − 1)2 .
s−1
s−1
Określamy nastȩpnie wielomian charakterystyczny ukladu wzglȩdem
zmiennej s:
(
1 + 2α + α2 + β 2 s2 + (2 − 2(α2 + β 2 ))s + 1 − 2α + α2 + β 2 = 0.
co oznacza, że a2 = 1 + 2α + α2 + β 2 , a1 = 2 − 2(α2 + β 2 ) i a0 =
1 − 2α + α2 + β 2 .
Ponieważ a2 = (1 + α)2 + β 2 i a0 = (1 − α)2 + β 2 , wiȩc kryterium stabilności Hurwitza określa obszar stabilności parametrycznej jako wnȩtrze
kola
α2 + β 2 < 1.
Stabilność dyskretnych liniowych ukladów sterowania w ukladzie zamkniȩtym sprowadza siȩ do badania, czy wartości wlasne macierzy stanu
zamkniȩtego ukladu dyskretnego
à = A + BKC
30
leża̧ wewna̧trz kola jednostkowego na plaszczyźnie z.
Zanikanie skladowej swobodnej rozwia̧zania równania stanu liniowego
dyskretnego ukladu sterowania
lim Ak δx0 = 0
k→∞
dla dowolnego zaburzenia stanu pocza̧tkowego implikuje zbieżność do
zera elementów macierzy Ak .
Praktyczne kryterium badania stabilności dyskretnych ukladów sterowania uzyskujemy obliczaja̧c potȩgi macierzy stanu ukladu dyskretnego
podnosza̧c je do kwadratu.
A, A2 = AA, A4 = A2 A2 , A8 = A4 A4 , A16 = A8 A8 ...
Jeśli elementy potȩgowanych macierzy da̧ża̧ do zera, to uklad dyskretny
jest asymptotycznie stabilny. Metoda ta nazywana jest metoda̧ szybkiego potȩgowania macierzy. Wyznacza ona cia̧g macierzy
k
A, A2 , A4 , A8 , ..., A2 .
Oznaczmy elementy ostatniej macierzy jako (aij )2k .
Warunek stopu metody szybkiego potȩgowania macierzy dla badania stabilności liniowych dyskretnych ukladów sterowania przybiera
postać
1
|(aij )2k | < , i, j = 1, 2, ..., n,
n
gdzie n jest wymiarem kwadratowej macierzy stanu A.
k
Jeśli warunek stopu jest spelniony, to elementy macierzy A2 spelniaja̧
warunki
(cij )2k
|(aij )2k | ≤
, i, j = 1, 2, ..., n
n
dla stalych (cij )2k < 1. Spelniaja̧ one wiȩc warunek
|(aij )2k | ≤
(c)2k
, i, j = 1, 2, ..., n
n
k+1
dla stalej (c)2k = maxij (cij )2k < 1. Elementy macierzy A2
spelniaja̧
oszacowania
(c) k (c)2k
(c)2k+1
=
,
|(aij )2k+1 | ≤ n 2
n
n
n
gdzie (c)2k+1 = (c)2k (c)2k < (c)2k < 1. Oszacowania te da̧ża̧ monotonicznie do zera dla k → ∞.
31
Przyklad: Niech jednorodne równanie stanu liniowego dyskretnego
ukladu sterowania ma postać


1
0
0
2


x(k + 1) = − 16 13 − 31  x(k)
− 14 0 − 21
Warunek stopu metody szybkiego potȩgowania macierzy ma w tym
przypadku postać
1
|(aij )2k | < , i, j = 1, 2, 3; (n = 3).
3
Elementy macierzy A (k = 0) nie spelniaja̧ warunku stopu metody szybkiego potȩgowania macierzy, gdyż 12 > 13 .
Obliczamy


 

1
1
1
0 0
0 0
0 0
2
2
4


  1 1 1
A2 = − 16 13 − 31  − 16 13 − 31  = − 18
9
18 
1
1
1
1
−4 0 −2
−4 0 −2
0 0 14
Dla k = 1 warunek stopu metody szybkiego potȩgowania macierzy jest
spelniony. Oznacza to, że rozpatrywany liniowy dyskretny uklad sterowania jest asymptotycznie stabilny.
32
Stabilność liniowych okresowych ukladów sterowania
Dla niektórych ukladów sterowania charakterystyczna jest okresowa
(cykliczna) zmienność jego parametrów. Wyróżniona̧ trajektoria̧ stanu
może być w tym przypadku krzywa zamkniȩta zwana także cyklem granicznym. Jednorodny liniowy okresowy uklad sterowania opisywany jest
równaniem stanu
ẋ(t) = A(t)x(t),
gdzie niestacjonarna macierz stanu A(t) jest macierza̧ okresowa̧ tj.
A(t + τ ) = A(t).
Lemat: Znormalizowana macierz fundamentalna Φ(t) = Φ(t, 0) liniowego okresowego ukladu sterowania posiada reprezentacjȩ
Φ(t) = Γ (t)eΛt , t ∈ [0, +∞),
gdzie Γ (t) jest nieosobliwa̧ macierza̧ okresowa̧, zaś Λ jest macierza̧ stala̧.
Dowód: Macierz Φ(t) spelnia z definicji równanie
Φ̇(t) = A(t)Φ(t), Φ(0) = I.
Z teorii równań różniczkowych wiadomo, że każda macierz fundamentalna Φ̃(t) może być uzyskana ze znormalizowanej macierzy fundamentalnej Φ(t) za pomoca̧ nieosobliwego przeksztalcenia liniowego C tj. Φ̃(t) =
Φ(t)C. Ponieważ dla ukladu okresowego Φ(t + τ ) jest jego macierza̧ fundamentalna̧
d(t + τ )
dΦ(t + τ )
= Φ0 (t + τ )
= A(t + τ )Φ(t + τ ) = A(t)Φ(t + τ ),
dt
dt
wiȩc Φ(t + τ ) = Φ(t)C i Φ(τ ) = C (t = 0). Oznacza to, że Φ(t + τ ) =
Φ(t)Φ(τ ).
Z teorii macierzy wiadomo, że każda macierz nieosobliwa posiada tzw.
reprezentacjȩ logarytmiczna̧ tj.
Φ(τ ) = eΛτ
.
33
Jeśli macierz Φ(τ ) posiada jednokrotne wartości wlasne s1 , s2 , ..., sn ,
to reprezentacjȩ taka̧ można latwo uzyskać stosuja̧c nieosobliwe przeksztalcenie diagonalizuja̧ce P :
P −1 Φ(τ )P = diag (si ).
1≤i≤n
Macierz P jest określona przez wektory wlasne Pi , i = 1, ..., n macierzy Φ(τ ) zwia̧zane z poszczególnymi wartościami wlasnymi. Wektory te
spelniaja̧ równania
Φ(τ )Pi = si Pi , i = 1, ..., n
i moga̧ być wyznaczone przez rozwia̧zanie tych równań. Ponieważ
det(si I − Φ(τ )) = 0,
wiȩc jedna̧ wspólrzȩdna̧ wektora Pi zakladamy jako dowolna̧ wartość niezerowa̧, a pozostale wspólrzȩdne tego wektora obliczamy z ukladu n − 1
równań liniowo niezależnych. Wartości wlasne si przedstawiamy w postaci wykladniczej
si = eλi τ , λi =
1
(ln|si | + (arg(si ) + 2kπ).
τ
i uzyskujemy zależności
Φ(τ ) = P diag (si ) P −1 = P diag (eλi τ ) P −1
1≤i≤n
1≤i≤n
= P (I + diag (λi τ ) + diag ((λi τ )2 /2!) + ...) P −1
1≤i≤n
1≤i≤n
= I + P diag (λi τ ) P −1 +
1≤i≤n
=e
P diag (λi τ ) P −1
1≤i≤n
1
P diag (λi τ ) P −1 P diag (λi τ ) P −1 + ...
2! 1≤i≤n
1≤i≤n
P diag (λi ) P −1 τ
=e
1≤i≤n
= eΛτ , Λ = P diag (λi ) P −1
1≤i≤n
Z zależności
Φ(t) = Φ(t)e−Λt eΛt = Γ (t)eΛt , Γ (t) = Φ(t)e−Λt ,
Γ (t + τ ) = Φ(t + τ )e−Λ(t+τ ) = Φ(t)Φ(τ )e−Λτ e−Λt = Φ(t)e−Λt = Γ (t)
wynika,że macierz Γ (t) jest macierza̧ τ -okresowa̧. Elementy tej macierzy
sa̧ jednostajnie ograniczone na osi czasu jako cia̧gle funkcje okresowe.
34
Definicja: Macierz fundamentalna Φ(τ ) liniowego ukladu okresowego
nazywa siȩ macierza̧ monodromii, a jej wartości wlasne nazywaja̧ siȩ
mnożnikami Floqueta lub multyplikatorami tego ukladu.
Twierdzenie: Liniowy okresowy uklad sterowania jest stabilny (stabilny asymptotycznie) wtedy i tylko wtedy, gdy wszystkie multyplikatory
(wartości wlasne macierzy monodromii Φ(τ )) tego ukladu leża̧ w domkniȩtym kole jednostkowym |si | ≤ 1, i = 1, ..., n (leża̧ wewna̧trz kola
jednostkowego |si | < 1, i = 1, ..., n).
Dowód: Skladowa rozwia̧zania liniowego ukladu okresowego pochodza̧ca od zaburzenia warunku pocza̧tkowego ma postać
x(t) = Γ (t)eΛt δx0 .
Ze wzglȩdu na jednostajna̧ ograniczoność macierzy Γ (t) na osi czasu
zachodzi oszacowanie
||x(t)|| ≤ c||eΛt ||.
Oznacza to, że badany uklad jest stabilny asymptotycznie wtedy i tylko
wtedy, gdy wartości wlasne λi macierzy Λ leża̧ w lewej pólplaszczyźnie
zmiennej zespolonej. Warunek ten jest jednak równoważny z polożeniem
wartości wlasnych macierzy Φ(τ ) wewna̧trz kola jednostkowego z uwagi
na zwia̧zek
s i = e λi τ .
Przyklad: Niech macierz A(t) bȩdzie określona jak nastȩpuje:
!
!
0 1
a1 0
A(t)t∈[0,π) = Ā =
, A(t)t∈[π,2π) = Ā¯ =
−1 0
0 a2
Mamy wiȩc
Φ(t) = eĀt
!
!
cos t sin t
−1 0
, Φ(π) =
,
−sin t cos t
0 −1
!
−ea1 π
0
.
Φ(2π) =
0
−ea2 π
Sta̧d wynika, że si = −eai π i warunek stabilności ukladu okresowego
przybiera postać ai < 0, i = 1, 2..
35
Stabilność ukladów zlinearyzowanych
Warunki stabilności liniowych ukladów sterowania można stosować do
badania stabilności ukladów nieliniowych w malym otoczeniu wyróżnionej
trajektorii stanu. Takimi wyróżnionymi trajektoriami stanu moga̧ być
m.in. trajektorie stale (np. optymalny statyczny punkt pracy ukladu)
lub trajektorie okresowe (np. optymalna cykliczna trajektoria ukladu).
Zalożenie o funkcjonowaniu procesu w malym otoczeniu wymienionych
trajektorii pozwala uprościć model matematyczny ukladu rozwijaja̧c nieliniowe funkcje w szereg Taylora pierwszego rzȩdu i przejść do modelu
zlinearyzowanego wzglȩdem zmiennych przyrostowych czyli malych odchyleń od trajektorii wyróżnionej.
Niech δx(t), δu(t) i ȳ bȩda̧ malymi odchyleniami stanu,sterowania i
wyjścia od statycznego punktu pracy x̄, ū iȳ ukladu. Nieliniowy opis
ukladu
ẋ(t) = f (x(t), u(t)),
y(t) = g(x(t), u(t))
linearyzujemy w punkcie pracy (x̄, ū)
∂f (x̄, ū)
∂f (x̄, ū)
d
(x̄+δx(t)) = f (x̄, ū)+
δx(t)+
δu(t)+rf (δx(t), δu(t)),
dt
∂x
∂u
∂g(x̄, ū)
∂g(x̄, ū)
δx(t) +
δu(t) + rg (δx(t), δu(t)),
∂x
∂u
gdzie rf (δx(t), δu(t)) i rg (δx(t), δu(t)) sa̧ nieliniowymi czlonami rozwiniȩć
(resztami z rozwiniȩcia w szereg Taylora w szereg pierwszego rzȩdu)
spelniaja̧cymi warunki
ȳ + δy(t) = g(x̄, ū) +
rf (δx(t), δu(t))
= 0,
||δx||→0
||δx||
lim
rf (δx(t), δu(t))
= 0.
||δu||→0
||δu||
lim
Reszty te sa̧ nieskończenie malymi rzȩdu wyższego niż odpowiednio ||δx||
i ||δu||. Można je pomina̧ć dla malych odchyleń od punktu pracy i przejść
do modelu zlinearyzowanego
δ ẋ(t) =
∂f (x̄, ū)
∂f (x̄, ū)
δx(t) +
δu(t),
∂x
∂u
δy(t) =
∂g(x̄, ū)
∂g(x̄, ū)
δx(t) +
δu(t).
∂x
∂u
36
Podstawa̧ do badania stabilności ukladu zlinearyzowanego jest weryfikacja polożenia wartości wlasnych macierzy Jacobiego
A=
∂fi (x̄, ū) ∂f (x̄, ū)
=
.
i,j=1,...,n
∂x
∂xj
W przypadku wyróżnionego cyklicznego sposobu prowadzenia procesu macierz stanu ukladu zlinearyzowanego przybiera niestacjonarna̧
postać okresowa̧
A(t) =
∂fi (x̃(t), ũ(t)) ∂f (x̃(t), ũ(t))
=
,
i,j=1,...,n
∂x
∂xj
gdzie x̃(t) jest cykliczna̧ trajektoria̧ stanu, a ũ(t) jest cyklicznym sterowaniem.
37