Synteza uogólnionego optymalnego regulatora stanu. Układy z

Transkrypt

Synteza uogólnionego optymalnego regulatora stanu. Układy z
Synteza uogólnionego optymalnego regulatora stanu.
Uklady z czasem cia̧glym.
W uogólnionym problemie syntezy optymalnego regulatora stanu do wskaźnika
jakości wlaczamy nie tylko skladniki zapewniaja̧ce minimalizacjȩ odchylenia
trajektorii aktualnej od trajektorii optymalnej za pomoca̧ sterowań koryguja̧cych
o malej amplitudzie lecz także skladniki wynikaja̧ce z liniowo-kwadratowej
aproksymacji pierwotnego wskaźnika jakości zapewniaja̧ce zmniejszenie strat
jakości procesu w czasie regulacji zaburzenia stanu. Podstawȩ do wyznaczania
uogólnionego optymalnego regulatora stanu stanowi rozwia̧zanie nastȩpuja̧cego
uogólnionego niestacjonarnego problemu LKSO: zminimalizować wskaźnik jakości
procesu regulacji stanu
Z t1
T
T
G(x, u) = q x(t1 ) + 0.5x (t1 )Qx(t1 ) +
(pT (t)x(t) + rT (t)u(t))dt
0
Z
+0.5
t1
(xT (t)P (t)x(t) + uT (t)R(t)u(t))dt
0
uwzglȩdniaja̧c liniowe równanie stanu
ẋ(t) = A(t)x(t) + B(t)u(t), t ∈ [0, t1 ],
z zadanym warunkiem pocza̧tkowym
x(0) = x0 .
Dodatkowe skladniki wskaźnika jakości uogólnionego niestacjonarnego problemu LKSO moga̧ wynikać z aproksymacji nieliniowego wskaźnika jakości
Z t1
g(x(t), u(t), t)dt
G(x, u) = h(x(t1 )) +
0
wyjściowego problemu sterowania tj.
q = hx (xo (t1 )), Q = αI + hxx (xo (t1 )),
p(t) = gx (xo (t), uo (t), t), P (t) = βI + gxx (xo (t), uo (t), t),
r(t) = gu (xo (t), uo (t), t), R(t) = γI + guu (xo (t), uo (t), t),
gdzie α, β, γ sa̧ dodatnimi wspólczynnikami wagowymi zapewniaja̧cymi nieujemna̧ określoność macierzy Q i P (t) oraz dodatnia̧ określoność macierzy R(t)
1
(tj. zapewniaja̧cymi pierwotna̧ funkcjȩ wskaźnika jakości problemu LKSO jako
miary odchylenia procesu rzeczywistego od procesu optymalnego). Wprowadzenie dodatkowych skladników aproksymuja̧cych pierwotny wskaźnik jakości
procesu pozwala zmniejszyć straty jakości procesu w trakcie regulacji stanu.
Tak zmodyfikowane macierze Q, P (t), R(t) nie musza̧ mieć postaci diagonalnej.
Do wyznaczenia optymalnego regulatora stanu zastosujemy zasadȩ maksimum. Zapisujemy hamiltonian problemu
H(λ(t), x(t), u(t), t) = −(pT (t)x(t)+rT (t)u(t))−0.5(xT (t)P (t)x(t)+uT (t)R(t)u(t))
+λT (t)(A(t)x(t) + B(t)u(t))
i wydzielamy jego czȩść zależna̧ od sterowania
H̃(λ(t), x(t), u(t), t) = −rT (t)u(t) − 0.5uT (t)R(t)u(t) + λT (t)B(t)u(t).
Przyrównanie pochodnej Hu (t) do zera daje w wyniku
−rT (t) − uT (t)R(t) + λT (t)B(t) = 0 ⇒ uo (t) = R−1 (t)B T (t)λ(t) − R−1 r(t).
Oczywiście
Huu (t) = −R(t) < 0,
a wiȩc wyznaczone rozwia̧zanie maksymalizuje hamiltonian problemu w sensie globalnym. Sterowanie to podstawiamy do ukladu równań kanonicznych
zasady maksimum
ẋ(t) = A(t)x(t) + B(t)R−1 B T (t)λ(t) − B(t)R−1 (t)r(t), x(0) = x0 ,
λ̇(t) = P (t)x(t) − AT (t)λ(t) + p(t), λ(t1 ) = −q − Qx(t1 ).
Do rozwiazania tego ukladu równań różniczkowych z warunkami dwugranicznymi wygodnie jest zastosować podstawienie Riccatiego z wyrazem wolnym,
gdyż uklad ten posiada wyrazy wolne:
λ(t) = K(t)x(t) + l(t),
gdzie l(t) ∈ Rn
Stosuja̧c podstawienie Riccatiego z wyrazem wolnym do ukladu równań
kanonicznych uzyskujemy
ẋ(t) = A(t)x(t) + B(t)R−1 B T (t)(K(t)x(t) + l(t)) − B(t)R−1 (t)r(t), x(0) = x0 ,
2
˙
˙ = P (t)x(t) − AT (t)(K(t)x(t) + l(t)) + p(t).
K(t)x(t)
+ K(t)ẋ(t) + l(t)
Podstawiamy pierwsze równanie do drugiego
˙
K(t)x(t)
+ K(t) A(t)x(t) + B(t)R−1 B T (t)(K(t)x(t)+
˙ = P (t)x(t) − AT (t)(K(t)x(t) + l(t)) + p(t).
l(t)) − B(t)R−1 (t)r(t) + l(t)
Równanie powyższe bȩdzie spelnione, jeśli bȩdzie spelnione macierzowe równanie
różniczkowe Riccatiego wyzerowuja̧ce wyrazy zwia̧zane z wektorem stanu x(t)
K̇(t) = −K(t)A(t)−AT A(t)−K(t)B(t)R−1 (t)B T (t)K(t)+P (t), K(t1 ) = −Q,
i jeśli bȩdzie spelnione równanie różniczkowe dla wyrazu wolnego
˙ = K(t)B(t)R−1 (t)(B T (t)l(t) − r(t)) + p(t), l(t1 ) = −q.
l(t)
Równanie uogólnionego optymalnego regulatora stanu przybiera postać
u(t) = R−1 (t)B T (t)K(t)x(t) + R−1 (t)(l(t) − r(t)).
Tak wiȩc celem syntezy uogólnionego optymalnego niestacjonarnego regulatora stanu rozwia̧zujemy najpierw macierzowe równanie różniczkowe Riccatiego, a nastȩpnie, korzystaja̧c ze znajomości macierzy K(t), wyznaczamy
rozwia̧zanie pomocniczego równania różniczkowego dla wektora l(t).
Jeśli fluktuacje parametru obiektu sterowania sa̧ sporadyczne, to możemy
poslużyć siȩ stacjonarnym regulatorem stanu. Podstawȩ do syntezy uogólnionego
optymalnego stacjonarnego regulatora stanu stanowi rozwia̧zanie nastȩpuja̧cego
problemu LKSO
zminimalizować wskaźnik jakości
Z ∞
G(x, u) =
(pT x(t) + 0.5xT (t)P x(t) + rT u(t) + 0.5uT (t)Ru(t))dt
0
przy ograniczeniach w postaci liniowego stacjonarnego równania stanu
ẋ(t) = Ax(t) + Bu(t), t ∈ [0, +∞)
z zadanym warunkiem pocza̧tkowym
x(0) = x0
3
i końcowym
x(∞) = 0.
Dodatkowe skladniki wskaźnika jakości uogólnionego stacjonarnego problemu LKSO moga̧ wynikać z aproksymacji nieliniowego wskaźnika jakości
wyjściowego problemu sterowania
Z ∞
g(x(t), u(t), t)dt
G(x, u) =
0
w nastȩpuja̧cej postaci uśrednionej
Z
1 τ
gx (x (t), u (t), t)dt, P = βI + lim
gxx (xo (t), uo (t), t)dt,
τ
→∞
τ
0
0
Z τ
Z τ
1
1
gu (xo (t), uo (t), t)dt, R = lim
γI + guu (xo (t), uo (t), t)dt,
r = lim
τ →∞ τ 0
τ →∞ τ 0
1
p = lim
τ →∞ τ
Z
τ
o
o
gdzie β, γ sa̧ dodatnimi wspólczynnikami wagowymi zapewniaja̧cymi nieujemna̧ określoność macierzy P oraz dodatnia̧ określoność macierzy R (tj.
zapewniaja̧cymi pierwotna̧ funkcjȩ wskaźnika jakości problemu LKSO jako
miary odchylenia procesu rzeczywistego od procesu optymalnego). Wprowadzenie dodatkowych skladników aproksymuja̧cych pierwotny wskaźnik jakości
procesu pozwala zmniejszyć straty jakości procesu w trakcie regulacji stanu.
Tak zmodyfikowane macierze P, R nie musza̧ mieć postaci diagonalnej.
Macierze A i B moga̧ być uśrednieniami macierzy Jacobiego
fx (xo , uo (t), t), fu (xo , uo (t), t)
wyjściowego równania stanu na procesie optymalnym tj.
Z
1 τ
A = lim
fx (xo , uo (t), t)dt,
τ →∞ τ 0
Z
1 τ
B = lim
fu (xo , uo (t), t)dt.
τ →∞ τ 0
Warunek pocza̧tkowy x0 stanowi odchylenie pocza̧tkowe aktualnego stanu od
stanu optymalnego (nominalnego). Ponieważ z zalożenia zaburzenia stanu sa̧
stosunkowo rzadkie, wiȩc mamy do dyspozycji dlugi horyzont czasowy dla zregulowania zaistnialego zaburzenia stanu. Przyjmuja̧c idealny przypadek nieskończonego horyzontu czasowego regulacji stanu stawiamy wymaganie pelnej
4
niwelacji zaburzenia stanu x(∞) = 0. Dlatego stan końcowy nie pojawia siȩ
we wskaźniku jakości uogólnionego stacjonarnego problemu LKSO.
Uogólniony stacjonarny problem LKSO rozwia̧żemy stosuja̧c zasadȩ maksimum. Zapisujemy hamiltonian problemu
H(λ(t), x(t), u(t)) = −(pT x(t) + 0.5xT (t)P x(t) + rT u(t) + 0.5uT (t)Ru(t))
+λT (t)(Ax(t) + Bu(t))
i wydzielamy jego czȩść zależna̧ od sterowania
H̃(λ(t), x(t), u(t)) = −(rT u(t) + 0.5uT (t)Ru(t)) + λT (t)Bu(t).
Maksymalizuja̧c hamiltonian wzglȩdem sterowania korzystamy z warunku
H̃u (t) = 0 (na sterowanie nie sa̧ nalożone ograniczenia chwilowe) oraz ze wzoru
na różniczkowanie formy kwadratowej
.
ϕ(z) = 0.5z T Kz ⇒ ϕz (z) = z T K.
Uzyskujemy wiȩc
Hu (t) = −rT − uoT (t)R + λT (t)B = 0 ⇒ Ruo (t) = B T λ(t) − r
i sta̧d
uo (t) = R−1 B T λ(t) − R−1 r.
Sprawdzamy warunek wystarczaja̧cy optymalności drugiego rzȩdu
Huu (t) = −R ⇒ Huu (t) < 0,
co oznacza, że macierz pochodnych cza̧stkowych hamiltonianu jest ujemnie
określona i że wyznaczone rozwia̧zanie stanowi maksimum. Jest to maksimum
globalne, gdyż jest to jedyne rozwia̧zanie spelniaja̧ce warunki optymalności.
Określamy uklad równań kanonicznych zasady maksimum uogólnionego
stacjonarnego problemu LKSO
ẋ(t) = HλT (t), x(0) = x0 , x(∞) = 0, λ̇(t) = −HxT (t),
tj.
ẋ(t) = Ax(t) + BR−1 B T λ(t) − BR−1 r, t ∈ [0, t1 ], x(0) = x0 , x(∞) = 0,
5
λ̇(t) = −AT λ(t) + P x(t) + p.
Tak wiȩc warunki konieczne optymalności rozważanego procesu sterowania
sprowadzaja̧ siȩ do ukladu stacjonarnych liniowych równań różniczkowych z
warunkami dwugranicznymi. Jeden z efektywnych sposobów rozwia̧zywania
tego ukladu polega na zastosowaniu tzw. uogólnionega stacjonarnego liniowego podstawienia Riccatiego
λ(t) = Kx(t) + l,
gdzie K ∈ Rn×n jest macierza̧ Riccatiego wia̧ża̧ca̧ wektor stanu i wektor zmiennych sprzȩżonych stacjonarnego problemu LKSO, a l ∈ Rn jest wyrazem wolnym podstawienia Riccatiego. Przewidywanie powia̧zania tych wektorów w
postaci uogólnionej stacjonarnej liniowej zależności jest uzasadnione przez fakt,
że uklad równań kanonicznych ma postać stacjonarna̧ liniowa̧ z wyrazami wolnymi.
Stosuja̧c uogólnione stacjonarne podstawienie Riccatiego do pierwszego
równania kanonicznego zasady maksimum uzyskujemy równanie stanu zamkniȩtego
ukladu jego regulacji
ẋ(t) = (A + BR−1 B T K)x(t) + BR−1 B T l − BR−1 r.
Stosuja̧c to podstawienie do drugiego równania kanonicznego zasady maksimum uzyskujemy
K ẋ(t) = −AT Kx(t) − AT l + P x(t) + p.
Podstawiamy pierwsze równanie do drugiego otrzymuja̧c
K(A+BR−1 B T K)x(t)+KBR−1 B T l−KBR−1 r = −AT Kx(t)−AT l+P x(t)+p.
Sta̧d wynikaja̧ równania dla określenia macierzy K i wektora l. Macierz K
powinna spelniać macierzowe algebraiczne równanie Riccatiego
KA + AT K + KBR−1 B T K − P = 0,
zaś wektor l powinien spelniać liniowe równanie macierzowe
(KBR−1 B T + AT )l = KBR−1 r + p.
W teorii równań macierzowych dowodzi siȩ, że macierzowe algebraiczne równanie
Riccatiego posiada wśród wielu rozwia̧zań jedno i tylko jedno rozwia̧zanie
6
ujemnie określone K < 0. To wlaśnie rozwia̧zanie K oraz wektor l stosujemy
do określenia uogólnionego optymalnego stacjonarnego regulatora stanu
uo (t) = R−1 B T Kx(t) + R−1 (B T l − r).
Przyklad: Minimalizacja zużycia surowca w chemicznym procesie produkcyjnym.
W przeplywowym reaktorze chemicznym zachodzi proces przemiany surowca A w produkt użyteczny B i w produkt uboczny C. Wyróżniamy zmienne
stanu
• x1 (t) - stȩżenie surowca A w reaktorze, x2 (t) - stȩżenie produktu użytecznego
B w reaktorze,
• u1 (t) - stȩżenia surowca A w strumieniu wejściowym reaktora, u2 (t) natȩżenie przeplywu mieszaniny przez reaktor.
Należy minimalizować średnie zużycie surowca
Z
1 τ
u1 (t)u2 (t)dt
G(x, u) =
τ 0
uwzglȩdniaja̧c równania stanu procesu
ẋ1 (t) = u1 (t)u2 (t) − u2 (t)x1 (t) − 3x21 (t) − ax1 (t),
ẋ2 (t) = −u2 (t)x2 (t) + 3x21 (t),
ograniczenia technologiczne w postaci zadanego średniego poziomu nieprzereagowanego surowca i średniego poziomu produkcji skladnika użytecznego
Z
1 τ
xi (t)dt = 1/3, i = 1, 2,
τ 0
oraz ograniczenia chwilowe stanu i sterowania
0 ≤ xi (t), 0 ≤ ui (t) ≤ 2, i = 1, 2,
przy czym a jest parametrem o nominalnej wartości a = 1, który jednak podlega czȩstym fluktuacjom.
Zakladamy, że proces należy prowadzić na optymalnym poziomie statycznym, który uzyskujemy rozwia̧zuja̧c statyczne równania stanu
1
2
0 = ū1 ū2 − ū2 − ,
3
3
7
1
1
0 = − ū2 + .
3
3
Wynika sta̧d, że statyczny proces optymalny (nominalny) jest określony jak
nastȩpuje
(x̄o1 , x̄o2 , ūo1 , ū02 ) = (1/3, 1/3, 1, 1).
Porównanie zagadnień syntezy podstawowego i uogólnionego optymalnego regulatora stanu na przykladzie chemicznego procesu produkcyjnego
W zwia̧zku z potrzeba̧ niwelowania wplywu fluktuacji parametru a na przebieg procesu formulujemy problem LKSO stanowia̧cy podstawȩ syntezy podstawowego optymalnego niestacjonarnego regulatora stanu. Wprowadzamy
miarȩ odchylenia procesu aktualnego od procesu optymalnego w skończonym
czasie t1 skorelowanym z czȩstościa̧ fluktuacji parametru a
Z t1
2
2
G(x, u) = x1 (t1 ) + x2 (t1 ) +
(x21 (t) + x22 (t) + u21 (t) + u22 (t))dt.
0
W tak sformulowanym wskaźniku jakości odzwierciedlona jest jedynie potrzeba niwelacji odchylenia stanu za pomoca̧ sterowań koryguja̧cych o malej
amplitudzie.
Wyznaczamy liniowa̧ aproksymacjȩ równań stanu tj. obliczamy macierze
f¯xo , f¯uo
!
!
−ū
−
6x̄
−
1
0
−4
0
2
1
f¯xo =
=
,
6x̄1
−ū2
2 −1
!
!
ū
ū
−
x̄
1
2/3
2
1
1
=
,
f¯uo =
0
−x̄2
0 −1/3
Zapisujemy zlinearyzowane równanie stanu
ẋ(t) =
!
−4 0
x(t) +
2 −1
!
1 2/3
u(t)
0 −1/3
i uwzglȩdniamy zaburzenie stanu pocza̧tkowego
x(0) = x0 .
Celem wyznaczenia podstawowej wersji optymalnego niestacjonarnego regulatora stanu rozważanego procesu należy rozwia̧zać nastȩpuja̧ce równanie
8
różniczkowe Riccatiego
!
!
!
k1 (t) k2 (t)
−4 0
k̇1 (t) k̇2 (t)
+
+
k̇2 (t) k̇3 (t)
k2 (t) k3 (t)
2 −1
!
!
−4 2
k1 (t) k2 (t)
+
0 −1
k2 (t) k3 (t)
!
!
!
!
k1 (t) k2 (t)
1 2/3
1
0
k1 (t) k2 (t)
=
k2 (t) k3 (t)
0 −1/3
2/3 −1/3
k2 (t) k3 (t)
1 0
0 0
!
z zadanym macierzowym warunkiem końcowym
!
k1 (t1 ) k2 (t1 )
=
k2 (t1 ) k3 (t1 )
!
1 0
.
0 1
Macierzowe równanie różniczkowe Riccatiego z zadanym warunkiem końcowym
rozwia̧zujemy za pomoca̧ metod numerycznych np. przy użyciu procedury
NDSolve w systemie ”Mathematica”.
Jeśli fluktuacje parametru obiektu sa̧ sporadyczne, to podstawȩ do syntezy
podstawowego optymalnego stacjonarnego regulatora stanu stanowi rozwia̧zanie
nastȩpuja̧cego problemu LKSO: zminimalizować odchylenie procesu aktualnego od procesu optymalnego w nieskończonym czasie t1 = +∞
Z ∞
(x21 (t) + x22 (t) + u21 (t) + u22 (t))dt
0
uwzglȩdniaja̧c liniowa̧ aproksymacjȩ równań stanu
ẋ(t) =
!
−4 0
x(t) +
2 −1
!
1 2/3
u(t)
0 −1/3
i zaburzenie stanu pocza̧tkowego
x(0) = x0 .
Również w tym przypadku wskaźnik jakości odzwierciedla jedynie potrzebȩ
niwelacji odchylenia stanu za pomoca̧ sterowań koryguja̧cych o malej amplitudzie.
Celem syntezy optymalnego stacjonarnego regulatora stanu należy rozwia̧zać
nastȩpuja̧ce macierzowe algebraiczne równanie Riccatiego
k1 k2
k2 k3
!
!
−4 0
+
2 −1
9
!
!
−4 2
k1 k2
+
0 −1
k2 k3
k1 k2
k2 k3
!
!
!
!
1 2/3
1
0
k1 k2
=
0 −1/3
2/3 −1/3
k2 k3
1 0
0 1
!
To macierzowe równanie Riccatiego można również rozwia̧zywać przy użyciu
metod numerycznych np. za pomoca̧ procedury NSolve w systemie ”Mathematica”.
Projektuja̧c uogólniony niestacjonarny regulator stanu dla rozważanego
procesu wprowadzamy do wskaźnika jakości skladniki wynikaja̧ce z aproksymacji pierwotnego wskaźnika jakości
Z t1
u1 (t)u2 (t)dt, t1 >> t1
G(x, u) =
0
w otoczeniu procesu optymalnego
Z t1
G(x, u) =
(ū1 + δu1 (t))(ū2 + δu2 (t))dt
0
Z
t1
(ū1 ū2 + ū2 δu1 (t) + ū1 δu2 (t) + δu1 (t)δu2 (t))dt.
0
Sta̧d uzyskujemy
T
rT (t) = gδu
(ūo ) = (ūo1 , ūo2 ) = (1, 1),
R(t) = βI + gδuδu (ūo ) =
!
β 1
.
1 β
Dodatnia̧ określoność macierzy R(t) zapewnia wspólczynnik wagowy β > 1
np. β = 2.
Celem wyznaczenia podstawowej wersji optymalnego niestacjonarnego regulatora stanu rozważanego procesu należy rozwia̧zać nastȩpuja̧ce macierzowe
równanie różniczkowe Riccatiego
!
!
!
!
!
k̇1 (t) k̇2 (t)
k1 (t) k2 (t)
−4 0
−4 2
k1 (t) k2 (t)
+
+
+
k̇2 (t) k̇3 (t)
k2 (t) k3 (t)
2 −1
0 −1
k2 (t) k3 (t)
!
!
!
!
!
k1 (t) k2 (t)
1 2/3
2/3 −1/3
1
0
k1 (t) k2 (t)
=
k2 (t) k3 (t)
0 −1/3
−1/3 2/3
2/3 −1/3
k2 (t) k3 (t)
!
1 0
0 1
10
z zadanym macierzowym warunkiem końcowym
!
k1 (t1 ) k2 (t1 )
=
k2 (t1 ) k3 (t1 )
!
1 0
.
0 1
oraz liniowe wektorowe równanie różniczkowe dla określenia wektora l
l˙1 (t)
l˙2 (t)
!
!
k1 (t) k2 (t)
=
k2 (t) k3 (t)
!
1
0
×
2/3 −1/3
!
!
1 2/3
2/3 −1/3
0 −1/3
−1/3 2/3
!
!
l1 (t)
1 −
l2 (t)
1
z zadanym warunkiem końcowym
!
l1 (t1 )
=
l2 (t2 )
!
0
.
0
Projektuja̧c uogólniony stacjonarny regulator stanu dla rozważanego procesu wprowadzamy do wskaźnika jakości skladniki wynikaja̧ce z aproksymacji
pierwotnego wskaźnika jakości określonego na dlugim horyzoncie czasowym
Z ∞
G(x, u) =
u1 (t)u2 (t)dt,
0
w otoczeniu procesu optymalnego
Z ∞
G(x, u) =
(ū1 + δu1 (t))(ū2 + δu2 (t))dt
0
Z
∞
(ū1 ū2 + ū2 δu1 (t) + ū1 δu2 (t) + δu1 (t)δu2 (t))dt.
0
Sta̧d uzyskujemy
T
rT = gδu
(ūo ) = (ūo1 , ūo2 ) = (1, 1),
R = βI + gδuδu (ūo ) =
!
β 1
.
1 β
Celem wyznaczenia uogólnionej wersji optymalnego niestacjonarnego regulatora stanu rozważanego procesu należy rozwia̧zać nastȩpuja̧ce macierzowe
algebraiczne równanie Riccatiego
!
!
!
!
k1 k2
−4 0
−4 2
k1 k2
+
+
k2 k3
2 −1
0 −1
k2 k3
11
k1 k2
k2 k3
!
!
!
!
!
1 2/3
2/3 −1/3
1
0
k1 k2
=
0 −1/3
−1/3 2/3
2/3 −1/3
k2 k3
!
1 0
0 1
oraz liniowe równanie macierzowe dla określenia wektora l
!
!
!
1 2/3
2/3 −1/3
0 −1/3
−1/3 2/3
!
!
!
!
1
0
l1
1 0
×
−
=
2/3 −1/3
l2
1
0
k1 k2
k2 k3
Synteza optymalnego regulatora stanu
procesów cyklicznych
Po wyznaczeniu optymalnego (nominalnego) cyklicznego procesu sterowania xo , uo nasuwa siȩ kwestia podtrzymywania tego procesu w warunkach
malych fluktuacji parametrów obiektu sterowania. Fluktuacje te powoduja̧
odchylenie aktualnej cyklicznej trajektorii stanu od jej optymalnego (nominalnego) przebiegu cyklicznego. Celem zniwelowania tego odchylenia wprowadzamy nowe wspólrzȩdne stanu i sterowania x(t) := x(t) − xo (t), u(t) :=
u(t) − uo (t) i określamy korektȩ cyklicznego sterowania optymalnego (nominalnego) na podstawie rozwia̧zania problemu cyklicznego liniowo-kwadratowego
sterowania optymalnego (CLKSO) aproksymuja̧cego problem wyjściowy w otoczeniu cyklicznego procesu optymalnego (nominalnego).
Aproksymuja̧cy problem CLKSO dla procesów z czasem cia̧glym polega na
minimalizacji kwadratowego wskaźnika jakości
Z
1 τ T
(x (t)P (t)x(t) + uT R(t)u(t))dt
G(x, u) = 0.5
τ 0
przy ograniczeniu w postaci liniowego równania stanu
ẋ(t) = A(t)x(t) + B(t)u(t), t ∈ [0, τ ],
12
z zadanym warunkiem pocza̧tkowym
x(0) = x0 .
Zakladamy, że P (t) ∈ Rn×n jest macierza̧ symetryczna̧ dodatnio pólokreślona̧
dla t ∈ [0, τ ], R(t) ∈ Rn×n jest macierza̧ symetryczna̧ dodatnio określona̧ dla
t ∈ [0, τ ].
Rτ
Skladnik wskaźnika jakości 0.5 τ1 0 xT (t)P (t)x(t) stanowi miarȩ odchylenia
aktualnej trajektorii stanu od jej cyklicznego przebiegu optymalnego (nominalnego) w przedziale sterowania [0, τ ]. Dla P (t) = I jest to wartość średnia z
kwadratu odchylenia aktualnej trajektorii od jej przebiegu optymalnego (nominalnego) w przedziale sterowania [0, τ ].
Rτ
Skladnik wskaźnika jakości 0.5 τ1 0 uT (t)R(t)u(t) określa koszty sterowania koryguja̧cego odchylenie aktualnej trajektorii od jej cyklicznego przebiegu
optymalnego (nominalnego). Skladnik ten ogranicza chwilowe wartości sterowania koryguja̧cego.
Równanie stanu jest linearyzacja̧ wyjściowych, ogólnie biora̧c, nieliniowych
równań stanu na cyklicznym procesie optymalnym (nominalnym). Oznacza to,
że A(t) = fx (xo (t), uo (t), t), B(t) = fu (xo (t), uo (t), t), A(0) = A(τ ), B(0) =
B(τ ) tj. macierze te sa̧ τ -okresowe.
Określenie korekty cyklicznego sterowania optymalnego (nominalnego) w
ukladzie zamkniȩtym nazywa siȩ synteza̧ optymalnego cyklicznego regulatora stanu. Do rozwia̧zania tego zadania zastosujemy zasadȩ maksimum,
która dla cykliczych problemów sterowania optymalnego obowia̧zuje przy cyklicznych warunkach granicznych na zmienne sprzȩżone.
Zapisujemy hamiltonian problemu
H(λ(t), x(t), u(t)) = −0.5(xT (t)P (t)x(t)+uT R(t)u(t))+λT (t)(A(t)x(t)+B(t)u(t))
i wydzielamy czȩść hamiltonianu zależna̧ od sterowania
H̃(λ(t), x(t), u(t)) = −0.5uT R(t)u(t) + λT (t)B(t)u(t).
Maksymalizuja̧c hamiltonian wzglȩdem sterowania korzystamy z warunku H̃u (t) =
0 (na sterowanie nie sa̧ nalożone ograniczenia chwilowe) oraz ze wzoru na
różniczkowanie formy kwadratowej
ϕ(z)0.5z T Kz = z T K ⇒ ϕz (z)xT K.
13
Uzyskujemy wiȩc
Hu (t) = −uoT (t)R(t) + λT (t)B(t) = 0 ⇒ R(t)uo (t) = B T (t)λ(t)
uo (t) = R−1 (t)B T (t)λ(t).
Sprawdzamy warunek wystarczaja̧cy optymalności drugiego rzȩdu
Huu (t) = −R(t) ⇒ Huu (t) < 0,
co oznacza, że macierz pochodnych cza̧stkowych hamiltonianu jest ujemnie
określona i że wyznaczone rozwia̧zanie stanowi maksimum. Jest to maksimum
globalne, gdyż jest to jedyne rozwia̧zanie spelniaja̧ce warunki optymalności.
Określamy uklad równań kanonicznych zasady maksimum cyklicznego problemu LKSO
ẋ(t) = HλT (t), x(0) = x(τ ), λ̇(t) = −HxT (t), λ(0) = λ(t)
tj.
ẋ(t) = A(t)x(t) + B(t)R−1 (t)B T (t)λ(t), t ∈ [0, τ ], x(0) = x(τ ),
λ̇(t) = −AT (t)λ(t) + P (t)x(t), λ(0) = λ(τ ).
Tak wiȩc warunki konieczne optymalności rozważanego procesu sterowania
sprowadzaja̧ siȩ do ukladu niestacjonarnych liniowych równań różniczkowych z
cyklicznymi warunkami granicznymi. Jeden z efektywnych sposobów rozwia̧zywania
tego ukladu polega na zastosowaniu tzw. cyklicznego niestacjonarnego liniowego podstawienia Riccatiego
λ(t) = K(t)x(t),
gdzie K(t) ∈ Rn×n jest okresowa̧ macierza̧ Riccatiego wia̧ża̧ca̧ wektor stanu i
wektor zmiennych sprzȩżonych problemu CLKSO. Przewidywanie powia̧zania
tych wektorów w postaci niestacjonarnej liniowej zaleṅości jest uzasadnione
przez fakt, że uklad równań kanonicznych ma postać niestacjonarna̧ liniowa̧.
Stosujemy cykliczne podstawienie Riccatiego do ukladu równań kanonicznych
ẋ(t) = A(t)x(t) + B(t)R−1 (t)B T (t)K(t)x(t), x(0) = x(τ )
K̇(t)x(t) + K(t)ẋ(t) = −AT (t)K(t)x(t) + P (t)x(t), λ(0) = λ(τ ).
14
Pierwsze z tych równań podstawiamy do drugiego
K̇(t)x(t)+K(t) A(t)+B(t)R−1 (t)B T (t)K(t) x(t) = −AT (t)K(t)x(t)+P (t)x(t).
Równanie to bȩdzie spelnione dla każdego stanu x(t), jeśli macierz K(t) bȩdzie
spelniać nastȩpuja̧ce macierzowe równanie różniczkowe Riccatiego
K̇(t) = −K(t)A(t) − AT (t)K(t) − K(t)B(t)R−1 (t)B T (t)K(t) + P (t)
z cyklicznym warunkiem dwugranicznym
K(0) = K(τ ).
Po wyznaczeniu macierzy K(t) określamy rów nanie optymalnego cyklicznego regulatora stanu
uo (t) = R−1 (t)B T (t)K(t)x(t).
Jest to liniowe cykliczne przeksztalcenie macierzowe.
Uklad sterowania cyklicznego z warstwa̧ regulacji
cykliczne sterowanie optymalne
-
Optymalny cykliczny
regulator stanu
R−1 (t)B T (t)K(t)
Obiekt sterowania
+?
x(t)
- x
+
τ -cykliczne
korekta
fluktuacje parametru
sterowania
optymalnego
-
Cykliczna macierz Riccatiego posiada nastȩpuja̧ce wlasności:
1. Cykliczna macierz K(t) jest symetryczna.
2. Istnieje jednoznacznie określona cykliczna macierz K(t) ujemnie określona.
Cykliczne rozwia̧zania macierzowego równania różniczkowego Riccatiego
wyznaczamy stosuja̧c metodȩ Newtona wzglȩdem warunku pocza̧tkowego, która̧
w systemie ”Mathematica” realizujemy z wykorzystaniem procedury NDSolve.
15