sterowanie stochastyczne w czasie dyskretnym

Transkrypt

sterowanie stochastyczne w czasie dyskretnym
Program przedmiotu:
STEROWANIE STOCHASTYCZNE W CZASIE DYSKRETNYM
30 godzin wykładu
Opis tematyki: Typowym problemem sterowania stochastycznego jest
znalezienie strategii, która maksymalizuje (minimalizuje) średni zysk
(koszt). Wykład poświęcony jest modelom w czasie dyskretnym. Tak więc
w tej typowej sytuacji proces stanów X jest zadany rekurencyjnie
X(n+1) = F(X(n), u(n), ξ(n)),
X(0)=x,
gdzie (ξ(n)) jest ciągiem niezależnych zmiennych losowych o tym samym
rozkładzie (dyskretny biały szum). Celem jest znalezienie sterowania u,
które dla zadanych T, g i G maksymalizuje (lub minimalizuje)
J(x,u)=E g(X(n),u(n)) + G(X(T)).
Cele przedmiotu: Poznanie podstawowych twierdzeń i technik teorii
sterowania stochastycznego w czasie dyskretnym (programowanie
dynamiczne, optymalne stopowanie, problemy liniowo-kwadratowe,
sterowanie z ergodycznym funkcjonałem kosztu lub zysku, filtr Kalmana).
Zaznajomienie z konkretnymi zastosowaniami: problemy inwestora,
problemy wyboru (problem sekretarki), problem optymalizacji kosztów na
jednostkę czasu (problem wymiany samochodu Howarda), problem
rozregulowania.
Zawartość programowa:
1. Pojęcia wstępne (2 godziny). Przykłady wprowadzające (problem
inwestora, sekretarki, problem wymiany samochodu). Markowskie modele
decyzyjne. Problem optymalnego sterowania na skończonym odcinku
czasowym.
2. Programowanie dynamiczne (8 godzin). Twierdzenie Bellmana dla
problemów sterowania na skończonym i nieskończonym odcinku
czasowym. Rozwiązanie problemu Samuelsona optymalnej konsumpcji i
inwestycji. Rozwiązanie problemu liniowo-kwadratowego (liniowa
dynamika stanów i kwadratowy funkcjonał kosztu).
3. Optymalne stopowanie (8 godzin). Twierdzenie Bellmana dla problemu
optymalnego stopowania na skończonym i nieskończonym przedziale
czasowym. Zastosowania do problemu wyboru (sekretarki, wynajmu
apartamentu). Problem liniowo-kwadratowy.
4. Sterowanie z ergodycznym funkcjonałem kosztów (8 godzin). Równania
Bellmana-Howarda. Zastosowanie do problemu Howarda (minimalizacji
kosztów utrzymania na jednostkę czasu).
5. Filtracja i sterowanie z niepełną informacją (6 godzin). Filtr Kalmana.
Sprowadzenie problemu z niepełną informacja do problemu z pełną
informacją. Zasada separacji. Problemy rozregulowania.
Literatura:
1. D.P. Bertsekas, S.E. Shreve, Stochastic optimal control: the discrete
time case, Academic Press, New York 1978.
2. H. Kushner, Introduction to stochastic control, New York 1971.
3. J.R. Norris, Markov Chains, Cambridge Univ. Press 1997.
4. S. Peszat, J. Zabczyk, Wst eo teorii sterowania stochastycznego w
czasie dyskretnym, manuskrypt.
5. J. Zabczyk, Chance and decision, stochastic control in discrete ime.
Quaderni SNS, Pisa 1996.