THINK - 5 - Gasior - Zastosowanie zasady maksimum Pontriagina
Transkrypt
THINK - 5 - Gasior - Zastosowanie zasady maksimum Pontriagina
ZASTOSOWANIE ZASADY MAKSIMUM PONTRIAGINA DO ZAGADNIENIA DYNAMICZNYCH LOKAT KAPITAŁOWYCH Krzysztof Gąsior Uniwersytet Rzeszowski Streszczenie Celem referatu jest zaprezentowanie praktycznego zastosowania zasady maksimum Pontriagina. Dla matematycznego formułowania problemu korzystamy ze znanego modelu dynamicznych lokat kapitałowych, który w badanym przez nas zagadnieniu jest liniowym układem równań różniczkowych. W naszych rozważaniach będziemy się starać wyznaczyć warunki w jaki sposób podzielić nasze zasoby tak, aby przy zadanych ograniczeniach finansowych w końcowym momencie czasu uzyskać maksymalny zysk z inwestycji. 1. Wprowadzenie Niech ܶ = ሾݐ , ݐ ሿ oznacza przedział osi liczbowej czasu o elementach t. Niech X oznacza n − wymiarową przestrzeń Euklidesa. Element tej przestrzeni ∈ )ݐ(ݔℝ nazywamy wektorem stanu. Niech U oznacza r − wymiarową przestrzeń sterowania. Element tej przestrzeni ∈ )ݐ(ݑℝ nazywamy wektorem sterowania. Dany jest zbiór ܹ będący iloczynem kartezjańskim ܶ × ܺ × ܷ. Przekrój tego zbioru oznaczamy przez ܹ( )ݐdla każdego ܶ ∈ ݐ. Odpowiednio rzut ܹ( )ݐna przestrzeń X oznaczamy przez ܹ௫ ()ݐ, a przekrój ܹ( )ݐprzy ustalonym ݔ przez ܹ௨ (ݐ, )ݔ. Niech pary funkcji ()ݐ(ݔ, ))ݐ(ݑokreślone na przedziale ሾݐ , ݐ ሿ spełniają następujące warunki: 1. Wektor stanu )ݐ(ݔjest ciągły i przedziałami różniczkowalny. 2. Wektor sterowania )ݐ(ݑjest przedziałami ciągły. 3. Dla każdego ustalonego ܶ ∈ ݐfunkcja ()ݐ(ݔ, ))ݐ(ݑprzyjmuje wartości ze zbioru ܹ()ݐ, to jest ൫)ݐ(ݔ, )ݐ(ݑ൯ ∈ ܹ()ݐ, czyli W szczególności przy ݐ = ݐ , ݐ = ݐ ܹ ∈ ݔ௫ ()ݐ, ܹ ∈ ݑ௨ (ݐ, ))ݐ(ݔ. ݐ(ݔ ) ∈ ܹ௫ (ݐ), ݐ(ݔ ) ∈ ܹ௫ (ݐ ) www.think.wsiz.rzeszow.pl , ISSN 2082-1107, Nr 1 (1) 2009, s. 63-69 (1) (2) Zastosowanie zasady maksimum Pontriagina do zagadnienia dynamicznych lokat kapitałowych 4. W przestrzeni sterowań ܷ określony jest obszar dopuszczalnych sterowań ܷௗ wypukły, ograniczony i domknięty. 5. Funkcja wektorowa ݂ określona na ܶ × ܺ × ܷ oraz ma ciągłe pochodne ݂௫ względem ݔ. 6. Pary ൫)ݐ(ݔ, )ݐ(ݑ൯ są określone na przedziale ܶ prawie wszędzie, to jest z wyjątkiem być może skończonej liczby punktów i spełniają równanie różniczkowe w postaci wektorowej ݔሶ = ݂(ݔ, ݑ, )ݐ (3) 7. Na funkcjach ݔ, ݑspełniających (3) oraz ܶ × ܺ × ܷ dana jest całka ௧ೖ න ݂ ሾݐ, )ݐ(ݔ, )ݐ(ݑሿ݀ݐ. ௧బ Definicja (por. [2], str. 329). Zbiór par ൫)ݐ(ݔ, )ݐ(ݑ൯ spełniających wymienione założenia nazywamy zbiorem dopuszczalnych procesów sterowania D i odpowiednio )ݐ(ݔnazywamy zbiorem dopuszczalnych trajektorii, zaś )ݐ(ݑnazywamy zbiorem dopuszczalnych sterowań. Związki (1) nazywamy zwykle ograniczeniami odpowiednio na wektor stanu oraz wektor sterowania, a ograniczenia (2) warunkami granicznymi. Definicja (por. [2], str. 329). Na obszarze dopuszczalnym D dany jest funkcjonał ௧ೖ = ܬන ݂ ሾݐ, ݔ, ݑሿ݀ ݐ+ ݂ ሾݐ(ݔ ), ݐ(ݔ )ሿ. ௧బ Funkcja ݂ ሾݐ(ݔ ), ݐ(ݔ )ሿ jest określona w przestrzeni ܺ × ܺ. Problem sterowania optymalnego )ݐ( ∗ݑ polega na znalezieniu takich ()ݐ( ∗ ݔ, ܦ ∈ ))ݐ( ∗ݑdla których powyższy funkcjonał osiąga minimalną wartość: ܬሾ)ݐ( ∗ ݔ, )ݐ( ∗ݑሿ ՜ ݂݅݊ ܬ. 1. Zasada maksimum Pontriagina Twierdzenie 1 (por. [2], str. 379,Twierdzenie 8.1, Zasada maksimum Pontriagina). Jeżeli para ()ݐ( ݔ, ))ݐ( ∗ݑjest odpowiednio sterowaniem optymalnym i trajektorią optymalną stanu i jeżeli zbiór ܹ௨ nie zależy od x oraz t, to prawie wszędzie w przedziale ሾݐ , ݐ ሿ spełniony jest warunek maksimum funkcji H dla każdego ߥ ∈ ܷௗ : ∗ gdzie ܪሾߣ()ݐ, )ݐ( ∗ ݔ, )ݐ( ∗ݑ, ݐሿ ≥ ܪሾߣ()ݐ, )ݐ( ∗ ݔ, ߥ, ݐሿ, ܪሾߣ()ݐ, )ݐ(ݔ, )ݐ(ݑ, ݐሿ ≡ ߣ ݂ ሾ)ݐ(ݔ, )ݐ(ݑ, ݐሿ, ߣ(∙): ሾݐ , ݐ ሿ ՜ ℝ jest rozwiązaniem równania z warunkiem końcowym (4) ୀ ݀ߣ()ݐ ߲ = − ܪሾߣ()ݐ, ݕ, )ݐ( ∗ݑ, ݐሿ௬ୀ௫ ∗ (௧) ݀ݐ ߲ݕ ݂݀ ()ݕ ቤ . ݀ ݕ௬ୀ௫ ∗ (௧ ) ߣ(ݐ ) = − ೖ 64 Zastosowanie zasady maksimum Pontriagina do zagadnienia dynamicznych lokat kapitałowych Wniosek (por. [2], str. 384). Jeżeli istnieje sterowanie optymalne znajdujące się w zbiorze sterowań dopuszczalnych, to spełnione są warunki: ݀ܪ߲ )ݐ(ݔሾߣ()ݐ, )ݐ(ݔ, )ݐ(ݑ, ݐሿ = , ݐ(ݔ ) = ݔ , ߲ߣ()ݐ ݀ݐ ݀ߣ()ݐ ߲ܪሾߣ()ݐ, )ݐ(ݔ, )ݐ(ݑ, ݐሿ ߲ܬሾ ݐ(ݔ )ሿ =− , ߣ(ݐ ) = − , ݀ݐ ߲)ݐ(ݔ ߲ݐ(ݔ ) (5) oraz spełniony jest warunek (4) dla prawie wszystkich ∈ ݐሾݐ , ݐ ሿ. Uwaga. Powyższe warunki nazywamy równaniami kanonicznymi Hamiltona. Funkcje H nazywamy funkcją Hamiltona (hamiltonianem), a ߣ zmiennymi sprzężonymi (dualnymi). 2. Zastosowanie zasady maksimum do analizy optymalności dynamiki lokat kapitałowych Niech będą dane dwa konta bankowe dla których możemy zaplanować pewną inwestycję kapitałową. Należy w jak najbardziej ekonomiczny sposób podzielić nasze zasoby tak, aby w końcowym momencie czasu uzyskać maksymalny zysk. Dla matematycznego formułowania zagadnienia korzystamy z modelu dynamicznych lokat kapitałowych (por. [3], str. 210): przy warunkach brzegowych ݇ଵ (0) = ݇ଵ , ݇ଶ (0) = ݇ଶ , ݇ଵ (ݐ ), ݇ଶ (ݐ ) swobodne, ݐ dane, oraz ograniczeniach na sterowanie: gdzie: − − − − ݇ሶ = ߤ ݇ + ݏ , ݅ = 1,2, ݏଵ + ݏଶ ≤ ݏ , ݏଵ ≥ −ߤଵ ݇ଵ , ݏଶ ≥ −ߤଶ ݇ଶ , ߤଵ , ߤଶ jest oprocentowaniem na koncie (ߤଵ , ߤଶ ∈ ℝା \ሼ0ሽ oraz ߤଵ ≠ ߤଶ ), ݏଵ , ݏଶ jest saldem wpływów i wydatków (ݏଵ , ݏଶ ∈ ℝ), ݇ଵ , ݇ଶ jest stanem konta w momencie czasu t (݇ଵ , ݇ଶ ∈ ℝା ), ݏ jest ilością wolnych środków możliwych do zainwestowania w chwili t (ݏ ∈ ℝା ). (6) (7) (8) ௧ೖ Aby zbadać jakość analizowanego zjawiska określimy funkcjonał celu, postaci: = ܬන ߙ(ݏଵ + ݏଶ )݀ ݐ− (݇ଵ (ݐ ) + ݇ଶ (ݐ )) ՜ ݉݅݊ Pierwszy składnik jest sumą przepływów pieniężnych dokonywanych pomiędzy kontami, zaś drugi sumą pieniędzy ulokowanych na kontach w momencie zakończenia procesu. Zatem minimalizacja funkcjonału ܬbędzie polegała na minimalizacji pierwszego składnika, ௫ ఓ ௧ a maksymalizacji drugiego. Współczynnik ߙ ∈ ቀ 0, ݁ భರರమ ೖ ቃ uwzględnia preferencje składnika w funkcjonale. Gdyby drugi człon funkcjonału był stały i nie zależał od ݇ଵ (ݐ ), ݇ଶ (ݐ ), ݐ moglibyśmy go pominąć w obliczeniach. Jego równoważna forma ma postać: 65 Zastosowanie zasady maksimum Pontriagina do zagadnienia dynamicznych lokat kapitałowych ௧ೖ ଶ = ܬන ൭൫ߙݏ − ݇ሶ ൯൱ ݀ ݐ− ݇ଵ (0) − ݇ଶ (0) ՜ ݉݅݊ ୀଵ (9) O ile powyższy funkcjonał zawiera dodatkowe wyrażenie poza całką, to jednak to wyrażenie jest stałe. Wpływa ono na optymalną wartość J, ale nie na optymalne ścieżki kଵ , k ଶ oraz optymalną wartość kଵ (t ୩ ), k ଶ (t ୩ ). Korzystając z zasady maksimum Pontriagina, problem sprowadza się do maksymalizacji funkcji H, gdzie ݇ሶଵ , ݇ሶଶ zastępujemy równaniami procesu (6): ଶ = ܪ൫(λ୧ + 1)(ߤ ݇ + ݏ ) − ߙs୧ ൯ ՜ ݉ܽݔ ୀଵ ߲ܪ = λ୧ − ߙ + 1, ݅ = 1, 2, ߲ݏ na obszarze wyznaczonym przez zależności (8). Oznaczmy przez ߛ = Otrzymujemy, że znalezienie wartości optymalnych sଵ , sଶ polega na maksymalizacji funkcji: na obszarze dopuszczalnym. ܪ௦ = ߛଵ sଵ + ߛଶ sଶ ՜ ݉ܽݔ, (10) (11) D W zależności od przyjmowanych wartości przez zmienne ߛଵ , ߛଶ otrzymujemy: ݏଵ∗ = −ߤଵ ݇ଵ , ݏଶ∗ = −ߤଶ ݇ଶ , ߛଵ , ߛଶ < 0, ݏଵ∗ = −ߤଵ ݇ଵ , ݏଶ∗ = ݏ + ߤଵ ݇ଵ , ߛଵ − ߛଶ ≤ 0, ݏଵ∗ = ݏ + ߤଶ ݇ଶ , ݏଶ∗ = −ߤଶ ݇ଶ , ߛଶ − ߛଵ ≤ 0. W warunkach (13’) i (14’) zakładamy, że co najmniej jedna zmienna ߛଵ ()ݐ, ߛଶ ( )ݐjest dodatnia. Wyznaczmy teraz zmienne sprzężone. Korzystając z (5) oraz (10) otrzymujemy: λሶ = − (12) (13) (14) ߲ܪ = −μ (λ + 1), ݅ = 1,2. ߲݇ 66 Zastosowanie zasady maksimum Pontriagina do zagadnienia dynamicznych lokat kapitałowych λ∗ ( ݁ = )ݐఓ (௧ೖି௧) − 1, ݅ = 1,2. Rozwiązanie szczegółowe po uwzględnieniu warunku (5) dla funkcjonału (9) ma postać: ߛ ( ݁ = )ݐఓ (௧ೖି௧) − ߙ, ݅ = 1, 2. Podstawiając otrzymany wynik do (11) mamy: Wstawiając powyższe zależności do warunków (12) – (14), uwzględniając warunek, że ߤଵ ≠ ߤଶ , a dodatkowo w warunkach (13) i (14) logarytmując oraz rugując czas, otrzymujemy następujące zależności: ݏଵ∗ = −ߤଵ ݇ଵ , ݏଶ∗ = −ߤଶ ݇ଶ , ݉ܽ ݔቀݐ − ఓ ݈݊ߙቁ ≤ ݐ, (12’) ଵ ଵஸஸଶ ݏଵ∗ = ݏ + ߤଶ ݇ଶ , ݏଶ∗ = −ߤଶ ݇ଶ , ߤଶ < ߤଵ , ݏଵ∗ = −ߤଵ ݇ଵ , ݏଶ∗ = ݏ + ߤଵ ݇ଵ , ߤଵ < ߤଶ , (13’) (14’) Z warunku (12’) otrzymujemy, że dla ߷ = ݐ, które wynosi: 1 ߷ = ݐ − ݉݅݊ ൬ ݈݊ߙ൰ ଵஸஸଶ ߤ obie zmienne ߛଵ ()ݐ, ߛଶ ( )ݐsą ujemne, czyli następuje zmiana sterowania z (13’) lub (14’) na (12’). Rozważmy przypadki sterowania ze względu na wartość współczynnika preferencji ߙ w funkcjonale (9): Przypadek 1. Dla 0 < ߙ < 1, gdy zachodzi zależność (13’) równania procesu są postaci: ቐ ݇ሶଵ = ߤଵ ݇ଵ + ݏ + ߤଶ ݇ଶ ݇ሶଶ = 0 , ݏ +ߤଶ ݇ଶ ఓ ௧ ݏ + ߤଶ ݇ଶ ൰݁ భ − ߤଵ ߤଵ a rozwiązania tego układu z warunkami początkowymi (7) wyrażają się wzorami: ݇ۓଵ∗ ( = )ݐ൬݇ଵ + ۔ ݇ەଶ∗ (݇ = )ݐଶ . (15) ݇ଵ∗ (݇ = )ݐଵ Natomiast, gdy spełniony jest warunek (14’) poprzez analogie, otrzymujemy: , ൞ ݏ ݏ +ߤ ݇ +ߤ ݇ ଵ ଵ ଵ ଵ ݇ଶ∗ ( = )ݐ൬݇ଶ + ൰ ݁ ఓమ ௧ − ߤଶ ߤଶ gdzie w obu przypadkach ∈ ݐሾ0, ݐ ሿ. Przypadek 2. Gdy ݁ భರರమ ೖ = ߙ, wtedy spełniony jest warunek (12’), a proces kapitalizacji opisany jest w następujący sposób: ௫ ఓ ௧ ݇ଵ∗ (݇ = )ݐଶ , ∈ ݐሾ0, ݐ ሿ. ቐ ݇ଶ∗ (݇ = )ݐଶ Przypadek 3. Gdy 1 ≤ ߙ < ݁ భರರమ ೖ , wtedy zamiana procesu następuje podczas jego trwania. Niech w I etapie procesu spełniony jest warunek (13’). Optymalne trajektorie przy warunkach początkowych (7) wyrażone są przez zależności (15), gdzie ∈ ݐሾ0, ߷). Natomiast w II etapie opisane są równaniami: ௫ ఓ ௧ 67 Zastosowanie zasady maksimum Pontriagina do zagadnienia dynamicznych lokat kapitałowych ݇ଵ∗ ( = )ݐଵ , ∈ ݐሾ߷, ݐ ሿ, ቐ ∗ ݇ଶ ( = )ݐଶ gdzie wartości ଵ , ଶ nie możemy wyznaczyć z warunków początkowych (7), ponieważ nie jesteśmy w momencie czasu = ݐ0. Korzystając z faktu, że proces musi być ciągły i wartości w momencie czasu ߷ = ݐetapu I i II muszą być równe, otrzymujemy: ݏ +ߤଶ ݇ଶ ݏ + ߤଶ ݇ଶ ۓଵ = ൬ + ݇ଵ ൰ ݁ ఓభ ద − ߤଵ ߤଵ . ۔ ەଶ = ݇ଶ Połączenie tych dwóch ścieżek daje nam ݇ଵ∗ , ݇ଶ∗ na całym przedziale czasu ሾ0, ݐ ሿ. W analogiczny sposób możemy uzyskać ścieżkę, gdy zmiana sterowania następuje z (14’) na (12’). 3. Interpretacja ekonomiczna Analiza ekonomiczna wyodrębnionych przez nas przypadków jest następująca: Przypadek 1. System inwestowania polega na wybieraniu przez cały okres ∈ ݐሾ0, ݐ ሿ z konta o niższym oprocentowaniu, kwot równych iloczynowi oprocentowania razy wartość kapitału początkowego ulokowanych na koncie i wpłacaniu wraz z maksymalną możliwą wartością pieniędzy równą ݏ na konto o wyższym oprocentowaniu. Przypadek 2. Strategia polega na wybieraniu z kont przez cały okres trwania procesu kwot równych iloczynowi oprocentowania i kwoty początkowej z obu kont. Również na konta nie wpłacamy żadnych nadwyżek finansowych. Przypadek 3. System polega na prowadzeniu strategii inwestowania jak w przypadku 1 przez okres czasu ∈ ݐሾ0, ߷), a w przedziale czasu ∈ ݐሾ߷, ݐ ሿ strategii z przypadku 2. Uwaga. Maksymalny zysk z inwestowania możemy uzyskać, gdy stosujemy strategie z przypadku 1, a najmniejszy w przypadku 2. Robert Dorfman w swoim artykule podaje, że każdemu elementowi zasady maksimum możemy przypisać znaczenie ekonomiczne odwołujące się do naszej intuicji(zob. [1]). W porównaniu do omawianego w artykule, nasz Hamiltonian przyjmuje postać: ଶ ܪሾߣ()ݐ, ݇()ݐ, )ݐ(ݏ, ݐሿ = −ܨሾ݇()ݐ, )ݐ(ݏ, ݐሿ + ߣ ݂ ሾ݇()ݐ, )ݐ(ݏ, ݐሿ, ୀଵ (16) gdzie F jest wyrażeniem podcałkowym z funkcjonału (9), a drugi człon jest iloczynem skalarnym zmiennych dualnych oraz równań procesu(6). Zasada maksimum wymaga maksymalizacji funkcji H względem ݏଵ , ݏଶ . Znaczy, to że musimy w każdej chwili starać się maksymalizować łączne perspektywy zysku poprzez optymalny wybór salda. W szczególności wymaga to równoważenia spodziewanego bieżącego zysku, ze spodziewanym zwiększeniem przyszłego. Dla jaśniejszego przedstawienia, zbadamy słabą wersję zasady maksimum: Po sprowadzeniu do postaci: ߲ܪ ߲ܨ ߲݂ =− + ߣ ()ݐ = 0, ݅ = 1, 2. ߲ݏ ߲ݏ ߲ݏ ߲ܨ ߲݂ = ߣ ()ݐ , ݅ = 1, 2, ߲ݏ ߲ݏ 68 Zastosowanie zasady maksimum Pontriagina do zagadnienia dynamicznych lokat kapitałowych warunek ten pokazuje, że optymalnie wybrane ݏଵ∗ , ݏଶ∗ muszą równoważyć każdy krańcowy wzrost bieżącego zysku umożliwiony przez tę strategię(lewa strona równania) z krańcowym zwiększeniem przyszłego zysku, która będzie wołane tą strategią poprzez zwiększanie zasobów kapitału. Zasada Pontriagina korzysta z dwóch równań ruchu. Jedno równanie, dla zmiennej stanu jest bezpośrednio opisane równaniami (6). Charakteryzuje ono sposób, w jaki nasze decyzje wpływają na stopę zmiany kapitału. Równania ruchu dla zmiennej dualnej opisują wzory: ߣሶ = − lub też po przemnożeniu przez −1: ߲ܪ ߲ܨ ߲݂ = − ߣ ()ݐ ݅ = 1, 2, ߲݇ ߲݇ ߲݇ −ߣሶ = − ߲݂ ߲ܨ + ߣ ()ݐ ݅ = 1, 2, ߲݇ ߲݇ Lewa strona powyższego równania określa stopę deprecjacji(spadku) w czasie ceny dualnej. Z równań ruchu wynika, że stopa ta jest równa co do wielkości różnicy dwóch składowych po prawej stronie. Pierwszy z nich reprezentuje krańcowy wpływ kapitału na bieżący zysk. Natomiast drugi, krańcowy wzrost kapitału na zwiększenie wartości kapitału. Zasada maksimum w tym przypadku oznacza, że stopa deprecjacji ceny dualnej jest równa stopie wzrostu różnicy bieżącego i przyszłego zysku, dzięki gromadzeniu kapitału. Na zakończenie wyjaśnimy znaczenie warunku zakończenia procesu w twierdzeniu 1. Przy sztywnym horyzoncie ݐ zakładamy, że liczą się tylko zyski uzyskane w okresie ሾ0, ݐ ሿ. W naszym przypadku λ∗ (ݐ ) = 0, ݅ = 1, 2. Oznacza, to że cena dualna kapitału powinna spaść do zera w końcowym momencie. Dzieje się tak, ponieważ wartość kapitału zależy wyłącznie od tego, ile może nam przynieść zysku. Wynika stąd, że zajmowanie się gromadzenie kapitału pod koniec okresu planowania nie przyniesie nam znaczących korzyści. Zatem powinniśmy starać się zgromadzić jak najwięcej kapitału do chwili ݐ . 4. 1. 2. 3. Bibliografia Dorfman R., „An Economic Interpretation of Optimal Control Theory”, The American Economic Review, Vol. 59, No. 5., Grudzień 1969r. Górecki H., „Optymalizacja systemów dynamicznych”, PWN, Warszawa 1993. Panek E., „Elementy ekonomii matematycznej − równowaga i wzrost”, PWN, Warszawa 1997. 69