Krótki opis i przykład

Transkrypt

Krótki opis i przykład
Dobromił Serwa
Filtr Kalmana – wstępne opracowanie
Modele przestrzeni stanów oraz filtr Kalmana zostały szczegółowo omówione w
licznych opracowaniach dotyczących analizy szeregów czasowych (Anderson i Moore
(1979), Aoki (1990), Harvey (1992), Hamilton (1994), Durbin, Koopmans (2001)).
Prezentacji algorytmu dokonano na podstawie pracy Hamiltona (1994). Algorytm Kalmana
pozwala prognozować przyszłe wartości pewnego nieobserwowalnego szeregu czasowego na
podstawie modelu przestrzeni stanów i historycznych danych. UmoŜliwia on takŜe
wygładzanie
obserwowalnych
szeregów
czasowych.
W
tej
części
pracy
uwagę
skoncentrowano na wyjaśnieniu metody ekstrakcji nieobserwowalnego sygnału z szeregów
danych. Metodę tę w następnym podpunkcie zastosowano do wygenerowania obserwacji
premii za ryzyko dla kursu walutowego.
Model przestrzeni stanów składa się z równania obserwacji (lub inaczej równania
pomiaru, ang. observation equation, measurement equation):
y t = Ax t + Βz t + ε t
(2.2.8)
i równania stanu (lub inaczej równania przejścia, ang. state equation, transition equation):
z t = Fz t −1 + Gυ t .
(2.2.9)
Zmienne wektory y t i x t są obserwowalne w czasie. Prawdziwe wartości wektora z t są
nieznane, a filtr Kalmana pozwala oszacować jego średnią i wariancję na podstawie danych
historycznych oraz równań (2.2.8) i (2.2.9). Nieobserwowalne są takŜe wektory składników
losowych ε t i υ t , ale znane są ich średnie (wektory zerowe) oraz macierze wariancji. Zwykle
zakłada się stałość wariancji składników losowych w czasie:
E (ε t ε t ' ) = R
i
E (υ t υ t ' ) = Q .
(2.2.10)
Procedura szacowania wartości średniej z t|t −1 oraz wariancji Pt|t −1 zmiennej losowej z t
warunkowej ze względu na całą informację It-1 dostępną w momencie t –1 opisana jest za
pomocą następujących formuł:
z t|t −1 = Fz t −1|t −1 ,
(2.2.11)
Pt|t −1 = FPt −1|t −1F '+GRG ' ,
(2.2.12)
Prognozy z t|t −1 i Pt|t −1 moŜna uaktualnić w momencie t wykorzystując poniŜsze równania
(ang. updating formulas):
−1
(2.2.13)
Pt|t = Pt|t −1Β' M t|t −1 ΒPt|t −1 ,
(2.2.14)
z t|t = z t|t −1 + Pt|t −1Β' M t|t −1 ξ t|t −1
−1
gdzie wyraŜenia:
ξ t|t −1 = y t − Ax t − Βz t|t −1 ,
(2.2.15)
M t|t −1 = ΒPt|t −1Β'+ R
(2.2.16)
oznaczają odpowiednio błąd prognozy i jego wariancję.
Proces iteracji rozpoczyna się zwykle od załoŜenia, Ŝe początkowa wartość wektora
z t jest realizacją zmiennej losowej o wielowymiarowym rozkładzie normalnym ze średnią
z 1|0 i wariancją P1|0 . Gdy z t jest zmienną stacjonarną (wszystkie wartości własne macierzy
F leŜą wewnątrz koła jednostkowego), to bezwarunkowe wartości z 1|0 i P1|0 moŜna otrzymać
ze wzorów:
z 1|0 = 0
(2.2.17)
vec(P1|0 ) = [I − (F ⊗ F)]−1 vec(GRG ' )
(2.2.18)
gdzie symbol ⊗ oznacza iloczyn Kroneckera, a vec(⋅) to operator przekształcający macierz
w wektor poprzez ułoŜenie kolejnych kolumn tej macierzy pod sobą.
Parametry modelu przestrzeni stanów zawarte w macierzach A, B, F, G, R i Q nie są
zawsze znane. Pod warunkiem, Ŝe ich wartości są identyfikowalne, moŜna je oszacować
równocześnie z prognozowaniem wartości wektora stanu z t . Procedura polega na:
a) wybraniu początkowych wartości parametrów modelu,
b) oszacowaniu wartości wektora z t filtrem Kalmana,
c) obliczenia wartości funkcji wiarygodności dla zadanych parametrów i oszacowań szeregu
zt ,
d) powtarzaniu czynności opisanych w punktach a – c dla róŜnych kombinacji wartości
parametrów w A, B, F, G, R i Q aŜ do znalezienia maksymalnej wartości funkcji
wiarygodności.
Funkcja wiarygodności w postaci zlogarymowanej dla modelu przestrzeni stanów
dana jest wzorem:
ln L = −
Do
1 T
1 T
n
−1
ln (2π ) ⋅ | M t|t −1 | − ∑ ξ 't|t −1 M t|t −1 ξ t|t −1
∑
2 t =1
2 t =1
[
znalezienia
parametrów
]
które
optymalizują
wartość
(2.2.19)
funkcji
wiarygodności
wykorzystywane są algorytmy optymalizacyjne dla funkcji nieliniowych, np. metoda quasiNewtona, ME (maximization – expectation), Marquardta i inne. MoŜliwe problemy związane
z szacowaniem parametrów modeli przestrzeni stanów związane są z występowaniem
lokalnych maksimów funkcji wiarygodności, które utrudniają znalezienie jej globalnego
maksimum.
Dodatkowo nieidentyfikowalność parametrów, interpretowana tutaj jako
występowanie tej samej największej wartości funkcji wiarygodności dla roŜnych kombinacji
wartości parametrów, uniemoŜliwia wyznaczenie ich oszacowań (Hamilton (1994)).
Przykład: Model premii za ryzyko jako model przestrzeni stanów
ZałoŜono, Ŝe w modelu premii za ryzyko premia jest generowana przez proces
autoregresji rzędu q, AR(q):
d t = pt + ε t
.

 pt = α1 pt −1 + α 2 pt −2 + ... + α q pt −q + vt
(2.2.20)
PoniewaŜ sygnał premii jest nieobserwowalny w czasie, to oszacowanie parametrów
modelu (2.2.20) moŜliwe jest dzięki wykorzystaniu filtra Kalmana oraz metody największej
wiarygodności przy załoŜeniu, Ŝe składniki losowe ε t i vt mają niezaleŜne rozkłady
normalne. Wariancje ε t i vt są stałe w czasie i mają odpowiednio wartości Q i R.
Model premii za ryzyko daje się przekształcić do postaci modelu przestrzeni stanów
analogicznej do (2.2.8) i (2.2.9). Ma on wtedy następująca postać:
d t = pt + ε t =
= [1 01 L 0 q−1 ] z t + ε t
α α 2 α 3
 pt   1
 p  1 0 0
t −1 
zt ≡ 
=0 1 0
 M  

 M O O
 pt −q+1   0 L 0

= Fz t −1 + Gvt
(równanie obserwacji)
L αq 
 pt −1  1
L 0  
pt −2  0


×
+   × vt
L 0
.
  M  M
O M  
  
 pt −q  0
1 0  
(równanie stanu)
(2.2.21)
(2.2.22)
Taka struktura modelu umoŜliwia dalsze modelowanie sygnału premii przy pomocy
algorytmu filtru Kalmana, to znaczy równań (2.2.11) – (2.2.18) oraz umoŜliwia oszacowanie
parametrów modelu (2.2.20) metodą największej wiarygodności. Funkcja wiarygodności dana
jest wtedy wzorem (2.2.19).
NaleŜy zwrócić uwagę, Ŝe sygnał premii w momencie t stanowi pierwszy element
wektora z t . Dlatego jego prognoza na okres t+1 dokonana w momencie t stanowi pierwszy
element wektora z t +1|t , a jego wariancja równa jest elementowi macierzy Pt +1|t , leŜącemu w
lewym górnym rogu tej macierzy (porównaj równania (2.2.11), (2.2.12)).