Krótki opis i przykład
Transkrypt
Krótki opis i przykład
Dobromił Serwa Filtr Kalmana – wstępne opracowanie Modele przestrzeni stanów oraz filtr Kalmana zostały szczegółowo omówione w licznych opracowaniach dotyczących analizy szeregów czasowych (Anderson i Moore (1979), Aoki (1990), Harvey (1992), Hamilton (1994), Durbin, Koopmans (2001)). Prezentacji algorytmu dokonano na podstawie pracy Hamiltona (1994). Algorytm Kalmana pozwala prognozować przyszłe wartości pewnego nieobserwowalnego szeregu czasowego na podstawie modelu przestrzeni stanów i historycznych danych. UmoŜliwia on takŜe wygładzanie obserwowalnych szeregów czasowych. W tej części pracy uwagę skoncentrowano na wyjaśnieniu metody ekstrakcji nieobserwowalnego sygnału z szeregów danych. Metodę tę w następnym podpunkcie zastosowano do wygenerowania obserwacji premii za ryzyko dla kursu walutowego. Model przestrzeni stanów składa się z równania obserwacji (lub inaczej równania pomiaru, ang. observation equation, measurement equation): y t = Ax t + Βz t + ε t (2.2.8) i równania stanu (lub inaczej równania przejścia, ang. state equation, transition equation): z t = Fz t −1 + Gυ t . (2.2.9) Zmienne wektory y t i x t są obserwowalne w czasie. Prawdziwe wartości wektora z t są nieznane, a filtr Kalmana pozwala oszacować jego średnią i wariancję na podstawie danych historycznych oraz równań (2.2.8) i (2.2.9). Nieobserwowalne są takŜe wektory składników losowych ε t i υ t , ale znane są ich średnie (wektory zerowe) oraz macierze wariancji. Zwykle zakłada się stałość wariancji składników losowych w czasie: E (ε t ε t ' ) = R i E (υ t υ t ' ) = Q . (2.2.10) Procedura szacowania wartości średniej z t|t −1 oraz wariancji Pt|t −1 zmiennej losowej z t warunkowej ze względu na całą informację It-1 dostępną w momencie t –1 opisana jest za pomocą następujących formuł: z t|t −1 = Fz t −1|t −1 , (2.2.11) Pt|t −1 = FPt −1|t −1F '+GRG ' , (2.2.12) Prognozy z t|t −1 i Pt|t −1 moŜna uaktualnić w momencie t wykorzystując poniŜsze równania (ang. updating formulas): −1 (2.2.13) Pt|t = Pt|t −1Β' M t|t −1 ΒPt|t −1 , (2.2.14) z t|t = z t|t −1 + Pt|t −1Β' M t|t −1 ξ t|t −1 −1 gdzie wyraŜenia: ξ t|t −1 = y t − Ax t − Βz t|t −1 , (2.2.15) M t|t −1 = ΒPt|t −1Β'+ R (2.2.16) oznaczają odpowiednio błąd prognozy i jego wariancję. Proces iteracji rozpoczyna się zwykle od załoŜenia, Ŝe początkowa wartość wektora z t jest realizacją zmiennej losowej o wielowymiarowym rozkładzie normalnym ze średnią z 1|0 i wariancją P1|0 . Gdy z t jest zmienną stacjonarną (wszystkie wartości własne macierzy F leŜą wewnątrz koła jednostkowego), to bezwarunkowe wartości z 1|0 i P1|0 moŜna otrzymać ze wzorów: z 1|0 = 0 (2.2.17) vec(P1|0 ) = [I − (F ⊗ F)]−1 vec(GRG ' ) (2.2.18) gdzie symbol ⊗ oznacza iloczyn Kroneckera, a vec(⋅) to operator przekształcający macierz w wektor poprzez ułoŜenie kolejnych kolumn tej macierzy pod sobą. Parametry modelu przestrzeni stanów zawarte w macierzach A, B, F, G, R i Q nie są zawsze znane. Pod warunkiem, Ŝe ich wartości są identyfikowalne, moŜna je oszacować równocześnie z prognozowaniem wartości wektora stanu z t . Procedura polega na: a) wybraniu początkowych wartości parametrów modelu, b) oszacowaniu wartości wektora z t filtrem Kalmana, c) obliczenia wartości funkcji wiarygodności dla zadanych parametrów i oszacowań szeregu zt , d) powtarzaniu czynności opisanych w punktach a – c dla róŜnych kombinacji wartości parametrów w A, B, F, G, R i Q aŜ do znalezienia maksymalnej wartości funkcji wiarygodności. Funkcja wiarygodności w postaci zlogarymowanej dla modelu przestrzeni stanów dana jest wzorem: ln L = − Do 1 T 1 T n −1 ln (2π ) ⋅ | M t|t −1 | − ∑ ξ 't|t −1 M t|t −1 ξ t|t −1 ∑ 2 t =1 2 t =1 [ znalezienia parametrów ] które optymalizują wartość (2.2.19) funkcji wiarygodności wykorzystywane są algorytmy optymalizacyjne dla funkcji nieliniowych, np. metoda quasiNewtona, ME (maximization – expectation), Marquardta i inne. MoŜliwe problemy związane z szacowaniem parametrów modeli przestrzeni stanów związane są z występowaniem lokalnych maksimów funkcji wiarygodności, które utrudniają znalezienie jej globalnego maksimum. Dodatkowo nieidentyfikowalność parametrów, interpretowana tutaj jako występowanie tej samej największej wartości funkcji wiarygodności dla roŜnych kombinacji wartości parametrów, uniemoŜliwia wyznaczenie ich oszacowań (Hamilton (1994)). Przykład: Model premii za ryzyko jako model przestrzeni stanów ZałoŜono, Ŝe w modelu premii za ryzyko premia jest generowana przez proces autoregresji rzędu q, AR(q): d t = pt + ε t . pt = α1 pt −1 + α 2 pt −2 + ... + α q pt −q + vt (2.2.20) PoniewaŜ sygnał premii jest nieobserwowalny w czasie, to oszacowanie parametrów modelu (2.2.20) moŜliwe jest dzięki wykorzystaniu filtra Kalmana oraz metody największej wiarygodności przy załoŜeniu, Ŝe składniki losowe ε t i vt mają niezaleŜne rozkłady normalne. Wariancje ε t i vt są stałe w czasie i mają odpowiednio wartości Q i R. Model premii za ryzyko daje się przekształcić do postaci modelu przestrzeni stanów analogicznej do (2.2.8) i (2.2.9). Ma on wtedy następująca postać: d t = pt + ε t = = [1 01 L 0 q−1 ] z t + ε t α α 2 α 3 pt 1 p 1 0 0 t −1 zt ≡ =0 1 0 M M O O pt −q+1 0 L 0 = Fz t −1 + Gvt (równanie obserwacji) L αq pt −1 1 L 0 pt −2 0 × + × vt L 0 . M M O M pt −q 0 1 0 (równanie stanu) (2.2.21) (2.2.22) Taka struktura modelu umoŜliwia dalsze modelowanie sygnału premii przy pomocy algorytmu filtru Kalmana, to znaczy równań (2.2.11) – (2.2.18) oraz umoŜliwia oszacowanie parametrów modelu (2.2.20) metodą największej wiarygodności. Funkcja wiarygodności dana jest wtedy wzorem (2.2.19). NaleŜy zwrócić uwagę, Ŝe sygnał premii w momencie t stanowi pierwszy element wektora z t . Dlatego jego prognoza na okres t+1 dokonana w momencie t stanowi pierwszy element wektora z t +1|t , a jego wariancja równa jest elementowi macierzy Pt +1|t , leŜącemu w lewym górnym rogu tej macierzy (porównaj równania (2.2.11), (2.2.12)).