Prognozowanie i Symulacje. Wykład III. Metody identyfikacji
Transkrypt
Prognozowanie i Symulacje. Wykład III. Metody identyfikacji
Analiza wahań okresowych Prognozowanie i Symulacje. Wykład III. Metody identyfikacji nielosowych składowych Edward Kozłowski e-mail:[email protected] Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Spis treści 1 Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Analiza wahań okresowych W szeregach czasowych {xt }t∈N , oprócz trendu lub dynamiki opisywanej za pomocą funkcji deterministycznych, mogą występować wahania okresowe. Taki szereg po m jednostkach czasu wykazuje podobne własności, innymi słowy znajduje się w tej samej fazie cyklu. W niektórych przypadkach badane zjawisko może podlegać kilku rodzajom wahań (np. sezonowym i koniunkturalnym), w takim przypadku należy w szeregu uwzględnić więcej niż jeden okres. Analiza wahań okresowych analiza trendów faowych analiza harmoniczna Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Analiza trendów fazowych Analiza trendów fazowych polega na oszacowaniu parametrów funkcji deterministycznych dla poszczególnych faz cyklu (dla każdej fazy cyklu wydzielamy podszereg oraz go identyfikujemy). Do identyfikacji parametrów funkcji deterministycznych najczęściej wykorzystujemy metodę najmniejszych kwadratów. Przyjmijmy, że w analizowanym szeregu czasowych {xt }1¬t¬N istnieje m−faz (najczęściej przyjmujemy m = 4 do analizy kwartalnych zachowań zjawiska lub m = 12 do analizy miesięcznych zachowań) oraz N = T m. Badany szereg {xt }1¬t¬N dzielimy na m podszeregów x1k 1¬k¬T , 2 xk 1¬k¬T , ...,{xm k }1¬k¬T , gdzie x1k x2k 1¬k¬T 1¬k¬T x1 , xm+1 , x2m+1 , ..., x(T −1)m+1 , = x2 , xm+2 , x2m+2 , ..., x(T −1)m+2 , = ... {xm k }1¬k¬T = {xm , x2m , x3m , ..., xT m } . Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Dla każdego z tych podszeregów konstrujemy trendy fazowe – modele postaci: x1k = f1 (k, Θ1 ) + ε1k , x2k = f2 (k, Θ2 ) + ε2k , xm k = fm (k, Θm ) + εm k , ... dla 1 ¬ k ¬ T , gdzie dla i = 1, 2, ..., m funkcje deterministyczne fi (t, Θ) określają wewnętrzną dynamikę w każdym z podszeregów xik 1¬k¬T , natomiast εik 1¬k¬T są nieskorelowanymi zmiennymi losowymi o rozkładzie normalnym N 0, σi2 . Oceny parametrów Θ1 , Θ2 , ..., Θm wyznaczamy za pomocą MNK. Estymatory odchyleń standardowych szacujemy jako v u T u1 X 2 σ̂i = t (εm k ) . T k=1 Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Po identyfikacji szereg czasowy {xt }t∈N możemy przedstawić w postaci t , gdy mod (t, m) = 1, + 1, Θ̂1 + ε1 t +1 f1 m [m] t f , gdy mod (t, m) = 2, + 1, Θ̂2 + ε2 t +1 2 m [m] ...... xt = t f + 1, Θ̂ + εm−1 , gdy mod (t, m) = m − 1, m−1 m−1 m [ mt ]+1 t fm m , gdy mod (t, m) = 0, , Θ̂m + εmt [m] (1) t gdzie m oznacza część całkowitą z dzielenia t przez m, natomiast mod (t, m) oznacza resztę z dzielenia t przez m. Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Przykład 4 Sprzedaż towaru (w tys.szt) w kolejnych kwartałach przedstawia rysunek poniżej Rysunek: Szereg czasowy {xt }t∈{1,2,...,100} Dokonać identyfikacji kwartalnych trendów fazowych w szeregu czasowym. Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Szereg czasowy przedstawiony na rysunku zawiera wahania okresowe. Okres składa się z czterech faz (pomiary kwartalne, z rysunku również widać że ”górki i dołki” powtarzają się co cztery chwile czasowe), dlatego rozbijamy go na cztery podszeregi, które reprezentują cztery różne fazy w analizowanym szeregu. Każdy z podszeregów zawiera w sobie trend liniowy, dlatego przyjmujemy 1 x = α01 + α11 k + ε1k , 2k xk = α02 + α12 k + ε2k , (2) x3 = α03 + α13 k + ε3k , 4k 4 4 4 xk = α0 + α1 k + εk , gdzie εik k∈{1,2,...,25} dla i = 1, 2, 3, 4 reprezentują ciągi nieskorelowanych zmiennych losowych o rozkładzie normalnym N 0, σi2 . Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Edward Kozłowski Analiza trendów fazowych Analiza harmoniczna Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Po identyfikacji parametrycznej szereg czasowy {xt }1¬t¬100 możemy przedstawić w postaci , gdy mod (t, 4) = 1 9.1549 + 1.1937 4t + 1 + ε1t +1 t [ 42] 13.3736 + 2.0372 4 + 1 + ε t , gdy mod (t, 4) = 2 [ 4 ]+1 t xt = 3 10.3475 + 1.3563 4 + 1 + ε t +1 , gdy mod (t, 4) = 3 [4] 4.3825 + 1.0396 4t + ε4t , gdy mod (t, 4) = 0 +1 [4] 2 2 gdzie ε1t ∼ N 0, 1.1129 , εt ∼ N 0, 0.684252 , ε3t ∼ N 0, 1.22482 , ε4t ∼ N 0, 0.738632 . Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Rysunek przedstawia zachowanie szeregu {xt }1¬t¬100 (krzywa granatowa) oraz części deterministycznej {x̂t }1¬t¬100 Rysunek: Wartości empiryczne i teoretyczne szeregu czasowego Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Analiza harmoniczna Inne podejście do analizy zjawisk okresowych polega na założeniu, że szereg czasowy jest zbudowany z fal sinusowych i kosinusowych o różnych częstotliwościach. Funkcje sinusowe i kosinusowe występujące w części deterministycznej szeregu czasowego nazywamy harmonikami. Do identyfikacji szeregu czasowego {xt }1¬t¬N używamy metod interpolacji trygonometrycznej, dokładniej dokonujemy rozwinięcia w szereg Fouriera. Analizowany szereg {xt }1¬t¬N przedstawiamy w postaci xt = α0 + T X k=1 αk cos 2π 2π kt + βk sin kt + εt , N N gdzie {εt }1¬t¬N jest ciągiem niezależnych zmiennych losowych o rozkładzie normalnym N 0, σ 2 . Wielkość T < N przyjmujemy jako N T = 2 , gdzie [·] oznacza część całkowitą. Edward Kozłowski Metody identyfikacji nielosowych składowych (3) Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Lemat 3 Dla dowolnego s 6= 2πk, k ∈ C (C–zbiór liczb całkowitych) spełnione są następujące równości n n X sin n+1 2 s sin 2 s , (4) sin ks = sin 2s k=1 n X sin n + 21 s 1 cos ks = (5) − . s 2 sin 2 2 k=1 Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Twierdzenie 2 Niech dany będzie szereg czasowy {xt }1¬t¬N postaci (3), wtedy estymatory nieznanych parametrów α0 , α1 , β1 , ..., αT , βT są dane wzorami: N 1 X xt , α̂0 = N t=1 (6) oraz α̂l = β̂l = N 2 X 2π xt cos lt , N t=1 N n 2 X 2π xt sin lt , N t=1 N dla l = 1, 2, ..., T. Edward Kozłowski Metody identyfikacji nielosowych składowych (7) (8) Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Wniosek 3 Jeżeli N jest liczbą parzystą, to ze wzorów (7)-(8) estymatory parametrów αT oraz βT dla T = N2 wynoszą: α̂T = N 2 X xt cos (πt) , N t=1 β̂T = 0. Edward Kozłowski (9) (10) Metody identyfikacji nielosowych składowych Analiza trendów fazowych Analiza harmoniczna Analiza wahań okresowych Dla każdej harmoniki wyznaczamy amplitudę, prędkość kątową oraz przesunięcie fazowe. Prędkość kątowa wynosi 2π k, N ωk = amplituda Ak = q αk2 + βk2 , natomiast przesunięcie fazowe φk = ϕk , ωk dla którego cos ϕk = βk , Ak sin ϕk = αk Ak lub ϕk = arctg αk βk dla k = 1, 2, ..., T. Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Szereg czasowy (3) możemy przedstawić w postaci xt = α0 + T X Ak sin (ωk t + ϕk ) + εt , (11) k=1 gdzie {εt }1¬t¬N jest ciągiem niezależnych zmiennych losowych o rozkładzie normalnym N 0, σ 2 . Liczba harmonik wzrasta wraz ze wzrostem liczebności próby (liczebności szeregu czasowego). Do prognozowania w modelu zazwyczaj nie uwzględnia się wszystkich harmonik, wybieramy tylko te, których udział w wyjaśnieniu zachowania szeregu czasowego jest największy. Wybiera się harmoniki o większych amplitudach. Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna W przypadku gdy w szeregu czasowym {xt }1¬t¬N oprócz wahań okresowych występują inne czynniki nielosowe (trendu, wielomianowe, wykładnicze itp.), np. xt = f (t) + T X 2π 2π kt + βk sin kt + εt , αk cos N N k=1 to najpierw z pierwotnego szeregu {xt }1¬t¬N wydzielamy nielosową składową f (t) tym sposobem definiujemy szereg {x̃t }1¬t¬N , gdzie x̃t = yt − f (t) dla t = 1, 2, ..., n. Następnie dokonujemy analizy poszczególnych harmonik szeregu postaci T X 2π 2π x̃t = αk cos kt + βk sin kt + εt , N N k=1 który już oscyluje dookoła poziomu zerowego. Edward Kozłowski Metody identyfikacji nielosowych składowych (12) Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Przykład 5 W szeregu {xt }1¬t¬100 z przykładu 4 przedstawionym krzywą granatową na rysunku a najpierw zidentyfikujemy trend liniowy (linia prosta - czerwona). Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Korzystając z metody najmniejszych kwadratów otrzymujemy xt = 10.1128 + 0.3463t + x̃t . Z wyjściowego szeregu {xt }1¬t¬100 wydzielając trend liniowy x̃t = xt − (10.1128 + 0.3463t) , otrzymujemy szereg {x̃t }1¬t¬100 przedstawiony na wykresie b . Edward Kozłowski Metody identyfikacji nielosowych składowych Analiza wahań okresowych k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 α̂k 0.0239 -0.1082 -0.2565 -0.2792 -0.0251 -0.1493 0.0010 -0.0014 -0.0647 0.0393 -0.0807 -0.1834 -0.1511 0.0918 -0.0102 -0.1810 -0.1591 -0.1063 0.0910 0.0431 0.1640 0.0703 0.3015 0.1999 -11.3267 β̂k -0.1303 -0.3377 -0.0304 -0.2605 0.1459 -0.0296 0.0758 0.0027 -0.0806 0.0049 0.1727 -0.2446 -0.2061 0.0652 -0.1641 -0.0637 -0.2748 -0.4262 -0.4846 -0.3964 -0.4912 -0.6160 -0.8554 -2.0106 -1.3075 Ak 0.1325 0.3546 0.2583 0.3819 0.1481 0.1522 0.0758 0.0030 0.1033 0.0396 0.1906 0.3057 0.2555 0.1127 0.1644 0.1919 0.3175 0.4393 0.4931 0.3988 0.5178 0.6200 0.9070 2.0205 11.4019 t 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Edward Kozłowski Analiza trendów fazowych Analiza harmoniczna α̂k -0.1274 -0.3934 -0.2862 -0.2568 -0.1014 -0.2764 -0.2465 -0.1187 -0.0670 -0.0934 -0.4124 -0.0879 -0.0551 -0.0384 -0.2545 -0.1613 -0.2992 -0.2534 -0.0316 0.0248 -0.0789 0.0365 0.0757 -0.2068 2.2047 β̂k 2.0453 0.9109 0.8899 0.2994 0.4838 0.2351 0.0737 0.4469 0.3208 0.3491 0.1987 0.1628 -0.1992 0.0537 0.3994 0.1454 0.2335 0.4185 -0.0592 0.5592 0.1009 0.2815 0.5414 1.1215 0 Ak 2.0493 0.9922 0.9348 0.3944 0.4943 0.3629 0.2573 0.4625 0.3277 0.3614 0.4578 0.1850 0.2067 0.0660 0.4736 0.2172 0.3795 0.4892 0.0671 0.5597 0.1281 0.2839 0.5467 1.1404 2.2047 Metody identyfikacji nielosowych składowych Analiza wahań okresowych Analiza trendów fazowych Analiza harmoniczna Z rysunku c widzimy, że dość duży wzrost amplitudy występuje dla k = 25 oraz nieduży dla k = 50 (jako efekt nakładania się fal w dolnym zakresie częstotliwości). Praktyczne największe wahania w szeregu {x̃t }1¬t¬100 występują dla prędkości kątowej ω25 = 50π n (harmonika kosinusowa k = 25 najwięcej wyjaśnia zachowanie okresowe w tym szeregu). Wykres d przedstawia zachowanie okresowe wydzielonego szeregu {x̃t }1¬t¬100 (krzywa granatowa) oraz jego części teoretycznej {x̄t }1¬t¬100 (krzywa czerwona) postaci x̄t = 50 X 2π 2π kt + β̂k sin kt . α̂k cos N N k=1 Powyższe szeregi praktycznie się nakładają. Edward Kozłowski Metody identyfikacji nielosowych składowych