Prognozowanie i Symulacje. Wykład III. Metody identyfikacji

Transkrypt

Prognozowanie i Symulacje. Wykład III. Metody identyfikacji
Analiza wahań okresowych
Prognozowanie i Symulacje. Wykład III.
Metody identyfikacji nielosowych składowych
Edward Kozłowski
e-mail:[email protected]
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Spis treści
1
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Analiza wahań okresowych
W szeregach czasowych {xt }t∈N , oprócz trendu lub dynamiki opisywanej
za pomocą funkcji deterministycznych, mogą występować wahania
okresowe. Taki szereg po m jednostkach czasu wykazuje podobne
własności, innymi słowy znajduje się w tej samej fazie cyklu. W
niektórych przypadkach badane zjawisko może podlegać kilku rodzajom
wahań (np. sezonowym i koniunkturalnym), w takim przypadku należy w
szeregu uwzględnić więcej niż jeden okres.
Analiza wahań okresowych
analiza trendów faowych
analiza harmoniczna
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Analiza trendów fazowych
Analiza trendów fazowych polega na oszacowaniu parametrów funkcji
deterministycznych dla poszczególnych faz cyklu (dla każdej fazy cyklu
wydzielamy podszereg oraz go identyfikujemy). Do identyfikacji
parametrów funkcji deterministycznych najczęściej wykorzystujemy
metodę najmniejszych kwadratów.
Przyjmijmy, że w analizowanym szeregu czasowych {xt }1¬t¬N istnieje
m−faz (najczęściej przyjmujemy m = 4 do analizy kwartalnych zachowań
zjawiska lub m = 12 do analizy miesięcznych zachowań) oraz
N = T m.
Badany szereg {xt }1¬t¬N dzielimy na m podszeregów x1k 1¬k¬T ,
2
xk 1¬k¬T , ...,{xm
k }1¬k¬T , gdzie
x1k
x2k
1¬k¬T
1¬k¬T
x1 , xm+1 , x2m+1 , ..., x(T −1)m+1 ,
=
x2 , xm+2 , x2m+2 , ..., x(T −1)m+2 ,
=
...
{xm
k }1¬k¬T
= {xm , x2m , x3m , ..., xT m } .
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Dla każdego z tych podszeregów konstrujemy trendy fazowe – modele
postaci:
x1k
= f1 (k, Θ1 ) + ε1k ,
x2k
= f2 (k, Θ2 ) + ε2k ,
xm
k
= fm (k, Θm ) + εm
k ,
...
dla 1 ¬ k ¬ T , gdzie dla i = 1, 2, ..., m funkcje deterministyczne
fi (t, Θ)
określają wewnętrzną dynamikę w każdym z podszeregów xik 1¬k¬T ,
natomiast εik 1¬k¬T są nieskorelowanymi zmiennymi losowymi o
rozkładzie normalnym N 0, σi2 . Oceny parametrów Θ1 , Θ2 , ..., Θm
wyznaczamy za pomocą MNK. Estymatory odchyleń standardowych
szacujemy jako
v
u
T
u1 X
2
σ̂i = t
(εm
k ) .
T
k=1
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Po identyfikacji szereg czasowy {xt }t∈N możemy przedstawić w postaci

t

, gdy mod (t, m) = 1,
+ 1, Θ̂1 + ε1 t +1
f1 m


[m]



t


f
, gdy mod (t, m) = 2,
+ 1, Θ̂2 + ε2 t +1

 2 m
[m]
...... xt =

t


f
+
1,
Θ̂
+ εm−1
, gdy mod (t, m) = m − 1,

m−1
m−1
m

[ mt ]+1




t
 fm m
, gdy mod (t, m) = 0,
, Θ̂m + εmt
[m]
(1)
t
gdzie m
oznacza część całkowitą z dzielenia t przez m, natomiast
mod (t, m) oznacza resztę z dzielenia t przez m.
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Przykład 4 Sprzedaż towaru (w tys.szt) w kolejnych kwartałach
przedstawia rysunek poniżej
Rysunek: Szereg czasowy {xt }t∈{1,2,...,100}
Dokonać identyfikacji kwartalnych trendów fazowych w szeregu
czasowym.
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Szereg czasowy przedstawiony na rysunku zawiera wahania okresowe.
Okres składa się z czterech faz (pomiary kwartalne, z rysunku również
widać że ”górki i dołki” powtarzają się co cztery chwile czasowe), dlatego
rozbijamy go na cztery podszeregi, które reprezentują cztery różne fazy w
analizowanym szeregu.
Każdy z podszeregów zawiera w sobie trend liniowy, dlatego przyjmujemy
 1
x = α01 + α11 k + ε1k ,


 2k
xk = α02 + α12 k + ε2k ,
(2)
x3 = α03 + α13 k + ε3k ,


 4k
4
4
4
xk = α0 + α1 k + εk ,
gdzie εik k∈{1,2,...,25} dla i = 1, 2, 3, 4 reprezentują ciągi
nieskorelowanych zmiennych losowych o rozkładzie normalnym N 0, σi2 .
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Edward Kozłowski
Analiza trendów fazowych
Analiza harmoniczna
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Po identyfikacji parametrycznej szereg czasowy {xt }1¬t¬100 możemy
przedstawić w postaci

, gdy mod (t, 4) = 1
9.1549 + 1.1937 4t + 1 + ε1t +1



t
[ 42]


 13.3736 + 2.0372 4 + 1 + ε t
, gdy mod (t, 4) = 2
[ 4 ]+1
t
xt =
3
10.3475 + 1.3563 4 + 1 + ε t +1 , gdy mod (t, 4) = 3


[4]



 4.3825 + 1.0396 4t + ε4t
, gdy mod (t, 4) = 0
+1
[4]
2
2
gdzie ε1t ∼ N 0, 1.1129
, εt ∼ N 0, 0.684252 , ε3t ∼ N 0, 1.22482 ,
ε4t ∼ N 0, 0.738632 .
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Rysunek przedstawia zachowanie szeregu {xt }1¬t¬100 (krzywa
granatowa) oraz części deterministycznej {x̂t }1¬t¬100
Rysunek: Wartości empiryczne i teoretyczne szeregu czasowego
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Analiza harmoniczna
Inne podejście do analizy zjawisk okresowych polega na założeniu, że
szereg czasowy jest zbudowany z fal sinusowych i kosinusowych o różnych
częstotliwościach. Funkcje sinusowe i kosinusowe występujące w części
deterministycznej szeregu czasowego nazywamy harmonikami. Do
identyfikacji szeregu czasowego {xt }1¬t¬N używamy metod interpolacji
trygonometrycznej, dokładniej dokonujemy rozwinięcia w szereg Fouriera.
Analizowany szereg {xt }1¬t¬N przedstawiamy w postaci
xt = α0 +
T X
k=1
αk cos
2π
2π
kt + βk sin
kt
+ εt ,
N
N
gdzie {εt }1¬t¬N jest ciągiem niezależnych zmiennych losowych o
rozkładzie normalnym N 0, σ 2 . Wielkość T < N przyjmujemy jako
N T = 2 , gdzie [·] oznacza część całkowitą.
Edward Kozłowski
Metody identyfikacji nielosowych składowych
(3)
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Lemat 3
Dla dowolnego s 6= 2πk, k ∈ C (C–zbiór liczb całkowitych) spełnione są
następujące równości
n
n
X
sin n+1
2 s sin 2 s
,
(4)
sin ks =
sin 2s
k=1
n
X
sin n + 21 s
1
cos ks =
(5)
− .
s
2 sin 2
2
k=1
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Twierdzenie 2
Niech dany będzie szereg czasowy {xt }1¬t¬N postaci (3), wtedy
estymatory nieznanych parametrów α0 , α1 , β1 , ..., αT , βT są dane
wzorami:
N
1 X
xt ,
α̂0 =
N t=1
(6)
oraz
α̂l
=
β̂l
=
N
2 X
2π
xt cos
lt ,
N t=1
N
n
2 X
2π
xt sin
lt ,
N t=1
N
dla l = 1, 2, ..., T.
Edward Kozłowski
Metody identyfikacji nielosowych składowych
(7)
(8)
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Wniosek 3
Jeżeli N jest liczbą parzystą, to ze wzorów (7)-(8) estymatory
parametrów αT oraz βT dla T = N2 wynoszą:
α̂T
=
N
2 X
xt cos (πt) ,
N t=1
β̂T
=
0.
Edward Kozłowski
(9)
(10)
Metody identyfikacji nielosowych składowych
Analiza trendów fazowych
Analiza harmoniczna
Analiza wahań okresowych
Dla każdej harmoniki wyznaczamy amplitudę, prędkość kątową oraz
przesunięcie fazowe. Prędkość kątowa wynosi
2π
k,
N
ωk =
amplituda
Ak =
q
αk2 + βk2 ,
natomiast przesunięcie fazowe
φk =
ϕk
,
ωk
dla którego
cos ϕk =
βk
,
Ak
sin ϕk =
αk
Ak
lub ϕk = arctg
αk
βk
dla k = 1, 2, ..., T.
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Szereg czasowy (3) możemy przedstawić w postaci
xt = α0 +
T
X
Ak sin (ωk t + ϕk ) + εt ,
(11)
k=1
gdzie {εt }1¬t¬N jest ciągiem niezależnych zmiennych losowych o
rozkładzie normalnym N 0, σ 2 .
Liczba harmonik wzrasta wraz ze wzrostem liczebności próby (liczebności
szeregu czasowego). Do prognozowania w modelu zazwyczaj nie
uwzględnia się wszystkich harmonik, wybieramy tylko te, których udział
w wyjaśnieniu zachowania szeregu czasowego jest największy. Wybiera się
harmoniki o większych amplitudach.
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
W przypadku gdy w szeregu czasowym {xt }1¬t¬N oprócz wahań
okresowych występują inne czynniki nielosowe (trendu, wielomianowe,
wykładnicze itp.), np.
xt = f (t) +
T X
2π
2π
kt + βk sin
kt
+ εt ,
αk cos
N
N
k=1
to najpierw z pierwotnego szeregu {xt }1¬t¬N wydzielamy nielosową
składową f (t) tym sposobem definiujemy szereg {x̃t }1¬t¬N , gdzie
x̃t = yt − f (t) dla t = 1, 2, ..., n. Następnie dokonujemy analizy
poszczególnych harmonik szeregu postaci
T X
2π
2π
x̃t =
αk cos
kt + βk sin
kt
+ εt ,
N
N
k=1
który już oscyluje dookoła poziomu zerowego.
Edward Kozłowski
Metody identyfikacji nielosowych składowych
(12)
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Przykład 5 W szeregu {xt }1¬t¬100 z przykładu 4 przedstawionym
krzywą granatową na rysunku a najpierw zidentyfikujemy trend liniowy
(linia prosta - czerwona).
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Korzystając z metody najmniejszych kwadratów otrzymujemy
xt = 10.1128 + 0.3463t + x̃t .
Z wyjściowego szeregu {xt }1¬t¬100 wydzielając trend liniowy
x̃t = xt − (10.1128 + 0.3463t) ,
otrzymujemy szereg {x̃t }1¬t¬100 przedstawiony na wykresie b .
Edward Kozłowski
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
α̂k
0.0239
-0.1082
-0.2565
-0.2792
-0.0251
-0.1493
0.0010
-0.0014
-0.0647
0.0393
-0.0807
-0.1834
-0.1511
0.0918
-0.0102
-0.1810
-0.1591
-0.1063
0.0910
0.0431
0.1640
0.0703
0.3015
0.1999
-11.3267
β̂k
-0.1303
-0.3377
-0.0304
-0.2605
0.1459
-0.0296
0.0758
0.0027
-0.0806
0.0049
0.1727
-0.2446
-0.2061
0.0652
-0.1641
-0.0637
-0.2748
-0.4262
-0.4846
-0.3964
-0.4912
-0.6160
-0.8554
-2.0106
-1.3075
Ak
0.1325
0.3546
0.2583
0.3819
0.1481
0.1522
0.0758
0.0030
0.1033
0.0396
0.1906
0.3057
0.2555
0.1127
0.1644
0.1919
0.3175
0.4393
0.4931
0.3988
0.5178
0.6200
0.9070
2.0205
11.4019
t
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Edward Kozłowski
Analiza trendów fazowych
Analiza harmoniczna
α̂k
-0.1274
-0.3934
-0.2862
-0.2568
-0.1014
-0.2764
-0.2465
-0.1187
-0.0670
-0.0934
-0.4124
-0.0879
-0.0551
-0.0384
-0.2545
-0.1613
-0.2992
-0.2534
-0.0316
0.0248
-0.0789
0.0365
0.0757
-0.2068
2.2047
β̂k
2.0453
0.9109
0.8899
0.2994
0.4838
0.2351
0.0737
0.4469
0.3208
0.3491
0.1987
0.1628
-0.1992
0.0537
0.3994
0.1454
0.2335
0.4185
-0.0592
0.5592
0.1009
0.2815
0.5414
1.1215
0
Ak
2.0493
0.9922
0.9348
0.3944
0.4943
0.3629
0.2573
0.4625
0.3277
0.3614
0.4578
0.1850
0.2067
0.0660
0.4736
0.2172
0.3795
0.4892
0.0671
0.5597
0.1281
0.2839
0.5467
1.1404
2.2047
Metody identyfikacji nielosowych składowych
Analiza wahań okresowych
Analiza trendów fazowych
Analiza harmoniczna
Z rysunku c widzimy, że dość duży wzrost amplitudy występuje dla
k = 25 oraz nieduży dla k = 50 (jako efekt nakładania się fal w dolnym
zakresie częstotliwości).
Praktyczne największe wahania w szeregu {x̃t }1¬t¬100 występują dla
prędkości kątowej ω25 = 50π
n (harmonika kosinusowa k = 25 najwięcej
wyjaśnia zachowanie okresowe w tym szeregu).
Wykres d przedstawia zachowanie okresowe wydzielonego szeregu
{x̃t }1¬t¬100 (krzywa granatowa) oraz jego części teoretycznej
{x̄t }1¬t¬100 (krzywa czerwona) postaci
x̄t =
50 X
2π
2π
kt + β̂k sin
kt
.
α̂k cos
N
N
k=1
Powyższe szeregi praktycznie się nakładają.
Edward Kozłowski
Metody identyfikacji nielosowych składowych