Wykład 2

Transkrypt

Wykład 2
Modelowanie i analiza szeregów czasowych
Małgorzata Doman
Plan zajęć
Część 1. Modelowanie szeregów jednowymiarowych.
1. Szeregi jednowymiarowe – własności i diagnozowanie
2. Modele autoregresji i średniej ruchomej
3. Identyfikowanie i ocena dopasowania modelu
4. Modele ARMA i ARIMA
Część 2. Modelowanie szeregów wielowymiarowych.
5. Modele wektorowej autoregresji
6. Analiza impuls response
7. Kointegracja
8. Model VECM
Literatura:






T. Kufel, Ekonometria. Rozwiazywanie problemów z wykorzystaniem programu GRETL, WN PWN, Warszawa 2007
M. Osińska, Ekonometria współczesna, Dom Organizatora, Toruń 2007.
M. Osińska, Ekonometria finansowa, PWE, Warszawa, 2006.
G.S. Maddala, Ekonometria, PWN, Warszawa, 2006.
J.D. Hamilton, Time Series Analysis, Princeton University Press, Princeton, 1994.
A. Welfe, Ekonometria, PWE 2003.
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
2
Część 1. Modelowanie szeregów jednowymiarowych.
Zajęcia 1. Szeregi jednowymiarowe – własności i diagnozowanie
A. Wiadomości teoretyczne
Rodzinę ( X t )t zmiennych losowych określonych na tej samej przestrzeni probabilistycznej
nazywa się procesem stochastycznym. Zazwyczaj przyjmuje się, że zbiór indeksów  jest
podzbiorem przedziału [0,) i interpretuje się go jako czas. Gdy zbiór  jest przeliczalny,
mówimy, że rozpatrywany proces jest procesem z czasem dyskretnym, a gdy  jest przedziałem, mówimy o procesie z czasem ciągłym.
Dla ustalonego 0   , proces stochastyczny X wyznacza odwzorowanie    ,
t  X t (0 ) , które nazywa się realizacją lub trajektorią procesu X odpowiadającą zdarzeniu
elementarnemu  0 .
W analizie szeregów czasowych, ale nie tylko, realizację procesu stochastycznego X,
która, gdy   {1,2,} , jest ciągiem ( xt ) obserwacji x1 , x2 , , nazywa się szeregiem czasowym i oznacza ( xt ) . Powszechna jest także konwencja, która będzie również stosowana w
trakcie tego wykładu, nazywania szeregiem czasowym, nie tylko realizacji procesu stochastycznego z czasem dyskretnym, ale również samego procesu, w sytuacjach gdy nie prowadzi
to do nieporozumień. Przy tej konwencji, proces stochastyczny X oznacza się, tak samo jak
szereg czasowy, symbolem ( xt ) , a zmienną losową X t oznacza się, tak jak jej realizację,
symbolem xt .
Pojęcie stacjonarności szeregu czasowego.

Szereg (rt ) nazywamy ściśle stacjonarnym, jeśli dla każdego ciągu liczb indeksów
(t1 , t2 ,, tk ) oraz dla każdych liczb całkowitych k , t łączny rozkład wektora losowego
(rt1 , rt 2 , rt K ) jest taki sam, jak rozkład wektora (rt1  t , rt 2  t , rt k  t ) .

Słaba (kowariancyjna) stacjonarność szeregu (rt ) oznacza, że zmienne rt mają skończony drugi moment E (rt 2 )   oraz E (rt )   i cov(rt , rt l )   l dla dowolnych indeksów t i l . Oznacza to w szczególności, że wszystkie rt mają tę samą skończoną wariancję
 0 , a kowariancja między rt i rs zależy jedynie od | t  s | .
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
3
Funkcja autokorelacji (ACF)
Rozważamy słabo stacjonarny szereg czasowy (rt ) . Funkcja autokorelacji (ang. autocorrelation function, ACF) przyporządkowuje liczbie całkowitej l współczynnik korelacji  l między zmiennymi rt i rt l .
l 
(1.1)
cov(rt , rt l )
cov(rt , rt l )  l

 .
var(rt )
0
var(rt ) var(rt l )
Z definicji tej wynika, że  0  1 ,  l   l oraz  1   l  1 . Mówimy, że w szeregu (rt ) nie
występuje autokorelacja, jeśli  0  1 oraz  l  0 dla wszystkich l  0 .
Szereg czasowy (rt ) nazywa się ścisłym białym szumem (ang. strict white noise), jeśli
zmienne rt tworzą ciąg niezależnych zmiennych losowych o tym samym rozkładzie (ang.
independent and identically distributed, iid) z zerową średnią i skończoną wariancją. Jeśli
ponadto zmienne rt mają rozkład normalny, to szereg (rt ) nazywa się gaussowskim białym
szumem.
Jeśli zmienne rt mają zerową średnią, jednakową skończoną wariancję i wartości  l
funkcji autokorelacji szeregu (rt ) są równe zeru dla wszystkich l  0 , to (rt ) nazywa się białym szumem (ang. white noise).
Dla danego ciągu obserwacji (rt )Tt1 , niech r oznacza średnią z próby, tzn. r 
1 T
 rt .
T t 1
Wówczas współczynnik autokorelacji z próby z opóźnieniem l określa się wzorem
T
(1.2)
̂l 
 (r  r )(r
t  l 1
 r)
t l
t
.
T
 (r  r )
t 1
2
t
Przy pewnych ogólnych założeniach, ̂ l jest zgodnym estymatorem współczynnika autokorelacji  l . Na przykład, jeśli (rt ) jest ciągiem iid, spełniającym warunek E (rt 2 )  ) , to dla
dowolnego całkowitego l  0 , ̂ l ma rozkład asymptotycznie normalny ze średnią 0 i wariancją
1
. Fakt ten może być wykorzystany w praktyce do testowania hipotezy zerowej
T
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
H 0 : l  0 , przeciw alternatywie H a : l  0 . Rozkład statystyki testowej postaci
4
T ̂ l jest
asymptotycznie standardowy normalny.
Ogólniej, jeśli
(rt )
jest szeregiem słabo stacjonarnym spełniającym warunek
q
rt     i at i , gdzie  0  1 , a (a j ) jest gaussowskim białym szumem, to ̂ l ma rozkład
i 0
asymptotycznie normalny z zerową średnią i wariancją
q

1
1  2  i2  , dla l  q .
T
i 1

Testy Boxa-Pierce’a i Ljunga-Boxa
W analizie szeregów czasowych często pojawia się konieczność łącznego testowania, czy dla
szeregu rt autokorelacje o różnych opóźnieniach są równe zero.

Test Boxa- Pierce’a (1970)
Test ten opiera się na statystyce walizkowej (ang. portmanteau statistic)
m
Q  (m)  T  ˆ l2 ,
(1.3)
l 1
gdzie ̂ l jest współczynnikiem autokorelacji z próby, określonym wzorem (1.2). Hipotezą
zerową jest H 0 : 1   2     m  0 , a hipotezą alternatywną jest H a :  i  0 , dla pewnego
i {1,2,, m} . Przy założeniu, że (rt ) jest iid (oraz istnieją momenty czwartego rzędu),
Q  (m) ma asymptotycznie rozkład  2 (m) .

Test Ljunga-Boxa (1978)
Statystyka Q(m) testu Ljunga-Boxa jest modyfikacją statystyki Q  (m) , mającą na celu uzyskania większej mocy testu dla skończonych prób:
m
Q(m)  T (T  2)
(1.4)
l 1
ˆ l2
T l
.
Asymptotyczny rozkład statystyki Q(m) jest taki sam, jak statystyki Q  (m) .
W praktyce wybór maksymalnego opóźnienia m ma znaczący wpływ na wyniku testu.
Zwykle przeprowadza się go dla kilku różnych m. Symulacje wskazują, że najlepsze wyniki
daje wybór m  ln T .
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
B. Ćwiczenia w Gretlu i Statistice
 import danych z Excela do gretla
 wstępne analizy statystyczne
5
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
6
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
 wykresy danych oraz funkcji ACF i PACF
 testowanie stacjonarności
 testowanie zależności liniowych
7
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
8
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
9
Małgorzata Doman
 To samo w Statistice
Modelowanie i analiza szeregów czasowych
10
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
11
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
12
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
13
Zajęcia 2. Modele autoregresji i średniej ruchomej
A. Wiadomości teoretyczne
Jeżeli szereg czasowy wykazuje statystycznie istotną wartość autokorelacji z opóźnieniem 1
to, można się spodziewać, że opóźniona wielkość rt 1 okaże się użyteczna w prognozowaniu
wielkości rt . Prosty model wykorzystujący taką zależność jest określony równaniem
rt  a0  a1rt 1   t ,
(2.1)
gdzie  t jest ścisłym białym szumem z wariancją  2 . Jest to model autoregresji rzędu 1, czyli inaczej model AR(1). Zauważmy, że mamy zależności
E (rt | rt 1 )  a0  a1rt 1 ,
(2.2)
var(rt | rt 1 )  var( t )   2 .
Naturalnym uogólnieniem modelu AR(1) są modele AR(p) określone równaniem
rt  a0  a1rt 1    a p rt  p   t .
(2.3)
Własności modeli AR
Przedyskutujemy teraz dokładnie własności modeli AR(1) i AR(2) oraz podamy pewne informacje o własnościach modeli AR(p).
Własności modelu AR(1)
 Kowariancyjna stacjonarność
Przyjmijmy, że szereg rt jest kowariancyjnie stacjonarny. Wtedy z równania (2.1) otrzymujemy
E (rr )  a0  a1 E (rt 1 ) .
Wobec kowariancyjnej stacjonarności, E (rr )  E (rt 1 )   , a zatem
(2.4)
E (rt )   
a0
.
1  a1
Wynika stąd, że średnia wartość zmiennej rt istnieje pod warunkiem, że a1  1 oraz, że
rt ma średnią zero tylko wtedy, gdy a0  0 .
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
14
Kowariancyjna stacjonarność modelu AR(1) określonego równaniem (2.1) jest
równoważna warunkowi  1  a1  1 .
 ACF dla modelu AR(1)
Mnożąc równość (2.1) przez  t , biorąc obustronnie wartości oczekiwane i korzystając z tego,
że E[(rt 1   ) t ]  0 , otrzymujemy E[ t (rt   )]   2 . Pozwala to otrzymać zależność
a1 1   2
l  
 a1 l 1
dla
dla
l 0
,
l 0
z której wynika, że dla kowariancyjnie stacjonarnego modelu AR(1) określonego przez (2.5),
ACF spełnia zależność
l  a1 l 1 , dla l  0 .
Ponieważ  0  1 , więc  l  a1l , dla l  0 .
Własności modelu AR(p)
Dla modelu AR(p) określonego równaniem (2.3), mamy
(2.5)
E (rt )   
a0
,
1  a1    a p
pod warunkiem, że mianownik jest różny od 0.
 Stacjonarność
Model AR(p) jest stacjonarny, jeśli moduły pierwiastków równania 1  a1 L    a p Lp  0
są większe od 1.
 ACF spełnia równanie
(2.6)
(1  a1 L  a2 L2  a p Lp ) l  0 .
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
15
Modele średniej ruchomej (ang. moving-average, MA)
Postać modelu MA(1) następująca:
rt  c0   t  b1 t 1 ,
(2.7)
gdzie c0 jest stałą, a  t ścisłym białym szumem. Ogólnie, model MA(q) jest postaci
rt  c0   t  b1 t 1    bq t q .
(2.8)
Własności modeli MA
 Procesy opisywane przez modele MA są kowariancyjnie stacjonarne, ponieważ są skończonymi kombinacjami liniowymi zmiennych tworzących ścisły biały szum. W przypadku modelu (2.7),
E (rt )  c0 ,
(2.9)
var(rt )  (1  b12  b22    bq2 ) 2 .
 Postać ACF.
Dla MA(1):
Dla MA(2):
 0  1,
 0  1,
1 
 b1
,
1  b12
 l  0, dla l  1.
1 
 b1  b1b2
,
1  b12  b22
2 
 b2
,
1  b12  b22
 l  0, dla l  2.
Dla modelu MA(q), wartość ACF z opóźnieniem q jest różna od zera, a dla każdego opóźnienia l  q jest równa zero. Tę własność można wykorzystać przy identyfikacji rzędu modelu MA.
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
B. Ćwiczenia w gretlu
 Diagnozowanie – ACF i PACF
 Szacowanie modeli AR i MA
16
Małgorzata Doman
 Interpretacja oszacowań
 To samo w Statistice
Modelowanie i analiza szeregów czasowych
17
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
18
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
19
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
20
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
21
Zajęcia 3. Identyfikowanie i ocena dopasowania modelu
A. Wiadomości teoretyczne
Identyfikowanie modeli AR i MA w praktyce.
Modele AR(p)
Problem: Nie wiemy jakie jest p.
Możliwe rozwiązania: PACF lub kryteria informacyjne.
W praktyce, rząd p modelu AR(p) jest nieznany i trzeba go wyznaczyć empirycznie.
Możliwe rozwiązania tego problemu osiągnięte poprzez zastosowanie funkcji autokorelacji
cząstkowej lub kryteriów informacyjnych.
PACF
PACF, czyli funkcja autokorelacji cząstkowej (ang. partial autocorrelation function) jest użytecznym narzędziem służącym do wyznaczania rzędu p w modelu autoregresji AR(p). Określa się ja następująco:
Rozważmy modele AR kolejnych rzędów:
rt  a0,1  a1,1rt 1  e1,t ,
rt  a0, 2  a1, 2 rt 1  a2, 2 rt 2  e2,t ,
rt  a0,3  a1,3 rt 1  a2,3 rt 2  a3,3 rt 3  e3,t ,
 

Są to równania w postaci równań modeli wielorakiej regresji liniowej i mogą być estymowane za pomocą metody najmniejszych kwadratów. Oszacowanie parametru â11 w pierwszym
równaniu jest nazywane wartością PACF z opóźnieniem 1, â22 w drugim równaniu – wartością PACF z opóźnieniem 2 itd.
Z określenia tego wynika, że PACF z opóźnieniem 2 pokazuje dodatkowy wkład wartości rt 2 do rt ponad to, co już zostało wniesione za pośrednictwem rt 1 w modelu AR(1)
rt  a0  a1  rt 1  e1,t . PACF z opóźnieniem 3 pokazuje dodatkowy wkład wartości rt 3 do
ponad to, co zostało wniesione przez model AR(3) itd. Zatem dla modelu AR(p), PACF z
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
22
opóźnieniem p nie powinno się zerować, natomiast z opóźnieniami większymi od p powinno
być bliskie 0.
Przy spełnieniu pewnych warunków regularności, można wykazać, że PACF z próby,
wyznaczone dla modelu AR(p) ma następujące własności:

aˆ p , p jest zbieżne do a p , gdy długość próby T dąży do  ,

aˆ j , j dąży do 0, dla wszystkich j  p ,

asymptotyczna wariancja zmiennych aˆ j , j jest równa 1/T , dla j  p .
Kryteria informacyjne
Podane niżej kryteria informacyjne wykorzystują funkcję wiarygodności, którą oznaczamy tu
przez L. W skrócie, jeśli dana jest próba {r1 ,, rT } , to
L( )  f (r1 ,rT ; ) ,
(3.1)
gdzie f jest gęstością łącznego rozkładu zmiennych {r1 ,, rT } , a  jest wektorem parametrów określającym jednoznacznie ten rozkład. Przy estymacji parametrów modeli szeregów
czasowych metodą największej wiarygodności na ogół korzysta się z równości
T
f (r1 ,rT ; )  f (r1 ; ) f (rt | rt 1 ,, r1 ; ) .
(3.2)
t 2
Najbardziej popularne jest kryterium informacyjne Akaike (ang. Akaike Information
Criterion, AIC)
AIC  2
ln L(ˆ)
k
2 ,
T
T
wyraz karzący za liczbę
parametrów modelu
gdzie k jest liczba parametrów modelu, a L(ˆ) jest wartością funkcji wiarygodności dla obserwacji {r1 ,, rT } , wyliczoną dla oszacowania ˆ wektora parametrów, które ją maksymalizuje.
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
23
Stosowanie kryterium informacyjnego AIC do wyboru rzędu modelu AR polega na wyznaczaniu jego wartości dla modeli AR(l), l  0, 1,, P , i wybraniu takiego rzędu l, dla którego AIC ma najmniejszą wartość
Oprócz kryterium AIC do najczęściej stosowanych należą jeszcze skorygowane kryterium Akaike (AICc) oraz kryteria Schwarza (Bayessian Information Criterion, BIC), Hannana-Quinna (H-Q) i Shibaty (Sh), określone wzorami:

AICc  2

BIC  2

H - Q  2

Sh  2
ln L(ˆ)
T k
,
2
T
T k 2
ln L(ˆ) k ln T
,

T
T
ln L(ˆ)
k ln(ln T )
,
2
T
T
ln L(ˆ)
 T  2k 
 ln 
.
T
 T 
Czym się różnią?
Przedstawione kryteria informacyjne różnią się regułą, według której wyliczają „karę” za
liczbę parametrów modelu. Na przykład, z tego, że dla T  7 , ln T  2 , wynika, iż kryterium
BIC „karze” bardziej za liczbę parametrów modelu niż kryterium AIC (jeśli T  7 ).
Należy podkreślić, że chociaż podane tu definicje kryteriów informacyjnych należą do najczęściej spotykanych w literaturze ekonometrycznej, to jednak czasami kryteria informacyjne
definiowane są inaczej. Niekiedy używa się następujących definicji:

AIC  ln L(ˆ)  k ,

BIC  ln L(ˆ)  12 k ln T ,

H - Q  ln L(ˆ)  k ln(ln T ) .
O tym, czy min czy max decyduje znak
przy logarytmie funkcji wiarygodności
W takiej sytuacji, przeciwnie niż poprzednio, większa wartość kryterium oznacza, że
model jest lepszy.
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
24
Ocena dopasowania modelu.
Jeśli model jest odpowiednio dobrany, to ciąg reszt powinien być ścisłym białym szumem.
Należy to sprawdzić za pomocą testów. Zwróćmy uwagę, że testy omawiane na poprzednio
dotyczą tylko zależności liniowych. Ponieważ w definicji modelu AR(p) jest mowa o ścisłym białym szumie, więc powinno się stosować testy wykrywające także zależności nieliniowe.
Modele MA(q)
Dla modelu MA(q), wartość ACF z opóźnieniem q jest różna od zera, a dla każdego opóźnienia l  q jest równa zero, a funkcja PACF maleje w sposób wykładniczy. Tę własność można wykorzystać przy identyfikacji rzędu modelu MA.
B. Ćwiczenia w Gretlu i w Statistice
- samodzielne wykorzystanie omówionych wcześniej funkcji
- Dane: plik4
- Instrukcja 3
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
25
Zajęcia 4. Modele ARMA i ARIMA
A. Wiadomości teoretyczne
Model ARMA(1,1)
(4.1)
r t a1rt 1  a0   t  b1 t 1 ,
gdzie  t jest ścisłym białym szumem, a1  b1 .
Własności modelu ARMA(1,1)
 Stacjonarność
Jeśli szereg jest kowariancyjnie stacjonarny, to wartość oczekiwana
(4.2)
E (rt )   
a0
1  a1
oraz wariancja
(4.3)
var(rt )   0 
(1  2a1b1  b12 ) 2
.
1  a12
Zatem warunkiem słabej stacjonarności jest  1  a1  1 .
 ACF
Dla autokowariancji procesu ARMA(1,1) zachodzą równości
(4.4)
 1  a1 0  b1 2 .
inaczej niż dla AR(1)
Dla l  2 otrzymujemy natomiast  2  a1 1  0 i tak samo dla wszystkich l  1,
(4.5)
 l  a1 l 1  0 .
tak jak dla AR(1)
Przechodząc z tym do ACF, mamy dla modelu ARMA(1,1)
(4.6)
1  a1 
b1 2
0
 l  a1  l 1 ,
,
dla l  1.
 PACF
Można wykazać, że PACF dla procesu ARMA(1,1) nie znika przy żadnym opóźnieniu i zachowuje się podobnie, jak dla MA(1), poza tym, że wykładniczy spadek wartości PACF dla
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
26
procesu ARMA(1,1) zaczyna się dopiero od opóźnienia 2, a nie, jak dla MA(1), od opóźnienia 1.
Modele ARMA(p, q)
Ogólna postać:
p
q
i 1
i 1
rt  a0   ai rt i   t   bi  t i ,
(4.7)
gdzie  t jest ścisłym białym szumem, a p i q są nieujemnymi liczbami całkowitymi.
Równość (2.24) możemy zapisać za pomocą operatora opóźnienia Lk , Lk rt  rt k jako
(1  a1 L    a p Lp )rt  a0  (1  b1 L    bq Lq ) t .
(4.8)
wielomian AR
Wielomian
wielomian MA
a( L)  1  a1 L  a2 L2    a p Lp nazywamy wielomianem AR, a wielomian
b( L)  1  b1 L  b2 L2    bq Lq – wielomianem MA. Żądamy by wielomiany AR i MA nie
miały wspólnych czynników; w przeciwnym wypadku rząd (p,q) modelu ARMA(p, q) można
zredukować.
Model ARMA(p, q) jest kowariancyjnie stacjonarny, gdy wszystkie pierwiastki równania a( L)  0 , gdzie a(L) jest wielomianem AR, mają moduły większe od 1. Gdy spełniony
jest ten warunek, to średnia procesu ARMA(p, q) określonego wzorem (4.7) jest równa
E (rt ) 
(4.9)
a0
.
1  a1    a p
Identyfikacja modeli ARMA
ACF i PACF nie niosą informacji użytecznych przy wyborze rzędu procesu ARMA.
Modele ARIMA
Rozważmy model ARMA określony równaniem (2.44) albo równoważnie (2.45).
(1  a1 L    a p Lp )rt  a0  (1  b1 L    bq Lq ) t
 (L)
 (L)
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
27
Jeśli wielomian AR w tym równaniu posiada pierwiastek o module równym 1, to proces opisany za pomocą tego modelu jest niestacjonarny. Obecność pierwiastka jednostkowego powoduje zmienność autokorelacji procesu w czasie. Inną konsekwencją istnienia pierwiastka
jednostkowego jest to, że wpływ szoku na szereg czasowy jest trwały (persystencja).
Zauważmy, że jeśli wielomianu  (L) ma dokładnie jeden pierwiastek jednostkowy i nie
ma pierwiastków w kole jednostkowym, to może być przedstawiony w postaci
 ( L)    ( L)(1  L) ,
gdzie   (L) jest wielomianem rzędu p  1 , który ma wszystkie pierwiastki poza kołem jednostkowym. Proces (zróżnicowany) wt  (1  L)rt może być wtedy opisany za pomocą kowariancyjnie stacjonarnego modelu ARMA.
Jeśli pierwiastków jednostkowych jest więcej (d) uzyskujemy przedstawienie
 ( L)    ( L)(1  L) d ,
co oznacza, że po d-krotnym zróżnicowaniu proces może być opisany za pomocą kowariancyjnie stacjonarnego modelu ARMA. Otrzymane w ten sposób równanie
 ( L)(1  L) d  a0  b( L)
(7.1)
opisuje autoregresyjny zintegrowany model średniej ruchomej ARIMA (ang. autoregressive
integrated moving average).
Zapis ARIMA(p,d,q) oznacza model dla procesu, który po d-krotnym zróżnicowaniu może
być opisany za pomocą modelu ARMA(p, q).
B. Ćwiczenia w Gretlu

Szacowanie modelu ARMA

Testy pierwiastka jednostkowego (zob. zajęcia 1)

Szacowanie modelu ARIMA
Małgorzata Doman

i w Statistice
Modelowanie i analiza szeregów czasowych
28
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
29
Małgorzata Doman
 Prognozy
Modelowanie i analiza szeregów czasowych
30
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
31
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
32
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
33
Cześć 2. Modelowanie szeregów wielowymiarowych.
Zajęcia 5. Modele wektorowej autoregresji
A. Wiadomości teoretyczne
Kowariancyjna stacjonarność i macierze korelacji krzyżowych.
Rozważmy teraz k-wymiarowy szereg czasowy rt  (r1t ,, rkt ) . Szereg czasowy jest kowariancyjnie (słabo) stacjonarny, jeśli jego wartość średnia μ  E (rt )  ( Er1t ,, Erkt ) oraz macierz kowariancji Γ 0  E[(rt  μ)(rt  μ)] nie zmieniają się w czasie.
cov(r1t , r2t )  cov(r1t , rnt ) 
 var(r1t )
cov(r , r )
var(r2t )
 cov(r2t , rnt )
2 t 1t

Γ 0  Γ ij (0) 








var(r2t ) 
cov(rnt , r1t ) cov(rnt , r2t ) 


Jeśli przez D oznaczymy macierz diagonalną, na której głównej przekątnej znajdują się odchylenia standardowe zmiennych rit , to macierz korelacji krzyżowych z opóźnieniem 0, ma
postać
ρ 0  D10 D1 .
Elementem ij macierzy ρ 0 jest korelacja pomiędzy zmiennymi rit oraz r jt .
Ważnym elementem badania zależności między zmiennymi jest analiza korelacji pomiędzy aktualnymi, a opóźnionymi wartościami zmiennych rit . W pewnym stopniu pozwala
ona określić zmienne wiodące i zmienne opóźnione.
Macierz kowariancji krzyżowych z opóźnieniem l jest zdefiniowana następująco:
Γl  [Γij (l )]  E[(rt  μ)(rt l  μ)] ,
a macierz korelacji krzyżowych z opóźnieniem l jest postaci
ρl  D1l D1 .
Jakie informacje zawiera ta macierz?
Macierz korelacji krzyżowych z próby – wiadomo jak.
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
34
Modele wektorowej autoregresji (VAR)
Wielowymiarowy szereg czasowy jest procesem VAR(1), jeśli można go opisać za pomocą
modelu
rt  φ 0  Φrt 1  ε t ,
(5.1)
gdzie φ 0 jest k-wymiarowym wektorem, Φ – macierzą o wymiarach k  k , a {ε t } jest ciągiem szeregowo nieskorelowanych wektorów losowych o zerowej średniej i macierzy kowariancji  .
W przypadku dwuwymiarowym mamy:
r1t  10  11r1t 1  12r2t 1   1t ,
r2t  20   21r1t 1   22 r2t 1   2t
Jaka jest interpretacja współczynników?
W podobny sposób, jak w przypadku jednowymiarowym można wyprowadzić dla
modelu VAR(1) warunki kowariancyjnej stacjonarności i inne własności modelu VAR(1).
Jeśli założymy, że model (5.1) jest słabo stacjonarny, to z równania
Ert  φ 0  ΦErt 1  Eε t
mamy μ  E (rt )  (I  Φ) 1 φ 0 , przy założeniu, że macierz (I  Φ) jest nieosobliwa.
Warunek stacjonarności: wszystkie wartości własne macierzy Φ muszą być co do modułu
mniejsze od 1.
Równanie (2.28) określa model VAR(p):
(5.2)
rt  φ 0  Φ1rt 1    Φp rt p  ε t .
Podobnie jak powyżej, {ε t } jest tu ciągiem szeregowo nieskorelowanych wektorów losowych
o zerowej średniej i macierzy kowariancji  .
Własności:

cov(rt , ε t )  Σ ,

cov(rt l , ε t )  0 , dla l  0

l  1l 1     p l  p , dla l  0 .
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
35
Wektorowe modele średniej ruchomej (VMA)
Wektorowy proces średniej ruchomej VMA(q) jest postaci
rt  θ0  ε t  1ε t 1    q ε t q ,
(5.3)
gdzie θ 0 jest k-wymiarowym wektorem, a  i są macierzami wymiaru k  k .
Dla przykładu, dwuwymiarowy proces VMA(1) jest opisany za pomocą równań
 r1t   1   1t   11 12   1t 1 
r          


 2t   2   2t   21  22   2t 1 
(5.4)
Interpretacja parametrów?
Modele VARMA
Wektorowe modele ARMA (VARMA) stanowią uogólnienie modeli ARMA. Sprawiają one
sporo kłopotów, jeśli chodzi o stosowanie w praktyce.
Jednym z podstawowych jest problem identyfikacji modelu. Na przykład model
VARMA(0,1)=VMA(1)
 r1t   1t  0 2  1t 1 
r      0 0  
  2t 1 
 2t   2t  
jest identyczny z modelem VARMA(1,0)=VAR(1)
 r1t  0  2  r1t 1   1t 
r   0 0  r    
  2t 1   2t 
 2t  
B. Ćwiczenia w gretlu
Małgorzata Doman
C.
Modelowanie i analiza szeregów czasowych
36
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
37
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
38
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
39
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
40
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
41
Zajęcia 6. Analiza impulse-response
A. Wiadomości teoretyczne
Analiza impulse response jest narzędziem pozwalającym na zbadanie wpływu jednostkowych
szoków obserwowanych w jednym szeregu czasowym na inny szereg. Umożliwia ona np.
ocenę, w jaki sposób nagłe, nieoczekiwane zmiany w jednym obszarze gospodarki wpływają
na inny jej obszar.
Punktem wyjścia do budowy funkcji reakcji jest przedstawienie procesu autoregresyjnego w postaci procesu średniej ruchomej (na podstawie twierdzenia Wolda o dekompozycji).
Zgodnie z twierdzeniem Wolda, dowolny proces kowariancyjnie stacjonarny yt o zerowej
średniej można przedstawić w postaci

yt   j  t  j   t , gdzie  0  1 i
j 0


j 0
2
j
.
W powyższej dekompozycji  t jest białym szumem (tzn. E ( t )  0 , E ( t2 )   2 oraz  t są
nieskorelowane) i reprezentuje błąd popełniany przy prognozowaniu zmiennej y t jako funkcji liniowej jej opóźnionych wartości.
Rozważmy model postaci
(6.1)
xt  b10  b11zt   11xt 1   12 yt 1   xt ,
(6.2)
yt  b20  b22 zt   21 yt 1   22 yt 1   xt ,
gdzie o zmiennych xt , yt nie dzielimy na egzo- i endogeniczne, a  xt  yt są białymi szumami.
O procesach xt , yt zakładamy, że są stacjonarne. Model postaci (3.14)-(3.15) może być zapisany w postaci zredukowanej, czyli takiej, w której zmienne objaśniane zależą tylko od
zmiennych z góry ustalonych:
 1 b12   xt  b10   11  12   xt 1   xt 
b
      
     .
 21 1   yt  b20   21  22   yt 1   yt 
Inaczej można napisać
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
42
1
a   x   * 
 x  a  a
(3.16)  t    10    11 12   t 1    1*t  ,
 yt  a20  a21 a22   yt 1   2t 
 a   1 b12  b10 
gdzie  10   
   ,
a20  b21 1  b20 
1
 a11 a12   1 b12   11  12 
a

 

 21 a22  b21 1   21  22 
1
 b12   xt 
 1*t   1 b12   xt 
 1
1

 * 


 .


1   yt 
 2t  b21 1   yt  1  b12b21  b21
Model (3.16) może zostać zapisany następująco:
i
 xt   x    a11 a12   1*t i 
 y    y    a
 *  ,
 t    i 0  21 a22   2t i 
gdzie x, y są średnimi wartościami odpowiednio xt , yt .
Dalej możemy uzyskać następującą zależność zmiennych xt , yt od szoków  xt i  yt :

 b12   xt i 
 xt   x 
 a11 a12   1
1




 y   y  1  b b  a


a22   b21
1   yt i 
 t  
12 21 i  0  21
i
 x    xt i 
     φi 

 y  i  0  yt i 
gdzie macierz φi  [ik ( j )] jest taka, jak to wynika z równania, czyli
 b12 
 a11 a12   1
1
φi 
.



1 
1  b12b21 a21 a22   b21
i
Model średniej ruchomej umożliwia badanie wzajemnych powiązań między procesami xt , yt .
Elementy macierzy φ 0 są nazywane mnożnikami natychmiastowymi. Elementy macierzy φ i ( i  0) są nazywane mnożnikami opóźnionymi. Obrazują one reakcję zmiennej wywołaną jednostkową nagłą zmianą, która zaszła i okresów wcześniej. Np. element 12 (2) wyraża reakcję po dwóch okresach zmiennej xt wywołaną przez jednostkową zmianę  yt .
Suma mnożników 12 (2) przez n okresów (tzn.
n

i 0
12
( j ) n) wyraża skumulowany wpływ
zmian  yt na xt i nazywana jest mnożnikiem długookresowym, albo skumulowanym Sumowanie można przeprowadzić dla każdego ciągu współczynników macierzy φ i .
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
43
Elementy macierzy φ i nazywane są razem funkcją reakcji. Analizując wartości
funkcji reakcji w zależności od i można zbadać zachowanie zmiennych xt i yt w przypadku
różnorodnych szoków jednostkowych.
B. Ćwiczenia w gretlu
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
44
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
45
Zajęcia 7. Problemy z pierwiastkiem jednostkowym
A. Wiadomości teoretyczne
Mówiąc o modelach AR(p) zauważyliśmy, że warunkiem stacjonarności procesu AR(p) jest
to, aby wszystkie pierwiastki wielomianu 1  a1 L    a p Lp  0 były co do modułu większe
od 1. Testowanie tego założenia najczęściej sprowadza się do badania, czy występują pierwiastki o module równym 1.

Wśród niestacjonarnych szeregów czasowych do najważniejszych należą tzw. procesy
pierwiastka jednostkowego.
Przykładem takiego procesu jest błądzenie losowe określone równaniem
(5.1)
rt  rt 1   t ,
gdzie  t jest białym szumem. Zauważmy, że jest to proces AR(1) ze współczynnikami a0  0
i a1  1 . Równanie (5.1) można zapisać w postaci
(5.2)
rt  rt 1   t .
Widać zatem, że po zróżnicowaniu procesu rt otrzymujemy proces stacjonarny.
Jeżeli proces rt jest niestacjonarny, a proces jego pierwszych różnic jest stacjonarny, to o rt mówimy, że jest zintegrowany w stopniu 1, co oznaczamy rt ~I(1).
Inne przykłady procesów I(1) to proces błądzenia losowego z dryfem
(5.3)
rt  0  rt 1   t
oraz proces błądzenia losowego z trendem
(5.4)
rt  0  1t   t
Jeżeli niestacjonarny proces rt staje się stacjonarny dopiero po k-krotnym zróżnicowaniu, to nazywamy go zintegrowanym w stopniu k, co oznaczamy rt ~I(k). Szeregi stacjonarne oznaczamy przez rt ~I(0).
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
46
Regresje pozorne
W przypadku, gdy modelujemy szeregi czasowe generowane przez proces pierwiastka jednostkowego, możliwe jest występowanie tzw. pozornej regresji.
Z regresją pozorną mamy do czynienia wówczas, gdy po oszacowaniu modelu wartość
współczynnika R 2 jest wysoka i wartości statystyk t-Studenta dla zmiennych objaśniających
w modelu wskazują, że zmienne te są istotne statystycznie przy założonym poziomie istotności  , a nie występuje powiązania merytorycznego pomiędzy zmienną objaśnianą i między
zmiennymi objaśniającymi.
Inaczej mówiąc, zmienna objaśniana i zmienne objaśniające są szeregami generowanymi przez niezależne procesy stochastyczne, natomiast ich regresja wskazuje na występowanie istotnej zależności i sugeruje, że mamy dobrze oszacowany model tej zależności. Zatem,
kiedy mamy do czynienia z szeregami niestacjonarnymi, to bez starannej analizy dotyczącej
poprawności modelu możemy wyciągnąć błędne wnioski dotyczące powiązań między zmiennymi.
Testy pierwiastka jednostkowego

Test Dickeya-Fullera.
Jest to najczęściej stosowany test pierwiastka jednostkowego. Rozważa się w nim trzy typy
równań (w zależności od tego, czy testujemy stacjonarność względem poziomu, czy względem trendu:
(7.1)
~
rt  rt 1  xt  1r1t 1   t ,
(7.2)
~
rt  rt 1  xt  2 r1t 1  2   t
(7.3)
~
rt  rt 1  xt  3r1t 1  3t   t
Hipoteza zerowa w każdym przypadku mówi, że występuje co najmniej jeden pierwiastek
~
~
jednostkowy ( i  0 ), a hipoteza alternatywna, że brak takiego pierwiastka ( i  0 ), gdzie
~i  i  1 , a  t ~iid(0;  2 ).
Jeżeli nie ma podstaw do odrzucenia hipotezy zerowej, to przyjmujemy, że mamy do czynienia z obecnością, co najmniej, jednego pierwiastka jednostkowego w procesie xt .
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
47
Jeżeli hipoteza zerowa zostaje odrzucona to mamy do czynienia odpowiednio ze:
1. stacjonarnym procesem AR(1),
2. stacjonarnym procesem AR(1) z dryfem,
3.stacjonarnym procesem AR(1) z deterministycznym trendem.
Statystyka testu Dickeya-Fullera jest następująca
~
DF  ~ ,
S ( )
gdzie ~ jest oszacowaniem parametru, przy opóźnionej zmiennej w równaniach (3.6)-(3.8), a
~
~
S ( ) błędem estymacji parametru  .
Trzeba korzystać z empirycznych wartości krytycznych wyznaczonych przez autorów
testu. Programy komputerowe z reguły podają od razu p-wartości.

Rozszerzony test Dickeya-Fullera (ADF)

Test Phillipsa-Perrona. H0: rt ~I(0)

Test KPSS: H0: rt ~I(1)
B. Ćwiczenia w gretlu

samodzielne przeprowadzenie testów omówionych na zajęciach 1 i zajęciach 6,

plik5
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
48
Zajęcia 7. Kointegracja
A. Wiadomości teoretyczne
Klasyczne podejście do analizy niestacjonarnych szeregów czasowych zakładało procedurę
kilkakrotnego różnicowania ich, aż do uzyskania szeregów stacjonarnych. Powodowało to
jednak utratę informacji o długookresowych zależnościach pomiędzy zmiennymi.
Koncepcja kointegracji została opracowana przez Engle’a i Grangera.
Istotą pojęcia kointegracji zmiennych jest istnienie długookresowych powiązań pomiędzy tymi zmiennymi. Kointegracja oznacza występowanie stanu równowagi długookresowej, przy czym w krótkim okresie mogą występować odchylenia od tego stanu. Odchylenia od stanu równowagi (danej ścieżki wzrostu) mogą być wynikiem wahań przypadkowych
lub też wahań sezonowych. Żeby można było mówić o kointegracji, zmienne powinny
charakteryzować się wspólną ścieżką wzrostu.
Założenie o występowaniu kointegracji jest silnym założeniem, gdyż pozwala na opisanie stanu równowagi pomiędzy zmiennymi, które są niestacjonarne, o ile ich liniowa kombinacja tworzy szereg stacjonarny.
Zmienne, będące procesami pierwiastka jednostkowego, których liniowa kombinacja jest procesem stacjonarnym, nazywamy zmiennymi skointegrowanymi.
Dokładnie mówiąc dwa procesy xt i yt są skointegrowane rzędu (d , b) , (ozn.
xt , yt ~ CI(d , b; d  b  0) ) jeżeli xt , yt ~ I(d ) oraz istnieje kombinacja liniowa tych procesów
 t  1 xt   2 yt , która jest procesem zintegrowanym w stopniu d  b .
Wektor [ 1 ,  2 ] nazywamy wektorem kointegrującym.
W ogólnym przypadku n procesów ( xt  ( x1t , x2t ,, xnt ) ) warunek skointegrowania
procesów x1t , x2t ,, xnt jest następujący: x1t , x2t ,, xnt ~ I(d ) oraz istnieje wektor β , taki że
x t β ~ I(d  b) .
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
49
Najkorzystniejszą sytuację z punktu widzenia modelowania mamy, gdy d  b (najlepiej
d  b  1 . Wtedy pewna kombinacja danych szeregów czasowych jest procesem stacjonar-
nym.
Możliwa jest na przykład kointegracja zmiennych w stopniu (2, 1), jednak relacja taka nie jest
specjalnie użyteczna, gdyż liniowa kombinacja zmiennych tworzy proces zintegrowany (w
stopniu pierwszym).
Jeżeli xt , yt ~ CI(1,1) , to
(7.1)
yt  βxt ,
czyli
(7.2)
[ yt
 1 
xt ]   [ yt
  
xt ] β  0 .
Zależność opisana równaniem (7.1) może być traktowana jako opisująca długookresowy (nie
zależący od czasu) stan równowagi pomiędzy procesami xt i yt .
Rozważmy możliwe sytuacje dotyczące szeregów xt i yt , z których każdy jest co najwyżej I(1):
1. xt ~I(1) i yt ~I(0) lub xt ~I(0) i yt ~I(1), wtedy  t ~I(1), więc procesy xt i yt nie są skointegrowane.
2. xt ~I(1) i yt ~I(1), wtedy mamy dwie możliwości:
A.  t ~I(1), co oznacza, że procesy xt i yt nie są skointegrowane.
B.  t ~I(0), wtedy procesy xt i yt są skointegrowane.
3. xt ~I(0) i yt ~I(0), szeregi są stacjonarne. Nie potrzeba się zastanawiać nad kointegracją.
Testowanie kointegracji opiera się na tych samych testach, co badanie stopnia integracji szeregów czasowych. Przy tym testy przeprowadzane są dla reszt z jednego z następujących
równań:

yt  xt   t

yt   0  1 xt   t

yt   0  1 x1t     n xnt   t
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
Na przykład w przypadku testu Dickeya-Fullera stosuje się do oszacowania statystyki testowej testu następujące równanie:  t   t 1  t , gdzie  t są resztami z jednego z powyższych równań, a  t jest białym szumem
W przypadku, gdy w resztach  t występuje silna autokorelacja t, należy szacowane
równania rozszerzyć o odpowiednią liczbę opóźnień. W przypadku testów dotyczących
kointegracji stosuje się tablice ze skorygowanymi wartościami krytycznymi.
B. Ćwiczenia w gretlu
50
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
51
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
52
Zajęcia 8. Model korekty błędem (VECM)
A. Wiadomości teoretyczne
Równanie kointegracji (7.1) opisuje stan równowagi długookresowej pomiędzy procesami. W
celu wychwycenia dostosowań krótkookresowych można zastosować model korekty błędem (ECM). Pozwala on na opis dostosowań, które nie zależą od poziomu zmiennych objaśniających, a od różnicy między poziomem zmiennych objaśniających, a poziomem wynikającym z równowagi długookresowej. Model korekty błędem składa się z dwóch równań.
Pierwsze z nich opisuje równowagę dłuookresową, a drugie, oparte na przyrostach procesów,
dostosowania krótkookresowe,
Zatem w celu zbudowania modelu korekty błędem dla szeregów xt , yt ~ I(d ) skointegrowanych w stopniu pierwszym xt , yt ~ CI(1,1) ) należy najpierw ustalić równanie kointegrujące. Parametry tego równania można traktować jako dane lub oszacować. Następnie
konstruuje się równanie krótkookresowe dla przyrostów procesów xt , yt :
(8.1)
yt   0  1xt   ( yt 1  0  1xt 1 )  t   0  1xt   t 1  t ,
(8.2)
yt   0  1xt  ECM t 1  t ,
gdzie  t jest procesem białego szumu. W równaniu (8.2) występują procesy stacjonarne.
Składnik oznaczony symbolem ECM t 1 opisuje stan równowagi długookresowej, osiągnięty
w okresie t-1 – jest to mechanizm korekty błędem. Parametr  1 niesie informację o dostosowaniach krótkookresowych w czasie t do stanu równowagi z okresu t-1. Parametr  powinien
być ujemny, gdyż tylko taka jego wartość zapewni dochodzenie do stanu równowagi w miarę
upływu czasu. Model opisany równaniem (8.2) nie uwzględnia autokorelacji w badanych
procesach. Zmodyfikowana postać (8.3) jest pozbawiona tej słabości:
(8.3)
p
q
i 1
j 1
yt   0  1xt   ( yt 1   0  1 xt 1 )   ai yt i  b j yt  j  t
Parametry modelu ECM mogą być szacowane klasyczną metodą najmniejszych kwadratów.
Małgorzata Doman
B. Ćwiczenia w gretlu
Modelowanie i analiza szeregów czasowych
53
Małgorzata Doman
Modelowanie i analiza szeregów czasowych
54