Niestacjonarne zmienne czasowe – własności i testowanie - E-SGH

Transkrypt

Niestacjonarne zmienne czasowe – własności i testowanie - E-SGH
Materiał dla studentów
Niestacjonarne zmienne czasowe –
własności i testowanie
(studium przypadku)
Część 2: Przypomnienie teorii
Nazwa przedmiotu: ekonometria finansowa I (22204), analiza szeregów czasowych i
prognozowanie (13201);
Kierunek studiów: Finanse i rachunkowość, Metody ilościowe w ekonomii i systemy
informacyjne
Studia I stopnia/studia II stopnia
Opracowała:
dr hab. Ewa M. Syczewska, Instytut Ekonometrii, Kolegium Analiz Ekonomicznych SGH
Warszawa, 2011
Materiał dla studentów – przypomnienie teorii
Materiał dla studentów – przypomnienie teorii
Niestacjonarność szeregów czasowych
Jednym z najprostszych przykładów procesu niestacjonarnego jest proces błądzenia losowego
(autoregresyjny stopnia 1, o parametrze przy zmiennej opóźnionej równym 1). Jego wykres
przypomina zachowanie indeksów giełdowych lub kursów walutowych, są one bowiem
również zmiennymi niestacjonarnymi. Postać równania opisującego proces błądzenia
losowego nasunęła ideę testowania niestacjonarności.
1600
1500
1400
1300
SPzam
1200
1100
1000
900
800
700
600
0
500
1000
1500
2000
Rys. 1. Przykład zmiennej niestacjonarnej – notowania indeksu SP500, źródło: stooq.pl
Najprostszym testem niestacjonarności, możliwym do przeprowadzenia nawet w arkuszu
kalkulacyjnym, pod warunkiem posłużenia się odpowiednimi tablicami wartości krytycznych,
jest test Dickeya-Fullera. Hipoteza zerowa zakłada niestacjonarność szeregu, hipoteza
alternatywna – jego stacjonarność. Sposób przeprowadzenia testu polega na oszacowaniu
regresji zmiennej względem zmiennej opóźnionej i porównaniu obliczonej statystyki
z wartościami krytycznymi z odpowiednich tablic. Mimo iż statystyka testu Dickeya-Fullera
jest równa ilorazowi oceny parametru przez błąd szacunku, należy pamiętać, że jej rozkład
jest nietypowy, asymetryczny; wartości krytyczne (np. dla poziomu istotności 0,05) są
ujemne. Trzeba sięgać do odpowiednich tablic wartości krytycznych.
Innym testem jest test Kwiatkowskiego-Phillipsa-Schmidta-Shina (w skrócie KPSS), który
ma odwrotny układ hipotez: hipoteza zerowa zakłada stacjonarność szeregu, alternatywna –
jego niestacjonarność.
R.Engle i C.W.J. Granger wprowadzili definicję zmiennej zintegrowanej oraz kointegracji.
Zmienna jest zintegrowana, jeśli jest niestacjonarna, ale można ją sprowadzić do zmiennej
stacjonarnej poprzez wyznaczanie jej przyrostów. Stopień (lub rząd) integracji to liczba
przyrostów potrzebnych do uzyskania stacjonarności. Zmienna jest zintegrowana rzędu 1,
jeśli jest niestacjonarna ale jej pierwsze przyrosty są stacjonarne.
Przykładem może być dochód do dyspozycji gospodarstw domowych, dla którego dane
dostępne są w pliku greene5_1.gdt dołączonym do gretl: sam dochód jest niestacjonarny, bo
podlega trendowi wzrostowemu. Natomiast jego przyrosty mają mniej więcej stałą wartość
oczekiwaną.
2
Materiał dla studentów – przypomnienie teorii
7000
6000
realdpi
5000
4000
3000
2000
1000
1950
1960
1970
1980
1990
2000
Rys. 2. Wykres dochodu do dyspozycji gospodarstw domowych, dane z podręcznika Greene’a
dołączone do pakietu gretl.
150
d_realdpi
100
50
0
-50
-100
1950
1960
1970
1980
1990
2000
Rys. 3. Wykres przyrostów dochodu do dyspozycji gospodarstw domowych.
Jeśli sprawdzimy wartości współczynników korelacji zmiennej z jej wartościami
opóźnionymi o 1,2,3,… itd., to dla zmiennej niestacjonarnej okaże się, że korelacja jest silna
nawet dla znacznej liczby opóźnień. A jeśli zmienna jest stacjonarna, współczynniki korelacji
maleją w miarę wzrostu liczby opóźnień.
Kointegracja zmiennych niestacjonarnych – obniżenie stopnia integracji dzięki dobraniu
odpowiedniej kombinacji liniowej zmiennych
Jeśli chcemy zbudować sensowny jednorównaniowy model ekonometryczny, a zmienne
objaśniana i objaśniające są niestacjonarne, zintegrowane, to można poszukać tzw. relacji
kointegrującej między nimi. Jest to – dla zmiennych zintegrowanych pierwszego stopnia –
taka kombinacja liniowa zmiennych niestacjonarnych, która jest stacjonarna. Jeśli stopień
3
Materiał dla studentów – przypomnienie teorii
integracji zmiennych jest wyższy, za skointegrowane uznajemy zmienne, dla których istnieje
kombinacja liniowa, która ma niższy stopień integracji niż poszczególne zmienne.
Relacja kointegrująca odpowiada równowadze dynamicznej między badanymi zmiennymi
niestacjonarnymi.
Najprostsza metoda badania kointegracji polega na oszacowaniu regresji zmiennej y
względem pozostałych zmiennych, xi, i = 1,2,…,k, wyznaczeniu reszt regresji i sprawdzeniu,
czy są stacjonarne (jednym z wymienionych testów – ADF lub KPSS). Jeśli tak, oznacza to że
wektor MNK ocen parametrów jest wektorem kointegrującym. Jeśli nie, ten wektor nie jest
wektorem kointegrującym, ale zmienne mogą być skointegrowane – mogą istnieć inne
wektory kointegrujące. Metodą umożliwiającą ich znalezienie jest metoda Johansena.
Wyznacza ona bazę przestrzeni wektorów kointegrujących dla danego zestawu zmiennych.
Występowanie relacji kointegrującej jest równoważne istnieniu zapisu modelu dla badanych
zmiennych w postaci modelu z mechanizmem korekty błędu (ECM, error correction
mechanism), łączącego opis krótko- i długookresowych zależności zmiennych.
Ujęcie formalne definicji i testów
Przypomnimy teraz potrzebne pojęcia i wzory. Zakładamy, że szereg czasowy obserwacji
zmiennej jest realizacją pewnego procesu stochastycznego. Proces stochastyczny jest ciągiem
zmiennych losowych, indeksowanych indeksem t. Ponieważ większość zmiennych
ekonomicznych jest obserwowana w odrębnych momentach więc zajmiemy się tu procesami
z czasem dyskretnym.
1. Definicja procesu stacjonarnego według momentów do drugiego rzędu włącznie:
Proces
jest stacjonarny (według momentów do rzędu drugiego
włącznie), jeśli są spełnione jednocześnie trzy warunki:
const
a) Wartość oczekiwana procesu jest stała w czasie: E ( X t )
2
b) Wariancja procesu jest stała w czasie: D 2 ( X t )
const
c) Kowariancja zmiennych pochodzących z różnych okresów zależy tylko od
odległości między momentami obserwacji i jest niezależna od czasu:
Cov( X t , X s )
|t s|
Niespełnienie któregoś lub wszystkich warunków oznacza niestacjonarność procesu stochastycznego
(a zatem szeregu czasowego obserwacji zmiennej). Zachowanie procesów, które nie są stacjonarne,
może być bardzo zróżnicowane:
Przykład 1: Dochód do dyspozycji gospodarstw domowych oraz konsumpcja zagregowana są
zmiennymi niestacjonarnymi ze względu na występowanie trendu rosnącego. Nie spełniają więc
pierwszego warunku.
Przykład 2: Składnik losowy regresji liniowej, którego wariancja nie jest stała w czasie, ma stałą
wartość oczekiwaną (równą zeru), czyli spełnia pierwszy warunek, ale ma wariancję zmienną w
czasie, czyli nie spełnia drugiego warunku.
4
Materiał dla studentów – przypomnienie teorii
2. Charakterystyki procesu stacjonarnego 1:
a) Średnia z próby dla procesu stacjonarnego: x
n
1
n
xt
t 1
n
b) Kowariancja procesu: C
1
( xt
n
x )( xt
x)
t 1
c) Funkcja autokorelacji: R
C
C0
ˆ
Funkcja autokorelacji i autokorelacji cząstkowej z próby: Powiedzieliśmy wcześniej, że
zachowanie jakościowe autokorelacji szeregu stacjonarnego i niestacjonarnego jest różne –
funkcja autokorelacji zmiennej stacjonarnej dość szybko wygasa.
Nieznana wartość oczekiwana i wariancja stacjonarnego procesu może być szacowana
na podstawie wzorów:
.
Ocena współczynnika korelacji zmiennych
jest równa
, k=1,2,…; T – liczba obserwacji.
Współczynniki korelacji z próby tworzą funkcję autokorelacji z próby, ACF (ang.
autocorrelation function). Współczynnik korelacji większy co do modułu od 2
jest
statystycznie istotny. Współczynniki korelacji cząstkowej mierzy korelację zmiennych
bez wpływu korelacji zmiennych pośrednich. Wyznaczany jest na podstawie regresji
zmiennej względem jej opóźnień do rzędu k włącznie, ocena parametru przy zmiennej
opóźnionej o k jest równa ocenie współczynnika korelacji cząstkowej rzędu k. Współczynniki
korelacji cząstkowej tworzą funkcję autokorelacji cząstkowej z próby (ang. partial
autocorrelation function, PACF).
3. Test Dickeya-Fullera
Hipoteza zerowa zakłada, że szereg jest niestacjonarny z powodu występowania pierwiastka
jednostkowego, hipoteza alternatywna zakłada stacjonarność szeregu. Sposób
przeprowadzenia testu jest następujący.
A) Szacujemy regresję postaci
m
yt
yt
1
j
yt
j
ut ,
(1)
j 1
Wyznaczamy wartość statystyki testu ADF = ˆ / s ˆ , gdzie ˆ – ocena parametru, s ˆ – błąd
szacunku parametru. Rozkład statystyki jest niestandardowy, asymetryczny i przesunięty
w lewo – należy sięgnąć do odpowiednich tablic wartości krytycznych 2.
• Jeśli obliczona wartość statystyki jest większa niż wartość krytyczna, nie ma podstaw do
odrzucenia hipotezy zerowej –szereg jest niestacjonarny.
1
T. Kufel, Ekonometria. Rozwiązywanie problemów z wykorzystaniem programu GRETL, PWN, Warszawa
2004, str. 64–70.
2
Wartości krytyczne np. w książce „Nowa ekonometria” Charemzy i Deadmana, z której zaczerpnięto
przykładowy fragment tablic. Wartości krytyczne wbudowane w pakietach ekonometrycznych są oparte na
tablicach wartości asymptotycznych Davidsona i MacKinnona.
5
Materiał dla studentów – przypomnienie teorii
• Jeśli obliczona wartość statystyki ADF jest mniejsza niż wartość krytyczna, hipotezę zerową
odrzucamy na rzecz stacjonarności zmiennej.
Można również zastosować warianty regresji: z wyrazem wolnym
m
yt
yt
1
yt
j
(2)
ut ,
j
j 1
Oraz z wyrazem wolnym i trendem:
m
yt
t
yt
1
j
yt
j
ut ,
(3)
j 1
Testowanie przebiega podobnie, trzeba jeszcze sprawdzić istotność wyrazu wolnego (testem
t Studenta) lub łączną istotność obu parametrów dla trendu (testem F).
Liczba opóźnionych przyrostów zmiennej w każdej z tych regresji jest tak dobrana, aby
składniki losowe nie wykazywały autokorelacji.
B) Jeśli nie ma podstaw do odrzucenia hipotezy o niestacjonarności zmiennej,
przechodzimy do testowania niestacjonarności przyrostów. Odpowiednia regresja jest
analogiczna do (1), otrzymujemy ją po podstawieniu przyrostów zmiennej zamiast y,
więc ma postać:
m
2
yt
yt
2
1
j
yt
j
(1a)
ut ,
j 1
Na ogół obliczona wartość statystyki testu jest mniejsza niż wartość krytyczna, zatem
hipotezę o niestacjonarności przyrostów należy odrzucić.
Jeżeli tak jest, to zgodnie z definicją integracji zmiennych (por. artykuł Engle’a i Grangera)
zmienna jest niestacjonarna, ale jej pierwsze przyrosty są stacjonarne, więc mówimy, że
zmienna jest zintegrowana stopnia 1, co oznaczamy y ~ I (1)
4. Test Kwiatkowskiego, Phillipsa, Schmidta, Shina.
Test zwany w skrócie testem KPSS ma jako hipotezę zerową stacjonarność szeregu, jako
hipotezę alternatywną – jego niestacjonarność.
5. Metoda Engle’a-Grangera badania kointegracji.
Pierwsza, najprostsza metoda testowania kointegracji została opisana przez Engle'a
i Grangera (zob. artykuł w Econometrice z1987 roku).
Załóżmy, że zmienne Y, X1, X2,...,Xk są wszystkie zintegrowane stopnia 1 i podejrzewamy, że
mogą być skointegrowane. Idea metody Engle'a-Grangera polega na tym, żeby
1. oszacować metodą najmniejszych kwadratów równanie regresji zmiennej Y względem
zmiennych Xi, i=1,2,...,k; po oszacowaniu otrzymujemy:
yt
ˆx
1 1t
ˆ x
2 2t
....
ˆ x
k kt
et
2. do reszt et tej regresji zastosować test Dickeya Fullera (lub test ADF):
6
Materiał dla studentów – przypomnienie teorii
m
et
et
1
j
et
j
(4)
ut ,
j 1
Sposób obliczania statystyki testu – analogiczny jak dla (1).
Hipoteza zerowa: reszty et są niestacjonarne, oznacza, że wektor [1, -beta] otrzymany
na podstawie ocen parametrów regresji, nie jest wektorem kointegrującym dla zmiennych Y,
X1, X2,...,Xk. Hipoteza alternatywna: reszty et są stacjonarne, oznacza, że zmienne Y, X1,
X2,...,Xk są skointegrowane, a wektor [1, -beta] jest dla nich wektorem kointegrującym .
Zaletą metody Engle'a-Grangera jest jej prostota. Wadą jest to, że a) nie mamy pewności,
że oszacowania parametrów regresji rzeczywiście wyznaczą nam wektor kointegrujący
dla badanych zmiennych,
b) nawet jeśli tak się stanie, otrzymany wektor kointegrujący może być jednym z możliwych
wektorów (tzn. będzie elementem przestrzeni kointegrującej, czyli podprzestrzeni liniowej
generowanej przez wszystkie możliwe wektory kointegrujące). Nie znamy liczby wszystkich
takich liniowo niezależnych wektorów kointegrujących dla badanych zmiennych.
Lepsza jest metoda Johansena. Po pierwsze, pozwala na przetestowanie liczby (liniowo
niezależnych) wektorów kointegrujących dla danego zestawu zmiennych, po drugie, jeśli
wektory kointegrujące istnieją, w metodzie Johansena otrzymujemy wszystkie takie wektory.
6. Model z mechanizmem korekty błędu
Jeśli zmienne y, y t , xit , i 1,2,..., k są zintegrowane stopnia 1 i skointegrowane, to można
dla nich zbudować model łączący opis zależności krótko- i długookresowych: tzw. model
z mechanizmem korekty błędu (ECM – Error Correction Mechanism), postaci:
yt
c0
c1 x1t
... ck xkt
( yt
1
ˆx
1 1,t
1
ˆ x ....
2 2 ,t 1
ˆ x ) u
k k ,t 1
t
(5)
Gdzie wyrażenie w nawiasie (oznaczane jako ECM) jest odchyleniem układu od ścieżki
równowagi w poprzednim okresie. Jeśli relacja równowagi jest stabilna, tzn. układ wytrącony
z równowagi powraca na tę ścieżkę, to po oszacowaniu regresji (5) metodą najmniejszych
kwadratów powinniśmy otrzymać ocenę parametru
ze znakiem – (minus).
7