otworzyć pliku xls

Transkrypt

otworzyć pliku xls
Modelowanie i analiza szeregów czasowych
Małgorzata Doman
Zajęcia 2
14 kwietnia 2012 r.
POLECENIA
Na poprzednich zajęciach:
Wstępna analiza własności szeregów czasowych (wykresy ACF, histogram, wykres Q-Q)
 Testowanie własności rozkładu obserwacji w szeregu (test
Testowanie występowania zależności liniowych – test Ljunga-Boxa
Testy stacjonarności (ADF, KPSS)
Szacowanie własności modeli AR(p)
 Modele ARMA
Część I. Modele ARMAX
1. Otworzyć PLIK2:
Plik/Otwórz dane/Import/Excel
Typ danych: szeregi czasowe – Inne
2. Przyjrzeć się danym.
3. Ustalić długość próby zostawiając 100 obserwacji na prognozy: Próba/Zakres próby
4. Dla stóp zwrotu z kursu PLN/UDSD oszacować model ARMA(1,1) oraz ARMAX(1,1),
czyli ARMA(1,1) z dodatkową zmienną objaśniającą –stopy zwrotu z kursu PLN/USD, a
następnie model ze zmiennymi 0-1.
Modelowanie i analiza szeregów czasowych
Małgorzata Doman
5. Wyznaczyć 100 prognoz stóp zwrotu kursu USD/PLN i ocenić ich jakość.
6. Dla stóp zwrotu z kursu USD/PLN oszacować kilka modeli ARMA(p,q) uwzględniając
jako dodatkowe zmienne objaśniające opóźnione stopy zwrotu z kursów USD/HUF,
USD/CZK oraz zmienne 0-1
7. Ocenić jakość dopasowania modeli i wybrać najlepszy model
8. Porównać jakość prognoz z różnych modeli
9. Zapisać sesję.
10. Plik/Pliki sesji gretla/ Zapisz sesję
Część II. Modele VAR
1. Otworzyć plik: Plik/otwórz dane/Pliki z przykładami/hamilton.gdt
2. Wyliczyć różnice zmiennych PC6IT, PZUNEW, EXRITL: Dodawanie zmiennych/pierwsze różnice dla wybranych zmiennych.
3. Przeprowadzić wstępne testy dla szeregów różnic
4. Wykreślić korelogramy oraz korelagram krzyżowy dla różnic zmiennych PC6IT i
PZUNEW.
5. Ustalić próbę na okres do końca 1988 r. : Próba/ Zakres próby.
6. Wybrać opóźnienie w modelu VAR: Model/Modele szeregów czasowych/wybór rzędu opóźnienia dla modelu VAR
7. Korzystając z wyniku z poprzedniego punktu oszacować model VAR.
8. Ocenić własności reszt oszacowanego modelu.
9. Przeprowadzić Analizę impuls response (menu na wydruku wyników szacowania modelu).
10. Wyznaczyć prognozy na rok 1989 (menu na wydruku wyników szacowania modelu:
Analiza/Prognozy). Ocenić jakość prognoz.
11. Rozważyć model z wprowadzonymi różnicami zmiennej EXRTIL
12. Samodzielnie powtórzyć analizę dla danych z pliku indeksy.xls
2
Modelowanie i analiza szeregów czasowych
Małgorzata Doman
Informacje uzupełniające – miary jakości prognoz - wzory
Jednym z podstawowych wymagań, jakie stawia się modelom szeregów czasowych, jest dostarczanie dobrej jakości prognoz. Stosowanych miar jakości prognoz jest bardzo wiele (zob. Aleksander
Welfe, Ekonometria). W poniższych formułach yˆ T i jest prognozą, yT i wielkością zaobserwowaną,
T oznacza liczbę obserwacji w próbie, N jest liczbą prognoz na okres poza próbą, a i jest długością
horyzontu prognozy. W praktyce modelowania stosuje się szeroki zestaw błędów prognoz, które
przedstawione zostały poniżej:

Błąd średniokwadratowy (MSE)
MSE 

1 N
 yT i  yˆT i 2

N i 1
Medianowy błąd kwadratowy (MedSE)

MedSE  mediana  yT i  yˆT i 

Błąd średni (ME)
ME 

1 N
  yT i  yˆT i 
N i 1
Średni błąd bezwzględny (MAE)
MAE 

1 N
 yT i  yˆT i
N i 1
Pierwiastek błędu średniokwadratowego (RMSE)
RMSE 

1 N
 yT i  yˆT i 2

N i 1
Średni bezwzględny błąd procentowy (MAPE)
MAPE 


2 N
i 1
1 N yT  i  yˆ T  i
 y
N i 1
T i
Skorygowany średni bezwzględny błąd procentowy (AMAPE)
AMAPE
1 N yT i  yˆ T  i

N i 1 yT  i  yˆ T i
3
Modelowanie i analiza szeregów czasowych
Małgorzata Doman

Udział prawidłowych znaków (PCS)
PCS 

1 N
 max sign  yT i yˆT i ,0
N i 1
Współczynnik rozbieżności Theila (TIC)
TIC 

1
N
1
N
N
 y
i 1
N
y
i 1
2
T i
 yˆ T  i 
2
T i

1
N
N
 yˆ
i 1
2
T i
Logarytmiczna funkcja straty (LLF)
1 N  yˆ 
LLF    ln T i 
N i 1  yT i 
2
Tylko niedoświadczony czytelnik mógłby odnieść wrażenie, że przedstawione tu miary błędów
powielają informacje dotyczące trafności prognoz. Zróżnicowana konstrukcja tych miar pozwala na
wychwycenie różnych aspektów jakości prognoz. Na przykład MSE i MAE i RMSE niosą w pewnym
sensie podobną informację, ale w różny sposób reagują na występowanie obserwacji nietypowych.
Bliskie siebie wartości tych błędów wskazują, że w szeregu prognoz nie ma pojedynczych prognoz
obciążonych dużym błędem, natomiast wartości MSE znacznie większe niż MAE ujawniają obecność
błędów o wartościach wyjątkowo dużych..
Duże wartości błędu MAE w zestawieniu z małymi wartościami ME wskazują na w podobne
udziały prognoz przeszacowanych i niedoszacowanych. Jeśli natomiast oba te błędy są duże co do
wartości bezwzględnej, to w zależności od znaku ME, prognozy są albo systematycznie przeszacowane (znak ujemny), albo niedoszacowane (znak dodatni).
Stosując miary MAPE, AMAPE oraz współczynnik rozbieżności Theila na różne sposoby odnosimy niedoskonałość prognozy błędu do obserwowanych wartości prognoz i realizacji prognozowanych zmiennych.
Udział prawidłowych znaków ma sens tylko przy prognozowaniu zmiennych, które mogą
przyjmować wartości ujemne i dodatnie. Miarę te stosujemy zatem przy ocenie prognoz średniej, ale
nie zmienności.
4
Dlaczego stosuje
się tyle różnych
miar jakości
prognozy?