otworzyć pliku xls
Transkrypt
otworzyć pliku xls
Modelowanie i analiza szeregów czasowych Małgorzata Doman Zajęcia 2 14 kwietnia 2012 r. POLECENIA Na poprzednich zajęciach: Wstępna analiza własności szeregów czasowych (wykresy ACF, histogram, wykres Q-Q) Testowanie własności rozkładu obserwacji w szeregu (test Testowanie występowania zależności liniowych – test Ljunga-Boxa Testy stacjonarności (ADF, KPSS) Szacowanie własności modeli AR(p) Modele ARMA Część I. Modele ARMAX 1. Otworzyć PLIK2: Plik/Otwórz dane/Import/Excel Typ danych: szeregi czasowe – Inne 2. Przyjrzeć się danym. 3. Ustalić długość próby zostawiając 100 obserwacji na prognozy: Próba/Zakres próby 4. Dla stóp zwrotu z kursu PLN/UDSD oszacować model ARMA(1,1) oraz ARMAX(1,1), czyli ARMA(1,1) z dodatkową zmienną objaśniającą –stopy zwrotu z kursu PLN/USD, a następnie model ze zmiennymi 0-1. Modelowanie i analiza szeregów czasowych Małgorzata Doman 5. Wyznaczyć 100 prognoz stóp zwrotu kursu USD/PLN i ocenić ich jakość. 6. Dla stóp zwrotu z kursu USD/PLN oszacować kilka modeli ARMA(p,q) uwzględniając jako dodatkowe zmienne objaśniające opóźnione stopy zwrotu z kursów USD/HUF, USD/CZK oraz zmienne 0-1 7. Ocenić jakość dopasowania modeli i wybrać najlepszy model 8. Porównać jakość prognoz z różnych modeli 9. Zapisać sesję. 10. Plik/Pliki sesji gretla/ Zapisz sesję Część II. Modele VAR 1. Otworzyć plik: Plik/otwórz dane/Pliki z przykładami/hamilton.gdt 2. Wyliczyć różnice zmiennych PC6IT, PZUNEW, EXRITL: Dodawanie zmiennych/pierwsze różnice dla wybranych zmiennych. 3. Przeprowadzić wstępne testy dla szeregów różnic 4. Wykreślić korelogramy oraz korelagram krzyżowy dla różnic zmiennych PC6IT i PZUNEW. 5. Ustalić próbę na okres do końca 1988 r. : Próba/ Zakres próby. 6. Wybrać opóźnienie w modelu VAR: Model/Modele szeregów czasowych/wybór rzędu opóźnienia dla modelu VAR 7. Korzystając z wyniku z poprzedniego punktu oszacować model VAR. 8. Ocenić własności reszt oszacowanego modelu. 9. Przeprowadzić Analizę impuls response (menu na wydruku wyników szacowania modelu). 10. Wyznaczyć prognozy na rok 1989 (menu na wydruku wyników szacowania modelu: Analiza/Prognozy). Ocenić jakość prognoz. 11. Rozważyć model z wprowadzonymi różnicami zmiennej EXRTIL 12. Samodzielnie powtórzyć analizę dla danych z pliku indeksy.xls 2 Modelowanie i analiza szeregów czasowych Małgorzata Doman Informacje uzupełniające – miary jakości prognoz - wzory Jednym z podstawowych wymagań, jakie stawia się modelom szeregów czasowych, jest dostarczanie dobrej jakości prognoz. Stosowanych miar jakości prognoz jest bardzo wiele (zob. Aleksander Welfe, Ekonometria). W poniższych formułach yˆ T i jest prognozą, yT i wielkością zaobserwowaną, T oznacza liczbę obserwacji w próbie, N jest liczbą prognoz na okres poza próbą, a i jest długością horyzontu prognozy. W praktyce modelowania stosuje się szeroki zestaw błędów prognoz, które przedstawione zostały poniżej: Błąd średniokwadratowy (MSE) MSE 1 N yT i yˆT i 2 N i 1 Medianowy błąd kwadratowy (MedSE) MedSE mediana yT i yˆT i Błąd średni (ME) ME 1 N yT i yˆT i N i 1 Średni błąd bezwzględny (MAE) MAE 1 N yT i yˆT i N i 1 Pierwiastek błędu średniokwadratowego (RMSE) RMSE 1 N yT i yˆT i 2 N i 1 Średni bezwzględny błąd procentowy (MAPE) MAPE 2 N i 1 1 N yT i yˆ T i y N i 1 T i Skorygowany średni bezwzględny błąd procentowy (AMAPE) AMAPE 1 N yT i yˆ T i N i 1 yT i yˆ T i 3 Modelowanie i analiza szeregów czasowych Małgorzata Doman Udział prawidłowych znaków (PCS) PCS 1 N max sign yT i yˆT i ,0 N i 1 Współczynnik rozbieżności Theila (TIC) TIC 1 N 1 N N y i 1 N y i 1 2 T i yˆ T i 2 T i 1 N N yˆ i 1 2 T i Logarytmiczna funkcja straty (LLF) 1 N yˆ LLF ln T i N i 1 yT i 2 Tylko niedoświadczony czytelnik mógłby odnieść wrażenie, że przedstawione tu miary błędów powielają informacje dotyczące trafności prognoz. Zróżnicowana konstrukcja tych miar pozwala na wychwycenie różnych aspektów jakości prognoz. Na przykład MSE i MAE i RMSE niosą w pewnym sensie podobną informację, ale w różny sposób reagują na występowanie obserwacji nietypowych. Bliskie siebie wartości tych błędów wskazują, że w szeregu prognoz nie ma pojedynczych prognoz obciążonych dużym błędem, natomiast wartości MSE znacznie większe niż MAE ujawniają obecność błędów o wartościach wyjątkowo dużych.. Duże wartości błędu MAE w zestawieniu z małymi wartościami ME wskazują na w podobne udziały prognoz przeszacowanych i niedoszacowanych. Jeśli natomiast oba te błędy są duże co do wartości bezwzględnej, to w zależności od znaku ME, prognozy są albo systematycznie przeszacowane (znak ujemny), albo niedoszacowane (znak dodatni). Stosując miary MAPE, AMAPE oraz współczynnik rozbieżności Theila na różne sposoby odnosimy niedoskonałość prognozy błędu do obserwowanych wartości prognoz i realizacji prognozowanych zmiennych. Udział prawidłowych znaków ma sens tylko przy prognozowaniu zmiennych, które mogą przyjmować wartości ujemne i dodatnie. Miarę te stosujemy zatem przy ocenie prognoz średniej, ale nie zmienności. 4 Dlaczego stosuje się tyle różnych miar jakości prognozy?