Prognozowanie i symulacje

Transkrypt

Forecasting is the art of saying what will happen, and then explaining why it didn’t.
Ch. Chatfield (1986)
PROGNOZY I SYMULACJE
Katarzyna Chudy – Laskowska
konsultacje: p. 400A
środa
czwartek
strona internetowa:
http://kc.sd.prz.edu.pl/
12-14
12-14
1
WYKŁAD VIII
Szeregi czasowe III
1.
2.
Modele autoregresyjne ARIMA
ARIMA z INTERWENCJĄ
2
2. MODELE AUTOREGRESYJNE
W niektórych przypadkach zauważyć można, że wielkość zmiennej prognozowanej
kształtuje się w zależności od jej poziomu w okresach poprzednich. W tego rodzaju
sytuacjach znajdują zastosowanie modele autoregresyjne mające postać:
yt  f ( yt 1 , yt 2 ,..., yt  p ,  t )
w których wielkość szeregu w okresie t jest funkcją poziomów tej zmiennej w
okresach poprzedzających okres t (t-1, t-2, …, t-p) i zmiennej losowej ζ. Na ogół
funkcja f jest liniowa lub logarytmiczno - liniowa.
Parametry modeli szacuje się najczęściej metodą najmniejszych kwadratów.
Przy konstrukcji tego typu modeli pojawia się problem określenia wartości
parametru p, od którego zależy jak daleko sięga się w przeszłość przy
uwzględnieniu opóźnionych wartości zmiennej prognozowanej w modelu.
MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE)
Model ARIMA wprowadzony, przez Boxa i Jenkinsa zawiera parametry
autoregresyjne, średniej ruchomej oraz wprowadza operator różnicowania. W
modelu wyróżniamy, więc trzy parametry: ARIMA (p,d,q): parametry autoregresyjne
p, rząd różnicowania d, parametry średniej ruchomej q. Wymagane jest aby
wejściowy szereg dla metody ARIMA był stacjonarny, tzn. powinien mieć stałą w
czasie średnią, wariancję i BRAK autokorelacji. Dlatego szereg zazwyczaj
potrzebuje różnicowania, aż do otrzymania stacjonarności, to ile razy szereg
powinien być różnicowany wyraża parametr d.
Należy przeanalizować wykres danych i autokorelogram. Istotne zmiany poziomu
(silny wzrost lub spadek) wymagają zwykle różnicowania nie sezonowego I rzędu,
natomiast duże zmiany nachylenia różnicowania II rzędu. Jeśli estymowane
współczynniki autokorelacji opadają wolno przy dłuższych opóźnieniach, wymaga się
zwykle różnicowania I rzędu. Należy określić ile parametrów autoregresyjnych (p) i
średniej ruchomej (q) wymaga uzyskanie efektywnego i oszczędnego modelu procesu.
Bardzo rzadko liczby parametrów p i q muszą być większe od 2.
UWAGA!! – aby skorzystać z metody ARIMA należy dysponować szeregiem
posiadającym co najmniej 60 obserwacji.
Proces autoregresyjny.
Szeregi czasowe składają się zazwyczaj z obserwacji wzajemnie zależnych tak, że
można oszacować współczynniki modelu, które opisują kolejne elementy szeregu na
podstawie opóźnionych w czasie poprzednich elementów. Każda obserwacja jest sumą
składnika losowego oraz kombinacji liniowej poprzednich obserwacji. Proces AR będzie
stabilny, jeśli parametry będą należeć do przedziału (-1,1). Jest to tzw. wymóg
stacjonarności szeregu.
Proces średniej ruchomej.
Niezależnie od procesu autoregresyjnego, każdy element szeregu może pozostawać
pod wpływem składnika losowego w okresach przyszłych, który to wpływ może nie być
wyjaśniony przez składnik autoregresyjny. Każda obserwacja składa się z ze składnika
losowego oraz kombinacji liniowej składników losowych z przeszłości. Równanie średniej
ruchomej można zapisać w formie autoregresyjnej a można to wykonać tylko wtedy, gdy
parametry średniej ruchomej spełniają pewne warunki tzn., jeśli model jest
odwracalny.
Model ARIMA zawiera w sobie dwa podstawowe procesy: autoregresji i średniej
ruchomej. W pewnych okolicznościach występują one razem.
Postać modelu autoregresji jest następująca:
yt  Φ0  Φ1 yt 1  ...  Φ p yt  p  et
Powyższe równanie nazywa się procesem autoregresji rzędu p, AR(p).
Yt, Yt-1, Yt-p – wartości zmiennej objaśnianej w okresie t, t-1, t-2, t-p.
φ0 ,φ1 ,φ2 ,φp – parametry modelu
et – reszta modelu dla okresu t
p – wielkość opóźnienia
Szeregi czasowe składają się zazwyczaj z obserwacji wzajemnie zależnych tak, że
można oszacować współczynniki modelu, które opisują kolejne elementy szeregu na
podstawie opóźnionych w czasie poprzednich elementów. Każda obserwacja jest sumą
składnika losowego oraz kombinacji liniowej poprzednich obserwacji. Proces AR będzie
stabilny, jeśli parametry będą należeć do pewnego przedziału (-1,1). Jest to tzw. wymóg
stacjonarności szeregu.
6
Postać modelu średniej ruchomej (MA):
yt  0  1et 1  ...  q et q  et
Powyższe równanie nazywa się procesem średniej ruchomej rzędu q, MA(q).
Yt – wartość zmiennej objaśnianej w okresie t
θ0, θ1, θ2, θq – parametry modelu
et, et-1, et-2, et-q – reszty modelu w okresach t, … t-q,
q – wielkość opóźnienia
W procesie średniej ruchomej każda obserwacja składa się z ze składnika losowego oraz
kombinacji liniowej składników losowych z przeszłości. Równanie średniej ruchomej
można zapisać w formie autoregresyjnej a można to wykonać tylko wtedy, gdy
parametry średniej ruchomej spełniają pewne warunki tzn., jeśli model jest odwracalny.
Termin średnia ruchoma jest nieco mylący ponieważ suma wag nie jest równa jedności
jednakże jest on ogólnie przyjęty i używany w tym modelu
7
Dla osiągnięcia większej elastyczności w dopasowaniu modelu do szeregu czasowego
celowe jest połączenie obu modeli:
yt  0  1 yt 1  ...   p yt  p  et  1et 1  ...  q et q
Proces taki nazywa się procesem autoregresji i średniej ruchomej rzędu (p i q) co w
skrócie zapisuje się ARMA (p,q).
W modelu zakłada się, że wartość zmiennej prognozowanej w momencie lub okresie t
zależy od przeszłych jej wielkości oraz od różnicy pomiędzy przeszłymi wartościami
rzeczywistymi zmiennej prognozowanej a jej wartościami uzyskanymi z modelu.
Wymagane jest aby wejściowy szereg dla metody ARIMA był stacjonarny, tzn. powinien
mieć stałą w czasie średnią, wariancję i brak autokorelacji. Dlatego szereg zazwyczaj
potrzebuje różnicowania aż do otrzymania stacjonarności, to ile razy szereg powinien
być różnicowany wyraża parametr d.
Są także modele sezonowe gdzie dodatkowo określa się trzy parametry sezonowości
ARIMA (ps, ds, qs) parametry sezonowe autoregresyjne ps, sezonowe różnicowania ds
oraz sezonowe średniej ruchomej qs.
8
Liczba parametrów modelu:
Należy ją ustalić przed rozpoczęciem estymacji (typ i liczbę). Podstawowym narzędziem są wykresy szeregów,
korelogramy autokorelacji ACF oraz autokorelacji cząstkowej PACF.
Warto wypróbować 5 modeli dla tych samych danych.
1. Jeden parametr autoregresyjny (p); ACF- opada wykładniczo,
PACF – maximum przy opóźnieniu =1 brak korelacji dla innych opóźnień,
2. Dwa parametry autoregresyjne (p); ACF – kształt sinusoidalny lub kombinacja zaników wykładniczych,
PACF – duże wartości przy opóźnieniach 1 i 2 brak korelacji dla innych opóźnień,
3. Jeden parametr średniej ruchomej (q); ACF- maximum przy opóźnieniu 1 brak korelacji dla innych opóźnień,
PACF – gaśnie wykładniczo,
4. Dwa parametry średniej ruchomej (q); ACF – duże wartości przy opóźnieniach 1 i 2 brak korelacji dla innych op.
PACF kształt sinusoidy,
5. Jeden parametr autoregresyjny(p) i jeden średniej ruchomej(q); ACF – opada wykładniczo począwszy od opóźnienia 1,
PACF – opada wykładniczo począwszy od opóźnienia 1.
9
OCENA MODELU
Oceny parametrów: przytoczone są wartości statystyki t, obliczone na podstawie błędów standardowych parametrów.
Jeśli parametr nie będzie istotny to odpowiednia zmienna może zostać w modelu pominięta,
co nie wpływa poważnie na dopasowanie modelu.
Dobry model powinien nie tylko umożliwiać dostatecznie trafne prognozy, ale powinien także być możliwie nieskomplikowany,
a reszty nie powinny zawierać żadnych składników systematycznych.
(korelogram reszt nie powinien ujawniać żadnych zależności szeregowych).
Kontrola poprawności modelu polega na:
- wykreśleniu reszt i poszukiwaniu trendów systematycznych
- badaniu autokorelogramu reszt ( nie powinna wystąpić żadna autokorelacja reszt)
Analiza reszt: problem pojawia się, gdy reszty wykazują jakąś systematyczną prawidłowość lub autokorelację,
co oznacza że aktualnie rozważana postać modelu ARIMA jest niewłaściwa.
OGRANICZENIA: metoda ARIMA nadaje się tylko do analizy modelu,
który jest stacjonarny i zaleca się, aby zbiór danych zawierał co najmniej 60 obserwacji.
10
AUTOKORELACJA KORELOGRAMU
Strukturę harmoniczną szeregu czasowego można analizować przy pomocy korelogramów.
Na korelogramie jest przedstawiona graficznie i liczbowo funkcja autokorelacji ACF tzn. współczynniki autokorelacji (i ich błędy standardowe)
dla kolejnych opóźnień w określonym zakresie opóźnień.
Zazwyczaj zaznacza się także przedział określony przez dwa błędy standardowe, przy czym siła korelacji jest ważniejsza niż
efektywność estymacji, ponieważ interesują nas tylko mocne (istotne) autokorelacje.
Autokorelacje dla kolejnych opóźnień są formalnie zależne. Jeśli pierwszy element jest związany z drugim a drugi z trzecim
to pierwszy musi być do pewnego stopnia związany z trzecim.
Oznacza to, że struktura autokorelacji może się istotnie zmienić po wyeliminowaniu autokorelacji pierwszego rzędu.
(tzn. po różnicowaniu szeregu z opóźnieniem = 1). Jeśli istnieje równomierny trend liniowy to każda obserwacja jest w dużym stopniu
(dodatnią) funkcją liniową obserwacji poprzedzającej.
Np. W szeregu zaobserwujemy trend i przedstawimy funkcję autokorelacji przed różnicowaniem:
Oraz po różnicowaniu niesezonowym (z opóźnieniem = 1)
11
AUTOKORELACJE CZĄSTKOWE
Służą także do badania struktury autokorelacji. Autokorelacje cząstkowe są podobne do autokorelacji z wyjątkiem tego ,
że w ramach opóźnienia podczas jej obliczenia zostają wyeliminowane korelacje z wszystkimi elementami.
Autokorelacja cząstkowa dostarcza „czystszego” obrazu zależności dla poszczególnych opóźnień.
Np. W szeregu zaobserwujemy trend i przedstawimy funkcję autokorelacji cząstkowej przed różnicowaniem,
Oraz po różnicowaniu niesezonowym (z opóźnieniem = 1)
Zależność szeregową dla danego opóźnienia równego k można usunąć przez różnicowanie szeregu, czyli przez przekształcenie
każdego i tego elementu szeregu na jego różnicę z (i-k) –tym elementem.
Po co??????
1.Można zidentyfikować ukrytą naturę zależności sezonowych w szeregu.
2.Można uzyskać szereg stacjonarny, jaki wymagany jest przy analizie modelu ARIMA
Statystyka - przykład
12
ARIMA Z INTERWENCJĄ
Może nastąpić nagła trwała zmiana wartości przeciętnej procesu, ten typ wpływu zakłada,
że ogólna średnia szeregu czasowego po interwencji przesunęła się całkowicie,
co oznacza się przez ()
Stopniowa (narastająca) zmiana wartości, zakłada się że wzrost lub spadek spowodowany
interwencją jest stopniowy i że ostateczny długotrwały wpływ staje się widoczny
po pewnym czasie. Pojawiają się tu dwa parametry: omega  i delta .
Obydwa parametry muszą być istotne statystycznie.
Jeśli  jest bliskie 0 to ostateczna długotrwała wielkość wpływu
stanie się widoczna dopiero po pewnym czasie.
Nagła i zanikająca zmiana wartości przeciętnej procesu.
Model ten zakłada początkowy nagły wzrost lub spadek spowodowany interwencją,
który następnie powoli zanika nie powodując długotrwałej zmiany średniej szeregu.
Statystyka - przykład
13

Prognozowanie i symulacje

Transkrypt

Podobne dokumenty

modele szeregow czasowych - E-SGH

Zastosowanie modeli ARIMA w prognozowaniu przychodów ze

Joanna Chrabołowska*, Joanicjusz Nazarko** MODELE ARIMA W

Zastosowanie wielosezonowego modelu ARIMA w prognozowaniu

zasady zaliczenia przedmiotu

Plan pracy dydaktyczno-wychowawczej na miesiąc kwiecień 2016r

Hasło umts

zadania 8 - E-SGH