Prognozowanie i symulacje
Transkrypt
Prognozowanie i symulacje
Forecasting is the art of saying what will happen, and then explaining why it didn’t. Ch. Chatfield (1986) PROGNOZY I SYMULACJE Katarzyna Chudy – Laskowska konsultacje: p. 400A środa czwartek strona internetowa: http://kc.sd.prz.edu.pl/ 12-14 12-14 1 WYKŁAD VIII Szeregi czasowe III 1. 2. Modele autoregresyjne ARIMA ARIMA z INTERWENCJĄ 2 2. MODELE AUTOREGRESYJNE W niektórych przypadkach zauważyć można, że wielkość zmiennej prognozowanej kształtuje się w zależności od jej poziomu w okresach poprzednich. W tego rodzaju sytuacjach znajdują zastosowanie modele autoregresyjne mające postać: yt f ( yt 1 , yt 2 ,..., yt p , t ) w których wielkość szeregu w okresie t jest funkcją poziomów tej zmiennej w okresach poprzedzających okres t (t-1, t-2, …, t-p) i zmiennej losowej ζ. Na ogół funkcja f jest liniowa lub logarytmiczno - liniowa. Parametry modeli szacuje się najczęściej metodą najmniejszych kwadratów. Przy konstrukcji tego typu modeli pojawia się problem określenia wartości parametru p, od którego zależy jak daleko sięga się w przeszłość przy uwzględnieniu opóźnionych wartości zmiennej prognozowanej w modelu. 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) Model ARIMA wprowadzony, przez Boxa i Jenkinsa zawiera parametry autoregresyjne, średniej ruchomej oraz wprowadza operator różnicowania. W modelu wyróżniamy, więc trzy parametry: ARIMA (p,d,q): parametry autoregresyjne p, rząd różnicowania d, parametry średniej ruchomej q. Wymagane jest aby wejściowy szereg dla metody ARIMA był stacjonarny, tzn. powinien mieć stałą w czasie średnią, wariancję i BRAK autokorelacji. Dlatego szereg zazwyczaj potrzebuje różnicowania, aż do otrzymania stacjonarności, to ile razy szereg powinien być różnicowany wyraża parametr d. Należy przeanalizować wykres danych i autokorelogram. Istotne zmiany poziomu (silny wzrost lub spadek) wymagają zwykle różnicowania nie sezonowego I rzędu, natomiast duże zmiany nachylenia różnicowania II rzędu. Jeśli estymowane współczynniki autokorelacji opadają wolno przy dłuższych opóźnieniach, wymaga się zwykle różnicowania I rzędu. Należy określić ile parametrów autoregresyjnych (p) i średniej ruchomej (q) wymaga uzyskanie efektywnego i oszczędnego modelu procesu. Bardzo rzadko liczby parametrów p i q muszą być większe od 2. UWAGA!! – aby skorzystać z metody ARIMA należy dysponować szeregiem posiadającym co najmniej 60 obserwacji. 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) Proces autoregresyjny. Szeregi czasowe składają się zazwyczaj z obserwacji wzajemnie zależnych tak, że można oszacować współczynniki modelu, które opisują kolejne elementy szeregu na podstawie opóźnionych w czasie poprzednich elementów. Każda obserwacja jest sumą składnika losowego oraz kombinacji liniowej poprzednich obserwacji. Proces AR będzie stabilny, jeśli parametry będą należeć do przedziału (-1,1). Jest to tzw. wymóg stacjonarności szeregu. Proces średniej ruchomej. Niezależnie od procesu autoregresyjnego, każdy element szeregu może pozostawać pod wpływem składnika losowego w okresach przyszłych, który to wpływ może nie być wyjaśniony przez składnik autoregresyjny. Każda obserwacja składa się z ze składnika losowego oraz kombinacji liniowej składników losowych z przeszłości. Równanie średniej ruchomej można zapisać w formie autoregresyjnej a można to wykonać tylko wtedy, gdy parametry średniej ruchomej spełniają pewne warunki tzn., jeśli model jest odwracalny. 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) Model ARIMA zawiera w sobie dwa podstawowe procesy: autoregresji i średniej ruchomej. W pewnych okolicznościach występują one razem. Postać modelu autoregresji jest następująca: yt Φ0 Φ1 yt 1 ... Φ p yt p et Powyższe równanie nazywa się procesem autoregresji rzędu p, AR(p). Yt, Yt-1, Yt-p – wartości zmiennej objaśnianej w okresie t, t-1, t-2, t-p. φ0 ,φ1 ,φ2 ,φp – parametry modelu et – reszta modelu dla okresu t p – wielkość opóźnienia Szeregi czasowe składają się zazwyczaj z obserwacji wzajemnie zależnych tak, że można oszacować współczynniki modelu, które opisują kolejne elementy szeregu na podstawie opóźnionych w czasie poprzednich elementów. Każda obserwacja jest sumą składnika losowego oraz kombinacji liniowej poprzednich obserwacji. Proces AR będzie stabilny, jeśli parametry będą należeć do pewnego przedziału (-1,1). Jest to tzw. wymóg stacjonarności szeregu. 6 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) Postać modelu średniej ruchomej (MA): yt 0 1et 1 ... q et q et Powyższe równanie nazywa się procesem średniej ruchomej rzędu q, MA(q). Yt – wartość zmiennej objaśnianej w okresie t θ0, θ1, θ2, θq – parametry modelu et, et-1, et-2, et-q – reszty modelu w okresach t, … t-q, q – wielkość opóźnienia W procesie średniej ruchomej każda obserwacja składa się z ze składnika losowego oraz kombinacji liniowej składników losowych z przeszłości. Równanie średniej ruchomej można zapisać w formie autoregresyjnej a można to wykonać tylko wtedy, gdy parametry średniej ruchomej spełniają pewne warunki tzn., jeśli model jest odwracalny. Termin średnia ruchoma jest nieco mylący ponieważ suma wag nie jest równa jedności jednakże jest on ogólnie przyjęty i używany w tym modelu 7 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) Dla osiągnięcia większej elastyczności w dopasowaniu modelu do szeregu czasowego celowe jest połączenie obu modeli: yt 0 1 yt 1 ... p yt p et 1et 1 ... q et q Proces taki nazywa się procesem autoregresji i średniej ruchomej rzędu (p i q) co w skrócie zapisuje się ARMA (p,q). W modelu zakłada się, że wartość zmiennej prognozowanej w momencie lub okresie t zależy od przeszłych jej wielkości oraz od różnicy pomiędzy przeszłymi wartościami rzeczywistymi zmiennej prognozowanej a jej wartościami uzyskanymi z modelu. Wymagane jest aby wejściowy szereg dla metody ARIMA był stacjonarny, tzn. powinien mieć stałą w czasie średnią, wariancję i brak autokorelacji. Dlatego szereg zazwyczaj potrzebuje różnicowania aż do otrzymania stacjonarności, to ile razy szereg powinien być różnicowany wyraża parametr d. Są także modele sezonowe gdzie dodatkowo określa się trzy parametry sezonowości ARIMA (ps, ds, qs) parametry sezonowe autoregresyjne ps, sezonowe różnicowania ds oraz sezonowe średniej ruchomej qs. 8 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) Liczba parametrów modelu: Należy ją ustalić przed rozpoczęciem estymacji (typ i liczbę). Podstawowym narzędziem są wykresy szeregów, korelogramy autokorelacji ACF oraz autokorelacji cząstkowej PACF. Warto wypróbować 5 modeli dla tych samych danych. 1. Jeden parametr autoregresyjny (p); ACF- opada wykładniczo, PACF – maximum przy opóźnieniu =1 brak korelacji dla innych opóźnień, 2. Dwa parametry autoregresyjne (p); ACF – kształt sinusoidalny lub kombinacja zaników wykładniczych, PACF – duże wartości przy opóźnieniach 1 i 2 brak korelacji dla innych opóźnień, 3. Jeden parametr średniej ruchomej (q); ACF- maximum przy opóźnieniu 1 brak korelacji dla innych opóźnień, PACF – gaśnie wykładniczo, 4. Dwa parametry średniej ruchomej (q); ACF – duże wartości przy opóźnieniach 1 i 2 brak korelacji dla innych op. PACF kształt sinusoidy, 5. Jeden parametr autoregresyjny(p) i jeden średniej ruchomej(q); ACF – opada wykładniczo począwszy od opóźnienia 1, PACF – opada wykładniczo począwszy od opóźnienia 1. 9 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) OCENA MODELU Oceny parametrów: przytoczone są wartości statystyki t, obliczone na podstawie błędów standardowych parametrów. Jeśli parametr nie będzie istotny to odpowiednia zmienna może zostać w modelu pominięta, co nie wpływa poważnie na dopasowanie modelu. Dobry model powinien nie tylko umożliwiać dostatecznie trafne prognozy, ale powinien także być możliwie nieskomplikowany, a reszty nie powinny zawierać żadnych składników systematycznych. (korelogram reszt nie powinien ujawniać żadnych zależności szeregowych). Kontrola poprawności modelu polega na: - wykreśleniu reszt i poszukiwaniu trendów systematycznych - badaniu autokorelogramu reszt ( nie powinna wystąpić żadna autokorelacja reszt) Analiza reszt: problem pojawia się, gdy reszty wykazują jakąś systematyczną prawidłowość lub autokorelację, co oznacza że aktualnie rozważana postać modelu ARIMA jest niewłaściwa. OGRANICZENIA: metoda ARIMA nadaje się tylko do analizy modelu, który jest stacjonarny i zaleca się, aby zbiór danych zawierał co najmniej 60 obserwacji. 10 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) AUTOKORELACJA KORELOGRAMU Strukturę harmoniczną szeregu czasowego można analizować przy pomocy korelogramów. Na korelogramie jest przedstawiona graficznie i liczbowo funkcja autokorelacji ACF tzn. współczynniki autokorelacji (i ich błędy standardowe) dla kolejnych opóźnień w określonym zakresie opóźnień. Zazwyczaj zaznacza się także przedział określony przez dwa błędy standardowe, przy czym siła korelacji jest ważniejsza niż efektywność estymacji, ponieważ interesują nas tylko mocne (istotne) autokorelacje. Autokorelacje dla kolejnych opóźnień są formalnie zależne. Jeśli pierwszy element jest związany z drugim a drugi z trzecim to pierwszy musi być do pewnego stopnia związany z trzecim. Oznacza to, że struktura autokorelacji może się istotnie zmienić po wyeliminowaniu autokorelacji pierwszego rzędu. (tzn. po różnicowaniu szeregu z opóźnieniem = 1). Jeśli istnieje równomierny trend liniowy to każda obserwacja jest w dużym stopniu (dodatnią) funkcją liniową obserwacji poprzedzającej. Np. W szeregu zaobserwujemy trend i przedstawimy funkcję autokorelacji przed różnicowaniem: Oraz po różnicowaniu niesezonowym (z opóźnieniem = 1) 11 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) AUTOKORELACJE CZĄSTKOWE Służą także do badania struktury autokorelacji. Autokorelacje cząstkowe są podobne do autokorelacji z wyjątkiem tego , że w ramach opóźnienia podczas jej obliczenia zostają wyeliminowane korelacje z wszystkimi elementami. Autokorelacja cząstkowa dostarcza „czystszego” obrazu zależności dla poszczególnych opóźnień. Np. W szeregu zaobserwujemy trend i przedstawimy funkcję autokorelacji cząstkowej przed różnicowaniem, Oraz po różnicowaniu niesezonowym (z opóźnieniem = 1) Zależność szeregową dla danego opóźnienia równego k można usunąć przez różnicowanie szeregu, czyli przez przekształcenie każdego i tego elementu szeregu na jego różnicę z (i-k) –tym elementem. Po co?????? 1.Można zidentyfikować ukrytą naturę zależności sezonowych w szeregu. 2.Można uzyskać szereg stacjonarny, jaki wymagany jest przy analizie modelu ARIMA Statystyka - przykład 12 2. MODELE AUTOREGRESYJNE MODEL ARIMA (AUTO-REGRESSIVE INTEGRATED MOVING AVERAGE) ARIMA Z INTERWENCJĄ Może nastąpić nagła trwała zmiana wartości przeciętnej procesu, ten typ wpływu zakłada, że ogólna średnia szeregu czasowego po interwencji przesunęła się całkowicie, co oznacza się przez () Stopniowa (narastająca) zmiana wartości, zakłada się że wzrost lub spadek spowodowany interwencją jest stopniowy i że ostateczny długotrwały wpływ staje się widoczny po pewnym czasie. Pojawiają się tu dwa parametry: omega i delta . Obydwa parametry muszą być istotne statystycznie. Jeśli jest bliskie 0 to ostateczna długotrwała wielkość wpływu stanie się widoczna dopiero po pewnym czasie. Nagła i zanikająca zmiana wartości przeciętnej procesu. Model ten zakłada początkowy nagły wzrost lub spadek spowodowany interwencją, który następnie powoli zanika nie powodując długotrwałej zmiany średniej szeregu. Statystyka - przykład 13