PiS-Wykład-5
Transkrypt
PiS-Wykład-5
Prognozowanie na podstawie szeregów czasowych. Składowe szeregów czasowych. Szereg czasowy składowa przypadkowa składowa systematyczna trend stały poziom składowa okresowa wahania sezonowe wahania cykliczne Trend (tendencja rozwojowa) - długookresowa skłonno do jednokierunkowych zmian (wzrostu lub spadku) warto ci zmiennej badanej. Jest konsekwencj działania stałych czynników np. w przypadku sprzeda y - liczba potencjalnych klientów, ich dochody lub preferencje. Mo e by wyznaczony gdy mamy długi ci g obserwacji. Stały (przeci tny poziom) - wyst puje gdy w szeregu czasowym nie ma trendu, za warto ci badanej zmiennej oscyluj wokół pewnego stałego poziomu. Wahania cykliczne - długookresowe wahania wokół trendu lub stałego poziomu. W ekonomii najcz ciej zwi zane z cyklem koniunkturalnym gospodarki. Wahania sezonowe - wahania wokół trendu lub stałego poziomu. Wahania te maj skłonno ci do powtarzania si w okre lonym czasie nie przekraczaj cym jednego roku, odzwierciedlaj wpływ pogody lub kalendarza na działalno 1 gospodarcz . Dekompozycja szeregu czasowego = wyodr bnienie poszczególnych składowych. Czas Wahania cykliczne Wahania sezonowe Trend Stały poziom Wahania przypadkowe Czas Modele szeregów czasowych. f(t) - trend, g(t) - wahania sezonowe, h(t) - wahania cykliczne, ξt - składnik losowy, const - stały poziom. Model addytywny: 2 yt = f (t) + g(t) + h(t) +ξt yt = const+ g(t) + h(t) +ξt lub Model multiplikatywny: yt = f (t) ⋅ g(t) ⋅ h(t) ⋅ξt yt = const⋅ g(t) ⋅ h(t) ⋅ξt lub Modele mieszane: yt = f (t) + g(t) + h(t) ⋅ξt lub yt = f (t) ⋅ h(t) + g(t) ⋅ξt yt = f (t) ⋅ g(t) ⋅ξt + h(t) lub yt = f (t) ⋅ h(t) ⋅ξt + g(t) stały poziom 25,0 20,0 yt 15,0 10,0 5,0 0,0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 9 10 11 12 13 14 15 16 czas trend 25,0 20,0 yt 15,0 10,0 5,0 0,0 0 1 2 3 4 5 6 7 3 8 czas stały poziom+wahania sezonowe 25,0 20,0 yt 15,0 10,0 5,0 0,0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 czas (wkwartałach) trend +wahania sezonowe 25,0 20,0 yt 15,0 10,0 5,0 0,0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 czas (w kwartałach) 4 Do wyznaczania składowych szeregu czasowego oprócz wykresu przydatny jest ci g współczynników autokorelacji rz du k (k od 1 do około połowy liczby danych) n−k rk = t =1 ( y t − y )⋅ ( y t + k n t =1 − y) ( y t − y )2 Je li rk zbli aj si do zera i nast pnie oscyluj wokół niego to szereg czasowy zawiera składow stał . Je li rk malej poprzez zero do warto ci ujemnych to szereg ma trend. Je li rk oscyluj wokół zera i co pewien okres s wyra nie wi ksze od zera to szereg czasowy zawiera wahania sezonowe. Niekiedy przyjmuje si , e wahania przypadkowe s niewielkie, gdy ich współczynnik zmienno ci jest rz du kilku, najwy ej kilkunastu procent. Prognoza zmiennej Y jest warto ci funkcji f zale nej od czasu, przeszłych warto ci i prognoz tej zmiennej. yt* = f (t , yt −1 ,..., yt − p , y * t −1 ,..., y * t − p , ξ t ) czas p - wielko prognozy warto ci składnik losowy opó nienia. Uwaga. Jako modelu oceniamy jak w ekonometrii. Dopasowanie wielko ci zjawiska wyznaczonych z modelu (prognozy wygasłe) do wielko ci zaobserwowanych oceniamy na podstawie: - bł du redniokwadratowego prognoz wygasłych s = * wielko 1 k k t =1 (y t − yt* ) 2 k - liczba prognoz wygasłych ta okre la o ile rednio jednostek prognozy wygasłe odchylaj si (plus-minus) od warto ci zaobserwowanych. - wzgl dnego bł du redniokwadratowego (procentowego bł du redniokwadratowego) prognoz wygasłych 5 1 k s = * w wielko k t =1 yt − yt* yt 2 ⋅ 100% ta okre la o ile rednio procent prognozy wygasłe odchylaj si (plus-minus) od warto ci zaobserwowanych. - redniego bł du wzgl dnego (procentowego bł du wzgl dnego) prognoz wygasłych 1 ψ= k k t =1 yt − yt* ⋅ 100% yt (interpretacja jak wy ej) Cz sto ostatni z tych bł dów słu y do oceny jako ci prognozy. Naiwne i proste metody prognozowania. (oparte na zało eniu, e wahania przypadkowe s niewielkie i nie zmieni si dotychczasowy wpływ czynników kształtuj cych obserwowane zjawisko). Zalet metody naiwnej jest prostota, wad brak oceny jako ci prognozy na podstawie prognoz wygasłych. Rodzaje prognoz naiwnych: • wg stałego poziomu yt*+1 = yt lub yt*+1 = y t + yt −1 + yt −2 3 • wg stałych przyrostów bezwzgl dnych (np. trend zbli ony do liniowego) yt*+1 = yt + ( yt − y t −1 ) • wg stałych przyrostów wzgl dnych (niektóre trendy nieliniowe) 2 y * t +1 y − yt −1 y = t = yt 1 + t yt −1 yt −1 • wg waha sezonowych i stałego poziomu yt*+1 = yt − r +1 , gdzie r długo cyklu sezonowego (liczba faz cyklu), 6 • wg waha sezonowych i trendu yt*+1 = yt − r +1 + r∆y r , gdzie r długo cyklu sezonowego (liczba faz cyklu), ∆y r - przyrost rednich w dwóch ostatnich cyklach. Przykład. Dla poszczególnych serii danych miesi cznych wyznacz prognoz naiwn na kolejny miesi c. a) 115, 119, 126, 131, 136, b) 1, 4, 12, 24, 72, c) 125, 120, 110, 115, 120. Przykład. Wiedz c, e zjawisko ma charakter sezonowy (r = 4), dla poszczególnych serii danych kwartalnych wyznacz prognoz naiwn na dwa kolejne kwartały. a) 150, 200, 160, 120, 170, b) 150, 220, 190, 170, 200, 270, 240, 220, 270 Metoda redniej globalnej. y n*+1 = 1 n n i =1 yi Metoda redniej ruchomej. Metod t wykorzystujemy zarówno do wygładzania szeregu czasowego jak i do prognozowania. Prognoza jest redni arytmetyczn z k ostatnich obserwacji (k - stała wygładzania). yt* = k wyznaczamy tak aby 1 t −1 yi k i =t − k 2 redni kwadratowy bł d ex post s * = ( n 1 yt − yt* n − k t = k +1 minimalny. Prognoz oceniamy za pomoc redniego bł du wzgl dnego prognoz przeszłych n yt − yt* 1 Ψk = 100% n − k t = k +1 y t 7 ) 2 był Uwaga. Gdy k = 1 to metoda naiwna. Gdy k = n to rednia globalna. Gdy k du e to rednia ruchoma silniej wygładza szereg czasowy lecz jednocze nie wolniej reaguje na zmiany poziomu badanego zjawiska. Gdy k małe to rednia ruchoma szybciej odzwierciedla zmiany zjawiska lecz wi kszy wpływ wywieraj na ni wahania przypadkowe. Aby stosowa redni ruchom powinni my zwykle dysponowa co najmniej kilkunastoma danymi. rednia wa ona. Ustalamy wagi 0 < w1 ≤ w2 ≤ .... ≤ wk < 1 takie, e k i =1 wi = 1 (oznacza to, e do wcze niejszych informacji przywi zujemy mniejsz wag ). Prognoz wyznaczamy na podstawie wzoru: * t +1 y t = wi−t +k yi i =t −k +1 Model Browna (prosty model wygładzania wykładniczego). Zwykle stosujemy ten model dla szeregów czasowych o stałym poziomie lub bardzo słabym trendzie i umiarkowanych wahaniach przypadkowych. Model pozwala wyznaczy prognoz wg wzoru: yt∗ = αyt −1 + (1 − α ) yt∗−1 , t = 2, 3, ...., n + 1 prognoza jest kombinacj wypukł ( redni wa on ) przeszłej warto ci zjawiska i przeszłej prognozy. α ∈ 0,1 – parametr wygładzania. Warto α dobieramy np. na podstawie kryterium najmniejszego bł du redniokwadratowego prognoz wygasłych s* tzn. min s * (α ) gdzie α s* = 2 1 n yt − y*t ( α ) n t =1 Je li nie mamy mo liwo ci wyznaczenia optymalnej warto ci parametru wygładzania zwykle zaleca si stosowania warto ci 0,1 – 0,3. Uwaga Równowa ny wzór na prognoz w tym modelu ma posta : yt∗ = yt∗−1 + α ( yt −1 − yt∗−1 ) 8 zatem dla małych α prognoza w małym stopniu uwzgl dnia bł d ex post prognoz przeszłych. Uwaga Jako warto y1∗ przyjmujemy jedn z warto ci: a) pierwsz warto szeregu czasowego, y1∗ = y1 , b) c) y1 + y 2 + y3 , 3 y + y 2 + y3 + y 4 + y5 redni z pi ciu pocz tkowych warto ci szeregu czasowego, y1∗ = 1 . 5 redni z trzech pocz tkowych warto ci szeregu czasowego, y1∗ = Model Browna jest rozwini ciem metody rednich wa onych. Wagi malej wykładniczo przy coraz starszych danych. Wida to gdy przekształcimy wzór na prognoz w tym modelu: yn∗ = αyn−1 + (1 − α ) yn∗−1 podstawiaj c yn−1 = αyn−2 + (1 − α ) yn−2 otrzymamy ∗ ∗ yn∗ = αyn−1 + (1 − α )(αyn−2 + (1 − α ) yn∗−2 ) = αyn−1 + α (1 − α ) yn−2 + (1 − α ) 2 yn∗−2 nast pnie podstawiaj c yn−2 = αyn−3 + (1 − α ) yn−3 otrzymamy ∗ ∗ yn∗ = αyn−1 + α (1 − α ) yn−2 + (1 − α ) 2 (αyn−3 + (1 − α ) yn∗−3 ) = = αyn−1 + α (1 − α ) yn−2 + α (1 − α ) 2 yn−3 + (1 − α ) 3 yn∗−3 ostatecznie yn∗ = αyn−1 + α (1 − α ) yn−2 + .... + α (1 − α ) k yn−k +1 + ... Wagi przy poszczególnych elementach szeregu czasowego α > α (1 − α ) > .... > α (1 − α ) k > ... stanowi kolejne wyrazy ci gu geometrycznego o ilorazie 0 < 1 − α < 1 . Dla du ych n ich suma jest prawie równa 1 bowiem α + α (1 − α ) + .... + α (1 − α ) k + ... = α 1 − (1 − α ) =1 Uwaga. a) je li wygładzenie szeregu czasowego (zwłaszcza dla du ych α) nie jest zadawalaj ce to mo emy powy sze wygładzanie powtórzy , b) chocia dla małych α wygładzenie jest lepsze, to nie zawsze wtedy jest najmniejszy bł d redniokwadratowy dla prognoz przeszłych, wida to w nast puj cym przykładzie Przykład (L. Kowalski, „Statystyka”, 2003, 2005), . Liczba sprzedanych arówek (tys. szt.) w hurtowni „LUMEN” w kolejnych kwartałach lat 1998-2000: 9 37, 36, 34, 33, 34, 33, 35, 34, 35, 33, 34, 36 Badaj c wielko bł du redniokwadratowego dla ró nych warto ci α otrzymamy: α bł d 0,1 1,47 0,2 1,39 0,3 1,36 0,4 1,35 0,5 1,35 0,6 1,36 0,7 1,37 0,8 1,38 0,9 1,41 Jak wida najlepsze (z tego punktu widzenia) warto ci α s w przedziale 0,4 ÷ 0,5. 10