PiS-Wykład-5

Transkrypt

PiS-Wykład-5
Prognozowanie na podstawie szeregów czasowych.
Składowe szeregów czasowych.
Szereg czasowy
składowa przypadkowa
składowa systematyczna
trend
stały poziom
składowa okresowa
wahania sezonowe
wahania cykliczne
Trend (tendencja rozwojowa) - długookresowa skłonno
do jednokierunkowych zmian
(wzrostu lub spadku) warto ci zmiennej badanej. Jest konsekwencj
działania stałych
czynników np. w przypadku sprzeda y - liczba potencjalnych klientów, ich dochody lub
preferencje. Mo e by wyznaczony gdy mamy długi ci g obserwacji.
Stały (przeci tny poziom) - wyst puje gdy w szeregu czasowym nie ma trendu, za warto ci
badanej zmiennej oscyluj wokół pewnego stałego poziomu.
Wahania cykliczne - długookresowe wahania
wokół trendu
lub stałego poziomu.
W ekonomii najcz ciej zwi zane z cyklem koniunkturalnym gospodarki.
Wahania sezonowe - wahania
wokół trendu
lub stałego poziomu. Wahania te maj
skłonno ci do powtarzania si w okre lonym czasie nie przekraczaj cym jednego roku,
odzwierciedlaj wpływ pogody lub kalendarza na działalno
1
gospodarcz .
Dekompozycja szeregu czasowego = wyodr bnienie poszczególnych składowych.
Czas
Wahania cykliczne
Wahania sezonowe
Trend
Stały poziom
Wahania przypadkowe
Czas
Modele szeregów czasowych.
f(t) - trend,
g(t) - wahania sezonowe,
h(t) - wahania cykliczne,
ξt
- składnik losowy,
const - stały poziom.
Model addytywny:
2
yt = f (t) + g(t) + h(t) +ξt
yt = const+ g(t) + h(t) +ξt
lub
Model multiplikatywny:
yt = f (t) ⋅ g(t) ⋅ h(t) ⋅ξt
yt = const⋅ g(t) ⋅ h(t) ⋅ξt
lub
Modele mieszane:
yt = f (t) + g(t) + h(t) ⋅ξt
lub
yt = f (t) ⋅ h(t) + g(t) ⋅ξt
yt = f (t) ⋅ g(t) ⋅ξt + h(t)
lub
yt = f (t) ⋅ h(t) ⋅ξt + g(t)
stały poziom
25,0
20,0
yt
15,0
10,0
5,0
0,0
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
9
10 11 12 13 14 15 16
czas
trend
25,0
20,0
yt
15,0
10,0
5,0
0,0
0
1
2
3
4
5
6
7
3
8
czas
stały poziom+wahania sezonowe
25,0
20,0
yt
15,0
10,0
5,0
0,0
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16
czas (wkwartałach)
trend +wahania sezonowe
25,0
20,0
yt
15,0
10,0
5,0
0,0
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
czas (w kwartałach)
4
Do wyznaczania składowych szeregu czasowego oprócz wykresu przydatny jest ci g
współczynników autokorelacji rz du k (k od 1 do około połowy liczby danych)
n−k
rk =
t =1
( y t − y )⋅ ( y t + k
n
t =1
− y)
( y t − y )2
Je li rk zbli aj si do zera i nast pnie oscyluj wokół niego to szereg czasowy zawiera
składow stał .
Je li rk malej poprzez zero do warto ci ujemnych to szereg ma trend.
Je li rk oscyluj wokół zera i co pewien okres s wyra nie wi ksze od zera to szereg czasowy
zawiera wahania sezonowe.
Niekiedy przyjmuje si , e wahania przypadkowe s niewielkie, gdy ich współczynnik
zmienno ci jest rz du kilku, najwy ej kilkunastu procent.
Prognoza zmiennej Y jest warto ci funkcji f zale nej od czasu, przeszłych warto ci i prognoz
tej zmiennej.
yt* = f (t , yt −1 ,..., yt − p , y * t −1 ,..., y * t − p , ξ t )
czas
p - wielko
prognozy
warto ci
składnik losowy
opó nienia.
Uwaga.
Jako
modelu oceniamy jak w ekonometrii.
Dopasowanie wielko ci zjawiska wyznaczonych z modelu (prognozy wygasłe) do wielko ci
zaobserwowanych oceniamy na podstawie:
-
bł du redniokwadratowego prognoz wygasłych
s =
*
wielko
1
k
k
t =1
(y
t
− yt*
)
2
k - liczba prognoz wygasłych
ta okre la o ile rednio jednostek prognozy wygasłe odchylaj si (plus-minus)
od warto ci zaobserwowanych.
-
wzgl dnego bł du redniokwadratowego (procentowego bł du redniokwadratowego)
prognoz wygasłych
5
1
k
s =
*
w
wielko
k
t =1
yt − yt*
yt
2
⋅ 100%
ta okre la o ile rednio procent prognozy wygasłe odchylaj si (plus-minus) od
warto ci zaobserwowanych.
-
redniego bł du wzgl dnego (procentowego bł du wzgl dnego) prognoz wygasłych
1
ψ=
k
k
t =1
yt − yt*
⋅ 100%
yt
(interpretacja jak wy ej)
Cz sto ostatni z tych bł dów słu y do oceny jako ci prognozy.
Naiwne i proste metody prognozowania.
(oparte na zało eniu, e wahania przypadkowe s niewielkie i nie zmieni si dotychczasowy
wpływ czynników kształtuj cych obserwowane zjawisko).
Zalet metody naiwnej jest prostota, wad brak oceny jako ci prognozy na podstawie prognoz
wygasłych.
Rodzaje prognoz naiwnych:
• wg stałego poziomu
yt*+1 = yt
lub
yt*+1 =
y t + yt −1 + yt −2
3
• wg stałych przyrostów bezwzgl dnych (np. trend zbli ony do liniowego)
yt*+1 = yt + ( yt − y t −1 )
• wg stałych przyrostów wzgl dnych (niektóre trendy nieliniowe)
2
y
*
t +1
y − yt −1
y
= t
= yt 1 + t
yt −1
yt −1
• wg waha sezonowych i stałego poziomu
yt*+1 = yt − r +1 ,
gdzie r długo
cyklu sezonowego (liczba faz cyklu),
6
• wg waha sezonowych i trendu
yt*+1 = yt − r +1 + r∆y r ,
gdzie r długo
cyklu sezonowego (liczba faz cyklu),
∆y r - przyrost rednich w dwóch ostatnich cyklach.
Przykład.
Dla poszczególnych serii danych miesi cznych wyznacz prognoz naiwn na kolejny miesi c.
a) 115, 119, 126, 131, 136,
b) 1, 4, 12, 24, 72,
c) 125, 120, 110, 115, 120.
Przykład.
Wiedz c, e zjawisko ma charakter sezonowy (r = 4), dla poszczególnych serii danych
kwartalnych wyznacz prognoz naiwn na dwa kolejne kwartały.
a) 150, 200, 160, 120, 170,
b) 150, 220, 190, 170, 200, 270, 240, 220, 270
Metoda redniej globalnej.
y n*+1 =
1
n
n
i =1
yi
Metoda redniej ruchomej.
Metod
t
wykorzystujemy zarówno do wygładzania szeregu czasowego jak i do
prognozowania.
Prognoza jest redni arytmetyczn z k ostatnich obserwacji (k - stała wygładzania).
yt* =
k wyznaczamy tak aby
1 t −1
yi
k i =t − k
2
redni kwadratowy bł d ex post s * =
(
n
1
yt − yt*
n − k t = k +1
minimalny.
Prognoz oceniamy za pomoc
redniego bł du wzgl dnego prognoz przeszłych
n
yt − yt*
1
Ψk =
100%
n − k t = k +1 y t
7
)
2
był
Uwaga.
Gdy k = 1 to metoda naiwna.
Gdy k = n to rednia globalna.
Gdy k du e to rednia ruchoma silniej wygładza szereg czasowy lecz jednocze nie wolniej
reaguje na zmiany poziomu badanego zjawiska.
Gdy k małe to rednia ruchoma szybciej odzwierciedla zmiany zjawiska lecz wi kszy wpływ
wywieraj na ni wahania przypadkowe.
Aby stosowa
redni ruchom powinni my zwykle dysponowa co najmniej kilkunastoma
danymi.
rednia wa ona.
Ustalamy wagi 0 < w1 ≤ w2 ≤ .... ≤ wk < 1
takie, e
k
i =1
wi = 1 (oznacza to, e do
wcze niejszych informacji przywi zujemy mniejsz wag ).
Prognoz wyznaczamy na podstawie wzoru:
*
t +1
y
t
=
wi−t +k yi
i =t −k +1
Model Browna (prosty model wygładzania wykładniczego).
Zwykle stosujemy ten model dla szeregów czasowych o stałym poziomie lub
bardzo słabym trendzie i umiarkowanych wahaniach przypadkowych.
Model pozwala wyznaczy prognoz wg wzoru:
yt∗ = αyt −1 + (1 − α ) yt∗−1 ,
t = 2, 3, ...., n + 1
prognoza jest kombinacj wypukł ( redni wa on ) przeszłej warto ci zjawiska i przeszłej
prognozy. α ∈ 0,1 – parametr wygładzania.
Warto α dobieramy np. na podstawie kryterium najmniejszego bł du redniokwadratowego
prognoz wygasłych s* tzn. min s * (α ) gdzie
α
s* =
2
1 n
yt − y*t ( α )
n t =1
Je li nie mamy mo liwo ci wyznaczenia optymalnej warto ci parametru wygładzania zwykle
zaleca si stosowania warto ci 0,1 – 0,3.
Uwaga
Równowa ny wzór na prognoz w tym modelu ma posta :
yt∗ = yt∗−1 + α ( yt −1 − yt∗−1 )
8
zatem dla małych α prognoza w małym stopniu uwzgl dnia bł d ex post prognoz przeszłych.
Uwaga
Jako warto
y1∗ przyjmujemy jedn z warto ci:
a) pierwsz warto szeregu czasowego, y1∗ = y1 ,
b)
c)
y1 + y 2 + y3
,
3
y + y 2 + y3 + y 4 + y5
redni z pi ciu pocz tkowych warto ci szeregu czasowego, y1∗ = 1
.
5
redni z trzech pocz tkowych warto ci szeregu czasowego, y1∗ =
Model Browna jest rozwini ciem metody rednich wa onych.
Wagi malej wykładniczo przy coraz starszych danych.
Wida to gdy przekształcimy wzór na prognoz w tym modelu:
yn∗ = αyn−1 + (1 − α ) yn∗−1
podstawiaj c yn−1 = αyn−2 + (1 − α ) yn−2 otrzymamy
∗
∗
yn∗ = αyn−1 + (1 − α )(αyn−2 + (1 − α ) yn∗−2 ) = αyn−1 + α (1 − α ) yn−2 + (1 − α ) 2 yn∗−2
nast pnie podstawiaj c yn−2 = αyn−3 + (1 − α ) yn−3 otrzymamy
∗
∗
yn∗ = αyn−1 + α (1 − α ) yn−2 + (1 − α ) 2 (αyn−3 + (1 − α ) yn∗−3 ) =
= αyn−1 + α (1 − α ) yn−2 + α (1 − α ) 2 yn−3 + (1 − α ) 3 yn∗−3
ostatecznie
yn∗ = αyn−1 + α (1 − α ) yn−2 + .... + α (1 − α ) k yn−k +1 + ...
Wagi przy poszczególnych elementach szeregu czasowego
α > α (1 − α ) > .... > α (1 − α ) k > ...
stanowi kolejne wyrazy ci gu geometrycznego o ilorazie 0 < 1 − α < 1 . Dla du ych n ich
suma jest prawie równa 1 bowiem
α + α (1 − α ) + .... + α (1 − α ) k + ... =
α
1 − (1 − α )
=1
Uwaga.
a) je li wygładzenie szeregu czasowego (zwłaszcza dla du ych α) nie jest zadawalaj ce to
mo emy powy sze wygładzanie powtórzy ,
b) chocia dla małych α wygładzenie jest lepsze, to nie zawsze wtedy jest najmniejszy bł d
redniokwadratowy dla prognoz przeszłych, wida to w nast puj cym przykładzie
Przykład (L. Kowalski, „Statystyka”, 2003, 2005), .
Liczba sprzedanych arówek (tys. szt.) w hurtowni „LUMEN” w kolejnych kwartałach lat
1998-2000:
9
37, 36, 34, 33, 34, 33, 35, 34, 35, 33, 34, 36
Badaj c wielko bł du redniokwadratowego dla ró nych warto ci α otrzymamy:
α
bł d
0,1
1,47
0,2
1,39
0,3
1,36
0,4
1,35
0,5
1,35
0,6
1,36
0,7
1,37
0,8
1,38
0,9
1,41
Jak wida najlepsze (z tego punktu widzenia) warto ci α s w przedziale 0,4 ÷ 0,5.
10

Podobne dokumenty