Dobór wartości początkowych w modelu wyrównywania

Transkrypt

Dobór wartości początkowych w modelu wyrównywania
Zeszyty
Naukowe nr 797
Uniwersytetu Ekonomicznego w Krakowie
2008
Artur Lipieta
Katedra Statystyki
Dobór wartości początkowych
w modelu wyrównywania
wykładniczego Browna a wyniki
prognozowania
1. Wprowadzenie
Metoda wyrównywania wykładniczego po raz pierwszy została przedstawiona
w pracy R.G. Browna [1959]. Jest ona jedną z metod adaptacyjnych, uwzględniających m.in. niestałość struktury ekonomicznej i możliwość zmian parametrów
modelu w czasie. W zasadzie jedynym warunkiem koniecznym do poprawnego stosowania modeli adaptacyjnych jest założenie stacjonarności w czasie błędów predykcji. Dzięki temu, że parametry przystosowują się do zaistniałych warunków (nie
są stałe w czasie, choć mogą być stałe w pewnych okresach), nie narażamy się na
ryzyko, iż prognozy będą oparte na modelu zdezaktualizowanym z powodu zmiany
jego postaci analitycznej lub parametrów. Bez wnikania w zależności przyczynowo-skutkowe rozwoju analizowanych zmiennych można budować prognozy nie tylko
dla zmiennych o ustabilizowanym poziomie rozwoju zjawiska, ale także gdy rozwój ten cechuje duża nieregularność i załamania dotychczasowych trendów.
W celu wyznaczenia prognoz szereg czasowy poddaje się wygładzeniu – prognozy są budowane na podstawie wartości wygładzonych. Pojawia się przy tym
problem doboru pierwszej wartości wygładzonego szeregu.
Jeśli nawet prognoza dla danego okresu, w którym nastąpiło zachwianie się lub
załamanie dotychczasowej prawidłowości, nie jest zbyt trafna, to prognozy obliczone dla następnych okresów charakteryzują się zwykle dostatecznym rzędem
dokładności, co jest związane z dużą elastycznością omawianej grupy metod. Stosunkowo duża trafność prognoz oraz nieskomplikowane obliczenia numeryczne
powodują, że metody adaptacyjne znajdują wielu zwolenników. Metodologię i za-
Artur Lipieta
130
stosowania modeli wyrównywania wykładniczego można znaleźć w podręcznikach z zakresu prognozowania oraz wielu artykułach, m.in. w pracach [Malina
1994, Zeliaś 1997, Lipieta 1998, Nowak 1998, Zeliaś, Pawełek i Wanat 2003, Prognozowanie gospodarcze… 2009]
Celem artykułu jest ocena wrażliwości prognoz wygasłych budowanych z jednostkowym realnym wyprzedzeniem czasowym na dobór wartości początkowych
w modelu Browna. Wnioski praktyczne zostały sformułowane na podstawie symulacyjnych oraz rzeczywistych szeregów czasowych o ustalonej długości, uwzględniających różne wartości początkowe wygładzonego szeregu czasowego.
2. Metoda Browna
Metoda wyrównania wykładniczego Browna znajduje zastosowanie dla szeregów czasowych bez wyraźnie zaznaczonego trendu oraz bez wahań sezonowych.
Przyrosty trendu (poza okresami, kiedy nastąpiła zmiana lub załamanie trendu)
powinny być w przybliżeniu stałe lub zmieniać się w sposób regularny.
Szereg czasowy zmiennej prognozowanej wygładza się za pomocą ważonej
średniej ruchomej, przy czym wagi zmieniają się w sposób wykładniczy. Rekurencyjny wzór ma postać:
yˆ1 = y1
yˆt = α ⋅ yt + (1 − α ) ⋅ yˆt −1 dla t > 1
(1)
gdzie:
yt – wartość analizowanej zmiennej w jednostce czasu t,
ŷt – ocena trendu (wartość wygładzona) w jednostce czasu t,
α – stała wygładzania (α ∈ (0, 1))1.
Prognozę (yTP) dla jednostki czasu T uzyskuje się ze wzoru:
yTP = ŷn + h . Δ ŷn (2)
gdzie:
ŷn – ostatnia (najnowsza) ocena trendu,
h – realne wyprzedzenie czasowe prognozy (T = n + h),
Δ ŷn – różnica ostatnich wartości wygładzonych obliczona zgodnie ze wzorem:
Δ yˆn = yˆn − yˆn −1
(3)
Jako ocenę trendu w pierwszej jednostce czasu we wzorze (1) przyjmuje się
zazwyczaj pierwszą wartość rzeczywistą. Za punkt startowy można przyjąć także
1
W literaturze przedmiotu spotyka się także przedział prawostronnie lub obustronnie domknięty.
Dobór wartości początkowych…
131
średnią arytmetyczną z wyrazów całego szeregu czasowego lub też jego fragmentu, np. z kilku pierwszych realizacji zmiennej prognozowanej.
Obliczając wartość wygładzoną dla jednostki czasu t (gdzie t > 1), przyjmuje się,
że jest ona równa średniej ważonej dwóch składników: wartości rzeczywistej zaobserwowanej w jednostce t i poprzedniej wartości wygładzonej obliczonej dla t – 1.
Rolę wag2 odgrywają parametr α i jego dopełnienie do jedynki (1 – α). Determinują one siłę i zasięg oddziaływania wcześniejszych informacji na poziom wygładzenia, a zarazem na prognozy. Im α jest bliższe 1, tym większy wpływ ma najnowsza realizacja zmiennej (otrzymuje się mniejsze wygładzenie zaobserwowanych
wartości zmiennej, używane zwykle w wypadku dużych, gwałtownych zmian wartości obserwacji), im zaś α jest bliższe 0, tym większy wpływ ma poprzednia wartość
wygładzona (większe wygładzenie wartości). Gdy przyjmie się α = 0, wszystkie wartości wygładzone są identyczne, równe przyjętej wartości początkowej ŷ1,
i mamy do czynienia z prognozą naiwną (prognoza jest równa ostatniej znanej realizacji zmiennej). W drugim skrajnym przypadku wartości wygładzone są równe wartościom rzeczywistym, do obliczenia prognoz używa się zaś ich przyrostów absolutnych. Najczęściej stałą wygładzania α wyznacza się w sposób doświadczalny, metodą
kolejnych empirycznych przybliżeń3. Dla różnych wartości parametru α konstruuje
się (w okresie empirycznej weryfikacji) prognozy wygasłe, które następnie porównuje się z rzeczywistymi realizacjami zmiennej. Do budowy „niewygasłej” prognozy
wybiera się taką wartość parametru, dla której prognozy (według przyjętego kryterium) najlepiej aproksymują rzeczywiste realizacje prognozowanej zmiennej.
3. Ocena wrażliwości prognoz wygasłych na wybór wartości
początkowych w metodzie Browna
Jakość prognozy (dla modeli adaptacyjnych) może być określona po upływie
czasu, na który prognoza została wyznaczona, za pomocą mierników dokładności
(trafności) predykcji ex post4. Mogą one pełnić funkcję mierników wrażliwości
prognoz wygasłych na wybór wartości początkowych w metodach adaptacyjnych
(w tym w modelu Browna). Za pomocą tych mierników bada się różnice między
Wagami nazywa się ciąg liczb dodatnich (ew. nieujemnych, jeśli dopuszcza się wagi równe 0)
o sumie równej 1.
2
3
Przyjmując różne wartości stałej wygładzania, np. 0,1, 0,2, …, 0,9.
Dla modeli klasycznych można na ogół określić jakość prognozy już w chwili jej wyznaczania (za pomocą mierników ex ante). Mierniki ex ante mierzą dopasowanie oszacowanego
modelu do danych rzeczywistych i są próbą oceny błędu w prognozach budowanych na okres prognozowany (zakładając, że błąd w prognozach wynikających z oszacowanego modelu będzie tej
samej wielkości).
4
Artur Lipieta
132
wartościami rzeczywistymi a prognozami w przedziale empirycznej weryfikacji
prognoz, tj. w takim przedziale czasowym, w którym istnieją dane rzeczywiste
i prognozy (wygasłe)5.
Wśród mierników dokładności predykcji ex post umożliwiających badanie trafności prognoz w literaturze przedmiotu najczęściej stosuje się dwa:
– średni błąd predykcji ex post, który określa, o ile średnio różnią się realizacje
zmiennej prognozowanej od obliczonych prognoz, określony wzorem
sP =
1
2
yt − ytP ) (
∑
m t ∈ I ep
(4)
gdzie:
Iep – okres empirycznej weryfikacji prognoz,
m – liczba jednostek czasu w Iep,
– względny błąd predykcji ex post:
VsP =
Vs'P =
sP
yt ∈ I ep
sP
ytP∈ I ep
(5)
(6)
określający udział średniego błędu predykcji ex post w przeciętnej rzeczywistej
realizacji zmiennej prognozowanej (5) lub w przeciętnej wartości prognozy (6)
z okresu empirycznej weryfikacji.
W podanych wzorach yt ∈ I ep i ytP∈ I ep oznaczają średnie arytmetyczne, odpowiednio:
wartości rzeczywistych i wartości prognoz wygasłych w okresie empirycznej weryfikacji Iep.
Jeżeli odbiorca prognozy nie poda własnych kryteriów dopuszczalności prognoz, zwykle przyjmuje się, że jeśli względny miernik dokładności predykcji ex
post (5, 6) ma wartość:
– V ≤ 3%, to prognozy są bardzo dobre,
– 3% < V ≤ 5%, to prognozy uznaje się za dobre,
– 5% < V ≤ 10%, to prognozy mogą być jeszcze nazwane dopuszczalnymi
(zależy to głównie od charakteru i znaczenia zmiennej prognozowanej),
– V > 10%, to prognozy są niedopuszczalne.
Prognoza wygasła to prognoza obliczona dla okresu t, dla której jest znana prawdziwa wartość prognozowanej zmiennej.
5
Dobór wartości początkowych…
133
4. Wyniki przeprowadzonych badań
Symulacje komputerowe zostały wykonane w programie Excel pakietu Microsoft
Office 2003, z użyciem generatora liczb pseudolosowych6. Założono stałą długość szeregu czasowego równą 20 jednostkom (n = 20). Wygenerowane dane zostały
poddane (pojedynczemu) wygładzeniu wykładniczemu. Następnie obliczono prognozy wygasłe oraz zbadano ich trafność za pomocą średniego błędu predykcji ex
post (4). Aby znaleźć wartość parametru wygładzenia α, minimalizującą sumę kwadratów różnic między obserwacjami a prognozami (minimalizującą zarazem średni
błąd predykcji ex post oraz względny błąd predykcji ex post – wzory 5 i 6) w okresie empirycznej weryfikacji, obliczeń dokonano kolejno dla różnych wartości parametru wygładzania α ∈ [0; 1], stosując krok równy 0,01 (tj. dla α = 0,00; 0,01; 0,02;
0,03; …; 0,99; 1,00). Przyjmowano różne długości okresu empirycznej weryfikacji
Iep (zawierającego od 2 ostatnich jednostek czasowych: t ∈ Iep(2), do 18 jednostek:
t ∈ Iep(18)), a także różne wartości początkowe wygładzonego szeregu, równe średniej
arytmetycznej z (różnej długości) k pierwszych realizacji zmiennej prognozowanej
(y( k ))7. Obliczenia przeprowadzono dla prognoz budowanych z wyprzedzeniem czasowym równym jednej jednostce, poszukując takiej wartości początkowej ŷ1 , która
minimalizuje w przyjętym okresie weryfikacji średni błąd predykcji ex post.
Szeregi generowano dla różnych rodzajów i parametrów rozkładów: normalnego, jednostajnego oraz logarytmiczno-normalnego, za każdym razem powtarzając obliczenia.
Ze względu na ograniczenia liczby wierszy i kolumn dostępnych w programie Excel oraz
ogromną liczbę przeprowadzanych operacji matematycznych liczbę powtórzeń (analizowanych szeregów) ograniczono do 2000 dla każdego z generowanych rozkładów.
W tabelach 1–8 zaprezentowano wybrane wyniki przeprowadzonych symulacji.
Liczby w tych tabelach określają, ile razy w ciągu 2000 symulacji rozpatrywana
wartość początkowa dawała najlepsze rezultaty. Wartości w nawiasach wskazują,
że różne wartości początkowe, przy ustalonej długości okresu empirycznej weryfikacji, dawały ten sam minimalny średni błąd predykcji ex post (oczywiście niekoniecznie z tym samym parametrem wygładzania α). Wartość 176 (+1) w 5. wierszu od dołu oraz w 4. kolumnie tabeli 4 oznacza np., że średnia arytmetyczna
z trzech pierwszych obserwacji (jako wartość początkowa dla okresu empirycznej
weryfikacji zawierającego 10 ostatnich jednostek czasowych) dała najmniejszy
średni błąd predykcji ex post w 177 (bo 176 + 1 = 177) z 2000 analizowanych szeregów czasowych (generowanych z rozkładu jednostajnego z przedziału [10; 20]),
w tym w jednym przypadku tę samą minimalną wartość średniego błędu pre6
Menu: Narzędzia/Analiza danych/Generowanie liczb pseudolosowych.
Dla szeregu liczącego 20 obserwacji, przy przyjętym realnym wyprzedzeniu czasowym prognozy h = 1, można wyznaczyć maksymalnie 18 prognoz (nie da się wyznaczyć prognoz dla 2
pierwszych jednostek czasowych).
7
Artur Lipieta
134
dykcji co inna wartość początkowa (tę samą co y (5)). Ogólna suma szeregów minimalizujących Sp przy różnych wartościach początkowych mniejsza od 2000 świadczy o tym, że istniały przypadki (ich liczba jest równa dopełnieniu tej sumy do
2000), w których ten sam optymalny rezultat dawały różne wartości początkowe
ŷ 1. Mogło się tak zdarzyć (choć niekoniecznie tylko wtedy), gdy parametrem minimalizującym Sp była któraś z wartości skrajnych, tj. 0 lub 1.
Tabela 1. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna – wyniki symulacji dla 2000 szeregów czasowych o długości 20 obserwacji
generowanych z rozkładu normalnego N(0; 1)
Wartość
początkowa
y1
y (2)
y (3)
y (4)
y (5)
y
Suma
t ∈ Iep(3)
385 (+42)
248 (+43)
231 (+43)
Liczba szeregów minimalizujących Sp
t ∈ Iep(6)
t ∈ Iep(10)
277 (+3)
226 (+1)
236 (+3)
195 (+1)
210 (+3)
t ∈ Iep(18)
81 (+0)
6 (+0)
167 (+1)
68 (+0)
222 (+43)
251 (+3)
172 (+1)
101 (+0)
246 (+43)
221 (+3)
205 (+1)
171 (+0)
625 (+43)
802 (+3)
1034 (+1)
1573 (+0)
Źródło: obliczenia własne.
1957
1997
1999
2000
Tabela 2. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna – wyniki symulacji dla 2000 szeregów czasowych o długości 20 obserwacji
generowanych z rozkładu normalnego N(10; 1)
Wartość
początkowa
y1
386 (+27)
265 (+1)
227 (+0)
t ∈ Iep(10)
t ∈ Iep(18)
y (3)
235 (+29)
226 (+1)
172 (+0)
4 (+0)
212 (+28)
203 (+1)
171 (+0)
81 (+0)
218 (+30)
197 (+1)
182 (+0)
117 (+0)
243 (+31)
244 (+1)
1968
1999
y (2)
y (4)
y (5)
y
Suma
t ∈ Iep(3)
Liczba szeregów minimalizujących Sp
674 (+29)
Źródło: obliczenia własne.
t ∈ Iep(6)
864 (+1)
186 (+0)
1061 (+0)
1999
76 (+0)
158 (+0)
1564 (+0)
2000
Dobór wartości początkowych…
135
Tabela 3. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna – wyniki symulacji dla 2000 szeregów czasowych o długości 20 obserwacji
generowanych z rozkładu normalnego N(100; 2)
Wartość
początkowa
t ∈ Iep(3)
Liczba szeregów minimalizujących Sp
379 (+39)
t ∈ Iep(6)
294 (+3)
t ∈ Iep(10)
t ∈ Iep(18)
284 (+38)
238(+2)
208 (+0)
8 (+0)
200 (+37)
208 (+3)
200 (+0)
80 (+0)
198 (+40)
188 (+3)
165 (+0)
104 (+0)
222 (+40)
224 (+3)
182 (+0)
133 (+0)
y
676 (+40)
845 (+3)
1024 (+0)
1599 (+0)
Suma
1959
1997
2000
2000
y1
y (2)
y (3)
y (4)
y (5)
221 (+0)
76 (+0)
Źródło: obliczenia własne.
Tabela 4. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna – wyniki symulacji dla 2000 szeregów czasowych o długości 20 obserwacji
generowanych z rozkładu jednostajnego [10; 20]
Wartość
początkowa
t ∈ Iep(3)
Liczba szeregów minimalizujących Sp
375 (+31)
t ∈ Iep(6)
269 (+2)
t ∈ Iep(10)
t ∈ Iep(18)
261 (+31)
240(+2)
216 (+0)
6 (+0)
220 (+31)
222 (+2)
176 (+1)
103 (+0)
213 (+31)
202 (+2)
179 (+0)
118 (+0)
239 (+31)
235 (+2)
211 (+1)
197 (+0)
y
661 (+31)
830 (+2)
1019 (+0)
1506 (+0)
Suma
1969
1998
1999
2000
y1
y (2)
y (3)
y (4)
y (5)
Źródło: obliczenia własne.
198 (+0)
70 (+0)
Artur Lipieta
136
Tabela 5. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna – wyniki symulacji dla 2000 szeregów czasowych o długości 20 obserwacji
generowanych z rozkładu jednostajnego [100; 105]
Wartość
początkowa
t ∈ Iep(3)
Liczba szeregów minimalizujących Sp
t ∈ Iep(6)
t ∈ Iep(10)
t ∈ Iep(18)
346 (+36)
280 (+4)
200 (+0)
247 (+36)
225 (+5)
208 (+0)
6 (+0)
267 (+37)
235 (+5)
195 (+0)
99 (+0)
221 (+38)
188 (+5)
195 (+0)
136 (+0)
224 (+36)
215 (+5)
195 (+0)
156 (+0)
y
657 (+38)
852 (+5)
1007 (+0)
1542 (+0)
Suma
1962
1995
2000
2000
y1
y (2)
y (3)
y (4)
y (5)
61 (+0)
Źródło: obliczenia własne.
Tabela 6. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna – wyniki symulacji dla 2000 szeregów czasowych o długości 20 obserwacji
generowanych z rozkładu jednostajnego [0; 1]
Wartość
początkowa
t ∈ Iep(3)
Liczba szeregów minimalizujących Sp
368 (+21)
253 (+4)
t ∈ Iep(6)
t ∈ Iep(10)
t ∈ Iep(18)
256 (+21)
241 (+4)
190 (+0)
3 (+0)
232 (+21)
222 (+4)
183 (+0)
63 (+0)
211 (+21)
225 (+4)
185 (+0)
115 (+0)
238 (+21)
214 (+4)
217 (+0)
181 (+0)
y
674 (+21)
841 (+4)
1029 (+0)
1561 (+0)
Suma
1979
1996
2000
2000
y1
y (2)
y (3)
y (4)
y (5)
Źródło: obliczenia własne.
196 (+0)
77 (+0)
Dobór wartości początkowych…
137
Tabela 7. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna – wyniki symulacji dla 2000 szeregów czasowych o długości 20 obserwacji
generowanych z rozkładu logarytmiczno normalnego lN[0; 1]
Wartość
początkowa
t ∈ Iep(3)
Liczba szeregów minimalizujących Sp
402 (+48)
t ∈ Iep(6)
311 (+10)
t ∈ Iep(10)
t ∈ Iep(18)
282 (+48)
238 (+10)
204 (+4)
6 (+0)
229 (+50)
220 (+10)
159 (+4)
70 (+0)
173 (+47)
185 (+11)
166 (+4)
101 (+0)
235 (+47)
232 (+11)
192 (+4)
144 (+0)
y
629 (+47)
803 (+10)
1038 (+4)
1606 (+0)
Suma
1950
1989
1996
2000
y1
y (2)
y (3)
y (4)
y (5)
237 (+4)
73 (+0)
Źródło: obliczenia własne.
Tabela 8. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna – wyniki symulacji dla 2000 szeregów czasowych o długości 20 obserwacji
generowanych z rozkładu logarytmiczno-normalnego lN[2; 0,4]
Wartość
początkowa
t ∈ Iep(3)
Liczba szeregów minimalizujących Sp
371 (+33)
t ∈ Iep(6)
279 (+5)
t ∈ Iep(10)
t ∈ Iep(18)
277 (+33)
226 (+5)
197 (+0)
4 (+0)
277 (+33)
219 (+5)
162 (+0)
80 (+0)
204 (+33)
192 (+5)
164 (+0)
115 (+0)
240 (+33)
231 (+5)
221 (+0)
169 (+0)
y
648 (+33)
848 (+5)
1027 (+0)
1556 (+0)
Suma
1967
1995
2000
2000
y1
y (2)
y (3)
y (4)
y (5)
Źródło: obliczenia własne.
229 (+0)
76 (+0)
Artur Lipieta
138
W tabeli 9 zamieszczono rezultaty badań empirycznych przeprowadzonych na
podstawie danych finansowych w postaci 21 szeregów czasowych. Ich wykresy
prezentuje rys. 1. Analizowano szeregi złożone z 20 obserwacji: średnich kursów
walut w NBP (1 EUR, 1 USD, 100 HUS, 1 GBP, 1 CHF w dniach od 29 grudnia
2006 r. do 26 stycznia 2007 r.; http://waluty.onet.pl/11,tabele.html), kursów akcji
notowanych na Warszawskiej GPW (KGHM, PKN Orlen, PKO BP, TP SA, BIOTON, BZWBK na zamknięciu sesji od 29 grudnia 2006 r. do 26 stycznia 2007 r.;
http://gielda.onet.pl/a,p,notowania.html, http://www.money.pl/gielda/archiwum/
spolki/) oraz wartości indeksów giełdowych: polskich (WIG, WIG20, TECHWIG,
MIDWIG na zamknięciu sesji od 29 grudnia 2006 r. do 26 stycznia 2007 r.; http://
gielda.onet.pl/notowania.html) i zagranicznych (DAX, FTSE, HANG SENG od
29 grudnia 2006 r. do 26 stycznia 2007 r., Nikkei225 od 26 grudnia 2006 r. do
26 stycznia 2007 r., Dow Jones, NASDAQ od 27 grudnia 2006 r. do 26 stycznia
2007 r.; http://www.money.pl/gielda/swiat/archiwum/).
7
a)
100
90
6
80
5
70
60
4
50
3
40
30
2
20
1
0
10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 EUR
1 USD
100 HLF
1 GBR
1 CHF
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
KGHM
BIOTON
c)
60000
70000
50000
60000
PKN Orlen
PKO BP
TP SA
d)
50000
40000
40000
30000
30000
20000
20000
10000
0
b)
10000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
WIG
DAX
HANG SENG NASDAQ Dow Jones Nikkei225
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
BZWBK
Rys. 1. Wykresy analizowanych szeregów finansowych
Źródło: opracowanie własne.
TECH WIG
MID WIG
WIG 20
FTSE
Dobór wartości początkowych…
139
Tabela 9. Ocena wrażliwości prognoz wygasłych budowanych z wyprzedzeniem
czasowym równym 1 jednostce w okresie empirycznej obserwacji (Iep), równym
ostatnim 3, 6, 10 oraz 18 jednostkom, na dobór wartości początkowych w modelu
Browna na podstawie 21 rzeczywistych szeregów czasowych o długości 20 obserwacji
Wartość
początkowa
Liczba szeregów minimalizujących
t ∈ Iep(3)
t ∈ Iep(6)
t ∈ Iep(10)
t ∈ Iep(18)
y (2)
0 (+3)
1 (+2)
0 (+0)
2 (+1)
3 (+3)
2 (+2)
0 (+0)
5 (+1)
y (4)
2 (+2)
0 (+1)
0 (+0)
0 (+0)
y
y1
y (3)
3 (+2)
4 (+1)
9 (+0)
4 (+0)
y (5)
1 (+2)
1 (+1)
3 (+0)
2 (+0)
Suma
9 (+2)
18
11 (+1)
9 (+0)
7 (+0)
19
21
20
Źródło: obliczenia własne.
Dla szeregów rzeczywistych przeprowadzono podobne obliczenia jak dla szeregów symulacyjnych. Liczby zamieszczone w tabeli 9 określają (zgodnie z przyjętą wcześniej konwencją), ile razy dla 21 rzeczywistych szeregów czasowych rozpatrywana wartość początkowa dawała najmniejszy średni błąd predykcji ex post
Sp oraz (wartości w nawiasach) ile różnych wartości początkowych przy ustalonej
długości okresu empirycznej weryfikacji dawało tę samą minimalną wartość Sp.
W analizowanych szeregach mogły pojawić się trendy (np. dla CHF, WIG).
W celu eliminacji (ewentualnych) trendów liniowych w badanych szeregach można
np. zastosować metodę podwójnego wygładzania lub skorzystać z przyrostów wartości empirycznych (prognozując przyrosty wartości).
5. Wnioski
Odpowiedni dobór wartości początkowych modelu ma duży wpływ na trafność
prognoz otrzymanych za pomocą metody Browna. Jeżeli za pierwszą, początkową
wartość wygładzonego szeregu przyjmie się średnią arytmetyczną ze wszystkich
wyrazów szeregu, to (dla szeregów czasowych o długości 20 obserwacji) obliczone
prognozy, przy realnym wyprzedzeniu równym 1 jednostce czasowej, są statystycznie rzecz biorąc, najbardziej trafne. Znaczenie tak przyjętej wartości początkowej wzrasta wraz z długością przyjętego okresu empirycznej weryfikacji (od
około 30% skuteczności, gdy za Iep przyjęto dwie ostatnie wartości szeregu, do
około 80%, gdy za Iep przyjęto cały badany okres).
Artur Lipieta
140
Drugą w kolejności, najlepszą co do trafności wartością początkową jest wartość pierwszej obserwacji, zwłaszcza gdy rozpatruje się krótki okres empirycznej
weryfikacji prognoz. Najgorsze rezultaty otrzymano, gdy za wartość początkową
przyjęto średnią z dwóch pierwszych realizacji zmiennej. Co ważne, bardzo zbliżone rezultaty otrzymano dla różnych rodzajów i parametrów rozkładów.
Warto podkreślić, że nie analizowano dopuszczalności obliczanych prognoz
(wygasłych). Poszukiwane były jedynie wartości początkowe, dla których (przy
przyjętych ograniczeniach) średniokwadratowy błąd prognoz wygasłych przyjmował najmniejsze wartości. Otrzymane prognozy mogły zatem nie być dopuszczalne.
W analizowanych szeregach mogły pojawić się trendy, zwłaszcza w wypadku
szeregów czasowych zawierających dane rzeczywiste8. Dlatego zapewne otrzymano nieco mniejszą użyteczność średniej arytmetycznej jako wartości początkowej, gdy brano pod uwagę rzeczywiste szeregi czasowe (por. tabela 9). Liczba
rozpatrywanych szeregów wartości rzeczywistych była jednak zbyt mała, aby
można było na tej podstawie sformułować dalej idące wnioski.
Spostrzeżenia te upoważniają do stwierdzenia, że warto przeprowadzać podobne
symulacje dla innych modeli adaptacyjnych oraz kontynuować badania dla modelu
Browna przy prognozach budowanych z realnym wyprzedzeniem czasowym równym 2–3 jednostkom i dla różnej długości analizowanego szeregu czasowego.
Literatura
Brown R.G. [1959], Statistical Forecasting for Inventory Control, McGraw-Hill, New
York.
Lipieta A. [1998], Prognozowanie cen na giełdach towarowych, „Wiadomości Statystyczne”, nr 6, GUS, Warszawa.
Malina A. [1994], Prognozowanie zjawisk ekonomicznych w oparciu o metody wykładniczego wygładzania szeregów czasowych, Zeszyty Naukowe Akademii Ekonomicznej
w Krakowie, nr 440, Kraków.
Nowak E. [1998], Prognozowanie gospodarcze. Metody, modele, zastosowania, przykłady, Agencja Wydawnicza Placet, Warszawa.
Prognozowanie gospodarcze. Metody i zastosowania [2005], red. M. Cieślak, wyd. 4 zm.
i uaktualnione, Wydawnictwo Naukowe PWN, Warszawa.
Zeliaś A. [1997], Teoria prognozy, wyd. 3, PWE, Warszawa.
Zeliaś A., Pawełek B., Wanat S. [2003], Prognozowanie ekonomiczne. Teoria, przykłady,
zadania, Wydawnictwo Naukowe PWN, Warszawa.
8
W szeregach z danymi generowanymi prawdopodobieństwo pojawienia się trendu jest małe.
Dobór wartości początkowych…
141
Selection of Initial Values in Single Exponential Smoothing Method
and Forecasting Results
For Brown’s single exponential smoothing method, the author conducted a simulation
analysis whose purpose was to test the impact of the choice of initial values on forecasting
results. The simulation tests carried out for the established sample size (n = 20), and with
changing distribution types and parameters, showed that the most accurate forecasts built
for one period “ahead” are most frequently obtained when the arithmetic mean of all the
observations of the analysed series are adopted as the first smoothed value.

Podobne dokumenty