HSC Research Rep

Transkrypt

HSC Research Rep
HSC Research Report
HSC/13/17
Short-term forecasting
of electricity spot prices
using model averaging
(Krótkoterminowe prognozowanie
spotowych cen energii elektrycznej
z wykorzystaniem uśredniania
modeli)
Jakub Nowotarski
Hugo Steinhaus Center, Wrocław University
of Technology, Poland
Hugo Steinhaus Center
Wrocław University of Technology
Wyb. Wyspiańskiego 27, 50-370 Wrocław, Poland
http://www.im.pwr.wroc.pl/~hugo/
POLITECHNIKA WROCŠAWSKA
WYDZIAŠ PODSTAWOWYCH PROBLEMÓW TECHNIKI
KIERUNEK: Matematyka
SPECJALNO‘‚: Matematyka Finansowa i Ubezpieczeniowa
PRACA MAGISTERSKA
Krótkoterminowe prognozowanie spotowych
cen energii elektrycznej z wykorzystaniem
u±redniania modeli
AUTOR:
Jakub Nowotarski
PROMOTOR:
dr hab. Rafaª Weron, prof. PWr
OCENA PRACY:
WROCŠAW 2013
Spis treści
1
Wstęp
2
2
Spotowe ceny energii elektrycznej
2.1 Giełdy energii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Podstawowe własności i modelowanie cen spotowych . . . . . . . . . . .
2.2.1 Sezonowość . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Powracanie do średniej . . . . . . . . . . . . . . . . . . . . . . .
2.2.3 Piki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Zbiory danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Nord Pool 1998-1999 . . . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Nord Pool 2009-2010 . . . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Pennsylvania-New Jersey-Maryland Interconnection (2010-2012)
4
4
4
4
5
6
7
7
9
10
3
Prognozowanie cen spotowych
3.1 Wprowadzenie . . . . . . . . . . . . . . . . . . . .
3.2 Modele prognozowania krótkoterminowego . . . . .
3.2.1 Podstawowy model autoregresji . . . . . . .
3.2.2 Modele wstępnie przetworzone . . . . . . . .
3.2.3 Modele progowe . . . . . . . . . . . . . . .
3.2.4 Procesy powracające do średniej ze skokami
3.2.5 Modele semiparametryczne . . . . . . . . .
.
.
.
.
.
.
.
11
11
12
12
12
13
13
14
4
Uśrednianie modeli
4.1 Metody uśredniania modeli . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Średnia arytmetyczna . . . . . . . . . . . . . . . . . . . . . . . .
4.1.2 Metody oparte o metodę najmniejszych kwadratów . . . . . . . .
4.1.3 Metody oparte o miary błędu prognozy . . . . . . . . . . . . . .
4.1.4 Uśrednianie Bayesowskie . . . . . . . . . . . . . . . . . . . . . .
4.2 Prognozowanie i pomiar jego dokładności . . . . . . . . . . . . . . . . .
4.3 Wyniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Nord Pool 1998-1999 . . . . . . . . . . . . . . . . . . . . . . . .
4.3.2 Nord Pool 2009-2010 . . . . . . . . . . . . . . . . . . . . . . . .
4.3.3 Pennsylvania-New Jersey-Maryland Interconnection (2010-2012)
16
16
17
17
18
19
20
21
21
25
28
5
Podsumowanie
33
6
Bibliografia
35
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
Wstęp
W zagadnieniu prognozowania badacze często mają do czynienia z różnorodnymi predyktorami, opisującymi tę samą wartość. W takiej sytuacji pojawia się pytanie, jak optymalnie wykorzystać te informacje. Innymi słowy, należy rozstrzygnąć, czy korzystniej jest
jako predyktor wybrać jedną z dostępnych metod, czy może skorzystać z nich wszystkich
i używając odpowiednich wag, skonstruować na ich podstawie nowy model? To drugie
podejście nazywamy uśrednianiem modeli – na przestrzeni ostatnich kilkudziesięciu lat,
począwszy od prac Barnarda [2] oraz Batesa i Grangera [3], zyskało szerokie uznanie w
literaturze. Szczególnie duże zastosowanie tej techniki obserwujemy w prognozowaniu
PKB, inflacji, zmienności na rynkach finansowych, danych meteorologicznych, czy nawet
wyników meczów piłkarskich lub ryzyka politycznego [6].
Jednakże, istnieje stosunkowo niewiele publikacji dotyczących zastosowań uśredniania modeli dla rynków energii elektrycznej. Rynki te są z pewnością interesujące z perspektywy matematyki finansowej. Fakt ten wynika ze zmian strukturalnych, które miały
miejsce w wielu rozwiniętych krajach począwszy od lat 90. ubiegłego wieku. Postępująca
liberalizacja rynków wymusiła zmiany w obrocie tym towarem. Obecnie ceny ustalane są
na podstawie popytu i podaży, co w konsekwencji powoduje, że proces cen energii elektrycznej wykazuje pewne unikalne cechy, niespotykane na innych rynkach towarowych lub
finansowych.
Energia elektryczna, sprzedawana i kupowana obecnie po cenach rynkowych, jest towarem specyficznym. Brak efektywnych możliwości jej przechowywania prowadzi do bardzo wysokiej zmienności cen na rynku hurtowym, sięgającej nawet 50% w skali dnia, czyli
więcej niż jakikolwiek inny towar [19]. W dodatku, zapotrzebowanie na energię elektryczną jest silnie zależne od cykli pogodowych i biznesowych. Tym samym, potencjalne błędy
prognoz zapotrzebowania oraz cen energii elektrycznej przekładają się na duże koszty
późniejszej odsprzedaży lub dokupienia jej na rynku bilansującym i mogą prowadzić do
ogromnych strat finansowych. Wszystko to wymusza na uczestnikach rynku konieczność
zabezpieczania się przed ryzykiem.
Prognozowanie krótkoterminowe, które jest tematem niniejszej pracy, dotyczy horyzontu czasowego obejmującego okres od kilku godzin do kilku dni i z punktu widzenia
uczestnika rynku jest istotne przy przeprowadzaniu bieżących transakcji. Stąd właśnie wynika potrzeba rozwijania technik prognozowania, z których jedną z popularniejszych jest
analiza statystyczna szeregów czasowych. W literaturze możemy spotkać wiele metod powstałych w oparciu o autoregresję, np. modele ARIMA lub Seasonal ARIMA (SARIMA),
modele ARX, czyli autoregresja z uwzględnieniem zmiennej zewnętrznej (fundamentalnej) lub modele przełącznikowe (ang. treshold autoregressive, TAR). Ponadto, występują
także różne rodzaje procesu powracającego do średniej, procesy powracające do średniej
ze skokami (ang. mean–reverting jump–diffusion), modele ARCH i GARCH, czy wresz-
2
cie markowskie modele zmieniające stany (ang. Markov regime-switching). Wymienione
metody to jedynie najbardziej popularne podejścia z dziedziny szeregów czasowych i procesów stochastycznych. Dokładniejszy przegląd modeli, wraz z odniesieniami do prac, w
których są one stosowane, znajduje się w [19].
Celem niniejszej pracy jest analiza wybranych metod uśredniania modeli na przykładzie cen spotowych energii elektrycznej. W obliczu wielu metod prognozowania pożądanym rezultatem jest określenie skutecznego sposobu uśredniania, tj. przydzielenie odpowiednich wag poszczególnym (pojedynczym) metodom bazowym. Innymi słowy postaramy się wykorzystać różne predyktory do skonstruowania nowego, skuteczniejszego.
Praca składa się z pięciu rozdziałów. Rozdział drugi przedstawia pokrótce najważniejsze cechy charakterystyczne cen energii elektrycznej. Zaczyna się on krótkim przedstawieniem zasad działania rynku, po czym wymienione zostały podstawowe własności modelowania cen spotowych. Również tam znajdują się opisy wykorzystanych zbiorów danych.
Rozdział trzeci poświęcony jest prognozowaniu cen spotowych. Zawiera on opis bazowych
metod prognozowania przy użyciu modeli szeregów czasowych, które będą punktem wyjścia przy procedurach uśredniania. Kolejny rozdział skupia się na uśrednianiu modeli. Po
przedstawieniu definicji wykorzystanych metod, zawiera on opis schematu prognozowania
wraz z używanymi miarami dokładności prognoz. Rozdział kończy się przedstawieniem
wyników analiz numerycznych i ich opisem. Ostatni rozdział podsumowuje całą pracę.
3
2
2.1
Spotowe ceny energii elektrycznej
Giełdy energii
W wyniku liberalizacji sektora elektroenergetycznego w wielu krajach utworzone zostały giełdy energii, czyli platformy obrotu tym towarem. Handel odbywa się w odniesieniu
do danej godziny (czasem półgodziny), a uczestnicy rynku składają oferty z odpowiednim
wyprzedzeniem. Tym samym rynek podzielony jest na 24 aukcje godzinowe (lub 48 aukcji
półgodzinnych). Ponadto, brak możliwości magazynowania energii elektrycznej i konieczność bilansowania w czasie rzeczywistym powodują, że obrót nią jest diametralnie różny
od obrotu innymi towarami. Rolą giełdy energii jest ustalenie rynkowej ceny rozliczeniowej (inaczej ceny spotowej) na podstawie ofert złożonych przez uczestników rynku. Cena
spotowa energii elektrycznej w rzeczywistości dotyczy rynku dnia następnego, co różni
ten rynek od klasycznych rynków spotowych. Rynkową cenę rozliczeniową definiujemy
jako punkt przecięcia krzywych podaży i popytu.
Poza rynkiem spotowym występuje też rynek terminowy, na którym ma miejsce obrót
instrumentami pochodnymi na energię elektryczną. Podobnie jak na innych rynkach finansowych występują tam np. kontrakty futures lub opcje. Handel tymi instrumentami ułatwia
uczestnikom rynku zarządzanie ryzykiem i zabezpieczanie się przed niepożądanymi z ich
punktu widzenia cenami.
Poza rynkiem regulowanym, wiele transakcji opiera się na umowach dwustronnych.
Taki rynek nazywamy bilateralnym lub pozagiełdowym (ang. Over–The–Counter, OTC).
W przeciwieństwie do transakcji, które mają miejsce na giełdach energii, strony w umowie
bilateralnej nie mają obowiązku upubliczniać szczegółów transakcji. Mimo, że istnieją
platformy obrotu pozagiełdowego, służą one jedynie jako tablica ofert i nie pełnią roli
giełd.
2.2
Podstawowe własności i modelowanie cen spotowych
Zbudowanie dobrego modelu opisującego zachowanie cen spotowych energii elektrycznej bez uprzedniego zrozumienia pewnych ich własności jest trudne. Co istotne, niektóre
z nich mocno różnią się od specyfiki innych rynków towarowych i finansowych. Za najbardziej charakterystyczne cechy rynku energii uważa się: sezonowość, powracanie do
średniej oraz piki. Te ostatnie w dużej mierze wpływają na bardzo wysoką zmienność cen
spotowych.
2.2.1
Sezonowość
Na rynkach energii elektrycznej proces kształtowania się cen jest silnie zależny od zapotrzebowania, które zawiera okresowe fluktuacje. Czynniki, które się do tego przyczyniają to m.in. temperatura i długość dnia astronomicznego. W danych zapotrzebowania na
4
energię elektryczną obserwujemy również silne okresowości tygodniowe i dzienne. Jednak największym wyzwaniem jest z pewnością modelowanie komponenty długoterminowej sezonowości (ang. long–term seasonal component, LTSC). Na większości rynków nie
obserwujemy wyraźnych okresowości rocznych, co poddaje w wątpliwość użyteczność
metod opartych na regularnych funkcjach trygonometrycznych. Przykładowa długoterminowa funkcja sezonowości została zaznaczona na rysunku (1).
Dokładne opisanie długoterminowego trendu jest niezwykle istotne przy modelowaniu
cen energii. Standardowym podejściem jest rozbicie wyjściowego szeregu czasowego Pt ,
reprezentującego ceny spotowe, na składniki:
Pt = Tt + st + Xt ,
gdzie Tt odpowiada za sezonowość długoterminową, st reprezentuje okresowości krótsze,
nie dłuższe niż tydzień, natomiast Xt jest procesem stochastycznym opisującym losowy
charakter zjawiska.
Źle wyestymowana komponenta sezonowa doprowadzi nas do całkowicie odmiennych
procesów stochastycznych Xt i w konsekwencji do być może błędnych wniosków na temat
specyfiki procesu cen. Spośród wielu metod estymowania i prognozowania komponenty
sezonowej należy z pewnością wyróżnić trzy podejścia: funkcje przedziałami (np. miesiącami) stałe (ang. dummies), funkcje trygonometryczne, oraz falki. Jak pokazują ostatnie
badania [15], ostatnie z tych trzech podejść wydaje się być najrozsądniejsze zarówno jeśli
chodzi o dopasowanie sezonowości do wyjściowego szeregu czasowego, jak i przy prognozowaniu w okresie do jednego roku. Niemniej jednak, kiedy skupiamy się na prognozach
krótkoterminowych, często modelowanie komponenty sezonowej jest pomijane. Również
w tej pracy zastosujemy takie podejście.
2.2.2
Powracanie do średniej
Podobnie jak inne towary, ceny energii elektrycznej uważane są za powracające do średniej. Fakt ten wydaje się mieć intuicyjne uzasadnienie: wyższe ceny wymuszają na producentach energii elektrycznej uruchomienie dodatkowych źródeł, co z kolei po pewnym
czasie może doprowadzić do sytuacji, w której podaż przewyższa popyt. Tym samym na
rynku dojdzie wtedy do spadku cen. Kwestią dyskusyjną może być jedynie szybkość powrotu do średniej. Zauważmy również, że przy takiej własności proces cen energii elektrycznej powinien być opisywany procesami stochastycznymi, które taką własność posiadają, jak np. proces Orsteina–Uhlenbecka, znany również w matematyce finansowej jako
model Vasička, który w czasie dyskretnym jest procesem autoregresji rzędu 1.
5
250
Cena spotowa
Komponenta sezonowa
Cena PJM [USD/MWh]
200
150
100
50
0
0
200
400
600
800
1000
1200
Dni [Sty 1, 2006 − Kwi 28, 2011]
1400
1600
1800
Rys. 1: Średnie dzienne ceny spotowe dla rynku PJM w okresie 1.01.2006–28.04.2011. Na
czerwono została zaznaczona komponenta sezonowa (LTSC) wyestymowana przy użyciu
dyskretnej transformaty falkowej. Na wykresie wyraźnie widać piki cenowe, które występują na tyle często, że nie można ich pominąć podczas modelowania. Proces ceny spotowej
jest uważany również za powracający do średniej – istotnie, jak widzimy, ceny na przestrzeni kilku lat utrzymują się na podobnym poziomie.
2.2.3
Piki
Ostatnią i być może najbardziej charakterystyczną cechą cen energii elektrycznej są tzw.
piki cenowe, które występują na większości giełd energii. Takie zachowanie cen energii
elektrycznej skutkuje niespotykaną na innych rynkach finansowych zmiennością. W skali
dziennej odchylenie standardowe zwrotów z cen sięga nawet 50%, podczas gdy dla innych
rynków zazwyczaj nie przekracza ona 4% [19]. Na szerszej skali czasowej zmienność cen
nie jest już aż tak duża, co niejako wynika z własności powracania do średniej. Piki cenowe
występują często przy współudziale ekstremalnych warunków pogodowych i wysokiego
zapotrzebowania na energię elektryczną. Zdarzenia te mają miejsce w różnych okresach
dla różnych części świata – np. w Skandynawii skoki cen zdarzają się najczęściej w zimie, a w Stanach Zjednoczonych i Australii w lecie. Bezpośrednią przyczyną występowania pików cenowych jest brak możliwości składowania energii elektrycznej oraz strategie
uczestników rynku przy składaniu ofert na giełdach energii. Dla wielu przedsiębiorstw
rynkowych energia jest towarem kluczowym, dlatego też tak istotne dla nich jest utrzyma6
nie ciągłości dostaw. Tym samym, niektórzy uczestnicy rynku są skłonni zapłacić każdą
cenę w celu utrzymania dostaw.
Co ciekawe, ekstremalne ceny energii elektrycznej zazwyczaj nie utrzymują się zbyt
długo. Najczęściej już po kilku godzinach cena wraca do wcześniejszego, stosunkowo niskiego poziomu. Występowanie skoków cenowych nie jest przy tym jednorodne w czasie.
Wprawdzie zazwyczaj zdarzenia te obserwujemy w godzinach szczytu, gdy zapotrzebowanie na energię elektryczną jest największe, jednak i od tej reguły zdarzają się wyjątki.
Rysunek 1 pokazuje, że piki są wyraźne, nawet gdy rozważymy średnie dobowe ceny spotowe.
Piki stanowią wyzwanie z punktu widzenia modelowania cen energii elektrycznej. Ich
właściwa identyfikacja wpływa na poprawność stosowanego modelu. Problem jednak w
tym, że w literaturze trudno spotkać formalną definicję skoku cenowego. Dyskusję na ten
temat wraz z narzędziami do identyfikacji ekstremalnych zachowań procesu cen spotowych można znaleźć w [12].
2.3
Zbiory danych
W niniejszej pracy wykorzystano szeregi czasowe spotowych cen energii z dwóch rynków energii: skandynawskiego Nord Pool w dwóch okresach: 1998-1999 oraz 2009-2010
i amerykańskiego Pennsylvania-New Jersey-Maryland Interconnection (PJM) w okresie
2010-2012. Pierwszy z trzech zbiorów danych pochodzi z pracy [14], a pozostałe dwa
stanowią stosunkowo szerokie uzupełnienie, co pozwoli na numeryczną analizę uśredniania modeli dla rynków w różnych warunkach i w efekcie uczyni wnioski z badań nieco
bardziej ogólnymi.
2.3.1
Nord Pool 1998-1999
Dane pochodzą ze skandynawskiej giełdy energii i zawierają godzinowe rynkowe ceny rozliczeniowe (ang. market clearing price) oraz temperaturę w okresie 2.04.1998-5.12.1999.
Szereg czasowy powstał na podstawie danych publikowanych przez operatora giełdy energii (www.nordpool.com) i Szwedzkiego Instytutu Meteorologii i Hydrologii (www.smhi.se).
Przez temperatury rozumiemy tutaj średnie z obserwacji godzinowych dla skandynawskich miast: Bergen, Helsinki, Malmö, Sztokholm, Oslo i Trondheim. Pierwsze 39 tygodni danych zostało wykorzystanych do kalibracji modeli. Temperatura została wykorzystana jako zmienna zewnętrzna (fundamentalna). Na rysunku 2 widzimy specyfikę rynku
skandynawskiego – ceny spotowe energii elektrycznej są najwyższe przy najniższych temperaturach. W odniesieniu do pracy źródłowej, z której pochodzi analiza prognozowania
krótkoterminowego z wykorzystaniem wcześniej wspomnianych modeli, w niniejszym badaniu rozszerzono okres prognozy do 44 tygodni. W pracy Misiorka i Werona [14] składał
się on z czterech okresów, które mniej więcej odpowiadały poszczególnym porom roku. W
7
Cena NP [NOK/MWh]
500
Prognoza
(tygodnie 1−44)
400
300
200
100
0
Kwi 2, 1998
Lut 1, 1999
Godziny [Kwi 2, 1998 − Gru 5, 1999]
Gru 5, 1999
Temperatura [oC]
30
Prognoza
(tygodnie 1−44)
20
10
0
−10
Kwi 2, 1998
Lut 1, 1999
Godziny [Kwi 2, 1998 − Gru 5, 1999]
Gru 5, 1999
Cena NP [EUR/MWh]
400
300
Prognoza
(tygodnie 1−30)
200
100
0
Lut 2, 2009
Lis 30, 2009
Godziny [Lut 2, 2009 − Cze 27, 2010]
Cze 27, 2010
100
Temperatura [oF]
80
Prognoza
(tygodnie 1−30)
60
40
20
0
Lut 02, 2009
Lis 30, 2009
Godziny [Lut 02, 2009 − Cze 27, 2010]
Cze 27, 2010
Rys. 2: Ceny energii elektrycznej dla giełdy energii elektrycznej Nord Pool wraz z temperaturami dla okresów 2.04.1998-5.12.1999 oraz 2.02.2009-27.06.2010. Oba okresy czasu
różnią się skalami i jednostkami w jakich mierzone są zarówno cena spotowa jak i temperatura. Pionowa przerywana linia symbolizuje początek okresu kalibracji dla modeli
uśrednionych, a prostokąty w prawych częściach wykresów oznaczają przedziały prognozy.
8
Cena PJM [USD/MWh]
600
500
400
300
Prognoza
(tygodnie 1−30)
200
100
0
Sie 22, 2010
Cze 19, 2011
Godziny [Sie 22, 2010 − Sty 14, 2012]
Sty 14, 2012
Temperatura [oF]
100
80
60
Prognoza
(tygodnie 1−30)
40
20
0
Sie 22, 2010
Cze 19, 2011
Godziny [Sie 22, 2010 − Cze 14, 2012]
Sty 14, 2012
Rys. 3: Ceny energii elektrycznej dla giełdy energii elektrycznej PJM w okresie
22.08.2010-14.01.2012 wraz z temperaturą. Pionowa przerywana linia symbolizuje początek okresu kalibracji dla modeli uśrednionych, a prostokąty w prawych częściach wykresów oznaczają przedziały prognozy.
niniejszym badaniu, wykorzystano okres począwszy od początku pierwszego przedziału
z tamtej pracy, kończąc wraz z końcem ostatniego z nich.
2.3.2
Nord Pool 2009-2010
Kolejny zbiór danych dotyczy ponownie rynku skandynawskiego. Tym razem rozpatrujemy nowsze obserwacje, które pochodzą z okresu 2.02.2009-27.06.2010. Ponownie bierzemy pod uwagę godzinowe spotowe ceny energii elektrycznej oraz temperaturę. Tym
razem ceny zostały przedstawione w Euro za Megawatogodzinę, a nie jak poprzednio w
koronach norweskich, więc by uzyskać podobną skalę, należałoby przemnożyć ten szereg
czasowy mniej więcej przez 8. Rysunek 2 pokazuje tym samym, że piki, które obserwujemy dla tego zbioru danych w okresie prognozy, są wyraźnie wyższe niż te, które występowały w latach 1998-1999. Temperatura mierzona jest tym razem w skali Fahrenheita.
Ponadto, zastosowano przekształcenie postaci: Tt = log(Tt + minTt + 1). Jest to konsekwencją pewnych wstępnych analiz, które wykazały, że takie właśnie podejście zwraca
nam nieco dokładniejsze prognozy. Tym razem temperatura otrzymana została z uśrednienia godzinowych obserwacji w następujących miastach: Kopenhaga, Helsinki, Oslo,
Sztokholm i Trondheim. Zbiór danych pochodzi z serwisu NOAA (National Climatic Da9
ta Center, www.ncdc.noaa.gov). Okres kalibracji jest ponownie długości 39 tygodni, natomiast przedział, w którym liczymy prognozy dla tego zbioru danych jest nieco krótszy
niż poprzednio i wynosi 30 tygodni.
2.3.3
Pennsylvania-New Jersey-Maryland Interconnection (2010-2012)
Ostatni z analizowanych zbiorów pochodzi ze wschodniego wybrzeża Stanów Zjednoczonych w okresie 22.08.2010-14.01.2012. Dane zawierają strefowe godzinowe ceny rozliczeniowe rynku dnia następnego (ang. day-ahead locational marginal price) dla strefy
PJM JCPL (Jersey Central Power and Light Company i temperatury dla Nowego Jorku,
obie mierzone co godzinę. Szereg czasowy powstał w oparciu o dane publikowane przez
EDF Suez (www.gdfsuezenergyresources.com) i serwis NOAA (National Climatic Data
Center, www.ncdc.noaa.gov). Jako zmienną zewnętrzną wykorzystano tym razem logarytmy temperatur w skali Fahrenheita. Nie były konieczne bardziej złożone przekształcenia,
ponieważ wszystkie obserwacje były większe niż 1o F . Tak samo jak dla dwóch poprzednich zestawów danych, modele szeregów czasowych kalibrujemy na okresie 39 tygodni w
pierwszym kroku i w kolejnych dniach okres ten rozszerzamy. Okno prognozy, tak samo
jak dla zbioru Nord Pool 2009-2010, jest długie na 30 tygodni. Wykresy ceny rynkowej
energii elektrycznej, jak i zmiennej zewnętrznej dla rynku PJM zostały przedstawione na
rys. 3.
10
3
3.1
Prognozowanie cen spotowych
Wprowadzenie
Pierwszym krokiem analizy jest obliczenie prognoz metodami bazowymi. Literatura wskazuje wiele modeli do prognozowania krótkoterminowego cen spotowych. Szeroki przegląd
dostępnych metod znajduje się w [19]. Nie sposób jednak znaleźć podejście dominujące,
czy też funkcjonujące lepiej od innych niezależnie od badanego rynku energii.
W niniejszej pracy skorzystamy z metod analizowanych przez Misiorka i Werona [14].
Autorzy w swej publikacji przeanalizowali w sumie 12 różnych modeli szeregów czasowych: AR/ARX, pAR/pARX (modele AR/ARX, które zostały wstępnie przetworzone
pod kątem eliminacji obserwacji ekstremalnych, ang. preprocessed), progowe AR/ARX,
dwie klasy semiparametrycznych modeli AR/ARX oraz procesy powracające do średniej
ze skokami. Dla wszystkich danych dotyczących cen spotowych zastosowano transformację logarytmiczną: pt = log(Pt ). Dla dwóch z trzech zbiorów danych w podobny sposób przekształcono temperatury, z niewielkim wyjątkiem dla rynku Nord Pool w okresie
2009-2010 (szczegóły znajdują się w punkcie 2.3.2). Nałożenie logarytmu na ceny spotowe energii elektryczne pozwala na uzyskanie stabilniejszej wariancji i bardziej symetrycznego rozkładu rozpatrywanego szeregu czasowego. Z danych usunięto ich średnie,
tak by były skoncentrowane wokół zera. Podobnie jak w pracy [14], prognozy wyliczane były oddzielnie dla każdej godziny z doby. Dokładniej rzecz ujmując, wyjściowe dane
zostały podzielone na 24 krótsze szeregi czasowe. W celu uzyskania zależności między
nimi, na prognozowany logarytm ceny spotowej pt wpływa minimum cen z poprzedniego
dnia. Ponadto, pozostałymi zmiennymi od których zależy pt są cena spotowa dla analogicznej godziny z dwóch poprzednich dni oraz sprzed tygodnia. Ostatnie parametry dotyczą uwzględnienia sezonowości tygodniowej – w tym celu model zawiera indykatory
(ang. dummies) poszczególnych dni tygodnia. Ponieważ poszczególne dni robocze niewiele różnią się między sobą, liczbę tych parametrów ograniczono do 3: po jednym dla
poniedziałku, soboty i niedzieli. Dlaczego wyróżniamy tylko 3 spośród 7 dni? Autorzy
pracy [14] przekonują, że wynika to z istotności parametrów modelu – jak czytamy, parametry dla pozostałych czterech dni były statystycznie nieistotne.
Tak jak w pracy [14], do prognozowania zastosowano rozszerzające się okno kalibracji. W pierwszym kroku dla wszystkich zbiorów danych jest ono długości 273 dni, czyli 39
tygodni. W jednym kroku prognozy (jeden dzień w danych) prognozujemy jednocześnie
wszystkie 24 godziny, każdą oddzielnym predyktorem. Wyjściowy model nie zmienia się
w czasie, jedynie jego parametry są estymowane na nowo w kolejnych krokach. Być może
nie jest to wzorcowe podejście z punktu widzenia analizy statystycznej szeregów czasowych, ponieważ pomijamy kilka istotnych kroków jak np. sprawdzanie stacjonarności, wyznaczanie rzędu modelu, czy wreszcie testowanie residuów. Jednakże, celem badania nie
jest znalezienie dokładnie dopasowanego modelu, a przetestowanie wielu różnych metod.
11
Wykorzystane modele są niejako kompromisem pomiędzy statystyczną poprawnością, a
złożonością obliczeń i nadmierną liczbą parametrów. Fakt, że pochodzą one z pracy opublikowanej w prestiżowym czasopiśmie najlepiej świadczy o tym, że nie ma podstaw do
ich kwestionowania.
3.2
Modele prognozowania krótkoterminowego
Przedstawimy teraz wykorzystane metody prognozowania, które następnie posłużą nam
za bazę przy uśrednianiu modeli. Jak wspomniano wcześniej wszystkie one pochodzą z
publikacji [14]. W niniejszym podrozdziale jedynie pokrótce przedstawimy używane modele. Szersza dyskusja na ich temat nie jest tematem tej pracy.
3.2.1
Podstawowy model autoregresji
Podstawowy model autoregresjii zawiera 8 parametrów. Na nasz predyktor wpływają: ceny spotowe z dwóch dni poprzednich i sprzed 7 dni, we wszystkich przypadkach dla tej
samej godziny co prognozowana, minimum ceny w całym poprzednim dniu, indykatory
dni tygodnia oraz zmienna zewnętrzna (fundamentalna). Ta ostatnia jest w naszych analizach temperaturą (bądź jej funkcją) w tej samej godzinie, dla której prognozujemy cenę,
co można traktować jako prognozę temperatury (zawsze dokładną) wykonaną 24 godziny
wcześniej.
Nasz model jest postaci:
pt = φ1 pt−24 + φ2 pt−48 + φ3 pt−168 + φ4 mpt +
+ψ1 zt + d1 DM on + d2 DSat + d3 DSun + εt .
(1)
Model ten oznaczymy jako ARX. Zmienne pt−24 , pt−48 , pt−168 są cenami obserwowanymi
(dla tej samej godziny, dla której prognozujemy) i odpowiadają za część autoregresyjną
modelu. Zmienna mpt to minimum ceny z całego poprzedniego dnia – wprowadza ona zależność wszystkich dobowych prognoz, które, przypomnijmy, prognozujemy oddzielnie.
Kolejne zmienne, tj. DM on , DSat , DSun , są indykatorami poszczególnych dni tygodnia
(odpowiednio poniedziałku, soboty i niedzieli) i w modelu reprezentują sezonowość tygodniową. Wreszcie, zt jest zmienną zewnętrzną, a εt białym szumem. Zauważmy, że jeśli
za odpowiadający jej parametr ψt położymy 0, to otrzymamy zwykły model autoregresji,
który oznaczymy jako AR.
3.2.2
Modele wstępnie przetworzone
Kolejne dwa modele dotyczą pewnej transformacji pików cenowych w danych. Ponieważ,
jak wspomniano w punkcie 2.2.3, te ekstremalne zachowania są najczęściej tymczasowe,
12
sensownym podejściem mogłoby być wygładzenie szeregu czasowego poprzez wytłumienie obserwacji odstających. W przeciwnym razie wpływałyby one negatywnie na nasze
prognozy. Wprowadźmy zatem pewien ustalony limit ceny T . Następnie dla obserwacji,
które go przekraczają (przed zlogarytmowaniem), tj. dla Pt > T stosujemy przekształcenie Pt = T + T log10 ( PTt ).
Po zastosowaniu takiej transformacji, korzystamy z równania (1). Ponownie rozpatrujemy dwie możliwości: model bez lub z zmienną zewnętrzną zt . Modele te oznaczymy
jako pAR i pARX odpowiednio.
3.2.3
Modele progowe
Kolejne dwa modele to autoregresyjne modele progowe (ang. threshold). W naszym modelu wyróżniamy dwa stany (w ogólności może być ich oczywiście więcej): stan bazowy
oraz wzbudzony. W zależności od poziomu zmiennej przełącznikowej vt nasz proces znajduje się w jednym z dwóch stanów. Model ten, który oznaczymy jako TARX jest uogólnieniem modelu ARX i możemy go zapisać w postaci:
pt = φ1,i pt−24 + φ2,i pt−48 + φ3,i pt−168 + φ4,i mpt +
+ψ1,i zt + d1,i DM on + d2,i DSat + d3,i DSun + εt,i ,
(2)
gdzie i = 1, 2. Proces znajduje się stanie bazowym, tj. dla i = 1, gdy vt ¬ T , a w stanie wzbudzonym, gdy vt > T . W naszym modelu kładziemy T = 0, natomiast zmienną
przełącznikową jest różnica między ceną spotową poprzedniego dnia i ceną sprzed 8 dni.
Parametry estymujemy osobno dla obu stanów. Zauważmy również, że dla ψ1,i = 0 dostajemy model bez zmiennej zewnętrznej, tzn. model TAR.
3.2.4
Procesy powracające do średniej ze skokami
Kolejne dwa modele wywodzą się z dziedziny procesów stochastycznych z czasem ciągłym. Proces powracający do średniej ze skokami (ang. mean–reverting jump diffusion,
MRJD) jest zdefiniowany przez następujące stochastyczne równanie różniczkowe:
dpt = (α − βpt )dt + σdWt + Jdqt .
(3)
Jest to rozszerzenie procesu Orsteina–Uhlenbecka o część odpowiadającą za skoki. W
modelu MRJD proces Wt odpowiada za mniejsze wahania ceny wokół długoterminowej
średniej równej αβ . Niezależny od niego proces qt jest tutaj procesem Poissona z intensywnością λ. Tym samym wielkość Jdqt jest odpowiadającym mu przyrostem złożonego
procesu Poissona ze skokami wielkości J. Dla uproszczenia modelu i ułatwienia estymacji parametrów założymy, że J ma rozkład normalny ze średnią µ i wariancją γ 2 . Proces,
który wyjściowo jest w czasie ciągłym musimy oczywiście zdyskretyzować (dt → ∆t).
13
Kolejne założenie dotyczy parametru λ – przyjmujemy, że jest on na tyle mały, że możliwe jest pominięcie zdarzenia, w którym występują dwa skoki procesu Poissona w jednej
godzinie. Wówczas, proces ten możemy aproksymować procesem dwumianowym, ponieważ jedyne możliwości to zero lub jeden skok. Jak wiadomo, zdyskretyzowany proces
Orsteina–Uhlenbecka jest szeregiem czasowym AR(1) z szumem gaussowskim. Tym samym, uwzględniając zmienną zewnętrzną zt , otrzymujemy model MRJDX (lub MRJD
dla ψ1 = 0) postaci:
pt = φ1 pt−24 + ψ1 zt + d1 DM on + d2 DSat + d3 DSun + εi,t ,
(4)
gdzie indeks i przyjmuje wartości 1, gdy skok w procesie Poissona nie wystąpił, oraz
2, gdy wystąpił. Zmienne εi,t mają rozkład normalny, a dokładniej: ε1,t ∼ N (0, σ 2 ) i
ε2,t ∼ N (0, σ 2 + γ 2 ). Ponieważ proces Poissona przybliżamy procesem dwumianowym,
w którym prawdopodobieństwo sukcesu wynosi λ (dla uproszczenia przyjmujemy, że
∆t = 1), to w rezultacie nasz model jest mieszaniną rozkładów normalnych. Do estymacji parametrów możemy w takim razie użyć metody największej wiarogodności.
3.2.5
Modele semiparametryczne
Ostatnią klasą modeli, którą rozważymy, są tzw. modele semiparametryczne. Ich nazwa
wynika z połączenia modelu AR z estymacją nieparametryczną. Dokładniej rzecz ujmując, rozważymy model autoregresji, w którym residua nie będą pochodziły z zadanego
rozkładu prawdopodobieństwa – wyestymujemy go równocześnie z parametrami modelu
AR za pomocą estymacji jądrowej.
Motywacja dla takiego podejścia jest niejako intuicyjna: gdy residua modelu AR różnią się od pewnego ustalonego z góry rozkładu, metody jądrowe estymacji ich gęstości
powinny zwrócić dokładniejsze dopasowanie do danych. Podążając za Misiorkiem i Weronem [14] skorzystamy z 4 różnych metod. Warto w tym miejscu zaznaczyć, że autorzy
wnioskują, że metody te zazwyczaj przynoszą lepsze prognozy niż modele parametryczne.
Metody semiparametryczne, z których korzystamy, pochodzą od Hsieha i Manskiego
[11]. Pierwszym wykorzystanym modelem jest podejście oparte na iterowanym estymatorze Hsieha–Manskiego. W pierwszym kroku estymacji parametrów wyznaczamy startowy
wektor parametrów φb0 tymi samymi metodami jak w przypadku modelu ARX. W kolejnym kroku wykorzystujemy residua εb(φb0 ) = {εbt (φb0 )}nt=1 tego modelu, by za pomocą
estymatora jądrowego Parzena–Rozenblatta otrzymać ich gęstość fbh (x, εb(φb0 )). Następnie
wyliczamy nieparametryczny estymator Hsieha–Manskiego maksymalizując funkcję wiarogodności:
b ) = arg max
b (φ, φ
φbHM = arg max L
h
0
φ
φ
14
n
Y
t=1
fbh (εbt (φ), εb(φb0 )).
(5)
W ostatnim kroku wyznaczamy parametry modelu, powtarzając powyższy schemat, z tym
że startowym wektorem parametrów jest teraz φbHM (wcześniej był to wektor φb0 ):
b
b (φ, φ
φbIHM = arg max L
h
HM ).
φ
(6)
W zależności od tego, czy użyjemy zmiennej zewnętrznej model oznaczymy jako IHMARX lub IHMAR.
Drugą parą metod są tzw. wygładzone nieparametryczne estymatory największej wiarogodności. Konstruujemy je w podobny sposób, z tą różnicą, że nie korzystamy już z
wyjściowego wektora parametrów. Tutaj parametry modelu estymujemy na podstawie bieżących residuów modelu:
φb
SN
=
b
arg max L
φ
h (φ, φ)
= arg max
φ
n
Y
b
fbh (εbt (φ), εb(φ)).
(7)
t=1
Parę tych modeli będziemy oznaczać jako SNARX i SNAR.
Szersza dyskusja na temat czterech modeli semiparametrycznych, wraz z odesłaniami
do innych prac, w których można znaleźć np. rozważania na temat pewnych subtelności
związanych z powyższymi estymatorami znajduje się w [14]
15
4
Uśrednianie modeli
Uśrednianie modeli (inaczej: uśrednianie prognoz) po raz pierwszy pojawiło się najprawdopodobniej w pracy Barnarda [2]. W literaturze możemy też spotkać wiele odwołań do
pracy Batesa i Grangera [3], gdzie poddana analizie została liczba pasażerów jednej z linii
lotniczych, która również pojawia się w kontekście zapoczątkowania dyskusji nad uśrednianiem modeli. Już 20 lat później Clemen [6] tworzy przegląd ponad 200 publikacji,
traktujących o tym zagadnieniu, które autor opisuje jako eksplozję liczby artykułów na
temat uśredniania modeli. Przegląd współcześnie najpopularniejszych metod uśredniania
znajduje się w pracy Timmermanna [18].
Obecnie uśrednianie modeli jest powszechnie stosowaną techniką w wielu zastosowaniach. Co ciekawe, dotychczas ukazało się stosunkowo niewiele prac z tej dziedziny w
zastosowaniu do modelowania i prognozowania cen energii elektrycznej (jednymi z nielicznych wyjątków są prace Bordignona i in. [4] oraz Raviva i in. [?]). Wiele wskazuje
również na to, że nie ukazała się dotychczas żadna publikacja, która byłaby przeglądem
wielu dostępnych metod pod kątem ich użyteczności dla prognozowania cen spotowych
energii elektrycznej.
4.1
Metody uśredniania modeli
Wprowadźmy następujące oznaczenia: niech pt oznacza rzeczywistą wartość analizowanego szeregu czasowego w czasie t. Przez p̂t = (p̂1t , . . . , p̂M t )T oznaczymy wektor jednokrokowych (w chwili t − 1 na czas t) prognoz otrzymanych M różnymi metodami,
natomiast do opisu uśrednionych predyktorów skorzystamy z oznaczenia pcct .
Naszym celem jest zbudowanie uśrednionego modelu prognoz, który możemy wyrazić
wzorem:
pcct =
M
X
wi p̂it (+w0 ),
(8)
i=1
gdzie wi = wi (t) są współczynnikami uśredniania w czasie t. Uwzględnienie stałej w
uśrednionym modelu jest możliwe, ale nie koniecznie. Większość rozpatrywanych przez
nas metod pomija składnik w0 .
Bardzo często problem poszukiwania optymalnego uśrednionego modelu definiuje się
jako próbę wyznaczenia optymalnych wag za pomocą minimalizacji zadanej funkcji straty,
zob. [7]. Niemniej, w niniejszej pracy skupimy się głównie na nieco innym podejściu.
Wagi z modelu (8) będziemy estymować na podstawie danych (cena energii elektrycznej pt oraz prognozy metodami bazowymi p̂it ) z tygodnia poprzedzającego moment prognozy. Tym samym wszystkie jednokrokowe prognozy wyznaczymy na podstawie okna
kalibracji o jednej, ustalonej arbitralnie szerokości. Odpowiada ono 168 wcześniejszym
obserwacjom, co możemy zapisać jako: pcct = pcct |t−1,...,t−168 .
16
4.1.1
Średnia arytmetyczna
Najprostszym możliwym uśrednionym modelem prognozowania jest bez wątpienia średnia arytmetyczna. Skorzystamy zatem z predyktora postaci:
pcct =
p̂1t + · · · + p̂M t
,
M
(9)
a metodę tę oznaczymy jako AM (ang. arithmetic mean). Co ciekawe, w literaturze nietrudno znaleźć informacje (zob. np. [4] i odnośniki tamże), że to właśnie średnia arytmetyczna jest najbardziej uniwersalnym podejściem w uśrednianiu modeli. Co ciekawe,
gdyby metody bazowe były nieobciążone i dawały błędy z identycznymi wariancjami, a
korelacja dla każdej z par byłaby taka sama, to wybór równomiernie wag jest podejściem
optymalnym w sensie błędu średnokwadratowego [18].
4.1.2
Metody oparte o metodę najmniejszych kwadratów
Kolejna metoda uśredniania została zaproponowana przez [9]. Dla modelu określonego
równaniem (8), z uwzględnieniem stałej w0 , wprowadźmy następujące oznaczenia:




pt
µp
E  =  ,
p̂t
µ
oraz


(10)


T
σ 2 σ21
pt
,
V ar   =  p
σ21 Σ22
p̂t
(11)
gdzie µp jest wartością oczekiwaną zmiennej pt , µ jest wektorem wartości oczekiwanych
wektora p̂t , Σ22 jest macierzą kowariancji wektora p̂t , σp2 wariancją zmiennej pt , natomiast σ21 jest wektorem zadanym wzorem: σ21 = (Cov(pt , p̂1t ), . . . , Cov(pt , p̂M t ))T .
Przyjmując kwadratową funkcję straty, nasze parametry otrzymamy minimalizując wyrażenie:
h
T
i2
E pt − (w0 + w p̂t )
"
= E pt − (w0 +
M
X
#2
wi p̂it )
i=1
"
+ E pt − (w0 +
M
X
= V ar pt − (w0 +
M
X
!
wi p̂it ) +
i=1
#!2
wi p̂it )
= σp2 + wT Σ22 w − 2wT σ21 + (µp − w0 − wT µ)2 ,
i=1
(12)
gdzie w = (w1 , . . . , wM )T . Można sprawdzić ([7]), że wyrażenie to osiąga swoje minimum dla:
w 0 = µp − w T µ
(13)
wT = Σ−1
22 σ21
17
Tym samym wektor wag w zależy tylko od macierzy kowariancji wektora p̂t oraz kowariancji między zmienną pt a wektorem p̂t . Stała w0 w tej sytuacji wynika z obciążeń poszczególnych predyktorów p̂it , i = 1, . . . , M . Model określony równaniem (8)
(z uwzględnieniem stałej w0 ), gdzie parametry przyjmują wartości jak w (13), oznaczymy
jako OLS (ang. ordinary least squares).
W powyższej metodzie pojawia się element dyskusyjny – możliwe występowanie ujemnych lub bardzo dużych co do modułu wag wi . Pojawiają się trudności z interpretacją
takiego rezultatu. Proponowanym rozwiązaniem jest narzucenie pewnych ograniczeń na
parametry wi . Skorzystamy więc z podejścia zaproponowanego przez Aksu i Sevketa [1]
i wprowadzimy warunki postaci:
wit ­ 0, ∀1­i­M ∀t∈T
w0 = 0 oraz
M
X
wi = 1, ∀t∈T .
(14)
(15)
i=1
Pierwsze podejście wykorzystuje tylko równanie (14) – metodę tę oznaczymy jako PW
(ang. positive weights). Kolejne wykorzystuje oba powyższe warunki – ozn. CLS (ang.
constrained least squares). Zyskujemy tutaj prostą interpretację wyników, jednak niestety w tych metodach estymator parametrów wi możemy uzyskać jedynie poprzez pewne
aproksymacje numeryczne. Dokładniej rzecz biorąc skorzystamy z programowania kwadratowego (ang. quadratic programming), które w przypadku z ograniczeniami nałożonymi na przestrzeń argumentów możemy zdefiniować następująco:
1
arg min{cT x + xT Hx : l ¬ x ¬ u, Ax = b}.
x
2
(16)
Macierz H jest tutaj symetryczna i, podobnie jak wektor c, ustalona. Zadane wektory l i
u wyznaczają przestrzeń, na której poszukujemy minimum powyższej funkcji, podobną
rolę odgrywa zależność liniowa Ax = b (A to ustalona macierz, b – ustalony wektor). W
szczególnym przypadku, minimalizacja funkcji cT x+ 12 xT Hx sprowadza się do problemu
przedyskutowanego w metodzie OLS. Istotnie, gdy położymy H = Σ22 + µµT oraz
c = −(σ21 + µp µ), to przy w0 = 0 otrzymamy równanie (12). Obliczenia numeryczne
w tym wypadku opieramy o tzw. metodę odbić Newtona (and. reflective Newton method),
która została zaproponowana przez Colemana i Li [5].
4.1.3
Metody oparte o miary błędu prognozy
Kolejne podejścia to efekt uwzględnienia błędu prognoz każdej z bazowych metod prognozowania. Pierwsze z nich pochodzi z pracy [17]. Dla uśrednionej prognozy pcct =
18
Pm
i=1
wit p̂it wagi wi dane są wzorami
−1
M SEi
PM
i=1
wit =
PM
i=1
M SEi
M SEi
PM
i=1
−1
=
1
M SEi
PM
1
i=1 M SEi
,
(17)
M SEi
gdzie M SEi , i = 1, . . . , M oznacza błąd średniokwadratowy i-tej bazowej prognozy
wyznaczony na okresie kalibracji. Poszczególnym prognozom bazowym nadajemy zatem
wagi, które odpowiadają odwrotności uzyskiwanych przez nie błędów. Innymi słowy, im
mniejszy błąd średniokwadratowy dana bazowa metoda uzyskuje, tym większą wagę uzyskuje. Metodę tę oznaczamy jako IMSE (ang. inverted mean squarred error).
Kolejna metoda, to wybór (jednego) najlepszego z bazowych modeli w okresie kalibracji, ponownie na podstawie błędu średniokwadratowego. Takie podejście możemy uznać
za uśrednianie zdegenerowane. Wagi w tym podejściu są dane wzorem:
wit =


1,
gdy i-ty model osiąga najniższy błąd średniokwadratowy,

0,
w przeciwnym wypadku.
(18)
Metodę tę oznaczymy jako BIMSE (ang. best individual mean squarred error).
Wybór jednego predyktora stanowi alternatywę dla użycia kombinacji modeli i jest
częstym dylematem dla korzystających z technik uśredniania modeli. Problem z jakim
zmagają się oni polega na podjęciu decyzji, czy korzystniejszy jest dla nich wybór jednej najdokładniejszej metody prognozowania, czy próba poszukiwania skuteczniejszego,
uśrednionego podejścia. To ostatnie wiąże się oczywiście z ryzykiem, że uzyskana w taki
sposób prognoza okaże się gorsza od najlepszej metody bazowej.
Obie te metody można zmodyfikować, zamieniając błąd średniokwadratowy na średni
błąd bezwzględny. Tak uśrednione prognozy będziemy oznaczać jako IMAE (ang. inverted mean absolute error) oraz BIMAE (ang. best individual mean absolute error).
4.1.4
Uśrednianie Bayesowskie
Kolejna, ciekawa z punktu widzenia statystyki metoda opiera się na wzorze Bayesa na
prawdopodobieństwo całkowite. Idea jest następująca: spośród M rozważanych modeli
bazowych, tworzymy wszystkie (2M − 1) kombinacje modeli, co skutkuje oczywiście
znacznym wzrostem złożoności obliczeniowej. Tym samym uśredniona prognoza będzie
wyrażała się wzorem:
pcc
t
=
2M
−1
X
wkt p̂kt ,
(19)
k=1
gdzie tym razem, w przeciwieństwie do wszystkich pozostałych podejść, p̂kt oznacza prognozę przy użyciu k-tej kombinacji modeli (spośród wszystkich 2M − 1), wyznaczonej
19
przy użyciu średniej arytmetycznej z rozważanych bazowych prognoz. Wagi wkt są wyznaczane na podstawie wzoru Bayesa:
L(pt |mk , D)P (mk )
.
wkt = P2M −1
j=1 L(pt |mk , D)P (mk )
(20)
W powyższym wzorze L(pt |mk , D) oznacza wartość funkcji wiarogodności dla k-tej kombinacji modeli na podstawie zbioru obserwacji D, natomiast P (mk ) to jej prawdopodobieństwo a–priori. W naszych analizach zastosujemy najczęściej stosowane podejście:
P (mk ) będzie z dyskretnego rozkładu jednostajnego (dokładniejsza analiza możliwych
rozkładów a–priori znajduje się w [8]), natomiast za gęstość odpowiadającą funkcji wiarogodności przyjmiemy gęstość rozkładu normalnego. Szeroka dyskusja na temat licznych
subtelności związanych z wyznaczaniem wag przy uśrednianiu Baysowskim znajduje się
w [10].
4.2
Prognozowanie i pomiar jego dokładności
W naszej analizie stosujemy 3 różne podejścia do estymowania wag w uśrednionym modelu prognozy. Będziemy kalibrować uśrednione modele dla dwóch długości okna kalibracji
przesuwającego się (tydzień i cztery tygodnie), a także dla okna rozszerzającego się, które
w pierwszym dniu prognozy będzie długości 4 tygodni. Wydawać by się mogło, że zastosowanie okien przesuwających się jest naturalne i zgodne z intuicją. Nie wiadomo jednak,
czy z powodu lokalnych wahań prognoz bazowych podejście takie nie zwróci wyników,
które na pewnych przedziałach będą całkowicie pozbawione sensu. Zaznaczmy również,
że tym razem parametry modeli uśrednionych wyznaczamy na podstawie wszystkich obserwacji z okresu kalibracji, a nie jedynie dla tej samej godziny, dla której wyznaczamy
prognozę, tak jak miało to miejsce przy prognozowaniu metodami bazowymi.
Wyniki przedstawimy uśredniając prognozy na przedziałach tygodniowych. Przypomnijmy, że rezultaty otrzymujemy łącznie dla 700 dni, a więc uwzględniwszy fakt, że
działamy na danych godzinowych oraz, że przetestujemy łącznie 3 okna kalibracji, otrzymujemy w rezultacie ponad 50 tysięcy prognoz punktowych!
Podobnie jak w pracy Misiorka i Werona [14], miarą tygodniowego błędu będzie tygodniowy ważony błąd bezwzględny:
W M AE =
1
P 168
M AE =
168
X
1
|Ph − Pbh |,
168 · P 168 h=1
(21)
gdzie Ph jest rzeczywistą ceną, a Pbh jej prognozą, obie w godzinie h. Natomiast P 168
1 P168
oznacza średnią cenę dla danego tygodnia, tj. P 168 = 168
h=1 Ph .
W tym momencie pojawia się również pytanie, jaki rezultat będzie dla nas satysfakcjonujący. Jak wspomniano wcześniej, w literaturze możemy spotkać dwa podjejścia: (i)
20
efektywne znajdowanie modelu, który będzie zazwyczaj dawał najdokładniejsze rezultaty
lub (ii) znalezienie takiej kombinacji liniowej metod bazowych, która da skuteczniejsze
metody niż każda z metod z osobna. W tej pracy spojrzymy na ten problem z jeszcze innej
perspektywy. Mianowicie, sukcesem nazwiemy sytuację, w której dana metoda uśredniania dla danego tygodnia będzie skuteczniejsza niż obie metody zdegenerowane. Przyjmujemy tym samym, że metody BIMSE i BIMAE są niejako optymalnym wskazaniem najskuteczniejszej z bazowych metod. Przy okazji, metody uśrednione porównamy także z
najlepszą bazową metodą dla danego tygodnia, którą oznaczać będziemy jako BI (ang. best
individual). Zauważmy, że BI różni się od BIMSE i BIMAE, w przeciwieństwie do nich
nie jest predyktorem, a jedynie wskazaniem najskuteczniejszej metody, kiedy znamy już
dokładną wartość zmiennej, którą prognozujemy. Innymi słowy, BI będzie dla nas metodą
wyznaczoną na podstawie błędu ex post, natomiast metody BIMSE i BIMAE określamy
na podstawie błędu ex ante.
4.3
4.3.1
Wyniki
Nord Pool 1998-1999
Widzimy z tabel 1-3, że spośród rozważanych uśrednionych modeli tylko metody oparte o
metodę najmniejszych kwadratów dają zadowalające rezultaty. Zarówno średnia arytmetyczna (AM), uśrednianie Bayesowskie (BMA), jak i obie metody, w których wagi wyznaczyliśmy w oparciu o błędy prognozy (IMAE i IRMSE), bardzo rzadko działały skuteczniej od metod zdegenerowanych. Niezależnie od tego, jakie okno kalibracji wybierzemy,
metodą, która najczęściej zachowuje się lepiej niż BIMSE i BIMAE, jest OLS, czyli optymalny uśredniony predyktor w sensie minimalizacji błędu średniokwadratowego. Jest to
pewne zaskoczenie, ponieważ wagi w tej metodzie nie są w żaden sposób ograniczone i
nie muszą sumować się do 1. Mimo tego, to podejście dało najlepsze rezultaty. Należy
również podkreślić, że przy wyborze okna kalibracji długości 7 dni, metody OLS i PW
prognozują ceny spotowe energii dokładniej niż wszystkie metody bazowe (BI) dla ponad
połowy tygodni (względem miary WMAE). Także po uśrednieniu (po błędach WMAE)
te dwie metody wyglądają najlepiej i co najistotniejsze, są one w takim ujęciu lepsze niż
wszystkie metody bazowe. Jeśli porównamy natomiast okna kalibracji (zob. rys. 4), widzimy wyraźną przewagę okna 7-dniowego nad dwoma pozostałymi, ale jedynie dla metod
OLS, PW i CLS. Okazało się tym samym, że dla zbioru Nord Pool 1998-1999 lepiej jest
zastosować wagi, które są stosunkowo mocno narażone na wahania. Należy zatem przypuszczać, że ma to związek z tym, że na przestrzeni czasu skuteczność metod bazowych
zmienia się dość dynamicznie, co zresztą widać po ostatnich kolumnach tabel 1-3.
21
Tabela 1: Wyniki uśredniania modeli dla zbioru danych NP 1998-1999 przy użyciu okna
kalibracji długości 7 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu
metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
średnio
% pogr.
% podkr.
AM
4.15
3.07
2.82
3.58
4.22
3.36
3.22
2.58
4.76
7.16
5.89
5.19
4.29
6.40
8.82
6.67
4.96
4.16
6.81
4.98
5.54
7.59
5.81
5.33
7.04
4.79
3.33
4.88
4.38
4.25
2.85
1.87
2.84
2.91
2.35
4.36
3.54
2.39
2.40
2.73
3.49
2.55
2.22
3.16
4.31
36.7%
6.7%
OLS
4.13
3.96
1.87
1.93
1.50
3.38
1.57
1.16
2.26
5.80
6.05
3.74
3.49
7.26
6.70
5.98
6.22
3.69
6.78
5.19
4.84
6.75
6.92
3.27
3.51
3.96
3.20
4.20
2.43
4.01
2.84
2.07
2.47
2.44
2.29
3.46
2.84
1.59
2.20
2.58
3.25
2.36
1.82
2.00
3.64
106.7%
90.0%
PW
4.12
3.77
2.15
1.88
1.56
3.43
1.51
1.17
2.40
5.75
6.22
3.43
4.12
6.74
7.88
5.28
5.40
3.79
6.11
4.66
4.79
6.88
5.63
4.15
3.72
4.54
3.19
4.00
2.10
3.66
2.81
1.89
2.41
2.60
2.21
3.45
2.99
1.56
2.27
2.47
3.20
2.44
1.84
2.67
3.61
110.0%
93.3%
CLS
5.10
3.45
2.62
2.54
2.49
3.14
2.20
1.60
3.24
6.26
6.04
5.09
3.96
6.13
7.99
6.00
4.98
3.71
6.38
4.79
5.21
7.28
5.88
4.63
5.25
4.46
3.11
4.36
2.88
3.74
2.68
1.85
2.53
2.68
2.47
3.81
3.58
2.34
2.49
2.37
3.21
2.44
2.23
2.84
3.91
76.7%
33.3%
IRMSE
4.20
3.07
2.85
3.50
3.96
3.21
3.15
2.29
4.53
6.99
5.86
5.14
4.30
6.29
8.62
6.56
4.95
4.06
6.82
4.89
5.49
7.52
5.75
5.29
6.90
4.78
3.30
4.85
4.23
4.18
2.79
1.86
2.79
2.90
2.38
4.27
3.54
2.39
2.39
2.74
3.49
2.54
2.22
3.16
4.25
43.3%
6.7%
22
IMAE
4.15
3.08
2.85
3.46
3.95
3.19
3.10
2.28
4.51
7.01
5.86
5.15
4.30
6.30
8.63
6.55
4.95
4.06
6.79
4.90
5.48
7.51
5.75
5.29
6.89
4.78
3.29
4.84
4.20
4.14
2.76
1.84
2.79
2.91
2.37
4.29
3.53
2.38
2.40
2.72
3.48
2.54
2.22
3.15
4.24
43.3%
10.0%
BMA
4.76
3.18
3.43
4.22
4.74
3.49
3.44
2.66
4.95
7.22
5.91
5.16
4.36
6.28
8.58
6.59
4.94
4.02
6.74
4.88
5.40
7.45
5.74
5.16
6.95
5.10
3.76
5.17
4.53
4.54
2.96
2.04
2.91
2.86
2.54
4.26
3.66
2.44
2.41
2.81
3.54
2.55
2.24
3.19
4.40
30.0%
3.3%
BIMSE
5.23
3.57
2.65
3.36
2.92
3.77
2.71
2.12
3.51
6.38
6.07
5.09
4.20
6.31
7.92
6.11
4.92
3.64
6.35
4.84
5.21
7.22
6.00
4.42
5.12
4.67
3.13
4.38
2.90
3.75
2.66
1.89
2.51
2.60
2.75
3.68
3.96
2.51
2.70
2.82
3.72
2.37
2.43
2.98
4.05
BIMAE
5.04
3.38
2.70
3.28
2.87
3.80
2.56
2.12
3.51
6.38
6.01
5.05
4.18
6.38
8.19
6.06
4.84
3.50
6.42
4.75
5.24
7.20
5.78
4.20
5.12
4.73
3.18
4.42
2.94
3.57
2.59
1.95
2.56
2.63
2.73
3.75
3.62
2.28
2.66
2.80
3.54
2.45
2.38
2.87
4.00
3.57
3.26
2.44
2.44
3.03
3.37
1.74
2.12
3.51
6.38
4.91
4.91
4.00
5.84
7.92
5.94
4.74
3.59
6.31
4.61
5.07
6.89
5.69
4.11
5.12
4.64
2.95
4.30
2.86
3.57
2.43
1.86
2.48
2.35
2.31
3.72
3.31
2.27
2.30
2.48
3.38
2.37
2.10
2.82
3.77
BI
(MRJD)
(AR)
(SNAR)
(SNAR)
(MRJD)
(SNARX)
(MRJD)
(MRJD)
(MRJD)
(MRJD)
(TARX)
(TARX)
(SNARX)
(ARX)
(TARX)
(pARX)
(TARX)
(ARX)
(TARX)
(AR)
(SNARX)
(ARX)
(AR)
(SNARX)
(SNARX)
(SNAR)
(TAR)
(TAR)
(SNAR)
(SNAR)
(IHMAR)
(IHMAR)
(TAR)
(TARX)
(SNARX)
(SNAR)
(TAR)
(SNAR)
(ARX)
(MRJDX)
(SNARX)
(TARX)
(MRJDX)
(SNARX)
Tabela 2: Wyniki uśredniania modeli dla zbioru danych NP 1998-1999 przy użyciu okna
kalibracji długości 28 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu
metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
średnio
% pogr.
% podkr.
AM
4.15
3.07
2.82
3.58
4.22
3.36
3.22
2.58
4.76
7.16
5.89
5.19
4.29
6.40
8.82
6.67
4.96
4.16
6.81
4.98
5.54
7.59
5.81
5.33
7.04
4.79
3.33
4.88
4.38
4.25
2.85
1.87
2.84
2.91
2.35
4.36
3.54
2.39
2.40
2.73
3.49
2.55
2.22
3.16
4.31
40.0%
6.7%
OLS
3.20
3.90
2.16
2.65
1.74
3.24
1.42
1.13
2.25
6.01
5.89
4.18
3.37
6.52
8.11
4.80
6.06
4.00
5.99
4.64
5.91
6.84
6.04
4.79
5.65
4.46
4.03
4.67
2.29
3.40
2.74
1.99
2.40
3.27
2.25
3.83
3.02
2.07
2.34
4.30
2.92
2.50
1.48
1.94
3.78
100.0%
76.7%
PW
4.10
3.25
2.48
3.76
2.11
3.25
1.37
1.11
2.83
6.25
6.07
4.48
3.87
6.27
8.27
5.54
4.62
3.80
5.91
4.64
5.36
6.96
5.82
4.50
5.76
4.88
4.48
4.61
2.29
3.36
2.83
1.83
2.34
3.36
2.39
3.85
3.25
2.16
2.57
4.39
2.91
2.44
1.55
2.65
3.88
106.7%
70.0%
CLS
4.54
3.30
3.33
4.38
2.74
3.14
1.74
1.59
3.33
6.59
6.70
5.52
3.83
6.11
7.96
5.95
4.84
3.83
6.35
4.85
5.45
7.07
5.91
4.69
6.08
4.92
3.64
4.40
3.01
3.52
2.58
1.82
2.47
3.14
2.48
4.14
3.30
2.29
2.63
2.61
3.17
2.59
2.19
2.72
4.03
76.7%
36.7%
IRMSE
4.18
3.07
2.87
3.65
4.18
3.34
3.06
2.45
4.60
7.10
5.91
5.20
4.28
6.32
8.66
6.57
4.94
4.07
6.78
4.90
5.49
7.50
5.75
5.32
6.97
4.83
3.36
4.86
4.27
4.19
2.79
1.84
2.80
2.93
2.37
4.31
3.55
2.39
2.40
2.74
3.50
2.55
2.22
3.17
4.28
40.0%
10.0%
23
IMAE
4.12
3.09
2.82
3.59
4.12
3.31
3.01
2.42
4.55
7.09
5.92
5.21
4.27
6.33
8.68
6.57
4.94
4.07
6.78
4.90
5.49
7.50
5.75
5.31
6.96
4.82
3.36
4.86
4.26
4.17
2.77
1.83
2.78
2.94
2.36
4.32
3.55
2.39
2.41
2.73
3.49
2.55
2.22
3.16
4.27
40.0%
10.0%
BMA
4.75
3.18
3.43
4.22
4.73
3.49
3.44
2.66
4.94
7.22
5.91
5.16
4.37
6.29
8.58
6.58
4.93
4.00
6.71
4.88
5.40
7.46
5.75
5.17
6.94
5.10
3.76
5.17
4.53
4.54
2.96
2.04
2.90
2.86
2.53
4.26
3.66
2.44
2.42
2.81
3.54
2.55
2.24
3.19
4.40
20.0%
3.3%
BIMSE
4.17
3.17
3.61
4.33
4.03
3.46
2.12
2.12
3.51
6.38
6.82
5.04
4.00
6.10
8.01
6.14
4.82
3.92
6.33
4.84
5.56
6.83
5.98
4.90
6.85
5.26
3.74
4.43
2.93
3.79
2.51
1.87
2.71
3.40
2.36
4.08
3.44
2.25
2.69
3.28
3.65
2.60
2.33
2.82
4.16
BIMAE
3.65
3.41
2.64
3.68
3.65
3.79
1.76
2.12
3.51
6.38
7.39
5.58
4.00
6.14
8.04
5.94
5.03
3.92
6.45
4.84
5.39
6.89
5.99
4.80
5.12
4.89
3.74
4.42
2.97
3.57
2.46
1.87
2.58
3.43
2.36
4.06
3.42
2.27
2.96
2.71
3.38
2.58
2.29
2.82
4.07
3.57
3.26
2.44
2.44
3.03
3.37
1.74
2.12
3.51
6.38
4.91
4.91
4.00
5.84
7.92
5.94
4.74
3.59
6.31
4.61
5.07
6.89
5.69
4.11
5.12
4.64
2.95
4.30
2.86
3.57
2.43
1.86
2.48
2.35
2.31
3.72
3.31
2.27
2.30
2.48
3.38
2.37
2.10
2.82
3.77
BI
(MRJD)
(AR)
(SNAR)
(SNAR)
(MRJD)
(SNARX)
(MRJD)
(MRJD)
(MRJD)
(MRJD)
(TARX)
(TARX)
(SNARX)
(ARX)
(TARX)
(pARX)
(TARX)
(ARX)
(TARX)
(AR)
(SNARX)
(ARX)
(AR)
(SNARX)
(SNARX)
(SNAR)
(TAR)
(TAR)
(SNAR)
(SNAR)
(IHMAR)
(IHMAR)
(TAR)
(TARX)
(SNARX)
(SNAR)
(TAR)
(SNAR)
(ARX)
(MRJDX)
(SNARX)
(TARX)
(MRJDX)
(SNARX)
Tabela 3: Wyniki uśredniania modeli dla zbioru danych NP 1998-1999 przy użyciu rozszerzającego się okna kalibracji. Kolumna BI oznacza najlepszą metodę bazową dla danego
tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że
metoda była skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
średnio
% pogr.
% podkr.
AM
4.15
3.07
2.82
3.58
4.22
3.36
3.22
2.58
4.76
7.16
5.89
5.19
4.29
6.40
8.82
6.67
4.96
4.16
6.81
4.98
5.54
7.59
5.81
5.33
7.04
4.79
3.33
4.88
4.38
4.25
2.85
1.87
2.84
2.91
2.35
4.36
3.54
2.39
2.40
2.73
3.49
2.55
2.22
3.16
4.31
50.0%
6.7%
OLS
3.13
3.69
2.26
3.29
3.22
3.54
2.41
1.50
2.85
6.06
5.87
4.05
3.56
6.33
9.16
5.66
5.25
4.77
5.95
4.99
4.62
7.45
6.21
4.16
8.03
5.11
5.85
7.43
7.95
5.94
4.00
2.51
3.15
2.68
2.30
4.50
3.47
2.35
2.22
2.46
3.36
2.53
1.79
3.03
4.33
73.3%
50.0%
PW
4.07
3.28
2.64
4.01
4.46
3.22
2.54
1.65
3.60
6.41
5.95
4.53
3.68
6.29
9.07
5.86
4.50
3.93
5.96
4.66
5.00
7.19
5.75
4.54
6.66
4.85
4.40
6.13
6.36
5.66
3.88
2.42
3.28
2.61
2.36
4.62
3.74
2.48
2.20
2.43
3.59
2.53
1.88
3.30
4.28
73.3%
36.7%
CLS
4.50
3.28
3.09
3.93
4.09
3.26
2.88
2.25
3.98
6.78
6.37
5.33
3.95
6.91
9.14
6.57
4.93
4.16
6.53
4.99
5.31
7.58
5.77
4.83
6.63
4.77
3.72
5.09
4.58
4.30
2.91
1.92
2.73
2.96
2.41
4.11
3.39
2.32
2.47
2.75
3.38
2.47
2.25
2.93
4.28
60.0%
6.7%
IRMSE
4.18
3.07
2.86
3.63
4.28
3.38
3.26
2.61
4.80
7.17
5.88
5.18
4.30
6.37
8.77
6.62
4.95
4.12
6.80
4.94
5.52
7.54
5.77
5.32
7.00
4.82
3.35
4.89
4.37
4.28
2.84
1.88
2.83
2.91
2.36
4.33
3.55
2.39
2.40
2.76
3.52
2.54
2.23
3.19
4.31
43.3%
3.3%
IMAE
4.12
3.08
2.82
3.58
4.19
3.34
3.16
2.54
4.70
7.13
5.90
5.21
4.28
6.42
8.85
6.67
4.97
4.15
6.81
4.97
5.53
7.57
5.79
5.31
6.99
4.80
3.35
4.88
4.35
4.25
2.83
1.87
2.83
2.92
2.35
4.33
3.55
2.39
2.41
2.74
3.51
2.54
2.22
3.18
4.30
50.0%
6.7%
24
BMA
4.75
3.18
3.43
4.22
4.73
3.49
3.44
2.66
4.94
7.22
5.91
5.16
4.37
6.29
8.58
6.58
4.93
4.00
6.71
4.88
5.40
7.46
5.75
5.17
6.94
5.10
3.76
5.17
4.53
4.54
2.96
2.04
2.90
2.86
2.53
4.26
3.66
2.44
2.42
2.81
3.54
2.55
2.24
3.19
4.40
70.0%
46.7%
BIMSE
4.17
3.31
3.24
4.41
4.39
3.37
3.16
2.56
4.31
6.87
6.08
5.04
4.00
6.99
9.02
6.21
5.03
3.81
6.60
4.69
5.33
7.19
5.82
4.88
6.69
5.26
4.29
5.44
5.13
5.10
3.15
2.25
2.86
3.02
2.37
4.12
3.46
2.37
2.41
2.80
3.65
2.66
2.16
3.30
4.39
BIMAE
3.65
3.41
2.64
3.83
4.07
3.37
3.16
2.56
4.31
6.87
6.08
5.04
4.00
6.99
9.60
6.49
5.54
4.18
6.78
5.23
5.07
7.88
5.88
4.11
5.12
4.89
3.74
4.89
3.76
4.15
2.70
1.97
2.80
3.32
2.31
3.84
3.41
2.29
2.76
2.70
3.38
2.59
2.29
2.82
4.24
3.57
3.26
2.44
2.44
3.03
3.37
1.74
2.12
3.51
6.38
4.91
4.91
4.00
5.84
7.92
5.94
4.74
3.59
6.31
4.61
5.07
6.89
5.69
4.11
5.12
4.64
2.95
4.30
2.86
3.57
2.43
1.86
2.48
2.35
2.31
3.72
3.31
2.27
2.30
2.48
3.38
2.37
2.10
2.82
3.77
BI
(MRJD)
(AR)
(SNAR)
(SNAR)
(MRJD)
(SNARX)
(MRJD)
(MRJD)
(MRJD)
(MRJD)
(TARX)
(TARX)
(SNARX)
(ARX)
(TARX)
(pARX)
(TARX)
(ARX)
(TARX)
(AR)
(SNARX)
(ARX)
(AR)
(SNARX)
(SNARX)
(SNAR)
(TAR)
(TAR)
(SNAR)
(SNAR)
(IHMAR)
(IHMAR)
(TAR)
(TARX)
(SNARX)
(SNAR)
(TAR)
(SNAR)
(ARX)
(MRJDX)
(SNARX)
(TARX)
(MRJDX)
(SNARX)
4.3.2
Nord Pool 2009-2010
Wnioski płynące z wyników dla zbioru (tabele 4-6) danych NP 2009-2010 są podobne
do wniosków z poprzedniego podrozdziału. Znów najskuteczniejsze okazały się być metody oparte o minimalizację błędu średniokwadratowego (OLS, PW, CLS). Raz jeszcze
wszystkie pozostałe podejścia dają nam wyniki raczej niesatysfakcjonujące. Najdokładniejsze prognozy otrzymaliśmy tym razem przy użyciu metody PW. Zauważmy, że przy
oknie kalibracji długości 7 dni, dla ponad połowy tygodni otrzymaliśmy prognozę dokładniejszą niż każda z metod bazowych, co należy uznać za sukces. Pozostałe dwa okna
kalibracji nie są aż tak skuteczne, zarówno jeśli chodzi o metodę PW, jak i w ujęciu globalnym, choć już w nieco mniejszym stopniu. Wyraźnie widzimy te zależności na rysunku 4,
gdzie różnice łatwo dostrzec szczególnie dla trzech najlepszych metod (PW, OLS, CLS).
Zbiór danych NP 2009-2010 w okresie prognozy zawiera, w przeciwieństwie do okresu 1998-1999, piki cenowe. Powodują one wyraźne zaburzenia w wynikach uśredniania.
Szczególnie źle wypadają tygodnie 3, 6, 7, 27, gdzie niemal żadna metoda uśredniania, niezależnie od okna kalibracji, nie poprawia dokładności prognozowania, względem najlepszej metody bazowej, mierzonej zarówno błędem ex post, jak i ex ante. Niemniej jednak,
różnice w błędach WMAE pomiędzy poszczególnymi modelami uśredniania, a najlepszą
metodą bazową BI nie są wysokie. Można zatem przypuszczać, że wina nieskuteczności
uśredniania leży bardziej po stronie dokładności modeli szeregów czasowych, niż procedury estymacji wag im przypisywanym.
Inny ciekawy okres w wynikach to tygodnie 14-24. Zauważmy (tab. 6), że dla rozszerzającego się okna kalibracji metody uśredniania (z jednym małym wyjątkiem) zawodzą,
dając większe tygodniowe błędy niż BIMSE i BIMAE (więc również większe niż BI). Ten
specyficzny okres poprzedzony jest pikiem cenowym, który wystąpił w tygodniu 14. Stąd
też prawdopodobne jest obciążenie w estymacji wag dla metod bazowych. Dostrzegamy
zatem wyraźną przewagę przesuwającego się okna kalibracji nad oknem rozszerzającym
się. Ponieważ piki cenowe są charakterystyczne dla rynków energii elektrycznej, możemy
wnioskować, że użycie przesuwającego się okna kalibracji jest szczególnie wskazane w
modelowaniu i prognozowaniu cen spotowych energii.
25
Tabela 4: Wyniki uśredniania modeli dla zbioru danych NP 2009-2010 przy użyciu okna
kalibracji długości 7 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu
metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
średnio
% pogr.
% podkr.
AM
OLS
PW
CLS
IRMSE
IMAE
BMA
BIMSE
BIMAE
5.11
2.97
14.38
6.04
4.16
28.73
10.58
5.18
14.95
7.44
7.66
9.63
14.51
4.76
3.01
3.99
3.08
3.42
4.58
2.77
2.54
3.50
3.38
6.69
16.41
16.39
14.15
12.30
9.18
6.11
7.48
2.76
16.64
8.23
3.44
43.13
18.28
4.62
10.99
9.59
4.81
5.23
24.50
5.63
3.48
2.98
2.66
1.43
2.86
1.92
1.37
2.39
1.97
5.67
18.35
16.69
13.43
9.99
9.86
4.96
5.35
1.90
14.99
8.83
3.30
32.86
15.41
3.06
11.91
6.70
5.00
5.32
18.98
4.89
3.40
3.23
2.88
1.56
2.77
1.98
1.40
2.54
1.75
6.02
15.42
18.02
11.31
10.83
8.41
5.61
5.22
2.46
13.77
7.06
3.85
27.80
10.85
4.77
13.11
7.16
6.82
7.44
14.24
4.85
2.81
3.56
2.71
2.31
3.34
1.88
1.62
2.82
2.40
6.19
16.26
16.21
14.64
11.53
9.76
5.98
5.12
2.99
14.28
6.08
4.34
28.66
10.61
5.11
14.87
7.43
7.64
9.42
14.49
4.75
2.92
3.93
3.03
3.23
4.42
2.54
2.33
3.32
3.26
6.63
16.33
16.36
14.12
12.21
9.15
6.04
5.12
2.99
14.27
6.10
4.35
28.65
10.57
5.07
14.85
7.38
7.62
9.34
14.51
4.74
2.92
3.93
3.03
3.22
4.37
2.53
2.31
3.30
3.21
6.67
16.37
16.37
14.08
12.22
9.13
6.04
5.25
2.95
14.38
6.08
4.61
28.33
10.51
5.03
15.23
7.57
7.94
10.31
14.91
4.76
3.13
3.96
3.05
3.61
4.85
3.00
2.78
3.68
3.69
6.60
16.39
16.39
14.51
12.44
9.32
6.23
5.91
2.93
13.96
6.95
4.61
27.38
10.55
4.87
13.26
7.48
6.67
7.34
14.37
5.15
3.07
3.66
2.93
2.52
3.48
1.93
1.70
2.93
2.40
6.14
16.32
16.46
14.54
11.47
10.57
6.27
5.54
2.94
13.74
6.63
4.56
27.28
10.31
4.44
12.96
6.48
6.63
7.67
14.75
4.72
2.99
3.77
2.77
2.52
3.48
2.04
1.70
2.93
2.40
6.99
16.51
16.24
13.29
11.69
9.47
6.26
4.85
2.75
13.14
5.85
4.57
25.84
9.92
4.44
12.91
6.63
6.63
7.36
14.37
4.31
2.82
3.66
2.93
2.33
3.48
1.89
1.70
2.93
2.40
6.64
16.02
15.95
12.52
11.22
9.36
5.34
7.93
7.79
7.49
8.25
8.84
7.85
7.78
8.19
8.18
8.38
16.7%
6.7%
53.3%
46.7%
63.3%
60.0%
50.0%
40.0%
20.0%
10.0%
20.0%
6.7%
13.3%
6.7%
26
BI
(TARX)
(TARX)
(pARX)
(SNARX)
(pARX)
(pARX)
(ARX)
(SNAR)
(TAR)
(SNAR)
(SNAR)
(TAR)
(TARX)
(SNAR)
(SNARX)
(SNARX)
(MRJDX)
(MRJD)
(MRJD)
(SNAR)
(SNAR)
(SNAR)
(SNAR)
(TARX)
(pARX)
(TAR)
(SNARX)
(TAR)
(TAR)
(AR)
Tabela 5: Wyniki uśredniania modeli dla zbioru danych NP 2009-2010 przy użyciu okna
kalibracji długości 28 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu
metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
średnio
% pogr.
% podkr.
AM
OLS
PW
CLS
IRMSE
IMAE
BMA
BIMSE
BIMAE
5.11
2.97
14.38
6.04
4.16
28.73
10.58
5.18
14.95
7.44
7.66
9.63
14.51
4.76
3.01
3.99
3.08
3.42
4.58
2.77
2.54
3.50
3.38
6.69
16.41
16.39
14.15
12.30
9.18
6.11
5.73
2.33
16.65
9.02
6.91
31.01
12.60
6.75
12.49
7.80
5.52
5.37
20.01
9.49
10.05
7.43
3.20
2.27
3.33
1.97
1.63
2.39
2.46
6.56
18.55
14.53
15.61
12.27
8.32
5.07
5.04
1.99
14.13
7.83
5.11
28.49
11.15
4.56
12.61
6.53
4.89
5.48
15.99
7.07
8.29
6.82
3.57
2.23
3.02
1.91
1.52
2.58
2.29
6.65
16.43
15.70
14.74
12.29
0.00
5.52
5.07
2.49
13.68
6.70
4.90
27.89
10.36
4.85
14.68
8.65
7.29
7.69
14.23
5.42
5.05
5.10
2.79
2.49
3.68
1.98
1.76
2.79
2.46
6.66
16.55
15.95
16.63
12.84
9.58
5.74
5.13
2.98
14.32
6.03
4.16
28.67
10.59
5.17
14.96
7.44
7.66
9.58
14.50
4.78
3.03
3.99
3.05
3.29
4.49
2.62
2.41
3.33
3.24
6.67
16.37
16.36
14.21
12.30
9.20
6.06
5.13
2.99
14.33
6.08
4.23
28.67
10.55
5.13
14.91
7.43
7.64
9.52
14.51
4.73
3.00
3.96
3.04
3.30
4.47
2.61
2.37
3.30
3.18
6.71
16.46
16.38
14.16
12.28
9.17
6.07
5.20
2.96
14.36
6.09
4.61
28.35
10.51
5.03
15.23
7.57
7.94
10.31
14.90
4.76
3.13
3.96
3.01
3.63
4.85
3.00
2.79
3.68
3.70
6.61
16.43
16.38
14.52
12.43
9.33
6.25
5.85
3.20
13.62
6.95
4.57
27.69
10.24
4.97
14.69
8.42
7.31
7.83
14.37
5.07
4.86
5.27
2.73
2.97
4.10
2.08
1.70
2.93
2.40
6.81
16.32
16.24
16.21
13.27
10.67
5.37
5.39
2.93
13.89
6.70
4.57
26.59
10.24
4.97
14.69
8.44
7.26
7.86
14.73
5.07
4.77
3.67
2.93
2.97
3.83
2.39
2.03
2.93
2.40
7.30
17.56
16.13
14.04
11.68
9.25
5.95
4.85
2.75
13.14
5.85
4.57
25.84
9.92
4.44
12.91
6.63
6.63
7.36
14.37
4.31
2.82
3.66
2.93
2.33
3.48
1.89
1.70
2.93
2.40
6.64
16.02
15.95
12.52
11.22
9.36
5.34
8.29
8.11
7.49
8.25
8.91
7.81
8.20
8.22
8.21
8.38
26.7%
6.7%
46.7%
40.0%
53.3%
40.0%
40.0%
13.3%
26.7%
6.7%
26.7%
6.7%
20.0%
6.7%
27
BI
(TARX)
(TARX)
(pARX)
(SNARX)
(pARX)
(pARX)
(ARX)
(SNAR)
(TAR)
(SNAR)
(SNAR)
(TAR)
(TARX)
(SNAR)
(SNARX)
(SNARX)
(MRJDX)
(MRJD)
(MRJD)
(SNAR)
(SNAR)
(SNAR)
(SNAR)
(TARX)
(pARX)
(TAR)
(SNARX)
(TAR)
(TAR)
(AR)
Tabela 6: Wyniki uśredniania modeli dla zbioru danych NP 2009-2010 przy użyciu rozszerzającego się okna kalibracji. Kolumna BI oznacza najlepszą metodę bazową dla danego
tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że
metoda była skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
średnio
% pogr.
% podkr.
4.3.3
AM
OLS
PW
CLS
IRMSE
IMAE
BMA
BIMSE
BIMAE
5.11
2.97
14.38
6.04
4.16
28.73
10.58
5.18
14.95
7.44
7.66
9.63
14.51
4.76
3.01
3.99
3.08
3.42
4.58
2.77
2.54
3.50
3.38
6.69
16.41
16.39
14.15
12.30
9.18
6.11
5.73
2.48
16.61
8.97
6.84
29.62
11.76
5.20
12.07
7.57
6.09
5.74
19.87
8.26
8.28
7.59
5.98
4.91
4.93
3.65
3.19
3.91
2.98
7.53
17.97
15.76
14.72
11.90
9.58
6.88
5.11
1.81
14.00
7.43
4.99
28.07
10.12
3.48
12.65
6.27
5.54
7.09
14.86
5.42
6.39
6.76
6.83
5.16
4.66
3.52
3.59
3.67
3.07
8.16
17.67
15.42
12.93
11.65
8.71
6.22
5.06
2.55
13.55
6.72
5.04
27.90
10.40
4.88
14.69
7.96
8.24
10.42
14.76
4.72
3.32
3.89
2.88
3.66
5.23
3.28
2.97
3.87
4.25
6.78
16.73
16.25
14.15
12.77
9.71
6.61
5.13
2.98
14.34
6.03
4.16
28.67
10.59
5.17
14.96
7.43
7.67
9.64
14.51
4.76
3.01
3.98
3.08
3.42
4.59
2.77
2.54
3.50
3.39
6.69
16.41
16.39
14.15
12.30
9.18
6.11
5.13
2.99
14.34
6.07
4.22
28.66
10.54
5.13
14.91
7.42
7.66
9.62
14.48
4.77
3.02
3.99
3.09
3.43
4.58
2.77
2.53
3.49
3.36
6.69
16.41
16.38
14.13
12.28
9.16
6.09
5.22
2.96
14.37
6.08
4.61
28.33
10.51
5.02
15.23
7.56
7.94
10.31
14.90
4.77
3.13
3.95
3.02
3.62
4.87
3.00
2.79
3.94
3.06
7.71
18.07
16.12
14.50
12.43
9.32
6.23
5.85
3.32
13.75
6.95
4.57
27.94
10.24
4.97
14.69
8.03
8.61
11.47
16.26
4.60
2.82
3.66
2.93
2.97
4.27
2.11
1.95
3.68
3.69
6.61
16.42
16.37
12.52
11.68
9.41
6.30
5.39
2.97
14.08
5.85
4.57
27.49
10.24
4.97
14.69
8.03
7.18
8.66
15.78
4.60
2.82
3.66
2.93
2.97
4.27
2.11
1.95
3.09
2.75
7.10
17.29
16.57
12.52
11.68
9.41
6.30
4.85
2.75
13.14
5.85
4.57
25.84
9.92
4.44
12.91
6.63
6.63
7.36
14.37
4.31
2.82
3.66
2.93
2.33
3.48
1.89
1.70
2.93
2.40
6.64
16.02
15.95
12.52
11.22
9.36
5.34
8.29
8.06
7.49
8.25
9.22
8.38
8.44
8.25
8.24
8.45
23.3%
6.7%
20.0%
16.7%
43.3%
26.7%
26.7%
6.7%
23.3%
6.7%
23.3%
6.7%
23.3%
3.3%
BI
(TARX)
(TARX)
(pARX)
(SNARX)
(pARX)
(pARX)
(ARX)
(SNAR)
(TAR)
(SNAR)
(SNAR)
(TAR)
(TARX)
(SNAR)
(SNARX)
(SNARX)
(MRJDX)
(MRJD)
(MRJD)
(SNAR)
(SNAR)
(SNAR)
(SNAR)
(TARX)
(pARX)
(TAR)
(SNARX)
(TAR)
(TAR)
(AR)
Pennsylvania-New Jersey-Maryland Interconnection (2010-2012)
Wyniki dla zbioru PJM przedstawione w tabelach 7-9 nieco odbiegają od dwóch poprzednich. Tym razem nie znajdujemy żadnej metody uśredniania, która byłaby skuteczniejsza
od wszystkich metod bazowych w co najmniej 50% przypadków. W najlepszym wypadku
metoda PW dla okna 7-dniowego jest lepsza niż modele autoregresyjne średnio 2 na 5
razy.
Jeśli przychodzi nam wskazać najdokładniejszą metodę uśredniania w odniesieniu do
błędu ex ante, to ponownie jest to predyktor powstały w oparciu o metodę najmniejszych
28
kwadratów, przy użyciu nieujemnych wag (PW), ale jedynie dla przesuwających się okien
kalibracji. Nieco zaskakująca jest różnica w skuteczności prognoz tą metodą, jeśli zestawimy ze sobą któreś z okien kalibracji o stałej długości z oknem rozszerzającym się, zob.
rys. 4. Takich różnic nie obserwowaliśmy dla dwóch wcześniejszych zbiorów danych.
To nie jedyna rzecz którą różni zbiór PJM od dwóch zbiorów z rynku skandynawskiego. Tym razem znacznie lepiej w porównaniu do pozostałych metod sprawują się metody
IRMSE i IMAE. Zaznaczmy także, że dla wszystkich trzech zbiorów danych podejścia
te dają stosunkowo podobne błędy. Jest to wyraźna różnica względem innych metod, w
szczególności tych opartych o metodę najmniejszych kwadratów (OLS, PW, CLS), które
wykazują się większą zmiennością. Może to być spowodowane zarówno przez występowanie nieograniczonych wag w metodach OLS i PW, jak również przez większą stabilność
metod IRMSE i IMAE, które raczej nie marginalizują żadnej z metod bazowych. Stabilność ta nie oznacza oczywiście większej skuteczności.
80%
Okno 7−dniowe
Okno 28−dniowe
Okno rozszerzajace
70%
# lepsze niz BIMSE/BIMAE
# lepsze niz BIMSE/BIMAE
80%
60%
50%
40%
30%
20%
10%
0%
Okno 7−dniowe
Okno 28−dniowe
Okno rozszerzajace
70%
60%
50%
40%
30%
20%
10%
AM
OLS PW
0%
CLS IRMSE IMAE BMA
Metody
# lepsze niz BIMSE/BIMAE
80%
AM
OLS PW
CLS IRMSE IMAE BMA
Metody
Okno 7−dniowe
Okno 28−dniowe
Okno rozszerzajace
70%
60%
50%
40%
30%
20%
10%
0%
AM
OLS PW
CLS IRMSE IMAE BMA
Metody
Rys. 4: Histogramy przedstawiające ile razy (procentowo) dana metoda uśredniania okazała się lepsza od obu metod zdegenerowanych, tj. BIMSE i BIMAE, w danym tygodniu.
Wykresy przedstawiają porównanie różnych okien kalibracji. Zauważmy, że słupki dla
średniej arytmetycznej są różnych wielkości, mimo że metoda ta daje identyczne prognozy niezależnie od okna kalibracji. Spowodowane jest to tym, że prognozowane wielkości
porównujemy do BIMSE i BIMAE, które nie mają podobnej własności.
Ponownie także obserwujemy negatywny wpływ pików na uśrednianie modeli. Nawet,
gdy któraś z metod uśredniania w tygodniach 4 i 5 daje mniejszy błąd od BIMSE/BIMAE
29
lub BI, to zysk jest stosunkowo niewielki. Dla zbioru PJM widzimy też skuteczność uśrednionych prognoz jest mniejsza również w tygodniach następujących bezpośrednio po tych,
gdzie występowały piki. Istotnie, również dla tygodnia 6 nie obserwujemy żadnej metody
uśredniania, która poprawiałaby błąd prognozy dla indywidualnych metod. Ten tydzień
jest ciekawy również jeśli spojrzymy na błędy metod OLS i PW, czyli tych, które do tej
pory uważaliśmy za wyraźnie najlepsze. Co ciekawe, błędy, które uzyskaliśmy dla tego tygodnia za pomocą tych dwóch metod, przewyższają wszystkie metody bazowe (najgorsze
MRJDX ma błąd WMAE rzędu 18.79)! Jest to jednak jednostkowy przypadek.
Tabela 7: Wyniki uśredniania modeli dla zbioru danych PJM przy użyciu okna kalibracji długości 7 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia
względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda
okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była
skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
AM
OLS
PW
CLS
IRMSE
IMAE
BMA
BIMSE
BIMAE
12.95
6.99
12.51
21.11
28.42
13.94
8.52
8.85
8.09
13.07
7.65
9.29
10.56
6.59
6.89
6.11
8.80
5.58
8.51
9.65
9.01
10.40
10.86
9.20
6.68
9.50
9.23
11.46
18.88
9.27
11.10
9.99
11.99
19.30
29.59
27.37
14.24
11.10
8.26
11.77
9.69
9.20
10.30
7.27
6.82
6.25
8.82
5.67
8.27
10.76
9.87
8.78
10.22
9.91
6.60
8.61
7.91
11.49
17.06
12.15
11.77
7.51
11.98
20.48
27.03
24.94
10.24
9.97
8.17
12.47
8.18
9.53
9.78
6.77
6.97
5.97
8.83
4.39
8.51
10.19
9.33
8.52
9.27
9.37
6.34
8.72
7.02
10.67
16.41
8.55
11.96
7.01
12.24
20.33
28.08
13.23
8.88
9.46
7.95
12.37
8.02
9.46
9.90
5.96
7.05
6.60
8.60
4.56
8.27
9.95
9.19
9.89
10.62
8.91
6.74
9.42
9.45
11.04
18.07
9.05
12.87
7.00
12.50
21.07
28.43
13.93
8.53
8.87
8.06
13.05
7.66
9.29
10.52
6.60
6.86
6.14
8.78
5.54
8.54
9.64
8.99
10.39
10.86
9.19
6.68
9.49
9.24
11.43
18.84
9.27
12.86
6.99
12.52
21.07
28.40
13.89
8.51
8.84
8.07
13.07
7.65
9.29
10.54
6.60
6.87
6.14
8.80
5.53
8.55
9.64
8.97
10.38
10.86
9.17
6.68
9.49
9.22
11.43
18.83
9.29
12.18
7.51
12.10
19.73
27.71
13.29
9.20
9.31
7.98
12.60
8.21
9.68
9.95
6.19
7.41
6.83
8.68
4.60
8.65
10.40
9.32
9.72
10.42
9.09
6.90
9.27
10.02
11.12
17.93
9.21
11.78
7.40
12.41
20.32
27.34
13.16
9.14
9.30
7.93
13.50
7.96
9.55
10.19
6.43
7.17
6.42
8.98
4.62
9.13
10.57
8.38
9.88
10.54
8.76
7.06
9.08
8.63
10.58
18.12
9.59
13.25
6.78
12.52
20.84
28.25
14.04
8.48
9.03
8.32
13.00
7.57
9.28
10.59
6.24
6.91
6.08
8.83
5.28
8.42
9.53
9.14
10.25
10.74
9.03
6.57
9.41
9.02
11.45
18.92
9.08
12.14
7.21
11.68
19.62
26.69
12.74
8.03
8.44
8.00
12.47
7.59
8.73
10.09
6.11
6.49
6.33
8.69
4.64
8.57
9.24
8.39
9.54
10.17
8.11
6.59
8.95
8.48
10.51
18.05
8.64
10.46
10.56
10.03
średnio
10.62
11.35
10.60
10.41
10.61
10.60
10.51
% pogr.
% podkr.
10.0%
10.0%
43.3%
30.0%
46.7%
40.0%
30.0%
30.0%
10.0%
10.0%
10.0%
10.0%
33.3%
16.7%
30
BI
(ARX)
(TARX)
(MRJD)
(TAR)
(TAR)
(AR)
(TAR)
(IHMARX)
(IHMARX)
(TARX)
(MRJD)
(ARX)
(ARX)
(MRJD)
(TAR)
(pAR)
(TARX)
(TARX)
(MRJD)
(TARX)
(pARX)
(TARX)
(pAR)
(TARX)
(pAR)
(pAR)
(TAR)
(TAR)
(TAR)
(MRJD)
Tabela 8: Wyniki uśredniania modeli dla zbioru danych PJM przy użyciu okna kalibracji długości 28 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia
względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda
okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była
skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
AM
OLS
PW
CLS
IRMSE
IMAE
BMA
BIMSE
BIMAE
12.95
6.99
12.51
21.11
28.42
13.94
8.52
8.85
8.09
13.07
7.65
9.29
10.56
6.59
6.89
6.11
8.80
5.58
8.51
9.65
9.01
10.40
10.86
9.20
6.68
9.50
9.23
11.46
18.88
9.27
22.85
16.95
15.65
22.06
27.68
17.82
18.34
14.70
14.77
12.81
9.02
7.92
12.50
8.14
7.46
5.80
8.07
5.26
9.30
9.76
9.79
10.40
11.28
8.98
6.08
8.43
7.43
10.42
17.03
9.92
22.10
17.83
14.93
21.36
26.89
16.32
12.31
13.59
11.24
12.71
8.45
8.38
10.36
6.93
6.81
6.03
8.35
4.81
9.25
9.08
9.17
10.28
11.08
8.84
5.65
8.26
6.93
10.26
16.66
9.07
15.11
7.47
12.25
21.32
28.00
12.75
9.23
9.84
8.43
12.84
8.25
8.92
10.22
7.24
6.87
6.76
8.65
5.04
8.93
9.60
9.28
9.75
11.09
8.90
6.52
9.15
9.19
11.30
18.78
9.63
12.98
6.97
12.52
21.10
28.46
13.93
8.52
8.86
8.11
13.08
7.67
9.29
10.54
6.62
6.85
6.14
8.78
5.58
8.56
9.65
9.00
10.39
10.86
9.20
6.68
9.49
9.23
11.44
18.86
9.30
12.96
6.99
12.50
21.11
28.42
13.90
8.50
8.88
8.10
13.08
7.66
9.28
10.55
6.61
6.86
6.13
8.79
5.58
8.55
9.64
8.99
10.38
10.87
9.18
6.68
9.48
9.22
11.44
18.85
9.32
13.26
6.79
12.53
20.80
28.25
14.04
8.48
9.03
8.32
13.00
7.57
9.29
10.60
6.24
6.91
6.07
8.84
5.28
8.42
9.53
9.14
10.26
10.74
9.03
6.57
9.41
9.02
11.45
18.92
9.08
15.64
7.74
12.47
21.01
27.62
12.74
9.23
9.86
8.45
12.87
8.16
8.86
9.89
7.41
7.58
7.11
8.70
4.74
9.40
9.54
8.63
9.86
11.31
8.69
6.67
8.98
9.27
10.94
19.06
10.02
14.06
7.71
11.77
21.43
27.64
14.42
8.21
10.91
8.30
13.26
8.28
8.78
10.18
7.58
6.71
6.39
8.70
4.74
9.46
9.42
8.79
9.89
11.35
9.05
7.06
9.21
8.77
10.73
18.06
10.37
12.14
7.21
11.68
19.62
26.69
12.74
8.03
8.44
8.00
12.47
7.59
8.73
10.09
6.11
6.49
6.33
8.69
4.64
8.57
9.24
8.39
9.54
10.17
8.11
6.59
8.95
8.48
10.51
18.05
8.64
10.75
10.71
10.03
średnio
10.62
12.22
11.46
10.71
10.62
10.62
10.56
% pogr.
% podkr.
33.3%
10.0%
40.0%
26.7%
50.0%
30.0%
33.3%
6.7%
33.3%
10.0%
33.3%
10.0%
36.7%
16.7%
31
BI
(ARX)
(TARX)
(MRJD)
(TAR)
(TAR)
(AR)
(TAR)
(IHMARX)
(IHMARX)
(TARX)
(MRJD)
(ARX)
(ARX)
(MRJD)
(TAR)
(pAR)
(TARX)
(TARX)
(MRJD)
(TARX)
(pARX)
(TARX)
(pAR)
(TARX)
(pAR)
(pAR)
(TAR)
(TAR)
(TAR)
(MRJD)
Tabela 9: Wyniki uśredniania modeli dla zbioru danych PJM przy użyciu rozszerzającego
się okna kalibracji. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia
względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda
okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była
skuteczniejsza niż BIMSE i BIMAE.
Tydzień
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
AM
OLS
PW
CLS
IRMSE
IMAE
BMA
BIMSE
BIMAE
12.95
6.99
12.51
21.11
28.42
13.94
8.52
8.85
8.09
13.07
7.65
9.29
10.56
6.59
6.89
6.11
8.80
5.58
8.51
9.65
9.01
10.40
10.86
9.20
6.68
9.50
9.23
11.46
18.88
9.27
22.59
17.08
14.47
22.20
29.05
21.28
12.40
12.03
10.69
16.83
10.21
14.13
11.74
8.93
11.00
8.38
11.42
6.96
12.81
12.38
9.89
10.94
11.26
9.78
7.75
8.70
9.76
10.82
17.93
11.98
21.71
16.31
14.80
20.57
26.04
19.70
12.09
15.19
11.21
16.24
9.55
11.74
12.76
7.94
8.93
7.62
10.38
7.66
9.24
11.16
10.89
12.65
12.49
9.81
8.09
10.10
10.42
11.68
19.19
10.74
15.10
7.44
12.51
19.87
26.66
13.45
8.51
9.99
8.55
13.31
8.05
9.74
10.23
6.66
6.65
6.57
8.85
5.43
9.17
9.88
9.06
10.64
10.42
9.07
6.87
9.17
8.76
10.85
18.29
10.23
12.98
6.97
12.52
21.09
28.41
13.93
8.51
8.87
8.10
13.07
7.65
9.30
10.56
6.59
6.88
6.11
8.79
5.58
8.52
9.65
9.01
10.40
10.86
9.19
6.69
9.50
9.23
11.45
18.87
9.28
12.96
6.99
12.51
21.10
28.41
13.91
8.51
8.87
8.09
13.08
7.66
9.30
10.55
6.61
6.87
6.12
8.79
5.58
8.53
9.65
9.00
10.40
10.85
9.20
6.69
9.49
9.23
11.45
18.86
9.30
23.07
16.82
14.86
19.62
33.72
22.76
12.40
12.19
10.59
17.11
7.65
14.07
11.72
8.88
10.82
8.43
11.47
7.00
13.01
12.59
9.92
11.00
11.33
10.01
7.88
8.93
9.97
11.00
18.35
12.39
15.64
7.74
12.54
19.62
27.29
12.74
9.23
9.86
8.32
13.27
8.43
9.20
10.34
7.09
6.80
6.56
8.96
5.92
8.94
9.69
9.11
11.00
10.45
9.49
6.79
9.12
9.01
11.09
18.44
10.22
14.07
7.71
12.51
20.88
27.20
13.07
9.23
9.86
8.32
13.27
8.43
9.20
10.34
7.09
6.80
6.56
8.96
5.92
8.94
9.69
9.11
11.00
10.45
9.49
6.79
9.12
9.01
11.09
18.44
10.22
12.14
7.21
11.68
19.62
26.69
12.74
8.03
8.44
8.00
12.47
7.59
8.73
10.09
6.11
6.49
6.33
8.69
4.64
8.57
9.24
8.39
9.54
10.17
8.11
6.59
8.95
8.48
10.51
18.05
8.64
10.76
10.76
10.03
średnio
10.62
13.18
12.90
10.67
10.62
10.62
13.32
% pogr.
% podkr.
60.0%
10.0%
13.3%
6.7%
3.3%
3.3%
53.3%
3.3%
60.0%
10.0%
60.0%
10.0%
13.3%
3.3%
32
BI
(ARX)
(TARX)
(MRJD)
(TAR)
(TAR)
(AR)
(TAR)
(IHMARX)
(IHMARX)
(TARX)
(MRJD)
(ARX)
(ARX)
(MRJD)
(TAR)
(pAR)
(TARX)
(TARX)
(MRJD)
(TARX)
(pARX)
(TARX)
(pAR)
(TARX)
(pAR)
(pAR)
(TAR)
(TAR)
(TAR)
(MRJD)
5
Podsumowanie
Praca przedstawia analizę dotyczącą prognozowania cen spotowych energii elektrycznej
z wykorzystaniem uśredniania modeli. Technika ta polega na użyciu wielu predyktorów
tej samej zmiennej i stworzeniu modelu, który przyniósłby prognozy dokładniejsze niż
każda z nich z osobna. Metody bazowe wykorzystywały modele szeregów czasowych, w
znacznej większości oparte na autoregresji.
Metody, które zwróciły najdokładniejsze prognozy opierają się o metodę najmniejszych kwadratów. Wszystkie 3 takie podejścia (bez ograniczeń nałożonych na wagi – OLS,
z wagami nieujemnymi – PW oraz z wagami nieujemnymi, sumującymi się do 1 – CLS)
zachowują się wyraźnie lepiej niż pozostałe modele. W szczególności stwierdzamy, że
metoda PW przy użyciu siedmiodniowego okna kalibracji jest podejściem optymalnym.
W ujęciu globalnym, czyli dla wszystkich 3 zbiorów danych, taki model okazał się skuteczniejszy od wszystkich metod bazowych w nieco ponad 50% przypadków. Sugeruje to,
że zastosowanie go w praktyce jest jak najbardziej wskazane. Możemy tym samym uznać,
że niniejsza analiza odniosła sukces, ponieważ niejako poprawiamy rezultaty uzyskane
w pracy [14], z której pochodzą zastosowane tutaj metody bazowe. Warto zaznaczyć również, że dla rynku Nord Pool w okresie 1998-1999 metody OLS i PW dały lepsze rezultaty
od wszystkich metod bazowych również po uśrednieniu tygodniowych błędów WMAE, co
sugeruje, że obie te metody nie miały niepożądanych wahań jeśli chodzi o błąd prognozy.
Jeśli zaś chodzi o różnice w prognozach między zbiorami danych, to są one nieznaczne, jeśli skalibrujemy modele na optymalnym w niniejszym badaniu okresie 7 dni. Dla
wszystkich trzech rozpatrywanych szeregów czasowych uśrednianie wynikające z różnych
wariantów metody najmniejszych kwadratów prognozuje ceny spotowe energii elektrycznej najdokładniej. Dla rynku skandynawskiego modele te zafunkcjonowały nieco lepiej
niż w przypadku rynku z wschodniego wybrzeża Stanów Zjednoczonych.
Metody takie jak: średnia arytmetyczna, uśrednianie Bayesowskie, czy też modele,
gdzie dobieramy wagi proporcjonalnie do wartości pewnej funkcji straty, prognozowały
ceny spotowe energii elektrycznej w stopniu niezadowalającym. W większości wypadków prognozy te okazywały się gorsze zarówno od najdokładniejszej metody bazowej,
jak i obu zdegenerowanych metod uśredniania. Należy również zaznaczyć, że użycie okna
kalibracji długości 4 tygodni lub okna rozszerzającego się stwarza pewne zagrożenie, ponieważ dla pewnych tygodni uzyskiwane błędy bardzo wyraźnie przewyższają błędy ex
ante. Dzieje się tak nawet dla metod, które uznaliśmy za satysfakcjonujące w przypadku
okna 7-dniowego.
Wyniki uzyskane przez Bordignona i in. [4] również wskazują na to, że uśrednianie
modeli zastosowane do prognozowania cen spotowych zwiększa skuteczność osiąganych
rezultatów. W porównaniu do niniejszej pracy, wspomniane badanie nie jest aż tak kompleksowe. Autorzy analizują tam jedynie jedną metodę uśredniania – średnią arytmetycz-
33
ną. Z drugiej jednak strony, jeśli skupimy się na porównaniu tylko metody AM, to zadziałała ona skuteczniej w cytowanej pracy. W przeciwieństwie do tego badania, tam autorzy
stosują metody bazowe, które są ze sobą znacznie mniej skorelowane.
Raviv i in. [16] również rozpatrują mniejszą liczbę metod uśredniania modeli. Zastosowali oni średnią arytmetyczną (AM) i metodę najmniejszych kwadratów z takimi samymi
ograniczeniami jak metoda CLS z niniejszej pracy. Ponownie wnioski są optymistyczne
– uśrednianie modeli skutkuje poprawą dokładności prognoz. Podobnie jak tutaj, metoda
CLS okazała się lepsza od zwykłej średniej arytmetycznej.
34
6
Bibliografia
Literatura
[1] Aksu C., Sevket I.G. (1992). An empirical analysis of the accuracy of SA, OLS, ERLS
and NRLS combination forecasts. International Journal of Forecasting 8(1), 27-43.
[2] Barnard, G. A. (1963). New methods of quality control. Journal of Royal Statistical
Society Series A 126(4), 255-258.
[3] Bates, J. M., Granger, C. W. J. (1969). The combination of forecasts. Operational Research Quarterly 20, 451–468.
[4] Bordignon, S., Bunn, D. W., Lisi, F., Nan, F. (2013). Combining day-ahead forecasts
for British electricity prices. Energy Economics 35, 88-103.
[5] Coleman, T. F., Li, Y. (1996). A reflective Newton method for minimazing a quadratic
function suubject to bounds on some of the variables. SIAM Journal on Optimization,
6(4), 1040–1058.
[6] Clemen, R. T. (1989). Combining forecasts: a review and annotated bibliography. International Journal of Forecasting 5, 559–583.
[7] Elliott, G., Timmermann A. (2004). Optimal forecast combinations under general loss
functions and forecast error distributions. Journal of Econometrics 122, 47-79.
[8] Fernández, C., Ley, E., Steel, M. F. (2001). Benchmark priors for Bayesian model
averaging. Journal of Econometrics 16, 381-427.
[9] Granger, C. W. J., Ramanathan, R. (1984). Improved methods of combining forecasts.
Journal of Forecasting 3, 197–204.
[10] Hoeting, J. A., Madigan, D., Raftery, A. E., Volinsky, C. T. (1999). Bayesian model
averaging: A tutorial. Statistical Science 14(4), 382-417.
[11] Hsieh, D. A., Manski, C. F. (1987). Monte Carlo evidence on adaptive maximum
likelihood estimation of a regression. Annals of Statistics 15, 541-551.
[12] Janczura, J., Trück, S., Weron, R., Wolf, R. (2013). Identifying spikes and seasonal
components in electricity spot price data: A guide to robust modeling. Energy Economics 38, 96-27.
[13] Misiorek, A., Trück, S., Weron, R. (2006). Point and interval forecasting of spot electricity prices: linear vs. non-linear time series models. Studies in Nonlinear Dynamics
and Econometrics, 10(3), Article 2.
35
[14] Misiorek, A., Weron, R. (2008). Forecasting spot electricity prices: A comparison of
parametric and semiparametric time series models. International Journal of Forecasting
24, 744-763.
[15] Nowotarski, J., Tomczyk, J., Weron, R. (2013). Robust estimation and forecasting
of the long-term seasonal component of electricity spot prices. Energy Economics 39,
12-27.
[16] Raviv, E., Bouwman, K. E., van Dijk, D. (2012). Forecasting short term electricity
prices. Working Paper.
[17] Stock, J. H., Watson, M. W. (2004). Combination forecasts of output hrowth in a
seven-country data set. Journal of Forecasting 23(6), 405-430.
[18] Timmermann, A. (2004). Forecast combination. W Elliot, G., Granger, C. W. J., Timmermann, A., Handbook of Economic Forecasting (s. 135-196).
[19] Weron, R. (2006). Modelling and Forecasting Electricity Loads and Prices: A Statistical Approach. Wiley, Chichester.
36
HSC Research Report Series 2013
For a complete list please visit http://ideas.repec.org/s/wuu/wpaper.html
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
Forecasting of daily electricity spot prices by incorporating intra-day
relationships: Evidence form the UK power market by Katarzyna
Maciejowska and Rafał Weron
Modeling and forecasting of the long-term seasonal component of the EEX
and Nord Pool spot prices by Jakub Nowotarski, Jakub Tomczyk and Rafał
Weron
A review of optimization methods for evaluation of placement of distributed
generation into distribution networks by Anna Kowalska-Pyzalska
Diffusion of innovation within an agent-based model: Spinsons,
independence and advertising by Piotr Przybyła, Katarzyna Sznajd-Weron
and Rafał Weron
Going green: Agent-based modeling of the diffusion of dynamic electricity
tariffs by Anna Kowalska-Pyzalska, Katarzyna Maciejowska, Katarzyna
Sznajd-Weron and Rafał Weron
Relationship between spot and futures prices in electricity markets: Pitfalls
of regression analysis by Michał Zator
An empirical comparison of alternate schemes for combining electricity
spot price forecasts by Jakub Nowotarski, Eran Raviv, Stefan Trueck and
Rafał Weron
Revisiting the relationship between spot and futures prices in the Nord Pool
electricity market by Rafał Weron and Michał Zator
Rewiring the network. What helps an innovation to diffuse? by Katarzyna
Sznajd-Weron, Janusz Szwabiński, Rafał Weron and Tomasz Weron
Going green: Agent-based modeling of the diffusion of dynamic electricity
tariffs by Anna Kowalska-Pyzalska, Katarzyna Maciejowska, Katarzyna
Sznajd-Weron, Karol Suszczyński and Rafał Weron
Forecasting of daily electricity prices with factor models: Utilizing intra-day
and inter-zone relationships by Katarzyna Maciejowska and Rafał Weron
Computing electricity spot price prediction intervals using quantile
regression and forecast averaging by Jakub Nowotarski and Rafał Weron
Long term probabilistic load forecasting and normalization with hourly
information by Tao Hong, Jason Wilson and Jingrui Xie
Fuzzy interaction regression for short term load forecasting by Tao Hong
and Pu Wang
Energy forecasting: Past, present and future by Tao Hong
Global Energy Forecasting Competition 2012 by Tao Hong, Pierre Pinson
and Shu Fan
Short-term forecasting of electricity spot prices using model averaging by
Jakub Nowotarski