HSC Research Rep
Transkrypt
HSC Research Rep
HSC Research Report HSC/13/17 Short-term forecasting of electricity spot prices using model averaging (Krótkoterminowe prognozowanie spotowych cen energii elektrycznej z wykorzystaniem uśredniania modeli) Jakub Nowotarski Hugo Steinhaus Center, Wrocław University of Technology, Poland Hugo Steinhaus Center Wrocław University of Technology Wyb. Wyspiańskiego 27, 50-370 Wrocław, Poland http://www.im.pwr.wroc.pl/~hugo/ POLITECHNIKA WROCAWSKA WYDZIA PODSTAWOWYCH PROBLEMÓW TECHNIKI KIERUNEK: Matematyka SPECJALNO: Matematyka Finansowa i Ubezpieczeniowa PRACA MAGISTERSKA Krótkoterminowe prognozowanie spotowych cen energii elektrycznej z wykorzystaniem u±redniania modeli AUTOR: Jakub Nowotarski PROMOTOR: dr hab. Rafaª Weron, prof. PWr OCENA PRACY: WROCAW 2013 Spis treści 1 Wstęp 2 2 Spotowe ceny energii elektrycznej 2.1 Giełdy energii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Podstawowe własności i modelowanie cen spotowych . . . . . . . . . . . 2.2.1 Sezonowość . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Powracanie do średniej . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Piki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Zbiory danych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Nord Pool 1998-1999 . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Nord Pool 2009-2010 . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Pennsylvania-New Jersey-Maryland Interconnection (2010-2012) 4 4 4 4 5 6 7 7 9 10 3 Prognozowanie cen spotowych 3.1 Wprowadzenie . . . . . . . . . . . . . . . . . . . . 3.2 Modele prognozowania krótkoterminowego . . . . . 3.2.1 Podstawowy model autoregresji . . . . . . . 3.2.2 Modele wstępnie przetworzone . . . . . . . . 3.2.3 Modele progowe . . . . . . . . . . . . . . . 3.2.4 Procesy powracające do średniej ze skokami 3.2.5 Modele semiparametryczne . . . . . . . . . . . . . . . . 11 11 12 12 12 13 13 14 4 Uśrednianie modeli 4.1 Metody uśredniania modeli . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Średnia arytmetyczna . . . . . . . . . . . . . . . . . . . . . . . . 4.1.2 Metody oparte o metodę najmniejszych kwadratów . . . . . . . . 4.1.3 Metody oparte o miary błędu prognozy . . . . . . . . . . . . . . 4.1.4 Uśrednianie Bayesowskie . . . . . . . . . . . . . . . . . . . . . . 4.2 Prognozowanie i pomiar jego dokładności . . . . . . . . . . . . . . . . . 4.3 Wyniki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Nord Pool 1998-1999 . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Nord Pool 2009-2010 . . . . . . . . . . . . . . . . . . . . . . . . 4.3.3 Pennsylvania-New Jersey-Maryland Interconnection (2010-2012) 16 16 17 17 18 19 20 21 21 25 28 5 Podsumowanie 33 6 Bibliografia 35 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Wstęp W zagadnieniu prognozowania badacze często mają do czynienia z różnorodnymi predyktorami, opisującymi tę samą wartość. W takiej sytuacji pojawia się pytanie, jak optymalnie wykorzystać te informacje. Innymi słowy, należy rozstrzygnąć, czy korzystniej jest jako predyktor wybrać jedną z dostępnych metod, czy może skorzystać z nich wszystkich i używając odpowiednich wag, skonstruować na ich podstawie nowy model? To drugie podejście nazywamy uśrednianiem modeli – na przestrzeni ostatnich kilkudziesięciu lat, począwszy od prac Barnarda [2] oraz Batesa i Grangera [3], zyskało szerokie uznanie w literaturze. Szczególnie duże zastosowanie tej techniki obserwujemy w prognozowaniu PKB, inflacji, zmienności na rynkach finansowych, danych meteorologicznych, czy nawet wyników meczów piłkarskich lub ryzyka politycznego [6]. Jednakże, istnieje stosunkowo niewiele publikacji dotyczących zastosowań uśredniania modeli dla rynków energii elektrycznej. Rynki te są z pewnością interesujące z perspektywy matematyki finansowej. Fakt ten wynika ze zmian strukturalnych, które miały miejsce w wielu rozwiniętych krajach począwszy od lat 90. ubiegłego wieku. Postępująca liberalizacja rynków wymusiła zmiany w obrocie tym towarem. Obecnie ceny ustalane są na podstawie popytu i podaży, co w konsekwencji powoduje, że proces cen energii elektrycznej wykazuje pewne unikalne cechy, niespotykane na innych rynkach towarowych lub finansowych. Energia elektryczna, sprzedawana i kupowana obecnie po cenach rynkowych, jest towarem specyficznym. Brak efektywnych możliwości jej przechowywania prowadzi do bardzo wysokiej zmienności cen na rynku hurtowym, sięgającej nawet 50% w skali dnia, czyli więcej niż jakikolwiek inny towar [19]. W dodatku, zapotrzebowanie na energię elektryczną jest silnie zależne od cykli pogodowych i biznesowych. Tym samym, potencjalne błędy prognoz zapotrzebowania oraz cen energii elektrycznej przekładają się na duże koszty późniejszej odsprzedaży lub dokupienia jej na rynku bilansującym i mogą prowadzić do ogromnych strat finansowych. Wszystko to wymusza na uczestnikach rynku konieczność zabezpieczania się przed ryzykiem. Prognozowanie krótkoterminowe, które jest tematem niniejszej pracy, dotyczy horyzontu czasowego obejmującego okres od kilku godzin do kilku dni i z punktu widzenia uczestnika rynku jest istotne przy przeprowadzaniu bieżących transakcji. Stąd właśnie wynika potrzeba rozwijania technik prognozowania, z których jedną z popularniejszych jest analiza statystyczna szeregów czasowych. W literaturze możemy spotkać wiele metod powstałych w oparciu o autoregresję, np. modele ARIMA lub Seasonal ARIMA (SARIMA), modele ARX, czyli autoregresja z uwzględnieniem zmiennej zewnętrznej (fundamentalnej) lub modele przełącznikowe (ang. treshold autoregressive, TAR). Ponadto, występują także różne rodzaje procesu powracającego do średniej, procesy powracające do średniej ze skokami (ang. mean–reverting jump–diffusion), modele ARCH i GARCH, czy wresz- 2 cie markowskie modele zmieniające stany (ang. Markov regime-switching). Wymienione metody to jedynie najbardziej popularne podejścia z dziedziny szeregów czasowych i procesów stochastycznych. Dokładniejszy przegląd modeli, wraz z odniesieniami do prac, w których są one stosowane, znajduje się w [19]. Celem niniejszej pracy jest analiza wybranych metod uśredniania modeli na przykładzie cen spotowych energii elektrycznej. W obliczu wielu metod prognozowania pożądanym rezultatem jest określenie skutecznego sposobu uśredniania, tj. przydzielenie odpowiednich wag poszczególnym (pojedynczym) metodom bazowym. Innymi słowy postaramy się wykorzystać różne predyktory do skonstruowania nowego, skuteczniejszego. Praca składa się z pięciu rozdziałów. Rozdział drugi przedstawia pokrótce najważniejsze cechy charakterystyczne cen energii elektrycznej. Zaczyna się on krótkim przedstawieniem zasad działania rynku, po czym wymienione zostały podstawowe własności modelowania cen spotowych. Również tam znajdują się opisy wykorzystanych zbiorów danych. Rozdział trzeci poświęcony jest prognozowaniu cen spotowych. Zawiera on opis bazowych metod prognozowania przy użyciu modeli szeregów czasowych, które będą punktem wyjścia przy procedurach uśredniania. Kolejny rozdział skupia się na uśrednianiu modeli. Po przedstawieniu definicji wykorzystanych metod, zawiera on opis schematu prognozowania wraz z używanymi miarami dokładności prognoz. Rozdział kończy się przedstawieniem wyników analiz numerycznych i ich opisem. Ostatni rozdział podsumowuje całą pracę. 3 2 2.1 Spotowe ceny energii elektrycznej Giełdy energii W wyniku liberalizacji sektora elektroenergetycznego w wielu krajach utworzone zostały giełdy energii, czyli platformy obrotu tym towarem. Handel odbywa się w odniesieniu do danej godziny (czasem półgodziny), a uczestnicy rynku składają oferty z odpowiednim wyprzedzeniem. Tym samym rynek podzielony jest na 24 aukcje godzinowe (lub 48 aukcji półgodzinnych). Ponadto, brak możliwości magazynowania energii elektrycznej i konieczność bilansowania w czasie rzeczywistym powodują, że obrót nią jest diametralnie różny od obrotu innymi towarami. Rolą giełdy energii jest ustalenie rynkowej ceny rozliczeniowej (inaczej ceny spotowej) na podstawie ofert złożonych przez uczestników rynku. Cena spotowa energii elektrycznej w rzeczywistości dotyczy rynku dnia następnego, co różni ten rynek od klasycznych rynków spotowych. Rynkową cenę rozliczeniową definiujemy jako punkt przecięcia krzywych podaży i popytu. Poza rynkiem spotowym występuje też rynek terminowy, na którym ma miejsce obrót instrumentami pochodnymi na energię elektryczną. Podobnie jak na innych rynkach finansowych występują tam np. kontrakty futures lub opcje. Handel tymi instrumentami ułatwia uczestnikom rynku zarządzanie ryzykiem i zabezpieczanie się przed niepożądanymi z ich punktu widzenia cenami. Poza rynkiem regulowanym, wiele transakcji opiera się na umowach dwustronnych. Taki rynek nazywamy bilateralnym lub pozagiełdowym (ang. Over–The–Counter, OTC). W przeciwieństwie do transakcji, które mają miejsce na giełdach energii, strony w umowie bilateralnej nie mają obowiązku upubliczniać szczegółów transakcji. Mimo, że istnieją platformy obrotu pozagiełdowego, służą one jedynie jako tablica ofert i nie pełnią roli giełd. 2.2 Podstawowe własności i modelowanie cen spotowych Zbudowanie dobrego modelu opisującego zachowanie cen spotowych energii elektrycznej bez uprzedniego zrozumienia pewnych ich własności jest trudne. Co istotne, niektóre z nich mocno różnią się od specyfiki innych rynków towarowych i finansowych. Za najbardziej charakterystyczne cechy rynku energii uważa się: sezonowość, powracanie do średniej oraz piki. Te ostatnie w dużej mierze wpływają na bardzo wysoką zmienność cen spotowych. 2.2.1 Sezonowość Na rynkach energii elektrycznej proces kształtowania się cen jest silnie zależny od zapotrzebowania, które zawiera okresowe fluktuacje. Czynniki, które się do tego przyczyniają to m.in. temperatura i długość dnia astronomicznego. W danych zapotrzebowania na 4 energię elektryczną obserwujemy również silne okresowości tygodniowe i dzienne. Jednak największym wyzwaniem jest z pewnością modelowanie komponenty długoterminowej sezonowości (ang. long–term seasonal component, LTSC). Na większości rynków nie obserwujemy wyraźnych okresowości rocznych, co poddaje w wątpliwość użyteczność metod opartych na regularnych funkcjach trygonometrycznych. Przykładowa długoterminowa funkcja sezonowości została zaznaczona na rysunku (1). Dokładne opisanie długoterminowego trendu jest niezwykle istotne przy modelowaniu cen energii. Standardowym podejściem jest rozbicie wyjściowego szeregu czasowego Pt , reprezentującego ceny spotowe, na składniki: Pt = Tt + st + Xt , gdzie Tt odpowiada za sezonowość długoterminową, st reprezentuje okresowości krótsze, nie dłuższe niż tydzień, natomiast Xt jest procesem stochastycznym opisującym losowy charakter zjawiska. Źle wyestymowana komponenta sezonowa doprowadzi nas do całkowicie odmiennych procesów stochastycznych Xt i w konsekwencji do być może błędnych wniosków na temat specyfiki procesu cen. Spośród wielu metod estymowania i prognozowania komponenty sezonowej należy z pewnością wyróżnić trzy podejścia: funkcje przedziałami (np. miesiącami) stałe (ang. dummies), funkcje trygonometryczne, oraz falki. Jak pokazują ostatnie badania [15], ostatnie z tych trzech podejść wydaje się być najrozsądniejsze zarówno jeśli chodzi o dopasowanie sezonowości do wyjściowego szeregu czasowego, jak i przy prognozowaniu w okresie do jednego roku. Niemniej jednak, kiedy skupiamy się na prognozach krótkoterminowych, często modelowanie komponenty sezonowej jest pomijane. Również w tej pracy zastosujemy takie podejście. 2.2.2 Powracanie do średniej Podobnie jak inne towary, ceny energii elektrycznej uważane są za powracające do średniej. Fakt ten wydaje się mieć intuicyjne uzasadnienie: wyższe ceny wymuszają na producentach energii elektrycznej uruchomienie dodatkowych źródeł, co z kolei po pewnym czasie może doprowadzić do sytuacji, w której podaż przewyższa popyt. Tym samym na rynku dojdzie wtedy do spadku cen. Kwestią dyskusyjną może być jedynie szybkość powrotu do średniej. Zauważmy również, że przy takiej własności proces cen energii elektrycznej powinien być opisywany procesami stochastycznymi, które taką własność posiadają, jak np. proces Orsteina–Uhlenbecka, znany również w matematyce finansowej jako model Vasička, który w czasie dyskretnym jest procesem autoregresji rzędu 1. 5 250 Cena spotowa Komponenta sezonowa Cena PJM [USD/MWh] 200 150 100 50 0 0 200 400 600 800 1000 1200 Dni [Sty 1, 2006 − Kwi 28, 2011] 1400 1600 1800 Rys. 1: Średnie dzienne ceny spotowe dla rynku PJM w okresie 1.01.2006–28.04.2011. Na czerwono została zaznaczona komponenta sezonowa (LTSC) wyestymowana przy użyciu dyskretnej transformaty falkowej. Na wykresie wyraźnie widać piki cenowe, które występują na tyle często, że nie można ich pominąć podczas modelowania. Proces ceny spotowej jest uważany również za powracający do średniej – istotnie, jak widzimy, ceny na przestrzeni kilku lat utrzymują się na podobnym poziomie. 2.2.3 Piki Ostatnią i być może najbardziej charakterystyczną cechą cen energii elektrycznej są tzw. piki cenowe, które występują na większości giełd energii. Takie zachowanie cen energii elektrycznej skutkuje niespotykaną na innych rynkach finansowych zmiennością. W skali dziennej odchylenie standardowe zwrotów z cen sięga nawet 50%, podczas gdy dla innych rynków zazwyczaj nie przekracza ona 4% [19]. Na szerszej skali czasowej zmienność cen nie jest już aż tak duża, co niejako wynika z własności powracania do średniej. Piki cenowe występują często przy współudziale ekstremalnych warunków pogodowych i wysokiego zapotrzebowania na energię elektryczną. Zdarzenia te mają miejsce w różnych okresach dla różnych części świata – np. w Skandynawii skoki cen zdarzają się najczęściej w zimie, a w Stanach Zjednoczonych i Australii w lecie. Bezpośrednią przyczyną występowania pików cenowych jest brak możliwości składowania energii elektrycznej oraz strategie uczestników rynku przy składaniu ofert na giełdach energii. Dla wielu przedsiębiorstw rynkowych energia jest towarem kluczowym, dlatego też tak istotne dla nich jest utrzyma6 nie ciągłości dostaw. Tym samym, niektórzy uczestnicy rynku są skłonni zapłacić każdą cenę w celu utrzymania dostaw. Co ciekawe, ekstremalne ceny energii elektrycznej zazwyczaj nie utrzymują się zbyt długo. Najczęściej już po kilku godzinach cena wraca do wcześniejszego, stosunkowo niskiego poziomu. Występowanie skoków cenowych nie jest przy tym jednorodne w czasie. Wprawdzie zazwyczaj zdarzenia te obserwujemy w godzinach szczytu, gdy zapotrzebowanie na energię elektryczną jest największe, jednak i od tej reguły zdarzają się wyjątki. Rysunek 1 pokazuje, że piki są wyraźne, nawet gdy rozważymy średnie dobowe ceny spotowe. Piki stanowią wyzwanie z punktu widzenia modelowania cen energii elektrycznej. Ich właściwa identyfikacja wpływa na poprawność stosowanego modelu. Problem jednak w tym, że w literaturze trudno spotkać formalną definicję skoku cenowego. Dyskusję na ten temat wraz z narzędziami do identyfikacji ekstremalnych zachowań procesu cen spotowych można znaleźć w [12]. 2.3 Zbiory danych W niniejszej pracy wykorzystano szeregi czasowe spotowych cen energii z dwóch rynków energii: skandynawskiego Nord Pool w dwóch okresach: 1998-1999 oraz 2009-2010 i amerykańskiego Pennsylvania-New Jersey-Maryland Interconnection (PJM) w okresie 2010-2012. Pierwszy z trzech zbiorów danych pochodzi z pracy [14], a pozostałe dwa stanowią stosunkowo szerokie uzupełnienie, co pozwoli na numeryczną analizę uśredniania modeli dla rynków w różnych warunkach i w efekcie uczyni wnioski z badań nieco bardziej ogólnymi. 2.3.1 Nord Pool 1998-1999 Dane pochodzą ze skandynawskiej giełdy energii i zawierają godzinowe rynkowe ceny rozliczeniowe (ang. market clearing price) oraz temperaturę w okresie 2.04.1998-5.12.1999. Szereg czasowy powstał na podstawie danych publikowanych przez operatora giełdy energii (www.nordpool.com) i Szwedzkiego Instytutu Meteorologii i Hydrologii (www.smhi.se). Przez temperatury rozumiemy tutaj średnie z obserwacji godzinowych dla skandynawskich miast: Bergen, Helsinki, Malmö, Sztokholm, Oslo i Trondheim. Pierwsze 39 tygodni danych zostało wykorzystanych do kalibracji modeli. Temperatura została wykorzystana jako zmienna zewnętrzna (fundamentalna). Na rysunku 2 widzimy specyfikę rynku skandynawskiego – ceny spotowe energii elektrycznej są najwyższe przy najniższych temperaturach. W odniesieniu do pracy źródłowej, z której pochodzi analiza prognozowania krótkoterminowego z wykorzystaniem wcześniej wspomnianych modeli, w niniejszym badaniu rozszerzono okres prognozy do 44 tygodni. W pracy Misiorka i Werona [14] składał się on z czterech okresów, które mniej więcej odpowiadały poszczególnym porom roku. W 7 Cena NP [NOK/MWh] 500 Prognoza (tygodnie 1−44) 400 300 200 100 0 Kwi 2, 1998 Lut 1, 1999 Godziny [Kwi 2, 1998 − Gru 5, 1999] Gru 5, 1999 Temperatura [oC] 30 Prognoza (tygodnie 1−44) 20 10 0 −10 Kwi 2, 1998 Lut 1, 1999 Godziny [Kwi 2, 1998 − Gru 5, 1999] Gru 5, 1999 Cena NP [EUR/MWh] 400 300 Prognoza (tygodnie 1−30) 200 100 0 Lut 2, 2009 Lis 30, 2009 Godziny [Lut 2, 2009 − Cze 27, 2010] Cze 27, 2010 100 Temperatura [oF] 80 Prognoza (tygodnie 1−30) 60 40 20 0 Lut 02, 2009 Lis 30, 2009 Godziny [Lut 02, 2009 − Cze 27, 2010] Cze 27, 2010 Rys. 2: Ceny energii elektrycznej dla giełdy energii elektrycznej Nord Pool wraz z temperaturami dla okresów 2.04.1998-5.12.1999 oraz 2.02.2009-27.06.2010. Oba okresy czasu różnią się skalami i jednostkami w jakich mierzone są zarówno cena spotowa jak i temperatura. Pionowa przerywana linia symbolizuje początek okresu kalibracji dla modeli uśrednionych, a prostokąty w prawych częściach wykresów oznaczają przedziały prognozy. 8 Cena PJM [USD/MWh] 600 500 400 300 Prognoza (tygodnie 1−30) 200 100 0 Sie 22, 2010 Cze 19, 2011 Godziny [Sie 22, 2010 − Sty 14, 2012] Sty 14, 2012 Temperatura [oF] 100 80 60 Prognoza (tygodnie 1−30) 40 20 0 Sie 22, 2010 Cze 19, 2011 Godziny [Sie 22, 2010 − Cze 14, 2012] Sty 14, 2012 Rys. 3: Ceny energii elektrycznej dla giełdy energii elektrycznej PJM w okresie 22.08.2010-14.01.2012 wraz z temperaturą. Pionowa przerywana linia symbolizuje początek okresu kalibracji dla modeli uśrednionych, a prostokąty w prawych częściach wykresów oznaczają przedziały prognozy. niniejszym badaniu, wykorzystano okres począwszy od początku pierwszego przedziału z tamtej pracy, kończąc wraz z końcem ostatniego z nich. 2.3.2 Nord Pool 2009-2010 Kolejny zbiór danych dotyczy ponownie rynku skandynawskiego. Tym razem rozpatrujemy nowsze obserwacje, które pochodzą z okresu 2.02.2009-27.06.2010. Ponownie bierzemy pod uwagę godzinowe spotowe ceny energii elektrycznej oraz temperaturę. Tym razem ceny zostały przedstawione w Euro za Megawatogodzinę, a nie jak poprzednio w koronach norweskich, więc by uzyskać podobną skalę, należałoby przemnożyć ten szereg czasowy mniej więcej przez 8. Rysunek 2 pokazuje tym samym, że piki, które obserwujemy dla tego zbioru danych w okresie prognozy, są wyraźnie wyższe niż te, które występowały w latach 1998-1999. Temperatura mierzona jest tym razem w skali Fahrenheita. Ponadto, zastosowano przekształcenie postaci: Tt = log(Tt + minTt + 1). Jest to konsekwencją pewnych wstępnych analiz, które wykazały, że takie właśnie podejście zwraca nam nieco dokładniejsze prognozy. Tym razem temperatura otrzymana została z uśrednienia godzinowych obserwacji w następujących miastach: Kopenhaga, Helsinki, Oslo, Sztokholm i Trondheim. Zbiór danych pochodzi z serwisu NOAA (National Climatic Da9 ta Center, www.ncdc.noaa.gov). Okres kalibracji jest ponownie długości 39 tygodni, natomiast przedział, w którym liczymy prognozy dla tego zbioru danych jest nieco krótszy niż poprzednio i wynosi 30 tygodni. 2.3.3 Pennsylvania-New Jersey-Maryland Interconnection (2010-2012) Ostatni z analizowanych zbiorów pochodzi ze wschodniego wybrzeża Stanów Zjednoczonych w okresie 22.08.2010-14.01.2012. Dane zawierają strefowe godzinowe ceny rozliczeniowe rynku dnia następnego (ang. day-ahead locational marginal price) dla strefy PJM JCPL (Jersey Central Power and Light Company i temperatury dla Nowego Jorku, obie mierzone co godzinę. Szereg czasowy powstał w oparciu o dane publikowane przez EDF Suez (www.gdfsuezenergyresources.com) i serwis NOAA (National Climatic Data Center, www.ncdc.noaa.gov). Jako zmienną zewnętrzną wykorzystano tym razem logarytmy temperatur w skali Fahrenheita. Nie były konieczne bardziej złożone przekształcenia, ponieważ wszystkie obserwacje były większe niż 1o F . Tak samo jak dla dwóch poprzednich zestawów danych, modele szeregów czasowych kalibrujemy na okresie 39 tygodni w pierwszym kroku i w kolejnych dniach okres ten rozszerzamy. Okno prognozy, tak samo jak dla zbioru Nord Pool 2009-2010, jest długie na 30 tygodni. Wykresy ceny rynkowej energii elektrycznej, jak i zmiennej zewnętrznej dla rynku PJM zostały przedstawione na rys. 3. 10 3 3.1 Prognozowanie cen spotowych Wprowadzenie Pierwszym krokiem analizy jest obliczenie prognoz metodami bazowymi. Literatura wskazuje wiele modeli do prognozowania krótkoterminowego cen spotowych. Szeroki przegląd dostępnych metod znajduje się w [19]. Nie sposób jednak znaleźć podejście dominujące, czy też funkcjonujące lepiej od innych niezależnie od badanego rynku energii. W niniejszej pracy skorzystamy z metod analizowanych przez Misiorka i Werona [14]. Autorzy w swej publikacji przeanalizowali w sumie 12 różnych modeli szeregów czasowych: AR/ARX, pAR/pARX (modele AR/ARX, które zostały wstępnie przetworzone pod kątem eliminacji obserwacji ekstremalnych, ang. preprocessed), progowe AR/ARX, dwie klasy semiparametrycznych modeli AR/ARX oraz procesy powracające do średniej ze skokami. Dla wszystkich danych dotyczących cen spotowych zastosowano transformację logarytmiczną: pt = log(Pt ). Dla dwóch z trzech zbiorów danych w podobny sposób przekształcono temperatury, z niewielkim wyjątkiem dla rynku Nord Pool w okresie 2009-2010 (szczegóły znajdują się w punkcie 2.3.2). Nałożenie logarytmu na ceny spotowe energii elektryczne pozwala na uzyskanie stabilniejszej wariancji i bardziej symetrycznego rozkładu rozpatrywanego szeregu czasowego. Z danych usunięto ich średnie, tak by były skoncentrowane wokół zera. Podobnie jak w pracy [14], prognozy wyliczane były oddzielnie dla każdej godziny z doby. Dokładniej rzecz ujmując, wyjściowe dane zostały podzielone na 24 krótsze szeregi czasowe. W celu uzyskania zależności między nimi, na prognozowany logarytm ceny spotowej pt wpływa minimum cen z poprzedniego dnia. Ponadto, pozostałymi zmiennymi od których zależy pt są cena spotowa dla analogicznej godziny z dwóch poprzednich dni oraz sprzed tygodnia. Ostatnie parametry dotyczą uwzględnienia sezonowości tygodniowej – w tym celu model zawiera indykatory (ang. dummies) poszczególnych dni tygodnia. Ponieważ poszczególne dni robocze niewiele różnią się między sobą, liczbę tych parametrów ograniczono do 3: po jednym dla poniedziałku, soboty i niedzieli. Dlaczego wyróżniamy tylko 3 spośród 7 dni? Autorzy pracy [14] przekonują, że wynika to z istotności parametrów modelu – jak czytamy, parametry dla pozostałych czterech dni były statystycznie nieistotne. Tak jak w pracy [14], do prognozowania zastosowano rozszerzające się okno kalibracji. W pierwszym kroku dla wszystkich zbiorów danych jest ono długości 273 dni, czyli 39 tygodni. W jednym kroku prognozy (jeden dzień w danych) prognozujemy jednocześnie wszystkie 24 godziny, każdą oddzielnym predyktorem. Wyjściowy model nie zmienia się w czasie, jedynie jego parametry są estymowane na nowo w kolejnych krokach. Być może nie jest to wzorcowe podejście z punktu widzenia analizy statystycznej szeregów czasowych, ponieważ pomijamy kilka istotnych kroków jak np. sprawdzanie stacjonarności, wyznaczanie rzędu modelu, czy wreszcie testowanie residuów. Jednakże, celem badania nie jest znalezienie dokładnie dopasowanego modelu, a przetestowanie wielu różnych metod. 11 Wykorzystane modele są niejako kompromisem pomiędzy statystyczną poprawnością, a złożonością obliczeń i nadmierną liczbą parametrów. Fakt, że pochodzą one z pracy opublikowanej w prestiżowym czasopiśmie najlepiej świadczy o tym, że nie ma podstaw do ich kwestionowania. 3.2 Modele prognozowania krótkoterminowego Przedstawimy teraz wykorzystane metody prognozowania, które następnie posłużą nam za bazę przy uśrednianiu modeli. Jak wspomniano wcześniej wszystkie one pochodzą z publikacji [14]. W niniejszym podrozdziale jedynie pokrótce przedstawimy używane modele. Szersza dyskusja na ich temat nie jest tematem tej pracy. 3.2.1 Podstawowy model autoregresji Podstawowy model autoregresjii zawiera 8 parametrów. Na nasz predyktor wpływają: ceny spotowe z dwóch dni poprzednich i sprzed 7 dni, we wszystkich przypadkach dla tej samej godziny co prognozowana, minimum ceny w całym poprzednim dniu, indykatory dni tygodnia oraz zmienna zewnętrzna (fundamentalna). Ta ostatnia jest w naszych analizach temperaturą (bądź jej funkcją) w tej samej godzinie, dla której prognozujemy cenę, co można traktować jako prognozę temperatury (zawsze dokładną) wykonaną 24 godziny wcześniej. Nasz model jest postaci: pt = φ1 pt−24 + φ2 pt−48 + φ3 pt−168 + φ4 mpt + +ψ1 zt + d1 DM on + d2 DSat + d3 DSun + εt . (1) Model ten oznaczymy jako ARX. Zmienne pt−24 , pt−48 , pt−168 są cenami obserwowanymi (dla tej samej godziny, dla której prognozujemy) i odpowiadają za część autoregresyjną modelu. Zmienna mpt to minimum ceny z całego poprzedniego dnia – wprowadza ona zależność wszystkich dobowych prognoz, które, przypomnijmy, prognozujemy oddzielnie. Kolejne zmienne, tj. DM on , DSat , DSun , są indykatorami poszczególnych dni tygodnia (odpowiednio poniedziałku, soboty i niedzieli) i w modelu reprezentują sezonowość tygodniową. Wreszcie, zt jest zmienną zewnętrzną, a εt białym szumem. Zauważmy, że jeśli za odpowiadający jej parametr ψt położymy 0, to otrzymamy zwykły model autoregresji, który oznaczymy jako AR. 3.2.2 Modele wstępnie przetworzone Kolejne dwa modele dotyczą pewnej transformacji pików cenowych w danych. Ponieważ, jak wspomniano w punkcie 2.2.3, te ekstremalne zachowania są najczęściej tymczasowe, 12 sensownym podejściem mogłoby być wygładzenie szeregu czasowego poprzez wytłumienie obserwacji odstających. W przeciwnym razie wpływałyby one negatywnie na nasze prognozy. Wprowadźmy zatem pewien ustalony limit ceny T . Następnie dla obserwacji, które go przekraczają (przed zlogarytmowaniem), tj. dla Pt > T stosujemy przekształcenie Pt = T + T log10 ( PTt ). Po zastosowaniu takiej transformacji, korzystamy z równania (1). Ponownie rozpatrujemy dwie możliwości: model bez lub z zmienną zewnętrzną zt . Modele te oznaczymy jako pAR i pARX odpowiednio. 3.2.3 Modele progowe Kolejne dwa modele to autoregresyjne modele progowe (ang. threshold). W naszym modelu wyróżniamy dwa stany (w ogólności może być ich oczywiście więcej): stan bazowy oraz wzbudzony. W zależności od poziomu zmiennej przełącznikowej vt nasz proces znajduje się w jednym z dwóch stanów. Model ten, który oznaczymy jako TARX jest uogólnieniem modelu ARX i możemy go zapisać w postaci: pt = φ1,i pt−24 + φ2,i pt−48 + φ3,i pt−168 + φ4,i mpt + +ψ1,i zt + d1,i DM on + d2,i DSat + d3,i DSun + εt,i , (2) gdzie i = 1, 2. Proces znajduje się stanie bazowym, tj. dla i = 1, gdy vt ¬ T , a w stanie wzbudzonym, gdy vt > T . W naszym modelu kładziemy T = 0, natomiast zmienną przełącznikową jest różnica między ceną spotową poprzedniego dnia i ceną sprzed 8 dni. Parametry estymujemy osobno dla obu stanów. Zauważmy również, że dla ψ1,i = 0 dostajemy model bez zmiennej zewnętrznej, tzn. model TAR. 3.2.4 Procesy powracające do średniej ze skokami Kolejne dwa modele wywodzą się z dziedziny procesów stochastycznych z czasem ciągłym. Proces powracający do średniej ze skokami (ang. mean–reverting jump diffusion, MRJD) jest zdefiniowany przez następujące stochastyczne równanie różniczkowe: dpt = (α − βpt )dt + σdWt + Jdqt . (3) Jest to rozszerzenie procesu Orsteina–Uhlenbecka o część odpowiadającą za skoki. W modelu MRJD proces Wt odpowiada za mniejsze wahania ceny wokół długoterminowej średniej równej αβ . Niezależny od niego proces qt jest tutaj procesem Poissona z intensywnością λ. Tym samym wielkość Jdqt jest odpowiadającym mu przyrostem złożonego procesu Poissona ze skokami wielkości J. Dla uproszczenia modelu i ułatwienia estymacji parametrów założymy, że J ma rozkład normalny ze średnią µ i wariancją γ 2 . Proces, który wyjściowo jest w czasie ciągłym musimy oczywiście zdyskretyzować (dt → ∆t). 13 Kolejne założenie dotyczy parametru λ – przyjmujemy, że jest on na tyle mały, że możliwe jest pominięcie zdarzenia, w którym występują dwa skoki procesu Poissona w jednej godzinie. Wówczas, proces ten możemy aproksymować procesem dwumianowym, ponieważ jedyne możliwości to zero lub jeden skok. Jak wiadomo, zdyskretyzowany proces Orsteina–Uhlenbecka jest szeregiem czasowym AR(1) z szumem gaussowskim. Tym samym, uwzględniając zmienną zewnętrzną zt , otrzymujemy model MRJDX (lub MRJD dla ψ1 = 0) postaci: pt = φ1 pt−24 + ψ1 zt + d1 DM on + d2 DSat + d3 DSun + εi,t , (4) gdzie indeks i przyjmuje wartości 1, gdy skok w procesie Poissona nie wystąpił, oraz 2, gdy wystąpił. Zmienne εi,t mają rozkład normalny, a dokładniej: ε1,t ∼ N (0, σ 2 ) i ε2,t ∼ N (0, σ 2 + γ 2 ). Ponieważ proces Poissona przybliżamy procesem dwumianowym, w którym prawdopodobieństwo sukcesu wynosi λ (dla uproszczenia przyjmujemy, że ∆t = 1), to w rezultacie nasz model jest mieszaniną rozkładów normalnych. Do estymacji parametrów możemy w takim razie użyć metody największej wiarogodności. 3.2.5 Modele semiparametryczne Ostatnią klasą modeli, którą rozważymy, są tzw. modele semiparametryczne. Ich nazwa wynika z połączenia modelu AR z estymacją nieparametryczną. Dokładniej rzecz ujmując, rozważymy model autoregresji, w którym residua nie będą pochodziły z zadanego rozkładu prawdopodobieństwa – wyestymujemy go równocześnie z parametrami modelu AR za pomocą estymacji jądrowej. Motywacja dla takiego podejścia jest niejako intuicyjna: gdy residua modelu AR różnią się od pewnego ustalonego z góry rozkładu, metody jądrowe estymacji ich gęstości powinny zwrócić dokładniejsze dopasowanie do danych. Podążając za Misiorkiem i Weronem [14] skorzystamy z 4 różnych metod. Warto w tym miejscu zaznaczyć, że autorzy wnioskują, że metody te zazwyczaj przynoszą lepsze prognozy niż modele parametryczne. Metody semiparametryczne, z których korzystamy, pochodzą od Hsieha i Manskiego [11]. Pierwszym wykorzystanym modelem jest podejście oparte na iterowanym estymatorze Hsieha–Manskiego. W pierwszym kroku estymacji parametrów wyznaczamy startowy wektor parametrów φb0 tymi samymi metodami jak w przypadku modelu ARX. W kolejnym kroku wykorzystujemy residua εb(φb0 ) = {εbt (φb0 )}nt=1 tego modelu, by za pomocą estymatora jądrowego Parzena–Rozenblatta otrzymać ich gęstość fbh (x, εb(φb0 )). Następnie wyliczamy nieparametryczny estymator Hsieha–Manskiego maksymalizując funkcję wiarogodności: b ) = arg max b (φ, φ φbHM = arg max L h 0 φ φ 14 n Y t=1 fbh (εbt (φ), εb(φb0 )). (5) W ostatnim kroku wyznaczamy parametry modelu, powtarzając powyższy schemat, z tym że startowym wektorem parametrów jest teraz φbHM (wcześniej był to wektor φb0 ): b b (φ, φ φbIHM = arg max L h HM ). φ (6) W zależności od tego, czy użyjemy zmiennej zewnętrznej model oznaczymy jako IHMARX lub IHMAR. Drugą parą metod są tzw. wygładzone nieparametryczne estymatory największej wiarogodności. Konstruujemy je w podobny sposób, z tą różnicą, że nie korzystamy już z wyjściowego wektora parametrów. Tutaj parametry modelu estymujemy na podstawie bieżących residuów modelu: φb SN = b arg max L φ h (φ, φ) = arg max φ n Y b fbh (εbt (φ), εb(φ)). (7) t=1 Parę tych modeli będziemy oznaczać jako SNARX i SNAR. Szersza dyskusja na temat czterech modeli semiparametrycznych, wraz z odesłaniami do innych prac, w których można znaleźć np. rozważania na temat pewnych subtelności związanych z powyższymi estymatorami znajduje się w [14] 15 4 Uśrednianie modeli Uśrednianie modeli (inaczej: uśrednianie prognoz) po raz pierwszy pojawiło się najprawdopodobniej w pracy Barnarda [2]. W literaturze możemy też spotkać wiele odwołań do pracy Batesa i Grangera [3], gdzie poddana analizie została liczba pasażerów jednej z linii lotniczych, która również pojawia się w kontekście zapoczątkowania dyskusji nad uśrednianiem modeli. Już 20 lat później Clemen [6] tworzy przegląd ponad 200 publikacji, traktujących o tym zagadnieniu, które autor opisuje jako eksplozję liczby artykułów na temat uśredniania modeli. Przegląd współcześnie najpopularniejszych metod uśredniania znajduje się w pracy Timmermanna [18]. Obecnie uśrednianie modeli jest powszechnie stosowaną techniką w wielu zastosowaniach. Co ciekawe, dotychczas ukazało się stosunkowo niewiele prac z tej dziedziny w zastosowaniu do modelowania i prognozowania cen energii elektrycznej (jednymi z nielicznych wyjątków są prace Bordignona i in. [4] oraz Raviva i in. [?]). Wiele wskazuje również na to, że nie ukazała się dotychczas żadna publikacja, która byłaby przeglądem wielu dostępnych metod pod kątem ich użyteczności dla prognozowania cen spotowych energii elektrycznej. 4.1 Metody uśredniania modeli Wprowadźmy następujące oznaczenia: niech pt oznacza rzeczywistą wartość analizowanego szeregu czasowego w czasie t. Przez p̂t = (p̂1t , . . . , p̂M t )T oznaczymy wektor jednokrokowych (w chwili t − 1 na czas t) prognoz otrzymanych M różnymi metodami, natomiast do opisu uśrednionych predyktorów skorzystamy z oznaczenia pcct . Naszym celem jest zbudowanie uśrednionego modelu prognoz, który możemy wyrazić wzorem: pcct = M X wi p̂it (+w0 ), (8) i=1 gdzie wi = wi (t) są współczynnikami uśredniania w czasie t. Uwzględnienie stałej w uśrednionym modelu jest możliwe, ale nie koniecznie. Większość rozpatrywanych przez nas metod pomija składnik w0 . Bardzo często problem poszukiwania optymalnego uśrednionego modelu definiuje się jako próbę wyznaczenia optymalnych wag za pomocą minimalizacji zadanej funkcji straty, zob. [7]. Niemniej, w niniejszej pracy skupimy się głównie na nieco innym podejściu. Wagi z modelu (8) będziemy estymować na podstawie danych (cena energii elektrycznej pt oraz prognozy metodami bazowymi p̂it ) z tygodnia poprzedzającego moment prognozy. Tym samym wszystkie jednokrokowe prognozy wyznaczymy na podstawie okna kalibracji o jednej, ustalonej arbitralnie szerokości. Odpowiada ono 168 wcześniejszym obserwacjom, co możemy zapisać jako: pcct = pcct |t−1,...,t−168 . 16 4.1.1 Średnia arytmetyczna Najprostszym możliwym uśrednionym modelem prognozowania jest bez wątpienia średnia arytmetyczna. Skorzystamy zatem z predyktora postaci: pcct = p̂1t + · · · + p̂M t , M (9) a metodę tę oznaczymy jako AM (ang. arithmetic mean). Co ciekawe, w literaturze nietrudno znaleźć informacje (zob. np. [4] i odnośniki tamże), że to właśnie średnia arytmetyczna jest najbardziej uniwersalnym podejściem w uśrednianiu modeli. Co ciekawe, gdyby metody bazowe były nieobciążone i dawały błędy z identycznymi wariancjami, a korelacja dla każdej z par byłaby taka sama, to wybór równomiernie wag jest podejściem optymalnym w sensie błędu średnokwadratowego [18]. 4.1.2 Metody oparte o metodę najmniejszych kwadratów Kolejna metoda uśredniania została zaproponowana przez [9]. Dla modelu określonego równaniem (8), z uwzględnieniem stałej w0 , wprowadźmy następujące oznaczenia: pt µp E = , p̂t µ oraz (10) T σ 2 σ21 pt , V ar = p σ21 Σ22 p̂t (11) gdzie µp jest wartością oczekiwaną zmiennej pt , µ jest wektorem wartości oczekiwanych wektora p̂t , Σ22 jest macierzą kowariancji wektora p̂t , σp2 wariancją zmiennej pt , natomiast σ21 jest wektorem zadanym wzorem: σ21 = (Cov(pt , p̂1t ), . . . , Cov(pt , p̂M t ))T . Przyjmując kwadratową funkcję straty, nasze parametry otrzymamy minimalizując wyrażenie: h T i2 E pt − (w0 + w p̂t ) " = E pt − (w0 + M X #2 wi p̂it ) i=1 " + E pt − (w0 + M X = V ar pt − (w0 + M X ! wi p̂it ) + i=1 #!2 wi p̂it ) = σp2 + wT Σ22 w − 2wT σ21 + (µp − w0 − wT µ)2 , i=1 (12) gdzie w = (w1 , . . . , wM )T . Można sprawdzić ([7]), że wyrażenie to osiąga swoje minimum dla: w 0 = µp − w T µ (13) wT = Σ−1 22 σ21 17 Tym samym wektor wag w zależy tylko od macierzy kowariancji wektora p̂t oraz kowariancji między zmienną pt a wektorem p̂t . Stała w0 w tej sytuacji wynika z obciążeń poszczególnych predyktorów p̂it , i = 1, . . . , M . Model określony równaniem (8) (z uwzględnieniem stałej w0 ), gdzie parametry przyjmują wartości jak w (13), oznaczymy jako OLS (ang. ordinary least squares). W powyższej metodzie pojawia się element dyskusyjny – możliwe występowanie ujemnych lub bardzo dużych co do modułu wag wi . Pojawiają się trudności z interpretacją takiego rezultatu. Proponowanym rozwiązaniem jest narzucenie pewnych ograniczeń na parametry wi . Skorzystamy więc z podejścia zaproponowanego przez Aksu i Sevketa [1] i wprowadzimy warunki postaci: wit 0, ∀1iM ∀t∈T w0 = 0 oraz M X wi = 1, ∀t∈T . (14) (15) i=1 Pierwsze podejście wykorzystuje tylko równanie (14) – metodę tę oznaczymy jako PW (ang. positive weights). Kolejne wykorzystuje oba powyższe warunki – ozn. CLS (ang. constrained least squares). Zyskujemy tutaj prostą interpretację wyników, jednak niestety w tych metodach estymator parametrów wi możemy uzyskać jedynie poprzez pewne aproksymacje numeryczne. Dokładniej rzecz biorąc skorzystamy z programowania kwadratowego (ang. quadratic programming), które w przypadku z ograniczeniami nałożonymi na przestrzeń argumentów możemy zdefiniować następująco: 1 arg min{cT x + xT Hx : l ¬ x ¬ u, Ax = b}. x 2 (16) Macierz H jest tutaj symetryczna i, podobnie jak wektor c, ustalona. Zadane wektory l i u wyznaczają przestrzeń, na której poszukujemy minimum powyższej funkcji, podobną rolę odgrywa zależność liniowa Ax = b (A to ustalona macierz, b – ustalony wektor). W szczególnym przypadku, minimalizacja funkcji cT x+ 12 xT Hx sprowadza się do problemu przedyskutowanego w metodzie OLS. Istotnie, gdy położymy H = Σ22 + µµT oraz c = −(σ21 + µp µ), to przy w0 = 0 otrzymamy równanie (12). Obliczenia numeryczne w tym wypadku opieramy o tzw. metodę odbić Newtona (and. reflective Newton method), która została zaproponowana przez Colemana i Li [5]. 4.1.3 Metody oparte o miary błędu prognozy Kolejne podejścia to efekt uwzględnienia błędu prognoz każdej z bazowych metod prognozowania. Pierwsze z nich pochodzi z pracy [17]. Dla uśrednionej prognozy pcct = 18 Pm i=1 wit p̂it wagi wi dane są wzorami −1 M SEi PM i=1 wit = PM i=1 M SEi M SEi PM i=1 −1 = 1 M SEi PM 1 i=1 M SEi , (17) M SEi gdzie M SEi , i = 1, . . . , M oznacza błąd średniokwadratowy i-tej bazowej prognozy wyznaczony na okresie kalibracji. Poszczególnym prognozom bazowym nadajemy zatem wagi, które odpowiadają odwrotności uzyskiwanych przez nie błędów. Innymi słowy, im mniejszy błąd średniokwadratowy dana bazowa metoda uzyskuje, tym większą wagę uzyskuje. Metodę tę oznaczamy jako IMSE (ang. inverted mean squarred error). Kolejna metoda, to wybór (jednego) najlepszego z bazowych modeli w okresie kalibracji, ponownie na podstawie błędu średniokwadratowego. Takie podejście możemy uznać za uśrednianie zdegenerowane. Wagi w tym podejściu są dane wzorem: wit = 1, gdy i-ty model osiąga najniższy błąd średniokwadratowy, 0, w przeciwnym wypadku. (18) Metodę tę oznaczymy jako BIMSE (ang. best individual mean squarred error). Wybór jednego predyktora stanowi alternatywę dla użycia kombinacji modeli i jest częstym dylematem dla korzystających z technik uśredniania modeli. Problem z jakim zmagają się oni polega na podjęciu decyzji, czy korzystniejszy jest dla nich wybór jednej najdokładniejszej metody prognozowania, czy próba poszukiwania skuteczniejszego, uśrednionego podejścia. To ostatnie wiąże się oczywiście z ryzykiem, że uzyskana w taki sposób prognoza okaże się gorsza od najlepszej metody bazowej. Obie te metody można zmodyfikować, zamieniając błąd średniokwadratowy na średni błąd bezwzględny. Tak uśrednione prognozy będziemy oznaczać jako IMAE (ang. inverted mean absolute error) oraz BIMAE (ang. best individual mean absolute error). 4.1.4 Uśrednianie Bayesowskie Kolejna, ciekawa z punktu widzenia statystyki metoda opiera się na wzorze Bayesa na prawdopodobieństwo całkowite. Idea jest następująca: spośród M rozważanych modeli bazowych, tworzymy wszystkie (2M − 1) kombinacje modeli, co skutkuje oczywiście znacznym wzrostem złożoności obliczeniowej. Tym samym uśredniona prognoza będzie wyrażała się wzorem: pcc t = 2M −1 X wkt p̂kt , (19) k=1 gdzie tym razem, w przeciwieństwie do wszystkich pozostałych podejść, p̂kt oznacza prognozę przy użyciu k-tej kombinacji modeli (spośród wszystkich 2M − 1), wyznaczonej 19 przy użyciu średniej arytmetycznej z rozważanych bazowych prognoz. Wagi wkt są wyznaczane na podstawie wzoru Bayesa: L(pt |mk , D)P (mk ) . wkt = P2M −1 j=1 L(pt |mk , D)P (mk ) (20) W powyższym wzorze L(pt |mk , D) oznacza wartość funkcji wiarogodności dla k-tej kombinacji modeli na podstawie zbioru obserwacji D, natomiast P (mk ) to jej prawdopodobieństwo a–priori. W naszych analizach zastosujemy najczęściej stosowane podejście: P (mk ) będzie z dyskretnego rozkładu jednostajnego (dokładniejsza analiza możliwych rozkładów a–priori znajduje się w [8]), natomiast za gęstość odpowiadającą funkcji wiarogodności przyjmiemy gęstość rozkładu normalnego. Szeroka dyskusja na temat licznych subtelności związanych z wyznaczaniem wag przy uśrednianiu Baysowskim znajduje się w [10]. 4.2 Prognozowanie i pomiar jego dokładności W naszej analizie stosujemy 3 różne podejścia do estymowania wag w uśrednionym modelu prognozy. Będziemy kalibrować uśrednione modele dla dwóch długości okna kalibracji przesuwającego się (tydzień i cztery tygodnie), a także dla okna rozszerzającego się, które w pierwszym dniu prognozy będzie długości 4 tygodni. Wydawać by się mogło, że zastosowanie okien przesuwających się jest naturalne i zgodne z intuicją. Nie wiadomo jednak, czy z powodu lokalnych wahań prognoz bazowych podejście takie nie zwróci wyników, które na pewnych przedziałach będą całkowicie pozbawione sensu. Zaznaczmy również, że tym razem parametry modeli uśrednionych wyznaczamy na podstawie wszystkich obserwacji z okresu kalibracji, a nie jedynie dla tej samej godziny, dla której wyznaczamy prognozę, tak jak miało to miejsce przy prognozowaniu metodami bazowymi. Wyniki przedstawimy uśredniając prognozy na przedziałach tygodniowych. Przypomnijmy, że rezultaty otrzymujemy łącznie dla 700 dni, a więc uwzględniwszy fakt, że działamy na danych godzinowych oraz, że przetestujemy łącznie 3 okna kalibracji, otrzymujemy w rezultacie ponad 50 tysięcy prognoz punktowych! Podobnie jak w pracy Misiorka i Werona [14], miarą tygodniowego błędu będzie tygodniowy ważony błąd bezwzględny: W M AE = 1 P 168 M AE = 168 X 1 |Ph − Pbh |, 168 · P 168 h=1 (21) gdzie Ph jest rzeczywistą ceną, a Pbh jej prognozą, obie w godzinie h. Natomiast P 168 1 P168 oznacza średnią cenę dla danego tygodnia, tj. P 168 = 168 h=1 Ph . W tym momencie pojawia się również pytanie, jaki rezultat będzie dla nas satysfakcjonujący. Jak wspomniano wcześniej, w literaturze możemy spotkać dwa podjejścia: (i) 20 efektywne znajdowanie modelu, który będzie zazwyczaj dawał najdokładniejsze rezultaty lub (ii) znalezienie takiej kombinacji liniowej metod bazowych, która da skuteczniejsze metody niż każda z metod z osobna. W tej pracy spojrzymy na ten problem z jeszcze innej perspektywy. Mianowicie, sukcesem nazwiemy sytuację, w której dana metoda uśredniania dla danego tygodnia będzie skuteczniejsza niż obie metody zdegenerowane. Przyjmujemy tym samym, że metody BIMSE i BIMAE są niejako optymalnym wskazaniem najskuteczniejszej z bazowych metod. Przy okazji, metody uśrednione porównamy także z najlepszą bazową metodą dla danego tygodnia, którą oznaczać będziemy jako BI (ang. best individual). Zauważmy, że BI różni się od BIMSE i BIMAE, w przeciwieństwie do nich nie jest predyktorem, a jedynie wskazaniem najskuteczniejszej metody, kiedy znamy już dokładną wartość zmiennej, którą prognozujemy. Innymi słowy, BI będzie dla nas metodą wyznaczoną na podstawie błędu ex post, natomiast metody BIMSE i BIMAE określamy na podstawie błędu ex ante. 4.3 4.3.1 Wyniki Nord Pool 1998-1999 Widzimy z tabel 1-3, że spośród rozważanych uśrednionych modeli tylko metody oparte o metodę najmniejszych kwadratów dają zadowalające rezultaty. Zarówno średnia arytmetyczna (AM), uśrednianie Bayesowskie (BMA), jak i obie metody, w których wagi wyznaczyliśmy w oparciu o błędy prognozy (IMAE i IRMSE), bardzo rzadko działały skuteczniej od metod zdegenerowanych. Niezależnie od tego, jakie okno kalibracji wybierzemy, metodą, która najczęściej zachowuje się lepiej niż BIMSE i BIMAE, jest OLS, czyli optymalny uśredniony predyktor w sensie minimalizacji błędu średniokwadratowego. Jest to pewne zaskoczenie, ponieważ wagi w tej metodzie nie są w żaden sposób ograniczone i nie muszą sumować się do 1. Mimo tego, to podejście dało najlepsze rezultaty. Należy również podkreślić, że przy wyborze okna kalibracji długości 7 dni, metody OLS i PW prognozują ceny spotowe energii dokładniej niż wszystkie metody bazowe (BI) dla ponad połowy tygodni (względem miary WMAE). Także po uśrednieniu (po błędach WMAE) te dwie metody wyglądają najlepiej i co najistotniejsze, są one w takim ujęciu lepsze niż wszystkie metody bazowe. Jeśli porównamy natomiast okna kalibracji (zob. rys. 4), widzimy wyraźną przewagę okna 7-dniowego nad dwoma pozostałymi, ale jedynie dla metod OLS, PW i CLS. Okazało się tym samym, że dla zbioru Nord Pool 1998-1999 lepiej jest zastosować wagi, które są stosunkowo mocno narażone na wahania. Należy zatem przypuszczać, że ma to związek z tym, że na przestrzeni czasu skuteczność metod bazowych zmienia się dość dynamicznie, co zresztą widać po ostatnich kolumnach tabel 1-3. 21 Tabela 1: Wyniki uśredniania modeli dla zbioru danych NP 1998-1999 przy użyciu okna kalibracji długości 7 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 średnio % pogr. % podkr. AM 4.15 3.07 2.82 3.58 4.22 3.36 3.22 2.58 4.76 7.16 5.89 5.19 4.29 6.40 8.82 6.67 4.96 4.16 6.81 4.98 5.54 7.59 5.81 5.33 7.04 4.79 3.33 4.88 4.38 4.25 2.85 1.87 2.84 2.91 2.35 4.36 3.54 2.39 2.40 2.73 3.49 2.55 2.22 3.16 4.31 36.7% 6.7% OLS 4.13 3.96 1.87 1.93 1.50 3.38 1.57 1.16 2.26 5.80 6.05 3.74 3.49 7.26 6.70 5.98 6.22 3.69 6.78 5.19 4.84 6.75 6.92 3.27 3.51 3.96 3.20 4.20 2.43 4.01 2.84 2.07 2.47 2.44 2.29 3.46 2.84 1.59 2.20 2.58 3.25 2.36 1.82 2.00 3.64 106.7% 90.0% PW 4.12 3.77 2.15 1.88 1.56 3.43 1.51 1.17 2.40 5.75 6.22 3.43 4.12 6.74 7.88 5.28 5.40 3.79 6.11 4.66 4.79 6.88 5.63 4.15 3.72 4.54 3.19 4.00 2.10 3.66 2.81 1.89 2.41 2.60 2.21 3.45 2.99 1.56 2.27 2.47 3.20 2.44 1.84 2.67 3.61 110.0% 93.3% CLS 5.10 3.45 2.62 2.54 2.49 3.14 2.20 1.60 3.24 6.26 6.04 5.09 3.96 6.13 7.99 6.00 4.98 3.71 6.38 4.79 5.21 7.28 5.88 4.63 5.25 4.46 3.11 4.36 2.88 3.74 2.68 1.85 2.53 2.68 2.47 3.81 3.58 2.34 2.49 2.37 3.21 2.44 2.23 2.84 3.91 76.7% 33.3% IRMSE 4.20 3.07 2.85 3.50 3.96 3.21 3.15 2.29 4.53 6.99 5.86 5.14 4.30 6.29 8.62 6.56 4.95 4.06 6.82 4.89 5.49 7.52 5.75 5.29 6.90 4.78 3.30 4.85 4.23 4.18 2.79 1.86 2.79 2.90 2.38 4.27 3.54 2.39 2.39 2.74 3.49 2.54 2.22 3.16 4.25 43.3% 6.7% 22 IMAE 4.15 3.08 2.85 3.46 3.95 3.19 3.10 2.28 4.51 7.01 5.86 5.15 4.30 6.30 8.63 6.55 4.95 4.06 6.79 4.90 5.48 7.51 5.75 5.29 6.89 4.78 3.29 4.84 4.20 4.14 2.76 1.84 2.79 2.91 2.37 4.29 3.53 2.38 2.40 2.72 3.48 2.54 2.22 3.15 4.24 43.3% 10.0% BMA 4.76 3.18 3.43 4.22 4.74 3.49 3.44 2.66 4.95 7.22 5.91 5.16 4.36 6.28 8.58 6.59 4.94 4.02 6.74 4.88 5.40 7.45 5.74 5.16 6.95 5.10 3.76 5.17 4.53 4.54 2.96 2.04 2.91 2.86 2.54 4.26 3.66 2.44 2.41 2.81 3.54 2.55 2.24 3.19 4.40 30.0% 3.3% BIMSE 5.23 3.57 2.65 3.36 2.92 3.77 2.71 2.12 3.51 6.38 6.07 5.09 4.20 6.31 7.92 6.11 4.92 3.64 6.35 4.84 5.21 7.22 6.00 4.42 5.12 4.67 3.13 4.38 2.90 3.75 2.66 1.89 2.51 2.60 2.75 3.68 3.96 2.51 2.70 2.82 3.72 2.37 2.43 2.98 4.05 BIMAE 5.04 3.38 2.70 3.28 2.87 3.80 2.56 2.12 3.51 6.38 6.01 5.05 4.18 6.38 8.19 6.06 4.84 3.50 6.42 4.75 5.24 7.20 5.78 4.20 5.12 4.73 3.18 4.42 2.94 3.57 2.59 1.95 2.56 2.63 2.73 3.75 3.62 2.28 2.66 2.80 3.54 2.45 2.38 2.87 4.00 3.57 3.26 2.44 2.44 3.03 3.37 1.74 2.12 3.51 6.38 4.91 4.91 4.00 5.84 7.92 5.94 4.74 3.59 6.31 4.61 5.07 6.89 5.69 4.11 5.12 4.64 2.95 4.30 2.86 3.57 2.43 1.86 2.48 2.35 2.31 3.72 3.31 2.27 2.30 2.48 3.38 2.37 2.10 2.82 3.77 BI (MRJD) (AR) (SNAR) (SNAR) (MRJD) (SNARX) (MRJD) (MRJD) (MRJD) (MRJD) (TARX) (TARX) (SNARX) (ARX) (TARX) (pARX) (TARX) (ARX) (TARX) (AR) (SNARX) (ARX) (AR) (SNARX) (SNARX) (SNAR) (TAR) (TAR) (SNAR) (SNAR) (IHMAR) (IHMAR) (TAR) (TARX) (SNARX) (SNAR) (TAR) (SNAR) (ARX) (MRJDX) (SNARX) (TARX) (MRJDX) (SNARX) Tabela 2: Wyniki uśredniania modeli dla zbioru danych NP 1998-1999 przy użyciu okna kalibracji długości 28 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 średnio % pogr. % podkr. AM 4.15 3.07 2.82 3.58 4.22 3.36 3.22 2.58 4.76 7.16 5.89 5.19 4.29 6.40 8.82 6.67 4.96 4.16 6.81 4.98 5.54 7.59 5.81 5.33 7.04 4.79 3.33 4.88 4.38 4.25 2.85 1.87 2.84 2.91 2.35 4.36 3.54 2.39 2.40 2.73 3.49 2.55 2.22 3.16 4.31 40.0% 6.7% OLS 3.20 3.90 2.16 2.65 1.74 3.24 1.42 1.13 2.25 6.01 5.89 4.18 3.37 6.52 8.11 4.80 6.06 4.00 5.99 4.64 5.91 6.84 6.04 4.79 5.65 4.46 4.03 4.67 2.29 3.40 2.74 1.99 2.40 3.27 2.25 3.83 3.02 2.07 2.34 4.30 2.92 2.50 1.48 1.94 3.78 100.0% 76.7% PW 4.10 3.25 2.48 3.76 2.11 3.25 1.37 1.11 2.83 6.25 6.07 4.48 3.87 6.27 8.27 5.54 4.62 3.80 5.91 4.64 5.36 6.96 5.82 4.50 5.76 4.88 4.48 4.61 2.29 3.36 2.83 1.83 2.34 3.36 2.39 3.85 3.25 2.16 2.57 4.39 2.91 2.44 1.55 2.65 3.88 106.7% 70.0% CLS 4.54 3.30 3.33 4.38 2.74 3.14 1.74 1.59 3.33 6.59 6.70 5.52 3.83 6.11 7.96 5.95 4.84 3.83 6.35 4.85 5.45 7.07 5.91 4.69 6.08 4.92 3.64 4.40 3.01 3.52 2.58 1.82 2.47 3.14 2.48 4.14 3.30 2.29 2.63 2.61 3.17 2.59 2.19 2.72 4.03 76.7% 36.7% IRMSE 4.18 3.07 2.87 3.65 4.18 3.34 3.06 2.45 4.60 7.10 5.91 5.20 4.28 6.32 8.66 6.57 4.94 4.07 6.78 4.90 5.49 7.50 5.75 5.32 6.97 4.83 3.36 4.86 4.27 4.19 2.79 1.84 2.80 2.93 2.37 4.31 3.55 2.39 2.40 2.74 3.50 2.55 2.22 3.17 4.28 40.0% 10.0% 23 IMAE 4.12 3.09 2.82 3.59 4.12 3.31 3.01 2.42 4.55 7.09 5.92 5.21 4.27 6.33 8.68 6.57 4.94 4.07 6.78 4.90 5.49 7.50 5.75 5.31 6.96 4.82 3.36 4.86 4.26 4.17 2.77 1.83 2.78 2.94 2.36 4.32 3.55 2.39 2.41 2.73 3.49 2.55 2.22 3.16 4.27 40.0% 10.0% BMA 4.75 3.18 3.43 4.22 4.73 3.49 3.44 2.66 4.94 7.22 5.91 5.16 4.37 6.29 8.58 6.58 4.93 4.00 6.71 4.88 5.40 7.46 5.75 5.17 6.94 5.10 3.76 5.17 4.53 4.54 2.96 2.04 2.90 2.86 2.53 4.26 3.66 2.44 2.42 2.81 3.54 2.55 2.24 3.19 4.40 20.0% 3.3% BIMSE 4.17 3.17 3.61 4.33 4.03 3.46 2.12 2.12 3.51 6.38 6.82 5.04 4.00 6.10 8.01 6.14 4.82 3.92 6.33 4.84 5.56 6.83 5.98 4.90 6.85 5.26 3.74 4.43 2.93 3.79 2.51 1.87 2.71 3.40 2.36 4.08 3.44 2.25 2.69 3.28 3.65 2.60 2.33 2.82 4.16 BIMAE 3.65 3.41 2.64 3.68 3.65 3.79 1.76 2.12 3.51 6.38 7.39 5.58 4.00 6.14 8.04 5.94 5.03 3.92 6.45 4.84 5.39 6.89 5.99 4.80 5.12 4.89 3.74 4.42 2.97 3.57 2.46 1.87 2.58 3.43 2.36 4.06 3.42 2.27 2.96 2.71 3.38 2.58 2.29 2.82 4.07 3.57 3.26 2.44 2.44 3.03 3.37 1.74 2.12 3.51 6.38 4.91 4.91 4.00 5.84 7.92 5.94 4.74 3.59 6.31 4.61 5.07 6.89 5.69 4.11 5.12 4.64 2.95 4.30 2.86 3.57 2.43 1.86 2.48 2.35 2.31 3.72 3.31 2.27 2.30 2.48 3.38 2.37 2.10 2.82 3.77 BI (MRJD) (AR) (SNAR) (SNAR) (MRJD) (SNARX) (MRJD) (MRJD) (MRJD) (MRJD) (TARX) (TARX) (SNARX) (ARX) (TARX) (pARX) (TARX) (ARX) (TARX) (AR) (SNARX) (ARX) (AR) (SNARX) (SNARX) (SNAR) (TAR) (TAR) (SNAR) (SNAR) (IHMAR) (IHMAR) (TAR) (TARX) (SNARX) (SNAR) (TAR) (SNAR) (ARX) (MRJDX) (SNARX) (TARX) (MRJDX) (SNARX) Tabela 3: Wyniki uśredniania modeli dla zbioru danych NP 1998-1999 przy użyciu rozszerzającego się okna kalibracji. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 średnio % pogr. % podkr. AM 4.15 3.07 2.82 3.58 4.22 3.36 3.22 2.58 4.76 7.16 5.89 5.19 4.29 6.40 8.82 6.67 4.96 4.16 6.81 4.98 5.54 7.59 5.81 5.33 7.04 4.79 3.33 4.88 4.38 4.25 2.85 1.87 2.84 2.91 2.35 4.36 3.54 2.39 2.40 2.73 3.49 2.55 2.22 3.16 4.31 50.0% 6.7% OLS 3.13 3.69 2.26 3.29 3.22 3.54 2.41 1.50 2.85 6.06 5.87 4.05 3.56 6.33 9.16 5.66 5.25 4.77 5.95 4.99 4.62 7.45 6.21 4.16 8.03 5.11 5.85 7.43 7.95 5.94 4.00 2.51 3.15 2.68 2.30 4.50 3.47 2.35 2.22 2.46 3.36 2.53 1.79 3.03 4.33 73.3% 50.0% PW 4.07 3.28 2.64 4.01 4.46 3.22 2.54 1.65 3.60 6.41 5.95 4.53 3.68 6.29 9.07 5.86 4.50 3.93 5.96 4.66 5.00 7.19 5.75 4.54 6.66 4.85 4.40 6.13 6.36 5.66 3.88 2.42 3.28 2.61 2.36 4.62 3.74 2.48 2.20 2.43 3.59 2.53 1.88 3.30 4.28 73.3% 36.7% CLS 4.50 3.28 3.09 3.93 4.09 3.26 2.88 2.25 3.98 6.78 6.37 5.33 3.95 6.91 9.14 6.57 4.93 4.16 6.53 4.99 5.31 7.58 5.77 4.83 6.63 4.77 3.72 5.09 4.58 4.30 2.91 1.92 2.73 2.96 2.41 4.11 3.39 2.32 2.47 2.75 3.38 2.47 2.25 2.93 4.28 60.0% 6.7% IRMSE 4.18 3.07 2.86 3.63 4.28 3.38 3.26 2.61 4.80 7.17 5.88 5.18 4.30 6.37 8.77 6.62 4.95 4.12 6.80 4.94 5.52 7.54 5.77 5.32 7.00 4.82 3.35 4.89 4.37 4.28 2.84 1.88 2.83 2.91 2.36 4.33 3.55 2.39 2.40 2.76 3.52 2.54 2.23 3.19 4.31 43.3% 3.3% IMAE 4.12 3.08 2.82 3.58 4.19 3.34 3.16 2.54 4.70 7.13 5.90 5.21 4.28 6.42 8.85 6.67 4.97 4.15 6.81 4.97 5.53 7.57 5.79 5.31 6.99 4.80 3.35 4.88 4.35 4.25 2.83 1.87 2.83 2.92 2.35 4.33 3.55 2.39 2.41 2.74 3.51 2.54 2.22 3.18 4.30 50.0% 6.7% 24 BMA 4.75 3.18 3.43 4.22 4.73 3.49 3.44 2.66 4.94 7.22 5.91 5.16 4.37 6.29 8.58 6.58 4.93 4.00 6.71 4.88 5.40 7.46 5.75 5.17 6.94 5.10 3.76 5.17 4.53 4.54 2.96 2.04 2.90 2.86 2.53 4.26 3.66 2.44 2.42 2.81 3.54 2.55 2.24 3.19 4.40 70.0% 46.7% BIMSE 4.17 3.31 3.24 4.41 4.39 3.37 3.16 2.56 4.31 6.87 6.08 5.04 4.00 6.99 9.02 6.21 5.03 3.81 6.60 4.69 5.33 7.19 5.82 4.88 6.69 5.26 4.29 5.44 5.13 5.10 3.15 2.25 2.86 3.02 2.37 4.12 3.46 2.37 2.41 2.80 3.65 2.66 2.16 3.30 4.39 BIMAE 3.65 3.41 2.64 3.83 4.07 3.37 3.16 2.56 4.31 6.87 6.08 5.04 4.00 6.99 9.60 6.49 5.54 4.18 6.78 5.23 5.07 7.88 5.88 4.11 5.12 4.89 3.74 4.89 3.76 4.15 2.70 1.97 2.80 3.32 2.31 3.84 3.41 2.29 2.76 2.70 3.38 2.59 2.29 2.82 4.24 3.57 3.26 2.44 2.44 3.03 3.37 1.74 2.12 3.51 6.38 4.91 4.91 4.00 5.84 7.92 5.94 4.74 3.59 6.31 4.61 5.07 6.89 5.69 4.11 5.12 4.64 2.95 4.30 2.86 3.57 2.43 1.86 2.48 2.35 2.31 3.72 3.31 2.27 2.30 2.48 3.38 2.37 2.10 2.82 3.77 BI (MRJD) (AR) (SNAR) (SNAR) (MRJD) (SNARX) (MRJD) (MRJD) (MRJD) (MRJD) (TARX) (TARX) (SNARX) (ARX) (TARX) (pARX) (TARX) (ARX) (TARX) (AR) (SNARX) (ARX) (AR) (SNARX) (SNARX) (SNAR) (TAR) (TAR) (SNAR) (SNAR) (IHMAR) (IHMAR) (TAR) (TARX) (SNARX) (SNAR) (TAR) (SNAR) (ARX) (MRJDX) (SNARX) (TARX) (MRJDX) (SNARX) 4.3.2 Nord Pool 2009-2010 Wnioski płynące z wyników dla zbioru (tabele 4-6) danych NP 2009-2010 są podobne do wniosków z poprzedniego podrozdziału. Znów najskuteczniejsze okazały się być metody oparte o minimalizację błędu średniokwadratowego (OLS, PW, CLS). Raz jeszcze wszystkie pozostałe podejścia dają nam wyniki raczej niesatysfakcjonujące. Najdokładniejsze prognozy otrzymaliśmy tym razem przy użyciu metody PW. Zauważmy, że przy oknie kalibracji długości 7 dni, dla ponad połowy tygodni otrzymaliśmy prognozę dokładniejszą niż każda z metod bazowych, co należy uznać za sukces. Pozostałe dwa okna kalibracji nie są aż tak skuteczne, zarówno jeśli chodzi o metodę PW, jak i w ujęciu globalnym, choć już w nieco mniejszym stopniu. Wyraźnie widzimy te zależności na rysunku 4, gdzie różnice łatwo dostrzec szczególnie dla trzech najlepszych metod (PW, OLS, CLS). Zbiór danych NP 2009-2010 w okresie prognozy zawiera, w przeciwieństwie do okresu 1998-1999, piki cenowe. Powodują one wyraźne zaburzenia w wynikach uśredniania. Szczególnie źle wypadają tygodnie 3, 6, 7, 27, gdzie niemal żadna metoda uśredniania, niezależnie od okna kalibracji, nie poprawia dokładności prognozowania, względem najlepszej metody bazowej, mierzonej zarówno błędem ex post, jak i ex ante. Niemniej jednak, różnice w błędach WMAE pomiędzy poszczególnymi modelami uśredniania, a najlepszą metodą bazową BI nie są wysokie. Można zatem przypuszczać, że wina nieskuteczności uśredniania leży bardziej po stronie dokładności modeli szeregów czasowych, niż procedury estymacji wag im przypisywanym. Inny ciekawy okres w wynikach to tygodnie 14-24. Zauważmy (tab. 6), że dla rozszerzającego się okna kalibracji metody uśredniania (z jednym małym wyjątkiem) zawodzą, dając większe tygodniowe błędy niż BIMSE i BIMAE (więc również większe niż BI). Ten specyficzny okres poprzedzony jest pikiem cenowym, który wystąpił w tygodniu 14. Stąd też prawdopodobne jest obciążenie w estymacji wag dla metod bazowych. Dostrzegamy zatem wyraźną przewagę przesuwającego się okna kalibracji nad oknem rozszerzającym się. Ponieważ piki cenowe są charakterystyczne dla rynków energii elektrycznej, możemy wnioskować, że użycie przesuwającego się okna kalibracji jest szczególnie wskazane w modelowaniu i prognozowaniu cen spotowych energii. 25 Tabela 4: Wyniki uśredniania modeli dla zbioru danych NP 2009-2010 przy użyciu okna kalibracji długości 7 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 średnio % pogr. % podkr. AM OLS PW CLS IRMSE IMAE BMA BIMSE BIMAE 5.11 2.97 14.38 6.04 4.16 28.73 10.58 5.18 14.95 7.44 7.66 9.63 14.51 4.76 3.01 3.99 3.08 3.42 4.58 2.77 2.54 3.50 3.38 6.69 16.41 16.39 14.15 12.30 9.18 6.11 7.48 2.76 16.64 8.23 3.44 43.13 18.28 4.62 10.99 9.59 4.81 5.23 24.50 5.63 3.48 2.98 2.66 1.43 2.86 1.92 1.37 2.39 1.97 5.67 18.35 16.69 13.43 9.99 9.86 4.96 5.35 1.90 14.99 8.83 3.30 32.86 15.41 3.06 11.91 6.70 5.00 5.32 18.98 4.89 3.40 3.23 2.88 1.56 2.77 1.98 1.40 2.54 1.75 6.02 15.42 18.02 11.31 10.83 8.41 5.61 5.22 2.46 13.77 7.06 3.85 27.80 10.85 4.77 13.11 7.16 6.82 7.44 14.24 4.85 2.81 3.56 2.71 2.31 3.34 1.88 1.62 2.82 2.40 6.19 16.26 16.21 14.64 11.53 9.76 5.98 5.12 2.99 14.28 6.08 4.34 28.66 10.61 5.11 14.87 7.43 7.64 9.42 14.49 4.75 2.92 3.93 3.03 3.23 4.42 2.54 2.33 3.32 3.26 6.63 16.33 16.36 14.12 12.21 9.15 6.04 5.12 2.99 14.27 6.10 4.35 28.65 10.57 5.07 14.85 7.38 7.62 9.34 14.51 4.74 2.92 3.93 3.03 3.22 4.37 2.53 2.31 3.30 3.21 6.67 16.37 16.37 14.08 12.22 9.13 6.04 5.25 2.95 14.38 6.08 4.61 28.33 10.51 5.03 15.23 7.57 7.94 10.31 14.91 4.76 3.13 3.96 3.05 3.61 4.85 3.00 2.78 3.68 3.69 6.60 16.39 16.39 14.51 12.44 9.32 6.23 5.91 2.93 13.96 6.95 4.61 27.38 10.55 4.87 13.26 7.48 6.67 7.34 14.37 5.15 3.07 3.66 2.93 2.52 3.48 1.93 1.70 2.93 2.40 6.14 16.32 16.46 14.54 11.47 10.57 6.27 5.54 2.94 13.74 6.63 4.56 27.28 10.31 4.44 12.96 6.48 6.63 7.67 14.75 4.72 2.99 3.77 2.77 2.52 3.48 2.04 1.70 2.93 2.40 6.99 16.51 16.24 13.29 11.69 9.47 6.26 4.85 2.75 13.14 5.85 4.57 25.84 9.92 4.44 12.91 6.63 6.63 7.36 14.37 4.31 2.82 3.66 2.93 2.33 3.48 1.89 1.70 2.93 2.40 6.64 16.02 15.95 12.52 11.22 9.36 5.34 7.93 7.79 7.49 8.25 8.84 7.85 7.78 8.19 8.18 8.38 16.7% 6.7% 53.3% 46.7% 63.3% 60.0% 50.0% 40.0% 20.0% 10.0% 20.0% 6.7% 13.3% 6.7% 26 BI (TARX) (TARX) (pARX) (SNARX) (pARX) (pARX) (ARX) (SNAR) (TAR) (SNAR) (SNAR) (TAR) (TARX) (SNAR) (SNARX) (SNARX) (MRJDX) (MRJD) (MRJD) (SNAR) (SNAR) (SNAR) (SNAR) (TARX) (pARX) (TAR) (SNARX) (TAR) (TAR) (AR) Tabela 5: Wyniki uśredniania modeli dla zbioru danych NP 2009-2010 przy użyciu okna kalibracji długości 28 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 średnio % pogr. % podkr. AM OLS PW CLS IRMSE IMAE BMA BIMSE BIMAE 5.11 2.97 14.38 6.04 4.16 28.73 10.58 5.18 14.95 7.44 7.66 9.63 14.51 4.76 3.01 3.99 3.08 3.42 4.58 2.77 2.54 3.50 3.38 6.69 16.41 16.39 14.15 12.30 9.18 6.11 5.73 2.33 16.65 9.02 6.91 31.01 12.60 6.75 12.49 7.80 5.52 5.37 20.01 9.49 10.05 7.43 3.20 2.27 3.33 1.97 1.63 2.39 2.46 6.56 18.55 14.53 15.61 12.27 8.32 5.07 5.04 1.99 14.13 7.83 5.11 28.49 11.15 4.56 12.61 6.53 4.89 5.48 15.99 7.07 8.29 6.82 3.57 2.23 3.02 1.91 1.52 2.58 2.29 6.65 16.43 15.70 14.74 12.29 0.00 5.52 5.07 2.49 13.68 6.70 4.90 27.89 10.36 4.85 14.68 8.65 7.29 7.69 14.23 5.42 5.05 5.10 2.79 2.49 3.68 1.98 1.76 2.79 2.46 6.66 16.55 15.95 16.63 12.84 9.58 5.74 5.13 2.98 14.32 6.03 4.16 28.67 10.59 5.17 14.96 7.44 7.66 9.58 14.50 4.78 3.03 3.99 3.05 3.29 4.49 2.62 2.41 3.33 3.24 6.67 16.37 16.36 14.21 12.30 9.20 6.06 5.13 2.99 14.33 6.08 4.23 28.67 10.55 5.13 14.91 7.43 7.64 9.52 14.51 4.73 3.00 3.96 3.04 3.30 4.47 2.61 2.37 3.30 3.18 6.71 16.46 16.38 14.16 12.28 9.17 6.07 5.20 2.96 14.36 6.09 4.61 28.35 10.51 5.03 15.23 7.57 7.94 10.31 14.90 4.76 3.13 3.96 3.01 3.63 4.85 3.00 2.79 3.68 3.70 6.61 16.43 16.38 14.52 12.43 9.33 6.25 5.85 3.20 13.62 6.95 4.57 27.69 10.24 4.97 14.69 8.42 7.31 7.83 14.37 5.07 4.86 5.27 2.73 2.97 4.10 2.08 1.70 2.93 2.40 6.81 16.32 16.24 16.21 13.27 10.67 5.37 5.39 2.93 13.89 6.70 4.57 26.59 10.24 4.97 14.69 8.44 7.26 7.86 14.73 5.07 4.77 3.67 2.93 2.97 3.83 2.39 2.03 2.93 2.40 7.30 17.56 16.13 14.04 11.68 9.25 5.95 4.85 2.75 13.14 5.85 4.57 25.84 9.92 4.44 12.91 6.63 6.63 7.36 14.37 4.31 2.82 3.66 2.93 2.33 3.48 1.89 1.70 2.93 2.40 6.64 16.02 15.95 12.52 11.22 9.36 5.34 8.29 8.11 7.49 8.25 8.91 7.81 8.20 8.22 8.21 8.38 26.7% 6.7% 46.7% 40.0% 53.3% 40.0% 40.0% 13.3% 26.7% 6.7% 26.7% 6.7% 20.0% 6.7% 27 BI (TARX) (TARX) (pARX) (SNARX) (pARX) (pARX) (ARX) (SNAR) (TAR) (SNAR) (SNAR) (TAR) (TARX) (SNAR) (SNARX) (SNARX) (MRJDX) (MRJD) (MRJD) (SNAR) (SNAR) (SNAR) (SNAR) (TARX) (pARX) (TAR) (SNARX) (TAR) (TAR) (AR) Tabela 6: Wyniki uśredniania modeli dla zbioru danych NP 2009-2010 przy użyciu rozszerzającego się okna kalibracji. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 średnio % pogr. % podkr. 4.3.3 AM OLS PW CLS IRMSE IMAE BMA BIMSE BIMAE 5.11 2.97 14.38 6.04 4.16 28.73 10.58 5.18 14.95 7.44 7.66 9.63 14.51 4.76 3.01 3.99 3.08 3.42 4.58 2.77 2.54 3.50 3.38 6.69 16.41 16.39 14.15 12.30 9.18 6.11 5.73 2.48 16.61 8.97 6.84 29.62 11.76 5.20 12.07 7.57 6.09 5.74 19.87 8.26 8.28 7.59 5.98 4.91 4.93 3.65 3.19 3.91 2.98 7.53 17.97 15.76 14.72 11.90 9.58 6.88 5.11 1.81 14.00 7.43 4.99 28.07 10.12 3.48 12.65 6.27 5.54 7.09 14.86 5.42 6.39 6.76 6.83 5.16 4.66 3.52 3.59 3.67 3.07 8.16 17.67 15.42 12.93 11.65 8.71 6.22 5.06 2.55 13.55 6.72 5.04 27.90 10.40 4.88 14.69 7.96 8.24 10.42 14.76 4.72 3.32 3.89 2.88 3.66 5.23 3.28 2.97 3.87 4.25 6.78 16.73 16.25 14.15 12.77 9.71 6.61 5.13 2.98 14.34 6.03 4.16 28.67 10.59 5.17 14.96 7.43 7.67 9.64 14.51 4.76 3.01 3.98 3.08 3.42 4.59 2.77 2.54 3.50 3.39 6.69 16.41 16.39 14.15 12.30 9.18 6.11 5.13 2.99 14.34 6.07 4.22 28.66 10.54 5.13 14.91 7.42 7.66 9.62 14.48 4.77 3.02 3.99 3.09 3.43 4.58 2.77 2.53 3.49 3.36 6.69 16.41 16.38 14.13 12.28 9.16 6.09 5.22 2.96 14.37 6.08 4.61 28.33 10.51 5.02 15.23 7.56 7.94 10.31 14.90 4.77 3.13 3.95 3.02 3.62 4.87 3.00 2.79 3.94 3.06 7.71 18.07 16.12 14.50 12.43 9.32 6.23 5.85 3.32 13.75 6.95 4.57 27.94 10.24 4.97 14.69 8.03 8.61 11.47 16.26 4.60 2.82 3.66 2.93 2.97 4.27 2.11 1.95 3.68 3.69 6.61 16.42 16.37 12.52 11.68 9.41 6.30 5.39 2.97 14.08 5.85 4.57 27.49 10.24 4.97 14.69 8.03 7.18 8.66 15.78 4.60 2.82 3.66 2.93 2.97 4.27 2.11 1.95 3.09 2.75 7.10 17.29 16.57 12.52 11.68 9.41 6.30 4.85 2.75 13.14 5.85 4.57 25.84 9.92 4.44 12.91 6.63 6.63 7.36 14.37 4.31 2.82 3.66 2.93 2.33 3.48 1.89 1.70 2.93 2.40 6.64 16.02 15.95 12.52 11.22 9.36 5.34 8.29 8.06 7.49 8.25 9.22 8.38 8.44 8.25 8.24 8.45 23.3% 6.7% 20.0% 16.7% 43.3% 26.7% 26.7% 6.7% 23.3% 6.7% 23.3% 6.7% 23.3% 3.3% BI (TARX) (TARX) (pARX) (SNARX) (pARX) (pARX) (ARX) (SNAR) (TAR) (SNAR) (SNAR) (TAR) (TARX) (SNAR) (SNARX) (SNARX) (MRJDX) (MRJD) (MRJD) (SNAR) (SNAR) (SNAR) (SNAR) (TARX) (pARX) (TAR) (SNARX) (TAR) (TAR) (AR) Pennsylvania-New Jersey-Maryland Interconnection (2010-2012) Wyniki dla zbioru PJM przedstawione w tabelach 7-9 nieco odbiegają od dwóch poprzednich. Tym razem nie znajdujemy żadnej metody uśredniania, która byłaby skuteczniejsza od wszystkich metod bazowych w co najmniej 50% przypadków. W najlepszym wypadku metoda PW dla okna 7-dniowego jest lepsza niż modele autoregresyjne średnio 2 na 5 razy. Jeśli przychodzi nam wskazać najdokładniejszą metodę uśredniania w odniesieniu do błędu ex ante, to ponownie jest to predyktor powstały w oparciu o metodę najmniejszych 28 kwadratów, przy użyciu nieujemnych wag (PW), ale jedynie dla przesuwających się okien kalibracji. Nieco zaskakująca jest różnica w skuteczności prognoz tą metodą, jeśli zestawimy ze sobą któreś z okien kalibracji o stałej długości z oknem rozszerzającym się, zob. rys. 4. Takich różnic nie obserwowaliśmy dla dwóch wcześniejszych zbiorów danych. To nie jedyna rzecz którą różni zbiór PJM od dwóch zbiorów z rynku skandynawskiego. Tym razem znacznie lepiej w porównaniu do pozostałych metod sprawują się metody IRMSE i IMAE. Zaznaczmy także, że dla wszystkich trzech zbiorów danych podejścia te dają stosunkowo podobne błędy. Jest to wyraźna różnica względem innych metod, w szczególności tych opartych o metodę najmniejszych kwadratów (OLS, PW, CLS), które wykazują się większą zmiennością. Może to być spowodowane zarówno przez występowanie nieograniczonych wag w metodach OLS i PW, jak również przez większą stabilność metod IRMSE i IMAE, które raczej nie marginalizują żadnej z metod bazowych. Stabilność ta nie oznacza oczywiście większej skuteczności. 80% Okno 7−dniowe Okno 28−dniowe Okno rozszerzajace 70% # lepsze niz BIMSE/BIMAE # lepsze niz BIMSE/BIMAE 80% 60% 50% 40% 30% 20% 10% 0% Okno 7−dniowe Okno 28−dniowe Okno rozszerzajace 70% 60% 50% 40% 30% 20% 10% AM OLS PW 0% CLS IRMSE IMAE BMA Metody # lepsze niz BIMSE/BIMAE 80% AM OLS PW CLS IRMSE IMAE BMA Metody Okno 7−dniowe Okno 28−dniowe Okno rozszerzajace 70% 60% 50% 40% 30% 20% 10% 0% AM OLS PW CLS IRMSE IMAE BMA Metody Rys. 4: Histogramy przedstawiające ile razy (procentowo) dana metoda uśredniania okazała się lepsza od obu metod zdegenerowanych, tj. BIMSE i BIMAE, w danym tygodniu. Wykresy przedstawiają porównanie różnych okien kalibracji. Zauważmy, że słupki dla średniej arytmetycznej są różnych wielkości, mimo że metoda ta daje identyczne prognozy niezależnie od okna kalibracji. Spowodowane jest to tym, że prognozowane wielkości porównujemy do BIMSE i BIMAE, które nie mają podobnej własności. Ponownie także obserwujemy negatywny wpływ pików na uśrednianie modeli. Nawet, gdy któraś z metod uśredniania w tygodniach 4 i 5 daje mniejszy błąd od BIMSE/BIMAE 29 lub BI, to zysk jest stosunkowo niewielki. Dla zbioru PJM widzimy też skuteczność uśrednionych prognoz jest mniejsza również w tygodniach następujących bezpośrednio po tych, gdzie występowały piki. Istotnie, również dla tygodnia 6 nie obserwujemy żadnej metody uśredniania, która poprawiałaby błąd prognozy dla indywidualnych metod. Ten tydzień jest ciekawy również jeśli spojrzymy na błędy metod OLS i PW, czyli tych, które do tej pory uważaliśmy za wyraźnie najlepsze. Co ciekawe, błędy, które uzyskaliśmy dla tego tygodnia za pomocą tych dwóch metod, przewyższają wszystkie metody bazowe (najgorsze MRJDX ma błąd WMAE rzędu 18.79)! Jest to jednak jednostkowy przypadek. Tabela 7: Wyniki uśredniania modeli dla zbioru danych PJM przy użyciu okna kalibracji długości 7 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 AM OLS PW CLS IRMSE IMAE BMA BIMSE BIMAE 12.95 6.99 12.51 21.11 28.42 13.94 8.52 8.85 8.09 13.07 7.65 9.29 10.56 6.59 6.89 6.11 8.80 5.58 8.51 9.65 9.01 10.40 10.86 9.20 6.68 9.50 9.23 11.46 18.88 9.27 11.10 9.99 11.99 19.30 29.59 27.37 14.24 11.10 8.26 11.77 9.69 9.20 10.30 7.27 6.82 6.25 8.82 5.67 8.27 10.76 9.87 8.78 10.22 9.91 6.60 8.61 7.91 11.49 17.06 12.15 11.77 7.51 11.98 20.48 27.03 24.94 10.24 9.97 8.17 12.47 8.18 9.53 9.78 6.77 6.97 5.97 8.83 4.39 8.51 10.19 9.33 8.52 9.27 9.37 6.34 8.72 7.02 10.67 16.41 8.55 11.96 7.01 12.24 20.33 28.08 13.23 8.88 9.46 7.95 12.37 8.02 9.46 9.90 5.96 7.05 6.60 8.60 4.56 8.27 9.95 9.19 9.89 10.62 8.91 6.74 9.42 9.45 11.04 18.07 9.05 12.87 7.00 12.50 21.07 28.43 13.93 8.53 8.87 8.06 13.05 7.66 9.29 10.52 6.60 6.86 6.14 8.78 5.54 8.54 9.64 8.99 10.39 10.86 9.19 6.68 9.49 9.24 11.43 18.84 9.27 12.86 6.99 12.52 21.07 28.40 13.89 8.51 8.84 8.07 13.07 7.65 9.29 10.54 6.60 6.87 6.14 8.80 5.53 8.55 9.64 8.97 10.38 10.86 9.17 6.68 9.49 9.22 11.43 18.83 9.29 12.18 7.51 12.10 19.73 27.71 13.29 9.20 9.31 7.98 12.60 8.21 9.68 9.95 6.19 7.41 6.83 8.68 4.60 8.65 10.40 9.32 9.72 10.42 9.09 6.90 9.27 10.02 11.12 17.93 9.21 11.78 7.40 12.41 20.32 27.34 13.16 9.14 9.30 7.93 13.50 7.96 9.55 10.19 6.43 7.17 6.42 8.98 4.62 9.13 10.57 8.38 9.88 10.54 8.76 7.06 9.08 8.63 10.58 18.12 9.59 13.25 6.78 12.52 20.84 28.25 14.04 8.48 9.03 8.32 13.00 7.57 9.28 10.59 6.24 6.91 6.08 8.83 5.28 8.42 9.53 9.14 10.25 10.74 9.03 6.57 9.41 9.02 11.45 18.92 9.08 12.14 7.21 11.68 19.62 26.69 12.74 8.03 8.44 8.00 12.47 7.59 8.73 10.09 6.11 6.49 6.33 8.69 4.64 8.57 9.24 8.39 9.54 10.17 8.11 6.59 8.95 8.48 10.51 18.05 8.64 10.46 10.56 10.03 średnio 10.62 11.35 10.60 10.41 10.61 10.60 10.51 % pogr. % podkr. 10.0% 10.0% 43.3% 30.0% 46.7% 40.0% 30.0% 30.0% 10.0% 10.0% 10.0% 10.0% 33.3% 16.7% 30 BI (ARX) (TARX) (MRJD) (TAR) (TAR) (AR) (TAR) (IHMARX) (IHMARX) (TARX) (MRJD) (ARX) (ARX) (MRJD) (TAR) (pAR) (TARX) (TARX) (MRJD) (TARX) (pARX) (TARX) (pAR) (TARX) (pAR) (pAR) (TAR) (TAR) (TAR) (MRJD) Tabela 8: Wyniki uśredniania modeli dla zbioru danych PJM przy użyciu okna kalibracji długości 28 dni. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 AM OLS PW CLS IRMSE IMAE BMA BIMSE BIMAE 12.95 6.99 12.51 21.11 28.42 13.94 8.52 8.85 8.09 13.07 7.65 9.29 10.56 6.59 6.89 6.11 8.80 5.58 8.51 9.65 9.01 10.40 10.86 9.20 6.68 9.50 9.23 11.46 18.88 9.27 22.85 16.95 15.65 22.06 27.68 17.82 18.34 14.70 14.77 12.81 9.02 7.92 12.50 8.14 7.46 5.80 8.07 5.26 9.30 9.76 9.79 10.40 11.28 8.98 6.08 8.43 7.43 10.42 17.03 9.92 22.10 17.83 14.93 21.36 26.89 16.32 12.31 13.59 11.24 12.71 8.45 8.38 10.36 6.93 6.81 6.03 8.35 4.81 9.25 9.08 9.17 10.28 11.08 8.84 5.65 8.26 6.93 10.26 16.66 9.07 15.11 7.47 12.25 21.32 28.00 12.75 9.23 9.84 8.43 12.84 8.25 8.92 10.22 7.24 6.87 6.76 8.65 5.04 8.93 9.60 9.28 9.75 11.09 8.90 6.52 9.15 9.19 11.30 18.78 9.63 12.98 6.97 12.52 21.10 28.46 13.93 8.52 8.86 8.11 13.08 7.67 9.29 10.54 6.62 6.85 6.14 8.78 5.58 8.56 9.65 9.00 10.39 10.86 9.20 6.68 9.49 9.23 11.44 18.86 9.30 12.96 6.99 12.50 21.11 28.42 13.90 8.50 8.88 8.10 13.08 7.66 9.28 10.55 6.61 6.86 6.13 8.79 5.58 8.55 9.64 8.99 10.38 10.87 9.18 6.68 9.48 9.22 11.44 18.85 9.32 13.26 6.79 12.53 20.80 28.25 14.04 8.48 9.03 8.32 13.00 7.57 9.29 10.60 6.24 6.91 6.07 8.84 5.28 8.42 9.53 9.14 10.26 10.74 9.03 6.57 9.41 9.02 11.45 18.92 9.08 15.64 7.74 12.47 21.01 27.62 12.74 9.23 9.86 8.45 12.87 8.16 8.86 9.89 7.41 7.58 7.11 8.70 4.74 9.40 9.54 8.63 9.86 11.31 8.69 6.67 8.98 9.27 10.94 19.06 10.02 14.06 7.71 11.77 21.43 27.64 14.42 8.21 10.91 8.30 13.26 8.28 8.78 10.18 7.58 6.71 6.39 8.70 4.74 9.46 9.42 8.79 9.89 11.35 9.05 7.06 9.21 8.77 10.73 18.06 10.37 12.14 7.21 11.68 19.62 26.69 12.74 8.03 8.44 8.00 12.47 7.59 8.73 10.09 6.11 6.49 6.33 8.69 4.64 8.57 9.24 8.39 9.54 10.17 8.11 6.59 8.95 8.48 10.51 18.05 8.64 10.75 10.71 10.03 średnio 10.62 12.22 11.46 10.71 10.62 10.62 10.56 % pogr. % podkr. 33.3% 10.0% 40.0% 26.7% 50.0% 30.0% 33.3% 6.7% 33.3% 10.0% 33.3% 10.0% 36.7% 16.7% 31 BI (ARX) (TARX) (MRJD) (TAR) (TAR) (AR) (TAR) (IHMARX) (IHMARX) (TARX) (MRJD) (ARX) (ARX) (MRJD) (TAR) (pAR) (TARX) (TARX) (MRJD) (TARX) (pARX) (TARX) (pAR) (TARX) (pAR) (pAR) (TAR) (TAR) (TAR) (MRJD) Tabela 9: Wyniki uśredniania modeli dla zbioru danych PJM przy użyciu rozszerzającego się okna kalibracji. Kolumna BI oznacza najlepszą metodę bazową dla danego tygodnia względem miary WMAE. Wartości podkreślone oznaczają, że w danym tygodniu metoda okazała się lepsza od wszystkich metod bazowych. Pogrubienie wskazuje, że metoda była skuteczniejsza niż BIMSE i BIMAE. Tydzień 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 AM OLS PW CLS IRMSE IMAE BMA BIMSE BIMAE 12.95 6.99 12.51 21.11 28.42 13.94 8.52 8.85 8.09 13.07 7.65 9.29 10.56 6.59 6.89 6.11 8.80 5.58 8.51 9.65 9.01 10.40 10.86 9.20 6.68 9.50 9.23 11.46 18.88 9.27 22.59 17.08 14.47 22.20 29.05 21.28 12.40 12.03 10.69 16.83 10.21 14.13 11.74 8.93 11.00 8.38 11.42 6.96 12.81 12.38 9.89 10.94 11.26 9.78 7.75 8.70 9.76 10.82 17.93 11.98 21.71 16.31 14.80 20.57 26.04 19.70 12.09 15.19 11.21 16.24 9.55 11.74 12.76 7.94 8.93 7.62 10.38 7.66 9.24 11.16 10.89 12.65 12.49 9.81 8.09 10.10 10.42 11.68 19.19 10.74 15.10 7.44 12.51 19.87 26.66 13.45 8.51 9.99 8.55 13.31 8.05 9.74 10.23 6.66 6.65 6.57 8.85 5.43 9.17 9.88 9.06 10.64 10.42 9.07 6.87 9.17 8.76 10.85 18.29 10.23 12.98 6.97 12.52 21.09 28.41 13.93 8.51 8.87 8.10 13.07 7.65 9.30 10.56 6.59 6.88 6.11 8.79 5.58 8.52 9.65 9.01 10.40 10.86 9.19 6.69 9.50 9.23 11.45 18.87 9.28 12.96 6.99 12.51 21.10 28.41 13.91 8.51 8.87 8.09 13.08 7.66 9.30 10.55 6.61 6.87 6.12 8.79 5.58 8.53 9.65 9.00 10.40 10.85 9.20 6.69 9.49 9.23 11.45 18.86 9.30 23.07 16.82 14.86 19.62 33.72 22.76 12.40 12.19 10.59 17.11 7.65 14.07 11.72 8.88 10.82 8.43 11.47 7.00 13.01 12.59 9.92 11.00 11.33 10.01 7.88 8.93 9.97 11.00 18.35 12.39 15.64 7.74 12.54 19.62 27.29 12.74 9.23 9.86 8.32 13.27 8.43 9.20 10.34 7.09 6.80 6.56 8.96 5.92 8.94 9.69 9.11 11.00 10.45 9.49 6.79 9.12 9.01 11.09 18.44 10.22 14.07 7.71 12.51 20.88 27.20 13.07 9.23 9.86 8.32 13.27 8.43 9.20 10.34 7.09 6.80 6.56 8.96 5.92 8.94 9.69 9.11 11.00 10.45 9.49 6.79 9.12 9.01 11.09 18.44 10.22 12.14 7.21 11.68 19.62 26.69 12.74 8.03 8.44 8.00 12.47 7.59 8.73 10.09 6.11 6.49 6.33 8.69 4.64 8.57 9.24 8.39 9.54 10.17 8.11 6.59 8.95 8.48 10.51 18.05 8.64 10.76 10.76 10.03 średnio 10.62 13.18 12.90 10.67 10.62 10.62 13.32 % pogr. % podkr. 60.0% 10.0% 13.3% 6.7% 3.3% 3.3% 53.3% 3.3% 60.0% 10.0% 60.0% 10.0% 13.3% 3.3% 32 BI (ARX) (TARX) (MRJD) (TAR) (TAR) (AR) (TAR) (IHMARX) (IHMARX) (TARX) (MRJD) (ARX) (ARX) (MRJD) (TAR) (pAR) (TARX) (TARX) (MRJD) (TARX) (pARX) (TARX) (pAR) (TARX) (pAR) (pAR) (TAR) (TAR) (TAR) (MRJD) 5 Podsumowanie Praca przedstawia analizę dotyczącą prognozowania cen spotowych energii elektrycznej z wykorzystaniem uśredniania modeli. Technika ta polega na użyciu wielu predyktorów tej samej zmiennej i stworzeniu modelu, który przyniósłby prognozy dokładniejsze niż każda z nich z osobna. Metody bazowe wykorzystywały modele szeregów czasowych, w znacznej większości oparte na autoregresji. Metody, które zwróciły najdokładniejsze prognozy opierają się o metodę najmniejszych kwadratów. Wszystkie 3 takie podejścia (bez ograniczeń nałożonych na wagi – OLS, z wagami nieujemnymi – PW oraz z wagami nieujemnymi, sumującymi się do 1 – CLS) zachowują się wyraźnie lepiej niż pozostałe modele. W szczególności stwierdzamy, że metoda PW przy użyciu siedmiodniowego okna kalibracji jest podejściem optymalnym. W ujęciu globalnym, czyli dla wszystkich 3 zbiorów danych, taki model okazał się skuteczniejszy od wszystkich metod bazowych w nieco ponad 50% przypadków. Sugeruje to, że zastosowanie go w praktyce jest jak najbardziej wskazane. Możemy tym samym uznać, że niniejsza analiza odniosła sukces, ponieważ niejako poprawiamy rezultaty uzyskane w pracy [14], z której pochodzą zastosowane tutaj metody bazowe. Warto zaznaczyć również, że dla rynku Nord Pool w okresie 1998-1999 metody OLS i PW dały lepsze rezultaty od wszystkich metod bazowych również po uśrednieniu tygodniowych błędów WMAE, co sugeruje, że obie te metody nie miały niepożądanych wahań jeśli chodzi o błąd prognozy. Jeśli zaś chodzi o różnice w prognozach między zbiorami danych, to są one nieznaczne, jeśli skalibrujemy modele na optymalnym w niniejszym badaniu okresie 7 dni. Dla wszystkich trzech rozpatrywanych szeregów czasowych uśrednianie wynikające z różnych wariantów metody najmniejszych kwadratów prognozuje ceny spotowe energii elektrycznej najdokładniej. Dla rynku skandynawskiego modele te zafunkcjonowały nieco lepiej niż w przypadku rynku z wschodniego wybrzeża Stanów Zjednoczonych. Metody takie jak: średnia arytmetyczna, uśrednianie Bayesowskie, czy też modele, gdzie dobieramy wagi proporcjonalnie do wartości pewnej funkcji straty, prognozowały ceny spotowe energii elektrycznej w stopniu niezadowalającym. W większości wypadków prognozy te okazywały się gorsze zarówno od najdokładniejszej metody bazowej, jak i obu zdegenerowanych metod uśredniania. Należy również zaznaczyć, że użycie okna kalibracji długości 4 tygodni lub okna rozszerzającego się stwarza pewne zagrożenie, ponieważ dla pewnych tygodni uzyskiwane błędy bardzo wyraźnie przewyższają błędy ex ante. Dzieje się tak nawet dla metod, które uznaliśmy za satysfakcjonujące w przypadku okna 7-dniowego. Wyniki uzyskane przez Bordignona i in. [4] również wskazują na to, że uśrednianie modeli zastosowane do prognozowania cen spotowych zwiększa skuteczność osiąganych rezultatów. W porównaniu do niniejszej pracy, wspomniane badanie nie jest aż tak kompleksowe. Autorzy analizują tam jedynie jedną metodę uśredniania – średnią arytmetycz- 33 ną. Z drugiej jednak strony, jeśli skupimy się na porównaniu tylko metody AM, to zadziałała ona skuteczniej w cytowanej pracy. W przeciwieństwie do tego badania, tam autorzy stosują metody bazowe, które są ze sobą znacznie mniej skorelowane. Raviv i in. [16] również rozpatrują mniejszą liczbę metod uśredniania modeli. Zastosowali oni średnią arytmetyczną (AM) i metodę najmniejszych kwadratów z takimi samymi ograniczeniami jak metoda CLS z niniejszej pracy. Ponownie wnioski są optymistyczne – uśrednianie modeli skutkuje poprawą dokładności prognoz. Podobnie jak tutaj, metoda CLS okazała się lepsza od zwykłej średniej arytmetycznej. 34 6 Bibliografia Literatura [1] Aksu C., Sevket I.G. (1992). An empirical analysis of the accuracy of SA, OLS, ERLS and NRLS combination forecasts. International Journal of Forecasting 8(1), 27-43. [2] Barnard, G. A. (1963). New methods of quality control. Journal of Royal Statistical Society Series A 126(4), 255-258. [3] Bates, J. M., Granger, C. W. J. (1969). The combination of forecasts. Operational Research Quarterly 20, 451–468. [4] Bordignon, S., Bunn, D. W., Lisi, F., Nan, F. (2013). Combining day-ahead forecasts for British electricity prices. Energy Economics 35, 88-103. [5] Coleman, T. F., Li, Y. (1996). A reflective Newton method for minimazing a quadratic function suubject to bounds on some of the variables. SIAM Journal on Optimization, 6(4), 1040–1058. [6] Clemen, R. T. (1989). Combining forecasts: a review and annotated bibliography. International Journal of Forecasting 5, 559–583. [7] Elliott, G., Timmermann A. (2004). Optimal forecast combinations under general loss functions and forecast error distributions. Journal of Econometrics 122, 47-79. [8] Fernández, C., Ley, E., Steel, M. F. (2001). Benchmark priors for Bayesian model averaging. Journal of Econometrics 16, 381-427. [9] Granger, C. W. J., Ramanathan, R. (1984). Improved methods of combining forecasts. Journal of Forecasting 3, 197–204. [10] Hoeting, J. A., Madigan, D., Raftery, A. E., Volinsky, C. T. (1999). Bayesian model averaging: A tutorial. Statistical Science 14(4), 382-417. [11] Hsieh, D. A., Manski, C. F. (1987). Monte Carlo evidence on adaptive maximum likelihood estimation of a regression. Annals of Statistics 15, 541-551. [12] Janczura, J., Trück, S., Weron, R., Wolf, R. (2013). Identifying spikes and seasonal components in electricity spot price data: A guide to robust modeling. Energy Economics 38, 96-27. [13] Misiorek, A., Trück, S., Weron, R. (2006). Point and interval forecasting of spot electricity prices: linear vs. non-linear time series models. Studies in Nonlinear Dynamics and Econometrics, 10(3), Article 2. 35 [14] Misiorek, A., Weron, R. (2008). Forecasting spot electricity prices: A comparison of parametric and semiparametric time series models. International Journal of Forecasting 24, 744-763. [15] Nowotarski, J., Tomczyk, J., Weron, R. (2013). Robust estimation and forecasting of the long-term seasonal component of electricity spot prices. Energy Economics 39, 12-27. [16] Raviv, E., Bouwman, K. E., van Dijk, D. (2012). Forecasting short term electricity prices. Working Paper. [17] Stock, J. H., Watson, M. W. (2004). Combination forecasts of output hrowth in a seven-country data set. Journal of Forecasting 23(6), 405-430. [18] Timmermann, A. (2004). Forecast combination. W Elliot, G., Granger, C. W. J., Timmermann, A., Handbook of Economic Forecasting (s. 135-196). [19] Weron, R. (2006). Modelling and Forecasting Electricity Loads and Prices: A Statistical Approach. Wiley, Chichester. 36 HSC Research Report Series 2013 For a complete list please visit http://ideas.repec.org/s/wuu/wpaper.html 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 Forecasting of daily electricity spot prices by incorporating intra-day relationships: Evidence form the UK power market by Katarzyna Maciejowska and Rafał Weron Modeling and forecasting of the long-term seasonal component of the EEX and Nord Pool spot prices by Jakub Nowotarski, Jakub Tomczyk and Rafał Weron A review of optimization methods for evaluation of placement of distributed generation into distribution networks by Anna Kowalska-Pyzalska Diffusion of innovation within an agent-based model: Spinsons, independence and advertising by Piotr Przybyła, Katarzyna Sznajd-Weron and Rafał Weron Going green: Agent-based modeling of the diffusion of dynamic electricity tariffs by Anna Kowalska-Pyzalska, Katarzyna Maciejowska, Katarzyna Sznajd-Weron and Rafał Weron Relationship between spot and futures prices in electricity markets: Pitfalls of regression analysis by Michał Zator An empirical comparison of alternate schemes for combining electricity spot price forecasts by Jakub Nowotarski, Eran Raviv, Stefan Trueck and Rafał Weron Revisiting the relationship between spot and futures prices in the Nord Pool electricity market by Rafał Weron and Michał Zator Rewiring the network. What helps an innovation to diffuse? by Katarzyna Sznajd-Weron, Janusz Szwabiński, Rafał Weron and Tomasz Weron Going green: Agent-based modeling of the diffusion of dynamic electricity tariffs by Anna Kowalska-Pyzalska, Katarzyna Maciejowska, Katarzyna Sznajd-Weron, Karol Suszczyński and Rafał Weron Forecasting of daily electricity prices with factor models: Utilizing intra-day and inter-zone relationships by Katarzyna Maciejowska and Rafał Weron Computing electricity spot price prediction intervals using quantile regression and forecast averaging by Jakub Nowotarski and Rafał Weron Long term probabilistic load forecasting and normalization with hourly information by Tao Hong, Jason Wilson and Jingrui Xie Fuzzy interaction regression for short term load forecasting by Tao Hong and Pu Wang Energy forecasting: Past, present and future by Tao Hong Global Energy Forecasting Competition 2012 by Tao Hong, Pierre Pinson and Shu Fan Short-term forecasting of electricity spot prices using model averaging by Jakub Nowotarski