05 - Halicka ZET2010 skrócony

Transkrypt

05 - Halicka ZET2010 skrócony
WYKORZYSTANIE SZTUCZNYCH SIECI NEURONOWYCH DO
PROGNOZOWANIA CEN NA GIEŁDZIE ENERGII
Autor: Katarzyna Halicka
(„Rynek Energii” – nr 1/2010)
Słowa kluczowe: giełda energii, prognozowanie cen energii elektrycznej, prognozowanie zapotrzebowania na energię elektryczną, sztuczne sieci neuronowe
Streszczenie. Celem niniejszego artykułu jest przedstawienie zastosowania sztucznych sieci neuronowych do
prognozowania cen na giełdzie energii elektrycznej. Na wejście skonstruowanego predykatora neuronowego wprowadzono
m.in. przeszłe wartości ceny energii i wolumenu obrotu, zmienne określające pogodę, tzn. temperaturę, zachmurzenie,
prędkość wiatru oraz zmienne opisujące dzień i godzinę transakcji. Wszystkie te zmienne były mierzone dla każdej godziny
doby handlowej.
1. WSTĘP
Do budowy modelu prognozującego cenę energii elektrycznej na giełdzie energii wykorzystano
sztuczne sieci neuronowe (SSN). Czynników decydujących o wyborze tej metody było kilka.
Do najistotniejszych, zdaniem autorki, należy trafność prognoz wyznaczonych za pomocą modeli
neuronowych. W [1, 2, 3] prognozowano cenę energii na giełdzie energii wykorzystując modele
matematyczno-statystyczne, takie jak ARIMA i GARCH oraz sztuczne sieci neuronowe. Porównując
błędy uzyskane za pomocą tych metod zauważono, że prognozy wyznaczone za pomocą SSN
były najtrafniejsze. Poza tym, na wejście modelu neuronowego, w przeciwieństwie do klasycznych
modeli matematyczno-statystycznych, można wprowadzić kilka zmiennych objaśniających. Wiadomo,
że zapotrzebowanie na energię elektryczną i cena energii zależy m.in. od czynników pogodowych.
Dlatego też, istotne wydawało się skonstruowanie modelu, który uwzględniałby te zależności.
2. PROGNOZOWANIE CEN NA TOWAROWEJ GIEŁDZIE ENERGII
Zadanie prognostyczne, postawione przez autorkę, polegało na skonstruowaniu modelu, za pomocą którego można wyznaczyć cenę energii elektrycznej dla każdej godziny doby handlowej, dzień przed
fizyczną dostawą energii. Do budowy modelu prognozującego cenę energii na TGE SA zastosowano
sztuczne sieci neuronowe, a właściwie perceptron wielowarstwowy MLP (ang. Multi-Layered
Perceptron). Dane, wykorzystywane do budowy modelu, pochodziły z okresu od 01.01.2008 r.
do 31.12.2008 r. (8 760 przypadków). Natomiast dane z okresu od 01.01.2009 r. do 31.01.2009 r. (744
przypadków) zostały wykorzystywane do zbadania zdolności prognostycznych utworzonych sieci
neuronowych.
2.1. Budowa modelu prognostycznego
Początkowo przeprowadzano wstępną analizę danych wejściowych (rys. 1). Na podstawie wizualnej
analizy wykresu ceny energii elektrycznej można stwierdzić, że wykazuje on cykliczność dobową i
tygodniową. Cena energii zależy od godziny oraz dnia tygodnia, w jakim jest kupowana/sprzedawana.
cena
Średnia cena energii w poszczególny ch
godzinach doby handlowej
140
135
130
125
120
115
110
105
100
95
90
85
80
1
3
5
7
9
11
13
15
17
19
21
23
godzina
cena
Średnia cena energii w poszczególny ch dniach ty godnia
i w poszczególny ch godzinach doby handlowej
140
135
130
125
120
115
110
105
100
95
90
85
80
1
3
5
7
9
11
13
15
17
19
21
23
godzina
Rys. 1. Średnia cena energii elektrycznej w zależności od dnia tygodnia i godziny transakcji
Dokonując analizy graficznej rysunku 1 można wyróżnić trzy profile kształtowania się średniej ceny
energii: średnia cena energii elektrycznej w dniach roboczych, sobotę i niedzielę. Dlatego też,
na wejście neuronowego modelu prognostycznego wprowadzono zmienną określającą odpowiednio
dzień tygodnia (1 – dzień roboczy, 2 – sobota, 3 – niedziela i święta) oraz godzinę transakcji.
Skonstruowany przez autorkę model prognostyczny miał na wejściu 7 zmiennych, na wyjściu jedną
zmienną (rys. 2). Wszystkie te zmienne były mierzone dla każdej godziny doby handlowej. Dane, dotyczące ceny energii elektrycznej oraz wolumenu obrotów, wykorzystywane do budowy modelu pochodzą ze strony internetowej Towarowej Giełdy Energii SA. Natomiast dane określające pogodę
w badanym okresie pochodzą z Instytutu Meteorologii i Gospodarki Wodnej w Warszawie. Dotyczyły
one temperatury, prędkości wiatru i zachmurzenia w sześciu wybranych stacjach metrologicznych
w Polsce: Poznaniu, Rzeszowie, Suwałkach, Szczecinie, Warszawie i Wrocławiu.
cena
energii (t)
wolumen
(t)
prędkość
wiatru (t)
zach. (t)
Model SSN
cena energii
elektrycznej (t+1)
temp. (t)
godzina
transakcji (t)
dzień
tygodnia (t)
Rys. 2. Model prognostyczny
2.2. Wyznaczanie przykładowych prognoz cen energii elektrycznej na giełdzie energii
Na podstawie skonstruowanego modelu prognostycznego, projektowano sieci neuronowe typu MLP
różniące się liczbą warstw ukrytych. Zbudowane sieci neuronowe poddano ocenie. Ocenę dopasowania
modeli neuronowych do danych rzeczywistych przeprowadzono dla całego okresu budowy modeli, tj.
od 01.01.2008 r. do 31.12.2008 r.
Początkowo skonstruowano sieć składającą się z jednej warstwy ukrytej zawierającej 13 neuronów
(MLP 7:168-13-1:1), a następnie korzystając z podstawowych miar statystycznych zbadano dopasowanie tej sieci do danych rzeczywistych. Otrzymane wyniki umieszczono w tabeli 1.
Analizując otrzymane wyniki można zauważyć, że przeciętne odchylenia prognoz cen energii
od wartości rzeczywistych wynosi około 14,56 PLN. Stanowi to około 4,61% zmiennej prognozowanej.
Można również zauważyć, że nie występuje systematyczne niedoszacowanie bądź przeszacowanie
prognozy. Wysoka wartość maxAE i maxAPE świadczy o tym, że zdarzają się błędy znacznie przekraczające wartości przeciętne.
W dalszej części badań skonstruowano dwie sieci neuronowe składające się z dwóch warstw ukrytych.
Podstawowe parametry obu sieci przedstawiono w tabeli 2. Sieci różniły się miedzy sobą liczbą neuronów w drugiej warstwie ukrytej. Sieć typu MLP 7:168-30-5-1:1 miała 30 neuronów w pierwszej warstwie ukrytej i 5 neuronów w drugiej warstwie. Podczas gdy predykator neuronowy typu MLP 7:16830-6-1:1 został zbudowany z 30 neuronów w pierwszej warstwie ukrytej i 6 w warstwie drugiej.
Tabela 1
Ocena dopasowania jednowarstwowego modelu do danych rzeczywistych w okresie budowy modelu
Miary statystyczne
ME (ang. Mean Error) – błąd
średni
MAE (ang. Mean Absolute
Error) – błąd średni
bezwzględny
RMSE (ang. Root Mean Square
Error) – pierwiastek z błędu
średniego kwadratowego
MAPE (ang. Mean Absolute
Percentage Error) – średni
bezwzględny błąd procentowy
MdAPE (ang. Median Absolute
Percentage Error) – mediana
bezwzględnego błędu
procentowego
maxAPE (ang. Maximum
Absolute Percentage Error) –
maksymalny błąd procentowy
maxAE (ang. Maximum
Absolute Error) – maksymalny
błąd bezwzględny
MLP
7:168-13-1:1
6,52 PLN
5,46 PLN
14,56 PLN
4,61%
3,11%
66,73%
341,60 PLN
Tabela 2
Parametry wybranych sieci neuronowych
Zmienne
wejściowe
Zmienne
wyjściowe
Liczba wejść
Liczba wyjść
Liczba warstw
ukrytych
Liczba
neuronów
w warstwie
wej.
Liczba
neuronów
w warstwie
ukrytej
Liczba
neuronów
w warstwie
wyj.
Liczba wartości
opóźnionych
Horyzont
czasowy
Funkcja
aktywacji
MLP
MLP
7:168-30-57:168-30-61:1
1:1
cena energii elektrycznej,
wolumen obrotów, prędkość
wiatru, zachmurzenie,
temperatura, godzina
transakcji, dzień tygodnia
cena energii elektrycznej
7
1
2
7
1
2
168
168
I warstwa: 30
II ukryta: 5
I warstwa: 30
II warstwa: 6
1
1
24
24
24
24
I warstwa (wejściowa):
liniowa
II warstwa (ukryta):
hiperboliczna
III warstwa(ukryta):
hiperboliczna
IV warstwa (wyjściowa):
logistyczna
Metoda uczenia I etap uczenia: metoda
wstecznej propagacji błędów
II etap: metoda gradientów
sprzężonych
Kolejny etap wyznaczania prognozy cen energii polegał na wytrenowaniu skonstruowanych sieci.
Proces uczenia tych sieci przebiegał w dwóch etapach. W pierwszym etapie uczono sieć metodą
wstecznej
propagacji
błędów,
w drugim
metodą
gradientów
sprzężonych.
Uwzględnione w eksperymentach numerycznych sieci różniły się postacią funkcji aktywacji.
W przypadku sieci MLP 7:168-30-5-1:1 i MLP 7:168-30-6-1:1 w warstwie wejściowej przyjęto liniową
funkcję aktywacji, w warstwach ukrytych hiperboliczną, a w warstwie wyjściowej logistyczną.
Zbudowane sieci neuronowe poddano ocenie. Wyniki z obliczeń umieszczono w tabeli 3.
Tabela 3
Ocena dopasowania dwuwarstwowych modeli do danych rzeczywistych w okresie budowy modelu
MLP
MLP
Miary statystyczne 7:168-30-5- 7:168-30-61:1
1:1
ME – błąd średni
2,86 PLN
2,25 PLN
MAE – błąd
średni
3,97 PLN
2,93 PLN
bezwzględny
RMSE –
pierwiastek ze
7,97 PLN
5,95 PLN
błędu średniego
kwadratowego
MAPE – średni
bezwzględny błąd
3,42%
2,53%
procentowy
MdAPE mediana
bezwzględnego
2,45%
1,84%
błędu
procentowego
Na podstawie obliczonych miar statystycznych można zauważyć, że najlepiej dopasowany do danych
rzeczywistych jest dwuwarstwowy model zbudowany z wykorzystaniem sieci neuronowej typu
MLP 7:168-30-5-1:1. Niewielka wartość błędu średniego (ME) wskazuje, że nie występuje systematyczne przeszacowanie i systematyczne niedoszacowanie prognoz. Dlatego też, do dalszych badań
wykorzystywano predykator neuronowy typu: MLP 7:168-30-5-1:1 – charakteryzujący się najlepszą
jakością.
3. ANALIZA I OCENA WYNIKÓW
Korzystając z dwuwarstwowego modelu neuronowego zbudowanego na wytrenowanej sieci neuronowej typu: MLP 7:168-30-5-1:1 wyznaczono prognozę ceny energii elektrycznej w poszczególnych
godzinach stycznia 2009 r.
Wartości prognozy ceny energii elektrycznej na giełdzie w arbitralnie wybranych dniach stycznia
2009 r. przedstawiono na rys. 3. Uzyskane wyniki porównano z wartościami rzeczywistymi cen energii
elektrycznej w tym okresie, dokonano oceny trafności prognozy (tabela 4).
prognozowane cena [PLN]
Prognozowana cena energii elektrycznej w okresie
od 10 stycznia do 13 stycznia 2009 r.
140
130
120
110
100
90
13-Sty-04
13-Sty-04
13-Sty-04
12-Sty-04
12-Sty-04
12-Sty-04
12-Sty-04
11-Sty-04
11-Sty-04
11-Sty-04
10-Sty-04
10-Sty-04
10-Sty-04
10-Sty-04
80
Rys. 3. Prognozowane ceny energii elektrycznej wyznaczone dla arbitralnie wybranych dni stycznia 2009 r.
Analizując wyniki przedstawione w tabeli 4 można zauważyć, że prognozowane wartości cen energii
elektrycznej na giełdzie energii w styczniu 2009 r. odbiegają od wartości rzeczywistych średnio
o 3,74 PLN, stanowi to około 2,80% zmiennej prognozowanej.
Ponadto media absolutnych procentowych błędów wynosi 1,79%. Można również zauważyć, że nie występuje systematyczne niedoszacowanie bądź przeszacowanie prognozy, ponieważ wartość błędu średniego (ME) oraz mediany bezwzględnego błędu procentowego (MdAPE) nieznacznie różnią się od
zera.
Tabela 4
Ocena trafności prognozy wyznaczonej w styczniu 2009 r.
Miary statystyczne
ME – błąd średni
MAE – błąd średni
bezwzględny
RMSE – pierwiastek z
błędu średniego
kwadratowego
MAPE – średni
bezwzględny błąd
procentowy
MdAPE mediana
bezwzględnego błędu
procentowego
maxAPE – maksymalny
błąd procentowy
MLP 7:168-30-51:1
1,85 PLN
3,74 PLN
9,50PLN
2,80%
1,79%
29,74%
Otrzymane wyniki (niewielka wartość średniego modułu względnego błędu prognozy, nieznaczące odchylenie wartości rzeczywistej od wartości prognozowanej) dowodzą, że sztuczne sieci neuronowe
mogą być użytecznym narzędziem prognozowania, znajdującym zastosowanie w praktyce.
4. PODSUMOWANIE
W artykule do wyznaczenia prognozy ceny energii elektrycznej na giełdzie energii wykorzystano
sztuczne sieci neuronowe (perceptron wielowarstwowy MLP).
Podczas prac preparacyjnych testowano szereg modeli sieci różniących się liczbą warstw ukrytych
i liczbą neuronów w tych warstwach. Ostatecznie do wyznaczenia prognozy ceny energii elektrycznej
w miesiącu styczniu 2009 roku wykorzystano ten, który jest najlepiej dopasowany do danych rzeczywistych.
Uzyskane prognozy charakteryzowały się wysoką jakością, dowodząc, że sztuczne sieci neuronowe są
użytecznym narzędziem prognozowania, mogącym znaleźć praktyczne zastosowanie przez operatorów
handlowych przedsiębiorstw obrotu i dystrybucji.
Należy podkreślić, że podczas wykorzystania wyuczonego predykatora neuronowego nie jest wymagana specjalistyczna wiedza z dziedziny metod sztucznej inteligencji. Istotny jest również fakt, że
w momencie wprowadzenia nowych danych nie należy rozpoczynać całego procesu prognozowania od
początku.
Podczas budowy modelu nie była konieczna szczegółowa analiza danych dotyczących ceny energii
i wolumenu obrotów na giełdzie energii. Aczkolwiek taka analiza może być pomocna przy doborze
zmiennych wejściowych do modelu prognostycznego.
W przypadku modeli statystycznych przed wyznaczeniem prognozy cen energii konieczne jest
przeprowadzenie wstępnej analizy danych.
LITERATURA
[1] Chodakowska E., Halicka K., Kononiuk A., Nazarko J.: Prognozowanie cen energii elektrycznej
[2]
[3]
[4]
[5]
[6]
na Towarowej Giełdzie Energii SA z wykorzystaniem modeli ARIMA. Technologie informatyczne
i prognozowanie w zarządzaniu – wybrane zagadnienia, pod red. Kiełtyki L., Nazarko J., Białystok
2005, s. 140-159.
Chodakowska E., Halicka K., Kononiuk A., Nazarko J.: Zastosowanie modeli GARCH do
prognozowania cen energii elektrycznej. Technologie informatyczne i prognozowanie
w zarządzaniu – wybrane zagadnienia, pod red. Kiełtyki L., Nazarko J., Białystok 2005, s. 159-172.
Chodakowska E., Halicka K., Kononiuk A., Nazarko J.: Zastosowanie sztucznych sieci
neuronowych do prognozowania cen energii elektrycznej na Towarowej Giełdzie Energii S.A.
Technologie informatyczne i prognozowanie w zarządzaniu – wybrane zagadnienia, pod red.
Kiełtyki L., Nazarko J., Białystok 2005, s. 235-245.
Lichota J.: Artificial Neural Networks Application to Optimization of Heat-Only Boiler Control.
Rynek Energii 2009, nr 4.
Malko J., Wilczyński A.: Rynki energii elektrycznej i regulacja – Komitet Studiów C5. Rynek Energii
2009, nr 2.
Szkutnik J., Moroz E.: Procedura efektywnej komunikacji w obrębie spółki dystrybucyjnej. Rynek
Energii 2009, nr 1.
Artykuł opracowano w ramach pracy statutowej nr S/WZ/1/2009.
APPLICATION OF ARTIFICIAL NEURAL NETWORKS IN FORECASTNG ON ENERGY
MARKET
Key words: energy market, electric energy prices forecasting, electric energy demand forecasting, artificial neural networks
Summary. The aim of the paper is to present application of artificial neural networks in electric energy prices forecasting on
energy market. As an input of the constructed predicator past energy prices and turnover volume, variables describing
weather that is temperature, cloudiness, speed of wind and variables describing time and date of transaction were introduced.
All the variables were measured for each hour of the trade twenty- four hours. In the next step of study adjustment of the
model to the real data was assessed.
Katarzyna Halicka, dr inż. Jest adiunktem na Wydziale Zarządzania Politechniki Białostockiej, ul.
Wiejska 45A, 15-351 Białystok. Zainteresowania naukowe dotyczą przede wszystkim zastosowań metod
sztucznej inteligencji w prognozowaniu. Prowadzone badania naukowe obejmują obszar polskiego rynku
energii a w szczególności giełdy energii w Polsce.
E-mail: [email protected]