pełny tekst

Transkrypt

pełny tekst
FOLIA UNIVERSITATIS AGRICULTURAE STETINENSIS
Folia Univ. Agric. Stetin. 2007, Oeconomica 258 (49), 177–186
Celina SKROBISZ
ZASTOSOWANIE BAYESOWSKICH MODELI HIERARCHICZNYCH
W MODELOWANIU NA PRZYKŁADZIE DOTYCZĄCYM
MIESIĘCZNYCH DOSTAW GAZU ZIEMNEGO
BAYESIAN HIERARCHICAL MODELLING FOR EXAMPLE DELIVERIES
OF EARTH GAS
Katedra Zastosowań Matematyki, Akademia Rolnicza
ul. Monte Cassino 16, 70-466 Szczecin
Abstract. The article was consecrated the bayesian modelling and forecasting on the ground
the hierarchical models of time series. The principles of bayesian modeling and forecasting
were put-upon to analysis of deliveries of earth gas The comparison of exactitude of prognoses'
ex post was conducted fast on the ground bayesian models and classic models. In the article to
building, estimation and prediction the bayesian, hierarchical models were used numerical
methods Monte Carlo. Seven hierarchic models were estimated on the basis of the data of the
relating deliveries of the earth gas in years 1994–1997.
Słowa kluczowe: analiza Bayesowska, metody Monte Carlo, próbnik Gibbsa.
Key words: Bayesian analysis, Monte Carlo methods, Gibbs sampling.
ISTOTA WNIOSKOWANIA BAYESOWSKIEGO
Metody Bayesowskie zaliczane są do nieklasycznych metod statystycznych. Opierają
się one na warunkowym prawdopodobieństwie, zdefiniowanym za pomocą wzoru Bayesa.
Ich istota oparta jest o rozkłady a priori, które odgrywają ważną rolę we wnioskowaniu. Model statystyczny scharakteryzowany jest jednoznacznie przez gęstość łącznego rozkładu
prawdopodobieństwa wektora obserwowanego, wektora prognozowanego oraz wektora
parametrów. Zapis analityczny tego modelu jest następujący:
p ( y, y f , θ ) = p ( y f / y, θ ) p ( y / θ ) p (θ )
Estymacja parametrów modelu polega na wyznaczeniu z łącznego wektora obserwacji
i wektora parametrów warunkowej gęstości dla parametrów, przy danym wektorze y, czyli gęstości
rozkładu a posteriori. Wnioskowanie Bayesowskie opiera się na twierdzeniu Bayesa:
p (θ / y ) =
p ( y / θ ) p (θ )
∫ p( y / θ ) p(θ )dθ
θ
gdzie:
y − wektor obserwacji,
θ − wektor parametrów,
p ( y ) = ∫ p (θ ) p ( y / θ )dθ − gęstość brzegowego rozkładu wektora X,
C. Skrobisz
178
p(θ) – wstępna (niezależna od obserwacji) wiedza badacza o parametrze θ, wyrażona
za pomocą rozkładu a priori o gęstości p(θ),
p(y/θ) – funkcja wiarygodności określająca stopień przekonania, dotyczący przyjmowanych przez badane zjawisko wartości względem hipotetycznych wartości
parametru θ,
p(θ/y) – wiedza badacza o parametrze θ oparta na całej dostępnej informacji (z próby
i wiedzy wstępnej), wyrażona przez gęstość rozkładu a posteriori.
Predykcja jest wyznaczeniem z łącznej gęstości p ( y, y f , θ ) gęstości rozkładu warunkowego dla wektora prognozowanego, przy zaobserwowanym wektorze y. Jest to tzw. gęstość rozkładu predyktywnego:
p( y f / y) =
p( y, y f )
p( y )
∫ p( y, y
f
,θ )dθ
= ∫ p( y f / y,θ )
Θ
=
p( y )
Θ
p ( y, θ )
dθ = ∫ p ( y f / y,θ ) p (θ / y )dθ
p( y)
Θ
Uzyskany rozkład a posteriori p (θ / y ) i rozkład predyktywny p ( y f , y ) reprezentuje całą dostępną wiedzę o szacowanych wielkościach parametrów θ i wektorze y f w następstwie wektora y. W stosowaniu metod Bayesowskich podstawowymi problemami, z którymi należy się uporać, są problemy natury numerycznej. Wyznaczenie podstawowych charakterystyk rozkładów a posteriori i predyktywnego wymaga obliczenia całek wielokrotnych.
Oznacza to, że w przypadku wielowymiarowych przestrzeni parametrów i zmiennych ukrytych, które są przedmiotem wnioskowania, praktycznie jedynymi dostępnymi metodami obliczeniowymi są symulacyjne metody Monte Carlo. W procesie symulacyjnym wykorzystywane
są różne algorytmy, np. Gibbsa, algorytm Metropolisa i Hastingsa czy algorytm eliminacji.
ANALIZA BAYESOWSKA HIERARCHICZNYCH MODELI SZEREGU CZASOWEGO
Ogólne zapisy analityczne − zarówno modeli klasycznych hierarchicznego, jak i Bayesowskich − są takie same. Różnice i to o zasadniczym charakterze odnoszą się do sposobów estymacji, weryfikacji i budowy prognoz.
Postać modelu hierarchicznego dwustopniowego można zapisać następująco:
m
p1
m
p2
s =1
r =1
Ysrt = α 1t + α 0 + ∑ b0 s Qst + ∑ b0 sr Qsrt + U srt ,
∑b
s
0s
= ∑ b0 sr = 0
(1)
r
Model 3-stopniowy wyraża się wzorem:
m
p1
m
p2
m
p3
s =1
r =1
l
Ysrlt = α 1t + α 0 + ∑ b0 s Q st + ∑ b0 sr Q srt + U 2 t + + ∑ b0 srl + Qsrlt + U srlt
przy warunkach:
m
p1
∑b
s =1
0s
=
m
p2
∑b
r =1
0 sr
=
m
p3
∑b
l =1
0 srl
=0
(2)
179
Zastosowanie Bayesowskich modeli hierarchicznych...
Zapisy analityczne modeli oraz ich zestawienie dla danych miesięcznych (m=12) podajemy za Zawadzkim (2003).
W modelach (1), (2) zmienne Qkt , Qsrt oraz Qsrlt są zmiennymi zerojedynkowymi,
przyjmującymi wartości równe 1 dla poszczególnych podokresów, wynoszących odpowied-
m m
m
,
oraz
, gdzie p1 , p 2 , p3 są podzielnikami odpowiadającymi kolejnym stopp1 p 2
p3
nio
niom hierarchii. Z kolei liczba szacowanych parametrów w modelach hierarchicznych jest
równa sumie podzielników pomniejszonych o liczbę stopni hierarchii. W przypadku modelu
dwuczynnikowego:
L2 = ( p1 − 1) + ( p 2 − 1) = p1 + p 2 − 2
Natomiast w modelu trzyczynnikowym wyraża się wzorem:
L3 = ( p1 − 1) + ( p 2 − 1) + ( p3 − 1) = p1 + p 2 + p3 − 3
Zestawienie modeli hierarchicznych przedstawiono w tab. 1.
Tabela. 1. Specyfikacja regularnych modeli hierarchicznych dla danych miesięcznych
Czynnik pierwszy
Model
Czynnik drugi
Czynnik trzeci
Liczba
szacowanych
parametrów
rodzaj
zmienności
macierz
M12
miesiąc w roku
IN
H26
półrocze
w roku
PR
miesiąc w półroczu
MP
6
H34
kwartał
w roku
K
miesiąc w kwartale
MK
5
H43
okres 4 miesięcy
w roku
CZ
miesiąc w okresie
czteromiesięcznym
MCZ
5
H62
okres 2 miesięcy
w roku
D
miesiąc w okresie
dwóch miesięcy
MD
6
H232
półrocze
w roku
PR
2 miesiące
w półroczu
PD
H223
półrocze
w roku
PR
kwartał w półroczu
KP
H322
okres 4 miesięcy
w roku
CZ
2 miesiące w okresie
4 miesięcy
MDCZ
rodzaj
zmienności
rodzaj
zmienności
macierz
macierz
11
miesiąc
w okresie dwóch
miesięcy
miesiąc
w kwartale
miesiąc
w okresie dwóch
miesięcy
TMD
4
MK
4
MD
4
Źródło: Zawadzki (2003).
Do szacowania parametrów Bayesowskich modeli hierarchicznych zostanie wykorzystany algorytm Gibbsa, będący jednym ze skuteczniejszych narzędzi symulacyjnych metod
Monte Carlo. Procedura Gibbsa umożliwia losowanie z rozkładu wielowymiarowego poprzez losowanie z pełnych rozkładów warunkowych i jest następująca: Mając dany wektor
(q)
(q)
(q)
(q)
(q)
(q)
(θ1 , θ 2 ,..., θ p , h1 , h2 ,..., hm ) , będący wynikiem q-tego losowania (lub wektor
startowy, gdy q=0), wektor: (θ1
θ1
( q +1)
losujemy z p (θ1 /θ 2
(q)
( q +1)
,θ 2
( q +1)
,..., θ p
(q)
(q)
(q)
(q)
, θ 3 ,..., θ p
( q +1)
, h1
( q +1)
, h2
( q +1)
,..., hm
, h (q) , y)
( q +1)
θ2
θ p −1
losujemy z p (θ 2 / θ1
( q +1)
(q)
, θ 3 ,...,θ p
losujemy z p (θ p −1 / θ1
( q +1)
,θ 2
( q +1)
, h (q) , y) …
,..., θ p − 2
( q +1)
,θ p
(q)
, h (q ) , y)
( q +1)
) , otrzymujemy:
180
θp
h1
C. Skrobisz
( q +1)
losujemy z p (θ p / θ1
( q +1)
,θ 2
(q)
( q +1)
losujemy z p (h1 / θ ( q+1) , h2
( q +1)
losujemy z p (h2 / θ ( q +1) , h1
h2
hm −1
hm
( q +1)
( q +1)
( q +1)
(q)
( q +1)
, h (q ) , y)
(q)
, h3 ,..., hm , y )
( q +1)
losujemy z p (hm −1 / θ ( q +1) , h1
losujemy z p (hm / θ ( q +1) , h1
,..., θ p −1
(q)
(q)
, h3 ,..., hm , y ) …
( q +1)
( q +1)
(q)
(q)
(q)
, h2 ,..., hm − 2 , hm , y )
(q)
(q)
, h2 ,..., hm −1 , y )
Wygenerowanie jednej realizacji wektora losowego składa się z p+m kroków i jest to jeden pełny cykl Gibbsa. Powtarzając tę procedurę losowania, otrzymamy ciąg
(0)
(0)
(0)
(0)
(0)
(0)
(1)
(1)
(1)
(1)
(1)
(1)
θ1 ,θ 2 ,..., θ p , h1 , h2 ,..., hm ) , θ1 , θ 2 ,..., θ p , h1 , h2 ,..., hm ) …
(s)
(s)
(s)
(s)
(s)
(s)
θ1 ,θ 2 ,...,θ p , h1 , h2 ,..., hm ) , θ1
(θ1
(S + N )
,θ 2
(S +N )
,..., θ p
(S +N )
, h1
(S + N )
, h2
(S + N )
( s +1)
,θ 2
,..., hm
( s +1)
(S +N )
,..., θ p
( s +1)
, h1
( s +1)
, h2
( s +1)
,..., hm
( s +1)
)…
) … realizacji łańcucha Markowa, które-
go rozkładem stacjonarnym jest rozkład a posteriori.
PRZYKŁAD EMPIRYCZNY
Dotychczasowe rozważania zostaną zilustrowane przykładem empirycznym dotyczącym
miesięcznych dostaw gazu ziemnego w ciągu trzech lat. Wybór okresu związany był
z przeprowadzeniem analizy porównawczej prognoz ex post otrzymanych na podstawie
modeli Bayesowskich oraz modeli klasycznych. Wyniki zastosowania modeli klasycznych
zaprezentowane zostały w pracy Zawadzkiego (2003).⋅
Rysunek 1 przedstawia kształtowanie się miesięcznych dostaw gazu ziemnego.
500
400
.
–3
[MJ m ]
450
350
300
250
1
4
7
10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58
Miesiąc
Rys.1. Kształtowanie się dostaw gazu ziemnego w latach 1994–1997
Tabela 2. Wartości oczekiwane i odchylenia standardowe a posteriori parametrów siedmiu modeli hierarchicznych
Model
Parametr
Y1
H26
H26
H43
H43
H34
H34
H62
H62
H223
H223
H232
H232
H322
H322
wartość
oczekiwana
odchylenie
standardowe
wartość
oczekiwana
odchylenie
standardowe
wartość
oczekiwana
odchylenie
standardowe
wartość
oczekiwana
odchylenie
standardowe
wartość
oczekiwana
odchylenie
standardowe
wartość
oczekiwana
odchylenie
standardowe
wartość
oczekiwana
odchylenie
standardowe
teta_1
398,77
4,77
420,66
8,13
427,03
9,38
420,70
11,38
397,47
4,64
399,16
4,81
421,23
398,77
tata_2
397,39
5,75
353,97
8,40
372,21
8,89
408,08
10,93
395,25
4,58
394,92
6,01
353,24
397,39
tata_3
393,92
6,92
399,43
8,88
357,93
9,28
360,82
11,35
396,72
4,89
399,94
5,40
390,16
393,92
tata_4
399,39
6,00
381,20
8,95
397,84
7,65
351,92
11,74
394,87
5,03
399,67
4,88
401,94
399,39
tata_5
398,45
5,80
402,89
8,90
390,21
7,66
388,29
10,71
–
–
–
–
–
398,45
tata_6
398,98
5,90
–
–
–
–
401,67
6,56
–
–
–
–
–
398,98
sigma
44,36
2,49
41,91
2,34
40,95
2,29
42,20
2,42
45,15
2,37
45,26
2,37
42,13
44,36
tau
5,92
4,75
31,89
13,39
33,01
13,98
33,42
12,92
5,26
4,54
6,35
5,46
37,69
5,92
Mu
397,75
4,27
392,46
12,25
390,33
12,60
389,71
12,04
396,13
4,10
398,27
4,44
392,63
397,75
182
C. Skrobisz
W analizie dostaw gazu ziemnego szacowaniu poddanych zostało siedem modeli hierarchicznych, w tym cztery dwustopniowe oraz trzy trzystopniowe.
Łączny rozkład a posteriori dla poszczególnych modeli hierarchicznych jest następujący:
J
J
nj
p(θ , μ, logσ , logτ / y) ∝ τ ∏ N (θ j / μ,τ )∏∏ N ( yij / θ j ,σ 2 )
2
j =1
j =1 i=1
Do obliczeń charakterystyk rozkładów a posteriori parametrów wykorzystano metody
MCMC. Wykonano 550 000 losowań (cykli Gibbsa), w tym odrzucono 50 000 spalonych
cykli. W obliczeniach wykorzystano program komputerowy Gauss 6.0. Tabela 2 przedstawia wyniki wartości oczekiwanych i odchyleń standardowych a posteriori parametrów.
Najmniejsza wartość oczekiwana oszacowanego parametru teta_1 wynosi 397,47
i występuje w modelu H223, natomiast największa wartość oczekiwana tego parametru
to 427,03 − jest ona wynikiem oszacowania parametrów modelu dwustopniowego H34.
Najwyżej oszacowana wartość oczekiwana parametru teta_2 jest dla modelu dwustopniowego H62 − wynosi ona 408,08. Z kolei oczekiwaną wartość najmniejszą (353,24) uzyskujemy w wyniku oszacowania parametrów dla modelu H322. Parametr teta_3 osiąga największą wartość oczekiwaną 399,94 dla modelu H232. Wartość najmniejsza dla tego parametru to 357,93 − uzyskana jest w wyniku oszacowań parametrów modelu dwustopniowego H34. Z kolei dla modelu H322 osiągamy największą wartość oczekiwaną dla parametru teta_4 − wynosi ona 401,94. Ten sam parametr osiąga najmniejszą wartość oczekiwaną
351,92 dla modelu dwustopniowego H62. Parametr teta_5 szacowany był dla czterech
modeli dwustopniowych − największą wartość oczekiwaną 402,89 osiągnął dla modelu
H43. Z kolei najmniejsza wartość oczekiwana dla tego parametru oszacowana została
w modelu H62 i wynosiła 388,29. Parametr teta_6 szacowany był dla dwóch modeli. Największa wartość oczekiwana tego parametru wynosi 401,67 dla modelu H62, natomiast
najmniejsza wartość oczekiwana parametru teta_6 plasuje się na poziomie 398,98 dla modelu H26. Tabela 3 przedstawia wartości kwantyli a posteriori dla poszczególnych parametrów siedmiu modeli hierarchicznych.
Tabela 3. Wartości kwantyli a posteriori dla poszczególnych parametrów przy zmiennych zero-jedynkowych
Modele
H26
Kwantyle
a posteriori
teta_1
0,025
0,25
0,5
0,75
0,95
389,9737
395,2528
398,2695
402,0403
408,8277
H26
teta_2
385,6680
393,5276
397,4575
401,3873
408,2645
H26
teta_3
377,7468
390,2170
394,7516
399,2862
404,9545
H26
teta_4
388,6660
394,7414
398,7916
402,8418
412,9673
H26
teta_5
386,9108
394,8206
397,7867
401,7416
410,6401
H26
teta_6
387,8514
394,8928
398,9164
402,9400
411,9932
H26
sigma
39,80511
42,48299
44,08972
46,23203
49,44548
H26
tau
0,371392
1,855511
4,82375
8,534049
18,18083
H26
mu
389,1234
394,6417
398,0907
400,8498
406,3681
H43
teta_1
405,4392
415,2161
420,1045
426,2150
435,9918
H43
teta_2
338,2800
348,3834
353,4352
359,7498
369,8533
H43
teta_3
382,8275
393,5210
398,8677
405,5511
416,2445
H43
teta_4
364,2059
375,0064
381,7567
387,1569
397,9574
Zastosowanie Bayesowskich modeli hierarchicznych...
183
cd. tab. 3
Modele
H43
H43
H43
H43
H43
H34
H34
H34
H34
H34
H34
H34
H34
H34
H62
H62
H62
H62
H62
H62
H62
H62
H62
H223
H223
H223
H223
H223
H223
H223
H223
H223
H232
H232
H232
H232
H232
H232
H232
H232
H232
H322
H322
H322
H322
H322
H322
H322
H322
H322
Kwantyle
a posteriori
teta_5
teta_6
sigma
tau
mu
teta_1
teta_2
teta_3
teta_4
teta_5
teta_6
sigma
tau
mu
teta_1
teta_2
teta_3
teta_4
teta_5
teta_6
sigma
tau
mu
teta_1
teta_2
teta_3
teta_4
teta_5
teta_6
sigma
tau
mu
teta_1
teta_2
teta_3
teta_4
teta_5
teta_6
sigma
tau
mu
teta_1
teta_2
teta_3
teta_4
teta_5
teta_6
sigma
tau
mu
0,025
0,25
0,5
0,75
0,95
386,2292
–
37,26073
14,51571
367,8085
409,3382
355,3150
340,4834
383,4819
375,7829
–
36,63631
14,03163
364,8577
399,5950
387,8392
339,3158
329,9038
368,0807
389,3441
37,51008
14,14599
365,9030
389,1598
386,1140
387,1473
383,9985
–
–
40,3744
0,381957
388,1600
390,1134
381,1994
390,3555
390,8528
–
–
40,61416
0,459738
389,4627
405,8812
337,4725
377,8466
389,6264
–
–
37,63849
12,75194
358,9783
396,9803
–
40,23806
22,36057
384,9979
420,6342
366,0231
351,6399
392,6995
385,0161
–
39,48319
22,25818
382,5120
411,5354
399,3458
352,9798
344,0177
381,0205
397,2411
40,55397
24,43004
382,2939
394,3504
391,9834
393,6084
391,4555
–
–
43,55412
1,908973
393,6216
395,5031
391,6753
396,5382
396,2945
–
–
43,7618
2,298608
395,5639
415,7478
347,6704
385,7170
397,5199
–
–
40,62892
23,78335
382,2675
402,3558
–
41,72673
30,20543
391,4439
427,6942
372,7156
358,6127
397,3083
389,6327
–
40,90663
30,48473
391,3392
420,0643
407,5649
361,5199
351,0747
389,1078
401,1896
42,07591
32,14308
390,4893
397,3165
395,6517
396,8390
394,7697
–
–
45,14398
4,199496
396,3525
399,3529
395,4847
399,1879
399,4040
–
–
45,33562
5,056914
398,6145
420,6811
352,7694
390,6360
401,4667
–
–
42,12414
31,13762
393,9121
409,0753
–
43,71162
38,05029
400,0386
433,3422
378,0697
364,1909
403,0694
395,4035
–
42,33007
38,71128
397,9595
428,5931
415,7839
368,3519
359,8958
395,5776
406,1252
44,10517
39,85612
398,6848
400,2826
398,5864
400,0695
398,0839
–
–
46,73384
7,253527
399,0833
402,4327
399,2942
403,6042
403,2909
–
–
46,90944
8,734655
401,6651
426,8478
359,143
394,5712
406,4002
–
–
43,61935
45,84617
402,6456
419,8263
–
46,68895
66,81477
417,2281
444,6383
388,7778
375,3474
412,2870
404,6367
–
45,65142
68,87529
415,6138
442,2393
428,9344
382,0160
374,0097
408,5174
414,0222
47,14907
65,56625
413,0268
406,9562
403,7222
406,5307
403,8837
–
–
49,91356
17,17913
403,8623
409,3623
405,0083
411,5534
409,5099
–
–
50,05708
20,68731
407,0036
436,7144
369,3409
402,4416
414,2938
–
–
46,60978
89,97182
425,9348
184
C. Skrobisz
Najmniejsza wartość dla kwantyla 0,025 wynosi 329,90383 dla parametru teta_4 w modelu H62. Z kolei największa wartość dla tego kwantyla wynosi 409,33815 dla parametru
teta_1 w modelu H34. Dla kwantyla 0,5 największa wartość wynosi 420,63419; otrzymujemy ją również dla oszacowanego parametru teta_1 w modelu H34. Najmniejsza wartość
dla kwantyla 0,5 wynosi 344,01772; osiągamy ją dla parametru teta_4 również w modelu
H62. Dla kwantyla 0,950 największa wartość wynosi 444,63828; otrzymujemy ją dla parametru teta_1 w modelu H34. Wartość najmniejsza występuje także w modelu H43; otrzymujemy ją dla parametru teta_2. Rysunek 2 przedstawia brzegowy rozkład a posteriori parametru pierwszego, przy zero-jedynkowej zmiennej przedstawiającej dostawy gazu ziemnego dla modelu hierarchicznego H223.
Rys. 2. Brzegowy rozkład a posteriori parametru 1, przy zmiennej zero-jedynkowej modelu hierarchicznego H223
Na podstawie modeli, zawartych w tab. 1, zbudowane zostały prognozy na 12 miesięcy,
a następnie przeprowadzona została analiza ex post ich dokładności. Jako kryterium dokładności prognoz przyjęto średni ważony błąd prognozy. Tabela 4 przedstawia oceny tych
błędów.
Tabela 4. Kształtowanie się średnich błędów prognoz ekstrapolacyjnych
H26
Średnie względne błędy
prognoz modeli
Bayesowskich [%]
7,53
H43
5,53
4,74
H34
4,63
4,62
H62
5,26
4,72
H223
7,51
7,58
H232
7,41
7,47
H322
4,78
4,86
Model
Źródło: obliczenie własne oraz Zawadzki (2003).
Średnie względne błędy prognoz
modeli klasycznych [%]
7,51
Zastosowanie Bayesowskich modeli hierarchicznych...
185
Z informacji zawartych w tabeli 4 wynika, że oceny błędów prognoz ekstrapolacyjnych,
otrzymanych na podstawie predyktorów opartych na oszacowaniu Bayesowskich modeli
hierarchicznych, charakteryzują się dość znacznym zróżnicowaniem. Najwyższe oceny
średnich błędów prognoz dla wariantu 12 miesięcy otrzymano dla modelu H26. Najniższe
oceny otrzymano dla modelu H34 na 12-miesięczny okres prognozowania. Warto również
zauważyć, że dłuższy okres prognozowania w metodach Bayesowskich jest obarczony
mniejszym średnim błędem prognoz. Zwraca uwagę fakt, że minimalne oceny błędów modeli Bayesowskich są zbliżone do błędów klasycznych modeli. Błędy te są w trzech przypadkach niższe od ocen błędów prognoz otrzymanych na podstawie predyktorów klasycznych. Dotyczy to modeli trzyczynnikowych H223, H232,H322. Różnice te wahają się
od 0,06 punktu procentowego dla modelu H232 do 0,8 punktu procentowego dla modelu
H322. Natomiast w tych przypadkach, w których średnie błędy prognoz są większe, różnica
ta wynosi od 0,01 punktu procentowego dla modelu H34 do 0,79 punktu procentowego dla H43.
Na rysunku 3 przedstawiono kształtowanie się prognozy ekstrapolacyjnej zmiennej dla
modelu H26 na miesiąc prognozowania w 12-miesięcznym okresie prognozowania.
Rys. 3. Wykres brzegowego rozkładu predyktywnego zmiennej dostaw gazu ziemnego w pierwszym
okresie prognozowania o 12-miesięcznym okresie prognozowania
W zastosowaniach metod Monte Carlo, opartych na łańcuchach Markowa, zasadniczym
problemem jest ocena zbieżności z rozkładem stacjonarnym. W literaturze zazwyczaj podaje się warunki tej zbieżności, ale nie precyzując szybkości zbieżności z rozkładem stacjonarnym. Pojawia się pytanie: po jakiej liczbie cykli wstępnych – spalonych (ang. burnt-in
passus) należy dokonać już losowania z rozkładu stacjonarnego? Algorytmy MCMC teoretycznie są zbieżne, ale wymagają dużej liczby cykli spalonych (ich generowanie potrwać
może nawet kilka dni). Natomiast szybka zbieżność i praktyczna jej ocena są bardzo istotne w przypadku stosowania metod opartych na łańcuchach Markowa. Problem badania
szybkości zbieżności algorytmu Gibbsa z losowaniami z rozkładu a posteriori omawia
np. Geweke (1992). Proponuje on użycie do tego celu analizy spektralnej (widmowej).
186
C. Skrobisz
PIŚMIENNICTWO
Box G.E.P., Tiao G.C. 1992. Bayesian inference in statistical analysis. Wiley Classics Library,
Londyn.
Geweke J. 1989. Bayesian inference in econometric models using Monte Carlo integration.
Econometrica 57, 31.
Geweke J. 1992. Evaluating the accuracy of sampling-based approaches to the calculation
of posterior moments. Bayesian Statistics 4. Oxford University Press, Oxford.
Greń J. 1970. Prognozy w świetle teorii statystycznych funkcji decyzyjnych. Prz. Statyst. 319–332.
Osiewalski J. 1991. Bayesowska estymacja i predykcja dla jednorównaniowych modeli ekonometrycznych. Zeszt. Nauk. AE Krak. 100, 47–50.
Osiewalski J. 2001. Ekonometria Bayesowska w zastosowaniach. AE, Kraków.
Harley S.J., Myers A.M. 2001. Hierarchical Bayesian models of length-specific catchability
of research trawl surveys. Canad. J. Fish. Aquatic Sci. 58, 1569–1571.
Zawadzki J. 2003. Zastosowanie hierarchicznych modeli szeregów czasowych w prognozowaniu zmiennych ekonomicznych z wahaniami sezonowymi. AR, Szczecin.