Podstawy sejsmoakustycznej prognozy energii emitowanej z

Transkrypt

WARSZTATY z cyklu „Zagrożenia naturalne w górnictwie”
____________________________________________________________________________
Mat. Symp. str. 233 – 244
Jerzy KORNOWSKI
Główny Instytut Górnictwa, Katowice
Przykłady sejsmoakustycznej prognozy energii emitowanej
z eksploatowanego pokładu węgla
Streszczenie
Praca ta stanowi część drugą dwuczęściowego cyklu dotyczącego prognozy sejsmoakustycznej (cześć pierwszą stanowi artykuł: Kurzeja (2002), dalej oznaczany krótko jako „Cz. 1”)
i przedstawia wyniki obszernych badań, w których – korzystając z dużego zbioru jakościowo
dobrych obserwacji z ZG Piekary – porównano wyniki prognozowania (godzinowej logarytmicznej energii łącznej tzn. AE i wstrząsów) za pomocą różnych wariantów algorytmu
prognozy liniowej. Algorytm ten wybrano – wśród wielu możliwych ze względu na jego
prostotę i dobrze rozwinięte podstawy teoretyczne. Stwierdzono, że nie wszystkie warianty
metody są jednakowo dobre i że najlepsze z nich zapewniają – na badanym zbiorze obserwacji
– skuteczność prognozy zbliżoną do 54% co oznacza że wariancja błędu prognozy wynosi
około 46% wariancji obserwacji a wartość średnia błędu prognozy jest (na badanym zbiorze
obserwacji) bardzo bliska zeru.
1. Wprowadzenie i przegląd problemów prognozy
Prognoza zagrożenia sejsmicznego jest centralnym problemem sejsmoakustyki (AE) i sejsmologii górniczej. Przedmiotem prognozy może być albo czas, miejsce i energia przyszłego
wstrząsu (taka prognoza jest marzeniem użytkowników, jest jednak bardzo trudna i na razie
nieosiągalna), albo też zmienna w czasie i okresowo (co ΔT, np. co godzinę) liczona wartość
zagrożenia definiowana (np. Kornowski 2002; patrz także Cz. 1) jako prawdopodobieństwo,
że łączna energia emisji (AE i wstrząsów) w nadchodzącej jednostce czasu ΔT, zawarta
będzie w przedziale (E1, E2) energii dopuszczając E2 →∞. W praktyce celowe jest ustalenie,
dla wyrobiska w konkretnych warunkach, dolnej granicy E1 „niebezpiecznej energii wstrząsu”
(np. Konopko 1994; tabl. 18, także Dubiński i Konopko 2000, str. 79) i definiowanie zagrożenia jako prawdopodobieństwa, że E (t, t + ∆T) > E 1, wymagając równocześnie by okres ∆T
(obserwacji /interpretacji/prognozy) był znacznie krótszy od średniego czasu między niebezpiecznymi wstrząsami. Ponieważ energia łączna większa jest od energii samych wstrząsów
a energia AE w ciągu ∆T rzadko sięga wartości „niebezpiecznych” (np. 10 4 J), możliwe jest
ustalenie („alarmowego”) progu E1 na użytecznym i bezpiecznym poziomie.
Prognoza – nie tylko w geofizyce – jest możliwa gdy dysponujemy zbiorem informacyjnym It danych/obserwacji związanych z przyszłymi wartościami prognozowanej wielkości
Zt+τ (np. zagrożenia) oraz algorytmem/metodą/teorią (F) umożliwiającą wnioskowanie
o Zt+τ na podstawie It. Gdy teoria ta ma postać matematyczną, nazywamy ją modelem
prognozy (także modelem lub filtrem predykcyjnym).
Wartość zmiennej x, wyprognozowaną algorytmem F na podstawie zbioru informacyjnego
____________________________________________________________________________
233
J. KORNOWSKI – Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego...
____________________________________________________________________________
It oznaczamy ~
xt – rozumiejąc przez to, że ~
xt (t, t+∆T) = F(It).
x (It, F) – lub krócej ~
Fundamentem prognozy jest empirycznie i logicznie uzasadnione przekonanie, że im
lepszy zbiór It i model F, tym bliżej teoretycznego optimum będą wyniki prognozy.
Zastrzeżenie, iż wyniki prognozy zbliżać się mogą tylko do pewnego optimum, a nie do
(bardzo pożądanej lecz zwykle nieosiągalnej) wartości prawdziwej (czyli przyszłej obserwacji)
jest bardzo ważne, bo np. w przypadku szumu białego N (0, s 2) żaden, nawet idealny zbiór
It i model F nie dadzą prognoz o wariancji mniejszej od s 2 (która może przecież być bardzo
duża i odległa od oczekiwań/potrzeb praktyki!). Cała teoria i praktyka prognozy sprowadzają się do poszukiwania jak najlepszego modelu F oraz zbioru I t.
By najważniejsze problemy i warunki racjonalnej prognozy postawić jasno i potem do nich
nie wracać, stwierdzić trzeba że:
– zajmujemy się tu prognozą, której zbiór informacyjny It składa się z minionych wartości
log-energii łącznej Et = log(Ewstrz + EAE + 1)t, obserwowanych w kolejnych przedziałach czasu ∆T [Et jest skrótem symbolu E(t, t+∆T)]. Taką prognozę nazywamy sejsmoakustyczną prognozą zagrożenia sejsmciznego (SPZS); inna zawartość It może być
przyczyną innej nazwy metody/prognozy. Zauważmy, że zbiór It z którego korzysta
SPZS, jest bardzo „ubogi” i nie zawiera żadnych informacji geologicznych czy górniczych.
Zagadnienie rozszerzenia bazy informacyjnej należy do podstawowych problemów
prognozy zagrożenia sejsmicznego,
– w zagadnieniu SPZS nie występuje problem czasu (prognoza jest formułowana co ∆T
i dotyczy nadchodzącego ∆T) ani miejsca (prognoza dotyczy ściany objętej obserwacją AE).
A oto niektóre warunki konieczne SPZS:
a) Konieczna jest lokalizacja wstrząsów tak, by zbiór It nie został zaśmiecony wprowadzającymi w błąd zdarzeniami obcymi.
b) Energie AE i wstrząsów muszą być addytywne (liczyć trzeba fizyczną, wyrażoną
w dżulach J, energię AE, odrzucając tzw. „energię umowną”).
c) Ewstrz i EAE zaobserwowane w minionym przedziale ∆T muszą być równocześnie, co ∆T,
dostępne programowi który liczy Et (zatem tworzy zbiór It) i prognozuje.
d) Et (zatem Ewstrz oraz EAE) muszą być liczone z dokładnością zapewniającą użyteczność wyników. Dokładność prognoz energii nie będzie lepsza od dokładności
obserwacji/estymacji energii (zdarzeń minionych) a grube błędy w It wywołają jeszcze
większe błędy prognozy.
e) Im krótsze są okresy ∆T obserwacji i prognozy, tym większe są szanse zaobserwowania emisji poprzedzającej nagłą zmianę zagrożenia (być może wstrząs). Częstość
obserwacji/interpretacji/prognozy winna zależeć od stanu zagrożenia. Okresy
zmianowe (∆T = 8 godzin) są reliktem epoki przedkomputerowej i powinny być radykalnie skrócone.
f) Istnieć musi co najmniej pośredni związek między obserwowanymi (i wchodzącymi do I t)
parametrami emisji AE a wstrząsami które decydują o zagrożeniu; związek ten Kornowski
(2002) nazwał „postulatem jedności emisji” uznając, że wspólną przyczyną AE i wstrząsów (o nieodległych źródłach) jest pole naprężeń (modyfikowane eksploatacją i niejednorodnościami). Postulat ten (w teorii) dopuszcza wnioskowanie o zagrożeniu {tzn. Z = F(I t)}
w obszarze S tylko na podstawie zdarzeń z S i mających wspólną z zagrożeniem
przyczynę. Oznacza to m.in. konieczność eliminowania hałasów i zakłóceń oraz
konieczność teoretycznie poprawnego traktowania emisji związanej ze skrawaniem
(zagadnienie to opisują tzw. sejsmoakustyczne równania stanu skrawanej ściany
(Kornowski 2002) – lecz wykracza to poza zakres niniejszej pracy).
____________________________________________________________________________
234
____________________________________________________________________________
Określić jeszcze należy formę wyników prognozy i miarę jakości. W każdej chwili
t, przyszła wartość energii łącznej E(t, t+∆t) jest wielkością nieznaną, która traktowana być
musi jako zmienna losowa opisana swym (ewoluującym) rozkładem prawdopodobieństwa
(jeśli E(t, t-∆t) została już zaobserwowana, to jest wielkością znaną i deterministyczną: proces
(z założenia: dokładnej) obserwacji przekształca wielkość nieznaną w znaną, a losową w deterministyczną). Kornowski (2002) sugeruje, że błąd optymalnej prognozy Et łącznej log-energii
może być dobrze aproksymowany jako N(0, s2):
~
– Zatem z każdą jednostką czasu ∆T, prognozować należy wartość E t i jej wariancję s2, a dla
użytkownika najwygodniejsze jest korzystanie z α % przedziału ufności i prawdopodobieństwa przekroczenia wartości niebezpiecznej, E1 (prawdopodobieństwo to
nazywamy zagrożeniem!). Prognoza w chwili t winna zatem mieć postać zdania: „z praw~
dopodobieństwem 90%, E α < E (t, t+∆T) < Eβ, a prawdopodobieństwo że E(t, t+∆t) > E 1
wynosi Z" (przy czym Eα, Eβ, Z to konkretne, liczone co ∆T wartości, E1 ustala Dział Tąpań
kopalni dla danego wyrobiska (np. korzystając z Tab. 5.4, Dubiński i Konopko 2000),
a wartość 90% jest tylko przykładem (może być 95%)). Dział Tąpań kopalni winien wiedzieć jak informację tę w praktyce wykorzystać, a przepisy/instrukcje winny to ułatwiać.
– Ponieważ wartość średnia błędów optymalnej prognozy jest zerem, dobrą miarą jakości
prognozy jest iloraz:
2
VARNOR = Sb2 /Sobs
(1.1)
gdzie:
Sb2 – to wariancja błędu prognozy
2
– to wariancja obserwacji.
S obs
W terminologii regresji liniowej, VARNOR = 1 – R2 gdzie R2 to współczynnik
determinacji. Jest to ocena statystyczna, wymagająca wielu prób/prognoz i wykluczająca
osądzanie wyników (także modelu i zbioru It) na podstawie pojedynczych (lub nielicznych) przypadków.
Wśród dostępnych nam wyników obserwacji z kopalń, dane ze ściany 331/510 Zakładu
Górniczego Piekary najbliższe były spełnienia warunków SPZS, toteż te właśnie obserwacje
wykorzystano. Oznacza to jednak, że zakres ważności przedstawianych wyników ograniczony
jest do warunków słabego lub co najwyżej średniego zagrożenia tąpaniami.
Przedmiotem tej pracy są wyniki badań porównawczych zdolności predykcyjnej
(mierzonej wartością VARNOR) i użyteczności praktycznej (uwzględniającej też
prostotę/złożoność metody) szeregu wariantów znanej metody prognozy liniowe za
pomocą przybliżonych filtrów Wienera.
Algorytmy opisane były (m.in.) w Cz. 1, tu podane są wyniki prognozy i niektóre
informacje szczegółowe.
2. Wyniki prognozy liniowej
2.1. Opis zadania i przykładowe wyniki
Prognozą liniową nazywamy obliczanie, w każdej dyskretnej chwili t (t = i·∆T, i = 1, 2,...)
wartości:
xt+1 = a1xt + a2xt-1 + ... + aLxt-L+1
(2.1)
____________________________________________________________________________
235
____________________________________________________________________________
gdzie:
a – wektor parametrów (a1,...,aL) nazywamy (liniowym) predyktorem (także filtrem predykcyjnym) rzędu L.
Na przykład xt mogą to być wartości log-energii łącznej w kolejnych jednostkach ∆T (np.
w kolejnych godzinach) – i wówczas równanie (2.1) realizuje sejsmoakustyczną prognozę
zagrożenia sejsmicznego (SPZS) wykorzystując zbiór I t = (x1,..., xt) i model (2.1). Prognozę
liniową nazywamy optymalną gdy wartości (a1,...,aL oraz L) dobrane są w sposób gwarantujący
minimalizację średniokwadratowego błędu prognozy a w praktyce – ponieważ właściwie
dobrany filtr (2.1) jest tak zwanym estymatorem nieobciążonym czyli gwarantującym że średni
błąd prognozy jest zerem – gdy zapewniona jest minimalizacja wariancji (VARNOR) błędu
prognozy. Istnieje obszerna literatura dotycząca optymalizacji parametrów filtru predykcyjnego (Robinson i Treitel 1980; Box i Jenkins 1970; Burg 1975), zagadnienie to opisano także
w Cz. 1, tutaj więc przypomnieć wystarczy że warunkiem użyteczności metody (prognozy
liniowej) jest występowanie (dla przesunięcia τ > 0) istotnie różnej od zera autokorelacji
r(τ) w szeregu czasowym (xt) obserwowanych i prognozowanych wielkości. Brak istotnej
autokorelacji wyklucza użyteczność prognozy liniowej. Zagadnienie autokorelacji w szeregach
czasowych emitowanej energii (AE, wstrząsów i łącznej) dyskutowane było i ilustrowane
przykładami w pracach Kornowskiego i Kurzeji (2000), Kornowskiego (2002), a także w Cz. 1
gdzie stwierdzono, że autokorelacja taka występuje w stopniu uzasadniającym stosowanie
prognozy liniowej. Zauważyć też trzeba że (przed przystąpieniem do prognozy) niewiadomymi
są zarówno parametry filtru predykcyjnego (a1,...,aL) jaki jego rząd L, i wyznaczyć trzeba
zarówno L jak i parametry; ponadto nowoczesne algorytmy estymujące optymalne wartości
parametrów filtru, obliczają też (zakładając stacjonarność procesu – np. emisji energii łącznej)
przybliżoną wariancję błędu prognozy. Ponieważ błąd prognozy logarytmicznej energii łącznie
ma rozkład w przybliżeniu normalny (z wartością średnią 0), znajomość wariancji wystarcza
do określenia przedziałów ufności.
Przykład prognozy – dla 9 tygodni obserwacji energii łącznej z ść 331/510 ZG Piekary i jej
wyników pokazano na rysunku 2.1. i 2.2. Na rysunku 2.1. widzimy trzy pary wykresów –
a każda para dotyczy trzytygodniowego okresu obserwacji i składa się z:
– wykresu górnego, przedstawiającego (przebieg środkowy) obserwowane wartości godzinowej log-energii łącznej wewnątrz (wykresy powyżej i poniżej) 90% przedziału ufności
dla prognozy,
– wykresu dolnego przedstawiającego błędy prognozy.
Można zauważyć, że energia obserwowana czasami – lecz niezbyt często – wykracza poza
granice 90% przedziału ufności – co jest zrozumiałe (można, oczywiście, wyznaczyć przedziały bardziej „pewne”, np. 95% lub 99%, lecz nie wydaje się to celowe).
Na rysunku 2.2. pokazano – z lewej dla obserwowanych wartości log-energii łącznej,
z prawej dla błędów prognozy – od góry: autokorelację, histogram częstości występowania
(czyli przybliżony rozkład gęstości prawdopodobieństwa) danej wartości oraz widmo szeregu
czasowego (obserwowanej godzinowej log-energii lub błędu prognozy tej energii).
Zauważyć należy, że w autokorelacji obserwacji bardzo wyraźna jest składowa okresowa
o okresie 168 godzin (1 tydzień), wymuszona rytmem produkcji, a w widmie widoczne są też
składowe o okresie T = 12 i T = 24 godziny; ponadto histogram obserwacji jest zdecydowanie
odległy od (zaznaczonego na jego tle) rozkładu normalnego o tej samej średniej i wariancji.
Pokazana z prawej strony rysunku 2.2. autokorelacja błędów predykcji nie różni się w sposób
istotny od szumu białego [r(τ) < 1,96/ 1513 nie jest więc istotna], choć w widmie znaleźć
można jeszcze oznaki składowych 12 i 24-godzinnych. Histogram błędów predykcji znacznie
____________________________________________________________________________
236
____________________________________________________________________________
bardziej „przypomina” rozkład normalny (choć w sensie ścisłym nie jest nim) o wartości
średniej 0,06 (a więc bliskiej zera) i wariancji σ2 = 0,19.
2.2. Prognoza modelem autoregresji rzędu L ≤ 50
Metoda prognozy liniowej dostosowana jest do przetwarzania wsadowego i dla ustalonego
zbioru (xk, xk+1,..., xk+N-1) obserwacji o liczebności N, określa parametry (Lopt; ai, i=1,..., Lopt; s2)
filtru predykcyjnego. Ponieważ jednak poszukiwanie optymalnego rzędu (optymalnej długości)
filtru, Lopt, odbywa się porównując jakość coraz to dłuższych filtrów (L = 1, 2,..., L max), zadana
musi zostać pewna wartość maksymalna, Lmax, by program nie liczył w nieskończoność. Od
wyboru tej wartości (Lmax) również zależeć może ostateczna jakość prognozy. Ponieważ
w przypadku obserwacji godzinowych dane napływają sekwencyjnie (co godzinę), oprócz
wartości Lmax określić trzeba szerokość (N) okna czasowego – na którym, dla zadanej wartości
Lmax, algorytm estymuje (Lopt; ai, i=1,...Lopt; s2) – a także określić trzeba krok (KROK) tego
okna, gdyż (choć prognoza robiona jest co godzinę) filtr obliczać można (np.) co godzinę, albo
co dobę, albo co tydzień, albo w ogóle tylko raz (na początku, gdy uruchamiany jest algorytm).
Ponadto, przed każdym obliczeniem filtru (Lopt, ai, s2) ze zbioru (xk, xk+1,..., xk+N-1) można
usuwać wartość średnią x (k, k+N) lub można jej nie usuwać. Istnieje więc ogromna liczba
możliwych przypadków i wariantów, a próba wyboru optymalnego sposobu prognozy (tylko
metodą prognozy liniowej i tylko na jednym, 9-tygodniowym zbiorze obserwacji z ść 331/510
ZG Piekary) wymaga bardzo obszernego eksperymentu numerycznego. Wyniki tego
eksperymentu, zawsze określone wartością VARNOR, znormalizowanego „błędu prognozy”,
przedstawiono w tabeli 2.1.
5 logE/h
4
3
2
1
0
0
48
2 logE/h
0
-2
0
48
5 logE/h
4
3
2
1
0
504
552
2 logE/h
0
-2
504
552
5 logE/h
4
3
2
1
0
1008 1056
2 logE/h
0
-2
1008 1056
t[h]
96
144
192
240
288
336
384
432
480
96
144
192
240
288
336
384
432
480
600
648
696
744
792
840
888
936
984
600
648
696
744
792
840
888
936
984
1104
1152
1200
1248
1296
1344
1392
1440
1488
1104
1152
1200
1248
1296
1344
1392
1440
1488
t[h]
t[h]
t[h]
t[h]
t[h]
Rys. 2.1. Wyniki prognozy dziewięciotygodniowej (1512 godz.) obserwacji godzinowej logarytmicznej
energii łącznej (AE + wstrząsów) ze ść 331/510 ZG Piekary (zagrożenie słabe do średniego). W wierszach 1, 3, 5 energia obserwowana wraz z 90% przedziałem ufności dla prognozy (zauważ sporadyczne wykroczenia obserwacji poza granice 90% przedziału ufności). W wierszach 2, 4, 6 błędy
prognozy godzinowej log-energii łącznej. Obserwacje rozpoczęto w poniedziałek, godz. 6°°
Fig. 2.1. Results of nine-weeks prediction of AE and mining tremors energy
____________________________________________________________________________
237
____________________________________________________________________________
g(x)
g(x)
100
150
x = 2,29
2 =0,42
50
x = 0,06
2 =0,19
100
50
0
x = logE/h
0
1
2
3
4
r()
1
0.5
0.5
0
0
0
2
0
(h)
0
100
200
300
400
-0.5
(h)
0
100
200
300
400
dB
dB
0
-20
-20
-40
-60
-2
r()
1
-0.5
x = logE/h
0
-40
48 24
12
6
T[h]
T(h)
T[h]
-60
T[h]
T(h)
48 24
12
6
Rys. 2.2. Statystyczne charakterystyki obserwacji (z lewej) i błędów prognozy (z prawej) pokazanych
na rysunku 2.1. Od góry: histogram danych na tle rozkładu normalnego o tej samej średniej i wariancji
(zauważ wartości x oraz σ2), w środku: funkcja autokorelacji obliczona na podstawie 1512 wartości
danych (w r(τ) obserwacji zauważ składową okresową o okresie tygodniowym), u dołu: widmo szeregu
czasowego godzinowych obserwacji błędów prognozy
Fig. 2.2. The statistic characteristics of observation and prediction errors showed on Fig. 2.1.
Użyty do estymacji parametrów ai algorytm pochodził z pracy Kalouptsidisa i innych (1985)
i został zmodyfikowany przez autora między innymi poprzez wprowadzenie kryterium FPE
(patrz Cz. 1) do wyznaczania optymalnej długości filtru Lopt. W tabeli 2.1. uwzględniono tylko
skrajne wartości (1 oraz ∞) parametru KROK, i dla KROK = 1 parametry (Lopt, ai, i=1,... Lopt)
estymowano co godzinę, a dla KROK = ∞ parametry te estymowano tylko raz, na początku
przetwarzania ciągu obserwacji. Dla innych wartości tego parametru (KROK) otrzymuje się
wyniki pośrednie, zrezygnowano więc z ich przedstawiania. Szerokość okna, N, określono
w godzinach (168 godzin to 1 tydzień). Symbol xt oznacza estymację parametrów bez
usuwania wartości średniej ze zbioru obserwacji, symbol xt- x oznacza, że ze zbioru (xK,...,
xK+N-1) przed estymacją filtra (Lopt, ai, s2) usunięto średnią:
x (k, N) = N-1(xk + xK+1 +...+ xK+N-1)
(2.2)
Wartość VARMOR = 0,47 oznacza że prognoza „usuwa” 53% wariancji z ciągu obserwacji,
VARNOR = 0 oznacza prognozę idealnie dokładną a VARNOR = 1 oznacza, że prognozowano wartość średnią ciągu obserwacji.
Pamiętając, że wyniki uzyskano na zbiorze 1513 obserwacji godzinowych z ZG Piekary –
są to więc wyniki wiarygodne w warunkach umiarkowanego stanu zagrożenia tąpaniami,
zawarte w tabeli 2.1. wyniki podsumować można następującymi wnioskami:
W1. Zastosowana metoda i wykorzystany zbiór obserwacji, w obszarze dopuszczonych długości filtru, umożliwiają prognozę ze „średnią” jakością. Błędy prognozy mają wartość
____________________________________________________________________________
238
____________________________________________________________________________
średnią (nie ilustrowaną w tabeli 2.1., lecz widoczną na histogramie, rysunek 2.2.
z prawej) w przybliżeniu równą zero i wariancję, w najlepszym przypadku, wynoszącą
około 47% wariancji ciągu obserwacji.
W2. Usuwanie średniej poprawia jakość prognoz systematycznie lecz bardzo nieznacznie
(VARNOR maleje nie więcej jak o 1%).
Tabela 2.1.
Wartości VARNOR∙1000 znormalizowanej wariancji błędu prognozy liniowej w zależności od
szerokości okna (N) i dopuszczalnej długości Lmax filtru, dla parametrów KROK = 1 i KROK → ∞ oraz
dla przypadków usuwania i nie usuwania średniej x ze zbioru przed estymacją parametrów filtru. Wyniki
uzyskano dla 1513 godzinowych obserwacji (9 tygodni) log-energii łącznej ze ść 331/510 ZG Piekary
Table 2.1.
Values VARNOR 1000 of normalised variance of linear prediction error
Lmax
N [godz.]
x
3
4
5
10
15
20
KROK
(50,
N/10)
336
504
672
840
1
∞
1
∞
1
∞
1
∞
1
∞
xt
493
495
484
487
484
482
482
480
480
480
xt - x
491
493
480
480
476
474
474
474
469
474
493
495
480
484
482
478
478
476
476
476
xt – x
493
493
478
480
476
472
472
469
467
469
xt
493
495
482
484
482
478
478
476
476
473
xt – x
493
493
478
480
476
472
469
469
469
469
xt
497
526
489
502
487
487
478
493
476
493
xt – x
497
526
487
500
480
482
469
487
467
489
xt
502
551
491
515
487
495
480
504
480
506
xt – x
502
551
487
513
480
491
474
500
469
500
xt
500
551
491
515
491
495
482
504
480
506
500
551
487
513
482
491
474
500
469
500
515
610
495
515
487
495
484
504
480
506
513
610
41
513
478
491
474
500
472
500
xt
xt –
min
168
x
xt
xt –
x
Uwaga: podane wartości należy podzielić przez 1000
W3. Wzrost długości okna (N) poprawia jakość prognozy, lecz niezbyt systematycznie
i w niewielkim stopniu (wzrost wartości N od 168 do 840 powoduje spadek VARNOR
o 2 ÷ 4%). Sugeruje to stacjonarność procesu emisji.
____________________________________________________________________________
239
____________________________________________________________________________
W4. Wpływ kroku okna (KROK) niewielki i niesystematyczny dla filtrów krótkich, staje się
wyraźny dla Lmax ≥ 10, gdzie widać, że jakość prognozy pogarsza się ze wzrostem długości
kroku, co jest nieuniknione w przypadku lokalnych nie stacjonarności emisji. W praktyce
kopalnianej, krok o umiarkowanej długości – np. tygodniowy, tzn. KROK = 168, co oznacza
aktualizację parametrów raz w tygodniu – powinien okazać się rozwiązaniem racjonalnym.
W5. Filtry krótkie, np. ograniczone wartością Lmax = 5, zapewniają prognozę lepszą od filtrów
długich. Wynik ten jest bardzo ważny, gdyż decyduje o prostocie i efektywności obliczeń
(wynik ten, choć z pozoru zaskakujący bo filtry krótkie są podzbiorem filtrów długich –
jest znany w teorii prognozy liniowej), równocześnie ograniczając obszar dalszych badań.
2.3. Prognoza modelem jednoparametrowym uwzględniającym okresowość
Ewidentna obecność (w obserwowanych wartościach łącznej godzinowej log-energii, patrz
rys. 2.2.) składowej okresowej o okresie tygodniowym – bez wątpienia wymuszona procesem
produkcji – skłoniła autora (we współpracy z Autorką Cz. 1) do próby wykorzystania modelu:
x(t) = αx(t – 1) + (1 – α) x (t – 168)
(2.3)
gdzie:
0 ≤ α ≤ 1.
W modelu tym występuje tylko jeden parametr (α) – którego optymalną (minimalizującą
błąd dopasowania w oknie czasowym o szerokości N) wartość znajduje się przy pomocy
algorytmu tzw. złotego podziału. Zwracam jednak uwagę, że podane dalej wartości VARNOR
określają znormalizowaną wariancję błędu predykcji, a nie dopasowania. Dla α = 1 otrzymuje
się model:
x(t) = x( t – 1)
(2.4a)
Optymalny dla procesu przyrostów niezależnych (zwanego też ruchem Browna lub procesem
błądzenia przypadkowego – ang.: random walk). Model ten sugeruje, że „jak było w minionej
godzinie, tak będzie w następnej” i jest bardzo popularny w wielu zastosowaniach, także
w sejsmoakustyce, gdzie obowiązująca Instrukcja (implicite) utożsamia prognozę (na okres
t+1) z oceną zagrożenia (w okresie t). W przypadku α = 0 otrzymuje się model optymalny dla
procesu okresowego o okresie tygodniowym, zaburzonego białym szumem:
x(t) = x(t – 168)
(2.4b)
Postać autokorelacji obserwacji (rys. 2.2.) sugeruje, że i ten model powinien być brany pod
uwagę. Postać ogólna modelu jednoparametrowego (2.3) dopuszcza – jak się wydaje – dowolną
mieszaninę tych procesów – uznano więc, że stanowić może model warty zbadania. Jak
poprzednio, możliwa jest wielka liczba wariantów algorytmu prognozy ze względu na długość
okna czasowego (N) i jego krok (KROK).
{badano także dodatkowo celowość zastąpienia członu x(t – 168) w równaniach (2.3) i (2.4b),
członem K-1[x(t – 1 · 168) + x (t – 2 · 168) + ... + x (t – K · 168)] dla różnych wartości K ≠ 1
nie otrzymując jednak wyników lepszych od otrzymanych dla K = 1, stąd ograniczamy się do
K = 1}.
Otrzymane wyniki przedstawiono w tabeli 2.2., określającej znormalizowany błąd
prognozy VARNOR dla optymalnych wartości parametru α zależnie od wartości parametrów
N oraz KROK.
____________________________________________________________________________
240
____________________________________________________________________________
Tabela 2.2.
Wartości VARNOR·1000, znormalizowanej wariancji błędu prognozy optymalnym filtrem
jednoparametrowym (4) w zależności od szerokości okna (N) i od kroku okna (KROK)
Table 2.2.
Values VARNOR 1000 of normalised variance of prediction error of one-parameter filter
KROK
1
24
168
∞
168
522
522
523
517
336
524
525
527
531
504
524
526
530
543
672
526
527
530
544
840
528
529
532
547
N
Uwaga: podane wartości należy podzielić przez 1000.
Badano ponadto wartości VARNOR dla α = 1 (czyli zakładając „błądzenie przypadkowe”)
oraz dla α = 0 (czyli zakładając proces okresowy na tle białego szumu) w obu przypadkach
otrzymując systematycznie wartości znacznie większe od pokazanych w tabeli 2.1. (dla α = 1
typowo VARNOR ≈ 0,59, dla α = 0 typowo VARNOR > 1), co upoważnia do ważnego
wniosku:
W6. Proces (szereg czasowy) utworzony z godzinowych wartości łącznej log-energii
(obserwowanej w ścianie 331/510 ZG Piekary) nie może być aproksymowany ani
modelem przyrostów niezależnych (który zwany jest też ruchem Browna lub błądzeniem
przypadkowym) ani, tym bardziej, modelem procesu okresowego na tle szumu białego.
Ponadto, porównanie wartości VARNOR w tabela 2.1. i w tabeli 2.2. upoważnia do wniosku.
W7. Prognoza modelem jednoparametrowym (4) uwzględniającym okresowość daje wyniki
w sposób istotny gorsze od wyników standardowej prognozy liniowej.
Zauważmy na koniec, że model (4) może być traktowany jako szczególny przypadek
predyktora liniowego, krótkiego lecz bardzo wysokiego rzędu (L = 168) z narzuconymi bardzo
silnymi ograniczeniami (ai = 0, i = 2, 3,..., 167; a1 = 1 – a168).
2.4. Jeszcze trzy modele liniowe
Celem pełniejszego wyjaśnienia i zrozumienia możliwości prognozy krótkimi optymalnymi
filtrami predykcyjnymi, pojęto badanie filtrów:
1
M1 :
2
M2 :
x(t) = a1x (t-1)
x(t) = b1x (t-1) + b2x (t-2)
3
M 168 : x(t) = q1x (t-1) + q2x (t-2) + q3x (t-168)
(2.5a)
(2.5b)
(2.5c)
na tym samym zbiorze danych z ZG Piekary.
Wyniki prognozy podano poniżej w tabeli 2.3. i 2.4.
____________________________________________________________________________
241
____________________________________________________________________________
Ponieważ optymalne wartości parametrów filtrów znajduje się rozwiązując tzw. równania
normalne prognozy (patrz Cz. 1) zwykle wykorzystując przy tym wartości autokorelacji, r(τ),
zbioru obserwacji, powstaje dodatkowo cały szereg możliwości obliczeniowych (wariantów
metody) można bowiem autokorelację liczyć usuwając uprzednio wartość średnią ze zbioru
obserwacji lub jej nie usuwając, ponadto w każdym przypadku stosować można tzw. obciążony:
N τ
ro(τ) = N-1  x(t)x(t  τ)
(2.6a)
τ 0
lub nieobciążony:
N τ
rn(τ) = (N-τ)-1  x(t)x(t  τ)
(2.6b)
τ 0
estymator autokorelacji. Wyniki podane w tabeli 2.3. dotyczą wyłącznie przypadku prognozy
wykorzystującej (do obliczenia optymalnych parametrów filtru a 1 lub b1 i b2) obciążony
estymator ro(τ) obliczany po usunięciu wartości średniej ze zbioru (dotychczasowych)
obserwacji. Przyczyna tego wyjaśniona będzie poniżej.
Tabela 2.3.
Wartość VARNOR·1000 oraz wartości średnie ε błędu predykcji dla 1513 godzinowych obserwacji logenergii łącznej w przypadku prognozy optymalnym filtrem pierwszego (M 1) i drugiego (M2) rzędu
Table 2.3.
Values VARNOR 1000 and average prediction error for 1513 hours observation log-energy
KROK
M
N
336
VARNOR
ε
504
VARNOR
ε
672
VARNOR
ε
840
VARNOR
ε
1
24
∞
168
M1
M2
M1
M2
M1
M2
M1
M2
513
469
516
469
518
470
507
463
0,02
0,02
0,03
0,02
0,04
0,03
0,22
0,16
511
467
512
467
513
467
507
463
0,03
0,02
0,03
0,02
0,04
0,03
0,19
0,14
513
468
514
467
515
467
505
463
0,04
0,03
0,04
0,03
0,05
0,04
0,17
0,13
511
467
514
467
514
467
515
463
0,05
0,03
0,05
0,03
0,06
0,04
0,16
0,13
Uwaga: wartości VARNOR podzielić należy przez 1000
Z tabeli 2.1. wynikają kolejne, istotne wnioski:
W8: Model M 11 umożliwia usunięcie około 49% wariancji a model M 22 około 53% wariancji
ze zbioru obserwacji. Nawet najlepsze z wyników podanych w tabeli 2.1. nie są istotnie
lepsze od uzyskanych modelem M2.
W9: Średni błąd kwadratowy jest sumą wariancji i kwadratu błędu średniego. Uwzględnienie
kwadratu błędu średniego (który jest bliski zera zawsze prócz przypadku KROK = ∞)
wyjaśnia pozornie bardzo dobre działanie filtrów, które są raz tylko (na początku procesu
prognozy) estymowane a potem stosowane bez zmiany: w rzeczywistości filtry te nie
gwarantują zerowej średniej wartości błędu predykcji i parametr VARNOR nie jest dla
____________________________________________________________________________
242
____________________________________________________________________________
nich właściwą miarą jakości (lepszą miarą jest średni błąd kwadratowy).
3
Ostatnia seria obliczeń związana była z optymalizacją i zastosowaniem filtru M 168
określonego równaniem (6c). Jest to filtr wprawdzie krótki (trzyelementowy) lecz tak
wysokiego rzędu (L = 168) że stosowanie standardowych metod estymacji uznano za
niecelowe. Równocześnie filtr ten umożliwia uwzględnienie składowej okresowej o okresie
tygodniowym, a porównanie uzyskanych wyników z wynikami uzyskanymi przy użyciu
M 22 umożliwia ocenę informacji zawartej w składowej okresowej. Wyniki przedstawione
w tabeli 2.4. dotyczą tylko przypadku wykorzystania obciążonego estymatora autokorelacji
(7a ). Wyniki uzyskane stosując estymator nieobciążony były systematycznie gorsze – ich
przedstawianie uznano więc za niecelowe.
Analiza tabeli 2.4. i porównanie z tabeli 2.3. skłania do następujących wniosków.
3
W10: M 168
umożliwia w najlepszym przypadku (N = 504, KROK = 168) prognozę z błędem
VARNOR ≈ 0,460 (  = 0,03, VARNOR +  2 ≈ 0,461) o około 1,5% mniejszym niż za pomocą
filtru M 22 . Jest to zaskakująco mała poprawa jakości prognozy, być może warta głębszej analizy.
W11: Jak poprzednio, usuwanie średniej (ze zbioru obserwacji) i wykorzystanie
obciążonego estymatora autokorelacji poprawia wyniki w stopniu niewielkim lecz
systematycznie, winno więc być zawsze stosowane. Prognoza filtrem którego współczynniki
są tylko raz liczone, prowadzi do wyników gorszych od uzyskanych filtrem okresowo
aktualizowanym. Wyniki podane w tabeli 2.4. sugerują też, że racjonalne jest aktualizowanie
filtru raz w tygodniu i stosowanie okna N = 504.
Tabela 2.4.
Wartości VARNOR (wariancji znormalizowanej błędu prognozy) oraz średniego błędu  prognozy
3
filtrem M 168
dla różnych wartości kroku (krok) okna i szerokości (N) okna, gdy z obserwacji usuwano
(x – x ) wartość średnią i gdy jej nie usuwano (xt)
Table 2.4.
3
Values VARNOR and average prediction error of M 168
filter
KROK
N
1
24
∞
168
xt
x- x
xt
x- x
xt
x- x
xt
x- x
336
VARNOR
ε
492
464
495
465
493
464
484
453
0.01
0.02
0.01
0.02
0.01
0.03
0.01
0.12
504
VARNOR
ε
489
461
491
461
489
460
481
453
0.01
0.02
0.01
0.02
0.01
0.03
0.01
0.10
672
VARNOR
ε
486
461
488
461
486
461
477
456
0.01
0.03
0.01
0.03
0.01
0.04
0.01
0.09
840
VARNOR
484
460
485
461
484
460
476
459
0.01
0.03
0.01
0.03
0.01
0.04
0.01
0.09
ε
Uwaga: wartości VARNOR należy podzielić przez 1000
3. Wnioski
1.
Na obszernym zbiorze obserwacji z ZG Piekary wykazano, że możliwa jest prognoza
liniowa godzinowych wartości logarytmicznej energii łącznej (AE i wstrząsów) ze
____________________________________________________________________________
243
____________________________________________________________________________
2.
3.
4.
5.
sprawnością (czyli jakością, mierzoną parametrem VARNOR = 1-R2 określającym
redukcję wariancji wskutek prognozy) lepszą od 50%. Wartość liczbowa VARNOR zależy
od zbioru obserwacji może więc być traktowana tylko jako przykład.
Optymalną prognozę liniową umożliwiają filtry bardzo krótkie, 2 – 5 elementowe, zatem
łatwe do obliczenia i stosowania.
Uzyskane wyniki wskazują, że estymację parametrów filtru predykcyjnego można i warto
powtarzać raz w tygodniu (a potem przez tydzień stosować obliczone wartości
parametrów): zapewnia to wystarczającą adaptacyjność (zdolność dostosowania się do
zmiennych warunków) metody.
Jeżeli do estymacji filtru wykorzystywana jest autokorelacja, stosować należy estymator
obciążony, ro(τ), zawsze najpierw usuwając wartość średnią.
Cała procedura estymacji filtru predykcyjnego i prognozy tym filtrem jest tak prosta
że – jeśli obsługa Stacji Geofizycznej zapewni dopływ (do komputera PC)
godzinowych wartości fizycznej (wyrażonej w dżulach, J) energii AE i wstrząsów –
może działać całkowicie automatycznie, nie kolidując z obowiązującymi metodami
(sejsmoakustyczną i sejsmologiczna) i dostarczając dodatkową informację o zagrożeniu – która łatwo może być ilościowo sprawdzona.
Literatura
[1] Box G. E. P., Jenkins G. M. 1970: Time Series Analysis Forecasting and Control. San Francisco,
Holden-Day.
[2] Burg J. P. 1975: Maximum Entropy Spectral Analysis. Ph. D. Dissertation, Stanford Univ.
[3] Dubiński J., Konopko W. 2000: Tąpania: ocena, prognoza, zwalczanie. Katowice, GIG.
[4] Kalouptsidis N., Carayannis G., Manolakis D., Koukoutsis D. 1985: Efficient Recursive in Order Least Squares FIR filtering and Prediction. IEEE Trans. Acoust. Speech Sign. Processing, ASSP-33, 1175 – 1187.
[5] Konopko W. 1994: Doświadczalne podstawy kwalifikowania wyrobisk górniczych w kopalniach
węgla kamiennego do stopni zagrożenia tąpaniami. Prace Naukowe GIG nr 795, Katowice.
[6] Kornowski J. 2002: Podstawy sejsmoakustycznej oceny i prognozy zagrożenia sejsmicznego
w górnictwie. GIG, Katowice.
[7] Kornowski J., Kurzeja J. 2000: Korelacja energii wstrząsów górniczych z emisją sejsmoakustyczną
i ocena możliwości jej wykorzystania w matematycznych modelach prognozy. Mat. XXIII Zim. Szk.
Mechaniki Górotworu, Wyd. Katedra Geomech. Górn. i Geotech. AGH, Kraków, 181 – 195.
[8] Kurzeja J. 2002: Podstawy sejsmoakustycznej prognozy energii emitowanej z eksploatowanego
pokładu węgla. Mat. Symp. Warsztaty 2002.
[9] Robinson E., Treitel S. 1980: Geophysical Signal Analysis. Englewood Cliffs N. J., Prentice-Hall.
The examples of seismoacoustic energy prediction emitted from exploited
hand coal bed
Results of experimental investigations have been presented, comparing performance (as
measured by variance reduction factor) of many variants of the linear prediction method, when
used to predict hourly – observed energy of seismic and seismoacoustic (AE) emission from
a longwall in „Piekary” Coal Mine. We conclude that not all the variants of the linear
prediction behave equally well and that – due to the best of them – approximately 54%
reduction of variance is possible for this set of observations.
Przekazano: 28 marca 2002
____________________________________________________________________________
244

Podstawy sejsmoakustycznej prognozy energii emitowanej z

Transkrypt

Podobne dokumenty

Współczesna Prognoza Pogody – fizyka, matematyka, informatyka

KRN.pl

Prognoza pogody dla Polski na dzien 10-01-2017 i na noc 10/11

Rynek IT w Polsce 2016