Podstawy sejsmoakustycznej prognozy energii emitowanej z
Transkrypt
Podstawy sejsmoakustycznej prognozy energii emitowanej z
WARSZTATY z cyklu „Zagrożenia naturalne w górnictwie” ____________________________________________________________________________ Mat. Symp. str. 233 – 244 Jerzy KORNOWSKI Główny Instytut Górnictwa, Katowice Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla Streszczenie Praca ta stanowi część drugą dwuczęściowego cyklu dotyczącego prognozy sejsmoakustycznej (cześć pierwszą stanowi artykuł: Kurzeja (2002), dalej oznaczany krótko jako „Cz. 1”) i przedstawia wyniki obszernych badań, w których – korzystając z dużego zbioru jakościowo dobrych obserwacji z ZG Piekary – porównano wyniki prognozowania (godzinowej logarytmicznej energii łącznej tzn. AE i wstrząsów) za pomocą różnych wariantów algorytmu prognozy liniowej. Algorytm ten wybrano – wśród wielu możliwych ze względu na jego prostotę i dobrze rozwinięte podstawy teoretyczne. Stwierdzono, że nie wszystkie warianty metody są jednakowo dobre i że najlepsze z nich zapewniają – na badanym zbiorze obserwacji – skuteczność prognozy zbliżoną do 54% co oznacza że wariancja błędu prognozy wynosi około 46% wariancji obserwacji a wartość średnia błędu prognozy jest (na badanym zbiorze obserwacji) bardzo bliska zeru. 1. Wprowadzenie i przegląd problemów prognozy Prognoza zagrożenia sejsmicznego jest centralnym problemem sejsmoakustyki (AE) i sejsmologii górniczej. Przedmiotem prognozy może być albo czas, miejsce i energia przyszłego wstrząsu (taka prognoza jest marzeniem użytkowników, jest jednak bardzo trudna i na razie nieosiągalna), albo też zmienna w czasie i okresowo (co ΔT, np. co godzinę) liczona wartość zagrożenia definiowana (np. Kornowski 2002; patrz także Cz. 1) jako prawdopodobieństwo, że łączna energia emisji (AE i wstrząsów) w nadchodzącej jednostce czasu ΔT, zawarta będzie w przedziale (E1, E2) energii dopuszczając E2 →∞. W praktyce celowe jest ustalenie, dla wyrobiska w konkretnych warunkach, dolnej granicy E1 „niebezpiecznej energii wstrząsu” (np. Konopko 1994; tabl. 18, także Dubiński i Konopko 2000, str. 79) i definiowanie zagrożenia jako prawdopodobieństwa, że E (t, t + ∆T) > E 1, wymagając równocześnie by okres ∆T (obserwacji /interpretacji/prognozy) był znacznie krótszy od średniego czasu między niebezpiecznymi wstrząsami. Ponieważ energia łączna większa jest od energii samych wstrząsów a energia AE w ciągu ∆T rzadko sięga wartości „niebezpiecznych” (np. 10 4 J), możliwe jest ustalenie („alarmowego”) progu E1 na użytecznym i bezpiecznym poziomie. Prognoza – nie tylko w geofizyce – jest możliwa gdy dysponujemy zbiorem informacyjnym It danych/obserwacji związanych z przyszłymi wartościami prognozowanej wielkości Zt+τ (np. zagrożenia) oraz algorytmem/metodą/teorią (F) umożliwiającą wnioskowanie o Zt+τ na podstawie It. Gdy teoria ta ma postać matematyczną, nazywamy ją modelem prognozy (także modelem lub filtrem predykcyjnym). Wartość zmiennej x, wyprognozowaną algorytmem F na podstawie zbioru informacyjnego ____________________________________________________________________________ 233 J. KORNOWSKI – Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... ____________________________________________________________________________ It oznaczamy ~ xt – rozumiejąc przez to, że ~ xt (t, t+∆T) = F(It). x (It, F) – lub krócej ~ Fundamentem prognozy jest empirycznie i logicznie uzasadnione przekonanie, że im lepszy zbiór It i model F, tym bliżej teoretycznego optimum będą wyniki prognozy. Zastrzeżenie, iż wyniki prognozy zbliżać się mogą tylko do pewnego optimum, a nie do (bardzo pożądanej lecz zwykle nieosiągalnej) wartości prawdziwej (czyli przyszłej obserwacji) jest bardzo ważne, bo np. w przypadku szumu białego N (0, s 2) żaden, nawet idealny zbiór It i model F nie dadzą prognoz o wariancji mniejszej od s 2 (która może przecież być bardzo duża i odległa od oczekiwań/potrzeb praktyki!). Cała teoria i praktyka prognozy sprowadzają się do poszukiwania jak najlepszego modelu F oraz zbioru I t. By najważniejsze problemy i warunki racjonalnej prognozy postawić jasno i potem do nich nie wracać, stwierdzić trzeba że: – zajmujemy się tu prognozą, której zbiór informacyjny It składa się z minionych wartości log-energii łącznej Et = log(Ewstrz + EAE + 1)t, obserwowanych w kolejnych przedziałach czasu ∆T [Et jest skrótem symbolu E(t, t+∆T)]. Taką prognozę nazywamy sejsmoakustyczną prognozą zagrożenia sejsmciznego (SPZS); inna zawartość It może być przyczyną innej nazwy metody/prognozy. Zauważmy, że zbiór It z którego korzysta SPZS, jest bardzo „ubogi” i nie zawiera żadnych informacji geologicznych czy górniczych. Zagadnienie rozszerzenia bazy informacyjnej należy do podstawowych problemów prognozy zagrożenia sejsmicznego, – w zagadnieniu SPZS nie występuje problem czasu (prognoza jest formułowana co ∆T i dotyczy nadchodzącego ∆T) ani miejsca (prognoza dotyczy ściany objętej obserwacją AE). A oto niektóre warunki konieczne SPZS: a) Konieczna jest lokalizacja wstrząsów tak, by zbiór It nie został zaśmiecony wprowadzającymi w błąd zdarzeniami obcymi. b) Energie AE i wstrząsów muszą być addytywne (liczyć trzeba fizyczną, wyrażoną w dżulach J, energię AE, odrzucając tzw. „energię umowną”). c) Ewstrz i EAE zaobserwowane w minionym przedziale ∆T muszą być równocześnie, co ∆T, dostępne programowi który liczy Et (zatem tworzy zbiór It) i prognozuje. d) Et (zatem Ewstrz oraz EAE) muszą być liczone z dokładnością zapewniającą użyteczność wyników. Dokładność prognoz energii nie będzie lepsza od dokładności obserwacji/estymacji energii (zdarzeń minionych) a grube błędy w It wywołają jeszcze większe błędy prognozy. e) Im krótsze są okresy ∆T obserwacji i prognozy, tym większe są szanse zaobserwowania emisji poprzedzającej nagłą zmianę zagrożenia (być może wstrząs). Częstość obserwacji/interpretacji/prognozy winna zależeć od stanu zagrożenia. Okresy zmianowe (∆T = 8 godzin) są reliktem epoki przedkomputerowej i powinny być radykalnie skrócone. f) Istnieć musi co najmniej pośredni związek między obserwowanymi (i wchodzącymi do I t) parametrami emisji AE a wstrząsami które decydują o zagrożeniu; związek ten Kornowski (2002) nazwał „postulatem jedności emisji” uznając, że wspólną przyczyną AE i wstrząsów (o nieodległych źródłach) jest pole naprężeń (modyfikowane eksploatacją i niejednorodnościami). Postulat ten (w teorii) dopuszcza wnioskowanie o zagrożeniu {tzn. Z = F(I t)} w obszarze S tylko na podstawie zdarzeń z S i mających wspólną z zagrożeniem przyczynę. Oznacza to m.in. konieczność eliminowania hałasów i zakłóceń oraz konieczność teoretycznie poprawnego traktowania emisji związanej ze skrawaniem (zagadnienie to opisują tzw. sejsmoakustyczne równania stanu skrawanej ściany (Kornowski 2002) – lecz wykracza to poza zakres niniejszej pracy). ____________________________________________________________________________ 234 WARSZTATY z cyklu „Zagrożenia naturalne w górnictwie” ____________________________________________________________________________ Określić jeszcze należy formę wyników prognozy i miarę jakości. W każdej chwili t, przyszła wartość energii łącznej E(t, t+∆t) jest wielkością nieznaną, która traktowana być musi jako zmienna losowa opisana swym (ewoluującym) rozkładem prawdopodobieństwa (jeśli E(t, t-∆t) została już zaobserwowana, to jest wielkością znaną i deterministyczną: proces (z założenia: dokładnej) obserwacji przekształca wielkość nieznaną w znaną, a losową w deterministyczną). Kornowski (2002) sugeruje, że błąd optymalnej prognozy Et łącznej log-energii może być dobrze aproksymowany jako N(0, s2): ~ – Zatem z każdą jednostką czasu ∆T, prognozować należy wartość E t i jej wariancję s2, a dla użytkownika najwygodniejsze jest korzystanie z α % przedziału ufności i prawdopodobieństwa przekroczenia wartości niebezpiecznej, E1 (prawdopodobieństwo to nazywamy zagrożeniem!). Prognoza w chwili t winna zatem mieć postać zdania: „z praw~ dopodobieństwem 90%, E α < E (t, t+∆T) < Eβ, a prawdopodobieństwo że E(t, t+∆t) > E 1 wynosi Z" (przy czym Eα, Eβ, Z to konkretne, liczone co ∆T wartości, E1 ustala Dział Tąpań kopalni dla danego wyrobiska (np. korzystając z Tab. 5.4, Dubiński i Konopko 2000), a wartość 90% jest tylko przykładem (może być 95%)). Dział Tąpań kopalni winien wiedzieć jak informację tę w praktyce wykorzystać, a przepisy/instrukcje winny to ułatwiać. – Ponieważ wartość średnia błędów optymalnej prognozy jest zerem, dobrą miarą jakości prognozy jest iloraz: 2 VARNOR = Sb2 /Sobs (1.1) gdzie: Sb2 – to wariancja błędu prognozy 2 – to wariancja obserwacji. S obs W terminologii regresji liniowej, VARNOR = 1 – R2 gdzie R2 to współczynnik determinacji. Jest to ocena statystyczna, wymagająca wielu prób/prognoz i wykluczająca osądzanie wyników (także modelu i zbioru It) na podstawie pojedynczych (lub nielicznych) przypadków. Wśród dostępnych nam wyników obserwacji z kopalń, dane ze ściany 331/510 Zakładu Górniczego Piekary najbliższe były spełnienia warunków SPZS, toteż te właśnie obserwacje wykorzystano. Oznacza to jednak, że zakres ważności przedstawianych wyników ograniczony jest do warunków słabego lub co najwyżej średniego zagrożenia tąpaniami. Przedmiotem tej pracy są wyniki badań porównawczych zdolności predykcyjnej (mierzonej wartością VARNOR) i użyteczności praktycznej (uwzględniającej też prostotę/złożoność metody) szeregu wariantów znanej metody prognozy liniowe za pomocą przybliżonych filtrów Wienera. Algorytmy opisane były (m.in.) w Cz. 1, tu podane są wyniki prognozy i niektóre informacje szczegółowe. 2. Wyniki prognozy liniowej 2.1. Opis zadania i przykładowe wyniki Prognozą liniową nazywamy obliczanie, w każdej dyskretnej chwili t (t = i·∆T, i = 1, 2,...) wartości: xt+1 = a1xt + a2xt-1 + ... + aLxt-L+1 (2.1) ____________________________________________________________________________ 235 J. KORNOWSKI – Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... ____________________________________________________________________________ gdzie: a – wektor parametrów (a1,...,aL) nazywamy (liniowym) predyktorem (także filtrem predykcyjnym) rzędu L. Na przykład xt mogą to być wartości log-energii łącznej w kolejnych jednostkach ∆T (np. w kolejnych godzinach) – i wówczas równanie (2.1) realizuje sejsmoakustyczną prognozę zagrożenia sejsmicznego (SPZS) wykorzystując zbiór I t = (x1,..., xt) i model (2.1). Prognozę liniową nazywamy optymalną gdy wartości (a1,...,aL oraz L) dobrane są w sposób gwarantujący minimalizację średniokwadratowego błędu prognozy a w praktyce – ponieważ właściwie dobrany filtr (2.1) jest tak zwanym estymatorem nieobciążonym czyli gwarantującym że średni błąd prognozy jest zerem – gdy zapewniona jest minimalizacja wariancji (VARNOR) błędu prognozy. Istnieje obszerna literatura dotycząca optymalizacji parametrów filtru predykcyjnego (Robinson i Treitel 1980; Box i Jenkins 1970; Burg 1975), zagadnienie to opisano także w Cz. 1, tutaj więc przypomnieć wystarczy że warunkiem użyteczności metody (prognozy liniowej) jest występowanie (dla przesunięcia τ > 0) istotnie różnej od zera autokorelacji r(τ) w szeregu czasowym (xt) obserwowanych i prognozowanych wielkości. Brak istotnej autokorelacji wyklucza użyteczność prognozy liniowej. Zagadnienie autokorelacji w szeregach czasowych emitowanej energii (AE, wstrząsów i łącznej) dyskutowane było i ilustrowane przykładami w pracach Kornowskiego i Kurzeji (2000), Kornowskiego (2002), a także w Cz. 1 gdzie stwierdzono, że autokorelacja taka występuje w stopniu uzasadniającym stosowanie prognozy liniowej. Zauważyć też trzeba że (przed przystąpieniem do prognozy) niewiadomymi są zarówno parametry filtru predykcyjnego (a1,...,aL) jaki jego rząd L, i wyznaczyć trzeba zarówno L jak i parametry; ponadto nowoczesne algorytmy estymujące optymalne wartości parametrów filtru, obliczają też (zakładając stacjonarność procesu – np. emisji energii łącznej) przybliżoną wariancję błędu prognozy. Ponieważ błąd prognozy logarytmicznej energii łącznie ma rozkład w przybliżeniu normalny (z wartością średnią 0), znajomość wariancji wystarcza do określenia przedziałów ufności. Przykład prognozy – dla 9 tygodni obserwacji energii łącznej z ść 331/510 ZG Piekary i jej wyników pokazano na rysunku 2.1. i 2.2. Na rysunku 2.1. widzimy trzy pary wykresów – a każda para dotyczy trzytygodniowego okresu obserwacji i składa się z: – wykresu górnego, przedstawiającego (przebieg środkowy) obserwowane wartości godzinowej log-energii łącznej wewnątrz (wykresy powyżej i poniżej) 90% przedziału ufności dla prognozy, – wykresu dolnego przedstawiającego błędy prognozy. Można zauważyć, że energia obserwowana czasami – lecz niezbyt często – wykracza poza granice 90% przedziału ufności – co jest zrozumiałe (można, oczywiście, wyznaczyć przedziały bardziej „pewne”, np. 95% lub 99%, lecz nie wydaje się to celowe). Na rysunku 2.2. pokazano – z lewej dla obserwowanych wartości log-energii łącznej, z prawej dla błędów prognozy – od góry: autokorelację, histogram częstości występowania (czyli przybliżony rozkład gęstości prawdopodobieństwa) danej wartości oraz widmo szeregu czasowego (obserwowanej godzinowej log-energii lub błędu prognozy tej energii). Zauważyć należy, że w autokorelacji obserwacji bardzo wyraźna jest składowa okresowa o okresie 168 godzin (1 tydzień), wymuszona rytmem produkcji, a w widmie widoczne są też składowe o okresie T = 12 i T = 24 godziny; ponadto histogram obserwacji jest zdecydowanie odległy od (zaznaczonego na jego tle) rozkładu normalnego o tej samej średniej i wariancji. Pokazana z prawej strony rysunku 2.2. autokorelacja błędów predykcji nie różni się w sposób istotny od szumu białego [r(τ) < 1,96/ 1513 nie jest więc istotna], choć w widmie znaleźć można jeszcze oznaki składowych 12 i 24-godzinnych. Histogram błędów predykcji znacznie ____________________________________________________________________________ 236 WARSZTATY z cyklu „Zagrożenia naturalne w górnictwie” ____________________________________________________________________________ bardziej „przypomina” rozkład normalny (choć w sensie ścisłym nie jest nim) o wartości średniej 0,06 (a więc bliskiej zera) i wariancji σ2 = 0,19. 2.2. Prognoza modelem autoregresji rzędu L ≤ 50 Metoda prognozy liniowej dostosowana jest do przetwarzania wsadowego i dla ustalonego zbioru (xk, xk+1,..., xk+N-1) obserwacji o liczebności N, określa parametry (Lopt; ai, i=1,..., Lopt; s2) filtru predykcyjnego. Ponieważ jednak poszukiwanie optymalnego rzędu (optymalnej długości) filtru, Lopt, odbywa się porównując jakość coraz to dłuższych filtrów (L = 1, 2,..., L max), zadana musi zostać pewna wartość maksymalna, Lmax, by program nie liczył w nieskończoność. Od wyboru tej wartości (Lmax) również zależeć może ostateczna jakość prognozy. Ponieważ w przypadku obserwacji godzinowych dane napływają sekwencyjnie (co godzinę), oprócz wartości Lmax określić trzeba szerokość (N) okna czasowego – na którym, dla zadanej wartości Lmax, algorytm estymuje (Lopt; ai, i=1,...Lopt; s2) – a także określić trzeba krok (KROK) tego okna, gdyż (choć prognoza robiona jest co godzinę) filtr obliczać można (np.) co godzinę, albo co dobę, albo co tydzień, albo w ogóle tylko raz (na początku, gdy uruchamiany jest algorytm). Ponadto, przed każdym obliczeniem filtru (Lopt, ai, s2) ze zbioru (xk, xk+1,..., xk+N-1) można usuwać wartość średnią x (k, k+N) lub można jej nie usuwać. Istnieje więc ogromna liczba możliwych przypadków i wariantów, a próba wyboru optymalnego sposobu prognozy (tylko metodą prognozy liniowej i tylko na jednym, 9-tygodniowym zbiorze obserwacji z ść 331/510 ZG Piekary) wymaga bardzo obszernego eksperymentu numerycznego. Wyniki tego eksperymentu, zawsze określone wartością VARNOR, znormalizowanego „błędu prognozy”, przedstawiono w tabeli 2.1. 5 logE/h 4 3 2 1 0 0 48 2 logE/h 0 -2 0 48 5 logE/h 4 3 2 1 0 504 552 2 logE/h 0 -2 504 552 5 logE/h 4 3 2 1 0 1008 1056 2 logE/h 0 -2 1008 1056 t[h] 96 144 192 240 288 336 384 432 480 96 144 192 240 288 336 384 432 480 600 648 696 744 792 840 888 936 984 600 648 696 744 792 840 888 936 984 1104 1152 1200 1248 1296 1344 1392 1440 1488 1104 1152 1200 1248 1296 1344 1392 1440 1488 t[h] t[h] t[h] t[h] t[h] Rys. 2.1. Wyniki prognozy dziewięciotygodniowej (1512 godz.) obserwacji godzinowej logarytmicznej energii łącznej (AE + wstrząsów) ze ść 331/510 ZG Piekary (zagrożenie słabe do średniego). W wierszach 1, 3, 5 energia obserwowana wraz z 90% przedziałem ufności dla prognozy (zauważ sporadyczne wykroczenia obserwacji poza granice 90% przedziału ufności). W wierszach 2, 4, 6 błędy prognozy godzinowej log-energii łącznej. Obserwacje rozpoczęto w poniedziałek, godz. 6°° Fig. 2.1. Results of nine-weeks prediction of AE and mining tremors energy ____________________________________________________________________________ 237 J. KORNOWSKI – Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... ____________________________________________________________________________ g(x) g(x) 100 150 x = 2,29 2 =0,42 50 x = 0,06 2 =0,19 100 50 0 x = logE/h 0 1 2 3 4 r() 1 0.5 0.5 0 0 0 2 0 (h) 0 100 200 300 400 -0.5 (h) 0 100 200 300 400 dB dB 0 -20 -20 -40 -60 -2 r() 1 -0.5 x = logE/h 0 -40 48 24 12 6 T[h] T(h) T[h] -60 T[h] T(h) 48 24 12 6 Rys. 2.2. Statystyczne charakterystyki obserwacji (z lewej) i błędów prognozy (z prawej) pokazanych na rysunku 2.1. Od góry: histogram danych na tle rozkładu normalnego o tej samej średniej i wariancji (zauważ wartości x oraz σ2), w środku: funkcja autokorelacji obliczona na podstawie 1512 wartości danych (w r(τ) obserwacji zauważ składową okresową o okresie tygodniowym), u dołu: widmo szeregu czasowego godzinowych obserwacji błędów prognozy Fig. 2.2. The statistic characteristics of observation and prediction errors showed on Fig. 2.1. Użyty do estymacji parametrów ai algorytm pochodził z pracy Kalouptsidisa i innych (1985) i został zmodyfikowany przez autora między innymi poprzez wprowadzenie kryterium FPE (patrz Cz. 1) do wyznaczania optymalnej długości filtru Lopt. W tabeli 2.1. uwzględniono tylko skrajne wartości (1 oraz ∞) parametru KROK, i dla KROK = 1 parametry (Lopt, ai, i=1,... Lopt) estymowano co godzinę, a dla KROK = ∞ parametry te estymowano tylko raz, na początku przetwarzania ciągu obserwacji. Dla innych wartości tego parametru (KROK) otrzymuje się wyniki pośrednie, zrezygnowano więc z ich przedstawiania. Szerokość okna, N, określono w godzinach (168 godzin to 1 tydzień). Symbol xt oznacza estymację parametrów bez usuwania wartości średniej ze zbioru obserwacji, symbol xt- x oznacza, że ze zbioru (xK,..., xK+N-1) przed estymacją filtra (Lopt, ai, s2) usunięto średnią: x (k, N) = N-1(xk + xK+1 +...+ xK+N-1) (2.2) Wartość VARMOR = 0,47 oznacza że prognoza „usuwa” 53% wariancji z ciągu obserwacji, VARNOR = 0 oznacza prognozę idealnie dokładną a VARNOR = 1 oznacza, że prognozowano wartość średnią ciągu obserwacji. Pamiętając, że wyniki uzyskano na zbiorze 1513 obserwacji godzinowych z ZG Piekary – są to więc wyniki wiarygodne w warunkach umiarkowanego stanu zagrożenia tąpaniami, zawarte w tabeli 2.1. wyniki podsumować można następującymi wnioskami: W1. Zastosowana metoda i wykorzystany zbiór obserwacji, w obszarze dopuszczonych długości filtru, umożliwiają prognozę ze „średnią” jakością. Błędy prognozy mają wartość ____________________________________________________________________________ 238 WARSZTATY z cyklu „Zagrożenia naturalne w górnictwie” ____________________________________________________________________________ średnią (nie ilustrowaną w tabeli 2.1., lecz widoczną na histogramie, rysunek 2.2. z prawej) w przybliżeniu równą zero i wariancję, w najlepszym przypadku, wynoszącą około 47% wariancji ciągu obserwacji. W2. Usuwanie średniej poprawia jakość prognoz systematycznie lecz bardzo nieznacznie (VARNOR maleje nie więcej jak o 1%). Tabela 2.1. Wartości VARNOR∙1000 znormalizowanej wariancji błędu prognozy liniowej w zależności od szerokości okna (N) i dopuszczalnej długości Lmax filtru, dla parametrów KROK = 1 i KROK → ∞ oraz dla przypadków usuwania i nie usuwania średniej x ze zbioru przed estymacją parametrów filtru. Wyniki uzyskano dla 1513 godzinowych obserwacji (9 tygodni) log-energii łącznej ze ść 331/510 ZG Piekary Table 2.1. Values VARNOR 1000 of normalised variance of linear prediction error Lmax N [godz.] x 3 4 5 10 15 20 KROK (50, N/10) 336 504 672 840 1 ∞ 1 ∞ 1 ∞ 1 ∞ 1 ∞ xt 493 495 484 487 484 482 482 480 480 480 xt - x 491 493 480 480 476 474 474 474 469 474 493 495 480 484 482 478 478 476 476 476 xt – x 493 493 478 480 476 472 472 469 467 469 xt 493 495 482 484 482 478 478 476 476 473 xt – x 493 493 478 480 476 472 469 469 469 469 xt 497 526 489 502 487 487 478 493 476 493 xt – x 497 526 487 500 480 482 469 487 467 489 xt 502 551 491 515 487 495 480 504 480 506 xt – x 502 551 487 513 480 491 474 500 469 500 xt 500 551 491 515 491 495 482 504 480 506 500 551 487 513 482 491 474 500 469 500 515 610 495 515 487 495 484 504 480 506 513 610 41 513 478 491 474 500 472 500 xt xt – min 168 x xt xt – x Uwaga: podane wartości należy podzielić przez 1000 W3. Wzrost długości okna (N) poprawia jakość prognozy, lecz niezbyt systematycznie i w niewielkim stopniu (wzrost wartości N od 168 do 840 powoduje spadek VARNOR o 2 ÷ 4%). Sugeruje to stacjonarność procesu emisji. ____________________________________________________________________________ 239 J. KORNOWSKI – Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... ____________________________________________________________________________ W4. Wpływ kroku okna (KROK) niewielki i niesystematyczny dla filtrów krótkich, staje się wyraźny dla Lmax ≥ 10, gdzie widać, że jakość prognozy pogarsza się ze wzrostem długości kroku, co jest nieuniknione w przypadku lokalnych nie stacjonarności emisji. W praktyce kopalnianej, krok o umiarkowanej długości – np. tygodniowy, tzn. KROK = 168, co oznacza aktualizację parametrów raz w tygodniu – powinien okazać się rozwiązaniem racjonalnym. W5. Filtry krótkie, np. ograniczone wartością Lmax = 5, zapewniają prognozę lepszą od filtrów długich. Wynik ten jest bardzo ważny, gdyż decyduje o prostocie i efektywności obliczeń (wynik ten, choć z pozoru zaskakujący bo filtry krótkie są podzbiorem filtrów długich – jest znany w teorii prognozy liniowej), równocześnie ograniczając obszar dalszych badań. 2.3. Prognoza modelem jednoparametrowym uwzględniającym okresowość Ewidentna obecność (w obserwowanych wartościach łącznej godzinowej log-energii, patrz rys. 2.2.) składowej okresowej o okresie tygodniowym – bez wątpienia wymuszona procesem produkcji – skłoniła autora (we współpracy z Autorką Cz. 1) do próby wykorzystania modelu: x(t) = αx(t – 1) + (1 – α) x (t – 168) (2.3) gdzie: 0 ≤ α ≤ 1. W modelu tym występuje tylko jeden parametr (α) – którego optymalną (minimalizującą błąd dopasowania w oknie czasowym o szerokości N) wartość znajduje się przy pomocy algorytmu tzw. złotego podziału. Zwracam jednak uwagę, że podane dalej wartości VARNOR określają znormalizowaną wariancję błędu predykcji, a nie dopasowania. Dla α = 1 otrzymuje się model: x(t) = x( t – 1) (2.4a) Optymalny dla procesu przyrostów niezależnych (zwanego też ruchem Browna lub procesem błądzenia przypadkowego – ang.: random walk). Model ten sugeruje, że „jak było w minionej godzinie, tak będzie w następnej” i jest bardzo popularny w wielu zastosowaniach, także w sejsmoakustyce, gdzie obowiązująca Instrukcja (implicite) utożsamia prognozę (na okres t+1) z oceną zagrożenia (w okresie t). W przypadku α = 0 otrzymuje się model optymalny dla procesu okresowego o okresie tygodniowym, zaburzonego białym szumem: x(t) = x(t – 168) (2.4b) Postać autokorelacji obserwacji (rys. 2.2.) sugeruje, że i ten model powinien być brany pod uwagę. Postać ogólna modelu jednoparametrowego (2.3) dopuszcza – jak się wydaje – dowolną mieszaninę tych procesów – uznano więc, że stanowić może model warty zbadania. Jak poprzednio, możliwa jest wielka liczba wariantów algorytmu prognozy ze względu na długość okna czasowego (N) i jego krok (KROK). {badano także dodatkowo celowość zastąpienia członu x(t – 168) w równaniach (2.3) i (2.4b), członem K-1[x(t – 1 · 168) + x (t – 2 · 168) + ... + x (t – K · 168)] dla różnych wartości K ≠ 1 nie otrzymując jednak wyników lepszych od otrzymanych dla K = 1, stąd ograniczamy się do K = 1}. Otrzymane wyniki przedstawiono w tabeli 2.2., określającej znormalizowany błąd prognozy VARNOR dla optymalnych wartości parametru α zależnie od wartości parametrów N oraz KROK. ____________________________________________________________________________ 240 WARSZTATY z cyklu „Zagrożenia naturalne w górnictwie” ____________________________________________________________________________ Tabela 2.2. Wartości VARNOR·1000, znormalizowanej wariancji błędu prognozy optymalnym filtrem jednoparametrowym (4) w zależności od szerokości okna (N) i od kroku okna (KROK) Table 2.2. Values VARNOR 1000 of normalised variance of prediction error of one-parameter filter KROK 1 24 168 ∞ 168 522 522 523 517 336 524 525 527 531 504 524 526 530 543 672 526 527 530 544 840 528 529 532 547 N Uwaga: podane wartości należy podzielić przez 1000. Badano ponadto wartości VARNOR dla α = 1 (czyli zakładając „błądzenie przypadkowe”) oraz dla α = 0 (czyli zakładając proces okresowy na tle białego szumu) w obu przypadkach otrzymując systematycznie wartości znacznie większe od pokazanych w tabeli 2.1. (dla α = 1 typowo VARNOR ≈ 0,59, dla α = 0 typowo VARNOR > 1), co upoważnia do ważnego wniosku: W6. Proces (szereg czasowy) utworzony z godzinowych wartości łącznej log-energii (obserwowanej w ścianie 331/510 ZG Piekary) nie może być aproksymowany ani modelem przyrostów niezależnych (który zwany jest też ruchem Browna lub błądzeniem przypadkowym) ani, tym bardziej, modelem procesu okresowego na tle szumu białego. Ponadto, porównanie wartości VARNOR w tabela 2.1. i w tabeli 2.2. upoważnia do wniosku. W7. Prognoza modelem jednoparametrowym (4) uwzględniającym okresowość daje wyniki w sposób istotny gorsze od wyników standardowej prognozy liniowej. Zauważmy na koniec, że model (4) może być traktowany jako szczególny przypadek predyktora liniowego, krótkiego lecz bardzo wysokiego rzędu (L = 168) z narzuconymi bardzo silnymi ograniczeniami (ai = 0, i = 2, 3,..., 167; a1 = 1 – a168). 2.4. Jeszcze trzy modele liniowe Celem pełniejszego wyjaśnienia i zrozumienia możliwości prognozy krótkimi optymalnymi filtrami predykcyjnymi, pojęto badanie filtrów: 1 M1 : 2 M2 : x(t) = a1x (t-1) x(t) = b1x (t-1) + b2x (t-2) 3 M 168 : x(t) = q1x (t-1) + q2x (t-2) + q3x (t-168) (2.5a) (2.5b) (2.5c) na tym samym zbiorze danych z ZG Piekary. Wyniki prognozy podano poniżej w tabeli 2.3. i 2.4. ____________________________________________________________________________ 241 J. KORNOWSKI – Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... ____________________________________________________________________________ Ponieważ optymalne wartości parametrów filtrów znajduje się rozwiązując tzw. równania normalne prognozy (patrz Cz. 1) zwykle wykorzystując przy tym wartości autokorelacji, r(τ), zbioru obserwacji, powstaje dodatkowo cały szereg możliwości obliczeniowych (wariantów metody) można bowiem autokorelację liczyć usuwając uprzednio wartość średnią ze zbioru obserwacji lub jej nie usuwając, ponadto w każdym przypadku stosować można tzw. obciążony: N τ ro(τ) = N-1 x(t)x(t τ) (2.6a) τ 0 lub nieobciążony: N τ rn(τ) = (N-τ)-1 x(t)x(t τ) (2.6b) τ 0 estymator autokorelacji. Wyniki podane w tabeli 2.3. dotyczą wyłącznie przypadku prognozy wykorzystującej (do obliczenia optymalnych parametrów filtru a 1 lub b1 i b2) obciążony estymator ro(τ) obliczany po usunięciu wartości średniej ze zbioru (dotychczasowych) obserwacji. Przyczyna tego wyjaśniona będzie poniżej. Tabela 2.3. Wartość VARNOR·1000 oraz wartości średnie ε błędu predykcji dla 1513 godzinowych obserwacji logenergii łącznej w przypadku prognozy optymalnym filtrem pierwszego (M 1) i drugiego (M2) rzędu Table 2.3. Values VARNOR 1000 and average prediction error for 1513 hours observation log-energy KROK M N 336 VARNOR ε 504 VARNOR ε 672 VARNOR ε 840 VARNOR ε 1 24 ∞ 168 M1 M2 M1 M2 M1 M2 M1 M2 513 469 516 469 518 470 507 463 0,02 0,02 0,03 0,02 0,04 0,03 0,22 0,16 511 467 512 467 513 467 507 463 0,03 0,02 0,03 0,02 0,04 0,03 0,19 0,14 513 468 514 467 515 467 505 463 0,04 0,03 0,04 0,03 0,05 0,04 0,17 0,13 511 467 514 467 514 467 515 463 0,05 0,03 0,05 0,03 0,06 0,04 0,16 0,13 Uwaga: wartości VARNOR podzielić należy przez 1000 Z tabeli 2.1. wynikają kolejne, istotne wnioski: W8: Model M 11 umożliwia usunięcie około 49% wariancji a model M 22 około 53% wariancji ze zbioru obserwacji. Nawet najlepsze z wyników podanych w tabeli 2.1. nie są istotnie lepsze od uzyskanych modelem M2. W9: Średni błąd kwadratowy jest sumą wariancji i kwadratu błędu średniego. Uwzględnienie kwadratu błędu średniego (który jest bliski zera zawsze prócz przypadku KROK = ∞) wyjaśnia pozornie bardzo dobre działanie filtrów, które są raz tylko (na początku procesu prognozy) estymowane a potem stosowane bez zmiany: w rzeczywistości filtry te nie gwarantują zerowej średniej wartości błędu predykcji i parametr VARNOR nie jest dla ____________________________________________________________________________ 242 WARSZTATY z cyklu „Zagrożenia naturalne w górnictwie” ____________________________________________________________________________ nich właściwą miarą jakości (lepszą miarą jest średni błąd kwadratowy). 3 Ostatnia seria obliczeń związana była z optymalizacją i zastosowaniem filtru M 168 określonego równaniem (6c). Jest to filtr wprawdzie krótki (trzyelementowy) lecz tak wysokiego rzędu (L = 168) że stosowanie standardowych metod estymacji uznano za niecelowe. Równocześnie filtr ten umożliwia uwzględnienie składowej okresowej o okresie tygodniowym, a porównanie uzyskanych wyników z wynikami uzyskanymi przy użyciu M 22 umożliwia ocenę informacji zawartej w składowej okresowej. Wyniki przedstawione w tabeli 2.4. dotyczą tylko przypadku wykorzystania obciążonego estymatora autokorelacji (7a ). Wyniki uzyskane stosując estymator nieobciążony były systematycznie gorsze – ich przedstawianie uznano więc za niecelowe. Analiza tabeli 2.4. i porównanie z tabeli 2.3. skłania do następujących wniosków. 3 W10: M 168 umożliwia w najlepszym przypadku (N = 504, KROK = 168) prognozę z błędem VARNOR ≈ 0,460 ( = 0,03, VARNOR + 2 ≈ 0,461) o około 1,5% mniejszym niż za pomocą filtru M 22 . Jest to zaskakująco mała poprawa jakości prognozy, być może warta głębszej analizy. W11: Jak poprzednio, usuwanie średniej (ze zbioru obserwacji) i wykorzystanie obciążonego estymatora autokorelacji poprawia wyniki w stopniu niewielkim lecz systematycznie, winno więc być zawsze stosowane. Prognoza filtrem którego współczynniki są tylko raz liczone, prowadzi do wyników gorszych od uzyskanych filtrem okresowo aktualizowanym. Wyniki podane w tabeli 2.4. sugerują też, że racjonalne jest aktualizowanie filtru raz w tygodniu i stosowanie okna N = 504. Tabela 2.4. Wartości VARNOR (wariancji znormalizowanej błędu prognozy) oraz średniego błędu prognozy 3 filtrem M 168 dla różnych wartości kroku (krok) okna i szerokości (N) okna, gdy z obserwacji usuwano (x – x ) wartość średnią i gdy jej nie usuwano (xt) Table 2.4. 3 Values VARNOR and average prediction error of M 168 filter KROK N 1 24 ∞ 168 xt x- x xt x- x xt x- x xt x- x 336 VARNOR ε 492 464 495 465 493 464 484 453 0.01 0.02 0.01 0.02 0.01 0.03 0.01 0.12 504 VARNOR ε 489 461 491 461 489 460 481 453 0.01 0.02 0.01 0.02 0.01 0.03 0.01 0.10 672 VARNOR ε 486 461 488 461 486 461 477 456 0.01 0.03 0.01 0.03 0.01 0.04 0.01 0.09 840 VARNOR 484 460 485 461 484 460 476 459 0.01 0.03 0.01 0.03 0.01 0.04 0.01 0.09 ε Uwaga: wartości VARNOR należy podzielić przez 1000 3. Wnioski 1. Na obszernym zbiorze obserwacji z ZG Piekary wykazano, że możliwa jest prognoza liniowa godzinowych wartości logarytmicznej energii łącznej (AE i wstrząsów) ze ____________________________________________________________________________ 243 J. KORNOWSKI – Przykłady sejsmoakustycznej prognozy energii emitowanej z eksploatowanego... ____________________________________________________________________________ 2. 3. 4. 5. sprawnością (czyli jakością, mierzoną parametrem VARNOR = 1-R2 określającym redukcję wariancji wskutek prognozy) lepszą od 50%. Wartość liczbowa VARNOR zależy od zbioru obserwacji może więc być traktowana tylko jako przykład. Optymalną prognozę liniową umożliwiają filtry bardzo krótkie, 2 – 5 elementowe, zatem łatwe do obliczenia i stosowania. Uzyskane wyniki wskazują, że estymację parametrów filtru predykcyjnego można i warto powtarzać raz w tygodniu (a potem przez tydzień stosować obliczone wartości parametrów): zapewnia to wystarczającą adaptacyjność (zdolność dostosowania się do zmiennych warunków) metody. Jeżeli do estymacji filtru wykorzystywana jest autokorelacja, stosować należy estymator obciążony, ro(τ), zawsze najpierw usuwając wartość średnią. Cała procedura estymacji filtru predykcyjnego i prognozy tym filtrem jest tak prosta że – jeśli obsługa Stacji Geofizycznej zapewni dopływ (do komputera PC) godzinowych wartości fizycznej (wyrażonej w dżulach, J) energii AE i wstrząsów – może działać całkowicie automatycznie, nie kolidując z obowiązującymi metodami (sejsmoakustyczną i sejsmologiczna) i dostarczając dodatkową informację o zagrożeniu – która łatwo może być ilościowo sprawdzona. Literatura [1] Box G. E. P., Jenkins G. M. 1970: Time Series Analysis Forecasting and Control. San Francisco, Holden-Day. [2] Burg J. P. 1975: Maximum Entropy Spectral Analysis. Ph. D. Dissertation, Stanford Univ. [3] Dubiński J., Konopko W. 2000: Tąpania: ocena, prognoza, zwalczanie. Katowice, GIG. [4] Kalouptsidis N., Carayannis G., Manolakis D., Koukoutsis D. 1985: Efficient Recursive in Order Least Squares FIR filtering and Prediction. IEEE Trans. Acoust. Speech Sign. Processing, ASSP-33, 1175 – 1187. [5] Konopko W. 1994: Doświadczalne podstawy kwalifikowania wyrobisk górniczych w kopalniach węgla kamiennego do stopni zagrożenia tąpaniami. Prace Naukowe GIG nr 795, Katowice. [6] Kornowski J. 2002: Podstawy sejsmoakustycznej oceny i prognozy zagrożenia sejsmicznego w górnictwie. GIG, Katowice. [7] Kornowski J., Kurzeja J. 2000: Korelacja energii wstrząsów górniczych z emisją sejsmoakustyczną i ocena możliwości jej wykorzystania w matematycznych modelach prognozy. Mat. XXIII Zim. Szk. Mechaniki Górotworu, Wyd. Katedra Geomech. Górn. i Geotech. AGH, Kraków, 181 – 195. [8] Kurzeja J. 2002: Podstawy sejsmoakustycznej prognozy energii emitowanej z eksploatowanego pokładu węgla. Mat. Symp. Warsztaty 2002. [9] Robinson E., Treitel S. 1980: Geophysical Signal Analysis. Englewood Cliffs N. J., Prentice-Hall. The examples of seismoacoustic energy prediction emitted from exploited hand coal bed Results of experimental investigations have been presented, comparing performance (as measured by variance reduction factor) of many variants of the linear prediction method, when used to predict hourly – observed energy of seismic and seismoacoustic (AE) emission from a longwall in „Piekary” Coal Mine. We conclude that not all the variants of the linear prediction behave equally well and that – due to the best of them – approximately 54% reduction of variance is possible for this set of observations. Przekazano: 28 marca 2002 ____________________________________________________________________________ 244