parametr kształtu rozkładów gev i gp przepływów maksymalnych

Transkrypt

parametr kształtu rozkładów gev i gp przepływów maksymalnych
M O N O G R A F I E K O M I T E T U G O S P O D A R K I W O D N E J PA N
z. XX
2014
Agnieszka RUTKOWSKA1, Kazimierz BANASIK2
Uniwersytet Rolniczy w Krakowie
Wydział Inżynierii Środowiska i Geodezji
2
Szkoła Główna Gospodarstwa Wiejskiego w Warszawie
Wydział Budownictwa i Inżynierii Środowiska
1
PARAMETR KSZTAŁTU ROZKŁADÓW GEV I GP
PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH ORAZ
POWYŻEJ PROGU ODCIĘCIA – ANALIZA STATYSTYCZNA
1. WSTĘP
Wyznaczanie przepływów o określonym prawdopodobieństwie przewyższenia
jest kluczowe, jeśli chodzi o projektowanie urządzeń przeciwpowodziowych oraz
sporządzanie map ryzyka. W praktyce są one estymowane na podstawie empirycznych przepływów maksymalnych rocznych (AM), z półrocza zimowego (letniego)
lub przepływów powyżej poziomu (progu) odcięcia. Szczególną uwagę należy przy
tym zwrócić na estymację prawego ogona rozkładu, gdyż w nim zawarta jest informacja o przepływach mających długi okres powtarzalności. Jeśli przepływ maksymalny prawdopodobny jest estymowany za pomocą rozkładu uogólnionego wartości
ekstremalnych (GEV) lub uogólnionego Pareto (GP), to o kształcie ogona rozkładu
decyduje jego współczynnik kształtu. Stąd też kluczowa jest poprawna estymacja
tego współczynnika.
Prekursorami w badaniach rozkładów ekstremów zmiennych losowych byli
Fréchet (1927), Fisher i Tippet (1928), Gumbel (1935), von Mises (1936). Rozkład
GEV został wprowadzony przez Jenkinsona (1955) przez połączenie trzech rozkładów Fishera-Tippetta. Jest to asymptotyczny rozkład maksimów ciągów niezależnych zmiennych losowych o tym samym rozkładzie.
Rozkład GEV jest często stosowany w hydrologii i meteorologii do opisu zjawisk ekstremalnych (Katz i in. 2002; Renard i in. 2006; Tiago de Oliviera 1986),
a także we wskazaniach dotyczących metodyki obliczania przepływów maksymalnych prawdopodobnych w wielu krajach (CWC 2010; Kjeldsen 2008; USGS 1982).
Dystrybuanta tego rozkładu ma postać (Węglarczyk 2005):
Monografia KGW-PAN, z. XX, tom 1.indb 95
2014-09-05 07:46:31
96
A. Rutkowska, K. Banasik
F(x) =
{
)
(
exp ( – exp (– ))
–1
k
exp – (1 + k x–c
σ ) 1
jeśli k ≠ 0
x–c
σ1
jeśli k = 0
}
(1)
gdzie:
k ϵ R – parametr kształtu,
σ1 > 0 – parametr skali,
c ϵ R – parametr położenia, przy czym .
Jeśli k < 0, to x ϵ (– ∞, c – σk ], a jeśli k > 0, to x ϵ [c – σk , +∞). Przypadki k = 0, k > 0,
k < 0 odpowiadają rozkładom Fishera-Tippetta I, II, III. Rozkład ten jest też
zwany rozkładem Gumbela dla k = 0, Frécheta dla k > 0 oraz odwróconym rozkładem
Weibulla dla k < 0. Rozkład Frécheta jest ciężkoogonowy, gdyż jego funkcja gęstości
maleje do 0 wolniej niż dowolna funkcja wykładnicza. Przyjmowanie bardzo dużych wartości jest dla niego bardzo prawdopodobne. Jeśli jest on rzeczywistym rozkładem przepływów maksymalnych rocznych, to wskazuje na możliwe występowanie bardzo wysokich przepływów lub inaczej: na bardzo wysokie przepływy dla
długich okresów powtarzalności. Rozkład Gumbela, jako wykładniczy, ma lekki
prawy ogon i jego kwantyle są niższe niż Frécheta. Dlatego też, z punktu widzenia
estymowania przepływów maksymalnych prawdopodobnych, istotne jest rozróżnienie między przypadkami k = 0 i k > 0. W literaturze znanych jest kilka testów do weryfikacji hipotezy H : k = 0 przeciw HA : k > 0, także w kontekście przepływów i opadów (Otten, van Montfort 1978, Hosking 1984).
Rozkład uogólniony Pareto (GP) jest przedmiotem analizy w kontekście przepływów powyżej poziomu odcięcia (Madsen i in. 1997; Anderson, Meerschaert
1998; Renard i in. 2006; Onyutha,Willems 2013). W metodzie POT (Peak Over
Threshold), zwanej też metodą wszystkich wezbrań, rozważane są wszystkie przepływy, które przekroczyły pewną, z góry ustaloną wartość. Zastosowanie tego sposobu modelowania umożliwia wykorzystanie dodatkowych informacji, gdyż zwiększana jest liczebność próby oraz rozważane są chwile przekroczenia ustalonego
progu. Z twierdzenia udowodnionego niezależnie przez Balkema i de Haana oraz
Pickandsa (Beirland i in. 2005) wynika, że dla długich okresów obserwacji przepływy powyżej progu mogą być opisane rozkładem GP o dystrybuancie:
1
1
G(x) =
{
)
1 – exp (– )
(
–1
k
1– 1 + k x–u
jeśli k ≠ 0
σ x–u
σ
jeśli k = 0
}
(2)
gdzie:
σ > 0 – parametr skali,
k ϵ R – parametr kształtu, który zastosowany do przepływów POT jest teoretycznie
taki sam, jak parametr kształtu rozkładu GEV zastosowany do przepływów
AM,
u ϵ R – parametr położenia, przy czym x – u > 0.
Parametr k, podobnie jak w rozkładzie GEV, decyduje o grubości prawego ogo-
Monografia KGW-PAN, z. XX, tom 1.indb 96
2014-09-05 07:46:32
Parametr kształtu rozkładów GEV i GP przepływów maksymalnych...
97
na, a przy tym jest on niezmienniczy ze względu na wzrost progu. Prawy ogon rozkładu GP z k > 0 jest bardzo ciężki i opisuje ekstremalne zjawiska, z k < 0 jest lekki
(ucięty), a z k = 0 – wykładniczy. Stąd też wskazane jest badanie jego znaku. Problem
ten był przedmiotem wielu opracowań statystycznych (np. Davidson, Smith 1990;
Brilhante 2004), także w kontekście opadów (Gomes, van Montfort 1987; Groisman
i in. 2005; Kozubowski i in. 2008) i przepływów (van Montfort, Witter 1985; Smith
1989). W pracach Cunnane’a (1973, 1979) oraz Langa i in. (1999) przedstawiona
została obszerna metodologia modelowania POT dla przepływów. Polska literatura
o POT to np. prace Byczkowskiego i in. (2008), Strupczewskiego (1967) i Zielińskiej (1965).
Można pokazać teoretycznie, że jeśli rozkład przepływów POT jest wykładniczy o dystrybuancie G(x) = 1 – exp (– x–u
σ ) to rozkład AM jest rozkładem Gumbela
o dystrybuancie F(x) = exp (– μ · exp (– x–u
σ )), a jeśli rozkład POT jest GP z k ≠ 0, to
(
)
–1
k
rozkład AM jest GEV z dystrybuantą F(x) = exp – μ (1 + k x–u
(i vice versa),
σ ) gdzie μ jest średnią liczbąprzekroczeń progu w roku. Stąd mając rozkład przepływów POT, można oszacować przepływy maksymalne prawdopodobne, uwzględniając średnią liczbę przekroczeń w roku. Z powyższego wynika także, że teoretycznie
rozkłady GEV i GP mają taki sam parametr kształtu i dlatego jest on często oznaczany tym samym symbolem.
Celem pracy jest poznanie własności parametru kształtu rozkładów GEV i GP
przy użyciu metod statystycznych.
2. OBSZAR BADAŃ
Pierwszym badanym szeregiem czasowym przepływów były przepływy rzeki
Zagożdżonki w przekroju Płachty Stare. Rzeka płynie przez Puszczę Kozienicką
i jest lewym dopływem środkowej Wisły. Jej zlewnia ma typowo nizinny charakter.
Powierzchnia zlewni do przekroju Płachty wynosi 82,4 km2 przy czym około 24%
tego obszaru stanowią tereny nieaktywne hydrologicznie ze względu na lokalne depresje. Wpływa to znacząco na małą wartość współczynnika odpływu
(c = 0,17). Średnie roczne warstwy opadu i odpływu wynoszą odpowiednio 612
i 107 mm. Przepływy zwyczajne roczne w Płachtach wahają się od 0,11 do 0,37 m3 s-1.
Reżim hydrologiczny Zagożdżonki jest szczegółowo opisany w artykule Banasika
i in. (2013). Zlewnia ta od roku 1962 jest przedmiotem badań prowadzonych przez
Katedrę Inżynierii Wodnej SGGW w Warszawie. Przepływy maksymalne wyznaczone wg kryteriów AM i POT były przedmiotem kilku opracowań (m.in. Banasik,
Byczkowski 2007; Byczkowski i in. 2008). W bieżącym artykule poddano badaniu
przepływy POT oraz AM, a osobno maksima pochodzenia opadowego (zwykle
z półrocza letniego) i roztopowego (z półrocza zimowego) z okresu 1963-2012.
Drugi szereg tworzyły przepływy Dunajca w przekroju Nowy Targ. Dunajec
jest prawym dopływem Wisły i do przekroju Nowy Targ ma charakter rzeki górskiej. Obszar do przekroju ma powierzchnię 681 km2 i zawiera aż 25% zasobów
Monografia KGW-PAN, z. XX, tom 1.indb 97
2014-09-05 07:46:32
98
A. Rutkowska, K. Banasik
wodnych całej zlewni Dunajca, mimo że obejmuje tylko 16% jej powierzchni. Ta
część dorzecza charakteryzuje się dużą amplitudą stanów i wysokim spływem powierzchniowym. W Nowym Targu średni przepływ z wielolecia 1951-2012 wynosi
14,1 m3 s-1, a średnia roczna suma opadów – 915 mm. Poddano analizie przepływy
AM oraz POT z okresu 1951-2012. Dane dla Dunajca otrzymano od IMGW-PIB
w Warszawie.
3. METODY
Wstępna analiza każdego szeregu obejmowała badanie trendu przy pomocy
testów Manna-Kendalla (Kendall 1938; Mann 1945) oraz Coxa-Stuarta (McCuen
2003; Niedzielski, Kosek 2011; Rutkowska 2014), a także testu Pettitta na skokową
zmianę w średniej (Pettitt 1979; Kundzewicz, Robson 2004). Estymatory wszystkich parametrów rozkładu GEV oraz parametrów skali i kształtu rozkładu GP wyznaczano metodą największej wiarygodności.
We wszystkich testach przyjęto poziom istotności α = 0,05.
3.1. Test istotności parametru kształtu rozkładu GEV: przepływy AM
Zgodność rozkładu przepływów maksymalnych z rozkładem GEV sprawdzono
testem Andersona-Darlinga (AD).
Do testowania H : k = 0 przeciw HA : k > 0 zastosowano test wprowadzony przez
Ottena i van Montforta (1978). Został on wybrany spośród kilkunastu innych testów
przez Hoskinga (1984) jako mający dużą moc. Zakładamy uporządkowanie próby
x1 ≤ x2 ... ≤ xn. Procedura jest następująca:
( )
∆i = – ln – ln
–
∆=
i – 12
n + 1
– 2
n
1 ∑n
1
∑
∆i, σ∆2 =
(∆
– ∆)
i i=2
i=2
n – 1
n – 1
( ( ))
(
)
1 , m = – ln – ln i , l = xi – xi-1
m1 = – ln – ln n+1
i
n+1 i mi – mi-1 dla i = 2, ... , n
Statystyka testowa ma postać:
(
n
)( )
2
∑ li∆i –
σ
– ∆ · ∆
A = i=2
n
∑ i=2 li
n
Monografia KGW-PAN, z. XX, tom 1.indb 98
−
1
2
(3)
2014-09-05 07:46:32
Parametr kształtu rozkładów GEV i GP przepływów maksymalnych...
99
i – 1
i 2 oraz
Wielkości ∆i oraz mi są kwantylami rozkładu Gumbela rzędu n + 1 n + 1 a mierzy zależność między mi a wartościami z próby. Pierwszy czynnik A można, po
przekształceniu, wyrazić przez kowariancję w próbie(∆i, li), a drugi pełni rolę normalizacyjną. Statystyka A bada więc siłę zależności między próbą a kwantylami
rozkładu Gumbela. Wartość krytyczna dla n = 50 (100) wynosi 1,87 (1,89) (Otten,
van Montfort 1978).
3.2. Rozkład GP: przepływy POT
Aby zbadać adekwatność rozkładu GP, należało przeanalizować przepływy
POT, a przy tym (i) zapewnić niezależność zmiennych w szeregu czasowym oraz
(ii) dobrać odpowiedni próg.
3.2.1. Wybór progu odcięcia
Problem (ii) jest złożony, gdyż własności rozkładu GP zmieniają się wraz
z poziomem odcięcia. W szczególności, jeśli σu jest parametrem skali dla progu
u, to σv = σu + k (v – u) dla v > u, więc skala rośnie liniowo ze wzrostem progu. Dodatkowo wzrasta niepewność szacowania parametrów. W praktyce rozsądnym
wyborem jest próg dający średnio około 5 przekroczeń na rok (Lang i in. 1999),
a następnie obserwacja rozkładu przy zwiększającym się progu.
Niech X będzie przepływem ponad poziomem odcięcia u, a x1, ... , xn próbą
losową, przy czym x1 > u. Proces wyboru progu bazował na:
• warunkach zapewniających niezależność, tj. by między wezbraniami pojawił
się przynajmniej 1 raz średni przepływ dobowy z wielolecia (Banasik, Byczkowski 2007) oraz by w ostatecznym wyborze progu między wezbraniami minęło nie mniej niż 5 + log(P) dni, gdzie P – powierzchnia zlewni w mila2 (Lang
i in. 1999). Niezależność potwierdzano przy pomocy testu na istotność funkcji
autokorelacji cząstkowej PACF, mierzącej korelacje między zmiennymi w szeregu z pominięciem korelacji zmiennych pośrednich;
• funkcji określonej jako średnie wezbranie ponad próg (Mean Excess, w naukach ekonomicznych znanej jako średnia nadwyżka ponad próg), zdefiniowanej dla poziomu u przez
e(u) = E (X – u|X > u)
(4)
σ
k
+ 1 – k
u więc e jest liniowa. Stąd najDla rozkładu GP zachodzi e(u) = 1 – k lepszym wyjściowym poziomem odcięcia jest taki, od którego wykres estymatora tej funkcji jest w przybliżeniu liniowy. Estymatorem e(u) jest:
ˆ =
e(u)
•
∑ni=1 (xi – u) ·1{xi>u}
∑ni=1 1{xi>u}
wartościach estymatora parametru kształtu, które od pewnego u powinny się
stabilizować ze względu na niezmienniczość parametru kształtu rozkładu GP;
Monografia KGW-PAN, z. XX, tom 1.indb 99
2014-09-05 07:46:32
100
A. Rutkowska, K. Banasik
zgodności liczby przekroczeń progu z rozkładem Poissona. Dla dowolnego
przedziału czasowego o ustalonej długości, liczba wezbrań ponad próg powinna być rozkładem Poissona. Wykorzystano indeks dyspersji zdefiniowany jako
DU
ψ = EU dla dowolnej zmiennej U , a równy 1 dla rozkładu Poissona. Jeśli U jest
liczbą przekroczeń ustalonego progu w ciągu 1 roku, to zmienna ψ(N – 1) ma
(asymptotycznie) rozkład χ2 o N – 1 stopniach swobody, gdzie N – liczba lat
(Lang i in. 1999). Stąd wyznaczono dla każdego progu przedział ufności dla ψ.
• wyborze u = NWQ, gdzie NWQ = minimum AM (Banasik, Byczkowski 2007)
jako progu wyjściowym oraz obserwacji powyższych funkcji przy zmieniającym się u;
• warunku, by ostatecznie wybrany próg był mniejszy niż ZQW = mediana AM.
Po wyborze progu przeanalizowano wykres kwantyl-kwantyl, a testem AD
sprawdzono zgodność z rozkładem GP.
•
2
3.2.2. Test istotności parametru kształtu rozkładu GP
Test H : k = 0 przeciw HA : k ≠ 0 (ew. k > 0, k < 0) przy założeniu, że zmienna podlega rozkładowi GP, został zaczerpnięty z pracy Brilhante (2004). Zaletą testu jest
jego prostota. Statystyka testowa przy uporządkowanej rosnąco próbie ma postać:
V=
xn – xmed
xmed – x1
(5)
Brilhante (2004) wskazał test V jako mocniejszy od testu przedstawionego
przez Montforta i Wittera (1985), stosowanego w kontekście przepływów. Dwustronnym obszarem krytycznym jest zbiór (0;3,57] [11,79;+∞), a prawostronnym
(ew. lewostronnym) zbiór [10,73;+ ∞) (ew. (0;3,88]) dla n = 100. Przedziały te ulegają niewielkim zmianom dla n = 50 (Brilhante 2004).
∩
4. WYNIKI
Przeprowadzone testy nie wykazały istnienia trendu w żadnym z analizowanych szeregów.
4.1. Przepływy AM
W tablicy 1 podano wyniki analizy przepływów maksymalnych na Zagożdżonce oraz na Dunajcu. Test AD wskazał dużą zgodność z rozkładem GEV, gdyż wartość
p była równa co najmniej 0,78 dla każdego szeregu. Estymowany parametr k wahał
się dla Zagożdżonki od 0,35 do 0,98, a test A (wzór (3)) wskazał, że w każdym szeregu jest on istotnie większy od 0. Wynika stąd, że dla Zagożdżonki ciężkoogonowy
rozkład Frécheta lepiej opisuje rzeczywiste przepływy maksymalne niż lekkoogonowy Gumbela. Dla Dunajca wartość statystyki testowej A nie przekroczyła wartości
krytycznej, stąd rozkład Gumbela jest lepszym wyborem niż rozkład Frécheta.
Monografia KGW-PAN, z. XX, tom 1.indb 100
2014-09-05 07:46:32
Parametr kształtu rozkładów GEV i GP przepływów maksymalnych...
101
Tablica 1
Wartości estymatora parametru kształtu, wartości p testu AD oraz wartości
statystyki testowej A dla przepływów maksymalnych Zagożdżonki (Z.) oraz Dunajca (D.)
Maksima
Estymator parametru
kształtu
Wartości p
testu AD
Statystyka
testowa A
Roczne Z.
0,58
0,94
4,86
Roztopowe Z.
0,35
0,94
4,23
Deszczowe Z.
0,98
0,84
7,71
Roczne D.
0,20
0,78
0,98
4.2. Przepływy POT
Dla przepływów Zagożdżonki wybrano wyjściowy poziom odcięcia 0,63 m3 s-1,
który był najniższym z rocznych maksimów w okresie 1963-2012. Próba miała 306
elementów, co dało μ = 6,12 przewyższeń na rok. Następnie próg przesuwano od
0,7 do 4,5 co 0,1 m3 s-1, dokonując dla każdego poziomu analizy przedstawionej
w rozdziale 3.2.
Wartości funkcji autokorelacji PACF okazały się nieistotne już dla u = 0,7,
stąd nie było przeciwwskazań do uznania zmiennych za niezależne. Na rys. 1 przedstawiono wykres estymatora funkcji e. Jest on rosnący i zbliżony do liniowego, co
świadczy na korzyść rozkładu GP. Rys. 2 przedstawia zależność estymatora k od
u. Zauważalna jest jego stabilność dla u < 3,0 oraz pewna niestabilność dla u > 3,0,
co może świadczyć o nieadekwatności rozkładu GP. Przerywane linie wyznaczają
niepewność estymacji k.
Rys. 1. Wykres średniego wezbrania ponad próg, Zagożdżonka
Wartości indeksu ψ wahały się od 1,40 do 2,44 dla 0,63 ≤ u ≤ 4,5 i spełniały warunek Poissona tylko dla u = 1,60 oraz u = 2,40. Dla pozostałych progów wartości
indeksów ψ leżały poza 95% przedziałem ufności.
Ostatecznie wybrano próg u = 1,60 m3 s-1, który ograniczył liczebność szeregu
do 99 przepływów oraz dał μ = 1,98.
Monografia KGW-PAN, z. XX, tom 1.indb 101
2014-09-05 07:46:32
102
A. Rutkowska, K. Banasik
Rys. 2. Wykres zależności estymatora parametru kształtu od poziomu odcięcia, Zagożdżonka
Rys. 3 przedstawia wykres kwantyl-kwantyl dla rozkładu GP. Widoczna jest
idealna zgodność dla przepływów poniżej 8 m3 s-1 oraz duża niezgodność dla wyższych oraz to, że przepływy rzeczywiste powyżej 8 m3 s-1 są znacznie wyższe niż
estymowane, co może świadczyć o ciężkim ogonie rozkładu rzeczywistego. Test AD
wskazał zgodność z rozkładem GP (wartość p = 0,51). Zadecydowała o tym bardzo
dobra zgodność kwantyli dla przepływów mniejszych niż 8 m3 s-1, które stanowiły
ok. 93% próby. Wynika stąd, że przepływy POT dla Zagożdżonki z u = m3 s-1 można
opisać rozkładem GP, mając jednak na względzie możliwe duże błędy estymacji
wysokich kwantyli.
Testując wykładniczość (wzór (5)) przy HA : k > 0, otrzymano V = 16,63, leżące
w obszarze krytycznym. Tym samym stwierdzono istnienie ciężkiego ogona rozkładu.
Rys. 3. Wykres kwantyl-kwantyl dla Zagożdżonki rozkład GP z σ = 1,24, k = 0,44
Dla Dunajca wybrano najpierw 375 wezbrań przy u = NWQ = 33,3 m3 s-1,
a następnie próg przesuwano do u = 200 m3 s-1. Analiza wartości indeksu ψ wskazała
na spełnianie warunku Poissona dla wszystkich progów ponad 33,3 m3 s-1. Wykres
funkcji e był zbliżony do liniowego dla u < 100 m3 s-1 (silnie rosnący) oraz dla u > 100
Monografia KGW-PAN, z. XX, tom 1.indb 102
2014-09-05 07:46:33
Parametr kształtu rozkładów GEV i GP przepływów maksymalnych...
103
m3 s-1 (słabo malejący). Na rys. 4 widoczna jest oscylacja parametru k wokół 0 oraz
pewna jego stabilizacja dla u > 100 m3 s-1. Poziom u = 100 m3 s-1 był jednak zbyt wysoki, gdyż dostarczał tylko 58 wezbrań. Ostatecznie wybrano u = 90 m3 s-1, co dało
76 wezbrań (μ = 1,2). Rys. 5 przedstawia wykres kwantyl-kwantyl z rozkładem GP.
Zauważalna jest dość dobra zgodność kwantyli, nawet dla wysokich wezbrań. Test
AD nie zaprzeczył zgodności z rozkładem GP (wartość p = 0,12). Testując wykładniczość, otrzymano V = 4,40 leżące poza obszarem krytycznym. Stąd lekkoogonowy
rozkład wykładniczy poprawnie opisuje przepływy POT dla Dunajca przy u = 90 m3 s-1.
Rys. 4. Wykres zależności estymatora parametru kształtu od poziomu odcięcia, Dunajec
Rys. 5. Wykres kwantyl-kwantyl dla Dunacja rozkład GP z σ = 84,94, k = -0,10
5. PODSUMOWANIE
Testy parametru kształtu są praktycznym narzędziem do oceny, czy rozkład jest
lekko- czy ciężkoogonowy.
Przedstawione metody statystyczne umożliwiają analizę własności parametru
kształtu rozkładów GEV i GP dla szeregów AM i POT. Zaletą metody POT jest rozważanie dużej liczby wezbrań, a wadą – jej pewien subiektywizm.
Monografia KGW-PAN, z. XX, tom 1.indb 103
2014-09-05 07:46:33
104
A. Rutkowska, K. Banasik
Dla każdej rzeki uzyskano podobne wnioski o ciężkości ogona dla szeregów
AM i POT.
Zagożdżonka jest przykładem rzeki, dla której przepływy AM można opisać
rozkładem Frécheta, a przepływy POT – rozkładem GP, przy czym oba są ciężkoogonowe. Analizując przepływy POT, należy jednak zwrócić uwagę na niespełnianie warunku Poissona dla większości progów, co może świadczyć o istnieniu pewnej niejednorodności szeregu. Ponieważ testy nie wykazały istnienia trendu, zmiany
mają zapewne charakter bardziej nieregularny. Ich analiza w kontekście przepływów
POT wymaga osobnego opracowania.
Dunajec jest przykładem rzeki, dla której przepływy POT można opisać rozkładem wykładniczym, jako szczególnym przypadkiem GP. Spełnianie warunku Poissona
w okresie 62-letnim świadczy o stabilności warunków hydrologicznych w tej zlewni.
Przepływy AM na Dunajcu mogą być opisane przez rozkład GEV, ale wynik analizy
sugeruje jego szczególny przypadek, tj. rozkład Gumbela jako ostateczny wybór.
Przedstawiona metodologia POT może być także zastosowana do analizy innych charakterystyk hydrologicznych lub meteorologicznych.
THE SHAPE PARAMETER OF THE GEV AND GP DISTRIBUTIONS
OF ANNUAL MAXIMA AND PEAK OVER THRESHOLD DISCHARGES
– STATISTICAL ANALYSIS
Abstract
Identification of the annual maximum discharge (AM) distribution is fundamental in
flood frequency analysis. The Extreme Value Theory states that the asymptotic distribution of
maximum of iid variables is the Generalized Extreme Value (GEV) distribution, particularly
Fréchet, Gumbel or Reversed Weibull. They differ in the shape parameter which decides on
the thickness of the distribution tail. Therefore its estimation plays a crucial role in the assessment of flood discharges.
Flood discharges can also be estimated using flood peaks over a certain threshold
(POT). The POT method uses the Generalized Pareto (GP) distribution. The tail thickness of
the GP distribution is also expressed by the shape parameter.
In the study the statistical tests A and V for the shape parameters were presented and
applied to AM and POT discharges, respectively, to distinguish between the heavy- and lighttailed distributions. The investigation was carried out for the Zagożdżonka river and the
Dunajec river.
For each river the conclusions on the heaviness of the tails were similar for the AM
and POT discharges. The study revealed that the AM series in the Zagożdżonka river was
featured by a heavy tail. Additionally, the GP distribution with heavy tail was adequate to the
POT series. The POT discharge distribution in the Dunajec river was properly depicted by
the GP distribution and the test V indicated the light-tailed exponential distribution as a good
fit. The Gumbel distribution was identified as a proper parent distribution function of the AM
in the Dunajec river.
Key words: tests for shape of GEV and GP distributions, annual maxima, peak over threshold method.
Monografia KGW-PAN, z. XX, tom 1.indb 104
2014-09-05 07:46:33
Parametr kształtu rozkładów GEV i GP przepływów maksymalnych...
105
BIBLIOGRAFIA
Anderson P.L., Meerschaert M.M., 1998, Modeling river flows with heavy tails, Water Resources Research, 34 (9), 2271-2280
Beirland J., Goegebeur Y., Segers J., Teugels J., 2004, Statistics of Extremes, Theory and Applications,
Wiley, Chichester, UK
Banasik K., Byczkowski A., 2007, Probable annual floods in a small lowland river estimated with the
use of various sets of data, Annals of Warsaw University of Life Sciences – SGGW, Land Reclamation, 38, 3-10
Banasik K., Hejduk L., Hejduk A., Kaznowska E., Byczkowski A., 2013, Wieloletnia zmienność odpływu z małej zlewni rzecznej w regionie Puszczy Kozienickiej, Sylwan, 157 (8), 578-586
Brilhante M., 2004, Exponentiality versus generalized Pareto – a resistant and robust test, REVSTAT
– Statistical Journal, 2 (1), 2-13
Byczkowski A., Banasik K., Hejduk L., 2008, Obliczanie przepływów powodziowych o określonym
prawdopodobieństwie przekroczenia, Infrastruktura i Ekologia Terenów Wiejskich, 5, 199-208
Cunnane C., 1973, A particular comparison of annual maxima and partial duration series methods of
flood frequency prediction, Journal of Hydrology, 18, 257-271
Cunnane C., 1979, A note on the Poisson assumption in partial duration series models, Water Resources Research, 15 (2), 489-494
CWC, 2010, Development of Hydrological Design Aids (Surface Water) under Hydrology Project.
State of The Art Report, Central Water Commision, Ministry of Water Res., Gouvernment of India,
dostęp online 30.06.2014: www.cwc.gov.in/main/downloads/SAR%20Report%20of%20November%202010.pdf
Davidson A.C., Smith R.L., 1990, Models for exceedances over high thresholds, Journal of the Royal
Statistic Society, Series B, 52, 393-442
Fisher R.A., Tippett L.H.C., 1928, Limiting forms of the frequency distribution of the largest and smallest member of a sample, Proceedings of the Cambridge Philosophical Society, 24, 180-190
Fréchet M., 1927, Sur la loi de probabilité de l’écart maximum, Annales de la Société Polonaise de
Mathématique, 6
Gomes M.I., van Montfort M.A.J., 1987, Exponentiality versus generalized Pareto – quick tests, Statistical Climatology, 87, 185-195
Groisman P.Y., Knight R.W., Karl T.R., Hegerl G.C., 2005, Trends in intense precipitation in the climate record, Journal of Climate, 18, 1326-1350
Gumbel E.J., 1935, Les valeurs extrêmes des distributions statistiques, Annales de l’Institut Henri Poincaré, 5 (2), 115-158
Hosking J.R.M., 1984, Testing whether the shape parameter is zero in the generalized extreme-value
distribution, Biometrika, 71 (2), 367-374
Jenkinson A.F., 1955, The frequency distribution of the annual maximum (or minimum) of meteorological elements, Quarterly Journal of the Royal Meteorological Society, 81, 158-171
Katz R.W., Parlange M.B., Naveau P., 2002, Statistics of extremes in hydrology, Advances in Water
Resources, 25, 1287-1304
Kendall, M.G., 1938, A New Measure of Rank Correlation, Biometrika, 30, 81-93
Kjeldsen T.R., Jones D.A., Bayliss A.C., 2008, Improving the FEH statistical procedures for flood frequency estimation. Science Report: SC050050, Environment Agency, dostęp online 30.06.2014:
www.gov.uk/government/uploads/system/uploads/attachment_data/file/291096/scho0608boff-e-e.
pdf
Monografia KGW-PAN, z. XX, tom 1.indb 105
2014-09-05 07:46:33
106
A. Rutkowska, K. Banasik
Kozubowski T.J., Panorska I., Qeadan F., Gershunov A., Rominger D., 2008, Testing Exponentiality
Versus Pareto Distribution via Likelihood Ratio, Communications in Statistics – Simulation and
Computation, 38 (1), 118-139
Kundzewicz Z.W., Robson A.J., 2004, Change detection in river flow recordsreview of methodology,
Hydrological Sciences Journal, 49 (1), 7-19
Lang M., Ouarda T.B.M.J., Bobée B., 1999, Towards operational guidelines for over-threshold modeling, Journal of Hydrology, 225, 103-117
Mann, H.B., 1945, Nonparametric test against trend, Econometrica, 13, 245-259
Madsen H., Rasmussen P.F., Rosbjerg D., 1997, Comparison of annual maximum series and partial duration series methods for modeling extreme hydrologic events. 1. At-site modeling, Water Resources
Research, 33 (4), 747-757
McCuen R.H., 2003, Modeling Hydrologic Change, Statistical Methods, Lewis Publishers CRC Press
Niedzielski T., Kosek W., 2011, Minimum time span of TOPEX/Poseidon, Jason-1 and Jason-2 global
altimeter data to detect a significant trend and acceleration in sea level change, Advances in Space
Research, 47, 1248-1255
Onyutha C., Willems P., 2013, Uncertainties in flow-duration-frequency relationships of high and low
flow extremes in Lake Victoria basin, Water, 5, 1561-1579
Otten A, van Montfort M.A.J., 1978, The power of two tests on the type of distributions of extremes,
Journal of Hydrology, 37 (1-2), 195-199
Pettitt A.N., 1979, A non-parametric approach to the change-point problem, Journal of the Royal Statistical Society, Series C – Applied Statistics, 28 (2), 126-135
Renard B., Lang M., Bois P., 2006, Statistical analysis of extreme events in a nonstationary context
via a Bayesian framework: case study with peak-over-threshold data, Stochastic Environmental
Research and Risk Assessment, 21 (2), 97-112
Rutkowska A., 2014, Properties of the Cox-Stuart test for trend in application to hydrological series: the simulation study, Communications in Statistics – Simulation and Computation,
doi:10.1080/03610918.2013.78498 (in press)
Smith J.A., 1989, Regional flood frequency analysis using extreme order statistics of the annual peak
record. Water Resources Research, 25, 311-317
Strupczewski W. G., 1967, Determination of the probability of repeating phenomena, Acta Geophysica
Polonica, XV (2), 147-158
Tiago de Oliviera J., 1986, Extreme Values and Meteorology, Theoretical and Applied Climatology, 37,
184-193
USGS, 1982, Flood Flow Frequency, Bulletin #17B of the Hydrology Subcommittee, dostępu online
30.06.2014: http://water.usgs.gov/osw/bulletin17b/dl_flow.pdf
van Montfort M.A.J., Witter J.V, 1985, Testing exponentiality against generalized Pareto distribution,
Journal of Hydrology, 78 (3-4), 305-315
von Mises, R., 1936, La distribution de la plus grande de n valeurs, Revues in Mathematic Union
Interbalcanique, 1, 141-160
Węglarczyk S., 2005, Statystyka w inżynierii środowiska, Politechnika Krakowska, Kraków, 90-92
Zielińska M., 1965, Sposoby zestawiania danych hydrometeorologicznych dla opracowań statystycznych, Gospodarka Wodna, 7, 245-251
Adres do korespondencji – Corresponding author: dr Agnieszka Rutkowska, Uniwersytet Rolniczy,
Wydział Inżynierii Środowiska i Geodezji, Katedra Zastosowań Matematyki, 30-198 Kraków, ul. Balicka 253C, e-mail: [email protected]
Monografia KGW-PAN, z. XX, tom 1.indb 106
2014-09-05 07:46:33

Podobne dokumenty