funkcja rozkładu

Transkrypt

funkcja rozkładu
Zeszyty
Naukowe nr
726
Akademii Ekonomicznej w Krakowie
2006
Sławomir Śmiech
Katedra Statystyki
Analiza zależności ekstremalnych
1. Wprowadzenie
W dobie globalizacji gospodarki zarządzający ryzykiem w instytucjach finansowych stoją przed nowymi wyzwaniami. Kryzysy w jednych częściach świata
mają negatywne i nierzadko natychmiastowe konsekwencje dla rynków w innych
częściach. Załamanie kursów na giełdach w Azji może powodować spadki cen
w Europie lub Ameryce. Dlatego aby zabezpieczyć się przed stratą wartości portfela, zarządzający ryzykiem nie mogą ograniczać się do wyboru instrumentów
z różnych sektorów czy rynków, ale muszą również analizować, czy pomiędzy
nimi nie zachodzą tzw. ekstremalne zależności, które oznaczają równoczesny
ekstremalny ruch cen.
W niniejszym artykule przedstawiono elementy teorii wartości ekstremalnych,
które mogą być wykorzystywane w szacowaniu i analizowaniu zależności ekstremalnych. Twierdzenia przedstawione w pracy zostaną zilustrowane przykładem,
w którym wykorzystano procedurę analizy ekstremalnych zależności pomiędzy
indeksami giełdowymi WIG20 i Dow Jones.
2. Elementy teorii wartości ekstremalnych
Teoria wartości ekstremalnych (TWE) jako gałąź statystyki opisuje graniczne
własności wartości ekstremalnych. Klasyczne podejście charakteryzuje zachowanie normalizowanych maksimów zmiennych losowych i może być sformułowane
w postaci niżej podanego twierdzenia [Coles 2001].
Twierdzenie 1. Niech X1, …, X n będą zmiennymi losowymi niezależnymi
o takim samym rozkładzie z dystrybuantą F. Oznaczmy Mn := max(X1, …, Xn).
ZN_726.indb 91
1/30/08 12:58:40 PM
Sławomir Śmiech
92
Niech an, bn będą takimi ciągami, że dla pewnej dystrybuanty G zachodzi:
lim P
n
M n bn
an
x = G(x),
Wtedy G jest jedną z dystrybuant typu:
– Frechet
0,
(x) =
exp x
– Weibull
(
(x) =
exp
1,
(
( x)
R.
0
x
),
x
x > 0,
),
>0
(1)
x<0
0,
x
>0
(2)
(3)
– Gumbel
(
)
Λ(x) = exp −x − x ,
(4)
x ∈ R.
Powyższe dystrybuanty są nazywane dystrybuantami wartości ekstremalnych.
Możliwe jest przedstawienie powyższych funkcji w syntetycznej postaci, zwanej
dystrybuantą uogólnionego rozkładu wartości ekstremalnych (generalized extreme
value distribution, GEV):
H
,μ,
(x) =
exp
1
,
0
+
exp
1+
x μ
exp
x μ
,
x
R ,
(5)
=0
gdzie: x+ = max(x, 0).
Przypadek:
1
,
α
1
ξ < 0 odpowiada rozkładowi Weibulla, gdzie ξ = − ,
α
ξ = 0 odpowiada rozkładowi Gumbela.
Modelowanie zachowania normalizowanych maksimów w praktyce realizuje
się poprzez wykorzystanie maksimów zmiennych w rozłącznych przedziałach
czasu (metody te są nazywane metodami blokowymi) – w kolejnych miesiącach,
kwartałach czy latach.
ξ > 0 odpowiada rozkładowi Frecheta, gdzie ξ =
ZN_726.indb 92
1/30/08 12:58:43 PM
Analiza zależności ekstremalnych
93
Podobnie jak w przypadku jednowymiarowym, wielowymiarowy rozkład
wartości ekstremalnych może być opisywany metodami blokowym. Niech (X1, Y1),
(X2, Y2), … oznacza ciąg niezależnych wektorów o rozkładzie z dystrybuantą F(x, y).
W wypadku opisu dystrybuanty F metodami blokowymi należy oznaczyć:
(
)
M x, n = max { Xi } , M y, n = max {Yi } , M n = M x, n , M y, n .
i=1, …, n
i=1, …, n
(6)
Wektor Mn jest wektorem, którego składowymi są maksymalne wartości zmiennych losowych X i Y. Opis wielowymiarowego rozkładu wartości ekstremalnych
jest najprostszy w przypadku, gdy rozkłady brzegowe są standaryzowanymi
rozkładami Frecheta. Standaryzacji tej dokonuje się dzieląc wektor Mn przez n.
(
)
Rozważa się zatem wektor M n = M x, n n , M y, n n . Poniższe twierdzenie opisuje
wielowymiarowego rozkładu wartości ekstremalnych, w przypadku gdy n → ∞.
*
(
)
Twierdzenie 2 [Coles 2001]. Niech wektor M n* = M x,* n , M y,* n , gdzie (Xi, Yi ) są
niezależne, będzie miał składowe brzegowe opisywane standaryzowanym rozkładem Frecheta. Wtedy, jeśli:
to
Pr((M x,* n < x, M y,* n , y) → G(x, y),
(7)
G ( x, y ) = exp –V ( x, y ) , x > 0, Y > 0,
(8)
{
gdzie:
1
V (x, y) = 2 max
0
}
x 1 w
,
dH (w),
w
y
(9)
a H jest dystrybuantą spełniającą warunek:
1
∫ wdH (w) = 0, 5.
0
(10)
Dystrybuanty spełniające warunek (8) są nazywane dwuwymiarowymi dystrybuantami wartości ekstremalnych. W odróżnieniu od przypadku jednowymiarowego,
gdzie opis jednowymiarowej dystrybuanty ograniczał się do trzech typów (Frechet, Gumbel, Weibull) wielowymiarowy rozkład jest opisywany poprzez możliwe
warianty dystrybuanty H. Dowolna dystrybuanta spełniająca warunek (10) (takich
dystrybuant jest nieskończenie wiele) generuje kolejne typy funkcji G, zatem
w przypadku wielowymiarowym nie ma skończonej liczby rodzin generujących
wszystkie możliwe typy wielowymiarowych rozkładów wartości ekstremalnych.
W praktyce postać dystrybuanty G jest szczególnym przypadkiem funkcji należą-
ZN_726.indb 93
1/30/08 12:58:47 PM
Sławomir Śmiech
94
cych do jednej ze znanych rodzin dystrybuant wartości ekstremalnych. Najpopularniejszą z nich jest rodzina rozkładów logistycznych dana formułą:
G(x, y) = exp
x
1
+y
1
, x, y > 0,
(0, 1).
(11)
Zaletą takiego opisu jest możliwość zaobserwowania i łatwej interpretacji zależności pomiędzy badaną parą zmiennych. W przypadku gdy α → 1, badane
zmienne są niezależne, gdy α → 0, występuje przypadek dodatniej zależności
pomiędzy zmiennymi. Innymi rodzinami opisującymi dystrybuantę G są: model
bilogistyczny, model Dirichleta [Coles 2001, s. 147], w których nie zakłada się
symetrycznej zależności pomiędzy badanymi zmiennymi.
Alternatywą do stosowania wyżej przedstawionych metod modelowania wielowymiarowego rozkładu wartości ekstremalnych jest użycie funkcji połączeń
(copula function). Funkcje połączeń to dystrybuanty wielowymiarowych rozkładów
jednostajnych. W wypadku gdy rozważany jest wektor (X1, …, Xn ) o dystrybuancie F, to o ile wszystkie jednowymiarowe rozkłady brzegowe F1, …, Fn są ciągłe,
wówczas istnieje jedyna funkcja połączeń CF rozkładu F, taka że (tw. Sklara, 1959)
[Embrechets, Lindskog, McNeil 2001]:
F ( x1 , …, xn ) = CF F ( x1 ) , …, F ( xn ) .
(
)
(12)
Ponieważ funkcja połączeń nie zależy od rozkładów brzegowych, więc zawiera
wszystkie informacje dotyczące zależności pomiędzy składnikami wektora
(X1, …, Xn ). Możliwość wykorzystania funkcji połączeń w analizie wielowymiarowego rozkładu wartości ekstremalnych, w przypadku gdy rozważane są maksima
blokowe, przedstawia poniższe twierdzenie [Bouye 2002].
(
)
Twierdzenie 3. Niech M n = M x1 , n , …, M xd , n =
max X1, k , …, max Xd, k ,
k=1, …, n
k=1, …, n
gdzie (X1, n, …, Xd, n ) jest wektorem losowym o rozkładzie F, dystrybuantach brzegowych F1, …, Fd oraz funkcji połączenia C. Wówczas warunek:
lim P
n
M x1 , n
a1, n
b1, n
x1 , …,
M xd , n
ad, n
bd , n
xd
(x1, …, xd ) R d , a j, n > 0
= G (x1 , …, xd ),
(13)
Wykorzystanie funkcji połączeń w metodach progowych analizy wartości ekstremalnych
zawiera np. praca [Yamai, Yoshiba 2002].
ZN_726.indb 94
1/30/08 12:58:50 PM
Analiza zależności ekstremalnych
95
zachodzi wtedy i tylko wtedy, gdy:
1. Dla każdego j = 1, …, d istnieją aj, n, bj, n i dystrybuanta graniczna Gj , takie
że:
lim P
n
M x j , n b j,n
a j, n
x j = G j (x j ),
x
R.
(14)
2. Istnieje funkcja połączenia C∞, taka że:
C∞ (u1 , …, ud ) = lim C n (u11/n , …, u1/n
d ).
n→∞
(15)
Jeżeli powyższe warunki są spełnione, zachodzi równość:
G∞ (x1 , …, xd ) = C∞ ( G1 (x1 ), …, Gd (xd )) .
Funkcja połączenia, dla której spełniony jest warunek:
C(u1t , …, u Nt ) = C t (u1 , …, u N ),
(16)
(17)
nazywana jest funkcją połączenia dla wartości ekstremalnych (extreme value
copula).
Analogicznie jak w przypadku klasycznego modelowania wielowymiarowej
dystrybuanty wartości ekstremalnych, nie istnieje skończona liczba rodzin funkcji
połączeń dla wartości ekstremalnych.
3. Wybór optymalnej funkcji połączenia
Wielowymiarowy rozkład zmiennej losowej może być reprezentowany przez
dystrybuanty brzegowe oraz funkcję połączeń. Wybór odpowiedniej funkcji
połączeń sprowadza się do wytypowania najlepszej funkcji spośród skończonego
zbioru kandydatów S (który jest podzbiorem zbioru wszystkich możliwych funkcji
połączeń). Optymalna, najlepsza funkcja to ta, której odległość, mierzona np. odległością opartą na normach L p od empirycznej funkcji połączeń, jest najmniejsza
spośród wszystkich dystrybuant w zbiorze S.
W celu rozpoczęcia procesu porównywania odległości pomiędzy funkcjami
połączeń należy wyznaczyć empiryczną funkcję połączenia. Problem pojawiający
się w tym miejscu polega na tym, że skończona próba wyznacza empiryczne dystrybuanty brzegowe będące funkcjami skokowymi, z czego wynika, że funkcja
połączenia opisująca zależności pomiędzy zmiennymi brzegowymi nie jest określona w sposób jednoznaczny (tw. Sklara). Może się wiec zdarzyć, że różne funkcje połączeń brane ze zbioru kandydatów są „najbliższe” różnym empirycznym
ZN_726.indb 95
1/30/08 12:58:52 PM
Sławomir Śmiech
96
funkcjom połączeń. Aby ominąć tę niejednoznaczność, P. Deheuveles w 1979 r.
zaproponował następującą definicję [Durrleman 2000].
Definicja 1. Niech X =
T
{( x , x )}
t
1
t
2
t =1
będzie próbą pochodzącą z wektora loso-
wego (X1, X2) o dystrybuantach brzegowych odpowiednio F1, F2 i funkcją połączenia C. Dwuwymiarową empiryczną funkcją połączenia na kracie L, gdzie:
t1 t2
,
: t n = 0, …, T T T
L=
nazywa się funkcję postaci:
Ĉ (T )
t1 t2
1
,
=
T T
T
T
t =1
1 xt
1
(
x1( t ) , x2t x2(t )
(18)
,
(19)
)
gdzie xi(t ) jest t-tą kolejną obserwacją w ciągu xi(1) , xi(2) , …, xi(n) , gdzie xi(k ) jest
(
)
elementem próby, dla którego
≤
≤
, i ∈ {1, 2} .
Tak zdefiniowana funkcja połączenia nie zależy od rozkładów brzegowych
xi(1)
(
xi(2)
… ≤ xi(n)
)
i jest zbieżna do dystrybuanty C Ĉ(T ) → C .
4. Szacowanie asymptotycznej zależności
W celu określenia zależności w ogonie rozkładu dwuwymiarowej zmiennej
losowej analizuje się tzw. współczynnik zależności górnego ogona (analogicznie
bada się zależność dolnego ogona) dany jako:
χ = lim Pr { F1 (X) > u | F2 (Y ) > u }
u→1
lub w alternatywnej postaci:
= lim 2
u
1
log Pr ( FX (X) < u, FY (Y ) < u )
.
log u
(20)
(21)
Współczynnik ten mierzy prawdopodobieństwo wystąpienia zdarzenia ekstremalnego jednej zmiennej pod warunkiem wystąpienia zdarzenia ekstremalnego
dla drugiej.
Definicja 2. Zmienne losowe są asymptotycznie niezależne, gdy współczynnik
zależności górnego ogona jest równy zeru.
Zmienne losowe są asymptotycznie zależne, gdy χ > 0, a wzrost natężenia
zależności jest tożsamy ze wzrostem wartości χ.
ZN_726.indb 96
1/30/08 12:58:57 PM
Analiza zależności ekstremalnych
97
Asymptotyczna niezależność występuje dla bogatej klasy rozkładów. Przykładem jest dwuwymiarowy rozkład normalny, którego zmienne są skorelowane,
a współczynnik korelacji zawiera się w przedziale (–1, 1). Dla tego rozkładu niemożliwe jest wystąpienie skrajnie dużych wartości dla obu zmiennych brzegowych
jednocześnie. Mimo to dla współczynnika korelacji, którego wartość bezwzględna
jest bliska jedności, występowanie zależności można zaobserwować nie tylko
w jądrze rozkładu, ale także na „umiarkowanie” ekstremalnym poziomie [Coles
2001, s. 168]. Dlatego też, aby badać natężenie zależności w klasie rozkładów
asymptotycznie niezależnych, wprowadza się następujący miernik:
= lim
u
1
2 log(1 u)
1 .
log Pr(FX (X) > u, FY (Y ) > u)
(22)
W przypadku gdy zmienne są asymptotycznie niezależne, χ = 0, zaś χ ∈ [−1, 1)
wskazuje na natężenie zależności ekstremalnej. Jeśli np. rozważany jest dwuwymiarowy rozkład normalny, wówczas wartość χ jest równa współczynnikowi
korelacji pomiędzy zmiennymi brzegowymi. Dla zmiennych asymptotycznie
zależnych miernik χ przyjmuje wartość 1 i natężenie zależności ekstremalnych
jest wskazywane przez wartość χ.
Ponieważ funkcje połączeń niosą ze sobą wszystkie informacje dotyczące
zależności pomiędzy zmiennymi losowymi, których rozkłady opisują, można
więc przy ich użyciu badać zależności asymptotyczne. Mierniki χ i χ mogą zostać
wyrażone w języku funkcji połączeń w następujący sposób:
= lim 2
u 1
= lim
u 1
1 C(u, u)
1 u
ln(1 u)2
1 .
ln(1 2u + C(u, u))
(23)
(24)
Analiza pary (χ i χ) daje pełny obraz formy i natężenia asymptotycznej zależności.
5. Przykład empiryczny
W niniejszym przykładzie elementy TWE i analiza funkcji połączeń zostaną
wykorzystane w celu określenia formy i oszacowania natężenia zależności ekstremalnych. Dane użyte w przykładzie to logarytmiczne stopy zwrotów wartości
indeksów Dow Jones i WIG20 z okresu od 3 stycznia 1995 r. do 28 listopada 2003 r.
W celu uzyskania porównywalności dane zostały zestandaryzowane. Na rys. 1
ZN_726.indb 97
1/30/08 12:59:00 PM
Sławomir Śmiech
98
b)
600
–10 –5 0
1400
5 10
2200
a)
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
d)
–6 –4 –2 0 2 4 6
4000 6000 8000
1100
c)
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Rys. 1. a) Wartość indeksu WIG20 na zamknięciu w badanym okresie, b) Logarytmiczne
standaryzowane stopy zwrotu indeksu WIG20, c) Wartość indeksu Dow Jones na
zamknięciu w badanym okresie, b) Logarytmiczne standaryzowane stopy zwrotu indeksu
Dow Jones
Źródło: opracowanie własne.
przedstawiono wykresy wartości badanych indeksów, a także analizowane logarytmiczne standaryzowane stopy zwrotów.
Parametry rozkładu ogonów zmiennych losowych opisujących ujemne zmiany
wartości indeksów (oznaczone symbolem „min”) oszacowano metodą największej
wiarygodności przy użyciu metody blokowej. Obserwacje zostały podzielone na
107 podokresów, odpowiadających kolejnym miesiącom. Wyniki estymacji parametrów uogólnionej dystrybuanty wartości ekstremalnych (wzór (5)) przedstawia
tabela 1.
Tabela 1. Wyniki estymacji parametrów uogólnionej dystrybuanty wartości
ekstremalnych dla badanej pary indeksów
Parametr
WIG20 min
Dow Jones min
μ̂
2,581
1,5419
σ̂
1,263
0,7863
ξ̂
0,1397
0,1141
Źródło: obliczenia własne.
ZN_726.indb 98
1/30/08 12:59:06 PM
Analiza zależności ekstremalnych
99
Parametr kształtu ξ uogólnionej dystrybuanty wartości ekstremalnych dla
badanych spadków indeksów jest dodatni, co oznacza, że rozkłady analizowanych
zmiennych mają grube ogony.
WIG20
12
8
4
0
0
1
2
3
4
Dow Jones
5
6
7
Rys. 2. Diagram korelacyjny maksymalnych logarytmicznych standaryzowanych zmian
indeksów Dow Jones i WIG20
Źródło: opracowanie własne.
Rozkład dwuwymiarowy maksymalnych spadków badanych indeksów, które
zostały przedstawione na rys. 2, zostanie opisany funkcją połączenia. Przedstawiony diagram korelacyjny wskazuje na niewielki stopień zależności, chociaż
z drugiej strony, największe spadki wartości badanych indeksów występowały
w tych samych okresach. W celu wybrania optymalnej funkcji połączenia stworzony został zbiór kandydatów S. Elementami zbioru S są wybrane funkcje połączeń
dla wartości ekstremalnych oraz (dla porównania) funkcja połączenia normalnego
(niespełniająca warunku (17)). Nazwy funkcji połączeń, których parametry będą
oszacowane, są przedstawione wraz z ich dystrybuantami w tabeli 2.
Oceny parametrów funkcji połączeń otrzymane metodą największej wiarygodności zostały przedstawione w tabeli 3.
W celu wybrania najlepszej dystrybuanty oszacowane funkcje zostały porównane do empirycznej funkcji połączenia zdefiniowanej na następującej kracie:
i
j
L=
,
: i, j {1, …, 107} . Odległość użyta do porównania (oparta na
107 107
normie L2 w dyskretnej wersji) ma następującą postać:
ZN_726.indb 99
1/30/08 12:59:08 PM
Sławomir Śmiech
100
d(Ci , Ĉ) =
107 107
i
j
Ci
,
107 107
2
i
j
Ĉ
,
107 107
i=1 j=1
gdzie:
Ci – funkcja połączenia należąca do zbioru S,
,
(25)
Ĉ – empiryczna funkcja połączenia.
Tabela 2. Dystrybuanty funkcji połączeń – elementy zbioru kandydatów S
Funkcja połączenia
C(u, v)
exp
(u
uv exp
(u
Gumbel
Galambos
exp
bb5
u +v
C⊥
(u
)
+v
1
+v
)
1
)
+v
1
1
uv
(
Φβ Φ −1 (u), Φ −1 (v)
Normalna
)
Źródło: opracowanie własne.
Tabela 3. Oceny parametrów funkcji połączeń i odległości dystrybuant od empirycznej
funkcji połączeń
Funkcja połączenia
Gumbel
Galambos
bb5
C⊥
Normalna
Parametry
1,287
0,559
(1, 0,55)
–
0,338
Odległość
1,844
1,840
1,840
12,254
2,737
Źródło: obliczenia własne.
Odległość dystrybuant kandydatów od dystrybuanty empirycznej podano
w tabeli 3. Wyniki przedstawione w tabeli dowodzą, że dystrybuanty Gumbela,
Galambosa oraz bb5 są niemal tak samo odległe od empirycznej funkcji połączenia. Większy dystans od „wzorca” dzieli dystrybuantę połączenia normalnego.
Zdecydowanie najdalej od porównywanej dystrybuanty znalazła się funkcja
ZN_726.indb 100
1/30/08 12:59:11 PM
Analiza zależności ekstremalnych
101
połączenia odpowiadająca za przypadek niezależności zmiennych brzegowych.
W interpretacji zostanie użyta dystrybuanta Galambosa. Ponieważ oszacowany
parametr β jest większy od zera, należy przyjąć, że opisywane maksymalne spadki
badanych indeksów są asymptotycznie zależne. Natężenie ekstremalnej zależności
oszacowane zostało zatem za pomocą wzoru (23) i wyniosło 0,29.
6. Podsumowanie
Określanie formy i natężenia asymptotycznej zależności pomiędzy składnikami
portfela wydaje się niezbędne w bezpiecznym i skutecznym zarządzaniu ryzykiem. Metodologia przedstawiona w niniejszym artykule pozwala badać zależność
w ogonach rozkładów w przypadkach występowania zależności i niezależności
asymptotycznej, przez co wydaje się bardzo skuteczna w kontekście zastosowań.
Literatura
Bouye E. [2002], Multivariate Extremes at Work for Portfolio Risk Management, preprint.
Coles S.G. [2001], An Introduction to Statistical Modeling of Extreme Values, Springer,
London.
Durrleman V., Nikeghbali A., Roncalli T. [2000], Which Copula is the Right One?, preprint.
Embrechets P., Lindskog F., McNeil A. [2001], Modelling Dependence with Copulas and
Applications to Risk Management, Report, ETHZ, Zurich.
Statystyczne metody oceny ryzyka w działalności gospodarczej [1998], red. A. Zeliaś,
Wydawnictwo AE w Krakowie, Kraków.
Yamai Y., Yoshiba T. [2002], Comparative Analyses of Expected Shortfall and Value-at-Risk
under Market Stress, preprint.
An Analysis of Extreme Correlations
Determining the form and intensity of asymptotic correlation among portfolio
components is crucial to safe and effective risk management. In this article, the author
reviews extreme value theory and analyses the function of connections that enable the
form and intensity of correlations in distribution tails to be estimated. The author presents
indicators that afford a complete description of the correlations divided into asymptotically
dependent and independent distributions. The article includes a translation of the theory
used to determine the extreme correlations between the WIG20 and Dow Jones stock
market indices.
ZN_726.indb 101
1/30/08 12:59:11 PM

Podobne dokumenty