Detekcja rozkładów o ciężkich ogonach

Transkrypt

Detekcja rozkładów o ciężkich ogonach
Detekcja rozkładów o cieżkich
˛
ogonach
J. Śmiarowska, P. Jamer
Wydział Matematyki i Nauk Informacyjnych
Politechnika Warszawska
24 kwietnia 2012
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
1 / 40
Spis treści
1
Rozkłady o cieżkich
˛
ogonach
Informacje wstepne
˛
Rodzina podwykładnicza
Rozkłady typu Pareto
2
Detekcja rozkładów o grubych ogonach
Analiza problemu
Wykresy kwantylowe
Empiryczna średnia nadwyżka
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
2 / 40
Spis treści
1
Rozkłady o cieżkich
˛
ogonach
Informacje wstepne
˛
Rodzina podwykładnicza
Rozkłady typu Pareto
2
Detekcja rozkładów o grubych ogonach
Analiza problemu
Wykresy kwantylowe
Empiryczna średnia nadwyżka
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
3 / 40
Definicja
Rozkład o lekkim ogonie
Niech X bedzie
˛
nieujemna˛ zmienna˛ losowa˛ o dystrybuancie F .
Zmienna losowa X ma rozkład o lekkim ogonie przy x → ∞, jeśli
(∃A, b > 0) (∃x0 > 0) (∀x ≥ x0 ) F (x) ≤ Ae−bx .
Rozkład o cieżkim
˛
ogonie
Nieujemna zmienna losowa X ma rozkład o cieżkim
˛
ogonie przy
x → ∞, jeśli nie ma rozkładu o lekkim ogonie.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
3 / 40
Warunek równoważny
Twierdzenie
Zmienna losowa nieujemna X ma cieżki
˛
ogon wtedy i tylko wtedy, gdy
(∀t > 0) MX (t) = ∞.
Dowód:
Pokażemy, że zmienna losowa ma lekki ogon wtedy i tylko wtedy, gdy
(∀t < t0 ) MX (t) < ∞.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
4 / 40
Warunek równoważny
(⇒) Z założenia mamy, że istnieja˛ A, b, x0 > 0 takie, że
(∀x ≥ x0 ) F (x) ≤ Ae−bx .
Zatem mamy
MX (t) = E e
tX
Z
∞
Z
tx
e dF (x) = −
=
0
∞
= −etx F (x) 0 + t
∞
etx dF (x) =
0
Z
∞
F (x) etx dx < ∞,
0
bo dla odpowiednio małych t :
limx→∞ etx F (x) ≤ limx→∞ etx Ae−bx = limx→∞ Ae(t−b)x = 0,
R∞
R ∞ −bx tx
R∞
tx
e dx = 0 Ae(t−b)x dx < ∞.
0 F (x) e dx ≤ 0 Ae
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
5 / 40
Warunek równoważny
(⇐) Załóżmy nie wprost, że zachodzi
(∀t ≤ t0 ) MX (t) < ∞,
ale zmienna losowa nie ma lekkiego ogona.
Zatem
(∀A, b > 0) (∀x0 > 0) (∃x ≥ x0 ) F (x) > Ae−bx .
Wówczas
∞
MX (t) = −etx F (x) 0 + t
Z
∞
F (x) etx dx < ∞,
0
ale dla t > b
h
i
h
i
lim etx F (x) ≥ lim etx Ae−bx = lim Ae(t−b)x = ∞.
x→∞
x→∞
x→∞
Zatem MX (t) = ∞, co prowadzi do sprzeczności.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
6 / 40
Twierdzenie
Definicja
Niech
− ln F (x)
,
x
x→∞
αF := lim sup
gdzie F (0−) = 0, F - dystrybuanta.
Twierdzenie
Załóżmy, że αF = 0, wówczas F ma cieżki
˛
ogon.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
7 / 40
Twierdzenie
Dowód:
Niech αF = 0. Wówczas
(∀ε > 0) ∃x 0 > 0
∀x ≥ x 0 − ln F (x) ≤ εx.
Zatem po przeskalowaniu
(∀x ≥ 0) F (x) ≥ ce−εx ,
a stad
˛
Z
(∀s ≥ ε)
∞
esx F (x) dx = ∞.
0
Z dowolności ε dostajemy, że F ma cieżki
˛
ogon.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
8 / 40
Przykłady
Rozkład Lognormalny
Rozkład Lognormalny
Y ∼ etX , X ∼ N µ, σ 2
Policzmy k -ty moment Y :
1 2 2 2
mk ,Y = E Y k = E ektX = MX (kt) = eµkt+ 2 σ k t .
Zatem
∞
X
mk ,Y
k =0
k!
t k = ∞.
Co jest równoważne temu, że nie istnieje
MY (t) , t > 0.
Zastosowanie: ubezpieczenia komunikacyjne.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
9 / 40
Przykłady
Rozkład Weibulla
Rozkład Weibulla
X ∼ W (r , c) ,
r
F (x) = e−cx , x > 0, c > 0.
Bezpośrednio z definicji widać, że
gdy r ≥ 1, to rozkład Weibulla ma lekki ogon,
gdy r < 1, to rozkład Weibulla ma cieżki
˛
ogon.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
10 / 40
Przykłady
Rozkład Pareto
Rozkład Pareto
X ∼ Par (α, c) ,
c α
F (x) =
,x > c
x
Bezpośrednio z definicji widać, że rozkład ma cieżki
˛
ogon.
Zastosowanie: ubezpieczenia przeciwpożarowe.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
11 / 40
Spis treści
1
Rozkłady o cieżkich
˛
ogonach
Informacje wstepne
˛
Rodzina podwykładnicza
Rozkłady typu Pareto
2
Detekcja rozkładów o grubych ogonach
Analiza problemu
Wykresy kwantylowe
Empiryczna średnia nadwyżka
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
12 / 40
Rodzina podwykładnicza
Definicja
Dystrybuanta F , F (0−) = 0, jest podwykładnicza, jeśli
∗2
F (x)
lim
= 2.
x→∞ F (x)
Oznaczenie: F ∈ S.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
12 / 40
Twierdzenie
Twierdzenie
Jeśli F ∈ S, to F ma cieżki
˛
ogon.
Lemat
Niech F ∈ S. Wówczas dla każdego x 0 > 0 :
1
limx→∞
2
limx→∞
F (x−x 0 )
F (x)
Rx
0
= 1,
F (x−y )
dF
F (x)
(y ) = 1.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
13 / 40
Twierdzenie
Dowód:
Niech F ∈ S. Przyjmijmy m (x) := − ln F (x) . Wówczas z
wcześniejszego twierdzenia wynika, iż wystarczy pokazać, że
m (x)
= 0.
x
x→∞
αF = lim sup
Z lematu mamy, że dla każdego x 0 > 0 :
F (x − x 0 )
= 1.
x→∞
F (x)
lim
Co dla każdego x 0 > 0 daje nam
lim ln F x − x 0 − ln F (x) = lim m (x) − m x − x 0 = 0.
x→∞
x→∞
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
14 / 40
Twierdzenie
Zatem
(∀ε > 0) (∃x0 > 0) (∀x ≥ x0 ) m (x) − m (x − 1) < ε.
Wynika stad,
˛ że
m (x) ≤ m (x − 1) + ε ≤ m (x − 2) + 2ε ≤ . . . ≤ m (x − n) + nε,
gdzie x0 ≤ x − n < x0 + 1.
Możemy wiec
˛ ogólniej napisać
m (x) ≤
sup
x0 ≤x 0 ≤x0 +1
m x 0 + (x − x0 ) ε, x ≥ x0 .
Ostatecznie z dowolności ε dostajemy
lim
x→∞
m (x)
= 0.
x
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
15 / 40
Spis treści
1
Rozkłady o cieżkich
˛
ogonach
Informacje wstepne
˛
Rodzina podwykładnicza
Rozkłady typu Pareto
2
Detekcja rozkładów o grubych ogonach
Analiza problemu
Wykresy kwantylowe
Empiryczna średnia nadwyżka
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
16 / 40
Rozkłady typu Pareto
Definicja
Powiemy, że funkcja L : [0, ∞) → (0, ∞) jest wolno zmieniajac
˛ a˛ sie˛
funkcja˛ przy x → ∞ wtedy i tylko wtedy, gdy
L (tx)
=1
x→∞ L (x)
(∀t > 0) lim
Oznaczenie: L ∈ R0 .
Definicja
Dystrybuanta F jest typu Pareto z wykładnikeim α > 0, jeśli
F (x) ∼ x −α L (x)
przy x → ∞, gdzie L jest funkcja˛ wolno zmieniajac
˛ a˛ sie.
˛
Oznaczenie: F ∈ R−α ⇔ F ∼ L (x) x −α , x → ∞, gdzie L ∈ R0 .
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
16 / 40
Twierdzenie
Twierdzenie
Jeśli F ∈ R−α , to F ∈ S.
Dowód:
Niech X , X1 , X2 iid F ∈ R−α .
Niech x > 0. Wówczas dla dowolnego ε ∈ (0, 1) zdarzenie
{X1 + X2 > x}
implikuje zdarzenie
{X1 > (1 − ε) x} ∪ {X2 > (1 − ε) x} ∪ {X1 > εx ∩ X2 > εx} .
Wynika stad,
˛ że
P (X1 + X2 > x) ≤ 2P (X > (1 − ε) x) + (P (X > εx))2
2
P (X1 + X2 > x) ≤ 2F ((1 − ε) x) + F (εx)
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
17 / 40
Twierdzenie
Zatem
∗2
F (x)
P (X1 + X2 > x)
lim sup
= lim sup
≤2
F (x)
x→∞ F (x)
x→∞
Z drugiej strony dla dowolnej dystrybuanty F mamy
∗2
F (x)
=1+
F (x)
Z
0
x
F (x − y )
dF (y ) ≥ 1 + F (x) ,
F (x)
co po przejściu do granicy daje nam
∗2
F (x)
≥2
x→∞ F (x)
lim inf
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
18 / 40
Spis treści
1
Rozkłady o cieżkich
˛
ogonach
Informacje wstepne
˛
Rodzina podwykładnicza
Rozkłady typu Pareto
2
Detekcja rozkładów o grubych ogonach
Analiza problemu
Wykresy kwantylowe
Empiryczna średnia nadwyżka
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
19 / 40
Oznaczenia
{Ui : 1 ≤ i ≤ n} — portfel roszczeń.
Xn = U1 + U2 + . . . + Un — całkowita suma roszczeń.
U(1) , U(2) , . . . , U(n) — roszczenia uporzadkowane
˛
tak, że
min Ui = U(1) ≤ U(2) ≤ . . . ≤ U(n) = max Ui .
1≤i≤n
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
1≤i≤n
24 kwietnia 2012
19 / 40
Intuicje
Wysokie roszczenie
Roszczenie bedziemy
˛
nazywać dużym, gdy łaczna
˛
suma roszczeń jest
w znacznej mierze przez nie determinowana.
Powyższe stwierdzenie znajduje wiele interpretacji. Przykładowo
roszczenie możemy nazywać dużym, gdy
jego wartość jest nietypowa, pojawia sie˛ rzadko.
stosunek U(n) do Xn jest duży. Czyli powiemy, że U(n) jest duże,
gdy
U(n)/Xn
d
=Z
ma wiekszość
˛
masy prawdopodobieństwa w okolicy 1.
stanowi ono duża˛ cz˛eść całkowitej sumy roszczeń Xn . Czyli
powiemy, że U(m) jest duże, gdy
m ≥ min k : U(k ) > pXn ,
gdzie p to odpowiednio duża cz˛eść całkowitej sumy roszczeń.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
20 / 40
Formalizm
Podejście I
Podejście I
Całkowita suma roszczeń jest duża, ponieważ najwieksze
˛
roszczenie
jest duże. Czyli matematycznie
P (Xn > x) ∼ P U(n) > x , x → ∞.
Takie podejście prowadzi w naturalny sposób do podwykładniczej
rodziny rozkładów S.
Statystyczna weryfikacja hipotezy F = FU ∈ S jest jednak daleka
od prostoty.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
21 / 40
Formalizm
Podejście II
Podejście II
Opierajac
˛ sie˛ na jednym z wcześniejszych twierdzeń. Rozkłady o
cieżkich
˛
ogonach możemy wykrywać w oparciu o warunek
− log (1 − F (x))
= 0.
x
x→∞
αF = lim sup
Statystycznie interesowałoby nas analizowanie warunku
log kn
− log (1 − Fn (Un−k ))
= lim sup
= 0,
Un−k
x→∞
x→∞ Un−k
lim sup
gdzie k/n → 0.
Jest on niestety nieweryfikowalny z uwagi na granice˛ we wzorze.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
22 / 40
Formalizm
Podejście III
Podejście III
Możemy oprzeć nasze wnioskowanie na funkcji
Z ∞
1 − F (y )
µF (x) = E (U − x | U > x) =
dy ,
1 − F (x)
x
wiedzac,
˛ że zachodzi relacja
lim µF (x) = ∞ ⇒ αF = 0.
x→∞
Na potrzeby obliczeń powyższy wzór przekształcić można do postaci
1
µn U(n−k ) =
k
n
X
U(j) − U(n−k ) , k/n → 0.
j=n−k +1
Nie jest jednak statystycznie oczywistym jak badać, czy powyższe
wyrażenie zbiega do ∞.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
23 / 40
Konkluzje
Ściśle formalne, statystyczne postawienie problemu wykrywania
rozkładów o cieżkich
˛
ogonach okazało sie˛ być zadaniem trudnym.
Koniecznym jest poświecenie
˛
formalizmu na rzecz prostoty.
Skupimy sie˛ na porównywaniu ogonów rozkładów empirycznych z
ogonami rozkładów wzorcowych.
Dobrym rozkładem wzorcowym jest tutaj rozkład wykładniczy
f (x) = λe−λx I(0,∞) (x) , λ > 0.
Powiemy, że rozkład F ma cieższy
˛
ogon niż rozkład wykładniczy,
jeżeli
1 − F (x) > ce−ax , x ≥ 0, a, c > 0.
Zachodzenie powyższej nierówności dla wszystkich a > 0
gwarantuje nam, że
αF = 0.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
24 / 40
Spis treści
1
Rozkłady o cieżkich
˛
ogonach
Informacje wstepne
˛
Rodzina podwykładnicza
Rozkłady typu Pareto
2
Detekcja rozkładów o grubych ogonach
Analiza problemu
Wykresy kwantylowe
Empiryczna średnia nadwyżka
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
25 / 40
Idea
Rozkład wykładniczy
Rozważamy jako rozkład wzorcowy standardowy rozkład
wykładniczy o dystrybuancie
G ∼ Exp (1) .
Jesteśmy zainteresowani sprawdzeniem, czy dystrybuanta
empiryczna wielkości roszczenia F ma ten sam rozkład co G z
dokładnościa˛ do parametru λ :
F ∼ Exp (λ) .
Sprawdzenia powyższego dokonamy tworzac
˛ wykres kwantylowy
funkcji kwantylwej QG ∼ G oraz Qn ∼ F .
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
25 / 40
Funkcja kwantylowa
Definicja
Niech F bedzie
˛
dystrybuanta˛ pewnego rozkładu prawdopodobieństwa.
Wówczas mianem funkcji kwantylowej tego rozkładu określimy funkcje˛
zdefiniowana˛ nastepuj
˛ aco
˛
QF (y ) = F −1 (y ) = inf {x : F (x) ≥ y } .
Definicja
Niech Fn bedzie
˛
dystrybuanta˛ empiryczna˛ zbudowana˛ na bazie próbki
n − elementowej. Niech U(1) ≤ U(2) ≤ . . . ≤ U(n) bedzie
˛
wspomniana˛
próbka˛ po uporzadkowaniu.
˛
Empiryczna˛ funkcja˛ kwantylowa˛
zbudowana˛ na bazie powyższej próbki nazwiemy funkcje˛ spełniajac
˛ a˛
poniższy warunek
Qn (y ) = U(k ) ⇔
k −1
k
<y ≤ .
n
n
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
26 / 40
Wykres kwantylowy
Rozkład wykładniczy
Nanosimy na układ współrz˛ednych punkty
k
1
k
k
QG
, Qn
= − log 1 −
, U(k ) .
n
n
λ
n
Jeżeli nasze dane pochodza˛ z rozkładu o ogonie zbliżonym do
tego, jaki posiada rozkład wykładniczy, to na wykresie uzyskamy
w przybliżeniu linie˛ prosta.
˛
Parametr λ−1 wyraża nachylenie tej prostej.
Jeżeli nasze dane pochodza˛ z rozkładu o ogonie cieższym
˛
do
tego, jaki posiada rozkład wykładniczy, wówczas funkcja rośnie
szybciej niż linia prosta.
Jeżeli nasze dane pochodza˛ z rozkładu o ogonie lżejszym do
tego, jaki posiada rozkład wykładniczy, wówczas funkcja rośnie
wolniej niż linia prosta.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
27 / 40
Wykres kwantylowy
Poprawka na ciagłość
˛
Zauważmy, że dla k = n zachodzi
k
= ∞.
QG
n
Z tego wzgledu,
˛
rysujac
˛ wykres kwantylowy, cz˛esto zamiast punktów
k
:1≤k ≤n ,
n
nanosi sie˛ na niego punkty
k
:1≤k ≤n .
n+1
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
28 / 40
Estymacja parametru rozkładu
Jeżeli F ma w przybliżeniu rozkład wykładniczy o parametrze λ.
Wówczas parametr ten możemy wyestymować z pomoca˛ MNK:
Pn
k
U
Q
k =1 (k ) G n+1
λ̂−1 =
2 .
Pn k
k =1 QG n+1
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
29 / 40
Siła zależności liniowej
Możemy zbadać siłe˛ zależności liniowej miedzy
˛
QG oraz Qn
wykorzystujac
˛ empiryczny współczynnik korelacji:
Pn
k
QG n+1
− QG
k =1 u(k ) − u
,
r (u1 , u2 , . . . , un ) = r
2 P
Pn 2
n
k
k =1 QG n+1 − Q G
k =1 u(k ) − u
gdzie:
u=
1
n
QG =
Pn
k =1 uk
1 Pn
n
=
k =1 QG
1
n
Pn
k
n+1
k =1 u(k ) ,
= − n1
log
1−
k =1
Pn
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
k
n+1
.
24 kwietnia 2012
30 / 40
Dane uciete
˛
Niech U ∼ Exp (λ) . Wówczas ogonem dystrybuanty ucietego
˛
rozkładu
wykładniczego nazwiemy funkcje˛
F [0,a] (x) = P (U > x | U > a) =
P (U > x)
= e−λ(x−a) , x > a.
P (U > a)
Odpowiadajaca
˛ jej funkcja kwantylowa, to
Q[0,a] (y ) = a −
1
log (1 − y ) , 0 < y < 1.
λ
Estymatorem parametru a tak zdefiniowanego rozkładu jest punkt
przeciecia
˛
wykresu kwantylowego z prosta˛ y = 0.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
31 / 40
Inne rozkłady
Przy tworzeniu wykresu kwantylowego, jako rozkład wzorcowy można
rozważać oczywiście nie tylko rozkład wykładniczy.
k
Rozkład normalny N µ, σ 2 : Φ−1 n+1
, U(k ) .
Wyraz wolny prostej estymuje parametr µ.
Współczynnik kierunkowy prostej estymuje parametr σ.
k
Rozkład lognormalny: Φ−1 n+1
, log U(k ) .
k
Rozkład Pareto Par (α, c) : − log 1 − n+1
, log U(k ) .
Wyraz wolny prostej estymuje parametr log c.
Współczynnik kierunkowy prostej estymuje parametr α−1 .
Rozkład Weibulla W (r , c) : log − log 1 −
k
n+1
, log U(k ) .
Wyraz wolny prostej estymuje parametr −r −1 log c.
Współczynnik kierunkowy prostej estymuje parametr r −1 .
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
32 / 40
Przykład 1
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
33 / 40
Przykład 2
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
34 / 40
Przykład 3
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
35 / 40
Spis treści
1
Rozkłady o cieżkich
˛
ogonach
Informacje wstepne
˛
Rodzina podwykładnicza
Rozkłady typu Pareto
2
Detekcja rozkładów o grubych ogonach
Analiza problemu
Wykresy kwantylowe
Empiryczna średnia nadwyżka
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
36 / 40
Wzór empiryczny
Rozważać bedziemy
˛
funkcje˛ średniej nadwyżki
Z ∞
1 − F (y )
µF (x) =
dy .
1 − F (x)
x
Wyprowadzimy dla niej wzór empiryczny przy k takim, że k/n → 0.
Z ∞
1 − Fn (y )
dy =
µn U(n−k ) =
U(n−k ) 1 − Fn U(n−k )
n−1 Z U(i+1)
n−1
n X
1 X
=
(1 − Fn (y )) =
(n − i) U(i+1) − U(i) =
k
k
i=n−k U(i)
i=n−k


n
n
X
1
1 X
= 
U(j) − U(n−k ) .
U(j) − kU(n−k )  =
k
k
j=n−k +1
j=n−k +1
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
36 / 40
Idea
Zauważmy, że dla rozkładu wykładniczego z parametrem λ
µF (x) = λ−1 = const.
Podobnie, jeśli µF (x) = const, to F jest dystrybuanta˛ rozkładu
wykładniczego.
Możemy wiec
˛ stosujac
˛ empiryczna˛ funkcje˛ µn U(n−k )
porównywać rozkłady wartości roszczeń z rozkładem
wykładniczym.
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
37 / 40
Interpretacja
Jeśli dystrybuanta F ma cieższy
˛
ogon niż dystrybuanta rozkładu
wykładniczego. Wówczas jej empiryczna średnia nadwyżka
µn U(n−k ) : 1 < k ≤ n
bedzie
˛
znajdowała sie˛ powyżej analogicznej funkcji dla rozkładu
wykładniczego (bedzie
˛
rosła).
Jeśli dystrybuanta F ma lżejszy ogon niż dystrybuanta rozkładu
wykładniczego. Wówczas jej empiryczna średnia nadwyżka
µn U(n−k ) : 1 < k ≤ n
bedzie
˛
znajdowała sie˛ poniżej analogicznej funkcji dla rozkładu
wykładniczego (bedzie
˛
malała).
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
38 / 40
Wykresy
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
39 / 40
Dziekujemy
˛
za uwage!
˛
J. Śmiarowska, P. Jamer (Politechnika Warszawska)
Detekcja rozkładów o cieżkich
˛
ogonach
24 kwietnia 2012
40 / 40

Podobne dokumenty