Modelowanie zaleznosci pomiedzy zmiennymi losowymi

Transkrypt

Modelowanie zaleznosci pomiedzy zmiennymi losowymi
Modelowanie zależności
pomiędzy zmiennymi losowymi
Matematyczne podstawy teorii
ryzyka i ich zastosowanie
R. Łochowski
Zmienne losowe niezależne przypomnienie
• Dwie rzeczywiste zmienne losowe X i Y są
niezależne jeżeli dla dowolnych a<b i c<d
P ( X ∈ a, b & Y ∈ c, d  ) = P ( ( X , Y ) ∈ a, b × c, d  )
= P ( X ∈ a, b )iP (Y ∈ c, d  )
• Jeżeli X i Y są niezależne, to dla dowolnych
funkcji f i g, dla których istnieją Ef ( X ) , Eg (Y ) :
E ( f ( X ) g (Y ) ) = Ef ( X )iEg (Y )
• W ogólnej sytuacji, gdy X i Y nie są niezależne
powyższa równość nie musi zachodzić
Kowariancja i korelacja przypomnienie
• Jedną z wielu miar niezależności zmiennych losowych
jest współczynnik korelacji Pearsona, który definiujemy
za pomocą formuły
ρ ( X ,Y ) =
Cov ( X , Y )
D ( X ) D (Y )
=
E ( XY ) − E X iE Y
D ( X ) D (Y )
• Współczynnik korelacji przyjmuje wartości z przedziału
[-1,1],
• nie zmienia się przy transformacjach liniowych
zmiennych X i Y (z dokładnością do znaku),
• jeżeli jest równy 1 lub -1, to zmienne losowe X i Y są
związane zależnością liniową,
• jeżeli zmienne X i Y są niezależne, to ρ ( X , Y ) = 0
(ale nie na odwrót).
Dwuwymiarowa zmienna losowa
• Dwuwymiarowa zmienna losowa
(dwuwymiarowy wektor losowy) (X,Y) to
zmienna, która przyjmuje wartości będące
parami liczb rzeczywistych.
• Współrzędne dwuwymiarowej zmiennej
losowej X i Y są również zmiennymi losowymi.
Możliwe są wszystkie kombinacje:
X – dyskretna
X – ciągła
Y – dyskretna
x
x
Y - ciągła
x
x
Rozkład łączny i rozkłady brzegowe,
przypadek dyskretny
• Rozkład łączny dwóch zmiennych losowych X i Y
to rozkład wektora losowego (X,Y) na płaszczyźnie
liczb rzeczywistych R 2
• Jeżeli zmienne X i Y są dyskretne, to rozkład
łączny dany jest za pomocą prawdopodobieństw
P ( X = xi &Y = yj ) = P ( X,Y) = ( xi ,yj ) = pij,i, j = 1,2,...
• Rozkłady brzegowe wektora (X,Y) to rozkłady
zmiennych X i Y
• Zadanie: jaka jest zależność pij od pi = P( X = xi )
oraz q j = P(Y = y j ) gdy X i Y są niezależne?
(
)
Rozkład łączny i rozkłady brzegowe przypadek ciągły
• Jeżeli istnieje pewna funkcja f : R 2 → 0, +∞ )
taka, że dla a<b i c<d
b d
P ( X , Y ) ∈  a, b  × c, d  = ∫ ∫ f ( x, y )dxdy
a c
to f nazywa się gęstością wektora (X,Y) zaś
zmienne X i Y mają rozkłady ciągłe odpowiednio o
gęstościach
+∞
+∞
fX ( x ) = ∫ f ( x, y ) dy , fY ( y ) = ∫ f ( x, y ) dx
(
)
−∞
−∞
• Zadanie: jaka jest zależność pomiędzy gęstością
rozkładu łącznego a gęstościami rozkładów
brzegowych gdy zmienne X i Y są niezależne?
Rozkład łączny i rozkłady brzegowe przypadek dyskretno-ciągły
• Jeżeli zmienna X ma rozkład ciągły a zmienna Y
ma rozkład dyskretny, to wówczas rozkład
łączny wektora (X,Y) można określić za pomocą
formuły
{ }
P( X ∈  a, b  & Y = y j ) = P(( X , Y ) ∈  a, b  × y j )
=
∫
b
a
f j ( x ) dx, j = 1,2,...
• Zadanie: wyznaczyć z powyższej formuły
gęstość zmiennej X oraz q j = P (Y = y j )
Kopule i dystrybuanty dwuwymiarowe
• Kopulą nazywamy dowolną funkcję
2
C : 0,1 → 0,1 spełniającą warunki
C t , 0 = C 0, s  = 0, C 1, t  = t , C  s,1 = s,
C  s1, t1  + C  s2 , t2  ≥ C  s1 , t2  + C  s2 , t1  gdy
s1 ≤ s2 , t1 ≤ t2
• Dystrybuantę rozkładu (X,Y ) definiujemy
wzorem
FX ,Y ( s, t ) = P ( X ≤ s, Y ≤ t )
Kopule a dystrybuanty dwuwymiarowe
- Twierdzenie Sklara
• Dystrybuanta każdego rozkładu dwuwymiarowego, którego rozkłady brzegowe są
jednostajne na przedziale [0,1] jest kopulą
• Zachodzi również odwrotne
Twierdzenie Sklara Każda dystrybuanta FX ,Y ( s, t )
rozkładu dwuwymiarowego da się przedstawić
w postaci
FX ,Y ( s, t ) = C X ,Y ( FX ( s ) , FY ( t ) )
gdzie C X ,Y - kopula, a FX ( s ) , FY ( t ) -
dystrybuanty X i Y
Współczynnik korelacji rang
Spearmana
• Współczynnik korelacji rang Spearmana
zmiennych X i Y, ρS ( X , Y ) , definiujemy za
pomocą formuły
ρS ( X , Y ) = ρ ( FX ( X ) , FY (Y ) )
gdzie ρ - współczynnik korelacji Pearsona
• Zachodzi również formuła
ρS ( X , Y ) = 12∫
1
0
∫
1
C X ,Y ( s, t ) − s ⋅ t  dsdt
0
Współczynnik korelacji rang własności
• Współczynnik korelacji rang przyjmuje wartości z
przedziału [-1,1],
• nie zmienia się przy transformacjach monotonicznych zmiennych X i Y, (z dokładnością do znaku),
• jeżeli jest równy 1 lub -1, to zmienne losowe X i Y
są związane zależnością monotoniczną.
• Jeżeli X i Y są niezależne, to ρ S ( X , Y ) = 0 (ale
nie na odwrót).
• Pewien estymator współczynnika korelacji rang
2
n
rS = 1 − 6∑ i =1 ( Rxi − Ry i ) / n3 − n
• Pytanie o rozkład asymptotyczny estymatora.
(
)
Prawdopodobieństwo warunkowe
• Prawdopodobieństwo warunkowe, że zmienna
X przyjmie wartości z przedziału [a,b], pod
warunkiem, że zmienna Y przyjmuje wartości z
przedziału [c,d] definiuje się, przy założeniu, że
P (Y ∈ c, d  ) > 0
za pomocą formuły
P ( X ∈ a, b | Y ∈ c, d ) =
P ( X ∈ a, b & Y ∈ c, d )
P (Y ∈ c, d )
• Zadanie: Obliczyć P ( X ∈ a, b | Y = y j ) dla
rozkładu dyskretno-ciągłego
Rozkłady warunkowe
• (X,Y) - rozkład dyskretny, wówczas
(
)
P X = xi | Y = y j = pij / q j
• (X,Y) - rozkład ciągły, wówczas możemy
określić gęstość warunkową
f X ( x | Y = y ) = f ( x, y ) / fY ( y )
• (X,Y) – rozkład dyskretno-ciągły, wówczas
(
)
(
)
fX x | Y = y j = f j ( x ) / P Y = y j = f j ( x ) / q j
• Zadanie: Obliczyć P Y = y j | X = x dla
(
rozkładu dyskretno-ciągłego
)
Rozkłady warunkowe i brzegowe a
rozkłady łączne
• (X,Y) - rozkład dyskretny, wówczas
(
P X = xi & Y = y j
(
)
) (
= P X = xi | Y = y j iP Y = y j
)
• (X,Y) - rozkład ciągły, wówczas
f ( x, y ) = fX ( x | Y = y )ifY ( y )
• (X,Y) – rozkład dyskretno-ciągły, wówczas
(
) (
f j ( x ) = fX x | Y = y j iP Y = y j
(
)
= P Y = y j | X = x if X ( x )
)
Rozkład ujemny dwumianowy jako
mieszanina rozkładów
• Zmienna (X,Y) ma rozkład dyskretno –ciągły,
• prawdopodobieństwa warunkowe są równe
P ( N = k | Λ = λ ) = e − λ λ k / k !, k = 0,1,...
• gęstość brzegowa zmiennej Λ jest gęstością
rozkładu Γ(β,α),
• wówczas N ma rozkład ujemny dwumianowy
α β +∞ − λ λ k β −1 −αλ
P (N = k ) =
e
λ e dλ
∫
0
Γ (β )
k!
β
k
β
β
Γ
+
k
β
+
k
−
1
(
)


1 α
 α   1 
=
=


 α + 1
α
k ! Γ ( β ) (α + 1) β + k 
+
1
k

 


Warunkowa wartość oczekiwana
• Warunkową wartość oczekiwaną X pod
warunkiem Y = y określamy jako wartość
oczekiwaną rozkładu warunkowego zmiennej
X pod warunkiem Y = y, np. w przypadku
dyskretnym
) ∑
(
E X |Y = yj =
=
∑
∞
i =1
∞
i =1
(
)
P X = xi | Y = y j xi
pij xi / q j
• Warunkowa wartość oczekiwana pod
warunkiem Y=y jest pewną funkcją zmiennej y
E ( X | Y = y ) = E (y )
Warunkowa wartość oczekiwana, c. d.
• Warunkową wartość oczekiwaną zmiennej X
pod warunkiem zmiennej Y definiujemy jako
E ( X | Y ) = E(Y )
• Tak zdefiniowana warunkowa wartość
oczekiwana jest zmienną losową i jest zawsze
pewną funkcją zmiennej Y
• Zadanie: Obliczyć rozkład warunkowy i E ( X | Y )
gdy zmienna (X,Y) ma rozkład łączny ciągły o
2
2
gęstości exp ( − x − 2 xy − y − 2 | y |) / π
Warunkowa wartość oczekiwana
- własności
• Warunkowa wartość oczekiwana, podobnie jak
wartość oczekiwana jest operacją liniową, tzn.
E ( α X1 + β X 2 | Y ) = α E ( X 1 | Y ) + β E ( X 2 | Y )
• Jeżeli zmienna Z = F (Y ) jest funkcją zmiennej Y, to
E ( ZX | Y ) = ZE ( X | Y )
• Zachodzi również równość
E (E ( X | Y ) ) = E ( X )
• Jeżeli zmienne X i Y są niezależne, to
E(X |Y ) = E(X )
Dekompozycja wariancji
• Dla warunkowej wartości oczekiwanej
ponadto zachodzi następująca równość
2
( X ) = E ( X − EX )
2
2
= E ( X − E ( X | Y ) ) + E (E ( X | Y ) − E ( X ) )
2
D
• Zadanie: udowodnić powyższą równość
korzystając z równości E (E ( X | Y ) ) = E ( X ) ,
sprawdzić obie równości dla wektora (X,Y) o
2
2
exp
−
x
−
2
xy
−
y
− 2 | y |) / 2 π
gęstości
(
Wariancja warunkowa
• Wariancję warunkową definiujemy jako
zmienną losową
2
D
(
2
( X | Y ) = E ( X − E ( X | Y ))
|Y
)
• Ze wzoru na dekompozycję wariancji
(
)
D2 ( X ) = E D2 ( X | Y ) + D2 (E ( X | Y ) )
• Zadanie: udowodnić, że jeżeli mamy gęstość
2
2
warunkową fX ( x | Y = y ) , to D ( X |Y ) = D (Y ) ,
gdzie D ( y ) = ∫ x f ( x | Y = y ) dx
+∞
2
0
−
(∫
+∞
0
2
X
xf X ( x | Y = y ) dx
2
)