Modelowanie zaleznosci pomiedzy zmiennymi losowymi
Transkrypt
Modelowanie zaleznosci pomiedzy zmiennymi losowymi
Modelowanie zależności pomiędzy zmiennymi losowymi Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski Zmienne losowe niezależne przypomnienie • Dwie rzeczywiste zmienne losowe X i Y są niezależne jeżeli dla dowolnych a<b i c<d P ( X ∈ a, b & Y ∈ c, d ) = P ( ( X , Y ) ∈ a, b × c, d ) = P ( X ∈ a, b )iP (Y ∈ c, d ) • Jeżeli X i Y są niezależne, to dla dowolnych funkcji f i g, dla których istnieją Ef ( X ) , Eg (Y ) : E ( f ( X ) g (Y ) ) = Ef ( X )iEg (Y ) • W ogólnej sytuacji, gdy X i Y nie są niezależne powyższa równość nie musi zachodzić Kowariancja i korelacja przypomnienie • Jedną z wielu miar niezależności zmiennych losowych jest współczynnik korelacji Pearsona, który definiujemy za pomocą formuły ρ ( X ,Y ) = Cov ( X , Y ) D ( X ) D (Y ) = E ( XY ) − E X iE Y D ( X ) D (Y ) • Współczynnik korelacji przyjmuje wartości z przedziału [-1,1], • nie zmienia się przy transformacjach liniowych zmiennych X i Y (z dokładnością do znaku), • jeżeli jest równy 1 lub -1, to zmienne losowe X i Y są związane zależnością liniową, • jeżeli zmienne X i Y są niezależne, to ρ ( X , Y ) = 0 (ale nie na odwrót). Dwuwymiarowa zmienna losowa • Dwuwymiarowa zmienna losowa (dwuwymiarowy wektor losowy) (X,Y) to zmienna, która przyjmuje wartości będące parami liczb rzeczywistych. • Współrzędne dwuwymiarowej zmiennej losowej X i Y są również zmiennymi losowymi. Możliwe są wszystkie kombinacje: X – dyskretna X – ciągła Y – dyskretna x x Y - ciągła x x Rozkład łączny i rozkłady brzegowe, przypadek dyskretny • Rozkład łączny dwóch zmiennych losowych X i Y to rozkład wektora losowego (X,Y) na płaszczyźnie liczb rzeczywistych R 2 • Jeżeli zmienne X i Y są dyskretne, to rozkład łączny dany jest za pomocą prawdopodobieństw P ( X = xi &Y = yj ) = P ( X,Y) = ( xi ,yj ) = pij,i, j = 1,2,... • Rozkłady brzegowe wektora (X,Y) to rozkłady zmiennych X i Y • Zadanie: jaka jest zależność pij od pi = P( X = xi ) oraz q j = P(Y = y j ) gdy X i Y są niezależne? ( ) Rozkład łączny i rozkłady brzegowe przypadek ciągły • Jeżeli istnieje pewna funkcja f : R 2 → 0, +∞ ) taka, że dla a<b i c<d b d P ( X , Y ) ∈ a, b × c, d = ∫ ∫ f ( x, y )dxdy a c to f nazywa się gęstością wektora (X,Y) zaś zmienne X i Y mają rozkłady ciągłe odpowiednio o gęstościach +∞ +∞ fX ( x ) = ∫ f ( x, y ) dy , fY ( y ) = ∫ f ( x, y ) dx ( ) −∞ −∞ • Zadanie: jaka jest zależność pomiędzy gęstością rozkładu łącznego a gęstościami rozkładów brzegowych gdy zmienne X i Y są niezależne? Rozkład łączny i rozkłady brzegowe przypadek dyskretno-ciągły • Jeżeli zmienna X ma rozkład ciągły a zmienna Y ma rozkład dyskretny, to wówczas rozkład łączny wektora (X,Y) można określić za pomocą formuły { } P( X ∈ a, b & Y = y j ) = P(( X , Y ) ∈ a, b × y j ) = ∫ b a f j ( x ) dx, j = 1,2,... • Zadanie: wyznaczyć z powyższej formuły gęstość zmiennej X oraz q j = P (Y = y j ) Kopule i dystrybuanty dwuwymiarowe • Kopulą nazywamy dowolną funkcję 2 C : 0,1 → 0,1 spełniającą warunki C t , 0 = C 0, s = 0, C 1, t = t , C s,1 = s, C s1, t1 + C s2 , t2 ≥ C s1 , t2 + C s2 , t1 gdy s1 ≤ s2 , t1 ≤ t2 • Dystrybuantę rozkładu (X,Y ) definiujemy wzorem FX ,Y ( s, t ) = P ( X ≤ s, Y ≤ t ) Kopule a dystrybuanty dwuwymiarowe - Twierdzenie Sklara • Dystrybuanta każdego rozkładu dwuwymiarowego, którego rozkłady brzegowe są jednostajne na przedziale [0,1] jest kopulą • Zachodzi również odwrotne Twierdzenie Sklara Każda dystrybuanta FX ,Y ( s, t ) rozkładu dwuwymiarowego da się przedstawić w postaci FX ,Y ( s, t ) = C X ,Y ( FX ( s ) , FY ( t ) ) gdzie C X ,Y - kopula, a FX ( s ) , FY ( t ) - dystrybuanty X i Y Współczynnik korelacji rang Spearmana • Współczynnik korelacji rang Spearmana zmiennych X i Y, ρS ( X , Y ) , definiujemy za pomocą formuły ρS ( X , Y ) = ρ ( FX ( X ) , FY (Y ) ) gdzie ρ - współczynnik korelacji Pearsona • Zachodzi również formuła ρS ( X , Y ) = 12∫ 1 0 ∫ 1 C X ,Y ( s, t ) − s ⋅ t dsdt 0 Współczynnik korelacji rang własności • Współczynnik korelacji rang przyjmuje wartości z przedziału [-1,1], • nie zmienia się przy transformacjach monotonicznych zmiennych X i Y, (z dokładnością do znaku), • jeżeli jest równy 1 lub -1, to zmienne losowe X i Y są związane zależnością monotoniczną. • Jeżeli X i Y są niezależne, to ρ S ( X , Y ) = 0 (ale nie na odwrót). • Pewien estymator współczynnika korelacji rang 2 n rS = 1 − 6∑ i =1 ( Rxi − Ry i ) / n3 − n • Pytanie o rozkład asymptotyczny estymatora. ( ) Prawdopodobieństwo warunkowe • Prawdopodobieństwo warunkowe, że zmienna X przyjmie wartości z przedziału [a,b], pod warunkiem, że zmienna Y przyjmuje wartości z przedziału [c,d] definiuje się, przy założeniu, że P (Y ∈ c, d ) > 0 za pomocą formuły P ( X ∈ a, b | Y ∈ c, d ) = P ( X ∈ a, b & Y ∈ c, d ) P (Y ∈ c, d ) • Zadanie: Obliczyć P ( X ∈ a, b | Y = y j ) dla rozkładu dyskretno-ciągłego Rozkłady warunkowe • (X,Y) - rozkład dyskretny, wówczas ( ) P X = xi | Y = y j = pij / q j • (X,Y) - rozkład ciągły, wówczas możemy określić gęstość warunkową f X ( x | Y = y ) = f ( x, y ) / fY ( y ) • (X,Y) – rozkład dyskretno-ciągły, wówczas ( ) ( ) fX x | Y = y j = f j ( x ) / P Y = y j = f j ( x ) / q j • Zadanie: Obliczyć P Y = y j | X = x dla ( rozkładu dyskretno-ciągłego ) Rozkłady warunkowe i brzegowe a rozkłady łączne • (X,Y) - rozkład dyskretny, wówczas ( P X = xi & Y = y j ( ) ) ( = P X = xi | Y = y j iP Y = y j ) • (X,Y) - rozkład ciągły, wówczas f ( x, y ) = fX ( x | Y = y )ifY ( y ) • (X,Y) – rozkład dyskretno-ciągły, wówczas ( ) ( f j ( x ) = fX x | Y = y j iP Y = y j ( ) = P Y = y j | X = x if X ( x ) ) Rozkład ujemny dwumianowy jako mieszanina rozkładów • Zmienna (X,Y) ma rozkład dyskretno –ciągły, • prawdopodobieństwa warunkowe są równe P ( N = k | Λ = λ ) = e − λ λ k / k !, k = 0,1,... • gęstość brzegowa zmiennej Λ jest gęstością rozkładu Γ(β,α), • wówczas N ma rozkład ujemny dwumianowy α β +∞ − λ λ k β −1 −αλ P (N = k ) = e λ e dλ ∫ 0 Γ (β ) k! β k β β Γ + k β + k − 1 ( ) 1 α α 1 = = α + 1 α k ! Γ ( β ) (α + 1) β + k + 1 k Warunkowa wartość oczekiwana • Warunkową wartość oczekiwaną X pod warunkiem Y = y określamy jako wartość oczekiwaną rozkładu warunkowego zmiennej X pod warunkiem Y = y, np. w przypadku dyskretnym ) ∑ ( E X |Y = yj = = ∑ ∞ i =1 ∞ i =1 ( ) P X = xi | Y = y j xi pij xi / q j • Warunkowa wartość oczekiwana pod warunkiem Y=y jest pewną funkcją zmiennej y E ( X | Y = y ) = E (y ) Warunkowa wartość oczekiwana, c. d. • Warunkową wartość oczekiwaną zmiennej X pod warunkiem zmiennej Y definiujemy jako E ( X | Y ) = E(Y ) • Tak zdefiniowana warunkowa wartość oczekiwana jest zmienną losową i jest zawsze pewną funkcją zmiennej Y • Zadanie: Obliczyć rozkład warunkowy i E ( X | Y ) gdy zmienna (X,Y) ma rozkład łączny ciągły o 2 2 gęstości exp ( − x − 2 xy − y − 2 | y |) / π Warunkowa wartość oczekiwana - własności • Warunkowa wartość oczekiwana, podobnie jak wartość oczekiwana jest operacją liniową, tzn. E ( α X1 + β X 2 | Y ) = α E ( X 1 | Y ) + β E ( X 2 | Y ) • Jeżeli zmienna Z = F (Y ) jest funkcją zmiennej Y, to E ( ZX | Y ) = ZE ( X | Y ) • Zachodzi również równość E (E ( X | Y ) ) = E ( X ) • Jeżeli zmienne X i Y są niezależne, to E(X |Y ) = E(X ) Dekompozycja wariancji • Dla warunkowej wartości oczekiwanej ponadto zachodzi następująca równość 2 ( X ) = E ( X − EX ) 2 2 = E ( X − E ( X | Y ) ) + E (E ( X | Y ) − E ( X ) ) 2 D • Zadanie: udowodnić powyższą równość korzystając z równości E (E ( X | Y ) ) = E ( X ) , sprawdzić obie równości dla wektora (X,Y) o 2 2 exp − x − 2 xy − y − 2 | y |) / 2 π gęstości ( Wariancja warunkowa • Wariancję warunkową definiujemy jako zmienną losową 2 D ( 2 ( X | Y ) = E ( X − E ( X | Y )) |Y ) • Ze wzoru na dekompozycję wariancji ( ) D2 ( X ) = E D2 ( X | Y ) + D2 (E ( X | Y ) ) • Zadanie: udowodnić, że jeżeli mamy gęstość 2 2 warunkową fX ( x | Y = y ) , to D ( X |Y ) = D (Y ) , gdzie D ( y ) = ∫ x f ( x | Y = y ) dx +∞ 2 0 − (∫ +∞ 0 2 X xf X ( x | Y = y ) dx 2 )