Wykład 11: Zmienne losowe dwuwymiarowe. Roz

Transkrypt

Wykład 11: Zmienne losowe dwuwymiarowe. Roz
Rachunek prawdopodobieństwa MAP1064
Wydział Elektroniki, rok akad. 2008/09, sem. letni
Wykładowca: dr hab. A. Jurlewicz
Wykład 11: Zmienne losowe dwuwymiarowe. Rozkłady łączne, brzegowe. Niezależność zmiennych losowych. Momenty. Współczynnik korelacji.
Zmienne losowe dwuwymiarowe, rozkład łączny, rozkłady
brzegowe.
Definicja.
Zmienna losowa dwuwymiarowa to wektor (X, Y ), którego składowe X, Y są
zmiennymi losowymi.
Rozkład wektora losowego (X, Y ) to funkcja P ((X, Y ) ∈ C), gdzie C to borelowski podzbiór płaszczyzny R2 . Nazywamy go rozkładem łącznym zmiennych
losowych X, Y .
Rozkład zmiennej losowej X i rozkład zmiennej losowej Y nazywamy rozkładami
brzegowymi wektora losowego (X, Y ).
Pełna informacja o rozkładzie łącznym zmiennych losowych X, Y zawarta jest:
(a) w dystrybuancie tego rozkładu, czyli funkcji
FX,Y (x, y) = P (X < x, Y < y)
(b) w przypadku dyskretnego wektora losowego (X, Y ) zawarta jest także w ciągu
trójek {(xn , yk , pnk ), n ∈ T1 ⊂ N, k ∈ T2 ⊂ N}, gdzie {xn , n ∈ T1 } oraz {yk , k ∈ T2 }
to ciągi wszystkich wartości przyjmowanych odpowiednio przez X i Y z dodatnimi
prawdopodobieństwami, natomiast pnk = P (X = xn , Y = yk ), n ∈ T1 , k ∈ T2 .
(Ciągi {xn , n ∈ T1 } oraz {yk , k ∈ T2 } muszą być różnowartościowe, natomiast
P P
pnk ­ 0 dla wszystkich n, k oraz
pnk = 1, aby rozkład był dobrze określony.)
n∈T1 k∈T2
(c) w przypadku ciągłego rozkładu wektora losowego (X, Y ) zawarta jest także w
gęstości łącznej f (x, y), czyli takiej funkcji f (x, y) ­ 0 dla każdego (x, y), że
Zx
FX,Y (x, y) =
−∞
ds
Zy
f (s, t)dt
−∞
(Aby funkcja f (x, y) była gęstością pewnego rozkładu prawdopodobieństwa musi
spełniać warunki: f (x, y) ­ 0 dla każdego (x, y) oraz
Z∞
−∞
1
dx
Z∞
−∞
f (x, y)dy = 1.)
Fakt: Jeśli znamy rozkład łączny, to znamy też rozkłady brzegowe, gdyż:
FX (x) = P (X < x) = P (X < x, Y < ∞) =
lim FX,Y (x, y),
y→∞
FY (y) = P (Y < y) = P (X < ∞, Y < y) =
lim FX,Y (x, y)
x→∞
W przypadku dyskretnego wektora losowego (X, Y ) zadanego ciagiem
{(xn , yk , pnk ), n ∈ T1 , k ∈ T2 }:
rozkład zmiennej losowej X zadany jest ciągiem {(xn , pn· ), n ∈ T1 }, gdzie
P
P
pn· = P (X = xn ) =
P (X = xn , Y = yk ) =
pnk
k∈T2
k∈T2
Podobnie, rozkład zmiennej losowej Y zadany jest ciągiem {(yk , p·k ), k ∈ T2 },
P
P
gdzie p·k = P (Y = yk ) =
P (X = xn , Y = yk ) =
pnk
n∈T1
n∈T1
W przypadku wektora o rozkładzie ciągłym o gęstości łącznej f (x, y)
można pokazać, że:
rozkład zmiennej losowej X jest ciągły o gęstości fX (x) =
Z∞
f (x, y)dy,
−∞
rozkład zmiennej losowej Y jest ciągły o gęstości fY (y) =
Z∞
f (x, y)dx.
−∞
Niezależność zmiennych losowych
Definicja.
Zmienne losowe X i Y są niezależne, gdy dla dowolnych borelowskich zbiorów B1 i B2
zdarzenia {X ∈ B1 } i {Y ∈ B2 } są niezależne, tzn. P (X ∈ B1 , Y ∈ B2 ) = P (X ∈
B1 )P (Y ∈ B2 ).
Zmienne losowe X1 , X2 , . . . , Xn są niezależne, gdy dla dowolnych borelowskich zbiorów
B1 , B2 , . . . , Bn rodzina {{Xi ∈ Bi }, i = 1, 2, . . . , n} jest rodziną zdarzeń niezależnych.
Fakt.
Zmienne losowe X i Y są niezależne wtedy i tylko wtedy, gdy dla każdego (x, y)
FX,Y (x, y) = FX (x)FY (y).
W przypadku rozkładu dyskretnego warunek ten jest równoważny warunkowi
pnk = pn· p·k
dla każdego (n, k) z odpowiedniego zakresu.
W przypadku rozkładu ciągłego warunkiem równoważnym jest
f (x, y) = fX (x)fY (y)
dla prawie wszystkich (x, y) (tzn. równość może nie zachodzić na zbiorze o polu 0).
Przykłady do zad. 10.1, 10.2
2
Wartość oczekiwana i macierz kowariancji zmiennej losowej dwuwymiarowej. Współczynnik korelacji.
Definicja.
(EX, EY ) to wektor wartości oczekiwanych zmiennej losowej dwuwymiarowej (X, Y ).
Cov(X, Y ) = EXY − EXEY - współczynnik kowariancji zmiennych X i Y
"
D2 X
Cov(X, Y )
Cov(X, Y )
D2 Y
#
to macierz kowariancji zmiennej losowej dwuwymiarowej (X, Y )
Parametry te są dobrze określone, o ile istnieją wartości oczekiwane i wariancje zmiennych
losowych X i Y
Fakt.
Dla dowolnej funkcji borelowskiej
EZ = Eg(X, Y ) =
Z∞ Z∞
g(x, y)dFX,Y (x, y) =
−∞ −∞
 P P

g(xn , yk )pnk ,



 n∈T1 k∈T2
=
R∞ R∞




gdy X ma rozkład dyskretny
zadany ciągiem {(xn , yk , pnk ), n ∈ T1 , k ∈ T2 };
g(x, y)f (x, y)dxdy, gdy X ma rozkład ciągły o gęstości f (x, y).
−∞ −∞
o ile całka (szereg) zbieżne.
Stąd jeśli istnieją EX i EY , to
E(X + Y ) = EX + EY
oraz jeśli istnieją D2 X i D2 Y , to
D2 (X + Y ) = D2 X + D2 Y + 2Cov(X, Y ).
Definicja.
Przy założeniu, że istnieją D2 X > 0 i D2 Y > 0, określamy współczynnik korelacji
zmiennych losowych X i Y jako:
Cov(X, Y )
ρXY = √
.
D2 X · D2 Y
Własności współczynnika korelacji:
• |ρXY | ¬ 1.
• |ρXY | = 1 wtedy i tylko wtedy, gdy Y = aX + b dla pewnych stałych a 6= 0, b, przy
czym ρXY = 1 odpowiada a > 0, a ρXY = −1 odpowiada a < 0 (pełna liniowa
zależność Y od X).
• Gdy ρXY = 0, mówimy, że X i Y są nieskorelowane.
Przykłady do zad. 10.3
3