Wykład 11: Zmienne losowe dwuwymiarowe. Roz
Transkrypt
Wykład 11: Zmienne losowe dwuwymiarowe. Roz
Rachunek prawdopodobieństwa MAP1064 Wydział Elektroniki, rok akad. 2008/09, sem. letni Wykładowca: dr hab. A. Jurlewicz Wykład 11: Zmienne losowe dwuwymiarowe. Rozkłady łączne, brzegowe. Niezależność zmiennych losowych. Momenty. Współczynnik korelacji. Zmienne losowe dwuwymiarowe, rozkład łączny, rozkłady brzegowe. Definicja. Zmienna losowa dwuwymiarowa to wektor (X, Y ), którego składowe X, Y są zmiennymi losowymi. Rozkład wektora losowego (X, Y ) to funkcja P ((X, Y ) ∈ C), gdzie C to borelowski podzbiór płaszczyzny R2 . Nazywamy go rozkładem łącznym zmiennych losowych X, Y . Rozkład zmiennej losowej X i rozkład zmiennej losowej Y nazywamy rozkładami brzegowymi wektora losowego (X, Y ). Pełna informacja o rozkładzie łącznym zmiennych losowych X, Y zawarta jest: (a) w dystrybuancie tego rozkładu, czyli funkcji FX,Y (x, y) = P (X < x, Y < y) (b) w przypadku dyskretnego wektora losowego (X, Y ) zawarta jest także w ciągu trójek {(xn , yk , pnk ), n ∈ T1 ⊂ N, k ∈ T2 ⊂ N}, gdzie {xn , n ∈ T1 } oraz {yk , k ∈ T2 } to ciągi wszystkich wartości przyjmowanych odpowiednio przez X i Y z dodatnimi prawdopodobieństwami, natomiast pnk = P (X = xn , Y = yk ), n ∈ T1 , k ∈ T2 . (Ciągi {xn , n ∈ T1 } oraz {yk , k ∈ T2 } muszą być różnowartościowe, natomiast P P pnk 0 dla wszystkich n, k oraz pnk = 1, aby rozkład był dobrze określony.) n∈T1 k∈T2 (c) w przypadku ciągłego rozkładu wektora losowego (X, Y ) zawarta jest także w gęstości łącznej f (x, y), czyli takiej funkcji f (x, y) 0 dla każdego (x, y), że Zx FX,Y (x, y) = −∞ ds Zy f (s, t)dt −∞ (Aby funkcja f (x, y) była gęstością pewnego rozkładu prawdopodobieństwa musi spełniać warunki: f (x, y) 0 dla każdego (x, y) oraz Z∞ −∞ 1 dx Z∞ −∞ f (x, y)dy = 1.) Fakt: Jeśli znamy rozkład łączny, to znamy też rozkłady brzegowe, gdyż: FX (x) = P (X < x) = P (X < x, Y < ∞) = lim FX,Y (x, y), y→∞ FY (y) = P (Y < y) = P (X < ∞, Y < y) = lim FX,Y (x, y) x→∞ W przypadku dyskretnego wektora losowego (X, Y ) zadanego ciagiem {(xn , yk , pnk ), n ∈ T1 , k ∈ T2 }: rozkład zmiennej losowej X zadany jest ciągiem {(xn , pn· ), n ∈ T1 }, gdzie P P pn· = P (X = xn ) = P (X = xn , Y = yk ) = pnk k∈T2 k∈T2 Podobnie, rozkład zmiennej losowej Y zadany jest ciągiem {(yk , p·k ), k ∈ T2 }, P P gdzie p·k = P (Y = yk ) = P (X = xn , Y = yk ) = pnk n∈T1 n∈T1 W przypadku wektora o rozkładzie ciągłym o gęstości łącznej f (x, y) można pokazać, że: rozkład zmiennej losowej X jest ciągły o gęstości fX (x) = Z∞ f (x, y)dy, −∞ rozkład zmiennej losowej Y jest ciągły o gęstości fY (y) = Z∞ f (x, y)dx. −∞ Niezależność zmiennych losowych Definicja. Zmienne losowe X i Y są niezależne, gdy dla dowolnych borelowskich zbiorów B1 i B2 zdarzenia {X ∈ B1 } i {Y ∈ B2 } są niezależne, tzn. P (X ∈ B1 , Y ∈ B2 ) = P (X ∈ B1 )P (Y ∈ B2 ). Zmienne losowe X1 , X2 , . . . , Xn są niezależne, gdy dla dowolnych borelowskich zbiorów B1 , B2 , . . . , Bn rodzina {{Xi ∈ Bi }, i = 1, 2, . . . , n} jest rodziną zdarzeń niezależnych. Fakt. Zmienne losowe X i Y są niezależne wtedy i tylko wtedy, gdy dla każdego (x, y) FX,Y (x, y) = FX (x)FY (y). W przypadku rozkładu dyskretnego warunek ten jest równoważny warunkowi pnk = pn· p·k dla każdego (n, k) z odpowiedniego zakresu. W przypadku rozkładu ciągłego warunkiem równoważnym jest f (x, y) = fX (x)fY (y) dla prawie wszystkich (x, y) (tzn. równość może nie zachodzić na zbiorze o polu 0). Przykłady do zad. 10.1, 10.2 2 Wartość oczekiwana i macierz kowariancji zmiennej losowej dwuwymiarowej. Współczynnik korelacji. Definicja. (EX, EY ) to wektor wartości oczekiwanych zmiennej losowej dwuwymiarowej (X, Y ). Cov(X, Y ) = EXY − EXEY - współczynnik kowariancji zmiennych X i Y " D2 X Cov(X, Y ) Cov(X, Y ) D2 Y # to macierz kowariancji zmiennej losowej dwuwymiarowej (X, Y ) Parametry te są dobrze określone, o ile istnieją wartości oczekiwane i wariancje zmiennych losowych X i Y Fakt. Dla dowolnej funkcji borelowskiej EZ = Eg(X, Y ) = Z∞ Z∞ g(x, y)dFX,Y (x, y) = −∞ −∞ P P g(xn , yk )pnk , n∈T1 k∈T2 = R∞ R∞ gdy X ma rozkład dyskretny zadany ciągiem {(xn , yk , pnk ), n ∈ T1 , k ∈ T2 }; g(x, y)f (x, y)dxdy, gdy X ma rozkład ciągły o gęstości f (x, y). −∞ −∞ o ile całka (szereg) zbieżne. Stąd jeśli istnieją EX i EY , to E(X + Y ) = EX + EY oraz jeśli istnieją D2 X i D2 Y , to D2 (X + Y ) = D2 X + D2 Y + 2Cov(X, Y ). Definicja. Przy założeniu, że istnieją D2 X > 0 i D2 Y > 0, określamy współczynnik korelacji zmiennych losowych X i Y jako: Cov(X, Y ) ρXY = √ . D2 X · D2 Y Własności współczynnika korelacji: • |ρXY | ¬ 1. • |ρXY | = 1 wtedy i tylko wtedy, gdy Y = aX + b dla pewnych stałych a 6= 0, b, przy czym ρXY = 1 odpowiada a > 0, a ρXY = −1 odpowiada a < 0 (pełna liniowa zależność Y od X). • Gdy ρXY = 0, mówimy, że X i Y są nieskorelowane. Przykłady do zad. 10.3 3