Funkcje charakterystyczne zmiennych losowych, linie regresji 1
Transkrypt
Funkcje charakterystyczne zmiennych losowych, linie regresji 1
Metody probabilistyczne i statystyka Wykład Funkcje charakterystyczne zmiennych losowych, linie regresji 1-go i 2-go rodzaju Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 5 Metody probabilistyczne i statystyka Wykład 5 16. Funkcje charakterystyczne zmiennych losowych Zespolona zmienna losowa to funkcja Ω ∋ ω → X 1 (ω) + i ⋅ X 2 (ω) ∈ , gdzie X 1 , X 2 : Ω → są zmiennymi losowymi, określonymi na przestrzeni probabilistycznej (Ω, Z , P) Jeśli istnieją EX1 i EX2 , to (16.1) E ( X 1 + i ⋅ X 2 ) EX 1 + i ⋅ EX 2 Funkcja charakterystyczna rzeczywistej zmiennej losowej X określonej na przestrzeni probabilistycznej (Ω, Z , P) to funkcja ϕ X : → dana wzorem ϕ X (t ) = Ee itX = E (cos tX ) + i ⋅ E (sin tX ) , t ∈ (16.2) gdyż ze wzoru Eulera e ib = cos b + i sin b , b ∈ (16.3) Stwierdzenie a) X − typu skokowego o rozkładzie P( X = xk ) = p k , k = 1,2,... ϕ X (t ) = ∑ k e itxk p k = ∑ k p k cos txk + i ⋅ ∑ k p k sin txk , t ∈ b) X − typu ciągłego o gęstości f ∞ ∞ ∞ −∞ −∞ ϕ X (t ) = ∫ e f ( x)dx = ∫ cos tx ⋅ f ( x)dx + i ⋅ ∫ sin tx ⋅ f ( x)dx , t ∈ −∞ itx Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Własności funkcji charakterystycznych (16.4) Uwagi a) b) Funkcja charakterystyczna istnieje dla każdej zmiennej losowej X (zmienna losowa zespolona jest ograniczona, tj. | e itX |= 1) Jeśli nie będzie to prowadzić do nieporozumień, będziemy pisać ϕ zamiast ϕX (16.5) Własności (funkcji charakterystycznej zmiennej losowej X ) a) b) c) d) e) ϕ(0) = 1 | ϕ(t ) | ≤ 1 dla t ∈ ϕ( −t ) = ϕ(t ) dla t ∈ Y = aX + b , a, b ∈ ⇒ ϕY (t ) = e itb ⋅ ϕ X (at ) dla t ∈ ϕ jest jednostajnie ciągła Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Własności funkcji charakterystycznych (16.6) Twierdzenie Jeżeli X1, X2,…, Xn są niezależnymi zmiennymi losowymi, to funkcja charakterystyczna sumy tych zmiennych losowych określona jest wzorem ϕ X 1 + X 2 +...+ X n (t ) = ϕ X 1 (t ) ⋅ ϕ X 2 (t ) ⋅ ... ⋅ ϕ X n (t ) , dla t ∈ (16.7) Przykłady a) b) Wyznaczyć funkcję charakterystyczną zmiennej losowej Sn o rozkładzie dwumianowym z parametrami n ∈ N + i p ∈ (0,1) Wyznaczyć funkcję charakterystyczną zmiennej o rozkładzie jednostajnym na przedziale 〈a,b〉 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Własności funkcji charakterystycznych (16.8) Twierdzenie Jeżeli istnieje k-ty moment EXk zmiennej losowej X dla k ≥ 1, to istnieje k-ta pochodna funkcji charakterystycznej ϕ oraz ϕ ( k ) (0) = i k EX k (16.9) Wniosek Jeśli dla zmiennej losowej X istnieją EX i EX 2 , to ϕ′(0) EX = oraz EX 2 = −ϕ′′(0) i (16.10) Przykłady Wyznaczyć wartość oczekiwaną i wariancję zmiennych losowych X ma rozkład geometryczny z parametrem p∈(0,1), tzn. P( X = k ) = q k −1 p, k = 1, 2,... λ k −λ e , k = 0,1,2,... X ma rozkład Poissona z parametrem λ > 0 , tzn. P( X = k ) = k! X ma rozkład wykładniczy z parametrem λ > 0 , dla x < 0 0 tzn. funkcja gęstości jest określona wzorem f ( x) = −λx dla x ≥ 0 λe Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 17. Linie regresji 1-go i 2-go rodzaju E ( X / Y = y ) − wartość oczekiwaną zmiennej losowej X pod warunkiem, że zmienna losowa Y przyjmuje wartość y E (Y / X = x ) − analogicznie (17.1) Stwierdzenie Jeśli ( X, Y ) jest wektorem losowym typu skokowego o rozkładzie P( X = xi , Y = y j ) = pij , i, j = 1, 2,... , to 1 x ⋅ pij ∑ i i P(Y = y j ) 1 E (Y / X = xi ) = ∑ j y j ⋅ P(Y = y j / X = xi ) = y ⋅ pij ∑ j j P ( X = xi ) E ( X / Y = y j ) = ∑ i xi ⋅ P ( X = xi / Y = y j ) = Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Linie regrsji 1-go rodzaju (17.2) Stwierdzenie Jeśli ( X, Y ) jest wektorem losowym typu ciągłego o gęstości f i gęstościach brzegowych fX i fY odpowiednio, to ∞ 1 x ⋅ f ( x, y )dx, dla y ∈ ∧ f Y ( y ) ≠ 0 ∫ −∞ −∞ fY ( y) ∞ ∞ 1 E (Y / X = x) = ∫ y ⋅ f ( y / x)dy = y ⋅ f ( x, y )dy, dla x ∈ ∧ f X ( x) ≠ 0 ∫ −∞ −∞ f X ( x) ∞ E ( X / Y = y ) = ∫ x ⋅ f ( x / y )dx = Ze stwierdzeń (17.1) i (17.2) wynika, że E ( X / Y = y ) jest funkcją zmiennej y Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 3 Linie regresji 1-go rodzaju Linia regresji 1-go rodzaju zmiennej X względem zmiennej Y to zbiór punktów ( x, y ) ∈ 2 spełniających równanie y → x = g1 ( y ) (17.3) gdzie g1 ( y ) = E ( X / Y = y ) Linia regresji 1-go rodzaju zmiennej Y względem zmiennej X to zbiór punktów ( x, y ) ∈ 2 spełniających równanie (17.4) x → y = g 2 ( x) gdzie g 2 ( x) = E (Y / X = x) (17.5) Własność Jeśli są niezależnymi zmiennymi losowymi, to linie regresji 1-go rodzaju są stałe oraz g1 ( y ) = EX i g 2 ( x) = EY Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 3 Linie regresji 1-go rodzaju (17.6) Własność Średnie odchylenie kwadratowe zmiennej losowej Y od pewnej funkcji 2 g( X ) zmiennej losowej X, tzn. E (Y − g ( X ) ) jest najmniejsze, gdy funkcja ta prawie wszędzie jest równa g2( X ) . Oznacza to, że 2 E (Y − g 2 ( X ) ) = min E (Y − g ( X ) ) 2 g Analogicznie 2 E ( X − g1 (Y ) ) = min E ( X − g (Y ) ) 2 g (17.7) Przykłady a) Wyznaczyć linię regresji 1-go rodzaju zmiennej losowej X względem Y dla wektora losowego o rozkładzie z przykładu (10.9) X Atomy 0 1 2 P (Y = y j ) Y 0 28 45 8 45 0 4 5 1 0 8 45 1 45 1 5 P ( X = xi ) 28 45 16 45 1 45 1 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Linie regresji 1-go rodzaju (17.7) Przykłady b) Wyznaczyć linię regresji 1-go rodzaju zmiennej losowej Y względem X dla wektora losowego ( X, Y ) o gęstości określonej wzorem 12 dla ( x, y ) ∈ K f ( x, y ) = gdzie K = {( x, y ) ∈ 2 :| x | + | y | ≤ 1} 0 dla ( x, y ) ∉ K Z przykładu (10.5) wiadomo, że 2( x1+1) f ( y / x) = 2(11− x ) 0 dla x ∈ ( −1,0〉 ∧ y ∈ 〈− x − 1, x + 1〉 dla x ∈ (0,1) ∧ y ∈ 〈 x − 1,1 − x〉 dla pozostałych y Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Linie regresji 2-go rodzaju Linia regresji 2-go rodzaju to funkcja y = g(x), której przewidywaną postać wyznacza się metodą najmniejszych kwadratów, minimalizując 2 wyrażenie E (Y − g ( X ) ) Prosta regresji 2-go rodzaju zmiennej Y względem zmiennej X to funkcja o równaniu y = αx + β, gdzie współczynniki α i β są dobrane tak, by średnie odchylenie kwadratowe zmiennej losowej Y od zmiennej losowej 2 αX + β, tzn. E (Y − (αX + β) ) było najmniejsze (17.8) Przykład 2 a) Wykazać, że α = i b) cov( X , Y ) DY = ρ ( X , Y ) , o ile D 2 X > 0 2 2 D X D X β = EY − αEX Obliczyć wartość minimalną wyrażenia E (Y − (αX + β) ) 2 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Minimum funkcji dwóch zmiennych Wyznaczenie pochodnych cząstkowych pierwszego rzędu i rozwiązanie układu równań (warunek konieczny istnienia ekstremum) ∂f ( x, y ) =0 ∂x ∂f ( x, y ) =0 ∂y Wyznaczenie pochodnych cząstkowych drugiego rzędu i obliczenie głównych minorów hesjana, tj. macierzy ∂ 2 f ( x0 , y 0 ) ∂x 2 H= 2 ∂ f ( x0 , y 0 ) ∂y∂x ∂ 2 f ( x0 , y 0 ) ∂x∂y 2 ∂ f ( x0 , y 0 ) ∂y 2 Sprawdzenie warunku wystarczającego istnienia minimum (główne minory macierzy H większe od zera) Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Linie regresji 2-go rodzaju Wyrażenie (17.9) D 2Y (1 − ρ 2 ( X , Y ) ) to wariancja resztowa (resztkowa) lub wariancja regresji zmiennej losowej Y względem zmiennej X (17.10) Przykład a) Wyznaczyć prostą regresji zmiennej losowej X względem zmiennej Y oraz wariancję resztkową Y dla wektora losowego ( X, Y ) o rozkładzie z przykładu (10.9) Atomy 0 1 P ( X = xi ) 28 28 0 0 45 45 8 8 16 1 X 45 45 45 1 2 0 451 45 P (Y = y j ) 54 15 1 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Linie regresji 2-go rodzaju (17.10) Przykład b) Wyznaczyć regresję 2-go rodzaju zmiennej losowej Y względem zmiennej X oraz wariancję resztkową dla wektora losowego ( X, Y ) o gęstości określonej wzorem 12 dla ( x, y ) ∈ K gdzie K = {( x, y ) ∈ 2 :| x | + | y | ≤ 1} f ( x, y ) = 0 dla ( x, y ) ∉ K (17.11) Własność Jeśli linia regresji 1-go rodzaju jest zbiorem współliniowym, to prosta regresji 2-go rodzaju ją pokrywa Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 5 Dziękuję za uwagę Opracowała Joanna Banaś