Rozkład normalny(Gaussa)
Transkrypt
Rozkład normalny(Gaussa)
Wykład 6 Rozkład normalny(Gaussa) Niech m ∈ R, σ∈ R+ : Gestości ˛ a˛ zmiennej losowej o rozkładzie normalnym z parametrami m i σ jest funkcja (x − m)2 1 f (x)= √ exp(− ); x ∈ R 2σ2 σ 2π (6.0.1) Nośnikiem tego rozkładu jest prosta rzeczywista. Naszkicujmy kilka wykresów funkcji gestości ˛ dla różnych wartości parametrów: najpierw dla różnych parametrów m = −1, 5; 0, 5; 4 przy stałej wartości σ = 1. y 0.3 0.2 0.1 0 -2.5 0 2.5 5 x a nastepnie ˛ przy m = 0 dla różnych σ = 0, 35 , 1 , 2. 35 WYKŁAD 6. ROZKŁAD NORMALNY(GAUSSA) 36 y 1 0.75 0.5 0.25 0 -5 -2.5 0 2.5 5 x Jeśli zmienna losowa X ma gestoś ˛ ć postaci (6.0.1) z parametrami to bedziemy ˛ wówczas pisali X∼N (m, σ2 ). 2-wymiarowy rozkład normalny gdzie C f(x, y) (6.0.2) 1 1 (x − a)2 (x − a)(y − b) (x − b)2 = C exp − − 2ρ + (6.0.3) 2 1 − ρ2 σ21 σ1 σ 2 σ 22 1 = . (6.0.4) 2π 1 − ρ2 Jest to ogólna postać g˛estości 2-wymiarowego wektora normalnego. Parame a trami sa˛ tu a, b, σ1 , σ2 , ρ. Grupujemy je w wektor m = , i macierz Σ = b 2 σ1 ρσ1 σ2 X i zapisujemy Z = ∼ N (m, Σ). Narysujmy kilka taρσ1 σ2 σ22 Y kich poziomic gestości ˛ 2-wymiarowych rozkładów normalnych dla różnych wartości parametrów σ1 , σ2 , ρ. Wpływ parametrów a i b jest łatwo dostrzegalny. Punkty (a, b) sa˛ środkami elips bed ˛ acych ˛ poziomicami ˛ Poza tym zauważmy, gestości. że 2 (x−b)2 (x−a)(y−b) − 2ρ + =c , poziomice g˛estości 6.0.2 sa˛ elipsami (x, y) : (x−a) σ1 σ2 σ21 σ22 dla różnych wartości c. A zatem na pierwszym rysunku mamy ma czarno narysowane poziomice g˛estości o parametrach σ 1 = 2, σ2 = 1, ρ = .5 dla c = 0, 5; 1; 1, 5 zaś na czerwono zaznaczono sa˛ poziomice dla tych samych wartości σ2 , σ2 i c ale z ρ = −.2. Na drugim zaś mamy takie same wartości ρ i c ale odwrócone role σ1 i σ2 : 6.1 Wielowymiarowe rozkłady normalne: G˛estość n−wymiarowego rozkładu normalnego ma postać: f(x) = 1 √ (2π)n/2 1 exp(− (x − m)T Σ−1 (x − m)) 2 det Σ (6.1.1) gdzie m ∈Rn , zaś Σ jest symetryczna˛ dodatnio określona˛ n × n- macierza. ˛ Piszemy X ∼ Nn (m, Σ) jeśli X ma taki rozkład. Później w nast˛epnym wykładzie, gdy bedzie ˛ mowa o przekształceniach liniowych zmiennych losowych pokażemy, 6.1. WIELOWYMIAROWE ROZKŁADY NORMALNE: 1 y 0.5 -2 -1 00 -0.5 -1 Rysunek 6.1: 2 x 1 -1 -0.50 0 0.5 1 y -1 -2 Rysunek 6.2: 1 x 2 37 WYKŁAD 6. ROZKŁAD NORMALNY(GAUSSA) 38 że funkcja (6.1.1) istotnie jest gestości ˛ a. ˛ Poziomice, czyli podzbiory Rn dla których gestości ˛ sa˛ stałe, sa˛ dla takiego rozkładu powierzchniami elipsoid. Wynika to z nastepuj ˛ acego ˛ rozumowania: Mamy Ec = {x ∈ Rn : f(x) = c} = x ∈ Rn : (x − m)T Σ−1 (x − m) = ć , √ gdzie zależność mie˛ dzy c i ć jest dana formuł a: ˛ ć = exp(c(2π)n/2 det Σ) . To, że zbiór Ec przedstawia soba˛ dla dodatnich ć powierzchnie elipsoid n- wymiarowych wynika z wiadomości z Algebry ( I semestr -formy kwadratowe). Rozkłady brzegowe n- wymiarowego rozkładu normalnego Nn+k (m,Σ) Przez X1 i X2 oznaczmy odpowiednio pierwszych n i ostatnich ˛ k współrzedX1 nych wektora X ∼ Nn+k (m, Σ), jednym słowem X = . Temu rozbiciu X2 wektora na dwa podwektory odpowiada w naturalny sposób rozbicie wektora m m1 na dwa podwektory m1 i m2 w taki sposób, że mamy: m = i rozbicie m2 macierzy Σ na cztery macierze Σ11 , Σ12 , Σ21 , Σ22 otrzymane w taki sposób, że Σ11 Σ12 . Σ11 jest n × n minorem głównym macierzy Σ otrzymanym Σ= Σ21 Σ22 z pierwszych n wierszy i pierwszych n kolumn macierzy Σ. Podobnie macierz Σ12 jest n × k podmacierza˛ otrzymana˛ z n pierwszych wierszy i k ostatnich kolumn macierzy Σ itd. Załóżmy, że Σ12 i Σ21 sa˛ macierzami zerowymi. −1 Σ11 0 −1 Wówczas mamy: Σ = (można sprawdzić, że tak jest wykonu0 Σ−1 22 jac ˛ sprawdzajace ˛ mnożenie macierzowe ΣΣ−1 = I. Ponadto mamy det Σ = det Σ11 det Σ22 . Zatem: T −1 (x − m)T Σ−1 (x − m) = (x1 − m1 )T Σ−1 11 (x1 − m1 ) + (x2 − m2 ) Σ22 (x2 − m2 ). (6.1.2) Oznaczmy: f1 (x1 ) = (2π)n/2 i f2 (x2 ) = (2π)k/2 1 1 √ exp(− (x1 − m1 )T Σ−1 11 (x1 − m1 )) 2 det Σ11 1 √ det Σ22 1 exp(− (x2 − m2 )T Σ−1 22 (x2 − m2 )). 2 Z formuły (6.1.2) wynika , że f (x) =f1 (x1 )f2 (x2 ). (6.1.3) Teraz zauważmy, że Rk f(x1 , x2 )dx1 = f2 (x2 ) Rk f1 (x1 )dx ˛ ć brze 1 . czyli gestoś gowa wektora X2 jest równa f2 (x2 ) razy pewna stała ( = Rk f1 (x1 )dx1 ). Widać wiec, ˛ że rozkład brzegowy X2 jest też normalny i ponadto, że jest postaci: Nk (m2 , Σ22 )!!!! Później, w nastepnym ˛ wykładzie, wynik ten zostanie uogólniony na macierze Σ nie tylko powyższej, specjalnej diagonalnej postaci. Rozumujac ˛ analogicznie otrzymamy: X1 ∼ Nn (m1 , Σ22 ). Zauważmy ponadto, że z formuły (6.1.3) wynika, że zmienne X1 i X2 sa˛ niezależne. 6.2. MOMENTY 6.2 6.2.1 39 Momenty Momenty 1-wymiarowe Niech X ∼ N(m, σ 2 ). ∞ ∞ 2 2 /2σ2 ) /2σ 2 ) √ √ Mamy EX = −∞ x exp(−(x−m) dx = −∞ (x − m) exp(−(x−m) dx + σ 2π σ 2π ∞ exp(−(x−m)2 /2σ2 ) √ m −∞ dx . Pierwsza z tych całek jest równa zeru (bo po zmiσ 2π anie zmiennych x − m −→ y całkujemy funkcje˛ parzysta˛ po symetrycznym przedziale) a druga jest równa m. Zatem EX = m 6.2.2 Momenty centralne ∞ 2 /2σ2 ) √ Oznaczmy mk = −∞ (x − m)k exp(−(x−m) dx. Zmieniajac ˛ zmienne na x − σ 2π m −→ y dostaniemy: mk = 0 ∞ √ y2j exp(−y 2 /(2σ 2 ))/(σ 2π)dy -∞ dla k = 2j + 1 dla k = 2j j = 0, 1, 2 . . . . Aby sprawnie obliczyć m√ 2j dla j = 1, 2, . . . zauważmy po pierwsze, że m2j = ∞ 2 0 y 2j exp(−y 2 /(2σ 2 ))/(σ 2π)dy a po drugie po zamianie zmiennych y 2 /(2σ 2 ) −→ z dostaniemy ∞ 2j Γ( 2j+1 ) 1 2j √ 2 m2j = σ2j √ z j− 2 e−z dz = σ2j π 0 π Zatem np. m2 = E(X − EX)2 = σ 2 , m4 = 3σ4 , m6 = 15σ6 itp. 6.2.3 Przypadek wielowymiarowy Załóżmy teraz, że X ∼ Nn (m, Σ), det Σ > 0. Rozważmy nastepuj ˛ acy ˛ wektor pomocniczy: Y = Σ−1/2 (X−m). Wiadomo, że a) Y ∼ Nn (0, I), b) współrzedne ˛ wektora Y sa˛ niezależne o jednakowych rozkładach N(0, 1). Każda z nich ma zatem wartość oczekiwana równa˛ zero i wariancj˛e równa˛ 1. Zatem 0 = EY = Σ−1/2 (EX − m), I = ΣY = Σ−1/2 ΣX Σ−1/2 . Aby wiec ˛ znaleźć, EX i ΣX trzeba rozwiazać ˛ te równania wektorowo macierzowe. Nie jest to trudne i łatwo znajdziemy: EX = m, ΣX = Σ ! Podsumujmy poprzednie informacje o zmiennych Gaussowskich. Niech X ∼ Nn (m, Σ), det Σ > 0, wówczas: • fX (x) = exp(− 12 (x−m)T Σ−1 (x−m)) (2π)n/2 (det Σ)1/2 • EX = m, ΣX = Σ. , x ∈ Rn . WYKŁAD 6. ROZKŁAD NORMALNY(GAUSSA) 40 • Niech XT = (X1T , X2T ), gdzie dim X1 = k i dim X2 = n jest rozbiciem wektora X. Niech dalej rozbiciu temu ˛ a˛ rozbiciu wektora m odpowiadajac Σ Σ 1 12 i macierzy Σ: mT = (mT1 ,mT2 ), Σ = , to X1 ∼ Nk (m1 , Σ1 ). ΣT12 Σ2 Dowód. Rozważmy nastepuj ˛ ace ˛ liniowe przekształcenie wektora losowego X: Y1 Y2 = X1 = X2 − m2 − ΣT12 Σ−1 11 (X1 − m1 ). czyli innymi słowy I Y1 df Y= = Y2 −ΣT12 Σ−1 11 0 I df X+ 0 −m2 + ΣT12 Σ−1 11 m1 = AX + b. Korzystajac ˛ teraz z własności(??) wnioskujemy, że Y∼ N(Am + b, AΣAT ). m1 Uzasadnienie, że Am + b = pozostawiamy czytelnikowi. Obliczmy 0 AΣAT . mamy: I 0 Σ1 Σ12 I −Σ−1 1 Σ12 (6.2.1) AΣAT = ΣT12 Σ2 −ΣT12 Σ−1 I 0 I 1 I 0 Σ1 −Σ12 + Σ12 = (6.2.2) −ΣT12 Σ−1 I ΣT12 Σ2 − ΣT12 Σ−1 1 1 Σ12 Σ1 0 = . 0 Σ2 − ΣT12 Σ−1 1 Σ12 Na podstawie własności brzegowych rozkładów normalnych dyskutowanych w cześci ˛ ?? wnosimy, że X1 = Y1 ∼ N (m1 , Σ1 ). • Niech A bedzie ˛ k ×n (k ≤ n) macierza˛ o pełnym rze˛ dzie (tzn. rz(A) = k). Oznaczmy Y = AX + b dla pewnego wektora b ∈Rk . Wówczas Y∼ N(Am + b, AΣAT ). Dowód opierajacy ˛ sie˛ na własności (??) i wyżej udowodnionej własności pozostawiamy czytelnikowi. 6.3 Warunkowa wartość oczekiwana wielowymiarowych wektorów gaussowskich. X1 m1 Σ1 ∼ Nn+k ( , X2 m2 Σ21 arowy wektor X o rozkładzie gaussowskim. wektora nazwano X1 zaś ostatnie k nazwano Niech X= Σ12 ) tzn. dany n + k wymiΣ2 Pierwsze n współrzednych ˛ tego X2 . Rozbiciu wektora X na dwa 6.3. WARUNKOWA WARTOŚĆ OCZEKIWANA WIELOWYMIAROWYCH WEKTORÓW GAUSSOWSKIC podwektory odpowiada rozbicie wektora m na dwa podwektory m1 m2 i rozbicie macierzy kowariancji Σ na 4 podmacierze n × n macierz Σ1 , n × k macierz Σ12 itd. Pierwszy etap: Przypuśćmy, że Σ12 = ΣT21 = 0, jak pamietamy ˛ z wykładu 6 zmienne X1 i X2 sa˛ niezależne zatem z własności ?? wynika, że dla i-tej współrzednej ˛ wektora X1 tj. X1i mamy E(X1i |X2 = x) = EX1i = m1i . Drugi etap: Podstawmy Y = X1 −m1 −Σ12 Σ−1 2 (X2 −m2 ) , T = X2 . Wiadomo wówczas np. z wykładu 6 (kurs MPS), że rozkład łaczny ˛ (Y, T) jest gaussowski naste˛ pujacej ˛ postaci: Y ∼ N n+k Am + b, AΣAT , T gdzie oznaczyliśmy I −Σ12 Σ−1 −m1 + Σ12 Σ−1 m2 2 2 A= ,b = . 0 I 0 0 Łatwo zauważyć, że Am + b = . Nieco trudniej zauważyć, że AΣAT = m2 Y Σ1 − Σ12 Σ−1 0 2 Σ21 . Zatem wektor ma własności rozważane w T 0 Σ2 etapie pierwszym. Wiec ˛ E(Y|T) =E(Y) = 0. Podstawiajac ˛ teraz czym jest Y i T dostaniemy: 0 = E(X1 − m1 − Σ12 Σ−1 (X − m )|X ˛ łatwo 2 2 2 ) . Stad 2 dostaniemy E(X1 |X2 ) = m1 + Σ12 Σ−1 2 (X2 − m2 )p.n.. Okazuje sie˛ ponadto, że wariancja warunkowa V (X1 |X2 ) = Σ1 − Σ12 Σ−1 2 Σ21 . Reasumujac: ˛ W przypadku rozkładów gaussowskich warunkowa wartość oczekiwana jest liniowa zaś wariancja warunkowa w przypadku rozkładów gaussowskich jest wiec ˛ nielosowa!!!!