dx generacji
Transkrypt
dx generacji
Rozkłady wielu zmiennych Uogólnienie pojęć na rozkład wielu zmiennych Dystrybuanta, gęstość prawdopodobieństwa, rozkład brzegowy, wartości średnie i odchylenia standardowe, momenty Notacja macierzowa Macierz kowariancji ■ Zamiana zmiennych ■ Transformacja gęstości prawdopodobieństwa ■ Transformacje liniowe ■ Propagacja błędów ■ Transformacje ortogonalne ■ KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 1 Rozkłady wielu zmiennych ■ Dystrybuanta F x 1 ,x 2 , . . . ,x n =P X 1 <x 1 ,X 2 <x 2 , . . . ,X n <x n ■ Gęstość prawdopodobieństwa n f x 1 ,x 2 ,. . . ,x n = ■ ∂ F x 1 ,x 2 ,. . . ,x n ∂ x1 ∂ x 2 . . . ∂ x n Gęstość rokładu brzegowego g r x r =∫ ...∫ f x 1 ,x 2 ,... ,x n dx 1 dx 2 ... dx r−1 dx r+1 ... dx n to gęstość prawdopodobieństwa zmiennej xr ■ Podobnie mamy wartość oczekiwaną: E { H X 1 ,X 2 ,... ,X n }=∫ ...∫ H x 1 ,x 2 ,... ,x n f x 1 ,x 2 ,... ,x n dx 1 dx 2 ... dx n ■ W szczególności dla H(x)=xr E { x r }=∫ ...∫ x r f x 1 ,x 2 ,... ,x n dx 1 dx 2 ... dx n=∫ x r g r x r dx r KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 2 Niezależność. Łączne rozkłady brzegowe ■ Podobnie jak w przypadku dwuwymiarowym, dla niezależności zmiennych musi być spełniony warunek: f x 1 ,x 2 , . . . ,x n =g 1 x 1 g 2 x 2 . . . g n x n ■ Definiujemy też łączną gęstość brzegową dla dowolnych l spośród n zmiennych: g ■ x 1 ,x , . . . ,x 2 l =∫ . . .∫ f x 1 ,x 2 , . . . ,x n dx l+ 1 . . . dx n Zmienne X1, ..., Xl są niezależne, gdy: g x 1 ,x 2 , . . . ,x l =g 1 x 1 g 2 x 2 . . . g l x l KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 3 Momenty. Wariancje. ■ Momentami rzędu l1, l2, ..., ln nazywamy wartości oczekiwane funkcji: l1 l2 ln H=x 1 x 2 .. . x n i oznaczamy je symbolami λl ■ W szczególności 100...0 =E { X 1 }= x 1 ■ l1 1 l ...l 2 n ln 010...0=E { X 2 }= x 2 ... =E 1l ...l 2 n { X 1 1− x 000...1 =E { X n }=x n l1 X 2− x 2 l2 . . . X n− x n ln } Co pozwala na zapis wariancji: μ 200 . . . 0 =E { X 1− x 1 } =σ 2 X 1 ■ l2 Momenty względem wartości średnich to: μl ■ =E { X 1 X 2 . . . X n } μ 020 . . . 0 =E { X 2 − x 2 } =σ 2 X 2 . . . Oraz kowariancji między zmiennymi i i j: c ij =cov X i ,X j =E { X i − x i X j − x j } KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 4 Notacja macierzowa ■ Naturalną reprezentacją dla n zmiennych x1, x2, ..., xn jest wektor x w przestrzeni n-wymiarowej. Możemy przedstawić wszelkie wielkości w notacji wektorowej: F=F x - dystrybuanta ∂n f x = F x ∂ x1 ∂ x 2 . . . ∂ x n - gęstość prawdopodobieństwa E { H x }=∫ H x f x d x - wartość oczekiwana E X = x - wartość średnia x T = x 1 ,x 2 ,. . . ,x n x1 x x= 2 ⋮ xn - notacja macierzowa KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 5 Macierz kowariancji ■ Szczególne znaczenie dla dalszych rozważań ma tzw. macierz kowariancji c 11 c 12 ... c 1 n c c ... c 2 n C= 21 22 ⋮ c n1 c n2 ... c nn gdzie cij to kowariancja zmiennych i i j. ■ Elementy diagonalne to wariancje cii=σ2(xi) ■ Macierz jest symetryczna: cij = cji ■ W notacji macierzowej możemy napisać: C=E { X − x X − x T } KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 6 Zamiana zmiennych Dowolna funkcja zmiennej losowej X, Y=Y(X), jest również zmienną losową. Jaka jest gęstość prawdopodobieństwa g(y), jeżeli znana jest f(x)? y y=y(x) 1,02cm ■ f x dx= g y dy dy g(y) x f(x) dx 1,59 ∣ ∣ dx dx=∣ ∣dy dy dx g y=∣ ∣ f x dy dy dy= dx dx x KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 7 Transformacja rozkładów Można rozważać podobny problem. Mamy zmienną losową X opisaną rozkładem jednorodnym f(x). Jaka ma być funkcja Y=Y(X), aby otrzymać zadaną g(y)? y y=y(x)=? f x dx= g y dy gdy f x≡1 1,02cm ■ dy dG y≡g y dy=dx g(y) x x=G y dx 1,59 f(x) ∫ dx=∫ dG y y=G−1 x 1 y min =G−1 0 , y max =G−1 1 0 1x KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 8 Zamiana zmiennych, funkcja 2d ■ Podobnie możemy dokonać zamiany zmiennych dla funkcji dwóch zmiennych (X,Y)→(U,V): U =U X , Y ■ Szukamy funkcji J: V =V X , Y y ∣ ∣ g u , v= f x , y J x,y x a =x u , v x b =x u , vdv x c = x udu , v d b u ,v y a =y u , v y b =y u , vdv y c = y udu , v v(x,y)+dv dA v(x,y) c u(x,y)+du a u(x,y) x Rozwijamy w szereg Taylora: x b = x u , v x c = x u , v ∂x ∂v ∂x ∂u dv y b =y u , v du y c = y u , v ∂y ∂v ∂y ∂u dv du KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 9 Jakobian ■ Obliczamy pole powierzchni dA: ∣ 1 dA= 1 1 xa xb xc ∣∣ ∂x ya ∂u yb = ∂x yc ∂v ∣ ∂y ∂u du dv ≡ J ∂y ∂v x,y du dv u ,v czyli szukaną funkcją jest Jakobian transformacji ■ Dla funkcji wielu zmiennych uogólniamy: ∂x ∂x Y 1 =Y 1 X Y 2 =Y 2 X ⋮ Y n =Y n X ∣ ∣ g y = J x y f x J 2 ∂ y1 ∂ y1 ∂ x1 ∂ x2 = ∂y 2 ∂ y2 x y ∣ ∣ 1 ... ... ∂ xn ∂ y1 ∂ xn ∂ y2 ... ∂ x1 ∂ x2 ∂ yn ∂ yn ... KADD – Rozkłady wielu zmiennych. Generacja liczb losowych ∂ xn ∂ yn 10 Przykład zamiany zmiennych f x , y =1/2 ∗a ,∣x∣∣ y∣a 2 ■ Dokonujemy zamiany zmiennych: 1 uv 2 ⇔ 1 y u , v = u−v v x , y = x− y 2 u x , y = x y ■ Obliczamy Jakobian: ∂x 1 = ∂u 2 ∂y 1 = ∂u 2 ∂x 1 = ∂v 2 ∂y 1 =− ∂v 2 J ■ g u , v = x u , v = x,y 1 1 1 1 1 = ⋅ − ⋅− = u ,v 2 2 2 2 2 I otrzymujemy g(u,v): 1 f x , y =1/ 4 ∗a 2 ,∣u∣a ;∣v∣a 2 KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 11 Współrzędne sferyczne f x , y =1/∗R 2 , x 2 y 2R ■ Dokonujemy zamiany zmiennych: 2 2 x r , =r cos r x , y = x y y ⇔ y r , =r sin x , y =arctg x ■ Obliczamy Jakobian: ∂y y ∂x x = = ∂ r r ∂r r ∂ x −y ∂y x = 2 = 2 ∂ ∂ r r x,y x x y y 1 J = ⋅ 2 ⋅ 2= u ,v r r r r r ■ g r , = I otrzymujemy g(r,φ): 1 f x , y =1/r∗∗R 2 , 0 r R ; r KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 12 Transformacje liniowe ■ Najczęściej posługujemy się transformacjami liniowymi Y 1 =a 1 t 11 X 1 t 12 X 2 ...t 1 n X n Y 2 =a 2 t 21 X 1 t 22 X 2 ...t 2 n X n ⋮ Y r =a r t r1 X 1 t r2 X 2 ...t rn X n ■ Współczynniki t najwygodniej przedstawić w postaci macierzy. Wtedy: Y =T X a E { Y }= y =T x a C y = E { y− y y− y } T = E {T X a−T x −aT X a−T x −a } T T = E {T X − x X − x T } T =TE { X − x X − x T } T T , C y =T C x T T , KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 13 Propagacja błędów ■ Załóżmy, że znamy wartości pomiaru (X) oraz ich błędy σ2x i kowariancje. Szukamy błędów Y(X). Dokonujemy rozwinięcia w szereg Taylora wokół wartości średnich: Y i =Y i x ■ ∂ yi ∂ x1 x= x X 1− x 1 ... ∂ yi ∂ xn x= x X n − x n O 2 Ograniczając się do wyrazów liniowych mamy transformację liniową o a=Yi(x) oraz: ∂ y1 ∂ y1 ∂ x1 ∂ x2 ∂ y2 ∂ y2 T= ∂ x 1 ∂ x2 ⋮ ∂ yn ∂ yn ∂ x1 ∂ x2 ... ... ... ∂ y1 ∂ xn ∂ y2 ∂ xn ∂ yn ∂ xn x= x KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 14 Prawo propagacji błędów ■ Możemy obliczyć macierz błędów wielkości Y: T C y =T C x T , Błędy zmiennych Y zależą od całej macierzy kowariancji, a nie tylko od błedów zmiennej x. ■ Tylko i wyłącznie, gdy zmienne X są niezależne czyli cij=0, dla i≠j, czyli gdy macierz Cx jest diagonalna, możemy napisać: ■ n Y i =∑ j=1 2 ■ ∂ yi ∂xj 2 2 X j Co daje nam, po utożsamieniu σ z błędem pomiarowym, prawo propagacji błędów: y i = n ∑ j=1 ∂ yi ∂xj 2 x j 2 KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 15 Zamiana zmiennych - kowariancja Sprawdźmy znaczenie macierzy kowariancji. ■ Przykład: eksperyment STAR mierzy pęd cząstki poprzez pomiar pędu poprzecznego pT (z krzywizny toru) i jego kąta azymutalnego φ. Dla cząstki o pędzie pT=1 GeV niepewność pomiaru pT jest ośmiokrotnie większa niż φ. ■ x= p T , y= p x , p y p x = p T cos p y = p T sin p T =1 GeV =60 o ∂ px ∂ pT T= ∂ py ∂ pT ∂ px cos − p T sin ∂ = ∂ py sin p T cos ∂ 1 T= 2 3 2 − 3 2 1 2 2 8 C p T , = 0 KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 0 2 1 16 Kowariancja ■ Obliczamy nową macierz kowariancji: Cp ■ x , p =TC p y T T T = , 1 67 4 63 3 Jeśli zaniedbamy wyrazy niediagonalne i dokonamy transformacji odwrotnej: ∂ pT ∂ px T= ∂ ∂ px ■ 63 3 193 px ∂ pT pT ∂ py = −py ∂ 2 ∂ py pT py pT px pT Cp x ,p = y 1 67 4 0 0 193 2 Otrzymamy następującą macierz kowariancji: Cp T , =TC p T x , py T = 1 646 126 3 16 126 3 394 KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 17 Transformacje ortogonalne ■ Mamy n funkcji y zależnych od n zmiennych x. Zakładamy a=0. Stąd y=Rx. Żądamy, aby moduł długości wektora był niezmiennikiem transformacji n ■ Z założeń wynika, że: 2 2 R R= I , czyli ∑i=1 r ik r il =∂ kl Jest to tzw. transformacja ortogonalna. Obliczmy wyznacznik macierzy transformacji: ∣ r 11 r D= 21 ⋮ r n1 ■ 2 i n T ■ n Y =∑i=1 Y = X =∑i=1 X i 2 r 12 r 22 r n2 ... ... ... ∣ r1n r2n r nn ∣ 1 0 2 D = ⋮ 0 0 1 ... ... 0 0 0 ... 1 ∣ czyli Jakobian J=± 1, zaś x=RTy. Każdą transformację liniową Y1=r11X1+r12X2+...+r1nXn można rozszerzyć do ortogonalnej przezn konstrukcję dodatkowych 2 r =1 ∑ funkcji Y2, ..., Yn z warunkiem i=1 1 i KADD – Rozkłady wielu zmiennych. Generacja liczb losowych 18