dx generacji

Transkrypt

dx generacji
Rozkłady wielu zmiennych
Uogólnienie pojęć na rozkład wielu zmiennych

Dystrybuanta, gęstość prawdopodobieństwa,
rozkład brzegowy, wartości średnie i odchylenia
standardowe, momenty

Notacja macierzowa

Macierz kowariancji
■ Zamiana zmiennych
■ Transformacja gęstości prawdopodobieństwa
■ Transformacje liniowe
■ Propagacja błędów
■ Transformacje ortogonalne
■
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
1
Rozkłady wielu zmiennych
■
Dystrybuanta
F  x 1 ,x 2 , . . . ,x n  =P  X 1 <x 1 ,X 2 <x 2 , . . . ,X n <x n 
■
Gęstość prawdopodobieństwa
n
f  x 1 ,x 2 ,. . . ,x n  =
■
∂
F  x 1 ,x 2 ,. . . ,x n 
∂ x1 ∂ x 2 . . . ∂ x n
Gęstość rokładu brzegowego
g r  x r =∫ ...∫ f  x 1 ,x 2 ,... ,x n  dx 1 dx 2 ... dx r−1 dx r+1 ... dx n
to gęstość prawdopodobieństwa zmiennej xr
■ Podobnie mamy wartość oczekiwaną:
E { H  X 1 ,X 2 ,... ,X n  }=∫ ...∫ H  x 1 ,x 2 ,... ,x n  f  x 1 ,x 2 ,... ,x n  dx 1 dx 2 ... dx n
■
W szczególności dla H(x)=xr
E { x r }=∫ ...∫ x r f  x 1 ,x 2 ,... ,x n  dx 1 dx 2 ... dx n=∫ x r g r  x r  dx r
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
2
Niezależność. Łączne rozkłady brzegowe
■
Podobnie jak w przypadku dwuwymiarowym, dla
niezależności zmiennych musi być spełniony
warunek:
f  x 1 ,x 2 , . . . ,x n  =g 1  x 1  g 2  x 2  . . . g n  x n 
■
Definiujemy też łączną gęstość brzegową dla
dowolnych l spośród n zmiennych:
g
■

x 1 ,x , . . . ,x
2
l

=∫ . . .∫ f  x 1 ,x 2 , . . . ,x n  dx l+ 1 . . . dx n
Zmienne X1, ..., Xl są niezależne, gdy:
g  x 1 ,x 2 , . . . ,x l  =g 1  x 1  g 2  x 2  . . . g l  x l 
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
3
Momenty. Wariancje.
■
Momentami rzędu l1, l2, ..., ln nazywamy wartości
oczekiwane funkcji:
l1
l2
ln
H=x 1 x 2 .. . x n
i oznaczamy je symbolami
λl
■
W szczególności
100...0 =E { X 1 }= x 1
■
l1
1
l ...l
2
n
ln
010...0=E { X 2 }= x 2 ...
=E
1l ...l
2
n
{ X
1
1− x
000...1 =E { X n }=x n
l1
  X 2− x 2 
l2
. . .  X n− x n 
ln
}
Co pozwala na zapis wariancji:
μ 200 . . . 0 =E { X 1− x 1  } =σ 2  X 1 
■
l2
Momenty względem wartości średnich to:
μl
■
=E { X 1 X 2 . . . X n }
μ 020 . . . 0 =E { X 2 − x 2  } =σ 2  X 2  . . .
Oraz kowariancji między zmiennymi i i j:
c ij =cov  X i ,X
j
 =E { X i − x i  X j − x j  }
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
4
Notacja macierzowa
■
Naturalną reprezentacją dla n zmiennych x1, x2, ...,
xn jest wektor x w przestrzeni n-wymiarowej.
Możemy przedstawić wszelkie wielkości w notacji
wektorowej:
F=F  x 
- dystrybuanta
∂n
f  x =
F x
∂ x1 ∂ x 2 . . . ∂ x n
- gęstość prawdopodobieństwa
E { H  x  }=∫ H  x  f  x  d x
- wartość oczekiwana
E  X = x
- wartość średnia
x T = x 1 ,x 2 ,. . . ,x n 

x1
x
x= 2
⋮
xn
- notacja macierzowa
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
5
Macierz kowariancji
■
Szczególne znaczenie dla dalszych rozważań ma
tzw. macierz kowariancji

c 11 c 12 ... c 1 n
c
c
... c 2 n
C= 21 22
⋮
c n1 c n2 ... c nn

gdzie cij to kowariancja zmiennych i i j.
■ Elementy diagonalne to wariancje cii=σ2(xi)
■ Macierz jest symetryczna: cij = cji
■ W notacji macierzowej możemy napisać:
C=E {  X − 
x   X −
x
T
}
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
6
Zamiana zmiennych
Dowolna funkcja zmiennej losowej X, Y=Y(X), jest
również zmienną losową. Jaka jest gęstość
prawdopodobieństwa g(y), jeżeli znana jest f(x)?
y
y=y(x)
1,02cm
■
f  x dx= g  y dy
dy
g(y)
x
f(x)
dx
1,59
∣ ∣
dx
dx=∣ ∣dy
dy
dx
g  y=∣ ∣ f  x
dy
dy
dy=
dx
dx
x
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
7
Transformacja rozkładów
Można rozważać podobny problem. Mamy
zmienną losową X opisaną rozkładem
jednorodnym f(x). Jaka ma być funkcja Y=Y(X),
aby otrzymać zadaną g(y)?
y
y=y(x)=?
f  x dx= g  y dy
gdy f  x≡1
1,02cm
■
dy
dG  y≡g  y dy=dx
g(y)
x
x=G  y
dx
1,59
f(x)
∫ dx=∫ dG  y
y=G−1  x 
1
y min =G−1 0 , y max =G−1 1
0
1x
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
8
Zamiana zmiennych, funkcja 2d
■
Podobnie możemy dokonać zamiany zmiennych
dla funkcji dwóch zmiennych (X,Y)→(U,V):
U =U  X , Y 
■
Szukamy funkcji J:
V =V  X , Y 
y
∣  ∣
g u , v= f  x , y J
x,y
x a =x u , v
x b =x u , vdv 
x c = x udu , v
d
b
u ,v
y a =y u , v
y b =y u , vdv 
y c = y udu , v
v(x,y)+dv
dA
v(x,y)
c
u(x,y)+du
a
u(x,y)
x
Rozwijamy w szereg Taylora:
x b = x u , v
x c = x u , v
∂x
∂v
∂x
∂u
dv
y b =y u , v
du
y c = y u , v
∂y
∂v
∂y
∂u
dv
du
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
9
Jakobian
■
Obliczamy pole powierzchni dA:
∣
1
dA= 1
1
xa
xb
xc
∣∣
∂x
ya
∂u
yb =
∂x
yc
∂v
∣
∂y
∂u
du dv ≡ J
∂y
∂v


x,y
du dv
u ,v
czyli szukaną funkcją jest Jakobian
transformacji
■ Dla funkcji wielu zmiennych uogólniamy:
∂x
∂x
Y 1 =Y 1  X 
Y 2 =Y 2  X 
⋮
Y n =Y n  X 
∣  ∣
g  y = J
x
y
f  x
J
2
∂ y1
∂ y1
∂ x1
∂ x2
= ∂y
2
∂ y2

x
y
∣ ∣
1
...
...
∂ xn
∂ y1
∂ xn
∂ y2
...
∂ x1
∂ x2
∂ yn
∂ yn
...
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
∂ xn
∂ yn
10
Przykład zamiany zmiennych
f  x , y =1/2 ∗a  ,∣x∣∣ y∣a
2
■
Dokonujemy zamiany
zmiennych:
1
uv
2
⇔
1
y u , v = u−v
v  x , y = x− y
2
u  x , y = x y
■
Obliczamy Jakobian:
∂x 1
=
∂u 2
∂y 1
=
∂u 2
∂x 1
=
∂v 2
∂y
1
=−
∂v
2
J
■
g u , v =
x u , v =
 
x,y
1 1 1
1 1
= ⋅ − ⋅− =
u ,v
2 2 2
2 2
I otrzymujemy g(u,v):
1
f  x , y =1/ 4 ∗a 2  ,∣u∣a ;∣v∣a
2
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
11
Współrzędne sferyczne
f  x , y =1/∗R 2  ,  x 2  y 2R
■
Dokonujemy zamiany
zmiennych:
2
2
x r , =r cos 
r  x , y =  x  y
y ⇔
y r , =r sin 
 x , y =arctg  
x
■
Obliczamy Jakobian:
∂y y
∂x x
=
=
∂
r
r
∂r r
∂ x −y
∂y
x
= 2
= 2
∂
∂ r
r
x,y
x x
y y 1
J
= ⋅ 2 ⋅ 2=
u ,v
r r
r r
r
 
■
g r , =
I otrzymujemy g(r,φ):
1
f  x , y =1/r∗∗R 2 , 0 r R ;
r
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
12
Transformacje liniowe
■
Najczęściej posługujemy się transformacjami
liniowymi
Y 1 =a 1 t 11 X 1 t 12 X 2 ...t 1 n X n
Y 2 =a 2 t 21 X 1 t 22 X 2 ...t 2 n X n
⋮
Y r =a r t r1 X 1 t r2 X 2 ...t rn X n
■
Współczynniki t najwygodniej przedstawić w
postaci macierzy. Wtedy:
Y =T X a
E { Y }= y =T 
x a
C y = E { y− y  y− y  }
T
= E {T X a−T 
x −aT X a−T 
x −a  }
T
T
= E {T  X − 
x  X − 
x T }
T
=TE { X − 
x  X − 
x T } T T ,
C y =T C x T T ,
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
13
Propagacja błędów
■
Załóżmy, że znamy wartości pomiaru (X) oraz ich
błędy σ2x i kowariancje. Szukamy błędów Y(X).
Dokonujemy rozwinięcia w szereg Taylora wokół
wartości średnich:
 
Y i =Y i  x 
■
∂ yi
∂ x1
x= x
 
 X 1− x 1 ...
∂ yi
∂ xn
x= x
 X n − x n O 2
Ograniczając się do wyrazów liniowych mamy
transformację liniową o a=Yi(x) oraz:
 
∂ y1
∂ y1
∂ x1
∂ x2
∂ y2
∂ y2
T= ∂ x
1
∂ x2
⋮
∂ yn
∂ yn
∂ x1
∂ x2
...
...
...
∂ y1
∂ xn
∂ y2
∂ xn
∂ yn
∂ xn
x= x

KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
14
Prawo propagacji błędów
■
Możemy obliczyć macierz błędów wielkości Y:
T
C y =T C x T ,
Błędy zmiennych Y zależą od całej macierzy
kowariancji, a nie tylko od błedów zmiennej x.
■ Tylko i wyłącznie, gdy zmienne X są niezależne
czyli cij=0, dla i≠j, czyli gdy macierz Cx jest
diagonalna, możemy napisać:
■
n
 Y i =∑ j=1
2
■
 
∂ yi
∂xj
2
2
  X j
Co daje nam, po utożsamieniu σ z błędem
pomiarowym, prawo propagacji błędów:
 y i =

n
∑ j=1
 
∂ yi
∂xj
2
 x j 
2
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
15
Zamiana zmiennych - kowariancja
Sprawdźmy znaczenie macierzy kowariancji.
■ Przykład: eksperyment STAR mierzy pęd cząstki
poprzez pomiar pędu poprzecznego pT (z
krzywizny toru) i jego kąta azymutalnego φ. Dla
cząstki o pędzie pT=1 GeV niepewność pomiaru pT
jest ośmiokrotnie większa niż φ.
■
x= p T , 
y= p x , p y 
p x = p T cos 
p y = p T sin 
p T =1 GeV
=60
o
 
∂ px
∂ pT
T=
∂ py
∂ pT
∂ px
cos  − p T sin 
∂
=
∂ py
sin 
p T cos 
∂
1
T= 2
 3
2
− 3
2
1
2





2
8
C  p T , =
0
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
0
2
1

16
Kowariancja
■
Obliczamy nową macierz kowariancji:
Cp
■
x
, p =TC p
y
T
T
T
=
,

1 67
4 63  3

Jeśli zaniedbamy wyrazy niediagonalne i
dokonamy transformacji odwrotnej:
  
∂ pT
∂ px
T=
∂
∂ px
■
63  3
193
px
∂ pT
pT
∂ py
=
−py
∂
2
∂ py
pT
py
pT
px
pT
Cp
x
,p =
y

1 67
4 0
0
193

2
Otrzymamy następującą macierz kowariancji:
Cp
T
,  =TC p
T
x
, py
T =

1
646
126  3
16 126  3
394

KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
17
Transformacje ortogonalne
■
Mamy n funkcji y zależnych od n zmiennych x. Zakładamy
a=0. Stąd y=Rx. Żądamy, aby moduł długości wektora był
niezmiennikiem transformacji
n
■
Z założeń wynika, że:
2
2
R R= I , czyli ∑i=1 r ik r il =∂ kl
Jest to tzw. transformacja ortogonalna. Obliczmy
wyznacznik macierzy transformacji:
∣
r 11
r
D= 21
⋮
r n1
■
2
i
n
T
■
n
Y =∑i=1 Y = X =∑i=1 X i
2
r 12
r 22
r n2
...
...
...
∣
r1n
r2n
r nn
∣
1
0
2
D =
⋮
0
0
1
...
...
0
0
0
...
1
∣
czyli Jakobian J=± 1, zaś x=RTy.
Każdą transformację liniową Y1=r11X1+r12X2+...+r1nXn można
rozszerzyć do ortogonalnej przezn konstrukcję dodatkowych
2
r
=1
∑
funkcji Y2, ..., Yn z warunkiem
i=1 1 i
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
18