Rachunek prawdopodobienstwa i statystyka matematyczna

Transkrypt

Rachunek prawdopodobienstwa i statystyka matematyczna
Arkadiusz Kwoska
Rafał Kukliński
Informatyka sem.4 gr.2
Rachunek prawdopodobieństwa i statystyka matematyczna.
Zad 8.1)
a)
{(X,Y) : |X|≤a i |Y|≤a}
Zależność tą można przedstawić w postaci następującej interpretacji graficznej:
Y
a
a
a
X
a
Sprawdźmy, czy podane zmienne losowe są niezależne statystycznie. W tym celu można skorzystać z
następującej definicji niezależności statystycznej zmiennych losowych.
DEF.
Mówimy, że dwie zmienne losowe X i Y są statystycznie niezależne, gdy spełnione jest równanie:
P(X,Y)=P(X)P(Y)
Ponieważ
p
∫∫
ζ
P( X , Y ) =
XY
( x, y )dxdy
(Ω)
oraz
P( X ) =
p
∫
ζ
XY
( x, y )dx
(Ω)
Zatem niezależność statystyczną zmiennych losowych X iY możemy sprawdzić obliczając
odpowiednie rozkłady prawdopodobieństwa.
• Rozkład łączny:
P( X , Y ) =
+∞+∞
∫∫p
XY
− ∞−∞
•
+ a+ a
+ a+ a
−a − a
−a − a
( x, y )dxdy = ∫ ∫ p XY ( x, y )dxdy = p XY ( x, y ) ∫ ∫ dxdy =4a 2 p XY ( x, y )
Rozkłady brzegowe:
P( X ) =
P (Y ) =
∞
∫p
XY
−∞
∞
∫p
XY
( x, y )dx = 2a
( x, y )dy = 2a
−∞
Korzystając z definicji niezależności statystycznej zmiennych losowych sprawdzamy, czy:
4a2=2a*2a
4a2=4a2
Zatem możemy stwierdzić, że zmienne losowe X I Y są statystycznie niezależne.
Obliczmy teraz współczynnik korelacji zmiennych losowych X i Y.
Współczynnik korelacji dwóch zmiennych losowych X i Y ρXY możemy zdefiniować następująco:
ρ XY = Ε( X − ΕX )(Y − ΕY )
Ponieważ :
ΕX = ∫ xdFX ( x)
ζ (Ω)
Zatem w przypadku naszego zadania
ΕX = ΕY =
+∞
+a
−∞
−a
∫ xdFX ( x) = ∫ xdx =0
Zatem współczynnik korelacji ρXY wynosi
ρ XY = ΕXY
Ponieważ zmienne losowe są statystycznie niezależne możemy napisać:
ρ XY = ΕXY = ΕXΕY = 0 * 0 = 0
ODPOWIEDŹ: Zatem jak widać zmienne losowe X i Y są nieskorelowane. Jak można zauważyć z
powyższych obliczeń niezależne zmienne losowe są niekorelowalne.
b)
{(X,Y) : |X|+|Y|≤a}
Zależność tą można przedstawić w postaci następującej interpretacji graficznej:
Y
a
a
a
X
a
Tym razem skorzystajmy z innej definicji niezależności statystycznej dwóch zmiennych losowych X i
Y:
DEF.
Mówimy, że dwie zmienne losowe X i Y są statystycznie niezależne, gdy spełnione jest równanie:
pXY(x,y)=pX(x)pY(y)
Policzmy potrzebne rozkłady gęstości prawdopodobieństwa:
• Rozkład łączny
P( X , Y ) =
+∞+∞
∫∫p
−∞−∞
+ a+ a
XY
( x, y )dxdy = ∫ ∫ p XY ( x, y )dxdy =2a 2 p XY ( x, y )
− a −a
Korzystając z warunku normalizacyjnego:
2a 2 p XY ( x, y ) = 1
p XY ( x, y ) =
•
Rozkłady brzegowe
1
2a 2
pX ( X ) =
∞
∫ p XY ( x, y)dy =
−∞
a −| x|
∫p
XY
( x, y )dy =
− a +| x|
2a − 2 x
2a 2
Ponieważ pY można obliczyć w ten sam sposób;
2a − 2 y
pY ( y ) =
2a 2
Korzystając z definicji niezależności statystycznej zmiennych losowych sprawdzamy, czy:
pXY(x,y)=pX(x)pY(y)
1
2a - 2 | x | 2a - 2 | y |
≠
2
2a
2a 2
2a 2
Zatem zmienne losowe X i Y nie są statystycznie niezależne.
Obliczmy współczynnik korelacji korzystając ze wzorów podanych w poprzednim podpunkcie.
x2
EX = ∫ x ⋅ p X ( x ) ⋅ dx = p X ( x )
-∞
2
∞
a −| x|
=0
− a +| x|
∞
EY = ∫ y ⋅ p Y ( y ) ⋅ dy = 0
-∞
EXY = ∫
∞
∫
∞
−∞ − ∞
xy ⋅ p XY ( x, y )dx ⋅ dy =0
Zatem współczynnik korelacji ρXY=0-0*0=0.
ODPOWIEDŹ: Zmienne losowe X i Y są niekorelowalne. Jka można zauważyć z powyższych
rozważań fakt, że dwie zmienne losowe są niekorelowalne nie implikuje niezależności statystycznej
tychże zmiennych.
Zad 8.2)
Mamy dwie zmienne losowe dyskretne. O następującym łącznym rozkładzie prawdopodobieństwa:
Y
X
0
1
2
0
0,1
0
0,1
1
0,15
0,3
C2
2
0,05
c1
0,05
a) Czy można dobrać stałe c1 i c2 tak, aby X i Y były niezależne.
W celu sprawdzenie, czy zmienne można dobrać tak parametry c1 i c2 , aby zmienne losowe X i Y
były niezależne statystycznie posłużę się następującą definicją niezależności statystycznej dwóch
zmiennych dyskretnych:
DEF
Mówimy, że dwie zmienne losowe X i Y są statystycznie niezależne, gdy spełnione jest równanie:
P(X=xi,Y=yi)=P(X=xi)P(Y=yi)
Przy czym brzegowe rozkłady prawdopodobieństwa można obliczyć korzystając z zależności:
P ( X = xi ) = ∑ P ( X = xi , Y = y j )
j
Zatem sprawdzając warunek niezależności, sprawdźmy go w punkcie (X=0,Y=0), w którym wartości
prawdopodobieństwa nie zależą od parametrów.
P(X=0,Y=0)=0,1
2
P ( X = 0) = ∑ P ( X = 0, Y = y j ) = 0,1 + 0,15 + 0,05 = 0,3
j =0
2
P (Y = 0) = ∑ P ( X = xi , Y = 0) = 0,1 + 0 + 0,1 = 0,2
i =0
Jak widać
P(X=0,Y=0)≠P(X=0)P(Y=0)
Niezależnie od parametrów c1 i c2.
ODPOWIEDŹ: Nie można dobrać tak parametrów c1 i c2 , aby zmienne losowe X i Y były
statystycznie niezależne.
b) Czy można dobrać stałe c1 i c2 tak, aby X i Y były niekorelowalne.
Korzystając z definicji współczynnika korelacji
ρ XY = ΕXY − ΕXΕY ,
Definicji wartości średniej dla zmiennych losowych dyskretnych:
ΕX = ∑ xi P( X = xi )
xi ∈ζ ( Ω )
oraz rozkładów brzegowych zmiennych losowych X i Y możemy obliczyć:
EX=1*(0,3+c1)+2*(0,1+c2+0,05)=0,3+c1+0,3+2c2=0,6+c1+2c2
EY=1*(0,15+0,3+c2)+2*(0,05+c1+0,05)=0,45+c2+0,2+2c1=0,65+2c1+c2
EXY=1*1*0,3+1*2*c1+2*1*c2+2*2*0,05=0,5+2c1+2c2
Korzystając z faktu, że EXY=1, otrzymujemy
c1=0,25-c2
Co po podstawieniu do powyższych równań daje:
EX=1,1-c1
EY=0,9+c1
Ponieważ szukamy takich wartości parametrów c1 i c2 dla których zmienne losowe X i Y są
niekorelowalne musimy znaleźć rozwiązanie układu równań:
c1 = 0,25 − c2

ΕXY − ΕXΕY = 0
Po podstawieniu wartości EXY, EX oraz EY otrzymujemy:
1-(1,1-c1)(0,9+c1)=0
c12-0,2c1+0,01=0
Korzystając ze wzoru na kwadrat sumy dwuch czynników:
(c1-0,1)2=0
Zatem naszym rozwiązaniem są :
c1 = 0,1

c2 = 0,15
ODPOWIEDŹ: Zmienne losowe X i Y będą nieskorelowalne, gdy parametry c1 i c2 będą wynosiły
odpowiednio: c1=0,1 c2=0,15.
Zad 9.2) Znajdź pY jeżeli
a) Y=aX+b , pX – dowolna.
Ponieważ funkcja g(X)=aX+b jest różniczkowalna i monotoniczna znalezienie rozkładu gęstośći
prawdopodobieństwa pY(y) sprowadza się do następujących trzech kroków:
1) Rozwiązanie równania g(x)=y
y=xa+b
y −b
xk =
a
2) Obliczenie pochodnej g’(xk).
y −b
)=a
a
3) Obliczenie wartości wyrażenia:
p X ( xi )
pY ( y ) = ∑
xi :g ( xi ) = y | g ' ( xi ) |
Zatem:
p (x ) 1  y − b 
pY ( y ) = X k = p X 

a
a  a 
Wpływ stałych a i b na graficzną postać pY jest następujący:
a – odpowiada za zmianę skali (koniec przedziału <p,...,k>)
b – odpowiada za przesunięcie wykresu względem początku układu współrzędnych (początek
przedziału <p,...,k>.
1  y −b 
.
ODPOWIEDŹ: Otrzymany rozkład to : pY ( y ) = p X 
a  a 
g ' ( xk ) = g ' (
b) Y=exp(-X), gdzie pX=N(0,1)
N (0,1) =
1
e−
2π
x2
2
Podobnie jak w poprzednim przykładzie pY(y) znajdziemy poprzez wykonanie trzech kroków.
1) Rozwiązanie równania g(x)=y
y=exp(-x)
xk=-ln(y)
2) Obliczenie pochodnej g’(xk).
g ' ( xk ) = g ' (− ln( y )) = −e ln( y ) = − y
3) Obliczenie wartości wyrażenia:
p X ( xi )
pY ( y ) = ∑
xi :g ( xi ) = y | g ' ( xi ) |
Zatem:
−
ln( y )
y
−
1 e
1
pY ( y ) =
=−
e
2π − y
y 2π
ln( y )
2
−
ln( y )
y
ln( y )
−
1
ODPOWIEDŹ: Otrzymany rozkład to: p ( y ) = 1 e
=−
e 2 .
Y
2π − y
y 2π
Zad 10.2)
Zad 10.3) Zaprojektować generator liczb pseudolosowych o zadanym rozkładzie, mając do dyspozycji
generator o rozkładzie równomiernym w przedziale <0,...,1>.
a) Rozkład równomierny w przedziale <a,...,b>
Do zaprojektowania takiego generatora możemy wykorzystać wnioski jakie zauważyliśmy w
ćwiczeniu 9.9.a w tym sprawozdaniu. Należy zmienną losową uzyskaną na wyjściu posiadanego
generatora (X) przekształcić przekształceniem liniowym g(X) w taki sposób, aby otrzymana zmienna
losowa Y należała do przedziału <a,...,b>. Zatem
Y=cX+d
Otrzymany rozkład pY będzie wyrażał się wzorem:
1  y−d 
pX 

c  c 
Zatem początek przedziału będzie zależał od współczynnika d (dokładniej będzie mu równy), a
współczynnik c możemy obliczyć korzystając z faktu, że mamy przekształcić koniec przedziału b w 1:
b−a
1=
⇒c =b−a
c
Zatem przekształcenie liniowe przekształcające jest następujące:
Y = (b − a) X + b
Przykładowy program realizujący tą funkcję mógłby wyglądać nastęująco:
float randab(float a, float b)
{
return (b-a)random()+b;
}
gdzie:
a – początek przedziału
b – koniec przedziału
random() – generuje liczby o rozkładzie równomiernym z przedziału <0,…,1>
pY ( y ) =
b) Rozkład wykładniczy z parametrem a - pY(y)=aexp(-ay).
Ponieważ dystrybuanta rozkładu wykładniczego FY jest funkcją ciągłą i monotoniczną możemy więc
zastosować metodę odwracania dystrybuanty, która sprowadza się do następujących kroków:
1) losujemy x przy pomocy generatora random()
2) wyznaczamy y korzystając ze wzoru: y = FY-1(x)
Dystrybuanta rozkładu wykładniczego ma następującą postać:
FY ( y ) = 1 − e − ay
W celu zaprojektowania generatora musimy policzyć funkcję odwrotną tejże dystrybuanty, a więc:
1 - FY ( y ) = e − ay
1 − x = e − ay
ln (1 − x )
y=−
a
stąd:
ln (1 − x )
FY−1 ( x ) = y = −
a
Przykładowy program realizujący tą funkcję mógłby wyglądać nastęująco:
float randa(float a)
{
return ln(1-random())/a;
}
gdzie:
a – parametr rozkładu
random() – generuje liczby o rozkładzie równomiernym z przedziału <0,…,1>