Rachunek prawdopodobienstwa i statystyka matematyczna
Transkrypt
Rachunek prawdopodobienstwa i statystyka matematyczna
Arkadiusz Kwoska Rafał Kukliński Informatyka sem.4 gr.2 Rachunek prawdopodobieństwa i statystyka matematyczna. Zad 8.1) a) {(X,Y) : |X|≤a i |Y|≤a} Zależność tą można przedstawić w postaci następującej interpretacji graficznej: Y a a a X a Sprawdźmy, czy podane zmienne losowe są niezależne statystycznie. W tym celu można skorzystać z następującej definicji niezależności statystycznej zmiennych losowych. DEF. Mówimy, że dwie zmienne losowe X i Y są statystycznie niezależne, gdy spełnione jest równanie: P(X,Y)=P(X)P(Y) Ponieważ p ∫∫ ζ P( X , Y ) = XY ( x, y )dxdy (Ω) oraz P( X ) = p ∫ ζ XY ( x, y )dx (Ω) Zatem niezależność statystyczną zmiennych losowych X iY możemy sprawdzić obliczając odpowiednie rozkłady prawdopodobieństwa. • Rozkład łączny: P( X , Y ) = +∞+∞ ∫∫p XY − ∞−∞ • + a+ a + a+ a −a − a −a − a ( x, y )dxdy = ∫ ∫ p XY ( x, y )dxdy = p XY ( x, y ) ∫ ∫ dxdy =4a 2 p XY ( x, y ) Rozkłady brzegowe: P( X ) = P (Y ) = ∞ ∫p XY −∞ ∞ ∫p XY ( x, y )dx = 2a ( x, y )dy = 2a −∞ Korzystając z definicji niezależności statystycznej zmiennych losowych sprawdzamy, czy: 4a2=2a*2a 4a2=4a2 Zatem możemy stwierdzić, że zmienne losowe X I Y są statystycznie niezależne. Obliczmy teraz współczynnik korelacji zmiennych losowych X i Y. Współczynnik korelacji dwóch zmiennych losowych X i Y ρXY możemy zdefiniować następująco: ρ XY = Ε( X − ΕX )(Y − ΕY ) Ponieważ : ΕX = ∫ xdFX ( x) ζ (Ω) Zatem w przypadku naszego zadania ΕX = ΕY = +∞ +a −∞ −a ∫ xdFX ( x) = ∫ xdx =0 Zatem współczynnik korelacji ρXY wynosi ρ XY = ΕXY Ponieważ zmienne losowe są statystycznie niezależne możemy napisać: ρ XY = ΕXY = ΕXΕY = 0 * 0 = 0 ODPOWIEDŹ: Zatem jak widać zmienne losowe X i Y są nieskorelowane. Jak można zauważyć z powyższych obliczeń niezależne zmienne losowe są niekorelowalne. b) {(X,Y) : |X|+|Y|≤a} Zależność tą można przedstawić w postaci następującej interpretacji graficznej: Y a a a X a Tym razem skorzystajmy z innej definicji niezależności statystycznej dwóch zmiennych losowych X i Y: DEF. Mówimy, że dwie zmienne losowe X i Y są statystycznie niezależne, gdy spełnione jest równanie: pXY(x,y)=pX(x)pY(y) Policzmy potrzebne rozkłady gęstości prawdopodobieństwa: • Rozkład łączny P( X , Y ) = +∞+∞ ∫∫p −∞−∞ + a+ a XY ( x, y )dxdy = ∫ ∫ p XY ( x, y )dxdy =2a 2 p XY ( x, y ) − a −a Korzystając z warunku normalizacyjnego: 2a 2 p XY ( x, y ) = 1 p XY ( x, y ) = • Rozkłady brzegowe 1 2a 2 pX ( X ) = ∞ ∫ p XY ( x, y)dy = −∞ a −| x| ∫p XY ( x, y )dy = − a +| x| 2a − 2 x 2a 2 Ponieważ pY można obliczyć w ten sam sposób; 2a − 2 y pY ( y ) = 2a 2 Korzystając z definicji niezależności statystycznej zmiennych losowych sprawdzamy, czy: pXY(x,y)=pX(x)pY(y) 1 2a - 2 | x | 2a - 2 | y | ≠ 2 2a 2a 2 2a 2 Zatem zmienne losowe X i Y nie są statystycznie niezależne. Obliczmy współczynnik korelacji korzystając ze wzorów podanych w poprzednim podpunkcie. x2 EX = ∫ x ⋅ p X ( x ) ⋅ dx = p X ( x ) -∞ 2 ∞ a −| x| =0 − a +| x| ∞ EY = ∫ y ⋅ p Y ( y ) ⋅ dy = 0 -∞ EXY = ∫ ∞ ∫ ∞ −∞ − ∞ xy ⋅ p XY ( x, y )dx ⋅ dy =0 Zatem współczynnik korelacji ρXY=0-0*0=0. ODPOWIEDŹ: Zmienne losowe X i Y są niekorelowalne. Jka można zauważyć z powyższych rozważań fakt, że dwie zmienne losowe są niekorelowalne nie implikuje niezależności statystycznej tychże zmiennych. Zad 8.2) Mamy dwie zmienne losowe dyskretne. O następującym łącznym rozkładzie prawdopodobieństwa: Y X 0 1 2 0 0,1 0 0,1 1 0,15 0,3 C2 2 0,05 c1 0,05 a) Czy można dobrać stałe c1 i c2 tak, aby X i Y były niezależne. W celu sprawdzenie, czy zmienne można dobrać tak parametry c1 i c2 , aby zmienne losowe X i Y były niezależne statystycznie posłużę się następującą definicją niezależności statystycznej dwóch zmiennych dyskretnych: DEF Mówimy, że dwie zmienne losowe X i Y są statystycznie niezależne, gdy spełnione jest równanie: P(X=xi,Y=yi)=P(X=xi)P(Y=yi) Przy czym brzegowe rozkłady prawdopodobieństwa można obliczyć korzystając z zależności: P ( X = xi ) = ∑ P ( X = xi , Y = y j ) j Zatem sprawdzając warunek niezależności, sprawdźmy go w punkcie (X=0,Y=0), w którym wartości prawdopodobieństwa nie zależą od parametrów. P(X=0,Y=0)=0,1 2 P ( X = 0) = ∑ P ( X = 0, Y = y j ) = 0,1 + 0,15 + 0,05 = 0,3 j =0 2 P (Y = 0) = ∑ P ( X = xi , Y = 0) = 0,1 + 0 + 0,1 = 0,2 i =0 Jak widać P(X=0,Y=0)≠P(X=0)P(Y=0) Niezależnie od parametrów c1 i c2. ODPOWIEDŹ: Nie można dobrać tak parametrów c1 i c2 , aby zmienne losowe X i Y były statystycznie niezależne. b) Czy można dobrać stałe c1 i c2 tak, aby X i Y były niekorelowalne. Korzystając z definicji współczynnika korelacji ρ XY = ΕXY − ΕXΕY , Definicji wartości średniej dla zmiennych losowych dyskretnych: ΕX = ∑ xi P( X = xi ) xi ∈ζ ( Ω ) oraz rozkładów brzegowych zmiennych losowych X i Y możemy obliczyć: EX=1*(0,3+c1)+2*(0,1+c2+0,05)=0,3+c1+0,3+2c2=0,6+c1+2c2 EY=1*(0,15+0,3+c2)+2*(0,05+c1+0,05)=0,45+c2+0,2+2c1=0,65+2c1+c2 EXY=1*1*0,3+1*2*c1+2*1*c2+2*2*0,05=0,5+2c1+2c2 Korzystając z faktu, że EXY=1, otrzymujemy c1=0,25-c2 Co po podstawieniu do powyższych równań daje: EX=1,1-c1 EY=0,9+c1 Ponieważ szukamy takich wartości parametrów c1 i c2 dla których zmienne losowe X i Y są niekorelowalne musimy znaleźć rozwiązanie układu równań: c1 = 0,25 − c2 ΕXY − ΕXΕY = 0 Po podstawieniu wartości EXY, EX oraz EY otrzymujemy: 1-(1,1-c1)(0,9+c1)=0 c12-0,2c1+0,01=0 Korzystając ze wzoru na kwadrat sumy dwuch czynników: (c1-0,1)2=0 Zatem naszym rozwiązaniem są : c1 = 0,1 c2 = 0,15 ODPOWIEDŹ: Zmienne losowe X i Y będą nieskorelowalne, gdy parametry c1 i c2 będą wynosiły odpowiednio: c1=0,1 c2=0,15. Zad 9.2) Znajdź pY jeżeli a) Y=aX+b , pX – dowolna. Ponieważ funkcja g(X)=aX+b jest różniczkowalna i monotoniczna znalezienie rozkładu gęstośći prawdopodobieństwa pY(y) sprowadza się do następujących trzech kroków: 1) Rozwiązanie równania g(x)=y y=xa+b y −b xk = a 2) Obliczenie pochodnej g’(xk). y −b )=a a 3) Obliczenie wartości wyrażenia: p X ( xi ) pY ( y ) = ∑ xi :g ( xi ) = y | g ' ( xi ) | Zatem: p (x ) 1 y − b pY ( y ) = X k = p X a a a Wpływ stałych a i b na graficzną postać pY jest następujący: a – odpowiada za zmianę skali (koniec przedziału <p,...,k>) b – odpowiada za przesunięcie wykresu względem początku układu współrzędnych (początek przedziału <p,...,k>. 1 y −b . ODPOWIEDŹ: Otrzymany rozkład to : pY ( y ) = p X a a g ' ( xk ) = g ' ( b) Y=exp(-X), gdzie pX=N(0,1) N (0,1) = 1 e− 2π x2 2 Podobnie jak w poprzednim przykładzie pY(y) znajdziemy poprzez wykonanie trzech kroków. 1) Rozwiązanie równania g(x)=y y=exp(-x) xk=-ln(y) 2) Obliczenie pochodnej g’(xk). g ' ( xk ) = g ' (− ln( y )) = −e ln( y ) = − y 3) Obliczenie wartości wyrażenia: p X ( xi ) pY ( y ) = ∑ xi :g ( xi ) = y | g ' ( xi ) | Zatem: − ln( y ) y − 1 e 1 pY ( y ) = =− e 2π − y y 2π ln( y ) 2 − ln( y ) y ln( y ) − 1 ODPOWIEDŹ: Otrzymany rozkład to: p ( y ) = 1 e =− e 2 . Y 2π − y y 2π Zad 10.2) Zad 10.3) Zaprojektować generator liczb pseudolosowych o zadanym rozkładzie, mając do dyspozycji generator o rozkładzie równomiernym w przedziale <0,...,1>. a) Rozkład równomierny w przedziale <a,...,b> Do zaprojektowania takiego generatora możemy wykorzystać wnioski jakie zauważyliśmy w ćwiczeniu 9.9.a w tym sprawozdaniu. Należy zmienną losową uzyskaną na wyjściu posiadanego generatora (X) przekształcić przekształceniem liniowym g(X) w taki sposób, aby otrzymana zmienna losowa Y należała do przedziału <a,...,b>. Zatem Y=cX+d Otrzymany rozkład pY będzie wyrażał się wzorem: 1 y−d pX c c Zatem początek przedziału będzie zależał od współczynnika d (dokładniej będzie mu równy), a współczynnik c możemy obliczyć korzystając z faktu, że mamy przekształcić koniec przedziału b w 1: b−a 1= ⇒c =b−a c Zatem przekształcenie liniowe przekształcające jest następujące: Y = (b − a) X + b Przykładowy program realizujący tą funkcję mógłby wyglądać nastęująco: float randab(float a, float b) { return (b-a)random()+b; } gdzie: a – początek przedziału b – koniec przedziału random() – generuje liczby o rozkładzie równomiernym z przedziału <0,…,1> pY ( y ) = b) Rozkład wykładniczy z parametrem a - pY(y)=aexp(-ay). Ponieważ dystrybuanta rozkładu wykładniczego FY jest funkcją ciągłą i monotoniczną możemy więc zastosować metodę odwracania dystrybuanty, która sprowadza się do następujących kroków: 1) losujemy x przy pomocy generatora random() 2) wyznaczamy y korzystając ze wzoru: y = FY-1(x) Dystrybuanta rozkładu wykładniczego ma następującą postać: FY ( y ) = 1 − e − ay W celu zaprojektowania generatora musimy policzyć funkcję odwrotną tejże dystrybuanty, a więc: 1 - FY ( y ) = e − ay 1 − x = e − ay ln (1 − x ) y=− a stąd: ln (1 − x ) FY−1 ( x ) = y = − a Przykładowy program realizujący tą funkcję mógłby wyglądać nastęująco: float randa(float a) { return ln(1-random())/a; } gdzie: a – parametr rozkładu random() – generuje liczby o rozkładzie równomiernym z przedziału <0,…,1>