funkcje zmiennej losowej. f-charakterystyczna. tw
Transkrypt
funkcje zmiennej losowej. f-charakterystyczna. tw
L.Kowalski –Funkcje zmiennych losowych FUNKCJE ZMIENNYCH LOSOWYCH Uwagi o rozkładzie funkcji zmiennej losowej jednowymiarowej. Jeśli X - skokowa, o funkcji prawdopodobieństwa P(X = xi) = pi, g - dowolna to funkcja prawdopodobieństwa zmiennej losowej Y = g(X) ma postać: g(x1) g(x2) ... g(xk) p1 p2 ... pk Po uporządkowaniu rosnąco wartości g(xi) i zsumowaniu odpowiednich prawdopodobieństw. Dokładniej P (Y = y ) = P ( g ( X ) = y ) = P U ( X = xi ) = ∑ P ( X = xi ) = ∑ pi {i: g ( xi ) = y } {i: g ( xi ) = y } {i: g ( xi ) = y} Przykład. X - zmienna losowa skokowa o funkcji prawdopodobieństwa: -4 -2 -1 0 1 2 0,4 0,1 0,1 0,1 0,1 0,2 wyznaczymy funkcję prawdopodobieństwa zmiennej losowej Y = sgnX . sgn(-4) = sgn(-2) = sgn(-1) = -1. sgn(0) = 0. sgn(1) = sgn(2) = 1. Zatem funkcja prawdopodobieństwa zmiennej losowej Y jest następująca -1 0 1 0,6 0,1 0,3 X - dana zmienna losowa ciągła o gęstości f. Y = g(X) g - borelowska, tzn. g-1(B) ∈B(R) dla B ∈B(R), Wyznaczyć gęstość g(y) zmiennej losowej Y. 1) Jeśli g - ściśle monotoniczna i różniczkowalna w przedziale (a, b) koncentracji X to: g ( y ) = f (h( y ) ) h ' ( y ) gdzie h = g-1. Należy pamiętać o przekształceniu przedziału koncentracji. Przykład. y −b 1 Y = aX + b, wtedy g ( y ) = f , a a Przykład. 0 Jeśli X ma rozkład o gęstości f ( x) = − x e dla x ≤ 0 dla x > 0 Y = X − 2, 2 wtedy h( y ) = ( y + 2 ) , h′( y ) = 2( y + 2) , g(0) = -2, g(∞) = ∞, 1 L.Kowalski –Funkcje zmiennych losowych dla x ≤ −2 0 g ( y) = 2 2( y + 2)e − ( y + 2) dla x > −2 , 2) Jeśli g - przedziałami ściśle monotoniczna i różniczkowalna w przedziale (a, b) koncentracji X to: k g ( y ) = ∑ f (hi ( y ) ) hi ( y) ' i =1 gdzie hi - funkcje odwrotne do g dla poszczególnych przedziałów, k - liczba wartości funkcji odwrotnej odpowiadających danemu y. Przykład. Y = |X|, wtedy Przykład. Y = X2, wtedy g ( y ) = f (− y ) + f ( y ) y > 0 , ( g ( y) = f − y )2 1 y + f ( y )2 1 y y > 0, W niektórych zagadnieniach wyznaczania rozkładu funkcji zmiennej losowej najpierw wyznaczamy dystrybuantę rozkładu zmiennej losowej Y = g(X), wg schematu FY ( y ) = P(Y < y ) = P( g ( X ) < y ) = P X ∈ g −1 ((−∞, y ) ) < y następnie jeśli to możliwe, wyznaczamy funkcję prawdopodobieństwa (gdy jest to rozkład skokowy) lub gęstość (gdy jest to rozkład ciągły). Przykład. Jeśli X ma rozkład o gęstości 0 dla x ∉ [0 , 3] (rozkład jednostajny na [0, 3]) f ( x) = 1 dla x ∈ [ 0 , 3 ] 3 Y = max(2, X ) , ( ) dla y ≤ 2 0 wtedy FY ( y ) = P(Y < y ) = P(max(2, X ) < y ) = 1 y 3 1 dla 2 < y ≤ 3 dla y > 3 Nie jest to ani rozkład skokowy ani ciągły. Nie można więc wyznaczyć ani funkcji prawdopodobieństwa ani gęstości. Jest to rozkład mieszany skokowo - ciągły i zgodnie z twierdzeniem o rozkładzie dystrybuanty powyższą dystrybuantę można przedstawić w postaci FY = c1F1 + c2 F2 gdzie 0 c1 = 2/3, F1 ( y ) = 1 dla y ≤ 2 dla y > 2 2 , L.Kowalski –Funkcje zmiennych losowych 0 c2 = 1/3, F2 ( y ) = y - 2 1 dla y ≤ 2 dla 2 < y ≤ 3 , dla y > 3 Funkcje zmiennych losowych 2 wymiarowych. (X1, X2) - dana zmienna losowa ciągła o gęstości f. Y = g(X1, X2) Dystrybuanta tej zmiennej losowej ma postać ∫∫ f ( x , x G( y) = ( g ( x1 , x2 )< y ) 1 g - borelowska, 2 )dx1dx2 gęstość g(y) wyznaczamy przez różniczkowanie. Przykład. G( y) = Y = X1⋅X2 , 0 ∞ ∞ y / x1 f ( x , x )dx dx + f ( x , x )dx dx = f ( x , x ) dx dx 1 2 1 2 1 2 2 1 1 2 2 1 ∫∫ ∫ ∫ ∫ ∫ x1 ⋅ x2 < y 0 −∞ − ∞ y / x1 g ( y) = wtedy ∞ 0 1 y 1 y ∫−∞ x f ( x, x )dx + ∫0 x f ( x, x )dx Przykład. (X1, X2) - zmienna losowa o rozkładzie jednostajnym w kwadracie (0, 1) x (0, 1). Wyznaczyć rozkład pola prostokąta o bokach x1, x2 tzn. zmiennej losowej Y = X1⋅X2 . 1 1 G ( y ) = ∫∫ dx1dx2 = 1 − ∫∫ dx1dx2 = 1 − ∫ ∫ dx2 dx1 = y (1 − ln y ) x1 ⋅ x 2 < y x1 ⋅ x 2 ≥ y y y / x1 dla 0 < y ≤ 1 stąd dla y ≤ 0 0 G ( y ) = y (1 − ln y ) dla 0 < y ≤ 1 1 dla 1 < y zatem g(y) = -lny Przykład. dla 0 < y ≤ 1 Y = X2/X1 , 0 ∞ ∞ y ⋅ x1 G ( y ) = ∫ ∫ f ( x1 , x2 ) dx2 dx1 + ∫ ∫ f ( x1 , x2 ) dx2 dx1 − ∞ y ⋅ x1 0 −∞ wtedy 0 ∞ −∞ 0 g ( y ) = − ∫ xf ( x, yx)dx + ∫ xf ( x, yx)dx Przykład. X1, X2 - niezależne zmienne losowe. X1 - N(0, σ1), X2 - N(0, σ2). ~ X ~ Niech X 1 = 1 , X 2 = X 2 (mają rozkład N(0, 1). σ1 σ2 3 L.Kowalski –Funkcje zmiennych losowych ~ −x2 / 2 ∞ ~ e − yx / 2 e − x / 2 e − yx / 2 1 ⋅ dx + ∫ x ⋅ ⋅ dx = π 1 + ~y 2 2π 2π 2π 2π −∞ 0 (rozkład Cauchy'ego) i korzystając funkcji liniowej od zmiennej losowej Y = Y~ σ 1 mamy 0 e g~( ~ y) = − ∫ x ⋅ 2 2 2 ( ) σ2 g ( y) = 1 2 σ 2 2 σ1 π 1 + y σ1 σ2 Przykład. Y = X1 + X2 , y − x1 G ( y ) = ∫ ∫ f ( x1 , x2 ) dx2 dx1 −∞ −∞ ∞ g ( y) = wtedy ∞ ∫ f ( x, y − x)dx = −∞ ∞ ∫ f ( y − x, x)dx −∞ Uwaga. Jeśli X1, X2 - niezależne zmienne losowe to gęstość sumy wyraża się splotem gęstości brzegowych (p. dalej). Przykład. Y = X1 - X2 , g ( y) = wtedy ∞ ∞ −∞ −∞ ∫ f ( x, x − y)dx = ∫ f ( x − y, x)dx Suma niezależnych zmiennych losowych. Własności: 1) X, Y niezależne skokowe zmienne losowe o funkcjach prawdopodobieństwa P(X = xi), P(Y = yj); wtedy funkcja prawdopodobieństwa zmiennej losowej X + Y wyraża się wzorem: P(Z = zk) = ∑ P(X = xi)P(Y = zk - xj); (zk = xi + yj) 2) X, Y niezależne ciągłe zmienne losowe o gęstościach f1 i f2 ; wtedy gęstość zmiennej losowej X + Y wyraża się wzorem: f ( x) = ∞ ∫ f (t ) f 1 −∞ 2 ( x − t )dt = ∞ ∫ f (x − t) f 1 2 (t )dt −∞ (splot gęstości składników). Funkcje zmiennych losowych n - wymiarowych. Przykład. System składa się n układów z których każdy ma czas bezawaryjnej pracy określony rozkładem wykładniczym Xi o parametrze ai niezależnym od pozostałych układów. Wyznaczyć rozkład bezawaryjnego czasu pracy całego systemu (system działa jeśli pracuje chociaż jeden układ). Y = X1 + X2 + X3 + ....+ Xn, 4 L.Kowalski –Funkcje zmiennych losowych Przez indukcję pokazuje się, że Y ma rozkład o gęstości: g ( y) = n n (− 1)n −1 ∏ ai ∑ i =1 j =1 e ∏ (a n k =1 k≠ j wtedy G( y) = −a j y n n i =1 j =1 j − ak ) 1− e (− 1)n−1 ∏ ai ∑ ∏ (a n k =1 k≠ j dla y > 0 j −a j y − ak ) Otrzymany rozkład nazywamy uogólnionym rozkładem Erlanga n - tego rzędu Tn. n n 1 E (Tn ) = E ∑ Ti = ∑ k =1 k =1 a k n n 1 D 2 (Tn ) = D 2 ∑ Ti = ∑ 2 k =1 k =1 ak gdy a1 = a2 = ... = an =λ g ( y) = to λ (λt ) n −1 ( n − 1)! e − λt = λP( n − 1, λt ) t > 0 gdzie P(n-1, λt) jest rozkładem Poissona. Przykład. Y = min(X1 , X2 ) G ( y ) = F1 ( y ) + F2 ( y ) − F ( y , y ) wtedy g ( y) = y f1 ( y) + f 2 ( y) − y ∫ f ( y, x)dx − ∫ f ( x, y )dx −∞ −∞ Uwaga. Jeśli X1, X2 - niezależne zmienne losowe to: G ( y ) = F1 ( y ) + F2 ( y ) − F1 ( y ) ⋅ F2 ( y ) g ( y ) = f 1 ( y)(1 − F2 ( y )) + f 2 ( y )(1 − F1 ( y )) Jeśli X1, X2 - niezależne zmienne losowe o takim samym rozkładzie to: G ( y ) = F ( y )(2 − F ( y )) wtedy g ( y) = 2 f ( y )(1 − F ( y )) Przykład. Y = max(X1 , X2 ) G ( y ) = F ( y, y ) wtedy g ( y) = y ∫ −∞ y f ( y, x)dx + ∫ f ( x, y)dx −∞ Uwaga. Jeśli X1, X2 - niezależne zmienne losowe o takim samym rozkładzie to: G( y) = F 2 ( y) g ( y ) = 2 f ( y) F ( y) Rozkład funkcji od rozkładu normalnego. wtedy (X1 , X2 , X3 ,...., Xn) - rozkład normalny. Y = g(X1 , X2 , X3 ,...., Xn), należy wyznaczyć rozkład Y. Przykład. Y = a1X1 + a2X2 + a3X3 +....+ a3Xn + b 5 dla y > 0 L.Kowalski –Funkcje zmiennych losowych n=2 g ( y) = − ( y −my )2 1 e σ y 2π 2σ 2y σ = a12σ 12 + a 22σ 22 + 2a1 a2 rσ 1 σ 2 , 2 y gdzie: my = a1m1 + a2m2 + b, Przez indukcję można pokazać, że dla dowolnego n Y ma rozkład normalny o parametrach: my = a1m1 + a2m2 + ... +anmn + b, σ y2 = ∑ ai2σ i2 + 2∑ ai a j rijσ i σ j , i< j Przykład. X1 , ..., Xn - niezależne, o rozkładzie N(0, 1). Y n = X 12 + .... + X n2 ma rozkład chi kwadrat n2 −1 − 2y y e x>0 n f ( y) = 2 n 2 Γ 2 0 x≤0 n ∈N EX = n; D2X = 2n Przykład. X - N(m, σ), Y = eX Ma rozkład logarytmiczno-normalny. Nazwa pochodzi stąd, że X = lnY ma rozkład normalny. FUNKCJA CHARAKTERYSTYCZNA Własności zmiennych losowych można również badać korzystając z przekształcenia Fouriera (Fouriera-Stieltiesa), prowadzi to do pojęcia funkcji charakterystycznej. Najważniejszym zastosowaniem funkcji charakterystycznych jest badanie własności sum niezależnych zmiennych losowych i porównywanie rozkładów. Funkcję ϕ : R → C (zespoloną zmiennej rzeczywistej) określoną wzorem ∞ ϕ (t ) = ϕ X (t ) = E (e itX ) = ∫ e itx dF ( x) , t∈R −∞ nazywamy funkcją charakterystyczną zmiennej losowej X. Zatem dla zmiennej losowej skokowej o funkcji prawdopodobieństwa P( X = xk ) = p k ϕ (t ) = ∑ pk e itx , k t∈R k natomiast dla zmiennej losowej ciągłej o gęstości f(x) ϕ (t ) = ∞ ∫ f ( x)e itx dx , t∈R −∞ Powyższy szereg i całka są bezwzględnie zbieżne do 1 (bo wartości modułu zmiennej losowej eitX , t∈R są równe 1 i odpowiednio ∑ pk = 1 , k charakterystyczna zawsze istnieje. 6 ∞ ∫ f ( x)dx =1 ), −∞ zatem funkcja L.Kowalski –Funkcje zmiennych losowych Własności funkcji charakterystycznej. a) ϕ (0) = 1, ϕ (t ) ≤ 1, t ∈ R , b) ϕ jest funkcją jednostajnie ciągłą, itb c) ϕ aX +b (t ) = e ϕ X (ta) , d) jeśli istnieje E X EX = k k < ∞, k ≥ 1 , to ϕ jest funkcją klasy Ck oraz ϕ (k ) (0) = i k EX k , czyli ϕ ( k ) ( 0) , ik e) jeśli istnieje i jest skończona pochodna ϕ (2k ) (0) to EX 2 k < ∞, k ≥ 1 f) ϕ X (t ) = ϕ X (−t ) = ϕ − X (t ) g) jeśli X, Y - niezależne zmienne losowe to ϕ X + Y (t ) = ϕ X (t )ϕY (t ) , h) funkcja charakterystyczna określa rozkład zmiennej losowej jednoznacznie. Ad. b) ϕ (t + h) − ϕ (t ) = Ee i (t + h ) X − Ee itX = ( ( )) ( ) ( = E eitX e ihX − 1 ≤ E e itX e ihX − 1 = E e ihX − 1 )→ 0 h →0 Ponieważ ostatnie wyrażenie nie zależy od t to zbieżność jest jednostajna. Ad. c) ϕ aX +b (t ) = Eeit (aX +b ) = eitb Ee iatX = e itbϕ X (ta) , Ad. d) (dla zmiennej losowej ciągłej). Ponieważ rozpatrywana funkcja jest jednostajnie ciągła to można różniczkować względem t pod znakiem całki i wtedy ∞ ϕ ′ (t ) = i ∫ xf ( x)eitx dx , stąd ϕ ′(0) = i EX −∞ Przez indukcję można pokazać, że (k ) ϕ (t ) = i ∞ k ∫x k f ( x)e itx dx , stąd ϕ (k ) (0) = i k EX k −∞ Ad. g) ϕ X +Y (t ) = Eeit ( X +Y ) = E (e itX eitY ) = EeitX Ee itY = ϕ X (t )ϕY (t ) Funkcje charakterystyczne podstawowych rozkładów zostały podane w ich zestawieniu, wyprowadzimy niektóre z tych wzorów. Przykład. Wyznaczymy funkcję charakterystyczną rozkładu dwumianowego. n P( X = k ) = p k q n− k gdzie q = 1 – p k k = 0, 1, 2, ... , n. n n n n k n ϕ (t ) = ∑ p k q n − k eitk = ∑ peit q n − k = peit + q k =0 k k =0 k ( ) ( 7 ) L.Kowalski –Funkcje zmiennych losowych Przykład. Wyznaczymy funkcję charakterystyczną rozkładu wykładniczego. ae − ax x>0 f ( x) = x≤0 0 ∞ ∞ 0 0 ϕ (t ) = ∫ ae −ax e itx dx = a ∫ e (it −a )x dx = a a − it Przykład. Wyznaczymy funkcję charakterystyczną zmiennej losowej Y o rozkładzie N(m, σ). f ( x) = 1 σ 2π − e ( x −m )2 2 2σ x∈R Najpierw wyznaczymy funkcję charakterystyczną zmiennej losowej X o rozkładzie N(0, 1). 1 1 2 x 2 − 2itx + i 2 t 2 ∞ ∞ − + 2 i t − x itx 2 1 1 ϕ (t ) = ∫ e 2 e dx = dx = ∫e 2 2 2π −∞ =e − 1 2 t2 2π ( ) 1 2 x − it ∞ − 2 dx ∫e ∞42444 12π4−4 3 1 =e −∞ − 1 2 t2 =1 Ponieważ Y = σX + m to korzystając z własności c) funkcji charakterystycznej ϕ aX +b (t ) = e ϕ X (ta) mamy ϕ Y (t ) = e ϕ X (tσ ) = e e itb itm itm − t 2σ 2 2 =e itm − t 2σ 2 2 Przykład. Wyznaczymy za pomocą funkcji charakterystycznej moment rzędu 4 zmiennej losowej X o rozkładzie N(0, 1). Mamy ϕ (t ) = e − t2 2 , zatem ϕ ′(t ) = −te ϕ (4 ) (t ) = (t 4 − 6t 2 + 3)e stąd m4 = t2 − 2 , − t2 2 ( ) , ϕ ′′(t ) = t − 1 e 2 − t2 2 ( ) , ϕ ′′′(t ) = − t + 3t e 3 − t2 2 , ϕ ( 4 ) ( 0) = 3 , 3 = 3. i4 Wniosek. Kurtoza tej zmiennej losowej wynosi 3. Przykład. Pokażemy, że suma niezależnych zmiennych losowych o rozkładzie Poissona z parametrami λ1, λ2 jest również zmienną losową o rozkładzie Poissona o parametrze λ1 + λ2. Zmienna losowa o rozkładzie Poissona z parametrem λ1 + λ2 ma funkcję charakterystyczną ϕ (t ) = e(λ + λ )(e −1) it 1 suma niezależnych zmiennych losowych o λ1, λ2 ma funkcję charakterystyczną (własność g)) 8 2 rozkładzie Poissona z parametrami L.Kowalski –Funkcje zmiennych losowych ϕ X +Y (t ) = eλ (e −1)eλ (e −1) = e(λ + λ )(e −1) it it 1 it 2 1 2 Z równości funkcji charakterystycznych wynika równość rozkładów (funkcja charakterystyczna określa rozkład zmiennej losowej jednoznacznie). Stąd prawdziwość postawionej tezy. W szczególnych przypadkach można (korzystając z retransformaty) na podstawie funkcji charakterystycznej wyznaczyć rozkład zmiennej losowej . Własność 1. Jeśli funkcja charakterystyczna ϕ zmiennej losowej X jest bezwzględnie całkowalna, to X jest zmienną losową ciągłą i gęstość jej wyraża się wzorem f ( x) = 1 2π ∞ ∫ ϕ (t )e −itx dt −∞ Własność 2. Jeśli funkcja charakterystyczna ϕ zmiennej losowej X jest okresowa o okresie 2π, to X jest zmienną losową skokową o wartościach całkowitych i jej funkcja prawdopodobieństwa wyraża się wzorem P( X = k ) = 1 2π π ∫πϕ (t )e −itk k - liczba całkowita dt − Przykład. Wyznaczymy rozkład prawdopodobieństwa zmiennej losowej, której funkcja charakterystyczna ma postać ϕ (t ) = e3it . Jest to funkcja okresowa o okresie 2π, zatem X jest zmienną losową skokową o wartościach całkowitych i jej funkcja prawdopodobieństwa wyraża się wzorem π π gdy k = 3 1 1 1 it 3 −itk P( X = k ) = e e dt = e it 3 / k dt = ∫ ∫ gdy k ≠ 3 2π −π 2π −π 0 Zatem X ma rozkład jednopunktowy P(X = 3) = 1. Funkcja tworząca. Jeśli X jest zmienną losową przyjmującą nieujemne wartości całkowite i mającą rozkład określony funkcją prawdopodobieństwa P( X = k ) = p k k = 0,1, 2, .... to jej funkcją tworzącą nazywamy zespolony szereg potęgowy ∞ Ψ ( s ) = ΨX ( s ) = ∑ pk s k k =0 Przy czym jeśli pewne wartości k nie są punktami skokowymi to odpowiednie składniki powyższej sumy są równe zero. Zauważmy, że powyższą funkcję można formalnie określić jako Ψ ( s ) = E s X . Z własności funkcji prawdopodobieństwa wynika, że powyższy szereg potęgowy jest zbieżny przynajmniej dla s ≤ 1 . Zatem z własności zespolonych szeregów potęgowych wynika, że ( ) Ψ (s ) jest funkcją analityczną wewnątrz koła jednostkowego s < 1 . 9 L.Kowalski –Funkcje zmiennych losowych Funkcja tworząca jednoznacznie określa rozkład prawdopodobieństwa zmiennej losowej o nieujemnych wartościach całkowitych, bowiem 1 dk Ψ ( s ) s =0 k = 0,1, 2, .... k! ds k Niekiedy do wyznaczania k stosuje się całkę Cauchy’ego Ψ (s) 1 pk = ds 0 <r ≤1 ∫ 2πi s = r s k +1 pk = (wartość tej całki można wyznaczyć za pomocą twierdzenia o residuach). Jeśli Ψ (s ) jest funkcja wymierną to stosujemy rozkład na ułamki proste. Przykład. Rozkład zerojedynkowy P ( X = 1) = p , P ( X = 0) = q ma funkcję tworzącą Ψ ( s ) = q + ps gdzie q = 1 − p Funkcja tworząca sumy niezależnych zmiennych losowych jest równa iloczynowi funkcji tworzących poszczególnych składników. Przykład. n Rozkład dwumianowy P ( X = k ) = p k q n− k k = 0,1, 2, ...., n gdzie q = 1 − p k ma funkcję tworzącą n Ψ ( s ) = (q + ps ) Uzasadnienie: rozkład dwumianowy jest sumą n niezależnych rozkładów zerojedynkowych. Przykład. Rozkład Poissona P ( X = k ) = λk k! e −λ k = 0,1, 2, .... λ >0 ma funkcję tworzącą Ψ ( s ) = e − λ (1− s ) Jeśli dla zmiennej losowej X istnieje moment rzędu drugiego, to m = Ψ ′(1) m2 = Ψ ′′(1) + Ψ ′(1) zatem 2 D 2 X = Ψ ′′(1) + Ψ ′(1) − [Ψ ′(1)] Uwaga. Ponieważ ΨX (e it ) = ϕ X (t ) , gdzie ϕ X (t ) jest funkcją charakterystyczną zmiennej losowej X, to własności funkcji tworzących wynikają z własności funkcji charakterystycznych z uwzględnieniem zamiany argumentu. Np. ϕ ′ (0) ΨX′ (e i 0 ) ⋅ e i 0 ⋅ i m= X = = ΨX′ (1) i i 10 L.Kowalski –Funkcje zmiennych losowych m2 = ϕ ′X′ (0) i2 = (Ψ ′ (e X it ) ⋅ e it ⋅ i i2 )′ t =0 = (Ψ′′ (e it X ) ⋅ e it ⋅ i ⋅ e it ⋅ i + ΨX′ (e it ) ⋅ e it ⋅ i ⋅ i ) t =0 i2 = Ψ ′′(1) + Ψ ′(1) Funkcja tworząca momenty (transformata Laplace’a). Jeśli X jest zmienną losową dla której istnieją momenty dowolnego rzędu to jej funkcją tworzącą momenty nazywamy funkcję zespoloną M (t ) = M X (t ) = E e tX zatem dla zmiennej losowej skokowej o funkcji prawdopodobieństwa P( X = xk ) = p k ( ) M (t ) = ∑ e txk p k k a dla zmiennej losowej ciągłej o gęstości f(x) ∞ M (t ) = ∫ e tx f ( x)dx −∞ W obu przypadkach rozwijając funkcję etx w szereg Taylora możemy funkcję tworzącą momenty zapisać w postaci ∞ tk M (t ) = ∑ mk k = 0 k! zatem d k M (t ) mk = dt k t =0 co wyjaśnia nazwę rozpatrywanej funkcji. Uwaga. Między funkcją tworzącą momenty a funkcją tworzącą zachodzi zależność M (t ) = Ψ e t ( ) (dla zmiennej losowej o nieujemnych wartościach całkowitych). TWIERDZENIA GRANICZNE Zbieżność ciągu zmiennych losowych z prawdopodobieństwem 1 (prawie napewno) Ciąg zmiennych losowych (Xn) jest zbieżny do zmiennej losowej X z prawdopodobieństwem 1 jeśli ({ }) P ω : lim X n (ω ) = X (ω ) = 1 n →∞ Średniokwadratowa zbieżność ciągu zmiennych losowych Ciąg zmiennych losowych (Xn) jest średniokwadratowo zbieżny do zmiennej losowej X jeśli ( lim E X n − X n→∞ 2 )= 0 Rozpatrując ten rodzaj zbieżności zakładamy, że dla występujących tu zmiennych losowych (Xn), X istnieje skończony moment rzędu 2. 11 L.Kowalski –Funkcje zmiennych losowych Niekiedy stosuje się zapis l.i.m. X n = X (skrót od „limit in mean”). Stochastyczna zbieżność ciągu zmiennych losowych Ciąg zmiennych losowych (Xn) jest stochastycznie (wg prawdopodobieństwa) zbieżny do zmiennej losowej X jeśli ∧ lim P( X n − X < ε ) = 1 ∧ lim P( X n − X ≥ ε ) = 0 ε >0 lub równoważnie ε >0 n→∞ n→∞ Zbieżność ciągu zmiennych losowych wg dystrybuant (wg rozkładu) Ciąg zmiennych losowych (Xn) jest zbieżny do zmiennej losowej X wg dystrybuant jeśli ciąg ich dystrybuant Fn jest zbieżny do dystrybuanty F w każdym punkcie jej ciągłości (F jest dystrybuantą zmiennej losowej X). Zależności miedzy zbieżnościami. ZBIEŻNOŚĆ Z PRAWDOPODOBIEŃSTWEM 1 ZBIEŻNOŚĆ ŚREDNIOKWADRATOWA ZBIEŻNOŚĆ STOCHASTYCZNA zbieżność do stałej (tzn. gdy granica ma rozkład jednopunktowy) ZBIEŻNOŚĆ WG DYSTRYBUANT Przykład. Rozpatrzmy ciąg zmiennych losowych skokowych określonych na przedziale [0, 1) w następujący sposób 1 X kn (ω ) = 0 k k + 1 gdy ω ∈ ; n n k k + 1 gdy ω ∈ [0, 1) − ; n n 1 1 ; P ( X kn = 0) = 1 − n n Ciąg X01, X02, X12, X03, X13, X23, ..... jest zbieżny stochastycznie do zera bo P ( X kn = 1) = 12 L.Kowalski –Funkcje zmiennych losowych ∧ε 0< <1 lim P( X n ≥ ε ) = lim 1 =0 n→∞ n n→∞ Natomiast ciąg ten nie jest zbieżny w żadnym punkcie przedziale [0, 1) bowiem dla każdego ustalonego punktu otrzymujemy rozbieżny ciąg zer i jedynek (zera i jedynki występują na dowolnie dalekich miejscach). Przykład. Ciąg zmiennych losowych Xn ciągłych o rozkładach jednostajnych na przedziałach (0, 1/n) jest zbieżny do rozkładu jednopunktowego X ( P ( X = 0) = 1 ) wg dystrybuant. Uwaga. Punktowa granica ciągu dystrybuant nie musi być dystrybuantą. Jeśli ciąg funkcji charakterystycznych odpowiadających rozpatrywanemu ciągowi dystrybuant jest punktowo zbieżny do funkcji ciągłej to granica tych dystrybuant jest dystrybuantą. Klasyfikacja twierdzeń granicznych i szerszy ich wybór p. J.Zacharski „Zarys matematyki wyższej, T. III”. Centralne twierdzenie graniczne Lindeberga – Levy'ego Jeśli niezależne zmienne losowe Xi (i = 1, 2, ..., n) mają taki sam rozkład oraz istnieje E(Xn) = m i D2(Xn) = σ2 > 0 to ciąg dystrybuant (Fn) standaryzowanych średnich n arytmetycznych X n (lub standaryzowanych sum ∑ Xi ) i =1 n Yn = Xn −m σ/ n = ∑X i =1 n − mn σ n jest zbieżny do dystrybuanty Φ rozkładu N(0, 1). Aby się przekonać, że suma niezależnych zmiennych losowych o takim samym rozkładzie może dążyć do rozkładu N(0, 1) porównajmy rozkład N(0, 1) i standaryzowane rozkłady X, (X + Y)/2, (X + Y + Z)/3, gdzie X, Y, Z niezależne zmienne losowe o rozkładzie jednostajnym w przedziale [– 0,5; 0,5]. 13 L.Kowalski –Funkcje zmiennych losowych 14 L.Kowalski –Funkcje zmiennych losowych Wniosek Dla dużych n (w praktyce n ≥ 30) P a ≤ n ∑X i =1 i − nm σ n < b ≅ Φ (b) − Φ( a ) W przypadku szczególnym gdy Xi (i = 1, 2, ..., n) maja rozkład zerojedynkowy to powyższe twierdzenie nazywamy twierdzeniem Moivre'a-Laplace'a n (zmienne losowe Yn = ∑ X i mają rozkład dwumianowy). i =1 Wniosek z twierdzenia Moivre'a-Laplace'a: Y − np P a ≤ i < b ≅ Φ (b) − Φ (a) npq Uwaga. Powyższe twierdzenia wskazują na ważną rolę rozkładu normalnego. Przykład Wadliwość partii żarówek wynosi 0,01. Z tej partii żarówek wylosowano 625 żarówek. Obliczyć prawdopodobieństwo, że wśród wylosowanych żarówek będzie a) mniej niż 10 wadliwych, b) najwyżej 10 wadliwych. Rozwiązanie. Yn – liczba wadliwych żarówek wśród wylosowanych, Ad a) Y − 625⋅ 0,01 10− 625⋅ 0,01 ≅ P(Yi < 10) = P i < 625⋅ 0,01⋅ 0,99 625⋅ 0,01⋅ 0,99 ≅ Φ(1,51) = 0,93448 Ad b) P(Yi ≤ 10) = P(Yi < 10) + P(Yi = 10) = P(Yi < 11) = Y − 625⋅ 0,01 11− 625⋅ 0,01 ≅ P i < 625 ⋅ 0 , 01 ⋅ 0 , 99 625 ⋅ 0 , 01 ⋅ 0 , 99 ≅ Φ(1,91) = 0,97193 Prawo wielkich liczb Chinczyna (Xi) – ciąg niezależnych zmiennych losowych o takim samym rozkładzie oraz niech istnieje E(Xi) = m. n Wtedy ciąg Yn = 1 ∑ X i jest zbieżny stochastycznie do m. n i =1 Wniosek Dla dużych n jeśli istnieje D2(Xn) = σ2 > 0 to 15 L.Kowalski –Funkcje zmiennych losowych ∧ ε >0 ε n −1 P (Yn − m < ε ) ≅ 2Φ σ Przypadek szczególny – prawo wielkich liczb Bernoulliego: (Xi) – ciąg niezależnych zmiennych losowych o rozkładzie dwumianowym wtedy ciąg X n n jest stochastycznie zbieżny do p. Wniosek Dla dużych n: ∧ ε >0 ε n X −1 P n − p < ε ≅ 2Φ pq n Ilustracja powyższego twierdzenia dla rzutu monetą (p = 0,5), Xn – liczba orłów w n rzutach. n = 1000 rzutów Przykład Wadliwość partii żarówek wynosi 0,1. Z tej partii żarówek losujemy n żarówek. Ile żarówek należy wylosować aby prawdopodobieństwo, że średnia liczba wadliwych żarówek różniła się co do wartości bezwzględnej od wadliwości partii o mniej niż 0,025 było co najmniej równe 0,95. Rozwiązanie Yn – liczba wadliwych żarówek wśród wylosowanych 0,025 n Y − 1 ≥ 0,95 P n − 0,1 < 0,025 ≅ 2Φ n 0,1 ⋅ 0,9 stąd 0,025 n ≥ 0,975 oraz 0,025 n ≥ 1,96 Φ 0,1 ⋅ 0,9 0,1 ⋅ 0,9 zatem n ≥ 23,52 i n > 553. 16 L.Kowalski –Funkcje zmiennych losowych Ocenę odchylenia wartości zmiennej losowej od jej wartości oczekiwanej daje nierówność Czebyszewa: X – zmienna losowa oraz istnieje E(X) = m i D2(X) = σ2 > 0 wtedy ∧ ε >0 σ2 P( X − m ≥ ε ) ≤ 2 ε σ2 ∧ P( X − m ≤ ε ) ≥ 1 − 2 ε >0 ε lub (zatem σ jest miarą odchylenia wartości zmiennej losowej od wartości oczekiwanej). Zauważmy, że dla ε = 3σ otrzymujemy uogólnione prawo "trzech sigm". Z nierównością Czebyszewa związane są inne nierówności np. 1) nierówność Markowa P( X ≥ ε ) ≤ ∧ ∧ ε >0 p >0 EX p εp 2) nierówność Czebyszewa II ∧ ε >0 P( X ≥ ε ) ≤ EX ε 3) nierówność Czebyszewa III (wykładnicza) jeśli Ee λX <∞ to ε∧ >0 Ee λX P( X ≥ ε ) ≤ λε e 4) nierówność Bernsteina jeśli Sn – liczba sukcesów w n próbach Bernoulliego z prawdopodobieństwem sukcesu p to ∧ ε >0 Sn − 2 nε 2 P − p ≥ ε ≤ 2e n 17 L.Kowalski –Funkcje zmiennych losowych ZADANIA Zadanie 2.1 X - rozkład wykładniczy o parametrze a = 10, tzn. 10e −10 x dla x ≥ 0 f ( x) = , dla x < 0 0 wyznaczyć gęstość rozkładu zmiennej losowej Y = 2 - 3X. Zadanie 2.2 Temperatura X mierzona w skali Fahrenheita ma rozkład jednostajny w przedziale (t1; t2). Wyznaczyć rozkład temperatury przeliczonej na skalę Celsjusza Y = 5(X – 32)/9. Zadanie 2.3 Oporność R rezystora ma rozkład jednostajny w przedziale (r - ∆; r + ∆ ). Wyznaczyć rozkład przewodności Y = 1/R. Zadanie 2.4 X - zmienna losowa skokowa o funkcji prawdopodobieństwa: -2 0,3 -1 0,1 0 0,1 1 0,3 2 0,2 wyznaczyć funkcję prawdopodobieństwa zmiennej losowej Y = X2 . Zadanie 2.5 Sprawdź, że jeśli dla X ≤ a a Y = X b dla a < X ≤ b dla b < X to 0 G( y) = F ( y) 1 dla y ≤ a dla a < y ≤ b dla b < y Gdzie G - dystrybuanta Y, F - dystrybuanta X, a, b - poziomy nasycenia. Zadanie 2.6 Sprawdź, że jeśli X Y = min( X , a ) = a to 0 G( y) = F ( y) dla X ≤ a dla a < X dla y ≤ a dla a < y Gdzie G - dystrybuanta Y, F - dystrybuanta X. 18 L.Kowalski –Funkcje zmiennych losowych Zadanie 2.7 Które z poniższych funkcji nie mogą być funkcjami charakterystycznymi? 1. ϕ (t ) = 1 , 1+ t 2. ϕ (t ) = 1 2 , 1+ t 3. ϕ (t ) = sin at , 4. ϕ (t ) = cos at , 5. ϕ (t ) = 1 − it . Zadanie 2.8 Wyznacz funkcję charakterystyczną rozkładu Poissona. Korzystając z niej wyznacz wartość oczekiwaną i wariancję tego rozkładu. Zadanie 2.9 Korzystając z funkcji charakterystycznej rozkładu wykładniczego wyznacz wartość oczekiwaną i wariancję tego rozkładu. Zadanie 2.10 Wyznacz funkcję charakterystyczną rozkładu geometrycznego. Korzystając z niej wyznacz wartość oczekiwaną i wariancję tego rozkładu. Zadanie 2.11 Wyznacz funkcję charakterystyczną rozkładu jednostajnego na przedziale (0, 1). Następnie korzystając z własności funkcji charakterystycznej wyznacz funkcję charakterystyczną rozkładu jednostajnego na przedziale (a, b), a < b. Zadanie 2.12 Wyznacz funkcję charakterystyczną rozkładu gamma. Zadanie 2.13 Wyznacz funkcję charakterystyczną rozkładu liczby wyrzuconych orłów przy rzucie trzema monetami. Zadanie 2.14 Pokazać, że suma niezależnych zmiennych losowych o rozkładzie Poissona z parametrami λ1, ..., λn jest również zmienną losową o rozkładzie Poissona o parametrze λ1 + ... +λn. 19 L.Kowalski –Funkcje zmiennych losowych Zadanie 2.15 Pokazać, że suma niezależnych zmiennych losowych o rozkładzie N(mi, σi), i = 1, ..., n; jest zmienną losową N(m1 + ... + mn, σ1 + ... + σn). Zadanie 2.16 Zmienna losowa X ma funkcję prawdopodobieństwa P(X = -2) = 0,25; P(X = 0) = 0,5; P(X = 2) = 0,25 Wyznacz funkcję charakterystyczną tej zmiennej losowej. Zadanie 2.17 Zmienna losowa X ma dystrybuantę x ≤ −1 −1 < x ≤ 1 0 F ( x) = 0,5 1 x >1 a) Wyznacz funkcję charakterystyczną tej zmiennej losowej. b) Wyznacz funkcję charakterystyczną zmiennej losowej Y = 2X +1. Zadanie 2.18 Wyznaczyć rozkład prawdopodobieństwa zmiennej losowej, której funkcja charakterystyczna ma postać ϕ (t ) = cos t . (Wsk. cos t = 1 (eit + e−it ) ) 2 Zadanie 2.19 Wyznaczyć rozkład prawdopodobieństwa zmiennej losowej, której funkcja charakterystyczna ma postać ϕ (t ) = cos 2 t . (Wsk. cos2 t = 1 (1 + cos 2t ) ), 2 Zadanie 2.20 Wyznaczyć rozkład prawdopodobieństwa zmiennej losowej, której funkcja charakterystyczna ma postać ϕ (t ) = 0,25(1 + eit ) . 2 (Wsk. 0,25(1 + eit ) = 0,25 + 0,5eit + 0,25e2it ), 2 Zadanie 2.21 Wyznaczyć rozkład prawdopodobieństwa zmiennej losowej, której funkcja charakterystyczna ma postać ϕ (t ) = e −0,5t . 2 20 L.Kowalski –Funkcje zmiennych losowych Zadanie 2.22 Zmienna losowa X ma funkcję charakterystyczną postaci ϕ (t ) = e− t . Czy istnieje EX? Zadanie 2.23 Zmienna losowa X ma dystrybuantę x≤0 0< x≤2 0 F ( x) = 0,5 x 1 x>2 Wyznacz funkcję charakterystyczną tej zmiennej losowej. Zadanie 2.24 Zmienna losowa X ma gęstość x ≤ −1 −1 < x ≤ 0 0 x + 1 f ( x) = 1− x 0 0 < x ≤1 x >1 Wyznacz funkcję charakterystyczną tej zmiennej losowej. Zadanie 2.25 Niech X i Y będą niezależne o rozkładzie jednostajnym na (-0,5; 0,5). Pokazać, że ich suma ma rozkład o gęstości jak w poprzednim zadaniu. Zadanie 2.26 Niech X i Y będą niezależne o tym samym rozkładzie i funkcji charakterystycznej ϕ (t ) . Wyznacz funkcję charakterystyczną zmiennej losowej Z = X - Y. Zadanie 2.27 Funkcja ( ) 1 f (t , s ) = exp 2it − is − 4t 2 + 9ts + 9 s 2 2 jest funkcją charakterystyczną 2 wymiarowego rozkładu normalnego. Wyznaczyć wektor wartości oczekiwanych i macierz kowariancji tej zmiennej losowej. Wyznaczyć gęstość tego rozkładu. Zadanie 2.28 System składa się z 2 układów z których każdy ma czas bezawaryjnej pracy określony rozkładem wykładniczym Xi o parametrze ai niezależnym od drugiego układu. Wyznaczyć 21 L.Kowalski –Funkcje zmiennych losowych rozkład bezawaryjnego czasu pracy całego systemu (system działa jeśli oba układy pracują). Y = min(X1 , X2 ) Odp. Jest to rozkład wykładniczy o parametrze a1 + a2. Zadanie 2.29 X1 , X2 , ..., Xn - niezależne zmienne losowe o rozkładzie określonym gęstością f(x). Wyznaczyć rozkład zmiennej losowej Y = min(X1 , X2 , ..., Xn ). (odp. G ( y ) = 1 − (1 − F ( y)) n ; g ( y ) = nf ( y )(1 − F ( y )) n −1 ) Zadanie 2.30 X1 , X2 , ..., Xn - niezależne zmienne losowe o rozkładzie określonym gęstością f(x). Wyznaczyć rozkład zmiennej losowej Y = max(X1 , X2 , ..., Xn ). (odp. G( y) = F n ( y ) ; g ( y ) = 2 f ( y ) F n−1 ( y ) ) Zadanie 2.31 Wyznaczyć gęstość rozkładu logarytmiczno-normalnego. (odp. g ( y ) = 1 σy 2π e − (ln y − m ) 2 2σ 2 y ≥ 0) Zadanie 2.32 X, Y - niezależne zmienne losowe o rozkładzie określonym funkcją prawdopodobieństwa P(X = 0) = 1/2, P(X = 1) = 3/8, P(X = 2) = 1/8, Wyznacz funkcję prawdopodobieństwa zmiennej losowej X + Y. Zadanie 2.32 a) X, Y - niezależne zmienne losowe o rozkładzie jednostajnym w [0, 1]. Wyznacz gęstość zmiennej losowej X + Y. Wyznacz parametry tej zmiennej losowej. b) X, Y, Z - niezależne zmienne losowe o rozkładzie jednostajnym w [0, 1]. Wyznacz gęstość zmiennej losowej X + Y + Z. Wyznacz parametry tej zmiennej losowej. Zadanie wykonaj stosując splot gęstości a wynik sprawdź za pomocą funkcji charakterystycznych. 22 L.Kowalski –Funkcje zmiennych losowych Naszkicuj i porównaj wykresy gęstości zmiennych losowych X, X + Y, X + Y + Z. Zauważ, że gdy rośnie liczba rozpatrywanych składników, wykres gęstości staje się podobny do krzywej Gaussa. Zadanie 2.33 X - zmienna losowa odpowiadająca mierzonej wielkości (zakładamy, że ma rozkład jednostajny w [0, 8]), Y - niezależna od X zmienna losowa opisująca błąd pomiaru (zakładamy, że ma rozkład normalny N(0, 1)). Wyznacz gęstość zmiennej losowej odpowiadającej wynikowi pomiaru U = X + Y. Wyznacz parametry tej zmiennej losowej. Zadanie wykonaj stosując splot gęstości a wynik sprawdź za pomocą funkcji charakterystycznych. Naszkicuj wykres gęstości zmiennej losowej X + Y. Zadanie 2.34 Wykazać, że ciąg zmiennych losowych n Yn = ∑ (X i =1 i − m) n jest zbieżny stochastycznie do zera. Zakładamy, że zmienne losowe są niezależne o takim samym rozkładzie i skończonych momentach rzędu 2. (Wsk. Wykazać zbieżność średniokwadratową) Zadanie 2.35 Sprawdź, że punktowa granica ciągu dystrybuant gdy x ≤ −n 0 x + n Fn ( x) = gdy − n < x ≤ n 2 n gdy x > n 1 jest funkcją która nie jest dystrybuantą. Zadanie 2.36 Rzucamy a) 100, b) 1000, c) 10000 razy monetą. Oszacować stosując nierówność Czebyszewa i Bernsteina prawdopodobieństwo, że liczba orłów będzie różnić się od wartości oczekiwanej o więcej niż 5%. 23 L.Kowalski –Funkcje zmiennych losowych Zadanie 2.37 Wiadomo, że 70% studentów pewnego wydziału WAT kończy studia w terminie. Jeśli studia na tym wydziale rozpoczęło 60 studentów, to oceń szansę ukończenia przez przynajmniej 45 z nich studiów w terminie. Zastosuj twierdzenie graniczne. Zadanie 2.37 Rzucamy 500 razy kostką sześcienną. Wyznaczyć prawdopodobieństwo tego, że częstość wypadania jedynki będzie należała do przedziału (1/6 – 0,05; 1/6 + 0,05). Zadanie 2.38 Ile razy należy rzucić monetą aby z prawdopodobieństwem co najmniej 0,975 twierdzić, że częstość wypadania orła będzie należała do przedziału (0,4; 0,6). Zadanie 2.39 Ile razy należy rzucić monetą aby z prawdopodobieństwem 0,95 twierdzić, że częstość wypadania orła będzie różniła się od 0,5 co najwyżej o 0,1. Zadanie 2.40 Wadliwość pewnego wyrobu wynosi 10%. Obliczyć prawdopodobieństwo, że wśród 100 losowo wybranych sztuk tego wyrobu będzie od 5 do 12 sztuk wadliwych. Zadanie 2.41 Zmienna losowa Y jest średnią arytmetyczną 3200 niezależnych zmiennych losowych o jednakowym rozkładzie o wartości oczekiwanej 3 i wariancji 2. Obliczyć prawdopodobieństwo, że Y przyjmuje wartości z przedziału (2,95; 3,075). Zadanie 2.42 Wiedząc, że wariancja każdej z 4500 niezależnych zmiennych losowych o jednakowym rozkładzie jest równa 5, oszacować prawdopodobieństwo, że średnia tych zmiennych odchyli się od jej wartości oczekiwanej nie więcej niż o 0,04. L.Kowalski, 27. 03.2010 24