funkcje zmiennej losowej. f-charakterystyczna. tw

Transkrypt

L.Kowalski –Funkcje zmiennych losowych
FUNKCJE ZMIENNYCH LOSOWYCH
Uwagi o rozkładzie funkcji zmiennej losowej jednowymiarowej.
Jeśli X - skokowa, o funkcji prawdopodobieństwa P(X = xi) = pi, g - dowolna to funkcja
prawdopodobieństwa zmiennej losowej Y = g(X) ma postać:
g(x1)
g(x2)
...
g(xk)
p1
p2
...
pk
Po uporządkowaniu rosnąco wartości g(xi) i zsumowaniu odpowiednich prawdopodobieństw.
Dokładniej


P (Y = y ) = P ( g ( X ) = y ) = P U ( X = xi ) = ∑ P ( X = xi ) = ∑ pi
{i: g ( xi ) = y }
 {i: g ( xi ) = y }
 {i: g ( xi ) = y}
Przykład.
X - zmienna losowa skokowa o funkcji prawdopodobieństwa:
-4
-2
-1
0
1
2
0,4
0,1
0,1
0,1
0,1
0,2
wyznaczymy funkcję prawdopodobieństwa zmiennej losowej Y = sgnX .
sgn(-4) = sgn(-2) = sgn(-1) = -1.
sgn(0) = 0.
sgn(1) = sgn(2) = 1.
Zatem funkcja prawdopodobieństwa zmiennej losowej Y jest następująca
-1
0
1
0,6
0,1
0,3
X - dana zmienna losowa ciągła o gęstości f.
Y = g(X)
g - borelowska, tzn. g-1(B) ∈B(R) dla B ∈B(R),
Wyznaczyć gęstość g(y) zmiennej losowej Y.
1) Jeśli g - ściśle monotoniczna i różniczkowalna w przedziale (a, b) koncentracji X to:
g ( y ) = f (h( y ) ) h ' ( y )
gdzie h = g-1.
Należy pamiętać o przekształceniu przedziału koncentracji.
Przykład.
 y −b 1
Y = aX + b, wtedy g ( y ) = f 
 ,
 a a
Przykład.
0
Jeśli X ma rozkład o gęstości f ( x) =  − x
e
dla x ≤ 0
dla x > 0
Y = X − 2,
2
wtedy h( y ) = ( y + 2 ) , h′( y ) = 2( y + 2) , g(0) = -2, g(∞) = ∞,
1
dla x ≤ −2
0
g ( y) = 
2
2( y + 2)e − ( y + 2)
dla x > −2
,
2) Jeśli g - przedziałami ściśle monotoniczna i różniczkowalna w przedziale
(a, b) koncentracji X to:
k
g ( y ) = ∑ f (hi ( y ) ) hi ( y)
'
i =1
gdzie hi - funkcje odwrotne do g dla poszczególnych przedziałów,
k - liczba wartości funkcji odwrotnej odpowiadających danemu y.
Przykład.
Y = |X|, wtedy
Przykład.
Y = X2, wtedy
g ( y ) = f (− y ) + f ( y ) y > 0 ,
(
g ( y) = f − y
)2 1 y + f ( y )2 1 y
y > 0,
W niektórych zagadnieniach wyznaczania rozkładu funkcji zmiennej losowej najpierw
wyznaczamy dystrybuantę rozkładu zmiennej losowej Y = g(X), wg schematu
FY ( y ) = P(Y < y ) = P( g ( X ) < y ) = P X ∈ g −1 ((−∞, y ) ) < y
następnie jeśli to możliwe, wyznaczamy funkcję prawdopodobieństwa (gdy jest to rozkład
skokowy) lub gęstość (gdy jest to rozkład ciągły).
Przykład.
Jeśli X ma rozkład o gęstości
0 dla x ∉ [0 , 3]

(rozkład jednostajny na [0, 3])
f ( x) =  1
dla
x
∈
[
0
,
3
]
 3
Y = max(2, X ) ,
(
)
dla y ≤ 2
0

wtedy FY ( y ) = P(Y < y ) = P(max(2, X ) < y ) =  1 y
3
1
dla 2 < y ≤ 3
dla y > 3
Nie jest to ani rozkład skokowy ani ciągły. Nie można więc wyznaczyć ani funkcji
prawdopodobieństwa ani gęstości.
Jest to rozkład mieszany skokowo - ciągły i zgodnie z twierdzeniem o rozkładzie
dystrybuanty powyższą dystrybuantę można przedstawić w postaci
FY = c1F1 + c2 F2
gdzie
0
c1 = 2/3, F1 ( y ) = 
1
dla y ≤ 2
dla y > 2
2
,
0

c2 = 1/3, F2 ( y ) =  y - 2
1

dla y ≤ 2
dla 2 < y ≤ 3 ,
dla y > 3
Funkcje zmiennych losowych 2 wymiarowych.
(X1, X2) - dana zmienna losowa ciągła o gęstości f.
Y = g(X1, X2)
Dystrybuanta tej zmiennej losowej ma postać
∫∫ f ( x , x
G( y) =
( g ( x1 , x2 )< y )
1
g - borelowska,
2
)dx1dx2
gęstość g(y) wyznaczamy przez różniczkowanie.
Przykład.
G( y) =
Y = X1⋅X2 ,
0 ∞
∞ y / x1



 f ( x , x )dx dx +  f ( x , x )dx dx
=
f
(
x
,
x
)
dx
dx
1
2
1
2
1
2
2
1
1
2
2 1
∫∫
∫
∫
∫
∫



x1 ⋅ x2 < y
0  −∞
− ∞ y / x1


g ( y) =
wtedy
∞
0
1
y
1
y
∫−∞ x f ( x, x )dx + ∫0 x f ( x, x )dx
Przykład.
(X1, X2) - zmienna losowa o rozkładzie jednostajnym w kwadracie (0, 1) x (0, 1). Wyznaczyć
rozkład pola prostokąta o bokach x1, x2 tzn. zmiennej losowej
Y = X1⋅X2 .
1 1

G ( y ) = ∫∫ dx1dx2 = 1 − ∫∫ dx1dx2 = 1 − ∫  ∫ dx2 dx1 = y (1 − ln y )


x1 ⋅ x 2 < y
x1 ⋅ x 2 ≥ y
y  y / x1

dla 0 < y ≤ 1
stąd
dla y ≤ 0
0

G ( y ) =  y (1 − ln y )
dla 0 < y ≤ 1
1
dla 1 < y

zatem g(y) = -lny
Przykład.
dla 0 < y ≤ 1
Y = X2/X1 ,
0 ∞
∞ y ⋅ x1



G ( y ) = ∫  ∫ f ( x1 , x2 ) dx2 dx1 + ∫  ∫ f ( x1 , x2 ) dx2 dx1




− ∞ y ⋅ x1
0  −∞


wtedy
0
∞
−∞
0
g ( y ) = − ∫ xf ( x, yx)dx + ∫ xf ( x, yx)dx
Przykład.
X1, X2 - niezależne zmienne losowe.
X1 - N(0, σ1),
X2 - N(0, σ2).
~
X
~
Niech X 1 = 1 , X 2 = X 2 (mają rozkład N(0, 1).
σ1
σ2
3
~
−x2 / 2
∞
~
e − yx / 2
e − x / 2 e − yx / 2
1
⋅
dx + ∫ x ⋅
⋅
dx =
π 1 + ~y 2
2π
2π
2π
2π
−∞
0
(rozkład Cauchy'ego)
i korzystając funkcji liniowej od zmiennej losowej Y = Y~ σ 1 mamy
0
e
g~( ~
y) = − ∫ x ⋅
2
2
2
(
)
σ2
g ( y) =
1
2

σ 2 
2  σ1  
π
1 + y  
σ1 
σ2  


Przykład.
Y = X1 + X2 ,
 y − x1

G ( y ) = ∫  ∫ f ( x1 , x2 ) dx2 dx1


−∞ −∞

∞
g ( y) =
wtedy
∞
∫
f ( x, y − x)dx =
−∞
∞
∫ f ( y − x, x)dx
−∞
Uwaga.
Jeśli X1, X2 - niezależne zmienne losowe to gęstość sumy wyraża się splotem gęstości
brzegowych (p. dalej).
Przykład.
Y = X1 - X2 ,
g ( y) =
wtedy
∞
∞
−∞
−∞
∫ f ( x, x − y)dx = ∫ f ( x − y, x)dx
Suma niezależnych zmiennych losowych.
Własności:
1) X, Y niezależne skokowe zmienne losowe o funkcjach prawdopodobieństwa
P(X = xi), P(Y = yj); wtedy funkcja prawdopodobieństwa zmiennej losowej X + Y
wyraża się wzorem:
P(Z = zk) = ∑ P(X = xi)P(Y = zk - xj); (zk = xi + yj)
2) X, Y niezależne ciągłe zmienne losowe o gęstościach f1 i f2 ; wtedy gęstość zmiennej
losowej X + Y wyraża się wzorem:
f ( x) =
∞
∫ f (t ) f
1
−∞
2
( x − t )dt =
∞
∫ f (x − t) f
1
2
(t )dt
−∞
(splot gęstości składników).
Funkcje zmiennych losowych n - wymiarowych.
Przykład.
System składa się n układów z których każdy ma czas bezawaryjnej pracy określony
rozkładem wykładniczym Xi o parametrze ai niezależnym od pozostałych układów.
Wyznaczyć rozkład bezawaryjnego czasu pracy całego systemu (system działa jeśli pracuje
chociaż jeden układ).
Y = X1 + X2 + X3 + ....+ Xn,
4
Przez indukcję pokazuje się, że Y ma rozkład o gęstości:
g ( y) =
n
n
(− 1)n −1 ∏ ai ∑
i =1
j =1
e
∏ (a
n
k =1
k≠ j
wtedy
G( y) =
−a j y
n
n
i =1
j =1
j
− ak )
1− e
(− 1)n−1 ∏ ai ∑
∏ (a
n
k =1
k≠ j
dla y > 0
j
−a j y
− ak )
Otrzymany rozkład nazywamy uogólnionym rozkładem Erlanga n - tego rzędu Tn.
 n  n 1
E (Tn ) = E  ∑ Ti  = ∑
 k =1  k =1 a k
 n  n 1
D 2 (Tn ) = D 2  ∑ Ti  = ∑ 2
 k =1  k =1 ak
gdy a1 = a2 = ... = an =λ
g ( y) =
to
λ (λt )
n −1
( n − 1)!
e − λt = λP( n − 1, λt ) t > 0
gdzie P(n-1, λt) jest rozkładem Poissona.
Przykład.
Y = min(X1 , X2 )
G ( y ) = F1 ( y ) + F2 ( y ) − F ( y , y )
wtedy
g ( y) =
y
f1 ( y) + f 2 ( y) −
y
∫ f ( y, x)dx − ∫ f ( x, y )dx
−∞
−∞
Uwaga.
Jeśli X1, X2 - niezależne zmienne losowe to:
G ( y ) = F1 ( y ) + F2 ( y ) − F1 ( y ) ⋅ F2 ( y )
g ( y ) = f 1 ( y)(1 − F2 ( y )) + f 2 ( y )(1 − F1 ( y ))
Jeśli X1, X2 - niezależne zmienne losowe o takim samym rozkładzie to:
G ( y ) = F ( y )(2 − F ( y ))
wtedy
g ( y) = 2 f
( y )(1 − F ( y ))
Przykład.
Y = max(X1 , X2 )
G ( y ) = F ( y, y )
wtedy
g ( y) =
y
∫
−∞
y
f ( y, x)dx +
∫ f ( x, y)dx
−∞
Uwaga.
Jeśli X1, X2 - niezależne zmienne losowe o takim samym rozkładzie to:
G( y) = F 2 ( y)
g ( y ) = 2 f ( y) F ( y)
Rozkład funkcji od rozkładu normalnego.
wtedy
(X1 , X2 , X3 ,...., Xn) - rozkład normalny.
Y = g(X1 , X2 , X3 ,...., Xn), należy wyznaczyć rozkład Y.
Przykład.
Y = a1X1 + a2X2 + a3X3 +....+ a3Xn + b
5
dla y > 0
n=2
g ( y) =
− ( y −my )2
1
e
σ y 2π
2σ 2y
σ = a12σ 12 + a 22σ 22 + 2a1 a2 rσ 1 σ 2 ,
2
y
gdzie: my = a1m1 + a2m2 + b,
Przez indukcję można pokazać, że dla dowolnego n Y ma rozkład normalny o parametrach:
my = a1m1 + a2m2 + ... +anmn + b,
σ y2 = ∑ ai2σ i2 + 2∑ ai a j rijσ i σ j ,
i< j
Przykład.
X1 , ..., Xn - niezależne, o rozkładzie N(0, 1). Y n = X 12 + .... + X n2 ma rozkład chi kwadrat
 n2 −1 − 2y
y e
x>0
 n
f ( y) =  2  n 
2 Γ 

2
0
x≤0

n ∈N
EX = n;
D2X = 2n
Przykład.
X - N(m, σ),
Y = eX
Ma rozkład logarytmiczno-normalny.
Nazwa pochodzi stąd, że X = lnY ma rozkład normalny.
FUNKCJA CHARAKTERYSTYCZNA
Własności
zmiennych
losowych
można
również
badać
korzystając
z przekształcenia Fouriera (Fouriera-Stieltiesa), prowadzi to do pojęcia funkcji
charakterystycznej. Najważniejszym zastosowaniem funkcji charakterystycznych jest badanie
własności sum niezależnych zmiennych losowych i porównywanie rozkładów.
Funkcję ϕ : R → C (zespoloną zmiennej rzeczywistej) określoną wzorem
∞
ϕ (t ) = ϕ X (t ) = E (e itX ) = ∫ e itx dF ( x) ,
t∈R
−∞
nazywamy funkcją charakterystyczną zmiennej losowej X.
Zatem dla zmiennej losowej skokowej o funkcji prawdopodobieństwa P( X = xk ) = p k
ϕ (t ) = ∑ pk e itx ,
k
t∈R
k
natomiast dla zmiennej losowej ciągłej o gęstości f(x)
ϕ (t ) =
∞
∫ f ( x)e
itx
dx ,
t∈R
−∞
Powyższy szereg i całka są bezwzględnie zbieżne do 1 (bo wartości modułu zmiennej losowej
eitX ,
t∈R
są równe 1 i odpowiednio
∑ pk = 1 ,
k
charakterystyczna zawsze istnieje.
6
∞
∫ f ( x)dx =1 ),
−∞
zatem funkcja
Własności funkcji charakterystycznej.
a) ϕ (0) = 1, ϕ (t ) ≤ 1, t ∈ R ,
b) ϕ jest funkcją jednostajnie ciągłą,
itb
c) ϕ aX +b (t ) = e ϕ X (ta) ,
d) jeśli istnieje E X
EX =
k
k
< ∞, k ≥ 1 , to ϕ jest funkcją klasy Ck oraz ϕ (k ) (0) = i k EX k , czyli
ϕ ( k ) ( 0)
,
ik
e) jeśli istnieje i jest skończona pochodna ϕ (2k ) (0) to EX 2 k < ∞, k ≥ 1
f) ϕ X (t ) = ϕ X (−t ) = ϕ − X (t )
g) jeśli X, Y - niezależne zmienne losowe to ϕ X + Y (t ) = ϕ X (t )ϕY (t ) ,
h) funkcja charakterystyczna określa rozkład zmiennej losowej jednoznacznie.
Ad. b)
ϕ (t + h) − ϕ (t ) = Ee i (t + h ) X − Ee itX =
( (
))
(
) (
= E eitX e ihX − 1 ≤ E e itX e ihX − 1 = E e ihX − 1
)→ 0
h →0
Ponieważ ostatnie wyrażenie nie zależy od t to zbieżność jest jednostajna.
Ad. c)
ϕ aX +b (t ) = Eeit (aX +b ) = eitb Ee iatX = e itbϕ X (ta) ,
Ad. d) (dla zmiennej losowej ciągłej).
Ponieważ rozpatrywana funkcja jest jednostajnie ciągła to można różniczkować względem t
pod znakiem całki i wtedy
∞
ϕ ′ (t ) = i ∫ xf ( x)eitx dx ,
stąd ϕ ′(0) = i EX
−∞
Przez indukcję można pokazać, że
(k )
ϕ (t ) = i
∞
k
∫x
k
f ( x)e itx dx ,
stąd ϕ (k ) (0) = i k EX k
−∞
Ad. g)
ϕ X +Y (t ) = Eeit ( X +Y ) = E (e itX eitY ) = EeitX Ee itY = ϕ X (t )ϕY (t )
Funkcje charakterystyczne podstawowych rozkładów zostały podane w ich zestawieniu,
wyprowadzimy niektóre z tych wzorów.
Przykład.
Wyznaczymy funkcję charakterystyczną rozkładu dwumianowego.
 n
P( X = k ) =   p k q n− k
gdzie q = 1 – p
 k
k = 0, 1, 2, ... , n.
n
n
n
n
k
n
ϕ (t ) = ∑   p k q n − k eitk = ∑   peit q n − k = peit + q
k =0  k 
k =0  k 
( )
(
7
)
Przykład.
Wyznaczymy funkcję charakterystyczną rozkładu wykładniczego.
ae − ax
x>0
f ( x) = 
x≤0
0
∞
∞
0
0
ϕ (t ) = ∫ ae −ax e itx dx = a ∫ e (it −a )x dx =
a
a − it
Przykład.
Wyznaczymy funkcję charakterystyczną zmiennej losowej Y o rozkładzie
N(m, σ).
f ( x) =
1
σ 2π
−
e
( x −m )2
2
2σ
x∈R
Najpierw wyznaczymy funkcję charakterystyczną zmiennej losowej
X o rozkładzie N(0, 1).
1
1
2
x 2 − 2itx + i 2 t 2 
∞
∞ − 
+ 2 i t
− x itx
2
1
1


ϕ (t ) = ∫
e 2 e dx =
dx =
∫e
2 2
2π
−∞
=e
−
1
2
t2
2π
(
)
1
2
x − it
∞ −
2
dx
∫e
∞42444
12π4−4
3
1
=e
−∞
−
1
2
t2
=1
Ponieważ Y = σX + m to korzystając z własności c) funkcji charakterystycznej
ϕ aX +b (t ) = e ϕ X (ta) mamy ϕ Y (t ) = e ϕ X (tσ ) = e e
itb
itm
itm
−
t 2σ 2
2
=e
itm −
t 2σ 2
2
Przykład.
Wyznaczymy za pomocą funkcji charakterystycznej moment rzędu 4 zmiennej losowej X o
rozkładzie N(0, 1).
Mamy ϕ (t ) = e
−
t2
2
, zatem ϕ ′(t ) = −te
ϕ (4 ) (t ) = (t 4 − 6t 2 + 3)e
stąd
m4 =
t2
−
2
,
−
t2
2
(
)
, ϕ ′′(t ) = t − 1 e
2
−
t2
2
(
)
, ϕ ′′′(t ) = − t + 3t e
3
−
t2
2
,
ϕ ( 4 ) ( 0) = 3 ,
3
= 3.
i4
Wniosek. Kurtoza tej zmiennej losowej wynosi 3.
Przykład.
Pokażemy, że suma niezależnych zmiennych losowych o rozkładzie Poissona z parametrami
λ1, λ2 jest również zmienną losową o rozkładzie Poissona o parametrze λ1 + λ2.
Zmienna losowa o rozkładzie Poissona z parametrem λ1 + λ2 ma funkcję charakterystyczną
ϕ (t ) = e(λ + λ )(e −1)
it
1
suma niezależnych zmiennych losowych o
λ1, λ2 ma funkcję charakterystyczną (własność g))
8
2
rozkładzie
Poissona
z
parametrami
ϕ X +Y (t ) = eλ (e −1)eλ (e −1) = e(λ + λ )(e −1)
it
it
1
it
2
1
2
Z równości funkcji charakterystycznych wynika równość rozkładów (funkcja
charakterystyczna określa rozkład zmiennej losowej jednoznacznie). Stąd prawdziwość
postawionej tezy.
W szczególnych przypadkach można (korzystając z retransformaty) na podstawie funkcji
charakterystycznej wyznaczyć rozkład zmiennej losowej .
Własność 1.
Jeśli funkcja charakterystyczna ϕ zmiennej losowej X jest bezwzględnie całkowalna, to X jest
zmienną losową ciągłą i gęstość jej wyraża się wzorem
f ( x) =
1
2π
∞
∫ ϕ (t )e
−itx
dt
−∞
Własność 2.
Jeśli funkcja charakterystyczna ϕ zmiennej losowej X jest okresowa o okresie 2π, to X jest
zmienną losową skokową o wartościach całkowitych i jej funkcja prawdopodobieństwa
wyraża się wzorem
P( X = k ) =
1
2π
π
∫πϕ (t )e
−itk
k - liczba całkowita
dt
−
Przykład.
Wyznaczymy
rozkład prawdopodobieństwa zmiennej losowej, której funkcja
charakterystyczna ma postać ϕ (t ) = e3it .
Jest to funkcja okresowa o okresie 2π, zatem X jest zmienną losową skokową o wartościach
całkowitych i jej funkcja prawdopodobieństwa wyraża się wzorem
π
π
gdy k = 3
1
1
1
it 3 −itk
P( X = k ) =
e
e
dt
=
e it 3 / k dt = 
∫
∫
gdy k ≠ 3
2π −π
2π −π
0
Zatem X ma rozkład jednopunktowy P(X = 3) = 1.
Funkcja tworząca.
Jeśli X jest zmienną losową przyjmującą nieujemne wartości całkowite i mającą rozkład
określony funkcją prawdopodobieństwa P( X = k ) = p k k = 0,1, 2, .... to jej funkcją
tworzącą nazywamy zespolony szereg potęgowy
∞
Ψ ( s ) = ΨX ( s ) = ∑ pk s k
k =0
Przy czym jeśli pewne wartości k nie są punktami skokowymi to odpowiednie składniki
powyższej sumy są równe zero.
Zauważmy, że powyższą funkcję można formalnie określić jako Ψ ( s ) = E s X .
Z własności funkcji prawdopodobieństwa wynika, że powyższy szereg potęgowy jest zbieżny
przynajmniej dla s ≤ 1 . Zatem z własności zespolonych szeregów potęgowych wynika, że
( )
Ψ (s ) jest funkcją analityczną wewnątrz koła jednostkowego s < 1 .
9
Funkcja tworząca jednoznacznie określa rozkład prawdopodobieństwa
zmiennej losowej o nieujemnych wartościach całkowitych, bowiem
1 dk
Ψ ( s ) s =0
k = 0,1, 2, ....
k! ds k
Niekiedy do wyznaczania k stosuje się całkę Cauchy’ego
Ψ (s)
1
pk =
ds
0 <r ≤1
∫
2πi s = r s k +1
pk =
(wartość tej całki można wyznaczyć za pomocą twierdzenia o residuach).
Jeśli Ψ (s ) jest funkcja wymierną to stosujemy rozkład na ułamki proste.
Przykład.
Rozkład zerojedynkowy P ( X = 1) = p , P ( X = 0) = q
ma funkcję tworzącą
Ψ ( s ) = q + ps
gdzie q = 1 − p
Funkcja tworząca sumy niezależnych zmiennych losowych jest równa iloczynowi funkcji
tworzących poszczególnych składników.
Przykład.
n
Rozkład dwumianowy P ( X = k ) =   p k q n− k k = 0,1, 2, ...., n
gdzie q = 1 − p
k 
n
Ψ ( s ) = (q + ps )
Uzasadnienie: rozkład dwumianowy jest sumą n niezależnych rozkładów zerojedynkowych.
Przykład.
Rozkład Poissona P ( X = k ) =
λk
k!
e −λ
k = 0,1, 2, ....
λ >0
Ψ ( s ) = e − λ (1− s )
Jeśli dla zmiennej losowej X istnieje moment rzędu drugiego, to
m = Ψ ′(1)
m2 = Ψ ′′(1) + Ψ ′(1)
zatem
2
D 2 X = Ψ ′′(1) + Ψ ′(1) − [Ψ ′(1)]
Uwaga.
Ponieważ ΨX (e it ) = ϕ X (t ) , gdzie ϕ X (t ) jest funkcją charakterystyczną zmiennej losowej X,
to własności funkcji tworzących wynikają z własności funkcji charakterystycznych
z uwzględnieniem zamiany argumentu.
Np.
ϕ ′ (0) ΨX′ (e i 0 ) ⋅ e i 0 ⋅ i
m= X
=
= ΨX′ (1)
i
i
10
m2 =
ϕ ′X′ (0)
i2
=
(Ψ ′ (e
X
it
) ⋅ e it ⋅ i
i2
)′
t =0
=
(Ψ′′ (e
it
X
) ⋅ e it ⋅ i ⋅ e it ⋅ i + ΨX′ (e it ) ⋅ e it ⋅ i ⋅ i
)
t =0
i2
= Ψ ′′(1) + Ψ ′(1)
Funkcja tworząca momenty (transformata Laplace’a).
Jeśli X jest zmienną losową dla której istnieją momenty dowolnego rzędu to jej funkcją
tworzącą momenty nazywamy funkcję zespoloną
M (t ) = M X (t ) = E e tX
zatem dla zmiennej losowej skokowej o funkcji prawdopodobieństwa P( X = xk ) = p k
( )
M (t ) = ∑ e txk p k
k
a dla zmiennej losowej ciągłej o gęstości f(x)
∞
M (t ) = ∫ e tx f ( x)dx
−∞
W obu przypadkach rozwijając funkcję etx w szereg Taylora możemy funkcję tworzącą
momenty zapisać w postaci
∞
tk
M (t ) = ∑ mk
k = 0 k!
zatem
d k M (t )
mk =
dt k t =0
co wyjaśnia nazwę rozpatrywanej funkcji.
Uwaga.
Między funkcją tworzącą momenty a funkcją tworzącą zachodzi zależność
M (t ) = Ψ e t
( )
(dla zmiennej losowej o nieujemnych wartościach całkowitych).
TWIERDZENIA GRANICZNE
Zbieżność ciągu zmiennych losowych z prawdopodobieństwem 1 (prawie napewno)
Ciąg zmiennych losowych (Xn) jest zbieżny do zmiennej losowej X z prawdopodobieństwem
1 jeśli
({
})
P ω : lim X n (ω ) = X (ω ) = 1
n →∞
Średniokwadratowa zbieżność ciągu zmiennych losowych
Ciąg zmiennych losowych (Xn) jest średniokwadratowo zbieżny do zmiennej losowej X jeśli
(
lim E X n − X
n→∞
2
)= 0
Rozpatrując ten rodzaj zbieżności zakładamy, że dla występujących tu zmiennych losowych
(Xn), X istnieje skończony moment rzędu 2.
11
Niekiedy stosuje się zapis l.i.m. X n = X (skrót od „limit in mean”).
Stochastyczna zbieżność ciągu zmiennych losowych
Ciąg zmiennych losowych (Xn) jest stochastycznie (wg prawdopodobieństwa) zbieżny do
zmiennej losowej X jeśli
∧
lim P( X n − X < ε ) = 1
∧
lim P( X n − X ≥ ε ) = 0
ε >0
lub równoważnie
ε >0
n→∞
n→∞
Zbieżność ciągu zmiennych losowych wg dystrybuant (wg rozkładu)
Ciąg zmiennych losowych (Xn) jest zbieżny do zmiennej losowej X wg dystrybuant jeśli ciąg
ich dystrybuant Fn jest zbieżny do dystrybuanty F w każdym punkcie jej ciągłości (F jest
dystrybuantą zmiennej losowej X).
Zależności miedzy zbieżnościami.
ZBIEŻNOŚĆ Z
PRAWDOPODOBIEŃSTWEM 1
ZBIEŻNOŚĆ
ŚREDNIOKWADRATOWA
ZBIEŻNOŚĆ
STOCHASTYCZNA
zbieżność do stałej
(tzn. gdy granica ma rozkład
jednopunktowy)
ZBIEŻNOŚĆ WG
DYSTRYBUANT
Przykład.
Rozpatrzmy ciąg zmiennych losowych skokowych określonych na przedziale [0, 1)
w następujący sposób

1

X kn (ω ) = 
0

 k k + 1
gdy ω ∈  ;

n n 
 k k + 1
gdy ω ∈ [0, 1) −  ;

n n 
1
1
;
P ( X kn = 0) = 1 −
n
n
Ciąg X01, X02, X12, X03, X13, X23, ..... jest zbieżny stochastycznie do zera bo
P ( X kn = 1) =
12
∧ε
0< <1
lim P( X n ≥ ε ) = lim
1
=0
n→∞ n
n→∞
Natomiast ciąg ten nie jest zbieżny w żadnym punkcie przedziale [0, 1) bowiem dla każdego
ustalonego punktu otrzymujemy rozbieżny ciąg zer i jedynek (zera i jedynki występują na
dowolnie dalekich miejscach).
Przykład.
Ciąg zmiennych losowych Xn ciągłych o rozkładach jednostajnych na przedziałach (0, 1/n)
jest zbieżny do rozkładu jednopunktowego X ( P ( X = 0) = 1 ) wg dystrybuant.
Uwaga.
Punktowa granica ciągu dystrybuant nie musi być dystrybuantą.
Jeśli ciąg funkcji charakterystycznych odpowiadających rozpatrywanemu ciągowi
dystrybuant jest punktowo zbieżny do funkcji ciągłej to granica tych dystrybuant jest
dystrybuantą.
Klasyfikacja twierdzeń granicznych i szerszy ich wybór p. J.Zacharski „Zarys matematyki
wyższej, T. III”.
Centralne twierdzenie graniczne Lindeberga – Levy'ego
Jeśli niezależne zmienne losowe Xi (i = 1, 2, ..., n) mają taki sam rozkład oraz istnieje
E(Xn) = m i D2(Xn) = σ2 > 0 to ciąg dystrybuant (Fn) standaryzowanych średnich
n
arytmetycznych X n (lub standaryzowanych sum ∑
Xi )
i =1
n
Yn =
Xn −m
σ/ n
=
∑X
i =1
n
− mn
σ n
jest zbieżny do dystrybuanty Φ rozkładu N(0, 1).
Aby się przekonać, że suma niezależnych zmiennych losowych o takim samym rozkładzie
może dążyć do rozkładu N(0, 1) porównajmy rozkład N(0, 1) i standaryzowane rozkłady X,
(X + Y)/2, (X + Y + Z)/3, gdzie X, Y, Z niezależne zmienne losowe o rozkładzie jednostajnym
w przedziale [– 0,5; 0,5].
13
14
Wniosek
Dla dużych n (w praktyce n ≥ 30)


P a ≤



n
∑X
i =1
i
− nm
σ n


< b  ≅ Φ (b) − Φ( a )



W przypadku szczególnym gdy Xi (i = 1, 2, ..., n) maja rozkład zerojedynkowy to powyższe
twierdzenie nazywamy twierdzeniem Moivre'a-Laplace'a
n
(zmienne losowe Yn = ∑ X i mają rozkład dwumianowy).
i =1
Wniosek z twierdzenia Moivre'a-Laplace'a:


Y − np
P a ≤ i
< b  ≅ Φ (b) − Φ (a)


npq


Uwaga. Powyższe twierdzenia wskazują na ważną rolę rozkładu normalnego.
Przykład
Wadliwość partii żarówek wynosi 0,01. Z tej partii żarówek wylosowano 625 żarówek.
Obliczyć prawdopodobieństwo, że wśród wylosowanych żarówek będzie
a) mniej niż 10 wadliwych,
b) najwyżej 10 wadliwych.
Rozwiązanie.
Yn – liczba wadliwych żarówek wśród wylosowanych,
Ad a)
 Y − 625⋅ 0,01
10− 625⋅ 0,01 
≅
P(Yi < 10) = P i
<
625⋅ 0,01⋅ 0,99 
 625⋅ 0,01⋅ 0,99
≅ Φ(1,51) = 0,93448
Ad b)
P(Yi ≤ 10) = P(Yi < 10) + P(Yi = 10) = P(Yi < 11) =
 Y − 625⋅ 0,01
11− 625⋅ 0,01 
≅
P i
<

625
⋅
0
,
01
⋅
0
,
99
625
⋅
0
,
01
⋅
0
,
99


≅ Φ(1,91) = 0,97193
Prawo wielkich liczb Chinczyna
(Xi) – ciąg niezależnych zmiennych losowych o takim samym rozkładzie oraz niech istnieje
E(Xi) = m.
n
Wtedy ciąg Yn = 1 ∑ X i jest zbieżny stochastycznie do m.
n
i =1
Wniosek
Dla dużych n jeśli istnieje D2(Xn) = σ2 > 0 to
15
∧
ε >0
ε n 
 −1
P (Yn − m < ε ) ≅ 2Φ

 σ 
Przypadek szczególny – prawo wielkich liczb Bernoulliego:
(Xi) – ciąg niezależnych zmiennych losowych o rozkładzie dwumianowym wtedy ciąg X n
n
jest stochastycznie zbieżny do p.
Wniosek
Dla dużych n:
∧
ε >0
ε n 
 X

 −1
P n − p < ε  ≅ 2Φ
 pq 
 n



Ilustracja powyższego twierdzenia dla rzutu monetą (p = 0,5),
Xn – liczba orłów w n rzutach.
n = 1000 rzutów
Przykład
Wadliwość partii żarówek wynosi 0,1. Z tej partii żarówek losujemy n żarówek. Ile żarówek
należy wylosować aby prawdopodobieństwo, że średnia liczba wadliwych żarówek różniła się
co do wartości bezwzględnej od wadliwości partii o mniej niż 0,025 było co najmniej równe
0,95.
Rozwiązanie
Yn – liczba wadliwych żarówek wśród wylosowanych
 0,025 n 
Y

 − 1 ≥ 0,95
P n − 0,1 < 0,025  ≅ 2Φ

 n

 0,1 ⋅ 0,9 
stąd
 0,025 n 
 ≥ 0,975 oraz 0,025 n ≥ 1,96
Φ

0,1 ⋅ 0,9
 0,1 ⋅ 0,9 
zatem
n ≥ 23,52 i n > 553.
16
Ocenę odchylenia wartości zmiennej losowej od jej wartości oczekiwanej daje nierówność
Czebyszewa:
X – zmienna losowa oraz istnieje E(X) = m i D2(X) = σ2 > 0 wtedy
∧
ε >0
σ2
P( X − m ≥ ε ) ≤ 2
ε
σ2
∧ P( X − m ≤ ε ) ≥ 1 − 2
ε >0
ε
lub
(zatem σ jest miarą odchylenia wartości zmiennej losowej od wartości oczekiwanej).
Zauważmy, że dla ε = 3σ otrzymujemy uogólnione prawo "trzech sigm".
Z nierównością Czebyszewa związane są inne nierówności np.
1) nierówność Markowa
P( X ≥ ε ) ≤
∧ ∧
ε >0
p >0
EX
p
εp
2) nierówność Czebyszewa II
∧
ε >0
P( X ≥ ε ) ≤
EX
ε
3) nierówność Czebyszewa III (wykładnicza)
jeśli
Ee
λX
<∞
to ε∧
>0
Ee λX
P( X ≥ ε ) ≤ λε
e
4) nierówność Bernsteina
jeśli Sn – liczba sukcesów w n próbach Bernoulliego z prawdopodobieństwem sukcesu p to
∧
ε >0

 Sn
− 2 nε 2
P
− p ≥ ε  ≤ 2e
n


17
ZADANIA
Zadanie 2.1
X - rozkład wykładniczy o parametrze a = 10, tzn.
10e −10 x dla x ≥ 0
f ( x) = 
,
dla x < 0
0
wyznaczyć gęstość rozkładu zmiennej losowej Y = 2 - 3X.
Zadanie 2.2
Temperatura X mierzona w skali Fahrenheita ma rozkład jednostajny w przedziale
(t1; t2). Wyznaczyć rozkład temperatury przeliczonej na skalę Celsjusza Y = 5(X – 32)/9.
Zadanie 2.3
Oporność R rezystora ma rozkład jednostajny w przedziale (r - ∆; r + ∆ ). Wyznaczyć rozkład
przewodności Y = 1/R.
Zadanie 2.4
X - zmienna losowa skokowa o funkcji prawdopodobieństwa:
-2
0,3
-1
0,1
0
0,1
1
0,3
2
0,2
wyznaczyć funkcję prawdopodobieństwa zmiennej losowej Y = X2 .
Zadanie 2.5
Sprawdź, że jeśli
dla X ≤ a
a

Y = X
b

dla a < X ≤ b
dla b < X
to
0

G( y) = F ( y)
1

dla y ≤ a
dla a < y ≤ b
dla b < y
Gdzie G - dystrybuanta Y, F - dystrybuanta X, a, b - poziomy nasycenia.
Zadanie 2.6
Sprawdź, że jeśli
X
Y = min( X , a ) = 
a
to
0
G( y) = 
F ( y)
dla X ≤ a
dla a < X
dla y ≤ a
dla a < y
Gdzie G - dystrybuanta Y, F - dystrybuanta X.
18
Zadanie 2.7
Które z poniższych funkcji nie mogą być funkcjami charakterystycznymi?
1. ϕ (t ) = 1 ,
1+ t
2. ϕ (t ) = 1 2 ,
1+ t
3. ϕ (t ) = sin at ,
4. ϕ (t ) = cos at ,
5. ϕ (t ) = 1 − it .
Zadanie 2.8
Wyznacz funkcję charakterystyczną rozkładu Poissona.
Korzystając z niej wyznacz wartość oczekiwaną i wariancję tego rozkładu.
Zadanie 2.9
Korzystając z funkcji charakterystycznej rozkładu wykładniczego wyznacz wartość
oczekiwaną i wariancję tego rozkładu.
Zadanie 2.10
Wyznacz funkcję charakterystyczną rozkładu geometrycznego.
Korzystając z niej wyznacz wartość oczekiwaną i wariancję tego rozkładu.
Zadanie 2.11
Wyznacz funkcję charakterystyczną rozkładu jednostajnego na przedziale (0, 1). Następnie
korzystając z własności funkcji charakterystycznej wyznacz funkcję charakterystyczną
rozkładu jednostajnego na przedziale (a, b), a < b.
Zadanie 2.12
Wyznacz funkcję charakterystyczną rozkładu gamma.
Zadanie 2.13
Wyznacz funkcję charakterystyczną rozkładu liczby wyrzuconych orłów przy rzucie trzema
monetami.
Zadanie 2.14
Pokazać, że suma niezależnych zmiennych losowych o rozkładzie Poissona z parametrami
λ1, ..., λn jest również zmienną losową o rozkładzie Poissona o parametrze λ1 + ... +λn.
19
Zadanie 2.15
Pokazać, że
suma
niezależnych
zmiennych
losowych
o
rozkładzie
N(mi,
σi),
i = 1, ..., n; jest zmienną losową N(m1 + ... + mn, σ1 + ... + σn).
Zadanie 2.16
Zmienna losowa X ma funkcję prawdopodobieństwa
P(X = -2) = 0,25; P(X = 0) = 0,5; P(X = 2) = 0,25
Wyznacz funkcję charakterystyczną tej zmiennej losowej.
Zadanie 2.17
Zmienna losowa X ma dystrybuantę
x ≤ −1
−1 < x ≤ 1
0

F ( x) =  0,5
1
x >1
a) Wyznacz funkcję charakterystyczną tej zmiennej losowej.
b) Wyznacz funkcję charakterystyczną zmiennej losowej Y = 2X +1.
Zadanie 2.18
Wyznaczyć rozkład prawdopodobieństwa zmiennej losowej, której funkcja charakterystyczna
ma postać ϕ (t ) = cos t .
(Wsk. cos t = 1 (eit + e−it ) )
2
Zadanie 2.19
ma postać ϕ (t ) = cos 2 t .
(Wsk. cos2 t = 1 (1 + cos 2t ) ),
2
Zadanie 2.20
ma postać ϕ (t ) = 0,25(1 + eit ) .
2
(Wsk. 0,25(1 + eit ) = 0,25 + 0,5eit + 0,25e2it ),
2
Zadanie 2.21
ma postać ϕ (t ) = e −0,5t .
2
20
Zadanie 2.22
Zmienna losowa X ma funkcję charakterystyczną postaci ϕ (t ) = e− t . Czy istnieje EX?
Zadanie 2.23
Zmienna losowa X ma dystrybuantę
x≤0
0< x≤2
0

F ( x) = 0,5 x
1
x>2
Zadanie 2.24
Zmienna losowa X ma gęstość
x ≤ −1
−1 < x ≤ 0
0
 x + 1
f ( x) = 
1− x

0
0 < x ≤1
x >1
Zadanie 2.25
Niech X i Y będą niezależne o rozkładzie jednostajnym na (-0,5; 0,5). Pokazać, że ich suma
ma rozkład o gęstości jak w poprzednim zadaniu.
Zadanie 2.26
Niech X i Y będą niezależne o tym samym rozkładzie i funkcji charakterystycznej ϕ (t ) .
Wyznacz funkcję charakterystyczną zmiennej losowej Z = X - Y.
Zadanie 2.27
Funkcja
(
)
1


f (t , s ) = exp 2it − is − 4t 2 + 9ts + 9 s 2 
2


jest funkcją charakterystyczną 2 wymiarowego rozkładu normalnego. Wyznaczyć wektor
wartości oczekiwanych i macierz kowariancji tej zmiennej losowej. Wyznaczyć gęstość tego
rozkładu.
Zadanie 2.28
System składa się z 2 układów z których każdy ma czas bezawaryjnej pracy określony
rozkładem wykładniczym Xi o parametrze ai niezależnym od drugiego układu. Wyznaczyć
21
rozkład bezawaryjnego czasu pracy całego systemu (system działa jeśli oba układy pracują).
Y = min(X1 , X2 )
Odp. Jest to rozkład wykładniczy o parametrze a1 + a2.
Zadanie 2.29
X1 , X2 , ..., Xn - niezależne zmienne losowe o rozkładzie określonym gęstością f(x).
Wyznaczyć rozkład zmiennej losowej Y = min(X1 , X2 , ..., Xn ).
(odp. G ( y ) = 1 − (1 − F ( y)) n ; g ( y ) = nf ( y )(1 − F ( y )) n −1 )
Zadanie 2.30
X1 , X2 , ..., Xn - niezależne zmienne losowe o rozkładzie określonym gęstością f(x).
Wyznaczyć rozkład zmiennej losowej Y = max(X1 , X2 , ..., Xn ).
(odp. G( y) = F n ( y ) ; g ( y ) = 2 f ( y ) F n−1 ( y ) )
Zadanie 2.31
Wyznaczyć gęstość rozkładu logarytmiczno-normalnego.
(odp. g ( y ) =
1
σy 2π
e
−
(ln y − m ) 2
2σ 2
y ≥ 0)
Zadanie 2.32
X, Y - niezależne zmienne losowe o rozkładzie określonym funkcją prawdopodobieństwa
P(X = 0) = 1/2, P(X = 1) = 3/8, P(X = 2) = 1/8,
Wyznacz funkcję prawdopodobieństwa zmiennej losowej X + Y.
Zadanie 2.32
a) X, Y - niezależne zmienne losowe o rozkładzie jednostajnym w [0, 1].
Wyznacz gęstość zmiennej losowej X + Y. Wyznacz parametry tej zmiennej losowej.
b) X, Y, Z - niezależne zmienne losowe o rozkładzie jednostajnym w [0, 1].
Wyznacz gęstość zmiennej losowej X + Y + Z. Wyznacz parametry tej zmiennej losowej.
Zadanie wykonaj stosując splot gęstości a wynik sprawdź za pomocą funkcji
charakterystycznych.
22
Naszkicuj i porównaj wykresy gęstości zmiennych losowych
X,
X + Y,
X + Y + Z.
Zauważ, że gdy rośnie liczba rozpatrywanych składników, wykres gęstości staje się podobny
do krzywej Gaussa.
Zadanie 2.33
X - zmienna losowa odpowiadająca mierzonej wielkości (zakładamy, że ma rozkład
jednostajny w [0, 8]), Y - niezależna od X
zmienna losowa
opisująca błąd pomiaru
(zakładamy, że ma rozkład normalny N(0, 1)).
Wyznacz
gęstość
zmiennej
losowej
odpowiadającej
wynikowi
pomiaru
U = X + Y. Wyznacz parametry tej zmiennej losowej.
Zadanie wykonaj stosując splot gęstości a wynik sprawdź za pomocą funkcji
charakterystycznych. Naszkicuj wykres gęstości zmiennej losowej X + Y.
Zadanie 2.34
Wykazać, że ciąg zmiennych losowych
n
Yn =
∑ (X
i =1
i
− m)
n
jest zbieżny stochastycznie do zera.
Zakładamy,
że
zmienne
losowe
są
niezależne
o
takim
samym
rozkładzie
i skończonych momentach rzędu 2.
(Wsk. Wykazać zbieżność średniokwadratową)
Zadanie 2.35
Sprawdź, że punktowa granica ciągu dystrybuant
gdy x ≤ −n
0
x + n

Fn ( x) = 
gdy − n < x ≤ n
2
n

gdy x > n
1
jest funkcją która nie jest dystrybuantą.
Zadanie 2.36
Rzucamy a) 100, b) 1000, c) 10000 razy monetą. Oszacować stosując nierówność
Czebyszewa i Bernsteina prawdopodobieństwo, że liczba orłów będzie różnić się od wartości
oczekiwanej o więcej niż 5%.
23
Zadanie 2.37
Wiadomo, że 70% studentów pewnego wydziału WAT kończy studia w terminie. Jeśli studia
na tym wydziale rozpoczęło 60 studentów, to oceń szansę ukończenia przez przynajmniej 45
z nich studiów w terminie. Zastosuj twierdzenie graniczne.
Zadanie 2.37
Rzucamy 500 razy kostką sześcienną. Wyznaczyć prawdopodobieństwo tego, że częstość
wypadania jedynki będzie należała do przedziału
(1/6 – 0,05; 1/6 + 0,05).
Zadanie 2.38
Ile razy należy rzucić monetą aby z prawdopodobieństwem co najmniej 0,975 twierdzić, że
częstość wypadania orła będzie należała do przedziału (0,4; 0,6).
Zadanie 2.39
Ile razy należy rzucić monetą aby z prawdopodobieństwem 0,95 twierdzić, że częstość
wypadania orła będzie różniła się od 0,5 co najwyżej o 0,1.
Zadanie 2.40
Wadliwość pewnego wyrobu wynosi 10%. Obliczyć prawdopodobieństwo, że wśród 100
losowo wybranych sztuk tego wyrobu będzie od 5 do 12 sztuk wadliwych.
Zadanie 2.41
Zmienna losowa Y jest średnią arytmetyczną 3200 niezależnych zmiennych losowych
o jednakowym rozkładzie o wartości oczekiwanej 3 i wariancji 2.
Obliczyć prawdopodobieństwo, że Y przyjmuje wartości z przedziału (2,95; 3,075).
Zadanie 2.42
Wiedząc, że wariancja każdej z 4500 niezależnych zmiennych losowych o jednakowym
rozkładzie jest równa 5, oszacować prawdopodobieństwo, że średnia tych zmiennych odchyli
się od jej wartości oczekiwanej nie więcej niż o 0,04.
L.Kowalski, 27. 03.2010
24

funkcje zmiennej losowej. f-charakterystyczna. tw

Transkrypt

Podobne dokumenty

Spis treści

1. Asia i Basia umówiły się między 16:00 a 17:00 w centrum miasta

Zadanie 1. Zmienna losowa X ma dystrybuantę FX daną wzorem: FX

ćwiczenia z rachunku prawdopodobieństwa matematyka, III rok lista

Zmienne losowe ciągłe - Uniwersytet Zielonogórski

X, Y

Wartość oczekiwana, wariancja, odchylenie standardowe, momenty

STATYSTYKA MATEMATYCZNA Zestaw 1. Rachunek

Mathcad - procesy_stochastyczne.xmcd

Zestaw11