Funkcje charakterystyczne

Transkrypt

Funkcje charakterystyczne
Arkadiusz Kwoska
Rafał Kukliński
Funkcje charakterystyczne
Zadanie 1
Jaki rozkład ma suma niezależnych zmiennych losowych X i Y o rozkładach
a) N(E1,σ1) i N(E2,σ2)
Przy rozwiązywaniu tego zadania będziemy korzystali z funkcji charakterystycznych
Definicja
Funkcję charakterystyczną zmiennej losowej X definiujemy jako:
ϕ X (ν ) = Ee jνX

e jνx dFX ( x)
∫

=  ζ ( Ω )jνx
k
 ∑ e P ( X = xk )
 xk ∈ζ ( Ω )
Jeżeli szukamy funkcji charakterystycznej sumy dwóch niezależnych zmiennych losowych, to można
napisać, że:
ϕ X +Yν
z definicji
=
(
Ee jν ( X +Y ) = E e jνX ⋅ e jνY
)
z niezleznosci
=
Ee jνX ⋅ Ee jνY = ϕ X (ν ) ⋅ ϕ Y (ν )
Czyli można sformułować wniosek, że dodawanie wielkości niezależnych odpowiada mnożeniu ich
funkcji charakterystycznych i splataniu gęstości prawdopodobieństwa1
Tak więc, aby otrzymać rozkład prawdopodobieństwa sumy zmiennych losowych skorzystamy z funkcji
charakterystycznych. Do przedstawienia zmiennych losowych X i Y w postaci funkcji charakterystycznych
wykorzystam dodatkową zmienną losową Z o rozkładzie normalnym N(0,1). Wiem, że gęstość
prawdopodobieństwa dla takiej zmiennej losowej wyraża się wzorem:
z2
1 −2
pZ ( z ) =
e
2π
Funkcja charakterystyczna policzona z definicji ma postać:
ϕ Z (ν ) =
∞
∫p
−∞
jνz
Z
( z ) ⋅ e dz =
∞
∫
−∞
z2
ν2
−
−
1
⋅ e 2 ⋅ e jνz dz = e 2
2π
Dla tak określonej zmiennej losowej nietrudno zauważyć, że:
X = σ 1Z + E1 oraz
Y = σ 2 Z + E2
powyższe nierówności wynikają, z wyglądu rozkładu zmiennej losowej Z:
Tak więc wymnożenie funkcji rozkładu przez σ1 przeskaluje ją, natomiast dodanie E1 powoduje
przesunięcie rozkładu we właściwe miejsce.
1
Wniosek ten będę wykorzystywał wielokrotnie w kolejnych zadaniach
Korzystając z wymienionych równości można napisać:
ϕ X (ν ) = ϕσ1Z + E1 (ν )
z wlasnosci liniowosci
=
ϕ Z (σ 1ν )e
jνE1
korzystajac z funkcji charakterystycznej Z
=
e
−
σ 12ν 2
+ jνE1
2
Postępując analogicznie w stosunku do zmiennej losowej Y otrzymuję jej funkcję charakterystyczną:
ϕ Y (ν ) = e
−
σ 2 2ν 2
+ jνE2
2
Jak już przedstawiliśmy powyżej funkcja charakterystyczna sumy zmiennych losowych jest iloczynem
funkcji charakterystycznych tych zmiennych, a więc:
ϕ X +Y (ν ) = ϕ X (ν ) ⋅ ϕ Y (ν ) = e
(
ν2
− σ 12 +σ 22
2
)
e jν ( E1 + E2 )
Na podstawie funkcji charakterystycznej można odtworzyć funkcję rozkładu prawdopodobieństwa.
Moglibyśmy więc skorzystać z twierdzenia o jednoznaczności:
1
p X ( x) =
2π
∫
∞
∞
e ϕ X (ν )dν = ∫ e
jνx
−∞
(
)
ν2
jνx − σ12 +σ 22 + jν ( E1 + E2 )
2
−∞
dν
Ale już na podstawie obserwacji funkcji charakterystycznej sumy zmiennych losowych można zauważyć,
że:
ϕ X +Y (ν ) = e
gdzie
−
σ 32ν 2
+ jνE3
2
σ 3 = σ 12 + σ 2 2 oraz E3=E1+E2
Stąd widać już, że rozkład sumy zmiennych losowych będzie rozkładem normalnym.
Odp. Rozkład sumy dwóch zmiennych losowych o rozkładach normalnych N(E 1,σ1) i N(E2,σ2) jest również
rozkładem normalnym postaci
2
2
N  E1 + E2 , σ 1 + σ 2  .


b) Poissona z parametrami a i b:
a ne−a
b n e −b
i
, n=0,1,… , a,b>0
P ( X = n) =
P (Y = n) =
n!
n!
Przypomnijmy na początek jak wygląda rozkład Poissona2:
Podobnie jak w punkcie poprzednim skorzystam z funkcji charakterystycznych. Najpierw policzę funkcje
charakterystyczne zmiennych losowych X i Y z definicji:
∞
ϕ X (ν ) = ∑ e
k =0
2
wykresu
jνk
(
∞
a k e −a
ae jν
= e −a ∑
k!
k!
k =0
)
k
Osie są nie opisane, gdyż konkretne wartości zależą od zmiennych a (lub b). Wykres ma jedynie przedstawić kształt
Korzystając z faktu, że:
ex = ∑
i ≥0
xi
można funkcję charakterystyczną zapisać jako3:
i!
ϕ X (ν ) = e −a e ae = e a ( e
jν
i analogicznie
ϕY (ν ) = e b ( e
jν
jν
)
−1
)
−1
Teraz korzystając z faktu, że funkcja charakterystyczna sumy zmiennych losowych jest iloczynem funkcji
charakterystycznych:
ϕ X +Y (ν ) = e a ( e
) ⋅ eb ( e ν −1) = e ( a +b ) ( e ν −1)
jν
−1
j
j
Podobnie jak w punkcie a zamiast korzystać z transformaty odwrotnej, wystarczy zauważyć, że:
ϕ X +Y (ν ) = e c ( e
jν
)
−1
gdzie c=a+b
czyli mamy tu do czynienia z rozkładem Poissona o parametrze a+b.
Odp. Rozkład sumy dwóch zmiennych losowych o rozkładach Poissona z parametrami a i b jest również
rozkładem Poissona, z parametrem a+b czyli:
P ( X + Y = n) =
( a + b ) n e − ( a +b )
n!
Zadanie 3
a)
Znajdź funkcję charakterystyczną
liczby szóstek w N rzutach kostką symetryczną
Zgodnie z sugestią zawartą w skrypcie przedstawię poszczególne rzuty jako niezależne zmienne losowe o
rozkładzie dwupunktowym:
Niech Xi=0 oznacza porażkę, czyli wyrzucenie liczby oczek różnej od 6, natomiast Xi=1 to sukces czyli
wyrzucenie 6. Prawdopodobieństwa tych zdarzeń wynoszą odpowiednio
q = 1− p =
5
1
oraz p = .
6
6
Można więc napisać:
1
6
5
P ( X i = 0) =
6
P ( X i = 1) =
Tak więc Xi to wynik rzutu w i-tej próbie. Funkcja charakterystyczna tej zmiennej losowej to:
1
ϕ X (ν ) = ∑ e jνn P( X = n) =e jν
n =0
1
5
1 5
+ e jν 0 = e jν +
6
6
6 6
Wprowadzimy nową zmienną losową Y aby przedstawić ilość sukcesów tzn. liczbę szóstek po N rzutach:
Y=X1+…XN
Funkcja charakterystyczna tej zmiennej ma postać:
ϕ Y (ν ) = ϕ X1 +...+ X N (ν )
z niezaleznosci
=
1 5

ϕ X1 (ν ) ⋅ ... ⋅ ϕ X N (ν ) = ( ϕ X (ν ) ) N =  e jν + 
6 6

N
Korzystając z wzoru dwumianowego Newtona można powyższy wynik wyrazić w formie równoważnej:
1
ϕ Y (ν ) =  
6
N N
 N  jνk N −k  5 
 e 5
= 
∑
6
k =0  k 
N N
 N  e jν
 
∑
k =0  k  5



k
Odp. Funkcja charakterystyczna liczby szóstek w N rzutach kostką symetryczną ma postać:
3
To podstawienie wykonuję jedynie w tym miejscu. W kolejnych zadaniach będę traktował funkcję
charakterystyczną rozkładu Poissona jako znaną.
N
N N
(
)
N
5
= 
6
 N  e jν
 
∑
k =0  k  5
k



b) sumy K niezależnych zmiennych losowych o rozkładach wykładniczych p ( x) = ae − ax , x ≥ 0 , co się
K
= c pozostaje stałe
dzieje gdy K → ∞ i a → ∞ w ten sposób, że
a
1
ϕ Y (ν ) =   e jν + 5
6
Znów skorzystamy z funkcji charakterystycznych. Funkcja charakterystyczna zmiennej losowej X o danym
rozkładzie ma postać:
∞
ϕ X (ν ) = ∫ ae −ax e − jνx dx =
0
a
a − jν
4
teraz aby znaleźć funkcję charakterystyczną sumy niezależnych zmiennych losowych o funkcjach
charakterystycznych korzystam z faktu, iż jest to iloczyn tych funkcji charakterystycznych. A ponieważ
wszystkie K zmiennych ma identyczne funkcje charakterystyczne więc:
ϕ Y (ν ) = ( ϕ X (ν ) )
K
 a
= 
 a − jν



K
gdzie Y=X1+…+XK
Rozkład prawdopodobieństwa dla zmiennej losowej o takiej funkcji charakterystycznej ma postać:
pY ( y ) =
a K y K −1e − ay
Γ( K )
Rozkład taki można przedstawić na wykresie:
Celowo nie umieściliśmy opisów osi, gdyż wartości zależą od współczynnika a oraz od ilości zmiennych K. Od
parametrów tych zależy również kształt rozkładu.
Rozważmy teraz sytuację, gdy K oraz a dążą do nieskończoności, natomiast ich stosunek pozostaje stały.
Wówczas:
 a
ϕ Y (ν ) = 
 a − jν
K

1
1
1
 =
=
=
K
K
K
K
jνc 
 a − jν 



j
ν
1
−






a 
K 
 a 

1 −
K 





→ e jνc
K →∞
a →∞
K
=const
a
czyli jak widzimy rozkład Gamma przy granicy przechodzi w deltę. Trzeba przyznać, że jest to nieco
zaskakujący wynik:
4
Warto zwrócić uwagę na podobieństwo do rozwinięcia Fouriera
Cofnijmy się nieco i zauważmy, że rozkład jaki uzyskaliśmy, jest rozkładem Erlanga K-tego rzędu. Policzmy
wartości σ oraz E dla tego rozkładu:
PROBLEM, ŻE JESZCZE NIE WIEM JAK POLICZYĆ
c) liczby rzutów kostką symetryczną do wyrzucenia „szóstki” po raz K-ty
Innymi słowy interesuje nas ilość prób poprzedzających K-ty sukces, przy czym sukcesem jest wyrzucenie
szóstki, a próba polega na rzucie kostką. Oznaczmy zatem f ( r , K , p ) jako prawdopodobieństwo, że K-ty
sukces zrealizuje się w próbie o numerze K+r. Oznacza to, że wśród pierwszych K+r-1 prób mamy dokładnie n
porażek i (r+K) – ta próba zakończyła się sukcesem. Odpowiednie prawdopodobieństwa są
 K + r − 1

 = p K −1q r
r


oraz p. Tak więc otrzymujemy rozkład:
 K + r − 1 K r
 p q
f (r , K , p) = 
r


zwany rozkładem Pascala, gdzie K-liczba sukcesów, r+K=x – ilość prób. p –prawdopodobieństwo sukcesu,
q=1-p – prawdopodobieństwo porażki. Tak więc jeśli naszą zmienną losową oznaczymy jako X, to jej rozkład
prawdopodobieństwa:
 x − 1  K x−K
 p q
P ( X = K ) = 
x − K
gdzie
p=
1
- prawdopodobieństwo wyrzucenia szóstki, x- liczba rzutów, K – ilość wyrzuconych szóstek
6
Mamy tutaj do czynienia ze zmienną losową dyskretną, więc aby znaleźć funkcję charakterystyczną należy
posłużyć się wzorem:
K
ϕ X (ν ) = ∑ e jvn P( X = n)
n=0
Spróbujmy podejść do problemu z innej strony. W tym celu zdefiniujemy zmienną losową Yi – oznaczającą i
rzutów do wyrzucenia pierwszej szóstki. Wówczas można opisać zmienną losową X – liczba rzutów do
wyrzucenia K szóstek jako: X=Y1+…+YK. Rozkład prawdopodobieństwa tak zdefiniowanej zmiennej losowej Y
ma postać:
5
P(Y = i ) =  
6
i −1
1
6
Natomiast funkcja charakterystyczna:
∞
ϕY (ν ) = ∑ e
k =1
jνk
1 ∞
5
P(Y = k ) = ∑ e jνk  
6 k =1
6
k −1
Ponieważ poszczególne rzuty kostką są zdarzeniami niezależnymi, więc możemy skorzystać z faktu, że
funkcja charakterystyczna sumy niezależnych zmiennych losowych jest iloczynem funkcji charakterystycznych
tych zmiennych, więc:
ϕ X (ν ) = ϕ Y1 +...+YK (ν ) = ( ϕ Y (ν ) )
K
 1 ∞ jνk  5  k −1 
=  ∑e   
 6 k =1
 6  

K
CO Z TYM DALEJ, TO JEDEN PAN BÓG WIE
Zadanie 4
Potrzebuję X sekund na dokończenie obliczeń, a za Y sekund mój komputer padnie. Y ma rozkład
pY ( y ) = ae − ay . Wyraź przy pomocy ϕX(ν) prawdopodobieństwo, że zdążę.
W tym zadaniu interesuje nas jakie jest prawdopodobieństwo, że jednak czas na skończenie obliczeń
okaże się krótszy od czasu prawidłowej pracy komputera. Można to zapisać:
P( X ≤ Y )
Interesujące nas prawdopodobieństwo można zapisać korzystając z twierdzenia o prawdopodobieństwie
całkowitym:
+∞
P( X ≤ Y ) = ∫ p ( X ≤ Y | x ≤ Y < x + dx) p ( x ≤ Y < x + dx )dx
−∞
Stąd można zapisać:
+∞
P( X ≤ Y ) = ∫ p ( X ≤ Y | x ≤ Y < x + dx) p ( x)dx
−∞
Teraz skorzystajmy z faktu, że:
P( X ≤ Y | x ≤ Y < x + dx) = ∫
+∞
x
+∞
+∞
x
x
p ( y )dy = ∫ ae −ay dy = − e −ay
= e −ax
czyli szukane prawdopodobieństwo można zapisać jako:
+∞
P( X ≤ Y ) = ∫ e −ax p ( x)dx
−∞
Jeżeli podstawimy, że − a = jν , to wówczas można zauważyć, że szukane prawdopodobieństwo jest
funkcją charakterystyczną:
+∞
P( X ≤ Y ) = ∫ e jνx p( x)dx = ϕ X (ν )
−∞
przy czym:
ν=
− a − aj
= 2 = aj
j
j
czyli otrzymujemy równość:
+∞
P( X ≤ Y ) = ∫ e jνx p( x)dx = ϕ X (aj )
−∞
Odp. Poszukiwane prawdopodobieństwo, że zdążę dokończyć obliczenia zanim mój komputer padnie
wyrazić można w postaci funkcji charakterystycznej postaci:
P ( X ≤ Y ) = ϕ X (aj )
gdzie a – parametr rozkładu wykładniczego, że mój komputer padnie
Zadanie 6
Znajdź rozkład Y, jeżeli:
a) Y – liczba sukcesów w serii niezależnych doświadczeń ze stałym prawdopodobieństwem sukcesu p,
której długość N ma rozkład Poissona z parametrem a.
Przedstawmy serię niezależnych doświadczeń jako:
Y = X 1 + ... + X N
gdzie doświadczenie Xi ma rozkład binarny, czyli:
P ( X i = 1) = p
P ( X i = 0) = q = 1 − p
gdzie p to dane prawdopodobieństwo sukcesu w i-tej próbie.
Funkcję charakterystyczną takiej zmiennej losowej liczyliśmy już w zadaniu 3, a więc:
ϕ X (ν ) = e jν p + q
Długość serii N ma rozkład Poissona z parametrem a, więc:
a k e−a
P( N = k ) =
k!
Ponieważ mamy do czynienia ze zdarzeniami niezależnymi, więc przy warunku, że N=n możnaby
napisać:
ϕY (ν ) = ( ϕ X (ν ) )
n
Uwzględniając fakt, że różne długości serii występują z różnymi prawdopodobieństwami piszemy,
korzystając ze średniej warunkowej, że funkcja charakterystyczna ma postać:
(
∞
k
a k e −a jv
ae jν p + aq
−a
ϕY (ν ) = ∑ P ( N = k )( ϕ X (ν ) ) = ∑
e p+q =e ∑
k!
k!
k =0
k =0
k =0
∞
Korzystając z faktu, że
k
ex = ∑
i ≥0
(
∞
)
)
k
xi
przedstawimy funkcję charakterystyczną jako:
i!
ϕ Y (ν ) = e −a e ae
jν
p + aq
= ea(e
jν
p + q −1
)
Jeśli zauważymy, że p=1-q to powyższą funkcję charakterystyczną można zapisać w postaci:
ϕ Y (ν ) = e ae
jν
− ae jν q + aq − a
= ea(e
jν
) (
−1 − aq e jν −1
) = e a (1−q ) ( e ν −1) = e ap ( e ν −1)
j
j
Jak łatwo zauważyć, mamy tutaj do czynienia z rozkładem Poissona o parametrze ap. Stąd można już
sformułować odpowiedź
Odp. Rozkład zmiennej losowej Y reprezentującej liczbę sukcesów w serii niezależnych doświadczeń ze
stałym prawdopodobieństwem sukcesu p, której długość ma rozkład Poissona z parametrem a ma postać
rozkładu Poissona z parametrem ap tzn:
k
(
ap ) e − ap
P(Y = k ) =
k!
b) Y – łączny czas pobytu zadania w kolejce do procesora; zakładamy, że każdorazowy pobyt w kolejce
ma rozkład wykładniczy. Po przetworzeniu zadanie wraca do kolejki z prawdopodobieństwem p i
opuszcza system z prawdopodobieństwem 1-p, zaś czasy kolejnych pobytów w kolejce są wzajemnie
niezależne.
Wprowadźmy dodatkową zmienną losową Xi oznaczającą czas pobytu zadania w kolejce po raz i-ty. Z
treści zadania wiadomo, że Xi ma rozkład wykładniczy, a więc:
p X i ( x) = ae − ax
Natomiast funkcja charakterystyczna tej zmiennej losowej jak wiemy z zadania 3b wynosi:
ϕ X i (ν ) =
a
a − jν
Dodatkowo wiadomo, że po przetworzeniu zadania prawdopodobieństwo, że trafi ono z powrotem do
kolejki wynosi p. Łączny czas pobytu zadania w kolejce można zapisać jako:
Y = X 1 + X 2 + ... + X N + ...
Natomiast rozkład N ilości pobytów zadania w kolejce:
pk −1
P( N = k ) = 1 + p + p + ... + p =
p −1
2
k
Tak więc funkcja charakterystyczna zmiennej losowej Y ma postać:
∞
ϕ Y (ν ) = ∑ P( N = k )( ϕ X (ν ) )
k =0
k
 p k − 1  a

= ∑ 
k =0  p − 1  a − jν
∞



k
Po przekształceniach i zastosowaniu wzór na szereg geometryczny otrzymujemy:
1  ∞  pa
ϕ Y (ν ) =
∑
p − 1  k =0  a − jν

k
∞

 a
 − ∑ 
 k =0  a − j ν
Po krótkich obliczeniach otrzymujemy:
ϕ Y (ν ) =
k



1
1
1

=
−
 p −1
pa
a

 1 − a − jν 1 − a − jν

1
a (1 − p )
a
⋅ 2
=
2
p − 1 pa − pa − jν pa − pa − jν
NIE WIEM JAK PRZEJŚĆ NA ROZKŁAD
Odp.








