Łancuchy Markowa z czasem dyskretnym Procesy Stochastyczne

Transkrypt

Łancuchy Markowa z czasem dyskretnym Procesy Stochastyczne
Łańcuchy Markowa z czasem dyskretnym
Procesy Stochastyczne, wykład 6, T. Byczkowski,
Procesy Stochastyczne, PPT, Matematyka
MAP1136
19 marzec, 2012
Łańcuchy Markowa z czasem dyskretnym
Przykłady procesów Markowa
P
(i). P = (pij ) - macierz stochastyczna, tzn. pij ≥ 0, j pij = 1.
Definiujemy
X
P1 (i, A) =
pij , (pij = P1 (i, {j})).
j∈A
Z równania Chapmana-Kołmogorowa macierz (P2 (i, {j})) przejścia w dwóch krokach - powinna spełniać
X
(2)
pij = P2 (i, {j}) =
pik pkj .
k
Stąd, macierz przejścia P(2) w dwóch krokach, będzie iloczynem
macierzy P: P(2) = P2 oraz ogólniej: P(s+k) = P(s) P(k) = Ps+k .
Bezpośrednio sprawdzamy, że taka definicja prawd. przejścia
pociąga za sobą równość Chapmana-Kołmogorowa, więc każda
macierz stochastyczna definiuje prawd. przejścia Pt (x, E ), gdzie
T = {0, 1, . . . , }, S = {0, 1, . . . , }, BS = 2S .
Łańcuchy Markowa z czasem dyskretnym
Przykłady procesów Markowa cd.
(ii). Niech T = [0, ∞), S = {0, 1, . . . , }, BS = 2S . Dla λ > 0
definiujemy
pi,i+j (t) := Pt (i, {i + j}) = e −λt (λt)j /j!.
Są to prawd. przejścia w procesie Poissona o intensywności λ.
[P(Xt+h = i + j|Xh = i) = P(Xt = j) = pi,i+j (t)].
(iii). Niech T = [0, ∞), S = R, BS = BR . Dla A borelowskiego
na S = R kładziemy
Z
√
2
e −y /2t dy
Pt (x, A) = 1/ 2πt
A−x
Są to prawd. przejścia w procesie Wienera
[P(Xt+h ∈ A|Xh = x) = P((Xt+h − Xh ) + Xh ∈ A|Xh = x) =
P(Xt ∈ A − x)].
Łańcuchy Markowa z czasem dyskretnym
Łańcuchy Markowa
Rozpatrujemy przypadek T = {0, 1, . . . , }, S = {0, 1, . . . , },
BS = 2S .Ppj,k - prawd. przejścia w jednym kroku z stanu j do
stanu k, k pj,k = 1. Prawd. przejścia z stanu j do stanu k w
(n + 1) krokach dane jest przez
X
(n+1)
(n)
pj,k
=
pj,l pl,k , n = 1, 2, . . .
l
Zakładamy dalej, że S - skończony. Prawd. przejścia określają
macierz stochastyczną (n × n). Macierz przejścia w n krokach jest
dana wzorem P(n) = Pn . Równania Chapmana-Kołmogorowa
redukują sie do
P(n+m) = P(n) P(m) = Pn Pm .
Podstawowy problem - zachowanie systemu tzn. Pn w czasie
(n)
n → ∞. Przy pewnych założeniach prawd. przejścia pj,k → gdy
n → ∞. Mówimy, że po upływie długiego czasu system jest
stacjonarny.
Łańcuchy Markowa z czasem dyskretnym
Zbieżność Pn
Tw. 1.
Niech P będzie macierzą stochastyczną. Załóżmy, że dla pewnego
(m)
m, pi,j > 0 dla wszystkich i, j. Wtedy
lim Pn = π
istnieje.
i jest macierzą stochastyczną o identycznych wierszach.
Dowód.
Załóżmy, że m = 1. Wtedy pi,j ≥ ε > 0, dla każdego i, j. Niech
(n)
mj (n) = min pi,j będzie najmniejszym elementem j-tej kolumny
(n)
Pn ; analogicznie, niech Mj (n) = max pi,j . Wtedy
P
P
(n)
(n−1)
pi,j = k pi,k pk,j
≥ k pi,k mj (n − 1) = mj (n − 1)
dla każdego i, czyli mj (n) ≥ mj (n − 1).
Łańcuchy Markowa z czasem dyskretnym
Zbieżność Pn cd.
Analogicznie pokazujemy, że Mj (n) ≤ Mj (n − 1). Istnieją więc
(n)
granice ciągów mj (n) i Mj (n). Załóżmy, że mj (n) = pi0 j oraz
(n−1)
Mj (n − 1) = pi1 j
. Wtedy
(n)
mj (n) = pi0 j =
X
(n−1)
pi0 ,k pk,j
=
k
(n−1)
εpi1 j
(n−1)
+ (pi0 ,i1 − ε)pi1 j
X
+
(n−1)
pi0 ,k pk,j
≥
k6=i1
εMj (n − 1) + [pi0 ,i1 − ε +
X
pi0 ,k ]mj (n − 1)
k6=i1
Stąd
mj (n) ≥ εMj (n − 1) + (1 − ε)mj (n − 1)
Niech mj = lim mj (n) , Mj = lim Mj (n). Przechodząc w
poprzednim wierszu do granicy otrzymujemy
mj ≥ εMj + (1 − ε)mj
Łańcuchy Markowa z czasem dyskretnym
Zbieżność Pn cd.
czyli mj ≥ Mj więc mj = Mj . Oznacza to,że kolumny macierzy
granicznej π są stałe, więc macierz ma identyczne wiersze.
Niech teraz m > 1. Z poprzedniej cześci dowodu otrzymujemy, że
lim Pnm = π.
n→∞
Gdy teraz ln → ∞ to zapisując ln = mjn + kn , 0 ≤ kn < m,
otrzymujemy
||Pln − π|| = ||Pmjn +kn − Pkn π|| ≤
||Pkn || ||Pmjn − π|| = ||Pmjn − π|| → 0,
gdy n → ∞. Tutaj π = Pkn π bo π ma stałe kolumny, a suma
wyrazów każdego wiersza Pkn jest równa 1.
Łańcuchy Markowa z czasem dyskretnym
Zbieżność Pn cd.
Wniosek
Wiersze macierzy π spełniają relacje
X
πi pij = πj , πj > 0,
X
i
πi = 1 .
i
Wektor π = (πi ) jest jedynym wektorem spełniającym powyższe
relacje.
Dowód.
Zachodzi
(n)
pkj =
X
(n−1)
pki
pij .
i
Przechodząc do granicy otrzymujemy
X
πj =
πi pij .
i
Łańcuchy Markowa z czasem dyskretnym
Zbieżność Pn cd.
Założyliśmy pij ≥ ε > 0 więc
(n)
pkj =
X
i
(n−1)
pki
pij ≥ ε
X
(n−1)
pki
= ε.
i
P (n)
P
Zachodzi i pki = 1 więc także i πi = 1.
Jedyność. Przypuśćmy, że v jest wektorem spełniającym powyższe
założenia. Wtedy
v = vP = vPn = lim vPn = vπ = π,
P
bo π ma kolumny złożone ze stałych, zaś i vi = 1.
Gdy π dodatnie i zachodzi zbieżność Pn → π punktowo, to także
(n)
jednostajnie, więc pkj > 0, począwszy od pewnego n, dla
wszystkich k, j.
Łańcuchy Markowa z czasem dyskretnym
Klasyfikacja stanów
Definicja. Łańcuch Markowa nazywamy nieprzywiedlnym
(n)
gdy dla każdego i, j istnieje n = n(i, j) takie, że pij > 0. Okres di
(n)
stanu i: n.w.d. zbioru {n ≥ 1; pii > 0} (n.w.d. = najwiekszy
wspólny dzielnik). Stan i nazywamy aperiodycznym, gdy di = 1.
Tw. 2. Macierz stochastyczna P spełnia Pm > 0 dla pewn. m
(warunek dodatniości) wtedy i tylko wtedy, gdy łańcuch Markowa
jest nieprzywiedlny i posiada co najmniej jeden stan aperiodyczny.
Dowód. Gdy Pm > 0 to dla wszystkich dużych potęg m zachodzi
(m)
(m+1)
Pm > 0 (zbieżność Pm → π > 0). Stąd pii > 0 i pii
> 0, dla
dużych m, wiec di = 1. [m = km ρ, m + 1 = km+1 ρ].
Na odwrót, załóżmy, że stan i jest aperiodyczny. Wtedy
X (n) (m)
(n+m)
(n) (m)
pii
=
pik pki ≥ pii pii .
k
Łańcuchy Markowa z czasem dyskretnym
Klasyfikacja stanów
(n)
Zatem D = {n; pii
> 0} jest półgrupą w N.
Zadanie (Ćwiczenia)
Z tego, że n.w.d. liczb w D wynosi 1 wynika, że od pewnego m0 ,
D zawiera wszystkie liczby naturalne.
Ustalamy stan i; niech j - inny stan. k oraz l wybieramy tak, aby
pijk > 0 oraz pjil > 0. Wtedy dla wszystkich m ≥ m0 ,
(m+k+l)
pjj
≥ pjil piim pijk > 0
(m)
czyli pjj > 0 dla odpowiednio dużych m więc j też jest
aperiodyczny. Analogicznie
(m+l)
pji
≥ pjil piim > 0,
dla m ≥ m0 , więc także wyrazy poza przekątną główną są
dodatnie, dla dużych m. Ponieważ P - macierz (n × n), więc dla
dużych m zachodzi Pm > 0.
Łańcuchy Markowa z czasem dyskretnym
Klasyfikacja stanów
Uwagi.
1. Gdy łańcuch jest nieprzywiedlny ale pewien stan ma okres
d > 1 to wszystkie stany mają ten okres, Pn nie musi być już
zbieżne; zachodzi jednak zbieżność średnich:
(P0 + P1 + . . . + Pn )/n → π;
dla Pn zachodzi zbieżność (mod d).
2. Gdy założenie nieprzywiedlności nie jest spełnione to zbiór
stanów rozpada się na klasy stanów wzajemnie komunikujacych się
oraz pewne stany do których nie ma powrotu (nie należą do żadnej
klasy).
3. Gdy S nieskończony, sytuacja bardziej skomplikowana ale dalej
można badać nieprzywiedlność, komunikowanie się stanów,
okresowość, istnienie rozkładów stacjonarnych, itd.
Łańcuchy Markowa z czasem dyskretnym