plik - pdf
Transkrypt
plik - pdf
Procesy Markowa Proces stochastyczny {X t }t nazywamy procesem markowowskim, jeśli dla każdego momentu t0 prawdopodobieństwo dowolnego położenia systemu w przyszłości (t>t0) zależy tylko od jego położenia w chwili t=t0 i nie zależy od tego, w jaki sposób proces ten przebiegał w przeszłości. Mówimy, że jest to proces bez pamięci1. Procesy markowowskie możemy podzielić na klasy w zależności od tego, w jaki sposób, oraz w jakim zakresie system może zmieniać swoje położenie. Proces markowowski jest procesem z dyskretnymi położeniami (stanami), jeżeli dopuszczalne stany systemu E1, E2, E3,… można przeliczyć (ponumerować), a sam proces polega na tym, że co pewien przypadkowy przedział czasu system w sposób skokowy przechodzi z jednego położenia w inne. Rysunek 1 Przykładowy graf stanów procesu z dyskretnymi położeniami. Procesy z ciągłymi położeniami charakteryzują się stopniowymi (ciągłymi) przejściami z danego położenia w inne. Przykładem jest proces zmiany napięcia w sieci elektrycznej. Jeśli w procesie przejścia systemu z jednego położenia w inne, możliwe są tylko w ściśle ustalonym czasie t1, t2, …, tn, i w przedziałach czasu pomiędzy tymi momentami (krokami) system zachowuje swoje poprzednie położenie to nazywamy go procesem z dyskretnym czasem. Jeśli przejście systemu z jednego położenia w inne jest możliwe w każdym z góry nieznanym momencie, to proces nazywamy procesem z ciągłym czasem. Proces zachodzący w systemie można przedstawić jako ciąg (łańcuch) zdarzeń, np. E1( 0 ) , E 2(1) , E1( 2 ) , E 2(3) , E3( 4) ,... 1 Bogusław Filipowicz: Modele stochastyczne w badaniach operacyjnych, Wydawnictwa Naukowo-Techniczne, Warszawa 1996, s. 27 Łańcuch Markowa definiuje się za pomocą prawdopodobieństw zmian systemu, które możemy przedstawić w postaci macierzy. Np. dla grafu przedstawionego na rys. 1 macierz przejść wyglądałaby następująco: M = [ pik ] = przy czym 0 ≤ pjk ≤ 1, oraz ∑p j k =1 jk =1 p11 p 21 p31 p 41 p12 p13 p 22 p 23 p32 p 42 p33 p 43 p14 p 24 p34 p 44 j, k = 1, 2, …, n. Przykłady Czy możemy liczyć na kawę? Maszyna z kawą może być czynna (stan 0) lub zepsuta (stan 1). Załóżmy, że jeśli maszyna jest czynna w danym dniu, to prawdopodobieństwo zepsucia w dniu następnym jest δ , a jeśli jest zepsuta w danym dniu, to prawdopodobieństwo jej naprawienia na dzień następny jest γ. Jakie jest prawdopodobieństwo dostania kawy z maszyny? maszyna jest czynna, wczoraj też była czynna: p(0, tn | 0, tn-1) = 1 - δ, maszyna jest nieczynna, wczoraj była czynna: p(1, tn | 0, tn-1) = δ, maszyna jest czynna, wczoraj była nieczynna: p(0, tn | 1, tn-1) = γ, maszyna jest nieczynna, wczoraj też była nieczynna: p(1, tn | 1, tn-1) = 1 - γ, (Dobra i dobrze serwisowana maszyna powinna mieć δ bliskie 0 i γ bliskie 1 !) Prawdopodobieństwo dostania kawy z maszyny będzie zależało od proporcji czasu, gdy maszyna jest czynna, do całego czasu pomiaru. Symulacja dla δ = 0.2 i γ = 0.9 LICZBA SYMULACJI (DNI) 10 50 100 500 1000 0 W DNIU 0 0.90 0.82 0.84 0.84 0.82 1 W DNIU 0 0.50 0.86 0.80 0.80 0.81 Zauważamy, że uśredniając po długim czasie, prawdopodobieństwo kupienia kawy stabilizuje się na poziomie 80%, praktycznie niezależnie od stanu maszyny w dniu początkowym2. Brawurowa gra Mamy 1 zł i chcemy wygrać 5 zł. Krupier oferuje nam grę, w której prawdopodobieństwo naszej wygranej wynosi p w każdej rundzie z wypłatą podwójnej stawki w razie wygranej oraz jej stratą w razie przegranej, przy czym stawki są w całkowitych wielokrotnościach złotówki. Wybieramy następującą strategię brawurową: w każdej grze stawiamy wszystko co mamy, jeśli ewentualna wygrana pozwoli osiągnąć cel (osiągnąć 5 zł), lub mniej niż cel. W przeciwnym razie, stawiamy tyle aby ewentualnie wygrać 5 zł. Jaka jest szansa wygrania w k lub mniejszej liczbie gier? Ponumerujmy stany liczbą posiadanych przez nas złotówek. Zaczynamy grę od stanu nr 1. Wygrać grę – znaczy przejść od stanu 1 do stanu 5. Stan 0 oznacza przegraną. Prawdopodobieństwo wygrania lub przegrania gry nie zależy od historii wygranych przegranych w poprzednich grach – własność Markowa jest zatem spełniona. Prawdopodobieństwo wygranej w stanie i nie zależy od czasu, więc proces ten jest jednorodny w czasie. 2 p 4 q 1 p 0 q p 1 5 1 p q 2 i q 3 Interesują nas tylko ścieżki, które kończą się w stanie 5. Nazwiemy je istotnymi. www.icm.edu.pl/home/wislicki, wyk_9.pdf, 2001-10- 15 Prawdopodobieństwo każdej jest iloczynem prawdopodobieństw przejść jednokrotnych. Istotna ścieżka o długości 3 o prawdopodobieństwie p3 S: ścieżki (1) → (2) → (4) → (5) Zatem prawdopodobieństwo wygrania w trzech grach wynosi p3. Istotna ścieżka o długości 4 R: (1) → (2) → (3) → (5) ma prawdopodobieństwo p3q. Zatem prawdopodobieństwo wygrania w 4 lub mniej grach wynosi p3 (1+ q). Nie ma istotnych ścieżek o długości 6. Istotna ścieżka o długości 7 ma jedną pętlę L: (1) → (2) → (4) → (3) → (1), po czym następuje ścieżka S. Prawdopodobieństwo pętli L wynosi λ=p2q2, zatem prawdopodobieństwo dla ścieżki L∗S wynosi λq3. Zatem prawdopodobieństwo wygrania w 7 lub mniej grach wynosi p3(1+λ)+p3q. Istnieje jedna ścieżka o długości 8: L*R, dla której prawdopodobieństwo wynosi λp3q. Zatem prawdopodobieństwo wygrania w 8 lub mniej grach wynosi p3(1+q)(1+λ). Zauważmy ogólną prawidłowość, że wszystkie dłuższe ścieżki są typu L*…*L*S lub L*…*L*R. Ich prawdopodobieństwa przy n pętlach wynoszą λnp3 i λnp3q. Mamy pq ≤ 0.25, zatem λ ≤ 0.625, czyli szereg geometryczny o ilorazie λ jest zbieżny. Stąd prawdopodobieństwo wygranej przy nieograniczonej liczbie prób wynosi p 3 (1 + q )(1 + λ + λ2 +& ...) = 3 p 3 (1 + q ) 3 1− λ www.icm.edu.pl/home/wislicki, wyk_10.pdf, 2001-15- 10 Zadania 1. Ostrożna gra Podobnie jak w przypadku brawurowej gry, chcemy wygrać 5 zł, startując od złotówki. Przyjmujemy ostrożną strategię, że w każdej grze stawiamy minimalną stawkę 1 zł. Jaka jest szansa wygrania w k lub mniejsze liczbie gier?4 2. Symulacja gry Dokonaj symulacyjnego porównania strategii brawurowej i ostrożnej. 3. Ostrożna gra ( rekurencyjnie)*** Rozwiąż rekurencyjnie zadanie 1.2.2.1 dla każdej wartości n (n – wysokość wygranej, stawki w całkowitych wielokrotnościach złotówki). 4. Czy jest to proces Markowa?** Rozważmy ciąg prób Bernoulliego z wynikami Y0, Y1, …, gdzie Yi = 0 lub 1 z prawdopodobieństwami q = 1 – p i p. Oczywiści Yi jest procesem Makowa. Definiujemy nowy proces stochastyczny: Xn = Yn + Yn+1, n = 0, 1, 2, … Każda zmienna Xn jest zmienną o rozkładzie dwuwymiarowym z dwiema niezależnymi próbami Bernoulliego i prawdopodobieństwem p. Czy proces Xn jest procesem Markowa?5 5. Symulacja działania automatu do kawy Dokonaj symulacyjnego porównania działania maszyny do kawy (z przykładu powyżej) dla δ = 0.4 i γ = 0.9 oraz δ = 0.1 i γ = 0.6. 4 5 www.icm.edu.pl/home/wislicki, wyk_10.pdf, 2001-15- 10 www.icm.edu.pl/home/wislicki, wyk_9.pdf, 2001-15- 10