wyklad4 cd.

Transkrypt

wyklad4 cd.

Strategie losowe (mieszane).
ALP520 - Wykład z Algorytmów Probabilistycznych – p.2
Gracz W wybiera rozkład prawdopodobieństwa (schemat
losowy) p = (p1 , p2 , . . . , pn ), gdzie pi to prawdopodobieństwo
wyboru strategii (wiersza) i.
Gracz K wybiera rozkład prawdopodobieństwa (schemat
losowy) q = (q1 , q2 , . . . , qn ), gdzie qi to prawdopodobieństwo
wyboru strategii (kolumny) i.
Gracz K wybiera rozkład prawdopodobieństwa (schemat
losowy) q = (q1 , q2 , . . . , qn ), gdzie qi to prawdopodobieństwo
wyboru strategii (kolumny) i.
Wygrana jest zmienna˛ losowa˛ o wartości oczekiwanej:
E[”wygranej”] = pT M q =
n
n X
X
pi Mij qj .
i=1 j=1
Niech VW i VK oznaczaja˛ gwarantowane średnie wypłaty dla
graczy W i K. Wtedy zachodzi znane w teorii gier
twierdzenie:
twierdzenie:
Twierdzenie (von Neumann 1928). W dowolnej grze dwuosobowej o
zerowej sumie i macierzy wypłat M
VW = maxp minq pT M q = minq maxp pT M q = VK .
twierdzenie:
Dowód. Nietrywialny: używa twierdzenia o punkcie stałym lub twierdzeń
o separacji z geometrii analitycznej. Jest to też szczególny przypadek
twierdzenia dualnego w zagadnieniu programowania liniowego.
twierdzenie:
Dowód. Nietrywialny: używa twierdzenia o punkcie stałym lub twierdzeń
o separacji z geometrii analitycznej. Jest to też szczególny przypadek
twierdzenia dualnego w zagadnieniu programowania liniowego.
Wniosek. Gra ma punkt siodłowy (istnieja˛ optymalne strategie mieszane
lub czyste dla obu graczy).
Twierdzenie Loomisa
Twierdzenie Loomisa
Jeśli p jest ustalone, to pT M q jest funkcja˛ liniowa˛ zależna˛ od
q, która przyjmuje wartość minimalna˛ dla qj = 1, gdzie j
odpowiada najmniejszemu współczynnikowi (analogicznie
dla q ). Wtedy prawdziwa jest uproszczona wersja
powyższego twierdzenia:
Twierdzenie Loomisa
Jeśli p jest ustalone, to pT M q jest funkcja˛ liniowa˛ zależna˛ od
q, która przyjmuje wartość minimalna˛ dla qj = 1, gdzie j
odpowiada najmniejszemu współczynnikowi (analogicznie
dla q ). Wtedy prawdziwa jest uproszczona wersja
powyższego twierdzenia:
Twierdzenie (Loomisa). W dowolnej grze dwuosobowej o zerowej sumie
i macierzy M
max min pT M ej = min max eTi M q,
p
j
q
i
gdzie ej jest wektorem jednostkowym z 1 na pozycji j.
Metoda Yao
Metoda Yao
Zastosowanie twierdzeń minimaksowych do oszacowania złożoności
algorytmów losowych.
Metoda Yao
Gracz K - projektant algorytmów Las Vegas.
Gracz W - malkontent wybierajacy
˛ najgorszy zbiór
danych wejściowych.
Wypłata K dla W − miara złożoności algorytmu (czas
działania).
K chce zminimalizować czas działania, W daży
˛ do
zmaksymalizowania wypłaty.
Metoda Yao
˛ najgorszy zbiór
działania).
˛ do
Twierdzenia von Neumanna i Loomisa w jezyku
˛
algorytmów
losowych.
Metoda Yao
˛ najgorszy zbiór
działania).
˛ do
Twierdzenia von Neumanna i Loomisa w jezyku
˛
algorytmów
losowych.
Π− problem o sk. zb. danych wejściowych I (ustalonego rozmiaru) i sk. zb. algorytmów
deterministycznych A.
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
C(I, A)− czas działania algorytmu A na
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
p− rozkład prawdopodobieństwa na zbiorze I, q−
rozkład prawd. na zbiorze A (algorytm losowy LV)
Ip − losowy zbiór danych wejściowych odpowiadajacy
˛ pi
Aq − losowy algorytm odpowiadajacy
˛ q.
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
˛ pi
˛ q.
Wniosek (z tw. vN. i L.).
max min E[C(Ip , Aq )] = min max E[C(Ip , Aq )]
p
q
q
p
CDIST = max min E[C(Ip , A)] =
p
A∈A
min max E[C(I, Aq )] = CRAN D .
q
I∈I
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
˛ pi
˛ q.
p
q
q
p
p
A∈A
q
I∈I
CDIST − złożoność średniego przypadku
CRAN D − złożoność losowa
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
˛ pi
˛ q.
p
q
q
p
p
A∈A
q
I∈I
CDIST − złożoność średniego przypadku
CRAN D − złożoność losowa
Zasada minimaksowa Yao
Zasada (Minimaksowa Yao). Dla każdego rozkładu p nad I i q nad A,
min E[C(Ip , A)] ≤ max E[C(I, Aq )].
A∈A
I∈I
Zasada minimaksowa Yao
Zasada (Minimaksowa Yao). Dla każdego rozkładu p nad I i q nad A,
min E[C(Ip , A)] ≤ max E[C(I, Aq )].
A∈A
Interpretacja:
I∈I
Średni czas najlepszego algorytmu determini-
stycznego (najszybszego w odniesieniu do danego rozkładu
p na zbiorze danych wejściowych I ) jest ograniczeniem dolnym
na oczekiwany czas działania najlepszego algorytmu losowego dla ustalonego problemu.
Zastosowanie zasady minimaksowej Yao
Cel: udowodnić ograniczenie dolne na CRAN D
problemu Π
problemu Π
wybrać dowolny rozkład prawdopodobieństwa p na
zbiorze danych wejściowych
problemu Π
wybrać dowolny rozkład prawdopodobieństwa p na
zbiorze danych wejściowych
udowodnić ograniczenie dolne na średni czas działania
każdego algorytmu deterministycznego dla tego
problemu i rozkładu p
Ilustracja zasady Yao
Zastosowanie zasady Yao do problemu obliczania drzewa gry T2,k typu
AND-OR.
AND-OR.
Zadanie. Pokazać, że jeśli w drzewie T2,k wszystkie bramki AN D i OR
zastapimy
˛
funkcja˛ N OR (0, 0 → 1, pozostałe 0), to wartości dla
korzenia nie zmienia˛ sie.
˛
AND-OR.
zastapimy
˛
˛
Dowód: (p ∨ q) ∧ (r ∨ s) ⇔ ¬(¬(p ∨ q) ∨ ¬(r ∨ s)).
AND-OR.
zastapimy
˛
˛
Bedziemy
˛
analizować drzewo N OR (łatwiej).
AND-OR.
zastapimy
˛
˛
Bedziemy
˛
Ustalmy rozkład p na zbiorze liści drzewa przypisujac
˛ 1 z prawd. p tak,
aby prawdopodobieństwo, że rodzic =1 było również równe p.
AND-OR.
zastapimy
˛
˛
Bedziemy
˛
2
(1 − p) = p,
2
p − 3p + 1 = 0,
√
3− 5
.
p=
2
AND-OR.
zastapimy
˛
˛
Bedziemy
˛
2
(1 − p) = p,
2
p − 3p + 1 = 0,
√
3− 5
.
p=
2
Wtedy prawdopodobieństwa na kolejnych poziomach drzewa sa˛
wzajemnie niezależne.
Tarsi udowodnił, że optymalny algorytm
deterministyczny dla tego problemu, to algorytm przeszukiwania
drzewa w głab
˛ z obcinaniem.
Fakt:
drzewa w głab
˛ z obcinaniem.
W (h)− wartość oczekiwana liczby sprawdzonych liści w celu
obliczenia wierzchołka w odległości h od liści za pomoca˛
optymalnego algorytmu (przeszukiwania drzewa w głab
˛ z
obcinaniem).
Fakt:
drzewa w głab
˛ z obcinaniem.
˛ z
obcinaniem).
Fakt:
W (h) = pW (h − 1) + (1 − p) · 2W (h − 1)
drzewa w głab
˛ z obcinaniem.
˛ z
obcinaniem).
Fakt:
W (h) = pW (h − 1) + (1 − p) · 2W (h − 1)
Rozwiazanie:
˛
W (1) = 2 − p, a zatem W (h) = (2 − p)h , czyli dla
h = log2 n otrzymujemy W (log2 n) ≈ n0.694 < n0.793 .
Pytanie: czy istnieje lepszy algorytm losowy od pokazanego
na wykładzie (n0.793 ), czy też lepsze (wieksze)
˛
oszacowanie
dolne niż n0.694 ?
˛
oszacowanie
Odpowiedź: Inny rozkład prawdopodobieństwa (nie gwarantujacy
˛ niezależności) gwarantuje ograniczenie dolne rz˛edu
n0.793 , czyli opisany wcześniej algorytm losowy jest opty-
malny.
˛
oszacowanie
Odpowiedź: Inny rozkład prawdopodobieństwa (nie gwarantujacy
˛ niezależności) gwarantuje ograniczenie dolne rz˛edu
n0.793 , czyli opisany wcześniej algorytm losowy jest opty-
malny.

wyklad4 cd.

Transkrypt

Podobne dokumenty

Zagadnienia egzaminacyjne_I_st_OGÓLNE

Dr Adrian Kosowski

Podstawy teorii decyzji

Tytuły i treści wykładów: Technologia informacyjna – Hodowla

Oferta: praca / Główny specjalista ds. algorytmów

Główne kierunki badań naukowych na Wydziale Matematyki i

Konspekt lekcji w klasie VI – przedmiot INFORMATYKA

Tematyka prac dyplomowych inżynierskich dla specjalności AiR

• M−i = ∏ Mj • supp σi: nosnik strategii mieszanej • σi(s

wyklad4