wyklad4

Transkrypt

wyklad4

Metody teorii gier
ALP520 - Wykład z Algorytmów Probabilistycznych – p.2
Metody teorii gier
Wyprowadzenie oszacowania dolnego na oczekiwany
czas działania dowolnego algorytmu losowego dla danego
problemu.
Cel:
Metody teorii gier
Wyprowadzenie oszacowania dolnego na oczekiwany
czas działania dowolnego algorytmu losowego dla danego
problemu.
Cel:
Udowodnienie oszacowań dolnych jest łatwiejsze dla algorytmów deterministycznych niż losowych, dlatego spróbujemy
wyprowadzić zwiazek
˛
pomiedzy
˛
tymi wielkościami korzystajac
˛ z twierdzeń teorii gier.
Gra w unikanie trójkata
˛
Dwaj gracze dodaja˛ na zmiane˛ krawedzie
˛
do pustego grafu.
Przegrywa ten, kto pierwszy utworzy trójkat.
˛
Gra w unikanie trójkata
˛
I
0
1
0
1
0
0
0
1
1−wygrana I gracza
0−przegrana I gracza
0
Definicja drzewa gry
pełne drzewo binarne z ustalonym korzeniem
wierzchołki wewnetrzne
˛
drzewa w odległości parzystej
od korzenia otrzymuja˛ etykiete˛ „AND” ∧
˛
˛
drzewa w odległości
nieparzystej od korzenia otrzymuja˛ etykiete˛ „OR” ∨
˛
˛
liście otrzymuja˛ etykiety 1 lub 0; 1 oznacza wygrana˛ dla
pierwszego gracza, 0 przegrana˛ dla pierwszego gracza.
˛
˛
ogólnie: dowolne wartości rzeczywiste, pierwszy gracz
chce zmaksymalizować (MAX zamiast OR), a drugi
zminimalizować (MIN zamiast AND) wartość gry
˛
˛
ogólnie: dowolne wartości rzeczywiste, pierwszy gracz
chce zmaksymalizować (MAX zamiast OR), a drugi
zminimalizować (MIN zamiast AND) wartość gry
jeśli danych jest k możliwości w każdym ruchu, to
drzewo ma stopień k.
Przykład drzewa gry
?
∧ − AN D
∨ − OR
∧ − AN D
∨ − OR
0
1
1
0
0
0
1
1
0
1
0
1
1
1
0
1
?
∧ − AN D
∨ − OR
∧ − AN D
∨ − OR
0
1
1
0
0
0
1
1
0
1
0
1
1
1
0
1
CEL: majac
˛ dane wartości dla liści oblicz drzewo gry, tzn.
oblicz wartość etykiety dla korzenia.
1
∧ − AN D
1
1
1
1
0
0
0
1
1
1
0
0
1
1
1
0
1
∨ − OR
1
0
1
1
0
1
1
1
1
1
∧ − AN D
1
∨ − OR
0
1
CEL: majac
1
∧ − AN D
1
1
1
1
0
0
0
1
1
1
0
0
1
1
1
0
1
∨ − OR
1
0
1
1
0
1
1
1
1
1
∧ − AN D
1
∨ − OR
0
1
CEL: majac
Inaczej: Oblicz wartość funkcji boolowskiej postaci (((x1 ∨ x2 ) ∧
(x3 ∨ x4 )) ∨ ((x5 ∨ x6 ) ∧ (x7 ∨ x8 ))) ∧ (((x9 ∨ x10 ) ∧ (x11 ∨ x12 )) ∨ ((x13 ∨
x14 ) ∧ (x15 ∨ x16 ))).
Analiza drzewa gry
Jaka jest maksymalna liczba odczytanych liści
niezbedna
˛
do obliczenia drzewa gry (wyznaczenia wartości
dla korzenia) ?
Pytanie:
Analiza drzewa gry
niezbedna
˛
dla korzenia) ?
Pytanie:
Rozważmy drzewo T2,k (drzewo binarne, każdy liść w
odległości 2k od korzenia).
Analiza drzewa gry
niezbedna
˛
dla korzenia) ?
Pytanie:
Dowolny algorytm deterministyczny wymaga w
najgorszym przypadku odczytania wszystkich 22k = 4k
liści.
Analiza drzewa gry
niezbedna
˛
dla korzenia) ?
Pytanie:
Dowolny algorytm deterministyczny wymaga w
najgorszym przypadku odczytania wszystkich 22k = 4k
liści.
Zadanie. Znajdź przykład ciagu
˛ wartości dla liści drzewa gry T2,k ,
dla którego dowolny algorytm deterministyczny wymaga odczytania
wszystkich 4k liści w celu wyznaczenia wartości dla korzenia.
Losowo?
Obserwacja. Rozważmy wierzchołek AND i jego dwa liście. Jeśli wartość
dla tego wierzchołka bedzie
˛
0, to co najmniej jeden z jego potomków
musi zawierać 0. W najgorszym przypadku dla alg. deterministycznego (
który przeglada
˛ liście w ustalonym porzadku)
˛
0 może wystapić
˛ na drugim
miejscu, co wymaga 2 kroków ( odczytania 2 liści).
0 ∧ AN D
1
0
Losowo?
Jak przechytrzyć przeciwnika ?
0 ∧ AN D
1
0
Losowo?
Przegladać
˛
te 2 liście w
losowym porzadku
˛
(z pr. 21 )
0 ∧ AN D
1
0
Losowo?
0 ∧ AN D
Przegladać
˛
te 2 liście w
losowym porzadku
˛
(z pr. 21 )
Wartość oczekiwana liczby
kroków dla ciagu
˛
1 0 : 21 · 1 + 12 · 2 = 32 < 2.
1
0
Losowo?
0 ∧ AN D
Przegladać
˛
te 2 liście w
losowym porzadku
˛
(z pr. 21 )
Wartość oczekiwana liczby
kroków dla ciagu
˛
1 0 : 21 · 1 + 12 · 2 = 32 < 2.
1
0
Brak zysku dla ciagu
˛ 1 1, ale jeśli jakieś drzewo osiaga
˛
wartość 1 dla korzenia, to każdy wew. wierzchołek AND
musi mieć obu potomków OR o wartościach 1, a wtedy
zyskujemy.
Algorytm A obliczania drzewa gry
1. Rozpocznij od korzenia.
2. Wybierz jednego z jego potomków losowo ( z prawd.
i postepuj
˛
rekurencyjnie.
1
2
)
3. Jeśli poddrzewo wierzchołka AND zwraca 1, to przejdź
do drugiego poddrzewa.
4. Jeśli poddrzewo wierzchołka AND zwraca 0, to zwróć 0
w tym wierzchołku. (Analogicznie dla OR.)
Algorytm A obliczania drzewa gry
1. Rozpocznij od korzenia.
2. Wybierz jednego z jego potomków losowo ( z prawd.
i postepuj
˛
rekurencyjnie.
1
2
)
3. Jeśli poddrzewo wierzchołka AND zwraca 1, to przejdź
do drugiego poddrzewa.
4. Jeśli poddrzewo wierzchołka AND zwraca 0, to zwróć 0
w tym wierzchołku. (Analogicznie dla OR.)
Twierdzenie. Dla dowolnego drzewa T2,k wartość oczekiwana liczby
kroków algorytmu losowego A jest równa co najwyżej 3k .
Analiza algorytmu A - indukcja
Niech Nk -liczba kroków algorytmu (liczba odczytanych liści)
dla drzewa T2,k
dla drzewa T2,k
k = 1 zadanie na ćwiczenia
dla drzewa T2,k
Założenie dla k − 1 : ENk−1 ≤ 3k−1 .
dla drzewa T2,k
Założenie dla k − 1 : ENk−1 ≤ 3k−1 .
Teza dla k : ENk ≤ 3k .
Teza dla k : ENk ≤ 3k .
T
T2,k−1
T2,k−1
T2,k−1
T2,k−1
Indukcja -cd.
T
Rozpatrzmy drzewo T, którego
poddrzewami sa˛ dwie kopie
drzewa T2,k−1 (potomkami korzenia T sa˛ korzenie drzew T2,k−1 ).
T2,k−1
T2,k−1
T2,k−1
T2,k−1
Indukcja -cd.
T
Niech k(T ) oznacza wartość obliczona˛ w korzeniu drzewa T.
Możliwe sa˛ nastepuj
˛ ace
˛
przypadki:
T2,k−1
T2,k−1
T2,k−1
T2,k−1
Indukcja -cd.
T
Niech k(T ) oznacza wartość obliczona˛ w korzeniu drzewa T.
Możliwe sa˛ nastepuj
˛ ace
˛
przypadki:
T2,k−1
T2,k−1
T2,k−1
T2,k−1
k(T ) = 1
k(T ) = 0
Indukcja -cd.
Indukcja -cd.
k(T ) = 1: ⇒ co najmniej jedno z poddrzew k(T2,k−1 ) = 1 i
wartość oczekiwana liczby kroków jest równa co
najwyżej 21 · 3k−1 + 2 · 12 · 3k−1 = 32 · 3k−1 (dla 01 i 10) lub
3k−1 (dla 11).
Indukcja -cd.
k(T ) = 1: ⇒ co najmniej jedno z poddrzew k(T2,k−1 ) = 1 i
wartość oczekiwana liczby kroków jest równa co
najwyżej 21 · 3k−1 + 2 · 12 · 3k−1 = 32 · 3k−1 (dla 01 i 10) lub
3k−1 (dla 11).
k(T ) = 0: ⇒ dla obu poddrzew k(T2,k−1 ) = 0, i wartość
oczekiwana wynosi co najwyżej 2 · 3k−1 .
Indukcja -cd.
Teraz jesteśmy gotowi do analizy drzewa T2,k .
Indukcja -cd.
k(T2,k ) = 1: ⇒ dla obu poddrzew k(T ) = 1 i
ENk ≤ 2 · 23 · 3k−1 = 3k .
Indukcja -cd.
ENk ≤ 2 · 23 · 3k−1 = 3k .
k(T2,k ) = 0: ⇒ w co najmniej jednym poddrzewie musiało
wystapić
˛ 0.
Indukcja -cd.
ENk ≤ 2 · 23 · 3k−1 = 3k .
wystapić
˛ 0. Niech p bedzie
˛
prawdopodobieństwem
wyboru 0. Wtedy
k−1
ENk ≤ 2p · 3
3 k−1
+ (1 − p)( · 3
+ 2 · 3k−1 ) ≤ 3k ,
2
ponieważ p ≥ 21 .
Indukcja -cd.
ENk ≤ 2 · 23 · 3k−1 = 3k .
wystapić
˛ 0. Niech p bedzie
˛
prawdopodobieństwem
wyboru 0. Wtedy
k−1
ENk ≤ 2p · 3
3 k−1
+ (1 − p)( · 3
+ 2 · 3k−1 ) ≤ 3k ,
2
ponieważ p ≥ 21 .
Wniosek. Powyższy algorytm losowy ma średni czas ograniczony przez
nlog4 3 ≈ n0.793 .
Teoria gier jeszcze raz ale inaczej
Cel: Metoda dowodzenia ograniczeń dolnych dla algorytmów losowych.
Gra w kamień, papier i nożyczki.
Gracze: K (grajacy
˛ kolumnami) i W (grajacy
˛ wierszami).
Gracze: K (grajacy
˛ wierszami).
Nożyczki Papier Kamień
Nożyczki
0
1
-1
Papier
-1
0
1
Kamień
1
-1
0
Gracze: K (grajacy
˛ wierszami).
Nożyczki
0
1
-1
Papier
-1
0
1
Kamień
1
-1
0
M − macierz wypłat Mij − wartość, jaka˛ gracz K płaci
graczowi W, jeśli W wybierze strategie˛ i, a K strategie˛ j.
Gracze: K (grajacy
˛ wierszami).
Nożyczki
0
1
-1
Papier
-1
0
1
Kamień
1
-1
0
M − macierz wypłat Mij − wartość, jaka˛ gracz K płaci
graczowi W, jeśli W wybierze strategie˛ i, a K strategie˛ j.
Jest to przykład gry dwuosobowej o sumie zerowej ( suma
wypłat =0). Gracz W chce zmaksymalizować wygrana,
˛ a
gracz K chce ja˛ zminimalizować.
Wygrana w grze
Jeśli jest to gra o zerowej informacji ( gracze nie znaja˛ swoich
strategii), to
jeśli W wybiera strategie˛ i, to gwarantowana wygrana
wynosi minj Mij , niezależnie od strategii K.
Wygrana w grze
strategii), to
jeśli W wybierze optymalna˛ strategie,
˛ to jego wygrana
wynosi co najmniej UW = maxi minj Mij .
Wygrana w grze
strategii), to
˛ to jego wygrana
Analogicznie dla K, wygrana wynosi co najwyżej
UK = minj maxi Mij .
Wygrana w grze
strategii), to
˛ to jego wygrana
Analogicznie dla K, wygrana wynosi co najwyżej
UK = minj maxi Mij .
UW = −1, UK = 1
Wygrane i strategie
Fakt.
max min Mij ≤ min max Mij
i
j
j
i
Wygrane i strategie
Fakt.
i
j
j
i
Dowód. Niech i0 : maxi minj Mij = minj Mi0 j ≤ minj maxi Mij ,
ponieważ Mi0 j ≤ maxi Mij .
Wygrane i strategie
Fakt.
i
j
j
i
Jeśli UW = UK = U, to gra ma punkt siodłowy (rozwiazanie).
˛
Odpowiadajace
˛ mu strategie graczy nazywamy strategiami
czystymi (polegajacymi
˛
na wyborze konkretnego wiersza
lub, odpowiednio, kolumny).
Wygrane i strategie
Fakt.
i
j
j
i
Jeśli UW = UK = U, to gra ma punkt siodłowy (rozwiazanie).
˛
Odpowiadajace
˛ mu strategie graczy nazywamy strategiami
czystymi (polegajacymi
˛
na wyborze konkretnego wiersza
lub, odpowiednio, kolumny).
Inny przykład
Nożyczki
0
1
2
Papier
-1
0
1
Kamień
-2
-1
0
Inny przykład
Nożyczki
0
1
2
Papier
-1
0
1
Kamień
-2
-1
0
Oblicz UW i UK .
Strategie losowe (mieszane).
Gracz W wybiera rozkład prawdopodobieństwa (schemat
losowy) p = (p1 , p2 , . . . , pn ), gdzie pi to prawdopodobieństwo
wyboru strategii (wiersza) i.
Gracz K wybiera rozkład prawdopodobieństwa (schemat
losowy) q = (q1 , q2 , . . . , qn ), gdzie qi to prawdopodobieństwo
wyboru strategii (kolumny) i.
Gracz K wybiera rozkład prawdopodobieństwa (schemat
losowy) q = (q1 , q2 , . . . , qn ), gdzie qi to prawdopodobieństwo
wyboru strategii (kolumny) i.
Wygrana jest zmienna˛ losowa˛ o wartości oczekiwanej:
E[”wygranej”] = pT M q =
n
n X
X
pi Mij qj .
i=1 j=1
Niech VW i VK oznaczaja˛ gwarantowane średnie wypłaty dla
graczy W i K. Wtedy zachodzi znane w teorii gier
twierdzenie:
twierdzenie:
Twierdzenie (von Neumann 1928). W dowolnej grze dwuosobowej o
zerowej sumie i macierzy wypłat M
VW = maxp minq pT M q = minq maxp pT M q = VK .
twierdzenie:
Dowód. Nietrywialny: używa twierdzenia o punkcie stałym lub twierdzeń
o separacji z geometrii analitycznej. Jest to też szczególny przypadek
twierdzenia dualnego w zagadnieniu programowania liniowego.
twierdzenie:
Dowód. Nietrywialny: używa twierdzenia o punkcie stałym lub twierdzeń
o separacji z geometrii analitycznej. Jest to też szczególny przypadek
twierdzenia dualnego w zagadnieniu programowania liniowego.
Wniosek. Gra ma punkt siodłowy (istnieja˛ optymalne strategie mieszane
lub czyste dla obu graczy).
Twierdzenie Loomisa
Twierdzenie Loomisa
Jeśli p jest ustalone, to pT M q jest funkcja˛ liniowa˛ zależna˛ od
q, która przyjmuje wartość minimalna˛ dla qj = 1, gdzie j
odpowiada najmniejszemu współczynnikowi (analogicznie
dla q ). Wtedy prawdziwa jest uproszczona wersja
powyższego twierdzenia:
Twierdzenie Loomisa
Jeśli p jest ustalone, to pT M q jest funkcja˛ liniowa˛ zależna˛ od
q, która przyjmuje wartość minimalna˛ dla qj = 1, gdzie j
odpowiada najmniejszemu współczynnikowi (analogicznie
dla q ). Wtedy prawdziwa jest uproszczona wersja
powyższego twierdzenia:
Twierdzenie (Loomisa). W dowolnej grze dwuosobowej o zerowej sumie
i macierzy M
max min pT M ej = min max eTi M q,
p
j
q
i
gdzie ej jest wektorem jednostkowym z 1 na pozycji j.
Metoda Yao
Metoda Yao
Zastosowanie twierdzeń minimaksowych do oszacowania złożoności
algorytmów losowych.
Metoda Yao
Gracz K - projektant algorytmów Las Vegas.
Gracz W - malkontent wybierajacy
˛ najgorszy zbiór
danych wejściowych.
Wypłata K dla W − miara złożoności algorytmu (czas
działania).
K chce zminimalizować czas działania, W daży
˛ do
zmaksymalizowania wypłaty.
Metoda Yao
˛ najgorszy zbiór
działania).
˛ do
Twierdzenia von Neumanna i Loomisa w jezyku
˛
algorytmów
losowych.
Metoda Yao
˛ najgorszy zbiór
działania).
˛ do
Twierdzenia von Neumanna i Loomisa w jezyku
˛
algorytmów
losowych.
Π− problem o sk. zb. danych wejściowych I (ustalonego rozmiaru) i sk. zb. algorytmów
deterministycznych A.
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
C(I, A)− czas działania algorytmu A na
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
p− rozkład prawdopodobieństwa na zbiorze I, q−
rozkład prawd. na zbiorze A (algorytm losowy LV)
Ip − losowy zbiór danych wejściowych odpowiadajacy
˛ pi
Aq − losowy algorytm odpowiadajacy
˛ q.
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
˛ pi
˛ q.
Wniosek (z tw. vN. i L.).
max min E[C(Ip , Aq )] = min max E[C(Ip , Aq )]
p
q
q
p
CDIST = max min E[C(Ip , A)] =
p
A∈A
min max E[C(I, Aq )] = CRAN D .
q
I∈I
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
˛ pi
˛ q.
p
q
q
p
p
A∈A
q
I∈I
CDIST − złożoność średniego przypadku
CRAN D − złożoność losowa
Metoda Yao
∀ I ∈ I, A ∈ A,
zbiorze I.
˛ pi
˛ q.
p
q
q
p
p
A∈A
q
I∈I
CDIST − złożoność średniego przypadku
CRAN D − złożoność losowa
Zasada minimaksowa Yao
Zasada (Minimaksowa Yao). Dla każdego rozkładu p nad I i q nad A,
min E[C(Ip , A)] ≤ max E[C(I, Aq )].
A∈A
I∈I
Zasada minimaksowa Yao
Zasada (Minimaksowa Yao). Dla każdego rozkładu p nad I i q nad A,
min E[C(Ip , A)] ≤ max E[C(I, Aq )].
A∈A
Interpretacja:
I∈I
Średni czas najlepszego algorytmu determini-
stycznego (najszybszego w odniesieniu do danego rozkładu
p na zbiorze danych wejściowych I ) jest ograniczeniem dolnym
na oczekiwany czas działania najlepszego algorytmu losowego dla ustalonego problemu.
Zastosowanie zasady minimaksowej Yao
Cel: udowodnić ograniczenie dolne na CRAN D
problemu Π
problemu Π
wybrać dowolny rozkład prawdopodobieństwa p na
zbiorze danych wejściowych
problemu Π
wybrać dowolny rozkład prawdopodobieństwa p na
zbiorze danych wejściowych
udowodnić ograniczenie dolne na średni czas działania
każdego algorytmu deterministycznego dla tego
problemu i rozkładu p

wyklad4

Transkrypt

Podobne dokumenty

Zagadnienia egzaminacyjne_I_st_OGÓLNE

Dr Adrian Kosowski

sylabus przedmiotu „wstęp do informatyki”

Wykaz zagadnien na egzamin dyplomowy

Tytuły i treści wykładów: Technologia informacyjna – Hodowla

Oferta: praca / Główny specjalista ds. algorytmów

Główne kierunki badań naukowych na Wydziale Matematyki i

Konspekt lekcji w klasie VI – przedmiot INFORMATYKA

Tematyka prac dyplomowych inżynierskich dla specjalności AiR

wyklad4 cd.