Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 II lista

Transkrypt

Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 II lista
Teoria gier, Informatyka WPPT
semestr zimowy 2010/2011
II lista zadań
1. Mówimy że strategia x1 gracza 1. jest słabo zdominowana przez strategię x2 (w grze dwuosobowej;
jak poprzednio, podobnie można to definiować dla gry większej liczby graczy), jeśli dla dowolnej strategii y przeciwnika, u1 (x1 , y) ¬ u1 (x2 , y) oraz istnieje strategia przeciwnika y ∗ taka że
u1 (x1 , y ∗ ) < u1 (x2 , y ∗ ). Załóżmy, że dla pewnej gry dwumacierzowej przeprowadziliśmy algorytm
iterowanej dominacji z listy I, wykreślając nie tylko strategie mocno, ale też słabo zdominowane.
(a) Pokaż, że dowolna równowaga (zrandomizowana) w zredukowanej grze, powstałej po przeprowadzeniu algorytmu, jest też równowagą w wyjściowej grze.
(b) Załóżmy, że nasza gra spełnia następujący warunek: jeśli x∗ jest strategią wykreśloną na
pewnym kroku algorytmu iterowanej dominacji dlatego, że jest zdominowana przez strategię x∗∗ , to u1 (x∗ , y) < u1 (x∗∗ , y) dla wszystkich (nie wykreślonych na tym etapie algorytmu)
strategii y przeciwnika z wyjątkiem co najwyżej jednej. Pokaż, że wtedy każda równowaga w wyjściowej grze jest równowagą w strategiach czystych lub równowagą w grze powstałej
po zakończeniu algorytmu iterowanej dominacji.
(c) Znajdź przykład gry, w której istnieje równowaga, w której używa się strategii wykreślonych w trakcie przeprowadzania algorytmu iterowanej dominacji, ale ta równowaga nie jest
równowagą w strategiach czystych.
2. Niech (µ, σ) będą równowagą Nasha w strategiach mieszanych w grze dwumacierzowej. Pokaż, że
każda strategia czysta j gracza 2. taka że σj > 0 jest wtedy najlepszą odpowiedzią na strategię
µ (czyli że wypłata z używania przeciwko strategii µ 1. gracza dowolnej kolumny j, dla której
σj > 0 jest taka sama).
3. Z dwóch powyższych zadań wynika następujący algorytm szukania równowag w grach dwumacierzowych:
(a) Sprawdzamy, czy gra ma równowagi w strategiach czystych.
(b) Przeprowadzamy algorytm iterowanej dominacji (z wykreślaniem strategii słabo
zdominowanych).
(c) Dla zbiorów strategii, które pozostały po punkcie (a), X̂ i Ŷ , rozważamy wszystkie
co najmniej dwuelementowe podzbiory X̂ i Ŷ . Dla tych podzbiorów wyrównujemy oczekiwane
wypłaty, jak w zadaniu 2. (tzn. jeśli np. wybranymi podzbiorami są {1, 2} dla pierwszego
gracza i {4, 5, 6} dla drugiego, to rozwiązujemy układy równań
u1 (1, σ) = u1 (2, σ),
u2 (µ, 4) = u2 (µ, 5) = u2 (µ, 6).
Na koniec sprawdzamy, czy otrzymane strategie mieszane µ i σ są równowagą w grze
wyjściowej.
Korzystając z powyższego algorytmu, znajdź (wszystkie, jakie można znaleźć przy jego pomocy)
równowagi Nasha w grach dwumacierzowych opisanych przez macierze wypłat:




4 1 3
0
−3
1 −3 1
2 , B =  1 −1
2 0 ,
∙ A= 1 2 0
−3 2 2 −1
4
1
0 2




2 −1 1 1
2 0
4 1
 1

2 3 2 
1 3 
, B =  4 2
,
∙ A=
 5
 −1 3
1 2 0 
0 0 
0 −1 0 2
0 2 −1 2

1
 3

∙ A=
4
0


3
2 3
1

1 2 −1 
, B =  1
 −1
1 2
0 
3
−1 0
3

2 1 4
−1 3 0 
.
1 0 2 
1 0 1
Czy w przypadku każdej z tych gier są to wszystkie równowagi, jakie istnieją w grze?
4. Dla którejś z gier z poprzedniego zadania rozważ scenariusz, w którym jeden z graczy podejmuje
decyzję jako pierwszy, a drugi dostosowuje się do wyboru pierwszego (taki model w teorii gier
nazywa się modelem Stackelberga). Znajdź równowagę dla takiej gry. Porównaj wypłaty graczy
w równowadze dla standardowej gry i dla modelu Stackelberga. Która wypłata jest większa
(dla pierwszego i dla drugiego gracza)? Czy zawsze tak będzie? Uzasadnij (podaj dowód albo
kontrprzykład) swoją odpowiedź.
5. W pewnym klubie są dwa wejścia: A i B oraz tylko jeden ochroniarz, bardzo silny, ale mało
wytrzymały. W ciągu godziny ma pilnować wejść do klubu, może jednak stać tylko przy jednym
z nich, zmieniając wejście, przy którym stoi, nie częściej niż co kwadrans (czytaj: zmiany mogą
następować tylko w 15, 30 lub 45 minucie). W trakcie tej godziny chuligani napadają klub. Jeśli
wejdą przez wejście, przy którym nikt nie stoi lub pobiją ochroniarza, demolują klub. Demolowanie trwa więcej niż kwadrans, ale ochroniarz ma słuchawki na uszach i nic nie słyszy, ale jeśli
w trakcie demolowania zdecyduje się przejść do drugiego wejścia, łapie chuliganów na gorącym
uczynku, dzięki czemu, jeśli chuligani go nie pobiją, może zmusić ich do zapłacenia za straty.
Ochroniarz jest jednak bardzo mało wytrzymały – jeśli zostanie zaatakowany przy wejściu, przy
którym stał od początku, wygrywa z prawdopodobieństwem 1, jeśli przy wejściu, do którego musiał przejść raz, wygrywa z prawdopodobieństwem 43 , jeśli przechodził od przejścia do przejścia 2
razy, wygrywa z prawdopodobieństwem 12 , jeśli 3 razy – 41 . Wypłata dla ochroniarza, jeśli ochronił klub przed zdemolowaniem to 1 (−1 dla chuliganów). Wypłata, gdy nie uchronił klubu przed
zniszczeniem, ale złapał sprawców i zmusił do zapłaty to 0 (tyle samo dla chuliganów), natomiast
gdy klub został zniszczony, a chuligani uciekli −1 (1 dla chuliganów). Zakładamy, że jeśli chuligani zaatakowali w ostatnim kwadransie i nie zostali zatrzymani przez ochroniarza, uciekają bez
przeszkód. W powyższej grze ochroniarz wybiera wejścia, przy których będzie stał w każdym z
kwadransów, natomiast chuligani – wejście, które atakują, oraz moment ataku. Zapisz macierz(e)
wypłat graczy. Następnie spróbuj znaleźć jakąkolwiek równowagę w tej grze. Jeśli okaże się to zbyt
trudne standardową metodą (a tak się okaże), załóż, że gracze stosują zamiast strategii czystych
strategie mieszane, w których z równym prawdopodobieństwem wybierają wejście A i wejście B
(czyli w przypadku chuliganów strategią będzie tylko moment ataku, a w przypadku ochroniarza
para “symetrycznych” strategii, np. AABA i BBAB lub ABAB i BABA, wybieranych z prawdopodobieństwem 12 każda), znajdź równowagę w tak zmodyfikowanej grze, a następnie pokaż, że
jest ona też równowagą w grze wyjściowej. Dlaczego ta równowaga wydaje się nierealistyczna?
6. Rozważ grę dwumacierzową, w której każdy z graczy ma do wyboru n strategii (czystych), a
wszystkie elementy macierzy wypłat graczy są wylosowane (niezależnie od siebie) zgodnie z rozkładem jednostajnym na odcinku [0, 1]. Pokaż, że prawdopodobieństwo, że ta gra będzie miała
równowagę w strategiach czystych dąży przy n dążącym do nieskończoności do 1 − 1e (czyli jest
całkiem duże).