Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 II lista
Transkrypt
Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 II lista
Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 II lista zadań 1. Mówimy że strategia x1 gracza 1. jest słabo zdominowana przez strategię x2 (w grze dwuosobowej; jak poprzednio, podobnie można to definiować dla gry większej liczby graczy), jeśli dla dowolnej strategii y przeciwnika, u1 (x1 , y) ¬ u1 (x2 , y) oraz istnieje strategia przeciwnika y ∗ taka że u1 (x1 , y ∗ ) < u1 (x2 , y ∗ ). Załóżmy, że dla pewnej gry dwumacierzowej przeprowadziliśmy algorytm iterowanej dominacji z listy I, wykreślając nie tylko strategie mocno, ale też słabo zdominowane. (a) Pokaż, że dowolna równowaga (zrandomizowana) w zredukowanej grze, powstałej po przeprowadzeniu algorytmu, jest też równowagą w wyjściowej grze. (b) Załóżmy, że nasza gra spełnia następujący warunek: jeśli x∗ jest strategią wykreśloną na pewnym kroku algorytmu iterowanej dominacji dlatego, że jest zdominowana przez strategię x∗∗ , to u1 (x∗ , y) < u1 (x∗∗ , y) dla wszystkich (nie wykreślonych na tym etapie algorytmu) strategii y przeciwnika z wyjątkiem co najwyżej jednej. Pokaż, że wtedy każda równowaga w wyjściowej grze jest równowagą w strategiach czystych lub równowagą w grze powstałej po zakończeniu algorytmu iterowanej dominacji. (c) Znajdź przykład gry, w której istnieje równowaga, w której używa się strategii wykreślonych w trakcie przeprowadzania algorytmu iterowanej dominacji, ale ta równowaga nie jest równowagą w strategiach czystych. 2. Niech (µ, σ) będą równowagą Nasha w strategiach mieszanych w grze dwumacierzowej. Pokaż, że każda strategia czysta j gracza 2. taka że σj > 0 jest wtedy najlepszą odpowiedzią na strategię µ (czyli że wypłata z używania przeciwko strategii µ 1. gracza dowolnej kolumny j, dla której σj > 0 jest taka sama). 3. Z dwóch powyższych zadań wynika następujący algorytm szukania równowag w grach dwumacierzowych: (a) Sprawdzamy, czy gra ma równowagi w strategiach czystych. (b) Przeprowadzamy algorytm iterowanej dominacji (z wykreślaniem strategii słabo zdominowanych). (c) Dla zbiorów strategii, które pozostały po punkcie (a), X̂ i Ŷ , rozważamy wszystkie co najmniej dwuelementowe podzbiory X̂ i Ŷ . Dla tych podzbiorów wyrównujemy oczekiwane wypłaty, jak w zadaniu 2. (tzn. jeśli np. wybranymi podzbiorami są {1, 2} dla pierwszego gracza i {4, 5, 6} dla drugiego, to rozwiązujemy układy równań u1 (1, σ) = u1 (2, σ), u2 (µ, 4) = u2 (µ, 5) = u2 (µ, 6). Na koniec sprawdzamy, czy otrzymane strategie mieszane µ i σ są równowagą w grze wyjściowej. Korzystając z powyższego algorytmu, znajdź (wszystkie, jakie można znaleźć przy jego pomocy) równowagi Nasha w grach dwumacierzowych opisanych przez macierze wypłat: 4 1 3 0 −3 1 −3 1 2 , B = 1 −1 2 0 , ∙ A= 1 2 0 −3 2 2 −1 4 1 0 2 2 −1 1 1 2 0 4 1 1 2 3 2 1 3 , B = 4 2 , ∙ A= 5 −1 3 1 2 0 0 0 0 −1 0 2 0 2 −1 2 1 3 ∙ A= 4 0 3 2 3 1 1 2 −1 , B = 1 −1 1 2 0 3 −1 0 3 2 1 4 −1 3 0 . 1 0 2 1 0 1 Czy w przypadku każdej z tych gier są to wszystkie równowagi, jakie istnieją w grze? 4. Dla którejś z gier z poprzedniego zadania rozważ scenariusz, w którym jeden z graczy podejmuje decyzję jako pierwszy, a drugi dostosowuje się do wyboru pierwszego (taki model w teorii gier nazywa się modelem Stackelberga). Znajdź równowagę dla takiej gry. Porównaj wypłaty graczy w równowadze dla standardowej gry i dla modelu Stackelberga. Która wypłata jest większa (dla pierwszego i dla drugiego gracza)? Czy zawsze tak będzie? Uzasadnij (podaj dowód albo kontrprzykład) swoją odpowiedź. 5. W pewnym klubie są dwa wejścia: A i B oraz tylko jeden ochroniarz, bardzo silny, ale mało wytrzymały. W ciągu godziny ma pilnować wejść do klubu, może jednak stać tylko przy jednym z nich, zmieniając wejście, przy którym stoi, nie częściej niż co kwadrans (czytaj: zmiany mogą następować tylko w 15, 30 lub 45 minucie). W trakcie tej godziny chuligani napadają klub. Jeśli wejdą przez wejście, przy którym nikt nie stoi lub pobiją ochroniarza, demolują klub. Demolowanie trwa więcej niż kwadrans, ale ochroniarz ma słuchawki na uszach i nic nie słyszy, ale jeśli w trakcie demolowania zdecyduje się przejść do drugiego wejścia, łapie chuliganów na gorącym uczynku, dzięki czemu, jeśli chuligani go nie pobiją, może zmusić ich do zapłacenia za straty. Ochroniarz jest jednak bardzo mało wytrzymały – jeśli zostanie zaatakowany przy wejściu, przy którym stał od początku, wygrywa z prawdopodobieństwem 1, jeśli przy wejściu, do którego musiał przejść raz, wygrywa z prawdopodobieństwem 43 , jeśli przechodził od przejścia do przejścia 2 razy, wygrywa z prawdopodobieństwem 12 , jeśli 3 razy – 41 . Wypłata dla ochroniarza, jeśli ochronił klub przed zdemolowaniem to 1 (−1 dla chuliganów). Wypłata, gdy nie uchronił klubu przed zniszczeniem, ale złapał sprawców i zmusił do zapłaty to 0 (tyle samo dla chuliganów), natomiast gdy klub został zniszczony, a chuligani uciekli −1 (1 dla chuliganów). Zakładamy, że jeśli chuligani zaatakowali w ostatnim kwadransie i nie zostali zatrzymani przez ochroniarza, uciekają bez przeszkód. W powyższej grze ochroniarz wybiera wejścia, przy których będzie stał w każdym z kwadransów, natomiast chuligani – wejście, które atakują, oraz moment ataku. Zapisz macierz(e) wypłat graczy. Następnie spróbuj znaleźć jakąkolwiek równowagę w tej grze. Jeśli okaże się to zbyt trudne standardową metodą (a tak się okaże), załóż, że gracze stosują zamiast strategii czystych strategie mieszane, w których z równym prawdopodobieństwem wybierają wejście A i wejście B (czyli w przypadku chuliganów strategią będzie tylko moment ataku, a w przypadku ochroniarza para “symetrycznych” strategii, np. AABA i BBAB lub ABAB i BABA, wybieranych z prawdopodobieństwem 12 każda), znajdź równowagę w tak zmodyfikowanej grze, a następnie pokaż, że jest ona też równowagą w grze wyjściowej. Dlaczego ta równowaga wydaje się nierealistyczna? 6. Rozważ grę dwumacierzową, w której każdy z graczy ma do wyboru n strategii (czystych), a wszystkie elementy macierzy wypłat graczy są wylosowane (niezależnie od siebie) zgodnie z rozkładem jednostajnym na odcinku [0, 1]. Pokaż, że prawdopodobieństwo, że ta gra będzie miała równowagę w strategiach czystych dąży przy n dążącym do nieskończoności do 1 − 1e (czyli jest całkiem duże).