Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 I lista
Transkrypt
Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 I lista
Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 I lista zadań 1. Rozważ następującą grę dwóch przedsiębiorców transportowych: Każdy z nich chce przewieźć po 4 ciężarówki towarów przez granicę. Przez granicę wiodą dwa przejścia – przejście A i przejście B. Przejazd do i od granicy przez przejście A trwa 2 godziny, przez przejście B – 4 godziny. Na granicach nie ma kolejek (przekraczać ją będą tylko nasi kierowcy), niestety celnicy na przejściu A prowadzą strajk włoski – odprawiają jeden samochód na godzinę. Na przejściu B odprawiają jeden samochód w ciągu 15 minut. Każdy z graczy stara się zminimalizować czas, przez jaki będzie musiał czekać od wyjazdu swoich samochodów (wszystkie wyjeżdżają naraz) do przyjazdu ostatniego do celu (zakładamy, że jeśli przez któreś z przejść mają przejechać samochody z dwóch firm, to przejeżdżają na zmianę (z jednej i drugiej firmy), zaczynając od samochodu 1. firmy (tak długo, jak długo na przejściu są samochody obu firm – później przekraczają je pozostałe samochody)). Wskaż, jakie strategie mają w tej grze poszczególni gracze. Następnie oblicz ich macierze wypłat (za wypłatę przyjmij minus czas oczekiwania na ostatnią ciężarówkę) i znajdź wszystkie równowagi w tej grze. 2. Dla gry dwumacierzowej rozważ następującą procedurę: 1. Gracz 1. wybiera jedną ze strategii a0 ; t := 0. 2. Gracz 2. wybiera najlepszą swoją odpowiedź bt+1 na strategię at pierwszego. 3. Gracz 1. wybiera najlepszą odpowiedź at+1 na strategię bt+1 wybraną przez 2.; t := t + 1 i wracamy do punktu 2. Algorytm przerywamy, jeśli w kroku 2. lub 3. at+1 = at lub bt+1 = bt . (a) Pokaż, że procedura ta albo zatrzymuje się w równowadze Nasha, albo nie zatrzymuje się wcale. (b) Znajdź przykład gry, która posiada równowagę, ale dla pewnej początkowej strategii Gracza 1. procedura podana w zadaniu się nie kończy. 3. Mówimy że strategia x1 gracza 1. jest mocno zdominowana przez strategię x2 (w grze dwuosobowej; podobnie można to definiować dla gry większej liczby graczy), jeśli dla dowolnej strategii y przeciwnika, u1 (x1 , y) < u1 (x2 , y) (u1 – funkcja wypłaty 1. gracza). Podobnie definiujemy strategię zdominowaną 2. gracza. Algorytm iterowanej dominacji dla gier dwumacierzowych polega na tym, że na każdym jego kroku sprawdzamy, czy któryś z graczy ma strategię zdominowaną. Jeśli tak, to z macierzy wypłat obu graczy wykreślamy wiersz (kolumnę) odpowiadający tej strategii. Następnie procedurę powtarzamy dla tych zmniejszonych macierzy. Kończymy, gdy w danej macierzy nie ma już strategii zdominowanych. (a) Pokaż, że zbiory strategii graczy, które zostają po wykonaniu algorytmu iterowanej dominacji, są takie same niezależnie od tego, który z graczy na każdym kroku algorytmu wykreśla strategie zdominowane jako pierwszy. (b) Pokaż, że jeśli po zastosowaniu algorytmu iterowanej dominacji każdemu graczowi zostaje tylko jedna strategia, to ta para strategii jest równowagą Nasha, w dodatku jedyną w grze. (c) Rozważ następującą modyfikację algorytmu z zadania 2. (tamten algorytm jest szczególnym przypadkiem algorytmu zdefiniowanego poniżej): 1. Gracze 1. i 2. wybierają po jednej ze swoich strategii a0 i b0 ; t := 0. 2. Gracz 1. wybiera dowolną strategię (jeśli taka istnieje) at+1 , taką że jego wypłata, gdy stosuje at+1 przeciwko bt jest większa niż gdy stosuje at przeciwko bt . 3. Gracz 2. wybiera dowolną strategię (jeśli taka istnieje) bt+1 , taką że jego wypłata, gdy stosuje bt+1 przeciwko at+1 jest większa niż gdy stosuje bt przeciwko at+1 ; t := t + 1 i wracamy do punktu 2. Algorytm jest przerywany, jeśli w kroku 2. lub 3. któryś z graczy nie może wybrać żadnej strategii zgodnie z powyższymi zasadami. Pokaż, że jeśli po zastosowaniu algorytmu iterowanej dominacji każdemu z graczy pozostaje po jednej strategii, to powyższy algorytm zatrzymuje się po skończonej liczbie kroków, w dodatku też w tej parze strategii. 4. Znajdź równowagę w grze dwóch graczy ze zbiorami strategii X = Y = [0, ∞) oraz funkcjami wypłat u1 (x, y) = ln(x + 2) − xy, u2 (x, y) = −(x − y)2 . 5. Znajdź równowagę w grze dwóch graczy z X = Y = [0, 1] oraz funkcjami wypłat u1 (x, y) = 2 xy 2 − x2 , u2 (x, y) = sin(2π(x + y)). 6. Rozważ następującą grę dwóch graczy: policji i przestępcy. Policja chce wybrać w mieszkaniu przestępcy takie miejsce na założenie podsłuchu, żeby prawdopodobieństwo uzyskania przy jego pomocy użytecznej informacji było jak największe. Z kolei przestępca, wiedząc o tym, że jest podsłuchiwany, wybiera miejsce, w którym będzie rozmawiał tak, żeby to prawdopodobieństwo było jak najmniejsze. Dla uproszczenia przyjmiemy, że poszczególnym miejscom w mieszkaniu odpowiadają punkty na odcinku [0, 1]. Prawdopodobieństwo uzyskania użytecznej dla policji informacji wynosi 1 − ed−1 , gdzie d to odległość między podsłuchem a rozmawiającymi osobami. (a) Gdzie powinien być umieszczony podsłuch, a gdzie powinni rozmawiać przestępcy? (b) W jaki sposób zmieni się optymalne położenie podsłuchów oraz rozmawiających przestępców, jeśli policja założy zamiast jednego n podsłuchów w mieszkaniu? (Wtedy prawdopoP n dobieństwo uzyskania informacji przez policję jest liczone ze wzoru 1 − e di to odległość od i-tego podsłuchu). i=1 (di −1) , gdzie (c) Rozważmy modyfikację powyższej gry, w której policja wybiera nie tylko rozmieszczenie, ale też liczbę podsłuchów. Wtedy policja stara się zmaksymalizować prawdopodobieństwo uzyskania istotnej informacji minus liczbę podsłuchów razy c (gdzie c to jednostkowy koszt założenia podsłuchu), a przestępca zminimalizować samo prawdopodobieństwo (bez uwzględnienia kosztów). Jakie wtedy będą optymalne: liczba i rozmieszczenie podsłuchów oraz miejsce rozmów przestępców? (Liczba podsłuchów wyjdzie zwykle niecałkowita, ale nie należy się tym przejmować).