Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 I lista

Transkrypt

Teoria gier, Informatyka WPPT semestr zimowy 2010/2011 I lista
Teoria gier, Informatyka WPPT
semestr zimowy 2010/2011
I lista zadań
1. Rozważ następującą grę dwóch przedsiębiorców transportowych: Każdy z nich chce przewieźć po
4 ciężarówki towarów przez granicę. Przez granicę wiodą dwa przejścia – przejście A i przejście
B. Przejazd do i od granicy przez przejście A trwa 2 godziny, przez przejście B – 4 godziny. Na
granicach nie ma kolejek (przekraczać ją będą tylko nasi kierowcy), niestety celnicy na przejściu
A prowadzą strajk włoski – odprawiają jeden samochód na godzinę. Na przejściu B odprawiają
jeden samochód w ciągu 15 minut. Każdy z graczy stara się zminimalizować czas, przez jaki
będzie musiał czekać od wyjazdu swoich samochodów (wszystkie wyjeżdżają naraz) do przyjazdu
ostatniego do celu (zakładamy, że jeśli przez któreś z przejść mają przejechać samochody z dwóch
firm, to przejeżdżają na zmianę (z jednej i drugiej firmy), zaczynając od samochodu 1. firmy
(tak długo, jak długo na przejściu są samochody obu firm – później przekraczają je pozostałe
samochody)). Wskaż, jakie strategie mają w tej grze poszczególni gracze. Następnie oblicz ich
macierze wypłat (za wypłatę przyjmij minus czas oczekiwania na ostatnią ciężarówkę) i znajdź
wszystkie równowagi w tej grze.
2. Dla gry dwumacierzowej rozważ następującą procedurę:
1. Gracz 1. wybiera jedną ze strategii a0 ; t := 0.
2. Gracz 2. wybiera najlepszą swoją odpowiedź bt+1 na strategię at pierwszego.
3. Gracz 1. wybiera najlepszą odpowiedź at+1 na strategię bt+1 wybraną przez 2.; t :=
t + 1 i wracamy do punktu 2.
Algorytm przerywamy, jeśli w kroku 2. lub 3. at+1 = at lub bt+1 = bt .
(a) Pokaż, że procedura ta albo zatrzymuje się w równowadze Nasha, albo nie zatrzymuje się
wcale.
(b) Znajdź przykład gry, która posiada równowagę, ale dla pewnej początkowej strategii Gracza
1. procedura podana w zadaniu się nie kończy.
3. Mówimy że strategia x1 gracza 1. jest mocno zdominowana przez strategię x2 (w grze dwuosobowej; podobnie można to definiować dla gry większej liczby graczy), jeśli dla dowolnej strategii y
przeciwnika, u1 (x1 , y) < u1 (x2 , y) (u1 – funkcja wypłaty 1. gracza). Podobnie definiujemy strategię zdominowaną 2. gracza. Algorytm iterowanej dominacji dla gier dwumacierzowych polega na
tym, że na każdym jego kroku sprawdzamy, czy któryś z graczy ma strategię zdominowaną. Jeśli
tak, to z macierzy wypłat obu graczy wykreślamy wiersz (kolumnę) odpowiadający tej strategii. Następnie procedurę powtarzamy dla tych zmniejszonych macierzy. Kończymy, gdy w danej
macierzy nie ma już strategii zdominowanych.
(a) Pokaż, że zbiory strategii graczy, które zostają po wykonaniu algorytmu iterowanej dominacji, są takie same niezależnie od tego, który z graczy na każdym kroku algorytmu wykreśla
strategie zdominowane jako pierwszy.
(b) Pokaż, że jeśli po zastosowaniu algorytmu iterowanej dominacji każdemu graczowi zostaje
tylko jedna strategia, to ta para strategii jest równowagą Nasha, w dodatku jedyną w grze.
(c) Rozważ następującą modyfikację algorytmu z zadania 2. (tamten algorytm jest szczególnym
przypadkiem algorytmu zdefiniowanego poniżej):
1. Gracze 1. i 2. wybierają po jednej ze swoich strategii a0 i b0 ; t := 0.
2. Gracz 1. wybiera dowolną strategię (jeśli taka istnieje) at+1 , taką że jego
wypłata, gdy stosuje at+1 przeciwko bt jest większa niż gdy stosuje at przeciwko
bt .
3. Gracz 2. wybiera dowolną strategię (jeśli taka istnieje) bt+1 , taką że jego
wypłata, gdy stosuje bt+1 przeciwko at+1 jest większa niż gdy stosuje bt przeciwko
at+1 ; t := t + 1 i wracamy do punktu 2.
Algorytm jest przerywany, jeśli w kroku 2. lub 3. któryś z graczy nie może wybrać
żadnej strategii zgodnie z powyższymi zasadami.
Pokaż, że jeśli po zastosowaniu algorytmu iterowanej dominacji każdemu z graczy pozostaje
po jednej strategii, to powyższy algorytm zatrzymuje się po skończonej liczbie kroków, w
dodatku też w tej parze strategii.
4. Znajdź równowagę w grze dwóch graczy ze zbiorami strategii X = Y = [0, ∞) oraz funkcjami
wypłat u1 (x, y) = ln(x + 2) − xy, u2 (x, y) = −(x − y)2 .
5. Znajdź równowagę w grze dwóch graczy z X = Y = [0, 1] oraz funkcjami wypłat u1 (x, y) =
2
xy 2 − x2 , u2 (x, y) = sin(2π(x + y)).
6. Rozważ następującą grę dwóch graczy: policji i przestępcy. Policja chce wybrać w mieszkaniu
przestępcy takie miejsce na założenie podsłuchu, żeby prawdopodobieństwo uzyskania przy jego
pomocy użytecznej informacji było jak największe. Z kolei przestępca, wiedząc o tym, że jest
podsłuchiwany, wybiera miejsce, w którym będzie rozmawiał tak, żeby to prawdopodobieństwo
było jak najmniejsze. Dla uproszczenia przyjmiemy, że poszczególnym miejscom w mieszkaniu
odpowiadają punkty na odcinku [0, 1]. Prawdopodobieństwo uzyskania użytecznej dla policji informacji wynosi 1 − ed−1 , gdzie d to odległość między podsłuchem a rozmawiającymi osobami.
(a) Gdzie powinien być umieszczony podsłuch, a gdzie powinni rozmawiać przestępcy?
(b) W jaki sposób zmieni się optymalne położenie podsłuchów oraz rozmawiających przestępców, jeśli policja założy zamiast jednego n podsłuchów w mieszkaniu? (Wtedy
prawdopoP
n
dobieństwo uzyskania informacji przez policję jest liczone ze wzoru 1 − e
di to odległość od i-tego podsłuchu).
i=1
(di −1)
, gdzie
(c) Rozważmy modyfikację powyższej gry, w której policja wybiera nie tylko rozmieszczenie, ale
też liczbę podsłuchów. Wtedy policja stara się zmaksymalizować prawdopodobieństwo uzyskania istotnej informacji minus liczbę podsłuchów razy c (gdzie c to jednostkowy koszt założenia podsłuchu), a przestępca zminimalizować samo prawdopodobieństwo (bez uwzględnienia kosztów). Jakie wtedy będą optymalne: liczba i rozmieszczenie podsłuchów oraz miejsce
rozmów przestępców? (Liczba podsłuchów wyjdzie zwykle niecałkowita, ale nie należy się
tym przejmować).

Podobne dokumenty