Egzamin z przedmiotu: Wstęp do Teorii Gier Prowadzący: dr Michał

Transkrypt

Egzamin z przedmiotu: Wstęp do Teorii Gier Prowadzący: dr Michał
Egzamin z przedmiotu: Wstęp do Teorii Gier
Zadanie 1
Prowadzący: dr Michał Lewandowski
Agnieszka Radwańska gra w tenisa z Karoliną Woźniacki. Agnieszka może zaserwować na backhand
lub na forehand Woźniacki. Jeśli Woźniacki przewidzi właściwie, na którą stronę Agnieszka zaserwuje,
odbierze serw z większym prawdopodobieństwem. Agnieszka ma jednak silniejszy serwis na
backhand. Dlatego, jeśli Agnieszka zaserwuje na backhand a Karolina to przewidzi, wówczas Karolina
odbierze z prawdopodobieństwem 60%, a jeśli zaserwuje na forehand i Karolina to przewidzi,
wówczas odbierze z prawdopodobieństwem 90%. Jeśli Woźniacki nie przewidzi serwu na forehand,
wówczas odbierze z prawdopodobieństwem 20%, a jeśli nie przewidzi serwu na backhand, odbierze z
prawdopodobieństwem 30%. Gra w formie strategicznej jest pokazana w tabeli poniżej.
a) Znajdź równowagi Nasha tej gry oraz wypłaty w równowadze obu tenisistek.
Nie ma równowag w strategiach czystych (patrz tabelka powyżej). Szukamy równowagi w strategiach
mieszanych. Oznaczmy przez p prawdopodobieństwo backhand_W a przez q prawdopodobieństwo
backhand_R.
Woźniacki tak wybiera p, aby Radwańska była obojętna pomiędzy backhandem i forehandem:
Radwańska tak wybiera q, aby Woźniacki była obojętna pomiędzy backhandem i forehandem:
Równowaga jest zatem następująca: (0,7 backhand_R + 0,3 forehand_R; 0,6 backhand_W + 0,4
backhand_W). Wypłaty:
b) Wyznacz i narysuj korespondencje najlepszych odpowiedzi dla obu tenisistek na jednym
wykresie.
Korespondencje najlepszych odpowiedzi:
#$%&' ( )
*+
#$%&' "
!
#$%&' , q
0,7
#$%&' , . " ) *+ #$%&' #$%&' ( 0,6
p
Zadanie 2
Dana jest następująca gra:
a) Znajdź równowagę Nasha: Jedyną równowagą Nasha jest AA
b) Znajdź poziomy bezpieczeństwa wiersza i kolumny (wypłaty, jakie mogą sobie
zagwarantować gracze – np. poziom bezpieczeństwa kolumny to wypłata w równowadze w
grze najbardziej dla kolumny niekorzystnej, czyli takiej, gdzie wypłaty kolumny są identyczne
jak w grze powyżej a wypłaty wiersza są po prostu ujemnymi wypłatami kolumny)
A
B
Gra wiersza
A
2
0
B
7
1
A
B
Kolumny
A
7
1
B
2
0
Poziomy bezpieczeństwa: Wiersza: 2, Kolumny: 1
c) Narysuj wielobok wypłat i nanieś na niego status quo wyznaczony w poziomach
bezpieczeństwa graczy oraz zbiór negocjacyjny (bargaining set)
Zbiór negocjacyjny
SQ
d) Znajdź rozwiązanie arbitrażowe Nasha, gdzie status quo jest wyznaczone przez poziomy
bezpieczeństwa graczy
Najpierw znajdziemy równanie prostej przechodzącej przez odcinek oznaczający zbiór negocjacyjny:
/ 0 / 0
Teraz podstawimy do problemu maksymalizacji
0 / 1 234
0 0 1 234
0 5 0 1 234
Warunki konieczne maksymalizacji (ponieważ parabola jest wklęsła są również warunkami
wystarczającymi):
0 06
/
Zatem rozwiązaniem jest punkt (5,4).
Zadanie 3
Rozważmy problem duopolu. Mamy dwie firmy, produkujące identyczne dobro. Każda z firm wybiera
własną produkcję (x1 i x2). Cena dobra dana jest odwrotną funkcją popytu p(x1,x2)=60-3(x1+x2) (lub
0 jeśli suma produkcji przekracza 20). Funkcja kosztów wynosi ci(xi)=12xi dla i=1,2. Obaj gracze dążą
do maksymalizacji zysku, czyli różnicy między dochodem a kosztem.
a) (Cournot) Przyjmijmy, że gracze dokonują wyboru x1 i x2 jednocześnie. Wyznacz równowagi
Nasha oraz zyski w równowadze
Problem gracza 1:
2349 0: 05 ;0: 0:
78
2340: 0:5 05 0: 78
Analogicznie dla gracza 2.
Warunki pierwszego rzędu (warunki konieczne istnienia ekstremum) dla problemów maksymalizacji
obu graczy (funkcja wklęsła i dlatego są to zarazem warunki wystarczające):
0: 05 05 0: Rozwiązując otrzymujemy:
<= < Zyski wynoszą:
=
=
= =
b) (Stackelberg) Przyjmijmy, że najpierw decyzje podejmuje gracz 1, a następnie –
zaobserwowawszy decyzję gracza 1 – decyzję podejmuje gracz 2. Przebieg gry, wypłaty i
możliwe akcje i strategie są wspólną wiedzą w tej grze. Wyznacz równowagę i zyski w
równowadze. (Wskazówka użyj indukcji wstecznej, najpierw rozwiąż problem gracza 2 i wyznacz
funkcję reakcji na akcję gracza 1, potem podstaw do problemu gracza 1)
Rozwiązujemy najpierw problem drugiego gracza (analogicznie, jak powyżej):
2349 0: 05 ;05 05
7>
23405 0: 05 055 78
Warunek pierwszego rzędu:
05 0: Stąd wyznaczamy funkcję reakcji gracza 2 na akcję gracza 1:
05 0: 50:
:
Teraz tą funkcję reakcji wstawimy do problemu gracza 1 zamiast x2:
2349 0: 05 ;0: 0:
78
234 ? @0: 50: AB 0: 0:
78
:
234 @0: 50:5 A
C
78
0: 0: 05 Tak więc rozwiązaniem jest:
<= < Zyski wynoszą:
= D
Zadanie 4
Dana jest następująca gra:
a) Zamień powyższą grę w postaci ekstensywnej na grę w postaci strategicznej.
AG
AH
BG
BH
C
0,8
0,8
3,1
0,0
D
0,8
0,8
1,3
0,0
E
0,8
0,8
2,2
2,2
F
0,8
0,8
3,0
3,0
b) Znajdź równowagi Nasha w strategiach czystych: Są dwie równowagi Nasha w strategiach
czystych: (BG,D) oraz (BH,E)
c) Czy są równowagi Nasha, które nie są równowagami doskonałymi w podgrach? Tak (BH,E)
d) Ile podgier można wyróżnić w poniższym drzewie (cała gra jest również podgrą)? Są 3
podgry.
Zadanie 5
Dana jest następująca gra:
Gracz 2
Gracz 1
A
B
C
X
4,2
1,1
2,3
Y
0,2
4,2
2,1
a) Rozwiąż grę metodą iteracyjnej eliminacji strategii zdominowanych. Za każdym razem podaj,
przez jaką strategię jest zdominowana dana strategia. Podaj równowagę Nasha będącą
rozwiązaniem.
1) Najpierw eliminujemy strategię C gracza pierwszego, która jest silnie zdominowana przez strategię
mieszaną pA+(1-p)B, gdzie p spełnia następujące warunki:
: :
C
Zatem ) @ 5A.
( ( 2) Następnie eliminujemy strategię X gracza drugiego, ponieważ jest słabo zdominowana przez
strategię Y.
3) Na koniec eliminujemy strategię A gracza pierwszego, ponieważ jest silnie zdominowana przez
strategię B. Rozwiązanie, czyli para strategii B,Y jest równowagą Nasha w strategiach dominujących.
b) Czy w wyniku procedury z punktu a) nie straciliśmy jakiejś równowagi Nasha? Jeśli tak, to
jaką?
Utraciliśmy równowagę A,X w wyniku kroku drugiego powyżej – w drugim kroku wyeliminowaliśmy
strategię słabo zdominowaną, a wówczas możemy stracić pewne równowagi Nasha, mianowicie te,
które nie są równowagami w strategiach dominujących.
Zadanie 6
Dana jest następująca gra ultimatum.
a) Ile strategii ma gracz 1? Ile strategii ma gracz 2? Gracz 1: 11, Gracz 2: 211=2048
b) Podaj równowagi doskonałe w podgrach? (0,AAAAAAAAAAA) oraz (1,OAAAAAAAAAA), czyli:
• Gracz 1:zaproponuj drugiemu graczowi 0. Gracz 2: zaakceptuj każdą ofertę gracza 1 oraz
• Gracz 1: zaproponuj drugiemu graczowi 1. Gracz 2: zaakceptuj każdą ofertę gracza 1 oprócz tej,
gdy zaproponuje 0.
c) Czy strategia zaakceptuj 3 a wszystko inne odrzucaj dla gracza 2 oraz zaoferuj 3 dla gracza 1 jest
równowagą Nasha? Uzasadnij jednym zdaniem: Jest to równowaga Nasha, ponieważ żadnemu z graczy
nie opłaca się jednostronnie od niej odstąpić.
Zadanie 7
Znajdź równowagi stabilne ewolucyjnie w następującej grze:
Odpowiedź: Patrzymy na elementy diagonalne macierzy wypłat pierwszego gracza (czerwone liczby) i
porównujemy je z innymi wypłatami pierwszego gracza w danej kolumnie. W dwóch przypadkach, tj. w
kolumnie posiadacza oraz w kolumnie mściciela wartości na przekątnej macierzy są najwyższe w tej kolumnie
(odpowiednio 25 oraz 15). Oznacza to, że stabilną Posiadacz jest równowagą ewolucyjnie. Również Mściciel jest
równowagą stabilną ewolucyjnie. Ponieważ w kolumnie posiadacza wypłata w wierszu gnębiciel jest równa
najwyższej wartości w tej kolumnie (25), będziemy weryfikować czy i – jeśli tak – dla jakich wartości p istnieje
równowaga mieszana EFGHIJIKL MNIOPOJQ
. Musimy zweryfikować, że wypłata jakiegokolwiek
mutanta będzie osiągała w starciu z przedstawicielem populacji EFGHIJIKL MNIOPOJQ
gorsze
wypłaty niż przedstawiciel populacji EFGHIJIKL MNIOPOJQ
walczący z przedstawicielem tej
samej populacji.
RSTUVWXYZ 6 6 , 6
R[\]YZ 6 , 6
R^%_`_`ab 6 6 , 6
:
Z powyższych warunków otrzymujemy jeden: , C. Zatem posiadacz dopuszczający do 33,33% gnębicieli jest
strategią stabilną ewolucyjnie.
Analogicznie, w kolumnie mściciela najwyższe dwie wypłaty są na przekątnej oraz w wierszu gołębia. Będziemy
weryfikować, czy istnieje stabilna ewolucyjnie równowaga mieszana mścicieli dopuszczająca pewną ilość gołębi:
cM]YH d%JIJIKL. Możliwi mutanci muszą mieć niższe wypłaty niż populacja, która ma być stabilna
ewolucyjnie:
RSTUVWXYZ 6 6 , 6
R[eGZ`_`ab 6 , 6
Rf\U`TgT_X 6 6 , 6
Z powyższych warunków otrzymujemy jeden: ,
strategią stabilną ewolucyjnie.
C
.
:h
Zatem mściciel dopuszczający do 30% gołębi jest
Zadanie 8
Dana jest gra „Panika finansowa” omawiana na wykładzie.
a) Czy istnieje równowaga separowalna, w której dobry typ Wypłaca a słaby Nie Wypłaca pieniędzy z
banku?
Nie, ponieważ Nie wypłacać jest strategią zdominowaną słabego typa.
b) Sprawdź następujące strategie: Gracz 1: Nie Wypłacać, Gracz 2- dobry: Nie Wypłacać, Gracz 2- słaby:
Wypłacać. Czy jest to równowaga Bayesowska Nasha? Jeśli tak, to dla jakich wierzeń gracza 1?
Najlepsza odpowiedź słabego typu Gracza 2 na strategię Nie wypłacać Gracza 1 to Wypłacać. Najlepszą
odpowiedzią dobrego typu Gracza 2 na strategię Nie wypłacać Gracza 1 to Nie wypłacać. (Na razie OK)
Najlepszą odpowiedzią Gracza 1 na strategię (Słaby: Wypłacać, Dobry: Nie wypłacać) Gracza 2 jest Nie wypłacać
jeśli wypłata z Nie wypłacać jest wyższa niż wypłata z Wypłacać:
R: i/]OJOj
6 , 6 R: kIK l/]OJOj
:
5
Zatem otrzymujemy warunek ( . Czyli podana para strategii jest równowagą Bayesowską Nasha, jeśli Gracz
1 wierzy, że Gracz 2 jest dobrego typu z prawdopodobieństwem większym niż ½.
Zadanie 9
(DODATKOWE)
Ala, Basia i Cecylia oraz Darek, Ernest oraz Filip są z tej samej klasy. W długich rozmowach na przerwach chłopcy
ustalili jako najważniejsze kryterium oceny, że blondynka powinna mieć niebieskie oczy a brunetka ciemne.
Dziewczynki z kolei stwierdziły po długiej konwersacji, że fajny chłopak musi być przede wszystkim wysoki. W
poniższych tabelkach znajduje się charakterystyka chłopców i dziewczynek:
Włosy
Oczy
Ala
Blondynka Niebieskie
Basia
Brunetka
Ciemne
Cecylia Brunetka
Jasne
Darek
Ernest
Filip
Włosy
Blondyn
Brunet
Blondyn
Wzrost
Wysoki
Wysoki
Niski
Okazało się, że blondynki wolą brunetów, brunetki blondynów, bruneci brunetki (!) i blondyni blondynki (!).
a) Sporządź ranking chłopców odnośnie dziewczynek i dziewczynek odnośnie chłopców.
I miejsce
Ala
Ernest
Basia
Darek
Cecylia Darek
II miejsce
Darek
Ernest
Ernest
III miejsce
Filip
Filip
Filip
Darek
Ernest
Filip
I miejsce
Ala
Basia
Ala
II miejsce
Basia
Ala
Basia
III miejsce
Cecylia
Cecylia
Cecylia
b) Czy poniższe skojarzenie jest stabilne? Jeśli nie, podaj kto z kim mógłby zablokować to skojarzenie?
Basia – Darek
Cecylia – Ernest
Ala – Filip
Zablokować może Ala z Darkiem lub Ala z Ernestem.
c) Jakie skojarzenie będzie wybrane, jeśli użyjemy algorytmu Gale-Shapley’a z chłopcami proponującymi
wyjście na randkę dziewczynkom?
Ala – Darek
Basia – Ernest
Cecylia – Filip
d) Czy można zyskać poprzez podanie nieprawdziwych preferencji? Wskazówka: użyj algorytmu Gale-Shapley’a
z chłopcami proponującymi (jak wyżej), jeśli Ala skłamie i powie, że woli Filipa niż Darka. Jakie będzie
wówczas skojarzenie:
Ala – Ernest
Basia – Darek
Cecylia – Filip
Ala zyskała poprzez podanie nieprawdziwych preferencji. Mało tego – zyskała na tym również Basia,
natomiast Cecylia nie straciła – jest to więc polepszenie Pareto dla dziewczynek. Jednak dla chłopców jest
to pogorszenie Pareto, ponieważ zarówno Ernest, jak i Darek wychodzą na tym gorzej – to się nazywa
kobiecy spryt ☺
Zadanie 10
(DODATKOWE)
Rozważmy następującą grę: dwóch przestępców zostało zamkniętych w osobnych celach.
•
•
•
Jeśli oboje będą zeznawać, dostaną wyroki każdy po 5 lat
Jeśli oboje nie będą zeznawać, dostaną wyroki każdy po 1 roku
Jeśli jeden będzie zeznawać a drugi nie, to ten pierwszy zostanie zwolniony w ogóle a ten drugi dostanie
maksymalny wyrok 20 lat.
Zanim jednak zaczną grać, każdy z przestępców może wybrać czy być honorowym czy niehonorowym
(niezależnie i bez informowania drugiego). Niehonorowy przestępca dba wyłącznie o to, aby jak najkrócej
przesiedzieć w więzieniu. Honorowy przestępca natomiast nie lubi być kapusiem. Jego użyteczność jeśli on sam
nie zeznaje pozostaje niezmieniona. Teraz jednak woli nie zeznawać i siedzieć 20 lat w więzieniu niż zeznawać i
siedzieć 5 lat (w przypadku, kiedy ten drugi zeznaje). Również woli nie zeznawać i siedzieć rok w więzieniu niż
zeznawać i zostać zwolnionym (w przypadku kiedy ten drugi nie zeznaje).
Zapisz grę w postaci ekstensywnej. Poprzez znalezienie równowag Nasha w odpowiednich podgrach i metodę
indukcji wstecznej znajdź równowagi doskonałe w podgrach. Ile ich jest?
Trzeba narysować odpowiednie drzewko i zaznaczyć właściwie zbiory informacji. Trzeba nanieść odpowiednie
wypłaty. Potem można poszczególne podgry rozpisać w formie strategicznej – rozwiązać i podstawić jako
liście do drzewka i rozwiązać do końca.
Ogólnie się okazuje, że gra metodą indukcji wstecznej sprowadza się do zwykłego , ale bardziej
rozbudowanego dylematu więźnia. Równowaga doskonała w podgrach jest zatem jedna i jest następująca:
(NH, Z) dla gracza 1 oraz (NH, Z) dla gracza 2.

Podobne dokumenty