Teoria gier - Przemysław Juszczuk

Transkrypt

Teoria gier - Przemysław Juszczuk
Teoria gier
mgr Przemysław Juszczuk
Instytut Informatyki Uniwersytetu Śląskiego
Wykład 5 - Równowagi w grach n-osobowych
mgr Przemysław Juszczuk
Teoria gier
Figure: Podział gier
mgr Przemysław Juszczuk
Teoria gier
Definicje
Formalnie, jednoetapowa gra w postaci strategicznej dla n graczy
definiowana jest jako:
Γ = hN, {Ai }, Mi, i = 1, 2, ..., n
gdzie:
N = {1, 2, ..., n} jest zbiorem graczy;
{Ai } jest skończonym zbiorem strategii dla gracza i o m strategiach;
M = {µ1 , µ2 , ..., µn } to zbiór funkcji wypłat dla graczy.
mgr Przemysław Juszczuk
Teoria gier
Układ strategii
Przez a = (~a1 , ...,~an ) oznaczmy profil strategii mieszanych wszystkich
graczy, określany dalej jako układ strategii.
a−i = (~a1 , ...,~ai−1 ,~ai+1 , ...,~an ),
będzie układem strategii z wyłączeniem gracza i. Mieszana strategia
gracza i określana jest jako:
~ai = (P(ai1 ), P(ai2 ), ..., P(aim )),
gdzie P(ai1 ) prawdopodobieństwo wyboru strategii 1 przez gracza i,
natomiast ~ai oznacza tutaj dyskretny rozkład prawdopodobieństwa nad
zbiorem strategii.
Wsparcie
Wsparcie strategii mieszanych jest podzbiorem zbioru strategii czystych
danego gracza mających niezerowe prawdopodobieństwo wyboru:
∀i , xi ∈ Mx , P(xi ) > 0
mgr Przemysław Juszczuk
Teoria gier
strategie
A1
A2
B1
B2
1,4 0,6
4 , 1 -1 , -1
Table: Prosta gra 2-osobowa
Równowaga Nasha w grze
n-osobowej jest układem
strategii, w którym żaden z
graczy znając strategię
przeciwników nie zyskuje
odstępując od wybranej
strategii.
Figure: Graficzna reprezentacja równowagi
Nasha
mgr Przemysław Juszczuk
Teoria gier
Równowaga Nasha
Mieszana równowaga Nasha definiowana jest następująco:
∀i , ∀j , µi (a) ­ µi (aij , a−i ),
gdzie:
i - oznacza i-tego gracza;
j - jest numerem strategii danego gracza;
µi (a) - wypłata i-tego gracza dla profilu strategii a;
µi (aij , a−i ) - wypłata i gracza stosującego strategię j przeciwko a−i .
mgr Przemysław Juszczuk
Teoria gier
Figure: Równowaga Nasha - klasa złożoności
FP = FNP jeżeli P = NP
mgr Przemysław Juszczuk
Teoria gier
Figure: Przykład gry 3 osobowej
mgr Przemysław Juszczuk
Teoria gier
Figure: Liczba graczy a wielkość macierzy
mgr Przemysław Juszczuk
Teoria gier
Typy równowag
równowaga Nasha;
równowaga Nasha - zwana także równowagą;
równowaga skorelowana - bardziej ogólna niż Nash;
równowaga Pareto - równowaga Nasha z najwyższą wypłatą dla
graczy;
Trembling hand equilibrium - równowaga „drżącej ręki” - założenie,
że gracz może przez nieuwagę zagrać strategię z zerowym
prawdopodobieństwem wyboru;
idealna równowaga w podgrach - w grach w postaci ekstensywnej;
-Well supported Nash - równowaga, w której każda strategia ma
niezerowe prawdopodobieństwo wyboru.
mgr Przemysław Juszczuk
Teoria gier
Typy równowag cd
Silna równowaga Nasha (ang. Coalition Proof Social Equilibrium)
określana także jako CPSE (stosowana w teorii głosowania). Często
pomijana w rozważaniach jako zbyt trudna do uzyskania.
Punkty ogniskowe (zwane także punktem Schellinga) - punkt
równowagi w grach koordynacyjnych.
Równowagi Nasha z dodatkowymi właściwościami (zaproponowane
przez Gilboę) dotyczą pareto równowagi Nasha, równowagi, w której
gracze zobligowani są do stosowania z góry założonej strategii, lub
też prawdopodobieństwo wyboru danej strategii nie może być niższe
(nie może przekroczyć) konkretnej wartości. Powyższe koncepcje
należą do klasy złożoności NP.
mgr Przemysław Juszczuk
Teoria gier
Figure: Zależność pomiędzy równowagami
mgr Przemysław Juszczuk
Teoria gier
Figure: Program Gamut
java −jar gamut.jar −g GraphicalGame−RG −players 3 −randomparams
−normalize −minpayoff 0 −maxpayoff 1 −f game.nfg −output
GambitOutput −actions 3
mgr Przemysław Juszczuk
Teoria gier
Figure: Program Gambit - główne okno programu
mgr Przemysław Juszczuk
Teoria gier
Gry:
Dylemat więźnia;
Gra w cykora;
Oligopol Bertranda;
Zgadnij 32 ze średniej;
Dylemat podróżnika;
Klasy gier:
Gra bimacierzowa;
Gra koordynacyjna;
Kowariancja;
Gra losowa;
Gra losowa znormalizowana;
Figure: Przykład dylematu więźnia oraz gry losowej
mgr Przemysław Juszczuk
Teoria gier
strategie
a1
a2
a3
a4
b1
0.2
0.4
0.1
0.5
,
,
,
,
b2
0.6
0.1
0.5
0.4
0.1
0.5
0.9
0.7
,
,
,
,
b3
0.7
0.3
0.4
0.9
0.4
0.5
0.9
0.1
,
,
,
,
b4
0.8
0.7
0.3
0.6
Table: Prosta gra 2-osobowa
Równowaga Nasha: {0 : 14 : 34 : 0 :
Wypłaty graczy to: 0.443 i 0.4.
mgr Przemysław Juszczuk
4
7
:0:
3
7
: 0}
Teoria gier
0.3
0.2
0.8
0.1
,
,
,
,
0.5
0.7
0.1
0.6
strategie
a1
a2
a3
a4
b1
0.2
0.4
0.1
0.5
,
,
,
,
b2
0.6
0.1
0.5
0.4
0.1
0.5
0.9
0.7
,
,
,
,
b3
0.7
0.3
0.4
0.9
0.4
0.5
0.9
0.1
,
,
,
,
b4
0.8
0.7
0.3
0.6
0.3
0.2
0.8
0.1
,
,
,
,
0.5
0.7
0.1
0.6
Table: Prosta gra 2-osobowa
Dla układu:
1
3
2
4
1
3
2
4
{ 10
: 10
: 10
: 10
: 10
: 10
: 10
: 10
}
Po 3 losowych grach: a2 b1 , a4 b4 ,
a2 b1 wypłaty graczy: 0.3 i 0.26
wynosi: 0.36
Figure: Wybór strategii
mgr Przemysław Juszczuk
Teoria gier
strategie
a1
a2
a3
a4
b1
0.2
0.4
0.1
0.5
,
,
,
,
b2
0.6
0.1
0.5
0.4
0.1
0.5
0.9
0.7
,
,
,
,
b3
0.7
0.3
0.4
0.9
0.4
0.5
0.9
0.1
,
,
,
,
b4
0.8
0.7
0.3
0.6
0.3
0.2
0.8
0.1
,
,
,
,
0.5
0.7
0.1
0.6
Table: Prosta gra 2-osobowa
Dla układu:
1
3
2
4
1
3
2
4
{ 10
: 10
: 10
: 10
: 10
: 10
: 10
: 10
}
Po 3 innych losowych grach: a2 b2 ,
a4 b3 , a2 b1 wypłaty graczy: 0.333 i
0.3666
Figure: Wybór strategii
mgr Przemysław Juszczuk
Teoria gier
Algorytmy dla gier 2-osobowych
Lemke Howson;
algorytmy przybliżone;
Algorytm Scarfa;
Algorytmy dla gier n-osobowych
Simplicial Subdivision;
Globalna metoda Newtona;
Metaheurystyki w wyszukiwaniu czystych równowag;
Algorytm przybliżony oparty na ewolucji różnicowej;
mgr Przemysław Juszczuk
Teoria gier
Co na następnym wykładzie?
Dylemat więźnia;
Iterowany dylemat więźnia i turniej Axelroda;
Gry przeciwko naturze;
Gry Bayesowskie;
Gry kooperacyjne.
mgr Przemysław Juszczuk
Teoria gier
Dziękuję za uwagę.
mgr Przemysław Juszczuk
Teoria gier

Podobne dokumenty