Teoria gier - Przemysław Juszczuk

Transkrypt

Teoria gier
mgr Przemysław Juszczuk
Instytut Informatyki Uniwersytetu Śląskiego
Wykład 5 - Równowagi w grach n-osobowych
Teoria gier
Figure: Podział gier
Teoria gier
Definicje
Formalnie, jednoetapowa gra w postaci strategicznej dla n graczy
definiowana jest jako:
Γ = hN, {Ai }, Mi, i = 1, 2, ..., n
gdzie:
N = {1, 2, ..., n} jest zbiorem graczy;
{Ai } jest skończonym zbiorem strategii dla gracza i o m strategiach;
M = {µ1 , µ2 , ..., µn } to zbiór funkcji wypłat dla graczy.
Teoria gier
Układ strategii
Przez a = (~a1 , ...,~an ) oznaczmy profil strategii mieszanych wszystkich
graczy, określany dalej jako układ strategii.
a−i = (~a1 , ...,~ai−1 ,~ai+1 , ...,~an ),
będzie układem strategii z wyłączeniem gracza i. Mieszana strategia
gracza i określana jest jako:
~ai = (P(ai1 ), P(ai2 ), ..., P(aim )),
gdzie P(ai1 ) prawdopodobieństwo wyboru strategii 1 przez gracza i,
natomiast ~ai oznacza tutaj dyskretny rozkład prawdopodobieństwa nad
zbiorem strategii.
Wsparcie
Wsparcie strategii mieszanych jest podzbiorem zbioru strategii czystych
danego gracza mających niezerowe prawdopodobieństwo wyboru:
∀i , xi ∈ Mx , P(xi ) > 0
Teoria gier
strategie
A1
A2
B1
B2
1,4 0,6
4 , 1 -1 , -1
Table: Prosta gra 2-osobowa
Równowaga Nasha w grze
n-osobowej jest układem
strategii, w którym żaden z
graczy znając strategię
przeciwników nie zyskuje
odstępując od wybranej
strategii.
Figure: Graficzna reprezentacja równowagi
Nasha
Teoria gier
Równowaga Nasha
Mieszana równowaga Nasha definiowana jest następująco:
∀i , ∀j , µi (a) µi (aij , a−i ),
gdzie:
i - oznacza i-tego gracza;
j - jest numerem strategii danego gracza;
µi (a) - wypłata i-tego gracza dla profilu strategii a;
µi (aij , a−i ) - wypłata i gracza stosującego strategię j przeciwko a−i .
Teoria gier
Figure: Równowaga Nasha - klasa złożoności
FP = FNP jeżeli P = NP
Teoria gier
Figure: Przykład gry 3 osobowej
Teoria gier
Figure: Liczba graczy a wielkość macierzy
Teoria gier
Typy równowag
równowaga Nasha;
równowaga Nasha - zwana także równowagą;
równowaga skorelowana - bardziej ogólna niż Nash;
równowaga Pareto - równowaga Nasha z najwyższą wypłatą dla
graczy;
Trembling hand equilibrium - równowaga „drżącej ręki” - założenie,
że gracz może przez nieuwagę zagrać strategię z zerowym
prawdopodobieństwem wyboru;
idealna równowaga w podgrach - w grach w postaci ekstensywnej;
-Well supported Nash - równowaga, w której każda strategia ma
niezerowe prawdopodobieństwo wyboru.
Teoria gier
Typy równowag cd
Silna równowaga Nasha (ang. Coalition Proof Social Equilibrium)
określana także jako CPSE (stosowana w teorii głosowania). Często
pomijana w rozważaniach jako zbyt trudna do uzyskania.
Punkty ogniskowe (zwane także punktem Schellinga) - punkt
równowagi w grach koordynacyjnych.
Równowagi Nasha z dodatkowymi właściwościami (zaproponowane
przez Gilboę) dotyczą pareto równowagi Nasha, równowagi, w której
gracze zobligowani są do stosowania z góry założonej strategii, lub
też prawdopodobieństwo wyboru danej strategii nie może być niższe
(nie może przekroczyć) konkretnej wartości. Powyższe koncepcje
należą do klasy złożoności NP.
Teoria gier
Figure: Zależność pomiędzy równowagami
Teoria gier
Figure: Program Gamut
java −jar gamut.jar −g GraphicalGame−RG −players 3 −randomparams
−normalize −minpayoff 0 −maxpayoff 1 −f game.nfg −output
GambitOutput −actions 3
Teoria gier
Figure: Program Gambit - główne okno programu
Teoria gier
Gry:
Dylemat więźnia;
Gra w cykora;
Oligopol Bertranda;
Zgadnij 32 ze średniej;
Dylemat podróżnika;
Klasy gier:
Gra bimacierzowa;
Gra koordynacyjna;
Kowariancja;
Gra losowa;
Gra losowa znormalizowana;
Figure: Przykład dylematu więźnia oraz gry losowej
Teoria gier
strategie
a1
a2
a3
a4
b1
0.2
0.4
0.1
0.5
,
,
,
,
b2
0.6
0.1
0.5
0.4
0.1
0.5
0.9
0.7
,
,
,
,
b3
0.7
0.3
0.4
0.9
0.4
0.5
0.9
0.1
,
,
,
,
b4
0.8
0.7
0.3
0.6
Równowaga Nasha: {0 : 14 : 34 : 0 :
Wypłaty graczy to: 0.443 i 0.4.
4
7
:0:
3
7
: 0}
Teoria gier
0.3
0.2
0.8
0.1
,
,
,
,
0.5
0.7
0.1
0.6
strategie
a1
a2
a3
a4
b1
0.2
0.4
0.1
0.5
,
,
,
,
b2
0.6
0.1
0.5
0.4
0.1
0.5
0.9
0.7
,
,
,
,
b3
0.7
0.3
0.4
0.9
0.4
0.5
0.9
0.1
,
,
,
,
b4
0.8
0.7
0.3
0.6
0.3
0.2
0.8
0.1
,
,
,
,
0.5
0.7
0.1
0.6
Dla układu:
1
3
2
4
1
3
2
4
{ 10
: 10
: 10
: 10
: 10
: 10
: 10
: 10
}
Po 3 losowych grach: a2 b1 , a4 b4 ,
a2 b1 wypłaty graczy: 0.3 i 0.26
wynosi: 0.36
Figure: Wybór strategii
Teoria gier
strategie
a1
a2
a3
a4
b1
0.2
0.4
0.1
0.5
,
,
,
,
b2
0.6
0.1
0.5
0.4
0.1
0.5
0.9
0.7
,
,
,
,
b3
0.7
0.3
0.4
0.9
0.4
0.5
0.9
0.1
,
,
,
,
b4
0.8
0.7
0.3
0.6
0.3
0.2
0.8
0.1
,
,
,
,
0.5
0.7
0.1
0.6
Dla układu:
1
3
2
4
1
3
2
4
{ 10
: 10
: 10
: 10
: 10
: 10
: 10
: 10
}
Po 3 innych losowych grach: a2 b2 ,
a4 b3 , a2 b1 wypłaty graczy: 0.333 i
0.3666
Figure: Wybór strategii
Teoria gier
Algorytmy dla gier 2-osobowych
Lemke Howson;
algorytmy przybliżone;
Algorytm Scarfa;
Algorytmy dla gier n-osobowych
Simplicial Subdivision;
Globalna metoda Newtona;
Metaheurystyki w wyszukiwaniu czystych równowag;
Algorytm przybliżony oparty na ewolucji różnicowej;
Teoria gier
Co na następnym wykładzie?
Dylemat więźnia;
Iterowany dylemat więźnia i turniej Axelroda;
Gry przeciwko naturze;
Gry Bayesowskie;
Gry kooperacyjne.
Teoria gier
Dziękuję za uwagę.
Teoria gier

Teoria gier - Przemysław Juszczuk

Transkrypt

Podobne dokumenty

Laborki 1 - Przemysław Juszczuk

JAK NARYSOWAĆ

Pytanie Póki co gry pełnią funkcję, powiedzmy "wspomagającą" w

Lab 12 - Przemysław Juszczuk

Sztuczna inteligencja: zbiory rozmyte