Równowaga Nasha

Transkrypt

Równowaga Nasha

Równowaga Nasha
Równowaga Nasha – p. 1/14
Gra rankingowa
I etap:
Lisek i Dobromir niezależnie mówia˛ „pas” lub „gram”.
pasuja˛ Dobromir i Lisek: Dobromir płaci Liskowi
100zł (i koniec gry);
Dobromir pasuje a Lisek gra: Dobromir dostaje od
Liska 100zł (i koniec);
Dobromir gra a Lisek pasuje: Dobromir dostaje od
Liska 500zł (i koniec);
obaj graja:
˛ nastepny
˛
etap.
II etap: j.w.
III etap: j.w., ale jeśli obaj mówia˛ „gram”, to Dobromir
płaci Liskowi 100zł (i koniec).
Rozgrzewka
Polowanie: królik 5, niedźwiedź 20 (dla każdego).
Wszyscy na niedźwiedzia: niedźwiedź złapany,
nie wszyscy na niedźwiedzia: niedźwiedź na wolności.
Królika każdy umie złapać sam.
Gry macierzowe vs gry dwumacierzowe
W grach o sumie zerowej strategie bezpieczeństwa
daja˛ najl. wypłaty w najgorszym przypadku.
W grach o sumie zerowej str. bezp. sa˛ najlepszymi
odpowiedziami na siebie nawzajem.
Gry macierzowe vs gry dwumacierzowe
W grach o sumie zerowej strategie bezpieczeństwa
daja˛ najl. wypłaty w najgorszym przypadku.
W grach o sumie zerowej str. bezp. sa˛ najlepszymi
odpowiedziami na siebie nawzajem.
X
A (1,-7)
Y
(0,0)
Z
(0,0)
B
(2,3)
(1,2)
(1,2)
C
(3,4)
(-5,0) (0,-3)
John Nash (1928–2015)
zdjecia
˛
- Wikipedia
John Nash (1928–2015)
Nobel z ekonomii 1994
J. Harsanyi, J. Nash, R. Selten
zdjecia
˛
- Wikipedia
Noble z ekonomii (teoria gier)
1978 Herbert Simon (USA): ewolucyjna teoria gier,
teoria ograniczonej racjonalności
1994 John Nash (USA), Reinhard Selten (GER), John
(János) Harsányi (HUN): teoria równowagi
1996 William Vickrey (USA), James Mirrlees (UK):
modele przetargu, gry z niesymatryczna˛ informacja˛
2005 Thomas Schelling (USA), Robert Aumann (Izrael):
teoria gier w mikroekonomii i naukach społecznych
2007 Leonid Hurwicz (USA), Eric Maskin (USA), Roger
Myerson (USA): gry z kreatorem (mechanism design)
2012 Lloyd Shapley (USA), Alvin Roth (USA): teoria
skojarzeń stabilnych (nie t.gier, ale blisko)
2014 Jean Tirole (FRA): o rynku opanowanym przez
duże firmy
Punkt równowagi Nasha
σ̄ = (σ1 , . . . , σn ) ∈
n
Q
Mi jest punktem równowagi Nasha
i=1
(układem strategii w równowadze), gdy dla każdego i
strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i .
σ̄ = (σ1 , . . . , σn ) ∈
n
Q
i=1
Równoważnie:
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
σ̄ = (σ1 , . . . , σn ) ∈
n
Q
i=1
Równoważnie:
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
X
A
(1,4)
B
C
(2,12) (0,9)
Y
(3,0)
(1,2)
(0,1)
Z (1,12)
(1,0)
(5,3)
σ̄ = (σ1 , . . . , σn ) ∈
n
Q
i=1
Równoważnie:
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
X
A
(1,4)
B
C
(2,12) (0,9)
Y
(3,0)
(1,2)
(0,1)
Z (1,12)
(1,0)
(5,3)
(X,B) - p. równowagi Nasha
Dlaczego?
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
σ1 =
1 7
8, 8
, σ2 =
7 1
8, 8
,
(σ1 , σ2 ) – p.r. Nasha
Dlaczego?
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
σ1 =
1 7
8, 8
, σ2 =
7 1
8, 8
,
(σ1 , σ2 ) – p.r. Nasha
Dlaczego?
Polowanie:
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
σ1 =
1 7
8, 8
, σ2 =
7 1
8, 8
,
(σ1 , σ2 ) – p.r. Nasha
Dlaczego?
Polowanie: (K, K, . . . , K) – p.r. Nasha
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
σ1 =
1 7
8, 8
, σ2 =
7 1
8, 8
,
(σ1 , σ2 ) – p.r. Nasha
Dlaczego?
Polowanie: (K, K, . . . , K) – p.r. Nasha
(N, N, . . . , N ) ?
Wady i zalety p.r. Nasha
Zalety
Zalety
stabilny
Zalety
stabilny
nie żal decyzji post factum
Zalety
stabilny
pojawia sie˛ czasem spontanicznie
Zalety
stabilny
pojawia sie˛ czasem spontanicznie
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
ktoś wybrał σ2 = ( 78 , 18 )
Wady
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
Wady
˛
P
(-5,-5)
N
(0,-10)
N (-10,0)
(-1,-1)
P
Wady
˛
P
(-5,-5)
N
(0,-10)
N (-10,0)
(-1,-1)
P
(P,P) – dominacja, Nash, nie Pareto
Wady
˛
P
(-5,-5)
N
(0,-10)
N (-10,0)
(-1,-1)
P
(P,P) – dominacja, Nash, nie Pareto
(N,N) – Pareto, nie Nash
Wady
˛
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
Wady
˛
L
(9,9)
P
(-9,8)
D (8,-9)
(7,7)
G
Wady
˛
L
(9,9)
P
(-9,8)
D (8,-9)
(7,7)
G
(G,L) – Nash, Pareto, najlepsze wypłaty, ale ryzyko
Wady
˛
Polowanie: (N, N, . . . , N )
Wady
˛
Polowanie: (N, N, . . . , N ) – Nash, Pareto, najlepsze
wypłaty, ale ryzyko
Wady
˛
L
(0,0,10)
P
(-5,-5,0)
L
P
G (-2,-2,0) (-5,-5,0)
D (-5,-5,0)
(1,1,-5)
D (-5,-5,0) (-1,-1,5)
G
X
Y
Wady
˛
L
(0,0,10)
P
(-5,-5,0)
L
P
G (-2,-2,0) (-5,-5,0)
D (-5,-5,0)
(1,1,-5)
D (-5,-5,0) (-1,-1,5)
G
X
Y
(G,L,X) – Nash, Pareto (jedyny taki)
Wady
˛
L
(0,0,10)
P
(-5,-5,0)
L
P
G (-2,-2,0) (-5,-5,0)
D (-5,-5,0)
(1,1,-5)
D (-5,-5,0) (-1,-1,5)
G
X
Y
G
L
(0,0)
P
(-5,-5)
D (-5,-5)
(1,1)
X
Wady
˛
L
(0,0,10)
P
(-5,-5,0)
L
P
G (-2,-2,0) (-5,-5,0)
D (-5,-5,0)
(1,1,-5)
D (-5,-5,0) (-1,-1,5)
G
X
Y
G
L
(0,0)
P
(-5,-5)
D (-5,-5)
(1,1)
X
Wady
˛
Wady
˛
może być dużo nieprównywalnych punktów
równowagi
Wady
˛
równowagi
Czy może nie być żadnego p.r. Nasha?
Wady
˛
równowagi
Czy może nie być żadnego p.r. Nasha?
X
A
(4,4)
B
C
(2,2) (0,13)
Y
(3,0)
(0,0)
(0,1)
Z (1,12) (1,0)
(5,3)
Twierdzenie Nasha
Twierdzenie Nasha
Twierdzenie (Nash 1950). W każdej grze n–osobowej w
n
Q
postaci normalnej istnieje punkt równowagi σ̄ ∈
Mi .
i=1
Poczatki
˛ badań p. równowagi
Poczatki
XIX w.: modele duopolu Cournota i Bertranda
Poczatki
1944: John (János–>Johann–>John) von Neumann,
Oskar Morgenstern „Games and economic behavior” –
równowaga w grach o sumie zerowej
Poczatki
1944: John (János–>Johann–>John) von Neumann,
Oskar Morgenstern „Games and economic behavior” –
równowaga w grach o sumie zerowej
’50: John Nash
Punkty równowagi - własności
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
(RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si
(zamiast σi′ ∈ Mi ).
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
(RN2) Usuwanie strategii spoza Mbest
nie zmienia zbioru
i
p.r. Nasha gry.
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
nie zmienia zbioru
i
p.r. Nasha gry.
(RN3) Usuwanie strategii zdominowanych nie zmienia zbioru
p.r. Nasha.
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
nie zmienia zbioru
i
p.r. Nasha gry.
p.r. Nasha.
(RN4) Po usuwanieciu
˛
strategii słabo zdominowanych, zbiór
p.r. Nasha jest podzbiorem p.r. Nasha wyjściowej gry (i
może sie˛ zmniejszyć).
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
nie zmienia zbioru
i
p.r. Nasha gry.
p.r. Nasha.
(RN4) Po usuwanieciu
˛
strategii słabo zdominowanych, zbiór
p.r. Nasha jest podzbiorem p.r. Nasha wyjściowej gry (i
może sie˛ zmniejszyć).
(RN5) W grach macierzowtych (σ1 , σ2 ) sa˛ p.r. Nasha wtedy i
tylko wtedy, gdy σ1 , σ2 sa˛ optymalne.
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
X
A
(1,4)
B
C
(2,12) (0,9)
Y
(3,0)
(1,2)
(0,1)
Z (1,12)
(1,0)
(5,3)
Przykład 1.
X
A
(1,4)
B
C
(2,12) (0,9)
Y
(3,0)
(1,2)
(0,1)
Z (1,12)
(1,0)
(5,3)
2
1
A
+
3
3B
≻C
Przykład 1.
X
A
(1,4)
B
(2,12)
Y
(3,0)
(1,2)
Z (1,12)
(1,0)
Przykład 1.
X
A
(1,4)
B
(2,12)
Y
(3,0)
(1,2)
Z (1,12)
(1,0)
1
2X
+ 21 Y ≻ Z
Przykład 1.
A
B
X (1,4) (2,12)
Y (3,0)
(1,2)
Przykład 1.
A
B
X (1,4) (2,12)
Y (3,0)
(1,2)
B≻A
Przykład 1.
B
X (2,12)
Y
(1,2)
Przykład 1.
B
X (2,12)
Przykład 2.
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
Przykład 3.
X
A
(4,4)
B
C
(-2,2) (0,-1)
Y
(3,-1)
(0,0)
(0,-1)
Z (1,12)
(1,0)
(5,-3)
Przykład 3.
X
A
(4,4)
B
(-2,2)
Y
(3,-1)
(0,0)
Z (1,12)
(1,0)

Równowaga Nasha

Transkrypt

Podobne dokumenty

spis_tresci - Wydawnictwo Naukowe Scholar

Wydrukuj tekst

slajdy 3

stary egzamin 1

PS3

Wykład 5

Szkicowe rozwiązania i wskazówki dotyczące przykładowych zadań