Równowaga Nasha

Transkrypt

Równowaga Nasha
Równowaga Nasha
Równowaga Nasha – p. 1/14
Gra rankingowa
I etap:
Lisek i Dobromir niezależnie mówia˛ „pas” lub „gram”.
pasuja˛ Dobromir i Lisek: Dobromir płaci Liskowi
100zł (i koniec gry);
Dobromir pasuje a Lisek gra: Dobromir dostaje od
Liska 100zł (i koniec);
Dobromir gra a Lisek pasuje: Dobromir dostaje od
Liska 500zł (i koniec);
obaj graja:
˛ nastepny
˛
etap.
II etap: j.w.
III etap: j.w., ale jeśli obaj mówia˛ „gram”, to Dobromir
płaci Liskowi 100zł (i koniec).
Równowaga Nasha – p. 2/14
Rozgrzewka
Polowanie: królik 5, niedźwiedź 20 (dla każdego).
Wszyscy na niedźwiedzia: niedźwiedź złapany,
nie wszyscy na niedźwiedzia: niedźwiedź na wolności.
Królika każdy umie złapać sam.
Równowaga Nasha – p. 3/14
Gry macierzowe vs gry dwumacierzowe
W grach o sumie zerowej strategie bezpieczeństwa
daja˛ najl. wypłaty w najgorszym przypadku.
W grach o sumie zerowej str. bezp. sa˛ najlepszymi
odpowiedziami na siebie nawzajem.
Równowaga Nasha – p. 4/14
Gry macierzowe vs gry dwumacierzowe
W grach o sumie zerowej strategie bezpieczeństwa
daja˛ najl. wypłaty w najgorszym przypadku.
W grach o sumie zerowej str. bezp. sa˛ najlepszymi
odpowiedziami na siebie nawzajem.
X
A (1,-7)
Y
(0,0)
Z
(0,0)
B
(2,3)
(1,2)
(1,2)
C
(3,4)
(-5,0) (0,-3)
Równowaga Nasha – p. 4/14
John Nash (1928–2015)
zdjecia
˛
- Wikipedia
Równowaga Nasha – p. 5/14
John Nash (1928–2015)
Nobel z ekonomii 1994
J. Harsanyi, J. Nash, R. Selten
zdjecia
˛
- Wikipedia
Równowaga Nasha – p. 5/14
Noble z ekonomii (teoria gier)
1978 Herbert Simon (USA): ewolucyjna teoria gier,
teoria ograniczonej racjonalności
1994 John Nash (USA), Reinhard Selten (GER), John
(János) Harsányi (HUN): teoria równowagi
1996 William Vickrey (USA), James Mirrlees (UK):
modele przetargu, gry z niesymatryczna˛ informacja˛
2005 Thomas Schelling (USA), Robert Aumann (Izrael):
teoria gier w mikroekonomii i naukach społecznych
2007 Leonid Hurwicz (USA), Eric Maskin (USA), Roger
Myerson (USA): gry z kreatorem (mechanism design)
2012 Lloyd Shapley (USA), Alvin Roth (USA): teoria
skojarzeń stabilnych (nie t.gier, ale blisko)
2014 Jean Tirole (FRA): o rynku opanowanym przez
duże firmy
Równowaga Nasha – p. 6/14
Punkt równowagi Nasha
Równowaga Nasha – p. 7/14
Punkt równowagi Nasha
σ̄ = (σ1 , . . . , σn ) ∈
n
Q
Mi jest punktem równowagi Nasha
i=1
(układem strategii w równowadze), gdy dla każdego i
strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i .
Równowaga Nasha – p. 7/14
Punkt równowagi Nasha
σ̄ = (σ1 , . . . , σn ) ∈
n
Q
Mi jest punktem równowagi Nasha
i=1
(układem strategii w równowadze), gdy dla każdego i
strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i .
Równoważnie:
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
Równowaga Nasha – p. 7/14
Punkt równowagi Nasha
σ̄ = (σ1 , . . . , σn ) ∈
n
Q
Mi jest punktem równowagi Nasha
i=1
(układem strategii w równowadze), gdy dla każdego i
strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i .
Równoważnie:
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
X
A
(1,4)
B
C
(2,12) (0,9)
Y
(3,0)
(1,2)
(0,1)
Z (1,12)
(1,0)
(5,3)
Równowaga Nasha – p. 7/14
Punkt równowagi Nasha
σ̄ = (σ1 , . . . , σn ) ∈
n
Q
Mi jest punktem równowagi Nasha
i=1
(układem strategii w równowadze), gdy dla każdego i
strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i .
Równoważnie:
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
X
A
(1,4)
B
C
(2,12) (0,9)
Y
(3,0)
(1,2)
(0,1)
Z (1,12)
(1,0)
(5,3)
(X,B) - p. równowagi Nasha
Dlaczego?
Równowaga Nasha – p. 7/14
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
Równowaga Nasha – p. 8/14
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
σ1 =
1 7
8, 8
, σ2 =
7 1
8, 8
,
(σ1 , σ2 ) – p.r. Nasha
Dlaczego?
Równowaga Nasha – p. 8/14
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
σ1 =
1 7
8, 8
, σ2 =
7 1
8, 8
,
(σ1 , σ2 ) – p.r. Nasha
Dlaczego?
Polowanie:
Równowaga Nasha – p. 8/14
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
σ1 =
1 7
8, 8
, σ2 =
7 1
8, 8
,
(σ1 , σ2 ) – p.r. Nasha
Dlaczego?
Polowanie: (K, K, . . . , K) – p.r. Nasha
Równowaga Nasha – p. 8/14
Punkty równowagi
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
σ1 =
1 7
8, 8
, σ2 =
7 1
8, 8
,
(σ1 , σ2 ) – p.r. Nasha
Dlaczego?
Polowanie: (K, K, . . . , K) – p.r. Nasha
(N, N, . . . , N ) ?
Równowaga Nasha – p. 8/14
Wady i zalety p.r. Nasha
Zalety
Równowaga Nasha – p. 9/14
Wady i zalety p.r. Nasha
Zalety
stabilny
Równowaga Nasha – p. 9/14
Wady i zalety p.r. Nasha
Zalety
stabilny
nie żal decyzji post factum
Równowaga Nasha – p. 9/14
Wady i zalety p.r. Nasha
Zalety
stabilny
nie żal decyzji post factum
pojawia sie˛ czasem spontanicznie
Równowaga Nasha – p. 9/14
Wady i zalety p.r. Nasha
Zalety
stabilny
nie żal decyzji post factum
pojawia sie˛ czasem spontanicznie
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
ktoś wybrał σ2 = ( 78 , 18 )
Równowaga Nasha – p. 9/14
Wady i zalety p.r. Nasha
Wady
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
P
(-5,-5)
N
(0,-10)
N (-10,0)
(-1,-1)
P
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
P
(-5,-5)
N
(0,-10)
N (-10,0)
(-1,-1)
P
(P,P) – dominacja, Nash, nie Pareto
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
P
(-5,-5)
N
(0,-10)
N (-10,0)
(-1,-1)
P
(P,P) – dominacja, Nash, nie Pareto
(N,N) – Pareto, nie Nash
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
L
(9,9)
P
(-9,8)
D (8,-9)
(7,7)
G
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
L
(9,9)
P
(-9,8)
D (8,-9)
(7,7)
G
(G,L) – Nash, Pareto, najlepsze wypłaty, ale ryzyko
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
Polowanie: (N, N, . . . , N )
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
Polowanie: (N, N, . . . , N ) – Nash, Pareto, najlepsze
wypłaty, ale ryzyko
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
L
(0,0,10)
P
(-5,-5,0)
L
P
G (-2,-2,0) (-5,-5,0)
D (-5,-5,0)
(1,1,-5)
D (-5,-5,0) (-1,-1,5)
G
X
Y
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
L
(0,0,10)
P
(-5,-5,0)
L
P
G (-2,-2,0) (-5,-5,0)
D (-5,-5,0)
(1,1,-5)
D (-5,-5,0) (-1,-1,5)
G
X
Y
(G,L,X) – Nash, Pareto (jedyny taki)
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
L
(0,0,10)
P
(-5,-5,0)
L
P
G (-2,-2,0) (-5,-5,0)
D (-5,-5,0)
(1,1,-5)
D (-5,-5,0) (-1,-1,5)
G
X
Y
(G,L,X) – Nash, Pareto (jedyny taki)
G
L
(0,0)
P
(-5,-5)
D (-5,-5)
(1,1)
X
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
L
(0,0,10)
P
(-5,-5,0)
L
P
G (-2,-2,0) (-5,-5,0)
D (-5,-5,0)
(1,1,-5)
D (-5,-5,0) (-1,-1,5)
G
X
Y
(G,L,X) – Nash, Pareto (jedyny taki)
G
L
(0,0)
P
(-5,-5)
D (-5,-5)
(1,1)
X
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
może być dużo nieprównywalnych punktów
równowagi
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
może być dużo nieprównywalnych punktów
równowagi
Czy może nie być żadnego p.r. Nasha?
Równowaga Nasha – p. 10/14
Wady i zalety p.r. Nasha
Wady
nie zawsze naturalny kandydat na „rozwiazanie”
˛
może być dużo nieprównywalnych punktów
równowagi
Czy może nie być żadnego p.r. Nasha?
X
A
(4,4)
B
C
(2,2) (0,13)
Y
(3,0)
(0,0)
(0,1)
Z (1,12) (1,0)
(5,3)
Równowaga Nasha – p. 10/14
Twierdzenie Nasha
Równowaga Nasha – p. 11/14
Twierdzenie Nasha
Twierdzenie (Nash 1950). W każdej grze n–osobowej w
n
Q
postaci normalnej istnieje punkt równowagi σ̄ ∈
Mi .
i=1
Równowaga Nasha – p. 11/14
Poczatki
˛ badań p. równowagi
Równowaga Nasha – p. 12/14
Poczatki
˛ badań p. równowagi
XIX w.: modele duopolu Cournota i Bertranda
Równowaga Nasha – p. 12/14
Poczatki
˛ badań p. równowagi
XIX w.: modele duopolu Cournota i Bertranda
1944: John (János–>Johann–>John) von Neumann,
Oskar Morgenstern „Games and economic behavior” –
równowaga w grach o sumie zerowej
Równowaga Nasha – p. 12/14
Poczatki
˛ badań p. równowagi
XIX w.: modele duopolu Cournota i Bertranda
1944: John (János–>Johann–>John) von Neumann,
Oskar Morgenstern „Games and economic behavior” –
równowaga w grach o sumie zerowej
’50: John Nash
Równowaga Nasha – p. 12/14
Punkty równowagi - własności
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
Równowaga Nasha – p. 13/14
Punkty równowagi - własności
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
(RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si
(zamiast σi′ ∈ Mi ).
Równowaga Nasha – p. 13/14
Punkty równowagi - własności
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
(RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si
(zamiast σi′ ∈ Mi ).
(RN2) Usuwanie strategii spoza Mbest
nie zmienia zbioru
i
p.r. Nasha gry.
Równowaga Nasha – p. 13/14
Punkty równowagi - własności
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
(RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si
(zamiast σi′ ∈ Mi ).
(RN2) Usuwanie strategii spoza Mbest
nie zmienia zbioru
i
p.r. Nasha gry.
(RN3) Usuwanie strategii zdominowanych nie zmienia zbioru
p.r. Nasha.
Równowaga Nasha – p. 13/14
Punkty równowagi - własności
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
(RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si
(zamiast σi′ ∈ Mi ).
(RN2) Usuwanie strategii spoza Mbest
nie zmienia zbioru
i
p.r. Nasha gry.
(RN3) Usuwanie strategii zdominowanych nie zmienia zbioru
p.r. Nasha.
(RN4) Po usuwanieciu
˛
strategii słabo zdominowanych, zbiór
p.r. Nasha jest podzbiorem p.r. Nasha wyjściowej gry (i
może sie˛ zmniejszyć).
Równowaga Nasha – p. 13/14
Punkty równowagi - własności
∀
∀
′
wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi )
(∗)
i σi ∈Mi
(RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si
(zamiast σi′ ∈ Mi ).
(RN2) Usuwanie strategii spoza Mbest
nie zmienia zbioru
i
p.r. Nasha gry.
(RN3) Usuwanie strategii zdominowanych nie zmienia zbioru
p.r. Nasha.
(RN4) Po usuwanieciu
˛
strategii słabo zdominowanych, zbiór
p.r. Nasha jest podzbiorem p.r. Nasha wyjściowej gry (i
może sie˛ zmniejszyć).
(RN5) W grach macierzowtych (σ1 , σ2 ) sa˛ p.r. Nasha wtedy i
tylko wtedy, gdy σ1 , σ2 sa˛ optymalne.
Równowaga Nasha – p. 13/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
X
A
(1,4)
B
C
(2,12) (0,9)
Y
(3,0)
(1,2)
(0,1)
Z (1,12)
(1,0)
(5,3)
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
X
A
(1,4)
B
C
(2,12) (0,9)
Y
(3,0)
(1,2)
(0,1)
Z (1,12)
(1,0)
(5,3)
2
1
A
+
3
3B
≻C
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
X
A
(1,4)
B
(2,12)
Y
(3,0)
(1,2)
Z (1,12)
(1,0)
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
X
A
(1,4)
B
(2,12)
Y
(3,0)
(1,2)
Z (1,12)
(1,0)
1
2X
+ 21 Y ≻ Z
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
A
B
X (1,4) (2,12)
Y (3,0)
(1,2)
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
A
B
X (1,4) (2,12)
Y (3,0)
(1,2)
B≻A
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
B
X (2,12)
Y
(1,2)
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 1.
B
X (2,12)
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 2.
T
T
M
(1,7) (0,0)
M (0,0) (7,1)
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 3.
X
A
(4,4)
B
C
(-2,2) (0,-1)
Y
(3,-1)
(0,0)
(0,-1)
Z (1,12)
(1,0)
(5,-3)
Równowaga Nasha – p. 14/14
Wyznaczanie wszystkich p.r. Nasha
Przykład 3.
X
A
(4,4)
B
(-2,2)
Y
(3,-1)
(0,0)
Z (1,12)
(1,0)
Równowaga Nasha – p. 14/14

Podobne dokumenty