Równowaga Nasha
Transkrypt
Równowaga Nasha
Równowaga Nasha Równowaga Nasha – p. 1/14 Gra rankingowa I etap: Lisek i Dobromir niezależnie mówia˛ „pas” lub „gram”. pasuja˛ Dobromir i Lisek: Dobromir płaci Liskowi 100zł (i koniec gry); Dobromir pasuje a Lisek gra: Dobromir dostaje od Liska 100zł (i koniec); Dobromir gra a Lisek pasuje: Dobromir dostaje od Liska 500zł (i koniec); obaj graja: ˛ nastepny ˛ etap. II etap: j.w. III etap: j.w., ale jeśli obaj mówia˛ „gram”, to Dobromir płaci Liskowi 100zł (i koniec). Równowaga Nasha – p. 2/14 Rozgrzewka Polowanie: królik 5, niedźwiedź 20 (dla każdego). Wszyscy na niedźwiedzia: niedźwiedź złapany, nie wszyscy na niedźwiedzia: niedźwiedź na wolności. Królika każdy umie złapać sam. Równowaga Nasha – p. 3/14 Gry macierzowe vs gry dwumacierzowe W grach o sumie zerowej strategie bezpieczeństwa daja˛ najl. wypłaty w najgorszym przypadku. W grach o sumie zerowej str. bezp. sa˛ najlepszymi odpowiedziami na siebie nawzajem. Równowaga Nasha – p. 4/14 Gry macierzowe vs gry dwumacierzowe W grach o sumie zerowej strategie bezpieczeństwa daja˛ najl. wypłaty w najgorszym przypadku. W grach o sumie zerowej str. bezp. sa˛ najlepszymi odpowiedziami na siebie nawzajem. X A (1,-7) Y (0,0) Z (0,0) B (2,3) (1,2) (1,2) C (3,4) (-5,0) (0,-3) Równowaga Nasha – p. 4/14 John Nash (1928–2015) zdjecia ˛ - Wikipedia Równowaga Nasha – p. 5/14 John Nash (1928–2015) Nobel z ekonomii 1994 J. Harsanyi, J. Nash, R. Selten zdjecia ˛ - Wikipedia Równowaga Nasha – p. 5/14 Noble z ekonomii (teoria gier) 1978 Herbert Simon (USA): ewolucyjna teoria gier, teoria ograniczonej racjonalności 1994 John Nash (USA), Reinhard Selten (GER), John (János) Harsányi (HUN): teoria równowagi 1996 William Vickrey (USA), James Mirrlees (UK): modele przetargu, gry z niesymatryczna˛ informacja˛ 2005 Thomas Schelling (USA), Robert Aumann (Izrael): teoria gier w mikroekonomii i naukach społecznych 2007 Leonid Hurwicz (USA), Eric Maskin (USA), Roger Myerson (USA): gry z kreatorem (mechanism design) 2012 Lloyd Shapley (USA), Alvin Roth (USA): teoria skojarzeń stabilnych (nie t.gier, ale blisko) 2014 Jean Tirole (FRA): o rynku opanowanym przez duże firmy Równowaga Nasha – p. 6/14 Punkt równowagi Nasha Równowaga Nasha – p. 7/14 Punkt równowagi Nasha σ̄ = (σ1 , . . . , σn ) ∈ n Q Mi jest punktem równowagi Nasha i=1 (układem strategii w równowadze), gdy dla każdego i strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i . Równowaga Nasha – p. 7/14 Punkt równowagi Nasha σ̄ = (σ1 , . . . , σn ) ∈ n Q Mi jest punktem równowagi Nasha i=1 (układem strategii w równowadze), gdy dla każdego i strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i . Równoważnie: ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi Równowaga Nasha – p. 7/14 Punkt równowagi Nasha σ̄ = (σ1 , . . . , σn ) ∈ n Q Mi jest punktem równowagi Nasha i=1 (układem strategii w równowadze), gdy dla każdego i strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i . Równoważnie: ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi X A (1,4) B C (2,12) (0,9) Y (3,0) (1,2) (0,1) Z (1,12) (1,0) (5,3) Równowaga Nasha – p. 7/14 Punkt równowagi Nasha σ̄ = (σ1 , . . . , σn ) ∈ n Q Mi jest punktem równowagi Nasha i=1 (układem strategii w równowadze), gdy dla każdego i strategia σi jest najlepsza˛ odpowiedzia˛ na σ̄−i . Równoważnie: ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi X A (1,4) B C (2,12) (0,9) Y (3,0) (1,2) (0,1) Z (1,12) (1,0) (5,3) (X,B) - p. równowagi Nasha Dlaczego? Równowaga Nasha – p. 7/14 Punkty równowagi T T M (1,7) (0,0) M (0,0) (7,1) Równowaga Nasha – p. 8/14 Punkty równowagi T T M (1,7) (0,0) M (0,0) (7,1) σ1 = 1 7 8, 8 , σ2 = 7 1 8, 8 , (σ1 , σ2 ) – p.r. Nasha Dlaczego? Równowaga Nasha – p. 8/14 Punkty równowagi T T M (1,7) (0,0) M (0,0) (7,1) σ1 = 1 7 8, 8 , σ2 = 7 1 8, 8 , (σ1 , σ2 ) – p.r. Nasha Dlaczego? Polowanie: Równowaga Nasha – p. 8/14 Punkty równowagi T T M (1,7) (0,0) M (0,0) (7,1) σ1 = 1 7 8, 8 , σ2 = 7 1 8, 8 , (σ1 , σ2 ) – p.r. Nasha Dlaczego? Polowanie: (K, K, . . . , K) – p.r. Nasha Równowaga Nasha – p. 8/14 Punkty równowagi T T M (1,7) (0,0) M (0,0) (7,1) σ1 = 1 7 8, 8 , σ2 = 7 1 8, 8 , (σ1 , σ2 ) – p.r. Nasha Dlaczego? Polowanie: (K, K, . . . , K) – p.r. Nasha (N, N, . . . , N ) ? Równowaga Nasha – p. 8/14 Wady i zalety p.r. Nasha Zalety Równowaga Nasha – p. 9/14 Wady i zalety p.r. Nasha Zalety stabilny Równowaga Nasha – p. 9/14 Wady i zalety p.r. Nasha Zalety stabilny nie żal decyzji post factum Równowaga Nasha – p. 9/14 Wady i zalety p.r. Nasha Zalety stabilny nie żal decyzji post factum pojawia sie˛ czasem spontanicznie Równowaga Nasha – p. 9/14 Wady i zalety p.r. Nasha Zalety stabilny nie żal decyzji post factum pojawia sie˛ czasem spontanicznie T T M (1,7) (0,0) M (0,0) (7,1) ktoś wybrał σ2 = ( 78 , 18 ) Równowaga Nasha – p. 9/14 Wady i zalety p.r. Nasha Wady Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ P (-5,-5) N (0,-10) N (-10,0) (-1,-1) P Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ P (-5,-5) N (0,-10) N (-10,0) (-1,-1) P (P,P) – dominacja, Nash, nie Pareto Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ P (-5,-5) N (0,-10) N (-10,0) (-1,-1) P (P,P) – dominacja, Nash, nie Pareto (N,N) – Pareto, nie Nash Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ T T M (1,7) (0,0) M (0,0) (7,1) Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ L (9,9) P (-9,8) D (8,-9) (7,7) G Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ L (9,9) P (-9,8) D (8,-9) (7,7) G (G,L) – Nash, Pareto, najlepsze wypłaty, ale ryzyko Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ Polowanie: (N, N, . . . , N ) Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ Polowanie: (N, N, . . . , N ) – Nash, Pareto, najlepsze wypłaty, ale ryzyko Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ L (0,0,10) P (-5,-5,0) L P G (-2,-2,0) (-5,-5,0) D (-5,-5,0) (1,1,-5) D (-5,-5,0) (-1,-1,5) G X Y Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ L (0,0,10) P (-5,-5,0) L P G (-2,-2,0) (-5,-5,0) D (-5,-5,0) (1,1,-5) D (-5,-5,0) (-1,-1,5) G X Y (G,L,X) – Nash, Pareto (jedyny taki) Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ L (0,0,10) P (-5,-5,0) L P G (-2,-2,0) (-5,-5,0) D (-5,-5,0) (1,1,-5) D (-5,-5,0) (-1,-1,5) G X Y (G,L,X) – Nash, Pareto (jedyny taki) G L (0,0) P (-5,-5) D (-5,-5) (1,1) X Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ L (0,0,10) P (-5,-5,0) L P G (-2,-2,0) (-5,-5,0) D (-5,-5,0) (1,1,-5) D (-5,-5,0) (-1,-1,5) G X Y (G,L,X) – Nash, Pareto (jedyny taki) G L (0,0) P (-5,-5) D (-5,-5) (1,1) X Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ może być dużo nieprównywalnych punktów równowagi Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ może być dużo nieprównywalnych punktów równowagi Czy może nie być żadnego p.r. Nasha? Równowaga Nasha – p. 10/14 Wady i zalety p.r. Nasha Wady nie zawsze naturalny kandydat na „rozwiazanie” ˛ może być dużo nieprównywalnych punktów równowagi Czy może nie być żadnego p.r. Nasha? X A (4,4) B C (2,2) (0,13) Y (3,0) (0,0) (0,1) Z (1,12) (1,0) (5,3) Równowaga Nasha – p. 10/14 Twierdzenie Nasha Równowaga Nasha – p. 11/14 Twierdzenie Nasha Twierdzenie (Nash 1950). W każdej grze n–osobowej w n Q postaci normalnej istnieje punkt równowagi σ̄ ∈ Mi . i=1 Równowaga Nasha – p. 11/14 Poczatki ˛ badań p. równowagi Równowaga Nasha – p. 12/14 Poczatki ˛ badań p. równowagi XIX w.: modele duopolu Cournota i Bertranda Równowaga Nasha – p. 12/14 Poczatki ˛ badań p. równowagi XIX w.: modele duopolu Cournota i Bertranda 1944: John (János–>Johann–>John) von Neumann, Oskar Morgenstern „Games and economic behavior” – równowaga w grach o sumie zerowej Równowaga Nasha – p. 12/14 Poczatki ˛ badań p. równowagi XIX w.: modele duopolu Cournota i Bertranda 1944: John (János–>Johann–>John) von Neumann, Oskar Morgenstern „Games and economic behavior” – równowaga w grach o sumie zerowej ’50: John Nash Równowaga Nasha – p. 12/14 Punkty równowagi - własności ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi Równowaga Nasha – p. 13/14 Punkty równowagi - własności ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi (RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si (zamiast σi′ ∈ Mi ). Równowaga Nasha – p. 13/14 Punkty równowagi - własności ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi (RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si (zamiast σi′ ∈ Mi ). (RN2) Usuwanie strategii spoza Mbest nie zmienia zbioru i p.r. Nasha gry. Równowaga Nasha – p. 13/14 Punkty równowagi - własności ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi (RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si (zamiast σi′ ∈ Mi ). (RN2) Usuwanie strategii spoza Mbest nie zmienia zbioru i p.r. Nasha gry. (RN3) Usuwanie strategii zdominowanych nie zmienia zbioru p.r. Nasha. Równowaga Nasha – p. 13/14 Punkty równowagi - własności ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi (RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si (zamiast σi′ ∈ Mi ). (RN2) Usuwanie strategii spoza Mbest nie zmienia zbioru i p.r. Nasha gry. (RN3) Usuwanie strategii zdominowanych nie zmienia zbioru p.r. Nasha. (RN4) Po usuwanieciu ˛ strategii słabo zdominowanych, zbiór p.r. Nasha jest podzbiorem p.r. Nasha wyjściowej gry (i może sie˛ zmniejszyć). Równowaga Nasha – p. 13/14 Punkty równowagi - własności ∀ ∀ ′ wi (σ̄−i ; σi′ ) 6 wi (σ̄−i ; σi ) (∗) i σi ∈Mi (RN1) Warunek (∗) wystarczy sprawdzić dla wszystkich si ∈ Si (zamiast σi′ ∈ Mi ). (RN2) Usuwanie strategii spoza Mbest nie zmienia zbioru i p.r. Nasha gry. (RN3) Usuwanie strategii zdominowanych nie zmienia zbioru p.r. Nasha. (RN4) Po usuwanieciu ˛ strategii słabo zdominowanych, zbiór p.r. Nasha jest podzbiorem p.r. Nasha wyjściowej gry (i może sie˛ zmniejszyć). (RN5) W grach macierzowtych (σ1 , σ2 ) sa˛ p.r. Nasha wtedy i tylko wtedy, gdy σ1 , σ2 sa˛ optymalne. Równowaga Nasha – p. 13/14 Wyznaczanie wszystkich p.r. Nasha Przykład 1. X A (1,4) B C (2,12) (0,9) Y (3,0) (1,2) (0,1) Z (1,12) (1,0) (5,3) Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 1. X A (1,4) B C (2,12) (0,9) Y (3,0) (1,2) (0,1) Z (1,12) (1,0) (5,3) 2 1 A + 3 3B ≻C Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 1. X A (1,4) B (2,12) Y (3,0) (1,2) Z (1,12) (1,0) Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 1. X A (1,4) B (2,12) Y (3,0) (1,2) Z (1,12) (1,0) 1 2X + 21 Y ≻ Z Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 1. A B X (1,4) (2,12) Y (3,0) (1,2) Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 1. A B X (1,4) (2,12) Y (3,0) (1,2) B≻A Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 1. B X (2,12) Y (1,2) Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 1. B X (2,12) Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 2. T T M (1,7) (0,0) M (0,0) (7,1) Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 3. X A (4,4) B C (-2,2) (0,-1) Y (3,-1) (0,0) (0,-1) Z (1,12) (1,0) (5,-3) Równowaga Nasha – p. 14/14 Wyznaczanie wszystkich p.r. Nasha Przykład 3. X A (4,4) B (-2,2) Y (3,-1) (0,0) Z (1,12) (1,0) Równowaga Nasha – p. 14/14