Teoria gier - Przemysław Juszczuk
Transkrypt
Teoria gier - Przemysław Juszczuk
Teoria gier mgr Przemysław Juszczuk Instytut Informatyki Uniwersytetu Śląskiego Wykład 5 - Równowagi w grach n-osobowych mgr Przemysław Juszczuk Teoria gier Figure: Podział gier mgr Przemysław Juszczuk Teoria gier Definicje Formalnie, jednoetapowa gra w postaci strategicznej dla n graczy definiowana jest jako: Γ = hN, {Ai }, Mi, i = 1, 2, ..., n gdzie: N = {1, 2, ..., n} jest zbiorem graczy; {Ai } jest skończonym zbiorem strategii dla gracza i o m strategiach; M = {µ1 , µ2 , ..., µn } to zbiór funkcji wypłat dla graczy. mgr Przemysław Juszczuk Teoria gier Układ strategii Przez a = (~a1 , ...,~an ) oznaczmy profil strategii mieszanych wszystkich graczy, określany dalej jako układ strategii. a−i = (~a1 , ...,~ai−1 ,~ai+1 , ...,~an ), będzie układem strategii z wyłączeniem gracza i. Mieszana strategia gracza i określana jest jako: ~ai = (P(ai1 ), P(ai2 ), ..., P(aim )), gdzie P(ai1 ) prawdopodobieństwo wyboru strategii 1 przez gracza i, natomiast ~ai oznacza tutaj dyskretny rozkład prawdopodobieństwa nad zbiorem strategii. Wsparcie Wsparcie strategii mieszanych jest podzbiorem zbioru strategii czystych danego gracza mających niezerowe prawdopodobieństwo wyboru: ∀i , xi ∈ Mx , P(xi ) > 0 mgr Przemysław Juszczuk Teoria gier strategie A1 A2 B1 B2 1,4 0,6 4 , 1 -1 , -1 Table: Prosta gra 2-osobowa Równowaga Nasha w grze n-osobowej jest układem strategii, w którym żaden z graczy znając strategię przeciwników nie zyskuje odstępując od wybranej strategii. Figure: Graficzna reprezentacja równowagi Nasha mgr Przemysław Juszczuk Teoria gier Równowaga Nasha Mieszana równowaga Nasha definiowana jest następująco: ∀i , ∀j , µi (a) µi (aij , a−i ), gdzie: i - oznacza i-tego gracza; j - jest numerem strategii danego gracza; µi (a) - wypłata i-tego gracza dla profilu strategii a; µi (aij , a−i ) - wypłata i gracza stosującego strategię j przeciwko a−i . mgr Przemysław Juszczuk Teoria gier Figure: Równowaga Nasha - klasa złożoności FP = FNP jeżeli P = NP mgr Przemysław Juszczuk Teoria gier Figure: Przykład gry 3 osobowej mgr Przemysław Juszczuk Teoria gier Figure: Liczba graczy a wielkość macierzy mgr Przemysław Juszczuk Teoria gier Typy równowag równowaga Nasha; równowaga Nasha - zwana także równowagą; równowaga skorelowana - bardziej ogólna niż Nash; równowaga Pareto - równowaga Nasha z najwyższą wypłatą dla graczy; Trembling hand equilibrium - równowaga „drżącej ręki” - założenie, że gracz może przez nieuwagę zagrać strategię z zerowym prawdopodobieństwem wyboru; idealna równowaga w podgrach - w grach w postaci ekstensywnej; -Well supported Nash - równowaga, w której każda strategia ma niezerowe prawdopodobieństwo wyboru. mgr Przemysław Juszczuk Teoria gier Typy równowag cd Silna równowaga Nasha (ang. Coalition Proof Social Equilibrium) określana także jako CPSE (stosowana w teorii głosowania). Często pomijana w rozważaniach jako zbyt trudna do uzyskania. Punkty ogniskowe (zwane także punktem Schellinga) - punkt równowagi w grach koordynacyjnych. Równowagi Nasha z dodatkowymi właściwościami (zaproponowane przez Gilboę) dotyczą pareto równowagi Nasha, równowagi, w której gracze zobligowani są do stosowania z góry założonej strategii, lub też prawdopodobieństwo wyboru danej strategii nie może być niższe (nie może przekroczyć) konkretnej wartości. Powyższe koncepcje należą do klasy złożoności NP. mgr Przemysław Juszczuk Teoria gier Figure: Zależność pomiędzy równowagami mgr Przemysław Juszczuk Teoria gier Figure: Program Gamut java −jar gamut.jar −g GraphicalGame−RG −players 3 −randomparams −normalize −minpayoff 0 −maxpayoff 1 −f game.nfg −output GambitOutput −actions 3 mgr Przemysław Juszczuk Teoria gier Figure: Program Gambit - główne okno programu mgr Przemysław Juszczuk Teoria gier Gry: Dylemat więźnia; Gra w cykora; Oligopol Bertranda; Zgadnij 32 ze średniej; Dylemat podróżnika; Klasy gier: Gra bimacierzowa; Gra koordynacyjna; Kowariancja; Gra losowa; Gra losowa znormalizowana; Figure: Przykład dylematu więźnia oraz gry losowej mgr Przemysław Juszczuk Teoria gier strategie a1 a2 a3 a4 b1 0.2 0.4 0.1 0.5 , , , , b2 0.6 0.1 0.5 0.4 0.1 0.5 0.9 0.7 , , , , b3 0.7 0.3 0.4 0.9 0.4 0.5 0.9 0.1 , , , , b4 0.8 0.7 0.3 0.6 Table: Prosta gra 2-osobowa Równowaga Nasha: {0 : 14 : 34 : 0 : Wypłaty graczy to: 0.443 i 0.4. mgr Przemysław Juszczuk 4 7 :0: 3 7 : 0} Teoria gier 0.3 0.2 0.8 0.1 , , , , 0.5 0.7 0.1 0.6 strategie a1 a2 a3 a4 b1 0.2 0.4 0.1 0.5 , , , , b2 0.6 0.1 0.5 0.4 0.1 0.5 0.9 0.7 , , , , b3 0.7 0.3 0.4 0.9 0.4 0.5 0.9 0.1 , , , , b4 0.8 0.7 0.3 0.6 0.3 0.2 0.8 0.1 , , , , 0.5 0.7 0.1 0.6 Table: Prosta gra 2-osobowa Dla układu: 1 3 2 4 1 3 2 4 { 10 : 10 : 10 : 10 : 10 : 10 : 10 : 10 } Po 3 losowych grach: a2 b1 , a4 b4 , a2 b1 wypłaty graczy: 0.3 i 0.26 wynosi: 0.36 Figure: Wybór strategii mgr Przemysław Juszczuk Teoria gier strategie a1 a2 a3 a4 b1 0.2 0.4 0.1 0.5 , , , , b2 0.6 0.1 0.5 0.4 0.1 0.5 0.9 0.7 , , , , b3 0.7 0.3 0.4 0.9 0.4 0.5 0.9 0.1 , , , , b4 0.8 0.7 0.3 0.6 0.3 0.2 0.8 0.1 , , , , 0.5 0.7 0.1 0.6 Table: Prosta gra 2-osobowa Dla układu: 1 3 2 4 1 3 2 4 { 10 : 10 : 10 : 10 : 10 : 10 : 10 : 10 } Po 3 innych losowych grach: a2 b2 , a4 b3 , a2 b1 wypłaty graczy: 0.333 i 0.3666 Figure: Wybór strategii mgr Przemysław Juszczuk Teoria gier Algorytmy dla gier 2-osobowych Lemke Howson; algorytmy przybliżone; Algorytm Scarfa; Algorytmy dla gier n-osobowych Simplicial Subdivision; Globalna metoda Newtona; Metaheurystyki w wyszukiwaniu czystych równowag; Algorytm przybliżony oparty na ewolucji różnicowej; mgr Przemysław Juszczuk Teoria gier Co na następnym wykładzie? Dylemat więźnia; Iterowany dylemat więźnia i turniej Axelroda; Gry przeciwko naturze; Gry Bayesowskie; Gry kooperacyjne. mgr Przemysław Juszczuk Teoria gier Dziękuję za uwagę. mgr Przemysław Juszczuk Teoria gier