1 - Instytut Matematyki
Transkrypt
1 - Instytut Matematyki
TEORIA GIER I ZASTOSOWANIA W EKONOMII I BIOLOGII Andrzej Szymanski Slippery Rock University of PA UNIWERSYTET J. KOCHANOWSKIEGO Instytut Matematyki 9 grudnia, 2009 Streszczenie Referatu Probka wynikow - najnowszyc h i starszych - otrzymanyc h w teorii gier. 1. Wprowadze nie i przyklady gier niekoopera cyjnych i skonczonyc h. 2. Formalizac ja gier. 3 . Taktyki w graniu gier. 4. Twierdzeni a o istnieniu punktow rownowagi. (a) Minimax. (b) Punkty rownowagi Nasha. 6. Wprowadze nie i istnienie punktow ESS. Zarys Historii Teorii Gier Antoine Augustin Cournot (1801 - 1877) Recherches sur les principes mathématiques de la théorie des richesses, 1838. Oligopoly; w szczegolnosci, duopoly John von Neumann (1903 - 1957) Theory of Games and Economic Behavior, 1944 (co-autor: Oscar Morgenstern). Gry kooperacyjne; wczesniej, punkty minimax Zarys Historii Teorii Gier John Forbes Nash Jr. (1921 - ) Equilibrium points in N-person Games, Proc. Nat. Sci. 36(1950), 48 – 49; Nashowski Punkt Rownowagi; Gry niekooperacyjne; Nagroda Nobla z Ekonomii, 1994 John Maynard Smith (1920 - 2004) Evolution and the Theory of Games, 1982. Strategia evolucyjnie stabilna, 1973; ESS; Gry dynamiczne Leonid Hurwicz (1917 - 2008) Robert Yisrael Aumann (1930 - ) Nagroda Nobla z Ekonomii, 2005 i 2007 Zapisywanie Regul Gier: Przyklady 1. Orzel - Reszka Dwoch graczy pokazuja sobie rownoczesn ie strony monety 1 - zl. Jezeli wybrali te samy strony monety, nikt nie wygrywa. Jezeli ktorys z graczy pokazal orla a drugi reszke, to orzel wy grywa i zabiera w nagrode zlotowke reszki. Formalizac ja Zbior graczy = {1,2} Zbiory strategii : Gracz1 = X 1 = {O, R} Gracz 2 = X 2 = {O, R} Zbior sytuacji : X 1 × X 2 = {OO, OR, RO , RR} Funkcja wyplaty gracza 1 = f1 ; funkcja wyplaty gracza 2 = f 2 f1 (O , O ) = 0 , f1 (O , R ) = 1, f1 (R , O ) = − 1, f1 (R , R ) = 0 f 2 (O , O ) = 0, f 2 (O , R ) = − 1, f 2 (R , O ) = 1, f 2 (R , R ) = 0 2. Dylemat wieznia Dwoch zlodziejas zkow ukradlo 10 kg zlota. Zostali zlapani i umieszczen i w osobnych celach. Jezeli obaj nie przyznaja sie do winy, beda uwolnieni (i beda mogli rowno podzielic lup). Jezeli ktorys z graczy przyzna sie a drugi nie, to przyznajac y be dzie uwolniony a drugi pojdzie do wiezienia na 6 lat. Jezeli obaj przyznaja sie, to beda skazani tylko na 2 lata. (I w miedzyczas ie ich zony roztrwonia 8 kg zlota). Formalizac ja Zbior graczy = {1,2} Zbiory strategii : Gracz1 = X 1 = {P, N } Gracz 2 = X 2 = {P, N } Zbior sytuacji : X 1 × X 2 = {PP , PN , NP , NN } Funkcja wyplaty gracza 1 = f1 ; funkcja wyplaty gracza 2 = f 2 f1 (P , P ) = 1, f1 (P , N ) = 10 , f1 ( N , P ) = − 6, f1 ( N , N ) = 5 f 2 (P , P ) = 1, f 2 (P , N ) = − 6, f 2 ( N , P ) = 10 , f 2 ( N , N ) = 5 Uwaga. Dylemat wi eznia reprezentu je typ sytuacji w naukach socjal nych lub ekonomii okreslanyc h mianem wspolne dobro vs. dobro jednostki Formalizowanie i Zapisywanie Regul Gier Uklad J , {X j }j∈ J , {f j }j∈ J nazywa sie skonczona gra niekoope racyjna gdy • J = {1,2,.., n} jest skonczonym zbiorem graczy ; J < ∞ • X j , j ∈ J , jest zbiorem strategii gracza j , ktory jest skonczony. • X = Π j∈ J X j = X 1 × X 2 × .. × X n jest zbiorem sytuacji ; • f j jest funkcja wyplaty gracza j , t.j., f j : X → R , j ∈ J . Gry Antagonistyczne Uklad J , {X j } , {f } j∈ J j j∈ J nazywa sie gra antagonist yczna gdy • J = {1,2} • X 1 = {s1 , s 2 ,.., s n } jest zbiorem strategii gracza 1; • X 2 = {t1 , t 2 ,.., t m } jest zbiorem strategii gracza 2; • X = X 1 × X 2 = {(si , t j ) : i = 1, 2,.., n; j = 1, 2,.., m} zbior sytuacji ; • f1 i f 2 sa funkcjami wyplaty graczy 1 i 2 spelniajac e warunek : f1 + f 2 = 0 • Oznaczmy w artosci f1 i f 2 w nastepujac y sposob : f1 (si , t j ) = aij f 2 (si , t j ) = bij i = 1, 2,.., n; j = 1, 2,.., m [ ] [ ] 0000 • Zatem wartosci funkcji f1 i f 2 mozna zakodowac przez macieze wymiaru n × m A = aij oraz B = bij takie, ze A + B = . Przyklad • Funkcja wyplaty pierwszego gracza w pewnej grze antagonis tycznej zostala podana przez nastepujac a maciez A : 1 − 1 0 − 1 0 . 1 1 − 1 0 • Jest to zakodowana gra nazywana papier, kamien, nozyczki. Taktyki w Grach Niekooperatywnych • Przypomnij my, w nowym juz ujeciu, funkcje wyplaty graczy z dylematu w ieznia . P N P N f1 = P 1 10 f 2 = P 1 − 10 N − 10 5 N 10 5 • Argument wieznia 1 : gdybym sie przyznal, tzn. gdybym uzyl pierwszej strategii, to najgorsze co mnie spotka to wyplata 1; Gdybym sie nie przyznal, to najgorsze co mnie spotka to wyplata - 10; Z dwojga zlego, wybiore strategie P. • Argument wieznia 2 : gdybym sie przyznal, to najgorsze co mnie spotka to wyplata 1; gdybym sie nie przyznal moge wpasc na - 10. Z dwojga zlego, wybiore strategie P. • Niech funkcje wyplaty f1 i f 2 w grze skonczonej niekoopera cyjnej beda dane przez macieze A = [aij ] oraz B = [bij ] wymiaru n × m. • Argument gracza 1 : rozwaz ri = min j aij a potem wybierz te strategie si* dla ktorej zachodzi max i ri , t.j., ai* j = max i min j aij • Argument gracza 2 : rozwaz k j = min i bij a potem wybierz te strategie t j * dla ktorej zachodzi max j k j , t.j., Zatem aij ≤ ai* j dla kazdego i = 1, 2,.., n; oraz bij ≤ bij * dla kazdego j = 1, 2,.., m. bij * = max j min i bij Punkty Rownowagi (= Equilibria) Niech J , {X j }j∈J , {f j }j∈J bedzie skonczona gra niekoopera cyjna. • Sytuacja (r1 , r2 ,.., rn ) ∈ X 1 × X 2 × .. × X n jest dopuszczal na dla gracza k gdy f k (r1 , r2 ,.., rn ) ≥ f k (r1 ,.., rk −1 , s , rk +1 .., rn ) dla kazdego s∈ Xk. • Sytuacja (r1 , r2 ,.., rn ) ∈ X 1 × X 2 × .. × X n nazywana jest punktem rownowagi gdy jest dopuszczal na dla kazdego z graczy, t.j., gdy f k (r1 , r2 ,.., rn ) ≥ f k (r1 ,.., rk −1 , s , rk +1 .., rn ) dla kazdego s ∈ X k i dla kazdego k = 1, 2,.., n. Uwaga. Powyzszy koncept punktu rownowagi pochodzi od J. Nash - a. Uwaga . (P , P ) jest sytuacja rownowagi dla gry Dylemat wieznia . Istnienie Punktow Rownowagi w Grach Antagonistycznych [ ] • Niech gra antagonist yczna bedzie dana przez maciez A = aij . Zatem f1 (si , t j ) = aij oraz f 2 (si , t j ) = − aij , i = 1, 2,.., n; j = 1, 2,.., m Zalozmy, ze sytuacja (si* , t j * ) jest punktem rownowagi w tej grze. Znaczy to, ze aij * ≤ ai* j * dla kazdego i = 1,2,.., n jak rowniez, ze − ai* j ≤ − ai* j * dla kazdego j = 1, 2,.., m. Tak wiec aij * ≤ ai* j * ≤ ai* j dla kazdego i = 1,2,.., n oraz j = 1,2,.., m. Zatem ai* j * zachowuje sie jak punkt siodlowy wsrod elementow maciezy A. W konsekwenc ji, max i aij * = ai* j * = min j ai* j , co pociaga, ze max i min j aij = min j max i aij . Przyklady • Czy w grze papier, kamien, nozyczki istnieje punkt rownowagi? 1 − 1 0 − 1 0 1 1 − 1 0 max i min j aij = −1 NIE min j max i aij = 1 • Zbadaj czy w grze antagonist ycznej istnieje punkt rownowagi. 2 1 − 1 0 3 1 1 − 1 1 max i min j aij = 1 TAK (cztery! ) min j max i aij = 1 a11 • Pokaz, ze w grze antagonist ycznej a 21 rownowagi gdy a11 + a 22 = a12 + a 21 . a12 istnieje punkt a 22 Jak Grac Gdy Reguly Gry Nie Dopuszczaja Punktow Rownowagi? • Powiedzmy , ze gra antagonist yczna jest dana przez maciez 3 − 2 − 5 1 i jest grana wiel okrotnie. • Przykladow o : Gra byla grana 100 razy. Gracz 1 uzyl 40 razy strategie #1, a zatem, uzyl 60 razy strategie #2. Gracz 2 uzyl 50 razy strategie #1 i 50 razy strategie #2. Powiedzmy rowniez, ze gracz 1 i gracz 2 uzyli rownoczesn ie strategie #1 20 razy. Oblicz wygrana/p rzegrana gracza 1. 20 × a11 + 20 × a12 + 30 a21 + 30 × a22 = = 20 × 3 + 20 × (− 2 ) + 30 × (− 5) + 30 × 1 = −100 • Problem . Jaka takty ke ma uzyc gracz 1 by byla ona dla niego dopuszczal na? Czy gracz 2 bedzie mial takowa rownoczesn ie? Probabilistyczne Ujecie Gier Niekooperacyjnych [ ] • Niech gra antagonist yczna bedzie dana przez maciez A = aij . i = 1, 2,.., n; j = 1, 2,.., m W ciagu calego procesu grania, gracz 1 uzyl strategie s1 z prawdopo dobienstwe m p1 ; strategie s2 z prawdopodo bienstwem p2 ;..... strategie sn z prawdopodo bienstwem pn . Rownoczesn ie, gracz 2 uzyl strategie t1 z prawdopodo bienstwem q1 ; strategie t2 z prawdopodo bienstwem q2 ;..... tm z prawdopod. qm . Zatem pi , q j ≥ 0 oraz p1 + p2 + .. + pn = 1 = q1 + q2 + .. + qm Probabilistyczne Ujecie Gier Niekooperacyjnych, c.d. Formalnie, p = ( p1 , p2 ,.., pn ) jest nazywane rozkladem prawdopodo bienstwa zmiennej losowej G1; Oraz, q = (q1 , q2 ,.., qm ) jest nazywane rozkladem prawdopodo bien stwa zmiennej losowej G2 . Przy takim wyborze strategii przez obydwu graczy, oczekiwana sred nia wygrana/przegrana przez gracza 1 bedzie obliczana przez wzor : E (G1 = p; G2 = q ) = a11 p1q1 + a12 p1q2 + .. + aij pi q j + .. + anm pn qm E (G1 = p; G2 = q ) = ∑∑ aij pi q j i j 3 − 2 Gra byla grana 100 razy. • . − 5 1 Gracz 1 uzyl 40 razy strategie #1 i 60 razy strategie #2. Gracz 2 uzyl 50 razy strategie #1 i 50 razy strategie #2. Wtedy : p1 = 0.4, p2 = 0.6 q1 = 0 . 5, q 2 = 0 . 5 E (G1 = p; G2 = q ) = a11 p1q1 + a12 p1q2 + a21 p2 q1 + a22 p2 q2 = = 3 × 0 .4 × 0 .5 − 2 × 0 .4 × 0 .5 − 5 × 0 .6 × 0 . 5 + 1 × 0 .6 × 0 . 5 = − 1 Rozklady Prawdopodobienstwa Geometrycznie 1 • • 1 Jednostkow y sympleks 1 - wymiarowy ∆1 = {( p1 , p2 ) : p1 + p2 = 1 oraz p1 , p2 ≥ 0} Jednostkow y sympleks 2 - wymiarowy ∆2 = {( p1, p2 , p3 ) : p1 + p2 + p3 = 1 oraz p1, p2 , p3 ≥ 0} Probabilistyczne Rozszerzenie Gier Niekooperacyjnych Niech ∆k = {( p1, p2 ,.., pk +1 ) : p1 + p2 + ... + pk +1 = 1 oraz p1, p2 ,.., pk +1 ≥ 0} oznacza k - wymiarowy sympleks jednostkow y. Niech gra antagonist yczna bedzie dana przez maciez A = [aij ]. i = 1, 2,.., n; j = 1, 2,.., m Rozszerzen iem probabilis tycznym powyzszej gry nazywa sie gre antagonist yczna zdefiniowa na w nastepujac y sposob : {∆ n −1 , ∆m −1 }, {F } , gdzie F : ∆n −1 × ∆m −1 → R jest dana przez formule : F (p, q ) = ∑∑ aij pi q j i j Rozumie sie, ze, p = ( p1 , p2 ,.., pn ) ∈ ∆n −1 i q = (q1 , q2 ,.., qm ) ∈ ∆m −1. Punkty Rownowagi I Istnienie w Rozszerzeniach Gier Antagonistycznych Niech gra antagonistyczna bedzie dana przez maciez A = [aij ]. Niech {∆n −1 , ∆m −1}, {F } bedzie jej rozszerzen iem probabilis tycznym. Sytuacja (p, q ) nazywa sie punktem rownowagi rozszerzen ia gdy zachodzi : F (s, q ) ≤ F (p, q ) dla kazdego s ∈ ∆n −1 oraz − F (p, t ) ≤ − F (p, q ) dla kazdego t ∈ ∆m −1 , t.j., F (s, q ) ≤ F (p, q ) ≤ F (p, t ) dla kazdego s ∈ ∆n −1 oraz t ∈ ∆m −1. Twierdzenie Minimax von Neumanna, 1928 Dla rozszerzen ia probabilistycznego gry antagonistycznej zachodzi : max x min y F (x, y ) = min y max x F (x, y ) = v Kazda sytuacja (p , q ) dla ktorej F (p , q ) = v jest puntem rownowagi i takowy zawsze istnieje. Znajdywanie Puntow Rownowagi w Rozszerzeniach • Podamy rozwiazani a wylaczni e dla rozszerzen gier antagonis a11 tycznych danych przez maciez a 21 a12 . a 22 • Metoda Analitycz na. Zalozmy, ze reguly nie dopuszczaj a ist nienia punktu rownowagi, a wiec a11 + a 22 ≠ a12 + a 21 . Wtedy a 22 − a 21 a 22 − a 21 p= ,1 − a 22 − a 21 − a12 + a 22 a 22 − a 21 − a12 + a 22 a 22 − a12 a 22 − a12 q = ,1 − a 22 − a 21 − a12 + a 22 a 22 − a 21 − a12 + a 22 Twierdzenie Nasha I. Niech G bedzie skonczona gra niekoopera cyjna. 1. W grze G uczestnicz y skonczona ilosc graczy g1 ,..., g n . 2. Kazdy z graczy g1 ,..., g n moze uzyc skonczenie wiele tzw. czystych strategii; powiedzmy gracz g i ma ich ni . 3. Kazdemu z graczy g i jest przyporzadkowana funkcja wyplaty f i : jezeli gracz g1 wybral czysta strategie s1 , gracz g 2 wybral czysta strategie s2 ,....., gracz g n wybral czysta strategie sn , to wartosc wygranej/przegranej gracza g i jest dana przez wartosc f i (s1 ,.., sn ). II . Rozszerzen ie probabilis tyczne gry G. 1. Poniewaz gracze wybierali strategie niezalezni e od siebie (gra G jest niekoopera cyjna! ), gracz g i otrzyma sred sowych niezalezny ch, t.j. Fi ( 1 ,.., ssss ssss nia wygrana Fi jako wartosc oczekiwana dla n zmiennych lo n ) = E (g1 ,.., g n ). ssss 2. Zanotujmy, ze kazda z funkcji Fi po ustaleniu wszyst kich procz i - tej zmiennej i staje sie funkcja liniowa ni zmiennych. Formalnie, rozszerzen ie gry G mozna opisac tak. RRRR Fi : ∆1 × ∆2 × ... × ∆n → , i = 1,2,.., n ssss Kazda z funkcji Fi jest ciagla oraz po ustaleniu wszyst kich procz i - tej zmiennej i staje sie funkcja liniowa ni zmiennych; w szczegolno sci, bedzie funkcja quasi - wypukla. tttt ssss ssss tttt Fi ( 1 ,.., ), ze dla kazdego i = 1, 2,.., n zachodzi : i n ) ≥ Fi ( 1 ,.., i −1 , i , i +1 ,.., n ), gdzie i ∈ ∆ . ssss n ssss ,.., ssss 1 ssss ( ssss ssss Punktem rownowagi gry G nazywa sie taki punkt Twierdzeni e Nasha. Gra G ma punkt rownowagi. Isnienie Punktow Rownowagi Dla Oligopoli Skonczona ilosc firm produkujaca pewien specyficzny towar zdo minowala calkowicie rynek na ten produkt. Kazda z indywidual nych firm ma wplyw na ustalanie ceny (przez zwiekszeni e/zmniejsz enie produkcji) Firmy nie kooperuja i staraja sie zmaksymali zowac zysk. Zalozmy rynek jest opanowany przez n firm i i − ta firma dostarcza na rynek xi jednostek. Cena jednostkow a zmienia sie liniowo ze wzgledu na cal kowita produkcje, t.j., p ( x1 ,.., x n ) = a − b ( x1 + .. + x n ). Zysk i − tej firmy wyno si f i ( x1 ,.., x n ) = xi p ( x1 ,.., x n ) − ci ( xi ). Zinterpretujmy powyzsza sytuacje jako nastepujaca gre : Graczami sa firmy, tak wiec w grze uczestnicz y n graczy. Zbior strategii X i = [0, M ], i = 1, 2,.., n. Jako funkcje wyplaty i - tego gracza bierzemy f i . Twierdzeni e. Gdy koszt produkcji jest jednakowy dla kazdej z firm, to istnieje punkt rownowagi w powyzszej grze postaci (d , d ,.., d ), gdzie d > 0 . Przyklad Maynarda-Smitha Rozpatrzmy nastepujac a gre dana przez maciez wyplaty dla 6 pierwszego gracza 8 5 . 4 Zatem w grze uczestnicz y 2 graczy i kazdy z nich ma po dwie strategie; nazwijmy je G i J . Gracz 1, odnosmy sie don jako natura, a wartosc wyplaty jako biologiczn a adaptowaln osc. Tak wiec, gdy wynika sytuacja GG to nie walcza i wychowaja po 6 potomkow. Gdy wynika sytuacja GJ to jastrzab przepedza golebia i golab wychowa tylko 5 potomkow natomiast jastrzab 8. Przyklad Maynarda-Smitha, c.d. Natomiast gdy wynika sytuacja JJ to walcza " az do zabicia" i w rezultacie drugi jastrzab zostanie unicestwio ny i wychowa sie tylko 4 potomkow. Powiedzmy, ze poczatkowo terytoriu m jest okupowane przez 80% golebi i 20 % jastrzebi. Chcac obliczyc proporcje golebi do jastrzebi w nastepnej generacji, pppp qqqq pppp najpierw obliczylibysmy srednia ilosc miotu golebiego jako wartosc qqqq funkcji wyplaty pierwszego gracza w sytuacji ( , ), gdzie = (0.8,0.2 ) oraz = (1,0 ) qqqq oraz = (0,1) pppp qqqq pppp natomiast srednia ilosc miotu jastrzebiego jako wartosc funkcji wyplaty pierwszego gracza w sytuacji ( , ), gdzie = (0.8,0.2 ) qqqq pppp qqqq pppp Okazaloby sie, ze po wielu generacjac h proporcja golebi i jastrzebi ustabilizo walaby sie jako ( , ), gdzie = = (2 / 3,1 / 3). Jezeli funkcja f : X × X → R jest interpreto wana jako funkcja biologiczn ej adaptowaln osci to punkt a ∈ X taki, ze (i ) f (x , a ) ≤ f (a , a ) dla kazdego x ∈ X ; (ii ) f (x , a ) = f (a , a ) pociaga, ze f (x , x ) < f (a , x ) nazywa sie strategia evolucyjni e stabilna , tzw. ESS. Kazdy ESS jest punktem rownowagi Nasha. W wielu jednak przypadkac h, punkt rownowagi Nasha nie okazuje sie ESS' em. Tak jest n.p. w przypadku rozszerzen ia probabilis tycznego gry papier, kamien, nozyczki . Niech x = ( x1 , x 2 ,.., x n ) i y = ( y1 , y 2 ,.., y n ) naleza do RRRR Zbiory Wypukle n . Odcinek laczacy x, y , [x, y ], sklada sie z punktow postaci tx + (1 − t ) y , RRRR where 0 ≤ t ≤ 1. Zbior S ⊆ n jest zbiorem wypuklym gdy [x , y ] ⊆ S dla dowol x, y ∈ S . Przyklady • • Obserwacja . Przeciecie dowolnej ilosci zbiorow wypuklych jest zbiorem wypuklym. Istnienie Symetrycznych Punktow Rownowagi f : ∆n → R jest nazywana funkcja wklesla gdy {x : f ( x ) > t } jest podzbiorem wypuklym sympleksu dla kazdego t ∈ R. Twierdzeni e . Jezeli f : ∆n × ∆n → R jest funkcja ciagla oraz wklesla ze wzgledu na pierwsza zmienna, to wtedy istnieje punkt a ∈ X taki, ze f ( x , a ) ≤ f (a , a ) dla kazdego x ∈ X .