1 - Instytut Matematyki

Transkrypt

1 - Instytut Matematyki
TEORIA GIER I ZASTOSOWANIA W
EKONOMII I BIOLOGII
Andrzej Szymanski
Slippery Rock University of PA
UNIWERSYTET J. KOCHANOWSKIEGO
Instytut Matematyki
9 grudnia, 2009
Streszczenie Referatu
Probka wynikow - najnowszyc h i starszych - otrzymanyc h
w teorii gier.
1. Wprowadze nie i przyklady gier niekoopera cyjnych i skonczonyc h.
2. Formalizac ja gier.
3 . Taktyki w graniu gier.
4. Twierdzeni a o istnieniu punktow rownowagi.
(a) Minimax.
(b) Punkty rownowagi Nasha.
6. Wprowadze nie i istnienie punktow ESS.
Zarys Historii Teorii Gier
Antoine Augustin Cournot (1801 - 1877)
Recherches sur les principes mathématiques de la
théorie des richesses, 1838. Oligopoly; w
szczegolnosci, duopoly
John von Neumann (1903 - 1957)
Theory of Games and Economic Behavior,
1944 (co-autor: Oscar Morgenstern). Gry
kooperacyjne; wczesniej, punkty minimax
Zarys Historii Teorii Gier
John Forbes Nash Jr. (1921 - )
Equilibrium points in N-person Games,
Proc. Nat. Sci. 36(1950), 48 – 49; Nashowski Punkt Rownowagi; Gry
niekooperacyjne; Nagroda Nobla z
Ekonomii, 1994
John Maynard Smith (1920 - 2004)
Evolution and the Theory of Games, 1982.
Strategia evolucyjnie stabilna, 1973; ESS;
Gry dynamiczne
Leonid Hurwicz (1917 - 2008)
Robert Yisrael Aumann (1930 - )
Nagroda Nobla z Ekonomii, 2005 i 2007
Zapisywanie Regul Gier: Przyklady
1. Orzel - Reszka
Dwoch graczy pokazuja sobie rownoczesn ie strony monety 1 - zl.
Jezeli wybrali te samy strony monety, nikt nie wygrywa.
Jezeli ktorys z graczy pokazal orla a drugi reszke, to orzel wy grywa i zabiera w nagrode zlotowke reszki.
Formalizac ja
Zbior graczy = {1,2}
Zbiory strategii : Gracz1 = X 1 = {O, R} Gracz 2 = X 2 = {O, R}
Zbior sytuacji : X 1 × X 2 = {OO, OR, RO , RR}
Funkcja wyplaty gracza 1 = f1 ; funkcja wyplaty gracza 2 = f 2
f1 (O , O ) = 0 , f1 (O , R ) = 1, f1 (R , O ) = − 1, f1 (R , R ) = 0
f 2 (O , O ) = 0, f 2 (O , R ) = − 1, f 2 (R , O ) = 1, f 2 (R , R ) = 0
2. Dylemat wieznia
Dwoch zlodziejas zkow ukradlo 10 kg zlota. Zostali zlapani i
umieszczen i w osobnych celach.
Jezeli obaj nie przyznaja sie do winy, beda uwolnieni (i beda
mogli rowno podzielic lup).
Jezeli ktorys z graczy przyzna sie a drugi nie, to przyznajac y be dzie uwolniony a drugi pojdzie do wiezienia na 6 lat.
Jezeli obaj przyznaja sie, to beda skazani tylko na 2 lata.
(I w miedzyczas ie ich zony roztrwonia 8 kg zlota).
Formalizac ja
Zbior graczy = {1,2}
Zbiory strategii : Gracz1 = X 1 = {P, N }
Gracz 2 = X 2 = {P, N }
Zbior sytuacji : X 1 × X 2 = {PP , PN , NP , NN }
Funkcja wyplaty gracza 1 = f1 ; funkcja wyplaty gracza 2 = f 2
f1 (P , P ) = 1, f1 (P , N ) = 10 , f1 ( N , P ) = − 6, f1 ( N , N ) = 5
f 2 (P , P ) = 1, f 2 (P , N ) = − 6, f 2 ( N , P ) = 10 , f 2 ( N , N ) = 5
Uwaga.
Dylemat wi eznia reprezentu je typ sytuacji w naukach socjal nych lub ekonomii okreslanyc h mianem wspolne dobro vs. dobro
jednostki
Formalizowanie i Zapisywanie Regul Gier
Uklad J , {X j }j∈ J , {f j }j∈ J nazywa sie skonczona gra niekoope racyjna gdy
• J = {1,2,.., n} jest skonczonym zbiorem graczy ; J < ∞
• X j , j ∈ J , jest zbiorem strategii gracza j , ktory jest skonczony.
• X = Π j∈ J X j = X 1 × X 2 × .. × X n jest zbiorem sytuacji ;
• f j jest funkcja wyplaty gracza j , t.j., f j : X → R , j ∈ J .
Gry Antagonistyczne
Uklad J , {X
j
} , {f }
j∈ J
j
j∈ J
nazywa sie gra antagonist yczna gdy
• J = {1,2}
• X 1 = {s1 , s 2 ,.., s n } jest zbiorem strategii gracza 1;
• X 2 = {t1 , t 2 ,.., t m } jest zbiorem strategii gracza 2;
• X = X 1 × X 2 = {(si , t j ) : i = 1, 2,.., n; j = 1, 2,.., m} zbior sytuacji ;
• f1 i f 2 sa funkcjami wyplaty graczy 1 i 2 spelniajac e warunek :
f1 + f 2 = 0
• Oznaczmy w artosci f1 i f 2 w nastepujac y sposob :
f1 (si , t j ) = aij
f 2 (si , t j ) = bij
i = 1, 2,.., n; j = 1, 2,.., m
[ ]
[ ]
0000
• Zatem wartosci funkcji f1 i f 2 mozna zakodowac przez macieze
wymiaru n × m A = aij oraz B = bij takie, ze A + B = .
Przyklad
• Funkcja wyplaty pierwszego gracza w pewnej grze antagonis tycznej zostala podana przez nastepujac a maciez A :
1 − 1
0
− 1 0
.
1


 1 − 1 0 
• Jest to zakodowana gra nazywana papier, kamien, nozyczki.
Taktyki w Grach Niekooperatywnych
• Przypomnij my, w nowym juz ujeciu, funkcje wyplaty graczy
z dylematu w ieznia .
P
N
P
N 


f1 =  P
1 10 
f 2 =  P 1 − 10 
 N − 10 5 
 N 10
5 
• Argument wieznia 1 : gdybym sie przyznal, tzn. gdybym uzyl
pierwszej strategii, to najgorsze co mnie spotka to wyplata 1;
Gdybym sie nie przyznal, to najgorsze co mnie spotka to wyplata - 10;
Z dwojga zlego, wybiore strategie P.
• Argument wieznia 2 : gdybym sie przyznal, to najgorsze co mnie
spotka to wyplata 1; gdybym sie nie przyznal moge wpasc na - 10.
Z dwojga zlego, wybiore strategie P.
• Niech funkcje wyplaty f1 i f 2 w grze skonczonej niekoopera cyjnej beda dane przez macieze A = [aij ] oraz B = [bij ] wymiaru n × m.
• Argument gracza 1 : rozwaz ri = min j aij a potem wybierz te
strategie si* dla ktorej zachodzi max i ri , t.j., ai* j = max i min j aij
• Argument gracza 2 : rozwaz k j = min i bij a potem wybierz te
strategie t j * dla ktorej zachodzi max j k j , t.j.,
Zatem aij ≤ ai* j dla kazdego i = 1, 2,.., n;
oraz bij ≤ bij * dla kazdego j = 1, 2,.., m.
bij * = max j min i bij
Punkty Rownowagi (= Equilibria)
Niech J , {X j }j∈J , {f j }j∈J bedzie skonczona gra niekoopera cyjna.
• Sytuacja (r1 , r2 ,.., rn ) ∈ X 1 × X 2 × .. × X n jest dopuszczal na dla
gracza k gdy f k (r1 , r2 ,.., rn ) ≥ f k (r1 ,.., rk −1 , s , rk +1 .., rn ) dla kazdego
s∈ Xk.
• Sytuacja (r1 , r2 ,.., rn ) ∈ X 1 × X 2 × .. × X n nazywana jest punktem
rownowagi gdy jest dopuszczal na dla kazdego z graczy, t.j., gdy
f k (r1 , r2 ,.., rn ) ≥ f k (r1 ,.., rk −1 , s , rk +1 .., rn ) dla kazdego s ∈ X k i dla
kazdego k = 1, 2,.., n.
Uwaga. Powyzszy koncept punktu rownowagi pochodzi od J. Nash - a.
Uwaga . (P , P ) jest sytuacja rownowagi dla gry Dylemat wieznia .
Istnienie Punktow Rownowagi w Grach Antagonistycznych
[ ]
• Niech gra antagonist yczna bedzie dana przez maciez A = aij .
Zatem f1 (si , t j ) = aij oraz f 2 (si , t j ) = − aij , i = 1, 2,.., n; j = 1, 2,.., m
Zalozmy, ze sytuacja (si* , t j * ) jest punktem rownowagi w tej grze.
Znaczy to, ze aij * ≤ ai* j * dla kazdego i = 1,2,.., n jak rowniez, ze
− ai* j ≤ − ai* j * dla kazdego j = 1, 2,.., m.
Tak wiec aij * ≤ ai* j * ≤ ai* j dla kazdego i = 1,2,.., n oraz j = 1,2,.., m.
Zatem ai* j * zachowuje sie jak punkt siodlowy wsrod elementow
maciezy A.
W konsekwenc ji, max i aij * = ai* j * = min j ai* j , co pociaga, ze
max i min j aij = min j max i aij .
Przyklady
• Czy w grze papier, kamien, nozyczki istnieje punkt rownowagi?
1 − 1
0
− 1 0

1


 1 − 1 0 
max i min j aij = −1
NIE
min j max i aij = 1
• Zbadaj czy w grze antagonist ycznej istnieje punkt rownowagi.
2 1
− 1 0

 3 1
1
− 1
1 
max i min j aij = 1
TAK (cztery! )
min j max i aij = 1
 a11
• Pokaz, ze w grze antagonist ycznej 
 a 21
rownowagi gdy a11 + a 22 = a12 + a 21 .
a12 
istnieje punkt

a 22 
Jak Grac Gdy Reguly Gry Nie Dopuszczaja Punktow
Rownowagi?
• Powiedzmy , ze gra antagonist yczna jest dana przez maciez
 3 − 2
 − 5 1  i jest grana wiel okrotnie.


• Przykladow o : Gra byla grana 100 razy. Gracz 1 uzyl 40 razy
strategie #1, a zatem, uzyl 60 razy strategie #2.
Gracz 2 uzyl 50 razy strategie #1 i 50 razy strategie #2.
Powiedzmy rowniez, ze gracz 1 i gracz 2 uzyli rownoczesn ie strategie
#1 20 razy. Oblicz wygrana/p rzegrana gracza 1.
20 × a11 + 20 × a12 + 30 a21 + 30 × a22 =
= 20 × 3 + 20 × (− 2 ) + 30 × (− 5) + 30 × 1 = −100
• Problem . Jaka takty ke ma uzyc gracz 1 by byla ona dla niego
dopuszczal na? Czy gracz 2 bedzie mial takowa rownoczesn ie?
Probabilistyczne Ujecie Gier Niekooperacyjnych
[ ]
• Niech gra antagonist yczna bedzie dana przez maciez A = aij .
i = 1, 2,.., n; j = 1, 2,.., m
W ciagu calego procesu grania, gracz 1 uzyl strategie s1 z prawdopo dobienstwe m p1 ; strategie s2 z prawdopodo bienstwem p2 ;.....
strategie sn z prawdopodo bienstwem pn .
Rownoczesn ie, gracz 2 uzyl strategie t1 z prawdopodo bienstwem q1 ;
strategie t2 z prawdopodo bienstwem q2 ;..... tm z prawdopod. qm .
Zatem pi , q j ≥ 0 oraz p1 + p2 + .. + pn = 1 = q1 + q2 + .. + qm
Probabilistyczne Ujecie Gier Niekooperacyjnych, c.d.
Formalnie, p = ( p1 , p2 ,.., pn ) jest nazywane rozkladem prawdopodo bienstwa zmiennej losowej G1;
Oraz, q = (q1 , q2 ,.., qm ) jest nazywane rozkladem prawdopodo bien stwa zmiennej losowej G2 .
Przy takim wyborze strategii przez obydwu graczy, oczekiwana sred nia wygrana/przegrana przez gracza 1 bedzie obliczana przez wzor :
E (G1 = p; G2 = q ) = a11 p1q1 + a12 p1q2 + .. + aij pi q j + .. + anm pn qm
E (G1 = p; G2 = q ) = ∑∑ aij pi q j
i
j
 3 − 2  Gra byla grana 100 razy.
•
.

 − 5 1  Gracz 1 uzyl 40 razy strategie #1 i 60 razy strategie #2.
Gracz 2 uzyl 50 razy strategie #1 i 50 razy strategie #2.
Wtedy : p1 = 0.4, p2 = 0.6
q1 = 0 . 5, q 2 = 0 . 5
E (G1 = p; G2 = q ) = a11 p1q1 + a12 p1q2 + a21 p2 q1 + a22 p2 q2 =
= 3 × 0 .4 × 0 .5 − 2 × 0 .4 × 0 .5 − 5 × 0 .6 × 0 . 5 + 1 × 0 .6 × 0 . 5 = − 1
Rozklady Prawdopodobienstwa Geometrycznie
1 •
•
1
Jednostkow y sympleks 1 - wymiarowy
∆1 = {( p1 , p2 ) : p1 + p2 = 1 oraz p1 , p2 ≥ 0}
Jednostkow y sympleks 2 - wymiarowy
∆2 = {( p1, p2 , p3 ) : p1 + p2 + p3 = 1 oraz p1, p2 , p3 ≥ 0}
Probabilistyczne Rozszerzenie Gier Niekooperacyjnych
Niech ∆k = {( p1, p2 ,.., pk +1 ) : p1 + p2 + ... + pk +1 = 1 oraz p1, p2 ,.., pk +1 ≥ 0}
oznacza k - wymiarowy sympleks jednostkow y.
Niech gra antagonist yczna bedzie dana przez maciez A = [aij ].
i = 1, 2,.., n; j = 1, 2,.., m
Rozszerzen iem probabilis tycznym powyzszej gry nazywa sie gre
antagonist yczna zdefiniowa na w nastepujac y sposob :
{∆
n −1
, ∆m −1 }, {F } , gdzie F : ∆n −1 × ∆m −1 → R jest dana przez formule :
F (p, q ) = ∑∑ aij pi q j
i
j
Rozumie sie, ze, p = ( p1 , p2 ,.., pn ) ∈ ∆n −1 i q = (q1 , q2 ,.., qm ) ∈ ∆m −1.
Punkty Rownowagi I Istnienie w Rozszerzeniach Gier
Antagonistycznych
Niech gra antagonistyczna bedzie dana przez maciez A = [aij ].
Niech {∆n −1 , ∆m −1}, {F } bedzie jej rozszerzen iem probabilis tycznym.
Sytuacja (p, q ) nazywa sie punktem rownowagi rozszerzen ia gdy
zachodzi : F (s, q ) ≤ F (p, q ) dla kazdego s ∈ ∆n −1 oraz
− F (p, t ) ≤ − F (p, q ) dla kazdego t ∈ ∆m −1 , t.j.,
F (s, q ) ≤ F (p, q ) ≤ F (p, t ) dla kazdego s ∈ ∆n −1 oraz t ∈ ∆m −1.
Twierdzenie Minimax von Neumanna, 1928
Dla rozszerzen ia probabilistycznego gry antagonistycznej zachodzi :
max x min y F (x, y ) = min y max x F (x, y ) = v
Kazda sytuacja (p , q ) dla ktorej F (p , q ) = v jest puntem rownowagi i
takowy zawsze istnieje.
Znajdywanie Puntow Rownowagi w Rozszerzeniach
• Podamy rozwiazani a wylaczni e dla rozszerzen gier antagonis  a11
tycznych danych przez maciez 
 a 21
a12 
.

a 22 
• Metoda Analitycz na. Zalozmy, ze reguly nie dopuszczaj a ist nienia punktu rownowagi, a wiec a11 + a 22 ≠ a12 + a 21 . Wtedy

a 22 − a 21
a 22 − a 21

p=
,1 −
a 22 − a 21 − a12 + a 22
 a 22 − a 21 − a12 + a 22




a 22 − a12
a 22 − a12
q = 
,1 −
a 22 − a 21 − a12 + a 22
 a 22 − a 21 − a12 + a 22



Twierdzenie Nasha
I. Niech G bedzie skonczona gra niekoopera cyjna.
1. W grze G uczestnicz y skonczona ilosc graczy g1 ,..., g n .
2. Kazdy z graczy g1 ,..., g n moze uzyc skonczenie wiele
tzw. czystych strategii; powiedzmy gracz g i ma ich ni .
3. Kazdemu z graczy g i jest przyporzadkowana funkcja
wyplaty f i : jezeli gracz g1 wybral czysta strategie s1 ,
gracz g 2 wybral czysta strategie s2 ,....., gracz g n wybral czysta
strategie sn , to wartosc wygranej/przegranej gracza g i jest
dana przez wartosc f i (s1 ,.., sn ).
II . Rozszerzen ie probabilis tyczne gry G.
1. Poniewaz gracze wybierali strategie niezalezni e od
siebie (gra G jest niekoopera cyjna! ), gracz g i otrzyma sred sowych niezalezny ch, t.j. Fi ( 1 ,..,
ssss
ssss
nia wygrana Fi jako wartosc oczekiwana dla n zmiennych lo n
) = E (g1 ,.., g n ).
ssss
2. Zanotujmy, ze kazda z funkcji Fi po ustaleniu wszyst kich procz i - tej zmiennej
i
staje sie funkcja liniowa ni
zmiennych.
Formalnie, rozszerzen ie gry G mozna opisac tak.
RRRR
Fi : ∆1 × ∆2 × ... × ∆n → , i = 1,2,.., n
ssss
Kazda z funkcji Fi jest ciagla oraz po ustaleniu wszyst kich procz i - tej zmiennej
i
staje sie funkcja liniowa ni
zmiennych; w szczegolno sci, bedzie funkcja quasi - wypukla.
tttt
ssss
ssss
tttt
Fi ( 1 ,..,
), ze dla kazdego i = 1, 2,.., n zachodzi :
i
n ) ≥ Fi ( 1 ,.., i −1 , i , i +1 ,.., n ), gdzie i ∈ ∆ .
ssss
n
ssss
,..,
ssss
1
ssss
(
ssss
ssss
Punktem rownowagi gry G nazywa sie taki punkt
Twierdzeni e Nasha. Gra G ma punkt rownowagi.
Isnienie Punktow Rownowagi Dla Oligopoli
Skonczona ilosc firm produkujaca pewien specyficzny towar zdo minowala calkowicie rynek na ten produkt.
Kazda z indywidual nych firm ma wplyw na ustalanie ceny
(przez zwiekszeni e/zmniejsz enie produkcji)
Firmy nie kooperuja i staraja sie zmaksymali zowac zysk.
Zalozmy rynek jest opanowany przez n firm i i − ta firma
dostarcza na rynek xi jednostek.
Cena jednostkow a zmienia sie liniowo ze wzgledu na cal kowita produkcje, t.j., p ( x1 ,.., x n ) = a − b ( x1 + .. + x n ).
Zysk i − tej firmy wyno si f i ( x1 ,.., x n ) = xi p ( x1 ,.., x n ) − ci ( xi ).
Zinterpretujmy powyzsza sytuacje jako nastepujaca gre :
Graczami sa firmy, tak wiec w grze uczestnicz y n graczy.
Zbior strategii X i = [0, M ], i = 1, 2,.., n.
Jako funkcje wyplaty i - tego gracza bierzemy f i .
Twierdzeni e. Gdy koszt produkcji jest jednakowy dla
kazdej z firm, to istnieje punkt rownowagi w powyzszej
grze postaci (d , d ,.., d ), gdzie d > 0 .
Przyklad Maynarda-Smitha
Rozpatrzmy nastepujac a gre dana przez maciez wyplaty dla
6
pierwszego gracza 
8
5
.

4
Zatem w grze uczestnicz y 2 graczy i kazdy z nich ma po dwie
strategie; nazwijmy je G i J .
Gracz 1, odnosmy sie don jako natura, a wartosc wyplaty jako
biologiczn a adaptowaln osc.
Tak wiec, gdy wynika sytuacja GG to nie walcza i wychowaja
po 6 potomkow.
Gdy wynika sytuacja GJ to jastrzab przepedza golebia i golab
wychowa tylko 5 potomkow natomiast jastrzab 8.
Przyklad Maynarda-Smitha, c.d.
Natomiast gdy wynika sytuacja JJ to walcza " az do zabicia" i w
rezultacie drugi jastrzab zostanie unicestwio ny i wychowa sie
tylko 4 potomkow.
Powiedzmy, ze poczatkowo terytoriu m jest okupowane przez 80%
golebi i 20 % jastrzebi.
Chcac obliczyc proporcje golebi do jastrzebi w nastepnej generacji,
pppp
qqqq
pppp
najpierw obliczylibysmy srednia ilosc miotu golebiego jako wartosc
qqqq
funkcji wyplaty pierwszego gracza w sytuacji ( , ), gdzie = (0.8,0.2 )
oraz = (1,0 )
qqqq
oraz = (0,1)
pppp
qqqq
pppp
natomiast srednia ilosc miotu jastrzebiego jako wartosc
funkcji wyplaty pierwszego gracza w sytuacji ( , ), gdzie = (0.8,0.2 )
qqqq
pppp
qqqq
pppp
Okazaloby sie, ze po wielu generacjac h proporcja golebi i jastrzebi
ustabilizo walaby sie jako ( , ), gdzie = = (2 / 3,1 / 3).
Jezeli funkcja f : X × X → R jest interpreto wana jako
funkcja biologiczn ej adaptowaln osci to punkt a ∈ X taki, ze
(i ) f (x , a ) ≤ f (a , a ) dla kazdego x ∈ X ;
(ii ) f (x , a ) = f (a , a ) pociaga, ze f (x , x ) < f (a , x )
nazywa sie strategia evolucyjni e stabilna , tzw. ESS.
Kazdy ESS jest punktem rownowagi Nasha.
W wielu jednak przypadkac h, punkt rownowagi Nasha nie
okazuje sie ESS' em. Tak jest n.p. w przypadku rozszerzen ia
probabilis tycznego gry papier, kamien, nozyczki .
Niech x = ( x1 , x 2 ,.., x n ) i y = ( y1 , y 2 ,.., y n ) naleza do
RRRR
Zbiory Wypukle
n
.
Odcinek laczacy x, y , [x, y ], sklada sie z punktow postaci tx + (1 − t ) y ,
RRRR
where 0 ≤ t ≤ 1.
Zbior S ⊆ n jest zbiorem wypuklym gdy [x , y ] ⊆ S dla dowol x, y ∈ S .
Przyklady
•
•
Obserwacja . Przeciecie dowolnej ilosci zbiorow wypuklych
jest zbiorem wypuklym.
Istnienie Symetrycznych Punktow Rownowagi
f : ∆n → R jest nazywana funkcja wklesla gdy {x : f ( x ) > t }
jest podzbiorem wypuklym sympleksu dla kazdego t ∈ R.
Twierdzeni e . Jezeli f : ∆n × ∆n → R jest funkcja ciagla oraz
wklesla ze wzgledu na pierwsza zmienna, to wtedy istnieje
punkt a ∈ X taki, ze f ( x , a ) ≤ f (a , a ) dla kazdego x ∈ X .

Podobne dokumenty