teoria gier w ekonomii - Wydział Matematyki i Informatyki UŁ

Transkrypt

teoria gier w ekonomii - Wydział Matematyki i Informatyki UŁ
TEORIA GIER
W EKONOMII
WYKŁAD 5: GRY DWUOSOBOWE
NIEKOOPERACYJNE O SUMIE DOWOLNEJ
dr Robert Kowalczyk
Katedra Analizy Nieliniowej
Wydział Matematyki i Informatyki UŁ
Gry dwumacierzowe
Skończoną grą dwuosobową o sumie dowolnej
nazywamy parę macierzy [ai,j] oraz [bi,j] o
wymiarach mxn lub równoważnie macierz (A,B) o
wymiarach
mxn,
której
elementami
są
uporządkowane pary (ai,j,bi,j). Elementy ai,j oraz
ai,j,bi,j oznaczają, odpowiednio wypłaty (w
jednostkach użyteczności ) graczy I oraz II, przy
założeniu, że stosują oni, odpowiednio, i-tą i j-tą
strategię czystą. Gra w tej postaci nazywa się też
grą dwumacierzową.
Rozróżniamy
dwa
dwumacierzowych:
przypadki

niekooperacyjne (bez współpracy),

kooperacyjne (ze współpracą).
gier
(a1,1,b1,1)
(a1,2,b1,2)
(a1,3,b1,3)
(a2,1,b2,1)
(a2,2,b2,2)
(a2,3,b2,3)
Strategie mieszane i punkty równowagi
Przez strategie mieszane graczy I i II rozumiemy, odpowiednio, m-wymiarowe i nwymiarowe wektory x=(x1, x2,…,xm) i y =(y1, y2,…,yn) nieujemnych liczb, których
suma wynosi 1.
Powiemy, że para strategii mieszanych (x*,y*) gry dwumacierzowej (A,B) jest w
równowadze, jeśli dla wszystkich innych strategii mieszanych x i y zachodzą
nierówności:
xAy*t≤x*Ay*t
oraz
x*Byt≤x*By*.
Twierdzenie (Nash)
Każda gra dwumacierzowa o sumie niestałej ma co najmniej jedną parę strategii w
równowadze.
Czy para strategii w równowadze to rozwiązanie gry?
A
B
A
(3,3)
(0,4)
B
(4,0)
(1,1)
Para strategii (B,B) jest w
równowadze. Wypłata (1,1)
odpowiadająca tej strategii nie
jest wypłatą optymalną. Lepiej
było wybrać parę strategii
(A,A) i wypłatę (3,3).
A
B
A
(4,1)
(0,0)
B
(0,0)
(1,4)
Pary strategii (A,A) oraz
(B,B) są w równowadze
jednak nie są one wymienne
ani nie dają tych samych
wypłat. Gracze nie potrafią
zdecydować którą ze strategii
wybrać.
A
B
A
(2,2)
(2,2)
B
(2,2)
(2,2)
Pary strategii (A,A), (A,B),
(B,A)
i
(B,B)
są
w
równowadze. Są wymienne i
dają te same wypłaty. Każda
z nich jest rozwiązaniem gry.
Kryterium Pareto
Powiemy, że wynik gry (wypłata) jest optymalny w sensie Pareto
(paretooptymalny) jeżeli nie ma w grze innego wyniku (wypłaty), który byłby dla
jednego gracza wyższy a dla drugiego nie niższy.
Najczęściej przyjmujemy, że gra dwuosobowa o sumie niezerowej jest
rozwiązywalna, gdy:

ma co najmniej jedną równowagę Nasha,

wypłata odpowiadająca tej równowadze jest optymalna w sensie Pareto,

równowagi są wymienne i prowadzą do wypłat o tej samej wartości.
Rozwiązaniem gry (o ile istnieje) można nazwać każdą z równowag (strategii
mieszanych (x*,y*)) spełniających powyższe warunki.
Punkty równowagi a strategie dominujące
A
B
A
(2,3)
(3,2)
B
(1,0)
(0,1)
Jeżeli gracz I zagra strategię A (dominuje ona strategię B gdyż 2>1 oraz 3>0), to
gracz II powinien wybrać strategię A, żeby wygrać więcej 3>2. Rozwiązaniem jest
zatem para strategii (A,A), które jak łatwo zauważyć są w równowadze.
Oczywiście w tym przypadku wypłata odpowiadająca tej parze strategii jest
optymalna w sensie Pareto.
Gry bez równowagi w strategiach czystych (strategie
wyrównujące)
A
B
A
(2,4)
(1,0)
B
(3,1)
(0,4)
W tej grze nie ma równowagi (w strategiach czystych). Brak również strategii dominujących.
Szukamy najpierw strategii (x1,x2) dla gracza I (tzw. strategii wyrównującej). tzn. gracz I patrzy
na grę gracza II i wybiera tak wektor (x1,x2) aby gracz II niezależnie od tego czy zagra A czy B
to osiągnął ten sam zysk.
Dostajemy zatem układ równań:
4x1+x2= 0x1+4x2
x1+x2= 1.
Gra gracza I
A
B
Szukamy teraz strategii (y1,y2) dla gracza II (tzw. strategii wyrównującej). tzn. gracz II patrzy
na grę gracza I i wybiera tak wektor (y1,y2) aby gracz II niezależnie od tego czy zagra A czy B
to osiągnął ten sam zysk.
A
2
1
Dostajemy zatem układ równań
B
3
0
Gra gracza
II
A
B
A
4
0
B
1
4
Strategia dla gracza I jest zatem postaci (3/7A,4/7B). Gracz II wygra wtedy 16/7.
2y1+y2= 3y1+0y2
y1+y2= 1.
Strategia dla gracza II jest zatem postaci (1/2A,1/2B). Gracz I wygra wtedy 3/2.
Oczywiście wartość gry (3/2,16/7) odpowiadająca tej równowadze nie jest optymalna w sensie
Pareto (więcej byśmy uzyskali wybierając np. parę strategii (A,A)).
Strategie bezpieczeństwa
A
B
A
(2,4)
(1,0)
B
(3,1)
(0,4)
W tej grze nie ma równowagi (w strategiach czystych). Brak również
strategii dominujących.
Gracz I obawiając się, że gracz II będzie minimalizował jego wypłatę
sam stara się minimalizować swoje straty. Zagra zatem w swojej grze
strategię minimaksową (tzw. strategią bezpieczeństwa). Ponieważ jego
gra ma punkt siodłowy, więc zagra strategię A. Wówczas dostanie on
wypłatę co najmniej 1 (jest to jego tzw. poziom bezpieczeństwa).
Gracz II obawiając się, że gracz I będzie minimalizował jego wypłatę
sam stara się minimalizować swoje straty. Zagra zatem w swojej grze
strategię minimaksową (tzw. strategię bezpieczeństwa). Ponieważ jego
gra nie ma punktu siodłowego szukamy jego strategii mieszanej.
Dostajemy strategię (4/7A,3/7B) i wartość gry gracza II 16/7 (jest to
jego tzw. poziom bezpieczeństwa).
Obydwaj gracze powinni zatem zagrać strategię 4/7AA+3/7AB i
wówczas ich wypłata będzie równa (11/7,16/7). Ten punkt też nie jest
jednak optymalny w sensie Pareto (można dostać więcej grając na
przykład (A,A)).
Gra gracza I
A
B
A
2
1
B
3
0
Gra gracza
II
A
B
A
4
0
B
1
4
Strategie kontrbezpieczeństwa
Rozpatrzmy jeszcze raz grę z poprzedniego slajdu.
Jeżeli gracz I gra swoją strategię bezpieczeństwa (rozgrywa swoją grę
metodą minimax), to wybierze strategię A. Jeżeli gracz II to przewidzi, to też
zagra strategię A. Wówczas gracz I dostaje wypłatę 2, a gracz II wypłatę 4,
co jest dla każdego z nich korzystniejsze niż granie przez każdego z nich
swoich strategii bezpieczeństwa.
Jeżeli z kolei gracz II gra swoją strategię bezpieczeństwa (rozgrywa swoją
grę metodą minimax), to wybierze strategię mieszaną (4/7A,3/7B) i wówczas
jego wygrana wyniesie 16/7. Jeżeli gracz I to przewidzi, to obliczy swoje
wypłaty dla swojej strategii A i strategii B:
gracz I gra A: 4/7*2+3/7*1=11/7
A
B
A
(2,4)
(1,0)
B
(3,1)
(0,4)
Gra gracza I
A
B
A
2
1
B
3
0
Gra gracza
II
A
B
A
4
0
B
1
4
gracz I gra B: 4/7*3+3/7*0=12/7
Gracz I powinien zatem wybrać strategię B i wówczas dostanie12/7. To
rozwiązanie (12/7,16/7) jest oczywiście lepsze dla obu graczy niż granie
przez każdego z nich ich strategii bezpieczeństwa.
Strategię najlepszej odpowiedzi na strategię bezpieczeństwa przeciwnika
nazywamy strategią kontrbezpieczeństwa.
O grach 2x2
Można wykazać, że każda gra dwuosobowa 2×2 o sumie niezerowej
spełnia jeden z poniższych warunków:

ma jedną równowagę,

ma dwie równowagi w strategiach czystych,
ma trzy równowagi: dwie w strategiach czystych i jedną w
strategiach mieszanych,

ma nieskończenie wiele równowag w tym: dwie, trzy lub cztery w
strategiach czystych.

Którą zatem z nich wybrać jeśli jest ich więcej niż jedna?
Którą równowaga najlepsza?
Harsányi i Selten zaproponowali sposób wyboru „najlepszej”
równowagi dla gier 2×2, w których występują dwie równowagi w
strategiach czystych położone na przekątnej tablicy wypłat oraz jedna
równowaga w strategiach mieszanych.
Reguła Seltena i Harsányi:
 ze wszystkich równowag gracze powinni wybrać równowagę
dominującą ze względu na wypłaty,
 jeżeli nie ma równowagi dominującej ze względu na wypłaty,
gracze powinni wybrać równowagę dominującą ze względu na ryzyko.
Równowaga dominująca ze względu na wypłaty
Powiemy, że równowaga Nasha dominuje ze względu na wypłaty
jeśli wypłata każdego z graczy (dla tej równowagi) jest największa
ze zbioru wypłat danego gracza dla wszystkich innych równowag
Nasha (czystych lub mieszanych).
A
B
A
(8,6)
(2,2)
6-2=4
1/3
B
(2,2)
(6,4)
4-2=2
2/3
8-2=6
6-2=4
2/5
3/5
10/3
22/5
Optymalną strategią jest strategia czysta (A,A).
Gracz I dostaje wypłatę 8 (8>6 i 8>22/5).
Gracz II dostaje wypłatę 6 (6>4 i 6>10/3).
Strategie (A,A) jest strategią dominującą ze
względu na wypłaty.
Równowaga dominująca ze względu na ryzyko
Powiemy, że równowaga Nasha dominuje ze względu na ryzko jeśli
odznacza się najmniejszym ryzykiem związanym z wyborem
poszczególnych strategii.
A
B
A
(9,5)
(1,1)
5-1=4
4/5
B
(1,1)
(7,17)
17-1=16
1/5
9-1=8
7-1=6
3/7
4/7
22/5
31/7
Gracz I zakłada, że gracz II używa strategii A z
prawdopodobieństwem q, a strategii B z prawdopodobieństwem
1-q. Wypłata gracza I:
9q+1(1-q)=8q+1 gdy gracz I gra A
1q+7(1-q)=7-6q gdy gracz I gra B
Ponieważ gracz I preferuje strategię A, więc 8q+1>7-6q, skąd
q>3/7.
Gracz II zakłada, że gracz I używa strategii B z
prawdopodobieństwem p, a strategii A z prawdopodobieństwem
1-p. Wypłata gracza II:
1p+5(1-p)=5-4p gdy gracz II gra A
17p+1(1-p)=16p+1 gdy gracz II gra B
Ponieważ gracz II preferuje strategię B, więc 16p+1>5-4p, skąd
p>1/5.
Ponieważ 1/5<3/7, więc gracz II ma poważniejsze powody by
wybrać strategię B niż gracz I strategię A. Zagrane zostanie
DZIĘKUJĘ ZA UWAGĘ
dr Robert Kowalczyk
Wydział Matematyki i Informatyki UŁ

Podobne dokumenty