1 - E-SGH

Transkrypt

1 - E-SGH
Oligopol
© 2010 W. W. Norton & Company, Inc.
Oligopol
Monopol – jedna firma na rynku.
Duopol – dwie firmy na rynku.
Oligopol – kilka firm na rynku. W
szczególności decyzje każdej firmy co
do ceny lub ilości produktu wpływają
na zyski pozostałych firm.
© 2010 W. W. Norton & Company, Inc.
2
Oligopol
Jak analizujemy rynek
oligopolistyczny?
Zał. przykład duopolu, obie firmy
produkują ten sam produkt.
© 2010 W. W. Norton & Company, Inc.
3
Konkurencja Ilościowa
Niech firmy konkurują poprzez
określanie wielkości produkcji.
Jeśli firma 1 produkuje y1 jednostek
produktu a firma 2 produkuje y2
jednostek produktu, to całkowita
podaż wynosi y1 + y2. Cena rynkowa
wyniesie p(y1+ y2).
Funkcje kosztów całkowitych: c1(y1) i
c2(y2).
© 2010 W. W. Norton & Company, Inc.
4
Konkurencja Ilościowa
Zał., że firma 1 bierze wielkość
produkcji firmy 2 y2 jako daną. Firma
1 ma funkcję zysku:
Π1( y1; y2 ) = p( y1 + y2 )y1 − c1 ( y1 ).
Jaka wielkość produkcji y1
maksymalizuje zyski firmy 1 przy
danym y2?
© 2010 W. W. Norton & Company, Inc.
5
Konkurencja Ilościowa; Przykład
Niech funkcja popytu ma postać:
p( yT ) = 60 − yT
a funkcje kosztu całkowitego są
postaci: 2
2
c
(
y
)
=
15
y
+
y
c1( y1 ) = y1 i
2 2
2
2.
© 2010 W. W. Norton & Company, Inc.
6
Konkurencja Ilościowa; Przykład
Dla danego y2, funkcja zysku 1. firmy wynosi
2
Π( y1; y2 ) = ( 60 − y1 − y2 )y1 − y1 .
Więc, dla danego y2, wielkość produkcji max.
zysk firmy 1 wynosi:
∂Π
= 60 − 2y1 − y2 − 2y1 = 0.
∂ y1
czyli najlepsza odpowiedź firmy 1 na y2 to:
1
y1 = R1 ( y2 ) = 15 − y2 .
4
© 2010 W. W. Norton & Company, Inc.
7
Konkurencja Ilościowa; Przykład
y2
“Funkcja reakcji” firmy 1
1
y1 = R1 ( y2 ) = 15 − y2 .
4
60
15
© 2010 W. W. Norton & Company, Inc.
y1
8
Konkurencja Ilościowa; Przykład
Podobnie, dla y1, funkcja zysku firmy 2:
2
Π( y2; y1 ) = ( 60 − y1 − y2 )y2 − 15y2 − y2 .
Więc, dla y1, poziom produkcji max. zysk
firmy 2 spełnia równanie:
∂Π
= 60 − y1 − 2y2 − 15 − 2y2 = 0.
∂ y2
czyli najlepsza odpowiedź firmy 2 na y1 to:
45 − y1
y2 = R2 ( y1 ) =
.
4
© 2010 W. W. Norton & Company, Inc.
9
Konkurencja Ilościowa; Przykład
y2
“Funkcja reakcji” firmy 2
45 − y1
y2 = R2 ( y1 ) =
.
4
45/4
45
© 2010 W. W. Norton & Company, Inc.
y1
10
Konkurencja Ilościowa; Przykład
Równowaga występuje, gdy poziom
produkcji każdej firmy jest najlepszą
odpowiedzią na poziom produkcji
drugiej firmy. Żadna firma wówczas
nie chce zmienić wielkości produkcji.
(y1*,y2*) jest równowagą Cournot*
Nash jeśli: *
y1 = R1 ( y2 ) i y*2 = R2 ( y*1 ).
© 2010 W. W. Norton & Company, Inc.
11
Konkurencja Ilościowa; Przykład
1 *
*
*
y1 = R1 ( y2 ) = 15 − y2
4
i
*
45
−
y
*
*
1.
y2 = R2 ( y1 ) =
4
Podstawiamy za y2*:
*

1
45
−
y
*
*
1


y1 = 15 − 
⇒ y1 = 13

4 4 
45 − 13
*
zatem
y2 =
= 8.
4
Równowaga Cournot-Nash:
( y*1 , y*2 ) = (13,8 ).
© 2010 W. W. Norton & Company, Inc.
12
Konkurencja Ilościowa; Przykład
y2
“Funkcja reakcji” firmy 1
1
y1 = R1 ( y2 ) = 15 − y2 .
4
60
“Funkcja reakcji” firmy 2
45 − y1
y2 = R2 ( y1 ) =
.
4
45/4
15
© 2010 W. W. Norton & Company, Inc.
45
y1
13
Konkurencja Ilościowa; Przykład
y2
“Funkcja reakcji” firmy 1
1
y1 = R1 ( y2 ) = 15 − y2 .
4
60
“Funkcja reakcji” firmy 2
45 − y1
y2 = R2 ( y1 ) =
.
4
Równowaga Cournot-Nash:
(
8
13
© 2010 W. W. Norton & Company, Inc.
48
)
y*1 , y*2 = (13,8) .
y1
14
Konkurencja Ilościowa
Ogólnie, dla danego y2, funkcja zysku firmy 1
wynosi
Π1 ( y1; y2 ) = p( y1 + y2 )y1 − c1 ( y1 )
wielkość y1 maksymalizująca zysk spełnia:
∂ Π1
∂ p( y1 + y2 )
′
= p( y1 + y2 ) + y1
− c1 ( y1 ) = 0.
∂ y1
∂ y1
Rozwiązanie y1 = R1(y2), to funkcja reakcji
Cournot-Nash firmy 1 na y2.
© 2010 W. W. Norton & Company, Inc.
15
Konkurencja Ilościowa
Dla danego y1, funkcja zysku firmy 2
wynosi:
Π 2 ( y2; y1 ) = p( y1 + y2 )y2 − c 2 ( y2 )
wielkość y2 maksymalizująca zysk spełnia:
∂ Π2
∂ p( y1 + y2 )
′
= p( y1 + y2 ) + y2
− c 2 ( y2 ) = 0.
∂ y2
∂ y2
Rozwiązanie y2 = R2(y1), to funkcja reakcji
Cournot-Nash firmy 2 na y1.
© 2010 W. W. Norton & Company, Inc.
16
Konkurencja Ilościowa
y2
“Funkcja reakcji” firmy 1 y1 = R1 ( y2 ).
“Funkcja reakcji” firmy 2 y2 = R2 ( y1 ).
Równowaga Cournot-Nash:
y1* = R1(y2*) i y2* = R2(y1*)
y*2
y*1
© 2010 W. W. Norton & Company, Inc.
y1
17
Linie Jednakowego Zysku
Dla firmy 1 linia jednakowego zysku
zawiera wszystkie punkty (y1,y2)
dające firmie 1 ten sam poziom zysku
Π 1.
Jak wyglądają linie jednakowego
zysku?
© 2010 W. W. Norton & Company, Inc.
18
Linie
Jednakowego
Zysku
dla
Firmy
1
y
2
Dla stałego y1, zysk firmy 1
rośnie, gdy y2 maleje.
y1
© 2010 W. W. Norton & Company, Inc.
19
Linie
Jednakowego
Zysku
dla
Firmy
1
y
2
Rosnący zysk firmy 1.
y1
© 2010 W. W. Norton & Company, Inc.
20
Linie
Jednakowego
Zysku
dla
Firmy
1
y
2
Q: Firma 2 wybiera y2 = y2’.
Gdzie wzdłuż y2 = y2’ jest
poziom produkcji maks. zysk
firmy 1?
A: Punkt osiągający najwyższą
położoną linię jednakowego
zysku firmy 1. y1’ to
najlepsza odp. firm 1 na
y2 = y2’.
y2’
y1’
© 2010 W. W. Norton & Company, Inc.
y1
21
Linie
Jednakowego
Zysku
dla
Firmy
1
y
2
y2’
Q: Firma 2 wybiera y2 = y2’.
Gdzie wzdłuż y2 = y2’ jest
poziom produkcji maks. zysk
firmy 1?
A: Punkt osiągający najwyższą
położoną linię jednakowego
zysku firmy 1. y1’ to
najlepsza odp. firm 1 na
y2 = y2’.
R1(y2’)
y1
© 2010 W. W. Norton & Company, Inc.
22
Linie
Jednakowego
Zysku
dla
Firmy
1
y
2
Funkcja reakcji firmy 1
przechodzi przez
“wierzchołki” linii
jednakowego zysku firmy 1.
y2”
y2’
R1(y2’)
R1(y2”)
© 2010 W. W. Norton & Company, Inc.
y1
23
Linie
Jednakowego
Zysku
dla
Firmy
2
y
2
Rosnący zysk firmy 2.
y1
© 2010 W. W. Norton & Company, Inc.
24
Linie
Jednakowego
Zysku
dla
Firmy
2
y
2
Funkcja reakcji firmy 2
przechodzi przez
„wierzchołki” linii
jednakowego zysku firmy 2.
y2 = R2(y1)
y1
© 2010 W. W. Norton & Company, Inc.
25
Zmowa
Q: Czy równowaga Cournot-Nasha
generuje największe możliwe zyski?
© 2010 W. W. Norton & Company, Inc.
26
Zmowa
y2
(y1*,y2*) - równowaga Cournot-Nash
Czy istnieje inne (y1,y2), które
dają wyższy zysk obu
firmom?
y2*
y1*
© 2010 W. W. Norton & Company, Inc.
y1
27
Zmowa
y2
(y1*,y2*) - równowaga Cournot-Nash
Wyższe Π2
Wyższe Π1
y2*
y1*
© 2010 W. W. Norton & Company, Inc.
y1
28
y2
Zmowa
Wyższe Π2
y2’
y2*
Wyższe Π1
y1*
y1’
© 2010 W. W. Norton & Company, Inc.
(y1’,y2’) generuje
wyższy zysk dla
obu firm niż
(y1*,y2*).
y1
29
Zmowa
Istnieją zachęty (w postaci zysku) dla
obu firm by „współpracować”
zmniejszając poziom produkcji.
Jest to zmowa.
Firmy tworzą kartel. Jak?
© 2010 W. W. Norton & Company, Inc.
30
Zmowa
Niech firmy działają w celu
maksymalizacji łącznego zysku,
który następnie dzielą pomiędzy
sobą. Ich cel to wspólna decyzja o
wielkości y1 i y2 by maksymalizować:
m
Π ( y1 , y2 ) = p( y1 + y2 )( y1 + y2 ) − c1 ( y1 ) − c 2 ( y2 ).
© 2010 W. W. Norton & Company, Inc.
31
Zmowa
Firmy nie pogorszą swej sytuacji
zmawiając się, gdyż konkurując ze
sobą mogą wybrać rozwiązanie
Cournot-Nash i odpowiadający
równowadze poziom zysku. Zmowa
musi prowadzić do poziomu zysku co
najmniej takiego jak równowaga
Cournot-Nasha.
© 2010 W. W. Norton & Company, Inc.
32
Zmowa
y2
Wyższe Π2
y2’
y2*
(y1’,y2’) generuje
wyższy zysk dla
obu firm niż
(y1*,y2*).
Wyższe Π1
y2”
(y1”,y2”) generuje
wyższy poziom
zysku dla obu firm.
y1” y1*
y1’
© 2010 W. W. Norton & Company, Inc.
y1
33
y2
_ y2*
y2
~
y
2
Zmowa
~
~
(y1,y2) maksymalizuje zysk firmy1
zostawiając zysk firmy 2 na
poziomie z równowagi
Cournot-Nash.
_ _
(y1,y2) max. zysk firmy
2 zostawiając zysk
firmy 1 na poziomie z
równowagi CournotNash.
_
y1
y2 ~ y1*
y1
© 2010 W. W. Norton & Company, Inc.
34
Zmowa
y2
Ścieżka wielkości prod. max.
zysk jednej firmy, dając drugiej
zysk co najmniej na poziomie
z równowagi C-N. Jeden
z tych punktów (na
ścieżce) musi max. zysk
kartelu.
_ y2*
y2
~
y
2
_
y2 ~ y1*
y1
© 2010 W. W. Norton & Company, Inc.
y1
35
Zmowa
y2
(y1m,y2m) oznacza
poziomy produkcji
maksymalizujące
całkowity zysk
kartelu.
y2*
y2m
y1m y1*
© 2010 W. W. Norton & Company, Inc.
y1
36
Zmowa
Czy kartel jest stabilny?
Czy jednej firmie opłaca się
oszukiwać?
Czyli, jeśli firma 1 produkuje y1m
jednostek, to czy firma 2
maksymalizuje swój zysk produkując
y2m jednostek?
© 2010 W. W. Norton & Company, Inc.
37
Zmowa
Funkcja reakcji maksymalizująca
zysk firmy 2 w odpowiedzi na y1 = y1m
to y2 = R2(y1m).
© 2010 W. W. Norton & Company, Inc.
38
Zmowa
y2
y1 = R1(y2), funkcja reakcji firmy 1
y2 = R2(y1m) to
najlepsza odp. firmy 2
gdy firma 1 wybiera
y1 = y1m.
R2(y1m)
y2m
y2 = R2(y1), funkcja
reakcji firmy 2
y1m
© 2010 W. W. Norton & Company, Inc.
y1
39
Zmowa
Odpowiedź firmy 2 max. zysk na y1 =
y1m to y2 = R2(y1m) > y2m.
Zysk firmy 2 rośnie, jeśli oszukuje
ona firmę 1 zwiększając wielkość
swojej produkcji z y2m do R2(y1m).
Podobnie, zysk firmy 1 rośnie, gdy
oszukuje firmę drugą zwiększając
produkcję z y1m do R1(y2m).
© 2010 W. W. Norton & Company, Inc.
40
Zmowa
y2
y1 = R1(y2), funkcja reakcji firmy 1
y2 = R2(y1m) to
najlepsza odp. firmy 2
na wybór firmy 1
y1 = y1m.
y2m
y2 = R2(y1), funkcja
reakcji firmy 2
y1m R1(y2m)
© 2010 W. W. Norton & Company, Inc.
y1
41
Zmowa
Zatem maksymalizujący zysk kartel,
w którym firmy wspólnie ustalają
wielkość produkcji jest z założenia
NIESTABILNY.
Kartel może być stabilny, gdy gra
jest powtarzana. Istnieje wówczas
możliwość ukarania oszusta.
© 2010 W. W. Norton & Company, Inc.
42
Kolejność Gry
Dotychczas zakładaliśmy, że firmy
ustalają wielkość swojej produkcji
równocześnie. Wielkość produkcji
jest wówczas zmienną strategiczną.
Załóżmy, że firma 1 pierwsza ustala
wielkość produkcji a następnie
„odpowiada” firma 2.
© 2010 W. W. Norton & Company, Inc.
43
Kolejność Gry
Firma 1 jest liderem, a firma 2
naśladowcą.
Mamy do czynienia z grą sekwencyjną,
gdzie wielkości produkcji to zmienne
strategiczne – model von Stackelberga.
Lepiej być liderem czy naśladowcą?
© 2010 W. W. Norton & Company, Inc.
44
Model Stackelberga
Q: Jaka jest najlepsza odpowiedź,
jaką może udzielić naśladowca (firma
2) na wybór y1 dokonany przez lidera
(firmę 1)?
A: Wybrać y2 = R2(y1).
Firma 1 to wie i dokładnie antycypuje
reakcję firmy 2 na dowolny wybór y1
firmy 1.
© 2010 W. W. Norton & Company, Inc.
45
Model Stackelberga
Funkcja zysku lidera przyjmuje
postać:
s
Π1 ( y1 ) = p( y1 + R 2 ( y1 )) y1 − c1 ( y1 ).
Lider wybiera y1 by max. zysk.
Q: Czy lider osiągnie zysk co
najmniej taki, jak w równowadze
Cournot-Nasha?
© 2010 W. W. Norton & Company, Inc.
46
Model Stackelberga
A: Tak. Lider powinien wybrać
poziom produkcji z równowagi
Cournot-Nash, wiedząc, że
naśladowca wówczas wybierze też
poziom produkcji z równ. C-N. Zysk
lidera jest równy wówczas zyskowi z
równ. C-N. Ale lider może wybrać
inny poziom produkcji, który da mu
poziom zysku co najmniej równy
zyskowi z równ. C-N.
© 2010 W. W. Norton & Company, Inc.
47
Model Stackelberga; Przykład
Rynkowa f-cja popytu ma postać p =
60 - yT. Funkcje kosztów są postaci:
c1(y1) = y12 i c2(y2) = 15y2 + y22.
Firma 2 jest naśladowcą. Jej funkcja
reakcji jest postaci:
45 − y1
y 2 = R 2 ( y1 ) =
.
4
© 2010 W. W. Norton & Company, Inc.
48
Model Stackelberga; Przykład
Funkcja zysku lidera jest postaci:
Π1s ( y1 ) = ( 60 − y1 − R 2 ( y1 )) y1 − y12
45 − y1
2
= ( 60 − y1 −
) y1 − y1
4
7 2
195
=
y1 − y1 .
4
4
Max. zysku następuje dla:
195 7
s
= y1 ⇒ y1 = 13 ⋅ 9.
4
2
© 2010 W. W. Norton & Company, Inc.
49
Model Stackelberga; Przykład
Q: Jaka jest odpowiedź firmy 2 na wybór
s
y
lidera
1 = 13 ⋅ 9 ?
45 − 13 ⋅ 9
s
s
= 7 ⋅ 8.
A: y 2 = R 2 ( y1 ) =
4
Równowaga C-N to (y1*,y2*) = (13,8), więc
lider teraz produkuje więcej, a naśladowca
mniej niż w C-N. Jest to prawda ogólna.
© 2010 W. W. Norton & Company, Inc.
50
y2
Model Stackelberga
(y1*,y2*) równowaga CournotNash.
Wyższe Π2
Wyższe Π1
y2*
y1*
© 2010 W. W. Norton & Company, Inc.
y1
51
y2
Model Stackelberga
(y1*,y2*) równowaga CournotNash. (y1S,y2S) równowaga
Stackelberga.
Funkcja reakcji
naśladowcy.
y2*
y2S
y1* y1S
© 2010 W. W. Norton & Company, Inc.
y1
52
Konkurencja Cenowa
Co się dzieje, jeśli firmy konkurują
tylko ceną, zamiast strategii
wielkości produkcji?
Model Bertranda – firmy
jednocześnie ustalają poziom ceny
produktu.
© 2010 W. W. Norton & Company, Inc.
53
Model Bertranda
Koszt krańcowy produkcji każdej
firmy jest stały i wynosi c.
Wszystkie firmy ustalają cenę
produktu jednocześnie.
Q: Czy istnieje równowaga Nasha?
A: Tak. Dokładnie jedna. Wszystkie
firmy ustalają cenę na poziomie
kosztu krańcowego c. Dlaczego?
© 2010 W. W. Norton & Company, Inc.
54
Model Bertranda
Zał., że jedna firma ustala wyższą
cenę produktu niż pozostałe.
Wówczas ta firma straciłaby
wszystkich klientów.
Zatem, w równowadze wszystkie
firmy muszą ustalić tę samą cenę.
© 2010 W. W. Norton & Company, Inc.
55
Model Bertranda
Zał., że cena ustalona przez wszystkie
firmy jest wyższa od kosztu
krańcowego c.
Jeśli tylko jedna firma nieznacznie
obniży poziom ceny swojego produktu,
sprzedaje go wszystkim konsumentom
zwiększając swój zysk.
Jedyny poziom ceny, której firmy nie
obniżą to c. Jest to jedyna równowaga
Nasha.
© 2010 W. W. Norton & Company, Inc.
56
Sekwencyjne Ustalanie Ceny
Jak wygląda gra, gdy jedna firma
ustala cenę produktu jako pierwsza?
Jest to gra sekwencyjna –
przywództwo cenowe.
Firma, która jako pierwsza ustala
cenę jest liderem.
© 2010 W. W. Norton & Company, Inc.
57
Sekwencyjne Ustalanie Ceny
Zał., że mamy jedną dużą firmę
(lidera) i wiele małych
konkurencyjnych firm
(naśladowców).
Małe firmy są cenobiorcami, więc ich
łączna odpowiedź na cenę rynkową p
to ich agregatowa podaż Yf(p).
© 2010 W. W. Norton & Company, Inc.
58
Sekwencyjne Ustalanie Ceny
Funkcja popytu rynkowego jest
postaci D(p).
Lider wie, że jeśli ustali cenę p to
popyt rezydualny wyniesie
L(p ) = D(p ) − Yf (p ).
Więc funkcja zysku lidera wynosi:
Π L (p) = p(D(p) − Yf (p)) − cL (D(p) − Yf (p)).
© 2010 W. W. Norton & Company, Inc.
59
Sekwencyjne Ustalanie Ceny
Funkcja zysku lidera wynosi
Π L (p ) = p( D(p ) − Yf (p )) − cL ( D(p ) − YF (p ))
zatem lider ustala poziom ceny p* dla
którego max. zysk.
Naśladowcy wspólnie dostarczają
Yf(p*) jednostek produktu a lider
dostarcza popyt rezydualny D(p*) Yf(p*).
© 2010 W. W. Norton & Company, Inc.
60
Teoria Gier
© 2010 W. W. Norton & Company, Inc.
Teoria Gier
Teoria gier pozwala modelować
zachowanie strategiczne jednostek,
które wiedzą, że ich działania
wpływają na zachowanie innych
jednostek.
© 2010 W. W. Norton & Company, Inc.
2
Przykłady Zastosowań
Analiza oligopolu
Analiza kartelu
Analiza efektów zewnętrznych, np.
łowiska ryb
Negocjacje
Strategie wojskowe
© 2010 W. W. Norton & Company, Inc.
3
Co to jest Gra?
Gra zawiera:
– graczy
– zestaw strategii kdażdego z
graczy
– wypłaty dla każdego z graczy dla
każdego zestawu strategii
© 2010 W. W. Norton & Company, Inc.
4
Gra
Analizujemy grę dwóch graczy, z
których każdy może dokonać wyboru
z dwóch możliwości.
© 2010 W. W. Norton & Company, Inc.
5
Przykład
Mamy dwóch graczy: A i B.
Gracz A ma dwie możliwości wyboru:
“góra” i “dół”.
Gracz B ma dwie możliwości wyboru:
„lewo” i „prawo”.
Macierz wypłat przedstawia wypłaty
dla obu graczy dla każdej z 4
możliwości działań.
© 2010 W. W. Norton & Company, Inc.
6
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Macierz wypłat.
Gracz A
Wypłata gracza A jest przedstawiona pierwsza.
Wypłata gracza B jest przedstawiona druga.
© 2010 W. W. Norton & Company, Inc.
7
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Gracz A
Wynik gry, np. (G,P) oznacza, że gracz A wybiera G
(pierwszy element obrazuje wybór gracza A), a
drugi element (P) oznacza akcję gracza B.
© 2010 W. W. Norton & Company, Inc.
8
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Macierz wypłat.
Gracz A
Np. A gra Góra a B gra Prawo, wówczas wypłata A
wynosi 1 a wypłata B wynosi 8.
© 2010 W. W. Norton & Company, Inc.
9
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Macierz wypłat.
Gracz A
Jeśli A wybiera Dół a B gra Prawo, to wypłata A
wynosi 2 a wypłata B wynosi 1.
© 2010 W. W. Norton & Company, Inc.
10
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Gracz A
Jak zachowają się gracze w danej grze?
© 2010 W. W. Norton & Company, Inc.
11
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Czy (G,P) jest
możliwym
rozwiązaniem?
Gracz A
Jeśli B wybiera Prawo, to najlepszą odpowiedzią A
jest Dół, gdyż wypłata A rośnie z 1 do 2. (G,P) nie
jest rozwiązaniem.
© 2010 W. W. Norton & Company, Inc.
12
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Czy (D,P) jest
możliwym
rozwiązaniem?
Gracz A
Jeśli B wybiera Prawo, to najlepszą odpowiedzią A jest
Dół. Jeśli A wybiera Dół to najlepszą odpowiedzią B
jest Prawo. (D,P) jest rozwiązaniem.
© 2010 W. W. Norton & Company, Inc.
13
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Czy (D,L) jest
możliwym
rozwiązaniem?
Gracz A
Jeśli A wybiera Dół to najlepszą odpowiedzią B jest
Prawo. (D,L) nie jest rozwiązaniem.
© 2010 W. W. Norton & Company, Inc.
14
Przykład
Gracz B
L
P
G
(3,9) (1,8)
D
(0,0) (2,1)
Czy (G,L) jest
możliwym
rozwiązaniem?
Gracz A
Jeśli A wybiera Góra, to najlepszą odpowiedzią B jest
Lewo. Jeśli B wybiera Lewo, to najlepszą odpowiedzią
A jest Góra. (U,L) jest rozwiązaniem.
© 2010 W. W. Norton & Company, Inc.
15
Równowaga Nasha
Para strategii tworzy równowagę
Nasha, jeśli wybór A jest optymalny
przy danym wyborze B oraz wybór
dokonany przez B jest optymalny
przy danym wyborze A.
W naszym przykładzie są dwie
równowagi Nasha: (G,L) i (D,P).
© 2010 W. W. Norton & Company, Inc.
16
Przykład
Gracz B
L
P
G (3,9) (1,8)
Gracz A
D
(0,0) (2,1)
(G,L) i (D,P) to równowagi Nasha. Która
zostanie zaobserwowana w rzeczywistości?
Zauważ, że (G,L) jest preferowane względem
(D,P)
przez
obu
graczy. Czy tylko ona wystąpi?
© 2010
W. W. Norton
& Company,
Inc.
17
Dylemat Więźnia
Rozważmy dylemat więźnia by
zobaczyć, czy rozwiązania efektywne
w sensie Pareto są wynikami gry.
© 2010 W. W. Norton & Company, Inc.
18
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
© 2010 W. W. Norton & Company, Inc.
(-1,-30) (-10,-10)
19
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Gdy Bonnie wybiera NP to najlepszą
odpowiedzią Clyde’a jes P.
© 2010 W. W. Norton & Company, Inc.
20
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
Bonnie
P
P
(-30,-1)
(-1,-30) (-10,-10)
Gdy Bonnie wybiera NP to najlepszą odpowiedzią
Clyde’a jes P.
Gdy Bonnie wybiera P to najlepszą odpowiedzią
Clyde’a
jestInc.P.
© 2010 W.
W. Norton & Company,
21
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Clyde ma strategię dominującą – P. Bez
względu na to co zrobi Bonnie najlepszą
odpowiedzią Clyde’a jest zawsze P.
© 2010 W. W. Norton & Company, Inc.
22
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Podobnie, dla Bonnie strategią dominującą
jest P.
© 2010 W. W. Norton & Company, Inc.
23
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Zatem równowagą Nasha jest (P,P), chociaż
para strategii (NP,NP) daje każdemu z graczy
wyższą wypłatę. Jedyna równowaga Nasha jest
nieefektywna.
© 2010
W. W. Norton & Company, Inc.
24
Gra Sekwencyjna
W obu przypadkach mieliśmy do
czynienia z jednoczesnym
podejmowaniem decyzji przez
graczy.
Gdy jeden z graczy podejmuje
decyzję jako pierwszy mamy do
czynienia z grą sekwencyjną. Lider i
naśladowca.
© 2010 W. W. Norton & Company, Inc.
25
Gra Sekwencyjna
Gdy gra ma więcej niż jedną
równowagę Nasha trudno określić
czasami, która jest bardziej
prawdopodobna.
Gdy gra jest sekwencyjna, niekiedy
można określić, która równowaga
jest bardziej prawdopodobna.
© 2010 W. W. Norton & Company, Inc.
26
Gra Sekwencyjna
Gracz B
L
P
U
(3,9) (1,8)
D
(0,0) (2,1)
Gracz A
(G,L) i (D,P) to równowagi Nasha. Przy grze
jednoczesnej nie można określić, która wystąpi.
© 2010 W. W. Norton & Company, Inc.
27
Gra Sekwencyjna
Gracz B
L
P
G (3,9) (1,8)
Gracz A
D
(0,0)
(2,1)
Niech gra przyjmie postać gry sekwencyjnej.
Pierwszy gra gracz A. Gra w postaci
ekstensywnej wygląda następująco.
© 2010 W. W. Norton & Company, Inc.
28
Gra Sekwencyjna
A
G
D
B
L
(3,9)
A gra pierwszy.
B gra drugi.
B
P
L
(1,8) (0,0)
© 2010 W. W. Norton & Company, Inc.
P
(2,1)
29
Gra Sekwencyjna
A
G
D
B
L
(3,9)
A gra pierwszy.
B gra drugi.
B
P
L
(1,8) (0,0)
P
(2,1)
(U,L) to równowaga Nasha, tak jak (D,P).
© 2010 W. W. Norton & Company, Inc.
30
Gra Sekwencyjna
A
G
D
B
L
(3,9)
A gra pierwszy.
B gra drugi.
B
P
L
(1,8) (0,0)
P
(2,1)
Jeśli A gra G to B gra L; A otrzymuje 3.
© 2010 W. W. Norton & Company, Inc.
31
Gra Sekwencyjna
A
G
D
B
L
(3,9)
A gra pierwszy.
B gra drugi.
B
P
L
(1,8) (0,0)
P
(2,1)
(G,L) jest
prawdopodobną
NE.
Jeśli A gra G to B gra L; A otrzymuje 3.
Jeśli A gra D to B gra P; A otrzymuje 2.
© 2010 W. W. Norton & Company, Inc.
32
Gra Sekwencyjna
Gracz B
L
P
G (3,9) (1,8)
Gracz A
D
(0,0)
(2,1)
Wróćmy do pierwotnego przykładu. Gra jest
jednoczesna. Występują dwie równowagi Nasha
(G,L) i (D,P).
© 2010 W. W. Norton & Company, Inc.
33
Gra Sekwencyjna
Gracz B
L
P
G (3,9) (1,8)
Gracz A
D
(0,0)
(2,1)
Gracz A wybiera G lub D, ale nigdy ich kombinację, G
i D to jego strategie czyste. Dla gracza B strategie
czyste to L i P.
© 2010 W. W. Norton & Company, Inc.
34
Gra Sekwencyjna
Gracz B
L
P
G (3,9) (1,8)
Gracz A
D
(0,0)
(2,1)
Zatem (G,L) i (D,P) to równowaga Nasha w
strategiach czystych. Czy każda gra ma co
najmniej jedną taką równowagę?
© 2010 W. W. Norton & Company, Inc.
35
Strategie Czyste
Gracz B
L
P
G
(1,2)
(0,4)
D
(0,5)
(3,2)
Gracz A
Mamy nową grę. Czy występuje tu równowaga
Nasha w strategiach czystych?
© 2010 W. W. Norton & Company, Inc.
36
Strategie Czyste
Gracz B
L
P
G
(1,2)
(0,4)
D
(0,5)
(3,2)
Gracz A
Czy (G,L) jest równowagą Nasha?
© 2010 W. W. Norton & Company, Inc.
37
Strategie Czyste
Gracz B
L
P
G
(1,2)
(0,4)
D
(0,5)
(3,2)
Gracz A
Czy (G,L) jest równowagą Nasha? Nie.
Czy (G,P) jest równowagą Nasha?
© 2010 W. W. Norton & Company, Inc.
38
Strategie Czyste
Gracz B
L
P
G
(1,2)
(0,4)
D
(0,5)
(3,2)
Gracz A
Czy (G,L) jest równowagą Nasha? Nie.
Czy (G,P) jest równowagą Nasha? Nie.
Czy (D,L) jest równowagą Nasha?
© 2010 W. W. Norton & Company, Inc.
39
Strategie Czyste
Gracz B
L
P
G
(1,2)
(0,4)
D
(0,5)
(3,2)
Gracz A
Czy (G,L) jest równowagą Nasha? Nie.
Czy (G,P) jest równowagą Nasha? Nie.
Czy (D,L) jest równowagą Nasha? Nie.
© 2010 W.(D,P)
W. Norton &jest
Company,równowagą
Inc.
Czy
Nasha?
40
Strategie Czyste
Gracz B
L
P
G
(1,2)
(0,4)
D
(0,5)
(3,2)
Gracz A
Czy (D,L) jest równowagą Nasha? Nie.
Czy (D,P) jest równowagą Nasha? Nie.
Czy (D,L) jest równowagą Nasha? Nie.
© 2010 W.(D,P)
W. Norton &jest
Company,równowagą
Inc.
Czy
Nasha? Nie.
41
Strategie Czyste
Gracz B
L
P
G
(1,2)
(0,4)
D
(0,5)
(3,2)
Gracz A
Gra nie ma zatem równowagi Nasha w strategiach
czystych. Ma natomiast równowagę Nasha w
strategiach mieszanych.
© 2010 W. W. Norton & Company, Inc.
42
Strategie Mieszane
Zamiast wybierać Góra lub Dół, gracz A
wybiera rozkład prawdopodobieństwa
(π
πU,1-π
πU), gdzie πU oznacza
prawdopodobieństwo, iż gracza A
wybiera Góra, a z
prawdopodobieństwem 1-π
πU gra Dół.
Gracz A miesza strategie czyste G i D.
Rozkład prawdopodobieństwa (π
πU,1-π
πU)
to strategia mieszana Gracza A.
© 2010 W. W. Norton & Company, Inc.
43
Strategie Mieszane
Podobnie, gracz B wybiera rozkład
prawdopodobieństwa (π
πL,1-π
πL), z prawd.
πL gracz B gra Lewo, a z prawd. 1-π
πL gra
Prawo.
Gracz B miesza strategie czyste L i P.
Rozkład prawdopodobieństwa (π
πL,1-π
π L)
to strategia mieszana Gracza B.
© 2010 W. W. Norton & Company, Inc.
44
Strategie Mieszane
Gracz B
L
P
G
(1,2)
(0,4)
D
(0,5)
(3,2)
Gracz A
Ta gra nie ma NE w strategiach czystych, ale ma
równowagę Nasha w strategiach mieszanych.
© 2010 W. W. Norton & Company, Inc.
45
Strategie Mieszane
Gracz B
L, πL P, 1-πL
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana A z wyboru G wynosi??
© 2010 W. W. Norton & Company, Inc.
46
Strategie Mieszane
Gracz B
L, πL P, 1-πL
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana A z wyboru G wynosi πL.
Wartość oczekiwana A z wyboru D wynosi??
© 2010 W. W. Norton & Company, Inc.
47
Strategie Mieszane
Gracz B
L, πL P, 1-πL
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana A z wyboru G wynosi πL.
Wartość oczekiwana A z wyboru D wynosi 3(1 - πL).
© 2010 W. W. Norton & Company, Inc.
48
Strategie Mieszane
Gracz B
L, πL P, 1-πL
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana A z wyboru G wynosi πL.
Wartość oczekiwana A z wyboru D wynosi 3(1 - πL).
Jeśli πL > 3(1 - πL) to A wybiera tylko G, ale nie ma NE,
w
której A gra tylko G.
© 2010 W. W. Norton & Company, Inc.
49
Strategie Mieszane
Gracz B
L, πL P, 1-πL
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana A z wyboru G wynosi πL.
Wartość oczekiwana A z wyboru D wynosi 3(1 - πL).
Jeśli πL < 3(1 - πL) to A wybiera tylko D, ale nie ma
NE,
w której A gra tylko D.
© 2010 W. W. Norton & Company, Inc.
50
Strategie Mieszane
Gracz B
L, πL P, 1-πL
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Jeśli jest NE, to πL = 3(1 - πL) ⇒ πL = 3/4;
czyli sposób w jaki B miesza Lewo i Prawo, musi
powodować, iż A jest obojętne czy wybrać Góra czy Dół.
© 2010 W. W. Norton & Company, Inc.
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
© 2010 W. W. Norton & Company, Inc.
52
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana B z wyboru L??
© 2010 W. W. Norton & Company, Inc.
53
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana B z wyboru L: 2πU + 5(1 - πU).
Wartość oczekiwana B z wyboru P??
© 2010 W. W. Norton & Company, Inc.
54
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana B z wyboru L: 2πU + 5(1 - πU).
Wartość oczekiwana B z wyboru P: 4πU + 2(1 - πU).
© 2010 W. W. Norton & Company, Inc.
55
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana B z wyboru L: 2πU + 5(1 - πU).
Wartość oczekiwana B z wyboru P: 4πU + 2(1 - πU).
Jeśli 2πU + 5(1 - πU) > 4πU + 2(1 - πU) to B wybiera
tylko
Lewo, ale nie ma NE, w której B gra tylko L.
© 2010 W. W. Norton & Company, Inc.
56
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, πU
(1,2)
(0,4)
Gracz A
D, 1-πU
(0,5)
(3,2)
Wartość oczekiwana B z wyboru L: 2πU + 5(1 - πU).
Wartość oczekiwana B z wyboru P: 4πU + 2(1 - πU).
Jeśli 2πU + 5(1 - πU) < 4πU + 2(1 - πU) to B wybiera
tylko
Prawo, ale nie ma NE, w której B gra tylko P.
© 2010 W. W. Norton & Company, Inc.
57
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, 3/5
(1,2)
(0,4)
(0,5)
(3,2)
Gracz A
D, 2/5
Jeśli jest NE, to 2πU + 5(1 - πU) = 4πU + 2(1 - πU) ⇒
πU = 3/5; czyli sposób w jaki A miesza Góa i Dół, musi
powodować, iż B jest obojętne czy wybrać Lewo czy
Prawo.
© 2010 W. W. Norton & Company, Inc.
58
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, 3/5
(1,2)
(0,4)
(0,5)
(3,2)
Gracz A
D, 2/5
Gra ma jedyną równowagę Nasha, w której A gra
strategię mieszaną (3/5, 2/5) a B gra strategię
mieszaną (3/4, 1/4).
© 2010 W. W. Norton & Company, Inc.
59
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, 3/5
Gracz A
D, 2/5
(1,2)
9/20
(0,5)
(0,4)
(3,2)
Wypłata (1,2) będzie z prawdopodobieństwem
3/5 × 3/4 = 9/20.
© 2010 W. W. Norton & Company, Inc.
60
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, 3/5
Gracz A
D, 2/5
(1,2)
(0,4)
9/20
3/20
(0,5)
(3,2)
Wypłata (0,4) będzie z prawdopodobieństwem
3/5 × 1/4 = 3/20.
© 2010 W. W. Norton & Company, Inc.
61
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, 3/5
Gracz A
D, 2/5
(1,2)
(0,4)
9/20
3/20
(0,5)
(3,2)
6/20
Wypłata (0,5) będzie z prawdopodobieństwem
2/5 × 3/4 = 6/20.
© 2010 W. W. Norton & Company, Inc.
62
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, 3/5
Gracz A
D, 2/5
(1,2)
(0,4)
9/20
3/20
(0,5)
(3,2)
2/20
6/20
Wypłata (3,2) będzie z prawdopodobieństwem
2/5 × 1/4 = 2/20.
© 2010 W. W. Norton & Company, Inc.
63
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, 3/5
Gracz A
D, 2/5
(1,2)
(0,4)
9/20
3/20
(0,5)
(3,2)
2/20
6/20
Oczekiwana wypłata A w równowadze Nasha:
1×9/20 + 3×2/20 = 3/4.
© 2010 W. W. Norton & Company, Inc.
64
Strategie Mieszane
Gracz B
L, 3/4 P, 1/4
G, 3/5
Gracz A
D, 2/5
(1,2)
(0,4)
9/20
3/20
(0,5)
(3,2)
2/20
6/20
Oczekiwana wypłata A w równowadze Nasha:
1×9/20 + 3×2/20 = 3/4.
Oczekiwana wypłata B w równowadze Nasha:
2×9/20 + 4×3/20 + 5×6/20 + 2×2/20 = 16/5.65
© 2010 W. W. Norton & Company, Inc.
Ile równowag Nasha?
Gra o skończonej liczbie graczy, z
których każdy ma skończoną liczbę
strategii czystych, ma co najmniej
jedną równowagę Nasha.
Jeśli gra nie ma NE w strategiach
czystych, to musi mieć co najmniej
jedną równowagę w strategiach
mieszanych.
© 2010 W. W. Norton & Company, Inc.
66
Gry Powtarzalne
Gra powtarzalna to gra grana raz w
każdym okresie przy x okresów.
Strategia graczy uzależniona jest od
tego czy gra:
– powtarzana jest skończoną czy
nieskończoną liczbę razy.
© 2010 W. W. Norton & Company, Inc.
67
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Niech gra będzie powtarzana tylko w 3
okresach,
t = 1, 2, 3. Jaki będzie wynik?
© 2010 W. W. Norton & Company, Inc.
68
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Zał., że jesteśmy w t = 3 (gra była już grana dwa
razy). Co powinien zrobić Clyde? Co powinna zrobić
Bonnie? Oboje powinni się Przyznać.
© 2010 W. W. Norton & Company, Inc.
69
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Zał., że jesteśmy w t = 2. Clyde i Bonnie oczekują, iż
każde w t = 3 wybierze P. Co powinien zrobić Clyde?
Co powinna zrobić Bonnie? Oboje powinni się
©Przyznać.
2010 W. W. Norton & Company, Inc.
70
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Na początku w t = 1 Clyde i Bonnie oczekują, iż
każde w t = 2 i t = 3 wybierze P. Co powinien zrobić
Clyde? Co powinna zrobić Bonnie? Oboje powinni się
©Przyznać.
2010 W. W. Norton & Company, Inc.
71
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Jedyna możliwa równowaga Nasha w tej grze to
wybór Przyznania się przez oboje graczy. Wynik jest
taki sam nawet dla wielokrotnie (ale o skończonej
powtarzanej
grze.
©liczbie)
2010 W. W. Norton
& Company, Inc.
72
Dylemat Więźnia
Clyde
NP
NP (-5,-5)
P
(-30,-1)
Bonnie
P
(-1,-30) (-10,-10)
Gdy gra jest powtarzana nieskończenie wiele razy to
ma wiele możliwych NE. Jedną jest (P,P). Ale (NP,NP)
też może być NE, gdyż gracz może ukarać drugiego
współpracy
(i wybranie P).
©za
2010 brak
W. W. Norton
& Company, Inc.
73

Podobne dokumenty