slajdy 3

Transkrypt

slajdy 3
Plan
I
I
I
Przypomnienie: Dominacja oraz równowaga Nasha
Model konkurencji ilościowej Cournot
Model konkurencji cenowej Bertranda
I
I
I
Prosty model aukcji:
I
I
I
jednakowe produkty
produkty zróżnicowane
Aukcja drugiej ceny - równowaga Nasha w strategiach
słabo dominujących
Aukcja pierwszej ceny - równowaga Nasha
Model przetrzennego głosowania
Aukcja drugiej ceny
I
I
I
Najwyższa oferta wygrywa, wygrany płaci drugą
najwyższą cenę.
W przypadku równych ofert, obiekt dostaje gracz 1
Przypuśćmy, że v1 > v2 > 0
Forma strategiczna:
I
N = {1, 2}
I
A1 = A2 = R+
I
Funkcje wypłaty: Dla każdego (b1 , b2 ) ∈ R2+
v1 − b2 , jeśli b1 ≥ b2 ,
0,
w przeciwnym przypadku
v2 − b1 , jeśli b2 > b1 ,
0,
w przeciwnym przypadku
u1 (b1 , b2 ) =
u2 (b1 , b2 ) =
Równowaga w strategiach słabo-dominujących w
aukcji drugiej ceny
On the le(: bidding higher than your value is weakly dominated. On the right: bidding lower than your value is weakly dominated. Aukcja drugiej ceny - strategia słabo dominująca
I
Słabo dominującą akcją dla każdego gracza to: bi = vi .
I
Jest wiele równowag Nasha - na przykład (v1 , 0).
I
Jedna równowaga w strategiach słabo dominujących:
(v1 , v2 )
Aukcja pierwszej ceny
I
I
Najwyższa oferta wygrywa, wygrany płaci swoją ofertę
W przypadku równych ofert, obiekt dostaje gracz 1
Forma strategiczna:
I
N = {1, 2}
I
A1 = A2 = R +
I
Funkcje wypłaty: Dla każdego (b1 , b2 ) ∈ R2+
v1 − b1 , jeśli b1 ≥ b2 ,
0,
w przeciwnym przypadku
v2 − b2 , jeśli b2 > b1 ,
0,
w przeciwnym przypadku
u1 (b1 , b2 ) =
u2 (b1 , b2 ) =
Aukcja pierwszej ceny
I
Nie ma równowagi w strategiach dominujących
I
I
Nie ma takiej akcji, która jest lepsza dla danego gracza
niż inna akcja niezależnie od tego, co zrobi drugi gracz
Szukamy równowagi Nasha sposobem wprost:
I
I
Warunki konieczne (jeśli profil strategii jest równowagą,
wtedy musi speł niać te warunki)
Warunki wystarczające (jeśli profil strategii spełnia te
warunki, wtedy jest równowagą w sensie Nasha)
Warunki konieczne
Niech (b1∗ , b2∗ ) będzie równowagą Nasha. Wtedy,
I
Gracz 1 wygrywa: b1∗ ≥ b2∗
Przypuśćmy, że nie: b1∗ < b2∗ . Mamy dwie możliwości:
I
I
b2∗ ≤ v2 : Gracz 1 mógłby zaoferować v2 i mieć zysk
b2∗ > v2 : Gracz 2 mógłby zaoferować zero i zredukować
straty do zera
Co oznacza, że taki profil nie może być równowagą.
I
I
b1∗ = b2∗
Przypuśćmy, że nie: b1∗ > b2∗ . Gracz I może zaoferować b2∗
i mieć zysk.
v2 ≤ b1∗ ≤ v1 Przypuśćmy, że nie. Są dwie możliwości:
I
I
b1∗ < v2 , wtedy gracz II może podnieść swoją ofertę
v1 < b1∗ , wtedy gracz I powinien obniżyć swoją ofertę
Warunki wystarczające
Każda równowaga Nasha (b1∗ , b2∗ ) musi spełniać:
v2 ≤ b1∗ = b2∗ ≤ v1
Czy jakaś z par spełniających te nierówności jest równowagą
Nasha?
TAK, wszystkie
Model wyborów politycznych
I
I
I
I
I
I
Kandydaci wybierają, jak bardzo chcą być prounijni.
Preferencje: Wygrana Remis Przegrana
Wyborcy mają swoją ulubioną pozycję prounijności
Jednowymiarowa przestrzeń strategii: prounijność w
skali [0, 1]
Wyborcy głosują na tego, kto jest najbliżej ich ulubionej
pozycji
Społ eczeństwo jest kontinuum i wyborcy rozmieszczeni
są na przedziale [0, 1] według rozkładu jednostajnego
Medianowy wyborca
I
N = {1, 2}
I
A1 = A2 = [0, 1]
I
Funkcje wypłaty dla obu partii

 1, jeśli i wygra
1
, jeśli remis
ui (p1 , p2 ) =
 2
0 jeśli i przegra
Niech p1∗ , p2∗ będzie równowagą Nasha. Wtedy:
I Wynikiem musi być remis p ∗ = p ∗
1
2
I
I
I
Przypuśćmy, że nie: p1∗ 6= p2∗ ?
Wówczas gracz 1 na przykład ma bodziec, aby zbliżyć się
do gracza 2.
Wynik powinien być dokładnie w połowie p1∗ = p2∗ = 1/2
I
I
Przypuśćmy, że nie: p1∗ = p2∗ 6= 1/2?
Wówczas gracz 1 na przykład ma bodziec, aby przesunąć
się nieznacznie w stronę środka.
Jedyną równowagą Nasha jest (p1∗ , p2∗ ) =
1 1
2, 2
Plan
Co było:
I
I
I
Pojęcie gry w postaci standardowej/normalnej (tabelka)
Strategie dominujące
Iteracyjna eliminacja strategii dominujących
I
I
Racjonalność graczy jest wspólną wiedzą
Równowaga Nasha w strategiach czystych
I
Funkcje/korespondencje najlepszych odpowiedzi
Plan wykładu
I
I
I
Więcej o wiedzy wspólnej: Historia trzech pań z
brudnymi twarzami
Pojęcie preferencji i użyteczności porządkowej (Cantor)
i kardynalnej (von Neumann i Morgenstern)
Wprowadzenie strategii mieszanych:
I
I
Eliminacja strategii zdominowanych przez strategię
mieszaną
Równowaga Nasha w strategiach mieszanych
I
I
I
I
I
Pijany kierowca
Bitwa płci
Sherlock Holmes i profesor Moriarty
Doniesienie o przestępstwie
Co dalej?: Gry dynamiczne i postać ekstensywna
I
W samo południe
Brudne twarze
I
I
I
I
I
Trzy panie ze
środkowego zachodu
USA mają brudne
twarze.
Każda pani widzi twarze
innych pań, ale nie widzi
swojej.
Jeśliby którakolwiek z
nich wiedziała na 100%,
że ma brudną twarz,
wówczas zarumieniłaby
się.
Jednak żadna z nich
nie rumieni się.
Wielebny, który zawsze
mówi prawdę, przybywa
i ogłasza, że jedna pani
ma brudną twarz.
I
Po tym ogłoszeniu,
jedna z pań
zarumieniła się.
DLACZEGO ???
Czy panie już tego przedtem
nie wiedziały ???
Brudne twarze
I
I
Jeśli ani Beata ani Cecylia się nie rumieni, Alicja
rozumuje następująco:
Alicja: Przypuśćmy, że moja twarz jest czysta. Wówczas
Beata rozumowałaby następująco:
I
Beata: Widzę, że twarz Alicji jest czysta. Przypuśćmy, że
moja twarz jest również czysta. Wówczas Cecylia
rozumowałaby następująco:
I
I
I
Cecylia: Widzę, że Alicja i Beata mają czyste twarze. Zatem
moja twarz musi być brudna. Muszę się zarumienić.
Beata: Ponieważ Cecylia się nie zarumieniła, moja twarz
musi być brudna. Zatem ja muszę się zarumienić.
Alicja: Ponieważ Beata się nie zarumieniła, moja twarz
jest brudna. Muszę się zarumienić.
Użyteczność ordynalna (porządkowa)
Preferencje ujawnione - dedukujemy z obserwowanych
wyborów, nie tłumaczymy skąd się biorą. Dwa założenia:
I
I
Wybory muszą być stabilne
Wybory muszą być spójne
Relacja preferencji % (podzbiór iloczynu kartezjańskiego
Ω × Ω) spełnia dwa aksjomaty:
I
zupełność: a % b lub b % a
I
przechodniość: jeśli a % b i b % c, to a % c
dla wszystkich a, b, c ∈ Ω
Twierdzenie (Cantor (1915))
Relacja % spełnia zupełność, przechodniość (i
separowalność) wtedy i tylko wtedy, gdy istnieje u : Ω Ï R
taka, że:
u(a) ≥ u(b)
⇐Ñ
a % b, ∀a, b ∈ Ω
Aksjomaty von Neumanna Morgensterna
Postulat (1)
Racjonalny gracz preferuje tą loterię wygraj-lub-przegraj,
która daje większą szansę wygranej.
(W, p; P, 1 − p) (W, q; P, 1 − q) ⇐Ñ p > q
Postulat (2)
Każda nagroda pomiędzy najgorszą a najlepszą jest
równoważna jakiejś loterii wygraj-lub-przegraj.
Postulat (3)
Racjonalni gracze są obojętni wobec wymiany jednej z
wygranej w loterii na inną, którą uważają za jednakowo
wartościową.
Postulat (4)
Racjonalni gracze troszczą się jedynie o całkowite
prawdopodobieństwo z jakim dostaną odpowiednią
nagrodę w loterii złożonej.
Użyteczność kardynalna
L = (ω1 , p1 ; . . . ; ωn , pn )
∼ [(W, q1 ; L, 1 − q1 ), p1 ; . . . ; (W, qn ; L, 1 − qn ), pn ]
∼ (W, p1 q1 + . . . + pn qn ; L, 1 − (p1 q1 + . . . + pn qn ))
gdzie pierwsza relacja obojętnośći wynika z postulatów (2) i
(3), a druga relacja wynika z postulatu (4). Zatem zgodnie z
postulatem (1) racjonalny gracz preferuje loterię z wyższym
prawdopodobieństwem wygranej:
r
= p1 q1 + p2 q2 + . . . + pn qn
= p1 u(ω1 ) + p2 u(ω2 ) + . . . + pn u(ωn )
= Eu(L)
Funkcja u : Ω Ï R jest funkcją kardynalną von Neumanna
Morgensterna.
Jednoznaczność użyteczności
I
Użyteczność ordynalna (porządkowa): jeśli u : Ω Ï R
reprezentuje relację preferencji % zdefiniowaną na
zbiorze Ω to każda ściśle rosnąca transformacja u
również reprezentuje tą relację preferencji. (u 0 = f ◦ u,
gdzie f jest funkcją rosnącą)
I
Użyteczność kardynalna: jeśli u : Ω Ï R reprezentuje
relację preferencji % na zbiorze wszystkich loterii
lott(Ω), to kaźda ściśle rosnąca afiniczna
transformacja u również reprezentuje tą relację
preferencji. (u 0 = Au + B, gdzie A > 0)
Akcje zdominowane i strategie mieszane
L
P
1
0
G
1
1
0
3
S
3
0
1
0
D
0
I
I
I
4
żadna akcja nie dominuje akcji G
Lecz strategia mieszana α1 (S) = 1/2, α1 (D) = 1/2 ściśle
dominuje akcję T
ściśle zdominowana akcja nigdy nie będzie grana z
dodatnim prawdopodobieństwem w równowadze
strategii mieszanych
Gra w monety lub strzelanie karnych
Bramkarz
w lewo
Strzelec
w prawo
1
-1
w lewo
-1
1
-1
1
w prawo
1
-1
Jak grać w taką grę?
Trzeba być nieprzewidywalnym - czyli grać losowo.
Pijany kierowca
I
I
Szef policji w Warszawie martwi się problemem
pijanych kierowców
Może zorganizować punkt kontrolny do sprawdzania
kierowców
I
I
punkt kontrolny zawsze złapie pijanego kierowcę
ale kosztuje c
Kierowca decyduje, czy wypić wino czy colę przed
prowadzeniem samochodu.
I
I
Wypicie wina przynosi o r więcej satysfakcji kierowcy
niż cola
Koszt prowadzenia po wypiciu wina jest a dla kierowcy i
f dla miasta
I
I
Występuje tylko, gdy kierowca nie jest złapany
Złapany pijany kierowca płaci mandat w wysokości d
Pijany kierowca
policja
kontrola
kierowca
brak
−c
wino
r −d
−f
r −a
−c
0
cola
0
0
Zakładamy, że f > c > 0 oraz d > r > a ≥ 0
Na przykład: f = 2, c = 1, d = 4, r = 2, a = 1
policja
kontrola
kierowca
brak
-1
-2
wino
-2
1
-1
0
cola
0
0
Strategia mieszana
I
I
Strategia mieszana to rozkład prawdpodobieństwa na
zbiorze akcji.
W równowadze strategii mieszanych każda akcja grana
z dodatnim prawdopodobieństwem musi być najlepszą
odpowiedzią na strategie mieszane innych graczy.
I
W szczególności gracze muszą być obojętni pomiędzy
akcjami granymi z dodatnim prawdopodobieństwem.
Przykład z pijanym kierowcą: niech p będzie
prawdopodobieństwem picia wina przez kierowcę a q niech
będzie prawdopodobieństwem urządzenia punktu
kontrolnego przez policję
Pijany kierowca
I
Oczekiwana wypłata kierowcy z wypicia:
I
I
I
I
wina: q × (−2) + (1 − q) × 1 = 1 − 3q
coli: 0
Warunek obojętności: 0 = 1 − 3q, czyli q =
Oczekiwana wypłata policji z:
I
I
1
3
urządzenia punktu kontrolnego: −1
nie urządzenia punktu kontrolnego:
p × (−2) + (1 − p) × 0 = −2p
1
2
I
Warunek obojętności: −1 = −2p, czyli p =
I
(p = 1/2, q = 1/3) to równowaga w strategiach
mieszanych
Bitwa płci
mąż
żona
balet
mecz
1
0
balet
2
0
0
2
mecz
0
I
1
Niech p będzie strategią żony a q będzie strategią męża
(prawdopodobieństwo wyboru baletu)
I
I
Najlepsza odpowiedź żony:
Oczekiwana wypłata z pójścia na:
I
I
balet: 2q
mecz: 1 − q
I
Jeśli 2q > 1 − q lub q > 1/3, najlepszą odpowiedzią żony
jest balet (p = 1)
I
Jeśli 2q < 1 − q lub q < 1/3, najlepszą odpowiedzią żony
jest mecz (p = 0)
I
Jeśli 2q = 1 − q lub q = 1/3, żonie wszystko jedno czy
balet czy mecz p ∈ [0, 1]
Korespondencja najlepszej odpowiedzi żony:

 {1}, jeśli q > 1/3
[0, 1], jeśli q = 1/3
R1 (q) =

{0}, jeśli q < 1/3
I
I
Najlepsza odpowiedź męża:
Oczekiwana wypłata z pójścia na:
I
I
balet: p
mecz: 2(1 − p)
I
Jeśli p > 2(1 − p) lub p > 2/3, najlepszą odpowiedzią męża
jest balet (q = 1)
I
Jeśli p < 2(1 − p) lub p < 2/3, najlepszą odpowiedzią męża
jest mecz (q = 0)
I
Jeśli p = 2(1 − p) lub p = 2/3, mężowi wszystko jedno czy
balet czy mecz q ∈ [0, 1]
Korespondencja najlepszej odpowiedzi męża:

 {1}, jeśli p > 2/3
[0, 1], jeśli p = 2/3
R2 (p) =

{0}, jeśli p < 2/3
W samo południe
W samo południe
I
I
I
Szeryf Kane oraz Miller idą naprzeciwko sobie
Oboje mają tylko jedną kulę w pistolecie
Im bliżej siebie są, tym większe prawdopodobieństwo, że
trafią
I
Początkowy dystans wynosi D, pi (D) = 0, pi (0) = 1.
I
Prawdopodobieństwo pi jest ciągłą ściśle malejącą
funkcją
I
0 = d0 < d1 < d2 < ... < dn = D

Podobne dokumenty