zbiór strategii czystych gracza i

Transkrypt

zbiór strategii czystych gracza i
niektóre OZNACZENIA
• Wi : macierz wyplat gracza i
• Si : zbiór strategii czystych gracza i;
Mi : zbiór strategii mieszanych gracza i; M−i =
∏
Mj
j̸=i
• supp σi : nośnik strategii mieszanej
• σi (s): prawdopodobieństwo odpowiadaja,ce strategii czystej s, w strategii mieszanej σi ∈ Mi
• wk (σ̄−i ; σi ): wyplata gracza k, gdy gracz i stosuje strategie, σi , a σ̄−i ∈ M−i jest ukladem strategii przeciwników
gracza i
• Mndom
: zbiór wszystkich strategii niezdominowanych (mieszanych) gracza i
i
• Mbest
:
zbiór wszystkich najlepszych odpowiedzi gracza i
i
• conv A: powloka (otoczka) wypukla zbioru A
• gra dwumacierzowa: dwuosobowa gra w postaci strategicznej
• gra macierzowa: dwuosobowa gra o sumie zerowej, w postaci strategicznej
• Bi : poziom bezpieczeństwa gracza i; val (G): wartość gry
• L(A): zbiór loterii nad zbiorem A wszystkich wyników gry
• prl (σ̄) lub prl (b̄): rozklad prawdopodobieństwa generowany na zbiorze liści przez uklad strategii mieszanych lub
behawioralnych
• rn(W, Q): rozwia,zanie arbitrażowe Nasha dla zbioru W i punktu niezgody Q
• rdz(v): rdzeń gry o funkcji charakterystycznej v
• ϕ(v): wartość Shapleya dla gry o funkcji charakterystycznej v
Monotoniczność preferencji: Dla dowolnych L1 , L2 , L3 ∈ L(A) i p ∈ (0, 1] zachodzi równoważność:
L1 ≼ L2 ⇔ pL1 + (1 − p)L3 ≼ pL2 + (1 − p)L3
Cia,glość preferencji: Dla dowolnych L1 , L2 , L3 ∈ L(A) zachodzi implikacja:
L1 ≺ L2 ≺ L3 ⇒
∃
p∈(0,1)
L2 ≈ pL1 + (1 − p)L3
Aksjomaty schematu arbitrażowego Nasha:
(A1) Osia,galność
(A2) Optimum Pareto
(A3) O symetryczności
(A4) Zgodność ze zmiana, skali użyteczności
(A5) Niezależność od możliwości nieistotnych
Aksjomaty Shapleya:
(S1) O efektywności
(S2) O symetryczności ról
(S3) O graczu nieistotnym
(S4) O addytywności
niektóre TWIERDZENIA
prawdopodobieńWlasność 1 (Podstawowa wl. wyplaty). Jeżeli τ1 , τ2 , . . . , τt ∈ Mi oraz (p1(, p2 , . . . , pt ) jest rozk
) ladem
∑t
∑t
stwa, to dla dowolnego σ̄−i ∈ M−i oraz dla dowolnego gracza j zachodzi wj σ̄−i ; m=1 pm τm = m=1 pm wj (σ̄−i ; τm ).
Wlasność 2.
(D1) Strategia σi ∈ Mi jest zdominowana przez σi′ ∈ Mi wtedy i tylko wtedy, gdy dla dowolnego ukladu strategii
czystych s̄−i zachodzi wi (s̄−i ; σi′ ) > wi (s̄−i ; σi ).
(D2) Jeżeli σi ∈ Mndom
, to żadna strategia czysta z nośnika σi nie jest zdominowana.
i
(D3) Jeżeli w grze nie ma strategii σi , σi′ ∈ Mi o rozla,cznych nośnikach, dla których σi ≺ σi′ , to gracz i nie ma żadnej
strategii zdominowanej.
(D4) Jeśli s ∈ Si jest zdominowana, to jest też zdominowana przez strategie, bez s w nośniku.
(D5) Końcowy wynik iterowanego usuwania strategii zdominowanych nie zależy od kolejności usuwania strategii.
Twierdzenie 3.
(O1) Jeśli wektor osia,galny (a1 , . . . , an ) nie jest optimum Pareto, to istnieje taki rozkad prawdopodobieństwa (p1 , . . . , pt )
na zb. ukladów strategii czystych {s̄1 , . . . , s̄t }, że dla wszystkich graczy i ai 6 p1 wi (s̄1 ) + . . . + pt wi (s̄t ) oraz ostra
nierówność zachodzi w przynajmniej jednym przypadku.
(O2) Jeżeli (a1 , . . . , an ) nie jest optimum Pareto i jest osigalny przez ukad strategii czystych s̄, to powyższy rozklad
prawdopodobieństwa istnieje również na zbiorze ukladów strategii czystych, niezawieraja,cym s̄.
Wlasność 4.
(a)
sup wi (σ̄−j ; σj ) = max wi (σ̄−j ; sj ),
σj ∈Mj
sj ∈Sj
inf
σj ∈Mj
wi (σ̄−j ; σj ) = min wi (σ̄−j ; sj ).
sj ∈Sj
(b) Jeżeli x ∈ R, a dla strategii s1 , s2 , . . . , sn gracza j zachodzi wi (σ̄−j ; sj ) > x dla i = 1, 2, . . . , n, to dla każdej
strategii σj ∈ conv {s1 , . . . , sn } zachodzi wi (σ̄−j ; σj ) > x. Analogiczne wlasności sa, prawdziwe, gdy zasta,pimy
wsze,dzie znak > znakiem =, lub <, lub >, lub 6.
Twierdzenie 5 (o minimaksie; von Neumann). W grze macierzowej B1 + B2 = 0.
1
2
Twierdzenie 6 (o minimaksie’; von Neumann). W grze macierzowej istnieje dokladnie jedno takie x ∈ R, że istnieja,
strategie σ1 ∈ M1 i σ2 ∈ M2 spelniaja,ce oba warunki: ∀s2 ∈S2 w1 (σ1 , s2 ) > x, ∀s1 ∈S1 w1 (s1 , σ2 ) 6 x.
Twierdzenie 7 (o dualności). Jeśli wzajemnie dualne zagadnia LP i DLP z funkcjami celu odpowiednio f i g maja,
rozwia,zanie, to max f = min g.
Wlasność 8. W grze macierzowej:
Jeżeli w grze macierzowej strategie σ1 ∈ M1 i σ2 ∈ M2 sa, optymalne, to wi (σ1 , σ2 ) = Bi .
Usuwanie (wielokrotne) strategii zdominowanych nie zmienia zbiorów strategi optymalnych.
Usuwanie (wielokrotne) strategii slabo zdominowanych może zmniejszyć zb. strategi optymalnych, ale coś zostanie.
Zalóżmy, że supp σ1 = S1 i supp σ2 = S2 . Wówczas σ1 i σ2 s optymalne wtedy i tylko wtedy, gdy dla i = 1, 2 σi
daje graczowi i zawsze te, sama, wyplate,, niezależnie od strategii przeciwnika.
(PB5) Zalóżmy, że supp σ1 = S1 i supp σ2 = S2 . σ1 i σ2 sa, optymalne wtedy i tylko wtedy, gdy σi daje graczowi i zawsze
te, sama, wyplate,, niezależnie od strategii przeciwnika (dla i = 1, 2).
(PB1)
(PB2)
(PB3)
(PB4)
Wlasność 9.
(NO1) σi ∈ Mi jest najlepsza, odpowiedzia, na σ̄−i wtedy i tylko wtedy, gdy wi (σ̄−i ; si ) 6 wi (σ̄−i ; σi ) dla każdego si ∈ Si .
(NO2) Jeżeli σi ∈ Mi jest najlepsza, odpowiedzia, na σ̄−i , to każda strategia czysta z nośnika σi daje w odpowiedzi na
σ̄−i te, sama, wyplate, graczowi i.
(NO3) σi jest n.o. na σ̄−i wtedy i tylko wtedy, gdy każda strategia czysta z nośnika σi jest najlepsza, spośród str. czystych
odpowiedzia, na σ̄−i .
(NO4) σi ∈ Mi jest najlepsza, odpowiedzia, na σ̄−i wtedy i tylko wtedy, gdy każda strategia czysta z nośnika σi jest
najlepsza, odpowiedzia, na σ̄−i .
(NO5) W grach dwumacierzowych Mbest
= Mndom
.
i
i
Wlasność 10.
(RN1)
(RN2)
(RN3)
(RN4)
Usuwanie strategii spoza Mbest
nie zmienia zbioru punktów równowagi gry.
i
Usuwanie strategii spoza Mndom
nie zmienia zbioru punktów równowagi gry.
i
Po usuwanie,ciu strategii slabo zdominowanych, zbiór p.r. Nasha jest podzbiorem p.r. Nasha wyjściowej gry.
W grze macierzowej (σ1 , σ2 ) ∈ M1 × M2 jest punktem równowagi Nasha wgdy σ1 i σ2 sa, optymalne.
Twierdzenie 11 (O użyteczności). Jeżeli realcja preferencji jest ≺ jest quasi-porza,dkiem liniowym na L(A) oraz jest
monotoniczna i cia,gla, to istnieje funkcja użyteczności u : A → R o naste,puja,cej wlasności:
Dla dowolnych loterii p1 [a1 ] + . . . + pk [ak ] i p′1 [a1 ] + . . . + p′k [ak ]
p1 [a1 ] + . . . + pk [ak ] ≼ p′1 [a1 ] + . . . + p′k [ak ] ⇔ p1 u(a1 ) + . . . + pk u(ak ) 6 p′1 u(a1 ) + . . . + p′k u(ak ).
Ponadto funkcja taka jest wyznaczona jednoznacznie z dokladnościa, do dodatniego przeksztalcenia afinicznego.
Wlasność 12.
(RS1) W grze w postaci ekstensywnej strategie σi ∈ Mi oraz bi ∈ Bi sa, równoważne wtedy i tylko wtedy, gdy dla każdego
ukladu strategii czystych s̄−i zachodzi prl (s̄−i ; σi ) = prl (s̄−i ; bi ).
(RS2) O prawdopodobieństwach dojścia do wierzcholków drzewa.
(RS3) Każdej strategii behawioralnej bi odpowiada (naturalnie) rozklad pr. na Si . Jeżeli rozklad ten jest taki sam jak
σi , to σi i bi s równoważne.
Twierdzenie 13 (Kuhn 1953). W n–osobowej grze w postaci ekstensywnej z pamie,cia, doskonala,, dla każdej strategii
mieszanej istnieje równoważna jej strategia behawioralna.
Twierdzenie 14 (Nash 1950). Istnieje doklanie jedno rozwia,zanie arbitrażowe w sensie Nasha rn : G → R2 , gdzie
G = {(W, Q) : W jest podzbiorem zwartym i wypuklym w R2 , Q ∈ W, istnieje w W punkt (x, y) > Q}. Ponadto
rn(W, (q1 , q2 )) = argmax (x,y)∈W (x − q1 )(y − q2 ).
x>q1 , y>q2
Twierdzenie 15 (Shapley 1953). Na zbiorze koalicyjnych gier n-osobowych istnieje dokladnie jedna funkcja ϕ spelniaja,ca
aksjomaty (S1)–(S4). Ponadto
∑
(
)
1
ϕi (v) =
v(G̃6i ) − v(G̃<i ) .
n!
G̃: uporz.w.k.